← Voltar para vagas

Engenheiro(a) de Dados Jr - Collect & Ingestion

JUIT

Descrição da vaga

Vaga: Engenheiro(a) de Dados Jr. - Coleta e Ingestão (Go/Golang)

A JUIT, legaltech focada em otimizar a pesquisa jurídica através da estruturação de dados do Judiciário, busca um(a) Engenheiro(a) de Dados Jr. para integrar nossa equipe de Coleta e Ingestão. Se você busca uma oportunidade para trabalhar com grandes volumes de dados e impactar o mercado jurídico, esta vaga é para você!

Nossa equipe de Engenharia de Dados é responsável por construir pipelines escaláveis e robustos para transformar dados brutos em ativos valiosos para nossos produtos e clientes. Atuamos em todo o ciclo de vida do dado, desde a coleta até a disponibilização para modelos de IA.

O que você fará:

  • Desenvolver soluções de coleta e ingestão de dados.
  • Colaborar com a equipe de engenharia para publicar serviços de dados escaláveis e observáveis.
  • Coletar, mapear e analisar dados de diversas fontes (estruturadas e não estruturadas).
  • Garantir a segurança de dados e compliance em conjunto com a equipe de segurança.
  • Desenvolver frameworks de testes para garantir a qualidade dos dados coletados.
  • Monitorar e documentar o status de scrapers e soluções em produção.
  • Definir e implementar métricas (SLA, SLO, SLI) para monitoramento de cargas de trabalho e garantir a observabilidade e o desempenho.

Requisitos:

  • Formação superior em áreas de exatas (Ciência da Computação, Engenharia ou áreas relacionadas).
  • Experiência sólida em Python (2+ anos).
  • Conhecimento em linguagem SQL (+1 ano).
  • Experiência com coleta de dados da web (web scraping, web crawling, APIs RESTful, datasets públicos).
  • Conhecimento em algoritmos e estruturas de dados.
  • Conhecimento em desenvolvimento orientado a testes (TDD).
  • Conhecimento em Docker.
  • Inglês intermediário.

Diferenciais:

  • Experiência com processamento e extração de dados de documentos (.DOCs, .RTFs, .PDFs, etc).
  • Experiência com motores de busca de texto (Elasticsearch, Solr, OpenSearch, etc.).
  • Experiência com desenvolvimento em Go/Golang e/ou Rust.
  • Experiência com linguagens baseadas na JVM (Java, Scala, Clojure, etc.).
  • Experiência com Infraestrutura como Código (Terraform, Pulumi, Chef, Ansible, etc.).
  • Experiência com coleta de dados de mídia (áudio e vídeo) e transcrição para texto.
  • Experiência com Kubernetes.

Benefícios:

  • Modelo de trabalho: Remoto
  • Período: Integral

Se você é um(a) desenvolvedor apaixonado(a) por dados e busca uma oportunidade desafiadora, candidate-se!