Tecnologias
Descrição da vaga
Vaga: Engenheiro(a) de Dados Jr. - Coleta e Ingestão (Go/Golang)
A JUIT, legaltech focada em otimizar a pesquisa jurídica através da estruturação de dados do Judiciário, busca um(a) Engenheiro(a) de Dados Jr. para integrar nossa equipe de Coleta e Ingestão. Se você busca uma oportunidade para trabalhar com grandes volumes de dados e impactar o mercado jurídico, esta vaga é para você!
Nossa equipe de Engenharia de Dados é responsável por construir pipelines escaláveis e robustos para transformar dados brutos em ativos valiosos para nossos produtos e clientes. Atuamos em todo o ciclo de vida do dado, desde a coleta até a disponibilização para modelos de IA.
O que você fará:
- Desenvolver soluções de coleta e ingestão de dados.
- Colaborar com a equipe de engenharia para publicar serviços de dados escaláveis e observáveis.
- Coletar, mapear e analisar dados de diversas fontes (estruturadas e não estruturadas).
- Garantir a segurança de dados e compliance em conjunto com a equipe de segurança.
- Desenvolver frameworks de testes para garantir a qualidade dos dados coletados.
- Monitorar e documentar o status de scrapers e soluções em produção.
- Definir e implementar métricas (SLA, SLO, SLI) para monitoramento de cargas de trabalho e garantir a observabilidade e o desempenho.
Requisitos:
- Formação superior em áreas de exatas (Ciência da Computação, Engenharia ou áreas relacionadas).
- Experiência sólida em Python (2+ anos).
- Conhecimento em linguagem SQL (+1 ano).
- Experiência com coleta de dados da web (web scraping, web crawling, APIs RESTful, datasets públicos).
- Conhecimento em algoritmos e estruturas de dados.
- Conhecimento em desenvolvimento orientado a testes (TDD).
- Conhecimento em Docker.
- Inglês intermediário.
Diferenciais:
- Experiência com processamento e extração de dados de documentos (.DOCs, .RTFs, .PDFs, etc).
- Experiência com motores de busca de texto (Elasticsearch, Solr, OpenSearch, etc.).
- Experiência com desenvolvimento em Go/Golang e/ou Rust.
- Experiência com linguagens baseadas na JVM (Java, Scala, Clojure, etc.).
- Experiência com Infraestrutura como Código (Terraform, Pulumi, Chef, Ansible, etc.).
- Experiência com coleta de dados de mídia (áudio e vídeo) e transcrição para texto.
- Experiência com Kubernetes.
Benefícios:
- Modelo de trabalho: Remoto
- Período: Integral
Se você é um(a) desenvolvedor apaixonado(a) por dados e busca uma oportunidade desafiadora, candidate-se!
