Site Reliability Engineer - SRE
Tecnologias
Descrição da vaga
Vaga para Engenheiro(a) de Confiabilidade de Sites (SRE) Sênior
Empresa: Blu Armor
Localização: Argentina, Bolívia, México, Paraguai, Colômbia (Remoto)
Estamos buscando um(a) Engenheiro(a) de Confiabilidade de Sites (SRE) Sênior para integrar nossa equipe e garantir a confiabilidade, alta capacidade e o bom desempenho de nossos sistemas. Nesta oportunidade, você atuará na proteção e melhoria contínua de nossas plataformas, com foco em confiabilidade, segurança, performance, custo e excelência operacional.
Como SRE Sênior, você colaborará em um modelo DevOps com as equipes de desenvolvimento de produtos, projetando, implementando e gerenciando ferramentas de automação que aumentem a previsibilidade e o tempo de lançamento no mercado, reduzindo custos.
Responsabilidades:
- Engenharia de Nuvem: Colaborar com as equipes de desenvolvimento na criação e manutenção de ferramentas de automação.
- Otimização de sistemas existentes, considerando restrições técnicas e de negócios.
- Implementar iniciativas para aumentar a confiabilidade e o desempenho do sistema.
- Garantir a rastreabilidade e transparência da automação da infraestrutura (infraestrutura como código, monitoramento como código).
- Monitorar ativamente os custos da AWS, utilizando ferramentas de otimização para maximizar o ROI.
- Engenharia de Observabilidade: Responsável pela confiabilidade, tempo de atividade, segurança do sistema, custo, operações, capacidade, resiliência e análise de desempenho.
- Liderar iniciativas para melhorar a confiabilidade e a estabilidade de aplicações e plataformas, utilizando análise de dados.
- Atuar como ponto de contato principal durante incidentes, identificando e resolvendo problemas.
- DevSecOps: Apoiar práticas de desenvolvimento de software, incluindo metodologia ágil, padrões de revisão de código e entrega contínua.
- Colaborar com a equipe de CyberSecurity no desenvolvimento de planos e automação para responder a novos riscos e vulnerabilidades.
- Engenharia de Resiliência: Colaborar com as equipes de desenvolvimento para identificar pontos de falha e o raio de explosão dos sistemas.
- Validar a eficácia das configurações de monitoramento e observabilidade.
- Planejar e prever o crescimento sazonal, comunicando tendências à liderança e aprimorando os planos de escalabilidade da infraestrutura.
- Mentorar e orientar engenheiros de diferentes níveis de experiência.
Requisitos:
- Experiência como desenvolvedor(a) de software, com experiência prática no desenvolvimento, depuração e implantação de aplicações corporativas.
- Experiência com tecnologias de automação de infraestrutura, preferencialmente Terraform.
- Experiência em tecnologias de contêineres/orquestração de contêineres, preferencialmente EKS ou ECS.
- Experiência com diversas tecnologias de hospedagem: plataformas de servidor web, plataformas de aplicação, sistemas operacionais, componentes de rede, tecnologias de virtualização, armazenamento e plataformas de banco de dados.
- Experiência com ciclos de vida de desenvolvimento de software baseados em implantação contínua (CI/CD).
- Experiência com estratégias de cache de aplicações e cargas de trabalho de alta concorrência.
- Fortes habilidades de comunicação, resolução de problemas, análise de causa raiz e engenharia de sistemas.
- Experiência comprovada na construção e gerenciamento de infraestrutura de produção em nuvem em grande escala.
- Graduação em Ciência da Computação (ou área técnica relacionada e/ou experiência equivalente na indústria).
- Conhecimento em Go/Golang é um diferencial.
- Experiência com AWS (Cloudfront, S3, EC2, ECS, SES, SQS, SNS, Load Balancing, VPC, Config, Systems Manager, Lambda, API Gateway, DB services).
- Conhecimento em OCI (Exacs, OCI Compute, Load Balancers, Networking, VCN, Object storage) é um plus.
- Experiência com Python, Bash, Ansible.
- Conhecimento em ferramentas de segurança como Rapid7, WAF.
- Experiência com Apache httpd, Apache Tomcat, Angular.
- Familiaridade com NewRelic, CloudWatch, DataDog.
- Experiência com Artifactory, Jenkins, CircleCI, SonarQube, Jfrog X-Ray, Control Tower, GitHub Enterprise.
- Participação em regime de plantão (on-call) quando necessário.
Benefícios:
- Trabalho Remoto
- Oportunidade de crescimento profissional em uma empresa inovadora.
- Participação em projetos desafiadores e de grande impacto.
Tipo de Vaga: Contrato Duração do Contrato: 12 meses Salário: R$100,00 por hora Carga Horária: 8 horas por semana Local de Trabalho: Remoto