Site Reliability Engineer - SRE

Blu Armor • Remoto

Descrição da vaga

Vaga para Engenheiro(a) de Confiabilidade de Sites (SRE) Sênior

Empresa: Blu Armor

Localização: Argentina, Bolívia, México, Paraguai, Colômbia (Remoto)

Estamos buscando um(a) Engenheiro(a) de Confiabilidade de Sites (SRE) Sênior para integrar nossa equipe e garantir a confiabilidade, alta capacidade e o bom desempenho de nossos sistemas. Nesta oportunidade, você atuará na proteção e melhoria contínua de nossas plataformas, com foco em confiabilidade, segurança, performance, custo e excelência operacional.

Como SRE Sênior, você colaborará em um modelo DevOps com as equipes de desenvolvimento de produtos, projetando, implementando e gerenciando ferramentas de automação que aumentem a previsibilidade e o tempo de lançamento no mercado, reduzindo custos.

Responsabilidades:

Engenharia de Nuvem: Colaborar com as equipes de desenvolvimento na criação e manutenção de ferramentas de automação.
Otimização de sistemas existentes, considerando restrições técnicas e de negócios.
Implementar iniciativas para aumentar a confiabilidade e o desempenho do sistema.
Garantir a rastreabilidade e transparência da automação da infraestrutura (infraestrutura como código, monitoramento como código).
Monitorar ativamente os custos da AWS, utilizando ferramentas de otimização para maximizar o ROI.
Engenharia de Observabilidade: Responsável pela confiabilidade, tempo de atividade, segurança do sistema, custo, operações, capacidade, resiliência e análise de desempenho.
Liderar iniciativas para melhorar a confiabilidade e a estabilidade de aplicações e plataformas, utilizando análise de dados.
Atuar como ponto de contato principal durante incidentes, identificando e resolvendo problemas.
DevSecOps: Apoiar práticas de desenvolvimento de software, incluindo metodologia ágil, padrões de revisão de código e entrega contínua.
Colaborar com a equipe de CyberSecurity no desenvolvimento de planos e automação para responder a novos riscos e vulnerabilidades.
Engenharia de Resiliência: Colaborar com as equipes de desenvolvimento para identificar pontos de falha e o raio de explosão dos sistemas.
Validar a eficácia das configurações de monitoramento e observabilidade.
Planejar e prever o crescimento sazonal, comunicando tendências à liderança e aprimorando os planos de escalabilidade da infraestrutura.
Mentorar e orientar engenheiros de diferentes níveis de experiência.

Requisitos:

Experiência como desenvolvedor(a) de software, com experiência prática no desenvolvimento, depuração e implantação de aplicações corporativas.
Experiência com tecnologias de automação de infraestrutura, preferencialmente Terraform.
Experiência em tecnologias de contêineres/orquestração de contêineres, preferencialmente EKS ou ECS.
Experiência com diversas tecnologias de hospedagem: plataformas de servidor web, plataformas de aplicação, sistemas operacionais, componentes de rede, tecnologias de virtualização, armazenamento e plataformas de banco de dados.
Experiência com ciclos de vida de desenvolvimento de software baseados em implantação contínua (CI/CD).
Experiência com estratégias de cache de aplicações e cargas de trabalho de alta concorrência.
Fortes habilidades de comunicação, resolução de problemas, análise de causa raiz e engenharia de sistemas.
Experiência comprovada na construção e gerenciamento de infraestrutura de produção em nuvem em grande escala.
Graduação em Ciência da Computação (ou área técnica relacionada e/ou experiência equivalente na indústria).
Conhecimento em Go/Golang é um diferencial.
Experiência com AWS (Cloudfront, S3, EC2, ECS, SES, SQS, SNS, Load Balancing, VPC, Config, Systems Manager, Lambda, API Gateway, DB services).
Conhecimento em OCI (Exacs, OCI Compute, Load Balancers, Networking, VCN, Object storage) é um plus.
Experiência com Python, Bash, Ansible.
Conhecimento em ferramentas de segurança como Rapid7, WAF.
Experiência com Apache httpd, Apache Tomcat, Angular.
Familiaridade com NewRelic, CloudWatch, DataDog.
Experiência com Artifactory, Jenkins, CircleCI, SonarQube, Jfrog X-Ray, Control Tower, GitHub Enterprise.
Participação em regime de plantão (on-call) quando necessário.

Benefícios:

Trabalho Remoto
Oportunidade de crescimento profissional em uma empresa inovadora.
Participação em projetos desafiadores e de grande impacto.

Tipo de Vaga: Contrato Duração do Contrato: 12 meses Salário: R$100,00 por hora Carga Horária: 8 horas por semana Local de Trabalho: Remoto

Site Reliability Engineer - SRE

Tecnologias

Descrição da vaga

Explorar mais vagas