A vaga não está disponível no seu país.

Site Reliability Engineer

ElevusLisboa, Portugal

Há 17 dias

Descrição da vaga

Estamos a contratar : Site Reliability Engineer

Localização : Lisboa, Porto, Coimbra, Covilhã, Guarda, Castelo Branco

Estás pronto para fazer crescer a tua carreira num ambiente dinâmico e colaborativo? Estamos à procura de um Site Reliability Engineer para se juntar à nossa equipa.

Estamos à procura de um Site Reliability Engineer (SRE) para integrar uma equipa dinâmica e multidisciplinar. Se tens paixão por garantir sistemas escaláveis, fiáveis e seguros, esta oportunidade é para ti!

Sobre a Oportunidade :

Como SRE, serás responsável por aplicar princípios de engenharia de software para resolver desafios operacionais, garantindo a fiabilidade, desempenho e escalabilidade de sistemas em produção. Irás colaborar diretamente com equipas de desenvolvimento com foco na adoção de práticas de fiabilidade, sempre alinhado com os objetivos de negócio e a experiência do cliente.

Responsabilidades :

Liderar e apoiar equipas no cumprimento de princípios e práticas de fiabilidade;

Definir e manter SLOs (Service Level Objectives) e SLAs (Service Level Agreements);

Desenhar e implementar infraestruturas escaláveis e resilientes, com foco em segurança e boas práticas cloud-native;

Trabalhar em estreita colaboração com equipas de desenvolvimento para garantir sistemas observáveis, tolerantes a falhas e de elevada performance;

Implementar soluções de monitorização, alertas, logging e tracing;

Coordenar a resposta a incidentes, assegurando resolução rápida e eficaz, com análise de causa raiz (RCA);

Automatizar tarefas operacionais, com foco na deteção e recuperação rápida de falhas;

Promover uma cultura de melhoria contínua e partilha de conhecimento;

Comunicar com stakeholders sobre a fiabilidade e performance dos sistemas;

Participar em regimes de on-call para suporte a sistemas em produção.

O que Procuramos :

Licenciatura em Engenharia Informática, Ciência da Computação ou áreas similares;

Mínimo de 5 anos de experiência em desenvolvimento de software e / ou operações;

Domínio de, pelo menos, uma linguagem de programação (Python, Java, C#, etc.);

Excelentes capacidades de troubleshooting e resolução de problemas;

Fluência em inglês e forte capacidade de comunicação;

Pensamento orientado a processos e capacidade de negociação em contextos técnicos.

Competências Técnicas Valorizadas :

Definição e monitorização de SLOs, SLIs e SLAs;

Experiência com Kubernetes, EKS, e tecnologias de containerização (certificações CKA / CKAD / CKS são uma mais-valia);

Conhecimentos de ferramentas de IaC (Terraform, CloudFormation, Puppet, etc.);

Experiência em scripting com Python, Go ou Bash;

Familiaridade com serviços AWS (EC2, RDS, ELB, Lambda, etc.);

Monitorização com Grafana, ELK, Prometheus ou similares;

Capacidade de desenhar sistemas distribuídos, resilientes e tolerantes a falhas.

O que Oferecemos :

Ambiente de trabalho colaborativo, dinâmico e tecnológico;

Participação em projetos inovadores com impacto local e internacional;

Oportunidades de crescimento e aprendizagem contínua;

Remuneração ajustada à experiência e performance individual.

Criar um alerta de emprego para esta pesquisa

Site Reliability Engineer • Lisboa, Portugal