Responsável pela disciplina de observabilidade e definição de Níveis de Serviço, Indicadores de níveis de serviço
Eliminação de “Toils”, melhoria contínua
Expansão das práticas SRE;
Ser um líder técnico para a disciplina SRE, orientando e trazendo soluções em nível estratégico;
Capacidade de liderar sala de crise em momento de troubleshooting;
Avaliar a maturidade, definir estratégias de otimização, ajustes de resultados de processos e mensuração de dados;
Acompanhar métricas e indicadores técnicos e de negócios, focar na disponibilidade, resiliência e desempenho dos serviços de TI;
Manutenção proativa, troubleshooting, análise de causas raiz e solução de problemas;
Projetos de modernização e jornadas para a nuvem.
Requisitos e Qualificações
Conhecimento de instrumentação nas ferramentas Grafana, AppDynamics, Dynatrace, ELK, Zabbix
Conhecimento em análise de log e cenários de conectividade e/ou integração entre aplicações e parceiros
Trabalho em equipe
Conhecimento na Ferramenta Jira/Kanban
Conhecimento em automação (Python, shell)
Expandir e evoluir os pipelines de CI/CD;
Experiência com troubleshooting em ferramentas de APM;
Contato diário com tecnologias de nuvem principalmente AWS, GCP e Azure
Trabalhar na otimização de custos e performance dos serviços;
Trabalhar diariamente para garantir a confiabilidade e segurança dos serviços;
Diferencial:
Experiência com gestão de APIs, padrão restful, ciclo de vida de API, boas práticas e documentação (Swagger).
Conhecimento na ferramenta GitLab.
Conhecimento em Google Workspace
Conhecimento e/ou experiência em gestão de ambiente bancário (PCI) como diferencial.
Genuíno interesse. Não ter medo de enfrentar problemas mesmo não tendo conhecimento da tecnologia envolvida e sim de estudar para resolver o problema.
Modalidade de Trabalho:
• Híbrido 2x por semana – Campos Elísios – São Paulo – SP