Descripción:
Publicado: 07/07/2025
Junte-se à Digiage e ajude a garantir a estabilidade e a performance de soluções inteligentes em produção
Estamos em busca de um(a) Analista de Sustentação de IA para atuar em um projeto de Arquitetura e Governança de Dados e IA (GenAI) no cliente Ipiranga.
Esse(a) profissional será responsável pela sustentação de modelos e soluções de IA em produção, garantindo o funcionamento contínuo, confiável e eficiente dessas aplicações por meio de monitoramento ativo, retraining, suporte técnico e resolução de incidentes.
Responsabilidades
- Realizar monitoramento contínuo de modelos de IA em produção, identificando falhas, desvios de performance (model drift) e gargalos operacionais
- Executar atividades de troubleshooting, suporte técnico de nível 2 e 3, e correção de incidentes em tempo hábil
- Apoiar atividades de retraining de modelos, manutenção de pipelines e estabilidade das soluções implantadas
- Utilizar ferramentas de observabilidade como Prometheus, Grafana, ELK, PagerDuty ou similares para garantir visibilidade e agilidade no suporte
- Documentar ocorrências, procedimentos e melhorias no processo de sustentação
- Colaborar com times de MLOps, engenharia e ciência de dados para evoluir a maturidade operacional das soluções
Requisitos
- Experiência com suporte técnico de aplicações em produção, preferencialmente relacionadas a dados ou IA
- Conhecimento básico a intermediário em machine learning e funcionamento de pipelines de modelos
- Familiaridade com ferramentas de observabilidade e monitoramento (Prometheus, Grafana, ELK, PagerDuty, Splunk, etc.)
- Experiência com sistemas Linux, análise de logs e resolução de incidentes
- Habilidade de comunicação clara para registrar ocorrências e interagir com equipes multidisciplinares
- Conhecimento em Python e SQL para suporte a scripts e consultas simples
Diferenciales
- Experiência com monitoramento e retraining automatizado de modelos de IA
- Conhecimento em MLOps e plataformas como MLflow, SageMaker, Vertex AI ou Azure ML
- Vivência com ITSM, gestão de incidentes e SLAs (ex: ServiceNow, Jira Service Management)
- Certificações ou cursos em IA, MLOps ou observabilidade de sistemas
- Experiência com automações de suporte utilizando scripts ou ferramentas no-code/low-code
Beneficios
- Reembolso de certificações
- Day off de aniversário
APIs e tecnologia de dados para acelerar a competitividade
Descripción:
Publicado: 07/07/2025
Junte-se à Digiage e ajude a garantir a estabilidade e a performance de soluções inteligentes em produção
Estamos em busca de um(a) Analista de Sustentação de IA para atuar em um projeto de Arquitetura e Governança de Dados e IA (GenAI) no cliente Ipiranga.
Esse(a) profissional será responsável pela sustentação de modelos e soluções de IA em produção, garantindo o funcionamento contínuo, confiável e eficiente dessas aplicações por meio de monitoramento ativo, retraining, suporte técnico e resolução de incidentes.
Responsabilidades
- Realizar monitoramento contínuo de modelos de IA em produção, identificando falhas, desvios de performance (model drift) e gargalos operacionais
- Executar atividades de troubleshooting, suporte técnico de nível 2 e 3, e correção de incidentes em tempo hábil
- Apoiar atividades de retraining de modelos, manutenção de pipelines e estabilidade das soluções implantadas
- Utilizar ferramentas de observabilidade como Prometheus, Grafana, ELK, PagerDuty ou similares para garantir visibilidade e agilidade no suporte
- Documentar ocorrências, procedimentos e melhorias no processo de sustentação
- Colaborar com times de MLOps, engenharia e ciência de dados para evoluir a maturidade operacional das soluções
Requisitos
- Experiência com suporte técnico de aplicações em produção, preferencialmente relacionadas a dados ou IA
- Conhecimento básico a intermediário em machine learning e funcionamento de pipelines de modelos
- Familiaridade com ferramentas de observabilidade e monitoramento (Prometheus, Grafana, ELK, PagerDuty, Splunk, etc.)
- Experiência com sistemas Linux, análise de logs e resolução de incidentes
- Habilidade de comunicação clara para registrar ocorrências e interagir com equipes multidisciplinares
- Conhecimento em Python e SQL para suporte a scripts e consultas simples
Diferenciales
- Experiência com monitoramento e retraining automatizado de modelos de IA
- Conhecimento em MLOps e plataformas como MLflow, SageMaker, Vertex AI ou Azure ML
- Vivência com ITSM, gestão de incidentes e SLAs (ex: ServiceNow, Jira Service Management)
- Certificações ou cursos em IA, MLOps ou observabilidade de sistemas
- Experiência com automações de suporte utilizando scripts ou ferramentas no-code/low-code
Beneficios
- Reembolso de certificações
- Day off de aniversário
APIs e tecnologia de dados para acelerar a competitividade