Description:

Published: 07/07/2025

Junte-se à Digiage e ajude a garantir a estabilidade e a performance de soluções inteligentes em produção

Estamos em busca de um(a) Analista de Sustentação de IA para atuar em um projeto de Arquitetura e Governança de Dados e IA (GenAI) no cliente Ipiranga.

Esse(a) profissional será responsável pela sustentação de modelos e soluções de IA em produção, garantindo o funcionamento contínuo, confiável e eficiente dessas aplicações por meio de monitoramento ativo, retraining, suporte técnico e resolução de incidentes.

Responsabilidades

  • Realizar monitoramento contínuo de modelos de IA em produção, identificando falhas, desvios de performance (model drift) e gargalos operacionais
  • Executar atividades de troubleshooting, suporte técnico de nível 2 e 3, e correção de incidentes em tempo hábil
  • Apoiar atividades de retraining de modelos, manutenção de pipelines e estabilidade das soluções implantadas
  • Utilizar ferramentas de observabilidade como Prometheus, Grafana, ELK, PagerDuty ou similares para garantir visibilidade e agilidade no suporte
  • Documentar ocorrências, procedimentos e melhorias no processo de sustentação
  • Colaborar com times de MLOps, engenharia e ciência de dados para evoluir a maturidade operacional das soluções

Requirements

  • Experiência com suporte técnico de aplicações em produção, preferencialmente relacionadas a dados ou IA
  • Conhecimento básico a intermediário em machine learning e funcionamento de pipelines de modelos
  • Familiaridade com ferramentas de observabilidade e monitoramento (Prometheus, Grafana, ELK, PagerDuty, Splunk, etc.)
  • Experiência com sistemas Linux, análise de logs e resolução de incidentes
  • Habilidade de comunicação clara para registrar ocorrências e interagir com equipes multidisciplinares
  • Conhecimento em Python e SQL para suporte a scripts e consultas simples

Differentials

  • Experiência com monitoramento e retraining automatizado de modelos de IA
  • Conhecimento em MLOps e plataformas como MLflow, SageMaker, Vertex AI ou Azure ML
  • Vivência com ITSM, gestão de incidentes e SLAs (ex: ServiceNow, Jira Service Management)
  • Certificações ou cursos em IA, MLOps ou observabilidade de sistemas
  • Experiência com automações de suporte utilizando scripts ou ferramentas no-code/low-code

Perks

  • Reembolso de certificações
  • Day off de aniversário

APIs e tecnologia de dados para acelerar a competitividade

CampinasCity
2013Founded
51-100Employees
Sector
Tecnologia e ServiçosSector

Description:

Published: 07/07/2025

Junte-se à Digiage e ajude a garantir a estabilidade e a performance de soluções inteligentes em produção

Estamos em busca de um(a) Analista de Sustentação de IA para atuar em um projeto de Arquitetura e Governança de Dados e IA (GenAI) no cliente Ipiranga.

Esse(a) profissional será responsável pela sustentação de modelos e soluções de IA em produção, garantindo o funcionamento contínuo, confiável e eficiente dessas aplicações por meio de monitoramento ativo, retraining, suporte técnico e resolução de incidentes.

Responsabilidades

  • Realizar monitoramento contínuo de modelos de IA em produção, identificando falhas, desvios de performance (model drift) e gargalos operacionais
  • Executar atividades de troubleshooting, suporte técnico de nível 2 e 3, e correção de incidentes em tempo hábil
  • Apoiar atividades de retraining de modelos, manutenção de pipelines e estabilidade das soluções implantadas
  • Utilizar ferramentas de observabilidade como Prometheus, Grafana, ELK, PagerDuty ou similares para garantir visibilidade e agilidade no suporte
  • Documentar ocorrências, procedimentos e melhorias no processo de sustentação
  • Colaborar com times de MLOps, engenharia e ciência de dados para evoluir a maturidade operacional das soluções

Requirements

  • Experiência com suporte técnico de aplicações em produção, preferencialmente relacionadas a dados ou IA
  • Conhecimento básico a intermediário em machine learning e funcionamento de pipelines de modelos
  • Familiaridade com ferramentas de observabilidade e monitoramento (Prometheus, Grafana, ELK, PagerDuty, Splunk, etc.)
  • Experiência com sistemas Linux, análise de logs e resolução de incidentes
  • Habilidade de comunicação clara para registrar ocorrências e interagir com equipes multidisciplinares
  • Conhecimento em Python e SQL para suporte a scripts e consultas simples

Differentials

  • Experiência com monitoramento e retraining automatizado de modelos de IA
  • Conhecimento em MLOps e plataformas como MLflow, SageMaker, Vertex AI ou Azure ML
  • Vivência com ITSM, gestão de incidentes e SLAs (ex: ServiceNow, Jira Service Management)
  • Certificações ou cursos em IA, MLOps ou observabilidade de sistemas
  • Experiência com automações de suporte utilizando scripts ou ferramentas no-code/low-code

Perks

  • Reembolso de certificações
  • Day off de aniversário

APIs e tecnologia de dados para acelerar a competitividade

CampinasCity
2013Founded
51-100Employees
Sector
Tecnologia e ServiçosSector