Cientista de Dados
FlowCredi
Ver empresaInteligência Artificial
Categoria
Full-Time
Jornada de trabalho
Júnior / Pleno
Nível
PJ
Tipo de Contratação
Negociável
Faixa Salarial
Remota
Localidade
Descrição:
Publicada: 24/02/2026
Estamos buscando um(a) Cientista de Dados Júnior para apoiar análises de dados, estruturar e organizar dados no nosso datalake em AWS e contribuir com a criação de agentes de IA para automações internas. Você vai trabalhar próximo de Engenharia, Produto e áreas de negócio, ajudando a transformar dados brutos em informação acionável e automações que aumentem a eficiência da empresa.
Habilidades
Técnicas (obrigatórias / muito importantes)
-
SQL sólido (CTEs, joins, agregações e funções de janela básicas) para exploração e criação de datasets analíticos.
-
Python para análise e manipulação de dados e uso de notebooks.
-
Noções de modelagem e organização de dados para análise (eventos, métricas, dimensões).
-
Conceitos de qualidade de dados (consistência, completude, duplicidade) e validação de resultados.
-
Git e boas práticas básicas de organização de código e documentação.
Técnicas (desejáveis)
-
Conhecimento de AWS no contexto de dados (ex.: S3, IAM, Athena, Glue, Lake Formation, Redshift, CloudWatch).
-
Experiência ou familiaridade com estrutura medalhão (bronze/silver/gold; raw/refined/curated) em datalake.
-
Noções de processamento distribuído com Spark (PySpark), por exemplo:
-
leitura e escrita em S3;
-
transforms e joins em DataFrames;
-
particionamento e formatos colunares (Parquet);
-
-
Vivência com ambientes Spark gerenciados é um plus (ex.: AWS Glue / EMR / Databricks).
-
Noções de integração com APIs e automações (REST, webhooks, scripts).
-
Noções de LLMs e automação com IA: desenhar prompts, estruturar fluxos, avaliar outputs e criar guardrails.
Comportamentais
-
Curiosidade e vontade de aprender rápido (dados, negócio e IA aplicada).
-
Perfil mão na massa, organizado e atento a detalhes.
-
Boa comunicação para explicar análises e resultados para pessoas não técnicas.
-
Colaboração com times multidisciplinares (Engenharia, Produto, Growth, Operações).
Responsabilidades
Análises e dados
-
Realizar análises exploratórias (EDA) e responder perguntas do negócio com dados.
-
Criar e manter consultas SQL e scripts em Python para extração, limpeza e transformação de dados.
-
Apoiar a definição e padronização de métricas (funil, conversão, operação, performance de processos).
-
Ajudar a estruturar dados no datalake (AWS), organizando tabelas e datasets por camadas (estrutura medalhão), com foco em:
-
rastreabilidade do dado (de onde veio e como foi transformado);
-
qualidade e consistência;
-
reuso por diferentes áreas.
-
-
Apoiar transformações e processamento de dados em Spark (PySpark) para conjuntos maiores, dentro dos padrões definidos pelo time.
Agentes de IA e automações
-
Apoiar a criação de agentes de IA para automação interna, por exemplo:
-
geração de relatórios e resumos automáticos a partir de dados;
-
bots internos para responder perguntas com base em dados e documentos;
-
alertas inteligentes e classificações (triagem, priorização, análise de inconsistências).
-
-
Construir e testar prompts, templates e fluxos de automação, com foco em previsibilidade, custo e segurança.
-
Validar resultados (qualidade, custo, tempo) e ajustar os agentes com base em feedback dos usuários internos.
-
Contribuir com boas práticas de governança (principalmente quando houver dados sensíveis e LGPD).
Diferenciais
AWS e dados
-
Experiência prática com AWS para dados, especialmente: S3, Athena, Glue, IAM, CloudWatch, Lake Formation e/ou Redshift.
-
Experiência com processamento em Spark em AWS (Glue/EMR/Databricks) e formatos Parquet/Delta (se aplicável).
-
Experiência (mesmo em projetos pessoais) com datalake em estrutura medalhão (bronze/silver/gold).
IA (forte diferencial)
-
Experiência com AWS Bedrock (modelos, agentes, knowledge bases, integrações) para construir automações e soluções internas.
-
Experiência chamando LLMs via API (Bedrock/OpenAI/Anthropic) e implementando automações com logs, métricas e versionamento.
-
Portfólio (GitHub, projetos, artigos) com agentes, automações, pipelines ou análises reprodutíveis.
Contexto de negócio
- Interesse ou experiência em fintech, crédito, risco e/ou LGPD.
Habilidades
Requisitos
Python
Analise de dados
Engenharia de Prompt
Diferenciais
Experiência com AWS Bedrock
Experiência com AWS
Conhecimentos básicos em microserviços
Benefícios
Plano de Saúde
FlowCredi
Ver empresaAssessoria para aquisição de crédito imobiliário.
São Paulo
Cidade
2024
Fundada
21-50
Colaboradores
FinTech
Setor
Cientista de Dados
FlowCredi
Ver empresaInteligência Artificial
Categoria
Full-Time
Jornada de trabalho
Júnior / Pleno
Nível
PJ
Tipo de Contratação
Negociável
Faixa Salarial
Remota
Localidade