Cientista de Dados

FlowCredi

Ver empresa

Inteligência Artificial

Categoria

Full-Time

Jornada de trabalho

Júnior / Pleno

Nível

Tipo de Contratação

Negociável

Faixa Salarial

Remota

Localidade

Descrição:

Publicada: 24/02/2026

Estamos buscando um(a) Cientista de Dados Júnior para apoiar análises de dados, estruturar e organizar dados no nosso datalake em AWS e contribuir com a criação de agentes de IA para automações internas. Você vai trabalhar próximo de Engenharia, Produto e áreas de negócio, ajudando a transformar dados brutos em informação acionável e automações que aumentem a eficiência da empresa.

Habilidades

Técnicas (obrigatórias / muito importantes)

SQL sólido (CTEs, joins, agregações e funções de janela básicas) para exploração e criação de datasets analíticos.
Python para análise e manipulação de dados e uso de notebooks.
Noções de modelagem e organização de dados para análise (eventos, métricas, dimensões).
Conceitos de qualidade de dados (consistência, completude, duplicidade) e validação de resultados.
Git e boas práticas básicas de organização de código e documentação.

Técnicas (desejáveis)

Conhecimento de AWS no contexto de dados (ex.: S3, IAM, Athena, Glue, Lake Formation, Redshift, CloudWatch).
Experiência ou familiaridade com estrutura medalhão (bronze/silver/gold; raw/refined/curated) em datalake.
Noções de processamento distribuído com Spark (PySpark), por exemplo:
- leitura e escrita em S3;
- transforms e joins em DataFrames;
- particionamento e formatos colunares (Parquet);
Vivência com ambientes Spark gerenciados é um plus (ex.: AWS Glue / EMR / Databricks).
Noções de integração com APIs e automações (REST, webhooks, scripts).
Noções de LLMs e automação com IA: desenhar prompts, estruturar fluxos, avaliar outputs e criar guardrails.

Comportamentais

Curiosidade e vontade de aprender rápido (dados, negócio e IA aplicada).
Perfil mão na massa, organizado e atento a detalhes.
Boa comunicação para explicar análises e resultados para pessoas não técnicas.
Colaboração com times multidisciplinares (Engenharia, Produto, Growth, Operações).

Responsabilidades

Análises e dados

Realizar análises exploratórias (EDA) e responder perguntas do negócio com dados.
Criar e manter consultas SQL e scripts em Python para extração, limpeza e transformação de dados.
Apoiar a definição e padronização de métricas (funil, conversão, operação, performance de processos).
Ajudar a estruturar dados no datalake (AWS), organizando tabelas e datasets por camadas (estrutura medalhão), com foco em:
- rastreabilidade do dado (de onde veio e como foi transformado);
- qualidade e consistência;
- reuso por diferentes áreas.
Apoiar transformações e processamento de dados em Spark (PySpark) para conjuntos maiores, dentro dos padrões definidos pelo time.

Agentes de IA e automações

Apoiar a criação de agentes de IA para automação interna, por exemplo:
- geração de relatórios e resumos automáticos a partir de dados;
- bots internos para responder perguntas com base em dados e documentos;
- alertas inteligentes e classificações (triagem, priorização, análise de inconsistências).
Construir e testar prompts, templates e fluxos de automação, com foco em previsibilidade, custo e segurança.
Validar resultados (qualidade, custo, tempo) e ajustar os agentes com base em feedback dos usuários internos.
Contribuir com boas práticas de governança (principalmente quando houver dados sensíveis e LGPD).

Diferenciais

AWS e dados

Experiência prática com AWS para dados, especialmente: S3, Athena, Glue, IAM, CloudWatch, Lake Formation e/ou Redshift.
Experiência com processamento em Spark em AWS (Glue/EMR/Databricks) e formatos Parquet/Delta (se aplicável).
Experiência (mesmo em projetos pessoais) com datalake em estrutura medalhão (bronze/silver/gold).

IA (forte diferencial)

Experiência com AWS Bedrock (modelos, agentes, knowledge bases, integrações) para construir automações e soluções internas.
Experiência chamando LLMs via API (Bedrock/OpenAI/Anthropic) e implementando automações com logs, métricas e versionamento.
Portfólio (GitHub, projetos, artigos) com agentes, automações, pipelines ou análises reprodutíveis.

Contexto de negócio

Interesse ou experiência em fintech, crédito, risco e/ou LGPD.

Habilidades

GITModelagem de banco de dadosPL/SQLPythonQualidade de DadosJava Script

Requisitos

Python

Analise de dados

Engenharia de Prompt

Diferenciais

Experiência com AWS Bedrock

Experiência com AWS

Conhecimentos básicos em microserviços

Benefícios

Plano de Saúde

FlowCredi

Ver empresa

Assessoria para aquisição de crédito imobiliário.

São Paulo

Cidade

2024

Fundada

21-50

Colaboradores

FinTech

Setor

Cientista de Dados

FlowCredi

Ver empresa

Inteligência Artificial

Categoria

Full-Time

Jornada de trabalho

Júnior / Pleno

Nível

Tipo de Contratação

Negociável

Faixa Salarial

Remota

Localidade