A tua carreira de Data Science & AI Engineer começa aqui!
No curso Data Science & AI Engineer vais aprender a manipular, explorar, visualizar e modelar dados usando Python e as principais bibliotecas da área. Irás também desenvolver pipelines, automatizar análises, aplicar machine learning e explorar a interseção entre inteligência artificial e tomada de decisão.
Sobre o curso
Data Science & AI Engineer
O Data Science & AI Engineer é um perfil técnico com foco na análise avançada de dados, construção de modelos de machine learning e desenvolvimento de soluções inteligentes aplicadas ao negócio. Este curso dá-te as competências práticas e estratégicas para trabalhar com dados — desde a extração e preparação até à visualização e automação com inteligência artificial.
Desenvolvido com profissionais da área, este bootcamp é indicado para quem quer entrar ou evoluir na área da ciência de dados, inteligência artificial ou engenharia de dados aplicada.
Objetivos
Entender e aplicar métodos de ciência de dados em contextos reais
Dominar o uso de Python para análise, visualização e modelação
Desenvolver modelos de machine learning supervisionados e não supervisionados
Trabalhar com dados estruturados e não estruturados
Explorar ferramentas de AI generativa e automação inteligente
Preparar e apresentar projetos com impacto estratégico
programa
Conteúdo programático
1
Fundamentos de Data Science & Python Básico
32
h
O que é Data Science e aplicações no mercado
Pensamento analítico e problem solving com dados
Tipos de dados, fontes e qualidade
Introdução ao Python: tipos de dados, variáveis, operadores
Estruturas de controle: condicionais e loops
Funções em Python
Ambientes de trabalho: Jupyter, Colab, VS Code
Git/GitHub: versionamento de código
Exercícios guiados de lógica e programação
1
Fundamentos de Data Science & Python Básico
32
h
O que é Data Science e aplicações no mercado
Pensamento analítico e problem solving com dados
Tipos de dados, fontes e qualidade
Introdução ao Python: tipos de dados, variáveis, operadores
Estruturas de controle: condicionais e loops
Funções em Python
Ambientes de trabalho: Jupyter, Colab, VS Code
Git/GitHub: versionamento de código
Exercícios guiados de lógica e programação
1
Fundamentos de Data Science & Python Básico
32
h
O que é Data Science e aplicações no mercado
Pensamento analítico e problem solving com dados
Tipos de dados, fontes e qualidade
Introdução ao Python: tipos de dados, variáveis, operadores
Estruturas de controle: condicionais e loops
Funções em Python
Ambientes de trabalho: Jupyter, Colab, VS Code
Git/GitHub: versionamento de código
Exercícios guiados de lógica e programação
1
Fundamentos de Data Science & Python Básico
32
h
O que é Data Science e aplicações no mercado
Pensamento analítico e problem solving com dados
Tipos de dados, fontes e qualidade
Introdução ao Python: tipos de dados, variáveis, operadores
Estruturas de controle: condicionais e loops
Funções em Python
Ambientes de trabalho: Jupyter, Colab, VS Code
Git/GitHub: versionamento de código
Exercícios guiados de lógica e programação
2
Programação em Python para Dados
32
h
Estruturas de dados: listas, dicionários, conjuntos, tuplas
Manipulação de arquivos (CSV, JSON, Excel)
Bibliotecas: NumPy, Pandas (indexação, seleção, transformações)
Limpeza e tratamento de dados (valores nulos, outliers, tipos)
Boas práticas de código (PEP8, modularização, docstrings)
Testes automatizados básicos (pytest)
Mini-projeto: análise exploratória de uma base simples (CSV → Pandas → visualização inicial com Matplotlib/Seaborn)
2
Programação em Python para Dados
32
h
Estruturas de dados: listas, dicionários, conjuntos, tuplas
Manipulação de arquivos (CSV, JSON, Excel)
Bibliotecas: NumPy, Pandas (indexação, seleção, transformações)
Limpeza e tratamento de dados (valores nulos, outliers, tipos)
Boas práticas de código (PEP8, modularização, docstrings)
Testes automatizados básicos (pytest)
Mini-projeto: análise exploratória de uma base simples (CSV → Pandas → visualização inicial com Matplotlib/Seaborn)
2
Programação em Python para Dados
32
h
Estruturas de dados: listas, dicionários, conjuntos, tuplas
Manipulação de arquivos (CSV, JSON, Excel)
Bibliotecas: NumPy, Pandas (indexação, seleção, transformações)
Limpeza e tratamento de dados (valores nulos, outliers, tipos)
Boas práticas de código (PEP8, modularização, docstrings)
Testes automatizados básicos (pytest)
Mini-projeto: análise exploratória de uma base simples (CSV → Pandas → visualização inicial com Matplotlib/Seaborn)
2
Programação em Python para Dados
32
h
Estruturas de dados: listas, dicionários, conjuntos, tuplas
Manipulação de arquivos (CSV, JSON, Excel)
Bibliotecas: NumPy, Pandas (indexação, seleção, transformações)
Limpeza e tratamento de dados (valores nulos, outliers, tipos)
Boas práticas de código (PEP8, modularização, docstrings)
Testes automatizados básicos (pytest)
Mini-projeto: análise exploratória de uma base simples (CSV → Pandas → visualização inicial com Matplotlib/Seaborn)
3
Visualização de Dados & Storytelling
32
h
Gráficos básicos e avançados com Matplotlib e Seaborn
Visualização interativa com Plotly
Dashboards simples com Streamlit
Boas práticas de visualização e design da informação
Storytelling com dados para diferentes públicos (técnicos e gestores)
Preparação de relatórios e apresentações analíticas
Exercício prático: criar dashboard com insights de uma base real
3
Visualização de Dados & Storytelling
32
h
Gráficos básicos e avançados com Matplotlib e Seaborn
Visualização interativa com Plotly
Dashboards simples com Streamlit
Boas práticas de visualização e design da informação
Storytelling com dados para diferentes públicos (técnicos e gestores)
Preparação de relatórios e apresentações analíticas
Exercício prático: criar dashboard com insights de uma base real
3
Visualização de Dados & Storytelling
32
h
Gráficos básicos e avançados com Matplotlib e Seaborn
Visualização interativa com Plotly
Dashboards simples com Streamlit
Boas práticas de visualização e design da informação
Storytelling com dados para diferentes públicos (técnicos e gestores)
Preparação de relatórios e apresentações analíticas
Exercício prático: criar dashboard com insights de uma base real
3
Visualização de Dados & Storytelling
32
h
Gráficos básicos e avançados com Matplotlib e Seaborn
Visualização interativa com Plotly
Dashboards simples com Streamlit
Boas práticas de visualização e design da informação
Storytelling com dados para diferentes públicos (técnicos e gestores)
Preparação de relatórios e apresentações analíticas
Exercício prático: criar dashboard com insights de uma base real
4
Estatística & Probabilidades Aplicadas
32
h
Probabilidades, distribuições e amostragem
Testes de hipótese e intervalos de confiança
Correlações, regressões e análises multivariadas
Tamanho de amostra e poder estatístico
Testes A/B e experimentação digital
Introdução à estatística bayesiana
Projeto prático: conduzir um A/B test com dataset simulado
4
Estatística & Probabilidades Aplicadas
32
h
Probabilidades, distribuições e amostragem
Testes de hipótese e intervalos de confiança
Correlações, regressões e análises multivariadas
Tamanho de amostra e poder estatístico
Testes A/B e experimentação digital
Introdução à estatística bayesiana
Projeto prático: conduzir um A/B test com dataset simulado
4
Estatística & Probabilidades Aplicadas
32
h
Probabilidades, distribuições e amostragem
Testes de hipótese e intervalos de confiança
Correlações, regressões e análises multivariadas
Tamanho de amostra e poder estatístico
Testes A/B e experimentação digital
Introdução à estatística bayesiana
Projeto prático: conduzir um A/B test com dataset simulado
4
Estatística & Probabilidades Aplicadas
32
h
Probabilidades, distribuições e amostragem
Testes de hipótese e intervalos de confiança
Correlações, regressões e análises multivariadas
Tamanho de amostra e poder estatístico
Testes A/B e experimentação digital
Introdução à estatística bayesiana
Projeto prático: conduzir um A/B test com dataset simulado
5
Machine Learning
32
h
O que é Machine Learning: supervised vs. unsupervised
Preparação de datasets para modelagem (treino, validação, teste)
Regressão linear, Regressão logística, KNN, SVM, K-means
Árvores de decisão e Random Forest
Métricas de performance (RMSE, MAE, accuracy, precision, recall, F1)
Cross-validation e tuning de hiperparâmetros (GridSearch, RandomSearch)
Introdução à interpretabilidade de modelos (feature importance, SHAP)
Projeto prático: prever preços ou classificação binária real
5
Machine Learning
32
h
O que é Machine Learning: supervised vs. unsupervised
Preparação de datasets para modelagem (treino, validação, teste)
Regressão linear, Regressão logística, KNN, SVM, K-means
Árvores de decisão e Random Forest
Métricas de performance (RMSE, MAE, accuracy, precision, recall, F1)
Cross-validation e tuning de hiperparâmetros (GridSearch, RandomSearch)
Introdução à interpretabilidade de modelos (feature importance, SHAP)
Projeto prático: prever preços ou classificação binária real
5
Machine Learning
32
h
O que é Machine Learning: supervised vs. unsupervised
Preparação de datasets para modelagem (treino, validação, teste)
Regressão linear, Regressão logística, KNN, SVM, K-means
Árvores de decisão e Random Forest
Métricas de performance (RMSE, MAE, accuracy, precision, recall, F1)
Cross-validation e tuning de hiperparâmetros (GridSearch, RandomSearch)
Introdução à interpretabilidade de modelos (feature importance, SHAP)
Projeto prático: prever preços ou classificação binária real
5
Machine Learning
32
h
O que é Machine Learning: supervised vs. unsupervised
Preparação de datasets para modelagem (treino, validação, teste)
Regressão linear, Regressão logística, KNN, SVM, K-means
Árvores de decisão e Random Forest
Métricas de performance (RMSE, MAE, accuracy, precision, recall, F1)
Cross-validation e tuning de hiperparâmetros (GridSearch, RandomSearch)
Introdução à interpretabilidade de modelos (feature importance, SHAP)
Projeto prático: prever preços ou classificação binária real
6
Machine Learning II (Avançado e Pipelines)
32
h
Modelos: KNN, Gradient Boosting, XGBoost
Introdução a clustering (K-means, hierárquico)
Pipelines em scikit-learn
Introdução ao MLflow para versionamento de experimentos
Boas práticas de documentação e reprodutibilidade
Deploy de modelo simples (API Flask ou Streamlit app)
Projeto prático: classificador + dashboard com deploy local
6
Machine Learning II (Avançado e Pipelines)
32
h
Modelos: KNN, Gradient Boosting, XGBoost
Introdução a clustering (K-means, hierárquico)
Pipelines em scikit-learn
Introdução ao MLflow para versionamento de experimentos
Boas práticas de documentação e reprodutibilidade
Deploy de modelo simples (API Flask ou Streamlit app)
Projeto prático: classificador + dashboard com deploy local
6
Machine Learning II (Avançado e Pipelines)
32
h
Modelos: KNN, Gradient Boosting, XGBoost
Introdução a clustering (K-means, hierárquico)
Pipelines em scikit-learn
Introdução ao MLflow para versionamento de experimentos
Boas práticas de documentação e reprodutibilidade
Deploy de modelo simples (API Flask ou Streamlit app)
Projeto prático: classificador + dashboard com deploy local
6
Machine Learning II (Avançado e Pipelines)
32
h
Modelos: KNN, Gradient Boosting, XGBoost
Introdução a clustering (K-means, hierárquico)
Pipelines em scikit-learn
Introdução ao MLflow para versionamento de experimentos
Boas práticas de documentação e reprodutibilidade
Deploy de modelo simples (API Flask ou Streamlit app)
Projeto prático: classificador + dashboard com deploy local
7
Data Engineering & Big Data Fundamentals
32
h
Arquitetura de dados: pipelines, ETL, do Excel ao Data Lake
Integração com APIs e bases de dados relacionais
SQL para cientistas de dados (SELECT, JOIN, agregações, subqueries)
Pandas + SQL juntos (SQLAlchemy)
Formatos otimizados (Parquet, Feather)
Noções básicas de cloud (Google Cloud, AWS ou Azure)
Introdução a Docker e ambientes reprodutíveis
Orquestração de pipelines (Airflow básico – demo conceitual)
7
Data Engineering & Big Data Fundamentals
32
h
Arquitetura de dados: pipelines, ETL, do Excel ao Data Lake
Integração com APIs e bases de dados relacionais
SQL para cientistas de dados (SELECT, JOIN, agregações, subqueries)
Pandas + SQL juntos (SQLAlchemy)
Formatos otimizados (Parquet, Feather)
Noções básicas de cloud (Google Cloud, AWS ou Azure)
Introdução a Docker e ambientes reprodutíveis
Orquestração de pipelines (Airflow básico – demo conceitual)
7
Data Engineering & Big Data Fundamentals
32
h
Arquitetura de dados: pipelines, ETL, do Excel ao Data Lake
Integração com APIs e bases de dados relacionais
SQL para cientistas de dados (SELECT, JOIN, agregações, subqueries)
Pandas + SQL juntos (SQLAlchemy)
Formatos otimizados (Parquet, Feather)
Noções básicas de cloud (Google Cloud, AWS ou Azure)
Introdução a Docker e ambientes reprodutíveis
Orquestração de pipelines (Airflow básico – demo conceitual)
7
Data Engineering & Big Data Fundamentals
32
h
Arquitetura de dados: pipelines, ETL, do Excel ao Data Lake
Integração com APIs e bases de dados relacionais
SQL para cientistas de dados (SELECT, JOIN, agregações, subqueries)
Pandas + SQL juntos (SQLAlchemy)
Formatos otimizados (Parquet, Feather)
Noções básicas de cloud (Google Cloud, AWS ou Azure)
Introdução a Docker e ambientes reprodutíveis
Orquestração de pipelines (Airflow básico – demo conceitual)
8
Inteligência Artificial Aplicada
32
h
O que é Deep Learning e redes neurais
Introdução ao TensorFlow/Keras
Casos práticos: classificação de imagens e séries temporais
Introdução a Transformers e HuggingFace (pipeline básico)
AI generativa (LLMs: ChatGPT, Claude, Gemini)
Prompt Engineering aplicado a dados e automação
Introdução a RAG (Retrieval-Augmented Generation)
Ética em IA: viés, privacidade e impacto social
8
Inteligência Artificial Aplicada
32
h
O que é Deep Learning e redes neurais
Introdução ao TensorFlow/Keras
Casos práticos: classificação de imagens e séries temporais
Introdução a Transformers e HuggingFace (pipeline básico)
AI generativa (LLMs: ChatGPT, Claude, Gemini)
Prompt Engineering aplicado a dados e automação
Introdução a RAG (Retrieval-Augmented Generation)
Ética em IA: viés, privacidade e impacto social
8
Inteligência Artificial Aplicada
32
h
O que é Deep Learning e redes neurais
Introdução ao TensorFlow/Keras
Casos práticos: classificação de imagens e séries temporais
Introdução a Transformers e HuggingFace (pipeline básico)
AI generativa (LLMs: ChatGPT, Claude, Gemini)
Prompt Engineering aplicado a dados e automação
Introdução a RAG (Retrieval-Augmented Generation)
Ética em IA: viés, privacidade e impacto social
8
Inteligência Artificial Aplicada
32
h
O que é Deep Learning e redes neurais
Introdução ao TensorFlow/Keras
Casos práticos: classificação de imagens e séries temporais
Introdução a Transformers e HuggingFace (pipeline básico)
AI generativa (LLMs: ChatGPT, Claude, Gemini)
Prompt Engineering aplicado a dados e automação
Introdução a RAG (Retrieval-Augmented Generation)
Ética em IA: viés, privacidade e impacto social
9
Projeto Final: Transformation Lab
44
h
Kickoff do projeto e definição do escopo (problema, hipóteses, metodologia CRISP-DM/CRISP-ML)
Formação de grupos e planejamento inicial
Exploração e pré-processamento dos dados (EDA avançada, limpeza, pipeline de dados)
Modelagem e escolha de métricas de performance (cross-validation, tuning leve)
Implementação dos primeiros modelos e comparação de resultados
Visualização dos insights e construção de dashboards (Streamlit, Plotly)
Deploy básico do modelo (API Flask ou Streamlit app)
Preparação do relatório executivo e da apresentação final para painel profissional
9
Projeto Final: Transformation Lab
44
h
Kickoff do projeto e definição do escopo (problema, hipóteses, metodologia CRISP-DM/CRISP-ML)
Formação de grupos e planejamento inicial
Exploração e pré-processamento dos dados (EDA avançada, limpeza, pipeline de dados)
Modelagem e escolha de métricas de performance (cross-validation, tuning leve)
Implementação dos primeiros modelos e comparação de resultados
Visualização dos insights e construção de dashboards (Streamlit, Plotly)
Deploy básico do modelo (API Flask ou Streamlit app)
Preparação do relatório executivo e da apresentação final para painel profissional
9
Projeto Final: Transformation Lab
44
h
Kickoff do projeto e definição do escopo (problema, hipóteses, metodologia CRISP-DM/CRISP-ML)
Formação de grupos e planejamento inicial
Exploração e pré-processamento dos dados (EDA avançada, limpeza, pipeline de dados)
Modelagem e escolha de métricas de performance (cross-validation, tuning leve)
Implementação dos primeiros modelos e comparação de resultados
Visualização dos insights e construção de dashboards (Streamlit, Plotly)
Deploy básico do modelo (API Flask ou Streamlit app)
Preparação do relatório executivo e da apresentação final para painel profissional
9
Projeto Final: Transformation Lab
44
h
Kickoff do projeto e definição do escopo (problema, hipóteses, metodologia CRISP-DM/CRISP-ML)
Formação de grupos e planejamento inicial
Exploração e pré-processamento dos dados (EDA avançada, limpeza, pipeline de dados)
Modelagem e escolha de métricas de performance (cross-validation, tuning leve)
Implementação dos primeiros modelos e comparação de resultados
Visualização dos insights e construção de dashboards (Streamlit, Plotly)
Deploy básico do modelo (API Flask ou Streamlit app)
Preparação do relatório executivo e da apresentação final para painel profissional
Duração total
Duração total
300h
300h
Hands-on
Hands-on
240h
240h
Projeto
Projeto
60h
60h
Contacta-nos