Ciência de Dados Aplicada à Epidemiologia - 2025

Author

Oswaldo G Cruz & Laís Picinini Freitas

Published

July 1, 2025

Apresentação do Curso

Ciência de Dados Aplicada à Epidemiologia I - 2025

  • Sigla: ENSP.86.120.1
  • Créditos: 2
  • Carga Horária: 60

Oswaldo G Cruz & Laís Picinini Freitas

Aulas Gravadas

Aulas Gravadas

OBJETIVO

Capacitar os estudantes a compreender e aplicar os fundamentos da Ciência de Dados no contexto da Epidemiologia com o apoio de ferramentas computacionais.

CONTEÚDO

  1. Fundamentos da Ciência de Dados aplicada à Saúde

    • Conceitos básicos de Ciência de Dados e sua relevância na Epidemiologia
    • Ética no uso de dados de saúde
    • Reprodutibilidade e transparência em pesquisas científicas
    • Apresentação de ferramentas (SQL, DuckDB, R, RStudio, RMarkdown, git, github)
  2. Bases de Dados e Linguagem SQL

    • Conceitos de bancos de dados relacionais
    • Linguagem SQL: criação, consulta e manipulação de dados
    • Uso de DuckDB para análise local de grandes volumes de dados
  3. Acesso e Consumo de Dados

    • Leitura de dados locais (CSV, Excel, etc.)
    • Consumo de dados remotos: APIs, FTP e web scraping
    • Integração do DuckDB (SQL) com R para manipulação de dados locais e em nuvem
  4. Limpeza, Transformação e Armazenamento de Dados

    • Limpeza e padronização de bases de dados (uso do dplyr, tidyr, janitor, etc.)
    • Manipulação eficiente com data.frame, tibble, e data.table
    • Armazenamento em bancos relacionais com SQL e DuckDB
  5. Visualização de dados e comunicação

    • Visualização de dados com ggplot2
    • Introdução ao Rmarkdown para documentação e relatórios dinâmicos
    • Dashboards com Shiny
    • Visualizações interativas com leaflet e plotly

AVALIAÇÃO

Trabalho final

  • Prazo: 31 de outubro de 2025
  • Trabalho individual ou em dupla
  • Formato Quarto/Rmarkdown

O trabalho deve ser em formato de relatório e conter:

  • descrição dos dados,
  • procedimentos de importação de dados externos,
  • preparação/limpeza dos dados usando o tidyverse,
  • criação de novas variáveis,
  • geração de pelo menos um gráfico e uma tabela.

De preferência, use seus dados. Caso não seja possível, use dados públicos.

Crie um ZIP com os anexos e texto relevantes.

Envio dos Trabalhos

Clque Aqui ou acesse no seu navegador https://own.procc.fiocruz.br/index.php/s/WWPtINoA6d0LVbV

Simplesmente arraste o seu o arquivo ZIPADO com o material!