HEALTH DATA SCIENCE

Anno accademico
2024/2025 Programmi anni precedenti
Titolo corso in inglese
HEALTH DATA SCIENCE
Codice insegnamento
EM1413 (AF:506439 AR:293001)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
SECS-S/05
Periodo
4° Periodo
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
Scopo di questo insegnamento è quello di offrire alcuni elementi di scenario per una delle principali applicazioni di data science: i dati sanitari.

Si esamineranno dunque i principali strumenti statistici più comuni per poter analizzare dati di salute:

- metodi staticici per l'analisi di dati categoriali
- metodi statistici per l'analisi dei costi sanitari
- modelli di sopravvivenza.

Le tecniche statistiche saranno esplorate da un punto di vista teorico e pratico attraverso attività di laboratorio (in R, analizzando dati reali provenienti da diversi sistemi di sorveglianza sanitari).
- Conoscenze sui sistemi informativi per i sistemi sanitari.

- Capacità di utilizzare, confrontare ed interpretare metodi statistici per dati sanitari (dal punto di vista teorico e pratico in R).
Almeno completata la frequenza del corso di Statistical Learning for Data Science. Alcuni concetti del corso di Statistical Learning for Data Science verranno ripresi nella prima settimana del corso, ma una buona conoscenza di R ed Rmarkdown è necessaria al fine di poter seguire propriamente il corso.
1. Introduzione ai dati sanitari:
- Tipologia di dati sanitari (rif. Etzioni)
- Survey: Il caso americano Behavioral Risk Factor Surveillance System (BRFSS) e quello italiano Progressi delle Aziende Sanitarie per la Salute in Italia (PASSI).
- Dati sanitari e politiche sanitarie

2. Modelli statistici per i dati sanitari:

2.a: Analisi di dati categoriali (rif. Agresti):
- Analisi delle tabelle di contingenza e confronto di proporzioni. Rischio relativo, odds ratio e test chi-quadro di indipendenza.
- Regressione logistica. Interpretazione, valutazione e selezione. Predittori categoriali e dati aggregati.
- Regressione di Poisson e binomiale negativa, interpretazione, valutazione e selezione.
- Modelli logit multicategoriali (per dati nominali e ordinali). Interpretazione, valutazione e selezione.
- Modelli lineari generalizzati. Definire la regressione logistica come modello lineare generalizzato.
- Modelli misti lineari generalizzati (modello logistico-normale) Interpretazione, valutazione e selezione.

2.b: Analisi costi assistenza sanitaria (rif. Etzioni):
- Modelli log cost e distribuzione lognormale
- Modelli gamma
- Modelli mistura
- Altri modelli per dati asimmetrici.


3. Laboratorio di analisi dei dati sanitari
- Casi studio e applicazioni pratiche con R.
Agresti, A. (2018). An introduction to categorical data analysis. John Wiley & Sons. (ch 2, 3, 4, 6, 10)
Collett, D. (2015). Modelling survival data in medical research. CRC press. (ch 2, 3)
Etzioni, R. (2020). Statistics for Health Data Science (ch 1, 6)
Slides della docente disponibili su moodle.
Progetto individuale o di gruppo che consiste in analizzare un dataset e redigere una relazione + presentazione in aula dei risultati ottenuti. È possibile utilizzare R e Rmarkdown o qualsiasi altro software.
Per ottenere la sufficienza gli studenti devono essere in grado di svolgere principali analisi in R e ed essere in grado di commentarle tenendo conto dei loro risvolti applicativi.
Lezioni frontali (teoria e laboratorio in R)
Inglese
scritto e orale

Questo insegnamento tratta argomenti connessi alla macroarea "Capitale umano, salute, educazione" e concorre alla realizzazione dei relativi obiettivi ONU dell'Agenda 2030 per lo Sviluppo Sostenibile

Programma definitivo.
Data ultima modifica programma: 30/06/2024