HEALTH DATA SCIENCE

Anno accademico
2023/2024 Programmi anni precedenti
Titolo corso in inglese
HEALTH DATA SCIENCE
Codice insegnamento
EM1413 (AF:474511 AR:208970)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
SECS-S/05
Periodo
4° Periodo
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
Scopo di questo insegnamento è quello di offrire alcuni elementi di scenario per una delle principali applicazioni di data science: i dati sanitari.

Si esamineranno dunque i principali strumenti statistici più comuni per poter analizzare dati di salute:

- metodi staticici per l'analisi di dati categoriali
- metodi statistici per l'analisi dei costi sanitari
- modelli di sopravvivenza.

Le tecniche statistiche saranno esplorate da un punto di vista teorico e pratico attraverso attività di laboratorio (in R, analizzando dati reali provenienti da diversi sistemi di sorveglianza sanitari).
- Conoscenze sui sistemi informativi per i sistemi sanitari.

- Capacità di utilizzare, confrontare ed interpretare metodi statistici per dati sanitari (dal punto di vista teorico e pratico in R).
Almeno completata la frequenza del corso di Statistical Learning for Data Science. Alcuni concetti del corso di Statistical Learning for Data Science verranno ripresi nella prima settimana del corso, ma una buona conoscenza di R ed Rmarkdown è necessaria al fine di poter seguire propriamente il corso.
1. Introduzione ai dati sanitari:
- Tipologia di dati sanitari (rif. Etzioni)
- Survey: Il caso americano Behavioral Risk Factor Surveillance System (BRFSS) e quello italiano Progressi delle Aziende Sanitarie per la Salute in Italia (PASSI).
- Dati sanitari e politiche sanitarie

2. Modelli statistici per i dati sanitari:

2.a: Analisi di dati categoriali (rif. Agresti):
- Analisi delle tabelle di contingenza e confronto di proporzioni. Rischio relativo, odds ratio e test chi-quadro di indipendenza.
- Regressione logistica. Interpretazione, valutazione e selezione. Predittori categoriali e dati aggregati.
- Regressione di Poisson e binomiale negativa, interpretazione, valutazione e selezione.
- Modelli logit multicategoriali (per dati nominali e ordinali). Interpretazione, valutazione e selezione.
- Modelli lineari generalizzati. Definire la regressione logistica come modello lineare generalizzato.
- Modelli misti lineari generalizzati (modello logistico-normale) Interpretazione, valutazione e selezione.

2.b: Analisi costi assistenza sanitaria (rif. Etzioni):
- Modelli log cost e distribuzione lognormale
- Modelli gamma
- Modelli mistura
- Altri modelli per dati asimmetrici.

2.c: Modellazione dei dati di sopravvivenza (rif. Collett):
- Introduzione all'analisi della sopravvivenza.
- Funzione di sopravvivenza, funzione di rischio, censura.
- Modelli di rischio proporzionale, regressione di Cox.

3. Laboratorio di analisi dei dati sanitari
- Casi studio e applicazioni pratiche con R.
Agresti, A. (2018). An introduction to categorical data analysis. John Wiley & Sons. (ch 2, 3, 4, 6, 10)
Collett, D. (2015). Modelling survival data in medical research. CRC press. (ch 2, 3)
Etzioni, R. (2020). Statistics for Health Data Science (ch 1, 6)
1. Studenti frequentanti: Progetto di gruppo che consiste in analizzare un dataset e redigere una relazione + presentazione in aula dei risultati ottenuti. La relazione deve includere almeno la motivazione dell'analisi, l'analisi esplorativa dei dati e un modello statistico. Il tutto deve essere documentato, interpretato e ben spiegato.

2. Studenti non frequentanti: l'esame consiste in rispondere a 4-5 domande riguardanti un dataset (le domande sono simili agli esempi proposti durante il laboratorio in classe). L'esame è a libro aperto. È possibile utilizzare R e Rmarkdown o qualsiasi altro software per tutta la durata dell'esame. Per gli studenti che desiderano aumentare il voto dell'esame scritto, è possibile sostenere un esame orale il giorno della correzione dell'esame.
Lezioni frontali (teoria e laboratorio in R)
Inglese
scritto e orale

Questo insegnamento tratta argomenti connessi alla macroarea "Capitale umano, salute, educazione" e concorre alla realizzazione dei relativi obiettivi ONU dell'Agenda 2030 per lo Sviluppo Sostenibile

Programma definitivo.
Data ultima modifica programma: 28/02/2024