ANALISI PREDITTIVA
- Anno accademico
- 2024/2025 Programmi anni precedenti
- Titolo corso in inglese
- PREDICTIVE ANALYTICS
- Codice insegnamento
- CT0429 (AF:402027 AR:218249)
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Laurea
- Settore scientifico disciplinare
- SECS-S/01
- Periodo
- I Semestre
- Anno corso
- 3
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
In corso tratta i concetti principali nei modelli lineari e nei modelli lineari generalizzati, e possibili estensioni di tali modelli tra cui l'analisi delle serie temporali. L'attenzione è rivolta a fornire sia le principali informazioni sulle basi statistico-matematiche dei modelli e la dimostrazione dell'effettiva implementazione dei metodi attraverso l'uso di software statistici. Il corso prevede una miscela di teoria e codice, con particolare attenzione ai temi della riproducibilità delle analisi. Vengono anche presentati esempi di dati reali e casi di studio.
Risultati di apprendimento attesi
Identificare le tecniche di analisi dei dati più appropriate per un problema di interesse e sapere come applicare le tecniche per l'analisi, la progettazione e la soluzione dei problemi.
Applicare tecniche di elaborazione dati a dati reali utilizzando software statistico appropriato.
Essere in grado di generare nuove idee e anticipare nuove situazioni, nei contesti dell'analisi dei dati e del processo decisionale.
* Competenze specifiche
Utilizzare i risultati classici di inferenza e regressione come base per metodi avanzati di predizione e classificazione.
Saper interpretare e presentare i risultati di un'analisi statistica, con particolare attenzione a saper tradurre i concetti statistici in linguaggio comune e viceversa.
Identificare correttamente il tipo di problema statistico corrispondente a determinati obiettivi e dati, così come le metodologie più appropriate da applicare agli obiettivi e ai dati.
Conoscere come progettare specifici sistemi di elaborazione dati per un tipo di problema statistico (classificazione, stima, previsione, ecc.)
Utilizzare conoscenze pregresse di algebra lineare per l'applicazione nei metodi di analisi dei dati.
Prerequisiti
Analisi Matematica 1 e 2 (ex Calcolo 1 e 2)
Algebra
Probabilità e Statistica
Analisi dei dati
anche senza avere necessariamente superato l’esame.
Contenuti
1.1 Panoramica del corso
1.2 Che cos'è la modellazione predittiva?
1.3 Notazione generale e background
2. Modelli lineari I: modello lineare semplice e multiplo
2.1 Formulazione del modello e minimi quadrati
2.2 Presupposti del modello
2.3 Inferenza per i parametri del modello
2.4 Previsione
2.5 ANOVA
2.6 Modello adatto
3. Modelli lineari II: selezione del modello, estensioni e diagnostica
3.1 Selezione del modello
3.2 Uso di predittori qualitativi
3.3 Relazioni non lineari
3.4 Diagnostica del modello
3.5 Possibilii criticità nei modelli di regressione
4. Modelli lineari generalizzati
4.1 Formulazione e stima del modello
4.2 Inferenza per i parametri del modello
4.3 Previsione
4.4 Devianza
4.5 Selezione del modello
4.6 Diagnostica del modello
A seconda della tempistiche del corso :
5. Predizione per serie temporali
5.1: gli elementi delle serie temporali
5.2: modelli auto-regressivi
5.3: predizione tramite lisciamento esponenziale
Il programma è soggetto a piccole modifiche se necessarie nella durata del corso e/o del calendario accademico. Viene inoltre incoraggiata la possibilità per gli studenti di chiedere attivamente di modificare parzialmente il programma per rispondere ad esigenze specifiche.
Testi di riferimento
Julian J. Faraway, 2016. Extending the Linear Model with R: Generalized Linear, Mixed Effects and Nonparametric Regression Models, Second Edition Chapman and Hall/CRC
Peter H. Westfall, Andrea L. Arias, Understanding Regression Analysis - A Conditional Distribution Approach, Chapman and Hall/CRC
James, Gareth, Daniela Witten, Trevor Hastie, and Robert Tibshirani. 2013. An Introduction to Statistical Learning. Springer
Modalità di verifica dell'apprendimento
1. le conoscenze della teoria degli argomenti del corso,
2. la capacità di applicare la teoria per risolvere problemi reali.
3. la capacità di usare il software R e interpretare l'output del software per risolvere problemi reali.
4. la capacità di usare il software R per presentare i risultati di un'analisi statistica.
Tipicamente la gradazione del voto seguirà i seguenti criteri:
A. punteggi nella fascia 18-22 verranno attribuiti in presenza di:
- comprensione dei concetti teorici di base della analisi predittiva statistica;
- limitata capacità di interpretare e presentare un'analisi predittiva statistica;
- limitata capacità di adattare un'analisi alle richieste del problema reale di interesse;
B. punteggi nella fascia 23-26 verranno attribuiti in presenza di:
- comprensione non solo di base di concetti teorici sottostanti l'analisi predittiva statistica;
- discreta capacità di interpretare e presentare un'analisi predittiva statistica;
- discreta capacità di adattare un'analisi alle richieste del problema reale di interesse;
C. punteggi nella fascia 27-30 verranno attribuiti in presenza di:
- buona od ottima comprensione dei concetti teorici sottostanti l'analisi predittiva statistica;
- buona od ottima capacità di interpretare e presentare un'analisi predittiva statistica;
- buona od ottima capacità di adattare un'analisi alle richieste del problema reale di interesse;
D. la lode verrà attribuita a studenti che dimostrino una particolare capacità di risoluzione di tutti i quesiti posti con cura e attenzione ai particolari