ANALISI PREDITTIVA

Anno accademico
2024/2025 Programmi anni precedenti
Titolo corso in inglese
PREDICTIVE ANALYTICS
Codice insegnamento
CT0429 (AF:402027 AR:218249)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
3
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
Questo corso fa parte delle attività educative interdisciplinari del curriculum Data Science del Corso di laurea in Informatica. Il corso è progettato per fornire una panoramica di diversi strumenti statistici disponibili per la modellazione predittiva, a livello intermedio.
In corso tratta i concetti principali nei modelli lineari e nei modelli lineari generalizzati, e possibili estensioni di tali modelli tra cui l'analisi delle serie temporali. L'attenzione è rivolta a fornire sia le principali informazioni sulle basi statistico-matematiche dei modelli e la dimostrazione dell'effettiva implementazione dei metodi attraverso l'uso di software statistici. Il corso prevede una miscela di teoria e codice, con particolare attenzione ai temi della riproducibilità delle analisi. Vengono anche presentati esempi di dati reali e casi di studio.
1. Conoscenza e comprensione
- Conoscere e comprendere i concetti matematici sottostanti i modelli lineari, anche generalizzati, e la loro stima
- Comprendere la relazione tra modelli lineari e concetti probabilistici ed inferenziali di base
- Conoscere e comprendere le diverse tipologie di analisi statistiche con scopo predittivo per cui possono essere usati i modelli lineari, anche generalizzati

2. Capacità di applicare conoscenza e comprensione

- Capacità di applicare le tecniche per l'analisi, la progettazione e la soluzione dei problemi di carattere statistico.
- Capacità di applicare tecniche di elaborazione dati a dati reali utilizzando software statistico appropriato.
- Capacità di utilizzare i risultati della stima di un modello statistico nel contesto della predizione e classificazione

3. Abilità comunicative

- Saper utilizzare il linguaggio e la notazione tecnica per comunicare i dettagli di un modello statistico predittivo.
- Saper tradurre i concetti statistici e matematici relativi ai modelli lineari in linguaggio comune e viceversa.
Si assume che gli studenti abbiano raggiunto gli obiettivi formativi dei corsi
Analisi Matematica 1 e 2 (ex Calcolo 1 e 2)
Algebra Lineare
Probabilità e Statistica
Analisi dei dati
anche senza avere necessariamente superato l’esame.
1. Introduzione
1.1 Panoramica del corso
1.2 Che cos'è la modellazione predittiva?
1.3 Notazione generale e background

2. Modelli lineari I: modello lineare semplice e multiplo
2.1 Formulazione del modello e minimi quadrati
2.2 Presupposti del modello
2.3 Inferenza per i parametri del modello
2.4 Previsione
2.5 ANOVA
2.6 Modello adatto

3. Modelli lineari II: selezione del modello, estensioni e diagnostica
3.1 Selezione del modello
3.2 Uso di predittori qualitativi
3.3 Relazioni non lineari
3.4 Diagnostica del modello
3.5 Possibilii criticità nei modelli di regressione

4. Modelli lineari generalizzati
4.1 Formulazione e stima del modello
4.2 Inferenza per i parametri del modello
4.3 Previsione
4.4 Devianza
4.5 Selezione del modello
4.6 Diagnostica del modello

A seconda della tempistiche del corso :
5. Predizione per serie temporali
5.1: gli elementi delle serie temporali
5.2: modelli auto-regressivi
5.3: predizione tramite lisciamento esponenziale

Il programma è soggetto a piccole modifiche se necessarie nella durata del corso e/o del calendario accademico. Viene inoltre incoraggiata la possibilità per gli studenti di chiedere attivamente di modificare parzialmente il programma per rispondere ad esigenze specifiche.
Julian J. Faraway, 2014. Linear Models with R Second Edition, Chapman and Hall/CRC
Julian J. Faraway, 2016. Extending the Linear Model with R: Generalized Linear, Mixed Effects and Nonparametric Regression Models, Second Edition Chapman and Hall/CRC
Peter H. Westfall, Andrea L. Arias, Understanding Regression Analysis - A Conditional Distribution Approach, Chapman and Hall/CRC
James, Gareth, Daniela Witten, Trevor Hastie, and Robert Tibshirani. 2013. An Introduction to Statistical Learning. Springer
L'esame dura 90 minuti, si svolge in laboratorio informatico e si compone di due parti: una parte scritta (che vale 18 punti) e una parte in R (che vale 16 punti). Entrambe le parti si compongono di diversi esercizi volti a valutare
1. le conoscenze della teoria degli argomenti del corso,
2. la capacità di applicare la teoria per risolvere problemi reali.
3. la capacità di usare il software R e interpretare l'output del software per risolvere problemi reali.
4. la capacità di usare il software R per presentare i risultati di un'analisi statistica.

Tipicamente la gradazione del voto seguirà i seguenti criteri:
A. punteggi nella fascia 18-22 verranno attribuiti in presenza di:
- comprensione di base dei concetti teorici di base della analisi predittiva statistica;
- limitata capacità di interpretare e presentare un'analisi predittiva statistica;
- limitata capacità di adattare un'analisi alle richieste del problema reale di interesse;
B. punteggi nella fascia 23-26 verranno attribuiti in presenza di:
- comprensione non solo di base di concetti teorici sottostanti l'analisi predittiva statistica;
- discreta capacità di interpretare e presentare un'analisi predittiva statistica;
- discreta capacità di adattare un'analisi alle richieste del problema reale di interesse;
C. punteggi nella fascia 27-30 verranno attribuiti in presenza di:
- buona od ottima comprensione dei concetti teorici sottostanti l'analisi predittiva statistica;
- buona od ottima capacità di interpretare e presentare un'analisi predittiva statistica;
- buona od ottima capacità di adattare un'analisi alle richieste del problema reale di interesse;
D. la lode verrà attribuita a studenti che dimostrino una particolare capacità di risoluzione di tutti i quesiti posti con cura e attenzione ai particolari
scritto
Il corso prevede lezioni frontali che consistono in un misto di teoria (descrizione dei metodi) e pratica (implementazione e uso pratico dei metodi). L'implementazione dei metodi è svolta tramite il linguaggio statistico R. Gli studenti sono incoraggiati a portare il proprio laptop e a provare il codice durante alcune parti delle lezioni.
Italiano
Programma definitivo.
Data ultima modifica programma: 28/01/2025