STATISTICAL INFERENCE AND LEARNING

Anno accademico
2024/2025 Programmi anni precedenti
Titolo corso in inglese
STATISTICAL INFERENCE AND LEARNING
Codice insegnamento
CM0471 (AF:451271 AR:286744)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
2
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento ricade tra le attività educative del corso di laurea magistrale in Computer Science che consentono allo studente di acquisire strumenti avanzati per l’analisi di dati mediante tecniche statistiche e di apprendimento automatico. L’obiettivo dell’insegnamento è sviluppare le competenze statistiche necessarie per analizzare dati caratterizzati da alta dimensionalità al fine di risolvere problemi di previsione e classificazione che sorgono nei più svariati ambiti tecnologico-scientifici, biomedici ed economico-aziendali.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:
1. (conoscenza e comprensione)
- conoscere e comprendere metodi avanzati propri dell’apprendimento statistico per la sintesi, la previsione e la classificazione
2. (capacità di applicare conoscenza e comprensione)
- applicare in modo autonomo metodi statistici avanzati per sintetizzare informazioni, effettuare previsioni e classificazioni anche con dataset caratterizzati da alta dimensionalità
- utilizzare in modo autonomo software statistico per analizzare dataset caratterizzati da alta dimensionalità
3. (capacità di giudizio)
- esprimere valutazioni autonome rispetto alla validità e alla fattibilità di diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
Si assume che gli studenti abbiano raggiunto gli obiettivi formativi del corso di Applied Probability for Computer Science (https://www.unive.it/data/insegnamento/335487 ) anche senza avere necessariamente superato l’esame. In particolare, è importante che gli studenti abbiano una piena dimistichezza con i concetti di base del calcolo delle probabilità, le variabili casuali, le tecniche di simulazione e gli strumenti di base dell'inferenza statistica.
Il programma del corso prevede la presentazione e la discussione dei seguenti argomenti:
1. modelli previsivi lineari
2. tecniche di classificazione
3. metodi di ricampionamento
4. scelta fra modelli e regolarizzazione
5. modelli non lineari
L’utilizzo del linguaggio R (www.r-project.org) è una parte integrante del corso.
- James G, Witten D, Hastie T, Tibshirani R (2015). An Introduction to Statistical Learning. 6th version. Springer. Pagina web http://www-bcf.usc.edu/~gareth/ISL/
- Letture e materiali integrativi distribuiti durante il corso tramite la piattaforma Moodle
La verifica dell'apprendimento avviene tramite la discussione orale di un progetto concordato con il docente. Il progetto consiste nell'analisi di un insieme di dati utilizzando i metodi appresi nel corso. Lo studente deve preparare una relazione che descrive il lavoro svolto e poi discuterla con il docente.

Gli studenti saranno valutati in termini di
- qualità delle analisi statistiche
- correttezza del linguaggio tecnico
- correttezza delle conclusioni
- qualità della presentazione (report)
- qualità della discussione orale

Regole:
1) se lo studente non passa l'esame, allora può provare l'esame in un appello successivo con lo stesso progetto. Tuttavia, se lo studente dovesse essere nuovamente bocciato allora sarà necessario considerare un *nuovo* progetto per le sessioni d'esame successive
2) se lo studente passa l'esame ma decide di rifiutare il voto, allora sarà necessario considerare un *nuovo* progetto per le sessioni d'esame successive

Valutazione:
Il punteggio complessivo è dato dalla somma della valutazione assegnata alla relazione che descrive le analisi statistiche svolte (60%) e della valutazione assegnata alla presentazione e discussione orale dei risultati descritti nella relazione (40%). Durante la discussione gli studenti possono anche ricevere domande su argomenti del corso non trattati nel progetto
Lezioni di teoria convenzionali accompagnate da esercitazioni in aula, discussione di casi studio e laboratori. Materiale didattico curato del docente verrà distribuito durante il corso tramite la piattaforma Moodle. Il software statistico utilizzato nel corso è R (www.r-project.org).
Inglese
orale
Programma definitivo.
Data ultima modifica programma: 13/10/2024