STATISTICAL INFERENCE AND LEARNING

Anno accademico
2021/2022 Programmi anni precedenti
Titolo corso in inglese
STATISTICAL INFERENCE AND LEARNING
Codice insegnamento
CM0471 (AF:335537 AR:175945)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
2
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento ricade tra le attività educative del corso di laurea magistrale in Computer Science che consentono allo studente di acquisire strumenti avanzati per l’analisi di dati mediante tecniche statistiche e di apprendimento automatico. L’obiettivo dell’insegnamento è sviluppare le competenze statistiche necessarie per analizzare dati caratterizzati da alta dimensionalità al fine di risolvere problemi di previsione e classificazione che sorgono nei più svariati ambiti tecnologico-scientifici, biomedici ed economico-aziendali.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:
1. (conoscenza e comprensione)
- conoscere e comprendere metodi avanzati propri dell’apprendimento statistico per la sintesi, la previsione e la classificazione
2. (capacità di applicare conoscenza e comprensione)
- applicare in modo autonomo metodi statistici avanzati per sintetizzare informazioni, effettuare previsioni e classificazioni anche con dataset caratterizzati da alta dimensionalità
- utilizzare in modo autonomo software statistico per analizzare dataset caratterizzati da alta dimensionalità
3. (capacità di giudizio)
- esprimere valutazioni autonome rispetto alla validità e alla fattibilità di diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
Si assume che gli studenti abbiano raggiunto gli obiettivi formativi del corso di Applied Probability for Computer Science (https://www.unive.it/data/insegnamento/335487 ) anche senza avere necessariamente superato l’esame. In particolare, è importante che gli studenti abbiano una piena dimistichezza con i concetti di base del calcolo delle probabilità, le variabili casuali, le tecniche di simulazione e gli strumenti di base dell'inferenza statistica.
Il programma del corso prevede la presentazione e la discussione dei seguenti argomenti:
1. modelli previsivi lineari
2. tecniche di classificazione
3. metodi di ricampionamento
4. scelta fra modelli e regolarizzazione
5. modelli non lineari
L’utilizzo del linguaggio R (www.r-project.org) è una parte integrante del corso.
- James G, Witten D, Hastie T, Tibshirani R (2015). An Introduction to Statistical Learning. 6th version. Springer. Pagina web http://www-bcf.usc.edu/~gareth/ISL/
- Letture e materiali integrativi distribuiti durante il corso tramite la piattaforma Moodle
La verifica dell'apprendimento avviene tramite una prova scritta. La prova presenta quattro esercizi scelti in modo da misurare
1. le conoscenze della teoria degli argomenti del corso,
2. la capacità di applicare i metodi appresi per risolvere problemi reali.
Il punteggio massimo per ogni esercizio è 8 punti. Il punteggio finale è dato dalla somma dei punteggi dei quattro esercizi. Un punteggio complessivo che supera 30 punti corrisponde alla lode.
Lezioni di teoria convenzionali accompagnate da esercitazioni in aula, discussione di casi studio e laboratori. Materiale didattico curato del docente verrà distribuito durante il corso tramite la piattaforma Moodle. Il software statistico utilizzato nel corso è R (www.r-project.org).
Inglese
scritto
Programma definitivo.
Data ultima modifica programma: 11/03/2021