DATA SCIENCE AND BUSINESS INTELLIGENCE

Anno accademico
2023/2024 Programmi anni precedenti
Titolo corso in inglese
DATA SCIENCE AND BUSINESS INTELLIGENCE
Codice insegnamento
EM1704 (AF:466187 AR:254568)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
INF/01
Periodo
2° Periodo
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
Questo corso si concentra sugli aspetti quantitativi del master, fornendo agli studenti conoscenze e abilità nei metodi di data mining predittivo. Il corso coprirà argomenti come l'analisi dei dati, approcci di classificazione e regressione basati su AI, il clustering (oltre che altri metodi non supervisionati) e l'uso di strumenti software per il data mining via Python. Alla fine del corso, gli studenti dovrebbero essere in grado di estrarre informazioni significative dai dati grezzi e utilizzare i risultati delle loro analisi per prendere decisioni e fare considerazioni utili ai loro scopi.
Al termine del corso, gli studenti dovranno dimostrare una comprensione completa dei principi e delle applicazioni degli algoritmi di apprendimento supervisionato e non supervisionato, essere in grado di applicare appropriate tecniche ai dati e gestire gli strumenti presentati a lezione. Dovrebbero anche essere in grado di confrontare diversi metodi di analisi dei dati, interpretare correttamente i risultati e comunicare efficacemente i loro risultati in un rapporto di analisi comparativa, inclusa la rappresentazione dei dati.
Programmazione - Probabilità e Statistica
1. Introduction to Data Science
- Data-driven approaches and Big Data
- What is Machine Learning and Data Mining: concepts of supervised and unsupervised approaches
- Kinds of data
- Managing a Data Science project
2. Clustering:
- Dimensionality reduction
- Clustering quality evaluation;
3. Supervised Learning
- Model training, validation, and tuning; Feature Engineering
- Classification; Regression; Decision Trees;
4. Similarity Search in Text
- Text representation; Tokenization, Stemming, Lemmatization; Vector space; Similarity measures;
- Letture selezionate ed appunti forniti a lezione
- Python Data Science Handbook. Jake VanderPlas. O'Reilly. 2016.
- Python Machine Learning - Third Edition. Sebastian Raschka, Vahid Mirjalili. Packt. 2019.
Un esame scritto e un progetto.
La prova scritta esamina le conoscenze teoriche dello studente attraverso domande ed esercizi sugli argomenti trattati durante il corso.
Il progetto serve allo studente per imparare a confrontare diversi strumenti applicati a un determinato set di dati o problema, selezionare la soluzione più adatta e redigere un rapporto (applicazione di conoscenze teoriche a un caso pratico).
Questo corso combina lezioni di teoria e pratica utilizzando la piattaforma Moodle per fornire il materiale.
La programmazione Python viene utilizzata per esplorare ulteriormente gli argomenti.
I partecipanti sono invitati a portare i loro laptop per sfruttare appieno l'esperienza di apprendimento.
Inglese
scritto e orale
Programma definitivo.
Data ultima modifica programma: 13/03/2023