DATA MANAGEMENT

Anno accademico
2021/2022 Programmi anni precedenti
Titolo corso in inglese
DATA MANAGEMENT
Codice insegnamento
ET4015 (AF:303809 AR:167547)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
INF/01
Periodo
4° Periodo
Anno corso
3
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L'insegnamento è collocato nella fascia "Affine/Integrativa" nel percorso "Economics, markets and finance" ed è un insegnamento a scelta da 6 crediti, erogato nel quarto periodo didattico. Il corso si propone di introdurre gli studenti alla gestione e analisi di grandi moli di dati attraverso l'uso di database relazionali e strumenti di manipolazione e visualizzazione di dati. Nell'ambito del "data management", si affrontano problematiche di estrazione di dati grezzi, loro organizzazione in un database, ed infine loro manipolazione e analisi tramite opportuni "data manipulation and visualization languages". Il corso ha una forte impronta laboratoriale volta alla presentazione di strumenti di gestione dei dati. Particolare enfasi verrà data allo studio dei database relazionali e del linguaggio SQL e all'analisi e visualizzazione di dati mediante il linguaggio Python.
Lo studente alla fine del corso sarà in grado di gestire grandi moli di dati e analizzarle a fini predittivi usando strumenti di basi di dati e data visualization. L'obiettivo del corso sarà di fornire allo studente un quadro complessivo dell'attuale stato dell'arte sul tema e sui suoi possibili sviluppi. I risultati di apprendimento attesi si dividono in:

1. Conoscenza e comprensione:
Al termine del corso lo studente sarà in grado di riconoscere le tecniche di data management più adatte ad affrontare specifiche problematiche.

2. Capacità di applicare conoscenza e comprensione:
Al termine del corso lo studente sarà in grado di applicare le tecniche di data management apprese (database SQL e librerie Python di data visualization) per risolvere problemi tipici di analisi e manipolazione di grosse quantità di dati.

3. Capacità di giudizio:
Al termine del corso lo studente sarà in grado di utilizzare le conoscenze acquisite per:
- progettare e gestire basi di dati efficienti su grandi moli di dati tramite il linguaggio SQL.
- filtrare i dati estraendo l'informazione strettamente necessaria ad individuare relazioni di interesse.
- visualizzare il risultato dell'analisi tramite strumenti professionali di data visualization (Python Pandas e Seaborn)
Nozioni di base di analisi matematica e calcolo delle probabilità.
Basi di dati:
- Introduzione alle basi di dati
- algebra relazionale
- diagrammi entità/relazioni
- design logico
- design fisico e interrogazioni: SQL

analisi di dati con Python:
- Pandas: series e dataframes
- visualizzazione di dati con Seaborn
- Database Systems: The Complete Book, Hector Garca-Molina, Jeffrey Ullman, and Jennifer Widom. Pearson Prentice Hall.
- Python for Data Analysis”, 2nd Edition, Wes McKinney (2017). O'Reilly Media, ISBN: 9781491957660
L'esame consiste in un progetto di gruppo e discussione orale.
Slides e laboratori pratici.
Inglese
orale
Programma definitivo.
Data ultima modifica programma: 31/05/2021