DATA MANAGEMENT

Anno accademico
2022/2023 Programmi anni precedenti
Titolo corso in inglese
DATA MANAGEMENT
Codice insegnamento
ET4015 (AF:331478 AR:179048)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
INF/01
Periodo
2° Periodo
Anno corso
3
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
Questo corso elettivo di 6 ECTS è insegnato nella fascia "affine/integrativa" nel percorso "Economics, markets and finance" erogato nel secondo periodo didattico. Il corso è un'introduzione alla gestione del "big data" attraverso database relazionali e strumenti di analisi/visualizzazione dei dati. L'obiettivo della disciplina "data management" è quello di estrarre efficacemente i dati grezzi, organizzarli in un database e, infine, manipolarli e analizzarli attraverso adeguati strumenti di manipolazione e visualizzazione dei dati. Questo corso ha una forte componente pratica che ha l'obiettivo di introdurre gli studenti alla gestione dei dati utilizzando python. Particolare attenzione sarà dedicata allo studio dei database relazionali e delle librerie python per l'analisi e la visualizzazione dei dati.
Al termine del corso, lo studente sarà in grado di gestire grandi moli di dati e analizzarle a fini predittivi usando strumenti di basi di dati e data visualization. L'obiettivo del corso sarà di fornire allo studente un quadro complessivo dell'attuale stato dell'arte sul tema e sui suoi possibili sviluppi. I risultati di apprendimento attesi si dividono in:

1. Conoscenza e comprensione:
Al termine del corso, lo studente sarà in grado di riconoscere le tecniche di data management più adatte ad affrontare specifiche problematiche.

2. Capacità di applicare conoscenza e comprensione:
Al termine del corso lo studente sarà in grado di applicare le tecniche di data management apprese (Python pandas e librerie di analisi e visualizzazione dei dati) per risolvere problemi tipici di analisi e gestione di grosse quantita` di dati.

3. Capacità di giudizio:
Al termine del corso lo studente sarà in grado di applicare le conoscenze acquisite durante il corso per:
- progettare database efficienti su grandi moli di dati.
- filtrare i dati estraendo l'informazione strettamente necessaria ad individuare relazioni utili di interesse.
- visualizzare i risultati dell'analisi tramite strumenti professionali di visualizzazione dei dati (Python pandas e Seaborn).
Nozioni di base di analisi matematica e calcolo delle probabilità.
Basi di dati:
- Introduzione alle basi di dati
- Algebra relazionale
- Diagrammi entità/relazioni
- Applicazione dei principi appresi in Python con la libreria Pandas

Analisi dei dati:
- Pulizia e preparazione dei dati
- Riassumere e visualizzare i dati
- Alcuni algoritmi per l'estrazione di informazioni
- Estrazione di informazioni dalle reti
- Database Systems: The Complete Book, Hector Garca-Molina, Jeffrey Ullman, and Jennifer Widom. Pearson Prentice Hall.
- Mathematical statistics and data analysis. John A. Rice. Cengage Learning.
- Python for Data Analysis. Wes McKinney. O'Reilly Media.
L'esame del corso consiste in esercizi bisettimanali con compiti sia teorici che pratici e in un esame. Le soluzioni degli esercizi devono essere consegnate in gruppi di massimo 4 studenti.
Lavagna e laboratori pratici.
Inglese
scritto
Programma definitivo.
Data ultima modifica programma: 08/11/2022