DATA MANAGEMENT

Anno accademico
2024/2025 Programmi anni precedenti
Titolo corso in inglese
DATA MANAGEMENT
Codice insegnamento
ET4015 (AF:382977 AR:208484)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
INF/01
Periodo
2° Periodo
Anno corso
3
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
Questo corso elettivo di 6 ECTS è insegnato nella fascia "affine/integrativa" nel percorso "Economics, markets and finance" erogato nel secondo periodo didattico. Il corso è un'introduzione alla gestione del "big data" attraverso database relazionali e strumenti di analisi/visualizzazione dei dati. L'obiettivo della disciplina "data management" è quello di estrarre efficacemente i dati grezzi, organizzarli in un database e, infine, manipolarli e analizzarli attraverso adeguati strumenti di manipolazione e visualizzazione dei dati. Questo corso ha una forte componente pratica che ha l'obiettivo di introdurre gli studenti alla gestione dei dati utilizzando python. Particolare attenzione sarà dedicata allo studio dei database relazionali e delle librerie python per l'analisi e la visualizzazione dei dati.
Al termine del corso, lo studente sarà in grado di gestire grandi moli di dati e analizzarle a fini predittivi usando strumenti di basi di dati e data visualization. L'obiettivo del corso sarà di fornire allo studente un quadro complessivo dell'attuale stato dell'arte sul tema e sui suoi possibili sviluppi. I risultati di apprendimento attesi si dividono in:

1. Conoscenza e comprensione:
Al termine del corso, lo studente sarà in grado di riconoscere le tecniche di data management più adatte ad affrontare specifiche problematiche.

2. Capacità di applicare conoscenza e comprensione:
Al termine del corso lo studente sarà in grado di applicare le tecniche di data management apprese (Python pandas e librerie di analisi e visualizzazione dei dati) per risolvere problemi tipici di analisi e gestione di grosse quantita` di dati.

3. Capacità di giudizio:
Al termine del corso lo studente sarà in grado di applicare le conoscenze acquisite durante il corso per:
- progettare database efficienti su grandi moli di dati.
- filtrare i dati estraendo l'informazione strettamente necessaria ad individuare relazioni utili di interesse.
- visualizzare i risultati dell'analisi tramite strumenti professionali di visualizzazione dei dati (Python pandas e Seaborn).
Nozioni di base di analisi matematica e calcolo delle probabilità.
Basi di dati:
- Introduzione alle basi di dati
- Algebra relazionale
- Diagrammi entità/relazioni
- Applicazione dei principi appresi in Python con la libreria Pandas

Analisi dei dati:
- Pulizia e preparazione dei dati
- Riassumere e visualizzare i dati
- Alcuni algoritmi per l'estrazione di informazioni
- Estrazione di informazioni dalle reti
- Database Systems: The Complete Book, Hector Garca-Molina, Jeffrey Ullman, and Jennifer Widom. Pearson Prentice Hall.
- Mathematical statistics and data analysis. John A. Rice. Cengage Learning.
- Python for Data Analysis. Wes McKinney. O'Reilly Media.
L'esame del corso consiste in un esame scritto di 120 minuti. L'esame consisterà in due parti. In una prima parte (30 minuti), si risolveranno esercizi di programmazione al computer. Nella seconda parte (90 minuti) risponderai a domande riguardanti il materiale teorico del corso.
Lavagna e laboratori pratici.
Inglese
scritto
Il programma è ancora provvisorio e potrà subire modifiche.
Data ultima modifica programma: 30/10/2024