LAB OF INFORMATION SYSTEMS AND ANALYTICS

Anno accademico
2024/2025 Programmi anni precedenti
Titolo corso in inglese
LAB OF INFORMATION SYSTEMS AND ANALYTICS
Codice insegnamento
ET7008 (AF:463487 AR:258201)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
INF/01
Periodo
4° Periodo
Anno corso
2
Sede
RONCADE
Spazio Moodle
Link allo spazio del corso
Uno dei principali ruoli di un Digital Manager è sfruttare le risorse disponibili per gestire progetti di digitalizzazione e implementare soluzioni digitali nel campo della tecnologia dell'informazione. In particolare, gli studenti dovrebbero essere in grado di sfruttare i moderni approcci di intelligenza artificiale per estrarre informazioni significative a partire da dati grezzi di vario genere.

Tali competenze richiedono una solida conoscenza teorica e pratica dell'analisi dei dati.

Questo corso ha l'obiettivo di insegnare agli studenti metodi e tecnologie per un'analisi dei dati efficace, discutendo le tecniche fondamentali per l'analisi predittiva e descrittiva dei dati. Durante le lezioni, saranno presentati vari strumenti e tecniche, sia dal punto di vista teorico che pratico, in modo che gli studenti possano confrontare tali strumenti ed estrarre conoscenza dai dataset presentati.

I risultati dell'analisi menzionata sono sfruttati come punto di partenza per ulteriori decisioni e considerazioni.
Alla fine del corso, gli studenti dovrebbero essere in grado di applicare le tecniche appropriate di apprendimento e descrittive ai dati e di gestire gli strumenti presentati durante le lezioni. Gli studenti dovrebbero anche essere in grado di produrre un rapporto di analisi comparativa, inclusa la rappresentazione dei dati.

Gli studenti raggiungeranno i seguenti risultati di apprendimento, suddivisi in tre aree principali:

1. Conoscenza e comprensione:
- Comprendere le basi teoriche dei principali algoritmi presentati durante le lezioni;
- Comprendere i principi e le differenze degli algoritmi di apprendimento non supervisionato;
- Comprendere i principi e le differenze degli algoritmi di apprendimento supervisionato.

2. Applicazione delle conoscenze e comprensione in situazioni pratiche:
- Essere in grado di applicare tecniche di analisi supervisionate e non supervisionate appropriate ai dati;
- Essere in grado di utilizzare gli strumenti software per l'analisi dei dati utilizzati durante le lezioni (ad esempio, scikit-learn);
- Essere in grado di confrontare e interpretare correttamente i diversi risultati di analisi ottenuti da diversi algoritmi.

3. Comunicazione:
- Redigere un rapporto di analisi comparativa comprensivo tra i diversi metodi di analisi dei dati;
- Presentare i risultati con grafici e diagrammi appropriati.
L'unico requisito formale è che gli studenti abbiano sostenuto con profitto l'esame di "Introduction to Coding and Data Management".
1. Introduzione alla Data Science
- Approcci basati sui dati e Big Data
- Cos'è il Machine Learning e il Data Mining: concetti di approcci supervisionati e non supervisionati
- Tipologie di dati
- Gestione di un progetto di Data Science

2. Clustering:
- Riduzione della dimensionalità
- Valutazione della qualità del clustering

3. Apprendimento Supervisionato
- Addestramento, validazione e ottimizzazione dei modelli; Feature Engineering
- Classificazione; Regressione; Alberi decisionali

4. Ricerca di Similarità nei Testi
- Rappresentazione del testo; Tokenizzazione, Stemming, Lemmatizzazione; Spazio vettoriale; Misure di similarità
Provost, F., & Fawcett, T. (2013). Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. O'Reilly Media.
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2nd ed.). O'Reilly Media.
I risultati di apprendimento sono verificati tramite un progetto/rapporto e con un esame scritto.

L'esame scritto richiederà agli studenti di rispondere a domande aperte sui contenuti del corso.

Il progetto richiede l'applicazione di metodi di analisi dei dati a un dataset di complessità limitata e comporta la conduzione di un'analisi comparativa di diversi strumenti applicati a un dataset o problema specifico. Lo studente deve scegliere e motivare la soluzione più appropriata e consegnare un rapporto che discuta un'analisi comparativa dei metodi scelti.
scritto
L’esame consiste in una prova scritta e nello sviluppo di un progetto. La prova scritta contribuisce al voto finale per un massimo di 28 punti, mentre il progetto può contribuire fino a un massimo di 5 punti. Gli studenti che raggiungeranno un punteggio superiore a 31 saranno considerati meritevoli della lode.
Il corso prevede sia lezioni teoriche, volte a introdurre i concetti fondamentali e i modelli di riferimento, sia attività pratiche, durante le quali gli studenti applicheranno quanto appreso attraverso esercitazioni guidate, analisi di dati reali e sviluppo di progetti in Python.
Inglese
Programma definitivo.
Data ultima modifica programma: 24/03/2025