ANALISI DEI DATI

Anno accademico
2019/2020 Programmi anni precedenti
Titolo corso in inglese
DATA ANALYSIS
Codice insegnamento
CT0427 (AF:274923 AR:166185)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
SECS-S/01
Periodo
II Semestre
Anno corso
2
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento ricade tra le attività affini del corso di laurea in Informatica nell’ambito del curriculum `Data Science’ e ha lo scopo di fornire agli studenti strumenti di base dell’inferenza statistica e dell’analisi dei dati. L’obiettivo dell’insegnamento è sviluppare competenze per rispondere a quesiti di natura statistica che sorgono in ambito tecnologico, scientifico, biomedico, economico ed aziendale. Particolare attenzione viene dedicata all’integrazione della metodologia con strumenti computazionali attraverso l’utilizzo del linguaggio R. Il raggiungimento degli obiettivi formativi dell’insegnamento permette allo studente di ottenere le basi per un apprendimento di strumenti più avanzati di data science.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:
1. (conoscenza e comprensione)
-- conoscere e comprendere i principali metodi inferenziali e di analisi dei dati
2. (capacità di applicare conoscenza e comprensione)
-- descrivere e modellare fenomeni caratterizzati da variabilità e incertezza
-- sviluppare e stimare un modello statistico per effettuare previsioni
-- utilizzare software statistico per la manipolazione, la rappresentazione e l'analisi di dati
3. (capacità di giudizio)
-- interpretare correttamente i risultati di analisi prodotte da software statistici
Si assume che gli studenti abbiano raggiunto gli obiettivi formativi del corso di Probabilità e Statistica (www.unive.it/data/insegnamento/230177) anche senza avere necessariamente superato l’esame. In particolare, è importante che gli studenti abbiano una piena dimistichezza delle principali proprietà e operazioni relative alle variabili casuali discrete e continue.
Il programma del corso prevede la presentazione e la discussione dei seguenti argomenti:
1. Statistica descrittiva
2. Sintesi grafiche dei dati
3. Stima puntuale
4. Stima intervallare
5. Verifica d'ipotesi
6. Il metodo Bootstrap
I metodi saranno illustrati con dati simulati e reali utilizzando il linguaggio R (www.r-project.org).
- Baron M (2014). Probability and Statistics for Computer Scientistis. Second Edition. CRC Press. Capitoli 8-9-10
- Letture e materiali integrativi distribuiti durante il corso tramite la piattaforma Moodle
La verifica dell'apprendimento avviene tramite una prova scritta erogata tramite la piattaforma Moodle. La prova presenta otto quesiti scelti in modo da misurare
1. le conoscenze della teoria degli argomenti del corso,
2. la capacità di applicare la teoria per risolvere problemi reali.
Il punteggio massimo per ogni quesito è 4 punti. Il punteggio finale è dato dalla somma dei punteggi dei quattro esercizi. Un punteggio complessivo che supera 30 punti corrisponde alla lode. Durante l’esame scritto *non* è ammesso l’uso di libri, appunti o supporti elettronici.
Lezioni convenzionali di teoria accompagnate da esercitazioni e discussione di casi studio. Materiale didattico curato del docente verrà distribuito durante il corso tramite la piattaforma Moodle. Il software statistico utilizzato nel corso è R (www.r-project.org).
Italiano
scritto
Programma definitivo.
Data ultima modifica programma: 24/05/2020