DATI E CONOSCENZA

Anno accademico
2021/2022 Programmi anni precedenti
Titolo corso in inglese
FROM DATA TO KNOWLEDGE
Codice insegnamento
NS001D (AF:361775 AR:191610)
Lingua di insegnamento
Italiano
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Minor
Settore scientifico disciplinare
SECS-S/01
Periodo
Estivo
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento è una delle attività formative del Minor in Computer and Data Science e consente allo studente di acquisire la conoscenza e la comprensione dei principali strumenti in uso per l'analisi e l'estrazione di informazione dai dati.
L'obiettivo dell’insegnamento è fornire conoscenze di statistica descrittiva, di calcolo delle probabilità e di alcuni argomenti di base dell'inferenza, nonché abilità nell’utilizzo di programmi specifici per l'analisi dei dati e la comunicazione delle informazioni ricavate.
Alla fine del corso, lo studente sarà in grado di individuare ed applicare i modelli e le metodologie di analisi più adatti al contesto di interesse, con l'obiettivo di guidare le scelte più adeguate; inoltre saprà interpretare e comunicare i risultati ottenuti.

1. Conoscenza e comprensione:
-conoscere i principali strumenti per la rappresentazione grafica e la sintesi delle caratteristiche fondamentali di un insieme di dati
-conoscere i concetti di base del calcolo delle probabilità e le principali distribuzioni di probabilità
-conoscere alcune metodologie di base dell'inferenza statistica

2. Capacità di applicare conoscenza e comprensione:
-saper utilizzare programmi specifici per l'analisi dei dati e per la comunicazione dei risultati
-saper utilizzare la terminologia adeguata in tutti i processi di applicazione e comunicazione delle conoscenze acquisite

3. Capacità di giudizio:
-saper contestualizzare le conoscenze acquisite, individuando i modelli e i metodi più adeguati alla situazione di interesse

4. Abilità comunicative:
-saper presentare in modo chiaro ed esaustivo i risultati ottenuti da un'analisi statistica
-sapere interagire con i pari e con il docente, in modo critico e rispettoso, in presenza e sul forum dell’aula virtuale

5. Capacità di apprendimento:
-saper utilizzare ed integrare informazioni provenienti da appunti, libri, slide e sessioni pratiche di laboratorio
-saper consultare criticamente i testi di riferimento e altri testi di introduzione all'analisi dei dati.
Nozioni di matematica a livello di scuola superiore e abilità di base nell'uso del computer.
Il corso fornisce un'introduzione alla statistica, attraverso esempi pratici e casi di studio. Le prime due settimane del corso hanno lo scopo di introdurre agli studenti le tecniche più utilizzate per la sintesi e la rappresentazione grafica di un insieme di dati, oltre che il programma R (https://cloud.r-project.org/ ) e l'interfaccia di RStudio (https://www.rstudio.com/ ) per la sintesi, la rappresentazione e l'analisi dei dati e la reportistica finale. Nell'ultima settimana, vengono presentati e discussi in dettaglio alcuni casi studio in maniera molto approfondita. Le lezioni teoriche sono sempre motivate da esempi e applicazioni a problemi pratici di interesse in diversi ambiti.

Nello specifico, la parte statistica è composta da
- elementi di statistica descrittiva: popolazione e campione; tipi di variabili; rappresentazioni grafiche e indici sintetici; relazioni fra variabili
- cenni di incertezza stocastica: errore statistico e come si collega all'inferenza statistica
- introduzione ai metodi di regressione.

Rafael A. Irizarry, Introduction to Data Science - Data Analysis and Prediction Algorithms with R - https://rafalab.github.io/dsbook/
Mine Çetinkaya-Rundel. Introduction to Modern Statistics - https://openintro-ims.netlify.app/index.html
Robinson, R. e White, H. (2016) Elementary Statistics with R - http://homerhanumat.github.io/elemStats/
Grolemund, Garrett, & Wickham, Hadley. (2017). "R for Data Science". Available at https://r4ds.had.co.nz/index.html

Letture integrative:
Altro materiale indicato dal docente durante il corso.
L'esame prevede la redazione e la presentazione di report statistico redatto in R su un data set, in modo da misurare:
. le conoscenze della teoria degli argomenti del corso,
. la capacità di applicare la teoria per risolvere problemi reali.

scritto
Lezioni frontali ed esercitazioni in classe con l'uso del programma R. Utilizzo della piattaforma Moodle per la verifica dell'apprendimento in itinere e per la condivisione del materiale del corso. Uso di programmi open source per l'analisi e la presentazione dei risultati.
Programma definitivo.
Data ultima modifica programma: 03/04/2022