DATI E CONOSCENZA

Anno accademico
2022/2023 Programmi anni precedenti
Titolo corso in inglese
FROM DATA TO KNOWLEDGE
Codice insegnamento
NS001D (AF:401850 AR:218020)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Minor
Settore scientifico disciplinare
SECS-S/01
Periodo
Estivo
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento è una delle attività formative del Minor in Computer and Data Science e consente allo studente di acquisire la conoscenza e la comprensione dei principali strumenti in uso per l'analisi e l'estrazione di informazione dai dati.

L'obiettivo dell’insegnamento è fornire conoscenze di statistica descrittiva, di calcolo delle probabilità e di alcuni argomenti di base dell'inferenza, nonché abilità nell’utilizzo di programmi specifici per l'analisi dei dati e la comunicazione delle informazioni ricavate.

Alla fine del corso, lo studente sarà in grado di individuare ed applicare i modelli e le metodologie di analisi più adatti al contesto di interesse, con l'obiettivo di guidare le scelte più adeguate; inoltre saprà interpretare e comunicare i risultati ottenuti.
1. Conoscenza e comprensione:
- conoscere i principali strumenti per la rappresentazione grafica e la sintesi delle caratteristiche fondamentali di un insieme di dati,
- conoscere i concetti di base del calcolo delle probabilità e le principali distribuzioni di probabilità,
- conoscere alcune metodologie di base dell'inferenza statistica.

2. Capacità di applicare conoscenza e comprensione:
- saper utilizzare programmi specifici per l'analisi dei dati e per la comunicazione dei risultati,
- saper utilizzare la terminologia adeguata in tutti i processi di applicazione e comunicazione delle conoscenze acquisite.

3. Capacità di giudizio:
- saper contestualizzare le conoscenze acquisite, individuando i modelli e i metodi più adeguati alla situazione di interesse.

4. Abilità comunicative:
- saper presentare in modo chiaro ed esaustivo i risultati ottenuti da un'analisi statistica,
- sapere interagire con i pari e con il docente, in modo critico e rispettoso, in presenza e sul forum dell’aula virtuale.

5. Capacità di apprendimento:
- saper utilizzare ed integrare informazioni provenienti da appunti, libri, slide e sessioni pratiche di laboratorio,
- saper consultare criticamente i testi di riferimento e altri testi di introduzione all'analisi dei dati.
Nozioni di matematica a livello di scuola superiore e abilità di base nell'uso del computer.
Il corso fornisce un'introduzione alla statistica, attraverso esempi pratici e casi di studio. Le lezioni teoriche sono sempre motivate da esempi e applicazioni a problemi pratici di interesse in diversi ambiti.

La durata delle lezioni è di 3 settimane.
1-2. La prima e seconda settimana del corso hanno lo scopo di introdurre agli studenti le tecniche più utilizzate per la sintesi e la rappresentazione grafica di un insieme di dati, oltre che il programma R (https://cloud.r-project.org ) e l'interfaccia di RStudio (https://www.rstudio.com ) per la sintesi, la rappresentazione e l'analisi dei dati e la reportistica finale.
3. Nella terza settimana, vengono presentati e discussi in dettaglio alcuni casi studio in maniera molto approfondita.

Nello specifico, la parte statistica è composta da:
- elementi di statistica descrittiva: popolazione e campione; tipi di variabili; rappresentazioni grafiche e indici sintetici; relazioni fra variabili;
- cenni di incertezza stocastica: errore statistico e come si collega all'inferenza statistica;
- introduzione ai metodi di regressione.
- Rafael A. Irizarry (2019). "Introduction to Data Science: Data Analysis and Prediction Algorithms with R". https://rafalab.github.io/dsbook
- Mine Cetinkaya-Rundel, Johanna Hardin & OpenIntro (2023). "Introduction to Modern Statistics". https://openintro-ims.netlify.app/index.html
- Rebekah Robinson & Homer White (2016). "Elementary Statistics with R". http://homerhanumat.github.io/elemStats
- Hadley Wickham & Garrett Grolemund (2017). "R for Data Science". https://r4ds.had.co.nz/index.html

Letture integrative:
- Altro materiale indicato dal docente durante il corso.
L'esame prevede la redazione e la presentazione di report statistico redatto in R su un data set.

Saranno oggetto di valutazione:
- le conoscenze della teoria degli argomenti del corso,
- la capacità di applicare la teoria per risolvere problemi reali.
- Lezioni frontali ed esercitazioni in classe con l'uso del programma R.
- Utilizzo della piattaforma Moodle per la verifica dell'apprendimento in itinere e per la condivisione del materiale del corso.
- Uso di programmi open source per l'analisi e la presentazione dei risultati.
Italiano
Italiano
scritto
Programma definitivo.
Data ultima modifica programma: 16/03/2023