DATA ANALYSIS WITH STATISTICAL PROGRAMMING

Anno accademico
2020/2021 Programmi anni precedenti
Titolo corso in inglese
DATA ANALYSIS WITH STATISTICAL PROGRAMMING
Codice insegnamento
PHD154 (AF:342252 AR:182045)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Corso di Dottorato (D.M.45)
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
1
Sede
VENEZIA
L’insegnamento ricade tra le attività educative del corso di dottorato che consentono allo studente di acquisire strumenti per l’analisi di dati mediante tecniche statistiche. L’obiettivo dell’insegnamento è quello di fornire le basi per l'utilizzo del software R per l'applicazione di metodi statistici di particolare interesse per le scienze ambientali. Varrà data particolare attenzione alla programmazione del codice corrispondente.

Il corso è parte di un percorso statistico composto di tre corsi che è disponibile per tutti gli studenti del dipartimento. Il percorso prevede un corso introduttivo (PHD154 Data Analysis with Statistical Programming) che precede due corsi più avanzati e non sequenziali: PHD076 Statistical Methods for Climate Change Analysis e PHD124 Applied Time Serie. Gli studenti interessati a ottenere una solida preparazione statistica sono incoraggiati a seguire tutti i corsi e a discutere con i docenti del corso nel dottorato cui afferiscono come meglio gestire il percorso formativo.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:

1. Conoscenza e comprensione
1.1 Conoscere i principali metodi statistici per l'analisi di dati, con particolare riferimento a quelli ambientali.

2. Capacità di applicare conoscenza e comprensione
2.1 Saper applicare i metodi statistici.
2.2 Saper utilizzare in modo autonomo l'ambiente software R per analizzare i dati.
2.3 Saper utilizzare il linguaggio di programmazione R per modificare programmi già disponibili o codificarne di nuovi.

3. Capacità di giudizio
3.1 Saper individuare il metodo statistico più idoneo al problema di interesse.

4. Abilità comunicative
4.1 Saper comunicare chiaramente, correttamente ed efficacemente i risultati dell’analisi statistica ai vari stakeholder, sia in forma scritta che parlata.
4.2 Sapere interagire con il docente e gli altri studenti durante le lezioni teoriche e le applicazioni di volta in volta considerate.

5. Capacità di apprendimento
5.1 Saper prendere appunti durante le lezioni per integrare e chiarire con essi i contenuti del materiale didattico.
5.2 Saper valutare i propri progressi nell’apprendimento della materia rispondendo a domande aperte poste dal docente e risolvendo esercizi.
Conoscenza dei concetti base di statistica, matematica, programmazione.
Basi di programmazione in R. Espressioni logiche. Vettori, matrici, data frame, liste. Caricare, salvare, modificare i dati. Caricare dati scaricati online. Esecuzione condizionata. Cicli for, while, repeat. Come velocizzare il codice R. Pacchetti aggiuntivi.

Statistica descrittiva e inferenziale. Test di ipotesi parametrici e nonparametrici. Test sui ranghi.

Analisi di dati categoriali.

Rappresentazioni grafiche.

Analisi della varianza. ANOVA a una via, parametrica e non parametrica. Analisi post-hoc e confronti multipli. ANOVA a due vie.

Correlazione e concordanza.

Modelli di regressione. Stima e test di ipotesi. Bontà di adattamento.

Casi studio.
Libri open source su R
Articoli scientifici
Slide delle lezioni fornite dal docente
Scrittura di un paper secondo il template fornito dal docente.
Insegnamento organizzato in:
a) lezioni sui concetti teorici principali e la descrizione dei vari metodi
b) esercitazioni in cui si mettono in pratica i concetti teorici, scrivendo codice, analizzando dati, interpretando e comunicando i risultati.
Inglese
Nessuna.
scritto
Programma definitivo.
Data ultima modifica programma: 21/04/2020