DATA ANALYSIS WITH STATISTICAL PROGRAMMING

Anno accademico
2022/2023 Programmi anni precedenti
Titolo corso in inglese
DATA ANALYSIS WITH STATISTICAL PROGRAMMING
Codice insegnamento
PHD154 (AF:401898 AR:218059)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Corso di Dottorato (D.M.45)
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento ricade tra le attività educative del corso di dottorato che consentono allo studente di acquisire strumenti per l’analisi di dati mediante tecniche statistiche. L’obiettivo dell’insegnamento è quello di fornire le basi per l'utilizzo del software R per l'applicazione di metodi statistici di particolare interesse per le scienze ambientali. Varrà data particolare attenzione alla programmazione del codice corrispondente.

Il corso è parte di un percorso statistico composto di tre corsi che è disponibile per tutti gli studenti del dipartimento. Il percorso prevede un corso introduttivo (PHD154 Data Analysis with Statistical Programming) che precede due corsi più avanzati e non sequenziali: PHD140, Statistics e PHD124 Applied Time Series. Gli studenti interessati a ottenere una solida preparazione statistica sono incoraggiati a seguire tutti i corsi e a discutere con i docenti del corso nel dottorato cui afferiscono come meglio gestire il percorso formativo.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:

1. Conoscenza e comprensione
1.1 Conoscere i principali metodi statistici per l'analisi di dati, con particolare riferimento a quelli ambientali.

2. Capacità di applicare conoscenza e comprensione
2.1 Saper applicare i metodi statistici.
2.2 Saper utilizzare in modo autonomo l'ambiente software R per analizzare i dati.
2.3 Saper utilizzare il linguaggio di programmazione R per modificare programmi già disponibili o codificarne di nuovi.

3. Capacità di giudizio
3.1 Saper individuare il metodo statistico più idoneo al problema di interesse.

4. Abilità comunicative
4.1 Saper comunicare chiaramente, correttamente ed efficacemente i risultati dell’analisi statistica ai vari stakeholder, sia in forma scritta che parlata.
4.2 Sapere interagire con il docente e gli altri studenti durante le lezioni teoriche e le applicazioni di volta in volta considerate.

5. Capacità di apprendimento
5.1 Saper prendere appunti durante le lezioni per integrare e chiarire con essi i contenuti del materiale didattico.
5.2 Saper valutare i propri progressi nell’apprendimento della materia rispondendo a domande aperte poste dal docente e risolvendo esercizi.
Conoscenza dei concetti base di statistica, matematica, programmazione.
Basi di programmazione in R. Espressioni logiche. Vettori, matrici, data frame, liste. Caricare, salvare, modificare i dati. Caricare dati scaricati online. Esecuzione condizionata. Cicli for, while, repeat. Come velocizzare il codice R. Pacchetti aggiuntivi.

Statistica descrittiva e inferenziale. Test di ipotesi parametrici e nonparametrici. Test sui ranghi.

Analisi di dati categoriali.

Rappresentazioni grafiche.

Analisi della varianza. ANOVA a una via, parametrica e non parametrica. Analisi post-hoc e confronti multipli. ANOVA a due vie.

Correlazione e concordanza.

Modelli di regressione. Stima e test di ipotesi. Bontà di adattamento.

Casi studio.
Libri open source su R
Articoli scientifici
Slide delle lezioni fornite dal docente
Scrittura di un paper secondo il template fornito dal docente, in cui discutere l'applicazione dei metodi studiati durante il corso a un problema nel campo delle scienze ambientali.
Insegnamento organizzato in:
a) lezioni sui concetti teorici principali e la descrizione dei vari metodi
b) esercitazioni in cui si mettono in pratica i concetti teorici, scrivendo codice, analizzando dati, interpretando e comunicando i risultati.
Inglese
Nessuna.
scritto
Programma definitivo.
Data ultima modifica programma: 08/04/2022