ANALISI DEI DATI

Anno accademico
2023/2024 Programmi anni precedenti
Titolo corso in inglese
DATA ANALYSIS
Codice insegnamento
CT0427 (AF:401993 AR:218232)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
SECS-S/01
Periodo
II Semestre
Anno corso
2
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento ricade tra le attività affini del corso di laurea in Informatica nell’ambito del curriculum `Data Science’ e ha lo scopo di fornire agli studenti strumenti di base dell’inferenza statistica e dell’analisi dei dati. L’obiettivo dell’insegnamento è sviluppare competenze per rispondere a quesiti di natura statistica che sorgono in ambito tecnologico, scientifico, biomedico, economico ed aziendale. Particolare attenzione viene dedicata all’integrazione della metodologia con strumenti computazionali attraverso l’utilizzo del linguaggio R. Il raggiungimento degli obiettivi formativi dell’insegnamento permette allo studente di ottenere le basi per l'apprendimento di strumenti più avanzati di data science.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:
1. (conoscenza e comprensione)
-- conoscere e comprendere i principali metodi inferenziali
2. (capacità di applicare conoscenza e comprensione)
-- descrivere e modellare fenomeni caratterizzati da variabilità e incertezza
-- utilizzare software statistico per la manipolazione, la rappresentazione e l'analisi di dati
3. (capacità di giudizio)
-- interpretare correttamente i risultati delle analisi prodotte da software statistici
Si assume che gli studenti abbiano raggiunto gli obiettivi formativi del corso di Probabilità e Statistica (www.unive.it/data/insegnamento/230177) anche senza avere necessariamente superato l’esame. In particolare, è importante che gli studenti abbiano una piena dimistichezza delle principali proprietà e operazioni relative alle variabili casuali discrete e continue.
Il programma del corso prevede la presentazione e la discussione dei seguenti argomenti:
1. Concetti di base
2. Stima puntuale
3. Stima intervallare
4. Verifica d'ipotesi
5. Dipendenza
I metodi saranno illustrati con dati simulati e reali utilizzando il linguaggio R (www.r-project.org).
- Baron M (2014). Probability and Statistics for Computer Scientistis. Second Edition. CRC Press. Parti selezionate dei capitoli 8-9-10-11
- Letture e materiali integrativi distribuiti durante il corso tramite la piattaforma Moodle
La verifica dell'apprendimento avviene tramite un esame scritto. L'esame è costituito da due parti. Ogni parte consiste di due esercizi. I quattro esercizi sono scelti in modo da misurare
1. le conoscenze della teoria degli argomenti del corso,
2. la capacità di applicare la teoria per risolvere problemi reali.

Il punteggio massimo per ogni esercizio è 8 punti. Il punteggio finale è dato dalla somma dei punteggi dei quattro esercizi. Per superare l'esame è necessario ottenere un punteggio sufficiente in ciascuna delle due parti, ovvero almeno 9 punti per ogni parte. Se la prima parte non risulta sufficiente, allora non verrà corretta la seconda parte dell'esame. Un punteggio complessivo che supera 30 punti corrisponde alla lode.

Durante l’esame è ammesso l'uso di un computer portatile e del formulario reso disponibile dal docente. Non sono ammessi libri, appunti o altri supporti elettronici.

E' prevista una prova intermedia dopo metà del corso. La prova intermedia corrisponde alla prima parte dell'esame (due esercizi). Se la prova intermedia è superata (con un punteggio di almeno 9 punti) allora la studentessa / lo studente potrà svolgere solo la seconda parte dell'esame durante il primo appello (**esclusivamente il primo appello**) e il punteggio finale sarà dato dalla somma del punteggio ottenuto nella prova intermedia e il punteggio ottenuto nella seconda parte dell'esame del primo appello.
Lezioni convenzionali di teoria accompagnate da esercitazioni e discussione di casi studio. Materiale didattico curato del docente verrà distribuito durante il corso tramite la piattaforma Moodle. Il software statistico utilizzato nel corso è R (www.r-project.org).
Italiano
scritto
Programma definitivo.
Data ultima modifica programma: 13/02/2023