COMPUTATIONAL STATISTICS AND SIMULATION

Anno accademico
2020/2021 Programmi anni precedenti
Titolo corso in inglese
COMPUTATIONAL STATISTICS AND SIMULATION
Codice insegnamento
CM0527 (AF:332764 AR:175902)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento ricade tra le attività educative del corso di laurea magistrale in Computer Science che consentono allo studente di acquisire strumenti avanzati per l’analisi di dati mediante tecniche statistiche. L’obiettivo dell’insegnamento è quello di fornire le basi per l'utilizzo del software R per l'applicazione dei principali metodi statistici computazionali e di simulazione.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:

1. Conoscenza e comprensione
1.1 Conoscere l’approccio non parametrico all’inferenza statistica.
1.2 Conoscere i principali metodi statistici per il workload modeling e la computer systems performance evaluation.
1.3 Conoscere i principali metodi statistici per l'analisi di scalabilità di software e hardware.
1.4 Conoscere le copule per la simulazione di distribuzioni ad alta dimensionalità e con complesse strutture di dipendenza.
1.5 Conoscere le basi per il controllo statistico di qualità di beni tangibili (es. produzione di semiconduttori), intangibili (es. software process improvement e software failure process) e servizi.

2. Capacità di applicare conoscenza e comprensione
2.1 Saper applicare i metodi statistici non parametrici.
2.2 Saper applicare i principali metodi statistici per il workload modeling e la computer systems performance evaluation.
2.3 Saper applicare le copule per simulare distribuzioni multivariate.
2.4 Saper progettare e applicare le carte di controllo qualità negli ambiti di maggior interesse dell'informatica.
2.5 Saper utilizzare in modo autonomo l'ambiente software R per analizzare i dati.

3. Capacità di giudizio
3.1 Saper individuare il metodo statistico non parametrico più idoneo al problema di interesse.
3.2 Saper individuare il metodo statistico più idoneo per il workload modeling e la computer systems performance evaluation.
3.3 Saper individuare e parametrizzare la copula più adeguata a simulare la distribuzione multivariata di interesse.
3.4 Saper progettare la carta di controllo più idonea al problema di interesse.

4. Abilità comunicative
4.1 Saper comunicare chiaramente, correttamente ed efficacemente i risultati dell’analisi statistica ai vari stakeholder, sia in forma scritta che parlata.
4.2 Sapere interagire con il docente e gli altri studenti durante le lezioni teoriche e le applicazioni di volta in volta considerate.

5. Capacità di apprendimento
5.1 Saper prendere appunti durante le lezioni per integrare e chiarire con essi i contenuti del materiale didattico.
5.2 Saper valutare i propri progressi nell’apprendimento della materia rispondendo a domande aperte poste dal docente e risolvendo esercizi.
Conoscenza dei concetti base di statistica descrittiva, calcolo delle probabilità, inferenza statistica parametrica, programmazione.
1) Introduzione: Statistica computazionale. Simulazione in statistica. Test statistici parametrici e non parametrici.

2) Confronto di tendenze centrali. Confronto di variabilità. Confronto congiunto di tendenza centrale e variabilità. Confronto tra distribuzioni. Test di correlazione e concordanza.

3) Qualità 4.0: Controllo statistico di qualità nell'Industria 4.0. Carte tipo Shewhart, CUSUM, EWMA per prodotti e servizi. Calcolo di LCL, UCL, ARL.

4) Applicazione delle carte di controllo alla produzione di semiconduttori. Gestione del Software Process Improvement attraverso il controllo sttaistico di processo. Monitoraggio del software failure process.

5) Modellazione del workload per la valutazione della performance di un computer. Simulazione del workload di un supercomputer. Valutazione del workload usando un modello stocastico di un supercomputer basato sulla recursione modificata di Kiefer–Wolfowitz. Workload import/export usando lo Standard Workload Format. Analisi statistica di datasets da supercomputer log.

6) Metodi statistici per l'analisi di scalabilità di software e hardware. Applicazione alle misure di benchmark di un software raytracer. Analisi di scalabilità di un benchmark SPEC.

7) Simulazione di distribuzioni multivariate con complesse strutture di dipendenza usando copule ellittiche e archimedee.

8) Bootstrap: stima della varianza, test e intervalli di confidenza.
Materiale didattico open source su R
Articoli scientifici
Appunti forniti dal docente
La verifica dell'apprendimento avviene attraverso una prova scritta. La prova scritta contiene domande con lo scopo di accertare le abilità acquisite nell’analizzare dati di interesse per l'informatica, usando gli strumenti della statistica computazionale, includendo i metodi statistici non parametrici, la simulazione statistica, le carte di controllo qualità. Si valuterà sia la capacità di scegliere il metodo più adatto, sia quella di applicarlo correttamente e di interpretarne i risultati in maniera corretta e chiara. Nella parte finale del corso si svolgerà almeno una prova di esame simulata.
Insegnamento organizzato in:
a) lezioni sui concetti teorici principali e la descrizione dei vari metodi
b) esercitazioni in cui si mettono in pratica i concetti teorici, analizzando dati, interpretando e comunicando i risultati.
Inglese
Nessuna.
scritto
Programma definitivo.
Data ultima modifica programma: 08/08/2020