DALMINE
Dati Generali
Periodo di attività
Syllabus
Obiettivi Formativi
Al termine del corso di Statistica lo studente ha le conoscenze di base del calcolo delle probabilità e dell’inferenza statistica, incluso la teoria della stima, la verifica delle ipotesi ed il modello di regressione.
In particolare sa usare la formula di Bayes, conosce le principali distribuzioni di probabilità continue e discrete. Sa calcolare gli intervalli di confidenza e sa eseguire i test per i più comuni modelli statistici nel caso
di dati che provengono dal campionamento casuale semplice. Sa fare inferenza sul modello di regressione lineare e su modelli non lineari. Sa usare R (o altro software statistico) per affrontare questi problemi.
Prerequisiti
Conoscenza dell'analisi matematica incluso il calcolo integrale, il calcolo differenziale e le serie.
Nozioni di calcolo matriciale e algebra e integrali multipli.
Metodi didattici
Lezioni frontali ed esercitazioni.
Laboratori di R (o altro software).
La frequenza è raccomandata.
Per l'esame è richiesto l’uso di R (o altro software).
Lo studente svolgerà un case study in gruppo, preparando una relazione che presenterà davanti alla classe al termine del ciclo di lezioni.
Verifica Apprendimento
-----------------
Modalità A
-----------------
Per chi può frequentare e prepararsi con continuità, tramite prove intermedie e svolgimento di un case study di gruppo.
I) Prove intermedie.
- una prova di autovalutazione in ambiente R
- due prove parziali informatizzate (una a novembre, l'altra al primo appello invernale) che richiedono l'uso di R.
L'accesso alla seconda prova parziale è consentito solo a chi ottiene un voto di almeno 15/30 nella prima prova in itinere.
L'insieme delle due prove intermedie è superato con una media di almeno 18/30.
Chi non raggiunge 15/30 nella prima prova parziale, può dare il completo nelle sessioni ordinarie invernali.
I pesi di ciascuna domanda all'interno di un prova sono inizialmente paritetici così come le 2 prove hanno lo stesso peso.
II) Case study sulla regressione. Svolgimento in gruppo di un case study sul tema della regressione
applicato a un data set fornito dai docenti.
Il paper che illustra il case study sviluppato e lo script R con i conti svolti vanno consegnati prima della presentazione di gruppo dello stesso (preferibilmente accompagnata da slides).
Maggiori dettagli saranno forniti a lezione.
III) Presentazione e discussione del case study. Presentazione di gruppo davanti alla classe e discussione su contenuti, risultati e metodologie utilizzate.
A ciascuno membro del gruppo a seguito della discussione orale del progetto svolto verrà fatta una domanda inerente i metodi usati nel case study.
Tutta la classe partecipa alla discussione di ciascun gruppo.
-----------------
Modalità B
-----------------
In appello ordinario con un'unica prova informatizzata ed un orale nello stesso appello.
La preparazione richiesta prevede la capacità sia di svolgere lo scritto con l'uso di R (o altro software) che l'orale. La prova orale verte sulla discussione dei metodi trattati nel corso e valuta la comprensione del
linguaggio, del formalismo e dei concetti a livello descrittivo ed interpretativo.
Contenuti
Richiami di insiemistica ed esperimenti causali.
Assiomi e interpretazione della probabilità.
Probabilità condizionata, indipendenza e probabilità totali.
Schemi di campionamento con rimessa e senza rimessa.
Teorema di Bayes.
Variabili casuali discrete in generale, valore atteso, varianza, momenti.
Distribuzioni discrete: bernoulliana, Binomiale, negativa binomiale, ipergeometrica, di Poisson, Geometrica.
Variabili continue in generale, media, varianza e momenti.
Cenni al problema dell'esistenza dei momenti.
Distribuzione uniforme continua,
La distribuzione normale: definizioni, proprietà, regole di calcolo, momenti, asimmetria e curtosi.
La distribuzione esponenziale negativa, processo di Poisson.
Distribuzione Gamma e legame con chi^2. Media e varianza del chi^2.
Teorema limite centrale per somma e media con esempi di binomiale.
Calcolo della varianza della somma di variabili indipendenti.
Proprietà di media campionaria e varianza campionaria.
Statistiche e distribuzioni campionarie: Chiquadro e t di Student"
Introduzione all'Inferenza.
Stima della media, varianza e percentuali.
Teoria generale: nondistorsione, consistenza, efficienza (cenni).
Legge dei grandi numeri.
Cenni su consistenza, efficienza.
Intervalli di confidenza sulla media, sia per varianza nota che ignota.
Determinazione della numerosità campionaria.
Intervalli di confidenza sulla varianza.
Verifica d’ipotesi:
Introduzione ai test, P-value.
Approccio decisionale: Rischi di 1° e 2° tipo.
Potenza di un test.
Test sulla media nota e ignota la varianza.
Nesso fra IC e test.
Test asintotici basati sulla normale.
Test sulla proporzione.
Test sulla varianza.
Test per differenza tra medie e per rapporto tra varianze.
Covarianza e correlazione.
Modello di regressione e minimi quadrati.
Scomposizione devianza ed R^2.
Test t e Intervalli di confidenza sui coefficienti.
Intervalli di confidenza sulla risposta e di previsione.
Modelli lineari generalizzati.
Cenni a modelli non lineari e per dati categoriali o dicotomici.
Modelli Lasso e Ridge.
Tecniche di model selection, cross-validazione e bootstrap.
Analisi dei residui e testing del modello.
Altre informazioni
Materiale didattico fornito dal docente attraverso la pagina E-Learning Moodle.