DALMINE
Dati Generali
Periodo di attività
Syllabus
Obiettivi Formativi
Al termine del modulo di Statistica lo studente ha le conoscenze di base del calcolo delle probabilità e dell’inferenza statistica, incluso la teoria della stima, la verifica delle ipotesi ed il modello di regressione. In particolare sa usare la formula di Bayes, conosce le principali distribuzioni di probabilità continue e discrete. Sa calcolare gli intervalli di confidenza e sa eseguire i test per i più comuni modelli statistici nel caso di dati che provengono dal campionamento casuale semplice. Sa fare inferenza sulla retta di regressione. Sa usare Excel per svolgere i conti relativi ai punti di cui sopra.
Prerequisiti
E' necessario conoscere l'analisi matematica incluso il calcolo integrale, il calcolo differenziale e le serie.
Sono molto utili anche nozioni di calcolo matriciale e algebra e integrali multipli.
Perciò e fortemente consigliato fare gli esami di Analisi Matematica I e Geometria e algebra lineare prima di Statistica.
Metodi didattici
Lezioni frontali ed esercitazioni in presenza. Laboratori con Excel. La frequenza è indispensabile per le prove intermedie. Per l'esame è richiesto l’uso di Excel. Lo studente svolgerà un case study in gruppo, preparando una relazione che presenterà davanti alla classe.
Verifica Apprendimento
----------------- Modalità A -----------------
Per chi può frequentare e prepararsi con continuità, tramite prove intermedie e un case study di gruppo.
I) Prove intermedie.
- Una prova di autovalutazione da svolgere in autonomia con l'ausilio di Excel.
- Due prove intermedie informatizzate che richiedono l'uso di Excel.
L'insieme delle prove intermedie è superato con una media di almeno 18/30. I pesi di ciascuna domanda all'interno di un prova sono inizialmente paritetici così come le diverse prove hanno lo stesso peso.
È possibile recuperare la prova valutata col punteggio più basso durante l'appello ordinario;
II) Case study sulla regressione.
Svolgimento in gruppo e presentazione di un case study sul tema della regressione lineare applicato a un data set fornito dai docenti.
Il paper che illustra il case study sviluppato e il foglio Excel con i conti svolti va consegnato prima dell’appello in data fissata durate il semestre. Maggiori dettagli saranno forniti entro dicembre nelle pagine dell'e-learning.
III) Presentazione e discussione in presenza del case study.
Presentazione di gruppo davanti alla classe e discussione su contenuti, risultati e metodologie utilizzate.
Ciascuno membro del gruppo deve rispondere anche ad una domanda teorica, valida per l'orale, inerente i metodi usati nel case study. Nel caso di insufficienza alla domanda teorica, lo studente deve sostenere la prova orale, vedi punto IV). Tutti gli studenti partecipano alla discussione di ciascun gruppo.
IV) Prova orale.
Chi non presenta il lavoro di gruppo di cui alla modalità III) sostiene una prova orale finale che verte sui contenuti teorici e sul paper sviluppato in gruppo.
V) Gruppi. Per svolgere il case study di cui sopra, gli studenti si aggregano in gruppi. Ogni gruppo ha a disposizione un proprio repository ed un proprio forum per il lavoro a distanza. Il case study viene caricato da un rappresentante designato dal gruppo seguendo le modalità che saranno indicate durante il corso.
VI) Voto finale.
Il voto finale è ottenuto come media pesata tra il voto delle prove intermedie di cui al punto I), entrambe sufficienti, e quello della prova orale di cui ai punti III) o IV).
I pesi sono i seguenti:
- 40% per le quattro prove intermedie - 60% per la prova orale
----------------- Modalità B -----------------
In appello ordinario con un'unica prova informatizzata ed un orale nello stesso appello. La preparazione richiesta prevede la capacità sia di svolgere i conti dello scritto con l'uso di Excel che trattare gli argomenti teorici dell'orale. La prova orale verte sulla discussione dei metodi trattati nel corso e valuta la comprensione del linguaggio, del formalismo e dei concetti a livello descrittivo ed interpretativo. Sulla pagina dell’elearning è disponibile a titolo di esempio un elenco non esaustivo di domande possibili.
Contenuti
Richiami di insiemistica ed esperimenti causali. Assiomi e interpretazione della probabilità. Probabilità condizionata, indipendenza e probabilità totali.
Schemi di campionamento con rimessa e senza rimessa. Teorema di Bayes. Variabili casuali discrete in generale, valore atteso, varianza, momenti. Distribuzione discreta uniforme U(k), bernoulliana, binomiale, ipergeometrica e Poisson. Variabili continue in generale, media, varianza e momenti. Cenni al problema dell'esistenza dei momenti. Distribuzione rettangolare in (0,1) ed in (a,b) La distribuzione normale: definizioni, proprietà, regole di calcolo, momenti, asimmetria e curtosi. La distribuzione esponenziale negativa, processo di Poisson. Distribuzione gamma e legame con chi^2. Media e varianza del chi^2. Teorema limite centrale per somma e media con esempi su somme di binomiali, rettangolari e gamma. Calcolo della varianza della somma di variabili indipendenti. Proprietà di media campionaria e varianza campionaria. Statistiche e distribuzioni campionarie: Chiquadro e t di Student" Introduzione all'inferenza. Stima della media, della varianza e della percentuale. Teoria generale: nondistorsione, consistenza, efficienza (cenni). Legge dei grandi numeri. Cenni su consistenza ed efficienza. Intervalli di confidenza (IC) sulla media, sia per varianza nota che ignota. Determinazione della numerosità campionaria. Intervalli di confidenza sulla varianza. Verifica d’ipotesi: Introduzione ai test, P-value. Approccio decisionale: Rischi di 1° e 2° tipo. Potenza di un test. Test sulla media nota e ignota la varianza. Nesso fra IC e test. Test asintotici basati sulla normale. Test sulla percentuale. Test sulla varianza. Covarianza e correlazione. Retta di regressione e minimi quadrati. Cenni sulla regressione multipla. Scomposizione devianza ed R^2. Test t e IC sui coefficienti. IC sulla superficie di risposta e sulle previsioni