Al termine del corso, lo studente ha conoscenze su una vasta gamma di problemi tipici della data science in ambito automazione e su come approcciarne l'impostazione e la risoluzione. In particolare, lo studente è in grado di:
- formulare un problema di business come un problema di data science;
- formulare e risolvere problemi di regressione e classificazione;
- formulare e risolvere problemi di analisi dell'immagine e riconoscimento oggetti;
- applicare tecniche di clustering e riduzione dimensionalità;
- valutare la bontà di un modello stimato dai dati;
- visualizzare e presentare i risultati di un progetto di data science.
- Analisi di funzioni reali di variabili reali (corsi di Analisi I e Analisi II);
- Basi di algebra lineare (corso di Geometria e Algebra Lineare);
- Basi di statistica (corso di Statistica I).
- Lezioni frontali con slides. Le slide saranno fornite prima delle lezioni;
- Codice MATLAB per l'implementazione pratica dei concetti visti a lezione;
- Esercitazioni in aula al PC personale.
Esame scritto + progetto di gruppo con breve discussione orale.
Il corso prevede sia lezioni teoriche che esperienze di laboratorio. Verrà fornito il codice MATLAB per mostrare a lato pratico i concetti teorici. Saranno riservate delle ore per il lavoro pratico individuale (o a gruppi) al PC personale su problemi di data science.
Il corso è organizzato come segue:
- introduzione alla data science (la prospettiva aziendale e il processo CRISP-DM, apprendimento supervisionato e apprendimento non supervisionato);
- analisi descrittiva e visualizzazione di un dataset (teoria + MATLAB);
- ripasso di statistica e stima a massima verosimiglianza;
- regressione lineare (teoria + MATLAB);
- regressione logistica (teoria + MATLAB);
- trade-off bias-varianza;
- overfitting e regolarizzazione;
- validazione e valuatazione delle perfomance;
- alberi decisionali (teoria + MATLAB);
- reti neurali (teoria + MATLAB);
- reti neurali convoluzionali (teoria + MATLAB);
- metodi di clustering (teoria + MATLAB);
- principal component analysis (teoria + MATLAB).