DALMINE
Dati Generali
Periodo di attività
Syllabus
Obiettivi Formativi
All’interno del Corso di Gestione, Analisi e Rappresentazione Dati gli studenti impareranno come approcciare l’analisi di un set di dati e la sua rappresentazione in ambito manifatturiero e produttivo utilizzando strumenti commerciali (ad esempio, software quali Tableau) e linguaggi/strumenti di programmazione general purpose (come Python e librerie connesse).
Nello specifico, alla fine del corso gli studenti:
- Potranno adottare procedure ed operazioni per prendere rapidamente confidenza con il dataset, individuare outlier, gestire dati mancanti
- Acquisiranno le basi degli algoritmi di machine learning per l’apprendimento automatico dai dati
- Avranno appreso i concetti teorici alla base della rappresentazione dei dati
- Impareranno a comprendere il funzionamento di software commerciali (es. Tableau) e software open source (es. Python) per la gestione, analisi e rappresentazione dei dati.
- Saranno in grado di scegliere, a seconda del contesto e della disponibilità, se utilizzare strumenti commerciali (es. Tableau) o strumenti open-source (es. librerie Python) per l’analisi e rappresentazione dei dati a disposizione.
- Saranno in grado di applicare una strategia di analisi dati in grado di coprire le fasi di raccolta, analisi e rappresentazione del dataset.
- Saranno in grado di costruire delle dashboard di sintesi interattive in grado di supportare decisioni in ambito manifatturiero.
Prerequisiti
Metodi didattici
La didattica si svolge tramite lezioni frontali ed esercitazioni per un totale di 48 ore, con particolare attenzione all'interazione con gli studenti. Il materiale didattico consiste principalmente delle slide reperibili sul sito del corso e del codice di esempio, alle quali saranno affiancate delle letture di approfondimento sui testi consigliati in bibliografia. Le slide fungono da supporto alla discussione in aula: pertanto, durante la discussione in aula potranno essere forniti ulteriori dettagli non presenti sulle slide.
La password di accesso al materiale pubblicato sulla pagina del corso viene comunicata durante la prima lezione del corso. In caso di impossibilità a essere presenti alla prima lezione, si invita a contattare il docente via e-mail.
I docenti:
- Presenteranno i principali concetti teorici in lezioni teoriche utilizzando PowerPoint o altri strumenti ritenuti utili.
- Presenteranno esempi di gestione, analisi e rappresentazione dati attraverso esercizi pratici e tutorial, sviluppando e discutendo ciascun esempio in classe con gli studenti.
- Presenteranno il progetto d'esame fornendo informazioni sui risultati attesi e sui traguardi da raggiungere.
- Supporteranno gli studenti nello sviluppo del progetto attraverso il feedback fornito durante il corso.
Gli studenti:
- Avranno il compito di ascoltare, prendere appunti e partecipare attivamente alle lezioni teoriche e pratiche attraverso domande e discussioni.
- Metteranno in pratica i concetti spiegati durante le lezioni teoriche in sessioni pratiche in cui, singolarmente o in gruppo, verrà chiesto di risolvere piccoli problemi forniti dai professori (ad esempio, eseguire una certa analisi, rappresentare un certo set di dati).
- Creeranno autonomamente gruppi per lo sviluppo di un caso di studio che sarà utilizzato per il loro esame.
- Chiederanno incontri con i professori per ricevere un feedback sul proprio progetto.
Verifica Apprendimento
La valutazione si baserà sullo sviluppo di un caso di studio che richiederà l’applicazione dei concetti appresi durante il corso. Lo scopo del caso di studio sarà analizzare un dataset e creare una dashboard per la rappresentazione del suo contenuto. Per dimostrare di aver raggiunto i requisiti per il superamento del corso, gli studenti dovranno:
- Lavorare in gruppo (minimo 3 studenti - massimo 5 studenti) per sviluppare il caso di studio.
- Fornire i file contenti le analisi svolte utilizzando uno degli strumenti software appresi durante il corso.
- Creare una presentazione PowerPoint che spieghi la strategia di analisi adottata ed i passaggi svolti per la preparazione e analisi del dataset e del caso di studio. La discussione durerà circa 30 minuti per gruppo, comprese le domande di chiarimento dei professori.
Le modalità d'esame per gli studenti non frequentanti sono le stesse rispetto a quelle per gli studenti frequentanti.
Gli studenti non frequentanti sono comunque invitati a prendere contatto con il docente per valutare eventuali materiali integrativi.
Contenuti
Partendo da una panoramica generale sui concetti di analisi e rappresentazione dati, il corso ha l’obiettivo di far acquisire agli studenti le conoscenze necessarie a capire come raccogliere, analizzare e rappresentare dati con lo scopo finale di fornire agli studenti le competenze per creare delle dashboard interattive a supporto delle decisioni in ambito manifatturiero e produttivo. Il corso si propone di raggiungere l’obiettivo tramite la presentazione di strumenti commerciali (es. Tableau) ed open-source (es. Python e le relative librerie) che daranno agli studenti la flessibilità e le competenze per capire quale strumento usare a seconda del contesto di lavoro.
Nello specifico, il corso si compone di moduli dedicati a:
- Concetti generali – Rappresentazione dati, dashboard in ambito produttivo e gestionale, definizione di una pipeline di analisi generica per la raccolta, gestione, analisi, e rappresentazione dei dati.
- Introduzione a Python – Anaconda, Jupyter notebook, comandi base.
- Introduzione a Pandas – Caricamento di un dataset, basi di data processing, transformation e preparation.
- Prendere confidenza col dataset – Operazioni da effettuare per acquisire conoscenza con i dati a disposizione
- Rilevamento e gestione di outlier - Definizione di outlier e metodi di rilevamento automatico degli outlier
- Rilevamento e gestione di dati mancanti – Meccanismi di rilevamento dei dati mancanti e loro imputazione
- Estrazione dell’informazione dai dati - Come creare nuove informazioni da dati esistenti
- Cenni di machine learning – Regressione, classificazione e clustering
- Introduzione ai software per la Business Intelligence – Caricamento di un dataset, costruzione query, costruzione grafici e dashboard.
- Progettazione di dashboard – Identificazione dei fruitori. Allineamento del contenuto allo scopo di utilizzo. strutturazione del contenuto per favorire la leggibilità e la consultazione. Identificazione degli elementi necessari alla comunicazione.
- Sviluppo di dashboard – Creazione di dashboard, identificazione e implementazione di elementi di interattività considerando anche la leggibilità. Valutazione della coerenza dei dati comunicati rispetto al contesto d’uso.
Altre informazioni
Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte modifiche rispetto a quanto dichiarato nel syllabus per rendere il corso e gli esami fruibili anche secondo queste modalità.