Cosa è il Machine Learning
Machine Learning significa letteralmente “apprendimento della macchina” e si intende il processo attraverso il quale la macchina, o meglio il computer, apprende regole e relazioni da quanto gli viene insegnato, riuscendo così a predire comportamenti futuri.
Come è possibile che la macchina impari?
L’abbondanza di dati disponibili grazie al diffondersi di computer, sensori, software ed all’impiego di internet, ci consente di registrare ed elaborare dati in quantità sempre più elevata. La maggiore disponibilità di dati deve andare di pari passo con lo sviluppo della tecnologia e al ridimensionamento dei costi delle infrastrutture hardware. Questi fattori che hanno reso l’immagazzinamento e la conservazione dei dati possibile e relativamente semplice.
Cosa significa ciò?
Ora, grazie ai dati disponibili, che costituiscono già l’intera popolazione del fenomeno da analizzare, si estrapolano direttamente le correlazioni insite negli stessi, giungendo ad una nuova conoscenza data driven.
Come viene allenata la macchina?
La macchina non apprende in modo automatico, ma, per essere allenata, ha bisogno che le venga fornito lo schema giusto. In termini statistici, quindi, “l’algoritmo” più adatto a rappresentare le relazioni insite nei dati. La selezione dell’algoritmo più appropriato è il risultato dell’applicazione di specifiche tecniche statistiche che consentono di selezionare un modello generalizzabile su nuovi dati.
Cosa propone smeup?
Grazie al Machine Learning è possibile sviluppare molteplici progetti basati sulla conoscenza data driven. Questo allo scopo di migliorare la produttività aziendale, grazie ad un più efficace controllo del processo di business, tra i quali:
- Analisi della qualità del prodotto (analisi dei pezzi buoni/scarti)
- Profilazione della clientela
- Manutenzione predittiva (studio del verificarsi del guasto di una macchina)
Vediamo ad esempio le fasi di un progetto di Manutenzione predittiva:
- Si individuano i sensori relativi al fenomeno che si vuole analizzare (ad esempio temperature, pressioni, vibrazioni ecc.);
- Si raccolgono i “big data”, cioè un grande volume di dati che riassumano la storia dei guasti. I dati devono essere inoltre consistenti e completi, per non inficiare il risultato dell’analisi;
- Il Data Scientist utilizza il software R, un potente programma free e open–source specifico per analisi statistiche e costruisce vari algoritmi. Questo allo scopo di selezionare l’algoritmo vincente per individuare gli elementi che consentono decisioni più precise ed efficaci;
- Si utilizza poi Qlik, il programma che già utilizziamo efficacemente per la Business Intelligence. Esso è dotato di un’elevatissima potenza di calcolo. Qlik lancia l’algoritmo selezionato su nuovi dati provenienti dallo stesso flusso aziendale e consente la realizzazione di report (es. KPI e grafici relativi alle variabili critiche da monitorare, ecc.).
Il progetto di Machine Learning descritto viene realizzato in maniera sartoriale sullo specifico processo aziendale di ogni azienda e controllato interamente dal Data Scientist. Infatti, anche se apparentemente ci troviamo di fronte ad aziende con dati e processi simili tra loro, ogni realtà ha una sua personale distribuzione e tipologia di variabili che determina l’unicità dell’analisi.
Sara Pea
Specialista Business Intelligence – smeup
My LinkedIn Profile
Naviga per categoria:
Seleziona una categoria d’interesse dal nostro magazine