Il Data Scientist: l’avvento di una nuova figura professionale
Nell’articolo precedente abbiamo visto come l’elevata mole di dati che caratterizza la nostra epoca e l’esigenza sempre più urgente, per rimanere al passo con la competitività del business, di analizzarli per estrapolare pattern e indicazioni utili al processo decisionale, abbia determinato il profilarsi di una nuova figura professionale, il Data Scientist, in grado di dare un senso ai Big Data.
L’acquisizione del dato in sé è una semplice commodity ottenuta attraverso strumenti informatici o meno, mentre la manipolazione dei file di testo, la comprensione delle operazioni vettoriali, il pensare per algoritmi sono attività che richiedono un background più complesso e non unicamente informatico. L’estrazione di significato dai dati grezzi richiede infatti una conoscenza di strumenti e metodi che provengono dalla matematica e dalla statistica.
Data Scientist: quali competenze?
Il Data Scientist si caratterizza pertanto per la presenza di capacità sia scientifiche (conoscenza delle tecnologie informatiche, di matematica e di statistica, competenza nel trattare i dati) sia umane (la curiosità, la comunicazione, la propensione a sperimentare, la creatività, la sistematicità, la capacità di adattarsi, la capacità di imparare velocemente, la flessibilità).
In realtà analizzare ed interpretare dati non è un nuovo mestiere, in quanto l’analisi dei dati è nota come statistica, tuttavia negli ultimi quarant’anni, e con l’accelerazione dell’ultimo decennio, è avvenuta una mutazione del contesto, che costringe a ridefinire ruoli e professioni. Fino ai primi anni ‘90, gli analisti di dati dovevano porsi il problema di quali dati raccogliere, quali interviste commissionare, come codificarle e renderle disponibili per un software che le analizzasse con l’obiettivo di trarre conoscenza e previsioni utilizzando il minor numero di dati possibili. Dagli anni ’90 in poi, con la prima ondata di Internet e del commercio elettronico in particolare, la situazione si è profondamente modificata: molte delle informazioni, per esempio riguardanti la relazione col cliente, sono già disponibili in formati digitali. Talvolta è dato strutturato, talvolta no; di fronte a questa abbondanza di dati, la statistica tradizionale ha faticato a ribaltare il suo paradigma di analisi, mentre la Computer Science, molto più vicina al reale svolgimento dei fatti, ha proposto metodi e algoritmi adatti a indagare dati in quantità assolutamente inusuale per gli statistici, generando nuove discipline note come Data Mining e Machine Learning. Il processo di digitalizzazione che ha investito tutti i settori industriali nell’ultimo decennio ha ampliato ulteriormente queste necessità. La capacità di analizzare e interpretare dati del Data Scientist lo pone quindi come una figura professionale centrale e richiesta nel mondo aziendale grazie ai vantaggi competitivi generabili da dati solo memorizzati, ma non realmente analizzati.
Alcuni esempi
A titolo di esempio basti pensare ai dati prodotti dalla sensoristica delle automobili, che in massima parte sono analizzati solo dopo il guasto dalla apparecchiatura di diagnostica del meccanico o in occasione di manutenzioni programmate; un’analisi dei dati basata su un approccio di Machine Learning con l’applicazione di algoritmi customizzati per l’applicazione di manutenzione predittiva per tutte le auto dello stesso modello, porterebbe enormi benefici economici, di sicurezza ed affidabilità dei mezzi.
Nella nostra esperienza abbiamo efficacemente sviluppato applicazioni simili a quanto descritto per il settore automotive, nel mondo produttivo, con l’analisi dei dati rilevati da sensori applicati a macchinari quali turbine, presse e impianti di filtraggio allo scopo di impostare una manutenzione predittiva customizzata sulla macchina e di studiare la qualità del prodotto finale in funzione delle variabili di processo. Applicazioni simili potrebbero essere sviluppate anche nel campo assicurativo per la predisposizione di profili di rischio personalizzati.
smeup e Data Scientist
smeup mette a disposizione una soluzione completa che integra la competenza trasversale del Data Scientist con due software sviluppati proprio per queste tematiche: R, programma specifico per l’implementazione degli algoritmi di Machine Learning e Qlik, che grazie alla sua potenza di calcolo e versatilità, offre cruscotti finali con KPI, grafici e tabelle, pronti per l’attivazione del processo decisionale.
Per leggere la prima parte dell’approfondimento sul Data Scientist clicca qui: L’esplosione delle Big Data Analytics e il Data Scientist – parte 1
Approfondisci anche la terza parte relativa al Data Scientist: Il Data Scientist/Data Analyst nelle diverse realtà aziendali – parte 3
Sara Pea
Specialista Business Intelligence – smeup
My LinkedIn Profile
Naviga per categoria:
Seleziona una categoria d’interesse dal nostro magazine