L’analisi predittiva, la disciplina che grazie all’utilizzo di modelli matematici di differente complessità realizza previsioni accurate sul futuro, sta diventando sempre più precisa e disponibile, grazie all’incremento delle cosiddette “tracce digitali”, elementi che consentono di immagazzinare un database storico sempre più ampio ed in grado di costituire un ambiente idoneo per allenare il più efficacemente possibile gli algoritmi da utilizzare nella realizzazione e svolgimento dell’attività di analisi.
L’abbondanza di dati raccolti dai numerosi device dell’Internet of Things, ormai inseriti nei più svariati ambiti applicativi (automobili, frigoriferi, macchinari inseriti in processi produttivi etc.), di quelli immagazzinati nella cronologia della nostra navigazione in rete, lasciati nella frequentazione e interazione quotidiana sui “social” o più semplicemente la possibilità di immagazzinare senza limiti i dati aziendali, grazie alle possibilità offerte oggi dalla tecnologia e alla riduzione dei costi hardware, ha aumentato esponenzialmente la capacità di profilatura dell’algoritmo, determinando una crescente affidabilità delle previsioni ottenute.
Un ramo di questa disciplina si occupa di predire nello specifico l’andamento delle serie temporali e trova interessanti applicazioni nella previsione del fatturato, del budget, del magazzino e di qualsivoglia misura legata alla variabile tempo.
Nei cruscotti Qlik è possibile visualizzare sia la fase di test e selezione modello, sia la fase finale di Forecasting.
Nelle applicazioni Qlik di Business Intelligence, realizzate dagli analisti smeup, abbiamo inserito, in aggiunta alla tradizionale analisi delle vendite a consuntivo, con i tipici KPI, anche un modulo predittivo; la possibilità di avere in un unico cruscotto il confronto tra il dato reale e il dato previsto, dà un grandissimo valore aggiunto a livello di decisioni di business.
Per ottenere una buona previsione è fondamentale innanzitutto avere un cospicuo database storico relativo alla variabile che si vuole prevedere, con la granularità desiderata (es. fatturato per famiglia di articolo, per articolo, per cliente, etc.). Grazie al connettore messo a disposizione da Qlik verso R, software open specifico per il Machine Learning, i dati vengono direttamente trasferiti in R dove vengono testati una serie di algoritmi personalizzati, scelti dall’analista in base alle caratteristiche specifiche dei dati stessi.
La selezione dell’algoritmo avviene partizionando in due il dataset storico fornito; si ottengono così un 80% circa di dataset di training e un 20% di dataset di test che coincide con la porzione temporale più recente. Le previsioni dei modelli costruiti sul training vengono confrontate con il dato a consuntivo del dataset di test e la curva che più si avvicina a quella reale viene selezionata.
La bontà della previsione viene poi espressa con un indice di accuratezza, che permetta di capirne l’affidabilità; la variabilità può ad esempio dipendere dalla disponibilità dello storico fornito, dalle caratteristiche intrinseche della serie temporale, che determinano la maggiore o minore efficacia dell’algoritmo ad estrapolarne il pattern, dall’orizzonte temporale del forecast richiesto (maggiore è l’estensione, minore può essere l’accuratezza).
Cruscotto Qlik – fase di Test
La curva grigia dei dati reali della porzione di Test viene confrontata con le curve colorate di previsione, per selezionare la migliore (curva rossa).
Cruscotto Qlik – fase di Forecasting
L’algoritmo selezionato (curva rossa) viene utilizzato per fare previsione e comunque confrontato rispetto alla previsione degli altri algoritmi.
Sara Pea
Specialista Business Intelligence – smeup
My LinkedIn Profile
Naviga per categoria:
Seleziona una categoria d’interesse dal nostro magazine