Dati come se piovessero
Dati, dati e ancora dati, di questo ha bisogno l’Intelligenza artificiale per poter imparare e così dare risposte. Un sistema di “machine learning” che tradotto letteralmente significa “macchina di apprendimento” come si evince dal nome, deve imparare. E come apprende ? Grazie ai sopracitati dati. Il punto è che ne ha bisogno di tanti, più sono e maggiori saranno le sue capacità intellettive.
Occorre iniziare oggi per far sì che tra un paio di anni, quando la tecnologia sarà alla portata di tutti, questi algoritmi possano essere alimentati da sufficienti dati.
È la Golden Age dei Dati ?
Secondo uno studio dell’università dell’Illinois del 1990, “ … la maggior parte dei problemi di ingegneria e produzione sono ricchi di dati ma scarsi di conoscenza”.
L’industria manifatturiera oggi sta vivendo un aumento mai visto dei dati disponibili, con una varietà di formati, semantica, qualità. Per questo fenomeno vengono utilizzati nomi diversi, ad esempio Industria 4.0, Smart Manufacturing o Smart Factory. L’ aumento e la disponibilità di grandi quantità di dati viene spesso indicata come Big Data.
La disponibilità, ad esempio, di dati relativi alla qualità offre il potenziale per migliorare la qualità del processo e del prodotto in modo sostenibile. Tuttavia, molte informazioni oltre ad essere una sfida pratica, possono avere un impatto negativo se portano a conclusioni ritardate o errate sulle azioni da intraprendere.
Nel complesso, l’industria manifatturiera deve capire che per beneficiare della maggiore disponibilità di dati, dal miglioramento della qualità, alla stima dei costi di produzione e/o ottimizzazione dei processi o, anche per comprendere meglio le esigenze del cliente, hanno necessariamente necessità di un supporto per gestire l’elevata dimensionalità, complessità e le dinamiche coinvolte.
Data Mining
Meno pittoresco del nome, ossia setacciare dati al fine di trovare dati di valore, cioè informazioni, il data mining è un insieme di tecniche e metodologie per estrarre sapere o conoscenza, da grandi quantità di dati, e il loro successivo utilizzo scientifico, industriale o operativo per prendere decisioni.
Utilizzare il ML (Machine Learning) in produzione può fornire una base per lo sviluppo di approssimazioni sul comportamento futuro del sistema . Queste nuove informazioni o conoscenze possono supportare i responsabili del processo nel loro processo decisionale o essere utilizzate automaticamente per migliorare direttamente il sistema.
Le tecniche di ML sono progettate per ricavare conoscenza dai dati esistenti. I dati immagazzinati diventano utili solo quando vengono analizzati e trasformati in informazioni come, ad esempio, quelle utilizzate per fare previsioni.
Una regola empirica è che il 70% del set di dati viene utilizzato come set di dati di addestramento, il 20% come set di dati di valutazione (per regolare i parametri, ad esempio bias) e il 10% finale come dati di test- impostato.
La quantità di dati che un algoritmo può processare è tendente all’infinito e quindi, più questo numero è grande, maggiore sarà la sua precisione.
I dati di un paio di anni di esercizio, con tutti gli inconvenienti, le interruzioni e le problematiche intervenute a mutare il valore standard registrato, potranno essere una buona base di partenza per realizzare previsioni con un orizzonte di qualche settimana.
Le previsioni sono l’estrapolazione di modelli ripetitivi individuati dagli algoritmi nei dati.
Pattern (modelli)
Le tecniche di data mining sono fondate su specifici algoritmi. I pattern identificati ipotizzano, e quindi vanno verificati, relazioni di tipo causale tra fenomeni; in generale si tratta di approssimazioni statistiche. Un pattern deve essere infatti:
- Valido sui dati con un certo grado di confidenza;
- Comprensibile dal punto di vista sintattico e semantico affinché si possa interpretare;
- Precedentemente sconosciuto e potenzialmente utile affinchè si possano conoscere le conseguenze.
Il data mining trova pattern e relazioni tramite la costruzione di modelli. I modelli sono delle rappresentazioni astratte della realtà. Una cartina stradale mostra le vie di un luogo, ma non un incidente che ne rallenta il traffico.
Un modello non è la realtà ma è utile per comprendere eventi reali e suggerisce azioni da intraprendere per raggiungere i propri scopi.
Inizia subito a salvare dati con SiVaF Informatica
SiVaF Informatica è specializzata nell’acquisizione di informazioni rilevanti di macchinari, impianti e persino da postazioni manuali.
Questa preziosa base di partenza sarà ciò che caratterizzerà il successo o il fallimento delle aziende del prossimo futuro.