Cosa significa Machine Learning (ML)?
Il machine learning (ML – Apprendimento Automatico) è un sottoinsieme dell’intelligenza artificiale (IA) che si occupa di addestrare i modelli algoritmici a imparare dai dati e a migliorare con l’esperienza.
In questo contesto, la parola “machine” è sinonimo di programma informatico, mentre il termine “learning” descrive il modo in cui gli algoritmi diventano sempre più precisi man mano che ricevono ulteriori dati.
Sebbene il concetto di machine learning non sia nuovo, la sua applicazione pratica è diventata finanziariamente fattibile con l’avvento di Internet e con i recenti progressi nell’analisi dei big data e nel cloud computing. Questo perché l’addestramento di un algoritmo di ML richiede molte risorse di calcolo e l’accesso a grandi quantità dati.
I termini “intelligenza artificiale” e ” machine learning” sono talvolta usati come sinonimi, perché fino a poco tempo fa la maggior parte dei modelli di ML erano costruiti per eseguire un singolo compito, utilizzavano il supervised learning (apprendimento supervisionato) e richiedevano grandi set di dati etichettati per l’addestramento.
Oggi, invece, l’automazione dei processi robotici (RPA) può essere utilizzata per automatizzare il processo di pre-elaborazione dei dati e rendere molto più veloce l’addestramento di un algoritmo di machine learning.
Techopedia spiega Machine Learning (ML)
I migliori modelli di Machine Learning (ML) richiedono dati di addestramento di alta qualità e l’accesso a grandi set di dati per estrarre le caratteristiche più rilevanti per gli obiettivi aziendali specificati e rivelare associazioni significative.
Modelli di Machine Learning
Un modello di machine learning è semplicemente l’output di un algoritmo che è stato eseguito sui dati. Il processo per costruire questi modelli passa attraverso le seguenti fasi:
- Raccogliere i dati di addestramento;
- Preparare i dati per l’addestramento;
- Decidere quale algoritmo di apprendimento utilizzare;
- Addestrare l’algoritmo di apprendimento;
- Valutare i risultati dell’algoritmo di apprendimento;
- Se necessario, regolare le variabili (iper-parametri) del processo di addestramento per migliorare i risultati.
In una tipica impostazione di ML, gli algoritmi di apprendimento automatico supervisionato richiedono un set di dati composto da esempi, in cui ogni esempio è costituito da un input e da un output.
In questo contesto, un obiettivo tipico dell’addestramento di un algoritmo di ML è quello di aggiornare i parametri di un modello predittivo per garantire che gli alberi decisionali del modello producano costantemente i risultati desiderati. Ed è qui che entra in gioco l’entropia.
L’entropia è una formula matematica utilizzata per quantificare il disordine e la casualità di un sistema chiuso. Nei progetti di machine learning, l’obiettivo principale è assicurarsi che l’entropia rimanga più bassa possibile, perché questa misura determinerà il modo in cui gli alberi decisionali del modello sceglieranno di dividere i dati.
Addestramento dei modelli di Machine Learning
Esistono tre tipi principali di algoritmi utilizzati per addestrare i modelli di machine learning: supervised learning, unsupervised learning e reinforcement learning.
- Supervised learning (Apprendimento supervisionato): all’algoritmo vengono forniti dati di addestramento etichettati (input) e viene mostrata la risposta corretta (output). Questo tipo di algoritmo utilizza i risultati di serie storiche di dati per prevedere i valori di output per i nuovi dati in arrivo.
- Unsupervised learning (Apprendimento non supervisionato): l’algoritmo riceve dati di addestramento non etichettati. Invece di prevedere l’output corretto, questo tipo di algoritmo utilizza i dati di addestramento per individuare modelli che possono essere applicati ad altri gruppi di dati che presentano un comportamento simile. In alcune situazioni, durante l’addestramento può essere necessario utilizzare una piccola quantità di dati etichettati con una maggiore quantità di dati non etichettati. Questo tipo di addestramento viene spesso definito apprendimento semi-supervised.
- Reinforcement learning (Apprendimento per rinforzo): invece di ricevere i dati di addestramento, l’algoritmo riceve un segnale di ricompensa e cerca nei dati i modelli che forniscono questa ricompensa. L’input di questo tipo di apprendimento deriva spesso dall’interazione dell’algoritmo con un ambiente fisico o digitale.
Che cosa causa i bias nel machine learning?
Sebbene la trasparenza e l’attendibilità siano due caratteristiche imprescindibili negli algoritmi di machine learning, capita spesso che i modelli di ML facciano previsioni imprecise o errate.
Questi machine bias sono generalmente causati da errori sistematici o nei dati utilizzati per addestrare il modello.
Purtroppo, poiché i dati utilizzati per addestrare un algoritmo di ML vengono selezionati da un essere umano, può capitare che vengano inavvertitamente introdotti dei pregiudizi nel modello di machine learning che si sta costruendo.
Inoltre, la natura iterativa degli algoritmi di apprendimento può anche rendere difficile per gli ingegneri tornare indietro e rintracciare la logica alla base di una particolare previsione.
Quando è possibile per un data scientist o un ingegnere di ML spiegare come è stata fatta una specifica previsione, un modello di ML può essere definito AI spiegabile. Quando invece non è possibile rivelare come è stata fatta una specifica previsione – o perché la matematica diventa troppo complessa o perché i dati di addestramento sono proprietari – il modello di ML può essere definito black box AI.
MLops
I progetti di machine learning sono solitamente supervisionati da data scientist e ingegneri di ML.
Il lavoro del data scientist prevede la creazione di un’ipotesi e la scrittura di un codice che si spera dimostri la veridicità dell’ipotesi.
Il lavoro di un ingegnere di ML si concentra invece sulle operazioni di apprendimento automatico (MLops).
Le operazioni di machine learning sono un approccio alla gestione dell’intero ciclo di vita di un modello di ML, che comprende l’addestramento, la messa a punto, l’uso quotidiano in un ambiente di produzione e l’eventuale dismissione.
Per questo motivo, gli ingegneri di ML devono avere una conoscenza pratica della modellazione dei dati, dell’ingegneria delle funzioni e della programmazione, oltre a possedere un solido background in matematica e statistica.
Idealmente, i data scientist e gli ingegneri di ML all’interno della stessa organizzazione collaboreranno per decidere quale tipo di algoritmo di apprendimento funzionerà meglio per risolvere un particolare problema aziendale. Tuttavia, in alcuni settori il lavoro dell’ingegnere di ML si limita a decidere quali dati utilizzare per l’addestramento e come convalidare i risultati del modello di machine learning.
Free Download: AI in the Insurance Industry: 26 Real-World Use Cases |