Un primer su AI Machine Learning

Cosa devi sapere sull’apprendimento automatico a colpo d’occhio

coffee/pixabay

Fonte: caffè / pixabay

È probabile che tu stia già utilizzando i servizi alimentati dall’intelligenza artificiale (AI) ogni giorno. Ma cosa alimenta esattamente l’apprendimento automatico? Diamo un’occhiata al motore sotto il cofano di AI machine learning.

L’apprendimento automatico è un sottoinsieme dell’intelligenza artificiale che non richiede espliciti hard-coding (programmazione) per eseguire attività. Ciò si ottiene fornendo algoritmi di apprendimento automatico con grandi quantità di dati da “apprendere” e elaborare. L’apprendimento automatico viene eseguito in un modo supervisionato, senza supervisione, semi-supervisionato o con metodi di rinforzo.

L’apprendimento automatico supervisionato utilizza dati di addestramento etichettati: per ogni input, esiste un valore di output noto e associato. L’obiettivo dell’apprendimento supervisionato è quello di apprendere una funzione che stima meglio la relazione tra i dati di input e di output. Mentre nell’apprendimento non supervisionato, non vi sono dati di addestramento in uscita etichettati associati ai dati di input, quindi l’obiettivo è che la macchina deduca dai dati di addestramento dell’input forniti per identificare le somiglianze e le differenze tra i punti di dati. L’apprendimento automatico semi-supervisionato utilizza alcuni dati di addestramento etichettati.

L’apprendimento di rinforzo (RL) è il metodo in cui l’apprendimento è realizzato attraverso agenti software che interagiscono con il suo ambiente con l’obiettivo di massimizzare la ricompensa. I processi decisionali Markov (MDP) sono in genere utilizzati per l’apprendimento di rinforzo. MDP modella matematicamente il processo decisionale in ambienti incerti.

Il cuore dell’intelligenza artificiale è la matematica e le statistiche utilizzate negli algoritmi informatici, le procedure per risolvere un problema. Gli algoritmi che eseguono regressione, classificazione o clustering sono esempi di attività comuni di apprendimento automatico.

Il concetto di regressione fu introdotto dal poligamo Sir Francis Galton (cugino di Charles Darwin) nei suoi documenti di ricerca genetica “Regressione verso la mediocrità nella statura ereditaria” e “Natural Inheritance” pubblicati rispettivamente nel 1886 e nel 1889. “La regressione verso la media” è il fenomeno per i dati anomali che sono al di fuori della norma per essere più vicini alla media la prossima volta che viene misurata. In termini scientifici, la regressione alla media si verifica in genere a causa di errori nel campionamento dei dati. Ciò può verificarsi quando la dimensione del campione è troppo piccola o se i campioni non vengono selezionati casualmente.

Un modo per pensare a questo è nel contesto del familiare adagio di “allontanarsi dal tavolo” quando si è davanti a un casinò perché vincere è un outlier a caso, e nel tempo, l’esito regredirà verso la media di perdere. Le serie vincenti sono esiti rari e le probabilità sono alte che nel tempo finirai per perdere se continui a giocare.

La regressione lineare è la forma più semplice di regressione che viene utilizzata per l’analisi predittiva negli algoritmi di apprendimento automatico. L’obiettivo è minimizzare l’errore tra il valore effettivo dell’algoritmo e il valore previsto. Una funzione di costo, nota anche come funzione Mean Squared Error (MSE), misura gli errori di predizione.

La discesa del gradiente è un algoritmo di ottimizzazione per l’apprendimento automatico utilizzato per identificare i valori dei coefficienti (parametri) di una funzione che minimizzerà una funzione di costo.

La regressione lineare è relativamente semplice e diretta. Spesso, tuttavia, in un dato insieme di dati, la relazione tra due variabili non è direttamente proporzionale, e quindi non può essere derivata dalla regressione lineare. Nell’apprendimento automatico, vengono utilizzate tecniche di regressione tipicamente non lineari. Esempi di algoritmi di regressione non lineare comprendono la discesa del gradiente, i metodi di Gauss-Newton e di Levenberg-Marquardt.

Un altro compito comune di apprendimento automatico è la classificazione. La classificazione è supervisionata dall’apprendimento automatico in cui il computer apprende dai dati di addestramento etichettati e applica l’apprendimento con l’obiettivo di prevedere con precisione la classe per i dati. Ad esempio, nella commedia della HBO “Silicon Valley”, uno dei personaggi intraprendenti, Mr. Jian-Yang, ha creato un’app AI chiamata “Not Hotdog” per classificare le immagini come hot dog o non hot dog. Nella vita reale, Tim Anglade, il consulente tecnico principale dello show, ha creato un’app Not Hotdog. Come con qualsiasi apprendimento automatico, la quantità e la qualità dell’allenamento sono importanti. In questo caso, Anglade ha scritto nel suo post sul blog su Medium che a causa di pregiudizi nel set di dati iniziale utilizzato, l’app era “incapace di riconoscere hot dog in stile francese, hot dog asiatici e altre stranezze con cui non avevamo un’esperienza personale immediata” e che l’intelligenza artificiale è influenzata “dagli stessi pregiudizi umani a cui siamo soggetti, attraverso i set di addestramento che gli esseri umani forniscono”.

Il terzo tipo principale di attività di apprendimento automatico è il clustering: l’organizzazione di dati non etichettati in gruppi simili attraverso l’apprendimento automatico non supervisionato. Per illustrare il concetto di clustering, diamo un’occhiata ad un esempio di analisi statistica basata su umani – il lavoro svolto da John Snow, MD, è stato uno dei primi epidemiologi. Il dott. Snow mappò i casi di colera e notò che i gruppi di focolai erano vicino a una pompa d’acqua. A quanto pare, l’acqua di quella pompa era inquinata dal pannolino sporco di un bambino con il colera. Il dott. Snow teorizzò che il colera era una malattia trasmessa dall’acqua durante un grande focolaio nel 1854 nel quartiere di SoHo a Londra. Sulla base della sua analisi dettagliata, ha concluso che il colera non è stato causato da “miasma” (“aria cattiva”) come era il pensiero dominante in quel momento.

La recente impennata degli investimenti in intelligenza artificiale (AI) in molti settori industriali è in gran parte dovuta alle capacità di riconoscimento dei pattern da deep learning, un metodo di apprendimento automatico di più di due strati di reti neurali. Apprendimento profondo: reti neurali composte da due o più livelli che utilizzano l’elaborazione non lineare. L’apprendimento approfondito rappresenta lo stato dell’arte per il riconoscimento del pattern utilizzato per il riconoscimento di immagini e parlato. Questa tecnica è ottimale quando ci sono grandi set di dati disponibili per l’allenamento.

AI è stata intrecciata in app per social media, ricerca su Internet, suggerimenti per acquisti online, bot di servizio clienti, medicina personalizzata, trading finanziario, gestione della produzione industriale, scoperta di farmaci, prevenzione delle frodi, analisi della business intelligence, reclutamento di risorse umane, assistenti virtuali, veicoli autonomi , motori di traduzione, riconoscimento facciale, conversione di immagini a colori e persino esports. I campi interdisciplinari della matematica, delle statistiche, della scienza dei dati e dell’informatica convergono nell’apprendimento automatico, che a sua volta sta cambiando rapidamente il modo in cui viviamo, lavoriamo e giochiamo.

Copyright © 2019 Cami Rosso Tutti i diritti riservati.

Riferimenti

Galton, Francis. “Regressione verso la mediocrità nella statura ereditaria.” Macmillan . 1886. Estratto il 2-4-2019 da http://galton.org/books/natural-inheritance/pdf/galton-nat-inh-1up-clean.pdf

Galton, Francis. “Eredità naturale”. Macmillan . 1889. Estratto il 2-4-2019 da http://galton.org/books/natural-inheritance/pdf/galton-nat-inh-1up-clean.pdf

GeegksforGeeks. “Raggruppamento in machine learning”. Estratto il 2/4/2019 da https://www.geeksforgeeks.org/

Anglade, Tim. “Come la Silicon Valley di HBO ha costruito” Not Hotdog “con TensorFlow, Keras e React Native mobili.” Media . 26 giugno 2017.

Rogers, Simon. “Il giornalismo dei dati di John Snow: la mappa del colera che ha cambiato il mondo.” The Guardian . 15 marzo 2013.