Dal corso: Fondamenti di intelligenza artificiale: apprendimento automatico

Con una supervisione parziale

- L'apprendimento semi-supervisionato è un crossover che sfrutta sia l'apprendimento supervisionato che quello non supervisionato. Immagina di voler creare un programma in grado di tradurre la segreteria telefonica in testo. Sarebbe difficile utilizzare l'apprendimento non supervisionato. Qui, la tua macchina raggrupperebbe le parole insieme, ma non saprebbe necessariamente cosa significano quelle parole. Forse la tua macchina potrebbe identificare ogni volta che qualcuno ha detto la parola foto. Il problema è che, poiché è raggruppato e non classificato, il tuo programma non sa che questo suono per foto è la stessa cosa della parola per foto. Il rovescio della medaglia, non vorresti usare solo l'apprendimento supervisionato. Sarebbe troppo laborioso etichettare tutti i dati per le parole e il loro suono. Inoltre, non è mai stato possibile creare un set di formazione abbastanza grande da tradurre tutte le parole e le frasi possibili. Quindi, invece, potresti provare l'apprendimento semi-supervisionato. Qui, inizierai con un set di allenamento più piccolo di parole e frasi molto comuni. La macchina potrebbe usarlo per eseguire alcune classificazioni di base. Questo sarebbe come il set di formazione nell'apprendimento supervisionato. Ma poi si alimenta quel set di addestramento nella macchina e si permette di studiare e osservare il resto dei dati. Questo è simile all'apprendimento non supervisionato. Ciò consentirebbe alla macchina di espandere il suo vocabolario in base a ciò che ha già classificato. Con i dati etichettati, il programma potrebbe utilizzare una forma di ragionamento induttivo per cercare di espandere il proprio vocabolario. Potrebbe utilizzare i dati di allenamento che collegano la parola foto alla foto audio e trovare nuove traduzioni. Forse può indurre la parola fotografia, fotografo, fotocopia o persino siluro fotonico. Avrà i dati di addestramento per la parola foto e la foto sonora, e quindi la macchina userebbe solo il ragionamento induttivo quando effettua le traduzioni. Ogni volta che la macchina induce una nuova connessione, fa del suo meglio per cercare di migliorare il modello. Quindi, se la traduzione è corretta, aggiungerà tutte queste parole. Di solito si ottiene questo feedback da osservatori umani. Ecco perché quando ottieni una traduzione, vedrai spesso un link che dice, come è questa traduzione? Ma l'apprendimento induttivo non è l'unica forma di apprendimento semi-supervisionato. C'è un'altra forma di apprendimento semi-supervisionato chiamato ragionamento trasduttivo. Ciò consente di restringere i dati senza etichetta pensando a ciò che già si sa sulla raccolta. Quindi, se stavi usando il ragionamento trasduttivo per trascrivere la segreteria telefonica, dovresti pensare ai dati in un contesto più ampio. Pensa ad alcune delle cose che le persone dicono in un messaggio vocale. Le persone probabilmente mettono molti più nomi nei loro messaggi vocali. Ti stanno dando informazioni su persone, luoghi o cose. È più probabile che parlino di orari e date. Un tipico messaggio vocale potrebbe essere qualcosa del tipo, ciao, questo è Jeff. Stavo chiamando per confermare il nostro incontro martedì prossimo. Chiamami se c'è un cambiamento. Questo è molto diverso da un campionamento casuale di audio che potresti ottenere ascoltando le persone in un ristorante. Quindi il ragionamento trasduttivo cerca di migliorare il modello facendo ipotesi migliori su cosa c'è nei dati non etichettati. L'apprendimento semi-supervisionato non è così comune, ma funziona bene in alcune aree. Spesso funziona meglio quando non è difficile per la macchina creare gruppi utili. Ma allo stesso tempo, i dati sono così grandi che non è pratico utilizzare l'apprendimento supervisionato. Potresti vedere l'apprendimento semi-supervisionato utilizzato per classificare le pagine Web o raggruppare le immagini di qualcosa come gli insetti. La cosa fondamentale da ricordare è che l'apprendimento semi-supervisionato ha davvero senso solo quando gli altri due approcci hanno difficoltà a risolvere la tua sfida. Potresti anche tenere presente che il ragionamento induttivo e trasduttivo potrebbe portare a errori maggiori e dati etichettati in modo errato. Quindi prova a pensarli come la soluzione migliore per un particolare problema e non necessariamente il posto migliore per iniziare con le tue sfide di apprendimento automatico.

Contenuti