Me

Come ha fatto Google Translate a migliorare così in fretta

Da sempre ridicolizzato per gli strafalcioni involontari delle sue traduzioni, il gigante dei traduttori automatici ha fatto passi da gigante riscrivendo il suo programma da zero

Immagine di copertina

Qualcosa è cambiato dentro a Google Translate, il celebre servizio di traduzione automatica fornito da Google che ogni giorno traduce 100 miliardi di parole

Il più famoso traduttore informatico, disponibile in 103 lingue, è sempre stato famoso per la sue traduzioni poco accurate e talvolta comiche, tanto da aver ispirato nel corso degli anni fiumi di contenuti ironici basati proprio sugli errori di traduzione più bizzarri.

Sul web si possono trovare centinaia fra meme e video (italiani e stranieri) da milioni di visualizzazioni che, per esempio, ripropongono le hit musicali del momento sostituendone i testi con le versioni storpiate dalle traduzioni di Google.

Questo trend è però in netto calo nell’ultimo periodo, fatto che si spiega con una banale constatazione: la rappresentazione proposta da simili contenuti, semplicemente, non corrisponde più alla realtà dei fatti.

Negli ultimi due anni, infatti, la situazione è si radicalmente trasfigurata: basta consentire a Google di tradurre automaticamente una qualsiasi pagina web in lingua straniera per accorgersi del recente salto di qualità del software.

In occasione del suo decimo compleanno, Google Translate ha annunciato ai suoi 500 milioni di utenti una modifica strutturale del programma, consistente nel passaggio dal precedente sistema “phrase-based” al nuovissimo Google Machine Neural Translation.

Il GMNT, realizzato dalla DeepMind Technologies (la divisione di Google dedicata all’intelligenza artificiale), si basa su un sistema di deep learning (apprendimento profondo), ossia una specifica tipologia di intelligenza artificiale che utilizza le reti neurali.

Qual è la differenza, quindi?

La precedente versione di Google Translate considerava una parola per volta, per poi tradurla e riordinare i lemmi nell’ordine grammaticale corretto.

Le regole sintattiche e semantiche proprie di ogni lingua venivano ricavate dal sistema grazie all’analisi di un altissimo numero di testi già tradotti e dati in pasto all’elaboratore in precedenza.

Nella miriade di esempi proposti (principalmente documenti ufficiali delle Nazioni Unite o del Parlamento europeo) il software ricercava dei pattern, compiendo un’analisi statistica per trovare il significato più comunemente attribuito ad ogni termine in quella sequenza di parole.

Le parole venivano quindi tradotte e riordinate per formare frasi logicamente corrette nella lingua desiderata, le quali prescindevano però dal contesto generale del paragrafo.

L’enorme numero di eccezioni tipiche di ogni lingua e l’intrinseca ambiguità di molte parole rendono però necessariamente imprecisa una traduzione che si basi sull’uso più comune dei termini.

Il traduttore, inoltre, compiva un doppio passaggio: le frasi venivano portate dalla lingua iniziale all’inglese, e poi dall’inglese alla lingua di destinazione, raddoppiando così la probabilità di commettere errori.

Il nuovo Google Translate, invece, compie veri e propri ragionamenti, il cui preciso funzionamento non è completamente chiaro neppure ai suoi stessi programmatori.

Quoc Le, uno dei ricercatori coinvolti nel progetto, ha dichiarato in un’intervista con il MIT Technology review che questa incertezza “può essere disturbante. Ma l’abbiamo provato in tanti settori diversi e, semplicemente, funziona”.

La rete neurale di Google non analizza le singole parole, ma guarda al contesto: selezionando intere sequenze di frasi come unità di base, “impara” a tradurre grazie ad un iniziale training in cui propone traduzioni e riceve dai programmatori dei feedback sulla precisione del risultato, per poi correggere il tiro via via.

Grazie alle migliaia di traduzioni fornite inizialmente al programma (i documenti ufficiali già utilizzati per la precedente versione), questo fa esperienza e impara a riconoscere il significato di ogni espressione più adatto ad ogni contesto.

È proprio questo tipo di apprendimento esperienziale a rendere l’intelligenza artificiale simile al cervello umano, che funziona più su base intuitiva-deduttiva che non per regole pre-programmate.

Il sistema di deep learning appare quindi particolarmente efficace per i traduttori, ed è infatti utilizzato anche dai principali rivali di Google Translate: Bing Translator ed il tedesco DeepL.

Campagna regione lazio

Quali sono i risultati?

Il nuovo sistema fornisce traduzioni che presentano un livello di accuratezza superiore in media del 60 per cento rispetto alla versione precedente.

Valutando le traduzioni con la scala BLEU (Bilingual evaluation understudy), che assegna ad ogni risultato un punteggio da 0 a 6 su 500 frasi prese da articoli e componimenti di varia provenienza, Google Translate realizza sul passaggio da inglese a spagnolo un punteggio medio di 5.43, contro il 5.5 delle traduzioni umane, mentre per cinese-inglese un punteggio di 4.3 contro il 4.6 umano.

Confronto tra l’accuratezza delle traduzioni realizzate con il vecchio sistema (in grigio), quelle realizzate dal nuovo (in verde) e quelle redatte da traduttori umani (in arancione).

Restano, tuttavia, delle criticità: il traduttore automatico scivola sui termini più rari, questione che gli sviluppatori stanno cercando di risolvere affiancando all’analisi di gruppi di frasi anche lo studio dei frammenti delle singole parole.

Le traduzioni neurali sono state attivate in un primo momento solo per una limitata selezione di combinazioni linguistiche (inglese, cinese, francese, tedesco, spagnolo, turco, portoghese, coreano, cinese), parlate come lingua madre da circa un terzo della popolazione mondiale e corrispondenti a circa il 35 per cento delle ricerche effettuate su Google Translate.

Grazie al meccanismo dello “Zero-shot system”, però, il traduttore riesce ora a funzionare anche per coppie di lingue sulle quali non è stato specificamente istruito, e il nuovo sistema si applica alla maggior parte delle combinazioni presenti (anche se le traduzioni da e per l’inglese restano le migliori).

Siamo ancora molto lontani dall’utopia fantascientifica di una traduzione perfetta ed istantanea dipinta da opere cult come Star Trek e Guida Galattica per Autostoppisti, dal momento che le produzioni artistiche e ironiche richiedono un necessario adattamento alla cultura locale che le macchine non sono (ancora) in grado di fornire.

I miglioramenti delle applicazioni di traduzione possono però segnare un salto di qualità notevolissimo nella quotidianità delle migliaia di stranieri e profughi che si trovano a doversi muovere in paesi di cui non conoscono la lingua.

Google e l’intelligenza artificiale: una storia d’amore

L’intero settore dell’intelligenza artificiale è da tempo al centro delle ricerche di Google, che ha utilizzato il deep learning anche per migliorare le sue applicazioni di riconoscimento vocale, sonoro e dell’immagine, nonché per il prodotto Google Assistant.

Per coinvolgere gli utenti nell’esplorazione delle nuove frontiere dell’informatica, gli sviluppatori del principale colosso del web hanno realizzato una serie di video esplicativi ed il portale A.I. Experiments, sul quale è possibile sperimentare le nuove funzioni, nell’ottica di uno sviluppo open source delle stesse.

Ecco, ad esempio, come funzionano le reti neurali di Google:

 

Un altro esempio di applicazione pratica dell’intelligenza artificiale sono le composizioni musicali: invece programmare il computer con tutte le regole dell’armonia, inserendo istruzioni su ritmo, metrica e tonalità, il deep learning consente di far fare esperienza al programma elaborando migliaia di brani, e deducendo risposte sensate.

 

 

La combinazione delle diverse applicazioni dell’intelligenza artificiale consente infine di aprire le porte a nuovi metodi di comunicazione ed apprendimento immediati anche per gli esseri umani.

Combinando il riconoscimento dell’immagine a Google Translate, per esempio, il “traduttore di cose” consente di scoprire il termine straniero che identifica un oggetto semplicemente fotografandolo.

Leggi anche: L’intelligenza artificiale è tra noi