Nieuwe vertaalprogramma Google gebruikt ki

Engels/Nederlands/Fries Google TranslateQuoc Le kent de fratsen van vertaalprogramma’s. Terug in zijn geboorteland Vietnam maakt de onderzoeker van Google in Mountaint View zich met zijn ouders vrolijk over de vertaalstrapatsen van Google Translate, terwijl hij een van de mensen is die het programma tot volwassenheid moet brengen. Veel fouten zijn gering, maar samen vertellen ze een groter verhaal: “Vertalen is geen opgelost probleem.” Het streven is niet om een perfecte vertaling te krijgen maar om ongemak te voorkomen. Dat zou kunnen veranderen met het gebruik van kunstmatige intelligentie (ki) in de jongste versie van het vertaalprogramma.

Quoc is met collega’s bezig aan een nieuw vertaalsysteem dat gigantische hoeveelheden gegevens verwerkt en meer verwerkingscapaciteit heeft, dat  (vooral) gebruik maakt van kunstmatige intelligentie (pdf-bestand) en een zelflerend vermogen heeft. Daarmee zouden de vertaalfouten met 87% worden teruggedrongen (geen 88 of 86?). “Dat demonstreert de kracht van neurale technologie”, zegt informaticus Yoshua Bengio van de universiteit van Montréal, die in het verleden aan het systeem heeft meegewerkt.
Neurale machinevertaling is een laatkomer. Automatisch vertalen is bij Google altijd een grote bak met voorbeeldzinnen geweest. Er zijn wel pogingen in het werk gesteld om vertalen grammaticaal aan te pakken, maar de simpele manier bleek het effectiefst, zij het verre van accuraat.
De neurale vertaalsystemen/netwerken zijn opgezet naar analogie van de werking van de hersens (of althans hoe gedacht wordt dat hersens werken). Ze worden eerst getraind door mensen op feitelijke vertalingen en vervolgens losgelaten op nieuwe teksten. In het verhaal van Science, dat ik hier reproduceer (vertaal), staat dat niet, maar een zelflerend systeem moet wel degelijk gecorrigeerd blijven worden. Uit zichzelf kan dat, althans volgens mij, zich niet zelf verbeteren.
Quoc denkt dat (dan ook?) vertalen meer vereist. “Het kost mij een onderdeel van een seconde om een beeld te herkennen of muziek, maar het kost me meer dan een seconde om een Chinese zin in het Engels te vertalen.” Met voorbeeldzinvertaling is volgens hem een hoop mis. De grammatica klopt vaak niet en woorden worden soms idioot vertaald. “Daarom moeten mensen lachen.”

16 processoren

Het nieuwe vertaalsysteem gebruikt 16 processoren om woorden eerst om te zetten in een waarde: een vector. Wat die vector precies is kan Quoc ook niet vertellen, maar die geeft de relatie van een woord aan met alle andere woorden in het oefenmateriaal (2,5 miljard Engelse en Franse voorbeeldzinnen en een halfmiljard Chinese en Engelse). Hond is, bijvoorbeeld, meer verbonden met kat dan kar en Obama is meer verbonden met Hillary Clinton dan met Vietnam. Met behulp an die vectoren worden er mogelijke vertalingen gemaakt die naar waarschijnlijk gerangschikt worden. Het systeem bevat controles die de accuraatheid moeten vergroten en een mechanisme om de verwerkingssnelheid te vergroten.
Vergeleken bij het vorige systeem van Google Translate is de neurale vertaling vooruitgegaan vinden recensenten. Het zou 58% juister zijn in het vertalen van Engels naar Chinees en 87% beter van Engels naar Spaans. Google is daarom van plan het oude systeem zoetjes aan te vervangen. Het bedrijf is begonnen met Chinees naar Engels. Dat is een lastig paar, maar komt ook omdat veel van Quocs collega’s Chinezen zijn.
“Het is grappig om te zien hoe snel onderzoek in het bedrijfsleven terechtkomt”, zegt informaticus Kyunghyun Cho van de universiteit van New York. “Dat is de kracht van zelflerende systemen en misschien ook de reden dat de bedrijven daar zo veel in investeren.”
Anderen zeggen dat het eerder om een technische dan een wetenschappelijke doorbraak gaat, waarbij veel is opgepikt van de spraak- en zichttechnologie. Overigens worden neurale netwerken al sedert 2010 toegepast bij vertalingen, dus helemaal nagelnieuw is dit niet. Google zou wel de eerste zijn die ki op grote schaal inzet bij vertalen. Quoc is benieuwd wat zijn ouders er van vinden.

Bron: Science

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.