Innovatie & Strategie

Wetenschap
Kunstmatige Intelligentie

Neurale software belooft betere vertaling

© CC BY 2.0 - Flickr.com Gwydion M. Williams
27 oktober 2014
Onderzoekers van de Universiteit van Amsterdam zijn er in geslaagd neurale netwerken te gebruiken om grammaticale kennis en informatie productief te maken voor softwarematig vertalen.

Grammaticale kennis is voor menselijke vertalers, na woordkennis, een van de belangrijkste factoren in hun vermogen om te vertalen. En het is precies het ontbreken van die grammaticale kennis waardoor softwarematige vertalingen, zoals die van Google Translator of itranslate4.eu telkens weer zo belabberd uitpakken.

Dat probleem wordt met name voelbaar als de vertaling van een grammaticaal eenvoudige taal zoals Nederlands of Engels naar een grammaticaal complexere taal zoals Frans of Duits verloopt. De onderzoekers noemen als voorbeeld de Nederlands woordgroep ‘de man’. Daarvoor kent het morfologisch rijkere Duits de vormen ‘der Mann’, ‘des Mannes’, ‘dem Mann’ en ‘den Mann’. De juiste vorm hangt af van de grammaticale functie van het woord in de zin. Een mens onderkent die grammaticale functie haast onwillekeurig, maar een computer heeft er grote moeite mee. Complexe grammaticale regels inprogrammeren is een optie, maar het kennisintensief en zeer tijdrovend. De UvA-onderzoekers Ke Tran, Arianna Bisazza en Christof Monz hebben nu laten zien dat die lastige grammaticale analyse ook kan worden uitgevoerd door kunstmatige neurale netwerken.

NWO Vidi-project

"De nieuwe aan de UvA ontwikkelde methode maakt gebruik van kunstmatige neurale netwerken, modellen waarbij het menselijk brein wordt nagebootst in een computer. Waar voorgaande vertaalsystemen veelal de meest voorkomende woordvormen kiezen, kiest de nieuwe methode de juiste woordvorm door de zinsopbouw in de brontaal te analyseren. Het neurale netwerk is in staat zelf grammaticale functies van woorden af te leiden, zonder dat het expliciete kennis van grammatica heeft", stelt onderzoeker Ke Tran.
Het onderzoek wordt uitgevoerd onder leiding van Christof Monz binnen het NWO Vidi-project `Surface Realization in Statistical Machine Translation'. Tran, Bisazza en Monz presenteerden hun bevindingen tijdens de 2014 Conference on Empirical Methods in Natural Language Processing.
 

Lees meer over
Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.