Innovatie & Strategie

Artificial Intelligence
Kunstmatige intelligentie

AI-model Whisper herkent, vertaalt, transcribeert audio bijna net zo goed als een mens

Whisper transcribeert interviews, podcasts, gesprekken en meer.

© Shutterstock vs148
23 september 2022

Whisper transcribeert interviews, podcasts, gesprekken en meer.

OpenAI heeft een nieuw open source AI-model gepubliceerd, genaamd Whisper, dat audio op bijna menselijk niveau kan herkennen en vertalen. Het model kan daardoor interviews, podcasts, gesprekken en meer transcriberen in het Engels, ook als er in een andere taal gesproken wordt, aldus OpenAI. 

Whisper is getraind op 680.000 uur aan audio-data en bijbehorende transcripts in 98 talen, die op het internet verzameld werden, schrijft Ars Technica. Volgens OpenAI leidde dat ertoe dat het model beter kan omgaan met accenten, achtergrondgeluiden en technische taal. Daarnaast maakt dit het mogelijk om in meerdere talen te transcriberen en om de audio naar het Engels te vertalen.

Het nieuwe AI-model breekt hiervoor de audio op in stukken van 30 seconden, die vervolgens in een encoder worden gestopt. De decoder is getraind om het bijbehorende tekstbijschrift te voorspellen. Daarbij worden ook speciale tokens gebruikt waarmee het model taken uit kan voeren als taalidentificatie, meertalige spraaktranscriptie en vertaling naar het Engels. 

OpenAI heeft Whisper volledig open source gemaakt, in de hoop dat het een bouwsteen kan worden om spraakverwerking en toegankelijkheidstools te verbeteren. Het AI-model is te vinden op GitHub

2
Reacties
Jasper Bakker 23 september 2022 20:44

@Harry
In dit geval ontbrak er een komma (of een 'en', zonder het werkwoord transcriberen in de kop). Van een d/t-fout is hier echter geen sprake; het (nieuwe) AI-model herkent, het vertaalt.

Mvg,
Jasper Bakker
AG Connect

Harry Oldinkhof 23 september 2022 15:01

De D's en T's blijven lastig in het Nederlands.... "herkent vertaald"

Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.