Nieuws Artificial Intelligence

23 september 2022 leestijd 1 minuut 0 reacties

AI-model Whisper herkent, vertaalt, transcribeert audio bijna net zo goed als een mens

OpenAI heeft een nieuw open source AI-model gepubliceerd, genaamd Whisper, dat audio op bijna menselijk niveau kan herkennen en vertalen. Het model kan daardoor interviews, podcasts, gesprekken en meer transcriberen in het Engels, ook als er in een andere taal gesproken wordt, aldus OpenAI.

Eveline Meijer

Eveline MeijerRedacteurMeer van deze auteur

brein computer interface — © Shutterstock

© Shutterstock

Whisper is getraind op 680.000 uur aan audio-data en bijbehorende transcripts in 98 talen, die op het internet verzameld werden, schrijft Ars Technica. Volgens OpenAI leidde dat ertoe dat het model beter kan omgaan met accenten, achtergrondgeluiden en technische taal. Daarnaast maakt dit het mogelijk om in meerdere talen te transcriberen en om de audio naar het Engels te vertalen.

Het nieuwe AI-model breekt hiervoor de audio op in stukken van 30 seconden, die vervolgens in een encoder worden gestopt. De decoder is getraind om het bijbehorende tekstbijschrift te voorspellen. Daarbij worden ook speciale tokens gebruikt waarmee het model taken uit kan voeren als taalidentificatie, meertalige spraaktranscriptie en vertaling naar het Engels.

OpenAI heeft Whisper volledig open source gemaakt, in de hoop dat het een bouwsteen kan worden om spraakverwerking en toegankelijkheidstools te verbeteren. Het AI-model is te vinden op GitHub.

Gerelateerde artikelen

Nieuws Artificial Intelligence

Beeldherkenningsalgoritme OpenAI makkelijk te misleiden

Is het een appel of een pizza?

Nieuws Artificial Intelligence

Code 'inspreken' dankzij AI

AI-taalmodel zet Engelse spraak om in softwarecode.

Nieuws Artificial Intelligence

AI-taalmodel GPT-3 ook waardevolle toevoeging voor security

Neuraal netwerk maakt zoeken naar dreigingen gemakkelijker.

Gerelateerde artikelen

Beeldherkenningsalgoritme OpenAI makkelijk te misleiden

Nieuws Artificial Intelligence

Beeldherkenningsalgoritme OpenAI makkelijk te misleiden

Is het een appel of een pizza?

Code 'inspreken' dankzij AI

Nieuws Artificial Intelligence

Code 'inspreken' dankzij AI

AI-taalmodel zet Engelse spraak om in softwarecode.

AI-taalmodel GPT-3 ook waardevolle toevoeging voor security

Nieuws Artificial Intelligence

AI-taalmodel GPT-3 ook waardevolle toevoeging voor security

Neuraal netwerk maakt zoeken naar dreigingen gemakkelijker.

Gerelateerde artikelen

Achtergrond Werkplektransformatie Partner

De werkplektransformatie van Zuyderland: een cloud-tenzij strategie

Zuyderland transformeert haar digitale werkplek binnen een cloud-first strategie. Irene To vertelt hoe zij dit aan hebben gepakt.

Achtergrond CIO Onderzoek Partner

Nederlandse CIO’s waarderen Sogeti opnieuw hoog in Whitelane Research IT Sourcing onderzoek 2026

Nieuwste editie van het jaarlijkse Whitelane Research IT Sourcing onderzoek 2026.

Meer whitepapers

Whitepaper Artificial Intelligence Partner

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Security Partner

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

De samenvoegingen van IT en fysieke beveiliging begon jaren geleden, maar hoe staat het er nu voor met deze ontwikkeling?

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee