Nieuws Leiderschap

26 oktober 2016 leestijd 1 minuut 0 reacties

Microsoft laat computer haast perfect luisteren

Als een mens luistert, wordt de tekst ook niet altijd even goed verstaan, afhankelijk van de manier waarop de spreker articuleert. In elk geval is hier sprake van een grote doorbraak, want luisterende computers hadden altijd een knullig imago. Een team van Microsoft Research in Redmond heeft zelflerende algoritmes bedacht, die spraak feilloos kunnen interpreteren.

Richard Keijzer

Richard KeijzerMeer van deze auteur

Een team onder leiding van Geoff Zweig heeft voortgeborduurd op een lange technologische ontwikkeling. Al vanaf de jaren 50 wordt geprobeerd om computers de menselijke stem te laten verstaan. Haast even lang wordt gewerkt aan de spraaksynthese, maar dat onderwerp lijkt een stuk makkelijker te zijn. Computerspraak, die in het begin blikkerig en robot-achtig klonk, is tegenwoordig nauwelijks nog van echte spraak te onderscheiden.

Geen beperking

Eerdere systemen voor spraakherkenning werkten in een zogeheten 'beperkte probleemruimte', wat wilde zeggen dat ze geschikt waren voor één enkele persoon (na veel trainingsuren) of voor een klein onderwerpje zoals het weerbericht. En dan nog waren die systemen niet echt robuust. Als een gebruiker vaak woordjes als "eeeh" gebruikte of een hoestbui kreeg, waren de resultaten niet te voorzien. Bij een van de herkennende systemen leidde het schrapen van de keel steevast tot het woordje "jurk".

Het systeem dat Microsoft nu heeft ontwikkeld is bruikbaar voor vrijwel elke tekst en vrijwel elke spreker. Ook tussenwerpsels en kuchen zijn geen probleem meer, zeggen de ontwikkelaars. Er is gebruik gemaakt van een verzameling gesproken woorden die in 2000 is vrijgegeven door het National Institute of Standards and Technology (Nist). Ontwikkelaars van spraakherkenningssystemen konden met die verzameling hun techniek testen.

De mens voorbij

Een absoluut perfect luisterende computer is er niet, maar dat geldt ook voor de mens. Over het algemeen hebben mensen een foutmarge van 4 procent, wat wil zeggen dat ze van elke 100 woorden er 4 verkeerd verstaan. Het team van Microsoft heeft dat voor hun systeem weten te verbeteren. Met dien verstande dat ze zijn uitgegaan van een eigen meting van de fouten. Daaruit bleek dat een professioneel transcriptiebureau 5,9 woorden van de 100 verkeerd had. Als het ging om een conversatie tussen twee vrinden was dat zelfs 11,3 procent. Meer informatie staat hier.

Gerelateerde artikelen

Google geeft spraakherkenning vrij

De ingang naar Google Speech Recognition wordt geregeld via een API, die onder de naam Google Cloud Speech API beschikbaar wordt gesteld.

Achtergrond Toepassingen PRO

Spraakinterface komt tot wasdom: de app is gezien

De spraakinterface wordt in snel tempo volwassen, en dat krijgt ingrijpende gevolgen.

Nieuws Netwerken

Google weet spraakherkenning flink te verbeteren

Google doet in een blog uit de doeken hoe het verantwoordelijk team de verbetering heeft kunnen bereiken.

Gerelateerde artikelen

Google geeft spraakherkenning vrij

Google geeft spraakherkenning vrij

De ingang naar Google Speech Recognition wordt geregeld via een API, die onder de naam Google Cloud Speech API beschikbaar wordt gesteld.

Spraakinterface komt tot wasdom: de app is gezien

Achtergrond Toepassingen PRO

Spraakinterface komt tot wasdom: de app is gezien

De spraakinterface wordt in snel tempo volwassen, en dat krijgt ingrijpende gevolgen.

Google weet spraakherkenning flink te verbeteren

Nieuws Netwerken

Google weet spraakherkenning flink te verbeteren

Google doet in een blog uit de doeken hoe het verantwoordelijk team de verbetering heeft kunnen bereiken.

Gerelateerde artikelen

Blog AI Partner

AI in het bedrijfsleven: strategisch wapen of veiligheidsrisico?

Neem even de tijd om te bedenken hoeveel AI-systemen je op een doorsnee dag tegenkomt. Wat is de keerzijde van de medaille?

Achtergrond malware Partner

FakeUpdates populairste malware wereldwijd en in Nederland

Cybercriminelen gebruiken eenvoudige malware steeds geavanceerder, acties moeilijker te onderscheiden van actoren met politieke motieven

Achtergrond App-v Partner

Van langdurige App-V packaging naar 'next-next-finish' – Een praktijkcase

App-V gaat verdwijnen. Deze Britse gemeente vond een sneller, eenvoudiger alternatief met FlexApp – zónder alles opnieuw te packagen.

Meer whitepapers

Whitepaper Artificial Intelligence Partner

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Security Partner

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

De samenvoegingen van IT en fysieke beveiliging begon jaren geleden, maar hoe staat het er nu voor met deze ontwikkeling?

Whitepaper Marketing Partner

High impact business stories creëren

De route naar de zakelijke beslisser.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee