Innovatie & Strategie

Apps
Mama Appelsap

Mama Appelsap

Voice encoding heeft neveneffecten waardoor het zorgt voor entertainment.

© Apple
20 februari 2018

‘Doe wel en zie niet om’. Napoleon leerde dat uitspreken door op te lezen: d'ou elle ainsi ni d'homme. Dit betekent iets totaal anders, maar het klinkt als een Mama Appelsapje, maar dan niet per ongeluk.

Tegenwoordig is vertalen gemakkelijker: er is Google Translate en YouTube-ondertiteling. Hoewel de kwaliteit matig is, is het oneindig veel beter dan mijn Chinees. YouTube's foneem-grafeemconvertor genereert vanuit stemgeluid automatisch de ondertiteling in een andere taal. Wie had dat kunnen denken!

Een kennis mailde me een Chinese YouTube over de sidespin-servetechniek van Fan Zhendong. Hij is niet alleen een pingpongfanaat maar ook informaticus, en zag direct dat de ondertiteling structureel misgaat. Oorzaak: de inputtaal staat op Nederlands en niet op Chinees. De convertor verwacht dus Nederlands te horen en perst uit het Chinees verse Mama Appelsap: chihuahua horloge, scheuren in het journaal, walnoot huisvader, oortelefoon natuur. Juweeltjes regent het uit deze Mama-Appelsapgenerator: als er iets in te horen valt, dan vindt de software van YouTube dat voor je!

Doet men tegenwoordig heel veel moeite om spraak te begrijpen, of identificatie via voice biometrics, vroeger was dat omgekeerd. Met voice encoders werkte men aan datacompressie om bandbreedte te besparen. En om stemencryptie te realiseren. Tijdens WWII was de vraag naar beveiligde communicatie enorm. Telefoongesprekken via de ether konden door iedereen onderschept worden. Niet handig als Roosevelt en Churchill telefoneren over D-day.

‘Ciphered telephony’ heet dat vak, of verkort ‘ciphony’. De eerste digitale ciphone werd begin 1940 ontwikkeld, kostte een miljoen dollar en woog 50.000 kilo. Eén stond in het Pentagon en één onder een luxe warenhuis in Londen (later volgden er meer). Zo spraken Roosevelt en Churchill elkaar dus. Men gebruikte ‘one-time pad encryption’. De stem werd gecombineerd met random noise op een langspeelplaat. Die werd synchroon gedraaid op beide locaties om te crypten en decrypten. De platen werden na het gesprek vernietigd, en daarmee was het systeem unhackable. Alan Turing zelf heeft nog naar de machinerie gekeken of de beveiliging goed genoeg was.

Darth Vader is de bekendste vocoderstem

Een neveneffect van voice encoding was dat de stem werd vervormd. Dave Tompkins heeft een erg leuk boek geschreven over deze ‘vocoders’. Daarin schetst hij hoe ciphony voor militaire doeleinden door de entertainmentindustrie is opgepakt. Stemmen worden via vocoders door musici en filmmakers vervormd om muzikale en filmische effecten te bereiken. Darth Vader is de bekendste vocoderstem. De Top 2000 zit er vol mee: van Kraftwerk tot Phil Collins, van ELO tot Daft Punk. Vocoders waar je net zo hard op moet studeren als op een klassiek instrument.

In al onze mobieltjes zitten vocoders om de sample rate van de gedigitaliseerde spraak te reduceren om, net als destijds, bandbreedte te sparen. De output is nu een stuk beter, dus niemand merkt ze op. Maar als je wilt horen hoe dat klonk, zijn er talloze vocoder-apps te downloaden. Ik pleit voor een Mama-Appelsapgenerator voor de ondertiteling van je telefoongesprekken. 

Just for fun.

Reactie toevoegen