Innovatie & Strategie

Software-ontwikkeling
Pixel 2 AI

Google deelt beeldherkennings-AI als open source

Technologie groepeert beeldelementen naar betekenis.

© CC BY 2.0 ,  Scott Akerman
15 maart 2018

Technologie groepeert beeldelementen naar betekenis.

Google maakt software beschikbaar als open source die vergelijkbaar is met de AI achter zijn imposante 'Portrait Mode' in de Pixel 2-smartphones.

Portrait Mode is bedoeld om de geringe scherptediepte na te bootsen die door fotografen gebruikt wordt bij portretfoto's; de onscherpe achtergrond leidt dan niet af van het onderwerp. Daarvoor is nodig dat de kunstmatige intelligentie achter de functie kan detecteren wat het onderwerp is, en waar het ophoudt. Andere smartphonefabrikanten hebben bijvoorbeeld een tweede camera aan het toestel meegegeven om hetzelfde effect, dat in fotografiekringen bekend staat als bokeh, te bereiken. Google kondigde maandag aan de achterliggende technologie te zullen delen in de TensorFlow-bibliotheek.

Semantic image segmentation

Google noemt de technologie die het op Github deelt als DeepLab-v3+ 'semantic image segmentation', wat erop neerkomt dat aan iedere pixel in beeld wordt toegewezen waar die bij hoort: de lucht, een huis, een hond, achtergrondrommel. Met die informatie kan kunstmatig bokeh aan een foto worden toegevoegd, en kunnen voor- en achtergrond worden gescheiden in een video. Gebruikers van Youtube 'stories' kunnen zo effecten bereiken die voorheen een blauw scherm vereisten.

Uiteraard zullen app-makers zich storten op de mogelijkheden van de nu vrijgegeven (server)software, maar Google hoopt dat ook wetenschappers en anderen gebruik gaan maken van de mogelijkheden tot object detection, en er nieuwe toepassingen voor weten te verzinnen.

Semantische segmentatie van beeld geniet al jaren aandacht van wetenschappelijke onderzoekers, zoals aan de University of Cambridge:

 

 

Lees meer over
Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.