Nieuws Artificial Intelligence

16 april 2020 leestijd 2 minuten 0 reacties

Google laat robot tegelijk handelen en leren

Robots die reageren op hun omgeving, hebben in hun handelen vaak iets houterigs. Dat is het gevolg van de vaste volgorde van observeren - denken - handelen, waarmee robots hun acties voorbereiden. Door de besluitvorming over de volgende stap te starten terwijl de vorige handeling wordt ingezet, krijg je veel soepeler, maar ook minder foutgevoelige bewegingen.

Thijs DoorenboschMeer van deze auteur

robothand — © CC0 - Unsplash.com

CC0 - Unsplash.com

Onderzoekers van Google Brain, Google X en de University of California Berkeley beschrijven hun nieuwe aanpak in een wetenschappelijk artikel (pdf) op Arxiv.org. De methode werkt in principe voor verschillende vormen van kunstmatige intelligentie - een agent - , maar is het best zichtbaar bij het handelen van robots.

De aanpak die zij beschrijven, lijkt veel meer op de manier waarop het menselijk brein werkt. De hersenen krijgen een permanente stroom aan input van sensoren zoals ogen, oren, neus en huid en passen voortdurend hun acties aan op de laatst beschikbare informatie. Zelflerende systemen daarentegen gebruiken een vaste volgorde waarbij ze de input verwerken, de beste reactie berekenen en die vervolgens uitvoeren. Het systeem gaat er dan van uit dat de omgeving niet verandert, nadat de input is verzameld.

In veel gevallen gaat dat goed, vooral in gesimuleerde omgevingen. Maar veel minder vaak in de reële wereld die veel meer aan verandering onderhevig is. Met de nieuwe aanpak kan nieuwe informatie er voor zorgen dat een actie die is ingezet, wordt gecorrigeerd of zelfs stopt.

Onderstaande video illustreert het effect heel goed:

De aanpak gaat uit van standaard reinforcement learning methoden die een agent naar een doel leiden met behulp van beloningen. De agent krijgt een status uit een serie beschikbare statussen en kiest op basis van een beleid een actie uit een serie beschikbare acties. Vanuit de veranderende omgeving komt de volgende status door en volgt een beloning, zodat de agent aanleert uit elke status het maximaal haalbare te krijgen.

Daaraan hebben de wetenschappers twee nieuwe eigenschappen aan toegevoegd om tot hun 'concurrent knowlegde' te komen, namelijk action selection time en vector-to-go. Vector to go is de laatste actie die wordt uitgevoerd op het moment dat de status van de omgeving opnieuw wordt bepaald.

Zo kan de agent een nieuwe status doorkrijgen tijdens het uitvoeren van de eerste actie. Het beleid selecteert daarop een nieuwe actie ongeacht of de voorgaande actie is afgerond. Daardoor kan de voorgaande actie worden gestopt of bijgestuurd.

Robot werkt sneller en vloeiender

Experimenten met de nieuwe aanpak waarbij een robotarm objecten moet oppakken, wijzen uit dat de snelheidswinst wel kan oplopen tot 49 procent. Bovendien waren de bewegingen veel vloeiender.

De onderzoekers zien veel toepassingen van hun aanpak bijvoorbeeld bij het ontwerpen van algoritmen voor zelfsturende auto's.

Lees ook:

Duiding van dit nieuws door AI-experts van de UvA en de VU in 'Pepper gaat geen bal vangen'

'Pepper-robot gaat geen bal vangen'

Systemen die gelijktijdig handelen en leren zijn een belofte voor de toekomst.

3 min

Achtergrond Development PRO

Zelfsturende auto doet veel te moeilijk

Met alleen een doorsnee GPS-systeem en machine learning leert de auto te rijden als een mens.

3 min

Nieuws Privacy

'Ook risico's aan kunstmatige intelligentie'

Financiële autoriteiten waarschuwen voor gebruik AI vanwege mogelijke nadelige gevolgen voor ethiek en vertrouwen.

1 min

'Pepper-robot gaat geen bal vangen'

Systemen die gelijktijdig handelen en leren zijn een belofte voor de toekomst.

3 min

Achtergrond Development PRO

Zelfsturende auto doet veel te moeilijk

Met alleen een doorsnee GPS-systeem en machine learning leert de auto te rijden als een mens.

3 min

Nieuws Privacy

'Ook risico's aan kunstmatige intelligentie'

Financiële autoriteiten waarschuwen voor gebruik AI vanwege mogelijke nadelige gevolgen voor ethiek en vertrouwen.

1 min

Cybercriminelen misbruiken enquêtetool Europese Commissie om inloggegevens te stelen

Onderzoekers van KnowBe4 hebben een phishingcampagne ontdekt waarbij aanvallers de online enquêtetool EUSurvey misbruikten.

2 min

Achtergrond App-v Partner

Van langdurige App-V packaging naar 'next-next-finish' – Een praktijkcase

App-V gaat verdwijnen. Deze Britse gemeente vond een sneller, eenvoudiger alternatief met FlexApp – zónder alles opnieuw te packagen.

3 min

Blog AI Partner

AI in het bedrijfsleven: strategisch wapen of veiligheidsrisico?

Neem even de tijd om te bedenken hoeveel AI-systemen je op een doorsnee dag tegenkomt. Wat is de keerzijde van de medaille?

3 min

Meer whitepapers

Whitepaper Artificial Intelligence Partner

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Security Partner

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

De samenvoegingen van IT en fysieke beveiliging begon jaren geleden, maar hoe staat het er nu voor met deze ontwikkeling?

Whitepaper Marketing Partner

High impact business stories creëren

De route naar de zakelijke beslisser.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Google laat robot tegelijk handelen en leren

Robot werkt sneller en vloeiender

Lees ook:

'Pepper-robot gaat geen bal vangen'

Zelfsturende auto doet veel te moeilijk

'Ook risico's aan kunstmatige intelligentie'

'Pepper-robot gaat geen bal vangen'

Zelfsturende auto doet veel te moeilijk

'Ook risico's aan kunstmatige intelligentie'

Cybercriminelen misbruiken enquêtetool Europese Commissie om inloggegevens te stelen

Van langdurige App-V packaging naar 'next-next-finish' – Een praktijkcase

AI in het bedrijfsleven: strategisch wapen of veiligheidsrisico?

The challenge of information asymmetry

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

High impact business stories creëren

Reacties

Bevestig jouw e-mailadres

Er is iets mis gegaan

Maak een gratis account aan en geniet van alle voordelen:

Maak een gratis account aan en geniet van alle voordelen: