De AI-agent moet zich snel bewijzen

Het tijdperk van de AI-agent lijkt nu echt aangebroken. OpenAI lanceerde vorige week ChatGPT Agent voor betalende, Amerikaanse gebruikers (wanneer we in de EU toegang krijgen is een groot vraagteken), en dat betekent dat de Agentic AI over niet al te lange tijd gemeengoed zal zijn, tenminste, als de technologie zich snel weet te bewijzen.

Dennis Wilman Redacteur Meer van deze auteur

Het feest kan beginnen, want de AI-agent is binnen. Of eigenlijk staat hij nog voor de deur. Hij heeft nog wat moeite om de deurknop te vinden en uit te zoeken hoe de deur open moet. Geef het nog een half uurtje, dan lukt het hem vast wel.

Het is het meest gehoorde euvel van de AI-agents die we tot nu toe voorbij hebben zien komen: ze zijn soms traag van begrip en boven alles ongehoord traag. Een eenvoudige taak die jij in drie minuten vervult kan ChatGPT agent 20 minuten bezighouden, blijkt uit meerdere gebruikservaringen die sinds de lancering van de nieuwe AI-tool te lezen zijn.

En dat is als de agent in kwestie de taak kan uitvoeren. Het surfen op het internet en uitvinden hoe websites werken of gebruikmaken van meerdere apps, is voor mensen al af en toe een ongekende uitdaging (bestaat er iemand die begrijpt hoe Spotify werkt?). Verwachten dat een AI met de intelligentie van een huiskat dat wel kan, is wellicht ietwat optimistisch te noemen.

Toch zijn het juist die twee euvels die de nieuwe Agentic AI's moeten overkomen als ze hun gebruikers te vriend willen houden. Op het begin is het nog acceptabel dat ChatGPT Agent na een half uur met lachwekkend resultaat aankomt, maar drie of vier keer hetzelfde meegemaakt te hebben, vraag je hem niks meer.

We hebben deze curve al heel veel vaker gezien. Zo hoorde ik dit weekend iemand in een podcast vragen: "heb jij Sora de afgelopen maanden nog wel eens gebruikt?". Daarop was het antwoord dat de AI-videocreatietool al lang en breed vergeten was. Na de lancering vol prachtige beloftes, bleek dat Sora helemaal niet aan die beloftes kon voldoen. Video's creëren duurde erg lang en de resultaten waren niet veel beter dan ronduit slecht te noemen.

Hoewel dat volledig werd verwacht door de initiële gebruikers, ontwikkelde de tool zich niet snel genoeg om gebruikers aan het lijntje te houden. Het lukte OpenAI niet om aan te tonen dat de toekomst met Sora echt veel mooier was dan zonder Sora. Gebruikers haakten af. Het probleem hierbij is dat juist deze mensen, doordat ze door hun negatieve ervaring extra sceptisch zijn, extreem moeilijk terug te winnen zijn. Ze stappen daardoor wellicht zelfs nog makkelijker over naar de concurrent, zoals VEO3 van Google.

Ik probeer hier niet bij voorbaat al te claimen dat ChatGPT Agent en Claude Computer Use en dergelijke gedoemd zijn om te falen. Wat ik wel denk is dat ze wellicht iets te vroeg op de markt gekomen zijn. Het zijn overduidelijk nog 'Minimum Viable Products', waarbij we dus mogen verwachten dat ze niet alles even goed kunnen als dat de makers claimen. Iets wat in het geval van dit soort AI-agents een enorme uitdaging is om te verbeteren, aangezien ze juiste interactie moeten hebben met wellicht het meest chaotische op de planeet: het internet.

Er valt met geen mogelijkheid te bepalen waar mensen een AI-agent voor gaan gebruiken, welke websites de bot hiervoor gaat bezoeken, hoe die interactie met die website is, hoe de website technisch in elkaar zit en welke problemen dit kan veroorzaken, wat het gevolg van deze interactie op de AI gaat zijn en hoe hij hier vervolgens me omgaat naar de gebruiker. Je kunt je dus wel voorstellen dat safety guardrails niet voldoende zijn.

Nu vangt OpenAI dit relatief slim af door de Agent in een virtuele, afgekaderde machine te draaien. Eventuele problemen die de bot dan veroorzaakt op het apparaat kunnen hierdoor beperkt blijven tot wat scheve software die zonder gevolgen verwijderd kan worden. Tegelijk hindert deze aanpak ook de gebruikstoepassing, aangezien er geen interactie kan plaatsvinden met lokale bestanden, instellingen of andere dingen waar de gebruiker dagelijks mee omgaat.

De manier waarop de AI-agents nu in de markt gezet worden, zijn vooral een voorproefje van wat er allemaal moet gaan komen. Je moet hiervoor erg leunen op het AI-credo: "dit is het slechtste wat het ooit gaat zijn", want het is uiteindelijk de belofte dat we allemaal onze persoonlijke AI-assistent hebben.

Dat maakt dat we vanaf nu grote stappen verwachten. Dat de ontwikkeling snel gaat van het binnen een half uur vinden en hopelijk goed kunnen reserveren bij een restaurant, tot het kunnen assisteren bij letterlijk alles in mijn leven zonder dat ik daar zelf aan hoef te denken, laat staan dat ik me zorgen hoef te maken over het feit of alles wel of niet goed gedaan wordt.

Helaas lijkt het er nu op dat het laatste (en belangrijkste) nooit gaat lukken...