Nieuws Artificial Intelligence Arbeidsmarkt

31 oktober 2025 leestijd 2 minuten 0 reacties

Onderzoek: AI-agents kunnen slechts 3 procent van het freelancerwerk vervangen

AI wordt vaak gepresenteerd als vervanger van kantoorwerk, maar de Remote Labor Index van Scale AI en het Center for AI Safety, toont een ander beeld. In tests met echte online klussen wist de beste AI‑agent minder dan 3 procent van het werk af te ronden.

Redactie AG Connect Meer van deze auteur

De onderzoekers van Scale AI en het Center for AI Safety (CAIS), die zich beide bezighouden met het in kaart brengen van het kunnen van AI, bedachten een nieuwe testmethode waarmee het inzichtelijk werd wat AI-agents nu daadwerkelijk kunnen, meldt Wired.

Om het onderzoek zo realistisch mogelijk te houden, namen de onderzoekers de bekendste AI-agents en gaven ze opdrachten die linea recta uit de praktijk kwamen. Deze omvatten via Upwork (een platform waar freelancers opdrachten kunnen vinden) verzamelde klussen zoals opdrachten voor grafisch ontwerp, video‑bewerking, game‑ontwikkeling en simpele administratie zoals data verzamelen.

Elke taak had een duidelijke briefing, de juiste bestanden en een voorbeeld van het gewenste eindresultaat. Toch stokte het zodra meerdere stappen nodig waren of tools gecombineerd moesten worden.

Zelfs de beste AI-agent presteerde slecht

De ranglijst is opmerkelijk. Manus, van een Chinese startup, presteerde het best en kon slechts drie procent van de voorgeschoteld taken met succes afronden. Daarna volgden Grok (xAI), Claude (Anthropic), ChatGPT (OpenAI) en Gemini (Google). In totaal verdienden de agents 1.810 dollar van een mogelijke 143.991 dollar. Dat verraadt hoe beperkt de zelfstandige inzetbaarheid van deze systemen nog is.

De uitkomst is voor mensen met enige kennis van AI wellicht niet zo verrassend. Dan Hendrycks, directeur van CAIS, verklaart waarom de bots volgens hem de verwachtingen niet waar kunnen maken. Hij stelt dat AI-modellen beter zijn geworden in programmeren, wiskunde en logica, maar dat nog twee essentiële dingen missen om menselijk werk te kunnen verzetten: lange termijn geheugen en leren op basis van ervaring. Zonder die basis valt een klus met veel stappen uiteen in losse acties. De agent weet wat stap één is, maar verliest het doel van stap tien uit het oog.

Gat tussen belofte en realiteit

De uitkomst van het onderzoek toont een groot contrast met grote claims die vooral CEO's van AI-bedrijven doen. Zo suggereerde bijvoorbeeld Dario Amodai, CEO van Anthropic, onlangs dat 90 procent van programmeerwerk binnen maanden te automatiseren is. Ook waren er vergelijkbare voorspellingen over snelle vervanging van onder andere radiologen.

OpenAI probeerde zelf de claims te bewijzen en presenteerde in september GDPval, een meetlat die stelt dat nieuwe modellen richting menselijk niveau bewegen op honderden kantoortaken.

Ondertussen is geen perfecte maatstaf die alle economische effecten vangt. In de praktijk gebruiken freelancers AI vooral als hulpmiddel om productiviteit te verhogen, niet als zelfstandige vervanger. Dat maakt de inzet van AI contextafhankelijk.

AI-ontslagen worden stilletjes teruggedraaid en opnieuw aangenomen tegen lagere lonen

Bedrijven die uit naam van AI mensen ontslaan zullen de rollen opnieuw gaan vervullen, maar tegen lagere lonen, voorspelt Forrester.

2 min

Nieuws Klant is koning

AI-bots gaan er vanuit dat de gebruiker gelijk heeft, blijkt uit onderzoek

Dat slijmerige gedrag van AI-chatbots voor problemen zorgt, wisten we. Maar het liegen gaat nog verder om de gebruiker te vriend te houden.

2 min

Achtergrond AI-workslop

Werknemers die 'AI-workslop' creëren, zijn het nieuwe probleem voor bedrijven die AI inzetten

Veel werknemers geven toe ze de afgelopen maand AI‑gegenereerde, inhoudsarme stukken in hun werk tegenkwamen.

2 min 1

Nieuws Arbeidsproductiviteit

AI laat medewerkers langer werken

AI maakt ons niet alleen productiever, maar ook drukker — met langere werkdagen en minder tijd voor herstel.

1 min

AI-ontslagen worden stilletjes teruggedraaid en opnieuw aangenomen tegen lagere lonen

Bedrijven die uit naam van AI mensen ontslaan zullen de rollen opnieuw gaan vervullen, maar tegen lagere lonen, voorspelt Forrester.

2 min

Nieuws Klant is koning

AI-bots gaan er vanuit dat de gebruiker gelijk heeft, blijkt uit onderzoek

Dat slijmerige gedrag van AI-chatbots voor problemen zorgt, wisten we. Maar het liegen gaat nog verder om de gebruiker te vriend te houden.

2 min

Achtergrond AI-workslop

Werknemers die 'AI-workslop' creëren, zijn het nieuwe probleem voor bedrijven die AI inzetten

Veel werknemers geven toe ze de afgelopen maand AI‑gegenereerde, inhoudsarme stukken in hun werk tegenkwamen.

2 min 1

Nieuws Arbeidsproductiviteit

AI laat medewerkers langer werken

AI maakt ons niet alleen productiever, maar ook drukker — met langere werkdagen en minder tijd voor herstel.

1 min

Grip op je digitale afhankelijkheden: waar sta jij vandaag?

Is jouw organisatie voldoende voorbereid is op verstoringen in de keten?

2 min

Meer whitepapers

Whitepaper Security Partner

NIS 2-richtlijn uitgelegd: een uitgebreide gids voor compliance

Ben je compliant met de NIS 2-richtlijn? Hier vind je een uitgebreide gids over de NIS 2-richtlijn die je helpt dit te realiseren.

Whitepaper Netwerken Partner

Van traditioneel netwerkbeheer naar AI aangestuurde infrastructuur

Ontdek hoe self-driving netwerken zorgen voor controle, eenvoud en toekomstbestendigheid.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Onderzoek: AI-agents kunnen slechts 3 procent van het freelancerwerk vervangen

Zelfs de beste AI-agent presteerde slecht

Gat tussen belofte en realiteit

AI-ontslagen worden stilletjes teruggedraaid en opnieuw aangenomen tegen lagere lonen

AI-bots gaan er vanuit dat de gebruiker gelijk heeft, blijkt uit onderzoek

Werknemers die 'AI-workslop' creëren, zijn het nieuwe probleem voor bedrijven die AI inzetten

AI laat medewerkers langer werken

AI-ontslagen worden stilletjes teruggedraaid en opnieuw aangenomen tegen lagere lonen

AI-bots gaan er vanuit dat de gebruiker gelijk heeft, blijkt uit onderzoek

Werknemers die 'AI-workslop' creëren, zijn het nieuwe probleem voor bedrijven die AI inzetten

AI laat medewerkers langer werken

Grip op je digitale afhankelijkheden: waar sta jij vandaag?

NIS 2-richtlijn uitgelegd: een uitgebreide gids voor compliance

Van traditioneel netwerkbeheer naar AI aangestuurde infrastructuur

Reacties

Bevestig jouw e-mailadres

Er is iets mis gegaan

Maak een gratis account aan en geniet van alle voordelen:

Maak een gratis account aan en geniet van alle voordelen:

Onderzoek: AI-agents kunnen slechts 3 procent van het freelancerwerk vervangen

Zelfs de beste AI-agent presteerde slecht﻿

Gat tussen belofte en realiteit﻿

AI-ontslagen worden stilletjes teruggedraaid en opnieuw aangenomen tegen lagere lonen

AI-bots gaan er vanuit dat de gebruiker gelijk heeft, blijkt uit onderzoek

Werknemers die 'AI-workslop' creëren, zijn het nieuwe probleem voor bedrijven die AI inzetten

AI laat medewerkers langer werken

AI-ontslagen worden stilletjes teruggedraaid en opnieuw aangenomen tegen lagere lonen

AI-bots gaan er vanuit dat de gebruiker gelijk heeft, blijkt uit onderzoek

Werknemers die 'AI-workslop' creëren, zijn het nieuwe probleem voor bedrijven die AI inzetten

AI laat medewerkers langer werken

Grip op je digitale afhankelijkheden: waar sta jij vandaag?

NIS 2-richtlijn uitgelegd: een uitgebreide gids voor compliance

Van traditioneel netwerkbeheer naar AI aangestuurde infrastructuur

Reacties

Zelfs de beste AI-agent presteerde slecht

Gat tussen belofte en realiteit