Nieuws Artificial Intelligence

21 maart 2023 leestijd 2 minuten 0 reacties

Onderzoek naar missers van tekstrobots gaat mis op de missers

Na korte tijd moesten onderzoekers van Stanford University een demo-site van hun open source natuurlijk taalmodel Apalca weer offline halen. Ze wilden met de site onderzoeken waarom de nu populaire Large Language Models (LLM) zoals GPT zo makkelijk de fout ingaan met ongepaste taal en feitelijke onjuistheden. Volgens de onderzoekers waren er zorgen over de veiligheid en de kosten voor hosting van de site.

Thijs Doorenbosch

Thijs DoorenboschMeer van deze auteur

ashamed — © Shutterstock

Shutterstock

Het ging om onderzoek met medewerking van Meta - moederbedrijf van onder meer Facebook - dat ook erg graag wil weten waarom deze vorm van kunstmatige intelligentie zo foutgevoelig is. Meta wilde daarvoor wel de code van zijn LLaMa-systeem delen met een geselecteerde groep onderzoekers, meldt The Register. Maar het was niet erg praktisch om de onderzoekers te laten werken met het volledige LLaMa-model met enkele tientallen tot honderden miljarden parameters, aangezien dat de inzet van een enorme infrastructuur betekent.

De onderzoekers hebben daarom een afgeleid model gemaakt met zeven miljard parameters - en noemden dat Apalca - dat zelfs op een Raspberry Pi en een Pixel 6-smartphone blijkt te werken.

Filters werken niet voldoende

De onderzoekers hingen het aan een publieke website om er hun experimenten mee te doen. Na korte tijd werd de demo-site echter al weer offline gehaald. In een verklaring zeggen de onderzoekers dat het beschikbaar stellen van het model potentiële risico's met zich meebrengt, zoals het verspreiden van valse informatie, 'toxische' teksten en stereotypen. Het is het algemene probleem van zogeheten instruction following models, waar ook GPT, ChatGPT en Bing Chat aan lijden. Er waren daarom moderationfilters toegevoegd die OpenAI - de maker van GPT en ChatGPT - ook gebruikt. Bovendien werd aan alle respons die Apalca geeft, een watermerk toegevoegd zodat anderen met enige zekerheid kunnen herleiden of teksten van Apalca afkomstig waren.

Toch waren de filters onvoldoende om Apalca te corrigeren. Het lijkt erop dat Apalca nog sterker in de fout gaat dan modellen zoals GPT-3.5, zeggen de onderzoekers. Bovendien liepen de kosten voor het hosten van de demo-site op basis van Apalca zo op dat werd besloten de website weer te sluiten. Het experiment is echter allerminst mislukt, zeggen de onderzoekers tegen The Register. De dataset en de code die nodig zijn om het model af te stellen op specifieke taken zijn beschikbaar via GitHub. Het model is daarom nuttig voor het doen van onderzoek naar de tekortkomingen ervan.

Gerelateerde artikelen

Nieuws Artificial Intelligence

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Semantische neurale zoekmachine helpt GPT zijn redeneringen te onderbouwen

Nieuws Artificial Intelligence

Verbeterde ChatGPT-motor gaat Microsoft Bing aandrijven

Microsoft-CEO heropent race tegen search-reus Google.

Nieuws Artificial Intelligence

Onderzoek: ChatGPT ondermijnt morele waarden in maatschappij

Mensen hebben de neiging alles wat de bot zegt klakkeloos over te nemen.

Gerelateerde artikelen

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Nieuws Artificial Intelligence

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Semantische neurale zoekmachine helpt GPT zijn redeneringen te onderbouwen

Verbeterde ChatGPT-motor gaat Microsoft Bing aandrijven

Nieuws Artificial Intelligence

Verbeterde ChatGPT-motor gaat Microsoft Bing aandrijven

Microsoft-CEO heropent race tegen search-reus Google.

Onderzoek: ChatGPT ondermijnt morele waarden in maatschappij

Nieuws Artificial Intelligence

Onderzoek: ChatGPT ondermijnt morele waarden in maatschappij

Mensen hebben de neiging alles wat de bot zegt klakkeloos over te nemen.

Gerelateerde artikelen

Blog digitale werkplek Partner

Werkplekbeheer: zelf doen of uitbesteden?

Werkplekbeheer: zelf doen of uitbesteden en hoe zit het met datasouvereiniteit?

Achtergrond cyberaanvallen, training Partner

Gebrek aan focus en training belangrijkste redenen waarom werknemers slachtoffer worden van cyberaanvallen

Utrecht, 26 augustus 2025 – Niet de complexiteit van cyberaanvallen, maar een gebrek aan focus en training zijn de belangrijkste redenen...

Achtergrond Klantervaring Partner

Met outside-in denken de klant écht verder helpen

Bij Cegeka draait het om outside‑in denken: klantvragen staan centraal, niet de technologie, voor maximale impact. Harry weet er alles van.

Meer whitepapers

Whitepaper Artificial Intelligence Partner

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Security Partner

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

De samenvoegingen van IT en fysieke beveiliging begon jaren geleden, maar hoe staat het er nu voor met deze ontwikkeling?

Whitepaper Cloud Partner

Dé ideale mix tussen cloud en on-premises

Download de infographic en ontdek de vier grootste misvattingen over on-premises en de cloud.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee