Nieuws Artificial Intelligence

23 april 2025 leestijd 1 minuut 0 reacties

Nieuwe OpenAI-modellen hallucineren meer

De nieuwe genAI-modellen die het bekende OpenAI eerder deze maand heeft uitgebracht, zijn niet alleen krachtiger dan voorgaande modellen van het Amerikaanse bedrijf. De modellen o3 en o4-mini blijken ook meer vatbaar voor eigen verzinsels. Tot op heden wisten nieuwere genAI-modellen hun neiging tot hallucineren telkens wat terug te dringen. Maar dat ligt nu anders.

Lees ook: AI is als die dronken oom op een verjaardag

Jasper BakkerredacteurMeer van deze auteur

tegenvallende prestaties — neerwaartse lijn

Shutterstock

De zogeheten redenerende modellen o3 en o4-mini blijken juist vaker te hallucineren dan hun directe voorgangers o1, o1-mini en o3-mini. Hetzelfde geldt voor de meer traditionele, 'non-reasoning' genAI-modellen van OpenAI, zoals GPT-4o. De discrepantie qua hallucinaties komt naar voren uit interne tests die AI-maker OpenAI heeft uitgevoerd, meldt onder meer TechCrunch.

Twee keer zo veel

In de PersonQA-benchmark van OpenAI gaf het o3-model in 33% van de tijd hallucinaties in de output. Dat is twee keer zo veel als het hallucineren door oudere modellen: 16% bij o1 en 14,8% bij o3-mini. Het nieuwe model o4-mini 'wint' met hallucinaties in 48% van de tijd. De bevindingen in OpenAI's technische rapport (PDF) over o3 en o4-mini worden gestaafd door onderzoek dat extern is verricht.

Tests door nonprofit AI-onderzoekslab Transluce hebben ook een hogere mate van hallucineren aan het licht gebracht. De hypothese van Transluce over deze 'tegendraadse trend', in vergelijking dus met het terugdringen van hallucineren in nieuwere AI-modellen, is dat er een versterkend effect optreedt bij het trainen van OpenAI's o-series modellen. OpenAI zelf geeft aan dat het vooralsnog geen duidelijke oorzaak ziet en dat meer onderzoek hiernaar nodig is.

Menskracht ter controle nodig

Hallucinaties door AI-modellen en daarop gebaseerde toepassingen kunnen het nut nogal inperken. Inaccuraatheid of complete verzinsels ondermijnen immers de voorgespiegelde winst aan tijd, kennis en menskracht. Onbetrouwbare - of onbetrouwbaar geachte - AI-gegenereerde output vereist dan gedegen controle, door experts. Wat dan gevolgd kan worden door eventuele correcties, uitgevoerd door mensen óf door hernieuwde AI-inzet.

Zorgen over AI-verzinsels in audiotranscripties door OpenAI-tool

Transcriptietool Whisper zet ongesproken en zelfs niet-bestaande zaken in tekstverslagen van audio-opnames, ontdekken onderzoekers.

3 min 1

Nieuws AI-betrouwbaarheid

Scorebord voor AI-hallucinaties, GPT4 versus Llama en andere concurrenten

AI-searchbedrijf heeft evaluatiemodel gemaakt om te meten hoeveel (of weinig) AI-toepassingen verzinnen in hun output.

1 min

Nieuws AI-modellen

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Onderzoekers maakten Woodpecker, dat hallucinaties in gegenereerde content vindt en corrigeert.

2 min

Zorgen over AI-verzinsels in audiotranscripties door OpenAI-tool

Transcriptietool Whisper zet ongesproken en zelfs niet-bestaande zaken in tekstverslagen van audio-opnames, ontdekken onderzoekers.

3 min 1

Nieuws AI-betrouwbaarheid

Scorebord voor AI-hallucinaties, GPT4 versus Llama en andere concurrenten

AI-searchbedrijf heeft evaluatiemodel gemaakt om te meten hoeveel (of weinig) AI-toepassingen verzinnen in hun output.

1 min

Nieuws AI-modellen

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Onderzoekers maakten Woodpecker, dat hallucinaties in gegenereerde content vindt en corrigeert.

2 min

Waarom IT-strategieën falen zonder een solide informatiebeheerplan

Organisaties investeren volop in technologie, maar vergeten vaak het fundament: informatiebeheer.

2 min

Blog informatiechaos Partner

Informatiechaos als valkuil van verscherpt toezicht – zo voorkom je het

Toezicht wordt scherper, maar je informatievoorziening is dat nog niet. Ontdek waarom versnippering je grootste risico is

2 min

Nieuws KnowBe4, Microsoft Partner

KnowBe4 sluit zich aan bij Microsoft Security Store Partner Ecosysteem

2 min

Meer whitepapers

Whitepaper Security Partner

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

De samenvoegingen van IT en fysieke beveiliging begon jaren geleden, maar hoe staat het er nu voor met deze ontwikkeling?

Whitepaper Artificial Intelligence Partner

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Marketing Partner

High impact business stories creëren

De route naar de zakelijke beslisser.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Nieuwe OpenAI-modellen hallucineren meer

Twee keer zo veel

Menskracht ter controle nodig

Zorgen over AI-verzinsels in audiotranscripties door OpenAI-tool

Scorebord voor AI-hallucinaties, GPT4 versus Llama en andere concurrenten

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Zorgen over AI-verzinsels in audiotranscripties door OpenAI-tool

Scorebord voor AI-hallucinaties, GPT4 versus Llama en andere concurrenten

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Waarom IT-strategieën falen zonder een solide informatiebeheerplan

Informatiechaos als valkuil van verscherpt toezicht – zo voorkom je het

KnowBe4 sluit zich aan bij Microsoft Security Store Partner Ecosysteem

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

The challenge of information asymmetry

High impact business stories creëren

Reacties

Bevestig jouw e-mailadres

Er is iets mis gegaan

Maak een gratis account aan en geniet van alle voordelen:

Maak een gratis account aan en geniet van alle voordelen:

Nieuwe OpenAI-modellen hallucineren meer

Twee keer zo veel﻿

Menskracht ter controle nodig﻿

Zorgen over AI-verzinsels in audiotranscripties door OpenAI-tool

Scorebord voor AI-hallucinaties, GPT4 versus Llama en andere concurrenten

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Zorgen over AI-verzinsels in audiotranscripties door OpenAI-tool

Scorebord voor AI-hallucinaties, GPT4 versus Llama en andere concurrenten

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Waarom IT-strategieën falen zonder een solide informatiebeheerplan

Informatiechaos als valkuil van verscherpt toezicht – zo voorkom je het

KnowBe4 sluit zich aan bij Microsoft Security Store Partner Ecosysteem

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

The challenge of information asymmetry

High impact business stories creëren

Reacties

Twee keer zo veel

Menskracht ter controle nodig