Nieuws Artificial Intelligence

21 april 2021 leestijd 1 minuut 0 reacties

'Ontgiftigen' van taalmodellen versterkt bias juist

Onderzoek naar de resultaten van verschillende methoden om trainingsdata te ontdoen van vooroordelen, suggereert dat in datasets zoals de English Jigsaw Civil Comments onterechte verbindingen zitten tussen enerzijds de taalgewoonten van Afrikaans-Engelse bevolkingsgroepen, moslimgroepen en andere minderheden en anderzijds de labeling van 'giftige termen' (toxic labels).

Thijs Doorenbosch

Thijs DoorenboschMeer van deze auteur

neuraal netwerk — © Shutterstock

Shutterstock

Door op die trainingssets detoxificatie-methoden los te laten, ontstaat een voorkeur voor het Engels dat de witte gemeenschap gebruikt, concludeert Venturebeat. De modellen krijgen daardoor minder training op het taalgebruik van de minderheidsgroepen en kunnen daar dus ook minder goed mee overweg. Dat wordt dan gekarakteriseerd als incorrect of slecht taalgebruik.

De onderzoekers - werkzaam aan de UC Berkeley en de University of Washington - pakten GPT-2 als testmodel. Ze gebruikten de dataset van Jigsaw - een dochteronderneming van Alphabet die zich richt op het bestrijden van online pesten - als trainingsdata. In natuurlijke taalverwerking wordt als maat voor de kwaliteit van de output van een model op een bepaalde eigenschap gemeten in een perplexity-score. Hoe lager de score hoe beter het model presteert. De onderzoekers vonden dat door training met de opgeschoonde English Jigsaw Civil Comments dataset de perplexity-score voor "wit-gerelateerd Engels" opliep met een factor 2,1. Maar voor data waar veel gegevens van minderheden in zaten, liep de score op met een factor 4,3. Het opschonen van de trainingsdata zorgde dus voor een versterking van de bias.

Het toepassen deze technieken leidt er toe dat onderwerpen die spelen in minderheidsgemeenschappen eerder vermeden worden wanneer deze opgeschoonde taalmodellen worden gebruikt.

Detoxificeren is nu toch enige optie

De onderzoekers constateren nu in hun wetenschappelijk artikel (pdf) dat het nog niet goed mogelijk is accurate modellen te trainen op datasets waarin een bias voorkomt. Daarom moet er meer aandacht komen voor het opstellen van methoden om datasets van hun bias te ontdoen. Het wordt steeds duidelijker wat de consequenties zijn van de ingebakken vooroordelen in kunstmatige intelligentie. De toepassingsmogelijkheden nemen daardoor af.

Gerelateerde artikelen

Achtergrond Artificial Intelligence PRO

Artificial intelligence: bias uitbannen of in gesprek met AI?

AI als gesprekspartner kan meer ruimte voor menselijke maat bieden

Nieuws Artificial Intelligence

Bias in AI komt niet alleen door slechte trainingsdata

Menselijke keuzes bij AI-implementatie spelen ook grote rol.

Nieuws Artificial Intelligence

Nieuwe aanpak van bias in algoritmen faalt jammerlijk

Harvard- en Microsoft-onderzoekers schoffelen veelbelovende onderzoeksresultaten onderuit.

Nieuws Artificial Intelligence

Bias gezichtsherkenning neemt toe in plaats van af

Aandacht voor discriminatieprobleem heeft niet het verwachte effect.

Gerelateerde artikelen

Artificial intelligence: bias uitbannen of in gesprek met AI?

Achtergrond Artificial Intelligence PRO

Artificial intelligence: bias uitbannen of in gesprek met AI?

AI als gesprekspartner kan meer ruimte voor menselijke maat bieden

Bias in AI komt niet alleen door slechte trainingsdata

Nieuws Artificial Intelligence

Bias in AI komt niet alleen door slechte trainingsdata

Menselijke keuzes bij AI-implementatie spelen ook grote rol.

Nieuwe aanpak van bias in algoritmen faalt jammerlijk

Nieuws Artificial Intelligence

Nieuwe aanpak van bias in algoritmen faalt jammerlijk

Harvard- en Microsoft-onderzoekers schoffelen veelbelovende onderzoeksresultaten onderuit.

Bias gezichtsherkenning neemt toe in plaats van af

Nieuws Artificial Intelligence

Bias gezichtsherkenning neemt toe in plaats van af

Aandacht voor discriminatieprobleem heeft niet het verwachte effect.

Gerelateerde artikelen

Blog cybersecurity Partner

EU trekt 145,5 miljoen euro uit voor cyberveiligheid MKB en zorgverleners: "Europa moet kiezen voor schaal en scherpte in security"

Miljoenen van de EU voor cyberveiligheid MKB en zorgverleners - waar moeten deze voor ingezet worden?

Blog werkplek Partner

De moderne werkplek: van IT-project naar strategische businessversneller

De moderne werkplek is geen IT-project meer, maar een strategische versneller. Ontdek hoe je hierop kan inspelen.

Meer whitepapers

Whitepaper Artificial Intelligence Partner

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Security Partner

De weg ontdekken naar geïntegreerde IT- en fysieke beveiliging afdelingen

De samenvoegingen van IT en fysieke beveiliging begon jaren geleden, maar hoe staat het er nu voor met deze ontwikkeling?

Whitepaper Marketing Partner

High impact business stories creëren

De route naar de zakelijke beslisser.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee