Overslaan en naar de inhoud gaan

Er zijn meer GenAI-hulpmiddelen dan ChatGPT en Bing Chat

Generatieve AI
Shutterstock, iQoncept

Generatieve kunstmatige intelligentie (genAI) is op het hoogtepunt van de hypecycle volgens Gartner. Vrijwel elke dag is er nieuws over toepassingen in diverse sectoren of de verwachtingen rond de gevolgen ervan voor de maatschappij en de economie. Maar hoe kun je als bedrijf genAI praktisch inzetten en - ook interessant - waar komen al die toepassingen opeens vandaan? AG Connect geeft een overzicht.

ChatGPT van OpenAI heeft op dit moment vrijwel alle aandacht naar zich toe getrokken na de spectaculaire introductie van de eerste gratis voor iedereen toegankelijke tekstrobot in november vorig jaar op basis van het in huis ontwikkelde en getrainde taalmodel GPT.

Microsoft sprong daar begin 2023 handig op in en kreeg met zijn strategische investeringen in OpenAI exclusieve toegang tot de allerlaatste genAI-ontwikkelingen bij dit startersbedrijf. Daarmee lukte het Microsoft de aandacht deels naar zich toe te trekken met de integratie van genAI-technologie in de eigen zoekmachine Bing - en daar was Bing Chat.

Maar ChatGPT en Bing Chat zijn lang niet de enige toepassingen van genAI. Uit de koker van OpenAI komt bijvoorbeeld ook Dall-E, dat op basis van een paar steekwoorden afbeeldingen produceert.

En er zijn meer bedrijven met in-huis ontwikkelde genAI-modellen. Google bouwde voort op het eigen pionierswerk in kunstmatige intelligentie met onder meer het taalmodel PaLM. Ook Meta investeert veel in het ontwikkelen van nieuwe modellen zoals LLaMA en de training daarvan. Verder zijn er nog kleinere pioniers op dit gebied zoals Stable Diffusion en Anthropic.

Vervolgens hebben andere bedrijven weer gespecialiseerde toepassingen gemaakt op basis van dat handvol aan taalmodellen. Dat heeft inmiddels geresulteerd in bijna 5000 genAI-hulpmiddelen. Sommigen helpen bij het opstellen van een businessplan, andere sorteren het beursgerelateerde nieuws of assisteren bijvoorbeeld bij het maken van een presentatie. Ontwikkelaars wordt werk uit handen genomen met codesuggesties of het bouwen van complete websites. De mogelijkheden zijn grenzeloos. Futurepedia.io biedt een overzicht met 54 categorieën, dat dagelijks wordt aangevuld met nieuwe toepassingen.

OpenAI, Google en onderliggende technologie

GenAI is gebaseerd op een kunstmatig neuraal netwerk. Kunstmatig, omdat er ook biologische neurale netwerken bestaan. Dit zijn stelsels van neuronen, ofwel langgerekte cellen in de hersenen of zenuwbanen, die in staat zijn met hun uiteinden - synapsen genoemd - informatie te bewerken en over te dragen op andere neuronen via elektrische en chemische impulsen. Ze vormen de basis voor heel veel eigenschappen van dierlijke organismen. Ze zorgen dat een lichaam kan voelen, horen, zien, reageren, bewegen, denken, onthouden en veel meer. Het hele mechanisme is uiterst efficiënt. Bijvoorbeeld, het menselijk brein, dat het centrum is voor al deze acties in ons lichaam, verbruikt ongeveer 25 Watt, zeg maar evenveel als een paar Led-lampjes.

Kunst afkijken van de natuur

Om computers enige vorm van kunstmatige intelligentie aan te leren, grijpen wetenschappers dus steeds weer terug naar biologische systemen om daar de kunst van af te kijken. Het probleem is dat ook van biologische neurale netwerken nog eigenlijk maar relatief weinig bekend is over de werking. Soms leren biologen dus ook weer van computerwetenschappers die proberen deze biologische systemen na te bootsen.

Veel werk aan kunstmatige neurale netwerken is al gedaan in de jaren 50-60 van de vorige eeuw. Hoewel er veel verschillende manieren zijn uitgeprobeerd, kwamen stochastic gradiënt descent en het backpropagation algorithm destijds als beste naar voren. Maar deze aanpak vergt veel computerkracht en als gevolg daarvan veel energie. Pas nadat er een jaar of tien geleden voldoende goedkope computerkracht beschikbaar kwam in de vorm van clusters in de cloud, schoten de toepassingen van neurale netwerken als paddenstoelen uit de grond. Ook kwam er veel geld en menskracht beschikbaar voor onderzoek naar nieuwe toepassingen en kwamen er ook veel data via internet beschikbaar waarmee modellen konden worden getraind.

Google legde belangrijke basis

Vanuit het bedrijfsleven timmerde onder meer Google hard aan de weg met de ontwikkeling in 2017 van de Transformer-modellen die beter presteerden dan de recurrent convolution modellen die tot dan toe populair waren om neurale netwerken natuurlijke taal aan te leren.

OpenAI brak de markt open

OpenAI timmert sinds de oprichting in 2015 hard aan de weg met die Transformer-aanpak. Het bedrijf ontwikkelde het taalmodel GPT, wat een afkorting is van Generative Pretrained Transformer. ChatGPT is een toepassing van dat taalmodel in de vorm van een tekstrobot die op een website vragen kan beantwoorden. In november 2022 maakte OpenAI ChatGPT publiek beschikbaar op basis van versie 3.5 van het taalmodel GPT. Inmiddels kunnen klanten van betaalde toepassingen ook GPT-4 gebruiken.

Hetzelfde model kan ook worden getraind om afbeeldingen te genereren. OpenAI presenteerde in 2021 DALL-E op basis van GPT.

Meta biedt meer openheid

Meta heeft een grote eigen afdeling die fundamenteel werk verricht aan kunstmatige intelligentie. Het bedrijf - dat toen nog net als het sociale netwerk Facebook heette - startte in 2013 met Facebook Artificial Intelligence Research (FAIR) onder leiding van de Turing Award-winnaar en hoogleraar deep learning Yann LeCun. Inmiddels is het onderdeel omgedoopt tot Meta AI. Naast werk aan computer vision heeft Meta AI in 2023 LLaMa (Large Language Model Meta AI). Sinds kort zijn er bedrijven die voor hun toepassingen gebruik maken van LLaMA zoals Databricks. LLaMA heeft als voordeel ten opzichte van bijvoorbeeld een taalmodel als GPT dat de 'gewichten' - zeg maar de parameters die in het neuraal netwerk de input in de verschillende lagen bewerken - kunnen worden aangepast. Daardoor zijn meer geavanceerde interacties met het taalmodel mogelijk.

Ruzie bij OpenAI levert Anthropic

Antropic is een startup van twee mede-oprichters van OpenAI, die het bedrijf in 2021 verlieten omdat zij het niet eens waren met onder meer de koerswijziging van open naar commercieel die de andere leidinggevenden wilden inzetten.

Broer en zus Dario Amodei en Daniela Amodei zetten in korte tijd hun eigen taalmodel op, gefinancierd en geholpen door onder meer Google en cryptocurrencybedrijf Alameda Research. Antropic ontwikkelde een eigen chatbot genaamd Claude die aanvankelijk alleen via Slack te benaderen was. In juli 2023 kwam er ook een publiek toegankelijke website claude.ai beschikbaar.

GenAI op de desktop

Stable Diffusion is een aparte vorm van genAI, omdat het model dat afbeeldingen maakt op basis van tekstinput geen zware hardware nodig heeft maar op gewone consumenten-pc's draait met een GPU en minimaal 8 GB aan VRAM. Alle andere genAI-modellen kunnen vanwege de benodigde computerkracht alleen als clouddienst worden aangeboden. Stable Diffusion is ontwikkeld aan de Duitse Ludwich Maximilian universiteit in München. De code werd verder doorontwikkeld en in 2022 aangeboden als opensourcesoftware door startup Stability AI.

Kunstenaars over Midjourney: love it or hate it

Midjourney is een genAI-model dat net als Stable Diffusion op basis van tekstinput afbeeldingen genereert. De eerste openbare versie kwam in juli 2022 beschikbaar in een bèta-versie die benaderbaar is via het Discord socialmediaplatform. Midjourney staat in de belangstelling bij kunstenaars, zowel in positieve als negatieve zin. Er zijn inmiddels vele tijdschriften verschenen met een afbeelding op de omslag gemaakt met Midjourney, zoals The Economist (juni 2022) en Corriere della Sera (augustus 2022). Ook zijn verschillende kunstwerken gemaakt met gebruik van Midjourney die ook in de prijzen vielen, zoals het Théâtre d'Opéra Spatial dat bij de Colorado State Fair de digital art competition won. Het gebruik van genAI-modellen leidt echter ook tot veel controverse. Kunstenaars protesteren dat de indieners van genAI-werk niet werkelijke kunstenaars zijn omdat zij alleen de 'prompt' (de tekstinput) invullen. Vaak is echter nog veel digitaal schaafwerk nodig voordat het ruwe beeld waar genAI mee komt, de kwaliteit heeft om aan een wedstrijd mee te doen.

Er lopen ook diverse rechtszaken die kunstenaars hebben aangespannen tegen de ontwikkelaars van AI-gebaseerde beeldgeneratoren omdat de modellen getraind worden op originele kunstwerken waar auteursrecht op rust.

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee
RH
Ron Heinen 30 augustus 2023

Vanuit een wetenschappelijke wereldvisie kun je altijd de concepten Systeem-Theorie, Probleem-Oplossing en Evolutie toepassen. Generieke systeem-theorie is een universele taal voor de wetenschap. Als we een complex probleem willen oplossen dan moeten we elk middel gebruiken dat tot onze beschikking staat. Evolutie is veel breder dan biologische evolutie en kan gezien worden als een algemene theorie van verandering. Aansluitend op "Kunst afkijken van de natuur" in het artikel kan de evolutie theorie antwoorden bieden in deze context. Ontwikkel zoveel mogelijk AI-concepten (Diversificatie), laat internetgebruikers de beste selecteren (Selectie) en financieer de geselecteerde om een volgende generatie te ontwikkelen (Reproductie). Met 5000 genAI-hulpmiddelen (Diversificatie) in 54 categorieën (Soorten) met dagelijks nieuwe toepassingen (Reproductie) zijn we aardig op weg met de evolutie van AI-systemen.