Overslaan en naar de inhoud gaan

In GPU-schaarste door AI-hype komt Nvidia met volgende generatie AI-chip

Terwijl de nu-vorige generatie van Nvidia's grafische chips (GPU's) voor AI-werk nog altijd wereldwijd schaars zijn, brengt de chipmaker de nieuwe H200 op de markt. Deze krachtige chips voor wetenschappelijke rekentaken (zoals AI en HPC, high-performance computing) beloven een flink hoger prestatieniveau, wat aantrekkelijk kan zijn voor cloudaanbieders die hun klanten AI-taken laten draaien.

Nvidia H200
Nvidia

Nvidia zelf vergelijkt zijn H200 met de A100, die in 2020 is geïntroduceerd en die is gebaseerd op de oudere Ampere-architectuur. De nieuwste AI-chip heeft bijna twee keer zoveel geheugen (141 gigabyte) met daarvoor bijna tweeënhalf keer zoveel bandbreedte (4,8 terabytes per seconde). In vergelijking met de H100, die eind 2022 is aangekondigd, heeft Nvidia's nieuwe GPU 'slechts' 1,8 keer zoveel geheugen en 1,4 keer zoveel bandbreedte. De H100 en de H200 zijn gebaseerd op de nieuwere Hopper-architectuur.

Harder, beter, sneller

De krachtigere, nieuwe chip kan genAI-toepassingen een flinke prestatieverbetering geven. Nvidia spiegelt een bijna-verdubbeling voor wat betreft de inferentiesnelheid van het Llama 2.0-model van Facebooks moederbedrijf Meta. Deze prestatiesprong is wél in vergelijking met de H100-chip. Toekomstige software-updates voor de H200 moeten nog meer verbeteringen brengen, belooft Nvidia.

De grote, brede en aanhoudende hype rond AI-toepassingen zorgt ervoor dat speciale chips daarvoor zeer in trek zijn. Nvidia, die de grootste leverancier op dit gebied is, kampt al geruime tijd met een scheefgetrokken verhouding tussen vraag en aanbod. De productie van deze complexe chips kan de opgezweepte vraag niet bijbenen. Dit heeft al gezorgd voor flink hoge prijzen én voor consolidatie van AI-taken bij techreuzen en cloudaanbieders die wel de hand weten te leggen op de felbegeerde GPU's.

AWS, Google, Microsoft en Oracle

De H200 moet in het tweede kwartaal van komend jaar beschikbaar komen, meldt Nvidia. Dan komen zowel serverfabrikanten als ook cloudaanbieders met H200-systemen. Techreuzen AWS , Google, Microsoft en Oracle behoren tot de voorhoede van leveranciers die gebruik van de nieuwe GPU's gaan bieden aan hun klanten. Daarnaast doen ook kleinere bedrijven als CoreWeave, Lambda en Vultr mee, aldus Nvidia.

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in