NVIDIA mikt met Fermi-’graphical processing unit’ op nieuwe markten

16 oktober 2009
NVIDIA heeft een tipje van de sluier van zijn volgende chipgeneratie opgelicht, Fermi genaamd. Volgens NVIDIA is Fermi, met 3 miljard transistors, de meest complexe chip die het bedrijf ooit heeft ontworpen.

Met de nieuwe ‘graphical processing unit’ (GPU) mikt NVIDIA op toepassingen die verder gaan dan puur grafisch rekenwerk. Volgens de fabrikant is de nieuwe chiparchitectuur, die de derde generatie vormt van NVIDIA’s Compute Unified Device Architecture (CUDA), net zo geschikt voor grafische applicaties als voor parallelle gegevensverwerking. De grenzen tussen specialistische grafische processors en processors voor algemeen gebruik vervagen hiermee steeds verder. Onder meer Cray, Dell, HP, IBM en Microsoft hebben ondersteuning van Fermi toegezegd.

NVIDIA claimt dat met Fermi supercomputers kunnen worden gebouwd tegen tien keer zo lage kosten en met een twintig keer zo laag energieverbruik als gewone servers met traditionele central processing units (CPU’s) zoals de Xeon van Intel en de Opteron van AMD. Fermi kan berekeningen met dubbele precisie acht keer zo snel uitvoeren als de laatste generatie GPU’s van NVIDIA. Dat maakt het nieuwe chipontwerp interessant voor wetenschappelijke applicaties en simulaties.

Fermi zal de basis vormen voor drie productfamilies: GeForce, Quadro en Tesla, aldus NVIDIA.

Tesla is de productlijn voor high-performance computing (HPC), oftewel supercomputers. Concrete producten heeft het bedrijf nog niet aangekondigd, maar dat zal naar verwachting niet lang meer duren. Vermoedelijk zijn de eerste producten op zijn vroegst in het eerste kwartaal van 2010 verkrijgbaar, aldus de doorgaans goed ingevoerde technologiesite AnandTech. Op dit moment levert Tesla overigens slechts een bescheiden bijdrage – vorig kwartaal circa 10 miljoen dollar op een totaal van 776 miljoen dollar – aan NVIDIA’s omzet.

De nieuwe chipgeneratie is de opvolger van NVIDIA’s G80 die in 2008 op de markt kwam en wordt toegepast in de GeForce GT200 grafische kaart, met maximaal 240 verwerkingskernen (cores). Fermi gaat nog een stap verder door chipontwerpen met 512 ‘cores’ mogelijk te maken. Die 512 kernen zijn dan verdeeld over 16 multiprocessors met ieder 32 cores. Belangrijk voor gebruik in datacenters en supercomputers is de ondersteuning van geheugenchips met ingebouwde foutcorrectie (ECC), iets dat bij AMD ontbreekt. Fermi kan verder gebruikmaken van GDDR5-geheugen. Vooralsnog is dit door de 40-bitsadressering beperkt tot een maximum van 1 terabyte, al ondersteunt het ontwerp in principe ook 64-bitsadressering.

Concurrent AMD bracht in september al de ATI Radeon HD 5800-serie op de markt, met twee videokaarten die zijn gebaseerd op de RV870 Cypress GPU-core (alias Cypress). De snelste uitvoering daarvan levert een performance van 2,72 teraflops. De AMD-processor heeft 2,15 miljard transistors, drie keer zoveel als de Core i7 van Intel.

NVIDIA heeft de fabricage net als concurrent AMD uitbesteed aan de Taiwanese foundry TSMC en van beide producten is de spoorbreedte 40 nanometer. Het grotere aantal transistors van Fermi maakt het aannemelijk dat de fabricagekosten hoger liggen dan die van de RV870. Het zal voor NVIDIA dan ook moeilijk zijn puur op prijs met AMD te concurreren.

NVIDIA-topman Jen-Hsun Huang erkent dat het nooit prettig is wanneer een concurrent eerder op de markt komt met een soortgelijk product. Volgens Huang mikt NVIDIA met de Fermi echter op andere markten dan AMD doet met zijn Cypress-processor en maakt het weinig uit dat de chip van AMD iets eerder leverbaar is. “Dit wordt waarschijnlijk de meest succesvolle GPU die we ooit hebben aangekondigd”, zei Huang op een persconferentie na de onthulling van Fermi.

Net als de HD5800 van AMD kan Fermi overweg met DirectX versie 11, een techniek van Microsoft voor het versnellen van multimediatoepassingen. Vergelijkbaar met DirectX 11 is OpenCL, een onderdeel van Mac OS X van Apple. Dit betekent dat de chiparchitectuur ook geschikt is voor games en andere veeleisende grafische software voor de consument. Volgens NVIDIA kan voor deze toepassingsgebieden worden volstaan met minder dan 512 ‘cores’ en met een uitgeklede feature-lijst, waarbij bijvoorbeeld ondersteuning van berekeningen met dubbele precisie vervalt.

Grafische processors hebben de naam dat ze veel lastiger te programmeren zijn dan standaard x86-CPU’s van Intel en AMD. NVIDIA belooft dat dit met Fermi anders ligt. Applicatiemakers kunnen gebruikmaken van de vertrouwde programmeertaal C++ en ook van ontwikkeltools als Visual Studio van Microsoft, dankzij de plug-in Nexus.

Een van de eerste toekomstige gebruikers van het Fermi-platform is het Oak Ridge National Laboratory (ORNL), een onderzoeksinstelling van het Amerikaanse ministerie van Energie. Het ORNL wil met de Fermi-chips een supercomputer bouwen die tien keer zo krachtig is als de snelste wetenschappelijke computers van dit moment. Dat betekent dat het lab werkt aan een supercomputer van circa 10 petaflops (1 petaflop is 10 tot de macht 15 berekeningen met drijvende komma per seconde).

De nieuwe supercomputer met NVIDIA-processors is onder meer bedoeld voor onderzoek naar energie en klimaatverandering. Het ORNL, gevestigd in de staat Tennessee, werkt nu met een supercomputer die is opgebouwd uit Opteron-processors van AMD.

Lees meer over
Reactie toevoegen
De inhoud van dit veld is privé en zal niet openbaar worden gemaakt.