Nvidia H100 NVL: dual-GPU accelerator met 188 GB HBM3 voor AI-modellen zoals ChatGPT

1 reactie

Nvidia-ceo Jensen Huang heeft tijdens zijn GTC-keynote de H100 NVL onthuld. Bij deze dual-gpu worden twee bestaande Hopper-acceleratoren aaneen gekoppeld om large language models zoals ChatGPT te versnellen.


Een configuratie met vier H100 NVL’s moet tot tien keer beter presteren in ai-workloads dan een HGX A100-cluster.

In essentie gaat het om cherrypicked GH100-chips, die op een pcie-uitbreidingskaart worden geplaatst en per twee stuks via drie NVLink 4-bridges met elkaar worden verbonden. In tegenstelling tot de reeds onthulde H100-producten beschikt elke gpu over zes 16GB-stacks aan hbm3-geheugen in plaats van vijf. Terwijl dit een capaciteit van 96 GB per chip zou moeten opleveren, gaat het in de praktijk om 94 GB. Dit wil zeggen dat elke dual-gpu niet minder dan 188 GB geheugen aan boord heeft.

Deze uitgebreide geheugenconfiguratie levert niet alleen meer capaciteit op, ook de bandbreedte wordt verhoogd – wat zeer goed van pas moet komen bij het versnellen van ai-modellen. Elke H100 NVL bereikt 7,8 TB/s, een uplift van 16% in vergelijk met twee H100 SXM’s. Waar laatstgenoemde een stroomverbruik van maximaal 700 watt heeft, moet de NVL vanwege zijn pcie-formaat het doen met 2x 350-400 W. Hierdoor moet het mogelijk zijn om de temperatuur onder controle te houden.

De H100 NVL wordt in de tweede helft van dit jaar verwacht. Nvidia noemt geen prijs, al zal deze naar verwachting niet bepaald mals zijn.

Bronnen: Nvidia, Videocardz, AnandTech, Igor's Lab

« Vorig bericht Volgend bericht »
0

Hardware Info maakt gebruik van cookies

Hardware Info plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Hardware Info relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie.

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Hardware Info contextuele advertenties te tonen op basis van pagina's die je hebt bezocht.

    janee

    Hardware Info genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Hardware Info gevolgd worden. Deze data wordt maximaal 2 weken bewaard. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden.

    janee