Die NVIDIA H100 ist eine High-End-GPU, die punkt­ge­nau für KI, Deep Learning und HPC-An­wen­dun­gen kon­zi­piert wurde. Auf Basis der in­no­va­ti­ven Hopper-Ar­chi­tek­tur nutzt die H100-GPU leis­tungs­star­ke Tensor-Kerne der vierten Ge­ne­ra­ti­on für eine au­ßer­ge­wöhn­li­che Per­for­mance. Dank ihrer massiven Re­chen­ka­pa­zi­tät ist die NVIDIA H100 die ideale Wahl, um komplexe neuronale Netze zu trai­nie­ren, da­ten­in­ten­si­ve Cloud-Workloads zu be­wäl­ti­gen und an­spruchs­vol­le HPC-Si­mu­la­tio­nen durch­zu­füh­ren.

Was zeichnet die NVIDIA H100 aus?

Die NVIDIA H100 liefert ein Per­for­mance-Niveau, das durch die neuartige Hopper-Ar­chi­tek­tur er­mög­licht wird. Durch die Kom­bi­na­ti­on von Tensor-Core-Tech­no­lo­gie mit einer Trans­for­mer-Engine wird die Re­chen­leis­tung maximiert und das Training von KI-Modellen massiv be­schleu­nigt. world4you weist darauf hin, dass NVIDIA die H100-GPU in zwei Varianten anbietet: H100 SXM und H100 NVL.

Beide Aus­füh­run­gen un­ter­schei­den sich in Form­fak­tor, Leistung, Spei­cher­band­brei­te und Kon­nek­ti­vi­tät. Die H100 SXM ist speziell für **hoch­dich­te Server** und **Hy­pers­ca­le-Um­ge­bun­gen** optimiert. Im Gegensatz dazu wurde die H100 NVL für PCIe-Steck­plät­ze ent­wi­ckelt, was die In­te­gra­ti­on in **be­stehen­de Ser­ver­struk­tu­ren** er­leich­tert. Die folgende Tabelle zeigt die Details der beiden NVIDIA-H100-Varianten im Vergleich:
Leis­tungs­merk­mal NVIDIA H100 SXM NVIDIA H100 NVL
FP64 34 TFLOPS 30 TFLOPS
FP64-Tensor-Core 67 TFLOPS 60 TFLOPS
FP32 67 TFLOPS 60 TFLOPS
TF32 Tensor Core 989 TFLOPS 835 TFLOPS
BFLOAT16 Tensor Core 1.979 TFLOPS 1.671 TFLOPS
FP16 Tensor Core 1.979 TFLOPS 1.671 TFLOPS
FP8 Tensor Core 3.958 TFLOPS 3.341 TFLOPS
INT8 Tensor Core 3.958 TOPS 3.341 TOPS
GPU-Speicher 80 GB 94 GB
GPU-Spei­cher­band­brei­te 3,35 TB/s 3,9 TB/s
Decoder 7 NVDEC, 7 JPEG 7 NVDEC, 7 JPEG
Maximal Thermal Design Power (TDP) 700 W (kon­fi­gu­rier­bar) 350–400 W (kon­fi­gu­rier­bar)
Multi-Instanzen-GPU (MIG) Bis zu 7 MIGs mit je 10 GB Bis zu 7 MIGs mit je 12 GB
Form­fak­tor SXM PCIe (2 Slots, Luft­küh­lung)
Schnitt­stel­le NVIDIA NVLink 900 GB/s, PCIe Gen5: 120 GB/s NVIDIA NVLink: 600 GB/s, PCIe Gen5 128 GB/s
Ser­ver­op­tio­nen NVIDIA HGX H100-Partner:innen & zer­ti­fi­zier­te Systeme (4/8 GPUs), NVIDIA DGX H100 (8 GPUs) Partner:innen & zer­ti­fi­zier­te Systeme (bis zu 8 GPUs)
NVIDIA AI En­ter­pri­se Add-on Inklusive
Hinweis

TFLOPS (Tera Floating Point Operations per Second) misst die Re­chen­ge­schwin­dig­keit bei Gleit­kom­ma­zah­len. Ein TFLOPS ent­spricht 1 Billion Kal­ku­la­tio­nen pro Sekunde. Die Einheit TOPS (Tera Operations per Second) bezieht sich analog dazu auf Ganzzahl-Ope­ra­tio­nen.

Vor- und Nachteile der NVIDIA H100

Als eine der stärksten GPUs am Markt nutzt die NVIDIA H100 modernste Tech­no­lo­gien. Das sind die wich­tigs­ten Plus­punk­te:

  • Extreme Re­chen­kraft: Durch die enorme Per­for­mance der FP8- und FP16-Tensor-Cores ist sie prä­de­sti­niert für LLMs (Large Language Models). Das Zu­sam­men­spiel aus Tensor-Kernen der vierten Ge­ne­ra­ti­on und der Trans­for­mer Engine hebt die Effizienz von KI-Prozessen auf ein neues Level.
  • NVLink und NVSwitch: Dank NVLink (Gen 4) lassen sich mehrere GPUs mit 900 GB/s Band­brei­te koppeln. Mit NVSwitch skalierst du deine Cluster ganz nach Bedarf.
  • Multi-Instanz-GPU (MIG): Du kannst den Gra­fik­pro­zes­sor in bis zu 7 un­ab­hän­gi­ge Instanzen un­ter­tei­len. Das erlaubt den par­al­le­len Betrieb ver­schie­de­ner Workloads bei voller Res­sour­cen­tren­nung – ideal für geteilte Um­ge­bun­gen.
  • Con­fi­den­ti­al Computing: In­te­grier­te Si­cher­heits-Features ga­ran­tie­ren die In­te­gri­tät deiner Daten über den gesamten Workload hinweg – Sor­gen­frei­heit inklusive.
  • HBM3-Speicher & PCIe Gen5: Mit bis zu 94 GB HBM3-Speicher und 3,9 TB/s Band­brei­te bietet die H100 eine der schnells­ten Lösungen für da­ten­hung­ri­ge Projekte, un­ter­stützt durch blitz­schnel­les PCIe Gen5.

Ein Punkt, den man beachten muss: Die Spit­zen­leis­tung hat ihren Preis. Je nach Modell liegen die Kosten zwischen 30 000 € und 40 000 €, was sich auch in den Tarifen für Cloud-Instanzen wi­der­spie­gelt. Zudem sorgt die enorme Nachfrage re­gel­mä­ßig für längere Lie­fer­zei­ten.

Wo spielt die NVIDIA H100 ihre Stärken aus?

Die H100-GPU ist das Kraft­pa­ket für re­chen­in­ten­si­ve Aufgaben in der KI- und HPC-Welt. Hier sind die zentralen Ein­satz­be­rei­che:

  • Training großer KI-Modelle: Sie be­schleu­nigt das Training von neu­ro­na­len Netzen und LLMs wie GPT oder LLaMA massiv.
  • KI-Inferenz in Echtzeit: Trai­nier­te Modelle werden mit Höchst­ge­schwin­dig­keit aus­ge­führt – perfekt für Sprach­ver­ar­bei­tung oder Bil­der­ken­nung.
  • Cloud & Re­chen­zen­tren: Sie bildet das Rückgrat moderner GPU-Server für komplexe Aufgaben.
  • High-Per­for­mance Computing (HPC): Wis­sen­schaft­li­che Si­mu­la­tio­nen pro­fi­tie­ren enorm von der hohen FP64-Leistung.
  • Ge­ne­ra­ti­ve KI: Ob Texte, Bilder oder Videos – die H100 ver­ar­bei­tet die nötigen Da­ten­sät­ze für ge­ne­ra­ti­ve KI schnell und effizient.
  • Da­ten­ana­ly­se: Un­ter­neh­men (z. B. aus Finanzen oder Logistik) nutzen die Hopper-GPUs für präzise Prognosen aus riesigen Da­ten­men­gen.

Welche Al­ter­na­ti­ven gibt es zur H100?

Je nach Budget und An­for­de­rung können andere Lösungen wirt­schaft­lich sinn­vol­ler sein. Mögliche Al­ter­na­ti­ven sind:

  • NVIDIA A100: Das bewährte Vor­gän­ger­mo­dell bietet solide Leistung für KI und HPC zum at­trak­ti­ve­ren Preis.
  • NVIDIA A30: Ein guter Kom­pro­miss aus Per­for­mance und Kosten.
  • NVIDIA H200: Das Upgrade zur H100 mit nochmals ge­stei­ger­ter Spei­cher­band­brei­te.
  • Intel Gaudi 3: Ein starker Her­aus­for­de­rer speziell für KI-Inferenz.
Hinweis

Einen de­tail­lier­ten Überblick über die gän­gigs­ten Gra­fik­pro­zes­so­ren findest du in unserem Guide „Server GPUs im Vergleich“.

Zum Hauptmenü