OpenAI und NVIDIA stellen Stromversorger (und Umwelt) vor immense Herausforderungen

Allein eines der geplanten Gigawatt-Rechenzentren benötigte zwei moderne AKW für die redundante Stromversorgung.

Bild: KI

OpenAI und Nvidia wollen Gigawatt-KI-Rechenzentren aufbauen und betreiben. Dabei ist noch nicht klar, ob es zehn Gigawatt-RZ werden oder ein 10-Gigawatt-RZ oder mehrere 10-Gigawatt-RZ. Laut Pressemeldung sollen “mindestens 10 Gigawatt an NVIDIA-Systemen für die nächste Generation der OpenAI-Infrastruktur" bereitgestellt werden. So oder so wird auch nur ein einziges der geplanten Monster-RZ sowohl Energieversorger als auch Umwelt vor nur schwer zu lösende Probleme stellen.

Für die 2026 von NVIDIA und OpenAI geplanten Gigawatt-Rechenzentren soll die neue Rubin-Plattform zum Einsatz kommen. Dazu kombiniert NVIDIA seine Vera-ARM-CPUs mit den neuen Rubin-(CPX-)GPUs, jeder Menge Arbeitsspeicher und schnellem Netzwerk in einem Rack.

Image
Description
NVIDIA Vera Rubin NVL144 CPX-Rack und -Einschub mit Rubin Context-GPUs (Rubin CPX), Rubin-GPUs und Vera-CPUs (Bildquelle: NVIDIA)

Die erste Generation, Vera Rubin NVL144 CPX, soll eine KI-Rechenleistung von 8 EFLOPS (FP4-Inferenz) pro Rack erreichen können. Beim Training ist die Leistung geringer. Geht man von der abgespeckten Plattform Vera Rubin NVL144 (ohne CPX) aus, sinkt für FP8-Workloads die Leistung auf etwa ein Drittel.

Die Rubin-Plattform wurde für Scale-out entwickelt und ist der Nachfolger der Blackwell-GPUs. Ursprünglich wurde Rubin für generative Videoanwendungen und die Verarbeitung von bis zu 100-Millionen-Token-Kontextfenstern konzipiert.

Rubin-CPX-Systeme sollen in der zweiten Hälfte 2026 auf den Markt kommen. Bereits für ein Jahr später ist mit Rubin Ultra NVL576 die nächste Generation angekündigt: mit noch mehr Leistung, noch mehr Speicher, noch schnellerem Netzwerk – und mit noch größerem Strombedarf.

Während ein Rack Vera Rubin NVL144 (ohne CPX) noch mit knapp 200 Kilowatt (kW) Leistung auskommen können soll, ist es bei Vera Rubin NVL144 CPX mit ca. 370 kW schon fast doppelt so viel – aber immer noch kein Vergleich mit den für Rubin Ultra NVL576 angeblich benötigten 600 kW.

Belastung für Infrastruktur und Umwelt

1 Gigawatt (GW) entspricht 1.000.000 kW. Für ein 1-Gigawatt-RZ bräuchte man also ‘nur’ 1.666 Rubin-Ultra-Racks (ungefähr 1.000 mehr, wenn man mit der Vorgänger-Generation Vera Rubin NVL144 CPX plant). In der Praxis werden es weniger Racks sein, da ein Rechenzentrum Strom noch für andere Dinge benötigt, z. B. Storage, Gebäudeinfrastruktur (Licht, Schließsysteme, etc.), unterstützende IT sowie Klimatisierung bzw. Wärmetausch.

Abgesehen von den eher utopischen Kosten für Systeme und Bau bzw. Betrieb der Rechenzentren: Was bedeutet ein GW-RZ für die Infrastruktur oder die Umwelt?

Der Stromanschluss

Eines können wir direkt vorab sagen: Mit erneuerbaren Energien wie Sonne, Wind und Wasser wird sich der Energiehunger eines oder gar mehrerer GW-Rechenzentren nicht stillen lassen. Selbst mit Kernkraft wird das nicht so einfach.

Ein Windrad erzeugt 2-5 Megawatt. Selbst der größte aller Windparks würde sich schwertun, die Träume von Huang und Altmann zu verwirklichen.

Die bei den Big Tech so beliebten Generation-IV-Reaktoren, zu denen auch die Small Modular Reactors (SMR) gehören, sind jedenfalls keine Lösung. SMRs existieren bisher nur auf PowerPoint-Folien oder als Experiment. Geplante Prototypen sollen zwischen 2 MW und 300 MW produzieren können. Zwar können die Module zu größeren Einheiten kombiniert werden. Je nach tatsächlicher Netto-Leistung könnten dazu aber sehr viele Module notwendig sein. Und Redundanz braucht immer mindestens zwei solcher Cluster.

In Deutschland betrug 2024 die Gesamtkapazität (Anschlussleistung aller Rechenzentren) ca. 2,7 GW. Laut einer Bitkom-Studie liegt die Leistungsgrenze mittelgroßer Rechenzentren zwischen 100 kW und 5 MW. Nur 100 hatten eine Anschlussleistung von mehr als 5 MW. Hyperscale-Rechenzentren liegen bei einer Anschlussleistung von über 100 MW. Zum Vergleich: Das Volkswagen-Werk in Wolfsburg gilt als die größte Autofabrik der Welt. Im März 2024 betrug die Grundlast des Produktionsstandortes ca. 45 MW.

Für ein GW-Rechenzentrum bräuchte man eher zwei ausgewachsene AKW wie das im April 2023 stillgelegte Kernkraftwerk Isar II (KKI II). Das KKI II, besser als Isar 2 oder OHU II bekannt, war mit einer Leistung von 1,4 GW das leistungsstärkste deutsche AKW. Das derzeit größte AKW erreicht eine Brutto-Leistung von 1,75 GW; netto sind es 1,66 GW.

Image
Description
KKI II bei Landshut (Bildquelle: PreussenElektra)

Altman ist in dieser Sache konsequent: Er investiert in Start-ups sowohl im Bereich Kernspaltung als auch Kernfusion. Laut dem ChatGPT-Erfinder sind Kernreaktoren die einzige skalierbare, stabile Energiequelle, die den unerbittlichen Anforderungen von KI gerecht werden kann.

Derzeit betriebene AKW basieren allesamt auf Kernspaltung. Die als umweltverträglicher geltende Kernfusion ist eine Zukunftstechnologie, die noch im Entwicklungsstadium ist. Im Gegensatz zur Kernspaltung entstehen bei der Kernfusion keine hochradioaktiven Abfälle. Die Technologie gilt zudem als nachhaltig, da die benötigten Brennstoffe wie Wasserstoff auf der Erde (noch) in großen Mengen vorhanden sind.

Es ist sehr unwahrscheinlich, dass die Technologie bis 2027 einsatzbereit ist. Selbst wenn das der Fall wäre, dauern Genehmigung und Bau eines Kernkraftwerks mehrere Jahre.

Auswirkungen auf die Umwelt

CPX und Ultra soll es ausschließlich mit Flüssigkühlung geben. Nicht nur die Kühlung der Kernreaktoren, sondern auch die Wärmetauscher in den geplanten Rechenzentren werden enorme Mengen an Frischwasser erfordern – eine Ressource, die in vielen Gebieten bereits knapp ist.

Ein NVIDIA-Vera-Rubin-NVL144-CPX-Rack besteht aus bis zu 18 Rubin-Boards. Im Vollausbau sind das 144 Rubin CPX-GPUs, 144 Rubin-GPUs und 36 Vera-CPUs. Diese Prozessoren müssen hergestellt werden. Dazu müssen Ressourcen gewonnen werden. Das passiert notfalls mit umstrittenen Fracking-Methoden, wie es im Osterzgebirge für das für die Elektromobilität so dringend benötigte Lithium geplant ist. Auch die Produktion ist alles andere als ressourcenschonend, wie Branch Education anschaulich in einem Video zeigt. Dazu kommt das Problem des Elektronikschrotts. Wenn Nvidia seinen aggressiven Hardware-Zyklus fortsetzt, ist ein noch schnellerer und noch massiverer Anstieg giftiger Abfallströme die Folge.

Dazu kommen indirekt verursachte Schäden durch Altlasten wie marode Infrastruktur. Hauptursache der großen Waldbrände in Griechenland im letzten Sommer waren wohl defekte Stromleitungen. Das geht aus vorläufigen Daten der griechischen Feuerwehr hervor, die der Nachrichtenagentur Reuters exklusiv vorliegen.

Neue Ansätze sind dringend notwendig

Bereits 2023 mahnte Dr. Angie Qarry, dass im klassischen Computing – und nichts anderes sind die von NVIDIA vorgestellten Rubin-Systeme – die Energieproduktion nicht mehr für die Versorgung aller Ansprüche ausreichen wird. Die Quantenphysikerin und Mathematikerin ist Gründerin und CEO der QDeepTech GmbH sowie Gründerin und CEO/CTO von Shama AI_FlexCo. Grundlage ihrer These ist das Landauer-Prinzip. Demzufolge steigt der Energiebedarf beim klassischen Computing mit der Menge der verarbeiteten Informationen.

Image
Description
Vortrag von Dr. Angie Qarry auf dem OCP Regional Summit 2023 in Prag: “Quantum Computing: What, Why, and What for”

Quantum Machine Learning gilt als eine Sprunginnovation zur Lösung dieser Probleme. Quantencomputer bieten durch neue Berechnungsmodelle ein Vielfaches der Leistung klassischer Computermodelle und Rechenverfahren bei vergleichsweise geringem Energiebedarf. In Projekten wie Projekt PlanQT entwickeln Forschende eine Plattform für Quantenunterstützte Künstliche Intelligenz (QKI). Im Gegensatz zum klassischen, irreversiblen Computing gilt Quantencomputing als reversible Technologie, die theoretisch ohne Energieverlust rechnen kann.