Die Zukunft der KI gehört nicht der GPU allein

Warum CPUs plötzlich wieder im Zentrum der AI-Ökonomie stehen – und was das für IT-Verantwortliche bedeutet

Bild: Getty Images / Credits: ploy

Der deutliche Kurssprung der Intel-Aktie im April 2026 ist mehr als eine kurzfristige Börsenreaktion: Er könnte auf eine strukturelle Verschiebung im KI-Markt hindeuten – weg von einer starken GPU-Fokussierung hin zu einer Architektur, in der CPUs wieder eine wichtigere Rolle spielen.

Intel hat im ersten Quartal 2026 geliefert: Mit 13,6 Milliarden US-Dollar Umsatz und einem deutlich über den Erwartungen liegenden Gewinn je Aktie übertraf der Hersteller die Prognosen der Analysten klar.

Auffällig ist das Wachstum im Rechenzentrums- und KI-Geschäft um 22 Prozent. Das deutet darauf hin, dass Intel vom AI-Boom stärker profitiert als in vielen Prognosen bislang unterstellt.

Die Börse reagierte entsprechend: Am 24. April stieg die Aktie um rund 24 Prozent auf über 82 US-Dollar – der stärkste Tagesanstieg seit Jahrzehnten.

Die Zahlen bestätigen, was sich seit Monaten abzeichnet: Die Nachfrage nach KI-Infrastruktur verschiebt sich. Intel spricht von einer „beispiellosen Nachfrage nach Silizium“, die aktuell sogar die Lieferfähigkeit übersteigt.

Der Grund liegt im Wandel der KI-Workloads. Laut CEO Lip-Bu Tan verlagert sich der Fokus von großen Trainingsmodellen hin zu Inference und agentischen Systemen – also KI, die eigenständig Aufgaben ausführt und orchestriert.

Als Produkt in KI-Inferenz- und Agentensystemen sowie als Foundry für Drittkunden profitiert Intel doppelt von dem Wandel.

Die Börsenrally hat allerdings auch eine Kehrseite. Intel wird inzwischen mit einem hohen Forward-KGV (teils deutlich über 80) bewertet – das schraubt die Erwartungen an weiteres Wachstum massiv nach oben. Dabei bleibt offen, ob Intel:

seine Fertigungsroadmap (18A, 14A) planmäßig liefern kann
im Foundry-Geschäft gegen TSMC bestehen wird
langfristig mit Nvidia im AI-Ökosystem konkurrieren kann

Ein Meilenstein ist der Deal mit Tesla. Der Autobauer will Intels kommende 14A-Fertigungstechnologie für sein „Terafab“-Projekt nutzen – einen KI-Chip-Komplex in Texas. Damit gelingt es dem Konzern, erstmals einen namhaften Kunden für die eigene Auftragsfertigung zu gewinnen – ein zentraler Baustein der Turnaround-Strategie.

„Agentische KI wird das Verhältnis von CPU zu GPU verändern. Also müssen wir einfach mehr CPUs zu unseren GPU-Servern hinzufügen, oder?“

AMD bestätigt den Trend. In einem aktuellen Blogpost argumentiert Dan McNamara, Senior Vice President and General Manager, Compute & Enterprise AI bei AMD, dass agentische KI die klassische Arbeitsteilung zwischen CPU und GPU grundlegend verändert.

Während GPUs weiterhin Training und Modellberechnungen übernehmen, rücken CPUs bei zentralen Aufgaben nach vorn:

Orchestrierung komplexer Workflows
Steuerung von Agenten und API-Aufrufen
Sicherheits- und Policy-Checks
Datenmanagement und Integration in Unternehmenssysteme

In Konsequenz verschiebt sich das Verhältnis von bislang 1 CPU für 4–8 GPUs in Richtung 1:1 – oder sogar darüber hinaus.

AMD-CEO Lisa Su prognostizierte bei der Bekanntgabe der Quartalsergebnisse für den Server-CPU-Markt ein jährliches Wachstum von über 35 Prozent.

“Während wir zuvor von einem jährlichen Wachstum des Marktes für Server-CPUs von 18 % ausgegangen sind, verändert der durch KI-Agenten bedingte strukturelle Anstieg des Rechenbedarfs die Rechnung. Wir gehen nun davon aus, dass der gesamte adressierbare Markt für Server-CPUs jährlich um mehr als 35 % wachsen und bis 2030 ein Volumen von über 120 Milliarden US-Dollar erreichen wird”, schreibt auch McNamara.

Euphorie mit Risiken

Die Kursentwicklungen bei Intel und AMD lassen sich nicht allein anhand von Quartalszahlen erklären. Sie kann auch als Hinweis auf einen Paradigmenwechsel in der KI-Infrastruktur gelesen werden:

GPUs und andere Beschleuniger bleiben für Training und Inference zentral –
ohne CPUs für Logik, Orchestrierung und Integration wird die nächste KI-Generation jedoch nicht skalieren.

Davon wollen auch andere profitieren.

In der Debatte um die künftige Chip-Architektur für KI spielt neben CPUs und GPUs auch Googles Tensor Processing Unit (TPU) eine Rolle. TPUs nehmen eine andere Marktposition ein als Intel- oder AMD-CPUs: Sie sind als spezialisierte Beschleuniger für KI-Workloads ausgelegt und werden sowohl in der Google-Cloud-Infrastruktur als auch in Google-eigenen Diensten eingesetzt.

Google stellt TPU-Kapazität über Google Cloud bereit; das Unternehmen vermarktet damit einen Teil der eigenen, vertikal integrierten Infrastruktur. Im April 2024 kündigte Google zudem gemeinsam mit Axion eigene Arm-basierte Rechenzentrums-CPUs für die Cloud an. In der Summe zielt diese Strategie darauf ab, sich bei zentralen Bausteinen der KI-Infrastruktur weniger abhängig von externen Chipanbietern zu machen.

Passend zum Trend hin zu Inference und agentischen Systemen teilte Google im April 2026 seine achte TPU-Generation erstmals in zwei Varianten auf: TPU 8t für Training und TPU 8i für Inference. Laut Google soll das Training mit TPU 8t gegenüber der Vorgängergeneration bis zu dreimal schneller sein; TPU 8i soll für Inference eine um 80 Prozent bessere Performance pro Dollar liefern.

Der Unterschied zu klassischen Server-CPUs ist grundlegend:

CPUs (Intel/AMD) sind General-Purpose-Prozessoren und übernehmen in KI-Systemen häufig Logik, Datenvorbereitung, Orchestrierung sowie Integrations- und Sicherheitsaufgaben.
TPUs sind für KI-spezifische Rechenoperationen optimiert, insbesondere für effizientes Training und Inference in großen Clustern.

Im Unterschied zu CPU-Hardware, die Unternehmen kaufen und in eigenen Servern betreiben können, verwendet Google seine TPUs hauptsächlich, um eigene Dienste und KI-Modelle (Gemini und PaLM) zu betreiben.

Für Intel und AMD ist das relevant

Je mehr Trainings- und Inference-Workloads innerhalb eines Hyperscaler-Ökosystems auf eigene Beschleuniger verlagert werden, desto weniger zwingend ist der Zukauf externer Hardware. Ein Beispiel ist Anthropic, das laut eigener Mitteilung den Einsatz von Google-Cloud-TPUs deutlich ausweiten will. Im April gab Google bekannt, ebenfalls weitere 40 Mrd. USD in Anthropic investieren zu wollen. Der Suchmaschinenriese gehört seit Jahren zu den Geldgebern des KI-Pioniers und will damit die Zusammenarbeit stärken – lies: die Abhängigkeit erhöhen. Das ist umso interessanter, da auch Amazon um Anthropic buhlt und gern auf den eigenen Trainium-, Inferentia- und Graviton-Chips in der AWS-Cloud rechnen lassen würde.

Trotz eigener Chips bleibt Amazon ein großer Kunde von Nvidia. Der wiederum reagierte ebenfalls auf die Verschiebung in Richtung Inference: Ende 2025 vereinbarte der Konzern mit Groq einen Deal, der formal als nicht exklusive Lizenz für Groqs Inference-Technologie beschrieben wird; zugleich wechselten Groq-Gründer Jonathan Ross und weitere Führungskräfte sowie Teile des Teams zu Nvidia.

Groq bleibt laut den Beteiligten als Unternehmen unabhängig und betreibt auch seinen Chatbot weiter; strategisch kann Nvidia die LPU-Architektur jedoch in die eigene Plattform integrieren, um besonders latenzkritische Inference- und Echtzeit-Workloads (etwa für agentische Systeme) neben klassischen GPU-Workloads abzudecken.

Fazit für IT-Verantwortliche

Für die nächste Phase der KI-Entwicklung dürfte weniger ein einzelner Chiptyp entscheidend sein als das Zusammenspiel von CPUs, GPUs und spezialisierten Beschleunigern innerhalb der jeweiligen Architektur.

Für IT-Verantwortliche in Unternehmen werden Architekturentscheidungen wichtiger werden als die Wahl eines einzelnen Chipanbieters: Training, Inference und agentische Workflows werden je nach Latenz-, Kosten- und Compliance-Anforderungen zunehmend auf unterschiedliche Kombinationen aus CPU, GPU und spezialisierten Beschleunigern verteilt.

Damit steigen zugleich die Anforderungen an Portabilität (inklusive Exit-Optionen), an ein belastbares Kosten- und Kapazitätsmanagement für Inference sowie an Governance für Datenflüsse und Betriebsmodelle über On-Premises- und Cloud-Umgebungen hinweg.