Gefährlicher Trend: Tokenmaxxing

Wenn KI‑Nutzung zum Statussymbol wird – und Unternehmen die falsche Metrik gamifizieren

Bild: KI

„Tokenmaxxing“ steht für eine neue Arbeitskultur‑Debatte: In Teilen der Tech‑Welt wird der Verbrauch von KI‑Tokens zum Signal für „AI‑Adoption“ und manchmal sogar zum Statussymbol. Medienberichte über interne Dashboards bei Großunternehmen zeigen, wie schnell aus Telemetrie ein Wettbewerb werden kann – mit Risiken für Budget, Governance und Produktivität.

Was sind Tokens? Tokens sind kleine Texteinheiten, in die Sprachmodelle Eingaben und Ausgaben zerlegen. Tokens sind Grundlage für die Abrechnungsmodelle viele Anbieter – und neuerdings auch für die Messung von Produktivität. „Tokenmaxxing“ beschreibt den Versuch, möglichst viele Tokens zu verbrauchen, um intensive KI‑Nutzung zu demonstrieren; teils geschieht das sogar durch parallele Agenten‑Workflows, die im Hintergrund laufen.

Warum jetzt? Der Grund ist banal: Token machen den Verbrauch sichtbar; Sichtbarkeit erzeugt Vergleichbarkeit – in einer Phase, in der Unternehmen KI‑Tools breit freigeben und Token‑Budgets teils sehr großzügig auslegen, beschleunigt durch den Boom agentischer KI.

Das Gefährliche daran? Token‑Volumen kann auch ein Automationsartefakt sein. Betrachtet man die Kennzahl nur als Produktivitätsmaß ohne Kontext, kann das hohe Kosten verursachen – Berichten zufolge erreichen die monatlichen Rechnungen für den KI-Verbrauch in einigen Tech-Unternehmen bereits sechsstellige Beträge – und stellt ein Sicherheitsrisiko dar.

Goodhart’s Law in der Praxis

Goodharts Gesetz besagt: „Wenn ein Maßstab zum Ziel wird, hört er auf, ein guter Maßstab zu sein.“

Die folgenden Beispiele zeigen, dass Token‑Verbrauch als Zielgröße zu sinnlosem Verbrauch führen kann.

Mitarbeitende von Meta Platforms messen sich in einem intensiven internen Wettbewerb um die maximale Nutzung der KI und wetteifern um einen Platz an der Spitze der Rangliste mit Titeln wie „Token Legend“, “Model Connaisseur” oder „Session Immortal“. Innerhalb von 30 Tagen wurden über 60 Billionen verwendete Token erfasst. Das Tool wurde Anfang April 2026 innerhalb von 48 Stunden abgeschaltet, nachdem Daten aus der internen Rangliste nach außen gelangt waren.

Dass das Thema nicht auf Silicon Valley beschränkt bleibt, illustriert ein Beispiel aus dem Payments‑Umfeld: Business Insider berichtet, Visa habe angegeben, im März rund 1,9 Billionen Tokens pro Monat zu verbrauchen – etwa doppelt so viel wie im Februar – und Teams für schnellere Ergebnisse durch KI‑Einsatz zu würdigen.

Besonders heikel wird es dort, wo Token‑ oder Tool‑Nutzung nicht nur aggregiert, sondern personenbezogen sichtbar wird. JPMorgan soll mit internen Dashboards die Nutzung von Tools wie GitHub Copilot und Anthropic‑Modellen erfassen und Nutzergruppen kategorisieren.

Auch bei Disney soll es ein „AI Adoption Dashboard“ geben, das Token‑ und Request‑Zahlen über Tools wie Cursor und Claude ausweist – inklusive „Leaderboard“-Anmutung. Ein Nutzer soll demnach Claude in einem Zeitraum von neun Arbeitstagen rund 460.000 Mal aufgerufen haben; eigentlich können nur autonome Agenten solche Invocation‑Raten erzeugen.

Telemetrie ja, aber Outcome vor Activity

Kennzahlen verlieren ihre Aussagekraft, sobald Menschen mit ihrem Verhalten das Ergebnis zu manipulieren. Das eigentliche Ziel ist so nicht zu erreichen. TechCrunch formuliert es deutlicher: Wer Inputs misst, bekommt mehr Inputs – aber nicht zwingend bessere Outputs; gerade bei AI‑Coding könne mehr generierter Code zugleich mehr Nacharbeit bedeuten. The Pragmatic Engineer schlussfolgert: "Tokenmaxxing ist gut für KI-Anbieter, schlecht für alle anderen.“

Doch wie immer ist es nicht nur schwarz oder weiß.

Tokens als Kosten‑ und Kapazitätsmaß sind nützlich; als Statussymbol oder Leaderboard‑Währung drohen sie, die Produktivität zu verzerren. Organisationen, die das erkannt haben, sind sich einig: keine Incentives, die Menschen (oder Agenten) dazu bringen, „mehr Verbrauch“ mit „mehr Wert“ gleichzusetzen.

Indeed‑CIO Anthony Moisant betonte einem Interview, dass man zwar Token‑Nutzung im Hintergrund tracke, aber definitiv kein Leaderboard wolle. „Ich glaube, wann immer wir eine solche Kennzahl oder einen solchen Maßstab haben, der Teil eines Anreizsystems ist, schaffen wir damit einen Fehlanreiz, und die Menschen beginnen, bestimmte Dinge zu tun“, sagte Moisant. Stattdessen wolle man stärker auf Outcome-nahe Metriken schauen (z. B. Geschwindigkeit des Shippings, Kundeneffekte), nicht auf reine Aktivitätsmessung.

Mikhail Parakhin, CTO bei Shopify, erläuterte in einer Episode des Latent-Space-Podcasts ausführlich, wie es konkret aussieht, wenn ein 20 Jahre altes Softwareunternehmen mit einem unbegrenzten Opus-4.6-Token-Budget volle Kraft auf KI setzt. Parakhin spricht darüber, wie der Ansatz von Shopify zur Skalierung der KI-Entwicklung und zur Steigerung der internen technischen Produktivität beitrug.

Image

Description

Screenshot aus dem „Latent Space“-Podcast

Tokenmaxxing ist damit weniger ein Technik-Trend als ein Leadership- und Kulturtest für Unternehmen, die KI in großem Maßstab einführen.