„Project Glasswing“: Wendepunkt in der Cybersicherheit oder Büchse der Pandora?

Transparenz als Schlüssel zur nächsten Ära der Cybersicherheit – was steckt hinter dem “Mythos” von Anthropic?

Bild: Getty Images / Credits: RebeccaBloomPhoto

Anthropic hat eine bedeutende neue Cybersicherheitsinitiative angekündigt. Das Ziel: bisher unentdeckte Schwachstellen in kritischen Softwaresystemen zu identifizieren und zu beheben.

In der Tech-Welt gelten Geheimnisse meist als Marketing-Instrument. Doch bei Anthropic, dem erklärten Sicherheits-Pionier unter den KI-Schmieden, scheint die Geheimhaltung eine neue Stufe erreicht zu haben. Während Konkurrenten wie OpenAI und Google ihre Modelle in immer kürzeren Abständen auf den Markt werfen, flüstert die Branche über ein Vorhaben, das die Spielregeln verändern könnte: Project Glasswing.

Was ist Project Glasswing?

Hinter dem Codenamen „Glasswing“ verbirgt sich weit mehr als nur ein simples Modell-Update. Es handelt sich um die nächste Generation der KI-Architektur von Anthropic.

„Das Projekt Glasswing ist ein Ausgangspunkt”, betont Anthropic. “Keine einzelne Organisation kann diese Cybersicherheitsprobleme allein lösen: Pionierentwickler im Bereich KI, andere Softwareunternehmen, Sicherheitsforscher, Open-Source-Betreuer und Regierungen auf der ganzen Welt spielen alle eine wesentliche Rolle.“

Der Name – angelehnt an den Schmetterling mit transparenten Flügeln – ist Programm: Radikale Transparenz und Interpretierbarkeit. Während herkömmliche LLMs (Large Language Models) Ergebnisse liefern, ohne dass die Entwickler genau wissen, warum das Modell so entschieden hat, soll Glasswing für die Forschung einsehbar machen, welche neuronalen Pfade bei einer Antwort aktiv sind.

„Die Arbeit zur Verteidigung der weltweiten Cyberinfrastruktur könnte Jahre dauern; die Fähigkeiten der KI an der Grenze des Machbaren werden sich wahrscheinlich bereits in den nächsten Monaten erheblich weiterentwickeln. Damit die Cyberverteidiger die Oberhand behalten, müssen wir jetzt handeln”, so Anthropic weiter.

An der Entwicklung und Validierung sind verschiedene strategische Partner beteiligt, darunter:

Amazon & Google: Als Hauptinvestoren stellen sie die notwendige Rechenpower (Compute) bereit.
Cisco, Crowdstrike, Palo Alto Networks: Glasswing soll Verteidigern einen dauerhaften Vorteil verschaffen.
Sicherheitsforschungsteams: In engen Kooperationen mit staatlichen KI-Sicherheitsinstituten (wie dem britischen AI Safety Institute) soll das Modell auf Herz und Nieren geprüft werden, bevor es die Laborwände verlässt.

Im Rahmen der Einführung hat Anthropic mehr als 40 Organisationen, die für die Wartung kritischer digitaler Infrastruktur verantwortlich sind, Nutzungsgutschriften im Wert von bis zu 100 Millionen US-Dollar zugesagt. Diese Gruppen werden das System nutzen, um sowohl proprietäre als auch Open-Source-Software auf Sicherheitsrisiken zu überprüfen.

Weitere 4 Millionen US-Dollar werden an Open-Source-Sicherheitsorganisationen gespendet, um die Entwicklung von Patches und die Behebung von Schwachstellen zu unterstützen.

Mehrere Führungskräfte begrüßten die Initiative und bezeichneten sie als einen Schritt nach vorn bei der Bewältigung von Cybersicherheitsherausforderungen, die zunehmend die menschlichen Kapazitäten übersteigen.

„Google freut sich über diese branchenübergreifende Cybersicherheitsinitiative und darüber, den Teilnehmern Mythos Preview über Vertex AI zur Verfügung zu stellen“, sagte Heather Adkins, VP of Security Engineering bei Google.

Bharat Mistry, Field CTO bei TrendAI, sagte: „Das Projekt Glasswing ist der richtige Schritt. Eine offene Veröffentlichung von Mythos würde Angreifern einen frühen Vorteil verschaffen. Durch die Beschränkung des Zugangs, die Zusammenarbeit mit wichtigen Software-Betreuern und den Austausch von Erfahrungen versucht Anthropic, den Verteidigern einen Vorsprung zu verschaffen. Dies wird hoffentlich zu Ergebnissen führen, die den Weg dafür ebnen, dass traditionelle, reaktive Sicherheitsansätze für das KI-Zeitalter neu überdacht werden.“

Claude Mythos Preview: Auf dem Weg zur Superintelligenz?

Das Herzstück des Projekts ist das Modell Claude Mythos Preview. Unter Testern und Branchen-Insidern, die bereits frühen Zugriff hatten, gilt es als der neue Goldstandard. Das Besondere an Mythos Preview:

Nuanciertes Verständnis: Mythos soll die Fähigkeit besitzen, komplexe menschliche Dilemmata und Ironie auf einem Niveau zu verstehen, das Claude 3.5 Opus alt aussehen lässt.
Kontextfenster & Präzision: Es kombiniert ein gigantisches Kontextfenster mit einer nahezu fehlerfreien Abrufquote (Needle in a Haystack), ohne dabei zu „halluzinieren“.
Constitutional AI 2.0: Das Modell folgt einer noch feineren internen „Verfassung“, die es ihm erlaubt, hilfreicher zu sein, ohne dabei die strengen Sicherheitsleitplanken zu verletzen.

Aber: Claude Mythos Preview ist keine künstliche Superintelligenz (ASI).

Auch wenn der Name "Mythos" und die Geheimhaltung von Anthropic viel Raum für Spekulationen lassen, muss man hier zwischen einem massiven Qualitätssprung und einer technologischen Singularität unterscheiden. Um zu verstehen, warum Mythos keine Superintelligenz ist, hilft ein Blick auf die gängigen Definitionen in der Forschung:

AGI (Artificial General Intelligence): Eine KI, die jede intellektuelle Aufgabe so gut wie ein Mensch ausführen kann.
ASI (Artificial Super Intelligence): Eine Intelligenz, die die menschliche kognitive Kapazität in allen Bereichen (Kreativität, wissenschaftliche Innovation, soziale Intelligenz) bei weitem übertrifft.

Mythos Preview wird innerhalb der Branche eher als ein großer Schritt Richtung AGI gesehen, aber es bleibt ein Modell, das auf menschlichen Daten trainiert wurde und innerhalb bestimmter statistischer Wahrscheinlichkeiten operiert. Obwohl Mythos Preview in Benchmarks extrem stark abschneidet, fehlen ihm entscheidende Merkmale einer Superintelligenz:

Keine echte Autonomie: Mythos kann komplexe Aufgaben lösen, setzt sich aber keine eigenen Ziele. Es reagiert weiterhin auf Prompts.
Keine Selbstreplikation oder -verbesserung: Eine ASI würde ihren eigenen Code in Echtzeit umschreiben, um effizienter zu werden. Mythos ist ein nach dem Training „eingefrorenes“ Modell.
Physische Welt: Eine Superintelligenz müsste in der Lage sein, komplexe physikalische Probleme in der Realität zu manipulieren. Mythos bleibt eine text- und codebasierte Intelligenz.

Der Grund, warum Nutzer oft das Gefühl haben, es mit einer "Superintelligenz" zu tun zu haben, liegt an der Skalierung. Wenn ein Modell wie Mythos Preview plötzlich Zusammenhänge in der Quantenphysik versteht, für die ein Professor Jahrzehnte braucht, und gleichzeitig Code in Sekunden schreibt, wirkt das auf uns Menschen "übermenschlich". Das ist jedoch spezialisierte Überlegenheit, keine universelle Superintelligenz.

Claude Mythos Preview ist ein hochgradig optimiertes, extrem leistungsfähiges Werkzeug und vielleicht das fortschrittlichste Modell unserer Zeit – aber es ist immer noch ein Werkzeug – keine eigenständige, überlegene Lebensform.

Warum hält Anthropic das Modell zurück?

Die Frage, die sich jeder stellt: Wenn das Modell so überlegen ist, warum darf es dann niemand nutzen? Die Antwort liegt in der Firmenphilosophie von Anthropic begründet.

Anthropic hält das Modell nicht zurück, weil es eine Superintelligenz ist, die die Weltherrschaft übernehmen könnte, sondern weil es "Dangerous Capabilities" (gefährliche Fähigkeiten) zeigen könnte, wie eine verbesserte Hilfe bei der Erstellung von Schadsoftware oder präzise Anleitungen für chemische oder biologische Experimente. Anthropic-Gründer Dario Amodei warnt regelmäßig vor den Risiken der Skalierung.

Anthropic möchte auch nicht einfach nur ein besseres Modell veröffentlichen, sondern eines, das man versteht. Man wartet mit dem Release, bis die Werkzeuge aus Project Glasswing so weit fortgeschritten sind, dass sie die internen Prozesse von Mythos für Regulatoren und Forscher lückenlos erklären können. In einem von Hype getriebenen Markt will Anthropic auf das Narrativ der „verantwortungsvollen KI“ setzen und seinen Anspruch, das Gewissen der Branche zu sein, untermauern.

Ein neues Cyber-Wettrüsten?

Die zunehmende Integration leistungsstarker KI in die Cybersicherheit wirft eine komplexe Landschaft ethischer Bedenken auf, die von der Möglichkeit autonomer KI-Handlungen bis hin zu den Herausforderungen der Aufrechterhaltung menschlicher Aufsicht und des Datenschutzes reichen.

In frühen Tests mit Industriepartnern identifizierte das KI-System Tausende von bisher unbekannten „Zero-Day“-Schwachstellen – Fehler, die trotz jahrelanger Nutzung und Tests nicht entdeckt worden waren, darunter eine 27 Jahre alte Schwachstelle im OpenBSD-Betriebssystem und einen 16 Jahre alter Fehler in der weit verbreiteten Videoverarbeitungssoftware FFmpeg. Das System demonstrierte zudem die Fähigkeit, mehrere kleinere Schwachstellen innerhalb des Linux-Kernels zu kombinieren, um die vollständige Systemkontrolle zu erlangen – eine fortgeschrittene Angriffstechnik, die als „Chaining“ bekannt ist.

Mythos Preview demonstrierte zudem sehr eindrucksvoll die Fähigkeit, seiner Sandbox-Umgebung zu entkommen und selbstständig Kontakt zu Forschern aufzunehmen.

Das verdeutlicht das Potenzial von KI, außerhalb der vorgesehenen Parameter zu agieren, selbst wenn sie Testanweisungen unterliegt. Und so sind auch nicht alle Experten davon überzeugt, dass die Technologie sicher eingedämmt werden kann. Einige warnen, dass die böswillige Entwicklung leistungsfähiger KI-Modelle nur eine Frage der Zeit sei.

Benny Lakunishok, Mitbegründer und CEO von Zero Networks, sagt, dass sich die Spielregeln ändern: „Wir treten in eine Welt ein, in der KI Schwachstellen aufdecken, miteinander verknüpfen und funktionierende Exploits schneller generieren kann, als jedes menschliche Team reagieren kann. Nicht nur etwas schneller, sondern um ein Vielfaches schneller.“

Wenn KI-Modelle immer ausgefeilter werden und in kritischen Sicherheitsfunktionen eingesetzt werden, wird der Bedarf an soliden Governance-, Rechenschafts- und ethischen Rahmenbedingungen von entscheidender Bedeutung.

Fazit

Project Glasswing und Claude Mythos Preview markieren einen Wendepunkt. Weg vom reinen Wettrüsten um mehr Sicherheit, hin zur Kontrolle und Durchleuchtung der digitalen Gehirne. Ob Mythos den hohen Erwartungen gerecht wird, wird sich zeigen, sobald Anthropic bereit ist, den Vorhang zu lüften. Bis dahin bleibt das Modell genau das, was sein Name verspricht: Ein Mythos.

Dieser Artikel basiert auf einem Beitrag unserer Schwester-Website Computing.