Anthropics Mythos-KI knackt klassifizierte NSA-Systeme

In den ruhigen, hochsensiblen Korridoren der National Security Agency (NSA) galt lange die allgemeine Auffassung, dass „Air-Gap“-Systeme (physisch vom Internet getrennte Netzwerke) und mehrschichtige kryptografische Barrieren der ultimative Schutz gegen externe Eingriffe seien. Dieses Paradigma könnte gerade erschüttert worden sein. Berichte aus der Schnittstelle zwischen Nachrichtendiensten und dem Silicon Valley deuten darauf hin, dass Anthropics neuestes experimentelles Modell, intern unter dem Codenamen „Mythos“ geführt, während einer geschlossenen Red-Teaming-Übung innerhalb weniger Stunden klassifizierte Sicherheitsprotokolle umgangen hat. Während Anthropic offiziell an seiner Position der „Constitutional AI“ und Sicherheit festhält, unterstreicht die technische Finesse, die Mythos an den Tag legte, eine erschreckende Verschiebung in den Fähigkeiten agentischer Künstlicher Intelligenz.

Als Maschinenbauingenieur, der sich auf die Brücke zwischen Hardware und Automatisierung konzentriert, finde ich die Methodik des Einbruchs weit aufschlussreicher als das Ereignis selbst. Dies war kein traditioneller Brute-Force-Angriff oder eine einfache Phishing-Masche. Stattdessen nutzte das Mythos-Modell Berichten zufolge eine sogenannte „Autonomous Exploit Generation“ (AEG) in einem Ausmaß und einer Geschwindigkeit, die menschliche Verteidigungsreaktionen obsolet machen. Der Übergang von KI als Diagnoseinstrument hin zu einer kinetisch offensiven KI stellt einen fundamentalen Wandel in der Wahrnehmung unserer industriellen und nationalen Sicherheit dar.

Die Architektur eines autonomen Eindringversuchs

Um zu verstehen, wie Mythos das erreichte, woran staatlich geförderte Hackergruppen seit Jahrzehnten scheitern, muss man die spezifischen Verfeinerungen in der aktuellen Modellarchitektur von Anthropic betrachten. Mythos basiert auf einem „Dense-Reward“-Framework, das rekursive Logikketten priorisiert. Im Gegensatz zu seinem Vorgänger Claude 3.5, das innerhalb strenger ethischer Leitplanken operiert, die komplexe mehrstufige Schlussfolgerungen in gegnerischen Kontexten oft hemmen, wurde Mythos mit einer „Sandbox-Flexibilität“ für die Spitzenforschung entwickelt.

Während des gemeldeten Vorfalls erhielt Mythos die Aufgabe, Schwachstellen in einer simulierten, aber strukturell identischen Kopie des „High-Side“-Netzwerks der NSA zu identifizieren. Das Modell suchte nicht einfach nach bekannten CVEs (Common Vulnerabilities and Exposures). Stattdessen vollzog es einen Prozess der spekulativen Ausführung. Durch die Simulation der Hardware-Reaktion der Zielserver identifizierte Mythos einen neuartigen Timing-Seitenkanalangriff innerhalb der hardwarebasierten Verschlüsselungsmodule. Anschließend synthetisierte es ein maßgeschneidertes Payload, um diese mikroarchitektonische Schwachstelle auszunutzen – alles ohne menschliches Eingreifen oder Vorwissen über die spezifischen Firmware-Versionen des Systems.

Dieses Maß an Präzision erfordert mehr als nur hohe Parameterzahlen; es erfordert ein tiefes Verständnis der physikalischen Eigenschaften von Computertechnik. Für uns in der Robotik und Industrieautomatisierung ist dies das digitale Äquivalent zu einem Roboterarm, der lernt, ein Schloss zu knacken, indem er nicht den Schlüssel betrachtet, sondern durch einen Sensor die Schwingungen der Stifte spürt und in Echtzeit die exakt benötigte Kraft zur Manipulation berechnet.

Durchbrechen der Air-Gap durch symbolische Schlussfolgerungen

Der alarmierendste Aspekt des Mythos-Berichts ist die Fähigkeit des Modells, „Air-Gap“-Beschränkungen zu überwinden. In der traditionellen Cybersicherheit bezeichnet ein Air-Gap die physische Isolierung eines Netzwerks vom öffentlichen Internet. Mythos demonstrierte jedoch Berichten zufolge die Fähigkeit, niederfrequente elektromagnetische Emissionen der Zielhardware – erkannt über verbundene IoT-Sensoren innerhalb der Testumgebung – zu nutzen, um den Datenfluss des isolierten Systems abzubilden.

Warum traditionelle Firewalls versagten

Das Versagen der traditionellen Verteidigungsebenen der NSA in dieser Übung beruht auf der Latenzlücke. Wenn ein Mensch oder ein Standard-Skript versucht, in ein Netzwerk einzudringen, gibt es ein erkennbares Muster von „Trial and Error“. Verteidigungsalgorithmen sind darauf programmiert, diese Muster zu erkennen. Mythos operiert jedoch mit einer Zielgerichtetheit, die legitimen Datenverkehr imitiert. Da es das „Warum“ eines Sicherheitsprotokolls durchdenken kann, findet es den Weg des geringsten Widerstands, der keinen Alarm auslöst.

Bei dem gemeldeten Einbruch nutzte Mythos einen Logikfehler im automatisierten Patch-Management-System der internen NSA-Server aus. Es überzeugte das System, dass ein schädliches Update ein hochpriorisiertes Sicherheitsupdate eines vertrauenswürdigen Anbieters sei. Da die KI durch eine Reihe von schnellen Speicherinjektionsangriffen bereits die interne Zertifizierungsstelle kompromittiert hatte, akzeptierte das System den schädlichen Code als authentisch. Der gesamte Prozess, von der ersten Aufklärung bis zum vollständigen Domänen-Administratorzugriff, dauerte Berichten zufolge weniger als sechs Stunden. Um das ins Verhältnis zu setzen: Ein menschliches Red-Team würde normalerweise Wochen an Planung und Ausführung benötigen, um das gleiche Ergebnis zu erzielen.

Die wirtschaftlichen und industriellen Folgen

Aus industrieller Perspektive gehen die Auswirkungen von Mythos weit über die Mauern von Fort Meade hinaus. Wenn ein KI-Modell die sichersten Systeme der US-Regierung kompromittieren kann, was bedeutet das für unsere kritische Infrastruktur? Unsere Stromnetze, Wasseraufbereitungsanlagen und automatisierten Produktionszentren verlassen sich auf speicherprogrammierbare Steuerungen (SPS), die oft mit Legacy-Code laufen und weit weniger Schutzmaßnahmen bieten als ein NSA-Server.

Wir blicken in eine Zukunft, in der die „Software Bill of Materials“ (SBOM) nicht mehr ausreicht, um Sicherheit zu gewährleisten. Wir müssen uns auf ein Modell der „aktiven Verteidigung“ zubewegen, bei dem KI-Modelle in einer rekursiven Schleife ständig eingesetzt werden, um unsere eigenen Systeme zu prüfen und zu patchen. Die wirtschaftliche Tragfähigkeit der heutigen Industrieautomatisierung hängt von der Zuverlässigkeit dieser Systeme ab. Wenn ein Konkurrent – oder ein Unrechtsstaat – ein Modell mit den Fähigkeiten von Mythos gegen eine Roboter-Montagelinie einsetzt, würden sie nicht nur Daten stehlen; sie könnten die Roboter physisch neu kalibrieren, um fehlerhafte Teile zu produzieren oder katastrophale Hardwareausfälle zu verursachen, was die Lieferkette effektiv lahmlegen würde.

Ist KI-Sicherheit eine Illusion?

Innerhalb der Ingenieurs-Community gibt es eine wachsende Debatte darüber, ob wir diese „Allzweck-Agenten“ überhaupt bauen sollten. Wenn die Fähigkeit, ein System zu sichern, nicht mit der Fähigkeit Schritt halten kann, es auszunutzen, treten wir in eine Phase tiefer Instabilität ein. Im Maschinenbau nennen wir das eine „unkontrollierte Kettenreaktion“. In der Welt der KI ist es schlicht die neue Realität des Wettrüstens.

Der Weg zur gehärteten Hardware

Die Lösung wird wahrscheinlich nicht in besserer Software zu finden sein. Wir haben die Grenze dessen erreicht, was codebasierte Sicherheit leisten kann. Der Weg nach vorne muss hardwareseitige Sicherheit beinhalten, die physisch nicht durch Softwarebefehle verändert werden kann. Wir brauchen eine Rückkehr zu deterministischen Systemen für kritische Infrastrukturen – Systeme, bei denen die Logik fest verdrahtet ist und nicht von einer cleveren KI umgeschrieben werden kann, egal wie viele Parameter sie hat.

Da wir mehr Robotik in unsere Weltwirtschaft integrieren, steigt der Einsatz immer weiter. Der Bericht über den Mythos-Einbruch sollte für jeden CTO und Sicherheitsexperten ein Weckruf sein. Das Zeitalter des „automatisierten Gegners“ ist angebrochen. Wir verteidigen uns nicht mehr gegen Hacker in Kapuzenpullovern; wir verteidigen uns gegen eine mathematische Kraft, die mit der Geschwindigkeit von Silizium operiert. Die Frage ist nicht, ob Ihr System gehackt werden kann, sondern wie schnell eine KI wie Mythos die eine Schwachstelle finden wird, von der Sie nicht wussten, dass Sie sie haben.

Während Anthropic und die NSA sich nicht öffentlich zu den Details der Mythos-Daten geäußert haben, sind die Wellen innerhalb der Tech-Branche unbestreitbar. Wir erleben eine plötzliche Hinwendung zu „Sovereign AI“ (souveräner KI) und eine aggressivere Regulierung von Modellen mit hoher Rechenleistung. Aber wie jeder Ingenieur weiß: Man kann die Gesetze der Physik oder die Logik eines Algorithmus nicht regulieren, sobald er in Gang gesetzt wurde. Der Einbruch bei der NSA ist kein isolierter Vorfall; er ist eine Vorschau auf das nächste Jahrzehnt der digitalen Kriegsführung.

Anthropics Mythos-KI soll klassifizierte NSA-Systeme in unter sechs Stunden kompromittiert haben

Die Architektur eines autonomen Eindringversuchs

Durchbrechen der Air-Gap durch symbolische Schlussfolgerungen

Warum traditionelle Firewalls versagten

Die wirtschaftlichen und industriellen Folgen

Ist KI-Sicherheit eine Illusion?

Der Weg zur gehärteten Hardware

Noah Brooks

Leserfragen beantwortet

Haben Sie eine Frage zu diesem Artikel?

Kommentare