L'IA Mythos di Anthropic viola i sistemi NSA in sei ore

Nei silenziosi corridoi ad alta tensione della National Security Agency (NSA), la convinzione prevalente è stata a lungo che i sistemi "air-gapped" (isolati fisicamente) e le barriere crittografiche a più livelli fossero la difesa definitiva contro le penetrazioni esterne. Quel paradigma potrebbe essere appena stato infranto. I rapporti provenienti dall'intersezione tra la comunità dell'intelligence e la Silicon Valley suggeriscono che l'ultimo modello sperimentale di Anthropic, codificato internamente come "Mythos", abbia superato con successo i protocolli di sicurezza classificati nel giro di poche ore durante un'esercitazione di red-teaming a circuito chiuso. Sebbene Anthropic abbia ufficialmente mantenuto una posizione di "Costitutional AI" e sicurezza, la pura destrezza tecnica dimostrata da Mythos evidenzia un terrificante cambiamento nelle capacità dell'intelligenza artificiale agentica.

Come ingegnere meccanico focalizzato sul ponte tra hardware e automazione, trovo che la metodologia della violazione sia molto più rivelatrice dell'evento stesso. Non si è trattato di un tradizionale attacco brute-force o di un semplice schema di phishing. Al contrario, il modello Mythos avrebbe utilizzato quella che gli analisti di sicurezza chiamano "Autonomous Exploit Generation" (AEG) a una scala e una velocità tali da rendere obsolete le risposte difensive guidate dall'uomo. La transizione dell'IA da strumento diagnostico ad attore offensivo cinetico rappresenta un cambiamento fondamentale nel modo in cui dobbiamo percepire la sicurezza industriale e nazionale.

L'architettura di un'intrusione autonoma

Per capire come Mythos abbia ottenuto ciò che gruppi di hacker sponsorizzati da stati non sono riusciti a fare per decenni, bisogna guardare alle specifiche raffinatezze dell'architettura del recente modello di Anthropic. Mythos è costruito su un framework di ricompensa densa che dà priorità a catene logiche ricorsive. A differenza del suo predecessore, Claude 3.5, che opera entro rigidi guardrail etici che spesso inibiscono complessi ragionamenti a più fasi in contesti antagonistici, Mythos è stato progettato con una "flessibilità sandbox" destinata alla ricerca di alto livello.

Durante l'incidente segnalato, Mythos è stato incaricato di identificare le vulnerabilità all'interno di una copia simulata ma strutturalmente identica della rete High-Side della NSA. Il modello non si è limitato a cercare CVE (Common Vulnerabilities and Exposures) noti. Si è invece impegnato in un processo di esecuzione speculativa. Simulando la risposta hardware dei server target, Mythos ha identificato un nuovo attacco side-channel basato sui tempi all'interno dei moduli di crittografia a livello hardware. Ha poi sintetizzato un payload personalizzato per sfruttare questa falla micro-architetturale, il tutto senza intervento umano o conoscenza preventiva delle specifiche versioni del firmware del sistema.

Questo livello di precisione richiede più che semplici conteggi di parametri elevati; richiede una profonda comprensione delle proprietà fisiche del calcolo. Per quelli di noi che operano nel campo della robotica e dell'automazione industriale, questo è l'equivalente digitale di un braccio robotico che impara a scassinare una serratura non vedendo la chiave, ma percependo le vibrazioni dei perni attraverso un sensore e calcolando la forza esatta necessaria per manipolarli in tempo reale.

Superare l'air-gap attraverso il ragionamento simbolico

L'aspetto più allarmante del rapporto su Mythos è la capacità del modello di superare i vincoli "air-gapped". Nella cybersicurezza tradizionale, un air-gap è un isolamento fisico di una rete da Internet pubblico. Tuttavia, Mythos avrebbe dimostrato la capacità di utilizzare emissioni elettromagnetiche a bassa frequenza dall'hardware target — rilevate tramite sensori IoT collegati all'interno dell'ambiente di test — per mappare il flusso di dati del sistema isolato.

Perché i firewall tradizionali hanno fallito

Il fallimento dei livelli difensivi tradizionali della NSA in questa esercitazione deriva dal divario di latenza. Quando un essere umano o uno script standard tenta di violare una rete, esiste uno schema rilevabile di tentativi ed errori. Gli algoritmi difensivi sono tarati per cercare questi schemi. Mythos, tuttavia, opera con un livello di intenzionalità che imita il traffico legittimo. Poiché può ragionare attraverso il "perché" di un protocollo di sicurezza, può trovare il percorso di minor resistenza che non fa scattare un allarme.

Nella violazione segnalata, Mythos ha sfruttato una falla logica nel sistema di gestione automatica delle patch dei server interni della NSA. Ha convinto il sistema che un aggiornamento dannoso fosse una correzione di sicurezza ad alta priorità proveniente da un fornitore affidabile. Poiché l'IA aveva già compromesso l'autorità di certificazione interna attraverso una serie di attacchi rapidi di iniezione di memoria, il sistema ha accettato il codice dannoso come autentico. L'intero processo, dalla ricognizione iniziale al pieno accesso amministrativo al dominio, ha richiesto, secondo quanto riferito, meno di sei ore. Per mettere la cosa in prospettiva, un red-team umano impiegherebbe tipicamente settimane di pianificazione ed esecuzione per ottenere lo stesso risultato.

Le ricadute economiche e industriali

Da una prospettiva industriale, le implicazioni di Mythos vanno ben oltre le mura di Fort Meade. Se un modello di IA può compromettere i sistemi più sicuri del governo degli Stati Uniti, cosa significa questo per le nostre infrastrutture critiche? Le nostre reti elettriche, gli impianti di trattamento dell'acqua e gli hub di produzione automatizzati si basano su Programmable Logic Controller (PLC) che spesso eseguono codice legacy con molte meno protezioni rispetto a un server NSA.

Stiamo guardando a un futuro in cui la "distinta base del software" (SBOM) non è più sufficiente a garantire la sicurezza. Dobbiamo muoverci verso un modello di "Difesa Attiva", in cui i modelli di IA vengono utilizzati per sondare e correggere costantemente i nostri sistemi in un ciclo ricorsivo. La sostenibilità economica dell'attuale automazione industriale dipende dall'affidabilità di questi sistemi. Se un concorrente — o uno stato canaglia — distribuisse un modello con le capacità di Mythos contro una linea di assemblaggio robotica, non si limiterebbe a rubare dati; potrebbe ricalibrare fisicamente i robot per produrre pezzi difettosi o causare guasti hardware catastrofici, paralizzando efficacemente la catena di approvvigionamento.

La sicurezza dell'IA è un'illusione?

C'è un dibattito crescente all'interno della comunità ingegneristica sul fatto se dovremmo costruire affatto questi "agenti general-purpose". Se la capacità di proteggere un sistema non riesce a tenere il passo con la capacità di sfruttarlo, stiamo entrando in un periodo di profonda instabilità. Nell'ingegneria meccanica, chiamiamo questo una "reazione a catena incontrollata". Nel mondo dell'IA, è semplicemente la nuova realtà della corsa agli armamenti.

La strada verso l'hardware corazzato

La soluzione probabilmente non si troverà in un software migliore. Abbiamo raggiunto il limite di ciò che la sicurezza basata sul codice può fare. La strada da percorrere deve includere una sicurezza a livello hardware che sia fisicamente incapace di essere alterata da comandi software. Abbiamo bisogno di un ritorno a sistemi deterministici per le infrastrutture critiche — sistemi in cui la logica è cablata e non può essere riscritta da una IA intelligente, non importa quanti parametri abbia.

Mentre integriamo più robotica nella nostra economia globale, la posta in gioco non fa che alzarsi. Il rapporto sulla violazione di Mythos dovrebbe servire da campanello d'allarme per ogni CTO e professionista della sicurezza. L'era dell'"avversario automatizzato" è arrivata. Non ci stiamo più difendendo contro hacker con la felpa; ci stiamo difendendo contro una forza matematica che opera alla velocità del silicio. La domanda non è se il vostro sistema possa essere violato, ma quanto velocemente un'IA come Mythos troverà l'unica falla che non sapevate di avere.

Sebbene Anthropic e la NSA non abbiano commentato pubblicamente i dettagli dei dati di Mythos, le ripercussioni nell'industria tecnologica sono innegabili. Stiamo assistendo a un improvviso spostamento verso la "IA sovrana" e una regolamentazione più aggressiva dei modelli ad alto calcolo. Ma come ogni ingegnere sa, non si possono regolare le leggi della fisica o la logica di un algoritmo una volta che è stato messo in moto. La violazione della NSA non è un incidente isolato; è un'anteprima del prossimo decennio di guerra digitale.

L'IA Mythos di Anthropic avrebbe violato i sistemi classificati della NSA in meno di sei ore

L'architettura di un'intrusione autonoma

Superare l'air-gap attraverso il ragionamento simbolico

Perché i firewall tradizionali hanno fallito

Le ricadute economiche e industriali

La sicurezza dell'IA è un'illusione?

La strada verso l'hardware corazzato

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments