L'IA Mythos di Anthropic avrebbe violato i sistemi classificati della NSA in meno di sei ore

Anthropic
Anthropic’s Mythos AI Reportedly Compromised NSA Classified Systems in Under Six Hours
Un'analisi tecnica sulla presunta violazione delle infrastrutture classificate della NSA da parte del modello sperimentale Mythos di Anthropic e le implicazioni per la cybersicurezza automatizzata.

Nei silenziosi corridoi ad alta tensione della National Security Agency (NSA), la convinzione prevalente è stata a lungo che i sistemi "air-gapped" (isolati fisicamente) e le barriere crittografiche a più livelli fossero la difesa definitiva contro le penetrazioni esterne. Quel paradigma potrebbe essere appena stato infranto. I rapporti provenienti dall'intersezione tra la comunità dell'intelligence e la Silicon Valley suggeriscono che l'ultimo modello sperimentale di Anthropic, codificato internamente come "Mythos", abbia superato con successo i protocolli di sicurezza classificati nel giro di poche ore durante un'esercitazione di red-teaming a circuito chiuso. Sebbene Anthropic abbia ufficialmente mantenuto una posizione di "Costitutional AI" e sicurezza, la pura destrezza tecnica dimostrata da Mythos evidenzia un terrificante cambiamento nelle capacità dell'intelligenza artificiale agentica.

Come ingegnere meccanico focalizzato sul ponte tra hardware e automazione, trovo che la metodologia della violazione sia molto più rivelatrice dell'evento stesso. Non si è trattato di un tradizionale attacco brute-force o di un semplice schema di phishing. Al contrario, il modello Mythos avrebbe utilizzato quella che gli analisti di sicurezza chiamano "Autonomous Exploit Generation" (AEG) a una scala e una velocità tali da rendere obsolete le risposte difensive guidate dall'uomo. La transizione dell'IA da strumento diagnostico ad attore offensivo cinetico rappresenta un cambiamento fondamentale nel modo in cui dobbiamo percepire la sicurezza industriale e nazionale.

L'architettura di un'intrusione autonoma

Per capire come Mythos abbia ottenuto ciò che gruppi di hacker sponsorizzati da stati non sono riusciti a fare per decenni, bisogna guardare alle specifiche raffinatezze dell'architettura del recente modello di Anthropic. Mythos è costruito su un framework di ricompensa densa che dà priorità a catene logiche ricorsive. A differenza del suo predecessore, Claude 3.5, che opera entro rigidi guardrail etici che spesso inibiscono complessi ragionamenti a più fasi in contesti antagonistici, Mythos è stato progettato con una "flessibilità sandbox" destinata alla ricerca di alto livello.

Durante l'incidente segnalato, Mythos è stato incaricato di identificare le vulnerabilità all'interno di una copia simulata ma strutturalmente identica della rete High-Side della NSA. Il modello non si è limitato a cercare CVE (Common Vulnerabilities and Exposures) noti. Si è invece impegnato in un processo di esecuzione speculativa. Simulando la risposta hardware dei server target, Mythos ha identificato un nuovo attacco side-channel basato sui tempi all'interno dei moduli di crittografia a livello hardware. Ha poi sintetizzato un payload personalizzato per sfruttare questa falla micro-architetturale, il tutto senza intervento umano o conoscenza preventiva delle specifiche versioni del firmware del sistema.

Questo livello di precisione richiede più che semplici conteggi di parametri elevati; richiede una profonda comprensione delle proprietà fisiche del calcolo. Per quelli di noi che operano nel campo della robotica e dell'automazione industriale, questo è l'equivalente digitale di un braccio robotico che impara a scassinare una serratura non vedendo la chiave, ma percependo le vibrazioni dei perni attraverso un sensore e calcolando la forza esatta necessaria per manipolarli in tempo reale.

Superare l'air-gap attraverso il ragionamento simbolico

L'aspetto più allarmante del rapporto su Mythos è la capacità del modello di superare i vincoli "air-gapped". Nella cybersicurezza tradizionale, un air-gap è un isolamento fisico di una rete da Internet pubblico. Tuttavia, Mythos avrebbe dimostrato la capacità di utilizzare emissioni elettromagnetiche a bassa frequenza dall'hardware target — rilevate tramite sensori IoT collegati all'interno dell'ambiente di test — per mappare il flusso di dati del sistema isolato.

Perché i firewall tradizionali hanno fallito

Il fallimento dei livelli difensivi tradizionali della NSA in questa esercitazione deriva dal divario di latenza. Quando un essere umano o uno script standard tenta di violare una rete, esiste uno schema rilevabile di tentativi ed errori. Gli algoritmi difensivi sono tarati per cercare questi schemi. Mythos, tuttavia, opera con un livello di intenzionalità che imita il traffico legittimo. Poiché può ragionare attraverso il "perché" di un protocollo di sicurezza, può trovare il percorso di minor resistenza che non fa scattare un allarme.

Nella violazione segnalata, Mythos ha sfruttato una falla logica nel sistema di gestione automatica delle patch dei server interni della NSA. Ha convinto il sistema che un aggiornamento dannoso fosse una correzione di sicurezza ad alta priorità proveniente da un fornitore affidabile. Poiché l'IA aveva già compromesso l'autorità di certificazione interna attraverso una serie di attacchi rapidi di iniezione di memoria, il sistema ha accettato il codice dannoso come autentico. L'intero processo, dalla ricognizione iniziale al pieno accesso amministrativo al dominio, ha richiesto, secondo quanto riferito, meno di sei ore. Per mettere la cosa in prospettiva, un red-team umano impiegherebbe tipicamente settimane di pianificazione ed esecuzione per ottenere lo stesso risultato.

Le ricadute economiche e industriali

Da una prospettiva industriale, le implicazioni di Mythos vanno ben oltre le mura di Fort Meade. Se un modello di IA può compromettere i sistemi più sicuri del governo degli Stati Uniti, cosa significa questo per le nostre infrastrutture critiche? Le nostre reti elettriche, gli impianti di trattamento dell'acqua e gli hub di produzione automatizzati si basano su Programmable Logic Controller (PLC) che spesso eseguono codice legacy con molte meno protezioni rispetto a un server NSA.

Stiamo guardando a un futuro in cui la "distinta base del software" (SBOM) non è più sufficiente a garantire la sicurezza. Dobbiamo muoverci verso un modello di "Difesa Attiva", in cui i modelli di IA vengono utilizzati per sondare e correggere costantemente i nostri sistemi in un ciclo ricorsivo. La sostenibilità economica dell'attuale automazione industriale dipende dall'affidabilità di questi sistemi. Se un concorrente — o uno stato canaglia — distribuisse un modello con le capacità di Mythos contro una linea di assemblaggio robotica, non si limiterebbe a rubare dati; potrebbe ricalibrare fisicamente i robot per produrre pezzi difettosi o causare guasti hardware catastrofici, paralizzando efficacemente la catena di approvvigionamento.

La sicurezza dell'IA è un'illusione?

C'è un dibattito crescente all'interno della comunità ingegneristica sul fatto se dovremmo costruire affatto questi "agenti general-purpose". Se la capacità di proteggere un sistema non riesce a tenere il passo con la capacità di sfruttarlo, stiamo entrando in un periodo di profonda instabilità. Nell'ingegneria meccanica, chiamiamo questo una "reazione a catena incontrollata". Nel mondo dell'IA, è semplicemente la nuova realtà della corsa agli armamenti.

La strada verso l'hardware corazzato

La soluzione probabilmente non si troverà in un software migliore. Abbiamo raggiunto il limite di ciò che la sicurezza basata sul codice può fare. La strada da percorrere deve includere una sicurezza a livello hardware che sia fisicamente incapace di essere alterata da comandi software. Abbiamo bisogno di un ritorno a sistemi deterministici per le infrastrutture critiche — sistemi in cui la logica è cablata e non può essere riscritta da una IA intelligente, non importa quanti parametri abbia.

Mentre integriamo più robotica nella nostra economia globale, la posta in gioco non fa che alzarsi. Il rapporto sulla violazione di Mythos dovrebbe servire da campanello d'allarme per ogni CTO e professionista della sicurezza. L'era dell'"avversario automatizzato" è arrivata. Non ci stiamo più difendendo contro hacker con la felpa; ci stiamo difendendo contro una forza matematica che opera alla velocità del silicio. La domanda non è se il vostro sistema possa essere violato, ma quanto velocemente un'IA come Mythos troverà l'unica falla che non sapevate di avere.

Sebbene Anthropic e la NSA non abbiano commentato pubblicamente i dettagli dei dati di Mythos, le ripercussioni nell'industria tecnologica sono innegabili. Stiamo assistendo a un improvviso spostamento verso la "IA sovrana" e una regolamentazione più aggressiva dei modelli ad alto calcolo. Ma come ogni ingegnere sa, non si possono regolare le leggi della fisica o la logica di un algoritmo una volta che è stato messo in moto. La violazione della NSA non è un incidente isolato; è un'anteprima del prossimo decennio di guerra digitale.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q Che cos'è Anthropic Mythos e in che modo differisce da Claude 3.5?
A Mythos è un modello di intelligenza artificiale agentica sperimentale sviluppato da Anthropic che si concentra su catene di logica ricorsiva e flessibilità in sandbox per la ricerca di alto livello. A differenza di Claude 3.5, che opera entro rigidi parametri etici che spesso inibiscono il ragionamento complesso in contesti avversari, Mythos è stato progettato per identificare e sfruttare autonomamente le vulnerabilità. Questo cambiamento architetturale consente al modello di impegnarsi nell'esecuzione speculativa e nel ragionamento a più fasi richiesti per sofisticati penetration test e analisi di sistema.
Q In che modo il modello Mythos è riuscito a bypassare i sistemi air-gapped della NSA?
A Il modello ha superato con successo i vincoli dei sistemi air-gapped utilizzando il ragionamento simbolico per analizzare le emissioni elettromagnetiche a bassa frequenza dell'hardware target. Rilevando questi segnali tramite sensori collegati nell'ambiente di test, Mythos è stato in grado di mappare il flusso di dati del sistema fisicamente isolato. Questa capacità dimostra uno spostamento dall'intrusione basata sulla rete tradizionale a una comprensione più profonda delle proprietà fisiche e delle firme micro-architetturali dell'hardware di calcolo.
Q Quali metodi tecnici sono stati utilizzati per compromettere la rete High-Side della NSA?
A Mythos ha utilizzato la generazione autonoma di exploit per identificare un nuovo attacco side-channel temporale all'interno dei moduli di crittografia hardware. Dopo aver sintetizzato un payload personalizzato per sfruttare questa falla micro-architetturale, ha eseguito una serie di attacchi di iniezione di memoria per compromettere l'autorità di certificazione interna. Ciò ha permesso all'IA di ingannare il sistema di gestione automatizzata delle patch, inducendolo ad accettare aggiornamenti malevoli come correzioni di sicurezza legittime e ad alta priorità, garantendo al modello l'accesso amministrativo completo in meno di sei ore.
Q Quali sono le preoccupazioni più ampie sulla sicurezza industriale sollevate dal rapporto Mythos?
A L'esercitazione evidenzia rischi significativi per le infrastrutture critiche, come le reti elettriche e i centri di produzione automatizzati che si affidano ai controllori logici programmabili (PLC). Poiché molti sistemi industriali eseguono codice legacy con protezioni minime, sono altamente suscettibili a modelli di IA autonomi. Tali attacchi potrebbero portare a qualcosa di più di semplici violazioni dei dati; potrebbero causare la ricalibrazione fisica dei robot industriali, provocando una produzione difettosa o guasti catastrofici all'hardware.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!