Il modello Mythos di Anthropic viola sistemi USA in poche ore

Nel contesto ad alta posta in gioco della sicurezza nazionale, le tempistiche per una violazione di sistema sono state tradizionalmente misurate in settimane, mesi o addirittura anni di meticolosa ricognizione. Tuttavia, una recente rivelazione che coinvolge Mythos, il modello di intelligenza artificiale più avanzato di Anthropic, ha compresso tali tempi in una questione di ore. Durante un'esercitazione di test autorizzata condotta in collaborazione con le agenzie di intelligence statunitensi, il modello Mythos avrebbe identificato vulnerabilità critiche in sistemi informatici governativi altamente sensibili e classificati con una velocità che ha colto di sorpresa l'establishment della difesa. L'incidente non solo ha evidenziato la terrificante efficienza dell'IA generativa nella guerra cibernetica, ma ha anche scatenato una tempesta legislativa e normativa che minaccia di bloccare il dispiegamento degli stessi strumenti destinati a proteggere questi sistemi.

La rivelazione è emersa durante un'audizione della Commissione bancaria, edilizia e affari urbani del Senato, in cui il senatore della Virginia Mark Warner ha fornito un resoconto agghiacciante delle prestazioni del modello. Attribuendo le informazioni al generale Joshua Rudd, capo della National Security Agency (NSA) e dello U.S. Cyber Command, Warner ha osservato che lo strumento di IA ha violato quasi tutti i sistemi classificati presentatigli nel giro di un solo pomeriggio. Non si è trattato di un lento processo iterativo di tentativi ed errori, ma di una rapida identificazione di debolezze architettoniche rimaste nascoste per decenni sia agli auditor umani che ai precedenti scanner automatizzati. La velocità della scoperta suggerisce che i LLM come Mythos possiedano una capacità latente di mappare complessi flussi logici e identificare guasti non lineari in un modo che altera radicalmente il panorama della fortificazione digitale.

L'architettura di Mythos e la logica della vulnerabilità

Per comprendere come un modello di IA possa ottenere tali risultati, è necessario osservare le differenze meccaniche tra i modelli linguistici di grandi dimensioni standard e le capacità di ragionamento specializzate che Anthropic ha integrato nella serie Mythos. A differenza del suo predecessore, Fable, progettato per un'utilità pubblica più ampia e per l'allineamento alla sicurezza, Mythos è stato ingegnerizzato concentrandosi sulla deduzione logica profonda e sulla risoluzione di problemi a più fasi. Dal punto di vista ingegneristico, trovare una vulnerabilità in un sistema classificato è essenzialmente un compito di identificazione di un'eccezione non gestita o di uno stato trascurato in una vasta catena di approvvigionamento software interconnessa. Laddove un team umano potrebbe impiegare giorni per rintracciare un memory leak o un set di autorizzazioni mal configurato, Mythos utilizza il suo massiccio set di parametri per simulare simultaneamente milioni di permutazioni di interazione.

La genialità tecnica di Mythos risiede nel suo riconoscimento di pattern del codice legacy. Molti sistemi classificati statunitensi si basano su architetture software datate, che sono state corrette e stratificate per quasi quarant'anni. Questi strati creano una “frangibilità” all'interno del sistema: punti di attrito nascosti in cui i protocolli di sicurezza moderni interagiscono in modo inefficiente con basi di codice antiche. Mythos sembra aver sviluppato un modello interno ad alta fedeltà di queste contraddizioni architettoniche. Assimilando la logica strutturale di un sistema, l'IA è in grado di prevedere dove è probabile che si verifichi un guasto prima ancora di avviare una scansione. Questa capacità predittiva è ciò che ha ridotto il lavoro di settimane a poche ore; l'IA non stava solo cercando falle, stava derivando matematicamente la loro posizione sulla base dei difetti di progettazione intrinseci del sistema.

Progetto Glasswing ed etica del red teaming

Le vulnerabilità sono state scoperte attraverso un'iniziativa nota come Progetto Glasswing. Questo programma è stato istituito come quadro di collaborazione tra Anthropic, altri giganti della tecnologia e le agenzie di intelligence statunitensi per sottoporre a "red-teaming" le infrastrutture critiche. Il red teaming è la pratica di osservare un sistema attraverso gli occhi di un avversario per trovarne i punti deboli. Il Progetto Glasswing intendeva essere la rete di sicurezza definitiva, assicurando che se un modello potente come Mythos fosse stato in grado di violare un sistema, il governo ne sarebbe venuto a conoscenza per primo. Tuttavia, il successo del progetto ha creato un paradosso: più l'IA diventa efficace nel difendere il sistema trovandone i difetti, più l'IA stessa appare pericolosa agli occhi dei regolatori che la supervisionano.

Fonti interne suggeriscono che i test nell'ambito del Progetto Glasswing non si siano limitati a semplici crack di password o simulazioni di phishing. Hanno invece coinvolto l'IA nell'analisi di flussi di dati crittografati e nel suggerire metodi innovativi per l'escalation dei privilegi, tecniche mai documentate nella letteratura esistente sulla sicurezza informatica. Sebbene un funzionario statunitense abbia chiarito che identificare una vulnerabilità non equivale a sfruttarla, la distinzione è spesso sottile nel regno digitale. Una volta identificato il percorso, l'esecuzione è spesso un banale script. Questa consapevolezza ha spinto la NSA e altre agenzie a riconsiderare i rischi di consentire a uno strumento così potente di esistere in un ambiente commerciale, anche se orientato alla sicurezza come quello di Anthropic.

Contraccolpo normativo e divieto di accesso straniero

Sulla scia di queste scoperte, l'amministrazione Trump si è mossa con una rapidità inusuale per limitare la tecnologia. È stato firmato un ordine esecutivo che stabilisce un quadro di controllo per tutti i sistemi di IA avanzati, richiedendo una revisione della sicurezza nazionale della durata di un mese prima di qualsiasi rilascio pubblico. Ancora più importante, è stata emessa una direttiva specifica che richiede ad Anthropic di impedire ai cittadini stranieri l'accesso ai suoi ultimi modelli, Mythos 5 e Fable 5. La logica dell'amministrazione affonda le radici in una tradizionale strategia di contenimento: se lo strumento è così potente, deve essere mantenuto entro i confini degli Stati Uniti e dei suoi alleati più stretti per evitare che avversari come la Cina o la Russia utilizzino modelli simili per trovare le stesse crepe nell'armatura americana.

Il divieto sulla sicurezza informatica è controproducente?

La risposta dell'industria al giro di vite del governo è stata di ferma opposizione. Una coalizione di oltre 100 esperti di sicurezza informatica ed executive di aziende come Adobe e Nvidia ha recentemente inviato una lettera all'amministrazione sollecitando una revoca della direttiva. La loro argomentazione è pragmatica: rimuovendo dal mercato gli strumenti di IA più avanzati, il governo sta effettivamente disarmando i difensori senza fare nulla per fermare lo sviluppo di modelli simili da parte degli avversari. Questi esperti sostengono che Mythos sia "piuttosto bravo" a trovare difetti software, ma non sia "unicamente bravo" in un modo che giustifichi un divieto totale. Altri modelli open-source e progetti finanziati dallo Stato in nazioni rivali raggiungeranno inevitabilmente lo stesso livello di capacità.

Il nocciolo del dibattito è se siamo entrati in un'era in cui l'unica difesa contro gli attacchi guidati dall'IA sia uno scudo guidato dall'IA. Se alle aziende di sicurezza informatica americane venisse negato l'accesso a modelli come Mythos, sarebbero costrette a fare affidamento su metodi più lenti e incentrati sull'uomo che non possono tenere il passo con gli exploit automatizzati. Nel mondo dell'automazione industriale e della gestione della catena di approvvigionamento, dove una singola vulnerabilità può bloccare il trasporto globale o spegnere una rete elettrica, la perdita di uno strumento diagnostico avanzato è un duro colpo. I firmatari della lettera sostengono che la difesa migliore sia un ecosistema robusto e trasparente in cui i modelli migliori vengano utilizzati per controllare e correggere costantemente il software mondiale. Vedono l'attuale percorso del governo come una ritirata verso una mentalità di "sicurezza attraverso l'oscurità" che non è più sostenibile nell'era dell'intelligenza generativa.

Il modello Mythos di Anthropic viola i sistemi classificati USA in poche ore

L'architettura di Mythos e la logica della vulnerabilità

Progetto Glasswing ed etica del red teaming

Contraccolpo normativo e divieto di accesso straniero

Il divieto sulla sicurezza informatica è controproducente?

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments