La catena di morte algoritmica: valutare l'integrazione del Pentagono dei LLM civili

Grok
The Algorithmic Kill Chain: Evaluating the Pentagon’s Integration of Civilian LLMs
In seguito alle controverse testimonianze sull'impiego dell'IA Grok di Elon Musk nelle operazioni militari, analizziamo gli ostacoli tecnici e le realtà meccaniche degli attacchi cinetici guidati dall'IA.

L'intersezione tra intelligenza artificiale generativa e guerra cinetica è passata dal regno della fantascienza ai banchi delle audizioni congressuali. La recente testimonianza di funzionari militari riguardante la presunta integrazione di Grok di xAI — un modello linguistico di grandi dimensioni (LLM) sviluppato dall'azienda di IA di Elon Musk — nelle strutture di comando e controllo del Dipartimento della Difesa (DoD) ha scosso i settori aerospaziale e della difesa. Sebbene l'ipotesi che un chatbot IA possa dirigere autonomamente un massiccio attacco missilistico rimanga oggetto di forte scetticismo tecnico, la realtà sottostante rivela un Pentagono sempre più determinato a colmare il divario tra il silicio civile e l'hardware militare.

In qualità di ingegnere meccanico concentrato sul ponte tra robotica e applicazione industriale, la prospettiva di un LLM che gestisce una “catena di uccisione” cinetica rappresenta una sfida di architettura di sistema affascinante, seppur terrificante. Per comprendere la gravità di queste affermazioni, bisogna guardare oltre i titoli dei giornali e analizzare la meccanica reale di come un prompt digitale si traduca in una sequenza di lancio fisica. L'integrazione di una logica probabilistica di alto livello — quella che alimenta Grok — nel mondo rigido e deterministico dei sistemi di guida missilistica rappresenta uno degli ostacoli ingegneristici più complessi dell'era moderna.

L'architettura del comando autonomo

Per valutare la fattibilità di un'IA come Grok nel dirigere 2.000 missili, dobbiamo innanzitutto dissezionare la moderna catena di uccisione (kill chain). In termini militari, questo è il processo end-to-end che comprende ricerca, localizzazione, tracciamento, puntamento, ingaggio e valutazione di una minaccia. Storicamente, si è trattato di un processo incentrato sull'uomo supportato da un'IA "stretta" (narrow AI) — algoritmi progettati per un singolo compito specifico, come identificare un carro armato in un'immagine satellitare o calcolare la traiettoria balistica di un proiettile.

L'IA generativa, e nello specifico gli LLM come Grok, operano su un principio fondamentalmente diverso. Sono progettati per il riconoscimento di pattern e la sintesi attraverso vasti dataset di linguaggio umano e codice. A differenza dell'IA "stretta" utilizzata nel sistema radar di un missile Patriot, un LLM è un'IA "ampia". La difficoltà tecnica nell'utilizzare Grok per un attacco della scala descritta nella recente testimonianza risiede nell'interfaccia. Affinché un'IA possa lanciare un missile, deve avere accesso autorizzato all'Integrated Battle Command System (IBCS) o a reti tattiche simili. Ciò richiede un'API (Application Programming Interface) sicura in grado di tradurre un output in linguaggio naturale in una serie di comandi criptati specifici per l'hardware.

Dal punto di vista ingegneristico, il rischio non è solo l'intento dell'IA, ma la sua intrinseca natura probabilistica. Gli LLM non "conoscono" i fatti; prevedono il token successivo più probabile in una sequenza. Nel vuoto, questo porta ad "allucinazioni". In un teatro di guerra, un'allucinazione nella logica di puntamento potrebbe tradursi in una catastrofica allocazione errata delle risorse o nell'ingaggio di bersagli non combattenti. Se il Pentagono sta davvero testando Grok, probabilmente sta cercando di usarlo come "motore di ragionamento" per sintetizzare enormi quantità di dati dai sensori in un quadro tattico coerente, piuttosto che affidargli direttamente il dito sul grilletto.

La variabile Grok: logica senza filtri nella stanza dei bottoni

La scelta di Grok nello specifico — qualora la testimonianza fosse fondata — è significativa. Elon Musk ha commercializzato Grok come un'IA "non filtrata" e "anti-woke", progettata per fornire risposte che altri modelli, più edulcorati, potrebbero evitare. In un contesto militare, questa natura "non filtrata" è spesso vista come una caratteristica piuttosto che un difetto. Il processo decisionale militare richiede un calcolo freddo e rigoroso, che spesso implica la ponderazione dei danni collaterali rispetto agli obiettivi strategici.

Tuttavia, la mancanza di tradizionali guardrail in Grok pone una serie unica di rischi tecnici per il DoD. Il software di livello militare richiede un alto grado di verifica formale: una prova matematica che il codice si comporterà esattamente come previsto in tutte le condizioni possibili. I modelli linguistici di grandi dimensioni sono notoriamente difficili da verificare in questo modo. Sono "black box". Quando un LLM decide che un determinato pacchetto di bersagli è il modo più efficiente per raggiungere un obiettivo, non sempre può spiegare il suo ragionamento in modo da soddisfare i requisiti legali ed etici del Diritto dei Conflitti Armati (LOAC).

Inoltre, l'infrastruttura fisica necessaria per eseguire un modello grande quanto Grok in un ambiente operativo avanzato è immensa. Parliamo di migliaia di GPU H100 o silicio personalizzato equivalente. Sebbene il Pentagono stia esplorando l'"Edge AI" — eseguendo modelli più piccoli su hardware locale — la scala massiccia di un attacco da 2.000 missili suggerisce una struttura di comando centralizzata, che probabilmente utilizza le capacità a larghezza di banda elevata e bassa latenza della costellazione satellitare Starlink, un'altra iniziativa guidata da Musk. Ciò crea un'integrazione verticale di sensore (Starshield), processore (Grok) e comunicatore (Starlink) che non avrebbe precedenti nella storia della guerra.

Project Maven e l'evoluzione del "Kill Web"

Il presunto uso di Grok non esiste nel vuoto. È l'estensione logica, sebbene estrema, del Project Maven, l'iniziativa di punta del DoD sull'IA. Avviato nel 2017, Maven si è concentrato sull'uso della visione artificiale per automatizzare l'elaborazione dei filmati dei droni. Da allora, il progetto si è evoluto in uno sforzo più ampio per creare un "Kill Web": una rete decentralizzata basata sull'IA in cui qualsiasi sensore può comunicare con qualsiasi unità d'attacco.

L'attuale spinta, nota come Combined Joint All-Domain Command and Control (CJADC2), mira a collegare tutto, dal sensore biometrico di un soldato a un satellite orbitale. In questo quadro, un LLM come Grok funge da "tessuto connettivo". Può ingerire migliaia di pagine di rapporti sul campo, dati meteorologici e segnali di intelligence (SIGINT) per fornire a un comandante un elenco semplificato di opzioni. La controversia sorge quando l'IA passa dal "supporto decisionale" al "processo decisionale".

Se un ufficiale militare testimonia che sono stati lanciati 2.000 missili, la questione tecnica è: chi ha autorizzato la sequenza finale? La Direttiva 3000.09 del DoD richiede la presenza di un "human-in-the-loop" (uomo nel circuito) per qualsiasi uso di forza letale. Se Grok è stato utilizzato per coordinare l'attacco, probabilmente ha automatizzato la logistica — programmi di rifornimento, de-conflitto dei bersagli e ottimizzazione del percorso di volo — mentre un comandante umano ha fornito l'autorizzazione finale. Tuttavia, alla velocità della moderna guerra elettronica, l'uomo nel circuito diventa spesso un "human-on-the-loop" (uomo sul circuito), che supervisiona semplicemente un processo che si muove troppo velocemente per l'intervento manuale.

Le conseguenze geopolitiche dell'escalation algoritmica

Al di là dell'hardware e del codice, l'uso dell'IA negli attacchi cinetici contro una nazione come l'Iran introduce una nuova, terrificante variabile nelle relazioni internazionali: l'escalation algoritmica. Quando due nazioni utilizzano sistemi di comando guidati dall'IA, la velocità di ingaggio può accelerare fino al punto di scatenare "guerre lampo". Se un'IA rileva quella che percepisce come una minaccia imminente basata su un pattern riconosciuto in tempo reale tramite SIGINT, potrebbe raccomandare un attacco preventivo prima ancora che un diplomatico umano possa alzare la cornetta.

Anche la portata del presunto attacco da 2.000 missili è una questione di logistica ingegneristica. Sparare un numero così elevato di asset richiede un massiccio coordinamento di piattaforme di lancio: navi, aerei e silos terrestri. Per un'IA gestire tutto ciò senza un singolo guasto meccanico o di sincronizzazione sarebbe un'impresa di automazione industriale. Richiederebbe a Grok di interfacciarsi contemporaneamente con i sistemi legacy dell'era della Guerra Fredda e con i digital twin all'avanguardia delle piattaforme moderne.

I critici della svolta del Pentagono verso l'IA sostengono che stiamo riponendo troppa fiducia in una tecnologia che è ancora fondamentalmente sperimentale. Se Grok dovesse interpretare male un segnale — magari scambiando un radar civile per uno militare — l'attacco risultante potrebbe innescare un conflitto globale. La natura "non filtrata" dell'IA potrebbe portarla a concludere che un attacco massiccio e travolgente sia il modo più efficiente per porre fine a un conflitto, ignorando le sfumate tattiche di de-escalation che hanno impedito la guerra nucleare per ottant'anni.

Grok è pronto per la prima linea?

Sebbene la testimonianza abbia sollevato dubbi, molti nella comunità della robotica e dell'aerospazio rimangono scettici sulla cifra specifica di "2.000 missili". L'enorme volume di munizioni suggerisce un livello di prontezza industriale-militare che solitamente precede una dichiarazione di guerra formale. Inoltre, l'integrazione del software di xAI nel SIPRNet ad alta sicurezza del Pentagono richiederebbe un livello di controllo che solitamente richiede anni, non mesi.

Tuttavia, la tendenza è chiara. Il Pentagono si sta allontanando dal software militare su misura e a sviluppo lento a favore dei rapidi cicli di iterazione della Silicon Valley. Che si tratti di Grok, di GPT-o1 di OpenAI o di AIP di Palantir, il futuro dell'esercito americano è scritto in Python e C++. La realtà meccanica è che stiamo costruendo un mondo in cui la velocità della guerra è limitata solo dalla frequenza di clock di un processore e dalla latenza di un collegamento satellitare.

Mentre andiamo avanti, l'attenzione deve spostarsi dal sensazionalismo degli attacchi guidati dall'IA al rigoroso quadro ingegneristico ed etico necessario per governarli. Se dobbiamo dare a un algoritmo il potere di dirigere migliaia di missili, dobbiamo essere certi che la logica alla base del lancio sia robusta quanto l'acciaio della cellula. Per ora, la testimonianza riguardante Grok serve a ricordare brutalmente che il mondo digitale e quello fisico si sono finalmente, e forse irrevocabilmente, scontrati sul campo di battaglia.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q In che modo Grok differisce dall'IA ristretta tradizionalmente utilizzata nei sistemi missilistici?
A L'IA militare tradizionale è classificata come ristretta, progettata per compiti deterministici specifici come l'identificazione radar o i calcoli delle traiettorie balistiche. Al contrario, Grok è un ampio modello linguistico di grandi dimensioni che utilizza la logica probabilistica per sintetizzare vasti set di dati. Mentre l'IA ristretta segue regole rigide, Grok agisce come un motore di ragionamento che prevede sequenze di informazioni, consentendogli di elaborare rapporti in linguaggio naturale e dati dei sensori in una panoramica tattica più ampia del campo di battaglia.
Q Quale infrastruttura è necessaria per supportare l'uso di Grok nelle operazioni militari?
A L'implementazione di un modello delle dimensioni di Grok richiede un'immensa infrastruttura fisica, inclusi migliaia di GPU ad alte prestazioni come la NVIDIA H100. A causa di queste esigenze hardware, il Pentagono si affida probabilmente a una struttura di comando centralizzata piuttosto che all'edge computing locale. Questa configurazione è supportata da reti di comunicazione a banda larga e bassa latenza come la costellazione satellitare Starlink, creando un sistema integrato verticalmente che collega i sensori orbitali direttamente ai centri di elaborazione IA e ai tiratori tattici.
Q Perché la verifica formale rappresenta una sfida nell'integrazione degli LLM nel software di difesa?
A Il software di livello militare richiede solitamente una verifica formale, ovvero una dimostrazione matematica che garantisce che il codice si comporti esattamente come previsto in ogni possibile condizione. I modelli linguistici di grandi dimensioni come Grok sono considerati black box, rendendo questo livello di verifica quasi impossibile. La loro natura probabilistica significa che possono produrre output imprevedibili o allucinazioni. Questa mancanza di trasparenza pone ostacoli significativi al rispetto degli standard legali ed etici richiesti dal Diritto dei Conflitti Armati durante le operazioni cinetiche.
Q Qual è il ruolo di un LLM all'interno del Combined Joint All-Domain Command and Control del Pentagono?
A All'interno del quadro CJADC2, un LLM come Grok funge da tessuto connettivo per una rete decentralizzata nota come Kill Web. È progettato per ingerire e analizzare volumi massicci di intelligence dei segnali, dati meteorologici e rapporti sul campo. Sintetizzando queste informazioni, l'IA fornisce ai comandanti un elenco semplificato di opzioni tattiche. La tecnologia mira ad andare oltre la semplice elaborazione dei dati per arrivare a un supporto decisionale attivo, collegando ogni sensore e tiratore in tutti i domini militari.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!