Grok e il mito del Pentagono: perché gli LLM non controlleranno gli arsenali

Nell'ecosistema frenetico dei social media, il confine tra allucinazione algoritmica e realtà geopolitica è diventato pericolosamente sottile. Recentemente, un'ondata di notizie e meme su X (ex Twitter) ha suggerito che Grok, il modello linguistico di grandi dimensioni (LLM) sviluppato dalla xAI di Elon Musk, sia stato utilizzato dal Pentagono per coordinare un massiccio attacco che ha coinvolto 2000 razzi contro obiettivi in Medio Oriente. Sebbene l'affermazione abbia ottenuto milioni di impression e alimentato un ciclo di argomenti di tendenza, un'analisi tecnica dell'attuale infrastruttura militare e dell'architettura fondamentale degli LLM rivela una realtà molto più sobria.

Come ingegnere meccanico focalizzato sul punto di incontro tra software e hardware industriale, trovo comprensibile il fascino per la "guerra guidata dall'IA", ma la specifica affermazione che un LLM come Grok possa — o debba — essere utilizzato per innescare lanci cinetici rivela un'incomprensione fondamentale di come il Dipartimento della Difesa (DoD) gestisca i propri sistemi di Comando e Controllo (C2). Dal punto di vista della robotica e dell'automazione industriale, la distanza tra un chatbot e una batteria missilistica non è solo una questione di permessi; è un abisso di filosofie ingegneristiche differenti.

L'architettura del fallimento non deterministico

Per capire perché il Pentagono non utilizzerebbe Grok per attacchi cinetici, bisogna innanzitutto comprendere la natura dei modelli linguistici di grandi dimensioni. Grok, come i suoi contemporanei GPT-4 o Claude, è un sistema non deterministico. Ciò significa che per ogni dato input, l'output viene generato sulla base di pesi probabilistici. Sebbene questo sia eccellente per la scrittura creativa, l'assistenza alla programmazione o la sintesi di notizie dal flusso in tempo reale di X, è un anatema per l'ingegneria militare.

I sistemi militari, in particolare quelli che prevedono il lancio di migliaia di razzi, richiedono un determinismo assoluto. Nell'automazione industriale, costruiamo sistemi in cui l'Input A porta sempre al Risultato B. Quando si ha a che fare con la logistica di 2000 asset cinetici, le variabili includono lo stato del carburante, le coordinate GPS, le condizioni meteorologiche e l'identificazione Amico-o-Nemico (IFF). Un LLM opera in uno spazio latente di token e vettori ad alta dimensionalità; non "sa" cosa sia un razzo in senso fisico. Sa semplicemente come prevedere la parola successiva in una frase che lo descrive. L'idea di inserire un'IA non deterministica e "ribelle" in un circuito di tiro tattico è uno scenario da incubo per qualsiasi ingegnere di sistemi.

Come il Pentagono integra effettivamente l'IA

Sebbene le voci su Grok siano un prodotto dell'economia dei meme, il Pentagono sta effettivamente perseguendo in modo aggressivo l'integrazione dell'IA attraverso iniziative come il Project Maven e il programma Replicator. Tuttavia, l'IA utilizzata in questi contesti non assomiglia affatto a Grok. L'attenzione del DoD è rivolta alla Computer Vision (CV) e alla manutenzione predittiva, non ad agenti conversazionali con un "senso dell'umorismo".

Il Project Maven, ad esempio, utilizza l'apprendimento automatico per analizzare enormi quantità di riprese di droni al fine di identificare oggetti di interesse: camion, carri armati o personale. Si tratta di un'attività di classificazione, non generativa. L'obiettivo è accorciare il ciclo OODA (Osservare, Orientarsi, Decidere, Agire). Anche in questi scenari ad alta tecnologia, le fasi finali di "Decidere" e "Agire" sono rigorosamente riservate agli operatori umani, una politica nota come requisito "Human-in-the-Loop" (HITL). Integrare un LLM commerciale in questo ciclo introdurrebbe una latenza inaccettabile e una mancanza di trasparenza: il problema della "scatola nera" che attualmente affligge la ricerca sull'IA.

L'IA generativa può gestire la logistica di 2000 razzi?

Da un punto di vista meccanico e logistico, l'affermazione di 2000 razzi lanciati simultaneamente sotto la direzione di una singola IA è un'impresa colossale. Nella robotica industriale, il coordinamento di anche solo 50 unità autonome in un magazzino richiede una sofisticata rete mesh e una deconfliction spaziale in tempo reale. Scalare tutto ciò a 2000 asset cinetici in un teatro di guerra comporta strati di comunicazione crittografata e handshake hardware che sono attualmente incompatibili con l'architettura basata su API dell'IA commerciale.

L'iniziativa Joint All-Domain Command and Control (JADC2) del Pentagono è progettata per collegare i sensori di tutti i rami delle forze armate in una rete unificata. Questa rete utilizza protocolli specializzati e blindati. Grok è ospitato sull'infrastruttura cloud di xAI, probabilmente utilizzando cluster NVIDIA H100. Collegare un'IA cloud pubblica con la SIPRNet (Secret Internet Protocol Router Network) rappresenterebbe una delle più significative violazioni della sicurezza della storia. Nessun ingegnere sano di mente esporrebbe un asset strategico alle vulnerabilità intrinseche di un LLM basato sul web, indipendentemente dalla velocità con cui si aggiornano i suoi dati di addestramento.

Il ruolo della disinformazione virale nell'era dell'IA

Perché questa voce ha guadagnato così tanta trazione? La risposta risiede nel modo in cui funzionano ora le funzioni "Esplora" e di tendenza di X. Grok stesso spesso riassume gli argomenti di tendenza basandosi sui post degli utenti. Se una massa critica di utenti inizia a scherzare sul fatto che Grok sia utilizzato dal Pentagono, il motore di sintesi delle notizie di Grok potrebbe riportare la tendenza come se fosse un evento, creando un ciclo di feedback di disinformazione. Questa è una classica "allucinazione" a livello di piattaforma.

Nel mondo della robotica e dell'automazione, lo chiamiamo ciclo di feedback incontrollato. Per il grande pubblico, crea una visione distorta di ciò che l'IA è in grado di fare. Presenta l'IA come un'entità simile a un dio capace di superare i propri limiti digitali nel mondo fisico. In realtà, le applicazioni industriali dell'IA sono molto più banali e focalizzate sull'efficienza. Stiamo usando l'IA per ottimizzare la coppia su un braccio robotico o per prevedere quando un motore di un nastro trasportatore potrebbe guastarsi, non per aggirare la catena di comando al Pentagono.

La realtà economica dell'IA di livello militare

Inoltre, dobbiamo guardare alla sostenibilità economica. Il Pentagono spende miliardi in software personalizzati da appaltatori della difesa come Palantir, Anduril e Lockheed Martin. Queste aziende forniscono un'IA di "livello difesa" che è controllata, isolata (air-gapped) e progettata per un'affidabilità ad alto rischio. xAI è un'impresa commerciale rivolta al mercato consumer e aziendale. Dal punto di vista degli approvvigionamenti, gli ostacoli legali e tecnici per l'utilizzo di un chatbot commerciale non verificato per operazioni cinetiche richiederebbero anni, se non decenni, per essere superati.

L'hardware necessario per supportare il lancio di 2000 razzi — lanciatori, veicoli di trasporto, sistemi di guida — rappresenta miliardi di dollari in capitale fisico. Il software che controlla tale capitale deve essere robusto quanto l'acciaio che movimenta. Grok è una meraviglia dell'ingegneria del software, ma è ottimizzato per l'engagement e il reperimento di informazioni, non per i rigori della distruzione su scala industriale. I meme possono essere divertenti, ma distolgono dal lavoro reale e serio che viene svolto nel campo dei sistemi autonomi e della guerra algoritmica.

In conclusione, mentre la tendenza di Grok utilizzato per attacchi missilistici crea una narrazione avvincente per i social media, fallisce ogni test tecnico e logico. Il movimento del Pentagono verso l'IA è reale, ma è costruito su una base di sistemi specializzati, deterministici e altamente regolamentati. Man mano che procediamo nell'era della robotica, è essenziale distinguere tra le capacità conversazionali degli LLM e le realtà meccaniche dell'hardware industriale e militare. Il primo è uno strumento di comunicazione; il secondo è uno strumento d'azione. Per ora, quei due mondi rimangono separati in sicurezza.

Grok e il mito del Pentagono: perché gli LLM non controlleranno gli arsenali cinetici

L'architettura del fallimento non deterministico

Come il Pentagono integra effettivamente l'IA

L'IA generativa può gestire la logistica di 2000 razzi?

Il ruolo della disinformazione virale nell'era dell'IA

La realtà economica dell'IA di livello militare

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments