L'IA nell'era degli agenti: GPT-5.5 e Claude Mythos

Mentre OpenAI si è concentrata sul ridimensionamento del ragionamento e dell'efficienza generica del suo modello di punta, Anthropic si è orientata verso un'applicazione altamente specializzata e ad alto rischio: la sicurezza informatica. Le implicazioni di questo doppio rilascio si stanno già propagando sui mercati globali. Nel Regno Unito, funzionari governativi e istituzioni finanziarie si stanno muovendo per integrare Mythos di Anthropic nell'infrastruttura bancaria nazionale, mentre i regolatori dell'Unione Europea rimangono cauti, bloccando di fatto il nuovo modello fuori dai propri confini per il momento. Questa divergenza evidenzia una crescente tensione tra la spinta verso l'efficienza automatizzata e i rischi intrinseci di un sistema capace di riscrivere le regole della difesa informatica.

L'evoluzione tecnica di GPT-5.5

Il rilascio di GPT-5.5 da parte di OpenAI rappresenta un significativo traguardo ingegneristico nell'equilibrio tra intelligenza grezza e latenza operativa. Storicamente, man mano che i modelli diventano più "intelligenti" — solitamente misurati dalla densità dei loro parametri e dalla complessità delle loro catene di ragionamento — tendono a diventare più lenti e costosi da eseguire. OpenAI afferma di aver infranto questa tendenza. GPT-5.5 eguaglia la latenza per token del suo predecessore, GPT-5.4, offrendo al contempo quello che l'azienda descrive come un "passo avanti" nel ragionamento attraverso il contesto.

Da una prospettiva di ingegneria meccanica e di sistema, l'aggiornamento più critico in GPT-5.5 è la sua maggiore efficienza nei compiti di Codex. OpenAI riferisce che il modello utilizza molti meno token per completare le stesse attività di programmazione e debug rispetto alle versioni precedenti. Per gli utenti aziendali, questo si traduce direttamente in costi operativi inferiori e una maggiore produttività per lo sviluppo software automatizzato. Il modello è ora capace di ciò che OpenAI definisce "codifica agentica" (agentic coding), dove l'IA non suggerisce solo uno snippet di codice, ma pianifica un'architettura multi-file, esegue test e itera sul risultato finché non viene raggiunto un obiettivo funzionale.

Questa capacità di gestire "compiti complessi e articolati" è la pietra angolare di GPT-5.5. Invece di richiedere a un essere umano di gestire ogni sotto-fase di un progetto, al modello può ora essere assegnato un obiettivo di alto livello — come "analizza questo set di dati, crea un foglio di calcolo riassuntivo e aggiorna il nostro database interno" — e il sistema navigherà autonomamente tra gli strumenti software necessari. Questo passaggio da strumento passivo a partecipante attivo nel flusso di lavoro digitale segna un punto di svolta per l'automazione industriale, in cui il collo di bottiglia si sposta dalla capacità dell'IA di generare contenuti alla capacità dell'uomo di supervisionare le sue azioni autonome.

Claude Mythos e la nuova matematica della difesa informatica

Mentre OpenAI scala l'utilità generale, Claude Mythos di Anthropic (spesso indicato come Mythos Preview) si sta posizionando come un'arma specializzata nel campo della sicurezza informatica. Anthropic descrive Mythos come il suo modello più capace per la codifica e i compiti agentici, sottolineando però che questa forza è un'arma a doppio taglio. Un modello che comprende il software abbastanza profondamente da riparare una vulnerabilità è, per definizione, un modello che può trovare e sfruttare la stessa vulnerabilità con una velocità senza precedenti.

La comunità tecnica ha notato che Mythos sembra aver "aperto il software come un uovo". In test controllati, il modello ha dimostrato una spaventosa competenza nell'identificare difetti profondi nel codice informatico che erano sfuggiti ai tradizionali strumenti di analisi statica. Questa capacità viene sfruttata attraverso "Project Glasswing", un'iniziativa di sicurezza informatica specializzata che include pesi massimi come CrowdStrike, Palo Alto Networks e Microsoft. L'obiettivo di Glasswing è utilizzare Mythos per effettuare proattivamente il "red-teaming" del software aziendale, trovando essenzialmente le falle prima che lo facciano attori malevoli.

Tuttavia, l'enorme potenza di Mythos ha portato a un lancio limitato. A differenza di GPT-5.5, che viene distribuito a una vasta base di utenti, l'accesso a Mythos è strettamente controllato. Ciò ha creato un punto di attrito geopolitico; mentre la National Security Agency (NSA) degli Stati Uniti starebbe utilizzando Mythos nonostante alcune preoccupazioni interne al Pentagono sui rischi della catena di approvvigionamento, l'Unione Europea è stata esclusa dal rilascio iniziale del modello. La decisione di Anthropic di escludere l'UE suggerisce che le capacità del modello potrebbero scontrarsi con i rigorosi requisiti di sicurezza e trasparenza dell'EU AI Act, o forse che l'azienda sta dando priorità a partnership strategiche con nazioni come Regno Unito e Stati Uniti, disposte a integrare questi strumenti nelle loro infrastrutture principali più rapidamente.

Il perno strategico del settore bancario britannico

Nel Regno Unito, il governo non sta aspettando che si calmino le acque sulla regolamentazione dell'IA. I rapporti indicano che il Regno Unito è in trattative attive con Anthropic per fornire alle imprese e alle banche britanniche l'accesso a Mythos. Questa mossa è vista come un tentativo di garantire a Londra lo status di hub finanziario globale sfruttando l'IA difensiva più avanzata disponibile. In caso di successo, le banche britanniche potrebbero essere tra le prime a utilizzare agenti autonomi per monitorare le transazioni, proteggere le pipeline di dati e correggere automaticamente le vulnerabilità in tempo reale.

I leader finanziari, inclusi quelli di JPMorgan Chase, stanno già valutando i potenziali rischi. L'integrazione di un sistema potente come Mythos in uno stack bancario richiede un ripensamento completo dei protocolli di sicurezza tradizionali. Quando un'IA può "gestire software e spostarsi tra strumenti finché un compito non è terminato", deve ricevere un livello di accesso al sistema che in precedenza era riservato a ingegneri umani altamente fidati. Il dibattito all'interno del Tesoro britannico e tra i regolatori si concentra sul fatto se i guadagni di efficienza di questa automazione superino il rischio di un fallimento a livello di sistema o di un "jailbreak" che potrebbe consentire l'uso improprio del modello.

Può un sistema così potente essere controllato in sicurezza?

La questione della sicurezza incombe su entrambi, GPT-5.5 e Claude Mythos. Il rinomato esperto di sicurezza Bruce Schneier ha sottolineato che la potenza di questi sistemi ha implicazioni spaventose per il futuro dell'hacking. Se un'IA può trovare in pochi secondi vulnerabilità che richiederebbero settimane a un team umano per essere scoperte, la "matematica" della difesa informatica cambia. La difesa deve ora essere altrettanto veloce e autonoma. Questo crea una "corsa agli armamenti dell'IA" in cui l'unico modo per proteggersi da un attaccante automatizzato è impiegare un difensore automatizzato.

Dal punto di vista ingegneristico, la sicurezza di questi sistemi si basa sulla robustezza dei loro "modelli del mondo" interni e sui vincoli posti al loro comportamento agentico. OpenAI sottolinea che GPT-5.5 è progettato per "navigare attraverso l'ambiguità e continuare ad andare avanti", il che è un grande passo avanti per l'usabilità ma un incubo per la prevedibilità. Se un'IA agentica incontra una situazione che i suoi addestratori non avevano previsto, la sua "pianificazione" autonoma potrebbe portare a conseguenze indesiderate in un ambiente di produzione reale. La sfida tecnica del prossimo decennio non sarà rendere questi modelli più intelligenti, ma rendere le loro azioni autonome verificabili e reversibili.

La sostenibilità economica dei modelli agentici

Per la dirigenza e gli stakeholder industriali, il rilascio di GPT-5.5 e il potenziale arrivo di Mythos nel Regno Unito rappresentano un cambiamento nel ROI degli investimenti in IA. I primi LLM erano spesso visti come booster di produttività sperimentali, utili per scrivere e-mail o generare testi di marketing. I modelli agentici cambiano l'equazione puntando ai costi operativi principali. Quando un'IA può gestire "lavoro di conoscenza e ricerca scientifica iniziale" ragionando attraverso il contesto e agendo nel tempo, inizia a sostituire interi livelli di gestione intermedia e coordinamento tecnico.

La riduzione dell'utilizzo di token per i compiti Codex in GPT-5.5 è un esempio lampante di questo cambiamento economico. In un contesto industriale su larga scala, dove un'IA potrebbe gestire milioni di righe di codice su migliaia di repository, un aumento del 20% o 30% nell'efficienza dei token può tradursi in milioni di dollari di risparmio sui costi di calcolo. Ancora più importante, la velocità di iterazione — la "latenza" che OpenAI ha lavorato duramente per mantenere — determina quanto velocemente un'azienda può rispondere ai cambiamenti del mercato o ai guasti tecnici. Nel mondo del trading ad alta frequenza o della gestione automatizzata della catena di approvvigionamento, i millisecondi fanno la differenza tra profitto e perdita.

In definitiva, il rilascio parallelo di questi due modelli suggerisce che abbiamo superato l'era dell'IA come novità. GPT-5.5 di OpenAI è il nuovo cavallo di battaglia dell'impresa digitale, ottimizzato per il completamento di compiti ampi, efficienti e autonomi. Mythos di Anthropic è lo strumento di alta precisione, un modello progettato per gli angoli più critici e pericolosi di Internet. Mentre il Regno Unito si prepara ad accogliere questi strumenti, il resto del mondo osserverà attentamente per vedere se la promessa dell'era agentica potrà essere realizzata senza compromettere la sicurezza delle istituzioni stesse che mira a modernizzare.

L'IA entra nell'era degli agenti: GPT-5.5 e Claude Mythos ridefiniscono l'automazione aziendale

L'evoluzione tecnica di GPT-5.5

Claude Mythos e la nuova matematica della difesa informatica

Il perno strategico del settore bancario britannico

Può un sistema così potente essere controllato in sicurezza?

La sostenibilità economica dei modelli agentici

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments