L'IA entra nell'era degli agenti: GPT-5.5 e Claude Mythos ridefiniscono l'automazione aziendale

Anthropic
AI Enters the Agentic Era: GPT-5.5 and Claude Mythos Redefine Enterprise Automation
OpenAI e Anthropic hanno lanciato modelli di nuova generazione progettati per il completamento autonomo dei compiti, spingendo il Regno Unito a valutare Claude Mythos per infrastrutture bancarie e di sicurezza informatica ad alto rischio.

Mentre OpenAI si è concentrata sul ridimensionamento del ragionamento e dell'efficienza generica del suo modello di punta, Anthropic si è orientata verso un'applicazione altamente specializzata e ad alto rischio: la sicurezza informatica. Le implicazioni di questo doppio rilascio si stanno già propagando sui mercati globali. Nel Regno Unito, funzionari governativi e istituzioni finanziarie si stanno muovendo per integrare Mythos di Anthropic nell'infrastruttura bancaria nazionale, mentre i regolatori dell'Unione Europea rimangono cauti, bloccando di fatto il nuovo modello fuori dai propri confini per il momento. Questa divergenza evidenzia una crescente tensione tra la spinta verso l'efficienza automatizzata e i rischi intrinseci di un sistema capace di riscrivere le regole della difesa informatica.

L'evoluzione tecnica di GPT-5.5

Il rilascio di GPT-5.5 da parte di OpenAI rappresenta un significativo traguardo ingegneristico nell'equilibrio tra intelligenza grezza e latenza operativa. Storicamente, man mano che i modelli diventano più "intelligenti" — solitamente misurati dalla densità dei loro parametri e dalla complessità delle loro catene di ragionamento — tendono a diventare più lenti e costosi da eseguire. OpenAI afferma di aver infranto questa tendenza. GPT-5.5 eguaglia la latenza per token del suo predecessore, GPT-5.4, offrendo al contempo quello che l'azienda descrive come un "passo avanti" nel ragionamento attraverso il contesto.

Da una prospettiva di ingegneria meccanica e di sistema, l'aggiornamento più critico in GPT-5.5 è la sua maggiore efficienza nei compiti di Codex. OpenAI riferisce che il modello utilizza molti meno token per completare le stesse attività di programmazione e debug rispetto alle versioni precedenti. Per gli utenti aziendali, questo si traduce direttamente in costi operativi inferiori e una maggiore produttività per lo sviluppo software automatizzato. Il modello è ora capace di ciò che OpenAI definisce "codifica agentica" (agentic coding), dove l'IA non suggerisce solo uno snippet di codice, ma pianifica un'architettura multi-file, esegue test e itera sul risultato finché non viene raggiunto un obiettivo funzionale.

Questa capacità di gestire "compiti complessi e articolati" è la pietra angolare di GPT-5.5. Invece di richiedere a un essere umano di gestire ogni sotto-fase di un progetto, al modello può ora essere assegnato un obiettivo di alto livello — come "analizza questo set di dati, crea un foglio di calcolo riassuntivo e aggiorna il nostro database interno" — e il sistema navigherà autonomamente tra gli strumenti software necessari. Questo passaggio da strumento passivo a partecipante attivo nel flusso di lavoro digitale segna un punto di svolta per l'automazione industriale, in cui il collo di bottiglia si sposta dalla capacità dell'IA di generare contenuti alla capacità dell'uomo di supervisionare le sue azioni autonome.

Claude Mythos e la nuova matematica della difesa informatica

Mentre OpenAI scala l'utilità generale, Claude Mythos di Anthropic (spesso indicato come Mythos Preview) si sta posizionando come un'arma specializzata nel campo della sicurezza informatica. Anthropic descrive Mythos come il suo modello più capace per la codifica e i compiti agentici, sottolineando però che questa forza è un'arma a doppio taglio. Un modello che comprende il software abbastanza profondamente da riparare una vulnerabilità è, per definizione, un modello che può trovare e sfruttare la stessa vulnerabilità con una velocità senza precedenti.

La comunità tecnica ha notato che Mythos sembra aver "aperto il software come un uovo". In test controllati, il modello ha dimostrato una spaventosa competenza nell'identificare difetti profondi nel codice informatico che erano sfuggiti ai tradizionali strumenti di analisi statica. Questa capacità viene sfruttata attraverso "Project Glasswing", un'iniziativa di sicurezza informatica specializzata che include pesi massimi come CrowdStrike, Palo Alto Networks e Microsoft. L'obiettivo di Glasswing è utilizzare Mythos per effettuare proattivamente il "red-teaming" del software aziendale, trovando essenzialmente le falle prima che lo facciano attori malevoli.

Tuttavia, l'enorme potenza di Mythos ha portato a un lancio limitato. A differenza di GPT-5.5, che viene distribuito a una vasta base di utenti, l'accesso a Mythos è strettamente controllato. Ciò ha creato un punto di attrito geopolitico; mentre la National Security Agency (NSA) degli Stati Uniti starebbe utilizzando Mythos nonostante alcune preoccupazioni interne al Pentagono sui rischi della catena di approvvigionamento, l'Unione Europea è stata esclusa dal rilascio iniziale del modello. La decisione di Anthropic di escludere l'UE suggerisce che le capacità del modello potrebbero scontrarsi con i rigorosi requisiti di sicurezza e trasparenza dell'EU AI Act, o forse che l'azienda sta dando priorità a partnership strategiche con nazioni come Regno Unito e Stati Uniti, disposte a integrare questi strumenti nelle loro infrastrutture principali più rapidamente.

Il perno strategico del settore bancario britannico

Nel Regno Unito, il governo non sta aspettando che si calmino le acque sulla regolamentazione dell'IA. I rapporti indicano che il Regno Unito è in trattative attive con Anthropic per fornire alle imprese e alle banche britanniche l'accesso a Mythos. Questa mossa è vista come un tentativo di garantire a Londra lo status di hub finanziario globale sfruttando l'IA difensiva più avanzata disponibile. In caso di successo, le banche britanniche potrebbero essere tra le prime a utilizzare agenti autonomi per monitorare le transazioni, proteggere le pipeline di dati e correggere automaticamente le vulnerabilità in tempo reale.

I leader finanziari, inclusi quelli di JPMorgan Chase, stanno già valutando i potenziali rischi. L'integrazione di un sistema potente come Mythos in uno stack bancario richiede un ripensamento completo dei protocolli di sicurezza tradizionali. Quando un'IA può "gestire software e spostarsi tra strumenti finché un compito non è terminato", deve ricevere un livello di accesso al sistema che in precedenza era riservato a ingegneri umani altamente fidati. Il dibattito all'interno del Tesoro britannico e tra i regolatori si concentra sul fatto se i guadagni di efficienza di questa automazione superino il rischio di un fallimento a livello di sistema o di un "jailbreak" che potrebbe consentire l'uso improprio del modello.

Può un sistema così potente essere controllato in sicurezza?

La questione della sicurezza incombe su entrambi, GPT-5.5 e Claude Mythos. Il rinomato esperto di sicurezza Bruce Schneier ha sottolineato che la potenza di questi sistemi ha implicazioni spaventose per il futuro dell'hacking. Se un'IA può trovare in pochi secondi vulnerabilità che richiederebbero settimane a un team umano per essere scoperte, la "matematica" della difesa informatica cambia. La difesa deve ora essere altrettanto veloce e autonoma. Questo crea una "corsa agli armamenti dell'IA" in cui l'unico modo per proteggersi da un attaccante automatizzato è impiegare un difensore automatizzato.

Dal punto di vista ingegneristico, la sicurezza di questi sistemi si basa sulla robustezza dei loro "modelli del mondo" interni e sui vincoli posti al loro comportamento agentico. OpenAI sottolinea che GPT-5.5 è progettato per "navigare attraverso l'ambiguità e continuare ad andare avanti", il che è un grande passo avanti per l'usabilità ma un incubo per la prevedibilità. Se un'IA agentica incontra una situazione che i suoi addestratori non avevano previsto, la sua "pianificazione" autonoma potrebbe portare a conseguenze indesiderate in un ambiente di produzione reale. La sfida tecnica del prossimo decennio non sarà rendere questi modelli più intelligenti, ma rendere le loro azioni autonome verificabili e reversibili.

La sostenibilità economica dei modelli agentici

Per la dirigenza e gli stakeholder industriali, il rilascio di GPT-5.5 e il potenziale arrivo di Mythos nel Regno Unito rappresentano un cambiamento nel ROI degli investimenti in IA. I primi LLM erano spesso visti come booster di produttività sperimentali, utili per scrivere e-mail o generare testi di marketing. I modelli agentici cambiano l'equazione puntando ai costi operativi principali. Quando un'IA può gestire "lavoro di conoscenza e ricerca scientifica iniziale" ragionando attraverso il contesto e agendo nel tempo, inizia a sostituire interi livelli di gestione intermedia e coordinamento tecnico.

La riduzione dell'utilizzo di token per i compiti Codex in GPT-5.5 è un esempio lampante di questo cambiamento economico. In un contesto industriale su larga scala, dove un'IA potrebbe gestire milioni di righe di codice su migliaia di repository, un aumento del 20% o 30% nell'efficienza dei token può tradursi in milioni di dollari di risparmio sui costi di calcolo. Ancora più importante, la velocità di iterazione — la "latenza" che OpenAI ha lavorato duramente per mantenere — determina quanto velocemente un'azienda può rispondere ai cambiamenti del mercato o ai guasti tecnici. Nel mondo del trading ad alta frequenza o della gestione automatizzata della catena di approvvigionamento, i millisecondi fanno la differenza tra profitto e perdita.

In definitiva, il rilascio parallelo di questi due modelli suggerisce che abbiamo superato l'era dell'IA come novità. GPT-5.5 di OpenAI è il nuovo cavallo di battaglia dell'impresa digitale, ottimizzato per il completamento di compiti ampi, efficienti e autonomi. Mythos di Anthropic è lo strumento di alta precisione, un modello progettato per gli angoli più critici e pericolosi di Internet. Mentre il Regno Unito si prepara ad accogliere questi strumenti, il resto del mondo osserverà attentamente per vedere se la promessa dell'era agentica potrà essere realizzata senza compromettere la sicurezza delle istituzioni stesse che mira a modernizzare.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q Quali sono i principali miglioramenti tecnici introdotti nel GPT-5.5 di OpenAI?
A GPT-5.5 introduce un concetto noto come codifica agentica, che consente al modello di pianificare autonomamente architetture multi-file ed eseguire test, invece di limitarsi a suggerire frammenti di codice. Sorprendentemente, OpenAI ha mantenuto la latenza per token delle versioni precedenti, migliorando al contempo le capacità di ragionamento. Questa efficienza riduce i costi operativi per gli utenti aziendali richiedendo meno token per completare attività complesse di programmazione e debug, spostando l'attenzione dalla generazione di contenuti all'esecuzione autonoma di progetti.
Q Come viene utilizzato Claude Mythos nel campo della sicurezza informatica?
A Claude Mythos è progettato per applicazioni di sicurezza informatica ad alto rischio, in particolare attraverso un'iniziativa collaborativa chiamata Project Glasswing. Questo progetto coinvolge leader del settore come CrowdStrike e Microsoft, che utilizzano il modello per testare proattivamente la sicurezza (red-teaming) dei software aziendali. Mythos eccelle nell'identificare vulnerabilità profonde che i tradizionali strumenti di analisi statica spesso trascurano. Poiché è in grado sia di riparare che di sfruttare potenzialmente le falle con grande rapidità, il suo rilascio rimane strettamente controllato per prevenire l'uso improprio in attività dannose.
Q Perché l'Unione Europea è stata esclusa dal rilascio iniziale di Claude Mythos?
A Anthropic ha escluso l'Unione Europea dal rilascio iniziale di Claude Mythos probabilmente perché le avanzate capacità autonome del modello sono in conflitto con i rigidi mandati di sicurezza e trasparenza dell'AI Act dell'UE. L'azienda sta invece dando priorità a implementazioni strategiche negli Stati Uniti e nel Regno Unito. Questa divergenza riflette una crescente tensione tra la cautela normativa europea e la spinta verso una rapida integrazione delle infrastrutture osservata in altri mercati globali.
Q Qual è l'obiettivo strategico dell'integrazione di Claude Mythos nel settore bancario del Regno Unito?
A Il Regno Unito sta negoziando l'accesso a Claude Mythos per consolidare la posizione di Londra come hub finanziario globale di primo piano. Integrando questa IA autonoma, le banche britanniche mirano a utilizzare agenti per il monitoraggio delle transazioni in tempo reale, la protezione delle pipeline di dati e l'applicazione automatica di patch per le vulnerabilità. Questa transizione richiede di concedere all'IA un accesso senza precedenti al sistema, suscitando un acceso dibattito tra i regolatori del Tesoro britannico riguardo all'equilibrio tra efficienza operativa e rischio di fallimenti catastrofici del sistema.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!