Le modèle Mythos d'Anthropic infiltre des systèmes classifiés américains en quelques heures

Anthropic
Anthropic Mythos Model Pierces US Classified Systems in Hours
Un exercice de test classifié a révélé que l'IA Mythos d'Anthropic peut identifier les vulnérabilités de systèmes gouvernementaux sécurisés avec une rapidité inédite, déclenchant un débat sur la sécurité nationale.

Dans le monde aux enjeux élevés de la sécurité nationale, le calendrier d'une intrusion dans un système se mesurait traditionnellement en semaines, en mois, voire en années de reconnaissance minutieuse. Cependant, une révélation récente impliquant le modèle d'intelligence artificielle le plus avancé d'Anthropic, Mythos, a réduit ce délai à quelques heures. Au cours d'un exercice de test autorisé mené en collaboration avec les agences de renseignement américaines, le modèle Mythos aurait identifié des vulnérabilités critiques dans des systèmes informatiques gouvernementaux hautement sensibles et classifiés, avec une rapidité qui a pris l'establishment de la défense au dépourvu. L'incident a non seulement mis en lumière l'efficacité terrifiante de l'IA générative dans la cyberguerre, mais a également déclenché une tempête législative et réglementaire qui menace de bloquer le déploiement des outils mêmes destinés à protéger ces systèmes.

La divulgation a été faite lors d'une audition du Comité sénatorial sur les banques, le logement et les affaires urbaines, où le sénateur Mark Warner de Virginie a fourni un compte rendu effrayant des performances du modèle. Attribuant ses informations au général Joshua Rudd, chef de la National Security Agency (NSA) et du Cyber Command des États-Unis, Warner a noté que l'outil d'IA a pénétré la quasi-totalité des systèmes classifiés qui lui étaient présentés en un seul après-midi. Il ne s'agissait pas d'un processus lent et itératif d'essais et d'erreurs, mais d'une identification rapide de faiblesses architecturales restées cachées aux auditeurs humains et aux scanners automatisés précédents pendant des décennies. La rapidité de cette découverte suggère que les modèles de langage étendus (LLM) comme Mythos possèdent une capacité latente à cartographier des flux logiques complexes et à identifier des défaillances non linéaires d'une manière qui modifie fondamentalement le paysage de la fortification numérique.

L'architecture de Mythos et la logique de la vulnérabilité

Pour comprendre comment un modèle d'IA peut obtenir de tels résultats, il faut examiner les différences mécaniques entre les modèles de langage étendus standard et les capacités de raisonnement spécialisées qu'Anthropic a intégrées dans la série Mythos. Contrairement à son prédécesseur, Fable, qui a été conçu pour une utilité publique et un alignement sur la sécurité plus larges, Mythos a été conçu en mettant l'accent sur l'inférence logique profonde et la résolution de problèmes en plusieurs étapes. Du point de vue de l'ingénierie, trouver une vulnérabilité dans un système classifié consiste essentiellement à identifier une exception non gérée ou un état négligé dans une vaste chaîne d'approvisionnement logicielle interconnectée. Là où une équipe humaine pourrait passer des jours à retracer une fuite de mémoire ou un ensemble de permissions mal configuré, Mythos utilise son ensemble massif de paramètres pour simuler des millions de permutations d'interaction simultanément.

La brillance technique de Mythos réside dans sa reconnaissance des formes dans le code hérité. De nombreux systèmes classifiés américains reposent sur des architectures logicielles plus anciennes qui ont été patchées et superposées pendant près de quarante ans. Ces couches créent une « fragilité » au sein du système — des points de friction cachés où les protocoles de sécurité modernes interagissent mal avec les bases de code anciennes. Mythos semble avoir développé un modèle interne haute fidélité de ces contradictions architecturales. En ingérant la logique structurelle d'un système, l'IA peut prédire où une défaillance est susceptible de se produire avant même d'initier un scan. Cette capacité prédictive est ce qui a réduit le travail de plusieurs semaines à quelques heures ; l'IA ne se contentait pas de chercher des failles, elle dérivait mathématiquement leur emplacement en fonction des défauts de conception inhérents au système.

Le projet Glasswing et l'éthique du « red teaming »

Les vulnérabilités ont été découvertes grâce à une initiative connue sous le nom de projet Glasswing. Ce programme a été établi en tant que cadre collaboratif entre Anthropic, d'autres géants de la technologie et les agences de renseignement américaines pour tester les infrastructures critiques via le « red teaming ». Le red teaming est la pratique consistant à observer un système à travers les yeux d'un adversaire pour en trouver les faiblesses. Le projet Glasswing était censé être le filet de sécurité ultime, garantissant que si un modèle aussi puissant que Mythos pouvait briser un système, le gouvernement en serait informé en premier. Cependant, le succès du projet a créé un paradoxe : plus l'IA devient efficace pour défendre le système en trouvant ses failles, plus l'IA elle-même semble dangereuse aux yeux des régulateurs qui la supervisent.

Des sources internes suggèrent que les tests effectués dans le cadre du projet Glasswing ne se limitaient pas à de simples craquages de mots de passe ou à des simulations d'hameçonnage. Il s'agissait plutôt d'une analyse par l'IA des flux de données chiffrées et de la suggestion de méthodes novatrices d'élévation de privilèges — des techniques qui n'avaient jamais été documentées dans la littérature existante sur la cybersécurité. Bien qu'un responsable américain ait précisé qu'identifier une vulnérabilité n'est pas la même chose que l'exploiter, la distinction est souvent mince dans le domaine numérique. Une fois le chemin identifié, l'exécution est souvent un script trivial. Cette prise de conscience a incité la NSA et d'autres agences à reconsidérer les risques liés au fait de permettre à un outil aussi puissant d'exister dans un environnement commercial, même un environnement aussi axé sur la sécurité que celui d'Anthropic.

Coup de frein réglementaire et interdiction d'accès étranger

À la suite de ces conclusions, l'administration Trump a agi avec une rapidité inhabituelle pour restreindre la technologie. Un décret a été signé établissant un cadre de contrôle pour tous les systèmes d'IA avancés, exigeant un examen de sécurité nationale d'un mois avant toute publication publique. Plus important encore, une directive spécifique a été émise exigeant qu'Anthropic empêche les ressortissants étrangers d'accéder à ses derniers modèles, Mythos 5 et Fable 5. La logique de l'administration repose sur une stratégie de confinement traditionnelle : si l'outil est aussi puissant, il doit être maintenu à l'intérieur des frontières des États-Unis et de leurs alliés les plus proches pour empêcher des adversaires comme la Chine ou la Russie d'utiliser des modèles similaires pour trouver les mêmes fissures dans l'armure américaine.

L'interdiction en cybersécurité est-elle contre-productive ?

La réponse de l'industrie à la répression gouvernementale a été une opposition virulente. Une coalition de plus de 100 experts en cybersécurité et dirigeants d'entreprises telles qu'Adobe et Nvidia a récemment envoyé une lettre à l'administration demandant l'annulation de la directive. Leur argument est pragmatique : en retirant les outils d'IA les plus avancés du marché, le gouvernement désarme effectivement les défenseurs tout en ne faisant rien pour arrêter le développement de modèles similaires par des adversaires. Ces experts soutiennent que Mythos est « plutôt bon » pour trouver des failles logicielles, mais qu'il n'est pas « uniquement bon » d'une manière qui justifie une interdiction totale. D'autres modèles open-source et des projets financés par l'État dans des nations rivales atteindront inévitablement le même niveau de capacité.

Le cœur du débat est de savoir si nous sommes entrés dans une ère où la seule défense contre les attaques pilotées par l'IA est un bouclier piloté par l'IA. Si les entreprises américaines de cybersécurité se voient refuser l'accès à des modèles comme Mythos, elles seront contraintes de s'appuyer sur des méthodes plus lentes, centrées sur l'humain, qui ne peuvent tout simplement pas suivre le rythme des exploits automatisés. Dans le monde de l'automatisation industrielle et de la gestion de la chaîne d'approvisionnement, où une seule vulnérabilité peut stopper le transport mondial ou arrêter un réseau électrique, la perte d'un outil de diagnostic avancé est un coup dur. Les signataires de la lettre soutiennent que la meilleure défense est un écosystème robuste et transparent où les meilleurs modèles sont utilisés pour auditer et corriger en permanence les logiciels du monde entier. Ils considèrent la voie actuelle du gouvernement comme un repli vers une mentalité de « sécurité par l'obscurité » qui n'est plus tenable à l'ère de l'intelligence générative.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q Qu'est-ce qui distingue le modèle Mythos d'Anthropic de ses prédécesseurs comme Fable ?
A Anthropic Mythos est un grand modèle de langage avancé spécialement conçu pour l'inférence logique approfondie et la résolution de problèmes en plusieurs étapes. Alors que les modèles précédents comme Fable étaient conçus pour une utilité publique générale et un alignement de sécurité standard, Mythos utilise un ensemble massif de paramètres pour simuler des interactions logicielles complexes. Cette architecture spécialisée lui permet de cartographier les défaillances non linéaires et d'identifier les vulnérabilités structurelles dans les bases de code héritées beaucoup plus efficacement que les scanners automatisés traditionnels ou les auditeurs humains.
Q Quelles ont été les principales conclusions de l'exercice de test Project Glasswing ?
A Au cours de l'exercice d'équipe rouge (red-teaming) Project Glasswing, le modèle Mythos a identifié des vulnérabilités critiques dans presque tous les systèmes gouvernementaux classifiés présentés, et ce en une seule après-midi. L'IA a mis en évidence des faiblesses architecturales et de nouvelles techniques d'élévation de privilèges qui étaient restées cachées pendant des décennies. Bien que le programme ait été destiné à aider le gouvernement à identifier et à corriger les failles, la rapidité des résultats a suscité des inquiétudes quant au potentiel d'utilisation offensive de tels outils d'IA.
Q Comment le gouvernement américain a-t-il restreint l'accès au modèle d'IA Mythos ?
A Suite à la découverte des capacités du modèle, le gouvernement américain a émis un décret établissant un processus obligatoire d'examen de sécurité nationale pour tous les systèmes d'IA avancés avant leur mise à disposition du public. En outre, une directive spécifique interdit désormais aux ressortissants étrangers d'accéder aux outils les plus avancés d'Anthropic, notamment Mythos 5 et Fable 5. Cette stratégie de confinement vise à empêcher les adversaires internationaux de tirer parti de ces puissantes capacités de raisonnement pour compromettre l'infrastructure numérique américaine.
Q Pourquoi le modèle Mythos est-il particulièrement capable d'identifier les vulnérabilités dans le code hérité ?
A Mythos est très efficace pour analyser les architectures logicielles anciennes qui ont été superposées à des décennies de correctifs. Ces couches complexes créent souvent des points de friction où les protocoles de sécurité modernes ne s'alignent pas parfaitement avec le code ancien. En modélisant la logique structurelle d'un système, Mythos peut dériver mathématiquement l'emplacement des exceptions non gérées et des défauts de conception. Cela permet à l'IA de prédire les défaillances du système avant même d'initier un scan, comprimant ainsi des mois de travail en quelques heures.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!