Anthropic : le modèle Mythos infiltre des systèmes sécurisés

Dans le monde aux enjeux élevés de la sécurité nationale, le calendrier d'une intrusion dans un système se mesurait traditionnellement en semaines, en mois, voire en années de reconnaissance minutieuse. Cependant, une révélation récente impliquant le modèle d'intelligence artificielle le plus avancé d'Anthropic, Mythos, a réduit ce délai à quelques heures. Au cours d'un exercice de test autorisé mené en collaboration avec les agences de renseignement américaines, le modèle Mythos aurait identifié des vulnérabilités critiques dans des systèmes informatiques gouvernementaux hautement sensibles et classifiés, avec une rapidité qui a pris l'establishment de la défense au dépourvu. L'incident a non seulement mis en lumière l'efficacité terrifiante de l'IA générative dans la cyberguerre, mais a également déclenché une tempête législative et réglementaire qui menace de bloquer le déploiement des outils mêmes destinés à protéger ces systèmes.

La divulgation a été faite lors d'une audition du Comité sénatorial sur les banques, le logement et les affaires urbaines, où le sénateur Mark Warner de Virginie a fourni un compte rendu effrayant des performances du modèle. Attribuant ses informations au général Joshua Rudd, chef de la National Security Agency (NSA) et du Cyber Command des États-Unis, Warner a noté que l'outil d'IA a pénétré la quasi-totalité des systèmes classifiés qui lui étaient présentés en un seul après-midi. Il ne s'agissait pas d'un processus lent et itératif d'essais et d'erreurs, mais d'une identification rapide de faiblesses architecturales restées cachées aux auditeurs humains et aux scanners automatisés précédents pendant des décennies. La rapidité de cette découverte suggère que les modèles de langage étendus (LLM) comme Mythos possèdent une capacité latente à cartographier des flux logiques complexes et à identifier des défaillances non linéaires d'une manière qui modifie fondamentalement le paysage de la fortification numérique.

L'architecture de Mythos et la logique de la vulnérabilité

Pour comprendre comment un modèle d'IA peut obtenir de tels résultats, il faut examiner les différences mécaniques entre les modèles de langage étendus standard et les capacités de raisonnement spécialisées qu'Anthropic a intégrées dans la série Mythos. Contrairement à son prédécesseur, Fable, qui a été conçu pour une utilité publique et un alignement sur la sécurité plus larges, Mythos a été conçu en mettant l'accent sur l'inférence logique profonde et la résolution de problèmes en plusieurs étapes. Du point de vue de l'ingénierie, trouver une vulnérabilité dans un système classifié consiste essentiellement à identifier une exception non gérée ou un état négligé dans une vaste chaîne d'approvisionnement logicielle interconnectée. Là où une équipe humaine pourrait passer des jours à retracer une fuite de mémoire ou un ensemble de permissions mal configuré, Mythos utilise son ensemble massif de paramètres pour simuler des millions de permutations d'interaction simultanément.

La brillance technique de Mythos réside dans sa reconnaissance des formes dans le code hérité. De nombreux systèmes classifiés américains reposent sur des architectures logicielles plus anciennes qui ont été patchées et superposées pendant près de quarante ans. Ces couches créent une « fragilité » au sein du système — des points de friction cachés où les protocoles de sécurité modernes interagissent mal avec les bases de code anciennes. Mythos semble avoir développé un modèle interne haute fidélité de ces contradictions architecturales. En ingérant la logique structurelle d'un système, l'IA peut prédire où une défaillance est susceptible de se produire avant même d'initier un scan. Cette capacité prédictive est ce qui a réduit le travail de plusieurs semaines à quelques heures ; l'IA ne se contentait pas de chercher des failles, elle dérivait mathématiquement leur emplacement en fonction des défauts de conception inhérents au système.

Le projet Glasswing et l'éthique du « red teaming »

Les vulnérabilités ont été découvertes grâce à une initiative connue sous le nom de projet Glasswing. Ce programme a été établi en tant que cadre collaboratif entre Anthropic, d'autres géants de la technologie et les agences de renseignement américaines pour tester les infrastructures critiques via le « red teaming ». Le red teaming est la pratique consistant à observer un système à travers les yeux d'un adversaire pour en trouver les faiblesses. Le projet Glasswing était censé être le filet de sécurité ultime, garantissant que si un modèle aussi puissant que Mythos pouvait briser un système, le gouvernement en serait informé en premier. Cependant, le succès du projet a créé un paradoxe : plus l'IA devient efficace pour défendre le système en trouvant ses failles, plus l'IA elle-même semble dangereuse aux yeux des régulateurs qui la supervisent.

Des sources internes suggèrent que les tests effectués dans le cadre du projet Glasswing ne se limitaient pas à de simples craquages de mots de passe ou à des simulations d'hameçonnage. Il s'agissait plutôt d'une analyse par l'IA des flux de données chiffrées et de la suggestion de méthodes novatrices d'élévation de privilèges — des techniques qui n'avaient jamais été documentées dans la littérature existante sur la cybersécurité. Bien qu'un responsable américain ait précisé qu'identifier une vulnérabilité n'est pas la même chose que l'exploiter, la distinction est souvent mince dans le domaine numérique. Une fois le chemin identifié, l'exécution est souvent un script trivial. Cette prise de conscience a incité la NSA et d'autres agences à reconsidérer les risques liés au fait de permettre à un outil aussi puissant d'exister dans un environnement commercial, même un environnement aussi axé sur la sécurité que celui d'Anthropic.

Coup de frein réglementaire et interdiction d'accès étranger

À la suite de ces conclusions, l'administration Trump a agi avec une rapidité inhabituelle pour restreindre la technologie. Un décret a été signé établissant un cadre de contrôle pour tous les systèmes d'IA avancés, exigeant un examen de sécurité nationale d'un mois avant toute publication publique. Plus important encore, une directive spécifique a été émise exigeant qu'Anthropic empêche les ressortissants étrangers d'accéder à ses derniers modèles, Mythos 5 et Fable 5. La logique de l'administration repose sur une stratégie de confinement traditionnelle : si l'outil est aussi puissant, il doit être maintenu à l'intérieur des frontières des États-Unis et de leurs alliés les plus proches pour empêcher des adversaires comme la Chine ou la Russie d'utiliser des modèles similaires pour trouver les mêmes fissures dans l'armure américaine.

L'interdiction en cybersécurité est-elle contre-productive ?

La réponse de l'industrie à la répression gouvernementale a été une opposition virulente. Une coalition de plus de 100 experts en cybersécurité et dirigeants d'entreprises telles qu'Adobe et Nvidia a récemment envoyé une lettre à l'administration demandant l'annulation de la directive. Leur argument est pragmatique : en retirant les outils d'IA les plus avancés du marché, le gouvernement désarme effectivement les défenseurs tout en ne faisant rien pour arrêter le développement de modèles similaires par des adversaires. Ces experts soutiennent que Mythos est « plutôt bon » pour trouver des failles logicielles, mais qu'il n'est pas « uniquement bon » d'une manière qui justifie une interdiction totale. D'autres modèles open-source et des projets financés par l'État dans des nations rivales atteindront inévitablement le même niveau de capacité.

Le cœur du débat est de savoir si nous sommes entrés dans une ère où la seule défense contre les attaques pilotées par l'IA est un bouclier piloté par l'IA. Si les entreprises américaines de cybersécurité se voient refuser l'accès à des modèles comme Mythos, elles seront contraintes de s'appuyer sur des méthodes plus lentes, centrées sur l'humain, qui ne peuvent tout simplement pas suivre le rythme des exploits automatisés. Dans le monde de l'automatisation industrielle et de la gestion de la chaîne d'approvisionnement, où une seule vulnérabilité peut stopper le transport mondial ou arrêter un réseau électrique, la perte d'un outil de diagnostic avancé est un coup dur. Les signataires de la lettre soutiennent que la meilleure défense est un écosystème robuste et transparent où les meilleurs modèles sont utilisés pour auditer et corriger en permanence les logiciels du monde entier. Ils considèrent la voie actuelle du gouvernement comme un repli vers une mentalité de « sécurité par l'obscurité » qui n'est plus tenable à l'ère de l'intelligence générative.

Le modèle Mythos d'Anthropic infiltre des systèmes classifiés américains en quelques heures

L'architecture de Mythos et la logique de la vulnérabilité

Le projet Glasswing et l'éthique du « red teaming »

Coup de frein réglementaire et interdiction d'accès étranger

L'interdiction en cybersécurité est-elle contre-productive ?

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments