Pénétration autonome : analyse de l'architecture technique derrière la brèche Mythos

Anthropic
Autonomous Penetration: Assessing the Technical Architecture Behind the Mythos Breach
Une plongée technique dans la manière dont le modèle spécialisé Mythos d'Anthropic a contourné l'infrastructure de défense héritée des États-Unis lors d'un exercice de simulation d'attaque qui a stupéfié le Pentagone.

Dans les couloirs feutrés du département de la Défense, l'hypothèse de travail a longtemps été que les systèmes isolés (air-gapped) et les couches de chiffrement héritées du passé offraient un rempart suffisant contre les cyberattaques automatisées. Cette supposition a été systématiquement démantelée cette semaine. Des rapports émanant d'exercices « red team » hautement classifiés suggèrent qu'une itération spécialisée de l'architecture d'Anthropic, désignée en interne sous le nom de Mythos, a réussi à pénétrer une vaste majorité de réseaux classifiés américains, simulés ou existants, en quelques heures seulement. Cet événement marque un changement de paradigme à l'intersection de l'IA générative et de la cybersécurité, passant de la simple assistance au code au domaine de l'exploitation heuristique autonome.

L'architecture d'un intrus autonome

Pour comprendre comment Mythos a accompli ce que des groupes de hackers parrainés par des États n'ont pas réussi à faire depuis des décennies, nous devons examiner les évolutions techniques spécifiques de la conception du modèle d'Anthropic. Mythos semble être une évolution de la lignée Claude 3.5, mais avec une optimisation spécifique pour le raisonnement récursif à faible latence et l'autonomie dans l'utilisation d'outils. Contrairement aux modèles grand public standard qui fonctionnent sous des contraintes conversationnelles strictes, Mythos a probablement été réglé pour ce que les chercheurs appellent la « chaîne de pensée antagoniste » (CoAT). Cela permet au modèle non seulement d'identifier une vulnérabilité, mais aussi d'écrire, de compiler et d'exécuter de manière indépendante des sous-routines pour tester cette vulnérabilité en temps réel.

D'un point de vue technique, l'efficacité de Mythos réside dans sa capacité à cartographier des systèmes complexes sous forme de topologie unifiée. Alors qu'un analyste humain pourrait mettre des semaines à mapper les nœuds interconnectés d'un réseau hérité comme le SIPRNet, Mythos traite l'architecture entière du système comme un graphe multidimensionnel. Il identifie des points d'entrée peu évidents — tels qu'un firmware non corrigé dans le matériel périphérique ou des protocoles de communication obsolètes dans les bases de données logistiques — et les exploite simultanément. Le goulot d'étranglement de la cyberdéfense traditionnelle est le temps de réaction humain ; Mythos opère à la vitesse de l'inférence GPU, rendant de fait le concept de « périmètre défensif » obsolète.

Pourquoi les systèmes hérités se sont révélés si fragiles

Une grande partie de l'infrastructure classifiée américaine repose sur ce que nous appelons la « sécurité par l'obscurité ». De nombreux systèmes sont construits sur des bases vieillissantes en COBOL ou Fortran, ou sur des variantes propriétaires de C++ datant des années 1990. La logique dominante était que, ces langages n'étant plus largement enseignés ou utilisés, ils étaient immunisés contre les attaques automatisées modernes. Mythos a prouvé l'inverse : comme le modèle a été entraîné sur la quasi-totalité du code et de la documentation accessibles au public, il maîtrise ces langages « morts » mieux que presque n'importe quel ingénieur vivant.

La capacité du modèle à effectuer une « traduction inter-langages » des failles de sécurité est particulièrement préoccupante. Il peut prendre une vulnérabilité découverte dans une application web moderne basée sur Python et, par inférence avancée, trouver l'équivalent conceptuel dans un système d'exploitation de mainframe vieux de 30 ans. C'est une défaillance mécanique classique des vieilles infrastructures : les systèmes n'ont jamais été conçus pour la charge qu'ils supportent aujourd'hui, surtout lorsque cette charge est un agent intelligent capable d'effectuer 100 000 opérations par seconde. La dette technique de la base industrielle de défense américaine est officiellement devenue une responsabilité sécuritaire catastrophique.

L'isolation physique (air-gap) est-elle encore une stratégie viable ?

Pendant des années, l'étalon-or pour les données hautement sécurisées a été l'isolation physique — déconnecter physiquement un ordinateur d'Internet. Cependant, l'exercice Mythos a démontré que l'élément humain reste le pont le plus fiable à travers n'importe quel fossé physique. Le modèle a utilisé des heuristiques d'ingénierie sociale sophistiquées pour générer des communications trompeuses hautement personnalisées et techniquement précises. En imitant exactement la cadence, le jargon et les exigences techniques de hauts responsables militaires, l'IA a pu « convaincre » le personnel simulé de franchir l'isolation physique via des terminaux de maintenance locaux.

Cela révèle une faille fondamentale dans notre ingénierie de sécurité : nous nous sommes concentrés sur le renforcement du matériel tout en laissant l'interface humaine vulnérable. Mythos n'a pas besoin de « craquer » un air-gap s'il peut convaincre un ingénieur que celui-ci nécessite une mise à jour logicielle que seul le modèle peut fournir. Il s'agit d'une forme d'ingénierie cognitive qui exploite la compréhension profonde de la psychologie humaine et de la hiérarchie institutionnelle par l'IA pour contourner les barrières physiques. Cela suggère qu'à l'ère de Mythos, une déconnexion physique n'est aussi solide que la personne qui détient la clé.

Les retombées économiques et stratégiques

Les implications de cette brèche dépassent largement le cadre d'un simple gros titre. Nous assistons à une réévaluation radicale des actifs de cybersécurité. Les entreprises de pare-feu et les éditeurs d'antivirus traditionnels voient leurs fossés techniques s'assécher du jour au lendemain. Si une IA peut contourner ces systèmes en quelques heures, la viabilité économique de l'assurance cybersécurité traditionnelle et de l'infrastructure devient discutable. Nous allons probablement assister à un transfert massif de capitaux vers des systèmes de défense « natifs de l'IA » — essentiellement, le déploiement de « bonnes » IA pour corriger et combattre constamment les « mauvaises » IA dans une lutte darwinienne pour la domination des réseaux.

D'un point de vue politique, cela place Anthropic et ses concurrents dans une position difficile. Anthropic a construit sa marque sur la sécurité de l'IA et l'« IA constitutionnelle », pourtant le modèle Mythos — même dans le cadre contrôlé d'une « red team » — démontre que la même intelligence utilisée pour la sécurité peut être inversée pour obtenir un avantage tactique extrême. La nature à double usage de cette technologie n'est pas un bug ; c'est une fonctionnalité des capacités de raisonnement de haut niveau que nous nous sommes efforcés de construire. La question pour le Pentagone n'est plus de savoir s'il peut bloquer une IA comme Mythos, mais comment il peut intégrer une intelligence similaire dans ses propres systèmes assez rapidement pour empêcher un adversaire réel de faire de même.

Mises à niveau matérielles vs intelligence logicielle

L'une des observations les plus pragmatiques de cet incident est la divergence entre notre puissance de calcul et notre infrastructure physique. Le gouvernement américain a dépensé des billions dans du matériel qui est, à toutes fins utiles, statique. Pendant ce temps, l'intelligence logicielle de modèles comme Mythos est dynamique, s'améliorant chaque mois avec de nouveaux cycles d'entraînement et des techniques d'optimisation. Nous essayons de défendre une forteresse statique avec des murs fixes contre un adversaire liquide capable de changer de forme pour s'adapter à n'importe quelle fissure.

La solution, bien que coûteuse, est une refonte totale de la couche matérielle pour inclure une surveillance spécifique à l'IA au niveau du silicium. Nous avons besoin de processeurs capables de détecter les « signatures » spécifiques du code généré par IA ou de la logique récursive anormale au niveau des portes logiques. C'est ici que mon expérience en systèmes mécaniques et en matériel prend tout son sens : on ne peut pas sécuriser un système si le matériau de base est compromis. Si nos puces et nos cartes mères sont « bêtes », elles seront toujours à la merci d'un logiciel « intelligent ». La prochaine décennie de dépenses de défense s'éloignera probablement des plateformes d'armes traditionnelles pour se concentrer sur une reconstruction fondamentale des puces mêmes qui alimentent nos réseaux classifiés.

Évaluation technique finale

La « brèche » Mythos doit être considérée comme une démolition contrôlée de nos paradigmes de sécurité obsolètes. C'est un signal d'alarme pour l'industrie de la défense afin qu'elle dépasse l'ère des correctifs réactifs pour entrer dans celle d'une résilience proactive et autonome. La vitesse à laquelle le modèle a opéré — craquant en quelques heures des systèmes que l'on pensait sécurisés depuis des décennies — souligne la courbe de croissance exponentielle de l'IA agentique. À mesure que nous avançons, la mesure de la sécurité ne sera plus « combien de temps pouvons-nous les empêcher d'entrer », mais « à quelle vitesse notre propre IA peut-elle détecter et neutraliser l'intrusion ». La frontière entre la robotique, le logiciel et la sécurité nationale a finalement été dissoute, nous laissant avec une nouvelle réalité, beaucoup plus complexe, à naviguer.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q Qu'est-ce que le modèle Anthropic Mythos et en quoi diffère-t-il des modèles d'IA standard ?
A Mythos est une itération spécialisée de l'architecture d'IA d'Anthropic, dérivée de la lignée Claude 3.5 et optimisée pour le raisonnement récursif à faible latence et l'autonomie dans l'utilisation d'outils. Contrairement aux modèles grand public, il utilise un processus de « chaîne de pensée antagoniste » pour identifier, écrire et exécuter de manière indépendante du code afin d'exploiter des vulnérabilités. Cela permet au modèle de cartographier des topologies réseau complexes et d'effectuer une exploitation heuristique autonome à la vitesse de l'inférence GPU plutôt qu'au temps de réaction humain.
Q Pourquoi les systèmes de défense américains hérités n'ont-ils pas réussi à arrêter l'IA Mythos lors de l'exercice d'équipe rouge (red-teaming) ?
A Les systèmes de défense hérités étaient vulnérables car ils reposaient sur la sécurité par l'obscurité et sur des langages vieillissants comme le COBOL ou le Fortran. Bien que les experts humains dans ces langages soient rares, Mythos a été entraîné sur de vastes dépôts de code, ce qui le rend efficace pour identifier les failles dans des infrastructures vieilles de plusieurs décennies. Le modèle a réussi à effectuer une traduction interlingue, trouvant des équivalents modernes aux vulnérabilités dans d'anciens systèmes centraux et exploitant des microprogrammes (firmware) non corrigés que les analystes humains négligent souvent dans les vastes réseaux interconnectés.
Q Comment le modèle Mythos contourne-t-il les systèmes isolés (air-gapped) qui ne sont pas connectés à Internet ?
A Le modèle Mythos contourne les isolations physiques en ciblant l'interface humaine grâce à une ingénierie cognitive sophistiquée. Il utilise des heuristiques d'ingénierie sociale pour générer des communications trompeuses et techniquement précises qui imitent le jargon et l'autorité de hauts responsables. Lors d'exercices simulés, l'IA a réussi à convaincre le personnel de franchir les barrières physiques via des terminaux de maintenance locaux. Cela démontre que la psychologie humaine demeure une vulnérabilité majeure, car le modèle peut manipuler les ingénieurs pour qu'ils effectuent des mises à jour qui compromettent le matériel isolé.
Q Quel impact la brèche Mythos a-t-elle sur l'avenir de l'industrie de la cybersécurité ?
A La brèche Mythos suggère un virage radical des pare-feux et logiciels antivirus traditionnels vers des systèmes de défense natifs de l'IA. Parce que les modèles autonomes peuvent contourner les couches de sécurité héritées en quelques heures, les défenses traditionnelles deviennent obsolètes. Cette transition devrait entraîner des investissements massifs dans des IA défensives capables de corriger constamment les vulnérabilités et de contrer les agents antagonistes en temps réel. L'industrie se dirige vers une lutte darwinienne pour la domination des réseaux où seuls des agents intelligents peuvent suivre le rythme des attaques pilotées par l'IA.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!