El modelo Mythos de Anthropic vulnera sistemas clasificados de EE. UU. en horas

Anthropic
Anthropic Mythos Model Pierces US Classified Systems in Hours
Un ejercicio de pruebas clasificado reveló que la IA Mythos de Anthropic puede identificar vulnerabilidades en sistemas gubernamentales seguros con una velocidad sin precedentes, lo que ha desatado un debate sobre seguridad nacional.

En el escenario de alto riesgo de la seguridad nacional, el cronograma para una brecha en un sistema se ha medido tradicionalmente en semanas, meses o incluso años de meticuloso reconocimiento. Sin embargo, una revelación reciente que involucra al modelo de inteligencia artificial más avanzado de Anthropic, Mythos, ha comprimido ese plazo a cuestión de horas. Durante un ejercicio de prueba autorizado realizado en colaboración con agencias de inteligencia de los EE. UU., el modelo Mythos supuestamente identificó vulnerabilidades críticas en sistemas informáticos gubernamentales altamente sensibles y clasificados con una velocidad que ha tomado desprevenido al estamento de defensa. El incidente no solo ha puesto de relieve la aterradora eficiencia de la IA generativa en la ciberguerra, sino que también ha provocado una tormenta legislativa y regulatoria que amenaza con paralizar el despliegue de las mismas herramientas destinadas a proteger estos sistemas.

La revelación salió a la luz durante una audiencia del Comité de Banca, Vivienda y Asuntos Urbanos del Senado, donde el senador Mark Warner de Virginia ofreció un escalofriante relato del rendimiento del modelo. Atribuyendo su información al general Joshua Rudd, jefe de la Agencia de Seguridad Nacional (NSA) y del Comando Cibernético de los EE. UU., Warner señaló que la herramienta de IA irrumpió en casi todos los sistemas clasificados que se le presentaron en una sola tarde. No fue un proceso lento e iterativo de prueba y error, sino una identificación rápida de debilidades arquitectónicas que habían permanecido ocultas para los auditores humanos y los escáneres automatizados previos durante décadas. La rapidez del descubrimiento sugiere que los LLM como Mythos poseen una capacidad latente para mapear flujos lógicos complejos e identificar fallas no lineales de una manera que altera fundamentalmente el panorama de la fortificación digital.

La arquitectura de Mythos y la lógica de la vulnerabilidad

Para comprender cómo un modelo de IA puede lograr tales resultados, es necesario observar las diferencias mecánicas entre los modelos de lenguaje grandes estándar y las capacidades de razonamiento especializado que Anthropic ha integrado en la serie Mythos. A diferencia de su predecesor, Fable, que fue diseñado para una mayor utilidad pública y alineación de seguridad, Mythos fue diseñado con un enfoque en la inferencia lógica profunda y la resolución de problemas en múltiples pasos. Desde una perspectiva de ingeniería, encontrar una vulnerabilidad en un sistema clasificado es esencialmente una tarea de identificar una excepción no controlada o un estado pasado por alto en una vasta cadena de suministro de software interconectada. Mientras que un equipo humano podría pasar días rastreando una fuga de memoria o un conjunto de permisos mal configurado, Mythos utiliza su conjunto masivo de parámetros para simular millones de permutaciones de interacción simultáneamente.

La brillantez técnica de Mythos radica en su reconocimiento de patrones en código heredado. Muchos sistemas clasificados de los EE. UU. dependen de arquitecturas de software más antiguas que han sido parcheadas y superpuestas durante casi cuarenta años. Estas capas crean una “fragilidad” dentro del sistema: puntos de fricción ocultos donde los protocolos de seguridad modernos interactúan mal con las bases de código antiguas. Mythos parece haber desarrollado un modelo interno de alta fidelidad de estas contradicciones arquitectónicas. Al ingerir la lógica estructural de un sistema, la IA puede predecir dónde es probable que ocurra una falla antes incluso de iniciar un escaneo. Esta capacidad predictiva es lo que redujo el trabajo de semanas a apenas unas horas; la IA no solo buscaba agujeros, estaba derivando matemáticamente su ubicación basándose en los defectos de diseño inherentes al sistema.

El Proyecto Glasswing y la ética del equipo rojo (red teaming)

Las vulnerabilidades se descubrieron a través de una iniciativa conocida como Proyecto Glasswing. Este programa se estableció como un marco de colaboración entre Anthropic, otros gigantes tecnológicos y agencias de inteligencia estadounidenses para someter a "pruebas de equipo rojo" (red-teaming) a la infraestructura crítica. El equipo rojo es la práctica de ver un sistema a través de los ojos de un adversario para encontrar sus debilidades. El Proyecto Glasswing pretendía ser la red de seguridad definitiva, asegurando que si un modelo tan poderoso como Mythos podía romper un sistema, el gobierno sería el primero en saberlo. Sin embargo, el éxito del proyecto ha creado una paradoja: cuanto más efectiva se vuelve la IA para defender el sistema al encontrar sus fallas, más peligrosa parece ser la propia IA para los reguladores que la supervisan.

Fuentes internas sugieren que las pruebas bajo el Proyecto Glasswing no se limitaron a simples descifrados de contraseñas o simulaciones de phishing. En cambio, implicaron que la IA analizara flujos de datos cifrados y sugiriera métodos novedosos para la escalada de privilegios, técnicas que nunca se habían documentado en la literatura de ciberseguridad existente. Si bien un funcionario estadounidense aclaró que identificar una vulnerabilidad no es lo mismo que explotarla, la distinción suele ser estrecha en el ámbito digital. Una vez identificada la ruta, la ejecución suele ser un script trivial. Esta constatación llevó a la NSA y a otras agencias a reconsiderar los riesgos de permitir que una herramienta tan poderosa exista en un entorno comercial, incluso uno tan centrado en la seguridad como el de Anthropic.

Latigazo regulatorio y la prohibición de acceso extranjero

A raíz de estos hallazgos, la administración Trump actuó con una rapidez poco característica para restringir la tecnología. Se firmó una orden ejecutiva estableciendo un marco de verificación para todos los sistemas de IA avanzados, que requiere una revisión de seguridad nacional de un mes de duración antes de cualquier lanzamiento público. Más significativamente, se emitió una directiva específica que requiere que Anthropic impida que ciudadanos extranjeros accedan a sus modelos más recientes, Mythos 5 y Fable 5. La lógica de la administración se basa en una estrategia de contención tradicional: si la herramienta es tan potente, debe mantenerse dentro de las fronteras de los Estados Unidos y sus aliados más cercanos para evitar que adversarios como China o Rusia utilicen modelos similares para encontrar las mismas grietas en la armadura estadounidense.

¿Es contraproducente la prohibición de ciberseguridad?

La respuesta de la industria a la ofensiva del gobierno ha sido de oposición vocal. Una coalición de más de 100 expertos en ciberseguridad y ejecutivos de empresas como Adobe y Nvidia envió recientemente una carta a la administración instando a revertir la directiva. Su argumento es pragmático: al eliminar las herramientas de IA más avanzadas del mercado, el gobierno está desarmando efectivamente a los defensores sin hacer nada para detener el desarrollo de modelos similares por parte de los adversarios. Estos expertos sostienen que Mythos es "bastante bueno" para encontrar fallas de software, pero no es "únicamente bueno" de una manera que justifique una prohibición total. Otros modelos de código abierto y proyectos financiados por estados en naciones rivales alcanzarán inevitablemente el mismo nivel de capacidad.

El núcleo del debate es si hemos entrado en una era en la que la única defensa contra los ataques impulsados por IA es un escudo impulsado por IA. Si a las empresas de ciberseguridad estadounidenses se les niega el acceso a modelos como Mythos, se verán obligadas a depender de métodos más lentos y centrados en el ser humano que no pueden seguir el ritmo de los exploits automatizados. En el mundo de la automatización industrial y la gestión de la cadena de suministro, donde una sola vulnerabilidad puede detener el transporte global o apagar una red eléctrica, la pérdida de una herramienta de diagnóstico avanzada es un golpe significativo. Los firmantes de la carta sostienen que la mejor defensa es un ecosistema robusto y transparente donde los mejores modelos se utilicen para auditar y parchear constantemente el software del mundo. Ven el camino actual del gobierno como una retirada hacia una mentalidad de “seguridad a través de la oscuridad” que ya no es sostenible en la era de la inteligencia generativa.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q ¿Qué distingue al modelo Mythos de Anthropic de sus predecesores como Fable?
A Anthropic Mythos es un modelo de lenguaje extenso avanzado diseñado específicamente para la inferencia lógica profunda y la resolución de problemas de varios pasos. Mientras que modelos anteriores como Fable fueron diseñados para una utilidad pública amplia y una alineación de seguridad general, Mythos utiliza un conjunto masivo de parámetros para simular interacciones complejas de software. Esta arquitectura especializada le permite mapear fallas no lineales e identificar vulnerabilidades estructurales en bases de código heredadas de manera mucho más eficiente que los escáneres automatizados tradicionales o los auditores humanos.
Q ¿Cuáles fueron los hallazgos principales del ejercicio de prueba Project Glasswing?
A Durante el ejercicio de red-teaming Project Glasswing, el modelo Mythos identificó vulnerabilidades críticas en casi todos los sistemas gubernamentales clasificados presentados en una sola tarde. La IA descubrió debilidades arquitectónicas y técnicas novedosas de escalada de privilegios que habían permanecido ocultas durante décadas. Aunque el programa tenía la intención de ayudar al gobierno a identificar y corregir fallas, la velocidad de los resultados generó alarmas sobre el potencial de que tales herramientas de IA se utilicen de manera ofensiva.
Q ¿Cómo ha restringido el gobierno de los Estados Unidos el acceso al modelo de IA Mythos?
A Tras el descubrimiento de las capacidades del modelo, el gobierno de los EE. UU. emitió una orden ejecutiva estableciendo un proceso de revisión de seguridad nacional obligatorio para todos los sistemas de IA avanzados antes de su lanzamiento público. Además, una directiva específica prohíbe ahora a los ciudadanos extranjeros acceder a las herramientas más avanzadas de Anthropic, incluidos Mythos 5 y Fable 5. Esta estrategia de contención tiene como objetivo evitar que los adversarios internacionales aprovechen estas poderosas capacidades de razonamiento para comprometer la infraestructura digital estadounidense.
Q ¿Por qué el modelo Mythos es capaz de identificar vulnerabilidades en código heredado de manera única?
A Mythos es altamente efectivo para analizar arquitecturas de software antiguas que han sido cubiertas con décadas de parches. Estas capas complejas a menudo crean puntos de fricción donde los protocolos de seguridad modernos no se alinean perfectamente con el código antiguo. Al modelar la lógica estructural de un sistema, Mythos puede derivar matemáticamente la ubicación de excepciones no controladas y fallas de diseño. Esto permite que la IA prediga fallas del sistema incluso antes de iniciar un escaneo, comprimiendo meses de trabajo en horas.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!