El modelo Mythos de Anthropic vulnera sistemas de EE. UU.

En el escenario de alto riesgo de la seguridad nacional, el cronograma para una brecha en un sistema se ha medido tradicionalmente en semanas, meses o incluso años de meticuloso reconocimiento. Sin embargo, una revelación reciente que involucra al modelo de inteligencia artificial más avanzado de Anthropic, Mythos, ha comprimido ese plazo a cuestión de horas. Durante un ejercicio de prueba autorizado realizado en colaboración con agencias de inteligencia de los EE. UU., el modelo Mythos supuestamente identificó vulnerabilidades críticas en sistemas informáticos gubernamentales altamente sensibles y clasificados con una velocidad que ha tomado desprevenido al estamento de defensa. El incidente no solo ha puesto de relieve la aterradora eficiencia de la IA generativa en la ciberguerra, sino que también ha provocado una tormenta legislativa y regulatoria que amenaza con paralizar el despliegue de las mismas herramientas destinadas a proteger estos sistemas.

La revelación salió a la luz durante una audiencia del Comité de Banca, Vivienda y Asuntos Urbanos del Senado, donde el senador Mark Warner de Virginia ofreció un escalofriante relato del rendimiento del modelo. Atribuyendo su información al general Joshua Rudd, jefe de la Agencia de Seguridad Nacional (NSA) y del Comando Cibernético de los EE. UU., Warner señaló que la herramienta de IA irrumpió en casi todos los sistemas clasificados que se le presentaron en una sola tarde. No fue un proceso lento e iterativo de prueba y error, sino una identificación rápida de debilidades arquitectónicas que habían permanecido ocultas para los auditores humanos y los escáneres automatizados previos durante décadas. La rapidez del descubrimiento sugiere que los LLM como Mythos poseen una capacidad latente para mapear flujos lógicos complejos e identificar fallas no lineales de una manera que altera fundamentalmente el panorama de la fortificación digital.

La arquitectura de Mythos y la lógica de la vulnerabilidad

Para comprender cómo un modelo de IA puede lograr tales resultados, es necesario observar las diferencias mecánicas entre los modelos de lenguaje grandes estándar y las capacidades de razonamiento especializado que Anthropic ha integrado en la serie Mythos. A diferencia de su predecesor, Fable, que fue diseñado para una mayor utilidad pública y alineación de seguridad, Mythos fue diseñado con un enfoque en la inferencia lógica profunda y la resolución de problemas en múltiples pasos. Desde una perspectiva de ingeniería, encontrar una vulnerabilidad en un sistema clasificado es esencialmente una tarea de identificar una excepción no controlada o un estado pasado por alto en una vasta cadena de suministro de software interconectada. Mientras que un equipo humano podría pasar días rastreando una fuga de memoria o un conjunto de permisos mal configurado, Mythos utiliza su conjunto masivo de parámetros para simular millones de permutaciones de interacción simultáneamente.

La brillantez técnica de Mythos radica en su reconocimiento de patrones en código heredado. Muchos sistemas clasificados de los EE. UU. dependen de arquitecturas de software más antiguas que han sido parcheadas y superpuestas durante casi cuarenta años. Estas capas crean una “fragilidad” dentro del sistema: puntos de fricción ocultos donde los protocolos de seguridad modernos interactúan mal con las bases de código antiguas. Mythos parece haber desarrollado un modelo interno de alta fidelidad de estas contradicciones arquitectónicas. Al ingerir la lógica estructural de un sistema, la IA puede predecir dónde es probable que ocurra una falla antes incluso de iniciar un escaneo. Esta capacidad predictiva es lo que redujo el trabajo de semanas a apenas unas horas; la IA no solo buscaba agujeros, estaba derivando matemáticamente su ubicación basándose en los defectos de diseño inherentes al sistema.

El Proyecto Glasswing y la ética del equipo rojo (red teaming)

Las vulnerabilidades se descubrieron a través de una iniciativa conocida como Proyecto Glasswing. Este programa se estableció como un marco de colaboración entre Anthropic, otros gigantes tecnológicos y agencias de inteligencia estadounidenses para someter a "pruebas de equipo rojo" (red-teaming) a la infraestructura crítica. El equipo rojo es la práctica de ver un sistema a través de los ojos de un adversario para encontrar sus debilidades. El Proyecto Glasswing pretendía ser la red de seguridad definitiva, asegurando que si un modelo tan poderoso como Mythos podía romper un sistema, el gobierno sería el primero en saberlo. Sin embargo, el éxito del proyecto ha creado una paradoja: cuanto más efectiva se vuelve la IA para defender el sistema al encontrar sus fallas, más peligrosa parece ser la propia IA para los reguladores que la supervisan.

Fuentes internas sugieren que las pruebas bajo el Proyecto Glasswing no se limitaron a simples descifrados de contraseñas o simulaciones de phishing. En cambio, implicaron que la IA analizara flujos de datos cifrados y sugiriera métodos novedosos para la escalada de privilegios, técnicas que nunca se habían documentado en la literatura de ciberseguridad existente. Si bien un funcionario estadounidense aclaró que identificar una vulnerabilidad no es lo mismo que explotarla, la distinción suele ser estrecha en el ámbito digital. Una vez identificada la ruta, la ejecución suele ser un script trivial. Esta constatación llevó a la NSA y a otras agencias a reconsiderar los riesgos de permitir que una herramienta tan poderosa exista en un entorno comercial, incluso uno tan centrado en la seguridad como el de Anthropic.

Latigazo regulatorio y la prohibición de acceso extranjero

A raíz de estos hallazgos, la administración Trump actuó con una rapidez poco característica para restringir la tecnología. Se firmó una orden ejecutiva estableciendo un marco de verificación para todos los sistemas de IA avanzados, que requiere una revisión de seguridad nacional de un mes de duración antes de cualquier lanzamiento público. Más significativamente, se emitió una directiva específica que requiere que Anthropic impida que ciudadanos extranjeros accedan a sus modelos más recientes, Mythos 5 y Fable 5. La lógica de la administración se basa en una estrategia de contención tradicional: si la herramienta es tan potente, debe mantenerse dentro de las fronteras de los Estados Unidos y sus aliados más cercanos para evitar que adversarios como China o Rusia utilicen modelos similares para encontrar las mismas grietas en la armadura estadounidense.

¿Es contraproducente la prohibición de ciberseguridad?

La respuesta de la industria a la ofensiva del gobierno ha sido de oposición vocal. Una coalición de más de 100 expertos en ciberseguridad y ejecutivos de empresas como Adobe y Nvidia envió recientemente una carta a la administración instando a revertir la directiva. Su argumento es pragmático: al eliminar las herramientas de IA más avanzadas del mercado, el gobierno está desarmando efectivamente a los defensores sin hacer nada para detener el desarrollo de modelos similares por parte de los adversarios. Estos expertos sostienen que Mythos es "bastante bueno" para encontrar fallas de software, pero no es "únicamente bueno" de una manera que justifique una prohibición total. Otros modelos de código abierto y proyectos financiados por estados en naciones rivales alcanzarán inevitablemente el mismo nivel de capacidad.

El núcleo del debate es si hemos entrado en una era en la que la única defensa contra los ataques impulsados por IA es un escudo impulsado por IA. Si a las empresas de ciberseguridad estadounidenses se les niega el acceso a modelos como Mythos, se verán obligadas a depender de métodos más lentos y centrados en el ser humano que no pueden seguir el ritmo de los exploits automatizados. En el mundo de la automatización industrial y la gestión de la cadena de suministro, donde una sola vulnerabilidad puede detener el transporte global o apagar una red eléctrica, la pérdida de una herramienta de diagnóstico avanzada es un golpe significativo. Los firmantes de la carta sostienen que la mejor defensa es un ecosistema robusto y transparente donde los mejores modelos se utilicen para auditar y parchear constantemente el software del mundo. Ven el camino actual del gobierno como una retirada hacia una mentalidad de “seguridad a través de la oscuridad” que ya no es sostenible en la era de la inteligencia generativa.

El modelo Mythos de Anthropic vulnera sistemas clasificados de EE. UU. en horas

La arquitectura de Mythos y la lógica de la vulnerabilidad

El Proyecto Glasswing y la ética del equipo rojo (red teaming)

Latigazo regulatorio y la prohibición de acceso extranjero

¿Es contraproducente la prohibición de ciberseguridad?

Noah Brooks

Readers Questions Answered

Have a question about this article?

Comments