La IA entra en la era de los agentes: GPT-5.5 y Claude Mythos redefinen la automatización empresarial

Anthropic
AI Enters the Agentic Era: GPT-5.5 and Claude Mythos Redefine Enterprise Automation
OpenAI y Anthropic han lanzado modelos de nueva generación diseñados para completar tareas de forma autónoma, lo que ha llevado al Reino Unido a explorar Claude Mythos para infraestructuras críticas de banca y ciberseguridad.

Mientras que OpenAI se ha centrado en escalar el razonamiento de propósito general y la eficiencia de su modelo insignia, Anthropic ha avanzado hacia una aplicación altamente especializada y de alto riesgo: la ciberseguridad. Las implicaciones de este doble lanzamiento ya están resonando en los mercados globales. En el Reino Unido, funcionarios gubernamentales e instituciones financieras se están moviendo para integrar Mythos de Anthropic en la infraestructura bancaria de la nación, incluso cuando los reguladores de la Unión Europea se mantienen cautelosos, bloqueando efectivamente el nuevo modelo fuera de sus fronteras por el momento. Esta divergencia pone de relieve una creciente tensión entre el impulso hacia la eficiencia automatizada y los riesgos inherentes de un sistema capaz de reescribir las reglas de la ciberdefensa.

La evolución técnica de GPT-5.5

El lanzamiento de GPT-5.5 por parte de OpenAI representa un logro de ingeniería significativo al equilibrar la inteligencia pura con la latencia operativa. Históricamente, a medida que los modelos se vuelven más "inteligentes" —lo que generalmente se mide por la densidad de sus parámetros y la complejidad de sus cadenas de razonamiento—, tienden a volverse más lentos y costosos de ejecutar. OpenAI afirma haber roto esta tendencia. GPT-5.5 iguala la latencia por token de su predecesor, GPT-5.4, a la vez que ofrece lo que la compañía describe como un "salto" en el razonamiento a través del contexto.

Desde una perspectiva de ingeniería mecánica y de sistemas, la actualización más crítica en GPT-5.5 es su mayor eficiencia en las tareas de Codex. OpenAI informa que el modelo utiliza significativamente menos tokens para completar las mismas tareas de programación y depuración que las versiones anteriores. Para los usuarios empresariales, esto se traduce directamente en menores costos operativos y un mayor rendimiento para el desarrollo de software automatizado. El modelo es ahora capaz de lo que OpenAI llama "codificación agéntica" (agentic coding), donde la IA no solo sugiere un fragmento de código, sino que planifica una arquitectura de múltiples archivos, ejecuta pruebas e itera sobre el resultado hasta alcanzar un objetivo funcional.

Esta capacidad de "tareas complejas y multifacéticas" es la piedra angular de GPT-5.5. En lugar de requerir que un humano gestione cada subpaso de un proyecto, al modelo ahora se le puede asignar un objetivo de alto nivel —como "analizar este conjunto de datos, crear una hoja de cálculo resumen y actualizar nuestra base de datos interna"— y navegará a través de las herramientas de software necesarias de forma autónoma. Este paso de ser una herramienta pasiva a un participante activo en el flujo de trabajo digital marca un punto de inflexión para la automatización industrial, donde el cuello de botella se desplaza de la capacidad de la IA para generar contenido a la capacidad del humano para supervisar sus acciones autónomas.

Claude Mythos y la nueva matemática de la ciberdefensa

Mientras que OpenAI escala la utilidad general, Claude Mythos de Anthropic (a menudo referido como Mythos Preview) se posiciona como un arma especializada en el ámbito de la ciberseguridad. Anthropic describe a Mythos como su modelo más capaz para tareas de codificación y agénticas, pero enfatiza que esta fortaleza es un arma de doble filo. Un modelo que comprende el software lo suficientemente profundo como para reparar una vulnerabilidad es, por definición, un modelo que puede encontrar y explotar esa misma vulnerabilidad con una velocidad sin precedentes.

La comunidad técnica ha señalado que Mythos parece haber "abierto el software como un huevo". En pruebas controladas, el modelo ha demostrado una aterradora competencia para identificar fallas profundas en el código informático que han eludido las herramientas tradicionales de análisis estático. Esta capacidad se está aprovechando a través de "Project Glasswing", una iniciativa de ciberseguridad especializada que incluye a pesos pesados como CrowdStrike, Palo Alto Networks y Microsoft. El objetivo de Glasswing es utilizar Mythos para realizar proactivamente pruebas de "red-teaming" en software empresarial, buscando esencialmente los agujeros antes de que lo hagan los actores malintencionados.

Sin embargo, el enorme poder de Mythos ha llevado a un despliegue restringido. A diferencia de GPT-5.5, que se está implementando para una base de usuarios amplia, el acceso a Mythos está estrictamente controlado. Esto ha creado un punto de fricción geopolítica; aunque se informa que la Agencia de Seguridad Nacional (NSA) de EE. UU. está utilizando Mythos a pesar de algunas preocupaciones internas del Pentágono sobre los riesgos de la cadena de suministro, la Unión Europea ha quedado excluida del lanzamiento inicial del modelo. La decisión de Anthropic de dejar fuera a la UE sugiere que las capacidades del modelo pueden chocar con los estrictos requisitos de seguridad y transparencia de la Ley de IA de la UE, o quizás que la compañía está priorizando asociaciones estratégicas con naciones como el Reino Unido y EE. UU. que están dispuestas a integrar estas herramientas en su infraestructura central más rápidamente.

El giro estratégico del sector bancario del Reino Unido

En el Reino Unido, el gobierno no está esperando a que las aguas se calmen en torno a la regulación de la IA. Los informes indican que el Reino Unido se encuentra en negociaciones activas con Anthropic para proporcionar a las empresas y bancos británicos acceso a Mythos. Este movimiento es visto como una apuesta para asegurar el estatus de Londres como centro financiero global mediante el aprovechamiento de la IA defensiva más avanzada disponible. De tener éxito, los bancos británicos podrían estar entre los primeros en utilizar agentes autónomos para monitorear transacciones, asegurar tuberías de datos y parchear automáticamente vulnerabilidades en tiempo real.

Líderes financieros, incluidos los de JPMorgan Chase, ya están evaluando los riesgos potenciales. La integración de un sistema tan poderoso como Mythos en una pila bancaria requiere un replanteamiento completo de los protocolos de seguridad tradicionales. Cuando una IA puede "operar software y moverse entre herramientas hasta que se termina una tarea", debe otorgársele un nivel de acceso al sistema que anteriormente estaba reservado para ingenieros humanos de alta confianza. El debate dentro del Tesoro y los reguladores del Reino Unido se centra en si las ganancias de eficiencia de esta automatización superan el riesgo de una falla a nivel de sistema o un "jailbreak" que podría permitir que el modelo sea utilizado indebidamente.

¿Se puede controlar de forma segura un sistema tan potente?

La cuestión de la seguridad se cierne sobre GPT-5.5 y Claude Mythos. El renombrado experto en seguridad Bruce Schneier ha señalado que el poder de estos sistemas tiene implicaciones aterradoras para el futuro de la piratería informática. Si una IA puede encontrar vulnerabilidades en segundos que a un equipo humano le llevaría semanas descubrir, las "matemáticas" de la ciberdefensa cambian. La defensa ahora debe ser igualmente rápida y autónoma. Esto crea una "carrera armamentista de IA" donde la única forma de protegerse contra un atacante automatizado es emplear un defensor automatizado.

Desde una perspectiva de ingeniería, la seguridad de estos sistemas depende de la robustez de sus "modelos del mundo" internos y de las restricciones impuestas a su comportamiento agéntico. OpenAI enfatiza que GPT-5.5 está diseñado para "navegar a través de la ambigüedad y seguir adelante", lo cual es un gran paso adelante para la usabilidad pero una pesadilla para la previsibilidad. Si una IA agéntica se encuentra con una situación que sus entrenadores no anticiparon, su "planificación" autónoma podría llevar a consecuencias no deseadas en un entorno de producción en vivo. El desafío técnico de la próxima década no será hacer que estos modelos sean más inteligentes, sino hacer que sus acciones autónomas sean verificables y reversibles.

La viabilidad económica de los modelos agénticos

Para la alta dirección y las partes interesadas industriales, el lanzamiento de GPT-5.5 y la posible llegada de Mythos al Reino Unido representan un cambio en el retorno de la inversión (ROI) de las inversiones en IA. Los primeros modelos de lenguaje (LLM) a menudo se consideraban impulsores experimentales de productividad, útiles para redactar correos electrónicos o generar textos de marketing. Los modelos agénticos cambian la ecuación al apuntar a los costos operativos básicos. Cuando una IA puede manejar "trabajo de conocimiento e investigación científica temprana" razonando a través del contexto y actuando con el tiempo, comienza a reemplazar niveles enteros de gestión intermedia y coordinación técnica.

La reducción en el uso de tokens para las tareas de Codex en GPT-5.5 es un ejemplo principal de este cambio económico. En un entorno industrial a gran escala, donde una IA podría estar gestionando millones de líneas de código en miles de repositorios, un aumento del 20% o 30% en la eficiencia de tokens puede traducirse en millones de dólares en costos de computación ahorrados. Más importante aún, la velocidad de iteración —la "latencia" que OpenAI trabajó tan duro para mantener— determina qué tan rápido puede responder una empresa a los cambios del mercado o a las fallas técnicas. En el mundo del comercio de alta frecuencia o la gestión automatizada de la cadena de suministro, los milisegundos son la diferencia entre el beneficio y la pérdida.

En última instancia, el lanzamiento paralelo de estos dos modelos sugiere que hemos dejado atrás la era de la IA como una novedad. GPT-5.5 de OpenAI es el nuevo caballo de batalla de la empresa digital, optimizado para la finalización de tareas de forma amplia, eficiente y autónoma. Mythos de Anthropic es el instrumento de alta precisión, un modelo diseñado para los rincones más críticos y peligrosos de Internet. A medida que el Reino Unido avanza para adoptar estas herramientas, el resto del mundo observará de cerca para ver si la promesa de la era agéntica puede realizarse sin comprometer la seguridad de las instituciones que busca modernizar.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q ¿Cuáles son las principales mejoras técnicas introducidas en GPT-5.5 de OpenAI?
A GPT-5.5 introduce un concepto conocido como codificación agéntica, que permite al modelo planificar de forma autónoma arquitecturas de archivos múltiples y ejecutar pruebas en lugar de limitarse a sugerir fragmentos de código. Sorprendentemente, OpenAI ha mantenido la latencia por token de versiones anteriores mientras mejora las capacidades de razonamiento. Esta eficiencia reduce los costes operativos para los usuarios empresariales al requerir menos tokens para completar tareas complejas de programación y depuración, desplazando el enfoque de la generación de contenido a la ejecución autónoma de proyectos.
Q ¿Cómo se está utilizando Claude Mythos en el campo de la ciberseguridad?
A Claude Mythos está diseñado para aplicaciones de ciberseguridad de alto riesgo, específicamente a través de una iniciativa de colaboración llamada Project Glasswing. Este proyecto involucra a líderes de la industria como CrowdStrike y Microsoft utilizando el modelo para realizar pruebas de penetración (red-teaming) proactivas en software empresarial. Mythos destaca en la identificación de vulnerabilidades profundas que las herramientas de análisis estático tradicionales suelen pasar por alto. Debido a que puede reparar y potencialmente explotar fallos con gran velocidad, su lanzamiento sigue estando estrictamente controlado para evitar su uso indebido en actividades maliciosas.
Q ¿Por qué se ha excluido a la Unión Europea del lanzamiento inicial de Claude Mythos?
A Anthropic ha excluido a la Unión Europea del lanzamiento inicial de Claude Mythos, probablemente porque las capacidades autónomas avanzadas del modelo entran en conflicto con los estrictos mandatos de seguridad y transparencia de la Ley de Inteligencia Artificial de la UE. En su lugar, la empresa está priorizando despliegues estratégicos en Estados Unidos y el Reino Unido. Esta divergencia refleja una creciente tensión entre la cautela regulatoria europea y el impulso hacia una rápida integración de la infraestructura que se observa en otros mercados globales.
Q ¿Cuál es el objetivo estratégico de integrar Claude Mythos en el sector bancario del Reino Unido?
A El Reino Unido está negociando el acceso a Claude Mythos para asegurar la posición de Londres como un centro financiero global de primer nivel. Al integrar esta IA autónoma, los bancos británicos pretenden utilizar agentes para el monitoreo de transacciones en tiempo real, la seguridad de los flujos de datos y la corrección automática de vulnerabilidades. Esta transición requiere otorgar a la IA un acceso al sistema sin precedentes, lo que ha provocado un intenso debate entre los reguladores del Tesoro del Reino Unido sobre el equilibrio entre la eficiencia operativa y el riesgo de fallos catastróficos en el sistema.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!