Anthropic anuncia Claude Mythos Preview: el modelo de IA “demasiado peligroso” para lanzarlo al público
Anthropic reveló el 7 de abril su modelo de inteligencia artificial más avanzado hasta la fecha, Claude Mythos Preview, un frontier model con capacidades excepcionales en ciberseguridad que ha decidido no lanzar de forma general. En su lugar, lo está utilizando en una iniciativa defensiva llamada Project Glasswing junto a las principales empresas tecnológicas del mundo.
Según la compañía, Mythos Preview representa un “salto cualitativo” (step change) en razonamiento, codificación y tareas agenticas. Su mayor fortaleza —y el motivo de la restricción— radica en su habilidad para identificar y explotar de forma autónoma vulnerabilidades zero-day en todos los sistemas operativos y navegadores principales.
Durante pruebas internas realizadas en las últimas semanas, el modelo descubrió miles de vulnerabilidades de alta severidad desconocidas previamente, incluyendo bugs que habían permanecido ocultos durante décadas. Entre los ejemplos destacados:
- Una vulnerabilidad de 27 años en OpenBSD que permitía crashes remotos.
- Un bug de 16 años en FFmpeg que pasó desapercibido tras cinco millones de pruebas automatizadas.
- Cadenas de explotación en el kernel de Linux y fallos en navegadores como Firefox y Chrome.
Ingenieros sin entrenamiento formal en seguridad solicitaron al modelo buscar vulnerabilidades de ejecución remota durante la noche y, al día siguiente, recibieron exploits completos y funcionales. En evaluaciones como Cybench, Mythos Preview logró tasas de éxito del 100% en desafíos de ciberseguridad, superando ampliamente a su predecesor, Claude Opus 4.6.
Project Glasswing: IA al servicio de la defensa
Ante el potencial ofensivo del modelo, Anthropic optó por no hacerlo disponible al público general. En cambio, lanzó Project Glasswing, una coalición que reúne a más de 50 organizaciones, entre ellas:
- Amazon Web Services, Apple, Google, Microsoft, NVIDIA, Cisco, Broadcom, CrowdStrike, Palo Alto Networks y JPMorgan Chase.
- La Linux Foundation y otros mantenedores de software open-source.
Estas entidades recibirán acceso controlado a Claude Mythos Preview para escanear sus sistemas críticos, identificar vulnerabilidades y corregirlas antes de que puedan ser explotadas. Anthropic respalda la iniciativa con créditos de uso por hasta 100 millones de dólares y donaciones directas a proyectos de seguridad open-source.
“Los modelos de IA han alcanzado un nivel de capacidad de codificación en el que pueden superar a todos, excepto a los humanos más calificados, en la detección y explotación de vulnerabilidades de software”, señaló Anthropic en su anuncio oficial.
La compañía publicó una extensa System Card de más de 200 páginas con evaluaciones detalladas de capacidades, riesgos de alineación y pruebas de seguridad, donde reconoce que Mythos Preview es su modelo “mejor alineado” hasta ahora, aunque también el que presenta mayores desafíos.
Una advertencia para la industria
La decisión de Anthropic ha generado debate en la comunidad tecnológica. Algunos lo ven como un acto responsable de “IA segura”, priorizando la defensa frente a posibles abusos por parte de ciberdelincuentes o actores estatales. Otros lo interpretan como una estrategia para posicionarse como líder ético en la carrera de la inteligencia artificial.
Lo cierto es que Claude Mythos Preview marca un punto de inflexión: las IA frontier ya son capaces de automatizar tareas de ciberseguridad que antes requerían expertos humanos durante semanas o meses. Esto acelera tanto la detección de fallos como la creación de exploits, obligando a la industria a repensar cómo proteger la infraestructura crítica del mundo digital.
Por ahora, Mythos Preview solo está disponible para los socios invitados de Project Glasswing a través de plataformas como Claude API, Amazon Bedrock, Google Vertex AI y Microsoft Foundry. Anthropic asegura que continuará mejorando sus salvaguardas y monitoreo para futuros modelos.
¿El futuro de la ciberseguridad impulsada por IA?
Este anuncio refuerza la idea de que la era de la ciberseguridad automatizada ya está aquí. La pregunta que queda abierta es si los defensores podrán mantener la ventaja frente a posibles usos ofensivos de tecnologías similares que podrían filtrarse o ser replicadas por otros actores.
Anthropic invita a más organizaciones a sumarse a Project Glasswing para fortalecer colectivamente la seguridad del software que sustenta la sociedad actual.