¿Qué tan peligroso es Mythos? ¿Por qué Anthropic ha decidido no lanzar el nuevo modelo?
Título del artículo original: Cómo Anthropic aprendió que Mythos era demasiado peligroso para el mundo real
Autores del artículo original: Margi Murphy, Jake Bleiberg y Patrick Howell O'Neill, Bloomberg
Traducción: Peggy, BlockBeats
Nota del editor: Cuando una empresa de IA decide no lanzar su modelo más potente directamente al público, eso en sí mismo significa un problema.
Mythos de Anthropic ya era capaz de llevar a cabo de forma independiente todo un proceso de ataque. Desde descubrir vulnerabilidades de día cero, escribir código de explotación hasta enlazar caminos de varios pasos para penetrar en sistemas centrales, estas tareas, que originalmente requerían que los mejores hackers colaboraran durante mucho tiempo, se han comprimido a horas o incluso minutos.
Por eso, en el momento en que se dio a conocer el modelo, Scott Bessent y Jerome Powell convocaron una reunión con instituciones de Wall Street, solicitando que lo usaran para una "autoinspección". Cuando la capacidad de descubrimiento de vulnerabilidades se libera a gran escala, el sistema financiero ya no enfrenta ataques aislados, sino un escaneo continuo.
Un cambio más profundo radica en la estructura de suministro. En el pasado, el descubrimiento de vulnerabilidades dependía de unos pocos equipos de seguridad y de la experiencia de los hackers, con un ritmo lento e irrepetible. Ahora, esta capacidad está comenzando a ser producida en masa por modelos, lo que reduce el umbral tanto para los ataques como para las defensas. Una metáfora de un experto es bastante directa: entregar el modelo a un hacker común es equiparlo con capacidades de operaciones especiales.
Las instituciones han comenzado a utilizar las mismas herramientas para verificar sus propios sistemas de manera retrospectiva. JPMorgan Chase, Cisco Systems y otros están realizando pruebas internas, con la esperanza de corregir las vulnerabilidades antes de que sean explotadas. Sin embargo, las limitaciones de la realidad no han cambiado; la velocidad del descubrimiento está aumentando mientras que el proceso de reparación sigue siendo lento. “Somos buenos para encontrar vulnerabilidades, pero no para corregirlas”, señaló Jim Zemlin, destacando la discrepancia temporal.
De hecho, dado que Mythos no es solo una mejora en una sola capacidad, sino más bien una integración, aceleración y reducción del umbral de usabilidad de capacidades de ataque previamente dispersas y restringidas, una vez fuera del entorno controlado, se desconoce cómo se propagará esta capacidad, sin experiencia previa a la que hacer referencia.
El peligro no radica en lo que puede hacer, sino en quién puede usarlo y bajo qué condiciones.
El artículo original es el siguiente:
En una cálida tarde de febrero, durante un descanso en una boda en Bali, Nicholas Carlini se alejó brevemente, abrió su computadora portátil y se preparó para "causar algo de caos". En ese momento, Anthropic acababa de lanzar un nuevo modelo de inteligencia artificial llamado Mythos para pruebas internas, y este renombrado investigador de IA estaba a punto de ver cuántos problemas podría realmente causar.
Anthropic ha contratado a Carlini para trabajar en la prueba de estrés de sus modelos de IA para evaluar si los hackers podrían explotarlos potencialmente para espionaje, robo o destrucción. Mientras asistía a una boda india en Bali, Carlini se sorprendió por las capacidades de este modelo.
En solo unas horas, encontró varias técnicas que podrían utilizarse para penetrar en sistemas utilizados globalmente. Al regresar a la oficina de Anthropic en el centro de San Francisco, descubrió además que Mythos ya era capaz de generar de manera autónoma herramientas de intrusión poderosas, incluidas tácticas dirigidas a Linux, la columna vertebral de la mayoría de los sistemas informáticos modernos.
Mythos organizó un "atraco bancario digital": podía eludir los protocolos de seguridad, entrar en el sistema de red por la puerta principal y luego irrumpir en la bóveda digital para obtener sus activos en línea. En el pasado, la IA solo podía "abrir cerraduras", pero ahora tiene la capacidad de planificar y ejecutar un "robo" completo.
Carlini y algunos colegas comenzaron a sonar la alarma dentro de la empresa, informando sobre sus hallazgos. Mientras tanto, casi todos los días, descubrían vulnerabilidades de alto riesgo a potencialmente fatales en los sistemas que Mythos sondeaba, problemas que generalmente solo los mejores hackers del mundo serían capaces de descubrir.

Se ha demostrado que el modelo de IA de próxima generación de Anthropic, Mythos, tiene la capacidad de penetrar en varios sistemas globales. (Fuente de la imagen: Jakub Porzycki / NurPhoto / AP)
Simultáneamente, internamente en Anthropic, un equipo llamado el "Equipo Rojo Fronterizo", compuesto por 15 empleados conocidos como "Hormigas", también estaba realizando pruebas similares. La responsabilidad de este equipo era asegurarse de que los modelos de la empresa no se utilizaran para dañar a la humanidad. Introducirían perros robóticos en los almacenes y probarían con ingenieros para ver si los chatbots podrían usarse para controlar maliciosamente estos dispositivos; también colaborarían con biólogos para evaluar si los modelos podrían usarse para crear armas biológicas.
Sin embargo, esta vez, gradualmente se dieron cuenta de que el mayor riesgo que representaba Mythos provenía del campo de la ciberseguridad. "En las primeras horas de tener el modelo, supimos que era diferente", dijo Logan Graham, quien está a cargo del equipo.
El modelo anterior, Opus 4.6, había demostrado la capacidad de ayudar a los humanos a explotar vulnerabilidades de software. Pero Graham señaló que Mythos ahora podía "ponerse las manos sucias" y explotar estas vulnerabilidades por sí mismo. Esto representaba un riesgo a nivel de seguridad nacional, y basándose en esto, emitió una advertencia a la dirección de la empresa. Esto lo obligó a enfrentar un dilema: explicar a la dirección que el próximo motor de ingresos significativo de la empresa podría no ser lanzado al público debido a que es demasiado peligroso.
El cofundador y científico jefe de Anthropic, Jared Kaplan, declaró que, durante el proceso de capacitación de Mythos, había estado "muy de cerca" monitoreando su progreso. Para enero, comenzó a darse cuenta de que la capacidad del modelo para descubrir vulnerabilidades del sistema era excepcionalmente fuerte. Como físico teórico, Kaplan necesitaba determinar si estas capacidades eran simplemente un "fenómeno técnicamente interesante" o "una realidad estrechamente vinculada a la infraestructura de Internet". Al final, concluyó que era lo segundo.

Jared Kaplan (cofundador y científico jefe de Anthropic) Fuente de la imagen: Chris J. Ratcliffe/Bloomberg
Durante un período de dos semanas, desde finales de febrero hasta principios de marzo, Kaplan y el cofundador Sam McCandlish deliberaron sobre si debían lanzar este modelo.
En la primera semana de marzo, el equipo directivo de la empresa, incluido el director ejecutivo Dario Amodei, la presidenta Daniela Amodei, el director de seguridad de la información Vitaly Gudanets y otros, celebró una reunión para escuchar la exposición de Kaplan y McCandlish.
Su conclusión fue que Mythos tenía un riesgo demasiado alto y no era adecuado para un lanzamiento público completo. Sin embargo, Anthropic debería permitir que algunas empresas, incluidos los competidores, lo prueben.
<p"we quickly realized that this time a considerably different approach needed to be taken; would not routine product launch," kaplan>Para la primera semana de marzo, la empresa finalmente llegó a un consenso: aprobar Mythos para su implementación como una herramienta de defensa de la ciberseguridad.

Dario Amodei (CEO de Anthropic) Fuente de la imagen: Samyukta Lakshmi/Bloomberg
La reacción del mercado fue casi instantánea. El día en que Anthropic dio a conocer la existencia de Mythos, EE. El Secretario del Tesoro, Scott Bessent, y el presidente de la Reserva Federal, Jerome Powell, convocaron una reunión de emergencia de las principales instituciones de Wall Street en Washington, D.C. El mensaje fue muy claro: utilicen inmediatamente Mythos para identificar vulnerabilidades en sus sistemas.
Según una fuente cercana a los ejecutivos que asistieron a la reunión (que pidió el anonimato debido a la naturaleza privada de las discusiones), la seriedad de la reunión fue evidente: los participantes incluso se negaron a revelar el contenido de la reunión a algunos asesores clave.
Funcionarios de la Casa Blanca emitieron una advertencia urgente sobre Mythos como una posible herramienta de piratería y su recomendación de "utilizarla para la defensa", señalando un cambio más profundo: la inteligencia artificial se está convirtiendo rápidamente en una fuerza decisiva en el campo de la ciberseguridad. Anthropic ha abierto selectivamente Mythos para su uso limitado por parte de algunas instituciones en la iniciativa "Proyecto Glasswing", incluyendo empresas como Amazon Web Services, Apple y JPMorgan Chase, permitiéndoles realizar pruebas; al mismo tiempo, las agencias gubernamentales también han mostrado un fuerte interés.
Antes de abrirse al público, Anthropic informó exhaustivamente a altos funcionarios del gobierno de EE. UU. sobre las capacidades de la versión de prueba de Mythos, incluidas sus posibles aplicaciones en ataques cibernéticos y defensa. Al mismo tiempo, la empresa mantiene conversaciones en curso con varios gobiernos nacionales. Un empleado de Anthropic, que solicitó el anonimato debido a asuntos internos, reveló esta información.
El competidor OpenAI siguió rápidamente el ejemplo y anunció el martes el lanzamiento de una herramienta para descubrir vulnerabilidades de software: GPT-5.4-Cyber.
Al probar las primeras versiones, los investigadores descubrieron docenas de casos de comportamiento "preocupantes", como no seguir las instrucciones humanas y, en casos muy raros, intentar ocultar sus acciones después de violar las instrucciones.
Actualmente, Anthropic no ha lanzado oficialmente Mythos como una herramienta de ciberseguridad al público, y los investigadores externos aún no han validado completamente sus capacidades. Sin embargo, la decisión anterior de la empresa de "acceso restringido" refleja un creciente consenso en la industria y el gobierno: La IA está remodelando la estructura económica de la ciberseguridad: reduce significativamente el costo del descubrimiento de vulnerabilidades, comprime el tiempo de preparación del ataque y reduce las barreras técnicas para ciertos tipos de ataques.
Anthropic también ha advertido que la mayor autonomía de Mythos plantea riesgos en sí misma. Durante las pruebas, el equipo observó varios casos inquietantes: el modelo desobedeciendo instrucciones e incluso intentando ocultar sus rastros después de una violación. En un incidente, el modelo ideó de manera autónoma una ruta de ataque de múltiples pasos para "escapar" de un entorno restringido, obtener un acceso más amplio a Internet y difundir contenido de manera proactiva.
En el mundo real, el software en el que se basan las aplicaciones, desde las bancarias hasta los sistemas hospitalarios, comúnmente contiene vulnerabilidades de código complejas y oscuras, que a menudo requieren semanas o incluso meses para ser descubiertas por profesionales. Una vez que los hackers explotan estas vulnerabilidades, puede llevar a violaciones de datos o ataques de ransomware, lo que resulta en consecuencias graves.
Sin embargo, muchos pesos pesados también han cuestionado las verdaderas capacidades de Mythos y sus riesgos potenciales. El asesor de IA de la Casa Blanca, David Sacks, declaró en la plataforma social X: Cada vez más personas comienzan a cuestionarse si Anthropic es el 'niño que grita al lobo' en la industria de la IA. Si la amenaza que representa Mythos no se materializa al final, la empresa enfrentará un grave problema de reputación.
Sin embargo, la realidad es que los hackers llevan tiempo utilizando grandes modelos de lenguaje para lanzar ataques sofisticados. Por ejemplo, un grupo de ciberespionaje utilizó el modelo Claude de Anthropic para intentar vulnerar unos 30 objetivos; otros atacantes han utilizado la IA para robar datos de agencias gubernamentales, desplegar ransomware e incluso eludir rápidamente cientos de herramientas de firewall utilizadas para la protección de datos.
Según una fuente familiarizada con el asunto, los funcionarios de seguridad nacional de EE. UU. consideran que la aparición de Mythos trae una incertidumbre sin precedentes: evaluar los riesgos de ciberseguridad se ha vuelto aún más difícil. Si este modelo se entregara a hackers individuales, su efecto podría ser similar al de convertir a un soldado común en un operativo de fuerzas especiales.
Al mismo tiempo, este tipo de modelo también podría convertirse en un "amplificador de capacidades", permitiendo que una organización de hackers criminales posea la capacidad de ataque de un pequeño estado-nación y permitiendo que hackers de inteligencia y militares de algunos países de tamaño pequeño a mediano realicen ciberataques que anteriormente solo las grandes potencias podían lograr.
El ex jefe de ciberseguridad de la NSA, Rob Joyce, declaró: "Creo que, a la larga, la IA nos hará más seguros y resilientes. Sin embargo, entre ahora y algún punto en el futuro, habrá un 'período oscuro' durante el cual la IA ofensiva tendrá una clara ventaja: aquellos que no hayan fortificado adecuadamente sus defensas serán los primeros en caer".
Vale la pena mencionar que Mythos no es el único modelo con tales capacidades. Varias organizaciones ya han estado utilizando modelos de lenguaje grandes para la investigación de vulnerabilidades, incluidas las versiones iniciales de Claude y Big Sleep.

Antes del lanzamiento de Mythos, JPMorgan Chase ya había tenido éxito utilizando modelos de lenguaje grandes para ayudar a descubrir vulnerabilidades en el software bancario. Una persona familiarizada con la situación (que solicitó el anonimato debido a su participación en proyectos de seguridad interna) divulgó esta información. (Fuente de la imagen: Michael Nagle / Bloomberg)
Según la fuente, las "vulnerabilidades de día cero", que antes tardaban días o incluso semanas en identificarse y escribir el código de explotación, ahora se pueden identificar en tan solo una hora, o incluso minutos, utilizando la IA. Una "vulnerabilidad de día cero" se refiere a una falla de seguridad que los defensores aún no han detectado, lo que deja casi ningún tiempo para parchear.
Actualmente, el enfoque de JPMorgan Chase está principalmente en la cadena de suministro y el espacio del software de código abierto, donde han descubierto múltiples vulnerabilidades y proporcionado retroalimentación a los respectivos proveedores.
El director ejecutivo de la empresa, Jamie Dimon, declaró durante una conferencia telefónica de resultados que la aparición de Mythos "indica que todavía hay un gran número de vulnerabilidades que necesitan ser abordadas con urgencia".

Fuente de la imagen de Jamie Dimon: Krisztian Bocsi / Bloomberg
Según una fuente familiarizada con el asunto, JPMorgan Chase ya se había puesto en contacto con Anthropic para discutir la prueba del modelo antes de que la existencia de Mythos fuera conocida públicamente. La fuente, que pidió el anonimato porque no estaba autorizada para hablar públicamente, afirmó que JPMorgan Chase se negó a hacer comentarios al respecto.
Ahora, otros bancos de Wall Street y empresas tecnológicas también están intentando utilizar Mythos para parchear de forma proactiva los defectos del sistema antes de que los hackers descubran vulnerabilidades. Bloomberg informó que instituciones financieras como Goldman Sachs, Citigroup, Bank of America y Morgan Stanley han probado internamente esta tecnología.
Los empleados de Cisco Systems están particularmente atentos a un problema: si los intrusos aprovecharán la IA para encontrar vías de acceso a su software de dispositivos de red desplegados globalmente, estos dispositivos incluyen enrutadores, cortafuegos y módems. Anthony Grieco, director de Seguridad y Confianza de la empresa, expresó preocupaciones específicas de que la IA podría acelerar los ataques de hackers en dispositivos "al final de su vida útil" que ya no recibirán actualizaciones de soporte de Cisco.
Sin embargo, la corrección de vulnerabilidades descubiertas por la IA seguirá siendo un desafío persistente. Este proceso, conocido como "corrección de seguridad", suele ser costoso y lleva mucho tiempo para las organizaciones, lo que lleva a muchas a ignorar las vulnerabilidades. Ataques catastróficos como el sufrido por Equifax, donde se robaron los datos de aproximadamente 147 millones de personas, ocurrieron debido a que las vulnerabilidades conocidas no se abordaron de manera oportuna.

En el incidente de violación de datos de Equifax, los intrusos robaron los registros personales de aproximadamente 147 millones de personas. (Fuente de la imagen: Elijah Nouvelage / Bloomberg)
A pesar de haber sido identificada por la administración Trump como una "amenaza para la cadena de suministro" después de negarse a ayudar en la realización de una vigilancia a gran escala de los ciudadanos estadounidenses, Anthropic actualmente está participando en discusiones y colaboraciones con agencias federales.
Estados Unidos El Departamento del Tesoro está buscando la aprobación para usar Mythos esta semana. El Secretario del Tesoro, Scott Bessent, afirmó que este modelo ayudará a Estados Unidos a mantener su ventaja competitiva en inteligencia artificial.

Fuente de la imagen de Scott Bessent: Matt McClain / Bloomberg
En una prueba, Mythos escribió un código de ataque al navegador que enlazaba cuatro vulnerabilidades diferentes en una cadena de explotación completa, una tarea que es muy difícil incluso para los hackers humanos. Un informe de investigación de ciberseguridad señaló que tal "cadena de vulnerabilidades" a menudo viola los límites originalmente seguros del sistema, de manera similar al enfoque utilizado en el ataque Stuxnet a las centrifugadoras de la instalación nuclear de Irán hace años.
Además, según Anthropic, cuando se le da una instrucción explícita, Mythos puede incluso identificar y explotar "vulnerabilidades de día cero" en todos los navegadores más populares.
Anthropic afirmó que habían utilizado Mythos para descubrir vulnerabilidades en el código de Linux. Jim Zemlin señaló que Linux "impulsa la mayoría de los sistemas informáticos en la actualidad", desde los teléfonos inteligentes Android y los enrutadores de Internet hasta las supercomputadoras de la NASA, y es casi ubicuo. Mythos puede descubrir de manera autónoma fallas en múltiples bases de código de código abierto, y una vez que se explotan estas vulnerabilidades, los atacantes pueden potencialmente tomar el control total de toda la máquina.
Actualmente, docenas de personal de la Fundación Linux han comenzado a probar Mythos. Zemlin cree que una pregunta clave es si el modelo de Anthropic puede proporcionar información valiosa para ayudar a los desarrolladores a escribir software más seguro desde el principio, reduciendo así la creación de vulnerabilidades.
"Somos muy buenos para encontrar vulnerabilidades", dijo, "pero no somos muy buenos para corregirlas".
También te puede interesar

Silicon Valley Entrepreneurship Guru Steve Blank: En la era de la IA, las startups de más de dos años deberían reiniciarse

Estas 25 palabras clave de Claude te ayudarán a ganar 15 horas extra cada semana.

De 'Silicon Valley Sneaker' a 'GPU Hashrate': El absurdo y la lógica del cambio de nombre de Allbirds a NewBird AI

2026 Informe sobre las relaciones con los inversores y la transparencia de los tokens en la industria de las criptomonedas

Informe diario de Bitget UEX | Las negociaciones de alto el fuego entre EE. UU. e Irán avanzan; el S&P 500 supera los 7000 puntos por primera vez; TSMC y Netflix publicarán sus resultados hoy (16 de abril de 2026).

Informe matutino | Kraken se presentó en secreto para una solicitud en EE. UU. Salida a bolsa; eToro adquiere el proveedor de monederos de criptomonedas Zengo; Bitmine anuncia su informe financiero del primer trimestre.

El capital de riesgo en criptomonedas está aumentando su presencia, ¿está el mercado comenzando a tocar fondo y recuperarse?

Social Graph Ventures: Tendencias y oportunidades en la tokenización de acciones

0G Labs lanza una plataforma de desarrollo de IA de grado consumidor basada en infraestructura descentralizada

¿Por qué SpaceX, con una pérdida anual de 5.000 millones de dólares y una valoración de 2 billones de dólares, cautiva tanto a los jugadores cripto?

Las mejores fichas de IA que debes tener en cuenta en 2026: ¿Qué monedas de IA vale la pena acumular desde el principio?
¿Buscas las mejores fichas criptográficas de IA en las que invertir antes del próximo ciclo del mercado? Esta guía explica qué son las monedas de IA, por qué 2026 podría ser una ventana clave de acumulación y qué proyectos de infraestructura, agentes de IA y capas de datos podrían tener un fuerte potencial de crecimiento a largo plazo.

El presidente de la Fed más experto en criptomonedas de la historia: ¿Qué criptomonedas tiene Kevin Warsh?

X Lanza Cashtag, la Super App de Musk Más Concreta

Educativo | ¿Cómo puede una persona promedio identificar rápidamente las estafas de fichas y las estrategias de negociación?

¿Es un rebote de gato muerto o la reactivación del mercado alcista? ¿Cómo lo ven los traders?

¿Por qué puede Bitcoin aumentar en medio de la marea de la turbulencia?<1>

OpenAI y Anthropic, ambas pre-IPO, quieren seguir peleando

