Anthropic, empresa líder en inteligencia artificial, ha revelado que su modelo más reciente, Claude Mythos Preview, posee una capacidad alarmante para identificar y explotar vulnerabilidades de seguridad profundamente arraigadas en sistemas de software críticos. Ante este descubrimiento, la compañía ha decidido no lanzar el modelo al público general, optando en su lugar por un enfoque defensivo de ciberseguridad denominado Proyecto Glasswing. Este proyecto otorga acceso a Mythos junto con 100 millones de dólares en créditos de uso a más de 50 organizaciones de gran envergadura, incluyendo a Amazon, Apple, Microsoft, Google y JPMorgan Chase.
La decisión de Anthropic se produce en un contexto donde incluso los modelos de IA disponibles públicamente ya han demostrado ser capaces de encontrar fallos de seguridad en software de uso común. Los investigadores de la empresa estiman que otros laboratorios se encuentran entre seis y 18 meses de alcanzar un nivel de capacidad comparable al de Mythos. Esta proliferación de capacidades, y las amenazas inherentes a la ciberseguridad que conllevan, podrían tener consecuencias devastadoras, afectando desde plataformas de streaming hasta servicios bancarios en línea y motores de búsqueda.
La facilidad con la que se está democratizando la creación de software, gracias a herramientas de IA que permiten convertir descripciones en lenguaje natural en código funcional el llamado vibe coding , presenta un nuevo desafío. Propietarios de pequeñas empresas, médicos y directores de organizaciones sin fines de lucro están creando software sin la formación adecuada, y estas aplicaciones, a menudo carentes de revisiones de seguridad, son susceptibles a ataques. La mejora continua de la IA facilita la identificación de estos fallos, abriendo la puerta a accesos no autorizados a datos de clientes, apropiación de cuentas e incluso la paralización completa de aplicaciones.
Durante décadas, la seguridad de internet se ha basado en dos factores limitantes: la dificultad de escribir software de calidad y la complejidad de encontrar errores. Esta combinación, aunque imperfecta, generó una especie de equilibrio. Sin embargo, la llegada de las herramientas de IA ha roto este equilibrio, permitiendo a cualquiera crear código y, potencialmente, a actores maliciosos explotar sus vulnerabilidades.
Gran parte de la infraestructura de internet se basa en software de código abierto, como FFmpeg, un programa gratuito utilizado para la transmisión de video, mantenido por voluntarios con recursos limitados. Incluso sistemas operativos altamente seguros como OpenBSD, que protegen redes sensibles, dependen de donaciones. A diferencia del software propietario desarrollado por las grandes empresas del Proyecto Glasswing, estos proyectos se mantienen gracias al compromiso de individuos que priorizan el valor del trabajo sobre la remuneración económica.
Anthropic ha demostrado la potencia de Mythos al identificar vulnerabilidades de 27 años en OpenBSD y de 16 años en FFmpeg, fallos que habían pasado desapercibidos para otras herramientas de seguridad automatizadas. Incluso Firefox, el navegador web, fue objeto de pruebas exitosas, donde Mythos logró convertir un fallo conocido en una amenaza funcional en casi todos los intentos, a diferencia de resultados previos que solo lo lograban en una pequeña fracción de los casos.
Estos hallazgos revelan la magnitud del problema: miles de vulnerabilidades en el código que podrían permitir ataques de ransomware, interrupciones de infraestructuras críticas y compromisos de redes gubernamentales. Mythos no solo detecta fallos en el código, sino que también expone las debilidades del contrato social informal que sustenta internet, donde los desarrolladores comparten su trabajo, se ayudan mutuamente y mantienen el software del que todos dependemos.
El programador veterano que dedica su tiempo libre a corregir código crítico se encuentra en la misma situación que la propietaria de una tienda que ha creado su primera aplicación con IA. Ambos son vulnerables, carecen de equipos de seguridad y, actualmente, no tienen acceso a Mythos.
Anthropic ha tomado la iniciativa de frenar la propagación de esta tecnología, destinando 4 millones de dólares a organizaciones de seguridad de código abierto, una inversión mayor que la realizada por cualquier otra empresa del sector. Sin embargo, la economía subyacente no ha cambiado: la infraestructura de software más valiosa sigue siendo mantenida por personas que trabajan de forma gratuita, mientras que las empresas que se benefician de ella no contribuyen a su mantenimiento.
Existe el riesgo de que las organizaciones con recursos accedan primero a estas herramientas y aprendan a protegerse, dejando a otros vulnerables. El programador que ha dedicado 20 años a mantener un código utilizado por miles de millones de personas aún no tiene acceso a Mythos. ¿Debería tenerlo? Las organizaciones que gestionan la infraestructura de código abierto conocen a estos mantenedores y pueden facilitarles el acceso.
La propietaria de la tienda, por su parte, no debería necesitar una herramienta tan potente como Mythos para protegerse, sino la confianza de que las herramientas que utiliza se han creado con la seguridad como prioridad.
Es imperativo cambiar el enfoque predeterminado. Todas las empresas que utilizan código abierto en sus productos la gran mayoría de la industria tecnológica deben invertir en los trabajadores que lo mantienen. Esto implica financiación, pero también la aportación de tiempo de ingeniería, experiencia en seguridad y personal a los proyectos de los que todos dependemos.
Las empresas de IA que desarrollan herramientas como Mythos deben ponerlas a disposición de estos trabajadores. Y todos los que nos beneficiamos de la infraestructura de código abierto debemos tratarla como un activo crítico, comparable a cualquier carretera, puente o línea eléctrica.
Para los millones de nuevos creadores de software, debemos facilitarles la construcción segura, integrando la seguridad en las herramientas que ya utilizan y asegurándonos de que la IA que escribe el código también lo protege de forma predeterminada.
La distensión ha terminado, los fallos son visibles y los creadores están por todas partes. La pregunta clave es si protegeremos a todos, o solo a aquellos que pueden permitírselo.









