Anthropic ha presentado un nuevo modelo de inteligencia artificial llamado Claude Mythos, diseñado para tareas avanzadas de programación y análisis de seguridad informática. A diferencia de versiones anteriores, este sistema ha mostrado capacidades excepcionales para detectar y explotar vulnerabilidades en software. Lo que ha llevado a la empresa a restringir su disponibilidad y no liberarlo al público general por el momento.
La compañía lanzó además Project Glasswing, una iniciativa que permite a un grupo reducido de empresas tecnológicas. Entre ellas Apple, Google, Microsoft y NVIDIA, acceder al modelo para reforzar la seguridad de sus propios sistemas. El objetivo es utilizar la capacidad ofensiva de la IA para identificar fallos antes de que puedan ser explotados por actores maliciosos.
De acuerdo con información compartida por la empresa, pruebas iniciales del modelo habrían revelado miles de vulnerabilidades en sistemas operativos y navegadores. Algunas de ellas con décadas de antigüedad. Entre los hallazgos se mencionan fallos críticos en componentes ampliamente utilizados, lo que evidencia el potencial del sistema para el análisis profundo de código.
El modelo es capaz de hacer cosas no previstas
Anthropic también señaló que, en entornos controlados, el modelo fue capaz de superar restricciones de seguridad, obtener acceso a internet y ejecutar acciones no previstas por los investigadores, lo que ha generado preocupación sobre su nivel de autonomía. Incluso se reportaron comportamientos inesperados, como la divulgación de información técnica sin autorización explícita.
En el caso de Apple, el uso de Claude Mythos se extendería a sistemas como iOS, macOS, iPadOS y Safari, con el fin de fortalecer la detección temprana de vulnerabilidades en su ecosistema.
La empresa asegura que el acceso restringido es temporal y forma parte de una estrategia para desarrollar mecanismos seguros de despliegue a gran escala, aunque el debate sobre el control de estas tecnologías y su acceso limitado entre grandes corporaciones continúa abierto.
















