Anthropic está ampliando el acceso a su modelo de inteligencia artificial Claude Mythos a través del Proyecto Glasswing, una iniciativa diseñada para que empresas tecnológicas, firmas de seguridad y gobiernos puedan descubrir y corregir errores antes del lanzamiento público del modelo.
Según anunció la compañía este martes, aproximadamente 150 nuevas organizaciones se sumarán al programa controlado mientras Anthropic prepara el despliegue del controvertido modelo. La ampliación llega después de que la empresa indicara que espera ofrecer modelos de la clase Mythos a sus clientes «en las próximas semanas», una vez complete las medidas de seguridad adicionales.
La noticia coincide con la presentación confidencial por parte de Anthropic de su solicitud de oferta pública de venta (OPV) ante la Comisión del Mercado de Valores de Estados Unidos el lunes pasado.
«Tras varias semanas de estrecha colaboración con nuestros socios del Proyecto Glasswing, la industria de la seguridad, mantenedores de software de código abierto y el gobierno estadounidense, estamos extendiendo la asociación a aproximadamente 150 nuevas organizaciones. Cada una deberá cumplir nuestros requisitos de seguridad antes de obtener acceso»
Sectores críticos incluidos en la expansión
Las nuevas organizaciones que se incorporan al Proyecto Glasswing pertenecen a sectores de infraestructura crítica, incluyendo energía, agua, sanidad, comunicaciones y hardware. Anthropic señala que muchas de estas entidades mantienen software utilizado por gobiernos y cientos de millones de personas.
«Lo que tienen en común todos los socios es que un ataque exitoso a su código base podría resultar catastrófico. Para la mayoría de los socios, estimamos que un ataque importante podría afectar a más de 100 millones de personas, con ramificaciones importantes tanto para la seguridad global como nacional», explica la compañía.
Capacidades y preocupaciones de seguridad
Claude Mythos salió a la luz pública en marzo tras la filtración online de materiales internos de Anthropic. Según la firma, las organizaciones que previamente recibieron acceso han utilizado Mythos Preview para identificar más de 10.000 vulnerabilidades de software de gravedad alta o crítica.
Los socios también emplean el modelo para escribir parches de seguridad, realizar revisiones de seguridad y probar software antes de su lanzamiento. Sin embargo, las capacidades del modelo han generado inquietud entre investigadores y agencias gubernamentales.
El Instituto de Seguridad de IA del Reino Unido informó que Mythos completó de forma autónoma un ataque simulado de 32 pasos en una red corporativa durante las pruebas. Por su parte, Mozilla afirmó que el modelo identificó 271 vulnerabilidades que corrigió en el navegador Firefox, mientras que la startup de seguridad Calif aseguró que una versión preliminar ayudó a investigadores a desarrollar una cadena de exploits dirigida a los chips M5 de Apple.
La carrera entre defensores y atacantes
Anthropic justifica la ampliación del acceso a Mythos argumentando que los defensores necesitan herramientas de IA cada vez más capaces antes de que los atacantes obtengan capacidades similares. La compañía estima que otros desarrolladores lanzarán modelos de la clase Mythos en un plazo de seis a doce meses, potencialmente sin garantías comparables.
«En el futuro, los lanzamientos de modelos frontera tendrán cada vez mayor trascendencia. Las capacidades seguirán mejorando en todos los dominios, incluidos muchos que —como la ciberseguridad— pueden potenciar tanto a atacantes como a defensores. Si tenemos éxito, esperamos permitir una ventaja permanente para los defensores», concluye Anthropic.
La ampliación del acceso privado coincide con un descenso en la confianza de los usuarios de Myriad —plataforma de mercados de predicción operada por la empresa matriz de Decrypt— sobre el lanzamiento público de Claude Mythos antes de finales de junio, situando la probabilidad en apenas un 26,5%.
Fuente: Decrypt · Esta información ha sido elaborada por la redacción de Criptonews con apoyo de herramientas editoriales automatizadas.