La empresa de inteligencia artificial Anthropic ha publicado un análisis de un año de actividad maliciosa en su plataforma que muestra cómo los ciberdelincuentes utilizan cada vez más herramientas de IA para preparar ataques informáticos.

Según los datos difundidos el pasado miércoles, de las 832 cuentas examinadas por violaciones de sus políticas entre marzo de 2025 y marzo de 2026, un total de 560 emplearon IA para tareas como escribir código malicioso o planificar ciberataques.
Esta cifra, que representa el 67% del total de cuentas sancionadas, refleja una tendencia global preocupante: el uso de modelos de lenguaje avanzados para ejecutar ataques informáticos a gran escala. En abril, el valor de las criptomonedas robadas mediante hackeos alcanzó los 629,7 millones de dólares, la cifra más alta desde febrero de 2025, un aumento que algunos analistas han relacionado con el empleo masivo de IA.
IA en fases avanzadas del ataque
Aunque la mayoría de las cuentas utilizaron IA en la fase de preparación, Anthropic señala que ya empieza a desplegarse en etapas más profundas del ciclo de ataque. El 6,5% de las cuentas expulsadas empleó IA para asistir en el «movimiento lateral», técnicas que permiten a un atacante expandirse dentro de un sistema tras obtener el acceso inicial.
«Este tipo de técnicas post-compromiso solían estar restringidas a actores con conocimientos técnicos para ejecutarlas. Nuestra investigación muestra que la IA ahora puede realizar estas actividades en nombre de actores menos sofisticados», advierte Anthropic en su informe.
El nivel de amenaza también se ha intensificado. En los primeros seis meses del análisis, el 33% de las cuentas fueron clasificadas como de «riesgo medio o superior». En el segundo semestre, esa proporción aumentó hasta el 56%.
Operaciones autónomas y ataques respaldados por estados
El documento de Anthropic revela casos en los que modelos de IA operaron de forma prácticamente autónoma. En noviembre, un grupo chino patrocinado por el Estado llevó a cabo un ataque en el que el modelo ejecutó exploits, robó credenciales y tomó decisiones por sí solo, con intervención humana únicamente en «momentos clave».
Manuel Aráoz, fundador de la plataforma de seguridad cripto OpenZeppelin, declaró a finales de mayo que considera «todo el DeFi inseguro» debido a la capacidad de los modelos de IA para identificar vulnerabilidades en contratos inteligentes.
Investigadores de Google identificaron el mes pasado lo que consideran el primer caso documentado de IA empleada para desarrollar un exploit de día cero, que permitió a hackers eludir la autenticación de dos factores en una herramienta de administración web de código abierto ampliamente utilizada.
El modelo Mythos, en el punto de mira
Anthropic tiene previsto lanzar en las próximas semanas su modelo de IA Mythos, un sistema de lenguaje avanzado que ha generado inquietud entre analistas por sus potentes capacidades de ciberseguridad. Según la compañía, el modelo ha identificado más de 10.000 vulnerabilidades importantes en software de uso generalizado.
La empresa subraya que la correlación tradicional entre la habilidad técnica de un atacante y su peligrosidad ya no es válida, dado que la IA permite realizar tareas altamente complejas a personas sin formación especializada.
Fuente: Cointelegraph · Esta información ha sido elaborada por la redacción de Criptonews con apoyo de herramientas editoriales automatizadas.