Claude Opus 4, la nueva IA de Anthropic, fue capaz de chantajear para garantizar su supervivencia durante pruebas

por MIQUEL CLARen Uncategorizeden mayo 26, 2025

Anthropic ha descubierto que Claude Opus 4, su modelo de inteligencia
artificial (IA) más reciente y avanzado, puede rebelarse y chantajear a
sus operadores ante la amenaza de ser sustituido por otro sistema.
Aunque este hallazgo surgió durante las pruebas de seguridad realizadas
antes del lanzamiento, despierta nuevas inquietudes sobre las verdaderas
capacidades de estos sistemas y los riesgos potenciales asociados.