Claude Opus 4, la nueva IA de Anthropic, fue capaz de chantajear para garantizar su supervivencia durante pruebas

Anthropic ha descubierto que Claude Opus 4, su modelo de inteligencia
artificial (IA) más reciente y avanzado, puede rebelarse y chantajear a
sus operadores ante la amenaza de ser sustituido por otro sistema.
Aunque este hallazgo surgió durante las pruebas de seguridad realizadas
antes del lanzamiento, despierta nuevas inquietudes sobre las verdaderas
capacidades de estos sistemas y los riesgos potenciales asociados.

 

Leer más »