Anthropic se disculpa por restringir en secreto Fable 5 para desarrollar nuevos modelos de IA, pero mantiene las medidas

Archivo - (Foto de ARCHIVO) (Foto de ARCHIVO)October 1, 2025, West Java, Indonesia: In this photo illustration

- CONTACTO VÍA EUROPA PRESS - Archivo

MADRID, 11 Jun. (Portaltic/EP) -

Anthropic se ha disculpado por limitar en secreto las capacidades de su nuevo modelo Claude Fable 5, como parte de una política de salvaguardias que pretendía evitar que adversarios extranjeros utilizasen el modelo avanzado para desarrollar sus propios modelos de IA, lo que ha provocado que otros desarrolladores del sector no pudieran utilizarlo para sus proyectos de investigación.

La compañía lanzó Claude Fable 5 este miércoles como el primer modelo de clase Mythos disponible de forma general, aunque se puso a disposición con algunas medidas de seguridad diseñadas para evitar posibles usos maliciosos y solo para las organizaciones que forman parte del Project Glasswing.

Estas medidas de seguridad incluyen cuestiones como limitar los resultados a preguntas relacionadas con la ciberseguridad, la biología o la química y, en su lugar, redirigen estas consultas a un modelo de IA menos capaz. De esta forma, el modelo sigue ofreciendo información relacionada, pero evita compartir datos relevantes que puedan usarse para, por ejemplo, ejecutar un ciberataque o desarrollar un arma biológica.

Sin embargo, estas no eran las únicas salvaguardias introducidas en Fable 5. Según ha recogido WIRED, Anthropic también ha limitado las capacidades del modelo para otras solicitudes sin indicarlo claramente, incluyendo tareas como entrenar modelos de lógica descriptiva (LLM), llevar a cabo depuración de código de IA u optimizar arquitectura neuronal.

Así lo han confirmado las quejas de algunos investigadores recogidas por el medio citado, que han denunciado que las limitaciones no se llevaron a cabo con transparencia, sino que se activaban automáticamente sin informar de ello a los usuarios, frenando sus proyectos de IA.

Ahora, Anthropic ha compartido una disculpa por este comportamiento opaco y ha señalado que todas las salvaguardias de Claude Fable 5 serán completamente visibles para los usuarios en su día a día.

"Vamos a cambiar las salvaguardas de Fable 5 para hacerlas visibles", ha sentenciado la compañía en declaraciones a WIRED, al tiempo que ha admitido que hicieron "el intercambio equivocado" y que sienten no haber encontrado el "equilibrio adecuado".

Por tanto, Anthropic ha dejado claro que, si sus sistemas intuyen que el usuario está intentando utilizar Fable 5 para desarrollar otro modelo de IA altamente capaz, notificará que rechaza la solicitud o trasladará la cuestión a un modelo menos capaz.

Cabe destacar que la tecnológica especifica en sus términos de uso que queda completamente prohibido utilizar Claude para entrenar y desarrollar otros modelos de IA. Teniendo esto en cuenta, la compañía ha aclarado que interpuso estas salvaguardias para impedir que adversarios extranjeros utilizasen sus modelos más capaces "de formas que supongan un grave riesgo para la seguridad".

Este planteamiento ya lo ha compartido en otras ocasiones, como cuando acusó en febrero a empresas chinas como DeepSeek o Moonshot por llevar a cabo ataques de destilación para abusar de su modelo Claude con el fin de aprovecharse de sus capacidades y mejorar sus modelos.

A pesar de todo ello, la comunidad de investigadores ha subrayado que, al restringir sus herramientas más avanzadas para investigar y desarrollar tecnología de IA, Anthropic reduce el acceso de esta tecnología a un grupo limitado de personas o, incluso, a la propia compañía de IA, lo que podría desembocar en degradar el rendimiento en la investigación global.

Anthropic se disculpa por restringir en secreto Fable 5 para desarrollar nuevos modelos de IA, pero mantiene las medidas

Contenido patrocinado