Nuevo modelo de IA de Anthropic Mythos con restricciones de seguridad

Anthropic acaba de abrir al público el acceso a Fable 5, una versión simplificada de su modelo de inteligencia artificial más avanzado, Mythos. Este nuevo modelo ha causado un gran revuelo por su capacidad de detectar y aprovechar vulnerabilidades de software, un tema que ha preocupado a muchos en el ámbito de la ciberseguridad. Se comenta que esta herramienta puede influir en los principales sistemas operativos y navegadores web. Aunque Fable 5 ofrece mejoras en programación, análisis complejo y visión artificial, mantiene restricciones en áreas sensibles como ciberseguridad, biología y química, donde las respuestas son redirigidas automáticamente a versiones más seguras.

Hasta el momento, Mythos había estado disponible solo para un pequeño grupo de organizaciones, debido a preocupaciones sobre su seguridad. Sin embargo, luego de una expansión inicial a cientos de entidades de infraestructura crítica en 15 países, Anthropic ha decidido lanzar Fable 5 a través de su API y planes corporativos.

Los usuarios de los planes Pro, Max, Team y Enterprise podrán probarlo de forma gratuita hasta el 22 de junio. Después de esa fecha, la empresa implementará un sistema de créditos de consumo para usar el modelo, pero aseguró que planea reintroducirlo en las suscripciones tradicionales lo más pronto posible.

Un lanzamiento marcado por las preocupaciones sobre la IA

La llegada de Fable 5 coincide con un momento crucial para la industria, ya que Anthropic se prepara para salir a bolsa. Recientemente, la empresa ha solicitado a otros laboratorios del sector que coordinen límites en el desarrollo de sistemas cada vez más potentes. Esto refleja la preocupación general sobre cómo la inteligencia artificial podría acercarse a escenarios de auto-mejora recursiva, donde los modelos se perfeccionarían automáticamente sin intervención humana.

Para mitigar estos riesgos, Anthropic sometió a Fable 5 a exhaustivas pruebas de seguridad antes de su lanzamiento. La compañía informó que llevó a cabo un programa de recompensas por detección de errores, logrando no encontrar vulnerabilidades universales en más de 1000 horas de pruebas. Además, colaboraron con organizaciones externas que también hicieron pruebas de penetración sin éxito en encontrar fallos.

Los salvaguardas del nuevo modelo de Mythos

Dentro de las nuevas medidas de seguridad, Anthropic implementará una política de retención de 30 días para todo el tráfico generado por Fable 5 y Mythos 5, incluso para aquellas organizaciones que antes tenían acuerdos de almacenamiento cero. Es importante destacar que la empresa asegura que no utilizará estos datos para entrenamiento, sino únicamente para detectar intentos de evadir restricciones y mejorar la seguridad del sistema. Esto podría marcar un precedente en una industria donde los modelos más avanzados requieren controles cada vez mayores sobre el uso de la información.

Según la compañía, solo en raras ocasiones Fable 5 necesita apoyo de Claude Opus 4.8 y, sorprendentemente, más del 95% de las sesiones se completan utilizando exclusivamente el nuevo modelo. Además, evaluaciones externas, como las realizadas por Hex, han reconocido que Fable fue el primer sistema en lograr un 90% de precisión en pruebas analíticas para tareas complejas y de larga duración.

Entidades también han reportado mejoras destacadas en aspectos como programación, desarrollo de aplicaciones, diseño de interfaces y hasta en la creación de videojuegos. Sin embargo, el costo podría representar un obstáculo para su adopción general. Anthropic ha fijado un precio de u$s10 por millón de tokens de entrada y u$s50 por millón de tokens de salida, que es el doble del costo de Claude Opus 4.8.

Botão Voltar ao topo