Calvin Wankhede / Autoridad de Android
TL;DR
- Anthropic lanzó un par de sus modelos más potentes hasta la fecha con Claude Fable 5 y Mythos 5.
- Si bien Mythos 5 se creó para que los investigadores de seguridad pudieran encontrar vulnerabilidades, el público Fable 5 tiene salvaguardias para evitar la piratería.
- Ambos modelos demuestran capacidades avanzadas para manejar incluso tareas analíticas muy complejas.
A estas alturas, es casi seguro que hayas visto al menos una demostración de IA que te haya dejado un poco confundido: “No sólo es bueno; es fantástico. aterrador Bien». Ya sea que hablemos de que la IA robe trabajos a los artistas o genere nuevas pruebas de misterios matemáticos, constantemente descubrimos nuevas formas en las que los sistemas impulsados por IA producen resultados que los hacen parecer increíblemente poderosos. Recientemente, escuchamos a Anthropic expresar su preocupación por el lanzamiento del último modelo de Claude Mythos, del cual solo hay unos pocos. demasiado bueno en la búsqueda de vulnerabilidades de software. Pero ahora, Anthropic está empezando a avanzar en ello.
No quiero perderme lo mejor de Autoridad de Android?
La búsqueda automatizada de errores no es nada nuevo, y los científicos informáticos han estado utilizando herramientas como fuzzers durante años, inundando el software con entradas aleatorias con la esperanza de provocar errores. Pero la IA representa una amenaza mucho más poderosa y, a medida que proliferan los buscadores de vulnerabilidades como Mythos, sus creadores se muestran cada vez más cautelosos a la hora de compartir sus modelos más poderosos.
En lugar de dejar que la tecnología se quede quieta para siempre, hoy Anthropic comparte los compromisos que ha logrado sobre cómo implementar Mythos de manera responsable y segura. La clave de este enfoque es dividir las cosas en dos modelos separados: Claude Fable 5 y Claude Mythos 5.
Fable 5 es un modelo para el público en general y es una solución con todas las funciones para manejar tareas analíticas. Esto va más allá de encontrar vulnerabilidades de software: Fable 5 puede ayudar a codificar, tiene poderosas herramientas de análisis de visión e incluso puede desarrollar estrategias internas con el tiempo. Según Anthropic, «las capacidades de Fable 5 superan cualquier modelo que hayamos puesto a disposición del público».
Pero Anthropic también lo lanzó con varias condiciones. Fable 5 está diseñado para resistir los intentos de usarlo para descubrir los últimos exploits de día cero, que están listos para ser explotados por actores maliciosos y causar estragos en los sistemas informáticos globales. Cuando alguien intenta llevar Fable 5 más allá de esos límites, el modelo volverá a Claude Opus 4.8.
Pero luego está el Mythos 5, que internamente es igual que el Fable 5, pero no tiene tanta protección adicional. La clave aquí es que Anthropic planea lanzarlo de manera muy selectiva, invitando a usarlo solo a miembros confiables de la comunidad de ciberseguridad. Para adelantarse a los malos, es importante utilizar herramientas como esta para identificar errores y corregirlos, y estas soluciones están destinadas a reducir el riesgo de que Mythos 5 se reutilice para cosas malas.
Anthropic ha desarrollado una serie de «clasificadores» que intentan reconocer lo que los usuarios intentan hacer con Fable 5, y no solo intentan bloquear los hacks. También se crearon para impedir que alguien usara los modelos para desarrollar formas de sintetizar compuestos químicos o biológicos peligrosos, o para extraer suficiente información interna para crear su propia Fable 5, sin ninguna protección.
Esperemos que eso sea suficiente para que esta versión pública basada en Mythos siga funcionando de forma segura, ya que estamos seguros de que mucha gente lo intentará. muy es difícil desbloquear todas sus capacidades.
Gracias por ser parte de nuestra comunidad. Lea nuestra Política de comentarios antes de publicar.


