Anthropic presentó Claude Sonnet 5, una nueva versión de su modelo de inteligencia artificial de tamaño intermedio que apuesta por ofrecer mayores capacidades autónomas sin elevar significativamente los costos. El lanzamiento llega en un momento en el que los principales desarrolladores de modelos fundacionales compiten por ofrecer herramientas cada vez más capaces de ejecutar tareas complejas con mínima intervención humana.
La compañía explicó que el nuevo modelo puede planificar procesos, utilizar navegadores y terminales, así como completar flujos de trabajo de manera autónoma, funciones que hasta hace poco estaban reservadas para modelos de mayor tamaño y precio.
Claude Sonnet 5 apuesta por mayor rendimiento a menor costo
Anthropic aseguró que el nuevo modelo ofrece un desempeño cercano al de Opus 4.8, pero con un costo considerablemente menor. Desde su lanzamiento, Claude Sonnet 5 se convirtió en el modelo predeterminado para los usuarios de los planes gratuitos y Pro, además de estar disponible para el resto de las suscripciones.
Hasta el 31 de agosto, el modelo tendrá un costo de 2 dólares por millón de tokens de entrada y 10 dólares por millón de tokens de salida. Después de esa fecha, las tarifas aumentarán a 3 y 15 dólares, respectivamente. Aun así, continúa siendo más económico que Opus 4.8, GPT-5.5 de OpenAI y Gemini 3.1 Pro de Google, aunque permanece por encima del precio de Gemini 3.5 Flash.
Las pruebas internas muestran mejoras respecto a Sonnet 4.6 en razonamiento, programación, uso de herramientas y ejecución de tareas relacionadas con el trabajo del conocimiento. En una de las evaluaciones de programación autónoma alcanzó una puntuación de 63.2%, frente al 58.1% obtenido por la versión anterior.
Anthropic mejora seguridad y automatización
La empresa también destacó que Claude Sonnet 5 reduce la frecuencia de comportamientos no deseados, como la cooperación con usos maliciosos, el engaño y las alucinaciones generadas por inteligencia artificial. Asimismo, mostró mejores resultados frente a intentos de manipulación mediante ataques de inyección de instrucciones (prompt injection).
De acuerdo con Anthropic, el modelo completa con mayor frecuencia tareas complejas de principio a fin e incluso revisa sus propias respuestas sin que el usuario tenga que solicitarlo expresamente.
Durante las pruebas realizadas por Zapier, el modelo logró actualizar cuentas de Salesforce y enviar anuncios comerciales de manera completamente autónoma, procesos que versiones anteriores dejaban inconclusos.
Aunque Anthropic reconoce que Opus 4.8 continúa siendo la mejor alternativa para tareas que requieren máxima precisión, considera que Claude Sonnet 5 ofrece un equilibrio más atractivo entre costo, rendimiento y seguridad para desarrolladores y empresas que buscan automatizar procesos cotidianos.