El Anthropic, durante meses insinuó que estaba preparando un salto importante. Y ese salto acaba de llegar con Claude Opus 4.5, una inteligencia artificial que según los datos publicados por la propia compañía y no solo supera a GPT-5.1 Codex-Max y Gemini 3 Pro, sino que también rinde mejor que los ingenieros humanos en pruebas reales de programación.

El Opus 4.5 fue sometido a un examen de nivel profesional diseñado para seleccionar candidatos a ingeniería, con un límite estricto de dos horas y resolución de problemas en Python. La sorpresa llegó cuando el modelo obtuvo una puntuación superior a la de cualquier persona, combinando paralelización de intentos con una notable capacidad para razonar pasos complejos. Anthropic describe Opus 4.5 como “el mejor modelo del mundo para programación, agentes y uso informático general”. Habrá que ver si la competencia responde, pero los números publicados son difíciles de ignorar.


En las métricas SWE-bench, el estándar para medir la capacidad de una IA de resolver incidencias reales de software, Opus 4.5 supera a GPT-5.1, Gemini 3 Pro y al anterior Claude Sonnet 4.5. No solo arregla bugs: también refactoriza, migra repositorios completos, revisa código con precisión quirúrgica y es capaz de desarrollar herramientas funcionales desde cero. Uno de los puntos que más destaca Anthropic es su razonamiento profundo. Frente a modelos anteriores, Opus 4.5 desarma problemas ambiguos y los ordena en una secuencia lógica; si algo no está claro, genera hipótesis y las contrasta en paralelo antes de entregar la solución final.


Asimismo incorpora una ventana de contexto de 200.000 tokens, suficiente para meter dentro un repositorio completo, documentación adjunta, ejemplos previos y una conversación larga sin perder coherencia. Para los desarrolladores que trabajan con bases de código gigantes, este detalle no es menor. Una de las novedades curiosas es un parámetro llamado effort (“esfuerzo”). Permite elegir entre más velocidad o más profundidad de análisis.

Si el usuario activa el modo de máximo esfuerzo, Opus 4.5 dedica más tiempo a generar múltiples rutas de solución antes de quedarse con la mejor. Para tareas urgentes, basta con rebajar ese ajuste y priorizar la entrega inmediata.
