Radar IA Semanal: Anthropic lanzó Claude Sonnet 4 con contexto 200K y el mercado tembló

Qué pasó

Claude Sonnet 4 con contexto 200K. Anthropic actualizó Sonnet 4 con la ventana de contexto completa de Opus (200K tokens) sin cambiar el pricing. Sonnet 4 ahora es el modelo con mejor relación calidad-precio del mercado: ~80% de la calidad de Opus a 1/5 del precio ($3/$15 → $0.60/$4).

Google ajustó precios de Gemini. Gemini 2.5 Pro bajó de $1.25/$10 a $0.80/$8 en el tier estándar. Gemini 2.5 Flash bajó a $0.10/$0.40. Es la respuesta directa a la presión de open-weights.

Los benchmarks de junio se cocinan. Se anunció la próxima ronda de SWE-bench y LiveCodeBench updates. Si los resultados confirman la tendencia (Opus > GPT-5 > Sonnet ≈ Qwen 3 > DeepSeek V4 Pro), el ranking se estabiliza.

Por qué importa

Sonnet 4 mató el argumento de “Opus o nada”. Antes, si querías contexto largo + calidad, pagabas $15/1M output. Ahora, Sonnet 4 ofrece 200K contexto a $4/1M output. Para la mayoría de devs, Sonnet 4 es suficiente. Opus se reserva para el 5% de tareas donde la calidad extra importa.

La guerra de precios beneficia al usuario. Frontier pricing bajó un 30-40% en 3 meses. Cuando Anthropic, Google y OpenAI compiten en precio, los desarrolladores ganan. El pricing de hoy es irreconocible respecto a enero.

El “sweet spot” se movió. Hace 3 meses, el sweet spot era GPT-5 ($2/$10). Ahora es Sonnet 4 ($0.60/$4) o Qwen 3 (~$0.40/$1.60). La calidad media subió y el precio medio bajó. Ganar-ganar.

A quién afecta

Devs que pagan por API: Revisar routing. Si usabas GPT-5 para todo, probablemente puedes bajar a Sonnet 4 para la mayoría de tareas.
Equipos con budget fijo: El mismo budget ahora rinde 2-3x más. Aprovecha.
Open-weight advocates: La presión de pricing de frontier hace que self-hosting sea menos atractivo económicamente. La ventaja principal de open-weights ahora es la privacidad, no el precio.

Qué haría yo

Actualizar routing inmediatamente:
- Rutina → Step 3.5 Flash (gratis)
- Estándar → Sonnet 4 ($0.60/$4)
- Coding complejo → Opus 4.7 ($3/$15)
- Solo usar GPT-5 si necesitas fine-tuning o structured output específico
Re-evaluar self-hosting: Con Sonnet 4 a $0.60/1M input, self-hostear Llama 4 Maverick a ~$3.50/h solo compensa si procesas >100M tokens/mes o tienes requisitos de privacidad.
Monitorear OpenAI: OpenAI no ha respondido al pricing de Sonnet. Si GPT-5 baja de precio, el mercado se recalibra de nuevo.

Señales que estoy vigilando

GPT-5 pricing response: OpenAI necesita responder. ¿Bajarán GPT-5 o lanzarán un tier intermedio?
Sonnet 4 stability: Nuevo modelo, posible teething. Verificar estabilidad antes de migrar producción.
Open-source models reaction: Qwen y DeepSeek podrían responder con pricing aún más agresivo.

Próximo radar: 2 de junio. RSS para actualizaciones semanales.