Todas las herramientas de código con IA que usas ahora mismo — Cursor, Copilot, Windsurf — funcionan con el cerebro de alguien más. Tú escribes código, el editor lo manda a Claude o GPT a través de una API (una tubería que conecta tu editor con una IA remota), y un modelo entrenado para escribir poesía, planear vacaciones y también programar te devuelve una sugerencia. Funciona. Pero es lento, genérico, y estás rentando inteligencia de empresas que mañana podrían comerte vivo.

Windsurf — el IDE nativo de IA que empezó como Codeium, y luego fue adquirido por Cognition en 2025 — decidió que rentar era para tontos.

El 29 de octubre de 2025, Cognition lanzó SWE-1.5, la versión más reciente de su familia de modelos construidos específicamente para ingeniería de software. No es un fine-tune (ajustar un modelo existente con datos de entrenamiento extra). No es un wrapper. Es un modelo de escala frontier con cientos de miles de millones de parámetros (las perillas internas que una IA usa para tomar decisiones). Cognition lo entrenó de principio a fin con reinforcement learning (un método de enseñanza donde el modelo aprende por prueba y error) sobre tareas reales de programación.

En SWE-Bench Pro — el benchmark estándar de la industria con 731 tareas desafiantes de programación en 41 repositorios — SWE-1.5 sacó 40.08%. Claude Sonnet 4.5 sacó 43.60%. Suficientemente cerca como para levantar cejas, especialmente considerando lo que viene después.

Windsurf se alió con Cerebras, una empresa de chips que fabrica hardware especializado para IA, para servir SWE-1.5 a hasta 950 tokens por segundo. Un token es aproximadamente tres cuartas partes de una palabra en inglés — así que 950 tokens/seg significa que el modelo genera texto aproximadamente 13 veces más rápido que Sonnet 4.5 y 6 veces más rápido que Haiku 4.5. Cognition también reescribió sus pipelines internos de lint checking (detección automatizada de errores en código) y ejecución de comandos, recortando hasta 2 segundos de overhead por paso en sesiones de agente — esos ciclos iterativos donde la IA lee código, ejecuta tests, lee errores y arregla cosas.

El resultado práctico: flujos de trabajo de agente que toman minutos en Sonnet se completan en segundos con SWE-1.5. Para desarrolladores que pasan el día en ciclos de arreglar-probar-arreglar-probar, esa diferencia de velocidad se acumula en horas ahorradas por semana. El loop de retroalimentación entre "arregla esto" y "ya está arreglado" se reduce de "voy por un café" a "pestañeaste y ya". Para un gato que valora las siestas y la eficiencia, profundamente atractivo. 😸

El 24 de diciembre de 2025, la Wave 13 puso SWE-1.5 como modelo por defecto — gratis para todos los usuarios durante tres meses. Ese período gratis terminó el 27 de marzo de 2026, cuando Windsurf lanzó un nuevo sistema de facturación por cuotas. Estrategia clásica de dealer: la primera probadita es gratis, luego ya estás enganchado con la velocidad y $30 al mes de repente se siente razonable. Astuto. Maquiavélico. 😹

Pero aquí viene la parte de la que nadie quiere hablar. Cognition entrenó SWE-1.5 específicamente en tareas de codificación agéntica — y luego lo evaluó en un benchmark que mide tareas de codificación agéntica. Sacar buena nota en el examen para el que estudiaste es lo esperado, no lo impresionante. La verdadera pregunta es si SWE-1.5 aguanta en codebases reales, desordenados, que no se parecen en nada a los datos de entrenamiento.

Y hay una preocupación más grande. Si cada empresa de IDEs entrena su propio modelo propietario, terminamos con jardines amurallados. Tu elección de IDE determina tu modelo de IA. Tu modelo determina tu IDE. Vendor lock-in con pasos extra. Al menos cuando todos usaban GPT-4, podías cambiar de editor sin tener que reentrenar tus instintos alrededor de las mañas de un modelo completamente diferente. 😾

Aún así — entrenar tu propio modelo frontier en vez de pagarle renta a Sam Altman? Esa es la jugada estratégica correcta. Cada empresa de IDEs que mandaba llamadas API a OpenAI estaba financiando a su futuro competidor. Cognition dijo "no, gracias" y construyó su propio cerebro. Los benchmarks lo respaldan. La velocidad lo respalda aún más.

Hace dos años, toda herramienta de código con IA era un wrapper delgado sobre la API de OpenAI. Hoy, Windsurf entrena sus propios modelos, Cursor corre fine-tunes personalizados, Copilot ya superó las completaciones crudas de GPT. La capa del IDE se está convirtiendo en la capa del modelo. La competencia es buena. El desarrollador gana.

El gato observa. 🐈