Windsurf SWE-1.5: IDE, що виростив власні мізки

Кожен AI-інструмент для коду, яким ви зараз користуєтесь — Cursor, Copilot, Windsurf — працює на чужих мізках. Ви пишете код, редактор відправляє його Claude чи GPT через API (труба, що з'єднує ваш редактор із віддаленим AI), і модель, створена писати вірші, планувати відпустки і заодно кодити — повертає підказку. Працює. Але повільно, узагальнено, і ви орендуєте інтелект у компаній, які завтра можуть з'їсти вас на сніданок.

Windsurf — AI-native IDE, що почав життя як Codeium, а потім був поглинутий Cognition у 2025 — вирішив, що оренда — для лохів.

29 жовтня 2025 року Cognition випустили SWE-1.5, останню версію своєї кастомної сімейки моделей, створених спеціально для software engineering. Не fine-tune (підкрутка існуючої моделі додатковими даними). Не обгортка. Повноцінна frontier-модель із сотнями мільярдів параметрів (внутрішніх ручок, якими AI приймає рішення). Cognition тренували її end-to-end за допомогою reinforcement learning (метод навчання, де модель вчиться методом спроб і помилок) на реальних задачах кодування.

На SWE-Bench Pro — індустріальному бенчмарку з 731 складної задачі кодування по 41 репозиторію — SWE-1.5 набрала 40.08%. Claude Sonnet 4.5 набрав 43.60%. Достатньо близько, щоб підняти брови, особливо враховуючи те, що далі.

Windsurf об'єднався з Cerebras, чіп-компанією, що будує спеціалізоване AI-залізо, щоб роздавати SWE-1.5 зі швидкістю до 950 токенів на секунду. Токен — це приблизно три чверті англійського слова — отже 950 токенів/сек означає, що модель генерує текст приблизно в 13 разів швидше за Sonnet 4.5 і в 6 разів швидше за Haiku 4.5. Cognition також переписали свій внутрішній lint checking (автоматичне виявлення помилок у коді) і пайплайни виконання команд, зрізавши до 2 секунд оверхеду на крок в агентних сесіях — тих ітеративних циклах, де AI читає код, запускає тести, читає помилки й фіксить їх.

Практичний результат: агентні воркфлоу, які на Sonnet займають хвилини, на SWE-1.5 завершуються за секунди. Для розробників, що цілий день крутять цикли fix-test-fix-test, ця різниця у швидкості перетворюється на години зекономленого часу за тиждень. Зворотний зв'язок між "пофікси це" і "пофікшено" скорочується від перерви-на-каву до моргнув-і-готово. Для кота, який цінує дрімоту та ефективність, — глибоко приваблива тема. 😸

24 грудня 2025 року Wave 13 зробив SWE-1.5 моделлю за замовчуванням — безкоштовно для всіх користувачів на три місяці. Цей безкоштовний період закінчився 27 березня 2026, коли Windsurf розкатав нову систему квотного біллінгу. Класична стратегія дилера: перша доза безкоштовна, потім ти підсів на швидкість і $30/міс раптом здаються розумною ціною. Розумно. Підступно. 😹

Але ось частина, про яку ніхто не хоче говорити. Cognition тренували SWE-1.5 саме на агентних задачах кодування — а потім тестували на бенчмарку, який міряє агентні задачі кодування. Здати екзамен, до якого ти готувався — очікувано, а не вражаюче. Справжнє питання в тому, чи тримає SWE-1.5 рівень на брудних, реальних кодових базах, які не схожі на тренувальні дані.

І є ще більше занепокоєння. Якщо кожна IDE-компанія тренуватиме свою пропрієтарну модель, ми отримаємо зачинені городи. Ваш вибір IDE визначає вашу AI-модель. Ваша модель визначає ваш IDE. Vendor lock-in з додатковими кроками. Принаймні коли всі сиділи на GPT-4, можна було змінити редактор, не перевчаючи свої інстинкти під примхи зовсім іншої моделі. 😾

Втім — тренувати власну frontier-модель замість того, щоб платити Сему Альтману оренду? Це правильний стратегічний хід. Кожна IDE-компанія, що слала API-запити в OpenAI, фінансувала свого майбутнього конкурента. Cognition сказали "ні, дякую" і побудували власні мізки. Бенчмарки це підтверджують. Швидкість — ще більше.

Два роки тому кожен AI-інструмент для коду був тонкою обгорткою над API OpenAI. Сьогодні Windsurf тренує власні моделі, Cursor запускає кастомні fine-tune'и, Copilot вийшов за межі голих GPT-комплішнів. Шар IDE стає шаром моделі. Конкуренція — це добре. Виграє розробник.

Кіт спостерігає. 🐈

Windsurf SWE-1.5: IDE, що виростив власні мізки

Читай далі

GPT-5.2-Codex: найгостріша кодинг-зброя OpenAI

Cursor 3 закрив питання безпеки. Тепер будує клітку, з якої не вийти

Долар-меню з'їдає стек

Велике Перерозподілення