Windsurf SWE-1.5: IDE, które wyhodowało własny mózg

Każde narzędzie AI do kodowania, którego teraz używasz — Cursor, Copilot, Windsurf — działa na cudzym mózgu. Piszesz kod, edytor wysyła go do Claude'a albo GPT przez API (rurę łączącą twój edytor ze zdalnym AI), a model zbudowany do pisania wierszy, planowania wakacji i przy okazji kodowania odsyła ci sugestię. Działa. Ale jest wolne, generyczne, a ty wynajmujesz inteligencję od firm, które jutro mogą zjeść twój obiad.

Windsurf — IDE z wbudowanym AI, które zaczęło życie jako Codeium, a potem zostało przejęte przez Cognition w 2025 — uznało, że wynajmowanie jest dla frajerów.

29 października 2025 Cognition wypuściło SWE-1.5, najnowszą wersję autorskiej rodziny modeli zbudowanych specjalnie pod inżynierię oprogramowania. Nie fine-tune (podkręcanie istniejącego modelu dodatkowymi danymi treningowymi). Nie wrapper. Model klasy frontier z setkami miliardów parametrów (wewnętrznych pokręteł, którymi AI podejmuje decyzje). Cognition trenowało go end-to-end reinforcement learningiem (metoda, w której model uczy się metodą prób i błędów) na prawdziwych zadaniach programistycznych.

Na SWE-Bench Pro — branżowym benchmarku z 731 wymagającymi zadaniami programistycznymi w 41 repozytoriach kodu — SWE-1.5 uzyskał 40.08%. Claude Sonnet 4.5 osiągnął 43.60%. Wystarczająco blisko, żeby ktoś w Anthropic uniósł brew — zwłaszcza biorąc pod uwagę to, co dalej.

Windsurf nawiązał partnerstwo z Cerebras, firmą chipową budującą specjalizowany hardware AI, żeby serwować SWE-1.5 z prędkością do 950 tokenów na sekundę. Token to mniej więcej trzy czwarte angielskiego słowa — więc 950 tokenów/s oznacza, że model generuje tekst około 13x szybciej niż Sonnet 4.5 i 6x szybciej niż Haiku 4.5. Cognition przepisało też wewnętrzne pipeline'y lint checkingu (automatycznego wykrywania błędów w kodzie) i wykonywania komend, obcinając do 2 sekund narzutu na krok w sesjach agentowych — tych iteracyjnych pętlach, gdzie AI czyta kod, odpala testy, czyta błędy i naprawia.

Praktyczny rezultat: agentic workflow, które na Sonnecie trwają minuty, na SWE-1.5 kończą się w sekundy. Dla programistów kręcących pętle fix-test-fix-test cały dzień ta różnica w prędkości składa się w godziny zaoszczędzone tygodniowo. Pętla zwrotna między 'napraw to" a 'naprawione" kurczy się z przerwy-na-kawę do mrugnięcia-okiem. Dla kota, który ceni drzemki i wydajność, głęboko satysfakcjonujące. 😸

24 grudnia 2025 Wave 13 wdrożył SWE-1.5 jako domyślny model — za darmo dla wszystkich użytkowników na trzy miesiące. Ten darmowy okres skończył się 27 marca 2026, kiedy Windsurf odpalił nowy system rozliczeń oparty na quotach. Klasyczna strategia dilera: pierwsza działka za darmo, potem jesteś uzależniony od prędkości i 30$/miesiąc nagle wydaje się rozsądne. Sprytne. Podstępne. 😹

Ale jest coś, o czym nikt nie chce mówić. Cognition trenowało SWE-1.5 specjalnie na agentic coding tasks — a potem testowało go na benchmarku, który mierzy agentic coding tasks. Zdanie egzaminu, do którego się kuło, to norma, nie powód do oklasków. Prawdziwe pytanie brzmi: czy SWE-1.5 daje radę na brudnych, produkcyjnych codebase'ach, które wyglądają zupełnie inaczej niż dane treningowe.

I jest większy problem. Jeśli każda firma IDE-owa trenuje swój własny proprietary model, lądujemy w ogrodach otoczonych murem. Twój wybór IDE determinuje twój model AI. Twój model determinuje twoje IDE. Vendor lock-in z dodatkowym krokiem pośrednim. Przynajmniej kiedy wszyscy siedzieli na GPT-4, mogłeś zmienić edytor bez przerabiania instynktów na dziwactwa zupełnie innego modelu. 😾

Mimo wszystko — trenowanie własnego modelu frontier zamiast płacenia czynszu Samowi Altmanowi? To strategicznie prawidłowy ruch. Każda firma IDE-owa wysyłająca API calle do OpenAI finansowała swojego przyszłego konkurenta. Cognition powiedziało 'nie, dzięki" i zbudowało własny mózg. Benchmarki to potwierdzają. Prędkość potwierdza jeszcze bardziej.

Dwa lata temu każde narzędzie AI do kodowania było cienkim wrapperem wokół API OpenAI. Dziś Windsurf trenuje własne modele, Cursor odpala custom fine-tune'y, Copilot wyszedł poza surowe kompletacje GPT. Warstwa IDE staje się warstwą modelu. Konkurencja jest dobra. Programista wygrywa.

Kot obserwuje. 🐈

Windsurf SWE-1.5: IDE, które wyhodowało własny mózg

Keep reading

Premiera GPT-5.2-Codex: Najostrzejsza Broń OpenAI w Kodowaniu

Cursor 3 rozwiazal problem bezpieczenstwa enterprise. Teraz buduje klatke, z ktorej nie wyjdziesz

Dolarowe Menu Pożera Stack

Wielka Redystrybucja