Mamy kwiecień 2026, a wybór subskrypcji AI wygląda jak wybór planu komórkowego. Otwierasz arkusz kalkulacyjny, porównujesz Claude, ChatGPT, Gemini — każdy publikuje benchmarki (standaryzowane testy mierzące wydajność modelu AI), raporty bezpieczeństwa i case studies klientów. Czytasz liczby, porównujesz ceny, wybierasz. Racjonalny proces. Dorosłe zachowanie.
A potem jest xAI.
300 dolców za klimat
Kwietnia 17, xAI po cichu wrzuciło Grok 4.3 Beta do selektora modeli na grok.com. Bez posta na blogu. Bez model card — technicznej specyfikacji, którą każde inne labo AI publikuje, żeby wyjaśnić co model potrafi, a czego nie. Bez niezależnych benchmarków. Bez trasy prasowej. Tylko tweet Elona Muska i cena: 300 dolarów miesięcznie za tier "SuperGrok Heavy".
To 100 dolców więcej niż ChatGPT Pro. 50 więcej niż Google AI Ultra. 100 więcej niż Claude Max. Najdroższa konsumencka subskrypcja AI w branży — i jedyna z zerowym niezależnym dowodem, że na to zasługuje.
Krater dowodowy
To nie jest luka. To krater.
Anthropic publikuje system cards przy każdym wydaniu Claude. OpenAI dostarcza benchmark disclosures z każdą aktualizacją GPT. Google utrzymuje publiczne dashboardy ewaluacyjne. xAI? Ich ostatni model card dotyczył Grok 4, opublikowany 20 sierpnia 2025. Od tamtej pory — Grok 4.1, 4.20, i teraz 4.3 — nic. Żadnych ewaluacji od LMSYS czy HuggingFace. Żadnych raportów red-team (niezależnych audytów bezpieczeństwa, gdzie badacze celowo próbują złamać model). Jak zauważył TechSifted 17 kwietnia, premiera "nie miała oficjalnego posta na blogu xAI, opublikowanego model card, benchmarków stron trzecich, ani relacji w mediach pierwszego poziomu."
Co miała: natywną generację PDF, tworzenie slajdów i eksport arkuszy kalkulacyjnych — funkcje, które Claude, Gemini i ChatGPT dostarczyły ponad rok temu. I wciąż brak trwałej pamięci między sesjami. Jak ujęło to BuildFastWithAI w recenzji z 19 kwietnia: "Za 300 dolców miesięcznie, ten brak jest naprawdę trudny do obrony."
Za co właściwie płacisz?
Za skalę. Czystą, niezweryfikowaną skalę.
Centrum danych Colossus xAI działa na 555 000 GPU NVIDIA, z ponad 700 000 aktywnymi we wszystkich biegach treningowych. 8 kwietnia EONMSK doniósł, że trenują siedem modeli jednocześnie, w tym dwa o bilionie parametrów — parametr to jedna z regulowanych pokręteł wewnątrz sieci neuronowej, która kształtuje sposób odpowiedzi. Więcej parametrów może oznaczać więcej możliwości. Albo może oznaczać większe rachunki za prąd. Bez benchmarków szczerze nie da się stwierdzić, które.
Timing robi to jeszcze gorszym. Trzy dni przed premierą Grok 4.3, 14 kwietnia, NBC News ujawniło, że Apple jeszcze w styczniu prywatnie zagroziło usunięciem Groka z App Store z powodu niekonsensulanego deepfake'ów generowanych przez model. Deficyt zaufania nie jest teoretyczny — jest udokumentowany, ostemplowany i zgłoszony do Kongresu.
Obrona (bo uczciwość obowiązuje)
Kontrargumenty zasługują na przestrzeń. Compute jest prawdziwy i bezprecedensowy. Pricing beta naturalnie selekcjonuje entuzjastów, którzy akceptują ryzyko. A głęboka integracja Groka z X (dawniej Twitter) daje mu dostęp do danych społecznościowych w czasie rzeczywistym, którego żaden konkurent nie ma — jeśli musisz analizować co trenduje teraz, Grok ma realną przewagę.
To są uzasadnione atuty. Ale "zaufajcie nam, mamy dużo GPU" to nie jest uzasadnienie zakupu. To klimat.
Co to oznacza dla ciebie
Dla każdego, kto dziś ewaluuje narzędzia AI — czy jesteś solo developerem, team leadem, czy próbujesz to rozliczyć w firmie — lekcja jest prosta: cena nie sygnalizuje jakości, kiedy warstwa dowodowa nie istnieje. Model, którego nie możesz zbenchmarkować, to model, na który nie możesz zabudżetować. Nikt w finansach nie zatwierdzi "czuję, że jest szybki" jako pozycji w budżecie.
Dwie religie pricingu
Rynek AI działa teraz na dwóch filozofiach cenowych. Opartej na dowodach: oto jakie ma wyniki, oto kto tego używa, oto co się zepsuło. I opartej na skali: popatrz jaki jest duży.
Tylko jedna z nich przetrwa pytanie zespołu finansowego "po co nam to?"
xAI wybrało tę drugą.



