
news
SWE-bench ist tot. Worauf dein AI-Coding-Tool wirklich konkurriert.
10.000 Entwickler bestaetigen: Benchmark-Scores sagen Zufriedenheit nicht voraus. Der echte Unterschied hat kein Leaderboard.

news
OpenAI hat das KI-Rennen nicht gewonnen -- es hat die Anzeigetafel gekauft
In sieben Wochen hat OpenAI den gesamten KI-Evaluierungs-Stack vertikal integriert. Drei vertretbare Schritte, ein Muster.