
news
SWE-bench मर चुका है। तुम्हारा AI Coding Tool असल में किस बात पर compete करता है।
10,000 devs confirm करते हैं: benchmark scores satisfaction predict नहीं करते। Context strategy का कोई leaderboard नहीं।

news
OpenAI ने AI रेस जीती नहीं — स्कोरबोर्ड ही खरीद लिया
सात हफ्तों में OpenAI ने SWE-bench गिराया, Promptfoo खरीदा, हर rival को अपने SDK में लपेटा। पूरे eval stack का vertical integration।