On est en avril 2026, et choisir un abonnement IA ressemble furieusement à choisir un forfait téléphone. Tu ouvres un tableur, tu compares Claude, ChatGPT, Gemini — chacun publie ses benchmarks (des tests standardisés qui mesurent les performances d'un modèle IA), ses rapports de sécurité et ses études de cas clients. Tu lis les chiffres, tu compares les prix, tu choisis. Processus rationnel. Comportement d'adulte.
Et puis il y a xAI.
300 $ pour du feeling
Le 17 avril, xAI a discrètement glissé Grok 4.3 Beta dans le sélecteur de modèles sur grok.com. Pas de billet de blog. Pas de model card — cette fiche technique que tous les autres labos IA publient pour expliquer ce qu'un modèle sait et ne sait pas faire. Pas de benchmarks indépendants. Pas de tournée presse. Juste un tweet d'Elon Musk et un prix : 300 $ par mois pour le tier « SuperGrok Heavy ».
C'est 100 $ de plus que ChatGPT Pro. 50 $ de plus que Google AI Ultra. 100 $ de plus que Claude Max. L'abonnement IA grand public le plus cher du marché — et le seul qui ne dispose d'aucune preuve indépendante qu'il mérite de l'être.
Le cratère de preuves
L'écart n'est pas un écart. C'est un cratère.
Anthropic publie des system cards pour chaque version de Claude. OpenAI livre des bilans de benchmarks à chaque mise à jour de GPT. Google maintient des tableaux de bord d'évaluation publics. xAI ? Leur dernière model card date de Grok 4, publiée le 20 août 2025. Depuis — Grok 4.1, 4.20, et maintenant 4.3 — rien. Aucune évaluation tierce de LMSYS ou HuggingFace. Aucun rapport de red-team (ces audits de sécurité indépendants où des chercheurs tentent délibérément de casser le modèle). Comme TechSifted l'a noté le 17 avril, le lancement « s'est fait sans billet de blog officiel d'xAI, sans model card publiée, sans benchmarks tiers, et sans couverture par un média de premier plan ».
Ce qu'il y avait en revanche : génération native de PDF, création de slides et export en tableur — des fonctionnalités que Claude, Gemini et ChatGPT ont livrées il y a plus d'un an. Et toujours pas de mémoire persistante entre les sessions. Comme BuildFastWithAI l'a écrit le 19 avril : « À 300 $/mois, son absence est sincèrement indéfendable. »
Alors, tu paies pour quoi exactement ?
L'échelle. L'échelle pure, non vérifiée.
Le data center Colossus d'xAI tourne avec 555 000 GPU NVIDIA, plus de 700 000 actifs sur l'ensemble des runs d'entraînement. Le 8 avril, EONMSK a rapporté qu'ils entraînent sept modèles simultanément, dont deux à mille milliards de paramètres — un paramètre étant l'un des boutons de réglage à l'intérieur d'un réseau neuronal qui façonne ses réponses. Plus de paramètres peut signifier plus de capacité. Ou ça peut juste signifier des factures d'électricité plus salées. Sans benchmarks, impossible de savoir lequel.
Le timing aggrave les choses. Trois jours avant le lancement de Grok 4.3, le 14 avril, NBC News a révélé qu'Apple avait menacé en privé de retirer Grok de l'App Store en janvier à cause de deepfakes non consentis générés par le modèle. Le déficit de confiance n'est pas théorique — il est documenté, tamponné, et déposé au Congrès.
La défense (parce que l'honnêteté intellectuelle, ça existe)
Les contre-arguments méritent d'être entendus. La puissance de calcul est réelle et sans précédent. Le pricing en bêta sélectionne naturellement des enthousiastes qui acceptent le risque. Et l'intégration profonde de Grok avec X (ex-Twitter) lui donne un accès aux données sociales en temps réel qu'aucun concurrent n'égale — si tu as besoin d'analyser ce qui est tendance maintenant, Grok a un vrai avantage.
Ce sont des atouts légitimes. Mais « fais-nous confiance, on a beaucoup de GPU » n'est pas une justification d'achat. C'est du feeling.
Ce que ça signifie pour toi
Pour quiconque évalue des outils IA aujourd'hui — que tu sois développeur solo, lead technique, ou quelqu'un qui essaie de faire passer ça en note de frais — la leçon est simple : le prix ne signale pas la qualité quand la couche de preuves est absente. Un modèle que tu ne peux pas benchmarker est un modèle que tu ne peux pas budgéter. Personne au contrôle de gestion ne valide « ça a l'air vachement rapide » comme ligne budgétaire.
Deux religions du pricing
Le marché de l'IA fonctionne désormais sur deux philosophies de tarification. Basée sur les preuves : voici ses scores, voici qui l'utilise, voici ce qui a cassé. Et basée sur l'échelle : regarde comme c'est gros.
Une seule de ces deux approches survit quand le DAF demande « pourquoi on a besoin de ça ? »
xAI a choisi l'autre.



