GitHub Copilot bascule en facturation au token le 1ᵉʳ juin. Anthropic et OpenAI ont déjà fait le même mouvement sur leurs offres entreprise. Le CTO d’Uber a brûlé son budget IA 2026 en quelques mois et reconnaît publiquement être « retourné à la planche à dessin ». Un cadre de Nvidia explique que pour son équipe, le compute coûte plus cher que les humains qu’il était censé remplacer.
Trois ans durant, les utilisateurs de Claude, ChatGPT, Copilot et Cursor ont brûlé entre 8 et 13 dollars de tokens pour chaque dollar d’abonnement. Personne ne le voyait, donc personne ne le mesurait.
Cette opacité a façonné nos usages. Un outil qui semble gratuit, on l’utilise sans considération. On laisse tourner un agent en boucle sur un prompt mal posé. On empile trois, quatre, cinq agents en parallèle, et au-delà de trois la productivité auto-déclarée chute.
Pendant ce temps, le paradoxe de Solow refait surface. Six mille dirigeants interrogés dans quatre pays : neuf sur dix disent que l’IA n’a eu aucun impact mesurable sur leur productivité ni leurs effectifs depuis trois ans. On voit l’âge de l’IA partout, sauf dans les chiffres de productivité.
C’était prévisible. Quand la matière première est invisible, on n’en fait rien de sérieux.
Vitesse n’est pas valeur
L’erreur de raisonnement est ancienne. Nous avons importé dans l’économie de l’information un mode de pensée hérité de l’industrie : produire plus vite la même chose. La logique des chaînes de montage. Elle ne tient plus dans une économie déjà saturée de slides, de notes, de tableaux de bord, de propositions commerciales que personne ne lit jusqu’au bout.
Dans ce contexte, gagner du temps ne crée pas de valeur. Souvent, ça en détruit, parce que les destinataires saturent et que rien ne se décide.
L’IA crée de la valeur seulement quand elle renforce la capacité de discernement. Pas quand elle accélère uniquement l’exécution.
Ce que ça change concrètement
Une journée de Claude Code coûte 30 dollars en moyenne, 100 sur les usages lourds. Une équipe de dix développeurs qui code en boucle dans un IDE pour voir ce qui sort, ça représente 75 000 à 250 000 euros par an. Personne ne signait pour ça il y a un an. Tout le monde va devoir signer pour ça l’année prochaine, ou décider que non.
Décider que non, c’est revenir à des questions simples qu’on s’épargnait tant que c’était gratuit (ou trop largement subventionné). Sur quel travail précis on lâche un agent. Avec quels garde-fous ? Pour quel résultat attendu, mesuré comment, par qui ? Ces questions ne sont pas nouvelles. Elles étaient celles qu’on posait avant de lancer un projet. On les avait juste mises de côté parce que l’expérimentation ne coûtait rien.
Ça change aussi la manière de fabriquer. Quand le compute commence d’être facturé à sa vraie valeur à chaque appel, on cesse de tout faire passer par le même modèle haut de gamme.
On confie les tâches simples à des modèles plus petits, on garde les modèles puissants pour les moments où ils font la différence, on coupe quand l’agent boucle. Et en utilise d’autres techniques d’IA plus adpatées.
Ce qui passait pour de la coquetterie technique devient une question de marge. Et pendant qu’on y est, on découvre l’utilité de ne pas dépendre d’un seul fournisseur. Anthropic a relevé ses tarifs en mars, Microsoft vient de faire pareil. Les organisations qui avaient construit toute leur chaîne sur un seul modèle comprennent comment le piège se referme en lisant leur facture.
Cultiver, pas extraire
Il ne s’agit pas de freiner l’IA. Il s’agit d’en raisonner l’usage. Et de l’orienter vers ce que l’IA ne fera pas spontanément : faire grandir le savoir-faire des organisations et des personnes qui s’en servent.
Sans ça, l’usage débridé fait exploser la facturation et paupérise nos entreprises. On injecte de la pression dans le sol pour en extraire ce qu’il reste. Trimestre après trimestre, il faut injecter davantage pour obtenir le même rendement, parce qu’on a abîmé le terrain à force de creuser. Et le terrain, dans une organisation, ce sont les savoir-faire des équipes. Ce qu’elles seules savent faire. Ce qu’elles transmettent aux nouveaux.
L’addition se présente alors deux fois. Une première fois sur la note de cloud, qui fait uniquement monter. Une seconde fois, plus tardivement, dans la dépendance acquise et dans les savoir-faire qu’on aura laissés filer parce que l’outil semblait les rendre superflus.
Notre conviction à La Forge tient en une phrase : démultiplier les savoir-faire par l’IA pour rendre les individus meilleurs dans ce qu’ils font. Cultiver, pas fracturer.


Laisser un commentaire