Le Tokenmaxxing : La tendance IA surprenante que les investisseurs négligent

Par Nick Rokke, analyste senior
chez L’Investisseur Tech
- Le gaspillage est le signal
- L’utilisation des tokens s’envole
- Le paradoxe de Jevons appliqué à l’IA
- Les dépenses en IA continueront d’être des vents favorables pour les actions

Cher lecteur,
La Silicon Valley a trouvé une nouvelle façon de classer ses programmeurs.
Non pas en nombre de lignes de code ou de bugs corrigés… Mais en nombre de tokens IA brûlés. Les « tokens » sont l’unité de base de l’utilisation de l’IA.
Les grands modèles de langage traitent le texte en tokens pour comprendre une requête, raisonner sur une tâche et générer une réponse.
Plus la tâche est complexe, plus elle consomme de tokens.
Un token peut être assimilé à un mot, un signe de ponctuation, ou une partie d’un mot.
Pour s’en faire une idée simple, il faut compter environ 750 000 mots de texte pour un million de tokens.
La théorie est donc simple.
Plus l’utilisation des tokens est élevée, plus l’IA est sollicitée.
Et plus l’IA est sollicitée, plus la productivité augmente.
Cette logique a conduit certaines entreprises à créer des classements internes indiquant quels employés utilisent le plus l’IA (c’est-à-dire ceux qui consomment le plus de tokens dans leur travail).
Mais comme on pouvait s’y attendre, une compétition fondée uniquement sur la mesure de l’utilisation, ou la consommation de tokens, a engendré des comportements étranges.
Des employés lancent des agents pour exécuter des tâches redondantes, des projets personnels, voire des tâches privées sans aucun intérêt pour l’entreprise.
Ils détournent le système.
Chez Meta, des employés ont rivalisé pour décrocher des titres comme « Session Immortal » ou « Token Legend ». Sur une période de 30 jours, le premier du classement a consommé 281 milliards de tokens.
À l’échelle de l’entreprise, les employés ont utilisé 60,2 billions de tokens IA.
Aux tarifs standard d’Anthropic, cette utilisation aurait coûté environ 900 millions de dollars.
Meta bénéficie très certainement de remises sur volume.
Mais même après réductions, la facture de calcul était colossale.
Du côté d’Amazon, un ingénieur aurait déclaré que chaque fois que son chef de projet l’agace, il déverse l’intégralité de l’historique des discussions Slack dans MeshClaw d’Amazon.
Puis il lance 10 sous-agents pour passer cet historique au peigne fin et trouver des moyens de le ridiculiser.
C’est absurde, certes, mais c’est la réalité dans le secteur technologique.
La pratique consistant à utiliser le plus grand nombre de tokens possible s’appelle le « tokenmaxxing ». Et elle est en train de conquérir la Silicon Valley.
Oui, une partie est absurde, et une partie est du gaspillage.
Mais les investisseurs ne devraient pas en rire.
Le gaspillage est le signal
Chaque technologie révolutionnaire commence par des comportements qui paraissent étranges aux « experts » de l’intérieur.
Lorsqu’Alexander Graham Bell a proposé de vendre le brevet du téléphone à Western Union, le président de la société l’aurait qualifié de jouet.
En 1946, un dirigeant de la 20th Century Fox a affirmé que la télévision n’était qu’un phénomène passager, car les gens allaient « vite se lasser de fixer une caisse en contreplaqué tous les soirs ». Dans un passé bien plus récent, Internet était raillé comme « un désert de données non filtrées » et « une messagerie en ligne n’est qu’un piètre substitut à une rencontre autour d’un café entre amis ». Même si la nouvelle technologie pouvait sembler anodine, c’est la courbe d’adoption qui importait.
La même dynamique se joue avec l’IA, mais à une vitesse bien plus grande.
Le tokenmaxxing semble étrange aujourd’hui.
Mais la raison pour laquelle les entreprises le tolèrent est évidente.
Elles veulent que leurs employés utilisent l’IA, qu’ils développent des réflexes autour de l’IA, qu’ils apprennent à raisonner dans des flux de travail agentiques, et qu’ils augmentent in fine leur productivité.
Le directeur technique de Meta aurait déclaré que l’un de ses meilleurs ingénieurs dépensait l’équivalent de son salaire en tokens.
Mais cet ingénieur était 5 à 10 fois plus productif.
Sa conclusion était simple : « C’est de l’argent facile.
Continuez comme ça.
Sans limite. » C’est cet état d’esprit qui se répand dans toute la Silicon Valley.
La rapidité et l’accélération pour obtenir un avantage concurrentiel comptent bien plus que les dépenses en ce moment.
Jensen Huang, PDG de NVIDIA, a déclaré qu’il serait « profondément alarmé » si un ingénieur payé 500 000 dollars par an n’utilisait pas au moins 250 000 dollars de tokens.
Les incitations perverses sont bien réelles.
Mais le potentiel de hausse de la productivité l’est aussi.
Les dépenses se font déjà sentir.
Jon Gray, président de Blackstone, a récemment indiqué que les dépenses en LLM au sein des sociétés du portefeuille de l’entreprise avaient été multipliées par 15 au premier trimestre par rapport à la même période l’an dernier.
Uber en offre un autre exemple frappant.
Son directeur technique a déclaré que les ingénieurs avaient épuisé l’intégralité du budget IA 2026 dès le premier trimestre.
Mais cette utilisation commence à porter ses fruits.
Environ 11 % des mises à jour du code backend en production chez Uber sont désormais rédigées par des agents IA.
Ces systèmes contribuent à des fonctions essentielles telles que la mise en relation des trajets, la tarification et la correction des bugs.
Les médias regarderont des histoires comme celle-ci et n’y verront que du gaspillage.
Mais en tant qu’investisseurs, nous y voyons une croissance exponentielle de l’utilisation.
L’utilisation des tokens s’envole
Les agents IA multiplient la consommation de tokens car ils transforment une seule requête humaine en de nombreuses étapes autonomes.
Un travailleur n’a plus besoin de saisir chaque requête.
L’agent peut continuer à travailler en arrière-plan.
C’est pourquoi le tokenmaxxing est important.
C’est un avant-goût d’un changement bien plus profond dans la façon dont l’infrastructure IA sera consommée.
Depuis début 2022, le nombre de tokens traités par trimestre a été multiplié par 17 000.
Cela représente une croissance exponentielle d’un ordre de grandeur bien supérieur à la loi de Moore.

Source : Exponential View
Et à mesure que les tâches agentiques sont devenues plus utiles, le nombre de tokens utilisés a plus que doublé d’un trimestre à l’autre au T1.
Ce n’est que le début.
Un récent rapport de Goldman Sachs montre que la consommation de tokens continue de s’envoler jusqu’à la fin de la décennie.
Le graphique ci-dessus ne nous mène qu’aux lignes rouges au milieu du graphique suivant.

Même après l’explosion de l’utilisation cette année, la tendance n’en est encore qu’à ses débuts.
Cela ne devrait pas surprendre les lecteurs habituels de L’Investisseur Tech.
Nous avons répété à plusieurs reprises qu’une baisse du coût de calcul créerait un paradoxe de Jevons.
Le paradoxe de Jevons appliqué à l’IA
Le paradoxe de Jevons décrit ce qui se passe lorsqu’une ressource précieuse devient moins chère et plus facile à utiliser.
Au lieu que la consommation totale diminue, l’adoption et l’utilisation s’envolent.
Et la taille du marché adressable s’envole elle aussi.
C’est exactement ce que nous attendons avec les tokens IA.
Et cela va accélérer le développement de l’infrastructure IA.
De nombreux investisseurs croient à tort que la baisse des coûts d’inférence signifie que les entreprises dépenseront moins pour l’IA.
C’est l’inverse qui est vrai.
À mesure que les tokens deviennent moins chers, les entreprises en utiliseront davantage.
Elles feront tourner plus d’agents, automatiseront plus de flux de travail, analyseront plus de données, généreront plus de code et lanceront plus de produits basés sur l’IA.
Goldman Sachs semble partager cet avis.
Le cabinet met en avant deux forces importantes.
Premièrement, à mesure que les coûts de calcul diminuent, le coût par token plus faible permet à des agents plus complexes de fonctionner de manière rentable.
Ces agents consomment davantage de tokens.
Cela augmente l’utilisation de l’infrastructure IA et offre aux fournisseurs de meilleures perspectives économiques pour continuer à investir dans la qualité des modèles et leur distribution.
Deuxièmement, les coûts de calcul baissent plus vite que les prix facturés par token par les hyperscalers.
Cela améliore les données économiques unitaires pour les hyperscalers et les opérateurs de centres de données.
À ce stade, cela augmentera non seulement les revenus, mais aussi les marges bénéficiaires.
Et de meilleures marges permettent de dépenser encore davantage dans l’infrastructure IA.
C’est l’effet volant.
Les dépenses en IA continueront d’être des vents favorables pour les actions
De nombreux acteurs de Wall Street s’interrogent sur la question de savoir si les entreprises dépensent trop pour l’IA.
Notre réponse est non.
Elles dépensent trop peu.
Nous observons les prémices d’une courbe de demande qui est encore en train de se découvrir.
Le tokenmaxxing est l’un des premiers signes que la demande en IA est très élastique.
Donnez aux travailleurs davantage d’IA et rendez-la moins chère, et ils en utiliseront plus.
Cela ne signifie pas que chaque token créera de la valeur.
Ce ne sera pas le cas.
Il y aura du gaspillage.
Il y aura de mauvaises expériences.
Il y aura des personnes utilisant des agents pour des tâches personnelles et des jeux de classement.
Mais c’est ainsi que débute toute grande courbe d’adoption technologique.
D’abord, les gens expérimentent.
Puis ils en abusent.
Ensuite, les entreprises découvrent les flux de travail qui comptent vraiment.
Et enfin, l’adoption se généralise.
Le tokenmaxxing peut sembler ridicule aujourd’hui, mais le signal le plus important est clair.
À mesure que les tokens deviennent moins chers, leur utilisation augmentera.
À mesure que les agents s’améliorent, les flux de travail se multiplieront.
Et à mesure que les flux de travail se multiplieront, le monde aura besoin de plus de semi-conducteurs, de plus de mémoire, de plus de réseaux, de plus d’énergie et de plus de centres de données IA.
Wall Street cherche encore à déterminer si le développement de l’IA est trop important.
Nous pensons qu’il est encore trop limité.
Et pour les entreprises qui fournissent l’infrastructure derrière ce boom, les meilleurs jours sont encore à venir.
Cordialement,


