A la recherche des fondements économiques de la bulle de l'IA

William H. Janeway

7 minutes de lecture

Si les contours d’une bulle de l’IA sont difficiles à déceler, son impact réel dépendra de sa capacité à se propager des marchés financiers à l’économie au sens large.

 

Ces dernières semaines, l’idée selon laquelle nous assistons à une «bulle de l’IA» est passée de la périphérie du débat public au courant dominant. Comme l’a dit avec justesse Katie Martin, commentatrice au Financial Times, «le discours sur la bulle est en train d’éclater partout».

Le débat est alimenté par une vague d’investissements dans les centres de données et dans les vastes infrastructures énergétiques nécessaires à la formation et au fonctionnement des grands modèles de langage (LLM) qui alimentent l’IA générative. Comme dans les bulles spéculatives précédentes, l’augmentation des volumes d’investissement alimente la montée en flèche des valorisations, qui atteignent toutes deux des sommets historiques sur les marchés publics et privés. Les «sept magnifiques» géants de la technologie – Alphabet, Amazon, Apple, Meta, Microsoft, Nvidia et Tesla – dominent le S&P 500, chacun affichant une capitalisation boursière supérieure à 1000 milliards de dollars, et Nvidia est aujourd’hui la première entreprise au monde à peser 5000 milliards de dollars.

Sur le marché privé, OpenAI aurait l ‘intention de lever 30 milliards de dollars à une valeur de 500 milliards de dollars auprès de SoftBank, l’investisseur le plus exubérant de l’ère post-2008. Cette levée de fonds intervient alors que les pertes de l’entreprise s ‘élèvent à 5 milliards de dollars en 2024, malgré un chiffre d’affaires de 3,7 milliards de dollars, et que sa consommation de trésorerie devrait s’élever à 115 milliards de dollars jusqu’en 2029.

À l’instar des cycles spéculatifs précédents, celui-ci est marqué par l’émergence de mécanismes de financement créatifs. Il y a quatre siècles, la tulipe hollandaise a donné naissance à des contrats à terme sur les bulbes de fleurs. La crise financière mondiale de 2008 a été alimentée par des produits dérivés exotiques tels que les titres synthétiques de créance garantis et les contrats d’échange sur défaut de crédit. Aujourd’hui, une dynamique similaire se manifeste dans la boucle de financement circulaire qui relie les fabricants de puces (Nvidia, AMD), les fournisseurs de services en nuage (Microsoft, CoreWeave, Oracle) et les développeurs de LLM comme OpenAI.

Si les contours d’une bulle de l’IA sont difficiles à déceler, son impact réel dépendra de sa capacité à se propager des marchés financiers à l’économie au sens large. On ne sait pas encore comment – et si – cette évolution se produira. Pratiquement chaque jour, de nouveaux projets d’infrastructure d’IA d’une valeur de plusieurs milliards de dollars sont annoncés. Dans le même temps, de plus en plus de rapports indiquent que les applications commerciales de l’IA produisent des résultats décevants, ce qui montre que le battage médiatique est peut-être bien en avance sur la réalité.

Les fantômes des bulles passées

Les bulles financières peuvent être appréhendées en fonction de leur objectif et de leur localisation. Le premier concerne ce sur quoi les investisseurs parient: Les actifs qui attirent la spéculation ont-ils le potentiel de stimuler la productivité économique lorsqu’ils sont déployés à grande échelle? Deuxièmement, cette activité se concentre-t-elle principalement sur les marchés des actions ou du crédit? C’est la spéculation financée par l’endettement qui conduit au désastre économique lorsqu’une bulle éclate inévitablement. Comme l’ont montréMoritz Schularick et Alan M. Taylor, les bulles alimentées par l’effet de levier ont déclenché des crises financières à plusieurs reprises au cours des quinze dernières années.

La bulle du crédit de 2004-2007, qui s’est concentrée sur l’immobilier et a culminé avec la crise financière mondiale de 2008-2009, en est un bon exemple. Elle n’offrait aucune promesse d’augmentation de la productivité et, lorsqu’elle a éclaté, les conséquences économiques ont été terribles, incitant à une souscription publique sans précédent de pertes privées, principalement par la Réserve fédérale américaine.

Si, jusqu’à présent, une grande partie des investissements a été réalisée grâce aux vastes réserves de liquidités et aux flux de trésorerie continus des grandes entreprises technologiques, des signes d’effet de levier commencent à se manifester. 

En revanche, la bulle technologique de la fin des années 1990 s’est concentrée sur la construction de l’infrastructure physique et logique de l’internet à l’échelle mondiale, accompagnée d’une première vague d’expériences dans les applications commerciales. Au cours de cette période, la spéculation s’est principalement concentrée sur les marchés publics d’actions, avec quelques retombées sur le marché des obligations de pacotille négociables, et l’effet de levier global est resté limité. Lorsque la bulle a éclaté, les dommages économiques qui en ont résulté ont été relativement modestes et ont été facilement contenus par la politique monétaire conventionnelle.

L’histoire du capitalisme moderne a été définie par une succession de «bulles productives» de ce type. Des chemins de fer à l’électrification en passant par l’internet, des vagues de spéculation financière ont à plusieurs reprises mobilisé de vastes quantités de capitaux pour financer des technologies potentiellement transformatrices dont les rendements ne pouvaient être connus à l’avance.

Dans chacun de ces cas, les entreprises qui avaient construit l’infrastructure de base ont fait faillite. Le financement spéculatif leur avait permis de construire des années avant que les essais et les erreurs ne débouchent sur des applications économiquement productives. Pourtant, personne n’a détruit les voies ferrées, démantelé les réseaux électriques ou déterré les câbles souterrains de fibre optique. L’infrastructure est restée en place, prête à soutenir la création de la «nouvelle économie» imaginée, même si ce n’est qu’avec un retard douloureux et, dans une large mesure, avec de nouveaux acteurs à la barre. L’expérimentation nécessaire pour découvrir les «killer applications» rendues possibles par ces «General Purpose Technologies» prend du temps. Ceux qui attendent des LLM une gratification instantanée risquent d’être déçus.

Par exemple, alors que la construction du premier chemin de fer aux États-Unis a commencé en 1828, la vente au détail par correspondance, l’application qui tue en l’occurrence, a commencé avec la fondation de Montgomery Ward en 1872. Dix ans plus tard, Thomas Edison a inauguré l’ère de l’électricité en allumant la centrale électrique de Pearl Street, mais la révolution de la productivité dans l’industrie manufacturière provoquée par l’électrification n’a eu lieu que dans les années 1930. De même, il a fallu une génération pour passer du moteur à combustion interne Otto, inventé en 1876, au modèle T d’Henry Ford en 1908, et du circuit intégré de Jack Kilby (1958) au PC IBM (1981). La première démonstration du proto-internet a eu lieu en 1972: Amazon et Google ont été fondés respectivement en 1994 et 1998.

Où se situe la bulle de l’IA dans ce spectre? Si, jusqu’à présent, une grande partie des investissements a été réalisée grâce aux vastes réserves de liquidités et aux flux de trésorerie continus des grandes entreprises technologiques, des signes d’effet de levier commencent à se manifester. Par exemple, Oracle, qui est entré tardivement dans la course, compense ses liquidités relativement limitées par une dette d’environ 38 milliards de dollars.

Et ce n’est peut-être qu’un début. OpenAI a annoncé son intention d’investir au moins 1000 milliards de dollars au cours des cinq prochaines années. Étant donné que des dépenses de cette ampleur nécessiteront inévitablement des emprunts à grande échelle, les LLM disposent d’une fenêtre étroite pour prouver leur valeur économique et justifier des niveaux d’investissement aussi extraordinaires.

Les premières études ont donné des raisons d’être optimistes. Les recherches menées par Erik Brynjolfsson, de Stanford, et Danielle Li et Lindsey Raymond, du MIT, sur l’introduction de l’IA générative dans les centres de service à la clientèle, ont montré que l’assistance de l’IA augmentait la productivité des travailleurs de 15%. Les gains les plus importants ont été enregistrés chez les employés les moins expérimentés, dont la productivité a augmenté de plus de 30%.

Brynjolfsson et ses coauteurs ont également observé que les employés qui suivaient les recommandations de l’IA devenaient plus efficaces au fil du temps, et que l’exposition aux outils de l’IA entraînait des améliorations durables des compétences. En outre, les clients ont traité les agents assistés par l’IA de manière plus positive, en se montrant plus satisfaits et en demandant moins souvent à parler à un superviseur.

Le tableau d’ensemble semble toutefois moins encourageant. Une étude récente du projet NANDA du MIT a révélé que 95% des projets pilotes d’IA générative du secteur privé échouent. Bien que moins rigoureuse que l’étude de Brynjolfsson évaluée par des pairs, l’enquête suggère que la plupart des expériences d’IA générative menées par les entreprises n’ont pas répondu aux attentes. Les chercheurs ont attribué ces échecs à un «déficit d’apprentissage» entre les quelques entreprises qui ont obtenu l’aide d’experts pour adapter les applications aux besoins pratiques de l’entreprise – principalement les tâches administratives d’arrière-guichet – et celles qui ont essayé de développer des systèmes internes pour les fonctions tournées vers l’extérieur, telles que les ventes et le marketing. 

Les limites de l’IA générative

Le principal défi auquel sont confrontés les utilisateurs de l’IA générative découle de la nature même de la technologie. De par leur conception, les systèmes d’IA générative transforment leurs données d’apprentissage – textes, images et discours – en vecteurs numériques qui, à leur tour, sont analysés pour prédire le prochain élément: syllabe, pixel ou son. Comme il s’agit essentiellement de moteurs de prédiction probabilistes, ils commettent inévitablement des erreurs aléatoires.

En début d’année, le regretté Brian Cantwell Smith, ancien scientifique en chef du légendaire centre de recherche de Xerox à Palo Alto, a succinctement décrit le problème. Henry Thompson, professeur à l’université d’Édimbourg, m’a cité les propos de Smith: «Il n’est pas bon que le [ChatGPT] dise des choses erronées, mais ce qui est vraiment, irrémédiablement mauvais, c’est qu’il n’a aucune idée qu’il existe un monde à propos duquel il se trompe».

Il en résulte inévitablement différentes sortes d’erreurs, dont les plus préjudiciables sont les «hallucinations», c’est-à-dire des affirmations qui semblent plausibles mais qui décrivent des choses qui n’existent pas en réalité. C’est là que le contexte devient critique: dans les entreprises, la tolérance à l’erreur est déjà faible et s’approche de zéro lorsque les enjeux sont élevés.

La génération de code en est un excellent exemple. Les logiciels utilisés dans des environnements financièrement ou opérationnellement sensibles doivent être rigoureusement testés, édités et débogués. Un programmeur junior équipé d’une IA générative peut produire du code à une vitesse remarquable. Mais ce code doit toujours être examiné attentivement par des ingénieurs chevronnés. Comme le suggèrent de nombreuses anecdotes circulant en ligne, tout gain de productivité réalisé en amont peut disparaître une fois que les ressources nécessaires aux tests et à la supervision sont prises en compte. Jonathan Last , de The Bulwark, l’a bien expliqué: 

«L’IA est comme la production de machines chinoises. Elle peut produire de bons résultats à un prix incroyablement bas (mesuré ici en coût de temps humain). Cela signifie que l’IA - telle qu’elle existe aujourd’hui - est un outil utile, mais uniquement pour les tâches qui ont une grande tolérance aux erreurs... si je demande à ChatGPT de faire des recherches sur un sujet pour moi, que j’intègre ces recherches dans un article que je suis en train de rédiger et que le résultat n’est correct qu’à 90%, alors nous avons un problème. Parce que mon produit écrit a une faible tolérance aux erreurs».

Dans son nouveau livre The Measure of Progress, l’économiste Diane Coyle, de l’université de Cambridge, souligne un autre problème majeur: l’opacité de l’IA. «Lorsqu’il s’agit de l’IA, écrit-elle récemment, certains des faits les plus élémentaires sont absents ou incomplets. Par exemple, combien d’entreprises utilisent l’IA générative, et dans quels secteurs? À quelles fins l’utilisent-elles? Comment les outils d’IA sont-ils appliqués dans des domaines tels que le marketing, la logistique ou le service à la clientèle? Quelles entreprises déploient des agents d’IA et qui les utilise réellement?»

L’inévitable bilan

Cela nous amène à la question centrale: Quel est le potentiel de création de valeur des LLM? Leur appétit insatiable pour la puissance de calcul et l’électricité, ainsi que leur dépendance à l’égard d’une surveillance et d’une correction d’erreurs coûteuses, rendent la rentabilité incertaine. Les entreprises clientes génèreront-elles suffisamment de revenus rentables pour justifier l’investissement requis dans l’infrastructure et le soutien humain? Et si plusieurs LLM fonctionnent à peu près au même niveau, leurs résultats deviendront-ils des produits de base, réduisant la production de jetons à une activité à faible marge? 

Des chemins de fer à l’électrification en passant par les plateformes numériques, un investissement initial massif a toujours été nécessaire pour fournir la première unité de service, tandis que le coût marginal de chaque unité supplémentaire diminuait rapidement, tombant souvent en dessous du coût moyen nécessaire pour récupérer l’investissement initial. Dans des conditions de concurrence, les prix tendent à graviter vers le coût marginal, laissant tous les concurrents opérer à perte. Il en résulte, à maintes reprises, des monopoles réglementés, des cartels ou d’autres «conspirations visant à restreindre le commerce», pour reprendre les termes de la loi antitrust Sherman.

Il existe deux alternatives distinctes au déploiement de LLM au niveau de l’entreprise. La première consiste à développer de petits modèles linguistiques, c’est-à-dire des systèmes formés sur des ensembles de données soigneusement sélectionnés pour des tâches spécifiques et bien définies. Les grandes institutions, telles que JPMorgan ou les agences gouvernementales, pourraient créer leurs propres applications verticales, adaptées à leurs besoins, réduisant ainsi le risque d’hallucinations et les coûts de contrôle.

L’autre alternative est le marché des consommateurs, où les fournisseurs d’IA sont en concurrence avec les plateformes de médias sociaux établies pour attirer l’attention et les recettes publicitaires. Dans ce domaine, où la valeur est souvent mesurée en termes de divertissement et d’engagement, tout est permis. ChatGPT compterait 800 millions d’»utilisateurs actifs hebdomadaires «, soit deux fois plus qu’en février. OpenAI semble prête à suivre avec un navigateur web augmenté de LLM, ChatGPT Atlas.

Toutefois, étant donné que les navigateurs de Google et d’Apple sont gratuits et intègrent déjà des assistants d’intelligence artificielle, il n’est pas certain qu’OpenAI puisse maintenir un modèle de revenu viable par abonnement ou par paiement au jeton qui justifie ses investissements massifs. Selon diverses estimations, seuls 11 millions d’utilisateurs - soit environ 1,5% du total - paient actuellement pour le ChatGPT sous quelque forme que ce soit. Les LLM axés sur le consommateur pourraient donc être condamnés à faire des offres pour obtenir des revenus publicitaires sur un marché déjà mature.

Il est impossible de prédire l’issue de cette course de chevaux. Les LLM finiront-ils par générer un flux de trésorerie positif et par couvrir les coûts énergétiques liés à leur exploitation à grande échelle? Ou bien l’industrie de l’IA, encore naissante, se fragmentera-t-elle en une mosaïque de fournisseurs spécialisés et de niche, tandis que les plus grandes entreprises rivaliseront avec les plates-formes de médias sociaux établies, y compris celles détenues par leurs investisseurs? Lorsque les marchés reconnaîtront que le secteur se fragmente plutôt qu’il ne se consolide, la bulle de l’IA sera terminée. 

Paradoxalement, un bilan plus précoce pourrait profiter à l’ensemble de l’écosystème, même s’il serait douloureux pour ceux qui ont acheté au plus fort de la crise. Un tel dégonflement pourrait empêcher de nombreux projets ambitieux de centres de données de devenir des actifs échoués, à l’instar des voies ferrées inutilisées et des fibres noires laissées par les bulles précédentes. En termes financiers, cela permettrait également d’éviter une vague d’emprunts à haut risque qui pourrait déboucher sur une nouvelle bulle à effet de levier et un nouveau krach. 
Le plus probable est qu’une bulle véritablement productive n’émergera que des années après que la frénésie spéculative d’aujourd’hui se sera calmée. Comme l’indique clairement le cycle de Hype de Gartner, un «creux de désillusion» précède le «plateau de productivité». Le timing n’est peut-être pas la clé de la vie, mais il l’est tout à fait pour les rendements des investissements. 

 

Project Syndicate, 2025.

www.project-syndicate.org

A lire aussi...