Les investissements dans l’IA générative explosent, mais la demande reste à la traîne. Emplacements isolés, financement risqué : certains y voient les signes d’une nouvelle bulle spéculative. En particulier pour les datacenters.
Ce printemps, McKinsey a établi une prévision des dépenses d’investissement en puces, centres de données et énergie pour produire de l’intelligence artificielle (IA). 5 200 milliards de dollars dans le monde au cours des cinq prochaines années. Moins de six mois plus tard, le cabinet de conseil envisage d’augmenter cette estimation. Les investissements dans les infrastructures d’IA générative atteignent des sommets vertigineux.
Accords gigantesques
Ces dépenses, mises en évidence par les accords gigantesques concernant des centres de données que des entreprises comme OpenAI, Nvidia et Oracle ont annoncés, visent à augmenter la puissance de calcul qui serait nécessaire pour fournir l’IA générative. Mais la demande ne correspond pas encore à la hype. Bien que l’utilisation de chatbots par les consommateurs augmente, McKinsey a découvert que le taux de réussite des projets pilotes d’IA dans les entreprises qu’il a interrogées est inférieur à 15 %, déclare Pankaj Sachdeva, associé chez le cabinet.
La force de la demande d’IA générative est peut-être le facteur le plus important pour déterminer si cette frénésie d’infrastructures se terminera ou non par un effondrement. Mais, trois nouveaux aspects augmentent l’incertitude. Les emplacements isolés des centres de données, les entreprises non publiques qui les financent et la faible qualité de crédit de certains emprunteurs. Ce triptyque rappelle à certains sceptiques le dernier grand désastre en matière d’infrastructures. La frénésie télécom de la fin des années 1990.
No man’s land
La géographie est la nouveauté la plus tangible. Les nouveaux centres de données IA apparaissent en pleine nature, dans des no man’s land, plutôt que dans des clusters établis proches de la demande et des hubs d’interconnexion. OpenAI et ses partenaires, Oracle et SoftBank, ont commencé la première phase de Stargate. Un projet d’infrastructure IA de 500 milliards de dollars, dans une partie du centre du Texas disposant de beaucoup d’énergie éolienne et solaire, et d’espace. Le Dakota du Nord et le Nouveau-Mexique présentent des avantages similaires.
Les nouveaux emplacements résolvent un problème énergétique. De nombreux clusters n’ont pas assez d’énergie pour entraîner les derniers grands modèles de langage (LLM) développés notamment par OpenAI. Mais l’isolement introduit des risques pour les investisseurs immobiliers qui pourraient ne pas être suffisamment reflétés dans le rendement, déclare Gautam Bhandari de la société de capital-investissement I Squared Capital.
Les centres de données sont généralement financés sur des dizaines d’années, mais les centres de données pour l’IA peuvent devenir obsolètes beaucoup plus rapidement, dit-il. Nvidia, le producteur dominant de puces graphiques (GPU) liées à l’IA, améliore constamment l’efficacité de ses puces, ce qui oblige à mettre à niveau régulièrement les centres de données.
Défaut de paiement
Les sources de financement sont également relativement nouvelles. Jusqu’à récemment, les principaux fournisseurs de capitaux pour les centres de données situés dans des emplacements de premier choix étaient les investisseurs boursiers, via des sociétés d’investissement immobilier cotées (REIT). Ils se sentaient le plus à l’aise lorsque la consommation électrique d’un centre de données était bien inférieure à 100 mégawatts. Mais à l’ère de l’IA, les besoins énergétiques se mesurent en gigawatts (GW). Les coûts peuvent atteindre 50 milliards de dollars par GW.
Alors que la demande de capitaux a explosé, les REIT sont limitées par leur propre capacité d’emprunt, déclare David Guarino du cabinet de recherche Green Street. Leur place est occupée par de grands prêteurs privés et des fonds souverains, aux côtés des banques traditionnelles. Ce sont des prêteurs sophistiqués disposant de beaucoup de capitaux, habitués à ce type de financement de projets. Mais leur participation déplace le risque des marchés actions vers les marchés de la dette. Cela expose davantage le système bancaire en cas d’augmentation des défauts de paiement.
Solvabilité douteuse
Le risque de défaut de paiement est accru par la solvabilité douteuse de certaines entreprises qui sont à la base de la frénésie de construction de centres de données. Ce n’était pas un gros problème lorsque des géants du cloud aux poches profondes, comme Amazon, Microsoft et Google, recevaient une grande partie du financement. Mais plus récemment, des laboratoires d’IA comme OpenAI et des entreprises « néocloud » qui louent des GPU se sont lancés dans la bataille. Ils ont augmenté le nombre d’acteurs impliqués, mais diminué la qualité du crédit.
« Pendant la frénésie télécom, des câbles étaient posés sans qu’il y ait de clients. Aujourd’hui, les centres de données ne sont construits que si des contreparties signent des contrats »
Non seulement les prêteurs s’inquiètent de ces nouveaux venus. Les entreprises de services publics, naturellement conservatrices, hésiteront également à deux fois avant de conclure des contrats énergétiques à long terme avec eux. « Vous ne savez pas lesquels de ces acteurs seront encore là dans cinq, dix ou quinze ans », déclare Sachdeva. En réponse, dit-il, des assurances sont conçues pour limiter les risques. Des géants technologiques comme Nvidia interviennent également avec un réseau de crédits fournisseurs (un accord par lequel le vendeur fournit un financement à l’acheteur pour acheter un produit ou un service) et d’investissements croisés qui peuvent rassurer les contreparties. Mais si le pire se produit, cette consanguinité augmentera la vulnérabilité de l’écosystème de l’IA.
Vers une bulle ?
De telles interconnexions alimentent la crainte qu’une bulle d’infrastructures soit en train de se former, comparable au déploiement de la fibre optique et des câbles sous-marins aux débuts d’Internet. L’historien Andrew Odlyzko de l’Université du Minnesota voit des parallèles avec la frénésie d’investissement de la fin des années 1990, qui a culminé avec le krach des dotcom. Des accords comme l’investissement potentiel de 100 milliards de dollars de Nvidia dans OpenAI s’il achète jusqu’à 10 GW de GPU, lui rappellent les arrangements de crédits fournisseurs de l’entreprise technologique Nortel avec les acheteurs de son équipement pendant la bulle télécom.
Mais d’autres soulignent les différences. Nick Del Deo du cabinet de recherche MoffettNathanson affirme que pendant la frénésie télécom, des câbles étaient posés sans qu’il y ait de clients. Aujourd’hui, les centres de données ne sont construits que si des contreparties signent des contrats, bien que les détails des contrats soient décisifs.
Pour l’instant, les récompenses potentielles sont si alléchantes que l’argent afflue, dit-il. Les enthousiastes, comme Sam Altman d’OpenAI, affirment que les risques de construire trop peu sont au moins aussi graves que ceux de construire trop, en raison du potentiel économique à long terme de l’IA générative. Il se peut que même s’il y a un excédent de capacité dans les centres de données les plus avancés, celui-ci puisse être absorbé en faisant fonctionner les LLM au lieu de les entraîner, déclare Sachdeva. Mais cela nous ramène à la question de savoir quand la demande de chatbots et d’applications d’IA générative suivra le rythme des ambitions de ceux qui les fournissent.
Source: The Economist