Lorsque quatre entreprises dépensent 600 à 700 milliards de dollars en capital, soit l'équivalent du PIB d'un pays comme la Suisse, pour l'infrastructure, elles ne se contentent pas de construire des centres de données - elles brisent les chaînes d'approvisionnement mondiales. Dans un monde où les composants avancés sont rares et où les courbes de prix sont devenues verticales, les entreprises sont confrontées à un choix cornélien : s'accrocher à des architectures puristes conçues pour l'abondance des composants d'hier, ou concevoir pour la flexibilité dans un marché défini par la contrainte.
Une réorganisation silencieuse de l'économie mondiale est en cours, et elle ne se produit pas dans les champs de pétrole ou sur les routes maritimes. Elle se produit dans les fabriques de semi-conducteurs, les usines de disques et les sites de construction de centres de données à grande échelle.
Source: Comprendre l'IA, "16 graphiques expliquant le boom de l'IA" (2025)
Pour comprendre ce qui se passe, commençons par une simple comparaison. Les dépenses d'investissement combinées d'Amazon, de Microsoft, de Google et d'Oracle atteignent aujourd'hui des niveaux comparables au produit intérieur brut annuel de la Suède. Et contrairement au PIB, qui fluctue en fonction des cycles économiques, les dépenses d'investissement des hyperscalers devraient augmenter régulièrement jusqu'à la fin de la décennie.
Source: Comprendre l'IA, "16 graphiques expliquant le boom de l'IA" (2025)
Il ne s'agit pas d'un phénomène abstrait. Il remodèle le marché du matériel informatique en temps réel.
Les hyperscalers absorbent, dans certains milieux, entre 60 et 80 % de la production mondiale de DRAM et de NVMe. Lorsqu'une telle demande est concentrée entre les mains de quatre acheteurs, les chaînes d'approvisionnement ne s'ajustent pas en douceur. Elles se déforment. Les prix augmentent. Les délais s'allongent. Les petits acheteurs se retrouvent en queue de peloton.
Les entreprises clientes sont confrontées à une situation qu'elles n'avaient pas connue depuis les pénuries dues à la pandémie : Les commandes passées de bonne foi sont réévaluées des semaines plus tard. Les délais de livraison de six à neuf mois deviennent monnaie courante. Les fournisseurs de systèmes font de leur mieux pour préserver la neutralité de leurs marges alors que les coûts de leurs composants grimpent en flèche.
Source: Comprendre l'IA, "16 graphiques expliquant le boom de l'IA" (2025)
Il y a six mois, un cluster de disques hybrides de 100 pétaoctets dans notre portefeuille coûtait environ 4,8 millions de dollars. Une architecture flash hybride de 100 pétaoctets, combinant TLC et QLC, coûtait environ 10 millions de dollars. À l'époque, il me semblait intuitif que les architectures flash hybrides dépasseraient en quelques années la densité des disques et s'approcheraient de la parité économique. La feuille de route des semi-conducteurs et la loi de Moore allaient dans ce sens.
C'est alors que le boom de l'IA s'est produit.
Aujourd'hui, cette même grappe de disques hybrides de 100 pétaoctets coûte environ 6 millions de dollars, soit une augmentation de 25 %. L'équivalent en flash hybride coûte environ 39 millions de dollars, soit près de quatre fois son prix d'il y a six mois. Les données économiques n'ont pas convergé progressivement. Ils se sont violemment retournés.
Pourquoi ? Parce que les usines de fabrication de semi-conducteurs ont besoin de plusieurs années pour être construites et mises en service. La fabrication de disques durs, en revanche, est historiquement dimensionnée et optimisée pour le stockage en vrac à grande échelle depuis plus d'une décennie. Depuis le début des années 2010, les hyperscalers consomment d'énormes volumes de disques durs pour les magasins d'objets en nuage. La chaîne d'approvisionnement des disques durs est mature, amortie et prévisible - et même elle est confrontée à une pression importante.
NVMe et les flashs empilés avancés n'ont toutefois pas été consommés historiquement en quantités hyperscale jusqu'à ce que le développement de modèles d'IA dans le nuage commence à exiger une densité et un débit extraordinaires. L'écosystème des semi-conducteurs a été pris au dépourvu. La courbe de la demande était verticale. La courbe de l'offre était fixe.
Il en résulte une asymétrie temporaire, mais puissante.
Les coûts des hyperscalers vont-ils augmenter ? Historiquement, non. Les plus grands fournisseurs d'informatique en nuage opèrent dans le cadre d'accords d'approvisionnement à long terme, bloquant souvent l'approvisionnement des années à l'avance. Ils négocient à une échelle qu'aucune entreprise ne peut égaler. En fait, la hausse des prix des composants sur site pourrait renforcer leur position concurrentielle. À mesure que le matériel d'entreprise devient plus cher et imprévisible, la stabilité relative des prix de l'informatique dématérialisée devient plus attrayante. Bien qu'il soit peu probable qu'il s'agisse d'un mouvement coordonné, les effets de second ordre sont des crises existentielles pour les néo-Clouds qui n'ont pas l'échelle d'approvisionnement d'un hyperscaler ou même d'un grand OEM de systèmes et pour les fournisseurs qui ont établi des obligations contractuelles autour de la tarification et de la disponibilité de NVMe à l'avance.
Pour les hyperscalers, il s'agit d'un cercle vertueux. Leur échelle réduit le coût marginal de l'informatique et du stockage. Leurs dépenses resserrent l'offre ailleurs. Ce resserrement rend leurs services plus attrayants sur le plan comparatif.
Pour les fournisseurs d'infrastructures sur site et les services informatiques des entreprises, il peut s'agir d'un cercle vicieux.
C'est précisément le moment où la discipline architecturale est plus importante que jamais.
Le marché des données d'entreprise en périphérie, au cœur de l'entreprise et dans le nuage reste fragmenté entre les baies scale-up héritées, les appliances NAS scale-out, les vendeurs de flashs ponctuels et les services de fichiers verrouillés dans le nuage. Nombre de ces systèmes ont été conçus pour un monde où les prix des composants étaient relativement stables et les cycles de rafraîchissement prévisibles. Ce monde a changé.
En période de volatilité, la flexibilité est une stratégie.
Chez Qumulo, nous avons conçu notre plateforme de données autour de l'option matérielle. Nous prenons en charge les disques hybrides denses, les flashs hybrides et les configurations NVMe pures. Nous fonctionnons sur des serveurs x86 standard et dans tous les principaux clouds publics. Ce n'était pas un choix marketing. Il s'agissait d'une couverture de la chaîne d'approvisionnement.
Lorsque les prix de la flash augmentent, les clients peuvent passer à un disque dur dense sans sacrifier les performances. Lorsque le prix de la mémoire flash se normalise, ils peuvent se rééquilibrer vers des niveaux de performance plus élevés. Grâce à notre architecture Stratus et à la Cloud Data Fabric, les données peuvent être transférées dans le nuage pour accélérer le calcul ou exploiter les magasins d'objets hyperscaler en tant que niveau de sauvegarde rentable, sans avoir à replatformer les applications.
Il convient de souligner une vérité contre-intuitive : les plus grands magasins d'objets en nuage du monde sont principalement construits sur des disques durs. Le modèle d'objets à grande échelle repose sur l'économie des disques depuis plus d'une décennie. L'écosystème des disques durs n'est pas nouveau. Il a fait ses preuves et est capable d'absorber l'hyperéchelle mieux que des technologies plus naissantes.
Aujourd'hui, la véritable dislocation se situe au niveau de la technologie flash avancée.
Parallèlement, la compression, l'optimisation de l'écriture basée sur les objets et la mise en cache prédictive de la lecture, qui offre une précision constante de 92 à 95 %, permettent aux architectures de disques hybrides d'atteindre des performances qui rivalisent ou dépassent celles des baies tout-flash de la concurrence pour de nombreuses charges de travail d'entreprise. Lorsque la mémoire flash se raréfie, l'intelligence devient le substitut.
C'est la leçon centrale.
Sur les marchés technologiques, nous supposons traditionnellement que c'est la physique qui détermine les courbes de coûts. En réalité, c'est l'économie qui le fait. Lorsqu'une poignée d'entreprises commandent des centaines de milliards de dépenses en capital, elles remodèlent non seulement leur propre infrastructure, mais aussi l'environnement tarifaire de tous les autres.
L'industrie des semi-conducteurs réagira. De nouvelles usines seront mises en service. L'offre se normalisera, peut-être dans 24 à 36 mois, peut-être plus longtemps. Mais dans l'intervalle, les entreprises doivent fonctionner dans le monde tel qu'il est, et non tel qu'il a été prévu.
Dans un tel environnement, il existe deux stratégies durables.
Tout d'abord, il convient d'élaborer une architecture pour la portabilité. Les systèmes qui ne fonctionnent que sur du matériel propriétaire ou dans un seul nuage hériteront de la volatilité des prix de ce substrat. Les systèmes qui font abstraction du matériel et fonctionnent dans des environnements périphériques, centraux et multi-cloud préservent l'effet de levier des négociations.
Deuxièmement, donner la priorité à l'efficacité plutôt qu'aux performances brutes. Lorsque les composants sont rares, l'intelligence logicielle, la mise en cache prédictive, la compression et la conception d'espaces de noms unifiés créent une résilience économique.
Les périodes de choc de l'offre récompensent les entreprises qui ont investi dans l'option architecturale avant qu'elle ne soit à la mode.
Le boom de l'IA a créé des opportunités extraordinaires. Il a également mis en évidence la fragilité de chaînes d'approvisionnement que beaucoup considéraient comme infinies. Les grandes entreprises jouent un jeu à long terme, et elles le jouent bien. Mais les entreprises ne sont pas dépourvues d'agence.
Les gagnants des cinq prochaines années ne seront pas simplement ceux qui achètent le plus de matériel. Ils seront ceux qui concevront des systèmes qui resteront rationnels alors que les marchés du matériel ne le seront pas.