La compétition dans l’IA se déplace progressivement de la seule puissance d’entraînement vers l’optimisation de l’inférence. Avec l’essor des modèles dits « raisonneurs », la réduction de la latence devient un enjeu critique pour l’adoption à grande échelle. C’est dans ce contexte de transformation profonde des infrastructures qu’OpenAI opère un choix stratégique majeur, susceptible de rebattre les cartes au sein de l’écosystème IA.
Dans une manœuvre stratégique majeure pour s'émanciper de la dépendance exclusive à Nvidia, OpenAI a signé un accord de 10 milliards de dollars avec Cerebras Systems. Ce contrat vise à acquérir jusqu'à 750 mégawatts de puissance de calcul sur trois ans, spécifiquement dédiés à l'accélération des tâches d'inférence pour ses modèles d'IA.

Capacité massive : L'accord sécurise 750 mégawatts de capacité de calcul jusqu'en 2028, Cerebras construisant ou louant des data centers dédiés équipés de ses puces "Wafer-Scale Engine".
Focus inférence : Contrairement aux GPU H100 de Nvidia souvent utilisés pour l'entraînement, cette infrastructure est optimisée pour l'inférence des modèles de raisonnement (type o1/o3), réduisant drastiquement le temps de "réflexion" avant réponse.
Impact financier : Avec une valorisation de plus de 10 milliards de dollars, ce partenariat est vital pour Cerebras en vue de sa seconde tentative d'introduction en bourse (IPO) prévue au deuxième trimestre 2026.
Ce qu’il faut retenir : Ce deal marque un tournant : nous passons de la guerre de l'entraînement à la guerre de l'inférence. En diversifiant sa supply chain hardware, OpenAI réduit les risques liés à la pénurie de GPU Nvidia et valide une architecture alternative (Cerebras) capable de traiter les requêtes complexes plus efficacement. C'est un signal fort que l'avenir de l'IA générative repose sur la vitesse d'exécution autant que sur la qualité du modèle.
🛰️ Le radar du Big Data
AWS annonce l’AWS European Sovereign Cloud, opéré et gouverné en Europe pour répondre aux exigences de souveraineté et de conformité (notamment autour du CLOUD Act). Objectif : rassurer administrations et secteurs régulés, avec un premier site en Allemagne et un investissement annoncé de 7,8 Md€.
Talen Energy annonce l’acquisition d’actifs de production gaz (2,6 GW) pour capter la demande électrique tirée par les data centers et l’IA, notamment dans la zone PJM. Le mouvement illustre la contrainte clé de 2026 : l’IA n’est plus limitée par les puces, mais par les watts.

