Le leader mondial des processeurs pour l’intelligence artificielle NVIDIA, a profité de l’ouverture du Consumer Electronics Show (CES) à Las Vegas pour présenter ce 5 janvier sa nouvelle plateforme baptisée Rubin. Celle-ci vise à rendre l’IA plus accessible et moins coûteuse.
« Rubin arrive au moment idéal, alors que la demande en puissance de calcul pour l’IA explose », annonce dans un communiqué Jensen Huang, PDG et fondateur de NVIDIA. La nouvelle plateforme promet des gains spectaculaires, jusqu’à 10 fois moins cher pour faire fonctionner les applications d’IA, et 4 fois moins de processeurs nécessaires pour entraîner les modèles d’IA les plus avancés. Pour comprendre l’enjeu, il faut savoir que l’entraînement et l’utilisation des intelligences artificielles comme ChatGPT ou Gemini nécessitent aujourd’hui des infrastructures colossales et extrêmement coûteuses. Rubin promet de réduire considérablement cette facture.
Six puces pour un superordinateur
La plateforme Rubin repose sur six nouvelles puces conçues pour fonctionner ensemble de manière optimale. C’est comme un orchestre où chaque instrument joue sa partition. Certaines puces s’occupent du calcul intensif, d’autres gèrent les communications ultra-rapides entre les composants, et d’autres encore assurent la sécurité des données. La puce principale, baptisée Rubin GPU, peut effectuer 50 millions de milliards d’opérations par seconde. Un système complet peut connecter 72 de ces processeurs, créant ainsi une bande passante supérieure à celle de l’ensemble d’Internet.
Avec Rubin, NVIDIA introduit une nouveauté clé pour l’IA dite « agentique » : le Inference Context Memory Storage Platform. Cette infrastructure permet de conserver et de réutiliser le contexte d’inférence — autrement dit, ce que l’IA a déjà lu, compris et calculé au fil d’une conversation ou d’un raisonnement en plusieurs étapes. Là où les systèmes précédents devaient sans cesse repartir de zéro, Rubin autorise le partage et la réutilisation des données intermédiaires entre requêtes, sessions et agents, grâce à un support matériel dédié. Concrètement, cela permet à l’IA de poursuivre une réflexion sans tout recalculer, d’enchaîner des échanges plus longs et plus cohérents, tout en réduisant les coûts, la latence et la consommation énergétique. On peut imaginer l’IA comme une bibliothèque. Jusqu’ici, à chaque nouvelle question, elle retournait chercher les mêmes livres, relisait les mêmes pages, puis refermait tout une fois la réponse donnée. Avec Rubin, elle peut désormais conserver ce qu’elle a déjà consulté, garder les livres ouverts sur la table et reprendre sa réflexion exactement là où elle s’était arrêtée.
L’annonce a suscité l’enthousiasme des plus grandes entreprises technologiques mondiales. OpenAI, Anthropic, Meta, Microsoft, Google, Amazon et Oracle ont tous confirmé leur intention d’adopter cette nouvelle génération. Rubin devrait particulièrement bénéficier aux « IA agentiques », ces intelligences artificielles capables de raisonner sur plusieurs étapes et d’accomplir des tâches complexes de manière autonome. Comme un assistant virtuel qui pourrait non seulement répondre à vos questions, mais aussi planifier vos voyages, gérer vos rendez-vous ou analyser des dossiers juridiques complets. La plateforme facilitera également la création de vidéos par IA et le traitement de conversations très longues, des applications qui nécessitent aujourd’hui une puissance de calcul prohibitive.
Une disponibilité pour la deuxième moitié de 2026
Les premiers systèmes basés sur Rubin seront disponibles dans la deuxième moitié de 2026. Microsoft prévoit de déployer ces superordinateurs dans ses « superfactories d’IA », des centres de données géants dédiés à l’intelligence artificielle. Amazon, Google et d’autres grands acteurs du cloud suivront rapidement. Cette annonce intervient dans un contexte de course mondiale à l’IA, où les entreprises investissent des milliards pour ne pas se laisser distancer. En rendant l’IA plus abordable et plus performante, NVIDIA espère accélérer son adoption dans l’économie réelle, au-delà des seules grandes entreprises technologiques.
Le nom « Rubin » rend hommage à Vera Rubin, astronome américaine pionnière dont les découvertes ont transformé notre compréhension de l’univers – un clin d’œil à l’ambition de NVIDIA de transformer notre rapport à l’intelligence artificielle.