Qu'est-ce que NVIDIA DSX Air et pourquoi est-ce important ?
NVIDIA révolutionne la conception et l'exploitation d'infrastructures d'IA à grande échelle grâce à sa plateforme NVIDIA DSX Air. Présentée lors de la GTC 2026 à San Jose, DSX Air s'inscrit dans la plateforme DSX, le plan directeur de NVIDIA pour les usines à IA.
Imaginez une usine à IA comme un immense centre de données spécialisé, conçu pour entraîner et exécuter des modèles d'IA à grande échelle. Ces environnements regorgent de GPU, de réseaux haut débit, de solutions de stockage, de systèmes de sécurité et d'outils d'orchestration. La mise en place de l'ensemble de ces éléments peut prendre des semaines, voire des mois.
DSX Air révolutionne le secteur en proposant une plateforme SaaS permettant de simuler logiquement une usine d'IA complète avant même l'installation du moindre serveur physique. Elle permet aux entreprises de construire un jumeau numérique haute fidélité de leur infrastructure, incluant :
- GPU, SuperNIC et DPU
- Commutateurs et réseaux avancés
- Plateformes de stockage et routage
- Piles de sécurité
- Outils d'orchestration et de planification
En effectuant l'intégration et le dépannage en simulation, les entreprises peuvent réduire considérablement le délai de mise en service de leur premier jeton, passant de plusieurs semaines ou mois à quelques jours, voire quelques heures. Pour les entreprises qui s'efforcent de déployer rapidement de nouvelles capacités d'IA, il s'agit d'un changement majeur dans la planification et le déploiement de leur infrastructure.
Comment DSX Air alimente un écosystème d'usine d'IA
NVIDIA a conçu DSX Air non seulement pour les utilisateurs finaux, mais aussi pour l'ensemble de l'écosystème qui conçoit et prend en charge les usines d'IA. Les fournisseurs de serveurs, les plateformes d'orchestration, les fournisseurs de stockage et les entreprises de sécurité peuvent tous se connecter au même environnement simulé et valider la compatibilité de leurs solutions à grande échelle.
Les fabricants de serveurs peuvent modéliser des architectures de référence spécifiques à chaque client sans avoir à construire d'immenses laboratoires physiques. Étant donné que les configurations d'IA d'entreprise suivent rarement une conception unique et fixe, les fournisseurs peuvent utiliser DSX Air pour créer des jumeaux numériques personnalisés pour chaque client, optimiser leurs piles logicielles et fournir des conceptions validées sans intervention sur le matériel.
Les fournisseurs de solutions d'orchestration en profitent également. Lors de la GTC, NVIDIA a présenté un environnement serveur RTX PRO multi-locataire fonctionnant intégralement au sein de DSX Air. Dans cette démonstration :
- Netris a fourni l'orchestration du réseau
- Rafay s'est chargé de l'orchestration de l'hôte
- Allocation GPU optimisée NVIDIA Run:ai
Tout cela s'est déroulé en simulation, permettant aux partenaires de tester des flux de travail complexes dans des conditions réalistes sans avoir à construire de clusters physiques.
Les plateformes de stockage et de données peuvent offrir des possibilités similaires. Sur le stand GTC, NVIDIA a présenté une charge de travail de génération augmentée pour la recherche vidéo, exécutée sur le système d'exploitation VAST AI au sein de DSX Air. L'environnement comprenait un cluster VAST entièrement simulé, des nœuds DataEngine et une interface de recherche et de résumé vidéo. Les déclencheurs et fonctions DataEngine traitaient et indexaient la vidéo via un pipeline de bout en bout, démontrant ainsi comment concevoir et valider virtuellement des applications d'IA réelles avant le déploiement de l'infrastructure.
Les fournisseurs de solutions de sécurité, qui doivent généralement faire face à des exigences de validation parmi les plus élevées, peuvent également tester les politiques multi-locataires, l'isolation accélérée par DPU et la détection des menaces dans DSX Air. Une démonstration, par exemple, mettait en scène le pare-feu distribué de Check Point exécuté sur des DPU BlueField simulées, TrendAI Vision One pour la détection des menaces et Keysight Cyperf générant un trafic réaliste. Cette configuration permet aux équipes de sécurité de découvrir les vulnérabilités et d'affiner les politiques dans le jumeau numérique du client bien avant tout déploiement en production.
Dans tous ces cas d'utilisation, les partenaires soulignent le même avantage : DSX Air leur offre une solution évolutive et économique pour valider leurs solutions avec l'infrastructure NVIDIA et entre elles, au sein d'un environnement partagé.
Des mois aux jours : un nouveau modèle opérationnel pour les usines d’IA
DSX Air ne se contente pas d'accélérer le déploiement initial. Il introduit un nouveau modèle de cycle de vie pour le fonctionnement et l'évolution des usines d'IA au fil du temps.
Dans un premier temps, les entreprises construisent intégralement leur environnement de production prévu dans un environnement de simulation. Elles reproduisent la configuration prévue pour le réseau, le calcul, le stockage, la sécurité, l'orchestration et la planification. Cette configuration virtuelle permet aux équipes de vérifier le bon fonctionnement de l'ensemble du système, de détecter rapidement les problèmes et de confirmer les performances attendues.
Ensuite, ils passent au déploiement physique avec une plus grande confiance. L'environnement ayant déjà été testé en détail, les chances d'une mise en service sans accroc sont bien plus élevées. Au lieu de passer leurs premières semaines à corriger des bugs d'intégration, les équipes peuvent se concentrer sur l'exécution de charges de travail réelles. Le délai d'obtention du premier jeton est considérablement réduit.
Une fois le système physique opérationnel, DSX Air continue d'apporter de la valeur ajoutée. Il devient un environnement de test permanent pour la gestion du changement, où les équipes peuvent :
- Tester les mises à jour des pilotes, des microprogrammes et des logiciels
- Répéter les fenêtres de maintenance
- Valider les nouvelles politiques ou les modifications d'architecture
- Prévoir l'impact sur les performances et la fiabilité
Ce n'est qu'après validation des modifications dans l'environnement simulé qu'elles sont appliquées à la production, ce qui permet de maximiser la disponibilité et de maintenir les services d'IA critiques opérationnels.
Cette approche basée sur la simulation est déjà utilisée par des fournisseurs de services. Siam.AI, le plus important fournisseur de cloud IA en Thaïlande, utilise DSX Air pour accélérer ses déploiements. En appliquant les bonnes pratiques NVIDIA par la simulation, ils ont atteint une disponibilité opérationnelle dès le premier jour et validé leur architecture avant même la réception du matériel.
Hydra Host en est un autre exemple. Cette entreprise développe Brokkr, un système d'exploitation dédié à l'IA pour le provisionnement de GPU dédiés, prenant en charge des dizaines de déploiements de GPU à travers le monde. Grâce à DSX Air, Hydra Host peut simuler des environnements complets et valider les flux de travail d'automatisation et d'orchestration de Brokkr sur différentes configurations réseau et matérielles, à grande échelle. Cela lui permet de déployer plus rapidement une infrastructure testée tout en protégeant les systèmes en production, alors que la demande mondiale en capacité d'IA ne cesse de croître.
À mesure que les plateformes d'IA se développent et se complexifient, la capacité à valider l'ensemble des environnements avant leur déploiement influencera fortement la rapidité d'innovation. NVIDIA DSX Air ambitionne de constituer la pierre angulaire de ce processus, offrant aux entreprises un accès plus rapide à leur premier jeton et une méthode plus sûre et plus prévisible pour exploiter une infrastructure d'IA haute performance sur le long terme.
Article et image originaux : https://blogs.nvidia.com/blog/dsx-air-simulation-ai-factories/