Ignorer et passer au contenu
Microsoft Azure lance un puissant nouveau cluster de superordinateurs NVIDIA pour OpenAI

Microsoft Azure lance un puissant nouveau cluster de superordinateurs NVIDIA pour OpenAI

Microsoft Azure vient de lancer une nouvelle série de machines virtuelles appelée NDv6 GB300. Ces machines virtuelles utilisent le premier cluster de production de superordinateurs NVIDIA GB300 NVL72, spécialement conçus pour gérer certaines des tâches d'intelligence artificielle les plus avancées d'OpenAI.

Ce nouveau supercalculateur est extrêmement puissant. Il regroupe plus de quatre mille six cents unités de traitement graphique (GPU) NVIDIA Blackwell Ultra, interconnectées grâce à la technologie réseau avancée Quantum X800 InfiniBand de NVIDIA. Microsoft a mis en œuvre une ingénierie innovante, tant au niveau de la mémoire que du réseau, pour doter ce système de la puissance de calcul massive nécessaire à l'entraînement et à l'exécution de modèles d'IA volumineux et complexes.

Le cœur de cette technologie est le système NVIDIA GB300 NVL72. Chaque rack utilise un système de refroidissement liquide pour assurer un fonctionnement efficace et comprend soixante-douze GPU NVIDIA Blackwell Ultra ainsi que trente-six CPU NVIDIA Grace. Chaque machine virtuelle peut accéder à une quantité énorme de mémoire rapide et dispose de suffisamment de puissance pour gérer certaines des tâches d'IA les plus avancées en matière de raisonnement et de génération.

La technologie de NVIDIA permet à ces GPU de fonctionner ensemble comme une seule unité, offrant un grand espace de mémoire partagée. Ceci est essentiel pour exécuter des modèles d'IA très volumineux. Le système prend en charge une communication rapide entre les GPU et utilise les derniers logiciels et formats d'entraînement, tels que NVFP4, pour des performances efficaces. Dans les tests comparatifs récents, cette configuration a atteint des vitesses de traitement record pour les modèles d'IA massifs, par rapport aux GPU NVIDIA précédents.

Pour connecter des milliers de GPU en un seul supercalculateur, Azure utilise un système de réseau intelligent à deux niveaux. À l'intérieur de chaque rack, le commutateur NVIDIA NVLink crée des connexions rapides permettant aux 72 GPU de partager rapidement la mémoire et les données. Sur l'ensemble du cluster, le NVIDIA Quantum X800 connecte tous les racks entre eux afin qu'ils fonctionnent comme un supercalculateur unifié. Cela garantit une communication rapide et fiable entre les 4 608 GPU.

La construction de ce cluster puissant a nécessité pour Microsoft de repenser chaque aspect de ses centres de données, y compris le refroidissement, l'alimentation et les logiciels. Ce nouveau jalon signifie que Microsoft Azure est prêt à gérer les projets d'IA les plus importants et les plus exigeants, ouvrant la voie à l'innovation future de sociétés comme OpenAI. Alors que Microsoft continue d'étendre l'utilisation de ses GPU NVIDIA, on peut s'attendre à des avancées encore plus importantes en matière d'intelligence artificielle.

Article et image originaux : https://blogs.nvidia.com/blog/microsoft-azure-worlds-first-gb300-nvl72-supercomputing-cluster-openai/

Panier 0

Votre carte est actuellement vide.

Commencer à magasiner