NVIDIA Blackwell établit de nouveaux standards en matière de performan

La nouvelle plateforme Blackwell de NVIDIA a obtenu les meilleurs résultats dans les derniers benchmarks InferenceMAX v1, prouvant ainsi qu'elle est un leader en matière de performances et d'efficacité énergétique pour les systèmes d'intelligence artificielle (IA).

Alors, qu'est-ce qui rend cette nouvelle digne d'intérêt ? InferenceMAX v1 est un test de référence indépendant qui évalue le coût réel de l'exécution de différents modèles d'IA dans des situations réelles. NVIDIA Blackwell a pris la tête dans toutes les catégories importantes, démontrant qu'il offre plus de puissance tout en consommant moins d'énergie et à moindre coût que les autres options.

Le système GB200 NVL72 de NVIDIA est particulièrement impressionnant. Une entreprise qui dépense 5 millions de dollars pour ce système pourrait générer 75 millions de dollars de revenus en exécutant des modèles d'IA, ce qui représente un retour sur investissement 15 fois supérieur. De plus, les puces Blackwell B200 permettent désormais d'exécuter les tâches beaucoup plus rapidement et efficacement, réduisant les coûts à seulement deux cents pour un million de jetons d'IA, soit cinq fois moins cher qu'avant.

Les performances se mesurent aussi à la vitesse. Le GPU NVIDIA B200 peut traiter jusqu'à 60 000 jetons IA par seconde sur certaines tâches. Pour les utilisateurs, cela pourrait signifier recevoir 1 000 jetons par seconde, rendant les chatbots et les assistants IA plus réactifs que jamais. Ces avancées sont le fruit des mises à jour logicielles continues de NVIDIA et de ses partenariats avec la communauté open source pour assurer un fonctionnement fluide et rapide de l'ensemble.

Mais pourquoi ces résultats sont-ils importants pour les débutants ou les entreprises ? L’IA moderne sert à bien plus que répondre à des questions. Elle permet désormais un raisonnement complexe et gère davantage d’étapes dans chaque tâche, exigeant beaucoup plus des systèmes informatiques. Grâce aux améliorations apportées par Blackwell, les entreprises peuvent déployer l’IA plus rapidement, à plus grande échelle et obtenir un meilleur rapport qualité-prix.

Derrière ces réussites se cachent des fonctionnalités de pointe. L'architecture Blackwell utilise un nouveau format pour stocker les nombres efficacement sans sacrifier la précision. Plusieurs GPU peuvent être interconnectés pour fonctionner comme un cerveau géant et puissant. Des logiciels comme NVIDIA TensorRT LLM augmentent encore la vitesse en prédisant plus d'informations à la fois, ce qui signifie moins d'attente pour les utilisateurs.

Un autre détail important est l'efficacité énergétique. Pour les entreprises exploitant de grandes usines d'IA, économiser l'énergie signifie économiser de l'argent et faire plus avec la même quantité d'énergie. Blackwell offre dix fois plus de résultats par unité d'énergie par rapport aux systèmes précédents, ce qui le rend beaucoup plus durable.

Globalement, NVIDIA Blackwell prouve qu'avec un matériel et des logiciels intelligents fonctionnant de concert, l'IA peut être à la fois rapide et rentable. Cela ouvre la voie à un plus grand nombre d'entreprises pour utiliser l'IA dans leurs opérations en temps réel, transformant les données en informations et en décisions précieuses. Des benchmarks ouverts comme InferenceMAX aident chacun à voir quels systèmes sont réellement performants, guidant ainsi des investissements plus judicieux dans le monde en pleine expansion de l'intelligence artificielle.

Article et image originaux : https://blogs.nvidia.com/blog/blackwell-inferencemax-benchmark-results/