La prochaine superpuce IA d'AMD : Instinct MI500 avec CDNA 6
AMD a dévoilé les premières informations concernant sa nouvelle génération de GPU pour centres de données, la série Instinct MI500, basée sur une nouvelle architecture CDNA 6 et compatible avec la future mémoire HBM4E. Ces GPU, attendus aux alentours de 2027, représentent une avancée majeure par rapport aux accélérateurs Instinct MI300X actuels.
Bien que ces puces ne soient pas des GPU pour le jeu, elles restent extrêmement pertinentes pour les passionnés de PC et de cartes graphiques. Les mêmes principes fondamentaux qui sous-tendent les performances des centres de données se retrouvent souvent dans les cartes graphiques grand public, et elles illustrent l'évolution de la technologie GPU en termes d'architecture, de conception de la mémoire et de puissance de calcul brute.
L'affirmation principale d'AMD est frappante : des performances jusqu'à 1 000 fois supérieures à celles de l'actuelle Instinct MI300X. Ce chiffre repose probablement sur des charges de travail spécifiques à l'IA ou aux centres de données plutôt que sur les performances brutes des shaders que l'on observe dans un benchmark de jeu, mais il témoigne tout de même d'un bond générationnel considérable.
Qu'est-ce que CDNA 6 et pourquoi est-ce important ?
CDNA est l'architecture GPU d'AMD axée sur le calcul, conçue spécifiquement pour les centres de données, le calcul haute performance et l'intelligence artificielle. Contrairement à RDNA, qui équipe les cartes graphiques Radeon, CDNA abandonne la logique graphique traditionnelle pour se concentrer exclusivement sur le calcul, l'accélération de l'IA et la communication à haut débit entre les puces.
CDNA 6 succède à CDNA 3, utilisé dans la gamme Instinct MI300. Avec CDNA 6, AMD cible :
- Des gains considérables dans les performances d'entraînement et d'inférence de l'IA
- Meilleure efficacité énergétique par watt pour les clusters de calcul à grande échelle
- Intégration plus étroite avec mémoire à large bande passante
- Amélioration de la mise à l'échelle sur plusieurs GPU fonctionnant de concert
Pour les passionnés de matériel informatique, le principal enseignement est que la puissance de calcul des GPU progresse à un rythme effréné. Des fonctionnalités telles que des interconnexions plus rapides, une planification plus intelligente et des accélérateurs de tenseurs ou de matrices améliorés dans l'architecture CDNA influencent souvent les choix de conception et les capacités qui se retrouvent ensuite dans les GPU grand public. À mesure que l'IA et les charges de travail de calcul se généralisent sur les ordinateurs de bureau, ces architectures de centres de données façonnent les possibilités offertes par l'informatique domestique.
Mémoire HBM4E et pourquoi la bande passante est reine
La série Instinct MI500 sera équipée de mémoire HBM4E, la prochaine grande avancée en matière de mémoire à large bande passante. La mémoire HBM est empilée verticalement sur le processeur graphique, à proximité du GPU, ce qui lui confère une bande passante bien supérieure et une consommation d'énergie réduite par rapport à la mémoire GDDR standard utilisée sur les cartes graphiques de jeu.
La technologie HBM4E devrait améliorer les générations précédentes en offrant :
- Bande passante mémoire beaucoup plus élevée pour alimenter des milliers d'unités de calcul
- Une meilleure efficacité énergétique, essentielle dans les centres de données de grande envergure.
- Une capacité accrue par pile, essentielle pour les modèles d'IA de grande taille.
Les modèles d'IA massifs et les charges de travail scientifiques sont souvent limités non pas par la puissance de calcul brute, mais par la vitesse de transfert des données vers et depuis le GPU. La technologie HBM4E vise à éliminer ce goulot d'étranglement. Pour les joueurs et les assembleurs de PC, cette évolution de la mémoire donne un aperçu des perspectives d'avenir de la mémoire graphique. Bien que la HBM soit actuellement trop coûteuse et complexe pour la plupart des GPU grand public, les enseignements tirés de la HBM4E pourraient inspirer les futures générations de mémoire haute bande passante pour le jeu ou des solutions hybrides.
Que signifie réellement une affirmation de performance multipliée par 1000 ?
L'affirmation d'AMD concernant des performances jusqu'à 1 000 fois supérieures à celles de l'Instinct MI300X est audacieuse. En pratique, de tels chiffres reposent généralement sur des charges de travail très spécifiques, combinant souvent des gains architecturaux, des améliorations de la finesse de gravure, des optimisations logicielles et une mise à l'échelle sur de nombreux accélérateurs au sein d'un cluster.
Au lieu de considérer cela comme un simple bond de 1000 fois en termes de puissance brute du GPU, il est plus logique de le voir comme :
- Amélioration architecturale majeure entre CDNA 3 et CDNA 6
- Augmentation significative de la bande passante et de la capacité de la mémoire grâce à HBM4E
- Amélioration des interconnexions entre les GPU et les CPU
- Des piles logicielles plus matures, optimisées pour l'IA et le HPC.
Même si le gain réel pour une seule puce est bien inférieur à 1000 fois, la tendance générale est claire : les GPU pour centres de données évoluent à grande échelle et le matériel axé sur l’IA devient le principal champ de bataille pour le leadership en matière de performances.
Pour les passionnés, cela signifie que le monde des GPU est fortement influencé par l'IA et les besoins en calcul. Cette pression tend à faire progresser les technologies de gravure, d'encapsulation et de mémoire, ce qui profite ensuite aux GPU haut de gamme pour le jeu. Des fonctionnalités telles que la conception à chiplets, le refroidissement avancé et une gestion de l'énergie plus intelligente dans les accélérateurs d'IA peuvent par la suite se retrouver dans les cartes graphiques pour PC de bureau.
Pourquoi les passionnés de PC et de jeux vidéo devraient s'en soucier
Bien que la série Instinct MI500 soit destinée aux serveurs et aux supercalculateurs, elle fait toujours partie du même écosystème GPU qui alimente les ordinateurs de jeu.
- Innovation architecturale : les techniques créées pour CDNA 6 peuvent influencer les futures conceptions RDNA pour les jeux, notamment en ce qui concerne les effets nécessitant une puissance de calcul importante et la mise à l’échelle par IA.
- Technologie de mémoire : les progrès réalisés dans le domaine de la mémoire HBM4E pourraient inspirer de nouvelles normes ou de nouveaux conditionnements pour les futurs GPU de jeu, permettant de gérer des résolutions plus élevées et des mondes plus complexes.
- Logiciels et IA : alors que l’accélération de l’IA devient la norme sur les GPU des centres de données, les GPU grand public bénéficient également de plus en plus de matériel dédié à l’IA pour des fonctionnalités telles que la mise à l’échelle de type DLSS, la génération d’images et les charges de travail avancées des créateurs.
L'annonce de l'Instinct MI500 indique clairement qu'AMD entend maintenir une stratégie offensive dans le domaine du calcul haute performance et de l'IA. C'est une excellente nouvelle pour les assembleurs de PC et les joueurs. Une forte concurrence sur le segment haut de gamme stimule souvent les progrès sur l'ensemble de la gamme GPU, des accélérateurs professionnels aux cartes graphiques destinées aux jeux.
Article et image originaux : https://www.tomshardware.com/tech-industry/artificial-intelligence/amd-unwraps-instinct-mi500-boasting-1-000x-more-performance-versus-mi300x-setting-the-stage-for-the-era-of-yottaflops-data-centers
