Ignorer et passer au contenu
Feuille de route des NPU Ascend de Huawei : Superclusters d'IA massifs et transition au-delà de la mise à l'échelle des puces

Feuille de route des NPU Ascend de Huawei : Superclusters d'IA massifs et transition au-delà de la mise à l'échelle des puces

Le grand pari de Huawei sur le matériel d'IA

Huawei a dévoilé une feuille de route ambitieuse pour sa gamme d'unités de traitement neuronal Ascend. Ces puces sont conçues spécifiquement pour les charges de travail d'intelligence artificielle et l'entreprise prévoit de les déployer à grande échelle, bien au-delà des processeurs individuels, pour créer d'immenses systèmes SuperCluster.

La feuille de route met en avant trois processeurs Ascend à venir : les 950, 960 et 970. Si les spécifications techniques précises sont encore en cours d'élaboration, la direction est claire. Huawei abandonne la simple miniaturisation et l'accélération de chaque puce pour se concentrer sur la construction de vastes systèmes distribués composés d'un grand nombre de ces NPU.

Cette stratégie est particulièrement importante pour Huawei en raison des sanctions américaines en vigueur et des restrictions imposées à la fabrication de semi-conducteurs de pointe. L'accès aux technologies de fabrication les plus récentes étant difficile, Huawei mise sur la mise à l'échelle au niveau système pour rester compétitif en matière de performances de calcul pour l'IA.

Des puces plus rapides aux systèmes plus grands

Pendant des années, la principale méthode pour améliorer les performances informatiques était simple : miniaturiser les puces, augmenter le nombre de transistors, accroître l’efficacité et la fréquence d’horloge, et ainsi obtenir de meilleures performances d’un seul processeur. Cette approche se complexifie d’année en année, et pour Huawei, elle est encore plus contraignante en raison des interdictions d’exportation et des restrictions sur les équipements.

Au lieu de renoncer aux performances brutes, Huawei adopte la stratégie des géants de l'IA : concevoir des architectures qui connectent un grand nombre de processeurs en clusters gigantesques fonctionnant comme un unique et immense accélérateur. Cette approche est similaire, dans son concept, à celle employée par Nvidia, AMD et d'autres entreprises de centres de données avec les clusters de GPU, mais elle repose ici sur les NPU Ascend de Huawei.

Le chiffre principal est impressionnant. D'ici 2028 environ, Huawei ambitionne de proposer des superclusters Ascend capables d'atteindre une performance de 4 zettaFLOPS en FP4. Les FLOPS (opérations en virgule flottante par seconde) sont une unité de mesure courante des performances de calcul pour l'IA et les charges de travail scientifiques. Le format FP4, un format à virgule flottante quatre bits de très faible précision, est de plus en plus utilisé dans l'entraînement et l'inférence en IA moderne, car il est extrêmement efficace pour les grands modèles de langage et autres réseaux neuronaux, notamment grâce à des techniques de quantification intelligentes.

Bien que le FP4 ne soit pas directement comparable au calcul traditionnel 32 ou 64 bits, l'échelle zetta illustre l'ambition de Huawei. Un zettaFLOP correspond à 10 puissance 21 opérations de puissance par seconde. Parler de plusieurs zettaFLOPS place ces SuperClusters au même niveau de performance que les centres de données d'IA les plus avancés au monde, du moins sur le papier.

Ascendez les niveaux 950, 960 et 970 dans les superclusters massifs

La feuille de route laisse entrevoir une progression à travers les générations Ascend 950, 960 et 970, chacune apportant vraisemblablement une efficacité accrue, une bande passante d'interconnexion plus large et des fonctionnalités axées sur l'IA. Même si la technologie de gravure utilisée n'est pas aussi avancée que celle des GPU occidentaux les plus récents, Huawei entend compenser par une production à grande échelle et une conception système intelligente.

Les superclusters devraient regrouper plus d'un million de processeurs individuels. Concrètement, cela signifie :

  • Un très grand nombre de puces Ascend fonctionnant en parallèle
  • Des interconnexions à haut débit pour assurer un flux de données efficace
  • Piles logicielles capables de répartir les charges de travail d'IA sur plusieurs NPU
  • Infrastructure de centre de données conçue spécifiquement pour le refroidissement et l'alimentation électrique de ces baies de calcul à haute densité.

Pour les développeurs d'IA au sein de l'écosystème Huawei, cela pourrait se traduire par des plateformes d'entraînement et d'inférence à grande échelle, capables de rivaliser avec les clouds basés sur GPU. L'entreprise commercialise déjà le matériel Ascend pour les datacenters, les services cloud d'IA et les solutions d'entreprise ; ces superclusters seront donc vraisemblablement au cœur des datacenters exploités par Huawei ou ses partenaires.

Il y a aussi un aspect stratégique. Face aux restrictions imposées par les États-Unis sur l'accès aux GPU de pointe et aux technologies de fabrication, Huawei doit développer sa propre stratégie pour accéder au calcul haute performance en intelligence artificielle. Les NPU Ascend et leurs SuperClusters constituent un pilier central de cette stratégie.

Ce que cela signifie pour le monde plus vaste de la technologie et du jeu vidéo

Pour les joueurs PC et les passionnés de matériel informatique, il existe quelques aspects intéressants, même si les NPU d'Ascend sont principalement destinés aux centres de données plutôt qu'aux PC grand public.

  • Concurrence dans le domaine de l'IA pour les centres de données : Nvidia domine actuellement le calcul IA grâce à ses plateformes GPU. L'offensive de Huawei avec Ascend renforce la concurrence sur le marché des accélérateurs pour centres de données, notamment dans les régions où Huawei est fortement implanté.
  • Tendance à la miniaturisation au niveau système : le passage de la miniaturisation au niveau de la puce à celle au niveau système reflète ce que l’on observe dans les jeux et l’informatique modernes. Les configurations multi-GPU, les architectures à chiplets pour les CPU et les GPU, ainsi que le jeu en nuage distribué, reposent tous sur l’interconnexion de plusieurs composants en silicium plutôt que sur la simple recherche de nœuds de gravure plus fins.
  • Services cloud et fonctionnalités d'IA : si Huawei parvient à construire de grands superclusters Ascend, les plateformes cloud alimentées par ces NPU pourraient offrir des services d'IA ayant un impact indirect sur les jeux et les logiciels PC, tels que des outils graphiques améliorés par l'IA, la génération de contenu ou une IA de jeu plus intelligente.

Tout cela se déroule sous la pression des contrôles à l'exportation et des contraintes de production. Huawei ne peut pas se contenter d'acheter les GPU les plus récents ou les équipements de lithographie ultraviolette extrême de pointe. L'entreprise mise donc sur l'innovation architecturale, les formats de calcul IA à faible précision comme le FP4 et le déploiement massif sur un million de processeurs pour atteindre des performances exceptionnelles.

D’ici 2028, nous verrons si cette stratégie a porté ses fruits. Si Huawei parvient à concrétiser sa feuille de route Ascend 950, 960 et 970 en matériel réel et en véritables superclusters fonctionnant à l’échelle zetta avec des performances FP4, le paysage concurrentiel des centres de données d’IA et des plateformes cloud sera profondément transformé, ce qui aura des répercussions sur l’ensemble du secteur technologique, y compris sur les écosystèmes dont les joueurs et les utilisateurs de PC ont besoin au quotidien.

Article et image originaux : https://www.tomshardware.com/tech-industry/artificial-intelligence/huawei-ascend-npu-roadmap-examined-company-targets-4-zettaflops-fp4-performance-by-2028-amid-manufacturing-constraints

Panier 0

Votre carte est actuellement vide.

Commencer à magasiner