Ignorer et passer au contenu
Comment les nouvelles puces d'IA pourraient enfin rendre les GPU de jeu plus abordables.

Comment les nouvelles puces d'IA pourraient enfin rendre les GPU de jeu plus abordables.

Une nouvelle puce d'IA bouleverse la donne.

La course au matériel dédié à l'IA est dominée depuis des années par Nvidia, notamment grâce à ses GPU puissants et onéreux spécialisés dans l'IA. Mais la donne pourrait bientôt changer. Une start-up chinoise et Google misent toutes deux sur un nouveau type de processeur pour les tâches d'IA, et leur succès pourrait à terme profiter aux joueurs PC.

Ces nouvelles puces sont appelées unités de traitement tensoriel (TPU). Il s'agit d'un type d'ASIC (circuit intégré spécifique à une application). Contrairement aux GPU généralistes capables de gérer une grande variété de charges de travail, les ASIC sont conçus dès le départ pour exécuter avec une grande efficacité un ensemble restreint de tâches.

Nous avons déjà vu cette histoire. Aux débuts du minage de bitcoins, on utilisait des GPU classiques. Puis sont apparus les ASIC dédiés au minage, nettement plus rapides et efficaces, qui ont supplanté les GPU sur ce marché. Une transition similaire pourrait aujourd'hui s'amorcer dans le monde de l'IA.

La puce TPU chinoise qui surpasse la Nvidia A100 en termes d'efficacité

La start-up chinoise Zhonghao Xinying affirme avoir créé une nouvelle puce d'intelligence artificielle, baptisée Ghana, capable de surpasser le GPU A100 de Nvidia (2020) sur des points clés. Selon l'entreprise, la puce Ghana offre des performances environ 1,5 fois supérieures à celles de l'A100 tout en réduisant la consommation d'énergie de 75 %.

Ce qui rend cette puce particulièrement intéressante, c'est qu'elle serait fabriquée selon les informations disponibles, à l'aide d'une technologie de production chinoise plus ancienne. Les procédés de fabrication chinois sont généralement en retard par rapport aux technologies de pointe utilisées par TSMC, Intel et Samsung. Sur le papier, cette puce ne devrait donc pas pouvoir rivaliser avec les GPU haut de gamme modernes. Pourtant, grâce à sa spécialisation poussée pour les charges de travail d'IA, comme les opérations tensorielles, elle parvient à atteindre des performances impressionnantes par watt.

La palme des performances brutes revient toujours aux derniers GPU IA de Nvidia basés sur l'architecture Blackwell, et non à l'A100. Cependant, les entreprises spécialisées en IA accordent une importance capitale à deux aspects :

  • Quel niveau de performance obtiennent-ils par dollar dépensé ?
  • Quel niveau de performance obtiennent-ils par watt de puissance ?

Si un ASIC spécialisé comme Ghana est beaucoup moins cher à produire et bien plus économe en énergie, il devient très intéressant pour les immenses clusters d'IA où les coûts d'électricité et de matériel sont énormes.

Il y a un hic. La transition depuis Nvidia n'est pas simple. L'écosystème de l'IA repose en grande partie sur le matériel Nvidia, CUDA et ses logiciels. Modèles, outils et flux de travail sont tous optimisés pour les GPU Nvidia. Migrer vers une nouvelle plateforme implique de réécrire et d'optimiser le code, de former à nouveau les équipes et de gérer les problèmes de compatibilité. C'est une opération délicate à court terme.

Cependant, Nvidia facturant apparemment entre 45 000 et 50 000 dollars pour chaque GPU B200 haut de gamme, de nombreuses entreprises sont incitées à rechercher des alternatives permettant de réduire les coûts à long terme.

Les TPU de Google et la course au-delà de Nvidia

À l'autre bout du monde, Google conçoit ses propres TPU depuis 2017 pour ses centres de données. Ces puces, également des processeurs ASIC, sont destinées aux charges de travail d'IA telles que l'entraînement et l'exécution de modèles complexes.

Google envisagerait désormais de vendre directement ses TPU plutôt que de se contenter d'en louer l'accès via ses services cloud. Selon certaines sources, Google serait en pourparlers avec plusieurs clients importants, notamment Meta, dans le cadre d'un potentiel accord de plusieurs milliards de dollars. Google viserait ainsi environ 10 % du chiffre d'affaires de Nvidia dans le domaine de l'IA en incitant davantage d'entreprises à adopter sa plateforme TPU.

Les TPU de Google sont plus spécialisés et probablement plus économes en énergie que de nombreux GPU IA généralistes de Nvidia. Si des acteurs majeurs comme Meta commencent à les utiliser à grande échelle, cela pourrait indiquer clairement que le marché est prêt à se diversifier et à s'affranchir du monopole matériel de Nvidia.

Cependant, tout comme pour la puce chinoise Ghana, l'adoption n'est pas chose aisée. Les entreprises ont besoin d'outils, de bibliothèques et d'assistance. Google devra convaincre ses clients que l'investissement dans des TPU (Treque TPU) est justifié par rapport à l'achat continu de GPU Nvidia.

Pourquoi les joueurs PC devraient s'en soucier

À première vue, cela pourrait ressembler à une querelle propre au secteur des centres de données, sans aucun rapport avec les PC de jeu. Pourtant, un lien important existe et pourrait influencer le prix de votre prochaine carte graphique.

Actuellement, les mêmes capacités de production de pointe utilisées pour fabriquer les GPU haut de gamme destinés aux jeux vidéo sont également largement mobilisées pour la fabrication des GPU dédiés à l'IA. La forte demande en matériel d'IA a fait grimper les prix et tendu l'offre. Les GPU pour jeux vidéo coûtent plus cher car ils utilisent les mêmes procédés de fabrication et les mêmes lignes de production que les GPU pour centres de données.

Si les charges de travail d'IA migrent des GPU généralistes vers des ASIC et des TPU spécialisés, la donne pourrait changer. Voici ce qui pourrait se produire à terme :

  • La demande de puces GPU de dernière génération diminue dans les centres de données.
  • Augmentation des capacités de production disponibles pour les GPU destinés aux jeux vidéo.
  • Pression réduite sur les prix des cartes graphiques grand public.

Autrement dit, si les puces d'IA basées sur des ASIC s'emparent d'une part importante du marché de l'IA, la dynamique de l'offre et de la demande de GPU pourrait évoluer en faveur des joueurs. Ce n'est pas garanti, et cela ne se fera pas du jour au lendemain, mais c'est une éventualité réaliste.

Un autre effet secondaire est possible. Si Nvidia fait face à une concurrence accrue dans le domaine de l'IA, notamment de la part de Google, des startups chinoises et d'autres acteurs, l'entreprise pourrait recommencer à accorder plus d'importance à son activité gaming. Depuis des années, la conception et le marketing des GPU sont de plus en plus dictés par les besoins en IA et en centres de données, au détriment des performances et du rapport qualité-prix pour le jeu. Un mix de revenus plus équilibré pourrait inciter Nvidia à investir davantage dans les fonctionnalités gaming, les prix et la disponibilité de ses produits.

Pour l'instant, ces puces ASIC dédiées à l'IA sont surtout le fruit d'une lutte acharnée entre géants de la tech pour l'avenir de l'intelligence artificielle. Mais si elles parviennent à leurs fins, les joueurs PC pourraient enfin constater une baisse des prix des cartes graphiques et un regain d'intérêt pour le jeu vidéo.

Article et image originaux : https://www.pcgamer.com/hardware/graphics-cards/could-a-new-generation-of-dedicated-ai-chips-burst-nvidias-bubble-and-do-for-ai-gpus-what-asics-did-for-crypto-mining/

Panier 0

Votre carte est actuellement vide.

Commencer à magasiner