Accueil Articles Comment nourrir le tsunami informatique généré par l'intelligence artificielle, l'apprentissage...

Comment alimenter le tsunami informatique généré par l'intelligence artificielle, l'apprentissage automatique et le big data

ia

Nouveaux niveaux de performances informatiques avec alimentation verticale

Auteur : Ajith Jain, vice-président, unité commerciale HPC

Les niveaux de puissance des processeurs d'intelligence artificielle (IA) hautes performances continuent d'augmenter et les contraintes du cœur diminuent grâce aux nœuds de calcul avancés. Par conséquent, les concepteurs de systèmes électriques sont mis au défi de gérer les chutes de tension croissantes dans le réseau électrique, les gradients de puissance sur les broches d'alimentation du processeur à courant élevé et basse tension, la réponse des spécifications de puissance aux transitoires et les pertes de puissance.

Dans le cas du cluster computing, où des grappes de processeurs à haute densité sont utilisées pour augmenter la vitesse et les performances de l'apprentissage automatique, la complexité du réseau électrique est considérablement augmentée car l'alimentation électrique doit être verticale depuis le bas du groupe.

La conception d'un réseau électrique basé sur l'architecture de puissance factorisée de Vicor (FPA™) avec des multiplicateurs de courant de point de charge au lieu des techniques traditionnelles de moyenne de tension permet un gain de performances significatif. Ceci est possible grâce aux caractéristiques des composants de puissance au point de charge : densité de courant élevée, moins de composants et, très important, flexibilité de localisation. Les composants de puissance au point de charge permettent donc d'alimenter latéralement et/ou verticalement le ou les cœurs de processeur IA et les rails de mémoire, minimisant ainsi considérablement les impédances dans le réseau électrique.

Besoins en courant plus élevés dans les réseaux électriques actuels

Les processeurs graphiques (GPU) modernes intègrent des dizaines de milliards de transistors, un nombre qui augmente avec chaque nouvelle génération et chaque famille de produits grâce à des géométries de nœuds de processus plus petites. Chaque nouvelle génération offre également des améliorations des performances du processeur, mais au prix d'une augmentation exponentielle de la puissance. La figure 1 montre une énorme augmentation du courant requis en raison de la géométrie réduite des transistors et des tensions de noyau.

performances informatiques

Figure 1. Dans la plupart des cas, la puissance est le facteur limitant des performances de calcul, car les nouveaux processeurs consomment des courants de plus en plus élevés. L'énergie englobe non seulement la distribution, mais également l'efficacité, la taille, le coût et les performances thermiques.

Il est courant que des courants jusqu'à 2000 A soient nécessaires. En réponse à ce défi d'alimentation, certaines sociétés de processeurs évaluent des options multi-rails dont les principaux rails d'alimentation principaux sont divisés en cinq entrées d'alimentation à courant inférieur ou plus. Le réseau électrique de chacun de ces rails doit délivrer un courant élevé et nécessite également une régulation précise de chacun, ce qui exerce une pression sur la densité du réseau électrique et sa localisation physique sur la carte accélératrice.

Pour ajouter encore plus de complexité, la nature hautement dynamique des charges de travail d'apprentissage automatique se traduit par des transitoires di/dt très élevés durant plusieurs microsecondes et une contrainte conséquente sur le réseau d'alimentation d'un module processeur ou d'une carte accélératrice à hautes performances.

La figure 2 montre l'architecture d'un réseau électrique typique.

réseau électrique typique

Figure 2. Réseau d'alimentation typique pour un processeur hautes performances.

Bonnes pratiques pour optimiser le réseau électrique

Les travaux du consortium Open Compute Project® (OCP®) ont aidé à établir un ensemble de normes pour la conception de développements de processeurs en rack et en carte. L'Open Rack Standard V2.2 définit un fond de panier de serveur de 48 V et une tension de fonctionnement de 48 V pour les modules OAM (modules d'accélération ouverts) utilisés principalement pour l'IA et l'apprentissage automatique. Pour maintenir la compatibilité avec les systèmes 12V précédents, la norme envisage la possibilité de couvrir les exigences de 12 à 48V et de 48 à 12V.

Quant à l'alimentation du processeur, ou borne de recharge, elle se heurte à des difficultés techniques. Les avancées techniques mentionnées dans la section précédente portaient sur la tendance à la baisse de la tension, la nécessité d'un réglage fin de la tension du cœur et la tendance à la hausse de la consommation de courant. Au niveau de l'assiette, l'impact de ces facteurs se manifeste de diverses manières.

Les niveaux de densité de courant sont extrêmes pour n'importe quelle carte de circuit imprimé et le routage des connexions d'alimentation capables de gérer ces énormes charges nécessite une attention particulière. La grande variation des charges de travail peut créer des transitoires de tension importants qui, pour les processeurs les plus avancés, peuvent être problématiques et potentiellement dangereux. Cependant, une carte processeur possède des centaines d'autres composants passifs, de la mémoire et des circuits intégrés essentiels à son fonctionnement qui doivent également être installés.

Un autre facteur est celui des pertes I2A. Les pistes d'alimentation doivent être courtes et pour y parvenir, les modules de conversion de puissance doivent être proches du processeur afin de réduire l'échauffement des pistes. La probabilité de flexion du PCB due aux courants de charge du processeur et aux gradients thermiques localisés du processeur nécessite des cartes plus robustes.

Le rendement énergétique du convertisseur doit également être aussi élevé que possible pour éviter d'autres problèmes de gestion thermique.

Utilisation maximale de la puissance du processeur

Fournir suffisamment de puissance au processeur nécessite de l'innovation pour essayer de garder une longueur d'avance. De nouvelles idées, architectures, topologies et technologies ouvrent la voie à un réseau électrique fiable et évolutif. L'architecture FPA™ de Vicor est la base d'une livraison sans précédent qui répond aux exigences de calcul haute performance.

architecture fpa

Figure 3. L'architecture FPA™ divise le pouvoir en fonctions spécialisées de régulation et de transformation. Les deux fonctionnalités peuvent être optimisées et installées individuellement pour fournir une solution haute densité et haute efficacité.

L'architecture FPA de Vicor divise le travail d'un convertisseur de puissance en fonctions de régulation et de transformation spécialisées, obtenant ainsi une solution à haute efficacité et haute densité en les séparant et en les optimisant individuellement. Le FPA, associé à la topologie SAC™ (convertisseur d'amplitude sinusoïdale), prend en charge plusieurs architectures innovantes qui peuvent aider à libérer toute la puissance des processeurs hautes performances d'aujourd'hui.

alimentation latérale

Figure 4. Grâce au FPA, Vicor minimise la traînée dans les "derniers pouces" avec plusieurs solutions brevetées telles que l'alimentation latérale (LPD) et l'alimentation verticale (VPD). Les deux permettent aux processeurs d'atteindre des niveaux de performance jusque-là inatteignables pour répondre à la croissance exponentielle des exigences de traitement du calcul haute performance.

La technologie de convertisseur de puissance de Vicor tire parti de l'architecture FPA unique, qui non seulement optimise l'efficacité du convertisseur, mais réduit également considérablement les pertes de courant associées à une alimentation à basse tension et à courant élevé au point de charge (ASIC, CPU, GPU, etc.) .

alimentation latérale est une technique innovante dans laquelle deux multiplicateurs de courant (modules Vicor VTM™) flanquent le processeur sur les côtés nord et sud ou est et ouest. Cette technique est préférable pour des courants de charge de ~800A avec une tension nominale de 0,8V associée à une alimentation secteur de 70µΩ à 100°C. À partir de ces chiffres, nous pouvons calculer ~ 45 W de perte de puissance. Un dissipateur thermique qui couvre à la fois les multiplicateurs haute puissance de 2,8 mm et le processeur comme celui illustré pourrait être une bonne solution thermique. Cette architecture est excellente pour alimenter les cartes accélératrices graphiques (OAM ou autres), les ASIC réseau et les APU utilisés dans les centres de données à grande échelle ou les armoires de supercalculateurs.

Alimentation latérale-verticale c'est une technique similaire à l'alimentation latérale, mais avec cette différence : seulement 70% de la puissance est fournie latéralement au moyen de multiplicateurs de courant qui flanquent les côtés du processeur. Un autre multiplicateur de courant au bas du processeur fournira les 30% restants du courant de charge directement au processeur BGA. La solution hybride de type latéral et vertical réduit les pertes du réseau électrique de près d'un quart (!). Cette technique libère également de l'espace sur la carte pour accueillir un deuxième rail à courant élevé (auxiliaire) ou des rails de mémoire HBM sur le côté supérieur de la carte autour du processeur.

alimentation verticale-latérale, d'autre part, il augmente le courant de charge jusqu'à > 50 % au moyen de multiplicateurs de courant supplémentaires au bas du processeur. Cette technique permet de réduire de 50% les pertes du réseau d'alimentation par rapport à la méthode latéral-vertical. Une conception de 1200 A peut maintenant atteindre une résistance secteur aussi faible que 10 µΩ, réalisant ainsi une perte de puissance inférieure à 14,4 W. Dans ce cas, les dissipateurs thermiques peuvent être placés sur les côtés supérieur et inférieur de la charge en fonction de l'espace disponible. Cette architecture est particulièrement efficace pour les applications qui ne prennent pas en charge les composants de puissance sur le côté supérieur de la carte afin de mettre en œuvre une connexion de signal à haut débit depuis la périphérie de l'ASIC. Quelques exemples sont CPO, NPO et les dispositifs de communication à large bande/réseau.

L'alimentation électrique verticale est la solution ultime pour fournir des courants très élevés et des tensions basses au cœur du processeur avec la plus faible résistance du réseau électrique. Dans ce cas, les multiplicateurs de courant et les condensateurs de dérivation sont superposés pour former un module de puissance intégré (multiplicateur de courant accordé) qui peut être monté directement sous le processeur en décalant la batterie de condensateurs de dérivation. Les GCM Vicor sont des dispositifs construits sur mesure qui mappent les broches multiplicatrices de courant au processeur AI BGA et fournissent tous les besoins en condensateur de dérivation dans le module lui-même. Cette technique libère le haut de la carte de circuit imprimé pour une interconnexion de signal à grande vitesse depuis la périphérie du processeur pour une solution avec la plus grande intégrité de signal. Des applications telles que les CPO (dispositifs optiques coencapsulés, processeurs de réseau) et les ASIC de signalisation à haut débit peuvent tirer parti de cette technique de puissance.

Les architectures de Vicor sont suffisamment flexibles pour s'adapter à une grande variété de solutions informatiques hautes performances. Les solutions de Vicor peuvent réduire les résistances de la carte mère jusqu'à 50 fois et le nombre de broches d'alimentation de traitement jusqu'à 10 fois. En utilisant l'architecture FPA™, Vicor minimise la traînée dans les "derniers pouces" avec des solutions brevetées qui combinent l'alimentation latérale (LPD) et l'alimentation verticale (VPD). Tous permettent aux processeurs d'atteindre des niveaux de performance jusqu'alors inatteignables pour répondre aux exigences du traitement informatique haute performance, qui connaît une croissance exponentielle.

Les architectures FPA sont inégalées pour leur densité de courant et leurs pertes de puissance réduites sur l'ensemble du réseau électrique. Les architectures propriétaires, les topologies et la petite taille des modules offrent des caractéristiques uniques dans le secteur de l'énergie. De plus, pour que les processeurs de nouvelle génération fonctionnent à leur capacité maximale, ils ont besoin de solutions d'alimentation capables de s'adapter, de s'ajuster et de fournir une densité de puissance élevée. Des modules de puissance robustes et fiables, ainsi que des topologies innovantes, sont primordiaux dans les systèmes dynamiques où les besoins en puissance changent rapidement. L'intelligence artificielle, l'apprentissage automatique et l'informatique de pointe ne seront jamais assez puissants pour l'avenir en utilisant les architectures d'alimentation traditionnelles. Pour répondre à ce besoin permanent, vous devez innover aujourd'hui et être prêt pour une adaptation future grâce à une alimentation modulaire.