Home Artikel Wie man den durch künstliche Intelligenz erzeugten Computer-Tsunami stillt, lernt ...

Wie man den durch künstliche Intelligenz, maschinelles Lernen und Big Data verursachten Computer-Tsunami stillt

ia

Neue Dimensionen der Rechenleistung mit vertikaler Zuführung

Autor: Ajith Jain, Vizepräsident, HPC Business Unit

Die Leistung von Hochleistungsprozessoren für künstliche Intelligenz (KI) steigt weiter und die Kernbelastung sinkt dank fortschrittlicher Rechenknoten. Daher stehen die Entwickler von Stromversorgungssystemen vor der Herausforderung, mit zunehmenden Spannungsabfällen im Stromnetz, Leistungsgradienten über Hochstrom- und Niederspannungs-Prozessor-Leistungsanschlüssen, der Reaktion der Leistungsspezifikationen auf Transienten und Leistungsverlusten umzugehen.

Im Fall von Cluster-Computing, bei dem hochdichte Prozessorcluster verwendet werden, um die Geschwindigkeit und Leistung des maschinellen Lernens zu erhöhen, erhöht sich die Komplexität des Stromnetzes erheblich, da die Stromversorgung vertikal von der Unterseite der Gruppe erfolgen muss.

Der Entwurf eines Stromnetzes auf Basis der Factorized Power Architecture (FPA™) von Vicor mit Point-of-Load-Stromvervielfachern anstelle herkömmlicher Spannungsmittelungstechniken ermöglicht eine erhebliche Leistungssteigerung. Dies ist dank der Eigenschaften der Leistungskomponenten am Ladepunkt möglich: hohe Stromdichte, weniger Komponenten und vor allem Flexibilität beim Standort. Leistungskomponenten am Ladepunkt ermöglichen daher die seitliche und/oder vertikale Stromversorgung in den/die IA-Prozessorkern(e) und Speicherschienen, wodurch Impedanzen im Stromnetz deutlich minimiert werden.

Höherer Strombedarf in aktuellen Stromnetzen

Moderne Grafikprozessoren (GPUs) integrieren zig Milliarden Transistoren, eine Zahl, die dank kleinerer Prozessknotengeometrien mit jeder neuen Generation und jeder Produktfamilie wächst. Jede neue Generation bietet auch Verbesserungen der Prozessorleistung, allerdings auf Kosten einer exponentiellen Leistungssteigerung. Abbildung 1 zeigt einen enormen Anstieg des Strombedarfs aufgrund der reduzierten Transistorgeometrie und Kernspannungen.

Rechenleistung

Abbildung 1. In den meisten Fällen ist die Leistung der limitierende Faktor für die Rechenleistung, da neuere Prozessoren immer höhere Ströme verbrauchen. Energie umfasst nicht nur die Verteilung, sondern auch Effizienz, Größe, Kosten und thermische Leistung.

Normalerweise sind Ströme bis zu 2000 A erforderlich. Als Reaktion auf diese Leistungsherausforderung prüfen einige Prozessorhersteller Multi-Rail-Optionen, deren Hauptstromschienen in fünf oder mehr Stromeingänge mit geringerem Strom unterteilt sind. Das Stromnetz für jede dieser Schienen muss einen hohen Strom liefern und erfordert außerdem eine präzise Regulierung jeder dieser Schienen, was die Dichte des Stromnetzes und seinen physischen Standort auf der Beschleunigerkarte unter Druck setzt.

Um die Komplexität noch weiter zu erhöhen, führt die hohe Dynamik der Arbeitslasten des maschinellen Lernens zu sehr hohen di/dt-Transienten, die mehrere Mikrosekunden andauern, und daraus resultierender Belastung des Stromnetzes eines Prozessormoduls oder einer Beschleunigerkarte. Hohe Leistung.

Abbildung 2 zeigt die Architektur eines typischen Stromnetzes.

typisches Stromnetz

Abbildung 2. Typisches Stromnetz für einen Hochleistungsprozessor.

Best Practices zur Optimierung des Stromnetzes

Die Arbeit des Open Compute Project-Konsortiums® (OCP®) haben dazu beigetragen, eine Reihe von Standards für die Entwicklung von Rack- und Karten-basierten Prozessorentwicklungen zu etablieren. Der Open Rack Standard V2.2 definiert eine 48-V-Server-Backplane und eine 48-V-Betriebsspannung für OAM-Module (Open Accelerator Modules), die hauptsächlich für KI und maschinelles Lernen verwendet werden. Um die Kompatibilität mit bisherigen 12-V-Systemen aufrechtzuerhalten, sieht die Norm die Möglichkeit vor, die Anforderungen von 12 bis 48 V und 48 bis 12 V abzudecken.

Die Stromversorgung des Prozessors bzw. der Ladestation ist mit technischen Schwierigkeiten behaftet. Die im vorherigen Abschnitt erwähnten technischen Fortschritte konzentrierten sich auf den Abwärtstrend der Spannung, die Notwendigkeit einer Feinabstimmung der Kernspannung und den Aufwärtstrend des Stromverbrauchs. Auf Plattenebene manifestiert sich der Einfluss dieser Faktoren auf unterschiedliche Weise.

Die Stromdichte ist für jede Leiterplatte extrem hoch und die Verlegung von Stromanschlüssen, die diesen enormen Belastungen standhalten können, erfordert sorgfältige Aufmerksamkeit. Die großen Schwankungen der Arbeitslasten können zu großen Spannungsspitzen führen, die für die fortschrittlichsten Prozessoren problematisch und potenziell gefährlich sein können. Allerdings verfügt eine Prozessorplatine über Hunderte anderer passiver Komponenten, Speicher und integrierter Schaltkreise, die für ihren Betrieb unerlässlich sind und ebenfalls installiert werden müssen.

Ein weiterer Faktor sind Verluste I2A. Stromschienen müssen kurz sein. Um dies zu erreichen, sollten sich die Stromumwandlungsmodule in der Nähe des Prozessors befinden, um die Erwärmung der Schienen zu reduzieren. Die Wahrscheinlichkeit einer Leiterplattenverbiegung aufgrund von Prozessorlastströmen und lokalisierten thermischen Gradienten des Prozessors erfordert robustere Leiterplatten.

Auch die Leistungseffizienz des Wandlers sollte möglichst hoch sein, um weitere Probleme beim Wärmemanagement zu vermeiden.

Maximale Nutzung der Prozessorleistung

Um den Prozessor mit ausreichend Leistung zu versorgen, sind Innovationen erforderlich, um an der Spitze zu bleiben. Neue Ideen, Architekturen, Topologien und Technologien weisen den Weg zu einem zuverlässigen und skalierbaren Stromnetz. Die FPA™-Architektur von Vicor ist die Grundlage für eine beispiellose Bereitstellung, die Hochleistungs-Computing-Anforderungen erfüllt.

FPA-Architektur

Abbildung 3. Die FPA™-Architektur unterteilt die Leistung in spezialisierte Regulierungs- und Transformationsfunktionen. Beide Funktionen können individuell optimiert und installiert werden, um eine hocheffiziente Lösung mit hoher Dichte bereitzustellen.

Die FPA-Architektur von Vicor unterteilt die Arbeit eines Leistungswandlers in spezielle Regelungs- und Transformationsfunktionen und erhält so eine Lösung mit hohem Wirkungsgrad und hoher Dichte, indem sie diese einzeln trennt und optimiert. FPA unterstützt zusammen mit der SAC™-Topologie (Sine Amplitude Converter) mehrere innovative Architekturen, die dabei helfen können, die volle Leistung heutiger Hochleistungsprozessoren freizusetzen.

Seiteneinzug

Abbildung 4. Dank FPA minimiert Vicor den Luftwiderstand auf den „letzten Zentimetern“ mit mehreren patentierten Lösungen wie Side Feed (LPD) und Vertical Feed (VPD). Beide ermöglichen es Prozessoren, bisher unerreichte Leistungsniveaus zu erreichen, um den exponentiell wachsenden Verarbeitungsanforderungen des Hochleistungsrechnens gerecht zu werden.

Die Stromwandlertechnologie von Vicor nutzt die einzigartige FPA-Architektur, die nicht nur die Wandlereffizienz optimiert, sondern auch die Netzverluste im Zusammenhang mit Niederspannungs- und Hochstromleistung am Lastpunkt (ASICs, CPUs, GPUs usw.) erheblich verringert. .

Seiteneinzug ist eine innovative Technik, bei der zwei Stromvervielfacher (Vicor VTM™-Module) den Prozessor entweder auf der Nord- und Südseite oder auf der Ost- und Westseite flankieren. Diese Technik ist für Lastströme von ~800 A mit einer Nennspannung von 0,8 V in Verbindung mit 70 µΩ Netzstrom bei 100 °C vorzuziehen. Aus diesen Zahlen können wir einen Leistungsverlust von ca. 45 W berechnen. Ein Kühlkörper, der sowohl die 2,8-mm-Hochleistungsvervielfacher als auch den Prozessor abdeckt, wie der abgebildete, könnte eine gute thermische Lösung sein. Diese Architektur eignet sich hervorragend für die Stromversorgung von Grafikbeschleunigerkarten (OAM oder anders), Netzwerk-ASICs und APUs, die in Hyperscale-Rechenzentren oder Supercomputer-Schränken verwendet werden.

Seitlich-vertikale Fütterung Es handelt sich um eine Technik, die der seitlichen Einspeisung ähnelt, jedoch mit dem Unterschied, dass nur 70 % der Leistung seitlich über Stromvervielfacher zugeführt werden, die die Seiten des Prozessors flankieren. Ein weiterer Stromvervielfacher an der Unterseite des Prozessors liefert die restlichen 30 % des Laststroms direkt an den Prozessor-BGA. Die Hybridlösung aus seitlichem und vertikalem Typ reduziert die Verluste des Stromnetzes um fast ein Viertel (!). Durch diese Technik wird außerdem Platz auf der Platine frei, um eine zweite Hochstromschiene (Hilfsstromschiene) oder HBM-Speicherschienen auf der Oberseite der Platine um den Prozessor herum unterzubringen.

vertikal-laterale Zuführung, Andererseits erhöht es den Ladestrom durch zusätzliche Stromvervielfacher an der Unterseite des Prozessors um bis zu >50 %. Diese Technik ermöglicht es, die Verluste im Stromversorgungsnetz im Vergleich zur Lateral-Vertikal-Methode um 50 % zu reduzieren. Ein 1200-A-Design kann jetzt einen Netzwiderstand von nur 10 µΩ erreichen und somit einen Leistungsverlust von weniger als 14,4 W erreichen. In diesem Fall können die Kühlkörper je nach verfügbarem Platz auf der Ober- und Unterseite der Last platziert werden. Diese Architektur ist besonders effektiv für Anwendungen, die keine Leistungskomponenten auf der Oberseite der Platine unterstützen, um eine Hochgeschwindigkeitssignalverbindung von der Peripherie des ASIC zu implementieren. Einige Beispiele sind CPO-, NPO- und Breitband-/Netzwerkkommunikationsgeräte.

Die vertikale Stromversorgung ist die ultimative Lösung, um dem Prozessorkern sehr hohe Ströme und niedrige Spannungen mit dem niedrigsten Widerstand des Stromnetzes zuzuführen. In diesem Fall werden die Stromvervielfacher und Bypass-Kondensatoren übereinander gelegt, um ein integriertes Leistungsmodul (abgestimmter Stromvervielfacher) zu bilden, das durch Versetzen der Bypass-Kondensatorbank direkt unter dem Prozessor montiert werden kann. Vicor GCMs sind speziell angefertigte Geräte, die die aktuellen Multiplikator-Pins dem BGA des AI-Prozessors zuordnen und alle erforderlichen Bypass-Kondensatoren innerhalb des Moduls selbst bereitstellen. Diese Technik macht die Oberseite der Leiterplatte für die Hochgeschwindigkeits-Signalverbindung von der Prozessorperipherie frei und sorgt so für eine Lösung mit höchster Signalintegrität. Anwendungen wie CPOs (Coencapsulated Optical Devices, Network Processors) und Hochgeschwindigkeits-Signalisierungs-ASICs können von dieser Leistungstechnik profitieren.

Die Architekturen von Vicor sind flexibel genug, um sich an eine Vielzahl von Hochleistungs-Computing-Lösungen anzupassen. Die Lösungen von Vicor können die Widerstände des Mainboards um das bis zu 50-fache und die Anzahl der Prozessor-Stromanschlüsse um das bis zu 10-fache reduzieren. Mithilfe der FPA™-Architektur minimiert Vicor den Luftwiderstand auf den „letzten Zentimetern“ mit patentierten Lösungen, die Side Feed (LPD) und Vertical Feed (VPD) kombinieren. Sie alle ermöglichen es Prozessoren, bisher unerreichte Leistungsniveaus zu erreichen, um den Anforderungen der Hochleistungsrechnerverarbeitung gerecht zu werden, die ein exponentielles Wachstum erlebt.

FPA-Architekturen sind hinsichtlich ihrer Stromdichte und reduzierten Leistungsverluste im gesamten Stromnetz unübertroffen. Die proprietären Architekturen, Topologien und die geringe Modulgröße bieten einzigartige Funktionen in der Energiebranche. Damit Prozessoren der nächsten Generation ihre maximale Leistung erbringen können, benötigen sie außerdem Stromversorgungslösungen, die sich anpassen, abstimmen und eine hohe Leistungsdichte liefern können. Robuste und zuverlässige Leistungsmodule sowie innovative Topologien sind in dynamischen Systemen, in denen sich der Leistungsbedarf schnell ändert, von größter Bedeutung. Künstliche Intelligenz, maschinelles Lernen und Edge Computing werden mit herkömmlichen Energiearchitekturen für die Zukunft nie leistungsfähig genug sein. Um diesem anhaltenden Bedarf gerecht zu werden, müssen Sie heute Innovationen einführen und durch modulare Stromversorgung für zukünftige Anpassungen gerüstet sein.