Inicio Artículos Cómo alimentar el tsunami informático generado por la inteligencia artificial, el aprendizaje...

Cómo alimentar el tsunami informático generado por la inteligencia artificial, el aprendizaje automático y big data

ia

Nuevos niveles de rendimiento informático con la alimentación vertical

Autor: Ajith Jain, Vicepresidente de la Unidad de Negocio HPC

Los niveles de potencia de los procesadores para inteligencia artificial (IA) de alto rendimiento siguen aumentando y las tensiones del núcleo disminuyen gracias a los nodos de proceso avanzados. De ahí que los diseñadores de sistemas de alimentación hayan de afrontar el reto de manejar las caídas de tensión cada vez mayores de la red de alimentación, los gradientes de potencia en las patillas de alimentación del procesador de alta corriente y baja tensión, las especificaciones de respuesta frente a transitorios y las pérdidas de potencia.

En el caso de la informática en clústeres, donde se usan grupos de procesadores de alta densidad para aumentar la velocidad y el rendimiento del aprendizaje automático, la complejidad de la red de alimentación aumenta de manera significativa ya que el suministro de corriente se debe efectuar verticalmente desde la parte inferior del grupo.

El diseño de una red de alimentación basada en la arquitectura Factorized Power Architecture (FPA™) de Vicor con multiplicadores de corriente en el punto de carga en lugar de técnicas tradicionales de promediado de tensión permite un importante avance del rendimiento. Esto es posible gracias a las características de los componentes de potencia en el punto de carga: alta densidad de corriente, menos componentes y, algo muy importante, flexibilidad de emplazamiento. Los componentes de potencia en el punto de carga permiten, por tanto, suministrar corriente lateralmente y/o verticalmente en el/los núcleo/s del procesador de IA y los carriles de memoria, minimizando así significativamente las impedancias en la red de alimentación.

Necesidades de mayor corriente en redes actuales de alimentación

Los modernos procesadores gráficos (GPU) integran decenas de miles de millones de transistores en un número que crece con cada nueva generación y cada familia de productos gracias a las geometrías de los nodos de proceso de menor tamaño. Cada nueva generación ofrece asimismo mejoras en el rendimiento del procesador, si bien a expensas de un aumento exponencial sobre la alimentación. La Figura 1 muestra un enorme incremento de la corriente necesaria debido a la geometría reducida del transistor y a las tensiones del núcleo.

rendimiento informatico

Figura 1. En la mayoría de los casos, la alimentación es el factor que limita el rendimiento informático ya que los nuevos procesadores consumen corrientes cada vez más elevadas. La alimentación abarca no solamente su distribución sino también la eficiencia, el tamaño, el coste y el rendimiento térmico.

Es habitual que se exijan corrientes de hasta 2000A. Como respuesta a este reto para la alimentación, algunas compañías de procesadores están evaluando opciones multicarril cuyos principales carriles de alimentación del núcleo se dividen en cinco o más entradas de potencia con una corriente menor. La red de alimentación para cada uno de estos carriles debe suministrar una corriente elevada y también necesita una regulación precisa de cada uno, todo lo cual ejerce presión sobre la densidad de la red de alimentación y su ubicación física en la tarjeta aceleradora.

Para añadir aún más complejidad, la naturaleza muy dinámica de las cargas de trabajo del aprendizaje automático da como resultado unos transitorios muy elevados de di/dt que duran varios microsegundos y el consiguiente estrés en la red de alimentación de un módulo procesador o una tarjeta aceleradora de alto rendimiento.

La Figura 2 muestra la arquitectura de una típica red de alimentación.

red de alimentacion tipica

Figura 2. Red de alimentación típica de un procesador de alto rendimiento.

Prácticas recomendadas para optimizar la red de alimentación

Los trabajos del consorcio Open Compute Project® (OCP®) han ayudado a establecer un conjunto de normas para diseñar desarrollos de procesadores basados en rack y tarjeta. El Open Rack Standard V2.2 define un backplane del servidor de 48V y una tensión de funcionamiento de 48V para los módulos OAM (open accelerator modules) utilizados principalmente para IA y aprendizaje automático. Para mantener la compatibilidad con sistemas anteriores de 12V, la norma contempla la posibilidad de cubrir los requisitos de 12 a 48V y 48 a 12V.

Por lo que respecta a la alimentación del procesador, o punto de carga, está plagada de dificultades de tipo técnico. Los avances técnicos mencionados en la sección anterior se centraron en la tendencia descendente de la tensión, la necesidad de un ajuste preciso de la tensión del núcleo y la tendencia al alza del consumo de corriente. Al nivel de la placa, la repercusión de estos factores se manifiesta de diversos modos.

Los niveles de densidades de corriente son extremos para cualquier placa de circuito impreso y el trazado de las conexiones de alimentación capaces de asumir estas enormes cargas exige prestar especial atención. La fuerte variación de las cargas de trabajo puede crear grandes transitorios de tensión que para los procesadores más avanzados puede ser problemática y potencialmente peligrosa. No obstante, una placa de procesador tiene otros cientos de componentes pasivos, memoria y circuitos integrados esenciales para su funcionamiento que también se han de instalar.

Otro factor es el de las pérdidas I2R. Las pistas de alimentación han de ser cortas y, para conseguirlo, los módulos de conversión de potencia deberían estar cerca del procesador para reducir el calentamiento de las pistas. La probabilidad de flexibilizar la placa de circuito impreso debido a las corrientes de carga del procesador y los gradientes térmicos localizados del procesador exigen placas más robustas.

La eficiencia de la potencia del convertidor también debería ser lo más alta posible para evitar mayores problemas de gestión térmica.

Máximo aprovechamiento de la potencia del procesador

Suministrar la potencia suficiente al procesador requiere innovación para intentar estar a la vanguardia. Las nuevas ideas, arquitecturas, topologías y tecnologías marcan el camino hacia una red de alimentación fiable y escalable. La arquitectura FPA™ de Vicor es la base para un suministro sin precedentes que cubre los requisitos informáticos de alto rendimiento.

arquitectura fpa

Figura 3. La arquitectura FPA™ divide la potencia en funciones especializadas de regulación y transformación. Ambas funciones se pueden optimizar e instalar de manera individual para proporcionar una solución de alta densidad y alta eficiencia.

La arquitectura FPA de Vicor divide el trabajo de un convertidor de potencia en las funciones especializadas de regulación y transformación, obtenido así una solución de alta eficiencia y alta densidad separándolas y optimizándolas individualmente. FPA, junto con la topología SAC™ (Sine Amplitude Converter), admite varias arquitecturas innovadoras que pueden ayudar a liberar toda la potencia de los procesadores actuales de alto rendimiento.

alimentacion lateral

Figura 4. Gracias a FPA, Vicor minimiza las resistencias en los “últimos centímetros” con varias soluciones patentadas como la alimentación lateral (LPD) y vertical (VPD). Ambas permiten que los procesadores consigan unos niveles de rendimiento anteriormente inalcanzables con el fin de cubrir el crecimiento exponencial de los requisitos de procesamiento de la informática de alto rendimiento.

La tecnología del convertidor de potencia de Vicor aprovecha la exclusiva arquitectura FPA, que no solo optimiza la eficiencia del convertidor sino que también disminuye enormemente las pérdidas de la red de alimentación asociadas con la alimentación de baja tensión y alta corriente en el punto de carga (ASIC, CPU, GPU, etc.).

La alimentación lateral es una técnica innovadora en la que dos multiplicadores de corriente (módulos VTM™ de Vicor) flanquean el procesador por el lado norte y sur o por el lado este y oeste. Esta técnica es preferible para corrientes de carga de ~800A con la tensión nominal de 0,8V asociada a 70µΩ de la red de alimentación a 100°C. A partir de estas cifras podemos calcular ~45W de pérdida de potencia. Un disipador de calor que cubra tanto los multiplicadores de corriente de 2,8mm de altura y el procesador como el mostrado en la imagen podría ser una buena solución térmica. Esta arquitectura es excelente para alimentar las tarjetas aceleradoras gráficas (OAM u otras), los ASIC para redes y las APU utilizadas en centros de datos hiperescalares o armarios de superordenadores.

La alimentación lateral-vertical es una técnica similar a la alimentación lateral, pero con esta diferencia: solo se suministra lateralmente el 70% de la potencia por medio de multiplicadores de corriente que flanquean los lados del procesador. Otro multiplicador de corriente en la parte inferior del procesador suministrará el 30% restante de la corriente de carga directamente al BGA del procesador. La solución híbrida de tipo lateral y vertical reduce las pérdidas de la red de alimentación casi a la cuarta parte (!). Esta técnica también deja espacio libre en la placa para albergar un segundo carril de alta corriente (auxiliar) o carriles de memoria HBM en el lado superior de la placa alrededor del procesador.

La alimentación vertical-lateral, por otra parte, aumenta la corriente de carga hasta >50% por medio de multiplicadores de corriente adicionales en la parte inferior del procesador. Esta técnica permite reducir en un 50% las pérdidas de la red de alimentación si se comparan con el método lateral-vertical. Un diseño de 1200A ahora pueden lograr una resistencia de la red de alimentación de apenas 10µΩ, obteniendo así una pérdida de potencia inferior a 14,4W. En este caso, los disipadores de calor se pueden colocar en los lados superior e inferior de la carga dependiendo del espacio disponible. Esta arquitectura es especialmente efectiva para aplicaciones que no admitan componentes de potencia en el lado superior de la placa con el fin de implementar la conexión de señal de alta velocidad desde la periferia del ASIC. Algunos ejemplos son CPO, NPO y dispositivos de comunicación de red / banda ancha.

La alimentación vertical es la solución definitiva para suministrar una corriente muy alta y tensiones bajas en el núcleo del procesador con la resistencia más baja de la red de alimentación. En este caso, los multiplicadores de corriente y los condensadores de derivación (bypass) están superpuestos para formar un módulo de potencia integrado (multiplicador de corriente ajustado) que se puede montar directamente debajo del procesador desplazando el banco de condensadores de derivación. Los GCM de Vicor son dispositivos construidos a medida que asignan las patillas de los multiplicadores de corriente al BGA del procesador de IA además de proporcionar todas las necesidades del condensador bypass dentro del propio módulo. Esta técnica libera la parte superior de la placa de circuito impreso para la interconexión de la señal de alta velocidad desde la periferia del procesador para obtener una solución con la integridad más alta de la señal. Aplicaciones como CPO (dispositivos ópticos coencapsulados, procesadores de redes) y ASIC de señalización de alta velocidad pueden aprovechar esta técnica de alimentación.

Las arquitecturas de Vicor son lo suficientemente flexibles para su adaptarlas en una gran variedad de soluciones informáticas de alto rendimiento. Las soluciones de Vicor pueden reducir hasta 50 veces las resistencias de la placa principal y el número de patillas de potencia de procesamiento hasta 10 veces. Con la arquitectura FPA™, Vicor minimiza las resistencias en los “últimos centímetros” con soluciones patentadas que combinan la alimentación lateral (LPD) y vertical (VPD). Todas ellas permiten que los procesadores consigan unos niveles de rendimiento inalcanzables con anterioridad para cubrir las demandas del procesamiento informático de alto rendimiento, que experimenta un crecimiento exponencial.

Las arquitecturas FPA son inigualables por su densidad de corriente y sus pérdidas de potencia reducidas en toda la red de alimentación. Las arquitecturas propias, las topologías y el pequeño tamaño del módulo ofrecen unas características únicas en la industria de potencia. Además, para que los procesadores de próxima generación funcionen a su máxima capacidad necesitan unas soluciones de potencia que pueden adaptar, ajustar y proporcionar una elevada densidad de potencia. Los robustos y fiables módulos de potencia, junto con las innovadoras topologías, son primordiales en sistemas dinámicos cuyos requisitos de potencia cambian con rapidez. La inteligencia artificial, el aprendizaje automático y la informática de borde (edge computing) nunca alcanzarán la potencia suficiente para el futuro mediante arquitecturas de potencia tradicionales. Para cubrir esta necesidad continua es preciso innovar hoy estar preparado para su adaptación en el futuro mediante alimentación modular.