Las cargas de trabajo de IA de alta densidad introducen demandas de energía rápidas y variables. Nuestras pruebas evaluaron cómo responden los sistemas UPS de Vertiv bajo estas condiciones.
Perfiles de carga de IA: Dinámicos, cíclicos y exigentes
A diferencia de las cargas de trabajo tradicionales, las cargas de trabajo de IA que utilizan GPUs modernas exhiben perfiles de carga altamente dinámicos y cíclicos. En lugar de mantener un consumo de energía constante, los sistemas de IA cambian frecuentemente entre estados de baja actividad y picos repentinos de máximo cómputo. Estas fluctuaciones pueden ocurrir cada pocos segundos o incluso milisegundos, con cargas que saltan del estado inactivo (alrededor del 10%) a la capacidad máxima (100-150%) casi instantáneamente.

El diagrama ilustra un patrón de carga de IA representativo. Aquí, observamos ciclos donde el sistema aumenta rápidamente hasta niveles máximos de cómputo, frecuentemente superando el 100% de carga nominal, para luego caer rápidamente a un estado de potencia GPU promedio más bajo. Este comportamiento se repite con frecuencia, creando patrones de energía que son tanto abruptos como regulares. Tales patrones desafían la capacidad de respuesta de la infraestructura de energía tradicional, haciendo esencial diseñar sistemas UPS y de distribución de energía que puedan sostener transiciones rápidas de carga sin degradación en el rendimiento o la fiabilidad.
Impacto en la cadena de alimentación
La naturaleza dinámica y cíclica de los perfiles de carga de IA ejerce una presión significativa en toda la cadena de alimentación. Las fluctuaciones de energía frecuentes y abruptas conducen a un ciclo térmico intensificado en todos los componentes de distribución de energía, acelerando el desgaste y potencialmente reduciendo la vida útil del sistema. Los elementos clave de la infraestructura – como los tableros de distribución, las barras conductoras, los paneles de distribución, las PDUs, los conmutadores de transferencia estática (STS) y los sistemas UPS – están sometidos repetidamente a cambios rápidos de carga, lo que aumenta el estrés eléctrico y térmico, y desafía su capacidad para mantener la estabilidad y la eficiencia.

Si estas rápidas transiciones de carga no se filtran o mitigan adecuadamente, las oscilaciones resultantes pueden propagarse hacia arriba en dirección a la conexión principal de servicios públicos. En centros de datos a gran escala que operan a niveles de varios megavatios, esto puede hacer que la red experimente picos repentinos y repetidos en la demanda. Esta inestabilidad puede alterar el equilibrio de la red y crear problemas de calidad de energía, potencialmente afectando no solo al centro de datos en sí, sino también a la infraestructura de red circundante.
En cuanto a los generadores, estos picos rápidos de carga pueden exceder la capacidad del generador para responder dentro de límites aceptables. En casos extremos, el generador puede rechazar la carga por completo, resultando en la desconexión de sistemas críticos de su fuente de energía de respaldo. Esto expone a la instalación a un riesgo significativo, particularmente durante cortes de servicios públicos o perturbaciones en la red, cuando la energía de respaldo confiable es esencial.
Por qué el UPS es un componente clave para abordar el impacto de la IA
Dentro de toda la cadena de alimentación, el UPS destaca como un componente activo capaz de mitigar efectivamente los desafíos introducidos por las cargas de trabajo de IA. A diferencia de los elementos de distribución pasivos – como tableros de distribución, PDUs o barras conductoras – el UPS incorpora convertidores de potencia que regulan y convierten continuamente la energía eléctrica. Esto le permite actuar como un filtro entre la carga fluctuante de IA y la infraestructura ascendente.
Al gestionar activamente el flujo de energía, el UPS puede suavizar las transiciones bruscas de carga y actuar como un filtro, absorbiendo o remodelando el perfil de carga antes de que alcance elementos críticos como el suministro principal o el sistema de baterías. Un sistema UPS correctamente configurado permite a las fábricas de IA contener el impacto de las dinámicas de carga de IA, protegiendo la estabilidad de la infraestructura de energía y proporcionando energía continua, limpia y predecible.
Simulador de Carga de IA: Una innovación patentada para la validación de energía preparada para IA
Los operadores de centros de datos necesitan una forma de probar con precisión el comportamiento de la carga de IA y validar su infraestructura de energía antes de la implementación. Sin esta validación, los operadores se arriesgan a la degradación del rendimiento, tiempo de inactividad no planificado y costos excesivos por sobredimensionamiento.
Reconociendo esta necesidad, Vertiv ha desarrollado el Simulador de Carga de IA, un sistema de pruebas patentado diseñado para replicar con precisión el comportamiento eléctrico de las cargas de cómputo impulsadas por IA – específicamente, los perfiles de energía de conmutación rápida e irregulares de clusters de GPU operando en ciclos de entrenamiento o inferencia. Este sistema permite a los equipos de ingeniería realizar pruebas determinísticas y repetibles de unidades UPS, PDUs y arquitecturas completas de distribución de energía bajo condiciones realistas de IA.
El Simulador de Carga de IA permite perfiles de carga tanto predefinidos como totalmente configurables, reproduciendo patrones típicos de energía de IA. Estos perfiles también pueden incorporar curvas de carga reales proporcionadas por fabricantes de GPU, permitiendo condiciones de prueba altamente realistas y representativas.
Hay dos modos de simulación disponibles: la primera versión admite perfiles de carga de 2 pasos y curvas específicas de aplicación, mientras que la segunda versión extiende la funcionalidad a perfiles de 3 pasos, permitiendo escenarios de prueba más granulares y complejos. El sistema está diseñado para operar a diferentes niveles de potencia, desde pruebas de rack individual hasta validación de infraestructura a gran escala, y soporta configuraciones tanto AC como DC.
El Simulador de Carga de IA incluye capacidades avanzadas de monitoreo y análisis, proporcionando información en tiempo real e informes detallados sobre cómo responde la infraestructura a demandas de energía repentinas y fluctuantes. Estos conocimientos son críticos para optimizar el diseño, apoyar la I+D y adaptar demostraciones específicas para clientes.
Implementado inicialmente en el Centro de Experiencia del Cliente de Energía Global de Vertiv en Bolonia, el Simulador de Carga de IA ahora se está expandiendo globalmente como una herramienta crítica para validar la preparación de infraestructura para cargas de trabajo de IA. Permite realizar pruebas de estrés proactivas y ajustar las arquitecturas de energía para cumplir con los requisitos del mundo real de los clusters modernos de IA – mitigando riesgos, reduciendo el sobredimensionamiento y mejorando la robustez del sistema.
Estándares de rendimiento de UPS: Pruebas con simulador de carga de IA
Este capítulo resume los resultados de las pruebas de rendimiento realizadas en sistemas UPS de Gran Potencia de Vertiv cuando se someten a patrones de carga simulados de Inteligencia Artificial (IA). El objetivo principal fue evaluar la capacidad del UPS para mantener una salida estable e ininterrumpida bajo condiciones de carga dinámicas y repetitivas típicas de cargas de trabajo de IA, utilizando la red eléctrica como fuente de alimentación.
Las pruebas incluyeron el monitoreo y análisis de parámetros clave del UPS: voltaje de entrada y salida, corriente, frecuencia y comportamiento del bus DC. Se prestó especial atención a la respuesta del UPS ante las rápidas transiciones entre fases de cómputo e inactividad, como se observa durante los ciclos de entrenamiento e inferencia de IA.
La primera ronda de pruebas se ejecutó utilizando el Simulador de Carga de IA Rev.1, capaz de generar variaciones de carga escalonadas con temporización ON/OFF configurable. Estas pruebas iniciales tenían como objetivo verificar que el firmware estándar del UPS pudiera soportar transiciones rápidas y repetidas sin depender de las baterías.
Unidades UPS bajo prueba:
Todas las pruebas se realizaron con el UPS operando en modo de doble conversión.
El objetivo es verificar que la estabilidad de salida del sistema y el rendimiento general permanezcan sin afectación durante la operación continua, ya que la norma IEC 62040-3 estipula este requisito únicamente como una prueba única.
Escenario 1: Escalones de carga de 0-50% hasta 0-100%
Descripción del perfil de carga: Esta prueba representa una condición de alta frecuencia y alto estrés debido al ciclo rápido de potencia (100ms ON / 30ms OFF), que impone estrés térmico (ΔT) en los semiconductores del rectificador e inversor.
Duración de la prueba: 4 horas
Perfil de carga: 100ms ON, 30ms OFF (8.3 Hz)

Vista general del gráfico del perfil de carga, Escenario 1.

Escenario 1, Formas de onda de Entrada/Salida/Bus DC/Baterías

Escenario 2: Escalones de carga de 30-50% hasta 30-100%
Descripción del perfil de carga: Este perfil simula un comportamiento de ciclo más estable (500ms ON / 500ms OFF), permitiendo que el bus DC alcance un estado estable entre transiciones.
Duración de la prueba: 4 horas
Perfil de carga: 500ms ON, 500ms OFF (1 Hz)

Escenario 2, vista general del gráfico del perfil de carga

Escenario 3: Escalones de carga de 30-50% hasta 30-100%
Descripción del perfil de carga: Los 100ms ON y 900ms OFF pretenden replicar una condición para probar más a fondo el bus DC del sistema cuando alcanza un estado estable antes de la siguiente variación de carga de salida. En este caso, se consideró que un período OFF más largo de 900ms era suficiente para probar cómo el ciclo de IA a largo plazo afectaría el control de ENTRADA y SALIDA del UPS desde la operación normal.
Duración de la prueba: 4 horas
Perfil de carga: 100ms ON, 900ms OFF (1 Hz)

Escenario 3, vista general del gráfico del perfil de carga.

Escenario 3, Formas de onda de Entrada/Salida/Bus DC/Baterías

Hallazgos y conclusión: Sistemas UPS probados en campo para demandas de IA
Las pruebas confirmaron que los sistemas UPS de Gran Potencia de Vertiv (Vertiv EXL S1, Vertiv Trinergy y Vertiv PowerUPS 9000) son capaces de manejar escalones de carga de IA altamente dinámicos desde 0% hasta 100% de su capacidad nominal sin involucrar la batería, siempre que la fuente de alimentación se mantenga dentro de los parámetros nominales. Esto demuestra la resistencia del diseño de los UPS y su idoneidad para cargas de trabajo de IA caracterizadas por fluctuaciones de carga rápidas y frecuentes, esto también ha sido probado en campo en diferentes sitios de centros de datos, como el sitio EdgeConneX donde Vertiv EXL S1 trabaja con cargas variables de IA.
De cara al futuro, Vertiv continúa trabajando en características basadas en firmware destinadas a mejorar aún más el rendimiento del sistema y la protección de la batería durante condiciones más exigentes, como transitorios de sobrecarga y perfiles de carga de IA complejos que exceden temporalmente el 100% de carga nominal. Estas mejoras están diseñadas para reducir el estrés de la batería y extender la vida útil de la misma con un conjunto más amplio de perfiles de carga.