IA y centros de datos

Equipos de potencia para centros de datos de IA: qué cambia cuando los racks llegan a 100 kW

Entogo

Sala de servidores de centro de datos de hiperescala con racks de GPU de alta densidad — entorno de cliente de equipos de potencia de Entogo para cargas de entrenamiento de IA

Un centro de datos de IA en funcionamiento es, ante todo, un problema de equipos de potencia. El silicio llega —los racks GB200 NVL72 de NVIDIA a unos 120 kW cada uno, las plataformas Vera Rubin NVL144 que apuntan a 600 kW por rack en una cadencia de 2026, el discurso inaugural de OCP de 2025 que reveló racks de referencia que demandan hasta 1 MW—. El reloj del cómputo es corto, y lo fija la hoja de ruta del proveedor.

El reloj que decide si el campus realmente energiza en 2026 o 2028 está del otro lado del medidor. El Large Power Transformer Resilience Report de julio de 2024 del Departamento de Energía de EE. UU. sitúa los plazos actuales de los grandes transformadores de potencia en 80 a 210 semanas, aproximadamente uno y medio a cuatro años. Los paquetes de subestación tardan aún más. Las filas de interconexión con servicios públicos en ERCOT, PJM y el IESO de Ontario se han extendido a sus propios rezagos de varios años. La restricción determinante del campus de IA moderno ya no es el cómputo; es el equipo, la servidumbre de paso y la fila.

El nuevo perfil de carga

Tres cosas distinguen a un campus de IA de las cargas de centro de datos para las que se dimensionó la red de distribución.

Las densidades de rack han dado un salto, no han trepado. La TI empresarial vivió cómodamente en 10-15 kW por rack durante la mayor parte de dos décadas. La generación Blackwell actual cae en aproximadamente 120 kW por rack; los diseños de referencia de 2025 del Open Compute Project llegan a 1 MW. El rack de 100 kW es ahora una suposición de línea base en lugar de un caso extremo.

Las cargas son ricas en armónicos. Los rectificadores de UPS, los variadores de frecuencia de la planta de enfriadores y las fuentes conmutadas dentro de cada servidor GPU producen corriente no senoidal. La IEEE 519-2014 establece el marco de diseño —en líneas generales, un límite de distorsión armónica total del 8 % en el punto de acoplamiento común para usuarios industriales generales— y los transformadores que sirven a estas cargas necesitan una clasificación de factor K (o una reducción equivalente según ANSI/IEEE C57.110) para absorber el calentamiento sin perder capacidad de placa.

Las cargas son dinámicas. Un trabajo de entrenamiento de IA puede oscilar decenas de megavatios en segundos cuando se vacía un checkpoint o se reinicia un trabajo. La coordinación de protecciones, el comportamiento del cambiador de derivaciones bajo carga y la respuesta de cualquier almacenamiento con baterías en la barra deben diseñarse contra la curva de carga real, no el estado estacionario.

Densidad de rack, antes y ahora

GeneraciónAñoPotencia típica por rackRégimen de enfriamiento
TI empresarial2005–20185–10 kWAire, contención de pasillo caliente
Nube/colocación pre-IA2018–202210–25 kWAire + intercambiador de puerta trasera
Cómputo acelerado temprano2022–202425–60 kWAire + líquido directo al chip
NVIDIA GB200 NVL722024–2025~120 kWLíquido directo al chip
NVIDIA Vera Rubin NVL1442026~600 kW (objetivo)Líquido directo al chip
Referencia OCP 20252025–2027hasta 1 MWLíquido directo al chip + inmersión

La duplicación no sigue una línea estilo Moore; las densidades llegan en saltos, y cada uno redibuja la arquitectura de enfriamiento y de potencia por debajo.

La jerarquía de tensiones: del enlace con el servicio público al rack

Un campus de IA de 100 megavatios típicamente organiza su cadena de potencia en cuatro etapas de tensión distintas. Cada una tiene su propio equipo dominante, su propia restricción y —en el mercado actual— su propio plazo de entrega.

EtapaClase de tensiónEquipo típicoLo que debe entregar
Enlace con el servicio115–345 kVSubestación de alta tensión, transformadores GSUAsignación de capacidad, coordinación de nivel de falla con la red
Colector de campus33 / 34.5 / 35 kVSubestaciones prefabricadas o construidas en sitio, celdas GISDistribución entre salas de datos, manejo de armónicos y cortocircuito
Alimentador de edificio11 / 12.47 / 13.8 kVCeldas metal-clad de interior, transformadores reductores tipo seco o sumergidos en aceiteProtección selectiva, eficiencia a carga parcial en servicio 24/7
Distribución de TI480 V (NA) / 415 V (IEC)Barra ducto (busway), transformadores con clasificación K, UPSCapacidad de factor K, muy bajo desbalance de neutro, respaldo de subciclo

La capa “colector de campus” de 33-35 kV es donde reside ahora la mayoría de las especificaciones de equipos de un centro de datos de IA, porque es la menor tensión que puede mover 100 MW a través de un campus de múltiples edificios sin un número impráctico de alimentadores. Los transformadores y las celdas de esa capa son los que fijan el reloj de adquisición.

Especificación de transformadores: dónde divergen las cargas de IA

Tres especificaciones importan más de lo que sugiere la literatura de marketing.

Factor K. ANSI/IEEE C57.110 define cómo se reduce un transformador bajo carga no lineal. Una unidad estándar (K-1) que alimenta carga de TI pesada funciona a aproximadamente el 60 % de la placa antes de que las temperaturas del estátor violen los límites de la clase de aislamiento. K-13 es la elección convencional para salas de TI generales; K-20 se especifica donde variadores industriales comparten la barra, común en campus de colocación de hiperescala con plantas mecánicas muy grandes.

Eficiencia a carga parcial. Un centro de datos funciona cerca de plena carga casi todo el tiempo. El número de eficiencia a plena carga en una placa importa menos que la curva de pérdidas al 70-90 % de carga, donde la unidad realmente pasará su vida. Especifique tanto las pérdidas en vacío como las pérdidas con carga, y verifíquelas contra el perfil de carga diario, no el máximo de diseño.

Familia de normas. IEEE / ANSI / CSA C57 es la familia norteamericana; IEC 60076 es la familia internacional. Son similares pero no intercambiables: las pruebas de cortocircuito, los regímenes de cambiadores de derivaciones y las tolerancias de impedancia se definen de forma diferente. Los proyectos norteamericanos que alimentan una distribución NEMA / NEC aguas abajo requieren IEEE / CSA. Los proyectos que siguen la práctica de distribución IEC (y los operadores internacionales de colocación que estandarizan entre regiones) requieren IEC.

Tipo de cargaRecomendación de factor KNotas
TI comercial ligera (oficinas, borde)K-4LED lineal + carga electrónica ligera
TI general de centro de datosK-13UPS, fuentes conmutadas dominan el espectro armónico
GPU de hiperescala / intensivo en entrenamientoK-13 a K-20Mayor contenido de 5.º y 7.º armónico bajo oscilaciones de carga
TI mixta + variador industrial (enfriadores)K-20El contenido armónico del variador se suma al espectro de TI

(Tabla de factor K adaptada de la práctica de reducción de ANSI/IEEE C57.110.)

Celdas, niveles de falla y el problema BYOP

Cuando un campus añade su propia generación —una planta de gas detrás del medidor, un arreglo de celdas de combustible o un BESS de varios megavatios— el nivel de falla en la barra de media tensión aumenta. Un conjunto de celdas especificado contra una contribución de falla solo del servicio público es la razón más común por la que una adaptación BYOP se estanca en la energización.

Ahora son estándar dos respuestas de diseño. La primera es especificar las celdas aisladas en gas de 33/35 kV en el colector de campus con una capacidad de interrupción mayor que la que demanda la carga —típicamente de 25 a 31,5 kA, donde 16 kA podría haber sido adecuado hace diez años—. La segunda es cablear el BESS y cualquier generación en sitio a través de protección dedicada limitadora de corriente, de modo que su contribución de falla quede acotada antes de llegar a la barra principal.

Almacenamiento con baterías: respaldo, cargos por demanda y servicios de red

Un BESS de iones de litio de 5 a 15 minutos ubicado en la barra de media tensión hace tres cosas a la vez en un campus de IA.

Brinda respaldo (ride-through) para eventos de la red que duran más de lo que las baterías del UPS pueden cubrir (típicamente unos pocos minutos), reduciendo la dependencia del respaldo diésel o de gas para cortes breves. Aplana la curva de carga que ve el servicio público, recortando el componente de cargo por demanda de la factura eléctrica, que en sitios de hiperescala es un número estructuralmente grande. Y donde el servicio público tiene una tarifa de participación, puede ofrecer respuesta de frecuencia o capacidad de vuelta a la red, monetizando parcialmente el mismo activo.

El BESS no reemplaza al UPS. El respaldo de subciclo (el tipo que evita que un trabajo se caiga ante una caída de tensión) sigue siendo tarea del UPS. Las dos capas se complementan entre sí.

Tiempo para tener energía: a dónde se va realmente el calendario

El número que en última instancia determina cuándo un campus de IA sirve una carga de trabajo es el tiempo para tener energía, y el desglose es implacable.

FaseDuración típica (meses)
Selección de sitio, servidumbres, revisión ambiental6–18
Estudio de interconexión con servicio público y fila18–60
Adquisición de equipos (subestación, equipo MT)24–60
Obras civiles del sitio6–12
Construcción y puesta en servicio de subestación4–8
Acondicionamiento de sala de datos e instalación de GPU6–9

La mayoría de estas fases corren en paralelo. La que casi siempre fija el cronograma es la línea de adquisición de equipos, porque ninguna de las demás puede terminar sin ella. Esa es la línea que el equipo EPC tiene más libertad para acortar, y la que la mayoría de los proyectos acorta de último.

Dónde encaja Entogo

Entogo fabrica los transformadores, subestaciones prefabricadas, celdas de media tensión y tableros de baja tensión y el almacenamiento con baterías de los que depende un campus de IA, en su propia fábrica de origen con una cadena de suministro integrada verticalmente. Los equipos de catálogo de norma europea (IEC/CE) se despachan en un promedio de 12 semanas —muy por dentro de las cifras de uno a cuatro años del mercado abierto publicadas por el DOE— y dentro de 36 semanas incluso cuando un producto requiere una nueva certificación UL u otra certificación norteamericana.

Tres tipos de involucramiento se convierten en especificaciones con más frecuencia. Un brief de solución para centro de datos de IA define la jerarquía de tensiones del campus y la lista corta de equipos. El lado del transformador se configura luego según ANSI/IEEE C57 o IEC 60076 (un configurador en línea ejecuta la selección de factor K, capacidad, tensión y enfriamiento en cinco pasos). Las capas de subestación de media tensión y de almacenamiento se derivan de la misma revisión de ingeniería.

El lado del cómputo de un campus de IA avanza al ritmo de la hoja de ruta de NVIDIA. El lado de la potencia es ahora el poste más largo. Los equipos que llegan antes que el resto a los primeros ingresos no tienen una GPU diferente; tienen una cadena de suministro de equipos de potencia que no está en la fila del mercado abierto.

FAQ

Preguntas frecuentes

¿Cuánta energía usa realmente un centro de datos de IA?
Un campus de IA moderno ahora planifica de 50 a 500 MW en un solo sitio, y varias construcciones anunciadas apuntan a 1 GW. La actualización de diciembre de 2024 del Lawrence Berkeley National Laboratory para el Departamento de Energía de EE. UU. estima que los centros de datos de EE. UU. consumieron alrededor del 4,4 % de la electricidad nacional en 2023 (aproximadamente 176 TWh) y consumirán entre el 6,7 % y el 12 % para 2028. El análisis Powering Intelligence de EPRI traza la misma trayectoria hasta 2030 y llega al 9 %-17 % de la electricidad de EE. UU., con el entrenamiento de IA como el mayor impulsor individual.
¿Qué tipo de transformador necesita un centro de datos de IA?
Dos cosas cambian frente a una carga comercial convencional. Primero, las cargas de UPS y de TI son no lineales, por lo que los transformadores que las alimentan se especifican con un factor K (comúnmente K-13 para racks de TI pesados, K-20 donde variadores industriales comparten la barra) para manejar el calentamiento armónico sin reducir por debajo de la placa según ANSI/IEEE C57.110. Segundo, la unidad funciona cerca de plena carga 24/7, por lo que las bajas pérdidas a carga parcial y un enfriamiento ONAN/ONAF dimensionado para ese servicio importan más que la holgura de pico. A escala de campus, la elección dominante es un transformador de potencia clase 33/35 kV sumergido en aceite, construido según ANSI/IEEE C57.12 o IEC 60076, que alimenta celdas de interior de 11-13,8 kV y distribución aguas abajo de 480 V (Norteamérica) o 415 V (internacional).
¿Por qué son tan largos ahora los plazos de transformadores y subestaciones para centros de datos?
Se combinan dos presiones. El acero eléctrico de grano orientado (GOES) —el material del núcleo de cada transformador de potencia y aproximadamente el 25 % del costo de un gran transformador de potencia según el Departamento de Energía de EE. UU.— está concentrado en un pequeño número de acerías, con Butler Works de Cleveland-Cliffs como único productor de EE. UU. Al mismo tiempo, la construcción de centros de datos de IA ha reconfigurado la cartera de pedidos. El informe Large Power Transformer Resilience Report de julio de 2024 del DOE sitúa los plazos actuales de LPT en 80 a 210 semanas —aproximadamente 1,5 a 4 años— y los paquetes de subestación se han extendido a tres a cinco años en gran parte de Norteamérica.
¿Puede el almacenamiento de energía con baterías reemplazar al UPS en un centro de datos de IA?
A nivel de rack, las baterías de iones de litio ya lo hacen, pues están dentro de la mayoría de los skids de UPS modernos como el almacén de energía. El movimiento más reciente es colocar un BESS de iones de litio de 5 a 15 minutos en el lado de media tensión del edificio, brindando respaldo (ride-through) para eventos de la red más servicios orientados a la red eléctrica que un UPS estático no ofrece, como la reducción de picos de demanda frente a los cargos por demanda y el soporte de frecuencia si el servicio público lo permite. Esto no elimina la necesidad de una capa de UPS para el respaldo de subciclo; la complementa.
¿Qué es "traer tu propia energía" (bring your own power) para los centros de datos de IA?
BYOP describe un campus que aporta su propia generación detrás del medidor —típicamente motores recíprocos de gas natural o celdas de combustible, cada vez más combinados con solar más almacenamiento en sitio— para que la carga de trabajo pueda energizar mientras la solicitud formal de interconexión con el servicio público continúa en la fila. Es una respuesta a las filas de subestación y transmisión que con frecuencia superan el cronograma de construcción de la propia sala de datos, y el lado de los equipos (transformadores, celdas/tableros, BESS) enfrenta las mismas restricciones de suministro que el lado del servicio público.

Para leer a continuación

Análisis relacionados

Solicitud de proyecto

Convierta la necesidad en un sistema especificado.