NVIDIA lleva la simulación de gemelos digitales a centros de datos

Las tecnologías que impulsan los siete millones de centros de datos del mundo están cambiando rápidamente. Las más recientes han permitido a las organizaciones de TI reducir los costos incluso mientras lidian con el crecimiento exponencial de los datos.

La simulación y los gemelos digitales pueden ayudar a los diseñadores, fabricantes y operadores de centros de datos a crear instalaciones altamente eficientes y de alto rendimiento. Sin embargo, construir un gemelo digital que pueda representar con precisión todos los componentes de una instalación de supercomputación de inteligencia artificial (IA) es una tarea enorme y compleja.

La plataforma de simulación NVIDIA Omniverse ayuda a resolver este desafío, ya que a optimiza el proceso de diseño virtual y colaborativo. Una demostración de Omniverse en la conferencia SC22 mostró cómo las personas detrás de los centros de datos pueden utilizar esta plataforma de desarrollo abierto para mejorar el diseño y la creación de instalaciones de supercomputación complejas.

Omniverse, por primera vez, permite a los operadores de centros de datos agregar entradas de datos en tiempo real de sus principales aplicaciones de diseño, simulación y monitoreo asistidas por computación de terceros para que puedan ver sus conjuntos de datos completos y trabajar con ellos en tiempo real.

La demostración muestra cómo Omniverse permite a los usuarios aprovechar el poder de la computación acelerada, la simulación y los gemelos digitales operativos conectados al monitoreo en tiempo real y la IA. Esto permite a los equipos optimizar el diseño, la construcción y la implementación de instalaciones, y optimizar las operaciones en curso.

También durante la demostración se destacó NVIDIA Air, una plataforma de simulación de centros de datos diseñada para trabajar junto con Omniverse para simular la red, el sistema nervioso central del centro de datos. Con NVIDIA Air, los equipos pueden modelar toda la pila de red, lo que les permite automatizar y validar el hardware y el software de la red antes de su lanzamiento.

Creación de Digital Twins para Mejorar el Diseño y la Simulación

Durante la planificación y la construcción de una de las últimas supercomputadoras de IA de NVIDIA, se recolectaron múltiples conjuntos de datos CAD de ingeniería mediante herramientas de la industria de terceros como Trimble.

Esto permitió a los diseñadores e ingenieros ver el modelo basado en Universal Scene Description con total fidelidad. Además, podían iterar de forma colaborativa en el diseño en tiempo real.

PATCH MANAGER es una aplicación de software empresarial para planificar el cableado, los recursos y la conectividad punto a punto de la capa física en dominios de red. Con PATCH MANAGER conectado a Omniverse, la topología compleja de las conexiones de puerto a puerto, los diseños de nodos y racks, y el cableado se puede integrar directamente en el modelo en vivo. Esto permite a los ingenieros de centros de datos ver la vista completa del modelo y sus dependencias.

Para predecir el flujo de aire y las transferencias de calor, los ingenieros utilizaron Cadence 6SigmaDCX, un software para la dinámica de fluidos computacional. Los ingenieros también pueden usar sustitutos de IA entrenados con NVIDIA Modulus para analizar situaciones hipotéticas casi en tiempo real. Esto permite a los equipos simular cambios en sistemas térmicos y de enfriamiento complejos, y pueden ver los resultados instantáneamente.

Además, con NVIDIA Air, la topología exacta de la red, incluidos los protocolos, el monitoreo y la automatización, se puede simular y validar previamente.

Una vez que finaliza la construcción de un centro de datos, sus sensores, sistema de control y telemetría se pueden conectar al gemelo digital dentro de Omniverse, lo que permite el monitoreo en tiempo real de las operaciones. Con un gemelo digital perfectamente sincronizado, los ingenieros pueden simular peligros comunes como picos de energía o fallas del sistema de enfriamiento.

El gemelo digital también les permite probar y validar actualizaciones de software y de componentes antes de implementarlas en el data center físico.

Artículos relacionados

Back to top button