NVIDIA presenta Rubin: Seis nuevos chips que impulsan la supercomputadora de IA de próxima generación

En Resumen

Nvidia presentó la plataforma Rubin en CES 2026, combinando seis nuevos chips en una supercomputadora de IA unificada que ofrece 5 veces más capacidad de entrenamiento que su línea Blackwell.

NVIDIA Unveils Rubin: Six New Chips Power Next-Gen AI Supercomputer

La empresa tecnológica NVIDIA presentó la plataforma Rubin en CES 2026, introduciendo una supercomputadora de IA unificada construida a partir de seis nuevos chips que en conjunto ofrecen cinco veces más capacidad de entrenamiento que la serie Blackwell. La plataforma está diseñada para establecer un nuevo estándar en la construcción, implementación y seguridad de sistemas de IA a gran escala, minimizando los costos para apoyar una adopción más amplia de la tecnología de IA.

La plataforma Rubin logra su rendimiento mediante un diseño conjunto estrecho en sus seis componentes: la CPU NVIDIA Vera, la GPU NVIDIA Rubin, el Switch NVIDIA NVLink 6, la SuperNIC NVIDIA ConnectX-9, el DPU NVIDIA BlueField-4 y el Switch Ethernet NVIDIA Spectrum-6. Este enfoque integrado reduce los tiempos de entrenamiento y disminuye los costos por token de inferencia.

Rubin introduce cinco innovaciones clave, incluyendo interconexiones NVLink de próxima generación, el Motor Transformer, la Computación Confidencial, el Motor RAS y la CPU NVIDIA Vera. Estos avances permiten IA agentica, razonamiento avanzado y inferencia de modelos de mezcla de expertos (MoE) a hasta diez veces menor costo por token en comparación con la plataforma Blackwell. El sistema puede entrenar modelos MoE con cuatro veces menos GPUs, acelerando aún más la adopción de IA.

Se espera que la plataforma sea desplegada por laboratorios líderes en IA, proveedores de servicios en la nube, fabricantes de hardware y startups, incluyendo Amazon Web Services (AWS), Anthropic, Black Forest Labs, Cisco, Cohere, CoreWeave, Cursor, Dell Technologies, Google, Harvey, HPE, Lambda, Lenovo, Meta, Microsoft, Mistral AI, Nebius, Nscale, OpenAI, OpenEvidence, Oracle Cloud Infrastructure (OCI), Perplexity, Runway, Supermicro, Thinking Machines Lab y xAI.

Presentación del almacenamiento nativo de IA y infraestructura definida por software para fábricas de IA

NVIDIA Rubin introduce un almacenamiento nativo de IA y una infraestructura segura definida por software diseñada para soportar cargas de trabajo de IA a gran escala de manera eficiente. La Plataforma de Almacenamiento de Memoria de Contexto de Inferencia de NVIDIA, impulsada por BlueField-4, permite compartir y reutilizar rápidamente datos de caché clave-valor, mejorando el rendimiento y la eficiencia energética para aplicaciones de IA agentica de múltiples turnos. BlueField-4 también incluye la Arquitectura de Recursos Confiables y Seguros Avanzados (ASTRA), proporcionando un punto de control único y confiable para la provisión segura y el aislamiento en entornos de IA bare-metal y multiinquilino.

La plataforma se ofrece en varias configuraciones, incluyendo la Vera Rubin NVL72, que integra 72 GPUs Rubin, 36 CPUs Vera, NVLink 6, SuperNICs ConnectX-9 y DPU BlueField-4, y el HGX Rubin NVL8, que conecta ocho GPUs Rubin para soportar plataformas de IA generativa basadas en x86. El sistema NVIDIA DGX SuperPOD sirve como arquitectura de referencia para desplegar sistemas Rubin a gran escala, combinando computación, redes y software de gestión.

Las redes y almacenamiento de próxima generación son proporcionados por las plataformas Ethernet Spectrum-6 y Spectrum-X, que cuentan con ópticas integradas, tejidos optimizados para IA y comunicación SerDes de alta velocidad de 200G. Estas innovaciones ofrecen mayor fiabilidad, eficiencia energética y escalabilidad, permitiendo que las fábricas de IA basadas en Rubin operen en múltiples sitios como entornos unificados y soporten futuras infraestructuras de millones de GPUs.

NVIDIA Rubin en plena producción, listo para su despliegue en la nube y laboratorios de IA

La nueva plataforma ha entrado en plena producción, y se espera que los sistemas basados en Rubin estén disponibles a través de socios en la segunda mitad de 2026. Los principales proveedores de la nube, incluyendo AWS, Google Cloud, Microsoft y OCI, así como socios en la nube de NVIDIA como CoreWeave, Lambda, Nebius y Nscale, son de los primeros en desplegar instancias con Rubin. Microsoft planea integrar los sistemas de escala rack NVIDIA Vera Rubin NVL72 en los centros de datos de IA de próxima generación, incluyendo futuros sitios de la superfábrica Fairwater AI, formando la base para cargas de trabajo avanzadas de entrenamiento e inferencia en empresas, investigación y aplicaciones de consumo.

CoreWeave incorporará sistemas Rubin en su plataforma de nube de IA, soportando múltiples arquitecturas y permitiendo un rendimiento optimizado para entrenamiento, inferencia y cargas de trabajo de IA agentica. Se espera que Cisco, Dell, HPE, Lenovo y Supermicro también ofrezcan servidores basados en productos Rubin. Laboratorios de IA líderes, como Anthropic, Cohere, OpenAI, Meta y otros, están adoptando Rubin para entrenar modelos más grandes y capaces, y soportar sistemas multimodales de largo contexto con menor latencia y costo en comparación con generaciones anteriores de GPU.

Socios de infraestructura y almacenamiento, como IBM, NetApp, Nutanix, Pure Storage, SUSE y VAST Data, colaboran con NVIDIA en el diseño de plataformas Rubin de próxima generación. Rubin representa la tercera generación de arquitectura en rack de NVIDIA, respaldada por más de 80 socios del ecosistema MGX. Red Hat ha anunciado una colaboración ampliada para ofrecer un stack de IA completo optimizado para Rubin, aprovechando su portafolio de nube híbrida que incluye Red Hat Enterprise Linux, OpenShift y Red Hat AI, ampliamente utilizado en las empresas Fortune Global 500.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)