NVIDIA 發佈 Rubin:六款新晶片驅動下一代 AI 超級電腦

簡要內容

Nvidia 在 2026 年 CES 展示了 Rubin 平台,將六款新晶片整合成一個統一的 AI 超級電腦,提供比 Blackwell 系列高出 5 倍的訓練運算能力。

NVIDIA Unveils Rubin: Six New Chips Power Next-Gen AI Supercomputer

科技公司 NVIDIA 在 2026 年 CES 展示了 Rubin 平台,推出由六款新晶片組成的統一 AI 超級電腦,整體提供比 Blackwell 系列高出五倍的訓練運算能力。該平台旨在為建構、部署與保護大規模 AI 系統設定新標準,同時降低成本以促進 AI 技術的更廣泛應用。

Rubin 平台通過其六個元件的緊密共同設計來實現性能,包括 NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6 Switch、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU 以及 NVIDIA Spectrum-6 乙太網路交換器。這種整合方式縮短訓練時間並降低推論代幣成本。

Rubin 引入五項關鍵創新,包括新一代 NVLink 互連、Transformer 引擎、機密運算、RAS 引擎,以及 NVIDIA Vera CPU。這些進步使得代理 AI、進階推理與大規模混合專家模型((MoE))的推論成本比 Blackwell 平台低十倍。系統能以四分之一的 GPU 數量訓練 MoE 模型,進一步加速 AI 的普及。

預計該平台將由領先的 AI 實驗室、雲端服務提供商、硬體製造商與新創公司部署,包括 Amazon Web Services (AWS)、Anthropic、Black Forest Labs、Cisco、Cohere、CoreWeave、Cursor、Dell Technologies、Google、Harvey、HPE、Lambda、Lenovo、Meta、Microsoft、Mistral AI、Nebius、Nscale、OpenAI、OpenEvidence、Oracle Cloud Infrastructure (OCI)、Perplexity、Runway、Supermicro、Thinking Machines Lab 以及 xAI。

揭示 AI 原生存儲與軟體定義基礎設施,打造 AI 工廠

NVIDIA Rubin 引入一套 AI 原生存儲與安全的軟體定義基礎設施,旨在高效支援大規模 AI 工作負載。由 BlueField-4 驅動的 NVIDIA 推理上下文記憶體存儲平台,能快速共享與重用鍵值快取資料,提升多回合代理 AI 應用的吞吐量與能源效率。BlueField-4 亦包含先進的安全可信資源架構((ASTRA)),提供在裸金屬與多租戶 AI 環境中安全配置與隔離的單一可信控制點。

該平台提供多種配置,包括整合 72 個 Rubin GPU、36 個 Vera CPU、NVLink 6、ConnectX-9 SuperNICs 以及 BlueField-4 DPU 的 Vera Rubin NVL72,以及連接八個 Rubin GPU 支援 x86 架構生成式 AI 平台的 HGX Rubin NVL8。NVIDIA DGX SuperPOD 作為部署 Rubin 系統的參考架構,結合計算、網路與管理軟體。

下一代網路與存儲由 Spectrum-6 與 Spectrum-X 乙太網路平台提供,特色包括共包光學元件、AI 優化的傳輸架構與高速 200G SerDes 通訊。這些創新提升可靠性、能源效率與擴展性,使 Rubin 為基礎的 AI 工廠能跨多個站點運作為統一環境,並支援未來百萬 GPU 基礎設施。

NVIDIA Rubin 完整量產,準備部署於雲端與 AI 實驗室

新平台已全面量產,預計 Rubin 系統將於 2026 年下半年由合作夥伴提供。主要雲端服務商,包括 AWS、Google Cloud、Microsoft 及 OCI,以及 NVIDIA Cloud Partners 如 CoreWeave、Lambda、Nebius 與 Nscale,將率先部署 Rubin 系統。微軟計畫將 NVIDIA Vera Rubin NVL72 機架規模系統整合進下一代 AI 數據中心,包括未來的 Fairwater AI 超工廠,作為企業、研究與消費應用的高階訓練與推論工作負載基礎。

CoreWeave 將在其 AI 雲端平台中加入 Rubin 系統,支援多種架構並優化訓練、推論與代理 AI 工作負載的性能。Cisco、Dell、HPE、Lenovo 及 Supermicro 亦預計提供基於 Rubin 產品的伺服器。包括 Anthropic、Cohere、OpenAI、Meta 等在內的領先 AI 實驗室,正採用 Rubin 以訓練更大、更強的模型,並支援長上下文、多模態系統,較前代 GPU 具有更低延遲與成本。

基礎建設與存儲合作夥伴,如 IBM、NetApp、Nutanix、Pure Storage、SUSE 及 VAST Data,正與 NVIDIA 合作設計下一代 Rubin 平台。Rubin 是 NVIDIA 第三代機架規模架構,擁有超過 80 個 MGX 生態系合作夥伴。Red Hat 宣布擴展合作,提供專為 Rubin 優化的完整 AI 堆疊,利用其混合雲產品組合,包括 Red Hat Enterprise Linux、OpenShift 及 Red Hat AI,廣泛應用於《財富》全球500強企業。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)