NVIDIA Rubin 正式登場,宣告 AI 進入「機架級」新世代

NVIDIA 正式發表全新 Rubin 平台,不只是一顆新 GPU,而是一整套為「下一世代 AI 工廠」打造的完整架構。從 CPU、GPU、網路、交換器到安全與儲存,Rubin 一口氣推出 六款全新晶片,目標只有一個:讓大型 AI 訓練與推論變得更快、更省、更能規模化

六晶片齊發,不只是換代,是「整組重做」

Rubin 平台採用 NVIDIA 所謂的「極致協同設計」,六大關鍵元件同時更新:

  • Vera CPU:為代理型 AI 與推理工作負載打造
  • Rubin GPU:第三代 Transformer Engine,主打推論效率
  • NVLink 6 交換器:GPU 對 GPU 超高速互連
  • ConnectX-9 SuperNIC:專為 AI 網路最佳化
  • BlueField-4 DPU:負責儲存、資安與資料流控
  • Spectrum-6 乙太網路交換器:支援光子學與 AI 網路架構

這不是單點升級,而是從晶片到機架、從硬體到軟體的全面翻新


關鍵數字一次看懂

相較前一代 Blackwell 平台,Rubin 帶來幾個關鍵突破:

  • AI 推論每個詞元(token)成本最多降低 10 倍
  • 訓練混合專家(MoE)模型所需 GPU 數量減少 4 倍
  • Spectrum-X 光子乙太網路
    • 能源效率提升 5 倍
    • 系統正常運作時間提升 5 倍
  • NVLink 6
    • 每顆 GPU 提供 3.6TB/s 頻寬
    • 單一 NVL72 機架總頻寬高達 260TB/s

簡單說,就是 更少硬體、做更多 AI


為「代理型 AI」與長情境推理而生

Rubin 特別針對近年快速成長的三種 AI 工作負載設計:

  1. 代理型 AI(Agentic AI)
  2. 長上下文、多步驟推理模型
  3. 大規模混合專家(MoE)模型

透過新版 Transformer Engine、NVFP4 精度、情境記憶儲存平台(Inference Context Memory Storage),Rubin 能有效管理龐大的推論情境資料,避免重算、降低延遲,也讓 AI 回應更快、更穩定。


機架級 AI 超級電腦正式成形

Rubin 並非單顆晶片,而是直接提供「整櫃解法」:

  • Vera Rubin NVL72
    • 72 顆 Rubin GPU
    • 36 顆 Vera CPU
    • 完整 NVLink 6、BlueField-4、ConnectX-9 整合
  • HGX Rubin NVL8
    • 8 顆 Rubin GPU
    • 支援 x86 架構伺服器

NVIDIA 也同步推出 DGX SuperPOD(Rubin 版),作為大規模 AI 工廠的標準參考架構。


雲端與 AI 巨頭全面站隊

Rubin 平台已獲得產業重量級玩家表態採用,包括:

  • 雲端服務:AWS、Google Cloud、Microsoft Azure、Oracle OCI、CoreWeave
  • AI 實驗室:OpenAI、Anthropic、Meta、xAI、Mistral、Perplexity
  • 硬體夥伴:Dell、HPE、Lenovo、Supermicro、Cisco

其中微軟更將 Rubin NVL72 導入下一代 Fairwater AI 超級工廠,規模將擴展至數十萬顆 GPU


上市時程

  • Rubin 平台已全面投產
  • 2026 年下半年:合作夥伴系統正式出貨
  • 首波雲端部署:AWS、Google Cloud、Azure、OCI、CoreWeave 等

總結一句話

Rubin 不是「更快的 GPU」,而是 NVIDIA 對未來 AI 世界的完整藍圖。
從單卡競賽,正式進入「機架級 AI 工廠」時代。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *