NVIDIA 正式發表全新 Rubin 平台,不只是一顆新 GPU,而是一整套為「下一世代 AI 工廠」打造的完整架構。從 CPU、GPU、網路、交換器到安全與儲存,Rubin 一口氣推出 六款全新晶片,目標只有一個:讓大型 AI 訓練與推論變得更快、更省、更能規模化。
六晶片齊發,不只是換代,是「整組重做」
Rubin 平台採用 NVIDIA 所謂的「極致協同設計」,六大關鍵元件同時更新:
- Vera CPU:為代理型 AI 與推理工作負載打造
- Rubin GPU:第三代 Transformer Engine,主打推論效率
- NVLink 6 交換器:GPU 對 GPU 超高速互連
- ConnectX-9 SuperNIC:專為 AI 網路最佳化
- BlueField-4 DPU:負責儲存、資安與資料流控
- Spectrum-6 乙太網路交換器:支援光子學與 AI 網路架構
這不是單點升級,而是從晶片到機架、從硬體到軟體的全面翻新。
關鍵數字一次看懂
相較前一代 Blackwell 平台,Rubin 帶來幾個關鍵突破:
- AI 推論每個詞元(token)成本最多降低 10 倍
- 訓練混合專家(MoE)模型所需 GPU 數量減少 4 倍
- Spectrum-X 光子乙太網路:
- 能源效率提升 5 倍
- 系統正常運作時間提升 5 倍
- NVLink 6:
- 每顆 GPU 提供 3.6TB/s 頻寬
- 單一 NVL72 機架總頻寬高達 260TB/s
簡單說,就是 更少硬體、做更多 AI。
為「代理型 AI」與長情境推理而生
Rubin 特別針對近年快速成長的三種 AI 工作負載設計:
- 代理型 AI(Agentic AI)
- 長上下文、多步驟推理模型
- 大規模混合專家(MoE)模型
透過新版 Transformer Engine、NVFP4 精度、情境記憶儲存平台(Inference Context Memory Storage),Rubin 能有效管理龐大的推論情境資料,避免重算、降低延遲,也讓 AI 回應更快、更穩定。
機架級 AI 超級電腦正式成形
Rubin 並非單顆晶片,而是直接提供「整櫃解法」:
- Vera Rubin NVL72:
- 72 顆 Rubin GPU
- 36 顆 Vera CPU
- 完整 NVLink 6、BlueField-4、ConnectX-9 整合
- HGX Rubin NVL8:
- 8 顆 Rubin GPU
- 支援 x86 架構伺服器
NVIDIA 也同步推出 DGX SuperPOD(Rubin 版),作為大規模 AI 工廠的標準參考架構。
雲端與 AI 巨頭全面站隊
Rubin 平台已獲得產業重量級玩家表態採用,包括:
- 雲端服務:AWS、Google Cloud、Microsoft Azure、Oracle OCI、CoreWeave
- AI 實驗室:OpenAI、Anthropic、Meta、xAI、Mistral、Perplexity
- 硬體夥伴:Dell、HPE、Lenovo、Supermicro、Cisco
其中微軟更將 Rubin NVL72 導入下一代 Fairwater AI 超級工廠,規模將擴展至數十萬顆 GPU。
上市時程
- Rubin 平台已全面投產
- 2026 年下半年:合作夥伴系統正式出貨
- 首波雲端部署:AWS、Google Cloud、Azure、OCI、CoreWeave 等
總結一句話
Rubin 不是「更快的 GPU」,而是 NVIDIA 對未來 AI 世界的完整藍圖。
從單卡競賽,正式進入「機架級 AI 工廠」時代。




