
NVIDIA released the new generation Rubin platform, with inference costs reduced by 10 times compared to Blackwell, and plans to ship in the second half of the year

英偉達發佈新一代 Rubin 平台,訓練性能是 Blackwell 的 3.5 倍,運行 AI 軟件的性能則提升 5 倍,訓練混合專家模型所需 GPU 數量減少 4 倍,推理成本較 Blackwell 降 10 倍。黃仁勳稱,全部六款 Rubin 芯片已通過顯示其可按計劃部署的關鍵測試。英偉達稱該平台已全面投產,擬下半年發貨,亞馬遜 AWS、谷歌雲、微軟和甲骨文雲等雲服務商將率先部署。
英偉達在 CES 展會推出新一代 Rubin AI 平台,標誌着其在人工智能(AI)芯片領域保持年度更新節奏。該平台通過六款新芯片的集成設計,在推理成本和訓練效率上實現大幅躍升,將於 2026 年下半年交付首批客户。
美東時間 5 日週一,英偉達 CEO 黃仁勳在拉斯維加斯表示,六款 Rubin 芯片已從合作製造方處回廠,並已通過部分關鍵測試,正按計劃推進。他指出"AI 競賽已經開始,所有人都在努力達到下一個水平"。英偉達強調,基於 Rubin 的系統運行成本將低於 Blackwell 版本,因為它們用更少組件即可實現相同結果。
微軟和其他大型雲計算提供商將成為下半年首批部署新硬件的客户。微軟的下一代 Fairwater AI 超級工廠將配備英偉達 Vera Rubin NVL72 機架級系統,規模可擴展至數十萬顆英偉達 Vera Rubin 超級芯片。CoreWeave 也將是首批提供 Rubin 系統的供應商之一。
該平台的推出正值華爾街部分人士擔憂英偉達面臨競爭加劇,並懷疑 AI 領域的支出能否維持當前速度。但英偉達保持長期看漲預測,認為總市場規模可達數萬億美元。
性能提升瞄準新一代 AI 需求
據英偉達公告,Rubin 平台的訓練性能是前代 Blackwell 的 3.5 倍,運行 AI 軟件的性能則提升 5 倍。與 Blackwell 平台相比,Rubin 可將推理 token 生成成本降低至多 10 倍,訓練混合專家模型(MoE)所需 GPU 數量減少 4 倍。
新平台配備的 Vera CPU 擁有 88 個核心,性能是其替代產品的兩倍。這款 CPU 專為代理推理設計,是大規模 AI 工廠中能效最高的處理器,採用 88 個定製 Olympus 核心、完整 Armv9.2 兼容性和超快 NVLink-C2C 連接。
Rubin GPU 配備第三代 Transformer 引擎,具備硬件加速自適應壓縮功能,可提供 50 petaflops 的 NVFP4 計算能力用於 AI 推理。每個 GPU 提供 3.6TB/s 的帶寬,而 Vera Rubin NVL72 機架則提供 260TB/s 帶寬。
芯片測試進展順利
黃仁勳披露,全部六款 Rubin 芯片已從製造合作伙伴處返回,並已通過顯示其可按計劃部署的關鍵測試。這一表態表明英偉達正維持其作為 AI 加速器領先製造商的優勢地位。
該平台包含五大創新技術:第六代 NVLink 互連技術、Transformer 引擎、機密計算、RAS 引擎以及 Vera CPU。其中第三代機密計算技術使 Vera Rubin NVL72 成為首個提供跨 CPU、GPU 和 NVLink 域數據安全保護的機架級平台。
第二代 RAS 引擎橫跨 GPU、CPU 和 NVLink,具備實時健康檢查、容錯和主動維護功能,以最大化系統生產力。機架採用模塊化、無線纜托盤設計,組裝和維護速度比 Blackwell 快 18 倍。
廣泛生態系統支持
英偉達表示,包括亞馬遜的 AWS、谷歌雲、微軟和甲骨文雲在 2026 年將率先部署基於 Vera Rubin 的實例,雲合作伙伴 CoreWeave、Lambda、Nebius 和 Nscale 也將跟進。
OpenAI CEO Sam Altman 表示:“智能隨計算擴展。當我們增加更多計算時,模型變得更強大,能解決更難的問題,為人們帶來更大影響。英偉達 Rubin 平台幫助我們持續擴展這一進展。”
Anthropic 聯合創始人兼 CEO Dario Amodei 稱,英偉達 “Rubin 平台的效率提升代表了能夠實現更長記憶、更好推理和更可靠輸出的基礎設施進步”。
Meta CEO 扎克伯格表示,英偉達的 “Rubin 平台有望帶來性能和效率的階躍式變化,這是將最先進模型部署給數十億人所需要的”。
英偉達還稱,思科、戴爾、惠普企業、聯想和超微預計將推出基於 Rubin 產品的各類服務器。包括 Anthropic、Cohere、Meta、Mistral AI、OpenAI 和 xAI 等 AI 實驗室正期待利用 Rubin 平台訓練更大型、更強大的模型。
提前公佈產品細節
評論稱,英偉達今年比往年更早披露新產品的細節,這是該司保持行業依賴其硬件的舉措之一。因為英偉達通常在每年春季加州聖何塞舉行的 GTC 活動上深入介紹產品細節。
對黃仁勳而言,CES 只是其馬拉松式出席活動的又一站。他要在各類活動中宣佈產品、合作和投資,均旨在為 AI 系統部署增添動力。
英偉達公佈的新硬件還包括網絡和連接組件,將成為 DGX SuperPod 超級計算機的一部分,同時也可作為單獨產品供客户以更模塊化的方式使用。這一性能提升是必需的,因為 AI 已轉向更專業化的模型網絡,不僅要篩選海量輸入,還需通過多階段流程解決特定問題。
英偉達正在推動面向整個經濟領域的 AI 應用,包括機器人、醫療保健和重工業。作為這一努力的一部分,英偉達宣佈了一系列旨在加速自動駕駛汽車和機器人開發的工具。目前,基於英偉達的計算機支出大部分來自少數客户的資本支出預算,包括微軟、Alphabet 旗下的谷歌雲和亞馬遜旗下的 AWS。
