NVIDIA competes in the "Inference Era," new Rubin CPX GPU "USD 100 million investment, USD 5 billion inference revenue, 50 times return rate"!

華爾街見聞
2025.09.10 08:39
portai
I'm PortAI, I can summarize articles.

花旗稱,英偉達推出專為長語境推理設計的 Rubin CPX GPU,承諾為客户帶來 50 倍投資回報率,遠超 GB200 NVL72 的 10 倍回報率。該芯片在注意力機制方面性能較 GB300 NVL72 提升 3 倍。英偉達 GB300 NVL72 系統在 MLPerf 推理基準測試中創下新紀錄。這些發佈表明推理時代已經到來。

本文作者:董靜

來源:硬 AI

英偉達重磅推出專為長語境推理設計的全新 Rubin CPX GPU,承諾為客户帶來前所未有的投資回報率!

9 月 9 日,花旗在最新研報中稱,英偉達在 AI 基礎設施峯會上推出專為長語境推理設計的全新 Rubin CPX GPU,承諾為客户帶來前所未有的投資回報率——每投入 1 億美元可獲得 50 億美元的推理收入,實現約 50 倍的投資回報率,遠超 GB200 NVL72 的約 10 倍回報率。

英偉達超大規模與高性能計算副總裁 Ian Buck 在 AI 基礎設施峯會上重申,公司致力於通過 GPU 驅動的數據中心加速生成式 AI 的採用。此次發佈的 Rubin CPX 專門針對超大規模上下文處理的最高性能而設計,相比 GB300 NVL72 系統,在注意力機制方面性能提升高達 3 倍

除新 GPU 發佈外,英偉達還宣佈其 GB300 NVL72 機架級系統在最新的 MLPerf 推理基準測試中創造了新的推理基準記錄。據花旗研究指出,通過在產品路線圖中插入 Rubin CPX,英偉達正在 ASIC 競爭加劇的背景下加速其一年一度的產品發佈節奏,這標誌着"推理時代"已經到來

革命性的 Rubin CPX:專為推理時代打造的盈利引擎

英偉達 Rubin CPX 代表了 GPU 設計的全新類別,專門針對長語境推理進行優化。這款芯片能夠處理百萬級 tokens 的軟件編程和生成式視頻,在速度和效率方面實現突破性提升。

花旗在研報中指出,最引人注目的是其經濟效益:

Rubin CPX 相比英偉達 GB300 NVL72 系統,注意力處理能力提升高達 3 倍。更重要的是,該芯片與英偉達 Vera CPU 和 Rubin GPU 緊密配合,構成全新的英偉達 Vera Rubin NVL144 CPX 平台,能夠讓企業以前所未有的規模實現投資變現——每投入 1 億美元可產生 50 億美元的推理收入,投資回報率約為 50 倍,遠超 GB200 NVL72 的約 10 倍回報率

花旗稱,英偉達通過在產品路線圖中插入 Rubin CPX,正在加速其一年更新節奏,這一舉措明顯是為了應對日益激烈的 ASIC 競爭。

英偉達 GB300 NVL72 機架級系統在最新 MLPerf 推理基準測試中創下新的推理基準記錄,相比 GB200 NVL72 系統,可提供高達 1.4 倍的 DeepSeek-R1 推理 throughput。

該平台還在 MLPerf Inference v5.1 套件新增的所有數據中心基準測試中創下性能記錄,包括 DeepSeek-R1、Llama 3.1 405B Interactive、Llama 3.1 8B 和 Whisper。

花旗表示,這些系統級性能表現是在英偉達已經在 MLPerf 數據中心基準測試中創下單 GPU 記錄基礎上的進一步提升。

花旗分析師指出,這些發佈表明推理時代已經到來,正如谷歌最近所説的其推理所處理的 Tokens 數量同比增長超過了 50 倍以上所反映的趨勢。英偉達正通過 GPU 驅動的數據中心加速生成式 AI 的採用,這一戰略定位使公司能夠充分捕捉推理市場的爆發性增長機遇。

花旗研究維持英偉達"買入"評級,目標價 200 美元,基於 2026 財年預期每股收益的 30 倍市盈率。分析師指出,30 倍市盈率與公司 3-5 年平均水平一致,預期股價回報率為 17.1%。

分析師認為,英偉達通過發佈 Rubin CPX 和創造 MLPerf 新紀錄,展現了公司在 AI 基礎設施領域的持續創新能力。隨着 AI 推理需求的快速增長,特別是長語境推理需求的爆發,英偉達的新產品組合將為公司帶來顯著的收入增長機會