NVIDIA competes in the "Inference Era," new Rubin CPX GPU "USD 100 million investment, USD 5 billion inference revenue, 50 times return rate"!

花旗稱，英偉達推出專為長語境推理設計的 Rubin CPX GPU，承諾為客户帶來 50 倍投資回報率，遠超 GB200 NVL72 的 10 倍回報率。該芯片在注意力機制方面性能較 GB300 NVL72 提升 3 倍。英偉達 GB300 NVL72 系統在 MLPerf 推理基準測試中創下新紀錄。這些發佈表明推理時代已經到來。

本文作者：董靜

來源：硬 AI

英偉達重磅推出專為長語境推理設計的全新 Rubin CPX GPU，承諾為客户帶來前所未有的投資回報率！

9 月 9 日，花旗在最新研報中稱，英偉達在 AI 基礎設施峯會上推出專為長語境推理設計的全新 Rubin CPX GPU，承諾為客户帶來前所未有的投資回報率——每投入 1 億美元可獲得 50 億美元的推理收入，實現約 50 倍的投資回報率，遠超 GB200 NVL72 的約 10 倍回報率。

英偉達超大規模與高性能計算副總裁 Ian Buck 在 AI 基礎設施峯會上重申，公司致力於通過 GPU 驅動的數據中心加速生成式 AI 的採用。此次發佈的 Rubin CPX 專門針對超大規模上下文處理的最高性能而設計，相比 GB300 NVL72 系統，在注意力機制方面性能提升高達 3 倍。

除新 GPU 發佈外，英偉達還宣佈其 GB300 NVL72 機架級系統在最新的 MLPerf 推理基準測試中創造了新的推理基準記錄。據花旗研究指出，通過在產品路線圖中插入 Rubin CPX，英偉達正在 ASIC 競爭加劇的背景下加速其一年一度的產品發佈節奏，這標誌着"推理時代"已經到來。

革命性的 Rubin CPX：專為推理時代打造的盈利引擎

英偉達 Rubin CPX 代表了 GPU 設計的全新類別，專門針對長語境推理進行優化。這款芯片能夠處理百萬級 tokens 的軟件編程和生成式視頻，在速度和效率方面實現突破性提升。

花旗在研報中指出，最引人注目的是其經濟效益：

Rubin CPX 相比英偉達 GB300 NVL72 系統，注意力處理能力提升高達 3 倍。更重要的是，該芯片與英偉達 Vera CPU 和 Rubin GPU 緊密配合，構成全新的英偉達 Vera Rubin NVL144 CPX 平台，能夠讓企業以前所未有的規模實現投資變現——每投入 1 億美元可產生 50 億美元的推理收入，投資回報率約為 50 倍，遠超 GB200 NVL72 的約 10 倍回報率。

花旗稱，英偉達通過在產品路線圖中插入 Rubin CPX，正在加速其一年更新節奏，這一舉措明顯是為了應對日益激烈的 ASIC 競爭。

英偉達 GB300 NVL72 機架級系統在最新 MLPerf 推理基準測試中創下新的推理基準記錄，相比 GB200 NVL72 系統，可提供高達 1.4 倍的 DeepSeek-R1 推理 throughput。

該平台還在 MLPerf Inference v5.1 套件新增的所有數據中心基準測試中創下性能記錄，包括 DeepSeek-R1、Llama 3.1 405B Interactive、Llama 3.1 8B 和 Whisper。

花旗表示，這些系統級性能表現是在英偉達已經在 MLPerf 數據中心基準測試中創下單 GPU 記錄基礎上的進一步提升。

花旗分析師指出，這些發佈表明推理時代已經到來，正如谷歌最近所説的其推理所處理的 Tokens 數量同比增長超過了 50 倍以上所反映的趨勢。英偉達正通過 GPU 驅動的數據中心加速生成式 AI 的採用，這一戰略定位使公司能夠充分捕捉推理市場的爆發性增長機遇。

花旗研究維持英偉達"買入"評級，目標價 200 美元，基於 2026 財年預期每股收益的 30 倍市盈率。分析師指出，30 倍市盈率與公司 3-5 年平均水平一致，預期股價回報率為 17.1%。

分析師認為，英偉達通過發佈 Rubin CPX 和創造 MLPerf 新紀錄，展現了公司在 AI 基礎設施領域的持續創新能力。隨着 AI 推理需求的快速增長，特別是長語境推理需求的爆發，英偉達的新產品組合將為公司帶來顯著的收入增長機會。