AI 芯片主戰場,變了

華爾街見聞
2024.02.26 02:12
portai
I'm PortAI, I can summarize articles.

英偉達公司的 AI 芯片主戰場正在從訓練芯片轉向推理芯片,這是一個更具競爭力的領域。英偉達通過提供訓練人工智能模型所需的芯片,成為一家價值 2 萬億美元的公司。然而,隨着行業的發展,更大的機會將是銷售推理芯片,為快速增長的實際使用生成式人工智能工具的公司和個人生產文本和圖像。英偉達的首席財務官表示,去年超過 40% 的收入用於推理系統,這是一個重要的轉變跡象。英特爾公司相信,隨着客户專注於降低人工智能模型的運行成本,推理芯片將變得越來越有吸引力。

英偉達主導的 AI 芯片大戰已經轉向了一個新的戰線——一個規模更大但也更具競爭力的戰線。

英偉達通過提供訓練人工智能模型這一極其複雜的工作所必需的芯片,將自己打造成一家價值 2 萬億美元的公司。隨着行業的快速發展,更大的機會將是銷售芯片使這些模型在訓練後運行的芯片,為快速增長的實際使用生成式人工智能工具的公司和人們生產文本和圖像。

目前,這種轉變正在增加英偉達的銷量。首席財務官科萊特·克雷斯 (Colette Kress) 上週表示,去年 Nvidia 數據中心業務的 40% 以上(收入超過 470 億美元)用於部署人工智能推理系統,而不是訓練。這一百分比是轉變正在進行的第一個重要跡象。

克雷斯的評論緩解了一些擔憂,即向部署人工智能系統的芯片(即執行所謂 “推理” 工作的芯片)的轉變威脅到了英偉達的地位,因為與製造英偉達的芯片相比,這項工作可以使用功能更弱、成本更低的芯片來完成。

Melius Research 分析師 Ben Reitzes 在給客户的一份報告中表示:“人們認為 Nvidia 在推理領域的份額將低於訓練領域。” “這一發現有助於揭示其從即將到來的推理爆炸中受益的能力。”

許多競爭對手認為,隨着推理芯片變得更加重要,他們在人工智能市場上擁有更好的機會。

生產數據中心中央處理器的英特爾公司相信,隨着客户專注於降低人工智能模型的運行成本,其芯片將越來越有吸引力。英特爾專門生產的芯片類型已經廣泛用於推理,在執行該任務時,擁有 Nvidia 的尖端且更昂貴的 H100 AI 芯片並不那麼重要。

英特爾首席執行官帕特·基辛格 (Pat Gelsinger) 在去年 12 月的一次採訪中表示:“推理的經濟學是,我不會承受 40,000 美元的 H100 環境,因為它會消耗太多電量,需要新的管理和安全模型以及新的 IT 基礎設施。” “如果我可以在標準 [英特爾芯片] 上運行這些模型,那是理所當然的。”

美國銀行分析師 Vivek Arya 表示,向推理的轉變可能是英偉達季度收益報告週三出現的最重要消息,該報告超出了華爾街的預期,導致其股價本週上漲 8.5%,推動該公司估值約為 2 萬億美元。

Arya 表示,隨着對人工智能模型的訓練投資激增,焦點轉向從人工智能模型中創收,推理能力將會上升。與英偉達佔據主導地位的人工智能訓練相比,這可能更具競爭力。

推理增長的速度可能比之前預期的要快。今年早些時候,瑞銀分析師估計 90% 的芯片需求來自訓練,而這一推論到明年只會推動 20% 的市場份額。分析師在一份報告中表示,英偉達大約 40% 的數據中心收入來自推理,“這個數字比我們預期的要大”。

事實上,英偉達週三的財務業績表明,其在人工智能芯片領域超過 80% 的市場份額尚未受到嚴重挑戰。英偉達用於訓練人工智能系統的芯片預計在可預見的未來仍將保持旺盛的需求。

在訓練人工智能系統時,公司通過模型運行海量數據,教它們以能夠實現人類發音表達的方式預測語言。這項工作需要強大的計算能力,非常適合 Nvidia 的圖形處理單元(GPU)。

推理工作是指這些模型被要求處理新的信息並做出響應——更輕鬆的提升。

除了英特爾和 AMD 等 Nvidia 的老牌競爭對手之外,隨着推理成為焦點,許多人工智能芯片初創公司也可能獲得發展動力。

“我們看到我們的推理用例呈爆炸式增長,” SambaNova 的首席執行官羅德里戈·梁 (Rodrigo Liang) 説,SambaNova 是一家初創公司,將人工智能芯片和軟件相結合,可以進行推理和訓練。“人們開始意識到 80% 以上的成本將用於推理,我需要尋找替代解決方案,” 他説。

Groq 是一家由前谷歌人工智能芯片工程師喬納森·羅斯 (Jonathan Ross) 創立的初創公司,近幾個月來,該公司主頁上的演示展示了其推理芯片可以如何快速地從大型語言模型中生成響應,因此引起了人們的興趣激增。羅斯表示,該公司預計今年將部署 42,000 個芯片,明年將部署 100 萬個芯片,但正在探索將芯片總數今年增加到 220,000 個,明年增加到 150 萬個。

他説,推動這一轉變的一個因素是,一些最先進的人工智能系統正在被調整,以產生更好的響應,而無需重新訓練它們,從而將更多的計算工作推向推理。他説,Groq 的專業芯片比 Nvidia 或其他芯片公司的產品運行速度更快、成本更低。

“據此推斷,你可以部署什麼取決於成本,” 他説。“有很多模型可以在谷歌接受訓練,但它們中大約 80% 沒有得到部署,因為它們太貴了,無法投入生產。”

大型科技公司——包括 Meta、微軟,谷歌和亞馬遜——一直致力於內部開發推理芯片,認識到即將到來的轉變以及能夠更便宜地進行推理的好處。

例如,亞馬遜自 2018 年以來就擁有推理芯片,該公司雲計算部門數據和機器學習副總裁斯瓦米·西瓦蘇布拉馬尼安 (Swami Sivasubramanian) 去年表示,推理佔其 Alexa 智能助手計算成本的 40%。

就英偉達而言,它正在尋求在向推理過渡的過程中保持領先地位。去年,一款即將推出的芯片在一項關鍵的人工智能推理基準測試中取得了行業領先的結果,延續了該公司多年來在競爭中的主導地位。

去年 12 月,AMD 推出了新的人工智能芯片,據稱其推理能力優於 Nvidia 的芯片後,Nvidia 在一篇博客文章中予以回擊,對這一説法提出質疑。英偉達表示,AMD 在宣稱其性能時並未使用優化軟件,如果這樣做,英偉達的芯片速度將是原來的兩倍。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。