Is Wall Street "agreed to short together"? Barclays: The current AI computing power seems sufficient to meet demand

華爾街見聞
2025.03.27 01:07
portai
I'm PortAI, I can summarize articles.

巴克萊發佈研究稱,2025 年全球 AI 算力可支持 15-220 億個 AI Agent,滿足美國和歐盟需求。分析指出,AI 行業需轉向有用的 Agent 產品,推理成本和開源模型將是關鍵。儘管算力表面充足,但面臨結構性挑戰,企業客户轉向成本更低的開源模型,下載量激增。

繼 TD Cowen 後,巴克萊似乎也開始唱空 AI 算力。

3 月 26 日,巴克萊發佈最新研究稱,2025 年全球 AI 算力可支持 15-220 億個 AI Agent,似乎足以滿足美國和歐盟的絕大部分需求。而同日 TD Cowen 分析師稱支撐人工智能運算的計算機集羣供過於求。

巴克萊研報指出,AI 行業需要從 “無意義基準測試” 轉向真正有用的 Agent 產品部署。同時巴克萊分析師表示:

  • AI Agent 市場的增長潛力巨大: 行業算力能夠支持大規模 Agent 部署,預示着巨大的市場機會。
  • 推理成本是關鍵: 低推理成本對於 Agent 產品的盈利至關重要,這將驅動對更高效的 AI 模型和算力的需求。
  • 開源模型的重要性: 開源模型將在降低成本方面發揮關鍵作用,投資者應關注相關領域的動態。

算力供需:過剩還是不足?

關於 AI 算力的供需平衡,巴克萊展示了幾個核心發現:

  • 行業推理容量基礎:2025 年全球約有 1,570 萬個 AI 加速器(GPU/TPU/ASIC 等)在線,其中 40%(約 630 萬個)將用於推理,而這些推理算力中約一半(310 萬個)將專門用於 Agent/聊天機器人服務
  • 算力分配正在演變:企業客户已開始轉向成本更低的開源模型,如 Salesforce 的 Agentforce 採用 Mistral 開源模型(7B-141B 參數),而非最昂貴的專有前沿模型;
  • 開源模型下載激增:Hugging Face 數據顯示 DeepSeek、Llama 和 Mistral 等開源模型的下載量正在迅速增長,這一趨勢將隨着從聊天機器人向 Agent 的轉變而加速。

算力供應雖然表面上充足,但面臨結構性挑戰。巴克萊明確表示:

如果 Agent 產品真正起飛並對消費者和企業用户非常有用,我們可能需要

1)更便宜、更小但性能同樣高的基礎模型(DeepSeek 風格);

2)更多推理芯片安裝;以及

3)可能需要將已安裝的訓練 GPU 重新用於推理。

這表明,雖然目前總體算力看似充足,但針對高效、低成本 Agent 產品的專用算力仍有較大缺口。巴克萊指出這意味着,在 AI Agent 賽道上,具有高效推理成本結構和專注開發小型高效模型的公司可能擁有更大競爭優勢,而僅依賴大模型而不考慮單位經濟學的公司可能面臨更大挑戰

推理成本:AI Agent 的經濟學挑戰

巴克萊指出AI Agent 的推理成本正成為行業發展的核心考量因素

  • AI Agent 生成的 Token 數量巨大:相比傳統聊天機器人,Agent 產品每次查詢生成約 10,000 個 Token,是聊天機器人 (約 400 個) 的 25 倍,這極大增加了推理成本;
  • 不同模型的經濟效益差異巨大:以年度訂閲成本計算,基於 OpenAI o1 模型的 Agent 產品成本高達 2,400/年,而基於 88/年,後者提供了 15 倍於前者的用户容量;
  • 超級 Agent 需求正在興起:OpenAI 計劃推出的"超級 Agent"產品,這類高端產品將消耗更多 Token,每月高達 3,560 萬個,每日查詢次數可達 44 次,遠超普通 Agent 的 2.6 次。

從單位經濟學角度看,以 Token 計價的模式將決定不同模型的市場競爭力。正如巴克萊研究指出:

這證明了低推理成本的重要性。由於其自主性質,Agent AI 產品的 Token 消耗趨勢遠高於聊天機器人。

此外,巴克萊分析師表示,雖然 “超級 Agent” 有潛力,但其高昂的推理成本可能限制其大規模應用。投資者在評估此類產品時,應謹慎考慮其經濟可行性。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。