The second wave of computing power tax, CPU price increase

華爾街見聞
2026.01.22 12:28
portai
I'm PortAI, I can summarize articles.

隨着 AI 向自主執行任務的智能體演進,算力瓶頸正從 GPU 轉向 CPU。智能體 80%-90% 的任務延遲來自 CPU 的沙箱環境與工具調用,IDC 預測智能體五年將增長 70 倍,帶來千萬片級需求。而供給端英特爾、台積電產能已達極限,交付週期延長至 24 周。供需失衡下,CPU 價格已上漲 10-15%。

全球半導體市場出現結構性變化,傳統意義上被視為成熟品類的 CPU 領域,正成為資本市場的關注焦點。

截至 1 月 21 日,英特爾股價創下近四年新高,年內漲幅超 44%;AMD 延續連續上漲態勢;A 股市場中,龍芯中科與海光信息分別錄得 20% 漲停及單日漲幅超 13%。這一行情背後,反映的是市場對 “算力税” 傳導邏輯的重新定價,繼 GPU 因 AI 訓練需求大漲之後,CPU 正在成為算力成本上漲的第二波承載者。

機構的共識正在迅速形成。國聯民生證券與西部證券在近期報告中不約而同地指出,當前 CPU 市場的供需變化並非週期性波動,而是由 AI 智能體應用規模化落地所驅動的結構性變革。

與以 GPU 為核心的 AI 訓練不同,在智能體工作負載中,CPU 承擔了包括工具調用、任務編排、實時決策等大量非 AI 原生計算,相關處理耗時佔總任務延遲的比例高達 80%-90%。這使得 CPU 在系統層面可能比 GPU 更早成為性能瓶頸。

需求前景已在數據層面得到支撐。據 IDC 預測,全球活躍智能體數量將從 2025 年的約 2860 萬個,迅速增長至 2030 年的 22.16 億個,年複合增長率達 139%。在中性情景下,長期對應的 CPU 需求或將突破 1173 萬片量級,形成顯著增量市場。

CPU 的供給端亦面臨着極限承壓。摩根大通數據顯示英特爾先進製程產能利用率已達 120%-130% 的超載狀態,台積電先進封裝產能瓶頸更將 CPU 交付週期從正常的 8-10 周拉長至 24 周以上。

在此趨勢下,國產 CPU 廠商迎來產業與政策的雙重機遇。CPU,這一曾長期被視為 “傳統” 的算力組件,正在 AI 智能體浪潮中重新確立其系統級價值。

AI 智能體催化 “域外 CPU” 需求重塑

傳統 AI 計算將算力重心完全置於 GPU 之上,主要用於模型的訓練與推理加速。然而,隨着 AI 向具備自主規劃與執行能力的智能體演進,計算負載的結構正在發生根本性重構。

智能體要完成一個實際任務,例如 “分析一批簡歷數據”,其工作流程遠超簡單的 API 調用。它需要自主執行:創建獨立沙箱環境、訪問指定網盤下載文件、解壓壓縮包、運行數據分析腳本、生成可視化報表,最後清理並釋放環境資源。在這一完整任務鏈中,僅任務拆解與結果生成環節依賴 GPU 進行推理,而佔整個流程時長 80%-90% 的中間步驟——包括文件操作、代碼執行、數據處理與系統調度——全部由 CPU 承擔。

英特爾發佈的白皮書《以 CPU 為核心的智能體 AI 視角》明確指出,智能體工作負載的延遲主要來自 CPU 側的工具處理任務。

智能體架構範式統一:主流平台全面轉向 “沙箱執行” 模式

隨着 AI 智能體從概念走向規模化應用,產業技術架構正在發生根本性重構。根據國泰海通電子的產業調研,自 2025 年下半年以來,包括豆包、智譜在內的主流 AI 平台已全面轉向 “沙箱執行” 架構模式。該模式的核心在於為每個智能體任務創建獨立、隔離的虛擬執行環境,以安全地完成文件操作、代碼運行、網絡訪問等外部調用。這種架構轉變直接催生了新型算力需求特徵:CPU 資源消耗與用户規模及任務併發量呈強相關性,而與 GPU 數量呈現弱關聯性

工程實踐的突破為這一架構演進提供了關鍵技術支撐。DeepSeek 研究團隊在論文中展示了里程碑式的 “存算分離” 方案:成功將 1000 億參數的嵌入表完全存儲於 CPU 主機內存,而非傳統的 GPU 顯存。通過精密的 PCIe 異步數據傳輸機制,該方案僅帶來不足 3% 的額外推理延遲,在工程可行性上實現了關鍵突破。

這一技術突破揭示了兩大產業趨勢:在技術路徑上,模型參數規模對 GPU 顯存容量的依賴被有效打破,性價比更優的主機內存成為大規模參數存儲的可行選擇;在系統架構上CPU 的角色定位發生本質變化,從輔助計算單元轉變為數據調度與系統管理的核心樞紐,承擔起海量參數的實時檢索、智能篩選及高效轉發等關鍵職能。

供需失衡加速漲價預期

需求結構劇變恰逢供給端產能瓶頸的雙重擠壓。

根據 TrendForce 2026 年 1 月供應鏈監測報告,台積電 N2 與 N3 等先進製程到 2027 年的產能已被蘋果、英偉達、博通等巨頭瓜分。由於高端 GPU 與定製 ASIC 在 “單晶圓產出價值” 上顯著高於傳統 CPU,代工廠產能分配存在明顯傾斜。與此同時,CoWoS 等先進封裝技術的瓶頸進一步惡化了供應鏈——IDC 分析指出,其產能利用率在 2025 年第四季度便已突破 100%,導致 CPU 出貨週期從正常的 8-10 周延長至 24 周以上。

英特爾內部生態同樣面臨極限壓力。隨着其 18A 工藝進入量產高峰,該公司不僅需保障自身酷睿與至強系列供應,還需履行對微軟、亞馬遜等外部代工客户的承諾。摩根大通研報指出,英特爾核心節點的產能利用率已攀升至 120%-130% 的超負荷狀態,迫使部分非核心組件轉移至聯電等二線代工廠。

西部證券最新行業點評指出,為應對供需失衡並保障供應穩定,英特爾與 AMD 已計劃將服務器 CPU 價格上調 10%-15%,且 2026 年兩家廠商的服務器 CPU 產能 “已基本預售完畢”。

總而言之,隨着 AI 從 “內容生成” 邁向 “任務執行”,算力需求的核心正經歷結構性遷移——從以 GPU 為中心的並行計算,轉向以 CPU 為樞紐的系統調度與資源協調。在供給端產能已達物理極限、需求端受智能體應用指數級增長驅動的雙重作用下,CPU 不僅面臨持續的價格上行壓力,其在整個計算體系中的戰略價值更在經歷系統性重估。