Price war reversal for large models? In-depth analysis of the latest pricing from 17 manufacturers reveals that over 70% are raising prices

華爾街見聞
2025.08.24 06:00
portai
I'm PortAI, I can summarize articles.

DeepSeek 宣佈自 9 月 6 日起調整 API 價格,漲幅達 50%,取消夜間優惠。這一變化標誌着大模型價格戰的逆轉,越來越多廠商停止降價,部分甚至上調價格。國內"大模型六小虎"中已有四家漲價,國際廠商如 OpenAI 和谷歌的 API 價格也趨於穩定或小幅上漲。整體來看,大模型價格下行速度減緩,行業趨勢向上。

DeepSeek 漲價了。

智東西 8 月 23 日報道,8 月 21 日,DeepSeek 在其公眾號官宣了 DeepSeek-V3.1 的正式發佈,還宣佈自 9 月 6 日起,DeepSeek 將執行新價格表,取消了今年 2 月底推出的夜間優惠,推理與非推理 API 統一定價,輸出價格調整至 12 元/百萬 tokens。這一決定,讓使用 DeepSeek API 的最低價格較過去上升了 50%。

DeepSeek 在業內曾有 “價格屠夫” 的稱號,在 2024 年 5 月憑藉 DeepSeek-V2,將 API 價格降至輸入 1 元/百萬 tokens、輸出 2 元/百萬 tokens 的行業低價,一石激起千層浪。

僅在當月,就有智譜、字節、阿里、百度、訊飛、騰訊等廠商跟進降價,最高降幅達到 80%-97%,還有部分廠商直接將輕量級模型免費開放,掀起一場持續半年多的大模型價格戰。

▲2024 年 5 月部分廠商發佈的大模型降價通知

然而,在 2025 年,卻有越來越多的廠商選擇了停止降價。在國內,“大模型六小虎” 中,已有智譜、月之暗面、MiniMax、階躍星辰 4 家對部分 API 價格進行上調,百川智能、零一萬物 2 家保持價格不變;阿里、字節、騰訊、百度、科大訊飛、商湯等大廠們廣泛採用階梯定價策略,或是拉開 “推理” 與 “非推理” 模式差距。行業的整體 API 價格趨於穩定,部分產品還出現了明顯上浮。

國際廠商雖然仍在宣稱智能將越來越便宜,但實際情況卻是,過去一年 OpenAI、Anthropic、谷歌等企業的 API 價格基本原地踏步,甚至有小幅上漲。與此同時,訂閲方案越來越貴,頂級模型幾乎被鎖在 200 美元/月及以上的高價檔裏,xAI 甚至推出了 300 美元/月的訂閲方案。

在這樣的背景下,DeepSeek 漲價只是更大規模行業趨勢的一個縮影:當前,大模型價格的下行速度正逐漸放緩,頂級 AI 服務不再無限下探,反而開始呈現趨於穩定,略有回升的態勢。

以下數據均收集於公開渠道,如有錯漏歡迎指正。

01. DeepSeek、大模型六小虎 API 價格普漲,但有兩家近 1 年沒改價

大模型價格戰,曾經是 2024 年國內 AI 圈最火的關鍵詞之一,大模型 API 的價格曾經一度降至每百萬 tokens 幾毛錢。然而,進入 2025 年後,這一降價趨勢卻基本停滯,尤其是對於那些最先進的模型而言。

以 DeepSeek 為例,去年年底 DeepSeek-V3 剛剛發佈時,DeepSeek 進行了 45 天的限時優惠,結束後,DeepSeek-Chat API(非推理 API)中輸出價格從 2 元恢復到 8 元;這一 API 的價格將於今年 9 月份進一步上浮 50%,至 12 元。

Deepseek-Reason API(推理 API)的價格則相對穩定,並且會在今年 9 月份將輸出價格從 16 元降至 12 元。不過,總體來看,DeepSeek API 的價格還是呈上漲趨勢。

▲DeepSeek API 價格變動情況(智東西製圖)

大模型六小虎中,智譜、月之暗面、百川智能、MiniMax、階躍星辰、零一萬物的價格,在 2025 年 1 季度之後,基本沒有出現明顯的下降。

智譜上一代 GLM-4 模型的 API 定價不區分輸入輸出與輸入 token 數量,統一為 5 元/百萬 tokens。而其今年 7 月發佈的 GLM-4.5 模型,在去除模型發佈之初的限時優惠政策後,高速推理版本(GLM-4.5-X)的輸出價格最高可達到 64 元/百萬 tokens。

即使是按照最低檔計價(使用 GLM-4.5,輸出長度小於 32K,輸出長度小於 0.2K,推理速度為 30-50tokens/秒),其輸出價格也從 5 元/百萬 tokens 變成了 8 元/百萬 tokens。

▲GLM-4.5 定價情況(圖源:智譜開放平台官網)

月之暗面 2024 年 8 月正式推出企業 API,彼時在 128K 上下文場景中,其輸入輸出定價均為 60 元/百萬 tokens,在業內屬於較高水平。

今年 4 月,月之暗面對部分 API 價格進行了調整,使用其最新 K1.5 模型的 API 輸出價格降至 30 元/百萬 tokens,但在 Kimi K2 推出後,128K 上下文場景中的高速輸出價格又回調至 64 元/百萬 tokens。

▲月之暗面 Kimi 大模型 API 定價變化,選取的數據均為最高檔次定價(智東西製圖)

百川智能已經長期沒有對 API 價格進行調整,旗艦模型 Baichuan4 的調用價格自 2024 年 5 月發佈以來,一直維持在輸入輸出均為 100 元/百萬 tokens 的水平。

▲百川智能 API 價格表(圖源:百川智能)

2024 年 8 月,MiniMax 對其當時的旗艦文本生成模型 abab-6.5s 進行了大幅度的降價,輸入和輸出價格均統一為 1 元/百萬 tokens。不過,目前這一模型在其 API 開放平台上已不可見。

MiniMax 新一代文本生成模型 MiniMax-Text-01(2025 年 1 月發佈)的定價為輸入 1 元/百萬 tokens,輸出 8 元/百萬 tokens;而其推理模型 MiniMax-M1(2025 年 6 月發佈)的價格則採用階梯定價,最高價格為輸入 2.4 元/百萬 token,輸出 24 元/百萬 token。

▲MiniMax 大模型 API 定價變化趨勢,選取的數據均為最高檔次定價(智東西製圖)

階躍星辰以多模態為特色。今年 4 月,該公司發佈了 Step-R1-V-Mini 多模態推理模型,輸出價格為 8 元/百萬 tokens。其 7 月發佈的新一代多模態推理模型 Step 3 調整為階梯定價,輸入≤4k 的價格基本持平或略有下調,在最高檔(4k < 輸入≤ 64k)的價格有一定上漲,輸出價格為 10 元/百萬 tokens。同時,Step 3 最大上下文窗口為 64K,較 Step-R1-V-Mini 的 100K 有所縮小。

▲階躍星辰大模型 API 定價變化趨勢,選取的數據均為最高檔次定價(智東西製圖)

零一萬物於 2024 年 10 月發佈 Yi-Lighting,價格為 0.99 元/百萬 tokens,此後未再更新 API 中的模型價格。如今調用 Yi-Lighting 時,還會根據用户輸入智能路由到 DeepSeek-V3、Qwen-30B-A3B 等模型。

▲零一萬物大模型 API 定價表(圖源:零一萬物)

02. 多家大廠細化定價規則,有模型輸出超 300 字就得加錢

更為 “財大氣粗” 的大廠們,也在 2025 年放緩了模型降價的腳步。

字節跳動在 2024 年 5 月首次推出豆包 Pro 家族,小於 32K 上下文的豆包通用模型 Pro 輸入價格僅為 0.8 元/百萬 tokens,輸出價格為 2 元/百萬 tokens。字節跳動火山引擎總裁譚待在發佈會上稱,這一定價 “比行業價格低 99.3%”。這次發佈也將大模型價格戰推至輿論的風口浪尖。

在 32K 上下文的場景下,2025 年 1 月發佈的豆包 1.5 Pro 與 2025 年 7 月的豆包 1.6,維持了豆包通用模型 Pro 的價格水平。

不過,字節進一步細化了定價規則,根據輸入、輸出兩個變量調整定價。當模型輸出超過 200 個 token(約為 300 個漢字)時,豆包 1.6 的輸出價變為 8 元/百萬 tokens,輸入價不變。

▲豆包 1.6 階梯定價細則(圖源:火山方舟)

從初代豆包 Pro,到豆包 1.5 Pro,再到豆包 1.6,字節豆包大模型 API 的最高價變化趨勢如下:

▲字節跳動豆包大模型 API 定價變化趨勢,選取的數據均為最高檔次定價(智東西製圖)

阿里巴巴通過阿里雲百鍊對外提供大模型 API 服務,由於阿里旗下的大模型數量眾多,更新頻率較快,且有開源版與商業版之分,全部統計將略顯龐雜。智東西主要追蹤了 2025 年以來其主力商業 API 服務之一 Qwen-Plus 的價格變化。

可以看到,Qwen-Plus 在今年 4 月份新版本推出,並引入思考與非思考模式的區別後,思考型輸出的價格來到了非思考輸出的 4 倍。

今年 7 月版本更新後,Qwen-Plus 全面採用階梯定價的形式,128K 輸入以下的調用價格與 4 月份定價持平,但當輸入量超過 128K 時,價格出現明顯上漲,最高輸出價格達到了 64 元/百萬 tokens。

▲阿里 Qwen-Plus API 價格變動情況(智東西製表)

2024 年 7 月,百度宣佈將其旗艦模型 ERNIE 4.0 降價,以輸入 40 元/百萬 tokens、輸出 120 元/百萬 tokens 的價格對外提供服務,百度後續逐漸將 ERNIE 4.0 的推理價格降至業內常見的輸入 4 元/百萬 tokens、輸出 16 元/百萬 tokens(未查詢到這一降價的具體時間),今年 3 月推出的 ERNIE 4.5 維持了這一定價,沒有繼續下降。

▲ERNIE 4.0、ERNIE 4.5 模型價格(圖源:百度)

騰訊是國內幾家大廠中少數仍在逐漸下調大模型 API 價格的企業。2024 年 9 月,騰訊發佈了混元 Turbo 大模型,定價為輸入 15 元/百萬 tokens、輸出 50 元/百萬 tokens,在當時屬於較高水平。

不過,目前混元 Turbo 的價格已經降至輸入 2.4 元/百萬 tokens、輸出 9.6 元/百萬 tokens,2025 年 3 月發佈的混元 TurboS 價格則降至輸入 0.8 元/百萬 tokens、輸出 2 元/百萬 tokens。

▲部分騰訊混元大模型的價格(圖源:騰訊雲)

科大訊飛的 API 服務按照 token 包計費,不區分輸入輸出,不同套餐摺合後的 token 單價不同。

按照價格區間的中值計算,2024 年 1 月推出的星火 3.5 的價格約為 25 元/百萬 tokens,同年 6 月推出的星火 4.0 價格約為 60 元/百萬 tokens,同年 10 月發佈的星火 4.0 Turbo,以及 2025 年 1 月升級後的新版星火 4.0 Turbo,都維持了這一價格。

▲訊飛星火 3.5、星火 4.0、星火 4.0 Turbo 價格變化(智東西製圖)

不過,訊飛也推出了一款基於全國產算力訓練的深度推理大模型星火 X1,其價格約為 11 元/百萬 tokens。

商湯旗艦模型日日新系列的 API 價格從 2024 年 5 月的 20 元/百萬 tokens,回落至 2025 年 4 月的 9 元/百萬 tokens,今年 7 月最新發布的 SenseNova-V6.5 Pro 維持了這一價格。

▲對應模型分別為日日新 SenseChat-5-1202、SenseNova-V6-Pro、SenseNova-V6.5 Pro,均為當時商湯已發佈的最先進模型(智東西製圖)

03.海外大模型廠商 “説一套做一套”,訂閲方案漲至 200 美元級別

國際主流大模型廠商之間,雖沒有出現明顯的價格戰現象,但 “鼓吹” 智能的成本將不斷降低,是海外 AI 圈幾位大咖們最熱衷的話題之一。

今年 7 月,OpenAI 聯合創始人、首席執行官 Sam Altman 説道:“智能的價格將低到無法計量,我們能將每個單位的智能的成本,每年降低至原來的 1/10,至少持續 5 年。”

2024 年 9 月,谷歌首席執行官 Sundar Pichai 分享了同樣的觀點:“在不久的將來,智能將像空氣一樣豐富,並且基本上對所有人免費。”

近期,The Information 的統計數據揭示了一個與上述觀點相悖的現實,海外主要大模型廠商的 API 價格在 2024 年 7 月後的 1 年多時間裏,就沒有出現明顯的下降,甚至還有輕微的漲幅。

例如,OpenAI 的 GPT 系列模型每百萬 tokens 的價格,自從 2024 年底降至 12.5 美元之後,便沒有繼續大幅度下探,目前維持在 11.25 美元的水平。

Anthropic 的 Claude 3、Claude 4 系列模型,自推出以來就從未降價。

谷歌的 Gemini Pro 模型的調用價格出現上漲,從 Gemini-1.5 Pro 的 12.5 美元/百萬 tokens 漲至 17.5 美元/百萬 tokens。

▲最先進的通用模型價格近期基本沒有出現下降(圖源:The Information)

過去一年中,多家海外頭部 AI 公司還相繼推出了月費超過 200 美元的高階訂閲方案。

OpenAI 與 Anthropic 均推出了 200 美元/月的訂閲檔位;谷歌最新的 AI Ultra 捆綁包定價為 249.99 美元/月;xAI 旗下的 Grok 更進一步,將其頂級訂閲方案設定為 300 美元/月的高價。

這些高端訂閲服務的共同特點是:用户只有支付超高額的月費,才能使用到各家在發佈會上展示的跑分最高、性能最強的旗艦模型。無論是更強的推理能力、更長的上下文窗口,還是更精準的代碼或複雜任務處理能力,均被保留在付費牆之後,高性能模型成為高付費用户專屬的資源。

那麼,究竟是什麼原因,導致了過去一段時間內 AI 服務價格下降趨勢的明顯停滯,甚至出現逆向走高呢?

04.算力、數據、人才價格持續推高,大模型玩家們也要考慮 ROI

大模型廠商們在算力、數據以及人才等方面的巨大投入,驅動了過去 1 年 AI 模型性能的飛速提升。

算力方面,GPU 的租賃價格目前已經趨於穩定。智東西收集的數據顯示,2024 年 9 月左右,AWS、微軟 Azure、谷歌雲等主流公有云上的 H100 每卡時租賃價格大約在 5-11 美元的區間。

今年,根據算力市場數據分析公司 Silicon Data 的 GPU 價格指數,H100 已經基本穩定在每卡時租賃價格 2-3 美元的區間,沒有出現價格的大幅度波動。

▲H100 GPU 租賃價格(圖源:Silicon Data)

同時,新一代大模型無論是在訓練還是推理階段,算力需求都在不斷增加。在與相對穩定的 GPU 價格複合後,算力成本成為限制 AI 服務價格繼續下探的 “硬門檻” 之一。

數據也是當今大模型訓練中不可忽視的成本項。起初,由於監管缺位,大模型訓練數據的獲取成本相對較低。隨着相關訴訟增多和合規審查趨嚴,為了避免與數據所有者發生法律糾紛,廠商開始主動與企業簽訂合同,購買授權數據。

例如,據《華爾街日報》報道,OpenAI 與美國出版集團 News Corp 簽署的 5 年數據使用協議金額可能高達 2.5 億美元;谷歌則與美國的貼吧類平台 Reddit 達成 AI 使用內容許可協議,路透社報道稱,其每年價格約為 6000 萬美元。

與此同時,這些模型背後人才的價格,也在水漲船高。

在國內,獵聘大數據研究院 7 月份發佈的《2025 上半年人才供需洞察報告》顯示當前國內 AI 人才缺口已突破 500 萬,AI 技術人員平均年薪為 32.35 萬元,50 萬年薪以上的 AI 技術崗佔比高達 31.03%。AI 技術人才的期望年資甚至高於如今的平均年資,為 44.09 萬元。

大洋彼岸,硅谷的 AI 人才爭奪戰打得火熱。除了那些數億美元的個別案例之外,AI 人才的整體薪資水平也明顯高於其他行業。國際職場平台 Levels.FYI 上的數據顯示,在舊金山灣區,ML/AI 工程師的薪資中位數要比所有軟件工程師的薪資中位數高 13% 左右。考慮到所有軟件工程師的統計範疇內包含了 ML/AI 工程師,後者的薪資優勢可能更大。

▲美國舊金山灣區 ML/AI 工程師薪資(圖源:Levels.FYI)

05.訂閲模式面臨服務成本考驗,成本控制迫在眉睫

打造大模型的成本越來越高昂,而隨着推理模型範式的興起,以及 Agent 等長序列任務的出現,用户的用量正在不斷攀升。大模型訂閲就像是一張 “無限流量卡”,用户用得越多,大模型廠商們提供服務的成本便越高,有部分廠商已經被用户逼到了入不敷出的程度。

本月,Anthropic 旗下的 Claude Code 編程 Agent 便取消了 200 美元/月訂閲方案的無限調用大模型權限,原因是有用户幾乎 24 小時不停地使用大模型,為這些用户提供 AI 服務的成本已經達到了每月數萬美元,遠超訂閲方案的定價。

Anthropic 更是在發佈會上宣稱,Claude 4 Opus 能連續 7 小時工作,完成編程類任務。按照 Claude 4 Opus 大約 50 tokens/秒的推理速度計算,這一任務大約會用掉 126 萬個 token,成本約 113.4 美元。

面臨高昂的服務成本,大模型廠商們紛紛祭出各種手段來降低開支。

DeepSeek 在其最新一代模型中提出了多種降本方法。例如,在對 DeepSeek-V3.1 進行思維鏈壓縮訓練後,模型推理時輸出 token 數可減少 20%-50%,且各項任務的平均表現與 DeepSeek-R1-0528 持平。這意味着 DeepSeek 的聊天機器人,能在不影響

DeepSeek-V3.1 還在一個模型內支持了思考模式與非思考模式,開發者可通過特定標籤控制推理的開關,進一步節省 API 使用成本。

騰訊混元降本的思路是架構創新。在混元 TurboS 上,騰訊融合了兩種架構,讓 Transformer 的上下文理解力與 Mamba 的長序列處理能力結合,實現性能與效率的平衡。

OpenAI 在 GPT-5 上採取了 “模型自動路由” 的方式:判斷任務的複雜度,將相對簡單的需求分配給輕量模型處理,從而節省算力資源。託管 GPT-5 的微軟 Azure 稱,這一方式最高可將推理成本削減 60%。

然而,問題的關鍵在於:大模型廠商和雲服務提供商的成本下降,並不必然傳導為終端用户與企業的使用成本下降。當前,如何在高昂的前期研發與部署投入後,將千億美元級別的 AI 投資真正轉化為商業價值,已成為所有大模型玩家必須回答的問題。

06.結論:大模型價格還有下探空間嗎?

未來,大模型價格的下降還存在幾條路徑。一方面,隨着模型平均性能的提升,未來經過優化的中低端廉價模型,也可高效解決特定任務。此外,隨着大模型、芯片領域的基礎研究不斷進步,新的技術路徑持續湧現,或許能在不犧牲效果的前提下,進一步壓縮訓練與推理的單位成本。

從產業發展的角度來看,大模型價格的階段性停滯或是回升有其價值。這為廠商回收前期鉅額研發與基礎設施投入,維持可持續創新提供了緩衝期,也能推動市場加速探索明確的商業化場景和付費模式。產業有望藉此機會,營造更為成熟、健康的生態。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。