Applying reasoning to self-developed Agents, Zhipu has started to take the lead

華爾街見聞
2025.03.31 13:46
portai
I'm PortAI, I can summarize articles.

智譜在中關村論壇上發佈了 AutoGLM 沉思,這是全球首個集深度研究與實際操作能力於一體的智能體,標誌着 AI Agent 進入 “邊想邊幹” 的新階段。智譜推出了 Agentic GLM 系列,包括 GLM-4、GLM-Z1 等模型,尤其是 GLM-Z1-Air 在推理性能上與 DeepSeek R1 相當,價格卻僅為其 1/30。智譜與三星等企業合作,並啓動出海戰略,預計 2024 年商業化收入增長超過 100%。

作者 | 劉寶丹

編輯 | 黃昱

DeepSeek 已經成為行業風向標,在這場 AI 競賽中,主流模型公司都在試圖超越 DeepSeek,國內 AI 獨角獸智譜也給出了自己的答卷。

3 月 31 日,智譜在中關村論壇上正式發佈 AutoGLM 沉思,這一全新智能體不僅具備深度研究能力(Deep Research),還能實現實際操作(Operator),真正推動 AI Agent 進入 “邊想邊幹” 的階段。

作為全球首個集深度研究與實際操作能力於一體的 Agent,AutoGLM 沉思的發佈是智譜自主智能體技術的一次重要進步,也是設備操控智能體的進一步升級。

AutoGLM 沉思背後,智譜推出 Agentic GLM 系列矩陣,包括 GLM-4 基座模型、GLM-Z1 推理模型、GLM-Z1-Rumination 沉思模型和 AutoGLM 模型等,尤其是推理模型 GLM-Z1-Air,它擁有比肩 DeepSeek R1 的推理性能,而價格僅需 R1 的 1/30。

距離 ChatGPT 出圈已經過去兩年多,AI 大模型也從技術迭代轉向應用落地,後者已經成為檢驗模型廠商競爭力的核心指標。目前,智譜已和三星等頭部企業合作,還成為北京、上海等城市的合作伙伴。此外,智譜也啓動了出海戰略。

智譜 CEO 張鵬對華爾街見聞表示,公司 2024 年商業化收入增長超過 100%,2025 年會有更大的增長機會。

在這場 AI 大模型競賽中,智譜開始探索出自己的成長路徑。

AutoGLM 沉思:邊想邊幹

4 個月前,智譜用 AutoGLM 實現了羣發紅包功能,這是 AI 發出的第一個紅包,代表着 AI 大模型開始從對話走向操作。4 個月後,智譜將推理能力佈局到 Agent 上。

不同於上一次發紅包,這次智譜開始用 Agent 賺到錢了。

14 天前,智譜秘密開展了一項測試,公司註冊了一個小紅書號,專注於生活科普。然後用 AutoGLM 沉思生成筆記,比如怎麼選咖啡壺、怎麼做化妝品成分對比等。

在現場演示中,張鵬表示,調查 2025 年化妝品最火的三大抗老成分,比對它們的作用、用法、優劣勢,最後還要做嚴謹的比對分析。“有些任務可真不簡單。”

智譜現場揭曉了該賬號的成績:兩週時間收穫了 5000 粉絲,接到多條商單邀請,昨天,智譜發出了第一個商單,賺了 500 塊錢。

AutoGLM 沉思是首個集深度研究能力和網頁操作能力於一體的 Agent,體現了智譜對 AI Agent 的最新理解,即讓機器不僅能夠思考,還能主動行動,實現 “邊想邊幹” 的目標。

這也是 AutoGLM 沉思與 Open AI 的 DeepResearch 不同的地方,沉思推動 AI Agent 從單純的思考者,進化為能交付結果的智能執行者。

張鵬表示,沉思突破了實時聯網搜索、動態工具調用、深度分析和自我驗證,實現真正的長程推理和任務執行。

比如,讓沉思寫一篇報告,“關於哪吒 2 票房的成功將會給中國電影行業帶來怎樣的改變。” 據張鵬介紹,沉思模型很擅長做這類開放性的問題,需要模型自己去探索,最後它生成了近萬字的報告。

這次,智譜發佈的是 AutoGLM 沉思 preview 版本,核心支持 research 場景。張鵬透露,在未來兩週,將進一步擴展更多 Agent 的執行能力。

此外,AutoGLM 沉思發佈即上線,目前已經在智譜清言 PC 客户端上線。

背後模型全棧自研

AutoGLM 沉思模型的背後,是智譜自主研發的全棧大模型技術。

整體來看,沉思融合了 GLM-4 的通用能力、GLM-Z1 的反思能力、GLM-Z1-Rumination 的沉思能力,以及 AutoGLM 的自動執行能力。

智譜重新訓練了一個 320 億參數的基座模型 GLM-4-Air-0414,在預訓練階段加入了更多的代碼類、推理類數據,並在對齊階段針對智能體能力進行了優化,模型在工具調用、聯網搜索、代碼等智能體任務上的能力得到大大加強。

會上,張鵬表示,GLM-4-Air-0414 以 32B 參數量比肩更大參數量的國內外主流模型,這使得模型在適配智能體任務方面特別有效。“這是因為智能體任務往往涉及多輪複雜交互,32B 的參數量使得 GLM-4-Air-0414 能快速執行復雜任務,為 AI 智能體的真正大規模落地應用提供了堅實基礎。”

基於 GLM-4-Air-0414,智譜推出了全新的深度思考模型 GLM-Z1-Air,在性能表現上,可以與 DeepSeek-R1(671B,激活 37B)媲美。

在推理速度上,GLM-Z1-Air 相比 R1 提升了 8 倍,成本可以降低至 1/30,實現高性能與高性價比的雙重突破。此外,GLM-Z1-Air 可在消費級顯卡上運行。

基於 GLM-Z1,智譜通過擴展強化學習訓練,提升了模型結合工具使用完成長程推理能力,訓練出沉思模型 GLM-Z1-Rumination。

張鵬表示,該模型突破了傳統 AI 單純依賴內部知識推理的侷限,創新性地結合實時聯網搜索、動態工具調用、深度分析和自我驗證,形成完整的自主研究流程。

GLM-Z1-Rumination 能夠主動理解用户需求,在複雜任務中不斷優化推理、反覆驗證與修正假設,使研究成果更具可靠性與實用性。相比於傳統的推理模型,智譜期待沉思模型引領 AI 助手進入一個 “高智商” 到 “高智商 + 高自主” 的階段。

Agent 的核心就是推理規劃和動手能力。如果説沉思模型是 AutoGLM 沉思的大腦,那麼,AutoGLM 則是 AutoGLM 沉思的手腳。

智譜去年 10 月發佈了 AutoGLM,它是全球首個能夠在手機上執行長達 50 多步 action 的大模型智能體,AutoGLM 沉思版背後的 AutoGLM 能力,較上次發佈也有了非常大的進化。

張鵬表示,大模型的預訓練和後訓練存在 Scaling Law,Agent 也存在類似的 Scaling Law。“在 Agent Scaling Law 的基礎上,我們進一步發現了 Agent 存在的能力湧現。”

比如,在訓練中,從未教給 AutoGLM 沉思訪問過巨潮資訊網。然而,當發送指令 “幫我收集昨天關於具身智能的相關研報” 時,AutoGLM 沉思能夠規劃出通過訪問巨潮資訊解決問題的方案,並順利操作了網站。

張鵬表示,AutoGLM 的動手能力目前在行業內處於 Sota,包括瀏覽器、手機和電腦在內的使用工具能力,全面領先。在 GUI 智能體方面,CogAgent 在 GUI Agent 的多個榜單上取得了 Sota 的結果。

上述一系列成績背後,離不開智譜對 Agent 的前瞻性佈局。

從 2023 年 10 月最早推出具備 FunctionCall 能力的智譜清言,到 2024 年 1 月上線支持智能體編排的 GLMs,再到 2024 年 10 月推出 AutoGLM,以及今天推出的 AutoGLM 沉思,智譜一直在引領對 Agent 的探索。

在經過 6 年的技術沉澱後,智譜終於開始在這場 AI 競賽中展現出更多競爭力。

開源並不等於免費

與 DeepSeek 和阿里等 AI 公司一樣,智譜也堅持開源策略。張鵬表示,上述模型將於 4 月 14 日開源,並將在未來兩週內陸續上線 MaaS 平台。

阿里開源的商業邏輯是為了售賣雲計算服務,對模型廠商而言,開源就意味着把核心技術公開,對於商業化會帶來一定挑戰。

張鵬也坦誠,開源對商業化市場會有一些影響。不過,他也強調,開源並不等於完全免費,後期技術人員的投入、維護成本,包括如何把 DeepSeek 做本地化落地等,成本一點都不低,要找專業團隊來解決問題。

目前,市面上有各種智能體產品,作為很早就開始智能體相關研究的模型廠商,智譜深諳市場需求。張鵬強調:“一定要做模型的服務,不是説把產品光扔給企業就可以了,企業玩不轉白搭,他花了錢反過頭來還會告訴你不好用。”

目前,智譜正在大力推進 AI 技術的整體服務,包括提供工具和平台,提供案例和解決方案,提供更好的經驗,讓更多的人能夠把買來的模型或者開源模型真正地用起來。

華爾街見聞獲悉,目前,智譜已攜手金融、教育、醫療、政務、企服等領域的合作伙伴,共同推進 AgenticLLM 的落地應用。今年 2 月,智譜和三星官宣了基於 Agentic LLM 的相關合作,將 Agent 體驗帶到三星最新手機 Galaxy S25 系列上。同時,智譜也相繼與北京、杭州、上海、成都、珠海等城市達成合作。

智譜也在積極出海,當天,由智譜主導,來自東盟十國及 “一帶一路” 沿線的 10 個國家共同發起了 “自主大模型國際共建聯盟” 正式成立,幫助 “一帶一路” 國家建立自主 AI,構建可控的國家級 AI 基礎設施。

對於商業化方面,智譜去年整體實現了超過 100% 的增長速度,很多頭部行業已經打進去,有一定規模化的效果。對於今年的預期,張鵬表示,經過再一次科普,會讓市場呈十倍以上的增長,會有更大的機會存在。

“整個模式和商業路徑會有一些變化,我們會做調整。但是我們還是保持一貫的穩定的商業化落地的速度和效益,持續提升商業化落地的效果。” 張鵬表示。

當談到公司目前的戰略重心時,張鵬對華爾街見聞表示,智譜把自己定位成技術驅動的公司,另外一條腿是商業化路徑,這兩條腿並不是互相矛盾的,也不是互相爭搶資源,處於動態調整的過程。

張鵬進一步表示:“技術的推進和演進,到了一個必須深入到產業和應用當中去,吸取營養回饋技術研發,所以才會從去年開始大力推進產業化、商業化落地這件事情,會有一些資源的投入。但是從整體的核心任務和資源投入角度來講,我們更多的資源還是投入在技術研發、創新這一塊更高一些。”

這場通往 AGI 的競賽仍處於早期,對智譜來説,雖然已經探索到 L3-Agentic LLM 階段,但未來的路仍然充滿荊棘,要想在全球範圍內實現更大的創新,還要全力以赴。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。