Zhipu AutoGLM launched: Install a universal agent on every phone

華爾街見聞
2025.08.20 08:20
portai
I'm PortAI, I can summarize articles.

智譜發佈了 AutoGLM 2.0,全球首個手機 Agent,具備推理、代碼與多模態能力,能夠在任何設備上執行多樣化任務。用户可通過簡單指令讓 AutoGLM 操作美團、京東等應用,完成外賣、機票預訂等任務。它不僅是聊天工具,更是全能代理人,能在辦公場景中跨網站執行工作,生成內容併發布到社交媒體。

還記得「AI 給人類發的第一個紅包」嗎?

去年 10 月智譜發佈全球首個 Phone-Use 產品 AutoGLM,開啓 Agent 的新時代。

今天,AutoGLM 2.0 再次升級,將 Agent 應用提升到新的高度——

  • 全球首個手機 Agent,人人可用;
  • 開創 Agent+ 雲手機/雲電腦的新技術範式,不搶佔用户手機和電腦;
  • 突破硬件限制,在任何設備、任何場景下運行,幫助用户代理操作;
  • 國產模型(GLM-4.5、GLM-4.5V)驅動,具備推理、代碼與多模態的全能能力。

即刻起,人人都可使用 AutoGLM。我們將快速迭代推出新功能(“定時任務” 很快上線,AI 每天主動替你幹活)。應用商店搜索 “AutoGLM”,或點擊文末 “閲讀原文”。

操作執行助手

過去的 AI 多停留在 “對話” 層面;一般的智能體助手也多侷限於信息查詢和總結。

AutoGLM 2.0 則實現了質的飛躍——它不再只是 “説”,而是真正能夠 “做”。

事實上,在 AutoGLM 1.0 中,我們已探索過讓 AI 代替用户完成部分手機操作,但只在有限場景下生效。隨着 AutoGLM 2.0 的發佈,它已經成長為一名執行型助手,能夠在「雲端」自主完成多樣化的任務。

在生活場景中,用户只需一句話,就能讓 AutoGLM 操作美團、京東、小紅書、抖音等幾十個高頻應用:點外賣、訂機票、查房源,例如幫你買「秋天的第一杯奶茶」。

在辦公場景中,它同樣能跨網站執行全流程工作,操作網頁版的飛書、網易郵箱、知乎、微博、抖音、微頭條等網站:從信息檢索到內容撰寫,再到生成視頻、PPT 或播客,並直接完成小紅書、抖音等社交媒體平台內容發佈。

這意味着,AI 不再是一個 “聊天工具”,而是一個能真正替你幹活的全能代理人。不僅能給出答案,還能把任務完整執行,幫助用户節省時間與精力,徹底改變人與 AI 的協作方式。

為 AI 配一台手機

AutoGLM 的主要亮點,是一個 APP 讓一部手機成為真正的 “新物種”。

在 AutoGLM 2.0 中,我們為 AI 配備了專屬智能體手機/智能體電腦,讓它可以在雲端自主幹活、完成任務,而無需佔用用户的本地設備,期間用户可以使用其他 APP(如刷抖音、打遊戲)。

這意味着AI不僅能 “自動駕駛手機”,還可 “異步代理辦公”。讓手機變成具備自主執行、跨端協作能力的智能體手機。

AutoGLM 會以這樣的產品形態出現,源於我們對AGI 早期形態的理解。我們認為從 Agent 到 AGI,還需要滿足 3A 原則:

  • Around-the-clock(全時):24 小時運行,即使用户離線,Agent 依然在執行任務;
  • Autonomy without interference(自主零干擾):獨立運行,不佔用用户屏幕與算力,平行世界的搭子;
  • Affinity(全域連接):跳出瀏覽器對話框,跨越手機、電腦、手錶、眼鏡、家電等設備,操作物理世界。

AI 新硬件

藉助 AutoGLM 強大的雲端執行能力,人與設備的交互方式正在被重新定義。

我們已將 AutoGLM 的操作執行能力封裝為 API,開發者只需簡單接入,即可將這一能力無縫融入各類硬件設備,從 AI 眼鏡等可穿戴設備到傳統家電。

AutoGLM首次讓硬件具備完整的手機級操作能力,無需在端側堆疊複雜系統或大容量電池。例如,可以通過智能眼鏡點一杯咖啡。

今日起,AutoGLM 移動端 API 申請通道及開發者生態共建計劃正式上線。除手機與電腦外,手錶、眼鏡、家電等設備都能成為 Agent 驅動的智能助手。

期待與更多開發者共同探索 AI 融入物理世界的無限可能。

技術 SOTA

AutoGLM 可以在國內免費向所有人開放,因為它是純國產 Agent,成本相較於接入國外模型的 Agent 有了數量級的下降。

AutoGLM 由智譜最新開源 SOTA 語言模型 GLM-4.5 與視覺推理模型 GLM-4.5V 驅動。AutoGLM 將基座模型原生能力發揮到極致,並結合在「端到端異步強化學習」方面的多項突破成果,可以完成推理、編碼、研究、Agentic 與 GUI 操作等多類任務,並可根據需求靈活調用最合適的「大腦」完成執行。

  • ComputerRL:提出 API-GUI 協同範式,提升數據多樣性與計算效率;改進 GRPO 並提出 Entropulse 機制,增強探索與策略多樣性。
  • MobileRL:創新難度自適應強化學習方法(推理自舉預熱 + 難度自適應 GRPO),顯著提升移動端任務的穩定性與收斂效率。
  • AgentRL:通過交叉採樣與任務優勢歸一化機制,解決多任務訓練中的不穩定與梯度分佈不均,增強整體魯棒性與效率。

在 Device Use 基準測試(涵蓋手機、電腦和網頁操作)中,AutoGLM 表現優於 ChatGPT Agent、UI-TARS-1.5 和 Claude Sonnet 4,展現出更強的魯棒性與通用性,處於主流 Agent 的SOTA 水平。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。