Zhipu AutoGLM launched: Install a universal agent on every phone

智譜發佈了 AutoGLM 2.0，全球首個手機 Agent，具備推理、代碼與多模態能力，能夠在任何設備上執行多樣化任務。用户可通過簡單指令讓 AutoGLM 操作美團、京東等應用，完成外賣、機票預訂等任務。它不僅是聊天工具，更是全能代理人，能在辦公場景中跨網站執行工作，生成內容併發布到社交媒體。

還記得「AI 給人類發的第一個紅包」嗎？

去年 10 月智譜發佈全球首個 Phone-Use 產品 AutoGLM，開啓 Agent 的新時代。

今天，AutoGLM 2.0 再次升級，將 Agent 應用提升到新的高度——

全球首個手機 Agent，人人可用；
開創 Agent+ 雲手機/雲電腦的新技術範式，不搶佔用户手機和電腦；
突破硬件限制，在任何設備、任何場景下運行，幫助用户代理操作；
國產模型（GLM-4.5、GLM-4.5V）驅動，具備推理、代碼與多模態的全能能力。

即刻起，人人都可使用 AutoGLM。我們將快速迭代推出新功能（“定時任務” 很快上線，AI 每天主動替你幹活）。應用商店搜索 “AutoGLM”，或點擊文末 “閲讀原文”。

操作執行助手

過去的 AI 多停留在 “對話” 層面；一般的智能體助手也多侷限於信息查詢和總結。

AutoGLM 2.0 則實現了質的飛躍——它不再只是 “説”，而是真正能夠 “做”。

事實上，在 AutoGLM 1.0 中，我們已探索過讓 AI 代替用户完成部分手機操作，但只在有限場景下生效。隨着 AutoGLM 2.0 的發佈，它已經成長為一名執行型助手，能夠在「雲端」自主完成多樣化的任務。

在生活場景中，用户只需一句話，就能讓 AutoGLM 操作美團、京東、小紅書、抖音等幾十個高頻應用：點外賣、訂機票、查房源，例如幫你買「秋天的第一杯奶茶」。

在辦公場景中，它同樣能跨網站執行全流程工作，操作網頁版的飛書、網易郵箱、知乎、微博、抖音、微頭條等網站：從信息檢索到內容撰寫，再到生成視頻、PPT 或播客，並直接完成小紅書、抖音等社交媒體平台內容發佈。

這意味着，AI 不再是一個 “聊天工具”，而是一個能真正替你幹活的全能代理人。不僅能給出答案，還能把任務完整執行，幫助用户節省時間與精力，徹底改變人與 AI 的協作方式。

為 AI 配一台手機

AutoGLM 的主要亮點，是一個 APP 讓一部手機成為真正的 “新物種”。

在 AutoGLM 2.0 中，我們為 AI 配備了專屬智能體手機/智能體電腦，讓它可以在雲端自主幹活、完成任務，而無需佔用用户的本地設備，期間用户可以使用其他 APP（如刷抖音、打遊戲）。

這意味着AI不僅能 “自動駕駛手機”，還可 “異步代理辦公”。讓手機變成具備自主執行、跨端協作能力的智能體手機。

AutoGLM 會以這樣的產品形態出現，源於我們對AGI 早期形態的理解。我們認為從 Agent 到 AGI，還需要滿足 3A 原則：

Around-the-clock（全時）：24 小時運行，即使用户離線，Agent 依然在執行任務；
Autonomy without interference（自主零干擾）：獨立運行，不佔用用户屏幕與算力，平行世界的搭子；
Affinity（全域連接）：跳出瀏覽器對話框，跨越手機、電腦、手錶、眼鏡、家電等設備，操作物理世界。

AI 新硬件

藉助 AutoGLM 強大的雲端執行能力，人與設備的交互方式正在被重新定義。

我們已將 AutoGLM 的操作執行能力封裝為 API，開發者只需簡單接入，即可將這一能力無縫融入各類硬件設備，從 AI 眼鏡等可穿戴設備到傳統家電。

AutoGLM首次讓硬件具備完整的手機級操作能力，無需在端側堆疊複雜系統或大容量電池。例如，可以通過智能眼鏡點一杯咖啡。

今日起，AutoGLM 移動端 API 申請通道及開發者生態共建計劃正式上線。除手機與電腦外，手錶、眼鏡、家電等設備都能成為 Agent 驅動的智能助手。

期待與更多開發者共同探索 AI 融入物理世界的無限可能。

技術 SOTA

AutoGLM 可以在國內免費向所有人開放，因為它是純國產 Agent，成本相較於接入國外模型的 Agent 有了數量級的下降。

AutoGLM 由智譜最新開源 SOTA 語言模型 GLM-4.5 與視覺推理模型 GLM-4.5V 驅動。AutoGLM 將基座模型原生能力發揮到極致，並結合在「端到端異步強化學習」方面的多項突破成果，可以完成推理、編碼、研究、Agentic 與 GUI 操作等多類任務，並可根據需求靈活調用最合適的「大腦」完成執行。

ComputerRL：提出 API-GUI 協同範式，提升數據多樣性與計算效率；改進 GRPO 並提出 Entropulse 機制，增強探索與策略多樣性。
MobileRL：創新難度自適應強化學習方法（推理自舉預熱 + 難度自適應 GRPO），顯著提升移動端任務的穩定性與收斂效率。
AgentRL：通過交叉採樣與任務優勢歸一化機制，解決多任務訓練中的不穩定與梯度分佈不均，增強整體魯棒性與效率。

在 Device Use 基準測試（涵蓋手機、電腦和網頁操作）中，AutoGLM 表現優於 ChatGPT Agent、UI-TARS-1.5 和 Claude Sonnet 4，展現出更強的魯棒性與通用性，處於主流 Agent 的SOTA 水平。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。