
Table flip! After being "attacked," Zhipu open-sourced its mobile Agent, allowing everyone to create AI phones

手機產業的 “智駕時刻” 正在加速到來。當技術門檻被夷平,巨頭們或許可以圍剿一款 “豆包手機”,卻難以圍剿千萬個基於開源框架自建的個性化 Agent。智譜 AI 表示,“這件事只在一家公司做,是不夠的。AutoGLM 開源的初衷,是把這一層能力變成整個行業可以共同擁有、共同打磨的公共底座。”
一個 “豆包” 或許可以被圍剿,但千千萬萬個 “豆包” 正在趕來的路上。
“每台手機,都可以成為 AI 手機。”
12 月 9 日早間,國內頭部大模型廠商智譜 AI 正式宣佈開源其核心 AI Agent 模型——AutoGLM。這是一個歷經 32 個月研發、具備 “Phone Use”(手機操作)能力的智能體框架。

智譜此時選擇開源,被業界解讀為一種技術上的 “掀桌” 行為——它意味着 “人人都可以打造豆包手機” 的願景在技術上已成為可能。
對於行業來説,這或許是手機產業的 “智駕時刻”。中信證券點評稱,AI Agent 之於手機,正如自動駕駛之於汽車。
此次開源意味着硬件廠商、手機廠商和開發者均可基於 AutoGLM,在自己的設備或系統中復現一個能 “看懂” 屏幕、並模擬真人進行點擊、輸入、滑動的 AI 助手。目前,AutoGLM 已支持微信、淘寶、抖音、等超過 50 個高頻中文應用的核心場景,其自動化操作能力與此前引發熱議的 “豆包手機” 演示相似。

而這一動作發生在一個極其微妙且劍拔弩張之際。就在此前的一週內,字節跳動聯合努比亞發佈的 “豆包手機” 攪動了整個科技圈,引發了互聯網巨頭們的集體 “應激反應”。
破壁:從 “豆包圍城” 到 “全員 Agent”
事件的導火索可以追溯到一週前。
12 月 1 日,字節跳動聯合中興通訊旗下努比亞推出了搭載 “豆包手機助手” 的 nubia M153,售價 3499 元。這款手機憑藉系統級權限,能夠模擬人類操作,跨越 APP 孤島執行點外賣、發微信、比價購物等複雜任務。這一創新迅速引爆市場,首批備貨瞬間售罄,在閒魚平台上,該手機的未拆封報價甚至一度被炒至 7999~9999 元。
然而,這種 “上帝之手” 般的跨應用能力迅速觸碰了互聯網行業的逆鱗。而後,微信、淘寶及多家銀行 APP 隨即啓動了防禦機制。用户反饋,當豆包助手嘗試接管微信或淘寶時,會出現異常退出、風險提示甚至封號的情況。大廠們給出的理由是 “安全與隱私”,但行業普遍認為,本質上這是對流量入口和數據控制權的殊死保衞戰。
就在行業以為 AI 手機將因巨頭封鎖而陷入短暫沉寂之際,智譜 AI 投下了一枚重磅炸彈。
據智譜官方通稿顯示,AutoGLM 項目正式在 GitHub 上線,開源了包括訓練好的核心模型、Phone Use 能力框架與工具鏈,以及覆蓋 50+ 高頻中文 App 的可跑通 Demo。智譜方面明確表示:
“這件事只在一家公司做,是不夠的。AutoGLM 開源的第一層初衷,是把這一層能力變成整個行業可以共同擁有、共同打磨的公共底座。”
市場分析人士指出,這一舉措的殺傷力在於,它將一項原本被視為 “大廠核武器” 的技術,變成了所有開發者唾手可得的工具。當技術門檻被夷平,巨頭們或許可以圍剿一款 “豆包手機”,卻難以圍剿千千萬萬個基於開源框架自建的個性化 Agent。

圖源:智譜 AI 官方公眾號 下同
解構:技術底層的 “降維打擊”、32 個月的 “底層突圍”
為什麼説這次開源是 “掀桌子”?核心在於智譜選擇了一條讓巨頭難以防禦的技術路徑。
根據智譜官方發佈的技術細節及行業內部的深度拆解,AutoGLM 的技術實現具有以下顛覆性特徵:
1. 從 “亂點” 到 “可控” 的進化:
據智譜官方透露,AutoGLM 的研發始於 2023 年 4 月。早期系統經常 “迷失” 在手機操作中,但經過 32 個月的打磨,團隊建立了一整套 Phone Use 能力框架,將點擊、滑動、輸入、界面理解抽象化。2024 年 11 月,AutoGLM 發出了人類歷史上第一個由 AI 完成的手機紅包——不是通過 API,而是 AI 真正 “看懂” 了界面並完成了操作。

2. 視覺大模型 +ADB 的 “降維打擊”:
不同於傳統腳本依賴易被封禁的無障礙服務(Accessibility),AutoGLM 在底層調用了 ADB(Android Debug Bridge)指令,並結合視覺大模型(AutoGLM-Phone-9B)。其運行邏輯是 “看屏幕截圖 -> 大模型分析 -> 模擬手指點擊”。這種基於視覺的 “類人操作”,讓 APP 廠商通過簡單的代碼檢測進行防禦變得極其困難。只要人眼能看懂界面,AI 就能操作。


3. 隱私問題的 “終極解法”、繞過易被圍剿的接口:
針對大廠 “圍剿” 的理由——隱私安全,智譜在開源公告中給出了明確回應:“技術向整個生態開放,數據與隱私,永遠留在使用方這一側。” AutoGLM 支持私有化部署,通過 MobileRL 等強化學習算法在雲端虛擬手機中訓練,而實際運行時,企業和開發者可以在自己的合規環境中掌控數據。AutoGLM 支持本地部署模式,模型運行和數據處理均在用户設備端完成,數據不出手機。這種架構設計直接瓦解了互聯網大廠以 “隱私泄露” 為由進行圍剿的合法性基礎。

影響:手機產業的 “智駕時刻”
站在投資者和行業發展的角度審視,智譜 AutoGLM 的開源具有里程碑式的意義,其不僅關乎技術,更關乎商業模式的重構。
1. 硬件廠商的 “新賽點”
中信證券在 12 月 5 日的研報中指出,AI Agent 之於手機,正如自動駕駛之於汽車。此前,手機廠商苦於缺乏能夠打通所有 APP 的超級入口,而 AutoGLM 的開源為榮耀、小米、OPPO 等廠商,甚至中小硬件開發者提供了現成的技術底座。參考汽車行業 “華為 + 賽力斯” 的智選模式,未來 “大模型廠商 + 手機廠商” 的深度綁定將成為常態,AI 手機有望迎來類似新能源汽車的爆發式增長。

2. 互聯網生態的 “倒逼機制”
對於騰訊、阿里等互聯網巨頭而言,護城河正面臨嚴峻挑戰。當用户可以通過 AI Agent 繞過 APP 的首頁推薦、廣告位,直接觸達核心服務(如直接訂票、比價購物),超級 APP 的流量分發邏輯將失效。智譜的開源將這種能力泛化後,巨頭們面臨的選擇只剩下兩個:要麼繼續修築高牆,冒着用户體驗下降的風險死守;要麼主動坐上談判桌,開放 API,與 AI Agent 共建新生態。
3. 個體開發者的 “賦能”
正如 Linux 開源推動了操作系統的普及,Stable Diffusion 開源引爆了 AI 繪畫,AutoGLM 的開源標誌着手機 Agent 進入了 “可編程” 時代。未來,基於該框架,可能會誕生出專門服務於視障人士的公益 Agent、專注於特定工作流的效率 Agent,甚至是完全個性化的私人助理。

結語:新舊秩序的交替
2025 年 12 月,從豆包手機的 “衝鋒” 到智譜 AutoGLM 的 “開源”,短短十天內,中國互聯網經歷了一場關於入口、流量與控制權的劇烈震盪。
AutoGLM 的開源,實際上是把選擇權交還給了用户和開發者。它宣告了僅僅依靠封閉生態和流量壟斷的時代正在過去。雖然當下的體驗或許還存在延遲或不穩定性,但智能體時代的到來無法阻擋。
對於市場而言,這不僅僅是一個技術新聞,更是一個明確的信號:智能終端的交互邏輯正在發生根本性逆轉,一個新的萬億級賽道——端側智能體經濟,已經轟然開啓。
開源地址可戳:https://github.com/zai-org/Open-AutoGLM
