Alibaba's AI battlefield sees another move: top scientist Xu Zhuhong transitions to lead multimodal interaction models

阿里巴巴的 AI 頂尖科學家許主洪已從智能信息事業羣轉崗至通義實驗室，負責多模態交互模型的研究。這一調動表明阿里在 AI 基礎模型研發上加大投入，許主洪的轉崗意味着他將從 C 端應用轉向更核心的研發領域。此舉反映了阿里對 AI 戰略優先級的重新聚焦，旨在推動 AI 技術的突破。

作者 | 小貓

編輯 | 硬 AI

正值全球科技巨頭在人工智能領域展開激烈軍備競賽之際，阿里巴巴內部的排兵佈陣再次出現關鍵變動。

華爾街見聞·硬 AI 獲悉，近期備受矚目的 AI 頂尖科學家、阿里集團副總裁許主洪（Steven Hoi）已從智能信息事業羣首席科學家的職位上，轉崗至阿里集團的核心 AI 研發機構——通義實驗室。

阿里方面向華爾街見聞·硬 AI 證實了這一消息，並表示許主洪將負責多模態交互模型方向的研究，後續向通義實驗室負責人、阿里雲 CTO 周靖人彙報。

這一內部調動釋放出重要信號：在吳泳銘 “AI 驅動” 的核心戰略下，阿里正進一步將頂尖人才向 AI 基礎模型研發的核心戰場集結，而多模態交互則被視為下一階段 AI 突破的關鍵隘口。

對於許主洪而言，這次轉崗意味着他將從更貼近 C 端應用的 “前線陣地” 轉向更為核心和底層的 “研發心臟”。

時間拉回至今年 2 月，這位在學術界和工業界均享有盛譽的 AI 大牛（IEEE Fellow、斯坦福大學評選的 “全球前 1% 的 AI 科學家”）正式加盟阿里，在當時引發了業內不小的轟動。他最初的落腳點是智能信息事業羣，一個囊括了夸克、UC 瀏覽器、書旗小説等億級用户產品的業務集羣，直接向 “85 後” 總裁吳嘉彙報。

彼時，業界的普遍解讀是，阿里意圖明顯——藉助許主洪在多模態基礎模型及 Agents 領域的深厚積累，快速提升 C 端產品與 AI 結合的應用能力，打造出能與用户直接對話的 “超級應用”。這也符合阿里在 AI C 端應用上 “軟硬一體” 的生態構想，即整合 “通義” APP、夸克、天貓精靈等核心業務，搶佔 AI 應用賽道先機。

然而，僅僅半年多後，許主洪便調離了這個被視為阿里 AI 應用重要出口的事業羣，轉而投身於更為基礎和前沿的通義實驗室。這一變化背後，是阿里對 AI 戰略優先級的再聚焦。

一位接近阿里的人士向華爾街見聞·硬 AI 分析稱：“這可以看作是阿里集中優勢兵力，全力攻堅核心基礎模型能力的體現。應用創新固然重要，但基礎模型的持續領先才是決定未來戰局的關鍵。讓最頂尖的科學家回到最核心的研發崗位，是確保技術引擎持續強大的必然選擇。”

阿里 “亮劍” 多模態交互

許主洪的新戰場——通義實驗室，是阿里 “通義” 系列大模型的 “孵化器”，由阿里雲 CTO 周靖人親自掛帥。周靖人同樣是 AI 領域的重量級人物，擁有哥倫比亞大學計算機博士學位，曾任微軟研發合夥人，是阿里雲大數據平台和人工智能研究的靈魂人物。

在周靖人的帶領下，通義實驗室已經構建了包括語言、視覺、語音等在內的 “全尺寸” 和 “全模態” 模型矩陣，其開源模型在全球範圍內獲得了巨大的影響力。

而許主洪此次負責的 “多模態交互模型”，正是當前全球大模型研發的前沿陣地。所謂多模態，即讓 AI 能夠像人一樣，同時理解和處理文本、圖像、音頻、視頻等多種信息形式，並以更自然、更智能的方式與人類進行交互。這被認為是 AI 從 “能聽會説” 邁向 “能看會想” 的關鍵一步，也是通往通用人工智能（AGI）的必經之路。

無論是谷歌的 Gemini、OpenAI 的 GPT-4o，還是阿里自身發佈的 Qwen-VL、Qwen-Audio 等模型，都已展現出強大的多模態能力。而許主洪在加入阿里之前，其研究便長期聚焦於此，尤其以 “多模態預訓練” 領域的突破性研究聞名。他提出的低成本預訓練策略，曾深刻影響全球大模型的研發進程。

此次履新，意味着阿里將整合許主洪在多模態領域的學術遠見和工業界經驗，與通義實驗室現有的工程和研發能力相結合，意圖在多模態這一核心賽道上建立起更強的技術壁壘。其未來的研究成果，不僅將為夸克、淘寶等前端應用提供更強大的 AI 能力支持，更有可能催生出全新的交互範式和產品形態，例如更智能的個人助理、更沉浸的 AI 硬件等。

“巨頭” 的邏輯：人才、資源與戰略定力

許主洪的轉崗，是阿里 AI 戰略在 “聚光燈” 下的又一次微調，也折射出當前 AI 巨頭競爭的普遍邏輯。

首先，頂尖人才的流向即是戰略方向的指針。從吳泳銘親自兼任阿里雲 CEO，到此次將許主洪這樣的戰略級科學家部署到基礎模型研發的一線，都顯示出阿里最高層對底層技術掌控力的極度重視。

其次，資源正以前所未有的力度向核心模型集中。知情人士透露，此次調整是 “正常的集團內部轉崗”，其背後邏輯是 “集中資源投入基礎模型能力建設”。這意味着，相較於在應用層面的多點開花，阿里當前更傾向於將寶貴的研發資源和人才投入到底層模型的 “深井” 中，以求獲得更具顛覆性的技術突破。

最後，這體現了巨頭在喧囂的 AI 浪潮中尋求戰略定力。AI 應用的商業化路徑仍在探索之中，但基礎模型的代際競爭卻已白熱化。在這樣的背景下，是否選擇長期投入、夯實技術根基，考驗着每一家公司的戰略遠見與決心。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。