Alibaba's AI battlefield sees another move: top scientist Xu Zhuhong transitions to lead multimodal interaction models

華爾街見聞
2025.09.30 06:00
portai
I'm PortAI, I can summarize articles.

阿里巴巴的 AI 頂尖科學家許主洪已從智能信息事業羣轉崗至通義實驗室,負責多模態交互模型的研究。這一調動表明阿里在 AI 基礎模型研發上加大投入,許主洪的轉崗意味着他將從 C 端應用轉向更核心的研發領域。此舉反映了阿里對 AI 戰略優先級的重新聚焦,旨在推動 AI 技術的突破。

作者 | 小 貓

編輯 | 硬 AI

正值全球科技巨頭在人工智能領域展開激烈軍備競賽之際,阿里巴巴內部的排兵佈陣再次出現關鍵變動。

華爾街見聞·硬 AI 獲悉,近期備受矚目的 AI 頂尖科學家、阿里集團副總裁許主洪(Steven Hoi)已從智能信息事業羣首席科學家的職位上,轉崗至阿里集團的核心 AI 研發機構——通義實驗室。

阿里方面向華爾街見聞·硬 AI 證實了這一消息,並表示許主洪將負責多模態交互模型方向的研究,後續向通義實驗室負責人、阿里雲 CTO 周靖人彙報。

這一內部調動釋放出重要信號:在吳泳銘 “AI 驅動” 的核心戰略下,阿里正進一步將頂尖人才向 AI 基礎模型研發的核心戰場集結,而多模態交互則被視為下一階段 AI 突破的關鍵隘口。

對於許主洪而言,這次轉崗意味着他將從更貼近 C 端應用的 “前線陣地” 轉向更為核心和底層的 “研發心臟”。

時間拉回至今年 2 月,這位在學術界和工業界均享有盛譽的 AI 大牛(IEEE Fellow、斯坦福大學評選的 “全球前 1% 的 AI 科學家”)正式加盟阿里,在當時引發了業內不小的轟動。他最初的落腳點是智能信息事業羣,一個囊括了夸克、UC 瀏覽器、書旗小説等億級用户產品的業務集羣,直接向 “85 後” 總裁吳嘉彙報。

彼時,業界的普遍解讀是,阿里意圖明顯——藉助許主洪在多模態基礎模型及 Agents 領域的深厚積累,快速提升 C 端產品與 AI 結合的應用能力,打造出能與用户直接對話的 “超級應用”。這也符合阿里在 AI C 端應用上 “軟硬一體” 的生態構想,即整合 “通義” APP、夸克、天貓精靈等核心業務,搶佔 AI 應用賽道先機。

然而,僅僅半年多後,許主洪便調離了這個被視為阿里 AI 應用重要出口的事業羣,轉而投身於更為基礎和前沿的通義實驗室。這一變化背後,是阿里對 AI 戰略優先級的再聚焦。

一位接近阿里的人士向華爾街見聞·硬 AI 分析稱:“這可以看作是阿里集中優勢兵力,全力攻堅核心基礎模型能力的體現。應用創新固然重要,但基礎模型的持續領先才是決定未來戰局的關鍵。讓最頂尖的科學家回到最核心的研發崗位,是確保技術引擎持續強大的必然選擇。”

阿里 “亮劍” 多模態交互

許主洪的新戰場——通義實驗室,是阿里 “通義” 系列大模型的 “孵化器”,由阿里雲 CTO 周靖人親自掛帥。周靖人同樣是 AI 領域的重量級人物,擁有哥倫比亞大學計算機博士學位,曾任微軟研發合夥人,是阿里雲大數據平台和人工智能研究的靈魂人物。

在周靖人的帶領下,通義實驗室已經構建了包括語言、視覺、語音等在內的 “全尺寸” 和 “全模態” 模型矩陣,其開源模型在全球範圍內獲得了巨大的影響力。

而許主洪此次負責的 “多模態交互模型”,正是當前全球大模型研發的前沿陣地。所謂多模態,即讓 AI 能夠像人一樣,同時理解和處理文本、圖像、音頻、視頻等多種信息形式,並以更自然、更智能的方式與人類進行交互。這被認為是 AI 從 “能聽會説” 邁向 “能看會想” 的關鍵一步,也是通往通用人工智能(AGI)的必經之路。

無論是谷歌的 Gemini、OpenAI 的 GPT-4o,還是阿里自身發佈的 Qwen-VL、Qwen-Audio 等模型,都已展現出強大的多模態能力。而許主洪在加入阿里之前,其研究便長期聚焦於此,尤其以 “多模態預訓練” 領域的突破性研究聞名。他提出的低成本預訓練策略,曾深刻影響全球大模型的研發進程。

此次履新,意味着阿里將整合許主洪在多模態領域的學術遠見和工業界經驗,與通義實驗室現有的工程和研發能力相結合,意圖在多模態這一核心賽道上建立起更強的技術壁壘。其未來的研究成果,不僅將為夸克、淘寶等前端應用提供更強大的 AI 能力支持,更有可能催生出全新的交互範式和產品形態,例如更智能的個人助理、更沉浸的 AI 硬件等。

“巨頭” 的邏輯:人才、資源與戰略定力

許主洪的轉崗,是阿里 AI 戰略在 “聚光燈” 下的又一次微調,也折射出當前 AI 巨頭競爭的普遍邏輯。

首先,頂尖人才的流向即是戰略方向的指針。從吳泳銘親自兼任阿里雲 CEO,到此次將許主洪這樣的戰略級科學家部署到基礎模型研發的一線,都顯示出阿里最高層對底層技術掌控力的極度重視。

其次,資源正以前所未有的力度向核心模型集中。知情人士透露,此次調整是 “正常的集團內部轉崗”,其背後邏輯是 “集中資源投入基礎模型能力建設”。這意味着,相較於在應用層面的多點開花,阿里當前更傾向於將寶貴的研發資源和人才投入到底層模型的 “深井” 中,以求獲得更具顛覆性的技術突破。

最後,這體現了巨頭在喧囂的 AI 浪潮中尋求戰略定力。AI 應用的商業化路徑仍在探索之中,但基礎模型的代際競爭卻已白熱化。在這樣的背景下,是否選擇長期投入、夯實技術根基,考驗着每一家公司的戰略遠見與決心。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。