The Transformation Journey of Tencent's Hunyuan Over Three Years

華爾街見聞
2026.01.08 06:35
portai
I'm PortAI, I can summarize articles.

騰訊在 2023 年啓動大模型研發,首次將大語言模型作為重點項目,由 27 歲的姚順雨負責。混元的下一個版本將是 Agent 模型,姚順雨主導訓練。騰訊在經歷多重低谷後,計劃在 2025 年對標全球頂尖大模型。青雲計劃是針對優秀畢業生的 AI 人才招聘,騰訊通過高薪挖人行動吸引字節跳動的優秀人才。

Key Points

2023 年啓動大模型研發以來,騰訊第一次把大語言模型變成一把手工程,負責人是個 27 歲的年輕人;

混元下一個版本將是一個 Agent 模型,主要由姚順雨主導訓練;

在姚順雨入職前,混元有過兩位總負責人:張正友與蔣傑。兩人背景主要是計算機視覺和大數據,而非自然語言處理;

ChatGPT 發佈的 2022 年,騰訊正在經歷多重低谷。低谷之一是遊戲業務,在此之前,騰訊在 2020 年左右面臨過一個更大的危機:QQ 的「孵化器魔法」失效了;

有「配方」、也有更多資源後,騰訊訓練出下一代基座模型的時間可能會更短。但也意味着,姚順雨和騰訊的甜蜜期差不多就是半年。

2025 年 11 月下旬,大學畢業生林楓在深圳參加了騰訊青雲計劃閉門會。活動採取定向邀請制,為期兩天,會議內容除了郵輪觀光、參觀騰訊總部,還有一個環節是部門見面會——姚順雨在現場。

這次見面會兩個小時左右,姚順雨是開場發言者,他講了大概只有 20 分鐘,但富有雄心。

「他説混元的目標是對標全球最頂尖的一批大模型。」林楓對第一財經「新皮層」説。

林楓對姚順雨印象深刻,除了「感覺他是主導混元大模型研發進度的管理者」,他還是林楓在現場看到的騰訊高管中為數不多的年輕人。

姚順雨,2025 年下半年加入騰訊,此前任職於 OpenAI。

青雲計劃是騰訊 2023 年下半年提出的面向優秀畢業生的 AI 人才專項招聘,對標字節跳動的 Top Seed 人才計劃。

與青雲計劃同時進行的是騰訊持續一年的高薪挖人行動。長期從事基座模型招聘的許嵐告訴「新皮層」,騰訊最重要的挖人對象之一是字節跳動。字節跳動 2-2 職級的候選人,跳槽到騰訊後可以獲得 T12 或 T13 的職級,相當於在字節跳動的原職位連升兩級。而且,薪酬也會直接翻倍,有的甚至會提升 200%。「這種行情最近一個月才出現,以前字節 2-2 的候選人會定下 T9 或 T10 的職級,薪資漲幅只有 30%。」許嵐説。

2025 年的騰訊就是 2024 年的字節跳動。2024 年,字節跳動加速基礎模型的研發進度,第一個動作也是搶人才——它當時的搶人對象主要是阿里巴巴,一年後,騰訊「接棒」,從字節跳動搶奪人才。

多位接近騰訊的人士對「新皮層」稱,騰訊大概 2024 年年底就開始大規模對外招募基礎模型相關的人才,並啓動一系列組織架構調整。2025 年 9 月姚順雨的加入加速了這一進程。

姚順雨新政

最開始,入職騰訊混元的外部人才主要來自微軟。自 2024 年 12 月起,微軟開源模型 WizardLM 團隊核心成員孫慶豐、微軟亞洲研究院視覺計算組前首席研究員胡瀚、微軟 WizardLM 團隊項目創建者徐燦陸續加入騰訊。然後是 2025 年 8 月,在月之暗面研究語音模型的研究員譚旭入職騰訊——加入月之暗面前,他任職於微軟亞洲研究院。

「騰訊只看來自 DeepSeek、月之暗面、字節和阿里這 4 家基座模型團隊的候選人,其他公司是不看的。」接近騰訊招聘的人士陳立峯對「新皮層」説。

他對「新皮層」稱,2025 年年中,字節跳動曾通過發放「豆包虛擬股」激勵員工,相當於為其大模型團隊漲薪。但正是在這輪股權激勵期間,部分字節豆包員工乘勢轉身加入了騰訊混元,原本年薪總包約為 250 萬至 300 萬元的字節跳動員工,加入混元后能拿到年薪 300 萬以上的 Offer。

2025 年 12 月,字節跳動再次向全球員工發佈了一封漲薪郵件,將公司整體獎金和調薪投入分別提升 35% 和 1.5 倍,以確保員工薪酬的競爭力和激勵回報在全球各個市場都「領先於頭部水平」。

在字節的防守下,騰訊的搶人計劃也加大了力度。「姚順雨的加入是騰訊混元人才招聘的一個關鍵節點。」許嵐説,姚順雨來之前,高管加盟騰訊「屬於大廠間的正常人才流動」,姚順雨加入後,混元不僅加強了招聘力度,「對候選人信息的保密性處理也升級了」。以姚順雨的加入為節點,騰訊招募了更多大語言模型(LLM)相關的人才,在此之前,包括孫慶豐、胡瀚、徐燦、譚旭等在內的加入者主要研究方向都以多模態為主。

多位招聘方人士告訴「新皮層」,姚順雨會在與 LLM 相關的招聘中擔任面試官,部分候選人由他親自引薦。這些新招募的人中,至少有 3 位 T12 職級的人才來自字節 Seed 團隊和 DeepSeek,其中一位負責預訓練的數據工作,還有一位和姚順雨一起做大模型的前沿探索。

部分混元員工因為姚順雨的到來信心倍增。「他們認為姚順雨可能會為內部爭取更多激勵,就像字節 Seed 為團隊成員發豆包股一樣。」許嵐説,姚順雨接手騰訊混元大模型不久,就與每位團隊成員都有過接觸、聊天,還參加了不同研究小組的團建和聚餐。

姚順雨的舉動獲得了部分員工的信任。一位內部員工認為他「性格討喜,跟着他幹活有信心」,另一位內部員工認為他「管理能力出色」。但也有部分混元成員開始擔心能力不足被調整,開始主動尋求外部機會。「從混元離職的人可能會變多,無論主動還是被動。」許嵐説。

換血只是姚順雨加入混元后的新政之一。在模型策略上,他也提出了不同於混元大模型前任領導者的觀念。

接近騰訊混元的人士告訴「新皮層」,相較於前任負責人,姚順雨更加重視後訓練——這在很多人的意料之中,姚順雨此前的主要工作都與後訓練更相關。不過除此之外,他還打算從預訓練的數據部分入手,「從數據開始重新訓練混元」,這相當於回到起點。林楓稱,姚順雨在 11 月的青雲計劃閉門會上還提出過一個明確要降低「發版速度」的計劃,「他説以前混元模型在內部更新版本的速度很快,有時候一週就會發布兩個版本。他來到這裏的第一件事就是降低發版速度,打磨好整體模型再發。」林楓説。

在被騰訊挖角之前,姚順雨只在 OpenAI 工作過一年,深度參與 Operator、Deep Research 等智能體項目。更早之前,他剛剛從普林斯頓博士畢業,研究方向是自然語言處理與強化學習。攻讀博士學位期間,他的主要科研成果有兩個,一個是 ToT(Tree of Thoughts,思維樹),這個計算框架讓 AI 在解決複雜問題時能夠將問題拆解為多步思維步驟並探索多條路徑,最終找到最優路徑。還有一個是 ReAct,這個算法讓大模型可以邊推理邊行動。ToT 和 ReAct 都可應用於模型的後訓練階段,提升模型的多步推理和動手操作能力。OpenAI 的 Operator、Deep Research 等智能體項目中都有 ToT 和 ReAct 的影子。

也就是説,騰訊把姚順雨從 OpenAI 挖過來時,他只有一年的工作經驗。但騰訊提供的可能是國內大模型人才戰中無論職位還是薪酬都最高的標準。2025 年 9 月,市場傳聞騰訊為了挖走他開出了上億元的薪水,騰訊隨後闢謠。這個數字不一定真實,但 1998 年出生的姚順雨一定是國內大廠中最年輕的大語言模型(LLM)「一號位」。

2025 年 12 月,騰訊宣佈混元組織架構調整,官宣姚順雨出任「CEO/總裁辦公室」首席 AI 科學家,向騰訊總裁劉熾平彙報,他同時兼任 AI Infra 部、大語言模型部負責人。一位接近騰訊的人士告訴「新皮層」,姚順雨平時在香港辦公室工作。另據一位騰訊內部人士稱,騰訊的 CEO/總裁辦公室在列的人員名單上只有姚順雨一個人。

這是 2023 年啓動大模型研發以來,騰訊第一次把大語言模型變成一把手工程。而且,這個模型負責人對下轄的團隊擁有直接而全面的管理權和人事權。「劉熾平是財務出身,並非技術背景。姚順雨直接向他彙報,獲得資源支持的效率就更高了。」騰訊 AI Lab 離職員工秦瑩瑩對「新皮層」説,在此之前,騰訊的自研模型混元有着很長的向上彙報鏈路,以及複雜的向下管理體系。

混元跟着跑

2025 年從年頭衝刺到年尾的一系列人事和組織變陣表明,騰訊在大模型領域開始着急。令這家大公司着急的直接原因就是,其自研模型混元的表現在大模型競爭中不夠靠前。

「很多公司發新模型時,會被拿來在 Benchmark 中對比的模型基本就是 GPT、Claude、Gemini、千問、Ki mi 和 DeepSeek,你不會看到豆包,也不會看到混元。」一位大模型業內人士對「新皮層」説,這種選擇基本代表了行業對誰在模型第一梯隊的認知。

馬化騰在 2023 年 5 月的股東大會稱,「對於工業革命(級的機遇)來講,早一個月(還是晚一個月)把電燈泡拿出來,在長的時間跨度上來看是不那麼重要的。」但大模型如今已經變成了一門「實驗科學」,「從基礎架構到注意力機制,從參數量到優化算法……每個環節都有多種方案,你需要做實驗才知道能不能行得通、在多大規模的參數量上行得通。」上述大模型業內人士説。這種實驗性意味着,晚起步雖然有成熟方案可以借鑑,但也會比其他選手缺少從實驗中積累的經驗,行動越慢差距越大、越難追趕。

騰訊是國內大廠中最晚推出自研大模型的公司。2022 年 11 月的最後一天,OpenAI 發佈 ChatGPT。4 個月後,2023 年 3 月,百度發佈了第一代大模型文心一言;同年 4 月,阿里巴巴發佈通義千問大模型;同年 8 月,字節跳動也發佈了首代大模型雲雀(注:後更名為豆包大模型)。

騰訊的起跑速度就慢於這 3 家公司。2023 年 2 月,騰訊才開始組建一個叫「混元助手」的團隊,從各事業羣集結人才,由時任騰訊 AI Lab 主任張正友擔任項目總負責人。

多位騰訊離職員工對「新皮層」稱,騰訊在大模型領域的緩慢起跑與公司內部節奏有相當大關係。在 ChatGPT 發佈的 2022 年,騰訊正在經歷多重低谷。

低谷之一是遊戲業務。2022 年,中國遊戲行業版號獲批通過的總量同比減少了 32%,是過往年份中數量最少的一年。另一位騰訊離職員工告訴「新皮層」,遊戲是騰訊最賺錢的業務之一,受版號鋭減影響,遊戲營收不確定性變高,公司當年就進行了「降本增效」,就連騰訊 TEG(技術工程事業羣)這樣的技術中台也要自負盈虧。後來主導混元模型研發的張正友所領導的 AI Lab 就隸屬於 TEG。「那時 AI Lab 並不鼓勵研究員發論文,員工若要參加學術會議,還要蹭高校的預算才能去開會。」他對「新皮層」説。

騰訊 AI Lab 離職員工秦瑩瑩稱,AI Lab 在 2016 年成立時主要任務還是做基礎研究。但 2018 年左右,AI Lab 就拆分成了兩個部分,只有少部分人繼續留做 AI 基礎研究,其他大部分成員都要開始服務於公司的遊戲與廣告業務。

而且,這位 AI Lab 離職員工稱,在遊戲業務陷入危機之前,騰訊在 2020 年左右面臨過一個更大的危機:QQ 的「孵化器魔法」失效了。

2020 年之前,騰訊的很多新業務、新產品——比如 QQ 音樂、騰訊視頻——都是通過 QQ 孵化成功的。那時 QQ 扮演了一個分發渠道和入口的角色——就像今天抖音在豆包的分發中所扮演的角色一樣。但在 2020 年左右,騰訊的很多新業務都難以複製過去的成功路徑,比如騰訊電商、對標今日頭條的天天快報,以及對標抖音和快手的騰訊微視,都沒有獲得預期的成功。2020 年,騰訊的另一大分發渠道——微信——的月活用户已經達到 12.25 億,成為移動互聯網時代的超級入口,但它至今沒有施展比肩當年 QQ 孵化新產品的魔法。

眾多新業務中,唯一一個被騰訊高層認為有潛力的是視頻號。上述騰訊離職員工稱,2022 年,騰訊創始人、董事長兼 CEO 馬化騰在內部員工大會上稱「微信事業羣最亮眼的業務是視頻號,基本上是全場的希望」。到了 2023 年,馬化騰又在股東大會上表示「AI 是類似工業革命一樣幾百年不遇的機會」,但整個 2023 年和 2024 年,這位騰訊離職員工稱,他都沒有聽到公司從整體戰略上多麼強調過大模型,不斷被強調的依然是視頻號。

根據上述騰訊 AI Lab 離職員工的説法,2023 年時騰訊內部不同事業部如果想要訓練模型,需要向公司總辦申請預算和立項,「當時訓練模型的成本還很高,一次試錯動輒幾百萬美元。就算訓練成功,模型的用途是什麼?那時候還沒人能説清楚。」這位騰訊 AI Lab 離職員工稱。

一號位難當

3 年的大模型軍備競賽已經讓業界發現,大模型不僅是門實驗科學,還開創了前所未有的開發範式:它無法通過工業時代那樣主要依靠自上而下的明確規劃分工,以及大量工程師之間的分工合作完成;與這種依賴各個技術骨幹的開發模式不同,大模型開發是一種系統工程,如果沒有一號位頭腦中對模型從預訓練數據到預訓練架構和算法、後訓練路徑以及基礎設施層面的整體實驗構想,一個模型無法從多個技術骨幹的暴力開發中產生。

上述騰訊 AI Lab 離職員工告訴「新皮層」,啓動大模型研發後的 3 年中,騰訊很長時間裏沒有為混元團隊匹配到一位合適的技術領導者。微信團隊也曾訓練過一個模型,後來放棄了。

上述騰訊 AI Lab 離職員工告訴「新皮層」,在姚順雨入職前,騰訊混元有過兩位總負責人:張正友與蔣傑。張正友的研究方向是計算機視覺,他發明的平板攝像機標定法在全球被普遍採用,被稱為「張氏方法」。但大模型中最核心的模型是 LLM,LLM 的核心是自然語言處理,而非圖像處理。

「張正友管理了近半年後,並沒有交出夠好的成果。蔣傑之後主動接手了混元項目,因為他認為大模型可以服務於廣告投放。」秦瑩瑩説。

蔣傑 2012 年加入騰訊,是騰訊企業發展事業羣(CDG)與技術工程事業羣(TEG)副總裁,負責騰訊廣告平台產品技術管理工作。

在蔣傑的總負責下,劉威和王迪都曾短暫地直接管理過混元一段時間,「劉威類似於統籌者,王迪類似於執行者」,秦瑩瑩告訴「新皮層」。不過,劉威和王迪的技術背景也都與自然語言處理關聯不深,其中劉威的核心工作方向是計算機視覺,他在 2024 年年底從騰訊離職後,創辦了一家叫 ReBirth 的公司,主要方向是視頻生成。王迪 2008 年通過校招加入騰訊,主導混元 LLM 模型前主要在 TEG 負責數據與搜廣推算法方面的工作。

2024 年 11 月,蔣傑也開始不再實際管理混元項目下的 LLM 部分了,只實際負責混元多模態模型。前述騰訊 AI Lab 離職員工稱,當時整個 LLM 團隊都在等待一位據説是「來自微軟的高階人才」,但這位微軟系一把手一直沒有被等到。直到 2025 年 9 月,姚順雨來了。

在姚順雨負責混元 LLM 模型並直接向騰訊總裁劉熾平彙報之前,混元的 LLM 負責人是個向上、向下都很難推動工作的夾心角色。秦瑩瑩告訴「新皮層」,在張正友與蔣傑帶隊期間,混元 LLM 模型曾有一個小組長,但他的職級並不高,距離觸達劉熾平至少存在大模型技術負責人王迪、混元大模型負責人蔣傑、TEG 總裁盧山三個層級。這種架構使他不可能像姚順雨那樣與劉熾平直接溝通、獲得資源支持。

對下管理方面,這位組長也需要橫跨 TEG 的多個部門,才能接觸到他的項目相關成員。2023 年成立的混元是一個虛擬團隊,其成員來自 AI Lab,甚至是 TEG 的多個部門。

秦瑩瑩對「新皮層」説,機器學習部、數據平台部等部門均隸屬於 TEG 舊的組織架構,而非混元團隊。抽調去參與混元項目的員工們還要額外服務於騰訊不同部門、不同業務的 AI 需求。「混元有小半年的時間比較混亂,職責與權限沒有梳理清楚。無論是張正友還是蔣傑,都沒能把團隊真正整合起來。」她説。

直到 2025 年 4 月,騰訊才從組織上配備了一個類似字節 Seed 那樣的獨立團隊,在 TEG 體系內成立大語言模型部與多模態模型部。12 月官宣姚順雨入職後,騰訊進一步調整組織架構,新成立了 AI Infra 部、AI Data 部與數據計算平台部,第一次從組織架構上匹配大模型時代的研發需求。

多位招聘方人士及騰訊員工對「新皮層」稱,騰訊 AI Lab 目前已被逐漸弱化,多位成員已經離職,AI Lab 副主任俞棟也將於 1 月底離開。許嵐告訴「新皮層」,AI Lab 現在的工作重點就是做探索性研究、對外發表論文。這意味着騰訊 2016 年成立的 AI Lab 實際上已經反過來成為混元的一個下屬部門,而不再是它的上層管理機構。

「新皮層」獲得的消息稱,隨着俞棟離職,AI Lab 的語音與自然語言處理研究方向也將被裁撤。剩下的兩個方向是胡瀚負責的多模態理解方向,以及一位來自字節 Seed 前成員負責的多模態理解和生成統一方向。

直到 2025 年年底,混元才變成一個更接近於字節 Seed 的架構,而類似的組織架構調整,字節在 2023 年下半年就動手了。這個遲來但大手筆的調整意味着,擺在姚順雨這位 27 歲大語言模型一號位面前的障礙,騰訊已基本為其掃清。

加速理論與甜蜜期

進入大模型軍備競賽的第三年,落後者趕上先發者的最優路徑已經非常清晰:要想快速交出符合市場預期的模型,最好直接效仿被證明有效的成熟做法,走別人走過的成功之路,而不是想着如何創新、彎道超車。

最能説明這一成功法則的例子就是 Google。2025 年之前,「起個大早趕個晚集」在國內形容的是百度,在硅谷形容的則是 Google——它發明了大模型的基礎架構 Transformer,但在自 ChatGPT 發佈以來的全球模型競賽中,Google 的 Gemini 始終被認為落後於 OpenAI 的 GPT 和 Anthropic 的 Claude。

上述大模型業內人士告訴「新皮層」,Gemini 2.0 發佈之前,Google 一直堅持 Encoder+Decoder(注:編碼器 + 解碼器,Google 在 2017 年發明 Transformer 架構時的原始形態)架構。2024 年 2 月發佈 Gemini 1.5 時,其模型論文中還在強調該架構為什麼更優,但到了 2024 年年底發佈 Gemini 2.0 時,Google 不再宣傳 Encoder+Decoder 的架構如何富有潛力,而是開始和 OpenAI 一樣採取 Decoder only(注:純解碼器)架構。

不再偏執地堅持自研架構後,Google 很快就帶着 2025 年 3 月發佈的 Gemini 2.5 重回業界視野,11 月發佈的 Gemini 3.0 直接讓 OpenAI 拉響「紅色警報」,以應對 Gemini 帶來的流量壓力。根據 SimilarWeb 統計的 11 月數據,用户在 Gemini 上的平均停留時間已超越了 ChatGPT。

這位業內人士告訴「新皮層」,DeepSeek 2024 年 12 月和 2025 年 2 月先後發佈並開源的 V3 和 R1 模型,也分別扮演了 GPT 的 Decoder only 架構曾經扮演的角色——告訴大家一個類 GPT-4 和 OpenAI o1 效果的模型可能是怎樣的架構。其中,V3 模型為業界提供了一個可以訓練出等效於 GPT-4 模型的「配方」——表明要得到類似的模型效果,模型需要是一個 MoE(混合專家模型)架構,而不能是稠密模型;時隔一個多月後發佈的 R1 模型又提供了類 OpenAI o1 的推理模型「配方」——表明強化學習可以直接通過對有推理步驟的語料的模仿學習實現。

「此前,大家其實不知道 GPT-4 是怎麼訓練出來的,也不知道 o1 是怎麼訓練出來的。」這位業內人士説,整個 2024 年,國內大模型公司的主要目標就是「趕上 GPT-4」,但不知道如何趕上,OpenAI 從 GPT 3.5 開始就不再在論文中公開其模型核心架構和算法、甚至不發表技術報告了。

DeepSeek V3 和 R1 模型的發佈和開源加速了全球類 GPT-4 和 OpenAI o1 模型的推出。聘任一個在 OpenAI 直接參與過模型後訓練、並接觸過其預訓練的研究者擔任 LLM 模型負責人,對騰訊混元來説是也是一種加速。

姚順雨加入騰訊兩個月後,2025 年 12 月初,騰訊發佈混元 2.0 模型,總參數為 4060 億。其英文名更新為 HY2.0,被視為重視全球市場的舉措。有人猜測該模型就是姚順雨入職後的成果。但按照業內訓練一代模型的週期來看,混元 2.0 不太會是姚順雨從零開始訓練的模型。

「模型參數量與模型能力之間是必要不充分關係,參數量大,模型性能不一定強,但參數量小,模型潛力一定有限。」上述業內人士説,姚順雨大概率會訓練出一個參數量更大的模型,估計需要大半年時間——在有「配方」、有更多資源的條件下,時間可能會更短。這意味着,姚順雨和騰訊的甜蜜期差不多就是半年,這位 27 歲的年輕管理者需要交出一些實際成果,才能在騰訊這個有着 11 萬人的大廠坐穩大模型一號位。

2025 年 4 月,姚順雨在其個人博客中寫下《The Second Half》(下半場)一文,「宣佈」大模型已經具備足夠的推理能力,大模型競爭已經完成上半場的預訓練戰鬥,進入以後訓練和 Agent 開發為主題的下半場。但在騰訊,他得重新鏖戰上半場。

一位接近騰訊混元的人士對「新皮層」稱,混元下一個版本將是一個 Agent 模型,主要由姚順雨主導訓練。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。