
Llama 4 is finally coming this month

Meta 計劃在本月晚些時候發佈備受期待的 AI 模型 Llama4,儘管發佈可能再次推遲。推遲原因包括技術性能未達預期,尤其在推理和數學任務方面。為提升競爭力,Meta 將採用 “混合專家”(MoE)架構,並積極籌劃新策略,將 Llama 推向企業市場,可能提供自營 API。
去年春天,Meta 發佈的 Llama3 大語言模型曾贏得開發者和獨立評測者的一致好評。然而時隔近一年,備受期待的繼任者 Llama4 卻遲遲未能發佈。
據知情人士透露,在至少兩次推遲後,Meta 計劃在本月晚些時候發佈這一備受期待的 AI 模型——但這並非板上釘釘,仍有可能再度延期。
發佈延遲背後:技術性能未達預期
據兩位瞭解情況的人士稱,發佈推遲的關鍵原因之一,是該模型在開發過程中的技術基準測試表現未能完全達到 Meta 的內部預期,尤其在推理和數學任務方面存在短板。
此外,Meta 內部也對其模型在模擬人類語音對話方面無法與 OpenAI 的頂尖水平相媲美。
技術轉向與商業化新探索:擁抱 MoE 與 LlamaX 計劃
為了提升 Llama4 的競爭力,Meta 計劃在技術路線上做出重要調整。
媒體援引兩位知情人士消息稱,至少有一個版本的 Llama4 預計將採用 “混合專家”(MixtureofExperts,MoE)架構,而非 Llama 系列此前一直堅持的 “密集”(Dense)模型。
MoE 方法通過將模型劃分為多個專注於特定任務的 “專家” 子網絡,在處理用户請求時僅激活相關部分,從而有望在提升性能的同時提高運行效率。DeepSeek 及其他多家領先的模型開發者均已採用此技術路線。
值得注意的是,Meta 內部圍繞是否從 Dense 轉向 MoE 的決策,曾經歷了一場長達一年多的激烈技術辯論。最終選擇擁抱 MoE,無疑也受到了 DeepSeek 等競爭對手成功實踐的部分影響。
在商業化層面,Meta 正在積極籌劃新策略,以期更有效地將 Llama 推向企業市場。
媒體援引三位知情人士消息稱,公司內部正在深入討論 Meta 提供自營 API 的模式。不過,目前還不清楚該 API 將依託 Meta 自有數據中心還是租用雲服務商服務器運行。
通過提供自營 API,Meta 或能效仿 OpenAI 的模式,向客户提供諸如模型早期訪問權限、定製化技術支持等增值服務。
這些討論是 Meta 內部代號為"Llama X"項目的一部分,該項目源自首席戰略官 David Wehner 的團隊。通過 Llama X,Meta 還希望招聘工程師、營銷人員和銷售人員來擴大 Llama 的企業應用範圍。
組織重組與產品困境
為了加快發展步伐,Meta 今年 2 月對其生成式 AI 團隊的技術領導層進行了調整。該團隊任命了當時的 Messenger 負責人 Loredana Crisan 領導 AI 產品的產品管理,並更換了工程負責人 Ryan Cairns 和 Ning Li。隨後,Meta 又任命前混合現實技術副總裁 Amir Frenkel 為該團隊的工程負責人。
AI 部門負責人 Ahmad Al-Dahle 在內部表示,這些變化將使團隊"更快、更有效地行動"並幫助"作為一個團隊工作"。值得注意的是,Meta 的生成式 AI 團隊在過去一年半從約 500 人急劇擴張到超過 1700 人,即使 CEO 扎克伯格近年來一直在壓縮公司成本和人員。
然而,產品方面的進展並不順利。Meta 已致力於將其智能眼鏡應用 Meta View 轉變為 Meta AI 的獨立應用,希望通過這樣的應用更好地展示 Meta AI 的能力。但近幾周,該應用在處理分析性、複雜任務方面表現不佳,特別是在審閲大量文檔和撰寫微妙文本方面存在困難。
Meta 還考慮改變以往的做法,先通過 Meta AI 發佈 Llama 4,然後再作為開源軟件發佈,這與過去同時發佈的策略形成對比。這樣的變化可能會提升 Meta AI 的使用數據,但也可能疏遠那些讚賞公司開源方式的研究人員和開發者。不過,尚不清楚 Meta 是否會推進這一計劃。
高額投入、不確定回報
對 Meta 來説,AI 領域的投入巨大。公司正在為開發和運行其模型建設數據中心,今年資本支出計劃高達 650 億美元。更驚人的是,Meta 還在討論一個可能耗資 2000 億美元的數據中心項目。
迄今為止,Meta 在 AI 方面的成果喜憂參半。消費者 AI 方面,Meta AI 助手截至今年 1 月擁有超過 7 億月活用户,但其中部分使用被認為是非主動的,公司也尚未推出早在去年春季就有討論的付費版本。同時,Meta 去年還裁撤了一組模仿名人和網紅的聊天機器人。在雲計算服務商向客户銷售 Llama 方面,該模型未能獲得顯著吸引力。
儘管面臨這些挑戰,據一位接近公司的人士透露,Meta 依然相信 Llama 4 將成為行業領先模型。
儘管挑戰重重,一位接近 Meta 的人士透露,公司內部依然堅信 Llama4 將會是一款行業領先的模型。