Is Meta in Panic? Internal Leaks: Analyzing the Crazy Copy of DeepSeek, High Budget Difficult to Explain

華爾街見聞
2025.01.24 03:15
portai
I'm PortAI, I can summarize articles.

Meta 公司因 DeepSeek 的快速發展而感到恐慌,內部員工在匿名社區透露,DeepSeek 的低成本高效能讓 Meta 的生成式 AI 團隊面臨預算合理性的問題。DeepSeek-V3 在基準測試中超越了 Meta 的 Llama 4,管理層擔心如何證明龐大組織的成本合理性,尤其是當領導的薪資高於 DeepSeek 的訓練成本時。

「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」

DeepSeek 開源大模型的陽謀,切切實實震撼着美國 AI 公司。

最先陷入恐慌的,似乎是同樣推崇開源的 Meta。

最近,有 Meta 員工在美國匿名職場社區 teamblind 上面發佈了一個帖子。帖子提到,國內 AI 創業公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。

原文如下:

這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟糕的是那個「擁有 550 萬訓練預算的不知名中國公司」。

工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。

管理層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高,而我們有好幾十個這樣的「領導」時,他們要如何面對高層?

DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。

這本應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人為地膨脹了組織的招聘規模,結果每個人都成了輸家。

原貼鏈接:https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,並在性能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

不過,更引人關注的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來説,它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours,再加上上下文擴展與後訓練的訓練,總共也只有 278.8 H800 GPU Hours。相較之下,Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。

而最近發佈的 DeepSeek-R1 性能更猛 —— 在數學、代碼、自然語言推理等任務上,它的性能比肩 OpenAI o1 正式版。而且模型在發佈的同時,權重同步開源。很多人驚呼,原來 DeepSeek 才是真正的 OpenAI。UC Berkeley 教授 Alex Dimakis 則認為, DeepSeek 現在已經處於領先位置,美國公司可能需要迎頭趕上了。

看到這裏,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事,他們「開源之光」的地位岌岌可危。

有人指出,其實該慌的不止 Meta,OpenAI、谷歌、Anthropic 又何嘗沒有受到挑戰。「這是一件好事,我們可以實時看到公開競爭對創新的影響。」

還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那 AI 公司是否真的需要那麼多顯卡?」

不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆説,這可以從他們的發佈的技術報告中找到答案。

目前,我們還無法確定帖子的真實性。

不知道 Meta 後續將如何回應,即將到來的 Llama 4 又會達到怎樣的性能。

文章來源:機器之心,原文標題:《Meta 陷入恐慌?內部爆料:在瘋狂分析複製 DeepSeek,高預算難以解釋》

風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。