
AI "Battle of the Gods": In the face of "Stargate," Zuckerberg aims to build "Prometheus"

Meta 為突破算力瓶頸,啓動兩大巨型 AI 集羣:普羅米修斯(Prometheus)與亥伯龍(Hyperion)。前者規模高達 1 GW,採取了 “全方位” 策略,整合了自建園區、第三方租賃以及現場天然氣發電等多種方式。後者的一期功率就將超過 1.5 GW,預計 2027 年底成全球最大單一 AI 數據中心園區。
Meta 正在發起一場史無前例的戰略轉型,以扭轉其在基礎模型競賽中的落後局面。
7 月 15 日據華爾街見聞,Meta 首席執行官扎克伯格週一表示,將投資數千億美元建設幾座大型數據中心,其中首個數據中心普羅米修斯(Prometheus)預計將於明年投入使用。
據報道,Meta 正在效仿 xAI,採用更靈活、建設速度更快的 “帳篷式” 數據中心設計,並同時在俄亥俄州和路易斯安那州秘密建設兩個 “吉瓦級”(GW)的超級計算集羣,項目內部代號分別為普羅米修斯(Prometheus)和亥伯龍(Hyperion)。
在創始人扎克伯格的親自推動下,這家年現金流高達千億美元的廣告巨頭正不計成本地重金投入算力基礎設施和頂尖人才,旨在追趕並超越 OpenAI 等競爭對手,其核心目標直指 “超級智能”。
算力為王:從 “帳篷” 到 “吉瓦級” 集羣
為了快速獲得海量算力,Meta 已將過去十年的數據中心建設藍圖束之高閣。
據報道,扎克伯格決定再次革新戰略,擁抱一種將建設速度置於首位的全新設計。這種受 xAI 啓發的 “帳篷式” 結構,採用預製電力和冷卻模塊以及超輕型結構,犧牲了部分冗餘(例如備用柴油發電機),以求儘快讓 GPU 集羣上線運行。
為實現這一目標,Meta 正在推進兩項龐大的基礎設施項目:
- 普羅米修斯(Prometheus)集羣:位於俄亥俄州,一個規模高達 1 吉瓦的 AI 訓練集羣。Meta 採取了 “全方位” 策略,整合了自建園區、第三方租賃以及現場天然氣發電等多種方式。據報道,該項目旨在通過超高帶寬網絡連接所有站點,形成統一的後端網絡。為了解決當地電網的供電瓶頸,Meta 甚至效仿馬斯克,正在建設兩座 200 兆瓦的現場天然氣發電廠。
- 亥伯龍(Hyperion)集羣:位於路易斯安那州,規模更為宏大,旨在全面超越 OpenAI 備受矚目的星際之門項目。據報道,Hyperion 的一期工程的 IT 功率就將超過 1.5 吉瓦,預計到 2027 年底成為全球最大的單一 AI 數據中心園區。
這些舉措的目標非常明確:讓 Meta 在人均算力資源上從 “GPU 貧乏” 轉變為 “GPU 極其富有”,使其訓練算力規模能與 OpenAI 等頭部實驗室相匹敵。
Llama 4 之殤:覆盤技術與戰略根源
Meta 的激進轉型,源於其 Llama 4 Behemoth 大模型的失敗。在 Llama 3 一度引領開源模型浪潮後,這次失敗使 Meta 的聲譽受損。
據報道,失敗的技術根源主要包括以下幾點:
- 架構選擇失誤:模型採用了 “分塊注意力”(Chunked Attention)機制以追求長文本處理效率,但這在塊與塊的邊界造成了 “盲點”,損害了模型的長程推理能力。此外,模型最初採用的 “專家選擇路由”(Expert Choice Routing)雖然提升了訓練效率,但在推理階段表現不佳,中途切換回 “Token 選擇路由”(Token Choice Routing)又導致專家分工混亂。
- 數據質量瓶頸:在訓練中途,團隊從使用公共數據集轉向其新建的內部網絡爬蟲,但在數據清洗和去重方面準備不足。更重要的是,與其他頂尖 AI 實驗室不同,Meta 沒有利用 YouTube 的海量視頻與文本數據,這可能限制了其多模態能力的開發。
- 擴展與評估短板:報道指出,Llama 4 團隊在將研究實驗擴展到大規模訓練上遇到了困難,缺乏有力的領導來統一技術路線。同時,Meta 在強化學習和內部評估基礎設施方面也相對落後,未能及早發現架構選擇中存在的問題。
報道認為儘管 Llama 4 本身失敗了,但 Meta 仍通過模型蒸餾技術,將其知識遷移到更小的 Maverick 和 Scout 模型中。
彌合差距:豪擲千金與戰略收購
在重整算力基礎設施的同時,扎克伯格將戰略重心轉向了另一個關鍵要素:人才。他深知 Meta 與頂尖 AI 實驗室之間的人才差距,因此親自負責為一個全新的 “超級智能” 團隊招募成員。
據報道,Meta 為頂尖研究員開出的薪酬方案通常高達 4 年 2 億美元,部分關鍵崗位甚至收到了被拒絕的 10 億美元級別報價。
這一策略不僅是為了吸引人才,也是為了抬高競爭對手的用人成本。近期加盟的知名人士包括前 GitHub CEO Nat Friedman,以及與 Ilya Sutskever 共同創立 SSI 的 Daniel Gross。
在人才策略之外,戰略收購成為另一大支柱。對 Scale AI 的投資被視為關鍵一步,遠非 “退而求其次”。
據分析,此舉直接針對 Llama 4 暴露出的數據和評估短板。
Scale AI 的創始人 Alex Wang 及其專精於模型評估的 SEAL 實驗室將為 Meta 帶來急需的能力,尤其是其開發的推理模型評估基準 HLE(Humanity’s Last Exam),將有力彌補 Meta 的不足。
