Ultraman reveals the first phase of the "Stargate" factory, with 20 supercomputers being built across the U.S.! 700,000 GPUs make Jensen Huang a profit of 37.5 billion

華爾街見聞
2025.01.24 05:15
portai
I'm PortAI, I can summarize articles.

奧特曼展示了「星際之門」首期工廠,計劃在全美建設 20 座超算中心,耗資 5000 億美元。德州阿比林已獲批 875 英畝地,計劃打造 10 個數據中心。此項目引發科技圈熱議,尤其是 5000 億美元的投資金額。儘管馬斯克質疑融資情況,SemiAnalysis 確認「星際之門」第一階段已啓動,但軟銀資金不足以支持如此規模的算力集羣。

一大早,奧特曼直播剛下線,就炫出了「星際之門」首期工廠。

而我們以上看到的,還僅僅是「星際之門」的 1 號基地。

據稱,德州阿比林(Abilene)已經獲批 875 英畝地(約 354 萬㎡),面積堪比紐約中央公園,計劃打造 10 個數據中心。未來,4 年耗資共 5000 億美金,在全美建設共 20 座超算中心。

奧特曼最新的帖子,是對馬斯克昨日嘲諷做出的有力回覆。

奧特曼與馬斯克正面開懟,手撕對方

難道馬斯克所説的一切,真的只是噱頭嗎?

「星際之門」自週二官宣以來,備受各界關注,尤其是 5000 美金投資直接引爆了全科技圈的熱議。據稱,這一金額相當於達到了「曼哈頓計劃 + 阿波羅計劃」總額。

這一令人瞠目結舌的數字,不得不引發各界的猜想。

正如馬斯克昨日 battle 的所言,軟硬實際上獲得的融資遠不到 100 億美金。

那麼,真實情況到底是怎樣的?

SemiAnalysis 獨家透露,事實上,「星際之門」的第一階段已經確定,並在德克薩斯州阿比林數據中心基地展開。

不過,他們確認了馬斯克的話——軟銀的確沒有足夠資金來建設如此規模的算力集羣。

下文中,他們將詳細剖析「星際之門」的實際情況、微軟當前面臨的危機、項目架構和成本,以及這個算力集羣的真實情況。

千億美元集羣已鎖定

除了奧特曼放出的實景,SemiAnalysis 也製作了一張德州集羣建設的宏觀圖。

確定的第一階段,也僅僅是已承諾的 1000 億美元投資中的一部分。至少可以説,這個數字最終數字(5000 億美元)的計算方式着實令人玩味。

4 個月前,著名分析師便在「Multi-Datacenter Training」報告中,已經公開討論了位於德州阿比林數據中心基地第一階段規劃。

「星際之門」背後真實數據

他們認為,這個項目是按總擁有成本(TCO, Total Cost of Ownership),而非資本支出來計量的。

換言之,1000 億美元和 5000 億美元指的是 TCO,其中包括數據中心、服務器、網絡設施、電力供應的資本支出,以及債務融資在內的諸多運營成本。

此外,目前只有首期 1000 億美元項目,已經確定了數據中心選址和電力供應。「星際之門」項目整體資金仍未完全到位。

還有一個容易產生誤解的細節是,這個大型項目的第一個算力集羣,其實就是去年宣佈的 Oracle 和 OpenAI 合作項目。

該項目完全由 Lancium、Crusoe 和 Oracle 負責建設。據分析師瞭解,軟銀和 MGX 等其他方並未參與其中。

全美 20 座超算,10 個已開工

實際上,OpenAI 週二官宣博文中,已經明確了「星際之門」是一家新成立的合資企業公司。

在這個項目中,他們計劃在未來 4 年內斥資 5000 億美元,用於 AI 基礎設施建設,其中 1000 億美元將立即投入使用。

這是第二屆特朗普政府宣佈的首個重大 AI 計劃,由於監管政策顯著放寬,未來可能會推出更多類似計劃。

星際之門計劃的股權創始方包括軟銀、甲骨文、MGX 和 OpenAI,其中前三家公司負責前期注資。

軟銀和 OpenAI 是核心合作伙伴,軟銀負責財務管理,而 OpenAI 主導運營工作,包括幾乎所有的算力集羣管理軟件。

如前所述,該項目計劃共建設 20 個數據中心,其中 10 個已在德克薩斯州阿比林開工,每個佔地面積約 46,500 平方米(50 萬平方英尺)。

首期 1000 億美元支出明細

最初的 Oracle/Crusoe 項目作為其中一個數據中心,將與其他超級園區互聯,實現規模比現有任何訓練運行,都大數個量級的分佈式訓練。

此前,奧特曼提到的「已經在建設中」的星際之門計劃園區,即為 Oracle/Crusoe 阿比林園區。

該園區將容納供 OpenAI 使用的 10 萬台 GB200 算力集羣。這個開發項目以及計劃在第二季度和第三季度交付的 GB200 服務器,將部署在 Oracle/Crusoe 的數據中心內。

下面是 2024 年 12 月 29 日,拍攝的園區高清照片。

4 個約 11,150 平方米的「模塊」組成了一棟 44,600 平方米的建築,目前僅有兩棟建築在建,關鍵 IT 負載容量約為 180 兆瓦。

為了讓大家理解這一規模,整個由 20 棟建築組成的園區將包含 80 個這樣的「模塊」!

根據「加速器模型和數據中心模型」中,分析師為 OpenAI/微軟/甲骨文規劃的建設計劃,OpenAI 無需建設新園區就能部署全部 1000 億美元的總擁有成本(TCO)。

因此,他們認為「星際之門」計劃合資企業的首期 1000 億美元將全部投入這個園區。

在 Lancium 的官網中,這個園區被稱為「Abilene Clean Campus」,並聲稱將在 2025 年實現 1GW 供電能力。

然而,通過多個行業消息源和文件,該園區已額外獲得 1GW 容量,總供電能力達到 2.2GW。

據此可以估算,該園區的關鍵 IT 負載容量為 1.8GW,能源使用效率(PUE)約為 1.25。

雖然他們可能通過優化使 PUE 接近 2GW IT 容量,但考慮到 GB300 特別是 VR200 的功率密度提升,這個目標將很難實現。

70 萬塊 GPU,老黃首期爆賺 375 億刀

除了正在部署的 10 萬台 GB200 算力集羣外,分析師估計,他們還將在整個園區部署另外 20 萬台 GB300 和約 40 萬台 VR200(英偉達計劃在 2026 年推出的超算,分別對應 Vera CPU 和 Rubin GPU)。

他們根據園區 1,000 億美元總擁有成本(TCO)投資,以及人工智能 TCO 模型中的單位成本,計算出了 Vera Rubin 處理器的隱含數量。

約 70 萬台 GPU 的總 IT 功率為 1.8GW,這與 Oracle/Crusoe 阿比林園區 1,800 兆瓦的容量相符。

簡而言之,OpenAI 預計為首個 GB200 集羣支付的成本,約為每 GPU 每小時 2.8 美元,全規模集羣的 TCO 為每小時 2.38 美元。

這些數字會隨着未來英偉達 GPU 的部署而相應調整。

OpenAI 的支出將超過 1,000 億美元,但這並非前期資本投入。

分析師還估計英偉達從中獲得的收入和 IT 設備資本支出相對較為適中,分別約為 375 億美元和 490 億美元。這將佔用整個 1.8GW Crusoe Lancium 站點的容量。

隨着向 GB300 和 VR200 演進,每一代 GPU 的數量都將翻倍,單個 GPU 的功率需求也在增長。

雖然 70 萬塊 GPU 對於 1,000 億美元的投資而言規模似乎不大,但需要注意的是,這相當於數百萬台 Hopper(英偉達高性能計算架構)GPU 的算力。

刷存在感的軟銀

甲骨文和軟銀是知名的股權提供方。

MGX 是一個新近成立的阿布扎比科技投資平台,由 Mubadala 和 G42 共同創立。該基金由 Sheikh Tahnoon bin Zayed al-Nahyan 擔任主席,據報道他監管着超過 1.5 萬億美元的投資基金。

鑑於馬斯克聲稱軟銀籌資不到 100 億美元,需要特別指出的是,該合資企業還將通過項目融資籌集「債務資本」。

目前「股權融資」和「債務融資」的具體比例尚未確定,但甲骨文和 MGX 憑藉其雄厚的資產負債表,可以為項目提供大量資金支持。

也就是説,即便軟銀沒錢,還有甲骨文和 MGX。

據悉,OpenAI 和軟銀各自在賬面上,承諾投入 190 億美元。軟銀目前雖然沒有這麼多流動資金,但預計其可能會通過出售部分 ARM 股份來籌集所需的股權投資。

OpenAI 同樣缺乏這筆資金,但他們可以在新產品 o3 發佈後進行融資,而且不必直接全額籌集,可以通過向聯合體其他成員發行「混合資本工具」來實現。

需要承認的是,馬斯克的判斷是正確的,他們目前確實還沒有籌集到這筆資金。

關鍵問題在於項目融資風險能否與母機構分離。這種風險隔離十分重要,因為 OpenAI 需要籌集資金來支付相關費用。

對 OpenAI 而言,一個有利因素是這筆資金不需要立即到位。

OpenAI 現有資金足以支付今年 10 萬台 GB200 集羣的租金,但他們需要確保能夠支付 2026 年及以後大幅上漲的租金。

雖然 OpenAI 可能無法直接籌集到所需資金,但高級分析師相信,他們的技術和產品發展將能夠支撐這一規模的支出。

誰是最大贏家?

我們看到,在「星際之門」合資項目的公告中,出現了許多科技巨頭的名字,比如英偉達、Arm、微軟、甲骨文以及前面提到的投資方。

這些都是令人印象深刻的知名企業,但現實情況是,既有輸家,又有贏家。

若説誰是最大的輸家,恐怕就是微軟了。

微軟,最大 loser

當 OpenAI 選擇了另一個基礎設施合作伙伴時,微軟實際上被擠到了邊緣位置。

同時,納德拉的態度已經非常明確:僅僅守住 800 億美金投資!

週二,微軟博客陳述了合作關係的事實,以及微軟擁有優先購買權。

但現實是,這對微軟的長期發展將產生逐步顯現的負面影響,因為他們不願承擔這項投資的風險。

此外,更令人咋舌的是,負責 OpenAI 合作關係的 Chris Young 也在公告發布之後突然離職。

持樂觀態度的分析師會説,微軟正將其 AI 計劃的部分資本密集型業務轉移給甲骨文,但 SemiAnalysis 認為這種短期收益無法抵消失去 OpenAI 收入和控制權帶來的長期潛在損害。

雖然馬斯克和納德拉提出了同樣的疑問——「實際的收益在哪裏」,但馬斯克已制定計劃,要讓他們的田納西州孟菲斯基地以不低於 OpenAI 的速度發展;

而納德拉則沒有在內部建設前沿 AI 模型的計劃。

Arm:技術合作夥伴,還是虛假新聞

Arm 股價因被列為技術合作夥伴而上漲約 16%,但這僅僅是因為其 Grace 和 Vera CPU 與英偉達的 Blackwell 和 Rubin GPU 配套使用。

軟銀可能力推讓 Arm 加入公關陣營,表面上確實效果不錯。但實際上 Arm 並未發揮實質性作用。

對 Arm 股東而言,現實情況如上所述,軟銀可能不得不出售其在公司的部分股份,以為「星際之門」股權投資提供部分資金。

我們認為投資者大多忽視了這一點,錯誤地將這個公告視為實質性的利好消息。

甲骨文承擔了管理數據中心和供應鏈物流的重任;管理 1.8GW 集羣並按照另一家公司的要求採購所有必要設備是一項極具挑戰性的任務。

英偉達顯然深度參與其中,因為主要依賴的是他們的硬件。

而 OpenAI 將保持運營控制權,並運行幾乎所有自己的集羣管理軟件。

全部用於一次訓練

這個項目的規模令人印象深刻,但正如分析師最近在 Fabricated Knowledge 中所分析的那樣,這似乎是 AI 發展熱潮中的又一個重要里程碑。

我們知道,首批 1,000 億美元將投資於阿比林基地,而剩餘的 4,000 億美元將用於開發更多數據中心基地。

更值得注意的是,所有這些數據中心基地都將持續建設,旨在實現 AI 分佈式訓練的目標。

值得注意的是,僅僅複製 4 個相當於阿比林規模的基地,就能產生 9GW 的核心 IT 算力,而這些算力將全部用於一次 AI 訓練。

在 SemiAnalysis 分析中的,隨着數據中心互聯(DCI)建設的持續推進,Marvell 和 Ciena 將成為最大贏家,Fabrinet 將獲得可觀收益,而 Coherent 和 Lumentum 則會獲得相對較小的收益。

新智元,原文標題:《奧特曼曬「星際之門」首期工廠,全美狂建 20 座超算!70 萬塊 GPU 老黃爆賺 375 億》

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。