算力 “階級森嚴”？大廠優先內供、小廠無米下鍋，硅谷掀起新一輪 GPU“斷供潮”

微軟、亞馬遜等雲巨頭優先英偉達 GPU 分配給內部及頭部客户，導致 AI 初創企業陷入算力短缺與成本飆升困境。價格上漲、等待延長與嚴格准入並存，部分公司被迫轉向自建算力。資源向頭部集中雖提振雲廠利潤，卻加劇創業生態分化，算力正成為 AI 競爭的核心門檻。

微軟、亞馬遜等雲巨頭正將英偉達 GPU 優先分配給內部團隊及頭部客户，中小 AI 初創企業陷入"一芯難求"困境，算力資源的爭奪正在硅谷掀起新一輪結構性危機。

據 The Information 報道，此輪供應緊缺已波及多家獲得紅杉資本、Founders Fund、General Catalyst 及 Andreessen Horowitz 等頂級機構支持的 AI 初創公司。General Catalyst 管理合夥人 Hemant Taneja 已向其投資組合創始人發出調查問卷，詢問算力獲取情況，並在問卷中直言：

"我們聽到很多人反映，算力——尤其是 GPU 訪問——是今年面臨的最大瓶頸之一。"

供應收緊直接推高了租用價格，雲服務商的利潤率因此獲得提振，但初創企業的運營成本隨之大幅攀升。與此同時，微軟 Azure 已向內部員工明確表示，客户應預期漫長的等待時間至少將持續至 2026 年底，算力格局的重塑正在深刻影響整個 AI 創業生態。

歷史重演，但烈度更甚

此輪 GPU 短缺與 2023 年初的情形頗為相似——彼時雲服務商同樣從雲服務中抽調算力，優先支持內部團隊及 OpenAI 等核心客户，Andreessen Horowitz 和 Index Ventures 等風險機構最終不得不自行組建 GPU 資源池，以緩解投資組合公司的燃眉之急。

然而，當前局面的嚴峻程度有過之而無不及。The Information 指出，AI 編程工具的爆發式需求正在加劇這一短缺，Anthropic 等大型 AI 開發商對算力的需求激增，進一步擠壓了留給中小客户的空間。

另一個加劇短缺的結構性因素在於：大量 AI 初創企業此前簽訂的兩至三年雲服務合同正陸續到期，雲服務商借此機會向客户開出更高價格，或直接將算力重新分配給出價更高的買家。

微軟"用進廢退"，分級制度明確排序

微軟的算力分配機制已形成清晰的等級體系。據一名掌握內情的微軟員工透露，Azure 將客户劃分為三個層級：

Tier 1 為約 1000 家雲支出最高的大客户，享有優先訪問權；

Tier 2 為支出規模次之、但仍配有專屬銷售代表的客户；

Tier 3 則是規模較小的企業，其關係由 CDW 等微軟經銷商合作伙伴代為管理。

在芯片准入門檻上，微軟近幾個月開始要求希望獲得英偉達 Blackwell 芯片的客户，至少承諾租用 1000 塊芯片、期限不低於一年，合同金額至少達數千萬美元。即便是租用舊一代英偉達芯片，客户也需等待數週乃至數月。

更值得關注的是微軟的"用進廢退"政策：對於按需付費獲得 GPU 訪問權限的客户，微軟會追蹤其使用率，一旦服務器閒置哪怕數小時，便可能撤銷其訪問權限。通過"微軟初創企業計劃"獲得免費算力積分的初創公司同樣面臨這一規則——若未能充分利用芯片，將被取消 GPU 訪問資格。

初創企業：漲價、被"鴿"、搶不過大客户

圖像生成 AI 初創公司 Krea 的遭遇頗具代表性。這家成立四年、已從 Andreessen Horowitz 和 Bain Capital Ventures 等機構融資 8300 萬美元的公司，六個月前以每小時每塊芯片 2.80 美元的價格簽下了數百塊英偉達 Blackwell 芯片的六個月合同。

然而當 Krea 近期尋求更多服務器以從頭訓練新模型時，局面急轉直下。聯合創始人兼 CEO Victor Perez 表示，部分雲服務商的銷售代表直接不接電話；等到對方回電，不僅告知價格大幅上漲，還要求籤訂三年期合同才願意洽談。"有些直接消失，有些説沒有貨，還有些試圖讓我們接受極其苛刻的條款，"Perez 説。

最終，Krea 以每小時 3.70 美元的價格簽下一年期合同，較上次合同價格上漲 32%。與此同時，另一位尋求租用近 1000 塊 GPU 緊密集羣的初創企業創始人表示，英偉達銷售人員上週告知他，在大型雲服務商處找到此類集羣極為困難——該集羣每日租金將超過 7 萬美元。

GPU 雲服務商 Lightning AI 的數據則從供需角度印證了這一緊張態勢：該公司目前在線 GPU 約 4 萬塊，但來自約 40 家客户的待處理訂單合計需求約 40 萬塊。CEO Will Falcon 表示，過去六個月價格已上漲逾 25%，從每小時約 1.60 美元漲至逾 2 美元，部分情況下還要更高。

部分創始人選擇"脱雲自建"

面對漫長等待和不斷攀升的租用成本，部分初創企業創始人開始考慮繞開雲服務商，自行購買 GPU。

AI 代理初創公司 Collide 的創始人 Collin McLelland 表示，該公司正考慮花費約 50 萬美元直接購買英偉達 GPU 自行運營。Collide 去年完成 1400 萬美元種子輪融資，專注於為油氣行業開發 AI 代理產品。McLelland 計劃直接向數據中心或雲服務商租用機房空間託管自購 GPU，以規避租用模式下的等待時間和不確定性。

"對我們來説，在需要算力時卻沒有算力，是最大的風險，"McLelland 説，"大多數人只是害怕硬件。我擁有過油井，所以對此已經麻木了。"

儘管短期內自購 GPU 的成本遠高於租用，但他認為從多年維度來看，綜合成本反而更低，且能徹底擺脱對雲服務商的依賴。

雲廠商利潤受益，但生態隱憂浮現

對雲服務商而言，此輪供應緊缺帶來了久違的利潤改善。此前部分雲廠商在 GPU 業務上盈利承壓，而當前的供需失衡使其得以提高租用價格，邊際利潤率隨之回升。

然而，這一格局對 AI 創業生態的長期影響不容忽視。算力資源向頭部客户高度集中，意味着中小初創企業在模型訓練和產品迭代上將面臨更高門檻和更大不確定性。General Catalyst 正在研究通過建立共享算力池或代表初創企業直接談判等方式，幫助投資組合公司獲取 GPU 資源——這與 2023 年風險機構自建 GPU 池的應對思路如出一轍，折射出算力獲取已成為 AI 投資生態中不可迴避的結構性挑戰。