
Computing Power Crisis! SemiAnalysis In-depth Analysis: From GPUs to Memory to Fiber Optics, the AI Supply Chain is Strained Across the Board with Prices Rising in Tandem
SemiAnalysis 指出,需求爆发推动算力告急,内存、GPU 到 AI 服务器价格飙升且有价无市,H100 GPU 年租价五个月内飙升 40%。该机构认为,GPU 租赁价格短期内大概率继续上涨。Neocloud 开始掌握议价主动权,但 CoreWeave、IREN 等相关公司股价却尚未反映这一变化。
AI 算力需求的爆炸式增长正将整个供应链推向极限。从 GPU 租赁到 DRAM 内存,从光纤电缆到数据中心托管,价格在短短数月内全线飙升,而供给却几乎无处可寻。
据研究机构 SemiAnalysis 最新报告,H100 GPU 一年期租约合同价格已从 2025 年 10 月的低点每小时每 GPU 1.70 美元急升至 2026 年 3 月的 2.35 美元,涨幅接近 40%。与此同时,按需算力已在所有 GPU 型号上全线售罄。

此轮算力短缺的核心驱动力来自需求端的结构性跃升。Anthropic 的年度经常性收入(ARR)在单季度内从 90 亿美元飙升至超过 250 亿美元,Claude Code 等多智能体工作负载正在推动算力消耗呈抛物线式增长。
SemiAnalysis 认为,GPU 租赁价格短期内大概率继续上涨。Neocloud 开始掌握议价主动权,但 CoreWeave、Nebius、IREN 等相关公司股价却没有反映出这一变化。
需求端:多点爆发,算力消耗呈抛物线式增长
本轮算力短缺的需求侧动能来自多个相互叠加的方向。
Claude Code 的爆发是最显著的拐点。Anthropic 的 ARR 在一个季度内从 90 亿美元暴涨至超过 250 亿美元,三倍于前。GLM、Kimi K2.5 等开源模型的走红进一步拉动了推理工作负载的规模。

与此同时,Anthropic、OpenAI 等 AI 实验室的大规模融资本身也直接创造了 GPU 需求。
AI 代理是另一重要推手。这类工作负载以高并发方式执行多步骤工作流、持续迭代,导致算力消耗呈抛物线式上升。
原生媒体生成平台 Seedance 和 Nano Banana 推动了图像与视频生成场景下的海量算力需求。
从经济学角度看,这一需求具备相当的价格不弹性。SemiAnalysis 指出,如果 AI 工具的投资回报率达到 5 至 10 倍,GPU 租赁价格还有相当大的上升空间才会抑制需求。
"需求曲线向右上方移动,提供了一种强劲且相对缺乏弹性的力量,推动 GPU 租赁价格上涨。"
供给端:内存价格暴涨,服务器采购陷入混乱
需求爆发只是算力短缺的一面,供给端价格暴涨是另外一面。
2026 年 1 月成为另一个关键拐点。彼时 DRAM 和 NAND 内存价格上涨加速。据 SemiAnalysis 内存模型估算,LPDDR5 和 DDR5 合同价格在 2026 年第一季度的同比涨幅分别趋向约 4 倍和 5 倍。
内存价格的暴涨迅速传导至服务器整机端。原始设备制造商(OEM)对 AI 服务器重新定价,但其涨幅显著超出元器件成本的实际上升幅度。
更高的服务器采购成本压缩了项目预期回报,迫使部分运营商放缓甚至搁置新部署计划。换言之,原本将进入市场的供给被迫滞后,进一步收紧了租赁市场。
Blackwell 新一代 GPU 的供给状况同样不容乐观。据 SemiAnalysis 了解,Blackwell 新集群的部署交期目前已延伸至 2026 年 6 至 7 月,开源权重模型的强劲需求和持续的推理算力短缺是主因。
市场结构:Neocloud 掌握议价主动权,合约条款全面收紧
GPU 租赁市场的权力格局在六个月内发生了根本性转变。
在 2025 年下半年之前,市场竞争激烈,多家 Neocloud 争相压价,以确保资产利用率。
而如今,Neocloud 和超大规模云厂商(Hyperscaler)已完全掌握主动——他们不仅可以争取更高的预付款比例、更优的定价和更长的合约期限,还可以根据自身库存情况灵活安排合约起止时间。
GPU 租赁市场可分为三个主要层级:
短期租赁(按需、现货及 3 个月以下合约):通常为剩余产能,当前此类容量已全线售罄,持有者即便面临价格大幅上涨也不愿将容量归还市场。
中期合约(3 个月至 3 年以上):市场成交最为活跃的区间。其中一年期合约能够捕捉非 AI 实验室客户的边际需求,是反映市场紧张程度的最敏感指标。
长期大宗协议(4 至 5 年):主要由大型 AI 实验室主导,单笔交易规模通常达到 50 至 100 兆瓦甚至更大,相当于约 24,000 至 48,000 块 GB300 NVL72 GPU。
这类交易对 Neocloud 而言极具吸引力——凭借长期合约可安排有利的债务融资,锁定两位数的项目内部收益率(IRR),同时规避 GPU 价格风险。超大规模云厂商有时会在此类交易中充当担保方,进一步降低融资成本。
价格展望:自我强化的螺旋,Neocloud 估值却遭低估
SemiAnalysis 认为,GPU 租赁价格短期内继续上涨的可能性远大于下跌。
当前动态具有明显的自我强化特征:供给收紧推动价格上涨,价格上涨促使 Neocloud 加速锁定硬件,进一步收紧供给,价格随之再次上涨。
SemiAnalysis 将此与 2023 至 2024 年的 GPU 短缺周期相提并论,但认为此次服务器市场已足够成熟,OEM 获取超额利润的空间可能受限。
租价上涨对 Neocloud 的财务影响是双重的:一方面,已部署资本的利润率得以扩张,改善投资资本回报率(ROIC);另一方面,更高的租赁价格延长了现有 GPU 的经济使用寿命,使既有资产在需要再投资之前能够产生更长时间的现金流。
在当前环境下,SemiAnalysis 认为受益最为明显的 Neocloud 具备以下特征:合约期限较短(可更快重新定价)、拥有大规模 H100 存量、以及近期有新增产能上线。
然而,这一基本面改善与公开市场情绪之间存在显著背离。CoreWeave、Nebius、IREN 等 Neocloud 上市公司的股价目前仍处于过去 6 至 12 个月交易区间的低位。
SemiAnalysis 指出,市场仍受"最终供给过剩与商品化"叙事主导,尚未充分反映地面上清晰可见的持续稀缺与定价能力。
三大观察指标:决定价格趋势的关键变量
SemiAnalysis 列出了判断 GPU 租赁价格能否持续高位的三项核心观察指标。
其一,GB300 集群的放量节奏。新增算力容量能否缓解当前的算力短缺,还是算力消耗增速将继续超越新增供给——这将决定 AI 实验室参与 4 年以下合约市场的程度,进而左右该区间的定价走势。
其二,硅片短缺的恶化程度。SemiAnalysis 在此前报告中已指出台积电 N3 制程逻辑晶圆产能以及 HBM、DRAM、NAND 存储器的供应紧张状况,复杂的制造流程意味着执行风险随时存在。
其三,AI 实验室 ARR 的增长轨迹。用户采纳速度的快慢以及 token 消耗的持续增长,是决定整体需求曲线斜率的根本变量。
综合来看,SemiAnalysis 的结论清晰:在上述三项指标出现明显转向之前,算力价格的方向只有一个——向上。
