
Track Hyper | Micron GDDR7 Sample: Three giants open a new battlefield competition

竟然有个新玩家,是谁?
作者:周源/华尔街见闻
最近,英伟达联合创始人兼 CEO 黄仁勋在台北 Computex 2024 展更新了 AI GPU 技术路线图,同时黄仁勋还澄清了三星电子 HBM(高带宽存储器:High Bandwidth Memory)并没有因为过热问题而没有通过英伟达质量测试。此事意味着三星电子的 HBM3e(第五代)将很快进入英伟达 AI 加速卡供应链。
黄仁勋说,“我们需要 HBM 数量非常大,因此供应速度至关重要。我们正在与三星、SK 海力士和美光合作,我们将收到这三家公司的产品。“
之前有消息称,SK 海力士和美光的 HBM 产能已排到 2025 年底,一方面说明英伟达需要的 HBM 产能确实够多;另一方面,也在侧面说明 HBM 产能问题会成为英伟达 AI 加速卡出货量的障碍。
从 HBM 的技术演进史可以看到,HBM 原本作为 GDDR 的替代品。HBM 技术迭代很快,性能越来越强,但成本也越来越高。
实际上,GDDR 如今也已非昔日吴下阿蒙:今年 3 月 6 日,固态技术协会(JEDEC)确定了 JESD239 GDDR7 显卡技术规范标准,性能较 GDDR 有巨幅提升,已有迹象显示出 GDDR7 的部分性能正在跨越 To C 消费级范畴,迈向 To B 的 HPC(高性能计算)领域。故而,GDDR7 也开始有了弥补高成本 HBM 缺陷的实力。
新战场:GDDR7 来了
6 月 4 日,美光宣布开始为下一代 GPU 提供 GDDR7 内存样品:有 28GB/s 和 32GB/s 两种速率。其中,32GB/s GDDR7 提供的内存带宽比 GDDR6 高出 60%;在 384 位总线上,内存带宽能达到 1.5TB/s。GDDR6 在 RTX 4090 等 GPU 最高带宽为 1TB/s。
美光 GDDR7 采用其 1β (1-beta) DRAM 技术制造。在最新路线图中,美光公布了到 2026 年,达到 36GB 和 24GB+ 的内存模块;三星电子的目标是实现 32GB 的速率,但没有公布中期速率目标。
今年 3 月,三星电子和 SK 海力士在英伟达 GTC 大会上也披露了各自的 GDDR7 技术参数。现在,三家主流供应商等于又开辟了一个新战场:GDDR7。
按照不同应用场景划分,JEDEC 将 DRAM 分成标准 DDR、LPDDR 和 GDDR 三类。其中,DDR 主要应用于服务器和 PC 端(桌面),LPDDR 主要应用于手机端和 PC(笔电),GDDR 的主要应用领域为图像处理领域。
在 DARM 产业格局方面,三星、SK 海力士和美光三足鼎立。当前代际 DDR5/LPDDR5 主流市场的主要竞争由这三家展开。此外,中国台湾存储企业华邦及南亚科技,中国大陆存储企业长鑫存储也将目光聚焦在这块市场。
什么是 GDDR?
GDDR,英文全称 Graphics Double Data Rate:双图像倍数据速率。这是一种专为图形处理单元(GPU)设计的同步双数据速率动态随机存取存储器(SDRAM)。
1998 年,三星电子推出业界首款 16 Mb GDDR 内存芯片。自此,GPU 和 CPU 内存开始有了各自独立的技术路线和产品。最初,GPU 显卡内存和 CPU 内存可以通用。1998 年之后,GPU 开始有专用显存——GDDR。
3 月 6 日,JEDEC 发布 JESD239 GDDR7 显卡技术规范,旨在提供更高带宽、更高数据传输速率、更高能效和更大存储容量,以支持未来高性能计算应用的发展。
目前,市场首批 GDDR7 显存容量仅 2GB(16Gb),与 GDDR6/6X 一致。JEDEC 表示,未来会有 3GB、4GB、6GB 甚至 8GB。首发搭载 GDDR7 的是英伟达 RTX 50 系列和 AMD RX 8000 系列。
据 JEDEC 披露,JESD239 GDDR7 是首款使用脉冲幅度调制(PAM)接口作高频操作的 JEDEC 标准 DRAM。
GDDR7 的带宽是 GDDR6 的两倍:即 192GB/s。这通过了增加独立通道数量至 4 个实现。GDDR7 也支持 16Gbit 至 32Gbit 的密度,包括支持双通道模式,可实现系统容量的翻倍,孤儿能满足未来图形、游戏、计算、网络和人工智能应用对高内存带宽不断增长的需求。
与 HBM 通常用于超算(高性能计算:HPC)中心 AI 算力集群不同,GDDR 主要用于游戏、专业图形设计/渲染、科学和工程模拟、虚拟现实、可视化应用(消费级)和 AI 边缘计算的 ML(机器学习)。
下半年三巨头角逐
美光 GDDR7 内存样品的工作电压为 1.2V(前代 GDDR6 工作电压为 1.35V),与 JEDEC 的 GDDR7 技术规范吻合;工作效率相比前代提升 50%。之所以能实现这一点,主要是因为美光采用了分割电压平面、部分设备运行和休眠模式。
此外,美光还采用 FBGA 更薄的封装高度(1.1mm 对比 1.2mm)和高热导 EMC 封装,故而达成了 65% 更高的热阻,这为台式机和笔电提供了更高效的热管理。
这些特性,除了更进一步提升美光 GDDR7 在 GDDR 传统应用领域的性能,另外在生成式 AI 和 HPC 等需要更高性能带宽的尖端领域,也有了广阔前景。这就意味着,GDDR7 突破了以往的性能瓶颈,开始有了能与低端 HBM 相媲美的性能表现。
这让 GDDR 有能力实现破圈:从 To C 的消费级 GPU 应用,迈向 To B 的企业级高性能市场。
据美光官方信息,在游戏领域,美光的 GDDR7 样品预计每秒帧数(FPS)提升幅度超过 30%,特别是光线追踪和光栅化工作负载。
生成式 AI 方面,美光 GDDR7 提供超过 1.5TB/s 的高系统带宽,预计可将生成式 AI 文本到图像生成的响应时间加快 20%;在 HPC,GDDR7 预计能减少更多处理时间,实现复杂工作负载(如动画、3D 设计、科学仿真和金融建模)的无缝多任务处理。
当然,GDDR7 性能提升幅度虽然相比 GDDR6 更高,但依然无法与 HBM3/3e 相比,更遑论 HBM4,但 GDDR7 提升后的整体性能,与 HBM2 或许可以等量齐观。
三星电子在 3 月的英伟达 GTC 大会上也披露了其 GDDR7 的部分技术参数,比如三星 GDDR7 能在仅 1.1V 的 DRAM 电压下实现 32 Gbps 的速度(与 GDDR6X 相比提升 33%),超过了 JEDEC 的 GDDR7 技术规范的 1.2V 电压标准。这项性能主要是通过首次应用 PAM3 信号实现的。
同时,三星 GDDR7 能实现最高 192GB/s 的显存速度,单颗显存容量 2GB;通过加持三星电子特有的其他电源管理创新,三星 GDDR7 能效提高幅度提升了 20%,发热量(热阻)减少 70%,待机功耗降低 50%。
作为存储三巨头之一,SK 海力士自然也不会缺席。海力士 GDDR7 最大带宽达到 160GB/s,是其上一代产品(GDDR6 位 80GB/s)的两倍,功耗效率提升 40%;内存密度提升 1.5 倍,故而视觉效果也进一步得到增强。
目前,海力士 16Gb GDDR7 预计将在今年三四季度实现批量出货,三星也在出样品的过程中;美光 GDDR7 内存将于今年下半年发售。意外的是 AMD,据美光透露,AMD 也会加入 GDDR7 市场角逐。
