Amazon is stepping up its efforts to defend its position in the cloud market by upgrading its self-developed AI chips and launching the Q chatbot, which is powered by the latest generation of NVIDIA's super chips.

亚马逊发力捍卫在云计算领域的领先地位，一边升级自研的云芯片、推出亚马逊版的 GPT——人工智能（AI）聊天机器人，一边深化同英伟达的合作，推出基于英伟达芯片的新服务、和英伟达共同研发超级计算机。AWS 的副总裁 Dave Brown 表示，通过将自研芯片的设计重点放在对客户重要的实际工作负载上，AWS 能为他们提供最先进的云基础设施。此次推出的 Graviton4 是五年内的第四代芯片产品，随着人们对生成式 AI 兴趣的高涨，第二代 AI 芯片 Trainium2 将帮助客户以更低的成本和更高的能效更快地训练自己的机器学习模型。

亚马逊发力捍卫在云计算领域的领先地位，一边升级自研的云芯片、推出亚马逊版的 GPT——人工智能（AI）聊天机器人，一边深化同英伟达的合作，推出基于英伟达芯片的新服务、和英伟达共同研发超级计算机。

AWS 的副总裁 Dave Brown 表示，通过将自研芯片的设计重点放在对客户重要的实际工作负载上，AWS 能为他们提供最先进的云基础设施。此次推出的 Graviton4 是五年内的第四代芯片产品，随着人们对生成式 AI 兴趣的高涨，第二代 AI 芯片 Trainium2 将帮助客户以更低的成本和更高的能效更快地训练自己的机器学习模型。

Graviton4 计算性能较前代提高多达 30%

美东时间 11 月 28 日周二，亚马逊旗下云计算业务 AWS 宣布，推出新一代的 AWS 自研芯片。其中，通用芯片 Graviton4 的计算性能较前代 Graviton3 提高多达 30%，内核增加 50%，内存带宽提升 75%，从而在亚马逊云服务器托管服务 Amazon Elastic Compute Cloud（EC2）上提供最高性价比和能源利用效果。

Graviton4 还通过对所有高速物理硬件接口进行完全加密提高安全性。AWS 称，Graviton4 将应用于内存优化的 Amazon EC2 R8g 实例，让客户能改进高性能数据库、内存缓存和大数据分析工作负载的执行。R8g 实例提供更大的实例大小，比前代 R7g 实例的 vCPU 高最多三倍的，内存高三倍。

应用 Graitons4 的电脑将在未来数月内上市。AWS 称，启动 Garviton 项目约五年来，已生产超过 200 万个 Garviton 处理器，AWS EC2 的前 100 位用户都选择使用 Graviton。

Trainium2 速度提高四倍训练万亿参数级模型

AWS 的另一款新品——新一代 AI 芯片 Trainium2 速度比前代 Trainium1 快四倍，将能在 EC2 UltraCluster 中部署多达 10 万个芯片，让用户能在很短的时间内训练数以万亿参数的基础模型（PM）和大语言模型（LLM），同时能源利用率较前代提高多达两倍。

Trainium2 将用于 Amazon EC2 Trn2 实例，单个实例中包含 16 个 Trainium 芯片。Trn2 实例旨在帮助客户在下一代 EC2 UltraCluster 中扩展芯片应用数量至多达 10 万个 Trainium2 芯片，联通 AWS Elastic Fabric Adapter (EFA) petabit 级网络，提供高达 65 exaflops 的算力。

AWS 称，Trainium2 将从明年开始用于支持新的服务。

升级版 Grace Hopper 的首家大客户 DGX 云采用 GH200 NVL32 速度最快 GPU 驱动 AI 超算

除了自研芯片，AWS 周二还在年度大会 re:Invent 期间同英伟达共同宣布，扩大战略合作，提供最先进的基础设施、软件和服务，助力客户的生成式 AI 创新。

AWS 将成为第一家在云上采用全新多节点 NVLink 技术英伟达 H200 Grace Hopper 超级芯片的云服务商，也就是说，AWS 将是升级版 Grace Hopper 的第一个大客户。

英伟达的 H200 NVL32 多节点平台将 32 个 Grace Hopper 芯片与 NVLink 和 NVSwitch 技术共同用于一个实例。该平台将用于与亚马逊网络 EFA 连接的 Amazon EC2 实例，并由高级虚拟化 (AWS Nitro System) 和超大规模集群 (Amazon EC2 UltraClusters) 提供支持，使亚马逊和英伟达共同的客户能够扩展部署数以千计的 H200 芯片。

英伟达和 AWS 将共同在 AWS 上托管英伟达的 AI 训练即服务 DGX Cloud，它将是第一个采用 GH200 NVL32 的 DGX 云，能为开发人员提供单个实例中最大的共享内存。AWS 的 DGX 云将提高尖端生成式 AI 和超过 1 万亿参数的大语言模型的训练。

英伟达和 AWS 正在共同研发名为 Ceiba 的项目，设计世界上速度最快的 GPU 驱动 AI 超级计算机，这是一个采用 GH200 NVL32 和 Amazon EFA 互连的大规模系统。它是搭载 1.6384 万块 GH200 超级芯片的超级计算机，AI 处理能力达 65 exaflops。英伟达将用它推动下一波生成式 AI 创新。

企业客户机器人亚马逊 Q 预览版上线帮助在 AWS 上开发 App

除了芯片和云服务，AWS 还推出了自己的 AI 聊天机器人预览版，名为亚马逊 Q。它是生成式 AI 技术支持的新型数字助手，可根据企业客户的业务进行工作，帮助企业客户搜索信息、编写代码和审查业务指标。

Q 接受了 AWS 内部有关代码和文档的部分培训，可供 AWS 云的开发者使用。

开发者可以用 Q 在 AWS 上创建 App、研究最佳实践、改正错误、获得为 App 编写新功能的帮助。用户可以通过对话式的问答功能与 Q 进行交互，学习新知识、研究最佳实践以及了解如何在 AWS 上构建 App，无需将注意力从 AWS 控制台上移开。

Q 还将被添加到亚马逊的企业智能软件、呼叫中心工作人员和物流管理的程序。 AWS 表示，客户可以根据公司的数据或个人资料，对 Q 进行定制。

Q 对话式问答功能目前在所有提供企业 AWS 的地区提供预览版。

Amazon is stepping up its efforts to defend its position in the cloud market by upgrading its self-developed AI chips and launching the Q chatbot, which is powered by the latest generation of NVIDIA's super chips.

Graviton4 计算性能较前代提高多达 30%

Trainium2 速度提高四倍 训练万亿参数级模型

升级版 Grace Hopper 的首家大客户 DGX 云采用 GH200 NVL32 速度最快 GPU 驱动 AI 超算

企业客户机器人亚马逊 Q 预览版上线 帮助在 AWS 上开发 App

Trainium2 速度提高四倍训练万亿参数级模型

企业客户机器人亚马逊 Q 预览版上线帮助在 AWS 上开发 App