
Amazon is stepping up its efforts to defend its position in the cloud market by upgrading its self-developed AI chips and launching the Q chatbot, which is powered by the latest generation of NVIDIA's super chips.

亞馬遜發力捍衞在雲計算領域的領先地位,一邊升級自研的雲芯片、推出亞馬遜版的 GPT——人工智能(AI)聊天機器人,一邊深化同英偉達的合作,推出基於英偉達芯片的新服務、和英偉達共同研發超級計算機。AWS 的副總裁 Dave Brown 表示,通過將自研芯片的設計重點放在對客户重要的實際工作負載上,AWS 能為他們提供最先進的雲基礎設施。此次推出的 Graviton4 是五年內的第四代芯片產品,隨着人們對生成式 AI 興趣的高漲,第二代 AI 芯片 Trainium2 將幫助客户以更低的成本和更高的能效更快地訓練自己的機器學習模型。
亞馬遜發力捍衞在雲計算領域的領先地位,一邊升級自研的雲芯片、推出亞馬遜版的 GPT——人工智能(AI)聊天機器人,一邊深化同英偉達的合作,推出基於英偉達芯片的新服務、和英偉達共同研發超級計算機。
AWS 的副總裁 Dave Brown 表示,通過將自研芯片的設計重點放在對客户重要的實際工作負載上,AWS 能為他們提供最先進的雲基礎設施。此次推出的 Graviton4 是五年內的第四代芯片產品,隨着人們對生成式 AI 興趣的高漲,第二代 AI 芯片 Trainium2 將幫助客户以更低的成本和更高的能效更快地訓練自己的機器學習模型。
Graviton4 計算性能較前代提高多達 30%
美東時間 11 月 28 日週二,亞馬遜旗下雲計算業務 AWS 宣佈,推出新一代的 AWS 自研芯片。其中,通用芯片 Graviton4 的計算性能較前代 Graviton3 提高多達 30%,內核增加 50%,內存帶寬提升 75%,從而在亞馬遜雲服務器託管服務 Amazon Elastic Compute Cloud(EC2)上提供最高性價比和能源利用效果。
Graviton4 還通過對所有高速物理硬件接口進行完全加密提高安全性。AWS 稱,Graviton4 將應用於內存優化的 Amazon EC2 R8g 實例,讓客户能改進高性能數據庫、內存緩存和大數據分析工作負載的執行。R8g 實例提供更大的實例大小,比前代 R7g 實例的 vCPU 高最多三倍的,內存高三倍。
應用 Graitons4 的電腦將在未來數月內上市。AWS 稱,啓動 Garviton 項目約五年來,已生產超過 200 萬個 Garviton 處理器,AWS EC2 的前 100 位用户都選擇使用 Graviton。

Trainium2 速度提高四倍 訓練萬億參數級模型
AWS 的另一款新品——新一代 AI 芯片 Trainium2 速度比前代 Trainium1 快四倍,將能在 EC2 UltraCluster 中部署多達 10 萬個芯片,讓用户能在很短的時間內訓練數以萬億參數的基礎模型(PM)和大語言模型(LLM),同時能源利用率較前代提高多達兩倍。
Trainium2 將用於 Amazon EC2 Trn2 實例,單個實例中包含 16 個 Trainium 芯片。Trn2 實例旨在幫助客户在下一代 EC2 UltraCluster 中擴展芯片應用數量至多達 10 萬個 Trainium2 芯片,聯通 AWS Elastic Fabric Adapter (EFA) petabit 級網絡,提供高達 65 exaflops 的算力。
AWS 稱,Trainium2 將從明年開始用於支持新的服務。

升級版 Grace Hopper 的首家大客户 DGX 雲採用 GH200 NVL32 速度最快 GPU 驅動 AI 超算
除了自研芯片,AWS 週二還在年度大會 re:Invent 期間同英偉達共同宣佈,擴大戰略合作,提供最先進的基礎設施、軟件和服務,助力客户的生成式 AI 創新。
AWS 將成為第一家在雲上採用全新多節點 NVLink 技術英偉達 H200 Grace Hopper 超級芯片的雲服務商,也就是説,AWS 將是升級版 Grace Hopper 的第一個大客户。
英偉達的 H200 NVL32 多節點平台將 32 個 Grace Hopper 芯片與 NVLink 和 NVSwitch 技術共同用於一個實例。該平台將用於與亞馬遜網絡 EFA 連接的 Amazon EC2 實例,並由高級虛擬化 (AWS Nitro System) 和超大規模集羣 (Amazon EC2 UltraClusters) 提供支持,使亞馬遜和英偉達共同的客户能夠擴展部署數以千計的 H200 芯片。
英偉達和 AWS 將共同在 AWS 上託管英偉達的 AI 訓練即服務 DGX Cloud,它將是第一個採用 GH200 NVL32 的 DGX 雲,能為開發人員提供單個實例中最大的共享內存。AWS 的 DGX 雲將提高尖端生成式 AI 和超過 1 萬億參數的大語言模型的訓練。
英偉達和 AWS 正在共同研發名為 Ceiba 的項目,設計世界上速度最快的 GPU 驅動 AI 超級計算機,這是一個採用 GH200 NVL32 和 Amazon EFA 互連的大規模系統。它是搭載 1.6384 萬塊 GH200 超級芯片的超級計算機 ,AI 處理能力達 65 exaflops。英偉達將用它推動下一波生成式 AI 創新。

企業客户機器人亞馬遜 Q 預覽版上線 幫助在 AWS 上開發 App
除了芯片和雲服務,AWS 還推出了自己的 AI 聊天機器人預覽版,名為亞馬遜 Q。它是生成式 AI 技術支持的新型數字助手,可根據企業客户的業務進行工作,幫助企業客户搜索信息、編寫代碼和審查業務指標。
Q 接受了 AWS 內部有關代碼和文檔的部分培訓,可供 AWS 雲的開發者使用。
開發者可以用 Q 在 AWS 上創建 App、研究最佳實踐、改正錯誤、獲得為 App 編寫新功能的幫助。用户可以通過對話式的問答功能與 Q 進行交互,學習新知識、研究最佳實踐以及瞭解如何在 AWS 上構建 App,無需將注意力從 AWS 控制枱上移開。
Q 還將被添加到亞馬遜的企業智能軟件、呼叫中心工作人員和物流管理的程序。 AWS 表示,客户可以根據公司的數據或個人資料,對 Q 進行定製。
Q 對話式問答功能目前在所有提供企業 AWS 的地區提供預覽版。

