NVIDIA's new growth point has arrived: Heavyweight launch of Hindi AI model

智通財經
2024.10.24 07:11
portai
I'm PortAI, I can summarize articles.

英偉達推出了一款針對印地語的輕量級人工智能模型,旨在進入印度不斷增長的 AI 軟件市場。此舉顯示出英偉達在 AI 基礎設施領域的壟斷地位之外,積極拓展本地語言 AI 應用。CEO 黃仁勳透露,最新的 Blackwell 架構 AI GPU 設計缺陷已修復,預計 2024 年第四季度將批量出貨,貢獻營收 100 億美元。黃仁勳還將在孟買與信實工業集團主席穆克什·安巴尼會面。

智通財經 APP 獲悉,全球 AI 芯片霸主英偉達 (NVDA.US) 週四為印度廣泛使用的當地語言——印地語,針對性地推出了一款輕量級的人工智能模型,此舉凸顯出英偉達在整個印度市場的 AI 野心不僅限於英偉達堪稱處於壟斷地位的 AI 基礎設施領域——即為印度發展人工智能技術提供 AI GPU 這一最核心基礎設施,還希望借印度當地語言 AI 模型進入印度這一不斷增長的人工智能軟件市場。

在這一消息出爐前一天,英偉達 CEO 黃仁勳在訪問丹麥時透露,在台積電 (TSM.US) 提供的重大幫助下,其最新款的 AI GPU——Blackwell 架構 AI GPU 的一個影響芯片製造的重要設計缺陷已得到全面修復。黃仁勳週三表示,該公司最新的 Blackwell 架構 AI GPU 曾存在設計缺陷,“它的功能非常強大,但設計缺陷導致良率剛開始很低。” 他表示,這一缺陷 “100% 是英偉達的錯”,後來全靠台積電協助才得以從這一挫折中恢復過來,並 “以驚人的速度” 恢復芯片製造工作。

華爾街大行摩根士丹利預計,英偉達 2024 年第四季度 Blackwell 架構 AI GPU 有望批量出貨,預計 Blackwell Q4 貢獻的營收將達到 100 億美元,且利潤率將非常高。

這家總部位於加利福尼亞的芯片巨頭在週四表示,其首席執行官黃仁勳將在印度商業之都孟買與印度信實工業集團的主席、亞洲首富穆克什·安巴尼進行面對面會談。

英偉達表示,該公司正在向印度全面推出一款全新的輕量級語言模型,名為 “Nemotron-4-Mini-Hindi-4B”,擁有 40 億級別參數,供印度國內各大公司用於開發自己的類似 ChatGPT 的人工智能應用程序,或者在該輕量級基礎上用於打造能力更強大或者專業性更精確的人工智能模型。

英偉達週四在一份聲明中表示:“該人工智能模型經過修剪、蒸餾以及預訓練,充分結合了現實世界的印地語大數據體系、合成化的印地語數據以及基本上等量的英語數據。”

英偉達在聲明中透露,來自印度的 IT 服務和諮詢公司 Tech Mahindra 是第一個使用英偉達 AI 模型產品開發名為 Indus 2.0 的定製化人工智能模型的印度公司,經過該公司調整後的這一款定製化 AI 模型專注於印地語及該國的數十種方言。

據瞭解,印度憲法承認高達 22 種語言,雖然印度乃英聯邦成員國,但是印度高達 14 億人口中僅僅有十分之一的人會用英語進行日常交流與表達。

從大型公司到初創科技公司,印度的企業當前都專注於基於其多種本國語言來構建人工智能模型,以增強對於印度龐大消費者羣體的吸引力,並推動高質量客户服務以及本國語言的內容翻譯等諸多企業經營活動與生成式人工智能全面融合,力爭能夠藉助 AI 不斷提升企業盈利水平以及企業經營效率。

與應用於為 ChatGPT 等具備強大推理能力的 AI 聊天機器人提供支持的大型語言模型 (比如 OpenAI 推出的 GPT-4/GPT-4o) 截然不同的是,輕量級的小型語言模型參數級別較低,通常是在更小、但是更加具體的數據集上進行預訓練,它們通常價格更便宜,且易於根據公司本身的需求進行定製化調整,能夠打造出在某些領域精準度更高的生成式 AI 應用程序,這些都使得它們對 AI 算力資源較少的公司更具吸引力。相比於通用級別的 AI 大模型,輕量級 AI 模型通常被用於特定任務或應用中,比如針對於特定客户羣體的 AI 智能客服、特定語言的文本生成、翻譯等。

包括英偉達、美光以及應用材料在內的全球頂級芯片公司正在印度投資並加速建立工廠,以擴大在經濟快速增長的印度市場的業務,並且該國在莫迪政府提供的鉅額資金支持下,正在努力建立其半導體產業鏈,給予國外芯片大廠,尤其是芯片製造類大廠豐厚補貼,以便能夠與韓國、中國台灣等全球主要半導體中心進行競爭。

但是分析師們普遍表示,印度建立起最基本的半導體產業鏈可能需要數年時間,預計 2030 年之前可能難以達成。據瞭解,近二十年前首次在印度開設實體店面的英偉達在印度設有工程與設計中心,並在印度南部的科技中心班加羅爾和鄰近的海德拉巴等主要城市設有英偉達辦事處。

軟件業務,或將助推英偉達股價觸及 200 美元

華爾街知名投資機構 Rosenblatt 表示,相比於英偉達 AI GPU 創收,更加看好以 CUDA 為核心的軟件業務帶來的創收規模。Rosenblatt 芯片行業分析師 Hans Mosesmann 在一份研報中將該機構對英偉達的 12 個月內目標股價從 140 美元大幅上調至每股 200 美元的驚人水平,位列華爾街對於英偉達的最高目標價。

根據知名研究機構 IDC《全球人工智能和生成人工智能支出指南》的一項最新預測,該機構預計到 2028 年,全球人工智能 (AI) 相關的支出 (重點包括人工智能支持的應用程序、AI 芯片等人工智能基礎設施以及相關的 IT 和商業服務) 較當前將至少翻番,預計將達到約 6320 億美元。人工智能,特別是生成人工智能 (GenAI) 快速融入各種終端設備與產品,IDC 預計全球人工智能支出將在 2024-2028 年的預測期內實現 29.0% 的複合年增長率 (CAGR)。

IDC 指出,軟件或應用程序將是最大規模的人工智能技術支出類別,在大多數預測中佔整個人工智能市場的一半以上。IDC 預計人工智能軟件的五年期 (2024-2028) 複合年增長率將達到 33.9%。這也是為什麼英偉達不僅聚焦於在 AI 基礎設施領域堪稱壟斷的 AI GPU 的營收規模,近期更加聚焦於 AI 大語言模型、輕量級模型以及推動全球企業在基於英偉達高性能 AI GPU 的雲端推理算力以及基於 CUDA 平台提供的加速基礎上部署 AI 應用。

CUDA 生態壁壘,可謂是英偉達的 “最強大護城河”。英偉達在全球高性能計算領域已深耕多年,尤其是其一手打造的 CUDA 運算平台風靡全球,可謂 AI 訓練/推理等高性能計算領域首選的軟硬件協同系統。CUDA 加速運算生態是英偉達獨家開發的一種並行化計算加速平台和編程輔助軟件,允許軟件開發者和軟件工程師使用英偉達 GPU 加速並行通用計算 (僅支持英偉達 GPU,無法兼容 AMD 以及英特爾等主流 GPU)。

關於如何微調 AI 模型,以及如何以低技術門檻且無需購置任何昂貴 AI GPU 的方式進行 AI 模型定製化調整,英偉達也為企業或個人用户們提供了一套完整的雲端解決方案。基於無比強大且滲透率極高的 CUDA 平台和性能強大的 AI GPU,英偉達近期在軟硬件全棧生態方面的佈局可謂不斷加碼。英偉達在 3 月 GTC 正式推出名為 “NVIDIA NIM” 的微服務,按每 GPU 使用時間收費,它是專注於優化的雲原生微服務,旨在縮短基於各類型 AI 模型的生成式 AI 應用上市時間並簡化它們在雲端、數據中心和 GPU 加速工作站上的部署工作負載,使得企業能夠在英偉達 AI GPU 雲推理算力以及基於 CUDA 平台提供的加速基礎上部署 AI 應用,尋求建立專屬英偉達 GPU 體系的 AI 應用全棧開發生態。