'Excellent AI advancement': NVIDIA responds to rising popularity of China's DeepSeek

長灣資訊
2025.01.28 05:03
portai
I'm PortAI, I can summarize articles.

英偉達稱讚中國人工智能模型 DeepSeek 的創新方法和成本效益,標誌着人工智能發展的一個重要里程碑。DeepSeek 的崛起凸顯了測試時間擴展(Test Time Scaling)的潛力,這是一種在使用過程中優化人工智能模型的技術

來源:商業今日

隨着中國人工智能模型 DeepSeek 持續佔據頭條,科技巨頭 NVIDIA 對此成功發表了看法。作為人工智能芯片的領先供應商和全球人工智能行業的關鍵參與者,NVIDIA 讚揚了 DeepSeek 的創新,並解釋了其對未來人工智能的更廣泛意義。在 DeepSeek 的 V3 模型發佈後,NVIDIA 也成為最大的受損者之一。

在對 Investing.com 的評論中,NVIDIA 承認了 DeepSeek 的成功,並表示這展示了創新人工智能技術的潛力。

“DeepSeek 是一個優秀的人工智能進展,是測試時間擴展的完美例子,” NVIDIA 表示。“DeepSeek 的工作展示瞭如何利用這一技術創建新模型,利用廣泛可用的模型和完全符合出口管制的計算資源。”

NVIDIA 還指出,儘管 DeepSeek 的高性價比方法引起了轟動,但它仍然在推理過程中嚴重依賴 NVIDIA 的 GPU 和高性能網絡——推理是指在訓練後運行人工智能模型以生成輸出的過程。

什麼是測試時間擴展?

NVIDIA 提到的 “測試時間擴展” 是指一種人工智能技術,旨在優化模型在使用過程中的性能,而不僅僅關注其訓練或後訓練的改進。根據 NVIDIA 的説法,DeepSeek 的成功代表了人工智能發展的新階段,為現有方法增加了第三種 “擴展法則”:

1. 預訓練擴展:使用大量數據集和強大硬件構建模型。

2. 後訓練擴展:在訓練後微調模型以提高性能。

3. 測試時間擴展:在模型實際使用時優化其性能,以更少的資源實現更好的結果。

DeepSeek 似乎利用了這種新的擴展方法,創建了一個既強大又具有成本效益的人工智能助手。

為什麼 DeepSeek 的崛起重要

DeepSeek 通過成為美國蘋果應用商店下載量第一的免費應用,吸引了全球的關注,超越了 ChatGPT。其人工智能助手以極低的成本提供先進的功能,這得益於其高效的資源使用。

DeepSeek 的創造者聲稱,該模型是使用 NVIDIA 的 H800 芯片訓練的,這些芯片專門設計以符合美國出口管制。訓練成本據報道低於 600 萬美元,遠低於 OpenAI 等主要人工智能公司通常的支出。

這一成功迫使科技行業重新思考成本效率在人工智能開發中的角色,並引發了關於美國出口限制有效性的問題。

儘管一些人推測 DeepSeek 的崛起可能威脅到 NVIDIA 在人工智能芯片市場的主導地位,但 NVIDIA 似乎對其技術仍然至關重要充滿信心。DeepSeek 的人工智能助手仍然依賴 NVIDIA 的 GPU 進行推理,這意味着 NVIDIA 的硬件對於高效運行這些模型至關重要。

然而,像 DeepSeek 這樣的高性價比人工智能模型的崛起可能會使行業的關注點從昂貴的大規模模型轉向更小、更高效的替代品。這可能會隨着時間的推移減少對高端人工智能芯片的需求,儘管分析師表示這也可能導致整體人工智能採用率的增加,從而在長期內使 NVIDIA 受益。↳