Hong Kong Stock Concept Tracking | DeepSeek training cost is less than one-twentieth of GPT, AI applications may usher in low-cost expansion (with concept stocks)

智通財經
2025.01.27 01:53
portai
I'm PortAI, I can summarize articles.

DeepSeek 的訓練成本僅為 GPT 的二十分之一,且其新發布的 R1 模型性能可媲美 OpenAI 的 O1。該公司成立於 2023 年,由金融圈知名人士梁文鋒操盤。DeepSeek-V3 的研發費用為 558 萬美元,訓練僅用 2048 張 H100 GPU,時間為 53 天,顯示出中國在 AI 領域的創新潛力,可能重塑全球 AI 競爭格局。

AI 公司 DeepSeek 刷屏美國各大主流媒體和社交網站。有人猜測,可能是因為:1 月 20 日 DeepSeek 發佈了可以媲美 OpenAI O1 的 R1 模型。

天眼查顯示,DeepSeek 的開發者為杭州深度求索人工智能基礎技術研究有限公司,該公司成立於 2023 年 7 月份,由寧波程恩企業管理諮詢合夥企業和梁文鋒共同持股。 

據瞭解,深度求索背後的操盤手梁文鋒是金融圈成名已久的高手。他創立的幻方量化,為國內量化私募巨頭之一。 

值得注意的是,據湛江發佈消息,性能比肩 GPT-4o 的 DeepSeek-V3,投入研發費用為 558 萬美元,訓練成本不到 GPT-4o 的 1/20,且只用了 2048 張 H100 的 GPU 集羣,用時僅 53 天。在同等水平下,哪怕是全球 AI 第一梯隊的頭部公司,至少也要用到 1.6 萬張以上的 GPU 進行訓練。

智通財經 APP 獲悉,DeepSeek 大模型以極低成本 (600 萬美元) 和少量芯片 (2000 塊) 實現了與 OpenAI 等巨頭相媲美的性能,挑戰了"唯有科技巨頭才能研發尖端 AI"的行業共識。

其成功源於中國工程師在美國芯片限制下的創新突破:通過開源生態協作、算法優化及資源整合,將黑市芯片與量化交易公司的算力積累轉化為技術優勢。

這種模式不僅揭示美國技術封鎖的意外反效果,更預示中國可能通過開源主導權重構全球 AI 競爭格局,使低成本創新成為顛覆行業的新路徑。

市場理解,低成本可獲得最佳模型效果,對前期算力堆砌大模型邏輯否定。同時,也對中小型 AI 創新企業構成實質利好。

中信證券發佈研報稱,近日,DeepSeek-V3 的正式發版引起 AI 業內廣泛高度關注,其在保證了模型能力的前提下,訓練效率和推理速度大幅提升。

中信證券認為,DeepSeek 新一代模型的發佈意味着 AI 大模型的應用將逐步走向普惠,助力 AI 應用廣泛落地;同時訓練效率大幅提升,亦將助力推理算力需求高增。

伴隨模型能力升級,Agent 等應用形式有望加速落地,帶動辦公、教育、管理、端側、具身智能等應用領域公司加速兑現業績彈性。中信證券持續看好 AI 產業鏈的加速落地機遇。

AI 應用相關港股企業:

醫渡科技(02185)、創新奇智(02121)、匯量科技(01860)、第四範式(06682)、粉筆(02469)、晶泰控股-P(02228)等。