Hong Kong Stock Concept Tracking | DeepSeek training cost is less than one-twentieth of GPT, AI applications may usher in low-cost expansion (with concept stocks)

DeepSeek 的訓練成本僅為 GPT 的二十分之一，且其新發布的 R1 模型性能可媲美 OpenAI 的 O1。該公司成立於 2023 年，由金融圈知名人士梁文鋒操盤。DeepSeek-V3 的研發費用為 558 萬美元，訓練僅用 2048 張 H100 GPU，時間為 53 天，顯示出中國在 AI 領域的創新潛力，可能重塑全球 AI 競爭格局。

AI 公司 DeepSeek 刷屏美國各大主流媒體和社交網站。有人猜測，可能是因為：1 月 20 日 DeepSeek 發佈了可以媲美 OpenAI O1 的 R1 模型。

天眼查顯示，DeepSeek 的開發者為杭州深度求索人工智能基礎技術研究有限公司，該公司成立於 2023 年 7 月份，由寧波程恩企業管理諮詢合夥企業和梁文鋒共同持股。

據瞭解，深度求索背後的操盤手梁文鋒是金融圈成名已久的高手。他創立的幻方量化，為國內量化私募巨頭之一。

值得注意的是，據湛江發佈消息，性能比肩 GPT-4o 的 DeepSeek-V3，投入研發費用為 558 萬美元，訓練成本不到 GPT-4o 的 1/20，且只用了 2048 張 H100 的 GPU 集羣，用時僅 53 天。在同等水平下，哪怕是全球 AI 第一梯隊的頭部公司，至少也要用到 1.6 萬張以上的 GPU 進行訓練。

智通財經 APP 獲悉，DeepSeek 大模型以極低成本 (600 萬美元) 和少量芯片 (2000 塊) 實現了與 OpenAI 等巨頭相媲美的性能，挑戰了"唯有科技巨頭才能研發尖端 AI"的行業共識。

其成功源於中國工程師在美國芯片限制下的創新突破：通過開源生態協作、算法優化及資源整合，將黑市芯片與量化交易公司的算力積累轉化為技術優勢。

這種模式不僅揭示美國技術封鎖的意外反效果，更預示中國可能通過開源主導權重構全球 AI 競爭格局，使低成本創新成為顛覆行業的新路徑。

市場理解，低成本可獲得最佳模型效果，對前期算力堆砌大模型邏輯否定。同時，也對中小型 AI 創新企業構成實質利好。

中信證券發佈研報稱，近日，DeepSeek-V3 的正式發版引起 AI 業內廣泛高度關注，其在保證了模型能力的前提下，訓練效率和推理速度大幅提升。

中信證券認為，DeepSeek 新一代模型的發佈意味着 AI 大模型的應用將逐步走向普惠，助力 AI 應用廣泛落地；同時訓練效率大幅提升，亦將助力推理算力需求高增。

伴隨模型能力升級，Agent 等應用形式有望加速落地，帶動辦公、教育、管理、端側、具身智能等應用領域公司加速兑現業績彈性。中信證券持續看好 AI 產業鏈的加速落地機遇。

AI 應用相關港股企業：

醫渡科技（02185）、創新奇智（02121）、匯量科技（01860）、第四範式（06682）、粉筆（02469）、晶泰控股-P（02228）等。