The Chip Revolution at the AI Edge

華爾街見聞
2025.02.24 11:56
portai
I'm PortAI, I can summarize articles.

市場對小尺寸端側 AI 芯片的需求激增,2025 年中國文化市場表現強勁,AI 市場也在蓬勃發展。DeepSeek 的推出使得生成式 AI 從雲端走向端側,推動了 AI 硬件產品的探索。儘管 CES 上眾多產品與 AI 相關,但由於本地 SoC 算力與大模型需求不匹配,效果不佳。雲端 AI 推理面臨成本、速度和隱私等問題,端側推理在自動駕駛等場景中展現出更高的效率和安全性。

2025 年,中國開了一個好年。

文化市場,哪吒 2 爆火,票房已經突破了百億,闖入全球電影 TOP 榜,向世界展示了中國市場 “恐怖的” 消費能力。AI 市場,DeepSeek 的橫空出世,更低的算力達到 Chat GPT 的效果,直接刷屏全球熱搜榜。

如果説 Chat GPT 的出現,讓生成式 AI 走向了雲,那麼 DeepSeek 則是讓生成式 AI 走向了端。

端側 AI 芯片的 “黃金拐點”

科技行業一直在探索 AI 硬件產品。

從今年 “消費電子屆春晚” CES 上來看非常明確。今年 CES 上的各大公司推出的產品都與 AI 強相關,無論是通用的 PC,還是手機終端,再到機器人、眼鏡、耳機、手錶等等,幾乎每種產品只要存在人機交互的硬件終端,都有廠商嘗試將其與 AI 大模型結合。

但這些探索似乎都不太成功。大模型推出了成百上千種,硬件產品更是成千上萬種,但效果不甚了了。究其原因,還是本地 SoC 提供的算力和大模型需要的算力無法匹配。

ChatGPT 時代,大模型的蒸餾是很大的問題。如果採用雲端調用算力完成 AI 推理,就存在三個問題:第一,成本。雲端的任何操作都是有成本的,可能不多,幾分人民幣,但總之是要花錢的。

有手機廠商透露,調用一次雲端大模型的平均成本在 1.2 分到 1.5 分人民幣,假設每個品牌都有上億的用户量,每人每天調用 10 次,這其中的算力成本非常驚人。但是如果按次數或月租向用户進行收費,在功能同質化的情況下,用户的使用意願也會很難保證。

第二,速度。既然是雲端完成,那麼必然需要進行網絡傳輸,這就導致 AI 在終端的響應速度慢。如果是自動駕駛中的汽車,對於當前環境需要在 10 毫秒內決策,靠着雲端未免過於危險。在自動駕駛、工業質檢等場景,端側推理延遲能夠降至毫秒級,較雲端方案提升 5 倍。

第三,隱私。這是最重要的部分,涉及到醫療和金融等內容,對於用户來説,端側模型才是最優解。

所有人內心都有一個答案:端側 AI 才是 AI 硬件落地的關鍵。

小尺寸模型落地端側已經開始了。

自華為宣佈 “小藝智能體” 接入 DeepSeek-R1 算起,在一週多的時間裏,包括星紀魅族、榮耀、OPPO、努比亞、vivo 在內的 6 家手機廠商宣佈接入 DeepSeek。

需要解釋的是,滿血版 DeepSeek-R1 模型參數達到 671B,僅模型文件就需要 404GB 存儲空間,任何一種移動設備都無法滿足這樣的硬件配置需要。但 DeepSeek 蒸餾版本(1.5B、7B)適合手機等端側使用。

為了讓這些小尺寸模型在端側流暢運行並充分發揮其智能優勢,就需要性能強勁的端側 AI 芯片來提供算力支持。

市場對於能適配小尺寸模型運行的端側 AI 芯片需求開始水漲船高。

賽道主力玩家

端側的應用市場非常大,前文我們提到,只要存在人機交互的硬件終端,都有廠商嘗試將其與 AI 大模型結合。我們可以在這裏具體看一下:

AI PC 領域,2027 年 AI PC 在中國 PC 市場佔比能夠達到 85%;AI 手機領域,2026 年,AI 手機的出貨量預計將突破 4.7 億部,滲透率增至 38%;在 AI 可穿戴設備領域,市場規模預計將從 2024 年的 419 億美元增長至 2028 年的 1207 億美元,CAGR 達到 30.3%。

2023 年中國端側 AI 市場規模為 1,939 億元,從 2018 至 2023 年,其年均複合增長率為 116.3%。

DeepSeek 首先帶動是 AI 端側的 SoC 芯片需求。

SOC 芯片是各類型硬件設備的主控單元,承載着運算控制等核心功能,是硬件的 “大腦”。隨着 AI 在邊緣側的應用越來越廣泛,SOC 將更加變成集成人工智能和邊緣計算能力的系統級芯片,成為 AI SOC,算力達到幾十甚至數百 TOPS。

在這次端側 AI 熱潮中,瑞芯微頻頻漲停。

目前,瑞芯微能夠提供從 0.2TOPs 到 6TOPs 的不同算力水平的 AIoT 芯片,其中 RK3588、RK3576 帶有 6TOPs NPU 處理單元,能夠支持端側主流的 0.5B~3B 參數級別的模型部署。可通過大語言模型實現翻譯、總結、問答等功能,並可實現多模態搜索、識別,有效解決不同 AIoT 場景的痛點,提升產品使用體驗。

其中,公司 SOC 芯片拳頭產品 RK3588M 是國內少數能媲美國外一線產品的智能座艙 SoC 芯片。

據瑞芯微透露,該產品性能優異,一芯帶多屏、端側 AI 等能力突出,已落地應用於眾多頭部車廠,量產車型 10 餘款,超 20 款定點車型項目在同步開發中。此外,新產品 RK3576M 也正在進行客户導入。

這還僅是瑞芯微端側 AI 產品應用的一個方面。

事實上,當前已有多個領域的客户基於瑞芯微主控芯片研發在端側支持 AI 大模型的新硬件,例如教育平板、AI 玩具、桌面機器人、算力終端、會議主機等產品。

全志科技也是一家備受關注的 SoC 企業。去年公司全年實現屬於上市公司股東的淨利潤為 1.53 億元–1.9 億元,同比增長 566.29%~727.42%。業績暴增的原因,則是以掃地機器人、智能投影等業務線為代表的產品出貨量顯著提升,致使營業收入同比增長約 35%。

在記者問詢全志科技產品是否能適配 DeepSeek,是否針對 DeepSeek 進行佈局時,全志科技表示:“公司產品可以為端側多種形態的智能終端產品提供算力支持。”

樂鑫科技 SoC 長期應用於泛 IoT 領域。從應用端看,樂鑫科技在智能家居、智能照明和消費電子等核心應用市場合計達到了 30% 以上的增長

樂鑫科技 ESP32-S3 和 ESP32-P4 產品線都有添加邊緣 AI 的功能,主要體現為設備端語音喚醒與控制,以及圖像處理的功能。這兩個系列的芯片在硬件設計上增加了 AI 加速指令;而在軟件層面,也提供圖像識別和語音喚醒、控制等方案。

樂鑫科技副總經理王珏表示:“公司帶端側 AI 功能的 AIoT 芯片 ESP32-S3 目前增長非常迅速,也是當前主推的旗艦產品。” 字節跳動的 AI 玩具 “顯眼包” 中用的也是樂鑫的芯片 ESP32。

晶晨股份已有超 15 款商用芯片搭載其自研的端側 AI 算力單元,2024 年攜帶自研端側 AI 算力單元的芯片出貨量超過 800 萬顆。

2024 年年度實現營業收入 59.21 億元左右;歸母淨利潤約 8.2 億元左右,同比增長 64.65% 左右。該公司表示,其 6nm 芯片 S905X5 系列可利用端側 AI 能力,實現本地同聲翻譯、同聲字幕等功能,商用半年以來取得多個國際 Top 級運營商的訂單,預計 6nm 芯片有望在 2025 年達成千萬顆以上的銷量。

端側的 AI 音頻處理器應用場景多是在智能物聯網領域。比如,在智能音響中,端側 AI 音頻處理器能夠支持語音喚醒、語音識別、語音合成等功能,實現用户與音箱的自然語言交互。在智能家居系統中,它可用於聲音控制家電設備,如通過語音指令調節燈光、空調、電視等。

恆玄科技的端側 SoC 已經成功搭載在多家主流品牌產品裏,包括百度、字節跳動、谷歌、哈曼、安克創新、漫步者、韶音等。

今年,字節跳動推出的首款搭載豆包大模型的智能耳機 Ola Friend,搭載的就是恆玄科技 2700 芯片。恆玄科技的最新芯片 BES2800 還被應用於三星 2024 年最新發布的 Galaxy Buds3 Pro 耳機中。多款耳機的應用,能夠看出恆玄科技在智能終端 SoC 芯片領域處於領先地位。

對於端側 AI 對於芯片要求的變化,恆玄科技認為:“雲端大模型的興起除了對 AI 手機、PC 帶動外,可穿戴也是會受益於端側 AI 的發展,它對芯片會提出新的需求,比如可穿戴的環境感知能力要變得更強,所以主控芯片的算力需要相應提升,同時可穿戴產品長續航是剛需,所以芯片在算力提升的基礎上還要保持較低的功耗水平。”

值得一提的還有 AI 眼鏡芯片。行業普遍認為眼鏡是目前最火的 AI、大模型的落地載體,今年行業將會完成 0 到 1 的突破。

之前在 2017 年,Meta 就開始自研 AI 眼鏡,最開始是和三星合作,但是三年都沒出什麼結果,然後告吹了。之後 Meta 放棄了自研芯片,Ray-Ban 眼鏡使用了高通的 AR1 Gen 1 芯片。

可以説,在 ARVR 芯片這個領域,高通還是處於絕對的控制地位。在市面上,AI 眼鏡能用上的芯片,除了高通芯片,那就是紫光展鋭的 TW517。

紫光展鋭TW517 採用 12nm 工藝,GPU 型號為 IMG8300,運行頻率 800MHz。主要客户是閃極 AI 拍拍鏡、影目科技。

同時,恆玄科技此前透露,該公司芯片已在魅族等智能眼鏡產品中應用發佈,同時有一些客户項目正在導入階段。

結語

哪吒 2 突破百億票房,向世界展示了中國市場 “恐怖的” 消費能力。這意味着:單憑中國市場的規模和消費能力就抵得上全球其他發達國家的總和。

這背後傳遞的信號非常積極。

如果只看電影市場,可能還不太理解。但如果放到科技和製造業中來看就會明白其中的巨大價值。

接下來不管歐美再怎麼對我們進行貿易和科技壁壘,都不可能阻止我們產業升級。對於科技和製造的最大障礙,並不是 “卡脖子”,而是前期沒有足夠大的消費市場買單,就無法形成相關產業鏈的建立。

舉個例子,某企業研發一款芯片,從設計到量產累計成本要 2 個億,如果只賣出十萬片那每個芯片的成本等於是 2000 塊,這個價格太高了,企業肯定無法盈利。只能陷入長期虧損,最終倒閉出局。但是如果能夠賣出 1 億片,那每片成本只需要 2 塊錢。這個成本的大幅度攤薄就會讓企業有利潤繼續投入研發。

因為市場體量足夠大,有足夠多的買家幫助消化成本,公司就能賺錢、行業就能發展,這就是中國市場的魔力。

國信證券研報觀點稱,2024 年電子行情由 “週期復甦” 向 “成長創新” 切換,2025 年行業有望邁入估值擴張大年。應用端 AI 革新人機交互,以語音交互為核心的 AI 端側應用正處在大規模商業化的臨界點,創新催化頻繁。

相比 AI 雲側,國內半導體企業將在 AI 端側創新中實現更高的市場參與度,同時國產半導體自給率仍偏低,兩者共振奠定了行業成長的確定性和空間。

本文作者:九林,來源:半導體產業縱橫,原文標題:《AI 端側的芯片革命》

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。