數據安全至上,大模型發佈分秒必爭

華爾街見聞
2023.04.10 00:13
portai
I'm PortAI, I can summarize articles.

大模型開始商業 “廝殺”,AI 將滲透到眾多行業中。

4 月 8 日華為發佈了盤古大模型,引發業內高度關注。盤古 NLP 大模型在三方面實現了突破性進展。

第一、具備先進的語言理解和模型生成能力,盤古 NLP 大模型在權威的中文語言理解評測基準 CLUE 總排行榜及分類、閲讀理解單項均排名第一,刷新三項榜單世界歷史記錄;

第二、在預訓練階段沉澱了大量的通用知識,僅能做到理解又能做到生成,除了像 GPT-3 等基於端到端的生產方式之外,還能夠通過少量樣本學習對意圖進行識別,轉化為知識庫和數據庫查詢。

第三、採用大模型小樣本的調優路線,實現小樣本學習任務上超越 GPT 系列。

華爾街見聞·見智研究認為:人工智能的發展就是從小模型到大模型,未來幾年大模型的研發浪潮將會加速推動 AI 行業的快速發展,並且將滲透到眾多行業中。

專用模型下,數據安全被重視

在細分領域下,行業數據會直接影響到技術迭代速度、商業競爭等,被看作是大模型訓練的 “黃金鑰匙”,這也是為什麼現在各個國家將數據安全提高至最高等級。

此前,三星半導體部門就曾發生數據安全泄露的重大事故。

根據韓國媒體 Economist 的報道,出於擔心可能發生的內部機密信息泄露,三星一直阻止其員工在工作場所使用 ChatGPT。不過從 3 月 11 日起,三星向其半導體部門的員工授予了 ChatGPT 的使用權限(其他部門仍被禁止)。在三星員工使用 ChatGPT 來幫助他們完成工作時,三星的機密數據也不知不覺就泄露了。

所以,行業數據安全在大模型中需要有很高的安全性保證。基於這點來看,也催生出各個領域的巨頭對大模型研發的渴求,畢竟關鍵的數據將直接影響公司商業價值的時間長度。

接下來,多家巨頭都將會宣佈陸續發佈自家的大模型。

(預計)4 月 10 日商湯發佈大模型

(預計)4 月 11 日阿里發佈大模型

(預計)4 月 14 日同花順發布 AI 產品

(預計)5 月 6 日科大訊飛發佈大模型

(預計)5 月騰訊發佈混元大模型

而對於沒有很強資金實力的公司來説,盤古大模型就可以提供很好的數據訓練。

從盤古大模型來看為例,劃分為 L0-L1-L2 三個層級:

L0 層級:包含視覺大模型:部分應用場景成績位居世界第一,包括礦山場景、鐵路作業故障檢測等等;NLP 大模型也就是上文提到的自然語言大模型;圖網絡大模型、多模態大模型以及科學計算大模型。

L1 層級:是基礎模型與行業數據結合後的混合大模型,需要有很高的 know-how 經驗,這也就決定了行業大模型的垂直性,並且還要重點關注模型內的訓練參數質量和安全性。

L2 層級:是把 L1 層級下有業務場景進行部署後生成的細分場景模型,更具有專用性。

見智研究認為:特別是在 L1 和 L2 層級下,盤古大模型能夠極大程度的幫助各行各業進行定製化訓練,並且減少基礎大模型的高昂研發費用,同時還能保證數據安全。

小結:人工智能的時速競賽才剛剛啓程,接下來會是大模型的商業廝殺,誰越早發佈、質量越高、數據安全性越高,就能搶先獲得客户青睞,可謂是分秒必爭的時刻。