MiniMax Talks About the Survival Battle of Large Models

華爾街見聞
2024.12.06 14:23
portai
I'm PortAI, I can summarize articles.

優秀的創業公司也有機會。

作者 | 黃昱

編輯 | 劉寶丹

經去兩年的火熱發展,AI 大模型進入淘汰賽階段,悲觀情緒不斷蔓延。當 “只有少數玩家能拿到下半場競賽的門票” 成為行業共識,AI 大模型創業玩家的未來充滿了未知數。

近日,MiniMax 副總裁劉華和騰訊雲北區雲原生總經理田豐現身一場媒體交流會,共話大模型的未來發展。

就未來行業格局的發展問題,劉華對華爾街見聞表示,考慮到算力、研發團隊、資金等方面的實力,能做下一代模型研發的企業不會特別多,最終基礎大模型的賽道還是會侷限在個位數的企業,更多企業會轉去做 AI 應用,但相信優秀的大廠、優秀的創業公司會有機會留下來。

與此同時,劉華強調,MiniMax 還是會堅持做一家技術驅動的公司,在把基礎多模態大模型做好的同時,繼續做 toB、toC 的業務,“因為我們還是相信用户的反饋是最好的幫助我們提升模型的方向。”

市場中唱衰大模型創業公司的聲音其實不少。金沙江創投主管合夥人朱嘯虎曾表態,“六小虎” 最好的歸宿,將會是被大廠併購。

不過,在劉華看來,國內大廠做大模型肯定有很多優勢,但作為創業公司,MiniMax 也得到了一些大廠的支持,比如説騰訊。此外,MiniMax 也有一些成功的商業化。

大廠支持 + 成功的商業化路徑,劉華認為,像這樣的創業公司能夠留在賽道上繼續迭代研發模型,這個可能性還是很大的。

作為 “AI 六小虎” 中低調的存在, MiniMax 的商業化發展似乎是相對順利的。

今年 8 月份下旬,發佈最新的視頻模型時,MiniMax 國際業務總經理盛靜遠曾表示,MiniMax 現在是所有中國大模型公司裏面,少數幾個能講商業化變現,能講產品跟模型驅動,甚至很有可能能在比較短的時間內實現自負盈虧及盈利的公司。

她進一步指出,“最核心的還是技術突破,產品是技術突破的體現,這個產品能夠最終實現商業化,來反哺到後續的技術投入,這是公司真正轉起來的標誌,可能我們現在在半山腰的狀態,如果做得比較成功,很快就能達到一個正向的循環。”

值得一提的是,關於大模型技術迭代放緩、Scaling Law 撞牆的討論如今越來越多。

不過,劉華指出,沒有感受到 Scaling Law 在放緩,而且今年會發現不僅是有訓練的 Scaling Law,推理階段也存在 Scaling Law。其實對於 MiniMax 來講,2024 年依然是大模型飛速發展的一年。

大模型公司對技術、方向的判斷尤為重要,這決定了其未來發展的上限。MiniMax 在大模型研發方面,有三個明確的方向,包括降低模型錯誤率、實現無限長的輸入和輸出、多模態路線發展。

劉華指出,在模型錯誤率方面,上一代的 GPT 系列模型錯誤率約 30%,這導致 GPT 在一些嚴肅的生產場合沒法適用。如果説大模型要進入嚴肅的生產、研發、科研、設計,那它的錯誤率肯定要降低,最好能降低到 2%-3% 最好。

其次,大模型任務逐步從文本擴展到語音、視頻,所需的 Token 量也在迅猛增加,因此,MiniMax 必須要確保大模型以一個高效的方式處理更大規模的輸入和輸出。

據悉, MiniMax 最新研發的 Abab 7 系列模型基於 MoE 和 Linear Attention(線性注意力)機制的新架構,可顯著降低長文本的計算複雜度,實用性和響應速度極大提升,大幅減少了大模型的訓練和推理成本。

大模型的快速迭代,也離不開提供算力、存儲、大數據等基礎設施的雲服務廠商的支持。據悉,自從 MiniMax 成立以來,就與騰訊雲建立了合作關係。

經過過去幾年的發展,大模型公司對雲服務廠商的需求也發生了變化。

劉華對華爾街見聞指出,剛開始,MiniMax 對雲廠商的需求可能就是模型的訓練,隨着模型的能力不斷提升,會出現通過公有云去做業務的需要。

站在雲服務廠商的視角,騰訊雲北區雲原生總經理田豐也分享了這兩三年來對客户需求變化的觀察。

田豐指出,像 MiniMax 這樣的大模型公司客户早早期的需求是聚焦在算力、大數據處理,現在對數據存儲、數據庫、大數據、安全等都有了新的需求。隨着業務發展,訓練集羣、推理集羣的規模都在快速擴大。

“這個規模對我們的組網的能力、集羣的運維,都是一個非常大的、全新的挑戰,跟原來完全是不一樣的”。 田豐介紹,騰訊云為 MiniMax 提供了一系列集計算、存儲、網絡為一體的高性能智算產品,讓 MiniMax 釋放更多的精力聚焦在模型本身的訓練和工程化上。

據悉,騰訊雲高性能計算集羣通過一系統化的運維機制,可做到網絡故障一分鐘內發現問題,三分鐘內定位問題,最快五分鐘恢復系統。其千卡集羣的日故障數已刷新至 0.16,是行業平均水平的三分之一。

同時,騰訊雲 COS 對象存儲的元數據加速方案來保障性能,多種精細化管理措施進行數據治理。DLC 數據湖產品也針對語料數據預處理進行了專項優化來提升任務處理性能,幫助 MiniMax 節約算力 30% 以上,性能提升 35.5% 以上。

“AI 大模型是長跑,投資人和創業者都需要有信心和耐心,炫酷的技術最終還是要落實到商業化本身,要盈利去賺錢”。 田豐説道。

這場大模型競賽面臨的挑戰越來越大,要想成為最後的贏家之一,所有參與者都必須找準方向,然後全力以赴。