
下一個 OpenAI 來了?Mistral 超大杯模型直逼 GPT-4,93 年創始人 6 人公司被微軟認領

下一個 OpenAI 來了?Mistral AI 發佈了 Mistral Large 模型,性能直逼 GPT-4,並與微軟合作。Mistral 是一家創立僅 9 個月的公司,有着 6 人團隊和 8 億融資。創始人是 1993 年出生的法國小夥 Arthur Mensch,他離開谷歌後與兩位 Llama 模型開發者一起創立了這家公司。Mistral 模型的邏輯推理能力優秀,可以處理複雜的多語言任務。此次與微軟合作,使其名聲更加響亮。
下一個 OpenAI 來了?
開源社區的另一箇中心 Mistral AI,剛剛發佈了最強力的旗艦模型 Mistral Large,性能直接對標 GPT-4!(但可惜的是沒有開源)
Mistral Large 具備卓越的邏輯推理能力,能夠處理包括文本理解、轉換以及代碼生成在內的複雜多語言任務。
在眾多主流基準測試中,Mistral Large 力壓 Anthropic 的 Claude 2 和谷歌的 Gemini Pro,成績僅次於 GPT-4!
LLM 領域,格局再次改變。
同時,就在今天,AI 圈又一重磅消息曝出:繼 OpenAI 之後,微軟將 Mistral 也納入麾下!
Mistral 從誕生之初,就充滿傳奇的光環。成立 4 周,6 人團隊,7 頁 PPT,8 億融資(1.05 億歐元),簡直堪稱爽文走進現實。
創始人 Arthur Mensch 是 1993 年出生的法國小夥,在谷歌工作 3 年後,在自己 31 歲時離開谷歌,拉攏了兩位 Llama 模型的開發者,一起創立了這個日後可以和 OpenAI、Anthropic 分庭抗禮的公司。
幾個人的團隊,極少的融資,做出的模型卻可以和 GPT-4 掰手腕。
如今再加上金主爸爸微軟的撐腰,Mistral「下一個 OpenAI」的名頭,是坐實了。
Mistral 不開源?網友慌了!
現在,正處於全世界聚光燈下的 Mistral,一舉一動都十分引人注目。
有網友發現 Mistral 修改了網站內容,刪除了所有提及開源社區義務的內容,這立馬引發了恐慌!
之前的主頁(左);現在的主頁(右)
不過,大家目前還不需要太過擔心。
根據外媒對 Mistral CEO 的採訪,未來他們依然會堅持開源理念,但是同時也會推出性能最為強大的閉源模型參與商業競爭。
現在他們已經完成了以規模命名的開源模型:Mistral 7B 和 Mistral 8 x 7B 回饋社區,以「大中小」命名的閉源模型賺錢的產品線搭建。
歐洲最強大模型來了!
話説回來,這次發佈的 Mistral Large,可以説是最適合歐洲人體質的大模型。
簡單來説:
- Mistral Large 能夠母語般流利地使用英語、法語、西班牙語、德語和意大利語,深刻理解各自的語法規則和文化背景。- Mistral Large 能夠處理 32K Token 的上下文內容,使其能夠從龐大的文檔中精確快速地提取信息。- Mistral Large 在執行具體指令方面異常精準,這讓開發人員可以根據自己的需求定製內容審查政策——例如,Mistral AI 利用它來進行了 le Chat 的系統級別審查。- Mistral Large 原生支持函數調用。這個特性,結合 Mistral AI 在 la Plateforme 上實施的輸出內容限制模式,極大地促進了應用程序的開發和技術棧的現代化。
目前,Mistral AI 的這個新旗艦模型僅在 Azure AI 和 Mistral AI 平台上可用。
其中,在 Azure AI 上的定價如下:輸出為 0.024 美元/1000 token,輸入為 0.008 美元/1000 token。
推理能力與知識掌握
要説 Mistral Large 最令人印象深刻的,還是超強的推理能力。
作為旗艦模型,Mistral Large 在常識、推理以及知識方面,都展現出了令人矚目的實力。
雖然和 GPT-4 還有不小的差距,但 Claude 2 和 Gemini Pro 1.0 基本上已經是手下敗將了。
多語言能力
作為一款歐洲人自己的大模型,Mistral Large 在法語、德語、西班牙語和意大利語上的表現,均優於 Llama 2 70B 模型。
同時,也強過自家更小規模的模型。
數學與編程能力
在編程和數學方面,Mistral Large 的能力也非常突出。
不僅相比自己其他模型有了大幅的提升,而且在主流的測試基準上都取得了不俗的成績。
「小杯」也來了
相比之下,規模更小的 Mistral Small,則更加專注於對延遲和成本的優化。
相較於 Mixtral 8x7B,Mistral Small 展現出更優異的性能和更低的延遲,是介於 Mistral AI 開源模型和旗艦模型之間的解決方案。
與 Mistral Large 類似,Mistral Small 同樣採用了在 RAG 和函數調用方面的創新技術。
此外,Mistral 還優化了自家的服務接口:
- 提供競爭力價格的開放權重端點,包括 open-mistral-7B 和 open-mixtral-8x7b。
- 推出新的優化模型端點,包括 mistral-small-2402 和 mistral-large-2402,同時繼續提供未更新的 mistral-medium。
和微軟官宣合作,Mistral AI 腰板更硬了
除了宣佈模型之外,Mistral AI 還官宣了和微軟的深度合作。
而這也是微軟繼 OpenAI 之後,再次「真金白銀」地入股 AI 圈的另一家頂流模型公司。
雖然 2023 年 4 月才成立,Mistral AI 已經對歐洲的 AI 領域產生了重大影響。
開源模型 Mistral 7B 和 Mixtral 的發佈,驚豔了一眾開發者,在 AI 社區掀起了軒然大波。
如今微軟的支持,讓更多人堅信:Mistral 就是下一個 OpenAI。
Mistral AI 是法國的 AI 初創公司,微軟與它的合作,無疑讓微軟在歐洲也建立起了自己的 AI 影響力。
兩家公司的合作,目標是彌補基礎 AI 研究與實際解決方案之間的差距。
如果在未來建立多年的合作伙伴關係,Mistral AI 就可以訪問微軟 Azure 的 AI 基礎設施了。
微軟的加持對 Mistral AI 意味着什麼,不言而喻。
不光 Mistral AI 下一代 LLM 的開發和部署會大大加速,並且會開闢出新的商機。以歐洲為基礎,Mistral AI 會向全球市場擴張自己的影響力!
具體來説,微軟和 Mistral AI 之間的合作集中在以下三個關鍵領域——
超算基礎結構:微軟將通過 Azure AI 超算基礎結構支持 Mistral AI,用於 AI 訓練和推理工作負載。
擴展市場:微軟和 Mistral AI 將通過 Azure AI Studio 中的 MaaS 和 Azure 機器學習模型目錄,向客户提供 Mistral AI 的高級模型。
AI 研發:微軟和 Mistral AI 將探索合作,為指定的客户開發專有模型,甚至包括歐洲公共部門的工作負載。
目前,兩家公司還沒有透露財務細節。
最近,Mistral AI 以近 20 億美元的估值,籌集了 4.5 億歐元,由科技投資者 Andreessen Horowitz 領投。
不過,跟它在美國的競爭者比,Mistral AI 所獲得的資金顯然並不算多。
要知道,OpenAI 僅從微軟就獲得了超過 100 億美元的投資,而 Anthropic 從谷歌和亞馬遜獲得的資金,也高達 60 億美元。
據《華爾街日報》報道,去年 10 月,谷歌承諾向 Anthropic 投資 20 億美元
因此,此項合作一出,Mistral AI「歐洲版 OpenAI」的名頭,更加坐實了。
而對於微軟來説,這項投資也是好處多多——這是它在歐洲 AI 領域站穩腳跟的機會。
本來,作為 Azure 雲中歐盟服務器上 OpenAI 模型的唯一提供商,微軟已經在歐洲的 AI 競賽中處於領先地位。
不過 AI 在歐洲所受的待遇,並不像在美國那樣備受支持。
歐洲許多國家對於 AI 的態度偏保守,他們持的是批判性的態度,尤其是在數據保護方面。
而如果是歐洲服務器商的歐洲 AI 模型,或許能讓人放心,不失為一種不錯的補救措施。
成立 9 個月的傳奇 AI 初創企業,挑戰硅谷巨頭
Mistral 在種子輪融資時「6 人團隊,7 頁 PPT,8 億融資」的故事,值得好好講一講。
2023 年初,還在谷歌工作的 Arthur Mensch,剛剛 30 歲。
一年之後,他離開谷歌創立自己的公司,只用了 9 個來月的時間,就已經估值 20 億美元!
Mensch 於 2020 年初加入了谷歌,成為 DeepMind 的研究員,他的研究方向是提高 AI 和機器學習系統的效率。那時他 27 歲。
後來,他和兩位之前一起參與了 Llama 模型研發的年輕人 Timothée Lacroix 和 Guillaume Lample 一起,決定成立一家公司,通過更加高效的方法構建和部署 AI 模型。
他們相信,小團隊能力在靈活性上超越硅谷的大公司,而開源模型就是他們實現這一目標的利器。
雖然已經從各路投資者那裏籌集了超過 5 億美元,他的公司 Mistral AI 相比於微軟支持的 OpenAI,谷歌,乃至 Anthropic,依然顯得有些「微不足道」。
這些巨頭,以及巨頭重金支持的巨型獨角獸投入了幾十億美元來構建全世界最先進的 AI 系統。
但 Mensch 並不擔心與這些龐然大物競爭。
「我們的目標是成為 AI 領域中最節省資本的公司,」Mensch 表示。「這是我們成立的初衷。」
對於剛剛推出的 Mistral Large 模型,他認為,這款模型在執行某些推理任務上能夠與 OpenAI 最先進的語言模型 GPT-4 和谷歌的新模型 Gemini Ultra 相匹敵。
Mensch 透露,開發這款新模型的成本不到 2000 萬歐元(約合 2200 萬美元)。
Mistral 巴黎總部的辦公室
相比之下,OpenAI 的首席執行官 Sam Altman 曾在去年發佈 GPT-4 時表示,訓練他們公司的大型模型的成本接近 1 億美元。
而且隨着他們用行業內最為高效的開源模型不斷震驚業界,他們也獲得了微軟,英偉達和 Salesforce 等大公司的背書。
巨頭們也通過現金或者算力的支持,獲取了 Mistral AI 的少量股份。
伴隨着 Mistral Large 的發佈,9 個月前他們用 7 頁 PPT 吹下的牛,已經完全兑現了。
撬動 8 億元投資的六人團隊
這六個人的團隊,是這樣組成的。
Arthur Mensch 在巴黎綜合理工學院和巴黎高等師範學院學習期間,結識了另兩位創始人——Timothée Lacroix 和 Guillaume Lample。
兩人都是 Meta AI 團隊的,Lample 甚至領導了 LLaMA 的開發。
幾個三十出頭的年輕人,在 LLM 開發領域已經有不少經驗。
在當時,即使在全世界範圍內,具備構建、訓練和優化 LLM 專業經驗的人,也不超過 100 人。
而另外三位,分別是來自法國巴黎健康初創公司 Alan 的 CEO Jean-Charles Samuelian 和 CTO Charles Gorintin,以及前法國數字事務國務秘書 Cédric O。
AI 科學家,如何創立自己的獨角獸公司
Mensch 個頭高大,一頭濃密的深色頭髮,他既不像典型的科技極客,也不像常見的 CEO。
他的朋友和同事們説,他總是一邊喝啤酒一邊輕鬆地和朋友開玩笑。
作為一名運動愛好者,他在 2018 年提交博士論文前的幾個月,以不到三小時半的時間跑完了巴黎馬拉松。
Mensch 從小就在學術追求與創業之間徘徊。他出生在巴黎西郊,母親是物理老師,父親擁有一家小型科技公司。
這位未來的 CEO 畢業於法國頂級的數學和機器學習院校。他的導師們將他描述為一個熱情投入、能夠迅速掌握自己幾乎沒有基礎的項目的學生。
「我確實熱愛探索新事物,」Mensch 表示。「我很容易感到厭倦。」
在攻讀博士期間,Mensch 的研究方向是優化軟件,分析核磁共振圖像(fMRI)系統的三維大腦圖像,讓軟件能夠處理高達數百萬的圖像量。
2020 年底,Mensch 加入了 DeepMind,在那裏他參與開發了大語言模型。
到了 2022 年,他以主要作者的身份發表了著名的「Chinchilla 論文」。
這項研究重新定義了人們對 AI 模型的大小、訓練它所需的數據量以及其性能之間關係的認識,被稱為 AI 縮放法則。
隨着 2022 年 AI 競賽的升温,Mensch 對於大公司的 AI 實驗室減少了關於大語言模型研究成果的發表,減少了與研究社區的分享這一情況表示失望。
ChatGPT 發佈後,谷歌決定加速追趕。
Mensch 所在的團隊從一個 10 人的小團隊變為 30 人,最後擴充成為了一個 70 人的大團隊。
「我覺得我在事情變得過於官僚化之前應該離開了,」Mensch 説。「我不想在大型科技公司中開發那些不透明的技術。」
Mistral 在 2023 年春天向投資者提出的最初方案中,批評了由美國公司主導的「正在形成的寡頭壟斷」,這些公司開發的是專有閉源模型。
對於 Mensch 和他的合夥人來説,將他們的初始 AI 系統作為開源軟件發佈,允許任何人免費使用或修改,這是一個重要的原則。
這也是吸引開發者和潛在客户的一種方式,他們希望每個人對自己使用的 AI 有更多的控制權。
儘管 Mistral 現在的最先進模型 Mistral Large 並不開源,但 Mensch 表示:
「在構建商業模式和堅持我們的開源價值觀之間找到一個平衡點是非常微妙的。我們希望創造新的事物、新的架構,但是還想向我們的客户提供一些額外的產品和服務。」
參考資料:
https://www.wsj.com/tech/ai/the-9-month-old-ai-startup-challenging-silicon-valleys-giants-ee2e4c48?st=htctyj5gooqlcll
https://mistral.ai/news/mistral-large/
https://old.reddit.com/r/LocalLLaMA/comments/1b0o41v/top_10_betrayals_in_anime_history/?continueFlag=e442fb10c2502e2fe0c601afe6270309
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
