===== Claimed to be the "smartest AI on Earth"! The large model Grok3 developed by Elon Musk's xAI has officially been released. =====

華爾街見聞
2025.02.18 06:45
portai
I'm PortAI, I can summarize articles.

Chatbot Arena 有史以來首個突破 1400 分的模型,超過或媲美 Gemini、DeepSeek 和 ChatGPT 等對手,Grok3 在數學推理、科學邏輯推理等表現出色,而且 Grok3mini 的推理性能目前優於 Grok3,馬斯克表示 Grok3 版本調試成熟後將會開源。此外,xAI 曾在短短三個月將數據中心容量翻倍,並與戴爾達成 50 億美元協議支持 Grok3 訓練。

2 月 18 日中午, 馬斯克旗下 XAI 舉行 Grok 3 發佈會,超過 100 萬人在線觀看,馬斯克稱讚其為 “地球上最聰明的人工智能”。

發佈會演示顯示,在數學推理、科學邏輯推理等多方面的性能表現上,Grok3 和 Grok-3 mini 都超過或媲美 Gemini、DeepSeek 和 ChatGPT 等對手,此外 xAI 還推出功能更為強大的 Grok3 Thinking 推理模式。

除了計算能力方面,在理解力和創造力方面,Grok3 表現同樣出色。演示包括實時解決複雜的物理問題,例如繪製行星際軌跡,構思視頻遊戲......

更驚喜的是,馬斯克透露,Grok-3 最佳體驗 “大約一週之後”,語音交互功能還在開發中,一週後用户就可以擁有對話體驗。

馬斯克在發佈會中表示,X 上的 Premium Plus 用户開始,將是首批獲得訪問權限的羣體,同時用户也可以通過 Super Grok 單獨訂閲服務。

此外,為了支持 Grok3 訓練,xAI 在短短三個月將數據中心訓練集羣翻倍 20 萬塊 GPU,並且 xAI 與戴爾達成 50 億美元協議,戴爾或將今年向 xAI 交付搭載英偉達 GB200 芯片的服務器。

“地球上最聰明的 AI”

據介紹,在數學推理、科學邏輯推理和代碼寫作等能力表現方面,Grok-3 在多項 benchmark 測試中均取得了比 DeepSeek-v3、GPT-4o、Gemini-2 pro 更優的效果。據悉,目前 Grok 3 已經在 xAI 內部運行了 2 周。

xAI 工程師介紹,雖然 Grok 起步較晚,但在 MMLU 得分上以超快地速度追上了 ChatGPT。

馬斯克及其團隊表示,Grok 3 也將具有類似 DeepSeek R1 和 OpenAI o3 Mini 的推理能力。

馬斯克團隊指出,大約一個月前,Grok 3 的預訓練已經完成,從那時起其一直在努力將推理能力融入 Grok 3 模型中。Grok 3 推理迷你版的訓練時間更長,表現略優於 Grok 3 推理模型,這表明 Grok 3 推理模型具有巨大的潛力。

從各項指標來看 grok 3 一舉超越所有模型,排名世界第一,有推理模式,有 deep research 功能。上週,馬斯克在迪拜世界政府峯會的視頻通話中宣佈了 Grok 3 的推出,並稱該聊天機器人具有 “非常強大的推理能力” 並且是 “地球上最聰明的人工智能”。

Grok 3 比 Grok 2 快十倍,在 Grok3 中大規模安裝更多計算能力使其能夠在更短的時間內運行大數據集,同時提供更高的準確性。

具體演示來看,Grok3 現場為太空發射生成動畫 3D 圖,展現了其理解複雜物理知識的能力。

馬斯克團隊輸入提示要求要求 Grok-3 現場生成代碼,運行代碼後畫面上顯示出了飛船在地球和火星間往返的動畫。

另一段演示中,Gork-3 製作一款類似於俄羅斯方塊和寶石迷陣的遊戲,展現了其出色的創造力。

馬斯克還透露稱,我們將在 xAI 推出一個人工智能遊戲工作室。如果你有興趣加入我們並開發人工智能驅動的遊戲,請加入我們。

xAI 通過修改 Grok3 的訓練過程(而不僅僅是硬件改進)為 Grok3 實現了更好的功能。更新後的模型實現了合成數據集、自我校正和強化學習,以提高其性能。

訂閲試用方面,馬斯克表示,Grok3 測試版現已面向 X Premium 用户開放,並且推出 SuperGrok 訂閲服務。

此外,xAI 計劃在最新版本完全成熟後立即開源其 Grok 模型的先前版本,馬斯克預計 Grok-3 的過渡將在幾個月內完成。

xAI 與戴爾達成 50 億美元協議,三個月將數據中心容量翻倍

值得一提的是,xAI 即將與戴爾科技達成協議收購價值超過 50 億美元的配備英偉達 GB200 芯片的 AI 優化服務器,旨在滿足 Grok 3 和其他 AI 應用程序日益增長的計算需求。

見聞此前文章指出,知情者稱,若達成交易,戴爾將今年向 xAI 交付搭載英偉達 GB200 芯片的服務器,用於優化 AI 工作。

在發佈會上,馬斯克團隊還透露,xAI 在短短三個月將數據中心容量翻倍,使用了 20 萬個英偉達 H100 GPU 打造出最佳 AI。

馬斯克團隊表示,去年 4 月馬斯克決定 xAI 要想取得成功並打造出最佳 AI,唯一的辦法就是創建自己的數據中心。我們花了 122 天的時間才讓第一批 10 萬個 GPU 啓動並運行。我們很快意識到要構建我們設想的 AI,需要將集羣規模擴大一倍。因此啓動了另一個階段,我們在短短 92 天內就將容量翻了一番。

網友熱評:有史以來第一個突破 1400 分的模型、性價比超 Gemini

網友們對於 Gork-3 的發佈也滿懷激動,AI 大佬 Andrej Karpathy 試用後稱讚説,Grok3+Thinking 大概和 OpenAI 最強的模型(比如 o1-pro,月費 200 美元)相當,比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 略好一些。

還有網友誇讚稱,Grok-3 是有史以來第一個 Chatbot Arena 突破 1400 分的模型,其性能優於 OpenAI 和 Google 的最佳公開推理模型。而 xAI 成立於 Deepmind 晚 13 年,比 OpenAI 晚 8 年,現在領先於兩者。

有網友則對 AI 信心十足,Grok3 似乎非常強大,這很好地證明了縮放定律實際上並沒有結束,非常看好人工智能的未來。

也有網友指出了其缺點,Grok3 不擅長編碼。

此外,更有網友猜測,這會不會激起一輪大模型價格戰呢?