
Co-founder Brin returns, Alphabet-C is intensively brewing its "killer move" in AI: the fastest availability of the brand-new large-scale model Gemini this year!

傳説中合併了 AlphaGo 和類 GPT-4 大模型的 Gemini 在布林的加持下加快了應用落地的腳步,谷歌在 AI 大戰中即將迎來 “大反攻”?
四年前 “歸隱山林” 的谷歌傳奇人物又被 AI 的風吹回來了!
他就是谷歌聯合創始人,科技行業的傳奇謝爾蓋·布林。
7 月 20 日,《華爾街日報》援引谷歌內部工作人員消息稱,布林本已功成身退,最近每週都會有三到四天造訪谷歌位於加州山景城 (Mountain View) 的辦公室,與研究人員合力開發谷歌 AI 大模型——Gemini。
布林會和谷歌研究人員一同討論了 “損失曲線” 等技術問題,他還會涉及到一些人事方面的事務處理,比如如何招到搶手的研究人員。
而或許是因為布林的加入,華爾街日報援引知情人士稱,負責 Gemini 項目的谷歌高管 Demis Hassabis 在最近的一次全公司會議上告訴員工,全新大模型 Gemini 最快今年可用。
傳聞中合併了 AlphaGo 和類 GPT-4 大模型的 Gemini,終於要來了嗎?
谷歌內緊鑼密鼓
2019 年 12 月 4 日,布林正式宣佈 “隱退”,將公司控制權轉交給谷歌 CEO 桑達爾·皮查伊(Sundar Pichai)。
或許布林也沒想到,僅僅 3 年後,ChatGPT 的爆火能帶來一場 AI 革命,更沒有想到這場 AI 的戰火,讓谷歌不得不一次次展開 “正面對決”。
今年 2 月微軟宣佈將 ChatGPT 集成進 Bing,並在 GPT-4 的推動下擁有自己的生成搜索體驗,更是一度讓谷歌 “脊背發涼”。
不少谷歌員工表示,從去年 11 月 AI 熱潮開始,布林便頻繁參加谷歌與 AI 相關的會議,布林在谷歌的影響力正不斷擴大,從這一點便可看出 AI 大戰的激烈程度,沒有一個科技巨頭願意 “認輸”,也可以看出布林對 AI 的熱情。
值得一提的是,大名鼎鼎的 “谷歌大腦” 團隊就脱胎於布林早年間領導的 Google X 部門。在 2018 年發出的一封股東信中,布林曾寫道:“AI 的能力和潛力,以及通過計算來解決重要問題的潛力從未如此巨大。AI 的發展將成為我有生以來在計算機領域 (見到) 的最重大發展。”
媒體稱,谷歌 CEO“劈柴” 得知布林將加入谷歌 AI 領域的研究後感到非常興奮,並鼓勵他作出貢獻。
谷歌一直被視為頂尖人工智能研究中心,但隨着 AI 競爭加劇,這家科技巨頭開始了 “防守” 模式——為了抵禦一羣靈活且日益龐大的 AI 競爭對手、為了保護其核心搜索業務、股價,以及潛在的未來的安全威脅。
華爾街見聞提及,今年 4 月,谷歌母公司 Alphabet 旗下兩大頂級 AI 團隊谷歌大腦與 DeepMind 合併,交由原 DeepMind 創始人 Demis Hassabis 出任 CEO。彼時,谷歌稱,此舉將加快其 AI 進展。
對於合體後的全新團隊,Haasabis 顯然非常自信。他表示,全新的團隊彙集了兩股對最近的人工智能進步至關重要的力量。
“如果你看看我們在人工領域的位置,你會相信,未來 80% 或 90% 的創新,就會來自其中一個團隊。在過去十年裏,兩個團隊都做出了極其出色的成果。”
而這個將由人工智能領域的頂尖團隊推出的——Gemini 或許可以被稱為谷歌在這場 AI 之戰中的 “背水一戰”。

傳聞中的 Gemini 有多強?
谷歌 DeepMind CEO Hassabis 最新爆料,全新 Gemini 模型將結合進 AlphaGo 和大語言模型。
一個是用強化學習擊敗人類圍棋冠軍、創造歷史的 AI 系統,一個是霸榜幾乎所有大模型榜單的最強多模態大模型,兩個大模型合體後的,會碰撞出怎樣的火花?
華爾街見聞此前提及,Gemini 會將 AlphaGo 與 GPT-4 等大模型的語言功能合併,系統解決問題和規劃的能力將大大增強。
一些人工智能專家認為,語言模型通過文本間接地學習是其發展主要的限制。
而 AlphaGo 的優勢可以解決這一點,2016 年,DeepMind 設計的 AI 系統 AlphaGo 以 4 比 1 的比分擊敗了世界圍棋冠軍李世石,是史上首個戰勝圍棋世界冠軍的機器人。
AlphaGo 基於 DeepMind 開創的強化學習技術,該技術通過讓 AlphaGo 反覆嘗試並接受表現的反饋,學會處理需要選擇採取何種行動的棘手問題。同時,AlphaGo 使用了蒙特卡洛樹搜索技術方法來探索和記憶棋盤上的可能行為。
語言模型的下一步飛躍可能是在計算機上執行更多任務,此前文章提到,Gemini 的最大優勢在於其多模態能力,不僅能夠理解和生成文本、代碼,還能夠看懂和生成圖像。相比之下,ChatGPT 只是一個純文本模型,只能理解和生成文本。
此外,製作和 ChatGPT 類似能力的語言模型的一個重要的步驟是使用人類反饋強化學習來完善其性能,DeepMind 在強化學習方面的深厚經驗可賦予 Gemini 新的能力。
在 5 月的谷歌開發者 I/O 大會上,谷歌就曾提到,從一開始,Gemini 的目標就是多模態、高效集成工具、API。而當時谷歌的預告是:“雖然還在早期,但我們已經在 Gemini 中,看到了在之前的模型中從未見過的多模態能力,這讓人印象太深刻了。”
語言模型的下一個重大飛躍在哪裏?Gemini 或許指引了下一代語言模型的方向。而加快推出 Gemini 或許會讓谷歌在這場 AI 大賽中的勝算更大些。
