Google AI "Killer App" is coming! Here's everything we know about Gemini so far.

華爾街見聞
2023.09.16 11:23
portai
I'm PortAI, I can summarize articles.

谷歌集結數百工程師團隊後,Gemini 模型來勢洶洶,從強大的多模態能力到解決問題和規劃的能力,手握 TPU 的谷歌即將碾壓 OpenAI?

谷歌集大成之作——Gemini 要來了,GPT-4 的最強殺手即將問世。

9 月 14 日,媒體援引三位直接知情人士消息稱,谷歌已向一小部分公司提供了 Gemini 的早期版本,這意味着谷歌考慮將其納入消費者服務。同時,谷歌還將通過公司的雲計算服務出售給企業,這也意味着距離 Gemini 正是發佈越來越近。

據知情人士透露,谷歌並將發佈不同大小的 Gemini 版本,這樣開發者就可以購買簡化版本來處理較為簡單的任務,且足夠小的版本來在個人終端上運行。

為了與 OpenAI 抗衡,加快 Gemini 的開發週期,谷歌 CEO 劈柴在今年 4 月邁出了關鍵一步,將擁有完全不同文化和代碼的團隊——谷歌大腦和 DeepMind 合併。由原 DeepMind 創始人 Demis Hassabis 出任 CEO。

對於合體後的全新團隊,Haasabis 顯然非常自信。他表示,全新的團隊彙集了兩股對最近的人工智能進步至關重要的力量。谷歌創始人謝爾蓋·布林也被 AI 的風吹回戰場,親自參與 Gemini 的訓練。

此後的數月裏,Gemini 一點點掀開神秘面紗一點點被揭開,這是關於 Gemini,目前已知的一切。

Gemini 的多模態能力

語言模型的下一步飛躍可能是在計算機上執行更多任務,此前文章提到,Gemini 的最大優勢在於其多模態能力,不僅能夠理解和生成文本、代碼,還能夠看懂和生成圖像。相比之下,ChatGPT 只是一個純文本模型,只能理解和生成文本。

此外,製作和 ChatGPT 類似能力的語言模型的一個重要的步驟是使用人類反饋強化學習來完善其性能,DeepMind 在強化學習方面的深厚經驗可賦予 Gemini 新的能力。

在 5 月的谷歌開發者 I/O 大會上,谷歌就曾提到,從一開始,Gemini 的目標就是多模態、高效集成工具、API。而當時谷歌的預告是:“雖然還在早期,但我們已經在 Gemini 中,看到了在之前的模型中從未見過的多模態能力,這讓人印象太深刻了。”

Gemini 與 AlphaGo 合體

谷歌 DeepMind CEO Hassabis 爆料,全新 Gemini 模型將結合進 AlphaGo 和大語言模型。

Gemini 會將 AlphaGo 與 GPT-4 等大模型的語言功能合併,系統解決問題和規劃的能力將大大增強。

一些人工智能專家認為,語言模型通過文本間接地學習是其發展主要的限制。而 AlphaGo 的優勢可以解決這一點,2016 年,DeepMind 設計的 AI 系統 AlphaGo 以 4 比 1 的比分擊敗了世界圍棋冠軍李世石,是史上首個戰勝圍棋世界冠軍的機器人。

AlphaGo 基於 DeepMind 開創的強化學習技術,該技術通過讓 AlphaGo 反覆嘗試並接受表現的反饋,學會處理需要選擇採取何種行動的棘手問題。同時,AlphaGo 使用了蒙特卡洛樹搜索技術方法來探索和記憶棋盤上的可能行為。

它將有各種尺寸和功能

谷歌指出 Gemini 正在接受培訓,一旦經過微調,它將可以 “以各種尺寸和功能” 使用,就像 PaLM 2 一樣。谷歌表示,它可以部署在不同的產品中,為每個人帶來利益。

除了在企業服務中的應用之外,Gemini 在醫療用例方面還擁有巨大的潛力。谷歌一直在測試一款名為 Med-PaLM 2 的人工智能工具,該工具可以通過 Gemini 功能得到增強。該模型可用於醫療聊天機器人或機器人技術,以協助手術和醫療程序。

此外,谷歌在構建 DeepMind 的 Gato(一種 “通用” 系統)以及最近推出的 RT-2(一種機器人 Transformer 模型)方面的見解也可以集成到 Gemini 中。Google Brain 和 DeepMind 之間的合作對 OpenAI 和人工智能領域的其他競爭對手構成了重大挑戰。

Gemini 融入谷歌各類應用

劈柴在 9 月的採訪中透露了有關 Gemini 融入谷歌產品的信息。他表示,像 Bard 這樣的對話式 AI“不是最終狀態”,而是通向更高級聊天機器人的中間點。

劈柴表示,Gemini 和 Bard 融合的最終版本將成為 “令人驚歎的通用個人助手”,融入人們日常生活的各個方面,如旅行、工作和娛樂。

他重申,Gemini 將結合文本和圖像的優勢,稱當前的 AI 聊天機器人在幾年內將 “顯得微不足道”。

與現有模型相比,Gemini 將提高軟件開發人員代碼生成能力。谷歌希望用它來超越微軟的 GitHub Copilot 代碼助手。

TOB 銷售是重點 谷歌雲全力追趕微軟雲

谷歌希望藉助 Gemini 為旗下產品吸引更多用户,尤其是雲計算業務。

谷歌計劃通過其谷歌雲的 Vertex AI 服務向企業提供 Gemini 模型,並將發佈不同參數的版本,變相促進了谷歌的雲服務業務。

今年 5 月,谷歌宣佈將通過 Vertex AI 為谷歌雲客户提供一套 Palm 2 的 LLM。近期,谷歌還通過編碼平台初創公司 Replit,為客户提供了谷歌大模型一個月的免費試用。