Bard, Cladue, and OpenAI are starting a "battle" of large-scale models overseas. Is OpenAI beginning to counter the trend of internal competition? Meta Platforms defeats Midjourney

Bard、Claude2、ChatGPT 紛紛升級，誰都不閒着；大模型都在追趕 ChatGPT，而 OpenAI 卻準備成為反內卷達人；Meta 擊敗 Midjourney；Stability AI 聯合騰訊推出 Stable Doodle；

AI 界在本週發生了哪些大事呢？

觀點前瞻

大模型都在追趕 ChatGPT，而 OpenAI 卻準備成為反內卷達人；

本週，OpenAI 前腳剛剛更新了插件 “Code interpreter”，兩大最強競爭對手 Anthropic 和谷歌就相繼宣佈更新 Claude 和 Bard；

兩家競對現在的升級趨勢就是讓用户 “免費用上 GPT4 plus”，甚至是超越它；

而反觀 Ai 大模型鼻祖，這邊也是不慌不忙：不僅不卷大模型，甚至是準備停下來等等其它大模型的步伐。

“根據外媒報道，OpenAI 正準備開始創建多個運行成本較低的小型 GPT-4 模型，每個較小的專家模型都在不同的任務和主題領域進行訓練。”

簡而言之，就是 OpenAI 家正打算走降本的輕量化路線，下一目標很可能是推廣多種垂類大模型。

在【硬 AI】看來，OpenAI 這種【混合專家模型】的思路確實會在當下犧牲了一部分回答質量，但也許是更接近產業應用的一條有效路徑。

本週日報你還能獲得以下諮詢：

1、Bard、Claude2、ChatGPT 紛紛升級，誰都不閒着

2、AI 作圖界繼續開卷：

Meta 擊敗 Midjourney；Stability AI 聯合騰訊推出 Stable Doodle；視頻分割大模型【SAM-PT】現身；

3、國內模型大事件：

網信辦給國內大模型 “上保險”；阿里開源國內首個大模型"對齊數據集”；京東發佈言犀大模型；智源超越 DeepMind；王小川大模型再升級

4、海外熱點消息

牛津、劍橋紛紛解除對 ChatGPT 禁令；Meta 要發 AI 模型商用版；馬斯克 “打臉” 現場，從抵制 AI 到成立"xAI"；

Bard、Claude2、ChatGPT 都不閒着

1、Bard 更新：支持中文、圖像理解、語音提問

此前只支持英文提問的 Bard 終於更新了中文等 40 多種語言的輸入，還新增歐盟和巴西地區訪問，

不僅如此，Bard 還更新了以下幾個功能：

上傳和理解圖片（tips：僅支持英文版）

可以通過語音進行提問；

保存歷史記錄和分享對話鏈接（與 GPT 一樣）

定製回覆的長度、風格

導出代碼功能

2、Claude2：一鍵幫你總結 PDF

Claude 升級的第二代直接用上 GPT plus 會員，支持上傳 PDF，還能幫你查找、總結多文檔內容之間的關係（支持 txt、pdf 多種格式，最高不超過 10MB）

3、ChatGPT 上線最牛插件 - 代碼解釋器

GPT4 最新插件 - 代碼解釋器，起初這個插件被稱作—讓每個人都成為數據分析師 (主要是在數據處理、繪圖方面很厲害)；

不過最近又在網友的測試下，解鎖了一些新功能：比如做成小視頻、製作簡易小遊戲、表情包等等；

感覺這個插件的功能還有待網友們繼續探索和解密。

AI 作圖界又發生了哪些大事

1、Meta 突破多模態天花板，打敗 Stable Diffusion、Midjourney

Meta 推出一款單一多模態大模型——CM3leon，問市即巔峯？

現在都説 CM3leon 比 Stable Diffusion、Midjourney、DALL-E 2 還牛，這是為啥？

【有多硬】

CM3leon 採用自迴歸模型獨領風騷，比前期領航梯隊 Stable Diffusion 等多模態採用的擴散模型的計算量少了五倍；

能處理更復雜的提示詞，並且完成作圖任務；

根據任意格式的文本指令對現有圖像進行編輯，比如更改天空顏色，或者在特定位置添加對象。

客觀的説：CM3leon 能達到的能力還真的可以位居多模態市場巔峯，不僅是清晰度更高、還能突破此前多模態的繪畫瓶頸：比如手部細節刻畫、用語言提示詞進行物體、空間細節佈局等；

這可能都要歸功於 CM3leon 的多功能架構，這意味着多模態大模型以後可以實現在文本、圖像、視頻等多任務間自由切換，這是之前多模態所達不到的。

2、Stability AI 推出圖片生成控制模型 Stable Doodle

簡單來説 Stable Doodle 大模型就是給它一張草圖，幫助你實現圖片控制；類似 ControlNET 的功效；

【有多硬】

這個 Stable Doodle 是基於 Stable Diffusion XL 模型與 T2I-Adapter 相結合而成。

而 T2I-Adapter 是騰訊 ARC 實驗室的一款圖文控制器；參數只有 70M 存儲空間 300M，非常小巧，但是能夠更好的理解草圖的輪廓，並幫助 SDXL 做圖片生成進一步的控制；

3、視頻分割大模型【SAM-PT】現身

前段時間，Meta AI 開源了一個非常強大的圖像分割基礎模型 Segment Anything Model（SAM），瞬間引爆了 AI 圈。

現在，來自蘇黎世聯邦理工學院、香港科技大學、瑞士洛桑聯邦理工學院的研究人員發佈了 SAM-PT 模型，能將 SAM 的零樣本能力擴展到動態視頻的跟蹤和分割任務。

也就是説，視頻也能進行細節分割了。

國內大模型事件

1、網信辦出手，國內大模型，有了 “保險”

國家網信辦等七部門聯合公佈《生成式人工智能服務管理暫行辦法》（以下稱《辦法》），自 2023 年 8 月 15 日起施行。

主要包括：

1、要求分類分級監管；

2、明確提出訓練數據處理、標註等要求；

3、明確了提供和使用生成式 AI 服務的要求；

《辦法》的出台相當於給在國內使用、提供生成式 AI 服務的企業上了一個保險，以後哪怕是有問題，也知道去哪裏投訴了。

2、阿里開源國內首個大模型"對齊數據集”

上個月，天貓精靈和通義大模型聯合團隊公佈了一個 100PoisonMpts 大模型治理開源數據集，又稱為 “給 AI 的 100 瓶毒藥”，目的是試圖引導 AI 落入一般人也難以避免的歧視和偏見的陷阱。

這是對多個大模型投毒後的結果評測：在抑鬱症問題上，也還是 GPT4、GPT3.5 以及 Claude 的綜合得分更高；

阿里又開源了一個 15 萬條數據的大模型對齊評測數據集——CValue，主要用於 “大模型對齊” 研究；

對齊是幹嘛的？

簡單來説，大模型對齊研究就是讓 AI 給出符合更人類意圖的答案，主要是在回答更富有情感、具有共情能力，且符合人類價值觀，希望 AI 以後也學會人文關懷。

右側是對齊後的結果：測試 ChatPLUG-100Poison 通過對齊訓練後的回答，確實有點人情味兒啦～

3、京東發佈言犀大模型

京東正式發佈言犀大模型、言犀 AI 開發計算平台，想做最懂產業的服務工具。

目前，言犀已經啓動預約註冊，預計 8 月正式上線。

4、智源超越 DeepMind

智源研究院「悟道·視界」研究團隊開源了全新的統一多模態預訓練模型——Emu。不僅在 8 項基準測試中表現優異，而且還超越了此前的一眾 SOTA。

該預訓練模型最大的特點是：打通多模態輸入—多模態輸出；

實現了：多模態任意圖文任務的內容補全，並對任務進行下一步自迴歸預測；

這一套預訓練模型能幹什麼大事？

可以訓練媲美 Meta 新鮮出爐的 CM3leon 大模型啊。（方法給到了，剩下的全靠個人努力了）

5、王小川大模型再升級

百川智能再次發升級版大模型 Baichuan-13B，參數直接從 70 億飆到了 130 億。

一同出道的還有一個對話模型 Baichuan-13B-Chat，以及它的 INT4/INT8 兩個量化版本。

Baichuan-13B 刷新開源訓練數據天花板：

Baichuan-13B 大模型的訓練數據量有 1.4 萬億 token！是 LLaMA_13B（Meta 知名大模型）的 140%；在中文語言評測中，特別是自然科學、醫學、藝術、數學等領域直接跑贏 GPT。

其它 AI 海外消息

牛津、劍橋紛紛解除對 ChatGPT 禁令；

Meta 要發 AI 模型商用版；

馬斯克 “打臉” 現場，曾高調抵制生成式 AI，如今宣佈成立"xAI"；

本文作者：韓楓，來源：硬 AI，原文標題：《Bard、Cladue、GPT 掀起海外大模型"混戰"，OpenAI 開始反內卷？Meta 擊敗 Midjourney |【硬 AI】週報》

Bard, Cladue, and OpenAI are starting a "battle" of large-scale models overseas. Is OpenAI beginning to counter the trend of internal competition? Meta Platforms defeats Midjourney | [Hard AI] Weekly Report

觀點前瞻

Bard、Claude2、ChatGPT 都不閒着

AI 作圖界又發生了哪些大事

國內大模型事件

其它 AI 海外消息