長江證券:OpenAI 揭秘 “草莓” AI Meta 多模態新技術重磅落地

智通財經
2024.09.05 02:21
portai
I'm PortAI, I can summarize articles.

長江證券發佈報告稱 OpenAI 和 Meta 在 AI 技術領域取得重大突破,OpenAI 計劃推出代號為"草莓"的新 AI,旨在提升答案准確性和解決複雜數學問題。Meta 發佈的 Transfusion 方法將推動多模態模型訓練。這些技術進展預示着 AI 行業將繼續發展,提升用户體驗並帶來全行業技術創新。

智通財經 APP 獲悉,長江證券發佈研報稱,OpenAI 計劃最早在今年秋天推出代號為 “草莓” 的新人工智能,該人工智能旨在改進即將推出的 “Orion(獵户座)”,以幫助 OpenAI 減少模型生成的錯誤數量,提高答案的準確性。Meta(META.US) 最近發佈了融合 Transformer 和 Diffusion 的訓練能夠生成文本和圖像模型的統一方法 Transfusion,該方法有望用於訓練真正的多模態模型。AI 技術關卡持續突破,用户體驗逐步提升。OpenAI 和 Meta 等頭部企業對 AI 技術的突破以及應用拓展將會帶領全行業技術創新和用户體驗的提升,AI 行業擁有廣闊的發展前景。

OpenAI 計劃推出代號為 “草莓” 的新人工智能。1) AI 大模型技術更新推動演算能力提高。“草莓” 具備解決以前從未見過的數學問題的能力,這是當今的聊天機器人所無法準確做到的。給予長時間演算時,“草莓” 還能夠回答用户更主觀的問題,適用於對時間不太敏感的用例。2) 訓練數據生成能力增強。“草莓” 旨在改進即將推出的 “Orion(獵户座)”,可以幫助 OpenAI 克服獲取足夠高質量數據的限制,以便利用現實世界的數據訓練新模型,並幫助 OpenAI 減少模型生成的錯誤數量,提高答案的準確性。“草莓” 的推理能力有望被整合進 ChatGPT,同時,該技術還將對未來能夠完成多步驟任務的智能體產品產生深遠影響。

Meta 多模態模型訓練方法取得新進展,全新視覺模型性能出色。1) 高性能圖像與文本生成能力。Transfusion 能夠生成與相似規模的擴散模型相媲美的高質量圖像,而且,它同時也保持了強大的文本生成能力。在 GenEval 基準上,Transfusion 模型優於 DALL-E2 和 SDXL 等其他流行模型,且在文本基準上達到了 Llama1 級別的性能水平。該方法使用前景十分廣闊,有望用於訓練真正的多模態模型。2) Sapiens 優化視覺任務。Meta 推出的全新視覺模型 Sapiens 對二維姿勢預估、身體部位分割、深度估計和表面法線預測四大關鍵視覺認為進行了優化,在多種場景均有用武之地。3) 泛化能力卓越,用户使用便利。Sapiens 模型易於針對個別任務進行調整,面對真實世界數據時表現出卓越的泛化能力。即便是在標註數據稀缺或完全使用合成數據的情況下,Sapiens 依然擁有出色的性能。此外,該模型易用性強,為具有不同訓練設置偏好的用户提供了多樣化的安裝路徑選擇。

AI 技術關卡持續突破,用户體驗逐步提升。OpenAI 和 Meta 等頭部企業對 AI 技術的突破以及應用拓展將會帶領全行業技術創新和用户體驗的提升,AI 行業擁有廣闊的發展前景。AI 技術及應用領域持續突破,建議持續關注 AI 在視覺成像和內容創作等各領域的商業化落地。

風險提示

1、AI 技術發展不及預期風險;

2、內容監管風險。