What does GPT-4o mean? OpenAI joining forces with Apple, the unstoppable trend of AI smartphones!

華爾街見聞
2024.05.14 01:04
portai
I'm PortAI, I can summarize articles.

英偉達高級研究科學家 Jim Fan:這可能會成為從一開始就擁有 10 億用户的 AI 產品,OpenAI 之於蘋果類似於 “用於智能手機的 FSD”。

本文作者:李笑寅

來源:硬 AI

ChatGPT 帶飛 Siri?

當地時間 5 月 13 日上午 10 點,OpenAI 在春季發佈會上發佈了 GPT-4 的迭代版本——GPT-4o。據悉,GPT-4o 的速度是上一代的兩倍,並且對用户更友好:語音喚起、實時對話、無需註冊、免費使用。

OpenAI 表示,GPT-4o 及其文本和圖像能力即日起將開始向 API 和用户推出,語音和視頻能力即將推出。

從定位來看,全新的旗艦版本 GPT-4o 似乎正在挑戰 Siri。

實則不然。就在此前,有媒體報道透露,蘋果已經與 OpenAI 達成協議,將在全新操作系統 iOS 18 中引入 ChatGPT 技術,以升級 Siri 的對話體驗。

這不由令人猜想,GPT-4o 和 Siri 將如何結合?ChatGPT 和蘋果又將如何定義新一代 AI 手機?

GPT-4o 升級在哪?

1)融媒能力:GPT-4o 同時具備文本、圖片、視頻、音頻多方面的能力,即可以接受任何文本、音頻等形式及其組合的輸入,並生成同樣媒介形式的回答。

2)速度更快:GPT-4o 的速度是上一代的 5 倍,語音延遲大幅改善,可以在 232 毫秒內回應音頻輸入,平均為 320 毫秒,接近人類對話的反應時間。這意味用户可以和 GPT-4o 實時對話、甚至直接打視頻讓 Ta 在線解答各種問題。

3)免費開放:儘管 “價格戰” 的風還是吹到了 AI 界,但 OpenAI 顯然不買賬——發佈會即日起,GPT-4o 將面向 ChatGPT 的所有付費和免費用户發佈,取消其他所有限制,API 價格降價 50%。

正如發佈會所説,GPT-4o 中的 “o” 代表 “omni”,意為全能,從目前的功能更新來看,得到全棧優化的全新 GPT-4o 真正成為了一款 AI 實時語音助手,性能遠超 Siri。

演示中,GPT-4o 還展現出宣傳點之外的小功能,但驚喜程度不亞於前者:能夠實時翻譯、識別表情,可以通過攝像頭識別畫面寫代碼分析圖表。

“蘋果 +OpenAI” 將如何定義 AI 手機?

因下一代 iPhone 操作系統計劃發佈基於 LLM(大型語言模型)的新功能,蘋果正就此尋找第三方合作伙伴,談判對象包括谷歌、OpenAI。

就目前看來,蘋果和 OpenAI 的適配度似乎更高。

有分析指出,蘋果和 OpenAI 的合作能夠解決彼此在發展邊緣 AI 方面的痛點,真正做到各取所需——

OpenAI 最需要什麼?端側應用權限、系統級權限,只有蘋果能提供。

蘋果最需要什麼?最好的 AI 技術,最適配的大語言模型,GPT-4o 無疑是最佳人選。

況且,蘋果在自研芯片、封閉生態系統上還具有獨特優勢。正如英偉達高級研究科學家 Jim Fan 在 X 平台的評論:誰先贏得蘋果,誰就贏得了勝利。

我認為與 iOS 的集成將出現 3 個層級:

1)放棄 Siri。OpenAI 為 iOS 提煉出更小型、純設備上的 GPT-4o,並可選擇付費升級以使用雲。

2) 將相機或屏幕傳輸到模型中的本機功能。對神經音頻/視頻編解碼器的芯片級支持。

3)集成 iOS 系統操作 API 和智能家居 API。Siri 快捷方式是時候復活了。

這可能會成為從一開始就擁有 10 億用户的 AI 產品,OpenAI 之於蘋果類似於 “用於智能手機的 FSD”。

進一步展望,ChatGPT 引入 iPhone 能創造怎樣的新增長故事?

Wedbush 分析師 Dan Ives 在週一的一份報告表示:

在 iPhone 16 中嵌入 OpenAI 聊天框也將開闢新的增長途徑,這將讓重要的開發者以及微軟開發者生態系統一起湧入蘋果生態系統。”

“從本質上講,與 OpenAI 建立緊密的合作關係將改變遊戲規則,而對於微軟/OpenAI 來説,與全球最大的電子消費品牌捆綁將是一個明智的選擇。”

Ives 預計,蘋果將在 6 月 10 日的 WWDC 大會上官宣和 OpenAI 的合作伙伴關係,並推出基於蘋果 LLM 的 AI 聊天機器人。