Meta is focusing on AI Agents, and Llama 4 will enable direct voice conversations

華爾街見聞
2025.03.07 06:44
portai
I'm PortAI, I can summarize articles.

報道稱,Meta 計劃在其即將推出的 Llama 4 中引入改進的語音功能。該模型將致力於使用户與其語音模型間的對話更具互動性,接近自然對話,而不僅僅是單向的問答。

Meta 正發力 AI Agent,尤其是在端側 AI 和語音交互方面。公司計劃將在未來幾周內推出的 Llama 4 中引入更強大的語音功能。

據英國《金融時報》報 7 日報道,Meta 首席產品官 Chris Cox 在摩根士丹利技術、媒體和電信會議上透露,Llama 4 將是一個 “全能模型”,語音功能將是原生的。

這意味着,Llama 4 將能夠直接處理語音信息,無需先將語音轉換為文本,再將文本輸入大型語言模型(LLM)進行處理,最後將輸出的文本轉換回語音。

Cox 認為,這種原生語音功能對於人機交互界面而言意義重大,用户可以直接與 AI 對話,詢問任何問題。

“我相信這對接口產品來説是一件大事,你可以和互聯網交談,隨便問它什麼。我認為我們仍在思考這有多強大。”

Llama 4:語音功能原生化

扎克伯格已多次強調,2025 年將是 Meta AI 產品的 “決定性之年”。為了實現 AI 技術的商業化,Meta 正在考慮多種方案。

據報道援引知情人士透露,Meta 一直特別注重使用户與其語音模型之間的對話更接近於雙向自然對話,允許用户打斷,而不是更僵化的問答形式。

此外,Meta 正在探索為 AI 助手 Meta AI 推出高級訂閲服務,提供諸如預訂服務和視頻創作等功能 Meta 還在考慮在其 AI 助手的搜索結果中引入付費廣告或贊助內容。

扎克伯格今年還透露了構建一個具備中級工程師能力的 AI 工程代理計劃,這一項目被認為擁有 “非常大的市場潛力”。

Meta 的 AI 業務主管 Clara Shih 6 日在接受 CNBC 採訪時表示,全球有 2 億家小企業已經在使用 Meta 服務和平台。她預計 AI 將改變每一項工作和每一項業務,包括使用 WhatsApp、Instagram 和 Facebook 與客户建立聯繫的數億家小企業。

分析認為,Meta 的 AI 語音計劃不僅凸顯了 Meta 在 AI 領域的雄心,也預示着未來 AI 交互方式將更加註重自然對話,而非傳統的文本主導模式。

競爭格局:OpenAI、xAI 與 Meta 的語音之戰

在 AI 行業的競爭愈發激烈的背景下,Meta 正在努力回應來自競爭對手的挑戰。OpenAI 去年發佈的語音模式,專注於賦予其 AI 不同的人格特徵,而由馬斯克創辦的 xAI 的 Grok 3 最近也推出了語音功能。

這些競爭促使 Meta 在新模型的安全性和使用限制方面進行深入討論。一方面,Meta 需要確保 AI 模型的輸出符合道德規範,避免產生有害或不當內容。另一方面,Meta 也希望降低模型的 “高尚” 程度,使其能夠更自由地回答用户的問題。

此前,Meta 因其第三版 Llama 模型受到外界批評,認為其過於 “高尚”,拒絕回答一些無辜的問題。

除了語音能力的提升,Meta 在 AR/VR 和智能眼鏡領域的投資同樣不容小覷。Meta 最近推出的 Ray-Bans 智能眼鏡通過語音命令與 AI 助手互動,還加速籌備輕量級頭戴設備的開發,目標是替代智能手機,成為用户的主流計算設備。