Upgrading the model ahead of GPT-5, Anthropic releases Opus 4.1, with enhanced capabilities in programming, research, and data analysis

華爾街見聞
2025.08.05 16:32
portai
I'm PortAI, I can summarize articles.

Anthropic 稱,在 SWE-Bench Verified 測試中,Opus 4.1 準確率 74.5%,高於 Opus 4 的 72.5%;新模型還提升了 Claude 的深入研究和數據分析能力,尤其是細節追蹤和代理搜索方面。此次升級標誌着公司戰略轉向更頻繁的漸進式改進,而非僅專注重大版本更新。該司計劃,未來幾周內發佈更重大的模型更新。

人工智能(AI)模型的競賽再度升温。在 OpenAI 即將發佈備受期待的 GPT-5 之際,Anthropic 率先升級自家模型,推出 Claude Opus 4.1,聲稱在編程、研究和數據分析能力方面實現顯著提升。

美東時間 8 月 5 日週二,由前 OpenAI 員工創立的 OpenAI 勁敵 Anthropic 宣佈,新模型 Opus 4.1 在編程評估基準 SWE-Bench Verified 上的得分達到 74.5%,較前代 Opus 4 的 72.5% 提升兩個百分點。

新模型在處理大型代碼庫導航和多文件代碼重構方面表現尤為突出。GitHub、Rakuten Group 等客户反饋顯示,Opus 4.1 在代碼修改精準度和調試效率方面均有顯著改善,能夠在不引入漏洞的情況下精確定位需要修正的代碼位置。

面對 OpenAI 本月可能發佈 GPT-5 的競爭壓力,Anthropic 選擇聚焦現有產品優化。

Anthropic 的首席產品官 Mike Krieger 表示,此次 Opus 模型升級標誌着公司戰略轉向更頻繁的漸進式改進,而非僅專注重大版本更新。他説:

“過去,我們過於專注於只提供重要的升級。(模型)它現在在編碼、推理和代理任務方面都更勝一籌。我們只是想讓它更好地服務於人類。”

性能提升聚焦編程領域

Anthropic 公佈的數據顯示,Opus 4.1 在編程能力方面實現了實質性突破。

Anthropic 公佈,在評估大語言模型(LLM)完成現實世界軟件工程能力的 SWE-Bench Verified 基準測試中,Opus 4.1 取得 74.5% 的準確率。這一成績相比 Claude Sonnet 3.7 的 62.3% 和 Opus 4 的 72.5% 有明顯進步。

Anthropic 強調,升級後的 Opus 模型在處理複雜多步驟問題時更加高效,定位為更有效的 AI 代理。新模型能夠更好地導航大型代碼庫,在代碼修改時更加精確。

Opus 4.1 還 “提升了 Claude 的深入研究和數據分析能力,尤其是在細節追蹤和代理搜索方面。”

Anthropic 本週二表示,被 Cognition 收購的 AI 編程助手 Windsurf 反饋稱,Opus 4.1 在其初級開發人員基準測試中較 Opus 4 有一個標準差的改進,性能提升幅度相當於從 Sonnet 3.7 躍升至 Sonnet 4 的水平。

客户反饋驗證實用價值

Anthropic 本週二提到一些企業客户的使用反饋,它們證實了新模型的實際改進效果。

比如日本電商巨頭樂天集團(Rakuten Group)發現,Opus 4.1 擅長在大型代碼庫中精確定位需要修正的位置,無需進行不必要的調整或引入漏洞,樂天的團隊傾向於利用該模型的這種精確性處理日常調試任務。

Windsurf 表示,使用 Opus 4.1 後編程任務完成速度更快,質量也有所提高。GitHub 則指出,Opus 4.1 相對於 Opus 4 在大多數功能上都有改進,在多文件代碼重構方面的性能提升尤為顯著。

市場競爭加劇背景下的戰略調整

Anthropic 此次發佈正值 AI 行業競爭白熱化之際。谷歌和 OpenAI 都推出了幫助程序員簡化代碼編寫和調試流程的功能,而 OpenAI 高管也在公開場合為即將發佈的 GPT-5 造勢,有報道稱該產品可能在本月推出。

被問及 OpenAI 即將發佈的產品時,Mike Krieger 表示:"我學到的一點是,我們要專注於自己擁有的東西,尤其是在快速發展的 AI 領域,其他人要做什麼最終取決於他們自己。"

Anthropic 本週二表示,Opus 4.1 現已向付費 Claude 用户開放,並可通過 Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 獲得,定價與 Opus 4 保持一致。Anthropic 還計劃,未來幾周內發佈更重大的模型更新。

Anthropic 被傳新融資或推升估值至 1700 億美元

將近兩週前,7 月中旬媒體稱,Anthropic 稱其年化收入今年上半年增長四倍,已超過 40 億美元,其爆炸式的收入增長引起部分投資者濃厚興趣,考慮以超過 1000 億美元的估值進行新一輪投資,較四個月前該司宣佈融資時的 580 億美元估值幾乎翻了一番。

此後,有媒體在與多位中東投資者交流後表示,Anthropic 即將到來的估值更接近 1500 億美元。

上週又有媒體稱,Anthropic 正進行 Iconiq Capital 主導的新一輪融資相關磋商,擬融資 30 億至 50 億美元,使公司估值達到 1700 億美元。另有媒體稱,到 7 月末,Anthropic 的年化收入已增至約 50 億美元。該司預計,到今年年底,其經常性收入可能達到 90 億美元。

Anthropic 的新融資消息凸顯了市場對頭部 AI 公司未來增長的極高預期,尤其是對 Anthropic 在 AI 編碼這一應用領域的強大變現能力方面。