Anthropic releases Claude Opus 4.5, with comprehensive improvements in programming performance

華爾街見聞
2025.11.24 18:54
portai
I'm PortAI, I can summarize articles.

Anthropic 週一發佈旗艦模型 Claude Opus 4.5,在自動化編程、多步驟任務執行和辦公文檔生成方面顯著增強,並將在全線產品中成為默認模型。新模型在 SWE-Bench 等編程評測中成績超過 Google Gemini 3 Pro 與 OpenAI GPT-5.1,被公司稱為 “最智能的工程模型”。

Anthropic 週一推出其旗艦 AI 模型的最新版本 Claude Opus 4.5,稱該模型在軟件工程方面比以往版本更強,能更好地執行自動化編程和辦公任務。分析稱,這是 Anthropic 爭奪企業客户而在與 OpenAI 和谷歌競爭中的又一步動作。

Claude Opus 4.5 是 Anthropic 在兩個月內發佈的第三個重要模型,再次展示了 AI 行業的發展速度之快。該公司在 9 月底推出了 Claude Sonnet 4.5,10 月又發佈了 Claude Haiku 4.5。

Anthropic 表示,Claude Opus 4.5 可以更自主地修復程序錯誤,而不需要用户介入,還被設計成能更好地在用户的電腦和互聯網上執行復雜的多步驟任務。

Anthropic 開發者關係負責人 Alex Albert 對媒體表示:

“在我們真正關注的那些任務中,這是世界上最智能的模型。”

“我們的主題就是以極高的速度推進,並不斷推出我們所能做到的最好的模型。”

Claude Opus 4.5 將在所有地區上線,併成為 Anthropic Pro、Max 和 Enterprise 全線產品的默認模型。

新模型編程能力突出

Anthropic 在博客中表示,這款新模型在廣受歡迎的編程測試集 SWE-Bench Verified 上的得分超過了 Google Gemini 3 Pro 和 OpenAI 的 GPT 5.1。

新模型在處理日常任務方面 “顯著更強”。在 “代理式編程”(agentic coding)方面,Claude Opus 4.5 也達到了行業領先水平,根據軟件能力評測集 SWE-bench Verified 的結果,它的表現優於 Gemini 3 Pro,以及 OpenAI 的 GPT-5.1。

根據 Claude AI 模型產品負責人 Scott White 的説法,Anthropic 的新模型在某種意義上達到了新的編程里程碑。Opus 4.5 是第一款在公司內部一項具有挑戰性的 “居家工程任務” 測試中,得分超過所有公司應聘工程師求職者的模型。White 沒有透露這個任務的具體內容,但表示這是一個需要合格求職者花費數小時完成的測評任務,而且任務本身也會使用 Anthropic 的 Claude 模型。

White 對媒體表示:

“現在,它已經達到一個拐點,我們必須重新思考如何評估軟件工程能力。”

White 表示,Claude Opus 4.5 的理想用户包括專業軟件開發人員、金融分析師、諮詢顧問以及會計師等知識型工作者。他補充説,那些 “渴望提升自身創造力、打造新產品、擴大專業能力範圍” 的用户也會覺得這款模型很有用。

他表示,新模型還能更好地處理金融分析、製作演示文稿和電子表格等任務。此外,Opus 4.5 更適合與用户進行來回協作,不只是簡單生成一個用户再去自行打磨的粗稿。

Anthropic 也將在微軟 Excel 中向企業客户和其高端 Max 訂閲用户提供 Opus 4.5。Excel 中的聊天功能允許用户指示 Claude 聊天機器人執行諸如編輯電子表格等操作。此前,這項功能僅在受邀測試的用户中提供。

其他產品更新

除了模型發佈,Anthropic 週一還宣佈了一系列其他產品和功能更新。

該公司表示,其瀏覽器擴展 Claude for Chrome(可以讓 Claude 在不同瀏覽器標籤頁之間執行操作)將向所有 Max 用户開放。Claude for Excel(能理解並編輯電子表格)也將向所有 Max、Team 和 Enterprise 用户全面開放。

Anthropic 還將 Claude Code 引入桌面應用,併為其開發者平台加入新功能。

企業編程領域模型採用率領先

Anthropic 由前 OpenAI 員工於 2021 年在舊金山創立,目前已有超過 30 萬家企業客户使用其模型來簡化工作流程。尤其是在計算機編程領域,該公司已經成為市場領先者之一。微軟和英偉達上週宣佈對 Anthropic 進行數十億美元投資,使其估值提升至約 3500 億美元。

該公司最知名的產品是一系列名為 Claude 的 AI 模型。它通過不斷增加編號來區分不同代際,但系列裏最大的模型通常稱為 Opus,專為高級推理和複雜問題求解而打造;中等規模的稱為 Sonnet,最小的稱為 Haiku,兩者則主要優化速度和效率。Anthropic 最近一次發佈的 Opus 型號是在 8 月,名為 Claude Opus 4.1。

但 Anthropic 面臨來自 OpenAI 和谷歌的激烈競爭。谷歌上週發佈了 Gemini 3,新模型在編碼等任務上表現更強。

今年 7 月,Menlo Ventures 的報告指出,Anthropic 目前在企業級 AI 採用率方面處於領先,佔據 32% 的市場份額。OpenAI 以 25% 排第二,相比兩年前幾乎腰斬;谷歌為 20%,Meta 以 9% 排第四。