Qwen3 upgraded version, surprises are coming

華爾街見聞
2025.07.21 21:25
portai
I'm PortAI, I can summarize articles.

今天,Qwen3 模型更新為 Qwen3-235B-Instruct-2507-FP8,顯著提升了指令遵循、邏輯推理、文本理解等能力,超越了多款頂級模型。新模型在多語言知識覆蓋、用户偏好契合及長文本理解方面表現出色,已在魔搭社區和 HuggingFace 上開源。風險提示:市場有風險,投資需謹慎。

今天,我們更新了旗艦版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名為 Qwen3-235B-A22B-Instruct-2507-FP8。

新的 Qwen3 模型,通用能力顯著提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在 GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent 能力)等眾多測評中表現出色,超過 Kimi-K2、DeepSeek-V3 等頂級開源模型以及 Claude-Opus4-Non-thinking 等領先閉源模型。

此外,本次更新的 Qwen3 模型,還增強了以下關鍵性能:

-在多語言的長尾知識覆蓋方面,模型取得顯著進步。

-在主觀及開放性任務中,模型顯著增強了對用户偏好的契合能力,能夠提供更有用的回覆,生成更高質量的文本。

-長文本提升到 256K,上下文理解能力進一步增強。

目前,Qwen3 新模型已在魔搭社區和 HuggingFace 上開源更新,歡迎開發者們體驗。

通義千問 Qwen,原文標題:《Qwen3 升級版,驚喜來襲》

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。