当前位置:数智频道首页 > 人工智能 > 正文

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

阿里通义千问今日宣布正式推出 Qwen3-235B-A22B-Thinking-2507 思考模型升级版本。自千问 3 旗舰模型发布后,团队持续提升大模型的推理性能。新发布的 Qwen3-235B-A22B-Thinking-2507 在推理性能和通用能力上实现了巨大飞跃,可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型,并创下全球开源模型的最佳性能表现。

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

在编程(如 LiveCodeBench)、数学(如 AIME25)等核心能力上,Qwen3 推理模型取得了新的突破;在知识(如 SuperGPQA)、创意写作能力(如 WritingBench)、人类偏好对齐(如 Arena-Hard v2)、多语言能力(如 MultilF)等方面也有了显著进步。此外,新模型支持 256K 长文本理解,能够轻松处理超长上下文。

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

热点推送

本周关注

MORE