当前位置:数智频道首页 > 人工智能 > 正文

多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型

8月1日,谷歌宣布Gemini 2.5 Deep Think模型正式上线,并在Gemini应用中向Google AI Ultra订阅用户开放。这款新模型在多个关键基准测试中表现优异,超过了OpenAI的o3和xAI的Grok 4。

多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型

今年5月,谷歌在Google I/O大会上首次介绍了Gemini 2.5 Pro的Deep Think模式。该模式采用全新研究方法,可在作答前综合多个假设进行推理。此次发布的版本结合了早期内测用户的反馈和最新研究成果进行了优化,性能相比最初的I/O版本有了显著提升。

多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型

谷歌还提到,这一模型是此前模型的一个变体,曾在国际数学奥林匹克竞赛中获得金牌。为适应日常使用场景,谷歌对其进行了加速优化,因此在2025年IMO基准测试中仅达到铜牌水平。

从基准测试结果来看,Gemini 2.5 Deep Think在LiveCodeBench V6、Humanity’s Last Exam、IMO 2025和AIME 2025等项目中均表现出色。

目前,Google AI Ultra用户每天可以在Gemini应用中以限定次数使用Deep Think功能。当启用Gemini 2.5 Pro模型时,输入栏会显示“Deep Think”选项。该功能将自动集成代码执行和谷歌搜索等工具。谷歌计划在未来几周内通过Gemini API向部分开发者提供带工具与不带工具的Deep Think模型版本。

热点推送

本周关注

MORE