当前位置:数智频道首页 > 人工智能 > 正文

Kimi 迄今能力最强开源思考模型,月之暗面 Kimi K2 Thinking 发布

月之暗面今晚推出了Kimi迄今能力最强的开源思考模型——Kimi K2 Thinking。该模型基于“模型即Agent”理念训练,原生掌握了边思考边使用工具的能力。在多项基准测试中,如人类最后的考试、自主网络浏览能力和复杂信息收集推理等方面,Kimi K2 Thinking均达到SOTA水平,并在搜索、编程、写作和综合推理能力上取得全面提升。

Kimi K2 Thinking无需人类干预即可自主实现高达300轮的工具调用和持续稳定的多轮思考,帮助用户解决更复杂的问题。例如,在“人类最后的考试”这项涵盖100多个专业领域的终极封闭式学术测试中,Kimi K2 Thinking取得了44.9%的成绩。官方示例显示,经过5轮搜索和推理,Kimi K2 Thinking结合每轮搜索到的新信息,层层深入,最终推理出答案。

此外,Kimi K2 Thinking在复杂搜索和浏览场景中也表现出色。在OpenAI发布的专门评估AI Agent网络浏览能力的基准测试BrowseComp中,Kimi K2 Thinking以60.2%的成绩成为新的SOTA模型。这一成绩远超人类平均29.2%的成绩,展示了其强大的钻研能力。在长程规划和自主搜索能力驱动下,Kimi K2 Thinking能够通过动态循环不断提出并完善假设、验证证据、进行推理,并构建出逻辑一致的答案。

编码能力方面,Kimi K2 Thinking在多语言软件工程基准测试中的表现也有所提升。通用基础能力方面,Kimi K2 Thinking在创意写作和个人情感回应上均有显著进步。它能将粗略的灵感转化为清晰、动人且意图明确的叙述,同时保持风格连贯性;在回应个人或情感类问题时,Kimi K2 Thinking的回答更加富有同理心,提供细致入微的观点和切实可行的建议。

热点推送

本周关注

MORE