当前位置:数智频道首页 > 人工智能 > 正文

OpenAI深夜发布"超级智能体",AI"打工人"时代降临(4)

模型认为自己像一个“告密者”一样行事,但实际上,可能会损害用户的隐私、安全和专有信息,并向当局报告不存在的不当行为,或者只是可疑的行为。

简化工作流程,或与微软直接竞争

ChatGPT智能体能够创建PPT演示文稿和详细的Excel草稿,之后用户可以使用MicrosoftOffice或其他兼容软件对其进行编辑。OpenAI指出,相较于其他功能,这一功能更具创新性,有助于大幅减少用户在制作PPT和分析报告时所需的时间,将通常需要几个小时或几天的工作缩短到三十分钟内。

尽管如此,ChatGPT智能体功能使OpenAI在某种程度上直接与商业软件巨头微软展开竞争,这可能加剧两家公司之间的紧张关系,毕竟双方的竞争已逐渐升温。

微软也推出了类似的AI智能体,帮助用户创建和编辑PPT演示文稿和Excel电子表格。其他公司也推出了旨在简化PPT和报告制作过程的AI智能体。

OpenAI表示,ChatGPT智能体暂不支持谷歌的Slides和Sheets,二者是谷歌与微软Excel和PPT竞争的产品。

实测性能亮眼,但仍存局限

ChatGPT智能体不仅在理论上表现出色,在实际测试中也达到了很高的水平。在“人类终极考试”中,它通过并行部署方法取得了44.4的高分;在“FrontierMath”基准测试中,准确率达到了27.4%。

在“SpreadsheetBench”基准测试中,ChatGPT智能体得分为45.5%,是Excel中Copilot性能的两倍多。

目前,ChatGPT智能体的部分功能(如幻灯片生成)仍在测试阶段,可能在格式上存在一定差异,或者在应用内预览和导出文件之间有所不同。OpenAI正在积极训练其下一代版本,以提高该功能的完善度和布局。

ChatGPT智能体的推出,标志着用户与AI互动方式的一次范式转变——从单纯提问到全权任务委托。

凭借其强大的推理、执行和交付成果的能力,OpenAI相信,用户越来越希望AI不仅仅是一个辅助工具,而是一个能够为其工作、帮助解决实际问题的助手。虽然这一智能体功能仍在不断发展中,但OpenAI将此次发布视为构建未来互动性更强、更注重行动的AI的基础。(小小)

(责任编辑:卢其龙 CN070)

热点推送

本周关注

MORE