OpenAI今日发布了GPT-5.4系列模型,包括面向ChatGPT和API的GPT-5.4 Thinking版本以及面向复杂任务的GPT-5.4 Pro版本。这是首次将前沿推理、编码和智能体能力整合至单一模型中,旨在提升专业工作的效率和准确性。

在ChatGPT中,GPT-5.4 Thinking新增“思考过程预览”功能,处理复杂查询时预先展示推理思路,用户可以实时调整方向,减少沟通次数,更快获得满意结果。此功能已在网页版和Android应用上线,iOS版本即将推出。新模型还增强了深度网络研究能力,特别是在处理高度具体的查询时,能够更好地保持长上下文连贯性。对于需要较长时间思考的问题,GPT-5.4 Thinking可维持对对话前序步骤的更强意识,确保答案在整个过程中保持相关性和连贯性。

Codex和API层面,GPT-5.4是首个具备原生计算机使用能力的通用模型,支持通过截图和键盘鼠标指令操作计算机,完成跨应用的复杂工作流程。GPT-5.4系列模型支持高达100万tokens的上下文窗口,使智能体能够规划、执行和验证长周期任务。

GPT-5.4在专业工作领域实现了大幅突破。在测试的44个职业领域的GDPval基准中,GPT-5.4在83.0%项目上达到或超过行业专业水平,而前代GPT-5.2为70.9%。内部投行级电子表格建模任务测试中,GPT-5.4平均得分为87.3%,远高于GPT-5.2的68.4%。演示文稿评估中,评审者更偏好GPT-5.4生成的演示文稿,主要优势在于更强的美学设计、更丰富的视觉变化以及更有效的图像生成运用。在减少错误方面,GPT-5.4单个陈述的错误率降低33%,完整回答中出现任一错误的可能性降低18%。

GPT-5.4在计算机使用基准测试中表现优异,在OSWorld-Verified基准(通过截图和键盘鼠标操作PC桌面环境)上实现75.0%的成功率,远超GPT-5.2的47.3%,甚至超过人类表现(72.4%)。WebArena-Verified浏览器使用测试中,GPT-5.4结合DOM和截图驱动交互时成功率达67.3%;Online-Mind2Web测试中,仅凭观察截图即可实现92.8%的成功率。视觉感知能力方面,GPT-5.4在MMMU-Pro视觉理解与推理测试中取得81.2%的成功率,优于GPT-5.2的79.5%。OmniDocBench文档解析测试中,GPT-5.4的平均错误率降至0.109。

GPT-5.4融合了GPT-5.3-Codex的编码优势,在SWE-Bench Pro基准上与之持平或表现更优,同时延迟更低。Codex中的“/fast”模式可提升1.5倍token速度,保持同等智能水平。“工具搜索”功能使该系列模型高效处理各种工具,在Scale的MCP Atlas基准测试中,启用工具搜索后,在保持相同准确率的前提下,总token消耗量减少47%。GPT-5.4在网络搜索能力上也得到增强,在BrowseComp基准上性能较GPT-5.2提升了17个百分点,GPT-5.4 Pro更是创下了89.3%的新高。

GPT-5.4延续了GPT-5.3-Codex的安全防护措施,并引入新的开源评估“CoT可控性”,测试发现GPT-5.4 Thinking控制其思维链的能力较低,有利于安全监控。定价方面,GPT-5.4 API每token价格高于GPT-5.2,但更高的token效率可降低许多任务的总token消耗。批量处理和Flex定价为标准API费率的一半,优先处理为两倍。

GPT-5.4 Thinking即日起面向ChatGPT Plus、Team和Pro用户开放,取代GPT-5.2 Thinking。GPT-5.2 Thinking将在模型选择器的“遗留模型”部分保留三个月,直至2026年6月5日退役。Enterprise和Edu计划用户可通过管理员设置启用早期访问。GPT-5.4 Pro面向Pro和Enterprise计划用户开放。API中,GPT-5.4将以gpt-5.4名称提供支持,GPT-5.4 Pro则以gpt-5.4-pro名称提供给需要极致性能的开发者;Codex中的GPT-5.4支持1M上下文窗口的实验性功能。




近日,美国加利福尼亚州总检察长罗伯・邦塔和特拉华州总检察长凯西・詹宁斯会见了OpenAI,并向公司发出公开信,表达了对ChatGPT安全性的担忧,特别是针对儿童和青少年的使用风险
2026-04-17OpenAI,人工智能,AI安全近期,各手机厂商纷纷预热并发布新系统。小米在8月底推出了澎湃HyperOS 3系统,随后OPPO、vivo和荣耀也将分别推出ColorOS 16、OriginOS 6和MagicOS 10.0系统
2026-04-17荣耀,MagicOS,109月7日,一款搭载英特尔酷睿Ultra 5 245HX处理器的戴尔移动工作站Dell Pro Max 16 Plus出现在了Geekbench的AI跑分数据库中,预示着这款产品即将上市
2026-04-17英特尔,酷睿,处理器9月7日,据ComputerBase报道,AMD芯片技术总监在2025年柏林国际电子消费品展览会(IFA)期间接受采访时表示,Arm架构并不比x86能效更高。 谈到能效时,经典的Arm与x86架构之争再次浮现
2026-04-17AMD,Arm,架构
TCOMAS 钛钽旗下的幻世 NEOX 360 一体式水冷散热器已在京东上架,提供黑白双色选择,售价均为1599元
2026-04-17幻世,NEOX,360台积电在财报电话会议上回应了与英特尔EMIB封装方案的竞争挑战。董事长魏哲家表示,凭借其最大光罩尺寸封装方案与SoIC技术,台积电有信心为客户提供最优选择
2026-04-17台积电,英特尔,半导体
据报道,苹果iPhone 18 Pro系列的核心影像组件——可变光圈致动器已进入量产阶段。中国舜宇光学已经开始生产致动器,而LG Innotech也在韩国龟尾工厂部署了专用设备,为大规模量产做准备
2026-04-17iPhone,18,Pro
4月17日,OpenAI更新了Codex AI编程助手,新增了Mac桌面应用操作能力,支持多智能体并行运行和长期任务执行。 此次更新中,Codex AI编程助手获得了操作Mac桌面应用的能力
2026-04-17OpenAI,Codex,AI
奔驰在北京时间4月17日凌晨提前公布了即将于4月20日正式发布的全新纯电C级的内饰设计。其核心亮点是横贯中控台的MBUX Hyperscreen超联屏,整体布局与GLC纯电版保持一致
2026-04-17奔驰,奔驰C级
4月17日,卡普空开发的全新科幻动作冒险游戏《识质存在》正式发售。这款游戏最初公布于2020年6月,历经多次跳票后终于在2026年与玩家见面。 作为卡普空的新IP,《识质存在》获得了国内外主流游戏媒体的好评
2026-04-17英伟达,卡普空,DLSS
4月16日,荣耀通过一场打破常规的“史上最短发布会”,正式推出了MagicBook 14 | 16系列2026款轻薄本。发布会全程聚焦产品核心价值,荣耀高管林林用两句金句为新品定调:“没有标准杯,全是超大杯”“全部都大满贯”
2026-04-17荣耀笔记本,MagicBook
4月16日,英特尔正式发布了代号为“Wildcat Lake”的酷睿300系列处理器。该系列产品与酷睿Ultra 300 "Panther Lake"共享架构基础,但规模更小,适用于入门级PC设备
2026-04-17英特尔,处理器
Anthropic于4月16日发布了最新的人工智能模型Claude Opus 4.7,距离上一次模型升级仅两个月。新版本在高级软件开发能力方面有了显著提升,特别是在处理高难度编码任务时所需的人工监督大大减少
2026-04-17Anthropic,Claude,Code
路虎揽胜 SV 马年高定版发布,基于 SV 系列高性能定制平台打造。该车将中国传统生肖文化融入顶级豪华 SUV 设计,全球限量发售仅 3 台
2026-04-17路虎揽胜SV,路虎揽胜,路虎
科大讯飞宣布将于4月23日19:00推出一款AINOTE2蝉翼墨水屏平板。该机厚度为4.2毫米,重量仅为295克,号称是“世界最薄墨水屏平板”。预计定价为3999元
2026-04-16讯飞星火大模型,科大讯飞,AINOTE29月8日,据外媒Carscoops报道,大众Cupra在慕尼黑车展上公布了即将推出的Raval更多信息,并展示了伪装车的预告图。这款纯电动小型掀背车预计将于2026年正式上市
2026-04-16大众,Cupra工信部部长李乐成在国新办举行的“高质量完成‘十四五’规划”系列主题新闻发布会上表示,2020年至2024年间,我国全部工业增加值从31.3万亿元增长到40.5万亿元,制造业增加值从26.6万亿元增长到33.6万亿元
2026-04-16中国制造业,李乐成,5G魅族官方于9月9日预热了其22手机的屏幕规格,目标是打造“6.3英寸最佳观感屏幕”。这款手机将配备1.5K高刷无界屏,支持1-120Hz自适应刷新率,采用8T-LIPO材质
2026-04-16骁龙,8s,小至尊平台酷凛ID-COOLING在其全球官网上线了SE-904-XT BLACK风冷散热器。这款产品高度为123mm,采用10025小直径风扇,解热能力标称为180W TDP
2026-04-16酷凛,风冷散热器
高等教育专业评价机构软科今日正式发布了“2026 软科中国大学排名”。在主榜(即综合性大学排名)中,清华大学、北京大学和浙江大学分别位列前三
2026-04-16软科中国大学,大学排名,清华大学
罗技推出了Alto Keys琥珀K98M和K98S Plus机械键盘,售价分别为399元和499元。新款键盘为此前仅能充电的USB-C接口增加了数据传输功能,支持1kHz回报率有线连接
2026-04-16键盘,罗技
科技透明度项目(TTP)发布报告称,尽管苹果App Store和谷歌Play Store禁止“脱衣”应用,但其搜索及广告系统却主动向用户推荐相关应用
2026-04-16App,Store,Play
宝马中国宣布,2026 BMW品牌之夜将于4月22日举行,届时将带来三大全球首发车型。活动与BMW新世代车型有关,包括首创驾控超级大脑、全景iDrive、第六代eDrive电驱系统以及智能辅助驾驶等技术,旨在让电动车回归驾驶的本能
2026-04-16BMW,品牌之夜,宝马
4月15日,领英全球事务与法务负责人布莱克·洛维特在Semafor世界经济峰会上表示,自2022年以来,招聘规模下降约20%,但这一变化并非由AI驱动。领英拥有覆盖超过10亿用户的经济图谱,可以实时观察劳动力市场的变化
2026-04-16人工智能,AI求职,AI职场
Snapchat母公司Snap宣布了一系列人事变动,将在全公司范围内裁撤约1000个岗位,影响约16%的全职员工。同时,公司将关闭300多个空缺职位
2026-04-16Snap,裁员
统信软件今日正式发布了统信桌面操作系统V25,推出跨端全天候智能助手Uclaw,支持在电脑上操作手机
2026-04-16LoongArch,龙芯中科,统信
苹果公司为了追赶AI竞争对手,安排近200名Siri工程师参加为期数周的AI编程训练营。这些工程师将学习使用Claude Code等工具辅助开发,以增强iOS 27版Siri的竞争实力
2026-04-16iPhone,Siri,苹果
谷歌于4月15日推出了Mac原生版Gemini应用,该应用完全采用Swift开发,支持Option + Space快捷键唤起、屏幕共享及多语音播报。这款应用要求macOS 15 Sequoia或更高版本系统,现已可供Mac用户下载使用
2026-04-16Gemini,AI在人工智能与智能制造深度融合的新时代浪潮中,天津大学管理与经济学部优秀学者、天津展毅呈科技发展有限公司创始人兼总经理李文思,立足非标自动化产业一线的丰富实践经验
2026-04-15融智研思筑根基 产学互促启新篇 李文思以学术创新赋能智能制造高质量发展
随着汽车进入以软件定义竞争力的时代,比亚迪等中国车企正通过高频OTA更新建立优势,希望延长车辆生命周期,并探索新的收入来源。软件定义汽车的概念意味着购车后仍可通过软件持续提升性能,这已成为车企竞争力的关键
2026-04-15汽车OTA,比亚迪,特斯拉