OpenAI今日发布了GPT-5.4系列模型,包括面向ChatGPT和API的GPT-5.4 Thinking版本以及面向复杂任务的GPT-5.4 Pro版本。这是首次将前沿推理、编码和智能体能力整合至单一模型中,旨在提升专业工作的效率和准确性。

在ChatGPT中,GPT-5.4 Thinking新增“思考过程预览”功能,处理复杂查询时预先展示推理思路,用户可以实时调整方向,减少沟通次数,更快获得满意结果。此功能已在网页版和Android应用上线,iOS版本即将推出。新模型还增强了深度网络研究能力,特别是在处理高度具体的查询时,能够更好地保持长上下文连贯性。对于需要较长时间思考的问题,GPT-5.4 Thinking可维持对对话前序步骤的更强意识,确保答案在整个过程中保持相关性和连贯性。

Codex和API层面,GPT-5.4是首个具备原生计算机使用能力的通用模型,支持通过截图和键盘鼠标指令操作计算机,完成跨应用的复杂工作流程。GPT-5.4系列模型支持高达100万tokens的上下文窗口,使智能体能够规划、执行和验证长周期任务。

GPT-5.4在专业工作领域实现了大幅突破。在测试的44个职业领域的GDPval基准中,GPT-5.4在83.0%项目上达到或超过行业专业水平,而前代GPT-5.2为70.9%。内部投行级电子表格建模任务测试中,GPT-5.4平均得分为87.3%,远高于GPT-5.2的68.4%。演示文稿评估中,评审者更偏好GPT-5.4生成的演示文稿,主要优势在于更强的美学设计、更丰富的视觉变化以及更有效的图像生成运用。在减少错误方面,GPT-5.4单个陈述的错误率降低33%,完整回答中出现任一错误的可能性降低18%。

GPT-5.4在计算机使用基准测试中表现优异,在OSWorld-Verified基准(通过截图和键盘鼠标操作PC桌面环境)上实现75.0%的成功率,远超GPT-5.2的47.3%,甚至超过人类表现(72.4%)。WebArena-Verified浏览器使用测试中,GPT-5.4结合DOM和截图驱动交互时成功率达67.3%;Online-Mind2Web测试中,仅凭观察截图即可实现92.8%的成功率。视觉感知能力方面,GPT-5.4在MMMU-Pro视觉理解与推理测试中取得81.2%的成功率,优于GPT-5.2的79.5%。OmniDocBench文档解析测试中,GPT-5.4的平均错误率降至0.109。

GPT-5.4融合了GPT-5.3-Codex的编码优势,在SWE-Bench Pro基准上与之持平或表现更优,同时延迟更低。Codex中的“/fast”模式可提升1.5倍token速度,保持同等智能水平。“工具搜索”功能使该系列模型高效处理各种工具,在Scale的MCP Atlas基准测试中,启用工具搜索后,在保持相同准确率的前提下,总token消耗量减少47%。GPT-5.4在网络搜索能力上也得到增强,在BrowseComp基准上性能较GPT-5.2提升了17个百分点,GPT-5.4 Pro更是创下了89.3%的新高。

GPT-5.4延续了GPT-5.3-Codex的安全防护措施,并引入新的开源评估“CoT可控性”,测试发现GPT-5.4 Thinking控制其思维链的能力较低,有利于安全监控。定价方面,GPT-5.4 API每token价格高于GPT-5.2,但更高的token效率可降低许多任务的总token消耗。批量处理和Flex定价为标准API费率的一半,优先处理为两倍。

GPT-5.4 Thinking即日起面向ChatGPT Plus、Team和Pro用户开放,取代GPT-5.2 Thinking。GPT-5.2 Thinking将在模型选择器的“遗留模型”部分保留三个月,直至2026年6月5日退役。Enterprise和Edu计划用户可通过管理员设置启用早期访问。GPT-5.4 Pro面向Pro和Enterprise计划用户开放。API中,GPT-5.4将以gpt-5.4名称提供支持,GPT-5.4 Pro则以gpt-5.4-pro名称提供给需要极致性能的开发者;Codex中的GPT-5.4支持1M上下文窗口的实验性功能。




海盗船推出了FRAME 5000D WORKSTATION,这是其面向一般PC DIY玩家的FRAME 5000D机箱的工作站版本。新版本在保持原有尺寸的基础上,对硬件兼容性进行了调整,以更好地满足生产力系统的需求
2026-03-06海盗船,机箱
Anthropic 首席执行官达里奥·阿莫迪已重启与美国国防部的谈判,商讨其人工智能模型在美国军方中的使用方式
2026-03-06Anthropic,人工智能,美国国防部
第九代大众高尔夫的首张官方预告图正式亮相,由德国工会 IG Metall 发布,并在当地时间周三的一次员工会议上向大众员工展示。大众在会议上确认,高尔夫车型未来仍将在沃尔夫斯堡工厂生产
2026-03-06大众,大众高尔夫华为在MWC26巴塞罗那期间获得了八项重要的GLOMO奖项,包括“最佳移动网络基础设施奖”和“最佳非地面网络方案”。这些奖项由全球通信行业顶尖专家组成的评审团评选,旨在表彰在移动技术、创新应用和产业发展中做出杰出贡献的企业和个人
2026-03-06华为,MWC26,GLOMO
美联航更新了其运输条款,新增了一项规定:乘客在航班上收听音频或观看视频时必须佩戴耳机。根据The Verge的报道,如果乘客违反这项规定,美联航有权暂时或永久拒绝该乘客搭乘航班,并且可以在任何时候将违规乘客请下飞机
2026-03-06美联航,运输条款
英伟达此前复产的GeForce RTX 3060显卡即将进入市场。各品牌厂商的RTX 3060系列预计在3月10日至3月20日期间陆续到货,不同品牌的到货时间会有些许差异
2026-03-06英伟达,显卡,RTX
OpenAI今日发布了GPT-5.4系列模型,包括面向ChatGPT和API的GPT-5.4 Thinking版本以及面向复杂任务的GPT-5.4 Pro版本
2026-03-06openai,GPT5.4,OpenAI
在比亚迪二代刀片电池暨闪充技术发布会上,公司推出了2026款仰望U7、U8和U8L鼎世版车型。这些新车均搭载了第二代刀片电池及闪充技术,售价分别为65.8万元起、100.8万元起、130万元起
2026-03-06比亚迪,刀片电池,仰望U8
Netflix 放弃了收购华纳兄弟探索公司的计划,转而收购好莱坞影星本·阿弗莱克创立的AI影视技术公司InterPositive
2026-03-06Netflix,华纳兄弟
荣耀在马来西亚市场推出了600 Lite手机,定位中端市场。这款手机搭载了6.6英寸1080P AMOLED屏幕,峰值亮度可达6500尼特,刷新率为120Hz
2026-03-06天玑,7100,Elite
欧洲空间局、荷兰应用科学研究组织与德国有效载荷制造商泰萨特成功搭建了全球首条飞机与地球同步卫星间的吉比特级激光通信链路。试验实现了2.6 Gbps的零误码传输,并持续了数分钟
2026-03-06激光通信链路,激光通信据报道,OpenAI 正在开发一种新的语音模型,旨在让用户与ChatGPT的对话更加自然。当前,ChatGPT的高级语音模式采用回合式对话机制,用户必须先说完话,AI才会处理语音并生成回答
2026-03-06OpenAI,BiDi,ChatGPT根据DigiTimes最新公布的市场数据,2026年2月存储现货价格整体上涨,其中NAND闪存晶圆价格涨幅最大。随着存储需求与供应之间的缺口不断扩大,现货价格迅速上升,采购资金压力也在增加。如果这一趋势持续,行业甚至可能面临周期性崩溃
2026-03-06NAND,闪存
今天晚间,吉利银河通过官方公众号宣布,全球首款四驱中级电混轿车——星耀 7“颠覆而来”。 这款新车早在去年10月就已经在工信部第400批《道路机动车辆生产企业及产品公告》新产品公示中亮相
2026-03-06吉利银河,吉利银河星耀7
埃隆·马斯克承认,在他以440亿美元收购推特的诉讼中,那条引发争议的推文“或许不是我最明智的举动”。这位全球首富正在法庭上为自己辩护,否认操纵市场的指控。 马斯克在旧金山对陪审团表示,他在收购争夺战期间发布的帖子并非意在操纵推特股价
2026-03-06马斯克,推特
云鲸逍遥003洗地机器人于昨日发布并开启预售,京东平台新品首发价5199元起,将于3月23日现货首发。 这款新品定位为“全智能高端自维护洗地机器人”,搭载双目视觉感知技术和VLM万物识别大模型,支持毫米级高精度避障
2026-03-05云鲸逍遥,003,洗地机器人3月2日,在MWC 2026巴塞罗那期间的移动AI产业峰会上,华为与中国移动联合发布了2025年度高阶示范区AI+网络的实践成果。中国移动已建成全球最大规模5G/5G-A网络,拥有超277万5G基站、5G用户超6亿、5G人口覆盖率达96%
2026-03-05华为,中国移动,5G
在全国两会期间,TCL创始人、董事长李东生就先进制造业融资、光伏产业“反内卷”及扩大内需等议题提出了建议。他指出,中国先进制造企业在资本实力方面相对薄弱,资本市场融资受限,因此提议加强资本市场对这些企业的支持,持续疏通融资渠道
2026-03-05TCL,李东生
在昨天的鸿蒙智行技术焕新发布会上,华为常务董事、产品投资评审委员会主任、终端BG董事长余承东宣布了尚界Z7车型,称其为“鸿蒙智行最年轻的车”。他还提到,这款轿跑将首发随动四维屏,并配备灵感橱窗这一配置
2026-03-05尚界,Z7,鸿蒙智行
Omdia发布的最新研究报告显示,2025年欧洲智能手机市场出货量下降1%,至1.342亿部。这一变化受到需求低迷及环保设计和USB-C新规的影响。 三星依然是欧洲最大的智能手机厂商,出货量小幅增长至4660万部
2026-03-05Omdia,苹果,iPhone
毒蝰 Viper V4 PRO 专业版是雷蛇即将推出的高阶鼠标,此前已多次以伪装版的身份出现在电子竞技赛场上。X 平台用户 jakeu+ 北京时间昨日曝光了该鼠标白色款的外包装盒,显示这一型号接近发售
2026-03-05雷蛇,鼠标
腾讯混元于10月22日宣布,正式发布并开源了混元世界模型1.1版本(WorldMirror)。新版本新增支持多视图及视频输入,单卡即可部署,能在几秒钟内创建3D世界
2026-03-05混元世界模型,腾讯混元
2025年10月16日,第36届长城心脏病学大会如期举行。作为亚洲乃至全球心血管领域的顶级学术交流平台,大会始终以权威视角引领心脏病学研究与临床实践的未来方向。 本届大会上,华为运动健康的表现引人注目
2026-03-05华为运动健康
本田技研工业(中国)投资有限公司与东风汽车集团股份有限公司宣布启动氢燃料电池商用车的社会示范运行。此次合作将通过双方的合资企业——武汉东本储运有限公司,在武汉市现有物流配送线路上展开示范运行,并计划逐步扩展到广州、上海等地区
2026-03-05本田,东风汽车,氢燃料电池
10月22日,小米集团合伙人、总裁卢伟冰在接受采访时谈到了自研芯片对小米未来发展的重要性。他认为,未来的手机品牌可以分为两类:有自研芯片和没有自研芯片
2026-03-05卢伟冰,小米,玄戒
微星今日发布了配备英特尔酷睿 100U "Raptor Lake-U" 处理器的商用/生产力迷你主机Cubi 5 1M。这款主机体积仅为0.83L,内置一个2.5英寸硬盘位
2026-03-05微星,迷你主机
今天晚间,莲花发布了Eletre SUV的插混版本“FOR ME”。新车基于LTS(Lotus Tuned Specification)“莲花工程专属调校”标准打造,是中国市场首款超混架构车型,预计于3月底在中国上市,并在年中登陆欧洲市场
2026-03-05莲花汽车,FOR,ME
苹果今天发布了平价 MacBook Neo 笔记本,配备 13 英寸 Liquid 视网膜显示屏,起售价为 4599 元
2026-03-05MacBook,Neo,USBC
加纳部分城市正式启动了该国首个5G网络,为当地运营商推出超高速移动通信服务奠定了基础。共享网络运营商Next Gen InfraCo拥有在加纳建设和提供5G网络的独家许可
2026-03-05加纳,5g网络
前几年,提到QLC固态硬盘时,人们常常感到担忧。然而,随着技术进步和价格调整,对许多用户来说,QLC固态硬盘现在成为了一个更合适的选择。购买笔记本并加装固态硬盘变得更加务实,因为消费者希望在支付更高价格的同时获得更好的性能
2026-03-05铠侠,VC10,固态硬盘