研究证实：AI 大模型跨多轮对话任务表现不佳，性能最高降 39%

2026-03-01 09:22:40 来源：IT之家 A+A-

更新后的模型表现有所改善，性能降幅从39%减少到33%，但问题依然存在。在Python任务中，部分模型的性能损失仅在10%到20%之间。然而，拉班指出，在实际使用场景中，性能损失可能会更严重，因为测试只采用了简单的用户模拟。如果用户在对话过程中改变想法，性能下降可能更为明显。

研究发现，通过调低温度值等技术微调并不能有效解决这一问题。研究人员建议，遇到异常情况时，应重新开启一段新对话，并让模型先总结之前的请求，再基于这份总结继续新的对话。

热点推送

开启 6G 序章：华为发布 U6GHz 系列产品提升 5G-A 能力，覆盖宏站、小站及微波等完整矩阵

华为在西班牙巴塞罗那举行的世界移动通信大会期间，正式发布了覆盖全场景的U6GHz系列化产品与解决方案
2026-03-01华为，MWC26，5GA
AOC 22B35HM2 办公显示器开售：21.5 英寸 1080P 120Hz VA 面板，429 元

AOC 22B35HM2 办公显示器现已开售，售价为429元。这款显示器搭载了21.5英寸1080P 120Hz VA面板，原生刷新率为100Hz，可超频至120Hz
2026-03-01AOC，22B35HM2，办公显示器
研究证实：AI 大模型跨多轮对话任务表现不佳，性能最高降 39%

更新后的模型表现有所改善，性能降幅从39%减少到33%，但问题依然存在。在Python任务中，部分模型的性能损失仅在10%到20%之间。然而，拉班指出，在实际使用场景中，性能损失可能会更严重，因为测试只采用了简单的用户模拟
2026-03-01大语言模型，AI，人工智能
蔚来乐道三月加推购置税全兜底政策，同享 7 年超低息

蔚来旗下乐道汽车宣布，三月将推出购置税全兜底政策，最高补贴可达10262元，并提供7年超低息贷款，日供低至69元。对于乐道L60车型，整车购买时购置税补贴最高可达8156元
2026-03-01乐道汽车，蔚来
红魔 MWC 2026 亮点抢先看，含散热器 8 Pro、品牌首款开放式头戴电竞耳机等

红魔游戏手机产品总经理姜超提前公布了红魔在MWC 2026的亮点。届时，红魔电竞装备将集体亮相，展台位于巴塞罗那Fira Gran Via 3号馆3F30展位
2026-03-01红魔，MWC，2026
马斯克最新大胆构想：借助 AI 与机器人解决美国债务危机

自从ChatGPT在2022年问世后，人工智能迅速被视为医疗、农业、能源等各领域的万能工具。埃隆·马斯克则认为，AI与机器人技术本身才是解决美国债务危机的关键
2026-03-01机器人，人工智能，马斯克
首维 Shoei 推出全球首款“AR 头盔”：自带 HUD 能显示车速及导航信息

12月1日，日本头盔制造巨头Shoei与法国科技公司EyeLights合作推出了一款名为GT-Air 3 Smart的AR头盔
2026-03-01智能头盔，增强现实，AR头盔
消息称某厂旗舰产品线 s 迭代测试 7K 大电池：争取 2026 Q1 发布，预计为 vivo X300s

博主 @智慧皮卡丘在微博上透露了某厂旗舰产品线的最新动向。该系列机型正在测试7000mAh级别的大电池，预计在2026年第一季度发布。有用户在评论区询问17U是否有独家技术，博主回复称一英寸是最强的点
2026-03-01vivo，X300s，7000mAh
消息称“动力电池老大”宁德时代基层员工月薪上调 150 元

宁德时代发布了一项涨薪通知，旨在更好地吸引和保留新老员工，提升工作效率和产品品质，从而增强公司竞争力。从2026年1月1日起，该政策将对1-6职级的员工进行薪资调整。具体来说，JG1-6基本工资上调150元，其他薪资结构及标准保持不变
2026-03-01员工，宁德时代，涨薪
开发板、笔记本、NAS，多款终端亮相此芯科技 2025 生态大会

11月27日，此芯科技CIX在上海举办了以“万物共芯生生不息”为主题的2025生态大会。会上，各合作伙伴发布了基于此芯P1平台的多款硬件产品。迅龙软件推出了两款新的香橙派产品
2026-03-01此芯
小米电动滑板车 6 Ultra 海外发布：峰值功率 1200W，12 英寸全地形轮胎

在MWC 2026前夕，Xiaomi 17 Series全球发布会在西班牙巴塞罗那举行。小米电动滑板车6 Ultra也在此次活动中正式亮相
2026-03-01MWC，2026，小米电动滑板车
IT之家图赏小米 17 Ultra 徕卡海外版“LEITZPHONE”实拍：差异化后盖设计，香槟金边框

小米在MWC 2026发布会上推出了17 Ultra徕卡海外版“LEITZPHONE”。这款手机与国内版本相比，在后盖样式、Logo方向等细节上有所不同。发布会现场提供了实拍图赏，让观众第一时间体验到新机
2026-03-01小米，17，Ultra
AMD 锐龙 5 5500X3D 处理器上架：1119 元，6 核 Zen 3 + 99MB 高速缓存

AMD锐龙5 5500X3D处理器已在京东上架，售价1119元。目前显示为无货状态，推荐搭配X570、B550及A520主板使用
2026-03-01锐龙，5，5500X3D
印度 IT 行业年收入首超 3000 亿美元但正被 AI“抢饭碗”：头部企业裁员、毕业生就业率严重下滑

印度IT信息技术产业近期迈过了一个重要门槛。根据印度国家软件与服务公司协会2月24日发布的预测数据，在当前财年（截至今年3月31日），印度IT产业的总收入预计将首次突破3000亿美元大关，达到3150亿美元，同比增长6.1%
2026-03-01Nasscom
因在预测市场 Polymarket 使用机密信息，OpenAI 解雇一员工

OpenAI 向《连线》杂志证实，公司已解雇一名在预测市场 Polymarket 交易时使用机密信息的员工。这名员工违反了公司规定，禁止利用内部信息谋取个人利益，包括在预测市场的交易
2026-03-01OpenAI，Polymarket
蓝宝石发布黑钻、合金脉动 S 两款 RX 9060 XT 8G 显卡，2749 元起

蓝宝石今日推出了两款全新Radeon RX 9060 XT电竞显卡，分别是黑钻RX 9060 XT 8G D6 OC和合金脉动S RX 9060 XT 8G，售价分别为2999元和2749元
2026-02-28蓝宝石显卡，RX，9060
2026 国际冬季人工智能奥林匹克竞赛闭幕，中国和中国澳门代表队斩获两金一银

当地时间2月27日，2026国际冬季人工智能奥林匹克竞赛在斯洛文尼亚首都卢布尔雅那闭幕。中国和中国澳门代表队取得两金、一银和三项优胜奖的好成绩，主办方对中国选手的表现给予了高度评价和热烈祝贺
2026-02-28国际冬季人工智能奥林匹克竞赛，人工智能
三星 Galaxy A37/A57 手机能效标签曝光：续航猛增，循环寿命调至 1200 次

科技媒体nieuwemobiel通过挖掘欧盟EPREL数据库，发现了三星Galaxy A37和Galaxy A57两款手机的能效标签。Galaxy A57的电池能效评级从B级提升至A级，理论续航时间也从44小时34分钟增加到52小时
2026-02-28Galaxy，A57，Exynos
用时 13 年，大众品牌交付第 200 万辆纯电车型

大众品牌在电动化战略上取得了新的进展，其纯电动车型全球交付量正式突破200万辆。第200万辆新车为ID.3，产自大众茨维考工厂。大众的电动化进程始于2013年，当时推出了e-up!，之后不断扩充纯电产品阵容
2026-02-28大众，新能源汽车
铁路部门继续实行预售期外学生预约购票常态化服务

铁路部门全力服务保障学生旅客出行，加强运输组织，优先分配票额，实行优惠票价，强化站车服务引导，较好地满足了学生旅客购票出行需求，助力平安有序返校。继续实行预售期外学生预约购票常态化服务
2026-02-28中国铁路，12306
振华 LEADEX T1700W 钛金全模电源开售：双 12V-2x6 接口、140mm 双滚珠风扇，3999 元

振华现已为旗下LEADEX电源新增一款1700W版本（LEADEX T1700W），定价为3999元，提供十年质保
2026-02-28振华，LEADEX，T1700W
曝 OpenAI 正向多家企业推介使用 ChatGPT 登录：可将 API 成本转嫁用户，无形扩大影响力

据报道，OpenAI 正在向多家企业推介“使用 ChatGPT 登录”功能。这一功能允许用户直接使用 ChatGPT 账号登录第三方网站，类似于“使用 Google 登录”或“使用 Apple 账号登录”
2026-02-28ChatGPT，OpenAI
比亚迪腾势 N8L 汽车安全配置细节公布：9 个安全气囊、4 层热成型钢 A 柱，10 月 28 日上市

比亚迪腾势汽车官方发布了“腾势问答第七期”，解答了关于腾势N8L的相关问题，并公布了该车的安全配置细节。腾势N8L配备了9个安全气囊，A柱采用了4层热成型钢，支持高速爆胎不失控、高速紧急避让不怕侧翻、雨雪湿滑路面开得稳不打滑等特性
2026-02-28比亚迪，腾势，N8L
realme 真我 GT8 Pro 搭载全腔对称式双 1115E 大师级扬声器，号称低音音质表现最好的手机之一

真我手机官方近日继续预热旗下GT8 Pro旗舰新机。这款手机采用双1115E全腔扬声器结构，搭载0816瑞声顶级马达，并通过了IP69、IP68和IP66三重认证。此外，该机还配备了超声波指纹解锁功能，支持n79频段及全球21个5G频段
2026-02-28真我，GT8，Pro
英伟达 CEO 黄仁勋将出席亚太经合组织 CEO 峰会，计划与全球领导人和韩企高管见面

美国人工智能芯片制造商英伟达宣布，公司首席执行官黄仁勋将于本月出席在韩国举行的亚太经合组织企业领袖峰会，并计划与全球领导人及韩国顶尖企业高管会面
2026-02-28黄仁勋，英伟达，APEC峰会
首搭美光 GDDR7 显存，影驰 RTX 5060 显卡拆解曝光

持续的 DRAM 短缺严重影响了硬件市场。最新迹象显示，英伟达正试图拓展更多存储芯片供应商
2026-02-28影驰，RTX，5060
俄罗斯联邦通信监督局称其官网及国防部网站遭 DDoS 网络攻击

据报道，俄罗斯联邦通信、信息技术和大众传媒监督局表示，其官网以及俄罗斯国防部的网络资源正在遭受分布式拒绝服务攻击
2026-02-28俄罗斯国防部，DDoS，网络攻击
HMD 推出 4G 新机 Luma：紫光展锐 T615 处理器、3.5mm 耳机孔、SD 卡槽

HMD推出了一款名为Luma的新款智能手机。这款手机搭载了紫光展锐T615处理器，基于12nm工艺，采用Cortex-A75和Cortex-A55核心架构
2026-02-28hmd
ChatGPT 成人模式“Naughty Chat”代码现身新版客户端，需进行身份验证

AI聊天机器人正逐渐改变人们的生活。随着技术的进步，这些工具不仅能够处理日常事务，还开始满足用户的情感需求，许多人将ChatGPT等工具视为挚友或恋爱对象。最近，OpenAI下架了GPT-4o模型，引起了部分用户的不满
2026-02-28ChatGPT，OpenAI，萨姆
疑似 Vision GT 概念超跑现身后，小米宣布 MWC 2026 还有 One more thing

北京时间2月27日晚间，小米通过官方X账号宣布，在西班牙当地时间2月28日14时的发布会上将有“One more thing”。该账号还发布了一张形似汽车轮廓的预告图
2026-02-28小米汽车，MWC，2026