研究人员使用真实的手术录像对谷歌最新视频生成人工智能模型Veo-3进行了测试,发现该模型虽能生成高度逼真的视觉内容,但严重缺乏对医学操作流程的实质性理解。

研究中,研究人员仅提供单张手术图像作为输入,要求Veo-3预测接下来8秒内的手术进展。为系统评估其表现,一支国际研究团队构建了名为SurgVeo的专用评测基准,涵盖50段真实腹腔与脑部手术视频。评估环节由四位经验丰富的外科医生独立完成,从视觉真实性、器械使用合理性、组织反馈表现及操作医学逻辑性四个维度对AI生成视频进行打分(满分5分)。

Veo-3生成的视频初看极具欺骗性,部分外科医生甚至评价其画质“令人震惊地清晰”。然而深入分析后,其内容逻辑迅速崩塌:在腹腔手术测试中,模型在1秒时的视觉合理性尚达3.72分;但一旦涉及医学准确性,得分便大幅下滑——器械操作仅1.78分、组织反应仅1.64分,而最核心的手术逻辑性评分最低,仅为1.61分。模型虽能生成高度拟真的影像,却无法再现真实手术室中应有的操作流程与因果关系。

在对精细度要求极高的神经外科场景中,Veo-3表现更为逊色。自第1秒起,其即难以把握神经外科所需的精准操作:器械使用得分降至2.77分(腹腔手术为3.36分),而8秒后的手术逻辑性评分更是跌至1.13分。
研究团队进一步归类错误类型发现:超过93%的错误源于医学逻辑层面——例如凭空“发明”不存在的手术器械、虚构违反生理规律的组织反应,或执行在临床上毫无意义的操作;而仅极小比例的错误(腹腔手术6.2%、脑部手术2.8%)与图像质量相关。
研究人员尝试为模型提供更多上下文线索(如手术类型、具体操作阶段等),但结果未呈现显著或稳定的改善。团队指出,问题核心在于模型根本缺乏对医学知识的理解与推理能力。
SurgVeo研究表明,当前视频生成AI距离真正的医学理解仍有巨大鸿沟。尽管未来系统或有望用于医生培训、术前规划乃至术中引导,但现有模型远未达到安全、可靠的应用门槛——它们可生成“以假乱真”的影像,却缺乏支撑正确临床决策的知识基础。
研究团队计划将SurgVeo基准数据集开源至GitHub,以推动学界共同提升模型医学理解能力。
研究还警示,在医疗领域,此类AI生成视频用于医学培训存在重大隐患。若Veo-3类系统生成看似合理实则违反医学规范的操作视频,或将误导手术机器人或医学生习得错误技术。
结果表明,当前将视频模型视为“世界模型”的设想仍过于超前。现有系统仅能模仿表观运动与形态变化,却无法可靠掌握解剖结构、生物力学及手术中的因果逻辑。其输出视频虽具表面说服力,实则无法捕捉手术背后真实的生理机制与操作逻辑。
雷神推出了全新一代MIX NUC迷你主机,搭载AMD锐龙AI 9 HX 370移动处理器,提供32GB DDR5内存和1TB SSD存储,新品到手价为6999元,国补后价格为5599.2元
2025-11-13雷神,MIX,NUC
11月11日,小米法国副国家经理在微博上宣布,巴黎首家小米之家即将开业。这家新店将是直营门店。有网友询问之前在香榭丽舍大街是否已有店铺,对此,该经理回应称之前的店铺是由客户开设,因疫情原因暂时退出了市场
2025-11-13小米之家,巴黎
设计师Basic Apple Guy耗时两个多月,为iPhone 17 Pro和iPhone 17 Pro Max创作了内部结构主题壁纸。这些壁纸之所以细节惊人,是因为其素材直接源于苹果官方的维修手册
2025-11-13iPhone,17,Pro
法拉第未来 Faraday Future 宣布,自2026年起推出的新车型将配备NACS(北美充电标准)接口,并可直接接入特斯拉超级充电网络
2025-11-13法拉第未来,特斯拉充电,NACS
明年新赛季揭幕时,奥迪将首次亮相F1赛场。为此,奥迪正式发布了全新的R26概念车,让外界提前一睹奥迪赛车的风采
2025-11-13奥迪,F1
加州一名法官推迟批准Epic与谷歌之间的和解协议,这意味着两家公司关于内购抽成的纷争尚未结束。Epic在2020年起诉谷歌,指控其Android系统的Play商店构成事实性垄断,理由是超过95%的Android应用都通过Play商店分发
2025-11-13Epic,谷歌北京时间今天清晨,据彭博社报道,微软计划借助对OpenAI定制AI芯片研发的访问权来推动自研芯片进展。微软CEO纳德拉在播客节目中表示,即使OpenAI在系统层面进行创新,微软也能全面获取这些成果
2025-11-13OpenAI,微软,纳德拉
科技媒体9to5Mac发布了一篇关于苹果iOS 26.2 Beta 2更新内容的文章。此次更新主要为“测距仪”和“水平仪”等原生应用整合了液态玻璃设计语言,并调整了部分系统动画,使其更具弹性
2025-11-13iOS,26,苹果
今天凌晨,Valve 正式发布了全新的硬件产品——“主机级”设备 Steam Machine。该设备将率先在目前销售 Steam Deck 的地区同步上市,计划于 2026 年初开售,具体价格与时间待后续公布
2025-11-13Steam,Steam,Machine
华硕在10月末于电商平台上架了一款AIO水冷新品——ROG STRIX吹雪360 LCD方屏版,售价为1529元
2025-11-13华硕,水冷散热器
苹果今日向iPhone和iPad用户推送了iOS/iPadOS 26.2开发者预览版Beta 2更新,内部版本号为23C5033g。此次更新距离上次发布Beta/RC版本间隔8天
2025-11-13iOS,iPadOS
近日,据媒体报道,我国公安机关通缉的跨境赌博“十大逃犯”之一、缅甸妙瓦底“亚太新城”赌诈犯罪集团主犯佘智江被成功从泰国引渡回国。这是中泰执法司法合作取得的重大成果,彰显了双方坚决打击网赌电诈犯罪的决心
2025-11-13电信诈骗,网络赌博,跨境赌博
小米应用商店宣布与腾讯官方智能体平台——腾讯元器完成能力打通,成为首家接入该平台的智能手机厂商。腾讯元器是一个零代码智能体创建与分发平台,提供低门槛的创建能力和优秀模型支持
2025-11-13小米应用商店,腾讯元器
奇瑞汽车在11月13日凌晨发布了一份关于天门山挑战测试意外情况的致歉声明。声明中提到,2025年11月12日中午12时,风云X3L车型在湖南张家界天门山景区进行极限挑战测试时发生意外,导致测试中断,引起广泛关注
2025-11-13奇瑞汽车,风云,X3L
小米近期为安卓用户推送了米家App的11.1.505.302体验版本,更新中引入了一系列新功能。其中包括“场景”页面和全屋动态看板,并对设计风格进行了调整
2025-11-12米家,App,小米米家
近日,博主@Blood旌旗分享了尚界H5的官方价格指引,该车定价在18至23万元之间。博主表示,实际售价可能会更低一些。 根据博主分享的图片,尚界H5定位为中型纯电/增程SUV,拥有大型SUV的腿部空间
2025-11-12尚界,H5,鸿蒙智行
2025世界人形机器人运动会正在国家速滑馆举行。在百米“飞人大战”决赛中,北京天工队的“具身天工 Ultra”机器人以21.50秒的成绩夺得全球首个人形机器人运动会100米短跑项目的冠军
2025-11-12北京人形机器人创新中心,世界人形机器人运动会,具身天工
据韩国ETNews报道,苹果明年将不会发布“iPhone 18”基础款型号。今年苹果用Air/Slim替换了Plus型号,并计划在明年推出首款折叠屏iPhone,因此将对产品线进行扩展和调整
2025-11-12苹果,iPhone,18
得益于AI带动的HBM需求以及与英伟达的独家供货合作,SK海力士在2025年上半年超越了保持33年霸主地位的三星电子,成为全球最大DRAM制造商
2025-11-12SK海力士,存储器
KTC已在京东上架了一款型号为“大师 25M1”的24.1英寸显示器,主打1080P 400Hz刷新率。这款显示器将于明天开始首销,商品页显示价格为4399元,但最终定价可能有所不同
2025-11-12KTC,显示器
苹果发布了Xcode 26.1.1版本更新,主要聚焦于修复一系列漏洞,并显著优化了其全“编码智能”AI编码辅助功能的性能。本次更新的核心是针对“编码智能”功能的性能和稳定性修复,同时增加支持Swift 6.2.1
2025-11-12Swift,Xcode,苹果
研究人员警告称,AI聊天机器人正在对饮食失调高风险人群造成严重威胁。最新报告显示,谷歌、OpenAI等公司的AI工具不仅提供节食建议,还传授如何掩饰病情的技巧,甚至生成鼓吹极端瘦身的内容
2025-11-12人工智能,AI减肥,AI医生
梅赛德斯-奔驰正加速更新旗下紧凑型车阵容,计划于12月8日推出第二代GLB。新车外观保持方正硬朗,内饰则彻底革新。奔驰公布了新车内饰的预告图,座舱布局与今年早些时候发布的CLA相似,采用三联屏设计,科技感更强
2025-11-12奔驰,glb
索尼在State of Play发布会上公布了一款全新的27英寸游戏显示器,这款产品仅会登陆美国和日本市场。继推出PlayStation Portal远程播放器之后,索尼进一步拓展了硬件生态
2025-11-12索尼,playstation,显示器
金正浩,韩国科学技术院电气工程学系教授,被誉为“HBM 之父”,近日在YouTube频道节目中表示,AI时代的权力正从GPU转向内存。他预测高带宽闪存(HBF)将成为继HBM之后的新战场,并认为英伟达未来可能收购一家内存公司
2025-11-12HBF,HBM,三星
小米智能门锁4 Pro于8月末开售,支持AI掌静脉、3D人脸识别,原价2499元。目前京东PLUS会员可享受5.5折优惠,价格降至1377.68元
2025-11-12小米智能门锁,4,Pro
朗科Netac今日推出3.5英寸企业级移动硬盘K393。该设备基于企业级3.5英寸机械硬盘盘体,配备USB-C数据接口和DC-in独立供电接口。 K393移动机械硬盘提供12TB至28TB的容量选择,顺序读取速率为270MB/s
2025-11-12朗科,机械硬盘,移动硬盘9月4日,全球防网络诈骗的顶尖专家在新加坡举行会议。组织者通过一个模拟测试提醒大家注意网络安全:扫描二维码即可插队。结果显示,超过50人中了圈套。这一模拟骗局旨在提高与会者对二维码钓鱼攻击的认识,这类攻击会诱导受害者向恶意网站泄露个人信息
2025-11-12人工智能,反诈,防诈
苹果在巴西面临越来越大的监管压力,尤其是在App Store运营模式方面。近期,苹果引用了一项研究数据表明,2022年巴西地区的iOS应用创收达6380万雷亚尔,其中绝大部分收入无需支付佣金
2025-11-12App,Store,苹果
据英国《金融时报》报道,欧洲汽车行业多位高管建议欧盟效仿中国,在减排计划中纳入混合动力车。他们警告称,如果欧盟坚持2035年全面禁止燃油车,可能会对欧盟最大的产业造成风险
2025-11-12新能源汽车,纯电汽车,混动汽车