去年7月,由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万,下滑72.2%,“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。
但据多位知情人士透露,DeepSeek即将重登王座。他们计划在二月中旬发布新一代模型DeepSeek-V4。
也就是农历2026年新年期间,距离上一代模型DeepSeek-R1的发布正好一年。
这次发布的重点是代码生成和处理能力。
根据DeepSeek内部的基准测试,V4在编程任务上的表现超过了目前市场上的主流竞品,包括Anthropic的Claude和OpenAI的GPT系列。

根据报道,在即将发布的新模型中,DeepSeek团队解决了许多长期困扰AI发展的技术难题。很可能会彻底改变Vibe Coding产业。
01
报道中提到一件事,“DeepSeek-V4模型在整个训练过程中理解数据模式的能力也有所改进,且性能未出现衰减。”
这句话有些难以理解,我们不妨拆开来解读。
首先是前半句,它指的是模型不再只是死记硬背数据,而是能看透数据背后的规律和逻辑。
DeepSeek-R1有个具代表性的例子,就是让模型数strawberry里有几个r。
由于当时的DeepSeek模型并不能理解“数”(count)这个概念,只能根据训练时的数据来输出答案。可这个数据恰好又是错的,所以无论DeepSeek怎么思考,它给出的答案大多数情况都是2,而不是正确的3。

而DeepSeek-V4则会彻底杜绝这个情况,前提是在训练过程中,让模型彻底理解某一件事情。
后半句的性能退化,指的是在AI训练中,随着模型不断学习新东西或训练时间加长,往往会出现“学了新的忘了旧的”或者模型变得不稳定的情况。
这种现象在业内被称为“灾难性遗忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。
因此,V4在不断变聪明、变复杂的过程中,依然保持了极高的稳定性和原有能力的完整性,没有出现任何“副作用”或能力倒退。
这恰恰是构建编程Agent的前置条件。
在现代软件工程中,一个微小的修改可能波及数个文件、数千行代码的依赖关系。
但是以往的模型往往受限于上下文窗口或注意力机制的衰减,从而没办法对于庞大的项目进行修改。
V4极有可能是一个为“Agent时代”量身定制的模型。
一年前,DeepSeek-R1的发布确实在行业内引起了不小的波动。那款主打推理能力的模型证明了低成本研发路径的可行性。
然而一年后的今天,人工智能行业的关注焦点已经发生了显著转移。单纯的文本生成或逻辑推理已不再是唯一的竞争高地,代码生成正在演变为大模型能力的“试金石”。
在当前的开发环境中,“Vibe Coding”成为新趋势,要求AI不仅能补全代码,更能理解开发者的意图流(Flow),实现从自然语言到复杂工程逻辑的无缝转化。
DeepSeek似乎已经准备好在新赛道上狂飙了。
02
如果深入梳理DeepSeek团队以及核心人物梁文锋在R1发布之后这一年里的学术轨迹,我们会发现一条清晰且扎实的技术演进路线。
这些公开发表的论文与技术报告,不仅是对过去成果的总结,更是V4强大能力的注脚与预演。
2025年9月,DeepSeek-R1的相关论文成功登上了顶级学术期刊《Nature》的封面,梁文锋署名通讯作者。
面对审稿人关于是否使用了OpenAI模型输出进行蒸馏训练的尖锐质疑,DeepSeek团队在回应中给出了明确的否认,并首次公开了令人咋舌的低成本数据:从V3-Base训练到R1,仅花费了29.4万美元。
当然,这个成本仅指R1的后训练阶段成本,不包含V3-Base基础模型本身约600万美元的训练投入。
数据公开后,以及《Nature》为此专门撰写的社论,标志着DeepSeek在学术严谨性和技术原创性上获得了国际最高认可,彻底洗刷了外界对于中国大模型“套壳”或“跟随”的刻板印象。
不过,真正能佐证DeepSeek-V4在代码方面有大幅突破的证据,是2025年最后一天,DeepSeek团队发表的论文《mHC:流形约束超连接》。
代码生成任务对模型的逻辑深度和上下文跨度有着极高的要求,这通常需要更大规模的模型参数和更深的网络结构。
然而,传统的超连接(Hyper-Connections)架构在模型规模扩大时,会面临严重的信号增益问题,最终导致训练过程极不稳定甚至崩溃。
为了解决这一阻碍模型扩容的根本性物理难题,DeepSeek团队在这篇论文中提出了一种全新的架构mHC。
简单来说,它给狂奔的信号加了一道精密的阀门,将信号增益严格控制在1.6倍左右。
论文数据显示,在3B、9B乃至18B参数规模的模型测试中,应用了mHC架构的模型在BIG-BenchHard推理基准上提升了2.1%。
这项由梁文锋联合署名的研究成果,实际上解决了大模型在“做大”和“做复杂”过程中的稳定性难题。
这意味着V4模型极有可能采用了这种全新的架构,从而在拥有更庞大参数量和更深层推理能力的同时,依然保持了高效的训练效率和极高的稳定性。

不仅如此,在2026年1月初,DeepSeek悄无声息地将arXiV上的R1论文从原本的22页大幅扩充至86页。
这多出来的60多页内容,详尽地披露了R1的完整训练管线,包括冷启动、推理导向的强化学习(RL)、拒绝采样与再微调、以及对齐导向的强化学习这四个关键步骤。
业界普遍推测,这种在春节前夕“清库存”式的技术披露,往往预示着下一代更强大的技术已经成熟。
既然R1的技术细节已经不再是核心壁垒,那么即将到来的V4必然拥有了更高维度的护城河。
03
就在2026年的元旦,另一股来自量化界的力量也加入了战局。
由九坤投资创始团队发起成立的至知创新研究院(IQuestResearch),发布了名为IQuest-Coder-V1的开源代码大模型。我们曾在文章《又是量化基金,第二个DeepSeek时刻到来了?》中对其进行了报道。
这支同样出身于量化背景的团队,他们仅有40B参数的模型,在SWE-benchVerified测试中斩获了81.4%的高分,一举达到了Claude和ChatGPT的水平。
而在Vibe Coding的战场上,国内互联网大厂的动作同样不容小觑。
字节跳动的豆包在2025年初就推出了Trae编程工具,并在AI编程功能上实现了HTML预览、Python运行和完整项目生成等能力,让开发者可以在一个界面内完成从构思到部署的全流程。
阿里的通义千问则在12月26日更新到了Qwen Code v0.5.0版本。
此次更新的最大亮点就是支持在终端窗口中同时运行四个Qwen Code实例,可并行处理智能问答、实时翻译、原型设计、创意绘图等不同任务,实现了AI编程“跳出命令行”的突破。
不过,真正引发行业震动的,是豆包在硬件终端上的突破性尝试。
2025年12月1日,字节跳动与中兴通讯合作推出了搭载豆包手机助手的努比亚M153工程样机,售价3499元,首批约3万台在当天迅速售罄,甚至在二手市场炒出了高价。
这款手机助手的核心能力在于跨应用操作。用户只需用自然语言下达指令,AI就能自动跳转多个应用完成点外卖、订机票、比价购物等复杂任务。
这一系列动作背后,折射出的是AI大模型从云端走向终端、从工具走向入口的战略转型。
说不定DeepSeek手机也不远了。

与此同时,资本市场也迎来了大模型行业的收获季。
曾经历过“百模大战”喧嚣的中国AI行业,正在加速向头部收敛。智谱AI和MiniMax这两家公司均已成功上市。
智谱是1月8日在港交所敲的钟,发行价定在116.2港元/股,上市第一天就给了市场一个惊喜——开盘120港元,收盘131.5港元,第一天就涨了13.17%,市值一下子冲到578.9亿港元,成了“全球大模型第一股”。
第二天开盘直接137.2港元起,收盘158.6港元,较首日收盘价又涨了20.6%,市值也跟着涨到698.21亿港元,两天下来从发行价算已经涨了快37%,完全没给空头机会。
MiniMax比智谱晚一天,但风头更劲。发行价165港元/股,而且是顶格定价,上市前一天的暗盘就已经涨了25%-29%,报205.60-212.60港元。
上市当天开盘235.4港元,涨了42.7%,之后一路飙升,盘中最高到351.8港元,最终收盘345港元,较发行价暴涨109.09%,市值来到1054亿港元,成了千亿市值俱乐部新成员。
虽然高额的研发投入使得两家公司目前仍处于亏损状态,但强劲的增长曲线证明了市场对于高质量AI模型的付费意愿正在形成。
中国AI方兴未艾,但当全球目光已经再次聚焦到DeepSeek身上。一年前那个用低成本路径颠覆行业认知的团队,即将在春节期间交出新的答卷。
DeepSeek能否第二次“震惊全世界”,只要再等几天就会知晓。
AYANEO掌机在B站账号上发布声明,对近期网络上出现的针对该品牌的恶意不实言论进行辟谣
2026-02-10AYANEO,掌机,AYANEO
荣耀Magic Vs3手机的用户在荣耀俱乐部反馈,希望加快适配问界车钥匙。官方产品维护人员回复称:“问界车钥匙正在沟通当中。”这意味着问界系列车钥匙有望支持荣耀手机
2026-02-10问界,荣耀手机,车钥匙
华擎今天宣布为旗下AM5主板推出4.07.AS01 Beta版BIOS,修复部分CPU出现的无法开机问题
2026-02-10AM5,主板,华擎
近期,一辆小米YU7 Max出现在美国I-5州际公路上,悬挂着伊利诺伊州制造商车牌。随后,小米创办人、董事长兼CEO雷军在微博上回应称,前段时间确实有一辆YU7行驶在美国加州的高速公路上,并挂着当地的测试车牌
2026-02-10雷军,小米汽车
丰田自2023年起与日本炼油巨头出光兴产共同开展全固态电池试点项目,如今双方合作已进入新阶段。两家公司决定新建一座工厂,专门生产全固态电动汽车电池所需的固态电解质
2026-02-10丰田,固态电池,出光兴产
消息人士Yogesh Brar在X平台上透露,OPPO Find N6折叠屏手机将于3月17日发布。Find N6将在包括中国、南亚和欧盟在内的多个地区市场推出,但不包括印度
2026-02-10OPPO,Find,N6
苹果公司与中国人民大学合作推出了一种名为VSSFlow的新型AI模型。该模型能够从无声视频中同时生成逼真的环境音效和人类语音,突破了传统音频生成技术的局限
2026-02-10苹果,AI
江汽集团董事长、省十四届人大代表项兴初在接受《安徽新闻联播》采访时透露,尊界 S800 豪华轿车将推出高定版,并重点推进该车型与豪华 MPV、豪华 SUV 等后续车型的高质量量产
2026-02-10尊界,S800,江汽集团
苹果有望于2026年上半年发布新款Studio Display显示器。这款新显示器在外观上预计会沿用现款设计,保持现有工业设计风格
2026-02-10Mac,Studio,Display
美国全国劳资关系委员会决定放弃与埃隆·马斯克旗下SpaceX公司长达数年的法律诉讼,并表示未来将不再对该公司提起诉讼。两年前,该委员会曾指控SpaceX因8名工程师参与撰写批评马斯克的公开信而将其解雇。如今,委员会宣布撤销这一案件
2026-02-10SpaceX,马斯克
据韩媒报道,受苹果计划为iPhone 18 Pro系列手机引入可变光圈技术的传闻影响,三星正评估在未来Galaxy S27手机中带回可变光圈摄像头,以与苹果竞争
2026-02-10iPhone,18,Pro据CNBC报道,OpenAI周一正式启动了ChatGPT内的广告测试。该公司上月曾公开表示,相关广告会进行清晰的标识,仅出现在聊天机器人回答内容的底部,不会对ChatGPT的回复结果产生任何影响
2026-02-10OpenAI,ChatGPT,奥尔特曼
法拉利官方宣布旗下首款电动跑车定名为“Luce”,并公布了该车的内饰及人机交互设计,声称能带来令人振奋的驾驶体验。名字“Luce”源自意大利语,意为“光”或“照明”,象征着法拉利面向未来的坚定方向,并体现了品牌全新的命名策略
2026-02-10Luce,法拉利,电动跑车
曜越现已在京东上架TG100桌面迷你机箱,仅提供黑色可选,定价为219元。 该机箱尺寸为380x200x342mm,支持M-ATX/ITX主板。机箱顶部采用格栅设计,并带有木质曜越Logo铭牌,机箱支持三面快拆
2026-02-10曜越,TG100,桌面迷你机箱
谷歌更新了其官方说明文档,要求所有新注册的Google Voice电话服务用户必须完成身份验证才能使用短信收发和通话功能
2026-02-10Google,Voice,实名制
三星在印度市场推出了Galaxy F70e 5G手机,这款新机主打5000万像素主摄和天玑6300芯片。该手机采用皮革质感后盖设计,提供青柠绿和聚光蓝两种颜色选择
2026-02-09Galaxy,F70e,5G
荣耀游戏研发工程师宣布,WIN机型现已支持《王者荣耀》地图旗舰级画质。玩家可以在极致画质下勾选地图旗舰级画质选项,以获得更高质量的画面体验。 该画质选项限时开放,将在S42赛季结束后下线
2026-02-09王者荣耀,骁龙,8
尽管AM5是AMD当前的主流平台,但在北美和欧洲市场,上一代B550主板的销量却领先
2026-02-09AM5,B550,主板
今晚8点,由智元AGIBOT主办的全球首个大型机器人晚会《机器人奇妙夜》成功举行。晚会由两百余台机器人主导,融合了舞蹈、小品、魔术、武术、歌曲、走秀等多种表演形式
2026-02-09机器人奇妙夜,智元机器人
总部位于美国加州的QuantumScape公司成立十五年后,声称已成功攻克固态电池技术难题
2026-02-09固态电池,QuantumScape
当地时间上周六,一场支持加州亿万富翁的游行并未吸引大量人群。据《旧金山纪事报》统计,现场仅有约三十多名参与者,另有十几人以戏谑的方式进行了反示威。活动组织者德里克·考夫曼此前就已预估,出席人数只会有“几十人”
2026-02-09亿万富翁税法
美图公司在港交所发布公告,根据初步评估,按非国际财务报告准则,截至2025年12月31日止年度集团经调整归属母公司权益持有人净利润较截至2024年12月31日止年度可能实现60%至66%的同比增长
2026-02-09美图公司
小米REDMI Turbo 5 Max手机于1月29日发布,起售价为2199元。小米商城已公布这款新机的官方维修备件价格
2026-02-09小米,REDMI,Turbo
氛围编程迎来一周年纪念日之际,创造这个术语的人又提出了一个新概念:智能体工程。氛围编程是指人类通过提示词让人工智能编写代码,而智能体工程则是由人工智能智能体自主完成代码编写
2026-02-09氛围编程,智能体工程,OpenAI
扬州港集团昨日宣布,满载220台苏州金龙海格客车的“盛诚海”轮从扬州港顺利启航,前往阿尔及利亚。这次出运不仅刷新了扬州口岸单船整车出口量纪录,也是中国客车出口最大单的一部分,总订单为3000台,金额超过15亿元
2026-02-09阿尔及利亚,苏州金龙海格客车,苏州金龙
高通去年推出了骁龙 X2 Elite Extreme 与骁龙 X2 Elite 处理器,其中定位稍低的骁龙 X2 Elite 在一系列 CPU 和 GPU 基准测试中表现出色
2026-02-09骁龙X2,Elite,苹果M5
苹果计划在2月23日当周向开发者推送iOS 26.4的首个测试版。如果一切按计划进行,用户将有机会首次体验到苹果去年承诺的部分Apple Intelligence与升级版Siri功能
2026-02-09Siri,Apple,Intelligence
比亚迪于2月8日晚发布了海豹08的官方伪装照,照片中车辆在雪地中展现身姿,配文“极境之上,旗舰登场”
2026-02-09比亚迪,海豹,08
小米智能门锁E30星辰黑已在京东等平台开售,支持AI指纹识别和9种开锁方式,售价699元,国补价为629.1元。该产品将离合内置于锁体,并采用直插式C级锁芯贯穿锁体结构设计,以防止外力拆卸外面板后直接开门或暴力下压外把手开门
2026-02-09小米,智能门锁,E30
闪迪今年1月宣布启用全新游戏SSD品牌SANDISK Optimus,旨在取代从拆分前的西部数据继承而来的WD_BLACK黑盘和WD Blue蓝盘。新款“Optimus”系列SSD已在美国亚马逊等渠道上架
2026-02-09闪迪,Optimus,SSD