当前位置:数智频道首页 > 人工智能 > 正文

中国移动“九天”通用基础大模型 3.0 发布,核心技术开源

在2025世界人工智能大会的企业人工智能产业发展论坛上,中国移动发布了“九天”基础大模型3.0。该模型是国务院国资委战新“百大工程”的新成果,进一步强化了高安全、高可控、全国产、全行业四大特性,重点实现三大升级。

中国移动“九天”通用基础大模型 3.0 发布,核心技术开源

九天众擎语言大模型实现了架构与性能双重跃迁。模型采用可扩展至万亿级的MoE架构,通过15T token多阶段配比预训练数据与全流程治理体系强化推理能力,构建了113域×53能力的二维分级后训练框架。结合动态强化学习策略,复杂推理能力提升了35%。在GPQA-Diamond评测中,“九天”以77.67分获得全球第二;在ArenaHard V0.1中,以67.2分位居全球第一;在BFCL V3评测中,达到68分。此外,模型还增强了可控生成能力,支持沉浸式角色演绎和精确流程内置等技术细节,实现了专业场景零幻觉。

基于最新的语言大模型,中国移动推出多个专项模型。九天代码大模型使用两阶段的持续训练技术,支持多种任务,包括代码生成、注释生成、单元测试生成、代码智能问答等,并支持Python、Java、JS、TS、Go、C++等10多种主流编程语言。在多个代码生成榜单上,九天代码大模型成绩领先。九天数学大模型在短思考和长思考模式下均达到业界顶级水平,多项指标超过同类参数量级的其他模型。

九天善智多模态大模型全面提升生成可控性与理解能力。例如,在图片生成功能方面,支持多轮精准局部修改,如修改文字、修改背景、增加元素等。模型在图理解和视频理解方面的性能也全面提升。

此次发布还包括核心技术开源。一是开源九天数童结构化数据大模型,支持下载模型权重、微调代码、推理代码等;二是开源九天数学大模型,支持下载模型权重、推理代码和技术报告;三是开源九天代码大模型,支持下载模型权重、推理代码和技术报告;四是开源业界首创的结构化数据模型评测数据及TReB评测体系,涵盖六大任务、34个能力,支持下载评测数据集、测试代码;五是开源CCR-Bench行业场景复杂指令遵循评测数据集,涵盖174条高质量、多样化、高难度复杂指令数据,高度模拟健康专家、智能客服、医疗助手等典型工业场景,支持下载数据集。以上内容已在焕新社区、Github、HuggingFace、魔搭社区、Gitee、Arxiv上线。

据悉,中国移动九天人工智能研究院计划于8月推出此次发布内容的技术深度解读。

热点推送

本周关注

MORE