当前位置:数智频道首页 > 手机数码 > 正文

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

9月10日,Arm在Arm Unlocked 2025峰会上推出了全新的Arm Lumex计算子系统平台。该平台专为旗舰级智能手机及下一代个人电脑设计,旨在加速设备端的人工智能体验。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

Lumex CSS平台集成了第二代可伸缩矩阵扩展(SME2)技术的高性能Arm CPU、GPU及系统IP,支持桌面级移动游戏、实时翻译、智能助手等多样化场景,使消费电子产品更智能、更高效、更个性化。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

Lumex平台的核心组件包括搭载SME2技术的Armv9.3 CPU集群、配备新一代光线追踪技术的Arm Mali G1-Ultra GPU、高效的系统IP以及针对3纳米工艺节点优化的物理实现方案。这一高度集成的平台化交付模式为合作伙伴提供了前所未有的灵活性,他们可以选择直接采用Arm优化后的平台或根据需求配置寄存器传输级设计并自行完成核心模块硬化工作。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

发布会上,Arm公布了性能指标:全新的SME2技术使CPU的AI性能提升五倍,而GPU则带来了两倍的光线追踪性能飞跃。这些数字反映了Arm对未来计算架构的深刻思考,并为生态系统提供了战略性解决方案。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

当天下午,Arm还举办了关于Arm Lumex计算子系统的专门技术分享活动。C1 CPU集群是Lumex CSS平台的心脏,通过集成SME2技术重新定义了CPU在异构AI计算环境中的角色。SME2技术为端侧AI带来了革命性的突破,在同等条件下,相比上一代CPU集群,其AI性能提速高达五倍,同时能效优化多达三倍。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

在实际应用中,处理语音工作负载时延迟降低了4.7倍;运行Google Gemma 3模型进行聊天交互时,AI性能增长4.7倍;使用Stability AI Stable Audio模型生成音频时,速度提升了2.8倍。SME2的战略意义在于它为CPU提供额外的2到6 TOPS算力,这使得CPU在处理小模型任务时效率远高于高功耗的NPU。Arm构建了一个精细化的三级异构计算体系,分别由搭载SME2的CPU、GPU和NPU负责不同类型的AI任务。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

为了满足从旗舰到入门级市场的不同需求,Arm推出了分工明确的C1 CPU系列。Arm C1-Ultra作为旗舰核心,单线程峰值性能相较于上一代提升25%。Arm C1-Premium是次旗舰处理器,具有卓越的面积效率。Arm C1-Pro聚焦于持续能效表现,而Arm C1-Nano追求极致的能耗和面积效率。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

Mali G1-Ultra GPU在图形与AI推理环节扮演着核心角色。作为Arm迄今为止性能最强的移动GPU,Mali G1-Ultra不仅延续了手游领域的优势,还通过新一代光线追踪技术和AI加速设计将移动设备的图形体验推向桌面级水准。RTUv2实现了两倍光线追踪性能提升,且采用单光线模型与独立电源域设计,进一步节省功耗。在实际游戏测试中,Mali G1-Ultra表现出色,性能提升显著。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

在AI加速方面,Mali G1-Ultra引入了新的矩阵乘法单元FP16指令,针对关键AI工作负载优化,较上一代GPU,AI与机器学习网络推理速度提升20%。此外,通过扩大L2缓存与优化互连设计,Mali G1-Ultra实现了AI与图形工作负载的并行处理,大幅减少内存瓶颈。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

Arm还推出了Mali G1-Premium与Mali G1-Pro GPU,以满足不同设备层级的需求。该系列支持Arm精锐超级分辨率技术,可在减少GPU工作负载的同时提升图像质量。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

Lumex平台的硬件进步离不开强大且精心构建的软件生态系统。KleidiAI软件库是这个生态的核心,它让开发者在无需修改任何代码的情况下无缝利用SME2等硬件的加速能力。KleidiAI已累计安装超过80亿次,证明了其在开发者社区中的高度认可和广泛采纳。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

总体来说,Arm Lumex CSS平台的发布不仅是硬件的迭代更新,更是Arm从IP授权商向平台提供商战略演进的体现。通过C1 CPU集群和SME2技术,Arm重新划分了异构计算中各处理单元的职责。通过Mali G1-Ultra和RTUv2,它将移动游戏的视觉体验提升至新的高度。通过KleidiAI软件生态,确保了强大的硬件能力能够被开发者轻松转化为丰富的用户体验。整合在一个经过3纳米工艺优化的预验证“计算子系统”中进行交付,解决了芯片设计合作伙伴在转向先进工艺节点时所面临的巨大成本、风险和时间压力。

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

Arm Lumex 计算子系统平台详细解读:端侧 AI 时代的“异构协同”新基石

热点推送

本周关注

MORE