当前位置:数智频道首页 > 人工智能 > 正文

我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍

EXO Labs 展示了其“分布式推理”的新成果,解决了选择购买AI小主机时的难题——是选择苹果Mac Studio还是英伟达DGX Spark。在AI大语言模型推理测试中,EXO Labs 使用了两台NVIDIA DGX Spark和一台搭载M3 Ultra芯片的Mac Studio,相比单独使用Mac Studio,整体性能提升了2.8倍。

我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍

这项成果基于EXO Labs的开源项目EXO,该框架旨在让大语言模型能够在不同硬件的混合环境中高效运行。与传统仅依赖单一GPU或加速器的推理方式不同,EXO可以将工作负载自动分配到多种设备上,使台式机、笔记本、服务器甚至平板电脑与智能手机组成类似WiFi Mesh网络的“AI Mesh”。

我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍

DGX Spark侧重计算性能,而Mac Studio在数据带宽上更具优势。测试中,DGX Spark的预填充速度比Mac Studio快3.8倍,而Mac Studio的生成速度又比DGX Spark快3.4倍,实现了性能互补。EXO的方案是将计算密集的预填充任务交给DGX Spark,带宽敏感的解码任务则由M3 Ultra负责。系统通过逐层传输模型的内部数据(称为KV缓存),实现两台设备的同时工作,而非依次等待。

我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍

在使用Meta Llama-3.1 8B模型进行的基准测试中,该混合架构相较单独使用Mac Studio,推理性能提升2.8倍。EXO的实验展示了一种不同于传统单机加速的AI扩展思路。未来AI性能的提升可能不再依赖单一大型加速器,而是通过更智能的硬件协同实现整体算力的提升。

我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍

EXO当前的早期访问版本1.0仍属实验性质,尚未全面公开。现有的开源版本0.0.15-alpha发布于2025年3月,后续版本计划引入自动调度、KV流式传输和异构硬件优化功能。目前EXO仍是研究级工具,尚不适合普通消费者直接使用,但其演示结果表明,通过智能调度不同硬件资源,分布式推理架构能在无需大型数据中心的前提下显著提升AI性能。

我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍

我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍

热点推送

本周关注

MORE