当前位置:数智频道首页 > 人工智能 > 正文

微软推出其首款自研 AI 模型:MAI-Voice-1 秒级生成音频,MAI-1-preview 剑指 Copilot 文本场景

8月29日,微软人工智能部门推出了两款自研AI模型——MAI-Voice-1语音模型和MAI-1-preview通用模型。MAI-Voice-1语音模型只需单块GPU就能在一秒钟内生成长达一分钟的音频。而MAI-1-preview模型则展示了Copilot未来功能的发展方向。

微软推出其首款自研 AI 模型:MAI-Voice-1 秒级生成音频,MAI-1-preview 剑指 Copilot 文本场景

目前,微软已将MAI-Voice-1应用于多项功能中,例如在“Copilot Daily”功能里,AI主持人会通过该模型播报当日热点新闻。此外,它还能生成播客风格的对话内容,帮助用户理解各类话题。普通用户可以在Copilot Labs平台上体验MAI-Voice-1,不仅可以输入希望AI表达的内容,还可以自定义语音音色与说话风格。

此次同步推出的MAI-1-preview模型训练过程中动用了约1.5万块英伟达H100 GPU,专为特定需求用户设计,具备遵循指令的能力,可以为日常咨询提供实用回应。微软计划将此模型应用于Copilot助手的特定文本使用场景,并已在LMArena AI基准测试平台上进行公开测试。

微软AI负责人穆斯塔法·苏莱曼曾表示,公司内部研发的AI模型并未将企业级应用场景作为核心方向,而是致力于打造一款对消费者而言体验极佳的产品,并针对自身应用场景进行深度优化。他认为,在广告业务、消费者行为数据等领域,微软拥有海量高预测性、高实用性的数据,因此工作重点是构建真正适配“消费者伙伴”定位的模型。

微软AI团队在博客文章中提到,他们对未来有宏大规划,不仅会持续推进技术突破,还相信通过整合一系列针对不同用户需求与应用场景的专业模型,将释放出巨大价值。

热点推送

本周关注

MORE