当前位置:数智频道首页 > 人工智能 > 正文

支持消费级显卡部署:腾讯混元 3D 世界模型宣布推出 Lite 版本,推理速度提升 3 倍以上且精度损失 <1%

腾讯混元团队近日推出了一款Lite版本的3D世界模型。通过引入动态FP8量化技术,该版本将模型显存需求从原本的26GB优化至17GB以下,成功适配消费级显卡。

支持消费级显卡部署:腾讯混元 3D 世界模型宣布推出 Lite 版本,推理速度提升 3 倍以上且精度损失

此外,混元团队还通过引入FP8量化注意力算子,将Transformer中的Q、K、V矩阵量化为INT8,并结合动态平滑与硬件优化,实现了推理速度提升3倍以上,同时精度损失小于1%。这种改进显著降低了模型运行所需的显存。

支持消费级显卡部署:腾讯混元 3D 世界模型宣布推出 Lite 版本,推理速度提升 3 倍以上且精度损失

除了显存优化,混元团队还集成了Cache算法,通过优化冗余时间步,进一步提升了推理效率,使模型运行更加流畅。自动化搜参工具识别出关键时间步和block,进一步优化了冗余时间步,提高了整体性能。

混元3D世界模型1.0不仅能够生成清晰的视觉场景,还能对场景中的天空、地面、植被、物体等不同组件进行分层建模。生成的世界可以导出为3D mesh格式文件,无缝接入游戏、物理引擎等,支持二创如游戏开发、影视制作和物理仿真等应用。

自发布以来,混元3D世界模型1.0因其卓越的世界生成能力在社区中备受关注。然而,用户反馈的最大痛点是显存开销大,即使使用pipeline offloading技术,仍需26GB以上的显存,这对大多数消费级显卡来说是一个挑战。为了让更多中小企业和个人开发者能够便捷地使用这一模型,混元团队推出了Lite版本,使得消费级显卡也能运行。

更多关于混元3D世界模型的信息可访问官网、GitHub项目地址或Hugging Face模型地址。

热点推送

本周关注

MORE