当前位置:数智频道首页 > 人工智能 > 正文

苹果 FastVLM 模型开放试用:Mac 用户秒享“闪电级”视频字幕,生成速度较同类 AI 快 85 倍

苹果公司在Hugging Face平台上推出了FastVLM视觉语言模型的浏览器试用版。FastVLM以其“闪电般”的视频字幕生成速度著称,用户只需拥有搭载Apple Silicon芯片的Mac设备即可体验这一前沿技术。

苹果 FastVLM 模型开放试用:Mac 用户秒享“闪电级”视频字幕,生成速度较同类 AI 快 85 倍

FastVLM的核心优势在于其卓越的速度和效率。该模型利用苹果自研的开源机器学习框架MLX进行优化,专为Apple Silicon芯片设计。与同类模型相比,FastVLM模型体积仅为三分之一左右,但在视频字幕生成速度上却能提升85倍。

苹果 FastVLM 模型开放试用:Mac 用户秒享“闪电级”视频字幕,生成速度较同类 AI 快 85 倍

苹果发布的FastVLM-0.5B轻量版可在浏览器内直接加载运行。根据实测,在16GB M2 Pro MacBook Pro上,首次加载模型需数分钟,启动后能够精准描述画面中的人物、环境、表情及各种物体。该模型支持本地运行,所有数据均在设备端处理,无需上传至云端,从而保障了用户的数据隐私。

FastVLM的本地运行能力和低延迟特性使其在可穿戴设备和辅助技术领域展现出巨大潜力。例如,在虚拟摄像头应用中,该工具能即时详细描述多场景内容,未来有望成为这些设备的核心技术,为用户提供更智能、更便捷的交互体验。

热点推送

本周关注

MORE