我们很高兴地宣布发布 Qwen2.5-Omni-3B,为开发人员提供轻量级 GPU 可访问性! 🔹与 Qwen2.5-Omni-7B 模型相比,3B 版本在长上下文序列处理(~25k 个令牌)期间的 VRAM 消耗显著减少了 50% 以上🚀 ,同时支持在典型的 24GB 消费级 GPU 上进行延长的 30 秒音频视频交互。 🔹保留了 7B 模型 90% 以上的多模态理解能力,自然语音输出准确率和稳定性与 7B 版本的性能相匹配💪🏻 。系列 编程严选网
我们很高兴地宣布发布Qwen2.5-Omni-3B,为开发人员提供轻量级GP
JavaEdge聊AIss
2025-05-01 02:56:47
0
阅读:7