阿里云 Qwen3-VL 再添新丁：4B & 8B 稠密模型上线

本次发布包含了 4B 和 8B 两种参数规模，两个尺寸均提供Instruct与Thinking版本。我们实现了以下关键目

本次发布包含了 4B 和 8B 两种参数规模，两个尺寸均提供 Instruct 与 Thinking 版本。我们实现了以下关键目标:🔹 更低的资源门槛：尺寸缩减显著降低 VRAM 的占用。现在，开发者可以在更广泛的硬件设备上部署和运行我们的模型。

🔹 毫不妥协的核心能力：在缩减尺寸的同时，我们完整保留了 Qwen3-VL 的全部核心功能。

🔹 卓越的基准性能: 在 STEM、VQA、OCR、视频理解及 Agent 任务等多个权威基准上，其表现不仅超越了 Gemini 2.5 Flash Lite 和 GPT-5 Nano，在许多场景下甚至能与我们半年前的旗舰模型 Qwen2.5-VL-72B 相媲美。

注：文章转载自通义大模型公众号

阅读：1 点赞：0

游戏百科