游戏百科

阿里云 Qwen3-VL 再添新丁:4B & 8B 稠密模型上线

本次发布包含了 4B 和 8B 两种参数规模,两个尺寸均提供Instruct与Thinking版本。我们实现了以下关键目

本次发布包含了 4B 和 8B 两种参数规模,两个尺寸均提供 Instruct 与 Thinking 版本。我们实现了以下关键目标:🔹 更低的资源门槛:尺寸缩减显著降低 VRAM 的占用。现在,开发者可以在更广泛的硬件设备上部署和运行我们的模型。

🔹 毫不妥协的核心能力:在缩减尺寸的同时,我们完整保留了 Qwen3-VL 的全部核心功能。

🔹 卓越的基准性能: 在 STEM、VQA、OCR、视频理解及 Agent 任务等多个权威基准上,其表现不仅超越了 Gemini 2.5 Flash Lite 和 GPT-5 Nano,在许多场景下甚至能与我们半年前的旗舰模型 Qwen2.5-VL-72B 相媲美。

注:文章转载自通义大模型公众号