夸克背后最新Qwen闭源模型意味着什么？

文：王智远 | ID:Z201440

这两天，关于夸克「C+计划」传得纷纷扬扬。

有人说，这是夸克一次「AI 大换血」；也有人说，是阿里在测试闭源模型的新能力。

我体验完，觉得这事儿，确实值得聊聊。说是说上线一个新功能，叫「对话助手」。但实际不能完全这么看；因为，它从「会说话、会聊天」，正式跨进了「能干活」的阶段。

怎么干活呢？先说我自己的体验。

如果你想用这个功能，得先把夸克升级到最新版本，升级之后，主页会多出一个入口，点进去就是「对话助手」。

我试着问了一个比较「现实」的问题。

我说：「自己酿的酒给朋友喝，结果朋友喝出事了，这算什么罪名？」

为了测试它到底行不行，我特意在几个别的AI助手上问了同样的问题，AI的常规操作就不说了，先去查一些案例、贴几条法律法规。

但最后这个答案够不够清晰？能不能直接用？

我个人觉得，大家可以看下面图片对比下；夸克回答的结构更清晰、逻辑更有条理，连法律条文的引用，都更贴合实际场景，不堆术语，也不空讲原则，是真能看懂、能用的那种。

图片太长，你也可以搜同一个问题看看。

注释：左边为夸克APP实测，右边为其他AI助手

我又试了个更偏「动手」的问题：即拍即译。

怎么测呢？翻箱倒柜，翻出了本老古董——《英语统考大纲及学习指南》。（对，就是大学时人手一本的“考试圣经”。）

拍了两张照片传给它，让它帮我翻译。

本来也没抱什么希望，毕竟这种教材类的内容句子长、结构乱，AI一般都整不明白。

结果几秒钟，夸克翻完了，还自动分了段。原文、译文对照着排，我看着没什么毛病，关键是它翻得特别自然。

当年有它我四级估计早过了。顺便说一句，图片里的手是我的，真测的，不是假案例。

你也可以试试拍点别的。比如：拍本外文原版书、拍报纸、拍路牌、拍Excel、拍论文都行，这个助手特别妙，一键搞定。

有时候我们找东西，是在「搜资源」。

大多数资源都太散太杂怎么办？我这次换了个思路，直接问夸克：有没有心理学书籍的网盘资源？

它给我列出了一份清单，338 本心理学书籍，书名、作者、文件大小全都有，里面还有马斯洛、荣格、阿德勒这些经典著作。

有些链接，我点进去就能直接存进自己的夸克网盘；有些给的是下载方式，整个过程还挺顺，它帮我把“找”和“存”这两件事，一起干完了。

所以我，玩了将近一天，我才意识到：这已经不是单纯的「能聊天」了，它「能干活」。

体验完这几件「能干活」的小事，再看外部进展。

最近，OpenAI 也推出了浏览器功能，让 ChatGPT 能「自己去找」，这是AI发展的第二个阶段，从「能说话」到「能思考」。

夸克这一步「边找边干」的动作，也有异曲同工之处。

问问题同时，它已经在后台完成搜索、筛选、整合、比对，然后把结论整理成一段能直接使用的回答。

这种能力在交互上是质变的，因为作为一个用户，我不用手动去查、去点、去拼，直接得到「已经验证过的答案」，很方便。

也就是说，它把搜索和执行融合成了一件事。

如果说，豆包代表「陪聊型AI」，价值在于帮用户表达、陪伴、娱乐；那么，夸克方向更像「任务型AI助理」，它的核心是解决问题、完成任务。

两条路都没错，一个在训练AI的「情感力」，一个在强化AI的「执行力」；但从用户角度看，这次夸克明显更接近「能帮我干点实事」的那个AI。

所以，我觉得，这次变化不只是产品层面的，AI助手这件事，正在迎来一个分水岭：

从陪聊，到帮忙；从生成信息，到执行动作；从理解问题，到完成任务，而夸克，正好站在这条分界线上，它在探索新机会点。

夸克这次的「聪明」，背后有一颗全新「脑子」。

我查了下，它用的是阿里最新 Qwen 闭源模型。这个模型定位有点意思，介于「实验室」和「落地」之间，属于那层最核心的引擎。

怎么理解呢？

过去我们说 AI 模型厉害，大多是形容它“知道得多”，但 Qwen 的强，是在「理解力」和「执行力」上；它能听懂模糊的问题，也能给出清晰的决策，这背后靠的阿里那颗「闭源大脑」。

闭源，不是封闭，更像是一种「可控的极致」；它让模型的稳定性、准确率、响应逻辑，都被打磨到工程级的水准。

这次 Qwen 闭源版，性能已经比 Qwen3-Max 更强一档，从去年到现在，在几乎所有国际榜单上都进了第一梯队。

第一梯队这话，我说了不算，有数据可以作证。

比如：

Qwen3-Max 在 Chatbot Arena 上总分 1433 分，全球第三、开源模型第一；在大模型用coding解决真实世界问题SWE-Bench Verified 测试中拿下 69.6 分，跻身全球第一梯队；

在聚焦Agent工具调用能力的Tau2-Bench 测试中得 74.8 分，超过 Claude Opus 4 和 DeepSeek-V3.1；在数学推理的 AIME25 和 HMMT 测试中，更是双双拿到满分 100，这是国内第一次。

等等，有些英文你可能不太懂，我解释一下：

Chatbot Arena 是测「聊天综合水平」的；SWE-Bench 是测「写代码解决问题」的；Tau2-Bench 是测「AI调工具、连系统」的。

而 AIME25、HMMT，就是数学圈最硬核的两场考试，能拿满分，差不多等于 AI 在全球数学竞赛上考了第一。

所以，这一串数据说明一个很简单的事实：Qwen 的这颗「脑子」，是让 AI 终于长出了逻辑中枢。

举个简单例子：

你问它：「中国未来的新能源车会不会降价？」

普通模型大概率跟你扯一堆宏观分析；而 Qwen 会先分析市场结构，再拆变量，最后得出趋势，它不仅有答案，还知道答案是怎么来的。

这就是闭源模型的意义，它代表一种「工程化的确定性」，阿里在用闭源路线，让 AI 从「能输出」变成「能交付」，让每一句回答，都能自证逻辑。

所以，智远认为夸克「AI对话助手」模型的脑子，已经换代了。

阿里现在在用夸克验证「模型驱动的生活系统」，未来文档、网盘、邮箱、搜索、浏览器，都会被AI重新组织，你在一个入口提问，它能调用整个体系去完成。

换句话说，这是一次「模型—系统—生态」的打通，模型成了基础设施，让模型能从场景里长大，在生态里反馈，在使用中自我迭代。

智远判断，这是一场底层协议的改写。

当模型能在应用中自学习、自反馈、自优化时，它就成了一个会自己演化的系统。

阿里过去做电商、做云计算、做支付系统，都在解决人和系统效率的问题，现在，他们开始解决另一个问题：智能体之间的效率。

从搜索、到对话，到推理，再到能干活，AI助手已经进入第三阶段；而夸克，是这条进化线上，第一个能「跑起来」的窗口。

但问题是：当 AI 从会说、会想，进化到会做之后，下一个阶段又会是什么呢？值得进一步关注。

游戏百科

夸克背后最新Qwen闭源模型意味着什么？

评论列表

热门分类

夸克背后最新Qwen闭源模型意味着什么？

评论列表

猜你喜欢

这下知道为什么AI取代不了医护了🙉​​​

“提示工程”已死，迎来“上下文工程2.0”革命。GAIR团队最新研究彻底重塑人

美国那边，突然砸了800亿美金，不是去搞芯片，不是去造飞机，而是去建核电站。你没

我国是否跟上了此次AI革命？​​​

五年之内，大家就不要更换手机了，因为到时候所有手机和APP都会消失，手机不再是人

程序员特意留的后手bug

美国的AI圈都炸锅了，最尴尬的是美国员工，最近听说有美国员工投诉，说在AI核心

热门分类

这下知道为什么AI取代不了医护了🙉

我国是否跟上了此次AI革命？