
文:王智远 | ID:Z201440
这两天,关于夸克「C+计划」传得纷纷扬扬。
有人说,这是夸克一次「AI 大换血」;也有人说,是阿里在测试闭源模型的新能力。
我体验完,觉得这事儿,确实值得聊聊。说是说上线一个新功能,叫「对话助手」。但实际不能完全这么看;因为,它从「会说话、会聊天」,正式跨进了「能干活」的阶段。
01怎么干活呢?先说我自己的体验。
如果你想用这个功能,得先把夸克升级到最新版本,升级之后,主页会多出一个入口,点进去就是「对话助手」。
我试着问了一个比较「现实」的问题。
我说:「自己酿的酒给朋友喝,结果朋友喝出事了,这算什么罪名?」
为了测试它到底行不行,我特意在几个别的AI助手上问了同样的问题,AI的常规操作就不说了,先去查一些案例、贴几条法律法规。
但最后这个答案够不够清晰?能不能直接用?
我个人觉得,大家可以看下面图片对比下;夸克回答的结构更清晰、逻辑更有条理,连法律条文的引用,都更贴合实际场景,不堆术语,也不空讲原则,是真能看懂、能用的那种。
图片太长,你也可以搜同一个问题看看。

注释:左边为夸克APP实测,右边为其他AI助手
我又试了个更偏「动手」的问题:即拍即译。
怎么测呢?翻箱倒柜,翻出了本老古董——《英语统考大纲及学习指南》。(对,就是大学时人手一本的“考试圣经”。)
拍了两张照片传给它,让它帮我翻译。
本来也没抱什么希望,毕竟这种教材类的内容句子长、结构乱,AI一般都整不明白。
结果几秒钟,夸克翻完了,还自动分了段。原文、译文对照着排,我看着没什么毛病,关键是它翻得特别自然。
当年有它我四级估计早过了。顺便说一句,图片里的手是我的,真测的,不是假案例。
你也可以试试拍点别的。比如:拍本外文原版书、拍报纸、拍路牌、拍Excel、拍论文都行,这个助手特别妙,一键搞定。

有时候我们找东西,是在「搜资源」。
大多数资源都太散太杂怎么办?我这次换了个思路,直接问夸克:有没有心理学书籍的网盘资源?
它给我列出了一份清单,338 本心理学书籍,书名、作者、文件大小全都有,里面还有马斯洛、荣格、阿德勒这些经典著作。
有些链接,我点进去就能直接存进自己的夸克网盘;有些给的是下载方式,整个过程还挺顺,它帮我把“找”和“存”这两件事,一起干完了。
所以我,玩了将近一天,我才意识到:这已经不是单纯的「能聊天」了,它「能干活」。

体验完这几件「能干活」的小事,再看外部进展。
最近,OpenAI 也推出了浏览器功能,让 ChatGPT 能「自己去找」,这是AI发展的第二个阶段,从「能说话」到「能思考」。
夸克这一步「边找边干」的动作,也有异曲同工之处。
问问题同时,它已经在后台完成搜索、筛选、整合、比对,然后把结论整理成一段能直接使用的回答。
这种能力在交互上是质变的,因为作为一个用户,我不用手动去查、去点、去拼,直接得到「已经验证过的答案」,很方便。
也就是说,它把搜索和执行融合成了一件事。
02如果说,豆包代表「陪聊型AI」,价值在于帮用户表达、陪伴、娱乐;那么,夸克方向更像「任务型AI助理」,它的核心是解决问题、完成任务。
两条路都没错,一个在训练AI的「情感力」,一个在强化AI的「执行力」;但从用户角度看,这次夸克明显更接近「能帮我干点实事」的那个AI。
所以,我觉得,这次变化不只是产品层面的,AI助手这件事,正在迎来一个分水岭:
从陪聊,到帮忙;从生成信息,到执行动作;从理解问题,到完成任务,而夸克,正好站在这条分界线上,它在探索新机会点。
夸克这次的「聪明」,背后有一颗全新「脑子」。
我查了下,它用的是阿里最新 Qwen 闭源模型。这个模型定位有点意思,介于「实验室」和「落地」之间,属于那层最核心的引擎。
怎么理解呢?
过去我们说 AI 模型厉害,大多是形容它“知道得多”,但 Qwen 的强,是在「理解力」和「执行力」上;它能听懂模糊的问题,也能给出清晰的决策,这背后靠的阿里那颗「闭源大脑」。
闭源,不是封闭,更像是一种「可控的极致」;它让模型的稳定性、准确率、响应逻辑,都被打磨到工程级的水准。
这次 Qwen 闭源版,性能已经比 Qwen3-Max 更强一档,从去年到现在,在几乎所有国际榜单上都进了第一梯队。
03第一梯队这话,我说了不算,有数据可以作证。
比如:
Qwen3-Max 在 Chatbot Arena 上总分 1433 分,全球第三、开源模型第一;在大模型用coding解决真实世界问题SWE-Bench Verified 测试中拿下 69.6 分,跻身全球第一梯队;
在聚焦Agent工具调用能力的Tau2-Bench 测试中得 74.8 分,超过 Claude Opus 4 和 DeepSeek-V3.1;在数学推理的 AIME25 和 HMMT 测试中,更是双双拿到满分 100,这是国内第一次。
等等,有些英文你可能不太懂,我解释一下:
Chatbot Arena 是测「聊天综合水平」的;SWE-Bench 是测「写代码解决问题」的;Tau2-Bench 是测「AI调工具、连系统」的。
而 AIME25、HMMT,就是数学圈最硬核的两场考试,能拿满分,差不多等于 AI 在全球数学竞赛上考了第一。
所以,这一串数据说明一个很简单的事实:Qwen 的这颗「脑子」,是让 AI 终于长出了逻辑中枢。
举个简单例子:
你问它:「中国未来的新能源车会不会降价?」
普通模型大概率跟你扯一堆宏观分析;而 Qwen 会先分析市场结构,再拆变量,最后得出趋势,它不仅有答案,还知道答案是怎么来的。
这就是闭源模型的意义,它代表一种「工程化的确定性」,阿里在用闭源路线,让 AI 从「能输出」变成「能交付」,让每一句回答,都能自证逻辑。
所以,智远认为夸克「AI对话助手」模型的脑子,已经换代了。
阿里现在在用夸克验证「模型驱动的生活系统」,未来文档、网盘、邮箱、搜索、浏览器,都会被AI重新组织,你在一个入口提问,它能调用整个体系去完成。
换句话说,这是一次「模型—系统—生态」的打通,模型成了基础设施,让模型能从场景里长大,在生态里反馈,在使用中自我迭代。
智远判断,这是一场底层协议的改写。
当模型能在应用中自学习、自反馈、自优化时,它就成了一个会自己演化的系统。
阿里过去做电商、做云计算、做支付系统,都在解决人和系统效率的问题,现在,他们开始解决另一个问题:智能体之间的效率。
从搜索、到对话,到推理,再到能干活,AI助手已经进入第三阶段;而夸克,是这条进化线上,第一个能「跑起来」的窗口。
但问题是:当 AI 从会说、会想,进化到会做之后,下一个阶段又会是什么呢?值得进一步关注。
评论列表