今天,稀宇科技正式开源并上线了 MiniMax M2,专为 Agent 和代码而生,仅Claude Sonnet 8%价格,2倍速度,限时免费!
MiniMax-M2 是一款轻量、快速且极具成本效益的 MoE 模型(230B 总参数,10B 激活参数)。它在保持强大通用智能的同时,专为编码和智能体任务进行了深度优化。凭借仅10B 的激活参数,它提供了开发者期待的端到端工具使用性能,同时其小巧的“身材”也更易于部署和扩展。

卓越智能
根据 Artificial Analysis 的评测结果,MiniMax-M2 在数学、科学、指令跟随、编码和智能体工具使用方面,展现了极具竞争力的通用智能,排到了全球前五:

精通编码
MiniMax-M2具备强大的端到端开发能力,包括多代码文件处理、执行“编码-运行-调试”的完整循环,以及通过测试验证来自动修复代码。它在 Terminal-Bench 和 (Multi-)SWE-Bench 等基准测试中取得了出色的表现,并且在实际生产环境中,展现出很强的实用价值。
强大的Agentic能力
MiniMax-M2能够出色地规划并执行复杂的工具链,协同调用 Shell、浏览器、Python代码执行器和各种MCP工具。在 BrowseComp 评测中,它不仅可以挖掘到难以查找的信息源,还能保持信息来源的可追溯性,并具备自我纠错与恢复的能力。
高效设计
这款仅有10B激活参数(总参230B)的轻量级模型,在保持卓越性能的同时,实现了更低的延迟与成本,以及更高的吞吐效率,完美契合了新兴多智能体工作流对高效协同与快速响应的需求。它的出现顺应了模型发展的新趋势,即业界正积极转向那些“易于部署,且在编码和智能体任务上表现卓越”的解决方案。
02基准测试概览MiniMax-M2 在一系列强调端到端编码和智能体工具使用的基准测试中表现优异。这些任务(如 SWE-bench, Terminal-Bench, BrowseComp, HLE (w/ tools), FinSearchComp-global 等)的性能与开发者在终端、IDE 和 CI 中的日常体验高度相关。

在 Artificial Analysis (AA) 综合智能基准测试中,MiniMax-M2表现卓越,总分位列全球开源模型榜首。该评测体系全面覆盖了模型在数学、科学与编码等多个核心领域的能力。

为了大家更方便的使用Agent相关的能力,在国内上线了由M2模型驱动的Agent产品,并且对海外的版本做了升级。在MiniMax Agent中,提供了两种模式:
Lightning高效模式:高效极速版Agent,在对话问答/轻量级搜索/轻量级代码场景极速输出,且在效果上以强大agentic能力升级对话类产品体验。
Pro专业模式:专业agent能力,在复杂长程任务上最佳表现,擅长深度研究/全栈开发/PPT/报告撰写/网页制作等等。
受益于M2本身的推理速度,除了性价比高,M2驱动的Agent完成复杂任务的时间也显著更加流畅。
注:文章转载自稀宇科技公众号