MiniMax-M2 正式亮相：10B 参数，专为极速编码与智能体工作打造

今天，稀宇科技正式开源并上线了 MiniMax M2，专为 Agent 和代码而生，仅Claude Sonnet 8%价格，2倍速度，限时免费！

MiniMax-M2 是一款轻量、快速且极具成本效益的 MoE 模型（230B 总参数，10B 激活参数）。它在保持强大通用智能的同时，专为编码和智能体任务进行了深度优化。凭借仅10B 的激活参数，它提供了开发者期待的端到端工具使用性能，同时其小巧的“身材”也更易于部署和扩展。

01核心亮点

卓越智能

根据 Artificial Analysis 的评测结果，MiniMax-M2 在数学、科学、指令跟随、编码和智能体工具使用方面，展现了极具竞争力的通用智能，排到了全球前五：

精通编码

MiniMax-M2具备强大的端到端开发能力，包括多代码文件处理、执行“编码-运行-调试”的完整循环，以及通过测试验证来自动修复代码。它在 Terminal-Bench 和 (Multi-)SWE-Bench 等基准测试中取得了出色的表现，并且在实际生产环境中，展现出很强的实用价值。

强大的Agentic能力

MiniMax-M2能够出色地规划并执行复杂的工具链，协同调用 Shell、浏览器、Python代码执行器和各种MCP工具。在 BrowseComp 评测中，它不仅可以挖掘到难以查找的信息源，还能保持信息来源的可追溯性，并具备自我纠错与恢复的能力。

高效设计

这款仅有10B激活参数（总参230B）的轻量级模型，在保持卓越性能的同时，实现了更低的延迟与成本，以及更高的吞吐效率，完美契合了新兴多智能体工作流对高效协同与快速响应的需求。它的出现顺应了模型发展的新趋势，即业界正积极转向那些“易于部署，且在编码和智能体任务上表现卓越”的解决方案。

02基准测试概览

MiniMax-M2 在一系列强调端到端编码和智能体工具使用的基准测试中表现优异。这些任务（如 SWE-bench, Terminal-Bench, BrowseComp, HLE (w/ tools), FinSearchComp-global 等）的性能与开发者在终端、IDE 和 CI 中的日常体验高度相关。

在 Artificial Analysis (AA) 综合智能基准测试中，MiniMax-M2表现卓越，总分位列全球开源模型榜首。该评测体系全面覆盖了模型在数学、科学与编码等多个核心领域的能力。

为了大家更方便的使用Agent相关的能力，在国内上线了由M2模型驱动的Agent产品，并且对海外的版本做了升级。在MiniMax Agent中，提供了两种模式：

Lightning高效模式：高效极速版Agent，在对话问答/轻量级搜索/轻量级代码场景极速输出，且在效果上以强大agentic能力升级对话类产品体验。

Pro专业模式：专业agent能力，在复杂长程任务上最佳表现，擅长深度研究/全栈开发/PPT/报告撰写/网页制作等等。

受益于M2本身的推理速度，除了性价比高，M2驱动的Agent完成复杂任务的时间也显著更加流畅。

注：文章转载自稀宇科技公众号

游戏百科

MiniMax-M2 正式亮相：10B 参数，专为极速编码与智能体工作打造

热门分类