MiniMax发布新一代大模型MiniMax M2.1,该版本在多语言编程与真实世界复杂任务处理上实现显著突破。模型系统性提升了Rust、Java、Golang等十余种编程语言能力,在SWE-bench Verified基准测试中获得74分,超越Claude Sonnet 4.5。其创新的VIBE基准测试显示,M2.1在全栈应用构建能力上接近顶级闭源模型水平。
MiniMax 正式推出其新一代模型 MiniMax M2.1。此次更新并非简单迭代,而是致力于解决真实世界复杂任务的实质性突破。M2.1 系统性增强了在多种编程语言及办公场景下的可用性,旨在将 AI 原生的开发与工作方式带给更广泛的开发者与企业。
一、核心能力升级:从专精到全能
M2.1 的升级围绕实用性展开,具体亮点包括:
- 卓越多语言编程能力:模型对 Rust、Java、Golang、C++、Kotlin、Objective-C、TypeScript/JavaScript 等语言的能力进行了系统性提升,覆盖从底层系统到应用层开发的完整链路,多语言任务整体表现达到业内领先水平。
- 全栈开发生态强化:针对行业短板,显著加强了原生 Android / iOS 移动开发能力。同时,提升了在 Web 与 App 场景中的设计理解与美学表达能力,能够构建复杂交互、3D 科学模拟与高质量可视化,推动 “vibe coding” 成为可交付的生产实践。
- 思维与执行协同进化:作为开源模型中率先系统性引入 交错式思考(Interleaved Thinking) 的系列,M2.1 的系统化问题解决能力再次升级。它不仅能确保代码正确性,更关注对“复合指令约束”的整合执行能力,从而在真实办公场景中具备更高可用性。
- 效率与体验优化:相比前代,M2.1 的回复及思维链更加简洁,在实际编程中响应速度显著提升,Token 消耗下降,在 AI 编码与智能体驱动的连续工作流中更加流畅高效。
- 卓越的框架泛化性:模型在 Claude Code、Droid、Cline、Kilo Code 等多种主流编程工具与 Agent 框架中均表现稳定且一致,并对 Skill.md、Claude.md 等上下文管理机制提供可靠支持。
二、性能证明:基准测试与生态认可
在多项核心软件工程基准测试中,M2.1 表现卓越:
- 在多语言场景下,性能已超过 Claude Sonnet 4.5 和 Gemini 3 Pro,并接近 Claude Opus 4.5。
- 在各类 Coding Agent 框架上进行的 SWE-bench Verified 测试中,展现出优秀的框架泛化性和稳定性。
- 为评估全栈应用构建能力,MiniMax 构建并开源了全新基准 VIBE。该基准通过创新的“Agent-as-a-Verifier”范式,自动评估生成应用在真实运行环境中的交互与视觉表现。M2.1 在 VIBE 综合榜单中以平均 88.6 分 的成绩,展现了接近顶级闭源模型的全栈构建能力。
来自全球合作方与开发者的评价,进一步印证了其价值:
- Factory AI (Droid) 评价其“在部分场景下比头部闭源模型更好”,是开发者急需的优质选项。
- Fireworks 指出 M2.1 在 Go、Rust 等多语言场景下表现稳定,精炼的推理机制能更高精度完成复杂任务,提供了效能与资源的均衡方案。
- Cline、Kilo、Roo Code 和 BlackBox 等平台均称赞 M2.1 在编码能力、速度、可靠性及多步任务处理的一致性上实现了显著提升,是兼顾高性能与高性价比的选择。
三、从虚拟代码到物理世界:能力展示
M2.1 的能力已不止于生成代码,更能驱动复杂的实际应用与物理实体:
- 物理世界交互:模型已成功驱动机器狗等实体机器人,展现了从虚拟学习到物理世界控制的泛化能力。
- 多领域开发实例:Web 开发:生成具备前卫美学设计的极简主义摄影网站,以及支持 7000+ 实例的交互式 3D 圣诞树。原生 App:开发了安卓重力感应模拟器、iOS 交互式桌面小组件等完整应用。复杂模拟与工具:基于 Web Audio API 开发 16 步鼓机模拟器;用 Rust 打造 Linux 安全审计 TUI 工具;利用 C++ 与 GLSL 实现复杂的光线渲染。办公自动化:作为“数字员工”,能完成从数据收集、分析、跨软件沟通到流程更新的全链路办公任务。
四、如何快速体验
MiniMax M2.1 已通过多种方式开放,方便开发者快速集成与使用:
- API 服务:模型 API 已在 MiniMax 开放平台正式上线,并提供标准版和速度更优的 M2.1-lightning 版本。平台全面支持自动缓存,以优化体验、成本与延时。
- 通用 Agent 产品:基于 M2.1 打造的 MiniMax Agent 已全面开放使用。
- 开源与部署:模型权重已在 Hugging Face 上开源,供研究、本地部署及深度定制。
- 超值套餐:原有的 Coding Plan 套餐价格不变,但用户将免费获得大部分时间更快的 M2.1-lightning 推理速度。
MiniMax M2.1 的发布,标志着开源模型在解决真实世界复杂任务的道路上迈出了坚实的一步,为开发者提供了强大、高效且经济的 AI 编程新选择。