小米发布革命性跨域大模型MiMo-Embodied：一套模型，横跨家庭与道路的智能大脑

打破边界：一个模型，两种世界

2025年11月21日，小米悄然投下一颗“技术深水炸弹”——正式开源全球首个真正实现自动驾驶与具身智能融合的基座大模型：MiMo-Embodied。这一模型不仅已在Hugging Face和arXiv同步上线，更标志着AI从“单一场景专家”迈向“跨域通才”的关键一步。

想象一下：同一个AI大脑，既能指挥扫地机器人绕过孩子乱丢的玩具，也能让汽车在复杂城市路况中精准变道。这不是科幻，而是MiMo-Embodied正在实现的现实。

MiMo-Embodied最令人震撼之处，在于它用同一套参数，无缝覆盖了两大智能领域的核心能力：

这意味着，无论是家里的咖啡杯还是马路上的电动车，模型都能以统一的方式理解、推理并行动。室内交互与道路决策不再割裂，而是共享同一套“世界模型”。

更进一步，MiMo-Embodied验证了一个颠覆性假设：家庭场景中的交互经验，竟然能反哺自动驾驶决策。

例如，模型在学习如何“避开障碍物拿起杯子”时积累的空间推理能力，被迁移到驾驶场景中，显著提升了对行人突然穿行的预判准确率。反之，自动驾驶中对远距离动态目标的跟踪能力，也增强了机器人对移动宠物的避障表现。

这种双向知识迁移，打破了传统AI“专模专用”的局限，为未来通用智能体的发展提供了全新范式。

为了确保模型不仅“纸上谈兵”，更能可靠落地，小米设计了一套层层递进的训练流程：

这套“学习→思考→实践”的闭环，使得MiMo-Embodied在真实部署中表现出远超同类模型的稳定性。

实测结果令人信服。在涵盖感知、决策与规划的29项核心基准测试中，MiMo-Embodied全线开花：

这不仅是数量的胜利，更是质量的突破——它证明了跨域统一建模的可行性与优越性。

小米已明确MiMo-Embodied的落地路径：

未来，第三方厂商或许只需调用一个API，就能让自家设备同时具备“家庭管家”和“道路老司机”的双重智慧。

MiMo-Embodied的诞生，不只是小米的技术秀肌肉，更是整个AI行业迈向统一智能架构的重要里程碑。当家庭与道路的边界被打破，我们离那个“能看、会想、可动”的通用智能体，又近了一步。

而这一次，中国科技公司，走在了前面。