作加

高效推理新标杆:蚂蚁百灵开源 Ring-flash-2.0,100亿参数仅用6.1亿激活


开源高性能思考模型震撼登场

近日,蚂蚁百灵大模型团队重磅推出并开源了一款高性能思考模型——Ring-flash-2.0。这款模型基于Ling-flash-2.0-base进行深度优化,在人工智能推理效率与性能之间实现了前所未有的平衡。

Ring-flash-2.0拥有100亿总参数,但每次推理仅激活其中6.1亿参数,这种独特的激活机制不仅极大节省了计算资源,还显著提升了模型的响应速度和效率。可以说,它在性能与能耗之间找到了一个近乎完美的平衡点。

性能表现亮眼,媲美高端闭源模型

尽管参数规模仅为6.1亿,但Ring-flash-2.0在多个高难度任务中展现出惊人的能力。它在数学竞赛、代码生成和逻辑推理等复杂任务中表现出色,不仅超越了其他40亿参数的同类模型,甚至可以与一些更大规模的开源稀疏模型(如MoE)以及闭源高性能API一较高下。

这无疑为开发者提供了一个高效、轻量、强大的替代方案,尤其适合对推理速度和成本控制有较高要求的应用场景。

创新训练流程:两阶段强化学习

为了进一步提升模型的推理能力,蚂蚁百灵团队设计了一套创新的两阶段强化学习(RL)训练流程

  1. 轻量 Long-CoT SFT(有监督微调):通过长序列链式思考训练,让模型掌握多种推理方式。
  2. RLVR(可验证奖励强化学习) + RLHF(人类反馈强化学习):先利用可验证奖励机制激发模型的深层推理能力,再结合人类反馈提升模型的通用性和实用性。

这套训练流程不仅提升了模型的逻辑推理和复杂任务处理能力,也为未来的研究者提供了清晰的技术路径和训练范式。

完全开源,资源免费获取

值得一提的是,Ring-flash-2.0的模型权重、训练方案和数据配方均已完全开源,开发者和研究人员可以自由下载和使用,推动更多创新应用的诞生。

你可以在以下平台获取模型资源:

展望未来:开启智能应用新篇章

随着AI技术的不断演进,Ring-flash-2.0的推出无疑为未来的智能应用开辟了新的可能性。它不仅展示了高效推理模型的广阔前景,也预示着开源社区将在推动AI发展方面扮演越来越重要的角色。

如果你是AI研究者、开发者,或者只是对前沿技术感兴趣的爱好者,Ring-flash-2.0绝对值得你关注和尝试。