1960亿参数却只“唤醒”110亿:阶跃星辰Step3.5Flash全链路开源,国产MoE智能体引擎杀入全球Top 2
当“千亿参数”不再等于“烧钱推理”
还记得那些动辄上百GB显存、推理慢如加载网页的大模型吗?阶跃星辰刚刚干了一件让开发者拍案叫绝的事——把一款总参数高达1960亿的MoE(Mixture of Experts)大模型,完整、透明、毫无保留地开源了。更关键的是:它在实际运行时,每次推理仅激活约110亿参数。相当于用一台旗舰级消费显卡,就能跑起“千亿级大脑”的智能体任务。
这不是营销话术,而是工程实绩。3月4日,阶跃星辰正式宣布 Step3.5Flash 全链路开源:从预训练权重(Base)、中训练权重(Midtrain),到自研的轻量级训练框架 Steptron,全部开放下载、可复现、可微调——连训练脚本和调度逻辑都一并奉上。
专为Agent而生,不是“大而全”,而是“快而准”
Step3.5Flash不是通用对话模型的平替,它是为智能体(Agent)场景深度定制的基座引擎。在代码生成、多步工具调用、长链决策等典型Agent任务中,它展现出罕见的稳定性与逻辑纵深能力。测试显示:单请求代码任务推理速度最高达 350 tokens per second(TPS)——这个数字,在当前开源模型阵营中已属第一梯队。
而它的“聪明”不止于快。得益于稀疏MoE架构的动态专家路由机制,模型能根据输入内容自动激活最相关的子模块,既保障复杂推理质量,又大幅压缩计算开销。换句话说:它知道什么时候该“动脑”,什么时候该“省电”。
开源社区正在用下载量和调用量投票
事实胜于宣言。上线短短数周,Step3.5Flash已在Hugging Face收获超30万次下载,稳居平台热门模型榜单前列;更值得关注的是它在 OpenRouter Trending 榜单登顶第一——这个榜单实时反映全球开发者真实API调用热度。
而在被誉为开源Agent“试金石”的知名项目 OpenClaw(社区戏称“小龙虾”)中,Step3.5Flash的调用量已强势跃居全球第二,仅次于某国际头部闭源模型。开发者们反馈:它在高并发Agent编排中掉帧率低、出错率小、工具调用意图识别准确——这些恰恰是落地智能体最关键的“隐形指标”。
全链路开源,是一次信任交付,也是一次生态基建
从权重、中间态、训练框架到部署文档,全链路开源不是炫技,而是向开发者交出“可审计、可定制、可演进”的完整技术栈。这意味着:
✅ 企业可基于Midtrain权重快速适配垂直领域Agent;
✅ 研究者能深入分析MoE路由策略与推理效率的关系;
✅ 初学者可通过Steptron框架低成本复现训练流程。
这不仅是国产大模型的一次技术亮剑,更是对“高性能≠高门槛”这一命题的有力回应——在算力成本日益敏感的今天,用更少的激活参数,完成更复杂的智能体任务,才是真正的下一代AI基础设施逻辑。
阶跃星辰没喊口号,但已经把钥匙塞进了每位开发者的手里。
接下来,轮到你造什么了?
