1960亿参数却只“唤醒”110亿：阶跃星辰Step3.5Flash全链路开源，国产MoE智能体引擎杀入全球Top 2

当“千亿参数”不再等于“烧钱推理”

还记得那些动辄上百GB显存、推理慢如加载网页的大模型吗？阶跃星辰刚刚干了一件让开发者拍案叫绝的事——把一款总参数高达1960亿的MoE（Mixture of Experts）大模型，完整、透明、毫无保留地开源了。更关键的是：它在实际运行时，每次推理仅激活约110亿参数。相当于用一台旗舰级消费显卡，就能跑起“千亿级大脑”的智能体任务。

这不是营销话术，而是工程实绩。3月4日，阶跃星辰正式宣布 Step3.5Flash 全链路开源：从预训练权重（Base）、中训练权重（Midtrain），到自研的轻量级训练框架 Steptron，全部开放下载、可复现、可微调——连训练脚本和调度逻辑都一并奉上。

专为Agent而生，不是“大而全”，而是“快而准”

Step3.5Flash不是通用对话模型的平替，它是为智能体（Agent）场景深度定制的基座引擎。在代码生成、多步工具调用、长链决策等典型Agent任务中，它展现出罕见的稳定性与逻辑纵深能力。测试显示：单请求代码任务推理速度最高达 350 tokens per second（TPS）——这个数字，在当前开源模型阵营中已属第一梯队。

而它的“聪明”不止于快。得益于稀疏MoE架构的动态专家路由机制，模型能根据输入内容自动激活最相关的子模块，既保障复杂推理质量，又大幅压缩计算开销。换句话说：它知道什么时候该“动脑”，什么时候该“省电”。

开源社区正在用下载量和调用量投票

事实胜于宣言。上线短短数周，Step3.5Flash已在Hugging Face收获超30万次下载，稳居平台热门模型榜单前列；更值得关注的是它在 OpenRouter Trending 榜单登顶第一——这个榜单实时反映全球开发者真实API调用热度。

而在被誉为开源Agent“试金石”的知名项目 OpenClaw（社区戏称“小龙虾”）中，Step3.5Flash的调用量已强势跃居全球第二，仅次于某国际头部闭源模型。开发者们反馈：它在高并发Agent编排中掉帧率低、出错率小、工具调用意图识别准确——这些恰恰是落地智能体最关键的“隐形指标”。

全链路开源，是一次信任交付，也是一次生态基建

从权重、中间态、训练框架到部署文档，全链路开源不是炫技，而是向开发者交出“可审计、可定制、可演进”的完整技术栈。这意味着：
✅ 企业可基于Midtrain权重快速适配垂直领域Agent；
✅ 研究者能深入分析MoE路由策略与推理效率的关系；
✅ 初学者可通过Steptron框架低成本复现训练流程。

这不仅是国产大模型的一次技术亮剑，更是对“高性能≠高门槛”这一命题的有力回应——在算力成本日益敏感的今天，用更少的激活参数，完成更复杂的智能体任务，才是真正的下一代AI基础设施逻辑。

阶跃星辰没喊口号，但已经把钥匙塞进了每位开发者的手里。
接下来，轮到你造什么了？

1960亿参数却只“唤醒”110亿：阶跃星辰Step3.5Flash全链路开源，国产MoE智能体引擎杀入全球Top 2

AI超声黑科技来袭！这款”听音识病”模型或将改变全球医疗格局

AI购物新纪元：Google发布UCP协议，让聊天机器人替你“一键下单”

AI云服务黑马CoreWeave斩获207亿美元大单，英伟达力挺、Meta与OpenAI联手押注未来

AI视频神器Sora上线即登顶：邀请码比春运票还难抢，网友狂拍大片刷屏

Sora的华丽冒险：400万用户背后的50亿美金豪赌

AI代写作业成常态？韩国小学生正经历一场“思维外包”危机

类似文章