当大模型不再“空想”:前通义千问技术负责人揭秘AI的“行动革命”
大模型正在悄悄“长大”——从答题机器,到动手做事的伙伴
还记得那个在考试中总能写出惊艳答案、却连订一杯咖啡都要人类代劳的大模型吗?它正在经历一场静默而深刻的蜕变。3月26日晚,前阿里通义千问(Qwen)大模型技术负责人林俊旸在离职数周后首次公开发声,没有复盘过往荣光,而是抛出一个直击行业痛点的判断:大模型的下一程,不是“想得更深”,而是“动得更准”。
这不是修辞,而是一次范式迁移——从“推理式思维”(Reasoning-First)全面转向“智能体思维”(Agentic Thinking)。
为什么“多想一会儿”已经不够用了?
过去一年,整个行业都在卷“思考深度”:让模型链式推理更长、步骤更细、中间结论更严谨。但林俊旸一针见血地指出:思考本身不是目的,行动才是出口。
真正有价值的智能,不是在虚拟空间里完成一道高难度数学题,而是能在真实世界中——比如协调三方会议、调试API报错、甚至帮用户对比三家电商的满减规则——动态规划、即时纠错、持续推进。
换句话说:模型思考的终点,必须是动作的起点。
一次关键试错:当“思考”和“执行”被硬塞进同一个模型
林俊旸坦率复盘了千问团队在2025年初的一次重要工程尝试:试图打造一个“全能型”统一模型,让它根据问题复杂度自动决定“该深思还是该速答”。
理想很丰满,现实却给了团队一记清醒剂。
他们发现:推理类数据(如数学证明、代码生成)和指令类数据(如“写一封辞职信”“总结会议纪要”)在数据分布上存在本质差异——就像让一位哲学家同时兼任快递员,两种能力所需的底层模式、响应节奏与容错边界完全不同。
结果呢?模型既无法高效完成轻量指令(响应慢、幻觉多),又难以支撑高强度推理(逻辑易断裂、成本飙升)。最终,Qwen果断拆分路线:独立发布 Qwen-Instruct(专注精准执行)与 Qwen-Thinking(专注深度推理)——这不仅是产品策略调整,更是对AI能力边界的诚实承认。
“好思考”的新定义:不炫技,只务实
林俊旸还挑战了一个常见迷思:推理链越长,模型就越聪明?
他明确表示:盲目堆砌思维步骤,往往只是用算力掩盖设计缺陷。真正的“高质量思考”,必须能自然导出可执行的动作,并在环境反馈中快速迭代——比如看到天气预报说下午有雨,不是输出一段气象分析,而是主动帮你把晾晒中的衣服收进阳台。
这也意味着,未来AI研发的重心将发生位移:
– ❌ 不再只优化“模型参数”
– ✅ 而要联合优化 “模型 + 环境 + 评估器 + 协同机制” 整个闭环
环境仿真、多智能体分工、鲁棒性评估器……这些曾被视作“配套工具”的模块,正加速跃升为AI系统的核心支柱。
结语:我们正在迎接一个“会做事”的AI时代
林俊旸的这篇长文,没有PPT式的宏大叙事,却处处透露着一线工程师的克制与锋利。它提醒我们:AI的进化从来不是单点突破,而是一场系统重构——当模型开始为“下一步做什么”而思考,而不是为“下一句说什么”而生成,真正的智能体时代,才算真正启程。
而这场变革的标尺,将越来越简单:
它解决问题了吗?它推动事情向前了吗?它在真实世界里,有没有留下一点不可替代的痕迹?
