Cursor 自研 Composer2 杀到:代码能力逼近 GPT-5,价格却只要 1/10

AI 编程工具圈最近不太平静——不是因为又出了个新插件,而是因为一家公司真的“掀了桌子”。

本周四,AI 原生代码编辑器 Cursor 正式发布其第二代自研大模型 Composer2。这不是一次小修小补的升级,而是一次战略级转身:从依赖 OpenAI 和 Anthropic 的“API 消费者”,一跃成为手握核心模型、直面 GPT-5 和 Claude Opus 的“自主开发者”。


💡 不写诗、不算税,但能稳稳跑完 300 步的编程长任务

Composer2 的底层逻辑很纯粹:它只学代码,且只用代码训练

没有多模态幻觉,不掺杂通用语料,甚至主动剔除了所有非编程相关数据。这种“极度克制”的训练哲学,换来的是在真实开发场景中的惊人稳定性——尤其擅长处理需要多轮推理、跨文件修改、状态持续追踪的长程编码任务(比如重构一个微服务模块、修复遗留系统的耦合漏洞)。

性能怎么量?Cursor 团队拿出了自家构建的硬核评测基准 CursorBench(专注真实编程工作流,而非通用 MMLU 或 HumanEval)。结果令人侧目:

  • Composer2 得分:61.3
  • Anthropic 最强模型 Claude Opus 4.6:58.2
  • OpenAI 新晋旗舰 GPT-5.4 Thinking:63.9

换句话说:Composer2 已稳超 Claude Opus,与 GPT-5 仅差 2.6 分——而它的训练目标,从来就不是“全能”,而是“在写代码这件事上,做到无可替代”。


💸 价格不是“有竞争力”,是“重新定义成本”

如果说性能让人眼前一亮,那价格就是直接掀翻牌桌。

  • Composer2 标准版:$0.50 / 百万 tokens 输入
  • 对比 Claude Opus 4.6:$5.00 / 百万 tokens贵整整 10 倍
  • 即便启用加速版 Composer2Fast(响应更快、吞吐更高),价格依然显著低于竞品

算笔账:一个中型团队每月消耗 10 亿 tokens,用 Composer2 只需 $500;换用 Opus,则要 $5,000——一年省下超 50 万美元。这还不包括因响应延迟导致的工程师等待时间成本。

这不是“性价比高”,这是把底层模型从“奢侈品”拉回“水电煤”级别的基础设施。


🛡️ 从“壳应用”到“全栈 AI 编程平台”:一场生存之战

Cursor 今天的底气,来自它已坐拥 100 万日活用户 + 5 万付费企业客户,估值逼近 500 亿美元。但光鲜背后,是长期隐痛:过去高度依赖 OpenAI 和 Anthropic 的 API,既付高昂调用费,又面临对手“降维打击”——比如 Anthropic 推出的 Claude Code,正以补贴价疯狂抢夺开发者心智。

Composer2 的真正使命,远不止于提速或省钱。它是 Cursor 构建垂直闭环护城河的关键一子:
✅ 自研模型 → ✅ 深度适配编辑器 → ✅ 紧耦合调试/测试/部署流程 → ✅ 数据飞轮反哺模型迭代

从此,Cursor 不再是“套着别人模型外壳的漂亮界面”,而是一个从 UI 到 Kernel 全链路可控的 AI 编程操作系统


🔮 下一站:当“好用”变成“必须用”

GPT-5 和 Claude Opus 仍在通向 AGI 的宏大叙事里奔跑;而 Composer2 选择了一条更锋利的路径:在程序员每天敲下的每一行代码里,赢下确定性、速度和成本的三重胜利。

它不宣称“理解世界”,但它知道 git rebase -i 后如何安全修复 merge conflict;
它不生成十四行诗,但它能在 200 行 TypeScript 类中精准注入可观测性埋点;
它不跟你聊哲学——但它会让你今天下班前,真·合上笔记本。

这场关于“谁真正懂开发者”的战争,才刚刚进入中场。而 Cursor,已经亮出了自己的底牌。

作加

类似文章