GPT-5.1-Codex-Max重磅发布:代码生成进入“长记忆”时代


更聪明的AI程序员来了

OpenAI刚刚扔下一颗重磅炸弹——GPT-5.1-Codex-Max正式上线。这不是一次小修小补的版本迭代,而是一次针对复杂软件工程场景的深度进化。这款新模型专为处理数十万行代码级项目而生,真正让AI具备了“通读整个代码库”的能力。

最引人注目的,是它引入了一项名为 “compaction”(压缩) 的全新机制。简单来说,就像人类程序员不会记住每一行临时变量,而是提炼出关键逻辑一样,Codex-Max现在能在运行时自动整理上下文记忆,保留核心状态,丢弃冗余信息。这意味着在长时间、多轮交互的开发任务中,AI不再容易“忘记”前面的需求或架构设计,显著降低了上下文丢失的风险。

性能跃升:不只是数字游戏

数据不会说谎:

  • 在衡量软件工程能力的权威基准 SWE-bench 上,准确率从73.7%飙升至77.9%
  • 面向独立开发者任务的表现更猛,达到79.9%,已经接近“可靠副驾驶”的水平。
  • 更高效的同时也更省钱:令牌消耗减少约12%,对于高频调用的企业用户来说,这是一笔实实在在的成本节约。

此外,安全性也同步升级。不安全内容检测的“illicit”评分从0.860提升到0.920。不过OpenAI也坦诚表示,当前模型的网络安全能力尚未达到“高能力”标准,关键系统仍需人工审核把关。

谁能用上?价格变了没?

好消息是,Codex-Max现已取代旧版,成为Codex系列的默认模型。开发者可以通过以下方式立即使用:
ChatGPT Enterprise
OpenAI API
GitHub Copilot

更令人欣慰的是,定价维持不变:每百万输入token 5美元,输出token 15美元。对于批量调用的用户,还能享受50%的折扣,性价比进一步提升。

未来展望:企业专属版本已在路上

OpenAI还透露了一个重要计划:预计在2026年第一季度推出 “Codex-Max-Enterprise” 专用版本。该版本将支持私有化部署,并允许企业自定义代码风格与规范,意味着大型组织可以在完全可控的环境中,训练出符合自身技术栈的“专属AI工程师”。

当AI不仅能写代码,还能记住整个项目的来龙去脉,我们或许正站在一个新时代的门槛上——那个“AI结对编程”从概念走向常态的时代,终于要来了。