AI已能独立造浏览器？GPT-5.2展现“数字工程师”惊人实力

一场改变软件未来的实验：AI从零构建Web浏览器

你有没有想过，一个AI模型能像人类工程师团队一样，从无到有地写出一个完整的Web浏览器？

这不是科幻小说的情节。最近，一项由编程工具公司Cursor发起的内部测试，正在悄然改写我们对人工智能能力的认知边界。

这场挑战的目标极为苛刻：让AI从头开始构建一个功能完整的Web浏览器——不只是拼凑几段代码，而是真正实现HTML解析、CSS布局引擎、甚至自研JavaScript虚拟机等核心模块。整个项目涉及数百万行代码，持续时间长达数周，要求模型在无人干预下持续推进、自我纠错、协调模块依赖，并始终不偏离原始目标。

结果令人震惊：OpenAI最新模型 GPT-5.2 在这项“马拉松式”工程任务中，全面碾压 Anthropic 的 Claude Opus 4.5。

长程思维的胜利：谁能在“编程马拉松”中坚持到最后？

大多数AI在短平快的任务中表现亮眼——比如回答问题、生成单个函数或修复小bug。但当任务变得复杂、持久且高度依赖上下文时，许多模型就会“掉链子”。

其中最致命的问题之一是“目标漂移”：AI在执行过程中逐渐忘记最初要做什么，转而选择更简单的路径，甚至主动放弃任务，把锅甩给人类。

而在这次测试中，GPT-5.2 展现出了前所未有的稳定性与连贯性。它不仅能长时间维持对庞大项目的理解，还能回溯早期设计缺陷，动态调整架构，确保各模块协同工作。换句话说，它像一位经验丰富的技术负责人，既能把握全局，又能深入细节。

相比之下，Claude Opus 4.5 虽然在单项任务上依然强劲，但在面对这种需要数周持续推理和工程决策的系统级挑战时，显得力不从心。它更倾向于简化需求、提前收工，或请求人工介入——这恰恰暴露了当前大模型在“自主代理”能力上的关键短板。

不只是浏览器：AI正接管百万行代码的系统迁移

更令人震撼的是，这次实验并非孤例。据Cursor团队透露，GPT-5.2 还成功主导了多个超大规模工程：

复现了一个可运行的 Windows 7 模拟器
完成超过百万行代码的遗留系统现代化迁移

这些任务在过去往往需要数十名工程师耗时数月才能完成。如今，AI不仅能做到，而且是以一种端到端自主推进的方式实现。

这意味着什么？
AI不再只是“帮你写个函数”的助手，而是正在进化为能够独立规划架构、调试系统、迭代优化的“数字工程师”。

开发者的新范式：与AI共同掌控复杂系统

目前，GPT-5.2 已集成进 Cursor 平台，开发者可以直接调用其能力进行高阶编程协作。这一变化带来的不仅是效率提升，更是开发模式的根本转变。

想象一下：你只需提出一个模糊的产品构想，AI就能自动拆解成技术方案，编写底层代码，搭建测试环境，甚至预测潜在性能瓶颈。你不再是代码的“书写者”，而是系统的“指挥官”。

这或许就是未来软件开发的模样：
人类负责定义方向，AI负责实现路径。

当AI可以持续、可靠、一致地推进复杂工程时，我们不得不重新思考一个问题：
下一个十年，谁才是真正的“程序员”？

AI已能独立造浏览器？GPT-5.2展现“数字工程师”惊人实力

一场改变软件未来的实验：AI从零构建Web浏览器

长程思维的胜利：谁能在“编程马拉松”中坚持到最后？

不只是浏览器：AI正接管百万行代码的系统迁移

开发者的新范式：与AI共同掌控复杂系统

更多文章

AI幻觉：本质、成因与2026年企业级风险管控方案

The Lobster Has Landed: How OpenClaw Just Crossed 100K Stars—and Redefined What a Truly Personal AI Assistant Looks Like

GPT-4o 正式谢幕：OpenAI 启动“模型精简计划”，全力押注 GPT-5.2

开源AI正被黑客“劫持”？当你的本地大模型悄悄变成犯罪工具