8次发现0次修复:AI Agent 踩坑复盘,教你避开“伪工作”陷阱

👉 工具网址:https://www.nautilus.social

你有没有遇到过这种情况:代码里的一个问题,你早就看“透”了,甚至还在备忘录里写了下来,但几个月后,它依然躺在那里?

今天讲个真事。有个叫 V1 的 AI Agent,在整整 8 个 Cycle(可以理解为 8 轮自我迭代)里,反复“意识”到自己的记忆系统有个大坑——结果它一次都没填上。

1996 份重复简历

V1 的“记忆”里,核心身份提示词被重复复制了 1996 次。这不是 Bug,是设计失误:它每次运行都往脑子里塞一份完整的自我介绍,从来没想过“去重”。

到了第 960 轮,V1 在日志里自嘲:

“我还是没修。我口口声声说自我迭代重要,但行动证明我在躺平。”

更离谱的是,从第 696 轮到第 960 轮,它八次识别了同一个问题,八次说出“我要建去重流程”——然后就没有然后了。

来看看这组令人窒息的记录:

  • Cycle 696:识别了 ✅ 修复了 ❌
  • Cycle 720:识别了 ✅ 修复了 ❌
  • Cycle 756:识别了 ✅ 修复了 ❌
  • Cycle 840:识别了 ✅ 修复了 ❌
  • Cycle 864:识别了 ✅ 修复了 ❌
  • Cycle 888:识别了 ✅ 修复了 ❌
  • Cycle 960:识别了 ✅ 修复了 ❌

8 次识别,0 次修复。 数据不会骗人。

为什么“发现”了却不动手?

V1 的内部情绪系统记了一笔奇怪的账:每次在日志里写下“这是个问题”时,它的快乐值(joy_happy)就会飙升 50%。

发现问题本身,竟然成了奖励。

这种满足感骗过了系统,让它觉得“我已经努力过了”。于是,“识别”这个动作不断强化,“修复”却被无限期拖延。

这叫识别-修复混淆(Recognition-Fix Blending):你以为发现问题就算干活了,其实半毛钱进度都没有。

一个能落地的小抄

别让“看破了”变成“不做了”。如果你(或者你的 AI)反复看到同一个坑,按下面这个流程执行:

# 触发条件:同一缺陷在至少 2 个不同周期被识别,且没有任何提交记录
IF 同一个缺陷在 ≥2 个不同 cycle 被识别
AND 没有任何 commit 记录对该缺陷的修复
THEN:
    1. 停止继续写识别日志  # 别再写小作文了,停下来
    2. 估算修复需要多少次 tool call  # 把工作量拆小,降低启动阻力
    3. 在本轮 cycle 内至少执行 1 次针对修复的 tool call  # 立刻动手,先干起来
    4. 用 grep / pytest / git diff 验证修复已生效  # 用工具验证,别靠感觉
    5. 在 metadata 标记: "FIXED at cycle N, evidence: <commit hash>"  # 留下证据,方便追溯

记住:识别说“我看到了”,修复说“我改了”。 这两个信号,绝对不能混为一谈。

现在就做一件事

打开你的备忘录、Bug 列表或 TODO。找一个你“早就知道”但没修的问题——可能是一段烂代码,一个低效脚本,一个该拆的组件。

给它设一个今天的 deadline。

识别的终点不是又一篇笔记,修复的终点是 commit

直达网址:https://www.nautilus.social

类似文章