读完 Agent Loop 工程手册,我有 8 个还没想明白的问题

核心结论:Agent Loop 是范式跃迁(Prompt→Loop),但 8 个真痛点没标准答案;SELF Protocol 是一份”治理薄壳”草稿,专门回答 Loop 没展开的那一面:转起来之后怎么不胡说、不失忆、不重复踩坑。

知识节点(10 个独立概念)

关联图谱

上游(基于 / 来自)

下游(应用于 / 验证于)

同级(横向 / 并列)

正文要点 + 8 个真痛点

4 个值得琢磨的设计法

  1. Stopping Condition 第一:模糊目标 = AI 自欺;可验证目标 = 真护栏
  2. Context 自动拼:失败日志 / 文件树 / 调用记录动态组装
  3. 失败是输入:把错误堆栈/截图/Diff 喂回下一轮;与”出错就停”反过来
  4. 6 种多 Agent 拓扑:手册给的”模式词典”,看着场景挑

8 个真痛点(速查)

| # | 痛点 | 作者土办法 | 仍未解 | |—|—|—|—| | 1 | 软目标停止条件 | LLM judge + 诚实 disclaimer | judge 漂移(上午 0.85 / 下午 0.6) | | 2 | Maker-Checker 同病 | 同模型 review 卡 | 不同模型?规则引擎? | | 3 | 护栏分层 | 认知可插拔 / 资源写死 | 这分法对不对? | | 4 | 记忆给多大 | 三层 l0/l1/l2 | 仍有失焦;token 截断 vs 相关性打分 vs 时间衰减? | | 5 | 理解力腐蚀 | 无 | 怎么对冲? | | 6 | 拓扑选型 | 试过”辩论对抗”更糊涂 | 哪些拓扑看着美用着崩? | | 7 | AI 一本正经胡说 | pre-publish review 清单 | 拦下 1 次,触发率不稳 | | 8 | 多 Agent 成本 | 便宜模型路由 + 中间产物不进 Prompt + 限轮数 | 模型分级?压缩?缓存? |

6 个对 Seetong 团队可借鉴动作

  1. Stopping Condition 优先:写循环 cron(神策崩溃归类 / TAPD 过期迭代关闭 / 反馈去重)前先写”什么算做完了”
  2. fail-back 改造isHaveStreamData=NO 不重置 idle 计时器(4G 弹窗 6 大漏洞 #4)→ 失败转输入
  3. 发布前自检清单:iOS/Android/Harmony 发版前过 pre-publish review(链接真假 / 数据出处 / 未核实结论)
  4. 诚实 disclaimer 三档:周报/简报里强制标”论文级 / 工件级 / 计划级”——软目标不假装完成
  5. 护栏分层:OpenClaw 资源类护栏(maxTokens/timeoutSeconds)写死;认知类护栏(pre-publish)做成可插拔 Skill
  6. 理解力腐蚀对冲:Seetong 内部每 2 周选 1 个 loop 让真人手动跑一遍

备注 / 限制 / 相关链接