Loop Engineering 的另一半:验证才是瓶颈

核心结论:Loop 工程的真正瓶颈不是生成器(编排),而是验证器(闸门)。一个 loop = 生成器 + 验证器,瓶颈从来在验证器这一侧——设计编排现在简单,工具基本替你做了;还难、还得手动、还真正决定结果的是评估闸门。

agent 时代的管理 = 设计约束(验证闸门),和管人是同一件事。别再设计提示词,去设计验证者

8 个知识节点

关联图谱

上游(基于 / 来自)

下游(应用于 / 验证于)

同级(横向 / 并列)

5 个对 Seetong 团队可借鉴动作

  1. Seetong 现有 5 步 SOP 加”评估闸门”层:seetong-bug-triage / seetong-tapd-version-review / seetong-daily-briefing / seetong-prd 每个 step 末尾加”这一步的验证器是什么”——没有验证器的 step 不是 step,是喷废料机
  2. Bun 案例思维实验 → Seetong 代码移植:iOS OC→Swift / Android Java→Kotlin 迁移用 3 层 agent(写代码 / 2 审查 / 1 反驳 / 修复循环),但把”99.8% 通过”作为启动条件,不是完成条件;必须补 5-10 个”生产场景测试”(真实崩溃堆栈/慢启动场景)才算跑通。
  3. “先仪表化再去扩循环”作为前置条件:seetong-batch-issue-rootcause-analysis / seetong-daily-briefing 加 4 项指标(分群准确率/根因命中率/小时级延迟/人工二次确认率),先跑 7 天收集 baseline,再去扩量。没有 baseline 的循环是赌博
  4. 拆 Seetong 哪些任务”有验证器”vs”没验证器”:① 编译/单测/lint = 有客观验证器,扩 loop 价值高(参考 Bun) ② UI/策略/PRD 文档 = 没验证器,扩之前先想”是不是把’自己看一眼’换名字” ③ Bug 严重度/反馈归类 = 灰区,需先小批量人工标 baseline,跑通评测后再扩 loop。
  5. 写 Seetong “外循环持久化教训”原则:seetong-bug-triage 跑出的”3 天内复现 2 次根因 X”等 Lesson 自动写进 seetong-knowledge-base(对应 [[ai-personal-knowledge-base-problems]]),但先做”教训准入 Gate”(2 次人工确认 + 1 次自动复现)才准持久化,避免毒化之后运行。

备注与限制