核心命题:Loop Engineering 不是”提示词死了”,而是把 prompt 放回一个反馈系统:发现工作 → 分配任务 → 执行 → 验证 → 记录状态 → 决定继续/停止/交给人。若飞(架构师 JiaGouX)在这篇里不争论口号,而是给工程团队一份”小范围试 loop 的实操指南”——7 天试点 + 5 项准入小表 + 5 条保守原则。
本文是 [[Addy-Osmani-Loop-Engineering]] 的中文工程化深度解读 + 7 天试点设计 + 中文工程社区视角。
| 层级 | 管的什么 | 关键词 |
|---|---|---|
| Prompt | 下一句话怎么说 | 临时输入、上下文、推理 |
| Harness | 这一次任务怎么跑 | 状态边界、失败闭环、工作台 |
| Loop | 这类任务怎么持续发生 | 定期醒来、留下证据、自动验证 |
如果 Harness 是让 Agent 跑在一个可检查的工作现场里,Loop 接着问的是:工作现场能不能定期醒来,继续发现问题、处理问题、留下证据。
| 问题 | 对应能力 | 解决的风险 |
|---|---|---|
| 什么时候启动 | 自动化、定时任务、/goal、/loop |
靠人想起来才做 |
| 在哪里改 | worktree、隔离环境、临时分支 | 并行互相覆盖 |
| 按什么规则做 | Skills、项目规则、计划模板 | 每轮重新解释业务 |
| 能连到哪里 | MCP、插件、连接器、CLI | 只能看本地文件 |
| 谁来复核 | sub-agent、reviewer、测试 | 自写自审过于宽松 |
| 怎么接上下一轮 | 状态文件、issue、看板、日志 | 上下文中断和目标漂移 |
这些问题都不玄。难点在组合:这些东西放在一起后,系统还能不能停得住、看得清、交得出去。
我会把 loop 的第一站放在闭环,开环先放一放。 工程里有个老经验:先让一个小闭环跑稳,再谈更大的自动化。
Loop 适合”目标清楚、验证便宜、失败可回滚“的任务:
验证很便宜 → loop 放大收益;验证很贵 → loop 放大幻觉和成本
| 检查项 | 可以试 | 暂缓 |
|---|---|---|
| 输入 | 日志/issue/测试报告/文档 | 靠口头描述、边界每天变 |
| 输出 | 分类表/候选 PR/证据清单 | 直接改核心逻辑 |
| 验证 | 有测试/lint/链接检查/可复现命令 | 只能靠人读一遍 |
| 权限 | 默认只读、写入走隔离分支 | 直接改主分支或生产配置 |
| 停止 | 有预算/时间/证据不足等停止条件 | 只写”继续优化”、没有退出点 |
五项里只要有两项落在右边,先补测试、补状态、补边界,再考虑自动 loop。
示例任务卡(每日 CI 分流):
1
2
3
4
5
6
7
8
9
循环名称:每日 CI 分流
触发频率:每天 09:30
输入范围:过去 24 小时失败 job、最近 20 个 commit
最大运行:30 分钟
最大分支:一次最多处理 5 个失败簇
权限:默认只读;修复必须进入独立 worktree
验证:只运行相关测试,不跑全量回归
停止条件:无新失败、证据不足、预算到达、需要人工决策
交付物:失败分类表、可复现命令、候选 PR、剩余风险
这些边界如果不写,loop 会很快变成一个乐观的 while 循环。它会一直尝试,一直解释,一直”看起来有进展”。但 momentum 不是 progress。
1
2
3
4
5
## 当前目标
## 已尝试
## 已验证
## 禁止事项
## 下一步
如果没有状态记忆,loop 就会变成一串断开的 prompt。看起来连续,实际上每轮都在重新开始。
很多自动化出问题,不是因为不会继续,而是因为不知道什么时候停。
plan.md / issue / 看板复盘 5 指标:
| 指标 | 看什么 | 算可继续 |
|---|---|---|
| 命中率 | loop 找到的问题里有多少确实值得处理 | 人工复核后仍有稳定收益 |
| 误报率 | 有多少输出会浪费人的时间 | 不影响日常节奏 |
| 回滚率 | Agent 写入后有多少需要撤回 | 写入先控制在候选分支 |
| 成本 | token、运行时间、工具调用次数 | 账单和收益能对上 |
| 证据 | 每个结论有没有来源、命令、日志或测试结果 | 人能在 5 分钟内复核一轮 |
如果这些数说不清,问题通常不在 Agent,而在工作流本身还没有被定义清楚。
循环越自动,人的判断越要在场。因为 loop 本身不知道你是在加速理解,还是在逃避理解。这道分界线,最后还是要由人负责。
若飞对 loop 的态度:可以试,值得学,不用神化。
| 维度 | Addy 原文 | 若飞详解 |
|---|---|---|
| 视角 | 跨产品方法论综述 | 中文工程社区实操 |
| 重点 | 5+1 积木系统(Automations/Worktrees/Skills/Plugins/Sub-agents/Memory) | 6 工程问题 + 4 入口 + 5 准入 + 7 天试点 |
| 风险提示 | 3 个反噬警示 | 5 条保守原则 + momentum ≠ progress |
| 状态记忆 | 一笔带过 | 完整示例(plan.md 5 段式模板) |
| 试点路径 | 无 | 7 天具体路径 + 5 复盘指标 |
| 中文工程语境 | 无 | 大量”先只读后写入 / 先低风险后核心路径”等中文工程经验沉淀 |
plan.md 5 段式(目标/已尝试/已验证/禁止事项/下一步)标准化完整快问快答与产品演示细节见 [[../../raw/2026-06-Ruofei-Loop-Engineering-详解]] 原文。 速读摘要见 [[Loop-Engineering-详解-把反馈循环放进工程现场-digest]]。