淘宝主播 Agent 的 Harness 工程实战

核心结论:把 Harness 从”个人助手”推到”淘宝主播”高风险生产场景后,工程骨架的本质是业务/框架彻底分层 + 物理存储分治(MySQL/Hologres/GitLab)+ 纵深防御 5 层 + 记忆对账信任度闭环——不是”加更多规则”,而是把”会变的”和”不变的”拆成两层独立演化。

8 个知识节点

关联图谱

上游(基于 / 来自)

下游(应用于 / 验证于)

同级(横向 / 并列)

5 个对 Seetong 团队可借鉴动作

  1. Harness 六元组体检:给 Seetong 所有 Skill 落表自查 E/T/C/S/L/V 缺哪一块,补缺后再谈”提升效率”——不要先优化”能跑但不知道对不对”的流程。
  2. 业务/框架分层重写 Skill 库:seetong-tapd-version-review / seetong-bug-triage / seetong-daily-briefing / seetong-prd / seetong-decompose 现在”业务规则+工程实现”混在一起,业务一变就要动骨架。改成”Skill 声明 = 能干什么+风险等级+参数校验,框架兜住上下文/状态/Hook/观测“,业务迭代不再踩工程。
  3. 记忆三层 + 记忆对账用到简报:seetong-daily-briefing 现在是 L1 一句话,缺 L2(神策/友盟/TAPD)和 L3(运营类别)。加 L2+L3 就能给”主播说的关注点 vs 实际数据高发”对账,矛盾 ≥ 3 次触发主动确认。
  4. Approval 4 档作为 Seetong Agent 操作硬规则:自动关过期迭代=auto,自动打标签=soft-gate,自动修 7 天未响应 Bug=hard-gate(阻塞等二次确认),自动改版本号/动主分支=block 即时拒绝。与 [[Claude-Code一周年回顾-Boris-Cat]] “Auto Mode 比手动更安全”合并用。
  5. 写”Seetong PlanEngine” 7 天小试点:挑”每周版本回顾”按 PlanEngine 5 目标(可恢复 Checkpoint/可观测 TraceID/并行调度/增量 Replan/SubAgent 隔离)重写,7 天后用 5 项指标对比 PlanEngine vs 原 ReAct。

备注与限制