从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流

数仓埋点需求的承接流程中,最消耗数据承接方的往往是把分散的信息重新拼起来——需求文档里的动作到底要不要采集,历史上有没有类似点位,指标口径有没有被下游使用,新增字段要改哪几层表,发布前又该由谁确认。本文介绍得物数仓团队选型 Hermes Agent(而非 OpenClaw)重构数仓工作流的实战经验,核心:把”判断前的工程化准备”交给 Agent,人聚焦口径裁决 + 生产放行。

一、Hermes Agent 让流程可控

选型理由:Hermes vs OpenClaw

数仓埋点承接场景对 Agent 有 4 项原生能力诉求:

分层持久记忆:短期会话/中期交互/长期知识/技能库四层结构,本地 SQLite + FTS5 全文检索。”关掉窗口就失忆”,在需要反复回溯历史口径的数仓场景是不可接受的
技能自动沉淀:任务完成后能把经验提炼成 Markdown 技能文档并持续优化 —— 这正是”专家经验资产化”的框架级支撑,本文反复出现的”规则包”就构建在这套技能机制之上
多平台统一网关:原生接入飞书、钉钉、企业微信等协作平台,智能体直接嵌进团队已有的沟通现场,不用另建工作台
工具与扩展生态:终端执行、定时任务、浏览器自动化等内置工具,企业内部系统经 MCP 命令封装稳定接入

核心判断:选 Agent 不只看能力清单,看场景痛点——”反复回溯历史口径”+”让 AI 进入协作沟通现场”+”生产动作可审计”这 3 个是数仓场景刚需。

4 个工程构件

在这套框架之上,把一次埋点需求承接拆成 4 个可追踪的工程构件:

工作区:每个需求独立空间,集中存放需求文档、历史讨论、评审结论和交付产物
看板:状态机流转(进入→设计→预演→评审→交付),每步有责任人
规则 + 长期记忆:把”老同学才知道”的判断写成可执行检查清单
结构化工具接口 + 预演 + 人工确认点:高风险动作走结构化接口,写入生产前先预演、再等人放行

Hermes Agent 的能力边界

关键定位:Hermes Agent 不是”埋点生成器”,是”流程编排者”。

Hermes Agent 负责:把材料、历史、候选方案、系统预演和风险证据组织起来
人负责:业务语义、指标口径、敏感字段、下游影响和生产放行

Hermes Agent 的边界是”把问题整理到足够可判断“——让数据承接方从反复翻材料、追状态、补上下文里释放出来,把精力放在真正需要负责的地方:口径能不能成立,风险能不能接受,生产动作能不能放行。

二、用单 Agent 串流程,用能力模块沉淀可复用能力

选型逻辑:为什么是”单 Agent 编排 + 多能力模块”?

如果只靠一段提示词,会遇到两个问题:

同一个需求换个问法,输出结构和检查重点就会漂
模型可以写出”看起来完整”的方案,却说不清它读了哪些事实、调用了哪些系统、哪些动作必须等人确认

所以选择”单 Agent 编排 + 多能力模块 + 看板确认点”:

Hermes Agent 保持统一上下文,负责调度阶段
能力模块承接稳定动作,负责把工具调用、输入约束、输出产物和停顿条件固化下来

固化流程契约

能力模块不是”工具清单”,是”流程契约”——固化每个能力模块的:输入、动作边界、输出产物、失败处理、经验回写。只有这些契约稳定,Hermes Agent 才不会因为提示词换一种说法就改变检查重点。

可复用能力模块设计:从埋点链路迁移到更多数据研发场景

能力模块不是只服务一次埋点需求,而是把素材采集、历史检索、变更预演、发布确认、经验沉淀抽成可复用的流程模块。换事实源和工具接口后,同一套机制也能迁移到指标发布、配置变更和数据质量排查——可复用的 SKILL 就是这套机制的核心载体。

三、总体工作流:从一次对话变成一条可回放链路

端到端链路示意

业务 → “昨天各体裁发布量”示例:

需求入口(飞书群消息)
工作区(独立空间,集中需求文档/历史讨论/评审结论/交付产物)
规则包 + 长期记忆(把”老同学才知道”的判断写成可执行检查清单)
系统预演(用结构化工具接口先在测试环境跑一遍)
人工确认点(看板状态机:进入→设计→预演→评审→交付,每步责任人)
交付归档(产物入库 + 经验回写)

关键设计:会议纪要作为协作语境进入需求上下文,补充已确认事实、责任人和待澄清问题。 任务看板承接需求状态、推进和人工介入。 工作区保留的事实源作为最终可追溯依据。

单需求示例

业务希望稳定查看”昨天各体裁发布量”。如果只让模型直接写 SQL,很容易把物理字段、业务发生日期和默认过滤混在一起。Hermes Agent 的做法是:先固化事实,再预演风险,最后把需要人判断的点推到看板确认。

四、能力底座:把规则、上下文和命令资产化

核心命题:埋点自动化真正难的是把历史口径、下游影响、人工确认和生产状态拆成可复用资产——规则包回答”怎么判断”,工作区回答”依据在哪里”,看板回答”卡在哪里”,结构化工具接口回答”系统状态是否验证过”。

1. 规则资产化:先决定什么值得记住

关键不是让 Hermes Agent 记得更多,而是把材料分层:

临时信息留在本轮任务
能复用的做法沉进规则包
需要人工把关的内容进入治理记忆

下一次相似需求到来时,系统先补证据、提醒风险,而不是让数据承接方从头解释。

2. 协作可见:让 AI 不在后台默默跑完

规则资产只有进入协作流程才有价值。三件套:

看板:暴露阶段、阻断项和责任人
飞书:保留澄清、驳回和确认语境
工作区:承接证据和产物

三者合起来,才能让人知道 AI 做到了哪一步、还缺什么、哪里必须停下来等确认。

3. 上下文与事实源:下一任务读什么,最终相信什么

上下文传递不能靠”多塞材料”解决,而是要把任务背景、阶段结论、人工反馈和运行元数据分开保存:

类型	职责
聊天	补语境
工作区	留证
系统预演	验证
生产系统	最终事实源

4. 结构化工具接口:把生产动作变成可验证接口

当智能体接近生产系统时,最不应该依赖页面识别和临场点击。结构化工具接口的作用:把查询、绑定、发布、验证这些动作包装成 参数明确、返回结构化、过程可审计 的接口。越靠近写入,越要先预演、再确认、最后留痕。

五、风险治理:可验证执行、人工确认点与审计留痕

Hermes Agent 越靠近生产链路,越不能只追求”自动执行”。上线前只看三类硬证据:事实来源是否可信,系统预演是否通过,责任人是否已经确认。

上线前 3 道门

事实源门:证据材料是否齐备(工作区/规则包/历史讨论)
预演门:结构化工具接口在测试环境是否跑通
责任门:看板对应责任人是否已经确认

硬约束:任何一道门缺证据,Hermes Agent 都只能停在候选方案或待确认状态,不能继续推进生产写入。

治理的目标不是让数据承接方把系统做过的事再手工复查,而是让系统在关键位置停下来,把证据、预演结果和责任人摆到台面上。人的精力应该留给真正的判断点:口径要不要调整,风险能不能接受,生产动作能不能放行。

六、结论与下一步

已形成的主线

Hermes Agent 值得放大的是 可回放、可确认、可复用的工作流能力。当前链路已经围绕 4 件事形成主线:

跑通需求流转
前置风险拦截
沉淀规则资产
让数据承接方把精力放到口径裁决和生产边界上

规模化路径

下一步的重点不是继续堆更多自动化动作,而是把证据口径跑实——用连续样本证明:

准备时间的变化
交付周期的变化
评审通过率的变化
返工原因的变化

只有当这些指标和看板、日志、确认记录一一对应时,这条链路才真正具备扩大使用的工程基础。

作者团队往期回顾

让 Claude Code 拥有自我进化和记忆系统得物技术
用 LLM Agent 重构告警排查流程得物技术
得物技术在 AICon 关于大模型与 Agent 技术实践分享来袭!
HorizonVault 技术深潜:如何在 HDD 上做出 100GB/s+ 级大吞吐分布式存储得物技术
Claude Code Harness 工程:数仓侧落地方案得物技术

备注

本文作者小诘、博温(得物技术团队),与 [[让 Claude Code 拥有自我进化和记忆系统]] / [[用 LLM Agent 重构告警排查流程]] / [[Claude Code Harness 工程:数仓侧落地方案]] 同作者团队
核心选型立场:选 Hermes Agent 而非 OpenClaw — 原因是 Hermes 的 4 项原生能力(分层持久记忆 + 技能自动沉淀 + 多平台统一网关 + 工具与扩展生态)更贴近数仓场景痛点;OpenClaw 在”反复回溯历史口径 + 协作沟通现场嵌入 + 生产动作可审计”上”没有对应的能力定位”
与 [[阿里云开发者-淘宝主播Agent的Harness工程实战]] 阿里淘系 Harness 主题互补(都是 Harness/Agent 工程实战,但场景不同:主播=实时交互高风险/得物数仓=承接流程标准化)
与 [[Skill-Self-Evolution]] / [[Agent Skills 系统性综述]] Skill 主线
与 [[腾讯-AI-Agent-Skill-测评方案落地]] “测评是 Agent 从 Demo 可用走向生产可靠必须跨过的门槛”主线
与 [[Loop-Engineering-验证才是瓶颈]] 互补(本文讲”上线前 3 道门”硬证据 vs 那篇讲 Loop 验证闸门)
关键术语:Hermes Agent = 文中特指的智能体平台(非通用概念,与 OpenClaw 是平行对比)
文章清洗后字节数 1406589,正文约 4500 字,信息密度高,实战案例齐全
待补证:阶段 5 “规模化落地路径”中的”准备时间/交付周期/评审通过率/返工原因”四个量化指标具体数字未披露;Hermes Agent 平台具体技术栈(基于什么框架)未明示;规则包的版本管理 / 多人协作冲突解决未展开
截断内容:得物技术团队往期回顾 5 篇未给出完整链接(本文仅列标题)