Anthropic 万字爆火长文的三个判断,以及一个值得警惕的阳谋
- 原文链接:https://mp.weixin.qq.com/s/sizLxZEdpSDgjPzo4AtIfg
- 原始来源:Anthropic 长文《When AI builds itself》
- 来源:微信公众号 / 快刀青衣
- 发布时间:2026-06-07 10:02
- 获取时间:2026-06-08
核心结论(一句话)
Anthropic 用”80% 代码由 Claude 写”的真实数据包装”AI 自我进化”叙事,呼吁”可验证暂停机制”——结构上跟 1946 年巴鲁克计划一致:先建立控制体系再销毁武器;时机又恰好是 Anthropic 提交 IPO 申请的同一周。
分类提炼
- 场景:AI 行业战略分析 / AI 编程范式
- 标签:#主题/AI行业战略 #主题/Anthropic #节点/执行力的零价格 #节点/巴鲁克计划
- 类型:行业分析 / 战略洞察 / 反例论证 / 编译长文
知识节点(8 个独立概念)
- 执行力的零价格:AI 让”做出来”的成本趋近于零;摄影类比——决定照片好坏的不再是按快门的技术,而是”选什么拍”的眼光
- 技术监工:程序员从手艺人变成技术监工,价值从”能写代码”移到”能判断 AI 哪里走偏、什么时候喊停”
- AI审AI的盲区:Claude 审 Claude 写的代码 ≈ 同一老师教出来的学生互批考卷,可能对同类错误集体失明
- 验收能力:未来组织最稀缺的能力,包括发现”看起来对实际错”和”做对但不知道为什么对”
- 快变量与慢变量:AI 加速的是快变量(代码产出),但用户信任/习惯/打磨是慢变量;慢变量是真正的安全垫
- 巴鲁克计划:1946 年美国”先建立控制体系再销毁核武器”方案;结构上跟 Anthropic “可验证暂停机制”一致
- 可验证暂停机制:Anthropic 呼吁的”对违反者迅速且有保证的惩罚”——谁有能力验证?谁有资源承担合规成本?答案都是只有最领先的那几家
- 主场数据偏置:内部数据不等于客观真理;Anthropic 工程师懂模型、工具链围绕 Claude 优化、内部任务天然适合 Claude,类比”考试自己出题自己答”
关联图谱
上游(基于 / 来自)
- [[Claude-Code作者Boris-我已经不写prompt了我写loop]]:Boris 谈”写 loop 不写 prompt”是执行层零价格的开端;本篇是其在行业战略层的延伸
- [[从Prompt-Context到Harness-工程的三次进化与终局之战]]:Harness 思想 = 工程师从”执行”到”判断”的迁移路径
下游(应用于 / 验证于)
- [[买了一样的AI为什么别家的比你的强]]:Hiten Shah 谈”模型是商品,skill 才是资产”是判断层的具体形态
- [[AI-Coding的顿悟时刻]]:未来瓶颈=需求定义+架构设计,跟”验收能力”是同一回事
同级(横向 / 并列)
- [[Claude-Code架构深度解读-Agent系统的真正护城河不在模型-而在-Harness]]:Harness 思想的总论
- [[Claude-Code负责人谈AI原生工程组织]]:Anthropic 的组织方法论
- [[YC如何进行AI-Native组织改造-Agent能力要向所有人开放]]:从组织视角看 AI 战略
正文要点(6 节)
01 执行力的价格趋近于零
| 指标 |
数据 |
| 2024 年 Anthropic 内部 AI 写代码占比 |
个位数 |
| 2026 年 Anthropic 合入代码 Claude 占比 |
>80% |
| 工程师日均合入代码量 |
2024 年的 8 倍(按行数算) |
程序员正在从”手艺人”变成”技术监工”——价值从”能做出来”变成”能判断做什么”。
02 稀缺能力:验收 AI 的结果
AI 加速的副作用:方案爆炸 → 审不过来 → 出现”AI 审 AI”的闭环
Claude 审 Claude ≈ 同一老师教出来的学生互批考卷 → 对同类错误集体失明
Anthropic 内部数据:用 AI 审查过去每次改动的代码,1/3 导致线上事故的 bug 可以提前发现(但闭环可信度需打折)
未来组织最稀缺的能力:
- 发现”看起来对实际错”
- 在 100 个 AI 自动生成方向里挑出值得做的 3 个
- 区分”做对” vs “做对且知道为什么对”
一个反直觉的危险:
AI 做的最危险的不是”做错”,而是”做对,但我不知道为什么对”
实用习惯:每次用 AI 完成后,展开看思考过程(哪怕只缩成”已处理 9 分 30 秒”)
03 机器速度与人类速度的裂缝
快变量(AI 能加速的):
慢变量(AI 替代不了的):
真正的安全垫 = 慢变量
04 标题背后的真相
Anthropic 标题:《When AI builds itself》
实际发生:
- ❌ 完整的递归自我改进
- ✅ 人类设目标,AI 帮忙写代码/跑实验/调试/整理结果
关键跳跃:
- 标题指向”自我进化”
- 数据展示”研发加速”
- 中间有一段需要警惕的跳跃
80% 代码由 AI 写完 ≠ 80% 研发由 AI 完成
附:Transformer 故事
- 2017 年沙泽尔(Shazeer)在谷歌走廊听到 Vaswani/Parmar 讨论自注意力,主动加入并重写代码
- 沙泽尔后来创业,2024 年谷歌 27 亿美元把他的公司收购回去
- 关键洞察:人的争论、偶遇、决定写什么才是研发价值所在
05 一个值得警惕的阳谋
Anthropic 时间线:
- 2026-05:完成 650 亿美元 H 轮,估值 9650 亿
- 2026-06-01:秘密提交 IPO 申请
- 2026-06-07:长文发布
叙事框架:
- 数据展示:研发加速
- 标题指向:AI 自我进化
- 结尾呼吁:可验证暂停机制
道德话术翻译:
“不是我停不下来,是别人不停,我也不敢停” —— 把”不慢下来”的责任推给别人,自己保持道德高地
巴鲁克计划类比(1946 vs 2026)
| 维度 |
巴鲁克计划(1946) |
Anthropic 长文(2026) |
| 表面话术 |
“先监督后销毁核武器” |
“可验证暂停机制” |
| 真实顺序 |
美国先获对全球原子能控制权 |
现有领先者锁定 AI 能力优势 |
| 道德高地 |
“我们提议和平,是对方不配合” |
“我们愿意慢,是别人不停” |
| 暗钉 |
执法不受安理会否决权约束 |
合规成本只领先者能承担 |
| 时机 |
美国核垄断期 |
Anthropic IPO 申请周 |
伯恩斯 1946 金句(几乎不用改字地适用今天):
“原子弹很可能让我们在战争结束时,按自己的条件说了算。”
—— 换”原子弹”为”前沿 AI 模型”,句句成立。
Anthropic 关切可能真,但利益恰好一致:
- 可能真的担心 AI 风险
- 同时又恰好从自己的担忧中获得最大利益
- 这两件事不矛盾
06 如何阅读这篇文章
作者建议:
- 看原文(用翻译工具 / AI 都很简单)
- 先看数据,再识别叙事框架
- 警惕”带战略目的的真文章”——比纯假文章更危险
我的理解
- “执行力的零价格”是 2026 年最锋利的范式判断——和 Boris 谈”写 loop 不写 prompt”同主线:价值从产出层移到判断层
- “AI 审 AI 的盲区”是被低估的风险——MEMORY.md 里 Boris 提的”Adversarial verification”是 Claude Code 团队的明确推荐
- “慢变量是真正的安全垫”对 Seetong 团队很关键——异地区域、报警联动、设备发现是慢变量,AI 加速不了
- “巴鲁克计划类比”是分析 AI 公司战略的犀利框架——任何”带战略目的的真文章”都可用:表面话术 / 真实意图 / 道德高地 / 暗钉 / 时机
- “主场数据偏置”的提醒很及时——内部数据不等于客观真理,要看口径/条件/选择性
相关链接
- 原文:https://mp.weixin.qq.com/s/sizLxZEdpSDgjPzo4AtIfg
- 关联 wiki:
- [[Claude-Code作者Boris-我已经不写prompt了我写loop]] - 写 loop 不写 prompt 的范式开端
- [[从Prompt-Context到Harness-工程的三次进化与终局之战]] - Harness 思想
- [[AI-Coding的顿悟时刻]] - 未来瓶颈=需求定义+架构设计
- [[买了一样的AI为什么别家的比你的强]] - skill 是判断层的具体形态
- [[Claude-Code架构深度解读-Agent系统的真正护城河不在模型-而在-Harness]] - Harness 思想总论
- [[Claude-Code负责人谈AI原生工程组织]] - Anthropic 的组织方法论
- [[YC如何进行AI-Native组织改造-Agent能力要向所有人开放]] - YC 的 AI 战略