Skip to content

Agent 范式演进与 AI 未来

方向定位:从「推理式思考」到「智能体式思考」的范式迁移,以及由此延伸出的战略级判断——Coding Agent 中心论、可验证性原则、自主性边界、存在性风险与人机价值再分工。本文聚焦 Agent 范式的战略意义与未来方向,不展开工程实现细节。 当前版本:v2.3(从「Agent 范式演进与工程方法论」迁出战略部分独立成文) 首次构建:2026-05-13 最近更新:2026-05-20 文件名日期同步:2026-05-13 来源数:11 篇

一、本文定位

本文聚焦 Agent 范式的战略意义与未来方向——回答"范式如何迁移""为什么 Coding Agent 是新中心""人类与 AI 的能力边界如何划线""自主性提升会带来怎样的存在性风险""未来 12-24 个月的趋势走向哪里"。

工程实践细节请见姐妹方向:

本文凡触及具体工程实现处,仅做一句话提示并引用上述文档,不展开复述。

二、方向定位(战略边界)

本方向研究 AI 系统如何从「想得更久」迁移到「为行动而想」,以及由此衍生的战略级判断。核心战略问题:

  • 当模型能力从「单轮推理」演化到「跨多轮行动 + 环境闭环」,整个行业的护城河在哪里
  • 当 Coding Agent 成为通用底座,垂直 Agent 路线是否还成立
  • 当 Agent 能跑数小时甚至数天的自主任务,人类不可替代的点会收缩到哪里
  • 当 long-term coherence 同时是产品价值和存在性风险,应该如何在加速与防御之间下注

与相邻方向的边界:

  • 与 [AI 风险全景与治理] 的边界:本方向关心 Agent 范式演进过程中能力侧的战略判断,后者关心 powerful AI 门槛跨越后社会侧的系统性风险;两者在"长程一致性双面性"上直接耦合。
  • 与 [AI 产业全景与算力基础设施] 的边界:本方向关心 Agent 形态与未来走向,后者关心算力、投资、就业等产业基本盘。
  • 与「Agent 核心 / Harness 工程」目录的边界:本方向只谈"为什么这条路"和"走到哪里","怎么走"全部交给那两个目录。

三、知识图谱(战略视角)

Agent 范式演进与 AI 未来
├── 范式迁移轴:推理 → 行动
│   ├── 推理式思考(reasoning thinking,想得更久)
│   ├── 智能体式思考(agentic thinking,为行动而想)
│   └── 战略含义:竞争焦点从 RL 算法转向环境/harness/数据
├── 中心论:Coding Agent
│   ├── 「所有 Agent 本质都是 Coding Agent」
│   ├── 三阶段:Copilot → Claude Code → AI 管 AI
│   ├── Claude Agent SDK = 产品化实证(套壳 = 标准化开发路径)
│   └── 战略含义:垂直 Agent 路线被高度怀疑
├── 能力边界判据:可验证性原则(Karpathy)
│   ├── 可验证领域 → Agent 自主迭代
│   ├── 不可验证领域 → 人类品味
│   ├── 灰色区与"发现昂贵 / 验证廉价"的不对称
│   └── 任务可评价性三指标(姚顺宇):验收速度 × 纠错成本 × 责任位置
├── 自主性度量与监督(战略含义)
│   ├── 部署悬挂(Deployment Overhang)
│   ├── 三方共建模型(模型 / 用户 / 产品)
│   └── 监督模式演化:Pre-approval → Monitor & Intervene
├── 存在性风险(与 [AI 风险全景与治理] 耦合)
│   ├── 长程一致性双面性
│   ├── 风险三要素:intelligence + agency + coherence + 弱可控性
│   └── "投资能力 = 等量投资审计/校准/可中断性"
├── Agent 基础设施战争
│   ├── 三阶段:模型战争 → 产品战争 → 基础设施战争
│   ├── 四位一体垂直整合:MCP + Stainless + Claude Agent SDK + 模型
│   └── 软件产业 Agent 化重新分层(模型/连接/Runtime/应用)
└── 未来方向
    ├── 人类不可替代的点:taste / 意图设计 / 判断
    ├── Token 吞吐量瓶颈与组织结构重写
    └── 「AI 管 AI」与新型不可逆动作的责任归属

四、核心战略概念

1. 推理式思考 vs 智能体式思考(范式论)

  • 推理式思考(reasoning thinking):让模型「想得更久」,通过更长的 CoT、更深的 RL 训练,提升单轮回答的质量。主战场是数学、代码、逻辑——因为奖励信号确定、稳定、可规模化 [来源 #1]。
  • 智能体式思考(agentic thinking,又称「为行动而想」「通过行动来推理 reasons through action」):核心问题从「能不能想得够久」变成「能不能用撑得起有效行动的方式来想」。在与环境交互中持续修正计划,关心五件事:何时停止思考开始行动 / 工具选择与排序 / 处理残缺有噪声的环境反馈 / 失败后改计划 / 跨多轮保持思路连贯 [来源 #1]。
  • 关键判断:推理链更长不等于模型更聪明。好的思考是「在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条」[来源 #1]。
  • 战略含义:范式从推理迁到智能体后,竞争焦点同步从 RL 算法迁移到环境质量、harness 工程、训练推理紧耦合([来源 #1])。具体的数据策展、训练流水线、思考/指令模式合并困境等工程问题,详见 [Agent 工程实践与落地]。

2. Coding Agent 中心论(战略命题)

  • 核心论断:所有 Agent 本质上都是 Coding Agent。OpenClaw 的核心是一个名为 Pi 的 Coding Agent,其余都是套壳;Coding Agent + Skill 基本可以覆盖大多数垂直场景,垂直 Agent 这条路需要被高度怀疑 [来源 #4]。
  • 三个阶段
    • 第一阶段 Copilot:代码补全,人写代码。
    • 第二阶段 Claude Code:主动 prompt,人当 AI 指挥者。
    • 第三阶段 AI 管 AI:AI 自己发现需求、调度执行,人当质检员 [来源 #4]。
  • 典型旁证:Claude Code 50%+ 使用场景不是 Coding(数据分析、marketing、文案)——印证 Coding Agent 作为通用底座的可组合性 [来源 #4]。
  • Claude Agent SDK 作为直接实证 [来源 #10]:Anthropic 推出的 Claude Agent SDK 从架构上验证了 Coding Agent 中心论——SDK 的本质是启动一个 Claude Code 子进程作为 Agent 核心,开发者通过 query() / createSession() 调用,子进程自主执行 Read/Write/Bash/Grep/Glob/WebSearch/WebFetch 等工具。换言之,任何通过 SDK 构建的应用,底层都是一个 Coding Agent。SDK 的设计哲学直白地说明:「所有 Agent 本质都是 Coding Agent」不再只是战略判断,而是已经产品化的标准架构。更值得注意的是,SDK 支持通过环境变量将模型后端指向 DeepSeek 等国产模型的兼容端点,代码零修改——这进一步说明 Coding Agent 的核心不在特定模型,而在 Harness 层(工具集 + 工作流 + Skill 体系)。
  • 战略含义:SaaS 公司转型路径不是"训一个垂直模型",而是"从 know-how 卖方变成 harness 提供方"——为某垂直场景构建优秀的 harness + 知识库 + 工具集,让 Coding Agent 在该场景里跑得最好。具体的 harness 构建方法详见 [Coding Agent Harness 工程实践]、[Harness 演化与未来形态]。
  • 📌 2026-05-20 新证据:Notion Simon Last 提出 Coding Agent = AGI 的 kernel [来源 #12]。理由不同于"所有 Agent 本质都是 Coding Agent"的功能论,而是从**自举性(self-bootstrapping)**切入:代码是少数一种可以让 Agent 自举自身能力的媒介——它不只回答问题,还能写工具、调试工具、维护工具,甚至把自己的工作环境越建越复杂。顺着这条线,Notion 内部提出 software factory 概念:由一组 Agent 组成的流水线,去开发、调试、评审、合并、维护一个持续运行的系统。Simon 甚至让一个 coding agent 线程连续跑了 17 天。战略含义:未来知识工作不会停留在"问答式自动化",而是走向"多 Agent 协作完成一个结果"——这把 Coding Agent 中心论从"底座可复用"升级为"能力可自演化"。

3. 可验证性原则(Verifiability Principle)

  • 定义:一切可验证的领域(有客观指标、可自动评估),要么已经属于机器,要么很快就会;一切不可验证的领域(需要品味、判断、创造性),仍然属于人类 [来源 #3]。
  • 关键要素
    • 「发现」昂贵 vs 「验证」廉价的不对称性——是 AutoResearch 可去中心化(Folding@home 模式)的根本原因 [来源 #3]。
    • 「参差感」(jaggedness)——模型在训练轨道上比光速还快,偏离轨道就像十岁小孩 [来源 #3]。
  • 战略含义:可验证性原则是「该不该交给 Agent」的第一性判据。可验证领域可全自动闭环;不可验证领域必须保留人类品味节点。这条原则也是人类不可替代点的理论根基——判断、品味、意图设计这些"不可验证"的工作是人类最后的领地。
任务类型是否交给 Agent战略含义
有客观自动评估(代码、CUDA 优化、超参搜索、测试通过)全交,闭环自迭代AutoResearch 模式,"发现昂贵/验证廉价"使其天然适合去中心化
半客观(数据分析、bug 验证)交,但保留人类抽查灰色区,需要逐场景沉淀工程模板
不可验证(产品方向、架构权衡、品味、笑话)不交人类品味作为 PR 合并门

3.1 任务可评价性:可验证性原则的职业风险转译 [来源 #11]

📌 2026-05-20 新证据:姚顺宇(Anthropic / 前 Gemini)在访谈中提出「任务可评价性」框架,把可验证性原则从 Agent 决策判据扩展为全职业 AI 风险评估工具

  • 核心判断:AI 最先高速改变的不是人类觉得简单的工作,而是反馈最清楚的工作。AI 不按职业声望排队,它先进入能被清楚定义、快速验收、低成本纠错的任务 [来源 #11]。
  • 任务可评价性三指标——把可验证性原则从二分法细化为连续光谱:
指标含义高值 = 风险近
验收速度做完以后多久知道对错代码编译/测试秒级反馈 vs 产品上线数月后才知留存
纠错成本错了以后能不能快速重来代码回滚秒级 vs 产品方向错误需季度修正
责任位置你是在执行标准,还是在制定标准按 spec 写实现 vs 定义 spec 本身
  • 与 Karpathy 可验证性的关系:Karpathy 的二分法(可验证 vs 不可验证)解决了「Agent 自主闭环的边界在哪」;姚顺宇把这条线连续化——不是「可/不可」,而是「验收多快 × 纠错多便宜 × 你站在标准的哪一侧」。前两个越高、第三个越低,该任务就越接近「代码世界」的结构,AI 就越容易练。
  • 代码世界作为 AI 首选练习场的结构解释:程序员先站到第一排,不是因为写代码低端,而是代码世界有测试、编译、运行结果、日志和版本记录——模型做完以后环境会主动告诉它哪里错了。GitHub 和开源生态又提供了海量任务、上下文和修改历史。这与 Coding Agent 中心论(概念 2)的底层逻辑同源——Coding Agent 成为通用底座,本质上是因为代码环境提供了最完整的反馈闭环。
  • 对 PM / 知识工作者的战略含义:产品经理的反馈信号「晚、脏、主观」(功能上线后留存变化混入渠道/活动/竞品等多变量、产品方向对错需要数月甚至数年显现),因此完整产品判断难被训练。但 PM 工作中的可验收执行层(写 PRD、整理访谈、竞品分析、数据初筛)同样会被重构——它们可拆成输入、输出和格式要求,可快速验收,也可低成本重做。职业名不是护身符,任务结构才是风险判据
  • 与概念 5(存在性风险)的交叉:任务可评价性三指标也是 Agent 自主性应该被授予的判据——验收快、纠错便宜、执行标准明确的任务可以放心交给 Agent 自主迭代;反之需要保留人类监督。

4. Agent 自主性(部署悬挂与三方共建)

  • 部署悬挂(Deployment Overhang):模型能力远超用户实际授予的自主权。METR 评估 Claude Opus 4.5 能以 50% 成功率完成人类需 5 小时的任务,但 Claude Code P99.9 单轮时长仅约 42 分钟,中位数仅 45 秒 [来源 #5]。
  • 三方共建模型:自主性 = 模型能力 × 用户信任 × 产品默认。任何单一维度都无法完整刻画 Agent 自主性 [来源 #5]。这是本方向最干净的反直觉判断——「等模型变强自主性就上来」是空想,必须三方协同演化。
  • 监督模式的战略反转:经验丰富用户的 auto-approve 率(40%+)和中断率(9%)同时上升,意味着「让 Agent 跑得更猛 + 出问题更激进介入」并非矛盾。Pre-approval → Monitor & Intervene 是 Agent 产品默认设置的全行业级反转 [来源 #5]。具体的监督策略产品化实现(auto-approve 阈值、中断 UI、可信可见性设计)详见 [Agent 工程实践与落地]。

5. 存在性风险三要素(与 [AI 风险全景与治理] 的耦合点)

自主性的能力维度本身就是存在性风险的配方,无需依赖"power-seeking 必然涌现"这种第一性论证 [来源 #8]:

  • 风险三要素 = intelligence + agency + coherence + 弱可控性——只要四者同时具备,"AI 因为某种我们没预见到的奇怪原因(persona 异化、情境推理走极端、训练 trap)做出连贯破坏行为"的概率就不是零。
  • 长程任务能力提升与安全风险同向放大:Agent 的长程一致性(long-term coherence)原本是产品价值(能完成数小时/数天的任务),但同时也是"出问题时一次出更大问题"的放大器。
  • 战略推论:自主性提升不能只看"能跑多远",必须同步评估"跑偏了能跑多远"——投资 long-term coherence 的同时必须等量投资"长程行为审计 / 中途价值校准 / 可中断性",否则产品能力越强,事故规模越大。

五大风险类别(自主性 / 滥用破坏 / 滥用夺权 / 经济颠覆 / 间接效应)的完整论述详见 [AI 风险全景与治理]。本方向只标注其与 Agent 范式演进的直接耦合点。

6. Agent 基础设施战争(AI 竞争三阶段论)

  • 核心论断:AI 竞争正在从"模型战争"(比参数/算力/benchmark)→"产品战争"(ChatGPT/Claude/Gemini/Copilot 抢用户时间)→"Agent 基础设施战争"(谁能让 Agent 调用更多工具、连接更多系统、进入更多工作流)。第三阶段的竞争焦点是:谁控制了 Agent 连接世界的方式,谁就可能控制下一代软件入口 [来源 #9]。
  • 标志事件:Anthropic 2026-05 收购 Stainless(API spec → 多语言 SDK/CLI/MCP Server 自动生成平台,数百家公司依赖)。这不是工具公司收购,而是 Agent 时代的基础设施卡位——Anthropic 现在同时拥有 MCP 协议 + Stainless 工业化 SDK 生成能力 + Claude 模型,三位一体的垂直整合。
  • 第四维度:Claude Agent SDK [来源 #10]:原有三位一体(MCP 协议 + Stainless 工业化 SDK 生成 + Claude 模型)现在升级为四位一体——Claude Agent SDK 让开发者零门槛接入整个 Agent 能力栈。SDK 是「从基础设施卡位到开发者生态锁定」的关键一步:有了 SDK,开发者不再只是使用 Anthropic 的模型或协议,而是直接在 Anthropic 的 Agent Runtime 上构建应用。SDK 提供 V1 query() 一次性对话和 V2 Session API 多轮会话 + 会话持久化两种模式,子进程自主调用 Read/Write/Bash/WebSearch 等工具体系——这意味着开发者一旦基于 SDK 构建应用,就同时绑定了 Anthropic 的协议层(MCP)、工具层(内置工具体系)、模型层(Claude)和运行时(Agent Runtime),形成极强的路径依赖。
  • 战略含义:过去互联网公司的终极问题是"谁掌握流量入口";Agent 时代的终极问题变成"谁掌握 Agent 连接世界的入口"。答案不写在模型榜单上,而写在 SDK、协议、工具、权限、审计和每一次 API 调用里。四位一体的垂直整合(MCP + Stainless + Claude Agent SDK + 模型)意味着 Anthropic 不仅定义了 Agent 的连接方式,还提供了 Agent 的标准化开发路径——这是平台级锁定的经典路数。

7. 软件产业 Agent 化重新分层

  • 旧分层:底层云 → 中间层数据库/API/框架 → 上层 SaaS 应用。
  • Agent 时代新分层 [来源 #9]:
    1. 模型层(大脑)
    2. 连接协议与工具调用层(神经)——SDK/API spec/MCP Server/CLI;Claude Agent SDK 是该层的产品化入口 [来源 #10],将协议层能力封装为开发者可直接调用的标准接口
    3. Agent Runtime 层——权限、安全、审计、记忆、工作流编排
    4. AI 应用层(面向用户)
  • 战略含义:很多今天看起来"不性感"的中间层(SDK、API spec、MCP server、权限系统、工具注册表、Agent 审计日志、模型路由、执行沙箱、安全策略、跨应用连接器)将成为高价值资产。Stainless 正是第 2 层的工业化供给方——Anthropic 收购它是在卡位"连接协议与工具调用层"。
  • 与概念 2(Coding Agent 中心论)的交叉:Coding Agent + Skill 的可组合性解决了"Agent 能做什么",但"Agent 能连接什么"取决于工具调用层的覆盖度。两者共同决定 Agent 的行动边界。
  • 📌 2026-05-20 新证据(Notion / Latent Space 播客)[来源 #12]:Notion 明确预判**"未来大多数流量会来自使用我们界面的 Agent,而不是人"。这对 Agent 时代新分层的含义是——第 4 层"AI 应用层"不再只"面向用户",而必须同时面向人和 Agent**。产品工程团队要让数据库、编辑器、权限系统、SQL 引擎都为 Agent 留出可调用、可理解、可组合的接口。定价、模型选择器(model picker)、自动路由(auto routing)不只是商业决策,而是产品架构的一部分。换言之,软件产业 Agent 化分层的真正含义不只是"多了几个中间层",而是每一层都要为"Agent 是主要消费者"这个前提重新设计

五、关键战略案例

工程实操类案例(OpenAI Codex 7 人团队 / Qwen3.6 vs GLM-5.1 模型路线 / Manus 弃用 Function Calling)已迁出至 [Agent 工程实践与落地] 与 [Coding Agent Harness 工程实践]。本方向只保留对范式演进有战略意义的案例

案例 1:Karpathy 编码/委托比从 80/20 翻转为 20/80 [来源 #3]

  • 背景:2025 年 12 月起 Karpathy 没有亲手打过一行代码。
  • 做法:转型为「向 Agent 传达意志」连续 16 小时;建立 AutoResearch 想法队列(arXiv 论文 + GitHub 仓库 + 人类想法)→ 自动科学家 → 工作者池 → 有效结果走特性分支 → 人类偶尔监控 → 合并主分支。
  • 结果:一个晚上的 AutoResearch 发现了值嵌入权重衰减和 Adam beta 参数的交互效应——20 年经验研究员遗漏的;Dobby 智能家居用 3 个提示词扫描局域网、找到 Sonos、调用 API、接管整栋房子。
  • 战略启发:新瓶颈不是算力而是「token 吞吐量」——你能同时管理多少个 Agent 会话。「焦虑 = 订阅额度还有剩余就去睡觉」——这是 Agent 时代个体生产函数的根本重写。

案例 2:Claude Code 自主性指标 3 个月演化 [来源 #5]

  • 背景:Anthropic 分析 998,481 个随机 API 工具调用 + 50 万 Claude Code 交互会话。
  • 核心数据
    • 中位 turn 时长 ~45 秒(3 个月基本稳定,因新用户涌入拉低分布)。
    • P99.9 turn 时长从 <25 分钟翻倍到 >45 分钟。
    • 内部最难任务成功率翻倍(Aug→Dec),同期人均干预次数从 5.4 降至 3.3。
    • 80% 工具调用有至少一种安全防护;73% 有某种形式的人类参与;仅 0.8% 动作不可逆。
    • 软件工程占近 50% 的 agentic 活动。
  • 战略启发:自主性增长在模型发布间平滑过渡,无阶梯跳变——说明自主性增长不纯粹由模型能力驱动,信任积累和产品改进是重要因素。用数据反驳了「监督就是逐项审批」的产品默认。

案例 3:OpenClaw 单日 1600 commit 与「AI 管 AI」 [来源 #4]

  • 背景:OpenClaw 作者展示新一代 Agent 形态。
  • 数据:单日 1600 次 commit ≈ 三四人团队一年工作量;Cursor 一周做出 300 万行代码的浏览器;Anthropic 用 Agent 端到端实现 C 语言编译器;7 人团队 ≈ 过去 30-50 人产出;月消耗 2-3 万美元的 90 分用户与 10 分大多数用户差距可达 1000 倍。
  • 战略启发:Agent 时代不再按组织人数分层,而是按 Token 消耗分层——日消耗 1 亿 Token 的用户 ≈ SaaS 时代的世界 500 强。这条洞察对组织结构、人才战略、定价模型都有颠覆性含义。

六、关键战略洞察

  1. Agent 时代的瓶颈从算力转向「token 吞吐量 + 上下文工程」:Karpathy [来源 #3] 把它命名为「token 吞吐量瓶颈」(你能管理多少 Agent 会话),多个独立工程实践([Agent 工程实践与落地]、[Coding Agent Harness 工程实践])从不同层面发现同一个瓶颈——上下文是新的稀缺资源,工程化它就是新的工程学科。战略含义:个体与团队的产能上限不再由代码速度决定,而由"能同时驱动多少 Agent 会话"决定。

  2. 数据与 harness 工程取代 RL 算法成为新竞争焦点:林俊旸 [来源 #1] 明确判断「推理时代拼 RL 算法和训练流水线;智能体时代拼环境质量、harness 工程、训练推理紧耦合」;Qwen vs GLM 的路线分化 [来源 #2] 体现「不在模型架构上 PK,在 Coding 后训练数据和场景能力上 PK」——这条护城河沉淀在仓库和组织流程里,比任何 RL 算法 trick 都更难复制。

  3. 自主性是模型、用户、产品三方共建的涌现属性,非单一维度能力:Anthropic 实证 [来源 #5] 给出最干净的定义——「The autonomy agents exercise in practice is co-constructed by the model, the user, and the product」。战略含义:「等模型变强自主性就上来」是空想——必须三方协同演化。

  4. Coding Agent + Skill 的可组合性使垂直 Agent 路线被高度怀疑,但 harness 工程留出了护城河空间:曲凯/文锋 [来源 #4] 明确说「垂直 Agent 这条路需要被高度怀疑」;但 [来源 #1] 强调「环境质量、harness 工程是新护城河」——真正的护城河不是"为某垂直场景训一个专用模型",而是"为某垂直场景构建优秀的 harness + 知识库 + 工具集"。这意味着 SaaS 公司的转型路径是「从 know-how 卖方变成 harness 提供方」。

  5. 「人类不可被替代的点」越来越窄但越来越清晰:曲凯/文锋 [来源 #4] 列出两点(taste + 协作默契);Karpathy [来源 #3] 用可验证性原则给出第一性解释(不可验证 = 人类领地);Anthropic 实证 [来源 #5] 给出量化(仅 0.8% 动作不可逆)。三篇汇聚到同一个判断:人的价值正在从「执行」迁移到「判断、品味、意图设计」,且这部分工作的产品形态尚未完全成型——这是 PM 和工程师在未来 12-24 个月最重要的能力迁移。

  6. 「监督 ≠ 审批」是产品默认设置的关键反转:Anthropic 数据 [来源 #5] 给出最反直觉的事实——经验丰富用户的 auto-approve 率(40%+)和中断率(9%)同时上升。Pre-approval → Monitor & Intervene 是 Agent 产品默认设置的全行业级反转。这条反转背后的产品/工程实现详见 [Agent 工程实践与落地]。

  7. 长程一致性是产品价值与存在性风险的同一硬币两面:Agent 范式从状态机迁移到文件系统、从单步任务扩展到 6 小时连续运行、从"几十步崩塌"到"上千步可控"——这些都是 long-term coherence 提升带来的产品价值。但 Amodei [来源 #8] 指出同一能力维度也是存在性风险的核心要素:模型越能保持长程目标一致性,"它一旦走偏就会一致地走偏到底"的概率就越大。这条洞察对 Agent 产品架构有反直觉推论——投资 long-term coherence 的同时必须等量投资"长程行为审计 / 中途价值校准 / 可中断性"。这是与 [AI 风险全景与治理] 的最直接耦合点。

  8. Agent 时代的入口不是聊天框,而是连接层:聊天框可能只是过渡形态。真正的入口是一个能连接所有工具、理解上下文、执行任务、管理权限、调用模型、自动切换服务的 Agent 层——当 AI 从"回答"变成"行动",整个产业的价值链都会重构:模型公司向工具链延伸(Anthropic 收购 Stainless [来源 #9])、工具公司向 Agent 平台靠拢、SaaS 被迫开放更多接口、开发者生态围绕协议重新洗牌、安全/审计/权限/治理从可选项变成基础设施。Stainless 收购是"谁掌握 Agent 连接世界的入口"这一终极问题的第一个战略性回答。

  9. Claude Agent SDK 是「Coding Agent 中心论」的产品化证明——「套壳」不是贬义,是最务实的 Agent 开发策略:Claude Agent SDK 的架构设计直白地告诉开发者:除非是大厂有足够资源自研 Agent Runtime,否则最务实的路径就是直接在成熟的 Coding Agent 之上构建应用 [来源 #10]。SDK 把「套壳 Claude Agent」从一个贬义词变成了标准化开发路径——query() 一次性对话、createSession() 多轮会话,子进程自主执行全套工具,开发者只需定义意图和约束。战略含义:「别费劲了,直接套壳 Claude Agent」不是懒惰,而是对 Agent 时代分工的正确理解——模型能力由 Anthropic 负责迭代,Agent Runtime 由 SDK 封装,开发者的真正护城河在 Harness 层(Skill + 知识库 + 工具编排 + 场景理解)。

七、观点张力(保留冲突)

张力 1:Coding Agent 中心论 vs 环境与 harness 才是护城河

  • 正方(曲凯/文锋)[来源 #4]:「所有 Agent 本质都是 Coding Agent」,垂直 Agent 路线需要被高度怀疑,今年的机会是谁能把 Coding Agent 套壳做得足够好。
  • 正方新证据(Claude Agent SDK)[来源 #10]:SDK 让「套壳」从概念变为标准化开发路径——开发者通过 query() / createSession() 直接调用 Claude Code 子进程作为 Agent 核心,无需自研 Agent Runtime。SDK 的存在本身就是 Anthropic 对「所有 Agent 本质都是 Coding Agent」这一判断的产品化押注:如果垂直 Agent 路线成立,Anthropic 没有理由把自己的 Coding Agent 封装成通用 SDK。
  • 反方(林俊旸)[来源 #1]:模型只是新一代护城河的一半——「环境质量、harness 工程、训练推理紧耦合」才是另一半。SFT 时代执着数据多样性,Agent 时代应执着环境质量。
  • 不强行调和的张力:两者并非冲突,但暗示 Coding Agent + 优秀 harness 才是答案。如果只押注 Coding Agent 模型本身,会输给那些把 harness 工程化做到极致的对手;如果只押注 harness 工程,会被更强的底层 Coding Agent 模型反包。
  • 📌 2026-05-20 Notion 实践验证 [来源 #12]:Notion AI 团队(Sarah Sachs / Simon Last)的实践经验从产品侧支持 harness 一方——Simon 直说以前花了很多时间训练模型,但后来越来越觉得训练只是实现细节,关键是外循环:模型怎样和系统交互、工具有没有 bug、Harness 有没有把失败暴露出来、Eval 有没有覆盖真实工作流。Sarah 补充:工具几乎每天在变,专门微调模型理解这些工具反而拖慢整个产品迭代速度。"99% 的时候,问题其实出在某个工具的 bug 上,那就把 bug 修掉。"——这为张力 1 提供了来自生产环境的调和路径:Coding Agent 提供通用底座,但日常迭代的杠杆在 Eval / Harness / 工具质量,而不是模型微调

张力 2:思考/指令模式融合 vs 分离

  • 融合派(Anthropic Claude 3.7/4 / GLM-4.5 / DeepSeek V3.1 / Qwen3 初版)[来源 #1]:成功合并需要「平滑的推理力度光谱」,模型自适应分配算力,而非二元开关。
  • 分离派(Qwen 2507 回退后路线)[来源 #1]:发独立的 Instruct 和 Thinking 版本——承认融合的数据策展难度,企业客户大批量处理任务要的是指令模式的确定性和低成本。
  • 战略含义:这不是「谁对谁错」,而是「为谁服务」的产品选择。开发者市场拥抱融合(光谱),企业市场偏好分离(确定性)。这条路线分化短期内不会收敛。数据策展层面的具体合并困境详见 [Agent 工程实践与落地]。

张力 3:投资能力 vs 投资防御的资源配比

  • 加速派:Agent 长程一致性是产品价值的核心,应该全力投入提升 long-term coherence、扩大 P99.9 单轮时长、降低人类干预。
  • 审慎派(Amodei 立场)[来源 #8]:long-term coherence 是双面硬币,必须等量投资"长程行为审计 / 中途价值校准 / 可中断性"——否则产品能力越强,事故规模越大。
  • 战略含义:在 ASL-3 到 ASL-4 之间的窗口期,能力侧投入与防御侧投入的比例是 2026 年 Agent 公司战略层最尖锐的资源分配争论之一。这条争论的治理含义详见 [AI 风险全景与治理] 概念 2、方法论 B。

八、待探索问题

文档继续生长的钩子,每个问题指向未来需要补充的源材料方向。

  1. 当 Coding Agent 自身的代码也由 Agent 写,谁来界定「代码 = 仓库 = 记录系统」的边界? 多年尺度上是否会形成人类无法理解的「暗代码」?这关系到"AI 管 AI"时代的可审计性。

  2. Agent 自主性的法律与商业责任如何随「AI 管 AI」演化? 当 Proactive Agent 自己提需求、搭临时 Agent、执行后销毁,0.8% 的不可逆动作如何归责?这部分需要补充法律/政策方向的源材料。

  3. 可验证领域 vs 不可验证领域之间的「灰色区」如何战略化? Karpathy 给出二分法,但「半客观」任务(数据分析、bug 验证、合规审计)的战略归属与商业模式尚未沉淀。

  4. 「部署悬挂」的下一阶段:Agent 自主性 P99.9 突破单日级别后,监督机制如何演化? 当 P99.9 进入数小时甚至数天,事后监控基础设施要怎么建?这与 [AI 风险全景与治理] 的"自主性风险"治理工具同向耦合。

  5. Token 消耗分层取代组织人数分层后,企业的人力规划如何重写? 日消耗 1 亿 Token 的个体 ≈ SaaS 时代世界 500 强——这条数据如果成立,传统的组织设计、薪酬体系、招聘逻辑都需要重写。

  6. 人类「品味/意图设计/判断」这部分工作的产品形态尚未成型——谁会先做出"意图设计 IDE"? 类似 Cursor 之于代码、Figma 之于设计——服务于"向 Agent 传达意志"的工具形态会以什么形式出现?

  7. Agent 基础设施战争中,协议制定者/工具生态构建者/模型提供者三位一体后,独立生态位在哪? Anthropic 收购 Stainless 后同时拥有 MCP 协议 + SDK/MCP Server 工业化生成 + Claude 模型。这种垂直整合是否会压缩独立工具公司的生存空间?还是会通过生态扩大做大蛋糕?OpenAI/Google 是否会对等布局?

  8. 当 Anthropic 同时控制 MCP + Stainless + Claude Agent SDK + 模型时,模型后端可替换性是真正的解耦还是「有限的自由」? Claude Agent SDK 支持通过环境变量将模型后端指向 DeepSeek 等国产模型的兼容端点,代码零修改 [来源 #10]。但工具体系(Read/Write/Bash/WebSearch 等)和 Agent Runtime 仍然绑定 Anthropic 的子进程架构。这种「模型可换但 Runtime 锁定」的模式,对开发者而言是真正的自由还是更隐蔽的锁定?如果 DeepSeek 等厂商只实现了 API 兼容层而非 Agent Runtime 兼容层,开发者的「可替换性」实质上只停留在推理层,而非 Agent 全栈。

九、关联方向

十、来源索引

#标题来源收录日期贡献章节
1从「想得更久」到「为行动而想」:林俊旸的 AI 下一阶段判断林俊旸 X 长文(前 Qwen 负责人)2026-04-02核心概念 1(推理→Agent)/ 关键洞察 2 / 张力 1、2
2Qwen3.6-Plus 与 GLM-5.1:国产模型宣告 Agentic Coding 时代综合分析(用户提供)2026-04-03关键洞察 2(路线分化背书)
3Karpathy 深度访谈:AutoResearch、可验证性原则与 AI 成瘾时代No Priors Podcast(Sarah Guo × Karpathy)2026-04-03核心概念 3(可验证性)/ 案例 1(编码委托比翻转)/ 关键洞察 1、5
4所有 Agent 本质上都是 Coding Agent:SaaS 颠覆、Proactive Agent 与「AI 管 AI」42章经播客(曲凯×文锋)2026-04-03核心概念 2(Coding Agent 中心)/ 案例 3 / 关键洞察 4、5 / 张力 1
5Anthropic 实证研究:AI Agent 自主性在真实部署中的度量Anthropic Research2026-04-07核心概念 4(部署悬挂、三方共建)/ 案例 2 / 关键洞察 3、6
6OpenAI Codex 智能体优先开发:百万行代码、7 人团队、0 行人类手写代码OpenAI 工程博客(Ryan Lopopolo)2026-04-09已迁出至 [Coding Agent Harness 工程实践],本方向仅作引用
7Manus 前负责人 MorroHsu——单 run 工具与 Unix 哲学的 Agent CLI 范式r/LocalLLaMA 帖子(Pinix / agent-clip 作者)2026-05-09已迁出至 [Coding Agent Harness 工程实践],本方向仅作引用
8The Adolescence of Technology: Confronting and Overcoming the Risks of Powerful AIDario Amodei(Anthropic CEO),用户提供文本,2026-012026-05-19核心概念 5(存在性风险三要素)/ 关键洞察 7(长程一致性双面性)/ 张力 3
9Anthropic 收购 Stainless:AI 下半场从模型战争转向 Agent 基础设施战争用户提供文本(公众号分析文章)2026-05-20核心概念 6(Agent 基础设施战争三阶段论)/ 核心概念 7(软件产业 Agent 化重新分层)/ 关键洞察 8(Agent 入口 = 连接层)/ 待探索 7(三位一体后独立生态位)
10Claude Agent SDK 快速上手与 DeepSeek 配置教程公众号文章2026-05-20核心概念 2(Coding Agent 中心论追加 SDK 直接实证)/ 核心概念 6(Agent 基础设施战争升级四位一体)/ 核心概念 7(连接层产品化入口)/ 关键洞察 9(套壳 = 最务实策略)/ 张力 1(正方新证据)/ 待探索 8(模型可替换性 vs Runtime 锁定)
11别躲在岗位后:从姚顺宇判断看 AI 为什么不按职业排危险榜张小珺/姚顺宇访谈转译(公众号文章)2026-05-20核心概念 3.1(任务可评价性三指标 = 可验证性原则的职业风险转译)
12Notion 团队:为什么真正难的不是做 Agent,而是重做整个工作系统Latent Space 播客(Sarah Sachs × Simon Last)2026-05-20核心概念 2(Coding Agent = AGI kernel + software factory)/ 概念 7(Agent 流量超人类流量)/ 张力 1(外循环 > 微调的产品实践验证)

十一、演进记录

日期版本变更摘要
2026-05-13v1.0首次构建,由 7 篇源文件批量合成。覆盖 Agent 范式迁移、可验证性、Coding Agent 中心、自主性度量、智能体优先开发、CLI 范式 6 大维度
2026-05-19v1.1并入 Dario Amodei The Adolescence of Technology 长文:补"存在性风险三要素"+ 新增"长程一致性双面性"洞察
2026-05-19v2.0方向重定位:原文件迁出 Agent/ 目录进入战略与前沿目录,重新裁剪为"战略意义与未来方向"专题。删除工程细节(思考/指令合并困境的数据策展、智能体优先开发四大支柱、CLI/Unix 范式两层架构与三启发式、Agentic Coding 模型层细节、OpenAI Codex 7 人团队工程实践案例、Qwen vs GLM 模型路线工程案例、Manus 弃用 Function Calling 工程事故案例、长程任务从状态机到文件系统的工程演进),均一句话带过并引用 [Agent 工程实践与落地]、[Coding Agent Harness 工程实践]、[Harness 演化与未来形态]。保留范式论(推理 vs 智能体)、战略命题(Coding Agent 中心论)、原则(可验证性)、判据(自主性三方共建)、耦合(长程一致性双面性 → 存在性风险)。新增"本文定位"段落、章节统一编号、与 [AI 风险全景与治理] 的耦合点。
2026-05-20v2.1并入 Anthropic 收购 Stainless 分析:新增核心概念 6(Agent 基础设施战争三阶段论)、概念 7(软件产业 Agent 化重新分层)、关键洞察 8(Agent 入口 = 连接层而非聊天框)、待探索问题 7(协议/工具/模型三位一体后独立生态位);来源索引新增 #9
2026-05-20v2.2由 /route-knowledge-pm 路由触发,融入 Claude Agent SDK 新证据。Coding Agent 中心论追加 SDK 直接实证(概念 2);Agent 基础设施战争从三位一体升级为四位一体(概念 6);软件产业分层追加 Agent SDK 为连接层产品化入口(概念 7);新增第 9 条洞察(套壳 = 最务实 Agent 开发策略);张力 1 追加正方新证据(SDK 让套壳标准化);新增待探索问题 8(模型可替换性 vs Runtime 锁定);来源索引新增 #10
2026-05-20v2.3由 /route-knowledge-pm 路由触发,融入姚顺宇「任务可评价性」框架。可验证性原则新增 §3.1(任务可评价性三指标 = 可验证性原则的职业风险转译:验收速度 / 纠错成本 / 责任位置);补「代码世界作为 AI 首选练习场」的结构解释;补 PM 工作的可验收执行层 vs 判断层分析;来源索引新增 #11
2026-05-20v2.4由 /route-knowledge-pm 路由触发,融入 Notion / Latent Space 播客情报。Coding Agent 中心论追加 Simon Last "AGI kernel + software factory"自举性论据(概念 2);软件产业 Agent 化重新分层追加"大多数流量来自 Agent"的 Notion 战略判断(概念 7);张力 1 追加 Notion "外循环 > 微调"的生产实践验证;来源索引新增 #12

MIT License