Agent 范式演进与 AI 未来

方向定位：从「推理式思考」到「智能体式思考」的范式迁移，以及由此延伸出的战略级判断——Coding Agent 中心论、可验证性原则、自主性边界、存在性风险与人机价值再分工。本文聚焦 Agent 范式的战略意义与未来方向，不展开工程实现细节。当前版本：v2.3（从「Agent 范式演进与工程方法论」迁出战略部分独立成文）首次构建：2026-05-13 最近更新：2026-05-20 文件名日期同步：2026-05-13 来源数：11 篇

一、本文定位

本文聚焦 Agent 范式的战略意义与未来方向——回答"范式如何迁移""为什么 Coding Agent 是新中心""人类与 AI 的能力边界如何划线""自主性提升会带来怎样的存在性风险""未来 12-24 个月的趋势走向哪里"。

工程实践细节请见姐妹方向：

Agent 核心 / Agent 工程实践与落地——Agent 的具体工程方法论（数据策展、harness 构建、上下文工程、监督机制实现等）
Harness 工程 / Coding Agent Harness 工程实践——CLI/Unix 范式、单 run 工具、智能体优先开发四大支柱、AGENTS.md 设计等具体工程实现
Harness 工程 / Harness 演化与未来形态——Harness 形态演进的工程视角

本文凡触及具体工程实现处，仅做一句话提示并引用上述文档，不展开复述。

二、方向定位（战略边界）

本方向研究 AI 系统如何从「想得更久」迁移到「为行动而想」，以及由此衍生的战略级判断。核心战略问题：

当模型能力从「单轮推理」演化到「跨多轮行动 + 环境闭环」，整个行业的护城河在哪里？
当 Coding Agent 成为通用底座，垂直 Agent 路线是否还成立？
当 Agent 能跑数小时甚至数天的自主任务，人类不可替代的点会收缩到哪里？
当 long-term coherence 同时是产品价值和存在性风险，应该如何在加速与防御之间下注？

与相邻方向的边界：

与 [AI 风险全景与治理] 的边界：本方向关心 Agent 范式演进过程中能力侧的战略判断，后者关心 powerful AI 门槛跨越后社会侧的系统性风险；两者在"长程一致性双面性"上直接耦合。
与 [AI 产业全景与算力基础设施] 的边界：本方向关心 Agent 形态与未来走向，后者关心算力、投资、就业等产业基本盘。
与「Agent 核心 / Harness 工程」目录的边界：本方向只谈"为什么这条路"和"走到哪里"，"怎么走"全部交给那两个目录。

三、知识图谱（战略视角）

Agent 范式演进与 AI 未来
├── 范式迁移轴：推理 → 行动
│   ├── 推理式思考（reasoning thinking，想得更久）
│   ├── 智能体式思考（agentic thinking，为行动而想）
│   └── 战略含义：竞争焦点从 RL 算法转向环境/harness/数据
├── 中心论：Coding Agent
│   ├── 「所有 Agent 本质都是 Coding Agent」
│   ├── 三阶段：Copilot → Claude Code → AI 管 AI
│   ├── Claude Agent SDK = 产品化实证（套壳 = 标准化开发路径）
│   └── 战略含义：垂直 Agent 路线被高度怀疑
├── 能力边界判据：可验证性原则（Karpathy）
│   ├── 可验证领域 → Agent 自主迭代
│   ├── 不可验证领域 → 人类品味
│   ├── 灰色区与"发现昂贵 / 验证廉价"的不对称
│   └── 任务可评价性三指标（姚顺宇）：验收速度 × 纠错成本 × 责任位置
├── 自主性度量与监督（战略含义）
│   ├── 部署悬挂（Deployment Overhang）
│   ├── 三方共建模型（模型 / 用户 / 产品）
│   └── 监督模式演化：Pre-approval → Monitor & Intervene
├── 存在性风险（与 [AI 风险全景与治理] 耦合）
│   ├── 长程一致性双面性
│   ├── 风险三要素：intelligence + agency + coherence + 弱可控性
│   └── "投资能力 = 等量投资审计/校准/可中断性"
├── Agent 基础设施战争
│   ├── 三阶段：模型战争 → 产品战争 → 基础设施战争
│   ├── 四位一体垂直整合：MCP + Stainless + Claude Agent SDK + 模型
│   └── 软件产业 Agent 化重新分层（模型/连接/Runtime/应用）
└── 未来方向
    ├── 人类不可替代的点：taste / 意图设计 / 判断
    ├── Token 吞吐量瓶颈与组织结构重写
    └── 「AI 管 AI」与新型不可逆动作的责任归属

四、核心战略概念

1. 推理式思考 vs 智能体式思考（范式论）

推理式思考（reasoning thinking）：让模型「想得更久」，通过更长的 CoT、更深的 RL 训练，提升单轮回答的质量。主战场是数学、代码、逻辑——因为奖励信号确定、稳定、可规模化 [来源 #1]。
智能体式思考（agentic thinking，又称「为行动而想」「通过行动来推理 reasons through action」）：核心问题从「能不能想得够久」变成「能不能用撑得起有效行动的方式来想」。在与环境交互中持续修正计划，关心五件事：何时停止思考开始行动 / 工具选择与排序 / 处理残缺有噪声的环境反馈 / 失败后改计划 / 跨多轮保持思路连贯 [来源 #1]。
关键判断：推理链更长不等于模型更聪明。好的思考是「在真实约束下最能撑起行动的那条轨迹，而非最长或最显眼的那条」[来源 #1]。
战略含义：范式从推理迁到智能体后，竞争焦点同步从 RL 算法迁移到环境质量、harness 工程、训练推理紧耦合（[来源 #1]）。具体的数据策展、训练流水线、思考/指令模式合并困境等工程问题，详见 [Agent 工程实践与落地]。

2. Coding Agent 中心论（战略命题）

核心论断：所有 Agent 本质上都是 Coding Agent。OpenClaw 的核心是一个名为 Pi 的 Coding Agent，其余都是套壳；Coding Agent + Skill 基本可以覆盖大多数垂直场景，垂直 Agent 这条路需要被高度怀疑 [来源 #4]。
三个阶段：
- 第一阶段 Copilot：代码补全，人写代码。
- 第二阶段 Claude Code：主动 prompt，人当 AI 指挥者。
- 第三阶段 AI 管 AI：AI 自己发现需求、调度执行，人当质检员 [来源 #4]。
典型旁证：Claude Code 50%+ 使用场景不是 Coding（数据分析、marketing、文案）——印证 Coding Agent 作为通用底座的可组合性 [来源 #4]。
Claude Agent SDK 作为直接实证 [来源 #10]：Anthropic 推出的 Claude Agent SDK 从架构上验证了 Coding Agent 中心论——SDK 的本质是启动一个 Claude Code 子进程作为 Agent 核心，开发者通过 query() / createSession() 调用，子进程自主执行 Read/Write/Bash/Grep/Glob/WebSearch/WebFetch 等工具。换言之，任何通过 SDK 构建的应用，底层都是一个 Coding Agent。SDK 的设计哲学直白地说明：「所有 Agent 本质都是 Coding Agent」不再只是战略判断，而是已经产品化的标准架构。更值得注意的是，SDK 支持通过环境变量将模型后端指向 DeepSeek 等国产模型的兼容端点，代码零修改——这进一步说明 Coding Agent 的核心不在特定模型，而在 Harness 层（工具集 + 工作流 + Skill 体系）。
战略含义：SaaS 公司转型路径不是"训一个垂直模型"，而是"从 know-how 卖方变成 harness 提供方"——为某垂直场景构建优秀的 harness + 知识库 + 工具集，让 Coding Agent 在该场景里跑得最好。具体的 harness 构建方法详见 [Coding Agent Harness 工程实践]、[Harness 演化与未来形态]。
📌 2026-05-20 新证据：Notion Simon Last 提出 Coding Agent = AGI 的 kernel [来源 #12]。理由不同于"所有 Agent 本质都是 Coding Agent"的功能论，而是从**自举性（self-bootstrapping）**切入：代码是少数一种可以让 Agent 自举自身能力的媒介——它不只回答问题，还能写工具、调试工具、维护工具，甚至把自己的工作环境越建越复杂。顺着这条线，Notion 内部提出 software factory 概念：由一组 Agent 组成的流水线，去开发、调试、评审、合并、维护一个持续运行的系统。Simon 甚至让一个 coding agent 线程连续跑了 17 天。战略含义：未来知识工作不会停留在"问答式自动化"，而是走向"多 Agent 协作完成一个结果"——这把 Coding Agent 中心论从"底座可复用"升级为"能力可自演化"。

3. 可验证性原则（Verifiability Principle）

定义：一切可验证的领域（有客观指标、可自动评估），要么已经属于机器，要么很快就会；一切不可验证的领域（需要品味、判断、创造性），仍然属于人类 [来源 #3]。
关键要素：
- 「发现」昂贵 vs 「验证」廉价的不对称性——是 AutoResearch 可去中心化（Folding@home 模式）的根本原因 [来源 #3]。
- 「参差感」（jaggedness）——模型在训练轨道上比光速还快，偏离轨道就像十岁小孩 [来源 #3]。
战略含义：可验证性原则是「该不该交给 Agent」的第一性判据。可验证领域可全自动闭环；不可验证领域必须保留人类品味节点。这条原则也是人类不可替代点的理论根基——判断、品味、意图设计这些"不可验证"的工作是人类最后的领地。

任务类型	是否交给 Agent	战略含义
有客观自动评估（代码、CUDA 优化、超参搜索、测试通过）	全交，闭环自迭代	AutoResearch 模式，"发现昂贵/验证廉价"使其天然适合去中心化
半客观（数据分析、bug 验证）	交，但保留人类抽查	灰色区，需要逐场景沉淀工程模板
不可验证（产品方向、架构权衡、品味、笑话）	不交	人类品味作为 PR 合并门

3.1 任务可评价性：可验证性原则的职业风险转译 [来源 #11]

📌 2026-05-20 新证据：姚顺宇（Anthropic / 前 Gemini）在访谈中提出「任务可评价性」框架，把可验证性原则从 Agent 决策判据扩展为全职业 AI 风险评估工具。

核心判断：AI 最先高速改变的不是人类觉得简单的工作，而是反馈最清楚的工作。AI 不按职业声望排队，它先进入能被清楚定义、快速验收、低成本纠错的任务 [来源 #11]。
任务可评价性三指标——把可验证性原则从二分法细化为连续光谱：

指标	含义	高值 = 风险近
验收速度	做完以后多久知道对错	代码编译/测试秒级反馈 vs 产品上线数月后才知留存
纠错成本	错了以后能不能快速重来	代码回滚秒级 vs 产品方向错误需季度修正
责任位置	你是在执行标准，还是在制定标准	按 spec 写实现 vs 定义 spec 本身

与 Karpathy 可验证性的关系：Karpathy 的二分法（可验证 vs 不可验证）解决了「Agent 自主闭环的边界在哪」；姚顺宇把这条线连续化——不是「可/不可」，而是「验收多快 × 纠错多便宜 × 你站在标准的哪一侧」。前两个越高、第三个越低，该任务就越接近「代码世界」的结构，AI 就越容易练。
代码世界作为 AI 首选练习场的结构解释：程序员先站到第一排，不是因为写代码低端，而是代码世界有测试、编译、运行结果、日志和版本记录——模型做完以后环境会主动告诉它哪里错了。GitHub 和开源生态又提供了海量任务、上下文和修改历史。这与 Coding Agent 中心论（概念 2）的底层逻辑同源——Coding Agent 成为通用底座，本质上是因为代码环境提供了最完整的反馈闭环。
对 PM / 知识工作者的战略含义：产品经理的反馈信号「晚、脏、主观」（功能上线后留存变化混入渠道/活动/竞品等多变量、产品方向对错需要数月甚至数年显现），因此完整产品判断难被训练。但 PM 工作中的可验收执行层（写 PRD、整理访谈、竞品分析、数据初筛）同样会被重构——它们可拆成输入、输出和格式要求，可快速验收，也可低成本重做。职业名不是护身符，任务结构才是风险判据。
与概念 5（存在性风险）的交叉：任务可评价性三指标也是 Agent 自主性应该被授予的判据——验收快、纠错便宜、执行标准明确的任务可以放心交给 Agent 自主迭代；反之需要保留人类监督。

4. Agent 自主性（部署悬挂与三方共建）

部署悬挂（Deployment Overhang）：模型能力远超用户实际授予的自主权。METR 评估 Claude Opus 4.5 能以 50% 成功率完成人类需 5 小时的任务，但 Claude Code P99.9 单轮时长仅约 42 分钟，中位数仅 45 秒 [来源 #5]。
三方共建模型：自主性 = 模型能力 × 用户信任 × 产品默认。任何单一维度都无法完整刻画 Agent 自主性 [来源 #5]。这是本方向最干净的反直觉判断——「等模型变强自主性就上来」是空想，必须三方协同演化。
监督模式的战略反转：经验丰富用户的 auto-approve 率（40%+）和中断率（9%）同时上升，意味着「让 Agent 跑得更猛 + 出问题更激进介入」并非矛盾。Pre-approval → Monitor & Intervene 是 Agent 产品默认设置的全行业级反转 [来源 #5]。具体的监督策略产品化实现（auto-approve 阈值、中断 UI、可信可见性设计）详见 [Agent 工程实践与落地]。

5. 存在性风险三要素（与 [AI 风险全景与治理] 的耦合点）

自主性的能力维度本身就是存在性风险的配方，无需依赖"power-seeking 必然涌现"这种第一性论证 [来源 #8]：

风险三要素 = intelligence + agency + coherence + 弱可控性——只要四者同时具备，"AI 因为某种我们没预见到的奇怪原因（persona 异化、情境推理走极端、训练 trap）做出连贯破坏行为"的概率就不是零。
长程任务能力提升与安全风险同向放大：Agent 的长程一致性（long-term coherence）原本是产品价值（能完成数小时/数天的任务），但同时也是"出问题时一次出更大问题"的放大器。
战略推论：自主性提升不能只看"能跑多远"，必须同步评估"跑偏了能跑多远"——投资 long-term coherence 的同时必须等量投资"长程行为审计 / 中途价值校准 / 可中断性"，否则产品能力越强，事故规模越大。

五大风险类别（自主性 / 滥用破坏 / 滥用夺权 / 经济颠覆 / 间接效应）的完整论述详见 [AI 风险全景与治理]。本方向只标注其与 Agent 范式演进的直接耦合点。

6. Agent 基础设施战争（AI 竞争三阶段论）

核心论断：AI 竞争正在从"模型战争"（比参数/算力/benchmark）→"产品战争"（ChatGPT/Claude/Gemini/Copilot 抢用户时间）→"Agent 基础设施战争"（谁能让 Agent 调用更多工具、连接更多系统、进入更多工作流）。第三阶段的竞争焦点是：谁控制了 Agent 连接世界的方式，谁就可能控制下一代软件入口 [来源 #9]。
标志事件：Anthropic 2026-05 收购 Stainless（API spec → 多语言 SDK/CLI/MCP Server 自动生成平台，数百家公司依赖）。这不是工具公司收购，而是 Agent 时代的基础设施卡位——Anthropic 现在同时拥有 MCP 协议 + Stainless 工业化 SDK 生成能力 + Claude 模型，三位一体的垂直整合。
第四维度：Claude Agent SDK [来源 #10]：原有三位一体（MCP 协议 + Stainless 工业化 SDK 生成 + Claude 模型）现在升级为四位一体——Claude Agent SDK 让开发者零门槛接入整个 Agent 能力栈。SDK 是「从基础设施卡位到开发者生态锁定」的关键一步：有了 SDK，开发者不再只是使用 Anthropic 的模型或协议，而是直接在 Anthropic 的 Agent Runtime 上构建应用。SDK 提供 V1 query() 一次性对话和 V2 Session API 多轮会话 + 会话持久化两种模式，子进程自主调用 Read/Write/Bash/WebSearch 等工具体系——这意味着开发者一旦基于 SDK 构建应用，就同时绑定了 Anthropic 的协议层（MCP）、工具层（内置工具体系）、模型层（Claude）和运行时（Agent Runtime），形成极强的路径依赖。
战略含义：过去互联网公司的终极问题是"谁掌握流量入口"；Agent 时代的终极问题变成"谁掌握 Agent 连接世界的入口"。答案不写在模型榜单上，而写在 SDK、协议、工具、权限、审计和每一次 API 调用里。四位一体的垂直整合（MCP + Stainless + Claude Agent SDK + 模型）意味着 Anthropic 不仅定义了 Agent 的连接方式，还提供了 Agent 的标准化开发路径——这是平台级锁定的经典路数。

7. 软件产业 Agent 化重新分层

旧分层：底层云 → 中间层数据库/API/框架 → 上层 SaaS 应用。
Agent 时代新分层 [来源 #9]：
1. 模型层（大脑）
2. 连接协议与工具调用层（神经）——SDK/API spec/MCP Server/CLI；Claude Agent SDK 是该层的产品化入口 [来源 #10]，将协议层能力封装为开发者可直接调用的标准接口
3. Agent Runtime 层——权限、安全、审计、记忆、工作流编排
4. AI 应用层（面向用户）
战略含义：很多今天看起来"不性感"的中间层（SDK、API spec、MCP server、权限系统、工具注册表、Agent 审计日志、模型路由、执行沙箱、安全策略、跨应用连接器）将成为高价值资产。Stainless 正是第 2 层的工业化供给方——Anthropic 收购它是在卡位"连接协议与工具调用层"。
与概念 2（Coding Agent 中心论）的交叉：Coding Agent + Skill 的可组合性解决了"Agent 能做什么"，但"Agent 能连接什么"取决于工具调用层的覆盖度。两者共同决定 Agent 的行动边界。
📌 2026-05-20 新证据（Notion / Latent Space 播客）[来源 #12]：Notion 明确预判**"未来大多数流量会来自使用我们界面的 Agent，而不是人"。这对 Agent 时代新分层的含义是——第 4 层"AI 应用层"不再只"面向用户"，而必须同时面向人和 Agent**。产品工程团队要让数据库、编辑器、权限系统、SQL 引擎都为 Agent 留出可调用、可理解、可组合的接口。定价、模型选择器（model picker）、自动路由（auto routing）不只是商业决策，而是产品架构的一部分。换言之，软件产业 Agent 化分层的真正含义不只是"多了几个中间层"，而是每一层都要为"Agent 是主要消费者"这个前提重新设计。

五、关键战略案例

工程实操类案例（OpenAI Codex 7 人团队 / Qwen3.6 vs GLM-5.1 模型路线 / Manus 弃用 Function Calling）已迁出至 [Agent 工程实践与落地] 与 [Coding Agent Harness 工程实践]。本方向只保留对范式演进有战略意义的案例。

案例 1：Karpathy 编码/委托比从 80/20 翻转为 20/80 [来源 #3]

背景：2025 年 12 月起 Karpathy 没有亲手打过一行代码。
做法：转型为「向 Agent 传达意志」连续 16 小时；建立 AutoResearch 想法队列（arXiv 论文 + GitHub 仓库 + 人类想法）→ 自动科学家 → 工作者池 → 有效结果走特性分支 → 人类偶尔监控 → 合并主分支。
结果：一个晚上的 AutoResearch 发现了值嵌入权重衰减和 Adam beta 参数的交互效应——20 年经验研究员遗漏的；Dobby 智能家居用 3 个提示词扫描局域网、找到 Sonos、调用 API、接管整栋房子。
战略启发：新瓶颈不是算力而是「token 吞吐量」——你能同时管理多少个 Agent 会话。「焦虑 = 订阅额度还有剩余就去睡觉」——这是 Agent 时代个体生产函数的根本重写。

案例 2：Claude Code 自主性指标 3 个月演化 [来源 #5]

背景：Anthropic 分析 998,481 个随机 API 工具调用 + 50 万 Claude Code 交互会话。
核心数据：
- 中位 turn 时长 ~45 秒（3 个月基本稳定，因新用户涌入拉低分布）。
- P99.9 turn 时长从 <25 分钟翻倍到 >45 分钟。
- 内部最难任务成功率翻倍（Aug→Dec），同期人均干预次数从 5.4 降至 3.3。
- 80% 工具调用有至少一种安全防护；73% 有某种形式的人类参与；仅 0.8% 动作不可逆。
- 软件工程占近 50% 的 agentic 活动。
战略启发：自主性增长在模型发布间平滑过渡，无阶梯跳变——说明自主性增长不纯粹由模型能力驱动，信任积累和产品改进是重要因素。用数据反驳了「监督就是逐项审批」的产品默认。

案例 3：OpenClaw 单日 1600 commit 与「AI 管 AI」 [来源 #4]

背景：OpenClaw 作者展示新一代 Agent 形态。
数据：单日 1600 次 commit ≈ 三四人团队一年工作量；Cursor 一周做出 300 万行代码的浏览器；Anthropic 用 Agent 端到端实现 C 语言编译器；7 人团队 ≈ 过去 30-50 人产出；月消耗 2-3 万美元的 90 分用户与 10 分大多数用户差距可达 1000 倍。
战略启发：Agent 时代不再按组织人数分层，而是按 Token 消耗分层——日消耗 1 亿 Token 的用户 ≈ SaaS 时代的世界 500 强。这条洞察对组织结构、人才战略、定价模型都有颠覆性含义。

六、关键战略洞察

Agent 时代的瓶颈从算力转向「token 吞吐量 + 上下文工程」：Karpathy [来源 #3] 把它命名为「token 吞吐量瓶颈」（你能管理多少 Agent 会话），多个独立工程实践（[Agent 工程实践与落地]、[Coding Agent Harness 工程实践]）从不同层面发现同一个瓶颈——上下文是新的稀缺资源，工程化它就是新的工程学科。战略含义：个体与团队的产能上限不再由代码速度决定，而由"能同时驱动多少 Agent 会话"决定。
数据与 harness 工程取代 RL 算法成为新竞争焦点：林俊旸 [来源 #1] 明确判断「推理时代拼 RL 算法和训练流水线；智能体时代拼环境质量、harness 工程、训练推理紧耦合」；Qwen vs GLM 的路线分化 [来源 #2] 体现「不在模型架构上 PK，在 Coding 后训练数据和场景能力上 PK」——这条护城河沉淀在仓库和组织流程里，比任何 RL 算法 trick 都更难复制。
自主性是模型、用户、产品三方共建的涌现属性，非单一维度能力：Anthropic 实证 [来源 #5] 给出最干净的定义——「The autonomy agents exercise in practice is co-constructed by the model, the user, and the product」。战略含义：「等模型变强自主性就上来」是空想——必须三方协同演化。
Coding Agent + Skill 的可组合性使垂直 Agent 路线被高度怀疑，但 harness 工程留出了护城河空间：曲凯/文锋 [来源 #4] 明确说「垂直 Agent 这条路需要被高度怀疑」；但 [来源 #1] 强调「环境质量、harness 工程是新护城河」——真正的护城河不是"为某垂直场景训一个专用模型"，而是"为某垂直场景构建优秀的 harness + 知识库 + 工具集"。这意味着 SaaS 公司的转型路径是「从 know-how 卖方变成 harness 提供方」。
「人类不可被替代的点」越来越窄但越来越清晰：曲凯/文锋 [来源 #4] 列出两点（taste + 协作默契）；Karpathy [来源 #3] 用可验证性原则给出第一性解释（不可验证 = 人类领地）；Anthropic 实证 [来源 #5] 给出量化（仅 0.8% 动作不可逆）。三篇汇聚到同一个判断：人的价值正在从「执行」迁移到「判断、品味、意图设计」，且这部分工作的产品形态尚未完全成型——这是 PM 和工程师在未来 12-24 个月最重要的能力迁移。
「监督 ≠ 审批」是产品默认设置的关键反转：Anthropic 数据 [来源 #5] 给出最反直觉的事实——经验丰富用户的 auto-approve 率（40%+）和中断率（9%）同时上升。Pre-approval → Monitor & Intervene 是 Agent 产品默认设置的全行业级反转。这条反转背后的产品/工程实现详见 [Agent 工程实践与落地]。
长程一致性是产品价值与存在性风险的同一硬币两面：Agent 范式从状态机迁移到文件系统、从单步任务扩展到 6 小时连续运行、从"几十步崩塌"到"上千步可控"——这些都是 long-term coherence 提升带来的产品价值。但 Amodei [来源 #8] 指出同一能力维度也是存在性风险的核心要素：模型越能保持长程目标一致性，"它一旦走偏就会一致地走偏到底"的概率就越大。这条洞察对 Agent 产品架构有反直觉推论——投资 long-term coherence 的同时必须等量投资"长程行为审计 / 中途价值校准 / 可中断性"。这是与 [AI 风险全景与治理] 的最直接耦合点。
Agent 时代的入口不是聊天框，而是连接层：聊天框可能只是过渡形态。真正的入口是一个能连接所有工具、理解上下文、执行任务、管理权限、调用模型、自动切换服务的 Agent 层——当 AI 从"回答"变成"行动"，整个产业的价值链都会重构：模型公司向工具链延伸（Anthropic 收购 Stainless [来源 #9]）、工具公司向 Agent 平台靠拢、SaaS 被迫开放更多接口、开发者生态围绕协议重新洗牌、安全/审计/权限/治理从可选项变成基础设施。Stainless 收购是"谁掌握 Agent 连接世界的入口"这一终极问题的第一个战略性回答。
Claude Agent SDK 是「Coding Agent 中心论」的产品化证明——「套壳」不是贬义，是最务实的 Agent 开发策略：Claude Agent SDK 的架构设计直白地告诉开发者：除非是大厂有足够资源自研 Agent Runtime，否则最务实的路径就是直接在成熟的 Coding Agent 之上构建应用 [来源 #10]。SDK 把「套壳 Claude Agent」从一个贬义词变成了标准化开发路径——query() 一次性对话、createSession() 多轮会话，子进程自主执行全套工具，开发者只需定义意图和约束。战略含义：「别费劲了，直接套壳 Claude Agent」不是懒惰，而是对 Agent 时代分工的正确理解——模型能力由 Anthropic 负责迭代，Agent Runtime 由 SDK 封装，开发者的真正护城河在 Harness 层（Skill + 知识库 + 工具编排 + 场景理解）。

七、观点张力（保留冲突）

张力 1：Coding Agent 中心论 vs 环境与 harness 才是护城河

正方（曲凯/文锋）[来源 #4]：「所有 Agent 本质都是 Coding Agent」，垂直 Agent 路线需要被高度怀疑，今年的机会是谁能把 Coding Agent 套壳做得足够好。
正方新证据（Claude Agent SDK）[来源 #10]：SDK 让「套壳」从概念变为标准化开发路径——开发者通过 query() / createSession() 直接调用 Claude Code 子进程作为 Agent 核心，无需自研 Agent Runtime。SDK 的存在本身就是 Anthropic 对「所有 Agent 本质都是 Coding Agent」这一判断的产品化押注：如果垂直 Agent 路线成立，Anthropic 没有理由把自己的 Coding Agent 封装成通用 SDK。
反方（林俊旸）[来源 #1]：模型只是新一代护城河的一半——「环境质量、harness 工程、训练推理紧耦合」才是另一半。SFT 时代执着数据多样性，Agent 时代应执着环境质量。
不强行调和的张力：两者并非冲突，但暗示 Coding Agent + 优秀 harness 才是答案。如果只押注 Coding Agent 模型本身，会输给那些把 harness 工程化做到极致的对手；如果只押注 harness 工程，会被更强的底层 Coding Agent 模型反包。
📌 2026-05-20 Notion 实践验证 [来源 #12]：Notion AI 团队（Sarah Sachs / Simon Last）的实践经验从产品侧支持 harness 一方——Simon 直说以前花了很多时间训练模型，但后来越来越觉得训练只是实现细节，关键是外循环：模型怎样和系统交互、工具有没有 bug、Harness 有没有把失败暴露出来、Eval 有没有覆盖真实工作流。Sarah 补充：工具几乎每天在变，专门微调模型理解这些工具反而拖慢整个产品迭代速度。"99% 的时候，问题其实出在某个工具的 bug 上，那就把 bug 修掉。"——这为张力 1 提供了来自生产环境的调和路径：Coding Agent 提供通用底座，但日常迭代的杠杆在 Eval / Harness / 工具质量，而不是模型微调。

张力 2：思考/指令模式融合 vs 分离

融合派（Anthropic Claude 3.7/4 / GLM-4.5 / DeepSeek V3.1 / Qwen3 初版）[来源 #1]：成功合并需要「平滑的推理力度光谱」，模型自适应分配算力，而非二元开关。
分离派（Qwen 2507 回退后路线）[来源 #1]：发独立的 Instruct 和 Thinking 版本——承认融合的数据策展难度，企业客户大批量处理任务要的是指令模式的确定性和低成本。
战略含义：这不是「谁对谁错」，而是「为谁服务」的产品选择。开发者市场拥抱融合（光谱），企业市场偏好分离（确定性）。这条路线分化短期内不会收敛。数据策展层面的具体合并困境详见 [Agent 工程实践与落地]。

张力 3：投资能力 vs 投资防御的资源配比

加速派：Agent 长程一致性是产品价值的核心，应该全力投入提升 long-term coherence、扩大 P99.9 单轮时长、降低人类干预。
审慎派（Amodei 立场）[来源 #8]：long-term coherence 是双面硬币，必须等量投资"长程行为审计 / 中途价值校准 / 可中断性"——否则产品能力越强，事故规模越大。
战略含义：在 ASL-3 到 ASL-4 之间的窗口期，能力侧投入与防御侧投入的比例是 2026 年 Agent 公司战略层最尖锐的资源分配争论之一。这条争论的治理含义详见 [AI 风险全景与治理] 概念 2、方法论 B。

八、待探索问题

文档继续生长的钩子，每个问题指向未来需要补充的源材料方向。

当 Coding Agent 自身的代码也由 Agent 写，谁来界定「代码 = 仓库 = 记录系统」的边界？ 多年尺度上是否会形成人类无法理解的「暗代码」？这关系到"AI 管 AI"时代的可审计性。
Agent 自主性的法律与商业责任如何随「AI 管 AI」演化？ 当 Proactive Agent 自己提需求、搭临时 Agent、执行后销毁，0.8% 的不可逆动作如何归责？这部分需要补充法律/政策方向的源材料。
可验证领域 vs 不可验证领域之间的「灰色区」如何战略化？ Karpathy 给出二分法，但「半客观」任务（数据分析、bug 验证、合规审计）的战略归属与商业模式尚未沉淀。
「部署悬挂」的下一阶段：Agent 自主性 P99.9 突破单日级别后，监督机制如何演化？ 当 P99.9 进入数小时甚至数天，事后监控基础设施要怎么建？这与 [AI 风险全景与治理] 的"自主性风险"治理工具同向耦合。
Token 消耗分层取代组织人数分层后，企业的人力规划如何重写？ 日消耗 1 亿 Token 的个体 ≈ SaaS 时代世界 500 强——这条数据如果成立，传统的组织设计、薪酬体系、招聘逻辑都需要重写。
人类「品味/意图设计/判断」这部分工作的产品形态尚未成型——谁会先做出"意图设计 IDE"？ 类似 Cursor 之于代码、Figma 之于设计——服务于"向 Agent 传达意志"的工具形态会以什么形式出现？
Agent 基础设施战争中，协议制定者/工具生态构建者/模型提供者三位一体后，独立生态位在哪？ Anthropic 收购 Stainless 后同时拥有 MCP 协议 + SDK/MCP Server 工业化生成 + Claude 模型。这种垂直整合是否会压缩独立工具公司的生存空间？还是会通过生态扩大做大蛋糕？OpenAI/Google 是否会对等布局？
当 Anthropic 同时控制 MCP + Stainless + Claude Agent SDK + 模型时，模型后端可替换性是真正的解耦还是「有限的自由」？ Claude Agent SDK 支持通过环境变量将模型后端指向 DeepSeek 等国产模型的兼容端点，代码零修改 [来源 #10]。但工具体系（Read/Write/Bash/WebSearch 等）和 Agent Runtime 仍然绑定 Anthropic 的子进程架构。这种「模型可换但 Runtime 锁定」的模式，对开发者而言是真正的自由还是更隐蔽的锁定？如果 DeepSeek 等厂商只实现了 API 兼容层而非 Agent Runtime 兼容层，开发者的「可替换性」实质上只停留在推理层，而非 Agent 全栈。

九、关联方向

工程实践入口：
- Agent 核心 / Agent 工程实践与落地——Agent 工程方法论全面落地
- Harness 工程 / Coding Agent Harness 工程实践——CLI/Unix 范式、智能体优先开发四大支柱、工具接口设计
- Harness 工程 / Harness 演化与未来形态——Harness 形态演进
风险投影：
- [AI 风险全景与治理]（同目录）——本方向"长程一致性双面性"洞察直接耦合到该方向的"自主性风险"
产业基础：
- [AI 产业全景与算力基础设施]（同目录）——能力趋同 + 应用层护城河的产业基本盘

十、来源索引

#	标题	来源	收录日期	贡献章节
1	从「想得更久」到「为行动而想」：林俊旸的 AI 下一阶段判断	林俊旸 X 长文（前 Qwen 负责人）	2026-04-02	核心概念 1（推理→Agent）/ 关键洞察 2 / 张力 1、2
2	Qwen3.6-Plus 与 GLM-5.1：国产模型宣告 Agentic Coding 时代	综合分析（用户提供）	2026-04-03	关键洞察 2（路线分化背书）
3	Karpathy 深度访谈：AutoResearch、可验证性原则与 AI 成瘾时代	No Priors Podcast（Sarah Guo × Karpathy）	2026-04-03	核心概念 3（可验证性）/ 案例 1（编码委托比翻转）/ 关键洞察 1、5
4	所有 Agent 本质上都是 Coding Agent：SaaS 颠覆、Proactive Agent 与「AI 管 AI」	42章经播客（曲凯×文锋）	2026-04-03	核心概念 2（Coding Agent 中心）/ 案例 3 / 关键洞察 4、5 / 张力 1
5	Anthropic 实证研究：AI Agent 自主性在真实部署中的度量	Anthropic Research	2026-04-07	核心概念 4（部署悬挂、三方共建）/ 案例 2 / 关键洞察 3、6
6	OpenAI Codex 智能体优先开发：百万行代码、7 人团队、0 行人类手写代码	OpenAI 工程博客（Ryan Lopopolo）	2026-04-09	已迁出至 [Coding Agent Harness 工程实践]，本方向仅作引用
7	Manus 前负责人 MorroHsu——单 run 工具与 Unix 哲学的 Agent CLI 范式	r/LocalLLaMA 帖子（Pinix / agent-clip 作者）	2026-05-09	已迁出至 [Coding Agent Harness 工程实践]，本方向仅作引用
8	The Adolescence of Technology: Confronting and Overcoming the Risks of Powerful AI	Dario Amodei（Anthropic CEO），用户提供文本，2026-01	2026-05-19	核心概念 5（存在性风险三要素）/ 关键洞察 7（长程一致性双面性）/ 张力 3
9	Anthropic 收购 Stainless：AI 下半场从模型战争转向 Agent 基础设施战争	用户提供文本（公众号分析文章）	2026-05-20	核心概念 6（Agent 基础设施战争三阶段论）/ 核心概念 7（软件产业 Agent 化重新分层）/ 关键洞察 8（Agent 入口 = 连接层）/ 待探索 7（三位一体后独立生态位）
10	Claude Agent SDK 快速上手与 DeepSeek 配置教程	公众号文章	2026-05-20	核心概念 2（Coding Agent 中心论追加 SDK 直接实证）/ 核心概念 6（Agent 基础设施战争升级四位一体）/ 核心概念 7（连接层产品化入口）/ 关键洞察 9（套壳 = 最务实策略）/ 张力 1（正方新证据）/ 待探索 8（模型可替换性 vs Runtime 锁定）
11	别躲在岗位后：从姚顺宇判断看 AI 为什么不按职业排危险榜	张小珺/姚顺宇访谈转译（公众号文章）	2026-05-20	核心概念 3.1（任务可评价性三指标 = 可验证性原则的职业风险转译）
12	Notion 团队：为什么真正难的不是做 Agent，而是重做整个工作系统	Latent Space 播客（Sarah Sachs × Simon Last）	2026-05-20	核心概念 2（Coding Agent = AGI kernel + software factory）/ 概念 7（Agent 流量超人类流量）/ 张力 1（外循环 > 微调的产品实践验证）

十一、演进记录

日期	版本	变更摘要
2026-05-13	v1.0	首次构建，由 7 篇源文件批量合成。覆盖 Agent 范式迁移、可验证性、Coding Agent 中心、自主性度量、智能体优先开发、CLI 范式 6 大维度
2026-05-19	v1.1	并入 Dario Amodei The Adolescence of Technology 长文：补"存在性风险三要素"+ 新增"长程一致性双面性"洞察
2026-05-19	v2.0	方向重定位：原文件迁出 Agent/ 目录进入战略与前沿目录，重新裁剪为"战略意义与未来方向"专题。删除工程细节（思考/指令合并困境的数据策展、智能体优先开发四大支柱、CLI/Unix 范式两层架构与三启发式、Agentic Coding 模型层细节、OpenAI Codex 7 人团队工程实践案例、Qwen vs GLM 模型路线工程案例、Manus 弃用 Function Calling 工程事故案例、长程任务从状态机到文件系统的工程演进），均一句话带过并引用 [Agent 工程实践与落地]、[Coding Agent Harness 工程实践]、[Harness 演化与未来形态]。保留范式论（推理 vs 智能体）、战略命题（Coding Agent 中心论）、原则（可验证性）、判据（自主性三方共建）、耦合（长程一致性双面性 → 存在性风险）。新增"本文定位"段落、章节统一编号、与 [AI 风险全景与治理] 的耦合点。
2026-05-20	v2.1	并入 Anthropic 收购 Stainless 分析：新增核心概念 6（Agent 基础设施战争三阶段论）、概念 7（软件产业 Agent 化重新分层）、关键洞察 8（Agent 入口 = 连接层而非聊天框）、待探索问题 7（协议/工具/模型三位一体后独立生态位）；来源索引新增 #9
2026-05-20	v2.2	由 /route-knowledge-pm 路由触发，融入 Claude Agent SDK 新证据。Coding Agent 中心论追加 SDK 直接实证（概念 2）；Agent 基础设施战争从三位一体升级为四位一体（概念 6）；软件产业分层追加 Agent SDK 为连接层产品化入口（概念 7）；新增第 9 条洞察（套壳 = 最务实 Agent 开发策略）；张力 1 追加正方新证据（SDK 让套壳标准化）；新增待探索问题 8（模型可替换性 vs Runtime 锁定）；来源索引新增 #10
2026-05-20	v2.3	由 /route-knowledge-pm 路由触发，融入姚顺宇「任务可评价性」框架。可验证性原则新增 §3.1（任务可评价性三指标 = 可验证性原则的职业风险转译：验收速度 / 纠错成本 / 责任位置）；补「代码世界作为 AI 首选练习场」的结构解释；补 PM 工作的可验收执行层 vs 判断层分析；来源索引新增 #11
2026-05-20	v2.4	由 /route-knowledge-pm 路由触发，融入 Notion / Latent Space 播客情报。Coding Agent 中心论追加 Simon Last "AGI kernel + software factory"自举性论据（概念 2）；软件产业 Agent 化重新分层追加"大多数流量来自 Agent"的 Notion 战略判断（概念 7）；张力 1 追加 Notion "外循环 > 微调"的生产实践验证；来源索引新增 #12

思维模型

认知方法论

学科模型

职场与成长

05-AI与Agent

00-基础学科

01-Agent核心

02-Harness工程

03-RAG系统

04-成本与效能

05-AI安全

06-战略与前沿

Agent 范式演进与 AI 未来

一、本文定位

二、方向定位（战略边界）

三、知识图谱（战略视角）

四、核心战略概念

1. 推理式思考 vs 智能体式思考（范式论）

2. Coding Agent 中心论（战略命题）

3. 可验证性原则（Verifiability Principle）

3.1 任务可评价性：可验证性原则的职业风险转译 [来源 #11]

4. Agent 自主性（部署悬挂与三方共建）

5. 存在性风险三要素（与 [AI 风险全景与治理] 的耦合点）

6. Agent 基础设施战争（AI 竞争三阶段论）

7. 软件产业 Agent 化重新分层

五、关键战略案例

案例 1：Karpathy 编码/委托比从 80/20 翻转为 20/80 [来源 #3]

案例 2：Claude Code 自主性指标 3 个月演化 [来源 #5]

案例 3：OpenClaw 单日 1600 commit 与「AI 管 AI」 [来源 #4]

六、关键战略洞察

七、观点张力（保留冲突）

张力 1：Coding Agent 中心论 vs 环境与 harness 才是护城河

张力 2：思考/指令模式融合 vs 分离

张力 3：投资能力 vs 投资防御的资源配比

八、待探索问题

九、关联方向

十、来源索引

十一、演进记录

认知方法论

学科模型

职场与成长

00-基础学科

01-Agent核心

02-Harness工程

03-RAG系统

04-成本与效能

05-AI安全

06-战略与前沿

Agent 范式演进与 AI 未来 ​

一、本文定位 ​

二、方向定位（战略边界） ​

三、知识图谱（战略视角） ​

四、核心战略概念 ​

1. 推理式思考 vs 智能体式思考（范式论） ​

2. Coding Agent 中心论（战略命题） ​

3. 可验证性原则（Verifiability Principle） ​

3.1 任务可评价性：可验证性原则的职业风险转译 [来源 #11] ​

4. Agent 自主性（部署悬挂与三方共建） ​

5. 存在性风险三要素（与 [AI 风险全景与治理] 的耦合点） ​

6. Agent 基础设施战争（AI 竞争三阶段论） ​

7. 软件产业 Agent 化重新分层 ​

五、关键战略案例 ​

案例 1：Karpathy 编码/委托比从 80/20 翻转为 20/80 [来源 #3] ​

案例 2：Claude Code 自主性指标 3 个月演化 [来源 #5] ​

案例 3：OpenClaw 单日 1600 commit 与「AI 管 AI」 [来源 #4] ​

六、关键战略洞察 ​

七、观点张力（保留冲突） ​

张力 1：Coding Agent 中心论 vs 环境与 harness 才是护城河 ​

张力 2：思考/指令模式融合 vs 分离 ​

张力 3：投资能力 vs 投资防御的资源配比 ​

八、待探索问题 ​

九、关联方向 ​

十、来源索引 ​

十一、演进记录 ​

Agent 范式演进与 AI 未来

一、本文定位

二、方向定位（战略边界）

三、知识图谱（战略视角）

四、核心战略概念

1. 推理式思考 vs 智能体式思考（范式论）

2. Coding Agent 中心论（战略命题）

3. 可验证性原则（Verifiability Principle）

3.1 任务可评价性：可验证性原则的职业风险转译 [来源 #11]

4. Agent 自主性（部署悬挂与三方共建）

5. 存在性风险三要素（与 [AI 风险全景与治理] 的耦合点）

6. Agent 基础设施战争（AI 竞争三阶段论）

7. 软件产业 Agent 化重新分层

五、关键战略案例

案例 1：Karpathy 编码/委托比从 80/20 翻转为 20/80 [来源 #3]

案例 2：Claude Code 自主性指标 3 个月演化 [来源 #5]

案例 3：OpenClaw 单日 1600 commit 与「AI 管 AI」 [来源 #4]

六、关键战略洞察

七、观点张力（保留冲突）

张力 1：Coding Agent 中心论 vs 环境与 harness 才是护城河

张力 2：思考/指令模式融合 vs 分离

张力 3：投资能力 vs 投资防御的资源配比

八、待探索问题

九、关联方向

十、来源索引

十一、演进记录