Agent Harness 速读：来新璐的 12 个核心判断

🧪 Harness 架构

架构

"模型以外都是 Harness。模型是聪明的大脑，但没有手脚。Harness 就是给它穿上机甲。"

他把 Harness 拆成三层：执行能力层（给模型配工具）→ 上下文与状态层（环境感知 + 接力交接）→ 编排与治理层（多 Agent 协调 + 权限隔离）。三层对应：会跑 → 跑久 → 跑稳。

架构

"上下文窗口满了以后，其实已经是一个新的 Agent 在工作——它要接上上一个 Agent 交接给它的工作。这是接力赛跑。"

标准 Agent 模型有 256K 上下文，但长程任务仍然会装满。关键策略：设阈值（比如 80%）启动交接——写进展文档，让下一个 Agent 读完后接着干。这是 Claude Code 内部的核心设计之一。

架构

"工具配置要紧密跟 Agent 角色绑定。做 explore 的 Agent 就不应该有写和删的能力。测试 Agent 不应该一边测一边改代码。"

看似简单的工具配置暗藏陷阱——权限隔离。测试 Agent 如果能修改代码，它会 hack 自己的测试结果。做 explore 的 Agent 只配无副作用的只读工具。

🔧 Claude Code 解析

源码

"Claude Code 有一个 Auto Dream 机制——每隔一天对最近的会话做重放，就像我们做梦一样。纠正错误事实、合并记忆。"

两套记忆更新机制：① 实时——每次工作完成后 fork 一个轻量 Agent 复用 KV cache 判断要不要保存信息 ② 定时做梦——至少 5 个 session 后触发，后台 Agent 做深层记忆整理。记忆文件和 Skill 一样：前三行 YAML + description，按需加载而非全量加载。

源码

"上下文压缩策略远比我们想的更加多级。什么时候删工具 output？哪些信息保留？哪些让 Agent 自己按需查看？里边有非常多 trade-off。"

两种典型策略：① 清理垃圾——踢掉不必要信息腾出几十K继续工作 ② 阈值交接——窗口到 80% 就写进展文档交班。交接该写什么、不该写什么、下一个 Agent 初始化怎么准备——Claude Code 在这里做了大量工程兜底。

源码

"Claude Code 的 Insight 特性——分析最近一个月的对话、分析任务成败和犯了什么错误、生成总结 report。这是整波 Skill 自迭代的起源。"

很多 feature 没有对普通用户发布，由远程 flag 控制。记忆设计和 Skill 遵循同一套哲学——结构化 Markdown + YAML header + 按需加载。开源项目 MemU 也采用了类似的 "Unix 文件系统 + Agent 驱动" 模式。

💡 设计哲学

哲学

"更多的 Context，更少的 Control。Zero Control——最多就是限制有些工具不能调。Claude Code 完全淋漓尽致地体现了这一点。"

传统做法：设想好不同情况怎么处理，组成大的状态图。Claude Code 的做法：给模型配工具、给充分自由，不让程序员每一步指定"你就按我这个办"。本质上就是"模型才是 Agent"——Prompt 链条式做法不 make sense。

哲学

"关于上下文管理——最好的管理就是不要做管理。随便做裁剪会导致 KV 重新算一遍，Prompt Caching 失效。"

好的 Harness 两个判据：① 跟模型运行自洽（不破坏 KV cache）② 跟模型进步方向正交（模型越强 Agent 越强，而不是束缚模型——否则就像 LangChain 一样不断做破坏性更新）。

哲学

"Linux 命令在预训练中出现几十亿条。MCP 的语料占比可能不到 0.1%。Unix 1971 年就有了——返璞归真。"

他亲身经历了从 GitHub MCP 退回 gh CLI 的过程——CLI 调用的任务成功率高很多。飞书 CLI 也验证了同样规律。"Bash is All You Need" 是他九个月前写在 Learn Claude Code 仓库首页的标语，正在成为行业共识。

🚀 一人公司与未来

创业

"我从来不觉得一人公司是本质的事情。真正 makes sense 的是零人公司。"

23 岁，河南工业大学毕业，一人公司（加两名实习生）模式刚 close 300 万美金。他资助的 UU Agent 项目——创作者做完就放进汪洋大海，让它自己进化、在 GitHub 化缘赚 Token。"未来你口袋里一张卡片跑五个公司，每年创造几十亿收入。"

创业

"我们用数据结构在内存中实现了一台 Unix 计算机——只有 1KB 大小。Agent 以为自己生活在一台真实的 Unix 机器上。"

K Computer：TS 重写虚拟 Bash + 文件系统 + 进程管理 + 局域网。Trade-off：不能跑 GCC 或浏览器，但这些本就该放在集约化 infra 里。目标：所有能跑 JS 的场景（浏览器、小程序）都能用，心智统一简洁。

创业

"Agent 模型还在婴儿期。下一步是蜂群集群化——Agent 自己管理和协调更多 Agent。再之后，Agent 做发明、自迭代科研方案。"

Anthropic 2024 年初率先训练智能体模型，其他厂商落后半年。当前单体 Agent + 人工编排 → 下一步 Agent 蜂群自治 → 更远处 Agent 驱动的零人公司。他的 Slogan："加速世界升级"。

Agent Harness 速读：来新璐的技术判断

Agent Harness 速读：
来新璐的技术判断