🧪 Harness 架构
1
架构
"模型以外都是 Harness。模型是聪明的大脑,但没有手脚。Harness 就是给它穿上机甲。"
他把 Harness 拆成三层:执行能力层(给模型配工具)→ 上下文与状态层(环境感知 + 接力交接)→ 编排与治理层(多 Agent 协调 + 权限隔离)。三层对应:会跑 → 跑久 → 跑稳。
2
架构
"上下文窗口满了以后,其实已经是一个新的 Agent 在工作——它要接上上一个 Agent 交接给它的工作。这是接力赛跑。"
标准 Agent 模型有 256K 上下文,但长程任务仍然会装满。关键策略:设阈值(比如 80%)启动交接——写进展文档,让下一个 Agent 读完后接着干。这是 Claude Code 内部的核心设计之一。
3
架构
"工具配置要紧密跟 Agent 角色绑定。做 explore 的 Agent 就不应该有写和删的能力。测试 Agent 不应该一边测一边改代码。"
看似简单的工具配置暗藏陷阱——权限隔离。测试 Agent 如果能修改代码,它会 hack 自己的测试结果。做 explore 的 Agent 只配无副作用的只读工具。
🔧 Claude Code 解析
4
源码
"Claude Code 有一个 Auto Dream 机制——每隔一天对最近的会话做重放,就像我们做梦一样。纠正错误事实、合并记忆。"
两套记忆更新机制:① 实时——每次工作完成后 fork 一个轻量 Agent 复用 KV cache 判断要不要保存信息 ② 定时做梦——至少 5 个 session 后触发,后台 Agent 做深层记忆整理。记忆文件和 Skill 一样:前三行 YAML + description,按需加载而非全量加载。
5
源码
"上下文压缩策略远比我们想的更加多级。什么时候删工具 output?哪些信息保留?哪些让 Agent 自己按需查看?里边有非常多 trade-off。"
两种典型策略:① 清理垃圾——踢掉不必要信息腾出几十K继续工作 ② 阈值交接——窗口到 80% 就写进展文档交班。交接该写什么、不该写什么、下一个 Agent 初始化怎么准备——Claude Code 在这里做了大量工程兜底。
6
源码
"Claude Code 的 Insight 特性——分析最近一个月的对话、分析任务成败和犯了什么错误、生成总结 report。这是整波 Skill 自迭代的起源。"
很多 feature 没有对普通用户发布,由远程 flag 控制。记忆设计和 Skill 遵循同一套哲学——结构化 Markdown + YAML header + 按需加载。开源项目 MemU 也采用了类似的 "Unix 文件系统 + Agent 驱动" 模式。
💡 设计哲学
7
哲学
"更多的 Context,更少的 Control。Zero Control——最多就是限制有些工具不能调。Claude Code 完全淋漓尽致地体现了这一点。"
传统做法:设想好不同情况怎么处理,组成大的状态图。Claude Code 的做法:给模型配工具、给充分自由,不让程序员每一步指定"你就按我这个办"。本质上就是"模型才是 Agent"——Prompt 链条式做法不 make sense。
8
哲学
"关于上下文管理——最好的管理就是不要做管理。随便做裁剪会导致 KV 重新算一遍,Prompt Caching 失效。"
好的 Harness 两个判据:① 跟模型运行自洽(不破坏 KV cache)② 跟模型进步方向正交(模型越强 Agent 越强,而不是束缚模型——否则就像 LangChain 一样不断做破坏性更新)。
9
哲学
"Linux 命令在预训练中出现几十亿条。MCP 的语料占比可能不到 0.1%。Unix 1971 年就有了——返璞归真。"
他亲身经历了从 GitHub MCP 退回 gh CLI 的过程——CLI 调用的任务成功率高很多。飞书 CLI 也验证了同样规律。"Bash is All You Need" 是他九个月前写在 Learn Claude Code 仓库首页的标语,正在成为行业共识。
🚀 一人公司与未来
10
创业
"我从来不觉得一人公司是本质的事情。真正 makes sense 的是零人公司。"
23 岁,河南工业大学毕业,一人公司(加两名实习生)模式刚 close 300 万美金。他资助的 UU Agent 项目——创作者做完就放进汪洋大海,让它自己进化、在 GitHub 化缘赚 Token。"未来你口袋里一张卡片跑五个公司,每年创造几十亿收入。"
11
创业
"我们用数据结构在内存中实现了一台 Unix 计算机——只有 1KB 大小。Agent 以为自己生活在一台真实的 Unix 机器上。"
K Computer:TS 重写虚拟 Bash + 文件系统 + 进程管理 + 局域网。Trade-off:不能跑 GCC 或浏览器,但这些本就该放在集约化 infra 里。目标:所有能跑 JS 的场景(浏览器、小程序)都能用,心智统一简洁。
12
创业
"Agent 模型还在婴儿期。下一步是蜂群集群化——Agent 自己管理和协调更多 Agent。再之后,Agent 做发明、自迭代科研方案。"
Anthropic 2024 年初率先训练智能体模型,其他厂商落后半年。当前单体 Agent + 人工编排 → 下一步 Agent 蜂群自治 → 更远处 Agent 驱动的零人公司。他的 Slogan:"加速世界升级"。