一个 L8 Principal 工程师的 Agentic Engineering 全流程拆解

讲者 Kun Chen，前 Meta、Microsoft、Atlassian L8 Principal 工程师，参与过 Bing 搜索引擎、Windows、Facebook 游戏等大规模系统。近年在 Atlassian 构建前沿编码 Agent，个人每天产出 40-50 个经过完整测试并上线的 PR。
原视频：L8 Principal's Agentic Engineering Workflow（YouTube，约 46 分钟，2026 年 6 月 20 日）。约 28 分钟 ·

本文要点（TL;DR）

用终端（WezTerm + tmux + Neovim）构建全键盘驱动的开发环境，手不离键盘 = 持续心流
Agent 的记忆系统分两层：全局 memory file 尽量精简（27 行），项目级持续积累经验，条件性知识抽成 skill 按需加载
给 Agent 的工具决定了效率天花板 - AXI 标准比 MCP 省 3 倍 token、快 2 倍
人只在"开头定方向"和"结尾把质量"两个时刻介入，中间全部交给 No Mistakes 自动流水线
多 Agent 并行靠 Treehouse 管理 worktree，过夜靠 Good Night Have Fun 循环跑
终极形态是 First Mate - 一个统筹所有 Agent 的"大副"，人退到船长位置只管方向

关于配图：本文配图分两类——① 取自原视频的真实画面（终端、编辑器、浏览器界面截帧）；② 根据视频内容重新绘制的中文示意图（图注中标注"基于视频内容整理"）。

1. 装备船只：为什么是终端？

Kun Chen 用了一个航海比喻来组织整个视频：你是船长，Agent 是船员，工具链是你的船。出海之前，得先把船造好。

他的开发环境是纯终端流：WezTerm（终端模拟器）+ tmux（终端复用器）+ Neovim（编辑器）。三件套全部键盘驱动，不碰鼠标。

WezTerm + tmux + Claude Code 工作环境 — 图 1：Kun 的日常工作界面 - 左侧 Neovim，右侧 Claude Code，tmux 管理多标签页

选终端不是为了装酷，有两个实打实的理由：

第一，手不离键盘。 这不是小事。手在键盘上时你在心流里；手挪到鼠标上时，大脑被迫做一次上下文切换。GUI 应用也有快捷键，但鼠标才是 GUI 的主要交互范式，你很难完全不碰它。终端应用天生就是为键盘设计的，不存在这个诱惑。

第二，环境可以跟着人走。 tmux session 是持久化的 - 断开连接再重连，一切都在。更强的是，他可以从另一台设备（甚至手机）连到同一个 tmux session 继续工作。

"I can keep the exact same workflow everywhere, even on my phone. But if you really don't like the terminal, that's okay too."

我可以在任何设备上保持一模一样的工作流，包括手机。不过你要是真不喜欢终端也没关系。

2. 招募船员：Agent 的记忆与技能体系

Agent 的选择

Kun 日常用四个 Agent harness，但他的整个工作流是 Agent 无关的（agent-agnostic），不绑定任何特定模型或 harness。

Agent	特点
Claude Code	开箱体验最好，功能丰富，偶尔有 bug，定制性一般
Codex CLI	Rust 写的，比 Claude Code 流畅，开源可自查，花哨功能少
Pi	极简哲学，高度可扩展，适合喜欢折腾的人
Open Code	TUI 丝滑，模型兼容性最好，开箱即用功能比 Pi 完整

Memory File：两层记忆

Neovim 中的 AGENTS.md 文件 — 图 2：左侧文件列表中可以看到 AGENTS.md 和 .agents 目录，右侧是 Claude Code 运行界面

全局 memory file（~/.claude/CLAUDE.md 或 ~/AGENTS.md）只有 27 行，用 symlink 让两个路径指向同一个文件。为什么精简？因为这个文件的内容会注入到每一个 Agent session 的 system prompt 里，跨所有项目。写多了就是在静默消耗 token。

他只放最核心的偏好，比如 "never use mdash" 和一条很有意思的规则：

"When making technical decisions, don't give too much weight to development cost."

做技术决策时，不要太看重开发成本。

原因是：AI 模型从人类数据学到了人类工程师的工时估算习惯。让 Claude 估算做一个 3D 射击游戏要多久，它给出天和周的估算。但实际让它动手写，几分钟就能出一个可玩版本。

"AI doesn't seem to know it can code much faster than humans yet."

AI 似乎还不知道自己写代码比人类快得多。

项目级 memory file 内容多得多，是这个项目所有 Agent session 的集体经验积累。构建方式不是一次性写好，而是每次看到 Agent 犯错就纠正它，让它把教训记到 memory file 里。日积月累，船员就越来越懂这个项目。

Skill：按需加载的条件性知识

实时演示 skill 提取 — 图 3：左侧 Neovim 编辑 AGENTS.md，右侧 Claude Code 执行 skill 提取，底部安装 skill-creator

项目级 memory file 会越来越臃肿。解法是把只在特定条件下有用的知识抽成 skill。比如端到端测试的指令只有改代码时才用得上。变成 skill 之后，Agent 启动时只加载一行 skill 描述到 system prompt，真正需要时才读取完整内容。这就是渐进式披露（progressive disclosure）。

关于从网上安装 skill 的警告

Kun 发了一个很直接的警告：不要随便安装网上流传的 skill，哪怕它有很多 GitHub star。

他拿 andrej-karpathy-skills 仓库举例（17.7 万 star），用 ProgramBench 评测发现：用了这个 skill 之后，Agent 多花了 5% 的 token，结果反而更差。

"A lot of the skills being widely shared today have not been rigorously evaluated and are typically just some random guy who found something that worked for themselves anecdotally and somehow got it to go viral."

今天广泛传播的很多 skill 都没有经过严格评测，通常只是某个人自己觉得好用，然后不知怎么就火了。

3. 与单个船员高效协作

Agentic Engineering 五层进阶 — 图 4：Kun 的工作流分为五个层级，从基础环境搭建到船长模式（基于视频内容整理）

语音输入：3 倍打字速度

Claude Code 中的语音转写 — 图 5：Claude Code 界面显示 "Transcribing..." - Kun 正在用 Open SuperWhisper 语音输入

Kun 基本不打字了，全部用语音输入。他用的是 Open SuperWhisper - 免费开源的本地语音转写工具，本地跑 Whisper 模型。他引用 Stanford 论文指出说话速度是打字的 3 倍。实用技巧：在 Open SuperWhisper 的 system prompt 里放常用项目名词汇表，转写识别率非常高。

工具效率：AXI vs MCP

AXI GitHub 基准测试结果 — 图 6：基准测试对比（85 次运行平均） - AXI 以 100% 成功率和最低成本胜出

方案	成功率	平均成本	总成本	延迟	平均轮次
AXI	100%	$0.050	$4.26	15.7s	3
CLI	86%	$0.054	$4.58	17.4s	3
MCP (无 toolsearch)	87%	$0.148	$12.59	34.2s	6
MCP (有 toolsearch)	82%	$0.147	$12.45	41.1s	8

AXI（Agent eXperience Interface）是 Kun 设计的一套标准，核心思路是把工具设计成 Agent 友好的。其中一条原则：用 token 高效的输出格式比 JSON 省约 40% token。结论很清楚：用 GitHub MCP 就是在花 3 倍的钱和 2 倍的时间做同一件事。

Lavish：把"文字墙"变成可交互原型

Lavish Editor 浏览器界面 — 图 7：Lavish Editor - Agent 自动生成的 HTML 交互原型，使用与当前项目一致的设计系统

Agent 不再打印文字墙，而是启动浏览器渲染 HTML 交互原型。它使用当前项目的设计系统，视觉效果和真实产品一致。你可以直接在界面上标注、评论、点选决策，全程不用回终端。

"Honestly, I can never go back to reading text in the terminal anymore."

说实话，我再也回不去在终端里读文字了。

4. No Mistakes：全自动质检流水线

当 Agent 说"我做完了"，很多人会打开编辑器开始 review diff。Kun 认为这是扩展性瓶颈：

"AI writes code so fast, and if every piece of code requires your review, then you are creating a big bottleneck on yourself."

AI 写代码那么快，如果每段代码都要你人工审查，你就把自己变成了瓶颈。

他的类比：你应该像一个工程总监那样工作。总监不 review 每个 PR，但通过建立好的文化和流程来保证质量。

No Mistakes 流水线运行中 — 图 8：No Mistakes 流水线正在运行 - 右侧可以看到 Intent → Rebase → Review 各阶段进度

No Mistakes 全自动质检流水线 — 图 9：No Mistakes 的 13 步全自动流水线（基于视频内容整理）

13 步全自动：创建分支 → 提交代码 → 隔离 worktree → 分析 session 理解意图 → Rebase 解决冲突 → 对抗式代码审查（大部分问题在这里被抓住）→ 自动修复/升级人工 → E2E 测试 + 录制证据 → 更新文档 → Lint → Push + PR → 持续看护 PR → 等待合并。

PR 包含风险评估，Kun 根据它决定花多少时间看 diff：

"For low-risk changes, I don't really look at the diff at all because I have validated time and time again - any problem I could catch is very likely already caught by the pipeline."

低风险的变更我根本不看 diff，因为我反复验证过，流水线几乎都已经抓住了我能发现的问题。

时间分配对比 — 图 10：传统模式 vs Kun 模式的时间分配 - 中间阶段越长越自动化，并行能力越强（基于视频内容整理）

5. 多船员并行与过夜自动化

Treehouse：自动化 worktree 生命周期

多个 Agent 在同一目录工作会互相踩脚。标准方案 git worktree 有心智负担：要想名字、记住用途、手动清理。Treehouse 消除了这些：输入 treehouse 立刻进入隔离 worktree，关闭标签页自动回收，下次自动复用空闲的。

三个并行 Claude Code session — 图 11：tmux 顶部标签栏显示三个并行任务 - 每个都在独立的 Treehouse worktree 中运行

Good Night Have Fun：过夜自动循环

每晚 7-8 小时怎么让 Agent 一直干活？Good Night Have Fun（GNHF）给它一个目标，自动循环执行直到满足停止条件。

"Pretend you are a 7-year-old kid and use the Hi-Bit app end to end. Find the first usability problem that would confuse you as a kid. If you find a problem, stop and fix it. Then rinse and repeat."

假装你是一个 7 岁小孩，端到端使用 Hi-Bit app。找到第一个会让小孩困惑的可用性问题，修掉，然后重复。

适合 GNHF 的任务：降低页面加载时间、提高测试覆盖率、自动调研改进指标 - 任何可验证的循环目标。

6. 船长模式：First Mate

多 Agent 并行后你会发现：在多个 session 间切换本身就很累。First Mate 是他的解法 - 一个管理所有 Agent 的"大副"。

First Mate 管理并行任务 — 图 12：First Mate 正在并行管理三个 GitHub 项目的任务 - 自动开 worktree、分配 Agent

Kun 现场演示：让 First Mate 给三个项目同时加功能。它自动识别为三个独立任务，开 tmux 标签页、创建 worktree、分配 Agent、跑 No Mistakes、准备 PR。与此同时，Kun 继续给新指令讨论 issue，First Mate 一边等后台任务一边处理新请求。

"Watching it context switch is actually an oddly satisfying experience because I know that's what I would have to do otherwise."

看着它做上下文切换其实挺爽的，因为我知道不然这些事得我自己来。

7. 全景工具链

Kun Chen 开源工具全景 — 图 13：Kun 的全部开源工具一览（基于视频内容整理）

工具	用途
AXI	Agent 工具设计标准 + GitHub/Chrome DevTools 实现
Lavish	可视化规划编辑器，把文字墙变成交互原型
No Mistakes	13 步自动化代码质检流水线
Good Night Have Fun	过夜自动化循环，支持 token/迭代上限
Treehouse	Worktree 生命周期管理，一键创建/自动回收
First Mate	Agent 总指挥，统一入口管理所有并行任务
Open SuperWhisper	免费开源本地语音转文字

所有工具均免费开源，GitHub 链接见视频描述。

8. 关键洞察与实操建议

思维模式转变

核心观点：从工程师思维转变为工程总监思维。不要逐行审查 AI 写的代码，而是建立自动化流程替你把关。你只在流程标记为"高风险"时才介入。

Memory file 操作建议

全局 memory file 控制在 30 行以内，每多一行就是所有 session 的常驻 token 成本
项目级 memory file 不要一次性写好，看到 Agent 犯错就纠正，让它自己把教训写进去
膨胀了就拆 skill，判断标准：这段知识是不是只在特定条件下有用？

不要盲信网红 skill

Star 数衡量的是流行度，不是效果。没有发布过严格评测结果的 skill，不要装。

船长的最终挑战

当 First Mate 帮你处理了所有执行层面的事情之后，你会发现一个意想不到的问题：你自己没活干了。这其实是好事 - 说明瓶颈转移了。

"This requires a mindset shift of focusing more of your energy on understanding what matters by talking to your users, understanding the competitive landscape, and crafting a good treasure map that can lead your crew to a good direction."

这需要一个思维模式的转变 - 把更多精力放在理解什么是真正重要的事：和用户交谈、理解竞争格局、画出一张好的藏宝图来引导船员走向正确的方向。

本文基于 Kun Chen 的 YouTube 视频 L8 Principal's Agentic Engineering Workflow 整理。所有工具均免费开源。
图文整理：AI 辅助