YC 内部 AI 工程实战手册：从「让 agent 直接读 Postgres」到「组织级超级智能」

嘉宾Pete Koomen（Optimizely 创始人、YC 合伙人），与 YC 总裁 Garry Tan、合伙人 Harj Taggar、Jared Friedman、Diana Hu 罕见公开 YC 内部 AI agent 基础设施的完整路线图。
原视频：Inside YC's AI Playbook · YouTube 约 32 分钟 ·

TL;DR：12 条可直接抄作业的经验

不要把 AI 当 co-pilot，把它当 building layer。Pete 全场最核心的一句话——「co-pilot 思维是 2023 年的玩法」。
把所有内部业务收敛到一个 Postgres。所有 founder、batch、investor、CRM 笔记都在同一个库、同一个 schema。
给 agent 一个能跑只读 SQL 的工具，魔法时刻就来了。Jared 半夜悄悄上线，让非技术的财务同事都能问业务问题。
构建一个 Tool Registry。YC 内部 350+ 个工具，同一个 registry 既服务内部 agent，也服务本地 Claude Code。
Skill 化的三段进化：手写 system prompt → 写 skill → meta-prompting 自动改进 skill。
跑 Dream Loop：每晚让 agent 过一遍当天所有员工对话，自动改进 skill / CRM。
「两句话描述」是一个微缩样本。partners 集体打磨 → 会议 transcript 反喂 skill——「现在它比我写得更好」。
默认全员公开 agent 对话。高信任组织里，社会规范比 ACL 更高效。
高智能组织必须满足两点：trust by default、egalitarian by default。
每年烧 10 万到 100 万美元 token，提前住进 2028 年。Garry 把这个叫 time-warp。
AI Horseless Carriages：AI 的潜力是把软件控制权从开发者转交给用户。
极简软件 + JIT 软件：50 万行 Rails → 2 万行 TypeScript + 2000 行 markdown。

一、起点：一个被「财务系统的低效循环」逼出来的项目

Pete 回忆 YC 内部 agent 项目的起点 — Pete Koomen 回忆 YC agent 基础设施的起源——一切始于一年多前为 Finance 团队做的几个小工具。

Pete 把这条线追溯到大约一年前：他和几位工程师正在和 YC Finance 团队坐下来讨论一组工具——记日记账、记录 priced round、各种让 YC 这台机器持续运转的财务流水线。

当时他同时看到两件事：

一边是 YC 内部"古典"的开发模式——财务团队描述一个复杂工作流，工程师把它"翻译"成一段确定性的 Ruby 代码，再交回给财务。这是一个反复横跳、效率低下的循环。
另一边是 Claude Code、Cursor、Windsurf 刚开始走红，Pete 在自己电脑上用 agentic coding 工具感觉「像是有了超能力」。

「我看着同一个公司，一边在用老办法做事，一边在用 agent 给我开外挂——这个 gap 太大了。」

于是他给自己定了一个新方向：与其继续把工程师卡在「翻译需求 → 写 Ruby → 交付」这条流水线上，不如直接给财务团队一套 agent harness，让他们用自然语言（prompt）而不是代码（Ruby）来编码自己的工作流。

Pete 的出发点不是「我要建一个内部 ChatGPT」，而是移除人和工程师之间的中间层。这后来贯穿了 YC 整套架构——agent registry、skill registry、Dream Loop，本质都是在把"中间环节"自动化掉。

二、第一个 magical moment：让 agent 直接读 Postgres

Pete 谈 SQL agent 工具 — Pete 讲述真正解锁一切的那个工具——让 agent 直接对生产数据库执行只读 SQL。

YC 内部第一个 unlock 也是 SQL，但路径完全不同：他们不是把 LLM 当成 SQL 翻译器，而是把生产 Postgres 直接挂在 agent 的工具栏上。

这件事是 Jared Friedman 干的：

「我有点感觉自己在违规——一开始我们都只给非常窄、权限受限的工具。我老是被这些工具的能力上限气到。后来我心想：要不就给它彻底访问生产数据库的能力，让它随便祸祸？我有点偷偷摸摸地，可能某个深夜就推到线上了——结果效果好得离谱。」

他实际上给 agent 配了两个工具：

对生产数据库执行只读 SQL 查询
读 dbt 模型文件（解释 schema 语义）

「我们以前以为是 model 不够强，其实卡住世界的是对 safety、privacy 的过度担心。一旦你少担心一点，会发现这些东西强得离谱。」

为什么这个工具如此关键？答案藏在 YC 的架构里

Pete 讲 YC 统一 Postgres 架构 — Pete 强调 YC 之所以能让 agent 一上来就有效，是因为整个公司的业务都跑在一个统一的 Postgres 上。

「YC 有一个进入这场实验的巨大优势——我们所有软件都跑在自己写的代码上，而所有这些软件都连接到同一个 Postgres。每家 YC 投资的公司在 companies 表里、每个创始人在 founders 表里、每一笔财务交易、每一条我留在内部 CRM 里的备注——全在一个库里。」

绝大多数公司把这些功能交给了 SaaS（HRIS、CRM、ERP、BI、Workflow……），而 YC 选择了相反的路：自研、统一、集中。这条选择在 SaaS 红利期看起来很反潮流，但在 AI 时代变成了最高级的护城河。

Garry 把这个现象总结成 Jevons 悖论——一旦把跨团队的 RTT 抹掉，人们提问的频率和复杂度都会暴涨一个数量级。

Bigtable 的故事正在重演

Garry 类比 Google Bigtable 与 agent 时代数据架构 — Garry Tan 把当前 agent 时代的数据架构演进类比为 Google 当年从关系模型走向 Bigtable 的过程。

「你要做的不是规范化（normalize），而是反规范化（denormalize），把数据装进一个对 agent 检索友好的 schema。可以用 MCP 包一层，但 agent 处理 CLI 比处理 MCP 还顺手——我直觉上更倾向于做一个 Bigtable 风格、但是为 agent 优化的视图。」

这正是他个人项目 G-Brain 在做的事——agent 同时挂载多个上游系统，全部归一化到一个对 G-Brain / OpenClaw 友好的私人 schema，再叠 RAG、graph RAG、混合检索、rerank。

三、Tool Registry：YC 的「内部 MCP」

Pete 介绍 YC 的 Tool Registry — Pete 谈 Tool Registry——YC 内部 agent 体系的真正"业务大脑"。一年里从 20 个工具长到 350+。

Pete 把 YC 的整套架构压缩到几个原语：一个 agent loop、一个 shared tool registry、一个底层的 model router，此外几乎没了。

「Tool registry 是 YC-specific 的东西最后会落到的地方。是它把 agent 变成在工作中真正有用的东西。一开始我们就 20 个工具，现在已经 350+ 了。」

更妙的是——这套工具同时服务两条客户线：

YC 自家的内部 agent harness
每个员工本地跑的 Claude Code

Registry 是 agent 的能力中枢，也是开发者本地 IDE 的扩展层。Pete 称之为「我们这一代应用计算机科学家正在反复独立发明相同的 primitive」。

Skill 化的三段进化

Pete 讲 skill 演进路径 — Pete 谈 skill 化进化路径：手写 prompt → 手写 skill → meta-prompt 自动改进 skill。

写自己的 system prompt——每个人都从这里开始
抽出来变成 skill——把好用的 prompt 沉淀下来给其他人复用
Meta-prompting / Autoresearch——agent 自动改进 skill

YC 在自己的 skill registry 上还有两个工程化小工具：

skillify：做完一件新事，告诉它 skillify it，自动沉淀成一个 skill
check resolvable：扫一遍 registry 里现有 skills 和 tools，让它们满足 DRY（不重复）+ MECE（互斥穷尽）

「坏的是 10 个干同一件事的 skill；好的是 1 个带参数的 skill。模型对 DRY 和 MECE 这两个词的语义意外地敏感。」

四、Dream Loop：让 agent 在夜里改进自己

Pete 讲 Dream Loop — Pete 介绍 Dream Loop——夜间 agent 自动 review 当天所有员工对话，自动改进 skill 和 context。

「我们有一个通用 agent，每晚会去读所有员工当天和 agent 的对话，挑出本来可以做得更好的地方、以及如果一开始就有哪些 context 它会更快收敛——然后写回到 skill 里、写回到内部 CRM 里关于 people 和 companies 的知识里。」

Dream Loop 有两个层次：

Skill 层：自动改进 prompt、补充少见 case
知识层：从员工对话里挖出新事实，回灌内部 CRM，让"组织对世界的认知"以天为单位更新

很多公司只有第一层。第二层才是真正让组织上下文不断生长的关键。

一个微缩样本：YC 的「Two-Sentence Description」

Pete 谈两句话描述 skill — Pete 谈 YC 经典的 Two-Sentence Description skill——"组织级超级智能"如何形成的微缩样本。

「YC 这个机构本身就是一场 context engineering。我们反复在教 founder——你脑子里的 context 是完美的，但好的沟通是把同样的 context 复制到对方脑子里。两句话描述就是这件事的最小单位。」

两句话需要回答两个问题：

这到底是个什么？（如果对方都不知道是什么，他甚至没法问问题）
为什么这件事值得我花时间？（如果他听到还有五家做一样的，他会立刻走神）

这个 skill 的演进路径就是 YC 整套方法论的微缩版：Tom Blomfield 手写第一版 → partners 集体打磨 → 会议 transcript 反喂 agent → agent 自动改进 skill。改进后的 skill「比我自己写得还好」。

「这就是组织内部 superintelligence 长出来的方式——你把任何一个 partner 头脑里关于一件具体小事的 know-how，通过对话沉淀进 skill，整个组织的能力就上一个台阶。不复杂，就是这么直接。」

五、共享组织大脑：高信任 + 扁平 + 默认公开

Garry 谈共享组织大脑 — 五位嘉宾讨论 YC 的"共享组织大脑"机制——agent 对话默认全员公开。

YC 在制度层做了一个其他公司很难复制的选择：默认所有 agent 对话对全员可见。每段对话都会自动广播到一个内部 Slack 频道。

这件事同时解决了多个看似矛盾的问题：

教学：员工通过看别人怎么用 agent 学到怎么用
隐性安全控制：因为知道是公开的，没人会拿 agent 干坏事。在高信任组织里，社会规范是比 ACL 更高效的访问控制
数据回灌：所有对话本身就是 Dream Loop 的训练语料

「真正的高智能 agentic 组织必须同时是 egalitarian by default 和 trust by default——而绝大多数公司既不平等也不信任。但你做了这个选择之后，它就成了一种竞争优势。」

Raise the floor，新员工融入提速

「最让我意外的不是这工具能让最厉害的人更厉害，而是它抬高了下限。新员工原本要 6 个月才能 ramp up，现在他自动继承了组织里最厉害的人怎么做事——相当于跟着 Pete、Garry 做了一段时间学徒。」

「我自己用 coding agent 最大的好处是：所有我尴尬到不敢问人的蠢问题，问 agent 都没压力。在组织里也是——新人不想烦 Harj，那现在他不用烦了。结果是问题被问出来了，答案也被沉淀了下来。」

六、Time-Warp：花 10 万到 100 万美元的 token，提前住进 2028

Garry 谈用 token 预算换时间跃迁 — Garry 抛出"time-warp"概念——愿意为 token 多花一个数量级预算，就能跃迁式抢在所有竞争对手前面。

「你得愿意一年花 10 万到 100 万美元在 token 上。如果你愿意花、并且认真投资到 skill 上、把团队所有事情都开放协作做，你基本上是在提前活到 2028 年——你今天花 100 万的事，两年后就 1 万，再后年就两三百块。」

「这是一次性的 time-warp 窗口期，让你能直接跨过所有 Fortune 500、所有现有创业公司。我在想 90 年代企业开始给员工买电脑的那段时间，是不是也是这种感觉——电脑又贵又不稳定，但当你的竞争对手还没电脑的时候，你已经飞起来了。」

这条说得有点过于乐观，但它指向一个真问题：在 token 价格曲线快速下行的窗口里，"过度消费" token 在经济上是合算的——因为你买的不是计算，而是「提前两到三年看清楚一个未来已经定型的工作流」。

七、Horseless Carriages：AI 软件控制权之争

Pete 谈他的 Horseless Carriages 文章 — Pete 重新解读他那篇"AI Horseless Carriages"——AI 真正的潜力是把软件控制权从开发者交还给用户。

「Horseless Carriages 是我对当时一大批 AI 产品的批评——大家在把 AI 当成一个小功能塞进一堆现有软件里。但下面真正的想法是：AI 的潜力是把软件的控制权从开发者转移给用户。」

Pete 谈 AI 软件控制权从开发者转向用户 — Pete 强调 AI 时代真正的范式转移：把 prompt、上下文、行为控制权交还给用户。

「这些 AI 功能里关于 agent 要怎么干活的 prompt context，是被开发者藏起来、用户看不到、改不了的——这是一种典型的家长式 safetyism。我讨厌这种想法。」

把这一条对照到 YC 自己的设计，逻辑就完整了——Tool Registry / Skill registry / Dream Loop 全部都是让 prompt 和工作流尽可能可见、可改、可复用的工程产物。同一个哲学的两个层面：

对组织内部：让每个员工都能看、改、加 skill
对终端用户：让 prompt 不再是黑盒

八、极简软件 + JIT 软件：50 万行 Rails → 2 万行 TypeScript

Garry 和 Jared 讨论极简 AI 软件设计 — Garry 和 Jared 讨论"小而精"的 AI 软件设计哲学——OpenClaw、Pi、Claude Code 都遵循这个原则。

「我用过的、自己内部建的或别人建的、最好的 AI 软件，都是非常小的、只加'让模型发挥所需要的那一点点代码'。从一个简单到几乎不需要文档就能开始用的东西出发，你能 build 出非常多东西。」

他举的最爱例子是 Pi——OpenClaw 里默认的开源 coding agent：

「Pi 是一个特别漂亮的东西，能用 Pi 自己来改 Pi、扩展 Pi。这种 self-extending、self-referential 的软件形态我觉得会越来越多。」

Garry 的亲身案例：Gary's List → G-Brain

Gary's List v1：花一个半月用 Rails 写的全栈 agentic 应用——约 50 万行 Rails 代码
G-Brain（v2）：完全开源的重写——约 2 万行 TypeScript + 2000 行 markdown

「v1 我是按 2013 年的方式写代码的——这是最后一次我手写代码。v2 用 OpenClaw + Telegram 接管了 retrieval、对话界面、记忆，所有这些我都不用自己再实现一遍了。剩下的 2000 行 markdown 是真正的逻辑——'第二段我希望它多写一段政治人物的简短传记'这种调整，editor in chief 自己改 markdown 就行，我根本不需要碰代码。」

「这才是 just-in-time software 的开端，而且我已经能看见它就在眼前。」

这条对开发者最重要的启示是：「软件 = 代码」的等式在 agent 时代正在被改写。代码变成了围绕模型搭的最小骨架，真正的"业务逻辑"以 skill / prompt / markdown 的形式存在，因此所有"业务逻辑"都成了运行时可热改的资产。

九、Apple I 时刻：1984 还是 Homebrew Computer Club？

Garry 提出当前正处于 AI 领域的 Apple I 时刻 — Garry 把当前 AI 时代类比为 1976 年的 Apple I 时刻——五大厂的"1984"未来 vs. 个人 AI 的 Homebrew 未来。

「我脑子里出现的画面是 1984 年那支 Apple 的麦金塔广告。2034 会不会就是另一个 1984？一种未来是——五位 AI 之王，可能最后只剩一个。他们有最先进的模型、有所有终端用户、有所有数据中心——他们就是把 Gmail 那套搬到你整个数字生活里。」

「这就像个人电脑从未出现过、世界只有大型机的另一种历史——你买不到 PC，你得去某个机构申请几百万美元的机时。」

另一种未来则是「Homebrew Computer Club 那条线」——Steve Jobs 和 Steve Wozniak 在 Mountain View 的车库里焊电路板、卖出 500 台 Apple I 的那段历史。

「真正的 personal AI 革命」长什么样？Garry 给的清单是：

跑你自己的软件
改你自己的 prompt
测试一切
有一个只属于你自己的私人 repo
自己选模型，包括 open-weight 模型
AI 是你自己的延伸，而不是大厂想让你成为的样子

「AI 不是人类的替代品，是放大器。如果你看 mainframe → PC → 互联网这条线，整体故事都是 individual empowerment。AI 应该走的也是这条路。」

「但这些都是选择。默认情况下公司不开放，默认是命令与控制。我们需要一种非常不一样的组织形态，也需要一种非常不一样的算力供给方式。这些都是选择题，而且做选择的人，就是今天在 build 这些东西的人——所以我们最好选好。」

十、一份可执行的「Inside YC Playbook」精简版

层级	YC 的做法	你可以怎么做
数据	一个 Postgres、一个 schema、统一 CRM/财务/项目	至少把高频内部决策依赖的数据，归一化到一个 agent 友好的 schema
工具	Tool Registry，350+，跨内部 agent 和 Claude Code 共享	给团队一个共享 registry（MCP 也行），允许任何人加工具
Skill	DRY + MECE 的 skill 表 + `skillify`、`check resolvable`	任何重复 prompt 都 skillify，定期跑一次去重
改进	Dream Loop 夜间读所有对话，更新 skill 和 CRM	至少每周跑一次"复盘 agent"，把好的对话回灌
可见性	Agent 对话默认全员可见 → Slack	至少团队内默认公开，社会规范 + 公开通道
预算	每年 10 万–100 万美元 token，提前住进 2028	把 AI 预算独立列一项，按 time-warp 思路投资
审美	Pete: 写尽可能少的代码、让模型发挥	用 skill / markdown / prompt 表达业务逻辑，代码只做骨架

Lightcone 片尾 — Lightcone Podcast 片尾——主持人 Diana Hu / Harj Taggar / Jared Friedman / Garry Tan，本期嘉宾 Pete Koomen，制作 / 摄像 Ryan Loughlin、Matt Kang、Chris Hall，剪辑 Amanda Deisler。

附录：本文的"图文并茂"是怎么自动做出来的？

本文 17 张配图是用豆包 Doubao-Seed 多模态模型的 video 关键帧理解能力自动选出来的——具体路径：

yt-dlp 下载 YouTube 视频
bun run scripts/main.ts --task asr 用 Doubao-Seed 做 ASR，得到完整英文转录
bun run scripts/main.ts --task keyframe-extract --transcript-file ... 让 Doubao-Seed 结合 transcript，输出技术博客配图候选关键帧 JSON
手工挑选有信息密度的帧 + 用 ffmpeg -ss <t> -i video.mp4 -frames:v 1 截图
写正文，把截图嵌入论点旁边

整集视频的 ASR + 关键帧分析合计消耗约 43 万 token、4 段并发约 5 分钟跑完——成本基本可以忽略。豆包多模态在这种「真正读懂视频、为博客配图选帧」的场景里效果意外地好——它会主动避开重复的全景镜头，挑出有手势、表情、信息变化的关键瞬间。

本文基于 Inside YC's AI Playbook (Lightcone Podcast) 视频整理。英文原话尽量贴近转录，意译和延伸部分由作者承担。
原视频：Inside YC's AI Playbook · YouTube