← 播客精读
Lightcone Podcast · YC 内部 AI 工程实战手册

YC 内部 AI 工程实战手册:从「让 agent 直接读 Postgres」到「组织级超级智能」

Lightcone Podcast · Inside YC's AI Playbook · 时长约 46 分钟

嘉宾Pete Koomen(Optimizely 创始人、YC 合伙人),与 YC 总裁 Garry Tan、合伙人 Harj TaggarJared FriedmanDiana Hu 罕见公开 YC 内部 AI agent 基础设施的完整路线图。
原视频:Inside YC's AI Playbook · YouTube 约 32 分钟 ·

TL;DR:12 条可直接抄作业的经验

  1. 不要把 AI 当 co-pilot,把它当 building layer。Pete 全场最核心的一句话——「co-pilot 思维是 2023 年的玩法」。
  2. 把所有内部业务收敛到一个 Postgres。所有 founder、batch、investor、CRM 笔记都在同一个库、同一个 schema。
  3. 给 agent 一个能跑只读 SQL 的工具,魔法时刻就来了。Jared 半夜悄悄上线,让非技术的财务同事都能问业务问题。
  4. 构建一个 Tool Registry。YC 内部 350+ 个工具,同一个 registry 既服务内部 agent,也服务本地 Claude Code。
  5. Skill 化的三段进化:手写 system prompt → 写 skill → meta-prompting 自动改进 skill。
  6. 跑 Dream Loop:每晚让 agent 过一遍当天所有员工对话,自动改进 skill / CRM。
  7. 「两句话描述」是一个微缩样本。partners 集体打磨 → 会议 transcript 反喂 skill——「现在它比我写得更好」。
  8. 默认全员公开 agent 对话。高信任组织里,社会规范比 ACL 更高效。
  9. 高智能组织必须满足两点:trust by default、egalitarian by default。
  10. 每年烧 10 万到 100 万美元 token,提前住进 2028 年。Garry 把这个叫 time-warp。
  11. AI Horseless Carriages:AI 的潜力是把软件控制权从开发者转交给用户。
  12. 极简软件 + JIT 软件:50 万行 Rails → 2 万行 TypeScript + 2000 行 markdown。

一、起点:一个被「财务系统的低效循环」逼出来的项目

Pete 回忆 YC 内部 agent 项目的起点
Pete Koomen 回忆 YC agent 基础设施的起源——一切始于一年多前为 Finance 团队做的几个小工具。

Pete 把这条线追溯到大约一年前:他和几位工程师正在和 YC Finance 团队坐下来讨论一组工具——记日记账、记录 priced round、各种让 YC 这台机器持续运转的财务流水线。

当时他同时看到两件事:

「我看着同一个公司,一边在用老办法做事,一边在用 agent 给我开外挂——这个 gap 太大了。」

于是他给自己定了一个新方向:与其继续把工程师卡在「翻译需求 → 写 Ruby → 交付」这条流水线上,不如直接给财务团队一套 agent harness,让他们用自然语言(prompt)而不是代码(Ruby)来编码自己的工作流

Pete 的出发点不是「我要建一个内部 ChatGPT」,而是移除人和工程师之间的中间层。这后来贯穿了 YC 整套架构——agent registry、skill registry、Dream Loop,本质都是在把"中间环节"自动化掉。


二、第一个 magical moment:让 agent 直接读 Postgres

Pete 谈 SQL agent 工具
Pete 讲述真正解锁一切的那个工具——让 agent 直接对生产数据库执行只读 SQL。

YC 内部第一个 unlock 也是 SQL,但路径完全不同:他们不是把 LLM 当成 SQL 翻译器,而是把生产 Postgres 直接挂在 agent 的工具栏上

这件事是 Jared Friedman 干的:

「我有点感觉自己在违规——一开始我们都只给非常窄、权限受限的工具。我老是被这些工具的能力上限气到。后来我心想:要不就给它彻底访问生产数据库的能力,让它随便祸祸?我有点偷偷摸摸地,可能某个深夜就推到线上了——结果效果好得离谱。」

他实际上给 agent 配了两个工具:

  1. 对生产数据库执行只读 SQL 查询
  2. 读 dbt 模型文件(解释 schema 语义)

我们以前以为是 model 不够强,其实卡住世界的是对 safety、privacy 的过度担心。一旦你少担心一点,会发现这些东西强得离谱。

为什么这个工具如此关键?答案藏在 YC 的架构里

Pete 讲 YC 统一 Postgres 架构
Pete 强调 YC 之所以能让 agent 一上来就有效,是因为整个公司的业务都跑在一个统一的 Postgres 上。

「YC 有一个进入这场实验的巨大优势——我们所有软件都跑在自己写的代码上,而所有这些软件都连接到同一个 Postgres。每家 YC 投资的公司在 companies 表里、每个创始人在 founders 表里、每一笔财务交易、每一条我留在内部 CRM 里的备注——全在一个库里。」

绝大多数公司把这些功能交给了 SaaS(HRIS、CRM、ERP、BI、Workflow……),而 YC 选择了相反的路:自研、统一、集中。这条选择在 SaaS 红利期看起来很反潮流,但在 AI 时代变成了最高级的护城河。

Garry 把这个现象总结成 Jevons 悖论——一旦把跨团队的 RTT 抹掉,人们提问的频率和复杂度都会暴涨一个数量级

Bigtable 的故事正在重演

Garry 类比 Google Bigtable 与 agent 时代数据架构
Garry Tan 把当前 agent 时代的数据架构演进类比为 Google 当年从关系模型走向 Bigtable 的过程。

你要做的不是规范化(normalize),而是反规范化(denormalize),把数据装进一个对 agent 检索友好的 schema。可以用 MCP 包一层,但 agent 处理 CLI 比处理 MCP 还顺手——我直觉上更倾向于做一个 Bigtable 风格、但是为 agent 优化的视图。」

这正是他个人项目 G-Brain 在做的事——agent 同时挂载多个上游系统,全部归一化到一个对 G-Brain / OpenClaw 友好的私人 schema,再叠 RAG、graph RAG、混合检索、rerank。


三、Tool Registry:YC 的「内部 MCP」

Pete 介绍 YC 的 Tool Registry
Pete 谈 Tool Registry——YC 内部 agent 体系的真正"业务大脑"。一年里从 20 个工具长到 350+。

Pete 把 YC 的整套架构压缩到几个原语:一个 agent loop、一个 shared tool registry、一个底层的 model router,此外几乎没了。

Tool registry 是 YC-specific 的东西最后会落到的地方。是它把 agent 变成在工作中真正有用的东西。一开始我们就 20 个工具,现在已经 350+ 了。」

更妙的是——这套工具同时服务两条客户线

  1. YC 自家的内部 agent harness
  2. 每个员工本地跑的 Claude Code

Registry 是 agent 的能力中枢,也是开发者本地 IDE 的扩展层。Pete 称之为「我们这一代应用计算机科学家正在反复独立发明相同的 primitive」。

Skill 化的三段进化

Pete 讲 skill 演进路径
Pete 谈 skill 化进化路径:手写 prompt → 手写 skill → meta-prompt 自动改进 skill。
  1. 写自己的 system prompt——每个人都从这里开始
  2. 抽出来变成 skill——把好用的 prompt 沉淀下来给其他人复用
  3. Meta-prompting / Autoresearch——agent 自动改进 skill

YC 在自己的 skill registry 上还有两个工程化小工具:

坏的是 10 个干同一件事的 skill;好的是 1 个带参数的 skill。模型对 DRY 和 MECE 这两个词的语义意外地敏感。」


四、Dream Loop:让 agent 在夜里改进自己

Pete 讲 Dream Loop
Pete 介绍 Dream Loop——夜间 agent 自动 review 当天所有员工对话,自动改进 skill 和 context。

「我们有一个通用 agent,每晚会去读所有员工当天和 agent 的对话,挑出本来可以做得更好的地方、以及如果一开始就有哪些 context 它会更快收敛——然后写回到 skill 里、写回到内部 CRM 里关于 people 和 companies 的知识里。」

Dream Loop 有两个层次:

很多公司只有第一层。第二层才是真正让组织上下文不断生长的关键。

一个微缩样本:YC 的「Two-Sentence Description」

Pete 谈两句话描述 skill
Pete 谈 YC 经典的 Two-Sentence Description skill——"组织级超级智能"如何形成的微缩样本。

YC 这个机构本身就是一场 context engineering。我们反复在教 founder——你脑子里的 context 是完美的,但好的沟通是把同样的 context 复制到对方脑子里。两句话描述就是这件事的最小单位。」

两句话需要回答两个问题:

  1. 这到底是个什么?(如果对方都不知道是什么,他甚至没法问问题)
  2. 为什么这件事值得我花时间?(如果他听到还有五家做一样的,他会立刻走神)

这个 skill 的演进路径就是 YC 整套方法论的微缩版:Tom Blomfield 手写第一版 → partners 集体打磨 → 会议 transcript 反喂 agent → agent 自动改进 skill。改进后的 skill「比我自己写得还好」。

这就是组织内部 superintelligence 长出来的方式——你把任何一个 partner 头脑里关于一件具体小事的 know-how,通过对话沉淀进 skill,整个组织的能力就上一个台阶。不复杂,就是这么直接。」


五、共享组织大脑:高信任 + 扁平 + 默认公开

Garry 谈共享组织大脑
五位嘉宾讨论 YC 的"共享组织大脑"机制——agent 对话默认全员公开。

YC 在制度层做了一个其他公司很难复制的选择:默认所有 agent 对话对全员可见。每段对话都会自动广播到一个内部 Slack 频道。

这件事同时解决了多个看似矛盾的问题:

「真正的高智能 agentic 组织必须同时是 egalitarian by defaulttrust by default——而绝大多数公司既不平等也不信任。但你做了这个选择之后,它就成了一种竞争优势。」

Raise the floor,新员工融入提速

「最让我意外的不是这工具能让最厉害的人更厉害,而是它抬高了下限。新员工原本要 6 个月才能 ramp up,现在他自动继承了组织里最厉害的人怎么做事——相当于跟着 Pete、Garry 做了一段时间学徒。」

「我自己用 coding agent 最大的好处是:所有我尴尬到不敢问人的蠢问题,问 agent 都没压力。在组织里也是——新人不想烦 Harj,那现在他不用烦了。结果是问题被问出来了,答案也被沉淀了下来。」


六、Time-Warp:花 10 万到 100 万美元的 token,提前住进 2028

Garry 谈用 token 预算换时间跃迁
Garry 抛出"time-warp"概念——愿意为 token 多花一个数量级预算,就能跃迁式抢在所有竞争对手前面。

「你得愿意一年花 10 万到 100 万美元在 token 上。如果你愿意花、并且认真投资到 skill 上、把团队所有事情都开放协作做,你基本上是在提前活到 2028 年——你今天花 100 万的事,两年后就 1 万,再后年就两三百块。」

这是一次性的 time-warp 窗口期,让你能直接跨过所有 Fortune 500、所有现有创业公司。我在想 90 年代企业开始给员工买电脑的那段时间,是不是也是这种感觉——电脑又贵又不稳定,但当你的竞争对手还没电脑的时候,你已经飞起来了。」

这条说得有点过于乐观,但它指向一个真问题:在 token 价格曲线快速下行的窗口里,"过度消费" token 在经济上是合算的——因为你买的不是计算,而是「提前两到三年看清楚一个未来已经定型的工作流」。


七、Horseless Carriages:AI 软件控制权之争

Pete 谈他的 Horseless Carriages 文章
Pete 重新解读他那篇"AI Horseless Carriages"——AI 真正的潜力是把软件控制权从开发者交还给用户。

「Horseless Carriages 是我对当时一大批 AI 产品的批评——大家在把 AI 当成一个小功能塞进一堆现有软件里。但下面真正的想法是:AI 的潜力是把软件的控制权从开发者转移给用户。」

Pete 谈 AI 软件控制权从开发者转向用户
Pete 强调 AI 时代真正的范式转移:把 prompt、上下文、行为控制权交还给用户。

「这些 AI 功能里关于 agent 要怎么干活的 prompt context,是被开发者藏起来、用户看不到、改不了的——这是一种典型的家长式 safetyism。我讨厌这种想法。」

把这一条对照到 YC 自己的设计,逻辑就完整了——Tool Registry / Skill registry / Dream Loop 全部都是让 prompt 和工作流尽可能可见、可改、可复用的工程产物。同一个哲学的两个层面:


八、极简软件 + JIT 软件:50 万行 Rails → 2 万行 TypeScript

Garry 和 Jared 讨论极简 AI 软件设计
Garry 和 Jared 讨论"小而精"的 AI 软件设计哲学——OpenClaw、Pi、Claude Code 都遵循这个原则。

「我用过的、自己内部建的或别人建的、最好的 AI 软件,都是非常小的、只加'让模型发挥所需要的那一点点代码'。从一个简单到几乎不需要文档就能开始用的东西出发,你能 build 出非常多东西。」

他举的最爱例子是 Pi——OpenClaw 里默认的开源 coding agent:

「Pi 是一个特别漂亮的东西,能用 Pi 自己来改 Pi、扩展 Pi。这种 self-extending、self-referential 的软件形态我觉得会越来越多。」

Garry 的亲身案例:Gary's List → G-Brain

「v1 我是按 2013 年的方式写代码的——这是最后一次我手写代码。v2 用 OpenClaw + Telegram 接管了 retrieval、对话界面、记忆,所有这些我都不用自己再实现一遍了。剩下的 2000 行 markdown 是真正的逻辑——'第二段我希望它多写一段政治人物的简短传记'这种调整,editor in chief 自己改 markdown 就行,我根本不需要碰代码。」

「这才是 just-in-time software 的开端,而且我已经能看见它就在眼前。」

这条对开发者最重要的启示是:「软件 = 代码」的等式在 agent 时代正在被改写。代码变成了围绕模型搭的最小骨架,真正的"业务逻辑"以 skill / prompt / markdown 的形式存在,因此所有"业务逻辑"都成了运行时可热改的资产。


九、Apple I 时刻:1984 还是 Homebrew Computer Club?

Garry 提出当前正处于 AI 领域的 Apple I 时刻
Garry 把当前 AI 时代类比为 1976 年的 Apple I 时刻——五大厂的"1984"未来 vs. 个人 AI 的 Homebrew 未来。

「我脑子里出现的画面是 1984 年那支 Apple 的麦金塔广告。2034 会不会就是另一个 1984?一种未来是——五位 AI 之王,可能最后只剩一个。他们有最先进的模型、有所有终端用户、有所有数据中心——他们就是把 Gmail 那套搬到你整个数字生活里。」

「这就像个人电脑从未出现过、世界只有大型机的另一种历史——你买不到 PC,你得去某个机构申请几百万美元的机时。」

另一种未来则是「Homebrew Computer Club 那条线」——Steve Jobs 和 Steve Wozniak 在 Mountain View 的车库里焊电路板、卖出 500 台 Apple I 的那段历史。

真正的 personal AI 革命」长什么样?Garry 给的清单是:

AI 不是人类的替代品,是放大器。如果你看 mainframe → PC → 互联网这条线,整体故事都是 individual empowerment。AI 应该走的也是这条路。」

「但这些都是选择。默认情况下公司不开放,默认是命令与控制。我们需要一种非常不一样的组织形态,也需要一种非常不一样的算力供给方式。这些都是选择题,而且做选择的人,就是今天在 build 这些东西的人——所以我们最好选好。」


十、一份可执行的「Inside YC Playbook」精简版

层级YC 的做法你可以怎么做
数据一个 Postgres、一个 schema、统一 CRM/财务/项目至少把高频内部决策依赖的数据,归一化到一个 agent 友好的 schema
工具Tool Registry,350+,跨内部 agent 和 Claude Code 共享给团队一个共享 registry(MCP 也行),允许任何人加工具
SkillDRY + MECE 的 skill 表 + skillifycheck resolvable任何重复 prompt 都 skillify,定期跑一次去重
改进Dream Loop 夜间读所有对话,更新 skill 和 CRM至少每周跑一次"复盘 agent",把好的对话回灌
可见性Agent 对话默认全员可见 → Slack至少团队内默认公开,社会规范 + 公开通道
预算每年 10 万–100 万美元 token,提前住进 2028把 AI 预算独立列一项,按 time-warp 思路投资
审美Pete: 写尽可能少的代码、让模型发挥用 skill / markdown / prompt 表达业务逻辑,代码只做骨架
Lightcone 片尾
Lightcone Podcast 片尾——主持人 Diana Hu / Harj Taggar / Jared Friedman / Garry Tan,本期嘉宾 Pete Koomen,制作 / 摄像 Ryan Loughlin、Matt Kang、Chris Hall,剪辑 Amanda Deisler。

附录:本文的"图文并茂"是怎么自动做出来的?

本文 17 张配图是用 豆包 Doubao-Seed 多模态模型 的 video 关键帧理解能力自动选出来的——具体路径:

  1. yt-dlp 下载 YouTube 视频
  2. bun run scripts/main.ts --task asr 用 Doubao-Seed 做 ASR,得到完整英文转录
  3. bun run scripts/main.ts --task keyframe-extract --transcript-file ... 让 Doubao-Seed 结合 transcript,输出技术博客配图候选关键帧 JSON
  4. 手工挑选有信息密度的帧 + 用 ffmpeg -ss <t> -i video.mp4 -frames:v 1 截图
  5. 写正文,把截图嵌入论点旁边

整集视频的 ASR + 关键帧分析合计消耗约 43 万 token、4 段并发约 5 分钟跑完——成本基本可以忽略。豆包多模态在这种「真正读懂视频、为博客配图选帧」的场景里效果意外地好——它会主动避开重复的全景镜头,挑出有手势、表情、信息变化的关键瞬间。


本文基于 Inside YC's AI Playbook (Lightcone Podcast) 视频整理。英文原话尽量贴近转录,意译和延伸部分由作者承担。
原视频:Inside YC's AI Playbook · YouTube

链接已复制