TL;DR:12 条可直接抄作业的经验
- 不要把 AI 当 co-pilot,把它当 building layer。Pete 全场最核心的一句话——「co-pilot 思维是 2023 年的玩法」。
- 把所有内部业务收敛到一个 Postgres。所有 founder、batch、investor、CRM 笔记都在同一个库、同一个 schema。
- 给 agent 一个能跑只读 SQL 的工具,魔法时刻就来了。Jared 半夜悄悄上线,让非技术的财务同事都能问业务问题。
- 构建一个 Tool Registry。YC 内部 350+ 个工具,同一个 registry 既服务内部 agent,也服务本地 Claude Code。
- Skill 化的三段进化:手写 system prompt → 写 skill → meta-prompting 自动改进 skill。
- 跑 Dream Loop:每晚让 agent 过一遍当天所有员工对话,自动改进 skill / CRM。
- 「两句话描述」是一个微缩样本。partners 集体打磨 → 会议 transcript 反喂 skill——「现在它比我写得更好」。
- 默认全员公开 agent 对话。高信任组织里,社会规范比 ACL 更高效。
- 高智能组织必须满足两点:trust by default、egalitarian by default。
- 每年烧 10 万到 100 万美元 token,提前住进 2028 年。Garry 把这个叫 time-warp。
- AI Horseless Carriages:AI 的潜力是把软件控制权从开发者转交给用户。
- 极简软件 + JIT 软件:50 万行 Rails → 2 万行 TypeScript + 2000 行 markdown。
一、起点:一个被「财务系统的低效循环」逼出来的项目
Pete 把这条线追溯到大约一年前:他和几位工程师正在和 YC Finance 团队坐下来讨论一组工具——记日记账、记录 priced round、各种让 YC 这台机器持续运转的财务流水线。
当时他同时看到两件事:
- 一边是 YC 内部"古典"的开发模式——财务团队描述一个复杂工作流,工程师把它"翻译"成一段确定性的 Ruby 代码,再交回给财务。这是一个反复横跳、效率低下的循环。
- 另一边是 Claude Code、Cursor、Windsurf 刚开始走红,Pete 在自己电脑上用 agentic coding 工具感觉「像是有了超能力」。
「我看着同一个公司,一边在用老办法做事,一边在用 agent 给我开外挂——这个 gap 太大了。」
于是他给自己定了一个新方向:与其继续把工程师卡在「翻译需求 → 写 Ruby → 交付」这条流水线上,不如直接给财务团队一套 agent harness,让他们用自然语言(prompt)而不是代码(Ruby)来编码自己的工作流。
Pete 的出发点不是「我要建一个内部 ChatGPT」,而是移除人和工程师之间的中间层。这后来贯穿了 YC 整套架构——agent registry、skill registry、Dream Loop,本质都是在把"中间环节"自动化掉。
二、第一个 magical moment:让 agent 直接读 Postgres
YC 内部第一个 unlock 也是 SQL,但路径完全不同:他们不是把 LLM 当成 SQL 翻译器,而是把生产 Postgres 直接挂在 agent 的工具栏上。
这件事是 Jared Friedman 干的:
「我有点感觉自己在违规——一开始我们都只给非常窄、权限受限的工具。我老是被这些工具的能力上限气到。后来我心想:要不就给它彻底访问生产数据库的能力,让它随便祸祸?我有点偷偷摸摸地,可能某个深夜就推到线上了——结果效果好得离谱。」
他实际上给 agent 配了两个工具:
- 对生产数据库执行只读 SQL 查询
- 读 dbt 模型文件(解释 schema 语义)
「我们以前以为是 model 不够强,其实卡住世界的是对 safety、privacy 的过度担心。一旦你少担心一点,会发现这些东西强得离谱。」
为什么这个工具如此关键?答案藏在 YC 的架构里
「YC 有一个进入这场实验的巨大优势——我们所有软件都跑在自己写的代码上,而所有这些软件都连接到同一个 Postgres。每家 YC 投资的公司在
companies表里、每个创始人在founders表里、每一笔财务交易、每一条我留在内部 CRM 里的备注——全在一个库里。」
绝大多数公司把这些功能交给了 SaaS(HRIS、CRM、ERP、BI、Workflow……),而 YC 选择了相反的路:自研、统一、集中。这条选择在 SaaS 红利期看起来很反潮流,但在 AI 时代变成了最高级的护城河。
Garry 把这个现象总结成 Jevons 悖论——一旦把跨团队的 RTT 抹掉,人们提问的频率和复杂度都会暴涨一个数量级。
Bigtable 的故事正在重演
「你要做的不是规范化(normalize),而是反规范化(denormalize),把数据装进一个对 agent 检索友好的 schema。可以用 MCP 包一层,但 agent 处理 CLI 比处理 MCP 还顺手——我直觉上更倾向于做一个 Bigtable 风格、但是为 agent 优化的视图。」
这正是他个人项目 G-Brain 在做的事——agent 同时挂载多个上游系统,全部归一化到一个对 G-Brain / OpenClaw 友好的私人 schema,再叠 RAG、graph RAG、混合检索、rerank。
三、Tool Registry:YC 的「内部 MCP」
Pete 把 YC 的整套架构压缩到几个原语:一个 agent loop、一个 shared tool registry、一个底层的 model router,此外几乎没了。
「Tool registry 是 YC-specific 的东西最后会落到的地方。是它把 agent 变成在工作中真正有用的东西。一开始我们就 20 个工具,现在已经 350+ 了。」
更妙的是——这套工具同时服务两条客户线:
- YC 自家的内部 agent harness
- 每个员工本地跑的 Claude Code
Registry 是 agent 的能力中枢,也是开发者本地 IDE 的扩展层。Pete 称之为「我们这一代应用计算机科学家正在反复独立发明相同的 primitive」。
Skill 化的三段进化
- 写自己的 system prompt——每个人都从这里开始
- 抽出来变成 skill——把好用的 prompt 沉淀下来给其他人复用
- Meta-prompting / Autoresearch——agent 自动改进 skill
YC 在自己的 skill registry 上还有两个工程化小工具:
skillify:做完一件新事,告诉它 skillify it,自动沉淀成一个 skillcheck resolvable:扫一遍 registry 里现有 skills 和 tools,让它们满足 DRY(不重复)+ MECE(互斥穷尽)
「坏的是 10 个干同一件事的 skill;好的是 1 个带参数的 skill。模型对 DRY 和 MECE 这两个词的语义意外地敏感。」
四、Dream Loop:让 agent 在夜里改进自己
「我们有一个通用 agent,每晚会去读所有员工当天和 agent 的对话,挑出本来可以做得更好的地方、以及如果一开始就有哪些 context 它会更快收敛——然后写回到 skill 里、写回到内部 CRM 里关于 people 和 companies 的知识里。」
Dream Loop 有两个层次:
- Skill 层:自动改进 prompt、补充少见 case
- 知识层:从员工对话里挖出新事实,回灌内部 CRM,让"组织对世界的认知"以天为单位更新
很多公司只有第一层。第二层才是真正让组织上下文不断生长的关键。
一个微缩样本:YC 的「Two-Sentence Description」
「YC 这个机构本身就是一场 context engineering。我们反复在教 founder——你脑子里的 context 是完美的,但好的沟通是把同样的 context 复制到对方脑子里。两句话描述就是这件事的最小单位。」
两句话需要回答两个问题:
- 这到底是个什么?(如果对方都不知道是什么,他甚至没法问问题)
- 为什么这件事值得我花时间?(如果他听到还有五家做一样的,他会立刻走神)
这个 skill 的演进路径就是 YC 整套方法论的微缩版:Tom Blomfield 手写第一版 → partners 集体打磨 → 会议 transcript 反喂 agent → agent 自动改进 skill。改进后的 skill「比我自己写得还好」。
「这就是组织内部 superintelligence 长出来的方式——你把任何一个 partner 头脑里关于一件具体小事的 know-how,通过对话沉淀进 skill,整个组织的能力就上一个台阶。不复杂,就是这么直接。」
五、共享组织大脑:高信任 + 扁平 + 默认公开
YC 在制度层做了一个其他公司很难复制的选择:默认所有 agent 对话对全员可见。每段对话都会自动广播到一个内部 Slack 频道。
这件事同时解决了多个看似矛盾的问题:
- 教学:员工通过看别人怎么用 agent 学到怎么用
- 隐性安全控制:因为知道是公开的,没人会拿 agent 干坏事。在高信任组织里,社会规范是比 ACL 更高效的访问控制
- 数据回灌:所有对话本身就是 Dream Loop 的训练语料
「真正的高智能 agentic 组织必须同时是 egalitarian by default 和 trust by default——而绝大多数公司既不平等也不信任。但你做了这个选择之后,它就成了一种竞争优势。」
Raise the floor,新员工融入提速
「最让我意外的不是这工具能让最厉害的人更厉害,而是它抬高了下限。新员工原本要 6 个月才能 ramp up,现在他自动继承了组织里最厉害的人怎么做事——相当于跟着 Pete、Garry 做了一段时间学徒。」
「我自己用 coding agent 最大的好处是:所有我尴尬到不敢问人的蠢问题,问 agent 都没压力。在组织里也是——新人不想烦 Harj,那现在他不用烦了。结果是问题被问出来了,答案也被沉淀了下来。」
六、Time-Warp:花 10 万到 100 万美元的 token,提前住进 2028
「你得愿意一年花 10 万到 100 万美元在 token 上。如果你愿意花、并且认真投资到 skill 上、把团队所有事情都开放协作做,你基本上是在提前活到 2028 年——你今天花 100 万的事,两年后就 1 万,再后年就两三百块。」
「这是一次性的 time-warp 窗口期,让你能直接跨过所有 Fortune 500、所有现有创业公司。我在想 90 年代企业开始给员工买电脑的那段时间,是不是也是这种感觉——电脑又贵又不稳定,但当你的竞争对手还没电脑的时候,你已经飞起来了。」
这条说得有点过于乐观,但它指向一个真问题:在 token 价格曲线快速下行的窗口里,"过度消费" token 在经济上是合算的——因为你买的不是计算,而是「提前两到三年看清楚一个未来已经定型的工作流」。
七、Horseless Carriages:AI 软件控制权之争
「Horseless Carriages 是我对当时一大批 AI 产品的批评——大家在把 AI 当成一个小功能塞进一堆现有软件里。但下面真正的想法是:AI 的潜力是把软件的控制权从开发者转移给用户。」
「这些 AI 功能里关于 agent 要怎么干活的 prompt context,是被开发者藏起来、用户看不到、改不了的——这是一种典型的家长式 safetyism。我讨厌这种想法。」
把这一条对照到 YC 自己的设计,逻辑就完整了——Tool Registry / Skill registry / Dream Loop 全部都是让 prompt 和工作流尽可能可见、可改、可复用的工程产物。同一个哲学的两个层面:
- 对组织内部:让每个员工都能看、改、加 skill
- 对终端用户:让 prompt 不再是黑盒
八、极简软件 + JIT 软件:50 万行 Rails → 2 万行 TypeScript
「我用过的、自己内部建的或别人建的、最好的 AI 软件,都是非常小的、只加'让模型发挥所需要的那一点点代码'。从一个简单到几乎不需要文档就能开始用的东西出发,你能 build 出非常多东西。」
他举的最爱例子是 Pi——OpenClaw 里默认的开源 coding agent:
「Pi 是一个特别漂亮的东西,能用 Pi 自己来改 Pi、扩展 Pi。这种 self-extending、self-referential 的软件形态我觉得会越来越多。」
Garry 的亲身案例:Gary's List → G-Brain
- Gary's List v1:花一个半月用 Rails 写的全栈 agentic 应用——约 50 万行 Rails 代码
- G-Brain(v2):完全开源的重写——约 2 万行 TypeScript + 2000 行 markdown
「v1 我是按 2013 年的方式写代码的——这是最后一次我手写代码。v2 用 OpenClaw + Telegram 接管了 retrieval、对话界面、记忆,所有这些我都不用自己再实现一遍了。剩下的 2000 行 markdown 是真正的逻辑——'第二段我希望它多写一段政治人物的简短传记'这种调整,editor in chief 自己改 markdown 就行,我根本不需要碰代码。」
「这才是 just-in-time software 的开端,而且我已经能看见它就在眼前。」
这条对开发者最重要的启示是:「软件 = 代码」的等式在 agent 时代正在被改写。代码变成了围绕模型搭的最小骨架,真正的"业务逻辑"以 skill / prompt / markdown 的形式存在,因此所有"业务逻辑"都成了运行时可热改的资产。
九、Apple I 时刻:1984 还是 Homebrew Computer Club?
「我脑子里出现的画面是 1984 年那支 Apple 的麦金塔广告。2034 会不会就是另一个 1984?一种未来是——五位 AI 之王,可能最后只剩一个。他们有最先进的模型、有所有终端用户、有所有数据中心——他们就是把 Gmail 那套搬到你整个数字生活里。」
「这就像个人电脑从未出现过、世界只有大型机的另一种历史——你买不到 PC,你得去某个机构申请几百万美元的机时。」
另一种未来则是「Homebrew Computer Club 那条线」——Steve Jobs 和 Steve Wozniak 在 Mountain View 的车库里焊电路板、卖出 500 台 Apple I 的那段历史。
「真正的 personal AI 革命」长什么样?Garry 给的清单是:
- 跑你自己的软件
- 改你自己的 prompt
- 测试一切
- 有一个只属于你自己的私人 repo
- 自己选模型,包括 open-weight 模型
- AI 是你自己的延伸,而不是大厂想让你成为的样子
「AI 不是人类的替代品,是放大器。如果你看 mainframe → PC → 互联网这条线,整体故事都是 individual empowerment。AI 应该走的也是这条路。」
「但这些都是选择。默认情况下公司不开放,默认是命令与控制。我们需要一种非常不一样的组织形态,也需要一种非常不一样的算力供给方式。这些都是选择题,而且做选择的人,就是今天在 build 这些东西的人——所以我们最好选好。」
十、一份可执行的「Inside YC Playbook」精简版
| 层级 | YC 的做法 | 你可以怎么做 |
|---|---|---|
| 数据 | 一个 Postgres、一个 schema、统一 CRM/财务/项目 | 至少把高频内部决策依赖的数据,归一化到一个 agent 友好的 schema |
| 工具 | Tool Registry,350+,跨内部 agent 和 Claude Code 共享 | 给团队一个共享 registry(MCP 也行),允许任何人加工具 |
| Skill | DRY + MECE 的 skill 表 + skillify、check resolvable | 任何重复 prompt 都 skillify,定期跑一次去重 |
| 改进 | Dream Loop 夜间读所有对话,更新 skill 和 CRM | 至少每周跑一次"复盘 agent",把好的对话回灌 |
| 可见性 | Agent 对话默认全员可见 → Slack | 至少团队内默认公开,社会规范 + 公开通道 |
| 预算 | 每年 10 万–100 万美元 token,提前住进 2028 | 把 AI 预算独立列一项,按 time-warp 思路投资 |
| 审美 | Pete: 写尽可能少的代码、让模型发挥 | 用 skill / markdown / prompt 表达业务逻辑,代码只做骨架 |
附录:本文的"图文并茂"是怎么自动做出来的?
本文 17 张配图是用 豆包 Doubao-Seed 多模态模型 的 video 关键帧理解能力自动选出来的——具体路径:
yt-dlp下载 YouTube 视频bun run scripts/main.ts --task asr用 Doubao-Seed 做 ASR,得到完整英文转录bun run scripts/main.ts --task keyframe-extract --transcript-file ...让 Doubao-Seed 结合 transcript,输出技术博客配图候选关键帧 JSON- 手工挑选有信息密度的帧 + 用
ffmpeg -ss <t> -i video.mp4 -frames:v 1截图 - 写正文,把截图嵌入论点旁边
整集视频的 ASR + 关键帧分析合计消耗约 43 万 token、4 段并发约 5 分钟跑完——成本基本可以忽略。豆包多模态在这种「真正读懂视频、为博客配图选帧」的场景里效果意外地好——它会主动避开重复的全景镜头,挑出有手势、表情、信息变化的关键瞬间。
本文基于 Inside YC's AI Playbook (Lightcone Podcast) 视频整理。英文原话尽量贴近转录,意译和延伸部分由作者承担。
原视频:Inside YC's AI Playbook · YouTube