🎯 核心悖论
1
悖论
"Automation is a lie. 每当你自动化一件事,为了确保它运转良好,你就需要一个人骑在它上面盯着。"
这是全片的题眼。一个"最 AI-forward"的公司,一年内人数从 15 涨到 30——翻了一倍。自动化没有消灭岗位,反而催生了新岗位。
2
悖论
"一年后回头看,我们会发现人要做的活其实更多了,而不是更少。"
benchmark 让结论看起来注定:AI 要把活全干完。但 Dan 的体感相反——越自动化,越需要有人盯着、校正、把关,于是活反而更多。Dan 和 Lenny 约定 2027 年 5 月回来逐条复盘。
3
悖论
"模型能力在指数级上升,而且它是真的——已经能在 50% 准确率下完成 17 小时的任务。"
METR 的著名评测衡量"模型能自主完成多长时间的任务"。Dan 并不否认模型进步是真的——他要纠正的是从"模型变强"到"人会失业"之间那个错误的推论。
🔀 工作方式一分为二
4
模式一
"一个 AI Agent 想真正有用,它需要一个在乎它的人。"
Dan 放弃了"人手一个个人 Agent"的设想(太难伺候、老是坏、要会 SSH)。趋势是"一个公司一个超级 Agent"(Shopify、Ramp 已有),配一位"前向部署工程师"像园丁一样浇灌它。
5
模式二
"Codex / Claude Co-work 成为工作的操作系统——I think it's the coolest thing。"
一旦有了能在你电脑上"造任何东西"的编码 Agent,它对任何工作都好用。Dan 现在的 daily driver 是 Codex,靠这套连续 10 天保持收件箱清零。
6
反转
"别再'把 AI 装进浏览器'——反过来,把浏览器装进 AI Agent,让它看见你在做的一切。"
Dan 写文档用开源编辑器 Proof,让 Codex 在一旁"看着"他写:它看得见他在干嘛,他也看得见它在干嘛,像并肩工作的搭档。这是最值得产品人记住的范式反转。
7
判断
"CLIs are over. 当年以为 Claude Code 好用是因为它是 CLI——这个判断错了。"
命令行不会消失,但工作界面正回到 GUI。"我们当初造图形界面是有原因的。"Every 内部绝大多数技术同事,已经不再把 CLI 当主力工作界面。
💰 反共识:SaaS 与 harness
8
反共识
"SaaS 末日论很蠢。我现在就会买 SaaS 股票。Agent 增加 SaaS 用户数,而不是消灭它。"
成本结构变了:用户在你网站上跑的是他自己的 Agent、烧的是他自己的 token,厂商不必为"内置 AI"疯狂烧钱,利润率反而回血。Every 全员用 Agent,SaaS 支出却同比上涨。(不构成投资建议。)
9
趋势
"每家模型公司都意识到,要榨出模型的最大价值,必须有一层 harness(驾驭层)。"
不再是简单的 prompt-response,而是它们直接在云端电脑上替你"运行"模型、交付结果。Cursor 云端做得更超前,但它明确选了"为程序员服务",可能限制天花板。harness 的终极形态是"我能干任何知识工作"。
🛠️ 工作的"形状"在变
10
PR 暴增
"Open Claw 作者 Pete 一天收上千个 PR——spin up 五万个 Codex 实例去筛,合并大约一千个。"
非技术岗(咨询、运营、编辑)都在提 PR。难点从"能不能造"变成"它和已有的东西搭不搭、怎么保持连贯、该删什么"。分工重洗:非技术的人做技术活,技术的人把产出连贯地并进产品。
11
审稿成主业
"AI slop 的定义:做它花的时间,比我读它花的时间还短,而且作者并不为每一行负责。"
人人都在做分析、到处分享,于是大量时间花在"审核做错的数据科学"。解法不是抱怨而是搭系统(接数据仓库、懂权限的数据科学 Bot)。AI 写作没问题——但你得知道里面写了啥。
12
benchmark
"Benchmark 只在我们已经框定好、能表达、能打分的问题上上涨。"
Dan 的"资深工程师 benchmark":老模型 30 分、人类资深 80-90 分、GPT-5.5 拿 62(用 Opus 4.7 的 plan,且是唯一敢整个重写的模型)。但等模型刷爆它,他能轻松改造 benchmark 把模型重新打回 0——大量人类工作在写下来之前根本无法被打分。
🏆 谁会赢 + 生存法则
13
赢家
"I am super super bullish on PMs. 另一类是全栈设计师——品味 + 能自己交付。"
"建造"被 AI 接管后,PM 的价值回到"判断该造什么、好不好、该解决什么问题"。设计师被解放,能自己造、直接提 PR;当一切都长得一样(slop),创造力恰恰最值钱。
14
机制
"模型把昨天的人类能力变廉价、商品化;而人类拿这些'冻结的能力'去创造新东西。"
人人能做落地页 → 落地页满天飞;人人能写作 → slop 推文满天飞。因为大家用同一批模型、最默认的用法,长得都一样。人类则在前沿创造没被做过的东西——新专长又被下一代模型吸收,前沿再上移。人结构性地永远领先一步。
15
法则
"普通人怎么不被甩下?答案只有一句:Ride the models(骑在模型上)。"
每出新模型就去"翻石头"看看"现在行不行了"。"AI 的前沿,在任何 AI 遇见'一个真实的人在做真实的事'的地方。"造模型的人并不真正知道怎么用它——每出新模型,你都有机会成为最早发现"它能拿来干嘛"的人之一。