AI 悖论速读：Dan Shipper 对未来一年的 15 个核心判断

🎯 核心悖论

悖论

"Automation is a lie. 每当你自动化一件事，为了确保它运转良好，你就需要一个人骑在它上面盯着。"

这是全片的题眼。一个"最 AI-forward"的公司，一年内人数从 15 涨到 30——翻了一倍。自动化没有消灭岗位，反而催生了新岗位。

悖论

"一年后回头看，我们会发现人要做的活其实更多了，而不是更少。"

benchmark 让结论看起来注定：AI 要把活全干完。但 Dan 的体感相反——越自动化，越需要有人盯着、校正、把关，于是活反而更多。Dan 和 Lenny 约定 2027 年 5 月回来逐条复盘。

悖论

"模型能力在指数级上升，而且它是真的——已经能在 50% 准确率下完成 17 小时的任务。"

METR 的著名评测衡量"模型能自主完成多长时间的任务"。Dan 并不否认模型进步是真的——他要纠正的是从"模型变强"到"人会失业"之间那个错误的推论。

🔀 工作方式一分为二

模式一

"一个 AI Agent 想真正有用，它需要一个在乎它的人。"

Dan 放弃了"人手一个个人 Agent"的设想（太难伺候、老是坏、要会 SSH）。趋势是"一个公司一个超级 Agent"（Shopify、Ramp 已有），配一位"前向部署工程师"像园丁一样浇灌它。

模式二

"Codex / Claude Co-work 成为工作的操作系统——I think it's the coolest thing。"

一旦有了能在你电脑上"造任何东西"的编码 Agent，它对任何工作都好用。Dan 现在的 daily driver 是 Codex，靠这套连续 10 天保持收件箱清零。

反转

"别再'把 AI 装进浏览器'——反过来，把浏览器装进 AI Agent，让它看见你在做的一切。"

Dan 写文档用开源编辑器 Proof，让 Codex 在一旁"看着"他写：它看得见他在干嘛，他也看得见它在干嘛，像并肩工作的搭档。这是最值得产品人记住的范式反转。

判断

"CLIs are over. 当年以为 Claude Code 好用是因为它是 CLI——这个判断错了。"

命令行不会消失，但工作界面正回到 GUI。"我们当初造图形界面是有原因的。"Every 内部绝大多数技术同事，已经不再把 CLI 当主力工作界面。

💰 反共识：SaaS 与 harness

反共识

"SaaS 末日论很蠢。我现在就会买 SaaS 股票。Agent 增加 SaaS 用户数，而不是消灭它。"

成本结构变了：用户在你网站上跑的是他自己的 Agent、烧的是他自己的 token，厂商不必为"内置 AI"疯狂烧钱，利润率反而回血。Every 全员用 Agent，SaaS 支出却同比上涨。（不构成投资建议。）

趋势

"每家模型公司都意识到，要榨出模型的最大价值，必须有一层 harness（驾驭层）。"

不再是简单的 prompt-response，而是它们直接在云端电脑上替你"运行"模型、交付结果。Cursor 云端做得更超前，但它明确选了"为程序员服务"，可能限制天花板。harness 的终极形态是"我能干任何知识工作"。

🛠️ 工作的"形状"在变

PR 暴增

"Open Claw 作者 Pete 一天收上千个 PR——spin up 五万个 Codex 实例去筛，合并大约一千个。"

非技术岗（咨询、运营、编辑）都在提 PR。难点从"能不能造"变成"它和已有的东西搭不搭、怎么保持连贯、该删什么"。分工重洗：非技术的人做技术活，技术的人把产出连贯地并进产品。

审稿成主业

"AI slop 的定义：做它花的时间，比我读它花的时间还短，而且作者并不为每一行负责。"

人人都在做分析、到处分享，于是大量时间花在"审核做错的数据科学"。解法不是抱怨而是搭系统（接数据仓库、懂权限的数据科学 Bot）。AI 写作没问题——但你得知道里面写了啥。

benchmark

"Benchmark 只在我们已经框定好、能表达、能打分的问题上上涨。"

Dan 的"资深工程师 benchmark"：老模型 30 分、人类资深 80-90 分、GPT-5.5 拿 62（用 Opus 4.7 的 plan，且是唯一敢整个重写的模型）。但等模型刷爆它，他能轻松改造 benchmark 把模型重新打回 0——大量人类工作在写下来之前根本无法被打分。

🏆 谁会赢 + 生存法则

赢家

"I am super super bullish on PMs. 另一类是全栈设计师——品味 + 能自己交付。"

"建造"被 AI 接管后，PM 的价值回到"判断该造什么、好不好、该解决什么问题"。设计师被解放，能自己造、直接提 PR；当一切都长得一样（slop），创造力恰恰最值钱。

机制

"模型把昨天的人类能力变廉价、商品化；而人类拿这些'冻结的能力'去创造新东西。"

人人能做落地页 → 落地页满天飞；人人能写作 → slop 推文满天飞。因为大家用同一批模型、最默认的用法，长得都一样。人类则在前沿创造没被做过的东西——新专长又被下一代模型吸收，前沿再上移。人结构性地永远领先一步。

法则

"普通人怎么不被甩下？答案只有一句：Ride the models（骑在模型上）。"

每出新模型就去"翻石头"看看"现在行不行了"。"AI 的前沿，在任何 AI 遇见'一个真实的人在做真实的事'的地方。"造模型的人并不真正知道怎么用它——每出新模型，你都有机会成为最早发现"它能拿来干嘛"的人之一。

AI 悖论速读：自动化越多，人手越多

AI 悖论速读：
自动化越多，人手越多