速读：从扩张时代到研究时代 — Ilya Sutskever × Dwarkesh

🧩 模型为什么这么"参差"

01

💡 洞察

真正在 reward hacking 的，是人类研究员

"The model says, 'Oh my God, you're so right. I have a bug.' And it introduces a second bug. Then you tell it, and it brings back the first bug — and you can alternate between those."

模型在 evals 上分数漂亮，真实世界却在 vibe coding 里反复横跳——修好一个 bug 引入第二个，再修又把第一个带回来。Ilya 的解释：各家都照着评测集设计 RL 环境，等于让模型"应试"。Dwarkesh 一句点破——真正在 reward hacking 的，是盯着榜单的人类研究员。

02

💡 洞察

两个学生：死练一万小时 vs 天赋型选手

"The models are much more like the first student, but even more."

第一名学生 ≈ 今天的模型

死练 10,000 小时
刷遍所有竞赛题
背下全部证明技巧
拿了名次，却难迁移

第二名学生 · 有"it"

只练了 100 小时
一样打得很好
靠的是天赋直觉
后来走得更远

为什么在竞赛编程上超神，不会自动变成有品味的程序员？Ilya 用两个学生作比：死练一万小时的人拿了名次，却未必走得远；花 100 小时也很强的人，靠的是那种说不清的"it"。今天的模型，就是被灌了所有竞赛题、还做了数据增强的第一名学生——练得越狠，越难迁移。

03

🔥 反直觉

失去情绪的病人，连穿哪双袜子都定不了

"He stopped feeling any emotion… He became somehow extremely bad at making any decisions at all. It would take him hours to decide on which socks to wear."

一位中风病人情绪中枢受损后，智力测验正常、却做不了任何决定，连穿哪双袜子都要纠结几小时，还常做糟糕的财务判断。Ilya 借此追问：人类的 value function 也许被情绪深度调制，而这正是"成为一个有效的 agent"的关键——纯靠 pre-training 未必学得到。

🔬 扩张时代终结，研究时代回归

04

💡 洞察

扩张时代结束，回到"带着大电脑做研究"

"It's back to the age of research again, just with big computers."

扩张时代 2020–2025

一个词：Scaling
低风险砸资源
所有人做同一件事
"再大 100 倍就会不同"

研究时代 · 现在

回到"试试这个试试那个"
算力已经足够大
瓶颈变回想法本身
只是手里握着大电脑

一个词能改变一个领域。"Scaling"太好用，于是所有人只做一件事。但当算力已经足够大，"再大 100 倍就会天翻地覆"并不成立。Ilya 的判断：我们正从扩张时代回到研究时代，只是这次不再是空手，而是带着大电脑。

05

🔥 犀利

公司比想法还多

"Scaling sucked out all the air in the room… we are in a world where there are more companies than ideas by quite a bit."

硅谷常说"点子很廉价，执行才是一切"。可有人反问：既然点子这么便宜，怎么没人有点子？Ilya 说扩张吸干了房间里所有的空气，逼得所有人做同一件事。研究的瓶颈，就这样从算力换回了想法本身。

06

⚙️ 技术

AlexNet 当年只用了 2 块 GPU

"AlexNet was built on two GPUs. No single transformer paper experiment used more than 64 GPUs of 2017 — which would be like two GPUs of today."

研究不需要"史上最大算力"。AlexNet 全靠 2 块 GPU，Transformer 论文没有一个实验用超过 2017 年的 64 块 GPU——换算到今天也就 2 块。想造最强系统当然要更多算力；但想验证一个想法是否成立，够用就行。这也是 SSI 敢做的底气。

07

🏢 组织

SSI 只有 30 亿，研究算力差距却没那么大

"When you look at what's actually left for research, the difference becomes a lot smaller."

账面数字

SSI 融资 30 亿美元
别家融资多好几倍
看着望尘莫及

真正用于研究

大厂算力大头押 inference
还要养工程 / 销售 / 产品
做不同的东西无需最大规模
差距其实小得多

别家融资是 SSI 的好几倍，看着遥不可及。但 Ilya 算了一笔账：那些大数字大多押给推理（inference），还要养工程、销售、产品团队；真正剩给研究的部分，差距小得多。何况做不一样的东西，本就不需要最大规模去证明。

🎯 SSI、Meta 与重新定义超级智能

08

🔥 内幕

Meta 想收购 SSI，我说不

"Meta came in and offered to acquire us, and I said no. But my former cofounder in some sense said yes… he was the only person from SSI to join Meta."

有人问：既然 SSI 在不断突破，联合创始人为什么走了？Ilya 只补了几个"被遗忘的事实"：当时 SSI 以 320 亿美元估值融资，Meta 来提收购，他说不；前联合创始人某种意义上说了"yes"——拿了近期流动性，也是唯一一个从 SSI 去 Meta 的人。

09

💡 洞察

人，本来就不是 AGI

"You will realize that a human being is not an AGI. A human being lacks a huge amount of knowledge. Instead, we rely on continual learning."

AGI 这个词，是对"窄 AI"的反弹，再加上 pre-training"越训越全能"的印记，一起把目标定过了头。真按这个标准看，人类根本不是 AGI——我们知识有大量空白，靠的是在岗位上持续学习。Ilya 说，是现在的 RL 正在慢慢抹掉 pre-training 留下的概念烙印。

10

💡 洞察

超级智能是个很会学的 15 岁少年

"I produce a superintelligent 15-year-old that's very eager to go. They don't know very much at all, a great student… It's a process, as opposed to you dropping the finished thing."

那超级智能到底长什么样？不是一个会做经济中每份工作的成品，而是一个"很会学"的 15 岁少年：知道得不多，但极其好学，你让他去当程序员、去当医生，他边干边学。部署本身就是一段试错学习的过程，而不是把一个做好的东西直接丢出来。

🛡️ 对齐、均衡与人机融合

11

💡 洞察

让 AI 在乎"有知觉的生命"，反而更容易

"It will be easier to build an AI that cares about sentient life than one that cares about human life alone — because the AI itself will be sentient."

所有人都锁死在"自我改进的 AI"上，只因为公司比想法多。Ilya 提了个更值得造的目标——稳健地在乎"有知觉的生命"。而且这可能比"只在乎人类"更容易，因为 AI 自己就是有知觉的，就像镜像神经元让我们能共情动物：我们用建模自己的同一套回路去建模别人。

12

🔥 犀利

长期均衡的答案：人类接上 Neuralink++

"I don't like this solution, but it is a solution. The solution is if people become part-AI with some kind of Neuralink++."

就算前几个超级智能都爱护人类，长期均衡怎么维持？如果每个人都有一个 AI 替自己挣钱、替自己在政治上发声，人本身会慢慢退出决策，只剩批一句"干得好"。Ilya 给了个连他自己都不喜欢的答案：人接上 Neuralink++，让 AI 的理解被整体传给你——它在场，你也完整在场。

🔮 复制、时间线与研究品味

13

🧭 治学

一百万个 Ilya？收益递减

"There'll definitely be diminishing returns because you want people who think differently rather than the same. If there were literal copies of me, I'm not sure how much more value you'd get."

很多人的"递归自我改进"设想是——服务器里塞进一百万个 Ilya，超级智能瞬间涌现。Ilya 本人不买账：一定会收益递减，你要的是想法不同的人，而不是同一个我的复制品。他还补了一句冷知识：不同公司、号称不重叠数据训出的模型却惊人地像——多样性，才是真正稀缺的东西。

14

🔥 预测

5 到 20 年

"I think like 5 to 20."

一个能像人一样学习、并因此变得超人的系统，多久会到？Ilya 给的区间是 5 到 20 年。短短一句，却是他对"人类式持续学习"何时被攻克的正式下注——也是这场对谈里最硬的一条时间线。

15

🧭 治学

研究品味：容不下丑，靠自上而下的信念撑着

"There's no room for ugliness. Beauty, simplicity, elegance… The top-down belief is what sustains you when the experiments contradict you."

世界公认最有研究品味的人，怎么想出这些点子？Ilya 说他靠一种美学——美、简洁、优雅、对大脑的正确借鉴，必须同时具备，容不下丑。而当实验和你作对、又分不清是方向错了还是代码有 bug 时，撑住你的正是这种自上而下的信念：事情就该是这样，所以继续走。

扩张时代结束了，我们回到研究时代。
模型是死练一万小时的第一名，
缺的是人类那种可靠泛化与持续学习。
超级智能不是无所不知的成品，
而是一个很会学的 15 岁少年——5 到 20 年后到来。

从扩张时代，回到研究时代

真正在 reward hacking 的，是人类研究员

两个学生：死练一万小时 vs 天赋型选手

第一名学生 ≈ 今天的模型

第二名学生 · 有"it"

失去情绪的病人，连穿哪双袜子都定不了

扩张时代结束，回到"带着大电脑做研究"

扩张时代 2020–2025

研究时代 · 现在

公司比想法还多

AlexNet 当年只用了 2 块 GPU

SSI 只有 30 亿，研究算力差距却没那么大

账面数字

真正用于研究

Meta 想收购 SSI，我说不

人，本来就不是 AGI

超级智能是个很会学的 15 岁少年

让 AI 在乎"有知觉的生命"，反而更容易

长期均衡的答案：人类接上 Neuralink++

一百万个 Ilya？收益递减

5 到 20 年

研究品味：容不下丑，靠自上而下的信念撑着