3.5 小时播客 · 15 个核心判断

罗福莉访谈速读:
OpenClaw 冲击与 1T 入场券

「张小珺Jun|商业访谈录」第 138 期 · 2026.04 录制
小宇宙 · B站 · 微信原文 · 完整笔记 ->

🧑‍🔬 罗福莉
阿里达摩院 -> DeepSeek -> 小米
MiMo-V2 系列负责人
Flash · Pro · Omni · TTS
🔥 最炸裂的判断
1
Hot Take
"我之前认为我们自己做的工作已经足够有创造力、足够不会被 Skill 化、不会被 Workflow 化。但我现在发现,它竟然也能!"
AI 能复原研究者的科研成长路径,能设计实验、训练模型。她认为 AI 自训练 AI "肯定就在这一两年发生"——左脚踩右脚就提升了。
2
Hot Take
"我们基本上在三四周的时间做完了以前可能三四十周的时间才能做到的事情。"
春节后团队群体使用 OpenClaw + Claude 4.6 Ops 做研究。几个小时迭代一轮 Agent 框架,第三四天接上自家模型就发现"怎么也挺好用的"。
3
Hot Take
"接下来两三个月会非常精彩。"
Agent 框架在快速进化,模型能力在飞升,成本有极致优势——推理需求将爆发几倍到十倍。同时国内团队进入加速追赶状态。
🧪 技术判断
4
架构
"MLA 应该不会成为主流。所有 MLA 模型我猜测都没有上 MTP——上了就被计算 Bound,所以模型都会慢一些。"
MLA 在设计之初追求访存与计算的完美平衡,但没有留给 MTP 的空间。Hybrid Attention 天然有计算富余,可以被 MTP 填满——"恰好用起来"。MiMo-V2 Pro 做到了 60-100 TPS。
5
训练
"预训练跟后训练一个比例(1:1),这是今年可能发生的很大变化。顶尖团队应该都是 1 比 1 了。"
过去 Chat 时代 for 研究:预训练:后训练 = 3:5:1,后训练投入远小于预训练。Agent 范式让后训练周期大幅拉长——"你在 post train 上要投入的算力可能跟 pre train 是相当的"。理想分配:3:1:1。
6
Infra
"RL Infra 从以 rollout 推理引擎为核心切换到了以 Agent 为核心。"
Chat 时代的核心是让模型思考很久给出答案。Agent 时代要处理异构资源(GPU+CPU+存储)、容忍中断、兼容框架快速变化。"做 RL infra 跟 pretrain infra 的最大不同——RL 会更在乎容错。"
对比

Claude Code

  • 上限更高(4.6 Ops)
  • Agent 架构是黑盒
  • For 软件工程优化
  • 更稳定的输出

OpenClaw

  • 完全开源可改造
  • 弥补中层模型短板
  • 日常任务 + 泛编程
  • 群体智能驱动进化
Claude Code for 严肃编程最强,但 OpenClaw 的框架设计弥补了模型短板——"借助这个框架,85% 的任务能达到跟 Cloud Sonic 一样水准"。两者优势在互相吸纳。
🏢 行业与竞争
7
入场券
"1T 模型是 Agent 的你要做到接近 Cloud 4.6 Ops 水平的入场券。"
国内已有好几家具备 1T 以上基座(Kimi、MiMo 等)。同时需要后训练的敏捷性——MiniMax 用 10B 模型做到的 Agent 能力"后训练敏捷程度非常惊艳",但入场券和敏捷性同时具备的还没有。
8
中美
"在路径更清晰的情况下,国内大模型团队进入加速追赶的状态。"
预训练上基本没有代差,结构上甚至有优势。与 Claude Opus 4.6 的差距约两三个月——"不是追上两三个月过后的 Claude,而是追上当代的 Claude。这个概率蛮高的"。1T 以上基座:Kimi、MiMo 等好几家。
9
开源
"开源一定是加速 AGI 的事情。"
AGI 爆发 -> 需要海量芯片 -> 芯片分散 -> 模型不会是同一个 -> 开源是必然。OpenClaw 的 star 量飞增是"AGI 到来前兆必须要有的事情"。群体改进框架的速度远超任何单一公司。
🧭 组织与招人
10
组织
"没有组、没有职级。平权本身是有利于所有人平等地贡献创造力和智慧。"
约 100 人团队,实习生比例很高,二三十人真正投入一代模型迭代。做预训练的自然流向后训练,不按场景给人贴标签。管理方式:热爱驱动,以身示范解决问题。
11
招人
"环境反而比经验更重要。这些能力最多一两个月就可以被快速习得。"
大部分人之前没做过大模型。她更在乎"初始化 checkpoint 的上限高不高",不在乎"被 supervised learning 后那个点的状态"。开始倾向招大二大三本科生——"灵活性高,没有被污染"。
12
心法
"我的脑子就是一个 Sliding Window——我忘得非常快。快的话一两个小时,慢的话睡一觉就过了。"
每天否定昨天的自己,做事方式和判断都在不断推翻。信息来源:"自迭代。真的,来源自迭代。最近连跟人沟通都很少了。"工作时间:11am - 凌晨一二三四五点。
📜 AI 进化简史
13
范式
"Coding 基本上在每个范式上都戳中了那个点。"
预训练范式:code 是最密集的长上下文信号。R1 范式:code 有 verified 指标。Agent 范式:code 有 environment + 长程任务。"它还很容易 scaling——因为它本身就是自然语言。"
14
范式
"正确的事情是在非常复杂的 Agent 框架上端到端完成高复杂度任务,以此为后训练范式。"
她认为去年很多"做 Agent"的团队走了歧途——只是在 BrowseComp、SWE-bench 这类局限场景上刷分。"在那些 Benchmark 上表现高的模型不代表 Agent 能力真的强。"
15
AGI
"通往 AGI 的历程,感觉已经到了百分之二十。今年能走到百分之六七十。"
两个月前她认为 AGI "至少两年以上",现在修改为"两年以内"。关键变量:AI 能训 AI 了。先颠覆工作模式(产生生产力),生活颠覆更滞后(需要机器人硬件)。

Agent 框架弥补模型短板,群体智能加速框架进化,
1T 基座 + 后训练敏捷性是入场券。
环境比经验更重要,平权激发创造力。