一、从北大数学系到第一次创业:和李丰的合并、罗永浩做股东
吴明辉的创业起点充满了随机性。他不是那种一开始就 plan 好的创始人——用他自己的话说,"从来没有融过资,连资本市场都不懂"。
他在北大数学系是"保送一路到底"的那种学生:小学五年级参加数学竞赛培训,老师告诉他们一学期的课一个礼拜就能学完;初中学完高中数理化;高中不上课,每天骑自行车去市图书馆看数学书。数学、物理、化学、计算机,每门竞赛都拿奖。
"我第一优先选择本来是想去清华计算机的。但数学竞赛先考,考完了以后我是山东省第二名。北大的招生办老师特别狡猾——他跟我们省队前三名说,如果你们都来北大,我就给剩下两个同学发 offer。不能害了自己的队友,所以我就去北大了。"
到了北大数学系(号称"四大疯人院之首"),他发现自己不再是第一名了——"那一届有几个大数学家,号称北大数学黄金一代。跟他们一比,我就不是那种天才型选手了。" 于是他选择了差异化竞争:数学考不过你们,那我就开始创业赚钱、写代码。
最初的创业完全是机缘巧合。给人大附中小学生讲奥数赚第一桶金——2001 年一个月两三万,四环边上房价才五千一平。后来中学同学拉他入伙做软件外包:"他编程没有我厉害,接了外包有 bug 搞不定,我一天给他改完了,他就说要不咱们合伙吧。"
和李丰的合并
第一次融资是和李丰合并。李丰当时是新东方副总裁,有一家教育公司但没有技术团队;吴明辉有技术团队但没有产品方向。通过新浪教育频道主编介绍认识后,两人合并——李丰持股 40%,吴明辉 30%。估值三百万人民币,融了一百万。
"当时罗永浩还是我们的股东。因为李丰那个教育公司里面,罗永浩和李笑来都是他的股东——他们都是新东方的。"
第一版商业计划书写的是 recommendation system(推荐系统),不是广告系统。但 2007 年讲推荐系统没人买账——iPhone 一代都还没发布,PC 互联网连稳定的用户 ID 都没有。Cookie 每隔一两个月就被 360 清一次,推荐系统根本跑不起来。
"我的第一个 user 是谁呢?其实是罗永浩的牛博网。因为李丰的原因,我的推荐系统就放在了牛博网上。"
李丰觉得这事跟教育没关系了,不到一年就离开去做投资。吴明辉把天使投资人祝伟(广告公司高管)拉来做 CEO,自己退回做 CTO。他对李丰的评价是公允的:
"他不是说一定要做教育,更重要的是一定要把自己的最大价值发挥出来。如果不做教育,他对公司的最大价值就不大了。所以他后来就去做投资了——他走了以后还是公司的股东,让出来一些股份给到我后来的合伙人。"
奥赛心态:为什么始终乐观
"搞数学竞赛的人不会特别 struggle 一个事马上解决不了。奥林匹克类的项目,你要卷到全世界最牛——一定是挑战极强且天天失败的。英国数学奥林匹克的卷子第一页有个 guideline,它说'这个卷子很难,你只要有一道题能完整做起来就已经很好了'。从小接受了这样的训练,难题搞不定也很正常。"
二、秒针系统:上线第一天就拉爆 IDC
秒针的故事本质是一个"想做推荐系统但没有数据,于是曲线救国做广告数据分析"的故事。
吴明辉发现媒体不喜欢他的流量分析系统——因为大部分媒体在吹自己的流量,不希望第三方知道真实数据。于是他反过来找广告主:你们每天花钱买广告一直被骗,我帮你知道真实流量。
"上线第一天就把 IDC 给拉爆了。正常公司上线第一天可能十个流量,第二天一百个。我们上线第一天就是几千万——MSN 上帮客户做广告投放的监测,每弹一个聊天窗口后台就收一次数。两台服务器扛住了,爆掉的是机房的带宽——他们都没想到一个小破公司进去租了两个机位,第一天居然搞到这么大的流量。"
这个团队在大数据处理上确实是全球顶级的。隔壁实验室是北大天网实验室(分布式计算国内最强),他们的服务器满配 CPU 和内存做海量交叉计算——比如广告反欺诈,每一条日志都要追溯 IP 地址历史上所有行为,识别是不是机器人刷出来的。
错过移动互联网
"我的第一个 iPhone 是 iPhone 4。你很难想象我作为一个科技男……做广告行业的客户天天告诉我移动屏幕太小不适合做广告,我就被这个价值网络给影响了。创新者的窘境——给你反馈的都是错的信息。"
"如果 2011 年我也开始好好做 recommendation system,我们的优势是比今日头条要好的——因为我有比它多的 data。但再过两三年就没用了,人家就太厉害了。"
他把这归结为一个深刻的教训:当你在一个事上做得风生水起的时候,可能就沿着惯性去了,压根没想到自己还能做别的。
三、第二段创业:明略科技与"学 Palantir"
2014 年,吴明辉在中欧上了李善友教授的创业课程,学了"第二曲线"和"精益创业"。回来后一个公司变成了三个:秒针继续做广告、明略数据做大数据、云迹机器人(后者也即将 IPO)。
"我当时跟团队说,你们觉得咱们现在是不是挺浪费的、不够精益?大家说顶多一半人就可以干现在的活。我说行,那拎出来——同时成立两个新公司。"
明略数据的方向选择受到了 Palantir 的启发——美国大数据市场上最知名的企业之一,做 To G 业务做得很大。但实践中,To G 业务的核心问题很快暴露:反馈极其慢,每家机构的数据都不标准化,不适合做 AI 迭代。最终 To G 业务全部关掉和分拆。
2019 年,吴明辉把秒针和明略合并。原因很务实——他同时做两边 CEO,各有二十个人向他汇报,管理压力太大。更核心的原因是他看到了一个更大的机会:把企业所有数据合到一起做 AI。
"我自己就已经 confused 了——两边我都是 CEO,这块业务到底放哪做?合起来以后我跟股东说,我希望未来给每个企业做那个合到一起的大脑,把所有数据合到一起,在上面做 AI。"
四、收购小红(肖弘)的决策:一千人团队做 EIP——做太早了
2020 年通过北大同学介绍认识肖弘。第一次到家里聊完,吴明辉就决定收购她的公司夜莺(旗下产品微伴是腾讯企业微信上 install base 最大的 Social CRM)。
"我收她的主要原因不是因为她只是一个 application。在我看来,她有大量的 conversational data。这跟我的博士研究课题一模一样——我一看就说,干脆把它并购了,我就有一个很好的 install base,在上面做 AI 就好了。"
并购后,吴明辉甚至希望肖弘做他的 CEO 继任者——"她是一个比我还优秀的产品天才"。但肖弘最终选择了离开:
"她情商很高,不会直接拒绝我。但她后来告诉我:辉哥,我不可能做一个 To B 的公司老板的,我肯定要做 To C 的。"
更关键的失误是管理上的。吴明辉做了一个叫 EIP 的产品——一千人的团队,野心是做企业级智能体。三个子团队:application、数据 integration、AI 模型。这相当于 2020 年就在做 ChatGPT + 微软 Copilot 的概念。
"我当时太上头了。我让小红管了整个大团队的产品——对她来讲就太讨厌了。她是一个非常 hands on 的人,追求产品细节,但人多了以后全变成了汇报体系。"
回头看,问题的核心是做太早了。按 Sam Altman 的 AGI 五层分类,他需要 L3 的 model,但当时 L1(聊天式 AI)都不 ready。
"甚至唐杰老师都来我这讲过课,智谱的 founder 是我们的顾问——做的太早了。如果早半步是先驱,早两步就是先烈。"
关于肖弘后来创立 Manus,吴明辉的评价极高:
"Manus 发布第二天,我就跟团队说,如果今天我要投的话,我敢按 10 亿美金估值投——这是发布第二天我说的。她的产品做得真的是挺棒的,顶级的。"
五、2022 年:每个月花一个亿,一个月的 runway
从小到大顺风顺水的吴明辉,在 2022 年遭遇了最严峻的考验。上海封城,半数收入没了(国际客户集中在上海,开不了发票)。投资人开始 diss 他——"之前就觉得你做事不靠谱""把那么多钱给浪费了"。
"我们中间有那么几个月,账上就是在一个亿左右浮动。但你知道我每个月就要花一个亿——也就是一个月的 runway。这是最夸张的时候。"
大裁员开始。肖弘的微伴从三四百人裁到一百人。EIP 团队大幅缩减。裁员补偿金超过两个亿。银行骗他还贷——"说你还完了马上可以续贷,还了他就不给你贷了"。
他自己投了公司一千多万美金(借钱投的),腾讯也救了一把。最后融了一亿美金,但实际留下能用的只有两个亿——三分之一还裁员补偿,剩下的还银行贷款。
"我觉得这三年真的是——我从一个纯理想主义的 founder 变成了一个会经营的 founder。我现在算账能力一直很强,我们学数学的嘛——只不过之前不费这个心,总觉得有无数的钱可以给我用。"
即使在最 suffer 的时候,他说从来没考虑过关掉公司:
"我这人超级乐观。基本上没有什么事让我能够持续不舒服——有可能有的时候一两秒钟不舒服,但真的那一两秒钟之后就过去了。这跟竞赛有巨大关系。做奥赛的人天天做难题、天天失败,难题搞不定也很正常,不要 suffer。"
六、核心判断:基于公开数据训模型会卷成电费
吴明辉对 AI 行业格局有一个清晰的结构性判断:
"基于公开数据训出通用基础模型,拥有了人类的通识知识和逻辑推理能力——这个能力肯定不是只有一家公司有的。只要有两家以上,就不可能赚钱,就是要卷成基础设施那个最便宜的钱。因为大家要打价格战——就像电价一样。"
他的逻辑链条:
- 公开数据 = 无差异化:所有基础模型公司都能抓 Common Crawl,都能做蒸馏——"别人马上就可以做蒸馏,很快你的能力人家也有了"
- 真正的壁垒是私有数据:行业垂直数据、客户 first-party data、持续积累的时序数据——这些公开互联网上拿不到
- Y = F(X):当 F(模型能力)已经足够 smart,企业之间的竞争不再比 F,而是比 X(context,数据依据)
| 维度 | 通用基础模型公司 | 垂直数据公司 |
|---|---|---|
| 数据来源 | 公开互联网快照 | 持续积累的私有数据 |
| 护城河 | 算力和效率优化 | 行业知识 + 时序数据积累 |
| 商业模式 | 卖 token,打价格战 | 卖行业 AI 产品,按价值收费 |
| 终局 | 卷成电费 / 基础设施 | 垂直领域的差异化溢价 |
"就像天眼查的数据逻辑上来自工商总局——工商局的数据任何一个时间点去看就是个快照。但如果你每天去抓,你就能看到公司的历史沿革。你 2012 年再去抓 2008 年的数据已经没有意义了——数据这个事,没存下来就不叫数据。"
七、Scaling Law 是特别瞎扯的事
这是全场最 provocative 的判断之一。吴明辉用了两个生动的比喻来论证通用模型的规模极限。
血管分叉比喻
"人的主动脉往前走要分叉,一层一层分叉二十六次,最后分到毛细血管。到最后那个半径就是原来的二的二十六次方分之一——它有极限。你血管粗细有极限,整个带宽就有极限。就像 MoE 模型,你可以搞很多个不同的专家,但你的专家能穷尽吗?"
电梯缆绳比喻
"我去芬兰参观 KONE——全世界最高端的电梯公司,芬兰第一大市值。电梯的核心技术是什么?缆绳。一个三十层的楼,缆绳本身已经比轿厢重很多了——缆绳在拉自己,不是拉轿厢。所以很多高楼一定要分电梯,因为再高缆绳自己都拉不动自己了。"
"Scaling Law 是一个特别瞎扯的事——只是这些基础大模型公司的 CEO 出去融资的一种叙事。大到一定规模基础代谢就受不了了。通用基础模型把全世界所有人活都干了——这个不可能,它通用是有限的,是一个相对的概念。"
OCR 的反证
他用最简单的任务来证明通用模型的局限性:
"OCR 这么简单的任务——所有大模型都干不好。图片上有字、识别出来是什么字,六十二分类,以前用极小的模型就能干。但今天全世界最牛的通用模型都干不好——因为大模型训练图片时都是'看图说话',attention 机制训成了感受全局,而不是一个字一个字地看。"
如果把 OCR 作为 MoE 的一个专家模型,"连这样的任务都算一个专家的话,整个 MoE 得几万个专家——路由就越来越复杂,训练也更复杂。"
八、现实世界的数值游戏:DeepMiner 的由来
DeepMiner 的诞生源于一个意想不到的启发——游戏。
吴明辉投资了一个做 SLG 游戏的朋友。在讨论如何用 AI 替代游戏里"陪玩"的免费玩家时(省掉 60% 的广告买量费用),他发现了两个技术瓶颈:AI 不知道外部世界的八卦(聊天会露馅),以及 AI 无法操作游戏配合打仗。
"那个游戏公司 founder 说了一句话彻底启发我了。他说:'辉哥你的感受是对的,我们这种游戏就是数值类的游戏。'我一下就想到——我今天就是一个人在分析屏幕上的数字、分析完做决策。既然 AI 能干游戏里的这事,我为什么先去搞游戏?我自己的业务不就是每天一堆人在分析数据吗?"
"现实世界的数值游戏。商场如战场。我真实的战场就是陪着一堆企业每天打数值游戏。"
灵感在滑雪场上闭合——他在缆车上就开始给产研团队布置作业,春节后第一天上班就立项。
CUA/BUA 世界第一
DeepMiner 在两个关键榜单上拿到了顶级成绩:
- Mind2Web(Browser Use Agent):specialized 模型第一名。7B 模型拿了 44 分,第二名 Kimi 34 分——一下超了很多
- OSWorld(Computer Use Agent):specialized 模型第一名,总榜第四。前三是 OpenAI、Anthropic、字节
"主办方测了一天,看到我们分数非常惊讶——他说你们从哪冒出来的?我们是 pass at one 直接 SOTA。打榜你如果提交不止一次,都有作弊嫌疑——因为在线测试可以记数据再训练。我们就一次提交,直接第一名。"
整个产品加模型团队只有四十个人,模型是 7B 大小。疫情前买了一千张卡,里面还有消费级的——"我们是有能力做模型的公司里面资源最少的。"
九、Agent 是一种交互技术
吴明辉对 Agent 的理解超越了"AI 能做什么"的维度。他认为 Agent 本质上是一种交互技术——tool use 是交互,planning 是 plan 到底怎么交互。这会从产业格局层面对 To C 和 To B 互联网都产生革命性变化。
入口会改变
"你给智联招聘一个任务说找工作——以前只能在它的 database 里搜。但有了强大的 BUA/CUA 能力,Agent 可以先去智联,再去 Boss 直聘,再去五一 Job,所有的全走一遍。这个 Agent 就比原来厉害很多——入口就变了。"
只提供链接的平台很危险
"那些不提供供给侧能力、只提供链接网络的公司会很危险。比如滴滴——如果前面的苹果或小米把你绕过去了怎么办?但如果你在无人驾驶上有独有的供给侧能力,他们就绕不开你。原来只是一个链接网络、而且不是根节点——这是很危险的。"
AI 时代企业级服务会出现并购潮
"有 AI 以后,产品和产品的整合不难了——以前你要把底层全部打通,今天不用。把产品变成 Agent,变成 Multi-Agent 就可以了。整合容易了,产品和产品之间很容易协同——企业级服务赛道一定会进入并购潮。"
为什么企业级 Agent 需要 GUI + Text 双模式
吴明辉自己的工位上放了 N 个屏幕——"我需要一个带宽更高的状态,同时看到很多信息,处理起来才痛快。手机太小了,严重影响生产效率。"
"企业级的人机交互不可能只有 text 的 conversational 模式。涉及到精准干预执行过程的时候,纯文字描述就不够了——比如一张图片上要精准划出某个区间,有三个人在图片上你怎么用语言描述清楚?一定是 GUI 和 text 两种并存。"
十、将来企业只有两类人:老板和合伙人
吴明辉引用了一篇他认为"危言耸听但可能不是错的"文章:
"将来一个企业里面只有两类人——一个叫老板,一个叫合伙人。而且特意注明了:合伙人不是这个公司的员工。是 part-time 过来、作为某个 function 的专家、给老板提供支持的。"
他给这个观点加了自己的注解——那些 partners 最终不是肉身加入的,而是 Agent 加入的。你的分身 Agent 被租用了。
"为什么叫合伙人?因为合伙人要 take 公司的 performance 作为 responsibility——不是拿死工资,是分红。比如我是你的广告合伙人,你公司卖得好我就赚更多,卖不好你给我个电费就行了。"
Agent 的 IP 化
"Agent 是有 IP 的。一个顶级的做产品定价的大师,他的 Agent 就可以很贵;一个 nobody 的 Agent 就很 cheap。超级个体有自己的 IP,加入到任何一个 team 里就可以产生更高的价值——不是简单的 token 的钱。"
考试应该考学生训的 Agent
"每个学生上完课,期末考试的时候考他的 Agent,不是考他自己。大家上班 PK 的不是 PK 我——是 PK 我加我的 AI。小朋友在学校学的那些东西 AI 都已经知道了,你还去教他有什么意义?真正面向未来职场真正应该考的逻辑——是你能不能把你学的东西教给 AI,让 AI 代替你去考试。"
十一、人机协同中最难的是把暗默知识变成 Memory
吴明辉引用了日本学者野中郁次郎的 SECI 知识管理模型来解释人机协同的核心难题:
| 阶段 | 含义 | 知识流向 |
|---|---|---|
| Socialization | 师傅干活,徒弟在旁边看 | 暗默 → 暗默 |
| Externalization | 专家做 PPT 分享经验 | 暗默 → 显性 |
| Combination | 多个专家的知识对比连接 | 显性 → 显性 |
| Internalization | 标准化后每个人再学习执行 | 显性 → 暗默 |
最难的部分是第一步——暗默知识怎么变成 AI 可以用的 Memory。
"人脑的暗默知识每天都在迭代,人如果不告诉 AI,AI 就是不知道的。而且他每天都在迭代——有时候跟外部互动产生迭代,有时候脑子里静坐都可以迭代。"
吴明辉的解决方案是产品设计上的两个模式:
- 自主模式(Autonomous Agent):和 Manus 类似,给任务就跑
- 协作模式(Human-in-the-loop):AI 不停地问你问题,直到该问的都问够了才干活
"协作模式你会发现它很烦——不停地问你问题。但这个人机协作过程中,AI 就把你脑子里的暗默知识给挖出来了。只要最后结果是对的,你已经把所有 context 都给到它了。"
"就像做访谈一样——如果做 AI 相关的访谈,你就可以提出非常高质量的问题。AI 提问本身也是一个难的任务——没有人去训这方面的能力,因为种瓜得瓜种豆得豆。这就是创业公司的机会。"
十二、MOA 架构:为什么是 Multi-Agent 而不是 Single Agent
吴明辉把他的产品架构叫 MOA(Mixture of Agents),类比 MoE(Mixture of Experts)。Manus 是 Single Agent,DeepMiner 起手就做了 Multiple Agent。
"我作为公司老大,没有这个智商可以把所有事全都 plan 好。对所有 context 的细节了解是不够的——一定要分工。就像公司组织架构跟 AI 的 Context Engineering 道理一样:上下文窗口再长,也不可能把一个任务的所有 context 全处理完。"
他的策略是:每个细分领域做到世界第一的 specialized model,然后组合起来。
"基础模型公司的叙事是所有东西我都牛——但不可能每个事都牛。数学可能 DeepSeek 牛,coding 可能 Anthropic 牛。这些公司最聪明的几个人是有限的,注意力往哪倾斜哪就好。"
"从 Scaling Law 的天花板到人体的规模效应——大脑大到一定程度就不会再大了,最后变成 teamwork。现代人通过团队打败了上一代物种——学学进化论。"
模型都很小(7B / 8B,最大到 32B / 70B),可以在一台电脑上部署——这和 Manus 在云上跑有很大区别。企业环境下很多客户不敢把 confidential 数据放到别人的云上,私有化部署是刚需。
十三、快问快答
全球范围内一道你喜欢的食物?
兰州拉面。
全球范围内一个你喜欢的地点?
希腊萨莫斯岛——毕达哥拉斯的老家。
推荐两本书?
- 达尔文的《物种起源》——"所有做 AI 的同学应该好好看一下。"
- 《几何原本》——"感受一下第一性原理和公理体系的建设。我们做的 AI 将来一定要有这个能力,否则很容易忽悠人骗人。"
你听过我播客没有?印象比较深的哪期?
"杨植麟那期。他原来跟我在一个赛道做 application PK 的,后来纵身一跃去做 foundation model 了,还做了 To C——蛮成功的转型。我还是坚持做 AI 但坚持 To B。"
你是一个幸福的 founder 吗?
"显然我非常幸福。我人生至少到目前为止还都是挺完美的。我每天都挺开心的。哪怕 2022 年我也没有特别难受——我始终有一个信念,就是我肯定能搞定。就像做数学题一样,时间可能花得长一点而已。延迟满足能力很强。而且到目前为止运气好——都能搞定。"
本文基于「张小珺Jun|商业访谈录」第 116 期播客完整音频转录整理。播客时长约 3 小时 48 分钟,本文做了大量精简,完整版请收听播客。
播客收听:小宇宙FM
速读版:15 个核心判断 →