KOKoji杨远骋Jun 21, 2026· 38:03

【十字路口】对话 MiniMax 闫俊杰:M3、10X 计划、10T 模型、和智能的终局【视频播客】

本期十字路口对话MiniMax CEO闫俊杰、Multica创始人张佳圆、DeerFlow核心负责人何涛及金融AI负责人虞扬。闫俊杰详解M3关键突破与10T模型训练路径,直言中美模型差距整整两代,并解释数据观转向——从标注转向专家合作项目。嘉宾们围绕AI编程的工程化落地展开交锋:张佳圆主张多模型组合控成本,何涛强调长期维护而非次抛代码,虞扬则分享金融场景中AI如何将信息转化为决策路径并降低门槛。

  1. 0:00开场
  2. 1:41M3突破
  3. 4:02用户视角
  4. 5:56DeerFlow
  5. 8:53金融AI
  6. 12:09模型与Agent
  7. 14:1110T模型
  8. 17:53工程实践
  9. 27:13数据观
  10. 30:30未来下注

Transcript

开场0:00

Koji杨远骋0:00

那我们今天圆桌的名字 , 我发现主办方没有叫它圆桌论坛 , 叫它圆桌交锋 。 对 , 我就感觉这个有点压力 。 要是没有交锋起来就有点名不副实 , 我感觉 。 对 , 然后我 , 我其实自己啊 , 是有点这个 surprise 的 , 一开始说哎 IO 也会来 , 而且分享了那么多 。 呃 , 所以今天这个想问 IO 的第一个问题也是 , 就是这个活动为什么对你来说这

么重要 , 你自己花那么多时间来参与 。

闫俊杰0:28

其 , 其实我们这个主要是感谢各位 , 然后花时间起来这个分享 , 包括那个何涛 , 何涛其实坦白说是他是一个非常好的开源项目的这个作者 , 他那个应该是那个 -

Koji杨远骋0:39

七万 star。

闫俊杰0:40

对 , 七万 star。 呃 , 就包括佳圆 , 佳圆的话 , 其实那个很早之前就其实给我们提供了很多的建议与帮助啊 。 对 , 其实核心还是感谢大家了 , 就是说那个 , 就是刚才说了 , 其实也 , 也是我们第一次来办这个活动 , 我们连 , 我们觉得就是 AI 编程或者说 AI 这种 , 它其实不会让从业者越来越少 。 就比如说可能在两年前 , 当时我记得

我曾经问过另外一家公司的一个人 , 实际上我当时问过杨远骋说 , 哎你们要不要做 AI coding, 他说不做 。 为什么呢 ? 因为全中国会写代码的人可能只有一 , 只有 , 只有一百万还是两百万人 。 哎 , 这好像不是一个很大的市场 。 就两年前都是这么一个泥沼 。 但是现在显然不是 , 对吧 ? 因为 AI 这件事儿确实是可以让更多的人可以有

生产力的 。 我觉得这是一个非常好的 、 正向的变化 。 但是即使 , 就即使这个事儿它可以让更多人学会 , 它的核心还是说一开始有一些真正热爱这么来做的人 , 然后在这个里面 , 然后把它给触摸给更多的人 。 然后我觉得今天是我们是第一次吧 , 然后我后面也会把它变成一个持续性的这么一个呃事情吧 。

M3突破1:41

Koji杨远骋1:41

就从 M1 到 M3, 我们看到了非常多的突破 , 然后很好奇 , 这 you 觉得哪些突破是符合预期 , 哪些突破是还没有达到预期 。

闫俊杰1:53

我觉得就是一个比较客观的指标 , 其实是 token 消耗量 。 其实 M1 的话 , 我觉得我们实际上是这个 token 消耗量其实是比较低的 , 客观来说 。 但是那啥当时的 M1 的话 , 我觉得是 , 坦白说那个模型其实它最终的效果不太好 , 但是其实实际上我们从做 M1 的时候就感受到了这个事儿 。 就一个很经典的桥段啊 , 就是说什么潘多拉在椅子上

, 什么后背发凉这种事 , 我 , 我 , 我们有这种感觉 , 其实是在做 M1 的时候有这种感觉的 , 就是 , 就是在做 M1 的时候 , 我们第一次跑通那个消耗其实也是少 , 然后那个时候记得特别清楚 , 去年五一假期呢 , 那个时候反正就是第一次感受到这个 , 这个东西了 , 但是这个模型其实没有怎么做成功 。 然后呢 , 到 M2 的时候呢 , 去

年下半年 , 那个时候大家最关心的评测是其实 on Arena, 我记得 , 对吧 ? 那 , 那所有人发布都会讲这个东西 , 我们那个时候就非常明确 , 我们就只做 coding 跟 agent, 然后我们就不管那个 , 那些不相关的那些对话的那些场景 , 我们真的是这么来决定的 。 然后这个决定其实站我们团队里有很多的质疑 , 就为什么你不管这一层次 , 然后但是

我们就这么做了 , 然后这么做了之后呢 , 其实我们一开始 M2 刚上线的时候啊 , 我们觉得这个一天消耗一万亿的 token 我们就满意了 , 呃当时定的目标是这样的 。 然后那个 , 结果它那个 , 呃 , 到 2.7 的时候大概就变成了十万亿的 token 一天 , 基本上就是相当于我们目标就超了十倍吧 。 然后呢 ,M3 的话呢 , 就是说我们其实是定了一个更

大的目标 , 但这么多还没有完全实现啊 。 对 。 然后呢 , 就是说从 token 消耗量的角度来说 , 我觉得 , 呃 , 其实还是比较超预期 。 从能力上来说的话呢 , 是说我们在 M2 的时候其实就想实现这个多模态 , 但是在 M2 的时候其实没有实现 。 然后呢 , 我们在 M2 的时候能够到这个 , 呃 , 就是编程里面能够当成一个主意盟来用 , 这个其实

也没有实现 。 当然实现的东西是说后面出来的 OpenKao 出来 , 更晚的 agent 呢 , 它 , 它找到了这样的市场 。M3 的话呢 , 就是说我们的两代模型主要都是说可以无限制地来用 , 这种不需要关心成本来使用 32G 模型和 22G 模型 。 然后呢 , 如果这 , 如果到这个东西 , 再加上整个行业的大规模增长 , 我们觉得总量能到一个非常可观的量级 , 我觉

得 , 我觉得我们在非常接近这个事儿 。 对 。

用户视角4:02

Koji杨远骋4:02

好 , 谢谢 。 然后佳圆刚才其实也有一个精彩分享 , 就是讲 Google Engineering, 然后你们在做它的时候用的是这个 M3,MiniMax M3。 用的过程中你觉得有哪些好与不好 ?

张佳圆4:15

首先就是我们 , 我们 , 我们其实工作流里面有大量的这种可以去 pipeline 化的这个场景 , 包括去处理 GitHub issue, 包括去处理 , 呃比如说做这个呃 customer support 等等一系列的这个场景 。 因为其实并不是所有的场景都需要用最高级的模型来去做 。 我们每个人自己都有好几个 Cloud Code 账号 , 呃 , 加 Codex, 然后加上 Kuster, 可能有个几千美金每个月的这个 token 的消耗

, 其实成本是非常高的 。 那我们现在就在做的一个尝试 , 呃 , 就是 , 呃 , 单一的这个模型的能力 , 可能它或多或少可能在一些方面都会有 , 呃 , 就是可能有这个方面不足或者那个方面不足 , 但是能不能去设计一个系统 , 而去把 , 呃比如说不同的模型的能力去 , 呃 , 聚合起来 , 不同的 agent 的能力去聚合起来 , 它一定程度上

可以弥补你的这个模型能力在一些情况下的不足 。 比如说 , 呃 , 我 , 我们发现 M3 它可能有一些时候会比较啰嗦 , 或者有一些时候它这个 thinking 的时间会比较长 , 或者它给你的这个结果里面不一定 , 呃 , 所有的点都是正确的 , 那这个时候你就可以 , 呃 , 用一个比如说其他的模型 , 比如说像 Ops 或者是 GPT 来去给它去做这个 review, 或者

是作为它的 mentor, 对吧 ? 然后让 , 让 M3 来去作为 coding 的这样的一个模型 。 这个其实就是用系统的这个方式来去拟合 , 呃 , 这个单一模型的这个 , 呃 , 部分能力的这 , 这样的一个不足 。 然后我们实践下来 , 呃 , 发现它确实是 , 呃 , 能够达到你的这个 token 的这个消耗以及 , 呃 , 整个产出的这个效果的一个平衡 。 未来你的整个公司里

面的这个 token cost 肯定是你需要去 , 呃 , 考虑的一个 , 一个目标 , 那这个时候你就需要去考虑怎么让不同的工作由不同的这个模型来去完成 。

DeerFlow5:56

Koji杨远骋5:56

好 , 谢谢 , 谢谢 。 那接下来就这个请何涛介绍一下说 70,000 star 的 DeerFlow。 今天的 DeerFlow 和一开始已经有很大的不一样了 。 那给大家介绍一下今天的 DeerFlow 是一个什么 DeerFlow, 以及它是什么原因让它那么的受欢迎 。

何涛6:12

这个问题我是第一次代表我们团队在公开场合回答 , 然后我也跟我们团队讨论了一下 , 我先说一句大白话 。 为什么火这件事我们也没有追求出原因 , 可能很多时候 go viral 这件事就是上帝握着你的手写下了一行代码 , 或者说是上帝握着你的嘴说出了一句话 , 那 call code 或是咳嗽写了一段代码 , 然后 X 上面有人帮你转了 , 它就火

。 但我想说的事情是 , 这里边的话 , 就是 DeerFlow 它有两个身份 , 第一个身份是它是一个开源项目 , 然后这个开源项目的话 , 一开始的初衷的话 , 是我们在 25 年的时候发现 Deep Research 这样的任务非常贵 , 你首先需要有一个两百刀的呃 ,ChatGPT 的 Pro 的订阅 , 然后你才能去用几次 , 那我们就觉得奸商 , 开源必须得把你打下来 , 而且我们还要用

中国的模型给你打个样 , 然后我们还连生图都要用中国的模型 。 所以在我们一开始的我们的初衷就是说我们想用一种自己的表达方式把在电脑端要去做的一个事情 , 我们当时 , 呃 , 在一个大公司里面 , 所以我们的日常工作就是要写报告 , 然后报告的话可能还要有图表 , 然后有报告跟图表之后 , 那个时候还要生成像 Koji 那

样特别优质的播客 。 最后的话 , 我们还希望它能够变成一段动画片 , 因为我们很多人都有小孩 , 有这种动画片需求 。 之后还有人说我喜欢听音乐 , 那我要听音乐 。 所以 , 所以我得表扬一下 MiniMax token plant。 这个是我们在 day day 原本就接入了 MiniMax token plant 的原因 , 就多模态是一个非常有魅力的事情 , 而且每个人的日常工作就是一个多模态的

工作 。 我觉得如果要反推来说的话 , 这我觉得也是 , 呃 ,DeerFlow 一开始 bet 的对的一个点 , 我们一定要完成桌面工作者所有的工作 , 就是有可能一开始是残缺的 , 会被喷的 , 那我们要接受被人喷 , 但你要有 。 然后 DeerFlow 的话 , 其实这里面还有一个比较有趣的一个身份 , 就 DeerFlow 现在是一个社区 , 我们有 , 呃 ,1K 以上的 contributor, 这个 contributor 是覆盖了除

了北极 、 南极以外的其他的所有的陆地地区吧 , 大概我可以这么说 。 然后而且还有经常会有人给我们用各种我们看不懂的语言提 issue, 怎么样用 agent 去管理这样的一个开源项目 , 也成为了我们现在就是说不断在研究跟探讨的一个方向 , 然后以及我们现在被很多人去 complain 说我们的代码已经是屎山了 , 那我们怎么样再去说 , 呃 , 把

屎山的代码再清扫一下 , 变得更好 。 其实这也是就是今天来到这个 DevDay 能够跟更多的开发者一起交流 。

金融AI8:53

Koji杨远骋8:53

我理解这个其实是所有的成功的开源项目都走过的的事情 。

何涛8:58

对 。

Koji杨远骋8:58

最近 OpenCloud、Nanobot 都纷纷的 , 就是 , 就不得不这么做 , 再不这么做的话就受不了了 。 好 , 那我们再接下来想请教一下宜阳 , 就是在互联网金融这么一个垂直领域 , 然后你们又作为一家这个上市公司 , 你们现在在怎么用 AI 或者 agent, 哪些部分是看到已经产生了非常直接的商业价值 。

虞扬9:23

呃 , 好 , 我们这边是做这个 , 呃 , 直接是做这个金融行业的 。 从我们用户角度上来讲 , 他其实不是很会表达 , 我们大多数用户他其实根本不知道他今天打开应用 , 他今天想干什么 。 一般来说 , 如果你打开一个比如说类似于那个行情软件 , 他总归希望是他目标是赚钱 , 对吧 ? 这是很明显的一个事情 。 那除了这个事情以外

, 但是他其实很难表达说我今天是要干什么 , 可能他问的问题就是帮我选几只个股 , 这是我们收到的最多最多最多的一个 , 一个问题 , 帮你帮我选几只个股 。 那你 , 你 , 你遇到一般情况 , 这个事情就傻了 , 对不对 ? 比如说我现在问你 , 或者你问我 , 我也很难给你去选这个问题 , 对吧 ? 这是第一个 。 第二个 , 我发现我们

很多的同类的厂商 , 他们做的东西是今天比如说我 , 我能够问你 , 我今天某只个股怎么样 , 那他会给你去罗列很多的信息 , 然后就没有然后了 。 这个是一个很大的问题 。 所以我觉得从这个角度上来说 , 大家能做的东西第一步是筛选信息 , 这个也是现在所有的 AI 东西都在做的问题 。 第二个 , 我们可以降低很多人的门槛 ,

大家都知道的很多一些 , 一些术语 ,TTM 是什么 , 这个东西是大了还是小了之类的东西 。 所以说从 AI 的这个角度上来讲 , 它其实可以 , 可以降低很多的门槛 , 它告诉你这个数字为什么是这样子 , 告诉你这个东西对于你的影响是什么样子的 , 这个是我们 AI 要做的事情 。

Koji杨远骋10:40

那再问一个很简短的问题 , 就是作为在这个上市的金融公司做 AI 负责人 , 那有用 AI 帮你炒股 ?

虞扬10:50

呃 。 呃 , 这是一个很好的问题 。 第一个是因为有合规的原因 , 我们这个是不能直接炒股的 。 第二个事情是实话实说 , 我们自己有这样回测的一个机制 , 就是我们其实给用户输出的东西是不带投资建议 , 但是我们内部的版本有 , 我们可以根据我们自己的这个东西去做 , 去做回测 , 我们大概大致胜率是多少 。 实际上来说 ,

于我个人而言 , 我是 , 我对于我们东西是无比有自信的 , 因为我们实际上有真真实实的数据能支撑着我们说这个东西我们胜率是多少 。

Koji杨远骋11:14

你会不会发现 , 就是如果你今天就是工资其实远远跟不上这种 , 就是模型告诉你的这个投资建议 , 那你要怎么平衡 ? 因为真的也是 。

虞扬11:28

这是一个 , 这是一个很好的一個问题 。 炒股这个事情跟你一般去做那个大模型推理其实不太一样 , 它 , 它不是一个文字的问题 , 就它里面其实会有很多的步骤 , 你的信息要对 , 你的个人的画像要对 , 你的整个分析的状态要对 , 而且这是一方面 ; 第二方面就是这些是 , 东西都实际上是具变化的 , 你今天我做了一个决策 ,

它说 OK, 没有问题 , 那很有可能市场下一步 , 比如说可能 OpenAI 就直接拿出来 IPO 了 , 那这是一个很大的一个事情 。 那你要做的事情是说一 , 我要去预测说这个东西到底是好还是不好 , 这个是重要的 , 它接下来很有那种可能性是很重要的 。 第二个事情就是说 , 当这个东西真的发生了以后 , 你要怎么做 。

闫俊杰12:07

这个实际上是比我告诉你这个会怎么发展来说 , 其实要 , 要重要得多 。

模型与Agent12:09

Koji杨远骋12:10

下一个问题还是想请教 IO, 也是很简单的一个问题 , 就你怎么看这个模型和 agent 这个关系 , 未来还会 agent 吗 ? 还是只剩下基模 ?

闫俊杰12:27

这个我觉得是这样 , 对 , 我觉得是这样的 , 我觉得比如说 , 就我们回想一下 , 比如说去年这个时候 , 坦白说我觉得去年这个时候是想不到现在的模型是什么样的 , 反正至少我自己是想不到的 , 因为 , 因为你想去年我们自己还在 , 还 , 还 , 还在做 ME 呢 。 然后那个去年的话其实也没有 OpenCoila 对吧 ? 去年这个时候 CodeCode 其实 , 其实可

能还只有非常少的用户 。 所以说呢 , 就是说按照这个道理来说 , 我感觉好像明年会怎么样 , 我觉得现在可能我们也没法预测 。 对 , 然后呢 , 那就是我觉得这也是 , 就是 AI 里面比较神奇的地方 , 就是说相当于是说 , 比如说在 AI 这个行业里面 , 一年经历的事儿可能 , 可能就等价于其他行业要好几年才能经历的事儿 , 可能就

, 应该就是这么 , 这么一个过程 。 然后呢 , 并且呢是说 , 比如说模型的进步跟 hardness 的进步 , 它其实也不是一个互斥的关系 , 它其实是一个共同进步的关系 。 比如一开始坦白说 , 比如说如果假设没有 CodeCode, 这可能 Unsupervised 的模型可能也不会这么火 。 然后再假设是说 , 比如说一开始 , 比如说 OpenAI 当没有做出来 GPT 5.5 的时候 , 其实 Codex 其实也做

不起来 , 有了 GPT 5.5,Codex 才真正起来的 。 所以说我觉得这两个东西它可能就是一个 , 就是相互的关系 。 我觉得一个视角是说 , 我们可以把那个模型加 hardness 都看成是说我们能够实现更高智能的一个手段 , 就是虽然说模型现在越来越强 , 我 , 我们还是应该假定这个模型最终还是为 , 或者智能最终应该还是给人类来服务的 , 我们应该

还是得抱着这个前提来 , 来 , 然后来想这件事儿 , 然后模型和 hardness 就是两个手段 , 我 , 我 , 我觉得是这样 。

Koji杨远骋14:11

确实很难预测 。 啊 , 也想起那个是有一位计算机科学家就是叫 Alan Key, 他的一句遗言 , 就是这个 , 呃 , 预测未来最好的办法是去创造 。 然后刚才其实我记得这个 IO 在 , 呃 , 前面的分享的时候提到这个 , 咱们 10T 的模型是必须要属性 , 然后现在已于或是它训成的中间最大的卡点可能有哪些 ?

10T模型14:11

闫俊杰14:37

呃 , 对 , 它的卡点是这样的 , 就是说 , 呃 , 它实际上没有特别的卡点 , 它的卡点就是需要时间 , 需要积累 , 就是因为原话是因为 , 怎么说呢 , 你 , 其实你可以看到 AI 已经是很大的产业了 , 就跟之前半导体是很大的产业是一样的 。 是一个产业的意思就是说 , 这个里面的话它其实没有一个什么障碍 , 说让一个事实现不了 ,

就没有个特别的障碍 , 它有的障碍是说为了把这事做出来 , 它就需要时间 , 然后就需要积累很多东西 , 就需要实验的假想实地 , 比如就需要我们像现在这样 , 我们需要跟大家在一起来分析说模型到底应该优化什么东西 , 什么东西需要变得更好 。 我觉得它就是这么一个积累的过程 。

Koji杨远骋15:16

积累的具体是什么呢 ? 是比如说数据 , 是一些算法 , 还是 ? 啊 。

闫俊杰15:21

基本上是这样的 , 基本上就是说模型啊 , 基本上它的特点是这样 , 就是说 , 嗯 , 比如说每提升一代 , 比如说你的参数量 , 比如说可以大三倍或者大五倍 , 你可以发现是说原来大家都知道 scaling law, 对吧 ?scaling law 的外推 , 其实它不能外推那么多的 , 它只能外推一个 , 一 , 一个几倍 。 如果比如说大了十倍之后 , 可以发现你的很多外推

实际上是失效了 , 那如果 , 如果这个外推失效了 , 那又是你的结论是不一定对 , 那你去模型就是一个开方和 。 那所以说呢 , 这个事儿它的实质上是说就需要一代一代往上来做 。 我觉得其实可以看现在比如说像美国的模型比中国的模型基本上是大十倍 , 十倍的其实是意味着是两代 , 基本上是这么一个差距 。 那 , 那这个东

西怎么做到呢 ? 就是说我们觉得这个量级的模型需要 , 反正对国内的每家公司基本上都要再提升两代 , 然后那第一代的话就把 3T 的模型先真正能做好 。 第二代就是基于这里面积累的经验 , 然后再来做 10T 的 , 基本上就是这么两个阶段吧 。 对 , 然后在这个里面的话 , 每一次的话其实你可以发现 , 首先你的训练的规模变大了

, 对算力 , 对训练效率 , 对网络结构其实都会有很大的一个变化 。 比如说这次 M3 里面 , 它计算量其实是比较低了 , 但是它的 kv cache 还是比较大的 , 所以下版会尽量的来压它的 kv cache, 让它的推理会更好 。 实际上比如说更大的模型意味着更大的参数量 , 比如说一般情况下 , 就是说 , 呃 , 一个模型 , 比如它的参数是 , 是 , 是多少

, 它需要的数据量基本上是要参数量乘以二十 , 那一个十七的模型意味着需要两百 T 的数据 , 但全世界没有这么多数据 。 然后包括数据 , 数据质量其实也是不一样 , 比如说越大的模型它就越容易来拟合这些噪声 , 所以说越大的模型对数据质量要求其实越高 , 相当于是数据量要大很多 , 然后质量要求也又高了很多 , 然后

同时这个实验的 scaling law 的外推要大很多 , 就是 , 所以它其实是一个非常大的系统性的一个挑战 , 然后我们只能一代一代这样 , 然后往上来走 。 好处是说我 , 我 , 我们非常确定地认为我们在过去几个月一直是进步速度最快的那一个 , 所以说我觉得我们还是对这个事儿 , 呃 , 坦白说比较忐忑吧 , 但是我觉得我们应该是能到的

Koji杨远骋17:27

因为一开始这个 IO 分享的时候也说咱们这个是进步速度最快 , 而且全场长期涨停 , 其实当时我也有点好奇 , 就是这个 , 呃 , 快 , 它的速度你跟其他的是 , 就从什么维度来讲 ?

闫俊杰17:40

就 , 就比如说 , 比如说你看国内任何一个模型 , 在现在的这个精度水平 , 不管你用哪个东西来定义 , 和他们这个模型在三个月前或六个月前这个水平的比例 , 我觉得我们这个应该是 , 其中应该是最多的 。 对 。

Koji杨远骋17:53

好 , 谢谢谢谢 。 然后接下来一个问题是想和这位佳佑一块来这个探讨

工程实践17:53

何涛17:58

就是在完全依赖 AI 去做一个复杂项目的时候 , 现在到底应该怎么做才能够把这个软件工程的实践做得更好 。

张佳圆18:07

我先来分享一下我的一些想法 , 就是首先这个就是 , 呃 , 因为 , 因为现在 , 呃 ,AI coding 相当于是已经被商品化了 , 几乎人人都可以来去写代码 。 但实际上 Vibe Coding 这个事情 , 呃 , 从历史上来看并不新鲜 , 就是第一代的这个呃 ,Vibe Coding 的用户其实是产品经理 , 对吧 。 他过去其实已经是在 Vibe Coding 了 , 只不过他驱动的那个 , 那 , 那帮人是程

序员 。 那现在其实人人都可以 Vibe Coding 了之后 , 相当于是人人都变成了这个产品经理的这样一个角色 。 从这个产品的 , 产品经理的这个角度上来说 , 就是判断一个产品经理是否好坏的标准 , 从来都不是说他做了一百件事情 , 呃 , 或者说是他 , 看他 , 呃 , 这个提的需求够不够多 。 我觉得这里面更重要的一个判断标准是第一个

, 他怎么去判断要不要去做一件事情 , 或者说要不要不去做一件事情 , 因为你 , 你几乎能做任何事情 , 那这个时候你不去做什么事情的这个 , 你的这个决策标准就 , 呃 , 呃 , 非常 , 非常重要 。 然后第二点是 , 呃 , 就过去为什么我们就是 , 呃 , 软件开发发 , 发展了几十年 , 有各种各样的软件工程的理论 , 再者如果有一些

比较古早的这个程序员的话 , 应该都可能 , 可能看过一本叫 Code Complete 的一本书 , 对 , 叫代码大全 。 那 , 那本书里面讲的就是怎么 , 呃 , 因为本身软件开发它不是一个人的事情 , 它可能是一个 , 一个组织的事情 , 包括说你的这个代码复杂度上 , 上来之后 , 你其实里面有非常多的这个需要优化点 。 那这本书讲的就是怎么 , 怎么

在一个复杂的项目里面去更好地去 , 呃 , 做开发 , 然后包括说避免这个项目的架构变大了之后出现各种屎山的代码 , 怎么去让整个架构变得更加清晰等等一系列事情 。 所以说 , 呃 , 怎么去让这个 , 呃 , 一个一个项目不变成屎山 , 这个其实是大家研究了几十年的一个命题 , 包括现在就是 , 呃 , 包括 DeerFlow, 包括这个 Multica, 它作为一

个开源项目 , 其实 , 呃 , 每天都有大量的这个 contributor 提交代码 , 因为提交代码实在是太方便了 。 我们现在的一个做法其实是 , 呃 , 首先我们的一个核心的这个呃 , 项目的维护者会去定义这个产品的这个 , 呃 , 它 roadmap 是怎么样的 , 它的这个 , 呃 , 品味是怎么样的 , 它要去做哪些事情 , 不要去做哪些事情 。 然后另外一点就是比如

说一些 , 呃 , 这个外部的 contributor, 呃 , 或多或少可能会缺少的一部分的这个 context。 所以说我们现在在 , 在去维护这样的一个开源项目的时候 , 也会去和很多的外部的这个 contributor 去对齐这部分 context, 对吧 。 这个是我们的一些经验 。

何涛20:48

佳圆分享得很好 。 然后我这里先说一个暴论啊 , 就是 Vibe Coding 从来没有人说是 Vibe Engineering, 但是写代码从来都是一个 engineering 工作 , 而不只是一个 coding 工作 。 所以我特别讨厌别人说你是一个码农 , 应该说你是一个软件工程师 , 因为你的职责是把它变成一个工程的东西 。Engineering 的定义从来不是一个一次性交付的产品 , 而是一个可以长期交付且持续有

生命力的东西 。 所以这也是为什么就是现在的 , 其实我觉得可能对 IO、 对模型的同学也有一样 , 就现在的 bench 不得从 SWE 或 SWE 的 Pro 来看 , 它都是一次性去解决一个问题 。 模型很容易会变成在 coding 任务上使命必达 。 你会发现 , 比如说我怎么样 , 我一定要使命必达 , 就像一个就是非常努力的人一样 , 但最后他可能他努力了很久之后

, 最后 OK, 你高赞 , 呃 ,OK,just so so。 还有一点就是你们发现他这个东西 , 你后面接着 , 你接着它做根本做不了 。 所以我觉得从 coding 领域的话 , 其实从 bench 上的话 , 它是可以做很多工作 , 就怎么样去定义一个 , 就是说 agent 它能够明白 , 就在长程性的任务上怎么样去持续维护一个 code base, 把它变更好 。 其实这就有点像是把人的这样一些除了写

一次性 , 完成一次性这种 , 还有长期维护一个项目的一个 taste, 把它给放到模型里面去 , 我觉得这是对模型的一个要求了 。 还有一个就是我觉得是对人的要求 , 因为这一代的模型太有魅力 , 太有诱惑力 , 以至于会让你就是说陷入到一个极端 , 就是我觉得它是个魔法棒 , 我跟它说什么它应该是无所不能 , 然后它犯了个错 ,OK, 我

再跟它说一句 , 它就好了 。 然后你就会发现 , 它总会在以一种相对来说比较讨巧的形式 , 哦 , 对不起 , 那我可以改正 。 有可能其实你就是有偏见 , 人家可能是对的 , 它对会做 , 佳圆那么使命必达 。 在 , 所以在这个时候其实需要一 , 一个人还是带有古早的 , 呃 , 我这时候 , 我这时候再推荐一本书 , 叫 Clean Code。 这本书里面就讲

, 就是代码的整洁之道 , 很多时候是被先哲们已经全都列举出来了 , 所以这时候我觉得需要人多做一些工作 。 呃 , 可能我们已经没有办法人力 review, 但我觉得我做过的一些事情 , 就是我会把这些先哲的东西全都蒸馏成一些 skill, 或者说像 Google 的 best practice,Amazon 的 best practice 或怎么样 , 然后配合你的 agent, 给到 agent 更多你的 context, 还有就是你的一些偏好 。 就其

实每个人写出来代码很多时候跟他性格都挺像的 。 呃 , 而且还有就是我现在特别讨厌一个人说一句 , 啊 , 这个东西是 agent 做的 , 所以你不要怪我 。 就这个东西 , 它只要是拿你的账号来提交上来的东西 , 它用的应该就是你的 credits, 它背后表达的是你的责任心 , 还有你对待这个世界的态度 。 所以我觉得就是首先我们需要 take it seriously, 还

有以及把这个东西当成一个工程学去持续地去迭代 , 这个东西才变好 。 我觉得都会有一个阶段吧 , 就比如说我们当年很多时候都觉得有电了之后什么事情都能解决 , 然后发现其实它中间还是经历很多的过程 。 所以我觉得还是我们的 mindset, 还有我们要有更多的耐心 , 以及要把这个东西变成一个就是说新的一个工具来看待 , 而

不是说一个魔法棒来看待 , 就从这个 mindset 上的转变才能慢慢地去根治这些问题 。 谢谢 。

Koji杨远骋24:08

这还有这个 , 嗯 。

诶 , 我也好奇 , 有在 MiniMax 那一波 , 你们现在在开 AI Coding, 然后你们开始在用 AI Tool 去 , 去模型吗 ?

何涛24:21

阿导 , 阿导 , 阿导 , 阿导被 cue 到了 。

Guest24:26

对 , 就是发布会到一个很高的这样的一个速度 。 所以包括最近去阿里分享 , 因为他们是有规避大公司的 , 可能是几百个微服务 , 就是相对体量 , 他们的感受就是 , 呃 , 他把几几十个仓库放在一起 , 对吧 ? 因为以前可能一个人只能改一个仓库 , 现在是一个人开一下十几个仓库 , 提了一个 PR, 然后结果就是说看起来好像对 ,

但没有人敢相信 。 QA 也测不动 , 功能实现是快有很多 , 但是实际上它的验证是没有跟上 。 对吧 , 我记得我最早在刚开始带团队的时候 , 可能他们提交的每一行代码我都会 review, 就这个项目必须要 follow 我的 pace, 就是必须要足够简洁 , 然后结构足够清晰 , 就非常有强迫症 。 我是属于那种看代码能给他 , 能把他的 bug 基本看出来 , 否则

我就不做这个 review。 然后后来是那肯定看不过来了 , 我就做架构的 review, 对吧 ? 但今天在 Web Coding, 其实我们这种 review 是缺失的 。

Koji杨远骋25:24

嗯 。

Guest25:24

说换句话说 , 就是生产的能力在极大提升 , 包括我们 harness 也是奔着生产去的 , 训练也是奔着生产去的 。 但在验证和交付 , 在 review 这方面的 , 无论是 harness 还是模型 , 其实做的都是不够 。 所以我的观点 , 包括我和他们交流的就是说 , 呃 , 我们应该在验证上面投入甚至和研 , 研发生产接近的这样的能力 , 当项目达到一个足够巨大的

之后 , 否则这个项目就会 , 呃 , 大概其实 , 呃 , 我相信大家应该都有过这样的感受 , 大概在去年的 Cloud 的 4.0,Open 4.5 出来的时候 , 一个项目大概到几千行代码就崩溃了 , 去完 coding。 但今天它可以达到 , 呃 , 几十 、 十几万行 , 对吧 ?

Koji杨远骋26:09

嗯 。

Guest26:09

但它终究会崩溃 。

Koji杨远骋26:10

嗯 。

Guest26:11

因为 , 因为我觉得它还是缺失 , 就是 , 就或者这么说 , 它的 context 是有限的 。 另外一方面就是我觉得这种 , 这种人类的直觉还是尚好 , 有点难替代 。

Koji杨远骋26:24

对 。

Guest26:25

对 , 这是我的一个观点吧 。 就我们 , 我们确实是在用 Web Coding 来开发 , 比如说我们的那个训练 post-training 那个系统 , 就有点像 Multica, 就他们 , 他们会提一个 issue 上去 , 然后这 issue 会一个阶段 , 一个阶段 , 一个阶段地走 , 然后最后把那个给搞定 , 他们也会遇到类似的问题 。 啊 , 然后我们也在这种相似方式去解 , 这解决方案有很多啊 , 就是说你

有 , 呃 , 测试上的 replay, 你有 benchmark, 你有其他东西可以去验证 , 但还有很大量 , 就刚才 Paul 说到 , 就是你要为这个项 , 项目去建立它的 baseline, 什么东西是做 , 什么东西不做的 , 什么东西是违反这个 rule 的 , 好 , 然后这点还要让 agent 能够去实现 , 因为人是看不过来 。

Koji杨远骋27:08

谢谢 。

然后 , 呃 , 就刚才这个 IO 在分享的时候 , 其实有提到关于数据的一个问题 , 我们都知道 MiniMax 之前 , 呃 , 上个月吧 , 做了那个时差的项目 , 刚才 IO 分享的时候有提到说 , 诶去年这个时候可能我们对数据的理解就是数据标注 , 呃 , 然后现在是希望这个找专家阿戈来带路 , 那可不可以分享一下这个中间的转变它是怎么发生的 ?

数据观27:13

闫俊杰27:36

对 , 其实我觉得这个事是这样 , 这个事它的实质上是说 , 呃 , 一个比较根源的东西是说我们在想 , 其实就刚才说的 , 就是 , 就是 AI 的核心其实是生产力 , 然后生产力这个事儿呢 , 就是模型在里面的作用还是本质上就是提供工具嘛 , 就跟比如发明汽车是一样 , 它可能就是让赶路的时间变得更快了 。AI 的话就让大家思考的过

程跟做验证的过程变得更快了 , 它的实质还是那个行业里面本身的真实的问题 。 然后这个事情的话 , 很显然是说光靠模型或者光靠 researcher 其实是做不到的 。 其实这个事实际上我在做 coding 的时候就已经遇到了 , 比如说我们去年在做 coding 的时候发现是说 , 比如说对 coding 的理解 , 比如说开发工程师显然是比算法同学更理解什么叫好的 coding。

对 , 然后呢 , 所以说在那个时候我们就开始意识到是说这个 , 呃 , 比如说决定 coding 好坏的东西 , 它实际上是算法同学来做出来这样一个模型依赖的框架 , 但是它的这个 , 就是 , 这个 , 就是它的如何来做评测 , 如何来做归类 , 然后呢 , 这个是包括如何来构造这些场景下的环境 , 这些事情其实真正的软件工程师其实是实际上

是能够做得更好的 。 并且这个事在我们内部其实也已经发生了 , 只是说呢 , 就是像之前的话 , 在做 coding 的时候只需要两个角色 , 就是 researcher 跟 engineer, 然后并且 engineer 在里面其实决定了最关键的这个评测跟 test。 然后在做更多的领域里面呢 , 其实就发现就需要三个角色 , 它就需要算法 、 开发的工程师 , 以及还需要那个真正的专家 , 他其实是

变成了多一个角色 。 那既然我们把两个角色合作给走通了 , 那我们现在就在里面再加个角色 , 然后其实逻辑就是这样的 。 然后呢 , 并且呢是说这 - 这 - 这是第一个触动 , 就是 , 就是从我自己的推演 。 然后其实还有从第二个 , 就是说 , 比如说我们很仔细地研究了一下 , 就是说 Anthropic 他们是怎么来招人的 , 其实你可以发现的是

说他们公司有大量的非 researcher 跟 engineer 的人 , 他们公司有很多经济学家 。

Koji杨远骋29:39

然后呢 ? 还有心理学家 。

闫俊杰29:40

他们甚至还有 , 还有核物理学家 。

Koji杨远骋29:42

还有哲学家 。

闫俊杰29:44

对 , 他们为什么需要有核物理学家呢 ? 因为他们每次做对齐的时候都会来测试说 , 越狱的时候会测这个东西能不能用 , 被用来制作核武器 。

Koji杨远骋29:54

现在有哪些这个类似的这样的特殊专家角色呢 ?

闫俊杰29:57

坦白说 , 在半年前我们是不意识到为什么需要有这么多这些人的 , 我们现在其实对这事的理解其实已经非常深 , 我们真的是需要这些人跟我们在 , 就是在一起 。 然后呢 , 就是说我们那个天眼项目其实也是有很多 , 呃 , 非常好的同学在跟我们沟通啊 , 其实也吸引到了一些包括在座的一些人 , 我觉得我们接下来在几个领域

里面

张佳圆30:18

其实都会有些这样的人 , 呃 , 包括在网安全里面 , 包括在金融里面 , 法律啊什么之类的 。 就是我觉得我在这块接下来的这个 , 呃 , 做的深度应该会比现在会深很多 。

Koji杨远骋30:30

好 , 谢谢 。 我最后一个问题 , 其实我最想问的呢 , 就是这个 , 呃 , 每个人推荐一个个股 。 但是要知道这个问题可能等不到答案 。 对 , 所以这个 , 呃 , 一个替代问题就是说这个 2026 年还剩半年 , 有什么事情是你们认为在接下来半年你们自己最想 all in 的 ? 可以回答这个问题 , 也可以回答推荐个股的问题 。

未来下注30:30

虞扬30:55

那咱就不推荐个股了 。

啊其实我 , 我想说的是两件事情 , 现在我们 AI 和大模型在我们应用场景当中 , 什么东西是以前的东西可能替代不了的 , 我觉得有一点是什么 ? 是陪伴 。 极大多数人或者说他们都有陪伴需求 , 包括像我们自己的这个领域上也是 , 一定有赚了钱的时候 , 也就一定有亏了钱的时候 , 而且很有可能对于很多人来说 , 他们亏钱的

时候可能就更加多一点 。 所以说我觉得这是一个是陪伴 。 第二个就是 , 呃 , 我们现在自己在做金融的一个场景上来说 , 最初期我们做 agent 的时候是我们限制模型发挥 , 我们要不让它去做很多奇怪的事情 。 那等到 agent 进步了以后 , 最近的事情就是我们要去引领模型 , 能够让它去思考 , 能够让它去做一些创造性的事情 , 然后帮

我们做完很多东西 。 这是我觉得是今年可能两个比较大的目标 。

何涛31:45

刚刚严总跟阿岛其实都透露很多 , 所以推荐的个股我觉得大家应该都 , 都懂吧 , 所以我就不说了 。 对对对 。 然后我就讲一下 , 其实我个人平常会写一个专栏叫做 How AI Shapes Our Society, 就 AI 怎么改变我们的社会 。 我其实有一个非常直观的感觉 , 就是 AI 其实在让很多人变得内耗 , 变得焦虑 。 因为我有一个切实的体会 , 就是国内的模型

在 , 呃 ,somehow 可能在二六年的时候跨过了某一个基点 , 它其实已经具备了走进千家万户的机会 , 就不管是 MiniMax 的 M3 模型 , 还是国产之光的 DeepSeek, 哦 , 这里还是说一下吧 。 对对对 , 那个其实都已经跨过了某一个基点 , 但 MiniMax 模型这一次在多模态上 , 其实它相当于就有了眼睛 , 也可以做更多的事情 。 我可以分享一个我个人的案例啊 , 就

是 , 呃 , 我老婆有段时间很焦虑 , 她掉头发 , 所以她总去看中医 。 然后她去问了国内 DAU 最大的某 chatbot 的 , 呃 , 产品 , 不举它的名字 , 然后她就跟它说了好多 , 说了之后呢 , 然后她觉得缓解了焦虑 , 觉得那个方法让她头发掉得更多了 , 然后她就变得更焦虑了 。 然后她就开始跟我说 , 你们这个行业害人害己 , 最后还害到了你

老公这句话 。 我就觉得我得给她吃点好的 , 我就给她建了一个属于她的 LLM 的 Wiki, 呃 , 这个可能术语有点专业 , 就是一个属于她个人的一个 Wiki, 然后我把 , 我用 Codex 把她所有的体检报告 、 单据 、 做的检查 、 吃过的所有的药 , 甚至包括那个 chatbot 和她聊的聊天记录 , 我全都导进去 , 然后我就把 Codex 接到了她的 Facebook 里边 , 我让她去用 。 我就

跟她说 , 以后你不要用那个 chatbot, 你就用我给你做这个相见你老公 。 我就说 , 你可以问它怎么样下一次去看医生的时候我可以问什么问题 , 甚至医生问题给你录下来之后问它 , 然后让它直接反问医生 。 她就按照我这个去做 , 后来发现她跟医生的沟通也更顺畅 。 所以我就感觉到就是说 , 其实我们普通人 , 每个人都是有机会能

够用 AI 让家人 , 让身边人 , 让更多的东西变得更好 , 只要我们愿意 。 我觉得这也是我们用 Web coding 不是用来去替代人 , 或者说去替代一些工种 , 让人失业 , 而是更多让大家很好的 idea 跟想法能够绽放出来 , 而且让身边原来觉得和离这个很远的人能感到一种温暖吧 。 其实我觉得这其实就是从冰冷的软件工程里面 , 到最后能发扬

出来 , 就是一种人类社会的温暖 , 我觉得最后是要回归到这里 。 谢谢 。

张佳圆34:23

我覺得何涛分享的那个就非 , 非常好 , 包括说首先我 , 我其实跟阿岛一样 , 我 , 我也不投资 。 对 , 我 , 我只投资我自己和我自己的公司 。 所以 , 所以说个股的建议我也 , 呃 , 给不出来 。 呃 , 然后就下半年要 all in 的点 , 呃 , 我 , 我不能说是要 all in 吧 , 就但 , 但是可以说是我 , 我想要去探索的几个事情 。 其实我是一个 AI 将

领派 , 我是认定这个 AI 的能力发展到后面一定会比人 , 人来得强烈 , 而且这个 , 这个是在 , 是在我过去几年的这个比较深度地去和 AI 的这个协作过程中越来越发现 , 你未来已经不是在和人去竞争 , 而是在和 agent 去竞争 , 或者是在和 AI 去竞争 , 你的智能其实是没有办法去和 AI 去做一个抗智的 。 在 , 在这样的一个情况下 , 呃

, 就像刚刚提到的这个社会该是一个什么 , 什么样的 , 我觉得这个可能是一个值得我们去思考的一个点 , 因为人都是有惰性思维的 , 有了 AI 之后 , 大家都喜欢把事情都交给 AI 来去做 , 把自己的思考外包给 AI。 那我现在一个做法是我 , 我可能会去和 AI 去 , 呃 , 去 , 去做一个这个探索 , 但是我会把思考这个最重要的部分都交

给我自己 。

Koji杨远骋35:35

好 , 谢谢 。 好 , 那阿 IO 来压轴 。 所以你是将领派吗 ?

虞扬35:42

我 , 我觉得是这样的 , 然后我觉得首先现在的 AI 其实是一个本质上它是一个黑盒的 , 即使我们自己作为从业者 , 我们也不知道它一年之后会怎么样 , 就只是知道它会进步 。 并且我们也坦白说 , 其实也不太理解 , 就是比如说为什么会有 screening, 为什么会有各种各样的东西 。 坦白来说 , 我 , 我 , 我认为单靠人类也很难理解这件事

儿 , 因为现有的数学工具其实也是不太够的 。 呃 , 因为其实 , 其实我很早之前 , 大概在十年前 , 十年前我在读博士的时候就看过一篇论文 , 大概意思就是一个超过三层的神经网络 , 用现有的数学工具其实就也没法分析它的收敛性 , 但是这个行业还在进步 。 对 。 然后呢 , 就是说 , 呃 , 我觉得就是说虽然 AI 越来越强 , 我觉

得我特别关心的一件事儿是 , 也不是 , 这个可能不是 all in 啊 , 就是我自己特别关心的一件事儿是说 , 就是什么时候是不是能够 AI 能够帮助人家理解 AI。 我觉得这是一个非常本质的事儿 , 因为只有这样的话 , 各种比如说对 , 比如说 AI 会不会它的安全的问题 , 比如说 AI 到底能够走多久 , 这些事儿我觉得可能才会有一个答案 。

Koji杨远骋36:45

现在有看到什么信号吗 ?

虞扬36:47

呃 , 其实这样吧 , 就比如说 , 呃 , 我其实看过很多这个 , 这个生命科学的论文 , 就现在的话 , 其实大家越来越发现是这样 , 比如说就是大脑跟这个神经网络之间其实有很强的相关性的 , 这真的是这样 。 就是说 , 比如说就是大脑里面显然是大脑肯定不会算矩阵乘对吧 ? 但 , 但是大脑里面其实是有一些模块 , 其实是类似会

有这种 , 比如说 , 呃 , 会有类似这种矩阵的这样的 , 这样的 , 这样的一些概念 , 并且大脑里面也有机体 , 其实是几乎可以等价成一个 , 呃 , 呃 , 梯度这个反应残酷 。 然后呢 , 并且大脑里面其实它的这个有点像那个 , 呃 , transformer, 比如说汉堡体 , 汉堡体的话其实会有一些记忆 , 其实它跟那个 , 跟那个 DeepSeek 那个上次他们那个 , 那个

, 那个记忆的那个东西其实是很像 。 我觉得就是说这个 , 就是比如说在一年前我们不太理解 , 比如说安全这个非常 , 非常重要 , 现在的话我觉得我们可能就是不太理解 , 就是为什么可解释性是个很重要的事儿 。 但是我觉得现在其实越来越知道它的重要性了 , 我觉得 , 并且我觉得这个事儿 AI 方面应该是能帮大家做的 , 就

是 AI 本身的可解释性 , 也得需要靠 AI 一起帮助人去理解 。

Koji杨远骋37:57

好 。OK, 好 , 那我们今天谢谢大家的时间 。 好 , 谢谢 。