KOKoji杨远骋Apr 22, 2026· 31:17

【十字路口】「1 亿 TOKEN 俱乐部」挤爆了,AI 的燃料不够了|对谈于文渊:阿里云百炼技术负责人【视频播客】

阿里云百炼技术负责人于文渊与主持人Koji探讨了Token消耗激增、算力饥渴背后的工程挑战。他直言1亿Token俱乐部门槛已不够高,GPU一秒不能闲,并批评自建GPU是低估复杂性,强调MaaS在成本、安全与灵活性上优于自建。他警告不要用AI写太多代码,认为文生代码的vibe coding适用于原型但非生产环境,而内核工程师反而最易被AI替代。未来Agent和AI生成将成为最大Token消耗场景。

  1. 0:00快问快答
  2. 1:09Token核爆与云变
  3. 3:56算力饥渴
  4. 6:181亿Token与场景
  5. 9:50MaaS差异
  6. 11:48自建迷思
  7. 14:39AI与编程教育
  8. 21:41AI替代谁
  9. 23:28芯片与预测
  10. 27:25MaaS终局
  11. 30:55结束语

Transcript

快问快答0:00

Koji杨远骋0:00

嗨 , 我是 Koji。 那伴随着 Claude Code 和 OpenClaw 最近的爆炸性的流行啊 , 我们看到全世界好像都在惊叹 , 哇 ,Token 不够用了 , 觉得这个 Token 不够用 , 它只是一个结果 , 不够用的还是更高性价比的算力 。 未来我们能不能像用水 、 电 、 煤一样稳定地用 AI, 会决定最后人类智能的上限 。 那阿里云百炼呢 , 也是中国这个最大的 SaaS 服务商之一 。 那因此呢 ,

我们今天就请到了文渊 , 阿里云百炼的研发负责人 。 你好 , 文渊 , 欢迎来到十字路口 , 和大家打个招呼 。

于文渊0:32

Hi, 我是文渊 , 我来自阿里云百炼 , 啊 。

Koji杨远骋0:36

好 。

于文渊0:36

非常感谢 Koji 的邀请 。

Koji杨远骋0:38

好 , 那我们还是从快问快答开始哈 , 我们的一个老传统 , 让大家了解你 。

于文渊0:42

好的 。

Koji杨远骋0:42

请问文渊你的年龄 。

于文渊0:43

啊 , 我今年三十九岁 。

Koji杨远骋0:45

嗯 , 然后你毕业的院校 。

于文渊0:47

我本科毕业于北京大学 , 博士毕业于英国的爱丁堡大学 。

Koji杨远骋0:51

MBTI 和星座 。

于文渊0:52

呃 , 我是 INTP 啊 , 双鱼座 。

Koji杨远骋0:56

文渊在负责百炼之前在做什么 ?

于文渊0:58

2018 年我做了一个小公司 , 被收购进了阿里 , 当时是在做图计算 , 后面一直呢 , 都是在达摩院和统一实验室做一些呃 , 系统方面的研究 。

Token核爆与云变1:09

Koji杨远骋1:09

就最近两个月哈 , 我们看到 Claude Code 和 OpenClaw 席卷全球 , 这个对你们的工作带来了哪些影响 ?

于文渊1:16

就是 Token 数的迅速地增长 , 基本上按月要翻倍的一个速度在增长 , 而且都是非常非常高质量的 Token, 都是非常非常 sort 的 training 模型的增长 。 大家已经不再把 AI 当做一个 chatbot 或者是闲聊场景 , 大家把它融入到生产力的场景 , 这是非常非常夸张的 Token 的消耗的地方 。 然后现在仅仅是一个开始 , 我们相信这个增速会迅速迅速地达到一个非常

夸张的程度 。

Koji杨远骋1:46

现在仅仅是一个开始 。

于文渊1:47

现在是一个开始 , 嗯 。

Koji杨远骋1:49

一方面是 Claude Code, 一方面是 OpenClaw, 就是让 Token 燃烧突然这个核弹级的爆发 , 然后全球都在缺算力 , 背后的原因有别的吗 ?

于文渊1:59

今天其实 AI 在非常深刻地改变大家在怎么去使用算力 。 我非常非常难预测短期内下一个爆发的这种场景是什么 。 我非常笃定地可以说 , 比如说三五年 , 有非常非常多的人力所花的解决的事情 , 都一定是会用 AI 完成 。 第二个就是云计算 , 今天云计算的数据中心长什么样子 , 调度系统长什么样子 , 大家在用 , 怎么去消耗云

计算 、 存储 、 网络 , 怎么去用 , 基本上三五年后会和今天完全完全不一样 。

Koji杨远骋2:41

所以你说云计算的范式也会发生天翻地覆的变化 。

于文渊2:44

会发生天翻地覆 。

Koji杨远骋2:45

云梦会重新洗牌吗 ?

于文渊2:47

已经又再有一些洗牌的这个趋势了 。 什么叫做一个好用的云 , 其实在今天也在变化 , 为什么会有蓬勃而出的新云 ? 那未来的云是什么样子 ? 我们的现在是发展在一个十字路口的位置 。

Koji杨远骋3:03

因为其实有很长一段时间 , 大家会认为这个全世界的云厂商的格局几乎就定了嘛 , 就那么几个中国的巨头 , 美国的巨头定下来了 。 但是最近我们这些 Neo Cloud 出现 , 你会认为这个是一个昙花一现 , 最终还是云巨头会就拿下这个战场 , 还是这些新的创业公司 , 或者就是他们也不能那么创业了嘛 ,Cloudflare 还是有规模了 , 就这些新的公

司 , 你觉得他们有机会跻身到一线的巨头的行列吗 ?

于文渊3:31

这个我很难判断 , 但我觉得因为每个云厂商自己也会在变革 , 证明自己 。 阿里云是中国最大的一个云计算的厂商 , 我们这个云的用户是不是未来都不是真人 , 是 agent,agent 用云 , 他们需要什么样的计算 、 存储 、 网络 , 什么样的数据库 , 什么样的算力 , 怎么样去满足所有的的厂商都在迎接变革 。

Koji杨远骋3:56

阿里云全世界非常重要的云厂商之一 , 你最关注的事情有哪些 ?

算力饥渴3:56

于文渊4:01

我们第一关注的肯定还是稳定性 , 安全当然也是非常重要 , 但是我这里做的变化就是白天级别 , 我们就能看到用户量的巨大的增长 ,Token 量的巨大增长 , 算力需求的巨大增长 。 我们千问 3.5 出炉当天发布 , 两个星期的时间 , 它的峰值 tokens per minute 已经跃升到我们历史上所有的文本模型没有见到的高度 。 我们有一个最激进的对算力投

入的 CEO 啊 , 依然我觉得还是不够用 。 对 , 因为我们还有很大的模型研发 , 我们还有很多的这个客户的服务 , 我们 Token 数增长依然是不够用 。

Koji杨远骋4:40

就这个爆炸性的增长 , 它是在一个什么样的时间节点开始的 ?

于文渊4:45

我感觉就没有停下来过 , 从百炼的上线的第一天 。

Koji杨远骋4:49

所以你没有觉得这个 OpenClaw 或 Claude Code 有加速这样的增长吗 ?

于文渊4:53

有加速这个增长 , 那是在 agent 的场景下是绝对的加速 。 但是在我们历史的看来 , 我们有很多很多个 , 比如说视频的生成模型 , 一个模型跨过一个门槛 , 它从 demo 到 , 哇 , 真实市场可用 , 迅速地带来一波一波这样的增长 。

Koji杨远骋5:13

那在这样剧烈的变化里面 , 要去追求稳定 , 是不是很难啊 ?

于文渊5:19

很难 , 对 。 我们在稳定的前提 , 我们也非常希望说我们把算力很好地利用起来 。 除了安全 、 稳定性这个以外 , 这个面对这么快速的增长 , 我们还有一个巨大的限制 , 限制就是 GPU 的供给是非常有限 , 很多的算法团队都在抢 , 说我需要这个 GPU 来做训练 , 我希望这个场景用更强的模型 , 需要有更好的服务质量 。 那么在这中间

有非常非常大的系统和工程的挑战 , 我们有一个非常非常重要的使命 , 就是让每一个 GPU 不要有一秒钟闲下来 , 让它发挥最大的作用 。 一千卡 、 一万卡 、 十万卡 、 一百万卡 , 希望把阿里云的所有的 GPU 的算力资源 , 让我们的所有的用户都能享受到极致的弹性 , 极致的稳定性 , 它们看起来都是有一个中国最大的算力集群 。

Koji杨远骋6:14

嗯 。

于文渊6:14

可以用一个 API 调用就可以使用 。

Koji杨远骋6:18

嗯 。 哎 , 最近我们还看到有一个微信群哈 , 叫做这个 1 亿 Token 俱乐部 , 就是你要一天烧掉 1 亿 Token 才有资格进这个微信群 。 在钱采的时候其实你有提到说关注数量 , 呃 , 没有那么重要吧 , 应该同时也关注质量 , 这个可不可以也展开讲一讲 ?

1亿Token与场景6:18

于文渊6:35

其实 Token 有一点点误导性 , 像一个 0.6B 的小模型或者 in banning 的小模型的一个 Token, 和一个会深度思考的大模型今天烧它的模型 , 它的 Token 其实是不管从算力 、 智能和水平上可能都是不等价的 。OpenClaw 的这波 , 然后其实 , 呃 , 这个大家会发现 , 每次大家用的都是非常烧它的开源模型或者是闭源模型 。

Koji杨远骋7:01

在百炼里面看到每天烧掉 1 亿 Token 的这个用户大概有多少人啊 ?

于文渊7:06

我们感觉现在每天都在增加 , 数以万计的人每天都在增加 , 所以你们的这个 1 亿 Token 俱乐部可能 , 可能门槛要再提高一点了 , 对 。

Koji杨远骋7:18

变成十亿 Token 俱乐部 。

于文渊7:19

对 , 我觉得十亿 Token 俱乐部 , 因为我们的这个 coding plan 的用户 , 就是重度的个人在消耗 Token,1 亿已经不是一个很大的门槛 。

Koji杨远骋7:27

那除了 Token, 你们还关心些什么 ?

于文渊7:30

哦 , 我们关心峰值是一个什么样的调用量 , 我怎么样去做技术上的消峰填谷 , 怎么去做好的调度 , 把 GPU 充分地利用起来 , 我们也希望有更多的用户进来 , 然后有更好的服务质量 , 包括首包延时和生成速度 。

Koji杨远骋7:47

那我在想 , 让 GPU 物尽其用 , 是不是还有一个点 , 就是说让它二十四小时都跑 , 因此做国际化 , 就可能中国的白天中国人用 , 对吧 , 然后欧洲的白天欧洲人用 , 所以这个会有这样的考虑吗 ?

于文渊7:59

对 , 这个 Token 出海其实一定是一个我觉得非常非常重要的事情 , 对 , 这里边我们也在刚刚起步吧 , 就是对于阿里云来说 , 我们非常拥抱国际化 , 我们希望做好国际化 , 但是国内和国际的业务的发展不在同样的一个速度 , 因为可能如果稍微慢两个月 , 你可以发现 , 哇 , 你这实际上只占百分之个位数 , 这个相比我大盘 , 但是

这两个速度其实今天非常非常难去挤透并进 。

Koji杨远骋8:27

嗯 。

于文渊8:27

但我很相信最终的中台一定是国际国内都要用 。

Koji杨远骋8:33

嗯 。

于文渊8:33

呃 , 当然这里面有非常多的问题需要克服 , 地缘政治的问题啊 , 这个合规的问题啊等等 。 但从整体来说 , 今天的阿里云 、 中国厂商的 AI 出海 , 我觉得是一个非常大智所趋且停不下来的一个方向 。

Koji杨远骋8:48

嗯 。 其实在百炼我感觉你们是不是可以开一种上帝视角呀 , 就是你能看到今天 , 比如说什么赛道 、 什么领域 、 什么场景用的 Token 是最多的 , 这里有没有一些你观察到的也可以分享的故事 , 比如说一个人他在什么场景下用了大量的 Token 去干一个什么样的事情 。

于文渊9:06

某个水饮的这个厂商 , 他的经销商群里可能会建一些机器人 , 经销商要补货 , 就直接对那个机器人说什么什么多少多少箱 , 这里要深入地理解到这里面是什么饮料 , 他以前买的啥 , 什么水饮 , 直接就给他去补货了 , 就是用非常自然语言的方式在一个群里 。

Koji杨远骋9:25

但其实听起来这个好像也是更自然的 , 不用再去学一个什么系统 , 我就像和一个真的人在说话一样说我的需求嘛 。

于文渊9:33

嗯 。

Koji杨远骋9:33

所以会不会这就是一个这个更自然而然的未来 ?

于文渊9:37

对 , 这个肯定是一个自然而然的未来 , 因为这个当大模型 , 其实它真的是去替代一个人 , 未来整个的行业很多的角色都可能会深远地被大模型去影响 。

Koji杨远骋9:48

今天所有的这个云服务厂商 ——

MaaS差异9:50

于文渊9:50

嗯 。

Koji杨远骋9:50

都推出了自己的 Maas 服务 , 然后在外界看来好像大家都长得差不多 , 但是我相信可能还是从内行来看有差异化 。

于文渊10:01

嗯 。

Koji杨远骋10:01

那可不可以请你给我们讲一讲 , 就是大家的差异化会主要体现在哪些方面 ? 然后这里面会不会有一个你认为的 , 比如说制胜的差异点 ?

于文渊10:10

我其实是一个比较 hands on 的 , 就是 hands dirty club, 我还是需要能把 hands 搞 dirty 的一个工程师啊 。 一个公司它的基础设施做得好不好 , 技术做得好不好 , 其实很影响这个我们做的这个产品好不好 。 阿里云本身是有在国内做 infrastructure 做得非常久 , 积累很多 , 不管是产品线的广泛 , 还有一个规模 , 还有这个技术的厚度 。 与此同时呢 , 我们还有一个

同一实验室的兄弟伙伴呢 , 给我们提供好的模型 , 这个模型不是一个黑盒的模型 , 是背靠背地一起在做 , 模型的上线前不停地在摸 。 我们也有一个好的芯片团队 , 这个平头哥 , 我在内部从 CPU 时代开始 , 其实用了很多的平头哥的芯片 , 我觉得开发体验也非常非常地好 , 效率也非常非常地好 。 所以这是一个很独特的感觉 ,

从我们提供的模型和使用的 infrastructure, 我们的算力的资源的规模和我们自研的这套东西是可以端到端做大模的 。

Koji杨远骋11:08

可以具体讲一讲 , 比如说在百炼去调调问模型和我在别的平台去调教问模型 , 你们有那些独特的优势吗 ?

于文渊11:16

客户反馈我还听到非常多的 , 就是说为什么我部署的千问模型的效果或者质量或者速度 , 啊 , 没有百炼上的好 。 当然这个不只是千问模型 , 其实包括开源模型 , 因为我们这么多年是积累了比较多的精度体系 、 稳定性体系的一套的这个推理的服务的框架 , 我们可以比较自信地说 , 千问所有的模型的 model card 上的所有的分数 ,

在百炼的 API 一定可以做到 。

自建迷思11:48

Koji杨远骋11:48

其实今天也会有一些企业 , 尤其做到一定规模之后 , 他会觉得私有化部署 , 就自建是成本更低 , 那有没有任何一个情况你觉得企业还是应该考虑自建 ?

于文渊12:00

嗯 —— 好问题 , 你 , 你把我问倒了 。 我想想啊 。 我发表一个暴论 , 我不代表阿里云 , 我只代表阿里云百炼 , 我认为没有任何一个情况需要自建 。

Koji杨远骋12:12

嗯 。

于文渊12:12

真实的是这样子 。

Koji杨远骋12:14

这是不是也符合现在社会的发展规律 , 就是大家的分工越来越精细化 , 专业的人去做专业的事情 。

于文渊12:20

一方面我觉得肯定是这样 , 另一方面我觉得是大家低估了这个东西的复杂性和增长速度 。 客户他可能会自己采购一些 GPU, 我觉得无非就三个原因 , 啊 , 第一个原因 , 他觉得这个成本可控 , 就不管我用什么 , 我就这么多 GPU 了 , 我完全知道我未来几个月这些的成本花多少钱 , 然后我自己做好优化 , 这个成本很可控 。 第二个可

能是安全 , 模型是我自己的 , 数据是我自己的 , 呃 , 什么请求是我自己的 , 不要被别人看到 , 所以 API 不太放心 。

Koji杨远骋12:50

嗯 。

于文渊12:50

啊第三个 , 呃 , 可能大家还觉得这个 GPU 买来是很灵活的 , 我可以部署各种各样的模型 , 我的业务不管怎么调整 , 我只要是 NVIDIA 的卡可能什么都能干 , 对吧 ? 但我其实有一个暴论 , 就是这个恰恰相反 , 你这如果是抱着这个目的来说 , 也许用 Maas 才是 , 啊 , 能解决你这三个 concern 的最好的一件事情 。

Koji杨远骋13:12

就成本可控 , 然后安全和灵活 。

于文渊13:15

对 。

Koji杨远骋13:15

就反而你觉得 Maas 是可以更好地比自建满足这三个需求 。

于文渊13:19

首先第一点呢 , 就是这个成本本身 , 如果大家折到某一个模型的 per token 成本的话 , 它要解决几个问题 , 第一个就是在效果满足的情况下的推理优化 , 其实这个模型的变化也很快 , 算法的迭代也很快 。 我每个公司有一个 infer 的工程师去保证他的这个 token 的推理优化是很难的 。 第二个 , 这个业务场景 , 你是自己的 GPU, 你能不能把它

们都用好 ? 模型越来越多 , 服务质量和这个成本如何去平衡 , 都是非常非常复杂的系统问题 , 其实是很难啊解决的 。 第二个 , 从安全上来说 , 其实从作为一个云厂商 , 我们是绝对的可信 , 这是一个云厂商的这个操守 , 我们是看不到 , 也不会看用户的数据的 。 我们其实 , 呃 , 在推一种叫做 , 啊 , 机密推理的方式 , 我们看

不到你的模型文件 , 看不到你所有的请求 , 端到端的密钥在你手里 , 这个真的就是密码学的保障 。 第三个 , 我觉得从灵活性上 , 啊 , 这个 Maas 更有灵活 , 因为我们可以知道这个今天最大的确定性其实是不确定 , 明天的 AI 需要什么 , 明天的模型长什么样子 , 架构会有什么的变化 , 然后推理效率会变成什么样子 。

Koji杨远骋14:39

这里有一个插播的问题哈 。 你本科是计算机专业 , 对不对 ?

AI与编程教育14:39

于文渊14:42

是在对的 。

Koji杨远骋14:42

今天你的这个在计算机专业的学弟学妹们 , 然后首先你还建议大家去学计算机吗 ? 在本科 。 然后如果还建议的话 , 你认为大家学习的方式 、 方法会和当时你自己的那个年代有哪些不同 ?

于文渊14:57

我的建议是大家继续可以学计算机啊 。 之前有个老师 , 八十年代就是北大的计算机的 , 的本科生 , 他说他的老师跟他说 , 未来人有两种人 , 一种是被计算机使用的人 , 一种是使用计算机的人 。

Koji杨远骋15:11

准确啊 。

于文渊15:13

对 。

Koji杨远骋15:13

写晚点那篇文章 《 困在系统里的人 》 啊 。

于文渊15:16

对 。

Koji杨远骋15:17

对 。

于文渊15:17

对对对 , 就是要么被计算机使用 , 要么你去使用计算机 。 这个时候八十年代是一个 truth, 然后在二零零几年 , 我是零几年读大学 , 所以也是一个 truth, 我觉得今天还是一个 truth。 今天计算机专业的同学 , 不管未来 AI 可以解决什么问题 , 他实现的还是这件事情 , 就是这个物理世界的这些到底逻辑的电路板 、 硅片上的设计或者生产 , 这

里面 AI 或者自动化会发生越来越大的作用 , 但是我们不能不知道中间是如何发生的 。 第二件事儿 , 就是我觉得如果学弟学妹们怎么去用 AI, 我的建议 , 学弟学妹们一定不要用 AI 帮你写太多的代码 , 这个是我觉得可能有点反直觉的 , 因为我 , 我其实前两天看到了一个 , 呃 , 张文宏的访谈 , 这个说是医生到底应该怎么用 AI, 他

就说的一件事是 , 是如果已经非常资深的医生用 AI 是肯定可以的 。 如果一个实习医生从见第一个病号开始 , 就直接丢过去给 AI,AI 告诉结果就看 , 他就会找不到 AI 的问题的 , 他没有这个经验的 build up, 没有这个好和坏 、 正确与否的判断 , 他只能相信 AI 可能做百分之九十九的正确性 , 那百分之一这个人是找不到其中的问题的 。 刚

刚迈入行的计算机专业的同学一定要避免自己成为那百分之九十九和 AI 高度重合 , 没有真正技能 difference 的 , 一定要还要成为能识别出 AI 做不到的那百分之一的那件事情的人 。

Koji杨远骋17:00

呃 , 这个确实还是挺有趣的 。 科思俊发一个数据说他们可能半年前去用 type type type 补全代码的人 , 就是无脑补全代码的人 , 可能只有百分之二三十 。

于文渊17:10

嗯 。

Koji杨远骋17:10

但是最近这个已经完全反过来了 , 哦 , 就是说用无脑补全代码的人已经变成了百分之七八十了 , 就这个趋势好像不可逆转 。 那比如说你能想到一个具体的例子是说 , 什么时候因为曾经手错代码 , 因此形成了自己的一些判断和审美 , 所以在遇到一个 AI 去解决某个问题的时候 , 你产生了不同的看法和见解 , 然后给它提了不

同的建议吗 ?

于文渊17:35

对这个其实 , 呃 , 其实我们日常非常多 , 就是大家做 code review 的时候 , 如果一看这是 AI 生成的代码 , 至少我做 code review 的时候会很慌 。 日常中我们做的工作 , 把这种 AI 的代码交进来又铲掉的 case 太多太多了 。 大家的 vibe coding 在生产 service 用中还是我感觉还是差这么一点点 , 就是当你真正压力一上 , 你会发现暴露问题 。 做一个 prototype, 这个 vibe coding 今

天的质量已经到那个点了 , 我觉得完全没有问题 。 生产可用的代码 , 你需要知道每一行它可以完成你想要的事情 。 同时它的副作用是你可接受的 , 不会产生内存泄露 , 不会占用更多的什么文件去比 。 大家做 AI 应该知道它的上下文 , 它对这个事情的深度理解程度远远 , 远远啊没有做到那里 。 所以我觉得 mission critical 的代码 , 暂时

AI 还是不行 , 但它一定能做你的效率工具 , 你不要说认为它全不行 , 但 , 但这个 judgment 特别特别地重要 , 因为所有东西进去之后再去产出的永远是一个非常 costly 的事情 , 它不是一个效率工具啊 , 它会让你处于一个石山中无法维护的代码中去做这个事情 。

Koji杨远骋18:47

在苦海中挣扎 。

于文渊18:48

对 , 对 , 对 。 相反 , 我觉得这个 spec coding 就是是我们认为比较好的一个方式 , 你需要写非常清晰的需求文档或者是规范 , 这个对架构师的要求非常非常的高 , 讲得很清楚 。 这个去年的 FOSS 有一篇很好的论文 , 一个顶级的存储的 , 的顶会 , 它让 AI 写这个文件系统 , 它把各种的 spec 就是来清晰地给 AI, 然后发现 32B 当时的模型 , 如果 spec

写得够清楚 , 它都可以把文件系统这种底层的高质量的东西写好 。 这个我觉得启发还是很大的 , 如果人是能把用一个偏形式化的逻辑中 , 把我想要的东西能描述清楚 ,AI 是肯定是把填空的事情做得很好 。 但我今天我不敢说我用两三个提示词 , 它就能把这件事做好 。 所以说我还是非常鼓励大家可以多尝试 AI, 但是前提是首先

自己能完成这个工作 , 才让 AI 去替代自己 。

Koji杨远骋19:49

因为现在有一些企业 , 他们还在很激进地讲说我们一定要把这个 AI 生成的代码提高到一定的比例 , 这当做一个目标去提 。

于文渊19:57

嗯 。

Koji杨远骋19:58

所以这个在你看来这是有点危险的一种提法吗 ?

于文渊20:02

我觉得是很危险的一种提法 。 对 , 因为大家如果但凡对今天的 AI 它的算法能力的限制有所了解的话 , 这个都是非常危险的提法 。 我们日常人和人之间的合作交流中 , 有很多的知识的传递 , 是一些非常隐式的 , 是非常过程性的 , 就是你没有办法非常明确地 、 直接地靠几句提示词就能讲清楚 。 很多的地方是可以这么做 , 可

以那么做 , 没有那么的绝对 , 但是它应该怎么做 , 可能和这家公司创始人风格是什么样子 , 这个产品本身的一些上下文历史很有关系 , 这些东西其实 AI 是 get 不到的 。

Koji杨远骋20:40

不要低估 AI 的能力 , 也不要高估 AI 的能力 。

于文渊20:43

绝对不要高估 AI 的能力 , 但我相信 AI 应该是个效率工具 。 今天我觉得更应该讲的是 , 人家一个 AI 可以完成它自己原来需要几个这样的工程师所要完成的事情 , 但不能是一个 AI 替代几个工程师 。

Koji杨远骋20:55

就是我最近在想一个事情 , 就是说这个过程知识是很重要的 , 就是说我觉得我们把一个东西做出来要三个要素 , 第一个要素生产要素 , 第二个是知识要素 , 第三个是过程要素 。 就比如说我们都在宜家买过家具 , 对吧 ? 那其实我买来生产要素 , 也买来了那个说明书 , 那就是知识要素 。 但是每次组装仍然很痛苦 。

于文渊21:15

对 。

Koji杨远骋21:15

就是这个过程 , 但你就发现 , 哎 , 找个师傅上面来 , 哐哐就装好了 。

于文渊21:19

是的 。

Koji杨远骋21:19

但其实他拥有的东西和你是一样的 , 但是他因为装过很多遍 , 他是过程熟练 。

于文渊21:24

对 , 对 , 对 。 所以我个人感觉程序员其实非常重要的一点是一定要把自己的能力点立在 AI 做不到的那个点上 。 如果它一定将来永远 , 永远到了百分之九十九点九 , 他自己的零点一还是要坚守住 。

没有办法 。

AI替代谁21:41

Koji杨远骋21:42

嗯 。

于文渊21:42

我觉得大家会发现这个 AI 事情都会很反直觉 。 我看到 AI 写文件系统那个事情 , 其实我的一个更好的直觉是 ,AI 可能真正能替代的那些人 , 也许是写最好的那些 , 就是比如说写操作系统内核 , 写数据库内核 , 写文件系统 , 这些可能是最容易被大批量地替换和替代的 。

Koji杨远骋22:03

哦 , 这个和很多人的想法可能是恰恰相反的 。

于文渊22:07

嗯 , 就是我觉得像前端工程师或者说和产品中 , 他的这个很多的逻辑不是 copy 或者什么 , 他需要的是有一个 knowhow 说我需要让 , 怎么让用户去把它用起来 。

Koji杨远骋22:18

明白 , 就是和人走得越近的东西 , 有可能越难被取代 。 但是系统工程师写文件系统 , 写操作系统 , 因为他是想办法要去物尽其用 ——

于文渊22:29

对 。

Koji杨远骋22:29

所以他反而更容易被取代 。

于文渊22:31

对 , 他越更容易被取代 , 而且他的代码质量很高 , 这个测试用例非常地清楚 , 结果非常清楚 , 比如说我就优化百分之多少 , 对吧 ? 就是我就像是一个非常精准的数学的形式化的问题 。 像 AI, 今天我们说数学竞赛做得非常好 , 编程竞赛做得非常好 , 就是因为这个问题都足够地清晰 , 可以定义它的结果 。

Koji杨远骋22:54

嗯 。

于文渊22:54

那我什么样叫做好的短视频 APP? 什么叫好 ? 这是没有什么清晰的 。

Koji杨远骋23:00

这是一个开放问题 。

于文渊23:01

非常开放 。

Koji杨远骋23:02

那你觉得 Maas 系统工程师是一个开放问题 , 还是一个封闭问题 ?

于文渊23:06

我其实觉得是一个开放问题 , 啊 , 在今天 , 因为 AI 的变化太快了 。

Koji杨远骋23:12

嗯 。

于文渊23:12

我不知道明天是什么 , 哦 , 在这种情况下 , 我的底层资源变化也很快 , 我的算力的情况也变化很快 。 在变化非常快的情况 , 它需要的是一个人的潜力 , 它不是说一个人的知识 , 就是他的应对变化的能力 。

芯片与预测23:28

Koji杨远骋23:28

我们其实今天在讲到这个中国的 AI 的时候 , 都会面临一个英伟达的供应或者断供 , 那在你看来 , 这个对我们的影响有多大呀 ?

于文渊23:37

我觉得影响很大啊 , 就非常非常大 。 今天我对国产算力或者说这个是非常非常有信心的 , 对吧 ? 就是它一定能非常好 。 但算力这个东西在今天的这个市场上 , 它有点像石油 , 它本质上不是说中国能不能产石油的问题 , 或者说中国有多少个油田的问题 , 是中国每天需要的石油和每天能供给的石油是不是匹配的问题 。 今天

其实我完全地相信中国能做自主 , 能做自主可控 , 我们自己有非常聪明的工程师和工业基础 , 大家一定能把这个技术这样的什么的就成为世界第一 , 这个是我完全 , 完全有信心的 。 但是今天这个油田在没开采的情况下 , 已经有非常多的下游的需求的时候 。

Koji杨远骋24:25

就高速公路上的车已经跑起来了 , 油还不够 。

于文渊24:28

对 , 算力如果供给会产生缺口 , 其实是很影响中国的 AI 的发展 。 这有很多国家一样 , 但是大家可能卡在了电力上 , 电力是工业的血液 , 这可能就一百年前就知道 , 但是不知道为什么今天现在供血不足了 , 对吧 ? 如果让我真实地讲 , 个人感觉还是需要有更多的 , 只要是能进来的这个算力供给 , 对中国一定是只有好处没有

坏处的 。

Koji杨远骋24:52

哎 , 那像国产的芯片 , 我知道平头哥 , 嗯 。 然后还有一些这个刚上市的芯片公司们 。

于文渊24:59

嗯 。

Koji杨远骋24:59

就是你觉得有哪些做得比较好呀 ?

于文渊25:01

平头哥做得非常好 , 啊 , 今天非常非常好 , 就是我真的是不能再说更好 。 英伟达我觉得大家都是事实标准 , 最早开始做 , 没有 AI 的时候就开始做 , 大家都已经认为它很好 , 然后有非常强的软件团队 、 硬件团队 、 设计 , 而且很多的东西都落地了 , 做得非常好 。 平头哥 , 我个人感觉我们的这个团队还非常 very generous, 我们用得最丝

滑 , 最好用 。

Koji杨远骋25:25

那比如说现在在资本市场上炒得非常热的摩尔线程 、 沐曦 , 他们怎么样啊 ?

于文渊25:31

我个人是没有用过的 , 但是在今天还是这句话 , 我觉得我们 Maas 或者算力 AI 的发展不取决于到底我做的算力产品或者什么东西做得好不好 , 就是我这个石油是轻质石油 , 特别好炼 , 那个是重质石油 , 特别难炼 。

Koji杨远骋25:47

嗯 。

于文渊25:47

总有人炼 , 但今天是总量的供给的问题 。 你说我明年能增长十倍 , 我为什么不能有一百倍的算力呢 ? 我一百倍的算力 , 我一定可以让这个市场把它消耗掉 。

Koji杨远骋25:59

嗯 。

于文渊26:00

今天我在一千倍的 , 我相信啊 , 一定可以让市场 , 不管是做训练出更牛的模型 , 还是这个让更多的 AI 应用变得便宜 , 我相信只要给我算力 , 我一定让大家都用起来 。 所以我永远觉得不够用 。 当然大家可能认为中国算力 , 包括阿里云的算力很够了 , 还是不够啊 。

Koji杨远骋26:20

嗯 , 嗯 。

于文渊26:20

对 , 可以更多 。

Koji杨远骋26:22

就这种感觉在云计算的年代是从来没有过的 , 对吧 ? 就从来没觉得你给我更多的云 , 我也能把它物尽其用的 。

于文渊26:30

大家其实 , 嗯 , 没有这么爆炸过的对算力的需求 , 历史上 。 阿里云曾经有增 -- 高速增长的时候 , 但我们就按照算力本身来说 , 这个对算力的饥渴其实是一个前所未有的状态 。

Koji杨远骋26:46

然后我们来预测一下 , 到 2026 年底 , 你估计会有哪些场景会烧掉特别多的 Token, 而且这些场景可能是今年冒出来的新场景 , 或者大家意想不到的场景 。

于文渊26:59

嗯 , 现在我 - 我的这个意想不到的阈值已经非常非常地高 , 我觉得现在没有什么 AI 做到的事情是我今天觉得意想不到的 。Agent 一定是今年的一个最炸的增量的其中之一 , 啊 ,AI 生成一定是增长之一 。 对 , 它们到底谁多谁少 , 我不敢说 , 啊 , 每个厂商可能也不一样 , 但是我相信这两个一定会是今年最大的 。

MaaS终局27:25

Koji杨远骋27:25

大家今天可以选择不通过你们去调 API, 我可以直接调 OpenAI 的 API, 我也可以直接调千问的 API, 就你们在中间 , 你觉得提供的这个价值 , 它的厚度有多厚啊 ?

于文渊27:39

啊 , 首先千问的 API 就是百炼的 API 啊 , 我觉得这个中间的厚度 , 嗯 , 就是我说的谁能做到好的体验 、 低的成本和好的模型效果 , 对吧 ? 还有容量 , 没有一个 GPU 一秒钟闲下来 , 我这些容量怎么样把它转成 Token, 我理解今天的 Maas 之争 , 算力转换成 Token, 谁能转得更高效 , 谁有更多的算力的问题 。

Koji杨远骋28:04

现在在百炼上面可以用千问之外的其他的模型吗 ?

于文渊28:08

啊当然可以 , 就是百炼像作为一个云的平台 , 我们服务的是客户的需求啊 , 中国的这些开源模型 , 我们在百炼都有托管化的部署 。 啊除此以外呢 , 其实国内这些模型厂商的原厂的模型 , 像 Mini,MiniMax 啊 ,Kimi 和硅基流动的 DeepSeek 的 API, 用户其实可以用百炼的 API Key 去享受这些模型 , 甚至推理厂商的模型服务 。

Koji杨远骋28:37

我们前面聊到 Neo Cloud 嘛 , 是吧 , 这些新的 Neo Cloud 里面有你自己特别看好的吗 ?

于文渊28:43

Neo Cloud 其实是很泛的一些 cloud 的这个简称啊 , 大家无非还是想把一些复杂性给客户一个屏蔽啊 。 我个人感觉可能我并不是特别地看好一些 , 就是直接做资源转售类的这种的所谓的 Neo Cloud, 就是把英伟达的算力或者类似的算力 , 就是非常相对比较裸低层的往上上的这些 Neo Cloud。 但我相对来说更看好今天 AI 原生的 , 就是我把硬件和复杂

性屏蔽掉的 , 就是像 FireFox、Together 这种做 MaaS 的 , 然后像这个还有一些其他的厂商 , 就是做沙箱托管 , 就是今天云桌面浏览器的搜索的等等等等一大堆 , 围绕着 AI agent, 包括可观测性 , 怎么样去观测 agent。

Koji杨远骋29:32

嗯 。

于文渊29:32

就像 DataDog 这样的公司 , 其实围绕着 agent 和 AI 云相关的基建 -

Koji杨远骋29:38

嗯 。

于文渊29:38

... 的公司或者产品会非常有意思 。

Koji杨远骋29:40

那我们最后一个问题就是 , 今天仍然感觉 MaaS 是处在激战区 , 是吧 , 因为外界环境变化非常快 , 一日千里 , 那你有没有想过有一天如果这个战局确定下来 , 它是因为发生了一些什么样的变化 ?

于文渊29:56

这件事情其本质上取决于 AI 到底在我们整个这个未来的一个社会中去承担一个什么样的角色啊 。 我相信它会是一个类似水电煤一样的一个 utility, 就跟我们的手机运营商 、 电信运营商 、 交通设施 、 高速公路一样 , 它一定是一个基础设施级的 utility。AI 的终局可能确实不是一个模型 , 就电我不分核电 、 水电 , 我插在插头上就是二百二十

伏交流电 , 一定是非常多样性 、 复杂性 , 各种各样的 , 包括速度 、 速率啊 、 模型效果呀 , 你看功能的一个非常复杂 , 可能没有那么垄断 。

Koji杨远骋30:40

你会不会觉得未来我们的基础设施会从水电煤变成水电煤模 ?

于文渊30:48

一定的 , 嗯 , 一定是这样子 , 它会深远地影响我们的日常的生活 。 水电煤模 。

Koji杨远骋30:55

嗯 , 好 , 那今天非常开心 , 请到文渊来和我们录这一期播客 。

结束语30:55

于文渊30:59

好 , 谢谢 。

Koji杨远骋31:01

我们在一个变化非常快的时代 , 也感觉这个很期待 , 如果再过半年 , 再过一年 , 我们再见面再聊的时候 , 又会有哪些新的变化 , 对我们产生的工作 、 生活方方面面的影响 。

于文渊31:12

好 , 好 , 谢谢 , 谢谢 。

Koji杨远骋31:13

好 , 好的 , 好的 , 谢谢 , 谢谢 。 好 , 拜拜 。

于文渊31:15

拜拜 。 谢谢大家 。