开场0:00
我觉得这件事是我一定要干的
其实这是一个人生十字路口
因为这就是时代的问题就是时代的选择我们今天很多 AI 的服务给企业提供的是情绪价值而不是业务价值所以就是我们只花了一个小时我就做了决定我说不自己干了加入
中国的创业者和 VC 呢说到 To B 都是有一种生理性的恐惧但今天我们的嘉宾呢却选择逆流而上那张帆之前是智谱的这个 COO 然后最近呢选择创业选择了做 To B 企业服务这个赛道所以今天很开心请到你来做客十字路口
好谢谢谢谢谢谢 Koji
所以我们第一个问题就是想问你是什么原因让你那么的勇敢敢去做 To B
我觉得我经常在思考在今天这个时代下到底是反共识是什么我觉得今天市场共识呢让我们觉得有点担心而历来我们所有的技术都是从一些反共识包括商业模式都是从一些反共识开始的所以我总在想今天的反共识是什么那确实今天大家有一个对于创业的共识就是大家认为 To C 是更大的机会
尤其是对中国创业者
没错 To B 是个更更难的机会特别在中国的环境像你所说但是我觉得不倾向于直接得出这样的一个结论如果我们我觉得这更多的这种结论来自于我们的归纳法因为我们在互联网时代确实很多成功的都是在 To C 而 To B 其实收益并不是大家比起 To C 要差很多所以但是我觉得如果我们从一些演绎法的角度来看就是这两个时代我
觉得是有一点不一样的
你觉得互联网时代和 AI 时代不一样或者 SaaS 时代和 AI 时代不一样
还是要看环境和变量在互联网时代有一个很不一样的点就是我们当时的线下是完全就是我们线下是已经完全构建起来了但是其实线上是一个完全的空白所以大家知道那个时候的点叫做这个模式创新所以大家快速地跑马圈地在跑马圈地里面快速构建自己的竞争壁垒而这个在线上里面的竞争壁垒往往跟线下是不同的比如说
传统旅行社的供应链在携程的角度是没办法用的而携程是有机会去构建全新的供应链的所以有了相当长一段的缓冲期和一个战略纵深让企业可以快速去奔跑所以在那个时代我觉得 C 是很有机会的但今天其实一个反共识来讲我觉得 C 其实是蛮难的是因为我们觉得今天其实不但线下是满的线上也是满的并没有出现一个新设
备所以这个时候你发现原有在线上有效的一些壁垒在 AI 时代它依然存在比如说我今天可以非常容易做了一个非常高级的旅游的一个 agent 我也非常有信心它能做一个非常好的体验但是你想想这是一场不对称的战争如果 OTA 也就是比如携程这样的公司它想追上你的体验也许它只需要花一年但是如果你要追上它的供应链和它的服
务体系你可能要十年
其实冰山上的大家看到的这个界面只是一角而支撑携程今天帝国的可能是冰山下的整个供应链体系和运营体系
其实大多数的业务都是如此所以在这样的一个背景下我觉得做 To C 其实是一个很难建立高效的有效的一个壁垒的情况
妙计教训3:32
在你的职业生涯里面我们知道的是在智谱其实负责 To B 嘛但在更早之前你是不是也做过 To C 啊我记得
是的其实我是 C 跟 B 都做过的我也简单介绍一下我自己的背景我自己其实大家都会认为我在负责 To B 会认为我是一个业务负责人其实我是个技术在只有在智谱的最近的两年我才开始去做业务并且这其中当中也有一半的精力都是放在产研上的我是在巴黎大学读的书巴黎十一大读的人工智能然后当时还在法国国家科研中心
做过一段时间的机器翻译然后 10 年回国回国之后我赶上了第一波这个 AGI 的浪潮吧我当时是在搜狗和腾讯先后都是负责类 Siri 的产品
因为你说 Siri 发布之后全世界也是为之疯狂对吧每个厂都在做自己的 Siri
很像今天啊对那个时候大家都会觉得 Siri 是一个非常好的交互方式赫尔是不是会到来所以我们都在干那个事儿
但后来很快就全军覆灭嘛包括到今天 Siri 也不能说是成功的所以那个时候可以讲讲这个当时的经历吗 ?
其实是个很不成功啊所以那一次那个时候的技术并没有今天的大模型这种通用性的泛化能力那个时候某种程度上我们还是或者说有了一点点泛化能力那个时候的做法主体基本上还是一些结构化的就是都是我们会把它进行分类比如说我们会定义几十个类别每一个类别做单单独的模型去做识别去做解构去做 API 的调用所以某
种程度上是一个手动的来拆解所以我们当时大概火了两年左右的时间吧大家发现这条路好像不行第一我觉得这个问题比我预想的难可能没那么快第二件事来讲如果它能发生那一定是大厂的事情因为这是各家的必争之地所以我当时就想到了说那如果是这样我们今天是不是有机会能够把 AI 应用在一些垂直领域所以我就创业
了所以那大概是在 14 年的时候我就开始去做创业了我当时觉得在大厂做的这些努力我觉得受受到大家的就我自己的掌控力会变弱所以我更愿意自己去试一把所以那个时候也不懂创业然后就直接开始干起来了所以我做的第一个项目其实是 AI 加旅游所以我们当时做了一家公司叫做妙计旅行我们当时的逻辑呢很简单就是是用
搜索的 AI 技术来叠加旅游早期的时候我们当时认为很流行的是去哪儿当时我们称之为一阶元搜索就是你从北京飞巴黎它帮你找所有供应商里边最便宜的票但是如果从一个技术角色的角度我会觉得这样的搜索空间太小了你能得到的价差也不够大所以我当时想再把它升一级我不要以一张票为最优解我能不能以一个旅游行程
为最优解所以我当时的想法是说我要把它变成一个二阶元搜索怎么讲 ? 就是如果你今天我要去巴黎三天马德里三天巴塞罗那三天我但是其实我并不在乎先去哪个后去哪个我的顺序是可以随便排列的而顺序的排列就意味着更大的搜索空间而更大的搜索空间意味着这里边的价差和体验会有完全不一样
听起来非常合理
对所以我们当时做了一个呃一个非常复杂的一个基于搜索逻辑的 AI 加旅游你只要去输入你的需求我们会帮你连接机票 、 酒店 、 租车 、 包车 、 景点门票 day tour 以及城市内的小交通帮你串成一个行程
这是一个很从下至上的一个需求发现我觉得直到今天这个需求仍然成立而且好像还是没有被解决得很好
呃是的我觉得当时很大的原因在于呃我们其实有点像刚才讲到的这个话题就是我们当时地觉得会呃作为一个程序员去做创业所以大家第一反应会觉得旅游其实是一个产品问题我们要做一个足够 fancy 的产品但是事实当中我们经过了我们做了五年的时间吧也融了几千万美金啊最后并不成功啊这个也交了学费但是在这个过程当
中让我们开始意识到就是旅游本质上是一个供给问题是一个供应链问题因为如果你只给了一个非常高级的信息而没办法交付这件事没有价值的所以某种程度也跟我们今天在做事情的这个烙印也印在我们身体里
所以上一次这个创业的失败它还是给今天带来了一些启发
是的是的我觉得非常重要我觉得它让我们开始从一个纯的理想主义的技术研究者变成了一个初步合格的创业者就是我们会发现创业本质不是只做一个 fancy 的产品能给产业带来什么
以及这个整体体验你是不是能够真的 deliver 它不是只是界面的设计它其实背后是一整套供应链和运营
我觉得这个这个差的这是一个完全不一样的思考方式
但其实也有人会去建议创业者一开始就不要选这种复杂的地方嘛就可能去选可以更容易创新的地方
如果从这个角度来讲我其实觉得就是我觉得创业者要很注意的我觉得创业者特别容易自我强化就是我们当时在做这件事的时候其实呃你当时在 14 年是一个好的资本年代就是我们很容易做这些事然后在虽然我们也许并不是那么呃那么专业的一个创业者但是在当时其实我们还是很快拿到了很多钱也都是很一线的基金所以当
时呢你就会觉得说哎好像我有一个正反馈对吧 ? 如 - 如果用今天的话讲就是一个错误的 reward model 对吧 ? 就
非常错误因为融资从来不是一个对的一个 reward model
不止如如此你会发现除了它你会发现旅游行业的人也会过来说啊你你你很厉害你这个东西很对我觉得你一定很对你的个别的早期的天使客户也会说啊我觉得你这个方向我这个爱死了我觉得就是要这样做呃然后你的媒体也会来跟你说啊这个旅游门外的野蛮人然后会给你一些什么这个公牛冲进了瓷器店会让你产生一种错觉
好像我就是选对了
所以什么时候你开始感觉到这个事情不对劲的 ?
当你把注意力从一些这种外部的 reward model 转化为一些业务上的 reward model 你要看用户的留存用户的满意度你会看你在真正解决问题的这个完成度我觉得当你当你真正转回到一个业务视角你会发现可能看到的不是很一样
所以其实最近有一位 VC 给我讲说他每次看到某某创业者一年融四轮这样的新闻他就会这个内心亮红灯而且就是两个礼拜前有另外一位大佬呃我说有一个朋友他特别崇拜你想认识你啊然后我就说他这个最近这个在这个是一个 market deal 非常火然后这个连续哐哐哐好几轮他说哦我不喜欢这样的创业者啊我觉得这个其实背后也是你
说的这一个点就是呃会有人认为如果融资成为了 reward model 你会进到另外一个错误的获得自己的这个事情有没有在进步的一个判断的准则里面多数情况人是很容易迷失在这样的一个准则里头而忘了我应该去看可能更重要的一些指标
因为某种程度上连融四轮这件事太共识了一定不是个好的赚钱的机会就风险跟收益不见得对等所以还是要一些反共识我觉得我们不应该把做一个高级的产品作为一个目标而是要把它做成一个可闭环的生意
印奇其实之前也反复在讲所有不能闭环的商业模式都是泡沫对吧 ? 感觉他也这个受过很重的伤所以我好奇的是这个比如说在妙计之后在智谱之前我知道还有一段创业那一段你的选择是什么 ?
然后在妙计之后我们当时在想到的点就是给我一个特别大的印象就是我们当时还自认为自己是一个一流的技术团队但是坦率讲我觉得但我们认为发现一流技术团队这件事太常见了这不是我们的核心差异我们是一个花了几千万美金在一个产业里深度磨过的一个技术团队我觉得这是我们认为能够结合产业跟技术是我们的标
签是我们的收获所以我们当时又加入了另外一家公司叫做大搜车也曾经也是也 - 也 - 也在我们加入的时候是一个非常火的时候它当时也是这个三十亿美金的一家公司融了十亿美金左右的一个现金那当时他们是覆盖全部的汽车产业链十七条业务链包括新车 、 二手车 、 二网金融 、 保险 、 物流 、 软件 、 代运营等等所以那个时
候我是作为一个集团的 CTO 加入的然后来有这个这个一个非常庞大的产研团队来支持十七条业务线近千人的一个产研团队啊所以那我们又把 AI 跟汽车产业做了很多结合的尝试那这里边包括了一些这个呃比如说二手车的估价比如说这种自动化的检测呃比如说这种车商匹配等等所以进一步强化了我们把 AI 跟汽车产业结合又获
得了一些经验
嗯
然后在那个之后呢 , 我们又开始觉得还是又回归到创业 。 呃 , 然后呢 , 我当时又做了一个 AI 加 data 的公司 , 啊 , 就是因为我当时觉得又找到了一些反共识 , 因为我们当时在这个大头车的时候 , 其实我们的数据中心团队就有一个一百人的团队 , 然后呢 , 我们里边做了全链路的技术方案 , 包括从 , 呃 , 怎么做买点 , 怎么做大
数据的调度 , 做数据的治理 , 做指标体系 , 做 BI, 做 CDP, 全链路仔细 。
那是哪一年啊 ?
呃 , 那是大概二零年 、 二一年的样子 。 这是我们当时在大头车在构建刚才这些事儿的时候 。 呃 , 然后到我们又出来创业 , 大概是在二二年 。 嗯 , 然后二二年的时候 , 我们当时有一个 , 我找到了一个特别大的 , 我自己认为的一个反共识 , 就是我发现数据行业当时的共识在于只有大厂是有机会用数据的 , 它是可以用数据中
台的 , 因为我们的假设都是大厂有最完备的数据基础 。 但那个时候我们找到了一个反共识 , 就是我觉得大厂其实并不见得是一个最合适的切入数据中心的手段 , 呃 , 或者是战场 。 因为我们发现大厂天然有一个坏处 , 就是太异构了 , 因为它足够大 , 所以各个部门都会建自己的系统 , 而且自己的系统经常是没有找到以前的
文档 , 所以你数据的统一性是很难的 , 所以你要做大量的针对性的数据治理 , 且没办法复用 。 所以在那个时候我认为这个机会很难 。 但是我们看到一个什么机会 , 我们看到了其实有非常 , 就我觉得中型的或者某些垂直领域的小厂是有机会的 。 比如说我们的电商 , 你发现电商的信息化程度是最好的 , 而且比大厂还好 , 因
为是各个大厂来为它做的 。 你发现它的如果卖东西 , 无非只能是淘宝啊 , 然后京东啊 , 抖店呀 , 也就是这么多网站 , 呃 , 或者是一些这个 , 或者是一些这种 , 呃 , 比如说像这个有赞啊 , 或者微盟 , 它可能再有一些 ERP 或什么聚水潭 、 万店通 , 啊 , 再有一些什么内容制作的光云什么 , 反正也就是这么多 。 所以你会发现其实
它可能就有五十个网站 , 覆盖了全部的电商 , 且极其标准和体系 。 我们做了一个端到端的一个解决方案 , 就是如果你是一个电商 , 给你五十个常用网站的链接 , 你只要输入你的用户名跟密码 , 我就会自动帮你把分散在各个地方的数据集中起来 , 自动化的治理 , 自动化的生成报告 , 甚至给你一些预测 , 还可以一些自然语
言去做查询 , 某种程度上帮你做了一个中台的 , 呃 , 数据的中台 。
这也是一次 To B 的创业 。
而且这个成本极低 。 是的 , 可以做到正常大厂的可能几十分之一 , 十万块钱你就可以有一个中台 。 这件事我们大概做了六个月 , 也是完成了天使轮的融资 , 然后已经有了几个天使客户 , 正要准备去做 A 轮的时候 , 这时候 ChatGPT 发布了 , 啊 , 然后我们也很快关注到了 , 因为我自己本质上其实就是我本身就是在学 NLP 的 , 所以我
对这个很敏感 。 我看到了这个技术之后的我第一反应 , 我发现这个事情跟以往的不一样 , 这不是一个渐进式的创新 , 这是一个颠覆式的创新 。 啊 , 那这个时候 , 这个 , 呃 , 我当时在 , 呃 , 搜狗的老板 , 就是这个原来的搜狗首席科学家张阔 , 也是我非常好的朋友 , 他是唐杰老师的师弟 , 啊 , 所以他来找到了我 , 说我们要
智谱加入15:04
不要来搞这件事儿 。 所以当时我的公司就被智谱并购掉了 。 某种程度上并购是为了要团队啊 , 所以就是我们只花了一个小时 , 我就做了决定 , 我说不自己干了 , 加入 。 所以那个时候并不像今天大家看到的 , 那个时候 , 呃 , 智谱一单还没卖呢 , 所以那个 , 那个 , 那个时候是在很早期的那个状态 。
所以你和唐杰老师聊了一个小时 。
呃 , 对 , 和唐杰老师都没有聊到一个小时 , 我说我自己思考了一个小时 , 我就决定了 , 这个事要干 。
其实这是一个人生十字路口 。 所以等于当时唐杰根本就没有对你进行说服工作 。
对的 。 当时我们看起来还是有两个选择 , 就是一种选择 , 因为我们也预判到了这一波 AI 会火 , 那加上我们以前做 AI 的经验和这么多年都是 AI 跟产业的结合 , 所以我们当时是不是可以 , 呃 , 继续在我们的那个基础上去叠加这个 AI, 然后来变成一个新故事 , 来放大我们的融资 。 然后另外一个就是我们要不要就加入智谱 , 就是
完全放弃掉我们已经构建好简单的 PMF 的一个场景 , 然后彻底并入到一个未知的场景里边 , 去做一个全新的事儿 。 呃 , 我自己的思考的本质在于说我觉得 , 嗯 , 我觉得趋势还是一件非常重要的事儿 。 我 , 我 , 我也可以稍微讲一下为什么我觉得趋势特别重要 , 这也是我创业的一个经验 。 就是你发现我在这个妙计的时候 , 当
时我们就是一个普通的程序员 , 做算法的工程师 , 我们没有什么任何的其他的经验 , 只有一点产品经验和一些算法经验 , 呃 , 可能也只带个十几二十个人的小团队 。 那那个时候其实我们可以在一个用户都没有的情况下 , 我们就融到一千万美金以上 , 在一四年 , 而且都是大厂 , 呃 , 都给你发了 offer, 我们还拒掉了一些大厂的
offer, 很大的大厂的 offer。 所以在那个时候我觉得 , 呃 , 我 , 我 , 我觉得看起来是一切很顺利的 。 但是等到了我们到了这个我们下一段的这个 AI 加 data 的元因智能的这个阶段的时候 , 我们在这个时候发现 , 其实融资是很难的 , 因为那个时候我们赶上了疫情的上海封城 , 在那个的前一年其实是特别容易的 , 就是大家称之为 SaaS 元年 ,
就是很多人来找到我们 , 说你们要不要出来 , 我们马上就可以给你 , 对吧 , 按一个很高的估值就给你做天使 。 那那个时候我们觉得还不到时间 , 然后但是我们出来的那一刻刚刚赶上上海封城 , 你发现所有的基金都感兴趣 , 然后呢 , 但是很少出手 。 再加上我觉得我们自己的准备是极其充分的 , 我觉得我们从一个 , 呃 , 单
纯的程序员成长为了我们自己能管理千人的产研团队 , 我们负责过非常复杂的业务系统 , 然后我们也有交过这个数千万美金的这个学费等等 , 我觉得我们而且准备得非常充分 , 我们把所有的市面上相关的案例全研究了 。 但是你发现其实融资并没有想象中顺利 。 所以这个给我得到了一个结论是什么 ? 就是人在大势面前 ,
你的能力根本不重要 。 所以我能力也许比原来强了十倍 , 我团队比原来强了十倍 。 但如果现在不在那一个时间点上 , 你会发现其实一切问题都会难十倍 。 当然最终我们还是融到了点钱 , 但是其实比我们预想的要难 。
对 , 然后让我想到这个 《 这些 outlier》 这本书里面 , 其实他就有讲一个点 , 就是人出生的年份非常重要 。 他说 Bill Gates 和 Steve Jobs 都是 1955 年出生的 , 为什么是他们做了最厉害的两家电脑公司 ? 是因为在他们的青春期 , 就是七十年代的时候 , 正好是电脑崛起的时候 , 而这一波优秀的年轻人就可以 , 如果你最活跃 , 你最有创业的精神 , 你
就最有大的概率比 , 比年龄大三岁或者小三岁的人抓到这个机会 。 所以我 , 我其实也是很相信就是这个时间对于创业的重要性的 。
对 , 但你说的出生的年份是我们无法把握的 , 但是创业的年份是你可以把握的 。 所以这就是为什么你能理解我当时会那么果断地直接 , 呃 , 就 , 就把公司并到了智谱 , 然后从头开始干 。 我在智谱干了两年多 , 就是 ChatGPT 是 22 年的 12 月份发布的 , 然后我们大概是 2 月份 、3 月份加入的 。
所以你其实在智谱非常早期就加入 , 然后经历了这个一个它从零到今天做得特别好的一个阶段 , 然后在这个时候你又在 COO 的位置 , 对吧 ? 所以你离职的时候 , 我觉得很多人应该和我一样是感到很 surprise 的 , 然后你很快又开始新的创业 , 而这个创业又感觉是一个非共识中的非共识 , 就是在中国做 To B。 然后我知道蓝驰投了八百
再度创业20:04
万美金 , 然后上次我们一起见到蓝驰的 Joey,Joey 是说他在你身上看到了一种勇敢 。
我觉得我自己本质上还是个风险偏好很高的人 。 首先我认为智谱是一家非常好的公司 , 我觉得它的发展的方向 , 技术能力非常强 , 发展也是一切顺利 , 而且现在也正在 IPO 的过程中 。 在大多数人眼里觉得说 , 那你是不是应该等到上市再做打算 。 但是之前的经验告诉我说 , 我觉得如果在那一刻你觉得这件事是你的使命 , 是
你要去做的事 , 我觉得就不要等待 。 所以我自己本身是一个风险偏好较高 , 所以我就毅然下了这样的一个决定啊 。 啊 , 所以你说算不算勇敢呢 ? 我觉得 , 我觉得很难 , 我觉得不应该用勇敢来 , 来形容 , 因为勇敢的逻辑是在于你明明觉得这件事搞不了 , 你还要去搞 。 明知山有虎 , 偏上虎山行 , 这才叫勇敢 。 我是觉得这是
一个 AI 的下半场 , 我觉得我希望能够像参与上半场一样 , 更早地去参与这个下半场 。
所以你会有一个特别的 moment, 就是做这个决定吗 ?
不会那么有顿悟的感觉 , 但是我觉得它是一个渐进的 。 因为我们其实在 , 呃 , 智谱的时候 , 我们主要负责两件事 , 一件事是说我们要做所有的商业化 , 啊 , 特别从早期开始全面地去构建商业化的体系 。 那与此同时呢 , 我还在负责构建商业产品 , 呃 , 从早期到后面持续的当中 , 比如像我们的 Mask 平台 ,Mask 平台上面所有的这种
功能 , 呃 , 然后再到这个早期的像 CodeGeeks 这样的一个 coding 产品 , 都是我在负责 。 所以呢 , 我其实一直在跟一线 -- 就我觉得有两方面 , 一方面我们能在模型公司很有益的是让你知道第一手的模型底层的能力的进化 。 另外一个维度 , 我们在大规模地见客户 , 我觉得在智谱的两年是比我自己创业都要忙得多的 , 因为这就是时代的问
题 , 就是时代的选择 。 你看我们比如在 23 年刚去的时候 , 我基本每天要开七个客户会 。
每天七个 。
你停不下来 , 就你每一个小时之后 , 我们每天比如像 , 呃 , 我们如果开一个会一个多小时 , 我再打开手机 , 上面就有一百多条消息未读了 , 然后都是各种各样的人找到智谱 , 因为当时只有智谱有模型 , 所有的人都要找过来 , 你都要去交流 。 所以我觉得那 , 那一段都是要每天晚上到十二点才能开完 , 十二点开始回消息 ,
回到一点 , 回个两三百条 , 然后再睡觉 。 所以那 , 那是这个时代让我们感觉到了 , 呃 , 就 , 就我觉得很难 , 我们 , 我们不会比任何人聪明 , 但是我觉得在这个 , 我们的这个选择 , 让我们更早地能够接受到一手的模型的发展趋势和一手的用户的感知 , 呃 , 这个是我的一个收益 。 那在这个过程当中就会促使我们去思考 , 我
们会发现 , 嗯 , 我觉得模型的发展是这样 , 在早期的阶段 , 我觉得在 23 年 、24 年的时候 , 你会发现基座模型在早期是一切 , 因为在那个时候你任何上层的构建都完全依赖于基座模型 。 所以那个时候我的理解的智商可能我如果拿人来做比喻的时候 , 我觉得那个时候还是六十分的智商 , 七十分的智商 , 某种程度上你看到它已
经有人的行为了 , 但是如果你真的往具体的事情上去落地 , 你觉得它还是很难的 。 但是到了今天 , 或者说到了今年 , 我发现模型的智商已经开始到了一百或者到了一百一 , 所以在这个时候 , 各家模型或整个市场的模型都已经进入了一个相对成熟的阶段 。 这个时候是市场范式发生了变化 , 我觉得这个时候模型之外的东西
可能会变得更重要 。 呃 , 我举一个例子 , 比如你看人类社会 , 我 - 我 - 我很喜欢拿人来比喻 , 因为我觉得 AI 就是一个仿生学 。 你看人在过去五千年到今天 , 你发现人的脑容量没有变化 , 人的脑容量基本上还是这么大 。 我假设他的智商其实是没有本质上的变化的 。 但是你发现今天的人跟五千年前的人比起来 , 他的生产力
可能增长了一千倍起码 。 所以呢 , 从这个逻辑上 , 是什么构成了在一个智能的基线没变的情况下 , 而我们上涨到了一千倍的一个三个数量级以上的一个生产力的变化 。 我觉得本质上抽象下来就几件事 , 我觉得就是教育 、 分工 、 工具 、 组织协作 , 其实就几件事 , 把整个世界的生产力重新构建了 。 但这件事不会在你智商是
六十分的时候发生 , 就这个事情不会在动物身上发生 , 是因为它没有到那个临界点 。 所以从我的视角来看 , 我觉得基座模型今天到了这个临界点 , 但在这个临界点上继续再往上去提升 , 我觉得我自己能带来的帮助是有限 , 所以我觉得反而应该去如何为 AI 去构建社会形态 , 为 AI 去构建它的分工 、 教育 、 协作 、 工具的体系
。
这个很有意思 , 所以也是这个观点 , 就是让你认为自己现在应该去做一次新的 , 开启这个新的创业 。
是的 , 我觉得这个其实前两天看到像黄仁勋也讲过 , 对吧 , 他说 , 当然我觉得这也不算鸡汤 , 我觉得这是一个有道理的一个话 。 他认为说人还是要想什么事情是只有你能做的 , 就如果今天这件事情每个人都能做 , 大家都在做 , 你并不一定要浪费时间去做这个大家都能做的事 。 我觉得这个里面 people mission fit 变得非常重要 。 我确
实觉得如何构建一个标准的体系 , 能够让模型从基础智能转化为生产力 , 并且这个杠杆能够撬动三个数量级以上 , 我觉得这件事儿需要有非常强的模型的理解能力 , 有需要有产品能力 , 有需要对业务的洞察和理解能力 , 而我们之前的所有的创业经历几乎都是围绕这个方向 。 所以某种程度上我觉得这件事是我一定要干的
。
原理智能到现在大概成立多久了 ? 你们现在有没有可以方便介绍的客户 ? 以及比如说你们为这些客户做了什么样的服务 , 做了什么样的这个 -- 帮助他们产生价值 。
商业强化学26:20
我们大概是在七月份注册的公司 , 到现在为止也就是三个月的时间吧 , 啊 , 一个季度的时间 , 啊 , 还不算很久 。 嗯 , 啊 , 但这个里边呢 , 我们客户这边呢 , 我们选择也是有一些比较有意思的 , 啊 , 就是首先我们并不希望我们去做成一个定制的 , 但是呢 , 在 -- 我们更希望是一个标准化的 , 但是我们又明确地知道我们并不
能去闭门造车 , 所以我们在前 , 前期会有几家天使客户跟我们一起来共创 , 所以让我们在用一个比较全方位的服务的方式来帮我们去构建我们的产品 , 来确保它是一个有效的 。 所以 , 呃 , 是这样的一个方向 。 第二个 , 我们会给我们的客户设上限 , 就是我们认为到明年 Q2 之前 , 我们服务的客户不超过六家 , 啊 , 就是我们
不设下限 , 是因为核心逻辑在于我们目标是希望能够共建出一些灯塔客户 , 我希望这些客户能因为我们的服务 , 在他的关键业务指标甚至财务模型上带来明显的变化 。 我们试图打造一些公司从传统公司转化为 AI 时代公司的样板 , 啊 , 这是我们的目标 。 另外还有一个有意思的点 , 就是我们所选的这六家公司都不是同一个
行业的 。 我觉得如果我确保我们是一个泛化和通用的能力 , 我必须要面对不同的客户 , 确保它 work, 这样会推动我们更加有效地去设计成这样一个通用的框架 。
可以具体讲讲这些天使客户的故事吗 ? 他们和你们在配合做什么样的事情 ?
我还是先 -- 因为没有得到对方的同意啊 , 我就先不讲对方的名字了 。 那我讲讲我们做这个事情的方法论 。 就首先这里边有一个 , 就是如果用强化学习的逻辑 , 就是你怎么定义你的 reward, 你就会得到什么样的模型 。 所以同样的道理 , 我们在服务这个客户的时候 , 我们也要定义一个 reward, 就是我们到底想改变什么 。 我们今天的逻辑
在于 , 我们一定要以客户的业务结果为导向 , 就我不会以功能为导向 。 我们以前通常交付说 , 哎 , 那你要一个知识库 , 我给你一个知识库 , 啊 , 然后保证它达到一个什么指标 , 啊 , 这是原来的逻辑 。 啊 , 我觉得在今天新的时代 , 我觉得要探索一点不一样的 , 就是在于你今天的整个的业务的构成是什么样的 , 你这个业务
构成里的关键指标是什么 , 我能不能通过 AI 让你整个业务的流程进行了重塑 , 你的产品的结构 、 成本的结构进行了变化 。 好 , 那我具象说一下 , 比如这个里边我们可能会重一点 , 会从咨询开始进入 , 就是我觉得业务是第一导向 , 所以我们一般会有一个 , 我们会跟 , 跟客户进行一个用户的访谈 , 目标是构建他今天所有的
业务链路 , 就是我们一般会有一个同事跟他里边的 , 呃 , 二三十个不同的业务部门的各种层级的员工去做访谈 , 试图勾勒出今天企业的业务的核心的业务流 。 那好 , 第二步我们就开始来分析它的成本构成 。 就是财务模型其实代表了企业经营模型的关键嘛 。 就说我们以妙计的旅游为例啊 , 如果我们站在一个今天我们当时
服务的旅游的场景里边 , 你会发现旅游的 , 特别是定制游的业务链路非常简单 , 三大环节 : 获客 、 生产 、 供应链 。 好 , 那再下一个环节 AI 就要上场了 , 那我们就要理解 , 那 AI 在刚才的这个业务流里边有哪些地方是改进点 。 所以我们就会把刚才的业务流 , 比如 , 呃 , 在这个客户的 , 呃 , 他在获客这个环节 , 他就会存在广
告的投放 , 内容的生产 , 然后可能跟客户的沟通 , 然后再到生产环节 , 可能就变成模型的制作 , 就是形成的制作 , 形成的修改 , 然后再到供应链环节 , 变成谈判 、 下单 、 确认等等 , 你就会发现我们这个时候通常可能会在一个企业内识别出来三到四十个 AI 的改进点 。
每个你们都会参与吗 ?
这还没 , 没完 , 这个是为了画全貌 , 就是我总得知道整体的状况 。 所以这个里边我们就会发现 , 在链路里还有三四十个企业 AI 的改进点 , 然后这个时候的另一个关键就来了 , 这个时候我们要从里边做筛选 , 我们就会画一个象限图 , 我们找到一个业务价值跟技术成熟度的最大公约数 。 横轴其实就是我们把它作为一个业务
价值 。 然后纵轴我们就把它作为一个技术成熟度 , 这个时候我们要试图找整个坐标系右上角的 , 也就是业务价值又大 , 技术成熟度又高的 。 就刚才那三四十个改进点 , 并不一定今天都能完成 , 有很多就没办法完成 。 或者你 , 我 , 我举个简单例子 , 你比如说我在旅游过程当中 , 如果我希望能够 , 呃 , 比如说我跟供应链谈
判 , 谈出一个好的价格来 , 今天技术成熟度就不够高 , 但是业务价值就很大 , 对吧 ? 反之也有一些技术难度很低 , 对吧 ? 比如说我们帮客户日常提醒 , 这件事的技术成熟度很高 , 但是业务价值就不够大 。 所以选择合适的切入点是企业落地 AI 成功的第一要务 。 这个时候我们就开始进入到再下一步 , 我们就会由我们专业的
工程师进场 , 把刚才的这个问 , 问 , 问题 , 开始理解他们现在的日志的 log, 服务的过程 , 怎么去进行模型的训练 , 怎么进行 agent 的这种搭 , 搭 , 搭建 , 整整变成这样的一个过程 , 并且每一次可以跟 , 通过这个结果再反馈回来 。 所以从这个逻辑上看下来 , 刚才就是一套非常完整的逻辑 , 从业务到技术到实现 , 然后形成了一个
PDCA, 它可以再反过来循环 , 这里面会有连锁反应 。 就是如果我今天真的能够把形成的生产的部分的时效和成本 , 假如说能够下降五倍 , 你这个时候就会发现 , 你的整个的商业模型不只是它减了五倍 , 而是对于你整个的上下游又发生了变化 。 所以你看 , 如果刚才这样的逻辑 , 它不仅仅是解决简单的当前问题 , 是对于你整个
业务的战略都进行了重塑 。
呃 , 那你怎么理解 , 就这个事情它的可泛化性呢 ? 我觉得这还是一个挺重的工作的 , 第一步就要有人去采访二十到三十个这个企业里面的关键员工 , 才能得到就是第一步 。 那这个事情 , 呃 , 我觉得就是每个企业我觉得都值得做啊 , 都应该做 , 但这个怎么能够 , 比如说我们作为元理智能 , 作为一个 To B 的创业公司 , 怎么
能泛化它 , 使得我们可以这个服务更多的客户 , 成长成更大的一个企业 。
所以你看 , 如果我们作为一个程序员的角度 , 当我们遇到一个问题足够复杂的情况下 , 我们第一反应就是分治 , 就是我能不能把它分层和拆解开 , 啊 , 这个 , 这个是我们的方法 。 第一个点来讲 , 就比如像刚才说的这一些理解 , 理解 , 我 , 如果我们把它理性地来拆 , 它大概分成三个动作 , 大的动作 。 第一个动作叫业务理
解 。 某种程度就是偏咨询的部分 , 我们要理解它的场景 , 做 , 做选择 。 这个环节没有最优解 , 只有一个 , 呃 , 就是客户自己期望的解和我们的 , 就是 , 这 , 这是离不开线下人要沟通的事 。 第二件事 , 这件事一旦完成 , 我们会存在一个模型的优化 , 就是我们希望把模型 , 刚才业务里的这个场景训练出一个已知相对应的一
个垂类模型 。 第二 , 我们再需要把这个垂类模型变成一个垂直的 agent, 要完成技术栈 , 就是你可以理解为做模型这个部分 , 我们就相当于生产数据 , 强化也好 ,SFT 也好 , 本质上生产数据去训练它 , 让它跟这个业务变得更加匹配 。 第二 ,agent 来讲 , 本身也就是在里边去增加 prompt、RAG, 这个 memory, 然后或者是 workflow 等等一系列的这种工程类的东西 , 就
这么三件事 。 所以站在我们今天的角度来讲 , 我们会在里面分层 , 我们认为后面两件事 , 模型的学习 , 模型的优化和 agent 的优化 , 本质上我们相信商业强化学习可以把这两件事变成大一统 , 这件事可以完全不需要人工就可以完成 , 这是我们的目标 , 而且我并不认为这个很远 。 然后呢 , 再往上一层 , 人工的那一层能不能被
agent 解决呢 ? 我觉得能解决一半 。 为什么这么讲 ? 你看我们今天为什么自己在做这么重的 , 是因为我们要了解这个服务该怎么去做标准化 , 我们自己在建 SOP, 也在拿 agent 的赋能 。 比如说简单的访谈这件事 , 访谈谁 , 这件事是不是可以 agent 来定期化 , 访谈提纲是不是个 agent 有它的 know-how 来生成提纲的问题 ,agent 是不是可以自动化的访谈 , 我
觉得都会有帮助 , 但是它并不能完全替代 , 总归需要有人来进行这个服务 。 所以如果是这样的 , 我觉得 AI 可以让人的这种服务的门槛和成本下降五倍 , 所以我们可以让这件事变得容易一点 。 所以我们的下一步的战略 , 我们就希望能构建一个生态 , 我们希望那些会有大量的独立的工作者 , 比如说一些咨询公司的 , 呃 , 个
体的这些合伙人 , 或者是一些资深的咨询师 , 或者对某些行业有 know-how 的一些人 , 我觉得他都可以借助我们这样的平台来完成这种最后一公里的对接 。 所以如果按刚才这个逻辑的拆解 , 我觉得我们就把一个复杂的问题变成了一个体系化的结构 , 做了我们标准化的部分 , 又贡献了一个 , 又 , 又找到了一些这样的合作的伙伴 ,
构建了一个生态 。 因为我觉得这里边有两件事 , 第一件事 , 今天所有的场景 ,day one 都是很重的 。Salesforce、SAP, 哪个第一天的天使客户不重 ? 你包括像地平线 , 我们听过余凯的这个分享 , 就是他早期就是要跑到主机厂去跟车厂一个个地磨 , 到底这个芯片怎么做出来 , 才有今天的泛化 。 所以我觉得如果是站在我做妙计的时候 , 我可能会觉
得我能直接泛化 , 但我今天很明白 , 就是如果你不走一遍这样的流程 , 你根本没有泛化的基础 。 我觉得这是第一个 。 第二个逻辑在 , 来讲 , 我觉得我们今天在这个时代的创业 , 你不能想这家公司吃掉 everything, 就是你必须在这个里边是有生态 , 是在新的生态地图里选择自己的生态位 , 跟生态位去做合作的 。
生态定位36:10
嗯 , 所以你怎么理解你选的这个生态位是什么 ?
我觉得我 , 我们选择的生态位就 , 就是刚才我所描述的 , 我们希望能够坐在一个从咨询到基座模型的一个中间的一个转化器 。 我们希望 , 某种程度上你可以理解为 , 我希望我们变成一个模型的培训机构 。
模型的培训机构 。
就是我们希望基座模型今天带来的是越来越聪明的人 , 而我们希望能把这个聪明的人变得 , 变成一个某个更加职业的专家 。 然后从而进入到某一个企业去做工作 。 所以我觉得我们是这样的一个生态位 。 所以呢 , 在这个里边来讲 , 我们有一些不做的事情 , 就比如说基座模型我们肯定不做 , 然后 MaaS 平台我们肯定不搭 , 然后
SaaS 我们肯定不做 , 然后咨询的定制我们肯定不做 。
那你会怎么理解啊 , 就这一次和 SaaS 的那个年代有哪些不同了 ? 因为 SaaS 的失败带来了这种生理性恐惧 , 我觉得在我们这一代人的身上还没有消失掉 。
我觉得今天的时代跟上一个时代会完全不一样 。 首先一点 , 我认为今天 , 呃 , 就第一点 , 首先 SaaS 为什么是一个并不太成功 , 我觉得我们很难 , 大家都很容易简单归因为说 , 啊 , 中国企业没有这个习惯 , 呃 , 那抖音就很赚钱啊 , 企业的目标就一个 , 价值的最大化 , 所以这就是所有企业的一个使命 。 那如果我们把它再拆解
一层 , 价值的最大化等于什么 ? 我理解再简化一点来看 , 等于流量乘以转化能力 。 流量就意味着你有多少的线索进来 , 转化能力是你从一个线索当中能带来多少 , 呃 , 收益 。 很多情况下 , 企业的转化能力是个常量 , 甚至行业的转化能力是个常量 。 所以在这种情况下 , 它如果要最大化它的价值 , 那它只能最大化它的流量
。 所以这就是我们今天看到的 , 为什么大家会投在抖音上 , 投在这个投放上 , 投在广告 , 投在店铺上 , 这是因为这是一个今天唯一的增长的路径 。 好 , 那这个就可以理解了 , 为什么他们这么赚钱 。 那我们再拆解一下转化能力等于什么 ? 转化能力的本身等于人加上工具 。 好 , 那如果这看来就是人加上 SaaS 嘛 。 所以你发现那
在这个逻辑里边 , 我们推论出第一个有效的有意思的观点 , 就是你发现人和 SaaS 是零和博弈 , 因为在上一层的那个公式里面 , 它已经要最大化它的收益来自于最大化它的流量 , 所以相当于它给整个转化能力带来的是一个常量了 , 这是它认为压缩到极致的一个常量了 。 那这个时候 , 如果我今天要花一百万买一个 SaaS, 那理论上
来讲 , 我为什么要多付这一百万 ?
但这个在美国为什么就成立了呢 ?
我觉得这个会有一点不一样 , 这个会有 , 我 , 我先把刚才这个逻辑讲完 , 我们再说美国为什么会 。 那这个里边来讲 , 你就会发现 , 呃 , 所以它是一个零和博弈 。 我们经常在 To B 里面临的场景是什么 ? 你告诉这个团队说 , 哎 , 我给你花一百万买了个 SaaS, 哎 , 那你看是不是能砍一百万的人 , 这个人马上说我不用 SaaS。 而这个时候
人是必选项 ,SaaS 不是 。 所以天然这就是团原有的组织形态 , 就大家也会讲 , 对于 SaaS 的进入是一个阻碍 , 为什么需要很强的客户成功也是这样的一个原因 。 所以我为什么认为这次 AI 的逻辑不一样 , 是因为我觉得这次 AI 所对标的就不是工具 , 这也是我们今天原理的一个底层的一个判断的价值观 , 就是我们认为 AI 不是工具 ,AI 是
你的同事 。 所以如果 AI 是你的同事 , 你所要应对的就不是工具 , 而是转化能力本身 。 如果是转化能力本身 , 就意味着你从原来跟团队的一个零和博弈转和 , 转化为跟老板的正和博弈 。 所以我觉得这个故事就完全不一样 。 所以 AI 的对标不是软件市场 ,AI 的对标是劳动力市场 。 所以好 , 那我们说回来 , 你看中国的这个市场里
边 , 你会发现虽然大家不怎么买软件 , 但你发现中国有一个特别蓬勃发展的市场 , 叫做 BPO, 也就是人力资源外包 。 所以大家愿意为结果 , 为生产力买单 , 而不愿意为中间的工具买单 。 所以这是一个大几十倍的一个市场 。
这个我很认可 , 就是大家愿意为结果买单嘛 。 呃 , 我觉得这个其实放之四海皆准吧 , 就不管中国 、 美国 、 日本 、 欧洲 , 对吧 , 当你告诉一个企业家 , 我可以帮你的结果做得更好的时候 , 那这个肯定是大家最愿意掏钱的时候 。 但是我还是刚才那个问题我比较好奇啊 , 因为你提到它这种零和博弈 , 就是说员工排斥 SaaS, 所以在
中国很难够 , 呃 , 很难能够让企业买 SaaS。 但我觉得这个人性好像在美国同样也存在啊 , 那为什么比如说在美国 、 日本 、 欧洲 SaaS 就能够推得开呢 ?
对 , 我觉得就是这个底层逻辑都是共性的 。 但是如果从另外一个维度上来讲 , 你有没有发现中国的 SaaS 生态比过去几年是要变好的 , 今天如果不给我飞书 , 我都没办法工作了 。 但这件事在今天是需要一个过程 , 它并不是一个直接能带来的转化 , 所以这个可能是需要代际的差 。 其实像西方的生产 , 就是信息化的过程 , 其实
比中国要早很多很多 , 所以这些人里边 day one 出来 , 很多人今天的管理者 day one 出来工作的时候 , 他就是在用那个系统的 , 那是一套他们的对话的沟通的方式 , 比如没有 CRM, 他就不会干活 。 就跟我今天没有 , 没有 , 没有飞书 , 我也不会干活 。
我们再说回来啊 , 刚才你提到这个 , 你会认为 , 呃 ,AI 不是软件 , 而 AI 应该是生产力 。
我觉得 AI 是你的同事 , 我觉得它 , 它应该 , 你应该把它视为一个人 。 今天有一个特别大的误解吧 , 就是大家总是 , 就是 , 我觉得大家总会用旧的坐标系来找新的地图 , 来找新的方向 , 我觉得这个是不对的 。 我为什么这么讲 ? 你看本质上来讲 , 呃 , 我觉得大家普遍对于 AI 很 , 呃 , 觉得有问题的点 , 比如说第一名肯定是幻
觉 。 我记得 , 我记得好像什么也 , 也 , 也是有人发言 , 有 , 有讲过说 , 啊 , 只要机器还有这个 , 呃 , 百分之一的幻觉 , 人就很有价值 。 我觉得这是完全站在旧的坐标系在看新世界 , 这两个世界已经完全不一样了 。
嗯 , 你怎么看 ?
对 , 我觉得这个逻辑在于 , 你想机器有百分之一的幻觉 , 就需要人 。 请问人有幻觉吗 ? 人是有幻觉的 , 人的幻觉可能不止百分之一 。 所以你 , 我为什么叫做旧的坐标系 , 就是原来写代码是没有幻觉的 , 写代码是一定你怎么安排它就会怎么解决的 。 所以在如果我们按照原来旧的坐标系 , 我们总想控制它 , 总想让它不要出
错 。 但是你就没有泛化能力 , 它就没有它所带来的 ,AI 所带来的好处 。 所以我的觉得就是说你要接受 AI 就是有幻觉 , 但是我们应该怎么去驾驭幻觉 ? 就跟人今天有幻觉 , 但依然不影响人能做很高效的产出 。 所以这是两种不一样的思考体系 。 所以从这个维度上 , 你要视 AI 为人 , 而不是视 AI 为代码 。
所以这一次创业 , 你就是视 AI 为人 , 你要创造企业员工给企业用 , 是这么理解吗 ?
AI同事43:12
是的 , 我先说一下我看到的今天这个市场会有一个什么样的问题 。 我觉得今天的市场几乎大家对 AI 都极度看好 , 但是你发现这个市场是一个非常不对称的 , 你就会发现几乎所有的资本 、 人力 、 观点都在投入什么 ? 都在投入到供给侧 , 就是从半导体 、 芯片 、 集群 , 然后基座模型 , 这我理解全部都是供给侧 。 我觉得其实今
天大家对于需求侧是很忽视的 , 就是你看到供给侧的数据哐哐涨 , 投入巨大无比 , 对吧 ? 就是大家谁买了很大的集群和算力 , 资本市场 、 一级市场就给你正向的反馈 。 我觉得这是我看到的很好的一个方面 。 但是我觉得另外一个不好的方面 , 我觉得大家对于需求侧是非常地不够关注的 , 投入的是不够的 。 我们以前在做模
型的商业化的时候 , 最大的一个目标就是我们希望能够消耗掉更多的 token, 啊 , 这是我们的唯一的目标 , 对吧 ? 所以我们有那么大的供给都是为了这一个准备的 。 但是到我们事实当中 , 我觉得这件事其实比我们预想的难 。 我们原来想的方法就是我降价嘛 , 对吧 ? 我去做更多的商务的拓展嘛 , 让它去应用嘛 。 但我觉得这个路
径其实并没有解决本质的问题 。 这个有点像 , 呃 , 如果我们发明了电力 , 我们发明了灯泡 , 今天我们拿着电线和一个灯泡跑到一个这个原始部落 , 对吧 ? 跟他说请你多用点电 , 你 , 你看我这个灯泡很好啊 , 一插上就很亮啊 , 所以请你拜托多用点电 , 我再给你便宜 。 但是你发现今天这个部落已经摆满了灯泡了 , 它没有增
长的空间 , 不是它不想用 , 而是它不知道怎么用 。
它需要更多电器了 。
对的 。 所以我觉得这最大的卡点在于说大家不知道该怎么去应用和消耗掉这些智能 。 所以呢 , 我觉得更合理的逻辑就是应该我们今天的注意力到所谓的需求侧 , 就是我们是不是能够发明更多的开箱即用的电器 。 如果我们今天到了这个部落 , 我会告诉你说 , 哎 , 我这里有这个冰箱 , 有彩电 , 有洗衣机 , 啊 , 有空调 , 这一
切东西你是怎么跟生活连接起来的 ?
每个都想买 。
对 , 然后你不 , 不用再求他多用点点电 , 你也不用再求他说我再便宜点 , 你会发现自然而然地消耗就会变得巨大 。
那所以这一次你想造的 AI 电器是什么电器啊 ?
我觉得其实更多的就是如何把基座模型转化为生产力 。 其实原来我们衡量这件事的时候 , 大家特别喜欢 , 为什么 , 就大家的注意力都在性价比上 , 就是大家想的 , 但是大家的做法是一个很单调的 , 我想的都是怎么去解决价分母 , 没有想过我怎么去解决分子 。 大家所有的推演都会讲到说当成本再下降十倍 , 我们的消耗量
会增加多少 。 大家有没有想过说 , 如果我成本不变 , 但是我的业务价值放大十倍 , 那是不是依然能起到同样的效果 ? 而今天我觉得这一段的投入是太少的 , 所以本质上今天从基础智能转化为生产力会有一个巨大的 gap, 而我们这一次创业的目标就是希望去解决掉这个巨大的 gap。
所以你这一次打算怎么做 , 和在智谱的时候会有哪些相同和不同呢 ?
对 , 我觉得某种程度上 , 我们今天 , 呃 , 我觉得智谱需要一些新的生态的伙伴来把电器完成 , 从而才能让更多的模型的 token 被消耗 。 所以今天来讲 , 我们依然在一个上下游的关系 , 就是换了一种方式来支持智谱 , 让大家更多地来把模型去转化为业务能力 。 那说到这个里边来讲 , 那我们做这件事需要有两个点 , 就是首先你
得有一个自己的假设 , 就是如果你 -- 原来我们的假设就是在为知识建模 , 我们要做最强的智能 , 而今天我们在做这件事 , 我先得有一个自己的假设 , 对吧 ? 我的假设叫做为生产力建模 。 什么是你的生产力 ? 就你怎么定义这件事 , 你不定义你就没办法解决 。 第二 , 你如何去优化这件事 , 有没有更 general 的手段 , 更通用的手段
让你以百分之一 、 千分之一的成本来完成这个优化 。 我觉得这就是今天摆在我们面前的两个问题 。
对 , 一个是这个怎么去定义什么是生产力 , 第二是怎么不断地优化生产力 。 那你们打算怎么做呀 ?
第一个 , 比如说什么事生产力 , 我们先看一下人 。 其实你看一个 , 一个高中生 , 他其实是没有生产力的 , 但是他有智能 , 就像今天的基座模型 , 对吧 ? 就他会算术 , 呃 , 会识字 , 会推理 , 有 common sense, 有常识等等 , 但是你发现它并不是一个生产力 。 如果我们要把一个高中生变成一个生产力 , 我们要怎么做 ? 我们需要给他做分
工和定义 。 就比如说我可以让他上个大学 , 然后呢 , 再去进入到一家公司 , 变成一个医生 , 或者变成一个律师 , 哪怕说他变成去 , 呃 , 这个去送外 , 送外卖 , 他也需要有一个身份 。 所以就我们需要把基础智能变 , 变回为生产力 。 我觉得这里边有一个特别好的媒介 , 我觉得是工种 , 这是我们看起来很重要的第一个洞察 。
所以从这个逻辑上 , 我觉得我们第一层建模建完了 , 那第二层就来了 , 那我们怎么让模型去学习成一个工种 ? 那在这个逻辑里边 , 我觉得我们 , 呃 , 我们所用的方法叫做商业强化学习 , 所以这也 , 这也是我们发明的一个词啊 。
商业强化学习 。
对 。 首先的逻辑 , 等下我们可以展开为什么会有这个底层 。 但是商业强化学习的逻辑是在于 , 首先它是商业 , 第二它是强化学习 。 为什么会有这样的观点 ? 就是核心观点在于说 , 我觉得今天每一个工种 , 它自己的目标是不一样的 , 所以我们很难用一个统一的方式来解决 。 所以我们必须就像人学习一样 , 我们必须让这个
数字化的工种进入到真实的物理世界 , 得到真实的反馈 , 变成是一个以你业务目标为导向的强化学习 。 那为什么是商业强化学习 ? 为什么不是 general 的强化学习 ? 是因为商业强化学习跟 general 的强化学习很不一样的点在于说 , 我们今天可以看到 , 今天的强化学习有一个特别明确的目标 , 就是在于你必须得有一个非常清晰的反馈
。 比如说数学题 , 如果我们现在做一套鸡兔同笼的问题 , 那那个题首先得有答案 , 所以这个答案就是一个非常清晰的 reward。 所以你看今天强化学习已经广泛地应用在我们的这个 , 呃 , 数学题 , 我们的 coding, 我们的 GUI 等等一系列 , 这些有明确结果的上面都已经做得非常好了 , 而且已经看到了非常明确的进步 。 但是如何把它跟物理
世界 , 特别是商业环境的连接 , 其实是非常难的 , 因为这里边有很多我们原来没有想到的问题 , 比如说这个反馈稀疏 , 比如说反馈之后 , 我举个简单例子 , 比如我们今天要训练一个销售 , 对吧 ? 他没有数学题一样的答案 , 就是这个销售跟一个顾客聊了一个小时 , 聊了一百句话 , 最后这个顾客没买 。 我们能给一个负面的
信号说这一百句都聊错了 , 很难 。 所以这个时候你会发现 , 这是一个算法跟商业环境的认知强结合的事 , 就是你如何去构造 。 但 , 但本质上来看 , 你看人又是这么学习的 , 他能够在自然物理环境里面跟顾客交流 , 在里边从而从一个初级的销售变成了一个高级的销售 。 所以这个环境如何拟合 ? 所以抽象下来 , 我们认为今
天生产力环境的最优的标准单元是工种 , 我们认为它学习和优化的方法叫商业强化学习 , 让它在自然的物理世界 、 商业环境里自我进化 。
智能体迭代51:00
大概两周前吧 , 这个 A16z 的 Speedrun 他们做了新的一次这一批项目的路演 , 然后这一批项目里面呢 , 我自己观察下来 , 有非常大的一堆创业公司在硅谷 , 在做的事情叫做 Agent as a Service。 其实换句话说 , 我们可能就会叫它给企业提供数字员工 。 但是我观察到的是 , 大家都是会选一个自己的垂直领域 , 比如说今天非常火的三家 、 四家公司
都在干的一件事情是帮这个消费企业去做用户调研 , 融特别多钱 。 嗯 , 然后也有这个更早一点的公司 , 它去选择帮企业做客服员工 , 呃 , 然后也有这个帮企业去做销售 , 做 HR。 但听起来好像你的选择是要去做泛化的一个员工 。
是的 , 呃 , 我觉得这也是属于我们的自己的第一性的不一样 。 呃 , 首先我先说一下我怎么看待说这个市场 agent 发展的几个方向 。 其实你看 agent 的发展其实是有明确 , 明显的一个趋势变化的 。 你看最早的一代大家所谓的做的就叫什么 , 都叫做 workflow 为 based 的一个 agent, 啊 , 这个里边有很多问题 , 对吧 ? 举个例子 , 比如说我要做一个机票
预定的 agent, 这个时候呢 , 你会发现这个 workflow 是连 , 连 , 连续的 , 它可能我会说 , 哎 , 我要先问你从哪出发 , 再问你到哪去 , 再问你几个人 , 然后订票 。 这是一个简单的 workflow。 这时候你会发现 , 我们对顾客要求他按套路出牌 。 你如果问他说 , 哎 , 你从哪出发 ? 他说 , 我想去上海 。 这时候他死机了 。 他会说 , 那你从哪出发 ? 他说 ,
我要去上海 。 哎 , 死机了 。 就是你发现他没办法按照 , 没有泛化能力 , 这恰恰是模型本身的能力 。 所以这种方式当然也有解法 。 解法是什么呢 ? 我要把它串成一个蜘蛛网 , 让每个节点之间都能连接 , 以最小单元去做连接 。 这时候你会发现经常会出现错误的流转 , 这个问题就变得变成一个巨大的 、 庞大的规则系统 , 导致
它跑不通 。 但是如果 , 你发现另外一种方式 , 我们今天更加的一种让 AI, 让模型自己去做 planner, 也就是我认为 workflow 的下一代 , 就是用 AI 原生的方式去做一个 agent, 就会好很多 。 你会在一个 prompt 里告诉他说 , 哎 , 那你今天是一个机票预定的专员 , 你需要知道它的出发地 、 目的地 , 然后几个人 , 然后你就可以订票 。 如果他没有说 , 你就要
问他 。 好 , 就这么简单 。 所以我觉得这就是 , 就刚才我说的第一代 , 叫做 workflow, 第二代叫做 AI 这个自我 planner 的这样的一个 agent。 但我觉得还有第三代 , 这就是为什么我们想来做的事 。 第三代在于 , 你发现今天所有的刚才说的第二代这一类的 , 包括像 Manus 或者是像 Jazz Park 这样的公司 , 你会发现它其实是已经非常好地在应用了模型的原生
能力去做泛化了 。 这件事是个巨大的贡献和巨大的一个突破 。 但是你会发现他们今天其实都很依赖于模型本身的规划能力 。 就是说 Claude 怎么做 planner, 你是一个没法干预的 , 你能干预的就是 context, 在这种情况下的干预是有限的 。 所以某种程度上太依赖于模型本身能力 。 如果依赖于模型本身能力 , 就意味你这件事 , 你对于全世界的任
务 , 你都是一种解法 。 所以我觉得这是一个当前的问题 。 就像我刚才讲的 , 人会分工啊 , 同样就是一个分工之后的 , 哪怕就是一个医生 , 你在一个不同的医院 、 不同的科室 , 你的模型都是不一样的 。 但是今天大家是在一个统一的模型里面 , 所以我认为会有一个第三代的逻辑 , 就是我们如何除了 context 以外 , 我们要有办法去
干预模型本身 , 我让模型原生地会了解我们这个层面的知识 , 不是信息 , 是这个层面的映射的动作 , 该怎么去拆解 , 怎么去做 planner。 我觉得这件事是今天看起来最难的 , 所以为什么大家都没做 。 本质上是因为这件事大家不知道该怎么做 。 而我们刚才讲的所谓的商业强化学习 , 我认为是能够解决这个问题的关键 。
呃 , 就像刚才那个问题哈 , 我觉得 , 嗯 , 可能有些人他会选一个垂直领域去做 , 这样会简单一点嘛 。 但是听起来你们选的是 , 就是什么领域的数字员工都做 , 什么样的 agent 或者分工的 agent 你们都做 , 这个是一个什么考虑呢 ?
你会发现 SaaS 在早期我们做东西的时候特别喜欢用一个词 , 叫做行业最佳实践 。 行业最佳实践的逻辑就是说我帮你把行业里面所有的做法都了解了 , 我给了你一个最佳实践 。 然后 , 但某种程度上 , 行业最佳实践不是个体最佳实践 , 行业最佳实践是一个共 , 共性的最佳实践 。 在没有今日头条的时候 , 我们看的媒介叫做门户
网站 , 我的编辑帮你选好了 , 如果你要看体育 , 就看这二十篇 。 随着今日头条发布 , 你会发现这事变了 , 它希望有一个自己的个体最佳实践 。 那我们再说回刚才的这个逻辑 , 就是我觉得今天的很多垂类 agent, 我认为它还是在做的是行业最佳实践 。 本质上我觉得不是因为需求 , 而是因为妥协 , 因为你做不起个体最佳实践 , 所
个体实践56:04
以你选择了行业 。 但我认为这不本质 。 本质的逻辑 , 我们要像管理信息一样 , 为每一个公司找到它自己的个体的最佳实践 。
所以不管是星巴克或者 Manner 或者 M Stand, 就不同的咖啡公司 , 如果他们都要用一个数字员工去解决一个同样的领域的问题的话 , 你觉得提供行业最佳实践不如提供企业针对性的个体最佳实践 。
从本质上来讲 , 我觉得其实就是应该是一个个体最佳实践 。
那可以结合一个具体的 , 比如你们最近服务的一个案例来 , 就是稍微展开讲一讲吗 ?
我觉得首先我们还是回归到本质问题上来讲 , 就是我们怎么看待模型本身 , 模型的底层 。 就首先今天有一个特别流行的话题 , 叫做模型的不对称性 。 这个话怎么讲 ? 就是我们发现有的时候 , 呃 , 就是你发现有的时候模型能做奥数金牌 , 但有的时候你发现它数一个 strawberry, 一个这样单词里边有几个 R, 它会数错 。 所以但是在大家
的逻辑里边会认为这是模型的缺陷 , 觉得模型强了就会解决这个问题 。 但我有个不同的观点 , 我的观点就是不对称性不是模型的缺陷 , 而是模型的特性 。 所有的智能都是不对称的 , 人也是不对称的 。 就是你今天很难讲说是爱因斯坦聪明还是马云聪明 , 还是杨振宁聪明 , 我觉得他首先他们有不一样的目标 。 所以如果这个
问题能达成共识 , 就是我们相信模型是智能是不对称的 , 那我们就要想去怎么利用不对称 。 所以我们 , 那再延伸一步 , 就是每个企业自己所构建的环境都是不对称的 。 就像刚才我们提到的就是同样的一个咖啡店 , 对吧 ? 无论是 Manners 或者是 , 呃 , 这个 Manner 或者是这个 Luckin 还是什么 , 你发现他们的客群都是有微小不一样的 。 所以
呢 , 我们很难用一个我 , 我很难相信他们会购买一个统一的 SaaS 服务来解决他们所有一切的问题 , 他们就变得没有特性了 。 我也觉得很难相信说这个 , 这个红杉 、IDG、 蓝驰会买统一的一个服务来帮他判断要不要投资 , 这个 , 这个天然就是因为本身环境是 , 就是不对称 , 所以导致智能就是不对称 。 所以在每一个环境内都会有一
个所谓的最优解 。 所以呢 , 如果顺着这个逻辑再往上看 , 我并不想构建一个我认知的第一性来给所有的企业去套 , 我觉得这件事不本质 。 如果更加本质的角度来讲 , 我们每一个企业 、 每一个工种 、 每一个场景都是有一个自己的特有环境的 , 并且这个环境是动态的 , 每时每刻都在变 。 两年前的卖东西的方法和今天的卖东
西的方法可能就会变得不一样 。 所以如何 , 如果我们相信每一个商业环境都会有无数的一个一个独立构成的问题和环境 , 我觉得那就意味着我们需要找到一个通用的手段 , 如何把一个 general 的一个模型去适配到每一个独特的环境 , 找到每一个环境的最优解 。 所以这是两种做事情的方式 。
那可以具体地介绍一下 , 比如说今天有一位客户找到你们 , 你们会给他提供什么样的产品或什么样的一个服务流程 , 最后实现你想达到的这个效果吗 ?
假如说你今天来说 , 你说 , 哎 , 我今天想找一个帮我这个 , 呃 , 这个选 , 选这个访谈人 , 或者帮我做初步的前采的一个 agent。 说实话 , 我觉得你很难接受我今天卖给你的东西是一个所有的类似的服务都在用的一样的标准的 , 你一定有强烈自己的 knowhow。 所以这又回到原来的老问题了 , 那我就要定制 。 所以它就变回到了软件逻辑 ,
它不 general。 如果我今天是一个我们现在在做的方式 , 我会跟你一起来构建你的问题 , 你的环境 , 你会告诉我什么是好 , 什么是坏 , 你现在的业务流是什么 , 你来怎么评估这件事 。 当你构建了这样的一个环境之后 , 我们相信机器会有一种通用的方式来基于你的环境来学习出最优解 。 这个有点像什么呢 ? 有点像 AlphaGo。 你看 AlphaGo 当时的
逻辑是在于我们把人类历史上的三千万个残局训进了模型 , 当然它下赢了李世石 。 但是你发现一年之后出现的 AlphaGo Zero, 它没有任何人类的先验知识 , 它仅靠自我博弈 , 用了几天的时间它就超过了 AlphaGo。 所以这个本质的逻辑发现说 , 人类的知识有的时候也是一种噪音 。 所以我们的目标是在于不是帮你去标三千万的残局 , 而是在于
我应该跟你一起去构建你的围棋的环境和 reward, 并且之后把它交给机器 , 让它自己在虚拟的环境里面去找到最优解 。
那这里有一个悖论 , 就是这样做的话 , 针对每个企业都得去做一些定制 , 那这个事情要怎么能够规模化呢 ?
我认为刚才在学习的这个过程 , 它没定制 。 原来的定制是在于我理解你的需求 , 帮你把它开发成软件 。 今天的逻辑你只是 , 你可以把它理解为环境的定义 , 就是一种 prompt, 你只要软性地定义清楚你到底要做什么事 , 它就帮你得到一个最优解 。 所以我认为这才是更加 general 通用的来解决这个问题 。 比如说你今天想训练一个销售 ,
那你给我一个五千条的销售的 log, 我们会利用这种 log, 基于你的环境 , 快速构建出一个实验场 , 一个真实模拟你的环境 , 这时候把你要训练的 agent 放到这个环境里面 , 它会自己没日没夜地在这个环境里去做锻炼 , 不断地沟通 、 反馈 、 学习 , 当它出来的时候 , 就已经是跟你的这些日志非常 fit 的这些逻辑的一个销售了 。 所以这是
我们的目标 , 所以我觉得这才是通用的办法 。
企业落地1:01:42
你在智谱的时候 , 像刚才提到哈 , 这个夸张的时候一天打七个电话 , 那我初步算了一下 , 很可能两年多你起码接触了一千家中国的企业 , 你感受到他们一个普遍现在对 AI 的情绪是什么 ?
啊 , 我觉得蛮有意思的是 , 我觉得今天的企业其实 , 呃 , 我觉得企业经过了很多轮的变化 , 我觉得或者会有很多很极端的不同的呃变化 。 一种变化 , 就是一种我们看到的极端的 , 极端的特性是大家的焦虑 , 就是很多人非常焦虑 , 就觉得 AI 来了 , 我可能我的生意都不存在了 , 所以就非常非常焦虑 。 还有一些人呢 , 极度的
有信心 , 说 , 啊 , 自己内部多了个 demo, 我这个 AI 已经跑通了 , 我们都可以搞定了 。 所以我觉得如果你要让我用一个词来形容 , 我觉得今天的市场是在有一点混沌 , 就是我觉得它不成熟啊 。 我们这个时候我觉得蛮有意思的点就是你可以看到冰火两重天 。 一重天回到我们刚才讲的 , 从供给侧的角度来看 , 你会发现我们感觉美
股每天都在创新高 , 对吧 ? 然后我们发现 , 呃 , 所有的这个财报都在快速地增长 , 这个 Mega Seven, 对吧 , 所有这种 AI 相关的都变得一 , 一切都很好 。 呃 , 然后我们看到各种企业的 ARR 正在快速地增长 , 比如说很多垂类的 agent 公司也好 , 或者是像这个 ChatGPT 之类的 , 它们的日活全部一 , 一片大好 。 但是反之 , 我们又冷静下来 , 你再观测
, 我们又看到 , 比如说前两天像这个 MIT 做了一个深度的分析的一个报告 , 它在一到六月份采访了大概一两百位核心的这种企业里面的高管 , 得出了一个非常跟我们刚才看到的场景不一样的 , 在需求端的 , 它会认为有百分之九十五的 POC 都失败了 。 那这种论调并不 , 并不新鲜 , 并不 , 并不少见 。
这个和你观察到的企业去落地 AI 的成功率是类似的吗 ?
就是我们之前 , 当然我 - 我 - 我觉得从过去的两年多以来 , 我们确实服务了 , 深度服务的 , 不算是那种注册了的 , 差不多也是有千家以上的客户了 。 那这千家客户以上 , 我们也自己做过很多内部的复盘 , 我觉得我们可以看到客户的行为和在逐步的变化 。 但这里面有一个本质 , 就是也是我们内部经常在反思 , 就是我觉得
我们服务了这么多客户 , 而且我们自认为在市场上还是算是做得不错的 。 但是如果你要问我 , 有多少客户因为我们的服务 , 他变成了一家 AI 导向的公司 , 或者他的核心业务指标有了一个明显的提升 , 我其实觉得非常少 。
什么原因呢 ?
这里有很多的原因 , 就是如果大家看那个报告里面就会有很多细节的原因 。 但我觉得最本质的原因 , 我觉得在过去的两年间 , 我某种程度上觉得我们今天很多 AI 的服务给企业提供的是情绪价值 , 而不是业务价值 。
这个是因为什么原因导致提供的是情绪价值而不是业务价值啊 ? 比如说是甲方的原因 , 还是是咱们的原因 ?
我觉得多方的原因 , 我觉得这不叫坏事 , 我觉得这就是一个从一个新兴企业逐步成熟的过程 。 我们看到原来很多老板会演示说 , 哎 , 我就要一个知识库就好了 , 当别人来采访的时候 , 我的展厅里有一个能说话的机器就够了 。 但是你在真实的场景当中会发现 ,POC 并不等于真正的业务落地 。POC 只能代表了演示 , 我们能在一两个
单点里表现出非常有价值的亮点就够了 。 但是如果我们真正放到业务生产环节里边 , 合规 、 安全 、 成本 、 稳定性 , 每一个都是一票否决的权 , 每一个都是一票否决的能力 。
你接触了非常多中国的企业家啊 , 你觉得今天大家在面临 AI 的时候有哪些普遍的呃 , 困境 ?
之前张一鸣讲过对吧 , 说企业的竞争就是认知的竞争 , 因为严格的意义上来讲 , 除了认知以外 , 其他的要素都能构建 , 就是人可以招 , 钱可以融 , 对吧 , 然后技术可以买 , 对吧 , 但是你的认知决定了 。 我们看到也是 , 你 -- 因为我 , 因为之前有一个流传蛮广的一个小视频 , 就是电视台采访 , 好像在一个会上 , 就是大家问
云计算的判断 , 马云就会认为云计算是一个未来 , 对吧 ? 然后李彦宏就会觉得这是新瓶装旧酒 , 对吧 ? 然后马化腾就会认为说 , 啊 , 这个事还有十年一百年什么的 , 很远的周期才能实现 。 所以你最后发现 , 那显然阿里云现在做得最好嘛 , 对吧 ? 但是你会发现这件事真的是因为腾讯的技术不够吗 ? 是没有招到人才吗 ? 所
以我觉得企业家的认知决定了你自己的判断和战略 。 所以我觉得所有的企业家不要想偷懒 。 今天在 AI 时代学习怎么理解 AI, 这是特别重要的一件事儿 , 就是你不要把它当成是一个技术问题 。 就是很多企业家会觉得 AI 是一个技术问题 , 但我想说 AI 是个业务问题 。 我们在很多讨论的时候 , 你并不需要知道背后 , 就跟我们在讨
论一个人一样 , 对吧 ? 就是你不需要知道这个人的分子结构 , 或者不需要把这个人解剖掉 , 对吧 ? 但是你要了解的是人性 , 你要知道人的特性 , 预测人的行为 , 相当于也是对应过来 , 就变成我们这有一个词叫做模型性 , 对应了人性 。 你不需要知道 transformer 是怎么运作的 , 你不知道它 - 它里边的每一个算法怎么写 , 你需要知道
模型有哪些特性 , 你怎么利用这些特性 。 比如我们刚才所讲到的 , 呃 , 模型的不对称 , 智能的不对称性 , 幻觉然后这些等等这样的这些概念 , 其实本质上都没有一点技术的问题 , 本质上都是在聊说我们怎么能够理解模型的特性 , 从而去驾驭 , 让它转变到业务当中 。 所以我觉得每一个企业家当仁不让 , 你要让自己变成你
公司的某种意义上是一个 AI 的先知 。 你不可能有别人比你更早了解 AI 跟业务的结合 , 也不可能有供应商比你更早 , 也不可能有模型厂商比你更早 。 所以你要比别人更早地理解 AI 跟你业务的结合 , 所以你可以把它当成战略要素当中的必选的一环 。 就像我们刚才讲的话题 , 你要视模型为人 , 就像理解人性一样 , 你发现模型
有很多特性跟我们预想的不一样 。 比如很多人 , 我们看到了一些海外的论文 , 在去做模型之间的博弈 , 它让一个模型装成一个 seller, 也就是一个销售 , 再变成一个顾客 , 一个 buyer, 两个人去做博弈 。 你会发现这个结论非常没法看 , 就是这个 seller 有一个成本价 ,buyer 有一个预算 , 他俩人只要达到了就成交 , 没有任何我们真正想要模拟出
的东西 。 这个背后原因是啥 ? 是如果你真的是理解模型 , 你就发现这个不奇怪 。 第一 , 模型第一个特性叫什么呢 ? 叫做讨好型人格 。 它基于 RLHF 的训练 , 让这个模型天然都会倾向于让它去满足对方 , 这是原来的训练所带来的 。 所以如果你要在这个里面去构建 , 你要明白这是它的特性 。 然后如果你知道 , 如果你在一个群体
做一个 multi-agent, 在这里边你所有的讨好型人格是会被叠加的 , 所以它的偏差会变得进一步放大 。 所以这些东西跟技术一点关系都没有 。 但是如果你不知道这些能力 , 你不了解模型 , 你很难做出一个有效的判断 。
这个还挺有意思的 。
我经常会举一个例子啊 , 我觉得你可以把基座模型理解为是一个大海 , 非常宽广 , 波动 , 对吧 。 但这个时候你觉得我要胜出别人 , 所以我要比这个大海变得更高 。 所以我有两种做法 , 一种做法就叫做我要在上面修一个灯塔 , 我才能看得足够高 , 对吧 。 但是这个时候你要注意 , 海平面每半年要涨一百米 , 所以你的灯塔不
断地在修 , 不断地被淹没 , 所以你完全没有沉淀 。 很多公司证明了这个 , 我不知道大家了不了解 , 像以前早期的像 Jasper, 呃 , 非常快 , 十个月的时候已经变成了一个独角兽公司 , 但很快随着 ChatGPT 的发布 , 啊 , 又 , 又 , 又变得销声匿迹了 。 本质上还是因为我觉得它没有找到那个边界 。 所以我给大家的建议是说 , 你不要在海面上
修灯塔 , 你要在海面上修一条船 。 船的逻辑在于你跟模型是解耦的 , 就是海平面在上涨 , 你继续 , 对 , 你船在上涨 , 你船之上还继续涨 , 所以这是一个你跟模型的能力解耦的 。
那大家都知道哈 , 就是轮船要比灯塔好 , 但是企业家怎么去造这个轮船 , 而不是造着造着发现自己结果造出来是个灯塔 。
我们今天觉得 , 如果我们今天把它放到产业里面来看 , 我们不应该是一个二维的坐标 , 我们应该把它变成一个三维的坐标 。 我们要在这里面再衍生一维度 , 叫做什么呢 ? 叫做业务逻辑 。 就是你看模型再牛 , 它不能解决旅游的供应链吧 , 它不能解决旅游的服务吧 , 它不能解决医院的看病吧 。 所以这个时候我就给企业家定
了一个目标 , 我觉得呢 , 你在做业务的时候 , 你要考虑你的模型含量 。 模型含量不是越高越好 , 也不是越低越好 , 越高 , 你就跟模型正面竞争 , 很快就可能会被竞争掉 , 你要太低 , 就跟 , 你就跟这个时代没关系 。 所谓模型含量最好在百分之五十 , 也就意味着你有一半的竞争力来自于你原有的业务 , 有一半的竞争力来自
于模型的放大 , 这两者的结合是你的核心壁垒 。 我们其实可以看到早期的时候 , 像两个典型的案例 , 一个是 Jasper, 他当时是帮他人去做广告文案的 , 在 GPT 三出来的时候 ,ChatGPT 还没有发布的时候 , 他其实非常快速地就有了几千万美金的 ARR, 当时绝对是明星公司 , 业务增长得非常快 。 但是你可以发现 ,ChatGPT 发布之后六个月快速陨落 , 因为
模型完全覆盖掉他的业务 , 他没有建立那个轮船的壁垒 , 对吧 , 他建了一 , 一 , 一百米的灯塔 ,ChatGPT 一发布 , 一百米涨完了 , 所以很快就竞争掉了 。 但是你与之同样 , 你再看另外一家 , 比如像 Notion, 它也是非常早 , 在 GPT 三的时候它就已经发布了所谓的 Notion AI, 但是你可以发现它 Notion AI 对它的价值带来的越来越大 。 所以在二三年 、 二四
年 , 你可以看它的财报和单人的收入是明显较之原来上涨的 。 所以本质逻辑就是什么 ? 它除了模型之外 , 它还有自己的原有的办公软件体系的部分 , 而 Jasper 没有 。 所以我觉得今天的逻辑 , 每个企业家都要觉得说 ,AI 时代 , 如果你想形成一个竞争优势 , 如何构建你业务的优势和模型的放大 , 这两件事是缺一不可的 。 所以呢 ,
那如果说回来这个里边 , 这个里边也有很多的误区 , 大家通常都会觉得说 , 呃 , 我觉得比 - 比较典型的误区 , 大家就会认为说数据是一切 。 大家总会讲到说 , 哦 , 我 , 我 , 我 , 我 , 我有很多数据 , 我们见过很多企业来找我们聊 , 说 , 啊 , 我这个聊天的数据有 , 有几千万对 , 我都拿来给你训 , 训完是不是模型就好了 , 对
吧 ? 我说训完的模型就 , 就废了 , 对吧 ? 所以就是数据不是那么有用 , 或者大家也不必把数据当成那么关键 。 所以因为这个时代 , 你相不相信这个时代的环境是在变的 , 每时每刻的答案是不一样的 。 所以与其构建数据 , 不如构筑生产数据的业务场景 。 如果你有了这样的一个业务场景 , 它会源源不断地从自然界来生产 ,
就你要把它当成一块田 , 而不是把它当成一个固定的装甲 。 就是如果我们今天在企业内部 , 如何去理解了模型的特性和业务方向之后 , 你去构建这个业务场景 , 你构建这个业务场景来设计它怎么产生数据 。 如果你这个设计得好 , 你就会发现这个田会源源不断地把真实世界的变化变成最新的理解给到你 。 这是每一个企业
的护城河 , 我觉得这是企业核心的核心 。
所以你会觉得如果要去帮助企业更好地提升实际的生产力 , 这个是这个今天元理智能就是你们想要做的事情 , 而听起来其实你们要做的事情它是比较泛化的 , 没有在一个垂直领域去切入 。 但是我这里面可能也有另外一种 , 就是我个人的这个疑惑啊 , 就如果它能够被泛化 , 那它会不会其实最后还是是这个基础大模型 , 或
者我们今天说的大厂的机会 , 而不是一个创业公司的机会 。
OK, 呃 , 我觉得不会 。 嗯 , 或者说我觉得大厂肯定是重要的一个 , 一 , 一个参与方啦 。 但是我觉得这里面有几个原因吧 , 呃 , 我觉得第一个原因 , 我们先看产品本身的壁垒 。 首先来讲 , 你发现基座模型其实是一个很艰难的事 , 因为你发现基座模型没壁垒 , 或者说它某种程度上是一个后发优势的方向 。 就最早大家都会认为
RLHF 会对这个模型是产生数据飞轮 , 其实你今天看下来 , 其实这个事情没那么关键 , 也没那么主流 。 所以呢 , 你会发现为什么我说它是一个后发优势的事 , 就是因为我比你晚做三个月模型 , 我可能成本是你的一半 。 就一方面算力变便宜了 , 一方面我还能蒸馏你 。 所以你会发现其实 —— 而且呢 , 它自己的迭代其实不像以前啊
, 你看以前我们如果做 , 比如像百度 , 其实它是有数据飞轮的 , 它的数据飞轮的逻辑在于说有 —— 你会随着你业务的应用 , 你会增强某部分能力 。 比如说我们原来如果你搜索一个词叫做 " 荷塘月色 ", 你会发现这个词里边有菜 、 有歌 , 有小区 , 可能有餐厅 , 有很多东西 。 这个时候如果你站在技术的角度 , 你根本不知道谁该
排第一 , 这匹配度都是百分之百 。 但是如果一旦百度上线了 , 哎 , 你会发现你得到了大量原来没有的信息 。 比如说你发现北京的人民特别喜欢点小区 , 可能北京有个小区叫荷塘月色 , 你发现天津人民特别喜欢点餐厅 , 那可能天津有一个餐厅 , 这个信息就是原来没有的 , 所以它就会形成一个飞轮 , 就是我越滚动 , 我的信
息比别人越多 , 我的效果就越好 , 这个时候你别人越难追赶 。 但是你发现这件事在大模型里边没 , 没发生 。 所以大模型的逻辑在于 RLHF 到了一定的阶段其实不是特别有效 。 你看我今天用 ChatGPT, 它经常给我一个五千字的反馈 , 给我两个 , 让我选哪个好 , 我真选不出来 , 对吧 ? 所以从这个逻辑上来讲 , 我觉得在 AI 角度 , 这个里边
的就是大模型 , 基座模型本身的飞轮没起来 , 但是你发现如果进到 agent, 这个事情开始发生变化 。 就是我就好比说我们今天说一个高中生怎么变成一个更好的人 , 你发现他很难变 , 因为他没标准 。 但是如果我今天说这个医生怎么变成一个更好的医生 , 这个事就可衡量了 , 怎么变成一个更好的这个 , 这个程序员 , 这个事就可
衡量了 。 如果你从一个通用能力变成一个生产力环节的一个数字员工 , 首先它是一个带有数据飞轮的 。 如果你有越来越多的销售在场景里用 , 就意味着你能从这个场景里收获到越来越多的知识变到里面 。 所以如果我们今天能够把市面上常用的工种 , 比如五十个工种 , 每一个都构建了足够强的一个共性的相 —— 鲜艳的知识
, 其实会让所有的企业在驯化自己模型的时候 , 它的效率会变得更高 。 所以我觉得从这个点上来讲 , 我觉得它是一个有壁垒的 。 你会发现这个就很像是不是大模型这个时代该做的事 。 你发现在大模型以前 , 比如我们上一个时代 , 就是 AI 小龙时代 , 在那个 , 那一波 AI 的时候 , 你发现那个时候并不是一个通用 AI, 每一个 AI 都
是垂类 AI, 就会有人做一个车牌识别 , 有人做一个人脸识别 , 每一个都是一个独立的 agent。 但是你会发现 , 这种 agent 的能力本身 , 它的构建就不是在泛化能力基础之上的 。 我今天识别一个新版本的发票和另外一个版本的发票 , 我的几万条数据都是白标的 。 所以某种程度上我觉得做垂类这件事儿 , 在今天这个时代我认为不本质 。
我们希望找到一个像原来的 NLP 的一个一个的垂类模型 , 转变为基座大模型的一个逻辑 。 我们希望能够有一个通用的方法来解决问题 , 这 , 这就是 AGI 的这个 general 本身的逻辑嘛 。 所以我不太相信 , 或者说我认为也许在一两年之内看到的 , 我们确实是把一些人类的知识复刻到机器里面 , 让大家用一个行业的最佳实践 。 但是我觉
得这件事儿从第一性角度来讲 , 它不本质 。 我认为更好的本质在于说我们必须为学习建模 , 我们有一套通用的学习的手段 , 让每一个模型都有一个统一的方法 , 适应到我们每一个独立的任务当中 。
哎 , 其实这个我想到你第一次创业的时候做妙计旅行 , 你当时其实是很自下而上地找了一个用户的痛点需求 , 就比如他要去意大利旅行 , 他搜机票 , 他其实去罗马也行 , 去佛罗伦萨也行 , 去米兰也行 。 但是用户原来呢 , 这个平台就只能让他就一个一个地搜 , 但其实在你这儿就可以说我就是去意大利 , 反正你帮我把这个
, 我不管先后去哪个城市都行 , 嗯 , 然后这样就可以有更复杂的一个搜索环境 , 因此可以得到更好的结果 。 但是刚才在听你介绍 , 就这一次创业 , 就做元理智能的时候 , 我觉得好像就是另外一种视角 , 就比较从上到下 , 你会经常在讲这个第一性原理是什么 , 在这个时代我们有什么样的技术基础 , 所以应该做什么样的事
情 , 就这其实是 , 呃 , 我就 -- 在我看来哈 , 我 , 我的观察是这好像是两种很不一样的创业的切入点 。 对 , 你觉得这个在你身上是发生了一些什么样的变化 ?
就是我觉得这是两套思考逻辑的不一样 。 就是我觉得从一个成熟一点的角度来讲 , 我们不应该从一些表象里边去找特征 , 因为表象是会变的 。 我们希望能够在这个里边去在表象当中去理解到什么东西是不变 。 所以这就让我觉得在今天在创业选择的时候我们总想去从底层找到那些不变的和确定性的一些方向 。 你看黄仁勋
的本质上是在很早 , 在没有任何收益的情况下 , 他坚持要投资 CUDA, 然后当时消耗掉了他巨大的资金 , 而且他要求给所有的显卡都会去做 CUDA。 当时到底 —— 但是他这个创业很奇怪的点是在于什么 ? 当时没有应用场 - 场景 , 只有个别科学家在用 , 但是他自己在把企业自己的目标认为并行计算是一个未来 , 所以他从最底层推测了并
行计算在未来的价值 。 所以当这个 CUDA 推出十年之后 ,AI 出现了之后 , 它产生了几何式的爆发 。 所以这就是它不是通过表象看到了一个单点 , 找到了一个需求 , 而是通过底层的逻辑推演出来 , 一定会出现这样的一个变化 。 所以我觉得在今天 , 特别是表象这么凌乱和这么复杂的情况下 , 我觉得我们要更加 deep 地去思考 , 去找到
那个趋势的变化 。
就在过去两年 , 呃 , 有什么你曾经就是相信的事情 , 你现在不相信了 。
认知升级1:20:23
呃 , 我想跟大家分享一个小点吧 。 我 , 呃 , 跟你说的相反 , 我是原来不相信现在相信的事儿 。 呃 , 我 - 我 - 我想用这个来说明两个时代的变化 。 比如说关于合成数据 , 就是我最开始是不相信合成数据的 , 因为我是作为一个传统做 NLP 的人 , 我们原来什么叫合成数据呢 ? 就是我用规则来生成一堆数据 , 然后从而进行模型训
练 。 所以站在我们原来逻辑里觉得这是不可思议的 。 就是因为你想 , 我如果用一百条规则生成一万条数据 , 然后我再去训练模型 , 那我干嘛不直接用那一百条规则 ? 所以听起来是个反常识的事儿 。 在这个过程中你就会觉得说 , 就是模型上 , 我们有 , 在这个技术界有个词叫 overfitting, 叫做过拟合 , 就是你太拟合这一百条规则 , 其
实因为它背后是一个很明确的规则 。 但是后来在今年吧 , 呃 , 或者去年有一个时间点 , 我就突然相信这件事了 。 我就发现我也是站在了旧的坐标系里来看新的问题 。 我天然有一个假设 , 规则得比数据少 。 大家通常都想说 , 我要一百条规则生成一万条训练语料 , 它就会过拟合 。 但是为什么它得是一百条规则生成一万条训
练语料呢 ? 为什么不能反过来 , 不能是一万条规则生成一百条训练语料呢 ? 如果一万条规则生一百条训练语料 , 它就一定不会过拟合呀 。 那这个事听起来又反常识 , 说我有能力标一万条训练 , 一万条规则 , 我为什么不直接标一万条训练语料 ? 我觉得这个关键就在于预训练 。 就是你发现我们并不需要说是真正自己去标这
一万条数据 。 如果我们今天大模型就是那个杠杆 , 就是我们今天给大模型一个 prompt, 这个大模型本身如果它有一千万 , 不 , 它有这个万亿参数 , 你甚至某种程度可以意味 , 意味着它有这个万亿条规则 。 如果我们增加了一个 prompt, 或者我们训练了这个一百条数据 , 其实意味着这一万亿的参数全都做了更改 。 某种程度上它就是把它
映射到了一个人类原有智慧上 , 变成了一个更大规则的变化 。 所以这个时候我再生成的训练语料当然可以用了 , 所以它就不会过拟合 , 它相当于把原来的规则做了叠加 , 这是我原来没想到的 。 就是我 - 我 - 我讲这个故事 , 想告诉大家说 , 其实我们都是总是自觉和不自觉地陷在了我们原来的认知里面 , 而今天在 AI 这个里
边 , 我觉得认知是要被快速升级的 , 我们一定要空杯心态 , 我们一定要从更加的第一个角度去探索这些不一样的部分 。 我觉得这个是蛮有意思 , 我想通了 , 你会觉得很开心 , 没想通的时候会觉得 —— 这也是为什么我们今天在做商业强化学习的时候 , 里边有大量的 AI 的博弈 , 就理论上 AI 已经在这儿了 , 你为什么要通过博弈
来产生新的知识 ? 本质上就是因为我觉得两个博弈体 , 就是因为两套规则添加了两套不一样的 prompt, 或者是连 , 就是做了两个微小的调整 , 让两类知识能够进行博弈 , 从而产出一种一些全新的知识 , 所以底层都来自于这个第一性 。
呃 , 然后最后一个问题哈 , 如果今天给你三百万美金 , 让你去做天使投资 , 可以投三个人 , 不管他是现在的已经在创业的人 , 还是你这个认为如果他创业一定会做得非常好的人 , 你能想到哪三个名字 ?
呃 , 我觉得如果三百万美金看目标是啥 。
目标是要投出一个这个 billing company。
这这个难度太 hard 了 , 太难了 。 如果今天我有三百万美金 , 我且所有公司都能投的话 , 我觉得我会做三份 。 呃 , 一份我会把它投在大厂里面 , 一份我会把它投在模型公司里面 , 一份投到这个 Thinking Machines Lab 这家公司里面 。 这是一个不太在聚光灯前的公司 , 虽然它融资很高啊 。 我看到他们其实对于商业和 AI 的本身是有深度理解和洞
察的 , 我觉得非常稀缺 。 就是你看他们今天的所有的研究都在于如何高效地让机器更好地去做学习 , 这就是在我们刚才的这个路径上走得更快 , 因为他们比我们更有钱 , 我们没有办法像他们走得这么 , 这么激进 , 但是我觉得这个方向是我认为高度认可的 。
OK, 今天也很开心请到张帆 , 然后也祝福啊 , 就是你和元理智能可以在这一次新的创业里面一帆风顺 。 好 , 也期待你可以再来 《 十字路口 》。
谢谢 Koji。
好 , 谢谢 。
谢谢 , 谢谢 。






