KOKoji杨远骋Oct 22, 2025· 1:18:08

【十字路口】拜托了,AI!帮忙解决「看病难、看病贵」吧【视频播客】

京东健康首席科学家王国鑫详解其「京医千询 2.0」医疗大模型与「AI 医院」产品,主张 AI 能低成本扩大医疗供给,实现服务平权。他阐释了如何通过合成数据、多模态影像理解和循证推理提升模型专业度,并指出京东健康的供应链优势使其能打造连接用户与后端服务的健康入口,而非仅做聊天机器人。

  1. 0:00开场
  2. 2:56愿景
  3. 7:31数据之困
  4. 12:06垂类模型
  5. 15:08AI助医
  6. 25:02模型升级
  7. 29:47验证之道
  8. 41:18共情与专业
  9. 47:33数据来源
  10. 54:50AI医院
  11. 1:02:03商业模式
  12. 1:07:37全球视野

Transcript

开场0:00

王国鑫0:00

我们的 AI 所有给行业不仅是医疗 , 给行业都是一件事情 , 就是它能不能低成本地扩大供给 。 如果它能低成本地扩大供给 , 那我们每个人都有一种均等的服务水平 。

荣慧0:11

就是说其实大模型它可能会让很多人的工作效率拉开巨大的差距 , 但是它一定可以提供一个价值 , 是让所有人的情绪得到平权 。 你们用很多办法去验证这个对话它的真实性 , 以此才能拿去做训练嘛 。 但是我好奇的就是 , 怎么去验证这个医患之间的对话 。

王国鑫0:31

医学最重要的不完全是一个体验问题 , 医学最重要的还是它的诊断准确和处置方案有效的问题 。

Koji杨远骋0:39

大家好 , 欢迎来到这期的十字路口 , 这期的十字路口呢 , 我们邀请的是京东健康的首席科学家王国鑫老师 , 一起来聊一聊医疗大模型 。 这个医疗大模型它是一个挺典型 , 也是一个挺特别的一个案例哈 , 然后我们想要通过它来聊一聊 , 看看是不是所有的垂直场景的 AI 创业都会遇到类似的这样的问题 , 就是数据从哪里来 ,

怎么来验证 , 这个商业落地怎么来实现 。 这一次其实也是我们第一次在节目里面邀请到一个公司的 C level 的一个首席科学家哈 , 我就直接叫 Nico 好了 , 然后请 Nico 跟大家打个招呼 。

王国鑫1:19

好 , 大家好 , 也很高兴有机会参加十字路口这个节目 , 然后谢谢二位 。

Koji杨远骋1:23

那我们来进入这个快问快答哈 。

王国鑫1:26

嗯 。

Koji杨远骋1:26

年龄 。

王国鑫1:26

四十 。

Koji杨远骋1:28

你现在是在京东健康探索研究院的第几年 ?

王国鑫1:32

第三年 。 嗯 。

Koji杨远骋1:34

在这之前是做什么 ?

王国鑫1:36

主要是做搜索和多模态的技术吧 。

Koji杨远骋1:39

嗯 , 你的 MBTI 和星座 。

王国鑫1:41

我是 ENFJ 和双子 。

Koji杨远骋1:44

那一句话介绍一下你们现在在做的这个产品 。

王国鑫1:47

啊 , 我们在做的产品就是京医千询的医疗大模型和在它之上的 agent, 医疗服务的 agent。

Koji杨远骋1:53

嗯 , 方便介绍现在的收入和利润吗 ?

王国鑫1:57

哦 , 这是送命题了 。 其实现在 AI 整个来说还没有跑通完全的商业模式哈 。 但是京东健康其实上半年大概是三百五十亿左右的营收 , 然后利润大概是三十五亿人民币吧 。 然后但是这块业务其实对我们来说承担的主要是回答医疗服务的未来以及公司的未来的这么一个答案吧 。

Koji杨远骋2:16

对 , 其实你也说了 , 它现在它扮演的是一个向未来沟通的这么一个角色 , 它现在在这个一个公司的一个战略规划里面 , 它起到一个什么样的作用 ?

王国鑫2:27

基本是核心战略 , 因为医疗整个来说 , 说到底它是一个供给受限 , 然后服务成本巨高的一个行业 。 我们每个人对健康的需求是无限的 , 无节制的 。 呃 , 我相信每个人都想活得一辈子 。 所以 AI 在这个里面扮演的最大的特点就是能不能提升供给水平这么一个关键要素 。 所以它虽然很难 , 但是我相信是不仅是京东健康啊 , 所

有立志于在健康领域有所发展的公司 , 甚至是国家的角度 , 它都对这个技术极其重视 。

Koji杨远骋2:56

好 , 那我们来首先来说一说 , 就是也是你刚刚提到的你们在做的这个产品哈 , 大概其实十年前开始就在做这个方向 , 二零一八年开始做互联网医院 , 然后现在做的事情可以说是从那个时候到的一个延伸吧 。

愿景2:56

王国鑫3:12

我觉得可以是这么讲 。

Koji杨远骋3:13

可以说一说你们就是在准备做这个医疗方向的大模型的时候主要的考虑吗 ?

王国鑫3:20

我觉得作为一家公司 , 它从逻辑的角度还是要回答一个技术能为我带来什么 。 其实最早的京东健康之所以有一点 , 我们叫它有一部分 AI 的能力 , 是来自于这么一个事实 , 我们用最新的财报的话 , 我们每天是有四十九万路的医疗服务的进线 , 也就是说每天有四十九万人次在我们这里寻医问药 。 那这样的情况下 , 如果没有

类似 AI 的分诊技术 , 没有质控技术 , 一 , 我们满足不了这种精准的医患匹配 , 二 , 我们没有办法保证我线上的医疗服务都是合规合法的 。 所以我觉得京东之所以一开始做 AI 的技术 , 最本质的逻辑是首先先把一个业务装在合规的笼子里 , 同时让这个业务的成本能够越低越好 。 这就是我觉得它做 AI 第一个时代想做的事情 。AI

第二个时代的想做的事情 , 就是我们团队也做过类似数字疗法的工作 , 甚至一部分脑机接口的探索 , 都在想一件什么事情呢 ? 因为医疗本身我们不仅是 , 不仅是在线上给一个医生做个视频 , 打个电话 , 他就能解决的问题 , 我需要了解您日常的生活状态 , 了解您检验检查的状态 。 然后这种时候我就要用我们现在的行业的

话术呢 , 就要把我的数据向两头延长 , 在治病前的生 , 健康和治病后的这个状态 , 要向两端这样的延长 。 那在这种延长的情况下呢 , 数字疗法技术就是最重要的技术了 。 所以当时我们团队也做过了这个数字疗法的技术 , 然后再往后做的时候就进入大模型时代了 。 大模型时代最大的 , 我们叫它最大的吸引力 , 或者为什么

这个大模型时代 , 今天 ChatGPT 当年出来的时候给大家眼前一亮 , 实际上我觉得大家不完全是把它当一个产品看 , 而是它表现出高度的类人的水平 , 它的类人水平就表现在指令依存能力 。 所以在这个角度上讲 , 这一类的现在的大模型在医疗服务承担的就不仅仅是精准匹配 、 合规属性 , 甚至不仅仅是一个服务延长的问题了 , 而

是大家在想 , 一 , 我有没有可能创造类似医生服务水平的大模型 , 这样我能极度降低成本 。 二 , 如果这个大模型的水平进一步提升 , 是不是它可以成为我们生命伴随的一部分 , 就是能够长久地跟我们在一起 , 就像我的亲人一样 , 就像我们小时候父母关注我们的状态 , 太太关注我们的状态 , 到后来的子女关注我们状态 ,

这样的一个想法 。 所以我在想 , 这就是这一代大模型和前几代 AI 最根本的不同是 , 它尝试着去解决这个行业最根本的痛 , 痛点 , 就是供给能力 , 大概是这么一件事情 , 而且是一种低成本的方式 。 然后这里可能说一个小闲话 , 就是其实我在我们这个生活中有部分人他是能享有 , 因为他的社会地位也好 , 或者他的财富也好

, 他实际上能够享受这种专家级的服务 。 但是我们大部分的芸芸众生实际上是不太可能享受到这样的福利 , 因为我们社会是自然分层的 。 这种问题在欧美类比我们国内严重很多很多 , 他们的情况更 , 更严重 。 但反过来讲 , 我觉得 AI 所有给行业 , 既不仅是医疗 , 给行业都是一件事情 , 就是它能不能低成本地扩大供给 。 如

果它能低成本地扩大供给 , 那我们每个人都有一种均等的服务水平 , 那 OK, 那我们每个人都延长三到五岁 , 我相信这是所有做医疗 AI 的人最终极给这个社会 , 给这个国家创造的价值 , 我相信是 。

荣慧6:40

就我自己一直很喜欢一个说法 , 就是说其实大模型它可能会让很多人的工作效率拉开巨大的差距 , 但是它一定可以提供一个价值 , 是让所有人的这个情绪得到平权 。 什么意思呢 ? 就是在过去其实很多人这个呃 , 会有一些多多少少的心理疾病吧 , 但是他根本得不到很好的照料 , 得不到很好的回应 。 因为心理医生本来就是

一个严重稀缺的供给 , 呃 , 但是在现在这个大模型可以看见所有人 , 可以这个接住所有人的情绪 , 甚至提供一些抚慰 。 我想刚才这个 Nico 在讲的也是 , 就京东做健康大模型 , 可能是一个更加泛化 , 就从精神健康领域泛化到整个健康领域 , 可以给这个 , 呃 , 基本上所有人吧 , 带去大家所需要的这个在未来的一些医疗上的建

议或者指导 。

王国鑫7:28

这至少是我们的愿景 , 我也得努力 。

Koji杨远骋7:31

但是医疗就是垂直领域的模型 , 它需要非常多专业的数据嘛 。 我觉得医疗这个领域它可能很特别的一个地方是 , 它有一个优势是这些数据 , 首先它理论上应该是非常标准化的 , 但是它很难的地方就是这个采集的过程 , 和它的使用过程中所造成的影响也非常的大 。

数据之困7:31

王国鑫7:51

是是 , 我觉得这个问题我觉得可能我就回应一下荣慧 , 就是说 , 啊 , 我觉得是这样的 , 其实医疗有几个特点 , 我们叫痛并快乐着 。 就一方面确实因为我们国家过去很多年的 , 呃 , 这种信息化的推进 , 然后对医院的强考核 , 其实我们医院相对于其他的 , 呃 , 我觉得行业 , 它的数字化水平是高的 , 这是一个不可改变的事实

。 你看我们今天 , 呃 , 这些病例要严格地有它的规范 , 对吧 ? 然后我们所有的影像有云影像数据 , 然后有质控 , 国内的医疗体系花了巨大的力气去跑过了这个信息化的时代 。 这件事情是所有做医疗行业模型的我们叫做幸运 。 如果说今天让我平地起高楼 , 我们今天还是用纸质的 , 像咱们小时候一样纸质的这种报告 , 然后

挂号收工单 , 那谁也搞不掉哈 , 谁也搞不成 。 这个是我觉得这是一个幸运 , 但是其实它还有很多难度 。 难度我觉得在体现在几个方面 。 第一方面呢 , 就是医学数据本身 , 它很多时候它是不可能记录完全的 , 因为这里面可能有工作的需求 , 然后有医院流程的需求 , 而且甚至说它本身就不需求 , 因为它不需要记录那么大规

模的完整的数据 , 它只要解决用户的病患好了 , 因为它医院的第一责任还是救死扶伤嘛 。

荣慧9:09

所以现在记录的数据也是提炼过后的一些数据 。

王国鑫9:13

很多是提炼数据 , 而且它的质量水平也不见得都是能满足需求的 , 我觉得是第一点 。 第二点呢 , 就是模型的学习和人类的学习 , 它有一个差异 , 就是人类它很多时候是会在抽象空间去学习的 。 就比如说我们培养个医生 , 或者咱们不用培养医生 , 一般来说就看几个病例 , 跟主任看看几千个病例 , 医 -- 人是会有归纳能力的

。 在这个过程中 , 人往往是通过符号学习 , 一种归纳学习 , 然后能够提升这种认知水平的 。 但模型很多时候并不是这样子的 。 今天我们模型的训练方法还是基于原始数据的训练方法为主 , 那在这个就要求说它有大规模的推理数据 , 或者大规模的原始数据 , 但是这件事情在医疗中并不存在 。 我们很多时候看到了患者有个

症状 , 一个重要的医生 , 他经过脑子想了之后 , 他经过判断了之后 , 他在病历中写下了他的判断 , 他的思考过程是没有的 。 但是这件事情呢 , 很多时候人通过大量的归纳 , 包括我们的口口相传 , 他实际上是有提 -- 习得的能力的 。 这也是为什么其实最近大家也说 , 其实过去几年一个很酷的词叫 self learning 的地方 , 就是说模型什

么时候能学会 learn, 这件事情可能是下一个 AGI 中重要的一个组成部分 。 我觉得这第二点 , 就是它的数据本身就是有这样的问题 。 第三点呢 , 我觉得它里面还有几个特点呢 , 就是数据的敏感性和复杂性 。 在这个过程中呢 , 其实您怎么来看这个问题 ? 我们重要的病例 , 或者大家 , 我今天生病哈 , 我也是可能是跑好几个医院 , 首

先它的数据就天然在物理上分散了 。 第二点呢 , 它的数据确权也有问题 , 就是今天这个数据在转化的程度上 , 它属于医院 , 还是属于医生 , 还是属于我 , 有这方面的问题 , 所以它有敏感性的问题 。 那第三点呢 , 它有专业性的壁垒 。 那同样的道理 , 你看我们最近的检验检查互认才 , 才大规模地推广 , 以前我们检验检查都

不互认 , 原因是为什么 ? 是即便是我们做一个 CT, 也可能因为设备的原因 , 也可能因为医技的原因 , 从而导致它的结果不见得完完全全就是可被共识的 。 这 , 这倒真不是因为医院想挣那个钱 , 它很有 , 很有可能是这么一个情况 , 它为了降低这个医疗的这个风险 。 所以在这个地方讲 , 就是它的复杂性 , 它的敏感性和专业壁

垒比较高 。 这也是为什么医疗模型它是一个 , 我们认为它在垂类里就是真的是最难 , 但同时也是较 -- 最 , 我觉得最有存在价值的一类垂类模型的原因吧 。 就是我们今天面临的困难 , 所有做这个行业的人都面临 , 所以大家其实在同一赛道上 , 它 , 它很难用单点的技术优势去 , 去改变这件事情 。

荣慧11:44

啊 , 说到这个垂直模型啊 , 正好想追问一下 , 就在您看来 , 除了医疗的垂类模型 , 还有哪些行业有出现一个垂类模型的必要的 ? 因为今天其实现在有一个论调 , 叫做基模会变得越来越厉害 , 啊基模很可能之后会满足这个泛化的很多的需求 , 但是看上去医疗这个领域是需要大模型的 。 然后在您看来 , 还有哪些领域需要这

垂类模型12:06

荣慧12:06

样的垂直大模型 ? 这背后可不可以抽象出一些 , 就是需要这样的模型的垂直领域 , 它具备哪些特征 ?

王国鑫12:14

嗯 , 我觉得咱们先回答您最后一个问题 , 就是抽象的这个问题 。 因为我自己在内部也申请预算 , 然后跟 , 跟管理层申请预算 , 所以我必须得回答为什么要做这个事情的必要性 , 那我肯定要抽象出一个逻辑来 。 我觉得一个逻辑有几个点 , 第一个点就是它这个行业的数据 , 或者是不是相对于低成本可获取的 , 或者低成本可

模拟的 , 那这件事情就是一个 , 呃 , 一个行业的必要性 , 这是第一点 。 第二点呢 , 就是它的今天的商业模式是不是很鲜见的 。 诶这个话题很有意思 , 就是很鲜见的 。 如果是很鲜见的东西 , 你可能也不见得真有垂类的机会 。 然后这是我 , 这是我从一个从数据的要求角度 , 再从一个商业化的角度 , 用二维空间去划分的哈 。

比如说咱们举个例子 , 数据如果是很鲜见的 , 而且是低成本可以模拟的 , 那换句话说 , 这个行业本身的知识门槛不高 , 那这个行业的本身知识门槛不高 , 或者是说这个行业所过去所掌握的这份经验被新的技术所能容易替代 , 那这件事情就比较费劲 。 比如说咱们都说教育模型 , 或者叫做我是一个更好的数学老师 , 或者是

一个更好的英语老师 。 今天我们普遍认为学习语言这件事情 ,AI 的教育能力可能要比人的教育能力要高 , 原因是它的知识是鲜见的 , 可模拟的 , 同时呢 , 它能克服大家的这种心理状态 , 比如说我对陌生人讲外语 , 能克服大量的这种心理状态 , 所以我们是这样子的 。 还有一点呢 , 就是它的知识不见得是外显的 , 甚至有可能

我需要花很大的力气去治理 , 但是呢 , 它的商业模式足够清晰 。 那这件事情在摆在我们面前的是什么 ? 是代码 。 您可以看现在的代码模型往往是个独立的模型 , 甚至我们认为 Claude 可能就是一个专门为代码优化的模型 , 我们甚至可以这么讲 , 对吧 ? 就是像一家公司的所有商业模式压在了一个垂模上 。 某种意义上说 , 我们今

天看到的所谓的 coder 的 model, 其实就是个垂模 , 是吧 ? 那它为什么这件事情也是通用模型公司的菜呢 ? 原因就是它的商业太让通用公司无法拒绝 。 今天 , 今天哪有一个通用公司不写代码 ? 就是换句话说 , 就是我们这帮人 , 可能咱们跨领域的成本太高了 , 所以所有的公司都有个欲望说 , 哎 , 怎么能把 Nico 这个团队不要 , 然后全部

让它机器的人就能干 。 当然这是玩笑话了哈 。 但是 , 但是它的商业模式是极其外显的 。 所以呢 , 就是在我们里讲所谓的垂模就有两点 , 第一点就是它的数据是否拥有独占性以及独特性 , 且不迫切性 。 第二点呢 , 就是它的商业模式是不是足够清晰 , 已经足够高到说大家不能去放弃它 。

荣慧14:44

对 , 想到 -

王国鑫14:45

所以就是我们 , 对 。

荣慧14:46

哎 , 就想到我们上一期播客的嘉宾是 3D 大模型的这个创始人 , 他们这个 Vast 啊 , 然后他也提到他们的这个训练的数据是他们一个非常核心的竞争力 。 然后当问到 , 哎 , 你们的这个数据从哪来的时候 , 他说如果这个都说了 , 我们的最底层的商业机密就被透露了 。 我们再说回咱们的医疗大模型啊 , 就是在您看来 , 呃 , 今天仍

AI助医15:08

荣慧15:08

然会有看病难 、 看病贵 , 就这些大家都熟悉的问题 。 然后我们一开始也提到了这个你们的愿景是要让 AI 去改变 , 那到目前为止啊 , 就到咱们录播客这个 2025 年 9 月份的这个时间为止 , 就您看到 AI 已经带去了哪些改变了 , 有哪些又是你觉得可能在未来三五年之内会慢慢带来的新的改变 ?

王国鑫15:30

我觉得 AI 首先改变了一个 , 就是信息获取的平权 , 这件事情其实是了不得的一件事情 。 然后您可以看说大家以前 , 其实你看 , 我们就不要提具体的公司的名字 , 以前我们大家当有病患的时候 , 第一反应都是采用搜索引擎的方式去获得信息 , 而搜索引擎固有的商业模式 , 它是竞价排名的商业模式 。 所以在这个过程中 , 啊

, 以前也跟 , 呃 , 政府的合规的部门 , 然后去探讨的时候 , 就在谈说很多时候这种商业模式本身就促进了这种信息的错配 , 而不是信息的合理适配 。 那今天大模型解决了一个问题 , 是说我们大家对于所有大模型的衡量 , 都是它是否能够更遵守 , 遵守物理的实际结果 。 而且今天大模型本身在上面 , 我们当然大家都在思考

商业模式 , 但很少有人思考的商业模式是说我解决一个信息匹配的问题 。 我们所有的商业模式都是在于说我能给你提供高质量的 AI 的绝对高质量的知识和信息服务的基础上 , 我在想怎么做商业模式 。 所以没有人去挑战这个信息匹配的问题 , 它从一个信息匹配变成了一个信息绝对正确的生成 。 所有团队最终追求的都是这

个目标 , 最优秀的团队都在追求这个目标 。 所以 AI 今天大家其实很多时候不要去低估我们今天从一个原有的搜索引擎的模式转变成一个问答或者 chatbot 的模式 , 它实际上背后蕴含着我们普通人获得信息的准确性在极快速地升高 。 所以这件事情如果能从医疗的角度 , 所谓的看病难 、 看病贵 , 在这个前提是有一个健康认知 , 就

首先大家要尽可能地减少疾病的发生 。 其实这件事情很多时候这种重点我们被 , 被我们忽视了 。 比如说最简单的 , 我们 , 呃 , 人均的四十岁以上人群的胃肠镜的渗透率 , 然后比如说我们体检的渗透率 , 比如说我们检验讲它质量的把握 , 其实这些技术在很大程度上说都可以通过 AI 的帮助或者 AI 的辅助渗透进一步的教育 ,

我们叫做教育患者 , 或者叫教育整个社会 。

荣慧17:34

所以这也就是说大家在和 AI 对话的过程中 , 可能会听到更多来自 AI 的这样的健康建议 , 所以更多地去做体检 , 去提前做胃肠镜等等 。

王国鑫17:44

对 , 我觉得这件事情我觉得是首先第一步怎么可得的 。 第二步呢 , 我们今天谈 , 就是今天当时当刻我们今天在解决什么问题 , 今天当时当刻我们实际上在解决这么一个问题 , 就是说我们能不能通过模型首先解决一个分诊的问题 , 或者我们能够区分用户的状态的问题 。 那我可能识别你是轻症还是重症还是急症 , 我们通过

轻症的方式 , 我们给出你标准的解决方案 。 我们重症和急症 , 我们能够直接快速地链接到医疗服务资源 。 那这件事情原有的 AI 是原有的系统都做不到 。 为什么 ? 我们原有的系统 , 大家看看这种信息系统 , 要么我们到快速地到线下挂号 , 或者我到互联网医院去找一个医生 。 但现在的做法不一样了 。 如果有一个 AI, 它首先平

时日常已经在搜集你的数据 , 这种关键的时候呢 , 它又能针对你的这种病情变化 , 能更好地直接导向你具体的资源结果 , 它解决了一个匹配成本的问题 , 所以看病的复杂性被降低了 , 这是我们觉得讲的第二个事情 , 它不见得是解决看病难 , 但它是复杂程度以及心理门槛被事实上降低了 。 第三点就是回答一个最根本的问

题了 , 就是今天的 AI 的辅助诊疗能够做到一个什么样的水位了 , 这就是所有做 AI 大模型的人最终的一个阵地 , 战场 。 就是说我如果我的辅助诊疗能够高可信 , 然后人工这个时候很多时候只是去 check, 只是去 review 这个结果 , 那这样子的情况下 , 我就能够至少在普通的疾病上 , 我就能够把我的这种服务能力向七乘二十四小时延伸

, 我对于人的要求就逐步降低了 , 这样子的话 , 在一定程度上解决了看病难的问题 。 最后我们讲讲那个看病贵啊 , 看病贵其实讲的是急症的问题或者重症的问题 , 我们很多是这么一个问题 , 特别是重症的问题 。 那我们这个时候 AI 对它的最大的帮助不在医疗服务层面 , 而是在于疗法研发层面 。 今天的 AI 有几个东西其实没

有被或者叫做可以被更加地挖掘 , 一个是 AI 对于科研能力的帮助 。 今天每天行业内 , 我 , 我忘了一个具体数字了 , 就是每天有多少医学的论文去发表 , 包括我自己所在的 AI 行业 。 坦诚地讲 , 我今天是看不完我这个行业的论文的 , 我只能去看那些最高水平的论文 。 所以对于一个医生来说 , 他是 , 他是一个终身学习的行业

。 所以我们很多时候去解看病贵的时候 , 我们的一个大的呼吁都是应该有医生的服务型的 AI, 能够持续地提升 AI 的能力 , 而 , 而医生的能力 , 这件事情反过来其实才能提升我们整体的卫生水平 , 因为医生不行是根本性的 , 医生不行那就这肯定是不行 。 所以我们就是能解这么一个问题 。 第二点呢 ,AI 今天坦诚地讲 , 是制药或

者我们新疗法研发中的一个必要的核心组件 , 只是说它不像我们今天所谓的 ChatGPT 这样是一个 To C 的产品 , 大家感知更强 。 我们今天 , 今年我们看到了创新药的行情 , 其实背后的逻辑是中国避地出海的水平变高了 , 我们的这个 license 卖得变多了 , 那一定是因为中国的这帮企业掌握了更新的研发能力 , 提升了我们新药研发的速度

。 所以这件事情在背后实际上是解决看病贵的一个根本的逻辑 。 所以总结来看 , 我们其实几点 , 就是一个就是提升我们本身的意识 , 降低我们拿到错 , 错误信息的概率 , 那 AI 就是给我们正确的信息 。 第二点呢 , 是解决我们轻症或者级别的这种 , 这种所谓的诊断 , 让它的辅助诊断水平进一步的提升 , 让大家的心理门槛降

低 , 让大家的服务门槛降低 。 那最后一点呢 , 它不论是在医生的培训上 , 还是在新疗法或者新药的研发上 ,AI 其实是一个决定性的要素 。 所以大概我觉得看病难 、 看病贵 , 如果从长周期的角度上讲 , 这三件事情应该是最重要的能改变的点 。

Koji杨远骋21:26

你刚才提到这个愿景很美好 , 但我觉得这里面其实还有一个问题是 , 就是解决这个医生整体这个资源比较少的这个问题 , 但是其实还有一个很大的门槛是对于更多的人来说 , 他用 AI 它其实也需要被教育 , 它也有很高的门槛 。

王国鑫21:44

嗯 , 这件事情本身其实到 , 呃 , 我可能有一点不同的观点 , 就是说 , 呃 , 我那个 , 呃 , 给您举一个小案例哈 , 然后那个案例让我当时对这个问题产生了巨大的怀疑 。 就是有一次我坐航班 , 那个航班晚点了 , 然后呢 , 我 , 我肯定闲得无聊 , 然后我就旁边有个大爷 , 然后那个大爷就拿出手机来拍这个机舱 , 然后我就比较敏

感 , 我就觉得他在干什么 , 就是不好意思 , 就看了一下人家的屏幕哈 , 很不 , 很不应该 , 但是干了这个事儿 。 然后他就再问一个 chat bot, 就说 , 哎 , 这是个什么飞机 , 然后机型怎么样 , 然后 , 呃 , 哪个位置最舒服 , 然后怎么怎么样的问题 。 就是说 , 就是我会觉得 , 尤其是在中国 , 其实 , 其实 AI 的产品的渗透率今天有点超乎

人们的实际预期 , 是有点超乎人们的预期 。 只不过是今天的 AI 的产品 , 它好像没有我们经历的移动互联网那个时代那么在 C 端上那么出挑 , 但是在某种程度上说 , 它在信息服务上已经让人产生了一个很惊讶的表现了 。 然后从实际的那个行业数据来说也能看到 , 就是说在十几岁孩子的渗透率和在四五十岁人群以上的渗透

率 ,AI 都表现很好 , 这是也是表现出人群渗透率双高的一个表现 。 所以我在讲今天 AI, 你看 , 至少我们今天可以说一个模式 ,AI 的 chat bot 某种程度上说可能要把搜索引擎这个形态在一定程度上说扫到垃圾箱里了 , 至少在中国哈 , 至少我们可以 , 可以大概可能说一个很危险的言论 , 但是可以这么去探索 。 也是为什么其实去年 Google 曾

经一段时间的股价如此承压的一个表现 , 这也是其实在别人眼中看 , 说 AI 的这种知识 , 它直接给我 information, 直接给我 knowledge, 你已经直接给我 knowledge 和 answer 的时候 , 我为什么要看 information? 所以 , 所以站在这个角度上看 , 就是我是觉得 AI 的 , 对于 AI 产品的渗透力 , 我是保持一个高度乐观的 。 而且我 , 我的一个观点就是 , 不论是咱们三个 , 我相信在

座的所有人 , 甚至所有听众 , 我 -- 大家幻想一下 , 大家想象一下 , 能不能回到三年前没有 AI 的时代 , 我们今天的生活能不能回到那个时候 , 您的日常生活 , 您的生活能不能回到 , 我相信是这个答案是否定的 。

荣慧23:52

我昨天看到一个问题 , 就是说给你多少钱 , 你愿意过上这个没有 AI 的生活 , 然后前提是旁边的人都有 AI, 就只有你没有 , 你愿意就是 take 多少钱 。 对 , 然后我当时认真地想了一下 , 我觉得哇 , 这个真的对我来说好像非常的困难啊 , 比如说给我一个亿 , 我同不同意 ? 我觉得我都 , 都认真地想了一想 。

王国鑫24:14

非常非常困难 , 因为 , 因为这个就是这种生产力背后的巨大的认知代差 , 它有时候不是能用单点的金钱去衡量的 。 就像我们在移动 , 因为我自己正好经历过那个从互联网到移动互联网的时代 , 那个时候我记得最大的一个特点就是不可速 , 你感觉所有的事情好像那个东西本身就 , 就 PC 上做得很好 , 但是不可速的 , 就是这

个过程是不可速的 。 所以我们的 AI 今天 , 我觉得 AI 今天的特别一个生产力 , 它很多时候表现有 B 端的属性 , 所以我们在 C 端上 , 它的特点还没有那么大的进化 。 但是坦诚地讲 , 我们的这个产品的渗透率已经足够优秀 , 否则今天不会所有的产品都好像一个默认的动作 , 就是把搜索框变大是吧 , 你也不知道为什么 。

荣慧24:59

是的 , 我觉得还是这个 , 我也 , 我也同样很乐观吧 。

模型升级25:02

Koji杨远骋25:02

这个说回这个垂直模型哈 , 这个我们来说一说 , 就是你们这个京医千询模型从应该是二三年发的一点零到最近的这个二点零 , 可以给我们的听众大概介绍和科普一下这个模型它的主要的进化都体现在哪些地方吗 ?

王国鑫25:21

我觉得 , 嗯 , 主要其实进化体现在两个地方 , 第一点就是我们的研究模式发生了比较大的变化 , 就是在一的时候 , 我们普遍还是使用这种 , 啊 , 我们叫它 , 叫做 , 叫做所谓的真实的知识数据 , 比如说论文也好 , 或者是学科的文章也好 , 或者是教科书也好 , 然后大量的真实病例也好 , 然后这是我们构成了我们一个大的数

据底层 。 在二的时候 , 我们实际上花了很大的力气做了大量的合成数据的努力 。 所以这次京医千询 2.0 不仅是一个模型 , 我们这次把我们在医患对话的合成的 agent 也免费向行业开放 。 它虽然不是开源的 , 但是大家 , 大家可以通过这个接口去服务 。 那这件事情一个好处 , 对行业的一个贡献 , 就是行业可以通过这个接口 , 可以

尽可能地模拟真实的医患对话 。 这个事情在所有 -

荣慧26:10

他是直接来取到你们的模拟数据 , 还是他自己进来也可以开启模拟 ?

王国鑫26:14

他可以进来开启模拟 , 就是他就是一个医生 , 然后您可以问他任何问题 , 您可以帮他模拟问诊 , 他就可以帮你模拟诊间的一个患者和医生的真实对话 。 但所有的数据都是 , 就是背后都是 , 就是我们训练的一个模型去支撑的 。 所以这件事情您可以认为说算是我们有一个新的认知 , 就是 , 就刚才正好回应那个荣辉的观点 ,

就是其实医疗模型很多时候不能完全基于现有的数据 , 因为这个现有的数据实在是太困难获得 , 所以模拟数据或者叫 , 我们叫合成数据 , 或者叫 agent 模拟是一个必然的路径 。 所以二点零 , 我们的第一个变化是 , 在里面我们还是采用了大量的合成数据 , 而且我们评估这个合成数据应该是高水平的 , 这也有赖于京东健康实际

上每天有四十九万录的问诊 , 有赖于这个 , 所以我觉得我们是有 , 我们是有 , 有本事 , 或者我们是有基础做这件事情 , 所以这是我们觉得在数据层面的第一个问题 。 第二个层面的问题是在这个模态层面的问题 , 就是这次其实我们一个大的改进是在单一的模型里能够支持影像数据 , 我们支持 CT、MRI、X 光都能支持 , 因为这件事情

是来自于一个真实实践 , 就是说在医疗领域里 , 如果我们就把自己锁定在文本模态 , 它跟真实的世界离得很远 。 今天哪怕是我们如果已经咳嗽超过一周以上 , 其实医生都建议做一个筛查 , 对吧 ? 更何况就是更复杂的这种疾病 。 影像在我们这个生活中今天是一个最重要的一个诊断工具 , 所以我们一 , 二和一相比 , 就是在

模态层面上经历了一个巨大的去 , 提升 , 就是它不仅能够理解这种医学的语言吧 , 还能够精准地理解这种影像的资料 , 我觉得这是二上面的区别 。 第三点区别呢 , 就是在推理上的变化 。 以前我们推理 , 其实 , 其实我以前也说过 , 其实我挺不喜欢这个词的 , 因为这个词在中文翻译中它有二义性 , 因为当我们提推理的时候

, 其实讲的是像咱们 , 咱们这种人类的水平是吧 , 在哲学层面的推理 , 我可以去联想 , 可以去思考 。 其实模型的推理 , 我觉得咱们坦诚地讲 , 其实它更像是一个 , 呃 , 格式学习 , 然后它通过更多的算力以提升了最终答案的准确度 , 是这么一件事情 。 或者它不是我们说的哲学层面的推理 , 不是人的推理 , 至少我是这么认

知的哈 , 但可能跟 AGI 派可能有点不一样 , 我是不是这么认知的 。 所以反过来讲 , 就是我们这次推理呢 , 就是说这是首在医疗的行业中一个特点 , 就是你的推理过程首先也得被验证 , 那这件事情我们也跟我们的循证库进行了对接 。 举例来说 , 我的推理过程是 , 因为 A、B、C,A 我是通过哪个证据拿到的 ,B 我是通过哪个证据拿到的 ,C

我是通过哪个证据拿到的 , 然后我们还把证据分了等级 , 比如说在最高的期刊发表的论文 , 最好的期刊发表的论文 , 或者国家颁布的指南 , 那我们认为它的证据等级最高 , 我也是基于这种证据等级所做的如下的诊断和判断 。 所以您可以认为说我们这一波推理 , 我们叫做循证推理 , 而不仅仅单单的是说一个推理的模式 ,

或者我用消耗更多的 token 不断让它去思考 , 这么一种方式做 。 所以这是三个大的演进 , 在这三个大的演进上 , 我们认为是 , 啊 , 千询 2 值得起一个新的版本号的一个原因吧 。 然后另外就是它有个很酷的 demo, 就是说它可以 , 它的思考的过程 , 就是我们刚才说推理的思考过程 , 它实际上是一个多模态的 , 也就是说我们不仅仅是

在文本层面说因为 A、B、C, 那我们可以拿个影像的片子 , 然后它甚至可以锚定到某个病灶 , 说我基于这个病灶的状态 , 我是做这样的推理 , 基于你肺部的这个状态 , 我能做这样的推理 。 所以它的推理过程不仅仅是一个文本的 , 它是一个多模态交互式的这么一个推理 。

荣慧29:47

刚才您提到第一个大升级 , 就是用了非常多的合成数据 , 这个合成数据我理解其实是医患之间的问诊对话 , 然后您也提到说你们用很多办法去验证这个对话 , 它的真实性 , 啊 , 以此才能拿去做训练嘛 。 但是我好奇的就是 , 呃 , 怎么去验证这个医患之间的对话所谓的真实性啊 。

验证之道29:47

王国鑫30:07

其实这个问题就得回答那个 , 正好就是所有医疗的那个问题可以一并要回答 , 就是说 , 啊 , 数据的准确性 、 模型的准确性 , 以及经常有人被挑战说你这个 , 你这模型怎么验证的 , 其实就这个问题啊 。 在我们内部实际上是这么一个流程 , 在我们研发过程中 , 我们肯定是做了很多评测数据集 , 然后自身的去 , 去对比这个数

据集的优劣 。 但是我们任何一个 launch, 就是模型 , 我们指的 launch 不仅是对外开源 , 就是我们上线一个 launch, 实际上我们一般是经三步的人工验证 , 坦诚地讲 , 这个就是很成本很高 。 第一点我们叫 in-house 验证 , 就是因为京东健康本身是有一个大的全科医生的团队 , 我们叫 in-house doctor, 就是说 , 啊 , 这些医生都是京东健康的雇员 , 然后所以他们会

对这个进行一个科室的分布的评价 。 然后我们主要是通过五六个核心的指标去衡量 , 包括它的忠实性 , 包括它的准确性 、 专业准确性 , 包括它的流畅度 , 包括它的一致性等等这些问题 。 第二点呢 , 我们就有一个 third party, 我们跟几个大的医学院有合作 , 啊 , 当然也是因为商业合作的原因 , 我们就不方便提 , 就是说他们会有一

个 third party 的组织来帮我们 , 就是说我们一个大的 launch 之后 , 然后我们因为有一些合作关系 , 这样的话我们他们会先拿到我们的模型 , 然后去 , 去 , 去做二次评估 。 然后第三点呢 , 就是我们会有一个更大层面的 , 大概一百多人的专家团队的评估 , 那这个就不仅仅是一个 , 不是 third party, 也不是这个 in-house, 而是我们组织的这个质控委员会

了 , 啊它是来自于真正医生 , 然后来去看 。 所以今天呢 , 特别坦诚地讲 , 就是这个 , 通过这个工作 , 我就一下子回想起来 , 那个因为我们这个工作很重嘛 , 我就一下子回想起来 , 那个 OpenAI 不是发了篇文章叫 Health Bench, 然后当时那篇文章的时候 , 我记得 CEO 还问我说这篇文章代表什么含义 , 然后我就 , 我就跟他讲 , 代表着 OpenAI 验证医

疗模型也得用人我说 。 所以它那个 Health Bench 你可以知道 , 它大概是六十多名医生 , 其中有中国的医生参与 , 然后大家去手写的这么一个 , 当然它也用了很多技术的方法来手写的这么一个 , 一个 bench 吧 。 然后所以我 , 我们自己内部的就是有三层的这么一种 , 这种模式 。

荣慧32:17

啊因为咱们合成的数据的量应该是非常大的 , 在只有一百个这种数据校验的专业的团队的情况下 , 我们怎么才能够去核验那么多数据呢 ?

王国鑫32:27

对 , 其实这个流程挺简单的 , 您可以把它想成一个漏斗 , 就是说首先呢 , 漏 , 漏斗不是一天灌满的 , 这是第一点 。 所以我在我持续迭代的过程中 , 能知道模型的问题 , 以及它合成数据的 bug 在容易出现的地方 , 所以这样的话 , 我自然就把合成数据分级了 , 这是第一点 。 第二点 , 每个漏斗的上方都是技术手段 , 对吧 ? 我的

技术手段尽可能地去模拟下方的医生 , 就是我尽可能希望我用机器的评估的方式要接近人的评估水平 。 那所有上面的 , 上位的这种机器的工作团队都在想怎么去模拟下面的一个机器的评测水 -- 人工的评测水平 。 所以您可以认为这是一个漏斗 。 研发的同学解决的是我尽可能要把少的数据漏到下面去 , 然后 , 但是同时技术

的角度是说 , 我要尽可能把那些严重的问题漏到下面去 。 所以您可以认为说它是一个持续迭代的漏斗 。 但如果您说它是不是 , 我们是不是每条数据都看过 , 这确实不是 。 但如果说我们某种意义上说 , 呃 , 就是大模型是个什么 , 大模型是个贝叶斯 , 是个概率嘛 , 那就是在概率角度上说 , 我们尽可能地提升这个概率 , 那我

觉得是这个答案 , 就是尽可能地要把重的 、 严重的 , 然后容易错的往下漏 , 尽可能要把简单的 、 直接的往上浮 。 啊当然这里面有一些技术手段去做 。

荣慧33:40

明白 。 哎 , 其实说到这个模型水平啊 , 然后我自己就有一个非常大的好奇 , 就是我今天如果身体不舒服或怎么样 , 我其实还是会去第一反应问 ChatGPT, 然后我感觉它其实多多少少也能给我我自己认为还蛮准确的答复的 。 呃 , 所以我也很想知道 , 就是咱们还是这个八十人的团队 , 对吧 , 然后大家付出了那么多的时间 、 精力 , 努

力去训医疗大模型 , 那在比如说哪些地方是可以做得比基础大模型更好的 ? 比如说有没有 , 呃 , 一个比较具体的问题 , 呃 , 我如果问咱们比起去问 ChatGPT, 哦我就是可以得到确实更准确 、 更全面的一些回应 。

王国鑫34:21

我觉得这个例子其实蛮多哈 , 我觉得可以举两个角度去看这个问题 , 一个讲一个单模态的 , 一个讲一个多模态的 。 我们先从单模态的来讲吧 。 其实今天的大模型呢 , 就是真正的医疗大模型 , 它需要 , 叫我们内部讲到拟人能力吧 , 当然这个词其实有点二义性 , 其实我们是拟专家能力或者拟医生能力 , 我觉得更重要是这么

一个点 。 所以很多时候当我们在看到这种所谓的这个 GPT 也好 , 或者看到 Grok 也好 , 然后我们很多时候 , 因为我们本身是患者 , 所以可以不厌其烦地去回答这些问题 。 但如果从医生的视角 , 你就会发现 , 从医生的角度上看 , 医生要的是说通过短的对话 , 通过核心的问题 , 通 -- 然后快速地做一个判断 。

荣慧35:06

嗯 。

王国鑫35:06

那这件事情说在模型的角度 , 它就不是一个事无巨细的问答 , 而是说基于某个专病的核心谈 -- 核心问答 。 所以在这个过程中 , 其实您可以看到说这就是一个通用模型和专用模型在行业知识上的一个区别 。 因为通用模型它很多时候说基于你的症状 , 它可能通过教科书学 , 这个症状可能有这么多种问题 , 可能有零零总总这

么多种问题 , 然后它为了排除一切概率 , 它就把所有的问题都问掉了 , 对吧 ? 然后从而最后给你一个相对全面的一个答案 。 但实际上医疗模型它很多时候 , 虽然我们说做诊断这个词很敏感 , 因为有合规性问题 , 但是真正的医疗模型它得基于类似医生那样的 , 呃 , 重点的问题 , 重点询问 , 然后基于您的所有的信息快速地

做出一个判断 , 而不是事无巨细地说你可能有一个 、 三个 、 四个 、 五个问题 , 这其实是不对的啊 。 所以我觉得这是我们叫它不能叫做通用模型不能做 , 而是说它不符合医学伦理或者医学实践 。 我们来讲第一个问题 。 第二个问题就是 , 如果从多模态的角度 , 其实就更有意思了 。 大家其实我们今天经常使用的一个问题是吧

, 拍一种什么照片 , 或者 , 呃 , 经常我们说搜篇论文 , 然后让它给我翻译 , 其实这都用了的这个多模态能力 。 但如果您可以去试一下 , 如果用我们这种 GPT 也好 , 或者是其他的模型 , 就去让它去看影像 , 您可以认为说它其实效率就会大打折扣 。

荣慧36:27

嗯 。

王国鑫36:27

然后 , 而我们的模型是专门为影像去设计的 , 比如说它对于这种 , 呃 , 专业词汇叫 positioning 啊 , 叫做 , 或者叫做 , 呃 , 或者叫 placing, 然后就是说它对于这个脏器位置 、 左右的对称的敏感度 , 或者是小的病灶都很高 。 但是模型的话 , 大的模型的话 , 它其实不会对于这种多模态的数据进行一个专门的优化 。 就我说了 , 其实对它来说这

不是一个大的商业模式机会 , 同时也有数据墙 。 所以在这个角度上看 , 在多模态的效果上 , 我们自己评测实际上是差异还是比较明显的 。

荣慧37:01

了解 。

王国鑫37:01

这大概是我们两 - 两个能讲两个 , 两个方面的案例啊 。

荣慧37:05

对 , 多模态其实我非常容易理解啊 , 然后在这个单模态 , 比如我们就说文字的一个问题 , 比如说有没有一个具体什么问题 , 我 - 我想比如说我说我今天感冒了 , 那可能两边机模和垂直模型得到的答复差不多 , 但是比如说我要上升到一个什么样的复杂度 、 专业度的问题 , 就是可能就会不一样呢 ?

王国鑫37:26

其实您只 , 您可以去尝试问一下 , 比如说最简单的 , 我今天发烧了 , 就这么一个问题 , 然后您可以试一下我们的 agent 和通模之间的一个比较明显的本质区别 。 而且最好是这个产生的结果可以用真人医生的角度再去 review 一下 , 你就会发现说不同的模型对于医学的遵守或者专家习惯的遵守是差异是相当相当大的 。 如果你说我那

边发烧了 , 一般的通用模型可能会事无巨细地问你很多问题 , 因为在它的学习里 , 它的 , 因为发烧是一个极其通用的症状 , 但实际上在卫生经济学角度其实不会这样 。

荣慧38:02

哎 , 我 - 我们下来可以这个在机模和在咱们的模型里面啊 , 就分别去问 , 然后把这个链接附在我们播客的 show notes 里面 , 然后感兴趣的朋友也可以去对比看一看 。

Koji杨远骋38:11

其实我还是比较好奇 , 就是因为像 OpenAI 他们也会就是基于医疗这个 , 基于医疗这个方向有一些比如说跑分 , 然后我看你们也 - 也在公布那个 Med-bench, 对吧 , 上面的一个成绩 。 就是 , 那对 , 其实对 , 我觉得对普通用户来说 , 可能大家最直观的就是去看 , 哎 , 谁跑分跑的成绩高 , 怎么样让普通用户更直观地感受到这个准确性 。

王国鑫38:33

其实我觉得您刚才说的这个问题是一个服务体验的问题 , 就是说 , 就是所有的大模型 , 如果一旦 to C 之后 , 我们叫它体验拐点的问题 , 而不单纯是一个跑分的问题 。 坦诚地讲 , 跑分它实际上更多是一个技术拉动 , 就是说 , 哎 , 我们要做到那个水位 , 我要做什么 。 很多时候跑分和实际的产品体验之间其实没有百分之百的

关联性 。 其实这也是今天大模型评测的一个核心困难 , 就是说反正大家都不错 , 都不差 , 但是在真实业界的时候 , 真实使用的时候 , 可能 , 哎 , 好像差异还有一些 。 那在这里面其实有模型本身的问题 , 有产品设计的问题 , 甚至还有交互设计的问题 , 所以这就涉及到模型和以及 AI 产品该如何设计的问题 , 可能今天不是咱

们今天的话题了 , 所以这是第一点 。 第二点 , 我觉得什么是好的一个体验呢 ? 就是在我们认知中 , 呃 , 像专家那样的 , 呃 , 服务能力或者是服务体验 , 就是一种好的体验 , 就是我尽可能地 , 呃 , 模拟专家 , 就是我们好的一个服务体验 , 这是第一个我们的认知哈 。 第二个我们的认知是站在我的角度 , 呃 , 很 , 最重要 , 医

学最重要的不完全是一个体验问题 , 医学最重要的还是它的诊断准确和处置方案有效的问题 。 所以就是在我们这里面 , 可能专业性的要求在一定程度上说压过 , 甚至是压过 , 当然我们也有评测啊 , 甚至是压过了所谓服务能力这件事情 , 或者叫服务体验这件事情 。 当然其实 , 呃 , 这么说可能有一点绝对主义哈 , 好像其实

在我们内部 , 我们也当然也训练这个模型的共情能力 , 也希望它不要那么没情商是吧 , 说点漂亮话 , 然后天冷了也会嘘寒问暖 , 根据这个 context 训练嘘寒问暖 。 我 , 但是我只是说这部分能力某种程度上说它是可以剥离在医疗模型之外的 , 就是它是一个通用能力 , 说漂亮话是一个通用能力 , 而医疗最根本的圣杯还是诊断准确

和处置方案有效这两件事情是永远绕不过的 。 所以 , 呃 , 所以这就是可能不同人的观点 。 就是站在我的角度 , 我觉得这两件事情只要能够做到 , 然后接下来做的事情是用一个更好的产品去服务消费者就可以了 。 至于跑分这个事情 , 呃 , 我自己一直我们自己内部的状态就是可以跑也可以不跑 , 甚至也经 , 我经常其实被人

去问说跑不跑 , 其实我自己觉得说这件事情 , 很多 , 很多时候这个跑分的结果和我们 in-house, 就我们内 - 内部资深的专家评估 , 它有时候对不上 。 那站在我的角度 , 我还是更相信真正专家的评价指标吧 , 这可能是这么一个情况 。

荣慧41:09

因为其实跑分就是这个分也是由另外一群专家所定义出来的评判维度嘛 , 只是说大家可能不同的专家群体 , 他定义的评判维度不太一样 。

王国鑫41:18

对 , 而且它是定死的 , 我觉得 。

共情与专业41:18

荣慧41:20

嗯 , 哎 , 其实说回刚才那个用户体验 、 交互体验的话题啊 , 昨天在 JDD 大会上 , 然后我看到咱们这个京医千询的也有一个这个很大的展区 , 然后我去和产品经理交流 , 我就有问他同样的问题 , 就我的一个这个医学问题 , 问机模和问你们有什么区别 。 然后他其实给了我一个很有趣的一个答案 。 他说其实在咱们的 APP 里面 , 就

京东健康 APP 里面会见患者档案 , 然后你在使用这个京东健康的 APP 的过程当中 , 你过去的所有的这个疾病史和慢病史我们都是知道的 。 因此不同的人问同样的问题 , 就会根据你个人的健康情况 、 慢病情况给出所不一样的答复 。

王国鑫42:00

是 。

荣慧42:01

对 , 而且还可以 , 应该我理解是可以建家庭的这个档案 。 比如我问小孩的问题 , 问父母的问题 , 我觉得这个其实是一个看上去很小 , 但是我相信机模不太可能做 , 要不它就要做得太细分了 。 呃 , 但是坐在一个健康的一个垂直的一个产品里面 , 就有它的价值 。

王国鑫42:16

是是 , 我认同您的观点 。

荣慧42:18

然后咱们再说回来 , 刚才其实您提到说好像情商它不太是这个 , 呃 , 咱们做医学大模型的两个圣杯之一 , 对吧 ? 你觉得它是可能相对次要一点的 。 但是这个王晓川在另外一次访谈里面 , 我们其实看到他在讲这个百川要造医生 , 这背后其实有一个他想表达的意思 , 就是这个医生要学会怎么和病人以及与病人的家属去沟通

, 就这个沟通本身的重要程度也是非常高的 。 那所以想看一看 , 就是 Nico 你们这边 , 呃 , 针对就是造医生 , 或者就是帮医生 , 就或者帮 AI 去更好地像专家一样 , 呃安慰用户 , 安慰患者 , 安慰患者家属 , 从而让他们更好地这个更理性地接受一个诊疗的方案 。 就在这些方面 , 咱们有做哪些工作吗 ?

王国鑫43:08

是这样 , 其实在内部我们您 , 您可以认为说大的评测线 , 其实很多用评测的角度看能力就最清晰了 。 我们大的评测线分体验线和专业线 。 其实我们刚才讲的治疗准确啊 , 问诊准确啊 , 然后方案准确啊 , 其实都归在我们的专业线上 。 然后 , 然后我们这边都会归为我们的叫做体验线 , 就会归 , 归为什么 , 就像您说的沟通技

巧啊 , 安慰啊 , 然后沟通的能力啊 , 都会分为我们的体验线 。 其实我经常表达的是这样子 , 就是说 , 就是沟通技巧这件事情和专业这件事情 , 它本身并不冲突 , 很多时候这种模型能力是可以正交的 。

荣慧43:47

嗯 。

王国鑫43:47

其实在这里如果偏要从研发的角度 , 其实很简单啊 , 就是说我可以用一部分数据和算法提升我的专业力 , 我还可以用另外一部分数据和算法提升我的共情能力 , 然后我把它训练一个模型里 , 然后再通过提示词的激发 , 你会发现模型很多时候是能做这件事情 。 这也是今天这个大模型参数量达到一定之后的一个明显的特点

, 就是说它具有泛化应用单点知识的能力 , 不像以前的模型 , 需要把一条完整的数据全背会 , 它才照着这个来 , 对吧 ? 所以 , 所以我理解就是我们今天讲造医生这件事情 , 在一定程度上说沟通是极其重要的 , 我是认同的 。 但我觉得今天的这个模型的 , 呃 , 就是取决于说今天模型的真正的高水平的要求 , 在专业上我们是

怎么强调都不为过的 。

荣慧44:35

嗯 。

王国鑫44:35

因为医学它就是一个高信任 , 刚才呃 , 我觉得荣薇一开始提过 , 就是它的一个试错成本实在是太高了 。 所以 , 所以换句话说 , 我们可以这么来理解这件事情 , 就是我们买一辆车 , 我觉得后面的这个体验的问题有点像车机系统 。

荣慧44:50

嗯 。

王国鑫44:51

那前面的这个专业性有点像自动驾驶 。

荣慧44:53

嗯 。

王国鑫44:54

所以你看这样的它两个产品在某种意义上之间 , 它对一个团队的要求 , 是一个 , 啊逻辑性 , 然后包括它的稳定性的要求是不一样的 。 所以站在我的角度上说 , 啊 , 呃 , 就是这么来看这件事儿 。 但是另外一个问题呢 , 就是什么叫做拟人嘛 , 像我们刚才叫拟专家 , 坦诚地讲 , 确实是 , 今天模型你看咱们回答知识有模有样的

, 但是我觉得今天模型想让它变成一个高水平的倾诉对象是很难的 。 就换句话说 , 今天做内科医生的难度远低于 , 或者要做心理医生的难度远高于做内科医生 。

荣慧45:29

嗯 。

王国鑫45:29

这个坦诚来讲就是说 , 所以我们在想说进一步地提升模型的共情能力 , 或者说怎么去探索模型的共情能力 , 这件事情是很必要的 。 但我觉得这里面有几个难点 , 不仅是技术的难点 , 一点就是如何评判一个人的共情能力 , 或者如何衡量一个模型的共情能力 , 这件事情是很不容易 。

荣慧45:49

对 。

王国鑫45:49

然后我们行内有句话 , 就是当一个指标能被测量的时候 , 那这个指标就可以被优化 。

荣慧45:56

确实 。

王国鑫45:56

所以我们经 , 经常谈说 , 诶这个你看 , 就咱们经常说 , 咱们经常现在看到很多这种所谓的 OMI 类的模型 , 就是它能模仿我的声音 , 然后我相信模仿我的声音特别简单 , 但我觉得如果做了一个荣 , 荣辉的数字人 , 我觉得 Koji 可能前五分钟 , 前两三分钟给人感觉好 , 再过一段时间就觉得不像了 。 就是说 , 就是说明那个 , 那个感

觉 , 就是这种所谓真正像的感觉 , 或者完全拟人的感觉 , 或者玩高水平的沟通这件事情 , 很有可能是需要花大的力气进一步地抬升的技术去支撑的 。 所以站在我的角度上说 , 对我来说是一个资源分配问题 。 我觉得今天的专业性的问题是不能 compromise 的 , 不能去影响它的 , 但同时我尽可能地提升我的服务水平 。 当然我承认服务

水平这件事情在技术上它还有现实的难点 。

荣慧46:43

咱们有在做心理健康类的大模型吗 ?

王国鑫46:46

我们实际上考虑过做心理健康的大模型 , 实际上我们跟 , 呃国内的头部的心理健康的医院有过一些合作 , 然后 , 呃 , 因为这也是一个北京科委支持的项目 , 大概可以简单说一下 , 就是说它实际上就是一个心理健康的数字人 , 背后 , 前面的数字人和背后的模型都是我们研发的 , 然后它来去解决这个患者的焦虑和抑郁的这

两种心理状态 , 是这么一个情况 。 当然这个临床实验还没有做完 , 然后但是目前来看 , 临床表现得比较积极 , 这是第一点 。 第二点就是我们自己从模型的角度上看 , 我们并没有过分强调说它是一个心理模型 , 心理健康的模型 。 今天我们还在 , 还在重点去解决常见病和重病这两件事情上还是偏多 , 在心理上我们投入的其

实是略少 。

荣慧47:33

了解 。

数据来源47:33

Koji杨远骋47:33

那我们再说到 , 就是前面其实我们提到好几次 , 这个就是你们的这个数据获取的这个点 , 其实在 , 就是在你们昨天活动上也提到 , 你们合作了那么多医院嘛 , 你们这些训练的数据都是通过一个什么样子的方式来得到的呀 ?

王国鑫47:50

那这个我可能不像 3D WAs 的不能说 , 我觉得我们这个能说哈 。WA, WAS, WAs 的 3D 哈 , 不好意思 。 然后我觉得我们数据来自于几点 , 第一点就是我们还是跟数据中心合作的比较多 , 这样的话 , 因为数据就涉及到确权 , 通过数据中心的合作 , 一定程度上说能解决数据的合规的问题 。 因为医疗数据呢 , 它首先一定要强透明 , 然后强匿名

化 。 这件事情呢 , 我认为放在就是外部比较好 , 就是不要放在内部 , 就是放在外部比较好 , 就是所有给我的数据 , 它本身就是高度匿名化和这个合规的 。 所以我们跟数据中心的合作是第一道 。 然后最近也有一个大的签约吧 , 就是和一个国家级的数据中心进行一个合作 , 主要还是围绕着这个大的多模态模型的合作 , 这是

我们第一方面 。 然后第二方面呢 , 我们的研发思路是这样的 , 就是说为什么要跟单 , 单点的医院合作 , 我的研发思路是这样 , 就是我通过我们的互联网上的数据 , 以及京东健康本身的数据 , 以及合成数据 , 这是我的基线 。 然后我们通过大的数据中心的合作呢 , 它构成了我一个 private data 的基线 , 就它是个 private, 它不是别人的 , 它

是我跟它合作构成的 。 但是我相信通过数据中心我能拿到尽可能省级的数据单元 。 大量的数据 。 然后我认为说在这个情况下呢 , 我可能把绝大部分的常见病都覆盖了 , 这是我的判断 。 第三件事情呢 , 我就跟单点的顶级专科合作 , 因为他们手里有长周期的队列 , 那这个长周期的队列一定是偏疑难的 , 偏难的问题 , 那我就

单点地跟他们合作 , 大概我们现在合作的家数大概十几家的这样的一个规模吧 , 我们单点跟他们合作 。 然后我的假设是 , 我在一个大的模型上 , 在一个通过数据中心合作训练的 , 医疗数据中心合作的训练的模型上 , 我只要用不多的数据就能得到它的提升的能力 , 这是我的假设 , 这是我们一切的假设的开端 。 然后合规属

性呢 , 上面的这部分数据呢 , 我们也是走单点的科研合作为主 , 也是通过数据中心透明的方式 , 三方透明的方式来去获得 , 然后走的一般都是科研支持协议 , 共同研发的科研支持协议来做吧 。 所以我相信绝大部分的医疗领域的公司都是未来都是这条路子 。

荣慧49:58

然后前面其实提到咱们和一些这个医院有合作 , 然后现在医院对于咱们去做医疗大模型的 , 他们的态度呃 , 或者评价是什么呀 ? 他们有没有一些比如说担忧 、 顾虑 , 还是他们就是非常积极支持 , 这里尤其是有没有某一个医生或者某一个院长 , 他们给过你们一些让你印象深刻的反馈或评价 。

王国鑫50:20

其实相反 , 我觉得其实挺支持 , 而且 , 呃 ,Koji 我可以这么来讲 , 就是过去三年我一直跑医院 , 而这个支持力度是越来越大 , 可能最早的时候是部分院士 , 从国家的角度他要去推动 , 然后未来到院长 , 现在我们看到了很多大的主任也有这个趋势 。 因为您想我们合作的这些医院 , 本质上讲它都有几个核心任务 , 第一个核心任

务是学科建设 , 因为它已经是国家级的医疗中心了 , 那它就需要它有的责任 , 国家摆这个牌子给它 , 它的责任就是发展这个学科 。 那在这里面 ,AI 把它的能力固化 , 然后进一步地支撑它的学科建设是必然的 。 就我们刚才说医生培养是一个必然的事 , 对吧 ? 所以他一定要参与这件事情 。 第二件事情呢 , 对他来说 , 他去服务

患者 , 他想延伸自己的服务能力 , 想把自己的经验进一步地延伸 , 这个欲望是很强烈的 。 我们叫它欲望也好 , 或者它的历史责任也好 , 就是应该是这么一种很强烈的 , 所以他也很愿意跟你合作 。 第三点就是说 , 他实实在在地已经把 AI 应用到他的生产生活当中 。 今天的医生实际上特别是一些年轻的主任 , 对于 AI 的认知实

际上比我们高 。 我 - 我们不要说具体的名字哈 , 就是说我曾经建立过一个 , 他是院士的学生 , 他是很年轻 , 很年轻的一个主任 , 然后他们对于 AI 能力的评测 , 他们对于不同模型的评测 , 不同模型的认知 , 在一定程度上说当时惊讶到我 , 当然一定惊讶到我了 。 所以我们在看一个趋势 , 就是未来成长的这一批人 , 这些优秀

的医生 , 一定是广泛应用 AI 的工具来提升自己生产效率的这帮医生 。 然后当时 , 但是反过来说 , 就是当我们谈医生 、 医院群体的时候 , 很多时候它不是一样的 , 它在人群内部是有巨大分化 。 就我相信您肯定采访过很多不同的人 , 他对 AI 的观点是完全不一样的 。 所以我的一个直观体会 , 特别是今年 , 去年年底到今年 , 我

感觉整个行业对于 AI 的认知已经变成说 , 以前是说你不能犯错 , 今天的 , 今天的认知是变成说我可以允许你犯错 , 但是我们要怎么协同可控 , 我们把哪一部分替代掉 , 哪一部分不替代掉 , 我们的场景如何进一步地落地 , 甚至来说说我们一起找场景 , 一起想办法 , 这种声音越来越多了 , 所以让我们觉得特别 , 一方面感知

就是特别感受很强烈 , 就是感受觉得很兴奋的同时 , 也要感到很多压力嘛 。 因为确实一垫到临床场景的时候 , 它的场景极其多变 , 这对你模型本身的泛化能力就要求进一步提升 。 所以我 , 我能这么回答你这个问题 。

Koji杨远骋52:53

哎 , 那你刚刚说他们给你的这些反馈 , 比如说哪些地方大家可以一起做 , 哪些地方可以希望比较快地来被 AI 助力吧 , 就他们的反馈比较集中在哪些领域啊 ?

王国鑫53:06

我觉得他们首先还是集中在几个领域 , 一个是患者服务领域 , 因为医生今天很多时候是看完病就完事了 , 其实他对于患者的用药跟踪和诊前的这部分 , 他们其实很需 -- 他们其实也很需要一个类似服务机器人这么样一个 , 这么一个产品 , 就是它能通过一个 AI, 低成本的长周期地跟患者在一起 , 然后这样的方式才能进一步地

提升患者被治愈的概率或者康复的水平 。 其实这是一个逻辑 。 很多时候医生做诊断只是一个决策 , 真的健康是掌握在我们个人手里的 , 很 - 很多时候是这么讲 。 所以医 - 医疗服务的 , 只要涉及到医疗长周期的服务 , 或者叫这个医院它对医疗服务它有转型需求的 , 那么对于 AI 的诉求都是极大的 , 我觉得这是第一点 。 第二

点 , 我们叫科室级别的研究 , 科室研究水平 。 实际上就我们说了 , 今天这科室的研究水平和人员培养 , 这 AI 就是一个 must。 换句话说 , 以后医学院脑子中想的一定是我如何通过 AI 的能力 , 尽可能降低人的学习成本和犯错概率 。 那只要是他这个有科室研究要求的医院 , 很多研究型医院给我们提的要求是 , 能不能一起共建科研

平台 , 能够共同地挖掘 , 自动化的挖掘 AI 课题 , 能不能把我的队列交给你去做 , 然后你能发现这种患者中的机会 , 患者新的疗法 , 那这是第二件 , 第二件事情 。 第三件事情是效率 , 就是这个医院的效率承压 , 就是对他来说 , 他也已经不能通过水平加人的方式 , 当然成本端啊 , 成本端的压力太大 , 来去解决这个问题 , 那

他就更需要这种所谓诊前的助手或者助理的方式来去存在 。 所以这种逻辑是进一步的存在 。 那当然了 , 现在有一种产品叫做医生分身了 , 某种程度上说医生分身的就是他把第一点和第三点进行了一个结合 , 用数字人的方式去呈现而已 。 但我觉得底层能力其实就是这三者 , 这三个场景是最多的 。

AI医院54:50

荣慧54:51

咱们这一次同时还发布了另外一个产品 , 就是 AI 医院 1.0, 可不可以给大家介绍一下这是一个什么样的产品 , 就对于 , 呃 , 比如说我们的听众 , 对于一个这个普通的用户来说 , 他用 AI 医院 1.0, 他可以得到哪些帮助和价值 ?

王国鑫55:07

其实我觉得这是一个特别朴素的观点 , 就是我们叫它 AI 医院 , 它可能是一个产品的 , 我们叫它一个名字吧 , 我觉得它就是个很朴素的观点 , 就是医疗服务它是一个专业属性强的所以在我们的过去实际上我们研究了和研发了很多这种 agent, 比如说我们有专门的 , 就像您说的一样 , 心理医生 , 然后我们有内科 , 然后有不同的科

室 , 然后有药师和营养师 。 当你有这么多 agent 的时候 , 因为这个模型不一样 , 你在单点的 agent 的上的时候 , 你可以极大地优化它的表现嘛 , 对吧 ? 那肯定是垂直的 agent 呢 , 是一个方向 。 当你 , 当你有这么多 agent 的时候 , 实际上我们脑子中在想说 , 我们是希望这些 agent 散布在各地 , 然后让用户基于需求激发去找 , 还是应该说我放到

一个产品中间 , 然后把它变成一种入口性质的产品 , 用户但凡有一点不舒服就会去找它 。 那这是后者是我们希望的 , 因为这样有用户心智 。 那接下来就在想说这个产品应该叫什么名字了 。 所以想来想去 , 这么多专业的 agent 呢 , 是不是就是类似于一个人工智能医院的这么一个名字 。 所以它很鲜见 , 它的逻辑很鲜见 , 它其实

某种意义上说代表了京东健康去探索未来健康入口的 , 或者想争夺未来健康入口的这么一种心智吧 。 我觉得这个其实可以直接讲 , 就是这么一个逻辑 。

荣慧56:22

未来健康的入口 。

王国鑫56:24

对 , 这是或者我们叫第一入口 , 可以用更强烈的词 。

Koji杨远骋56:28

我感觉它 , 就是我模糊的感觉哈 , 我觉得这个产品它其实有可能在两个方向上吧 , 一个是我觉得是 , 就比如说我们前面讲了很多是关于健康管理 , 就是对于在一线城市 , 可能现在对于医疗这个 , 就是对医疗这件事儿的认知 , 是从一个看病到一个健康管理的这个转变的过程中 , 就像前面讲的有很多案例 , 它比如说我去通

过这种比较好的 , 呃 , 就是医疗服务 , 给我自己的整个的一个健康情况做一个引导 , 从一个看病变成一个我要减少我有可能生病的这个可能 , 我是在管理我的健康 。 但是另外一方面其实是 , 对更广大的用户来说 , 在一些比如说非一线城市和医疗需求缺口更大的这个地方 , 可能是一个对更多人来说 , 让他们来获取相对更

优质一些的医疗资源的一个入口 。

王国鑫57:20

我完全认同你的观点 , 就是说当我们谈 AI 的时候 , 我觉得 AI 和移动互联网一个本质的区别 , 当然特别中国的移动互联网本质区别是改变了我们和信息交互的方式 , 对吧 ? 啊虽然也有连接 , 比如说美团可能是物理世界的连接 , 滴滴是物理世界的连接 , 但总体是改变了我们和信息交互的方式 。 但我觉得 AI 从根子上它是一个

更像是一个弊端的生产力 。 我觉得虽然在国内谈弊的时候有点 , 有点 , 有点不性感啊 , 有点不性感 , 但是 , 是它就是一个弊端的影响力为主 。 所以我十分认同您的观点 , 我觉得未来的模式可能是这样 , 如果咱们再推演的话 , 就是大的医院或者国内大的医院 , 其实是辐射地方 , 然后我们通过医联体的方式啊 , 甚至兼并的

方式辐射地方 , 这是第一点 。 第二点呢 , 这种越细越细的地方 , 然后到社区级别呢 , 有大量的 AI 就是辅助当地的医生 , 然后实现这种全科级别的筛查 、 分诊 、 问诊等等 , 然后通过重疾症 , 然后通过转诊的方式这么来去做 。 而大的医院呢 , 不仅仅是诊断这么一件事了 , 它还有医疗服务的延伸 , 就不仅是做个手术就完事了

, 它有康复服务的延伸 。 而在这个过程中 ,AI 又能在里面承担着一个低成本的信息服务的能力 , 然后进一步地去连接当地有效的医疗资源 。 我会 , 我会认为说 , 如果偏要往中国未来的看 , 我觉得随着这个地 , 地域差距的加大 , 人口老龄化 , 它大概率是这么一个方式 , 当然也会改变支付模式 , 支付模式 , 但是那个就不是我

们今天的话题了 , 所以我觉得应该往后看 , 应该是这样的一个情况 。

Koji杨远骋58:50

那你们会计划怎么让它 , 怎么样让它落地呢 ? 就是让它更多地被这些非常需要它的人用到 。 或者是说可能都不只是你们的产品 , 而是就是说让更多的人能够通过 AI 来获得他很需要的这些信息 。

王国鑫59:07

我觉得这个问题可以这么来看 , 就是其实京东互联网医院本身就尝试着在做这么一件事情 , 就是说 , 啊 , 互联网医疗的底层逻辑还是 , 呃 , 异地的医疗资源的匹配嘛 , 或者七乘二十四小时的医疗资源的匹配 。 所以今天其实 AI 并没有说 , 也并不是它是一个 , 一个新故事 , 啊 , 并不是一个新故事 , 而是 , 啊 , 在原有的这个

医疗服务的故事或者的能力基础之上 , 进一步地叠加它的能力而已啊 。 所以我在想 , 其实互联网医疗某种意义上说 , 就是 AI 的互联网医疗 , 就是在原有的互联网形态上进一步提升 AI 能力得到的吧 , 大概是这么一个情况 。

荣慧59:46

京医千询这个模型是开源的 , 对吧 ? 然后可不可以讲一讲 -

王国鑫59:50

嗯 。

荣慧59:50

这个咱们开源了具体哪些部分 , 以及可不可以讲一讲这个为什么要开源 ?

王国鑫59:55

我就先回答另外一个问题 , 就是为什么要开源哈 。 就是我觉得逻辑挺简单的 , 就是医疗行业它是一个信任驱动的 , 它不是一个 , 我甚至不觉得它是一个合作驱动的 。 所以站在一个信任的角度上看 , 啊 , 就是需要不断地 , 呃 , 通过开源这种方式进一步地拉动你的生态合作伙伴参与其中 。 这件事情是一个 must 的事情 。 所以我

们对开源一直都是很开放的态度 , 就是说我通过开源能够让别人知道我的技术品牌 , 能够试用 , 试用我这套模型的结果 , 然后进一步地反哺我的技术提升和我的这个生态能力 。 所以这么一件事情 。 第二件事就是我们开源相对比较 , 比较 , 比较充分吧 , 就是说除了模型本身的开源之外 , 我们实际上把它的训练代码和一部

分训练数据都开源了 。 我们的目的是希望参与者能够复现我们的工作 , 而不简简单单是说开源一个结果 , 然后去得到一个 , 得到一个简单的结果吧 。

荣慧1:00:51

开源其实抱着建立信任的这个目标嘛 , 然后开源之后 , 你感觉这个 -

王国鑫1:00:55

嗯 。

荣慧1:00:56

目标实现得怎么样 ? 有没有收到一些什么样的来自开源社区的反馈或来自合作伙伴的反馈 ?

王国鑫1:01:01

其实我们主要还是来自于研究机构的反馈比较多 , 不论是大学还是医院的研究机构 , 因为我们模型开源的尺度也有大小嘛 , 所以一些小的尺度的模型 , 其实在医院的合作机构还有很多主动的评测 。 然后我觉得当时我印象最深的还是像我们今年能够不断地推进跟各个医院的专科合作这个模型开源在里面 , 其实发挥的重要

性是比较高的 , 因为会让别人看到说你这个确实是在做事的一个团队 , 这件事情是我觉得这种信任 , 合作的信任是一件 , 呃 , 无价的 , 无价的一个过程 。 所以 , 呃 , 确实有这么一个情况 , 主要当然主要还是来自于这个医院端和研究机构给我们的反馈比较多 。

Koji杨远骋1:01:42

哎 , 其实你前面提到这个也是希望 , 也是希望这个产品能够占领用户的心智 。 其实我觉得也有可能 -

王国鑫1:01:50

嗯 。

Koji杨远骋1:01:50

... 这个考虑到越来 , 如果说越来越多的用户都用 ChatGPT 或者其他的这个 , 这个 chatbot 来询问这个医疗问题的话 , 那确实是对这个你们这个入口问题是有一个影响的 , 也可能也对整个 -

商业模式1:02:03

王国鑫1:02:03

对 。

Koji杨远骋1:02:03

... 公司的这个商业模式有一些冲击哈 。 那你们是比较期待这个 , 不管是模型 , 从模型到你们这个 AI 医院 , 它对这个 , 这 , 它和 , 它和你们的这个商业模式 , 其他的这些真正就是用最简单的话 , 话来说 , 就是真正为公司挣钱的这些业务之间能够产生什么样子的联动吗 ?

王国鑫1:02:23

就是我自己在聊 , 在谈 AI 的商业模式的时候 , 好 , 我觉得真正的有价值的是几点 。 第一点就是百分之百或者三个九 、 四个九的替代 , 这件事情是蛮重要的 , 就是你在能不能哪怕是一个很窄的窄域 , 你确实能够替代 , 那这件事情是蛮重要的 。 第二件事情是连接 , 就是今天的 AI 是不是一个更好地连接消费者和服务的纽带 。

所以因此在医疗领域 , 我觉得前者和后者都是有机会的 。 但如果刚才荣慧的那个问题是在于说我们今天的医疗模型 , 特别是跟京东健康的模式叠加的时候 , 那就得回到我们的那个整个集团的 slogan, 我们本身是一家供应链驱动的公司 , 就换句话说 , 就是我们的核心逻辑都是能够用最低的成本在市场上提供最优质的产品或者服

务 。 那 AI 在这里面就有一个巨大的连接空间 , 所以对我们来说就是类似这种入口型的产品 , 我自己的 , 当然这不代表公司 , 不能完全代表公司 , 我自己的判断是京东健康一定要去争夺 , 一定要去推进 。 我们做 , 虽然是作为一家互联网公司 , 但我们是有实体的医疗机构 , 我们有这种到家的服务能力 , 我们有我药品的供应

链 , 我可以三十分钟 , 在很多城市可以三十分钟内实现上门的服务和上门的送药 。 然后我有自己的体检中心 , 我有自己的医院 , 我们是这么一家实体 。 那在这个过程中 ,AI 就是一定要扮演好 , 连接好后面的服务能力 , 为患者提供一套解决方案 , 然后这套解决方案最好是 for 他自己 ,for 我们自己的 , 然后个性化定制的 。 所以这

件事情就变成说 , 它不变成说我今天要不要干 , 而是说我怎么干 , 呃 , 怎么能把它做成的一个 , 一个道路呢 。 所以您刚才提到的观点特别对 , 就是未来的医疗服务的争夺 , 一定会从这种单点的这种 , 确实他们跟 , 现在是竞对哈 , 其实我们是竞对 , 但是我的观点是 , 会从那种单点的这种所谓的 chatbot 的争夺 , 或者单点入口型

的争夺 , 变成了 chatbot 的体验或者能力 , 再叠加后端服务能力 , 二者通盘能不能给用户带来一个满意度吧 。 因为说到底医疗最终是靠有效性去活着的 。

Koji杨远骋1:04:39

那在这个后端的服务这一块 , 你们现在有做什么要求 , 让这个后端的服务暂时不要影响前面的 chatbot 里面的信息吗 ?

王国鑫1:04:50

啊 , 不会 。 其实我们把后端的服务更多原子化 。 比如说我举一个 , 呃 , 不那么抽象的例子 , 比如说我洗 , 我可以让护士上门给 , 给一个患者做一次检检查 。 我们就这么 , 我们其实整个后端的服务已经被我们完全拆解到原子化了 。 那对于模型来说 , 今天要的是说它今天基于当期的判断 , 以及跟患者沟通之后 , 它要不要做

这件事情 , 以及做这件事情 , 患者需要付费多少 , 以及患者的意愿度问题 。 我们今天模型 , 这个模型是解决信息这一侧的问题 , 当患者有意愿度了 , 也有这个需要 , 那我们只是调用后端的供应链去解决他的问题 。 所以我刚才讲的是说 , 后面的这些供应链能力的夯实 , 它 , 因为供应链它不仅仅简简单单是一个商品嘛 , 它

还有服务嘛 。 这种能力的夯实是京东健康有可能去建这个心智的一个基础 。 如果我们连这个都没有的话 , 那我们就是完全飘在天上的一家公司 , 这是 , 这是 。 所以跟不同的竞对之间 , 大家手里有的核心资源或者核心心智是不一样的 。 而京东的核心心智就是在于这种服务能力是不是成本最高 , 效率最高的 , 而成本最低 ,

效率最高的是不是这样子 。 如果是这样子的话 , 那接下来我们基于它的这种心智服务能力 , 那有没有可能做出入口型的产品 , 这是我自己在想的问题 。 当然 , 所有 AI 的人今天应该都在想入口型产品的机会 , 虽然它很难 。

Koji杨远骋1:06:08

那像其他的积木公司 , 你觉得他们有可能基于就是这个 , 在 , 用户在 chatbot 里面发起的这些问询 , 跟医疗方向有关 , 就 , 就你了解他们有可能去做一些延伸的一些什么事情 , 或者产品 , 或者服务吗 ?

王国鑫1:06:26

呃 , 实际上积木公司对健康这个赛道是我觉得也是很关注的啊 。 然后当然我们不用提它具体的名字 , 就是说不同的公司 , 实际上特别是一些 chatbot, 其实现在一些很大的 chatbot 上是有一个很可观的流量占比都是健康相关 , 这件事情其实是跟搜索当年的心智是很一致的 。 就是现在 , 现在很多人其实把大的 chatbot 还是当搜索用嘛 。 所以个

人来说 , 对我来说 , 我觉得 , 呃 , 他们肯定会从某种意义上讲 , 这是一个特别想做或者极其想做的赛道 。 那但是站在这个角度上看 , 就是还是回到我们一开始说的这个问题 , 就是说这个行业到底有没有门槛 , 然后以及它的商业化成熟度够不够高 。 所以因此这些大的通用的 chatbot 对我们来说 , 我们更多把它当做合作伙伴 , 而

不是竞争对手 , 这是第一点 。 第二点 , 其实京东自己应该昨天的 JDD 也推出了自己的这个 , 呃 , 就是通用的 chatbot 嘛 , 叫 Joy AI App, 对吧 ? 叫 , 叫 , 叫这么一个 , 这么一个 APP。 这站在我的角度 , 我也 , 我也当然也希望这个 APP 能够在市场上能够快速占领的这个一席之地 , 从而让我们集团内部形成产业协同吧 。 大概这么个情况 。

全球视野1:07:37

Koji杨远骋1:07:37

然后 Nico 可以给我们讲一讲 , 这个 AI 加医疗在可能更广的一个范围 , 就是比如说美国 、 欧洲跟中国相比 , 就是在这些领域你看到有哪些现在这个 AI 加医疗的一些 , 比如说不管是创新还是针对在解决不同问题 , 不同角度的一些产品做得比较好的一些例子 。 其实比如说像美国这叫 OpenEvidence, 他们应该是这个不管是在融资还是收入方面

, 其实都取得了还挺好的一些成绩的 。

王国鑫1:08:08

嗯 , 我觉得医疗 AI 这个东西呢 , 就是为什么海外和国内有时候大家可能看到很多案例 , 但它不见得像其他行业迁移性那么强啊 , 啊 , 这里面 , 这里面关键的要素就是 payer, 就是支付逻辑的差异 , 以及医疗体制的区别 。 我觉得我们 , 我们国内还是一个呃 , 注重效率和公平的一个体制 。 所以虽然咱们今天讲看病难看病贵 , 坦诚

地讲 , 如果咱是美国人的话 , 可能会更 , 更艰艰难 , 艰难很多很多 。 所以您看 , 从回 , 回到这个角度上看 ,OE 的这种产品在美国在一定程度上能成为一个商业化产品的一个核心原因是医生的收入和医生的自我诉求 , 医生的高诉求 。 所以它是通过一个订阅费支撑的一个模式 。 那在国内的话 , 其实我觉得类似的生态是可以做

, 包括我们这次也把我们的循证库开放了 , 但是我们的模式就是免费 , 也没有什么订阅费 , 你就大家随便用 , 就是说免费的模式 。 所以我会觉得这个就是居身淮北和淮南的问题吧 , 就是主要还是医疗模式的区别导致的支付逻辑的差异 , 从而导致不一样 。 但是我觉得有几个 , 呃 , 有 , 有些产品我们还是可以深度地去看的

。 比如说美国现在实际上是有这种所谓的 AI 驱动的互联网医疗加特定化的呃 , 医疗服务 , 特别化的用药服务的公司 , 然后比如说一些这种 , 我们随便举一个例子哈 , 就是这种企业很多 , 比如说我们讲 Hims,HIMS 这家公司 , 它实际上就是一家让人变美 , 变 -- 让自己的变得漂亮 , 然后变美 , 变 , 变更好的一家公司 。 它背后的实际上

底层能力是在于说它有它的药品供应链 , 特别它有它自 , 自身的这种特色的药品供应链 , 但它前端的获客和前端的服务都是在于说一个 AI 化的一种互联网的产品 , 从而不断地评估用户的状态 , 给他新的健康建议 。 回到了这个医疗的逻辑 , 都是在于说 , 第一点就是你确实是可以服务医生 , 从而获得这个市场占有 。 这件事

情上看 , 这个模式在美国是很通的 , 在中国可能要打一个问号 。 另外一个就是服务患者 , 那服务患者的话 , 我觉得很多时候都要回到解决方案本身去倒推 。 很多时候医疗的解决方案还是器械 、 药品 , 甚至是某种生活模式的改变 。 那在这个前提下 , 其实就像刚才我们说 AI 可以为医院解决用户服务的问题 , 那么 AI 当然也可

以为这个药企或者器械厂商 , 甚至是数字疗法的厂商解决用户服务的问题 , 所以是这么一种模式会比较好 。 那第三点呢 , 就是 , 就是大家都知道的这种给医院端的这种服务模式了 。 目前在国内来看 , 信息化的渗透率已经比较高了 , 然后医院的采购 , 呃 , 我理解也是一件长周期的事情 。 其实我们也有智慧医疗的部门 , 我

们也有一个京东卓医的产品 , 呃 , 它力图就是想解决一个问题 , 就是把整个的医疗服务的信息化和患者服务的全部用 AI 改造一遍 。 所以这是第三个赛道 。 那最后一个赛道就是 To G 了 , 就是面对 , 呃 , 政府 , 然后解决医保端和管理端的问题 , 卫健委管理端的问题了 。 这在美国实际上相对要 , 相对要少一点 , 相对于这种模

式相对要少一点 。 所以我来看说 , 如果从商业机会的角度 , 在中国可能最后还是得回到患者服务的这个赛道上去 , 我觉得相对来说更 , 更 , 更符合中国的土壤 。

荣慧1:11:31

就 Nico 你刚才也讲嘛 , 就这三年你经常跑医院 , 大量的 , 可能或者沉浸式地在去思考 AI 加医疗可以怎么帮助大家变得更健康 。 那这个如果回到这个一个 , 比如说我们朋友聊天的状态 , 今天我们遇见了 , 然后我问你说 , 你研究了那么多 AI, 研究了那么多医疗健康 , 现在你给我们一个建议 , 就我们要怎样能够在 AI 的帮助下 , 让

我们比如说过得更好 , 过得更健康 , 就是一些小的 , 但是可行性比较高的 , 可能我们今天听众每个人听了都能够拿去用一用 , 就能够让自己变得更好的建议 , 你能想到一些吗 ?

王国鑫1:12:08

我们讲长周期的健康有两个因素导致的 , 一个是个人的自身慢病的免疫力或者慢 -- 常年免疫表 - 表现 , 另外一个就是自己的重症嘛 。 所以我觉得 , 呃 , 特别是随着你的岁数的增长 , 然后在健康上进行特别的健康的检查 , 检验检查 , 或者健康的提前预防上要多投资这件事情 , 一定是不会错的 。 咱们就以三十五岁举个例子

哈 , 然后三十五岁之后 , 我觉得每年都要拿出一部分固定的钱去投入到个人和家庭的这个健康的保护上去 , 然后不见得这笔钱有多大 , 但是你就要每年要拿出这笔预算 , 有意识地通过经济的手段去调整自己的认知 , 这件事情变得十分重要 。 而且从统计学的角度上看 , 它实际上是中期是为你省钱的 , 因为你 , 你更早地发

现 , 其实我们现在绝大部分疾病 , 甚至我们今天听到的很多重症 , 早期发现都是有治愈的可能的 。 所以 , 呃 , 要积极地每年给出一部分预算 , 拿出这部分预算去寻找预算范围内最好的医疗服务 。 呃 , 我觉得这件事情是对 , 对人一定是有巨大帮助 。 先把钱拿出来 , 会推动你去做 , 做事儿 。

荣慧1:13:21

对对对 , 我觉得这个非常有意思 , 就是不管怎么样 , 反正我这个钱先拿出来 , 然后再看看我怎么把这个钱花掉 , 这样就会倒逼我去研究这个钱我要怎么花 , 可以对我的健康有帮助 。 对 , 我觉得这个建议要比直接说大家都要去体检 , 都要去做胃肠镜可能来得我觉得更有意思啊 , 就是钱先给出来 , 然后再去想办法 , 必须花

掉 , 花不掉的话 , 年底就要这个给自己一个巨大的惩罚什么的 。

王国鑫1:13:46

对 , 当然不是每个人都适合做什么胃肠镜 , 我只是说以 , 以胃肠镜举一个例子哈 。 因为比如说如果确实我来自于这个胃癌的高发地区的话 , 或者有家族史 , 那是可以的 , 如果不是呢 , 其实也没必要 。 但我 , 我的逻辑就是 , 呃 , 就是这样子是可能是一个很好的方法 , 因为健康它是其实挺反人性的 。 我们经常刚才我一开始

说健康的需求是无限的 , 但是反过头来思考 , 只有你失去健康的时候 , 它才有需求 , 所以也是很痛苦的 。

Koji杨远骋1:14:13

对 , 刚问你说那三十五岁以下的人怎么办 ?

王国鑫1:14:16

啊 , 那我觉得道理是一样啊 , 因为我 , 只是戏谑的说法是三十五岁 , 我觉得道理是一样的 , 尤其是关注自己的家族史 , 关注自己的状态 , 然后 , 呃 , 我觉得有些工作是可以持续做的 , 比如说听上去很 , 很可笑 , 但是 , 呃 , 长期监控自己的血压 、 血糖 , 长期监控这种指标是很有帮助的 , 其实是对自己及早地发现 , 及早地

干预 。 同样是糖尿病 , 我们现在好像国内大概一点几亿人糖尿病吧 , 理论上十个就有一个哈 , 同样是糖尿病 , 我早 , 对 , 早发现早控制和我晚发现晚控制 , 最终的结果都是差异很大的 。 所以就是还是要相信一句话 , 就很多疾病的优先发现 , 在今天的科技水平下是有解法的 , 但是它一旦过了某些状态 , 它就没有解法了 ,

它只有 , 只有缓解的方法 。

荣慧1:15:08

我们最后两个问题啊 , 然后因为我们今天聊了非常多医疗大模型嘛 , 但我相信其实我们听众很多 , 其实并不是 , 就是真的在从事医疗大模型的行业 , 大家可能是在做各种各样的垂直模型 。 所以也想请教一下 Nico, 就在你看来 , 就医疗的垂直模型里面的一些经验 , 它要怎么可以迁移到其他的垂直模型 , 比如说金融 、 法律等等

等等 。

王国鑫1:15:30

我觉得在这些其实大家的技术都是比较相通的 , 尤其是这个 , 呃 , 我觉得所谓的这个行业经验 , 它的词我们叫做同源异构吧 , 就是说大家都是对一个更复杂的情境进行一个 , 进行一个建模和优化 。 比如说教育我们个性化的学习路径 , 然后在法律上的这种 , 呃 , 多信息流的这种多步推理 , 然后在金融上的这种投资组合的

推荐 , 以及基于大量海量金融数据的一个推理性的分析 。 在这种角度上看 , 其实技术都是很相通的 。 这也是为什么今天 AI 的人好像可以 , 好像可以找到任何工作的原因吧 。 所以我觉得今天本质上讲 , 就是只要这个行业是高度异质类的数据 , 它的数据异质性比较强 , 同时它这个模型又需要融合推理去优化 , 然后 , 那我觉

得这 , 其实这件事情在医疗上所做的经验是很容易迁移到教育和金融和法律 , 刚才您说的这三个行业 。

Koji杨远骋1:16:25

那你如果今天你是一个投资人 , 你要判断一个垂直大模型的公司能不能 , 就是做得好 , 你会怎么判断 ? 比如说 , 嗯 , 有哪些你自己特别在意的指标 。

王国鑫1:16:37

呃 , 我觉得一个事情就是这个行业的知识深度 , 就是说它的数据比例和知识深度 , 就是这件事情到底存不存在 。 很多垂域模型我觉得不见得真的百分之百存在 , 所以这是一个零和一的问题 。 然后第二件事就是看说它的商业机会 , 就是它的商业机会也不能那么大 , 因为一旦你商业机会大到大公司注意了 , 你也没戏了 。 所

以它最好是它的商业机会有可能实现 , 在近期有可能实现 , 但是它相对来说又不是那么听上去让人那么宏大的故事 。 然后第三点就是这个公司它在它未来的这个商业落地的预期 , 就是它自己接下来是一个 , 它期期 , 这个模型它是接下来是希望是一个 API 付费还是产品付费 , 甚至还是个销售驱动的付费 , 那要看它的合伙人

里面那种商业的合伙人 , 以及它的商业的思考吧 。 主要就看上面三项 。

Koji杨远骋1:17:36

那今天谢谢 Nico 来做客 《 十字路口 》, 然后跟我们分享了很多他们做这个医疗大模型的一些经验 , 然后当然这个领域其实 , 其实比较 , 相对来说哈 , 是一个非常有价值 , 但其实同时也其实是一个大家更多的人其实也是对它期待非常高 , 同时也比较敏感的一个领域 。 我们也期待看到 AI 能够让我们越来越多的人能够享受到这个

由技术进步带来的医疗成果吧 。 谢谢 Nico 今天跟我们聊这么多 。

荣慧1:18:04

嗯 , 谢谢 。

王国鑫1:18:05

嗯 , 谢谢二位 , 二位拜拜 。