医疗版ChatGPT直播评测！治疗方案与真人医生96%一致_快讯_财讯网

国内首个医疗大模型，已经在“接诊”患者了。

最近，一组AI医生医院真实站岗数据曝光:

共接诊120多名患者，从问诊、检查到诊疗方案全流程覆盖;

(资料图)

涉及心内科、消化内科、呼吸内科、内分泌科、肾脏内科、骨科、泌尿外科七大疾病科室，患者疾病类别多元，复杂程度不一;

医学水平不输国内三甲医院主治医生，与真人医生诊疗方案一致性达到96%;

来自北大人民医院、中日友好医院、阜外医院和友谊医院等国内顶尖医院的7位专家教授围观点赞。

这样公开化、规模化的AI医生评测，在国内是首次，放眼全球也是第一次见到。

更想不到的是，背后的主角MedGPT——基于Transformer的1000亿参数大模型，才刚问世一个月。

目前在实际诊疗中，它已经具备多轮连续对话和多模态能力。而在未来规划中，MedGPT还会上线医疗版的PluginStore，预计将搭载1000+医疗应用，极大丰富AI医生的诊疗工具，提升诊疗效率。

从上述这些数据与表现来看，96%的一致性，想不到。

这样的迭代速度，更想不到。

MedGPT直播首秀:接待百名患者

这场直播首秀其实是一场实打实的人机医学一致性评测。除了AI医生MedGPT外，还有10位来自四川大学华西医院的主治医师共同参与。

为了保证评测的权威性和科学性，一方面由国内顶尖医院的专家教授组成评审团，进行审核和多维度打分。

另一方面，整个流程也进行了特别的设计。简单来说，患者进屋问诊，但是是和有医师执业资格的“翻译员”对话。翻译员把患者主诉在电脑上分别传递给真人医生和AI医生，如此多轮往复，最终根据检查结果，给出诊断。

就像当初AlphaGo大战围棋界，中间帮助Alpha执行“落子”动作的执棋手，就是这个“翻译员”的角色了。

这样一来AI医生与真人医生之间互不干涉，且条件基本一致，双方就能给出独立的判断。

最终，经过一天的鏖战，真人医生综合得分为7.5分，AI 医生综合得分为7.2分，比分结果上一致性达到了96%。

在评审过程中，专家们也发现了一些意想不到的“惊喜”:

比如，出现漏诊误诊的概率比较小。

北大人民医院薛峰主任就发现，MedGPT通过多轮询问，根据患者脚底板疼痛症状，竟然在最后可以推断诊断出「有可能出现压迫颈神经」这样的结果。

这也就是说，从知识储备上，AI医生其实可能高于一个经验不太丰富的医生。

另外，MedGPT就诊时的“沉稳”表现也得到了点赞。

中日友好医院心内科主任医师任景怡就表示:我觉得最好的一点是当诊断尚不明确时，MedGPT并不会轻易给出结论，而是要坚持通过继续问诊或检查收集更多信息。

于是即便MedGPT还存在一定问题，她还是给了比真人医生还高的分数，并直言:这是里程碑的结果。

不可否认的是，MedGPT还有些问题需要调整，几位专家指出它会出现偶尔过度给出治疗建议、重复推荐检查项目、某些概念表述不准确，以及无法实现查体等局限——要想MedGPT更加可用，这些意见一定程度比正面评价还要重要。

但总的来说，首个医疗大模型的公开首秀的结果还算不错。

总结下来，首先是大模型的基本能力都有，语义理解、多轮对话、多模态识别等，还能像OpenAI那样通过插件商店链接到各种行业应用。

还有通用大模型被广为诟病的对齐和准确性问题，MedGPT整个流程结果也不输真人医生。

再从行业维度来看，确实能真正从医学角度为医生提供有效帮助，提升患者疾病管理效率。

此次真实测试过程中可以看到，它能基于有效问诊以及医学检查数据，MedGPT得以进行准确的疾病诊断，并为患者设计疾病治疗方案。

甚至在诊后，MedGPT还会在患者收到药品后进行用药指导与管理、智能随访复诊、康复指导等智能化疾病管理工作。

目前它基本覆盖ICD10的60%疾病病种，这意味着常见病症都能Hold住~

还能7*24小时不间断干活，一旦规模化落地辅助医生诊疗，能大大提升医疗效率，对于分级诊疗，医疗资源普惠，都能够发挥一定作用。

首个医疗大模型如何炼成?

医疗向来是AI落地中专业性最强、壁垒性最高，对安全要求最高的领域之一。

以往用户们会习惯性使用信息搜索来帮助自己做一些初步的疾病判断，但信息鱼龙混杂，普通用户缺乏专业知识无法进行有效筛选，最终导致往往会收效甚微。

但又因为这个领域牵涉到每个人的生命健康，市场需求和社会价值一直很大。

因此自ChatGPT诞生以来，关于何时能在医疗领域“上岗”发挥作用，就备受产学研各界专家的关注。

诚如“弱智吧”成为检验各个通用大模型能力的Benchmark一样，各个大模型的医疗能力也在美国执业医师资格考试USMLE中摩拳擦掌。

早些时候，哈佛大学教授曾亲自下场测试ChatGPT辅助诊断的表现。

结果显示，ChatGPT在45个案例中39个诊断正确，并为30个案例提供适当的分诊建议。这样的表现已经超过现有机器诊断水平，接近医生。

另一个代表，谷歌健康团队打造的Med-PaLM2，它能回答各种医学问题，据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

但能做题并不能意味着就能落地应用。

以GPT-4为首的通用大模型，他们高度依赖文本统计概率生成答案。相信大家也能感知到它很擅长一本正经地胡说八道，如果应用在日常交流，倒也乐在其中。

但要是应用到行业中去，往往非专业人士会难以察觉，这就会引发各种风险，尤其又像医疗这种民生行业，对内容生成的把控要求更高，容不得半点差池。

更不用说医疗本身覆盖知识面广而繁杂，而且从整个就医流程来看，诊前、诊中、诊后都涉及各种各样长尾任务，所需高质量数据可能并不比通用模型小，且大部分数据不是靠网上摘取。

这对企业来说，不单只是算法、算力和数据的考验，而是一整套系统工程性难题。

既然如此，作为国内首个医疗大模型MedGPT，又是如何做到的呢?

简单总结:专业大模型，以及多种准确性机android制保架护航。

首先，一上来就打造医疗大模型。

此前专业大模型的思路是，先打造一个大模型，再利用专业数据做监督微调。但MedGPT直接是以医疗数据预训练、微调以及超100名医生参与RLHF机制。

这就需要企业既要在垂直行业深耕，还要有AI技术实力。这就需要提及它背后的缔造者——医联。

在行业上，作为互联网医疗的早期入局者，医联已经积累了超过150万医生和2000万患者，稳固的医患关系链长期互动之下，形成了大量专业的医学数据。

此外医联长期关注医疗与技术的深度融合，已打造了近140个疾病管理标准化流程，涉及肿瘤、心脑血管、糖尿病等常见病症，覆盖1000多个病种，形成了一整套全数字化全流程疾病管理体系。

在互联网医疗时代，这些疾病管理体系可以为行业提供线上管理的有效依据，提升行业整体效率。而在AI赋能下的数字医疗行业来临之时，这便成了AI医疗的重要依托。

至于在AI方面，这家公司很早就开始关注并进行谋划:早在2017年医联就建立起医疗大数据结构化能力;2018年就将NLP、CV等AI技术应用落地，比如智能体液检测、智能分诊、口腔影像识别等场景。

2019年还推出针对单病种/分阶段的AI诊疗模型，曾联手多家医院及机构，创建亚洲首个多发性硬化症领域的早筛AI模型，帮助患者提前1-3年提升多发性硬化症的风险预测和防控能力。

这些前期在AI领域的摸索以及长期的医学与前沿技术的融合，成为医联能率先在行业内推出医疗大模型并应用的基础，可以说这一切绝非偶然。

让我们再往深看一步，为了保证医疗大模型的准确性和一致性，医联从模型到实际应用同样做了不少工作。

包括模型算法的一致性校验机制、多维编程度诊疗评测机制，以及基于专家评议的真实世界医生一致对标机制。

比如，在为患者输出正式答案前，会先经过临床医学规则器的校验。还有招募真实医生在电脑前判断，然后将两者结果交给专家委员会评议，以此来对标真实医生。

基于这样的方法论，医联团队率先为专业大模型的打造在行业中打了个样。

医疗AI2.0大幕拉开

最后回到MedGPT公开评测这件事情本身，也带来了大模型发展进程中的三点趋势。

第一、医疗AI2.0大幕已经拉开，系统复杂性问题将会得到解决。

以大模型为代表的AI2.0时代的到来——对话即入口，让所有的应用场景都得到了重新定义。被AI所辐射的千行百业也深处于变革之中。

以往AI1.0，NLP、CV、多模态等单点技术蓬勃发展，医疗AI应用场景丰富多样，他们强规则、具有可控性。但场景、数据之间没有打通，导致泛化能力不强，无法处理系统性、复杂性的问题。

得益于Transformer，打破了模态、数据、任务场景之间的壁垒。医疗场景中，利用海量医学文本与数据中，进行高并发/长距离学习整合，一些复杂性、系统性问题可以得到解决。

如果继续畅想，结合医联的云药房、云检验等云化能力，不仅是AI医生本身疾病管理能力会得到提升，患者甚至可以摆脱地理限制，轻松完成所有疾病从预防、诊断、治疗、康复的全流程管理路径。

这其实也并不难想象，只需要知道有一个能看各个专科领域并且比肩三甲医院医生的AI医生能够24小时在你身边为你出诊，同时，检验检测服务在家附近1公里就能全部完成。

有去三甲医院排队挂号看病经历的同学应该都懂——专家挂不上号、检验检查等一个月，这都是时有发生的事情。降本增效、解决编程客栈行业问题，走入医疗的下一个时代，就是靠MedGPT这类专业模型做的。

第二、大模型的行业红利并非在科技巨头手中，而在有场景有数据的玩家手里。

相信大家都或多或少有所看到，目前医疗领域的专用大模型和产品正在不断问世，最具代表性的产品来自谷歌和微软这两个大厂。

谷歌Med-PaLM2目前正在尝试多模态能力，比如自己检查X光片后给出诊断。在今年晚些时候将对一小部分谷歌云用户开放。

还有被微软200亿美元收购的Nuance，借由微软OpenAI合作之便，正在将GPT-4集成到临床笔记软件DAX中，以减轻临床医生的负担。

前者的大模型还没有到真正落地，后者无非是集成通用大模型的API，其行业的准确性和一致性无法得到保障。

但MedGPT一亮相就惊艳全场，并拿下多个行业首次:

这与垂直领域深耕、有场景有数据有关。

医联在医疗行业有9年深耕，积累了丰富的知识、数据和应用，构筑起了深厚的技术和用户壁垒。

一旦实现大模型技术的应用，在现有的用户场景基础之下，将会迅速规模化落地。这是其他想入局者无法拥有的先发优势。

上一次AI浪潮来袭时，最终也是场景玩家率先吃掉AI红利。

现在同样也依旧是场景玩家吃掉大模型红利，只不过技术路径已经明晰，落地速度自然要比以往快得多。

第三，医疗AI落地提速，也侧面印证了大模型的发展趋势——

雪球效应展现，从技术到应用部署的飞轮会越转越快。

ChatGPT最开始只会一本正经地胡说八道，短短几个月内基于用户反馈、插件开发生态，真正被各行业的人加入到工作流中，并上线了端侧应用。

还有Midjourney、Stable Diffusion被人诟病无法画手的问题，也能在短短几周内解决;以及国内大模型涌现、更新速度加快，文心一言一个月能迭代四次等等。

“大模型-应用-数据”的加速闭环一旦打通，那js么产业落地的速度将会比上一波浪潮更快。

而医联大模型MedGPT一个月就进入到真实患者全流程测试阶段。在此之后，根据数据飞轮迭代大模型，落地速度只会越来越快。

或许很快，医疗AI2.0就会惠及到每个人身边。

—完—

推荐内容

医疗版ChatGPT直播评测！治疗方案与真人医生96%一致

2023-07-05
首届“鄂尔多斯杯”创新创业大赛在京启动

2023-07-05
世界今头条！罗马诺：巴萨即将官宣32岁中卫伊尼戈-马丁内斯免签加盟

2023-07-05
理财产品风险等级是怎么划分的？保本和非保本浮动收益怎么选？

2023-07-05
黎亚最好听的六首歌（王越阳写的六首歌是哪六首）世界观天下

2023-07-05
保险可以在异地进行退保吗？异地退保需要什么条件？

2023-07-05
山西汾酒(600809)：积极信号显现再迎配置良机

2023-07-05
汽车行业周报：6月第4周乘用车销量维持环比改善关注有新车推出的整车及重卡产业链全球播资讯

2023-07-05
晨会纪要

2023-07-05
【世界聚看点】交通运输行业周报：菜鸟推出自营快递产品进军快递物流腹地

2023-07-05
人福医药(600079)：“归核聚焦”改善显着麻醉龙头成长可期

2023-07-05
全球快资讯丨恒力石化(600346)：拟分拆康辉新材上市聚焦新材料

2023-07-05
康恩贝(600572)：内生驱动增长稳健

2023-07-05
重庆市至云南昆明高铁川渝段四川境内箱梁架设完成-全球新资讯

2023-07-05
香港财库局局长许正宇：上调股票印花税税率不影响港股交易活动

2023-07-05
病理学家在抹香鲸尸体中发现9.5公斤龙涎香，价值390万元，号称“漂浮的黄金” 环球百事通

2023-07-05
4S店当“大象转身”|全球热讯

2023-07-05
一块航天玻璃的“极限突破”|世界热头条

2023-07-05
播报：和佳退7月5日加速下跌

2023-07-05
白酒板块午后持续下挫全球快播报

2023-07-05
中国武夷子公司拟捐赠3000万元用于南安市学校扩建|消息

2023-07-05
天天报道:五位民营企业家成国家发改委主任郑栅洁座上宾，有何深意？

2023-07-05
世界快资讯丨华塑科技7月5日快速上涨

2023-07-05
天风证券：新能源汽车行业景气度提升天天日报

2023-07-05
国海证券：主线方向尚未明确切忌盲目追高追涨丨投资有看投

2023-07-05
速递！国家药监局：我国创新药械研发上市迎来爆发期

2023-07-05
数字电源设计方案难选？相信我，看了本文就不难了~ 全球观点

2023-07-05
2023H1定增市场回顾暨下半年预期：收益持续分化择时优选布局

2023-07-05
精锻科技(300258)公司首次覆盖报告：国内精锻齿轮龙头战略转型赋能长期发展

2023-07-05
票息资产热度图谱：证券次级债迎做多

2023-07-05
【全球播资讯】北京要求二级及以上相关医院提供分娩镇痛等疼痛管理服务

2023-07-05
全球快讯:天风证券：新能源汽车行业景气度提升

2023-07-05
来自小镇的小刷子如何“刷”出百亿大产业？

2023-07-05
万州暴雨致一段铁路桥梁部分垮塌，铁路部门：安排途经列车迂回折返或停运

2023-07-05
【天天报资讯】涉嫌刑事犯罪！盘龙区住房和城乡建设局发布严正声明！

2023-07-05
随想：有些事是做给别人看的天天快资讯

2023-07-05
跆拳道完整训练法（跆拳道3000种训练方法）|当前速看

2023-07-05
日本商业原油库存增加106万千升至1237万千升_当前热讯

2023-07-05
终端消费有望持续改善机构看好汽车产业链后续走势快看

2023-07-05
暑运旺季将至旅游消费能否迎来布局良机？|全球速看

2023-07-05
伊朗正式成为上海合作组织成员国_全球最资讯

2023-07-05
世界气象组织官宣厄尔尼诺再现或突破2016年极端高温纪录

2023-07-05
近百家公司披露上半年业绩预告超八成预喜

2023-07-05
药品行业周报：创新产业链风险持续释放未满足需求布局窗口已至

2023-07-05
医药健康行业点评：医保续约意见稿发布整体政策温和稳健

2023-07-05
每日关注!欧克科技(001223)：国内生活用纸设备龙头切入锂电隔膜设备打开第二增长极

2023-07-05
晨会聚焦

2023-07-05
【世界速看料】京基智农(000048)：快速崛起的生猪养殖新星

2023-07-05
新资讯：鸿路钢构(002541)：23Q2产量提速年内产能利用率有望明显提升

2023-07-05
全球视点！百润股份(002568)：强爽延续高增餐饮渠道有望打开增长空间

2023-07-05
速递！山西通报一季度银行业投诉，个贷类投诉占比近七成

2023-07-05
世界新消息丨五部门：进一步扩大工业重点领域节能降碳改造升级范围

2023-07-05
国泰君安：钠电池有望成为锂电池的有效补充|环球报资讯

2023-07-05
瑞丰高材拟开展黑磷及黑磷烯材料业务|全球今热点

2023-07-05
智迪科技网上发行最终中签率为0.0196% 借力资本市场实现高质量发展-世界短讯

2023-07-05
环球微速讯：南财游戏未保研讨会成功举办，与会专家建言网游防沉迷应用人脸识别应关注合法性边界

2023-07-05
新鲜的鸭怎么做好吃?

2023-07-05
三元生物：公司阿洛酮糖有液体与结晶体两种，阿洛酮糖甜度大约是蔗糖的70%，其热量趋近于0，适合糖尿病患者_天天速讯

2023-07-05
刺杀希特勒事件_关于刺杀希特勒事件的介绍

2023-07-05
筑牢绿色屏障专注绿色发展（美丽中国）|今日播报

2023-07-05
安井食品(603345)：产品视角看安井之变大单品有望打开成长空间天天简讯

2023-07-05
晨会纪要全球快播报

2023-07-05
当前热讯：环保&电新行业观氢系列五：绿氢远期需求超8400万吨绿氨、交通领域预计率先平价

2023-07-05
盛视早参：经济复苏有望加速 7月A股或迎来翻身仗世界热文

2023-07-05
中国太保(601601)：长航二期启动 NBV可持续增长可期

2023-07-05
环球视讯！投顾月报：市场有望走出磨底期

2023-07-05
研究所晨报天天报资讯

2023-07-05
事关乘火车出行！呼和浩特铁路局增开这些旅客列车……-天天热头条

2023-07-05
今日看点：自行车刹车原理图解（自行车刹车原理）

2023-07-05
弄潮儿是什么意思网络用语（弄潮儿是什么意思）-当前速读

2023-07-05
全球快资讯：路畅科技7月5日快速反弹

2023-07-05
【天天热闻】杭州国资接手东风裕隆，破产车企还有没有“未来”？

2023-07-05
濮新高速柘城段预计9月底通车

2023-07-05
速看：考研上岸图片考研和考编同时上岸怎么选基本情况讲解

2023-07-05
最新人民币兑换哥斯达黎加科朗汇率汇价查询_2023年07月05日

2023-07-05
不要乱冲等主线更明朗天天看热讯

2023-07-05
苹的笔顺怎么写（苹的笔顺）|天天播报

2023-07-05
为暑假校外培训平安消费“上把锁” 市教育局公布116家校外培训机构“黑名单”和7家“警示名单” 世界独家

2023-07-05
*ST全筑连收5个涨停板

2023-07-05
2023年中期策略展望：宏大叙事疲劳

2023-07-05
家电行业2023年中报业绩前瞻：景气与拐点

2023-07-05
环球即时：美妆医美月报：6月线上大盘延续回暖趋势多家产业链龙头IPO迎新进展

2023-07-05
每日简讯：预测报告：经济弱复苏内生动力不足有待政策进一步推动

2023-07-05
医药健康行业动态点评：政策转向明确药品国谈续约再宽松当前短讯

2023-07-05
家居行业系列报告四：信息化家居远期竞争的胜负手环球快播报

2023-07-05
晨会纪要世界消息

2023-07-05
每日速递：7月5日生意社麦冬基准价为139.17元/公斤

2023-07-05
浙江“千项万亿”重大项目集中开工|环球快播

2023-07-05
深圳中山联手开展产业链招商-天天观天下

2023-07-05
天天日报丨业务做到心头办法送到手头

2023-07-05
中国近现代新闻出版博物馆开馆

2023-07-05
每日动态!西藏为劳动者追回工资1.13亿元

2023-07-05
让民众吃饱更要吃好河南拓展绿色食品发展之路

2023-07-05
今日精选：一汽财务有限公司违规为非成员单位产品提供消费信贷被罚30万

2023-07-05
世界热头条丨泰娱顶流被曝劈腿！男星小九频频私会前女友，女方高调晒照宣主权

2023-07-05
先烈的英勇事迹（先烈）世界球精选

2023-07-05
原创小说《南山有云》第二十八章消息

2023-07-05
全球快资讯：漏勺是什么意思_漏勺

2023-07-05
焦点日报：7月5日生意社废钢基准价为2851.12元/吨

2023-07-05
天天要闻：中央气象台：东北地区强降雨来袭局地达大暴雨

2023-07-05