专栏观察

群“模”乱舞,百度灵医大模型如何破局?

无需多言,今年就是大模型之年。

从技术角度来看,AI技术的突破与落地在今年忽然加速了,国内各种大模型纷至沓来,局面非常热闹。体现了这个时代的人们对于科技影响生活的热切期盼,无论对于开发者还是消费者,AI生活都是一个已经确定的方向。

然而理想与现实之间的距离到底凭什么去填补?解铃还须系铃人,还是要靠技术本身。目前AI与各种场景的结合之下可谓群“模”乱舞,不在其中的人很难想象行业里有多少疑云密布,倪叔是知道的。

比如有些所谓大模型根本不具备充足的算力支持,先给产品贴上大模型的标签,还有的仅是为了蹭热度,在未经过任何预训练只是进行了局部的指令精调,甚至仅仅是以传统模型或者语料问答的方式,就急匆匆地对外宣称自己推出了大模型。

这么做的不在少数,原因很简单,为了风口嘛。但是这种一拥而上的短视行为,却给大模型这个原本极具潜力的新生事物带来了很不好的影响,最直接的影响就是服务效果很难达标。

而实际上模型训练一次的成本最低也在千万元人民币,很多所谓的大模型不仅技术受限,资金实力更是存疑。这也是为什么真正的大模型通常都是科技大厂在引领的原因。

如今站在行业能否继续健康发展的十字路口,必须有更多的真正大模型站出来,展现领先的技术能力与务实的应用思路,让大众在一片乱象中真切地体会到大模型产品的差异化价值,如此才有利于行业在正确的道路上行走。

那么,谁能担此重任呢?

1

百度灵医大模型,我来

9月19日,百度发布国内首个“产业级”医疗大模型——灵医大模型,同时面向大健康上下游产业开放灵医大模型邀测,这在国内医疗大模型行业尚属首次。

百度集团资深副总裁

大健康事业群总裁何明科

百度集团资深副总裁、大健康事业群总裁何明科表示:灵医大模型目前已经和很多客户达成商业合作,深度共创了很多好的应用,致力于帮助客户提升运营效率,促进商业增长。

大厂、技术、资金、研发、开放、合作,大模型的各种基础要素都符合我们提到的“真正大模型”的要求,但这依旧只是表面现象,深入到本质来观察,百度灵医大模型到底有什么特别的功能,也就是差异化价值呢?

第一个差异化价值,安全性。

我们要清楚这样一个前提,医疗健康是一个对于安全性有较高要求的行业,所以,任何医疗大模型产品的核心功能都要满足“循证可溯源”。

百度灵医大模型的第一个差异化价值正是安全性。发布会采访中,百度大健康事业群AI产业部总经理刘军伟表示:结合临床医生给的意见,定了五个角度的评测标准,安全性、逻辑性、理解力、完整性、正确性。接下来选择评测数据集,包括从C端患者高度关注的药品问题、医生关注的问诊问题等等,建立评测集之后选择专业人士评测。哪些专业人士呢?上百名来自专业医疗机构、三甲医院的医生,评测过程采取盲测,确保评测结果客观公正。

在此基础上,百度灵医大模型在正式推出之前仍要围绕安全性反复训练。百度灵医大模型在预训练时,提供了千亿token的医疗类训练语料,覆盖了“医-患-药”全场景的海量优质数据。

要做到这一点是很难的。如前所述,背后首先是巨大的资金成本,其次需要对医疗行业深入了解、多年累积,该行业不存在什么“外行创业”,最后需要开发者提供海量“数据资产”,因为医疗行业已经不只是线下问诊这样孤立的场景了,有大量数据被生产、储存在线上。

现在市面上的各种大模型也都在卷数据量,可谓一个比一个“大”。但数据的来源、真实性、质量、标准程度等不确定。在这个纬度上百度的优势就体现了,在百度灵医大模型的训练数据中,既包括品牌“灵医智惠”多年深耕智慧医疗领域积累的经验,和脱敏电子病历、文献指南、知识图谱等线下医疗数据。同时也包括“百度健康”科普、医典、优质医患对话等线上健康数据,5亿+条权威健康科普内容、2亿+患者搜索数据/每日、1000万+优质医疗问答对数据。同时,百度“GBI”也能够提供贯穿全生命周期的全球药品器械数据。

从技术本身的角度来看,百度灵医大模型为确保输出内容准确、安全,加入了多重策略机制,最核心的就是将循证AI技术深度整合到训练过程中,目的还是为了安全——如此一来,就能避免大模型“自己创造医疗知识”。另外,通过反馈强化学习机制,大模型通过内部和外部的双重反馈优化,持续增强专项能力。通过数据+技术的结合,最终保障生成内容准确可用,有理有据。基于此,百度灵医大模型的核心功能充分体现出了医疗安全性,比如智能分导诊、预问诊、 辅助诊断、智能客服。

灵医大模型在发布前也经历了一系列严格的“考试”。上百名三甲医生在安全性、正确性、逻辑性、理解力和完整性等五个维度对市面上的大模型产品进行重点考察,灵医大模型在多个多维度皆领先同类模型。

第二个差异化价值,多样化的服务能力与落地场景。

百度灵医大模型有很强的落地实用性,它不是一个“概念产品”而是一个“量产产品”,这是基于其多层次的产品服务架构架构而实现的。

具体来说,有三层服务架构:模型层、能力层和应用层。

在模型层,提供基于数据微调或预训练服务。作为整个架构的基座,灵医大模型推出了三个版本,Lite版、旗舰版和定制版。

其中旗舰版作为千亿规模的参数模型,主要以公有云服务方式为广大用户提供服务,达到开箱即用的效果,用户无需担心部署成本。

Lite版,重点是面向医院客户或者对私有数据较为重视的客户提供的模型服务,以私有化方式部署;同时考虑到客户算力资源的实际情况,分档设置十亿和百亿两种参数量级的模型。

定制版,主要是针对自有高质量数据的客户,同时有一定的研发能力,需针对具体场景,如专科专病,提供定制化模型训练或者调优的服务。

在能力层。主要以API或AI插件的方式提供服务。将已有的基础能力在这一层进行封装后重点向合作伙伴开放,比如医疗问答、文档理解、病历生成等,合作方可以API方式调用这些能力,或是基于AI插件将大模型的能力嵌入到已有产品系统中,打造AI原生的应用型产品,不断丰富灵医大模型的产业场景。

在应用层。主要为患者、医院、企业等终端用户提供AI原生应用,打造了灵医Bot产品,目前聚焦在智能医生助手、智能健康管家、智能企业服务三大方向,满足“医-患-药”各自的特定需要。同时,作为封装好的产品,也更便于有利于快速推进大模型的应用落地应用。

通过以上三层服务架构,就能很好的满足客户和合作伙伴的多层次样化的需要,也便于大家选择更合适的方式进行推广落地,让产品技术做到做到真正的接地气。

第三个差异化价值,全产业链覆盖能力。

作为一个产业级的医疗大模型,百度灵医大模型覆盖了整个大健康产业链,既包括公立医院、科研机构,也包括药械企业、互联网医院平台等全产业链。

基于灵医大模型,一方面对已有产品进行重构升级,为已建立合作的客户提供更为优质的服务。

另外一方面,我们以基于全新的大模型为基础,致力于打造的AI原生的新产品、新场景,不断创造新价值。这些新价值主要体现在专业赋能、效率倍增、体验提升三个层面。

专业赋能方面,可将灵医大模型当做一个专业助手。例如药企以及药店的培训,能够基于大模型获得更多的医药信息支持,快速获取药品关键信息;灵医大模型还提供虚拟讲师个性化培训,虚拟讲师可以根据用户的个性化需求,提供更灵活、更丰富的培训内容;此外,灵医大模型的文献速览功能支持上传多篇中英文文献,并实现一键解析和智能对话,可以满足医生临床、科研、教学等多场景知识学习需求。

知识问答:满足医生临床、科研、教学等多场景知识学习需求;灵医大模型的文献速览功能支持上传多篇中英文文献,实现一键解析并根据文献内容进行智能对话。

效率倍增方面,灵医大模型可以协助医生完成具体的任务。例如传统上需要花费30分钟手动书写的病历,在大模型的帮助下,可以秒级生成,大大提升了工作效率。

体验提升方面,大模型能够为患者提供24小时的智能客服服务,随时有一个健康管家在身边,大幅提升患者医疗服务的获得感与价值感体验。

由此也可洞察到百度灵医大模型的显著优势:首先,它符合医学事实,提供的内容严谨,有证可循,这使得模型更具权威性和可信度。其次,百度灵医大模型在保障用户信息安全和诊疗安全方面表现出色,充分体现了其对用户隐私和医疗安全的承诺。再者,模型的推理逻辑通顺合理,能够逼近真人的思维和推理过程,使得医生更容易理解模型的推荐进而使用它来做出准确的诊断和治疗方案。此外,百度灵医大模型能够准确理解用户的意图并生成有效内容,这有助于提高医生和患者之间的沟通和交流效率。最后,模型提供的内容呈现全面,不断章取义,这使得医生能够全面了解患者的病情并根据实际情况做出正确的判断进而给予恰当的治疗方案。

一言概之——正确性、安全性、逻辑性、理解力、完整性。

2

凭什么是它?

肯定有人要问,倪叔这只是一家之言吧,在群“模”乱舞的行业背景下,百度灵医大模型真正凭什么正本清源?

来自文心一言通用大模型

首先,百度AI的技术先发地位,决定了百度灵医大模型的领先优势。

作为国内最早全面布局AI行业的科技巨头,百度持续将其技术领先性应用于最符合时代发展的方向上,这既是一种判断,更是一种姿态,它意味着百度的技术取向与投入必然获得先人一步的突破,对于AI、大模型的理解深度,也将反哺其在技术应用上的综合高度。

而“灵医智惠”更进一步,将医疗AI落到了应用实处,切实打开了医疗大模型的应用局面。

在“灵医智惠”与固生堂联合举办的大模型战略合作启动仪式上,百度集团资深副总裁、大健康事业群总裁何明科曾经表示,跨界合作的背后是千行百业对于掌握最先进生产技术的迫切与渴望。而固生堂与百度智慧医疗的合作,一开始就从业务场景落地为出发,将在中医病历生成、智能分导诊、预问诊、知识问答等多细分场景落地。

从这种合作思路与真实合作经验的逻辑来看,也就是说,此次百度灵医大模型是一个循序渐进技术积累的必然结果,而非借风口之力蹭热度之流。在背后体现的是百度在AI与产业结合方面的整体布局、持续深耕能力。

最后,百度灵医大模型的突出能力本质上体现了三个产业级的产品思路,重循证、多层次、全链条。

这种产业思路体现了百度在人工智能的产业级应用路径上的严谨与前瞻。那么可想而知,不止于医疗大模型,在其他领域的人工智能应用也将具备这种正确思路,这正是百度对于人工智能行业以及千行百业的真正价值所在。

希望看到您的想法,请您发表评论x