DeepSeek能满足医院的需求吗?病理学大模型是否被神化?
“只有在大家的支持下,才能成功迈出第一步,但晨练最难的是早起走上跑道迈出第一步。” 2 月 20 当天晚上,张少霆在朋友圈里转发了一条信息,庆祝商汤医疗完成超过1亿元 Pre-A 轮融资。
作为我国 AI(人工智能)龙头商汤科技副总裁、研究院副院长、商汤医疗 CEO,张少霆在 2018 2008年加入商汤时,以“智慧健康负责人”的身份亮相。
中国是去年夏天的第一个 AI 病理大模型 PathOrchestra 商汤科技、西京医院、清华大学的合作团队声称“完成了世界上最常见的临床研究任务赋能,完成了人工智能病理学研究领域从‘单模病’到‘一模病’的跳跃性突破”。近日,国内首家通信技术龙头华为参与发布“瑞智病理大模型” RuiPath ",让大型病理模型再次引起公众关注。
作为 AI 医疗大模型领域最具挑战性的“明珠”,为什么病理大模型频繁停留在领先地位?近日,《国家商报》记者(以下简称“NBD")独家对话张少霆,了解他的观点。
都知道 DeepSeek,但是什么是大的病理模型呢?
与 DeepSeek 与通用大模型不同,病理大模型致力于处理病理学家面临的临床问题;但与宫颈癌筛查等特殊模型不同,大型病理模型致力于解决各种临床任务。数据显示,PathOrchestra 覆盖肺部、乳房、肝脏、食道等 20 多种器官,赋能100多项临床任务,是当年世界上赋能临床任务最广泛的病理模型。
NBD:大型病理模型和 DeepSeek 有什么不同?
张少霆:DeepSeek 等等属于大型语言模型,大多数病理模型属于图像模型,也有一些是多模态模型,这是两种完全不同的模型。前者(大语言模型)一般有几百亿到几千亿的参数,不同的提示可以胜任几百个不同的任务;后者(大病理模型)的参数值规模在1亿到10亿之间。对于特定的下游任务,为了更好地适应这些任务,仍然需要添加相关数据进行微调训练。
所以,病理学大模型并不是人们常说的“大模型”,它更接近传统的预训练模型(Pre-trained Model),还不能像语言大模型那样“大杀四方”,还要深化下游任务。
NBD:为什么商汤医疗选择做病理大模型?
张少霆:基于医学图像进行辅助诊断时,有一个概念叫做“长尾问题”。例如,肺结节检查是一种数据丰富且易于获取的高频问题,因此可以相对容易地获得足够多的数据来训练专业人士模型。这种模型可以高效,性能优异,而不需要特别大。但是,对于一些小众疾病,数据标注稀缺,难以获得。这样的话,传统的数据采集和标记方法就显得力不从心了。
病理学大模型的优点是可以减少对传统数据采集和长尾问题注明的需求,从而提高模型训练效率,更好地适应和解决子问题。
回顾过去,我们对病理学领域的大模型研究自然会随着技术范式的变化而发生,经历了三个阶段。2018 从2000年开始,致力于胃肠道和宫颈 TCT单点应用(液基薄层细胞学检验);2021 从2008年开始,与瑞金医院合作,将下游任务扩展到 9 各种疾病,在迁移学习方面取得了一定的成果;2023 从2000年开始,我们开始训练大型病理模型,以覆盖数十种“长尾”疾病。
NBD:资料显示,PathOrchestra 能赋予100多项临床任务,这能包括医院病理科接触过的所有疾病吗?
张少霆:下面是“任务”的定义。举例来说,细胞分割或细胞检测对病理图像也是一项不同的任务,所以我们所说的 100 各种下游任务对应的不是 100 目前各种疾病,基本上可以覆盖二三十种疾病,比如 AI 在组织病理学中赋能最多的胃肠标本,宫颈 TCT 标本协助筛查,已满足病理科医师日常工作的大部分需要,但这些都是通过专业人才模型来完成的。
目前还有很多病理切片需要医生亲自检查,比如肿瘤组织标本,需要根据病理切片对十几种不同疾病的亚型进行分类判断。目前完全把这个任务交给病理模型还为时过早,因为目前大模型只有一般的“排兵布阵”阵型知识,缺乏一个一个打破的战斗能力。如果每个亚型都有一定的出错概率,十几个亚型同时正确的概率就低很多。
大型病理学模型不易做到,但是可以有效地解决两大问题
2023 2008年是大模型技术突破时期。最初发布医疗大模型产品的医疗企业有几十家,金融市场掀起了一股浪潮。 AI 医疗热潮。然而,由于应用的挑战,这些大型医疗模式正在进行。 2024 每年的声音明显减少。现在,当以病理大模型为代表的专科大模型出现时,他们似乎面临的难题只有不少。
NBD:发展病理学大模型,面临哪些技术挑战?
张少霆:仍然有相当多的挑战。首先是数据覆盖面,例如覆盖不同疾病并注意数量比例,不能只追求总数。举例来说,大模型在某一疾病上的表现很好,但是它可能会影响某些疾病的性能。要找到一个平衡点,让模型能兼顾各种疾病。二是大型模型虽然泛化性更强,适用场景更多,但参数大幅增加,导致运行效率下降。如何在保证性能的同时控制运行时间效率,是一个亟待解决的问题。
NBD:您刚才提到,病理重点模型在不同病理样本之间的性能可能会有所不同。怎样才能保证病理大模型特性的一致性和可靠性?
张少霆:体外诊断(IVD)这一领域常常面临着泛化问题。尽管商汤的病理产品已在近百家医院落地,目前所见的泛化性表现良好,但是医疗领域需要用统计数据进行讲话。泛化实验的标准正在制定中。如果产品不能直接应用于新场景,则需要利用当地新数据(包括标记数据)进行小规模参数微调,以便更好地适应新场景。
NBD:有些医生表示,病理样本的数字化比例并不高,这是一个挑战吗?
张少霆:是啊。病理数字化是 AI 如果没有病理数字化的基础设施,分析前提条件,AI 在临床上也很难进行大规模的辅助诊断赋能。对大型病理模型的研究,病理数字化的影响也足够长。
PathOrchestra 这是基于当时国内最大的数字病理图像数据集训练,但是仅仅大量的数据是不够的。如果我们回顾一下《自然》杂志上发表的哈佛、微软、斯坦福的文章,就会发现数据的分布更为重要。例如,肠胃和宫颈 TCT 这两个领域的数据量都很大,但其中有多少是关于乳房、肝脏等其他细分领域的?因此,病理数字化程度越高,越普遍。只有当数据覆盖面充足时,大模型才能平衡和处理足够多样化的任务,这不容易平衡(信息量和数据分布)。
NBD:现在有这么多挑战,为什么还要做大的病理模型?
张少霆:专有模型也面临两大挑战,一是前面提到的长尾问题,二是病理检查属于体外诊断,个别医院尤其是基层医院的生产过程可能不够规范,导致病理图像特征差异巨大,进而对专有模型的泛化提出更高的挑战。
大型模型可以有效解决这两个问题。在长尾问题上,大型模型至少可以提供比“无解决方案”更好的选择;在泛化方面,大型模型可以作为编码器(encoder),在优化某一疾病的特殊诊断模型之前,提取病理图像的特征。这种机制使大模型能够更好地总结病理数据的特征,从而具有更广泛的疾病覆盖能力。
但需要再次注意的是,目前大型病理模型无法像大型语言模型那样全面直接地处理很多问题,更多的是集中在科研领域。
医院院长们怎么看? AI 潮?
医院是病理模型等专业模型的直接买家。在张少霆看来,企业去年参与的湖北省“小切片”项目,是一项病理工程。 AI 模型落地标志性事件。这是湖北省医院智能化、数字化和数字化事件。 AI 化学转型,覆盖数百家基层医院。这个事件也预示着,大型病理模型的应用似乎已经达到了突破的临界点。
NBD:对于病理 AI 落地,有人支持,有人怀疑。根据你的观察,医院院长们是怎么想的?
张少霆:在R&D和发展的过程中,总有保守主义者和激进主义者。我认为国内政策制定者目前更倾向于拥抱新技术。对于头部医院,他们不仅希望介绍 AI,为医生节省时间,提高诊断精度,更希望借助 AI 对于基层医院来说,赋能其医联体医院的业务也是一个降低成本的过程。
但是,医院决策采购的核心考虑之一就是能否带来增量收益。有时说服管理层支持采购的难点在于, AI 医疗产品的卖点是帮助医生更准确地诊断和节省时间,而不是直接给医院带来新的收入或快速回报,这在以前是如此。 AI 推广医疗产品面临困难的一个原因。
NBD:您如何看待各医院的接入? DeepSeek 或者发布自己的大模型动作?
张少霆:接入很多医院 DeepSeek 平台之后,通用大语言模型在医疗领域的临床效果还有待验证。事实上,目前很多头部医院都是基于自己的R&D团队,或者尝试与合作企业一起在一般模型的基础上开发垂直模型,打造自己的品牌。这一趋势下,曾经的“百模对决”已逐步演变为垂直领域的“万模对决”。从底层结构来看,这些模型大多是基于开源的通用底座,这些开源底座占据主流地位。在此基础上,医学知识的注入是重点。
NBD:在这波 AI 热度,你感觉到 AI 是否被神化了?
张少霆:具体情况需要具体分析。例如,早期开发的图像模型(如肺结节检查)、刚才提到的胃肠道病理学和宫颈 TCT(液基薄层细胞学检验)等专有模型不仅没有被神化,反而可能被低估。事实上,在中国大多数三甲医院的报告写作背后都有。 AI 的支持。
但是从另一个角度来看,通用大模型的医疗价值可能确实被夸大了。这些大型模型具有很强的通用性能,在很多任务中取得了超出预期的效果,但幻觉问题(指大型模型产生的内容与现实世界事实或用户输入的指令不一致)不容忽视。从某种角度来看,幻觉问题在一般领域可能不是坏事,因为模型可以像人一样“编故事”,但在严肃领域,尤其是在医疗领域,这可能是致命的问题。
事实上,目前我们是上海瑞金医院病理科的专属模型,是帮助医生完成大量任务还是商汤,效果已经临床验证多年。
病理学大模型的产业化还有多远?
2023 2008年,发布了多个大病理模型的海外研究项目《Nature》及《Nature Medicine》其实这说明这个领域在学术界已经很活跃了,工业界也在尝试。但需要浇一盆冷水的是,目前大型病理模型的价值更多的体现在学术界,而不是工业界。
NBD:病理 AI 作商品,它的上市路径是什么?
张少霆:理想情况下,需要进行特定的临床试验,收集临床数据进行分析,以确定是否真的适用于临床试验。这就需要明确具体的任务目标,比如模型在特定任务中的性能要达到多少标准,只有在几家医院完成临床试验后才能部署。
然而,大型病理学模型通常声称可以诊断出几十种疾病,这种复杂性不能在认证中得到全面评估,难以通过。 NMPA(中国国家医药产品管理局) FDA(美国美国食品药品监督管理局)认证过程严格,所以目前产业化仍以病理专业人才模式为主。
NBD:除需要完善的上市路径外,病理 AI 商业化还面临着哪些挑战?
张少霆:在获得肝脏之前,我们花了两年多的时间和数千万的投资。 CT 全国首张三类证书(三类医疗器械注册证书)在确诊领域,在病理上。 AI 在商业化之前,公司需要花费大量的人力、资金、精力和时间,这是一个巨大的挑战。
另外,市场教育与生态链合作也是商业化的重要组成部分。目前,病理 AI 普及程度还比较落后。病理工作流程较为复杂,其落地涉及到扫描仪制造商,AI 工业生态的联动,如制造商、存储制造商等,更需要生态合作伙伴的真诚合作。例如在瑞金医院,商汤主要负责 AI R&D,衡道病理学负责部分信息化,华为主要提供存储硬件,通力合作打造瑞金智能病理样本。
诚然,从技术到商业,我们常常高估一年的变化,却低估了十年的变化,因此,每个人都能给这个行业更多的耐心。
日常经济新闻
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




