北京开启医疗人工智能应用评测服务

2025-11-10

IT之家11月9日消息,11月7日,北京市卫生健康委发布《关于开展医疗领域人工智能应用评测工作的通知》,正式为各企业、研究机构提供评测服务。


近年来,随着人工智能技术快速进步,医疗AI正加速朝着辅助医生、承担部分医生技术劳动的方向发展。如何坚持科技为民、科技向善,确保医疗AI应用规范安全有效,成了公众和行业关注的问题。


为此,北京市卫生健康委在国家基地建设中专门设立了医疗人工智能应用评测中心(以下简称评测中心)。其目的是建立医疗AI评测的制度体系与规范标准,依托首都高水平医院、专家队伍以及高质量医疗数据,验证医疗AI的临床辅助决策能力和效果,筑牢医疗人工智能应用安全底线,同时助力医疗人工智能产品迭代优化。


首先,在评测内容方面,评测中心构建了一套多维度考核标准。从百姓和医生最关心的角度出发,形成了包含6个核心维度(医学合规伦理、医学循证与知识、通用辅助能力、专科诊疗质控管理、诊疗流程适配性、诊疗决策准确性)的评测指标体系,涵盖70多项具体评测任务。全面考察“安全”,查看是否存在隐私泄露、违背医学伦理的情况;考察“专业”,测试是否运用最新医学教材、诊疗指南;考察“适用”,检查是否符合医生思考逻辑和日常工作流程;考察“准确”,查看AI诊断是否正确,治疗建议是否合理。


其次,在评测数据方面,评测中心联合重点医院、科研机构及权威专家团队,利用临床案例、国内外权威医学教材和最新临床诊疗指南,共同构建高质量评测数据集。权威医学教材保证基础知识扎实,临床诊疗指南确保与临床实践同步,典型案例覆盖常见病、罕见病及疑难病。“考题”由国内顶级专科高年资医师全程深度参与编撰与审核,保证评测的科学性和权威性。


最后,在评测方法方面,评测中心严格执行用户申请、系统评测、专家复核三个环节。系统根据应用类型自动匹配评测任务并生成评测报告,由临床专家进行复核。在计分方式上,除采用国际通用基础评测指标外,评测中心还创新引入基于人工智能的评分机制,即通过“裁判模型”判卷,综合“考生”的诊疗思路、推理逻辑、答题结果进行量化打分,避免只看最终结果的片面性。例如,两款人工智能应用都诊断正确,评测系统会给推理逻辑更严谨、依据更充分的那款打更高分,确保评测结果客观公正、科学可信。


《通知》中提到,本次评测服务是医疗领域国家人工智能应用中试基地首次提供对外评测服务,主要聚焦胸外科诊疗领域开展专项评测。评测结果将根据参评单位意愿适时公布,评测表现优秀的应用将优先纳入国家人工智能应用中试基地推广渠道,向各级医疗机构重点推荐。


后续,评测中心将陆续开展更多医学领域的评测服务,覆盖内科、外科、儿科等专业领域,助力医疗人工智能产业健康发展,更好地满足人民群众的健康需求。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com