北京启动医疗人工智能应用评测服务

资讯 » 新科技 2025-11-09

IT之家 11 月 9 日消息,11 月 7 日,北京市卫生健康委发布《关于开展医疗领域人工智能应用评测工作的通知》,正式向各企业、研究机构提供评测服务。

据介绍,随着近年来人工智能技术的飞速进步,医疗 AI 正在加速向辅助医生、承担部分医生技术劳动的方向发展。如何坚持科技为民、科技向善,确保医疗 AI 应用的规范安全有效,成为公众关注和行业关心的问题。

为此,北京市卫生健康委在国家基地建设中专门设立了医疗人工智能应用评测中心(IT之家注:以下称评测中心),旨在建立医疗 AI 评测的制度体系与规范标准,依托首都高水平医院和专家队伍、高质量医疗数据,验证医疗 AI 的临床辅助决策能力和效果,筑牢医疗人工智能应用安全底线,同时助力医疗人工智能产品迭代优化。


首先,在评测内容上,评测中心专门建了一套多维度考核标准,从百姓和医生最关心的角度出发,形成了 6 个核心维度(医学合规伦理、医学循证与知识、通用辅助能力、专科诊疗质控管理、诊疗流程适配性、诊疗决策准确性)的评测指标体系,包含 70 多项具体评测任务,全面覆盖了看“安全”,查有没有泄露隐私、有没有违背医学伦理;看“专业”,测会不会用最新的医学教材、诊疗指南;看“适用”,查是否符合医生的思考逻辑和日常工作流程;看“准确”,看 AI 诊断对不对,给的治疗建议合不合理。

其次,在评测数据上,评测中心联合重点医院、科研机构及权威专家团队,用临床案例、国内外权威医学教材和最新临床诊疗指南,共同构建高质量评测数据集。权威医学教材确保基础知识扎实,临床诊疗指南保证与临床实践同步,典型案例覆盖常见病、罕见病及疑难病。“考题”由国内顶级专科高年资医师全程深度参与编撰与审核而成,确保评测的科学性和权威性。

最后,在评测方法上,评测中心严格实施用户申请、系统评测、专家复核三个环节,系统根据应用类型自动匹配评测任务并生成评测报告,由临床专家进行复核。在计分方式上,除采用国际通用基础评测指标外,评测中心还创新引入了基于人工智能的评分机制,也就是用一个“裁判模型”来判卷,综合“考生”的诊疗思路、推理逻辑、答题结果进行量化打分,避免只看最终结果的片面性。比如两款人工智能应用都诊断对了,评测系统会给推理逻辑更严谨、依据更充分的那款打更高分,确保评测结果客观公正、科学可信。

《通知》中还提到,本次评测服务是医疗领域国家人工智能应用中试基地首次提供对外评测服务,主要聚焦胸外科诊疗领域开展专项评测。评测结果将根据参评单位意愿适时公布,评测表现优秀的应用将优先纳入国家人工智能应用中试基地推广渠道,向各级医疗机构重点推荐。

后续,评测中心将陆续开展更多医学领域的评测服务,覆盖内科、外科、儿科等专业领域,助力医疗人工智能产业健康发展,更好地服务人民群众健康需求。



免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿,经过编辑审核收录,不代表头部财经观点和立场。
证券投资市场有风险,投资需谨慎!请勿添加文章的手机号码、公众号等信息,谨防上当受骗!如若本网有任何内容侵犯您的权益,请及时联系我们。