人工智能(AI)技术在医疗领域的应用越来越深入,然而,AI 模型的「黑盒」特性导致医疗专家很难直观理解模型决策背后的逻辑,已有的「可解释 AI」方法(包括大语言模型)均无法如实准确的描述模型决策机制,引发了业界对医疗 AI 模型潜在错误、失控风险、偏向性等重大隐患的严重担忧。如何实现医疗专家和 AI 模型的「 零距离」对接,成为当前医疗 AI 推广的痛点。
文章上线截图

5 月 18 日,中国科学院深圳先进技术研究院(以下简称「深圳先进院」)蔡云鹏研究团队在国际权威期刊 Nature Biomedical Engineering 发表最新研究论文「Bridging the Interpretability Gap for Medical Artificial Intelligence Models using Class-Association Manifold Learning」。同时,该研究还被邀请撰写研究简报(Research Briefings)进行推介(每期仅 1 篇)。该研究提出了一种称为「类关联流形学习」(Class-Association Manifold Learning)的数学方法,高效地将黑盒 AI 模型决策规律转化为低维空间的可视化流形,并且用生成式 AI 方法按需灵活的对数据样本进行定向修改并产生虚构对比样本,从而让医生直观理解 AI 所发现的隐藏知识规律,并总结为临床知识。
包括诺奖得主、DeepMind 掌门人 Demis Hassabis 在内的许多科学家均认为,自然规律应该可以容纳在一个低维流形结构中,这为 AI 模型可解释性提供了可能。然而,至今未有方法可以产生这样一个低维流形来有效表达 AI 模型决策及其背后的数据自然规律。研究团队创造性地提出了一种「可重组的流形分解」的思路,运用流形学习,将自然数据分布分解为两个流形子空间,一个低维的类关联子流形编码与 AI 模型决策相关的所有特征,几乎决定 AI 模型的所有行为,另一个高维子流形编码与模型决策无关的个性化特征,并且两个子流形的内点可以进行两两任意组合而产生逼真的新样本。研究团队设计了求解满足上述特性子流形的机器学习算法。这种方式不仅实现了将 AI 模型决策规律压缩到低维流形结构的目标,而且能够产生一系列按特定趋势连续变化的修改样本,让用户可以直接观察 AI 决策变化与样本特征变化的关联规律,进一步总结获得决策面分布、亚型分布、病灶特征等医学知识发现,还可以检测短路学习等模型漏洞。Nature BME 主编 Rita Strack 评价该工作 「提出了一种聪明的方法,以使用者能理解的方式探究黑盒模型内部工作机制」。
图 1 类关联流形学习算法基本框架
研究团队在包括眼科眼底影像和 OCT 造影、X 光胸透影像、脑肿瘤 MRI 影像、心电图、基因表达谱等在内的多种生物医学数据集上对该方法进行了充分评测,证明所提出的方法能够将深度学习模型决策压缩到仅 8 维的低维空间且只损失约 1%-3% 的精确度,损失率仅为传统可解释方法的 1/10,维度仅为 1/3-1/10,并且局部特征解释的准确率也明显超越传统方法。所提取的知识规律与已有的医学知识概念在数据分布上呈现了高度对齐的效果。此外,多名医疗专家的盲测结果一致表明,新方法产生的解释图压倒性的更为专家所认可,为临床辅助诊断和医学科学发现提供了更有力的计算工具。
图 2 类关联流形学习算法通过流形投影和连续生成变化样本的联动,实现 AI 提取临床规律的可视化展示,并实现已知医学概念规律的对齐。
近年来,包括欧盟、美国 FDA 及我国卫健委在内的监管机构纷纷出台了关于人工智能可解释性的推荐性甚至强制性指导意见。另一方面,AI for Science 日益受到科研界的广泛关注。团队上述工作对增强 AI 医疗器械的安全性和合规性、提升 AI 辅助诊疗的质量和认可度、提高 AI 辅助医学科学发现的效率,具有非常重要的应用价值。
深圳先进院蔡云鹏研究员、深圳理工大学潘毅教授、唐金陵教授为论文共同通讯作者。深圳先进院博士生谢锐涛(现为深圳理工大学-深圳先进院联培博士后)为论文第一作者。深圳先进院李烨研究员、香港中文大学王涵研究员等共同参与了研究。中山大学眼科中心多名医疗专家为方法评测提供了重要支持。深圳先进院为第一完成单位。该项研究得到了中国科学院战略性先导科技专项、深圳市高层次人才团队项目、深圳市智能生物信息学重点实验室、国家自然科学基金项目的资助。
如需代发文章宣传、新闻稿、招聘等,请后台回复【学术】添加小编我们长期为科研用户提供前沿资讯、实验方法、选品推荐等服务,并且组建了 70 多个不同领域的专业交流群,覆盖神经科学、肿瘤免疫、基因编辑、外泌体、类器官等领域,定期分享实验干货、文献解读等活动。
添加实验菌企微,回复【】中的序号,即可领取对应的资料包哦~
模块一:科研设计与基金篇
【2401】从初稿到顶刊的写作攻略:一文拿下论文逻辑和语言
【2502】国自然基金申请突围指南:评审专家视角与中标策略深度解析
【2504】DeepSeek 辅助论文写作高阶口令
模块二:信号通路与期刊导航
【2604】《信号通路全景图与关键节点解析》
【2509】《核心工具酶终极大全》
【2603】影响因子动态跟踪与期刊投稿策略分析(2024-2025)
【2505】中国科学院期刊分区表(2025 年最新版,一线科研人员校验)
模块三:实验技术与 Protocol 宝典
【2405】PCR、免疫荧光、蛋白纯化实验 protocol 汇总
【2503】WB 避坑指南
【2402】国内顶尖实验室分子生物学实验方法汇总(实验室内部流传版本)
【2407】细胞培养急救手册/130 种常用试剂配制方法
【2501】染色体分析方法汇总
【非原创文章】「丁香学术」特邀稿件,作者授权发布。本内容著作权归作者所有, 欢迎个人转发分享。未经授权禁止转载,违者必究!