癌症已成为全球主要死亡原因之一,精准的生存预测对肿瘤风险分层、预后评估与临床治疗决策至关重要。传统多组学 + 病理图像的预测模型虽精度更高,但临床中转录组数据获取成本高、难以普及,仅靠病理切片又难以捕捉分子层面预后信息,存在明显模态缺失困境。
针对这一临床痛点,清华大学深圳国际研究生院王润铭团队、哈尔滨工业大学(深圳)张永兵团队联合提出自适应多模态知识蒸馏框架(AMKD),在训练阶段融合病理图像与转录组信息,推理阶段仅用病理切片即可实现媲美多模态模型的生存预测,为临床实用化癌症预后提供全新方案。
文章题目:Distilling genomic knowledge into pathology slides for robust cancer survival prediction
作者(通讯*):张永兵 *、王润铭 *
通讯机构:清华大学深圳国际研究生院、哈尔滨工业大学(深圳)
引用信息:Xu Y, Cai L, Wang Y, Cheng H, Liu F, Li Y, et al. Distilling genomic knowledge into pathology slides for robust cancer survival prediction. Comput Biomed. 2026;1:202527. https://doi.org/10.70401/cbm.2026.0015
扫码阅读全文:

一、研究背景:临床生存预测的模态缺失难题
肿瘤预后由组织形态(病理)与分子特征(转录组)共同决定,现有方法存在以下局限:
1.单模态病理模型:仅用 WSI,丢失关键分子信息,预测精度不足;
2.多模态融合模型:需同时提供病理与转录组数据,临床普及性差;
3.传统知识蒸馏:固定监督强度,当学生模型超越教师时易引入冗余 / 有害梯度。
团队瞄准“训练用多模态、推理用单模态”的临床刚需,设计AMKD 框架,将基因组预后知识 “注入” 病理模型,在训练阶段利用转录组信息监督病理模型,并在推理阶段仅依赖病理切片完成生存预测。
二、核心方法:AMKD—— 跨模态知识蒸馏的创新范式

Figure 1. Overview of the proposed AMKD framework. (a) A multimodal teacher learns joint genomic–pathology representations using self-attention and cross-attention modules for survival prediction. A pathology only student model distills cross-modal knowledge from the teacher through a gene-guided enhancement module and is trained with survival, distillation, and redundancy reduction losses. The student operates without genomic data during inference; (b) Scaled dot-product attention mechanism shared by all attention modules. AMKD: Adaptive Multi-modality Knowledge Distillation; MLP: multilayer perceptron.
AMKD 采用“多模态教师→单模态学生”的分层蒸馏结构,训练时融合信息,推理时脱离组学依赖,核心包含三大模块:
(1)基因编码:用稀疏 MLP 将转录组数据映射为 331 个生物通路特征,保留功能结构、降低噪声;
(2)病理编码:用 UNI 基础模型提取全切片图像(WSI)patch 特征;
(3)双向交叉注意力:同时建模基因→病理、病理→基因的交互,学习基因组感知的病理表征。
将学生模型的病理特征投影至教师的基因组感知空间,用KL 散度约束分布一致性,让学生在无基因输入时,仍能学习具有基因组感知能力的病理表征。
动态调整教师监督强度:
(1)学生弱于教师:强化教师指导;
(2)学生超越教师:削减冗余监督,避免性能倒退;解决传统蒸馏 “强制模仿” 的固有缺陷。
(1)数据集:TCGA 四大癌种(乳腺癌 BRCA、胃癌 STAD、头颈鳞癌 HNSC、结直肠癌 CRAD);
(2)外部验证:独立 CPTAC-HNSC 队列(无微调直接测试);
(3)指标:一致性指数(C-index)、Kaplan-Meier 生存曲线、log-rank 检验。
三、关键结果:单模态推理,多模态精度
AMKD 仅用病理切片推理,平均 C-index 达 0.669,显著优于单模态病理 / 组学模型,也超越现有缺失模态方法:
(1)胃癌 STAD:C-index 0.716(大幅领先);
(2)乳腺癌 BRCA:C-index 0.693;
(3)风险分层显著:所有癌种高低风险组 log-rank p<0.05,最强达 7.20×10⁻³⁹。
在独立外部 CPTAC-HNSC 队列上,AMKD C-index 达 0.558,优于所有对比方法,证明知识可跨数据集迁移。
推理阶段学生模型仅 803K 参数、1.69G FLOPs,远小于同类多模态模型,具有较低参数量和计算开销,更利于临床部署。
模型自动识别与癌症预后强相关的通路:
(1)乳腺癌:Glypican 通路(与文献一致);
(2)胃癌:胆汁酸合成、速激肽受体结合通路;并可视化病理切片上的关键区域,实现形态-分子联合解释。
四、消融验证:核心组件缺一不可
(1)移除ARR 损失:C-index 下降 3.0%;
(2)同时移除 ARR 与基因增强损失:C-index 暴跌 10.6%;
(3)最优平衡系数 α=0.75:兼顾传统蒸馏与自适应调整。
证实:基因引导增强 + 自适应冗余削减是性能提升的关键。
五、研究局限与未来方向
1. 数据集规模与多样性有限,需多中心真实世界数据验证;
2. 未纳入蛋白质组、代谢组、影像等更多模态;
3. 训练阶段仍需完整模态,未来需支持训练时模态缺失;
4. 基于预提取特征,未实现端到端优化。
未来方向:扩展多模态、支持训练缺失模态、提升可解释性、推进临床落地。
六、研究意义:打通基础研究到临床应用的关键桥梁
本研究实现三大突破:
1.范式创新:提出一种面向缺失模态生存分析的自适应知识蒸馏框架,实现“多模态训练、单模态推理”;
2.性能领先:仅用病理切片在仅使用病理切片的条件下取得接近甚至优于多模态模型的性能,兼顾精度与临床实用性;
3.临床价值:低成本、易普及,可快速用于病理科风险分层与治疗指导,推动 AI 病理落地。
AMKD 框架不仅为肿瘤生存预测提供新方案,更为多模态→单模态知识迁移提供通用范式,可广泛应用于其他医学 AI 任务,加速基础研究向临床转化。
通讯作者简介

张永兵
张永兵博士,哈尔滨工业大学(深圳)计算机科学与技术学院教授、博士生导师,国家优秀青年科学基金获得者、广东省科技创新领军人才。他长期致力于计算机视觉、生物医学图像处理、计算成像领域研究,聚焦 AI 与视觉信息处理的交叉创新,尤其在病理全切片分析、单分子成像、多模态知识蒸馏等方向成果突出,在 Nature Computational Science 等国际权威期刊及顶会发表论文 100 余篇,获国家科技进步二等奖 2 项、中国图象图形学学会技术发明一等奖等奖励,授权发明专利 50 余项,主持国家自然科学基金(重点 / 优青)、广东省及深圳市重点项目 10 余项,担任 IEEE、SPIE、OSA 等国际学会会员,积极推动 AI 技术在医疗健康领域的临床转化与应用落地。

王润铭
王润铭博士,清华大学深圳国际研究生院生物医药与健康工程研究院副教授、课题组长、博士生导师,入选国家海外高层次青年人才计划,现任该院总务办公室副主任(挂职),同时为工业生物催化教育部重点实验室(深圳分室)等多个研究机构成员。他长期致力于金属化学生物学、合成生物学、合成化学和人工智能的交叉研究,重点聚焦功能金属生物分子的合成生物技术开发及其医药应用,近年以第一作者(含同等贡献)或通讯作者身份在 Nat Microbiol、Nat Commun、Proc Natl Acad Sci U S A 等国际权威期刊发表论文,已获授权美国发明专利 3 项、公开美国 / 国际(PCT)专利 2 项,主持国家科技部重点研发计划课题、国家自然科学基金优秀青年科学基金(海外)等多项重要科研项目,斩获麻省理工科技评论 “35 岁以下科技创新 35 人” 亚太区入选者、日内瓦国际发明展金奖等多项荣誉,研究工作受到新华网、路透社等中外数十家权威媒体关注。
期刊主页:https://www.sciexplor.com/cbm
联系我们:cbmjournal@sciexplor.com



Author Instruction
Submission Portal
欢迎添加小编微信,加入CBM读者群。

关于期刊
Computational Biomedicine(CBM, Online ISSN: 3107-3131)是由Science Exploration Press出版的一本金色开放获取、同行评审的季刊。期刊由宁波东方理工大学黄德双教授担任主编,专注于计算方法与生物医学科学的交叉领域。
作为一个聚焦多学科交汇的平台,CBM紧跟这一快速发展的交叉领域的最新动态,重点报道利用生物信息学、数据分析、建模、模拟、人工智能和机器学习等计算技术进行的开创性研究,以增进对生物医学、疾病机制和治疗策略的理解。诚挚欢迎领域内科研人员向本刊投稿。
期刊主页:
https://www.sciexplor.com/cbm
投稿地址:
https://www.intellimanus.com/#/login?journalPath=cbm
联系我们:
cbmjournal@sciexplor.com



期刊官网
作者须知
投稿链接

Science Exploration Press是一家致力于传播高质量的科学研究成果的开放获取出版公司。自成立以来,Science Exploration Press协同各领域的专家创办了多本学术期刊,涵盖生物医学、建筑、计算机、材料等多个学科。
我们的使命 | Our Mission
我们致力于成为全球科研工作者可信赖的知识传播平台,推动科学进步、鼓励思想碰撞,让高质量研究触达世界每一个角落。
我们的价值观 | Our Core Values
学术为本:坚持严谨、公正、透明的审稿与出版流程,尊重每一份真实的科研努力。
开放共享:支持知识自由流通,让科研成果真正服务于全社会。
作者中心:以作者为中心,提供高效、友好的出版体验,并为研究传播提供全方位支持。
多样包容:鼓励跨学科、跨地域、跨视角的学术声音,让多样性成为创新的土壤。
影响力:我们相信,科研的影响力远不止数字。我们关注研究如何启发实践、服务社会、激发未来。
我们的承诺 | What We Stand For
我们不仅仅是一个出版平台,更是一个推动学术生态良性循环的行动者。我们坚信:
一本好期刊,是帮助真正有价值的研究被看见、被理解、被延续。
一次好合作,是基于共同理念的长期同行。
更多信息请访问Science Exploration Press官网:
https://www.sciexplor.com/
或联系我们:
contact@sciexplor.com

出版社官方网站














*点击图片了解期刊详情