


⬇关注生信方法论,解锁高分干货⬇
🚩点击上方名片,关注生信方法论,每日拆解高分生信佳作,解锁实操技巧与分析思路,助你高效发高分刊!





全基因组关联研究(GWAS)已发现大量癌症风险位点,但95% 以上变异位于非编码区,功能解读困难。传统转录组关联研究(TWAS)多聚焦基因表达与可变剪接,忽略选择性多聚腺苷酸化(APA) 这一关键转录后调控机制。APA 可通过改变 mRNA 3′UTR 长度影响蛋白表达,与肿瘤发生密切相关,但其在泛癌遗传易感中的整体作用、对遗传力的贡献及潜在机制尚未被系统解析。




数据整合与质控

跨组学整合应用:整合基因组、转录组数据🌟
优化虚拟器官建模算法,提升虚拟敲除预测准确性🔎




生信分析没头绪?选题创新卡了壳?如果你也想用 GWAS 数据库发表高分文章即刻“添加好友”高效对接,带你解锁定制化方案,科研难题一键破!



本研究整合22 种癌症类型、55 项大功率 GWAS(样本量均>50,000),总样本中位数达 194,153 例,覆盖欧洲、亚洲人群,数据来源包括 NHGRI–EBI GWAS Catalog、英国生物银行、FinnGen、JENGER 等。
癌症 GWAS lead SNP 95.66% 位于基因组非编码区,其中14.78% 富集在 3′UTR 及下游 20 kb 区域,在全基因组中呈现显著富集(富集倍数 1.62)。
不同癌症遗传力差异显著,乳腺癌遗传力最高(h²=0.17),淋巴瘤最低;生物学相近的癌症(如基底细胞癌与黑色素瘤、乳腺癌与女性生殖系统癌)遗传相关性更高;欧亚人群间癌症遗传差异较弱。

图1研究概述及收集的癌症相关全基因组关联研究(GWAS)摘要统计数据


功能 GWAS(fgwas)显示,3′aQTL 在35.88% 的组织–癌症配对中显著富集,在前列腺癌(全血)、乳腺癌(皮下脂肪)等关键配对中富集效应强于 eQTL。
分层 LD 分数回归(S-LDSC)显示,3′aQTL 可贡献中位数 14.11% 的癌症遗传力,在全血、脂肪组织中对乳腺癌、前列腺癌、皮肤癌等多癌种遗传贡献突出。
QQ 图证实,3′aQTL 在癌症 GWAS 信号中的富集程度显著高于基因组随机 SNP,支持其真实遗传关联。

图2 3′aQTLs富集对人类癌症性状遗传性的综合分析


共定位分析显示,3′aQTL 与28.57% 的癌症 GWAS 风险位点共定位,涉及 17 种癌症、34 个癌症性状;共定位事件在编码基因与 lncRNA 中均广泛存在。
53.1% 的 3′aQTL 共定位基因不与 eQTL、sQTL 重叠,代表一类全新的独立调控风险基因;典型如 CASP8 基因,仅与 3′aQTL 共定位,不与表达 / 剪接 QTL 关联。
3′a 基因通路富集集中于线粒体蛋白定位等肿瘤恶性转化相关通路,与 eQTL、sQTL 基因的 DNA 修复、染色质调控通路明显不同。
精细映射显示,同时属于 GWAS 可信集与 3′aQTL 可信集的变异,因果后验概率显著更高;加入 3′aQTL 可将 GWAS 精细定位精度提升,≤5 个候选因果变异的位点从 33 个增至 53 个。
序列特征上,3′a 基因具有显著更长的 3′UTR、更丰富的 AU 富集元件,提示更强的转录后调控潜力。

图3 共定位识别癌症性状相关基因


基于 GTEx 49 种组织、TCGA 18 种肿瘤构建3′aTWAS 模型,最终鉴定出642 个 APA 介导的泛癌易感基因(FDR<0.05)。
62.46% 的易感基因为传统表达 TWAS、剪接 TWAS 完全遗漏,极大扩展了癌症易感基因库。
易感基因在乳腺癌、前列腺癌中数量最多,且多个基因(如 SNX17、SPATA33、CASP8)在多癌种中共享,属于泛癌风险基因。
基于 DepMap 与 DRIVE 的基因必需性分析显示,3′aTWAS 基因的 CERES 评分显著低于 eTWAS、sTWAS 基因,对癌细胞增殖的必需性更高,其中 8 个基因的必需性接近或超过经典癌基因 MYC。

图4APA全转录组关联研究(TWAS)结果


CRLS1 在共定位与 3′aTWAS 中均被显著检出,其 GWAS 信号可被3′UTR 使用模式完全解释。
风险等位基因(rs2235816 G>A)使CRLS1 的 3′UTR 明显延长,3′RACE 实验直接验证了这一 APA 改变。
双荧光素酶报告显示,长 3′UTR 亚型与风险等位基因均可显著提高蛋白表达水平,机制与破坏 CSTF2 结合位点相关。
细胞功能实验证实,si/shRNA 敲低 CRLS1 可显著抑制乳腺癌 MCF-7 细胞增殖与克隆形成,直接证明 CRLS1 的 APA 异常通过提升蛋白丰度促进乳腺癌发生发展。

图5乳腺癌中APA关联的易感基因


新鉴定的 APA 易感基因与TP53、BRCA1/2、CASP8等经典癌基因形成紧密的蛋白互作(PPI)网络。
通路富集显示,这些基因显著集中在细胞内蛋白转运、凋亡执行阶段、TRAIL 信号通路等与癌症代谢重编程、细胞死亡调控密切相关的通路。
基因调控模式呈现方向性:长 3′UTR 使用与部分基因的癌症风险升高相关,短 3′UTR 使用与另一部分基因风险升高相关,形成双向调控格局。

图6新发现的APA相关癌症易感基因在代谢重编程和凋亡相关通路中得到丰富

本研究通过泛癌多组学分析证实,选择性多聚腺苷酸化(APA) 是癌症遗传易感的重要机制。3′aQTL 可贡献癌症遗传力并与 GWAS 风险位点共定位,3′aTWAS 鉴定出642 个泛癌易感基因,62.46% 为传统研究遗漏;实验验证CRLS1的 APA 异常可促进乳腺癌进展。该研究为癌症易感基因挖掘与病因解析提供了新方向。
深耕GWAS数据库,想利用数据库高效发文?关注私【生信方法论】,顶刊思路不在难复刻,解锁专属科研解决方案!

生信方法论
GBD|CHANES|CHARLS
生信分析|机器学习
数据库联合|个性化分析
评论区留下你的生信研究方向,「生信方法论」每日精选顶刊文献、精准解读前沿思路。关注我们,持续获取生信科研硬知识。


IF15.70!实力攻坚!集美大学牵头多校联合,靠GEAS+UKB研发高效补值算法,成果登顶《Nature》1 区顶刊!