人工智能正在为生命科学研究带来新的方法与视角:从基因序列的计算建模,到细胞状态与空间关系的表征学习,再到医学文献中疾病证据的自动整合,AI 正逐渐成为连接基础生命科学与精准医学的重要工具。相关方法在疾病机制研究、罕见病诊断和药物研发等场景中具有重要应用价值。
近年来,随着高通量基因测序、单细胞技术、大语言模型和基因组序列模型的快速发展,人工智能在复杂生命数据分析、医学文本理解和分子功能预测等方面展现出重要潜力。然而,真实生命科学场景中的数据和任务仍具有显著挑战:基因测序需要在成本、精度和规模之间取得平衡;单细胞多模态数据难以统一建模;不同类型的生物数据存在尺度和噪声差异;医学证据分散在大量论文、表格和数据库中,难以自动整合;个体化预测也常常面临训练样本有限的问题。
本报告将从基因组建模、细胞表征和医学证据推理三个角度出发,介绍人工智能在生命科学中的若干方法与应用。报告将结合极低覆盖度基因组分析、单细胞空间关系学习、基于大语言模型的遗传变异文献证据抽取,以及个体化基因表达预测等研究案例,重点探讨表征学习、对比学习、大语言模型和基因组基础模型在生命科学问题中的作用。