4月22日,清华大学深圳国际研究生院李斐然助理教授受微生物改造技术全国重点实验室侯进教授邀请,在本学期第四期“格微致知—研究生创新特色课程”作了题为《机器学习赋能合成生物学》的报告,微生物改造技术全国重点实验室和生命科学学院百余名师生聆听报告,并参加讨论。课程由侯进主持。
在讲座中,李斐然系统介绍了数字孪生生命模型的构建与生物大数据分析。李斐然首先讲解了其开发的首个深度学习预测酶活性参数的方法 -DLKcat。该模型只需输入酶的底物信息和序列即可预测其活性,可用于任意物种酶活的预测。在此基础上,构建了超大规模的开源酶数据库 GotEnzymes,该数据库包含了超过两千万个酶-底物对的酶活参数。之后,李斐然介绍了其团队最近开发的一套迄今为止最完整的酵母代谢数字孪生模型Yeast-MetaTwin。该模型结合逆合成分析与深度学习的计算框架,系统性地挖掘了酿酒酵母中的潜隐代谢(underground metabolism),将酵母代谢空间覆盖率从不足10%大幅提升至约92%,显著扩展了对细胞代谢能力的认知,且通过整合大规模反应规则、酶功能注释及酶-底物匹配预测,避免了传统方法中的“组合爆炸”问题。这些研究加速推进了对于蛋白序列-结构-功能关系的理解,有助于更精确预测复杂的生物系统行为,也为设计和优化高效的细胞工厂提供了更多可能性。
授课结束后,在场的师生就如何有效构建数字孪生生命模型,及生物大数据分析所涉及的软件等问题与李斐然深入交流,现场讨论热烈。本次课程不仅加深了师生们对于机器学习交叉领域的认识,也为相关领域的研究和发展提供了新的思路和方向。
李斐然,清华大学深圳国际研究生院助理教授及博士生导师。长期从事数字孪生生命模型的构建与生物大数据分析,致力于揭示生物系统的内在机理,并推动合成生物学和生物医药领域的研究。近年来,在国际学术期刊上发表了20余篇同行评审SCI论文,其中多篇作为第一或通讯作者发表于Nature Catalysis、Nature Communications、Molecular Systems Biology和PNAS等高水平期刊。荣获国家海外优青、《麻省理工科技评论》“中国区35岁以下科技创新35人”、AI100青年先锋等荣誉。