想象一下,你手里有一台分子级别的“打印机”,可以按照需求“打印”出任意长度的DNA链。其实这样的“打印机”在自然界中确实存在,它就是末端脱氧核苷酸转移酶(Terminal Deoxynucleotidyl Transferase, TdT)。TdT酶的神奇之处在于,它不需要DNA模板,就能像自由发挥的画家一样,将脱氧核苷酸随机添加到单链DNA的末端。这种能力让它成为合成生物学的重要工具,比如帮助科学家合成新基因、制造疫苗,甚至修复受损的DNA。然而天然TdT存在热稳定性差、催化效率低等问题,限制了其在工业规模DNA合成中的应用。为了解决这些问题,科学家们决定用计算设计的方法,对TdT酶进行改造,让它变成耐高温、高效率的“超级工具”。
近期,浙江大学杭州国际科创中心(以下简称“科创中心”)于浩然研究员采用人工智能算法ProteinMPNN、计算软件PROSS设计了十余种TdT突变体,使其熔解温度最高提高了24.3 °C,最优突变体M7−8的半衰期提高了77倍。相关研究以“Computational Design of a Thermostable and Highly Active Terminal Deoxynucleotidyl Transferase for Synthesis of Long De Novo DNA Molecules”为题,发表在ACS Catalysis上。
论文截图,科创中心供图
给酶“穿上”加固铠甲
如何改造TdT酶,这就像把一辆普通汽车升级改造成专业赛车,需要从结构、动力系统到操作性实现全面升级,而提升酶的耐热性和活性,就如同给赛车安上高性能的“发动机”。
“DNA的合成过程就像制作一条项链,如果合成时间变长,末端就会‘打卷’形成二级结构,阻碍下一步合成,解决的办法之一就是提高反应温度、破坏二级结构,恢复DNA的直链状态。我们的研究目标就是改造TdT酶,让它能够在高温条件下工作,帮助项链做得更长”,于浩然研究员说道。DNA是合成生物学的基石,只有拿到DNA基因序列,才能够转录成RNA序列,并通过翻译过程转换成蛋白质行使功能,而这项研究也让合成DNA的过程更加顺利。
左一为论文第一作者博士生牛亚丹、右一为于浩然研究员,科创中心供图
AI和“超能酶”的跨界融合
AI和合成生物,两个看起来完全独立的领域,是如何跨界融合的?
研究团队首次采用人工智能模型ProteinMPNN对截短的ZaTdT蛋白进行基于结构的重新设计,固定52个关键催化位点以保持功能。研究发现MP8在保持较高表达和热稳定性的同时,催化活性接近甚至优于野生型,这表明了结合蛋白质进化信息(PSSM)的蛋白质从头设计,有助于获得兼具稳定性和功能性的TdT突变体。
由ProteinMPNN生成的TdT的表现,科创中心供图
“跨界融合”的过程并非一帆风顺,团队初期设计出来的版本,酶的稳定性虽有提高,但活性却出现下降。研究团队经过对TdT同源序列的搜索和清洗,构建高质量的多序列比对文件,将其融合于蛋白质设计过程,有效提升了酶的稳定性和活性。这一过程就像给AI大模型输入高质量语料库并加以训练,当算法在生成一个新序列时,它会充分考虑前期“投喂”序列的进化规律,从而让序列变得更加稳定,并保持高活性。
改进突变体的活性和热稳定性,科创中心供图
TdT酶成功的计算设计,展现了计算生物学和人工智能算法的强大力量。“虚拟设计+实验验证”的方式不仅能优化自然界的酶,还能创造全新的分子机器。
从制药到DNA存储
DNA合成技术是服务细胞工厂构建、疫苗开发、治疗性抗体生产、基因治疗等的关键底层技术。使用热稳定性更高的TdT酶,可以在高温下快速合成更长的DNA链,大幅节约DNA合成成本、缩短研发时间。
另外,DNA作为携带生命核心“密码”的神秘大分子,可以发挥“硬盘”的功能角色,通过“A”“T”“C”“G”四进制进行信息存储。DNA存储密度极高,每克DNA的数据存储量能够达到215PB,相当于22万个1TB硬盘的数据存储量。另外,DNA存储的时间长,在没有特殊人工干预的情况下,能保存上千至上万年。于浩然说道。
未来,于浩然团队尝试通过设计自动化样机来提升工作效率,将实验流程自动化,高效合成可定制的DNA序列。“目前常用的化学法合成的DNA长度有限,而配合自动化设备,使用酶法合成DNA能在合成准确率、合成效率上得到提升、也能实现DNA合成长度的突破。”于浩然表示,后续自动化样机和科创中心所建立的iBioFoundry平台的联动运用,也将有力提升基础科研效率、推动产业落地转化进程。
“从2020年入园到现在,五年的时间里,科创中心给予了经费、场地、人员上的支持,让我们团队能够沉下心做研究。作为第一批‘老员工’,团队也有优秀的博士后留在了中心,看到中心发展势头越来越好,我打心底里高兴。”于浩然说道。
“转载请注明出处”