SCUBA-D模型:基于去噪声网络的全新蛋白质主链设计方法
关键词: #健康资讯
关键词: #健康资讯
中国科学技术大学生命科学与医学部的刘海燕教授和陈泉教授建立了团队,近期开发了一种依赖预训练结构预测网络的蛋白质主链噪声去扩散概率模型——SCUBA-D(SCUBA-diffusion) )。该模型能够自动从头设计蛋白质主链结构,或者根据指定的功能位点生成主链结构。这项重要的研究成果已经通过大量实验验证了其高效性和精确性,并于2024年10月9日以题为“独立于预训练结构预测模型的去噪扩散网络的从头蛋白质设计”的论文在线发表于《NatureMethods》期刊上。
刘海燕教授和陈泉教授团队多年来致力于蛋白质设计的相关研究工作,尤其是通过数据驱动的方式实现蛋白质的精准设计。早在2022年,团队该团队已成功开发出SCUBA模型,该模型通过神经网络能量函数从头设计蛋白质主链结构,并在《Nature》期刊发表。此次推出的SCUBA-D模型是这项研究的迭代升级版,它在深度学习的框架下,利用扩散概率模型进一步提高了蛋白质主链设计的成功率和精确度。
SCUBA-D模型的独特之处在于它不依赖于传统的预训练结构预测网络。传统方法往往会使用现有的结构预测网络作为休眠工具,这使得模型很容易产生已知天然蛋白质结构的偏好,导致设计的结构可能在可设计的蛋白质空间中存在盲区。而SCUBA-D通过在过程中引入对抗性损失函数(adversarial loss),有效避免生成出物理上不可行的结构,从而大幅提升了设计由于SCUBA-D独立于训练预模型,它在设计蛋白质结构时能跳脱出对天然蛋白质结构的依赖,这为探索新的蛋白质结构提供了更多的可能性。
具体来说,SCUBA-D模型可以通过不同的输入执行碳水化合物的蛋白质设计任务。首先,模型可以根据噪声或用户定义的结构草图生成新的主链结构;其次,它也可以根据功能位点的给定定信息,设计新的、功能性完整的主链结构。这使得SCUBA-D在蛋白质从头设计、功能蛋白质设计等多个领域发挥了极高的应用潜力。
实验数据充分验证了SCUBA-D模型的性能。在蛋白质重组结构的头设计任务中,研究团队设计了70条验证蛋白质序列,并由此进行实验。结果显示,近80%的序列(53条) )能够在实验条件下成功表达,这表明SCUBA-D设计的序列具备良好的可溶性。进一步解析的16个高分辨晶体结构与目标结构高度一致,主链原子位置的均方根中继(RMSD)介于0.96到2.11 Å之间,显示了设计结构的高精度。
另外,团队承诺SCUBA-D评估小分子结合蛋白的设计任务中。研究团队对非经典血红素降解酶进行了保留功能点的主链结构重新设计,可视化12条设计序列进行实验验证。其中5条序列表现出了与血红素结合的能力,而其中3条设计序列与血红素的结合亲和力甚至与天然蛋白相当或更高,显示了设计蛋白在结合能力上的优越性。
在另一项蛋白质结合任务中,研究团队对30个人工设计的Ras结合蛋白质进行了实验验证。结果表明,其中14个蛋白质能够与Ras应答,且其中3个设计蛋白质的结合亲和力与天然蛋白质近期,进一步的晶体结构解析则验证了这些设计蛋白结构的准确性。
总的来说,SCUBA-D模型为蛋白质设计提供了一种全新且高效的工具,其不依赖预训练网络的设计方式极大地拓宽了蛋白质结构的设计空间,并在多类蛋白质设计任务中进行了练习这一模型的成功无疑为未来的蛋白质设计和功能研究开辟了新的可能性。
2025-01-19
2025-01-19
2025-01-19
2025-01-19
2025-01-19