新模型PertKGE助力化合物-蛋白质相互作用研究
关键词: #健康资讯
关键词: #健康资讯
9月19日,中国科学院上海药物研究所郑明月课题组在《细胞-基因组学》期刊上发表了一项重要研究,题为《Identifying compound-protein interactions with knowledge graph embedding of perturbation transcriptomics》。该研究提出了一种新型的计算模型——PertKGE,旨在通过微扰转录组数据解耦化合物-蛋白质相互作用(CPI)。
在药物发现的过程中,化合物与蛋白质是两个核心要素,理解它们之间的相互作用是药物开发的基础。然而,目前并没有一种通用的方法能够准确预测和解释所有化合物与蛋白质之间的相互作用。研究人员通常需要利用多种生物数据,从不同的研究角度构建化合物-蛋白质相互作用的知识图谱。
微扰转录组学为药物发现提供了新的视角,它将化合物与组学数据相连接,能够直观地反映出在化合物微扰后所产生的生物学变化。这种方法为解耦化合物与蛋白质的相互作用提供了可能性,然而,生物数据中存在的噪声、细胞的稳态以及转录组表达的动态变化使得CPI的分析面临挑战,通常难以通过差异表达基因直接反映。
为应对这些挑战,研究团队提出了PertKGE模型。该模型受到微扰组学分析中因果推断模型的启发,并结合了知识图谱在药物发现中的应用,构建了一个包含因果关系的生物知识图谱。该图谱涵盖了三大部分:原因部分(化合物与特定靶标之间的相互作用)、过程部分(生物系统中的多层级调控事件对CPI信号的放大)以及结果部分(微扰的结果通过差异表达基因表现出来)。通过结合知识图谱嵌入技术,PertKGE能够有效建模这些因果链接,从而从差异表达基因中解耦出CPI。
广泛的计算实验结果显示,PertKGE在化合物冷启动和靶标冷启动场景下均展现出卓越的CPI预测性能。此外,通过因果策略引入的多级调控事件,PertKGE有效缓解了CPI数据集中代表性偏差对模型学习的影响,从而显著提升了预测的可靠性。
进一步的研究中,PertKGE被整合进基于表型和靶标的药物发现流程中,成功发现了TNKS抑制剂K-756的新靶标ENPP1,并为其独特的抗肿瘤免疫效应提供了分子层面的机制解释。在针对结直肠癌和胰腺癌的新型靶标ALDH1B1的筛选中,研究团队以10.8%的高命中率筛选到了5个具有全新骨架的潜在化合物。
该团队的研究不仅将CPI预测任务应用于真实的药物发现场景,还通过计算模拟和实验验证证明了PertKGE在药物发现流程中的关键作用,为构建和推理CPI图谱提供了创新的策略。
研究得到了国家自然科学基金、国家重点研发计划、中国科学院基础与交叉前沿科研先导专项等多项资助,并获得了国家蛋白质科学研究(上海)设施规模化蛋白质制备系统的技术支持。这一研究的成功为药物发现领域带来了新的希望,也为未来的相关研究奠定了基础。
2025-01-20
2025-01-20
2025-01-20
2025-01-20
2025-01-20