CN117198386A - 基于人工智能技术预测蛋白分子相互作用的方法和装置 - Google Patents
基于人工智能技术预测蛋白分子相互作用的方法和装置 Download PDFInfo
- Publication number
- CN117198386A CN117198386A CN202311476334.1A CN202311476334A CN117198386A CN 117198386 A CN117198386 A CN 117198386A CN 202311476334 A CN202311476334 A CN 202311476334A CN 117198386 A CN117198386 A CN 117198386A
- Authority
- CN
- China
- Prior art keywords
- predicted
- binding
- crystal structure
- preset
- binding sites
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 169
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 169
- 230000003993 interaction Effects 0.000 title claims abstract description 106
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 24
- 238000005516 engineering process Methods 0.000 title abstract description 20
- 239000013078 crystal Substances 0.000 claims abstract description 220
- 239000002131 composite material Substances 0.000 claims abstract description 63
- 238000004088 simulation Methods 0.000 claims abstract description 63
- 238000004364 calculation method Methods 0.000 claims abstract description 36
- 238000000329 molecular dynamics simulation Methods 0.000 claims abstract description 26
- 238000002884 conformational search Methods 0.000 claims abstract description 14
- 230000004001 molecular interaction Effects 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 32
- 230000033001 locomotion Effects 0.000 claims description 15
- 230000035790 physiological processes and functions Effects 0.000 claims description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 7
- 239000001257 hydrogen Substances 0.000 claims description 6
- 229910052739 hydrogen Inorganic materials 0.000 claims description 6
- 230000002209 hydrophobic effect Effects 0.000 claims description 5
- 230000009881 electrostatic interaction Effects 0.000 claims description 4
- 238000003166 chemical complementation Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 abstract description 9
- 239000002547 new drug Substances 0.000 abstract description 5
- 230000006916 protein interaction Effects 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 141
- 239000003814 drug Substances 0.000 description 51
- 229940079593 drug Drugs 0.000 description 35
- 108091008794 FGF receptors Proteins 0.000 description 32
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 32
- 101001051971 Homo sapiens Fibroblast growth factor 22 Proteins 0.000 description 32
- 102100024804 Fibroblast growth factor 22 Human genes 0.000 description 31
- 102000005962 receptors Human genes 0.000 description 21
- 108020003175 receptors Proteins 0.000 description 21
- 238000013461 design Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 125000000539 amino acid group Chemical group 0.000 description 8
- 238000009510 drug design Methods 0.000 description 8
- 238000012827 research and development Methods 0.000 description 7
- 102000023732 binding proteins Human genes 0.000 description 6
- 108091008324 binding proteins Proteins 0.000 description 6
- 230000002085 persistent effect Effects 0.000 description 6
- 239000003596 drug target Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000004962 physiological condition Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004904 shortening Methods 0.000 description 3
- 229940043263 traditional drug Drugs 0.000 description 3
- 125000003368 amide group Chemical group 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 238000005460 biophysical method Methods 0.000 description 2
- 238000009509 drug development Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 125000002883 imidazolyl group Chemical group 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012362 drug development process Methods 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 102000055267 human FGF22 Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000012482 interaction analysis Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000007614 solvation Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000006918 subunit interaction Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种基于人工智能技术预测蛋白分子相互作用的方法和装置。该方法包括获取两个待预测蛋白分子的第一晶体结构;对两个第一晶体结构进行自由能极小化模拟,获得两个待预测晶体结构;对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出满足第二预设条件的结合位点或界面;对结合位点或界面进行计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式;构建复合晶体结构,分析复合晶体结构中具有目标相互作用的目标结合位点;对复合晶体结构进行分子动力学模拟,分析复合晶体结构中两个待预测蛋白分子结合状态及相互作用力的强弱。本申请提供的方案,能够快速分析出蛋白分子之间相互作用,缩短新药开发时间、降低研发成本。
Description
技术领域
本申请涉及计算机技术、人工智能技术、生物大分子多尺度模拟技术及计算结构生物学技术领域,尤其涉及基于人工智能技术预测蛋白分子相互作用的方法和装置。
背景技术
近年来,生物药尤其是蛋白质药物前沿靶点结构建模与计算机技术之间的协同研究与交叉融合,已成为大分子生物药尤其是蛋白质药物研发的前沿新锐技术和核心竞争力。
较早期的药物主要通过筛选方法获得,筛选方法是最为传统的药物设计方式。数以万计的化合物经大量实验,先甄别化合物的生物活性,再经过体外药理、药代、动物实验等过程的层层筛选,最终进入临床试验。这种随机筛选的方法研制新药的效率极低,非常耗时,代价昂贵;尽管如此,药物研发最终阶段还可能因缺乏足够的安全性或有效性而被迫终止,不能满足现代制药的药物研发进程。自上个世纪80年代发展起来一种新的基于计算机模拟与理性设计的方法:计算机辅助药物设计(computer aided drug design,CADD)方法,这种方法较传统的药物设计方式,减少了筛选量,提高了药物活性,减少了药物不良反应。但是这种方法仍然损耗极大,据统计应用此设计方法的总成功率仅为4.1%,平均耗时12.5年,平均投入近18亿美金。
然而上述传统药物设计与计算机辅助药物设计大部分都是针对小分子化学药物开发的,并不适用大分子蛋白质药物。因此,亟需开发新的药物辅助设计方法,辅助挖掘蛋白药物靶点以及定点设计靶向药物。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种基于人工智能技术预测蛋白分子相互作用的方法和装置,能够快速分析出蛋白分子之间相互作用,可用于辅助挖掘蛋白药物靶点、AI计算匹配和定点设计靶向药物,缩短新药开发时间、降低研发成本。
本申请第一方面提供一种基于人工智能技术预测蛋白分子相互作用的方法,包括:
获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构;
对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构;
利用第一预设算法对两个所述待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个所述待预测晶体结构中满足第二预设条件的结合位点或界面;
对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式;
根据所述结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析所述复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型;
对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱。
作为一个可选的实施例,所述获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,包括:
获取带有所述待预测蛋白分子的第二晶体结构;
对所述第二晶体结构进行修复,得到修复后的第二晶体结构;
从所述修复后的第二晶体结构中分离出所述待预测蛋白分子的第一晶体结构。
作为一个可选的实施例,所述对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构,包括:
分别为两个所述第一晶体结构添加水分子模型与力场,构建两个所述待预测蛋白分子的拓扑结构;
为两个所述拓扑结构添加模拟盒子;
采用预置方法对添加模拟盒子的两个所述拓扑结构在真空条件下进行自由能极小化模拟的预处理;
对添加模拟盒子的两个所述拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个所述拓扑结构转换为两个所述待预测蛋白分子的待预测晶体结构。
作为一个可选的实施例,所述第一预设算法包括快速傅里叶变换算法,和/或,所述第二预设条件包括拓扑结构互补、作用力互补和化学性质互补。
作为一个可选的实施例,所述对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找所述结合自由能满足第三预设条件的结合位点及相互排布方式,包括:
基于第二预设算法,对所述满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转;
迭代生成两个所述待预测晶体结构的多个满足第二预设条件的结合位点或界面;
计算两个所述待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式。
作为一个可选的实施例,所述目标相互作用包括氢键作用、盐键作用、静电作用、疏水作用和范德华力作用。
作为一个可选的实施例,所述对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱,包括:
将所述复合晶体结构转换为拓扑结构;
为所述拓扑结构添加溶液模型、离子模型,以使所述拓扑结构达到电荷平衡的生理状态;
分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的所述拓扑结构进行分子动力学模拟,直至所述拓扑结构达到运动平衡状态;
分析达到运动平衡状态的所述拓扑结构中所述目标结合位点之间的结合状态及相互作用力的强弱;
若所述拓扑结构中所述目标结合位点分离,则预测所述两个待预测蛋白分子之间为弱相互作用;
若所述拓扑结构中所述目标结合位点维持结合,则预测所述两个待预测蛋白分子之间为强相互作用。
本申请第二方面提供一种基于人工智能技术预测蛋白分子相互作用的装置,包括:
获取模块,用于获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构;
自由能极小化模拟模块,用于对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构;
第一算法模块,用于利用第一预设算法对两个所述待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个所述待预测晶体结构中满足第二预设条件的结合位点或界面;
第二算法模块,用于对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式;
建模模块,用于根据所述结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析所述复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型;
分析模块,用于对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本申请提供的技术方案可以包括以下有益效果:
本申请首先获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,例如蛋白药物及其受体蛋白分子;再通过自由能极小化模拟,获得自由能较低的两个待预测蛋白分子的待预测晶体结构,即稳定性较高的两个待预测蛋白分子的待预测晶体结构;然后对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个预测晶体结构中满足第二预设条件的结合位点或界面,也就是从稳定性较高的两个待预测蛋白分子的待预测晶体结构中初步找出在形状、电荷、性质等方面匹配的结合位点或界面;再然后对这些结合位点或界面进行第二预设计算,寻找两个待预测晶体结构满足第三预设条件的结合位点及相互排布方式,即找出结合自由能较低的结合位点及相互排布方式,这些结合位点及相互排布方式有很大可能影响蛋白药物与受体蛋白分子之间的结合强弱;再根据这些结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型,即通过模拟待预测蛋白分子复合物的复合晶体结构,确定蛋白药物及其受体蛋白分子结合所形成的复合物中使蛋白药物及其受体蛋白分子紧密结合的目标结合位点及结合方式与类型;最后对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱,即通过模拟蛋白药物使用的生理环境,分析使蛋白药物与其受体蛋白分子之间紧密结合的目标结合位点是否仍保持紧密结合,从而可以预测蛋白药物与其受体蛋白分子之间靶向结合的强弱。因此,本申请可快速准确地预测蛋白药物与其受体蛋白分子之间的相互作用,可用于辅助挖掘蛋白药物靶点、AI计算匹配和定点设计靶向药物,从而大大缩短新药开发时间、降低研发成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程示意图;
图2是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的另一流程示意图;
图3是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程框架示意图;
图4是本申请实施例示出的FGF22蛋白分子和FGFR蛋白分子具有目标相互作用的目标结合位点和界面的示意图;
图5是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的装置的结构示意图;
图6是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
传统药物设计与计算机辅助药物设计大部分都是针对小分子化学药物开发的,并不适用大分子蛋白质药物。因此,亟需开发新的药物辅助设计方法,辅助挖掘蛋白药物靶点以及定点设计靶向药物。
针对上述问题,本申请实施例提供一种基于人工智能技术预测蛋白分子相互作用的方法,能够快速分析出蛋白分子之间相互作用,可用于辅助挖掘蛋白药物靶点、AI计算匹配和定点设计靶向药物,缩短新药开发时间、降低研发成本。
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程示意图。
参见图1,本申请实施例提供了一种基于人工智能技术预测蛋白分子相互作用的方法,包括如下步骤S1至步骤S6:
步骤S1:获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构。
两个待预测蛋白分子可能具有相互作用,本申请可以获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构。本申请实施例中的第一预设相互作用可以为配体与受体结合的相互作用、抗原与抗体结合的相互作用、多聚体蛋白中蛋白亚基之间结合的相互作用、以及其它具有亲和作用的两个蛋白结合的相互作用。
本申请实施例可通过以下方式获得待预测蛋白分子的第一晶体结构:获取待预测蛋白分子的第二晶体结构;对第二晶体结构进行晶体结构修复,得到修复后的第二晶体结构;从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构。
其中,本申请实施例的第二晶体结构指待预测蛋白分子通过生物物理学方法解析出的晶体结构。第二晶体结构可以从蛋白质结构数据库(Protein Data Bank,简称PDB)获得。其中,蛋白质结构数据库可以预先构建。
本申请实施例大多数情况所研究的待预测蛋白分子的晶体结构未被解析,或未被收录于蛋白质结构数据库中,可以采用相关技术的同源建模方法或从头计算建模方法进行建模,本申请对此不加以限定。
步骤S2:对两个第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个待预测蛋白分子的待预测晶体结构。
本申请实施例可以通过以下方式获得两个待预测蛋白分子的待预测晶体结构:分别为两个待预测蛋白分子的第一晶体结构添加水分子模型与力场,构建两个待预测蛋白分子的拓扑结构;为两个拓扑结构添加模拟盒子;采用预置方法对添加模拟盒子的两个拓扑结构在真空条件下进行自由能极小化模拟的预处理;对添加模拟盒子的两个拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个拓扑结构转换为两个待预测蛋白分子的待预测晶体结构。
步骤S3:利用第一预设算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个待预测晶体结构中满足第二预设条件的结合位点或界面。
本申请实施例可以通过以下方式找出两个待预测晶体结构中满足第二预设条件的结合位点或界面:利用快速傅里叶变换算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算;找出两个待预测晶体结构中满足第二预设条件的结合位点或界面,第二预设条件可以包括拓扑结构互补、作用力互补和化学性质互补。
步骤S4:对满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式。
本申请实施例可以通过以下方式寻找结合自由能满足第二预设条件的结合位点及相互排布方式:基于第二预设算法,对满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转;迭代生成两个待预测晶体结构的多个满足第二预设条件的结合位点或界面;计算两个待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式。
步骤S5:根据结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型。
本申请实施例中的目标相互作用包括氢键作用、盐键作用、静电作用、疏水作用和范德华力作用。
步骤S6:对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱。
本申请实施例可以通过以下方式分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱:将复合晶体结构转换为拓扑结构;为拓扑结构添加溶液模型、离子模型,以使拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态;分析达到运动平衡状态的拓扑结构中目标结合位点之间的结合状态及相互作用力的强弱;若拓扑结构中目标结合位点分离,则预测两个待预测蛋白分子之间为弱相互作用;若拓扑结构中目标结合位点维持结合,则预测两个待预测蛋白分子之间为强相互作用。
本申请实施例首先获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,例如蛋白药物及其受体蛋白分子;再通过自由能极小化模拟,获得自由能较低的两个待预测蛋白分子的待预测晶体结构,即稳定性较高的两个待预测蛋白分子的待预测晶体结构;然后对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个预测晶体结构中满足第二预设条件的结合位点或界面,也就是从稳定性较高的两个待预测蛋白分子的待预测晶体结构中初步找出在形状、电荷、性质等方面匹配的结合位点或界面;再然后对这些结合位点或界面进行第二预设计算,寻找两个待预测晶体结构满足第三预设条件的结合位点及相互排布方式,即找出结合自由能较低的结合位点及相互排布方式,这些结合位点及相互排布方式有很大可能影响蛋白药物与受体蛋白分子之间的结合强弱;再根据这些结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型,即通过模拟待预测蛋白分子复合物的复合晶体结构,确定蛋白药物及其受体蛋白分子结合所形成的复合物中使蛋白药物及其受体蛋白分子紧密结合的目标结合位点及结合方式与类型;最后对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱,即通过模拟蛋白药物使用的生理环境,分析使蛋白药物与其受体蛋白分子之间紧密结合的目标结合位点是否仍保持紧密结合,从而可以预测蛋白药物与其受体蛋白分子之间靶向结合的强弱。因此,本申请实施例可快速准确地预测蛋白药物与其受体蛋白分子之间的相互作用,可用于辅助挖掘蛋白药物靶点、AI计算匹配和定点设计靶向药物,从而大大缩短新药开发时间、降低研发成本。
图2是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的另一流程示意图。图3是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的方法的流程框架示意图。
参见图2和图3,本申请实施例提供的基于人工智能技术预测蛋白分子相互作用的方法,包括以下步骤:
步骤S10:获取带有待预测蛋白分子的第二晶体结构。
本申请实施例的第二晶体结构指待预测蛋白分子通过生物物理学方法解析出的晶体结构。第二晶体结构可以从蛋白质结构数据库(Protein Data Bank,简称PDB)获得。
步骤S11:对第二晶体结构进行修复,得到修复后的第二晶体结构。
本申请实施例中第二晶体结构的修复包括:第二晶体结构中谷氨酰胺残基、天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转180°,再通过计算与周围原子的相互作用来判定具体位置。其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优,最终得到修复后的第二晶体结构。
步骤S12:从修复后的第二晶体结构中分离出待预测蛋白分子的第一晶体结构。
其中,可以采用相关技术中的分离方法,从修复后的第二晶体结构中分离出目标蛋白分子的第一晶体结构,本申请对此不加以限定。
本申请实施例大多数情况所研究的待预测蛋白分子的晶体结构未被解析,或未被收录于蛋白质结构数据库中,可以采用相关技术的同源建模方法或从头计算建模方法进行建模,本申请对此不加以限定。
步骤S20:分别为两个待预测蛋白分子的第一晶体结构添加水分子模型与力场,构建两个待预测蛋白分子的拓扑结构。
本申请实施例可以利用分子动力学模拟,输入第一晶体结构,为第一晶体结构添加例如TIP3P的水分子模型以及例如Amber99sb-ildn的力场,构建两个待预测蛋白分子的拓扑结构。
步骤S21:为两个拓扑结构添加模拟盒子。
本申请实施例的模拟盒子可以为溶剂盒子,可以定义模拟盒子的形状和大小,例如可以为目标蛋白分子的拓扑结构添加与边界距离为2nm的立方体模拟盒子。
步骤S22:采用预置方法对添加模拟盒子的两个拓扑结构在真空条件下进行自由能极小化模拟的预处理。
本申请实施例的预置方法可以为最陡下降法,可根据实际情况设置能量极小化的步数。
步骤S23:对添加模拟盒子的两个拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个拓扑结构转换为两个待预测蛋白分子的待预测晶体结构。
本申请实施例通过自由能极小化模拟得到的两个待预测晶体结构可以为自由能极小化晶体结构。
步骤S30:利用快速傅里叶变换算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个待预测晶体结构中满足第二预设条件的结合位点或界面,第二预设条件包括拓扑结构互补、作用力互补和化学性质互补。
本申请实施例的第一预设算法可以为快速傅里叶变换算法,通过快速傅里叶变换算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,能够快速准确找出两个待预测晶体结构中满足第二预设条件的结合位点或界面。
步骤S40:基于第二预设算法,对满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转。
第二预设算法为精细化计算,对满足第二预设条件的结合位点或界面进行局部微小移动及扭转;每次结合位点或界面随机移动0.5nm或者扭转3°,首次移动及扭转之后,生成出1个新的相互作用结合位点或界面,并计算新的相互作用结合位点或界面结合自由能。相互作用结合位点或界面结合自由能计算如下公式:
A和B分别表示两个蛋白分子,ΔH gas表示气相环境下分子结合过程中R和L的焓变,、/>与/>分别表示液相环境下两个蛋白及其复合物的溶剂化自由能变,ΔS表示对接过程中熵变,T表示体系绝对温度。
步骤S41:迭代生成两个待预测晶体结构的多个满足第二预设条件的结合位点或界面。
在前一个相互作用结合位点或界面基础上,通过5000次局部微小移动及扭转,迭代生成出5000个相互作用结合位点或界面并计算对应的结合自由能。
步骤S42:计算两个待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式。
从5000个计算结果中寻找结合自由能最低(即结合自由能最佳)的结合位点或界面,并作为目标结合位点。
步骤S50:根据结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构。
本申请实施例可以采用相关技术的同源建模方法或从头计算建模方法进行构建两个待预测蛋白分子复合物的复合晶体结构。
步骤S51:分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点。
本申请实施例的目标相互作用包括氢键作用、盐键作用、静电作用、疏水作用和范德华力作用。
步骤S52:分析目标结合位点之间的结合方式与类型。
目标结合位点之间的结合方式与类型与目标相互作用相对应,也可以包括氢键、盐键、静电、疏水和范德华力。
步骤S60:将复合晶体结构转换为拓扑结构。
本申请实施例可以利用分子动力学模拟,输入复合晶体结构,添加例如TIP3P的水分子模型以及例如Amber99sb-ildn的力场,构建复合晶体结构的拓扑结构。
步骤S61:为拓扑结构添加溶液模型、离子模型,以使拓扑结构达到电荷平衡的生理状态。
本申请实施例可以利用分子动力学模拟,输入拓扑结构,添加例如spc216溶液模型和生理条件浓度的离子模型,使拓扑结构达到电荷平衡的生理状态。
步骤S62:分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态。
本申请实施例将添加生理条件环境的拓扑结构分别在正则系综与等温等压系综中进行分子动力学模拟,直至添加生理条件环境的拓扑结构处于运动平衡状态。
步骤S63:分析达到运动平衡状态的拓扑结构中目标结合位点之间的结合状态及相互作用力的强弱。
步骤S64:若拓扑结构中目标结合位点分离,则预测两个待预测蛋白分子之间为弱相互作用。
步骤S65:若拓扑结构中目标结合位点维持结合,则预测两个待预测蛋白分子之间为强相互作用。
本申请实施例可以将两个待预测蛋白分子之间的目标结合位点之间的目标相互作用分为强、弱两类。若拓扑结构中目标结合位点分离,则预测两个待预测蛋白分子之间为弱相互作用;若拓扑结构中目标结合位点维持结合,则预测两个待预测蛋白分子之间为强相互作用。因此,本申请实施例可以预测两个待预测蛋白分子之间的相互作用,基于相互作用分析结果,可用于理性挖掘蛋白药物靶点、AI计算匹配和定点设计靶向药物,可大大缩短新药开发时间以及降低研发成本。
下面本申请实施例以人成纤维细胞生长因子22(FGF22)与人成纤维细胞生长因子受体(FGFR)为例,对基于人工智能技术预测蛋白分子相互作用的方法进行说明,但并不局限于此例,包括以下步骤:
1、先从PDB数据库中获得通过结晶与X射线衍射方法解析得到的带有FGFR的第二晶体结构1NUN,再对第二晶体结构1NUN进行修复,最后从修复后的第二晶体结构1NUN中分离出FGFR蛋白分子的第一晶体结构。对第二晶体结构1NUN进行修复包括:第二晶体结构1NUN中谷氨酰胺残基、天冬酰胺残基侧链中的酰胺基团与组氨酸残基侧链中的咪唑基团的电子密度对称性极高,需要将这些氨基酸残基侧链翻转180°,通过计算与周围原子的相互作用来判定具体位置;其它氨基酸残基则通过侧链基团或肽平面的细微旋转使得能量最优;最终得到修复后的第二晶体结构1NUN。由于FGF22晶体结构未被解析,或未被收录于PDB数据库中,可以采用相关技术的同源建模方法进行建模,直接获取FGF22蛋白分子的第一晶体结构。
2、分别对FGF22与FGFR第一晶体结构进行自由能极小化模拟,获得FGF22与FGFR蛋白分子的能量极小化晶体结构。例如可以先利用分子动力学模拟,分别输入FGF22与FGFR蛋白分子的第一晶体结构,添加TIP3P水分子模型与Amber99sb-ildn力场,构建FGF22与FGFR蛋白分子的拓扑结构;再添加与边界距离为2nm的立方体模拟盒子;然后先采用最陡下降法对FGF22与FGFR蛋白分子的拓扑结构在真空条件下进行能量最小化预处理,再对FGF22与FGFR蛋白分子的拓扑结构在真空条件下正式进行能量极小化模拟,将模拟的能量极小化拓扑结构转换为FGF22与FGFR蛋白分子的能量极小化晶体结构。
3、基于例如快速傅里叶变换(FFT)算法的预设算法,对FGF22与FGFR蛋白分子的能量极小化晶体结构进行构象搜索及多尺度模拟计算,找出满足第二预设条件的结合位点或界面,第二预设条件包括拓扑结构互补、作用力互补、化学性质互补。
4、对上一步计算出的FGF22与FGFR满足第二预设条件的结合位点或界面进行精细化计算,寻找最佳结合自由能的目标结合位点及相互排布方式。例如对FGF22与FGFR满足第二预设条件的结合位点或界面进行局部微小移动及扭转,每次位点或界面随机移动0.5nm或者扭转3°,生成出1个新的相互作用结合位点或界面,并计算新相互作用结合位点或界面结合自由能;在前一个相互作用结合位点或界面基础上,通过5000次局部微小移动及扭转,迭代生成出5000个相互作用结合位点或界面并计算对应的结合自由能;结合自由能最低的相互作用结合位点或界面即为最佳结合自由能的目标结合位点与相互排布方式。
5、选择结合自由能最低的FGF22与FGFR相互作用放入目标结合位点或界面,即FGF22与FGFR最佳结合自由能的结合位点及相互排布方式,构建FGF22与FGFR蛋白分子复合物的复合晶体结构,分析FGF22与FGFR蛋白分子复合物的复合晶体结构中的两个蛋白分子之间的相互作用的位点、结合方式与类型。
6、对FGF22与FGFR蛋白分子复合物的复合晶体结构进行生理状态下分子动力学模拟,分析FGF22与FGFR复合物的复合晶体结构中目标结合位点的结合及作用力强度。利用分子动力学模拟,输入FGF22与FGFR蛋白分子复合物的复合晶体结构,先添加例如TIP3P的水分子模型以及例如Amber99sb-ildn的力场,构建FGF22与FGFR蛋白分子复合物的复合晶体结构的拓扑结构;再对拓扑结构添加例如spc216溶液模型和生理条件浓度的离子模型,使拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态;分析分析运动平衡的状态的拓扑结构中FGF22与FGFR蛋白分子的相互作用变化:若在运动平衡的状态下,拓扑结构中FGF22与FGFR蛋白分子相互分离,则预测FGF22与FGFR蛋白分子之间为弱相互作用;若在运动平衡的状态下,拓扑结构中FGF22与FGFR蛋白分子维持结合,则预测FGF22与FGFR蛋白分子之间为强相互作用。
7、通过上述方法,计算出FGF22蛋白分子中第39、35、36、77、117、119、124、122、123、125位氨基酸残基与FGFR蛋白分子中第173、251、282、283、285、319、345位氨基酸残基之间具有氢键相互作用;FGF22蛋白分子中第33、37、41、46、50、65、67、76、78、79、80、81、84、94、140、165位氨基酸残基与FGFR蛋白分子中第161、164、165、166、167、168、170、252、280、281、284、286、287、288、315、316、317、320、344位氨基酸残基之间具有疏水相互作用(见图4)。FGF22与FGFR蛋白分子复合物拓扑结构生理状态下分子动力学模拟中,FGF22与FGFR蛋白分子维持结合,运动状态下复合物中的FGF22与FGFR蛋白分子没有分离,则预测FGF22与FGFR蛋白分子之间为强相互作用。
与前述应用功能实现方法实施例相对应,本申请还提供了一种运用人工智能等技术高精度预测蛋白分子相互作用的装置、电子设备及相应的实施例。
图5是本申请实施例示出的基于人工智能技术预测蛋白分子相互作用的装置的结构示意图。
参见图5,本申请实施例提供的一种基于人工智能技术预测蛋白分子相互作用的装置包括:
获取模块50,用于获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构。
自由能极小化模拟模块51,用于对两个待预测蛋白分子的第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个待预测蛋白分子的待预测晶体结构。
第一算法模块52,用于利用第一预设算法对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个待预测晶体结构中满足第二预设条件的结合位点或界面。
第二算法模块53,用于对两个待预测晶体结构中满足第二预设条件的结合位点或界面进行第二预设计算,寻找两个待预测晶体结构中结合自由能满足第三预设条件的结合位点及相互排布方式。
建模模块54,用于根据满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型。
分析模块55,用于对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱。
本申请实施例首先通过获取模块50获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,例如蛋白药物及其受体蛋白分子;再通过自由能极小化模拟模块51进行自由能极小化模拟,获得自由能较低的两个待预测蛋白分子的待预测晶体结构,即稳定性较高的两个待预测蛋白分子的待预测晶体结构;然后通过第一算法模块52对两个待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个预测晶体结构中满足第二预设条件的结合位点或界面,也就是从稳定性较高的两个待预测蛋白分子的待预测晶体结构中初步找出在形状、电荷、性质等方面匹配的结合位点或界面;再然后通过第二算法模块53对这些结合位点或界面进行第二预设计算,寻找两个待预测晶体结构满足第三预设条件的结合位点及相互排布方式,即找出结合自由能较低的结合位点及相互排布方式,这些结合位点及相互排布方式有很大可能影响蛋白药物与受体蛋白分子之间的结合强弱;再通过建模模块54根据这些结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型,即通过模拟待预测蛋白分子复合物的复合晶体结构,确定蛋白药物及其受体蛋白分子结合所形成的复合物中使蛋白药物及其受体蛋白分子紧密结合的目标结合位点及结合方式与类型;最后通过分析模块55对复合晶体结构进行分子动力学模拟,分析复合晶体结构中目标结合位点之间的结合状态及相互作用力的强弱,即通过模拟蛋白药物使用的生理环境,分析使蛋白药物与其受体蛋白分子之间紧密结合的目标结合位点是否仍保持紧密结合,从而可以预测蛋白药物与其受体蛋白分子之间靶向结合的强弱。因此,本申请实施例可快速准确地预测蛋白药物与其受体蛋白分子之间的相互作用,可用于辅助挖掘蛋白药物靶点、AI计算匹配和定点设计靶向药物,从而大大缩短新药开发时间、降低研发成本。
作为一个可选的实施例,本申请实施例中的获取模块50包括获取子模块、修复模块和分离模块,获取子模块用于获取带有待预测蛋白分子的第二晶体结构;修复模块用于对第二晶体结构进行修复,得到修复后的第二晶体结构;分离模块用于从修复后的第二晶体结构中分离出待预测蛋白分子的第一晶体结构。
作为一个可选的实施例,本申请实施例中的自由能极小化模拟模块51具体用于分别为两个待预测蛋白分子的第一晶体结构添加水分子模型与力场,构建两个待预测蛋白分子的拓扑结构;为两个拓扑结构添加模拟盒子;采用预置方法对添加模拟盒子的两个拓扑结构在真空条件下进行自由能极小化模拟的预处理;对添加模拟盒子的两个拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个拓扑结构转换为两个待预测蛋白分子的待预测晶体结构。
作为一个可选的实施例,本申请实施例中的第二算法模块53包括精细计算模块、迭代模块和寻找模块,精细计算模块用于基于第二预设算法,对两个待预测晶体结构中满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转;迭代模块用于迭代生成两个待预测晶体结构的多个满足第二预设条件的结合位点或界面;寻找模块用于计算两个待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式。
作为一个可选的实施例,本申请实施例中的分析模块55具体用于将复合晶体结构转换为拓扑结构;为拓扑结构添加溶液模型、离子模型,以使拓扑结构达到电荷平衡的生理状态;分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的拓扑结构进行分子动力学模拟,直至拓扑结构达到运动平衡状态;分析达到运动平衡状态的拓扑结构中目标结合位点之间的结合状态及相互作用力的强弱。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图6是本申请实施例示出的电子设备的结构示意图。
参见图6,电子设备600包括存储器610和处理器620。
处理器620可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器610可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器620或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器610可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器610可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器610上存储有可执行代码,当可执行代码被处理器620处理时,可以使处理器620执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种基于人工智能技术预测蛋白分子相互作用的方法,其特征在于,包括:
获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构;
对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构;
利用第一预设算法对两个所述待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个所述待预测晶体结构中满足第二预设条件的结合位点或界面;
对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式;
根据所述结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析所述复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型;
对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱。
2.根据权利要求1所述的方法,其特征在于,所述获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构,包括:
获取带有所述待预测蛋白分子的第二晶体结构;
对所述第二晶体结构进行修复,得到修复后的第二晶体结构;
从所述修复后的第二晶体结构中分离出所述待预测蛋白分子的第一晶体结构。
3.根据权利要求1所述的方法,其特征在于,所述对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构,包括:
分别为两个所述第一晶体结构添加水分子模型与力场,构建两个所述待预测蛋白分子的拓扑结构;
为两个所述拓扑结构添加模拟盒子;
采用预置方法对添加模拟盒子的两个所述拓扑结构在真空条件下进行自由能极小化模拟的预处理;
对添加模拟盒子的两个所述拓扑结构在真空条件下正式进行自由能极小化模拟,将两个模拟结果对应的两个所述拓扑结构转换为两个所述待预测蛋白分子的待预测晶体结构。
4.根据权利要求1所述的方法,其特征在于,所述第一预设算法包括快速傅里叶变换算法,和/或,所述第二预设条件包括拓扑结构互补、作用力互补和化学性质互补。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找所述结合自由能满足第三预设条件的结合位点及相互排布方式,包括:
基于第二预设算法,对所述满足第二预设条件的结合位点或界面进行预设次数的局部叠加微移及扭转;
迭代生成两个所述待预测晶体结构的多个满足第二预设条件的结合位点或界面;
计算两个所述待预测晶体结构的多个满足第二预设条件的结合位点或界面的结合自由能,并寻找出结合自由能最低的结合位点及相互排布方式。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述目标相互作用包括氢键作用、盐键作用、静电作用、疏水作用和范德华力作用。
7.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱,包括:
将所述复合晶体结构转换为拓扑结构;
为所述拓扑结构添加溶液模型、离子模型,以使所述拓扑结构达到电荷平衡的生理状态;
分别在正则系综与等温等压系综中对达到电荷平衡的生理状态的所述拓扑结构进行分子动力学模拟,直至所述拓扑结构达到运动平衡状态;
分析达到运动平衡状态的所述拓扑结构中所述目标结合位点之间的结合状态及相互作用力的强弱;
若所述拓扑结构中所述目标结合位点分离,则预测所述两个待预测蛋白分子之间为弱相互作用;
若所述拓扑结构中所述目标结合位点维持结合,则预测所述两个待预测蛋白分子之间为强相互作用。
8.一种基于人工智能技术预测蛋白分子相互作用的装置,其特征在于,包括:
获取模块,用于获取具有第一预设相互作用的两个待预测蛋白分子的第一晶体结构;
自由能极小化模拟模块,用于对两个所述第一晶体结构进行自由能极小化模拟,获得自由能满足第一预设条件的两个所述待预测蛋白分子的待预测晶体结构;
第一算法模块,用于利用第一预设算法对两个所述待预测晶体结构进行构象搜索及多尺度模拟计算,找出两个所述待预测晶体结构中满足第二预设条件的结合位点或界面;
第二算法模块,用于对所述满足第二预设条件的结合位点或界面进行第二预设计算,寻找结合自由能满足第三预设条件的结合位点及相互排布方式;
建模模块,用于根据所述结合自由能满足第三预设条件的结合位点及相互排布方式,构建两个待预测蛋白分子复合物的复合晶体结构,并分析所述复合晶体结构中两个待预测蛋白分子之间具有目标相互作用的目标结合位点及结合方式与类型;
分析模块,用于对所述复合晶体结构进行分子动力学模拟,分析所述复合晶体结构中所述目标结合位点之间的结合状态及相互作用力的强弱。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311476334.1A CN117198386B (zh) | 2023-11-08 | 2023-11-08 | 基于人工智能技术预测蛋白分子相互作用的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311476334.1A CN117198386B (zh) | 2023-11-08 | 2023-11-08 | 基于人工智能技术预测蛋白分子相互作用的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117198386A true CN117198386A (zh) | 2023-12-08 |
CN117198386B CN117198386B (zh) | 2024-01-05 |
Family
ID=88989153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311476334.1A Active CN117198386B (zh) | 2023-11-08 | 2023-11-08 | 基于人工智能技术预测蛋白分子相互作用的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117198386B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003044230A1 (en) * | 2001-11-21 | 2003-05-30 | Bioimics Ab | Method and kit for detection of novel pathogen inhibitors |
US20120053067A1 (en) * | 2009-05-04 | 2012-03-01 | University Of Maryland, Baltimore | Method for binding site identification by molecular dynamics simulation (silcs: site identification by ligand competitive saturation) |
US20160041181A1 (en) * | 2013-02-04 | 2016-02-11 | Rutgers, The State University Of New Jersey | Nmr assay to screen protein-protein interaction inhibitors |
CN109671472A (zh) * | 2017-11-23 | 2019-04-23 | 周林祥 | 电子结构计算机辅助药物设计系统和方法 |
CN115985384A (zh) * | 2022-12-28 | 2023-04-18 | 星希尔生物科技(上海)有限公司 | 一种基于强化学习和分子模拟的靶向多肽设计方法及系统 |
CN116741259A (zh) * | 2023-05-30 | 2023-09-12 | 湖北工业大学 | 一种快速高通量筛选环保绝缘气体吸入毒性靶点的方法 |
-
2023
- 2023-11-08 CN CN202311476334.1A patent/CN117198386B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003044230A1 (en) * | 2001-11-21 | 2003-05-30 | Bioimics Ab | Method and kit for detection of novel pathogen inhibitors |
US20120053067A1 (en) * | 2009-05-04 | 2012-03-01 | University Of Maryland, Baltimore | Method for binding site identification by molecular dynamics simulation (silcs: site identification by ligand competitive saturation) |
US20160070850A1 (en) * | 2009-05-04 | 2016-03-10 | University Of Maryland, Baltimore | Method for binding site identification by molecular dynamics simulation (silcs: site identification by ligand competitive saturation) |
US20160041181A1 (en) * | 2013-02-04 | 2016-02-11 | Rutgers, The State University Of New Jersey | Nmr assay to screen protein-protein interaction inhibitors |
CN109671472A (zh) * | 2017-11-23 | 2019-04-23 | 周林祥 | 电子结构计算机辅助药物设计系统和方法 |
CN115985384A (zh) * | 2022-12-28 | 2023-04-18 | 星希尔生物科技(上海)有限公司 | 一种基于强化学习和分子模拟的靶向多肽设计方法及系统 |
CN116741259A (zh) * | 2023-05-30 | 2023-09-12 | 湖北工业大学 | 一种快速高通量筛选环保绝缘气体吸入毒性靶点的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117198386B (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xia et al. | Predicting tumor cell line response to drug pairs with deep learning | |
Tosco et al. | Open3DALIGN: an open-source software aimed at unsupervised ligand alignment | |
Mashiach et al. | FiberDock: flexible induced‐fit backbone refinement in molecular docking | |
CN114333986A (zh) | 模型训练、药物筛选和亲和力预测的方法与装置 | |
US7856321B2 (en) | Modeling biological effects of molecules using molecular property models | |
Imbernón et al. | METADOCK: A parallel metaheuristic schema for virtual screening methods | |
Liu et al. | Auto3d: Automatic generation of the low-energy 3d structures with ANI neural network potentials | |
Zhang et al. | Planet: a multi-objective graph neural network model for protein–ligand binding affinity prediction | |
Fan et al. | GPU-accelerated flexible molecular docking | |
Zhang et al. | ResGen is a pocket-aware 3D molecular generation model based on parallel multiscale modelling | |
Ertl et al. | IADE: a system for intelligent automatic design of bioisosteric analogs | |
Venkatesan et al. | Computational approach for protein structure prediction | |
McNutt et al. | Improving ΔΔg predictions with a multitask convolutional Siamese network | |
Pan et al. | AA-score: a new scoring function based on amino acid-specific interaction for molecular docking | |
Avramouli et al. | Quantum machine learning in drug discovery: Current state and challenges | |
Shilpa et al. | Recent applications of machine learning in molecular property and chemical reaction outcome predictions | |
CN117198386B (zh) | 基于人工智能技术预测蛋白分子相互作用的方法和装置 | |
Penner et al. | Shape-based descriptors for efficient structure-based fragment growing | |
Alhamoud et al. | Leveraging 2D molecular graph pretraining for improved 3D conformer generation with graph neural networks | |
Preto et al. | Molecular dynamics and related computational methods with applications to drug discovery | |
Arya et al. | Molecular Docking: A Review Paper | |
Zhang et al. | A Simple Way to Incorporate Target Structural Information in Molecular Generative Models | |
Lim et al. | Affinity prediction using deep learning based on SMILES input for D3R grand challenge 4 | |
Upadhyay et al. | A geometric and topological analysis of the binding behavior of Intrinsically Disordered Proteins | |
Maldonado-Nava et al. | Comparative study of computational strategies for protein structure prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |