CN112289371A - 蛋白质与小分子样本生成及结合能、结合构象预测方法 - Google Patents
蛋白质与小分子样本生成及结合能、结合构象预测方法 Download PDFInfo
- Publication number
- CN112289371A CN112289371A CN202011012500.9A CN202011012500A CN112289371A CN 112289371 A CN112289371 A CN 112289371A CN 202011012500 A CN202011012500 A CN 202011012500A CN 112289371 A CN112289371 A CN 112289371A
- Authority
- CN
- China
- Prior art keywords
- target
- small molecule
- sample
- interaction
- protein binding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 207
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 207
- 150000003384 small molecules Chemical class 0.000 title claims abstract description 203
- 238000000034 method Methods 0.000 title claims abstract description 133
- 230000003993 interaction Effects 0.000 claims abstract description 159
- 238000012549 training Methods 0.000 claims abstract description 71
- 238000012545 processing Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 12
- 125000003118 aryl group Chemical group 0.000 claims description 35
- 238000003062 neural network model Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 claims description 34
- 230000009471 action Effects 0.000 claims description 20
- 229910052736 halogen Inorganic materials 0.000 claims description 20
- 229910052739 hydrogen Inorganic materials 0.000 claims description 20
- 239000001257 hydrogen Substances 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 18
- 125000001165 hydrophobic group Chemical group 0.000 claims description 15
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 abstract description 3
- 230000002035 prolonged effect Effects 0.000 abstract description 2
- 239000000370 acceptor Substances 0.000 description 44
- 125000004429 atom Chemical group 0.000 description 26
- 229910052799 carbon Inorganic materials 0.000 description 8
- 125000004432 carbon atom Chemical group C* 0.000 description 8
- 125000004430 oxygen atom Chemical group O* 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000002209 hydrophobic effect Effects 0.000 description 7
- 239000007787 solid Substances 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 229910052794 bromium Inorganic materials 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 229910052801 chlorine Inorganic materials 0.000 description 4
- 229910052731 fluorine Inorganic materials 0.000 description 4
- 229910052740 iodine Inorganic materials 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 125000004433 nitrogen atom Chemical group N* 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 125000004434 sulfur atom Chemical group 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 125000002346 iodo group Chemical group I* 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
Landscapes
- Spectroscopy & Molecular Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种蛋白质与小分子样本生成及结合能、结合构象预测方法,其中,小分子和蛋白质结合样本生成方法,包括:当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断目标给体和目标受体是否存在相互作用;当目标给体与目标受体存在相互作用,则按照预设规则,建立目标给体与目标受体的空间构象数据,得到小分子和蛋白质结合样本。通过实施本发明对目标给体和受体部分进行筛选,并根据筛选出的目标给体和受体按照预设规则建立三维空间矩阵作为样本,根据已有知识,简化小分子和蛋白质结合时的分析模型,对样本引入先验知识,从而在后续模型训练时,可以通过较少的样本实现模型的训练,降低数据处理量以及训练过程耗费时长。
Description
技术领域
本发明涉及生物技术领域,具体涉及蛋白质与小分子样本生成及结合能、结合构象预测方法。
背景技术
蛋白质作为生物体的重要组成部分,几乎参与了生物体的所有生命活动,比如催化、免疫、代谢,在这些过程中大多涉及到蛋白质和小分子之间的相互作用。通常药物小分子活性通过与目标蛋白的结合能体现,因此预测小分子和蛋白的结合能是一项重要的课题。
相关技术中,利用神经网络实现结合能的预测,该神经网络以蛋白质-配体相互作用的全面三维表示作为输入,神经网络自动学习与结合相关的蛋白质-配体相互作用的关键特征,通过大量样本训练和优化神经网络评分功能,预测其结合能。但通过此种方式需要大量的训练样本,数据处理量大,且训练过程耗费时间较长。
发明内容
有鉴于此,本发明实施例提供了一种蛋白质与小分子样本生成及结合能、结合构象预测方法,以解决现有技术中需要大量的训练样本,数据处理量大,且训练过程耗费时间较长的缺陷。
根据第一方面,本发明实施例提供一种小分子和蛋白质结合样本生成方法,包括如下步骤:当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断所述目标给体和目标受体是否存在相互作用;当所述目标给体与所述目标受体存在相互作用,则按照预设规则,建立所述目标给体与所述目标受体的空间构象数据,得到所述小分子和蛋白质结合样本。
可选地,所述目标给体和目标受体的相互作用包括氢键相互作用、卤键相互作用、疏水基团相互作用、芳香环相互作用。
可选地,判断所述目标给体和目标受体是否存在相互作用包括:确定所述目标给体与所述目标受体的作用范围;根据所述目标给体与所述目标受体的作用范围确定所述目标给体与所述目标受体是否存在相互作用。
可选地,所述确定所述目标给体与所述目标受体的作用范围,包括:当目标给体和目标受体的相互作用为氢键相互作用时,作用范围为以所述氢键和所述目标受体为中心,半径4.5埃的圆形区域;当所述目标给体和目标受体的相互作用为卤键相互作用时,作用范围为以所述卤键和所述目标受体为中心,半径4.5埃的圆形区域;当所述目标给体和目标受体的相互作用为疏水基团相互作用时,作用范围为以所述疏水基团和所述目标受体为中心,半径6埃的圆形区域;当所述目标给体和目标受体的相互作用为芳香环相互作用时,作用范围为以所述芳香环和所述目标受体为中心,半径6埃的圆形区域。
根据第二方面,本发明实施例提供一种小分子和蛋白质结合能预测模型训练方法,包括如下步骤:获取第一方面或第一方面任一实施方式所述分子样本;将所述分子样本根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。
根据第三方面,本发明实施例提供一种小分子和蛋白质结合构象预测模型训练方法,包括如下步骤:获取第一方面或第一方面任一实施方式所述分子样本;对所述分子样本对应的空间构象进行变换,形成所述分子样本对应的新空间构象;根据所述新空间构象与所述分子样本的真实构象,得到所述新空间构象的样本标签;将所述分子样本的新构象以及样本标签根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应的小分子和蛋白质结合构象预测模型。
根据第四方面,本发明实施例提供一种小分子和蛋白质结合能预测方法,包括如下步骤:获取小分子和蛋白质的三维图像;根据第一方面或第一方面任一实施方式所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;根据不同目标给体将目标样本输入至小分子和蛋白质结合能预测模型;根据小分子和蛋白质结合能预测模型对对应的目标给体以及对应受体进行打分,得到所述小分子和蛋白质结合能预测结果。
根据第五方面,本发明实施例提供一种小分子和蛋白质结合构象预测方法,包括如下步骤:获取小分子和蛋白质的三维图像;根据第一方面或第一方面任一实施方式所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;将所述小分子和蛋白质的目标样本输入至小分子和蛋白质结合构象预测模型,得到所述小分子和蛋白质结合构象预测结果。
根据第六方面,本发明实施例提供一种小分子和蛋白质结合样本生成装置,包括:相互作用判断模块,用于当小分子与蛋白质之间存在相互配合的目标给体和受体,判断所述目标给体和目标受体是否存在相互作用;样本确定模块,用于当所述目标给体与所述目标受体存在相互作用,则按照预设规则,建立所述目标给体与所述目标受体的空间构象数据,得到所述小分子和蛋白质结合样本。
根据第七方面,本发明实施例提供一种小分子和蛋白质结合能预测模型训练装置,包括:样本获取模块,用于获取第一方面或第一方面任一实施方式所述的分子样本;分子样本输入模块,用于将所述分子样本根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;结合能预测模型训练模块,用于当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。
根据第八方面,本发明实施例提供一种小分子和蛋白质结合构象预测模型训练装置,包括:样本获取模块,用于获取第一方面或第一方面任一实施方式所述分子样本;新构象形成模块,用于对所述分子样本对应的空间构象进行变换,形成所述分子样本对应的新空间构象;样本标签确定模块,用于根据所述新空间构象与所述分子样本的真实构象,得到所述新空间构象的样本标签;新构象数据输入模块,用于将所述分子样本的新构象以及样本标签根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;结合构象训练模块,用于当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应的小分子和蛋白质结合构象预测模型。
根据第九方面,本发明实施例提供一种小分子和蛋白质结合能预测装置,包括:三维图像获取模块,用于获取小分子和蛋白质的三维图像;目标样本确定模块,用于根据第一方面或第一方面任一实施方式所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;结合能数据输入模块,用于根据不同目标给体和目标受体的相互作用将目标样本输入至小分子和蛋白质结合能预测模型;结合能预测结果确定模块,用于根据小分子和蛋白质结合能预测模型对对应的目标给体以及对应受体进行打分,得到所述小分子和蛋白质结合能预测结果。
根据第十方面,本发明实施例提供一种小分子和蛋白质结合构象预测装置,包括:小分子蛋白质获取模块,用于获取小分子和蛋白质的三维图像;样本处理模块,用于根据第一方面或第一方面任一实施方式所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;结合构象预测结果确定模块,用于将所述小分子和蛋白质的目标样本输入至小分子和蛋白质结合构象预测模型,得到所述小分子和蛋白质结合构象预测结果。
根据第十一方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面或第一方面任一实施方式所述小分子和蛋白质结合样本生成方法或者第二方面所述的小分子和蛋白质结合能预测模型训练方法或者第三方面所述的小分子和蛋白质结合构象预测模型训练方法或者第四方面所述的小分子和蛋白质结合能预测方法或者第五方面所述的小分子和蛋白质结合构象预测方法的步骤。
根据第十二方面,本发明实施例提供一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面或第一方面任一实施方式所述小分子和蛋白质结合样本生成方法或者第二方面所述的小分子和蛋白质结合能预测模型训练方法或者第三方面所述的小分子和蛋白质结合构象预测模型训练方法或者第四方面所述的小分子和蛋白质结合能预测方法或者第五方面所述的小分子和蛋白质结合构象预测方法的步骤。
本发明技术方案,具有如下优点:
本发明实施例提供的小分子和蛋白质结合样本生成方法,对小分子和蛋白质结合时的目标给体和受体部分进行筛选,并根据筛选出的目标给体和受体按照预设规则建立三维空间矩阵作为样本,根据已有知识,简化小分子和蛋白质结合时的分析模型,对样本引入先验知识,从而在后续模型训练时,可以通过较少的样本实现模型的训练,降低数据处理量以及训练过程耗费时长。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中小分子和蛋白质结合样本生成方法的一个具体示例的流程图;
图2为本发明实施例中小分子和蛋白质结合能预测模型训练方法的一个具体示例图;
图3为本发明实施例中小分子和蛋白质结合构象预测模型训练方法的一个具体示例图;
图4为本发明实施例中小分子和蛋白质结合构象预测模型训练方法的一个具体示例图;
图5为本发明实施例中小分子和蛋白质结合能预测方法的一个具体示例图;
图6为本发明实施例中小分子和蛋白质结合构象预测方法的一个具体示例图;
图7为本发明实施例中小分子和蛋白质结合样本生成装置的一个具体示例图;
图8为本发明实施例中电子设备的一个具体示例的原理框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本实施例提供一种小分子和蛋白质结合样本生成方法,如图1所示,包括如下步骤:
S101,当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断目标给体和目标受体是否存在相互作用。
示例性地,小分子与蛋白质的目标给体和受体可以是具有氢键相互作用的原子,卤键相互作用的原子、疏水基团相互作用的原子、芳香环相互作用的原子、离子键相互作用的原子、pi-pi相互作用的原子,本实施例对相互配合的目标给体和受体不做限定,本领域技术人员可以根据需要确定。
判断目标给体和目标受体是否存在相互作用的方式可以是判断目标给体和目标受体是否满足预设作用条件,预设作用条件可以是判断目标给体和对应受体是否处于相互作用范围,比如,在带极性氢的氧原子与其他氧原子分别作为目标给体和目标受体时,其作用区域可以是以半径为4.5埃的圆形区域,当带极性氢的氧原子与其他氧原子在4.5埃范围内,则表示目标给体和目标受体存在相互作用,本实施例对预设作用条件不做限定,本领域技术人员可以根据需要确定。
S102,当目标给体与目标受体存在相互作用,则按照预设规则,建立目标给体与目标受体的空间构象数据,得到小分子和蛋白质结合样本。
示例性地,目标给体与目标受体的空间构象数据可以是目标给体与目标受体的三维图像,也可以是将三维图像离散处理后的数据信息。按照预设规则,建立目标给体与目标受体的空间构象数据的方式可以是每个原子根据构象的坐标,建立立体高斯圆,圆心处值为1.0,向外逐渐衰减,1.5埃处衰减为零,如果不同原子存在重叠,取最大值;C N O S F Cl分别用一个不同通道表示,Br和I原子共用一个通道,单键单独使用一个通道表示,双键和参键共用一个通道表示;键使用一个立体圆柱体表示,圆柱中心轴的值为1.0,沿半径逐渐向外扩散衰减,1.0埃处衰减为零;芳香环用一个通道表示,在芳香环的中心使用一个比较大立体圆表示;为了区别相互作用范围内的目标给体和受体对应的原子与其他邻域原子,使用一个通道单独标记相互作用的原子,标记方式也用一个立体高斯圆。然后,由目标给体和目标受体对应的原子与邻域原子构成一个子区域,对子区域进行构象旋转校准,可以使配体中心位于原点,受体中心位于z轴上。一个子区域的体积可以限制在((-8,8)(-8,8)(-8,8))范围内(单位埃),以0.4埃的分辨率进行离散化,得(40,40,40)的三维空间矩阵,得到小分子和蛋白质结合样本。本实施例对预设规则不做限定,本领域技术人员可以根据需要确定。
本发明实施例提供的小分子和蛋白质结合样本生成方法,对小分子和蛋白质结合时的目标给体和受体进行筛选,并根据筛选出的目标给体和受体按照预设规则建立三维空间矩阵作为样本,根据已有知识,简化小分子和蛋白质结合时的分析模型,对样本引入先验知识,从而在后续模型训练时,可以通过较少的样本实现模型的训练,降低数据处理量以及训练过程耗费时长。
作为本实施例一种可选的实施方式,所述目标给体和目标受体的相互作用包括氢键相互作用、卤键相互作用、疏水基团相互作用、芳香环相互作用。
示例性地,目标给体和目标受体的相互作用为氢键相互作用时,氢键相互作用的给体可以是带极性氢的O原子和N原子,但N原子不能存在于芳香环,如咪唑;氢键相互作用的受体可以是所有的O原子和N原子;氢键相互作用条件可以是以给体和受体相互作用的距离小于4.5埃,角度无限制;相互作用的氢键邻域可以是以给体和受体为中心,分别构建半径4.5埃的圆形区域,如果周围原子落在此范围内,则属于邻域原子,如果邻域原子包含不完整的芳香环,则将该芳香环扩全,不同相互作用的邻域可能存在重叠。
目标给体和目标受体的相互作用为卤键相互作用时,卤键相互作用的给体可以所有的卤原子,包括F、Cl、Br、I;卤键相互使用的受体可以是所有的羰基的O原子,即有一个双键的O原子;卤键相互作用条件可以是受体与供体距离要求小于5埃,角度无限制;相互作用的卤键邻域可以是以供体和受体为中心,距离中心4.5埃范围内的所有原子,如果周围原子落在此范围内,则属于此邻域原子,当邻域原子包含不完整的芳香环,则将该芳香环扩全。
目标给体和目标受体的相互作用为疏水基团相互作用时,疏水基团相互作用的给体可以是非极性的末端碳原子、极性末端碳原子,但其极性邻接原子为F、Cl、Br、I和二价S原子;受体可以是非极性的末端碳原子、极性末端碳原子,但其极性邻接原子为F、Cl、Br、I和二价S原子、芳香环;疏水基团相互作用条件可以是受体与供体距离要求小于6埃,角度无限制。疏水相互作用邻域可以是以疏水碳原子或芳香环中心为圆心,距离中心6埃范围内的原子,如果包含不完整的芳香环,则扩全芳香环。
目标给体和目标受体的相互作用为芳香环相互作用时,芳香环相互作用的给体可以是芳香环,对应受体可以是非极性的末端碳原子、极性末端碳原子,但其极性邻接原子为F、Cl、Br、I和二价S原子、芳香环;芳香环相互作用条件可以是给体基团与受体基团之间的距离小于6埃,如果芳香环与芳香环之间的相互作用,则要求芳环不能共平面;芳香环作用邻域可以是以疏水碳原子或芳香环中心为圆心,距离中心6埃范围内的原子,如果邻域原子包含不完整的芳香环,则将芳香环扩全。上述的疏水基团相互作用和芳香环相互作用,包含三种相互作用:pi-pi相互使用,pi-疏水基团相互作用,疏水-疏水相互作用。
本发明实施例提供的小分子和蛋白质结合样本生成方法,引入了四种相互作用,而这四种相互作用对小分子和蛋白质结合能的大小起主要作用,从而进一步减小数据处理量,提高后续的模型训练效率。
本发明实施例提供一种小分子和蛋白质结合能预测模型训练方法,如图2所示,包括如下步骤:
S201,获取上述小分子和蛋白质结合样本生成实施例中任一分子样本。具体内容参见上述方法对应部分,在此不再赘述。
S202,将所述分子样本根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练。
示例性地,不同目标给体和目标受体的相互作用包括氢键的相互作用、卤键的相互作用、疏水基团的相互作用、芳香环的相互作用。一个分子可能存在不同数量的相互作用组合。比如,A分子包含5对氢键相互作用,1对卤键相互作用,2对疏水相互使用,1对芳香环相互作用。为了适应训练时的批处理操作,可以对不同的相互作用的数量进行固定,采用的方式可以是,氢键数量小于<=10;卤键数量<=5;疏水数量<=5;芳香环数量<=5,多则忽略,少则补零。
神经网络模型的网络结构,如图3所示,可以包括第一卷积层、第二卷积层、第三卷积层、全连接层和输出层,第一卷积层包括(9.9.9)*64的卷积算法、maxpool、dropout;第二卷积层包括(9.9.9)*128的卷积算法、maxpool、dropout;第三卷积层包括(5.5.5)*64的卷积算法、maxpool、dropout。不同相互作用可以都使用上述网络结构,不同目标给体和目标受体的相互作用分子样本输入至对应的神经网络模型,虽然不同相互作用的预测模型其网络结构可以一致,由于其输入样本不同,预测模型内部参数不同。比如,A分子中的5对氢键相互作用的样本输入至与其对应的氢键相互作用的神经网络模型,1对卤键相互作用的样本输入至与其对应的卤键相互作用的神经网络模型,2对疏水相互作用的样本输入至与其对应的疏水相互作用的神经网络模型,1对芳香环相互作用的样本输入至与其对应的芳香环相互作用的神经网络模型。这些针对不同相互作用的神经网络模型形成一个整体的神经网络模型。本实施例对神经网络模型的网络架构不做限定,本领域技术人员可以根据需要确定。
S203,当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。
示例性地,损失函数可以是abs误差函数,当分子样本以nM为单位,截取为1nM-100uM范围内的分子,取log对数,归一化至0-1,则预设函数值可以是0.1,当损失函数值小于0.1,则损失置零,完成对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型的训练,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。
本发明实施例提供的小分子和蛋白质结合能预测模型训练方法,用少量样本即可实现小分子和蛋白质结合能预测模型训练,提高了模型训练效率。
本发明实施例提供一种小分子和蛋白质结合构象预测模型训练方法,如图4所示,包括如下步骤:
S301,获取上述小分子和蛋白质结合样本生成实施例中任一分子样本;具体内容参见上述方法对应部分,在此不再赘述。
S302,对所述分子样本对应的空间构象进行变换,形成所述分子样本对应的新空间构象。空间构象进行变换的方式可以包括对分子样本的三维图像进行旋转、扭转、平移等。
S303,根据所述新空间构象与所述分子样本的真实构象,得到所述新空间构象的样本标签。
示例性地,根据所述新空间构象与所述分子样本的真实构象,得到所述新空间构象的样本标签的方式可以是计算分子样本新空间构象与分子样本真实构象的均方根偏差(RMSD),分子样本的真实构象可以来源于预先设定的数据库。其计算方式可以是:
其中,N是原子数,mi是原子i的质量,Xi是分子样本新空间构象中目标原子i的坐标向量,Yi是分子样本真实构象中对应的参考原子i的坐标向量,M是总质量。如果RMSD未进行质量加权,则所有mi=1且M=N。
本实施例对计算分子样本的新构象与分子样本的真实构象的方式不做限定,本领域技术人员可以根据需要确定。
S304,将所述分子样本的新构象以及样本标签根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练。
示例性地,神经网络模型的网络结构可以包括(9.9.9)*64的第一卷积层、第一最大池化层、第一dropout层;(9.9.9)*128的第二卷积层、第二最大池化层、第二dropout层;(5.5.5)*64的第三卷积层、第三最大池化层、第三dropout层和输出层。不同相互作用可以都使用上述网络结构,不同目标给体和目标受体的相互作用分子样本输入至对应的神经网络模型,虽然不同相互作用的预测模型其网络结构可以一致,由于其输入样本不同,其内部参数不同。
S305,当每一个神经网络模型的损失函数值小于预设函数值,得到对应的小分子和蛋白质结合构象预测模型。损失函数可以是均方误差函数,预设函数值可以是0.1,本实施例对损失函数不做限定,本领域技术人员可以根据需要确定。
本发明实施例提供的小分子和蛋白质结合构象预测模型训练方法,用少量的样本即可实现小分子和蛋白质结合构象预测模型训练,提高了模型训练效率。
本发明实施例提供一种小分子和蛋白质结合能预测方法,如图5所示,包括如下步骤:
S401,获取小分子和蛋白质的三维图像。小分子和蛋白质的三维图像可以取自pdbbind 1.6w构象-活性数据。
S402,根据上述小分子和蛋白质结合样本生成实施例中任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本。具体内容参见上述方法对应部分,在此不再赘述。
S403,根据不同目标给体和目标受体的相互作用将目标样本输入至小分子和蛋白质结合能预测模型。
S404,根据小分子和蛋白质结合能预测模型对对应的目标给体和目标受体的相互作用进行打分,得到所述小分子和蛋白质结合能预测结果。
示例性地,在小分子和蛋白质结合能预测模型中包含针对不同目标给体和目标受体的相互作用的预测模型,各个预测模型对各个对应的目标给体和目标受体的结合能进行打分,将各个打分进行综合,得到最终的小分子和蛋白质结合能预测结果。
本发明实施例提供的小分子和蛋白质结合能预测方法,对样本按照上述样本生成方法进行处理,输入至对应的小分子和蛋白质结合能预测模型,即可完成小分子和蛋白质结合能预测,由于样本中包含先验知识,能够提高小分子和蛋白质结合能预测效率。
本发明实施例提供一种小分子和蛋白质结合构象预测方法,如图6所示,包括如下步骤:
S501,获取小分子和蛋白质的三维图像。小分子和蛋白质的三维图像可以取自pdbbind 1.6w构象-活性数据。
S502,根据小分子和蛋白质结合样本生成实施例中任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本。具体内容参见上述方法对应部分,在此不再赘述。
S503,将小分子和蛋白质的目标样本输入至小分子和蛋白质结合构象预测模型,得到小分子和蛋白质结合构象预测结果。结合构象预测结果表明小分子和蛋白质发生结合时,最大概率的小分子和蛋白质构象。小分子和蛋白质结合构象预测模型可以是上述实施例中的预测模型,也可以是其他由神经网络训练得到的预测模型,本实施例对此不做限定,本领域技术人员可以根据需要确定。
本发明实施例提供的小分子和蛋白质结合构象预测方法,对样本按照上述样本生成方法进行处理,输入至对应的小分子和蛋白质结合构象预测模型,即可完成小分子和蛋白质结合构象预测,由于样本中包含先验知识,能够提高小分子和蛋白质结合构象预测效率。
本发明实施例提供一种小分子和蛋白质结合样本生成装置,如图7所示,包括:
相互作用判断模块601,用于当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断所述目标给体和目标受体是否存在相互作用;具体内容参见上述方法对应部分,在此不再赘述。
样本确定模块602,用于当所述目标给体与所述目标受体存在相互作用,则按照预设规则,建立所述目标给体与所述目标受体的空间构象数据,得到所述小分子和蛋白质结合样本。具体内容参见上述方法对应部分,在此不再赘述。
作为本实施例一种可选的实施方式,目标给体和目标受体的相互作用包括氢键相互作用、卤键相互作用、疏水基团相互作用、芳香环相互作用。
作为本实施例一种可选的实施方式,相互作用判断模块601,包括:
作用范围确定模块,用于确定目标给体与受体的作用范围;具体内容参见上述方法对应部分,在此不再赘述。
相互作用判断子模块,用于根据所述目标给体与所述目标受体的作用范围确定所述目标给体与所述目标受体是否存在相互作用。具体内容参见上述方法对应部分,在此不再赘述。
作为本实施例一种可选的实施方式,作用范围确定模块,包括:
氢键范围确定模块,用于当目标给体和目标受体的相互作用为氢键相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径4.5埃的圆形区域;具体内容参见上述方法对应部分,在此不再赘述。
卤键范围确定模块,用于当目标给体和目标受体的相互作用为卤键相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径4.5埃的圆形区域;具体内容参见上述方法对应部分,在此不再赘述。
疏水基团范围确定模块,用于当目标给体和目标受体的相互作用为疏水基团相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径6埃的圆形区域;具体内容参见上述方法对应部分,在此不再赘述。
芳香环范围确定模块,用于当目标给体和目标受体的相互作用为芳香环相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径6埃的圆形区域。具体内容参见上述方法对应部分,在此不再赘述。
本发明实施例提供一种小分子和蛋白质结合能预测模型训练装置,包括:
样本获取模块,用于获取上述小分子和蛋白质结合样本生成实施例中任一所述分子样本;具体内容参见上述方法对应部分,在此不再赘述。
分子样本输入模块,将所述分子样本根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;具体内容参见上述方法对应部分,在此不再赘述。
结合能预测模型训练模块,用于当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。具体内容参见上述方法对应部分,在此不再赘述。
本发明实施例提供一种小分子和蛋白质结合构象预测模型训练装置,包括:
样本获取模块,用于获取上述小分子和蛋白质结合样本生成实施例中任一所述分子样本;具体内容参见上述方法对应部分,在此不再赘述。
新构象形成模块,用于对所述分子样本对应的空间构象进行变换,形成所述分子样本对应的新空间构象;具体内容参见上述方法对应部分,在此不再赘述。
样本标签确定模块,用于根据所述新空间构象与所述分子样本的真实构象,得到所述新空间构象的样本标签;具体内容参见上述方法对应部分,在此不再赘述。
新构象数据输入模块,用于将所述分子样本的新构象以及样本标签根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;具体内容参见上述方法对应部分,在此不再赘述。
结合构象训练模块,用于当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应的小分子和蛋白质结合构象预测模型。具体内容参见上述方法对应部分,在此不再赘述。
本发明实施例提供一种小分子和蛋白质结合能预测装置,包括:
三维图像获取模块,用于获取小分子和蛋白质的三维图像;具体内容参见上述方法对应部分,在此不再赘述。
目标样本确定模块,用于根据上述小分子和蛋白质结合样本生成实施例中任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;具体内容参见上述方法对应部分,在此不再赘述。
结合能数据输入模块,用于根据不同目标给体将目标样本输入至小分子和蛋白质结合能预测模型;具体内容参见上述方法对应部分,在此不再赘述。
结合能预测结果确定模块,用于根据小分子和蛋白质结合能预测模型对对应的目标给体以及对应受体进行打分,得到所述小分子和蛋白质结合能预测结果。具体内容参见上述方法对应部分,在此不再赘述。
本发明实施例提供一种小分子和蛋白质结合构象预测装置,包括:
小分子蛋白质获取模块,用于获取小分子和蛋白质的三维图像;具体内容参见上述方法对应部分,在此不再赘述。
样本处理模块,用于根据上述小分子和蛋白质结合样本生成实施例中任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;具体内容参见上述方法对应部分,在此不再赘述。
结合构象预测结果确定模块,用于将所述小分子和蛋白质的目标样本输入至小分子和蛋白质结合构象预测模型,得到所述小分子和蛋白质结合构象预测结果。具体内容参见上述方法对应部分,在此不再赘述。
本申请实施例还提供一种电子设备,如图8所示,处理器710和存储器720,其中处理器710和存储器720可以通过总线或者其他方式连接。
处理器710可以为中央处理器(Central Processing Unit,CPU)。处理器710还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器720作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的小分子和蛋白质结合样本生成方法或者如图2所示实施例中所述的小分子和蛋白质结合能预测模型训练方法或者如图4所示实施例中所述的小分子和蛋白质结合构象预测模型训练方法或者如图5所示实施例中所述的小分子和蛋白质结合能预测方法或者如图6所示实施例中所述的小分子和蛋白质结合构象预测方法的步骤对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理。
存储器720可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器720可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器720中,当被所述处理器710执行时,执行如图1所示实施例中的小分子和蛋白质结合样本生成方法或者如图2所示实施例中所述的小分子和蛋白质结合能预测模型训练方法或者如图4所示实施例中所述的小分子和蛋白质结合构象预测模型训练方法或者如图5所示实施例中所述的小分子和蛋白质结合能预测方法或者如图6所示实施例中所述的小分子和蛋白质结合构象预测方法的步骤。
上述电子设备的具体细节可以对应参阅图1、2、4、5、6所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中小分子和蛋白质结合样本生成方法或者实施例中所述的小分子和蛋白质结合能预测模型训练方法或者实施例中所述的小分子和蛋白质结合构象预测模型训练方法或者实施例中所述的小分子和蛋白质结合能预测方法或者实施例中所述的小分子和蛋白质结合构象预测方法的步骤。。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccess Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (15)
1.一种小分子和蛋白质结合样本生成方法,其特征在于,包括如下步骤:
当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断所述目标给体和目标受体是否存在相互作用;
当所述目标给体与所述目标受体存在相互作用,则按照预设规则,建立所述目标给体与所述目标受体的空间构象数据,得到所述小分子和蛋白质结合样本。
2.根据权利要求1所述的方法,其特征在于,目标给体和目标受体的相互作用包括氢键相互作用、卤键相互作用、疏水基团相互作用、芳香环相互作用。
3.根据权利要求1所述的方法,其特征在于,判断所述目标给体和目标受体是否存在相互作用,包括:
确定所述目标给体与所述目标受体的作用范围;
根据所述目标给体与所述目标受体的作用范围确定所述目标给体与所述目标受体是否存在相互作用。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标给体与所述目标受体的作用范围,包括:
当目标给体和目标受体的相互作用为氢键相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径4.5埃的圆形区域;
当目标给体和目标受体的相互作用为卤键相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径4.5埃的圆形区域;
当目标给体和目标受体的相互作用为疏水基团相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径6埃的圆形区域;
当目标给体和目标受体的相互作用为芳香环相互作用时,作用范围为以所述目标给体和所述目标受体为中心,半径6埃的圆形区域。
5.一种小分子和蛋白质结合能预测模型训练方法,其特征在于,包括如下步骤:
获取权利要求1-4任一所述分子样本;
将所述分子样本根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;
当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。
6.一种小分子和蛋白质结合构象预测模型训练方法,其特征在于,包括如下步骤:
获取权利要求1-4任一所述分子样本;
对所述分子样本对应的空间构象进行变换,形成所述分子样本对应的新空间构象;
根据所述新空间构象与所述分子样本的真实构象,得到所述新空间构象的样本标签;
将所述分子样本的新构象以及样本标签根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;
当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应的小分子和蛋白质结合构象预测模型。
7.一种小分子和蛋白质结合能预测方法,其特征在于,包括如下步骤:
获取小分子和蛋白质的三维图像;
根据权利要求1-4任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;
根据不同目标给体和目标受体的相互作用将目标样本输入至小分子和蛋白质结合能预测模型;
根据小分子和蛋白质结合能预测模型对对应的目标给体以及对应受体进行打分,得到所述小分子和蛋白质结合能预测结果。
8.一种小分子和蛋白质结合构象预测方法,其特征在于,包括如下步骤:
获取小分子和蛋白质的三维图像;
根据权利要求1-4任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;
将所述小分子和蛋白质的目标样本输入至小分子和蛋白质结合构象预测模型,得到所述小分子和蛋白质结合构象预测结果。
9.一种小分子和蛋白质结合样本生成装置,其特征在于,包括:
相互作用判断模块,用于当小分子与蛋白质之间存在相互配合的目标给体和目标受体,判断所述目标给体和目标受体是否存在相互作用;
样本确定模块,用于当所述目标给体与所述目标受体存在相互作用,则按照预设规则,建立所述目标给体与所述目标受体的空间构象数据,得到所述小分子和蛋白质结合样本。
10.一种小分子和蛋白质结合能预测模型训练装置,其特征在于,包括:
样本获取模块,用于获取权利要求1-4任一所述分子样本;
分子样本输入模块,用于将所述分子样本根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;
结合能预测模型训练模块,用于当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应不同目标给体和目标受体的相互作用的小分子和蛋白质结合能预测模型。
11.一种小分子和蛋白质结合构象预测模型训练装置,其特征在于,包括:
样本获取模块,用于获取权利要求1-4任一所述分子样本;
新构象形成模块,用于对所述分子样本对应的空间构象进行变换,形成所述分子样本对应的新空间构象;
样本标签确定模块,用于根据所述新空间构象与所述分子样本的真实构象,得到所述新空间构象的样本标签;
新构象数据输入模块,用于将所述分子样本的新构象以及样本标签根据不同目标给体和目标受体的相互作用,输入至对应的神经网络模型进行训练;
结合构象训练模块,用于当每一个所述神经网络模型的损失函数值小于预设函数值,得到对应的小分子和蛋白质结合构象预测模型。
12.一种小分子和蛋白质结合能预测装置,其特征在于,包括:
三维图像获取模块,用于获取小分子和蛋白质的三维图像;
目标样本确定模块,用于根据权利要求1-4任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;
结合能数据输入模块,用于根据不同目标给体和目标受体的相互作用将目标样本输入至小分子和蛋白质结合能预测模型;
结合能预测结果确定模块,用于根据小分子和蛋白质结合能预测模型对对应的目标给体以及对应受体进行打分,得到所述小分子和蛋白质结合能预测结果。
13.一种小分子和蛋白质结合构象预测装置,其特征在于,包括:
小分子蛋白质获取模块,用于获取小分子和蛋白质的三维图像;
样本处理模块,用于根据权利要求1-4任一所述的分子样本生成方法,对所述小分子和蛋白质的三维图像进行处理,得到目标样本;
结合构象预测结果确定模块,用于将所述小分子和蛋白质的目标样本输入至小分子和蛋白质结合构象预测模型,得到所述小分子和蛋白质结合构象预测结果。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-4任一所述小分子和蛋白质结合样本生成方法或者权利要求5所述的小分子和蛋白质结合能预测模型训练方法或者权利要求6所述的小分子和蛋白质结合构象预测模型训练方法或者权利要求7所述的小分子和蛋白质结合能预测方法或者权利要求8所述的小分子和蛋白质结合构象预测方法的步骤。
15.一种存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-4任一所述小分子和蛋白质结合样本生成方法或者权利要求5所述的小分子和蛋白质结合能预测模型训练方法或者权利要求6所述的小分子和蛋白质结合构象预测模型训练方法或者权利要求7所述的小分子和蛋白质结合能预测方法或者权利要求8所述的小分子和蛋白质结合构象预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011012500.9A CN112289371A (zh) | 2020-09-23 | 2020-09-23 | 蛋白质与小分子样本生成及结合能、结合构象预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011012500.9A CN112289371A (zh) | 2020-09-23 | 2020-09-23 | 蛋白质与小分子样本生成及结合能、结合构象预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112289371A true CN112289371A (zh) | 2021-01-29 |
Family
ID=74422972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011012500.9A Pending CN112289371A (zh) | 2020-09-23 | 2020-09-23 | 蛋白质与小分子样本生成及结合能、结合构象预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112289371A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116884505A (zh) * | 2023-07-19 | 2023-10-13 | 西湖实验室(生命科学和生物医学浙江省实验室) | 基于局部模板相似性的蛋白质-小分子复合物对接方法 |
WO2024060886A1 (zh) * | 2022-09-23 | 2024-03-28 | 腾讯科技(深圳)有限公司 | 结合亲和力检测模型的训练方法及结合亲和力检测方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020072887A1 (en) * | 2000-08-18 | 2002-06-13 | Sandor Szalma | Interaction fingerprint annotations from protein structure models |
US20070192033A1 (en) * | 2006-02-16 | 2007-08-16 | Microsoft Corporation | Molecular interaction predictors |
CN102930181A (zh) * | 2012-11-07 | 2013-02-13 | 四川大学 | 基于分子描述符的蛋白质-配体亲和力预测方法 |
US20150278432A1 (en) * | 2012-07-25 | 2015-10-01 | Plebiotic, S.L. | Method and system for molecular dynamics simulation with stability control |
CN106446607A (zh) * | 2016-09-26 | 2017-02-22 | 华东师范大学 | 基于相互作用指纹和机器学习的药物靶标的虚拟筛选方法 |
CN107526939A (zh) * | 2017-06-30 | 2017-12-29 | 南京理工大学 | 一种快速小分子结构对齐方法 |
CN109036580A (zh) * | 2018-07-06 | 2018-12-18 | 华东师范大学 | 基于相互作用能项和机器学习的蛋白-配体亲和力预测方法 |
CN110600075A (zh) * | 2019-08-14 | 2019-12-20 | 浙江工业大学 | 一种基于配体生长策略的蛋白质atp对接方法 |
CN110600076A (zh) * | 2019-08-14 | 2019-12-20 | 浙江工业大学 | 一种基于距离和角度信息的蛋白质atp对接方法 |
CN110767266A (zh) * | 2019-11-04 | 2020-02-07 | 山东省计算中心(国家超级计算济南中心) | 基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法 |
CN110910949A (zh) * | 2019-11-27 | 2020-03-24 | 南通大学 | 基于虚拟筛选的Imatinib在作为AIBP抑制剂方面的应用 |
CN111292812A (zh) * | 2020-01-21 | 2020-06-16 | 中国医学科学院基础医学研究所 | 一种研究蛋白质及药物-蛋白质复合体构象多态性的方法 |
CN111435608A (zh) * | 2019-09-05 | 2020-07-21 | 中国海洋大学 | 一种基于深度学习的蛋白质药物结合位点预测方法 |
-
2020
- 2020-09-23 CN CN202011012500.9A patent/CN112289371A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020072887A1 (en) * | 2000-08-18 | 2002-06-13 | Sandor Szalma | Interaction fingerprint annotations from protein structure models |
US20070192033A1 (en) * | 2006-02-16 | 2007-08-16 | Microsoft Corporation | Molecular interaction predictors |
US20150278432A1 (en) * | 2012-07-25 | 2015-10-01 | Plebiotic, S.L. | Method and system for molecular dynamics simulation with stability control |
CN102930181A (zh) * | 2012-11-07 | 2013-02-13 | 四川大学 | 基于分子描述符的蛋白质-配体亲和力预测方法 |
CN106446607A (zh) * | 2016-09-26 | 2017-02-22 | 华东师范大学 | 基于相互作用指纹和机器学习的药物靶标的虚拟筛选方法 |
CN107526939A (zh) * | 2017-06-30 | 2017-12-29 | 南京理工大学 | 一种快速小分子结构对齐方法 |
CN109036580A (zh) * | 2018-07-06 | 2018-12-18 | 华东师范大学 | 基于相互作用能项和机器学习的蛋白-配体亲和力预测方法 |
CN110600075A (zh) * | 2019-08-14 | 2019-12-20 | 浙江工业大学 | 一种基于配体生长策略的蛋白质atp对接方法 |
CN110600076A (zh) * | 2019-08-14 | 2019-12-20 | 浙江工业大学 | 一种基于距离和角度信息的蛋白质atp对接方法 |
CN111435608A (zh) * | 2019-09-05 | 2020-07-21 | 中国海洋大学 | 一种基于深度学习的蛋白质药物结合位点预测方法 |
CN110767266A (zh) * | 2019-11-04 | 2020-02-07 | 山东省计算中心(国家超级计算济南中心) | 基于图卷积的面向ErbB靶向蛋白家族的打分函数构建方法 |
CN110910949A (zh) * | 2019-11-27 | 2020-03-24 | 南通大学 | 基于虚拟筛选的Imatinib在作为AIBP抑制剂方面的应用 |
CN111292812A (zh) * | 2020-01-21 | 2020-06-16 | 中国医学科学院基础医学研究所 | 一种研究蛋白质及药物-蛋白质复合体构象多态性的方法 |
Non-Patent Citations (1)
Title |
---|
胡姗姗: "药物互作数据的挖掘与预测研究", 《中国博士学位论文全文数据库 医药卫生科技辑》, no. 7, pages 079 - 26 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024060886A1 (zh) * | 2022-09-23 | 2024-03-28 | 腾讯科技(深圳)有限公司 | 结合亲和力检测模型的训练方法及结合亲和力检测方法 |
CN116884505A (zh) * | 2023-07-19 | 2023-10-13 | 西湖实验室(生命科学和生物医学浙江省实验室) | 基于局部模板相似性的蛋白质-小分子复合物对接方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Stepniewska-Dziubinska et al. | Improving detection of protein-ligand binding sites with 3D segmentation | |
Kozlovskii et al. | Spatiotemporal identification of druggable binding sites using deep learning | |
CN112289371A (zh) | 蛋白质与小分子样本生成及结合能、结合构象预测方法 | |
WO2017020654A1 (zh) | 无线网络接入方法和装置 | |
CN114333986A (zh) | 模型训练、药物筛选和亲和力预测的方法与装置 | |
KR102027892B1 (ko) | 위치 기반 정보의 서버 제어 타일링을 위한 기술 | |
CN112289370B (zh) | 一种蛋白质结构预测方法及装置 | |
Krejcar | Problem solving of low data throughput on mobile devices by artefacts prebuffering | |
US11519891B2 (en) | Techniques for providing data acquisition interfaces for analytical instruments | |
CN114974397A (zh) | 蛋白质结构预测模型的训练方法和蛋白质结构预测方法 | |
US20220358621A1 (en) | Point cloud feature enhancement and apparatus, computer device and storage medium | |
Sun et al. | A performance prediction method for a high-precision servo valve supported by digital twin assembly-commissioning | |
WO2022212215A1 (en) | Streamlined development and deployment of autoencoders | |
KR20230043754A (ko) | 포지셔닝 방법, 장치, 설비, 시스템, 매체 및 자율주행 차량 | |
CN116343949A (zh) | 蛋白配体结合亲和力预测方法、装置、系统及存储介质 | |
Gu et al. | Surface‐histogram: A new shape descriptor for protein‐protein docking | |
Muenks et al. | Automatic and accurate ligand structure determination guided by cryo-electron microscopy maps | |
WO2021236423A1 (en) | Identifying claim complexity by integrating supervised and unsupervised learning | |
CN117542405A (zh) | 面向糖类结合位点的预测方法、装置、设备和存储介质 | |
CN112101438A (zh) | 一种左右眼分类方法、装置、服务器和存储介质 | |
Xia et al. | BindWeb: a web server for ligand binding residue and pocket prediction from protein structures | |
CN109359382B (zh) | 掀背门安装点位置的确定方法、装置、设备和存储介质 | |
KR102481367B1 (ko) | 포인트 클라우드 데이터로부터 지표면 데이터를 생성하기 위한 인공지능 모델의 학습 방법, 장치 및 컴퓨터프로그램 | |
EP4272215A1 (en) | Protein structure prediction | |
CN116069340A (zh) | 自动驾驶模型部署方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |