CN113421610B - 一种分子叠合构象确定方法、装置以及存储介质 - Google Patents

一种分子叠合构象确定方法、装置以及存储介质 Download PDF

Info

Publication number
CN113421610B
CN113421610B CN202110803688.7A CN202110803688A CN113421610B CN 113421610 B CN113421610 B CN 113421610B CN 202110803688 A CN202110803688 A CN 202110803688A CN 113421610 B CN113421610 B CN 113421610B
Authority
CN
China
Prior art keywords
conformation
candidate
sampling
molecular
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110803688.7A
Other languages
English (en)
Other versions
CN113421610A (zh
Inventor
殷实秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wangshi Intelligent Technology Co ltd
Original Assignee
Beijing Wangshi Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wangshi Intelligent Technology Co ltd filed Critical Beijing Wangshi Intelligent Technology Co ltd
Publication of CN113421610A publication Critical patent/CN113421610A/zh
Application granted granted Critical
Publication of CN113421610B publication Critical patent/CN113421610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种分子叠合构象确定方法、装置以及存储介质,其中,方法包括:获取候选分子任一采样构象;根据目标算法确定候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象;对第一候选分子采样构象进行局部优化,得到第二候选分子采样构象;根据第二候选分子采样构象与参考分子构象,得到相似度结果;重复执行获取候选分子任一采样构象至根据第二候选分子采样构象与参考分子构象,得到相似度结果的步骤,直至满足目标条件,得到候选分子多个采样构象的相似度结果;根据多个相似度结果,确定候选分子的叠合构象。通过实施本发明,直接在局部使用梯度下降寻找最接近参考分子构象的构象,从而显著减少构象采样数,进而减少计算量。

Description

一种分子叠合构象确定方法、装置以及存储介质
技术领域
本发明涉及生物信息技术领域,具体涉及一种分子叠合构象确定方法、装置以及存储介质。
背景技术
分子叠合是完成分子相似性计算、获得分子活性构象、作用模式以及基于配基的虚拟筛选的重要手段。相关技术中,分子叠合构象确定方法分为三个步骤,候选分子构象采样,构象叠合,重合度计算。在进行构象叠合时,采用对候选分子构象进行最优旋转平移变换,从而改变候选分子的外部自由度,使其配对原子间距最小,而缺乏对候选分子内部结构的考虑,导致如果想要获得和参考构象最相似的叠合构象,必须进行大量的构象采样才能使得算法收敛,进而会消耗大量计算资源。
发明内容
有鉴于此,本发明实施例提供了一种分子叠合构象确定方法、装置以及存储介质,以解决现有技术中获得和参考构象最相似的叠合构象时,必须进行大量的构象采样才能使得算法收敛,进而会消耗大量计算资源的缺陷。
根据第一方面,本发明实施例提供一种分子叠合构象确定方法,包括如下步骤:获取候选分子任一采样构象;根据目标算法确定所述候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象;对所述第一候选分子采样构象进行局部优化,得到第二候选分子采样构象;根据所述第二候选分子采样构象与参考分子构象,得到相似度结果;重复执行所述获取候选分子任一采样构象至所述根据所述第二候选分子采样构象与参考分子构象,得到相似度结果的步骤,直至满足目标条件,得到候选分子多个采样构象的相似度结果;根据多个相似度结果,确定所述候选分子的叠合构象。
可选地,所述对所述第一候选分子采样构象进行局部优化,得到第二候选分子采样构象,包括:获取所述第一候选分子采样构象的自由度、原子坐标以及能量函数;将所述第一候选分子采样构象的自由度、原子坐标以及能量函数输入至预先存储的优化函数,对所述第一候选分子采样构象进行优化,得到第二候选分子采样构象,所述优化函数为根据相似度函数与所述能量函数进行加权得到。
可选地,所述获取候选分子任一采样构象之后,根据目标算法确定所述候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象之前,包括:对所述候选分子任一采样构象进行能量最小化。
可选地,所述根据所述第二候选分子采样构象与参考分子构象,得到相似度结果,包括:根据所述第二候选分子采样构象的范德华半径以及参考分子构象的范德华半径建立几何模型;根据几何模型,确定所述第二候选分子采样构象和参考分子构象的交并比体积,得到相似度结果。
可选地,所述目标算法为Kabsch算法。
根据第二方面,本发明实施例提供一种分子叠合构象确定装置,包括:采样构象获取模块,用于获取候选分子任一采样构象;第一候选分子采样构象确定模块,用于根据目标算法确定所述候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象;局部优化模块,用于对所述第一候选分子采样构象进行局部优化,得到第二候选分子采样构象;相似度确定模块,用于根据所述第二候选分子采样构象与参考分子构象,得到相似度结果;循环模块,用于重复执行所述获取候选分子任一采样构象至所述根据所述第二候选分子采样构象与参考分子构象,得到相似度结果的步骤,直至满足目标条件,得到候选分子多个采样构象的相似度结果;叠合构象确定模块,用于根据多个相似度结果,确定所述候选分子的叠合构象。
可选地,局部优化模块,包括:数据获取模块,用于获取所述第一候选分子采样构象的自由度、原子坐标以及能量函数;局部优化子模块,用于将所述第一候选分子采样构象的自由度、原子坐标以及能量函数输入至预先存储的优化函数,对所述第一候选分子采样构象进行优化,得到第二候选分子采样构象,所述优化函数为根据相似度函数与所述能量函数进行加权得到。
可选地,还包括:能量最小化模块,用于对所述候选分子任一采样构象进行能量最小化。
根据第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面或第一方面任一实施方式所述的分子叠合构象确定方法的步骤。
根据第四方面,本发明实施例提供一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面或第一方面任一实施方式所述的分子叠合构象确定方法的步骤。
本发明技术方案,具有如下优点:
本实施例提供的分子叠合构象确定方法/装置,在得到第一候选分子采样构象,改变候选分子的外部自由度后,还对第一候选分子采样构象进行局部优化,相当于加入了新的先验知识,直接在局部使用梯度下降寻找最接近参考分子构象的构象,从而显著减少构象采样数,进而减少计算量。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中分子叠合构象确定方法的一个具体示例的流程图;
图2为本发明实施例中分子叠合构象确定装置的一个具体示例原理框图;
图3为本发明实施例中电子设备的一个具体示例的原理框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本实施例提供一种分子叠合构象确定方法,如图1所示,包括如下步骤:
S101,获取候选分子任一采样构象;
示例性地,候选分子表征参考分子的待叠合分子。对构象未知的候选分子进行构象采样时,由于计算量的限制,采样数一般不会超过1000个,也不能过少,过少会降低叠合精确度。获取候选分子任一采样构象的方式可以是对候选分子的3D构象进行随机采样得到。
S102,根据目标算法确定候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象;
示例性地,目标算法可以是Kabsch算法。首先,获取候选分子采样构象与参考分子构象的配对原子组,根据Kabsch算法对该配对原子组的求取最优旋转平移矩阵,候选分子采样构象根据最优旋转平移矩阵对自身构象进行变换,得到第一候选分子采样构象,改变候选分子采样构象的外部自由度(三个平动坐标和三个姿态角),使得第一候选分子采样构象与参考分子构象的配对原子间距最小。
S103,对第一候选分子采样构象进行局部优化,得到第二候选分子采样构象;
示例性地,局部优化为对第一候选分子采样构象内部结构进行优化,具体可以从第一候选分子采样构象与参考分子构象的相似度以及能量方面进行优化,比如,对用能量项和相似度项加权求和作为目标函数优化或者将能量作为约束项,设置能量阈值,并在阈值范围内进行相似度优化。本实施例对此不做限定,本领域技术人员可以根据需要确定。比如,对第一候选分子采样构象与参考分子构象的相似度进行优化时,对第一候选分子采样构象进行局部优化的方式可以是利用OPLS力场得到第一候选分子采样构象的原子坐标,将参考分子构象中与第一候选分子采样构象中该原子配对的原子坐标与第一候选分子采样构象的原子坐标输入预先建立的原子匹配相似度函数,从而确定出原子匹配相似度函数最大化时第一候选分子采样构象的构象,作为第二候选分子采样构象,其中,原子匹配相似度函数可以是:
distance是欧氏距离,P={(ai,aj),…}ai,aj为配对原子。本实施例对局部优化方式以及原子匹配相似度函数的具体建立方式不做限定,本领域技术人员可以根据需要确定。
S104,根据第二候选分子采样构象与参考分子构象,得到相似度结果;
示例性地,根据第二候选分子采样构象与参考分子构象,得到相似度结果的方式可以是计算第二候选分子采样构象与参考分子构象shape tanimoto distance(accard相似度),从而得到相似度结果。常用的分子叠合软件包括RDKIT,Open3DALIGN,ROCS等,每种软件中计算相似度的算法可能不同,本实施例对根据第二候选分子采样构象与参考分子构象,得到相似度结果的方式以及采用的分子叠合软件不做限定,本领域技术人员可以根据需要确定。
S105,重复执行获取候选分子任一采样构象至根据第二候选分子采样构象与参考分子构象,得到相似度结果的步骤,直至满足目标条件,得到候选分子多个采样构象的相似度结果;
示例性地,目标条件可以是得到的相似度结果满足预设相似度要求,也可以是重复执行次数达到预设次数,本实施例对目标条件不做限定,本领域技术人员可以根据需要确定。
S106,根据多个相似度结果,确定候选分子的叠合构象。
示例性地,根据多个相似度结果,确定候选分子的叠合构象的方式可以是在多个相似度结果中选择相似度最大(shape tanimoto distance最小)的第二候选分子采样构象,将第二候选分子采样构象作为候选分子进行叠合时的叠合构象。
本实施例提供的分子叠合构象确定方法,在得到第一候选分子采样构象,改变候选分子的外部自由度后,还对第一候选分子采样构象进行局部优化,相当于加入了新的先验知识,直接在局部使用梯度下降寻找最接近参考分子构象的构象,从而显著减少构象采样数,进而减少计算量。
作为本实施例一种可选的实施方式,对第一候选分子采样构象进行局部优化,得到第二候选分子采样构象,包括:
首先,获取第一候选分子采样构象的自由度、原子坐标以及能量函数;
示例性地,第一候选分子采样构象中的自由度包括分子内部柔性键导致的内部自由度,其数量等于柔性建数量。获取候选分子采样构象的内部自由度、原子坐标以及能量函数的方式可以是通过分子力场计算得到,分子力场可以包括OPLS力场或者AMBER力场。能量函数可以表征候选分子采样构象的力场势函数,包括键结作用和非键相互作用。键结作用包括harmonics键长和键角势能,Fourier扭矩势能,非键相互作用包括LJ势和Coulomb势。本实施例对获取第一候选分子采样构象的自由度、原子坐标以及能量函数的方式不做限定,本领域技术人员可以根据需要确定。
其次,将第一候选分子采样构象的自由度、原子坐标以及能量函数输入至预先存储的优化函数,对第一候选分子采样构象进行优化,得到第二候选分子采样构象,优化函数为根据相似度函数与能量函数进行加权得到。
示例性地,预先存储的优化函数为根据相似度函数与能量函数进行加权得到,能量项的作用是保证分子不被优化成不合理构象;相似度项保证分子和参考分子具有足够的相似度,相似度函数权重越高,最终构象与参考构象越相似,但能量有可能更高,反之亦然,相似度函数与能量函数的权重可以按照需要设定,本实施例对此不做限定。相似度函数为根据原子坐标对第一候选分子采样构象与参考分子构象进行相似度的函数。
自由度描述了构想优化可能的搜索空间。例如刚体有三个平动自由度三个转动自由度共6个自由度。由于刚体本身无可变动组件,因此6个自由度全部为外部自由度。对于候选分子来说,因为存在内部可旋转键,所以除了6个外部自由度外还存在内部自由度,每多1个旋转键则增加一个内部自由度。构象优化就是对内部自由度进行优化,寻找最优的旋转键键角。
通过优化函数对第一候选分子采样构象进行优化的方式可以是将第一候选分子采样构象的自由度、原子坐标以及能量函数输入至预先存储的优化函数,判断优化函数的优化结果是否满足预先设定的优化目标,优化目标可以是能量最小化,具体实施过程中,可以借助OPLS力场的能量最小化功能进行优化求解。
本实施例提供的分子叠合构象确定方法,在进行局部优化时,考虑了第一候选分子采样构象与参考分子构象的相似度以及能量,使得局部优化效果更好,从而进一步减小构象采样数,进而减少计算量。
作为本实施例一种可选的实施方式,获取候选分子任一采样构象之后,根据目标算法确定候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象之前,包括:对候选分子任一采样构象进行能量最小化。
示例性地,对候选分子任一采样构象进行能量最小化的方式可以是运行openbabel进行能量最小化处理。在对候选分子构象进行采样时,随机构象采样会采出大量非法构象,可以通过能量最小化校正非法构象,避免由于非法构象的出现,为了算法收敛需要采样更多的分子构象,从而减小了分子叠合构象确定方法的运算量。
作为本实施例一种可选的实施方式,根据第二候选分子采样构象与参考分子构象,得到相似度结果,包括:
根据第二候选分子采样构象的范德华半径以及参考分子构象的范德华半径建立几何模型;根据几何模型,确定第二候选分子采样构象和参考分子构象的交并比体积,得到相似度结果。
示例性地,分子的几何模型可以通过软件构建得到,软件根据分子的范德华半径建立分子中的各个原子几何,从而完成分子的几何构建。当第二候选分子采样构象以及参考分子构象的几何模型构建完成后,通过计算两个几何模型的交集体积/并集体积,得到相似度结果。
本实施例提供一种分子叠合构象确定装置,如图2所示,包括:
采样构象获取模块201,用于获取候选分子任一采样构象;具体内容参见上述方法实施例对应部分,在此不再赘述。
第一候选分子采样构象确定模块202,用于根据目标算法确定所述候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象;具体内容参见上述方法实施例对应部分,在此不再赘述。
局部优化模块203,用于对所述第一候选分子采样构象进行局部优化,得到第二候选分子采样构象;具体内容参见上述方法实施例对应部分,在此不再赘述。
相似度确定模块204,用于根据所述第二候选分子采样构象与参考分子构象,得到相似度结果;具体内容参见上述方法实施例对应部分,在此不再赘述。
循环模块205,用于重复执行所述获取候选分子任一采样构象至所述根据所述第二候选分子采样构象与参考分子构象,得到相似度结果的步骤,直至满足目标条件,得到候选分子多个采样构象的相似度结果;具体内容参见上述方法实施例对应部分,在此不再赘述。
叠合构象确定模块206,用于根据多个相似度结果,确定所述候选分子的叠合构象。具体内容参见上述方法实施例对应部分,在此不再赘述。
本实施例提供的分子叠合构象确定装置,在得到第一候选分子采样构象,改变候选分子的外部自由度后,还对第一候选分子采样构象进行局部优化,相当于加入了新的先验知识,直接在局部使用梯度下降寻找最接近参考分子构象的构象,从而显著减少构象采样数,进而减少计算量。
作为本实施例一种可选的实施方式,局部优化模块,包括:
数据获取模块,用于获取所述第一候选分子采样构象的自由度、原子坐标以及能量函数;具体内容参见上述方法实施例对应部分,在此不再赘述。
局部优化子模块,用于将所述第一候选分子采样构象的自由度、原子坐标以及能量函数输入至预先存储的优化函数,对所述第一候选分子采样构象进行优化,得到第二候选分子采样构象,所述优化函数为根据相似度函数与所述能量函数进行加权得到。具体内容参见上述方法实施例对应部分,在此不再赘述。
作为本实施例一种可选的实施方式,还包括:能量最小化模块,用于对所述候选分子任一采样构象进行能量最小化。具体内容参见上述方法实施例对应部分,在此不再赘述。
作为本实施例一种可选的实施方式,相似度确定模块204,包括:
模型构建模块,用于根据所述第二候选分子采样构象的范德华半径以及参考分子构象的范德华半径建立几何模型;具体内容参见上述方法实施例对应部分,在此不再赘述。
相似度确定子模块,用于根据几何模型,确定所述第二候选分子采样构象和参考分子构象的交并比体积,得到相似度结果。具体内容参见上述方法实施例对应部分,在此不再赘述。
作为本实施例一种可选的实施方式,还包括:第一候选分子采样构象确定模块202包括:Kabsch算法模块,用于执行Kabsch算法。具体内容参见上述方法实施例对应部分,在此不再赘述。
本申请实施例还提供一种电子设备,如图3所示,处理器310和存储器320,其中处理器310和存储器320可以通过总线或者其他方式连接。
处理器310可以为中央处理器(Central Processing Unit,CPU)。处理器310还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器320作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的分子叠合构象确定方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理。
存储器320可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器320可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器320中,当被所述处理器310执行时,执行如图1所示实施例中的分子叠合构象确定方法。
上述电子设备的具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例1中分子叠合构象确定方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (6)

1.一种分子叠合构象确定方法,其特征在于,包括如下步骤:
获取候选分子任一采样构象;
根据目标算法确定所述候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象;
对所述第一候选分子采样构象进行局部优化,得到第二候选分子采样构象;
根据所述第二候选分子采样构象与参考分子构象,得到相似度结果;
重复执行所述获取候选分子任一采样构象至所述根据所述第二候选分子采样构象与参考分子构象,得到相似度结果的步骤,直至满足目标条件,得到候选分子多个采样构象的相似度结果;
根据多个相似度结果,确定所述候选分子的叠合构象;
所述对所述第一候选分子采样构象进行局部优化,得到第二候选分子采样构象,包括:
获取所述第一候选分子采样构象的自由度、原子坐标以及能量函数;
将所述第一候选分子采样构象的自由度、原子坐标以及能量函数输入至预先存储的优化函数,对所述第一候选分子采样构象进行优化,得到第二候选分子采样构象,所述优化函数为根据相似度函数与所述能量函数进行加权得到;
所述根据所述第二候选分子采样构象与参考分子构象,得到相似度结果,包括:
根据所述第二候选分子采样构象的范德华半径以及参考分子构象的范德华半径建立几何模型;
根据几何模型,确定所述第二候选分子采样构象和参考分子构象的交并比体积,得到相似度结果;
所述目标算法为Kabsch算法;
所述相似度函数为:
是欧氏距离,/>
2.根据权利要求1所述的方法,其特征在于,所述获取候选分子任一采样构象之后,根据目标算法确定所述候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象之前,包括:对所述候选分子任一采样构象进行能量最小化。
3.一种分子叠合构象确定装置,其特征在于,包括:
采样构象获取模块,用于获取候选分子任一采样构象;
第一候选分子采样构象确定模块,用于根据目标算法确定所述候选分子采样构象的最优旋转平移变换,得到第一候选分子采样构象;
局部优化模块,用于对所述第一候选分子采样构象进行局部优化,得到第二候选分子采样构象;
相似度确定模块,用于根据所述第二候选分子采样构象与参考分子构象,得到相似度结果;
循环模块,用于重复执行所述获取候选分子任一采样构象至所述根据所述第二候选分子采样构象与参考分子构象,得到相似度结果的步骤,直至满足目标条件,得到候选分子多个采样构象的相似度结果;
叠合构象确定模块,用于根据多个相似度结果,确定所述候选分子的叠合构象;
所述局部优化模块,包括:
数据获取模块,用于获取所述第一候选分子采样构象的自由度、原子坐标以及能量函数;
局部优化子模块,用于将所述第一候选分子采样构象的自由度、原子坐标以及能量函数输入至预先存储的优化函数,对所述第一候选分子采样构象进行优化,得到第二候选分子采样构象,所述优化函数为根据相似度函数与所述能量函数进行加权得到;
所述相似度确定模块,包括:
模型构建模块,用于根据所述第二候选分子采样构象的范德华半径以及参考分子构象的范德华半径建立几何模型;
相似度确定子模块,用于根据几何模型,确定所述第二候选分子采样构象和参考分子构象的交并比体积,得到相似度结果;
所述目标算法为Kabsch算法;
所述相似度函数为:
是欧氏距离,/>
4.根据权利要求3所述的装置,其特征在于,还包括:能量最小化模块,用于对所述候选分子任一采样构象进行能量最小化。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-2任一所述的分子叠合构象确定方法的步骤。
6.一种存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-2任一所述的分子叠合构象确定方法的步骤。
CN202110803688.7A 2021-07-01 2021-07-15 一种分子叠合构象确定方法、装置以及存储介质 Active CN113421610B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110746769 2021-07-01
CN2021107467698 2021-07-01

Publications (2)

Publication Number Publication Date
CN113421610A CN113421610A (zh) 2021-09-21
CN113421610B true CN113421610B (zh) 2023-10-20

Family

ID=77721028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110803688.7A Active CN113421610B (zh) 2021-07-01 2021-07-15 一种分子叠合构象确定方法、装置以及存储介质

Country Status (1)

Country Link
CN (1) CN113421610B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993014465A1 (en) * 1992-01-21 1993-07-22 The Board Of Trustees Of The Leland Stanford Jr. University Prediction of the conformation and stability of macromolecular structures
US5680319A (en) * 1995-05-25 1997-10-21 The Johns Hopkins University School Of Medicine Hierarchical protein folding prediction
US5787279A (en) * 1995-12-22 1998-07-28 International Business Machines Corporation System and method for conformationally-flexible molecular recognition
WO2000060507A2 (en) * 1999-04-02 2000-10-12 Neogenesis, Inc. Analyzing molecule and protein diversity
CN1849611A (zh) * 2003-09-08 2006-10-18 Acgt前基因组公司 建立和分析氨基酸序列构象的方法
CN1886659A (zh) * 2003-10-14 2006-12-27 维颂公司 分子构像及组合的分析方法及仪器
WO2007127367A2 (en) * 2006-04-26 2007-11-08 Yale University Method of prediction of the three-dimensional conformation of flexible proteins
CN102799779A (zh) * 2012-07-16 2012-11-28 中山大学 一种分子体积计算方法及两分子的形状比较方法
CN103745046A (zh) * 2013-12-26 2014-04-23 武汉轻工大学 一种根据分子动力学模拟预测润滑基础油减摩性能的方法
CN104866733A (zh) * 2015-04-03 2015-08-26 浙江工业大学 一种基于副本交换的群体构象空间优化方法
CN105654334A (zh) * 2015-12-17 2016-06-08 中国科学院自动化研究所 虚拟试衣方法和系统
CN108920894A (zh) * 2018-06-08 2018-11-30 浙江工业大学 一种基于简约抽象凸估计的蛋白质构象空间优化方法
CN110751990A (zh) * 2019-10-17 2020-02-04 兰州大学 以ido1为靶点的抑制剂及其虚拟筛选方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118296A1 (en) * 2003-11-07 2007-05-24 Dna Software Inc. System and methods for three dimensional molecular structural analysis
CA3060810A1 (en) * 2018-11-02 2020-05-02 Iqb Information Technologies Inc. Method and system for determining a conformation of a molecule using high-performance binary optimizer

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993014465A1 (en) * 1992-01-21 1993-07-22 The Board Of Trustees Of The Leland Stanford Jr. University Prediction of the conformation and stability of macromolecular structures
US5680319A (en) * 1995-05-25 1997-10-21 The Johns Hopkins University School Of Medicine Hierarchical protein folding prediction
US5787279A (en) * 1995-12-22 1998-07-28 International Business Machines Corporation System and method for conformationally-flexible molecular recognition
WO2000060507A2 (en) * 1999-04-02 2000-10-12 Neogenesis, Inc. Analyzing molecule and protein diversity
CN1849611A (zh) * 2003-09-08 2006-10-18 Acgt前基因组公司 建立和分析氨基酸序列构象的方法
CN1886659A (zh) * 2003-10-14 2006-12-27 维颂公司 分子构像及组合的分析方法及仪器
WO2007127367A2 (en) * 2006-04-26 2007-11-08 Yale University Method of prediction of the three-dimensional conformation of flexible proteins
CN102799779A (zh) * 2012-07-16 2012-11-28 中山大学 一种分子体积计算方法及两分子的形状比较方法
CN103745046A (zh) * 2013-12-26 2014-04-23 武汉轻工大学 一种根据分子动力学模拟预测润滑基础油减摩性能的方法
CN104866733A (zh) * 2015-04-03 2015-08-26 浙江工业大学 一种基于副本交换的群体构象空间优化方法
CN105654334A (zh) * 2015-12-17 2016-06-08 中国科学院自动化研究所 虚拟试衣方法和系统
CN108920894A (zh) * 2018-06-08 2018-11-30 浙江工业大学 一种基于简约抽象凸估计的蛋白质构象空间优化方法
CN110751990A (zh) * 2019-10-17 2020-02-04 兰州大学 以ido1为靶点的抑制剂及其虚拟筛选方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Flexible molecular superposition: Development of a combined similarity index and application of the constrained optimization technique;Chae, CH等;JOURNAL OF COMPUTATIONAL CHEMISTRY;第第22卷卷(第第8期期);第888-900页 *
The effective energy transformation scheme as a special continuation approach to global optimization with application to molecular conformation;Wu, ZJ等;SIAM JOURNAL ON OPTIMIZATION;第6卷(第3期);第748-768页 *
基于参数优化的染色体三维结构预测算法VMBO;李建更;张卫;李晓丹;;北京工业大学学报(第02期);第53-60页 *

Also Published As

Publication number Publication date
CN113421610A (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
McNutt et al. GNINA 1.0: molecular docking with deep learning
Dong et al. ChemDes: an integrated web-based platform for molecular descriptor and fingerprint computation
Gonçalves et al. Recent advances on the interval distance geometry problem
Zhang et al. A fast mathematical programming procedure for simultaneous fitting of assembly components into cryoEM density maps
CN113421610B (zh) 一种分子叠合构象确定方法、装置以及存储介质
Fang et al. Using a distributed SDP approach to solve simulated protein molecular conformation problems
Henzler et al. An integrated approach to knowledge-driven structure-based virtual screening
Zhang et al. Pareto dominance archive and coordinated selection strategy-based many-objective optimizer for protein structure prediction
CN107563080B (zh) 基于gpu的两相介质随机模型并行生成方法、电子设备
Focardi Aperiodic fractional obstacle problems
Zaucha et al. Deep learning model predicts water interaction sites on the surface of proteins using limited-resolution data
Chen et al. Mapreduce based skyline services selection for qos-aware composition
Mucherino et al. An efficient exhaustive search for the discretizable distance geometry problem with interval data
Davis et al. Protein structure determination via an efficient geometric build-up algorithm
CN112289371A (zh) 蛋白质与小分子样本生成及结合能、结合构象预测方法
Wu A note on the refined Strichartz estimates and maximal extension operator
Lu et al. Feasibility and a fast algorithm for Euclidean distance matrix optimization with ordinal constraints
Procacci et al. SAMPL9 blind predictions for toluene/water partition coefficients using nonequilibrium alchemical approaches
CN115910234A (zh) 复合物的配体结合位置评估方法、装置及计算机设备
Potrzebowski et al. Automated determination of fibrillar structures by simultaneous model building and fiber diffraction refinement
Yoshidome et al. An accurate and efficient computation method of the hydration free energy of a large, complex molecule
Puertas-Martín et al. MultiPharm-DT: A Multi-Objective Decision Tool for Ligand-Based Virtual Screening Problems
Bhattacharya et al. Comparison of protein structures by growing neighborhood alignments
Deng et al. Generalized image charge solvation model for electrostatic interactions in molecular dynamics simulations of aqueous solutions
Wahlgren Using GPU-aware message passing to accelerate high-fidelity fluid simulations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant