CN107657146B - 基于三维子结构的药物分子比较方法 - Google Patents

基于三维子结构的药物分子比较方法 Download PDF

Info

Publication number
CN107657146B
CN107657146B CN201710852115.7A CN201710852115A CN107657146B CN 107657146 B CN107657146 B CN 107657146B CN 201710852115 A CN201710852115 A CN 201710852115A CN 107657146 B CN107657146 B CN 107657146B
Authority
CN
China
Prior art keywords
query
substructure
molecules
substructures
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710852115.7A
Other languages
English (en)
Other versions
CN107657146A (zh
Inventor
徐峻
利秀明
严鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Iprexmed Technology Co ltd
Original Assignee
Guangzhou Iprexmed Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Iprexmed Technology Co ltd filed Critical Guangzhou Iprexmed Technology Co ltd
Priority to CN201710852115.7A priority Critical patent/CN107657146B/zh
Publication of CN107657146A publication Critical patent/CN107657146A/zh
Application granted granted Critical
Publication of CN107657146B publication Critical patent/CN107657146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs

Landscapes

  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于三维子结构的药物分子比较方法,涉及药物分子的设计与筛选技术领域。所述方法包括如下步骤:读入库分子的二维或三维结构信息,得到库分子的子结构匹配原子序列;读入查询分子和库分子的三维结构信息,以及查询子结构的相关信息,分别计算查询分子、库分子各自子结构的自身重叠体积与各自边链的自身重叠体积;计算查询分子和库分子多种叠合情况下的重叠体积;分别计算查询分子和库分子子结构相似度。所述方法能提高分子形状比较的灵活性,更利于先导化合物的发现,可应用于药物分子的虚拟筛选。

Description

基于三维子结构的药物分子比较方法
技术领域
本发明涉及药物分子的设计与筛选技术领域,特别是一种基于三维子结构的药物分子比较方法。
背景技术
二维结构不相似的分子可能由于拥有相同或相似的子结构而具有相同或相似的生物活性。针对分子的二维子结构搜索,最大公用子结构算法GMA(Journal of chemicalinformation and computer sciences,1996,36(1):25-34.)可以实现,得到以分子中原子序号标识的子结构原子序列;
药物分子的生物活性主要取决于其三维结构,一种基于加权高斯函数的分子叠合算法WEGA(Journal of chemical information and modeling,2013,53(8):1967-1978.)可以实现分子的三维形状定量比较,每个加权高斯球对应一个原子,以所有加权高斯球体积的加和作为分子的体积,采用多个起始叠合情况,寻求全局最大叠合体积。
运用上述两种方法进行药物分子形状比较的主要缺陷是:GMA算法只能进行二维子结构的检索,无法满足三维子结构检索和比较的需求;而WEGA算法没有考虑子结构部分对生物活性的重要性。
发明内容
本发明所要解决的技术问题是如何提供一种基于三维子结构的药物分子比较方法,所述方法可以更有效地利用分子的结构信息。
为解决上述技术问题,本发明所采取的技术方案是:一种基于三维子结构的药物分子比较方法,其特征在于,所述方法包括如下步骤:
读入库分子的二维或三维结构信息,定义查询子结构,得到库分子的子结构匹配原子序列;
读入查询分子和库分子的三维结构信息,以及查询子结构的相关信息,分别计算查询分子、库分子各自子结构的自身重叠体积与各自边链的自身重叠体积;
计算查询分子和库分子多种叠合情况下的重叠体积;
根据查询分子子结构的自身重叠体积和边链的自身重叠体积,库分子子结构的自身重叠体积和边链的自身重叠体积和两分子的子结构及边链的叠合体积,分别计算查询分子和库分子子结构相似度,以及边链相似度,以子结构相似度和边链相似度作为两分子的综合相似度,当库分子匹配子结构有多个时,比较各个匹配子结构下两分子综合相似度,选择其中最大值作为两分子的综合相似度。
进一步的技术方案在于,所述的读入库分子的二维或三维结构信息,定义查询子结构,得到库分子的子结构匹配原子序列的方法如下:
由查询分子中定义子结构为查询子结构,定义的子结构为一个或多个,得到查询子结构原子序列;
读入查询子结构的结构信息,所述结构信息包括查询子结构中每个原子和键的类型;
读入库分子的二维或三维结构信息,所述二维或三维结构信息包括库分子中每个原子和键的类型;
使用GMA算法得到库分子的子结构匹配原子序列。
进一步的技术方案在于:定义的查询子结构为多个时,且定义的查询子结构之间不允许有重叠,使用GMA算法得到库分子的子结构匹配原子序列后,判断库分子多个子结构匹配原子序列中有无重复原子,舍弃有重复原子的序列,只保留相互无重复原子的多个子结构匹配序列;将相互无重复原子的多个子结构匹配序列合并为一个子结构序列,即视为一个子结构。
进一步的技术方案在于:当定义的查询子结构为一个时,再定义一个或多个外源子结构,且外源子结构即是不在查询分子中,但能与查询子结构有相似功能的子结构,使用GMA算法得到库分子的与查询子结构或外源子结构对应的子结构匹配原子序列后,无需判断所有匹配原子序列中有无重复原子;外源子结构将视为单独的子结构,在相应的步骤中,将由外源子结构匹配得到的综合相似度与由查询子结构匹配的综合相似度比较得到综合相似度最好的结果。
进一步的技术方案在于:在匹配的过程中默认的是子结构精确匹配,当库分子中没有精确匹配的子结构时,选择继续进行泛匹配,得到更多的子结构匹配序列;泛匹配规则如下:将查询子结构中所有非碳非氢原子改为通配符Q;若库分子仍无匹配,将查询子结构中所有非碳非氢原子改为通配符Q,查询子结构中所有类型的键改为任意键;若库分子仍无匹配,将查询子结构中所有非碳非氢原子改为通配符Q,所有碳原子改为通配符A。
进一步的技术方案在于,所述读入查询分子和库分子的三维结构信息,以及查询子结构的相关信息,分别计算查询分子、库分子各自子结构的自身重叠体积与各自边链的自身重叠体积的方法如下:
读入查询分子的三维结构信息,所述三维结构信息包括查询分子中每个原子的类型及其坐标数值;
读入查询子结构的相关信息,所述相关信息为每个查询子结构的原子个数以及原子序列;
计算查询分子中子结构原子的叠合权重wc,查询分子中边链原子的权重为ws
计算查询分子子结构的自身重叠体积和边链的自身重叠体积,
Figure BDA0001413732610000041
Figure BDA0001413732610000042
为查询分子子结构原子的加权高斯球体积,
Figure BDA0001413732610000043
Figure BDA0001413732610000044
为查询分子边链原子的加权高斯球体积,qc表示查询分子子结构的所有加权高斯球的集合,qs表示查询分子边链的所有加权高斯球的集合,并将两者加和vqc+vqs作为查询分子的自身重叠体积;
读入库分子的三维结构信息,所述三维结构信息包括库分子中每个原子的类型及其坐标数值;
计算库分子中子结构原子的叠合权重w′c,库分子中边链原子的权重为w′s
计算库分子子结构的自身重叠体积和边链的自身重叠体积,
Figure BDA0001413732610000051
Figure BDA0001413732610000052
为库分子子结构原子的加权高斯球体积,
Figure BDA0001413732610000053
Figure BDA0001413732610000054
为库分子边链原子的加权高斯球体积,dc表示库分子子结构的所有加权高斯球的集合,ds表示库分子边链的所有加权高斯球的集合,并将两者加和vdc+vds作为库分子的自身重叠体积。
进一步的技术方案在于,计算查询分子中子结构原子的叠合权重wc的计算公式为:
Figure BDA0001413732610000055
其中nq为查询分子的原子总数,nc为查询子结构的原子个数;查询分子边链叠合权重ws=1.0;
库分子中子结构原子的叠合权重w′c的计算公式为:
Figure BDA0001413732610000056
其中nd为库分子的原子总数,n′c为子结构的原子个数,库分子边链叠合权重w′s=1.0。
进一步的技术方案在于,所述的计算查询分子和库分子多种叠合情况下的重叠体积VC的方法如下:
Figure BDA0001413732610000057
Figure BDA0001413732610000058
表示查询分子子结构中第i个加权高斯球和库分子子结构中第j个加权高斯球的叠合体积;两边链的重叠体积计算公式如下:
Figure BDA0001413732610000061
Figure BDA0001413732610000062
表示查询分子边链中第i个加权高斯球和库分子边链中第j个加权高斯球的叠合体积,并将两者加和Vc max+Vs max,选择其中最大值作为两分子的重叠体积。
进一步的技术方案在于,将查询分子的子结构重心和库分子子结构的重心作为叠合中心,将两分子进行起始叠合,计算查询分子和库分子在多种叠合情况下的重叠体积。
进一步的技术方案在于,所述的综合相似度比较规则如下:设定某一阈值,在两个子结构相似度之差大于该阈值时,选择较大的子结构相似度与其对应的边链相似度;在两个子结构相似度之差不大于该阈值时,选择较大的边链相似度与其对应的子结构相似度,将此得到的综合相似度
Figure BDA0001413732610000063
Figure BDA0001413732610000064
作为两个分子的比较结果。
采用上述技术方案所产生的有益效果在于:本发明所述方法能提高分子形状比较的灵活性,更利于先导化合物的发现,可应用于药物分子的虚拟筛选。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为通配符匹配流程图;
图2为只定义一个查询子结构时两分子综合相似度的比较流程图;
图3为定义多个查询子结构时两分子综合相似度的比较流程图;
图4为定义一个查询子结构以及一个或多个外源子结构时分子综合相似度的比较流程图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
本发明提出的一种基于三维子结构的药物分子比较方法能提高分子形状比较的灵活性,可以更有效地利用分子的结构信息。对于WEGA算法中提出的加权高斯球计算方法保持不变,对子结构部分的各原子赋予相应的叠合权重因子,使得两分子叠合过程中,子结构部分得到较大的叠合。本发明提出以下方法计算权重:
Figure BDA0001413732610000071
其中n为分子的原子总数,nc为子结构的原子个数。分子中除子结构部分外其余部分定义为边链结构,ws=1.0。
实施例一:只定义一个查询子结构时两分子综合相似度的比较
如图1所示,本发明所述方法包括如下步骤:
步骤(1),读入库分子的二维或三维结构信息,定义查询子结构,得到库分子的子结构匹配原子序列,具体包括:
由查询分子中定义子结构为查询子结构,定义的子结构可以为一个或多个,得到查询子结构原子序列;
读入查询子结构的结构信息,所述结构信息包括查询子结构中每个原子和键的类型;
读入库分子的二维或三维结构信息,所述二维或三维结构信息包括库分子中每个原子和键的类型;
使用GMA算法得到库分子的子结构匹配原子序列。
默认的是子结构精确匹配,当库分子中没有精确匹配的子结构时,可选择继续进行泛匹配,得到更多的子结构匹配序列。泛匹配规则如下:将查询子结构中所有非碳非氢原子改为通配符Q;若库分子仍无匹配,将查询子结构中所有非碳非氢原子改为通配符Q,查询子结构中所有类型的键改为任意键;若库分子仍无匹配,将查询子结构中所有非碳非氢原子改为通配符Q,所有碳原子改为通配符A;
通配符匹配流程如图2所示;
步骤(2),系统读入查询分子和库分子的三维结构信息,以及查询子结构的相关信息,分别计算查询分子、库分子各自子结构的自身重叠体积与各自边链的自身重叠体积,具体包括:
读入查询分子的三维结构信息,所述三维结构信息包括查询分子中每个原子的类型及其坐标数值;
读入查询子结构的相关信息,所述相关信息为每个查询子结构的原子个数以及原子序列;
计算查询分子中子结构原子的叠合权重wc,边链原子(除子结构外的其他原子)的权重为ws
查询分子子结构叠合权重的计算方式为:
Figure BDA0001413732610000081
其中nq为查询分子的原子总数,nc为查询子结构的原子个数;查询分子边链叠合权重ws=1.0;
计算查询分子子结构的自身重叠体积和边链的自身重叠体积,
Figure BDA0001413732610000091
Figure BDA0001413732610000092
为查询分子子结构原子的加权高斯球体积,
Figure BDA0001413732610000093
Figure BDA0001413732610000094
为查询分子边链原子的加权高斯球体积,qc表示查询分子子结构的所有加权高斯球的集合,qs表示查询分子边链的所有加权高斯球的集合,并将两者加和vqc+vqs作为查询分子的自身重叠体积;
读入库分子的三维结构信息,所述三维结构信息包括库分子中每个原子的类型及其坐标数值;
计算库分子中子结构原子的叠合权重w′c,边链原子(除子结构外的其他原子)的权重为w′s
库分子子结构叠合权重的计算方式为:
Figure BDA0001413732610000095
其中nd为库分子的原子总数,n′c为子结构的原子个数;库分子边链叠合权重w′s=1.0;
计算库分子子结构的自身重叠体积和边链的自身重叠体积,
Figure BDA0001413732610000096
Figure BDA0001413732610000097
为库分子子结构原子的加权高斯球体积,
Figure BDA0001413732610000098
Figure BDA0001413732610000099
为库分子边链原子的加权高斯球体积,dc表示库分子子结构的所有加权高斯球的集合,ds表示库分子边链的所有加权高斯球的集合,并将两者加和vdc+vds作为库分子的自身重叠体积。
步骤(3),将查询分子的子结构重心和库分子子结构的重心(子结构各原子的平均位置)作为叠合中心,将两分子进行起始叠合,计算查询分子和库分子在WEGA算法所述的多种叠合情况下的重叠体积,其中两子结构的重叠体积计算如下:所述的计算查询分子和库分子多种叠合情况下的重叠体积Vc的方法如下:
Figure BDA0001413732610000101
Figure BDA0001413732610000102
表示查询分子子结构中第i个加权高斯球和库分子子结构中第j个加权高斯球的叠合体积;两边链的重叠体积计算公式如下:
Figure BDA0001413732610000103
Figure BDA0001413732610000104
表示查询分子边链中第i个加权高斯球和库分子边链中第j个加权高斯球的叠合体积,并将两者加Vc+Vs,选择其中最大值Vc max+Vs max作为两分子的重叠体积;
步骤(4),根据查询分子子结构的自身重叠体积和边链的自身重叠体积,库分子子结构的自身重叠体积和边链的自身重叠体积和两分子的子结构及边链的最大叠合体积,分别计算查询分子和库分子子结构相似度,以及边链相似度;以子结构相似度和边链相似度作为两分子的综合相似度;
当库分子匹配子结构有多个时,比较各个匹配子结构下两分子综合相似度,选择其中最大值作为两分子的综合相似度;
设定某一阈值(默认为0.03,可根据实际需要自由设定),在两个子结构相似度之差大于该阈值时,选择较大的子结构相似度与其对应的边链相似度;在两个子结构相似度之差不大于该阈值时,选择较大的边链相似度与其对应的子结构相似度。将此得到的综合相似度
Figure BDA0001413732610000111
Figure BDA0001413732610000112
作为两个分子的比较结果。
阈值可根据具体需求而加以设定,子结构相似度相差越大,子结构在分子中的重要性应越小。
实施例二:定义多个查询子结构时两分子综合相似度的比较,如图3所示。
定义的查询子结构为多个时,在定义时多个查询子结构间不能重叠。使用GMA算法得到库分子的子结构匹配原子序列后,判断库分子多个子结构匹配原子序列中有无重复原子,舍弃有重复原子的序列,只保留相互无重复原子的多个子结构匹配序列;将相互无重复原子的多个子结构匹配序列合并为一个子结构序列,即视为一个子结构,采用实施例一的方式找到库分子所有符合的子结构匹配原子序列,计算两分子各自子结构的自身重叠体积与各自边链的自身重叠体积以及两分子最大重叠体积,最后进行综合相似度比较。
实施例三:定义一个查询子结构以及一个或多个外源子结构时分子综合相似度的比较,如图4所示。
当定义的查询子结构为一个时,可再定义一个或多个外源子结构(外源子结构即是不在查询分子中,但能与查询子结构有相似功能的子结构),使用GMA算法得到库分子的与查询子结构或外源子结构对应的子结构匹配原子序列后,无需判断所有匹配原子序列中有无重复原子。外源子结构将视为单独的子结构,采用实施例一的方式继续进行库分子子结构匹配,采用实施例一的方式找到库分子所有符合的子结构匹配原子序列,计算两分子各自子结构的自身重叠体积与各自边链的自身重叠体积以及两分子最大重叠体积,将由外源子结构匹配得到的综合相似度与由查询子结构匹配的综合相似度比较得到综合相似度最好的结果。

Claims (9)

1.一种基于三维子结构的药物分子比较方法,其特征在于,所述方法包括如下步骤:
读入库分子的二维或三维结构信息,定义查询子结构,得到库分子的子结构匹配原子序列;
读入查询分子和库分子的三维结构信息,以及查询子结构的相关信息,分别计算查询分子、库分子各自子结构的自身重叠体积与各自边链的自身重叠体积;
计算查询分子和库分子多种叠合情况下的重叠体积;
根据查询分子子结构的自身重叠体积和边链的自身重叠体积,库分子子结构的自身重叠体积和边链的自身重叠体积和两分子的子结构及边链的叠合体积,分别计算查询分子和库分子子结构相似度,以及边链相似度,以子结构相似度和边链相似度作为两分子的综合相似度,当库分子匹配子结构有多个时,比较各个匹配子结构下两分子综合相似度,选择其中最大值作为两分子的综合相似度;
其中,所述读入查询分子和库分子的三维结构信息,以及查询子结构的相关信息,分别计算查询分子、库分子各自子结构的自身重叠体积与各自边链的自身重叠体积的方法如下:
读入查询分子的三维结构信息,所述三维结构信息包括查询分子中每个原子的类型及其坐标数值;
读入查询子结构的相关信息,所述相关信息为每个查询子结构的原子个数以及原子序列;
计算查询分子中子结构原子的叠合权重wc,查询分子中边链原子的权重为ws
计算查询分子子结构的自身重叠体积和边链的自身重叠体积,
Figure FDA0002359386500000021
Figure FDA0002359386500000022
为查询分子子结构原子的加权高斯球体积,
Figure FDA0002359386500000023
Figure FDA0002359386500000024
为查询分子边链原子的加权高斯球体积,qc表示查询分子子结构的所有加权高斯球的集合,qs表示查询分子边链的所有加权高斯球的集合,并将两者加和vqc+vqs作为查询分子的自身重叠体积;
读入库分子的三维结构信息,所述三维结构信息包括库分子中每个原子的类型及其坐标数值;
计算库分子中子结构原子的叠合权重w′c,库分子中边链原子的权重为w′s
计算库分子子结构的自身重叠体积和边链的自身重叠体积,
Figure FDA0002359386500000025
Figure FDA0002359386500000026
为库分子子结构原子的加权高斯球体积,
Figure FDA0002359386500000027
Figure FDA0002359386500000028
为库分子边链原子的加权高斯球体积,dc表示库分子子结构的所有加权高斯球的集合,ds表示库分子边链的所有加权高斯球的集合,并将两者加和vdc+vds作为库分子的自身重叠体积。
2.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于,所述的读入库分子的二维或三维结构信息,定义查询子结构,得到库分子的子结构匹配原子序列的方法如下:
由查询分子中定义子结构为查询子结构,定义的子结构为一个或多个,得到查询子结构原子序列;
读入查询子结构的结构信息,所述结构信息包括查询子结构中每个原子和键的类型;
读入库分子的二维或三维结构信息,所述二维或三维结构信息包括库分子中每个原子和键的类型;
使用GMA算法得到库分子的子结构匹配原子序列。
3.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于:
定义的查询子结构为多个时,且定义的查询子结构之间不允许有重叠,使用GMA算法得到库分子的子结构匹配原子序列后,判断库分子多个子结构匹配原子序列中有无重复原子,舍弃有重复原子的序列,只保留相互无重复原子的多个子结构匹配序列;将相互无重复原子的多个子结构匹配序列合并为一个子结构序列,即视为一个子结构。
4.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于:
当定义的查询子结构为一个时,再定义一个或多个外源子结构,且外源子结构即是不在查询分子中,但能与查询子结构有相似功能的子结构,使用GMA算法得到库分子的与查询子结构或外源子结构对应的子结构匹配原子序列后,无需判断所有匹配原子序列中有无重复原子;外源子结构将视为单独的子结构,在相应的步骤中,将由外源子结构匹配得到的综合相似度与由查询子结构匹配的综合相似度比较得到综合相似度最好的结果。
5.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于:在匹配的过程中默认的是子结构精确匹配,当库分子中没有精确匹配的子结构时,选择继续进行泛匹配,得到更多的子结构匹配序列;泛匹配规则如下:将查询子结构中所有非碳非氢原子改为通配符Q;若库分子仍无匹配,将查询子结构中所有非碳非氢原子改为通配符Q,查询子结构中所有类型的键改为任意键;若库分子仍无匹配,将查询子结构中所有非碳非氢原子改为通配符Q,所有碳原子改为通配符A。
6.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于:计算查询分子中子结构原子的叠合权重wc的计算公式为:
Figure FDA0002359386500000041
其中nq为查询分子的原子总数,nc为查询子结构的原子个数;查询分子边链叠合权重ws=1.0;
库分子中子结构原子的叠合权重w′c的计算公式为:
Figure FDA0002359386500000042
其中nd为库分子的原子总数,n′c为子结构的原子个数,库分子边链叠合权重w's=1.0。
7.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于,所述的计算查询分子和库分子多种叠合情况下的重叠体积VC的方法如下:
Figure FDA0002359386500000051
Figure FDA0002359386500000052
表示查询分子子结构中第i个加权高斯球和库分子子结构中第j个加权高斯球的叠合体积;两边链的重叠体积计算公式如下:
Figure FDA0002359386500000053
Figure FDA0002359386500000054
表示查询分子边链中第i个加权高斯球和库分子边链中第j个加权高斯球的叠合体积,并将两者加和Vc max+Vs max,选择其中最大值作为两分子的重叠体积。
8.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于:将查询分子的子结构重心和库分子子结构的重心作为叠合中心,将两分子进行起始叠合,计算查询分子和库分子在多种叠合情况下的重叠体积。
9.如权利要求1所述的基于三维子结构的药物分子比较方法,其特征在于:
所述的综合相似度比较规则如下:设定某一阈值,在两个子结构相似度之差大于该阈值时,选择较大的子结构相似度与其对应的边链相似度;在两个子结构相似度之差不大于该阈值时,选择较大的边链相似度与其对应的子结构相似度,将此得到的综合相似度
Figure FDA0002359386500000055
Figure FDA0002359386500000056
作为两个分子的比较结果。
CN201710852115.7A 2017-09-20 2017-09-20 基于三维子结构的药物分子比较方法 Active CN107657146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710852115.7A CN107657146B (zh) 2017-09-20 2017-09-20 基于三维子结构的药物分子比较方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710852115.7A CN107657146B (zh) 2017-09-20 2017-09-20 基于三维子结构的药物分子比较方法

Publications (2)

Publication Number Publication Date
CN107657146A CN107657146A (zh) 2018-02-02
CN107657146B true CN107657146B (zh) 2020-05-05

Family

ID=61130885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710852115.7A Active CN107657146B (zh) 2017-09-20 2017-09-20 基于三维子结构的药物分子比较方法

Country Status (1)

Country Link
CN (1) CN107657146B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573123B (zh) * 2018-05-09 2021-07-30 深圳晶泰科技有限公司 药物晶体结构全景分析系统及其全景分析方法
CN108875298B (zh) * 2018-06-07 2019-06-07 北京计算科学研究中心 基于分子形状匹配的药物筛选方法
CN109637673A (zh) * 2018-12-18 2019-04-16 广州市爱菩新医药科技有限公司 一种药物虚拟筛选方法
CN109712677A (zh) * 2018-12-21 2019-05-03 广州市爱菩新医药科技有限公司 基于数据库的三维结构检索方法、电子设备及存储介质
CN114417986A (zh) * 2022-01-11 2022-04-29 平安科技(深圳)有限公司 基于人工智能的药物特征信息确定方法及装置
CN114530215B (zh) * 2022-02-18 2023-03-28 北京有竹居网络技术有限公司 设计配体分子的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2383945A1 (en) * 1999-10-08 2001-04-19 Li Shen Compositions and methods for detecting protein modification and enzymatic activity
CN1670754A (zh) * 2004-07-09 2005-09-21 清华大学 基于平均场退火技术的蛋白质的立体结构比对方法
CN102799779A (zh) * 2012-07-16 2012-11-28 中山大学 一种分子体积计算方法及两分子的形状比较方法
CN105488358A (zh) * 2015-12-01 2016-04-13 大连大学 基于互相关系数的rna二级结构序列相似性表达方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2383945A1 (en) * 1999-10-08 2001-04-19 Li Shen Compositions and methods for detecting protein modification and enzymatic activity
CN1670754A (zh) * 2004-07-09 2005-09-21 清华大学 基于平均场退火技术的蛋白质的立体结构比对方法
CN102799779A (zh) * 2012-07-16 2012-11-28 中山大学 一种分子体积计算方法及两分子的形状比较方法
CN105488358A (zh) * 2015-12-01 2016-04-13 大连大学 基于互相关系数的rna二级结构序列相似性表达方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《TOP: a new method for protein structure comparisons and similarity searches》;Lu GG et al;《Journal of Applied Crystallography》;20000229;第33卷;摘要,正文第2.5部分 *
《可视化搜索用户界面》;汪飞等;《计算机辅助设计与图形学学报》;20140531;第26卷(第5期);全文 *
张琦.《 基于三维结构的蛋白质相似性判定方法研究》.《中国优秀硕士学位论文全文数据库信息科技辑》.2010,(第2010年第5期),第I138-647页. *

Also Published As

Publication number Publication date
CN107657146A (zh) 2018-02-02

Similar Documents

Publication Publication Date Title
CN107657146B (zh) 基于三维子结构的药物分子比较方法
Meesrikamolkul et al. Shape-based clustering for time series data
Ouyang et al. Cscore: a simple yet effective scoring function for protein–ligand binding affinity prediction using modified cmac learning architecture
Vassiliev et al. Consensus drug design using IT microcosm
Yao et al. Denoising protein–protein interaction network via variational graph auto-encoder for protein complex detection
Tarsitano A computational study of several relocation methods for k-means algorithms
Hu et al. Prediction of hot regions in protein–protein interaction by combining density-based incremental clustering with feature-based classification
Gobbi et al. Atom-Atom-Path similarity and Sphere Exclusion clustering: tools for prioritizing fragment hits
Muflikhah et al. DNA sequence of hepatitis B virus clustering using hierarchical k-means algorithm
Armstrong et al. Molecular similarity including chirality
Cahyaningrum et al. Implementation of spectral clustering with partitioning around medoids (PAM) algorithm on microarray data of carcinoma
Chandran et al. An improved clustering algorithm based on K-means and harmony search optimization
Gullo et al. Multiobjective optimization of co-clustering ensembles
Heravi et al. Intelligent and fast recognition of heart disease based on synergy of‎ linear neural network and logistic regression model
Dhanik et al. Auto dock-based incremental docking protocol to improve docking of large ligands
Kung et al. Symmetric and asymmetric multi-modality biclustering analysis for microarray data matrix
CN104951501A (zh) 一种基于粒子群算法的大数据智能搜索算法
KR20170017231A (ko) 암과 연관성이 높은 유전자-마이크로 rna 모듈 식별을 위한 접근방법
Gao et al. Finding frequent approximate subgraphs in medical image database
Smith et al. Scalable analysis of multi-modal biomedical data
CN111326218B (zh) 一种基于蛋白环境描述小分子片段属性的指纹设计方法
Lipinski-Paes et al. MASTERS: A general sequence-based MultiAgent System for protein TERtiary Structure prediction
Gao et al. On the Bayesian derivation of a treatment-based cancer ontology
Chen et al. Silhouette index supervised affinity propagation clustering
US20240152668A1 (en) Methods and models for direct molecular conformation generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant