CN111326218B - 一种基于蛋白环境描述小分子片段属性的指纹设计方法 - Google Patents

一种基于蛋白环境描述小分子片段属性的指纹设计方法 Download PDF

Info

Publication number
CN111326218B
CN111326218B CN202010150513.6A CN202010150513A CN111326218B CN 111326218 B CN111326218 B CN 111326218B CN 202010150513 A CN202010150513 A CN 202010150513A CN 111326218 B CN111326218 B CN 111326218B
Authority
CN
China
Prior art keywords
atoms
atom
protein
fingerprints
small molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010150513.6A
Other languages
English (en)
Other versions
CN111326218A (zh
Inventor
季长鸽
单金文
张增辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN202010150513.6A priority Critical patent/CN111326218B/zh
Publication of CN111326218A publication Critical patent/CN111326218A/zh
Application granted granted Critical
Publication of CN111326218B publication Critical patent/CN111326218B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs

Landscapes

  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于蛋白环境描述小分子片段属性的指纹设计方法,其特点是该方法通过识别蛋白的口袋表层氨基酸原子,计算蛋白口袋原子和对接后的小分子的相互作用关系,及其对应的蛋白原子和小分子原子,设计两种不同描述小分子片段属性的指纹,一种是分别定义蛋白属性指纹和小分子属性指纹一一对应,通过寻找相似蛋白属性指纹找到相似的小分子属性指纹,另一种是根据蛋白环境设计描述整个分子的指纹,通过计算两组指纹的相似性判断两个小分子片段的相似性。本发明与现有技术相比具有快速生成两种指纹,将其应用于实际药物分子的设计和修改过程中,能够快速找到多个相似片段,生成多个新分子,有效的帮助药物化学家快速进行药物分子设计与修改。

Description

一种基于蛋白环境描述小分子片段属性的指纹设计方法
技术领域
本发明涉及计算机辅助药物设计技术领域,具体地说是一种基于蛋白环境描述小分子片段属性的指纹设计方法。
背景技术
在药物设计的整个过程中,对于小分子片段修改是主要的工作之一,其准确有效的修改有利于降低药物开发的成本和减少时间周期。一般情况下,药物化学研究人员在进行药物小分子设计和修改的时候,总是要依靠对小分子结构的观察并结合个人经验对于小分子的一部分官能团进行修饰或者改变。或依靠已有的计算软件,如薛定谔或者LeadIT等提供界面的软件,可以通过手动的方式结合个人经验进行修改。这两类方式都要求过于依赖研究人员的经验,导致效率低下。
现有技术的药物小分子设计和修改过于依赖研究人员的经验,导致效率低下,大大影响了药物化学研究人员更具有目的性的并且更为高效的进行药物分子设计与修饰。
发明内容
本发明的目的是针对现有技术的不足而设计的一种基于蛋白环境描述小分子片段属性的指纹设计方法,采用识别蛋白的口袋表层氨基酸原子,计算蛋白口袋原子和对接后的小分子的相互作用关系所对应的蛋白原子和小分子原子,设计指纹描述小分子的方法,并定义了两种不同的指纹,可根据不同的使用场景,一种是分别定义蛋白属性指纹和小分子属性指纹一一对应,可以通过寻找相似蛋白属性指纹找到相似的小分子属性指纹,另一种是根据蛋白环境设计描述整个分子的指纹,通过计算两组指纹的相似性判断两个小分子片段的相似性,可以快速的生成两种指纹,将这两类指纹应用于实际药物分子的设计和修改过程中,能够快速找到多个相似片段,生成多个新分子,有效的帮助药物化学家快速的进行药物分子设计与修改。
本发明的目的是这样实现的:一种基于蛋白环境描述小分子片段属性的指纹设计方法,其特点是采用识别蛋白的口袋表层氨基酸原子,计算蛋白口袋原子和对接后的小分子的相互作用关系所对应的蛋白原子和小分子原子的方法,设计两种不同描述小分子片段属性的指纹,其具体计算包括以下步骤:
步骤1:从输入的蛋白三维结构中找出蛋白表面原子,根据对接后的蛋白和小分子的三维结构,利用naccess软件计算蛋白三维结构中所有蛋白重原子的相对暴露表面积,并定义距离对接后小分子
Figure BDA0002402281480000021
距离之内的重原子为蛋白口袋表层氨基酸原子集合A。
步骤2:计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用,对于集合A中的原子ai,计算原子ai与小分子原子的相互作用关系;原子ai与小分子原子的相互作用关系主要是氢键相互作用:原子ai为氢键给体,小分子原子为氢键受体或者原子ai为氢键受体,小分子原子为氢键给体,所述原子ai为集合A中第i个原子;所述小分子原子为对接后小分子结构中的所有重原子;所述氢键相互作用形成的具体定义为:要求两原子分别为氢键供体和氢键受体,且两原子间的距离小于
Figure BDA0002402281480000022
供体重原子、供体氢原子、受体重原子三者之间的夹角大于120度。
步骤3:将小分子上所有的氢原子作为连接点,区分出一个连接点和多个连接点的情况,所述一个连接点是指小分子上所有的氢原子相连接的重原子可以作为连接点,并定义为b原子,其相应的氢原子定义为t原子;所述多个连接点一般是以两个连接点为基础,将一个连接点的情况两两组合,任意两个氢原子分别定义为t1、t2,其对应的两个重原子分别定义为b1和b2。
步骤4:根据不同的使用目的设计两类指纹:一类基于数据库搜索的目的,另一类基于相似性计算搜索的目的,根据上述定义的连接点b,氢原子t,及其一一对应的相互作用关系,定义蛋白上能够产生相互作用的原子为pi;小分子上对应的和蛋白产生相互作用的原子为li,两类不同指纹的具体计算如下:
1)一个连接点
第一类指纹计算:计算pi原子和b原子的距离,以及pi与b和t三个原子点所构成的三角形中以b原子为顶点的角度;计算li原子和b原子的距离,以及li与b和t三个原子点所构成的三角形中以b原子为顶点的角度;为描述片段大小,找出距离b原子最远的重原子,其距离标记为LD。
第二类指纹计算:将所有的小分子上能够和蛋白产生相互作用的原子标记为list,分别计算list中所有的原子和b原子的距离,以及list中所有原子和list中其他原子的距离;将距离重新划分归类为一个二十二维度的指纹,其距离大于1,小于等于6,每隔0.5算为一个维度;距离大于6,小于等于10.2,每隔0.6为一个维度;距离大于10.2,小于等于15.2,每个1.0为一个维度。
2)多个连接点
多个连接点可以两个连接点为基础定义指纹,由于两个连接点的两类指纹设计有一个共同之处,定义两个连接点之间的三维空间位置关系,计算两个连接点重原子b1和b2的欧式距离,以及两端连接点重原子和氢原子的角度,其分别为t1、b1、b2的角度和t2、b2、b的角度;计算两个连接点重原子、两个氢原子的二面角,即t1、b1、b2和t2的二面角;两个以上的多个连接点可在两个连接点的基础上进行拓展来定义指纹;
3)两类指纹的集中化处理
将所有连接点的距离放大五倍,所有角度缩小20倍进行两类指纹的集中化处理,所述距离按下述(1)式计算:
Figure BDA0002402281480000031
所述角度按下述(2)式计算:
angle=(AB*BC)/(|AB|*|BC|) (2)
其中:AB为连接原子和属性原子的向量;BC为连接原子和氢原子的向量。
所述第一类指纹计算还包括:因为上述已经定义了小分子片段两个连接点之间的三维空间位置关系,当有一个属性原子时,分别将属性原子与b1,b2原子计算如上述一个连接点时候的指纹即可,即计算两条指纹并记录两次。
所述第二类指纹从小分子片段的相似性出发,除了上述的两个连接点的三维空间位置关系之外,还包括:分别从b1,b2原子计算如上述一个连接点时的第二类指纹,然后合并。
本发明与现有技术相比具有以帮助药物化学研究人员进行药物设计和修改,在进行药物小分子结构修饰的时候,蛋白环境的影响极其重要,如氢键相互作用。因此,本发明在寻找一种可以描述小分子片段的时候,加入蛋白环境的因素,能够更好的贴切实际使用情况,可以有效地替代传统的研究人员的经验,有利于药物化学研究人员更具有目的性的并且更为高效的进行药物分子修饰。
附图说明
图1为本发明流程图;
图2为蛋白口袋氨基酸原子vmd图;
图3为以b原子为顶点的示意图;
图4为蛋白小分子一一对应的指纹结构示意图;
图5为最远距离LD示意图;
图6为计算相似性为目的的指纹结构示意图;
图7两个连接点时空间结构指纹图;
图8数据库搜索的应用结果图;
图9相似性计算的应用结果图。
具体实施方式
本发明通过识别蛋白口袋表层氨基酸原子与结合小分子的相互作用关系,主要是氢键作用关系,将小分子片段分为一个连接点和多个连接点的情况,按照数据库搜索的目的和小分子相似性计算搜索的目的,定义了两种不同的指纹。并根据三维蛋白结构和对接好的小分子结构,设计两种不同描述小分子片段属性的指纹,其具体计算包括以下步骤:
步骤1:从输入的蛋白三维结构中找出蛋白表面原子,根据对接后的小分子的三维结构找出蛋白口袋表层氨基酸原子集合A,所述找出蛋白口袋表层氨基酸原子集合A的方法为:利用naccess软件计算蛋白三维结构中所有蛋白重原子的相对暴露表面积,并定义距离对接后小分子
Figure BDA0002402281480000051
距离之内的重原子为蛋白口袋表层氨基酸原子集合A。
步骤2:计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用,将蛋白和小分子的相互作用属性原子记录为集合B,所述计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用,对于集合A中的原子ai,计算原子ai与小分子原子的相互作用关系;所述原子ai为集合A中第i个原子;所述小分子原子为对接后小分子结构中的所有重原子;所述原子ai与小分子原子的相互作用关系主要是氢键相互作用,其原子ai为氢键给体,小分子原子为氢键受体或原子ai为氢键受体,小分子原子为氢键给体;所述氢键相互作用形成的具体定义为:要求两原子分别为氢键供体和氢键受体,且两原子间的距离小于
Figure BDA0002402281480000052
供体重原子、供体氢原子、受体重原子三者之间的夹角大于120度。
步骤3:将小分子上所有的氢原子作为连接点,区分出一个连接点和多个连接点,所述一个连接点是指小分子上所有的氢原子所连接的重原子可以认为是连接点原子,记录为b原子,同时氢原子可以定义为t原子;所述多个连接点是以两个连接点为基础的,具体是指一个连接点的两两组合,任意两个不相同的氢原子分别定义为t1,t2,其对应的两个重原子分别定义为b1,b2。
步骤4:根据不同的使用目的,按一个连接点和多个连接点的情况,分别设计基于数据库搜索目的和基于相似性计算搜索目的的两类不同指纹,所述设计两类不同指纹是根据连接点b和氢原子t,及其一一对应的相互作用关系,并定义蛋白上能够产生相互作用的原子为pi,小分子上对应的和蛋白产生相互作用的原子为li,其两类不同指纹的具体计算如下:
1)一个连接点
第一类指纹计算包括:确认pi原子和li原子属性的确认,即属于氢键受体还是氢键给体,计算pi原子和b原子的距离,以及pi与b和t三个原子点所构成的三角形中以b原子为顶点的角度;计算li原子和b原子的距离,以及li与b和t三个原子点所构成的三角形中以b原子为顶点的角度;为描述片段大小,找出距离b原子最远的重原子,并标记该距离为LD。
第二类指纹计算包括:将集合B中所有的小分子的原子标记为list,并分别计算list中所有的原子和b原子的距离,以及list中所有原子和list中其他原子的距离,并将距离重新划分归类为一个二十二维度的指纹。
2)多个连接点
多个连接点可以两个连接点为基础定义指纹,由于两个连接点的两类指纹设计有一个共同之处,定义两个连接点之间的三维空间位置关系,计算两个连接点重原子b1和b2的欧式距离,以及两端连接点重原子和氢原子的角度,其分别为t1、b1、b2的角度和t2、b2、b的角度;计算两个连接点重原子、两个氢原子的二面角,即t1、b1、b2和t2的二面角;两个以上的多个连接点可在两个连接点的基础上进行拓展来定义指纹。
3)两类指纹的集中化处理
将所有连接点的距离放大五倍,所有角度缩小20倍进行两类指纹的集中化处理,所述距离按下述(1)式计算:
Figure BDA0002402281480000061
所述角度按下述(2)式计算:
angle=(AB*BC)/(|AB|*|BC|) (2)
其中:AB为连接原子和属性原子的向量;BC为连接原子和氢原子的向量。
所述二十二维度的指纹是将距离大于1,小于等于6,每隔0.5为一个维度,分成十个维度;距离大于6,小于等于10.2,每隔0.6为一个维度,分成七个维度;距离大于10.2,小于等于15.2,每隔1.0为一个维度,分成五个维度。
所述两个连接点的两类指纹设计,其第一类指纹计算,因为已经定义了小分子片段两个连接点之间的三维空间位置关系,当有一个属性原子时,分别将属性原子与b1和b2原子计算如同一个连接点的指纹计算,即计算两条指纹并记录两次;第二类指纹计算从小分子片段的相似性出发,除两个连接点的三维空间位置关系外,还包括:分别从b1和b2原子计算如同一个连接点的第二类指纹计算,然后合并一条指纹。
以下通过具体实施例对本发明作进一步的详细说明。
实施例1
参阅附图1,本发明通过输入蛋白三维结构和对接后的小分子文件,然后识别蛋白口袋表层原子和结合小分子的相互作用关系,分别根据单个连接点和多个连接点计算两类不同的指纹,从而根据不同的目的描述小分子的属性,其具体计算包括下述步骤:
步骤1:参阅附图2,选取蛋白的5v3x口袋vmd图,白色部分为蛋白原配体,从输入的蛋白三维结构中找出蛋白表面原子,根据对接后的蛋白和小分子的三维结构,利用naccess软件计算蛋白三维结构中所有蛋白重原子的相对暴露表面积,并定义距离对接后小分子
Figure BDA0002402281480000071
距离之内的重原子为蛋白口袋表层氨基酸原子集合A。
步骤2:计算蛋白口袋集合A和对接后的小分子的相互作用,对于集合A中的原子ai,计算原子ai与小分子原子的相互作用关系;其中,原子ai具体指集合A中第i个原子,小分子原子具体指对接后小分子结构中的所有重原子;原子ai与小分子原子的相互作用关系主要是氢键相互作用:原子ai为氢键给体,小分子原子为氢键受体或者原子ai为氢键受体,小分子原子为氢键给体。
氢键相互作用形成的具体定义为:要求两原子分别为氢键供体和氢键受体,且两原子间的距离小于
Figure BDA0002402281480000072
供体重原子、供体氢原子、受体重原子三者之间的夹角大于120度。
步骤3:将小分子上所有的氢原子作为连接点,区分出一个连接点的情况和多个连接点的情况,所述一个连接点是指小分子上所有的氢原子都可以定义为t原子,与氢原子连接的重原子定义为b原子;所述多个连接点是以两个连接点为基础,具体是一个连接点的情况两两组合,任意两个氢原子分别定义为t1,t2,对应的两个重原子分别定义为b1,b2。
步骤4:根据不同的使用目的,设计一种用于数据库的搜索,另一种用于相似性的计算的两类指纹,并根据上述定义的连接点b和氢原子t,及其一一对应的相互作用关系,定义:pi为蛋白上能够产生相互作用的原子;li为小分子上对应的和蛋白产生相互作用的原子,两类不同指纹的具体设计如下:
1)一个连接点
a、用于数据库搜索为目的设计指纹(第一类指纹):确认pi原子属性(属于氢键受体还是氢键给体),计算pi原子和b原子的距离;确认li原子属性(属于氢键给体还是氢键受体),计算li原子和b原子的距离。
参阅附图3,分别计算pi(li)原子与b原子和t原子三个原子点所构成的三角形中以b原子为顶点的角度。
参阅附图4a,为蛋白小分子一一对应指纹结构,图中表示的是示例蛋白与小分子形成氢键相互作用的蛋白原子和小分子原子对。
参阅附图4b,设计指纹表示的两个原子的距离和角度定义。
本发明具体计算的指纹示例如下述表1所示:
表1指纹示例
Filename_b Lig_fp Pro_fp
ligand_5 lig-D033015 pro_A025015
ligand_6 lig_A026013 pro_D024012
ligand_6 lig_D047011 pro_A031012
ligand_7 lig_D044009 pro_A036010
ligand_8 lig_D047006 pro_A058006
ligand_9 lig_A028005 pro_D025005
ligand_12 lig_A027010 pro_D027012
参阅附图5,为了描述片段大小,找出距离b原子最远的重原子,图中LD表示的是b原子和小分子上所有重原子的最远距离。
b、计算相似性为目的设计指纹(第二类指纹),其每一位的定义指纹如下述表2所示:
表2自定义指纹结构
Index 00 01 02 03 04 05 06 07 08
Dist (1,1.5] (1.5,2] (2,2.5] (2.5,3] (3,35] (3.5,4] (4,4.5] (4.5,5] (5,5,5]
lndex 09 10 11 12 13 14 15 16 17
Dist (55,6] (6,66] (66,72] (7.2,7.8] (78,8.4] (8.4,90] (90,9.6] (9.6,10.2] (10.2,11.2]
Index 18 19 20 21
Dist (11.2,12.2] (12.2,13.2] (13.2,14.2] (14.2,15.2]
将所有的小分子上能够和蛋白产生相互作用的原子标记为list,分别计算list中所有的原子和b原子的距离,list中所有原子和list中其他原子的距离,将距离重新划分归类为一个22维度的指纹(距离大于1,小于等于6,每隔0.5算作一位;距离大于6,小于等于10.2,每隔0.6算作一位;距离大于10.2,小于等于15.2,每个1.0算作一位,
参阅附图6a,图中表示的具体指纹为小分子与蛋白相互作用的原子标记下来,然后计算小分子上的b原子和属性原子的距离,即为dist1,并将dist1使用上述b步骤的方法重新划分。
参阅附图6b,图中所示的0,1指纹,长度为22,其中第二位是1,其余位置为0,可以记为Fp1,当有多个相互作用对时,需要定义多个Fp,为了保证所有的指纹长度一样,所以提前预制指纹长度,一共是14*22。
2)多个连接点
在多个连接点的情况下两类指纹有一个共同之处,所以多个连接点可以两个连接点为基础进行定义指纹。
参阅附图7,定义两个连接点之间的三维空间位置关系:两个连接点重原子b1,b2的欧式距离;两端连接点重原子和氢原子的角度,分别是t1,b1,b2的角度,t2,b2,b的角度;两个连接点重原子、两个氢原子的二面角,即t1,b1,b2,t2。
本发明具体指纹示例如下述表3所示:
表3指纹实例
Filename_b1_b2 Gid
ligand_5_12 030004005002
ligand_5_13 035004007002
ligand_5_18 033002001006
ligand_6_7 006006005009
ligand_6_8 012007007009
ligand_6_12 036007005002
ligand_6_19 043004007015
所述第一类指纹还包括:因为上述已经定义了小分子片段两个连接点之间的三维空间位置关系,当有一个属性原子时,分别将属性原子与b1,b2原子计算如上述一个连接点时候的指纹即可,即记录两条指纹;所述第二类指纹从小分子片段的相似性出发,除了上述的两个连接点的三维空间位置关系之外,还包括:分别从b1,b2原子计算如上述一个连接点时的第二类指纹,然后合并成一个指纹。
参阅附图8,本发明设计的第一种指纹使用于药物分子的设计和修改,图示中间的小分子为上述5v3x蛋白的原配体,中间结构的阴影部分为预计修改部分,首先对PDBBind数据库使用本发明的第一种指纹预先设计了数据库,然后计算阴影部分的第一种指纹,搜索数据库找到相似的片段,通过空间上坐标的平移旋转,与剩余的部分片段拼接,最后产生200个新分子,选择其中的6个展示在图示中,外围阴影部分就是相似的片段。
参阅附图9,本发明设计的第二种指纹使用于药物分子的设计和修改,为了方便对比,选取和附图7一样的修改片段,首先对所有的chembl数据库使用本发明的第二种指纹预先设计了指纹库,然后计算阴影部分的第二种指纹,计算相似性,选择相似性大于0.5的片段,按照上述的方法拼接新的分子,最后产生200个新分子,选择其中的6个展示在图示中,外围阴影部分就是相似的片段。
上述实施例表明,这两类指纹在药物分子设计的时候都有非常显著的效果,尤其在药物分子修改上有很大的成效。第一类指纹主要是采取穷举所有情况的方法,对于一次传入的蛋白和小分子结构,将蛋白与配体产生的氢键相互作用关系分别对小分子的每一个氢原子出现的位置制作指纹,所有的情况都被计算出来,穷举片段可能出现的所有情况,这样如果在有很多体系的情况下,本发明可以计算所有的体系,将计算出来的结果以数据库的形式储存,帮助药物化学工作者根据蛋白环境进行药物分子设计和修改。第二类指纹主要采取尽可能描述小分子的所有特性,包括产生相互作用,分子空间大小等,当出现新的体系时,可以通过相似性的计算快速找出外形和属性上相似的分子,可以帮助药物化学工作者进行快速的药物分子修改,有利于方向性的药物分子修改。
以上所述仅是对本发明的较佳实施例而已,并非对本专利作任何形式上的限制,凡为本发明等效实施所做的任何简单修改或等同变化与修饰,均应包含于本发明专利的权利要求范围之内。

Claims (7)

1.一种基于蛋白环境描述小分子片段属性的指纹设计方法,其特征在于采用识别蛋白的口袋表层氨基酸原子,计算蛋白口袋原子和对接后的小分子的相互作用关系所对应的蛋白原子和小分子原子的方法,设计两种不同描述小分子片段属性的指纹,其具体计算包括以下步骤:
步骤1:从输入的蛋白三维结构中找出蛋白表面原子,根据对接后的小分子的三维结构找出蛋白口袋表层氨基酸原子集合A;
步骤2:计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用,将蛋白和小分子的相互作用属性原子记录为集合B;
步骤3:将小分子上所有的氢原子作为连接点,区分出一个连接点和多个连接点;
步骤4:根据不同的使用目的,按一个连接点和多个连接点的情况,分别设计基于数据库搜索目的和基于相似性计算搜索目的的两类不同指纹,所述设计两类不同指纹是根据连接点b和氢原子t,及其一一对应的相互作用关系,并定义蛋白上能够产生相互作用的原子为pi,小分子上对应的和蛋白产生相互作用的原子为li,其两类不同指纹的具体计算如下:
1)一个连接点
第一类指纹计算包括:确认pi原子和li原子属性,即属于氢键受体还是氢键给体,计算pi原子和b原子的距离,以及pi与b和t三个原子点所构成的三角形中以b原子为顶点的角度;计算li原子和b原子的距离,以及li与b和t三个原子点所构成的三角形中以b原子为顶点的角度;找出距离b原子最远的重原子,并标记该距离为LD;
第二类指纹计算包括:将集合B中所有的小分子的原子标记为list,并分别计算list中所有的原子和b原子的距离,以及list中所有原子和list中其他原子的距离,并将距离重新划分归类为一个二十二维度的指纹;
2)多个连接点
多个连接点可以两个连接点为基础定义指纹,由于两个连接点的两类指纹设计有一个共同之处,定义两个连接点之间的三维空间位置关系,计算两个连接点重原子b1和b2的欧式距离,以及两端连接点重原子和氢原子的角度,其分别为t1、b1、b2的角度和t2、b2、b的角度;计算两个连接点重原子、两个氢原子的二面角,即t1、b1、b2和t2的二面角;
3)两类指纹的集中化处理
将所有连接点的距离放大五倍,所有角度缩小20倍进行两类指纹的集中化处理,所述距离按下述(1)式计算:
Figure FDA0002402281470000021
所述角度按下述(2)式计算:
angle=(AB*BC)/(|AB|*|BC|) (2)
其中:AB为连接原子和属性原子的向量;BC为连接原子和氢原子的向量。
2.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法,其特征在于所述步骤1中找出蛋白口袋表层氨基酸原子集合A的方法为:利用naccess软件计算蛋白三维结构中所有蛋白重原子的相对暴露表面积,并定义距离对接后小分子
Figure FDA0002402281470000022
距离之内的重原子为蛋白口袋表层氨基酸原子集合A。
3.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法,其特征在于所述步骤2中,计算蛋白口袋表层氨基酸原子集合A和对接后的小分子的相互作用,对于集合A中的原子ai,计算原子ai与小分子原子的相互作用关系;所述原子ai为集合A中第i个原子;所述小分子原子为对接后小分子结构中的所有重原子;所述原子ai与小分子原子的相互作用关系主要是氢键相互作用,其原子ai为氢键给体,小分子原子为氢键受体或原子ai为氢键受体,小分子原子为氢键给体;所述氢键相互作用形成的具体定义为:要求两原子分别为氢键供体和氢键受体,且两原子间的距离小于
Figure FDA0002402281470000031
供体重原子、供体氢原子、受体重原子三者之间的夹角大于120度。
4.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法,其特征在于所述步骤3中的一个连接点是指小分子上所有的氢原子所连接的重原子可以认为是连接点原子,记录为b原子,同时氢原子可以定义为t原子。
5.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法,其特征在于所述步骤3中的所述多个连接点是以两个连接点为基础的,具体是指一个连接点的两两组合,任意两个不相同的氢原子分别定义为t1,t2,其对应的两个重原子分别定义为b1,b2。
6.根据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法,其特征在于所述步骤4中的重新划分归类为一个二十二维度的指纹是将距离大于1,小于等于6,每隔0.5为一个维度;距离大于6,小于等于10.2,每隔0.6为一个维度;距离大于10.2,小于等于15.2,每隔1.0为一个维度。
7.据权利要求1所述基于蛋白环境描述小分子片段属性的指纹设计方法,其特征在于所述步骤4中的两个连接点的两类指纹设计,其第一类指纹当有一个属性原子时,分别将属性原子与b1和b2原子如同一个连接点的指纹计算,即计算两条指纹并记录两次;第二类指纹从小分子片段的相似性出发,除两个连接点的三维空间位置关系外,还包括:分别从b1和b2原子计算如同一个连接点的第二类指纹计算,然后合并成一条指纹。
CN202010150513.6A 2020-03-06 2020-03-06 一种基于蛋白环境描述小分子片段属性的指纹设计方法 Active CN111326218B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010150513.6A CN111326218B (zh) 2020-03-06 2020-03-06 一种基于蛋白环境描述小分子片段属性的指纹设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010150513.6A CN111326218B (zh) 2020-03-06 2020-03-06 一种基于蛋白环境描述小分子片段属性的指纹设计方法

Publications (2)

Publication Number Publication Date
CN111326218A CN111326218A (zh) 2020-06-23
CN111326218B true CN111326218B (zh) 2022-08-05

Family

ID=71167487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010150513.6A Active CN111326218B (zh) 2020-03-06 2020-03-06 一种基于蛋白环境描述小分子片段属性的指纹设计方法

Country Status (1)

Country Link
CN (1) CN111326218B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101169416A (zh) * 2006-10-23 2008-04-30 许洋 用磁珠支持基质及质谱判断质谱多肽谱和蛋白指纹的用途
CN101344900A (zh) * 2008-08-25 2009-01-14 重庆大学 一种新颖碱基和核苷及其衍生物的nmr氢谱化学位移预测方法
CN106446607A (zh) * 2016-09-26 2017-02-22 华东师范大学 基于相互作用指纹和机器学习的药物靶标的虚拟筛选方法
CN107038348A (zh) * 2017-05-04 2017-08-11 四川大学 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CN109994150A (zh) * 2019-03-12 2019-07-09 华东师范大学 一种显性表示蛋白口袋表层原子与配体相互作用满足程度的方法
CN110459274A (zh) * 2019-08-01 2019-11-15 南京邮电大学 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3374371A4 (en) * 2015-11-09 2019-12-11 University of Notre Dame SMALL MOLECULE AFFINITY MEMBRANE PURIFICATION SYSTEMS AND USES THEREOF

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101169416A (zh) * 2006-10-23 2008-04-30 许洋 用磁珠支持基质及质谱判断质谱多肽谱和蛋白指纹的用途
CN101344900A (zh) * 2008-08-25 2009-01-14 重庆大学 一种新颖碱基和核苷及其衍生物的nmr氢谱化学位移预测方法
CN106446607A (zh) * 2016-09-26 2017-02-22 华东师范大学 基于相互作用指纹和机器学习的药物靶标的虚拟筛选方法
CN107038348A (zh) * 2017-05-04 2017-08-11 四川大学 基于蛋白‑配体相互作用指纹图谱的药物靶标预测方法
CN109994150A (zh) * 2019-03-12 2019-07-09 华东师范大学 一种显性表示蛋白口袋表层原子与配体相互作用满足程度的方法
CN110459274A (zh) * 2019-08-01 2019-11-15 南京邮电大学 一种基于深度迁移学习的小分子药物虚拟筛选方法及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于自然语言处理的蛋白质小分子亲和力值预测";欧阳志友,等;《应用科学学报》;20190531;全文 *

Also Published As

Publication number Publication date
CN111326218A (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
Hendlich et al. Relibase: design and development of a database for comprehensive analysis of protein–ligand interactions
CN110957002B (zh) 一种基于协同矩阵分解的药物靶点相互作用关系预测方法
Zhao et al. Data clustering in life sciences
Lu et al. A new recognition model for electronic architectural drawings
CN107545025B (zh) 利用形态学标准查询数据库
Tong et al. Partial order optimum likelihood (POOL): maximum likelihood prediction of protein active site residues using 3D Structure and sequence properties
US20060052943A1 (en) Architectures, queries, data stores, and interfaces for proteins and drug molecules
US11163916B2 (en) Automatic generation of dimension and tolerance information for fastened components
Sabri et al. Semantic pattern-based retrieval of architectural floor plans with case-based and graph-based searching techniques and their evaluation and visualization
CN101059335A (zh) 三维空间连杆曲线匹配度的检测方法
Zhang et al. Collision-free planning algorithm of motion path for the robot belt grinding system
CN107657146A (zh) 基于三维子结构的药物分子比较方法
US20080126307A1 (en) Method for recognizing feature of 3D solid model
Ellingson et al. Protein surface matching by combining local and global geometric information
CN111326218B (zh) 一种基于蛋白环境描述小分子片段属性的指纹设计方法
Alfatemi et al. Patient subgrouping with distinct survival rates via integration of multiomics data on a Grassmann manifold
Korbi et al. A CAD model for the tolerancing of mechanical assemblies considering non-rigid joints between parts with defects
JP6947503B2 (ja) 量子化を用いた3dオブジェクトの位置特定
Xin et al. A tool path optimization approach based on blend feature simplification for multi-cavity machining of complex parts
CN111402966B (zh) 一种基于小分子三维结构描述小分子片段属性的指纹设计方法
Plewczynski et al. AutoMotif Server for prediction of phosphorylation sites in proteins using support vector machine: 2007 update
Lu et al. Machine tool movement control method combining the benefit of software and real-time interpolator for sculpture surface machining
Yin et al. Geometric mouldability analysis by geometric reasoning and fuzzy decision making
Li et al. An analysis-oriented parameter extraction method for features on freeform surface
Shunmugam et al. Automatic flat pattern development of sheet metal components from orthographic projections

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant