CN113284553A - 一种用于治疗药物成瘾的药物靶点结合能力测试方法 - Google Patents

一种用于治疗药物成瘾的药物靶点结合能力测试方法 Download PDF

Info

Publication number
CN113284553A
CN113284553A CN202110590269.XA CN202110590269A CN113284553A CN 113284553 A CN113284553 A CN 113284553A CN 202110590269 A CN202110590269 A CN 202110590269A CN 113284553 A CN113284553 A CN 113284553A
Authority
CN
China
Prior art keywords
drug
target
target protein
compound
binding capacity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110590269.XA
Other languages
English (en)
Other versions
CN113284553B (zh
Inventor
胡贞贞
邱天云
王勇胜
卢明芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang University
Original Assignee
Nanchang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang University filed Critical Nanchang University
Priority to CN202110590269.XA priority Critical patent/CN113284553B/zh
Publication of CN113284553A publication Critical patent/CN113284553A/zh
Application granted granted Critical
Publication of CN113284553B publication Critical patent/CN113284553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明公开了一种用于治疗药物成瘾的药物靶点结合能力测试方法,包括以下步骤:步骤1:获取成瘾药物化合物和靶点蛋白质数据;通过直接对成瘾药物化合物和靶点蛋白质数据就那些获取,再根据成瘾药物化合物和靶点蛋白质的特性进行数据结合,进而使测试的过程更加直观,并且基于二维指纹的深度神经网络评估治疗药物特性并进行筛选,使测试数据更加完善,对治疗药物成瘾具有较大意义;并且使成瘾药物再与靶点蛋白先进行结合,在受到成瘾药物的影响下对治疗药物进行筛选和与靶点蛋白结合能力进行测试,进而使经过筛选的治疗药物与靶点蛋白的结合能力相对于正常情况下的结合能力较强,进而使研发的治疗药物结合能力更强。

Description

一种用于治疗药物成瘾的药物靶点结合能力测试方法
技术领域
本发明属于生物医学技术领域,具体涉及一种用于治疗药物成瘾的药物靶点结合能力测试方法。
背景技术
成瘾性药物是指临床上常用的麻醉、镇痛、抗焦虑、抗抑郁的一些处方药;这些药物在医生指导下合理使用具有很好的疗效,但足若过量使用会使人产生欣快感,连续使用会产生严重的躯体依赖性和心理依赖性,停药会导致生理功能紊乱,出现戒断症状。
药物靶点是指药物在体内的作用结合位点,包括基因位点、受体、酶、离子通道、核酸等生物大分子。选择确定新颖的有效药靶是新药开发的首要任务;迄今已发现作为治疗药物靶点的总数约500个,其中受体尤其是G-蛋白偶联的受体靶点占绝大多数,另还有酶、抗菌、抗病毒、抗寄生虫药的作用靶点;合理化药物设计可以依据生命科学研究中所揭示的包括酶、受体、离子通道、核酸等潜在的药物作用靶位,或其内源性配体以及天然底物的化学结构特征来设计药物分子,以发现选择性作用于靶点的新药。
目前药物成瘾过程中,脱毒治疗只是整个治疗过程中的第一步,主要以药物等其他医学治疗手段为主,主要目的是帮助患者躯体上脱离对成瘾物质的依赖状态,消除或减少躯体戒断症状,是完成药物成瘾治疗的前提与基础;成瘾药物作用于药物靶点后,药物分子通过结合自由能与生物体内的靶点产生相互作用,影响相应生物大分子的功能,在药物治疗过程中需要使治疗药物与作用于靶点的成瘾药物相互反应,进而对生物代谢进行调整,并且要保证治疗药物与靶点的结合能力,为此提出一种用于治疗药物成瘾的药物靶点结合能力测试方法,用于测试治疗药物与靶点的结合能力,对研发结合能力较强的治疗药物具有重要意义。
发明内容
本发明要解决的技术问题是克服现有的缺陷,提供一种用于治疗药物成瘾的药物靶点结合能力测试方法,以解决上述背景技术中提出的在药物治疗过程中需要使治疗药物与作用于靶点的成瘾药物相互反应,并且要保证治疗药物与靶点的结合能力的问题。
为实现上述目的,本发明提供如下技术方案:一种用于治疗药物成瘾的药物靶点结合能力测试方法,包括以下步骤:
步骤1:获取成瘾药物化合物和靶点蛋白质数据;
步骤2:对成瘾药物化合物和靶点蛋白质数据进行处理;
步骤3:分别对成瘾药物化合物和靶点蛋白质的特性进行提取;
步骤4:对成瘾药物化合物和靶点蛋白质进行结合,获取成瘾药物与靶点蛋白的融合数据;
步骤5:基于二维指纹的深度神经网络评估治疗药物特性并进行筛选;
步骤6:建立MathPose和MathDL模型进行结合能力测试。
优选的,所述步骤1中分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据。
优选的,所述步骤2中利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码。
优选的,所述步骤3包括以下步骤:
步骤3.1:构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示;
步骤3.2:构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y。
优选的,所述步骤4包括以下步骤:
步骤4.1:将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合;
步骤4.2:构建融合后的LSTM模型,提取融合后的蛋白质特征向量XY。
优选的,所述步骤5包括以下步骤:
步骤5.1:以成瘾药物化合物SMILES编码生成新的SMILES字符串,SMILES字符串被基于GRU的编码器编码为隐空间向量,这些向量被分子生成器改进,达到良好的可用药特性,如结合亲和力,配分系数等,生成的类药物分子向量被解码为SMILES字符串;
步骤5.2:基于二维指纹的多任务深度神经网络验证这些SMILES字符串的物理特性并进行筛选。
优选的,所述步骤6包括以下步骤:
步骤6.1:通过MathPose预测基于二维指纹的多任务深度神经网络选择的复合物的三维结构信息;
步骤6.2:通过MathDL预测MathPose生成的三维复合物的生物活性,将有希望的候选药物输入MathPose单元来生成3D结构;
步骤6.3:然后由MathDL进一步验证,以选择最终的候选药物;
步骤6.4:最后对治疗药物与靶点蛋白质的结合能力进行测试。
优选的,所述步骤4中通过串联规则将成瘾药物化合物分子指纹特征向量X(x1、x2...xn)和蛋白质序列特征向量Y(y1、y2...yn)进行同一规则拼接,获得药物靶点融合特征数据XY(x1y1、x2y2...xnyn)。
优选的,所述步骤6.4包括以下步骤:
步骤6.4.1:对治疗药物化合物分子进行数值化处理,获取治疗药物化合物分子指纹特征向量Z;
步骤6.4.2:通过串联规则将药物靶点融合特征数据XY(x1y1、x2y2...xnyn)与治疗药物化合物分子指纹特征向量Z进行同一规则拼接,获得治疗药物靶点融合特征数据XYZ(x1y1Z1、x2y2Z2...xnynZn);
步骤6.4.3:将治疗药物靶点融合特征数据XYZ输入卷积神经网络。
优选的,所述步骤6.4.3具体包括对治疗药物靶点融合特征数据XYZ进行训练生成分类器模型,利用反向传播、梯度下降方法调整分类器网络权值,然后获取最终结合能力测试结果。
与现有技术相比,本发明提供了一种用于治疗药物成瘾的药物靶点结合能力测试方法,具备以下有益效果:
1、本发明通过直接对成瘾药物化合物和靶点蛋白质数据就那些获取,再根据成瘾药物化合物和靶点蛋白质的特性进行数据结合,进而使测试的过程更加直观,并且基于二维指纹的深度神经网络评估治疗药物特性并进行筛选,使测试数据更加完善,对治疗药物成瘾具有较大意义;
2、本发明使成瘾药物再与靶点蛋白先进行结合,在受到成瘾药物的影响下对治疗药物进行筛选和与靶点蛋白结合能力进行测试,进而使经过筛选的治疗药物与靶点蛋白的结合能力相对于正常情况下的结合能力较强,进而使研发的治疗药物结合能力更强;
3、本发明使成瘾药物再与靶点蛋白结合的情况下对治疗药物进行筛选,最后对治疗药物与靶点蛋白质的结合能力进行测试,进而达到了在保证药物治疗效果的情况下对治疗药物和靶点蛋白结合能力进行测试的效果;
4、本发明使成瘾药物再与靶点蛋白结合的情况下对治疗药物进行筛选,并且进行治疗药物与靶点蛋白的结合能力测试,对治疗药物成瘾的药物研发具有重要意义,使治疗药物与靶点蛋白的结合能力更强,进而增强药物治疗效果。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制,在附图中:
图1为本发明提出的一种用于治疗药物成瘾的药物靶点结合能力测试方法的流程示意图;
图2为本发明提出的一种用于治疗药物成瘾的药物靶点结合能力测试方法的原理流程示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参阅图1,本发明提供一种技术方案:一种用于治疗药物成瘾的药物靶点结合能力测试方法,包括以下步骤:
步骤1:获取成瘾药物化合物和靶点蛋白质数据;
步骤2:对成瘾药物化合物和靶点蛋白质数据进行处理;
步骤3:分别对成瘾药物化合物和靶点蛋白质的特性进行提取;
步骤4:对成瘾药物化合物和靶点蛋白质进行结合,获取成瘾药物与靶点蛋白的融合数据;
步骤5:基于二维指纹的深度神经网络评估治疗药物特性并进行筛选;
步骤6:建立MathPose和MathDL模型进行结合能力测试。
本发明的工作原理及使用流程:使用时,首先获取成瘾药物化合物和靶点蛋白质数据,再对成瘾药物化合物和靶点蛋白质数据进行处理,并且分别对成瘾药物化合物和靶点蛋白质的特性进行提取,然后对成瘾药物化合物和靶点蛋白质进行结合,获取成瘾药物与靶点蛋白的融合数据,然后基于二维指纹的深度神经网络评估治疗药物特性并进行筛选,并且建立MathPose和MathDL模型进行结合能力测试。
根据实施例一,通过直接对成瘾药物化合物和靶点蛋白质数据就那些获取,再根据成瘾药物化合物和靶点蛋白质的特性进行数据结合,进而使测试的过程更加直观,并且基于二维指纹的深度神经网络评估治疗药物特性并进行筛选,使测试数据更加完善,对治疗药物成瘾具有较大意义。
实施例二
请参阅图1-2,本发明提供一种技术方案:一种用于治疗药物成瘾的药物靶点结合能力测试方法,包括以下步骤:
步骤1:获取成瘾药物化合物和靶点蛋白质数据;
步骤2:对成瘾药物化合物和靶点蛋白质数据进行处理;
步骤3:分别对成瘾药物化合物和靶点蛋白质的特性进行提取;
步骤4:对成瘾药物化合物和靶点蛋白质进行结合,获取成瘾药物与靶点蛋白的融合数据;
步骤5:基于二维指纹的深度神经网络评估治疗药物特性并进行筛选;
步骤6:建立MathPose和MathDL模型进行结合能力测试。
本发明中,优选的,步骤1中分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据。
本发明中,优选的,步骤2中利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码。
本发明中,优选的,步骤3包括以下步骤:
步骤3.1:构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示;
步骤3.2:构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y。
本发明中,优选的,步骤4包括以下步骤:
步骤4.1:将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合;
步骤4.2:构建融合后的LSTM模型,提取融合后的蛋白质特征向量XY。
本发明的工作原理及使用流程:使用时,分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据,利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码,然后构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示,再构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y;将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合,再构建融合后的LSTM模型,提取融合后的蛋白质特征向量XY,然后基于二维指纹的深度神经网络评估治疗药物特性并进行筛选,最后建立MathPose和MathDL模型进行结合能力测试。
根据实施例二,使成瘾药物再与靶点蛋白先进行结合,在受到成瘾药物的影响下对治疗药物进行筛选和与靶点蛋白结合能力进行测试,进而使经过筛选的治疗药物与靶点蛋白的结合能力相对于正常情况下的结合能力较强,进而使研发的治疗药物结合能力更强。
实施例三
请参阅图1-2,本发明提供一种技术方案:一种用于治疗药物成瘾的药物靶点结合能力测试方法,包括以下步骤:
步骤1:获取成瘾药物化合物和靶点蛋白质数据;
步骤2:对成瘾药物化合物和靶点蛋白质数据进行处理;
步骤3:分别对成瘾药物化合物和靶点蛋白质的特性进行提取;
步骤4:对成瘾药物化合物和靶点蛋白质进行结合,获取成瘾药物与靶点蛋白的融合数据;
步骤5:基于二维指纹的深度神经网络评估治疗药物特性并进行筛选;
步骤6:建立MathPose和MathDL模型进行结合能力测试。
本发明中,优选的,步骤1中分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据。
本发明中,优选的,步骤2中利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码。
本发明中,优选的,步骤3包括以下步骤:
步骤3.1:构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示;
步骤3.2:构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y。
本发明中,优选的,步骤4包括以下步骤:
步骤4.1:将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合;
步骤4.2:构建融合后的LSTM模型,提取融合后的蛋白质特征向量XY。
本发明中,优选的,步骤5包括以下步骤:
步骤5.1:以成瘾药物化合物SMILES编码生成新的SMILES字符串,SMILES字符串被基于GRU的编码器编码为隐空间向量,这些向量被分子生成器改进,达到良好的可用药特性,如结合亲和力,配分系数等,生成的类药物分子向量被解码为SMILES字符串;
步骤5.2:基于二维指纹的多任务深度神经网络验证这些SMILES字符串的物理特性并进行筛选。
本发明中,优选的,步骤6包括以下步骤:
步骤6.1:通过MathPose预测基于二维指纹的多任务深度神经网络选择的复合物的三维结构信息;
步骤6.2:通过MathDL预测MathPose生成的三维复合物的生物活性,将有希望的候选药物输入MathPose单元来生成3D结构;
步骤6.3:然后由MathDL进一步验证,以选择最终的候选药物;
步骤6.4:最后对治疗药物与靶点蛋白质的结合能力进行测试。
本发明的工作原理及使用流程:使用时,分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据,利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码,然后构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示,再构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y;将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合,通过串联规则将成瘾药物化合物分子指纹特征向量X(x1、x2...xn)和蛋白质序列特征向量Y(y1、y2...yn)进行同一规则拼接,获得药物靶点融合特征数据XY(x1y1、x2y2...xnyn);然后以成瘾药物化合物SMILES编码生成新的SMILES字符串,SMILES字符串被基于GRU的编码器编码为隐空间向量,这些向量被分子生成器改进,达到良好的可用药特性,如结合亲和力,配分系数等,生成的类药物分子向量被解码为SMILES字符串,通过基于二维指纹的多任务深度神经网络验证这些SMILES字符串的物理特性并进行筛选,再通过MathPose预测基于二维指纹的多任务深度神经网络选择的复合物的三维结构信息,通过MathDL预测MathPose生成的三维复合物的生物活性,将有希望的候选药物输入MathPose单元来生成3D结构,然后由MathDL进一步验证,以选择最终的候选药物。
根据实施例三,使成瘾药物再与靶点蛋白结合的情况下对治疗药物进行筛选,最后对治疗药物与靶点蛋白质的结合能力进行测试,进而达到了在保证药物治疗效果的情况下对治疗药物和靶点蛋白结合能力进行测试的效果。
实施例四
请参阅图1-2,本发明提供一种技术方案:一种用于治疗药物成瘾的药物靶点结合能力测试方法,包括以下步骤:
步骤1:获取成瘾药物化合物和靶点蛋白质数据;
步骤2:对成瘾药物化合物和靶点蛋白质数据进行处理;
步骤3:分别对成瘾药物化合物和靶点蛋白质的特性进行提取;
步骤4:对成瘾药物化合物和靶点蛋白质进行结合,获取成瘾药物与靶点蛋白的融合数据;
步骤5:基于二维指纹的深度神经网络评估治疗药物特性并进行筛选;
步骤6:建立MathPose和MathDL模型进行结合能力测试。
本发明中,优选的,步骤1中分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据。
本发明中,优选的,步骤2中利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码。
本发明中,优选的,步骤3包括以下步骤:
步骤3.1:构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示;
步骤3.2:构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y。
本发明中,优选的,步骤4包括以下步骤:
步骤4.1:将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合;
步骤4.2:构建融合后的LSTM模型,提取融合后的蛋白质特征向量XY。
本发明中,优选的,步骤5包括以下步骤:
步骤5.1:以成瘾药物化合物SMILES编码生成新的SMILES字符串,SMILES字符串被基于GRU的编码器编码为隐空间向量,这些向量被分子生成器改进,达到良好的可用药特性,如结合亲和力,配分系数等,生成的类药物分子向量被解码为SMILES字符串;
步骤5.2:基于二维指纹的多任务深度神经网络验证这些SMILES字符串的物理特性并进行筛选。
本发明中,优选的,步骤6包括以下步骤:
步骤6.1:通过MathPose预测基于二维指纹的多任务深度神经网络选择的复合物的三维结构信息;
步骤6.2:通过MathDL预测MathPose生成的三维复合物的生物活性,将有希望的候选药物输入MathPose单元来生成3D结构;
步骤6.3:然后由MathDL进一步验证,以选择最终的候选药物;
步骤6.4:最后对治疗药物与靶点蛋白质的结合能力进行测试。
本发明中,优选的,步骤4中通过串联规则将成瘾药物化合物分子指纹特征向量X(x1、x2...xn)和蛋白质序列特征向量Y(y1、y2...yn)进行同一规则拼接,获得药物靶点融合特征数据XY(x1y1、x2y2...xnyn)。
本发明中,优选的,步骤6.4包括以下步骤:
步骤6.4.1:对治疗药物化合物分子进行数值化处理,获取治疗药物化合物分子指纹特征向量Z;
步骤6.4.2:通过串联规则将药物靶点融合特征数据XY(x1y1、x2y2...xnyn)与治疗药物化合物分子指纹特征向量Z进行同一规则拼接,获得治疗药物靶点融合特征数据XYZ(x1y1Z1、x2y2Z2...xnynZn);
步骤6.4.3:将治疗药物靶点融合特征数据XYZ输入卷积神经网络。
本发明中,优选的,步骤6.4.3具体包括对治疗药物靶点融合特征数据XYZ进行训练生成分类器模型,利用反向传播、梯度下降方法调整分类器网络权值,然后获取最终结合能力测试结果。
本发明的工作原理及使用流程:使用时,分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据,利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码,然后构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示,再构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y;将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合,通过串联规则将成瘾药物化合物分子指纹特征向量X(x1、x2...xn)和蛋白质序列特征向量Y(y1、y2...yn)进行同一规则拼接,获得药物靶点融合特征数据XY(x1y1、x2y2...xnyn);然后以成瘾药物化合物SMILES编码生成新的SMILES字符串,SMILES字符串被基于GRU的编码器编码为隐空间向量,这些向量被分子生成器改进,达到良好的可用药特性,如结合亲和力,配分系数等,生成的类药物分子向量被解码为SMILES字符串,通过基于二维指纹的多任务深度神经网络验证这些SMILES字符串的物理特性并进行筛选,再通过MathPose预测基于二维指纹的多任务深度神经网络选择的复合物的三维结构信息,通过MathDL预测MathPose生成的三维复合物的生物活性,将有希望的候选药物输入MathPose单元来生成3D结构,然后由MathDL进一步验证,以选择最终的候选药物,再对治疗药物化合物分子进行数值化处理,获取治疗药物化合物分子指纹特征向量Z,通过串联规则将药物靶点融合特征数据XY(x1y1、x2y2...xnyn)与治疗药物化合物分子指纹特征向量Z进行同一规则拼接,获得治疗药物靶点融合特征数据XYZ(x1y1Z1、x2y2Z2...xnynZn),最后将治疗药物靶点融合特征数据XYZ输入卷积神经网络,使卷积神经网络对治疗药物靶点融合特征数据XYZ进行训练生成分类器模型,利用反向传播、梯度下降方法调整分类器网络权值,然后获取最终结合能力测试结果。
根据实施例四,使成瘾药物再与靶点蛋白结合的情况下对治疗药物进行筛选,并且进行治疗药物与靶点蛋白的结合能力测试,对治疗药物成瘾的药物研发具有重要意义,使治疗药物与靶点蛋白的结合能力更强,进而增强药物治疗效果。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:包括以下步骤:
步骤1:获取成瘾药物化合物和靶点蛋白质数据;
步骤2:对成瘾药物化合物和靶点蛋白质数据进行处理;
步骤3:分别对成瘾药物化合物和靶点蛋白质的特性进行提取;
步骤4:对成瘾药物化合物和靶点蛋白质进行结合,获取成瘾药物与靶点蛋白的融合数据;
步骤5:基于二维指纹的深度神经网络评估治疗药物特性并进行筛选;
步骤6:建立MathPose和MathDL模型进行结合能力测试。
2.根据权利要求1所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤1中分别通过Enamine REAL数据库和PDB数据库获取成瘾药物化合物和靶点蛋白质的数据。
3.根据权利要求1所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤2中利用分子的SMILES编码对成瘾药物化合物进行编码,并且以成瘾药物化合物的编码为标记编码。
4.根据权利要求1所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤3包括以下步骤:
步骤3.1:构建成瘾药物化合物的CNN模型,将标记编码输入CNN模型中,提取成瘾药物化合物的特征向量X,得到化合物的分子表示;
步骤3.2:构建靶点蛋白的LSTM模型,提取靶点蛋白的特征向量Y。
5.根据权利要求1所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤4包括以下步骤:
步骤4.1:将瘾药物化合物的特征向量X和靶点蛋白质的特征向量Y进行结合;
步骤4.2:构建融合后的LSTM模型,提取融合后的蛋白质特征向量XY。
6.根据权利要求1所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤5包括以下步骤:
步骤5.1:以成瘾药物化合物SMILES编码生成新的SMILES字符串,SMILES字符串被基于GRU的编码器编码为隐空间向量,这些向量被分子生成器改进,达到良好的可用药特性,如结合亲和力,配分系数等,生成的类药物分子向量被解码为SMILES字符串;
步骤5.2:基于二维指纹的多任务深度神经网络验证这些SMILES字符串的物理特性并进行筛选。
7.根据权利要求1所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤6包括以下步骤:
步骤6.1:通过MathPose预测基于二维指纹的多任务深度神经网络选择的复合物的三维结构信息;
步骤6.2:通过MathDL预测MathPose生成的三维复合物的生物活性,将有希望的候选药物输入MathPose单元来生成3D结构;
步骤6.3:然后由MathDL进一步验证,以选择最终的候选药物;
步骤6.4:最后对治疗药物与靶点蛋白质的结合能力进行测试。
8.根据权利要求1所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤4中通过串联规则将成瘾药物化合物分子指纹特征向量X(x1、x2...xn)和蛋白质序列特征向量Y(y1、y2...yn)进行同一规则拼接,获得药物靶点融合特征数据XY(x1y1、x2y2...xnyn)。
9.根据权利要求7所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤6.4包括以下步骤:
步骤6.4.1:对治疗药物化合物分子进行数值化处理,获取治疗药物化合物分子指纹特征向量Z;
步骤6.4.2:通过串联规则将药物靶点融合特征数据XY(x1y1、x2y2...xnyn)与治疗药物化合物分子指纹特征向量Z进行同一规则拼接,获得治疗药物靶点融合特征数据XYZ(x1y1Z1、x2y2Z2...xnynZn);
步骤6.4.3:将治疗药物靶点融合特征数据XYZ输入卷积神经网络。
10.根据权利要求9所述的一种用于治疗药物成瘾的药物靶点结合能力测试方法,其特征在于:所述步骤6.4.3具体包括对治疗药物靶点融合特征数据XYZ进行训练生成分类器模型,利用反向传播、梯度下降方法调整分类器网络权值,然后获取最终结合能力测试结果。
CN202110590269.XA 2021-05-28 2021-05-28 一种用于治疗药物成瘾的药物靶点结合能力测试方法 Active CN113284553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110590269.XA CN113284553B (zh) 2021-05-28 2021-05-28 一种用于治疗药物成瘾的药物靶点结合能力测试方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110590269.XA CN113284553B (zh) 2021-05-28 2021-05-28 一种用于治疗药物成瘾的药物靶点结合能力测试方法

Publications (2)

Publication Number Publication Date
CN113284553A true CN113284553A (zh) 2021-08-20
CN113284553B CN113284553B (zh) 2023-01-10

Family

ID=77282134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110590269.XA Active CN113284553B (zh) 2021-05-28 2021-05-28 一种用于治疗药物成瘾的药物靶点结合能力测试方法

Country Status (1)

Country Link
CN (1) CN113284553B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116825234A (zh) * 2023-08-30 2023-09-29 江西农业大学 一种多模态信息融合的药物分子活性预测方法及电子设备

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930181A (zh) * 2012-11-07 2013-02-13 四川大学 基于分子描述符的蛋白质-配体亲和力预测方法
CN103183726A (zh) * 2004-03-19 2013-07-03 巴斯德研究院 衍生自人bplp蛋白的肽、编码所述肽的多核苷酸和针对所述肽的抗体
CN103656645A (zh) * 2013-10-27 2014-03-26 北京大学 治疗阿片成瘾新的分子靶点及其在药物开发中的应用
CN104159922A (zh) * 2012-01-10 2014-11-19 比奥根艾迪克Ma公司 对转运治疗性分子穿过血脑屏障的增强
US20180129776A1 (en) * 2016-11-07 2018-05-10 Samsung Electronics Co., Ltd. Method and device for selecting and optimizing enzyme for catalysis
CN108570004A (zh) * 2018-05-29 2018-09-25 郝惠敏 一种对5-ht具有双重作用的化合物及其在治疗抑郁症中的应用
ES2688737A1 (es) * 2017-05-04 2018-11-06 Universidad Del País Vasco / Euskal Herriko Unibertsitatea Método para diagnosticar placa ateroesclerótica inestable
CN108959841A (zh) * 2018-04-16 2018-12-07 华南农业大学 一种基于dbn算法的药物靶向蛋白作用预测方法
CN109715808A (zh) * 2016-04-15 2019-05-03 诺华股份有限公司 用于选择性蛋白质表达的组合物和方法
CN109890371A (zh) * 2016-08-26 2019-06-14 斯瑞尼瓦萨饶·韦帕切杜 组合物及其方法
CN110706756A (zh) * 2019-09-03 2020-01-17 兰州大学 一种基于人工智能进行靶向受体的3d药物设计方法
CN112164427A (zh) * 2020-09-23 2021-01-01 常州微亿智造科技有限公司 基于深度学习的药物小分子靶点活性预测方法和装置
CN112409363A (zh) * 2013-12-20 2021-02-26 艾吉因生物股份有限公司 用于治疗认知损害的苯并二氮杂䓬衍生物、组合物和方法
CN112489737A (zh) * 2020-11-16 2021-03-12 南京希瑞斯细胞工程有限公司 一种智能化药物靶点亲和力预测方法与流程
CN112582020A (zh) * 2020-12-18 2021-03-30 中国石油大学(华东) 基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
CN112599187A (zh) * 2020-12-18 2021-04-02 武汉大学 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法
CN112768089A (zh) * 2021-04-09 2021-05-07 至本医疗科技(上海)有限公司 用于预测药物敏感状态的方法、设备和存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103183726A (zh) * 2004-03-19 2013-07-03 巴斯德研究院 衍生自人bplp蛋白的肽、编码所述肽的多核苷酸和针对所述肽的抗体
CN104159922A (zh) * 2012-01-10 2014-11-19 比奥根艾迪克Ma公司 对转运治疗性分子穿过血脑屏障的增强
CN102930181A (zh) * 2012-11-07 2013-02-13 四川大学 基于分子描述符的蛋白质-配体亲和力预测方法
CN103656645A (zh) * 2013-10-27 2014-03-26 北京大学 治疗阿片成瘾新的分子靶点及其在药物开发中的应用
CN112409363A (zh) * 2013-12-20 2021-02-26 艾吉因生物股份有限公司 用于治疗认知损害的苯并二氮杂䓬衍生物、组合物和方法
CN109715808A (zh) * 2016-04-15 2019-05-03 诺华股份有限公司 用于选择性蛋白质表达的组合物和方法
CN109890371A (zh) * 2016-08-26 2019-06-14 斯瑞尼瓦萨饶·韦帕切杜 组合物及其方法
US20180129776A1 (en) * 2016-11-07 2018-05-10 Samsung Electronics Co., Ltd. Method and device for selecting and optimizing enzyme for catalysis
ES2688737A1 (es) * 2017-05-04 2018-11-06 Universidad Del País Vasco / Euskal Herriko Unibertsitatea Método para diagnosticar placa ateroesclerótica inestable
CN108959841A (zh) * 2018-04-16 2018-12-07 华南农业大学 一种基于dbn算法的药物靶向蛋白作用预测方法
CN108570004A (zh) * 2018-05-29 2018-09-25 郝惠敏 一种对5-ht具有双重作用的化合物及其在治疗抑郁症中的应用
CN110706756A (zh) * 2019-09-03 2020-01-17 兰州大学 一种基于人工智能进行靶向受体的3d药物设计方法
CN112164427A (zh) * 2020-09-23 2021-01-01 常州微亿智造科技有限公司 基于深度学习的药物小分子靶点活性预测方法和装置
CN112489737A (zh) * 2020-11-16 2021-03-12 南京希瑞斯细胞工程有限公司 一种智能化药物靶点亲和力预测方法与流程
CN112582020A (zh) * 2020-12-18 2021-03-30 中国石油大学(华东) 基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
CN112599187A (zh) * 2020-12-18 2021-04-02 武汉大学 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法
CN112768089A (zh) * 2021-04-09 2021-05-07 至本医疗科技(上海)有限公司 用于预测药物敏感状态的方法、设备和存储介质

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
DRUGAI: ""bioRxiv|利用机器智能设计抗新型冠状病毒药物"", 《HTTPS://BLOG.CSDN.NET/U012325865/ARTICLE/DETAILS/105002747》, 20 March 2020 (2020-03-20), pages 1 - 7 *
ERTL P 等: "" In silico generation of novel, drug-like chemical matter using the LSTM neural network"", 《ARXIV:1712.07449》, 31 December 2017 (2017-12-31), pages 1 - 7 *
GROW C等: ""Generative network complex (GNC) for drug discovery"", 《COMMUNICATIONS IN INFORMATION AND SYSTEMS》, vol. 19, no. 3, 31 October 2019 (2019-10-31), pages 1 - 22 *
KAIFU GAO等: ""Machine intelligence design of 2019-nCoV drugs"", 《BIORXIV》, 4 February 2020 (2020-02-04), pages 1 - 16 *
YI LI,YONGSHENG WANG: ""Bioinformatics analysis of gene expression data for the identification of critical genes in breast invasive carcinoma"", 《MOLECULAR MEDICINE REPORTS》, 11 October 2017 (2017-10-11), pages 1 - 4 *
付强 等: ""CART肽抑制可卡因行为敏感化与伏隔核CaMKII-D3R相互作用相关"", 《中华医学会第十七次全国神经病学学术会议论文汇编(下)》, 18 September 2014 (2014-09-18), pages 610 *
卞庆来: ""抑郁症调控网络及逍遥散抗抑郁模块的生物信息学分析与实验研究"", 《中国博士学位论文全文数据库 (医药卫生科技辑)》, no. 2021, 15 April 2021 (2021-04-15), pages 057 - 58 *
方霜霜等: "酸枣仁作用于神经精神疾病的网络药理学研究", 《辽宁中医杂志》 *
方霜霜等: "酸枣仁作用于神经精神疾病的网络药理学研究", 《辽宁中医杂志》, no. 07, 18 July 2020 (2020-07-18), pages 134 - 137 *
杨景芳: ""ABA调控受体蛋白活化的分子基础及其靶向性分子设计探究"", 《中国博士学位论文全文数据库 基础科学辑》, no. 2020, 15 January 2020 (2020-01-15), pages 006 - 294 *
胡珊珊: ""药物互作数据的挖掘与预测研究"", 《中国博士学位论文全文数据库 (医药卫生科技辑)》, no. 2019, 15 July 2019 (2019-07-15), pages 079 - 26 *
邓青: ""Ghrelin活性片段的中枢镇痛作用以及血脑屏障透过性研究"", 《中国优秀硕士学位论文全文数据库 (医药卫生科技辑)》, no. 2020, 15 August 2020 (2020-08-15), pages 079 - 73 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116825234A (zh) * 2023-08-30 2023-09-29 江西农业大学 一种多模态信息融合的药物分子活性预测方法及电子设备
CN116825234B (zh) * 2023-08-30 2023-11-07 江西农业大学 一种多模态信息融合的药物分子活性预测方法及电子设备

Also Published As

Publication number Publication date
CN113284553B (zh) 2023-01-10

Similar Documents

Publication Publication Date Title
Zhavoronkov et al. Deep biomarkers of aging and longevity: from research to applications
Ni et al. Generative design of de novo proteins based on secondary-structure constraints using an attention-based diffusion model
Ji Cell Language Theory, The: Connecting Mind And Matter
JP2023548923A (ja) 人工知能ベースの薬物分子処理方法および装置、機器、記憶媒体並びにコンピュータプログラム
CN113284553B (zh) 一种用于治疗药物成瘾的药物靶点结合能力测试方法
Lyu et al. Protein secondary structure prediction with a reductive deep learning method
Danel et al. Docking-based generative approaches in the search for new drug candidates
Gu et al. Targeted aspect-based multimodal sentiment analysis: An attention capsule extraction and multi-head fusion network
Wang et al. Drug-disease association prediction based on neighborhood information aggregation in neural networks
CN111862261A (zh) 一种flair模态磁共振影像生成方法及系统
Sang et al. Improved biogeography-based optimization algorithm by hierarchical tissue-like P system with triggering ablation rules
CN114417794A (zh) 量表问题生成模型的训练方法、装置和计算机设备
Guardiani et al. Coarse grained modeling and approaches to protein folding
CN116403731A (zh) 基于深度学习的错义突变对临床药效影响预测方法及系统
US20220300807A1 (en) Systems and methods for applying a transformer network to spatial data
CN110096145A (zh) 基于混合现实和神经网络的心理状态显示方法及装置
Zhan et al. iBT-Net: an incremental broad transformer network for cancer drug response prediction
CN115240873A (zh) 一种基于机器学习的药物推荐方法、电子设备和计算机可读存储介质
Tran et al. Protein binding pose prediction via conditional variational autoencoding for plasmodium falciparum
CN114842924A (zh) 一种优化的从头药物设计方法
Yu et al. Depression and severity detection based on body kinematic features: using kinect recorded skeleton data of simple action
HUANG Conditioned self-avoiding walk (csaw): Stochastic approach to protein folding
CN116758977A (zh) 一种基于活性片段的靶向配体生成方法
CN112420153B (zh) 一种基于gan的中药方剂改进的方法
Shuldau et al. Generative autoencoders for designing novel small-molecule compounds as potential SARS-CoV-2 main protease Inhibitors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant