CN110289050B - 一种基于图卷积和词向量的药物-靶标相互作用预测方法 - Google Patents

一种基于图卷积和词向量的药物-靶标相互作用预测方法 Download PDF

Info

Publication number
CN110289050B
CN110289050B CN201910460463.9A CN201910460463A CN110289050B CN 110289050 B CN110289050 B CN 110289050B CN 201910460463 A CN201910460463 A CN 201910460463A CN 110289050 B CN110289050 B CN 110289050B
Authority
CN
China
Prior art keywords
target
drug
features
matrix
constructing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910460463.9A
Other languages
English (en)
Other versions
CN110289050A (zh
Inventor
全哲
郭燕
林轩
何楠
王梓旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN201910460463.9A priority Critical patent/CN110289050B/zh
Publication of CN110289050A publication Critical patent/CN110289050A/zh
Application granted granted Critical
Publication of CN110289050B publication Critical patent/CN110289050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种基于图卷积和词向量的药物-靶标相互作用预测方法,从药物中提取分子指纹特征和邻接矩阵特征,然后利用图卷积训练这些特征,将一个蛋白质分子表达式3个一组切割,并用一个100维的向量表示这一组,利用CNN训练靶标的词向量特征,最后把训练好的药物和靶标结合在一起,进行最后的结果预测。本发明的有益效果如下:可以提供关于药物的更多特征,从而达到更高的准确性;利用词向量构建蛋白质特征,大大减少了构建特征的时间;可以完整保存药物分子图的有关信息,而不会损失特征;可以大大加快训练时间。

Description

一种基于图卷积和词向量的药物-靶标相互作用预测方法
【技术领域】
本发明涉及药物-靶标相互作用预测技术领域,尤其涉及一种基于图卷积和词向量的药物-靶标相互作用预测方法。
【背景技术】
现代新药研发的关键是寻找,确定和制备药物分子靶标。化合物成药所具备的重要前提之一就是与靶标蛋白的结合力够强,作用时间够长。然而,近些年,新药研发速率不断下降,研发成本不断上升。原因就在于:1.药物研发的早期阶段依靠耗时耗力的实验手段;2.大部分人类疾病是由多因素引起的复杂疾病,而生物系统具有一定的冗余度和鲁棒性,单一药物对单一靶点的干扰不能引起系统表型的改变。
目前通常的预测药物-靶标亲和力的做法主要分为以下几种:
1.基于特征的方法,已知的药物-靶相互作用通过由药物化学描述符的描述符与用于结合靶标。利用这些特征向量作为输入,然后利用诸如支持向量机(SVM),朴素贝叶斯(NB)或神经网络(NN)的标准机器学习方法可用于预测新药物-目标对的相互作用。此方法药物特征较难获取,普适性较差,结果误差较大。将药物-靶标任务规定为二元分类问题,没有区分真正的负相互作用和未经测试的药物-目标对,并且没有很好地涵盖整个相互作用谱,包括真正的正相互作用和真正的负相互作用。
2.基于相似性的方法,生成两者的药物-药物对和所述目标-目标对的相似性矩阵。可以使用不同类型的相似性度量来生成这些矩阵;通常,化学结构指纹用于计算药物之间的相似性,蛋白质序列比对评分用于靶标。使用相似性的最简单方法之一是最近邻分类器,预测来自最相似药物/目标的相互作用谱的加权(通过相似性)总和的新相互作用。和基于特征的方法一样将任务规定为二元分类问题。
3.利用梯度提升方法用于连续药物-靶标结合亲和力预测。给定持续结合亲和力的训练数据集以及药物之间和目标之间的相似性,这种方法构建药物,靶标和药物-靶标对的特征,并使用梯度增强机器来预测药物-靶标对的结合亲和力并生成预测间隔。这种方法药物和蛋白质特征构建比较困难,预测能力有限。
综上所述,药物-靶标亲和力预测的各种方法都会受限于自身的特点。其中基于特征和相似性的方法将此任务定义为二分类问题,没有很好地涵盖整个相互作用谱,而利用梯度提升的方法药物和蛋白质特征构建困难,预测能力有限。
【发明内容】
本发明的目的是提出了一种基于图卷积和词向量的药物-靶标相互作用预测方法,其中图卷积用于对药物进行特征提取,词向量用于表示蛋白质特征,然后用CNN(卷积神经网络)对蛋白质进行特征提取,可以提高药物-靶标亲和力预测准确性,从而降低药物生产过程的成本,帮助我们选择更好的药物。
为实现上述目的,本发明的技术方案为:
一种基于图卷积和词向量的药物-靶标相互作用预测方法,包括如下步骤:
步骤1、构建数据集,对数据集进行切分,生成80%的训练集和20%的测试集;
步骤2、对训练集中的药物构建邻接矩阵并提取分子指纹特征;
步骤3、构建靶标的氨基酸序列的三元组词向量表;
步骤4、利用Embedding层对分子指纹特征做映射,同时利用Embedding层将每个靶标的氨基酸序列转换成一个100维的矩阵;
步骤5、利用图卷积对处理好的药物特征进行训练,利用CNN对处理好的靶标特征进行训练;
步骤6、将训练后得到的药物特征和靶标特征连接在一起,输入全连接层;
步骤7、经过多次迭代计算,得到训练后的模型;
步骤8、将测试集经过同样的提取特征处理,喂入模型得到测试结果。
作为本发明的一种改进,步骤1具体包括如下步骤:
步骤1.1、将数据集进行切分,打乱,生成80%的训练集和20%的测试集,将测试集固定不变用于对照;
步骤1.2、对数据集的切分保证训练集和测试集的分布一致。
作为本发明的一种改进,在步骤2中,利用RDKit对数据集中的药物构建邻接矩阵。
作为本发明的一种改进,在步骤2中,所述分子指纹特征是摩根型指纹。
作为本发明的一种改进,步骤3具体包括如下步骤:
步骤3.1、将靶标的氨基酸序列3个为一组进行切割;
步骤3.2、利用预训练的词向量表构建词向量矩阵,矩阵的大小为不重复的3元组个数乘100;
步骤3.3、对所有不重复的氨基酸3元组进行编号。
作为本发明的一种改进,步骤4具体包括如下步骤:
步骤4.1、Embedding层将氨基酸序列转换成100维的矩阵,同样的也将分子指纹转换成特定维度的矩阵;
步骤4.2、Embedding层构建一个映射f:X→Y,将一个空间里的实体映射到一个线性向量空间。
作为本发明的一种改进,步骤5具体包括如下步骤:
步骤5.1、图卷积过程:
Input:
Molecule graph G=(V,E),radius R
For each node vi∈V and edge eij∈E
Figure BDA0002077895080000031
eij (t+1)=σ(eij (t)+gij (t)) (2)
Output:
Figure BDA0002077895080000032
步骤5.1.1、遍历图中所有节点和边;
步骤5.1.2、对节点做如式1的计算,其中:
σ(x)=1/(1+e-x) (4)
Figure BDA0002077895080000033
步骤5.1.2、对边做如式2的计算,其中:
Figure BDA0002077895080000034
步骤5.1.3、计算输出;
步骤5.2、卷积过程;
步骤5.2.1、输入Embedding后的氨基酸序列;
步骤5.2.2、进行卷积运算。
作为本发明的一种改进,在步骤1中,所述数据集采用Davis数据集,所述Davis数据集中含有68个药物,442个靶标,共30056个药物-靶标对。
本发明的有益效果如下:
1.利用分子指纹构建药物关于节点的特征,利用邻接矩阵构建药物关于边的信息,可以提供关于药物的更多特征,从而达到更高的准确性;
2.利用词向量构建蛋白质特征,大大减少了构建特征的时间;
3.利用图卷积对药物特征进行训练,可以完整保存药物分子图的有关信息,而不会损失特征;
4.利用CNN对靶标特征进行训练,可以大大加快训练时间。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1为本发明一种基于图卷积和词向量的药物-靶标相互作用预测方法的流程图;
图2为乙醇的邻接矩阵形式图;
图3为摩根型指纹示意图。
【具体实施方式】
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明提供一种基于图卷积和词向量的药物-靶标相互作用预测方法,可以应用于药物发现、分子结构、计算几何等领域,包括如下步骤:
步骤1、构建数据集,对数据集进行切分,生成80%的训练集和20%的测试集;
具体的,所述数据集采用Davis数据集,所述Davis数据集中含有68个药物,442个靶标,共30056个药物-靶标对。
具体包括如下步骤:
步骤1.1、将数据集进行切分,打乱,生成80%的训练集和20%的测试集,将测试集固定不变用于对照;
步骤1.2、对数据集的切分保证训练集和测试集的分布一致。
步骤2、对训练集中的药物构建邻接矩阵并提取分子指纹特征;
具体的,利用RDKit对数据集中的药物构建邻接矩阵,邻接矩阵是用于表示有限图的矩阵,矩阵的元素指示图中的顶点对是否相邻,邻接矩阵将分子中所有原子作为矩阵行和列的标签,当分子中两个原子有化学键相连接时,矩阵相应位置值为1,如图2所示,是乙醇的邻接矩阵形式。
所述分子指纹特征是摩根型指纹,分子指纹是一种将Smile格式的药物分子转换成0和1位的流的方法。在本发明中,使用的是摩根型指纹,这是一种圆形指纹,它记录每个从原子出发到指定半径内的环境,并且每一种可能性都被编码。然后使用散列算法将可能性压缩到预定长度。参照图3所示,摩根型指纹示意图:以一个原子为中心,搜索特定半径范围内的结构特征。
步骤3、构建靶标的氨基酸序列的三元组词向量表;
体包括如下步骤:
步骤3.1、将靶标的氨基酸序列3个为一组进行切割,如下所示氨基酸切分方式:
Figure BDA0002077895080000051
步骤3.2、利用预训练的词向量表构建词向量矩阵,矩阵的大小为不重复的3元组个数乘100;
步骤3.3、对所有不重复的氨基酸3元组进行编号。
步骤4、利用Embedding层对分子指纹特征做映射,同时利用Embedding层将每个靶标的氨基酸序列转换成一个100维的矩阵;
具体包括如下步骤:
步骤4.1、Embedding层将氨基酸序列转换成100维的矩阵,同样的也将分子指纹转换成特定维度的矩阵;
步骤4.2、Embedding层构建一个映射f:X→Y,将一个空间里的实体映射到一个线性向量空间。
步骤5、利用图卷积对处理好的药物特征进行训练,利用CNN对处理好的靶标特征进行训练;
具体包括如下步骤:
步骤5.1、图卷积过程:
Input:
Molecule graph G=(V,E),radius R
For each node vi∈V and edge eij∈E
Figure BDA0002077895080000061
eij (t+1)=σ(eij (t)+gij (t)) (2)
Output:
Figure BDA0002077895080000062
步骤5.1.1、遍历图中所有节点和边;
步骤5.1.2、对节点做如式1的计算,其中:
σ(x)=1/(1+e-x) (4)
Figure BDA0002077895080000063
步骤5.1.2、对边做如式2的计算,其中:
Figure BDA0002077895080000064
步骤5.1.3、计算输出;
步骤5.2、卷积过程;
步骤5.2.1、输入Embedding后的氨基酸序列;
步骤5.2.2、进行卷积运算。
步骤6、将训练后得到的药物特征和靶标特征连接在一起,输入全连接层;
步骤7、经过多次迭代计算,得到训练后的模型;
在得到模型后,使用梯度下降法优化损失函数。
步骤8、将测试集经过同样的提取特征处理,喂入模型得到测试结果。
在得到测试结果后,还可以进行实验结果验证,比较本模型与传统机器学习模型性能的优劣,其中KronRLS是基于支持向量机的方法,SimBoost是基于梯度提升树的方法。
使用一致性指数(CI),均方误差(MSE),精确召回曲线下的面积(AUPR)作为结果评价标准,Davis数据集实验结果参加下表1:
表1
Figure BDA0002077895080000071
通过对比MSE,CI,AUPR可以发现,本发明提供的方法在这些平均标准上均优于传统机器学习方法。相比传统机器学习方法本专利可以得到更好的结果,证明本发明是有效果的。
综上科技,本发明结合了图卷积,词向量与CNN(卷积神经网络),用分子指纹,邻接矩阵表示药物分子结构特征,用词向量来构建靶标氨基酸序列的结构特征,图卷积用于训练药物分子特征,CNN用于训练蛋白质分子特征,实验证明这种模型架构相比传统机器学习方法可显著提高药物-靶标亲和力预测能力。
本发明的有益效果如下:
1.利用分子指纹构建药物关于节点的特征,利用邻接矩阵构建药物关于边的信息,可以提供关于药物的更多特征,从而达到更高的准确性;
2.利用词向量构建蛋白质特征,大大减少了构建特征的时间;
3.利用图卷积对药物特征进行训练,可以完整保存药物分子图的有关信息,而不会损失特征;
4.利用CNN对靶标特征进行训练,可以大大加快训练时间。
尽管本发明的实施方案已公开如上,但并不仅仅限于说明书和实施方案中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里所示出与描述的图例。

Claims (7)

1.一种基于图卷积和词向量的药物-靶标相互作用预测方法,其特征在于,包括如下步骤:
步骤1、构建数据集,对数据集进行切分,生成80%的训练集和20%的测试集;
步骤2、对训练集中的药物构建邻接矩阵并提取分子指纹特征;
步骤3、构建靶标的氨基酸序列的三元组词向量表;
步骤4、利用Embedding层对分子指纹特征做映射,同时利用Embedding层将每个靶标的氨基酸序列转换成一个100维的矩阵;
步骤5、利用图卷积对处理好的药物特征进行训练,利用CNN对处理好的靶标特征进行训练;
具体包括如下步骤:
步骤5.1、图卷积过程:
输入:
分子图G=(V,E),半径R
对于每个节点vi∈V以及边eij∈E
Figure QLYQS_1
eij (t+1)=σ(eij (t)+gij (t)) (2)
输出:
Figure QLYQS_2
步骤5.1.1、遍历图中所有节点和边;
步骤5.1.2、对节点做如式1的计算,其中:
σ(x)=1/(1+e-x) (4)
Figure QLYQS_3
步骤5.1.2、对边做如式2的计算,其中:
Figure QLYQS_4
步骤5.1.3、计算输出;
步骤5.2、卷积过程;
步骤5.2.1、输入Embedding后的氨基酸序列;
步骤5.2.2、进行卷积运算
步骤6、将训练后得到的药物特征和靶标特征连接在一起,输入全连接层;
步骤7、经过多次迭代计算,得到训练后的模型;
步骤8、将测试集经过同样的提取特征处理,喂入模型得到测试结果。
2.如权利要求1所述的一种基于图卷积和词向量的药物-靶标相互作用预测方法,其特征在于,步骤1具体包括如下步骤:
步骤1.1、将数据集进行切分,打乱,生成80%的训练集和20%的测试集,将测试集固定不变用于对照;
步骤1.2、对数据集的切分保证训练集和测试集的分布一致。
3.如权利要求1所述的一种基于图卷积和词向量的药物-靶标相互作用预测方法,其特征在于,在步骤2中,利用RDKit对数据集中的药物构建邻接矩阵。
4.如权利要求1或3所述的一种基于图卷积和词向量的药物-靶标相互作用预测方法,其特征在于,在步骤2中,所述分子指纹特征是摩根型指纹。
5.如权利要求1所述的一种基于图卷积和词向量的药物-靶标相互作用预测方法,其特征在于,步骤3具体包括如下步骤:
步骤3.1、将靶标的氨基酸序列3个为一组进行切割;
步骤3.2、利用预训练的词向量表构建词向量矩阵,矩阵的大小为不重复的3元组个数乘100;
步骤3.3、对所有不重复的氨基酸3元组进行编号。
6.如权利要求1所述的一种基于图卷积和词向量的药物-靶标相互作用预测方法,其特征在于,步骤4具体包括如下步骤:
步骤4.1、Embedding层将氨基酸序列转换成100维的矩阵,同样的也将分子指纹转换成特定维度的矩阵;
步骤4.2、Embedding层构建一个映射f:X→Y,将一个空间里的实体映射到一个线性向量空间。
7.如权利要求1所述的一种基于图卷积和词向量的药物-靶标相互作用预测方法,其特征在于,在步骤1中,所述数据集采用Davis数据集,所述Davis数据集中含有68个药物,442个靶标,共30056个药物-靶标对。
CN201910460463.9A 2019-05-30 2019-05-30 一种基于图卷积和词向量的药物-靶标相互作用预测方法 Active CN110289050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910460463.9A CN110289050B (zh) 2019-05-30 2019-05-30 一种基于图卷积和词向量的药物-靶标相互作用预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910460463.9A CN110289050B (zh) 2019-05-30 2019-05-30 一种基于图卷积和词向量的药物-靶标相互作用预测方法

Publications (2)

Publication Number Publication Date
CN110289050A CN110289050A (zh) 2019-09-27
CN110289050B true CN110289050B (zh) 2023-06-16

Family

ID=68002906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910460463.9A Active CN110289050B (zh) 2019-05-30 2019-05-30 一种基于图卷积和词向量的药物-靶标相互作用预测方法

Country Status (1)

Country Link
CN (1) CN110289050B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110867254A (zh) * 2019-11-18 2020-03-06 北京市商汤科技开发有限公司 预测方法及装置、电子设备和存储介质
CN111564186A (zh) * 2020-03-25 2020-08-21 湖南大学 基于知识图谱的图卷积药物对相互作用预测方法及系统
CN113571124B (zh) * 2020-04-29 2024-04-23 中国科学院上海药物研究所 一种配体-蛋白质相互作用的预测方法及装置
CN111933225B (zh) * 2020-09-27 2021-01-05 平安科技(深圳)有限公司 药物分类方法、装置、终端设备以及存储介质
CN112382347B (zh) * 2020-11-17 2022-09-06 南京理工大学 基于分子指纹和多靶点蛋白的协同抗癌药物组合识别方法
CN112435720B (zh) * 2020-12-04 2021-10-26 上海蠡图信息科技有限公司 一种基于自注意力机制与多药物特征组合的预测方法
CN114765060B (zh) * 2021-01-13 2023-12-08 四川大学 预测药物靶标相互作用的多注意力方法
CN113327644B (zh) * 2021-04-09 2024-05-14 中山大学 一种基于图与序列的深度嵌入学习的药物-靶标相互作用预测方法
CN113160894B (zh) * 2021-04-23 2023-10-24 平安科技(深圳)有限公司 药物与靶标的相互作用预测方法、装置、设备及存储介质
CN113345535A (zh) * 2021-06-04 2021-09-03 南开大学 保持药物化学性质与功能一致性的药物靶标预测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930169A (zh) * 2012-11-07 2013-02-13 景德镇陶瓷学院 基于灰色理论和分子指纹的药物-靶标结合预测方法
CN102930179A (zh) * 2012-11-07 2013-02-13 景德镇陶瓷学院 基于复杂度和分子指纹的药物-靶标结合预测方法
CN105117618A (zh) * 2015-08-12 2015-12-02 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于牵连犯罪原则和网络拓扑结构特征的药物-靶标相互作用识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3568782A1 (en) * 2017-01-13 2019-11-20 Massachusetts Institute Of Technology Machine learning based antibody design
CN109189925B (zh) * 2018-08-16 2020-01-17 华南师范大学 基于点互信息的词向量模型和基于cnn的文本分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930169A (zh) * 2012-11-07 2013-02-13 景德镇陶瓷学院 基于灰色理论和分子指纹的药物-靶标结合预测方法
CN102930179A (zh) * 2012-11-07 2013-02-13 景德镇陶瓷学院 基于复杂度和分子指纹的药物-靶标结合预测方法
CN105117618A (zh) * 2015-08-12 2015-12-02 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于牵连犯罪原则和网络拓扑结构特征的药物-靶标相互作用识别方法

Also Published As

Publication number Publication date
CN110289050A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
CN110289050B (zh) 一种基于图卷积和词向量的药物-靶标相互作用预测方法
CN110659207B (zh) 基于核谱映射迁移集成的异构跨项目软件缺陷预测方法
CN107577924B (zh) 一种基于深度学习的长链非编码rna亚细胞位置预测方法
CN113393911B (zh) 一种基于深度学习的配体化合物快速预筛选方法
CN107291895B (zh) 一种快速的层次化文档查询方法
CN116417093A (zh) 一种结合Transformer和图神经网络的药物靶标相互作用预测方法
Yang et al. Image-based classification of protein subcellular location patterns in human reproductive tissue by ensemble learning global and local features
CN112489723B (zh) 基于局部进化信息的dna结合蛋白预测方法
CN114091603A (zh) 一种空间转录组细胞聚类、分析方法
CN112164100B (zh) 一种基于图卷积神经网络的图像配准方法
CN111370073A (zh) 一种基于深度学习的药物互作规则预测方法
Villegas-Morcillo et al. Protein fold recognition from sequences using convolutional and recurrent neural networks
Singh et al. Towards probabilistic generative models harnessing graph neural networks for disease-gene prediction
Ding et al. iT3SE‐PX: Identification of Bacterial Type III Secreted Effectors Using PSSM Profiles and XGBoost Feature Selection
Ma et al. Prediction of long non-coding RNA-protein interaction through kernel soft-neighborhood similarity
CN113284627A (zh) 基于患者表征学习的用药推荐方法
CN116343915B (zh) 生物序列集成分类器的构建方法及生物序列预测分类方法
CN112270950A (zh) 一种基于网络增强和图正则的融合网络药物靶标关系预测方法
CN112085245A (zh) 一种基于深度残差神经网络的蛋白质残基接触预测方法
CN112259157A (zh) 一种蛋白质相互作用预测方法
Wang et al. Gcmapcrys: integrating graph attention network with predicted contact map for multi-stage protein crystallization propensity prediction
CN116705192A (zh) 基于深度学习的药物虚拟筛选方法及装置
Zhang et al. Multimodal deep representation learning for protein-protein interaction networks
CN113837293A (zh) mRNA亚细胞定位模型训练方法、定位方法及可读存储介质
CN114610941A (zh) 基于对比学习的文物图像检索系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant