CN113053457A - 一种基于多通路图卷积神经网络的药物靶标预测方法 - Google Patents

一种基于多通路图卷积神经网络的药物靶标预测方法 Download PDF

Info

Publication number
CN113053457A
CN113053457A CN202110321988.1A CN202110321988A CN113053457A CN 113053457 A CN113053457 A CN 113053457A CN 202110321988 A CN202110321988 A CN 202110321988A CN 113053457 A CN113053457 A CN 113053457A
Authority
CN
China
Prior art keywords
matrix
drug
network
graph convolution
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110321988.1A
Other languages
English (en)
Other versions
CN113053457B (zh
Inventor
彭绍亮
冯潇逸
杨亚宁
白亮
李介臣
王小奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202110321988.1A priority Critical patent/CN113053457B/zh
Publication of CN113053457A publication Critical patent/CN113053457A/zh
Application granted granted Critical
Publication of CN113053457B publication Critical patent/CN113053457B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Optimization (AREA)
  • Biotechnology (AREA)
  • Databases & Information Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Bioethics (AREA)
  • Algebra (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于机器学习以及计算机生物信息学领域,公开了一种基于多通路图卷积神经网络的药物靶标预测方法。本发明包括步骤:基于随机游走的方法,计算药物信息的概率共现矩阵;通过概率共现矩阵计算移位正点互信息(PPMI)矩阵,通过使用计算所得的PPMI矩阵以及带自环的药物信息邻接矩阵作为全局和局部一致性的卷积核,对药物信息网络做图卷积操作,整合复杂有效的节点及拓扑结构知识,并通过交叉熵损失函数以及均方差损失函数联合对模型进行训练,将训练完成的模型作为药物靶标潜在关系预测的模型。本发明避免了传统药物靶标预测方法的局限性。本发明借助于多通路图卷积神经网络模型,实现高精度的药物靶标预测。

Description

一种基于多通路图卷积神经网络的药物靶标预测方法
技术领域:
本发明属于机器学习领域及多源药物信息网络领域,涉及基于多源异构药物信息网络的药物靶标预测方法,特别涉及一种基于多通路图卷积神经网络的多源异构药物信息的靶标预测方法。
背景技术:
药品的研发一直以来都是极其耗费时间资源以及成本资源的研究,传统的药物研发周期长,成本高,高污染,高风险,且需要经过漫长的临床实验的验证才有可能具备大范围应用于临床的机会。而药物靶标适应关系的相关研究及临床试验一直以来被认定为药物研发的重大困难,1993年以来FDA公布批准的小分子药物以及生物药物的数量大约每年只有30-40种。因此,近年来,研究人员将目光聚焦于老药新用这一领域,即,通过研究已被应用于临床的安全的药物来治疗除公开的适应症以外的病症。目前为止,已经有大量的专业药物信息系统及数据库被公开,海量的多源异构的药物信息网络的开源化给了全球的研究人员坚实的数据基础,如何利用海量的药物数据资源,从大量未被证实的药品相关数据中计算药物潜在的治疗关系迫在眉睫。
近几年,神经网络在图形图像以及自然语言处理领域展示出了前所未有的潜力,使得研究人员将目光聚焦在深度学习神经网络等方面,希望借助于神经网络实现药物的辅助研发功能,然而,传统的神经网络CNN等处理的数据多为规则图形图像数据,使用的卷积核等关键计算部分也是规定大小的规则矩阵,无法有效处理异构不规则的药物信息网络数据。在此基础上,基于图的卷积网络即图卷积神经网络应运而生。过去几年中,面向大规模药物信息网络,社交网络,知识图谱等不规则网络图结构的图神经网络模型得到了大规模的发展,该种神经网络目前已经发展出了相当多的变体,主要处理节点分类以及链路预测等问题。
针对药物信息领域中药物靶标预测的问题,目前的研究方法大体分为三类,分别是基于配体的方法,基于分子对接的方法以及基于机器学习的方法。经证实,基于配体的方法在配体的数量较少的情况下表现性能低下,而基于分子对接的方法需要预测蛋白质的三级结构的情况下预测,但是蛋白质三维结构的难以确定,并且耗时巨大,该种方法的预测效率较低。
为了解决基于配体方法和分子对接方法的不足,借助机器学习模型,从已有的药物和靶标的关联关系出发,分析整合药物信息,可以提高潜在的药物靶标关系对的富集程度,以降低预测的假阳性率。运用机器学习的方法整合有效的药物信息预测药物靶标的研究在药物重定位领域取得了成功的进展。在药物靶标预测过程中往往涉及到一些相关的药物信息例如,药物,靶标,副作用,疾病等节点信息,以及相关节点间的关联关系信息或相似度信息。本发明使用异构药物的子网络信息,通过使用多通路的图卷积神经网络,充分整合药物靶标的多源有效信息结合已知的药物靶点关联信息作为正样本做药物靶点的链路预测。
针对基于传统计算方法预测药物靶点的配体不足、表现不良以及效率低的问题,本发明提供一种基于多通路图卷积神经网络的药物靶标预测方法,目的在于避免传统的药物靶点预测的正负样本极度不均衡造成的预测精度不佳以及效率不高的问题。本发明通过使用多通路的图卷积神经网络,自动学习药物信息网络节点间的局部一致性信息以及全局一致性信息,有效的提高了预测精度以及预测效率,完成药物靶标的潜在关系对的预测工作。
发明内容:
针对如何融合药物信息网络的全局一致性及局部一致性信息,完成预测药物靶点的潜在关系对的任务,本发明提供一种基于多通路图卷积神经网络的药物靶标预测方法。为了实现本发明的目的,具体的实施步骤如下:
步骤一:计算多源异构网络的共现矩阵,包括以下步骤:
1.1.基于多源异构的药物信息网络的集合G=[G1,G2,G3,...,G5],其中,G表示多个药物信息子网络组成的多源异构药物信息网络,其中G=(V,E),V表示药物信息子网络中的节点,E表示节点间的关联关系,G1,G2,G3,G4,G5分别表示药物-蛋白质关联关系矩阵,药物-药物相互作用矩阵,药物-副作用关系矩阵,药物疾病相关关联矩阵以及有关药物结构的相似性矩阵;
1.2.基于随机游走方法,将步骤1.1中的药物信息网络的各个子网络作为初始数据,融合并计算所有子网络中的节点的拓扑结构和网络的节点表示,将计算结果输出为融合的药物信息网络的概率共现矩阵X,其中,具体的概率共现矩阵的计算公式是:
Xk=wXk-1A+(1-w)G0
其中Xk表示概率共现矩阵X在第k轮迭代的结果,G0表示步骤1.1中的多个子网络组成的药物信息网络的原始01矩阵,w表示概率,A表示转移矩阵;
1.3.将步骤1.2计算得到的概率共现矩阵X作为输入,计算概率共现矩阵的移位正点互信息矩阵PPMI矩阵,其中PPMI矩阵的计算公式为:
Figure BDA0002993218790000041
其中X为步骤1.2中计算所得的概率共现矩阵,X(i,j)表示概率共现矩阵X中第i行,第j列的数据,Nr和Nc分别表示矩阵的行数和列数,计算所得的负数设置为0;
计算带自环的药物-药物相互作用邻接矩阵~A,
计算公式为:
Figure BDA0002993218790000042
其中A为药物-药物相互作用邻接矩阵,I为单位矩阵;
步骤二:利用步骤一生成的带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000043
和PPMI矩阵P作为卷积核,步骤1.1中的多个子网络组成的药物信息网络G作为初始特征矩阵,将G作为多通路图卷积神经网络的输入,其中,多通路图卷积神经网络包含两条通路神经网络结构,每条通路包括三个图卷积层、一个softmax层,且网络顺序为图卷积层、图卷积层、图卷积层、softmax层,每条通路的每个图卷积层的维度分别为3000,2000,1512;确定整合局部一致性的图卷积层前馈计算公式为:
Figure BDA0002993218790000044
其中,Z(i-1)表示上一层图卷积神经网络的输出数据,将其作为下一层的输入,Z(i)表示每层图卷积神经网络的输出数据,
Figure BDA0002993218790000045
为带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000046
的度矩阵,W(i)为可更新的模型参数;
整合全局一致性的图卷积计算公式为:
Figure BDA0002993218790000051
其中,Z(i-1)表示上一层图卷积神经网络的输出数据,将其作为下一层的输入,Z(i)表示每层图卷积神经网络的输出数据,
Figure BDA0002993218790000052
为带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000053
的度矩阵,W(i)为可更新的模型参数;
步骤三:使用均方差损失函数以及交叉熵损失函数作为多通路图卷积神经网络的损失函数,以整合药物信息网络的全局一致性以及布局一致性有效表示,并结合BP方法更新网络参数,使得网络随着训练的进行,网络输出越来越接近已知的药物靶标的关联关系矩阵;
其中,均方差损失函数为:
Figure BDA0002993218790000054
其中,
Figure BDA0002993218790000055
表示由带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000056
作为卷积核的输出矩阵的第l行,第i列的数据,Yl,i表示已知的药物靶标关联关系的正负样本矩阵的第l行,第i列的数据,yL是一组数据索引,它的标签用于训练模型;
交叉熵损失函数为:
Figure BDA0002993218790000057
其中,将Convp(X)和ConvA(A)的输出分别作为ZP,ZA,其表示由PPMI矩阵P和由带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000058
作为卷积核的矩阵输出数据。
即,最终的完整的损失函数为:L=L(ConvA)+λ(t)L(ConvA,ConvP),其中,L(ConvA)表示整合局部一致性的损失函数,L(ConvA,ConvP)表示整合全局一致性的损失函数,λ(t)表示随着时间变换的参数函数;随着训练轮数的增加,模型参数不断更新,直到模型趋于稳定停止。
相比于现有技术,本发明的有益效果为:
针对基于传统计算方法预测药物靶点的配体不足、表现不良以及效率低的问题,本发明提供一种基于多通路图卷积神经网络的药物靶标预测方法,目的在于避免传统的药物靶点预测的正负样本极度不均衡造成的预测精度不佳以及效率不高的问题。本发明借助于多通路图卷积神经网络模型,通过学习多源异构的药物信息网络的局部一致性以及全局一致性内容,整合药物信息网络的有效信息,在正负样本不均衡的情况下,实现药物靶标的预测任务。相比于现有技术,本发明有效提高了预测精度,可以为药物靶标的潜在关系提供有效的预测。
附图说明:
图1为本发明的方法流程图。
具体实施方式:
下面结合附图和具体实施方法对本发明作进一步详细的说明:
如图1所示,一种基于多通路图卷积神经网络的药物靶标预测方法,包括以下步骤:
步骤一:计算多源异构网络的共现矩阵,包括以下步骤:
1.4.基于多源异构的药物信息网络的集合G=[G1,G2,G3,...,G5],其中,G表示多个药物信息子网络组成的多源异构药物信息网络,其中G=(V,E),V表示药物信息子网络中的节点,E表示节点间的关联关系,G1,G2,G3,G4,G5分别表示药物-蛋白质关联关系矩阵,药物-药物相互作用矩阵,药物-副作用关系矩阵,药物疾病相关关联矩阵以及有关药物结构的相似性矩阵;
1.5.基于随机游走方法,将步骤1.1中的药物信息网络的各个子网络作为初始数据,融合并计算所有子网络中的节点的拓扑结构和网络的节点表示,将计算结果输出为融合的药物信息网络的概率共现矩阵X,其中,具体的概率共现矩阵的计算公式是:
Xk=wXk-1A+(1-w)G0
其中Xk表示概率共现矩阵X在第k轮迭代的结果,G0表示步骤1.1中的多个子网络组成的药物信息网络的原始01矩阵,w表示概率,A表示转移矩阵;
1.6.将步骤1.2计算得到的概率共现矩阵X作为输入,计算概率共现矩阵的移位正点互信息矩阵PPMI矩阵,其中PPMI矩阵的计算公式为:
Figure BDA0002993218790000071
其中X为步骤1.2中计算所得的概率共现矩阵,X(i,j)表示概率共现矩阵X中第i行,第j列的数据,Nr和Nc分别表示矩阵的行数和列数,计算所得的负数设置为0;
计算带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000072
计算公式为:
Figure BDA0002993218790000073
其中A为药物-药物相互作用邻接矩阵,I为单位矩阵;
步骤二:利用步骤一生成的带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000074
和PPMI矩阵P作为卷积核,步骤1.1中的多个子网络组成的药物信息网络G作为初始特征矩阵,将G作为多通路图卷积神经网络的输入,其中,多通路图卷积神经网络包含两条通路神经网络结构,每条通路包括三个图卷积层、一个softmax层,且网络顺序为图卷积层、图卷积层、图卷积层、softmax层,每条通路的每个图卷积层的维度分别为3000,2000,1512;确定整合局部一致性的图卷积层前馈计算公式为:
Figure BDA0002993218790000081
其中,Z(i-1)表示上一层图卷积神经网络的输出数据,将其作为下一层的输入,Z(i)表示每层图卷积神经网络的输出数据,
Figure BDA0002993218790000082
为带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000083
的度矩阵,W(i)为可更新的模型参数;
整合全局一致性的图卷积计算公式为:
Figure BDA0002993218790000084
其中,Z(i-1)表示上一层图卷积神经网络的输出数据,将其作为下一层的输入,Z(i)表示每层图卷积神经网络的输出数据,
Figure BDA0002993218790000085
为带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000086
的度矩阵,W(i)为可更新的模型参数;
步骤三:使用均方差损失函数以及交叉熵损失函数作为多通路图卷积神经网络的损失函数,以整合药物信息网络的全局一致性以及布局一致性有效表示,并结合BP方法更新网络参数,使得网络随着训练的进行,网络输出越来越接近已知的药物靶标的关联关系矩阵;
其中,均方差损失函数为:
Figure BDA0002993218790000087
其中,
Figure BDA0002993218790000088
表示由带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000089
作为卷积核的输出矩阵的第l行,第i列的数据,Yl,i表示已知的药物靶标关联关系的正负样本矩阵的第l行,第i列的数据,yL是一组数据索引,它的标签用于训练模型;
交叉熵损失函数为:
Figure BDA0002993218790000091
其中,将Convp(X)和ConvA(A)的输出分别作为ZP,ZA,其表示由PPMI矩阵P和由带自环的药物-药物相互作用邻接矩阵
Figure BDA0002993218790000092
作为卷积核的矩阵输出数据。
即,最终的完整的损失函数为:L=L(ConvA)+λ(t)L(ConvA,ConvP),其中,L(ConvA)表示整合局部一致性的损失函数,L(ConvA,ConvP)表示整合全局一致性的损失函数,λ(t)表示随着时间变换的参数函数;随着训练轮数的增加,模型参数不断更新,直到模型趋于稳定停止。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种基于多通路图卷积神经网络的药物靶标预测方法,其特征在于,包括以下步骤:
步骤一:计算多源异构网络的共现矩阵,包括以下步骤:
1.1.基于多源异构的药物信息网络的集合G=[G1,G2,G3,...,G5],其中,G表示多个药物信息子网络组成的多源异构药物信息网络,其中G=(V,E),V表示药物信息子网络中的节点,E表示节点间的关联关系,G1,G2,G3,G4,G5分别表示药物-蛋白质关联关系矩阵,药物-药物相互作用矩阵,药物-副作用关系矩阵,药物疾病相关关联矩阵以及有关药物结构的相似性矩阵;
1.2.基于随机游走方法,将步骤1.1中的药物信息网络的各个子网络作为初始数据,融合并计算所有子网络中的节点的拓扑结构和网络的节点表示,将计算结果输出为融合的药物信息网络的概率共现矩阵X,其中,具体的概率共现矩阵的计算公式是:
Xk=wXk-1A+(1-w)G0
其中Xk表示概率共现矩阵X在第k轮迭代的结果,G0表示步骤1.1中的多个子网络组成的药物信息网络的原始01矩阵,w表示概率,A表示转移矩阵;
1.3.将步骤1.2计算得到的概率共现矩阵X作为输入,计算概率共现矩阵的移位正点互信息矩阵PPMI矩阵,其中PPMI矩阵的计算公式为:
Figure FDA0002993218780000011
其中X为步骤1.2中计算所得的概率共现矩阵,X(i,j)表示概率共现矩阵X中第i行,第j列的数据,Nr和Nc分别表示矩阵的行数和列数,计算所得的负数设置为0;
计算带自环的药物-药物相互作用邻接矩阵
Figure FDA0002993218780000026
计算公式为:
Figure FDA0002993218780000027
其中A为药物-药物相互作用邻接矩阵,I为单位矩阵;
步骤二:利用步骤一生成的带自环的药物-药物相互作用邻接矩阵
Figure FDA0002993218780000028
和PPMI矩阵P作为卷积核,步骤1.1中的多个子网络组成的药物信息网络G作为初始特征矩阵,将G作为多通路图卷积神经网络的输入,其中,多通路图卷积神经网络包含两条通路神经网络结构,每条通路包括三个图卷积层、一个softmax层,且网络顺序为图卷积层、图卷积层、图卷积层、softmax层,每条通路的每个图卷积层的维度分别为3000,2000,1512;确定整合局部一致性的图卷积层前馈计算公式为:
Figure FDA0002993218780000021
其中,Z(i-1)表示上一层图卷积神经网络的输出数据,将其作为下一层的输入,Z(i)表示每层图卷积神经网络的输出数据,
Figure FDA0002993218780000024
为带自环的药物-药物相互作用邻接矩阵
Figure FDA0002993218780000025
的度矩阵,W(i)为可更新的模型参数;
整合全局一致性的图卷积计算公式为:
Figure FDA0002993218780000022
其中,Z(i-1)表示上一层图卷积神经网络的输出数据,将其作为下一层的输入,Z(i)表示每层图卷积神经网络的输出数据,
Figure FDA0002993218780000023
为带自环的药物-药物相互作用邻接矩阵
Figure FDA0002993218780000031
的度矩阵,W(i)为可更新的模型参数;
步骤三:使用均方差损失函数以及交叉熵损失函数作为多通路图卷积神经网络的损失函数,以整合药物信息网络的全局一致性以及布局一致性有效表示,并结合BP方法更新网络参数,使得网络随着训练的进行,网络输出越来越接近已知的药物靶标的关联关系矩阵;
其中,均方差损失函数为:
Figure FDA0002993218780000032
其中,
Figure FDA0002993218780000033
表示由带自环的药物-药物相互作用邻接矩阵
Figure FDA0002993218780000034
作为卷积核的输出矩阵的第l行,第i列的数据,Yl,i表示已知的药物靶标关联关系的正负样本矩阵的第l行,第i列的数据,yL是一组数据索引,它的标签用于训练模型;
交叉熵损失函数为:
Figure FDA0002993218780000035
其中,将Convp(X)和ConvA(A)的输出分别作为ZP,ZA,其表示由PPMI矩阵P和由带自环的药物-药物相互作用邻接矩阵
Figure FDA0002993218780000036
作为卷积核的矩阵输出数据;
即,最终的完整的损失函数为:L=L(ConvA)+λ(t)L(ConvA,ConvP),其中,L(ConvA)表示整合局部一致性的损失函数,L(ConvA,ConvP)表示整合全局一致性的损失函数,λ(t)表示随着时间变换的参数函数;随着训练轮数的增加,模型参数不断更新,直到模型趋于稳定停止。
CN202110321988.1A 2021-03-25 2021-03-25 一种基于多通路图卷积神经网络的药物靶标预测方法 Active CN113053457B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110321988.1A CN113053457B (zh) 2021-03-25 2021-03-25 一种基于多通路图卷积神经网络的药物靶标预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110321988.1A CN113053457B (zh) 2021-03-25 2021-03-25 一种基于多通路图卷积神经网络的药物靶标预测方法

Publications (2)

Publication Number Publication Date
CN113053457A true CN113053457A (zh) 2021-06-29
CN113053457B CN113053457B (zh) 2022-04-05

Family

ID=76515554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110321988.1A Active CN113053457B (zh) 2021-03-25 2021-03-25 一种基于多通路图卷积神经网络的药物靶标预测方法

Country Status (1)

Country Link
CN (1) CN113053457B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113808664A (zh) * 2021-09-26 2021-12-17 平安科技(深圳)有限公司 基于机器学习的抗体筛选方法及装置
CN114496303A (zh) * 2022-01-06 2022-05-13 湖南大学 一种基于多通道神经网络的抗癌药物筛选方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033738A (zh) * 2018-07-09 2018-12-18 湖南大学 一种基于深度学习的药物活性预测方法
CN110880354A (zh) * 2019-10-24 2020-03-13 广东药科大学 一种基于群体智能的药物-靶标相互作用预测方法
CN111681718A (zh) * 2020-06-11 2020-09-18 湖南大学 一种基于深度学习多源异构网络的药物重定位方法
CN111882044A (zh) * 2020-08-05 2020-11-03 四川大学 一种基于图神经网络的共晶预测方法、深度学习框架
CN112216396A (zh) * 2020-10-14 2021-01-12 复旦大学 一种基于图神经网络预测药物-副作用关系的方法
CN112364983A (zh) * 2020-11-12 2021-02-12 浙江工业大学 一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法
CN112382411A (zh) * 2020-11-13 2021-02-19 大连理工大学 一种基于异质图的药物-蛋白质靶向作用预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033738A (zh) * 2018-07-09 2018-12-18 湖南大学 一种基于深度学习的药物活性预测方法
CN110880354A (zh) * 2019-10-24 2020-03-13 广东药科大学 一种基于群体智能的药物-靶标相互作用预测方法
CN111681718A (zh) * 2020-06-11 2020-09-18 湖南大学 一种基于深度学习多源异构网络的药物重定位方法
CN111882044A (zh) * 2020-08-05 2020-11-03 四川大学 一种基于图神经网络的共晶预测方法、深度学习框架
CN112216396A (zh) * 2020-10-14 2021-01-12 复旦大学 一种基于图神经网络预测药物-副作用关系的方法
CN112364983A (zh) * 2020-11-12 2021-02-12 浙江工业大学 一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法
CN112382411A (zh) * 2020-11-13 2021-02-19 大连理工大学 一种基于异质图的药物-蛋白质靶向作用预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
范益世: "基于深度学习的药物性质预测算法研究", 《中国优秀硕士学位论文全文数据库(医药卫生科技辑)》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113808664A (zh) * 2021-09-26 2021-12-17 平安科技(深圳)有限公司 基于机器学习的抗体筛选方法及装置
CN113808664B (zh) * 2021-09-26 2024-03-19 平安科技(深圳)有限公司 基于机器学习的抗体筛选方法及装置
CN114496303A (zh) * 2022-01-06 2022-05-13 湖南大学 一种基于多通道神经网络的抗癌药物筛选方法
CN114496303B (zh) * 2022-01-06 2024-06-04 湖南大学 一种基于多通道神经网络的抗癌药物筛选方法

Also Published As

Publication number Publication date
CN113053457B (zh) 2022-04-05

Similar Documents

Publication Publication Date Title
Su et al. Attention-based knowledge graph representation learning for predicting drug-drug interactions
Jemai et al. Fast learning algorithm of wavelet network based on fast wavelet transform
CN113053457B (zh) 一种基于多通路图卷积神经网络的药物靶标预测方法
Shi et al. Protein complex detection with semi-supervised learning in protein interaction networks
CN112905801A (zh) 基于事件图谱的行程预测方法、系统、设备及存储介质
Liang et al. Drugchat: towards enabling chatgpt-like capabilities on drug molecule graphs
WO2024011837A1 (zh) 药物筛选方法及系统
Ye et al. Molecular substructure graph attention network for molecular property identification in drug discovery
Sarkar et al. An algorithm for DNA read alignment on quantum accelerators
CN114882970B (zh) 基于预训练模型和分子图的药物相互作用效果预测方法
Yang et al. Versatile multi-stage graph neural network for circuit representation
CN106599610A (zh) 预测长链非编码rna和蛋白质联系的方法及系统
Cong et al. Multi-omics and artificial intelligence-guided drug repositioning: prospects, challenges, and lessons learned from COVID-19
CN113223609B (zh) 基于异质信息网络的药物靶标相互作用预测方法
Xu et al. SPACEL: deep learning-based characterization of spatial transcriptome architectures
Wang et al. Logistic regression analysis for LncRNA-disease association prediction based on random forest and clinical stage data
CN117334271A (zh) 一种基于指定属性生成分子的方法
Gómez-Vela et al. Structure optimization for large gene networks based on greedy strategy
CN116543832A (zh) 基于多尺度超图卷积的疾病-miRNA关系预测方法、模型及应用
Takagi et al. GraphIX: Graph-based In silico XAI (explainable artificial intelligence) for drug repositioning from biopharmaceutical network
CN112966155B (zh) 基于路径相关性的链路预测方法
CN114792397A (zh) 一种sar影像城市道路提取方法、系统以及存储介质
Vanitha et al. Detection and diagnosis of hepatitis virus infection based on human blood smear data in machine learning segmentation technique
Wedyan et al. Vibrating Particles System Algorithm for Solving Classification Problems
Guo et al. A density clustering-based differential evolution algorithm for solving nonlinear equation systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant