CN116453585A - mRNA和药物关联的预测方法、装置、终端设备及介质 - Google Patents
mRNA和药物关联的预测方法、装置、终端设备及介质 Download PDFInfo
- Publication number
- CN116453585A CN116453585A CN202310157523.6A CN202310157523A CN116453585A CN 116453585 A CN116453585 A CN 116453585A CN 202310157523 A CN202310157523 A CN 202310157523A CN 116453585 A CN116453585 A CN 116453585A
- Authority
- CN
- China
- Prior art keywords
- mrna
- feature vector
- detected
- drug
- target drug
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 275
- 108020004999 messenger RNA Proteins 0.000 title claims abstract description 265
- 229940079593 drug Drugs 0.000 title claims abstract description 242
- 238000000034 method Methods 0.000 title claims abstract description 69
- 239000013598 vector Substances 0.000 claims abstract description 294
- 230000002776 aggregation Effects 0.000 claims abstract description 54
- 238000004220 aggregation Methods 0.000 claims abstract description 54
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 19
- 238000003062 neural network model Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 9
- 238000006116 polymerization reaction Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 10
- 230000035945 sensitivity Effects 0.000 description 9
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013434 data augmentation Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 201000004569 Blindness Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 241000713862 Moloney murine sarcoma virus Species 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229940121657 clinical drug Drugs 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Crystallography & Structural Chemistry (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请适用于生物信息技术领域,提供了一种mRNA和药物关联的预测方法、装置、终端设备及介质。其中,该方法在预先构建的关联二分图上,对mRNA和药物的向量表示进行邻居节点聚合,分别得到二者的初始特征向量;根据关联二分图,构建关联超图,得到mRNA和药物的超图特征向量表示;根据初始特征向量和超图特征向量表示,构建跨视图对比损失,得到综合损失;利用综合损失分别对mRNA和药物的初始特征向量进行更新,得到mRNA和药物的中间特征向量;若中间特征向量满足更新终止条件,则利用其构建关联性预测模型,预测mRNA与药物的关联性。本申请能够提高mRNA与药物关联性的预测的准确性。
Description
技术领域
本申请属于生物信息学技术领域,尤其涉及一种mRNA和药物关联的预测方法、装置、终端设备及介质。
背景技术
近几年来,由于每个个体之间的异质性,药物敏感性在个体之间存在着显著差异,这样导致了大量的医疗资源的低效利用,造成了大量的资源浪费。并且由于药物敏感性的差异,会导致不同的患者需要使用不同的药物才能达到治疗的效果。研究表明,生物分子的改变,包括蛋白质编码信使RNA(mRNA)的表达、拷贝数变异、突变和甲基化对于临床药物治疗的敏感性有很大的影响。并且已经有研究揭示了KRAS(一种鼠类肉瘤病毒癌基因)点突变与结直肠癌对西妥昔单抗获得性耐药之间存在因果关系。因此,研究mRNA-药物敏感性关联对于优化药物治疗、实现个体化疾病治疗、推进精准医疗具有重要意义。但是生物实验验证mRNA-药物敏感性关联具有很大的盲目性,而且需要耗费大量的时间和精力。随着深度学习技术的发展,生物信息学吸引了越来越多的研究人员的关注,越来越多的计算方法被提出用于预测lncRNA-疾病关联,微小核糖核酸(miRNA)-疾病关联,环状核糖核酸(circRNA)-疾病关联等,但是目前mRNA和药物关联性的预测方法很少见且准确性不高。
发明内容
本申请实施例提供了一种mRNA和药物关联的预测方法、装置、终端设备及介质,可以对提高mRNA和药物关联性的预测的准确性。
第一方面,本申请实施例提供了一种mRNA和药物关联的预测方法,包括:
步骤1,在预先构建的由待测mRNA和目标药物的关联二分图上运行信息聚合神经网络模型,分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到待测mRNA的初始特征向量和目标药物的初始特征向量;
步骤2,根据关联二分图,构建关联超图,得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示;
步骤3,分别针对待测mRNA和目标药物二者中的一者,根据该者的初始特征向量和超图特征向量表示,构建跨视图对比损失,得到待测mRNA的视图对比损失和目标药物的跨视图对比损失;
步骤4,根据待测mRNA的跨视图对比损失和目标药物的跨视图对比损失,构建综合损失;
步骤5,利用综合损失,分别对待测mRNA的初始特征向量和目标药物的初始特征向量进行反向传播更新,得到待测mRNA的中间特征向量和目标药物的中间特征向量;
步骤6,若待测mRNA的中间特征向量和目标药物的中间特征向量满足预设更新终止标准,则将待测mRNA的中间特征向量作为待测mRNA的最终特征向量,将目标药物的中间特征向量作为目标药物的最终特征向量;否则,
将待测mRNA的中间特征向量作为步骤1中的待测mRNA的向量表示、目标药物的中间特征向量作为步骤1中的目标药物的向量表示,返回执行步骤1;
步骤7,根据待测mRNA的最终特征向量和目标药物的最终特征向量,构建待测mRNA与目标药物的关联性预测模型;
步骤8,利用关联性预测模型预测待测mRNA与目标药物的关联性。
可选的,步骤1中的信息聚合神经网络模型为图卷积神经网络模型。
可选的,步骤1中的分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到待测mRNA的初始特征向量和目标药物的初始特征向量,包括:
通过计算公式
得到待测mRNA的初始特征向量和目标药物的初始特征向量/>其中,/>表示第l层神经网络输出的第i个待测mRNA的初始特征向量,/>表示第l层神经网络输出的第j个目标药物的初始特征向量,i=1,2,...,I,I表示步骤1中预先获取的mRNA的总数量,j=1,2,...,J,J表示步骤1中预先获取的药物的总数量,/>表示关联二分图中待测mRNA的邻居节点聚合信息,/> 表示关联二分图中目标药物的邻居节点聚合信息,w表示向量维度,R表示实数域,σ(·)表示非线性激活函数,/>表示归一化邻接矩阵,/> D(m)表示待测mRNA的对角度矩阵,D(m)∈RI×I,d(d)表示目标药物的对角度矩阵,D(d)∈RJ×J,Ni表示关联二分图中待测mRNA的中心节点mi的邻近节点,Nj表示关联二分图中目标药物的中心节点dj的邻近节点,/>表示图卷积神经网络模型第l-1层输出的第i个待测mRNA的向量表示,/>表示图卷积神经网络模型第l-1层输出的第j个目标药物的向量表示,/>表示第l层神经网络中第i个mRNA信息聚合之后的向量表示,/>表示第l层神经网络中第j个药物信息聚合之后的向量表示,Ai,j表示第i个待测mRNA和第j个目标药物的邻接矩阵。
可选的,步骤2包括:
通过计算公式
ψ(X)=σ(VX)+X
得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示/>其中,/>表示待测mRNA在第l个超图信息聚合层下的超边特征向量表示,/>表示目标药物在第l个超图信息聚合层下的超边特征向量表示,W(m)表示待测mRNA的超边的特征矩阵,W(m)∈Rd×H,W(d)表示目标药物的超边的特征矩阵,W(d)∈Rd×H,Λ(m)表示待测mRNA的超图特征向量,Λ(d)表示目标药物的超图特征向量,Λ(m)由所述待测mRNA的向量表示E(m)和待测mRNA对应的超图结构矩阵H(m)聚合得到,Λ(d)由目标药物的向量表示E(d)和目标药物对应的超图结构矩阵H(d)聚合得到,Λ∈RH×d,E∈RK×d,H∈RK×H,K=I或K=J,c表示超图向量表示层的数量,ψ(·)表示超图信息聚合层的编码函数,X表示参数矩阵,X∈RH×H,σ'表示LeakyReLU映射。
可选的,步骤3包括:
通过计算公式
得到待测mRNA的视图对比损失和目标药物的跨视图对比损失/>i-表示第i个mRNA的负样本,j-表示第j个药物的负样本。
可选的,步骤4包括:
通过计算公式
得到综合损失L;其中,表示正样本的关联分数,/>表示负样本的关联分数,Θ表示模型参数,ri表示第i个mRNA,mj表示第j个药物。
可选的,步骤7包括:
通过计算公式
得到待测mRNA的最终向量表示和目标药物的最终向量表示/>其中,/>表示第l层超图卷积网络中第i个mRNA信息聚合之后的向量表示,/>表示第l层超图卷积网络中第j个药物信息聚合之后的向量表示;
根据和/>构建关联性预测模型。
可选的,关联性预测模型的表达式如下:
其中,表示图卷积网络第l层中第i个mRNA的特征向量,/>表示图卷积网络第l层中第j个药物的特征向量,/>表示第i个mRNA和第j个药物之间的关联分数。
第二方面,本申请实施例提供了一种mRNA和药物关联的预测装置,包括:
初始化模块,用于在预先构建的由待测mRNA和目标药物的关联二分图上运行信息聚合神经网络模型,分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到待测mRNA的初始特征向量和目标药物的初始特征向量;
超图特征向量模块,用于根据关联二分图,构建关联超图,得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示;
对比损失模块,用于分别针对待测mRNA和目标药物二者中的一者,根据该者的初始特征向量和超图特征向量表示,构建跨视图对比损失,得到待测mRNA的视图对比损失和目标药物的跨视图对比损失;
特征向量优化模块,用于根据待测mRNA的跨视图对比损失函数和目标药物的跨视图对比损失函数,构建综合损失;
中间特征向量,用于利用综合损失,分别对待测mRNA的初始特征向量和目标药物的初始特征向量进行反向传播更新,得到待测mRNA的中间特征向量和目标药物的中间特征向量;
最终特征向量模块,用于若待测mRNA的中间特征向量和目标药物的中间特征向量满足预设更新终止标准,则将待测mRNA的中间特征向量作为待测mRNA的最终特征向量,将目标药物的中间特征向量作为目标药物的最终特征向量;否则,
将待测mRNA的中间特征向量作为初始化模块中的待测mRNA的向量表示、目标药物的中间特征向量作为初始化模块中的目标药物的向量表示,返回执行初始化模块;
关联性预测模型模块,用于根据待测mRNA的最终特征向量和目标药物的最终特征向量,构建待测mRNA与目标药物的关联性预测模型;
预测模块,用于利用关联性预测模型预测待测mRNA与目标药物的关联性。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的mRNA和药物关联的预测方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的mRNA和药物关联的预测方法。
本申请的上述方案有如下的有益效果:
在本申请的一些实施例中,根据待测mRNA和目标药物的初始特征向量、超图特征向量表示,构建跨视图对比损失,再根据跨视图对比损失分别对待测mRNA和目标药物的初始特征向量进行反向传播更新,能够获得更加精确的特征向量,从而提高待测mRNA和目标药物关联性的预测的准确性。
本申请的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的mRNA和药物关联的预测方法的流程图;
图2为本申请一实施例提供的mRNA和药物关联的预测方法与其他现有技术性能比较ROC曲线图;
图3为本申请一实施例提供的mRNA和药物关联的预测方法与其他现有技术性能比较PR曲线图;
图4为本申请一实施例提供的mRNA和药物关联的预测装置的结构示意图;
图5为本申请一实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
针对目前mRNA和药物关联性的预测方法准确性不高的问题,本申请提供了一种mRNA和药物关联的预测方法、装置、终端设备及介质,其中,mRNA和药物关联的预测方法根据待测mRNA和目标药物的初始特征向量、超图特征向量表示,构建跨视图对比损失,再根据跨视图对比损失分别对待测mRNA和目标药物的初始特征向量进行反向传播更新,能够获得更加精确的特征向量,从而提高待测mRNA和目标药物关联性的预测的准确性。
如图1所示,本申请提供的mRNA和药物关联的预测方法主要包括以下步骤:
步骤1,在预先构建的由待测mRNA和目标药物的关联二分图上运行信息聚合神经网络模型,分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到待测mRNA的初始特征向量和目标药物的初始特征向量。
在本申请的实施例中,上述信息聚合神经网络模型为图卷积神经网络模型。
需要说明的是,上述关联二分图的构建,基于由待测mRNA和目标药物构成的关联对,可采用常见的二分图构建方法实现。在本申请的一些实施例中,上述关联对可以从RNAacrDrug数据库(包含来自多组学数据的与药物敏感性相关的RNA)中获取。
为了增加关联性预测模型的可信度,在本申请的一些实施例中,将获取的4198837种关联对按照8:1:1的比例,对应划分成训练集,验证集以及测试集。之后,利用训练集对关联性预测模型进行训练,得到训练后的关联性预测模型,再利用验证集对训练后的关联性预测模型的参数进行优化,最后在测试集中对预测模型的性能进行评估。
上述待测mRNA为从数据库中获取的多个mRNA中的一个,上述目标药物为从数据库中获取的多个药物中的一个。
步骤1中的分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到待测mRNA的初始特征向量和目标药物的初始特征向量的具体过程如下:
在关联二分图上运行图卷积网络方法,通过计算公式
得到待测mRNA的初始特征向量和目标药物的初始特征向量/>其中,/>表示第l层神经网络输出的第i个待测mRNA的初始特征向量,/>表示第l层神经网络输出的第j个目标药物的初始特征向量,i=1,2,...,I,I表示步骤1中预先获取的mRNA的总数量,j=1,2,...,J,J表示步骤1中预先获取的药物的总数量,/>表示关联二分图中待测mRNA的邻居节点聚合信息,/> 表示关联二分图中目标药物的邻居节点聚合信息,w表示向量维度,R表示实数域,σ(·)表示非线性激活函数,/>表示归一化邻接矩阵,/> D(m)表示待测mRNA的对角度矩阵,D(m)∈RI×I,D(d)表示目标药物的对角度矩阵,D(d)∈RJ×J,Ni表示关联二分图中待测mRNA的中心节点mi的邻近节点,Nj表示关联二分图中目标药物的中心节点dj的邻近节点,/>表示图卷积神经网络模型第l-1层输出的第i个待测mRNA的向量表示,/>表示图卷积神经网络模型第l-1层输出的第j个目标药物的向量表示,/>表示第l层神经网络中第i个mRNA信息聚合之后的向量表示,/>表示第l层神经网络中第j个药物信息聚合之后的向量表示,Ai,j表示第i个待测mRNA和第j个目标药物的邻接矩阵。
值得一提的是,本申请在局部邻居信息聚合过程中,引入了残差连接,可以强调中心节点(mi和dj)的语义信息并缓解图卷机网络层聚合过程的过度平滑问题。
步骤2,根据关联二分图,构建关联超图,得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示。
需要说明的是,在本申请的一些实施例中,使用了超图卷积网络来描述关联二分图中待测mRNA节点(目标药物节点)之间的高阶表示,以获得待测mRNA节点和目标药物节点基于超图卷积网络的向量表示(超图特征向量表示)。
步骤2的具体过程为:首先根据关联二分图,构建关联超图,此过程可采用常见的超图构建方法实现,在此不对其进行赘述;而后,本申请使用了参数化结构矩阵(H(m)和H(d))以减少模型的参数,从而简化计算;然后,对超图信息进行聚合,本申请的实施例中,在超图信息聚合层(超图卷积网络信息聚合层)引入了残差连接,可以提高求解超图向量表示的准确性,最后得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示。
示例性的,通过计算公式
ψ(X)=σ(VX)+X
得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示/>其中,/>表示待测mRNA在第l个超图信息聚合层下的超边特征向量表示,/>表示目标药物在第l个超图信息聚合层下的超边特征向量表示,W(m)表示待测mRNA的超边的特征矩阵,W(m)∈Rd×H,W(d)表示目标药物的超边的特征矩阵,W(d)∈Rd×H,Λ(m)表示待测mRNA的超图特征向量,Λ(d)表示目标药物的超图特征向量,Λ(m)由所述待测mRNA的向量表示E(m)和待测mRNA对应的超图结构矩阵H(m)聚合得到,Λ(d)由目标药物的向量表示E(d)和目标药物对应的超图结构矩阵H(d)聚合得到,Λ∈RH×d,E∈RK×d,H∈RK×H,K=I或K=J,c表示超图向量表示层的数量,ψ(·)表示超图信息聚合层的编码函数,X表示参数矩阵,X∈RH×H,σ'表示LeakyReLU(带泄漏线性整流)映射。
步骤3,分别针对待测mRNA和目标药物二者中的一者,根据该者的初始特征向量和超图特征向量表示,构建跨视图对比损失,得到待测mRNA的视图对比损失和目标药物的跨视图对比损失。
具体的,根据待测mRNA的初始特征向量和超图特征向量表示,待测mRNA的构建跨视图对比损失;根据目标药物的初始特征向量和超图特征向量表示,构建目标药物的跨视图对比损失。
示例性的,通过计算公式
得到待测mRNA的视图对比损失和目标药物的跨视图对比损失/>i-表示第i个mRNA的负样本,j-表示第j个药物的负样本。
上述负样本表示不存在已验证的关联。示例性的,mRNAm,i-表示第m个mRNA和第i个药物不存在已经验证的关联。
需要说明的是,在本申请的一些实施例中,将相同mRNA(zm,l,Γm,l)和药物(zd,l,Γd,l)的不同视图作为正样本对,不同mRNA和药物的不同视图作为负样本对。
在本申请的一些实施例中,可以通过计算公式
缓解跨视图的对比学习方法的引入过拟合的问题;其中,:=表示赋值运算符,表示逐元素乘法,MG∈RI×J和MH∈RJ×H均表示具有丢失概率为μ的二进制掩码矩阵。
步骤4,根据待测mRNA的跨视图对比损失和目标药物的跨视图对比损失,构建综合损失。
具体的,通过计算公式
得到综合损失L;其中,表示正样本的关联分数,/>表示负样本的关联分数,Θ表示模型参数,ri表示第i个mRNA,mj表示第j个药物。
在本申请的一些实施例中,上述综合损失L需要利用Adam(Adaptive MomentEstimation,自适应矩估计)优化器来进行最小化处理,以达到模型拟合的效果(得到的特征向量最准确)。
步骤5,利用综合损失,分别对待测mRNA的初始特征向量和目标药物的初始特征向量进行反向传播更新,得到待测mRNA的中间特征向量和目标药物的中间特征向量。
在本申请的一些实施例中,上述反向传播更新的具体过程为调用pytorch(一个开源的Python机器学习库)的loss反向传播,对待测mRNA的初始特征向量和目标药物的初始特征向量进行梯度更新。
步骤6,若待测mRNA的中间特征向量和目标药物的中间特征向量满足预设更新终止标准,则将待测mRNA的中间特征向量作为待测mRNA的最终特征向量,将目标药物的中间特征向量作为目标药物的最终特征向量;否则,
将待测mRNA的中间特征向量作为步骤1中的待测mRNA的向量表示、目标药物的中间特征向量作为步骤1中的目标药物的向量表示,返回执行步骤1。
在本申请的实施例中,上述更新终止标准的判断过程如下:
步骤a,根据待测mRNA的中间特征向量和目标药物的中间特征向量,分别计算AUC值和AUPR值。
在此计算AUC值(ROC曲线(接收者操作特性曲线)下与坐标轴围成的面积)和AUPR值(RC曲线下与坐标轴围成的面积)是为了判断此时的待测lncRNA的中间特征向量和目标药物的中间特征向量是否已经满足更新终止条件(待测mRNA的最优的中间特征向量和目标药物的最优的中间特征向量)。当不满足更新终止条件时,会反复执行此步骤,直至模型拟合(求解出待测mRNA的最优的中间特征向量和目标药物的最优的中间特征向量),提高了特征向量的准确性,从而提高了关联性预测的准确性。
需要说明的是,计算AUC值和AUPR值,属于公知常识,在此不对其计算过程做赘述。
步骤b,若AUC值和AUPR值达到最大值,则确定待测mRNA的中间特征向量和目标药物的中间特征向量满足预设更新终止条件;否则,确定待测mRNA的中间特征向量和目标药物的中间特征向量不满足预设更新终止条件。
步骤7,根据待测mRNA的最终特征向量和目标药物的最终特征向量,构建待测mRNA与目标药物的关联性预测模型。
步骤8,利用关联性预测模型预测待测mRNA与目标药物的关联性。
示例性的,将待测mRNA的最终特征向量和目标药物的最终特征向量输入关联性预测模型,得到待测mRNA和目标药物的关联分数,该关联分数越大,表明待测mRNA和目标药物的关联性越强。
下面对步骤7(根据待测mRNA的最终特征向量和目标药物的最终特征向量,构建待测mRNA与目标药物的关联性预测模型)的具体过程做示例性说明。
步骤7.1,通过计算公式
得到待测mRNA的最终向量表示和目标药物的最终向量表示/>
其中,表示第l层超图卷积网络中第i个mRNA信息聚合之后的向量表示,/>表示第l层超图卷积网络中第j个药物信息聚合之后的向量表示。
步骤7.2,根据和/>构建关联性预测模型。
步骤7.2的构建的关联性预测模型的表达式如下:
其中,表示图卷积网络第l层中第i个mRNA的特征向量,/>表示图卷积网络第l层中第j个药物的特征向量,/>表示第i个mRNA和第j个药物之间的关联分数。
在一些实施例中,为了验证本申请提供的mRNA和药物关联的预测方法的准确性,将本申请提供的mRNA和药物关联的预测方法与目前现有技术的性能,进行了比较,结果如图2和图3所示,图2的横坐标表示假正率,图2的纵坐标表示真正率,图3的横坐标表示召回率,图3的纵坐标表示准确率,图中(图2和图3),MF表示矩阵分解算法;GCN表示图卷积网络算法;LightGCN表示图卷积网络的一种优化方法,该方法摒弃了传统图卷积网络的特征变化和非线性激活,只保留了图卷积网络的节点聚合;GCL-ED表示基于边的随机丢失的数据增广方法的对比学习方法;GCL-ND表示基于节点的随机丢失的数据增广方法的对比学习方法;GCL-RW表示基于随机游走的数据增广方法的对比学习方法;MLRDFM表示MLRDFM整合了四种miRNA和两种疾病的相似性,通过深度分解机器方法预测miRNA与疾病的关联的方法;HCCFMDA表示表示本申请提供的mRNA和药物关联的预测方法。综合对比可见,本申请提供的mRNA和药物关联的预测方法的性能均优于其他现有技术。
在另一些实施例中,为了验证图卷积网络,超图卷积网络以及对比学习对本发明性能的影响,针对进行了不同的实验,实验结果如下:
其中P表示使用了该组件,O表示没有使用该组件。
由上表可见,如果只使用图卷积网络聚合邻居节点信息或者只使用超图卷积网络获取节点之间的高阶信息,使用超图卷积网络的效果更加显着的,并且两者的结合也显着提高了模型的预测的性能。
由上述步骤可见,本申请提供的mRNA和药物关联的预测方法根据待测mRNA和目标药物的初始特征向量、超图特征向量表示,构建跨视图对比损失,再根据跨视图对比损失分别对待测mRNA和目标药物的初始特征向量进行反向传播更新,能够获得更加精确的特征向量,从而提高待测mRNA和目标药物关联性的预测的准确性。
下面结合具体实施例对本申请提供的mRNA和药物关联的预测装置进行示例性的说明。
如图4所示,本申请的实施例提供了一种mRNA和药物关联的预测装置,该mRNA和药物关联的预测装置400包括:
初始化模块401,用于在预先构建的由待测mRNA和目标药物的关联二分图上运行信息聚合神经网络模型,分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到待测mRNA的初始特征向量和目标药物的初始特征向量;
超图特征向量模块402,用于根据关联二分图,构建关联超图,得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示;
对比损失模块403,用于分别针对待测mRNA和目标药物二者中的一者,根据该者的初始特征向量和超图特征向量表示,构建跨视图对比损失,得到待测mRNA的视图对比损失和目标药物的跨视图对比损失;
特征向量优化模块404,用于根据待测mRNA的跨视图对比损失函数和目标药物的跨视图对比损失函数,构建综合损失;
中间特征向量模块405,用于利用综合损失,分别对待测mRNA的初始特征向量和目标药物的初始特征向量进行反向传播更新,得到待测mRNA的中间特征向量和目标药物的中间特征向量;
最终特征向量模块406,用于若待测mRNA的中间特征向量和目标药物的中间特征向量满足预设更新终止标准,则将待测mRNA的中间特征向量作为待测mRNA的最终特征向量,将目标药物的中间特征向量作为目标药物的最终特征向量;否则,
将待测mRNA的中间特征向量作为初始化模块中的待测mRNA的向量表示、目标药物的中间特征向量作为初始化模块中的目标药物的向量表示,返回执行初始化模块;
关联性预测模型模块407,用于根据待测mRNA的最终特征向量和目标药物的最终特征向量,构建待测mRNA与目标药物的关联性预测模型;
预测模块408,用于利用关联性预测模型预测待测mRNA与目标药物的关联性。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
如图5所示,本申请的实施例提供了一种终端设备,如图5所示,该实施例的终端设备D10包括:至少一个处理器D100(图5中仅示出一个处理器)、存储器D101以及存储在所述存储器D101中并可在所述至少一个处理器D100上运行的计算机程序D102,所述处理器D100执行所述计算机程序D102时实现上述任意各个方法实施例中的步骤。
具体的,所述处理器D100执行所述计算机程序D102时,通过在预先构建的由待测mRNA和目标药物的关联二分图上运行信息聚合神经网络模型,分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到待测mRNA的初始特征向量和目标药物的初始特征向量,再根据关联二分图,构建关联超图,得到待测mRNA的超图特征向量表示和目标药物的超图特征向量表示,然后分别针对待测mRNA和目标药物二者中的一者,根据该者的初始特征向量和超图特征向量表示,构建跨视图对比损失,得到待测mRNA的视图对比损失和目标药物的跨视图对比损失,再根据待测mRNA的跨视图对比损失和目标药物的跨视图对比损失,构建综合损失,随后利用综合损失,分别对待测mRNA的初始特征向量和目标药物的初始特征向量进行反向传播更新,得到待测mRNA的中间特征向量和目标药物的中间特征向量,若待测mRNA的中间特征向量和目标药物的中间特征向量满足预设更新终止标准,则将待测mRNA的中间特征向量作为待测mRNA的最终特征向量,将目标药物的中间特征向量作为目标药物的最终特征向量,然后根据待测mRNA的最终特征向量和目标药物的最终特征向量,构建待测mRNA与目标药物的关联性预测模型,最后利用关联性预测模型预测待测mRNA与目标药物的关联性。其中,根据待测mRNA和目标药物的初始特征向量、超图特征向量表示,构建跨视图对比损失,再根据跨视图对比损失分别对待测mRNA和目标药物的初始特征向量进行反向传播更新,能够获得更加精确的特征向量,从而提高待测mRNA和目标药物关联性的预测的准确性。
所称处理器D100可以是中央处理单元(CPU,CentralProcessing Unit),该处理器D100还可以是其他通用处理器、数字信号处理器(DSP,Digital Signal Processor)、专用集成电路(ASIC,Application Specific Integrated Circuit)、现成可编程门阵列(FPGA,Field-Programmable GateArray)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器D101在一些实施例中可以是所述终端设备D10的内部存储单元,例如终端设备D10的硬盘或内存。所述存储器D101在另一些实施例中也可以是所述终端设备D10的外部存储设备,例如所述终端设备D10上配备的插接式硬盘,智能存储卡(SMC,SmartMedia Card),安全数字(SD,Secure Digital)卡,闪存卡(Flash Card)等。进一步地,所述存储器D101还可以既包括所述终端设备D10的内部存储单元也包括外部存储设备。所述存储器D101用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器D101还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到mRNA和药物关联的预测装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
本申请具有以下优点:
1、提出了一种预测mRNA和药物敏感性关联的通用计算框架,在本框架中,我们使用图卷积网络方法在mRNA-药物二部图(二分图)上聚合邻居节点之间的高阶关系,并且使用超图卷积网络方法来获取mRNA-药物二部图节点之间的高阶关系,并引入超图对比学习方法来提高模型的预测能力,最后通过内积来获取特定的mRNA-药物敏感性的关联分数,分数越高,说明该mRNA和药物更可能存在潜在的关联。
2、可以在很短的时间内进行大规模的mRNA-药物敏感性关联对的预测,有效解决了生物实验成本高,盲目性大的问题。
以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种mRNA和药物关联的预测方法,其特征在于,包括:
步骤1,在预先构建的由待测mRNA和目标药物构成的关联二分图上运行信息聚合神经网络模型,分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到所述待测mRNA的初始特征向量和所述目标药物的初始特征向量;
步骤2,根据所述关联二分图,构建关联超图,得到所述待测mRNA的超图特征向量表示和所述目标药物的超图特征向量表示;
步骤3,分别针对所述待测mRNA和所述目标药物二者中的一者,根据该者的初始特征向量和超图特征向量表示,构建跨视图对比损失,得到所述待测mRNA的视图对比损失和所述目标药物的跨视图对比损失;
步骤4,根据所述待测mRNA的跨视图对比损失和所述目标药物的跨视图对比损失,构建综合损失;
步骤5,利用所述综合损失,分别对所述待测mRNA的初始特征向量和所述目标药物的初始特征向量进行反向传播更新,得到所述待测mRNA的中间特征向量和所述目标药物的中间特征向量;
步骤6,若所述待测mRNA的中间特征向量和所述目标药物的中间特征向量满足预设更新终止标准,则将所述待测mRNA的中间特征向量作为所述待测mRNA的最终特征向量,将所述目标药物的中间特征向量作为所述目标药物的最终特征向量;否则,
将所述待测mRNA的中间特征向量作为步骤1中的所述待测mRNA的向量表示、所述目标药物的中间特征向量作为步骤1中的所述目标药物的向量表示,返回执行步骤1;
步骤7,根据所述待测mRNA的最终特征向量和所述目标药物的最终特征向量,构建所述待测mRNA与所述目标药物的关联性预测模型;
步骤8,利用所述关联性预测模型预测待测mRNA与目标药物的关联性。
2.根据权利要求1所述的预测方法,其特征在于,所述步骤1中的信息聚合神经网络模型为图卷积神经网络模型;
所述步骤1中的分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到所述待测mRNA的初始特征向量和所述目标药物的初始特征向量,包括:
通过计算公式
得到所述待测mRNA的初始特征向量和所述目标药物的初始特征向量/>其中,表示第l层神经网络输出的第i个待测mRNA的初始特征向量,/>表示第l层神经网络输出的第j个目标药物的初始特征向量,i=1,2,...,I,I表示所述步骤1中预先获取的mRNA的总数量,j=1,2,...,J,J表示所述步骤1中预先获取的药物的总数量,/>表示所述关联二分图中待测mRNA的邻居节点聚合信息,/> 表示所述关联二分图中目标药物的邻居节点聚合信息,/>w表示向量维度,R表示实数域,σ(·)表示非线性激活函数,/>表示归一化邻接矩阵,/>D(m)表示所述待测mRNA的对角度矩阵,D(m)∈RI×I,D(d)表示所述目标药物的对角度矩阵,D(d)∈RJ×J,Ni表示所述关联二分图中所述待测mRNA的中心节点mi的邻近节点,Nj表示所述关联二分图中所述目标药物的中心节点dj的邻近节点,/>表示所述图卷积神经网络模型第l-1层输出的第i个待测mRNA的向量表示,/>表示所述图卷积神经网络模型第l-1层输出的第j个目标药物的向量表示,/>表示第l层神经网络中第i个mRNA信息聚合之后的向量表示,/>表示第l层神经网络中第j个药物信息聚合之后的向量表示,Ai,j表示第i个待测mRNA和第j个目标药物的邻接矩阵。
3.根据权利要求2所述的预测方法,其特征在于,所述步骤2包括:
通过计算公式
ψ(X)=σ(VX)+X
得到所述待测mRNA的超图特征向量表示和所述目标药物的超图特征向量表示其中,/>表示所述待测mRNA在第l个超图信息聚合层下的超边特征向量表示,/>表示所述目标药物在第l个超图信息聚合层下的超边特征向量表示,W(m)表示所述待测mRNA的超边的特征矩阵,W(m)∈Rd×H,W(d)表示所述目标药物的超边的特征矩阵,W(d)∈Rd×H,Λ(m)表示所述待测mRNA的超图特征向量,Λ(d)表示所述目标药物的超图特征向量,Λ(m)由所述待测mRNA的向量表示E(m)和所述待测mRNA对应的超图结构矩阵H(m)聚合得到,Λ(d)由所述目标药物的向量表示E(d)和所述目标药物对应的超图结构矩阵H(d)聚合得到,Λ∈RH×d,E∈RK ×d,H∈RK×H,K=I或K=J,c表示超图向量表示层的数量,ψ(·)表示超图信息聚合层的编码函数,X表示参数矩阵,X∈RH×H,σ'表示LeakyReLU映射。
4.根据权利要求3所述的预测方法,其特征在于,所述步骤3包括:
通过计算公式
得到所述待测mRNA的视图对比损失和所述目标药物的跨视图对比损失/>i-表示第i个mRNA的负样本,i-表示第i个药物的负样本。
5.根据权利要求4所述的预测方法,其特征在于,所述步骤4包括:
通过计算公式
得到所述综合损失L;其中,表示正样本的关联分数,/>表示负样本的关联分数,Θ表示模型参数,ri表示第i个mRNA,mj表示第j个药物。
6.根据权利要求5所述的预测方法,其特征在于,所述步骤7包括:
通过计算公式
得到所述待测mRNA的最终向量表示和所述目标药物的最终向量表示/>其中,表示第l层超图卷积网络中第i个mRNA信息聚合之后的向量表示,/>表示第l层超图卷积网络中第j个药物信息聚合之后的向量表示;
根据和/>构建所述关联性预测模型。
7.根据权利要求6所述的预测方法,其特征在于,所述关联性预测模型的表达式如下:
其中,表示图卷积网络第l层中第i个mRNA的特征向量,/>表示图卷积网络第l层中第j个药物的特征向量,/>表示第i个mRNA和第j个药物之间的关联分数。
8.一种mRNA和药物关联的预测装置,其特征在于,包括:
初始化模块,用于在预先构建的由待测mRNA和目标药物的关联二分图上运行信息聚合神经网络模型,分别对预先初始化的待测mRNA的向量表示和预先初始化的目标药物的向量表示进行邻居节点聚合,得到所述待测mRNA的初始特征向量和所述目标药物的初始特征向量;
超图特征向量模块,用于根据所述关联二分图,构建关联超图,得到所述待测mRNA的超图特征向量表示和所述目标药物的超图特征向量表示;
对比损失模块,用于分别针对所述待测mRNA和所述目标药物二者中的一者,根据该者的初始特征向量和超图特征向量表示,构建跨视图对比损失,得到所述待测mRNA的视图对比损失和所述目标药物的跨视图对比损失;
特征向量优化模块,用于根据所述待测mRNA的跨视图对比损失函数和所述目标药物的跨视图对比损失函数,构建综合损失;
中间特征向量,用于利用所述综合损失,分别对所述待测mRNA的初始特征向量和所述目标药物的初始特征向量进行反向传播更新,得到所述待测mRNA的中间特征向量和所述目标药物的中间特征向量;
最终特征向量模块,用于若所述待测mRNA的中间特征向量和所述目标药物的中间特征向量满足预设更新终止标准,则将所述待测mRNA的中间特征向量作为所述待测mRNA的最终特征向量,将所述目标药物的中间特征向量作为所述目标药物的最终特征向量;否则,
将所述待测mRNA的中间特征向量作为初始化模块中的所述待测mRNA的向量表示、所述目标药物的中间特征向量作为初始化模块中的所述目标药物的向量表示,返回执行初始化模块;
关联性预测模型模块,用于根据所述待测mRNA的最终特征向量和所述目标药物的最终特征向量,构建所述待测mRNA与所述目标药物的关联性预测模型;
预测模块,用于利用所述关联性预测模型预测待测mRNA与目标药物的关联性。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的mRNA和药物关联的预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的mRNA和药物关联的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310157523.6A CN116453585A (zh) | 2023-02-23 | 2023-02-23 | mRNA和药物关联的预测方法、装置、终端设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310157523.6A CN116453585A (zh) | 2023-02-23 | 2023-02-23 | mRNA和药物关联的预测方法、装置、终端设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116453585A true CN116453585A (zh) | 2023-07-18 |
Family
ID=87124556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310157523.6A Pending CN116453585A (zh) | 2023-02-23 | 2023-02-23 | mRNA和药物关联的预测方法、装置、终端设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116453585A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116844645A (zh) * | 2023-08-31 | 2023-10-03 | 云南师范大学 | 一种基于多视角分层超图的基因调控网络推断方法 |
-
2023
- 2023-02-23 CN CN202310157523.6A patent/CN116453585A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116844645A (zh) * | 2023-08-31 | 2023-10-03 | 云南师范大学 | 一种基于多视角分层超图的基因调控网络推断方法 |
CN116844645B (zh) * | 2023-08-31 | 2023-11-17 | 云南师范大学 | 一种基于多视角分层超图的基因调控网络推断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110689920B (zh) | 一种基于深度学习的蛋白质-配体结合位点预测方法 | |
Sun et al. | Large-scale multiple testing under dependence | |
CN111681705B (zh) | 一种miRNA-疾病关联预测方法、系统、终端以及存储介质 | |
WO2021089013A1 (zh) | 空间图卷积网络的训练方法、电子设备及存储介质 | |
US20160026917A1 (en) | Ranking of random batches to identify predictive features | |
CN110827924B (zh) | 基因表达数据的聚类方法、装置、计算机设备及存储介质 | |
Cui et al. | Learning global pairwise interactions with Bayesian neural networks | |
Misir et al. | A reduced set of features for chronic kidney disease prediction | |
CN111564179B (zh) | 一种基于三元组神经网络的物种生物学分类方法及系统 | |
CN116453585A (zh) | mRNA和药物关联的预测方法、装置、终端设备及介质 | |
Sondhi et al. | The reduced PC-algorithm: improved causal structure learning in large random networks | |
CN114613437A (zh) | 一种基于异构图的miRNA与疾病关联预测方法及系统 | |
Kundu et al. | Efficient Bayesian regularization for graphical model selection | |
CN113948160A (zh) | 一种药物筛选方法、设备及存储介质 | |
EP3540648A1 (en) | Two-class classification method for predicting class to which specific item belongs, and computing device using same | |
CN115798598A (zh) | 一种基于超图的miRNA-疾病关联预测模型及方法 | |
CN110751183A (zh) | 影像数据分类模型的生成方法、影像数据分类方法及装置 | |
Padilla et al. | Estimators of the local false discovery rate designed for small numbers of tests | |
Tian et al. | A framework for stability‐based module detection in correlation graphs | |
WO2023231720A1 (zh) | 药物疾病关联预测方法、装置、电子设备和可读存储介质 | |
CN110837853A (zh) | 一种快速分类模型构建方法 | |
CN116313148A (zh) | 一种药物敏感性的预测方法、装置、终端设备及介质 | |
CN116232694A (zh) | 轻量级网络入侵检测方法、装置、电子设备及存储介质 | |
CN112599202A (zh) | 疾病相关miRNA预测系统 | |
CN116129989A (zh) | 一种药物关联性的预测方法、装置、终端设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |