CN113436729A - 一种基于异构图卷积神经网络的合成致死相互作用预测方法 - Google Patents
一种基于异构图卷积神经网络的合成致死相互作用预测方法 Download PDFInfo
- Publication number
- CN113436729A CN113436729A CN202110793581.9A CN202110793581A CN113436729A CN 113436729 A CN113436729 A CN 113436729A CN 202110793581 A CN202110793581 A CN 202110793581A CN 113436729 A CN113436729 A CN 113436729A
- Authority
- CN
- China
- Prior art keywords
- genes
- gene
- ppi
- data
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000003993 interaction Effects 0.000 title claims abstract description 26
- 231100000518 lethal Toxicity 0.000 title claims abstract description 22
- 230000001665 lethal effect Effects 0.000 title claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 20
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 104
- 239000011159 matrix material Substances 0.000 claims abstract description 20
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 14
- 238000005295 random walk Methods 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 5
- 238000005259 measurement Methods 0.000 claims abstract description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 2
- 238000011176 pooling Methods 0.000 claims description 2
- 239000013598 vector Substances 0.000 claims description 2
- 231100000225 lethality Toxicity 0.000 claims 8
- 238000010276 construction Methods 0.000 claims 1
- 230000004927 fusion Effects 0.000 claims 1
- 238000007418 data mining Methods 0.000 abstract description 5
- 230000004850 protein–protein interaction Effects 0.000 description 21
- 230000006870 function Effects 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 101100126955 Arabidopsis thaliana KCS2 gene Proteins 0.000 description 2
- 244000260524 Chrysanthemum balsamita Species 0.000 description 2
- 235000005633 Chrysanthemum balsamita Nutrition 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及生物信息学中的数据挖掘领域,具体涉及一种基于异构图卷积神经网络的合成致死相互作用预测方法。其发明内容主要包括:(1)收集已知合成致死相互关联数据、基因GO信息数据、基因PPI数据;(2)进行基因GO相似性分析,利用基于语义基因功能相似性度量算法对基因与基因之间的GO功能相似性进行度量,构建基因基于GO功能相似性的特征;(3)进行基因基于PPI特征的构建,利用蛋白质相互关联数据构建蛋白质和蛋白质之间的关联网络,通过随机游走的方式获取每一个基因基于蛋白质相互关联网络的特征;(4)利用合成致死相互关联数据构建邻接矩阵,融合基因基于GO功能相似性特征和基于PPI特征的领域特征;(5)构建基于图卷积神经网络的合成致死对预测模型,预测潜在的合成致死相互作用,得到最终结果。
Description
技术领域
本发明涉及生物信息学中的数据挖掘领域,具体涉及一种基于异构图卷积神经网络的合成致死相互作用预测方法。
背景技术
合成致死(SL)在肿瘤治疗中起着至关重要的作用,因为它能够在不干扰正常细胞的情况下识别特定的靶向基因来杀死肿瘤细胞。由于通过高通量湿实验设置验证SL对往往非常昂贵而且耗时,同时也面临着各种各样的挑战。因此,近年来,许多研究者试图通过使用计算方法来验证、预测SL对,从而显著降低了识别SL对相互作用的成本和时间。
早期的SL对识别的计算方法可以分为两大类:基于大数据和数据挖掘的方法。这种数据驱动的方法又包括生物网络拓扑的方法、数据挖掘方法和统计筛选的方法。与高通量湿实验方法相比,计算方法是一种有吸引力的替代方法,它可以帮助识别并优先排序潜在SL基因,以便进行进一步的实验验证。例如DAISY(Jerby-Arnon,L.,et al."PredictingCancer-Specific Vulnerability via Data-Driven Detection of SyntheticLethality."Cell 158.5(2014):1199-1209.)利用细胞拷贝数变化、shRNA和基因表达谱三种独立的策略来预测潜在的SL对。ISLE(Sang,L.J.,et al."Harnessing syntheticlethality to predict the response to cancer treatment."Nature Communications9.1(2018):2546-.)使用高通量实验筛选的SL对作为输入,通过滤波算法来获得临床相关的SL对。
此外,基于特征的机器学习的方法在解决许多生物问题方面也收到广泛关注,这些方法往往利用酵母和人类相关基因组学数据来预测潜在SL对,如基因表达、蛋白质-蛋白质相互作用(PPI)、功能/途径注释和进化模式等来构建基因的潜在特征,并使用可用的SL对数据集构建训练集,最后从这些训练集中学习预测模型。然而,基于特征的机器学习的方法往往是将基因孤立地映射成为了孤立的潜在表示,而忽视了邻居基因信息。同时,随着各大公开数据源的完善,可利用的生物学数据越来越多,选择哪些异构数据进行处理从而得到更有效的特征表示也成了一大挑战。
有鉴于此,本发明提出了一种基于异构图卷积神经网络的SL相互作用预测方法,以识别潜在的SL相互关联。
发明内容
本发明提出了一种基于异构图卷积神经网络的SL相互作用预测方法,用以识别潜在的SL相互作用,主要包括以下步骤:
(1)收集已知SL相互关联数据、基因GO信息数据、基因PPI数据;
(2)进行基因GO相似性分析,利用基于语义基因功能相似性度量算法对基因与基因之间的GO功能相似性进行度量,构建基因基于GO功能相似性的特征;
(3)进行基因基于PPI特征的构建,利用蛋白质相互关联数据构建蛋白质和蛋白质之间的关联网络,通过随机游走的方式获取每一个基因基于蛋白质相互关联网络的特征;
(4)利用SL相互关联数据构建邻接矩阵,融合基因基于GO功能相似性特征和基于PPI特征的领域特征;
(5)构建基于图卷积神经网络的SL对预测模型,预测潜在的SL相互作用,得到最终结果。
1.数据收集阶段
首先,在进行计算基因特征之前需要先获取基因的一些相关生物学数据,如GO信息数据以及基因的PPI数据,该方法中GO信息数据从GeneOntology数据库中提取,基因的PPI数据来自String数据库。
其次,现有已知的SL相互作用数据在这一步也要被收集,我们从SynLethDB数据库中下载了已经被观察到的SL相互作用,SynLethDB数据库是一个用于人类SL交互的综合数据库,该数据库整合了来自四种不同来源的SL相互作用数据:(1)手动整理的SL对,(2)通过文本挖掘得到的SL对,(3)由GenomeRNAi和shRNA等DECIPHER项目得到的相互作用,(4)由DAISY等计算方法得到的SL对。
2.基因GO相似性分析阶段
GeneOntology数据库为基因定义了三种GO术语描述:生物过程、细胞成分和分子功能,它们被表示为有向无环图,对于一个GO术语A,它可以表示为DAGA=(A,TA,EA),其中TA包含了术语A以及A在GO图上的所有祖先术语,EA表示的是所有与术语A相关的边。该方法定义了与术语A相关术语t对术语A的语义贡献SA(t)为:
其中,We是连接了t和t的子术语t′的边e∈EA的语义贡献因子。在获得DAGA中的所有术语的S值后,该方法将术语A的语义值SVA表示为:
对于术语A和术语B的有向无环图的表示DAGA=(A,TA,EA)和DAGB=(A,TB,EB),两个术语之间的GO相似性SGO(A,B)定义为:
其中,SA(t)和SB(t)分别是和术语A和术语B相关的术语t的语义贡献。在该公式的基础上该方法可以计算一个基因和其他所有基因之间的GO相似性,进而得到每一个基因基于GO相似性的特征。
3.构建基因基于PPI的特征阶段
在这项工作中,该方法专注于基因对应的蛋白质和蛋白质之间的相互关联,蛋白质与蛋白质之间的关联(PPI)往往可以以图的形式来表示,根据化学上具有SL对的基因之间的PPI往往关联更加密切的想法,使用基于随机游走的DeepWalk方法计算每一个节点的特征表示,对于每一个节点进行如下运算:
其中,RandomWalk是随机游走算法,该算法获取一个图G并以vi为根节点对随机节点进行均匀采样获得随机游走结果 其中t是随机游走长度。SkipGram是一种语言模型,它最大化了出现在一个窗口w中的单词在一个句子中的共现概率,使用SkipGram可以不断更新节点的特征表示。
4.融合特征阶段
图卷积神经网络(GCN)可以很好的基因的相邻基因的信息,一个SL图可以被定义为G=(u,ε),其中节点u表示基因,边ε表示两个基因之间存在SL关联。A∈Rn×n是G的邻接矩阵,其中n是基因的数量,在该邻接矩阵中如果两个基因之间存在SL关联,则对应位置值为1,否则为0。该方法在图卷积神经网络的第一层分别对基因基于GO相似性的特征和基于PPI的特征进行卷积:
其中⊙表示元素点乘,F1和F2分别是基因基于GO相似性的特征和基于PPI的特征。是丢弃矩阵,其中每个元素满足p-伯努利分布,p是丢弃率。和是待训练的权重矩阵。是标准化之后的邻接矩阵,其中 D是度矩阵。ReLU是非线性激活函数。在得到和两个考虑邻接矩阵信息的图嵌入矩阵之后,该方法使用最大池化层MaxPooling对两个图特征矩阵进行融合,得到新的图嵌入矩阵
5.构建异构图卷积神经网络的模型并预测合成致死相互作用
其中Dec(*)是内积解码器:
随后,该方法使用真实值yij和预测值y(i,j)之间的交叉熵损作为模型的损失函数,损失L定义为:
由于该损失是可微的,因此该方法使用基于梯度下降的Adam优化器对模型进行优化。最后,该方法通过对未知合成致死对的置信分数从高到底进行排列,分数越高越有可能是合成致死对。
具体实施方式
本发明涉及生物信息学中的数据挖掘领域,具体涉及一种基于异构图卷积神经网络的合成致死相互作用预测方法。下面描述本发明的具体实施方式。本领域技术人员应该理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的取证范围。
步骤1:从SynLethDB数据库中下载被实验验证的合成致死相互关联数据,并对数据处理筛选出所有的SL关联的基因。从GeneOntology基因本体论数据库下载基因GO数据,并提取其中的所有具有SL关联的相关基因的GO数据。从String数据库中下载PPI数据,由于PPI数据只有基因ID没有基因名,为了进行PPI特征分析,因此还需要在String数据库中下载基因ID和基因名的对照数据并根据PPI数据、基因ID和基因名的对照数据、SL相关基因构建涉及SL相关基因的PPI网络。
步骤2:根据上述提取出的GO数据,针对每一个基因,根据公式(1)求出所有与该基因相关的术语的语义贡献,并通过公式(2)求出该基因的语义值。针对每一对基因,通过公式(3)获取他们之间的GO相似性。每一个基因和其他所有基因的GO相似性组合成的一维向量便是该基因基于GO相似性的特征。
步骤3:根据步骤1构建出的PPI网络,根据公式(4),使用随机游走的方式获得每一个节点的特征表示,进而构建出基于PPI的特征矩阵。
步骤4:该方法提出了一种异构图卷积神经网络来学习每个基因的最终特征表示。首先,在该图卷积神经网络中将步骤2和步骤3获得的特征矩阵分别作为图卷积神经网络的第一层输入,根据公式(5)和公式(6),两个特征分别进行卷积,学习不同的权重矩阵。卷积之后会得到两个嵌入矩阵,根据公式(7)融合两个权重矩阵,在这一步中,该方法将来自基于GO相似性的特征和基于PPI的特征进行整合,得到每个基因全新的嵌入表达。接下来,根据公式(8)将融合后的特征作为图卷积神经网络第二层得而输入进行卷积,得到最终的嵌入矩阵。
步骤5:根据公式(9)和公式(10)对步骤4中得到的最终嵌入矩阵进行解码,并对解码后的置信分数和真实值求交叉熵,作为该模型的损失函数。在构建完成损失函数的基础上,使用Adam优化器对模型进行优化,优化完成后可以得到其他所有未知关联的基因对的分数。改实验重复10次,最后根据分数的平均值对所有的基因关联进行排序,这些关联的分数越高,则越有可能是潜在的合成致死对。
本领域技术人员可以理解,本发明的保护范围不局限于所述的具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征进行等同的更改或替换,需要注意的是,更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (6)
1.一种基于异构图卷积神经网络的合成致死相互作用预测方法,其特征在于实施步骤为:
(1)收集已知合成致死相互关联数据、基因GO信息数据、基因PPI数据;
(2)进行基因GO相似性分析,利用基于语义基因功能相似性度量算法对基因与基因之间的GO功能相似性进行度量,构建基因基于GO功能相似性的特征;
(3)进行基因基于PPI特征的构建,利用蛋白质相互关联数据构建蛋白质和蛋白质之间的关联网络,通过随机游走的方式获取每一个基因基于蛋白质相互关联网络的特征;
(4)利用合成致死相互关联数据构建邻接矩阵,融合基因基于GO功能相似性特征和基于PPI特征的领域特征;
(5)构建基于图卷积神经网络的合成致死对预测模型,预测潜在的合成致死相互作用,得到最终结果。
2.根据权利要求1所述的一种基于异构图卷积神经网络的合成致死相互作用预测方法,其特征在于数据收集阶段:
(1)从SynLethDB数据库中下载被实验验证的人类合成致死相互作用数据,将其作为分析数据的主体和目标矩阵;
(2)从GeneOntology数据库中提取基因的GO数据,以度量基因的功能相似性;
(3)从String蛋白质数据库中收集基因对应蛋白质的PPI数据,以度量基因的PPI相似性。
3.根据权利要求1所述的一种基于异构图卷积神经网络的合成致死相互作用预测方法,其特征在于GO功能相似性分析阶段:
(1)两个基因在GO术语描述上的距离越接近,则证明它们的功能相似性越高,所有基因的GO术语都通过有向无环图来表示,使用该有向无环图来计算每一个术语的语义值;
(2)利用已经获得的GO语义值,对两个术语之间的相似性进行度量,进而获得基因之间的功能相似性。
4.根据权利要求1所述的一种基于异构图卷积神经网络的合成致死相互作用预测方法,其特征在于基因基于PPI特征的构建阶段:
(1)在PPI上面具有相似拓扑结构的基因的潜在向量在潜在空间中也更加相似,使用Networkx构建PPI网络;
(2)基于PPI网络,使用随机游走的方式获取每一个节点在PPI网络拓扑结构上的潜在特征表示,进而获得对应基因的潜在特征。
5.根据权利要求1所述的一种基于异构图卷积神经网络的合成致死相互作用预测方法,其特征在于融合基因基于GO功能相似性特征和基于PPI特征的领域特征阶段:
(1)对于获得的基因基于GO功能相似性特征和基于PPI特征,先使用邻接矩阵分别获得对应基因结合领域基因特征之后的新的特征;
(2)随后,通过池化层更新刚刚获得的新的基于GO功能相似性特征和基于PPI特征。
6.根据权利要求1所述的一种基于异构图卷积神经网络的合成致死相互作用预测方法,其特征在于构建基于图卷积神经网络的合成致死对预测模型,根据更新后的特征、目标矩阵对该模型进行训练,获得最终的预测模型,对合成致死对进行预测并对其分数按降序排序,得分越高的越可能是潜在的合成致死相互作用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110793581.9A CN113436729A (zh) | 2021-07-08 | 2021-07-08 | 一种基于异构图卷积神经网络的合成致死相互作用预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110793581.9A CN113436729A (zh) | 2021-07-08 | 2021-07-08 | 一种基于异构图卷积神经网络的合成致死相互作用预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113436729A true CN113436729A (zh) | 2021-09-24 |
Family
ID=77760291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110793581.9A Pending CN113436729A (zh) | 2021-07-08 | 2021-07-08 | 一种基于异构图卷积神经网络的合成致死相互作用预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113436729A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115240777A (zh) * | 2022-08-10 | 2022-10-25 | 上海科技大学 | 基于图神经网络的合成致死基因预测方法、装置、终端及介质 |
CN116092577A (zh) * | 2023-01-09 | 2023-05-09 | 中国海洋大学 | 一种基于多源异质信息聚合的蛋白质功能预测方法 |
CN116453586A (zh) * | 2023-06-14 | 2023-07-18 | 北京望石智慧科技有限公司 | 一种细胞特异性合成致死对预测方法、装置、设备和介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789550A (zh) * | 2011-05-17 | 2012-11-21 | 中国科学院上海生命科学研究院 | 一种利用跨物种相似性的元分析方法 |
CN104011726A (zh) * | 2011-10-26 | 2014-08-27 | 加利福尼亚大学董事会 | 利用关于基因组模型的数据集成的途径识别算法(paradigm) |
CA2955554A1 (en) * | 2014-07-22 | 2016-01-28 | Vib Vzw | Methods to select for agents that stabilize protein complexes |
US20160283650A1 (en) * | 2015-02-26 | 2016-09-29 | The Trustees Of Columbia University In The City Of New York | Method for identifying synthetic lethality |
CN106355044A (zh) * | 2016-08-15 | 2017-01-25 | 上海电机学院 | 基于随机游走模型的蛋白质复合物识别方法 |
CN108681659A (zh) * | 2018-04-02 | 2018-10-19 | 首都师范大学 | 基于样本数据预测蛋白质复合物的方法 |
CN108804870A (zh) * | 2018-05-23 | 2018-11-13 | 扬州大学 | 基于Markov随机游走的关键蛋白质识别方法 |
CN109166604A (zh) * | 2018-08-22 | 2019-01-08 | 华东交通大学 | 一种融合多数据特征预测关键蛋白质的计算方法 |
CN110121345A (zh) * | 2017-06-04 | 2019-08-13 | 杨顿 | 利用基于myc癌基因过表达的合成致死的方法 |
CN110473592A (zh) * | 2019-07-31 | 2019-11-19 | 广东工业大学 | 基于图卷积网络的有监督的多视角人类协同致死基因预测方法 |
CN110797080A (zh) * | 2019-10-18 | 2020-02-14 | 湖南大学 | 基于跨物种迁移学习预测合成致死基因 |
CN110942803A (zh) * | 2019-11-22 | 2020-03-31 | 中南林业科技大学 | 一种LncRNA和环境因素关联关系的高效预测方法 |
CN111738318A (zh) * | 2020-06-11 | 2020-10-02 | 大连理工大学 | 一种基于图神经网络的超大图像分类方法 |
CN111863123A (zh) * | 2020-06-08 | 2020-10-30 | 深圳大学 | 一种基因合成致死关联预测方法 |
CN112259157A (zh) * | 2020-10-28 | 2021-01-22 | 杭州师范大学 | 一种蛋白质相互作用预测方法 |
-
2021
- 2021-07-08 CN CN202110793581.9A patent/CN113436729A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789550A (zh) * | 2011-05-17 | 2012-11-21 | 中国科学院上海生命科学研究院 | 一种利用跨物种相似性的元分析方法 |
CN104011726A (zh) * | 2011-10-26 | 2014-08-27 | 加利福尼亚大学董事会 | 利用关于基因组模型的数据集成的途径识别算法(paradigm) |
CA2955554A1 (en) * | 2014-07-22 | 2016-01-28 | Vib Vzw | Methods to select for agents that stabilize protein complexes |
US20160283650A1 (en) * | 2015-02-26 | 2016-09-29 | The Trustees Of Columbia University In The City Of New York | Method for identifying synthetic lethality |
CN106355044A (zh) * | 2016-08-15 | 2017-01-25 | 上海电机学院 | 基于随机游走模型的蛋白质复合物识别方法 |
CN110121345A (zh) * | 2017-06-04 | 2019-08-13 | 杨顿 | 利用基于myc癌基因过表达的合成致死的方法 |
CN108681659A (zh) * | 2018-04-02 | 2018-10-19 | 首都师范大学 | 基于样本数据预测蛋白质复合物的方法 |
CN108804870A (zh) * | 2018-05-23 | 2018-11-13 | 扬州大学 | 基于Markov随机游走的关键蛋白质识别方法 |
CN109166604A (zh) * | 2018-08-22 | 2019-01-08 | 华东交通大学 | 一种融合多数据特征预测关键蛋白质的计算方法 |
CN110473592A (zh) * | 2019-07-31 | 2019-11-19 | 广东工业大学 | 基于图卷积网络的有监督的多视角人类协同致死基因预测方法 |
CN110797080A (zh) * | 2019-10-18 | 2020-02-14 | 湖南大学 | 基于跨物种迁移学习预测合成致死基因 |
CN110942803A (zh) * | 2019-11-22 | 2020-03-31 | 中南林业科技大学 | 一种LncRNA和环境因素关联关系的高效预测方法 |
CN111863123A (zh) * | 2020-06-08 | 2020-10-30 | 深圳大学 | 一种基因合成致死关联预测方法 |
CN111738318A (zh) * | 2020-06-11 | 2020-10-02 | 大连理工大学 | 一种基于图神经网络的超大图像分类方法 |
CN112259157A (zh) * | 2020-10-28 | 2021-01-22 | 杭州师范大学 | 一种蛋白质相互作用预测方法 |
Non-Patent Citations (1)
Title |
---|
唐家琪;吴莉;: "基于PPI网络与机器学习的蛋白质功能预测方法", 计算机应用, no. 03 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115240777A (zh) * | 2022-08-10 | 2022-10-25 | 上海科技大学 | 基于图神经网络的合成致死基因预测方法、装置、终端及介质 |
CN115240777B (zh) * | 2022-08-10 | 2024-02-02 | 上海科技大学 | 基于图神经网络的合成致死基因预测方法、装置、终端及介质 |
CN116092577A (zh) * | 2023-01-09 | 2023-05-09 | 中国海洋大学 | 一种基于多源异质信息聚合的蛋白质功能预测方法 |
CN116092577B (zh) * | 2023-01-09 | 2024-01-05 | 中国海洋大学 | 一种基于多源异质信息聚合的蛋白质功能预测方法 |
CN116453586A (zh) * | 2023-06-14 | 2023-07-18 | 北京望石智慧科技有限公司 | 一种细胞特异性合成致死对预测方法、装置、设备和介质 |
CN116453586B (zh) * | 2023-06-14 | 2023-09-15 | 北京望石智慧科技有限公司 | 一种细胞特异性合成致死对预测方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113436729A (zh) | 一种基于异构图卷积神经网络的合成致死相互作用预测方法 | |
CN110070909B (zh) | 一种基于深度学习的融合多特征的蛋白质功能预测方法 | |
Eesa et al. | A novel feature-selection approach based on the cuttlefish optimization algorithm for intrusion detection systems | |
US8332347B2 (en) | System and method for inferring a network of associations | |
CN112599187B (zh) | 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法 | |
CN112507136A (zh) | 一种知识驱动的业务操作图谱构建方法 | |
CN114496092B (zh) | 基于图卷积网络的miRNA和疾病关联关系预测方法 | |
CN111370073B (zh) | 一种基于深度学习的药物互作规则预测方法 | |
CN113409892B (zh) | 基于图神经网络的miRNA-疾病关联关系预测方法 | |
CN112270958A (zh) | 一种基于分层深度学习miRNA-lncRNA互作关系的预测方法 | |
CN111540405B (zh) | 一种基于快速网络嵌入的疾病基因预测方法 | |
CN114999635A (zh) | 一种基于图卷积神经网络和node2vec的circRNA-疾病关联关系预测方法 | |
CN113488104A (zh) | 基于局部和全局的网络中心性分析的癌症驱动基因预测方法及系统 | |
Gupta et al. | Automated hierarchical density shaving: A robust automated clustering and visualization framework for large biological data sets | |
Wang et al. | A drug target interaction prediction based on LINE-RF learning | |
US20170076036A1 (en) | Protein functional and sub-cellular annotation in a proteome | |
CN114765063A (zh) | 基于图神经网络表征的蛋白质与核酸结合位点预测方法 | |
KR102407120B1 (ko) | 분자 단편 기반 분자 생성 딥러닝 모델을 이용한 분자 설계 방법 및 분석장치 | |
CN113539372A (zh) | 一种LncRNA和疾病关联关系的高效预测方法 | |
Ram et al. | Dynamic scaling factor based differential evolution with multi-layer perceptron for gene selection from pathway information of microarray data | |
CN113223609A (zh) | 基于异质信息网络的药物靶标相互作用预测方法 | |
CN111782818A (zh) | 生物医疗知识图谱的构建装置、方法、系统及存储器 | |
Cheng et al. | Segmentation of DNA using simple recurrent neural network | |
CN116386733A (zh) | 基于多视角多尺度多注意力机制的蛋白质功能预测方法 | |
CN114944191A (zh) | 一种基于网络爬虫和多模态特征的成分-靶点相互作用预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |