CN110473592A - 基于图卷积网络的有监督的多视角人类协同致死基因预测方法 - Google Patents

基于图卷积网络的有监督的多视角人类协同致死基因预测方法 Download PDF

Info

Publication number
CN110473592A
CN110473592A CN201910701944.4A CN201910701944A CN110473592A CN 110473592 A CN110473592 A CN 110473592A CN 201910701944 A CN201910701944 A CN 201910701944A CN 110473592 A CN110473592 A CN 110473592A
Authority
CN
China
Prior art keywords
prediction
matrix
angle
gene
visual angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910701944.4A
Other languages
English (en)
Other versions
CN110473592B (zh
Inventor
郝志峰
吴迪
蔡瑞初
温雯
陈学信
李梓健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910701944.4A priority Critical patent/CN110473592B/zh
Publication of CN110473592A publication Critical patent/CN110473592A/zh
Application granted granted Critical
Publication of CN110473592B publication Critical patent/CN110473592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开了一种基于图卷积网络的有监督多视角人类协同致死基因预测方法,包括以下步骤:以协同致死因数据集作为主视角,以u个基因本源相似度矩阵作为支撑视角;将协同致死基因对数据集划分训练集和测试集;将训练集转化为邻接矩阵Amian,将每个相似度矩阵进行k‑最近邻筛选,保留相似度最高的k条边,得到邻接矩阵Au;令X,Y=Amian;根据Amian和Au得到对应视角下的图卷积拉普拉斯矩阵构建包括图卷积网络编码层、基因关系解码层,基于注意力机制的多视角聚合层的预测模型;将输入预测模型,得到总的损失值;根据总的损失值计算梯度,利用梯度反向传播算法更新预测模型参数,直到预测模型收敛;将预测模型输出的预测分值输入激活函数,得到预测矩阵。

Description

基于图卷积网络的有监督的多视角人类协同致死基因预测 方法
技术领域
本发明涉及神经网络技术领域,更具体的,涉及一种基于图卷积网络的有监督的多视角人类协同致死基因预测方法。
背景技术
随着近年来深度学习技术的快速发展,深度学习技术在各个领域中都有应用开花结果,在生物信息领域中就有大量的数据,为深度学习技术的落地生根提供了充分的生长空间。在人类基因中存在这么一种基因对,当这对基因中的其中的某一个发生突变时,对细胞不会有严重的影响;当这对基因都发生了突变,就会导致细胞的死亡。这种现象我们称其为协同致死,构成协同致死的基因对就被称为协同致死基因对。通过收集基因性质和协同致死基因对的数据,可以用深度学习模型判断基因之间是否存在协同致死关系,进而为靶向的抗癌药物做出指导,推动抗癌药物的研究与开发。
在使用传统的深度学习方法对人类基因数据进行建模的时候,往往会将来自不同视角下的基因数据进行简单的叠加或者拼接,之后用于基因之间协同致死关系进行预测。这样的做法实际上是不周到的,首先是因为在预测协同致死关系时,协同致死关系数据集必然是与目标相关性最强的数据集;其次是在其他数据集中包含的信息并不完全是与协同致死关系相关的,如果在建模的过程中简单进行叠加或拼接就会将无关信息引入最终的预测中,甚至会降低了模型性能。因此,在使用传统的深度学习技术去解决多视角下人类协同致死基因预测的问题时受到了比较大的限制。
考虑到基因数据都可以转化描述的是基因之间的关系的形式,例如,协同致死关系在基因甲和基因乙之间是否存在,基因本体属性可以表现为基因甲和基因乙的相似度是多少,这样的形式可以用图来表示,相比传统的深度学习的中用向量表示的样本,图包含了丰富的结构信息,而这些结构信息表示了基因之间的相互关系,对于我们的预测是有帮助的。图卷积网络是近年提出的深度学习模型,它能同时抽取图表示和向量表示的样本信息,从而获得比传统的深度学习模型更好的效果。图卷积网络是深度学习领域近年来较热门的研究问题,也有不少关于多视角任务的工作,但是在这些工作中多个视角间是相对平等的关系,在协同致死关系预测的任务中,是包含一个主视角和多个支撑视角任务。因此如何选取合适的技术去处理支撑视角的数据,如何抽取支撑视角中和主视角相关的信息,如何处理主视角和支撑视角之间的关系,建立一个带有主视角的多视角预测模型具有一定的研究意义。
发明内容
本发明为了解决使用传统的深度学习技术去解决多视角下人类协同致死基因预测的问题时受到了比较大的限制的问题,提供了一种基于图卷积网络的有监督多视角人类协同致死基因预测方法,其主要利用支撑视角信息补充主视角信息进行人类协同致死基因对进行预测,本发明能准确预测两个基因是否构成协同致死关系。
为实现上述本发明目的,采用的技术方案如下:一种基于图卷积网络的有监督多视角人类协同致死基因预测方法,所述该方法包括以下步骤:
S1:以协同致死因数据集作为主视角,以u个基因本源相似度矩阵作为支撑视角;
S2:将已知的协同致死基因对数据集取Q作为训练集,其中0<Q<1,用基因关系的全集减去训练集得到的子集作为测试集;
S3:将训练集的数据转化为邻接矩阵Amian,并将每个支撑视角u的相似度矩阵进行k-最近邻筛选,对每个基因保留相似度最高的k条边,得到支撑视角的邻接矩阵Au;令X,Y=Amian,其中X作为所有基因的特征矩阵;Y作为监督信号,是训练时重构的目标矩阵;
S4:根据主视角的Amian和每个支撑视角u的邻接矩阵Au计算每个视角的拉普拉斯矩阵,得到对应视角下的图卷积拉普拉斯矩阵
S5:构建包括图卷积网络编码层、基因关系解码层,基于注意力机制的多视角聚合层的预测模型;
S6:将每个视角对应的拉普拉斯矩阵输入预测模型,得到总的损失函数,从而得到总的损失值;
S7:根据总的损失值计算梯度,利用梯度反向传播算法更新预测模型参数;
S8:重复S6~S7直到得到新的总的损失值大于或等于前W次的总的损失值的均值,停止更新,得到收敛的预测模型,其中P为正整数;
S9:将得到收敛的预测模型输出的预测分值输入激活函数,得到模型对协同致死关系的预测矩阵完成预测。
优选地,所述邻接矩阵Amian中的每一行或每一列都代表一个基因,邻接矩阵邻接中第i行第j列的数据称为边,代表基因i和基因j是否存在协同致死关系,若存在则为1,不存在则为0。
进一步地,所述步骤S4,将得到的Au和Amain分别代入下式中的A,分别得到对应视角下的图卷积拉普拉斯矩阵
式中,IN表示N阶单位阵;表示N阶对角阵,其对角线上的值为每一行的和,通称为度矩阵;IN都与邻接矩阵A维度相同。
再进一步地,步骤S5,所述图卷积网络编码层采用l层的图卷积网络来实现,其实现公式如下:
式中,l代表第l层图卷积网络;Zl为第l层图卷积网络输出的基因嵌入表达,当l=0时,Zl为节点特征,即Zl=X;表示步骤S4中计算得到的拉普拉斯矩阵;Wl为第l层图卷积网络的可学习参数,σ(·)为激活函数。
再进一步地,所述图卷积网络编码层采用2层的图卷积网络来实现,并设置第一层图卷积网络为512维,第二层图卷积网络为256维。
再进一步地,所述基因关系解码层将分别每个视角下的节点嵌入表达转化为对应的预测分值其计算方法如下:
经过基因关系解码层,就能得到主视角的预测分值和各个支撑视角的预测分值
再进一步地,所述基于注意力机制的多视角聚合层将所有支撑视角的预测分值输入注意力层中加权叠加后得到融合所有支撑视角的预测分值其计算方法如下:
假设有u个支撑视角,每个支撑视角对应一个预测分值首先计算非标准化的注意力权重:
式中,表示N×N的矩阵,N为基因数目;W和b均表示1×N的向量,表示注意力层中可学习的参数;
然后对g′u进行标准化处理,得到标准化的注意力权重gu,处理方法如下:
其中,上标u代表总共的u个支撑视角,T代表第T个支撑视角,1≤T≤u;下标i代表注意力权重向量g中第i个位置的值;
再对所有支撑视角的预测分值进行加权后叠加,得到计算方法如下:
其中diag(·)表示将1×N的向量转化为N×N的矩阵,*表示矩阵乘法;
最后根据主视角的预测分值和支撑视角的预测分值计算预测模型最终的预测分值计算方法如下:
其中⊙为逐项元素相乘。
再进一步地,所述步骤S6具体训练如下所示:
将每个视角对应的拉普拉斯矩阵分别输入独立的图卷积网络,每个图卷积网络都共享一个特征矩阵X,主视角和每个支撑视角分别输出协同致死关系预测矩阵输入基于注意力机制的多视角聚合层后得到模型最终的预测矩阵
然后根据监督信号Y,对每个视角和最终预测计算损失值;
其中支撑视角的损失计算方法如下:
其中主视角的损失计算方法如下:
最终预测的损失计算方式如下:
最后总的损失函数为:
losstotal=losssupp+lossmain+loss
其中:weight是根据Amian计算得到的权重系数,设Amian中节点总数为n,边总数为e,则
再进一步地,所述步骤S7,通过如下公式更新预测模型参数,
式中,θ表示预测模型中所有可学习的参数,包括图卷积网络中的Wl和多视角聚合层中的W和b;η表示学习率,表示梯度下降法中更新可学习参数时的步长,是人为设定的超参数。
再进一步地,将预测模型收敛后输出的预测分值输入激活函数,得到模型对协同致死关系的预测矩阵其计算方法如下:
本发明的有益效果如下:
1.本发明搭建了一个能够从人类协同致死基因数据和其他多个支撑视角的数据中抽取信息,并将多视角的信息进行聚合,再对人类协同致死基因进行预测的模型,并通过模型进行了训练,测试,最终生成一个训练好的人类协同致死基因预测模型,通过这个模型,可以准确预测两个基因是否构成协同致死关系。
2.本发明对每个视角的预测分值和支撑视角的注意力聚合机制都进行了带监督的训练,保证了每个视角抽取的信息都是与预测目标接近的。
3.本发明进行多视角融合时区分了主视角和支撑视角,将支撑视角的预测分值通过注意力机制叠加,然后与主视角的预测分值进行逐项元素相乘,最后再与主视角的预测分值相加得到最终的预测分值,从而提高预测精度。
附图说明
图1是本实施例所述预测方法的步骤流程图。
图2是本实施例对数据进行预处理的示意图。
图3是本实施例所述预测模型的结构示意图。
具体实施方式
下面结合附图和具体实施方式对本发明做详细描述。
实施例1
如图1、图2所示,一种基于图卷积网络的有监督的多视角人类协同致死基因预测方法,其包括如下步骤:
S1:为了方便本领域技术人员更好地理解本实施例的技术方案,下面以协同致死因数据集作为主视角,以两个基因本源相似度矩阵GO和CC作为支撑视角。
S2:将协同致死基因数据集取80%作为训练集,用基因关系的全集减去训练集得到的子集作为测试集,这样的测试集中会包含大量不构成协同致死关系的基因对,所述的测试集是作为真实的协同致死关系标签。所述的协同致死基因数据集是一个二元组的集合,每个二元组表示对应的基因对构成协同致死关系。
在实际真实数据集中有6000多个基因和大约14000对协同致死基因对,为了简化说明,本实施例假设现有包含十个基因的集合N={n1,n2,…,n10},且其中包含20对协同致死关系,则协同致死基因集形式如表1所示:
表1
序号 协同致死关系 序号 协同致死关系 序号 协同致死关系
1 &lt;n<sub>1</sub>,n<sub>3</sub>&gt; 8 &lt;n<sub>2</sub>,n<sub>7</sub>&gt; 15 &lt;n<sub>5</sub>,n<sub>10</sub>&gt;
2 &lt;n<sub>1</sub>,n<sub>5</sub>&gt; 9 &lt;n<sub>2</sub>,n<sub>8</sub>&gt; 16 &lt;n<sub>6</sub>,n<sub>8</sub>&gt;
3 &lt;n<sub>1</sub>,n<sub>6</sub>&gt; 10 &lt;n<sub>3</sub>,n<sub>5</sub>&gt; 17 &lt;n<sub>6</sub>,n<sub>10</sub>&gt;
4 &lt;n<sub>1</sub>,n<sub>7</sub>&gt; 11 &lt;n<sub>3</sub>,n<sub>8</sub>&gt; 18 &lt;n<sub>7</sub>,n<sub>8</sub>&gt;
5 &lt;n<sub>1</sub>,n<sub>10</sub>&gt; 12 &lt;n<sub>3</sub>,n<sub>10</sub>&gt; 19 &lt;n<sub>7</sub>,n<sub>9</sub>&gt;
6 &lt;n<sub>2</sub>,n<sub>3</sub>&gt; 13 &lt;n<sub>4</sub>,n<sub>5</sub>&gt; 20 &lt;n<sub>8</sub>,n<sub>9</sub>&gt;
7 &lt;n<sub>2</sub>,n<sub>4</sub>&gt; 14 &lt;n<sub>4</sub>,n<sub>9</sub>&gt;
假设现在前面80%的数据划分得到的训练集为
TrainingSet={1,2,3,…,16},测试集则为TestSet=U-TrainingSet,其中
U={<ni,nj>|1≤i<N,i<j≤N}
S3:根据图2所示,对上述数据集进行以下预处理:
S301:将训练集的数据转化为邻接矩阵Amian,所述邻接矩阵Amian中的每一行或每一列都代表一个基因,邻接矩阵邻接中第i行第j列的数据称为边,代表基因i和基因j是否存在协同致死关系,若存在则为1,不存在则为0。本实施例所述邻接矩阵Amian表示如下:
令X,Y=Amain,其中,X作为所有基因的特征矩阵,Y作为监督信号,是训练时重构的目标矩阵。
S302:GO和CC的是基因之间的相似度矩阵,每一行表示一个基因与其他基因的相似度。本实施例对相似度矩阵GO、相似度矩阵CC分别进行k-最近邻筛选,对每个基因保留相似度最高的k条边(也称k个基因的值),将其他置为0,得到支撑视角的邻接矩阵AGO和ACC。这里的k是控制相似度矩阵的超参数,在本实施例中k=45,假设有十个基因,其GO相似度矩阵如下:
若k=3,则只保留每个基因中与其相似度最高的3个值,得到AGO如下:
S4:将得到的Au和Amain分别代入下列计算公式中的A,分别得到对应视角下的图卷积拉普拉斯矩阵计算公式如下:
式中,IN表示N阶单位阵;表示N阶对角阵,其对角线上的值为每一行的和,通称为度矩阵;IN都与邻接矩阵A维度相同。
本实施例以步骤S3中所得的Amain为例,则计算结果如下:
S5:构建包括图卷积网络编码层、基因关系解码层,基于注意力机制的多视角聚合层的预测模型,如图3所示,
本实施例所述的图卷积网络编码层采用两层的图卷积网络来实现,其实现公式如下:
其中,l代表第l层图卷积网络,在本实施例中,使用的是2层图卷积网络;Zl为第l层图卷积输出的基因嵌入表达,当l=0时,Zl为节点特征,即Zl=X;为步骤S4中计算得到的拉普拉斯矩阵;Wl为第l层图卷积网络的可学习参数,在本实施例中第一层图卷积网络为512维,第二层图卷积网络为256维;σ(·)为激活函数,如ReLU(·)等。
所述基因关系解码层将分别每个视角下的节点嵌入表达转化为对应的预测分值其计算方法如下:
经过基因关系解码层,就能得到主视角的预测分值和各个支撑视角的预测分值
本实施例所述的基于注意力机制的多视角聚合层将所有支撑视角的预测分值输入注意力层中加权叠加后得到融合所有支撑视角的预测分值其计算方法如下:
假设有u个支撑视角,每个支撑视角对应一个预测分值首先计算非标准化的注意力权重:
其中,为N×N的矩阵,N为基因数目;W和b为1×N的向量,是注意力层中可学习的参数。
然后对g′u进行标准化处理,得到标准化的注意力权重gu,处理方法如下:
其中,上标u代表总共的u个支撑视角,T代表第T个支撑视角,1≤T≤u;下标i代表注意力权重向量g中第i个位置的值。
再对所有支撑视角的预测分值进行加权后叠加,得到计算方法如下:
其中diag(·)表示将1×N的向量转化为N×N的矩阵,*表示矩阵乘法。
最后根据主视角的预测分值和支撑视角的预测分值计算模型最终的预测分值计算方法如下:
其中⊙为逐项元素相乘。
S6:对预测模型的训练,将每个视角对应的拉普拉斯矩阵输入预测模型进行以下步骤训练:
S601:将从数据集中提取每个视角对应的拉普拉斯矩阵分别输入独立的图卷积网络,每个图卷积网络都共享一个特征矩阵X,主视角和每个支撑视角分别得到协同致死关系预测矩阵输入基于注意力机制的多视角聚合层后得到模型最终的预测矩阵
然后根据监督信号Y,对每个视角和最终预测计算损失值;
其中支撑视角GO的损失计算方法如下:
其中支撑视角GO的损失计算方法如下:
其中支撑视角CC的损失计算方法如下:
其中主视角的损失计算方法如下:
最终预测的损失计算方式如下:
最后总的损失函数为:
losstotal=losssupp+lossmain+loss
因此得到:
其中:weight是根据Amian计算得到的权重系数,设Amian中节点总数为n,边总数为e,则
S7:根据总的损失值计算梯度,利用梯度反向传播算法更新预测模型参数;
通过如下公式更新预测模型参数,
式中,θ表示预测模型中所有可学习的参数,包括图卷积网络中的Wl和多视角聚合层中的W和b;η表示学习率,表示梯度下降法中更新可学习参数时的步长,是人为设定的超参数。
S8:重复S6~S7直到得到新的总的损失值大于或等于前30次总的损失值的均值,此时认为预测模型已经得到收敛,停止更新,得到收敛的预测模型;
S9:将得到收敛的预测模型输出的预测分值输入激活函数,得到模型对协同致死关系的预测矩阵其中完成预测。
本实施例将通过所述预测方法得到的预测结果和测试集的真实标签进行比较,计算AUC和AUPR值。AUC和AUPR都是衡量模型优劣的一种性能指标,其取值范围均为[0,1],数值越高,说明模型性能越好。其中AUC是ROC曲线下的面积,ROC曲线是受试者工作特征曲线,其纵坐标为真阳性率,横坐标为假阳性率;AUPR是PR曲线下的面积,PR曲线是精确率(precision)-召回率(recall)曲线,其纵坐标为精确率,横坐标为召回率。ROC和PR曲线都是根据一系列不同的二分类阈值划分绘制的曲线。
现有技术的方法取得的AUC值为83.3%,AUPR值为27.5%。利用本实施例所述的预测方法计算得出的AUC值为84.8%,AUPR值为40.1%,并且对于协同致死预测这种测试样本中正负样本比例非常不平衡的任务来说,AUPR值的提高更具有意义。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:所述该方法包括以下步骤:
S1:以协同致死因数据集作为主视角,以u个基因本源相似度矩阵作为支撑视角;
S2:将已知的协同致死基因对数据集取Q作为训练集,其中0<Q<1,用基因关系的全集减去训练集得到的子集作为测试集;
S3:将训练集的数据转化为邻接矩阵Amian,并将每个支撑视角u的相似度矩阵进行k-最近邻筛选,对每个基因保留相似度最高的k条边,得到支撑视角的邻接矩阵Au;令X,Y=Amian,其中X作为所有基因的特征矩阵;Y作为监督信号,是训练时重构的目标矩阵;
S4:根据主视角的Amian和每个支撑视角u的邻接矩阵Au计算每个视角的拉普拉斯矩阵,得到对应视角下的图卷积拉普拉斯矩阵
S5:构建包括图卷积网络编码层、基因关系解码层,基于注意力机制的多视角聚合层的预测模型;
S6:将每个视角对应的拉普拉斯矩阵输入预测模型,得到总的损失函数,从而得到总的损失值;
S7:根据总的损失值计算梯度,利用梯度反向传播算法更新预测模型参数;
S8:重复S6~S7直到得到新的总的损失值大于或等于前P次的总的损失值的均值,停止更新,得到收敛的预测模型,其中P为正整数;
S9:将得到收敛的预测模型输出的预测分值输入激活函数,得到模型对协同致死关系的预测矩阵完成预测。
2.根据权利要求1所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:所述邻接矩阵Amian中的每一行或每一列都代表一个基因,邻接矩阵邻接中第i行第j列的数据称为边,代表基因i和基因j是否存在协同致死关系,若存在则为1,不存在则为0。
3.根据权利要求2所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:所述步骤S4,将得到的Au和Amain分别代入下式中的A,分别得到对应视角下的图卷积拉普拉斯矩阵
式中,IN表示N阶单位阵;表示N阶对角阵,其对角线上的值为每一行的和,通称为度矩阵;IN都与邻接矩阵A维度相同。
4.根据权利要求3所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:步骤S5,所述图卷积网络编码层采用l层的图卷积网络来实现,其实现公式如下:
式中,l代表第l层图卷积网络;Zl为第l层图卷积网络输出的基因嵌入表达,当l=0时,Zl为节点特征,即Zl=X;表示步骤S4中计算得到的拉普拉斯矩阵;Wl为第l层图卷积网络的可学习参数,σ(·)为激活函数。
5.根据权利要求4所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:所述图卷积网络编码层采用2层的图卷积网络来实现,并设置第一层图卷积网络为512维,第二层图卷积网络为256维。
6.根据权利要求4所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:
所述基因关系解码层将分别每个视角下的节点嵌入表达转化为对应的预测分值其计算方法如下:
经过基因关系解码层,就能得到主视角的预测分值和各个支撑视角的预测分值
7.根据权利要求6所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:
所述基于注意力机制的多视角聚合层将所有支撑视角的预测分值输入注意力层中加权叠加后得到融合所有支撑视角的预测分值其计算方法如下:
假设有u个支撑视角,每个支撑视角对应一个预测分值首先计算非标准化的注意力权重:
式中,表示N×N的矩阵,N为基因数目;W和b均表示1×N的向量,表示注意力层中可学习的参数;
然后对g′u进行标准化处理,得到标准化的注意力权重gu,处理方法如下:
其中,上标u代表总共的u个支撑视角,T代表第T个支撑视角,1≤T≤u;下标i代表注意力权重向量g中第i个位置的值;
再对所有支撑视角的预测分值进行加权后叠加,得到计算方法如下:
其中diag(·)表示将1×N的向量转化为N×N的矩阵,*表示矩阵乘法;
最后根据主视角的预测分值和支撑视角的预测分值计算预测模型最终的预测分值计算方法如下:
其中⊙为逐项元素相乘。
8.根据权利要求7所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:所述步骤S6具体训练如下所示:
将每个视角对应的拉普拉斯矩阵分别输入独立的图卷积网络,每个图卷积网络都共享一个特征矩阵X,主视角和每个支撑视角分别输出协同致死关系预测矩阵输入基于注意力机制的多视角聚合层后得到模型最终的预测矩阵
然后根据监督信号Y,对每个视角和最终预测计算损失值;
其中支撑视角的损失计算方法如下:
其中主视角的损失计算方法如下:
最终预测的损失计算方式如下:
最后总的损失函数为:
losstotal=losssupp+lossmain+loss
其中:weight是根据Amian计算得到的权重系数,设Amian中节点总数为n,边总数为e,则
9.根据权利要求8所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:
所述步骤S7,通过如下公式更新预测模型参数,
式中,θ表示预测模型中所有可学习的参数,包括图卷积网络中的Wl和多视角聚合层中的W和b;η表示学习率,表示梯度下降法中更新可学习参数时的步长,是人为设定的超参数。
10.根据权利要求9所述的基于图卷积网络的有监督多视角人类协同致死基因预测方法,其特征在于:将预测模型收敛后输出的预测分值输入激活函数,得到模型对协同致死关系的预测矩阵其计算方法如下:
CN201910701944.4A 2019-07-31 2019-07-31 一种多视角人类协同致死基因预测方法 Active CN110473592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910701944.4A CN110473592B (zh) 2019-07-31 2019-07-31 一种多视角人类协同致死基因预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910701944.4A CN110473592B (zh) 2019-07-31 2019-07-31 一种多视角人类协同致死基因预测方法

Publications (2)

Publication Number Publication Date
CN110473592A true CN110473592A (zh) 2019-11-19
CN110473592B CN110473592B (zh) 2023-05-23

Family

ID=68509583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910701944.4A Active CN110473592B (zh) 2019-07-31 2019-07-31 一种多视角人类协同致死基因预测方法

Country Status (1)

Country Link
CN (1) CN110473592B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143705A (zh) * 2019-12-26 2020-05-12 北京工业大学 一种基于图卷积网络的推荐方法
CN111419221A (zh) * 2020-02-14 2020-07-17 广东司法警官职业学院 一种基于图卷积网络的脑电图信号分析方法
CN112650861A (zh) * 2020-12-29 2021-04-13 中山大学 一种基于任务分层的人格预测方法、系统及装置
CN112668700A (zh) * 2020-12-30 2021-04-16 广州大学华软软件学院 一种基于分组注意的宽度图卷积网络模型及其训练方法
CN113011501A (zh) * 2021-03-22 2021-06-22 广东海启星海洋科技有限公司 基于图卷积神经网络进行台风水位预测的方法及装置
CN113362894A (zh) * 2021-06-15 2021-09-07 上海基绪康生物科技有限公司 一种对协同致死的癌症驱动基因进行预测的方法
CN113436729A (zh) * 2021-07-08 2021-09-24 湖南大学 一种基于异构图卷积神经网络的合成致死相互作用预测方法
CN113673483A (zh) * 2021-09-07 2021-11-19 天津大学 一种基于深度神经网络的多视角多目标关联方法
CN115019891A (zh) * 2022-06-08 2022-09-06 郑州大学 一种基于半监督图神经网络的个体驱动基因预测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000037660A1 (en) * 1998-12-22 2000-06-29 Dow Agrosciences Llc Methods and genetic compositions to limit outcrossing and undesired gene flow in crop plants
US20040091933A1 (en) * 2001-07-02 2004-05-13 Roland Stoughton Methods for genetic interpretation and prediction of phenotype
JP2005309836A (ja) * 2004-04-22 2005-11-04 Link Genomics Kk がん診断支援システム
CN104636635A (zh) * 2015-01-29 2015-05-20 南京理工大学 基于两层svm学习机制的蛋白质结晶预测方法
US20150331992A1 (en) * 2014-05-15 2015-11-19 Ramot At Tel-Aviv University Ltd. Cancer prognosis and therapy based on syntheic lethality
US20160283650A1 (en) * 2015-02-26 2016-09-29 The Trustees Of Columbia University In The City Of New York Method for identifying synthetic lethality
CN109637594A (zh) * 2018-10-25 2019-04-16 华中科技大学鄂州工业技术研究院 中药制剂非处方物种化学成分致病的分析方法及设备
US20190139622A1 (en) * 2017-08-03 2019-05-09 Zymergen, Inc. Graph neural networks for representing microorganisms

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000037660A1 (en) * 1998-12-22 2000-06-29 Dow Agrosciences Llc Methods and genetic compositions to limit outcrossing and undesired gene flow in crop plants
US20040091933A1 (en) * 2001-07-02 2004-05-13 Roland Stoughton Methods for genetic interpretation and prediction of phenotype
JP2005309836A (ja) * 2004-04-22 2005-11-04 Link Genomics Kk がん診断支援システム
US20150331992A1 (en) * 2014-05-15 2015-11-19 Ramot At Tel-Aviv University Ltd. Cancer prognosis and therapy based on syntheic lethality
CN104636635A (zh) * 2015-01-29 2015-05-20 南京理工大学 基于两层svm学习机制的蛋白质结晶预测方法
US20160283650A1 (en) * 2015-02-26 2016-09-29 The Trustees Of Columbia University In The City Of New York Method for identifying synthetic lethality
US20190139622A1 (en) * 2017-08-03 2019-05-09 Zymergen, Inc. Graph neural networks for representing microorganisms
CN109637594A (zh) * 2018-10-25 2019-04-16 华中科技大学鄂州工业技术研究院 中药制剂非处方物种化学成分致病的分析方法及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
温雯等: ""基于多视角多标签学习的读者情绪分类"", 《计算机科学》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143705A (zh) * 2019-12-26 2020-05-12 北京工业大学 一种基于图卷积网络的推荐方法
CN111143705B (zh) * 2019-12-26 2021-05-28 北京工业大学 一种基于图卷积网络的推荐方法
CN111419221A (zh) * 2020-02-14 2020-07-17 广东司法警官职业学院 一种基于图卷积网络的脑电图信号分析方法
CN112650861A (zh) * 2020-12-29 2021-04-13 中山大学 一种基于任务分层的人格预测方法、系统及装置
CN112668700A (zh) * 2020-12-30 2021-04-16 广州大学华软软件学院 一种基于分组注意的宽度图卷积网络模型及其训练方法
CN112668700B (zh) * 2020-12-30 2023-11-28 广州大学华软软件学院 一种基于分组注意的宽度图卷积网络模型系统及训练方法
CN113011501A (zh) * 2021-03-22 2021-06-22 广东海启星海洋科技有限公司 基于图卷积神经网络进行台风水位预测的方法及装置
CN113362894A (zh) * 2021-06-15 2021-09-07 上海基绪康生物科技有限公司 一种对协同致死的癌症驱动基因进行预测的方法
CN113436729A (zh) * 2021-07-08 2021-09-24 湖南大学 一种基于异构图卷积神经网络的合成致死相互作用预测方法
CN113673483A (zh) * 2021-09-07 2021-11-19 天津大学 一种基于深度神经网络的多视角多目标关联方法
CN113673483B (zh) * 2021-09-07 2023-07-14 天津大学 一种基于深度神经网络的多视角多目标关联方法
CN115019891A (zh) * 2022-06-08 2022-09-06 郑州大学 一种基于半监督图神经网络的个体驱动基因预测方法

Also Published As

Publication number Publication date
CN110473592B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
CN110473592A (zh) 基于图卷积网络的有监督的多视角人类协同致死基因预测方法
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN102413029B (zh) 基于分解的局部搜索多目标复杂动态网络社区划分方法
CN110544011B (zh) 一种智能化的体系作战效能评估和优化方法
CN106529569A (zh) 基于深度学习的三维模型三角面特征学习分类方法及装置
CN110232434A (zh) 一种基于属性图优化的神经网络架构评估方法
CN110164129B (zh) 基于gernn的单交叉口多车道交通流量预测方法
CN109063355A (zh) 基于粒子群优化与Kriging模型的近似优化方法
CN104881689A (zh) 一种多标签主动学习分类方法及系统
CN112464996B (zh) 基于LSTM-XGBoost的智能电网入侵检测方法
CN106649456A (zh) 基于多智能体进化的聚类和离群点检测方法
CN112784913A (zh) 一种基于图神经网络融合多视图信息的miRNA-疾病关联预测方法及装置
CN108564117A (zh) 一种基于svm的贫困生辅助认定方法
CN105825430A (zh) 一种基于异构社会网络的检测方法
CN110535149A (zh) 一种公变台区电力负荷三相不平衡预测方法
Yan et al. Real-time localization of pollution source for urban water supply network in emergencies
CN115952424A (zh) 一种基于多视图结构的图卷积神经网络聚类方法
Wen et al. A new genetic algorithm based evolutionary neural architecture search for image classification
Han et al. Adaptive multiple selection strategy for multi-objective particle swarm optimization
CN110082822A (zh) 利用卷积神经网络进行地震检测的方法
Du et al. Novel machine learning approach for shape-finding design of tree-like structures
Delima An experimental comparison of hybrid modified genetic algorithm-based prediction models
CN108830407B (zh) 多工况条件下结构健康监测中的传感器分布优化方法
CN115908909A (zh) 基于贝叶斯卷积神经网络的进化神经架构搜索方法及系统
Ren et al. Prediction of Ultimate Bearing Capacity of Pile Foundation Based on Two Optimization Algorithm Models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant