CN115730660B

CN115730660B - 基于因果解耦的链接生成方法和相关装置

Info

Publication number: CN115730660B
Application number: CN202310015334.5A
Authority: CN
Inventors: 张�林; 杨海钦; 幺宝刚
Original assignee: International Digital Economy Academy IDEA
Current assignee: International Digital Economy Academy IDEA
Priority date: 2023-01-06
Filing date: 2023-01-06
Publication date: 2023-05-16
Anticipated expiration: 2043-01-06
Also published as: CN115730660A

Abstract

本发明涉及图谱分析技术领域，具体是涉及基于因果解耦的链接生成方法和相关装置。本发明首先通过图变分自动编码器提取出实测图谱所包含的实测目标图表征，该图表征用于表示节点信息以及节点之间的链接关系，然后对实测目标图表征应用结构因果模型，判断出各个节点之间的因果表征，最后根据因果表征解耦出图谱中各个节点之间的真实链接关系。通过上述分析可知，本发明充分考虑了各个节点之间的因果关系，存在因果关系的两个节点之间存在链接关系的概率大，因此本发明结合因果关系提高了建立的链接关系准确性。

Description

基于因果解耦的链接生成方法和相关装置

技术领域

本发明涉及图谱分析技术领域，具体是涉及基于因果解耦的链接生成方法和相关装置。

背景技术

图谱作为信息系统的载体，信息系统通过分析图谱中的节点信息判断各个节点是否存在链接。常见的图谱有引文图谱、生物图谱和 web 图谱、基因疾病图谱等。以疾病分析系统中的基因疾病图谱为例，节点用于描述基因信息和疾病信息，节点之间的交互行为通常以“链接”的形式表示，即使用边连接两个节点以描述基因和疾病之间的关联程度。通过分析上述图谱，以生成图谱中的任意两个节点之间可能出现的链接，有效的链接生成方法对人们生活中各个方面都具有重要意义，例如帮助人们控制信息在网络上的传播，帮助医生更准确的分析病因等。链接生成用于生成网络中尚未链接的两个节点之间存在或产生链接的可能性。链接生成包括：(1)生成已存在但尚未被发现的链接，即生成未知链接；(2)生成现在未存在但未来可能新产生的链接，即生成未来链接。研究方法为将完整网络随机切分成训练集和测试集，训练集训练用于生成链接的网络，测试集用于验证训练之后的网络性能。由于图卷积神经网络在图上（图谱）的强大性能，一些研究者将GCN应用于动态图的链接生成任务上。上述生成链接的方法中均没有考虑图谱中各个节点之间的因果性，导致生成的链接准确性较低。

综上所述，现有技术的链接生成方法准确性较低。

因此，现有技术还有待改进和提高。

发明内容

为解决上述技术问题，本发明提供了基于因果解耦的链接生成方法和相关装置，解决了现有技术的链接生成方法准确性较低的问题。

为实现上述目的，本发明采用了以下技术方案：

第一方面，本发明提供一种基于因果解耦的链接生成方法，其中，包括：

对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征，所述实测图谱的信息用于表征所述实测图谱中的各个节点信息以及各个节点之间的关系；

对所述实测目标图表征应用已训练的结构因果模型，得到用于表征所述实测图谱中各个节点之间因果关系的实测因果表征；

依据所述实测因果表征，调整各个节点之间的链接关系，解耦出各个节点之间的实测重构链接关系。

在一种实现方式中，所述对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征，所述实测图谱的信息用于表征所述实测图谱中的各个节点信息以及各个节点之间的关系，包括：

依据所述实测图谱的信息，得到所述实测图谱的信息中的实测节点特征和用于表征各个节点之间链接关系的实测邻接矩阵；

对所述实测节点特征和所述实测邻接矩阵应用已训练的所述图变分自动编码器，得到已训练的所述图变分自动编码器输出的实测图特征；

计算各个所述实测图特征所对应的离散程度和/或各个所述实测图特征之间的差异信息；

依据所述离散程度和/或所述差异信息，随机生成实测目标图表征。

在一种实现方式中，所述依据所述离散程度和/或所述差异信息，随机生成实测目标图表征，包括：

依据所述离散程度，得到所述离散程度中的与各个所述实测图特征相对应的实测均值；

依据所述差异信息，得到所述差异信息中的与各个所述实测图特征相对应的实测方差；

依据所述实测均值和所述实测方差，随机生成实测目标图表征，所述实测目标图表征的均值和方差服从正态分布。

在一种实现方式中，所述依据所述实测因果表征，调整各个节点之间的链接关系，解耦出各个节点之间的实测重构链接关系，包括：

对所述实测因果表征应用图变分自动解码器，得到所述实测重构链接关系中的实测重构邻接矩阵。

在一种实现方式中，所述对所述实测因果表征应用图变分自动解码器，得到所述实测重构链接关系中的实测重构邻接矩阵，之后还包括：

对所述实测重构邻接矩阵应用挤压函数，得到压缩之后的所述实测重构邻接矩阵。

在一种实现方式中，还包括：

对所述实测因果表征和各个节点之间的链接关系，应用ELU函数，得到重构之后的各个节点信息中的各个节点特征。

在一种实现方式中，已训练的图变分自动编码器的训练方式，包括：

将样本图谱中的各个样本节点映射为样本向量，所述样本向量用于表征各个样本节点信息以及各个样本节点之间的关系；

将设定数量的图卷积神经网络组合成图变分自动编码器；

依据所述样本向量，训练所述图变分自动编码器，得到已训练的图变分自动编码器。

在一种实现方式中，所述依据所述样本向量，训练所述图变分自动编码器，得到已训练的图变分自动编码器，包括：

对所述样本向量应用所述图变分自动编码器，提取出所述样本向量所对应的训练图表征；

计算所述训练图表征的均值和方差；

依据所述训练图表征的均值和方差，重构图结构的节点表征；

依据重构之后的所述图结构的节点表征，训练所述图变分自动编码器，得到已训练的图变分自动编码器。

在一种实现方式中，已训练的结构因果模型的训练方式，包括：

依据所述样本图谱中的主动样本节点和被动样本节点之间的指向关系，构建所述样本图谱的有向无环图，所述主动样本节点为主动发生变化的节点，所述被动样本节点为因所述主动样本节点的变化而变化的节点；

依据所述有向无环图，构建所述结构因果模型的损失函数；

依据所述损失函数，训练结构因果模型。

在一种实现方式中，所述依据所述损失函数，训练结构因果模型，包括：

由各个所述主动样本节点构建原因变量；

由各个所述被动样本节点构建结果变量；

将所述原因变量和所述结果变量组合成因果向量；

依据重构之后的所述图结构的节点表征，生成外生向量；

构建与所述因果向量所对应的因果参数向量、与所述外生向量所对应的外生参数向量；

依据所述因果参数向量和所述外生参数向量，生成结构因果模型；

依据所述外生向量和所述损失函数，训练结构因果模型。

在一种实现方式中，所述结构因果模型的维度与重构之后的所述图结构的节点表征的维度相同。

第二方面，本发明实施例还提供一种基于因果解耦的链接生成装置，其中，所述装置包括如下组成部分：

图表征生成模块，用于对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征，所述实测图谱的信息用于表征所述实测图谱中的各个节点信息以及各个节点之间的关系；

因果表征生成模块，用于对所述实测目标图表征应用已训练的结构因果模型，得到用于表征所述实测图谱中各个节点之间因果关系的实测因果表征；

链接重构模块，用于依据所述实测因果表征，调整各个节点之间的链接关系，解耦出各个节点之间的实测重构链接关系。

第三方面，本发明实施例还提供一种终端设备，其中，所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的基于因果解耦的链接生成程序，所述处理器执行所述基于因果解耦的链接生成程序时，实现上述所述的基于因果解耦的链接生成方法的步骤。

第四方面，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于因果解耦的链接生成程序，所述基于因果解耦的链接生成程序被处理器执行时，实现上述所述的基于因果解耦的链接生成方法的步骤。

有益效果：本发明首先通过图变分自动编码器提取出实测图谱所包含的实测目标图表征，该图表征用于表示节点信息以及节点之间的链接关系，然后对实测目标图表征应用结构因果模型，判断出各个节点之间的因果表征，最后根据因果表征解耦出图谱中各个节点之间的真实链接关系（实测重构链接关系）。通过上述分析可知，本发明充分考虑了各个节点之间的因果关系，存在因果关系的两个节点之间存在链接关系的概率大，因此本发明结合因果关系提高了建立的链接关系准确性。

附图说明

图1为本发明的整体流程图；

图2为本发明实施例中的基因疾病图谱；

图3为本发明实施例中的图变分自动编码器提取的链接图谱；

图4为本发明实施例中的因果结果模型提取的链接图谱；

图5为本发明实施例中重构邻接矩阵流程图；

图6为本发明实施例提供的终端设备的内部结构原理框图。

具体实施方式

以下结合实施例和说明书附图，对本发明中的技术方案进行清楚、完整地描述。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

经研究发现，图谱作为信息系统的载体，信息系统通过分析图谱中的节点信息判断各个节点是否存在链接。常见的图谱有引文图谱、生物图谱和 web 图谱、基因疾病图谱等。以疾病分析系统中的基因疾病图谱为例，节点用于描述基因信息和疾病信息，节点之间的交互行为通常以“链接”的形式表示，即使用边连接两个节点以描述基因和疾病之间的关联程度。通过分析上述图谱，以生成图谱中的任意两个节点之间可能出现的链接，有效的链接生成方法对人们生活中各个方面都具有重要意义，例如帮助人们控制信息在网络上的传播，帮助医生更准确的分析病因等。链接生成用于生成网络中尚未链接的两个节点之间存在或产生链接的可能性。链接生成包括：(1)生成已存在但尚未被发现的链接，即生成未知链接；(2)生成现在未存在但未来可能新产生的链接，即生成未来链接。研究方法为将完整网络随机切分成训练集和测试集，训练集训练用于生成链接的网络，测试集用于验证训练之后的网络性能。由于图卷积神经网络在图上（图谱）的强大性能，一些研究者将GCN应用于动态图的链接生成任务上。上述生成链接的方法中均没有考虑图谱中各个节点之间的因果性，导致生成的链接准确性较低。

为解决上述技术问题，本发明提供了基于因果解耦的链接生成方法和相关装置，解决了现有技术的链接生成方法准确性较低的问题。具体实施时，首先对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征；然后对实测目标图表征应用已训练的结构因果模型，得到用于表征实测图谱中各个节点之间因果关系的实测因果表征；最后依据实测因果表征，调整各个节点之间的链接关系，解耦出各个节点之间的实测重构链接关系。由于本发明结合了因果关系，从而提高了建立的链接关系准确性。

举例说明，以基因疾病图谱为例：如图2所示，A1、A2、A3、A4、A5这五个节点分别为五个基因，B1、B2、B3这三个节点分别为三种疾病，疾病B1与A1、A2、A3这三者之间分别建立的了边，表明B1受A1、A2、A3这三个基因的影响，也就是疾病B1与A1、A2、A3这三者均存在交互行为。同时基因A3和基因A4也建立了边，表明基因A3和基因A4相关联，基因A4与B2之间的边表明基因A4导致了疾病B2。将A1、A2、A3、A4、A5这五个基因名称和B1、B2、B3这三个疾病名称以及上述八个节点之间的“边”（基因名称、疾病名称、节点之间是否有边都是实测图谱的信息）输入到图变分自动编码器encoder，图变分自动编码器encoder输出了上述八个节点之间的关系表征C（实测目标图表征），关系表征C如图3所示，图3相对图2增设了A3和B2之间的链接。之后将关系表征C输入到结构因果模型，结构因果模型输出表征上述八个节点之间的因果关系（实测因果表征），比如结构因果模型输出了A4和B2之间存在因果关系（即基因A4的变化会导致疾病B2的变化），B2和B3之间也存在因果关系。因此根据上述因果关系调整图3中的各个节点之间的链接关系，增设了如图4所示的A4和B3之间的链接（即实测重构链接关系，A4和B3之间的链接未被图2的图谱发现记载，但是却是真实存在的，通过本实施例的链接生成方法发现了A4和B3之间的链接）。

本实施例中，链接生成方法可以生成上述本来就存在的链接（A4和B3之间的链接），也可以生成未来的链接，比如预测出图2中A3和B3之间随着时间的推移会存在链接。

示例性方法

本实施例的基于因果解耦的链接生成方法可应用于终端设备中，所述终端设备可为具有计算功能的终端产品，比如电脑等。在本实施例中，如图1中所示，所述基于因果解耦的链接生成方法具体包括如下步骤S100至S400：

S100，训练图变分自动编码器和结构因果模型。

在一个实施例中，先训练图变分自动编码器encoder，再在训练之后的encoder基础上训练结构因果模型SCM。训练图变分自动编码器包括如下步骤S101至S106：

S101，将样本图谱中的各个样本节点映射为样本向量，所述样本向量用于表征各个样本节点信息以及各个样本节点之间的关系。

将图的节点映射为连续空间的一个向量（graph embedding），在该隐空间中，表征是指图中节点与节点的关系表征。本实施例中的样本向量为两个数组，其中一个一位数组存储样本图谱中各个节点信息（如果样本图谱是基因疾病图谱，那么节点信息就是各个基因的信息以及各个疾病的信息），另一个二维数组（邻接矩阵）存储节点之间的边或弧的信息（即两个节点之间是否存在边，也就是两个节点之间是否有链接）。

比如图2对应的一维数组为[a1，a2，a3，a4，a5，b1，b2，b3]，其中a1，a2，a3，a4，a5，b1，b2，b3分别对应图2中的A1、A2、A3、A4、A5、B1、B2、B3。对应的链接矩阵D，其中矩阵D中第一行第六列元素为“1”，表示排在一维数组第一位的A1和排在一维数据第六位的B1之间存在链接。

S102，将设定数量的图卷积神经网络组合成图变分自动编码器。

本实施例中的图变分自动编码器包括一个32维的GCN和一个16维的GCN。以使得图变分自动编码器能够提取出最优的图表征。

在另一个实施例中，图变分自动编码器也可以是一个32维的GCN。

S103，对所述样本向量应用所述图变分自动编码器，提取出所述样本向量所对应的训练图表征。

如图5所示，将上述表征节点特征的一维数组和表征节点之间关系的邻接矩阵（二维数组）输入到图变分自动编码器，图变分自动编码器提取出训练图表征。比如提取出邻接矩阵D中的各个元素值作为训练图表征。图变分自动编码器对训练图表征进行投影，获得低维度、表示能力强的节点特征。

S104，计算所述训练图表征的均值和方差。

图变分自动编码器提取出训练图表征之后，计算各个节点之间的各个图表征构成均值和方差，也就是计算邻接矩阵D中的各个元素值所对应的均值和方差。

S105，依据所述训练图表征的均值和方差，重构图结构的节点表征。

S106，依据重构之后的所述图结构的节点表征，训练所述图变分自动编码器，得到已训练的图变分自动编码器。

具体的，解码器Decoder利用均值和方差重构图结构的节点表征，也就是图变分自动编码器根据样本节点信息以及各个样本节点之间的链接关系提取出训练图表征（图2中的图结构所对应的训练图表征），然后Decoder利用均值和方差还原或者重构图2所对应的图结构的节点表征（节点表征包括节点自身的信息以及节点之间的链接关系）。将重构图结构的节点表征与图2中原有的图结构的节点表征进行比较，根据比较结果调整图变分自动编码器的相关参数，以完成图变分自动编码器的训练。

比如以邻接矩阵的形式表示重构之后的图结构的节点表征，D对应的重构之后的图结构的节点表征可以是（矩阵D中的第3行第7列的“0”变成了“1”，表明图变分自动编码器在图2中的节点A3和B2之间建立了链接）。

将重构之后的图结构的节点表征与真实的图表征（也就是图2中的A1、A2、A3、A4、A5、B1、B2、B3这八个节点之间存在的真实链接）进行比较，根据比较结果调整图变分自动编码器encoder中的参数，完成encoder的训练。

通过步骤S101至S106完成了图变分自动编码器encoder的训练，之后训练结构因果模型SCM，包括如下步骤S107至S1012：

S107，依据所述样本图谱中的主动样本节点和被动样本节点之间的指向关系，构建所述样本图谱的有向无环图，所述主动样本节点为主动发生变化的节点，所述被动样本节点为因所述主动样本节点的变化而变化的节点。

S108，依据所述有向无环图，构建所述结构因果模型的损失函数。

由于结构因果模型SCM（因果图）不能出现环结构，所以需要保证SCM结构符合DAG结构(有向无环图(DAG, Directed Acyclic Graph))，在损失函数中加入可导的DAG约束，利用反向传播迫使学习到的SCM结构符合DAG结构。

S109，由各个所述主动样本节点构建原因变量；由各个所述被动样本节点构建结果变量；将所述原因变量和所述结果变量组合成因果向量；依据重构之后的所述图结构的节点表征，生成外生向量。

比如图2中，基因导致疾病，因此基因节点A1、A2、A3、A4、A5为原因变量，疾病节点B1、B2、B3为结果变量。A1和B1就组合成了因果向量。

S1010，构建与所述因果向量所对应的因果参数向量、与所述外生向量所对应的外生参数向量。

S1011，依据所述因果参数向量和所述外生参数向量，生成如下的结构因果模型SCM。

式中，为因果参数向量的方阵，Z重构之后的所述图结构的节点表征（或者称之为最终的重构图表征，也可以称之为新的图表征），为外生参数向量（在训练结构因果模型的过程中需不断学习并调整），I为单位矩阵。

S1012，依据所述外生向量和所述损失函数，训练结构因果模型。

经过上述步骤S100完成了对图变分自动编码器encoder的训练和结构因果模型SCM的训练，在推理阶段（也就是实测阶段）采用已完成训练的encoder和SCM推理出各个节点中已经存在的链接（只是尚未被现有的邻接矩阵记录下来）以及推理出未来各个节点之间可能存在的链接。具体包括步骤S200、S300、S400：

S200，对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征，所述实测图谱的信息用于表征所述实测图谱中的各个节点信息以及各个节点之间的关系。

比如，通过图变分自动编码器初步将图2中的各个节点之间的关系转变成图3中的各个节点之间的关系（实测目标图表征），步骤S200具体包括如下步骤S201至S205：

S201，依据所述实测图谱的信息，得到所述实测图谱的信息中的实测节点特征和用于表征各个节点之间链接关系的实测邻接矩阵。

在一个实施例中，节点特征包括节点名称以及节点相连接的节点数量。

在一个实施例中，将每个节点用一个数字表示，相同的数字对应的各个节点表示为具有链接关系的节点。

S202，对所述实测节点特征和所述实测邻接矩阵应用已训练的所述图变分自动编码器，得到已训练的所述图变分自动编码器输出的实测图特征。

S203，依据所述离散程度，得到所述离散程度中的与各个所述实测图特征相对应的实测均值。

S204，依据所述差异信息，得到所述差异信息中的与各个所述实测图特征相对应的实测方差。

在一个实施例中，图变分自动编码器encoder在输出实测图特征的同时还会计算实测图特征的方差和均值。在另一个实施例中可以只计算方差和均值二者中的其中一个。

在另一个实施例中，用实测图特征的最大值和最小值的平均值表示各个实测图特征的离散程度。将各个实测图特征的按照从大到小的顺序排列，计算相邻两个实测图特征之间的差值，将各个差值之和作为差异信息。

S205，依据所述实测均值和所述实测方差，随机生成实测目标图表征，所述实测目标图表征的均值和方差服从正态分布。

S300，对所述实测目标图表征应用已训练的结构因果模型，得到用于表征所述实测图谱中各个节点之间因果关系的实测因果表征。

本实施例是采用公式生成实测因果表征（也就是扑捉各个节点之间的因果关系）。具体是由实测目标图表征生成外生变量，将代入到上式中，就可以得到实测因果表征。

S400，依据所述实测因果表征，调整各个节点之间的链接关系，解耦出各个节点之间的实测重构链接关系。

实测重构链接关系也就是重构邻接矩阵。

比如当前两个节点之间没有链接关系，但是通过步骤S300判断出这两个节点之间存在因果关系，因此在这两个节点之间重新建立链接。

在一个实施例中，是采用图变分自动解码器decoder得到重构邻接矩阵。

在另一个实施例中，通过因果表征进行求内积得到节点个数维度的矩阵，最后通过sigmoid函数使得矩阵收缩于0或1。在新生成的邻接矩阵（重构邻接矩阵）中，如果某一个位置的元素为1，则这个位置所代表的链接被预测为存在，否则不存在。

在另一实施例中，对所述实测因果表征和各个节点之间的链接关系，应用ELU函数，得到重构之后的各个节点信息中的各个节点特征。

使用激活函数Elu作用于因果表征的线性函数得到重构的节点特征，使用MSE损失对重构后的节点特征和原始节点特征进行优化。

综上，本发明首先通过图变分自动编码器提取出实测图谱所包含的实测目标图表征，该图表征用于表示节点信息以及节点之间的链接关系，然后对实测目标图表征应用结构因果模型，判断出各个节点之间的因果表征，最后根据因果表征解耦出图谱中各个节点之间的真实链接关系（实测重构链接关系）。通过上述分析可知，本发明充分考虑了各个节点之间的因果关系，存在因果关系的两个节点之间存在链接关系的概率大，因此本发明结合因果关系提高了建立的链接关系准确性。

另外，本发明训练因果学习模型，可以建模对具有相关性的数据中的因果关系，挖掘数据中的因果关系。在训练隐空间（邻接矩阵）特征时，可以通过因果解耦模型获得更加解耦的特征，使得模型效果提升的同时，可迁移能力增强。在训练SCM结构时，使用可导的DAG约束，保证学习到的SCM结构符合因果假设。

示例性装置

本实施例还提供一种基于因果解耦的链接生成装置，所述装置包括如下组成部分：

基于上述实施例，本发明还提供了一种终端设备，其原理框图可以如图6所示。该终端设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏。其中，该终端设备的处理器用于提供计算和控制能力。该终端设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于因果解耦的链接生成方法。

本领域技术人员可以理解，图6中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的终端设备的限定，具体的终端设备以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种终端设备，终端设备包括存储器、处理器及存储在存储器中并可在处理器上运行的基于因果解耦的链接生成程序，处理器执行基于因果解耦的链接生成程序时，实现如下操作指令：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于因果解耦的链接生成方法，其特征在于，包括：

对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征，所述实测图谱的信息用于表征所述实测图谱中的各个节点信息以及各个节点之间的关系，所述图谱为基因疾病图谱，所述节点用于表征基因和疾病，所述图变分自动编码器为GCN；

对所述实测目标图表征应用已训练的结构因果模型，得到用于表征所述实测图谱中各个节点之间因果关系的实测因果表征，因果关系为基因的变化导致疾病的变化，所述结构因果模型为Z＝(I-C^T)^-1ε，I为单位向量，C为原因变量和结果变量组成的因果向量所对应的因果参数向量，ε为由重构之后的图结构的节点表征生成的外生向量所对应的外生参数向量；

2.如权利要求1所述的基于因果解耦的链接生成方法，其特征在于，所述对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征，所述实测图谱的信息用于表征所述实测图谱中的各个节点信息以及各个节点之间的关系，包括：

3.如权利要求2所述的基于因果解耦的链接生成方法，其特征在于，所述依据所述离散程度和/或所述差异信息，随机生成实测目标图表征，包括：

4.如权利要求1所述的基于因果解耦的链接生成方法，其特征在于，所述依据所述实测因果表征，调整各个节点之间的链接关系，解耦出各个节点之间的实测重构链接关系，包括：

5.如权利要求4所述的基于因果解耦的链接生成方法，其特征在于，所述对所述实测因果表征应用图变分自动解码器，得到所述实测重构链接关系中的实测重构邻接矩阵，之后还包括：对所述实测重构邻接矩阵应用挤压函数，得到压缩之后的所述实测重构邻接矩阵。

6.如权利要求1-5任一项所述的基于因果解耦的链接生成方法，其特征在于，还包括：

7.如权利要求1-5任一项所述的基于因果解耦的链接生成方法，其特征在于，已训练的图变分自动编码器的训练方式，包括：

将设定数量的图卷积神经网络组合成图变分自动编码器；

8.如权利要求7所述的基于因果解耦的链接生成方法，其特征在于，所述依据所述样本向量，训练所述图变分自动编码器，得到已训练的图变分自动编码器，包括：

计算所述训练图表征的均值和方差；

依据重构之后的图结构的节点表征，训练所述图变分自动编码器，得到已训练的图变分自动编码器。

9.如权利要求8所述的基于因果解耦的链接生成方法，其特征在于，已训练的结构因果模型的训练方式，包括：

依据所述有向无环图，构建所述结构因果模型的损失函数；

依据所述损失函数，训练结构因果模型。

10.如权利要求9所述的基于因果解耦的链接生成方法，其特征在于，所述依据所述损失函数，训练结构因果模型，包括：

由各个所述主动样本节点构建原因变量；

由各个所述被动样本节点构建结果变量；

将所述原因变量和所述结果变量组合成因果向量；

依据重构之后的图结构的节点表征，生成外生向量；

依据所述外生向量和所述损失函数，训练结构因果模型。

11.如权利要求8所述的基于因果解耦的链接生成方法，其特征在于，所述结构因果模型的维度与重构之后的图结构的节点表征的维度相同。

12.一种基于因果解耦的链接生成装置，其特征在于，所述装置包括如下组成部分：

图表征生成模块，用于对实测图谱的信息应用已训练的图变分自动编码器，得到用于表征实测图谱中各个节点之间链接关系的实测目标图表征，所述实测图谱的信息用于表征所述实测图谱中的各个节点信息以及各个节点之间的关系，所述图谱为基因疾病图谱，所述节点用于表征基因和疾病，所述图变分自动编码器为GCN；

因果表征生成模块，用于对所述实测目标图表征应用已训练的结构因果模型，得到用于表征所述实测图谱中各个节点之间因果关系的实测因果表征，因果关系为基因的变化导致疾病的变化，所述结构因果模型为Z＝(I-C^T)^-1ε，I为单位向量，C为原因变量和结果变量组成的因果向量所对应的因果参数向量，ε为由重构之后的图结构的节点表征生成的外生向量所对应的外生参数向量；

13.一种终端设备，其特征在于，所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的基于因果解耦的链接生成程序，所述处理器执行所述基于因果解耦的链接生成程序时，实现如权利要求1-11任一项所述的基于因果解耦的链接生成方法的步骤。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于因果解耦的链接生成程序，所述基于因果解耦的链接生成程序被处理器执行时，实现如权利要求1-11任一项所述的基于因果解耦的链接生成方法的步骤。