CN114881124B

CN114881124B - 因果关系图的构建方法、装置、电子设备和介质

Info

Publication number: CN114881124B
Application number: CN202210425119.8A
Authority: CN
Inventors: 蔡云峰; 李旭; 孙明明; 李平
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-04-21
Filing date: 2022-04-21
Publication date: 2023-07-25
Anticipated expiration: 2042-04-21
Also published as: CN114881124A

Abstract

本公开提供了一种因果关系图的构建方法、装置、电子设备和介质，涉及大数据和自然语言处理等领域。具体实现方案为：对多个观测对象在至少两种观测维度进行检测，得到观测数据集，并根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量；根据至少两种观测维度的观测变量，确定用于指示各观测变量之间差异的协方差矩阵，并根据协方差矩阵，确定用于指示各观测变量之间关联性的邻接矩阵，从而可以根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。由此，可以实现根据观测数据集所确定的各观测维度的观测变量，有效构建用于指示各观测维度之间因果关系的因果关系图。

Description

因果关系图的构建方法、装置、电子设备和介质

技术领域

本公开涉及人工智能技术领域，具体涉及大数据和自然语言处理等领域，尤其涉及因果关系图的构建方法、装置、电子设备和介质。

背景技术

观测数据，又称原始数据，是指在自然的未被控制的条件下观测到的数据。从观测数据中进行因果发现，推理出数据特征之间的因果关系，被广泛应用于各领域中，比如生物、机器学习、制药、经济学等领域。例如，在医学健康领域，可以根据观测数据中人员的外在症状，来分析人员所患有的疾病。

从观测数据中抽象出因果关系，通常是通过寻找一个因果关系图，比如DAG(Directed Acyclic Graph，有向无环图)，根据DAG确定观测数据中各变量之间的因果关系，其中，DAG中各节点为需要找寻因果关系的变量，如果DAG中的两个节点之间有边，则说明这两个节点对应的变量之间存在因果关系。

因此，如何根据观测数据识别或构建因果关系图，是非常重要的。

发明内容

本公开提供了一种因果关系图的构建方法、装置、电子设备和介质。

根据本公开的一方面，提供了一种因果关系图的构建方法，包括：

对多个观测对象在至少两种观测维度进行检测，以得到观测数据集；

根据所述观测数据集中所述至少两种观测维度的观测数据，确定对应观测维度的观测变量；

根据所述至少两种观测维度的观测变量，确定用于指示所述至少两种观测维度的观测变量之间差异的协方差矩阵；

根据所述协方差矩阵，确定用于指示所述至少两种观测维度的观测变量之间关联性的邻接矩阵；

根据所述邻接矩阵和所述至少两种观测维度的观测变量，生成用于指示所述至少两种观测维度之间因果关系的因果关系图。

根据本公开的另一方面，提供了一种因果关系图的构建装置，包括：

检测模块，用于对多个观测对象在至少两种观测维度进行检测，以得到观测数据集；

第一确定模块，用于根据所述观测数据集中所述至少两种观测维度的观测数据，确定对应观测维度的观测变量；

第二确定模块，用于根据所述至少两种观测维度的观测变量，确定用于指示所述至少两种观测维度的观测变量之间差异的协方差矩阵；

第三确定模块，用于根据所述协方差矩阵，确定用于指示所述至少两种观测维度的观测变量之间关联性的邻接矩阵；

生成模块，用于根据所述邻接矩阵和所述至少两种观测维度的观测变量，生成用于指示所述至少两种观测维度之间因果关系的因果关系图。

根据本公开的又一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开上述一方面提出的因果关系图的构建方法。

根据本公开的再一方面，提供了一种计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本公开上述一方面提出的因果关系图的构建方法。

根据本公开的还一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开上述一方面提出的因果关系图的构建方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1为本公开实施例一所提供的因果关系图的构建方法的流程示意图；

图2为本公开实施例二所提供的因果关系图的构建方法的流程示意图；

图3为本公开实施例三所提供的因果关系图的构建方法的流程示意图；

图4为本公开实施例四所提供的因果关系图的构建方法的流程示意图；

图5为本公开实施例五所提供的因果关系图的构建方法的流程示意图；

图6为本公开实施例的实验结果示意图；

图7为本公开实施例六所提供的因果关系图的构建装置的结构示意图；

图8示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

从观测数据中抽象出因果关系，通常是通过寻找一个因果关系图，比如DAG，根据DAG确定观测数据中各观测变量之间的因果关系，其中，DAG中各节点为需要找寻因果关系的观测变量，如果DAG中的两个节点之间有边，则说明这两个节点对应的观测变量之间存在因果关系。

然而，从观测数据中恢复出来的因果关系图被证明是NP(non-deterministicpolynomial，非确定性多项式)-hard的问题。

即在多数场景下，并非所有的因果关系都可以被观测到，比如，在医学健康邻域，根据观测数据中人员的外在症状来分析人员所患有的疾病，可能无法保证分析结果的准确性和可靠性。例如，影响疾病的因素并非仅包括外在症状，还可能包括人类肉眼无法观测的影响因素，比如基因表达、问诊得到的家族疾病历史和饮食习惯等等。再例如，在金融领域，股票价格可能受到无法量化的经济和政策的影响。

也就是说，因果关系图还与一些隐变量(latent variable，或称为隐含变量、潜变量、潜在变量)相关。

然而相关技术中，大多数是针对没有隐变量的因果关系发现上。其中，没有隐变量的因果关系发现算法主要为：通过SEM(Structure Equation Model，结构等价模型)对因果发现问题进行建模，在SEM模型中，将DAG中的子节点表示为其父亲节点某个转换方程。其中，该转换方程可以是线性的，可以是非线性的。在一线条件下，比如高斯噪音假设、线性假设、等方差假设等，符合SEM模型的观测数据已经被证明是可以完全决定一个因果DAG。

目前，没有隐变量的因果发现算法主要包括以下几种类别：

第一，基于搜索的算法。该算法在合法的DAG拓扑结构上进行搜索，搜索目标是BIC(Bayesian information criterion，贝叶斯信息准则)分数、乔里斯基分数、删除添加分数等等。然而，在DAG的可行空间进行完全搜索是无法实现的，原因为：仅包含10个节点的DAG，其可行的拓扑空间就达到4.1e¹⁸个。考虑到基于搜索的算法需要在巨大的空间上进行搜索，目前可以基于一些启发式的规则，来实现在算法的复杂度和算法效果上达到平衡。

第二，基于连续优化的算法。该算法将DAG的离散空间约束条件转化为连续空间的约束方程，且该方程可导，从而可以利用拉格朗日方法对该条件优化问题进行求解。

第三，基于强化学习的方法。该方法通过一些探索策略探索到高回报的拓扑结构，同时通过参数学习，学习到构建该拓扑结构的决策机制。

第四，基于拓扑排序的方法。该方法将上述问题分解为两步：拓扑排序复原；基于复原的拓扑排序学习拓扑结构。

然而，对于包含隐变量的因果发现则是一个困难的多问题。目前针对这一问题的解决方法主要包括：传统的FCI(Fast Causal Inference，快速因果分析)和RFCI(ReallyFast Causal Inference，事实快速因果分析)等方法。近期也有一些学者提出基于某些特定假设条件下识别特定隐变量结构的方法，比如一些学者将假设条件宽松至非高斯噪音的含有隐变量的DAG结构发现。此外，也有学者从理论上给出了在线性等方差高斯噪音下，因果关系图结构可识别性的条件和分析。

然而，上述对于包含隐变量的因果发现方法中，假设条件比较苛刻，同时仅仅能识别特定的因变量因果结构，比如FCI，RFCI只能区别出观测到的变量和两个观测变量的共同父节点，而无法识别出隐变量之间的因果关系。

另外，还有一些因果发现算法，比如FOFC(Find One Factor Clusters，发现单一隐变量父节点的聚类算法)、基于t-分割和扩展t-分割算法，能够提升因果关系图识别结果的准确性，但是，上述方法也无法识别出隐变量之间的关系，同时，上述算法要求每个隐变量至少含有3个可以独立的观测到的变量(这些变量不能和其他观测变量相连)。

此外，虽然基于独立成分分析的算法可以利用高阶信息，来减少对可观测独立变量的要求，但是该算法依然不能识别隐变量之间的关系，而且该算法识别的等价图结构类中等价图的个数可能非常多。然而等价图的个数越多，还原出真实图的可能性就越少。另外，还有一些研究工作是基于非高斯噪音假设的，然而，自然界中普遍存在高斯噪音，上述假设不具有应用价值。

针对上述问题，本公开提出一种因果关系图的构建方法、装置、电子设备和介质。

下面参考附图描述本公开实施例的因果关系图的构建方法、装置、电子设备和介质。

图1为本公开实施例一所提供的因果关系图的构建方法的流程示意图。

本公开实施例以该因果关系图的构建方法被配置于因果关系图的构建装置中来举例说明，其中，该因果关系图的构建装置可以应用于任一具有计算能力的电子设备中，以使该电子设备能够执行因果关系图的构建功能。

其中，电子设备例如可以为个人电脑、移动终端、服务器等，移动终端例如可以为手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。

如图1所示，该因果关系图的构建方法可以包括以下步骤：

步骤101，对多个观测对象在至少两种观测维度进行检测，以得到观测数据集。

在本公开实施例中，观测对象是指可观测的对象，比如，观测对象可以为人、动物、植物等对象。

在本公开实施例中，观测维度是指可观测的维度，其中，在不同的应用领域中，观测维度可以不同，比如，在健康领域中，观测维度可以为身高、体重等维度，在医学领域中，观测维度可以为体温、心率、血压等维度。

在本公开实施例中，可以根据实际的应用场景和应用领域，确定观测对象和观测维度，从而可以对确定的多个观测对象在至少两种观测维度上进行检测，以得到观测数据集。

步骤102，根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量。

在本公开实施例中，可以根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量。

例如，标记观测对象的个数为n，观测维度的个数为p，则第i个观测维度的观测变量可以表示为X_i，其中，X_i为n*1的向量，i＝1,2,…,p。

步骤103，根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵。

在本公开实施例中，可以根据上述至少两种观测维度的观测变量，确定用于指示上述至少两种观测维度的观测变量之间差异的协方差矩阵。

步骤104，根据协方差矩阵，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

在本公开实施例中，可以根据用于指示至少两种观测维度的观测变量之间差异的协方差矩阵，确定用于指示上述至少两种观测维度的观测变量之间关联性的邻接矩阵。例如，标记该邻接矩阵为W。

作为一种示例，可以对因果关系进行数学建模，假设观测数据集为X，比如，观测数据集X中包括100名学生的身高和体重，则p＝2，X可以为n*p的矩阵，则建立的数学模型可以为：

X_i＝f_i(Pag(X_i))+N_i； (1)

其中，N_i为观测变量X_i对应的噪音数据，比如，以观测变量X_i对应的观测维度为身高进行示例性说明，噪音数据可以包括鞋子的高度、袜子的高度、增高鞋垫的高度等等；f为一个转换方程，Pag(X_i)表示待构建拓扑结构的因果关系图中观测变量X_i对应的节点的父节点。

需要说明的是，因果关系图的邻接矩阵W可以表示为一个严格上三角矩阵的重排矩阵，例如，标记重排矩阵为P，严格上三角矩阵为T，则有：

W＝PTP^T； (2)

考虑到线性转换方程f，则有：

X＝XW+N； (3)

其中，N为观测数据集中的噪音数据。将公式(3)经过转换，则有：

其中，表示X重排之后的矩阵，/>表示N重排之后的矩阵，I为p*p的单位矩阵。

定义重排序列Q为：

Q＝[i₁,…,i_p]＝[1,…,p]P； (5)

其中，i₁,…,i_p分别表示重排序列中第1个元素值，…，第p个元素值。

采用重排序列表示公式(4)，可以得到：

其中，是指各观测变量，/>是指各观测变量对应的噪音数据。

则观测数据集的协方差矩阵[Σ_xx]_QQ可以表示为：

其中，σ表示各观测变量对应的噪音数据的标准差。

令U＝(I-T)^-1，则观测数据集的协方差矩阵可以表示为：

[Σ_xx]_QQ＝U^TU； (8)

根据公式(8)可知，观测数据集的协方差矩阵可以分解为一个下三角矩阵和一个上三角矩阵的乘积，而分解后的观测数据集的协方差矩阵的非对角元为重排后T的权重。

本公开中，可以采用公式(9)，来估计公式(7)或(8)，则可以得到用于指示上述至少两种观测维度的观测变量之间差异的协方差矩阵为：

其中，λ为设定值。

从而可以通过分解公式(9)，得到因果关系图的邻接矩阵W。

步骤105，根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。

在本公开实施例中，由于邻接矩阵指示了因果关系图中各节点之间的关联性或因果关系，从而可以根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。

本公开实施例的因果关系图的构建方法，通过对多个观测对象在至少两种观测维度进行检测，得到观测数据集，并根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量；根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵，并根据协方差矩阵，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵，从而可以根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。由此，可以实现根据观测数据集所确定的各观测维度的观测变量，有效构建用于指示各观测维度之间因果关系的因果关系图。

需要说明的是，本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均在征得用户同意的前提下进行，并且均符合相关法律法规的规定，且不违背公序良俗。

为了清楚说明本公开任一实施例中是如何根据协方差矩阵确定用于指示各观测维度的观测变量之间关联性的邻接矩阵的，本公开还提出一种因果关系图的构建方法。

图2为本公开实施例二所提供的因果关系图的构建方法的流程示意图。

如图2所示，该因果关系图的构建方法可以包括以下步骤：

步骤201，对多个观测对象在至少两种观测维度进行检测，以得到观测数据集。

步骤202，根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量。

步骤203，根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵。

步骤201至203的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

步骤204，从协方差矩阵中的各对角元中，确定取值最小的目标对角元。

在本公开实施例中，可以将协方差矩阵中的各对角元进行比对，以从各对角元中确定取值最小的目标对角元。

步骤205，确定目标对角元在协方差矩阵中所处的目标位置。

在本公开实施例中，可以确定目标对角元在协方差矩阵中所处的目标位置。比如，该目标位置可以为第l行第l列。

步骤206，获取设定的第一重排序列，其中，第一重排序列用于指示各观测变量对应的观测维度在因果关系图中的位置。

在本公开实施例中，可以获取设定的第一重排序列，其中，第一重排序列用于指示各观测变量对应的观测维度在因果关系图中的位置。

作为一种示例，第一重排序列可以为：Q＝[1,…,p]。

步骤207，将第一重排序列中首个位置处的元素与目标位置处的元素进行交换，以得到第二重排序列。

在本公开实施例中，可以将第一重排序列中首个位置处的元素与目标位置处的元素进行交换，以得到第二重排序列。

比如，目标对角元可以为可以令：则可以将第一重排序列中的i₁和i_l进行位置交换，得到第二重排序列。

步骤208，根据第二重排序列，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

在本公开实施例中，可以根据第二重排序列，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

步骤209，根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。

步骤209的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

本公开实施例的因果关系图的构建方法，通过从协方差矩阵中的各对角元中，确定取值最小的目标对角元，并确定目标对角元在协方差矩阵中所处的目标位置；获取设定的第一重排序列，其中，第一重排序列用于指示各观测变量对应的观测维度在因果关系图中的位置；将第一重排序列中首个位置处的元素与目标位置处的元素进行交换，以得到第二重排序列；根据第二重排序列，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。由此，可以实现根据用于指示各观测变量对应的观测维度在因果关系图中的位置的重排序列以及协方差矩阵，有效确定邻接矩阵。

为了清楚说明本公开任一实施例中是如何确定用于指示各观测维度的观测变量之间关联性的邻接矩阵的，本公开还提出一种因果关系图的构建方法。

图3为本公开实施例三所提供的因果关系图的构建方法的流程示意图。

如图3所示，该因果关系图的构建方法可以包括以下步骤：

步骤301，对多个观测对象在至少两种观测维度进行检测，以得到观测数据集。

步骤302，根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量。

步骤303，根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵。

步骤304，从协方差矩阵中的各对角元中，确定取值最小的目标对角元，并确定目标对角元在协方差矩阵中所处的目标位置。

步骤305，获取设定的第一重排序列，并将第一重排序列中首个位置处的元素与目标位置处的元素进行交换，以得到第二重排序列。

其中，第一重排序列用于指示各观测变量对应的观测维度在因果关系图中的位置。

步骤301至305的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

步骤306，根据协方差矩阵中目标位置处的元素，确定第一上三角矩阵。

在本公开实施例中，可以根据协方差矩阵中目标位置处的元素，确定第一上三角矩阵。其中，第一上三角矩阵为p*p的上三角矩阵。

在本公开实施例的一种可能的实现方式中，为了实现有效确定第一上三角矩阵，本公开中，可以根据协方差矩阵中目标位置处的元素，确定初始的上三角矩阵。比如，可以将协方差矩阵中目标位置处的元素，作为初始的上三角矩阵中的元素值。

作为一种示例，初始的上三角矩阵可以为1*1的矩阵，标记该初始的上三角矩阵为则：/>即该初始的上三角矩阵可以等于协方差矩阵中第i₁行第i₁列(即第l行第l列)的元素。

在本公开中，可以根据初始的上三角矩阵和协方差矩阵执行设定次数的迭代过程，以进行上三角矩阵的更新，其中，设定次数是根据观测维度的个数确定的，例如，设定次数可以为(p-1)次。在每次迭代过程中，可以在上三角矩阵中增加元素，以得到该次迭代过程更新得到的上三角矩阵，从而可以根据最后一次迭代过程中更新得到的上三角矩阵，确定第一上三角矩阵。

作为一种示例，可以将最后一次迭代过程中更新得到的上三角矩阵的逆矩阵，作为第一上三角矩阵。例如，标记最后一次迭代过程中更新得到的上三角矩阵为(p*p的矩阵)，则第一上三角矩阵可以为/>

步骤307，根据第一上三角矩阵，确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差。

在本公开实施例中，可以根据第一上三角矩阵，确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差。

在本公开实施例的一种可能的实现方式中，为了有效确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差，本公开中，可以确定第一上三角矩阵的逆矩阵中的各对角元的均值，根据上述均值，确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差。比如，可以将上述均值，作为噪音数据的标准差。

例如，标记噪音数据的标准差为则/>其中，/>表示p*p的矩阵/>中各对角元的均值。

步骤308，根据标准差、第一上三角矩阵和第二重排序列，确定邻接矩阵。

在本公开实施例中，可以根据上述标准差、第一上三角矩阵和第二重排序列，确定邻接矩阵。比如，可以根据上述标准差和第一上三角矩阵，确定严格上三角矩阵T，根据第一重排序列，确定重排矩阵P，根据T和P，确定邻接矩阵W。

步骤309，根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。

步骤309的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

本公开实施例的因果关系图的构建方法，通过根据协方差矩阵中目标位置处的元素，确定第一上三角矩阵；根据第一上三角矩阵，确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差；根据标准差、第一上三角矩阵和第二重排序列，确定邻接矩阵。由此，可以实现根据协方差矩阵中目标位置处的元素，有效计算用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

图4为本公开实施例四所提供的因果关系图的构建方法的流程示意图。

如图4所示，该因果关系图的构建方法可以包括以下步骤：

步骤401，对多个观测对象在至少两种观测维度进行检测，以得到观测数据集。

步骤402，根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量。

步骤403，根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵。

步骤404，从协方差矩阵中的各对角元中，确定取值最小的目标对角元，并确定目标对角元在协方差矩阵中所处的目标位置。

步骤405，获取设定的第一重排序列，并将第一重排序列中首个位置处的元素与目标位置处的元素进行交换，以得到第二重排序列。

步骤401至405的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

步骤406，根据协方差矩阵中目标位置处的元素，确定初始的上三角矩阵。

在本公开实施例中，可以根据协方差矩阵中目标位置处的元素，确定初始的上三角矩阵。比如，可以将协方差矩阵中目标位置处的元素，作为初始的上三角矩阵中的元素值。

步骤407，根据初始的上三角矩阵和协方差矩阵，执行设定次数的迭代过程以进行上三角矩阵和第二重排序列的更新。

在本公开实施例中，可以根据初始的上三角矩阵和协方差矩阵执行设定次数的迭代过程，以进行上三角矩阵的更新，其中，设定次数是根据观测维度的个数确定的，例如，设定次数可以为(p-1)次。在每次迭代过程中，可以在上三角矩阵中增加元素，以得到该次迭代过程更新得到的上三角矩阵，从而可以根据最后一次迭代过程中更新得到的上三角矩阵，确定第一上三角矩阵。

作为一种可能的实现方式，为了实现有效且准确地对初始的上三角矩阵进行更新，本公开中，针对任意一次迭代过程，可以根据迭代过程的已执行次数和设定次数，确定一个取值区间，比如，该区间可以为[已执行次数+1,设定次数+1]，从而本公开中，可以根据上述区间确定至少一个候选参数，根据至少一个候选参数，从协方差矩阵中确定本次执行该迭代过程的矩阵元素，并根据至少一个候选参数所选取出的矩阵元素和当前的上三角矩阵，确定各候选参数对应的更新参数，从而可以从上述至少一个候选参数对应的更新参数中，确定取值最小的目标更新参数，以根据目标更新参数，对当前的上三角矩阵增加元素，得到本次执行该迭代过程更新得到的上三角矩阵。进而可以根据最后一次迭代过程中更新得到的上三角矩阵，确定第一上三角矩阵。

在本公开实施例中，在每次迭代过程中，还可以根据目标更新参数对应的候选参数，对第二重排序列进行更新。

作为一种示例，以将最后一次迭代过程中更新得到的上三角矩阵的逆矩阵，作为第一上三角矩阵(即第一上三角矩阵为/>)进行示例，则可以根据下述算法1，确定/>其中，算法1的输入为：协方差矩阵/>和一个可调参数γ，其中，γ≥0；算法1的输出为：重排序列Q、/>和/>则算法1对应的逻辑为：

Set Q＝[1,…,p]，and/>//令Q＝[1,…,p]，令R为协方差矩阵中各对角元中的最大值，令/>

Set//令/>

Exchange i₁ and i_l in Q；//将Q中的i₁和i_l进行位置交换，得到第二重排序列

Set

for k＝2,3,…,p do

for j＝k,k+1,…,p do//j即为本公开中的候选参数

//α_j为候选参数j对应的更新参数

end for

//从候选参数对应的更新参数α_j中，确定平方值最小的目标更新参数，将目标更新参数对应的候选参数j作为l

Setand exchange i_k and i_l in Q；//令/>将Q(即第二重排序列)中的i_k和i_l进行位置交换

/>

end for

步骤408，根据最后一次迭代过程中更新得到的上三角矩阵，确定第一上三角矩阵。

在本公开实施例中，可以根据最后一次迭代过程中更新得到的上三角矩阵，确定第一上三角矩阵。比如，可以将最后一次迭代过程中更新得到的上三角矩阵的逆矩阵，作为第一上三角矩阵。例如，标记最后一次迭代过程中更新得到的上三角矩阵为则第一上三角矩阵可以为/>

步骤409，根据第一上三角矩阵，确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差。

步骤409的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

步骤410，确定第一上三角矩阵中的各对角元中的最小值。

在本公开实施例中，可以将第一上三角矩阵中各对角元进行比对，以确定各对角元中的最小值。

步骤411，在最小值未小于目标比值的情况下，根据第一上三角矩阵，确定第一严格上三角矩阵。

其中，目标比值是根据标准差和设定参数确定的，比如，标记设定参数为标注差为/>则目标比值可以为/>

在本公开实施例中，在第一上三角矩阵中的各对角元中的最小值未小于目标比值的情况下，表明无需在因果关系图中添加隐变量，此时，可以根据第一上三角矩阵，确定第一严格上三角矩阵。

在本公开实施例的一种可能的实现方式中，为了有效确定第一严格上三角矩阵，本公开中，可以将第一上三角矩阵中各对角元的取值置零，得到第一严格上三角矩阵。

在本公开实施例的另一种可能的实现方式中，为了有效确定第一严格上三角矩阵，本公开中，可以将第一上三角矩阵中各对角元的取值置零，得到初始严格上三角矩阵，并将初始严格上三角矩阵中各元素的取值与设定阈值进行比对，如果初始严格上三角矩阵中存在至少一个目标元素，则将初始严格上三角矩阵中的至少一个目标元素的取值置零，以得到第一严格上三角矩阵；而如果初始严格上三角矩阵中未存在至少一个目标元素，则将初始严格上三角矩阵，作为第一严格上三角矩阵。

其中，上述至少一个目标元素的取值未大于设定阈值。

步骤412，根据最后一次迭代过程中更新得到的第二重排序列，确定第一重排矩阵。

在本公开实施例中，可以根据最后一次迭代过程中更新得到的第二重排序列，确定第一重排矩阵，比如，可以采用公式(5)，根据最后一次迭代过程中更新得到的第二重排序列，确定第一重排矩阵。

步骤413，根据第一严格上三角矩阵和第一重排矩阵，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

在本公开实施例中，可以根据第一严格上三角矩阵和第一重排矩阵，确定邻接矩阵，比如，可以采用公式(2)，根据第一严格上三角矩阵和第一重排矩阵，确定邻接矩阵W。

步骤414，根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。

步骤414的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

本公开实施例的因果关系图的构建方法，可以实现根据协方差矩阵中目标位置处的元素，确定第一上三角矩阵，根据第一上三角矩阵和协方差矩阵，有效计算用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

图5为本公开实施例五所提供的因果关系图的构建方法的流程示意图。

如图5所示，该因果关系图的构建方法可以包括以下步骤：

步骤501，对多个观测对象在至少两种观测维度进行检测，以得到观测数据集。

步骤502，根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量。

步骤503，根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵。

步骤504，从协方差矩阵中的各对角元中，确定取值最小的目标对角元，并确定目标对角元在协方差矩阵中所处的目标位置。

步骤505，获取设定的第一重排序列，并将第一重排序列中首个位置处的元素与目标位置处的元素进行交换，以得到第二重排序列。

步骤506，根据协方差矩阵中目标位置处的元素，确定初始的上三角矩阵。

步骤507，根据初始的上三角矩阵和协方差矩阵，执行设定次数的迭代过程以进行上三角矩阵和第二重排序列的更新。

步骤508，根据最后一次迭代过程中更新得到的上三角矩阵，确定第一上三角矩阵。

步骤509，根据第一上三角矩阵，确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差。

步骤510，确定第一上三角矩阵中的各对角元中的最小值。

步骤501至510的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

步骤511，在最小值小于目标比值的情况下，将最后一次迭代过程中更新得到的上三角矩阵作为第二上三角矩阵，并将最后一次迭代过程中更新得到的第二重排序列作为第三重排序列。

在本公开实施例中，在第一上三角矩阵中的各对角元中的最小值小于目标比值的情况下，表明需要在因果关系图中添加隐变量，此时，可以将最后一次迭代过程中更新得到的上三角矩阵作为第二上三角矩阵，并将最后一次迭代过程中更新得到的第二重排序列作为第三重排序列，以根据第二上三角矩阵和第三重排序列执行后续步骤。

步骤512，根据第三重排序列和第二上三角矩阵，执行至少一次循环过程以进行第三重排序列和第二上三角矩阵的更新。

在本公开实施例中，可以根据第三重排序列和第二上三角矩阵，执行至少一次循环过程，以进行第三重排序列的更新以及进行第二上三角矩阵的更新。

在本公开实施例的一种可能的实现方式中，为了实现有效且准确地对第三重排序列和第二上三角矩阵进行更新，本公开中，针对任意一次循环过程，可以判断前一次循环过程更新得到的第二上三角矩阵中各对角元中的取值最小的对角元是否小于目标比值，若否，即上述取值最小的对角元未小于目标比值，则表明本次循环过程无需在因果关系图中添加隐变量，此时，可以停止循环，即结束循环过程，若是，即上述取值最小的对角元小于目标比值，则表明还需继续在因果关系图中添加隐变量，此时，可以根据取值最小的对角元在前一次循环过程更新得到的第二上三角矩阵中所处的第一位置，确定待添加的隐变量在前一次循环过程更新得到的第三重排序列中所处的第二位置，从而可以在前一次循环过程更新得到的第三重排序列中的第二位置处，添加隐变量对应的元素值，以得到本次循环过程更新得到的第三重排序列。

在得到本次循环过程更新得到的第三重排序列后，可以继续根据本次循环过程更新得到的第三重排序列和协方差矩阵，确定本次循环过程对应的中间矩阵，从而可以根据中间矩阵对前一次循环过程更新得到的第二上三角矩阵进行更新，得到本次循环过程更新得到的第二上三角矩阵。

作为一种示例，以初始的q等于p进行示例，则可以根据下述算法2，确定最后一次循环过程中更新得到的第三重排序列和最后一次循环过程中更新得到的第二上三角矩阵。其中，算法2的输入为协方差矩阵和三个参数γ、/>和μ(均为人工设定值)；算法2的输出为：重排序列Q(即最后一次循环过程中更新得到的第三重排序列)和/>(即最后一次循环过程中更新得到的第二上三角矩阵)。则算法2对应的逻辑为：

j＝[]；

while#j≤p-q do

call Alg.1with inputγ，output Q，/>and/>//调用算法1，输入协方差矩阵/>和γ，输出重排序列、标准差/>和/>(初始时，令q＝p)

ifthen//如果/>中的各对角元中的最小值小于/>则执行以下步骤/>

q＝q+1；

J＝[J,j]，J^c＝[1,…,q]\J；//J^c是因果关系图中可观测到的节点(即观测变量)在重排序列中的位置，J表示向量，j表示元素值；

Q＝[i₁,…,i_j-1,q,i_j,…,i_q-1]，Q^c＝Q_Jc；

Solve(10)for S；//执行公式(10)，求解S

Compute C(S)in(11)and update via(12)；//根据S和公式(11)，求解C(S)，根据C(S)和公式(12)更新协方差矩阵

else

break；

end if

end while

其中，公式(10)为通过随机梯度下降求解一个优化问题，得到可优化参数S的最优解：

其中，公式(10)中的第一项的下标F表示F范数，第二项的下标1表示1范数。

其中，z＝[x^T,y^T]^T，x＝[C(S)]_1:j-1,j(矩阵C(S)中第1行到第j-1行中第j列的元素值)，y＝[C(S)]_j+1:q,j(矩阵C(S)中第j+1行到第q行中第j列的元素值)，d²＝[C(S)]_j,j(矩阵C(S)中第j行第j列的对角元)。

需要说明的是，在下一次循环过程中，可以将公式(11)更新得到的U(S)，作为从而可以根据/>计算/>如果/>则需要继续添加隐变量，而如果则无需添加隐变量，可以退出循环。

步骤513，根据最后一次循环过程中更新得到的第三重排序列，确定第二重排矩阵。

在本公开实施例中，可以根据最后一次循环过程中更新得到的第三重排序列，确定第二重排矩阵，比如，可以采用公式(5)，根据最后一次循环过程中更新得到的第三重排序列，确定第二重排矩阵。

步骤514，根据最后一次循环过程中更新得到的第二上三角矩阵，确定第二严格上三角矩阵。

在本公开实施例中，可以根据最后一次循环过程中更新得到的第二上三角矩阵，确定第二严格上三角矩阵。

在本公开实施例的一种可能的实现方式中，为了有效确定第二严格上三角矩阵，本公开中，可以将最后一次循环过程中更新得到的第二上三角矩阵中各对角元的取值置零，得到第二严格上三角矩阵。

在本公开实施例的另一种可能的实现方式中，为了有效确定第二严格上三角矩阵，本公开中，可以将最后一次循环过程中更新得到的第二上三角矩阵中各对角元的取值置零，得到候选严格上三角矩阵，并将候选严格上三角矩阵中各元素的取值与设定阈值进行比对，如果候选严格上三角矩阵中存在至少一个目标元素，则将候选严格上三角矩阵中的至少一个目标元素的取值置零，以得到第二严格上三角矩阵；而如果候选严格上三角矩阵中未存在至少一个目标元素，则将候选严格上三角矩阵，作为第二严格上三角矩阵。

步骤515，根据第二严格上三角矩阵和第二重排矩阵，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

在本公开实施例中，可以根据第二严格上三角矩阵和第二重排矩阵，确定邻接矩阵，比如，可以采用公式(2)，根据第二严格上三角矩阵和第二重排矩阵，确定邻接矩阵W。

步骤516，根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。

步骤516的执行过程可以参见本公开任一实施例的执行过程，在此不做赘述。

在本公开实施例的一种可能的实现方式中，为了提升因果关系图生成结果的准确性和可靠性，本公开中，可以根据邻接矩阵和至少两种观测维度的观测变量，确定各隐变量，从而可以根据各隐变量、至少两种观测维度的观测变量以及邻接矩阵，构建因果关系图。

作为一种示例，发明人采用本公开所提供的方法(后续称为算法1)在22中图类型(可识别identifiable的图)上进行了实验，实验结果所识别得到的因果关系图可以如图6所示，其中，因果关系图中的节点0、节点1和节点2表示观测变量，节点3和节点4表示隐变量。

并且，发明人还采用相关技术中的B-S(BIC(Bayesian information criterion，贝叶斯信息准则)guided search，BIC分数指导的搜索算法)(后续称为算法2)，在22种图类型上进行了实验，实验结果可以如表1和表2所示。

表1

表2

其中，表1和表2中实验结果为：算法1识别得到的因果关系图和真实的因果关系图之间的差异或距离，以及算法2识别得到的因果关系图和真实的因果关系图之间的差异或距离。由表1和表2可知，算法1与真实的因果关系图之间的差异或距离明显小于算法2。也就是说，本公开中，基于观测变量间的关系，隐变量间的关系和观测变量和隐变量间的关系，生成因果关系图，可以提升生成结果的准确性和可靠性。

与上述图1至图5实施例提供的因果关系图的构建方法相对应，本公开还提供一种因果关系图的构建装置，由于本公开实施例提供的因果关系图的构建装置与上述图1至图5实施例提供的因果关系图的构建方法相对应，因此在因果关系图的构建方法的实施方式也适用于本公开实施例提供的因果关系图的构建装置，在本公开实施例中不再详细描述。

图7为本公开实施例六所提供的因果关系图的构建装置的结构示意图。

如图7所示，该因果关系图的构建装置700可以包括：检测模块701、第一确定模块702、第二确定模块703、第三确定模块704以及生成模块705。

其中，检测模块701，用于对多个观测对象在至少两种观测维度进行检测，以得到观测数据集。

第一确定模块702，用于根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量。

第二确定模块703，用于根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵。

第三确定模块704，用于根据协方差矩阵，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵。

生成模块705，用于根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。

在本公开实施例的一种可能的实现方式中，第三确定模块704，具体用于：从协方差矩阵中的各对角元中，确定取值最小的目标对角元；确定目标对角元在协方差矩阵中所处的目标位置；获取设定的第一重排序列，其中，第一重排序列用于指示各观测变量对应的观测维度在因果关系图中的位置；将第一重排序列中首个位置处的元素与目标位置处的元素进行交换，以得到第二重排序列；根据第二重排序列，确定邻接矩阵。

在本公开实施例的一种可能的实现方式中，第三确定模块704，具体用于：根据协方差矩阵中目标位置处的元素，确定第一上三角矩阵；根据第一上三角矩阵，确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差；根据标准差、第一上三角矩阵和第二重排序列，确定邻接矩阵。

在本公开实施例的一种可能的实现方式中，第三确定模块704，具体用于：根据协方差矩阵中目标位置处的元素，确定初始的上三角矩阵；根据初始的上三角矩阵和协方差矩阵，执行设定次数的迭代过程以进行上三角矩阵的更新；根据最后一次迭代过程中更新得到的上三角矩阵，确定第一上三角矩阵。

在本公开实施例的一种可能的实现方式中，设定次数是根据观测维度的个数确定的，任意一次迭代过程包括：根据迭代过程的已执行次数和设定次数所确定的区间，确定至少一个候选参数；根据至少一个候选参数，从协方差矩阵中确定本次执行迭代过程的矩阵元素；根据至少一个候选参数所选取出的矩阵元素和当前的上三角矩阵，确定各候选参数对应的更新参数；从至少一个候选参数对应的更新参数中，确定取值最小的目标更新参数；根据目标更新参数，对当前的上三角矩阵增加元素，以确定本次执行迭代过程更新得到的上三角矩阵。

在本公开实施例的一种可能的实现方式中，任意一次迭代过程还包括：根据目标更新参数对应的候选参数，对第二重排序列进行更新；第三确定模块704，具体用于：确定第一上三角矩阵中的各对角元中的最小值；在最小值未小于目标比值的情况下，根据第一上三角矩阵，确定第一严格上三角矩阵；其中，目标比值是根据标准差和设定参数确定的；根据最后一次迭代过程中更新得到的第二重排序列，确定第一重排矩阵；根据第一严格上三角矩阵和第一重排矩阵，确定邻接矩阵。

在本公开实施例的一种可能的实现方式中，第三确定模块704，具体用于：将第一上三角矩阵中各对角元的取值置零，得到初始严格上三角矩阵；将初始严格上三角矩阵中各元素的取值与设定阈值进行比对；在初始严格上三角矩阵中存在至少一个目标元素的情况下，将初始严格上三角矩阵中的至少一个目标元素的取值置零，以得到第一严格上三角矩阵，其中，至少一个目标元素的取值未大于设定阈值。

在本公开实施例的一种可能的实现方式中，第三确定模块704，具体用于：在最小值小于目标比值的情况下，将最后一次迭代过程中更新得到的上三角矩阵作为第二上三角矩阵，并将最后一次迭代过程中更新得到的第二重排序列作为第三重排序列；根据第三重排序列和第二上三角矩阵，执行至少一次循环过程以进行第三重排序列和第二上三角矩阵的更新；根据最后一次循环过程中更新得到的第三重排序列，确定第二重排矩阵；根据最后一次循环过程中更新得到的第二上三角矩阵，确定第二严格上三角矩阵；根据第二严格上三角矩阵和第二重排矩阵，确定邻接矩阵。

在本公开实施例的一种可能的实现方式中，任意一次循环过程包括：判断前一次循环过程更新得到的第二上三角矩阵中各对角元中的最小的对角元是否小于目标比值；在最小的对角元未小于目标比值的情况下，结束循环过程；在最小的对角元小于目标比值的情况下，根据最小的对角元在前一次循环过程更新得到的第二上三角矩阵中所处的第一位置，确定待添加的隐变量在前一次循环过程更新得到的第三重排序列中所处的第二位置；在前一次循环过程更新得到的第三重排序列中的第二位置处，添加隐变量对应的元素值，以得到本次循环过程更新得到的第三重排序列；根据本次循环过程更新得到的第三重排序列和协方差矩阵，确定本次循环过程对应的中间矩阵；根据中间矩阵对前一次循环过程更新得到的第二上三角矩阵进行更新，以得到本次循环过程更新得到的第二上三角矩阵。

在本公开实施例的一种可能的实现方式中，生成模块705，具体用于：根据邻接矩阵和至少两种观测维度的观测变量，确定各隐变量；根据各隐变量、至少两种观测维度的观测变量以及邻接矩阵，构建因果关系图。

在本公开实施例的一种可能的实现方式中，第三确定模块704，具体用于：确定第一上三角矩阵的逆矩阵中的各对角元的均值；根据均值确定观测数据集中至少两种观测维度的观测变量对应的噪音数据的标准差。

本公开实施例的因果关系图的构建装置，通过对多个观测对象在至少两种观测维度进行检测，得到观测数据集，并根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量；根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵，并根据协方差矩阵，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵，从而可以根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。由此，可以实现根据观测数据集所确定的各观测维度的观测变量，有效构建用于指示各观测维度之间因果关系的因果关系图。

为了实现上述实施例，本公开还提供一种电子设备，该电子设备可以包括至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本公开上述任一实施例提出的因果关系图的构建方法。

为了实现上述实施例，本公开还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行本公开上述任一实施例提出的因果关系图的构建方法。

为了实现上述实施例，本公开还提供一种计算机程序产品，该计算机程序产品包括计算机程序，计算机程序在被处理器执行时实现本公开上述任一实施例提出的因果关系图的构建方法。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图8示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图8所示，电子设备800包括计算单元801，其可以根据存储在ROM(Read-OnlyMemory，只读存储器)802中的计算机程序或者从存储单元808加载到RAM(Random AccessMemory，随机访问/存取存储器)803中的计算机程序，来执行各种适当的动作和处理。在RAM803中，还可存储电子设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM803通过总线804彼此相连。I/O(Input/Output，输入/输出)接口805也连接至总线804。

电子设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于CPU(Central Processing Unit，中央处理单元)、GPU(Graphic Processing Units，图形处理单元)、各种专用的AI(Artificial Intelligence，人工智能)计算芯片、各种运行机器学习模型算法的计算单元、DSP(Digital SignalProcessor，数字信号处理器)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如上述因果关系图的构建方法。例如，在一些实施例中，上述因果关系图的构建方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到电子设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的因果关系图的构建方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行上述因果关系图的构建方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、FPGA(Field Programmable Gate Array，现场可编程门阵列)、ASIC(Application-Specific Integrated Circuit，专用集成电路)、ASSP(Application Specific StandardProduct，专用标准产品)、SOC(System On Chip，芯片上系统的系统)、CPLD(ComplexProgrammable Logic Device，复杂可编程逻辑设备)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、RAM、ROM、EPROM(Electrically Programmable Read-Only-Memory，可擦除可编程只读存储器)或快闪存储器、光纤、CD-ROM(Compact Disc Read-Only Memory，便捷式紧凑盘只读存储器)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(Cathode-Ray Tube，阴极射线管)或者LCD(Liquid Crystal Display，液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：LAN(LocalArea Network，局域网)、WAN(Wide Area Network，广域网)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务(VirtualPrivate Server，虚拟专用服务器)中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

其中，需要说明的是，人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

根据本公开实施例的技术方案，通过对多个观测对象在至少两种观测维度进行检测，得到观测数据集，并根据观测数据集中至少两种观测维度的观测数据，确定对应观测维度的观测变量；根据至少两种观测维度的观测变量，确定用于指示至少两种观测维度的观测变量之间差异的协方差矩阵，并根据协方差矩阵，确定用于指示至少两种观测维度的观测变量之间关联性的邻接矩阵，从而可以根据邻接矩阵和至少两种观测维度的观测变量，生成用于指示至少两种观测维度之间因果关系的因果关系图。由此，可以实现根据观测数据集所确定的各观测维度的观测变量，有效构建用于指示各观测维度之间因果关系的因果关系图。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开提出的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种因果关系图的构建方法，运用于医学领域，所述方法包括：

对多个观测对象在至少两种观测维度进行检测，以得到观测数据集，所述观测维度包括体温、心率、血压；

根据所述观测数据集中所述至少两种观测维度的观测数据，确定对应观测维度的观测变量X_i；所述观测变量X_i为n*1的向量,i=1,2,…,p，其中，n为所述多个观测对象的个数，p为观测维度的个数；

从所述协方差矩阵中的各对角元中，确定取值最小的目标对角元；

确定所述目标对角元在所述协方差矩阵中所处的目标位置；

获取设定的第一重排序列，其中，所述第一重排序列用于指示各所述观测变量对应的观测维度在所述因果关系图中的位置；

将所述第一重排序列中首个位置处的元素与所述目标位置处的元素进行交换，以得到第二重排序列；

根据所述协方差矩阵中所述目标位置处的元素，确定第一上三角矩阵；

根据所述第一上三角矩阵，确定所述观测数据集中所述至少两种观测维度的观测变量对应的噪音数据的标准差；

根据所述标准差、所述第一上三角矩阵和所述第二重排序列，确定邻接矩阵；

根据所述邻接矩阵和所述至少两种观测维度的观测变量，生成用于指示所述至少两种观测维度之间因果关系的因果关系图；

其中，所述根据所述邻接矩阵和所述至少两种观测维度的观测变量，生成用于指示所述至少两种观测维度之间因果关系的因果关系图，包括：

根据所述邻接矩阵和所述至少两种观测维度的观测变量，确定各隐变量，所述隐变量包括基因表达、家族疾病历史和饮食习惯；

根据各所述隐变量、所述至少两种观测维度的观测变量以及所述邻接矩阵，构建所述因果关系图，所述因果关系图用于分析观测对象所患有的疾病。

2.根据权利要求1所述的方法，其中，所述根据所述协方差矩阵中所述目标位置处的元素，确定第一上三角矩阵，包括：

根据所述协方差矩阵中所述目标位置处的元素，确定初始的上三角矩阵；

根据所述初始的上三角矩阵和所述协方差矩阵，执行设定次数的迭代过程以进行所述上三角矩阵的更新；

根据最后一次所述迭代过程中更新得到的上三角矩阵，确定所述第一上三角矩阵。

3.根据权利要求2所述的方法，其中，所述设定次数是根据所述观测维度的个数确定的，任意一次所述迭代过程包括：

根据所述迭代过程的已执行次数和所述设定次数所确定的区间，确定至少一个候选参数；

根据所述至少一个候选参数，从所述协方差矩阵中确定本次执行所述迭代过程的矩阵元素；

根据所述至少一个候选参数所选取出的矩阵元素和当前的上三角矩阵，确定各所述候选参数对应的更新参数；

从所述至少一个候选参数对应的更新参数中，确定取值最小的目标更新参数；

根据所述目标更新参数，对当前的上三角矩阵增加元素，以确定本次执行所述迭代过程更新得到的上三角矩阵。

4.根据权利要求3所述的方法，其中，任意一次所述迭代过程还包括：根据所述目标更新参数对应的候选参数，对所述第二重排序列进行更新；

所述根据所述标准差、所述第一上三角矩阵和所述第二重排序列，确定所述邻接矩阵，包括：

确定所述第一上三角矩阵中的各对角元中的最小值；

在所述最小值未小于目标比值的情况下，根据所述第一上三角矩阵，确定第一严格上三角矩阵；其中，所述目标比值是根据所述标准差和设定参数确定的；

根据最后一次所述迭代过程中更新得到的第二重排序列，确定第一重排矩阵；

根据所述第一严格上三角矩阵和所述第一重排矩阵，确定所述邻接矩阵。

5.根据权利要求4所述的方法，其中，所述根据所述第一上三角矩阵，确定第一严格上三角矩阵，包括：

将所述第一上三角矩阵中各对角元的取值置零，得到初始严格上三角矩阵；

将所述初始严格上三角矩阵中各元素的取值与设定阈值进行比对；

在所述初始严格上三角矩阵中存在至少一个目标元素的情况下，将所述初始严格上三角矩阵中的所述至少一个目标元素的取值置零，以得到所述第一严格上三角矩阵，其中，所述至少一个目标元素的取值未大于所述设定阈值。

6.根据权利要求4所述的方法，其中，所述根据所述标准差、所述第一上三角矩阵和所述第二重排序列，确定所述邻接矩阵，还包括：

在所述最小值小于所述目标比值的情况下，将最后一次所述迭代过程中更新得到的上三角矩阵作为第二上三角矩阵，并将最后一次所述迭代过程中更新得到的第二重排序列作为第三重排序列；

根据所述第三重排序列和所述第二上三角矩阵，执行至少一次循环过程以进行所述第三重排序列和所述第二上三角矩阵的更新；

根据最后一次所述循环过程中更新得到的第三重排序列，确定第二重排矩阵；

根据最后一次所述循环过程中更新得到的第二上三角矩阵，确定第二严格上三角矩阵；

根据所述第二严格上三角矩阵和所述第二重排矩阵，确定所述邻接矩阵。

7.根据权利要求6所述的方法，其中，任意一次所述循环过程包括：

判断前一次所述循环过程更新得到的第二上三角矩阵中各对角元中的最小的对角元是否小于目标比值；

在所述最小的对角元未小于所述目标比值的情况下，结束所述循环过程；

在所述最小的对角元小于所述目标比值的情况下，根据所述最小的对角元在前一次所述循环过程更新得到的第二上三角矩阵中所处的第一位置，确定待添加的隐变量在前一次所述循环过程更新得到的第三重排序列中所处的第二位置；

在前一次所述循环过程更新得到的第三重排序列中的第二位置处，添加所述隐变量对应的元素值，以得到本次循环过程更新得到的第三重排序列；

根据本次循环过程更新得到的第三重排序列和所述协方差矩阵，确定本次循环过程对应的中间矩阵；

根据所述中间矩阵对前一次所述循环过程更新得到的第二上三角矩阵进行更新，以得到本次循环过程更新得到的第二上三角矩阵。

8.根据权利要求1-7中任一项所述的方法，其中，所述根据所述第一上三角矩阵，确定所述观测数据集中所述至少两种观测维度的观测变量对应的噪音数据的标准差，包括：

确定所述第一上三角矩阵的逆矩阵中的各对角元的均值；

根据所述均值确定所述观测数据集中所述至少两种观测维度的观测变量对应的噪音数据的标准差。

9.一种因果关系图的构建装置，运用于医学领域，所述装置包括：

检测模块，用于对多个观测对象在至少两种观测维度进行检测，以得到观测数据集，所述观测维度包括体温、心率、血压；

第一确定模块，用于根据所述观测数据集中所述至少两种观测维度的观测数据，确定对应观测维度的观测变量X_i；所述观测变量X_i为n*1的向量,i=1,2,…,p，其中，n为所述多个观测对象的个数，p为观测维度的个数；

生成模块，用于根据所述邻接矩阵和所述至少两种观测维度的观测变量，生成用于指示所述至少两种观测维度之间因果关系的因果关系图；

其中，所述生成模块，具体用于：

根据所述邻接矩阵和所述至少两种观测维度的观测变量，确定各隐变量；所述隐变量包括基因表达、家族疾病历史和饮食习惯；

根据各所述隐变量、所述至少两种观测维度的观测变量以及所述邻接矩阵，构建所述因果关系图，所述因果关系图用于分析观测对象所患有的疾病；

所述第三确定模块，具体用于：

确定所述目标对角元在所述协方差矩阵中所处的目标位置；

根据所述标准差、所述第一上三角矩阵和所述第二重排序列，确定所述邻接矩阵。

10.根据权利要求9所述的装置，其中，所述第三确定模块，具体用于：

11.根据权利要求10所述的装置，其中，所述设定次数是根据所述观测维度的个数确定的，任意一次所述迭代过程包括：

12.根据权利要求11所述的装置，其中，任意一次所述迭代过程还包括：根据所述目标更新参数对应的候选参数，对所述第二重排序列进行更新；

所述第三确定模块，具体用于：

确定所述第一上三角矩阵中的各对角元中的最小值；

13.根据权利要求12所述的装置，其中，所述第三确定模块，具体用于：

14.根据权利要求12所述的装置，其中，所述第三确定模块，具体用于：

15.根据权利要求14所述的装置，其中，任意一次所述循环过程包括：

16.根据权利要求11-15中任一项所述的装置，其中，所述第三确定模块，具体用于：

确定所述第一上三角矩阵的逆矩阵中的各对角元的均值；

17.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。