CN110019973A - 用于估计观测变量之间的因果关系的方法、装置和系统 - Google Patents
用于估计观测变量之间的因果关系的方法、装置和系统 Download PDFInfo
- Publication number
- CN110019973A CN110019973A CN201710919294.1A CN201710919294A CN110019973A CN 110019973 A CN110019973 A CN 110019973A CN 201710919294 A CN201710919294 A CN 201710919294A CN 110019973 A CN110019973 A CN 110019973A
- Authority
- CN
- China
- Prior art keywords
- variables
- observed variables
- observed
- indirect
- constraint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001364 causal effect Effects 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000004044 response Effects 0.000 claims abstract description 7
- 238000005457 optimization Methods 0.000 claims abstract description 5
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000000844 transformation Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000000165 glow discharge ionisation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Mathematics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Artificial Intelligence (AREA)
- Mathematical Analysis (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Fuzzy Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种用于估计观测变量之间的因果关系的方法、装置和系统。根据本公开的用于估计观测变量之间的因果关系的方法可以包括响应于接收到针对多个观测变量其中至少一部分的专家知识,将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束;以及利用所述观测变量的观测数据,通过稀疏因果关系推理,在有向无环图的约束和从专家知识转换得到的所需要满足的约束下,对所述因果关系目标式进行最优化求解,以估计所述观测变量之间的因果关系。利用本公开的实施方式,能够以简单的方式将其并入到因果推理过程中,以充分利用专家知识,得到更加精确的因果关系。
Description
技术领域
本公开涉及数据挖掘技术领域,更特别地涉及一种用于估计观测变量之间的因果关系的方法、装置和系统。
背景技术
在大数据时代,可以通过各种数据采集途径获得大量的数据。通过对这些数据进行数据分析与挖掘,可以得到很多有用的信息。然而,在众多应用领域中,人们往往只能看到系统的表象,得到观测数据,却无法洞察系统背后复杂的作用机理及作用过程,而是仅能获得经验型的理解。
因果结构学习致力于基于系统的观测数据,自动还原系统背后复杂的作用机理,还原数据生成过程。目前,因果结构学习技术已被广泛应用于制药、制造。市场分析等多个领域,以便洞察系统本质,继而指导决策,创造价值。在因果结构学习中可以采用各种类型的模型,其中比较常用的包括结构方程模型、布尔可满足因果模型和贝叶斯网络因果模型。
目前,多数因果关系发现系统仅仅基于观测数据来恢复系统潜在机制,或者完全基于专家知识来构造因果关系网络,然后测试数据是否与假设模型拟合。然而,尽管掌握有一些专家知识,但是这些专家知识并不足以用来构建整个因果关系网络。
在G.Bordoudakis和I.Tsamardions在国际机器学习大会(ICML)上发表的论文“Scoring and searching over Bayesian networks with causal and associativepriors”(2012)中,提出使用基于路径置信度的先验知识(软约束)并使用局部贪婪算法进行因果推理。在该方案中,专家提供的先验知识涉及部分变量对,其并非百分百确定,而且这些先验知识还可能是不相干的置信度或者是错误先验。在该方案中,输入系统的是一组路径置信度K=<R,Π>,其指示在节点之间各种类型的路径存在的概率,其中R表示路径类型,Π表示概率分布。R中的元素rij可以表示如下:
其中
表示节点i和节点j之间存在从节点i至节点j的路径,
表示在从节点j至节点i的路径,
表示节点i至节点j之间存在双向路径,以及
节点i至节点j之间存在任何路径。
此外,Π中元素表示节点i和节点j之间存在rij类型的路径的概率,
在该方案中,提出了使用如下评分函数:
其中:
G指示因果关系图;
D指示观测数据;
J是路径置信度的联合分布,J=P(r1,…,rn|Π)=P(R|Π);
Sc(D|G)是评分函数,其可以是任何现有的用于贝叶斯网络的评分函数,例如BDeu;
是路径置信度的评分;
C是路径变量R=<r1,…,rn>的联合实例;
JC=P(R=C|Π);以及
CG是图G中变量R的联合实例。
从上面的评分公式可以看出,先验知识作为评分的一个独立项存在,从而对搜索过程进行影响。出于说明的目的,在图1中示意性地示出了该方法的流程图。在如图1所示,首先设置路径置信度101a,即K=<R,Π>。然后,在步骤102针对置信度执行相关性检测,如果存在不相干的置信度,则对K=<R,Π>进行预处理,以便得到相干置信度K’=<R,Π>(步骤103)。如果所有置信度均具有相干性,则直接进入步骤104。在步骤104,计算Jc值和Nc值(即,图G中的路径变量R的联合实例的数目)。随后,利用观测数据,根据贪婪本地搜索算法对因果关系目标式进行优化求解,最终得到因果关系结构。
因此,在上面的方案中,先验知识是一组置信度值,这意味着需要用户针对一组路径提供先验知识及其概率分布。尽管根据该方案,系统能够允许一定程度的错误,但是该系统仍然要求用户提供诸如概率这样的具体信息,而这对于用户而言是困难的。
为此,在本领域中存在针对基于专家知识的因果关系发现的新技术的需求。
发明内容
有鉴于此,本公开提出了一种用于估计观测变量之间的因果关系的方法、装置和系统,以至少部分上消除或者缓解现有技术中的问题。
根据本公开的第一方面,提供了一种用于估计观测变量之间的因果关系的方法。该方法可以包括:响应于接收到针对多个观测变量其中至少一部分的专家知识,将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束;以及,利用所述观测变量的观测数据,通过稀疏因果关系推理,在有向无环图的约束和从专家知识转换得到的所需要满足的约束下,对所述因果关系目标式进行最优化求解,以估计所述观测变量之间的因果关系。
根据本公开的第二方面,提供了一种用于估计观测变量之间的因果关系的装置。该装置可以包括:专家知识转换模块和因果推理模块。所述专家知识转换模块可以被配置为响应于接收到针对多个观测变量其中至少一部分的专家知识,将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束。所述因果推理模块可以被配置为利用所述观测变量的观测数据,通过稀疏因果关系推理,在有向无环图的约束和从专家知识转换得到的所需要满足的约束下,对所述因果关系目标式进行最优化求解,以估计所述观测变量之间的因果关系。
根据本公开的第三方面,提供了一种用于估计观测变量之间的因果关系的系统,所述系统可以包括:处理器,和存储器,其中存储有计算机程序代码,所述计算机程序代码在被所述处理器执行时,使得所述处理器执行根据本公开的第一方面所述的方法的步骤。
根据本公开的第四方面,提供了一种计算程序产品,其上包括有计算机程序代码,当被加载到计算机设备中时,其可以使得该计算机设备执行根据本公开的第一方面的方法的步骤。
根据本公开的实施方式,可以将专家知识转换成针对因果关系式的约束,从而能够以简单的方式将专家知识并入到因果推理过程中,以够充分利用专家知识,得到更加精确的因果关系。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开的附图中相同的标号表示相同或相似的部件。在附图中:
图1示意性地示出了现有技术中的用于因果关系估计的示例方法的流程图;
图2示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的方法的流程图;
图3示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的装置的方框图;
图4示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的装置的示例实现的示意图;
图5示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的系统的示意图。
具体实施方式
在下文中,将参考附图详细描述本公开的各个示例性实施方式。应当注意,这些附图和描述涉及的仅仅是作为示例的优选实施方式。可以应该指出的是,根据随后的描述,很容易设想出此处公开的结构和方法的替换实施方式,并且可以在不脱离本公开要求保护的公开的原理的情况下使用这些替代实施方式。
应当理解,给出这些示例性实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。此外在附图中,出于说明的目的,将可选的步骤、模块、模块等以虚线框示出。
在此使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语,即“包括/包含但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在下文描述中给出。
如前所述,在现有技术中需要用户针对一组路径提供先验知识及其概率分布,以便基于专家知识执行因果推理过程。尽管系统能够允许一定程度的错误,但是该系统仍然需要用户提供诸如概率这样具体的信息,而这对于用户而言是困难的。为此,在本申请中提出了一种新的用于在因果关系估计中并入专家知识的方案。根据本公开的实施方式,提议将专家知识转化为所述多个观测变量的因果关系目标式所需要满足的约束,由此以简单的方式将专家知识并入到因果关系推理过程中,以便充分利用专家知识。
在下文中,将参考图2至图5来描述根据本公开的因果关系估计方法、装置和系统。然而,需要说明的是,这些描述仅仅出于说明的目的,本公开并不局限于这些实施方式和附图中的细节。
图2示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的流程图。如图2所示,首先在步骤201,响应于接收到针对多个观测变量其中至少一部分的专家知识,将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束。
可以设置观测数据库,在其中存储系统观测数据X,X∈RN×D,X是一个N*D的矩阵,其N为观测样本的数量,D为观测变量的维数,或者观测变量的数目。观测数据库中的数据,可以是来自第三方的数据,或者是通过其他方式采集的数据。而且,可以预先对这些数据预处理,例如对原始数据的集成、规约、降噪等预处理。这些预处理操作本身在本领域是已知的,此处不再赘述。
此外,还接收专家知识K。可以针对观测数据X和专家知识K,通过两者的联合分布来确定因果关系目标式:
P(G|X,K)∝P(X|G)P(G|K) (式4)
其中,
为了最大化该联合分布,可以将其转化成如下问题,进行最优化求解。
●找到一个有向无环图DAG,使其满足:
其中
pad是指示第d个节点的父集合的节点编号集合;
可以是对数似然值,即或者也可以采用任何其他适当的评分函数形式,
G是指示因果关系结构的有向无环图,其例如是矩阵形式,G∈{0,1}D×D,GD是图G中的第d行,GD中的“1”指示第d个节点的父节点所在位置,换言之,GD中“1”的索引指示了父节点集合pad。
专家知识可以是针对多个观测变量中至少一部分的约束。这些约束例如可以包括边约束、路径约束、充分条件、必要条件其中任何一个或多个。在下文中,出于说明的目的,将针对每种专家知识的转换进行详细说明。然而,可以理解的是,在实际应用中,可以包括这些专家知识中的任何一种或多种,而且对于每种专家知识,其中的约束也可以包括任何一种或者多种。
边约束的转换
边约束是指专家知识针对因果关系网络中节点之间的边施加的约束,其可以涉及直接原因、无直接原因,或直接互相关。
直接原因
对于两个观测变量之间的直接原因,则可以将其转换为针对相应两个节点之间的父子关系的约束。
例如,如果节点d’是节点d的直接原因,则可以确定节点d’是节点d的父节点,此时可以将该直接原因转换为:d′∈pad即,d’是节点d的父节点集合中的一个元素。
无直接原因
对于将两个观测变量之间无直接原因,则可以将其转换为针对相应两个节点之间不存在父子关系的约束。
例如,如果节点d’不是节点d的直接原因,则可以确定节点d’必然不是节点d的父节点,此时可以将该直接原因转换为:即,d’不是节点d的父节点集合中的一个元素。
直接互相关
两个观测变量之间存在互相关的关系,则意味着两者之间互为直接原因,这样就可以将其转换为相应两个节点之间存在互为父子关系的约束。
例如,如果节点d’与节点d互相关,且存在从节点d’指向节点d的边,即则节点d’是节点d的父节点,d′∈pad。如果节点d’与节点d互相关,且存在从节点d指向节点d’的边,即d’>d,则节点d是节点d’的父节点,d∈pad′。
路径约束
路径约束是指专家知识针对因果关系网络中节点之间的路径施加的约束,其可以涉及间接原因、无间接原因,间接互相关,或相互独立。为了方便说明期间,将首先引入一些表示的说明。
Qd指示节点d之前的节点的集合;
GQd指示图G的子图,其是由图G中的Qd行构成的,其指示节点d的父节点集合Pad;
f(GQd,d’)是用于返回d’的子孙节点d”的集合的函数,d’的子孙节点集合满足下式:
即存在从d’至d”的路径。
接下来,将详细描述间接原因、无间接原因,间接互相关,或相互独立这些类型的路径约束的转换。
间接原因
针对间接原因,可以将两个观测变量之间的间接原因转换为针对位于相应两个节点之间的路径上的任意第三点与所述相应两个节点中的终点之间的父子关系的约束。
例如,如果d’是d的间接原因,即则可以找到位于d’和d之间的路径上的点d”的子集其中且确保
这样,就可以将间接原因转换为对针对位于相应两个节点之间的路径上的任意第三点d”与节点d之间的父子关系的约束。
无间接原因
针对无直接原因,可以将两个观测变量之间的间接原因转换为针对位于相应两个节点之间的路径上的任意第三点与所述相应两个节点中的终点之间不存在父子关系的约束。
例如,如果d’不是d的间接原因,即d’≠>d,则位于d’和d之间的路径上的点d”的不是节点d的父节点,即
这样就可以将无间接原因转换为对针对位于相应两个节点之间的路径上的任意第三点d”与节点d之间不存在父子关系的约束。
间接互相关
关于间接互相关,可以将两个观测变量之间的间接互相关转换为所述两个观测变量之间的间接原因、以及所述两个观测变量之外的第三观测变量与所述两个观测变量中每一个之间均存在间接原因,并按照间接原因对其进行转换。
例如,如果d‘与d互相关,即不失一般性,可以以 来进行说明。在的情况下,存在两种类型间接相关关系:
1)节点d’是节点d的间接原因,
2)存在除d’和d之外的第三点d”其分别是节点d’和节点d的间接原因,即且这样就可以将该间接互相关转换成一系列的间接原因:
进一步,可以基于前述的间接原因进行转换,得到位于d’和d之间的路径上的点d”的子集其中
并确保
相互独立
相互独立是指在两个观测变量之间不存在任何相关性。因此,可以将两个观测变量之间的相互独立性转换为所述两个观测最多变量之间无间接原因、以及所述两个观测变量之外的第三观测变量仅与所述两个观测变量其中一个之间存在间接原因,并按照无间接原因和间接原因对其进行转换。
例如,如果节点d’与节点d独立,即,d′⊥d。不失一般性,可以以来进行说明。在的情况下,可以得到:
(1)d′≠>d
(2)然后,可以将该问题转换为多个无间接原因的问题,从而得到:
充分条件
关于充分条件,可以将两个观测变量之间的充分条件关系转换为所述两个观测变量之间的直接原因,并按照直接原因进行转换。
例如如果节点d’是节点d的充分条件,则d’是d的直接原因,进而将其转换为针对相应两个节点之间的父子关系的约束,d′∈pad,即d’是节点d的父节点集合中的一个元素。
必要条件
关于必要条件,可以将两个观测变量之间的必要条件关系转换为对所述两个相应节点之间的边的指向的约束。例如,如果节点d’是的节点d的必要条件,则可以确定在d’和d之间存在d’指向d的边。
此外,还可以针对基于两个观测变量之间的必要条件关系,在所述因果关系目标式对所述两个观测变量的表示进行调整。例如,可以利用与d’对应的观测变量对d对应的观测变量的表达式进行调整。
例如,原始的评分表达式可以是
则在节点d’是的节点d的必要条件的情况下,可以将评分表达式修改为:
通过这样的调整,就可以例如在评分函数中将必要条件考虑在内。
接着,返回参考图2,在步骤202,利用所述观测变量的观测数据,通过稀疏因果关系推理,在有向无环图的约束和从专家知识转换得到的所需要满足的约束下,对所述因果关系目标式进行最优化求解,以估计所述观测变量之间的因果关系。
稀疏因果关系推理可以采用任何适当的方式来执行,例如可以将其转换为最优因果序列递归求解问题。例如,可以基于A*搜索方法来执行。关于最优因果排序递归问题的求解,在本领域是已知的,此处不再赘述。
在本公开的实施方式中,通过将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束,可以以简单的方式将其并入到因果推理过程中,以充分利用专家知识,从而得到更加精确的因果关系。
图3示意性地示出了根据本公开的一个实施方式的用于定价优化的装置的示意图。如图3所示,该装置300包括专家知识转换模块310和因果推理模块320。该专家知识转换模块310可以被配置为响应于接收到针对多个观测变量其中至少一部分的专家知识,将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束。该因果推理模块320可以被配置利用所述观测变量的观测数据,通过稀疏因果关系推理,在有向无环图的约束和从专家知识转换得到的所需要满足的约束下,对所述因果关系目标式进行最优化求解,以估计所述观测变量之间的因果关系。
所述专家知识可以包括边约束、路径约束、充分条件、必要条件其中任何一个或多个。
在根据本公开的一个实施方式中,所述专家知识转换模块310可以被配置为针对所述边约束,执行以下转换其中至少一个:将两个观测变量之间的直接原因转换为针对相应两个节点之间的父子关系的约束;将两个观测变量之间无直接原因转换为针对相应两个节点之间不存在父子关系的约束;以及将两个观测变量之间的直接互相关转换为在相应两个节点之间存在互为父子关系的约束。
在根据本公开的另一实施方式中,所述专家知识转换模块310可以被配置为针对所述路径约束,执行以下转换其中至少一个:将两个观测变量之间的间接原因转换为针对位于相应两个节点之间的路径上的第三点与所述相应两个节点中的终点之间的父子关系的约束;将两个观测变量之间无间接原因转换为针对位于相应两个节点之间的路径上的任意第三点与所述相应两个节点中的终点之间不存在父子关系的约束;将两个观测变量之间的间接互相关转换为所述两个观测变量之间的间接原因、以及所述两个观测变量之外的任意第三观测变量与所述两个观测变量中每一个之间均存在间接原因,并按照间接原因对其进行转换;以及将两个观测变量之间的相互独立性转换为所述两个观测变量之间无间接原因、以及所述两个观测变量之外的第三观测变量最多仅与所述两个观测变量其中一个之间存在间接原因,并按照无间接原因和间接原因对其进行转换。
在根据本公开的再一实施方式中,所述专家知识转换模块310可以被配置为针对所述充分条件:将两个观测变量之间的充分条件关系转换为所述两个观测变量之间的直接原因,并按照直接原因对其进行转换。
在根据本公开的又一实施方式中,所述专家知识转换模块310被配置为针对所述必要条件,将两个观测变量之间的必要条件关系转换为对所述两个相应节点之间的边的指向的约束。
需要说明的是,关于专家知识转换的详细内容,可以参考前面在方法描述中针对步骤201相关内容的描述。
此外,在根据本公开的再一实施方式中,所述装置300还进一步包括表示调整模块330,其被配置为针对基于两个观测变量之间的必要条件关系,在所述因果关系目标式对所述两个观测变量的表示进行调整。具体操作可以参考前面在方法描述中针对“必要条件”的相关描述。
出于清楚说明的目的,将参考图4来描述根据本公开的实施方式的用于估计观测变量之间的因果关系的装置的一个示例具体实现。
如图4所示,专家知识处理模块410接收专家知识401。如前所述专家知识401可以包括边约束、路径约束、充分条件和必要条件其中任何一个或多个。专家知识处理模块410可以按照上文所述的方法,根据不同专家知识的类型执行相应的处理,以将其转换父节点约束(被包含的父节点403a),不存在父节点的约束(被排除的父节点403b)等。被包含的父节点403a和被排除的父节点403b例如可以基于从边约束、路径约束、充分条件、必要条件等转换得到各种约束得到,例如相应两个节点之间存在父子关系的约束,相应两个节点之间不存在父子关系的约束,第三点与所述相应两个节点中的终点之间存在父子关系的约束,第三点与所述相应两个节点中的终点之间不存在父子关系的约束、以及边指向约束等。此外,针对专家知识中的必要条件401a,还可以如前所述,基于此对稀疏因果关系推理模块中使用的因果关系目标式进行调整,以使其反映该必要条件关系。
稀疏因果推理模块420可以利用观测数据402基于稀疏因果推理算法对因果关系目标式进行求解。稀疏因果推理例如可以采用A*搜索极其各种改进和扩展算法。如图4所示,在每次递归求解的过程中,可以将得到的局部因果关系结构返回给专家知识处理模块,以便使得生成的父节点关系约束403a和403b能够更加有效地用于约束因果关系目标式。例如,对于可以基于局部因果关系结构,确定出位于两个相应节点之间的路径上的第三点,以便使得约束更加具体。需要说明的是,对于部分因果推理方法例如A*搜索,返回局部因果结构关系是有利的,对于有一部分支持复杂约束的因果推理算法,也可以不用返回局部因果结构关系。
在稀疏因果推理模块已经遍历的所有节点后,可以输出所得到的因果关系结构404,作为最终得到的观测变量之间的因果关系。
需要说明的是,图4只是出于具体说明的目的而给出的,本发明并不局限于所示出的各种细节,而是可以根据实际应用做出各种改变。
此外,图5还示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的系统的示意图。下面,将参考图5来描述可以实现本发明的因果关系估计的系统。
图5中所示的计算机系统包括CPU(中央处理单元)501、RAM(随机存取存储器)502、ROM(只读存储器)503、系统总线504、硬盘控制器505、键盘控制器506、串行接口控制器507、并行接口控制器508、显示器控制器509、硬盘510、键盘511、串行外部设备512、并行外部设备513和显示器514。在这些部件中,与系统总线504相连的有CPU 501、RAM 502、ROM 503、硬盘控制器505、键盘控制器506、串行接口控制器507、并行接口控制器508和显示器控制器509。硬盘510与硬盘控制器505相连,键盘511与键盘控制器506相连,串行外部设备512与串行接口控制器507相连,并行外部设备513与并行接口控制器508相连,以及显示器514与显示器控制器509相连。
在存储器中可以存储一个或多个代码,所述代码在被所述计算机执行时,指示所述CPU执行在本公开的实施方式中提出的用于估计观测变量之间的因果关系的方法的步骤,例如参考图2所描述的方法步骤。
需要说明的是,图5所述的结构方框图仅仅为了示例的目的而示出的,并非是对本发明的限制。在一些情况下,可以根据需要添加或者减少其中的一些设备。
还可以理解的是,在本公开提出的方案,可以在制药、制造、市场分析、交通预测、天气预测、空气质量预测等各种应用中使用,以获得有益效果。
此外,本发明的实施方式可以以软件、硬件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。
本领域的普通技术人员可以理解上述的方法和装置可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供这样的代码。
本实施方式的装置及其组件可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
虽然已经参考目前考虑到的实施方式描述了本发明,但应该理解本发明不限于所公开的实施方式。相反,本发明旨在涵盖所附权利要求书的精神和范围内所包括的各种修改和等同布置。所附权利要求书的范围符合最广泛解释,以包含所有这样的修改及等同结构和功能。
Claims (16)
1.一种用于估计观测变量之间的因果关系的方法,包括:
响应于接收到针对多个观测变量其中至少一部分的专家知识,将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束;以及
利用所述观测变量的观测数据,通过稀疏因果关系推理,在有向无环图的约束和从所述专家知识转换得到的所需要满足的约束下,对所述因果关系目标式进行最优化求解,以估计所述观测变量之间的因果关系。
2.根据权利要求1所述的方法,其中所述专家知识包括边约束、路径约束、充分条件、必要条件其中任何一个或多个。
3.根据权利要求2所述的方法,其中针对所述边约束,执行以下转换其中至少一个:
将两个观测变量之间的直接原因转换为针对相应两个节点之间的父子关系的约束;
将两个观测变量之间无直接原因转换为针对相应两个节点之间不存在父子关系的约束;以及
将两个观测变量之间的直接互相关转换为在相应两个节点之间存在互为父子关系的约束。
4.根据权利要求2或3所述的方法,其中针对所述路径约束,执行以下转换其中至少一个:
将两个观测变量之间的间接原因转换为针对位于相应两个节点之间的路径上的任意第三点与所述相应两个节点中的终点之间的父子关系的约束;
将两个观测变量之间无间接原因转换为针对位于相应两个节点之间的路径上的任意第三点与所述相应两个节点中的终点之间不存在父子关系的约束;
将两个观测变量之间的间接互相关转换为所述两个观测变量之间的间接原因、以及所述两个观测变量之外的第三观测变量与所述两个观测变量中每一个之间均存在间接原因,并按照间接原因对其进行转换;以及
将两个观测变量之间的相互独立性转换为所述两个观测变量之间无间接原因、以及所述两个观测变量之外的第三观测变量最多仅与所述两个观测变量其中一个之间存在间接原因,并按照无间接原因和间接原因对其进行转换。
5.根据权利要求2或3所述的方法,其中针对所述充分条件:将两个观测变量之间的充分条件关系转换为所述两个观测变量之间的直接原因,并按照直接原因进行转换。
6.根据权利要求2或3所述的方法,其中针对所述必要条件,将两个观测变量之间的必要条件关系转换为对所述两个相应节点之间的边的指向的约束。
7.根据权利要求2或3所述的方法,还进一步包括:基于两个观测变量之间的必要条件关系,在所述因果关系目标式对相应观测变量的表示进行调整。
8.一种用于估计观测变量之间的因果关系的装置,包括:
专家知识转换模块,被配置为响应于接收到针对多个观测变量其中至少一部分的专家知识,将所述专家知识转换为所述多个观测变量的因果关系目标式所需要满足的约束;以及
因果推理模块,被配置为利用所述观测变量的观测数据,通过稀疏因果关系推理,在有向无环图的约束和从所述专家知识转换得到的所需要满足的约束下,对所述因果关系目标式进行最优化求解,以估计所述观测变量之间的因果关系。
9.根据权利要求8所述的装置,其中所述专家知识包括边约束、路径约束、充分条件、必要条件其中任何一个或多个。
10.根据权利要求9所述的装置,其中所述专家知识转换模块被配置为针对所述边约束,执行以下转换其中至少一个:
将两个观测变量之间的直接原因转换为针对相应两个节点之间的父子关系的约束;
将两个观测变量之间无直接原因转换为针对相应两个节点之间不存在父子关系的约束;以及
将两个观测变量之间的直接互相关转换为在相应两个节点之间存在互为父子关系的约束。
11.根据权利要求9或10所述的装置,其中所述专家知识转换模块被配置为针对所述路径约束,执行以下转换其中至少一个:
将两个观测变量之间的间接原因转换为针对位于相应两个节点之间的路径上的任意第三点与所述相应两个节点中的终点之间的父子关系的约束;
将两个观测变量之间无间接原因转换为针对位于相应两个节点之间的路径上的任意第三点与所述相应两个节点中的终点之间不存在父子关系的约束;
将两个观测变量之间的间接互相关转换为所述两个观测变量之间的间接原因、以及所述两个观测变量之外的第三观测变量与所述两个观测变量中每一个之间均存在间接原因,并按照间接原因对其进行转换;以及
将两个观测变量之间的相互独立性转换为所述两个观测变量之间无间接原因、以及所述两个观测变量之外的第三观测变量最多仅与所述两个观测变量其中一个之间存在间接原因,并按照无间接原因和间接原因对其进行转换。
12.根据权利要求9或10所述的装置,其中所述专家知识转换模块被配置为针对所述充分条件:将两个观测变量之间的充分条件关系转换为所述两个观测变量之间的直接原因,并按照直接原因对其进行转换。
13.根据权利要求9或10所述的装置,其中所述专家知识转换模块被配置为针对所述必要条件,将两个观测变量之间的必要条件关系转换为对所述两个相应节点之间的边的指向的约束。
14.根据权利要求9或10所述的装置,还进一步包括表示调整模块,其被配置为基于两个观测变量之间的必要条件关系,在所述因果关系目标式对相应观测变量的表示进行调整。
15.一种用于估计观测变量之间的因果关系的系统,包括:
处理器;以及
存储器,其中存储有计算机程序代码,所述计算机程序代码在被所述处理器执行时,使得所述处理器执行根据权利要求1至7其中任一项所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序代码,所述计算机程序代码在被处理器执行时,执行根据权利要求1至7其中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710919294.1A CN110019973A (zh) | 2017-09-30 | 2017-09-30 | 用于估计观测变量之间的因果关系的方法、装置和系统 |
US16/141,174 US20190102688A1 (en) | 2017-09-30 | 2018-09-25 | Method, device and system for estimating causality among observed variables |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710919294.1A CN110019973A (zh) | 2017-09-30 | 2017-09-30 | 用于估计观测变量之间的因果关系的方法、装置和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110019973A true CN110019973A (zh) | 2019-07-16 |
Family
ID=65896770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710919294.1A Pending CN110019973A (zh) | 2017-09-30 | 2017-09-30 | 用于估计观测变量之间的因果关系的方法、装置和系统 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20190102688A1 (zh) |
CN (1) | CN110019973A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597307A (zh) * | 2020-05-18 | 2020-08-28 | 山西大学 | 一种基于可解释因果模型的司法判决推理方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11232175B2 (en) * | 2019-03-28 | 2022-01-25 | Nec Corporation | Method, system, and computer program product for determining causality |
CN113761073A (zh) * | 2020-06-03 | 2021-12-07 | 日本电气株式会社 | 用于信息处理的方法、装置、设备和存储介质 |
WO2022104616A1 (en) * | 2020-11-18 | 2022-05-27 | Alibaba Group Holding Limited | Non-linear causal modeling based on encoded knowledge |
JPWO2022130547A1 (zh) * | 2020-12-16 | 2022-06-23 | ||
CN113806452B (zh) * | 2021-09-17 | 2022-10-25 | 北京百度网讯科技有限公司 | 信息处理方法、装置、电子设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030220906A1 (en) * | 2002-05-16 | 2003-11-27 | Chickering David Maxwell | System and method of employing efficient operators for bayesian network search |
CN1514209A (zh) * | 2003-08-01 | 2004-07-21 | 重庆大学 | 旋转机械故障智能诊断方法与装置 |
CN102194145A (zh) * | 2011-06-15 | 2011-09-21 | 天津大学 | 一种自主融合先验知识的贝叶斯网络方法 |
CN102859528A (zh) * | 2010-05-19 | 2013-01-02 | 加利福尼亚大学董事会 | 使用生物网络识别药物靶点的系统和方法 |
CN103473400A (zh) * | 2013-08-27 | 2013-12-25 | 北京航空航天大学 | 基于层次依赖建模的软件fmea方法 |
CN104600695A (zh) * | 2014-12-29 | 2015-05-06 | 国家电网公司 | 基于在线状态估计和实时调度计划的趋势潮流计算方法 |
CN106294323A (zh) * | 2016-08-10 | 2017-01-04 | 上海交通大学 | 对短文本进行常识性因果推理的方法 |
US20170083812A1 (en) * | 2010-06-25 | 2017-03-23 | Clayton Gillespie | Solving np-complete problems without hyper polynomial cost |
CN107016260A (zh) * | 2017-03-30 | 2017-08-04 | 广东工业大学 | 一种基于跨平台基因表达数据的基因调控网络重建方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7117185B1 (en) * | 2002-05-15 | 2006-10-03 | Vanderbilt University | Method, system, and apparatus for casual discovery and variable selection for classification |
US20070018953A1 (en) * | 2004-03-03 | 2007-01-25 | The Boeing Company | System, method, and computer program product for anticipatory hypothesis-driven text retrieval and argumentation tools for strategic decision support |
US10458969B2 (en) * | 2016-03-22 | 2019-10-29 | International Business Machines Corporation | Dynamic water quality prediction |
-
2017
- 2017-09-30 CN CN201710919294.1A patent/CN110019973A/zh active Pending
-
2018
- 2018-09-25 US US16/141,174 patent/US20190102688A1/en active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030220906A1 (en) * | 2002-05-16 | 2003-11-27 | Chickering David Maxwell | System and method of employing efficient operators for bayesian network search |
CN1514209A (zh) * | 2003-08-01 | 2004-07-21 | 重庆大学 | 旋转机械故障智能诊断方法与装置 |
CN102859528A (zh) * | 2010-05-19 | 2013-01-02 | 加利福尼亚大学董事会 | 使用生物网络识别药物靶点的系统和方法 |
US20130151452A1 (en) * | 2010-05-19 | 2013-06-13 | The Regents Of The University Of California | Systems and Methods for Identifying Drug Targets Using Biological Networks |
US20170083812A1 (en) * | 2010-06-25 | 2017-03-23 | Clayton Gillespie | Solving np-complete problems without hyper polynomial cost |
CN102194145A (zh) * | 2011-06-15 | 2011-09-21 | 天津大学 | 一种自主融合先验知识的贝叶斯网络方法 |
CN103473400A (zh) * | 2013-08-27 | 2013-12-25 | 北京航空航天大学 | 基于层次依赖建模的软件fmea方法 |
CN104600695A (zh) * | 2014-12-29 | 2015-05-06 | 国家电网公司 | 基于在线状态估计和实时调度计划的趋势潮流计算方法 |
CN106294323A (zh) * | 2016-08-10 | 2017-01-04 | 上海交通大学 | 对短文本进行常识性因果推理的方法 |
CN107016260A (zh) * | 2017-03-30 | 2017-08-04 | 广东工业大学 | 一种基于跨平台基因表达数据的基因调控网络重建方法 |
Non-Patent Citations (5)
Title |
---|
KUI YU; JIUYONG LI; LIN LIU;: "A Review on Algorithms for Constraint-based Causal Discovery", ARXIV, pages 1 - 17 * |
崔阳;刘长红;: "基于约束网络的因果关联规则挖掘研究", 计算机科学, no. 2, pages 466 - 468 * |
张振海;王晓明;党建武;闵永智;: "基于专家知识融合的贝叶斯网络结构学习方法", 计算机工程与应用, no. 02, pages 1 - 4 * |
杜元伟;石方园;杨娜;: "融合专家相对推断的贝叶斯网络构建方法", 计算机工程与应用, no. 22, pages 105 - 112 * |
邸若海,高晓光,郭志高: "基于改进BIC评分的贝叶斯网络结构学习", 系统工程与电子技术, 28 February 2017 (2017-02-28), pages 437 - 444 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597307A (zh) * | 2020-05-18 | 2020-08-28 | 山西大学 | 一种基于可解释因果模型的司法判决推理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20190102688A1 (en) | 2019-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110019973A (zh) | 用于估计观测变量之间的因果关系的方法、装置和系统 | |
US10009363B2 (en) | Selecting representative metrics datasets for efficient detection of anomalous data | |
Shih et al. | Compiling bayesian network classifiers into decision graphs | |
JP6969637B2 (ja) | 因果関係分析方法および電子デバイス | |
US7720773B2 (en) | Partitioning data elements of a visual display of a tree using weights obtained during the training state and a maximum a posteriori solution for optimum labeling and probability | |
Liu et al. | Multilayer graph contrastive clustering network | |
US20110208730A1 (en) | Context-aware searching | |
US20160224544A1 (en) | Sparse and data-parallel inference method and system for the latent dirichlet allocation model | |
CN109598346A (zh) | 用于估计观测变量之间的因果关系的方法、装置和系统 | |
US20160342677A1 (en) | System and Method for Agglomerative Clustering | |
CN110555047A (zh) | 数据处理方法和电子设备 | |
CN110929046B (zh) | 一种基于异质网络嵌入的知识实体推荐方法及系统 | |
Kaur et al. | An empirical study of software entropy based bug prediction using machine learning | |
Jabbari et al. | Discovery of causal models that contain latent variables through Bayesian scoring of independence constraints | |
GB2544853A (en) | Structured knowledge modeling and extraction from images | |
CN116257406A (zh) | 用于智慧城市的网关数据管理方法及其系统 | |
Dong et al. | Knowledge curation and knowledge fusion: challenges, models and applications | |
CN112417169A (zh) | 知识图谱的实体对齐方法、装置、计算机设备和存储介质 | |
CN109919172A (zh) | 一种多源异构数据的聚类方法及装置 | |
CN110717116B (zh) | 关系网络的链接预测方法及系统、设备、存储介质 | |
CN116579618A (zh) | 基于风险管理的数据处理方法、装置、设备及存储介质 | |
Zhu et al. | A Bayesian robust CP decomposition approach for missing traffic data imputation | |
Liao et al. | Probabilistic wind power forecasting for newly-built wind farms based on multi-task Gaussian process method | |
Bohra et al. | Group level social media popularity prediction by MRGB and Adam optimization | |
Jin et al. | Graph neural networks for detecting anomalies in scientific workflows |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |