CN106682737A

CN106682737A - 一种将马尔可夫网络等价转换为因子图的方法及系统

Info

Publication number: CN106682737A
Application number: CN201611178576.2A
Authority: CN
Inventors: 许卓明; 王秀丽; 毛承旺
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2016-12-19
Filing date: 2016-12-19
Publication date: 2017-05-17

Abstract

提供一种将马尔可夫网络等价转换为因子图的方法及系统，该方法包括下列步骤：输入待转换为因子图的马尔可夫网络；依次按转换规则1、2和3将马尔可夫网络等价转换为因子图；输出转换成的因子图。其中，转换规则1为：创建因子图的所有变量节点，它们分别对应于马尔可夫网络的所有随机变量节点；转换规则2为：创建因子图的所有因子节点即局部函数，它们分别对应于马尔可夫网络中表示的所有最大团势函数；转换规则3为：当且仅当因子图中某个变量是一个局部函数的自变量时，添加连接该变量节点与该局部函数即因子节点的无向边。本发明克服目前缺乏马尔可夫网络向因子图等价转换的完整、可实施技术方案的缺陷，方法及系统简单易行，应用前景广阔。

Description

一种将马尔可夫网络等价转换为因子图的方法及系统

技术领域

本发明属于概率图模型技术领域，涉及概率图模型之间的转换技术，尤其是一种将马尔可夫网络等价转换为因子图的方法及系统。

背景技术

概率(probability)在机器学习、模式识别、数据挖掘、大数据分析等智能分析推理技术领域起着核心作用。传统的概率论(probability theory)可以用和规则(the sumrule)、积规则(the product rule)方程式来表示，所有概率推理和学习的代数操作(algebraic manipulations)都等同于反复应用这两个简单方程式。然而，借助概率图模型(probabilistic graphical model)，可将概率模型的底层代数表示(algebraicrepresentations)等价变换成为直观的图形表示(graphical representations)，这样，概率推理和学习的复杂代数操作就可借助更为直观、方便的图操纵(graphicalmanipulations)来实现。

关于概率图模型技术，可参阅全球最权威的学术专著：Daphne Koller and NirFriedman.Probabilistic Graphical Models:Principles and Techniques.The MITPress,2009.ISBN 978-0-262-01319-2(下文简称为《Probabilistic Graphical Models:Principles and Techniques》)，该专著的中译版为：作者:[美]Daphne Koller,[以色列]Nir Friedman；译者:王飞跃,韩素青.概率图模型：原理与技术.清华大学出版社,2015.ISBN:978-7-302-37134-2(下文简称为《概率图模型：原理与技术》)。

概率图模型是概率论(probability theory)与图论(graph theory)相结合的产物，通过图模型来表示概率分布(probability distributions)，尤其是表示随机变量之间的条件依赖(conditional dependence)关系与结构。一个概率图模型通过连接线(links)——也称边(edges)或弧(arcs)，来连接一对节点(nodes)——也称顶点(vertices)；每个节点表示一个随机变量(random variables)(或随机变量组)，通过连接线来表示随机变量之间的概率关系。于是，概率图模型表示了代数上的一种因子分解(factorization)关系，即：定义在一个随机变量集上的联合分布可被分解成各自仅依赖于一个变量子集的函数(即因子)的乘积。

常用的概率图模型包括有向图模型(directed graphical models)和无向图模型(undirected graphical models)。

有向图模型常称为贝叶斯网络(Bayesian network)(参见：《ProbabilisticGraphical Models:Principles and Techniques》,Section 3.2 Bayesian Networks,pages 51–68中的Definition 3.5,page 62；或者：《概率图模型：原理与技术》,3.2贝叶斯网,pages 51–68,定义3.5,page 61)，适用于表示随机变量之间的因果关系(causalrelationships)。

无向图模型常称为马尔可夫随机场(Markov random field,MRF)或马尔可夫网络(Markov network)(参见：《Probabilistic Graphical Models:Principles andTechniques》,Section 4.2.2Gibbs Distributions and Markov Networks,pages 108–110中的Definition 4.3,page 108和Definition 4.4,page 109；或者：《概率图模型：原理与技术》,4.2.2吉布斯分布与马尔可夫网,pages 107–109中的定义4.3,page 107和定义4.4,page 108)，适用于表示随机变量之间的软约束(soft constraints)。马尔可夫网络是一个无向图，其中，每个节点表示一个随机变量，每条无向边连接一对随机变量节点，图中表示了若干个称为最大团(maximal clique)的最大完全子图(maximal completesubgraph)，所谓最大完全子图就是该子图中的所有节点对均通过一条无向边进行连接，且该子图中再增加图中任何节点将不具有这种性质，在每个最大团中所有节点所对应的若干个随机变量上定义了一个称为最大团势(maximal clique potential)的函数，且这些最大团势函数均是非负函数，于是，马尔可夫网络在代数上表示了这样一种因子分解(factorization)关系：定义在所有随机变量上的联合分布可表示为所有最大团势函数(即因子)的乘积再乘以一个归一化因子(normalization factor)，该归一化因子是一个归一化系数(normalization coefficient)，可看成是一个定义在随机变量空集上的常值函数(constant function)，它是称为配分函数(partition function)的归一化常数(normalization constant)的倒数。

因子图(factor graph)是一种新颖的无向图模型(参见：《ProbabilisticGraphical Models:Principles and Techniques》,Section 4.4.1.1 Factor Graphs,pages 123–124,Definition 4.13,page 123；或者：《概率图模型：原理与技术》,4.4.1.1因子图,pages 121–122,定义4.13,page122)。因子图是由变量节点与因子(factor)节点所构成的一个二分图(bipartite graph)，因子或因子节点也称为局部函数(local function)，在因子图中，每个变量节点表示变量集中的一个变量，每个因子节点表示定义在变量子集上的一个局部函数，当且仅当某个变量是一个局部函数的自变量(argument)时，该变量节点与该因子节点之间有一条无向边，于是，定义在变量集上的一个全局函数(globalfunction)可表示为所有定义在变量子集上的局部函数(即因子)的乘积；当全局函数用于表示一组随机变量的联合分布时，因子图成为一种新颖的概率图模型。因子图模型的突出优势在于概率推理的代数操作可借助因子图上的高效率的推理算法来实现。

概率图模型之间的相互转换技术有利于复用已有的概率模型，简化概率建模过程，从而促进概率图模型在机器学习、模式识别、数据挖掘、大数据分析等智能分析推理技术领域中的应用。贝叶斯网络、马尔可夫网络等传统概率图模型之间的相互转换已存在相应的方法，例如，从贝叶斯网络到马尔可夫网络的转换方法(参见：《ProbabilisticGraphical Models:Principles and Techniques》,Section 4.5.1 From BayesianNetworks to Markov Networks,pages 134–137；或者：《概率图模型：原理与技术》,4.5.1从贝叶斯网到马尔可夫网,pages 132–136)，从马尔可夫网络到贝叶斯网络的转换方法(参见：《Probabilistic Graphical Models:Principles and Techniques》,Section 4.5.2From Markov Networks to Bayesian Networks,pages 137–139；或者：《概率图模型：原理与技术》,4.5.2从马尔可夫网到贝叶斯网,pages 136–138)。然而，传统概率图模型向因子图这样的新颖概率图模型的等价转换，目前尚缺乏相应的方法，也缺乏完整、可实施的技术方案。本发明的目的就是提供一种将马尔可夫网络等价转换为因子图的方法及系统。所谓“等价转换”就是，虽然转换前后的两种概率图模型在图形表示上完全不同，但它们在代数上所表示的联合分布的因子分解关系是完全等价的。

发明内容

本发明所要解决的技术问题是提供一种将马尔可夫网络等价转换为因子图的方法及系统，从而克服目前缺乏马尔可夫网络向因子图等价转换的完整、可实施技术方案的缺陷。

为解决上述技术问题，本发明是通过以下技术方案实现的：

根据本发明的一个方面，提供了一种将马尔可夫网络等价转换为因子图的方法，包括下列步骤：

S1：输入待转换为因子图的马尔可夫网络；

S2：依次按转换规则1、2和3将马尔可夫网络等价转换为因子图：

转换规则1：创建因子图的所有变量节点，它们分别对应于马尔可夫网络的所有随机变量节点；

转换规则2：创建因子图的所有因子节点即局部函数，它们分别对应于马尔可夫网络中表示的所有最大团势函数；

转换规则3：当且仅当因子图中某个变量是一个局部函数的自变量时，添加连接该变量节点与该局部函数即因子节点的无向边；

S3：输出转换成的因子图。

在该方法中，所述步骤S1中的马尔可夫网络进一步包括：

马尔可夫网络的图形表示如下：作为一种概率图模型，马尔可夫网络是一个无向图，其中，每个节点对应一个随机变量，每条无向边连接一对随机变量节点，图中表示了若干个称为最大团的最大完全子图，在每个最大团中所有节点所对应的若干个随机变量上定义了一个称为最大团势的函数，且这些最大团势函数均是非负函数，于是，马尔可夫网络在代数上表示了这样一种因子分解关系：定义在所有随机变量上的联合分布可表示为所有最大团势函数的乘积再乘以一个归一化因子，该归一化因子是一个归一化系数，可看成是一个定义在随机变量空集上的常值函数，它是称为配分函数的归一化常数的倒数；

马尔可夫网络的代数表示如下：马尔可夫网络MN(X,L)表示为一个联合分布的因子分解关系其中，p(X)是定义在随机变量集X＝{x₁,...,x_K}上的联合分布，Z^-1是该因子分解中的归一化因子，配分函数是一个归一化常数，每个因子是定义在最大团C_n中所有节点所对应的随机变量子集上的一个最大团势函数，每个最大团是一个最大完全子图，其中所有节点对均通过一条无向边进行连接，所有这样的无向边构成马尔可夫网络MN(X,L)的无向边集L。

在该方法中，所述步骤S1中的因子图进一步包括：

因子图的图形表示如下：因子图是由变量节点与因子节点所构成的一个二分图，其中，每个变量节点表示变量集中的一个变量，每个因子节点表示定义在变量子集上的一个局部函数，当且仅当某个变量是一个局部函数的自变量时，该变量节点与该因子节点之间有一条无向边，于是，定义在变量集上的一个全局函数可表示为所有定义在变量子集上的局部函数的乘积；当全局函数用于表示一组随机变量的联合分布时，因子图成为一种新颖的概率图模型；

因子图的代数表示如下：因子图FG(X,F,E)表示为一个全局函数的因子分解关系其中，h(X)是定义在变量集X＝{x₁,...,x_K}上的全局函数，每个局部函数f_j(X_j),j∈{1,...,J}称为定义在变量子集上的一个因子，所有这样的局部函数构成因子图FG(X,F,E)的局部函数集F＝{f₁,...,f_J}，同时，因子图FG(X,F,E)的无向边集E＝{(x_j,f_j)|iif x_j∈X_j}；当全局函数h(X)用于表示定义在随机变量集X上的联合分布时，因子图FG(X,F,E)成为一个概率图模型。

在该方法中，所述步骤S2中的转换规则1、2和3进一步包括：

转换规则1的代数表示如下：将马尔可夫网络MN(X,L)中全部K个随机变量x_k∈X,k∈{1,...,K}对应地转换为因子图FG(X,F,E)中的K个变量

转换规则2的代数表示如下：将马尔可夫网络MN(X,L)中全部N个最大团势函数对应地转换为因子图FG(X,F,E)中J＝N个局部函数f_j∈F,j∈{1,...,J}；

转换规则3的代数表示如下：令因子图FG(X,F,E)中全部J＝N个局部函数f_j∈F，j∈{1,...,J}分别表示马尔可夫网络MN(X,L)中N个最大团势函数，即这些因子图局部函数它们表示了因子图的无向边集E＝{(x_j,f_j)|iif x_j∈X_j}；令该因子图的全局函数h(X)表示定义在随机变量集X上的联合分布再乘以该马尔可夫网络中的归一化常数Z，即：h(X)＝p(X)×Z；于是，该因子图所表示的因子分解关系即为它等价于J＝N，该因子分解关系与马尔可夫网络MN(X,L)所表示的因子分解关系完全等价。

根据本发明的另一个方面，还提供了一种将马尔可夫网络等价转换为因子图的系统，包括：马尔可夫网络输入模块、马尔可夫网络向因子图等价转换模块、因子图输出模块、人机交互界面，其中：

所述马尔可夫网络输入模块用于实现输入待转换为因子图的马尔可夫网络；

所述马尔可夫网络向因子图等价转换模块进一步包括三个子模块：因子图的变量节点创建子模块、因子图的因子节点创建子模块和因子图的无向边添加子模块，它们依次分别按转换规则1、2和3实现将马尔可夫网络等价转换为因子图；

上述转换规则1、2和3具体为：

所述因子图输出模块用于实现输出转换成的因子图；

所述人机交互界面用于实现用户与该系统之间的人机交互，包括：用户通过此界面输入并图示一个马尔可夫网络，用户通过此界面提交马尔可夫网络向因子图等价转换的执行指令，用户通过此界面输出并图示一个转换成的因子图。

本发明的有益技术效果主要包括三个方面：(1)克服了目前缺乏马尔可夫网络向因子图等价转换的完整、可实施技术方案的缺陷；(2)所提供的转换方法简单易行、转换系统易于实现；(3)所提供的转换方法及系统在概率建模与推理、机器学习、模式识别、数据挖掘、大数据分析等领域具有广阔的应用前景。

下面结合附图对本发明的具体实施方式作进一步的描述。本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1是根据本发明技术方案的一种将马尔可夫网络等价转换为因子图的方法的步骤流程图；

图2是根据本发明技术方案的一种将马尔可夫网络等价转换为因子图的系统的模块结构与处理流程图，图中符号遵循国家标准GB 1526-89(等同于国际标准ISO 5807-1985)；

图3是本发明的一个优选实施例中马尔可夫网络向因子图等价转换的过程与规则的示意。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的概念、对象、要素等或具有相同或类似功能的概念、对象、要素等。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域及相关领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为了解决上述技术问题，本发明是通过以下技术方案实现的：

根据本发明的一个方面，提供了一种将马尔可夫网络等价转换为因子图的方法，如图1所示，包括下列步骤：

S1：输入待转换为因子图的马尔可夫网络，所述马尔可夫网络进一步包括：

上述因子图进一步包括：

S3：输出转换成的因子图FG(X,F,E)。

以本发明的上述方法为基础，可以进一步构建一种将马尔可夫网络等价转换为因子图的系统100，如图2所示，包括：马尔可夫网络输入模块101、马尔可夫网络向因子图等价转换模块102、因子图输出模块103、人机交互界面104，其中：

所述马尔可夫网络输入模块101用于实现本发明方法中的步骤S1：输入待转换为因子图的马尔可夫网络；

所述马尔可夫网络向因子图等价转换模块102用于实现本发明方法中的步骤S2：依次按转换规则1、2和3将马尔可夫网络等价转换为因子图；该模块进一步包括三个子模块：因子图的变量节点创建子模块1021、因子图的因子节点创建子模块1022和因子图的无向边添加子模块1023，它们依次分别按转换规则1、2和3实现将马尔可夫网络等价转换为因子图：

所述因子图输出模块103用于实现本发明方法中的步骤S3：输出转换成的因子图；

所述人机交互界面104用于实现用户与该系统之间的人机交互，包括：用户通过此界面输入并图示一个马尔可夫网络，用户通过此界面提交马尔可夫网络向因子图等价转换的执行指令，用户通过此界面输出并图示一个转换成的因子图。

上述将马尔可夫网络等价转换为因子图的系统100可采用的实现技术包括：

马尔可夫网络输入模块101可采用常规的程序设计语言(如：C++、Java、Python、R等)通过编程及函数调用来实现，输入的马尔可夫网络以数据文件的形式进行存储，数据存储格式可采用一般的无向图(undirected graph,UG)的数据存储格式(如：文本文件、CSV文件、XML文档等)；作为一个可选项，输入的马尔可夫网络可进一步以无向图(UG)的形式在人机交互界面104进行图示。

马尔可夫网络向因子图等价转换模块102可采用常规的程序设计语言(如：C++、Java、Python、R等)通过编程实现；转换过程中，需读取已存储的马尔可夫网络数据文件，产生的因子图中间结果和最终结果以数据文件的形式进行存储，数据存储格式可采用一般的二分图(bipartite graph,BG)的数据存储格式(如：文本文件、CSV文件、XML文档等)。

因子图输出模块103可采用常规的程序设计语言(如：C++、Java、Python、R等)通过编程及函数调用来实现，通过读取已存储的因子图(最终结果)数据文件，以二分图(BG)的形式在人机交互界面104进行图示。

人机交互界面104可使用常规的人机交互界面实现技术，其中，基于已存储的图数据，输入的马尔可夫网络可采用一般的无向图(UG)可视化技术在界面上进行显示，转换所得的因子图可采用一般的二分图(BG)可视化技术在界面上进行图示，两者的图示也可以通过调用开源的图模型工具包中的有关函数来实现，如工具包GMTK—The Graphical ModelsToolkit(http://melodi.ee.washington.edu/gmtk/)。

下面再通过一个优选实施例来进一步描述本发明技术方案的具体实施方式，并进一步具体表明本发明的前述有益技术效果。本优选实施例中马尔可夫网络向因子图等价转换的过程与规则如图3所示。

本发明的一种将马尔可夫网络等价转换为因子图的方法，如图3所示，包括下列步骤：

S1：输入待转换为因子图的马尔可夫网络；不失一般性，设输入的马尔可夫网络MN如图3(A)所示，本实施例的具体情况如下：

马尔可夫网络MN的图形表示如图3(A)所示：该马尔可夫网络是一个含有7个随机变量节点的无向图，定义在所有随机变量上的联合分布可表示为所有最大团势函数的乘积再乘以一个归一化因子Z^-1。

马尔可夫网络MN的代数表示如图3(A)的右侧所示：定义在随机变量集X＝{x₁,...,x₇}上的联合分布p(X)＝p(x₁,...,x₇)，定义在全部3个最大团C₁,C₂,C₃所对应的随机变量子集上的最大团势函数分别是于是，该马尔可夫网络所表示的联合分布的因子分解关系具体为：

转换规则1的代数表示如下：将马尔可夫网络MN(X,L)中全部K个随机变量x_k∈X,k∈{1,...,K}对应地转换为因子图FG(X,F,E)中的K个变量如图3(A)到图3(B-1)之间的“第一步转换”所示，本实施例的具体情况如下：

创建的因子图变量为：x₁,...,x₇分别对应于马尔可夫网络MN的随机变量x₁,...,x₇。

转换规则2的代数表示如下：将马尔可夫网络MN(X,L)中全部N个最大团势函数对应地转换为因子图FG(X,F,E)中J＝N个局部函数f_j∈F,j∈{1,...,J}；如图3(B-1)到图3(B-2)之间的“第二步转换”所示，本实施例的具体情况如下：

创建的因子图的所有因子节点即局部函数具体为：f₁,f₂,f₃分别对应于马尔可夫网络MN所表示的上述最大团势函数：

转换规则3的代数表示如下：令因子图FG(X,F,E)中全部J＝N个局部函数f_j∈F，j∈{1,...,J}分别表示马尔可夫网络MN(X,L)中N个最大团势函数，即这些因子图局部函数它们表示了因子图的无向边集E＝{(x_j,f_j)|iif x_j∈X_j}；令该因子图的全局函数h(X)表示定义在随机变量集X上的联合分布再乘以该马尔可夫网络中的归一化常数Z，即：h(X)＝p(X)×Z；于是，该因子图所表示的因子分解关系即为它等价于J＝N，该因子分解关系与马尔可夫网络MN(X,L)所表示的因子分解关系完全等价；如图3(B-2)到图3(B-3)之间的“第三步转换”所示，本实施例的具体情况如下：

令因子图FG中全部3个局部函数f₁,f₂,f₃分别表示马尔可夫网络MN中最大团势函数：

这些局部函数对应表示了因子图FG的无向边集：

E＝{(x₁,f₁),(x₂,f₁),(x₂,f₂),(x₃,f₂),(x₄,f₂),(x₄,f₃),(x₅,f₃),(x₆,f₃),(x₇,f₃)}。

令因子图FG的全局函数h(X)表示定义在随机变量集X＝{x₁,...,x₇}上的联合分布再乘以马尔可夫网络MN中归一化常数Z，即h(X)＝p(X)×Z。于是，因子图FG所表示的全局函数的因子分解关系具体为：

它等价于：

以上因子分解与马尔可夫网络BN所表示的联合分布的因子分解关系完全等价，表明已将马尔可夫网络等价转换为因子图。

S3：输出转换成的因子图，本实施例的具体情况如下：

输出转换成的因子图FG，见图3(B-3)，该因子图由马尔可夫网络BN等价转换而得。

由本发明上述技术方案(包括方法及系统)及其具体实施方式(包括优选实施例)可理解出各处理步骤的技术效果和所解决的技术问题如下：

步骤S1所取得的技术效果是：输入了待转换为因子图的马尔可夫网络，该马尔可夫网络的图形表示及对应的代数表示可进行数据存储；从而解决了技术问题：如何输入待转换为因子图的马尔可夫网络。这样，为本发明总体技术问题的解决创造了不可或缺的必要条件。

步骤S2所取得的技术效果是：基于马尔可夫网络数据存储，将马尔可夫网络的图形表示及对应的代数表示等价转换为因子图的图形表示及对应的代数表示，并可进行数据存储；从而解决了技术问题：如何将马尔可夫网络等价转换为因子图。这样，为本发明总体技术问题的解决创造了不可或缺的必要条件。

步骤S3所取得的技术效果是：基于转换所得的因子图数据存储，输出等价转换成的因子图；从而解决了技术问题：如何输出转换成的因子图。这样，为本发明总体技术问题的解决创造了不可或缺的必要条件。

总体来说，由本发明上述技术方案及其具体实施方式可以理解的是，本发明的有益技术效果主要包括三个方面：(1)克服了目前缺乏马尔可夫网络向因子图等价转换的完整、可实施技术方案的缺陷；(2)所提供的转换方法简单易行、转换系统易于实现；(3)所提供的转换方法及系统在概率建模与推理、机器学习、模式识别、数据挖掘、大数据分析等领域具有广阔的应用前景。

以上所述仅是本发明的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种将马尔可夫网络等价转换为因子图的方法，包括下列步骤：

S1：输入待转换为因子图的马尔可夫网络；

S3：输出转换成的因子图。

2.根据权利要求1所述的方法，其特征在于，所述步骤S1中的马尔可夫网络进一步包括：

3.根据权利要求1所述的方法，其特征在于，所述步骤S1中的因子图进一步包括：

4.根据权利要求1至3任一项所述的方法，其特征在于，所述步骤S2中的转换规则1、2和3进一步包括：

5.一种将马尔可夫网络等价转换为因子图的系统，包括：马尔可夫网络输入模块、马尔可夫网络向因子图等价转换模块、因子图输出模块、人机交互界面，其中：

上述转换规则1、2和3具体为：

所述因子图输出模块用于实现输出转换成的因子图；