CN103365829A

CN103365829A - 信息处理装置、信息处理方法和程序

Info

Publication number: CN103365829A
Application number: CN2013100925027A
Authority: CN
Inventors: 矶崎隆司
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-03-28
Filing date: 2013-03-21
Publication date: 2013-10-23
Also published as: JP2013206016A; JP5854274B2; US9311729B2; US20130257873A1

Abstract

本发明公开了一种信息处理装置、信息处理方法和程序。测试多个变量之间的独立性的信息处理装置包括执行部分和确定部分。执行部分在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在两个变量之间的路径上的情况下，执行两个变量之间的条件独立性的测试。确定部分确定V形结构是否存在于两个变量之间的路径上，V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构。在条件变量仅设置在被确定为具有V形结构的路径上的情况下，执行部分不执行两个变量之间的条件独立性的测试。

Description

信息处理装置、信息处理方法和程序

技术领域

本技术涉及信息处理装置、信息处理方法和程序，尤其涉及一种能够增强多个变量之间的估计因果关系的可靠性的信息处理装置、信息处理方法和程序。

背景技术

根据现有技术的根据关于多元随机变量的观察数据来估计统计因果关系大致分为如下方法：通过信息标准、具有惩罚的最大似然法、或贝叶斯法将估计结果获得为分数并且使分数最大化的方法，以及通过变量之间的条件独立性的统计测试来估计变量之间的因果关系的方法。为了良好的结果可读性，作为结果的变量之间的因果关系常被表示为图形模型（非循环模型）。

图1示出表示变量X和变量Y之间的因果关系的图形模型的三个示例。

在图1的上部示出的图形模型中，变量X和变量Y之间的因果关系未经确认，并且变量X和变量Y用作由非定向边（无向边）链接的顶点。在图1的中部示出的图形模型中，变量X和变量Y之间的因果关系是变量X对应于因并且变量Y对应于果，以及变量X和变量Y用作由指示从因到果的方向的定向边（有向边）链接的顶点。在图1的下部示出的图形模型中，变量X和变量Y用作由三个变量和用于链接变量的边链接的顶点。在图1的下部示出的图形模型中，三个变量和用于链接变量的边形成变量X和变量Y之间的路径，并且该路径可部分地包括有向边。

通过变量之间的条件独立性的统计测试来估计变量之间的因果关系的方法已变得重要，因为该方法可能会估计潜在公共因变量的存在并且有向边的方向的理由基于物理背景。然而，另一方面，由于统计测试的检测能力不足，所以估计结果的可靠性低。

在该方法的初始尝试中，为了执行n元随机变量中的两个变量之间的条件独立性的测试，考虑从（n-2）个变量中提取所有变量组合作为用作条件独立性的条件的条件变量集，该变量组合的数量最小为0并且最大为（n-2），并且以循环（round-robin）的方式执行测试。然而，在这种情况下，变量组合的数量成指数增加，并且使用计算器执行计算是不实际的。

稍后公开了一种显著降低测试所需计算量的算法（参见P.Spirtes,C.Glymour,R.Scheines,"Causation,Prediction,and Search",MIT Press,第二版,2000年）。如果假设变量之间的条件独立性由有向非循环图唯一地表示，则唯一地确定使两个特定变量条件地独立的条件变量集，并且条件变量不与关注的变量条件地独立。在这样的条件下，在以升序增加条件变量集的数量的同时执行测试，并且在独立性未被拒绝的情况下，立即移除两个变量之间的边。然而，这种算法仍涉及大量测试尝试，这可能导致频繁的测试错误。

为了解决这种问题，P.Spirtes等也公开了对以上讨论的算法的改进，其进一步降低了在条件变量设置在关注的两个变量之间的路径上的条件下的计算量。然而，在算法的执行期间，保留稍后被确定为独立的边，因此允许遵循长路径。因此，可能无法有效地显著降低测试中的尝试次数。

提出了一种通过递归地将整个图划分为小的子图来降低具有大量条件变量集的独立性测试的尝试次数的算法（参见R.Yehezkel,B.Lerner,"Bayesian Network Structure Learning by Recursive AutonomyIdentification",Journal of Machine Learning Research,Vol.10,pp.1527-1570,2009年）。然而，该算法可能无法抑制如下测试错误的出现：在具有少量条件变量集的独立性测试中，内在地不独立的变量被确定为独立的。

另外，X.Xie,Z.Geng,"A Recursive Method for Structural Learningof Directed Acyclic Graphs",Journal of Machine Learning Research,Vol.9,pp.459-483,2008年公开了以与根据R.Yehezkel等的方法不同的方法来执行递归处理。然而，在根据X.Xie等的方法中，独立性测试需要大量条件变量，这可能导致缺少计算稳定性。

发明内容

因此，尚不存在通过条件独立性测试来充分地提高多个变量之间的因果关系的估计的低可靠性的方法。

所以，期望增强多个变量之间的估计因果关系的可靠性。

根据本技术的实施例，提供了一种测试多个变量之间的独立性的信息处理装置，包括：执行部分，在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及确定部分，确定V形结构是否存在于所述两个变量之间的路径上，V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，其中，在条件变量仅设置在被确定为具有V形结构的路径上的情况下，所述执行部分不执行所述两个变量之间的条件独立性的测试。

在条件变量是V形结构中的第三变量的情况下，所述执行部分可不执行所述两个变量之间的条件独立性的测试。

所述执行部分可在执行条件独立性的测试之前执行第一变量和第二变量之间的无条件独立性的测试，以及所述信息处理装置还可包括：V形结构搜索部分，搜索第一变量和第二变量无条件独立并且第一变量和第二变量各自不独立于第三变量的图结构，作为V形结构。

所述V形结构搜索部分可搜索第一变量和第二变量在除第三变量之外的变量的条件下条件独立并且第一变量和第二变量各自不独立于第三变量的图结构，作为V形结构。

在条件变量集的数量递增到超过预定数量的情况下，所述V形结构搜索部分可不搜索V形结构。

所述确定部分可针对所述两个变量之间的、数量与递增的条件变量集的数量相对应的路径，确定是否存在V形结构，以及在条件变量中的任一个设置在被确定为具有V形结构的路径中的任一个上的情况下，所述执行部分可不执行所述两个变量之间的条件独立性的测试。

所述信息处理装置还可包括：矛盾检测部分，检测多个V形结构中的有向边之间的矛盾，以将一些或全部有向边改变为无向边来解决矛盾。

所述矛盾检测部分可使用在所述多个V形结构中的第一变量和第二变量之间的独立性的测试中所使用的索引，将具有独立性较弱的第一变量和第二变量的V形结构的有向边改变为无向边。

在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中变量X和变量W不独立的情况下，所述矛盾检测部分可将第一V形结构中从变量X到变量Z的有向边和第二V形结构中从变量W到变量Z的有向边改变为无向边。

在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中变量X和变量W不独立的情况下，所述矛盾检测部分可将第一V形结构和第二V形结构中的全部有向边改变为无向边。

在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中变量X和变量W不独立的情况下，所述矛盾检测部分可使用两个变量之间的独立性的测试中所使用的索引来比较变量X和变量Y之间的独立性、以及变量W和变量Y之间的独立性，以将具有独立性较弱的两个变量的V形结构的有向边改变为无向边。

根据本技术的实施例，提供了一种用于测试多个变量之间的独立性的信息处理装置的信息处理方法，包括：在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及确定V形结构是否存在于所述两个变量之间的路径上，V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，其中，在条件变量仅设置在被确定为具有V形结构的路径上的情况下，不执行所述两个变量之间的条件独立性的测试。

根据本技术的实施例，提供了一种使计算机执行用于测试多个变量之间的独立性的处理的程序，所述处理包括：在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及确定V形结构是否存在于所述两个变量之间的路径上，V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，其中，在条件变量仅设置在被确定为具有V形结构的路径上的情况下，不执行所述两个变量之间的条件独立性的测试。

在本技术的实施例中，在用作两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试。确定V形结构是否存在于所述两个变量之间的路径上，V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构。在条件变量仅设置在被确定为具有V形结构的路径上的情况下，不执行所述两个变量之间的条件独立性的测试。

根据本技术的实施例，能够增强多个变量之间的估计因果关系的可靠性。

附图说明

图1示出图形模型的示例；

图2是示出根据本技术的实施例的信息处理装置的硬件配置示例的框图；

图3是示出根据本技术的实施例的信息处理装置的功能配置示例的框图；

图4图示V形结构；

图5是图示独立性测试处理的流程图；

图6是图示独立性测试处理的流程图；

图7图示对V形结构的搜索；

图8图示两个变量之间的路径；

图9图示两个变量之间的路径；

图10是图示矛盾解决处理的流程图；

图11图示矛盾解决处理的具体示例；

图12图示矛盾解决处理的具体示例；

图13图示矛盾解决处理的具体示例；以及

图14图示矛盾解决处理的具体示例。

具体实施方式

以下将参照附图描述本技术的实施例。

[信息处理装置的硬件配置示例]

图2示出根据本技术的实施例的信息处理装置11的硬件配置示例。

信息处理装置11测试离散多元随机变量之间的独立性或条件独立性，并将测试结果输出为贝叶斯网络，贝叶斯网络是一种图形模型。

信息处理装置11例如可由个人计算机组成，并可具有与个人计算机的配置类似的配置。

信息处理装置11包括CPU（中央处理单元）21、ROM（只读存储器）22、RAM（随机存取存储器）23、总线24、输入/输出接口25、输入部分26、输出部分27、存储部分28、通信部分29和驱动器30。

在信息处理装置11中，CPU21、ROM22和RAM23通过总线24彼此连接。输入/输出接口25还连接到总线24。诸如键盘、鼠标和触摸板的输入部分26、诸如显示器和扬声器的输出部分27、诸如硬盘驱动器和非易失性存储器的存储部分28、以及诸如网络接口的通信部分29连接到输入/输出接口25。

此外，驱动器30根据需要连接到输入/输出接口25。诸如磁盘、光盘、磁光盘和半导体存储器的可移除介质31视情况安装到驱动器30。从可移除介质31读取的程序根据需要安装在存储部分28中。

替选地，可由通信部分29经由有线或无线传输介质接收程序以安装在存储部分28中。另外替选地，程序可预先安装在ROM22或存储部分28中。

由信息处理装置11执行的程序可根据本文中描述的顺序按时间先后顺序进行处理，或者可并行地或在合适的定时（例如，当进行调用时）进行处理。

[信息处理装置的功能配置示例]

图3示出与本技术的实施例有关的信息处理装置11的一部分的功能配置示例。

图3的信息处理装置11包括输入部分51、控制部分52以及存储部分53和输出部分54。

输入部分51对应于图2的输入部分26。输入部分51接收如下输入：用于在N个离散随机变量之中指定要进行独立性测试的两个变量的自变量、用作条件独立性的条件的条件变量的变量集等，并将对应于该输入的内容的信息提供到控制部分52。

控制部分52对应于图2的CPU21。控制部分52根据存储在对应于图2的存储部分28的存储部分53中的程序进行操作，并使用存储在存储部分53中的各种信息执行所关注的两个变量之间的独立性的测试。

输出部分54对应于图2的输出部分27。输出部分54在控制部分52的控制下将独立性测试的结果输出为图形模型。

如图3中所示，控制部分52包括路径搜索部分71、执行确定部分72、测试执行部分73、V形结构搜索部分74和矛盾检测部分75，以及存储部分53包括变量对存储部分81、V形结构存储部分82和分离变量集存储部分83。

例如，路径搜索部分71使用诸如深度优先搜索的通用算法来搜索所关注的两个变量之间的路径。

执行确定部分72确定是否需要针对所关注的两个变量执行独立性测试。

测试执行部分73针对所关注的两个变量执行独立性测试。然而，应该注意，在执行确定部分72确定不需要执行独立性测试的情况下，测试执行部分73不执行独立性测试。

V形结构搜索部分74针对被确定为独立的两个变量搜索V形结构。例如，如图4所示，V形结构是这样的图结构，其中变量X和变量Y独立，变量X和变量Z不独立，以及变量Y和变量Z不独立。

矛盾检测部分75从V形结构搜索部分74找到的V形结构中检测彼此矛盾的V形结构，并解决V形结构之间的矛盾。

变量对存储部分81存储这样的变量对，其中不独立或未进行独立性测试的两个变量通过边而链接。

V形结构存储部分82存储V形结构搜索部分74找到的V形结构。执行确定部分72根据与存储在V形结构存储部分82中的V形结构相匹配的任意图结构是否设置在所关注的两个变量之间的路径上，确定是否需要针对两个变量执行独立性测试。

分离变量集存储部分83存储设置在由测试执行部分73执行的独立性测试中被确定为条件地独立的两个变量之间的路径上的条件变量，作为用于分离两个变量的分离变量集。

[由信息处理装置执行的独立性测试处理]

接下来，将参照图5和图6的流程图来描述由信息处理装置11执行的独立性测试处理。存储部分53预先存储随机变量（在下文中可被简称为“变量”）的数量N、以及各变量可取的内部状态的数量（2或更多）。当通过输入部分51输入用于描述所有变量的状态的M个数据时，独立性测试处理开始。

在初始状态中，变量对存储部分81存储这样的变量对，其中N个变量与不同的（N-1）个变量成对（通过边而链接）；以及V形结构存储部分82和分离变量集存储部分83不存储数据。

在步骤S11中，控制部分52将条件变量集（在下文中可被称为“条件变量”）的数量i设置为0，即，使条件变量集为空集。

在步骤S12中，控制部分52从存储在变量对存储部分81中的变量对中选择一个变量对。

在步骤S13中，测试执行部分73计算G²统计量，G²统计量是用来执行独立性测试的值。G²统计量由下式（1）给出。

G^{2} = 2 M \underset{x, y, z}{Σ} \hat{P} (x, y, z) \log \frac{\hat{P} (x | y, z)}{\hat{P} (x | z)} . . . (1)

在式（1）中，M指示数据的数量。附加有符号“^”（帽子（hat））的P（x,y,z）（例如，在下文中被称为“戴帽子的P（x,y,z）”）、戴帽子的P（x|y,z）和戴帽子的P（x|z）分别表示变量X和Y以及变量Z的集合的特定状态x、y、z的估计联合概率、状态x在状态y和z的条件下的估计条件概率、状态x在状态z的条件下的估计条件概率。使用M个数据来估计这些概率。在步骤S13中，变量Z的集合为空集，因此不考虑状态z。

这里，在p值和预定的阈值Th（例如，5%（0.05））之间进行比较，以测试所选择的变量对的两个变量之间的独立性。使用以上讨论的G²统计量和χ²分布来推导p值，以用作独立性测试的索引。

即，在步骤S14中，测试执行部分73确定p值是否大于阈值Th。

如果在步骤S14中确定p值大于阈值Th，则处理前进至步骤S15，在步骤S15中测试执行部分73接受所选择的变量对的两个变量之间的独立性。

然后，在步骤S16中，测试执行部分73从变量对存储部分81中删除所选择的变量对。

如果在步骤S14中确定p值不大于阈值Th，则处理前进至步骤S17，在步骤S17中测试执行部分73拒绝所选择的变量对的两个变量之间的独立性。

在以上提供的描述中，p值用作独立性测试的索引。然而，由下式（2）指示的条件互信息量MI可用作独立性测试的索引。

MI = \frac{G^{2}}{2 M} . . . (2)

在这种情况下，在条件互信息量MI和预定的阈值（例如，0.05）之间进行比较。如果确定条件互信息量MI小于阈值，则接受两个变量之间的独立性。

在步骤S16或步骤S17之后的步骤S18中，控制部分52确定是否已针对存储在变量对存储部分81中的所有变量执行了步骤S12至步骤S17中的处理，即，是否已针对存储在变量对存储部分81中的所有变量对执行了无条件独立性测试。

如果在步骤S18中确定没有处理所有变量对，则处理返回到步骤S12，以针对新选择的变量对重复步骤S12至步骤S17中的处理。

另一方面，如果在步骤S18中确定已处理了所有变量对，则处理前进至步骤S19。此时，变量对存储部分81仅存储具有这样的两个变量的变量对，这两个变量之间的独立性已被拒绝（不独立的两个变量）。

在步骤S19中，控制部分52确定是否存在在以上讨论的处理中找到的两个独立变量。

如果在步骤S19中确定存在两个独立变量的至少一个集合，则处理前进至步骤S20，在步骤S20中，V形结构搜索部分74针对两个独立变量搜索V形结构。具体地，在如图4所示的变量X和Y的特定集合独立并且各自不独立于变量Z的情况下，即，在变量X和Y具有路径（X-Z-Y）（其包括两条边以及在变量X和Y之间的变量Z）、并且变量Z不作为条件变量有助于变量X和Y之间的独立性的情况下，V形结构搜索部分74使V形结构存储部分82将这样的图结构存储为V形结构（例如，在下文中被表示为“X→Z←Y”）。

另一方面，如果在步骤S19中确定不存在两个独立变量的集合，则跳过步骤S20。

此后，处理前进至图6的步骤S21，在步骤S21中，控制部分52将条件变量集（条件变量）的数量i递增1。即，将条件变量集的数量设置为1。

在步骤S22中，控制部分52从存储在变量对存储部分81中的变量对中选择一个变量对，即，从具有不独立的两个变量的变量对中选择一个变量对。这里，假设已选择了具有变量S和变量T的变量对。

在步骤S23中，控制部分52选择可用作所选择的变量对的两个变量之间的独立性的条件的条件变量。具体地，控制部分52参考存储在变量对存储部分81中的变量对，以将与所选择的变量对的两个变量中的任意变量（例如，变量S）成对的变量之一选择为条件变量。这里，假设已选择了变量W。

在步骤S24中，路径搜索部分71搜索所选择的变量对的两个变量之间的路径，并确定条件变量是否设置在该路径上。

例如，如果在步骤S24中确定变量W设置在变量S和变量T之间的路径上，则处理前进至步骤S25，在步骤S25中，执行确定部分72确定与存储在V形结构存储部分82中的V形结构匹配的任意图结构是否设置在变量S和变量T之间的路径上。

如果在步骤S25中确定存在任何匹配的V形结构，则变量W不能用作路径上变量S和T之间的独立性的条件变量。因此，在步骤S26中，路径搜索部分71搜索另一路径。

在步骤S27中，确定是否存在任何其他路径。如果找到另一路径，则处理返回到步骤S24，并且再次执行步骤S24和S25中的处理。如果在步骤S24中确定变量W没有设置在变量S和变量T之间的路径上，则处理返回到步骤S23，在步骤S23中，选择另一条件变量。

另一方面，如果在步骤S25中确定不存在匹配的V形结构，则变量W可能是路径上变量S和T之间的独立性的条件变量，并且处理前进至步骤S28。

步骤S28至步骤S31、和步骤S33中的处理分别与以上讨论的步骤S13至步骤S17中的处理相同，因此将不进行描述。这里，例如，执行在变量W的条件下的变量S和T之间的条件独立性的测试。如果接受在变量W的条件下的变量S和T之间的条件独立性，则从变量对存储部分81中删除具有变量S和T的变量对。

然后，在步骤S32中，测试执行部分73使得分离变量集存储部分83将条件变量（变量W）存储为分离变量集。

如果在步骤S27中确定是否存在任何其他路径并且没有找到其他路径，即，如果条件变量仅设置在被确定为具有V形结构的路径上，则跳过步骤S28至步骤S33中的处理。即，在这种情况下，不执行在变量W的条件下的变量S和T之间的条件独立性的测试，并且变量S和T被保留为变量对（通过边而链接）。

这里，如果变量S和T条件地独立，则变量S和T将已在无条件独立性测试（步骤S13至步骤S17中的处理）中被确定为独立。这基于P.Spirtes等中公开的被称为“d-分离（d-separation）”和“忠实性（faithfulness）”的理论。此外，在这种情况下，变量W不能是变量S和T之间的独立性的条件变量。因此，清楚的是，变量S和T不是条件地独立的，因此不执行变量S和T之间的条件独立性的测试。

在步骤S32、步骤S33或步骤S27之后的步骤S34中，控制部分52确定是否已针对存储在变量对存储部分81中的所有变量对执行了步骤S22至步骤S33中的处理，即，是否已针对存储在变量对存储部分81中的所有变量对执行了条件独立性测试。

如果在步骤S34中确定未处理所有变量对，则处理返回到步骤S22，以针对新选择的变量对重复步骤S22至步骤S33中的处理。

另一方面，如果在步骤S34中确定已处理了所有变量对，则处理前进至步骤S35。此时，变量对存储部分81仅存储具有这样的两个变量的变量对，这两个变量之间的独立性已被拒绝（不独立的两个变量）、或这两个变量未进行条件独立性测试。

在步骤S35中，控制部分52确定是否存在在以上讨论的处理中找到的两个独立（条件地独立）变量。

如果在步骤S35中确定存在两个独立（条件地独立）变量的至少一个集合，则处理前进至步骤S36，在步骤S36中，V形结构搜索部分74针对两个独立变量搜索V形结构。具体地，例如，在如图7中所示的变量X和Y的特定集合在变量W的条件下条件地独立并且各自不独立于变量Z、以及变量Z未作为变量X和Y的条件变量（分离变量集）存储在分离变量集存储部分83中的情况下，V形结构搜索部分74使得V形结构存储部分82将这样的图结构存储为V形结构。

然而，应该注意，独立性测试中的错误可能导致这里获得的V形结构中的错误，并且如稍后所讨论的，条件变量集的数量的增加可能使测试中的这样的错误更容易出现。因此，即使这里获得的V形结构设置在正在测试的两个变量之间的路径上，也可执行测试。

另一方面，如果在步骤S35中确定不存在两个独立（条件地独立）变量的集合，则跳过步骤S36。

在步骤S37中，控制部分52确定条件变量集（条件变量）的数量i是否为最大数量（变量集中所包括的所有集的数量）imax（i=imax）。

如果在步骤S37中确定i=imax不为真，则处理返回到步骤S21，在步骤S21中，条件变量集（条件变量）的数量i递增1。然后，执行后续处理。

例如，在i=2为真的情况下，对两个条件变量中的每个执行与i=1为真的情况类似的处理，并且仅在两个条件变量均满足与具有一个条件变量的情况相同的条件的情况下，执行条件独立性测试。即，在条件变量中的任一个设置在具有V形结构的路径中的任一个上的情况下，不执行条件独立性测试。因此，可避免执行不需要的条件独立性测试，以降低错误出现的次数。

然后，如果在步骤S37中确定i=imax为真，则处理结束。当所有可执行的测试以这种方式结束时，具有这样的两个变量的变量对保留在变量对存储部分81中，这两个变量在测试中已被连续地确定为不独立，或这两个变量在不进行测试的情况下呈现为不独立。V形结构存储部分82存储用于形成V形结构的变量的集合。分离变量集存储部分83存储两个独立变量的条件变量集。

存储在存储部分53中的内容在控制部分52的控制下输出到输出部分54。具体地，输出包括有向边和无向边的组合的部分有向非循环图（贝叶斯网络），以允许对变量之间的依赖关系或因果关系进行估计。

根据上述处理，在条件变量仅设置在两个变量之间的路径中的具有V形结构的路径上的情况下，不执行两个变量之间的条件独立性的测试。

例如，在仅找到图8中所示的路径1作为变量X和变量Y之间的路径的情况下（路径1具有V形结构并且条件变量Z设置在路径1上），不执行变量X和变量Y之间的条件独立性的测试。然而，应该注意，在找到不具有V形结构但是其上设置有条件变量Z的路径2作为变量X和变量Y之间的路径的情况下，执行条件独立性测试。

此外，在仅找到图9中所示的路径作为变量X和变量Y之间的路径的情况下（路径具有V形结构，并且条件变量Z是不与V形结构的两个独立变量中的每个相独立的变量），不执行变量X和变量Y之间的条件独立性的测试。

因此，根据上述处理，可降低条件独立性测试的执行次数，这可降低测试错误的发生频率，因此增强变量之间的估计因果关系的可靠性。

以上描述了用于执行具有离散值的变量之间的独立性测试的处理。然而，在变量具有连续值的情况下，可使用用作条件独立性索引的部分相关系数和Fisher的Z变换来执行独立性测试。替选地，可使用内核方法来执行独立性测试，内核方法是用于统计模式识别的技术。

在以上讨论的独立性测试处理中，如果条件变量集的数量变得更大，则条件独立性测试的可靠性不可避免地降低。因此，V形结构搜索的精度也可能劣化，这可能导致变量之间的估计因果关系的可靠性的降低。

因此，在条件变量集（条件变量）的数量i递增到超过预定数量的情况下，即使在步骤S35中确定存在两个条件地独立的变量，也可跳过步骤S36中的处理（搜索V形结构）。

因此，不执行由于条件独立性测试的可靠性降低而导致的精度差的V形结构搜索，从而避免变量之间的估计因果关系的可靠性的降低。在完成所有条件独立性测试之后，执行已跳过的V形结构搜索。

在以上讨论的独立性测试处理中，V形结构存储部分82存储所找到的V形结构。然而，因为独立地对每对两个变量执行独立性测试处理，所以在发生测试错误的情况下，可能存储具有相互矛盾关系的V形结构。

[矛盾解决处理]

将参照图10的流程图来描述用于解决V形结构之间的矛盾的矛盾解决处理。

在步骤S51中，矛盾检测部分75从存储在V形结构存储部分82中的V形结构中检测具有矛盾的V形结构。

在步骤S52中，矛盾检测部分75根据预定标准来解决检测到的V形结构之间的矛盾。

[矛盾解决处理的第一具体示例]

图11图示具有相互矛盾关系的V形结构的矛盾解决处理的具体示例。

在图11的上部，示出了其中独立的变量X和变量Y各自不与变量Z独立的V形结构（X→Z←Y）、和其中独立的变量W和变量Z各自不与变量X独立的V形结构（W→X←Z）。

在这种情况下，在关系X→Z和关系X←Z之间存在矛盾。

为了解决这样的矛盾，矛盾检测部分75使用在每个V形结构的两个独立变量的独立性测试中使用的条件独立性的索引（具体为p值或条件互信息量MI），以将具有两个条件独立性较弱变量的V形结构的有向边改变为无向边。

具体地，比较变量X和变量Y、以及变量W和变量Z的相应p值，以确定哪对两个变量条件独立性较弱。例如，在变量X和变量Y的p值是0.50且变量W和变量Z的p值是0.20的情况下，接受具有变量X和变量Y的V形结构X→Z←Y，以及将表示变量Z对应于因并且变量X对应于果的因果关系的有向边（例如，在下文中被表示为“Z→X关系”）改变为如图11的下部所示的无向边。此外，从V形结构存储部分82中删除V形结构W→X←Z。

[矛盾解决处理的第二具体示例]

图12图示具有相互矛盾关系的V形结构的矛盾解决处理的另一具体示例。

在图12的上部，示出了其中独立的变量X和变量Y各自不与变量Z独立的V形结构（X→Z←Y）、和其中独立的变量W和变量Y各自不与变量Z独立的V形结构（W→Z←Y）。在图12中，变量X和变量W不独立。

在这种情况下，存在这样的矛盾：需要的是，变量X和变量W应该与除了用作条件变量的变量Z之外的变量内在地条件独立。

为了解决这样的矛盾，矛盾检测部分75将表示V形结构X→Z←Y中的X→Z关系和V形结构W→Z←Y中的W→Z关系的有向边改变为如图12的下部所示的无向边，并从V形结构存储部分82中删除V形结构X→Z←Y和W→Z←Y。

[矛盾解决处理的第三具体示例]

图13图示具有相互矛盾关系的V形结构的矛盾解决处理的又一具体示例。

在图13的上部，如图12中一样，示出了其中独立的变量X和变量Y各自不与变量Z独立的V形结构（X→Z←Y）、和其中独立的变量W和变量Y各自不与变量Z独立的V形结构（W→Z←Y）。同样在图13中，变量X和变量W不独立。

同样在这种情况下，存在这样的矛盾：需要的是，变量X和变量W应该与除了用作条件变量的变量Z之外的变量内在地条件独立。

为了解决这样的矛盾，矛盾检测部分75将V形结构X→Z←Y和V形结构W→Z←Y中的全部有向边改变为如图13的下部所示的无向边，并从V形结构存储部分82中删除V形结构X→Z←Y和W→Z←Y。

[矛盾解决处理的第四具体示例]

图14图示具有相互矛盾关系的V形结构的矛盾解决处理的又一具体示例。

在图14的上部，如图12中一样，示出了其中独立的变量X和变量Y各自不与变量Z独立的V形结构（X→Z←Y）、和其中独立的变量W和变量Y各自不与变量Z独立的V形结构（W→Z←Y）。同样在图14中，变量X和变量W不独立。

为了解决这样的矛盾，矛盾检测部分75使用在每个V形结构的两个独立变量的独立性测试中使用的条件独立性的索引（具体为p值或条件互信息量MI），以将具有未被其他V形结构共享的两个条件独立性较弱变量的V形结构的有向边改变为无向边。

具体地，比较变量X和变量Y、以及变量W和变量Y的相应p值，以确定哪对两个变量条件独立性较弱。例如，在变量X和变量Y的p值是0.50且变量W和变量Y的p值是0.30的情况下，接受具有变量X和变量Y的V形结构X→Z←Y，以及将表示V形结构W→Z←Y中未被V形结构X→Z←Y共享的W→Z关系的有向边改变为如图14的下部所示的无向边。此外，从V形结构存储部分82中删除V形结构W→Z←Y。

根据上述处理，检测具有矛盾的V形结构以解决V形结构之间的矛盾。因此，与独立性测试处理并发地执行矛盾解决处理可降低由于其中使用错误的V形结构的条件独立性测试而导致的错误的发生概率，因此增强变量之间的估计因果关系的可靠性。

[本技术的应用示例]

本技术可应用于以下示例。

（1）统计因果关系估计设备

根据本技术的实施例的独立性测试处理可应用于用于根据关于多元随机变量的观察数据来估计统计因果关系的因果关系估计处理。由用户来定义可具有离散值或连续值的多元随机变量，并且已预先准备了数据集。因此，向用作输出部分54的监视器等输出包括有向边和无向边的组合的图形模型作为图像。在这种情况下，可根据用于考虑条件独立性来确定有向边的取向的取向规则，尽可能地用有向边替换图形模型中的无向边。替选地，可将图形模型作为表示等同关系的文本数据输出到监视器等。

（2）医疗诊断辅助设备

根据本技术的实施例的独立性测试处理可应用于用于估计疾病和症状之间的因果关系的因果关系估计处理。已将{肺结核T,肺癌L,支气管炎B,胸部X射线检查结果X,呼吸困难D,和吸烟状态S}定义为随机变量，并且已将每个随机变量的内部状态的数量准备为数据。因此，揭示具有V形结构和无向边的变量对，并且向用作输出部分54的监视器等输出包括有向边和无向边的组合的图形模型作为图像。此外，可根据用于考虑条件独立性来确定有向边的取向的取向规则，尽可能地用有向边替换图形模型中的无向边。在示例中，例如输出{S-L}、{S-B}、{L→D}、{B→D}、{L→X}、{T→X}等作为变量之间的因果关系。

（3）产品管理设备

根据本技术的实施例的独立性测试处理可应用于用于估计工厂中的各种测量项和产量之间的因果关系的因果关系估计处理。已将{是否为好产品Y,工厂温度T,工厂湿度M,测量项1A,测量项2B,和测量项3C}定义为随机变量。这里，变量Y具有用于指示产品是否好的两个离散值，并且所有其他变量具有连续值。因此，使用根据现有技术的使用具有离散值的变量Y作为参考变量来离散化所有其他变量（连续值）的技术来离散化所有变量。因此，向用作输出部分54的监视器等输出包括有向边和无向边的组合的图形模型作为图像。

（4）文档分类设备

根据本技术的实施例的独立性测试处理可应用于用于将输入文档分类为用户预先定义的类别的文档分类设备中执行的文档分类的学习处理。当输入预先分类的或附有分类标签的文档时，文档分类设备通过词法分析（morphological analysis）等将文档分解为词类（parts of speech）。通过以上处理，已准备了表示类别的变量C和表示词类出现频率的变量S。这里，变量C具有离散值，而变量S具有连续值。因此，参考变量C将变量S离散化（归类）。然后，通过对具有离散值的变量S执行根据本技术的实施例的独立性测试处理来获得包括有向边和无向边的组合的图形模型。在这种情况下，可使用信息标准用有向边替换有向边。另外，可通过用有向边来链接表示类别的变量C和所有变量S，将条件概率分布的乘积表示为贝叶斯网络。因此，通过使用相同的数据估计条件概率分布来执行文档分类的学习处理。通过以这种方式估计（学习）词类之间的依赖关系，生成以高准确度对未知文档进行分类的分类器。

当新的未分类文档输入到文档分类设备时，文档被分解为词类，并且关于词类出现频率的信息在分类器中被映射在变量S的频率信息类别中。因此，为输入文档提供有作为证据的用于表示每个词类出现概率的变量S。然后，通过将变量S边缘化来计算未提供有证据的类别的概率值，并将输入文档分类为已计算最大概率值的类别。

（5）图像识别设备

根据本技术的实施例的独立性测试处理可应用于用于将输入图像分类为用户预先定义的类别的图像识别设备中执行的图像分类的学习处理。当输入预先分类的或附有分类标签的多个图像（用于学习的图像）时，图像识别设备对图像进行聚类。另外，图像识别设备使用每个聚类的图像的RGB值的均值，以无监督的方式进一步对图像进行聚类。通过以上处理，已准备了表示类别的变量C和表示RGB值的均值的变量V。这里，变量C具有离散值，而变量V具有连续值。因此，参考变量C将变量V离散化（归类）。然后，通过对具有离散值的变量V执行根据本技术的实施例的独立性测试处理来获得包括有向边和无向边的组合的图形模型。在这种情况下，可使用信息标准用有向边替换无向边。另外，可通过用有向边来链接表示类别的变量C和所有变量V，将条件概率分布的乘积表示为贝叶斯网络。因此，通过使用相同的数据估计条件概率分布来执行图像分类的学习处理。通过以这种方式估计（学习）RGB值之间的依赖关系，生成以高准确度对未知图像进行分类的分类器。

当新的未分类图像输入到图像识别设备时，计算RGB值的平均值，并且图像的RGB值的均值在分类器中被映射在变量V的RGB值类别中。因此，为输入的图像提供有作为证据的变量V。然后，通过将变量V边缘化来计算未提供有证据的类别的概率值，并将输入图像分类为已计算最大概率值的类别。

除了以上讨论的示例之外，本技术也可应用于用于辅助用户进行选择的决策支持设备、用于执行诸如遗传分析和心理学分析的社会科学分析的分析设备、用于分析从传感器输入的信息的分析设备、用于根据用户的品味等进行推荐的推荐设备、其他代理系统等。

本技术不限于上述实施例，并且在不脱离本技术的范围和精神的情况下，可以以各种方式进行修改。

例如，可通过云计算来实现本技术，在云计算中，经由网络由多个设备以分布式的方式联合地处理单个功能。

此外，在以上讨论的流程图中描述的每个步骤除了由单个设备执行之外，也可以由多个设备以分布式的方式执行。

另外，在单个步骤中包括多个处理的情况下，单个步骤中包括的多个处理除了由单个设备执行之外，也可以由多个设备以分布式的方式执行。

本技术可如下配置。

（1）一种测试多个变量之间的独立性的信息处理装置，包括：执行部分，在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及确定部分，确定V形结构是否存在于所述两个变量之间的路径上，所述V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，其中，在所述条件变量仅设置在被确定为具有所述V形结构的路径上的情况下，所述执行部分不执行所述两个变量之间的条件独立性的测试。

（2）根据（1）的信息处理装置，其中，在所述条件变量是所述V形结构中的所述第三变量的情况下，所述执行部分不执行所述两个变量之间的条件独立性的测试。

（3）根据（1）或（2）的信息处理装置，其中，所述执行部分在执行条件独立性的测试之前执行所述第一变量和所述第二变量之间的无条件独立性的测试，以及所述信息处理装置还包括：V形结构搜索部分，搜索所述第一变量和所述第二变量无条件独立并且所述第一变量和所述第二变量各自不独立于所述第三变量的图结构，作为所述V形结构。

（4）根据（3）的信息处理装置，其中，所述V形结构搜索部分搜索所述第一变量和所述第二变量在除所述第三变量之外的变量的条件下条件独立并且所述第一变量和所述第二变量各自不独立于所述第三变量的图结构，作为所述V形结构。

（5）根据（4）的信息处理装置，其中，在条件变量集的数量递增到超过预定数量的情况下，所述V形结构搜索部分不搜索所述V形结构。

（6）根据（1）至（5）中的任一项的信息处理装置，其中，所述确定部分针对所述两个变量之间的、数量与递增的条件变量集的数量相对应的路径，确定是否存在所述V形结构，以及在所述条件变量中的任一个设置在被确定为具有所述V形结构的路径中的任一个上的情况下，所述执行部分不执行所述两个变量之间的条件独立性的测试。

（7）根据（1）至（6）中的任一项的信息处理装置，还包括：矛盾检测部分，检测多个所述V形结构中的有向边之间的矛盾，以将一些或全部所述有向边改变为无向边来解决所述矛盾。

（8）根据（7）的信息处理装置，其中，所述矛盾检测部分使用在多个所述V形结构中的所述第一变量和所述第二变量之间的独立性的测试中使用的索引，将具有独立性较弱的所述第一变量和所述第二变量的所述V形结构的有向边改变为无向边。

（9）根据（7）的信息处理装置，其中，在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中所述变量X和所述变量W不独立的情况下，所述矛盾检测部分将所述第一V形结构中从所述变量X到所述变量Z的有向边和所述第二V形结构中从所述变量W到所述变量Z的有向边改变为无向边。

（10）根据（7）的信息处理装置，其中，在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中所述变量X和所述变量W不独立的情况下，所述矛盾检测部分将所述第一V形结构和所述第二V形结构中的全部有向边改变为无向边。

（11）根据（7）的信息处理装置，其中，在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中所述变量X和所述变量W不独立的情况下，所述矛盾检测部分使用两个变量之间的独立性的测试中使用的索引，比较所述变量X和所述变量Y之间的独立性以及所述变量W和所述变量Y之间的独立性，以将具有独立性较弱的两个变量的所述V形结构的有向边改变为无向边。

（12）一种用于测试多个变量之间的独立性的信息处理装置的信息处理方法，包括：在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及确定V形结构是否存在于所述两个变量之间的路径上，所述V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，其中，在所述条件变量仅设置在被确定为具有所述V形结构的路径上的情况下，不执行所述两个变量之间的条件独立性的测试。

（13）一种使计算机执行用于测试多个变量之间的独立性的处理的程序，所述处理包括：在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及确定V形结构是否存在于所述两个变量之间的路径上，所述V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，其中，在所述条件变量仅设置在被确定为具有所述V形结构的路径上的情况下，不执行所述两个变量之间的条件独立性的测试。

本公开包含与2012年3月28日在日本专利局提交的日本优先权专利申请JP2012-072789中公开的主题有关的主题，其全部内容通过引用合并于此。

Claims

1.一种测试多个变量之间的独立性的信息处理装置，包括：

执行部分，在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及

确定部分，确定V形结构是否存在于所述两个变量之间的路径上，所述V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，

其中，在所述条件变量仅设置在被确定为具有所述V形结构的路径上的情况下，所述执行部分不执行所述两个变量之间的条件独立性的测试。

2.根据权利要求1所述的信息处理装置，

其中，在所述条件变量是所述V形结构中的所述第三变量的情况下，所述执行部分不执行所述两个变量之间的条件独立性的测试。

3.根据权利要求1所述的信息处理装置，

其中，所述执行部分在执行条件独立性的测试之前执行所述第一变量和所述第二变量之间的无条件独立性的测试，

所述信息处理装置还包括：V形结构搜索部分，搜索所述第一变量和所述第二变量无条件独立并且所述第一变量和所述第二变量各自不独立于所述第三变量的图结构，作为所述V形结构。

4.根据权利要求3所述的信息处理装置，

其中，所述V形结构搜索部分搜索所述第一变量和所述第二变量在除所述第三变量之外的变量的条件下条件独立并且所述第一变量和所述第二变量各自不独立于所述第三变量的图结构，作为所述V形结构。

5.根据权利要求4所述的信息处理装置，

其中，在条件变量集的数量递增到超过预定数量的情况下，所述V形结构搜索部分不搜索所述V形结构。

6.根据权利要求1所述的信息处理装置，

其中，所述确定部分针对所述两个变量之间的、数量与递增的条件变量集的数量相对应的路径，确定是否存在V形结构，以及

在所述条件变量中的任一个设置在被确定为具有所述V形结构的路径中的任一个上的情况下，所述执行部分不执行所述两个变量之间的条件独立性的测试。

7.根据权利要求1所述的信息处理装置，还包括：

矛盾检测部分，检测多个所述V形结构中的有向边之间的矛盾，以将一些或全部所述有向边改变为无向边来解决所述矛盾。

8.根据权利要求7所述的信息处理装置，

其中，所述矛盾检测部分使用在多个所述V形结构中的所述第一变量和所述第二变量之间的独立性的测试中使用的索引，将具有独立性较弱的所述第一变量和所述第二变量的所述V形结构的有向边改变为无向边。

9.根据权利要求7所述的信息处理装置，

其中，在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中所述变量X和所述变量W不独立的情况下，所述矛盾检测部分将所述第一V形结构中从所述变量X到所述变量Z的有向边和所述第二V形结构中从所述变量W到所述变量Z的有向边改变为无向边。

10.根据权利要求7所述的信息处理装置，

其中，在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中所述变量X和所述变量W不独立的情况下，所述矛盾检测部分将所述第一V形结构和所述第二V形结构中的全部所述有向边改变为无向边。

11.根据权利要求7所述的信息处理装置，

其中，在变量X和变量Y各自不独立于变量Z的第一V形结构、以及变量W和变量Y各自不独立于变量Z的第二V形结构中所述变量X和所述变量W不独立的情况下，所述矛盾检测部分使用两个变量之间的独立性的测试中使用的索引，比较所述变量X和所述变量Y之间的独立性以及所述变量W和所述变量Y之间的独立性，以将具有独立性较弱的两个变量的所述V形结构的有向边改变为无向边。

12.一种用于测试多个变量之间的独立性的信息处理装置的信息处理方法，包括：

在用作图形模型中至少不独立的两个变量之间的独立性的条件的条件变量设置在所述两个变量之间的路径上的情况下，执行所述两个变量之间的条件独立性的测试；以及

确定V形结构是否存在于所述两个变量之间的路径上，所述V形结构是独立的第一变量和第二变量各自不独立于第三变量的图结构，

其中，在所述条件变量仅设置在被确定为具有所述V形结构的路径上的情况下，不执行所述两个变量之间的条件独立性的测试。

13.一种使计算机执行用于测试多个变量之间的独立性的处理的程序，所述处理包括：