CN112352235A - 因果分析 - Google Patents
因果分析 Download PDFInfo
- Publication number
- CN112352235A CN112352235A CN201980010742.3A CN201980010742A CN112352235A CN 112352235 A CN112352235 A CN 112352235A CN 201980010742 A CN201980010742 A CN 201980010742A CN 112352235 A CN112352235 A CN 112352235A
- Authority
- CN
- China
- Prior art keywords
- factor
- causal
- factors
- effect
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001364 causal effect Effects 0.000 title claims abstract description 390
- 238000004458 analytical method Methods 0.000 title abstract description 124
- 230000000694 effects Effects 0.000 claims abstract description 240
- 238000000034 method Methods 0.000 claims abstract description 77
- 230000009471 action Effects 0.000 claims abstract description 37
- 230000004044 response Effects 0.000 claims abstract description 28
- 238000004590 computer program Methods 0.000 claims abstract description 19
- 238000011156 evaluation Methods 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 42
- 230000006870 function Effects 0.000 description 66
- 238000010586 diagram Methods 0.000 description 24
- 238000000556 factor analysis Methods 0.000 description 19
- 230000000875 corresponding effect Effects 0.000 description 18
- 238000013480 data collection Methods 0.000 description 15
- 238000007781 pre-processing Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 10
- 238000012047 cause and effect analysis Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000008570 general process Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/027—Frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开的实施例涉及用于因果分析的方法、系统和计算机程序产品。在一些实施例中,提供了一种计算机实现的方法。该方法包括从多个因素的观察样本中确定指示多个因素之间的第一因果关系的第一因果结构,每个观察样本包括多个因素的一组观察值;向用户呈现第一因果结构;响应于从用户接收到关于第一因果结构的至少一个用户输入,基于第一因果结构来执行与至少一个用户输入相关联的动作;以及向用户呈现动作的执行的结果。在其他实施例中,提供了另一种方法、系统和计算机程序产品。
Description
技术领域
本公开的实施例总体上涉及机器学习领域,并且特别地涉及用于因果分析的方法、系统和计算机程序产品。
背景技术
在诸如市场研究、制造、医疗保健、零售等很多领域中,发现事情发生的原因和方式并且找到使得期望的事情能够发生的策略已经成为迫切的需求。因此,期望提供一种因果分析系统,该系统不仅可以提供洞察力以示出事情发生的原因和方式,而且还可以预测在策略被执行的情况下该策略的效应,或者推荐使得期望的事情能够发生的最佳策略。
发明内容
总体上,本公开的示例实施例提供了用于因果分析的方法、系统和计算机程序产品。
在第一方面,提供了一种计算机实现的方法。该方法包括从多个因素的观察样本中确定指示多个因素之间的第一因果关系的第一因果结构,每个观察样本包括多个因素的一组观察值;向用户呈现第一因果结构;响应于从用户接收到关于第一因果结构的至少一个用户输入,基于第一因果结构来执行与至少一个用户输入相关联的动作;以及向用户呈现动作的执行的结果。
在第二方面,提供了一种计算机实现的方法。该方法包括获取多个因素的观察样本和指示多个因素之间的因果关系的因果结构,每个观察样本包括多个因素的一组观察值;响应于在多个因素中标识出目标因素,基于因果结构从多个因素中确定影响目标因素的至少一个因素;针对至少一个因素中的每个因素,基于观察样本和因果结构来估计该因素对目标因素的总体因果效应;以及基于至少一个因素对目标因素的相应总体因果效应对至少一个因素进行排名。
在第三方面,提供了一种系统。该系统包括处理单元和耦合到该处理单元的存储器。存储器存储指令,该指令在由处理单元执行时执行动作,这些动作包括:从多个因素的观察样本中确定指示多个因素之间的第一因果关系的第一因果结构,每个观察样本包括多个因素的一组观察值;向用户呈现第一因果结构;响应于从用户接收到关于第一因果结构的至少一个用户输入,基于第一因果结构来执行与至少一个用户输入相关联的动作;以及向用户呈现动作的执行的结果。
在第四方面,提供了一种系统。该系统包括处理单元和耦合到该处理单元的存储器。存储器存储指令,该指令在由处理单元执行时执行动作,这些动作包括:获取多个因素的观察样本和指示多个因素之间的因果关系的因果结构,每个观察样本包括多个因素的一组观察值;响应于在多个因素中标识出目标因素,基于因果结构从多个因素中确定影响目标因素的至少一个因素;针对至少一个因素中的每个因素,基于观察样本和因果结构来估计该因素对目标因素的总体因果效应;以及基于至少一个因素对目标因素的相应总体因果效应对至少一个因素进行排名。
在第五方面,提供了一种计算机程序产品。该计算机程序产品有形地存储在机器可读介质上并且包括机器可执行指令。该机器可执行指令当在设备上执行时引起该设备执行根据本公开的第一方面的方法。
在第六方面,提供了一种计算机程序产品。该计算机程序产品有形地存储在机器可读介质上并且包括机器可执行指令。该机器可执行指令当在设备上执行时引起该设备执行根据本公开的第二方面的方法。
应当理解,该发明内容不旨在标识本发明实施例的关键或必要特征,也不旨在用于限制本实施例的范围。通过下面的描述,本实施例的其他特征将变得容易理解。
附图说明
通过在附图中对本公开的一些实施例的更详细描述,本公开的上述和其他目的、特征和优点将变得更加明显,其中相同的附图标记通常指代本公开的实施例的相同组件。
图1A示出了可以在其中实现本发明的实施例的示例环境;
图1B示出了可以在其中实现本发明的实施例的另一示例环境;
图2A示出了根据本公开的一些实施例的用于因果分析的示例系统;
图2B示出了根据本公开的一些实施例的示例因果分析引擎的框图;
图2C示出了根据本公开的一些实施例的因果分析引擎中的示例数据处理模块和示例因果结构发现模块的框图;
图2D示出了根据本公开的一些实施例的因果分析引擎中的示例因果分析模块的框图;
图2E示出了根据本公开的一些实施例的示例用户接口模块的框图;
图3示出了根据本公开的一些实施例的用户接口模块与因果分析引擎之间的交互;
图4示出了根据本公开的一些实施例的用于因果分析的示例方法;
图5A-5E示出了根据本公开的一些实施例的示例因果图;
图6示出了根据本公开的一些实施例的用于因果分析的示例方法;
图7示出了根据本公开的一些实施例的确定原因因素对目标因素的总体因果效应的示例;
图8示出了根据本公开的一些实施例的用于因果分析的通用过程;以及
图9是适合于实现本公开的实施例的设备的简化框图。
具体实施方式
现在将参考一些示例实施例描述本公开的原理。应当理解,这些实施例仅出于说明的目的进行描述,并且帮助本领域技术人员理解和实现本公开,而不暗示对本公开的范围的任何限制。除了下面描述的方式以外,本文中描述的公开内容可以以各种方式来实现。
在以下描述和权利要求中,除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同的含义。
如本文中使用的,除非上下文明确地另外指出,否则单数形式的“一个(a)”、“一个(an)”和“该(the)”也意图包括复数形式。术语“包括”及其变体应当被解读为开放式术语,意指“包括但不限于”。术语“基于”应当被解读为“至少部分基于”。术语“一个实施例”和“实施例”应当被解读为“至少一个实施例”。术语“另一实施例”应当被理解为“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同或相同的对象。下面可以包括其他定义(显式和隐式)。
在一些示例中,值、过程或装置被称为“最佳”、“最低”、“最高”、“最小”、“最大”等。应当理解,这样的描述旨在指示可以在很多使用的功能替代方案中进行选择,并且这样的选择不需要比其他选择更好、更小、更高或以其他方式优选。
如上所述,在诸如市场研究、制造、医疗保健、零售等很多领域中,发现事情发生的原因和方式并且找到使得期望的事情能够发生的策略已经成为迫切的需求。例如,在市场研究领域,人们想知道哪些因素会影响电信运营商的客户满意度以及如何提高客户满意度。在产品制造领域,人们想知道哪些因素会影响产品产量以及如何提高产品产量。在零售领域,人们想知道哪些因素会影响产品销量以及如何提高产品销量。在软件开发领域,人们想知道哪些因素会影响软件故障率以及如何降低软件故障率。因此,期望提供一种因果分析系统,该系统能够发现多个因素之间的因果关系并且基于该因果关系来推荐影响多个因素中的目标因素的策略。
一些常规解决方案以人工方式支持因果分析并且需要大量人工交互来执行因果分析,这导致效率低下并且不能满足不同领域的上述需求。
本公开的实施例提供了一种用于因果分析的解决方案,以解决上述问题和/或一个或多个其他潜在问题。在该解决方案中,可以从多个因素的观察样本中自动发现多个因素之间的因果关系。可以向用户呈现表示该因果关系的因果结构。用户可以调整该因果结构以输入一些先验知识,从而优化所发现的因果结构。用户可以在多个因素中指定目标因素,并且从多个因素中检索对目标因素具有最大效应的一个或多个关键因素。此外,该解决方案可以评估由用户输入的用于影响目标因素的策略的效应。该解决方案还可以推荐使得目标因素能够达到用户期望的值的最佳策略。
如本文中使用的,术语“因素”也被称为“变量”。术语“观察样本”是指能够直接观察的多个因素的一组观察值,并且能够直接观察的因素也称为“可观察变量”或“可观察因素”。术语“目标因素”是指人们期望影响的因素。例如,在市场研究领域,可观察因素可以包括与客户属性有关的因素(诸如客户级别、客户电话号码等)、与客户行为有关的因素(诸如每月消耗的流量、免费流量的比率、每月消耗的流量的总费用等)、与客户反馈有关的因素(例如,投诉次数、客户满意度)、以及与策略有关的因素(例如,针对特定事件的提醒次数等)。顾客满意度可以被认为是目标因素。作为另一示例,在软件开发领域,可观察因素可以包括用于软件开发的人力资源量、用于软件开发的持续时间、函数数目、代码行数目、用于软件开发的编程语言、软件故障率等。例如,软件故障率可以被认为是目标因素。观察样本可以包括可观察因素的一组观察值。
以下将参考附图描述本公开的一些示例实施例。然而,本领域技术人员将容易理解,仅出于说明的目的提供本文中给出的关于这些附图的详细描述,而不暗示对本公开的范围的任何限制。
图1A示出了可以在其中实现本发明的实施例的示例环境100。如图1A所示,环境100可以包括用户110、因果分析服务器120和数据收集设备130。因果分析服务器120可以包括用户接口模块121、因果分析引擎122和数据库123。应当理解,仅出于说明的目的示出了环境100和/或因果分析服务器120的结构,而不暗示对本公开的范围的任何限制。本公开的实施例也可以应用于具有不同结构的不同环境和/或具有不同组件的不同因果分析服务器。
在一些实施例中,数据收集设备130可以被配置为自动收集多个因素的观察样本。每个观察样本可以包括多个因素的一组观察值。在一些实施例中,数据收集设备130可以包括用于收集观察样本的一个或多个传感器。备选地,在一些实施例中,数据收集设备130可以包括用于分别收集不同类型的因素的观察值的一个或多个收集单元。
在一些实施例中,数据收集设备130可以将所收集的观察样本传输到因果分析服务器120以用于后续存储、处理和/或分析。例如,由数据收集设备130收集的观察样本可以经由用户输入接口模块121被传输到因果分析服务器120。然后,观察样本可以从用户输入接口模块121被传输到因果分析引擎122以用于后续存储、处理和/或分析。例如,因果分析引擎122可以发现多个因素之间的因果关系,和/或基于观察样本执行因果分析。备选地,在一些实施例中,可以省略数据收集设备130。例如,观察样本可以由用户110输入到服务器120。
在一些实施例中,用户110可以与因果分析系统120通信。例如,用户110可以经由用户输入接口模块121向因果分析服务器120输入用户信息、观察样本、一个或多个请求、有用知识和/或用于因果分析的一种或多种配置。用户输入可以从用户输入接口模块121被传输到因果分析引擎122。在一些实施例中,响应于接收到用户输入,因果分析引擎122可以执行与用户输入相关联的用于因果分析的一个或多个动作,并且经由用户接口模块121向用户110呈现一个或多个结果或反馈。因果分析引擎122可以将所接收的数据、所生成的结构、专家知识和/或任何有用信息存储到数据库123中以供后续使用。
图1B示出了可以在其中实现本发明的实施例的另一示例环境105。如图1B所示,环境105可以包括用户110、数据收集设备130(其与图1A所示的数据收集设备130相同或相似)、用户设备140和因果分析服务器160。例如,用户设备140可以经由网络150(诸如互联网)与因果分析服务器160通信。应当理解,仅出于说明的目的示出了环境105、用户设备140和/或因果分析服务器120的结构,而不暗示对本公开的范围的任何限制。本公开的实施例也可以应用于不同的环境、不同的用户设备和/或不同的因果分析服务器。
如本文中使用的,术语“用户设备”可以指代具有无线或有线通信能力的任何设备。用户设备的示例包括但不限于用户设备(UE)、个人计算机、台式机、移动电话、蜂窝电话、智能电话、个人数字助理(PDA)、便携式计算机、图像捕获设备(诸如数码相机)、游戏设备、音乐存储和播放设备、或者启用无线或有线互联网访问和浏览的互联网设备。
如图1B所示,例如,用户设备140可以包括用户接口模块121(其与如图1A所示的用户接口模块121相同或相似)和本地数据库141。在一些实施例中,用户设备140可以经由用户接口模块121从数据收集设备130接收观察样本,和/或经由用户接口模块121从用户110接收用户输入。用户设备140可以将所接收的观察结果样本、数据、专家知识和/或有用信息存储在本地数据库141处以供后续使用。用户设备140还可以经由网络150将所接收的观察样本、数据和/或信息传输到因果分析服务器160以用于后续处理和/或分析。
如图1B所示,例如,因果分析服务器160可以包括因果分析引擎122(其与如图1A所示的因果分析引擎122相同或相似)和数据库161。在一些实施例中,响应于接收到多个因素的观察样本,因果分析引擎122可以发现多个因素之间的因果关系,和/或基于观察样本来执行因果分析。响应于接收到用户输入(诸如用户信息、观察样本、一个或多个请求、有用知识和/或用于因果分析的一个或多个配置),因果分析引擎122可以执行与用户输入相关联的用于因果分析的一个或多个动作,并且将一个或多个结果或反馈传输回用户设备140。因果分析引擎122可以将所接收的数据、所生成的结构、专家知识和/或任何有用信息存储到数据库161中以供后续使用。用户设备140可以经由用户接口模块121向用户110呈现一个或多个结果或反馈。
图2A示出了根据本公开的一些实施例的用于因果分析的通用系统200。如图2A所示,用户接口模块121可以从用户110和/或数据收集设备130接收一个或多个输入201。用户接口模块121可以将一个或多个输入201传输给因果分析引擎122。因果分析引擎122可以执行与一个或多个输入201相关联的动作。因果分析引擎122可以通过执行动作来生成一个或多个输出202。备选地或附加地,因果分析引擎122可以将一个或多个输出202传输回用户接口模块121以便将它们呈现给用户110。
图2B示出了根据本公开的一些实施例的用户接口模块121的示例框图。如图2B所示,用户接口模块121可以包括以下至少一项:数据输入接口210、因果结构发现接口220、因果结构评估接口230、因果图管理接口240和策略管理接口250。应当理解,图2B所示的接口仅出于说明的目的而被示出,而不暗示对本公开的范围的任何限制。用户接口模块121可以提供适合于实现本公开的实施例的任何合适数目的接口。例如,在一些实施例中,用户接口模块121还可以提供允许用户110登录或注销因果分析引擎122的登录接口。
在一些实施例中,数据输入接口210可以允许用户110或数据收集设备130以因果分析引擎122所支持的格式来准备数据(诸如多个因素的观察样本)。数据输入接口210还可以允许用户110将数据中的敏感信息转换成非敏感信息。
如图2B所示,在一些实施例中,数据输入接口210可以提供数据上传接口211,数据上传接口211允许用户110或数据收集设备130上传数据(诸如,多个因素的观察样本)。然后,所上传的数据可以被传输到因果分析引擎122。
备选地或附加地,在一些实施例中,数据输入接口210还可以提供预处理方法选择接口212,预处理方法选择接口212允许用户110从因果分析引擎122所支持的一种或多种数据预处理方法中选择数据预处理方法,这可以帮助提高数据质量。
在一些实施例中,因果结构发现接口220可以提供目标因素选择接口221,目标因素选择接口221允许用户110在多个因素中指定目标因素(诸如,客户满意度、产品产量、软件故障率等)。
备选地或附加地,在一些实施例中,因果结构发现接口220还可以提供发现算法选择接口222。发现算法选择接口222可以将因果分析引擎122所支持的一组因果发现算法呈现给用户110以供选择。例如,不同的因果发现算法可以适用于不同种类的数据集,诸如离散数据、连续数据、混合数据等。在一些实施例中,发现算法选择接口222可以允许用户110从该组因果发现算法中选择要在后续因果结构的发现中使用的合适的因果发现算法。
备选地或附加地,在一些实施例中,因果结构发现接口220还可以提供超参数调整接口223,超参数调整接口223允许用户110调整所选择的因果发现算法的一些超参数,从而改善因果结构发现的速度和/或准确性。
备选地或附加地,在一些实施例中,因果结构发现接口220还可以提供专家知识输入接口224,专家知识输入接口224允许用户110输入关于多个因素之间的因果关系的专家知识,从而改善因果结构发现的速度和/或准确性。专家知识的示例可能包括但不限于:两个因素之间存在直接因果关系;两个因素之间没有直接因果关系;一个因素是另一因素的间接原因;一组因素不是另一组因素的原因;等等。所输入的专家知识可以存储在数据库中以供后续使用。
备选地或附加地,在一些实施例中,因果结构发现接口220还可以提供因果结构简化接口225,因果结构简化接口225允许用户110发起独立测试以优化所发现的因果结构,例如,以从所发现的因果结构中删除一些不合理的因果关系。
在一些实施例中,因果结构评估接口230可以允许用户110在各种评估指标和/或评估方法学下发起对所发现的因果结构的评估,从而标识所发现的因果结构对多个因素的观察样本的拟合度。在一些实施例中,因果结构评估接口230可以提供评估指标/方法学选择接口231,评估指标/方法学选择接口231允许用户110选择要用于评估所发现的因果结构的评估指标和/或评估方法学。
在一些实施例中,所发现的因果结构可以被呈现为图,该图在下文中也称为“因果图”。例如,因果图可以包括与多个因素相对应的多个节点和连接多个节点的一个或多个边。连接两个节点的边可以指示与两个节点相对应的两个因素之间的因果关系,下文中也称为“因果边”。
在一些实施例中,因果图管理接口240可以提供因果路径搜索选择接口241,因果路径搜索选择接口241允许用户110从多个因素中选择任何两个因素并且发起针对所选择的两个因素之间的因果路径的搜索。
备选地或附加地,在一些实施例中,因果图管理接口240还可以提供因果图编辑接口242,因果图编辑接口242允许用户110编辑所呈现的因果图以输入用于优化因果图的一些专家知识。在一些实施例中,由用户110对因果图执行的编辑可以包括以下任一项:向因果图添加边以指示两个节点之间的直接因果关系;从因果图去除现有边以指示两个节点之间没有直接因果关系;重定向因果图中的现有边以重定向两个节点之间的因果关系;或者向因果图添加一个或多个标签以指示一些先验知识。然后,专家知识可以用于优化所发现的因果图。在一些实施例中,如果专家知识与先前存储的知识冲突,则可以经由因果图管理接口240(诸如,因果图编辑接口242)向用户110呈现该冲突的指示。
备选地或附加地,在一些实施例中,因果图管理接口240还可以提供因素组合选择接口243,因素组合选择接口243允许用户110启用或禁用对所发现的因果图的因素组合操作。例如,因素组合操作可以将所发现的因果图中的两个或多个因素组合为一个因素,以优化或简化所发现的因果图。因素组合操作可以基于验证性因素分析(CFA)或探索性因素分析(EFA)来执行。
在一些实施例中,因果结构发现接口220还可以提供与因素组合选择接口243相同或相似的因素组合选择接口,使得因素组合操作可以在发现因果结构之前被执行,以便促进因果结构的发现。
备选地或附加地,在一些实施例中,因果图管理接口240还可以提供关键因素分析接口244,关键因素分析接口244允许用户110选择目标因素并且输入要检索的影响目标因素的关键因素的数目。然后,关键因素分析接口244可以向用户110呈现影响目标因素的关键因素。例如,可以根据关键因素对目标因素的因果效应对关键因素进行排名。
在一些实施例中,策略管理接口250可以提供策略选择/控制接口251,策略选择/控制接口251允许用户110输入对一个或多个因素的约束,诸如产品的销售量超过预期销售量的同时产品价格落入从5美元到9美元的范围内。然后,策略选择/控制接口251可以自动呈现满足这些约束的一个或多个控制策略,以及呈现这些控制策略的相应效应。
备选地或附加地,策略管理接口250还可以提供策略评估接口252,策略评估接口252允许用户110输入一个或多个策略以用于评估。例如,由用户110输入的策略可以指示影响目标因素的至少一个因素的值。然后,策略评估接口252可以呈现在这些策略被执行的情况下它们的相应效应,并且将允许用户110根据所呈现的效应来选择最佳策略。
应当理解,上述用户接口模块121中的每个接口可以与因果分析引擎122中的对应模块或单元交互。下面将参考图2C-2E来描述因果分析引擎122中的示例模块或单元。
图2C示出了根据本公开的一些实施例的示例因果分析引擎122的框图。如图2C所示,例如,因果分析引擎122可以包括数据处理模块260、因果结构发现模块270和因果分析模块280。应当理解,仅出于说明的目的示出了因果分析引擎122的模块,而不暗示对本公开的范围的任何限制。在一些实施例中,因果分析引擎122可以包括附加模块,和/或省略如图所示的一些模块。例如,在一些实施例中,可以省略数据处理模块260。
在一些实施例中,数据处理模块260可以从数据输入接口210接收观察数据(诸如,多个因素的观察样本),并且对所接收的观察数据执行数据预处理。数据处理模块260还可以从因果结构发现接口220接收信息,并且执行进一步的处理以优化要发现其因果结构的因素。下面将参考图2D来描述数据处理模块260中的示例功能单元。
图2D示出了根据本公开的一些实施例的示例数据处理模块260的框图。如图2D所示,例如,数据处理模块260可以包括以下至少一项:数据预处理单元261、因素工程单元262和因素收缩单元263。应当理解,仅出于说明的目的示出了数据处理模块260的单元,而不暗示对本公开的范围的任何限制。在一些实施例中,数据处理模块260可以包括附加单元,和/或省略如图所示一些单元。例如,在一些实施例中,可以省略因素工程单元262和/或因素收缩单元263。
在一些实施例中,经由数据输入接口210上传的数据(诸如,多个因素的观察样本)可以被提供给数据预处理单元261以用于数据预处理。在一些实施例中,数据预处理单元261可以提供数据清理功能,该数据清理功能可以处理和清理不在合理范围内的噪声数据(例如,年龄为200,价格折扣为1.2,等等)。在一些实施例中,数据预处理单元261可以提供若干种方法来填充数据中的缺失值,诸如使用平均值、附近值、预测值等来填充数据中的缺失值。在一些实施例中,数据预处理单元261可以提供数据过滤功能,该数据过滤功能可以自动去除缺失率超过由用户110设置的阈值的观察样本/变量。备选地或附加地,在一些实施例中,数据预处理单元261可以提供数据统计功能,该数据统计功能可以对所上传的数据执行统计,诸如计算每个可观察变量的最大值、最小值、均值或方差值,计算每个可观察变量的缺失率,等等。预处理后的数据也可以被存储在数据库(诸如,如图1A所示的数据库123或如图1B所示的数据库161)中以供后续使用。
在一些实施例中,因素工程单元262可以基于观察样本来分析多个因素的特征,并且将多个原始因素优化为一组新因素。这些新的因素可以反映原始因素的特征,诸如原始因素在一定时间段内或在一定维度上的变化率,以促进对因果关系/结构的发现。应当理解,在一些实施例中,可以省略因素工程单元262。
在一些实施例中,如上所述,因果结构发现接口220(诸如,目标因素选择接口221)可以允许用户110在多个因素中指定目标因素(诸如,顾客满意度、产品产量、软件故障率等)。因素收缩单元263可以从因果结构发现接口220接收目标因素的指示,并且使用某种分析技术从多个因素中删除不太可能是目标因素的原因的一个或多个因素,从而提高以下因果关系/结构发现的效率。应当理解,在一些实施例中,可以省略因素收缩单元263。
再次参考图2C,在一些实施例中,因果结构发现模块270可以从多个因素的观察样本中发现多个因素之间的因果关系/结构。下面将参考图2D描述因果结构发现模块270中的示例功能单元。
图2D示出了根据本公开的一些实施例的示例因果结构发现模块270的框图。如图2D所示,例如,因果结构发现模块270可以包括因果结构发现单元271和因果结构简化单元272中的至少一项。应当理解,仅出于说明的目的示出了因果结构发现模块270的单元,而不暗示对本公开的范围的任何限制。在一些实施例中,因果结构发现模块270可以包括附加单元,和/或省略如图所示一些单元。例如,在一些实施例中,可以省略因果结构简化单元272。
在一些实施例中,如上所述,因果结构发现接口220可以允许用户110从一组因果发现算法中选择要在因果关系的发现中使用的合适的因果发现算法。备选地或附加地,在一些实施例中,因果结构发现接口220还可以允许用户110调整所选择的因果发现算法的一些超参数,从而提高因果分析的速度和/或准确性。备选地或附加地,在一些实施例中,因果结构发现接口220还可以允许用户110输入关于多个因素之间的因果关系的专家知识,从而提高因果结构发现的速度和/或准确性。所选择的因果发现算法、调整后的超参数和/或专家知识的指示可以被提供给因果结构发现模块270。
在一些实施例中,因果结构发现模块270可以基于所选择的因果发现算法、调整后的超参数和/或专家知识来从多个因素的观察样本中发现多个因素之间的因果关系。因果结构发现模块270可以生成表示所发现的因果关系的因果结构。在一些实施例中,所生成的因果结构可以以不同的视觉形式呈现,诸如表格、因果图等。在一些实施例中,所生成的因果结构可以被呈现为因果图。例如,因果图可以包括与多个因素相对应的多个节点和连接多个节点的一个或多个因果边。在一些实施例中,如上所述,用户110可以经由因果结构发现接口220(诸如,因果结构简化接口225)来发起独立测试以优化所发现的因果结构。在一些实施例中,在这种情况下,因果结构简化单元272可以从因果结构简化接口225接收指示,并且应用独立的测试技术来优化所生成的因果图,诸如以从所生成的因果图中删除一些不合理的因果边。在一些实施例中,所生成和/或优化的因果图可以被提供给因果结构发现接口220用于呈现给用户110。另外,所生成和/或优化的因果图也可以被存储在数据库(诸如,如图1A所示的数据库123或如图1B所示的数据库161)中以供后续使用。
再次参考图2C,在一些实施例中,因果分析模块280可以基于经由因果结构评估接口230、因果图管理接口240和/或策略管理接口250的一个或多个用户输入来执行用于因果分析的动作。下面将参考图2E来描述因果分析模块280中的示例功能单元。
图2E示出了根据本公开的一些实施例的示例因果分析模块280的框图。如图2E所示,例如,因果分析模块280可以包括可以与因果结构评估接口230交互的因果结构评估单元281、可以与因果图管理接口240交互的图分析单元282以及可以与策略管理接口250交互的策略单元283。例如,图分析单元282可以包括因果路径搜索功能291、因果图编辑功能292、因素组合功能293和关键因素分析功能294。策略单元283可以包括策略控制/评估功能295和策略处方功能296。应当理解,仅出于说明的目的示出了因果分析模块280中的单元或功能,而不暗示对本公开的范围的任何限制。在一些实施例中,因果分析模块280可以包括附加的单元或功能,和/或省略如图所示的一些单元或功能。例如,在一些实施例中,可以省略因素组合功能293。
在一些实施例中,如上所述,因果结构评估接口230允许用户110在各种评估指标和/或评估方法学下发起对所发现的因果结构的评估,从而标识所发现的因果结构对多个因素的观察样本的拟合度。例如,评估指标/方法学选择接口231可以允许用户110选择要用于评估所发现的因果结构的评估指标和/或评估方法学。评估指标可以是绝对指标或相对指标。绝对指标的示例可以包括但不限于近似均方根误差(RMSEA)、标准均方根残差(SRMR)、贝叶斯信息标准(BIC)等。RMSEA与模型中的残差相关。RMSEA值的范围从0到1,其中较低的RMSEA值指示较好的模型拟合。例如,可接受的模型拟合度可以通过为0.05或更小的RMSEA值来指示。SRMR是基于拟合残差的整体拟合劣度度量。SRMR接近于零可以表示良好拟合。经验法则是,为了达到良好拟合,SRMR应当小于0.05,而小于0.10的值可以被解释为可接受的。BIC是考虑到数据拟合和模型稀疏性的平衡的得分。例如,具有最低BIC的模型是优选的。相对指标的示例可以包括但不限于比较拟合指数(CFI)、非范拟合指数(NNFI)或塔克尔勒威斯(Tucker-Lewis)指数(TLI)等。CFI等于针对样本大小而调整的差异函数。CFI的范围从0到1,其中较大的值指示较好的模型拟合。该指数的经验法则是,0.97表示相对于独立模型的良好拟合,而大于0.95的值可以被解释为可接受的拟合。NNFI或TLI(它们是相同的)值的范围从0到1,其中较大的值指示较好的模型拟合。该指数大于0.97表示相对于独立模型的良好拟合,而大于0.95的值可以被解释为可接受的拟合。
在一些实施例中,可以向因果结构评估单元281提供所选择的评估指标和/或评估方法学的指示。因果结构评估单元281可以在所选择的评估指标和/或评估方法学下评估所发现的因果结构,从而标识所发现的因果结构对多个因素的观察样本的拟合度。因果结构评估单元281可以将评估的结果提供给因果结构评估接口230以用于呈现给用户110。
在一些实施例中,包括因果路径搜索功能291、因果图编辑功能292、因素组合功能293和关键因素分析功能294中的至少一项的图分析单元282可以与因果图管理接口240交互。
如上所述,因果图管理接口240(诸如,因果路径搜索选择接口241)可以允许用户110从多个因素中选择任何两个因素,并且发起针对所选择的两个因素之间的因果路径的搜索。在一些实施例中,可以向因果路径搜索功能291提供所选择的因素的指示。因果路径搜索功能291可以在所发现的因果结构(诸如,因果图)中搜索所选择的两个因素之间的因果路径。因果路径搜索功能291可以将因果路径提供给因果图管理接口240以用于呈现给用户110。
如上所述,在一些实施例中,因果图管理接口240(诸如,因果图编辑接口242)可以允许用户110编辑所呈现的因果图以输入一些专家知识用于优化因果图。在一些实施例中,由用户110对因果图执行的编辑可以包括以下任一项:向因果图添加边以用于指示两个节点之间的直接因果关系;从因果图上去除现有边以用于指示两个节点之间没有直接因果关系;对因果图中的现有边进行重定向以用于重定向两个节点之间的因果关系;或者向因果图添加一个或多个标签以指示一些专家知识。由对因果图的编辑指示的专家知识可以与先前存储的专家知识进行比较。在一些实施例中,如果存在冲突,则可以经由因果图管理接口240(诸如,因果图编辑接口242)向用户110呈现该冲突的指示。在一些实施例中,如果不存在冲突,则由对因果图的编辑指示的专家知识可以被存储在数据库中以供后续使用。另外,由对因果图的编辑指示的专家知识可以被提供给图分析单元282(诸如,因果图编辑功能292)。
在一些实施例中,图分析单元282可以基于专家知识和多个因素的观察样本来重新发现多个因素之间的因果关系/结构,并且重新生成表示重新发现的因果关系的另外的因果结构(诸如,另外的因果图)。重新生成的因果结构可以整合专家知识并且反映对初始因果图执行的编辑。例如,重新生成的因果结构可以被提供给因果图管理接口240以用于呈现给用户110。另外,重新生成的因果结构/图也可以被存储在数据库(诸如,如图1A所示的数据库123或如图1B所示的数据库161)中以供后续使用。
如上所述,在一些实施例中,因果图管理接口240(诸如,因素组合选择接口243)可以允许用户110启用或禁用对所发现的因果图的因素组合操作。用于启用或禁用因素组合操作的指示可以被提供给图分析单元282(诸如,因素组合功能293)。因素组合功能293可以通过将所发现的因果图中的两个或更多个因素组合为一个因素来执行因素组合操作,从而优化或简化所发现的因果图。因素组合操作可以基于验证性因素分析(CFA)或探索性因素分析(EFA)来执行。经优化或简化的因果图可以被提供给因果图管理接口240以用于呈现给用户110。另外,经优化或简化的因果结构/图也可以被存储在数据库(诸如,如图1A所示的数据库123或如图1B所示的数据库161)中以供后续使用。
如上所述,在一些实施例中,因果图管理接口240(诸如,关键因素分析接口244)可以允许用户110选择目标因素并且输入要检索的影响目标因素的关键因素的数目。目标因素以及关键因素的数目可以被指示给图分析单元282(诸如,关键因素分析功能294)。在一些实施例中,关键因素分析功能294可以在因果图中搜索影响目标因素的那些因素。可以为每个因素分配得分以反映其对目标因素的重要性。关键因素分析功能294可以将关键因素及其对目标因素的因果效应提供给因果图管理接口240以用于呈现给用户110。例如,在一些实施例中,因果图管理接口240可以在因果图上突出显示与关键因素相对应的一个或多个节点。备选地或附加地,因果图管理接口240还可以呈现关键因素的重要性的视觉表示(诸如,文本、数字、进度条、饼图、条形图等)。
在一些实施例中,包括策略控制/评估功能295和策略处方功能296的策略单元283可以与策略管理接口250交互。
如上所述,在一些实施例中,策略管理接口250(诸如,策略选择/控制接口251)可以允许用户110输入对一个或多个因素的约束,诸如产品的销售量超过预期销售量的同时产品价格落入从5美元到9美元的范围内。对一个或多个因素的约束可以被提供给策略单元283(诸如,策略处方功能296)。在一些实施例中,策略处方功能296可以基于因果图来确定满足约束的一个或多个策略。在一些实施例中,如果策略处方功能296不能找到满足所有约束的策略,则策略处方功能296可以尝试找到能够满足至少一部分约束的一个或多个策略。在一些实施例中,策略处方功能296可以找到能够使目标因素的预测值(诸如,产品的销售量)接近预期销售量(诸如,产品的预测销售量与预期销售量之间的差值低于阈值)的一个或多个策略。策略处方功能296可以将所确定的一个或多个策略以及这些策略的相应效应提供给策略管理接口250以用于呈现给用户110。策略管理接口250可以允许用户110根据所呈现的效应来选择最佳策略。
如上所述,在一些实施例中,策略管理接口250(诸如,策略评估接口252)可以允许用户110输入一个或多个策略以用于评估。例如,由用户110输入的策略可以指示影响目标因素的至少一个因素的值。所输入的策略可以被提供给策略单元283(诸如,策略控制/评估功能295)。在一些实施例中,策略控制/评估功能295可以执行模拟,以基于因果图和由该策略指示的至少一个因素的值来预测目标因素的值。策略控制/评估功能295可以将目标因素的预测值提供给策略管理接口250以用于呈现给用户110。以这种方式,用户110可以预见在策略被执行的情况下该策略的效应。
在图3中总结了用户接口模块121与因果分析引擎122之间的交互。如图3所示并且如上面参考图2B-2E所述,数据输入接口210可以与数据处理模块260交互。因果结构发现接口220可以与数据处理模块260和/或因果结构发现模块270交互。由数据处理模块260处理的观察数据可以被提供给因果结构发现模块270。由因果结构发现模块270发现的因果结构可以被提供给因果分析模块280,因果分析模块280包括因果结构评估单元281、图分析单元282和策略单元283。如图3所示并且如上面参考图2B-2E所述,因果结构评估接口230可以与因果分析模块280中的因果结构评估单元281交互。因果图管理接口240可以与因果分析模块280中的图分析单元282交互。策略管理接口250可以与因果分析模块280中的策略单元283交互。
在一些实施例中,因果分析引擎122还可以包括显示控制模块(未在图中示出)。显示控制模块可以响应于用户110的操作而控制所发现的因果结构(诸如,因果图)的显示。显示控制模块可以被配置为执行以下动作中的至少一项:(1)通过改变因素的大小和颜色中的至少一项来指示因素对目标因素的因果重要性;(2)通过改变与因素相关联的边(或箭头)的粗细和颜色中的至少一项来指示相关因素之间的因果重要性;(3)通过改变因果图中的目标因素的形状来指示目标因素是否被选择;(4)呈现图表,其中具有较高总体重要性的因素被排在具有较低总体重要性的另一因素之上;(5)将因素重新定位在特定形状(例如,圆形)中以示出因素之间的因果关系的密度;(6)根据因果重要性对因果图中的因素置乱以示出因素之间具有较短边(或箭头)的简化图;(7)当用户110选择因素的名称时,利用动画(例如,闪烁)来指示因素;(8)响应于用户110的预定操作(例如,选择因素并且保持按压该因素一段时间),在隐藏其他因素的同时指示与所选择的因素具有直接因果关系的因素以及表示直接因果关系的边(或箭头);(9)响应于用户110通过拖放移动一个或多个因素,使表示因果关系的边(或箭头)保持连接并且移动这些边(或箭头);(10)响应于用户110选择因素并且在该因素上停留一段时间来指示对因素的描述;(11)控制因果图上与边(或箭头)相关联的因果重要性的示出和隐藏;(12)根据与边(或箭头)相关联的相应因果重要性来控制因果图上至少一些边(或箭头)的示出和隐藏;等等。应当理解,对应的操作接口可以被包括在用户接口模块121中。该操作接口可以由用户使用以触发以上动作中的至少一个动作的执行。
图4示出了根据本公开的一些实施例的示例方法400。方法400可以由如图2A所示的因果分析系统200来实现。在一些实施例中,例如,方法400可以在如图1A所示的因果分析服务器120处实现。备选地,在一些实施例中,例如,方法400可以在如图1B所示的用户设备140和因果分析服务器160处实现。应当理解,方法400可以包括未示出的附加框,和/或可以省略一些示出的框,并且本公开的范围不限于此。
在框410处,从多个因素的观察样本中确定指示多个因素之间的第一因果关系的第一因果结构,每个观察样本包括多个因素的一组观察值。
在一些实施例中,如上所述,用户110或数据收集设备130可以经由数据输入接口210(诸如,数据上传接口211)上传多个因素的观察样本。例如,每个观察样本可以包括多个因素的一组观察值。在一些实施例中,所上传的多个因素的观察样本可以由数据处理模块260(诸如,数据预处理单元261、因素工程单元262和因素收缩单元263中的一个或多个)来处理。因果结构发现模块270(诸如,因果结构发现单元271)可以从多个因素的观察样本中确定指示多个因素之间的第一因果关系的第一因果结构。
在一些实施例中,如上所述,因果结构发现接口220可以允许用户110从一组因果发现算法中选择要在因果关系的发现中使用的合适的因果发现算法。备选地或附加地,因果结构发现接口220还可以允许用户110调整所选择的因果发现算法的一些超参数,从而提高因果分析的速度和/或准确性。备选地或附加地,因果结构发现接口220还可以允许用户110输入关于多个因素之间的因果关系的专家知识,从而提高因果结构发现的速度和/或准确性。在一些实施例中,因果结构发现模块270(诸如,因果结构发现单元271)可以基于所选择的因果发现算法、调整后的超参数和/或专家知识来从多个因素的观察样本中发现多个因素之间的第一因果关系。
在一些实施例中,如上所述,用户110可以经由因果结构发现接口220(诸如,因果结构简化接口225)发起独立测试以优化所发现的因果结构。在一些实施例中,因果结构发现模块270(诸如,因果结构简化单元272)可以从因果结构简化接口225接收指示,并且应用独立测试技术以优化或简化所生成的因果结构,诸如以从所生成的因果结构中删除一些不合理的因果关系。
在框420处,向用户110呈现第一因果结构。所生成的因果结构可以以不同的视觉形式(诸如,表格、因果图等)来呈现。在一些实施例中,第一因果结构可以被呈现为因果图。例如,因果图可以包括与多个因素相对应的多个节点和连接多个节点的一个或多个因果边。在下文中,短语“因果结构”、“因果图”和“因果关系”可以互换使用。应当理解,仅出于说明的目的示出了这一点,而不暗示对本公开的范围的任何限制。
图5A示出了根据本公开的一些实施例的示例因果图510。如图5A所示,因果图510包括与多个因素相对应的多个节点501、502……506。出于描述的目的,在下文中,节点501也可以称为“因素501”;节点502也可以称为“因素502”……节点506也可以称为“因素506”。应当理解,因果图510中的因素的数目仅出于说明的目的来提供,而不暗示对本公开的范围的任何限制。根据本公开的实施例的因果图可以包括任何合适数目的节点或因素。还应当理解,在不同的领域,因素501、502……或506可以具有不同的含义。例如,在市场研究领域,因素501、502……或506可以包括以下任一项:客户级别、客户电话号码、每月消耗的流量、免费流量的比率、每月消耗的流量的总费用、投诉次数、客户满意度等。在软件开发领域,因素501、502……或506可以包括以下任一项:用于软件开发的人力资源量、用于软件开发的持续时间、函数数目、代码行数目、用于软件开发的编程语言、软件故障率等。
如图5A所示,因果图510还包括连接多个节点501、502……506的多个因果边511、512……516。例如,从节点501指向节点503的边511可以指示因素501是因素503的直接原因;从节点502指向节点503的边512可以指示因素502是因素503的直接原因……从节点505指向节点506的边516可以指示因素505是导致506的直接原因。在一些实施例中,因果图510中的因果边可以具有不同的颜色。例如,如果边511具有第一颜色(诸如,红色),则表示因素503的值可以随着因素501的值的增加而增加。如果边511具有与第一颜色不同的第二颜色(诸如,蓝色),则表示因素503的值可以随着因素501的值的增加而减小。
在框430处,确定是否从用户110接收到关于第一因果结构的至少一个用户输入。响应于接收到至少一个用户输入,在框440处,基于第一因果结构来执行与至少一个用户输入相关联的动作。然后,在框450处,向用户110呈现动作的执行的结果。
在一些实施例中,至少一个用户输入可以包括由用户110对第一因果结构(诸如,因果图)执行的编辑操作。如上所述,例如,因果图管理接口143可以允许用户110编辑所呈现的因果结构(诸如,因果图)以输入一些先验知识用于优化所发现的因果结构。在一些实施例中,由用户110对因果图执行的编辑可以包括以下任一项:向因果图添加边以用于指示两个节点之间的直接因果关系;从因果图上去除现有边以用于指示两个节点之间没有直接因果关系;对因果图中的现有边进行重定向以用于重定向两个节点之间的因果关系;以及向因果图添加一个或多个标签以用于指示一些先验知识。
在一些实施例中,多个节点可以包括与多个因素中的第一因素相对应的第一节点(诸如,图5A中的节点501)和与多个因素中的第二因素相对应的第二节点(诸如,图5A中的节点503),并且至少一个边可以包括从第一节点指向第二节点以用于指示第一因素是第二因素的直接原因的第一边(诸如,图5A中的边511)。在一些实施例中,由用户110对因果图执行的编辑操作可以包括从因果图上去除第一边,以指示第一因素不是第二因素的直接原因。备选地或附加地,在一些实施例中,由用户110对因果图执行的编辑操作可以包括将第一边重定向为从第二节点指向第一节点(诸如,将边511重定向为从节点503指向节点501),以指示第二因素是第一因素的直接原因。
备选地或附加地,在一些实施例中,多个节点可以包括与多个因素中的第三因素相对应的第三节点(诸如,图5A中的节点502)和与多个因素中的第四因素相对应的第四节点(诸如,图5A中的节点506)。在一些实施例中,由用户110对因果图执行的编辑操作可以包括向因果图添加从第三节点指向第四节点的第二边,以指示第三因素是第四因素的直接原因。备选地或附加地,在一些实施例中,由用户110对因果图执行的编辑操作可以包括向因果图添加与第三节点和第四节点相关联的第一标签,以指示第三因素是第四因素的间接原因。
备选地或附加地,在一些实施例中,多个节点包括与多个因素中的第一组因素相对应的第一组节点和与多个因素中的第二组因素相对应的第二组节点。在一些实施例中,由用户110对因果图执行的编辑操作可以包括向因果图添加与第一组节点和第二组节点相关联的第二标签,以指示第一组因素不是第二组因素的原因。
在一些实施例中,响应于用户110执行编辑操作,可以从编辑操作中确定用于优化第一因果结构的先验信息。与第一因果关系不同的多个因素之间的第二因果关系可以基于该信息和多个因素的观察样本来确定。然后,可以向用户110呈现表示第二因果关系的第二因果结构。例如,第二因果结构可以整合先验信息并且反映对第一因果结构执行的编辑。
在一些实施例中,至少一个用户输入可以包括第一请求,第一请求用以从多个因素中检索影响目标因素的第一数目的因素。例如,第一请求可以向因果分析系统200指示目标因素和第一数目(即,要检索的关键因素的数目)。如上所述,例如,因果图管理接口240(诸如,关键因素分析接口244)可以允许用户110选择目标因素并且输入要检索的影响目标因素的关键因素的数目。在一些实施例中,响应于接收到第一请求,因果图管理接口240(诸如,关键因素分析接口244)可以从第一请求中确定目标因素和第一数目(即,要检索的关键因素的数目)。目标因素以及关键因素的数目可以被指示给图分析单元282(诸如,关键因素分析功能294)。
在一些实施例中,图分析单元282(诸如,关键因素分析功能294)可以基于第一因果结构从多个因素中确定影响目标因素的至少一个因素。例如,至少一个因素可以包括作为目标因素的直接原因或间接原因的因素。图分析单元282(诸如,关键因素分析功能294)可以基于观察样本和第一因果结构来估计至少一个因素对目标因素的相应因果效应。图分析单元282(诸如,关键因素分析功能294)可以基于所估计的因果效应对至少一个因素进行排名(例如,从高到低),并且基于排名的结果来选择第一数目的关键因素(其具有对目标因素的最大因果效应)。
在一些实施例中,第一数目的因素可以对应于因果图中的多个节点中的第一数目的节点。因果图管理接口240可以突出显示因果图中的第一数目的节点。备选地或附加地,因果图管理接口240可以向用户110呈现指示第一数目的因素对目标因素的因果效应的视觉表示。
图5B示出了根据本公开的一些实施例的示例因果图510,因果图510示出了影响目标因素的关键因素。如图5B所示,在因果图510上突出显示了对目标因素506具有最大效应的两个关键因素503和505。特别地,节点505被示出为大于节点503,这表明因素505对目标因素506的因果效应(即,因素505的重要性)超过因素503对目标因素506的因果效应(即,因素503的重要性)。备选地,在一些实施例中,可以使用其他视觉表示(诸如,文本、数字、进度条、饼图、条形图等)来示出关键因素对目标因素的相应因果效应。
在一些实施例中,至少一个用户输入可以包括第二请求,第二请求用以获取使得多个因素中的目标因素能够达到期望值的策略。例如,第二请求可以向因果分析系统200指示目标因素和目标因素的期望值。如上所述,例如,策略管理接口250(诸如,策略选择/控制接口251)可以允许用户110输入对一个或多个因素的约束,诸如产品的销售量超过预期销售量的同时产品价格落入从5美元到9美元的范围内。在一些实施例中,响应于接收到第二请求,策略管理接口250(诸如,策略选择/控制接口251)可以从第二请求中确定目标因素和目标因素的期望值。目标因素和目标因素的期望值可以被指示给策略单元283(诸如,策略处方功能296)。
在一些实施例中,策略处方功能296可以基于因果图来确定满足约束的一个或多个策略。在一些实施例中,如果策略处方功能296不能找到满足所有约束的策略,则策略处方功能296可以尝试找到能够满足至少一部分约束的一个或多个策略。在一些实施例中,策略处方功能296可以找到能够使目标因素的预测值(诸如,产品的销售量)接近预期销售量(诸如,产品的预测销售量与预期销售量之间的差值低于阈值)的一个或多个策略。策略处方功能296可以将所确定的一个或多个策略以及相应的效应(诸如,在这些策略被执行的情况下目标因素的预测值)提供给策略管理接口250以用于呈现给用户110。管理接口250可以允许用户110根据所呈现的效应来选择最佳策略。
在一些实施例中,至少一个用户输入可以包括第三请求,第三请求用以发起对关于多个因素中的目标因素的策略的评估。例如,第三请求可以向因果分析系统200指示目标因素。在一些实施例中,第三请求可以由策略管理接口250(诸如,策略评估接口252)接收。在一些实施例中,响应于接收到第三请求,策略管理接口250(诸如,策略评估接口252)可以从第三请求中确定目标因素。策略管理接口250(诸如,策略评估接口252)可以将目标因素的指示提供给策略单元283(诸如,策略控制/评估功能295)。
在一些实施例中,策略控制/评估功能295可以基于第一因果结构从多个因素中确定影响目标因素的至少一个因素,并且基于目标因素和至少一个因素来生成第一因果结构的子结构。在一些实施例中,例如,子结构可以被表示为因果图的子图,该子图可以包括与目标因素和至少一个因素相对应的一组节点以及连接该组节点的一个或多个边。在一些实施例中,策略控制/评估功能295可以将第一因果结构的子结构(诸如,子图)提供给策略管理接口250(诸如,策略评估接口252)以用于呈现给用户110,使得用户110能够基于所呈现的子结构来输入一个或多个策略以用于评估。
图5C示出了根据本公开的一些实施例的因果图510的示例子图520。如图5C所示,从用户110接收的用于发起对策略的评估的第三请求可以指示目标因素是因素506。在一些实施例中,第三请求还可以指示要在子图中示出的关于至少一个因素的一些附加信息。例如,第三请求还可以指示从至少一个因素中的每个因素到目标因素的距离(即,因果边的数目)应当低于阈值(例如,在图5C中为2)。如图5C所示,所确定的影响目标因素的至少一个因素包括三个因素503、504和505。可以看出,从三个节点503、504和505中的每个节点到节点506的距离小于2。特别地,图5C还示出了三个因素503、504和505以及目标因素506的相应值。例如,因素503、504、505和506的值分别被示出为“50.03”、“50.01”、“50.05”和“50.08”。以这种方式,用户110可以编辑节点503、504和505中的一个或多个节点的值以输入影响目标因素506的控制策略以用于评估。
在一些实施例中,策略管理接口250(诸如,策略评估接口252)还可以从用户110接收策略以用于评估,该策略是基于所呈现的子结构(诸如,子图520)而输入的。如上所述,例如,策略管理接口250(诸如,策略评估接口252)可以允许用户110输入一个或多个策略以用于评估。例如,由用户110输入的策略可以指示影响目标因素的至少一个因素的值。所输入的策略可以被提供给策略单元283(诸如,策略控制/评估功能295)。在一些实施例中,策略控制/评估功能295可以执行模拟以基于因果图和由该策略指示的至少一个因素的值来预测目标因素的值。策略控制/评估功能295可以将目标因素的预测值提供给策略管理接口250以作为策略评估的结果呈现给用户110。以这种方式,用户110可以预见在策略被执行的情况下该策略的效应。
图5D和5E示出了根据本公开的一些实施例的对用于影响目标因素的不同策略的评估的示例。如图5D所示,例如,用户110可以将因素503的值从如图5C所示的“50.03”改变为“80”。策略控制/评估功能295可以基于因果关系来预测受因素503影响的因素504、505和506的值。例如,因素504的预测值为“53.04”,这不同于其如图5C所示的原始值“50.01”。因素505的预测值为“70.89”,这不同于其如图5C所示的原始值“50.05”。目标因素506的预测值为“65.62”,这不同于其如图5C所示的原始值“50.08”。预测值可以作为评估的结果呈现给用户110。如图5E所示,例如,用户110还可以将因素504的值从如图5D所示的“53.04”改变为“70”。策略控制/评估功能295可以基于因果关系来预测受因素504影响的因素506的值。例如,因素506的预测值为“70.79”,这不同于如图5D所示的“65.62”。特别地,由于因素504的值由用户110控制,因此因素504不再受到因素504的影响。因此,如图5E所示,指示因素503是因素504的直接原因的因果边513从因果图520中被去除。
图6示出了根据本公开的一些实施例的用于定位影响目标因素的关键因素的示例方法600。方法600可以在如图1A-1B、2A和/或2C所示的因果分析引擎122处实现。例如,在一些实施例中,方法600可以由因果分析引擎122中的因果分析模块280的关键因素分析功能294实现。
在框610处,因果分析引擎122可以获取多个因素的观察样本和指示多个因素之间的因果关系的因果结构。在一些实施例中,多个因素的观察样本可以经由用户接口模块121来接收并且被存储在数据库(诸如,如图1A所示的数据库123或如图1B所示的数据库161)中。因果结构可以由因果分析引擎122(诸如,因果结构发现模块270)发现并且存储在数据库中。也就是说,因果分析引擎122可以从数据库中获取多个因素的观察样本和因果结构。备选地,在一些实施例中,因果分析引擎122可以从用户接口模块121获取多个因素的观察样本,并且通过从观察样本中发现因果结构来获取因果结构。
在框620处,响应于在多个因素中标识出目标因素,因果分析引擎122可以基于因果结构来从多个因素中确定影响目标因素的至少一个因素。
在框630处,因果分析引擎122可以针对至少一个因素中的每个因素基于观察样本和因果结构来估计该因素对目标因素的总体因果效应。如本文中使用的,“总体因果效应”可以是指因素对目标因素的直接因果效应和间接因果效应的总和。在一些实施例中,因果分析引擎122可以基于因果效应估计算法来估计因素对目标因素的总体因果效应。应当理解,因果效应估计算法可以是当前已知或将来要开发的任何估计算法或估计器。
在一些实施例中,因果分析引擎122可以从因果结构中确定因素与目标因素之间的一个或多个因果路径。因果分析引擎122还可以针对一个或多个因果路径中的每个因果路径来估计因素对目标因素的因果效应。然后,因果分析引擎122可以将针对一个或多个因果路径的因果效应之和确定为因素对目标因素的总体因果效应。
图7示出了根据本公开的一些实施例的确定原因因素对目标因素的总体因果效应的示例。如图7所示,因果结构700可以包括因素701、702……706。因素705被标识为目标因素。假设要确定因素702对目标因素705的总体因果效应。因果分析引擎122可以首先标识因素702与目标因素705之间的因果路径。例如,因素702与目标因素705之间的因果路径包括:(1)因素702→因素705;(2)因素702→因素706→因素705;(3)因素702→因素701→因素706→因素705;(4)因素702→因素703→因素704→因素705。因果分析引擎122可以针对上述四个因果路径来估计因素702对目标因素705的相应因果效应。然后,因果分析引擎122可以将所估计的因果效应相加以得出因素702对目标因素705的总体因果效应。
再次参考图6,在框640处,因果分析引擎122可以基于所估计的至少一个因素对目标因素的总体因果效应来对至少一个因素进行排名,以获取影响目标因素的关键因素的序列。
在一些实施例中,原因因素对目标因素的总体因果效应可以被估计为正值或负值。例如,正值可以指示目标因素的观察值可以随着原因因素的值增加而增加,而负值可以指示目标因素的观察值可以随着原因因素的值增加而减小。
在一些实施例中,因果分析引擎122可以确定至少一个因素对目标因素的总体因果效应的相应绝对值,并且然后基于所确定的绝对值对至少一个因素进行排名。
根据本公开的一些实施例的用于因果分析的通用过程800可以被总结在图8中。如图8所示,通用过程800可以包括用于数据收集的一个或多个动作810(诸如,观察样本的收集)、用于数据输入的一个或多个动作820(诸如,上传观察样本)、用于数据处理的一个或多个动作830(诸如,数据预处理、因素工程和/或因素收缩)、用于因果关系/结构发现的一个或多个动作840、用于输出所发现的因果关系/结构的一个或多个动作850、用于因果分析的一个或多个动作860、以及用于执行策略的一个或多个动作870。过程800可以被执行多于一次。应当理解,过程800可以包括未示出的附加动作,和/或可以省略一些示出的动作。还应当理解,过程800可以由单个物理设备或由多个物理设备实现。本公开的范围在此不受限制。
鉴于以上内容,可以看出,本公开的实施例实现对多个因素之间的因果关系的自动发现。可以向用户呈现表示该因果关系的因果结构。用户可以调整该因果结构以输入一些先验知识,从而优化所发现的因果关系。可以在多个因素中定位影响目标因素的关键因素。此外,本公开的实施例可以评估由用户输入的用于影响目标因素的策略的效应。本公开的实施例还可以向用户推荐一个或多个最佳策略。
图9示出了能够用于实现本公开的实施例的设备900的示意性框图。例如,如图1A所示的因果分析服务器120、如图1B所示的用户设备140或因果分析服务器160、和/或如图1A-1B、2A和/或2C所示的因果分析引擎122可以由设备900实现。如图9所示,设备900包括中央处理单元(CPU)901,CPU 901可以基于存储在只读存储器(ROM)902中的计算机程序指令或从存储单元908上传到随机存取存储器(RAM)903的计算机程序指令来执行各种适当的动作和处理。在RAM 903中,还存储有设备900的操作所需要的各种程序和数据。CPU 901、ROM902和RAM 903经由总线904彼此连接。输入/输出(I/O)接口905也被连接到总线904。
设备900中的以下组件被连接到I/O接口905:输入单元906,诸如键盘、鼠标等;输出单元907,诸如各种类型的显示器和扬声器;存储单元908,诸如磁盘和光盘;通信单元909,诸如网卡、调制解调器、无线通信收发器。通信单元909允许设备900经由诸如互联网和/或电信网络的计算机网络与其他设备交换数据/信息。
诸如方法400、600和/或过程800的上述方法或过程可以由处理单元901执行。例如,在一些实现中,方法400、600和/或过程800可以被实现为计算机软件程序,其被有形地包含在诸如存储单元908的机器可读介质中。在一些实现中,计算机程序可以通过ROM 902和/或通信单元909被部分或全部加载和/或安装在设备900上。当计算机程序被上传到RAM903并且由CPU 901执行时,可以执行上述方法200的一个或多个步骤。
本公开可以是系统、装置、设备、方法和/或计算机程序产品。该计算机程序产品可以包括计算机可读存储介质,其上具有用于引起处理器执行本公开的各方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是——但不限于——电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
本文中描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
本文中参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图的每个框以及流程图和/或框图中的框的组合可以通过计算机可读程序指令来实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个框中规定的功能/动作。
流程图和框图示出了根据本公开的各种实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这点上,流程图或框图中的每个框可以表示模块、代码段或代码部分,其包括用于实现所指定的逻辑功能的一个或多个可执行指令。在一些备选实现中,在框中标注的功能可以不按图中标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。还应当注意,框图和/或流程图中的每个框以及框图和/或流程图中的框的组合可以由执行指定功能或动作的基于专用硬件的系统、或专用硬件和计算机指令的组合来实现。
本公开的各种实施例的描述已经出于说明的目的被呈现,而非旨在是穷举的或限于所公开的实施例。在不偏离所描述的实施例的范围和精神的情况下,很多修改和变化对于本领域普通技术人员将是明显的。选择本文中使用的术语以最好地解释实施例的原理、实际应用或对市场上发现的技术的技术改进,或者使得本领域其他普通技术人员能够理解本文中公开的实施例。
Claims (38)
1.一种计算机实现的方法,包括:
从多个因素的观察样本中确定指示所述多个因素之间的第一因果关系的第一因果结构,每个观察样本包括所述多个因素的一组观察值;
向用户呈现所述第一因果结构;
响应于从所述用户接收到关于所述第一因果结构的至少一个用户输入,基于所述第一因果结构来执行与所述至少一个用户输入相关联的动作;以及
向所述用户呈现所述动作的所述执行的结果。
2.根据权利要求1所述的方法,其中所述至少一个用户输入包括对所述第一因果结构执行的编辑操作,并且其中执行所述动作包括:
从所述编辑操作中确定用于优化所述第一因果结构的信息;以及
基于所述信息和所述多个因素的所述观察样本,确定指示所述多个因素之间的第二因果关系的第二因果结构,所述第二因果结构不同于所述第一因果结构。
3.根据权利要求2所述的方法,其中向所述用户呈现所述结果包括:
向所述用户呈现所述第二因果结构,所述第二因果结构反映对所述第一因果结构执行的所述编辑操作。
4.根据权利要求2所述的方法,其中所述第一因果结构被呈现为因果图,所述因果图包括与所述多个因素相对应的多个节点和连接所述多个节点的至少一个边,所述至少一个边指示所述多个因素之间的所述第一因果关系,并且
其中所述编辑操作包括以下之一:
向所述因果图添加用于连接所述多个节点中的两个节点的边,以指示所述两个节点之间的直接因果关系;
从所述因果图去除连接所述多个节点中的两个节点的边,以指示所述两个节点之间没有直接因果关系;
对连接所述多个节点中的两个节点的边进行重定向,以重定向所述两个节点之间的因果关系;或者
向所述因果图添加一个或多个标签,以指示关于所述多个节点之间的因果关系的先验知识。
5.根据权利要求1所述的方法,其中所述至少一个用户输入包括第一请求,所述第一请求用以从所述多个因素中检索影响目标因素的第一数目的关键因素,并且其中执行所述动作包括:
响应于接收到所述第一请求,从所述第一请求中确定所述目标因素和所述第一数目;
基于所述第一因果结构从所述多个因素中确定影响所述目标因素的至少一个因素;
基于所述观察样本和所述第一因果结构,估计所述至少一个因素对所述目标因素的相应因果效应;
基于估计的所述因果效应对所述至少一个因素进行排名;以及
基于所述排名的结果从所述至少一个因素中选择所述第一数目的关键因素。
6.根据权利要求5所述的方法,其中向所述用户呈现所述结果包括:
向所述用户呈现所述第一数目的因素。
7.根据权利要求6所述的方法,其中向所述用户呈现所述结果还包括:
向所述用户呈现所述第一数目的因素对所述目标因素的因果效应。
8.根据权利要求1所述的方法,其中所述至少一个用户输入包括第二请求,所述第二请求用以获取使得所述多个因素中的目标因素能够达到期望值的策略,并且其中执行所述动作包括:
响应于接收到所述第二请求,从所述第二请求中确定所述目标因素和所述目标因素的所述期望值;以及
基于所述第一因果结构和所述目标因素的所述期望值,生成用于配置所述多个因素中的至少一个因素的策略,
其中所述策略指示所述至少一个因素的值,使得基于所述至少一个因素的所述值而预测的所述目标因素的值与所述目标因素的所述期望值之间的差低于阈值。
9.根据权利要求8所述的方法,其中向所述用户呈现所述结果包括:
向所述用户呈现所述策略和/或经预测的所述目标因素的所述值。
10.根据权利要求1所述的方法,其中所述至少一个用户输入包括第三请求,所述第三请求用以发起对用于影响所述多个因素中的目标因素的策略的评估,并且其中执行所述动作包括:
响应于接收到所述第三请求,从所述第三请求中确定所述目标因素;
基于所述第一因果结构从所述多个因素中确定影响所述目标因素的至少一个因素;
基于所述目标因素和所述至少一个因素,生成所述第一因果结构的子结构。
11.根据权利要求10所述的方法,其中向所述用户呈现所述结果包括:
向所述用户呈现所述第一因果结构的所述子结构,以使得所述用户能够基于所述子结构来输入关于所述目标因素的策略以用于评估。
12.根据权利要求11所述的方法,其中所述至少一个用户输入还包括由所述用户基于所述子结构而输入以用于评估的策略,所述策略指示所述至少一个因素的值,并且其中执行所述动作还包括:
基于所述第一因果结构和所述至少一个因素的所述值,预测所述目标因素的值。
13.根据权利要求12所述的方法,其中向所述用户呈现所述结果还包括:
向所述用户呈现经预测的所述目标因素的所述值作为对所述策略的所述评估的结果。
14.一种计算机实现的方法,包括:
获取多个因素的观察样本和指示所述多个因素之间的因果关系的因果结构,每个观察样本包括所述多个因素的一组观察值;
响应于在所述多个因素中标识出目标因素,基于所述因果结构从所述多个因素中确定影响所述目标因素的至少一个因素;
针对所述至少一个因素中的每个因素,基于所述观察样本和所述因果结构来估计所述因素对所述目标因素的总体因果效应;以及
基于所述至少一个因素对所述目标因素的相应总体因果效应对所述至少一个因素进行排名。
15.根据权利要求14所述的方法,其中获取所述因果结构包括:
从所述观察样本中确定所述因果结构。
16.根据权利要求14所述的方法,其中估计所述因素对所述目标因素的所述总体因果效应包括:
基于因果效应估计算法来估计所述因素对所述目标因素的所述总体因果效应。
17.根据权利要求14所述的方法,其中估计所述因素对所述目标因素的所述总体因果效应包括:
从所述因果结构中确定所述因素与所述目标因素之间的一个或多个因果路径;
针对所述一个或多个因果路径中的每个因果路径,估计所述因素对所述目标因素的因果效应;以及
将针对所述一个或多个因果路径的因果效应之和确定为所述因素对所述目标因素的所述总体因果效应。
18.根据权利要求14所述的方法,其中所述因素对所述目标因素的所述总体因果效应被估计为正值或负值,并且其中对所述至少一个因素进行排名包括:
确定所述至少一个因素对所述目标因素的所述总体因果效应的相应绝对值;以及
基于确定的所述绝对值对所述至少一个因素进行排名。
19.一种系统,包括:
处理单元;以及
存储器,耦合到所述处理单元并且在其上存储指令,所述指令在由所述处理单元执行时执行动作,所述动作包括:
从多个因素的观察样本中确定指示所述多个因素之间的第一因果关系的第一因果结构,每个观察样本包括所述多个因素的一组观察值;
向用户呈现所述第一因果结构;
响应于从所述用户接收到关于所述第一因果结构的至少一个用户输入,基于所述第一因果结构来执行与所述至少一个用户输入相关联的动作;以及
向所述用户呈现所述动作的所述执行的结果。
20.根据权利要求19所述的系统,其中所述至少一个用户输入包括对所述第一因果结构执行的编辑操作,并且其中执行所述动作包括:
从所述编辑操作中确定用于优化所述第一因果结构的信息;以及
基于所述信息和所述多个因素的所述观察样本,确定指示所述多个因素之间的第二因果关系的第二因果结构,所述第二因果结构不同于所述第一因果结构。
21.根据权利要求20所述的系统,其中向所述用户呈现所述结果包括:
向所述用户呈现所述第二因果结构,所述第二因果结构反映对所述第一因果结构执行的所述编辑操作。
22.根据权利要求20所述的系统,其中所述第一因果结构被呈现为因果图,所述因果图包括与所述多个因素相对应的多个节点和连接所述多个节点的至少一个边,所述至少一个边指示所述多个因素之间的所述第一因果关系,并且
其中所述编辑操作包括以下之一:
向所述因果图添加用于连接所述多个节点中的两个节点的边,以指示所述两个节点之间的直接因果关系;
从所述因果图去除连接所述多个节点中的两个节点的边,以指示所述两个节点之间没有直接因果关系;
对连接所述多个节点中的两个节点的边进行重定向,以重定向所述两个节点之间的因果关系;或者
向所述因果图添加一个或多个标签,以指示关于所述多个节点之间的因果关系的先验知识。
23.根据权利要求19所述的系统,其中所述至少一个用户输入包括第一请求,所述第一请求用以从所述多个因素中检索影响目标因素的第一数目的关键因素,并且其中执行所述动作包括:
响应于接收到所述第一请求,从所述第一请求中确定所述目标因素和所述第一数目;
基于所述第一因果结构从所述多个因素中确定影响所述目标因素的至少一个因素;
基于所述观察样本和所述第一因果结构,估计所述至少一个因素对所述目标因素的相应因果效应;
基于估计的所述因果效应对所述至少一个因素进行排名;以及
基于所述排名的结果从所述至少一个因素中选择所述第一数目的关键因素。
24.根据权利要求23所述的系统,其中向所述用户呈现所述结果包括:
向所述用户呈现所述第一数目的因素。
25.根据权利要求24所述的系统,其中向所述用户呈现所述结果还包括:
向所述用户呈现所述第一数目的因素对所述目标因素的因果效应。
26.根据权利要求19所述的系统,其中所述至少一个用户输入包括第二请求,所述第二请求用以获取使得所述多个因素中的目标因素能够达到期望值的策略,并且其中执行所述动作包括:
响应于接收到所述第二请求,从所述第二请求中确定所述目标因素和所述目标因素的所述期望值;以及
基于所述第一因果结构和所述目标因素的所述期望值,生成用于配置所述多个因素中的至少一个因素的策略,
其中所述策略指示所述至少一个因素的值,使得基于所述至少一个因素的所述值而预测的所述目标因素的值与所述目标因素的所述期望值之间的差低于阈值。
27.根据权利要求26所述的系统,其中向所述用户呈现所述结果包括:
向所述用户呈现所述策略和/或经预测的所述目标因素的所述值。
28.根据权利要求19所述的系统,其中所述至少一个用户输入包括第三请求,所述第三请求用以发起对用于影响所述多个因素中的目标因素的策略的评估,并且其中执行所述动作包括:
响应于接收到所述第三请求,从所述第三请求中确定所述目标因素;
基于所述第一因果结构从所述多个因素中确定影响所述目标因素的至少一个因素;
基于所述目标因素和所述至少一个因素,生成所述第一因果结构的子结构。
29.根据权利要求28所述的系统,其中向所述用户呈现所述结果包括:
向所述用户呈现所述第一因果结构的所述子结构,以使得所述用户能够基于所述子结构来输入关于所述目标因素的策略以用于评估。
30.根据权利要求29所述的系统,其中所述至少一个用户输入还包括由所述用户基于所述子结构而输入以用于评估的策略,所述策略指示所述至少一个因素的值,并且其中执行所述动作还包括:
基于所述第一因果结构和所述至少一个因素的所述值,预测所述目标因素的值。
31.根据权利要求30所述的系统,其中向所述用户呈现所述结果还包括:
向所述用户呈现经预测的所述目标因素的所述值作为对所述策略的所述评估的结果。
32.一种系统,包括:
处理单元;以及
存储器,耦合到所述处理单元并且在其上存储指令,所述指令在由所述处理单元执行时执行动作,所述动作包括:
获取多个因素的观察样本和指示所述多个因素之间的因果关系的因果结构,每个观察样本包括所述多个因素的一组观察值;
响应于在所述多个因素中标识出目标因素,基于所述因果结构从所述多个因素中确定影响所述目标因素的至少一个因素;
针对所述至少一个因素中的每个因素,基于所述观察样本和所述因果结构来估计所述因素对所述目标因素的总体因果效应;以及
基于所述至少一个因素对所述目标因素的相应总体因果效应,对所述至少一个因素进行排名。
33.根据权利要求32所述的系统,其中获取所述因果结构包括:
从所述观察样本中确定所述因果结构。
34.根据权利要求32所述的系统,其中估计所述因素对所述目标因素的所述总体因果效应包括:
基于因果效应估计算法来估计所述因素对所述目标因素的所述总体因果效应。
35.根据权利要求32所述的系统,其中估计所述因素对所述目标因素的所述总体因果效应包括:
从所述因果结构中确定所述因素与所述目标因素之间的一个或多个因果路径;
针对所述一个或多个因果路径中的每个因果路径,估计所述因素对所述目标因素的因果效应;以及
将针对所述一个或多个因果路径的因果效应之和确定为所述因素对所述目标因素的所述总体因果效应。
36.根据权利要求32所述的系统,其中所述因素对所述目标因素的所述总体因果效应被估计为正值或负值,并且其中对所述至少一个因素进行排名包括:
确定所述至少一个因素对所述目标因素的所述总体因果效应的相应绝对值;以及
基于确定的所述绝对值对所述至少一个因素进行排名。
37.一种计算机程序产品,有形地存储在机器可读介质上并且包括机器可执行指令,所述机器可执行指令当在设备上被执行时引起所述设备执行根据权利要求1至13中任一项所述的方法。
38.一种计算机程序产品,有形地存储在机器可读介质上并且包括机器可执行指令,所述机器可执行指令当在设备上被执行时引起所述设备执行根据权利要求14至18中任一项所述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/090413 WO2020243965A1 (en) | 2019-06-06 | 2019-06-06 | Causal analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112352235A true CN112352235A (zh) | 2021-02-09 |
Family
ID=73652733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980010742.3A Pending CN112352235A (zh) | 2019-06-06 | 2019-06-06 | 因果分析 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11861508B2 (zh) |
JP (2) | JP7342942B2 (zh) |
CN (1) | CN112352235A (zh) |
WO (1) | WO2020243965A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11853912B1 (en) * | 2020-01-30 | 2023-12-26 | Amazon Technologies, Inc. | Determining causal insights |
CN112819253A (zh) * | 2021-03-02 | 2021-05-18 | 华东师范大学 | 一种无人机避障和路径规划装置及方法 |
GB2609904A (en) * | 2021-08-05 | 2023-02-22 | Impulse Innovations Ltd | Systems and methods for generating a structural model architecture |
CN115081631A (zh) * | 2022-06-29 | 2022-09-20 | 支付宝(杭州)信息技术有限公司 | 基于因果知识的业务处理方法、装置以及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105934754A (zh) * | 2014-02-14 | 2016-09-07 | 欧姆龙株式会社 | 因果网络生成系统和因果关系的数据结构 |
CN107111603A (zh) * | 2014-09-11 | 2017-08-29 | 博格有限责任公司 | 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型 |
US20180307219A1 (en) * | 2017-04-19 | 2018-10-25 | Hitachi, Ltd. | Causal Relation Model Verification Method and System and Failure Cause Extraction System |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581459A (en) * | 1990-09-26 | 1996-12-03 | Hitachi, Ltd. | Plant operation support system |
JP2011008375A (ja) * | 2009-06-24 | 2011-01-13 | Hitachi Ltd | 原因分析支援装置および原因分析支援方法 |
JP6721179B2 (ja) | 2016-10-05 | 2020-07-08 | 国立研究開発法人情報通信研究機構 | 因果関係認識装置及びそのためのコンピュータプログラム |
JP6515937B2 (ja) | 2017-02-08 | 2019-05-22 | 横河電機株式会社 | イベント解析装置、イベント解析システム、イベント解析方法、イベント解析プログラム、および記録媒体 |
CN109598346A (zh) * | 2017-09-30 | 2019-04-09 | 日本电气株式会社 | 用于估计观测变量之间的因果关系的方法、装置和系统 |
JP6916773B2 (ja) * | 2018-12-17 | 2021-08-11 | 株式会社日立製作所 | 因果関係表示システム及び方法 |
-
2019
- 2019-06-06 WO PCT/CN2019/090413 patent/WO2020243965A1/en active Application Filing
- 2019-06-06 US US16/965,066 patent/US11861508B2/en active Active
- 2019-06-06 CN CN201980010742.3A patent/CN112352235A/zh active Pending
- 2019-06-06 JP JP2021505729A patent/JP7342942B2/ja active Active
-
2023
- 2023-08-30 JP JP2023140531A patent/JP2023162364A/ja active Pending
- 2023-11-21 US US18/515,665 patent/US20240086738A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105934754A (zh) * | 2014-02-14 | 2016-09-07 | 欧姆龙株式会社 | 因果网络生成系统和因果关系的数据结构 |
CN107111603A (zh) * | 2014-09-11 | 2017-08-29 | 博格有限责任公司 | 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型 |
US20180307219A1 (en) * | 2017-04-19 | 2018-10-25 | Hitachi, Ltd. | Causal Relation Model Verification Method and System and Failure Cause Extraction System |
Also Published As
Publication number | Publication date |
---|---|
JP2022541959A (ja) | 2022-09-29 |
JP7342942B2 (ja) | 2023-09-12 |
US11861508B2 (en) | 2024-01-02 |
JP2023162364A (ja) | 2023-11-08 |
US20230153636A1 (en) | 2023-05-18 |
US20240086738A1 (en) | 2024-03-14 |
WO2020243965A1 (en) | 2020-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112352235A (zh) | 因果分析 | |
US9098858B2 (en) | Visualizing expressions for dynamic analytics | |
JP6822509B2 (ja) | データ処理方法および電子機器 | |
US11204851B1 (en) | Real-time data quality analysis | |
Hussain et al. | Integrated AHP-IOWA, POWA framework for ideal cloud provider selection and optimum resource management | |
US10614088B2 (en) | Assessing value of one or more data sets in the context of a set of applications | |
US20140164036A1 (en) | Program Sentiment Analysis, Systems and Methods | |
EP3383088A1 (en) | A computer implemented method, a system and computer programs to quantify the performance of a network | |
Hoad et al. | AutoSimOA: A framework for automated analysis of simulation output | |
US20190096102A1 (en) | Interactive tool for causal graph construction | |
AU2021319162B2 (en) | Efficient real-time data quality analysis | |
JP7173234B2 (ja) | 情報処理に用いられる方法、装置、デバイス及び記憶媒体 | |
US20140280216A1 (en) | Automated ranking of contributors to a knowledge base | |
Almomani et al. | Selecting a good stochastic system for the large number of alternatives | |
CN113159810B (zh) | 策略评估方法、装置、设备及存储介质 | |
US20220067800A1 (en) | Intelligent evidence based response system | |
US10762432B2 (en) | Semantic analysis network resource provider recommendation system | |
US20180268301A1 (en) | Cognitive prediction of problematic servers in unknown server group | |
US20220253781A1 (en) | Method, device and computer readable storage medium for data processing | |
US20230122472A1 (en) | Hybrid Techniques for Quality Estimation of a Decision-Making Policy in a Computer System | |
US20240070160A1 (en) | Data processing method and electronic device | |
US20230185791A1 (en) | Prioritized data cleaning | |
EP3617929A1 (en) | Systems and methods to ensure robustness for engineering autonomy | |
CN118733779A (zh) | 基于人工智能的云产品更新方法及系统 | |
CN118469381A (zh) | 信息处理方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |