CN114461858A - 一种因果关系分析模型构建及因果关系分析方法 - Google Patents

一种因果关系分析模型构建及因果关系分析方法 Download PDF

Info

Publication number
CN114461858A
CN114461858A CN202111608440.1A CN202111608440A CN114461858A CN 114461858 A CN114461858 A CN 114461858A CN 202111608440 A CN202111608440 A CN 202111608440A CN 114461858 A CN114461858 A CN 114461858A
Authority
CN
China
Prior art keywords
node
implication
analyzed
causal relationship
relationship analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111608440.1A
Other languages
English (en)
Inventor
蔡灿宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202111608440.1A priority Critical patent/CN114461858A/zh
Publication of CN114461858A publication Critical patent/CN114461858A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种因果关系分析模型构建及因果关系分析方法,获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点;对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点,在布尔代数算法的三层模型中输入计算得到的前因节点对所述目标节点的信息增益以及前因条件节点的中心度进行训练得到满足条件的因果关系分析模型,然后利用该因果关系分析模型进行因果关系分析,在保留布尔代数算法的高效率性的同时提高了模型分析的准确性。

Description

一种因果关系分析模型构建及因果关系分析方法
技术领域
本发明涉及数据挖掘技术领域,具体涉及一种因果关系分析模型构建及因果关系分析方法。
背景技术
网络图谱是以结构化的形式描述客观世界中概念、实体、事件、属性及其关系,将信息表达成更接近人类认知世界并且可以被计算机处理的形式,提供了一种更好地组织、管理和理解海量信息的能力;网络图谱数据更多的会以图数据库进行存储,通过对网络图谱结构中节点与边蕴含的信息再配合图交互探索进行更进一步的分析可以支持从数据分析、智能问答、反欺诈等一系列智能应用。
在知识图谱中如果任意节点的变量的改变会对其他节点造成影响,则需要对该因果关系进行分析。传统上,因果关系分析是基于相关分析进行的。相关分析描述的是客观事物之间的密切程度,一般情况下采用因果关系网络图谱进行分析。目前,研究提出了三种复杂的因果关系,包括:并发因果关系、等效性因果关系以及非对称因果关系,不能被简单的相关性分析解释。针对这种情况,提出了CARE复杂因果关系分析法,该方法结合了BOOM布尔表达式压缩算法和社会学中的网络分析算法将布尔表达式的简化效率大幅提升的同时将网络中心度的概念融合进了因果关系分析中。但是,该方法忽视了前因条件对结果出现的直接影响力,分析结果准确度较低。
发明内容
有鉴于此,本发明实施例提供了涉及一种因果关系分析模型构建及因果关系分析方法,以解决现有技术中因果关系分析时忽视了前因条件对结果出现的直接影响力导致分析结果准确度较低的技术问题。
本发明提出的技术方案如下:
本发明实施例第一方面提供一种因果关系分析模型构建方法,该因果关系分析模型构建方法包括:获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点;对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点;将所述多个前因条件节点对应的二分条件值和相应的目标节点对应的二分条件值构成多条极小项;将所述极小项中所述目标节点对应的二分条件值为1的构成正集群,将所述极小项中所述目标节点对应的二分条件值为0的构成负集群;根据所述前因节点在所述正集群中的频率计算所述前因节点对所述目标节点的信息增益;将每一个目标节点对应所述信息增益和所述前因条件节点在所述网络图谱中的中心度输入布尔代数算法的三层模型进行训练直至得到满足条件的因果关系分析模型。
本发明实施例第二方面提供一种因果关系分析方法,该因果关系分析方法包括:获取待分析网络图谱;对所述待分析网络图谱中任一待分析节点确定所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述待分析节点与其对应的前因条件节点构建的多条极小项;;将所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述多条极小项输入到如本发明实施例第一方面所述的因果关系分析模型构建方法得到的因果关系分析模型得到所述待分析节点的信息增益;根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析。
可选地,所述根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析,包括:根据所述多条极小项构造布尔表达式得到对应的蕴涵项并进行筛选得到满足预设条件的蕴涵项;对每一个所述蕴涵项中对应的所述前因条件节点进行排查直至所述每一个蕴涵项得到对应的素蕴涵项;根据LCMC衡量法对所述素蕴涵项进行筛选直至得到的本质蕴涵项覆盖所述正集群。
可选地,所述根据所述多条极小项构造布尔表达式得到对应的蕴涵项并进行筛选得到满足预设条件的蕴涵项,包括:计算所述待分析节点在所述正集群中的频率;根据所述中心度、所述待分析节点的信息增益以及所述频率计算所述前因条件节点的冗余分数;将所述冗余分数按照高低进行排序并由高至低选取所述前因条件节点并构造所述蕴涵项。
可选地,所述对每一个所述蕴涵项中对应的所述前因条件节点进行排查直至所述每一个蕴涵项得到对应的素蕴涵项,包括:在任一所述蕴涵项中移除任一所述前因条件节点得到新的蕴涵项;将所述新的蕴涵项与所述负集群进行比对;当所述新的蕴涵项与所述负集群有交集,则保留所述前因条件节点;当所述新的蕴涵项与所述负集群无交集,则保留所述新的蕴涵项并得到对应的素蕴涵项。
可选地,所述根据LCMC衡量法对所述素蕴涵项进行筛选直至得到的本质蕴涵项覆盖所述正集群,包括:计算每一个所述素蕴涵项覆盖所述极小项的个数;对所述个数进行筛选得到满足条件的所述素蕴涵项并根据所述素蕴涵项形成对应的本质蕴涵项。
本发明实施例第三方面提供一种因果关系分析模型构建装置,该因果关系分析模型构建装置包括:第一获取模块,用于获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点;划分模块,用于对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点;第一组成模块,用于将所述多个前因条件节点对应的二分条件值和相应的目标节点对应的二分条件值构成多条极小项;第二组成模块,用于将所述极小项中所述目标节点对应的二分条件值为1的构成正集群,将所述极小项中所述目标节点对应的二分条件值为0的构成负集群;计算模块,用于根据所述前因节点在所述正集群中的频率计算所述前因节点对所述目标节点的信息增益;训练模块,用于将每一个目标节点对应所述信息增益和所述前因条件节点在所述网络图谱中的中心度输入布尔代数算法的三层模型进行训练直至得到满足条件的因果关系分析模型。
本发明实施例第四方面提供一种因果关系分析装置,该因果关系分析装置包括:第二获取模块,用于获取待分析网络图谱;确定模块,用于对所述待分析网络图谱中任一待分析节点确定所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述待分析节点与其对应的前因条件节点构建的多条极小项;;输入模块,用于将所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述多条极小项输入到如本发明实施例第一方面所述的因果关系分析模型构建方法得到的因果关系分析模型得到所述待分析节点的信息增益;分析模块,用于根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析。
本发明实施例第五方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明实施例第一方面所述的因果关系分析模型构建方法,或者如本发明实施例第二方面及第二方面任一项所述的因果关系分析方法。
本发明实施例第六方面提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本发明实施例第一方面所述的因果关系分析模型构建方法,或者如本发明实施例第二方面及第二方面任一项所述的因果关系分析方法。
本发明提供的技术方案,具有如下效果:
本发明实施例提供的因果关系分析模型构建方法,获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点;对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点;将所述多个前因条件节点对应的二分条件值和相应的目标节点对应的二分条件值构成多条极小项;将所述极小项中所述目标节点对应的二分条件值为1的构成正集群,将所述极小项中所述目标节点对应的二分条件值为0的构成负集群;根据所述前因节点在所述正集群中的频率计算所述前因节点对所述目标节点的信息增益;将每一个目标节点对应所述信息增益和所述前因条件节点在所述网络图谱中的中心度输入布尔代数算法的三层模型进行训练直至得到满足条件的因果关系分析模型。该方法在布尔代数算法的三层模型中输入了目标节点的信息增益以及前因条件节点的中心度,在保留布尔代数算法的高效率性的同时提高了模型分析的准确性。
本发明实施例提供的因果关系分析方法,获取待分析网络图谱;对所述待分析网络图谱中任一待分析节点确定所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述待分析节点与其对应的前因条件节点构建的多条极小项;;将所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述多条极小项输入到如本发明实施例第一方面所述的因果关系分析模型构建方法得到的因果关系分析模型得到所述待分析节点的信息增益;根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析。该方法将前因条件对于结果出现的直接影响力即信息增益加入了分析流程,同时利用相对重要性(中心度)和直接影响力在训练好的模型中进行分析,分析结果更准确。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的因果关系分析模型构建方法的流程图;
图2是根据本发明实施例提供的关系节点的示意图;
图3是根据本发明实施例提供的因果关系分析模型架构图;
图4是根据本发明实施例的因果关系分析方法的流程图;
图5是根据本发明实施例的因果关系分析模型构建装置的结构框图;
图6是根据本发明实施例的因果关系分析装置的结构框图;
图7是根据本发明实施例提供的计算机可读存储介质的结构示意图;
图8是根据本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种因果关系分析模型构建方法,如图1所示,该方法包括如下步骤:
步骤S101:获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点。在任一条件影响结果的事项中都需要进行因果关系分析,因此用网络图谱来表征这些事项,并利用网络图谱中的节点来表征条件以及结果,通过对网络图谱中节点的分析完成任一事项中因果关系的分析。具体地,目标节点用于表征结果,与目标节点相连接的关联节点用于表征条件,因此在分析之前首先获取该目标节点以及对应连接的关联节点。
步骤S102:对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点。具体地,在得到目标节点以及对应连接的关联节点之后,将关联节点中直接指向该目标节点的关联节点作为该目标节点对应的前因条件节点。如图2所示,目标节点F对应的前因条件节点包括节点A、B、C,节点D和节点E表示目标节点F的子目标节点,对目标节点F无影响。
步骤S103:将所述多个前因条件节点对应的二分条件值和相应的目标节点对应的二分条件值构成多条极小项。具体地,每一个前因条件节点都包括两种条件值:真(1)和假(0),不同前因条件值会形成不同的结果条件值:真(1)和假(0),根据不同前因条件值以及结果条件值构成多条极小项。
在一实施例中,如下表1所示,每一行就表示一条极小项。
表1
Figure BDA0003432976810000071
Figure BDA0003432976810000081
步骤S104:将所述极小项中所述目标节点对应的二分条件值为1的构成正集群,将所述极小项中所述目标节点对应的二分条件值为0的构成负集群。具体地,如上表1所示,第一行和第二行构成正集群;第三、第四、第五行构成负集群。
步骤S105:根据所述前因节点在所述正集群中的频率计算所述前因节点对所述目标节点的信息增益。具体地,使用信息增益来表征前因条件节点对目标节点的直接影响力,根据下式计算:
信息增益=H(目标节点)-H(目标节点|前因条件节点)
其中,H(目标节点)与H(目标节点|前因条件节点)根据下式计算:
H(S)=I(S)=-∑iPi log2 Pi
式中,Pi表示前因节点出现在正集群中的频率。
步骤S106:将每一个目标节点对应所述信息增益和所述前因条件节点在所述网络图谱中的中心度输入布尔代数算法的三层模型进行训练直至得到满足条件的因果关系分析模型。具体地,在得到信息增益之后,首先计算前因条件节点在网络图谱中的中心度。具体地,根据前因条件节点在网络图谱中的度中心度与中介中心度计算:
中心度=系数*前因条件节点在网络图谱中的度中心度+系数*前因条件节点在网络图谱中的中介中心度
其中,度中心度表示连接到前因条件节点所有边的权重之和;中介中心度表示一个节点担任其他两个节点之间最短路径的桥梁的次数;系数用来衡量中心度和信息增益的重要性,一般取值为0.5,表示同样重要。
然后将信息增益和中心度输入布尔代数算法的三层模型进行训练直至得到多组由最精简的目标节点与前因条件节点组成的布尔表达式,停止训练并得到对应的因果关系分析模型。
在一实例中,训练得到的因果关系分析模型架构如图3所示。其中,InputDataset表示输入网络图谱;Boolean Truth表示布尔真值表;Degree andBetweenness Centrality表示中心度;Information Gain表示信息增益;Covergae-Directed表示覆盖率测试;Implicant Expansion表示模型第二层,用于精简第一层获得的蕴涵项,从而得到素蕴涵项;Covering Problem Solution表示模型第三层;Prime Implicant表示素蕴涵项;essential prime implicant表示本质蕴涵项。
本发明实施例提供的因果关系分析模型构建方法,该方法在布尔代数算法的三层模型中输入了目标节点的信息增益以及前因条件节点的中心度,在保留布尔代数算法的高效率性的同时提高了模型分析的准确性。
本发明实施例还提供一种因果关系分析方法,如图4所示,该方法包括如下步骤:
步骤S201:获取待分析网络图谱。具体地,在分析之前,首先需要获取待分析网络图谱。
步骤S202:对所述待分析网络图谱中任一待分析节点确定所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述待分析节点与其对应的前因条件节点构建的多条极小项。具体地,得到待分析网络图谱之后,计算待分析网络图谱中任一待分析节点对应的前因条件节点的中心度并构建多条极小项。具体地计算过程与构建过程可以参考本发明实施例提供的因果关系分析模型构建方法中的计算过程与构建过程实现,此处不再赘述。
步骤S203:将所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述多条极小项输入到如本发明实施例提供的所述因果关系分析模型构建方法得到的因果关系分析模型得到所述待分析节点的信息增益。具体地,将计算得到的中心度与构建的多条极小项输入到本发明实施例提供的因果关系分析模型构建方法得到的因果关系分析模型中,并在模型中进行计算得到该待分析节点的信息增益。具体地计算过程可以参考步骤S105的计算过程实现,此处不再赘述。
步骤S204:根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析。具体地,得到待分析节点的信息增益之后,利用该信息增益和输入的中心度在得到的因果关系分析模型中对该待分析节点进行分析。
本发明实施例提供的因果关系分析方法,该方法将前因条件对于结果出现的直接影响力即信息增益加入了分析流程,同时利用相对重要性(中心度)和直接影响力在训练好的模型中进行分析,分析结果更准确。
作为本发明实施例一种可选的实施方式,步骤S204,包括:根据所述多条极小项构造布尔表达式得到对应的蕴涵项并进行筛选得到满足预设条件的蕴涵项;对每一个所述蕴涵项中对应的所述前因条件节点进行排查直至所述每一个蕴涵项得到对应的素蕴涵项;根据LCMC衡量法对所述素蕴涵项进行筛选直至得到的本质蕴涵项覆盖所述正集群。
具体地,首先根据构成的多条极小项构造布尔表达式。
在一实施例中,如下表2所示,
表2
Figure BDA0003432976810000111
其中,A、B、C表示前因条件节点对应的二分条件值为真(1);a、b、c表示前因条件节点对应的二分条件值为假(0);Y表示待分析节点对应的二分条件值为真(1);y表示待分析节点对应的二分条件值为假(0)。
具体地,根据表2中第一行和第二行可以构造得到布尔表达式为:(a+b+C)|(a+B+C)=y;根据表2中第三、第四、第五行可以构造得到布尔表达式为:(a+B+c)|(A+B+c)|(A+B+C)=Y。
根据构造的布尔表达式可以得到对应的蕴涵项:(a+b+C)、(a+B+C)、(a+B+c)、(A+B+c)、(A+B+C)。
然后对该蕴涵项进行筛选得到满足预设条件的蕴涵项。又该蕴涵项中可能包含不直接影响待分析节点的前因条件节点,因此需要对每一个得到的蕴涵项中对应的前因条件节点进行排查直至每一个蕴涵项得到对应的素蕴涵项。
又一个在正集群中的极小项可能会被多个素蕴涵项所覆盖,所以并不是所有素蕴涵项都是必须保留在最后的分析结果中的,因此再根据LCMC衡量法对得到的素蕴涵项进行筛选得到本质蕴涵项,当得到的本质蕴涵项可以覆盖该正集群之后,停止筛选,最终得到的本质蕴涵项就是该待分析节点对应的因果关系的分析结果。
作为本发明实施例一种可选的实施方式,所述根据所述多条极小项构造布尔表达式得到对应的蕴涵项并进行筛选得到满足预设条件的蕴涵项,包括:计算所述待分析节点在所述正集群中的频率;根据所述中心度、所述待分析节点的信息增益以及所述频率计算所述前因条件节点的冗余分数;将所述冗余分数按照高低进行排序并由高至低选取所述前因条件节点并构造所述蕴涵项。具体地,首先计算该待分析节点在正集群中出现的频率Pi,然后设置一个OverallScore(冗余分数)来衡量每一个前因条件节点的冗余性,具体地计算方法为:
Overall Score=[系数*中心度+系数*信息增益]*频率
其中,中心度参考步骤S106中的计算过程,此处不再赘述;
信息增益=H(待分析节点)-H(待分析节点|前因条件节点),参考步骤S105中的计算过程,此处不再赘述;
当该冗余分数越高,则表示该前因条件节点的冗余性越低,在构造蕴涵项的时候会被优先选取,因此选取该冗余分数相对较高的前因条件节点并构造蕴涵项。根据前因条件节点出现在正集群的次数来选择该前因条件节点是否冗余,提高了布尔代数算法的效率。
作为本发明实施例一种可选的实施方式,所述对每一个所述蕴涵项中对应的所述前因条件节点进行排查直至所述每一个蕴涵项得到对应的素蕴涵项,包括:在任一所述蕴涵项中移除任一所述前因条件节点得到新的蕴涵项;将所述新的蕴涵项与所述负集群进行比对;当所述新的蕴涵项与所述负集群有交集,则保留所述前因条件节点;当所述新的蕴涵项与所述负集群无交集,则保留所述新的蕴涵项并得到对应的素蕴涵项。
具体地,使用逐个排查发进行处理。首先将任一个前因条件节点在对应的蕴涵项中暂时移除得到对应新的蕴涵项,观察获得的新的蕴涵项是否会和负集群产生交集,如果产生交集,表示该移除的前因条件节点发生变化,则对应的目标节点也会发生变化,即表示该移除的前因条件节点是不可以移除的,保留该前因条件节点;如果不产生交集,则保留该获得的蕴涵项作为对应的素蕴涵项。以此类推,直至所有的蕴涵项都得到对应的素蕴涵项。
作为本发明实施例一种可选的实施方式,所述根据LCMC衡量法对所述素蕴涵项进行筛选直至得到的本质蕴涵项覆盖所述正集群,包括:计算每一个所述素蕴涵项覆盖所述极小项的个数;对所述个数进行筛选得到满足条件的所述素蕴涵项并根据所述素蕴涵项形成对应的本质蕴涵项。具体地,在得到素蕴涵项之后,运用LCMC衡量法来决定哪些素蕴涵项会被保留。首先计算每一个素蕴涵项可以覆盖极小项的个数,然后优先选择覆盖个数多的素蕴涵项并形成本质蕴涵项,当产生的本质蕴涵项可以覆盖正集群时,停止筛选,最终形成的本质蕴涵项就是该待分析节点对应的因果关系的分析结果。
在一实例中,假设要分析某通信用户或运营商用户增长Y是否由候补前因条件H0~H9所产生,首先观察并收集29条事例,并将事例转换成真值表和对应的布尔表达式。如下表3所示:
表3
h0 h1 h2 h3 h4 h5 h6 h7 h8 h9 结果
0 0 0 0 1 0 0 1 1 0 1
0 0 0 1 1 0 0 0 1 0 1
0 0 0 1 1 0 0 1 1 0 1
1 0 0 0 1 1 1 0 1 1 1
1 1 0 0 1 1 1 0 1 1 1
1 1 0 1 0 1 1 0 1 1 1
1 0 0 0 0 1 1 0 0 1 1
1 0 0 0 0 1 1 0 0 1 1
1 0 0 0 0 1 1 0 1 1 1
1 1 1 1 0 1 1 0 0 0 0
1 1 1 1 0 1 0 0 0 0 0
1 1 1 1 0 1 0 0 0 0 0
1 0 1 1 0 0 1 1 0 0 0
0 0 1 1 0 0 1 1 0 0 0
0 1 1 1 0 0 1 1 0 0 0
1 1 1 1 0 0 0 1 0 0 1
1 1 1 1 0 0 0 1 1 0 1
1 0 1 1 0 0 0 1 1 0 1
0 1 1 0 0 1 0 1 0 0 0
0 1 0 0 0 1 0 1 0 0 0
0 1 0 0 0 1 0 1 0 1 0
0 0 0 1 0 1 1 0 1 1 0
0 0 1 0 0 1 1 0 1 1 0
0 1 1 0 0 1 1 0 1 1 0
0 0 1 0 1 1 1 1 0 0 1
0 0 1 0 1 1 1 1 1 0 1
0 0 1 0 1 1 1 1 1 0 1
1 1 1 0 1 1 1 0 0 0 1
1 1 1 1 1 1 1 0 0 0 1
首先计算出每一个前因条件对应的中心度(如下表4和下表5所示)和信息增益(如下表6和下表7所示):
表4
h0 h1 h2 h3 h4 h5 h6 h7 h8 h9
Degree 1 1 0.5 1 1 1 1 0.5 1 0
Betweenness 1 0 0.21 0 0 0.17 0.17 0 0.52 0
Socail Scores 0.8 0.4 0.28 0.4 0.4 0.47 0.47 0.2 0.61 0
表5
h0 h1 h2 h3 h4 h5 h6 h7 h8 h9
Degree 0.75 1 1 1 0 1 1 0.88 0.75 0.88
Betweenness 0 0.06 1 0.06 0 0.74 0.06 0 0 0
Socail Scores 0.3 0.43 8 0.43 0 0.7 0.43 0.35 0.3 0.35
表6
Figure BDA0003432976810000141
表7
Figure BDA0003432976810000151
然后计算每个前因条件在正集群中的频率,如下表8所示:
表8
h0 h1 h2 h3 h4 h5 h6 h7 h8 h9
0 0 0 0 1 0 0 1 1 0
0 0 0 1 1 0 0 0 1 0
0 0 0 1 1 0 0 1 1 0
1 0 0 0 1 1 1 0 1 1
1 1 0 0 1 1 1 0 1 1
1 1 0 1 0 1 1 0 1 1
1 0 0 0 0 1 1 0 0 1
1 0 0 0 0 1 1 0 0 1
1 0 0 0 0 1 1 0 1 1
1 1 1 1 0 0 0 1 0 0
1 1 1 1 0 0 0 1 1 0
1 0 1 1 0 0 0 1 1 0
0 0 1 0 1 1 1 1 0 0
0 0 1 0 1 1 1 1 1 0
0 0 1 0 1 1 1 1 1 0
1 1 1 0 1 1 1 0 0 0
1 1 1 1 1 1 1 0 0 0
0 1 0.6 0.2 0.2 0 0 0.6 0 1
1 0 0.4 0.8 0.8 1 1 0.4 1 0
根据计算得到的中心度、信息增益以及频率计算每一个前因条件的冗余分数Overall Score,如下表9所示:
表9
h0 h1 h2 h3 h4 h5 h6 h7 h8 h9
OS(-x) 0 0.13 0.27 0.2 -0.58 0.26 0.17 0.19 -0.07 0.22
OS(x) 0.52 0.28 0.24 0.21 0.82 0.28 0.27 0.11 0.51 0
根据表9可以得到前因条件h4的冗余分数0.82为最高值,因此将h4视为第一个候选变量来构成蕴涵项。然后判断h4是否与负集群有交集,即h4是否出现在负集群中。根据表3可以得到h4与负集群无交集,因此h4可以被用于构造蕴涵项。再然后将h4覆盖的极小项给暂时移除,并找到下一个可以被用于构造蕴涵项的前因条件。
重复上述计算过程直至得到最终的结果:
蕴涵项1:h4;
蕴涵项2:h0,h8;
蕴涵项3:h0,h1,~h5;
蕴涵项4:h0,~h2;
然后对得到的蕴涵项进行处理直至得到最终的本质蕴涵项,即因果关系的分析结果:
蕴涵项1:h4:当h4前因条件出现时,某通信用户或运营商用户数量增长;
蕴涵项2:h0,h8:当h0和h8前因条件同时出现时,某通信用户或运营商用户数量增长;
蕴涵项3:h0,~h2:当h0出现且h2不出现时,某通信用户或运营商用户数量增长;
蕴涵项4:h0,h1,~h5:当h0和h1同时出现,且h5不出现时,某通信用户或运营商用户数量增长;
本发明实施例还提供一种因果关系分析模型构建装置,如图5所示,该装置包括:
第一获取模块101,用于获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点;详细内容参见上述方法实施例中步骤S101的相关描述。
划分模块102,用于对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点;详细内容参见上述方法实施例中步骤S102的相关描述。
第一组成模块103,用于将所述多个前因条件节点对应的二分条件值和相应的目标节点对应的二分条件值构成多条极小项;详细内容参见上述方法实施例中步骤S103的相关描述。
第二组成模块104,用于将所述极小项中所述目标节点对应的二分条件值为1的构成正集群,将所述极小项中所述目标节点对应的二分条件值为0的构成负集群;详细内容参见上述方法实施例中步骤S104的相关描述。
计算模块105,用于根据所述前因节点在所述正集群中的频率计算所述前因节点对所述目标节点的信息增益;详细内容参见上述方法实施例中步骤S105的相关描述。
训练模块106,用于将每一个目标节点对应所述信息增益和所述前因条件节点在所述网络图谱中的中心度输入布尔代数算法的三层模型进行训练直至得到满足条件的因果关系分析模型;详细内容参见上述方法实施例中步骤S106的相关描述。
本发明实施例提供的因果关系分析模型构建装置,该装置在布尔代数算法的三层模型中输入了目标节点的信息增益以及前因条件节点的中心度,在保留布尔代数算法的高效率性的同时提高了模型分析的准确性。
本发明实施例提供的因果关系分析模型构建装置的功能描述详细参见上述实施例中因果关系分析模型构建方法描述。
本发明实施例还提供一种因果关系分析装置,如图6所示,该装置包括:
第二获取模块201,用于获取待分析网络图谱;详细内容参见上述方法实施例中步骤S201的相关描述。
确定模块202,用于对所述待分析网络图谱中任一待分析节点确定所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述待分析节点与其对应的前因条件节点构建的多条极小项;详细内容参见上述方法实施例中步骤S202的相关描述。
输入模块203,用于将所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述多条极小项输入到如权利要求1所述的因果关系分析模型构建方法得到的因果关系分析模型得到所述待分析节点的信息增益;详细内容参见上述方法实施例中步骤S203的相关描述。
分析模块204,用于根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析;详细内容参见上述方法实施例中步骤S204的相关描述。
本发明实施例提供的因果关系分析装置,该装置将前因条件对于结果出现的直接影响力即信息增益加入了分析流程,同时利用相对重要性(中心度)和直接影响力在训练好的模型中进行分析,分析结果更准确。
作为本发明实施例一种可选的实施方式,所述装置还包括:第一筛选模块,用于根据所述多条极小项构造布尔表达式得到对应的蕴涵项并进行筛选得到满足预设条件的蕴涵项;排查模块,用于对每一个所述蕴涵项中对应的所述前因条件节点进行排查直至所述每一个蕴涵项得到对应的素蕴涵项;第二筛选模块,用于根据LCMC衡量法对所述素蕴涵项进行筛选直至得到的本质蕴涵项覆盖所述正集群。
作为本发明实施例一种可选的实施方式,所述装置还包括:第一计算模块,用于计算所述待分析节点在所述正集群中的频率;第二计算模块,用于根据所述中心度、所述待分析节点的信息增益以及所述频率计算所述前因条件节点的冗余分数;构造模块,用于将所述冗余分数按照高低进行排序并由高至低选取所述前因条件节点并构造所述蕴涵项。
作为本发明实施例一种可选的实施方式,所述装置还包括:移除模块,用于在任一所述蕴涵项中移除任一所述前因条件节点得到新的蕴涵项;比对模块,用于将所述新的蕴涵项与所述负集群进行比对;第一保留模块,用于当所述新的蕴涵项与所述负集群有交集,则保留所述前因条件节点;第二保留模块,用于当所述新的蕴涵项与所述负集群无交集,则保留所述新的蕴涵项并得到对应的素蕴涵项。
作为本发明实施例一种可选的实施方式,所述装置还包括:第三计算模块,用于计算每一个所述素蕴涵项覆盖所述极小项的个数;第三筛选模块,用于对所述个数进行筛选得到满足条件的所述素蕴涵项并根据所述素蕴涵项形成对应的本质蕴涵项。
本发明实施例提供的因果关系分析装置的功能描述详细参见上述实施例中因果关系分析方法描述。
本发明实施例还提供一种存储介质,如图7所示,其上存储有计算机程序601,该指令被处理器执行时实现上述实施例中因果关系分析模型构建方法或因果关系分析方法的步骤。该存储介质上还存储有音视频流数据,特征帧数据、交互请求信令、加密数据以及预设数据大小等。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本发明实施例还提供了一种电子设备,如图8所示,该电子设备可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图8中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的因果关系分析模型构建方法或因果关系分析方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行如图1-3所示实施例中的因果关系分析模型构建方法,或者如图4所示实施例中的因果关系分析方法。
上述电子设备具体细节可以对应参阅图1至图4所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种因果关系分析模型构建方法,其特征在于,包括如下步骤:
获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点;
对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点;
将所述多个前因条件节点对应的二分条件值和相应的目标节点对应的二分条件值构成多条极小项;
将所述极小项中所述目标节点对应的二分条件值为1的构成正集群,将所述极小项中所述目标节点对应的二分条件值为0的构成负集群;
根据所述前因节点在所述正集群中的频率计算所述前因节点对所述目标节点的信息增益;
将每一个目标节点对应所述信息增益和所述前因条件节点在所述网络图谱中的中心度输入布尔代数算法的三层模型进行训练直至得到满足条件的因果关系分析模型。
2.一种因果关系分析方法,其特征在于,包括如下步骤:
获取待分析网络图谱;
对所述待分析网络图谱中任一待分析节点确定所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述待分析节点与其对应的前因条件节点构建的多条极小项;
将所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述多条极小项输入到如权利要求1所述的因果关系分析模型构建方法得到的因果关系分析模型得到所述待分析节点的信息增益;
根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析。
3.根据权利要求2所述的方法,其特征在于,所述根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析,包括:
根据所述多条极小项构造布尔表达式得到对应的蕴涵项并进行筛选得到满足预设条件的蕴涵项;
对每一个所述蕴涵项中对应的所述前因条件节点进行排查直至所述每一个蕴涵项得到对应的素蕴涵项;
根据LCMC衡量法对所述素蕴涵项进行筛选直至得到的本质蕴涵项覆盖所述正集群。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多条极小项构造布尔表达式得到对应的蕴涵项并进行筛选得到满足预设条件的蕴涵项,包括:
计算所述待分析节点在所述正集群中的频率;
根据所述中心度、所述待分析节点的信息增益以及所述频率计算所述前因条件节点的冗余分数;
将所述冗余分数按照高低进行排序并由高至低选取所述前因条件节点并构造所述蕴涵项。
5.根据权利要求3所述的方法,其特征在于,所述对每一个所述蕴涵项中对应的所述前因条件节点进行排查直至所述每一个蕴涵项得到对应的素蕴涵项,包括:
在任一所述蕴涵项中移除任一所述前因条件节点得到新的蕴涵项;
将所述新的蕴涵项与所述负集群进行比对;
当所述新的蕴涵项与所述负集群有交集,则保留所述前因条件节点;
当所述新的蕴涵项与所述负集群无交集,则保留所述新的蕴涵项并得到对应的素蕴涵项。
6.根据权利要求3所述的方法,其特征在于,所述根据LCMC衡量法对所述素蕴涵项进行筛选直至得到的本质蕴涵项覆盖所述正集群,包括:
计算每一个所述素蕴涵项覆盖所述极小项的个数;
对所述个数进行筛选得到满足条件的所述素蕴涵项并根据所述素蕴涵项形成对应的本质蕴涵项。
7.一种因果关系分析模型构建装置,其特征在于,包括:
第一获取模块,用于获取网络图谱中的每一个目标节点以及与所述目标节点相连接的关联节点;
划分模块,用于对每一个所述目标节点对应的关联节点的类型进行划分得到所述目标节点对应的多个前因条件节点;
第一组成模块,用于将所述多个前因条件节点对应的二分条件值和相应的目标节点对应的二分条件值构成多条极小项;
第二组成模块,用于将所述极小项中所述目标节点对应的二分条件值为1的构成正集群,将所述极小项中所述目标节点对应的二分条件值为0的构成负集群;
计算模块,用于根据所述前因节点在所述正集群中的频率计算所述前因节点对所述目标节点的信息增益;
训练模块,用于将每一个目标节点对应所述信息增益和所述前因条件节点在所述网络图谱中的中心度输入布尔代数算法的三层模型进行训练直至得到满足条件的因果关系分析模型。
8.一种因果关系分析装置,其特征在于,包括:
第二获取模块,用于获取待分析网络图谱;
确定模块,用于对所述待分析网络图谱中任一待分析节点确定所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述待分析节点与其对应的前因条件节点构建的多条极小项;
输入模块,用于将所述待分析节点对应的前因条件节点在所述待分析网络图谱中的中心度以及所述多条极小项输入到如权利要求1所述的因果关系分析模型构建方法得到的因果关系分析模型得到所述待分析节点的信息增益;
分析模块,用于根据所述中心度与所述信息增益在所述因果关系分析模型对所述待分析节点进行分析。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1所述的因果关系分析模型构建方法或如权利要求2-6任一项所述的因果关系分析方法。
10.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1所述的因果关系分析模型构建方法或如权利要求2-6任一项所述的因果关系分析方法。
CN202111608440.1A 2021-12-24 2021-12-24 一种因果关系分析模型构建及因果关系分析方法 Pending CN114461858A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111608440.1A CN114461858A (zh) 2021-12-24 2021-12-24 一种因果关系分析模型构建及因果关系分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111608440.1A CN114461858A (zh) 2021-12-24 2021-12-24 一种因果关系分析模型构建及因果关系分析方法

Publications (1)

Publication Number Publication Date
CN114461858A true CN114461858A (zh) 2022-05-10

Family

ID=81407825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111608440.1A Pending CN114461858A (zh) 2021-12-24 2021-12-24 一种因果关系分析模型构建及因果关系分析方法

Country Status (1)

Country Link
CN (1) CN114461858A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115730660A (zh) * 2023-01-06 2023-03-03 粤港澳大湾区数字经济研究院(福田) 基于因果解耦的链接生成方法和相关装置
CN116502057A (zh) * 2023-06-21 2023-07-28 安徽思高智能科技有限公司 一种格兰杰因果关系发现方法、设备及存储设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115730660A (zh) * 2023-01-06 2023-03-03 粤港澳大湾区数字经济研究院(福田) 基于因果解耦的链接生成方法和相关装置
CN115730660B (zh) * 2023-01-06 2023-05-16 粤港澳大湾区数字经济研究院(福田) 基于因果解耦的链接生成方法和相关装置
CN116502057A (zh) * 2023-06-21 2023-07-28 安徽思高智能科技有限公司 一种格兰杰因果关系发现方法、设备及存储设备
CN116502057B (zh) * 2023-06-21 2023-09-05 安徽思高智能科技有限公司 一种格兰杰因果关系发现方法、设备及存储设备

Similar Documents

Publication Publication Date Title
US20170199902A1 (en) Outlier detection for streaming data
US10552390B2 (en) Root cause analysis of performance problems
US20160112531A1 (en) Scripting distributed, parallel programs
CN114461858A (zh) 一种因果关系分析模型构建及因果关系分析方法
CN112052404B (zh) 多源异构关系网络的群体发现方法、系统、设备及介质
CN104008420A (zh) 一种基于自动编码机的分布式离群点检测方法及系统
CN115858168B (zh) 一种基于重要性排序的地球应用模型编排系统及其方法
CN108650684A (zh) 一种关联规则确定方法及装置
Gazzarri et al. End-to-end task based parallelization for entity resolution on dynamic data
Huang et al. An adaptively multi-attribute index framework for big IoT data
CN110191015B (zh) 基于cpi指标的云服务性能智能预测方法和装置
Nuiaa et al. Evolving Dynamic Fuzzy Clustering (EDFC) to Enhance DRDoS_DNS Attacks Detection Mechnism.
Blenn et al. Crawling and detecting community structure in online social networks using local information
CN116723090A (zh) 告警根因的定位方法、装置、电子设备及可读存储介质
Srinivasan et al. A shared-memory algorithm for updating tree-based properties of large dynamic networks
Sanchez-Diaz et al. A review of algorithms to computing irreducible testors applied to feature selection
CN106682290B (zh) 可编程逻辑器件布线方法及装置
CN114489574B (zh) 一种基于svm的流处理框架的自动调优方法
CN114781473A (zh) 轨道交通设备状态预测方法、装置、设备及存储介质
CN110059880B (zh) 一种服务发现方法及装置
Xie et al. Modeling traffic of big data platform for large scale datacenter networks
CN107229621A (zh) 差异数据的清洗方法及装置
CN117271098B (zh) 一种ai模型计算核调度方法、装置、设备及存储介质
CN110471962B (zh) 活跃数据报表的生成方法和系统
CN112381215B (zh) 一种面向自动机器学习的自适应搜索空间生成方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination