一种基于贝叶斯网络的因果关系判定方法
技术领域
本发明属于原因追溯技术领域,涉及一种基于贝叶斯网络的因果关系判定方法。
背景技术
原因追溯即在发生了一件意外事件或者意外效果的情况下,进行逐步地推理以获取隐藏于该事件或该效果的关键原因和根本原因,揭示出其复杂的因果关系。
例如,公开号为CN109063253A的中国专利公开一种基于贝叶斯网络的航空电源系统可靠性建模方法,包括为航空电源系统各元件建立输入输出关系描述表格;对N个子表各行数据,构建对应贝叶斯网络节点;确定所建贝叶斯网络各节点的父节点;为元件C在步骤2中的同名贝叶斯网络节点构建同名父节点,在确定所建贝叶斯网络各节点状态基础上确定各节点条件概率分布;为供电汇流条确定目标节点,计算航空电源系统供电可靠度;为各供电汇流条确定对应目标节点,计算航空电源系统供电可靠度。本发明提高了航空电源系统可靠性计算效率。该方法仅涉及一个对象发生的某一事件。
例如,公开号为CN105468703A的中国专利公开的一种原因追溯方法,包括以下步骤:初始化因果关系知识库,该因果关系知识库中包括一类对象的异常现象和引起该异常现象的原因,以及异常现象和其原因之间的因果关系;在异常现象列表中选出当前已知状态的异常现象,根据因果关系知识库中的因果关系,形成新的因果关系知识库并记录追溯的原因;输出追溯到的原因作为结果信息。
现有技术中,原因追溯针对于某一实体对象出现异常或者意外的效果时,但是对于至少两个对象发生至少一个特定事件时却不能够进行原因追溯;此外,该原因追溯方法仅仅涉及定性的判定。因此,如何确定至少两个对象发生了至少一个特定事件的情况下,如何地去判定该特定事件的原因,亟需一种系统或者方法解决。
发明内容
针对现有技术之不足,本发明提供了一种基于贝叶斯网络的因果关系判定系统,包括:构建模块,用于构建贝叶斯网络;判定模块,用于生成并输出基于所述请求贝叶斯网络的因果关系谱;因果库,用于建立历史原始文献库;在至少两个对象发生至少一个非特定事件的情况下,所述构建模块分析引起所述非特定事件的所述对象的自身因素以构建因素集并基于所述因素集构建无向图结构约束;并且所述构建模块能够基于所述因果库对所述无向图结构约束进行修正以建立所述贝叶斯网络;所述判定模块基于所述贝叶斯网络计算所述自身因素引起所述非特定事件的因果指标并基于所述因果指标输出非特定事件的因果关系谱,从而确定所述非特定事件的关键原因。
根据一种优选的实施方式,所述构建模块基于所述非特定事件定义至少一个领域,并基于所述因果库在所述领域中检索所述非特定事件相关的至少一种排他因素;在所述排他因素不属于所述自身因素的情况下,所述构建模块提示所述第三方进行证据查明;在所述第三方认定了所述排他因素是客观存在的情况下,所述构建模块将所述排他因素补加入所述无向图结构约束对所述无向图结构约束进一步修正。
根据一种优选的实施方式,所述构建模块在基于所述因果库对因素对Lm和Ln之间的关系进行检索失败的情况下,所述构建模块提示所述第三方对所述因素对Lm和Ln之间的关系进行专家论证,并将所述专家论证的结果反馈至所述因果库,所述因果库对所述专家论证的结果进行深度学习以修正所述因果库;在所述因果库对所述专家论证的结果进行深度学习的情况下,所述构建模块基于所述因果库按照所述因素对Lm和Ln编号对所述因素对Lm和Ln之间的关系进行修正。
根据一种优选的实施方式,所述构建模块基于所述自身因素建立数据集D,并按照所述数据集D为单元将所述自身因素划分为若干因素集L并按照两两配对的方式形成因素对Lm和Ln,并对所述数据集D和所述因素对Lm和Ln进行编号;所述构建模块基于所述因果库对按照因素对编号对因素对Lm和Ln之间的关系进行检索,并根据检索结果进行修正因素对Lm和Ln之间的关系并且对Lm→Ln的关系信度值、Ln→Lm的关系信度值以及Ln⊥Lm的关系信度值进行赋值,以此构建所述无向图结构约束。
根据一种优选的实施方式,根据贝叶斯法则,所述构建模块基于所述数据集D和所述因素对集L构建贝叶斯网络评价函数,所述评价函数用于能够基于所述无向图结构约束在所述构建模块启用启发式搜索算法的情况下从若干个候选贝叶斯网络中迭代生成评价指标最高的贝叶斯网络,其中,所述构建模块首先基于所述无向图结构约束首先构建初始的第一候选贝叶斯网络并采用贝叶斯网络评价函数对其进行评价获得第一评价指标;随后,所述构建模块启用所述启发式搜索算法对所述第二候选贝叶斯网络基于所述无向图结构约束进行局部修改,并再次使用所述贝叶斯网络评价函数对所述第二候选贝叶斯网络进行评价获得第二评价指标;所述构建模块能够基于所述启发式搜索算法按照迭代循环的方式获取至少两个候选贝叶斯网络及对应的评价指标;所述构建模块在获取了至少两个候选贝叶斯网络并获取了至少两个评价指标的情况下,会输出一个评价指标最优的作为输出非特定事件的因果关系谱的最终贝叶斯网格。
根据一种优选的实施方式,所述判定模块基于所述最终贝叶斯网格和Pearl原理计算各因素对Lm和Ln之间的所述因果指标,从而输出所述因果关系谱,其中,对于因素Lm,通过遍历的形式基于所述无向图结构约束获取与因素Lm相连接的节点构成其节点集;并逐次计算每个节点与因素Lm之间的相关性,并从中选取相关性最大的节点进行独立性假定,删除在给定数据集D下与Lm独立的节点,以提升所述判定模块的判定效率;因素Ln与因素Lm之间的独立性通过互信息度量:
在所述互信息超出了互信息的阈值时,则因素Ln与因素Lm具有相关性,不大独立;在所述互信息不超出了互信息的所述阈值,则因素Ln与因素Lm不具有相关性,独立。
根据一种优选的实施方式,所述因果库按照以下方式建立:所述因果库按照技术领域基于获取的众多含有多种历史属性的相关文献并对其进行分类形成若干文献单元体以构建所述原始文献库,以通过数据模式挖掘属性之间的关系信度值;其中,所述因果库中的文献层统计每一个文献中单词/词组的频率,按照独立性假设获取所述单词/所述词组的联合出现概率;所述文献层计算所述单词/所述词组的关联性强度;所述文献层构建所述文献的关联约化坐标,并基于全部的所述相关文献的所述关联约化坐标和所述关联性强度构建的分类函数将所述相关文献按照迭代算法的形式进行分类以形成若干所述文献单元体。
根据一种优选的实施方式,在所述因果库中的数据层获取了所述文献单元体的情况下,所述数据层按照两个历史属性配对的方式获取所述数据集;所述数据层对每一个所述相关文献以自然语言处理的句法分析方式提取其中两个历史属性之间的关系,用以建立所述两个历史属性的关系知识库,所述两个历史属性之间的关系包括正向关系、反向关系和垂直关系;并且,所述数据层基于关系知识表在所述文献单元体内对包含有所述两个历史的文献进行检索以融合的方式获取所述两个历史属性的关系信度值用以建立所述两个历史属性的关系信度值库,所述两个历史属性之间的关系包括正向关系信度值、反向关系信度值和垂直关系信度值;从而,所述数据层基于对所有历史之间按照两两配对的方式建立的所述关系知识库和关系信度值库构建所述历史数据集。
根据一种优选的实施方式,本发明还公开了一种基于贝叶斯网络的因果关系判定方法,所述方法包括:构建模块构建贝叶斯网络;判定模块生成并输出基于所述请求贝叶斯网络的因果关系谱;因果库建立历史原始文献库;在至少两个对象发生至少一个非特定事件的情况下,所述构建模块分析引起所述非特定事件的所述对象的自身因素以构建因素集并基于所述因素集构建无向图结构约束;并且所述构建模块能够基于所述因果库对所述无向图结构约束进行修正以建立所述贝叶斯网络;所述判定模块基于所述贝叶斯网络计算所述自身因素引起所述非特定事件的因果指标并基于所述因果指标输出非特定事件的因果关系谱,从而确定所述非特定事件的关键原因。
根据一种优选的实施方式,所述方法还包括:所述构建模块基于所述非特定事件定义至少一个领域,并基于所述因果库在所述领域中检索所述非特定事件相关的至少一种排他因素;在所述排他因素不属于所述自身因素的情况下,所述构建模块提示所述第三方进行证据查明;在所述第三方认定了所述排他因素是客观存在的情况下,所述构建模块将所述排他因素补加入所述无向图结构约束对所述无向图结构约束进一步修正。
本发明的优点主要在于针对于至少两个对象之间发生的至少一个非特定事件构建其因素之间贝叶斯网络的无向图约束,并基于文献知识库和专家知识库对该无向图约束进行修正,然后基于该无向图约束采用启发式搜索算法构建其贝叶斯网络。该贝叶斯网络的结构学习主要用于揭示变量间的定性关系,同时揭露定量关系。然而,单纯从数据角度出发进行贝叶斯网络构建存在诸多困难。依托对象之间的非特定事件及其历史事件可以增加贝叶斯网络构建的正确性。最后以构建的贝叶斯网络为基础,实现因果分析推理。综上所述,融合对象知识构建合理的贝叶斯网络和因果分析推理,确定非特定事件的因果关系谱及确定关键原因是本发明要解决的重点问题。
附图说明
图1是本发明提供的判定方法的一种优选实施例的流程示意图;和
图2是本发明提供的判定系统的一种优选的模块示意图。
附图标记列表
1:构建模块 2:判定模块
3:因果库
具体实施方式
下面结合附图1和2进行详细说明。
本发明的描述中,术语“第一”、“第二”、“第三”和仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”和的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
实施例1
本实施例提供一种基于贝叶斯网络的因果关系判定系统,旨在针对于至少两个对象发生了至少一个非特定事件时的因果关系谱的输出。本发明的优点主要在于针对于至少两个对象之间发生的至少一个非特定事件构建其因素之间贝叶斯网络的无向图约束,并基于文献知识库和专家知识库对该无向图约束进行修正,然后基于该无向图约束采用启发式搜索算法构建其贝叶斯网络。该贝叶斯网络的结构学习主要用于揭示变量间的定性关系,同时揭露定量关系。然而,单纯从数据角度出发进行贝叶斯网络构建存在诸多困难。依托对象之间的非特定事件及其历史事件可以增加贝叶斯网络构建的正确性。最后以构建的贝叶斯网络为基础,实现因果分析推理。综上所述,融合对象知识构建合理的贝叶斯网络和因果分析推理,确定非特定事件的因果关系谱及确定关键原因是本发明要解决的重点问题。
具体地,该系统包括构建模块1、判定模块2和因果库3。构建模块1用于构建贝叶斯网络。判定模块2用于生成并输出基于请求贝叶斯网络的因果关系谱。因果库3用于建立历史原始文献库。对于至少两个对象在至少一个非特定事件的情况下,构建模块1分析引起非特定事件的对象的自身因素以构建因素集并基于因素集构建无向图结构约束。并且构建模块1能够基于因果库3对无向图结构约束进行修正以建立贝叶斯网络。判定模块2基于贝叶斯网络计算自身因素引起非特定事件的因果指标并基于因果指标输出非特定事件的因果关系谱,从而确定非特定事件的关键原因。在本发明中,非特定事件可以是真实发生的事件,例如两两车之间的碰撞等。非特定事件也可以是科研人员预想的事件,例如宇宙飞船对接失败等。
优选地,构建模块1基于非特定事件定义至少一个领域,并基于因果库3在领域中检索非特定事件相关的至少一种排他因素。在排他因素不属于自身因素的情况下,构建模块1提示第三方进行证据查明;在第三方认定了排他因素是客观存在的情况下,构建模块1将排他因素补加入无向图结构约束对无向图结构约束进一步修正。
优选地,构建模块1在基于因果库3对因素对Lm和Ln之间的关系进行检索失败的情况下,构建模块1提示第三方对因素对Lm和Ln之间的关系进行专家论证,并将专家论证的结果反馈至因果库3,因果库3对专家论证的结果进行深度学习以修正因果库3。在因果库3对专家论证的结果进行深度学习的情况下,构建模块1基于因果库3按照因素对Lm和Ln编号对因素对Lm和Ln之间的关系进行修正。
优选地,构建模块1基于自身因素建立数据集D,并按照数据集D为单元将自身因素划分为若干因素集L并按照两两配对的方式形成因素对Lm和Ln,并对数据集D和因素对Lm和Ln进行编号。构建模块1基于因果库3对按照因素对编号对因素对Lm和Ln之间的关系进行检索,并根据检索结果进行修正因素对Lm和Ln之间的关系并且对Lm→Ln的关系信度值、Ln→Lm的关系信度值以及Ln⊥Lm的关系信度值进行赋值,以此构建无向图结构约束。
优选地,根据贝叶斯法则,构建模块1基于数据集D和因素对集L构建贝叶斯网络评价函数,评价函数用于能够基于无向图结构约束在构建模块1启用启发式搜索算法的情况下从若干个候选贝叶斯网络中迭代生成评价指标最高的贝叶斯网络。优选地,构建模块1首先基于无向图结构约束首先构建初始的第一候选贝叶斯网络并采用贝叶斯网络评价函数对其进行评价获得第一评价指标;随后,构建模块1启用启发式搜索算法对第二候选贝叶斯网络基于无向图结构约束进行局部修改,并再次使用贝叶斯网络评价函数对第二候选贝叶斯网络进行评价获得第二评价指标;构建模块1能够基于启发式搜索算法按照迭代循环的方式获取至少两个候选贝叶斯网络及对应的评价指标。构建模块1在获取了至少两个候选贝叶斯网络并获取了至少两个评价指标的情况下,会输出一个评价指标最优的作为输出非特定事件的因果关系谱的最终贝叶斯网格。
优选地,判定模块2基于最终贝叶斯网格和Pearl原理计算各因素对Lm和Ln之间的因果指标,从而输出因果关系谱。其中,对于因素Lm,通过遍历的形式基于无向图结构约束获取与因素Lm相连接的节点构成其节点集。并逐次计算每个节点与因素Lm之间的相关性,并从中选取相关性最大的节点进行独立性假定,删除在给定数据集D下与Lm独立的节点,以提升判定模块2的判定效率。因素Ln与因素Lm之间的独立性通过互信息度量:
在互信息超出了互信息的阈值时,则因素Ln与因素Lm具有相关性,不大独立;在互信息不超出了互信息的阈值,则因素Ln与因素Lm不具有相关性,独立。
优选地,因果库3按照以下方式建立:因果库3按照技术领域基于获取的众多含有多种历史属性的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以通过数据模式挖掘属性之间的关系信度值;其中,因果库3中的文献层统计每一个文献中单词/词组的频率,按照独立性假设获取单词/词组的联合出现概率;文献层计算单词/词组的关联性强度;文献层构建文献的关联约化坐标,并基于全部的相关文献的关联约化坐标和关联性强度构建的分类函数将相关文献按照迭代算法的形式进行分类以形成若干文献单元体。
优选地,在因果库3中的数据层获取了文献单元体的情况下,数据层按照两个历史属性配对的方式获取数据集;数据层对每一个相关文献以自然语言处理的句法分析方式提取其中两个历史属性之间的关系,用以建立两个历史属性的关系知识库,两个历史属性之间的关系包括正向关系、反向关系和垂直关系;并且,数据层基于关系知识表在文献单元体内对包含有两个历史的文献进行检索以融合的方式获取两个历史属性的关系信度值用以建立两个历史属性的关系信度值库,两个历史属性之间的关系包括正向关系信度值、反向关系信度值和垂直关系信度值;从而,数据层基于对所有历史之间按照两两配对的方式建立的关系知识库和关系信度值库构建历史数据集。
实施例2
本实施例公开了一种基于贝叶斯网络的因果关系判定方法,用于医疗纠纷中的责任确定,在不造成冲突或者矛盾的情况下,其他实施例的优选实施方式的整体和/或部分内容可以作为本实施例的补充。优选地,该方法可以由本发明的方法和/或其他可替代的模块实现。
医闹是指受雇于医疗纠纷的患者方,与患者家属一起,采用各种途径以严重妨碍医疗秩序、扩大事态、给医院造成负面影响的形式给医院造成施加压力并从中牟利的行为。医闹的直接后果是导致我国医务人员的直接或间接大量流失,并产生十分严重恶劣的影响,严重影响我国医务事业的发展。在发生医疗纠纷时,对医疗纠纷产生的原因的划分是难以界定的。医疗纠纷指发生在医疗卫生、预防保健、医学美容等具有合法资质的医疗企事业法人或机构的纠纷,目前中国的医疗纠纷是特别不好处理的事情。究其原因,医疗纠纷通常是由医疗过错和过失引起的。医疗过失是医务人员在诊断护理过程中所存在的失误。医疗过错是指医务人员在诊疗护理等医疗活动中的过错。这些过错往往导致病人的不满意或造成对病人的伤害,从而引起医疗纠纷。除了由于医疗过错和过失引起的医疗纠纷外,有时,医方在医疗活动中并没有任何疏忽和失误,仅仅是由于患者单方面的不满意,也会引起纠纷。这类纠纷可以是因患者缺乏基本的医学知识,对正确的医疗处理、疾病的自然转归和难以避免的并发症以及医疗中的意外事故不理解而引起的,也可以是由于患者的毫无道理的责难而引起的。亦有人称之为医疗侵权纠纷,即医疗服务的提供者与接受者之间对医疗行为及其后果是否侵权及侵权责任的争议。因此,为了给予医者一个舒适健康的工作环境以及被医者公平公正的说法,需要对该医疗纠纷产生的原因以透明化的方式呈现出来,做到透明性和公平性。
因此,本实施列提供一种本发明提供了一种基于贝叶斯网络的因果关系判定方法旨在协助司法部门解决医疗纠纷。在医疗纠纷司法实践中,对于举证双发主张的证据或者主张的因素的采纳多是从法律角度出发,对于证据或者因素的之间的关系多是采用定性的角度进行评定,这也是导致医患双发纠缠不清的原因之一,也是困扰司法人员裁定或者判决的原因之一;在医患双发纠缠不清的情况下,双发会对裁定或者判决进行质疑乃至上诉,占用过多的法律资源。在倡导“公平正义”的法治价值追求的年代,通过“数据说话”的方式来解决医患双发的矛盾,还予医生一个救死扶伤的轻松的工作环境,给予患者或者其家属一个信服的说法,提供给司法机构一份科学的参考文件,即是本发明所具有的重要价值。
具体地,该方法主要包括:
S1:构建模块1:构建贝叶斯网络。具体地,构建模块1基于医方和患方主张的因素构建无向图结构约束。并且在第三方介入的情况下,构建模块1基于因果库3对无向图结构约束进行修正以建立贝叶斯网络。
S2:判定模块2:基于贝叶斯网络输出因果关系谱。判定模块2基于贝叶斯网络计算各因素对之间的因果指标并基于因果指标输出医疗纠纷的因果关系谱,以使得因果关系谱即兼顾医患双方主张的因素又考虑科学性,能够有效防止医患双方的纠纷升级并且为第三方提供了裁定或判决的数据支撑。
优选地,步骤S1具体的步骤包括:
S11:根据医方和患方主张的因素建立数据集D=(D1,D2……Di)为若干组属性。L=(L1,L2……Ln)某一组属性的具体因素对合。例如,医方主张的因素包括患者患病时间、就医时间、患病程度和患病种类。则数据集可以时间属性和病症属性建立数据集D=(时间属性、病症属性)。而具体因素对合L则时间因素对应的患病时间和就医时间的具体属性,并对其进行编号。
S12:基于医方和患方主张的因素之间的关系构建无向图结构约束。通过检索医方和患方主张的因素之间的关系确定各具体因素对之间的关系,并对因素对进行编号。优选的,因素对之间的关系包括正向关系、负向关系以及垂直关系,即属性Lm影响属性Ln,记为Lm→Ln。属性Lm和属性Ln能够出现的关系为可能为反向关系,即属性Ln影响属性Lm,记为Ln→Lm。属性Lm和属性Ln出现的关系可能为垂直关系,即属性Lm与属性Ln,互不影响Ln⊥Lm。例如,患方认为药物成分导致了脑瘫加重,则药物成分影响脑瘫加重,则药物成分与脑瘫加重构成正向关系,记为药物成分→脑瘫加重。当然,也可以认为脑瘫加重与药物成分构成负向关系,同样记为药物成分→脑瘫加重。
S13:基于因果库对无向图结构约束进行修正。在因果库中对因素对编号进行检索,并根据检索对因素对Lm和Ln的关系进行修正,以及Lm→Ln的关系信度值、Ln→Lm的关系信度值以及Ln⊥Lm的关系信度值进行赋值。例如,患方认为药物成分会导致脑瘫加重,但是经过因果库的检索发现药物成分不会导致脑瘫加重,则将药物成分→脑瘫加重修正为药物成分⊥脑瘫加重。例如,药物成分是L1,脑瘫加重为L2,那么药物成分→脑瘫加重的编号记为12。
优选地,构建模块1基于医方和患方主张的因素定义至少一个请求领域,并基于请求领域检索与医方和患方主张的因素相关的其他至少一种因素。在该至少一种因素不在医方和患方主张的因素内的情况下,构建模块1提示第三方进行证据查明。在第三方认定了该至少一种因素是客观存在的情况下,构建模块1将该至少一种因素补加入无向图结构约束对无向图结构约束进一步修正。例如,发生一例新生儿死亡事件,医方和患方主张的因素中包括羊水栓塞、缺氧和多胎,则构建模块1会基于这些因素定义出的请求领域为妇女生产,那么构建模块1会在因果库3中对应的妇女生产领域检索与该事故存在的其他因素,例如检索出子宫壁薄,而子宫壁薄并未出现在医方和患方主张的因素中,则构建模块1会提示第三方去查明产妇是否有子宫壁薄的情况下,如果该情况客观存在,则构建模块1将加入子宫壁薄这一因素对其进行无向图结构约束进行进一步修正。即在步骤S13中,还存在另有一种可能性即某一双方均未举证的至少一种因素是影响结果的重要因素,则构建模块1会提示第三方对该至少一种因素进行查明,如果该至少一种因素是客观发生了的,则需要将至少一种因素加入无向图结构约束对其修正,以增加结果的可靠性以及科学性,提升第三方的公平判决或裁定,显示了第三方的严谨性、公平性和责任性。
优选地,因果库3中可能不存在某一因素对或某些因素对之间的关系及其关系信度值。为了保障双方主张的因素能够得到支持。即构建模块1在基于因果库3对因素对Lm和Ln之间的关系进行检索失败的情况下,构建模块1提示第三方对因素对Lm和Ln之间的关系进行专家论证。例如,患方主张了新生儿的头部大小不是新生儿死亡的原因。在因果库3中不存在新生儿的头部大小和新生儿死亡的关系。那么构建模块1会提示第三方进行专家论证。并将专家论证的结果反馈至因果库3,因果库3对专家论证的结果进行深度学习以修正因果库3。在因果库3对专家论证的结果进行深度学习的情况下,构建模块1基于因果库3按照因素对Lm和Ln编号对因素对Lm和Ln之间的关系进行修正。
优选地,构建模块1基于因果库3、数据集D和因素对集L构建贝叶斯网络评价函数:
logP(G,D,KL)=logP(G)+logP(D|G)+logP(KL|G)
优选地,构建模块1基于贝叶斯网络评价函数和无向图结构约束构建请求贝叶斯网络。式中,G为贝叶斯网格,其取值包括了以L=(L1,L2……Ln)某一组属性的具体因素对合为节点的有向无环图。其中,P(G)为先验分布。根据现有知识可知,logP(G)+logP(D|G)的最大值等价于logP(G|D)。logP(G|D)可以根据贝叶斯信息标准BIC评分。式中,
其中,如结构G中任意一条边表示为Lm→Ln,则 KL(Lm→Ln)即为关系信度值。公式中的求和是对结构G中所有的有向边对应的正向关系的文献知识可信度进行求和。对于给定数据集D,对D中的任意因素对Lm和Ln,基于所述贝叶斯网络评价函数和所述无向图结构约束构建贝叶斯网络。确定贝叶斯网络的无向图结构约束后,可执行启发式搜索算法,如K2算法,寻求评分函数最优的网络结构。一般步骤为:从初始模型开始搜索,在搜索的每一步,首先用搜索算子对当前模型进行局部修改,得到一系列候选模型,然后计算每个候选模型的评分,并将最优候选模型与当前模型比较。若最优候选模型的评分大,则它作为下一个当前模型,继续搜索;否则停止搜索,返回当前模型。根据贝叶斯原理,评分最大的候选模型即为贝叶斯网络。优选地,依据根据建立的贝叶斯网络以及贝叶斯规则构建贝叶斯网络评价函数。贝叶斯网络评价函数能够根据经典启发式结构学习算法构建,例如K2算法、Max-Min Parents and Children算法和马尔可夫链蒙特卡洛搜索等等
优选地,判定模块2基于请求贝叶斯网络和Pearl原理计算各因素对之间的因果指标,从而输出因果关系谱。判定模块2基于以通过数据模式挖掘属性之间的因果指标,从而能够根据因果指标属性之间是否构成并发症或合并症。在因果指标时,判定模块2基于Pearl原理和贝叶斯网络结构对属性之间因果指标进行计算。Pearl在探索事件X是否为事件Y的原因时,需要通过干预X实行X事件,计算E(Y|do(X)),即事件Y在干预X的情况下,其变化的平均情况大于显著性水平,则认为X是Y的原因。
在判定模块2基于以通过数据模式挖掘属性之间的因果指标时,由于文献量的巨大,从而造成贝叶斯网格的巨大,因此,采用后门准则计算因果指标。后门准则是指,贝叶斯网格G是一个有向无环图,(Lm,Ln)是G的一对节点,节点Z集合是(Lm,Ln)的后门,其中,Z中所有的节点都不是Z的后代并且Z阻断了所有指向Lm的连接Lm到Ln的路径。因此,可以通过后门原则来推理因素对Lm和Ln的因果关系。
为了能够在不影响因素对之间的因果关系的情况下,判定模块2通过独立性检验简化无向图约束。例如,独立性检验可以采用卡方独立性检验。在本发明中,独立性检验还可以采用如下方式:对于因素Lm,通过编列的形式基于构建的无向图获取与Lm相连接的节点构成其节点集。并逐次计算每个节点与因素Lm之间的相关性,并从中选取相关性最大的节点进行独立性假定,删除在给定请求子集Di下与Lm独立的节点。在本发明中,采用熵来度量因素对集Lm的不确定性。在给定因素Lm的情况下,因素Ln的不确定性可用条件熵如下方式度量:
因素Ln与Lm之间的相关程度可以通过互信息度量:
如果互信息超出了互信息的阈值,则认为Ln与Lm具有相关性。如果互信息不超出了互信息的阈值,则认为Ln与Lm不具备相关性。
优选地,因果库3按照以下方式建立:因果库3按照技术领域基于获取的众多含有多种历史属性的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以通过数据模式挖掘历史属性之间的关系信度值。其中,因果库3中的文献层统计每一个文献中单词/词组的频率,按照独立性假设获取单词/词组的联合出现概率。文献层计算单词/词组的关联性强度;文献层构建文献的关联约化坐标,并基于全部的相关文献的关联约化坐标和关联性强度构建的分类函数将相关文献按照迭代算法的形式进行分类以形成若干文献单元体。
优选地,文献层基于获取的众多含有多种历史属性的相关文献。文献层对相关文献进行分类形成若干文献单元体以构建原始文献库。该相关文献包括就诊病历、研究报告、会议文献、期刊文献、书籍、学术论文和专利。在如此大量的文献的情况下,其需要按照一定的方法进行分类。进行文献分类是为了能够有效的观察历史属性之间的关联以及减小系统的负荷。例如可以按照消化道疾病、心血管疾病和神经科疾病等进行分类。也可以按照学术领域进行分类,例如康复学和心理学等等进行分类。不过,在大量文献的严峻形式下,其准确高效的分类会直接影响并发症和合并症的区别。优选地,文献分来可以采用贝叶斯法、SVM方法和k-NN法。
优选地,相关文献分类按照如下方式进行:文献层统计每一个文献中单词/词组的频率,按照独立性假设获取单词/词组的联合出现概率。例如,对于一个具体的文献,其联合出现概率分布可以按照朴素贝叶斯方法计算。
优选地,文献层计算单词/词组的关联性强度。通过关联性强度的计算,能够反映单词/词组的关联性,对于文献的分类是适宜的。优选地,在分类时,定义N为文献样本的集合,V是文献类型的集合,Vi是第i个文献类型的子集。W是单词/词组集合,Wi是第i个单词/词组的子集。在Vi中含有Sj个样本,其中第p个样本的关联约化坐标Tp是一个n维数组:
其中,ki(i=1,2,3,…n)中第i个单词出现的个数,归一化系数。
在Vi的关联向量是所有Vi中样本关联约化坐标的平均,该值反映了文献中单词/词组的关联性强度即:
优选地,文献层获取文献的关联约化坐标,并基于全部的相关文献的关联约化坐标构建的分类函数将相关文献按照迭代算法的形式进行分类以形成若干文献单元体。优选地,对于任意文献其关联约化坐标为:
式中,qi是文献中第i个单词出现的次数。在进行分类是,待分类文献与每一类文献Vi的支撑点(b1,b2,…,bn)的距离记为:
根据关联性强度,构建文献分类函数:
式中,γi与关联性强度相关。
优选地,迭代算法可以采用最小化迭代算法、极小优化迭代算法和期望最大迭代算法。优选地,分类函数能够基于相关文献的样本量进行深度学习,从而增强文献层的精度。
优选地,在因果库3中的数据层获取了文献单元体的情况下,数据层按照两个历史属性配对的方式获取历史数据集。数据层对每一个相关文献以自然语言处理的句法分析方式提取其中两个历史属性之间的关系,用以建立两个历史属性的关系知识库,两个历史属性之间的关系包括正向关系、反向关系和垂直关系。并且,数据层基于关系知识表在文献单元体内对包含有两个历史的文献进行检索以融合的方式获取两个历史属性的关系信度值用以建立两个历史属性的关系信度值库,两个历史属性之间的关系包括正向关系信度值、反向关系信度值和垂直关系信度值,从而,数据层基于对所有历史之间按照两两配对的方式建立的关系知识库和关系信度值库构建历史数据集。
优选地,数据层能够基于文献单元体获取主要特征参数并基于主要特征参数构建历史数据集。以降低众多相关文献形成的众多特征参数对于历史属性之间因果关系的干扰并提高原始文献库的利用价值。优选地,在数据层获取了文献单元体的情况下,数据层按照两个历史属性配对的方式获取历史数据集。数据层对每一个相关文献以自然语言处理的句法分析方式提取其中两个历史属性之间的关系,用以建立两个历史属性的关系知识库,两个历史属性之间的关系包括正向关系、反向关系和垂直关系。并且,数据层基于关系知识表在文献单元体内对包含有两个历史属性的文献进行检索以融合的方式获取两个历史属性的关系信度值用以建立两个历史属性的关系信度值库,两个历史属性之间的关系包括正向关系信度值、反向关系信度值和垂直关系信度值。从而,数据层基于对所有历史属性之间按照两两配对的方式建立的关系知识库和关系信度值库构建历史数据集。例如,在相关文献中,获取了历史属性L1、历史属性L2、历史属性L3和历史属性L4等若干历史属性。按照以上构建历史属性的关系,可以构建出历史属性L1和历史属性L3的关系知识库、历史属性L2和历史属性L3的关系知识库,依次类推。然后在单元文献体内,根据不同文献中的内容基于上述关系知识库构建关系信度值库。优选地,正向关系信度值、反向关系信度值和垂直关系信度值三者之和按照归一化处理。即在单元文献体内,对所有的文献进行遍历查询,对正向关系信度值、反向关系信度值和垂直关系信度值按照频率赋予权重。数据层将上述关系知识库和关系信度值库构建历史数据集输入判定模块2中,进行下一步地。
优选地,对于期刊文献,L1→L2的正向关系信度值还可以按照如下定义:
其中,C(Xi)为文献Xi的可信度,公式为:C(Xi)=(IFi+1)×(CIi+1),Xi表示第i篇文献,IFi为文献Xi所在期刊的标准化后的影响因子,CIi为标准化后的引用量。若没有文献存在L1和L2的关系,则则KL(L1→L2)=0,KL(L2→L1)=0,KL(L1⊥L2)=1。其他类型的文献可以采用同样的方式定义,例如病历可以根据医生的权威性进行定义。对于会议文章,可以根据会议的权威性进行定义等等。
实施例3
本实施例公开了一种基于贝叶斯网络的因果关系判定系统,在不造成冲突或者矛盾的情况下,其他实施例的优选实施方式的整体和/或部分内容可以作为本实施例的补充。优选地,该方法可以由本发明的方法和/或其他可替代的模块实现。
本实施例提供一种基于贝叶斯网络的因果关系判定方法,方法包括:构建模块1构建贝叶斯网络。判定模块2生成并输出基于请求贝叶斯网络的因果关系谱。因果库3建立历史原始文献库。在至少两个对象发生至少一个非特定事件的情况下,构建模块1分析引起非特定事件的对象的自身因素以构建因素集并基于因素集构建无向图结构约束;并且构建模块1能够基于因果库3对无向图结构约束进行修正以建立贝叶斯网络;判定模块2基于贝叶斯网络计算自身因素引起非特定事件的因果指标并基于因果指标输出非特定事件的因果关系谱,从而确定非特定事件的关键原因。
优选地,构建模块1基于非特定事件定义至少一个领域,并基于因果库3在领域中检索非特定事件相关的至少一种排他因素。在排他因素不属于自身因素的情况下,构建模块1提示第三方进行证据查明。在第三方认定了排他因素是客观存在的情况下,构建模块1将排他因素补加入无向图结构约束对无向图结构约束进一步修正。
优选地,本发明中采用的构建模块1是具有搜索引擎的并且具有运算功能的服务器。判断模块2是具有运算功能的数据服务器。因果库3搜索引擎的并且具有运算功能和储存的服务器。构建模块1、判断模块2和因果库3相互之间通过光纤、数据线、蓝牙、wifi和/或4G等有线、无线方式通信连接。
需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。