CN117252186A - 基于xai的信息处理方法、装置、设备及存储介质 - Google Patents

基于xai的信息处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117252186A
CN117252186A CN202311004606.8A CN202311004606A CN117252186A CN 117252186 A CN117252186 A CN 117252186A CN 202311004606 A CN202311004606 A CN 202311004606A CN 117252186 A CN117252186 A CN 117252186A
Authority
CN
China
Prior art keywords
causal
sequence
information
causal relationship
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311004606.8A
Other languages
English (en)
Inventor
杨一帆
王悦嘉
孙弋涵
夏正勋
唐剑飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Xinghuan Intelligent Technology Co ltd
Original Assignee
Nanjing Xinghuan Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Xinghuan Intelligent Technology Co ltd filed Critical Nanjing Xinghuan Intelligent Technology Co ltd
Priority to CN202311004606.8A priority Critical patent/CN117252186A/zh
Publication of CN117252186A publication Critical patent/CN117252186A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种基于XAI的信息处理方法、装置、设备及存储介质。其中,该方法包括:对目标对象的原始解释文本进行解析,获得初始因果关系序列;从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列;将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;根据所述目标因果关系序列生成所述目标对象的目标解释文本,以根据所述目标解释文本对所述目标对象进行评估。本技术方案,对原始解释信息进行进一步的处理,使得获得的目标解释信息的准确性和适用性更强。

Description

基于XAI的信息处理方法、装置、设备及存储介质
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种基于XAI的信息处理方法、装置、设备及存储介质。
背景技术
随着人工智能的应用普及,人们越来越关注人工智能模型的黑盒问题,可解释人工智能(Explainable AI,XAI)能够为黑盒模型提供一定的可解释性,但其也普遍存在一些问题,例如:同一个决策结果或决策过程,同时存在多个合理的解释,但这些解释之间有很大的差异性,这给用户带来了选择性的困扰,反而降低了人们对人工智能模型决策结果的信任。此类问题被称为“罗生门问题”。当前对于罗生门问题的解决方法主要有:正则化方法、平均方法等。当前的方法本质上是从多个解释中挑选一个大概率正确的解释,并不符合正常的因果逻辑及推理分析逻辑。
发明内容
本发明实施例提供一种基于XAI的信息处理方法、装置、设备及存储介质,对原始解释文本进行进一步的处理,使得获得的目标解释文本的准确性和适用性更强。
根据本发明的一方面,本发明实施例提供了一种基于XAI的信息处理方法,包括:
对目标对象的原始解释文本进行解析,获得初始因果关系序列;其中,所述因果关系序列包括多个因果关系,且每个因果关系包括因信息和果信息;
从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列;其中,所述设定维度包括如下至少一项:数据维度、知识图谱维度、模型维度及用户认知维度;所述第一中间因果关系序列包括所述初始因果关系序列和扩增因果关系序列;
将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;
对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;
根据所述目标因果关系序列生成所述目标对象的目标解释文本,以根据所述目标解释文本对所述目标对象进行评估。
可选的,对目标对象的原始解释文本进行解析,获得初始因果关系序列,包括:
若所述原始解释文本中携带有因果标签,则基于所述因果标签提取因信息和果信息;
根据所述因信息和果信息构建多个因果关系,获得初始因果关系序列。
可选的,对目标对象的原始解释文本进行解析,获得初始因果关系序列,包括:
若所述原始解释文本中未携带有因果标签,则对所述原始解释文本进行分词处理;
识别各分词的主体,并提取主体间的因果关系,获得初始因果关系序列。
可选的,若所述设定维度为数据维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
获取与所述原始解释文本相关的多源数据集;
将所述多源数据集中的字段与所述因果关系序列中的因信息和/或果信息进行语义相似性匹配;
对匹配成功的字段进行因果关系分析和/或相关性分析,获得扩增因果关系序列;
将所述扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,若所述设定维度为知识图谱维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
对于所述初始因果关系序列中的因信息和果信息,从设定知识图谱中查到所述因信息的父节点和/或子节点,以及所述果信息的父节点和/或子节点;
根据查找到的父子关系确定扩增因果关系序列;
将所述扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,若所述设定维度为模型维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
对于所述初始因果关系序列中的因信息,将所述因信息输入多个第一模型中,输出多个新的果信息,所述因信息和所述多个新的果信息组成第一子扩增因果关系序列;
对于所述初始因果关系序列中的果信息,将所述因信息输入多个第二模型中,输出多个新的因信息,将所述多个新的因信息和所述果信息组成第二子扩增因果关系序列;
将所述第一子扩增因果关系序列、第二子扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,若所述设定维度为用户认知维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
获取与所述原始解释文本相关的用户认知文本;
提取所述用户认知文本中的因果关系,确定为用户认知因果关系;
基于所述用户认知因果关系与所述初始因果关系序列的语义相似性确定扩增因果关系序列;
将所述扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列,包括:
获取所述第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息,作为隐信息关联信息;
确定与所述隐信息关联信息满足设定条件的候选信息集;其中,所述设定条件为无因果关系或者存在间接因果关系;
将所述候选信息集中与所述隐信息的相关系数最大的候选信息确定为代理信息;
将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列。
可选的,对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列,包括:
将所述第二中间因果关系序列中的具有序贯效应的因果关系组合为至少一个因果关系链;其中,所述因果关系链中包含至少三个信息,且无分支;
对所述至少一个因果关系链进行检验,保留检验通过的因果关系,并确定各因果关系间的置信度,获得目标因果关系序列。
根据本发明的另一方面,本发明实施例还提供了一种基于XAI的信息处理装置,包括:
初始序列获取模块,用于对目标对象的原始解释文本进行解析,获得初始因果关系序列;其中,所述因果关系序列包括多个因果关系,且每个因果关系包括因信息和果信息;
第一中间序列获取模块,用于从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列;其中,所述设定维度包括如下至少一项:数据维度、知识图谱维度、模型维度及用户认知维度;所述第一中间因果关系序列包括所述初始因果关系序列和扩增因果关系序列;
第二中间序列获取模块,用于将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;
目标序列获取模块,用于对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;
目标解释文本生成模块,用于根据所述目标因果关系序列生成所述目标对象的目标解释文本,以根据所述目标解释文本对所述目标对象进行评估。
根据本发明的另一方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的基于XAI的信息处理方法。
根据本发明的另一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的基于XAI的信息处理方法。
本发明实施例的技术方案,通过对目标对象的原始解释文本进行解析,获得初始因果关系序列;从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列;将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;根据所述目标因果关系序列生成所述目标对象的目标解释文本,以根据所述目标解释文本对所述目标对象进行评估。本技术方案,对原始解释信息进行进一步的处理,使得获得的目标解释信息的准确性和适用性更强。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种基于XAI的信息处理方法的流程图;
图2是根据本发明实施例二提供的一种基于XAI的信息处理方法的流程图;
图3是根据本发明实施例三提供的一种基于XAI的信息处理装置的结构示意图;
图4是根据本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是根据本发明实施例一提供的一种基于XAI的信息处理方法的流程图,本实施例可适用于对信息进行处理的情况,该方法可以由一种基于XAI的信息处理装置来执行,具体包括如下步骤:
步骤110、对目标对象的原始解释文本进行解析,获得初始因果关系序列。
其中,因果关系序列可以包括多个因果关系,且每个因果关系包括因信息和果信息。其中,因信息可以理解为原因信息;果信息可以理解为由于原因信息造成的结果信息。目标对象可以理解为需要进行原始解释文本解析的对象。目标对象可以是用户对象或者企业对象,还可以是任意产品对象或者任意事件对象等。原始解释文本可以理解为对某个用户的描述信息或者某个企业的评估信息,或者是其他事务的描述信息或者评估信息等。原始解释文本可能来源于多个维度的分析结果,通常可以包含统计归因的解释结果、人工推理的解释结果、模型学习的解释结果以及认知评价的推断性解释等内容;其内容的形式可以是文字描述、符号推理、用户评级等等,具有不确定性、模糊性。原始解释文本中可以携带有因果标签信息,也可以不携带有因果标签信息。解析可以理解为对原始解释文本进行分析,提取解释内容中的因果关系。本实施例中对目标对象的原始解释文本的分析技术实现可以基于解释的属性标签进行分类,也可以基于语义分析技术。初始因果关系序列可以是对目标对象的原始解释文本进行解析得到的,可以包括多个因果关系的序列。
本实施例中可以对目标对象的原始解释文本进行解析,以获得初始因果关系序列。
在本实施例中,可选的,对目标对象的原始解释文本进行解析,获得初始因果关系序列,包括:若原始解释文本中携带有因果标签,则基于因果标签提取因信息和果信息;根据因信息和果信息构建多个因果关系,获得初始因果关系序列。
其中,因果标签可以理解为原始解释文本中携带的含有因果信息的标签。本实施例中可以从因果标签中提取出因信息和果信息。因果关系可以是根据因信息和果信息构建的,可以有多个因果关系。
本实施例中的原始解释文本中可以携带有因果标签,也可以不携带有因果标签,若原始解释文本中携带有因果标签,则可以基于因果标签提取因信息和果信息;根据因信息和果信息构建多个因果关系,从而获得初始因果关系序列。
本实施例中对于携带有因果标签的原始解释文本,可以在在前置步骤中,对原始解释的内容标注上因或果的属性,示例性的,原始解释文本的形式可以为{昨天南京的一场小雨<#1C#>打湿<#1R#2C#>了路面,有不少人路过时摔跤<#2R#>了。}中有2组因果关系序列,分别标记为#1、#2,其中C为因,R为果,其次需要按上述规则模板可以抽取出2组因果关系{雨#1C#->湿#1R#}、{湿#2C#->摔跤#2R#},从而获得初始因果关系序列。本实施例中的最终输出结果为原始结果解析后的初始因果关系序列,可以记为E[]={C1->R1,C2->R2,…,Cn->Rn},其中C与R均有可能重复,以满足一因多果、多因一果、多因多果的各种需求,可以简记为E[]={…,Ci->Ri,…}。
本实施例中通过这样的设置,可以基于原始解释文本中携带的因果标签进行提取因信息和果信息,然后构建多个因果关系,以获得初始因果关系序列,更加方便快捷。
在本实施例中,可选的,对目标对象的原始解释文本进行解析,获得初始因果关系序列,包括:若原始解释文本中未携带有因果标签,则对原始解释文本进行分词处理;识别各分词的主体,并提取主体间的因果关系,获得初始因果关系序列。
其中,分词处理可以理解为基于基于自然语言处理(NLP)技术对解释内容进行分词处理。本实施例中对原始解释文本进行分词处理后,可以得到多个分词。本实施例中对各分词进行主体识别可以理解为对各分词进行词性的识别,例如主语、谓语以及宾语等词性的识别。
本实施例中若原始解释文本中未携带有因果标签,则对原始解释文本进行分词处理,识别各分词的主体,并提取主体间的因果关系,以获得初始因果关系序列。
具体的,本实施例中对于未携带因果标签的原始解释文本,可以将原始解释文本进行解析。首先基于自然语言处理(NLP)技术对原始解释文本内容进行分词,其次对分词后的词组进行主体识别(NER),抽取出其中名词、动词等实体,接着对主体间的因果关系进行关系抽取(RE),并输出其中存在因果关系的主体对作为初始因果关系序列输出。本实施例中通过这样的设置,可以对未携带因果标签的原始解释文本进行分析处理以及关系提取,能够灵活性的对原始解释文本进行处理,从而获得初始因果关系序列。
步骤120、从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列。
其中,设定维度可以包括如下至少一项:数据维度、知识图谱维度、模型维度及用户认知维度;第一中间因果关系序列可以包括初始因果关系序列和扩增因果关系序列。其中,数据维度可以理解为基于多源数据集的统计归因解释进行扩增。知识图谱维度可以理解为基于知识系统检索的解释进行扩增。模型维度可以理解为基于模型反事实推理能力的解释进行扩增。用户认知维度可以理解为基于用户的评价评论结果的解释进行扩增。本实施例中可以通过设定维度中的任一个维度或者多种维度对原始解释文本进行扩增处理,从而可以得到更加全面的因果关系序列。
其中,第一中间因果关系序列可以理解为从设定维度对初始因果关系序列进行扩增处理得到的。扩增因果关系序列可以理解为从设定维度中的任一个维度对初始因果关系序列进行扩增处理得到的关系序列。
本实施例中可以从数据维度、知识图谱维度、模型维度及用户认知维度中至少一个作为设定维度对初始因果关系序列进行扩增处理,以获得第一中间因果关系序列。
在本实施例中,可选的,若设定维度为数据维度,则从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:获取与原始解释文本相关的多源数据集;将多源数据集中的字段与因果关系序列中的因信息和/或果信息进行语义相似性匹配;对匹配成功的字段进行因果关系分析和/或相关性分析,获得扩增因果关系序列;将扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
其中,多源数据集可以理解为与原始解释文本相关的不同来源的数据集。语义相似性匹配可以是将多源数据集中的字段与因果关系序列中的因信息,或者是果信息,或者是因信息和果信息根据其语义进行相似性的匹配。因果关系分析可以理解为对匹配成功的字段进行是否存在因果关系进行分析。相关性分析可以理解为对匹配成功的字段进行是否存在相关性进行分析。具体的,本实施例中进行因果关系分析或者相关性分析可以采用PC算法、FCI算法等算法进行分析。
本实施例中由于扩增得到的因果关系序列中的某些序列并不存在因果关系,则可以通过因果关系分析和相关性分析将不符合的因果关系的序列过滤掉。本实施例中基于数据维度进行扩增得到的扩增因果关系序列可以是对匹配成功的字段进行因果关系分析,或者进行相关性分析,或者进行因果关系分析和相关性分析得到的。第一中间因果关系序列可以是将扩增因果关系序列和初始因果关系序列进行合并得到的。
本实施例中若设定维度为数据维度时,可以进行获取与原始解释文本相关的多源数据集;将多源数据集中的字段与因果关系序列中的因信息和/或果信息进行语义相似性匹配;并对匹配成功的字段进行因果关系分析和/或相关性分析,以获得扩增因果关系序列;再将扩增因果关系序列和初始因果关系序列进行合并,从而获得第一中间因果关系序列。
示例性的,本实施例中若设定维度为数据维度时,以初始因果关系序列Ci->Ri为例,可以进行获取与原始解释文本相关的多源数据集DataSet_Ext,可以基于扩增数据集DataSet_Ext,对于Ci->Ri进行扩展。首先可以将扩增数据集的字段与Ci、Ri进行匹配,匹配结果记为C^i、R^i,匹配方法主要采用字段名的语义相似性匹配,至少需要匹配到其中1项,若无匹配结果,则继续匹配其他解释对;其次再扩展数据集DataSet_Ext中对C^i、R^i进行基于约束的因果关系分析或相关性分析(此方法为现有方法比如PC算法、FCI算法等),分析的最终解释扩展结果,也就是第一中间因果关系序列记为Edata[]={D^->C^i,C^i->D^·····D^->R^i,R^i->D^······},其中D^为C^i、R^i的因信息或果信息。
本实施例通过这样的设置,可以从不同设定维度对初始因果关系序列进行扩增处理,从而可以得到更加全面的因果关系序列。
在本实施例中,可选的,若设定维度为知识图谱维度,则从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:对于初始因果关系序列中的因信息和果信息,从设定知识图谱中查到因信息的父节点和/或子节点,以及果信息的父节点和/或子节点;根据查找到的父子关系确定扩增因果关系序列;将扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
其中,设定知识图谱可以理解为设定好的网格状的知识图谱,可以是从设定的知识图谱系统中检索的。具体的,本实施例中可以利用专家经验库以及知识图谱KG等有基本推理查询能力的系统进行查询检索因信息的父节点和/或子节点,以及果信息的父节点和/或子节点。父子关系可以是因信息的父节点,或者子节点,或者是父节点和子节点,以及可以是果信息的父节点,或者子节点,或者是父节点和子节点。本实施例中可以根据查找到的父子关系确定扩增因果关系序列。
本实施例中若设定维度为知识图谱维度时,则对于初始因果关系序列中的因信息和果信息,从设定知识图谱中查到因信息的父节点和/或子节点,以及果信息的父节点和/或子节点,并根据查找到的父子关系确定扩增因果关系序列;然后将扩增因果关系序列和初始因果关系序列进行合并,以获得第一中间因果关系序列。
示例性的,本实施例中若设定维度为知识图谱维度时,以初始因果关系序列Ci->Ri为例,首先可以以Ci、Ri为输入,调用知识系统的查询接口,通常知识系统会返回包含Ci、Ri的路径结果,通常可以表示为一个图的形式DAG(Ci,Ri);其次对DAG(Ci,Ri)中父节点和/或子节点关系路径进行提取,规则为父节点为因、子节点为果,分析的最终解释扩结果,也就是第一中间因果关系序列可以为Ekg[]={V^->Ci,Ci->V^····V^->Ri,Ri->V^?…….},其中V^为知识系统中的一个实体,也为Ci、Ri的因信息或果信息。
本实施例通过这样的设置,可以从不同设定维度对初始因果关系序列进行扩增处理,从而可以得到更加全面的因果关系序列。
在本实施例中,可选的,若设定维度为模型维度,则从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:对于初始因果关系序列中的因信息,将因信息输入多个第一模型中,输出多个新的果信息,因信息和多个新的果信息组成第一子扩增因果关系序列;对于初始因果关系序列中的果信息,将因信息输入多个第二模型中,输出多个新的因信息,将多个新的因信息和果信息组成第二子扩增因果关系序列;将第一子扩增因果关系序列、第二子扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
其中,模型维度可以理解为预先建立多个归因模型或者解释结果的神经模型。第一模型可以理解为预先建立好的归因的神经网络模型,可以用于基于因信息寻找多个新的果信息的模型,可以有多个。本实施例中可以将初始因果关系序列中的因信息输入到多个第一模型中,可以输出多个新的果信息。第一子扩增因果关系序列可以是由因信息和多个新的果信息组成的因果关系序列。第二模型可以理解为预先建立好的神经网络模型,可以用于基于果信息寻找多个新的因信息的模型,可以有多个。第二子扩增因果关系序列可以是由多个新的因信息和果信息组长的因果关系序列。本实施例中可以将第一子扩增因果关系序列、第二子扩增因果关系序列和初始因果关系序列进行合并,以获得第一中间因果关系序列。
本实施例中若设定维度为模型维度时,对于初始因果关系序列中的因信息,将因信息输入多个第一模型中,输出多个新的果信息,然后因信息和多个新的果信息组成第一子扩增因果关系序列;对于初始因果关系序列中的果信息,将因信息输入多个第二模型中,输出多个新的因信息,然后将多个新的因信息和果信息组成第二子扩增因果关系序列;最后将第一子扩增因果关系序列、第二子扩增因果关系序列和初始因果关系序列进行合并,以获得第一中间因果关系序列。
示例性的,本实施例中若设定维度为模型维度时,以初始因果关系序列Ci->Ri为例,当对一个结果Ri进行解释时,通常不同的XAI模型会给出不一样的解释结果,对同一问题建模的不同工作模型,其工作机制和预测结果也会不一样。本实施例可以通过模型反事实的能力,对原有的解释结果对E[]进行扩增。其具体步骤为:首先针对同一个工作模型或原始问题学习不同的XAI模型解释方法,新得到的XAI模型记为XAInew1、XAInew2……XAInewn。其次使用新的XAI模型对Ri进行解释,可以输出结果为Enew1[]、Enew2[]……Enewn[],Enewi[]的形式具体为{Cnew1->R1,Cnew2->R2……Cnewi->Ri……},Cnewi为新找到的因因子。汇总最终的解释结果对,也就是第一中间因果关系序列输出可以为Emodel[]={Enew1[]、Enew2[]……Enewn[]}={Cnew1->R1,Cnew2->R2……Cnewn->Rn}。
本实施例通过这样的设置,可以从不同设定维度对初始因果关系序列进行扩增处理,从而可以得到更加全面的因果关系序列。
在本实施例中,可选的,若设定维度为用户认知维度,则从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:获取与原始解释文本相关的用户认知文本;提取用户认知文本中的因果关系,确定为用户认知因果关系;基于用户认知因果关系与初始因果关系序列的语义相似性确定扩增因果关系序列;将扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
其中,用户认知文本可以理解为其他用户对原始解释文本中对应的主体的一些评价信息,可以包含对应的因果关系。用户认知因果关系可以是通过提取用户认知文本中的因果关系确定的。扩增因果关系序列可以是基于用户认知因果关系与初始因果关系序列的语义相似性进行确定的。
本实施例中若设定维度为用户认知维度时,则可以获取与原始解释文本相关的用户认知文本;然后提取用户认知文本中的因果关系,确定为用户认知因果关系;可以基于用户认知因果关系与初始因果关系序列的语义相似性确定扩增因果关系序列;将扩增因果关系序列和初始因果关系序列进行合并,从而获得第一中间因果关系序列。
示例性的,本实施例中若设定维度为用户认知维度时,以初始因果关系序列Ci->Ri为例,首先对用户评论进行分词处理;其次将E[]中的序列Ci、Ri做为输入,在分词结果中进行匹配式检索;最后以命中的分词为起点,提取与其存在因果关系的实体,记为Vnewi,根据父连子连接关系,将这些实体归类为Ci、Ri的原因因子或结果因子,输出新的解释对,也就是第一中间因果关系序列可以记为Ereview[]={Vnew1->R1…Vnewi->Ri…C1->Vnewi…Cj->Vnewj…}。
本实施例通过这样的设置,可以从不同设定维度对初始因果关系序列进行扩增处理,从而可以得到更加全面的因果关系序列。
此外,本实施例中针对原始解释进行扩增处理的实现方式,除了实施例内容中列举方式之外,还可以通过与第三方系统对接的形式获取扩增结果,这种方式可以获取领域类、更专业准确的扩展解释结果。本发明实施例中多维度的解释结果扩增模块,也可以部署在不同的机构组织,可通过分布式系统或隐私计算平台的模式,实现多方协同的XAI过程。
步骤130、将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列。
其中,隐信息可以理解为无法直接度量的信息。代理信息可以理解为可以代理隐信息进行度量的信息;代理信息可以是从多源数据集中得到的。示例性的,以Ci->Ri为例,Ci为无法直接度量变量,也就是隐信息,则需要在试验对象主体的数据集Dataset-Test中寻找Ci的代理信息Ci-proxy。
本实施例中由于在因果实证检验试验中,可能是因受限于参测对象的属性或具体数据集,或者因子为隐信息无法直接度量,从而导致待验证的因子在试验场景中找不到匹配对象的情况,试验无法进行,因此,将第一中间因果关系序列中的隐信息替换为代理信息。第二中间因果关系序列可以是通过将第一中间因果关系序列中的隐信息替换为代理信息得到的。
本实施例中可以将第一中间因果关系序列中的隐信息替换为代理信息,以获得第二中间因果关系序列。
步骤140、对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列。
其中,目标因果关系序列可以的对第二中间因果关系序列中的因果关系进行检验,并保留检验通过的因果关系得到的。
本实施例中可以对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列。
步骤150、根据目标因果关系序列生成目标对象的目标解释文本,以根据目标解释文本对目标对象进行评估。
其中,目标解释文本可以是通过检验后的目标因果关系序列生成的,具有置信度、推理结构和实证支撑的解释性结果。本实施例中可以根据目标因果关系序列生成目标对象的目标解释文本,以便于根据目标解释文本对目标对象进行评估。
本发明实施例的技术方案,通过对目标对象的原始解释文本进行解析,获得初始因果关系序列;从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列;将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;根据目标因果关系序列生成目标对象的目标解释文本,以根据目标解释文本对目标对象进行评估。本技术方案,对原始解释文本进行进一步的处理,使得获得的目标解释文本的准确性和适用性更强。
实施例二
图2是根据本发明实施例二提供的一种基于XAI的信息处理方法的流程图,本实施例以上述实施例为基础进行优化。具体优化为:将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列,包括:获取第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息,作为隐信息关联信息;确定与隐信息关联信息满足设定条件的候选信息集;其中,设定条件为无因果关系或者存在间接因果关系;将候选信息集中与隐信息的相关系数最大的候选信息确定为代理信息;将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列。如图2所示,本实施例的方法具体包括如下步骤:
步骤210、对目标对象的原始解释文本进行解析,获得初始因果关系序列。
步骤220、从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列。
步骤230、获取第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息,作为隐信息关联信息。
其中,隐信息关联信息可以理解为第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息。本实施例中可以是从多源数据集中得到的隐信息关联信息。
本实施例中可以获取第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息。
步骤240、确定与隐信息关联信息满足设定条件的候选信息集。
其中,设定条件可以为无因果关系或者存在间接因果关系。无因果关系可以理解为不存在因果关系的信息。间接因果关系可以理解为存在间接因果关系的信息。候选信息集可以是与隐信息关联信息无因果关系或者存在间接因果关系的信息集合。
本实施例中可以确定与隐信息关联信息无因果关系或者存在间接因果关系的候选信息集。
步骤250、将候选信息集中与隐信息的相关系数最大的候选信息确定为代理信息。
本实施例中将候选信息集中的信息与隐信息进行相关性分析。其中,相关系数最大的候选信息可以理解为进行相关性分析,并按照相关系数大小排序得到的相关系数最大的信息。本实施例中可以将候选信息集中与隐信息的相关系数最大的候选信息确定为代理信息。
步骤260、将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列。
本实施例中可以将第一中间因果关系序列中的隐信息替换为代理信息,从而获得第二中间因果关系序列。
示例性的,以因果关系序列Ci->Ri为例,Ci为无法直接度量变量,也就是隐信息,则需要在试验对象的数据集Dataset-Test中寻找Ci的代理信息Ci-proxy,其寻找方法具体可以为:首先对Dataset-Test中的字段与Ri做因果分析,将与Ri无直接因果关系或者存在间接因关系的字段输出为FarCausal(Ri)={DN1,DN2……DNi};其次,对FarCausal(Ri)中字段与Ci做相关性分析,并按相关系数大小排序,其分析结果为ProxySet(Ci)={…DNi>DNi+1},选择相关系数最大的字段为Ci的代理变量,记为proxy(Ci)。按照上述方法可以对所有的Eext[]处理后结果记为E’ext[]={…Ci->Ri…proxy(Cj)->Rj},对R也会有类似处理,此处不再赘述。本实施例中的所有的待验证因子信息均可被观测测量到,从而得到第二中间因果关系序列。
步骤270、对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列。
在本实施例中,可选的,对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列,包括:将第二中间因果关系序列中的具有序贯效应的因果关系组合为至少一个因果关系链;其中,因果关系链中包含至少三个信息,且无分支;对至少一个因果关系链进行检验,保留检验通过的因果关系,并确定各因果关系间的置信度,获得目标因果关系序列。
其中,因果关系链可以是将第二中间因果关系序列中具有序贯效应的因果关系组成的,可以有多个因果关系链。因果关系链中可以包含至少三个信息,且无分支。序贯效应可以理解为因果关系序列,可能是两对两个词构成的因果关系,但某个词可以是一个因果关系的果信息,又是另一个因果关系的因信息,这时,这两对因果关系序列就具有序贯效应。本实施例中可以对组合成的因果关系链进行检验,将检验不通过的因果关系进行删除,保留检验通过的因果关系。
本实施例中可以将第二中间因果关系序列中的具有序贯效应的因果关系组合为至少一个因果关系链,然后对至少一个因果关系链进行检验,保留检验通过的因果关系,并确定各因果关系间的置信度,从而获得目标因果关系序列。
示例性的,本实施例中可以先对E’ext[]中有序贯效应的解释对,也就是因果关系序列,组合成一个无分支的因果关系链,其具体处理规则为:形如A->B,B->C的因果关系序列,可组合为A->B->C。需要注意的是单个AB堆叠试验通常进行不相关单因素验证试验,因此对于出现多因1果的形式比如A->B、A’->B,需要拆分为A->B->C、A’->B->C单独的因果关系链,不能放在一个试验中。其次,由于本实施例中因链式反应的最终结果用于检验因果关系,所以无需记录所有的试验结果。其记录规则可以为,对于形如A->B->C的因果关系链,只需记录A是否导致B发生、B是否导致C发生,结果为P(A->B)、P(B->C),当连续发生时更只输出一个结果P(A->B->C)。最后,对所有堆叠试验的结果进行分析,其主要采用的方法可以为因果分析的基本方法,即通过判断是否存在因果效应判断是否存在因果关系。将存在因果关系的解释因果对作为最终的因果关系序列输出,其形式可以为Efinal[]={…Ci->Cj->R…->Y},与原始解释结果有显著差异的是经过对照试验实证过程后,此外,本实施例中原始解释文本处理的每一步骤均有对应的置信度,有利于对解释结果进行进一步的利用,有更强的说服力。本实施例中除了采用自动化随机对比试验的方式检验解释结果外,还可以与专家决策系统对接或基于知识图谱(Knowledge Graphs,KG)系统的评估方式实现对解释结果的校验。
步骤280、根据目标因果关系序列生成目标对象的目标解释文本,以根据目标解释文本对目标对象进行评估。
示例性的,本实施例的应用场景可以是电商A能推荐系统推荐其客户购买品牌B的电动汽车,采用本实施例方案解决推荐结果解释的罗生门问题。在本实施例中,电商A已有的智能推荐系统可以提供多个维度的推荐结果解释,以客户B为例,该客户的特征为{ID='XXXX',Age=24,Occupation=‘Professional’,Address=’beijing’,AnnualConsumption=150000,Repayment credit=0.6,Purchasing power=0.7,Browsing historyrelevancy=0.8,Willing to buy=0.6,Purchase Record Relevancy=0.7,Brandrecognition=0.6,Personalrisk level=2},电商A对推荐该客户购买品牌B的电动汽车的推荐度得分为70分,属于较为契合的推荐客户,建议进行推荐,电商A现有的推荐结果解释系统对于该评分的解释为:1.客户B年纪较轻,过往在平台上的年消费总额尚可,所以该客户的购买能力足够,因此判断该客户购买能力足够,所以可以推荐B品牌的电动汽车;2.客户B的年龄较小,且在平台上往期的还款信用不是特别高,所以个人购买能力评价较低,所以应降低为该客户推荐B品牌汽车的推荐度;3.该客户的年龄、职业、住址与品牌B电动汽车的客户人群高度重合,所以判断该客户对品牌B有较高认可度的可能性较高,所以应提高该客户的B品牌电动汽车的推荐度。显而易见,这些解释之间存在矛盾、模糊性的情况,存在罗生门问题。以此为例详述本发明的具体实施细节如下:
本实施例中样本数据集(Dataset-Test)为申请人的多维度衡量数据:例如样本数据集可以包括ID(编号),Age(年龄),Occupation(职业),Address(住址),AnnualConsumption(平台年消费额),Repayment credit(还款信用),Purchasing power(购买能力),Browsing history relevancy(浏览记录相关度),Willing to buy(购买意愿),Brandrecognition(品牌认可度),Purchase Record Relevancy(购买记录相关度),Personalrisk level(个人风险等级),以及电商A为用户推荐品牌B的电动汽车的推荐度评分Recommendation Score;任务目标为得到电商用于评估向客户推荐特定商品的推荐度评分(Recommendation Score)结果的可靠可信行解释。具体实施可以分为三个阶段,具体如下:
第一阶段:第一中间因果关系序列的扩增性生成阶段,本阶段可以将输入的贷款决策的原始解释文本从数据维度和模型维度两个方面进行解析,并进行因扩增,具体步骤如下:
首先,对输入的原始解释文本进行解析,获得初始因果关系序列。
本实施例中可以先提取原始解释文本“1.客户过往在平台上的年消费总额尚可,分期还款信用较好,所以该客户的购买能力足够,因此判断该客户购买能力足够,所以可以推荐B品牌的电动汽车;2.客户B的年龄较小,所以个人购买能力评价较低,所以应降低为该客户推荐B品牌汽车的推荐度;3.该客户的年龄、住址与品牌B电动汽车的客户人群高度重合,所以判断该客户对品牌B有较高认可度的可能性较高,所以应提高该客户的B品牌电动汽车的推荐度。”中的所有推荐决策的结果关系,本实施中解释为无标签模式,因此需要基于语义技术对原始解释进行分词及关系提取,本实施中采用的分词算法为NLP语义技术,采用的关系提取算法为基于特征向量的分类算法,上述处理后原始解释中的因果关系记为E[]={"Age(年龄)"->"Purchasing power(购买能力)","Annual Consumption(平台年消费额)"->"Purchasing power(购买能力)","Repayment credit(还款信用)"->"Purchasing power(购买能力)","Purchasing power(购买能力)"->"Willing to buy(购买意愿)","Browsing history relevancy(浏览记录相关度)"->"Willing to buy(购买意愿)","Willing to buy(购买意愿)"->"推荐度评分","Age(年龄)"->"Brand recognition(品牌认可度)","Address(住址)"->"Brand recognition(品牌认可度)","Brandrecognition(品牌认可度)"->"推荐度评分"};这也就是得到的初始因果关系序列。
然后基于设定维度对初始因果关系序列扩增,基于上一步骤对原始解释文本进行解析输出的智能推荐初始因果关系序列,对序列E[]里因果关系序列的因信息进行扩增处理,以获取更大范围的解释。本实施例中可以从数据维度、知识图谱维度、模型维度及用户认知维度四个维度方法进行因信息扩增,本实施例中可以选取数据维度和模型维度两个维度进行具体说明,具体因扩增方法如下:
数据维度,基于多源数据集对统计归因类型智能推荐解释扩增。本步骤扩展数据集DataSet_Ext含有2亿条数据,主要内容为来自其他业务数据库中的其他多维度信息,本案例中使用的扩增数据源包括ID(编号),Birthday(出生日期),Job Title(就业职称),Purchasing power(购买能力),Brand recognition(品牌认可度),Personal risk level(个人风险等级)等特征。首先将扩增数据集的字段与上一步骤得到初始因果关系序列中E[]中的每一个因子进行匹配,采用字段名的语义相似性匹配,在扩展数据集DataSet_Ext中匹配到"Purchasing power(购买能力)"、"Personal risk level(个人风险等级)"、"Brand recognition(品牌认可度)"三个字段与原数据集相同;然后,在DataSet_Ext中使用基于约束的因果分析算法,如PC算法等对这三个字段进行分析,得到"Job Title(就业职称)"->"Brand recognition(品牌认可度),将这个新找到的因果关系序列放入扩展因果关系序列中,可得Edata[]={"Job Title(就业职称)"->"Brand recognition(品牌认可度)"}。
模型维度,基于模型反事实推理能力对智能推荐解释进行扩增。在本步骤中,以"Willing to buy(购买意愿)"为例,首先,我们使用样本集中的样本,训练一个线性回归模型,该模型能够通过Dataset-Test中除了"Willing to buy(购买意愿)"的其他特征,训练一个预测"Willing to buy(购买意愿)"的模型,然后,使用KernelShap方法,得到其他所有特征对于预测结果的shap-value,例如"Purchase Record Relevancy(购买记录相关度)"的shap-value为2.53,"Age(年龄)"的shap-value为0.05,...,最终我们发现PurchaseRecord Relevancy(购买记录相关度)的sharp-value超过我们设定的阈值2.3,所以得到得到如下解释扩展结果:Emodel[]={"Purchase Record Relevancy(购买记录相关度)"->"Willing to buy(购买意愿)"}。
经设定维度对初始因果关系序列进行扩展后得到的第一中间因果关系序列可以记为Eext[]={E[],Edata[],Ekg[],Emodel[],Ereview[]},所有的解释对的基础形式依然为X->Y的形式,可以简记为Eext[]={"Age(年龄)"->"Purchasing power(购买能力)","AnnualConsumption(平台年消费额)"->"Purchasing power(购买能力)","Repayment credit(还款信用)"->"Purchasing power(购买能力)","Purchasing power(购买能力)"->"Willingto buy(购买意愿)","Browsing history relevancy(浏览记录相关度)"->"Willing tobuy(购买意愿)","Purchase Record Relevancy(购买记录相关度)"->"Willing to buy(购买意愿)"==(原始关系没有,扩展出来,但原始有这个字段),"Willing to buy(购买意愿)"->"推荐度评分","Age(年龄)"->"Brand recognition(品牌认可度)","Job Title(就业职称)"->"Brand recognition(品牌认可度)","Address(住址)"->"Brandrecognition(品牌认可度)","Brand recognition(品牌认可度)"->"推荐度评分"}。
对于数据维度、知识图谱维度、模型维度及用户认知维度四个维度,本实施例中仅选取了数据维度与模型维度进行扩增。在具体的应用实践中,本发明可适用于任一学习场景或四个维度的组合中。
第二阶段:目标因果关系序列检验任务生成及验证阶段。此阶段主要为对上一步骤得到的第一中间因果关系序列Eext[]解释进行生成实证性检验任务。Eext[]中的假设性解释通常无法进行直接验证,故本阶段采用因子代理方法,使其能够具有落地实施可能性;同时基于因果关系的堆叠试验设计方法,高效进行大规模对解释结果因果的实证试验。其具体步骤如下:
首先,将第一中间因果关系序列中的隐变量替换为代理信息处理,获得第二中间因果关系序列。
本实施例中,使用语义相似度方法来寻找数据集Dataset-Test所没有的因子在Dataset-Test中的代理信息特征,对于"Job Title(就业职称)",在Dataset-Test中找到代理特征"Occupation(职业)",经过该步骤处理后,所有的待验证因子均可被观测测量到,Eext[]处理后第二中间因果关系序列的结果可以记为E’ext[]={"Age(年龄)"->"Purchasing power(购买能力)","Annual Consumption(平台年消费额)"->"Purchasingpower(购买能力)","Repayment credit(还款信用)"->"Purchasing power(购买能力)","Purchasing power(购买能力)"->"Willing to buy(购买意愿)","Browsing historyrelevancy(浏览记录相关度)"->"Willing to buy(购买意愿)","Purchase RecordRelevancy(购买记录相关度)"->"Willing to buy(购买意愿)"==(原始关系没有,扩展出来,但原始有这个字段),"Willing to buy(购买意愿)"->"推荐度评分","Age(年龄)"->"Brand recognition(品牌认可度)","Occupation(职业)"->"Brand recognition(品牌认可度)","Address(住址)"->"Brand recognition(品牌认可度)","Brand recognition(品牌认可度)"->"推荐度评分"}。
然后,对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列。其具体处理如下:
首先,将E’ext[]中有序贯效应的解释对组合成一个无分支的因果关系链,组合后得到E’ext2[]={"Repayment credit(还款信用)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分","Age(年龄)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分","Annual Consumption(平台年消费额)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分","Browsing history relevancy(浏览记录相关度)"->"Willing to buy(购买意愿)"->"推荐度评分","Purchase Record Relevancy(购买记录相关度)"->"Willing to buy(购买意愿)"->"推荐度评分","Age(年龄)"->"Brand recognition(品牌认可度)"->"推荐度评分","Occupation(职业)"->"Brand recognition(品牌认可度)"->"推荐度评分","Address(住址)"->"Brand recognition(品牌认可度)"->"推荐度评分"}。
其次,对E’ext2[]中每一个无分支的因果关系链进行因果对照实验,得到每一个因果关系链成立的置信度为Pext[]={P("Repayment credit(还款信用)"->"Purchasingpower(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分")=0.81,P("Age(年龄)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分")=0.35,P("Annual Consumption(平台年消费额)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分")=0.83,P("Browsing history relevancy(浏览记录相关度)"->"Willing to buy(购买意愿)"->"推荐度评分")=0.79,P("Purchase Record Relevancy(购买记录相关度)"->"Willing to buy(购买意愿)"->"推荐度评分")=0.91,P("Age(年龄)"->"Brand recognition(品牌认可度)"->"推荐度评分")=0.86,P("Occupation(职业)"->"Brand recognition(品牌认可度)"->"推荐度评分")=0.85,P("Address(住址)"->"Brand recognition(品牌认可度)"->"推荐度评分")=0.89}。
最后,可以取置信度的阈值为0.75,因果链的置信度低于该值则认为该因果链不成立,高于该值的则认为该因果关系链成立,最终目标因果关系序列只有"Age(年龄)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分"这一条因果链不成立,最终得到的因果解释输出为Efinal[]={"Repayment credit(还款信用)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分","AnnualConsumption(平台年消费额)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分","Browsing history relevancy(浏览记录相关度)"->"Willingto buy(购买意愿)"->"推荐度评分","Purchase Record Relevancy(购买记录相关度)"->"Willing to buy(购买意愿)"->"推荐度评分","Age(年龄)"->"Brand recognition(品牌认可度)"->"推荐度评分","Occupation(职业)"->"Brand recognition(品牌认可度)"->"推荐度评分","Address(住址)"->"Brand recognition(品牌认可度)"->"推荐度评分"},且每一步骤均有对应的置信度和实证支撑的解释结果。
第三阶段:目标解释信息输出阶段。
根据上一步骤输出目标因果关系序列Efinal[],整理最终输出的解释结果。此步骤可以基于现有的文本生成技术,可以将Efinal[]转化为更方便人类理解的语句"1.客户的年龄、职业、住址与品牌B的典型用户高度重合,对品牌B大概率有较高的认可度,适宜给用户推荐品牌B的电动汽车;2.客户过去在平台上的消费额较大,且过往分期还款信用较好,应该具有较好的购买能力,可以给用户推荐品牌B的电动汽车;3.通过对于客户浏览记录和过往的购买记录的分析,用户对品牌B的电动汽车有较高的购买意愿,可以进行推荐"。相比原始解释文本,本实施例的技术方案可以为用户提供每一条因果关系链的置信度Pext[],其智能推荐解释性结果具有实证支撑,且去除了"Age(年龄)"->"Purchasing power(购买能力)"->"Willing to buy(购买意愿)"->"推荐度评分"的因果链,解决了现有系统的罗生门问题,使得获得的目标解释信息的准确性和适用性更强。
本发明实施例的技术方案,通过对目的对象的原始解释文本进行解析,获得初始因果关系序列;从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列;获取第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息,作为隐信息关联信息;确定与隐信息关联信息满足设定条件的候选信息集;其中,设定条件为无因果关系或者存在间接因果关系;将候选信息集中与隐信息的相关系数最大的候选信息确定为代理信息;将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;根据目标因果关系序列生成目标对象的目标解释文本,以根据目标解释文本对目标对象进行评估。本技术方案,对原始解释文本进行进一步的处理,使得获得的目标解释信息的准确性和适用性更强。
实施例三
图3是根据本发明实施例三提供的一种基于XAI的信息处理装置的结构示意图,该装置可执行本发明任意实施例所提供的基于XAI的信息处理方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置包括:
初始序列获取模块310,用于对目标对象的原始解释文本进行解析,获得初始因果关系序列;其中,因果关系序列包括多个因果关系,且每个因果关系包括因信息和果信息。
第一中间序列获取模块320,用于从设定维度对初始因果关系序列进行扩增处理,获得第一中间因果关系序列;其中,设定维度包括如下至少一项:数据维度、知识图谱维度、模型维度及用户认知维度;第一中间因果关系序列包括初始因果关系序列和扩增因果关系序列。
第二中间序列获取模块330,用于将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列。
目标序列获取模块340,用于对第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列。
目标解释文本生成模块350,用于根据目标因果关系序列生成目标对象的目标解释文本,以根据目标解释文本对目标对象进行评估。
可选的,初始序列获取模块310,具体用于:
若原始解释文本中携带有因果标签,则基于因果标签提取因信息和果信息;
根据因信息和果信息构建多个因果关系,获得初始因果关系序列。
可选的,初始序列获取模块310,具体用于:
若原始解释文本中未携带有因果标签,则对原始解释文本进行分词处理;
识别各分词的主体,并提取主体间的因果关系,获得初始因果关系序列。
可选的,第一中间序列获取模块320,具体用于:
获取与原始解释文本相关的多源数据集;
将多源数据集中的字段与因果关系序列中的因信息和/或果信息进行语义相似性匹配;
对匹配成功的字段进行因果关系分析和/或相关性分析,获得扩增因果关系序列;
将扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,第一中间序列获取模块320,具体用于:
对于初始因果关系序列中的因信息和果信息,从设定知识图谱中查到因信息的父节点和/或子节点,以及果信息的父节点和/或子节点;
根据查找到的父子关系确定扩增因果关系序列;
将扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,第一中间序列获取模块320,具体用于:
对于初始因果关系序列中的因信息,将因信息输入多个第一模型中,输出多个新的果信息,因信息和多个新的果信息组成第一子扩增因果关系序列;
对于初始因果关系序列中的果信息,将因信息输入多个第二模型中,输出多个新的因信息,将多个新的因信息和果信息组成第二子扩增因果关系序列;
将第一子扩增因果关系序列、第二子扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,第一中间序列获取模块320,具体用于:
获取与原始解释文本相关的用户认知文本;
提取用户认知文本中的因果关系,确定为用户认知因果关系;
基于用户认知因果关系与初始因果关系序列的语义相似性确定扩增因果关系序列;
将扩增因果关系序列和初始因果关系序列进行合并,获得第一中间因果关系序列。
可选的,第二中间序列获取模块330,具体用于:
获取第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息,作为隐信息关联信息;
确定与隐信息关联信息满足设定条件的候选信息集;其中,设定条件为无因果关系或者存在间接因果关系;
将候选信息集中与隐信息的相关系数最大的候选信息确定为代理信息;
将第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列。
可选的,目标解释文本生成模块350,具体用于
将第二中间因果关系序列中的具有序贯效应的因果关系组合为至少一个因果关系链;其中,因果关系链中包含至少三个信息,且无分支;
对至少一个因果关系链进行检验,保留检验通过的因果关系,并确定各因果关系间的置信度,获得目标因果关系序列。
上述装置可执行本发明前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明前述所有实施例所提供的方法。
实施例四
图4是根据本发明实施例四提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM12以及RAM13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如基于XAI的信息处理方法。
在一些实施例中,基于XAI的信息处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM13并由处理器11执行时,可以执行上文描述的基于XAI的信息处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于XAI的信息处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种基于XAI的信息处理方法,其特征在于,包括:
对目标对象的原始解释文本进行解析,获得初始因果关系序列;其中,所述因果关系序列包括多个因果关系,且每个因果关系包括因信息和果信息;
从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列;其中,所述设定维度包括如下至少一项:数据维度、知识图谱维度、模型维度及用户认知维度;所述第一中间因果关系序列包括所述初始因果关系序列和扩增因果关系序列;
将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;
对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;
根据所述目标因果关系序列生成所述目标对象的目标解释文本,以根据所述目标解释文本对所述目标对象进行评估。
2.根据权利要求1所述的方法,其特征在于,对目标对象的原始解释文本进行解析,获得初始因果关系序列,包括:
若所述原始解释文本中携带有因果标签,则基于所述因果标签提取因信息和果信息;
根据所述因信息和果信息构建多个因果关系,获得初始因果关系序列。
3.根据权利要求1所述的方法,其特征在于,对目标对象的原始解释文本进行解析,获得初始因果关系序列,包括:
若所述原始解释文本中未携带有因果标签,则对所述原始解释文本进行分词处理;
识别各分词的主体,并提取主体间的因果关系,获得初始因果关系序列。
4.根据权利要求1所述的方法,其特征在于,若所述设定维度为数据维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
获取与所述原始解释文本相关的多源数据集;
将所述多源数据集中的字段与所述因果关系序列中的因信息和/或果信息进行语义相似性匹配;
对匹配成功的字段进行因果关系分析和/或相关性分析,获得扩增因果关系序列;
将所述扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
5.根据权利要求1所述的方法,其特征在于,若所述设定维度为知识图谱维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
对于所述初始因果关系序列中的因信息和果信息,从设定知识图谱中查到所述因信息的父节点和/或子节点,以及所述果信息的父节点和/或子节点;
根据查找到的父子关系确定扩增因果关系序列;
将所述扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
6.根据权利要求1所述的方法,其特征在于,若所述设定维度为模型维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
对于所述初始因果关系序列中的因信息,将所述因信息输入多个第一模型中,输出多个新的果信息,所述因信息和所述多个新的果信息组成第一子扩增因果关系序列;
对于所述初始因果关系序列中的果信息,将所述因信息输入多个第二模型中,输出多个新的因信息,将所述多个新的因信息和所述果信息组成第二子扩增因果关系序列;
将所述第一子扩增因果关系序列、第二子扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
7.根据权利要求1所述的方法,其特征在于,若所述设定维度为用户认知维度,则从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列,包括:
获取与所述原始解释文本相关的用户认知文本;
提取所述用户认知文本中的因果关系,确定为用户认知因果关系;
基于所述用户认知因果关系与所述初始因果关系序列的语义相似性确定扩增因果关系序列;
将所述扩增因果关系序列和所述初始因果关系序列进行合并,获得第一中间因果关系序列。
8.根据权利要求1所述的方法,其特征在于,将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列,包括:
获取所述第一中间因果关系序列中与隐信息存在因果关系的因信息或者果信息,作为隐信息关联信息;
确定与所述隐信息关联信息满足设定条件的候选信息集;其中,所述设定条件为无因果关系或者存在间接因果关系;
将所述候选信息集中与所述隐信息的相关系数最大的候选信息确定为代理信息;
将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列。
9.根据权利要求1所述的方法,其特征在于,对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列,包括:
将所述第二中间因果关系序列中的具有序贯效应的因果关系组合为至少一个因果关系链;其中,所述因果关系链中包含至少三个信息,且无分支;
对所述至少一个因果关系链进行检验,保留检验通过的因果关系,并确定各因果关系间的置信度,获得目标因果关系序列。
10.一种基于XAI的信息处理装置,其特征在于,包括:
初始序列获取模块,用于对目标对象的原始解释文本进行解析,获得初始因果关系序列;其中,所述因果关系序列包括多个因果关系,且每个因果关系包括因信息和果信息;
第一中间序列获取模块,用于从设定维度对所述初始因果关系序列进行扩增处理,获得第一中间因果关系序列;其中,所述设定维度包括如下至少一项:数据维度、知识图谱维度、模型维度及用户认知维度;所述第一中间因果关系序列包括所述初始因果关系序列和扩增因果关系序列;
第二中间序列获取模块,用于将所述第一中间因果关系序列中的隐信息替换为代理信息,获得第二中间因果关系序列;
目标序列获取模块,用于对所述第二中间因果关系序列中的因果关系进行检验,保留检验通过的因果关系,获得目标因果关系序列;
目标解释文本生成模块,用于根据所述目标因果关系序列生成所述目标对象的目标解释文本,以根据所述目标解释文本对所述目标对象进行评估。
11.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的基于XAI的信息处理方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-9中任一项所述的基于XAI的信息处理方法。
CN202311004606.8A 2023-08-09 2023-08-09 基于xai的信息处理方法、装置、设备及存储介质 Pending CN117252186A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311004606.8A CN117252186A (zh) 2023-08-09 2023-08-09 基于xai的信息处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311004606.8A CN117252186A (zh) 2023-08-09 2023-08-09 基于xai的信息处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117252186A true CN117252186A (zh) 2023-12-19

Family

ID=89125563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311004606.8A Pending CN117252186A (zh) 2023-08-09 2023-08-09 基于xai的信息处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117252186A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688137A (zh) * 2024-01-31 2024-03-12 成都航空职业技术学院 应用于汽车营销管理系统软件的数据分析方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688137A (zh) * 2024-01-31 2024-03-12 成都航空职业技术学院 应用于汽车营销管理系统软件的数据分析方法及系统
CN117688137B (zh) * 2024-01-31 2024-04-12 成都航空职业技术学院 应用于汽车营销管理系统软件的数据分析方法及系统

Similar Documents

Publication Publication Date Title
US20230334254A1 (en) Fact checking
Ahmed et al. Sentiment analysis of online food reviews using big data analytics
US8719192B2 (en) Transfer of learning for query classification
US20140250032A1 (en) Methods, systems and processor-readable media for simultaneous sentiment analysis and topic classification with multiple labels
CN107844533A (zh) 一种智能问答系统及分析方法
CN109325121B (zh) 用于确定文本的关键词的方法和装置
Lavanya et al. Twitter sentiment analysis using multi-class SVM
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
CN114254201A (zh) 一种科技项目评审专家的推荐方法
CN115329207B (zh) 智能销售信息推荐方法及系统
Peng et al. An e-commerce customer service robot based on intention recognition model
CN101937432A (zh) 一种按照供需信息进行两方撮合的系统与方法
CN116739626A (zh) 商品数据挖掘处理方法、装置、电子设备及可读介质
Sulthana et al. Context based classification of Reviews using association rule mining, fuzzy logics and ontology
CN112579729A (zh) 文档质量评价模型的训练方法、装置、电子设备和介质
CN117252186A (zh) 基于xai的信息处理方法、装置、设备及存储介质
Xu et al. [Retracted] Research on the Construction of Crossborder e‐Commerce Logistics Service System Based on Machine Learning Algorithms
Maree et al. Semantic graph based term expansion for sentence-level sentiment analysis
CN107766229B (zh) 一种利用蜕变测试评价商品搜索系统正确性的方法
CN117235253A (zh) 一种基于自然语言处理技术的卡车用户隐性需求挖掘方法
CN110197056B (zh) 关系网络和关联身份识别方法、装置、设备和存储介质
Mahadik et al. Aspect based opinion mining and ranking: Survey
KR20220041336A (ko) 중요 키워드 추천 및 핵심 문서를 추출하기 위한 그래프 생성 시스템 및 이를 이용한 그래프 생성 방법
Janhavi et al. Sentiment Analysis of Customer Reviews on Laptop Products for Flipkart
US20240121119A1 (en) Method and Apparatus for Classifying Blockchain Address

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination