CN114417822A - 用于生成模型解释信息的方法、装置、设备、介质和产品 - Google Patents

用于生成模型解释信息的方法、装置、设备、介质和产品 Download PDF

Info

Publication number
CN114417822A
CN114417822A CN202210317507.4A CN202210317507A CN114417822A CN 114417822 A CN114417822 A CN 114417822A CN 202210317507 A CN202210317507 A CN 202210317507A CN 114417822 A CN114417822 A CN 114417822A
Authority
CN
China
Prior art keywords
model
interpretation
information
feature
interpreted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210317507.4A
Other languages
English (en)
Inventor
李硕
鲁俊杉
许韩晨玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210317507.4A priority Critical patent/CN114417822A/zh
Publication of CN114417822A publication Critical patent/CN114417822A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了用于生成模型解释信息的方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为金融科技和风控技术领域。具体实现方案为:获取待解释模型;确定待解释模型对应的至少一个解释层次;对于至少一个解释层次,确定该解释层次下、与待解释模型相匹配的模型解释信息;基于至少一个解释层次下、与待解释模型相匹配的模型解释信息,生成目标模型解释信息。本实现方式可以提高生成模型解释信息的精准度。

Description

用于生成模型解释信息的方法、装置、设备、介质和产品
技术领域
本公开涉及人工智能技术领域,具体为金融科技和风控技术领域。
背景技术
目前,在金融风控等应用场景下,对于相关模型的决策过程,经常需要做出相应的解释,用以掌握相关业务细节。
然而,现有的模型解释方法往往依赖于人工实现,从而导致模型解释精准度较低。
发明内容
本公开提供了一种用于生成模型解释信息的方法、装置、设备、介质和产品。
根据本公开的一方面,提供了一种用于生成模型解释信息的方法,包括:获取待解释模型;确定待解释模型对应的至少一个解释层次;对于至少一个解释层次,确定该解释层次下、与待解释模型相匹配的模型解释信息;基于至少一个解释层次下、与待解释模型相匹配的模型解释信息,生成目标模型解释信息。
根据本公开的另一方面,提供了一种用于生成模型解释信息的装置,包括:模型获取单元,被配置成获取待解释模型;层次确定单元,被配置成确定待解释模型对应的至少一个解释层次;初始解释确定单元,被配置成对于至少一个解释层次,确定该解释层次下、与待解释模型相匹配的模型解释信息;目标解释确定单元,被配置成基于至少一个解释层次下、与待解释模型相匹配的模型解释信息,生成目标模型解释信息。
根据本公开的另一方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上任意一项用于生成模型解释信息的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上任意一项用于生成模型解释信息的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上任意一项用于生成模型解释信息的方法。
根据本公开的技术,提供一种用于生成模型解释信息的方法,能够提高生成模型解释信息的精准度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的用于生成模型解释信息的方法的一个实施例的流程图;
图3是根据本公开的用于生成模型解释信息的方法的一个应用场景的示意图;
图4是根据本公开的用于生成模型解释信息的方法的另一个实施例的流程图;
图5是根据本公开的用于生成模型解释信息的方法的一个特征重要性参数进行展示的示意图;
图6是根据本公开的用于生成模型解释信息的方法的一个特征相关参数进行展示的示意图;
图7是根据本公开的用于生成模型解释信息的方法的一个特征的取值风险信息进行展示的示意图;
图8是根据本公开的用于生成模型解释信息的方法的一个特征的分箱对比信息进行展示的示意图;
图9是根据本公开的用于生成模型解释信息的方法的一个特征的数据集分布信息进行展示的示意图;
图10是根据本公开的用于生成模型解释信息的方法的一个特征的组合风险信息进行展示的示意图;
图11是根据本公开的用于生成模型解释信息的方法的一个样本特征分布信息进行展示的示意图;
图12是根据本公开的用于生成模型解释信息的装置的一个实施例的结构示意图;
图13是用来实现本公开实施例的用于生成模型解释信息的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以获取需要解释的待解释模型,例如金融风控模型。之后,终端设备101、102、103可以通过网络104将金融风控模型发送给服务器105,以使服务器105生成相对应的目标模型解释信息,并返回给终端设备101、102、103。终端设备101、102、103可以输出与待解释模型相对应的目标模型解释信息。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于手机、电脑、平板等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如,服务器105可以接收终端设备101、102、103通过网络104发送的待解释模型,并确定待解释模型对应的至少一个解释层次,确定每个解释层次下、与待解释模型相匹配的模型解释信息,再基于至少一个解释层次下、与待解释模型相匹配的模型解释信息,生成目标模型解释信息。通过网络104返回给终端设备101、102、103。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本公开实施例所提供的用于生成模型解释信息的方法可以由终端设备101、102、103执行,也可以由服务器105执行,用于生成模型解释信息的装置可以设置于终端设备101、102、103,也可以设置于服务器105中,本公开实施例对此不做限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的用于生成模型解释信息的方法的一个实施例的流程200。本实施例的用于生成模型解释信息的方法,包括以下步骤。
步骤201,获取待解释模型。
在本实施例中,执行主体(如图1中的终端设备101、102、103或者服务器105)可以从本地存储或者预先建立连接的电子设备中获取需要进行解释的模型,这里的模型可以包括机器学习中各种类别的模型,例如,决策树模型、随机森林模型、逻辑回归模型等,本实施例对于模型的具体类别不做限定。
步骤202,确定待解释模型对应的至少一个解释层次。
在本实施例中,至少一个解释层次可以包括具有递进关系的至少一个层次,例如,从整体层次到局部层次,再从局部层次到样本层次。其中,整体层次可以包括对待解释模型的所有特征的解释,局部层次可以包括对待解释的重要特征的解释,样本层次可以包括对每个样本的解释。
其中,执行主体可以接收用户触发的操作指令,基于该操作指令获取用户自定义选择的、待解释模型的至少一个解释层次。
或者,执行主体也可以先确定待解释模型对应的模型类别,再确定预先设置的、与模型类别相对应的至少一个解释层次。例如,对于模型类别为决策树模型的待解释模型,可以确定相对应的至少一个解释层次包括整体层次、局部层次和样本层次;对于模型类别为逻辑回归模型的待解释模型,可以确定相对应的至少一个解释层次包括整体解释层次。对于模型类别与解释层次之间的具体映射关系,本实施例中不做限定。
步骤203,对于至少一个解释层次,确定该解释层次下、与待解释模型相匹配的模型解释信息。
在本实施例中,执行主体可以对至少一个解释层次,确定该解释层次下、与待解释模型相匹配的模型解释信息。这里的模型解释信息的形式可以包括但不限于表格、图片、文本等,本实施例对此不做限定。
具体的,对于上述的整体解释层次,该解释层次下与待解释模型相匹配的模型解释信息可以为对待解释模型的所有特征的的解释信息。对于上述的局部解释层次,该解释层次下与待解释模型相匹配的模型解释信息可以为对待解释的重要特征的解释。对于上述的样本解释层次,该解释层次下与待解释模型相匹配的模型解释信息可以为对每个样本的解释。
步骤204,基于至少一个解释层次下、与待解释模型相匹配的模型解释信息,生成目标模型解释信息。
在本实施例中,执行主体可以将上述至少一个解释层次下、与待解释模型相匹配的模型解释信息进行汇总处理,得到待解释模型对应的目标模型解释信息。
在本实施例的一些可选的实现方式中,执行主体可以输出上述目标模型解释信息。
在本实施例的另一些可选的实现方式中,执行主体将上述至少一个解释层次下、与待解释模型相匹配的模型解释信息进行汇总处理,得到待解释模型对应的目标模型解释信息可以包括:将上述至少一个解释层次下、与待解释模型相匹配的模型解释信息映射至预设页面的指定区域,得到目标模型解释信息。采用这种实现方式,能够按照解释层次,在指定区域输出相应的解释信息,提高了目标模型解释信息的输出合理性。
继续参见图3,其示出了根据本公开的用于生成模型解释信息的方法的一个应用场景的示意图。在图3的应用场景中,执行主体可以获取需要进行解释的金融风控模型301。其中,金融风控模型301可以用于输出各个样本对象的风险信息。之后,执行主体可以确定与金融风控模型301对应的至少一个解释层次,作为示例,图3所示的至少一个解释层次包括第一解释层次3021、第二解释层次3022以及第三解释层次3023。之后,执行主体可以对于第一解释层次3021,确定相对应的第一解释信息3031。对于第二解释层次3022,确定相对应的第二解释信息3032。对于第三解释层次3023,确定相对应的第三解释信息3033。之后,执行主体可以将第一解释信息3031、第二解释信息3032和第三解释信息3033汇总得到,对金融风控模型301的目标模型解释信息304。
本公开上述实施例提供的用于生成模型解释信息的方法,能够从不同的解释层次,自动生成与待解释模型相匹配的目标模型解释信息,从而提高了生成模型解释信息的精准度。
继续参见图4,其示出了根据本公开的用于生成模型解释信息的方法的另一个实施例的流程400。如图4所示,本实施例的用于生成模型解释信息的方法可以包括以下步骤。
步骤401,获取待解释模型。
在本实施例中,对于步骤401的详细描述请参照对于步骤201的详细描述,在此不再赘述。
步骤402,确定待解释模型对应的至少一个解释层次,至少一个解释层次包括以下至少一项:整体解释层次、局部解释层次、样本解释层次。
在本实施例中,整体解释层次可以包括对待解释模型的所有特征的解释,局部解释层次可以包括对待解释的重要特征的解释,样本解释层次可以包括对每个样本的解释。
其中,对于步骤402的详细描述请参照对于步骤202的详细描述,在此不再赘述。
步骤403,对于整体解释层次,确定待解释模型对应的模型参数信息,模型参数信息包括以下至少一项:模型原理信息、模型特征信息。
在本实施例中,模型原理信息可以为对待解释模型的模型原理的描述信息,模型原理信息的呈现形式可以为文本描述形式、图片形式、动态动画形式等,本实施例对此不做限定。模型特征信息可以为对待解释模型的各个特征的描述信息,对于模型特征信息的具体形式本实施例不做限定。
对于整体解释层次,执行主体可以基于待解释模型的模型原理信息和/或模型特征信息,生成相应的模型解释信息,这里的模型解释信息可以用于描述待解释模型的模型运作原理,以及待解释模型的各个特征的特征属性。
步骤404,响应于确定模型参数信息包括模型特征信息,基于模型特征信息,确定待解释模型的特征内容、特征重要性参数和/或特征相关参数。
在本实施例中,待解释模型包括至少一个特征,特征的特征内容可以为特征的实质含义,特征重要性参数可以为反映至少一个特征的重要性的参数,特征相关参数可以为反映至少一个特征与模型输出结果之间的相关关系。其中,相关关系可以包括正相关、负相关、不相关。
其中,特征重要性参数可以基于以下步骤确定:响应于确定待解释模型为树模型,确定至少一个特征对应的分裂次数;基于分裂次数,生成特征重要性参数。其中,分类次数越多,特征越重要。
需要说明的是,这里的特征重要性参数可以基于模型类别的不同选取不同的特征重要性确定方式,这些特征重要性确定方式可以采用现有技术中的各类确定方式,在此不再赘述。
其中,特征相关参数可以基于shap(SHapley Additive exPlanation,一种统一的方法来解释任何机器学习模型的输出)确定得到。执行主体可以基于shap和待解释模型,确定各个特征与模型输出结果之间的相关关系。
需要说明的是,这里的特征相关参数可以基于模型类别的不同选取不同的特征相关性确定方式,这些特征相关性确定方式可以采用现有技术中的各类确定方式,在此不再赘述。
步骤405,基于模型原理信息、特征内容、特征重要性参数和/或特征相关参数,生成整体解释层次下、与待解释模型相匹配的模型解释信息。
在本实施例中,执行主体可以选取上述模型原理信息、特征内容、特征重要性参数、特征相关参数中的任意组合,作为整体解释层次下、与待解释模型相匹配的模型解释信息。
请参阅图5,图5是根据本公开的用于生成模型解释信息的方法的一个特征重要性参数进行展示的示意图,如图5所示,可以基于待训练模型的各个特征的特征重要性参数值由高至低的顺序,展示各个特征的特征重要性参数。图5中的特征1至15对应的特征重要性参数值依次递减,也即是,在特征1至15中,特征1的特征重要性程度最高,特征15的特征重要性程度最低。
请一并参阅图6,图6是根据本公开的用于生成模型解释信息的方法的一个特征相关参数进行展示的示意图,如图6所示,可以将基于shap得到的shap图作为特征相关参数进行展示的展示形式。在图6左侧的f116541至f200003表示待解释模型中不同的特征,这些特征可以按照特征重要性程度进行排序,将特征重要性程度更高的特征显示在靠前的位置。并且,对于待解释模型中的每个特征,可以基于shap确定该特征对应的shap value(一种衡量特征重要性的参数)。基于shap value的正负情况以及数值大小,能够反映各个特征与模型输出结果之间的相关关系以及相关程度。
步骤406,对于局部解释层次,从待解释模型对应的特征中确定待解释特征。
在本实施例中,执行主体可以先确定待解释模型对应的所有特征,再确定至少一个特征对应的特征重要性参数,以及基于特征重要性参数由高至低的顺序,选取预设数量个特征作为重要的待解释特征。其中,局部解释层次可以为对这些筛选出的重要的待解释特征进行的解释。
步骤407,基于待解释特征的特征属性,生成局部解释层次下、与待解释模型相匹配的模型解释信息。
在本实施例中,待解释特征的特征属性可以用于描述特征的分布信息、取值信息、样本划分信息等多种信息。
在本实施例的一些可选的实现方式中, 特征属性包括以下至少一项:特征的取值风险信息、特征的分箱对比信息、特征的数据集分布信息、特征的组合风险信息。
在本实现方式中,如果待解释模型为金融风控模型,则特征属性可以包括以下至少一项:特征的取值风险信息、特征的分箱对比信息、特征的数据集分布信息、特征的组合风险信息。其中,特征的取值风险信息可以用于描述特征的各个取值区间所对应的风险情况,特征的分箱对比信息可以用于描述基于不同分箱方式得到的取值区间所对应的风险情况对比,特征的数据集分布信息可以用于描述特征的训练集样本、验证集样本、测试集样本的分布对比情况,特征的组合风险信息可以用于描述特征之间组合得到的组合特征对应的风险信息。
在本实施例的另一些可选的实现方式中,还包括:响应于确定待解释模型为树模型,获取待解释特征对应的分裂次数以及分裂值;基于分裂次数和分裂值,确定目标分裂值;基于目标分裂值,对待解释特征进行分箱,得到第一特征区间集合;基于第一特征区间集合中特征区间对应的风险值,生成特征的取值风险信息。
在本实现方式中,如果待解释模型为树模型,则可以获取每个待解释特征在树模型中的分裂次数以及分裂值。其中,树模型可以包括预先构造的树集合。对于树集合中的每棵树,可以确定该树中各个节点的分裂信息;基于各棵树的分裂信息,可以得到每个待解释特征在树模型中的分裂次数以及分裂值。
并且,执行主体可以选取分裂次数大于预设阈值的分裂值,作为目标分裂值。也即是,选取特征在树模型中进行多次分裂的分裂值作为后续的分箱依据。通常的,这里的目标分裂值的数量可以为多个。
以及,执行主体可以按照目标分裂值,对待解释特征进行分箱,得到每个待解释特征对应的第一特征区间集合,其中,第一特征区间集合包括至少一个特征区间。
以及,执行主体可以基于每个待解释特征对应的样本划分信息,确定最终与每个特征区间对应的风险值。并基于特征区间与风险值之间的对应关系,生成特征的取值风险信息。其中,特征的取值风险信息的展示形式可以为表格,也可以为图片,本实施例对此不做限定。
请参阅图7,图7是根据本公开的用于生成模型解释信息的方法的一个特征的取值风险信息进行展示的示意图,如图7所示,对于“f116531”这个待解释特征而言,可以基于上述方式确定该待解释特征对应的多个目标分裂值,即为(0.0,0.22,0.33,0.43)。之后,执行主体可以按照目标分裂值对该待解释特征进行分箱,得到第一特征区间集合,这里的第一特征区间集合可以包括图7横坐标所示的5个特征取值区间。并且,基于每个待解释特征对应的样本划分信息,可以确定每个特征取值区间对应的样本数量,例如,与(0.0,0.22)这个取值区间对应的样本数量为3328,反映为柱状图的高度。以及,基于每个特征区间的样本分布,可以得到相对应的风险值,例如,与(0.0,0.22)这个取值区间对应的风险值为0.29。其中,风险值基于金融风控模型对落入该取值区间的样本们确定风险输出结果得到。以及,在图7中可以基于图片的形式展示特征的取值风险信息。可以理解,在具体实施过程中,也可以将图片中的数据抽取为表格形式输出。
在本实施例的另一些可选的实现方式中,还包括:对待解释特征进行等频分箱,得到第二特征区间集合;基于第一特征区间集合中特征区间对应的风险值,以及第二特征区间集合中特征区间对应的风险值,生成特征的分箱对比信息。
在本实现方式中,执行主体还可以采用等频分箱的方式,得到待解释特征对应的第二特征区间。等频分箱是指使划分的区间中,样本数量尽量保持一致。对于等频分箱的具体分箱方式,可以采用现有技术中的各类分箱方式,在此不再赘述。
之后,执行主体可以基于第一特征区间集合中每个特征区间对应的风险值,以及第二特征区间集合中每个特征区间对应的风险值,生成特征的分箱对比信息。这里的分箱对比信息的具体展示形式,本实施例对此不做限定。
请参阅图8,图8是根据本公开的用于生成模型解释信息的方法的一个特征的分箱对比信息进行展示的示意图,如图8所示,对于“f116531”这个待解释特征而言,图8展示的是第二特征区间集合中每个特征区间对应的风险值。这里的第二特征区间集合可以包括图8横坐标所示的9个特征取值区间。并且,基于每个待解释特征对应的样本划分信息,可以确定每个特征取值区间对应的样本数量,例如,与(-0.06,0.04)这个取值区间对应的样本数量为2002,反映为柱状图的高度。以及,基于每个特征区间的样本分布,可以得到相对应的风险值,例如,与(-0.06,0.04)这个取值区间对应的风险值为0.322。其中,风险值基于金融风控模型对落入该取值区间的样本们确定风险输出结果得到。以及,在图8中可以基于图片的形式展示特征的取值风险信息。可以理解,在具体实施过程中,也可以将图片中的数据抽取为表格形式输出。以及,图8可以和图7同时输出展示。
在本实施例的另一些可选的实现方式中,还包括:基于待解释特征的训练集分布信息、验证集分布信息和/或测试集分布信息,生成特征的数据集分布信息。
在本实现方式中,执行主体可以基于待解释特征对应的样本分布信息,确定对待解释模型进行训练的训练集样本,将训练集样本的分布信息,作为训练集分布信息。以及将用于对待解释模型进行验证的验证集样本的分布信息作为验证集分布信息,以及将用于对待解释模型进行测试的测试集样本的分布信息作为测试集分布信息。
请参阅图9,图9是根据本公开的用于生成模型解释信息的方法的一个特征的数据集分布信息进行展示的示意图,如图9所示,执行主体可以将待解释特征的训练集分布信息、验证集分布信息和测试集分布信息共同以图片的形式输出,作为上述特征的数据集分布信息。并且,特征的数据集分布信息也可以采用其他不同形式输出,对于输出形式,本实施例不做限定。
在本实施例的另一些可选的实现方式中,还包括:响应于确定待解释模型为树模型,确定待解释模型中从根节点到叶子节点的路径;基于路径对应的风险信息,生成特征的组合风险信息。
请参阅图10,图10是根据本公开的用于生成模型解释信息的方法的一个特征的组合风险信息进行展示的示意图,如图10所示,如果待解释模型为树模型,则从树模型的根节点到叶子节点存在多个路径。例如,图10中以颜色区分的一个路径为,f116531<0.34至f200003<36.00,f200003<36.00至f404389<95.84,f404389<95.84至leaf=-0.131。其中,f116531、f200003、f404389为不同的特征。可以理解,每个路径可以由多个特征组合得到,因此,可以基于各个路径对应的风险信息,得到特征的组合风险信息。
步骤408,对于样本解释层次,基于待解释模型对应的样本的样本特征分布信息和/或样本特征组合风险信息,生成样本解释层次下、与待解释模型相匹配的模型解释信息。
在本实施例中,样本特征分布信息可以基于shap确定得到,用于描述对于一个样本而言各个特征的贡献信息。样本特征组合风险信息可以为基于样本对应的特征的组合风险信息,具体的确定方式可以参考对于特征的组合风险信息的描述,在此不再赘述。
请参阅图11,图11是根据本公开的用于生成模型解释信息的方法的一个样本特征分布信息进行展示的示意图,如图11所示,执行主体可以基于shap确定得到样本特征分布图,对于样本特征分布图中的每个样本,可以直观的展示该样本对应的各个特征的信息。
在本实施例的一些可选的实现方式中,还包括:响应于确定待解释模型为树模型,确定样本对应的样本路径,样本路径为根节点到该样本所处的叶子节点的路径;基于样本对应的样本路径,生成样本特征组合风险信息。
在本实现方式中,如果待解释模型为树模型,则可以确定从根节点到每个样本所在的叶子节点的路径,并基于各个样本对应的样本路径,生成样本特征组合风险信息。对于样本特征组合风险信息具体的确定方式可以参考对于特征的组合风险信息的描述,在此不再赘述。
步骤409,基于至少一个解释层次下、与待解释模型相匹配的模型解释信息,生成目标模型解释信息。
在本实施例中,对于步骤409的详细描述请参照对于步骤204的详细描述,在此不再赘述。
本公开上述实施例提供的用于生成模型解释信息的方法,还可以整体解释模型的原理、模型的所有特征情况,以及局部解释模型的重要特征的取值风险、分箱对比、数据集分布、特征的组合风险,以及从样本出发,解释每个样本的打分原理、特征贡献、特征组合风险,进一步提高了模型解释的多样性。以及,本公开新引入了多次分裂的目标分裂值,作为第一特征区间集合的分箱依据,采用这种分箱依据进行分箱,所得到的样本能够集中在低风险的特征区间,提高了分箱合理性。
进一步参考图12,作为对上述各图所示方法的实现,本公开提供了一种用于生成模型解释信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于终端设备、服务器等电子设备中。
如图12所示,本实施例的用于生成模型解释信息的装置1200包括:模型获取单元1201、层次确定单元1202、初始解释确定单元1203和目标解释确定单元1204。
模型获取单元1201,被配置成获取待解释模型。
层次确定单元1202,被配置成确定待解释模型对应的至少一个解释层次。
初始解释确定单元1203,被配置成对于至少一个解释层次,确定该解释层次下、与待解释模型相匹配的模型解释信息。
目标解释确定单元1204,被配置成基于至少一个解释层次下、与待解释模型相匹配的模型解释信息,生成目标模型解释信息。
在本实施例的一些可选的实现方式中,至少一个解释层次包括以下至少一项:整体解释层次、局部解释层次、样本解释层次。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:对于整体解释层次,确定待解释模型对应的模型参数信息,模型参数信息包括以下至少一项:模型原理信息、模型特征信息;响应于确定模型参数信息包括模型特征信息,基于模型特征信息,确定待解释模型的特征内容、特征重要性参数和/或特征相关参数;基于模型原理信息、特征内容、特征重要性参数和/或特征相关参数,生成整体解释层次下、与待解释模型相匹配的模型解释信息。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:对于局部解释层次,从待解释模型对应的特征中确定待解释特征;基于待解释特征的特征属性,生成局部解释层次下、与待解释模型相匹配的模型解释信息。
在本实施例的一些可选的实现方式中,特征属性包括以下至少一项:特征的取值风险信息、特征的分箱对比信息、特征的数据集分布信息、特征的组合风险信息。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:响应于确定待解释模型为树模型,获取待解释特征对应的分裂次数以及分裂值;基于分裂次数和分裂值,确定目标分裂值;基于目标分裂值,对待解释特征进行分箱,得到第一特征区间集合;基于第一特征区间集合中特征区间对应的风险值,生成特征的取值风险信息。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:对待解释特征进行等频分箱,得到第二特征区间集合;基于第一特征区间集合中特征区间对应的风险值,以及第二特征区间集合中特征区间对应的风险值,生成特征的分箱对比信息。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:基于待解释特征的训练集分布信息、验证集分布信息和/或测试集分布信息,生成特征的数据集分布信息。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:响应于确定待解释模型为树模型,确定待解释模型中从根节点到叶子节点的路径;基于路径对应的风险信息,生成特征的组合风险信息。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:对于样本解释层次,基于待解释模型对应的样本的样本特征分布信息和/或样本特征组合风险信息,生成样本解释层次下、与待解释模型相匹配的模型解释信息。
在本实施例的一些可选的实现方式中,初始解释确定单元1203进一步被配置成:响应于确定待解释模型为树模型,确定样本对应的样本路径,样本路径为根节点到该样本所处的叶子节点的路径;基于样本对应的样本路径,生成样本特征组合风险信息。
应当理解,用于生成模型解释信息的装置1200中记载的单元1201至单元1204分别与参考图2中描述的方法中的各个步骤相对应。由此,上文针对用于生成模型解释信息的方法描述的操作和特征同样适用于装置1200及其中包含的单元,在此不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图13示出了可以用来实施本公开的实施例的示例电子设备1300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图13所示,设备1300包括计算单元1301,其可以根据存储在只读存储器(ROM)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(RAM)1303中的计算机程序,来执行各种适当的动作和处理。在RAM 1303中,还可存储设备1300操作所需的各种程序和数据。计算单元1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。
设备1300中的多个部件连接至I/O接口1305,包括:输入单元1306,例如键盘、鼠标等;输出单元1307,例如各种类型的显示器、扬声器等;存储单元1308,例如磁盘、光盘等;以及通信单元1309,例如网卡、调制解调器、无线通信收发机等。通信单元1309允许设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理,例如用于生成模型解释信息的方法。例如,在一些实施例中,用于生成模型解释信息的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1308。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1302和/或通信单元1309而被载入和/或安装到设备1300上。当计算机程序加载到RAM 1303并由计算单元1301执行时,可以执行上文描述的用于生成模型解释信息的方法的一个或多个步骤。备选地,在其他实施例中,计算单元1301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行用于生成模型解释信息的方法。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (25)

1.一种用于生成模型解释信息的方法,包括:
获取待解释模型;
确定所述待解释模型对应的至少一个解释层次;
对于所述至少一个解释层次,确定该解释层次下、与所述待解释模型相匹配的模型解释信息;
基于所述至少一个解释层次下、与所述待解释模型相匹配的模型解释信息,生成目标模型解释信息。
2.根据权利要求1所述的方法,其中,所述至少一个解释层次包括以下至少一项:整体解释层次、局部解释层次、样本解释层次。
3.根据权利要求2所述的方法,其中,所述对于所述至少一个解释层次,确定该解释层次下、与所述待解释模型相匹配的模型解释信息,包括:
对于所述整体解释层次,确定所述待解释模型对应的模型参数信息,所述模型参数信息包括以下至少一项:模型原理信息、模型特征信息;
响应于确定所述模型参数信息包括所述模型特征信息,基于所述模型特征信息,确定所述待解释模型的特征内容、特征重要性参数和/或特征相关参数;
基于所述模型原理信息、所述特征内容、所述特征重要性参数和/或所述特征相关参数,生成所述整体解释层次下、与所述待解释模型相匹配的模型解释信息。
4.根据权利要求2所述的方法,其中,所述对于所述至少一个解释层次,确定该解释层次下、与所述待解释模型相匹配的模型解释信息,包括:
对于所述局部解释层次,从所述待解释模型对应的特征中确定待解释特征;
基于所述待解释特征的特征属性,生成所述局部解释层次下、与所述待解释模型相匹配的模型解释信息。
5.根据权利要求4所述的方法,其中,所述特征属性包括以下至少一项:特征的取值风险信息、特征的分箱对比信息、特征的数据集分布信息、特征的组合风险信息。
6.根据权利要求5所述的方法,还包括:
响应于确定所述待解释模型为树模型,获取所述待解释特征对应的分裂次数以及分裂值;
基于所述分裂次数和所述分裂值,确定目标分裂值;
基于所述目标分裂值,对所述待解释特征进行分箱,得到第一特征区间集合;
基于所述第一特征区间集合中特征区间对应的风险值,生成所述特征的取值风险信息。
7.根据权利要求6所述的方法,还包括:
对所述待解释特征进行等频分箱,得到第二特征区间集合;
基于所述第一特征区间集合中特征区间对应的风险值,以及所述第二特征区间集合中特征区间对应的风险值,生成所述特征的分箱对比信息。
8.根据权利要求5所述的方法,还包括:
基于所述待解释特征的训练集分布信息、验证集分布信息和/或测试集分布信息,生成所述特征的数据集分布信息。
9.根据权利要求5所述的方法,还包括:
响应于确定所述待解释模型为树模型,确定所述待解释模型中从根节点到叶子节点的路径;
基于所述路径对应的风险信息,生成所述特征的组合风险信息。
10.根据权利要求2所述的方法,其中,所述对于所述至少一个解释层次,确定该解释层次下、与所述待解释模型相匹配的模型解释信息,包括:
对于所述样本解释层次,基于所述待解释模型对应的样本特征分布信息和/或样本特征组合风险信息,生成所述样本解释层次下、与所述待解释模型相匹配的模型解释信息。
11.根据权利要求10所述的方法,还包括:
响应于确定所述待解释模型为树模型,确定样本对应的样本路径,所述样本路径为根节点到该样本所处的叶子节点的路径;
基于所述样本对应的样本路径,生成所述样本特征组合风险信息。
12.一种用于生成模型解释信息的装置,包括:
模型获取单元,被配置成获取待解释模型;
层次确定单元,被配置成确定所述待解释模型对应的至少一个解释层次;
初始解释确定单元,被配置成对于所述至少一个解释层次,确定该解释层次下、与所述待解释模型相匹配的模型解释信息;
目标解释确定单元,被配置成基于至少一个解释层次下、与所述待解释模型相匹配的模型解释信息,生成目标模型解释信息。
13.根据权利要求12所述的装置,其中,所述至少一个解释层次包括以下至少一项:整体解释层次、局部解释层次、样本解释层次。
14.根据权利要求13所述的装置,其中,所述初始解释确定单元进一步被配置成:
对于所述整体解释层次,确定所述待解释模型对应的模型参数信息,所述模型参数信息包括以下至少一项:模型原理信息、模型特征信息;
响应于确定所述模型参数信息包括所述模型特征信息,基于所述模型特征信息,确定所述待解释模型的特征内容、特征重要性参数和/或特征相关参数;
基于所述模型原理信息、所述特征内容、所述特征重要性参数和/或所述特征相关参数,生成所述整体解释层次下、与所述待解释模型相匹配的模型解释信息。
15.根据权利要求13所述的装置,其中,所述初始解释确定单元进一步被配置成:
对于所述局部解释层次,从所述待解释模型对应的特征中确定待解释特征;
基于所述待解释特征的特征属性,生成所述局部解释层次下、与所述待解释模型相匹配的模型解释信息。
16.根据权利要求15所述的装置,其中,所述特征属性包括以下至少一项:特征的取值风险信息、特征的分箱对比信息、特征的数据集分布信息、特征的组合风险信息。
17.根据权利要求16所述的装置,其中,所述初始解释确定单元进一步被配置成:
响应于确定所述待解释模型为树模型,获取所述待解释特征对应的分裂次数以及分裂值;
基于所述分裂次数和所述分裂值,确定目标分裂值;
基于所述目标分裂值,对所述待解释特征进行分箱,得到第一特征区间集合;
基于所述第一特征区间集合中特征区间对应的风险值,生成所述特征的取值风险信息。
18.根据权利要求17所述的装置,其中,所述初始解释确定单元进一步被配置成:
对所述待解释特征进行等频分箱,得到第二特征区间集合;
基于所述第一特征区间集合中特征区间对应的风险值,以及所述第二特征区间集合中特征区间对应的风险值,生成所述特征的分箱对比信息。
19.根据权利要求16所述的装置,其中,所述初始解释确定单元进一步被配置成:
基于所述待解释特征的训练集分布信息、验证集分布信息和/或测试集分布信息,生成所述特征的数据集分布信息。
20.根据权利要求16所述的装置,其中,所述初始解释确定单元进一步被配置成:
响应于确定所述待解释模型为树模型,确定所述待解释模型中从根节点到叶子节点的路径;
基于所述路径对应的风险信息,生成所述特征的组合风险信息。
21.根据权利要求13所述的装置,其中,所述初始解释确定单元进一步被配置成:
对于所述样本解释层次,基于所述待解释模型对应的样本特征分布信息和/或样本特征组合风险信息,生成所述样本解释层次下、与所述待解释模型相匹配的模型解释信息。
22.根据权利要求21所述的装置,其中,所述初始解释确定单元进一步被配置成:
响应于确定所述待解释模型为树模型,确定样本对应的样本路径,所述样本路径为根节点到该样本所处的叶子节点的路径;
基于所述样本对应的样本路径,生成所述样本特征组合风险信息。
23.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-11中任一项所述的方法。
24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法。
25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述的方法。
CN202210317507.4A 2022-03-29 2022-03-29 用于生成模型解释信息的方法、装置、设备、介质和产品 Pending CN114417822A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210317507.4A CN114417822A (zh) 2022-03-29 2022-03-29 用于生成模型解释信息的方法、装置、设备、介质和产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210317507.4A CN114417822A (zh) 2022-03-29 2022-03-29 用于生成模型解释信息的方法、装置、设备、介质和产品

Publications (1)

Publication Number Publication Date
CN114417822A true CN114417822A (zh) 2022-04-29

Family

ID=81264029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210317507.4A Pending CN114417822A (zh) 2022-03-29 2022-03-29 用于生成模型解释信息的方法、装置、设备、介质和产品

Country Status (1)

Country Link
CN (1) CN114417822A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115331825A (zh) * 2022-07-26 2022-11-11 上海交通大学医学院附属新华医院 一种基于大数据多层次特征挖掘的骨折风险预测模型

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681750A (zh) * 2018-05-21 2018-10-19 阿里巴巴集团控股有限公司 Gbdt模型的特征解释方法和装置
CN111079944A (zh) * 2019-12-18 2020-04-28 支付宝(杭州)信息技术有限公司 迁移学习模型解释实现方法及装置、电子设备、存储介质
CN111612156A (zh) * 2020-05-22 2020-09-01 上海携程国际旅行社有限公司 用于XGBoost模型的解释方法
US20210256319A1 (en) * 2020-02-14 2021-08-19 International Business Machines Corporation Explaining cross domain model predictions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108681750A (zh) * 2018-05-21 2018-10-19 阿里巴巴集团控股有限公司 Gbdt模型的特征解释方法和装置
CN111079944A (zh) * 2019-12-18 2020-04-28 支付宝(杭州)信息技术有限公司 迁移学习模型解释实现方法及装置、电子设备、存储介质
US20210256319A1 (en) * 2020-02-14 2021-08-19 International Business Machines Corporation Explaining cross domain model predictions
CN111612156A (zh) * 2020-05-22 2020-09-01 上海携程国际旅行社有限公司 用于XGBoost模型的解释方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115331825A (zh) * 2022-07-26 2022-11-11 上海交通大学医学院附属新华医院 一种基于大数据多层次特征挖掘的骨折风险预测模型

Similar Documents

Publication Publication Date Title
CN112559007A (zh) 多任务模型的参数更新方法、装置及电子设备
CN114881129A (zh) 一种模型训练方法、装置、电子设备及存储介质
CN115202847A (zh) 任务的调度方法和装置
CN114417822A (zh) 用于生成模型解释信息的方法、装置、设备、介质和产品
CN114186681A (zh) 用于生成模型簇的方法、装置及计算机程序产品
CN114037059A (zh) 预训练模型、模型的生成方法、数据处理方法及装置
US10922324B2 (en) Identifying and scoring data values
CN116342164A (zh) 目标用户群体的定位方法、装置、电子设备及存储介质
CN115222444A (zh) 用于输出模型信息的方法、装置、设备、介质和产品
CN113032251B (zh) 应用程序服务质量的确定方法、设备和存储介质
CN114998649A (zh) 图像分类模型的训练方法、图像分类方法及装置
CN114021642A (zh) 数据处理方法、装置、电子设备和存储介质
CN113408632A (zh) 提高图像分类准确性的方法、装置、电子设备及存储介质
CN114328047A (zh) 系统测试方法、装置、电子设备以及存储介质
CN113360672A (zh) 用于生成知识图谱的方法、装置、设备、介质和产品
CN112560481A (zh) 语句处理方法、设备和存储介质
CN113127357A (zh) 单元测试方法、装置、设备、存储介质及程序产品
CN113344405B (zh) 基于知识图谱生成信息的方法、装置、设备、介质和产品
CN113391989B (zh) 程序评估方法、装置、设备、介质及程序产品
CN114491040B (zh) 信息挖掘方法及装置
CN115098405B (zh) 软件产品的测评方法、装置、电子设备及存储介质
CN117349653A (zh) 人群圈选方法、装置、电子设备及存储介质
CN113344405A (zh) 基于知识图谱生成信息的方法、装置、设备、介质和产品
CN115357271A (zh) 一种信息处理方法及装置
CN114997329A (zh) 用于生成模型的方法、装置、设备、介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination