CN114254762A - 可解释性机器学习模型构建方法、装置和计算机设备 - Google Patents
可解释性机器学习模型构建方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN114254762A CN114254762A CN202111609146.2A CN202111609146A CN114254762A CN 114254762 A CN114254762 A CN 114254762A CN 202111609146 A CN202111609146 A CN 202111609146A CN 114254762 A CN114254762 A CN 114254762A
- Authority
- CN
- China
- Prior art keywords
- machine learning
- learning model
- grouping
- sample data
- interpretable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Abstract
本申请涉及一种可解释性机器学习模型构建方法、装置、计算机设备、存储介质和计算机程序产品,可用于金融领域、人工智能领域或其他领域。所述方法包括:通过获取业务场景的样本数据,根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果,根据预测结果,对训练集进行分组,获得分组后的训练集,根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组,基于该业务场景的可解释性机器学习模型组,能够支持得到良好的可解释性结果。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种可解释性机器学习模型构建方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着人工智能技术的发展,机器学习模型在得到了越来越广泛的应用,机器学习技术的引入改变了营销、风控等领域的专家规则、业务经验以及统计模型等传统方式模型的方法,极大的提升了模型精度,但随着以集成算法、神经网络算法为代表的复杂机器学习算法使用的增多,片面追求机器学习模型的高精度不能满足实际需求,模型的可解释性也至关重要。
目前,对机器学习模型算法可解释性的研究主要是采用构建等效模型或者进行局部解释的方法,然而,这种构建等效模型或者进行局部解释的方法,存在机器学习模型算法可解释性差的问题。
发明内容
基于此,有必要针对传统机器学习模型可解释性差的技术问题,提供一种能够支持得到良好的可解释性结果的可解释性机器学习模型构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种可解释性机器学习模型构建方法。所述方法包括:
获取业务场景的样本数据,样本数据包括训练集和测试集;
根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;
根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;
根据预测结果,对训练集进行分组,获得分组后的训练集;
根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;
归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
在其中一个实施例中,根据预测结果,对训练集进行分组,获得分组后的训练集包括:
将预测结果进行排序,结合预设的组间距离,获得训练集的预分组;
根据预分组,获得每个预分组的样本数据个数;
根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集。
在其中一个实施例中,根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集包括:
若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并;
若预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集。
在其中一个实施例中,归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组,之后还包括:
对业务场景的可解释性机器学习模型组进行解释,获得业务场景的可解释性机器学习模型组的解释结果。
在其中一个实施例中,可解释性机器学习模型构建方法还包括:
获取待测业务场景的样本数据;
通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果;
根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果。
在其中一个实施例中,根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果包括:
根据分组后的训练集,获得分组空间;
确定第一预测结果对应的分组空间,得到目标分组空间;
根据可解释性机器学习模型组,选定与目标分组空间对应的第二机器学习模型;
通过选定的第二机器学习模型,对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果。
第二方面,本申请还提供了一种可解释性机器学习模型构建装置。所述装置包括:
数据获取模块,用于获取业务场景的样本数据,样本数据包括训练集和测试集;
第一机器学习模型获取模块,用于根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;
预测结果获取模块,用于根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;
训练集分组模块,用于根据预测结果,对训练集进行分组,获得分组后的训练集;
第二机器学习模型获取模块,用于根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;
第二机器学习模型归集模块,用于归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取业务场景的样本数据,样本数据包括训练集和测试集;根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;根据预测结果,对训练集进行分组,获得分组后的训练集;根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取业务场景的样本数据,样本数据包括训练集和测试集;根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;根据预测结果,对训练集进行分组,获得分组后的训练集;根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取业务场景的样本数据,样本数据包括训练集和测试集;根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;根据预测结果,对训练集进行分组,获得分组后的训练集;根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
上述可解释性机器学习模型构建方法、装置、计算机设备、存储介质和计算机程序产品,综合使用以精度为导向的初始第一机器学习模型和以解释性为导向的初始第二机器学习模型,具体以训练集对初始第一机器学习模型进行训练,并根据训练集的预测结果,通过集中分组,获得分组后的训练集;再以分组后的训练集对多个初始第二机器学习模型进行训练,从而得到多个解释性优良的第二机器学习模型,最终构建了业务场景的可解释性机器学习模型组,能够支持得到良好的可解释性结果。
附图说明
图1为一个实施例中可解释性机器学习模型构建方法的应用环境图;
图2为一个实施例中可解释性机器学习模型构建方法的流程示意图;
图3为一个实施例中可解释性机器学习模型构建步骤的流程示意图;
图4为另一个实施例中可解释性机器学习模型构建方法的流程示意图;
图5为另一个实施例中可解释性机器学习模型构建步骤的流程示意图;
图6为又一个实施例中可解释性机器学习模型构建方法的流程示意图;
图7为一个实施例中可解释性机器学习模型构建装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的可解释性机器学习模型构建方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102获取业务场景的样本数据,样本数据包括训练集和测试集;根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;根据预测结果,对训练集进行分组,获得分组后的训练集;根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组,服务器104接收终端102发送的业务场景的可解释性机器学习模型组。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种可解释性机器学习模型构建方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
S100:获取业务场景的样本数据,样本数据包括训练集和测试集。
其中,业务场景的样本数据是指特定业务场景中数据的实例,按照是否有标签可以将样本数据分为有标签样本和无标签样本,有标签的样本同时包含特征和标签,其用来训练模型,无标签样本包含特征,但不包含标签,在使用有标签样本训练模型之后,使用该模型预测无标签样本的标签;按照数据源头来分类的话,样本数据大致可以分为内部样本和外部样本,内部样本的获取方法通常有数据埋点与落库、数据标注、数据增强以及数据重组,外部样本的获取方法通常有公开数据集、抓取与众包以及采购与商务合作,具体样本数据获取方法本申请不做具体限定。在人工智能领域,机器学习中普遍的做法是将样本按一定的比例从同一个样本集中随机划分出训练集和测试集,训练集用于训练有监督模型、拟合模型、调整参数、选择入模变量以及对算法做出其他抉择,测试集用于评估训练出的模型效果,但不会改变模型的参数及效果,一般验证模型是否过拟合或者欠拟合,决定是否重新训练模型或者选择其他的算法,因此,需合理地选择训练集和测试集,使其分布能代表真实的数据分布,才能期望算法有良好的效果。
具体地,获取业务场景的样本数据,样本数据包括训练集和测试集,本申请中训练集和测试集均为有标签样本。
S200:根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型。
其中,机器学习模型训练是指选定机器学习模型中输入有样本数据,让模型学习特征与标签之间的关系,选定的初始第一机器学习模型为精度为导向的机器学习模型,本申请采用的初始第一机器学习模型算法可以为但不限于LightGBM(Light GradientBoosting Machine,轻量的梯度提升机)算法,该算法支持高效率的并行训练。
具体地,根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型。
S300:根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果。
其中,将训练得到的机器学习模型应用于样本数据,即使用经过训练的模型对样本数据做出有用的预测,获得样本数据的预测结果,根据测试集对机器学习模型进行测试,可以评估该机器学习模型的预测性能。
具体地,根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果。
S400:根据预测结果,对训练集进行分组,获得分组后的训练集。
其中,经过训练的模型对样本数据做出预测的预测结果为概率数据,即预测结果大小为0到1之间的实数,每个训练样本都有对应的预测结果,因此,根据预测结果,可以对预测结果对应的训练样本进行分组,获得分组后的训练样本。
具体地,根据预测结果,对训练集进行分组,获得分组后的训练集。
S500:根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型。
其中,选定的初始第二机器学习模型为可解释性为导向的机器学习模型,本申请采用的初始第二机器学习模型可以包括但不限于线性回归或者决策树,训练集经过分组后得到多个分组后的训练集,每个训练集对一个初始第二机器学习模型进行训练,多个分组后训练集分别对多个初始第二机器学习模型进行训练,得到多个第二机器学习模型。
具体地,根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型。
S600:归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
其中,将得到的业务场景的多个第二机器学习模型归集在一起,得到业务场景的第二机器学习模型组,该第二机器学习模型组即为业务场景的可解释性机器学习模型组。
具体地,归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
上述可解释性机器学习模型构建方法中,综合使用以精度为导向的初始第一机器学习模型和以解释性为导向的初始第二机器学习模型,具体以训练集对初始第一机器学习模型进行训练,并根据训练集的预测结果,通过集中分组,获得分组后的训练集;再以分组后的训练集对多个初始第二机器学习模型进行训练,从而得到多个解释性优良的第二机器学习模型,最终构建了业务场景的可解释性机器学习模型组,能够支持得到良好的可解释性结果。
在一个实施例中,如图3所示,根据预测结果,对训练集进行分组,获得分组后的训练集包括:
S420:将预测结果进行排序,结合预设的组间距离,获得训练集的预分组;
S440:根据预分组,获得每个预分组的样本数据个数;
S460:根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集。
本实施例中,将预测结果进行排序,结合预设的组间距离,获得训练集的预分组,根据预分组,获得每个预分组的样本数据个数,具体地,预测结果按照一定的规则进行排序,获得排序后的预测结果,排序规则可以为从小到大,具体排序规则,本申请不做限定,根据预设的组件距离,将排序后的预测结果划分为η个组,训练集也根据对应的预测结果分组,划分为η个组,该η个训练集分组即为训练集的预分组,进一步地,还可以获取每个训练集分组的分组下界,分组下界即是每个分组中对应的预测结果最小值,根据分组下界的大小,对预分组进行排序,得到排序后的预分组,排序规则可以为从小到大,具体排序规则,本申请不做限定,然后根据排序后的η个预分组,统计每个训练集预分组中的样本数据个数,然后,根据排序后的η个预分组和每个训练集预分组中的样本数据个数,通过集中分组,获得分组后的训练集。
上述实施例的方案,通过将预测结果进行排序,结合预设的组间距离,获得训练集的预分组,根据预分组,获得每个预分组的样本数据个数,根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集,该分组后的训练集可用于训练初始第二机器学习模型,为得到业务场景的可解释性机器学习模型提供了前提。
在一个实施例中,如图4所示,S460包括:
S462:若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并;
S464:若预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集。
本实施例中,若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并,具体地,依次对预分组中的样本数据个数进行判断,若某一个预分组中的样本数据个数小于预设比例的相邻预分组的样本个数,与该预分组相邻的第一个预分组即为相邻预分组,预设比例的大小本申请不做具体限定,将该预分组的样本数据与该相邻预分组的样本数据合并为一个预分组,经过一次或者多次合并操作,若预分组的样本数据个数大于等于预设比例的相邻预分组的样本数据个数,则停止合并,得到N个合并后的训练集预分组,也即为分组后的训练集。
上述实施例的方案,通过判断预分组的样本数据个数跟预设比例的相邻预分组的样本个数的大小,若小于预设比例的相邻预分组的样本个数,则合并预分组以及对应的相邻预分组的样本数据,若大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集,分组后的训练集可用于训练初始第二机器学习模型,为得到业务场景的可解释性机器学习模型提供了前提。
在一个实施例中,归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组,之后还包括:对业务场景的可解释性机器学习模型组进行解释,获得业务场景的可解释性机器学习模型组的解释结果。
本实施例中,通过对业务场景的可解释性机器学习模型组中的多个机器学习模型分别进行解释,获得多个机器学习模型的解释结果,也即为业务场景的可解释性机器学习模型组的解释结果。
上述实施例的方案,通过对业务场景的可解释性机器学习模型组进行解释,获得业务场景的可解释性机器学习模型组的解释结果,能够实现支持良好的可解释性结果。
在一个实施例中,如图5所示,上述可解释性机器学习模型构建方法还包括:
S720:获取待测业务场景的样本数据;
S740:通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果;
S760:根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果。
本实施例中,获取待测业务场景的样本数据,通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果,具体地,在实际业务场景中,获得实际业务场景的样本数据,也即为待测业务场景的样本数据,使用业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得预测值,该预测值即为待测业务场景的第一预测结果,然后,根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果。
上述实施例的方案,通过获取待测业务场景的样本数据,通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果,根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果,这种通过可解释性机器学习模型组对业务场景的第一机器学习模型的部分预测结果进行间接预测的方法,降低了可解释性机器学习模型的学习难度。
在一个实施例中,如图6所示,S760包括:
S762:根据分组后的训练集,获得分组空间;
S764:确定第一预测结果对应的分组空间,得到目标分组空间;
S766:通过可解释性机器学习模型组,选定与目标分组空间对应的第二机器学习模型;
S768:通过选定的第二机器学习模型,对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果。
本实施例中,根据分组后的训练集,获得分组空间,每个分组空间包括一个分组后的训练集以及对应的训练集的预测结果,根据分组空间中的预测结果范围,判断第一预测结果的大小属于哪个分组空间的预测结果范围之中,得到第一预测结果对应的分子空间,也即为目标分组空间,根据目标分组空间对应的分组后的训练集,从可解释性机器学习模型组中获得该分组后的训练集对应的业务场景第二机器学习模型,通过该选定的业务场景第二机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果。
上述实施例的方案,通过根据分组后的训练集,获得分组空间,确定第一预测结果对应的分组空间,选定与目标分组空间对应的第二机器学习模型,并对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果,这种通过可解释性机器学习模型组对业务场景的第一机器学习模型的部分预测结果进行间接预测的方法,降低了可解释性机器学习模型的学习难度。
为详细说明本方案中可解释性机器学习模型构建方法及效果,下面以一个最详细实施例进行说明:
针对金融领域常见的风险防控业务场景,获取风险防控业务场景下目标对象的财务状态和征信状态数据,选取80%的样本数据作为训练集,其余样本数据作为测试集,根据训练集对初始第一机器学习模型进行训练,得到风险防控业务场景的第一机器学习模型,初始第一机器学习模型为高精度机器学习模型lightGBM,根据测试集对风险防控业务场景的第一机器学习模型进行测试,得到预测结果,采用根据预测结果集中分组的方法,具体地,将预测结果进行排序,结合预设的组间距离,获得训练集的预分组,根据预分组,获得每个预分组的样本数据个数,若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并,若预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集,根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到风险防控业务场景的多个第二机器学习模型,初始第二机器学习模型为高解释性机器学习模型决策树,归集风险防控业务场景的多个第二机器学习模型,得到风险防控业务场景的可解释性机器学习模型组,对风险防控业务场景的可解释性机器学习模型组进行解释,获得风险防控业务场景的可解释性机器学习模型组的解释结果,根据风险防控业务场景的可解释性机器学习模型组的解释结果,可以得出影响目标对象风险等级的具体原因,若目标对象的风险等级为高风险,可以根据目标对象财务状态和征信状态数据是否良好对目标对象的风险等级为高风险给出具体解释。
获取待测风险防控业务场景的样本数据;通过风险防控业务场景的第一机器学习模型对待测风险防控业务场景的样本数据进行预测,获得待测风险防控业务场景的第一预测结果,根据分组后的训练集,获得分组空间,确定第一预测结果对应的分组空间,得到目标分组空间,根据可解释性机器学习模型组,选定与目标分组空间对应的第二机器学习模型,通过选定的第二机器学习模型,对待测风险防控业务场景的样本数据进行预测,获得待测风险防控业务场景的第二预测结果,若得到的第二预测结果显示目标对象的风险等级为低风险,对应的解释结果为目标对象的征信状态良好且负债高,银行客户经理可以根据目标对象的风险状态预测结果向目标对象推荐合适的理财产品。
本申请的方法还可以针对金融领域智慧营销业务场景,根据目标对象的投资偏好和理财状态数据,构建智慧营销业务场景的可解释性机器学习模型,银行客户经理得到智慧营销业务场景可解释性机器学习模型对目标对象的预测结果,并得到预测结果的具体解释,客户经理根据预测结果和解释结果向目标对象推荐合适的理财产品。需要说明的是,本申请公开的可解释性机器学习模型构建方法和装置还可以用于其他业务场景下的可解释性机器学习模型构建,本申请公开的可解释性机器学习模型构建方法和装置适用的业务场景不做限定。
上述实施例的方案,综合使用以精度为导向的初始第一机器学习模型和以解释性为导向的初始第二机器学习模型,具体以训练集对初始第一机器学习模型进行训练,并根据训练集的预测结果,通过集中分组,获得分组后的训练集;再以分组后的训练集对多个初始第二机器学习模型进行训练,从而得到多个解释性优良的第二机器学习模型,最终构建了业务场景的可解释性机器学习模型组,能够支持得到良好的可解释性结果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的可解释性机器学习模型构建方法的可解释性机器学习模型构建装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个可解释性机器学习模型构建装置实施例中的具体限定可以参见上文中对于可解释性机器学习模型构建方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种可解释性机器学习模型构建装置800,包括:数据获取模块810、第一机器学习模型获取模块820、预测结果获取模块830、训练集分组模块840、第二机器学习模型获取模块850和第二机器学习模型归集模块860,其中:
数据获取模块810,用于获取业务场景的样本数据,样本数据包括训练集和测试集。
第一机器学习模型获取模块820,用于根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型。
预测结果获取模块830,用于根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果。
训练集分组模块840,用于根据预测结果,对训练集进行分组,获得分组后的训练集。
第二机器学习模型获取模块850,用于根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型。
第二机器学习模型归集模块860,用于归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
上述可解释性机器学习模型构建装置,综合使用以精度为导向的初始第一机器学习模型和以解释性为导向的初始第二机器学习模型,具体以训练集对初始第一机器学习模型进行训练,并根据训练集的预测结果,通过集中分组,获得分组后的训练集;再以分组后的训练集对多个初始第二机器学习模型进行训练,从而得到多个解释性优良的第二机器学习模型,最终构建了业务场景的可解释性机器学习模型组,能够支持得到良好的可解释性结果。
在一个实施例中,训练集分组模块840还用于将预测结果进行排序,结合预设的组间距离,获得训练集的预分组;根据预分组,获得每个预分组的样本数据个数;根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集。
在一个实施例中,训练集分组模块840还用于若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并;若预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集。
在一个实施例中,第二机器学习模型归集模块860还用于对业务场景的可解释性机器学习模型组进行解释,获得业务场景的可解释性机器学习模型组的解释结果。
在一个实施例中,可解释性机器学习模型构建装置800还用于获取待测业务场景的样本数据;通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果;根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果。
在一个实施例中,可解释性机器学习模型构建装置800还用于根据分组后的训练集,获得分组空间;确定第一预测结果对应的分组空间,得到目标分组空间;通过可解释性机器学习模型组,选定与目标分组空间对应的第二机器学习模型;通过选定的第二机器学习模型,对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果。
上述可解释性机器学习模型构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储业务场景的可解释性机器学习模型组的解释结果和待测业务场景的第二预测结果。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种可解释性机器学习模型构建方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取业务场景的样本数据,样本数据包括训练集和测试集;
根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;
根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;
根据预测结果,对训练集进行分组,获得分组后的训练集;
根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;
归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将预测结果进行排序,结合预设的组间距离,获得训练集的预分组;根据预分组,获得每个预分组的样本数据个数;根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并;若预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对业务场景的可解释性机器学习模型组进行解释,获得业务场景的可解释性机器学习模型组的解释结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取待测业务场景的样本数据;通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果;根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据分组后的训练集,获得分组空间;确定第一预测结果对应的分组空间,得到目标分组空间;通过可解释性机器学习模型组,选定与目标分组空间对应的第二机器学习模型;通过选定的第二机器学习模型,对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取业务场景的样本数据,样本数据包括训练集和测试集;
根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;
根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;
根据预测结果,对训练集进行分组,获得分组后的训练集;
根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;
归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将预测结果进行排序,结合预设的组间距离,获得训练集的预分组;根据预分组,获得每个预分组的样本数据个数;根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并;若预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对业务场景的可解释性机器学习模型组进行解释,获得业务场景的可解释性机器学习模型组的解释结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取待测业务场景的样本数据;通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果;根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据分组后的训练集,获得分组空间;确定第一预测结果对应的分组空间,得到目标分组空间;通过可解释性机器学习模型组,选定与目标分组空间对应的第二机器学习模型;通过选定的第二机器学习模型,对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取业务场景的样本数据,样本数据包括训练集和测试集;
根据训练集对初始第一机器学习模型进行训练,得到业务场景的第一机器学习模型,初始第一机器学习模型为精度导向的机器学习模型;
根据测试集对业务场景的第一机器学习模型进行测试,得到预测结果;
根据预测结果,对训练集进行分组,获得分组后的训练集;
根据分组后的训练集分别对多个初始第二机器学习模型进行训练,得到业务场景的多个第二机器学习模型,初始第二机器学习模型为可解释性导向的机器学习模型;
归集业务场景的多个第二机器学习模型,得到业务场景的可解释性机器学习模型组。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将预测结果进行排序,结合预设的组间距离,获得训练集的预分组;根据预分组,获得每个预分组的样本数据个数;根据预分组和每个预分组的样本数据个数,通过集中分组,获得分组后的训练集。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将预分组的样本数据与对应的相邻预分组的样本数据进行合并;若预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据预分组的样本数据,获得分组后的训练集。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对业务场景的可解释性机器学习模型组进行解释,获得业务场景的可解释性机器学习模型组的解释结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取待测业务场景的样本数据;通过业务场景的第一机器学习模型对待测业务场景的样本数据进行预测,获得待测业务场景的第一预测结果;根据待测业务场景的第一预测结果和可解释性机器学习模型组,获得待测业务场景的第二预测结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据分组后的训练集,获得分组空间;确定第一预测结果对应的分组空间,得到目标分组空间;通过可解释性机器学习模型组,选定与目标分组空间对应的第二机器学习模型;通过选定的第二机器学习模型,对待测业务场景的样本数据进行预测,获得待测业务场景的第二预测结果。
需要说明的是,本申请公开的可解释性机器学习模型构建方法和装置可用于金融领域的可解释性机器学习模型构建,也可用于除金融领域之外任意领域的可解释性机器学习模型构建,本申请公开的可解释性机器学习模型构建方法和装置的应用领域不做限定,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种可解释性机器学习模型构建方法,其特征在于,所述方法包括:
获取业务场景的样本数据,所述样本数据包括训练集和测试集;
根据所述训练集对初始第一机器学习模型进行训练,得到所述业务场景的第一机器学习模型,所述初始第一机器学习模型为精度导向的机器学习模型;
根据所述测试集对所述业务场景的第一机器学习模型进行测试,得到预测结果;
根据所述预测结果,对所述训练集进行分组,获得分组后的训练集;
根据所述分组后的训练集分别对多个初始第二机器学习模型进行训练,得到所述业务场景的多个第二机器学习模型,所述初始第二机器学习模型为可解释性导向的机器学习模型;
归集所述业务场景的多个第二机器学习模型,得到所述业务场景的可解释性机器学习模型组。
2.根据权利要求1所述的可解释性机器学习模型构建方法,其特征在于,根据所述预测结果,对所述训练集进行分组,获得分组后的训练集包括:
将所述预测结果进行排序,结合预设的组间距离,获得所述训练集的预分组;
根据所述预分组,获得每个所述预分组的样本数据个数;
根据所述预分组和所述每个预分组的样本数据个数,通过集中分组,获得分组后的训练集。
3.根据权利要求2所述的可解释性机器学习模型构建方法,其特征在于,根据所述预分组和所述每个预分组的样本数据个数,通过集中分组,获得分组后的训练集包括:
若所述预分组的样本数据个数小于预设比例的相邻预分组的样本个数,则将所述预分组的样本数据与对应的所述相邻预分组的样本数据进行合并;
若所述预分组的样本数据个数大于等于预设比例的相邻预分组的样本个数,则根据所述预分组的样本数据,获得分组后的训练集。
4.根据权利要求1所述的可解释性机器学习模型构建方法,其特征在于,归集所述业务场景的多个第二机器学习模型,得到所述业务场景的可解释性机器学习模型组,之后还包括:
对所述业务场景的可解释性机器学习模型组进行解释,获得所述业务场景的可解释性机器学习模型组的解释结果。
5.根据权利要求1所述的可解释性机器学习模型构建方法,其特征在于,所述方法还包括:
获取待测业务场景的样本数据;
通过所述业务场景的第一机器学习模型对所述待测业务场景的样本数据进行预测,获得所述待测业务场景的第一预测结果;
根据所述待测业务场景的第一预测结果和所述可解释性机器学习模型组,获得所述待测业务场景的第二预测结果。
6.根据权利要求5所述的可解释性机器学习模型构建方法,其特征在于,根据所述待测业务场景的第一预测结果和所述可解释性机器学习模型组,获得所述待测业务场景的第二预测结果包括:
根据所述分组后的训练集,获得分组空间;
确定所述第一预测结果对应的分组空间,得到目标分组空间;
根据可解释性机器学习模型组,选定与所述目标分组空间对应的所述第二机器学习模型;
通过选定的所述第二机器学习模型,对所述待测业务场景的样本数据进行预测,获得所述待测业务场景的第二预测结果。
7.一种可解释性机器学习模型构建装置,其特征在于,所述装置包括:
数据获取模块,用于获取业务场景的样本数据,所述样本数据包括训练集和测试集;
第一机器学习模型获取模块,用于根据所述训练集对初始第一机器学习模型进行训练,得到所述业务场景的第一机器学习模型,所述初始第一机器学习模型为精度导向的机器学习模型;
预测结果获取模块,用于根据所述测试集对所述业务场景的第一机器学习模型进行测试,得到预测结果;
训练集分组模块,用于根据所述预测结果,对所述训练集进行分组,获得分组后的训练集;
第二机器学习模型获取模块,用于根据所述分组后的训练集分别对多个初始第二机器学习模型进行训练,得到所述业务场景的多个第二机器学习模型,所述初始第二机器学习模型为可解释性导向的机器学习模型;
第二机器学习模型归集模块,用于归集所述业务场景的多个第二机器学习模型,得到所述业务场景的可解释性机器学习模型组。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111609146.2A CN114254762A (zh) | 2021-12-27 | 2021-12-27 | 可解释性机器学习模型构建方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111609146.2A CN114254762A (zh) | 2021-12-27 | 2021-12-27 | 可解释性机器学习模型构建方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114254762A true CN114254762A (zh) | 2022-03-29 |
Family
ID=80797902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111609146.2A Pending CN114254762A (zh) | 2021-12-27 | 2021-12-27 | 可解释性机器学习模型构建方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114254762A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115396212A (zh) * | 2022-08-26 | 2022-11-25 | 国科华盾(北京)科技有限公司 | 检测模型的训练方法、装置、计算机设备和存储介质 |
-
2021
- 2021-12-27 CN CN202111609146.2A patent/CN114254762A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115396212A (zh) * | 2022-08-26 | 2022-11-25 | 国科华盾(北京)科技有限公司 | 检测模型的训练方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hung et al. | Customer segmentation using hierarchical agglomerative clustering | |
CN107230108A (zh) | 业务数据的处理方法及装置 | |
CN110674636B (zh) | 一种用电行为分析方法 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN114254762A (zh) | 可解释性机器学习模型构建方法、装置和计算机设备 | |
CN111352926A (zh) | 数据处理的方法、装置、设备及可读存储介质 | |
CN110991247B (zh) | 一种基于深度学习与nca融合的电子元器件识别方法 | |
CN112884569A (zh) | 一种信用评估模型的训练方法、装置及设备 | |
CN116703466A (zh) | 基于改进灰狼算法的系统访问量预测方法及其相关设备 | |
CN116191398A (zh) | 负荷预测方法、装置、计算机设备和存储介质 | |
CN113051911B (zh) | 提取敏感词的方法、装置、设备、介质及程序产品 | |
Shan et al. | Incorporating user behavior flow for user risk assessment | |
CN114170000A (zh) | 信用卡用户风险类别识别方法、装置、计算机设备和介质 | |
CN113674087A (zh) | 企业信用等级评定方法、装置、电子设备和介质 | |
CN112884028A (zh) | 一种系统资源调整方法、装置及设备 | |
Rong et al. | Exploring network behavior using cluster analysis | |
CN113689020A (zh) | 业务信息预测方法、装置、计算机设备和存储介质 | |
Liu et al. | A comparison of machine learning algorithms for prediction of past due service in commercial credit | |
CN110223102A (zh) | 客户推荐方法、装置、电子设备及存储介质 | |
Wu et al. | Explainable Network Pruning for Model Acceleration Based on Filter Similarity and Importance | |
CN113538020B (zh) | 获取客群特征关联度方法、装置、存储介质和电子装置 | |
CN114881761A (zh) | 相似样本的确定方法与授信额度的确定方法 | |
Kuizinienė et al. | Deep learning for credit scoring” | |
CN117151884A (zh) | 资产管理数据处理方法、装置、计算机设备和存储介质 | |
Wagh et al. | Forest cover type prediction using cartographic variables |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |