WO2017133569A1

WO2017133569A1 - 评估指标获取方法及装置

Info

Publication number: WO2017133569A1
Application number: PCT/CN2017/072405
Authority: WO
Inventors: 姜晓燕; 王少萌; 杨旭; 蔡宁
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2016-02-05
Filing date: 2017-01-24
Publication date: 2017-08-10
Also published as: CN107045506A; TW201732643A; US20190034516A1

Abstract

一种评估指标获取方法及装置，该方法包括：通过将样本输入分类模型进行分类训练，获取分类模型的输出数据（101），对输出数据进行概率分布统计获取概率统计结果，其中概率统计结果包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量（102），根据阈值集和概率统计结果计算分类模型的评估指标（103）。该方法和装置通过对分类模型的输出数据进行概率统计，基于得到的概率统计结果对评估指标进行计算，解决了在评估指标的计算过程中多次扫描输出数据的问题，尤其在输出数据为大规模数据时可以提高评估指标的计算效率。

Description

评估指标获取方法及装置

本申请要求2016年02月05日递交的申请号为201610082141.1、发明名称为“评估指标获取方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明属于数据处理领域，尤其涉及一种评估指标获取方法及装置。

背景技术

在大数据挖掘的业务场景中，经常需要针对超大规模的数据使用分类算法进行训练分类。当前分类算法有很多，而且不同的分类算法又用很多不同的变种。当根据分类算法建立一个分类模型之后，会考虑该分类模型的性能或准确率，因此需要对该分类模型的优良情况进行评估。目前，二分类算法模型的评估指标包括：混淆矩阵、受试者工作特征曲线(receiver operating characteristic curve，简称ROC)图、ROC图中的曲线下的面积(Area Under RocCurve，简称AUC)值与提升(Lift)图等指标。

现有的对二分类算法对应的分类模型的评估方法或者系统中，在获取评估指标的过程中，每当输入一个阈值点时，在计算与该阈值点对应的评估参数时，就需要对分类模型的输出数据进行一次扫描。经过大量阈值点的输入，然后获取到该分类模型的评估指标。对大规模数据来说，通过多次扫描分类模型的输出数据，获取该分类模型评估指标的方式存在计算效率较低的问题。

发明内容

本发明提供一种评估指标获取方法及装置，用于解决通过多次扫描分类模型的输出数据来获取评估指标的方式存在计算效率较低的问题。

为了实现上述目的，本发明提供了一种评估指标获取方法，包括：

将样本输入分类模型进行分类训练，获取分类模型的输出数据；

对所述输出数据进行概率分布统计获取概率统计结果；其中，所述概率统计结果包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量；

根据阈值集和所述概率统计结果计算所述分类模型的评估指标。

为了实现上述目的，本发明提供了一种评估指标获取装置，包括：

分类训练模块，用于将样本输入分类模型进行分类训练，获取分类模型的输出数据；

概率统计模块，用于对所述输出数据进行概率分布统计获取概率统计结果；其中，所述概率统计结果包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量；

计算模块，用于根据阈值集和所述概率统计结果计算所述分类模型的评估指标。

本发明提供的评估指标获取方法及装置，通过对分类模型的输出数据进行概率统计，基于得到的包括概率区间以及对应的实际正样本和实际负样本数量的概率统计结果对评估指标进行计算，解决了在评估指标的计算过程中多次扫描输出数据的问题，尤其在输出数据为大规模数据时可以提高评估指标的计算效率。

附图说明

图1为本发明实施例一的评估指标获取方法的流程示意图；

图2为本发明实施例二的评估指标获取方法的流程示意图；

图3为本发明实施例二的评估指标获取方法的应用示例示意图之一；

图4为本发明实施例二的评估指标获取方法的应用示例示意图之二；

图5为本发明实施例三的评估指标获取装置的结构示意图；

图6为本发明实施例四的评估指标获取装置的结构示意图。

具体实施方式

下面结合附图对本发明实施例提供的评估指标获取方法及装置进行详细描述。

实施例一

如图1所示，其为本发明实施例一的评估指标获取方法的流程示意图。该评估指标获取方法包括以下步骤：

S101、将样本输入分类模型进行分类训练，获取分类模型的输出数据。

二分类算法对应的分类模型将样本分成正样本或者负样本。在分类模型中往往将正样本用“1”表示，将负样本用“0”表示。其中，输入分类模型的每个样本都有一个原始的样本属性。本实施例中，样本属性包括正样本属性和负样本属性。原始的样本属性表示样本实际是正样本还是负样本。

为了对分类模型进行评估，需要将样本输入分类模型中进行分类训练，在训练完成后，分类模型会对每个样本进行分类和概率预测。具体地，分类模型在训练完成后为每个样本输出训练后的样本属性，训练后的样本属性可以指示出样本经过分类模型后是正样本还是负样本。

进一步地，分类模型在训练完成后还会为每个样本进行概率预测，用户可以根据实际需要选择输出每个样本经过分类模型预测成正样本的概率，或者选择输出每个样本经过分类模型预测成负样本的概率。其中，样本经过分类模型被预测成正样本的概率和被预测成负样本的概率的和为1。

S102、对输出数据进行概率分布统计获取概率统计结果；其中，概率统计结果包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量。

在获取到输出数据后，由于分类模型会对每个样本进行概率预测，这样输出数据中每个样本会有一个预测概率，本实施例中，分类模型输出的每个样本的概率为每个样本被分类模型预测成正样本的预测概率。

进一步地，根据预测概率对输出数据进行概率分布统计，获取概率统计结果。在进行概率统计时首先需要划分概率区间，然后在每个概率区间内基于输出数据中每个样本原始的样本属性统计实际正样本数量和实际负样本数量，得到正样本和负样本的概率分布图，基于正样本的概率分布图获取每个概率区间内实际正样本数量，基于负样本的概率分布图获取每个概率区间内实际负样本数量。

优选地，基于直方图算法对输出数据进行概率分布的统计，获取正样本的直方图和负样本的直方图，基于正样本的直方图和负样本的直方图能够获取到上述概率统计结果。

S103、根据阈值集和概率统计结果计算分类模型的评估指标。

在获取到概率统计结果后，需要获取阈值集，其中阈值集中包括多个阈值点，然后基于每个阈值点和概率统计结果中每个概率区间内实际正样本数据和实际负样本数据，获取每个阈值点对应的评估参数，利用所有阈值点对应的评估参数生成分类模型的评估指标。

本实施例中，在概率统计结果后，可以将概率统计结果中的概率区间的端点值作为阈值点构成阈值集。例如，可以利用每个概率区间的下限值作为阈值点构成阈值集。或者将部分概率区间的下限值作为阈值点构成阈值集。再例如，可以将概率区间的上限值作为阈值点构成阈值集。本实施例中在概率统计的过程中，对概率区间进行划分，概率区间的端点可作为分界点，直接将概率区间的端点值作为阈值点，不需要进行阈值点的重新设定，进而提高了评估指标的计算效率。

可选地，可以接收用户输入的利用概率区间的端点值作为阈值点构成阈值集。例如，用户可以将每个概率区间的下限值作为阈值点构成阈值集，或者用户选取部分概率区间的下限值作为阈值点构成阈值集。本实施例中，用户根据反馈的概率统计结果，可以初步对分类模型的效果有一定的了解，从而能够选取合适的阈值点构成阈值集，用户交互较好，而且对分类模型的评估更加准确。

进一步地，在获取到阈值集后，根据阈值集中的阈值点和概率统计结果计算评估指标。其中，评估指标包括混淆矩阵、ROC曲线、AUC值和Lift图。

其中，混淆矩阵中包括：实际为正样本预测为正样本的数量(True Positives，简称TP)、实际为负样本预测为正样本的数量(False Positives，简称FP)、实际为负样本预测为负样本的数量(True Negatives，简称TN)和实际为正样本预测为负样本的数量(False Negatives，简称FN)。

在获取到阈值点之后，将阈值点作为分界点，对于正样本的概率分布来说，大于阈值点的所有概率区间内实际正样本被分类模型预测成正样本，对实际正样本被分类模型预测成正样本的数量进行累积，将累积的实际正样本被分类模型预测成正样本的数量作为混淆矩阵的TP。而小于阈值点的所有概率区间内实际正样本被分类模型预测成负样本，对实际正样本被分类模型预测成负样本的数量进行累计，将累计后的实际正样本被分类模型预测成负样本的数量作为混淆矩阵的FP。

对于负样本的概率分布来说，大于阈值点的所有概率区间内实际负样本被分类模型预测成正样本，对实际负样本被分类模型预测成正样本的数量进行累积，将累积的实际负样本被分类模型预测成正样本的数量作为混淆矩阵的FN。而小于阈值点的所有概率区间内实际负样本被分类模型预测成负样本，对实际负样本被分类模型预测成负样本的数量进行累计，将累计后的实际负样本被分类模型预测成负样本的数量作为混淆矩阵的TN。

在获取到阈值点对应的混淆矩阵后，可以利用混淆矩阵中的TP、FP、TN和FN，计算得到其他评估指标的该阈值点对应的评估参数，当所有阈值点对应的评估参数计算完成后，利用每个阈值点对应的评估参数生成评估指标。例如，根据一个阈值点对应的混淆矩阵可以计算出在该阈值点处ROC曲线的坐标，将坐标作为该阈值点ROC曲线的评估参数。当所有阈值点对应的评估参数计算完成后，利用每个阈值点对应的ROC曲线的坐标绘制ROC曲线。

本实施例提供的评估指标获取方法，通过对分类模型的输出数据进行概率统计，基于得到包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量的概率统计结果对评估指标进行计算，解决了在评估指标的计算过程中多次扫描输出数据的问题，尤其在输出数据为大规模数据时可以提高评估指标的计算效率。

实施例二

如图2所示，其为本发明实施例二的评估指标获取方法的流程示意图。该评估指标获取方法包括以下步骤：

S201、将样本输入分类模型进行分类训练，获取分类模型的输出数据。

为了对分类模型进行评估，需要将样本输入分类模型中进行分类训练，在训练完成后，分类模型会对每个样本进行分类和概率预测。具体地，分类模型在训练完成后为每个样本输出训练后的样本属性，训练后的样本属性可以指示出样本经过分类模型后是正样本还是负样本。进一步地，分类模型在训练完成后还会为每个样本进行概率预测，一般分类模型会选择输出每个样本经过分类模型预测成正样本的概率。

本实施例中，分类模型进行分类训练后的输出数据中包括：每个样本原始的样本属性以及每个样本被分类模型预测成正样本的预测概率。本实施例中，样本属性包括正样本属性和负样本属性。在分类模型中往往将正样本用“1”表示，将负样本用“0”表示。

S202、基于直方图算法对输出数据进行概率区间划分，统计每个概率区间内实际正样本数量和实际负样本数量。

具体地，对分类模型的输出数据进行扫描。本实施例中，假设分类器的输出表格式为：原始的样本属性、分类模型的预测后样本属性以及样本被分类模型预测成正样本的预测概率。一般情况下，分类模型可以设置有选择项，可以选择输出样本被分类模型预测成正样本的预测概率或者样本被分类模型预测成正样本的预测概率。相应地，可以选择生成正样本对应的ROC曲线和Lift图，或者选择生成负样本对应的ROC曲线和Lift图，本实施例中以正样本为例。

进一步地，根据每个样本被预测成正样本的预测概率和输出数据中每个样本原始的样本属性生成正样本对应的第一直方图和负样本对应的第二直方图。其中，第一直方图的横轴是预测概率，第一直方图的纵轴是实际正样本数量，第二直方图的横轴是预测概率，第二直方图的纵轴是实际负样本数量。

在生成第一直方图和第二直方图的过程中，两个直方图的概率区间可能不同步，为了获取到一致的概率区间，需要调整横轴步长使第一直方图和第二直方图的概率区间一致，在概率区间调整一致后，可以获取到概率统计结果中的概率区间。

在获取到概率区间后，可以从第一直方图中统计获取每个概率区间内实际正样本的数量，以及可以从第二直方图中统计获取每个概率区间内实际负样本的数量。

S203、获取阈值点构成的阈值集。

在生成了概率区间后，可以将概率区间的端点值作为阈值点，构成阈值集，可选地，将部分概率区间的下限值或者上限值作为阈值点构成阈值集，例如，选取每隔一个概率区间选取一个下限值作为阈值点构成阈值集。本实施例中，在概率统计的过程，完成概率区间的划分，概率区间的端点值能够作为分界点，从而可将概率区间的端点值作为阈值点构成阈值集，不需要在对阈值进行重新设定，进而提高了评估指标的计算效率。

可选地，在获取到概率区间后，可以将概率统计结果反馈给用户，以使用户利用概率区间的端点值作为阈值点构成阈值集。例如，用户可以将每个概率区间的下限值作为阈值点作为阈值集，或者用户选取部分概率区间的下限值作为阈值点构成阈值集可以选取部分概率区间的端点值作为阈值点构成阈值集。在获取到阈值集后，用户输入阈值集进行计算评估指标。本实施例中，通过直方图的统计过程，用户根据反馈的概率统计结果，可以初步对分类模型的效果有一定的了解，从而能够选取合适的阈值点构成阈值集，用户交互较好，而且对分类模型的评估更加准确。

S204、按照由大到小的顺序获取阈值集中每个阈值点对应的混淆矩阵。

其中，混淆矩阵包括实际为正样本被预测为正样本的数量TP、实际为正样本被预测为负样本的数量FP、实际为负样本被预测为负样本的数量TN、实际为负样本被预测为正样本的数量FN，如下表1所示。

表1为混淆矩阵的示意表

具体地，对于正样本对应的第一直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内实际正样本数量进行累积得到TP，以及对小于阈值点的所有概率区间内实际正样本数量进行累积得到FN。

对于负样本对应的第二直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内负样本数量进行累积得到FP，以及对小于阈值点的所有概率区间内负样本数量进行累积得到TN。

S205、将每个阈值点对应的混淆矩阵作为评估指标。

S206、针对每一个阈值点，根据混淆矩阵获取对应的ROC坐标。

S207、利用每个阈值点的ROC坐标绘制ROC曲线。

S208、获取每个由相邻阈值点对应的ROC坐标与ROC曲线构成的曲边梯形的面积。

S209、将所有曲边梯形的面积相加得到ROC曲线的AUC值。

在获取到每个阈值点的混淆矩阵后，根据混淆矩阵可以获取到分类模型其他的评估指标，例如ROC曲线、ROC曲线下面积AUC值以及Lift图。

具体地，针对每一个阈值点，将FP与实际负样本总量的比值作为ROC的横坐标，以及将TP与实际正样本总量的比值作为ROC的纵坐标。在获取到每个阈值点对应的ROC坐标后，对所有阈值点对应的ROC坐标进行描点绘制ROC曲线。

进一步地，在绘制出ROC曲线后，由相邻阈值点对应的ROC坐标与ROC曲线可以构成一个曲边梯形，根据相邻的ROC坐标能够计算一个曲边梯形的面积。在获取到所有的曲边梯形的面积后，将所有面积相加得到该ROC曲线的AUC值。

S210、针对每一个阈值点，根据混淆矩阵获取对应的Lift坐标。

具体地，针对每一个阈值点，将TP和FP的和值与样本总量的比值作为Lift图的横坐标，以及将TP作为Lift图的纵坐标。

S211、利用每个阈值点对应的Lift坐标绘制Lift图。

进一步地，在获取到每个阈值点对应的Lift坐标后，将所有阈值点对应的Lift坐标绘制Lift图。

S212、接收用户的显示指令，根据显示指令将评估指标进行可视化展示。

在获取到评估指标后，用户可以发送显示评估指标的显示指令，在接收到显示指令后，向用户可视化展示计算出的评估指标，使得用户能够直观地判断分类模型的优良情况。

本实施例中，可以在服务器上执行该评估指标获取方法，在计算出评估指标，用户可以向服务器进行发送显示指令，在接收到显示指令，服务器可以将评估指标下发给本地终端，这样本地终端通过显示屏将评估指标进行可视化展示，如向用户展示ROC曲线、Lift图等。

可选地，对于大规模数据，计算直方图时数据量较大，可以在服务器上进行计算，在计算完直方图后，可以将直方图结果下发到本地终端，在本地终端上计算评估指标，这样可以减缓服务器的压力。在计算出评估指标后，用户可以向本地终端发送显示指令，在接收到显示指令后，本地终端通过显示屏将评估指标进行可视化展示，如向用户展示ROC曲线、Lift图等。当用户点击ROC曲线上的点时，可以将该点对应的混淆矩阵进行展示。

可选地，可以在本地终端上执行该评估指标获取方法，在计算出评估指标后，用户可以向本地终端发送显示指令，在接收到显示指令后，在显示屏上进行可视化展示，如向用户展示ROC曲线、Lift图等。当用户点击ROC曲线上的点时，可以将该点对应的混淆矩阵进行展示。

为了更好地理解本实施例提供的评估指标获取方法，下面举例进行说明：样本为用户0～用户99，样本用户具有如下的特征参数：年龄(age)、工作性质(workclass)、取样量(fnlwgt)学历(education)、教育程度(education_num)、婚姻状况(matrital_status)、职业(occupation)、家庭情况(relationship)、种族(race)、性别(sex)、资本收益(capital_gain)、资本损失(capital_loss)、每周工作时长(hours_per_week)、国籍(native_country)等，将这些用户的特征参数输入到分类模型中进行分类训练，能够获取到一个用于用户收入情况的分类结果。在该例子中用“0”表示为低收入，“1”表示高收入。将高收入作为正样本属性，将低收入作为负样本属性。分类模型的输出数据中包括每个样本原始的样本属性、预测的样本属性以及每个样本被预测成高收入类别的概率，如下表2所示。

表2为分类模型的输出数据

对分类模型的输出数据进行直方图计算，得到如下表3和表4，表3为正样本对应的第一直方图结果，表4为负样本对应的第二直方图结果。

表3为正样本的第一直方图结果

概率区间	概率区间内正样本数量
[0,0.04)	0
[0.04,0.08)	0
[0.08,0.12)	0
[0.12,0.16)	0
[0.16,0.2)	0

[0.2,0.24)	0
[0.24,0.28)	0
[0.28,0.32)	0
[0.32,0.36)	0
[0.36,0.4)	1
[0.4,0.44)	0
[0.44,0.48)	2
[0.48,0.52)	0
[0.52,0.56)	1
[0.56,0.6)	0
[0.6,0.64)	2
[0.64,0.68)	3
[0.68,0.72)	2
[0.72,0.76)	3
[0.76,0.8)	0
[0.8,0.84)	2
[0.84,0.88)	3
[0.88,0.92)	1
[0.92,0.96)	0
[0.96,1)	5

表4为负样本的第二直方图

概率区间	概率区间内负样本数量
[0,0.04)	34
[0.04,0.08)	13
[0.08,0.12)	10
[0.12,0.16)	5
[0.16,0.2)	3
[0.2,0.24)	3
[0.24,0.28)	4
[0.28,0.32)	1
[0.32,0.36)	0

[0.36,0.4)	1
[0.4,0.44)	1
[0.44,0.48)	0
[0.48,0.52)	0
[0.52,0.56)	0
[0.56,0.6)	0
[0.6,0.64)	0
[0.64,0.68)	0
[0.68,0.72)	0
[0.72,0.76)	0
[0.76,0.8)	0
[0.8,0.84)	0
[0.84,0.88)	0
[0.88,0.92)	0
[0.92,0.96)	0
[0.96,1)	0

在获取到第一直方图和第二直方图的结果后，可以获取到概率区间，将每个概率区间的下限制作为阈值点构成阈值集。该示例中阈值集为：0、0.04、0.08、0.12、0.16、0.2、0.24、0.28、0.32、0.36、0.4、0.44、0.48、0.52、0.56、0.6、0.64、0.68、0.72、0.76、0.8、0.84、0.88、0.92、0.96

此处仅以两个阈值点作为示例说明阈值点对应评估参数的计算过程：

当阈值点选择为0.4时，根据第一直方图和第二直方图可以获取阈值点为0.4时的混淆矩阵：TP＝24，FP＝1，FN＝1，TN＝74。

当阈值点选择为0.6时，根据第一直方图结果和第二直方图结果可以获取阈值点为0.6时的混淆矩阵：TP＝21，FP＝4，FN＝0，TN＝75。

对于每个阈值点，根据混淆矩阵可以计算出对应的ROC坐标和Lift坐标。

ROC坐标：横坐标X＝FP/(FP+TN)；纵坐标Y＝TP/(TP+FN)。Lift坐标：横坐标X＝(TP+FN)/样本总量；纵坐标Y＝TP。在获取到所有的阈值点对应的ROC坐标和Lift坐标后，就可以描点绘制ROC曲线以及Lift图。图3为分类模型的ROC曲线，图3中ROC曲线的纵坐标为击中率TPR(True Positive Rate)，击中率可用于指示出分类模型识别出正样本的灵敏度(Sensitivity)。TPR＝TP/(TP+FN)；横坐标为假正率FPR(False Positive Rate)，其中，FPR＝FP/(FP+TN)。其中，假正率可以通过特异率(Spcificity表示，假正率＝1-Spcificity，特异率为负例的覆盖率(True Negative Rate，TNR)TNR＝TN/(TN+FP)。

图4为分类模型的Lift图，图4中纵坐标为实际正样本的数量，横坐标为正样本预测比例＝(TP+FN)/样本总量。

在获取到每个阈值点对应的ROC坐标后，可以绘制出ROC曲线后，由相邻阈值点对应的ROC坐标与ROC曲线可以构成一个曲边梯形，根据相邻的ROC坐标能够计算一个曲边梯形的面积。在获取到所有的曲边梯形的面积后，将所有曲边梯形的面积相加得到ROC曲线对应的AUC值。

下面为计算评估参数的代码：

输入：N，icProb，icTrue，icFalse#N为概率区间的个数、icProb概率区间的下限值、icTrue概率区间内实际正样本的数量、icFalse概率区间内实际负样本的数量#

输出：每个阈值点对应的ROC坐标，Lift坐标，混淆矩阵，AUC值；

计算过程：

1.计算总体正样本数量：totalTrue＝∑(icTrue)；总体负样本数量：totalFalse＝∑(icFalse)

2.初始化累计正负样本数量curTrue＝0，curFalse＝0

3.For i：0to N

a)阈值点p＝icProb[N-1-i]

b)curTrue+＝icTrue[N-1-i]；curFalse+＝icFalse[N-1-i]#对实际正样本被预测成正样本数量进行累积得到TP，对实际负样本被预测成正样本数量进行累积得到FN#

c)混淆矩阵坐标：cm.p＝p；cm.tp＝curTrue,cm.fp＝curFalse

cm.fn＝totalTrue-curTrue,cm.tn＝totalFalse–curFalse

d)ROC坐标：roc.p＝p；

roc.x＝curFalse/totalFalse

roc.y＝curTrue/totalTrue

e)Lift坐标：lift.p＝plift.x＝(curTrue+curFalse)/(totalTrue+totalFalse)

lift.y＝curTrue

4.根据ROC坐标计算曲线下方的面积，即AUC值。

通过上述实施例可以看出，根据直方图计算结果计算得出的混淆矩阵，然后基于该混淆矩阵就可以方便的计算出其他评估指标，并生成可视化图像，用户可以直观地判断分类模型的优良。

实施例三

如图5所示，其为本发明实施例三的评估指标获取装置的结构示意图。该评估指标获取装置包括：分类训练模块11、概率统计模块12和计算模块13。

分类训练模块11，用于将样本输入分类模型进行分类训练，获取分类模型的输出数据。

为了对分类模型进行评估，分类训练模块11需要将样本输入分类模型中进行分类训练，在训练完成后，分类训练模块11会对每个样本进行分类和概率预测。具体地，分类训练模块11在训练完成后为每个样本输出训练后的样本属性，训练后的样本属性可以指示出样本经过分类模型后是正样本还是负样本。

进一步地，分类训练模块11在训练完成后还会为每个样本进行概率预测，用户可以根据实际需要选择输出每个样本经过分类模型预测成正样本的概率，或者选择输出每个样本经过分类模型预测成负样本的概率。其中，样本经过分类模型被预测成正样本的概率和被预测成负样本的概率的和为1。

其中，输入的每个样本都有一个原始的样本属性。本实施例中，样本属性包括正样本属性和负样本属性。原始的样本属性表示样本实际是正样本还是负样本。

概率统计模块12，用于对输出数据进行概率分布统计获取概率统计结果。

其中，概率统计结果包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量。

在获取到输出数据后，由于分类训练模块11会对每个样本进行概率预测，这样输出数据中每个样本会有一个预测概率，本实施例中，分类训练模块11输出的每个样本的概率为每个样本被分类模型预测成正样本的预测概率。

进一步地，概率统计模块12根据预测概率对输出数据进行概率分布统计，获取概率统计结果。概率统计模块12在进行概率统计时首先需要划分概率区间，然后在每个概率区间内基于输出数据中每个样本原始的样本属性统计实际正样本数量和实际负样本数量，得到正样本和负样本的概率分布图，基于正样本的概率分布图获取每个概率区间内实际正样本数量，基于负样本的概率分布图获取每个概率区间内实际负样本数量。

优选地，概率统计模块12基于直方图算法对输出数据进行概率分布的统计，获取正样本的直方图和负样本的直方图，基于正样本的直方图和负样本的直方图能够获取到上述概率统计结果。

计算模块13，用于根据阈值集和概率统计结果计算分类模型的评估指标。

在获取到概率统计结果后，需要获取阈值集，其中阈值集中包括多个阈值点，然后基于每个阈值点和概率统计结果中每个概率区间内实际正样本的第一数据和实际负样本的第二数据，获取每个阈值点对应的评估参数，利用所有阈值点对应的评估参数生成分类模型的评估指标。

本实施例中，在概率统计结果后，计算模块13可以将概率统计结果中的概率区间的端点值作为阈值点构成阈值集。例如，可以利用每个概率区间的下限值作为阈值点构成阈值集。或者将部分概率区间的下限值作为阈值点构成阈值集。在概率统计的过程中，对概率区间进行划分，本实施例中概率区间的端点可作为分界点，直接将概率区间的端点值作为阈值点，不需要进行阈值点的重新设定，进而提高了评估指标的计算效率。

可选地，计算模块13可以接收用户输入的利用概率区间端值点作为阈值点阈值集。例如，用户可以将每个概率区间的下限值作为阈值点构成阈值集，或者用户选取部分概率区间的下限值作为阈值点构成阈值集本实施例中，用户根据反馈的概率统计结果，可以初步对分类模型的效果有一定的了解，从而能够选取合适的阈值点构成阈值集，用户交互较好，而且对分类模型的评估更加准确。

进一步地，计算模块13根据阈值集中的阈值点和概率统计结果计算评估指标。其中，评估指标包括混淆矩阵、ROC曲线、AUC值和Lift图。

其中，混淆矩阵中包括：TP、FP、TN和FN。

在获取到阈值点之后，计算模块13将阈值点作为分界点，对于正样本的概率分布来说，大于阈值点的所有概率区间内实际正样本被分类模型预测成正样本，对实际正样本被分类模型预测成正样本的数量进行累积，将累积的实际正样本被分类模型预测成正样本的数量作为混淆矩阵的TP。而小于阈值点的所有概率区间内实际正样本被分类模型预测成负样本，对实际正样本被分类模型预测成负样本的数量进行累计，将累计后的实际正样本被分类模型预测成负样本的数量作为混淆矩阵的FP。

在获取到阈值点对应的混淆矩阵后，计算模块13可以利用混淆矩阵中的TP、FP、TN和FN，计算得到其他评估指标的该阈值点对应的评估参数，当所有阈值点对应的评估参数计算完成后，利用每个阈值点对应的评估参数生成评估指标。例如，根据一个阈值点对应的混淆矩阵可以计算出在该阈值点处ROC曲线的坐标，将坐标作为该阈值点ROC曲线的评估参数。当所有阈值点对应的评估参数计算完成后，利用每个阈值点对应的ROC曲线的坐标绘制ROC曲线。

本实施例提供的评估指标获取装置，通过对分类模型的输出数据进行概率统计，基于得到的概率统计结果对评估指标进行计算，解决了在评估指标的计算过程中多次扫描输出数据的问题，尤其在输出数据为大规模数据时可以提高评估指标的计算效率。

实施例四

如图6所示，其为本发明实施例四的评估指标获取装置的结构示意图。该评估指标获取装置包括：分类训练模块21、概率统计模块22、计算模块23和可视化模块24。

分类训练模块21，用于将样本输入分类模型进行分类训练，获取分类模型的输出数据。

进一步地，概率统计模块22，具体用于直方图计算单元221，用于基于直方图算法对输出数据进行概率区间划分，统计每个概率区间内实际正样本数量和实际负样本数量。

其中，输出数据包括：每个样本原始的样本属性以及每个样本被分类模型预测成正样本的预测概率；其中，样本属性包括正样本属性和负样本属性。

进一步地，概率统计模块22一种可选的结构方式包括：扫描单元221、直方图生成单元222、步长调整单元223和统计单元224。

扫描单元221，用于扫描输出数据。

直方图生成单元222，用于根据每个样本被预测成正样本的预测概率和输出数据中每个样本原始的样本属性生成正样本对应的第一直方图和负样本对应的第二直方图；其中，第一直方图的横轴是预测概率，第一直方图的纵轴是实际正样本数量；第二直方图的横轴是预测概率，第二直方图的纵轴是实际负样本数量。

步长调整单元223，用于调整横轴步长使第一直方图和第二直方图的概率区间一致，以获取概率统计结果中的概率区间。

统计单元224，用于统计第一直方图中每个概率区间内实际正样本的数量，以及统计第二直方图中每个概率区间内实际负样本的数量。

本实施例中，计算模块23一种可选的结构方式包括：阈值集获取单元231、混淆矩阵生成单元232和评估指标生成单元233。

阈值集获取单元231，用于将每个概率区间的端点值作为阈值点构成阈值集。

进一步地，阈值集获取单元231，还用于接收用户输入的根据概率区间的端点值构成的阈值集。

混淆矩阵生成单元232，用于按照由大到小的顺序获取阈值集中每个阈值点对应的混淆矩阵，其中，混淆矩阵包括TP、FP、TN、FN。

评估指标生成单元233，用于将每个阈值点对应的混淆矩阵作为分类模块的评估指标。

进一步地，混淆矩阵生成单元232，具体用于对于第一直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内实际正样本数量进行累积得到TP，以及对小于阈值点的所有概率区间内实际正样本数量进行累积得到FN，以及对于第二直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内负样本数量进行累积得到FP，以及对小于阈值点的所有概率区间内负样本数量进行累积得到TN。

评估指标生成单元233，具体用于将每个阈值对应的混淆矩阵作为评估指标。

评估指标生成单元233，具体用于针对每一个阈值点，将FP与实际负样本总量的比值作为ROC的横坐标，以及将TP与实际正样本总量的比值作为ROC的纵坐标，以及利用所有阈值点对应的ROC坐标绘制分类模型的评估指标ROC曲线。

评估指标生成单元233，具体用于获取每个由相邻阈值点对应的ROC坐标与所述ROC曲线构成的曲边梯形的面积，将所有曲边梯形的面积相加得到所述ROC曲线的AUC值。

评估指标生成单元233，具体用于针对每一个阈值点将TP和FP的和值与样本总量的比值作为Lift图的横坐标，以及将TP作为Lift图的纵坐标以及利用所有阈值点对应的Lift坐标绘制分类模型的评估指标Lift图。

可视化模块24，用于接收用户的显示指令，根据显示指令将评估指标进行可视化展示。

本实施例中，评估指标获取装置可以设置在服务器上执行该评估指标获取方法，在计算出评估指标，用户可以向该装置中的可视化模块24发送显示指令，在接收到显示指令，可视化模块24可以将评估指标下发给本地终端，这样本地终端通过显示屏将评估指标进行可视化展示，如向用户展示ROC曲线、Lift图等。当用户点击ROC曲线上的点时，可以将该点对应的混淆矩阵进行展示。

可选地，对于大规模数据，评估指标获取装置中分类训练模块21和概率统计模块22可以设置在服务器上，而将计算模块23和可视化模块24设置在本地终端上，以减少服务器的压力，且便于与用户的交互。在服务器上对样本数据进行分类训练以及直方图计算，在计算完直方图后，概率统计模块22可以将直方图结果下发到本地终端的计算模块23中，计算模块23在本地终端上计算评估指标，这样可以减缓服务器的压力。在计算出评估指标后，用户可以向可视化模块24发送显示指令，在接收到显示指令后，可视化模块24通过显示屏将评估指标进行可视化展示，如向用户展示ROC曲线、Lift图等。当用户点击ROC曲线上的点时，可以将该点对应的混淆矩阵进行展示。

可选地，评估指标获取装置可以设置在本地终端上执行该评估指标获取方法，在计算出评估指标后，用户可以向可视化模块24发送显示指令，在接收到显示指令后，可视化模块24在显示屏上进行可视化展示，如向用户展示ROC曲线、Lift图等。当用户点击ROC曲线上的点时，可以将该点对应的混淆矩阵进行展示。

本实施例提供的评估指标获取装置，对分类模型的输出数据进行概率统计，基于得到包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量的概率统计结果对评估指标进行计算，解决了在评估指标的计算过程中多次扫描输出数据的问题，尤其在输出数据为大规模数据时可以提高评估指标的计算效率。进一步地，在获取到评估指标后，能够将评估指标可视化展示，使用户能够直观地判断分类模型的优良情况。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

一种评估指标获取方法，其特征在于，包括：

将样本输入分类模型进行分类训练，获取分类模型的输出数据；

对所述输出数据进行概率分布统计获取概率统计结果；其中，所述概率统计结果包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量；

根据阈值集和所述概率统计结果计算所述分类模型的评估指标。
根据权利要求1所述的评估指标获取方法，其特征在于，所述对所述输出数据进行概率分布统计获取概率统计结果，包括：

基于直方图算法对所述输出数据进行概率区间划分，统计每个概率区间内所述实际正样本数量和所述实际负样本数量。
根据权利要求2所述的评估指标获取方法，其特征在于，所述输出数据包括：每个样本原始的样本属性以及每个样本被所述分类模型预测成正样本的预测概率；其中，样本属性包括正样本属性和负样本属性。
根据权利要求3所述的评估指标获取方法，其特征在于，所述基于直方图算法对所述输出数据进行概率区间划分，统计每个概率区间内所述实际正样本数量和所述实际负样本数量，包括：

扫描所述输出数据；

根据每个样本被预测成正样本的预测概率和所述输出数据中每个样本原始的样本属性生成正样本对应的第一直方图和负样本对应的第二直方图；其中，所述第一直方图的横轴是预测概率，所述第一直方图的纵轴是实际正样本数量；所述第二直方图的横轴是预测概率，所述第二直方图的纵轴是实际负样本数量；

调整横轴步长使所述第一直方图和所述第二直方图的概率区间一致，以获取所述概率统计结果中的所述概率区间；

统计所述第一直方图中每个概率区间内所述实际正样本的数量；

统计所述第二直方图中每个概率区间内所述实际负样本的数量。
根据权利要求4所述的评估指标获取方法，其特征在于，所述根据阈值集和所述概率统计结果计算所述分类模型的评估指标，包括：

将每个概率区间的端点值作为阈值点构成所述阈值集；

按照由大到小的顺序获取所述阈值集中每个阈值点对应的混淆矩阵，其中，所述混淆矩阵包括实际为正样本被预测为正样本的数量TP、实际为正样本被预测为负样本的数量FP、实际为负样本被预测为负样本的数量TN、实际为负样本被预测为正样本的数量FN；

将每个阈值点对应的混淆矩阵作为评估指标。
根据权利要求4所述的评估指标获取方法，其特征在于，所述根据阈值集和所述概率统计结果计算所述分类模型的评估指标，包括：

接收用户输入的根据概率区间的端点值构成的所述阈值集；

按照由大到小的顺序获取所述阈值集中每个阈值点对应的混淆矩阵，其中，所述混淆矩阵包括：TP、FP、TN和FN；

将每个阈值点对应的混淆矩阵作为所述评估指标。
根据权利要求5或6所述的评估指标获取方法，其特征在于，所述按照由大到小的顺序获取所述阈值集中每个阈值点对应的混淆矩阵，包括：

对于所述第一直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内实际正样本数量进行累积得到所述TP，以及对小于阈值点的所有概率区间内实际正样本数量进行累积得到所述FN；

对于所述第二直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内负样本数量进行累积得到所述FP，以及对小于阈值点的所有概率区间内负样本数量进行累积得到所述TN。
根据权利要求7所述的评估指标获取方法，其特征在于，所述按照由大到小的顺序获取所述阈值集中每个阈值点对应的混淆矩阵之后，还包括：

针对每个阈值点，将所述FP与实际负样本总量的比值作为所述ROC的横坐标；

将所述TP与实际正样本总量的比值作为所述ROC的纵坐标；

利用所有阈值点对应的ROC坐标绘制所述分类模型的评估指标ROC曲线。
根据权利要求8所述的评估指标获取方法，其特征在于，所述利用所有阈值点对应的ROC坐标绘制所述分类模型的评估指标ROC曲线之后，还包括：

获取每个由相邻阈值点对应的ROC坐标与所述ROC曲线构成的曲边梯形的面积；

将所有曲边梯形的面积相加得到所述ROC曲线对应的AUC值。
根据权利要求7所述的评估指标获取方法，其特征在于，所述按照由大到小的顺序获取所述阈值集中每个阈值点对应的混淆矩阵之后，还包括：

针对每个阈值点，将所述TP和所述FP的和值与样本总量的比值作为Lift图的横坐标；

将所述TP作为Lift图的纵坐标；

利用所有阈值点对应的Lift坐标绘制所述分类模型的评估指标Lift图。
一种评估指标获取装置，其特征在于，包括：

分类训练模块，用于将样本输入分类模型进行分类训练，获取分类模型的输出数据；

概率统计模块，用于对所述输出数据进行概率分布统计获取概率统计结果；其中，所述概率统计结果包括概率区间以及每个概率区间内实际正样本数量和实际负样本数量；

计算模块，用于根据阈值集和所述概率统计结果计算所述分类模型的评估指标。
根据权利要求11所述的评估指标获取装置，其特征在于，所述概率统计模块，具体用于基于直方图算法对所述输出数据进行概率区间划分，统计每个概率区间内所述实际正样本数量和所述实际负样本数量。
根据权利要求12所述的评估指标获取装置，其特征在于，所述输出数据包括：每个样本原始的样本属性以及每个样本被所述分类模型预测成正样本的预测概率；其中，样本属性包括正样本属性和负样本属性。
根据权利要求13所述的评估指标获取装置，其特征在于，所述概率统计模块，包括：

扫描单元，用于扫描所述输出数据；

直方图生成单元，用于根据每个样本被预测成正样本的预测概率和所述输出数据中每个样本原始的样本属性生成正样本对应的第一直方图和负样本对应的第二直方图；其中，所述第一直方图的横轴是预测概率，所述第一直方图的纵轴是实际正样本数量；所述第二直方图的横轴是预测概率，所述第二直方图的纵轴是实际负样本数量；

步长调整单元，用于调整横轴步长使所述第一直方图和所述第二直方图的概率区间一致，以获取所述概率统计结果中的所述概率区间；

统计单元，用于统计所述第一直方图中每个概率区间内所述实际正样本的数量，以及统计所述第二直方图中每个概率区间内所述实际负样本的数量。
根据权利要求14所述的评估指标获取装置，其特征在于，所述计算模块，包括：

阈值集获取单元，用于将每个概率区间的端点值作为阈值点生成所述阈值集；

混淆矩阵生成单元，用于按照由大到小的顺序获取所述阈值集中每个阈值点对应的混淆矩阵，其中，所述混淆矩阵包括实际为正样本被预测为正样本的数量TP、实际为正样本被预测为负样本的数量FP、实际为负样本被预测为负样本的数量TN、实际为负样本被预测为正样本的数量FN；

评估指标生成单元，用于将每个阈值点对应的混淆矩阵作为所述评估指标。
根据权利要求15所述的评估指标获取装置，其特征在于，所述阈值集获取单元，还用于接收用户输入的根据概率区间的端点值构成所述阈值集。
根据权利要求16所述的评估指标获取装置，其特征在于，所述混淆矩阵生成单元，具体用于对于所述第一直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内实际正样本数量进行累积得到所述TP，以及对小于阈值点的所有概率区间内实际正样本数量进行累积得到所述FN，以及对于所述第二直方图，按照阈值点的大小顺序逐次对大于阈值点的所有概率区间内负样本数量进行累积得到所述FP，以及对小于阈值点的所有概率区间内负样本数量进行累积得到所述TN。
根据权利要求17所述的评估指标获取装置，其特征在于，所述评估指标生成单元，具体用于针对每个阈值点，将所述FP与实际负样本总量的比值作为所述ROC的横坐标，以及将所述TP与实际正样本总量的比值作为所述ROC的纵坐标，以及利用所有阈值点对应的ROC坐标绘制所述分类模型的评估指标ROC曲线。
根据权利要求18所述的评估指标获取装置，其特征在于，所述评估指标生成单元，还具体用于获取每个由相邻阈值点对应的ROC坐标与所述ROC曲线构成的曲边梯形的面积，将所有曲边梯形的面积相加得到所述ROC曲线的AUC值。
根据权利要求19所述的评估指标获取装置，其特征在于，所述评估指标生成单元，具体用于针对每个阈值点，将所述TP和所述FP的和值与样本总量的比值作为Lift图的横坐标，以及将所述TP作为Lift图的纵坐标以及利用所有阈值点对应的Lift坐标绘制所述分类模型的评估指标Lift图。
根据权利要求20所述的评估指标获取装置，其特征在于，所述分类训练模块和所述概率统计模块设置于服务器端，所述计算模块设置于本地终端。
根据权利要求21所述的评估指标获取装置，其特征在于，还包括：可视化模块，用于接收用户的显示指令，根据显示指令将所述分类模型的评估指标进行可视化展示；

其中，所述可视化模块设置于所述本地终端。