WO2020253740A1

WO2020253740A1 - 用于样本审核的人工客户端的状态检查方法及装置

Info

Publication number: WO2020253740A1
Application number: PCT/CN2020/096645
Authority: WO
Inventors: 徐青松; 李青
Original assignee: 杭州睿琪软件有限公司
Priority date: 2019-06-20
Filing date: 2020-06-17
Publication date: 2020-12-24
Also published as: CN110245087A; CN110245087B

Abstract

一种用于样本审核的人工客户端的状态检查方法及装置，方法包括：获取一测试样本集，利用预先训练好的一识别模型对测试样本集中各个样本进行识别，标注出各个样本的识别结果(S101)；选取测试样本集中预设数量个样本作为目标样本集，并将目标样本集中每一样本所标注的识别结果修改为错误识别结果(S102)；将处理后的测试样本集发送给人工客户端，以便人工客户端对各个样本的识别结果进行审核(S103)；根据人工客户端对目标样本集的审核结果，检查人工客户端是否处于异常状态(S104)。

Description

用于样本审核的人工客户端的状态检查方法及装置

技术领域

本发明涉及人工智能技术领域，尤其涉及一种用于样本审核的人工客户端的状态检查方法、装置、电子设备和计算机可读存储介质。

背景技术

在人工智能领域，在进行模型训练之前，通常使用人工客户端来对样本的标注结果进行审核，如果在进行样本审核时人工客户端处于异常状态，则无法保证样本的标注情况达标，从而导致训练得到的模型的识别准确率不达标。因此，为了使训练得到的模型的准确率达标，要求人工客户端在进行样本审核时处于正常状态，这就需要对人工客户端的状态进行检查。

目前，可以通过检查人工客户端所审核的全部样本的标注结果，根据审核结果判断人工客户端是否存在异常，然而通常样本集中样本的数量非常大，这样就需要花费较多时间才能判断人工客户端是否异常。

发明内容

本发明的目的在于提供一种用于样本审核的人工客户端的状态检查方法、装置、电子设备和计算机可读存储介质，以快速判断人工客户端是否处于异常状态。具体技术方案如下：

第一方面，本发明提供一种用于样本审核的人工客户端的状态检查方法，所述方法包括：

获取一测试样本集，利用预先训练好的一识别模型对所述测试样本集中各个样本进行识别，标注出各个样本的识别结果；

选取所述测试样本集中预设数量个样本形成目标样本集，并将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，形成处理后的所述测试样本集；

将处理后的所述测试样本集发送给人工客户端，以便所述人工客户端对处理后的所述测试样本集中的各个样本的识别结果进行审核；

根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，判定所述人工客户端是否处于异常状态。

可选的，所述人工客户端对处理后的所述测试样本集中的各个样本的识别结果进行审核，包括：

针对处理后的所述测试样本集中每一样本，所述人工客户端判断所标注的识别结果是否正确；如果否，则对该样本所标注的识别结果进行修改。

可选的，根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，判定所述人工客户端是否处于异常状态，包括：

针对所述目标样本集中的每一样本，判断所述人工客户端是否对该样本的错误识别结果进行了修改；

获取在所述目标样本集中被所述人工客户端修改了识别结果的样本的比例，作为第一比例；

若所述第一比例小于预设阈值，则判定所述人工客户端处于异常状态。

可选的，所述方法还包括：

根据所述第一比例确定所述人工客户端的标注准确率。

可选的，根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，检查所述人工客户端是否处于异常状态，包括：

针对所述目标样本集中的每一样本，判断所述人工客户端是否将该样本的错误识别结果修改为正确识别结果；

获取在所述目标样本集中被所述人工客户端修改为正确识别结果的样本的比例，作为第二比例；

若所述第二比例小于预设阈值，则判定所述人工客户端处于异常状态。

可选的，所述方法还包括：

根据所述第二比例确定所述人工客户端的标注准确率。

可选的，所述预设阈值的最小值X按照以下公式确定：1-(1-X) ²＝Q；

其中，Q表示预先设置的经所述识别模型标注和所述人工客户端审核后所述测试样本集中样本标注的目标准确率。

可选的，所述预设数量大于等于最小样本抽取数量N；

其中，N＝Z ²×(P×(1-P))/E ²；Z表示与置信度相关的统计量，置信度等于所述识别模型的识别准确率；E表示预设的抽样误差值；P表示所述识别模型的识别准确率。

可选的，将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，包括：

将所述目标样本集中每一样本所标注的识别结果修改为与原始识别结果不同的识别结果。

第二方面，本发明还提供一种用于样本审核的人工客户端的状态检查装置，所述装置包括：

标注模块，用于获取一测试样本集，利用预先训练好的一识别模型对所述测试样本集中各个样本进行识别，标注出各个样本的识别结果；

修改模块，用于选取所述测试样本集中预设数量个样本形成目标样本集，并将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，形成处理后的所述测试样本集；

审核模块，用于将处理后的所述测试样本集发送给人工客户端，以便所述人工客户端对处理后的所述测试样本集中的各个样本的识别结果进行审核；

检查模块，用于根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，判定所述人工客户端是否处于异常状态。

可选的，所述检查模块，用于：

针对所述目标样本集中的每一样本，判断所述人工客户端是否对该样本的错误识别结果进行了修改；获取在所述目标样本集中被所述人工客户端修改了识别结果的样本的比例，作为第一比例；若所述第一比例小于预设阈值，则判定所述人工客户端处于异常状态。

可选的，所述装置还包括：

第一确定模块，用于根据所述第一比例确定所述人工客户端的标注准确率。

可选的，所述检查模块，用于：

针对所述目标样本集中的每一样本，判断所述人工客户端是否将该样本的错误识别结果修改为正确识别结果；获取在所述目标样本集中被所述人工客户端修改为正确识别结果的样本的比例，作为第二比例；若所述第二比例小于预设阈值，则判定所述人工客户端处于异常状态。

可选的，所述装置还包括：

第二确定模块，用于根据所述第二比例确定所述人工客户端的标注准确率。

可选的，所述预设数量大于等于最小样本抽取数量N；

可选的，所述修改模块将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，包括：

第三方面，本发明还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的所述计算机程序时，实现上述第一方面所述的用于样本审核的人工客户端的状态检查方法。

第四方面，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面述所述的用于样本审核的人工客户端的状态检查方法。

与现有技术相比，本发明采用识别模型对测试样本集中的样本进行识别，标注出识别结果，并将测试样本集中一部分样本的识别结果故意修改为错误识别结果，将处理后的测试样本集发给人工客户端进行审核，这样只需要检查人工客户端对故意标错的那一部分样本的审核结果即可推断人工客户端对整个测试样本集的标注准确率，进而判断人工客户端是否处于异常状态，而不需要统计人工客户端对整个测试样本集的审核情况来确定标注准确率，从而实现了快速确定人工客户端是否处于异常状态，并且缩短了统计时间，降低了费用成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的用于样本审核的人工客户端的状态检查方法的流程示意图；

图2是本发明一实施例提供的用于样本审核的人工客户端的状态检查装置的结构示意图；

图3是本发明一实施例提供的电子设备的结构示意图。

具体实施方式

以下结合附图和具体实施例对本发明提出的一种用于样本审核的人工客户端的状态检查方法、装置、电子设备及计算机可读存储介质作进一步详细说明。根据权利要求书和下面说明，本发明的优点和特征将更清楚。需说明的是，附图均采用非常简化的形式且均使用非精准的比例，仅用以方便、明晰地辅助说明本发明实施例的目的。

为解决现有技术的问题，本发明实施例提供了一种用于样本审核的人工客户端的状态检查方法、装置、电子设备及计算机可读存储介质。

需要说明的是，本发明实施例的用于样本审核的人工客户端的状态检查方法可应用于本发明实施例的用于样本审核的人工客户端的状态检查装置，该用于样本审核的人工客户端的状态检查装置可被配置于电子设备上。其中，该电子设备可以是个人计算机、移动终端等，该移动终端可以是手机、平板电脑等具有各种操作系统的硬件设备。

图1是本发明一实施例提供的一种用于样本审核的人工客户端的状态检查方法的流程示意图。请参考图1，一种用于样本审核的人工客户端的状态检查方法可以包括如下步骤：

步骤S101，获取一测试样本集，利用预先训练好的一识别模型对所述测试样本集中各个样本进行识别，标注出各个样本的识别结果。

在本实施例中，所述识别模型可以是通过样本训练建立的神经网络模型，其可以是通过任一类型的样本训练得到的识别模型，本实施例对训练用的样本类型不做限定。例如样本可以是票据图片，训练后可以建立票据识别模型，也可以是车辆图片、人脸图片、植物图片、试卷图片等，不同的样本类型通过样本训练分别可以建立不同的识别模型。当所述识别模型训练好后，所述识别模型的识别准确率也就确定了。通过样本训练建立所述识别模型的过程以及确定所述识别模型的识别准确率的方式可以参见现有技术，在此不做赘述。

所述测试样本集中的样本类型需与所述识别模型训练时的样本类型相同，例如，所述识别模型是通过票据图片样本训练得到的，那么所获取的测试样本集中样本即为票据图片。

本实施例对测试样本集中的样本数量不做限定，但是为了使判断人工客户端是否异常的判断结果更加准确，样本数量通常应设置为较大的数值，例如样本数量为100、1000等。将测试样本集中的各个样本均通过所述识别模型进行识别，并将所述识别模型的识别结果进行标注。识别结果可以标注在样本图片上，也可以标注作为样本图片的属性信息。

步骤S102，选取所述测试样本集中预设数量个样本作为目标样本集，并将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果。

将样本所标注的识别结果修改为错误识别结果，即修改为与所标注的原始识别结果不一致或不同的识别结果。举例而言，若所述识别模型是基于人脸图像样本训练得到的，用于识别人脸图像中的人脸是男性还是女性，所述识别模型对所述测试样本集中某一人脸图像样本的识别结果为女性，则该人脸图像样本所标注的识别结果即为女性，那么将该人脸图像样本所标注的识别结果修改为错误识别结果，例如修改为男性。又如，若所述识别模型是基于植物图像样本训练得到的，用于识别植物像中的植物的类别，所述识别模型对所述测试样本集中某一植物图像样本的识别结果为桃花，则该植物图像样本所标注的识别结果即为桃花，那么将该植物图像样本所标注的识别结果修改为不一致或不同的识别结果，例如修改为梨花。

本实施例中，可以从所述测试样本集中随机地抽取预设数量个样本作为目标样本集，将目标样本集所标注的识别结果修改为错误的识别结果。由于本发明的核心思想是通过统计人工客户端对所抽取的预设数量个目标样本集的错误识别结果的审核情况，来推断人工客户端对整个测试样本集中样本的审核情况，进而判断人工客户端是否处于异常状态，因此，为了保证后续统计的准确性，对所抽取的目标样本集的数量可以有如下要求：

所述预设数量大于等于抽样统计的最小样本抽取数量N；

Z与置信度的对应关系如下：当置信度为90％时，Z＝1.64；置信度为95％时，Z＝1.96；置信度为95.45％时，Z＝2；置信度为99％时，Z＝2.68；置信度为99.73时，Z＝3；以上数据可以通过查询统计表得出。本实施例的置信区间为90％～99.99％，也就是说认为所述识别模型的识别准确率应该在90％～99.99％的几率落入到P的范围内，本实施例可以采用95％的置信度。

本实施例中，抽样误差值E可以设定在±5％之间，P为概率值，可以设定其为90％，即经所述识别模型标注后所述测试样本集中样本标注的准确率需要达到90％。

如果通过上述计算公式计算得到最小样本抽取数量N等于100，则所述预设数量可以设定大于等于100的任意数值。也可以从所述测试样本集中抽取一定比例的样本作为目标样本集，只要保证所抽取的目标样本集的数量大于等于最小样本抽取数量N即可。

步骤S103，将处理后的所述测试样本集发送给人工客户端，以便所述人工客户端对各个样本的识别结果进行审核。

所述人工客户端会对所述识别模型的识别结果进行审核处理，审核处理包括：针对处理后的测试样本集中每一样本，判断所标注的识别结果是否正确；如果判定不正确，还可以对该样本所标注的识别结果进行修改。需要说明的是，由于处理后的测试样本集中包含两类样本，即标注有所述识别模型的识别结果的样本，和被抽取并故意标注错误识别结果的样本，人工客户端在审核时，不会对这两类样本进行区分，而是将被抽取并故意标注错误识别结果的目标样本集同样视为标注有所述识别模型的识别结果的样本。

举例而言，仍以上述步骤S102中的举例为例，若某一样本所标注的识别结果为女性，而人工客户端在审核后判定该样本所标注的识别结果有误，且经过自身的识别后判定该样本的识别结果应该为男性，则可以对该样本所标注的识别结果修改为自身所判定的识别结果。

实际上，对于被抽取并故意标注错误的某一目标样本集，人工客户端可能没有识别出该样本被标注错误，从而导致人工客户端将该样本的识别结果判定为正确。人工客户端对故意标错的目标样本集的审核情况反应了人工客户端对整个测试样本集中样本的识别(标注)情况，进而通过检查人工客户端对这类样本的审核情况可以来推断人工客户端的标注准确率或审核准确率，并且判断人工客户端是否存在异常。

步骤S104，根据所述人工客户端对所述目标样本集的审核结果，检查所述人工客户端是否处于异常状态。

在一种实现方式中，所述根据所述人工客户端对所述目标样本集的审核结果，检查所述人工客户端是否处于异常状态，包括：

可以理解的是，通常来说，如果人工客户端能够对故意标注错误的样本的错误识别结果进行修改，则可以认为人工客户端能够将该故意标注错误的样本进行正确的标注。若目标样本集中被人工客户端修改了识别结果的样本的比例大于等于预设阈值，可以认为人工客户端没有出现异常，反之，若目标样本集中被人工客户端修改了识别结果的样本的比例小于预设阈值，则表示人工客户端出现了异常。进一步的，还可以通过目标样本集中被人工客户端修改了识别结果的样本的比例，来推断人工客户端对整个测试样本集的标注准确率，例如将第一比例作为人工客户端的标注准确率。

具体而言，确定所述目标样本集中被所述人工客户端修改了识别结果的样本的比例，可以有如下两种方式：

方式一：对于经人工客户端审核后的所述测试样本集，首先获取被抽取并故意标注错误识别结果的目标样本集，然后判断人工客户端对所标注的识别结果进行了修改的样本的数量，进而获取所述目标样本集中被所述人工客户端修改了识别结果的样本的比例；

方式二：对于经人工客户端审核后的所述测试样本集，首先可以判断人工客户端对哪些样本所标注的识别结果进行了修改，然后统计出这些样本中哪些是属于被抽取并标注错误识别结果的目标样本集，进而获取目标样本集中被所述人工客户端修改了识别结果的样本的比例。

在另一种实现方式中，所述根据所述人工客户端对所述目标样本集的审核结果，检查所述人工客户端是否处于异常状态，包括：

在这一实现方式中，若目标样本集中被人工客户端修改为正确识别结果的样本的比例大于等于预设阈值，可以认为人工客户端没有出现异常，反之，若目标样本集中被人工客户端修改为正确识别结果的样本的比例小于预设阈值，则表示人工客户端出现了异常。进一步的，还可以通过目标样本集中被人工客户端修改为正确识别结果的样本的比例，来推断人工客户端对整个测试样本集的标注准确率，例如将第二比例作为人工客户端的标注准确率。

根据目标样本集中被人工客户端修改为正确识别结果的样本的比例，用来判断人工客户端是否存在异常，以及用来表征人工客户端的标注准确率，相比于上一种实现方式更加准确。

类似的，确定所述目标样本集中被所述人工客户端修改为正确识别结果的样本的比例，可以有如下两种方式：

方式一：对于经人工客户端审核后的所述测试样本集，首先获取被抽取并故意标注错误识别结果的目标样本集，然后判断人工客户端将所标注的识别结果修改为正确识别结果的样本的数量，进而获取所述目标样本集中被所述人工客户端修改为正确识别结果的样本的比例；

方式二：对于经人工客户端审核后的所述测试样本集，首先可以判断人工客户端将哪些样本所标注的识别结果修改为正确识别结果，然后统计出这些样本中哪些是属于被抽取并标注错误识别结果的目标样本集，进而获取目标样本集中被所述人工客户端修改为正确识别结果的样本的比例。

当判断出第一比例小于预设阈值，或第二比例小于预设阈值时，可以判定人工客户端处于异常状态，同时也表示人工客户端的标注准确率达不到期望值，因此可以对人工客户端进行修正，以使其标注准确率符合要求。

其中，所述预设阈值的最小值X可以按照以下公式确定：1-(1-X) ²＝Q；Q表示预先设置的经所述识别模型标注和所述人工客户端审核后所述测试样本集中样本标注的目标准确率。所述预设阈值可以设置为任意的等于大于X的数值，本实施例对此不做限定。

当Q＝99％时，通过上述公式计算出X＝90％，即人工客户端的标注准确率需要达到90％以上。本实施例中，如果希望经所述识别模型标注和所述人工客户端审核后所述测试样本集中样本标注的准确率达到99％以上，则人工客户端在故意标错的错误样本中的标注准确率需要达到90％以上。

综上所述，与现有技术相比，本实施例中采用识别模型对测试样本集中的样本进行识别，标注出识别结果，并将测试样本集中一部分样本的识别结果故意修改为错误识别结果，将处理后的测试样本集发给人工客户端进行审核，这样只需要检查人工客户端对故意标错的那一部分样本的审核结果即可推断人工客户端对整个测试样本集的标注准确率，进而判断人工客户端是否处于异常状态，而不需要统计人工客户端对整个测试样本集的审核情况来确定标注准确率，从而实现了快速确定人工客户端是否处于异常状态，并且缩短了统计时间，降低了费用成本。

相应于上述用于样本审核的人工客户端的状态检查方法实施例，本发明一实施例还提供了一种用于样本审核的人工客户端的状态检查装置，图2是本发明一实施例提供的一种用于样本审核的人工客户端的状态检查装置的结构示意图。请参考图2，一种用于样本审核的人工客户端的状态检查装置可以包括：

标注模块201，用于获取一测试样本集，利用预先训练好的一识别模型对所述测试样本集中各个样本进行识别，标注出各个样本的识别结果；

修改模块202，用于选取所述测试样本集中预设数量个样本作为目标样本集，并将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果；

审核模块203，用于将处理后的所述测试样本集发送给人工客户端，以便所述人工客户端对各个样本的识别结果进行审核；

检查模块204，用于根据所述人工客户端对所述目标样本集的审核结果，检查所述人工客户端是否处于异常状态。

可选的，所述审核模块203中人工客户端对各个样本的识别结果进行审核，包括：

可选的，所述检查模块204，具体用于：

可选的，所述装置还包括：

可选的，所述检查模块204，具体用于：

可选的，所述装置还包括：

可选的，所述预设数量大于等于最小样本抽取数量N；

可选的，所述修改模块202将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，包括：

与现有技术相比，本实施例采用识别模型对测试样本集中的样本进行识别，标注出识别结果，并将测试样本集中一部分样本的识别结果故意修改为错误识别结果，将处理后的测试样本集发给人工客户端进行审核，这样只需要检查人工客户端对故意标错的那一部分样本的审核结果即可推断人工客户端对整个测试样本集的标注准确率，进而判断人工客户端是否处于异常状态，而不需要统计人工客户端对整个测试样本集的审核情况来确定标注准确率，从而实现了快速确定人工客户端是否处于异常状态，并且缩短了统计时间，降低了费用成本。

本发明一实施例还提供了一种电子设备，图3是本发明一实施例提供的一种电子设备的结构示意图。请参考图3，一种电子设备包括处理器301、通信接口302、存储器303和通信总线304，其中，处理器301，通信接口302，存储器303通过通信总线304完成相互间的通信，

存储器303，用于存放计算机程序；

处理器301，用于执行存储器303上所存放的程序时，实现如下步骤：

选取所述测试样本集中预设数量个样本作为目标样本集，并将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果；

将处理后的所述测试样本集发送给人工客户端，以便所述人工客户端对各个样本的识别结果进行审核；

根据所述人工客户端对所述目标样本集的审核结果，检查所述人工客户端是否处于异常状态。

应用本实施例提供的方案，只需要检查人工客户端对故意标错的那一部分样本的审核结果即可推断人工客户端对整个测试样本集的标注准确率，进而判断人工客户端是否处于异常状态，而不需要统计人工客户端对整个测试样本集的审核情况来确定标注准确率，从而实现了快速确定人工客户端是否处于异常状态，并且缩短了统计时间，降低了费用成本。

关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图1所示的方法实施例，在此不做赘述。

另外，处理器301执行存储器303上所存放的程序而实现的人工客户端的标注准确率的确定方法的其他实现方式，与前述方法实施例部分所提及的实现方式相同，这里也不再赘述。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明一实施例还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，该计算机程序被处理器执行时实现上述的用于样本审核的人工客户端的状态检查方法的方法步骤。

需要说明的是，本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

上述描述仅是对本发明较佳实施例的描述，并非对本发明范围的任何限定，本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰，均属于权利要求书的保护范围。

Claims

一种用于样本审核的人工客户端的状态检查方法，其特征在于，所述方法包括：

获取一测试样本集，利用预先训练好的一识别模型对所述测试样本集中各个样本进行识别，标注出各个样本的识别结果；

选取所述测试样本集中预设数量个样本形成目标样本集，并将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，形成处理后的所述测试样本集；

将处理后的所述测试样本集发送给人工客户端，以便所述人工客户端对处理后的所述测试样本集中的各个样本的识别结果进行审核；

根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，判定所述人工客户端是否处于异常状态。
如权利要求1所述的用于样本审核的人工客户端的状态检查方法，其特征在于，所述人工客户端对处理后的所述测试样本集中的各个样本的识别结果进行审核，包括：

针对处理后的所述测试样本集中每一样本，所述人工客户端判断所标注的识别结果是否正确；如果否，则对该样本所标注的识别结果进行修改。
如权利要求2所述的用于样本审核的人工客户端的状态检查方法，其特征在于，根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，判定所述人工客户端是否处于异常状态，包括：

针对所述目标样本集中的每一样本，判断所述人工客户端是否对该样本的错误识别结果进行了修改；

获取在所述目标样本集中被所述人工客户端修改了识别结果的样本的比例，作为第一比例；

若所述第一比例小于预设阈值，则判定所述人工客户端处于异常状态。
如权利要求3所述的用于样本审核的人工客户端的状态检查方法，其特征在于，所述方法还包括：

根据所述第一比例确定所述人工客户端的标注准确率。
如权利要求2所述的用于样本审核的人工客户端的状态检查方法，其特征在于，根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，检查所述人工客户端是否处于异常状态，包括：

针对所述目标样本集中的每一样本，判断所述人工客户端是否将该样本的错误识别结果修改为正确识别结果；

获取在所述目标样本集中被所述人工客户端修改为正确识别结果的样本的比例，作为第二比例；

若所述第二比例小于预设阈值，则判定所述人工客户端处于异常状态。
如权利要求5所述的用于样本审核的人工客户端的状态检查方法，其特征在于，所述方法还包括：

根据所述第二比例确定所述人工客户端的标注准确率。
如权利要求3或5所述的用于样本审核的人工客户端的状态检查方法，其特征在于，所述预设阈值的最小值X按照以下公式确定：1-(1-X) ²＝Q；

其中，Q表示预先设置的经所述识别模型标注和所述人工客户端审核后所述测试样本集中样本标注的目标准确率。
如权利要求1所述的用于样本审核的人工客户端的状态检查方法，其特征在于，所述预设数量大于等于最小样本抽取数量N；

其中，N＝Z ²×(P×(1-P))/E ²；Z表示与置信度相关的统计量，置信度等于所述识别模型的识别准确率；E表示预设的抽样误差值；P表示所述识别模型的识别准确率。
如权利要求1所述的用于样本审核的人工客户端的状态检查方法，其特征在于，将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，包括：

将所述目标样本集中每一样本所标注的识别结果修改为与原始识别结果不同的识别结果。
一种用于样本审核的人工客户端的状态检查装置，其特征在于，所述装置包括：

标注模块，用于获取一测试样本集，利用预先训练好的一识别模型对所述测试样本集中各个样本进行识别，标注出各个样本的识别结果；

修改模块，用于选取所述测试样本集中预设数量个样本形成目标样本集，并将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，形成处理后的所述测试样本集；

审核模块，用于将处理后的所述测试样本集发送给人工客户端，以便所述人工客户端对处理后的所述测试样本集中的各个样本的识别结果进行审核；

检查模块，用于根据所述人工客户端对处理后的所述测试样本集中的所述目标样本集的审核结果，判定所述人工客户端是否处于异常状态。
如权利要求10所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述人工客户端对处理后的所述测试样本集中的各个样本的识别结果进行审核，包括：

针对处理后的所述测试样本集中每一样本，所述人工客户端判断所标注的识别结果是否正确；如果否，则对该样本所标注的识别结果进行修改。
如权利要求11所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述检查模块，用于：

针对所述目标样本集中的每一样本，判断所述人工客户端是否对该样本的错误识别结果进行了修改；获取在所述目标样本集中被所述人工客户端修改了识别结果的样本的比例，作为第一比例；若所述第一比例小于预设阈值，则判定所述人工客户端处于异常状态。
如权利要求12所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述装置还包括：

第一确定模块，用于根据所述第一比例确定所述人工客户端的标注准确率。
如权利要求11所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述检查模块，用于：

针对所述目标样本集中的每一样本，判断所述人工客户端是否将该样本的错误识别结果修改为正确识别结果；获取在所述目标样本集中被所述人工客户端修改为正确识别结果的样本的比例，作为第二比例；若所述第二比例小于预设阈值，则判定所述人工客户端处于异常状态。
如权利要求14所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述装置还包括：

第二确定模块，用于根据所述第二比例确定所述人工客户端的标注准确率。
如权利要求12或15所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述预设阈值的最小值X按照以下公式确定：1-(1-X) ²＝Q；

其中，Q表示预先设置的经所述识别模型标注和所述人工客户端审核后所述测试样本集中样本标注的目标准确率。
如权利要求10所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述预设数量大于等于最小样本抽取数量N；

其中，N＝Z ²×(P×(1-P))/E ²；Z表示与置信度相关的统计量，置信度等于所述识别模型的识别准确率；E表示预设的抽样误差值；P表示预先设置的经所述识别模型标注和所述人工客户端审核后所述测试样本集中样本标注的目标准确率。
如权利要求10所述的用于样本审核的人工客户端的状态检查装置，其特征在于，所述修改模块将所述目标样本集中每一样本所标注的识别结果修改为错误识别结果，包括：

将所述目标样本集中每一样本所标注的识别结果修改为与原始识别结果不同的识别结果。
一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的所述计算机程序时，实现权利要求1-9中任一所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-9中任一项所述的方法。