CN112435035A

CN112435035A - 数据的审核方法、装置及设备

Info

Publication number: CN112435035A
Application number: CN201910735852.8A
Authority: CN
Inventors: 樊珈珮
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-08-09
Filing date: 2019-08-09
Publication date: 2021-03-02

Abstract

本发明实施例提供一种数据的审核方法、装置及设备，方法包括：在预设的多个选择函数中确定至少一个目标选择函数，选择函数用于选择待标注的样本数据；根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据；确定与目标样本数据相对应的标注样本数据；利用标注样本数据对预设的审核模型进行优化训练，并利用优化训练后的审核模型对待处理数据进行审核。本实施例提供的数据的审核方法，实现了在不同的应用场景下可以确定不同的目标选择函数，并利用目标选择函数所确定的标注样本数据可以对审核模型进行优化训练，从而保证了在不同的应用场景下审核模型的审核精确度，提高了审核模型对数据进行审核的质量和效率。

Description

数据的审核方法、装置及设备

技术领域

本发明涉及通信技术领域，尤其涉及一种数据的审核方法、装置及设备。

背景技术

随着多媒体信息的不断发展，电商平台发展的越来越迅速，电商平台可以实现商品的交易。为了提高交易率，电商平台上的卖家们都会编辑和发布有关商品的图片和/或文字信息，而为了保证电商平台运营的安全性，并且保障卖家在平台上销售的商品都是符合国家及平台的相关规定，电商平台会人工地对卖家发布的商品的标题及内容进行审核，判断其是否违规。

现有技术中，在利用审核模型对数据进行审核时，为了保证审核模型的审核准确度，需要对审核模型进行优化训练；具体的，先获取待标注的样本数据，而后利用样本数据对审核模型进行优化训练。然而，在获取待标注的样本数据时，不同的应用场景所选择的待标注的样本数据往往是相同的，这样会影响在不同应用场景下的审核模型的审核精确度。

发明内容

本发明实施例提供了一种数据的审核方法、装置及设备，可以适用于不同的应用场景，保证审核模型的审核精确度。

第一方面，本发明实施例提供一种数据的审核方法，包括：

在预设的多个选择函数中确定至少一个目标选择函数，所述选择函数用于选择待标注的样本数据；

根据所述目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据；

确定与所述目标样本数据相对应的标注样本数据；

利用所述标注样本数据对预设的审核模型进行优化训练，并利用优化训练后的审核模型对待处理数据进行审核。

第二方面，本发明实施例提供一种数据的审核装置，包括：

第一选择模块，用于在预设的多个选择函数中确定至少一个目标选择函数，所述选择函数用于选择待标注的样本数据；

第一确定模块，用于根据所述目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据；

所述第一确定模块，还用于确定与所述目标样本数据相对应的标注样本数据；

审核模块，用于利用所述标注样本数据对预设的审核模型进行优化训练，并利用优化训练后的审核模型对待处理数据进行审核。

第三方面，本发明实施例提供一种电子设备，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的数据的审核方法。

第四方面，本发明实施例提供了一种计算机存储介质，用于储存计算机程序，所述计算机程序使计算机执行时实现上述第一方面中的数据的审核方法。

通过在预设的多个选择函数中确定至少一个目标选择函数，根据所述目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据，而后确定与所述目标样本数据相对应的标注样本数据，再利用所述标注样本数据对预设的审核模型进行优化训练，从而实现了可以基于不同的应用场景确定不同的目标选择函数，利用目标选择函数所确定的标注样本数据可以对审核模型进行优化训练，保证了在不同的应用场景下的审核模型的审核精确度；在利用审核模型对待处理数据进行审核时，有效地保证了审核模型对数据进行审核的质量和效率，并且在保证审核模型精度不降低的前提下，有效地降低了人工标注的成本，进而提高了该方法的实用性，有利于市场的推广与应用。

第五方面，本发明实施例提供了一种模型的训练方法，包括：

确定与所述目标样本数据相对应的标注样本数据；

利用所述标注样本数据对预设的审核模型进行优化训练。

第六方面，本发明实施例提供了一种模型的训练装置，包括：

第二选择模块，用于在预设的多个选择函数中确定至少一个目标选择函数，所述选择函数用于选择待标注的样本数据；

第二确定模块，用于根据所述目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据；

第二确定模块，还用于确定与所述目标样本数据相对应的标注样本数据；

训练模块，用于利用所述标注样本数据对预设的审核模型进行优化训练。

第七方面，本发明实施例提供了一种电子设备，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行时实现上述第五方面中的模型的训练方法。

第八方面，本发明实施例提供了一种计算机存储介质，用于储存计算机程序，所述计算机程序使计算机执行时实现上述第五方面中的模型的训练方法。

第九方面，本发明实施例提供了一种数据的处理方法，包括：

获取待处理数据，所述待处理数据中包括至少一个数据对象；

确定与所述数据对象相对应的神经网络，所述神经网络是通过样本数据训练得到的；

利用所述神经网络对所述数据对象进行分析处理，获取与所述数据对象相对应的对象信息。

第十方面，本发明实施例提供了一种数据的处理装置，包括：

获取模块，用于获取待处理数据，所述待处理数据中包括至少一个数据对象；

第三确定模块，用于确定与所述数据对象相对应的神经网络，所述神经网络是通过样本数据训练得到的；

处理模块，用于利用所述神经网络对所述数据对象进行分析处理，获取与所述数据对象相对应的对象信息。

第十一方面，本发明实施例提供了一种电子设备，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行时实现上述第九方面中的数据的处理方法。

第十二方面，本发明实施例提供了一种计算机存储介质，用于储存计算机程序，所述计算机程序使计算机执行时实现上述第九方面中的数据的处理方法。

通过获取待处理数据，确定与所述数据对象相对应的神经网络，所述神经网络是通过样本数据训练得到的，从而实现了可以基于不同的数据对象确定不同的神经网络，而后利用所述神经网络对所述数据对象进行分析处理，获取与所述数据对象相对应的对象信息，有效地保证了利用神经网络对数据进行处理的质量和效率，进而拓展了神经网络的适用范围，提高了该方法的实用性，有利于市场的推广与应用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a为本发明实施例提供的一种数据的审核方法的流程图；

图1b为本发明实施例提供的一种数据的审核方法的应用场景示意图；

图2为本发明实施例提供的在预设的多个选择函数中确定至少一个目标选择函数的流程图；

图3为本发明实施例提供的另一种数据的审核方法的流程图；

图4为本发明实施例提供的根据所述目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据的流程图；

图5为本发明实施例提供的根据所述目标选择函数确定与每个样本数据所对应的样本选择概率的流程图；

图6为本发明实施例提供的一种模型的训练方法的流程图；

图7为本发明实施例提供的一种数据的处理方法的流程图；

图8为本发明实施例提供的一种数据的处理方法的场景示意图；

图9为本发明应用实施例提供的一种数据的审核方法的流程图一；

图10为本发明应用实施例提供的一种数据的审核方法的流程图二；

图11为本发明实施例提供的一种数据的审核装置的结构示意图；

图12为与图11所示实施例提供的数据的审核装置对应的电子设备的结构示意图；

图13为本发明实施例提供的一种模型的训练装置的结构示意图；

图14为与图13所示实施例提供的模型的训练装置对应的电子设备的结构示意图；

图15为本发明实施例提供的一种数据的处理装置的结构示意图；

图16为与图15所示实施例提供的数据的处理装置对应的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义，“多种”一般包含至少两种，但是不排除包含至少一种的情况。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

取决于语境，如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的商品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

另外，下述各方法实施例中的步骤时序仅为一种举例，而非严格限定。

图1a为本发明实施例提供的一种数据的审核方法的流程图；图1b为本发明实施例提供的一种数据的审核方法的应用场景示意图；参考附图1a-1b所示，本实施例提供了一种数据的审核方法，该审核方法的执行主体是数据的审核装置，可以理解的是，该审核装置可以实现为软件、或者软件和硬件的组合。并且，该审核装置可以针对不同的业务场景，自适应的挑选出与业务场景相适配的选择函数，通过选择函数可以选择出最有价值的样本数据，而后，在保证审核模型精度不降低的前提下，利用最有价值的样本数据对审核模型进行优化。具体的，该数据的审核方法可以包括：

S101：在预设的多个选择函数中确定至少一个目标选择函数，选择函数用于选择待标注的样本数据。

本实施例中预设的多个选择函数用于在不同的应用场景下选择与应用场景相适配的待标注的样本数据；而上述多个选择函数可以包括以下至少一个函数：margin函数、uniform函数、bandit_discrete函数、kcenter_greedy贪心函数、hierarchical_clustering层次聚类函数。其中，margin函数可以从频率响应数据中计算出幅值裕度、相角裕度以及对应的频率；uniform(x,y)函数可以随机生成一个实数,它在[x,y]范围内；bandit_discrete函数是一种简单的在线学习算法,常常用于尝试解决exploit－explore选择问题和冷启动问题。

具体的，在根据应用场景选择目标选择函数时，目标选择函数的个数可以为一个或多个；具体的，参考附图2所示，在预设的多个选择函数中确定至少一个目标选择函数可以包括：

S1011：利用审核模型，获取与每个选择函数相对应的预估精确度。

S1012：将最大的预估精确度所对应的选择函数确定为目标选择函数。

具体的，预先设置有用于对数据进行审核的审核模型，针对每个选择函数，可以预先获取与选择函数相对应的样本数据，而后，利用与选择函数相对应的样本数据输入至审核模型中，从而可以获得与选择函数相对应的预估精确度；在获取到与每个选择函数相对应的预估精确度之后，可以将最大的预估精确度所对应的选择函数确定为目标选择函数，其中，目标选择函数的个数为一个或多个，这样可以有效地保证目标选择函数获取的准确可靠性，进一步提高了该方法使用的精确度。

可以理解的是，目标选择函数的具体确定方式并不限于上述实现方式，例如：预先设置有多个选择函数，每个选择函数对应有一选择概率，在不同的应用场景下，不同的选择函数可以对应有不同的选择概率，在特定的应用场景下，可以将选择概率最大的选择函数确定为目标选择函数；当然的，本领域技术人员还可以采用其他的方法来确定至少一个目标选择函数，只要能够保证目标选择函数确定的准确可靠性即可，在此不再赘述。

S102：根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据。

在确定与特定应用场景相对应的目标选择函数之后，可以根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据，具体的，可以预先设置有目标选择函数与目标样本数据之间的映射关系，利用目标选择函数和映射关系在待标注的多个样本数据中确定至少一个目标样本数据；或者，直接利用目标选择函数对多个样本数据进行筛选，将满足目标选择函数的样本数据确定为至少一个目标样本数据。举例来说，在应用场景为电商的应用场景时，可以通过电商平台(例如：服务器、处理器等等)获取到多个样本数据集合，每个样本数据集合中可以包括待标注的多个样本数据，而后，可以利用目标选择函数在多个样本数据中选择至少一个样本数据作为目标样本数据，这样有效地保证了所选择的目标样本数据与特定的应用场景(电商的应用场景)相适应。

S103：确定与目标样本数据相对应的标注样本数据。

其中，标注样本数据是与目标样本数据相对应的已标注的样本数据，其数量可以为一个或多个，已标注的样本数据是指样本数据对应有标注结果，该标注结果可以满足预设标准；具体的，标注结果所满足的预设标准的具体内容不做限定，本领域技术人员可以根据具体的应用需求进行设置，在样本数据所对应的标注结果满足预设标准时，则可以将此时的标注结果确认为样本数据的标准标注结果；而上述的标注结果可以是对标注样本数据进行预先审核之后所获取的审核结果；上述的预先审核的具体实现方式可以包括：人工审核或者模型审核。例如：上述标注结果可以为人工预先对标注样本数据进行标注审核所获得的审核结果；或者，上述标注结果也可以是利用预设的模型对标注样本数据进行分析处理后所获取的审核结果。较为优选的，为了保证标注结果的准确性，可以通过人为对标注样本数据进行审核，从而可以准确获取到满足预设要求的标注结果。

S104：利用标注样本数据对预设的审核模型进行优化训练，并利用优化训练后的审核模型对待处理数据进行审核。

其中，优化训练是指以标注样本数据作为参考基准，不断调整审核模型的参数，使得审核模型对数据进行审核的性能指标达到更高水平，例如：审核更加准确、审核效率更高、审核资源更少等等。因此，在获取到标注样本数据之后，可以利用标注样本数据对审核模型进行优化训练；在进行优化训练时，可以直接利用标注样本数据对审核模型进行优化训练；此时，若标注样本数据的个数为多个时，则可以对审核模型进行多次的优化训练，从而增加了对审核模型进行优化训练的次数和复杂度，但是也会降低了优化训练的效率。因此，为了避免上述情况的发生，在利用标注样本数据对预设的审核模型进行优化训练时，可以将标注样本数据添加至预设的训练样本集中；而后利用训练样本集对审核模型进行优化训练。

具体的，训练样本集用于存储对审核模型进行优化训练的样本数据，该样本数据中可以包括标注样本数据和已标注的非样本数据，可以理解的是，存储在训练样本集中的非样本数据也对应的标注结果满足预设标准；因此，在获取到一个或多个标注样本数据之后，可以将一个或多个标注样本数据添加至训练样本集中，而后利用训练样本集统一对审核模型进行优化训练，也即：利用训练样本中所包括的所有样本数据对审核模型进行优化训练。具体的实现过程包括：在训练样本集中所包括的标注样本数据达到预设的数量阈值时，则利用训练样本集对审核模型进行优化训练；或者，另一种可实现的方式为，按照预设的优化周期，利用训练样本集对审核模型进行优化训练。从而有效地降低了对审核模型进行优化训练的次数和复杂度，并且也保证了对审核模型进行优化训练的质量和效率。

另外，在对审核模型进行优化训练完毕后，可以利用优化训练后的审核模型对待处理数据进行审核，由于该审核模型可以通过标注样本数据进行不断的优化训练，因此，有效地提高了审核模型对待处理数据进行审核的质量和效率。

本实施例提供的数据的审核方法，通过在预设的多个选择函数中确定至少一个目标选择函数，根据所述目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据，而后确定与所述目标样本数据相对应的标注样本数据，再利用所述标注样本数据对预设的审核模型进行优化训练，从而实现了可以基于不同的应用场景确定不同的目标选择函数，利用目标选择函数所确定的标注样本数据可以对审核模型进行优化训练，保证了在不同的应用场景下的审核模型的审核精确度；在利用审核模型对待处理数据进行审核时，有效地保证了审核模型对数据进行审核的质量和效率，并且在保证审核模型精度不降低的前提下，有效地降低了人工标注的成本，进而提高了该方法的实用性，有利于市场的推广与应用。

可选地，在预设的多个选择函数中确定至少一个目标选择函数之前，本实施例中的方法还可以包括：

S001：为多个选择函数中的每个选择函数配置选择概率和最小选择概率，最小选择概率大于0。

具体的，对于每个选择函数而言，可以预先为选择函数配置一个初始选择概率；以5个选择函数为例，每个选择函数的选择概率记为p_i＝0.2(i＝1，2，3，4，5)和一个最小选择概率p_min，为每个选择函数配置最小选择概率是为了防止某个选择函数被选到的概率为0。需要说明的是，多个选择函数中的每个选择函数所配置的选择概率可以是相同或者不同的，并且，在不同的应用场景下，同一个选择函数可以对应有不同的选择概率。

通过为每个选择函数配置选择概率和最小选择概率，可以使得不同应用场景下，不同选择函数均具有被选择的机率，从而有利于标注样本数据确定的全面可靠性，进一步提高了对审核模型进行优化训练的精确度。

图3为本发明实施例提供的另一种数据的审核方法的流程图；在上述实施例的基础上，继续参考附图3所示，为了进一步提高对审核模型进行优化训练的质量，在利用标注样本数据对预设的审核模型进行优化训练之后，本实施例中的方法还可以包括：

S201：获取审核模型的模型反馈信息。

其中，模型反馈信息可以包括以下至少之一：模型反馈精确度、模型反馈性能信息、模型反馈开销资源信息等等，具体的，模型反馈精确度可以是指审核模型对数据进行审核的准确度，模型反馈性能信息可以是指审核模型对数据进行审核时，审核模型的性能表征信息；模型反馈开销资源可以是指审核模型对数据进行审核时，所节省的审核资源信息。可以理解的是，模型反馈信息可以不仅仅包括上述信息，本领域技术人员还可以根据具体的应用需求来设置模型反馈信息的具体内容，在此不再赘述。

S202：根据模型反馈信息对目标选择函数的选择概率进行调整。

在获取到模型反馈信息之后，可以根据模型反馈信息对目标选择函数的选择概率进行调整，以判断目标选择函数对审核模型的优化训练是否有贡献。具体的，在对目标选择函数的选择概率进行调整时，该目标选择函数的选择概率可以是预先配置的初始的选择概率，或者，该目标选择函数的选择概率也可以经过调整后的历史选择概率。举例来说，目标选择函数初始的选择概率为0.2，在获取到模型反馈信息之后，可以对目标选择函数的选择概率进行调整，比如，可以将目标选择概率的选择概率由0.2调整为0.3。当再次获取到模型反馈信息之后，可以根据模型反馈信息对目标选择函数的历史选择概率进行调整，即对0.3进行调整，比如：可以将选择概率由0.3调整为0.25。

具体的，根据模型反馈信息对目标选择函数的选择概率进行调整的步骤可以包括：

S2021：当所述模型反馈信息为正向反馈时，则增大目标选择函数的选择概率。

S2022：当所述模型反馈信息为负向反馈时，则减小目标选择函数的选择概率。

具体实现的过程中，在判断模型反馈信息是正向反馈或者负向反馈时，则可以先获取进行优化训练之前的审核模型的模型审核信息，该模型审核信息与模型反馈信息相对应，举例来说，当模型反馈信息包括模型反馈精确度时，模型审核信息可以包括模型审核精确度；当模型反馈信息包括模型反馈性能信息时，模型审核信息可以包括模型性能信息。在获取到模型审核信息和模型反馈信息之后，可以将模型反馈信息和模型审核信息进行比较，根据比较结果来判断模型反馈信息是正向反馈或者是负向反馈。具体的，在模型反馈信息大于模型审核信息时，则说明选择函数所对应的标注样本数据对审核模型的优化训练的贡献度较大，也即，可以确定此时的模型反馈信息是正向反馈，因此可以增加选择函数所对应的权重信息。在模型反馈信息小于模型审核信息时，则说明选择函数所对应的标注样本数据对审核模型的优化训练的贡献度较小，也即，可以确定此时的模型反馈信息是负向反馈，因此可以减小选择函数所对应的权重信息。当模型反馈信息等于模型审核信息时，则说明选择函数所对应的标注样本数据对审核模型的优化训练的贡献度没有影响，此时，则可以不调整选择函数所对应的权重信息。

通过获取审核模型的模型反馈信息，根据模型反馈信息对目标选择函数的选择概率进行调整，有效地实现了根据应用场景调整选择函数的选择概率，从而提高了对审核模型进行优化训练的质量。

图4为本发明实施例提供的根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据的流程图；图5为本发明实施例提供的根据目标选择函数确定与每个样本数据所对应的样本选择概率的流程图；在上述实施例的基础上，继续参考付4-5所示，为了保证目标样本数据确定的准确可靠性，本实施例中根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据可以包括：

S1021：根据目标选择函数确定与每个样本数据所对应的样本选择概率。

其中，根据目标选择函数确定与每个样本数据所对应的样本选择概率可以包括：

S10211：确定每个样本数据被所有选择函数进行选择的待选择概率。

S10212：将每个样本数据的待选择概率与目标选择函数的选择概率的乘积之和确定为与每个样本数据所对应的样本选择概率。

在每一次对审核函数进行优化训练时，对于样本数据而言，每个样本数据均有一定概率被所有选择函数所选择，对于每个样本数据而言，其所对应的待选择概率可以是根据具体的应用场景进行配置的；在获取到每个样本数据的待选择概率之后，可以将每个样本数据的待选择概率与目标选择函数的选择概率的乘积之和确定为与每个样本数据所对应的样本选择概率，也即：每个样本数据所对应的样本选择概率与样本数据本身被选择函数选中的机率和选择函数的选择概率相关；在样本选择概率较大时，则说明该样本数据被选中的机率较大。

S1022：将最大的样本选择概率所对应的至少一个样本数据确定为目标样本数据。

在获取到每个样本数据所对应的样本选择概率之后，可以将所有样本数据的样本选择概率进行比较，将最大的样本选择概率所对应的至少一个样本数据确定为目标样本数据。可以理解的是，在最大的样本选择概率为一个时，所对应的目标样本数据为一个，在最大的样本选择概率为多个时，所对应的目标样本数据为多个。

进一步的，在目标样本数据为多个时，本实施例中的方法还可以包括：

S1023：对多个目标样本数据进行筛选，获得筛选后样本数据。

具体的，在对多个目标样本数据进行筛选时，可以按照预设的筛选策略对多个目标样本数据进行筛选，从而可以获得筛选后样本数据。其中，筛选策略可以是预设的随机选择策略，或者，筛选策略可以设置有筛选个数，可以基于筛选个数对多个目标样本数据进行筛选，从而可以得到满足筛选个数的筛选后样本数据。

根据目标选择函数确定与每个样本数据所对应的样本选择概率，而后将最大的样本选择概率所对应的至少一个样本数据确定为目标样本数据，有效地实现了目标样本数据确定的准确可靠性，进而保证了该审核方法实施的稳定可靠性。

图6为本发明实施例提供的一种模型的训练方法的流程图；参考附图6所示，本实施例提供了一种模型的训练方法，该方法的执行主体为模型的训练装置，该训练装置可以实现为软件、或者软件和硬件的组合。具体的，该方法可以包括：

S301：在预设的多个选择函数中确定至少一个目标选择函数，选择函数用于选择待标注的样本数据。

S302：根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据。

S303：确定与目标样本数据相对应的标注样本数据。

S304：利用标注样本数据对预设的审核模型进行优化训练。

本实施例中的方法的具体实现过程以及实现效果与上述实施例中的S101-S104的具体实现过程以及实现效果相类似，具体参见上述实施例中的描述内容，在此不再赘述。

图7为本发明实施例提供的一种数据的处理方法的流程图；图8为本发明实施例提供的一种数据的处理方法的场景示意图；参考附图7-8所示，本实施例提供了一种数据的处理方法，该方法的执行主体为数据的处理装置，该处理装置可以实现为软件、或者软件和硬件的组合。具体的，该方法可以包括：

S401：获取待处理数据，所述待处理数据中包括至少一个数据对象。

其中，待处理数据可以为以下任意一个类型的数据：图像数据、视频数据、应用程序数据等等；在待处理数据为图像数据时，数据对象可以是指位于图像数据中的人物、动物、物体或者其他等等；在待处理数据为视频数据时，数据对象可以是指位于视频数据中的视频帧图像；在待处理数据为应用程序时，数据对象可以是指应用程序下所对应的应用实现功能。当然的，本领域技术人员也可以根据具体的应用需求将待处理数据设置为其他类型的数据，在此不再赘述。

S402：确定与所述数据对象相对应的神经网络，所述神经网络是通过样本数据训练得到的。

在获得待处理数据中包括的数据对象之后，由于数据对象的个数为一个或多个，为了能够实现对数据对象的准确识别和处理，可以确定与数据对象相对应的神经网络，可以理解的是，数据对象与神经网络之间的映射关系可以是一对一映射、多对一映射或者一对多映射。上述与数据对象相对应的神经网络可以是通过样本数据训练得到的，例如：采用上述图1所对应的实施例中的方式优化训练获得神经网络，从而可以利用神经网络对数据对象进行分析处理。

S403：利用所述神经网络对所述数据对象进行分析处理，获取与所述数据对象相对应的对象信息。

在获取到神经网络之后，可以利用神经网络对数据对象进行分析处理，从而可以获取到与数据对象相对应的对象信息，可以理解的是，对象信息可以随着神经网络的不同用途而发生改变。具体的，包括但不限于以下应用场景：

应用场景一：在神经网络用于识别数据对象的价格信息时，对象信息可以是指价格信息，参考附图8所示，在获取到数据对象所对应的神经网络之后，利用神经网络对数据对象进行分析处理之后，可以获取到与数据对象相对应的价格信息，如：网球的价格为1元，冰球的价格为1元，冰球棒的价格为9元，足球的价格为10元等等。

可以想到的是，在可以识别数据对象的价格信息之后，可以将数据对象以及相对应的价格信息上传网络(交易平台或者二手交易平台)，生成与数据对象相对应的待交易信息；为了更加方便地显示数据对象，还可以对数据对象进行多角度的拍摄，获得多角度的对象图片，将对象图片与待交易信息进行关联存储，从而利用虚拟现实(Virtual Reality，简称VR)技术形成针对数据对象的待交易信息。

进一步的，针对数据对象的待交易信息，为了方便对待交易信息进行管理，用户可以针对待交易信息建立相对应的实体仓库，并将实体仓库信息与待交易信息进行关联存储，举例来说：用户可以针对用于存储多个待交易的数据对象的区域进行定时拍摄，获得仓库实景图，而后将仓库实景图与待交易信息进行关联存储，从而便于对数据对象的管理和维护。

应用场景二：在神经网络用于识别数据对象的来源信息时，对象信息可以是指来源信息；或者，在神经网络用于识别数据对象的历史信息时，对象信息可以是指历史信息。例如：数据对象可以为待考证古学价值(简称“考古”)的物体，在确定与物体相对应的神经网络之后，可以利用神经网络对物体进行分析识别，从而可以获取到与物体相对应的来源信息或者历史信息。

应用场景三：在神经网络用于对数据对象的搭配进行建议时，对象信息可以是针对物体搭配的建议信息。例如：数据对象包括：待搭配的第一组件、第二组件、第三组件和第四组件，其中，第一组件可以与第二组件进行搭配使用。在确定与数据对象相对应的神经网络之后，可以利用神经网络对组件与组件之间的搭配状态进行分析识别，从而可以获取到组件与组件之间的搭配状态的建议信息，如：第一组件与第二组件可进行搭配，第三组件和第四组件不可进行搭配等等。

应用场景四：在神经网络用于对数据对象进行分类时，对象信息可以是指分类信息。例如：在数据对象为待分类的多个垃圾物体时，在确定与垃圾物体相对应的神经网络(此时的神经网络可以通过垃圾物体的外观信息来确定)时，则可以利用神经神经网络对垃圾物体进行分类，如：垃圾一为厨余垃圾、垃圾二为可回收垃圾。

应用场景五：在神经网络用于提取视频中的视频帧图像时，对象信息可以是指提取后的视频帧图像。例如：现有待提取图像的视频一、视频二和视频三，其中，视频一、视频二和视频三的拍摄角度不同，视频一的拍摄角度为近景，视频二的拍摄角度为中景，视频三的拍摄角度为远景，此时，可以根据不同视频的拍摄角度确定不同的神经网络，而后可以利用不同的神经网络针对所对应的视频进行图像提取操作，从而可以获得与视频相对应的提取后图像。

应用场景六：在神经网络可以基于应用程序实现多点聚焦功能时，对象信息可以是指聚焦后的图像信息。例如：现有拍摄的应用程序，在利用应用程序在不同场景中、不同拍摄视角下对不同的拍摄对象进行拍摄时，可以确定与拍摄对象所对应的神经网络，如，对拍摄对象一采用可实现单点聚焦的神经网络进行图像处理，对拍摄对象而采用可实现多点聚焦的神经网络进行图像处理，从而可以获得经过不同聚焦策略后的拍摄图像。

可以想到的是，本领域技术人员可以根据不同的应用需求来训练获得不同的神经网络，从而可以针对数据对象进行不同的数据处理操作，继而可以得到不同的对象信息，在此不再赘述。

本实施例提供的数据的处理方法，通过获取待处理数据，确定与所述数据对象相对应的神经网络，所述神经网络是通过样本数据训练得到的，从而实现了可以基于不同的数据对象确定不同的神经网络，而后利用所述神经网络对所述数据对象进行分析处理，获取与所述数据对象相对应的对象信息，有效地保证了利用神经网络对数据进行处理的质量和效率，进而拓展了神经网络的适用范围，提高了该方法的实用性，有利于市场的推广与应用。

在上述实施例的基础上，继续参考附图7-8所示，本实施例对于确定与所述数据对象相对应的神经网络的具体实现方式不做限定，本领域技术人员可以根据具体的应用需求进行设置，其中，在所述待处理数据为图像数据时，一种可实现确定与所述数据对象相对应的神经网络的方式，包括：

S4021：获取所述待处理数据的拍摄角度。

S4022：根据拍摄角度确定与所述数据对象相对应的神经网络。

具体的，在待处理数据为图像数据时，可以先确定待处理数据的拍摄角度，通过拍摄角度来确定对数据对象进行处理的神经网络，举例来说：先利用图像采集设备针对同一物体在第一拍摄角度和第二拍摄角度进行拍摄，从而可以获得与第一拍摄角度相对应的第一图像和与第二拍摄角度相对应的第二图像，在对第一图像中的数据对象进行处理时，可以根据第一拍摄角度确定第一神经网络，从而可以利用第一神经网络对数据对象进行处理；在对第二图像中的数据对象进行处理时，可以根据第二拍摄角度确定第二神经网络，从而可以利用第二神经网络对数据对象进行处理。从而可以实现了针对不同角度的图像数据(或者不同角度交互的图像数据)，可以采用不同的神经网络进行处理，有效地提高了对数据对象进行处理的质量和效率。

此外，在所述数据对象为多个时，又一种可实现确定与所述数据对象相对应的神经网络的方式，包括：

S4023：获取所述数据对象的对象类型。

S4024：根据所述对象类型确定与所述数据对象相对应的神经网络。

具体的，在待处理数据为图像数据时，可以利用神经网络对图像数据中的数据对象进行分析处理，从而可以获得图像数据中每个数据对象所对应的相关信息。例如，在图像数据中的至少一个数据对象包括：足球、冰球、冰球杆、网球时，可以通过数据对象所属的不同数据类型来确定不同的神经网络，例如：足球对应第一神经网络，冰球对应第二神经网络，冰球棒对应第三神经网络，网球对应第四神经网络，进而可以利用不同的神经网络对数据对象进行处理，从而可以确定与每个数据对象相对应的价格信息。

需要注意的是，数据对象与神经网络的映射关系并不限于上述的一对一映射，还可以是多对一映射或者一对多映射，例如，足球对应第一神经网络，冰球和冰球棒对应第二神经网络，网球对应第三神经网络，上述的冰球与冰球棒与第二神经网络的对应关系则是多对一的映射关系。或者，足球对应第一神经网络，冰球和冰球棒对应第二神经网络，网球可以对应第一神经网络和第三神经网络，上述的网球与第一神经网络和第三神经网络的对应关系则是一对多的映射关系。可以想到的是，本领域技术人员可以根据具体的设计需求对上述的数据对象与神经网络的映射关系进行任意设置，在此不再赘述。

另外，在所述数据对象为多个时，还一种确定与所述数据对象相对应的神经网络的实现方式，包括：

S4025：获取用户针对所述数据对象输入的交互信息。

S4026：根据所述交互信息对多个所述数据对象进行分组，获得对象分组信息。

S4027：根据所述对象分组信息确定与所述数据对象相对应的神经网络。

具体的，在获取到待处理数据中所包括的数据对象时，用户可以针对数据对象输入交互信息，在获取到用户输入的交互信息之后，可以根据用户的交互信息对数据对象进行分组，从而可以获得对象分组信息，而后可以根据对象分组信息确定与数据对象相对应的神经网络，可以想到的是，同一个对象分组信息中的一个或多个数据对象可以对应同一个神经网络。

举例来说：数据对象包括：冰球、冰球棒、足球和网球，在用户针对冰球和冰球棒进行关联交互时，可以将冰球与冰球棒确定为第一对象分组信息，该对象分组信息中包括冰球和冰球棒；在用户针对足球和网球进行关联交互时，可以将足球和网球确定为第二对象分组信息，该对象分组信息中包括足球和网球；而后，可以根据第一对象分组信息确定与冰球和冰球棒相对应的第一神经网络(该神经网络可以通过第一对象分组信息中的共同关键字确定)，根据第二分组信息确定与足球和网球相对应的第二神经网络。或者，数据对象包括：冰球、冰球棒、足球和网球，在用户针对冰球、足球和网球进行关联交互时，可以将对冰球、足球和网球确定为第一对象分组信息，该对象分组信息中包括冰球、足球和网球；此时，可以自动地将剩余的一个数据对象(冰球棒)为第二对象分组信息。而后，可以根据第一对象分组信息确定与冰球、足球和网球相对应的第三神经网络(该神经网络可以通过第一对象分组信息中的共同关键字确定)，根据第二分组信息确定与冰球棒的第四神经网络。

通过上述过程，有效地实现了可以通过用户输入的交互信息来确定与所述数据对象相对应的神经网络，有效地实现了所确定的神经网络可以满足用户的需求，并且也可以保证对数据对象进行处理的质量和效率。

具体应用时，参考附图9-10所示，以电商领域的应用场景为例，本应用实施例提供了一种数据的审核方法，该方法实现了半人工(人工对样本数据进行标注，使得样本数据可以获得满足预设标准的标注结果)半机审的数据审核方式，不仅可以在保证审核模型(分类器)精度不降低的前提下，有效地尽量降低人工标注的成本；并且还可以适用于不同的应用场景。具体的，该方法包括如下步骤：

step1：当新业务接入时，可以获得与新业务相对应的所有数据，此时，所有数据都未被标注，进而可以通过分层聚类的方法，选择出每个类簇中的TOP K个样本，给人工标注(专家标注)，从而可以获得已标注样本。

step2：上述已标注样本作为初始训练样例集，分别抽取商品每个维度的特征，构建基准分类器(审核模型)。具体的，基准分类器的构建步骤如下：

(1)通过卷积神经网络-Inception V3算法对已标注样本进行提取，获得图片原始特征。

(2)通过fasttext算法对已标注样本进行提取，获得文本类的数据，文本类的数据包括商品标题信息和类目信息等等。

(3)通过证据权重WOE算法对上述所获得的类目信息进行量化。

(4)针对已标注数据，提取商品维度和商品维度的数据特征，商品维度的数据特征包括：商品星级、商家销量、商品的价格等等特征。

(5)将结构化数据(上述的文本类的数据和图片原始特征)通过多个隐藏层进行特征提取，并与非结构数据一起通过attention模型网络，最终得到的嵌入层embedding，通过softmax函数进行分类，从而可以获得基准分类器，该基准分类器用于对数据进行审核。

step3：通过选择策略选择待标注的样本数据。

考虑到审核平台上的业务众多而且业务之间差异较大的场景，为了使得待标注的样本数据选取可以获得较好的效果，本应用实施例可以采用多个选择函数，这样不仅可以同时满足多个不同的业务场景的需求，并且数据选取的效率较高。具体的，可以将选择选择函数及样本看作多臂赌博机问题(multi-armed bandit problem)，获得每一次选择之后的反馈信息，并可以根据每一次选择之后的反馈信息，对选择选择函数的概率进行更新，从而自适应选择最有效的选择函数，继而根据最有效的选择函数选择最优的待标注的样本数据。

具体的包括如下步骤：

(3.1)在预设的多个选择函数中确定至少一个目标选择函数，选择函数用于选择待标注的样本数据。

具体的，利用审核模型，获取与每个选择函数相对应的预估精确度；将最大的预估精确度所对应的选择函数确定为目标选择函数。另外，在预设的多个选择函数中确定至少一个目标选择函数之前，为多个选择函数中的每个选择函数配置选择概率和最小选择概率，最小选择概率大于0。

(3.2)根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据。

其中，多个选择函数可以包括以下至少一个：margin函数、uniform函数、bandit_discrete函数、kcenter_greedy函数、hierarchical_clustering函数。对于每个选择函数而言，可以设置一个初始选择的概率值记为p_i和一个最小概率值p_min(防止某个选择函数被选到的概率为0)。而后，对于上述基准分类器(审核模型)而言，记第t个迭代过程可以采用第k个函数来选择待标注的样本数据的概率为p_k(t)；在每一个迭代中，对每一个未标注的样本数据而言，其可以供所有的选择函数h(t)进行挑选，记第k个选择函数在t个迭代选择样本数据的概率为h^k(t)；则最终选择样本数据j的概率

也即将每个样本数据的待选择概率与所述目标选择函数的选择概率的乘积之和确定为与每个样本数据所对应的样本选择概率，从而可以获得选择样本数据j所对应的样本选择概率，而后可以将最大的样本选择概率所对应的样本数据确定为目标样本数据。

step4：专家对选择的样本进行标注。

在确定目标样本数据之后，可以使得专家来确定与目标样本数据相对应的标注样本数据。

step5：在获取到标注样本数据之后，可以利用标注样本数据对基准分类器进行优化训练，并可以利用优化训练之后的基准分类器对其他的待处理数据进行审核处理。

step6：检测审核模型的模型准确率是否满足预设标准。

step7：若模型准确率不满足预设标准，则继续训练审核模型。

若模型准确率满足预设标准，则利用审核模型对未标注数据进行审核。

step8：对审核模型对未标注数据进行审核的审核结果进行灰度抽检。

step9：根据灰度抽检结果判断机审准确率(实际准确率)是否满足预设标准。

若机审准确率不满足预设标准，可以继续训练审核模型，并且还可以获取与数据相对应的满足预设标准的标注结果；将数据直接确定为新的样本数据。或者，将该数据直接作为新的样本数据的备选数据。若机审准确率满足预设标准，则可以对其他为标注数据继续进行审核。

step10：在利用审核模型对待处理数据进行审核之后，获取审核模型的模型反馈信息；根据模型反馈信息对目标选择函数的选择概率进行调整。

具体的，获取进行优化训练之前的审核模型的模型审核信息；在模型反馈信息大于模型审核信息时，则增大目标选择函数的选择概率；或者，在模型反馈信息小于模型审核信息时，则减小目标选择函数的选择概率；从而实现了对选择函数的选择概率进行更新。

本应用实施例提供的数据处理方法，通过multi-armed bandit的方式根据不同场景的需求，每次迭代可以从多个选择函数选择出最优的选择函数及最有价值的需标注样本，根据最有价值的需达标样本对审核模型进行优化训练，然后自适应的更新优化对应的选择函数的选择概率；这样选出的样本数据更优且通用型强；不仅有效的解决了监督学习需要大量标注，成本较高的问题；也有效的避免了半监督学习准确性不稳定的问题和传统active learning不能适应多个场景的问题；实现了对审核模型进行训练优化，而后利用审核模型对数据进行处理，从而构成了有效的闭环，整个流程能自动高效的进行，进一步体现了该方法的自主学习能力，保证了该方法使用的智能化程度。

图11为本发明实施例提供的一种数据的审核装置的结构示意图；参考附图11所示，本实施例提供了一种数据的审核装置，该审核装置可以执行上述的数据的审核方法，具体的，该装置可以包括：第一选择模块11、第一确定模块12和审核模块13。

第一选择模块11，用于在预设的多个选择函数中确定至少一个目标选择函数，选择函数用于选择待标注的样本数据；

第一确定模块12，用于根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据；

第一确定模块12，还用于确定与目标样本数据相对应的标注样本数据；

审核模块13，用于利用标注样本数据对预设的审核模型进行优化训练，并利用优化训练后的审核模型对待处理数据进行审核。

可选地，在第一选择模块11在预设的多个选择函数中确定至少一个目标选择函数时，该第一选择模块11可以用于执行：利用审核模型，获取与每个选择函数相对应的预估精确度；将最大的预估精确度所对应的选择函数确定为目标选择函数。

可选地，在预设的多个选择函数中确定至少一个目标选择函数之前，本实施例中的审核模块13还可以用于：为多个选择函数中的每个选择函数配置选择概率和最小选择概率，最小选择概率大于0。

可选地，在利用标注样本数据对预设的审核模型进行优化训练之后，本实施例中的审核模块13还可以用于执行：获取审核模型的模型反馈信息；根据模型反馈信息对目标选择函数的选择概率进行调整。

可选地，在审核模块13根据模型反馈信息对目标选择函数的选择概率进行调整时，该审核模块13可以用于执行：当模型反馈信息为正向反馈时，则增大目标选择函数的选择概率；或者，当所述模型反馈信息为负向反馈时，则减小目标选择函数的选择概率。

可选地，在第一确定模块12根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据时，该第一确定模块12可以用于执行：根据目标选择函数确定与每个样本数据所对应的样本选择概率；将最大的样本选择概率所对应的至少一个样本数据确定为目标样本数据。

可选地，在第一确定模块12根据目标选择函数确定与每个样本数据所对应的样本选择概率时，该第一确定模块12可以用于执行：确定每个样本数据被所有选择函数进行选择的待选择概率；将每个样本数据的待选择概率与目标选择函数的选择概率的乘积之和确定为与每个样本数据所对应的样本选择概率。

可选地，在目标样本数据为多个时，本实施例中的审核模块13还可以用于执行：对多个目标样本数据进行筛选，获得筛选后样本数据。

图11所示装置可以执行图1a、图1b、图2-图5所示实施例的方法，本实施例未详细描述的部分，可参考对图1a、图1b、图2-图5所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1a、图1b、图2-图5所示实施例中的描述，在此不再赘述。

在一个可能的设计中，图11所示数据的审核装置的结构可实现为一电子设备，该电子设备可以是手机、平板电脑、服务器等各种设备。如图12所示，该电子设备可以包括：第一处理器21和第一存储器22。其中，第一存储器22用于存储支持电子设备执行上述图1a、图1b、图2-图5所示实施例中提供的数据的审核方法的程序，第一处理器21被配置为用于执行第一存储器22中存储的程序。

程序包括一条或多条计算机指令，其中，一条或多条计算机指令被第一处理器21执行时能够实现如下步骤：

在预设的多个选择函数中确定至少一个目标选择函数，选择函数用于选择待标注的样本数据；

根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据；

确定与目标样本数据相对应的标注样本数据；

利用标注样本数据对预设的审核模型进行优化训练，并利用优化训练后的审核模型对待处理数据进行审核。

可选地，第一处理器21还用于执行前述图1a、图1b、图2-图5所示实施例中的全部或部分步骤。

其中，电子设备的结构中还可以包括第一通信接口23，用于电子设备与其他设备或通信网络通信。

另外，本发明实施例提供了一种计算机存储介质，用于储存电子设备所用的计算机软件指令，其包含用于执行上述图1a、图1b、图2-图5所示方法实施例中数据的审核方法所涉及的程序。

图13为本发明实施例提供的一种模型的训练装置的结构示意图；参考附图13所示，本实施例提供了一种模型的训练装置，该训练装置可以执行上述的模型的训练方法，具体的，该装置可以包括：第二选择模块31、第二确定模块32和训练模块33。

第二选择模块31，用于在预设的多个选择函数中确定至少一个目标选择函数，选择函数用于选择待标注的样本数据；

第二确定模块32，用于根据目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据；

第二确定模块32，还用于确定与目标样本数据相对应的标注样本数据；

训练模块33，用于利用标注样本数据对预设的审核模型进行优化训练。

图13所示装置可以执行图6所示实施例的方法，本实施例未详细描述的部分，可参考对图6所示实施例的相关说明。该技术方案的执行过程和技术效果参见图6所示实施例中的描述，在此不再赘述。

在一个可能的设计中，图13所示模型的训练装置的结构可实现为一电子设备，该电子设备可以是手机、平板电脑、服务器等各种设备。如图14所示，该电子设备可以包括：第二处理器41和第二存储器42。其中，第二存储器42用于存储支持电子设备执行上述图6所示实施例中提供的模型的训练方法的程序，第二处理器41被配置为用于执行第二存储器42中存储的程序。

程序包括一条或多条计算机指令，其中，一条或多条计算机指令被第二处理器41执行时能够实现如下步骤：

确定与目标样本数据相对应的标注样本数据；

利用标注样本数据对预设的审核模型进行优化训练。

其中，电子设备的结构中还可以包括第二通信接口43，用于电子设备与其他设备或通信网络通信。

另外，本发明实施例提供了一种计算机存储介质，用于储存电子设备所用的计算机软件指令，其包含用于执行上述图6所示方法实施例中模型的训练方法所涉及的程序。

图15为本发明实施例提供的一种数据的处理装置的结构示意图；本实施例提供了一种数据的处理装置，该处理装置可以执行上述的数据的处理方法，具体的，该装置可以包括：获取模块51、第三确定模块52和处理模块53。

获取模块51，用于获取待处理数据，所述待处理数据中包括至少一个数据对象；

第三确定模块52，用于确定与所述数据对象相对应的神经网络，所述神经网络是通过样本数据训练得到的；

处理模块53，用于利用所述神经网络对所述数据对象进行分析处理，获取与所述数据对象相对应的对象信息。

可选地，在所述待处理数据为图像数据时，在第三确定模块52确定与所述数据对象相对应的神经网络时，该第三确定模块52可以用于执行：获取所述待处理数据的拍摄角度；根据拍摄角度确定与所述数据对象相对应的神经网络。

可选地，在所述数据对象为多个时，在第三确定模块52确定与所述数据对象相对应的神经网络时，该第三确定模块52可以用于执行：获取所述数据对象的对象类型；根据所述对象类型确定与所述数据对象相对应的神经网络。

可选地，在所述数据对象为多个时，在第三确定模块52确定与所述数据对象相对应的神经网络时，该第三确定模块52可以用于执行：获取用户针对所述数据对象输入的交互信息；根据所述交互信息对多个所述数据对象进行分组，获得对象分组信息；根据所述对象分组信息确定与所述数据对象相对应的神经网络。

图15所示装置可以执行图7-8所示实施例的方法，本实施例未详细描述的部分，可参考对图7-8所示实施例的相关说明。该技术方案的执行过程和技术效果参见图7-8所示实施例中的描述，在此不再赘述。

在一个可能的设计中，图15所示数据的处理装置的结构可实现为一电子设备，该电子设备可以是手机、平板电脑、服务器等各种设备。如图16所示，该电子设备可以包括：第三处理器61和第三存储器62。其中，第三存储器62用于存储支持电子设备执行上述图7-8所示实施例中提供的数据的处理方法的程序，第三处理器61被配置为用于执行第三存储器62中存储的程序。

程序包括一条或多条计算机指令，其中，一条或多条计算机指令被第三处理器61执行时能够实现如下步骤：

其中，电子设备的结构中还可以包括第三通信接口63，用于电子设备与其他设备或通信网络通信。

另外，本发明实施例提供了一种计算机存储介质，用于储存电子设备所用的计算机软件指令，其包含用于执行上述图7-8所示方法实施例中数据的处理方法所涉及的程序。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现，当然也可以通过硬件和软件结合的方式来实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器，使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种数据的审核方法，其特征在于，包括：

确定与所述目标样本数据相对应的标注样本数据；

2.根据权利要求1所述的方法，其特征在于，在预设的多个选择函数中确定至少一个目标选择函数，包括：

利用所述审核模型，获取与每个选择函数相对应的预估精确度；

将最大的预估精确度所对应的选择函数确定为所述目标选择函数。

3.根据权利要求1所述的方法，其特征在于，在预设的多个选择函数中确定至少一个目标选择函数之前，所述方法还包括：

为多个选择函数中的每个选择函数配置选择概率和最小选择概率，所述最小选择概率大于0。

4.根据权利要求3所述的方法，其特征在于，在利用所述标注样本数据对预设的审核模型进行优化训练之后，所述方法还包括：

获取所述审核模型的模型反馈信息；

根据所述模型反馈信息对所述目标选择函数的选择概率进行调整。

5.根据权利要求4所述的方法，其特征在于，根据所述模型反馈信息对所述目标选择函数的选择概率进行调整，包括：

当所述模型反馈信息为正向反馈时，则增大所述目标选择函数的选择概率；或者，

当所述模型反馈信息为负向反馈时，则减小所述目标选择函数的选择概率。

6.根据权利要求3所述的方法，其特征在于，根据所述目标选择函数在待标注的多个样本数据中确定至少一个目标样本数据，包括：

根据所述目标选择函数确定与每个所述样本数据所对应的样本选择概率；

将最大的样本选择概率所对应的至少一个样本数据确定为所述目标样本数据。

7.根据权利要求6所述的方法，其特征在于，根据所述目标选择函数确定与每个样本数据所对应的样本选择概率，包括：

确定每个样本数据被所有选择函数进行选择的待选择概率；

将每个样本数据的待选择概率与所述目标选择函数的选择概率的乘积之和确定为与每个样本数据所对应的样本选择概率。

8.根据权利要求1-7中任意一项所述的方法，其特征在于，在所述目标样本数据为多个时，所述方法还包括：

对多个所述目标样本数据进行筛选，获得筛选后样本数据。

9.一种模型的训练方法，其特征在于，包括：

确定与所述目标样本数据相对应的标注样本数据；

利用所述标注样本数据对预设的审核模型进行优化训练。

10.一种数据的处理方法，其特征在于，包括：

11.根据权利要求10所述的方法，其特征在于，在所述待处理数据为图像数据时，确定与所述数据对象相对应的神经网络，包括：

获取所述待处理数据的拍摄角度；

根据拍摄角度确定与所述数据对象相对应的神经网络。

12.根据权利要求10所述的方法，其特征在于，在所述数据对象为多个时，确定与所述数据对象相对应的神经网络，包括：

获取所述数据对象的对象类型；

根据所述对象类型确定与所述数据对象相对应的神经网络。

13.根据权利要求10所述的方法，其特征在于，在所述数据对象为多个时，确定与所述数据对象相对应的神经网络，包括：

获取用户针对所述数据对象输入的交互信息；

根据所述交互信息对多个所述数据对象进行分组，获得对象分组信息；

根据所述对象分组信息确定与所述数据对象相对应的神经网络。

14.一种数据的审核装置，其特征在于，包括：

15.一种电子设备，其特征在于，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行时实现如权利要求1至8中任一项所述的数据的审核方法。

16.一种模型的训练装置，其特征在于，包括：

17.一种电子设备，其特征在于，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行时实现如权利要求9所述的模型的训练方法。

18.一种数据的处理装置，其特征在于，包括：

19.一种电子设备，其特征在于，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，其中，所述一条或多条计算机指令被所述处理器执行时实现如权利要求10-13中任意一项所述的数据的处理方法。