CN112149733B

CN112149733B - 模型训练、质量确定方法、装置、电子设备及存储介质

Info

Publication number: CN112149733B
Application number: CN202011008060.XA
Authority: CN
Inventors: 鲁方波; 汪贤; 成超; 樊鸿飞; 蔡媛
Original assignee: Beijing Kingsoft Cloud Network Technology Co Ltd
Current assignee: Beijing Kingsoft Cloud Network Technology Co Ltd
Priority date: 2020-09-23
Filing date: 2020-09-23
Publication date: 2024-04-05
Anticipated expiration: 2040-09-23
Also published as: CN112149733A

Abstract

本发明涉及一种模型训练、质量确定方法、装置、电子设备及存储介质，所述方法包括：获取第一数据集及多个不同的预设模型；利用多个预设模型分别预测第一数据集中每个第一数据对应的第一标签；针对每个预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与第一标签对应的第一数据，构建预设模型对应的伪标签数据集；构建预设模型对应的第二数据集；利用第二数据集对预设模型进行训练，直至预设模型训练结束，得到多个质量确定模型，以用于确定图像数据的质量。本发明实施例通过多个预设模型之间协同学习，相互学习其它预设模型的优势，通过其它预设模型对应的伪标签数据集进行模型训练和自我提升，显著提升模型的泛化性和精度。

Description

模型训练、质量确定方法、装置、电子设备及存储介质

技术领域

本申请涉及计算机领域，尤其涉及一种模型训练、质量确定方法、装置、电子设备及存储介质。

背景技术

随着多媒体技术的发展，网络数据呈现爆炸式增长，比如图片、视频、文字等。图像或视频作为信息传播的主要载体，在图像或视频采集、编码、传输等环节通常面临着很多质量损失。低质量图像或视频会严重降低人眼视觉观感，因此，如何有效评估图像或视频质量具有非常重要的意义。

目前，一般使用无参考视频质量评估方法评估图像或视频质量，现有无参考视频质量评估方法需要构建一个大规模数据集及对应主观评分标注即可，现有基于深度学习的无参考质量评估方法主要是基于开源的已标注的数据进行模型训练，然后将训练的模型运用到各种场景的视频或图像数据中。

然而，为了对基于深度学习的无参考质量评估方法进行训练，需要构建一个大规模数据集，由于视频或图像数据的多样性，现有开源已标注数据集最大也仅为几千的规模，相比数据本身的多样性相差甚远，在该标注数据集上训练的模型通常泛化性较差。因此，如何在有限的标注数据集下提升模型泛化性成为当前亟需解决的问题。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种模型训练、质量确定方法、装置、电子设备及存储介质。

第一方面，本申请提供了一种模型训练方法，包括：

获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据；

将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签；

针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集；

根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集；

利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束，得到多个质量确定模型，以用于确定图像数据的质量。

可选的，所述针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，包括：

针对每个所述预设模型，获取多个预设模型中除所述预设模型自身之外的其它预设模型预测的第一标签；

将获取到的第一标签中满足预设条件的第一标签确定为伪标签；

将第一数据集中与所述伪标签对应的第一数据确定为伪标签数据；

基于所述伪标签及所述伪标签数据构建所述预设模型对应的伪标签数据集。

可选的，所述将获取到的第一标签中满足预设条件的第一标签确定为伪标签，包括：

按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签；

针对每个所述预设模型，将多个预设模型中除所述预设模型之外的预设模型分别确定为参考模型；

针对每个所述预设模型对应的参考标签，计算任意两个所述参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第一差异数据；

计算所述预设模型所对应的参考标签与任一参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据；

若任一参考标签对应的第一差异数据小于第一预设阈值，且该参考标签对应的第二差异数据大于或者等于第二预设阈值，将所述参考标签确定为伪标签。

可选的，所述按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签，包括：

计算每个预设模型预测的第一标签的平均值，得到所述预设模型对应的参考标签。

可选的，所述方法还包括：

判断任一所述预设模型对应的伪标签数据集与其它预设模型对应的伪标签数据集的重合度是否超过预设阈值；

若任一所述重合度超过预设阈值，确定所述预设模型训练结束；

或者，判断任一所述预设模型重新训练的迭代次数是否达到预设次数；

若任一所述预设模型重新训练的迭代次数达到预设次数，确定所述预设模型训练结束。

可选的，所述方法还包括：

获取第二数据集，所述第二数据集包括：第二数据及第二标签；

利用所述第二数据集分别对多个预设初始模型进行训练，得到多个预设模型。

第二方面，本申请提供了一种质量确定方法，包括：

在多个质量确定模型中选择一个或多个质量确定模型，所述质量确定模型是通过以下方式训练得到的：获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据，将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集，利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束；

将待确定质量的图像数据输入一个或多个质量确定模型中，得到所述图像数据的质量确定结果。

第三方面，本申请提供了一种模型训练装置，包括：

获取模块，用于获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据；

第一输入模块，用于将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签；

第一构建模块，用于针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集；

第二构建模块，用于根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集；

第一训练模块，用于利用所述第二数据集重新对所述预设模型进行训练，直至所述预设模型训练结束，得到多个质量确定模型，以用于确定图像数据的质量。

可选的，所述第一构建模块，包括：

获取单元，用于针对每个所述预设模型，获取多个预设模型中除所述预设模型自身之外的其它预设模型预测的第一标签；

第一确定单元，用于将获取到的第一标签中满足预设条件的第一标签确定为伪标签；

第二确定单元，用于将第一数据集中与所述伪标签对应的第一数据确定为伪标签数据

构建单元，用于基于所述伪标签及所述伪标签数据构建所述预设模型对应的伪标签数据集。

可选的，所述选择单元，包括：

预测子单元，用于按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签；

第三确定单元，用于针对每个所述预设模型，将多个预设模型中除所述预设模型之外的预设模型分别确定为参考模型；

第一计算子单元，用于针对每个所述预设模型对应的参考标签，计算任意两个所述参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第一差异数据；

第二计算子单元，用于计算所述预设模型所对应的参考标签与任一参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据；

确定子单元，用于若任一参考标签对应的第一差异数据小于第一预设阈值，且该参考标签对应的第二差异数据大于或者等于第二预设阈值，将所述参考标签确定为伪标签。

可选的，所述预测子单元还用于：

可选的，所述装置还包括：

第一判断模块，用于判断任一所述预设模型对应的伪标签数据集与其它预设模型对应的伪标签数据集的重合度是否超过预设阈值；

第一确定模块，用于若所述预设模型对应的伪标签数据集与其它预设模型对应的伪标签数据集的重合度超过预设阈值，确定所述预设模型训练结束；

或者，第二判断模块，用于判断任一所述预设模型重新训练的迭代次数是否达到预设次数；

第二确定模块，用于若任一所述预设模型重新训练的迭代次数达到预设次数，确定所述预设模型训练结束。

可选的，所述装置还包括：

数据集获取模块，用于获取第二数据集，所述第二数据集包括：第二数据及第二标签；

模型训练模块，用于利用所述第二数据集分别对多个预设初始模型进行训练，得到多个预设模型。

第四方面，本申请提供了一种质量确定装置，包括：

模型选择模块，用于在多个质量确定模型中选择一个或多个质量确定模型，所述质量确定模型是通过以下方式训练得到的：获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据，将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集，利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束；

第二输入模块，用于将待确定质量的图像数据输入一个或多个质量确定模型中，得到所述图像数据的质量确定结果。

第五方面，本申请提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现第一方面任一所述的模型训练方法及第二方面所述的质量确定方法。

第六方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有模型训练方法或者质量确定方法的程序，所述模型训练方法程序被处理器执行时实现第一方面任一所述的模型训练方法或者第二方面所述的质量确定方法的步骤。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点：

本发明实施例通过获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据，然后将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签，再针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集，最后可以利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束，得到多个质量确定模型，以用于确定图像数据的质量。

本发明实施例能够基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建第二数据集，利用所述第二数据集重新对所述预设模型进行训练，也即：通过多个预设模型之间协同学习，相互学习其它预设模型的优势，然后通过其它预设模型对应的伪标签数据集进行模型训练和自我提升，可以显著提升模型的泛化性和精度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种模型训练方法的流程图；

图2为图1中步骤S103的流程图；

图3为图2中步骤S202的流程图；

图4为本申请实施例提供的一种质量确定方法的流程图；

图5为本申请实施例提供的一种模型训练装置的结构图；

图6为本申请实施例提供的一种质量确定装置的结构图；

图7为本申请实施例提供的一种电子设备的结构图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

现有技术中，为了对基于深度学习的无参考质量评估方法进行训练，需要构建一个大规模数据集，由于视频或图像数据的多样性，现有开源已标注数据集最大也仅为几千的规模，相比数据本身的多样性相差甚远，在该标注数据集上训练的模型通常泛化性较差。为此，本发明实施例提供了一种模型训练、质量确定方法、装置、电子设备及存储介质，其中，模型训练方法可以应用于终端中，如服务器或者PC机中等，如图1所示，所述模型训练方法可以包括以下步骤：

步骤S101，获取第一数据集及多个不同的预设模型；

在本发明实施例中，所述第一数据集包括多个第一数据，第一数据集是大规模的无标签数据集，即：第一数据集中的第一数据不存在对应的数据标签。

预设模型可以指预先利用小规模的有标签数据集训练后得到的深度神经网络模型，多个预设模型可以为模型结构不同的深度神经网络模型；也可以为同一个模型，但是应当预先利用不同的有标签数据集进行训练，得到不同的模型参数，也就是说，多个预设模型可以是模型结构不同，也可以是模型参数不同，不同的预设模型之间存在一定差异。

在该步骤中，可以获取预先准备好的第一数据集及多个预设模型，获取的预设模型的数量大于或者等于三个。

步骤S102，将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签；

在该步骤中，可以将第一数据集中分别输入多个预设模型中的每个预设模型，每个预设模型均预测第一数据集中每个第一数据对应的第一标签，也即：每个预设模型对应一组第一标签。

例如，预设模型01对应的一组第一标签包括{70、80、84…49}；预设模型02对应的一组第一标签包括{84、65、25…74}；预设模型03对应的一组第一标签包括{64、83、36…88}等等。

步骤S103，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集；

由于每个预设模型对应一组第一标签，所以可以针对每个预设模型，获取除该预设模型自身外的其它预设模型对应的各组第一标签及每个第一标签对应的第一数据，构建该预设模型对应的伪标签数据集；

例如，假设存在3个预设模型分别为预设模型01、预设模型02和预设模型03，则针对预设模型01，可以获取预设模型02对应的一组第一标签及各第一标签对应的第一数据，并获取预设模型03对应的一组第一标签及各第一标签对应的第一数据，构建预设模型01对应的伪标签数据集；

针对预设模型02，可以获取预设模型01对应的一组第一标签及各第一标签对应的第一数据，并获取预设模型03对应的一组第一标签及各第一标签对应的第一数据，构建预设模型02对应的伪标签数据集；

针对预设模型03，可以获取预设模型01对应的一组第一标签及各第一标签对应的第一数据，并获取预设模型02对应的一组第一标签及各第一标签对应的第一数据，构建预设模型03对应的伪标签数据集。

步骤S104，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集；

由于预设模型经过预先训练，所以可以获取预先训练预设模型使用的训练集(即：小规模的有标签数据集)，在训练集中选择随机部分训练数据及数据标签，为保证模型较好收敛，随机选择训练数据及数据标签的对数小于或者等于训练集中的训练数据与数据标签的对数总数，将选择出来的训练数据及数据标签及伪标签数据及中的第一数据及对应标签进行组合，得到该预设模型对应的第二数据集。

步骤S105，利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束，得到多个质量确定模型，以用于确定图像数据的质量。

由于针对每个预设模型均构建了一个对应的第二数据集，所以可以将第二数据集输入对应的预设模型中，利用第二数据集重新对该预设模型进行训练，直至预设模型训练结束，得到多个质量确定模型，质量确定模型用于确定图像数据的质量。

在本发明的又一实施例中，所述步骤S103，如图2所示，包括：

步骤S201，针对每个所述预设模型，获取多个预设模型中除所述预设模型自身之外的其它预设模型预测的第一标签；

步骤S202，将获取到的第一标签中满足预设条件的第一标签确定为伪标签；

在本发明实施例中，预设条件可以用于过滤掉可能会影响训练完的模型精度的第一标签。

在该步骤中，可以在获取到的第一标签中选择满足预设条件的第一标签，将选择出来的满足预设条件的第一标签确定为伪标签。

步骤S203，将第一数据集中与所述伪标签对应的第一数据确定为伪标签数据；

在该步骤中，可以在第一数据集中查找与伪标签对应的第一数据，将查找到的第一数据确定为伪标签数据。

步骤S204，基于所述伪标签及所述伪标签数据构建所述预设模型对应的伪标签数据集。

本发明实施例通过在第一标签中选择满足预设条件的第一标签，可以过滤掉可能会引起误差的第一标签，避免不满足预设条件的第一标签影响模型训练结果，进而提高模型精度。

在本发明的又一实施例中，所述步骤S202，如图3所示，包括：

步骤S301，按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签；

在本发明实施例中，预设算法可以指能够体现每个预设模型对应的第一标签的整体情况的算法，如：平均值计算公式等。

在该步骤中，可以将每个预设模型预测的第一标签的数值带入预设算法中，得到每个预设模型对应的参考标签。

示例性的，可以计算每个预设模型预测的第一标签的平均值，得到所述预设模型对应的参考标签。

步骤S302，针对每个所述预设模型，将多个预设模型中除所述预设模型之外的预设模型分别确定为参考模型；

步骤S303，针对每个所述预设模型对应的参考标签，计算任意两个所述参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第一差异数据；

在该步骤中，可以针对任一预设模型对应的参考标签，获取任意两个参考模型所对应的参考标签，计算这两个参考标签之间的差值，在对差值取绝对值，得到该参考标签对应的第一差异数据。

示例性的，假设存在3个预设模型分别为预设模型01、预设模型02和预设模型03，预设模型01对应的参考标签为60，预设模型02对应的参考标签为70，预设模型03对应的参考标签为80，则针对预设模型01对应的参考标签60，获取预设模型02对应的参考标签为70和预设模型03对应的参考标签为80，计算|70-80|＝10，10即为预设模型01对应的参考标签60 对应的第一差异数据；

同理，针对预设模型02对应的参考标签70，获取预设模型01对应的参考标签为60和预设模型03对应的参考标签为80，计算|60-80|＝20，20 即为预设模型02对应的参考标签70对应的第一差异数据；

同理，针对预设模型03对应的参考标签80，获取预设模型01对应的参考标签为60和预设模型02对应的参考标签为70，计算|60-70|＝10，10 即为预设模型03对应的参考标签80对应的第一差异数据。

步骤S304，计算所述预设模型所对应的参考标签与任一参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据；

在该步骤中，可以针对任一预设模型对应的参考标签，获取任一参考模型所对应的参考标签，计算这两个参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据。

示例性的，假设存在3个预设模型分别为预设模型01、预设模型02和预设模型03，预设模型01对应的参考标签为60，预设模型02对应的参考标签为70，预设模型03对应的参考标签为80，则针对预设模型01对应的参考标签60，获取预设模型02对应的参考标签为70，计算|60-70|＝10，获取预设模型03对应的参考标签为80，计算|60-80|＝20，10和20即为预设模型01对应的参考标签60对应的第二差异数据；

同理，针对预设模型02对应的参考标签70，获取预设模型01对应的参考标签为60，计算|70-60|＝10，获取预设模型03对应的参考标签为80，计算|60-80|＝20，10和20即为预设模型02对应的参考标签70对应的第二差异数据；

同理，针对预设模型03对应的参考标签80，获取预设模型01对应的参考标签为60，计算|80-60|＝20，获取预设模型02对应的参考标签为70，计算|80-70|＝10，20和10即为预设模型03对应的参考标签80对应的第二差异数据。

步骤S305，若任一参考标签对应的第一差异数据小于第一预设阈值，且该参考标签对应的第二差异数据大于或者等于第二预设阈值，将所述参考标签确定为伪标签。

在本发明实施例中，第二预设阈值大于第一预设阈值。

在该步骤中，可以针对每个参考标签，将步骤S302得到的第一差异数据与第一预设阈值比较，将步骤S303得到的第二差异数据与第二预设阈值比较，若第一差异数据小于第一预设阈值，且第二差异数据大于或者等于第二预设阈值，则确定该参考标签为满足预设条件的第一标签。

也就是说，假设N个算法的预测结果为p1至pN，则对于第i个算法， N个算法预测结果中除第i个外，其他所有算法两两之间的预测结果的差的绝对值小于第一预设阈值thres1，且第i个算法的预测结果与其他算法的预测结果的差的绝对值不小于第二预设阈值thres2，其中第二预设阈值thres2>第一预设阈值thres1，在实际应用中，比如thres1＝0.2，thres2＝0.5，具体可以根据实际需要进行设置。

本发明实施例通过选择第一差异数据小于第一预设阈值且第二差异数据大于或者等于第二预设阈值的参考标签，可以保证每个参考标签对应的第一差异数据尽可能小，第二差异数据尽可能大，也就是不同参考标签之间的距离尽可能的大，保证伪标签数据集中第一标签之间的差异性足够大，进而提高模型精度。

在本发明的又一实施例中，所述方法还包括：

为了保证训练完毕的质量确定模型的精度，需要不同预设模型对应伪标签数据集之间的差异越大越好，若任一预设模型对应的伪标签数据集对于其它预设模型对应的伪标签数据集之间的重合度超过预设阈值(如：0.8)，则认为两个伪标签数据集之间的差异较小，继续进行迭代将对得到的质量确定模型的精度无较大影响，所以可以在伪标签数据集之间的重合度超过预设阈值时，确定预设模型训练结束。

若任一重合度超过预设阈值，确定所述预设模型训练结束；

在实际应用中，为了在一定期限内完成模型的训练，可以将重新训练的迭代次数可以设置为100000，迭代次数可根据实际需要设置，在到达迭代次数的时候，即确定预设墨子那个训练结束。

在本发明的又一实施例中，所述方法还包括：

获取第二数据集。

在本发明实施例中，第二数据集为小规模的有标签数据集，所述第二数据集包括：第二数据及第二标签；

本发明实施例通过利用小规模的有标签数据集对多个预设初始模型进行训练，可以得到多个预设模型，进而便于使用多个预设模型对大规模的无标签数据集中的第一数据预测对应的第一标签。

在本发明的又一实施例中，还提供一种质量确定方法，如图4所示，所述方法包括：

步骤S401，在多个质量确定模型中选择一个或多个质量确定模型；

在本发明实施例中，所述质量确定模型是通过前述任一方法实施例训练得到的，示例性的，可以是通过以下方式训练得到的：获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据，将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集，利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束。

可以选择精度最高或者泛化性最高的一个质量确定模型，或者随机选择若干个质量确定模型。

步骤S402，将待确定质量的图像数据输入一个或多个质量确定模型中，得到所述图像数据的质量确定结果。

在本发明实施例中，图像数据可以指图像或者视频流中的图像帧等。

在仅选择出一个质量确定模型时，可以将该质量确定模型输出的结果确定为图像数据的质量确定结果；

在选择出多个质量确定模型时，可将多个质量确定模型输出的结果计算平均值，将平均值作为图像数据的质量确定结果。

本发明实施例能够利用质量确定模型确定图像数据的质量，保证对图像数据的质量确定的准确性。

在本发明的又一实施例中，还提供一种模型训练装置，如图5所示，包括：

获取模块11，用于获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据；

第一输入模块12，用于将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签；

第一构建模块13，用于针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集；

第二构建模块14，用于根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建第二数据集；

可选的，所述第一构建模块，包括：

可选的，所述选择单元，包括：

可选的，所述预测子单元还用于：

可选的，所述装置还包括：

在本发明的又一实施例中，还提供一种质量确定装置，如图6所示，包括：

模型选择模块21，用于在多个质量确定模型中选择一个或多个质量确定模型，所述质量确定模型是通过以下方式训练得到的：获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据，将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集，利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束；

第二输入模块22，用于将待确定质量的图像数据输入一个或多个质量确定模型中，得到所述图像数据的质量确定结果。

在本发明的又一实施例中，还提供一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现前述方法实施例所述的模型训练方法及前述方法实施例所述的质量确定方法。

本发明实施例提供的电子设备，处理器通过执行存储器上所存放的程序实现了本发明实施例通过获取第一数据集及多个预设模型，将所述第一数据集输入多个预设模型，利用多个所述预设模型预测每个第一数据对应的第一标签，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建第二数据集，利用所述第二数据集重新对所述预设模型进行训练，直至所述预设模型训练结束，可以得到多个质量确定模型。本发明实施例能够基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建伪标签数据集，根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建第二数据集，利用所述第二数据集重新对所述预设模型进行训练，也即：通过多个预设模型之间协同学习，相互学习其它预设模型的优势，然后通过其它预设模型对应的伪标签数据集进行模型训练和自我提升，可以显著提升模型的泛化性和精度。

上述电子设备提到的通信总线1140可以是外设部件互连标准(PeripheralComponentInterconnect，简称PCI)总线或扩展工业标准结构 (ExtendedIndustryStandardArchitecture，简称EISA)总线等。该通信总线1140可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口1120用于上述电子设备与其他设备之间的通信。

存储器1130可以包括随机存取存储器(RandomAccessMemory，简称 RAM)，也可以包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器1110可以是通用处理器，包括中央处理器(CentralProcessingUnit，简称CPU)、网络处理器(NetworkProcessor，简称 NP)等；还可以是数字信号处理器(DigitalSignalProcessing，简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明的又一实施例中，还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有模型训练方法或者质量确定方法的程序，所述模型训练方法程序被处理器执行时实现前述方法实施例所述的模型训练方法或者前述方法实施例所述的质量确定方法的步骤。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……” 限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims

1.一种模型训练方法，其特征在于，包括：

所述针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，包括：

将获取到的第一标签中满足预设条件的第一标签确定为伪标签；所述将获取到的第一标签中满足预设条件的第一标签确定为伪标签，包括：按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签；针对每个所述预设模型，将多个预设模型中除所述预设模型之外的预设模型分别确定为参考模型；针对每个所述预设模型对应的参考标签，计算任意两个所述参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第一差异数据；计算所述预设模型所对应的参考标签与任一参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据；若任一参考标签对应的第一差异数据小于第一预设阈值，且该参考标签对应的第二差异数据大于或者等于第二预设阈值，将所述参考标签确定为伪标签；

基于所述伪标签及所述伪标签数据构建所述预设模型对应的伪标签数据集；

2.根据权利要求1所述的模型训练方法，其特征在于，所述按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签，包括：

3.根据权利要求1所述的模型训练方法，其特征在于，所述方法还包括：

4.根据权利要求1所述的模型训练方法，其特征在于，所述方法还包括：

5.一种质量确定方法，其特征在于，包括：

在多个质量确定模型中选择一个或多个质量确定模型，所述质量确定模型是通过以下方式训练得到的：获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据，将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，所述针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，包括：针对每个所述预设模型，获取多个预设模型中除所述预设模型自身之外的其它预设模型预测的第一标签；将获取到的第一标签中满足预设条件的第一标签确定为伪标签；所述将获取到的第一标签中满足预设条件的第一标签确定为伪标签，包括：按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签；针对每个所述预设模型，将多个预设模型中除所述预设模型之外的预设模型分别确定为参考模型；针对每个所述预设模型对应的参考标签，计算任意两个所述参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第一差异数据；计算所述预设模型所对应的参考标签与任一参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据；若任一参考标签对应的第一差异数据小于第一预设阈值，且该参考标签对应的第二差异数据大于或者等于第二预设阈值，将所述参考标签确定为伪标签；将第一数据集中与所述伪标签对应的第一数据确定为伪标签数据；基于所述伪标签及所述伪标签数据构建所述预设模型对应的伪标签数据集；根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集，利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束；

6.一种模型训练装置，其特征在于，包括：

第一构建模块，用于针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集；所述针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，包括：针对每个所述预设模型，获取多个预设模型中除所述预设模型自身之外的其它预设模型预测的第一标签；将获取到的第一标签中满足预设条件的第一标签确定为伪标签；所述将获取到的第一标签中满足预设条件的第一标签确定为伪标签，包括：按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签；针对每个所述预设模型，将多个预设模型中除所述预设模型之外的预设模型分别确定为参考模型；针对每个所述预设模型对应的参考标签，计算任意两个所述参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第一差异数据；计算所述预设模型所对应的参考标签与任一参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据；若任一参考标签对应的第一差异数据小于第一预设阈值，且该参考标签对应的第二差异数据大于或者等于第二预设阈值，将所述参考标签确定为伪标签；将第一数据集中与所述伪标签对应的第一数据确定为伪标签数据；基于所述伪标签及所述伪标签数据构建所述预设模型对应的伪标签数据集；

7.一种质量确定装置，其特征在于，包括：

模型选择模块，用于在多个质量确定模型中选择一个或多个质量确定模型，所述质量确定模型是通过以下方式训练得到的：获取第一数据集及多个不同的预设模型，所述第一数据集包括多个第一数据，将所述第一数据集分别输入多个预设模型，利用多个所述预设模型分别预测所述第一数据集中每个第一数据对应的第一标签，针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，所述针对每个所述预设模型，基于多个预设模型中除自身外的其它预设模型预测的第一标签及与所述第一标签对应的第一数据，构建所述预设模型对应的伪标签数据集，包括：针对每个所述预设模型，获取多个预设模型中除所述预设模型自身之外的其它预设模型预测的第一标签；将获取到的第一标签中满足预设条件的第一标签确定为伪标签；所述将获取到的第一标签中满足预设条件的第一标签确定为伪标签，包括：按照预设算法及每个预设模型预测的第一标签计算每个预设模型对应的参考标签；针对每个所述预设模型，将多个预设模型中除所述预设模型之外的预设模型分别确定为参考模型；针对每个所述预设模型对应的参考标签，计算任意两个所述参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第一差异数据；计算所述预设模型所对应的参考标签与任一参考模型所对应的参考标签之间的差值的绝对值，得到与所述参考标签对应的第二差异数据；若任一参考标签对应的第一差异数据小于第一预设阈值，且该参考标签对应的第二差异数据大于或者等于第二预设阈值，将所述参考标签确定为伪标签；将第一数据集中与所述伪标签对应的第一数据确定为伪标签数据；基于所述伪标签及所述伪标签数据构建所述预设模型对应的伪标签数据集；根据所述伪标签数据集及用于预先训练所述预设模型的训练集构建所述预设模型对应的第二数据集，利用所述第二数据集对所述预设模型进行训练，直至所述预设模型训练结束；

8.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1～4任一所述的模型训练方法及权利要求5所述的质量确定方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有模型训练方法或者质量确定方法的程序，所述模型训练方法程序被处理器执行时实现权利要求1-4任一所述的模型训练方法或者权利要求5所述的质量确定方法的步骤。