WO2020087974A1

WO2020087974A1 - 生成模型的方法和装置

Info

Publication number: WO2020087974A1
Application number: PCT/CN2019/095078
Authority: WO
Inventors: 袁泽寰; 王长虎
Original assignee: 北京字节跳动网络技术有限公司
Priority date: 2018-10-30
Filing date: 2019-07-08
Publication date: 2020-05-07
Also published as: CN109344908B; CN109344908A

Abstract

一种生成模型方法和装置。该方法的一示例实施方式包括：获取样本集（201）；从该样本集中提取样本（202），执行如下训练过程：将所提取的样本中的样本视频中的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率（203）；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值（204）；将损失值与目标值进行比较，确定初始模型是否训练完成（205）；响应于确定初始模型训练完成，将训练后的初始模型确定为低质视频检测模型（206）。

Description

生成模型的方法和装置

本申请要求在2018年10月30日提交中国专利局、申请号为201811273468.2的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，例如生成模型的方法和装置。

背景技术

随着计算机技术的发展，短视频类应用应运而生。用户可以利用短视频类应用上传、发布视频。服务器在接收到一个视频后，可以对该视频进行检测，以确定其是否为低质视频。此处，低质视频通常为质量较低的视频，例如，可以包括模糊视频、黑屏视频、录屏视频等。

相关技术中，通常是将视频分为多类，例如分为黑屏视频类、录屏视频类、模糊视频类、正常视频类。训练分类模型确定视频属于每个类别的概率，将视频属于非正常视频的概率之和作为视频属于低质视频的概率，进而确定视频是否为低质视频。

发明内容

本申请实施例提出了生成模型的方法和装置。

第一方面，本申请实施例提供了一种生成模型的方法，该方法包括：获取样本集，其中，所述样本集中的样本包括样本视频和用于指示所述样本视频是否属于低质视频的第一标注信息，在样本视频属于低质视频的情况下，所述样本还包括用于指示所述样本视频的低质类别的第二标注信息，所述样本视频的低质类别为多种；从所述样本集中提取样本，执行如下训练过程：将所提取的样本中的样本视频中的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值；将所述损失值与目标值进行比较，确定所述初始模型是否训练完成；响应于确定所述初始模型训练完成，将训练后的所述初始模型确定为低质视频检测模型。

第二方面，本申请实施例提供了一种生成模型的装置，该装置包括：获取单元，被配置成获取样本集，其中，所述样本集中的样本包括样本视频和用于指示所述样本视频是否属于低质视频的第一标注信息，在所述样本视频属于低质视频的情况下，所述样本还包括用于指示所述样本视频的低质类别的第二标注信息，所述样本视频的低质类别为多种；训练单元，被配置成从样本集中提取样本，执行如下训练过程：将所提取的样本中的样本视频的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值；将所述损失值与目标值进行比较，确定所述初始模型是否训练完成；响应于确定所述初始模型训练完成，将训练后的所述初始模型确定为低质视频检测模型。

第三方面，本申请实施例提供了一种检测低质视频的方法，包括：接收包含目标视频的低质视频检测请求；将所述目标视频中的帧输入采用如上述第一方面中任一实施例所描述的方法生成的低质视频检测模型，得到检测结果，其中，所述检测结果包括所述目标视频属于低质视频的概率；响应于确定所述目标视频属于低质视频的概率大于第一预设阈值，确定所述目标视频为低质视频。

第四方面，本申请实施例提供了一种检测低质视频的装置，包括：第一接收单元，被配置成接收包含目标视频的低质视频检测请求；输入单元，被配置成将所述目标视频中的帧输入采用如上述第一方面中任一实施例所描述的方法生成的低质视频检测模型，得到检测结果，其中，所述检测结果包括所述目标视频属于低质视频的概率；第一确定单元，被配置成响应于确定所述目标视频属于低质视频的概率大于第一预设阈值，确定所述目标视频为低质视频。

第五方面，本申请实施例提供了一种电子设备，包括：至少一个处理器；存储装置，其上存储有至少一个程序，当至少一个程序被至少一个处理器执行，使得至少一个处理器实现如上述第一方面和第三方面中任一实施例的方法。

第六方面，本申请实施例提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述第一方面和第三方面中任一实施例的方法。

附图说明

图1是本申请的一个实施例可以应用于其中的示例性系统架构图；

图2是根据本申请的生成模型的方法的一个实施例的流程图；

图3是根据本申请的生成模型的方法的一个应用场景的示意图；

图4是根据本申请的生成模型的方法的又一个实施例的流程图；

图5是根据本申请的生成模型的装置的一个实施例的结构示意图；

图6是根据本申请的检测低质视频的方法的一个实施例的流程图；

图7是根据本申请的检测低质视频的装置的一个实施例的结构示意图；

图8是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作详细说明。可以理解的是，此处所描述的示例实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的生成模型的方法或生成模型的装置的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如视频录制类应用、视频播放类应用、语音交互类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

当终端设备101、102、103为硬件时，其上还可以安装有图像采集设备。图像采集设备可以是各种能实现采集图像功能的设备，如摄像头、传感器等等。用户可以利用终端设备101、102、103上的图像采集设备，来采集视频。

服务器105可以是提供各种服务的服务器，例如用于对终端设备101、102、103上传的视频进行存储、管理或者分析的视频处理服务器。视频处理服务器可以获取样本集。样本集中可以包含大量的样本。其中，上述样本集中的样本可以包括样本视频、用于指示样本视频是否属于低质视频的第一标注信息、用于指示属于低质视频的样本视频的低质类别的第二标注信息。此外，视频处理服务器可以利用样本集中的样本，对初始模型进行训练，并可以将训练结果(如生成的低质视频检测模型)进行存储。这样，在用户利用终端设备101、102、103上传视频后，服务器105可以检测用户所上传的视频是否为低质视频，进而，可以进行提示信息推送等操作。

需要说明的是，服务器105可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

需要说明的是，本申请实施例所提供的生成模型的方法一般由服务器105执行，相应地，生成模型的装置一般设置于服务器105中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的生成模型的方法的一个实施例的流程200。该生成模型的方法，包括以下步骤：

在步骤201中，获取样本集。

在本实施例中，生成模型的方法的执行主体(例如图1所示的服务器105)可以通过多种方式来获取样本集。例如，执行主体可以通过有线连接方式或无线连接方式，从设置为存储样本的另一服务器(例如数据库服务器)中获取存储于其中的样本集。再例如，用户可以通过终端设备(例如图1所示的终端设备101、102、103)来收集样本。这样，上述执行主体可以接收终端所收集的样本，并将这些样本存储在本地，从而生成样本集。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、超宽带(ultra wideband，UWB)连接、以及其他现在已知或将来开发的无线连接方式。

此处，样本集中可以包括大量的样本。其中，样本可以包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息。例如，属于低质视频时，第一标注信息可以是“1”；不属于低质视频时，第一标注信息可以是“0”。在样本中的样本视频属于低质视频的情况下，该样本还包括用于指示该样本视频的低质类别的第二标注信息。

需要说明的是，低质视频通常为质量较低的视频。例如，低质视频可以包括但不限于模糊视频、黑屏视频、录屏视频等。相应的，低质类别可以包括但不限于模糊视频类、黑屏视频类、录屏视频类等。

在步骤202中，从样本集中提取样本。

在本实施例中，执行主体可以从步骤201中获取的样本集中提取样本，以及执行步骤203至步骤206的训练过程。其中，样本的提取方式在本申请中并不限制。例如，可以是随机提取一个样本，也可以是从中样本集中按照指定次序提取当前需提取的样本。

在步骤203中，将所提取的样本中的样本视频中的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率。

在本实施例中，执行主体可以将步骤202中所提取的样本中的样本视频中的帧输入至初始模型，初始模型通过对视频中的帧进行特征提取、分析等，可以输出样本视频属于低质视频的概率，以及，可以输出样本视频属于每种低质类别的概率。需要说明的是，样本视频属于每种低质类别的概率，可以理解为，在样本视频属于低质视频的情况下，该样本视频属于每种低质类别的条件概率。

在本实施例中，初始模型可以是基于机器学习技术而创建的各种具有图像特征提取功能和分类功能的模型。初始模型可以对视频中的帧进行特征提取，而后对所提取的特征进行融合、分析等处理，最终输出样本视频属于低质视频的概率和样本视频属于每种低质类别的概率。实践中，在初始模型的训练过程中，初始模型所输出的各项概率通常不准确。训练初始模型的目的是试训练后的初始模型输出的各项概率更准确。

作为示例，初始模型可以是使用各种相关技术中的结构(例如DenseBox、VGGNet、ResNet、SegNet等)的卷积神经网络。实践中，卷积神经网络(Convolutional Neural Network，CNN)是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于图像处理有出色表现，因而，可以利用卷积神经网络进行样本视频中的帧特征的提取。在本示例中，所建立的积神经网络可以包含卷积层、池化层、特征融合层、全连接层等。其中，卷积层可以用于提取图像特征。池化层可以用于对输入的信息进行降采样(downsample)。特征融合层可以用于将所得到的每帧对应的图像特征(例如，可以是特征矩阵的形式，或者特征向量的形式)进行融合。例如，可以将不同帧对应的特征矩阵中的相同位置的特征值取平均，以进行特征融合，生成一个融合后的特征矩阵。全连接层可以用于将所得到的特征进行分类。

可以理解的是，由于初始模型可以输出样本视频属于低质视频的概率，以及样本视频属于每种低质类别的概率。因而，全连接层可以由两部分构成。其中，一部分可以输出样本视频属于低质视频的概率。另一部分可以输出样本视频属于每种低质类别的概率。实践中，各部分可以分别使用独立的softmax函数进行概率计算。

需要说明的是，上述初始模型也可以是具有图像特征提取功能和分类功能的其他模型，并不限于上述示例，具体的模型结构此处不作限定。

在步骤204中，基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值。

在本实施例中，上述执行主体可以基于所提取的样本中的标注信息(包含第一标注信息和第二标注信息)、所得到的概率和预先建立的损失函数，确定样本的损失值。实践中，损失函数(loss function)可以用来估量初始模型所输出的信息(如概率)与真实值(如标注信息)的不一致程度。一般情况下，损失函数的值(损失值)越小，模型的鲁棒性就越好。损失函数可以根据实际需求来设置。

在本实施例中，损失函数的设置可以考虑到两部分的损失(例如可以设定为两部分损失之和，或者两部分损失的加权结果)。其中一部分损失可以用于表征初始模型所输出的样本视频属于低质视频的概率与真实值(如第一标注信息，若第一标注信息指示样本视频为低质视频，则真实值为1；反之，为0)的差异程度。另一部分损失可以用于表征初始模型输出的样本视频属于第二标注信息所指示的低质类别的概率与真实值(如1)的差异程度。需要说明的是，当所提取的样本中未含有第二标注信息时，可以将该部分损失设置成预设值(例如0)。实践中，两部分损失可以分别利用交叉熵损失进行计算。

在本实施例的一些实现方式中，上述执行主体可以按照如下步骤确定样本的损失值：

第一步，将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数，得到第一损失值。此处，第一损失函数可以用于表征初始模型所输出的样本视频属于低质视频的概率与第一标注信息的差异程度。实践中，第一损失函数可以使用交叉熵损失。

第二步，响应于确定所提取的样本中不包含第二标注信息，可以将上述第一损失值确定为所提取的样本的损失值。

在一实施例中，在上述实现方式中，响应于确定所提取的样本中包含第二标注信息，上述执行主体可以执行如下步骤以确定样本的损失值：首先，可以将所提取的样本中的第二标注信息所指示的低质类别作为目标类别。而后，可以将所提取的样本中所包含的第二标注信息、初始模型所输出的样本视频属于该目标类别的概率输入至预先建立的第二损失函数，得到第二损失值。此处，第二损失函数可以用于表征初始模型所输出的样本视频属于目标类别(即第二标注信息所指示的低质类别)的概率与真实值(例如1)的差异程度。实践中，第二损失函数也可以使用交叉熵损失。之后，可以将上述第一损失值与上述第二损失值之和确定为所提取的样本的损失值。此处，还可以利用其他方式得到样本的损失值。例如，将第一损失值与上述第二损失值的加权结果确定为所提取的样本的损失值。其中，权重可以是技术人员根据需要而预先设置的。

在步骤205中，将损失值与目标值进行比较，确定初始模型是否训练完成。

在本实施例中，上述执行主体可以基于所确定损失值与目标值的比较，确定初始模型是否训练完成。作为示例，上述执行主体可以确定损失值是否已收敛。当确定损失值收敛时，则可以确定此时的初始模型已训练完成。作为又一示例，上述执行主体可以首先将损失值与目标值进行比较。响应于确定损失值小于或等于目标值，可以统计最近的预设数量次(例如近100次)训练过程所确定的损失值中，小于或等于上述目标值的损失值的数量占该预设数量的比例。在该比例大于预设比例(例如95％)时，可以确定初始模型训练完成。需要说明的是，步骤202中可以提取有多个(至少两个)样本。此时，可以针对每一个样本，可以分别利用步骤202-步骤204所记载的操作来计算样本的损失值。此时，执行主体可以将每个样本的损失值分别与目标值进行比较。从而可以确定每个样本的损失值是否小于或等于目标值。需要指出的是，目标值一般可以用于表示预测值与真实值之间的不一致程度的理想情况。也就是说，当损失值小于或等于目标值时，可以认为预测值接近或近似真实值。预设值可以根据实际需求来设置。

需要说明的是，响应于确定初始模型已训练完成，则可以继续执行步骤206。响应于确定初始模型未训练完成，可以基于所确定的样本的损失值，更新初始模型中的参数，从上述样本集中重新提取样本，使用更新参数后的初始模型作为初始模型，继续执行上述训练过程。此处，可以利用反向传播算法求得损失值相对于模型参数的梯度，而后利用梯度下降算法基于梯度更新模型参数。需要说明的是，上述反向传播算法、梯度下降算法以及机器学习方法是目前广泛研究和应用的公知技术，在此不再赘述。需要指出的是，这里的样本提取方式在本申请中也不限制。例如，在样本集中有大量样本的情况下，执行主体可以从中提取未被提取过的样本。

在步骤206中，响应于确定初始模型训练完成，将训练后的初始模型确定为低质视频检测模型。

在本实施例中，响应于确定初始模型训练完成，上述执行主体可以将训练后的初始模型确定为低质视频检测模型。该低质视频检测模型可以对检测视频是否为低质视频，同时，可以检测出低质视频的低质类别。

继续参见图3，图3是根据本实施例的生成模型的方法的应用场景的一个示意图。在图3的应用场景中，在图3的应用场景中，用户所使用的终端设备301上可以安装有模型训练类应用。当用户打开该应用，并上传样本集或样本集的存储路径后，对该应用提供后台支持的服务器302可以运行生成低质视频检测模型的方法，包括：

可以获取样本集。其中，上述样本集中的样本可以包括样本视频303、用于指示样本视频是否属于低质视频的第一标注信息304、用于指示属于低质视频的样本视频的低质类别的第二标注信息305。之后，可以从上述样本集中提取样本，执行如下训练过程：将所提取的样本中的样本视频中的帧输入至初始模型306，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值307；将上述损失值与目标值进行比较，确定初始模型是否训练完成。如果初始模型训练完成，将训练后的初始模型确定为低质视频检测模型308。

本申请的上述实施例提供的方法，通过获取样本集，可以从中提取样本以进行初始模型的训练。其中，上述样本集中的样本可以包括样本视频、用于指示样本视频是否属于低质视频的第一标注信息、用于指示属于低质视频的样本视频的低质类别的第二标注信息。这样，将提取的样本中的样本视频的帧输入至初始模型，便可以得到初始模型所输出的样本视频属于低质视频的概率和样本视频属于每种低质类别的概率。而后，基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，即可确定样本的损失值。之后，将上述损失值与目标值进行比较，可以确定初始模型是否训练完成。如果初始模型训练完成，就可以将训练后的初始模型确定为低质视频检测模型。从而，能够得到一种可以用于低质视频检测的模型，该模型有助于提高对低质视频检测的效率。

参考图4，其示出了生成模型的方法的又一个实施例的流程400。该生成模型的方法的流程400，包括以下步骤：

在步骤401中，获取样本集。

在本实施例中，生成模型的方法的执行主体(例如图1所示的服务器105)可以获取样本集。其中，样本可以包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息。在样本中的样本视频属于低质视频的情况下，该样本还包括用于指示该样本视频的低质类别的第二标注信息。

在步骤402中，从样本集中提取样本。

在本实施例中，执行主体可以从步骤401中获取的样本集中提取样本，以及执行步骤403至步骤410的训练过程。其中，样本的提取方式在本申请中并不限制。例如，可以是随机提取一个样本，也可以是从中样本集中按照指定次序提取当前需提取的样本。

在步骤403中，将所提取的样本中的样本视频中的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率。

在本实施例中，上述执行主体可以将步骤402中所提取的样本中的样本视频中的帧输入至初始模型，初始模型通过对视频中的帧进行特征提取、分析等，可以输出样本视频属于低质视频的概率，以及，可以输出样本视频属于每种低质类别的概率。

在本实施例中，初始模型可以使用基于机器学习技术而创建的卷积神经网络。所建立的积神经网络可以包含卷积层、池化层、特征融合层、全连接层等。全连接层可以由两部分构成。其中，一部分可以输出样本视频属于低质视频的概率。另一部分可以输出样本视频属于每种低质类别的概率。实践中，各部分可以分别使用独立的softmax函数进行概率计算。

在步骤404中，将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数，得到第一损失值。

在本实施例中，上述执行主体可以将所提取的样本中的第一标注信息、步骤403所输出的样本视频属于低质视频的概率输入至预先建立的第一损失函数，得到第一损失值。此处，第一损失函数可以用于表征初始模型所输出的样本视频属于低质视频的概率与第一标注信息的差异程度。实践中，第一损失函数可以使用交叉熵损失。

在步骤405中，确定所提取的样本中是否包含第二标注信息。

在本实施例中，上述执行主体可以确定所提取的样本中是否包含第二标注信息。若不包含，可以执行步骤406，以确定样本的损失值。若包含，可以执行步骤407-408，以确定样本的损失值。

在步骤406中，响应于确定所提取的样本中不包含第二标注信息，将第一损失值确定为所提取的样本的损失值。

在本实施例中，响应于确定所提取的样本中不包含第二标注信息，上述执行主体可以将第一损失值确定为所提取的样本的损失值。

在步骤407中，响应于确定所提取的样本中包含第二标注信息，将所提取的样本中的第二标注信息所指示的低质类别作为目标类别，将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数，得到第二损失值。

在本实施例中，响应于确定所提取的样本中包含第二标注信息，上述执行主体可以将所提取的样本中的第二标注信息所指示的低质类别作为目标类别，将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数，得到第二损失值。此处，第二损失函数可以用于表征初始模型所输出的样本视频属于目标类别概率与真实值(例如1)的差异程度。实践中，第二损失函数也可以使用交叉熵损失。

在步骤408中，将第一损失值与第二损失值之和确定为所提取的样本的损失值。

在本实施例中，上述执行主体可以将上述第一损失值与上述第二损失值之和确定为所提取的样本的损失值。

在步骤409中，将损失值与目标值进行比较，确定初始模型是否训练完成。

在本实施例中，上述执行主体可以基于所确定损失值与目标值的比较，确定初始模型是否训练完成。作为示例，上述执行主体可以确定损失值是否已收敛。当确定损失值收敛时，则可以确定此时的初始模型已训练完成。作为示例，上述执行主体可以首先将损失值与目标值进行比较。响应于确定损失值小于或等于目标值，可以统计最近的预设数量次(例如近100次)训练过程所确定的损失值中，小于或等于上述目标值的损失值的数量占该预设数量的比例。在该比例大于预设比例(例如95％)时，可以确定初始模型训练完成。需要说明的是，目标值一般可以用于表示预测值与真实值之间的不一致程度的理想情况。也就是说，当损失值小于或等于目标值时，可以认为预测值接近或近似真实值。预设值可以根据实际需求来设置。

需要说明的是，响应于确定初始模型已训练完成，则可以继续执行步骤410。响应于确定初始模型未训练完成，可以基于所确定的样本的损失值，更新初始模型中的参数，从上述样本集中重新提取样本，使用更新参数后的初始模型作为初始模型，继续执行上述训练过程。此处，可以利用反向传播算法求得损失值相对于模型参数的梯度，而后利用梯度下降算法基于梯度更新模型参数。需要说明的是，上述反向传播算法、梯度下降算法以及机器学习方法是目前广泛研究和应用的公知技术，在此不再赘述。需要指出的是，这里的样本提取方式在本申请中也不限制。例如，在样本集中有大量样本的情况下，执行主体可以从中提取未被提取过的样本。

在步骤410中，响应于确定初始模型训练完成，将训练后的初始模型确定为低质视频检测模型。

从图4中可以看出，与图2对应的实施例相比，本实施例中的生成模型的方法的流程400涉及了损失值的一种计算方式。基于这种方式计算得到的损失值进行初始模型的训练，可以使训练后的模型实现对低质视频的检测功能，以及，实现对低质视频的低质类别的检测功能。同时，利用所训练出的低质视频检测模型进行视频检测，有助于提升对低质视频的检测速度，以及，有助于提升对低质类别的检测效果。

参考图5，作为对上述各图所示方法的实现，本申请提供了一种生成模型的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置可以应用于各种电子设备中。

如图5所示，本实施例所述的生成模型的装置500包括：获取单元501，被配置成获取样本集，其中，样本可以包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息。在样本中的样本视频属于低质视频的情况下，该样本还包括用于指示该样本视频的低质类别的第二标注信息；训练单元502，被配置成从上述样本集中提取样本，执行如下训练过程：将所提取的样本中的样本视频的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值；将上述损失值与目标值进行比较，确定初始模型是否训练完成；响应于确定初始模型训练完成，将训练后的初始模型确定为低质视频检测模型。

在本实施例的一些实现方式中，上述训练单元502可以被配置成：将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数，得到第一损失值；响应于确定所提取的样本中不包含第二标注信息，将上述第一损失值确定为所提取的样本的损失值。

在本实施例的一些实现方式中，上述训练单元502可以被配置成：响应于确定所提取的样本中包含第二标注信息，将所提取的样本中的第二标注信息所指示的低质类别作为目标类别，将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数，得到第二损失值；将上述第一损失值与上述第二损失值之和确定为所提取的样本的损失值。

在本实施例的一些实现方式中，该装置还可以包括更新单元(图中未示出)。其中，上述更新单元可以被配置成响应于确定初始模型未训练完成，基于所确定的样本的损失值，更新初始模型中的参数，从上述样本集中重新提取样本，使用更新参数后的初始模型作为初始模型，继续执行上述训练过程。

本申请的上述实施例提供的装置，通过获取单元501获取样本集，训练单元502可以从中提取样本以进行初始模型的训练。其中，上述样本集中的样本可以包括样本视频、用于指示样本视频是否属于低质视频的第一标注信息、用于指示属于低质视频的样本视频的低质类别的第二标注信息。这样，训练单元502将提取的样本中的样本视频的帧输入至初始模型，便可以得到初始模型所输出的样本视频属于低质视频的概率和样本视频属于每种低质类别的概率。而后，基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，即可确定样本的损失值。之后，将上述损失值与目标值进行比较，可以确定初始模型是否训练完成。如果初始模型训练完成，就可以将训练后的初始模型确定为低质视频检测模型。从而，能够得到一种可以用于低质视频检测的模型，该模型有助于提高对低质视频检测的效率。

请参见图6，其示出了本申请提供的检测低质视频的方法的一个实施例的流程600。该检测低质视频的方法可以包括以下步骤：

在步骤601中，接收包含目标视频的低质视频检测请求。

在本实施例中，检测低质视频的执行主体(例如图1所示的服务器105，或者存储有低质视频检测模型的其他服务器)可以接收包含目标视频的低质视频检测请求。此处，目标视频可以是待进行低质视频检测的视频。目标视频可以预先存储在上述执行主体中。也可以是其他电子设备(例如图1所示的终端设备101、102、103)所发送的。

在步骤602中，将目标视频中的帧输入低质视频检测模型，得到检测结果。

在本实施例中，上述执行主体可以将目标视频中的帧输入低质视频检测模型，得到检测结果。其中，上述检测结果可以包括上述目标视频属于低质视频的概率。低质视频检测模型可以是采用如上述图2实施例所描述的生成低质视频检测模型的方法而生成的。生成过程可以参见图2实施例的相关描述，此处不再赘述。

在步骤603中，响应于确定目标视频属于低质视频的概率大于第一预设阈值，确定目标视频为低质视频。

在本实施例中，响应于确定目标视频属于低质视频的概率大于第一预设阈值，上述执行主体可以确定目标视频为低质视频。

在本实施例的一些实现方式中，上述检测结果还可以包括上述目标视频属于多种低质类别中每种低质类别的概率。在确定上述目标视频为低质视频之后，上述执行主体还可以执行如下操作：

首先，响应于接收到低质类别检测请求，可以将上述目标视频属于低质视频的概率作为第一概率，对于每种低质类别，确定上述目标视频属于该低质类别的概率与上述第一概率的乘积，将上述乘积确定为上述目标视频属于该低质类别的概率。

之后，可以将概率大于第二预设数值的低质类别确定为上述目标视频的低质类别。从而，可以确定出目标视频的低质类别。

需要说明的是，本实施例检测低质视频的方法可以用于测试上述各实施例所生成的低质视频检测模型。进而根据测试结果可以不断地优化低质视频检测模型。该方法也可以是上述各实施例所生成的低质视频检测模型的实际应用方法。采用上述各实施例所生成的低质视频检测模型，来进行低质视频检测，有助于提高低质视频检测模型的性能。同时，利用上述低质视频检测模型进行低质视频检测，提升了对低质视频的检测速度，以及，提升了对低质类别的检测效果。

继续参见图7，作为对上述图6所示方法的实现，本申请提供了一种检测低质视频的装置的一个实施例。该装置实施例与图6所示的方法实施例相对应，该装置可以应用于各种电子设备中。

如图7所示，本实施例所述的检测低质视频的装置700包括：第一接收单元701，被配置成接收包含目标视频的低质视频检测请求；输入单元702，被配置成将上述目标视频中的帧输入低质视频检测模型，得到检测结果。其中，上述检测结果包括上述目标视频属于低质视频的概率；第一确定单元703，被配置成响应于确定上述目标视频属于低质视频的概率大于第一预设阈值，确定上述目标视频为低质视频。

在本实施例的一些实现方式中，上述检测结果还可以包括上述目标视频属于多种低质类别中每种低质类别的概率。上述装置还可以包括第二接收单元和第二确定单元(图中未示出)。其中，上述第二接收单元可以被配置成响应于接收到低质类别检测请求，将上述目标视频属于低质视频的概率作为第一概率，对于每种低质类别，确定上述目标视频属于每种低质类别的概率与上述第一概率的乘积，将上述乘积确定为上述目标视频属于每种低质类别的概率。上述第二确定单元可以被配置成将目标视频属于每种低质类别的概率大于第二预设数值的低质类别确定为上述目标视频的低质类别。

可以理解的是，该装置700中记载的诸单元与参考图6描述的方法中的各个步骤相对应。由此，上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置700及其中包含的单元，在此不再赘述。

下面参考图8，其示出了适于用来实现本申请实施例的电子设备的计算机系统800的结构示意图。图8示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图8所示，计算机系统800包括中央处理单元(Central Processing Unit，CPU)801，其可以根据存储在只读存储器(Read-Only Memory，ROM)802中的程序或者从存储部分808加载到随机访问存储器(Random Access Memory，RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output，I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如局域网(Local Area Network，LAN)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，或从可拆卸介质811被安装这两种方式中的至少一种被安装。在该计算机程序被中央处理单元(CPU)801执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有至少一个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含至少一个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括获取单元和训练单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，获取单元还可以被描述为“获取样本集的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有至少一个程序，当上述至少一个程序被该装置执行时，使得该装置：获取样本集；从该样本集中提取样本，执行如下训练过程：将所提取的样本中的样本视频中的帧输入至初始模型，分别得到样本视频属于低质视频和样本视频属于每种低质类别的概率；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值；基于该损失值与目标值的比较，确定初始模型是否训练完成；响应于确定初始模型训练完成，将训练后的初始模型确定为低质视频检测模型。

Claims

一种生成模型的方法，包括：

获取样本集，其中，所述样本集中的样本包括样本视频和用于指示所述样本视频是否属于低质视频的第一标注信息，在所述样本视频属于低质视频的情况下，所述样本还包括用于指示所述样本视频的低质类别的第二标注信息，所述样本视频的低质类别包括多种低质类别；

从所述样本集中提取样本，执行如下训练过程：将所提取的样本中的样本视频中的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值；将所述损失值与目标值进行比较，确定所述初始模型是否训练完成；响应于确定所述初始模型训练完成，将训练后的所述初始模型确定为低质视频检测模型。
根据权利要求1所述的方法，其中，所述基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值，包括：

将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数，得到第一损失值；

响应于确定所提取的样本中不包含第二标注信息，将所述第一损失值确定为所提取的样本的损失值。
根据权利要求2所述的方法，所述基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值，还包括：

响应于确定所提取的样本中包含第二标注信息，将所提取的样本中的第二标注信息所指示的低质类别作为目标类别，将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数，得到第二损失值；

将所述第一损失值与所述第二损失值之和确定为所提取的样本的损失值。
根据权利要求1所述的方法，还包括：

响应于确定初始模型未训练完成，基于所确定样本的损失值，更新初始模型中的参数，从所述样本集中重新提取样本，使用更新参数后的初始模型作为初始模型，继续执行所述训练过程。
一种生成模型的装置，包括：

获取单元，被配置成获取样本集，其中，所述样本集中的样本包括样本视频和用于指示所述样本视频是否属于低质视频的第一标注信息，在所述样本视频属于低质视频的情况下，所述样本还包括用于指示所述样本视频的低质类别的第二标注信息，所述样本视频的低质类别包括多种低质类别；

训练单元，被配置成从所述样本集中提取样本，执行如下训练过程：将所提取的样本中的样本视频的帧输入至初始模型，分别得到样本视频属于低质视频的概率和样本视频属于每种低质类别的概率；基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数，确定样本的损失值；将所述损失值与目标值进行比较，确定所述初始模型是否训练完成；响应于确定所述初始模型训练完成，将训练后的所述初始模型确定为低质视频检测模型。
根据权利要求5所述的装置，其中，所述训练单元，被配置成：

将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数中，得到第一损失值；

响应于确定所提取的样本中不包含第二标注信息，将所述第一损失值确定为所提取的样本的损失值。
根据权利要求6所述的装置，所述训练单元，被配置成：

响应于确定所提取的样本中包含第二标注信息，将所提取的样本中的第二标注信息所指示的低质类别作为目标类别，将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数，得到第二损失值；

将所述第一损失值与所述第二损失值之和确定为所提取的样本的损失值。
根据权利要求5所述的装置，还包括：

更新单元，被配置成响应于确定初始模型未训练完成，基于所确定的样本的损失值，更新初始模型中的参数，从所述样本集中重新提取样本，使用更新参数后的初始模型作为初始模型，继续执行所述训练过程。
一种检测低质视频的方法，包括：

接收包含目标视频的低质视频检测请求；

将所述目标视频中的帧输入采用如权利要求1-4任一项所述的方法生成的低质视频检测模型，得到检测结果，其中，所述检测结果包括所述目标视频属于低质视频的概率；

响应于确定所述目标视频属于低质视频的概率大于第一预设阈值，确定所述目标视频为低质视频。
根据权利要求9所述的方法，所述检测结果还包括所述目标视频属于多种低质类别中每种低质类别的概率；以及

在所述确定所述目标视频为低质视频之后，所述方法还包括：

响应于接收到对所述目标视频的低质类别检测请求，将所述目标视频属于低质视频的概率作为第一概率，对于每种低质类别，确定所述目标视频属于每种低质类别的概率与所述第一概率的乘积，将所述乘积确定为所述目标视频属于每种低质类别的概率；

将所述目标视频属于每种低质类别的概率大于第二预设数值的低质类别确定为所述目标视频的低质类别。
一种检测低质视频的装置，包括：

第一接收单元，被配置成接收包含目标视频的低质视频检测请求；

输入单元，被配置成将所述目标视频中的帧输入采用如权利要求1-4任一项所述的方法生成的低质视频检测模型，得到检测结果，其中，所述检测结果包括所述目标视频属于低质视频的概率；

第一确定单元，被配置成响应于确定所述目标视频属于低质视频的概率大于第一预设阈值，确定所述目标视频为低质视频。
根据权利要求11所述的装置，所述检测结果还包括所述目标视频属于多种低质类别中每种低质类别的概率；以及

所述装置还包括：

第二接收单元，被配置成响应于接收到对所述目标视频的低质类别检测请求，将所述目标视频属于低质视频的概率作为第一概率，对于每种低质类别，确定所述目标视频属于每种低质类别的概率与所述第一概率的乘积，将所述乘积确定为所述目标视频属于每种低质类别的概率；

第二确定单元，被配置成将所述目标视频属于每种低质类别的概率大于第二预设数值的低质类别确定为所述目标视频的低质类别。
一种电子设备，包括：

至少一个处理器；

存储装置，其上存储有至少一个程序，

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-4、9-10中任一项所述的方法。
一种计算机可读介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1-4、9-10中任一项所述的方法。