CN109977848A

CN109977848A - 色情检测模型的训练方法及装置、计算机设备及可读介质

Info

Publication number: CN109977848A
Application number: CN201910223486.8A
Authority: CN
Inventors: 邹红才; 卢伟荣; 郑海洪
Original assignee: Guangzhou New Video Exhibition Investment Consulting Co Ltd
Current assignee: Guangzhou New Video Exhibition Investment Consulting Co Ltd
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2019-07-05
Anticipated expiration: 2039-03-22
Also published as: CN109977848B

Abstract

本发明提供一种色情检测模型的训练方法及装置、计算机设备及可读介质。其方法包括：从视频的色情类型已知的视频库中采集数条训练数据，各条训练数据中包括从对应的视频中抽取的一组预设数量的训练图片和对应的视频的已知色情类型；根据数条训练数据中的各条训练数据中的预设数量的训练图片、对应的视频的已知色情类型以及预先迁移来的色情检测模型的冻结层，训练色情检测模型的分类层，从而实现对色情检测模型的训练。本发明的技术方案，由于采用迁移来的视频的色情检测模型的冻结层，不用训练，而仅仅训练视频的色情检测模型的分类层的参数，需要调整的模型参数较少，从而能够大幅提高训练速度，缩短视频的训练时长，减少参数调优的成本。

Description

色情检测模型的训练方法及装置、计算机设备及可读介质

技术领域

本发明涉及计算机应用技术领域，尤其涉及一种色情检测模型的训练方法及装置、计算机设备及可读介质。

背景技术

近年来，在一系列包括智能手机全面普及、互联网流量快速增长及视频技术改革创新等利好环境下，短视频行业迎来了爆发式的发展，现已逐渐成为互联网生活的重要方式，短视频社交比重日益增长。各种短视频应用每天都将基于庞大的视频库为用户的短视频消费进行个性化推荐。为了保证应用生态的正向发展，在视频分发前，去除低质、色情、暴力相关的视频至关重要。

在短视频的色情检测中，现有的各家视频服务提供商常用方案为抽取视频中的一些图片，然后对抽取的图片进行图像识别，再根据业务需要，对满足特定规则的视频通过机器审核处理。在开展国际化业务的过程中，往往需要对本地化内容进行运营，以拉近产品与用户之间的距离，提供更好的用户体验。在这过程中，将无可避免地需要为本地化内容提供定制化服务，在使用上述短视频的色情检测技术，可以实现短视频的鉴黄服务。

但是，在现有的色情检测中，在鉴别能力上均有较好的表现，但在业务应用的过程中，检测时所采用的色情检测模型存在训练时间较长、参数调优成本较高的问题。

发明内容

为了解决上述问题，本发明提供一种色情检测模型的训练方法及装置、计算机设备及可读介质，以有效地缩短色情检测模型训练时长、节省参数调优成本。

本发明提供一种视频的色情检测模型的训练方法，所述方法包括：

从视频的色情类型已知的视频库中采集数条训练数据，各条所述训练数据中包括从对应的视频中抽取的一组预设数量的训练图片和对应的视频的已知色情类型；

根据所述数条训练数据中的各条所述训练数据中的预设数量的训练图片、对应的所述视频的已知色情类型以及预先迁移来的色情检测模型的冻结层，训练所述色情检测模型的分类层，从而实现对所述色情检测模型的训练。

本发明还提供一种视频的色情检测方法，所述方法包括：

从待检测视频中抽取预设数量的图片；

根据已经训练好的色情检测模型和所述预设数量的图片，检测所述待检测视频是否为色情视频；所述色情检测模型包括预先迁移来的冻结层和训练好的分类层，使得采用训练数据对所述色情检测模型训练时，仅对所述分类层进行训练，便能够实现对所述色情检测模型的训练。

本发明还提供一种视频的色情检测模型的训练装置，所述装置包括：

采集模块，用于从视频的色情类型已知的视频库中采集数条训练数据，各条所述训练数据中包括从对应的视频中抽取的一组预设数量的训练图片和对应的视频的已知色情类型；

训练模块，用于根据所述数条训练数据中的各条所述训练数据中的预设数量的训练图片、对应的所述视频的已知色情类型以及预先迁移来的色情检测模型的冻结层，训练所述色情检测模型的分类层，从而实现对所述色情检测模型的训练。

本发明还提供一种视频的色情检测装置，所述装置包括：

抽取模块，用于从待检测视频中抽取预设数量的图片；

检测模块，用于根据已经训练好的色情检测模型和所述预设数量的图片，检测所述待检测视频是否为色情视频；所述色情检测模型包括预先迁移来的冻结层和训练好的分类层，使得采用训练数据对所述色情检测模型训练时，仅对所述分类层进行训练，便能够实现对所述色情检测模型的训练。.

本发明还提供一种计算设备，包括：

处理器；以及

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如上任何一项所述的方法。

本发明还提供一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如上任一项所述的方法。

本发明的色情检测模型的训练方法及装置、计算机设备及可读介质，通过采用上述方式训练时，由于采用迁移来的视频的色情检测模型的冻结层，其中的参数已固定，不用训练，而仅仅训练视频的色情检测模型的分类层的参数，相对于训练视频的整个色情检测模型而言，需要调整的模型参数较少，从而能够大幅提高训练速度，缩短视频的训练时长，减少参数调优的成本。

附图说明

通过结合附图对本公开示例性实施方式进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施方式中，相同的参考标号通常代表相同部件。

图1为本发明的视频的色情检测模型的训练方法实施例的流程图。

图2为本实施例的视频的色情检测模型的结构示意图。

图3为本发明的视频的色情检测方法实施例的流程图。

图4为本发明的视频的色情检测模型的训练装置实施例一的结构示意图。

图5为本发明的视频的色情检测模型的训练装置实施例二的结构示意图。

图6为本发明的视频的色情检测装置实施例的结构示意图。

图7示出了根据本发明一实施例可用于实现上述方法实施例的方法的计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式，然而应该理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

目前，在视频的色情检测领域中，都是通过从待检测的视频中抽取多张图片，然后基于抽取的多张图片，采用色情检测模型对抽取的多张图片进行分析，以预测该待检测的视频是否为色情视频。例如现有的常见技术包括GoogLeNet、ResNet、Xeception等，都是采用该种方式来实现，现有技术在鉴别能力上均有较好的表现，但在业务应用的过程中，存在色情检测模型训练时间较长、参数调优成本较高等问题需要解决，为保证产品业务能更快更好适应不断变化的视频生态，需要对算法迭代的成本有更高的要求。因此，亟需提供一种训练时间较短、参数调优成本更低的色情检测模型的训练方案。

为解决上述色情检测模型中训练时间较长、参数调优成本较高等问题，本申请可以基于TensorFlow对原始训练数据进行迁移学习。在目前常用的图像识别模型中，模型参数将可能数以百万计，从神经网络模型的输入层到输出层之间的参数重训练需要依赖大量的标注数据、较长的训练时间及大量的计算资源，因此会存在训练时间较长、参数调优成本较高等问题。与之相比，本申请的迁移学习可以通过抽取已在相近任务上训练过的模型的一部分，在新模型上重复使用，并在神经网络模型的顶层训练新的分类层，以此大幅减少神经网络模型的训练时长和参数调优成本。

另外，需要注意的是，本申请中需要选用与当前任务相近的图像识别任务中的模型，否则获取的图像信息将难以有效区分新的分类类别。经过大量的实验验证，在相近的分类任务中，保持神经网络模型的底层特征不变也能够获取较好的分类效果。

图1为本发明的视频的色情检测模型的训练方法实施例的流程图。如图1所示，本实施例的视频的色情检测模型的训练方法，具体可以包括如下步骤：

S100、从视频的色情类型已知的视频库中采集数条训练数据，各条训练数据中包括从对应的视频中抽取的一组预设数量的训练图片和对应的视频的已知色情类型；

本实施例的视频的色情检测模型的训练方法的执行主体为视频的色情检测模型的训练装置，该视频的色情检测模型的训练装置可以设置在一个计算机实体上来运行，以实现视频的色情检测模型的训练；或者该视频的色情检测模型的训练装置也可以为软件集成的应用，运行在计算机上的上，实现对视频的色情检测模型的训练。

本实施例的视频的色情检测模型的训练方法，在训练时，首先需要从视频库中采集数条训练数据，具体采集时，视频库中每一条视频的色情类型也是已知的，可以作为训练数据的一部分。由于视频的色情检测具体实现时，是通过对视频中图片的色情检测来实现，因此，每一条训练数据中可以从每一视频中抽取的一组预设数量的训练图片。

例如，该步骤S100具体实现时，预先采集的视频库中可以包括有数条视频，对于任意一条视频，可以抽取一条训练数据。例如，具体可以从包括数条视频的视频库中的各条视频中，获取封面图片和多个预设时刻的图片，构成一组预设数量的训练图片，同时获取相应的视频的色情类型，一起作为该视频对应的一条训练数据，即训练数据可以包括预设数量的训练图片和对应视频的色情类型两部分信息。需要注意的是，本实施例的各条训练数据中包括的训练图片的预设数量与该视频库中视频的长度范围有关。视频的长度越长，可以取相对较多数量的图片，视频的长度越短，可以取相对较少数量的图片。例如视频库中的视频长度大于为2min左右，可以取预设数量的图片为5张，例如，可以取封面图片一张和4个预设时刻的图片。其中4个预设时刻可以取视频前半段中的4个时刻，例如可以取5s、10s、20s、60s的图片。取图片的时候，可以逐渐加大相邻图片的时间间隔，以避免获取时刻相邻较近的图片。

对于数据库中的数条视频，可以采集到数条训练数据。视频库中包括的视频的条数越多，采集的训练数据的条数越多。训练数据越多，训练的视频的色情检测模型就越准确。例如，训练时采集的训练数据可以达到20-30万，以有效地提高视频的色情检测模型检测的准确性。

S101、根据数条训练数据中的各条训练数据中的预设数量的训练图片、对应的视频的已知色情类型以及预先迁移来的色情检测模型的冻结层，训练色情检测模型的分类层，从而实现对色情检测模型的训练。

例如，图2为本实施例的视频的色情检测模型的结构示意图。如图2所示，本实施例的色情检测模型，可以包括两部分，一部分为迁移来的冻结层，另一部分为分类层，即相对于冻结层所在的原始模型而言，该分类层为需要重新训练的层，因此也可以称之为重训练层。该色情检测模型的冻结层具体可以从已经训练好的相类似的图像识别模型中迁移过来，例如，可以将相类似的图像识别模型中的输入层到瓶颈层直接迁移过来作为该色情检测模型的冻结层。这样，在训练时，色情检测模型的冻结层中的参数不需要再调整，相对于已训练好的相类似的图像识别模型，而仅需要重新训练色情检测模型的分类层，即可实现色情检测模型的训练。也就是说，在训练时，将分类层(softmax layer)以外的其他层参数进行固定，在训练过程中不断对分类层的参数进行更新，以训练色情检测模型的分类层。

由上所述，可以知道，在该步骤S101之前，还可以包括：迁移色情检测模型的冻结层。例如，该过程可以包括如下两种方式：

第一种方式：从基于ImageNet图像训练好的Inception-V3模型中迁移出输入层到瓶颈层，作为色情检测模型的冻结层。

第二种方式：从已知的Inception-V3模型中迁移出输入层到瓶颈层，作为色情检测模型的冻结层；为冻结层的参数随机配置数值。

上述第二种方式的冻结层的参数为随机配置的，相对于上述第一种方式从已经训练好的Inception-V3模型中迁移出冻结层而言，该冻结层的参数更加精准，能够助于提高后续分类层的分类精度。

实际应用中，基于ImageNet图像训练好的Inception-V3模型可以对正常视频中多个小类以及异常的色情视频中的多个小类进行识别，例如正常视频以及色情视频中的小类可以分别包括10多个、甚至20多个。这样，从Inception-V3模型中迁移来的冻结层便是基于多个小类的瓶颈层向量。例如正常视频可以被划分为11类，包括动物、宗教、Status、男性、女性、双人、多人等，而色情视频也可以被划分为11类，包括各种类型的色情视频，在此不再一一举例赘述。

在现实场景中，图片往往是多标签数据，没有特定类型，图片的画面内包含的物品也没有限制，例如可能出现动物与人并存的情况。若通过返回类目中的最高得分作为分类结果，因为其余类目均可能出现并占一定比重，将可能出现色情得分普遍偏低的情况。而累加所有色情类得分则可能导致最终的色情得分波动较大，难以制定判断阀值。

针对上述情况，需要基于瓶颈层输出的一个多分类的向量，对分类层进行训练。而分类层输出的结果为该视频是否为色情类视频，也就是说该分类层的输出可以是一个二分类。如该分类层的输出结果可以为该视频为色情类视频的概率。例如，该色情检测模型的分类层可以是基于XGBoost算法实现对视频为色情视频的概率的预测，从而可以基于多个小分类的瓶颈层输出向量，输出一个视频为色情类视频的概率。例如，可以设置输出为0时，表示该视频是正常视频，输出为1时，表示该视频时色情类视频。而实际应用中，预测结果往往不会为0或者1，往往时0-1之间的一个概率值，表示该视频为色情类视频的概率。

例如，本实施例的步骤S101，具体可以包括如下步骤：

(a)将数条训练数据中的各条训练数据中的预设数量的训练图片输入至预先迁移来的色情检测模型的冻结层进行迁移学习，获取学习后色情检测模型的冻结层输出的特征表达；

(b)根据特征表达和对应的视频的已知色情类型，训练色情检测模型的分类层。

例如，该步骤(b)具体实现时，可以先将特征表达输入至色情检测模型的分类层中，获取色情检测模型的分类层预测视频为色情视频的概率；然后根据预测的视频为色情视频的概率和视频的已知色情类型，调整色情检测模型的分类层的参数，使得预测的视频为色情视频的概率与视频的已知色情类型一致。

在实际训练的每一次训练迭代，将随机从训练数据集中选择一条训练数据，包括预设数量的训练图片和对应的视频的已知色情类型。然后将预设数量的训练图片输入至迁移来的冻结层进行迁移学习，该冻结层输出一个瓶颈层输出向量(即冻结层输出的特征表达)，并缓存。然后再从缓存中获取对应的瓶颈层输出向量，作为顶层的分类层的输入，得到预测结果后与视频的已知色情类型进行比对，判断分类层的预测结果是否与视频的已知色情类型是否一致，若不一致，调整分类层的参数，使得分类层预测的结果与视频的已知色情类型一致。采用上述训练数据集中的数条训练数据，通过上述训练方式，不断地对色情检测模型的分类层进行训练，以得到训练后的色情检测模型。

本实施例的视频的色情检测模型的训练方法，通过采用上述方式训练时，由于采用迁移来的视频的色情检测模型的冻结层，其中的参数已固定，不用训练，而仅仅训练视频的色情检测模型的分类层的参数，相对于训练视频的整个色情检测模型而言，需要调整的模型参数较少，从而能够大幅提高训练速度，缩短视频的训练时长，减少参数调优的成本。

另外，通过现有的方式训练的色情检测模型，不仅训练速度慢、训练时间长、参数调优的成本高，而且对特定类目的视频鉴别能力较弱，采用本实施例的训练方法训练的色情检测模型，能够适用于任一种类目的视频的鉴别，且经过试验验证，对任何特定类目的视频鉴别能力都较强。

图3为本发明的视频的色情检测方法实施例的流程图。如图3所示，本实施例的视频的色情检测方法，具体可以包括如下步骤：

S200、从待检测视频中抽取预设数量的图片；

例如，从待检测视频中抽取预设数量的图片，具体可以包括：从待检测视频中获取封面图片和多个预设时刻的图片，得到预设数量的图片，详细可以参考上述图1所示实施例的获取预设数量的图片的相关方式，在此不再赘述。

S201、根据已经训练好的色情检测模型和预设数量的图片，检测待检测视频是否为色情视频；其中，色情检测模型包括预先迁移来的冻结层和训练好的分类层，使得采用训练数据对色情检测模型训练时，仅对分类层进行训练，便能够实现对色情检测模型的训练。.

本实施例的视频的色情检测方法在检测时所采用的已经训练好的视频的色情检测模型包括两部分：一部分为预先迁移来的冻结层，这部分不用训练；另一部分为分类层，为视频的色情检测模型训练时需要训练的部分。本实施例的已经训练好的视频的色情检测模型，在训练时，具体可以采用上述图1所示实施例的训练方法得到，详细可以参考上述图1所示实施例的相关记载，在此不再赘述。

本实施例的视频的色情检测方法，根据已经训练好的色情检测模型和预设数量的图片，检测待检测视频是否为色情视频，具体可以采用如下方式：具体可以将预设数量的图片输入至色情检测模型中，色情检测模型会输出待检测视频为色情视频的概率，进而获取色情检测模型预测待检测视频为色情视频的概率。然后检测色情视频的概率是否大于预设的概率阈值，若是，确定待检测视频为色情视频；否则确定待检测视频为正常视频。本实施例的概率阈值可以根据经验来设置，例如可以为0.7、0.8、0.85或者其他0.5-1之间的其他数值。

本实施例的视频的色情检测方法，通过采用迁移来的冻结层和训练好后的分类层共同构成的色情检测模型来对待检测视频进行检测，能够有效地提高色情视频检测的效率和准确性。且本实施例的视频的色情检测方法能够适用于任一种类目的视频的鉴别，且经过试验验证，对任何特定类目的视频鉴别能力都较强。

图4为本发明的视频的色情检测模型的训练装置实施例一的结构示意图。如图4所示，本实施例的视频的色情检测模型的训练装置，包括：

采集模块10用于从视频的色情类型已知的视频库中采集数条训练数据，各条训练数据中包括从对应的视频中抽取的一组预设数量的训练图片和对应的视频的已知色情类型；

训练模块11用于根据采集模块10采集的数条训练数据中的各条训练数据中的预设数量的训练图片、对应的视频的已知色情类型以及预先迁移来的色情检测模型的冻结层，训练色情检测模型的分类层，从而实现对色情检测模型的训练。

本实施例的视频的色情检测模型的训练装置，通过采用上述模块实现视频的色情检测模型的训练，与上述相关方法实施例的实现原理以及技术效果相同，详细可以参考上述相关方法实施例的记载，在此不再赘述。

图5为本发明的视频的色情检测模型的训练装置实施例二的结构示意图。如图5所示，本实施例的视频的色情检测模型的训练装置，在上述图4所示实施例的技术方案的基础上，进一步更加详细地介绍本发明的技术方案。

如图5所示，本实施例的视频的色情检测模型的训练装置中，训练模块11，具体可以包括：

学习单元111用于将采集模块10采集的数条训练数据中的各条训练数据中的预设数量的训练图片输入至预先迁移来的色情检测模型的冻结层进行迁移学习，获取学习后色情检测模型的冻结层输出的特征表达；

训练单元112用于根据学习单元111得到的特征表达和采集模块采集的训练数据中对应的视频的已知色情类型，训练色情检测模型的分类层。

进一步可选地，本实施例的视频的色情检测模型的训练装置中，训练单元112，具体用于：

将特征表达输入至色情检测模型的分类层中，获取色情检测模型的分类层预测视频为色情视频的概率；

根据预测的视频为色情视频的概率和视频的已知色情类型，调整色情检测模型的分类层的参数，使得预测的视频为色情视频的概率与视频的已知色情类型一致。

进一步可选地，本实施例的视频的色情检测模型的训练装置中，色情检测模型的分类层是基于XGBoost算法实现对视频为色情视频的概率的预测。

进一步可选地，如图5所示，本实施例的视频的色情检测模型的训练装置中，还包括：

迁移模块12用于从基于ImageNet图像训练好的Inception-V3模型中迁移出输入层到瓶颈层，作为色情检测模型的冻结层。

或者对应地，迁移模块12用于：

从已知的Inception-V3模型中迁移出输入层到瓶颈层，作为色情检测模型的冻结层；

为冻结层的参数随机配置数值。

对应地，学习单元111用于将采集模块10采集的数条训练数据中的每一条训练数据中的预设数量的训练图片输入至迁移模块12预先迁移来的色情检测模型的冻结层进行迁移学习，获取学习后色情检测模型的冻结层输出的特征表达。

进一步可选地，本实施例的视频的色情检测模型的训练装置中，采集模块10用于：

从视频的色情类型已知的视频库中的各条视频中，获取封面图片和多个预设时刻的图片，构成一组预设数量的训练图片，同时获取相应的视频的色情类型，一起作为视频对应的一条训练数据。

图6为本发明的视频的色情检测装置实施例的结构示意图。如图6所示，本实施例的视频的色情检测装置，具体可以包括：

抽取模块20用于从待检测视频中抽取预设数量的图片；

检测模块21用于根据已经训练好的色情检测模型和抽取模块20抽取的预设数量的图片，检测待检测视频是否为色情视频；色情检测模型包括预先迁移来的冻结层和训练好的分类层，使得采用训练数据对色情检测模型训练时，仅对分类层进行训练，便能够实现对色情检测模型的训练。.

进一步可选地，本实施例的视频的色情检测装置中，抽取模块20用于从待检测视频中获取封面图片和多个预设时刻的图片，得到预设数量的图片。

进一步可选地，本实施例的视频的色情检测装置中，检测模块21用于：

将抽取模块20抽取的预设数量的图片输入至色情检测模型中，获取色情检测模型预测待检测视频为色情视频的概率；

检测概率是否大于预设的概率阈值，若是，确定待检测视频为色情视频。

本实施例的视频的色情检测装置，通过采用上述模块实现视频的色情检测，与上述相关方法实施例的实现原理以及技术效果相同，详细可以参考上述相关方法实施例的记载，在此不再赘述。

图7示出了根据本发明一实施例可用于实现上述方法实施例的方法的计算设备的结构示意图。具体地，图7所示的计算设备可以用于实现上述图1所示实施例的视频的色情检测模型的训练方法或者图3所示实施例的视频的色情检测方法。

参见图7，计算设备1000包括存储器1010和处理器1020。

处理器1020可以是一个多核的处理器，也可以包含多个处理器。在一些实施例中，处理器1020可以包含一个通用的主处理器以及一个或多个特殊的协处理器，例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中，处理器1020可以使用定制的电路实现，例如特定用途集成电路(ASIC，Application Specific Integrated Circuit)或者现场可编程逻辑门阵列(FPGA，Field Programmable Gate Arrays)。

存储器1010可以包括各种类型的存储单元，例如系统内存、只读存储器(ROM)，和永久存储装置。其中，ROM可以存储处理器1020或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中，永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中，永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备，例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外，存储器1010可以包括任意计算机可读存储媒介的组合，包括各种类型的半导体存储芯片(DRAM，SRAM，SDRAM，闪存，可编程只读存储器)，磁盘和/或光盘也可以采用。在一些实施方式中，存储器1010可以包括可读和/或写的可移除的存储设备，例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM，双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器1010上存储有可执行代码，当可执行代码被处理器1020处理时，可以使处理器1020执行上文述及的视频的色情检测模型的训练方法或者视频的色情检测方法。

上文中已经参考附图详细描述了根据本发明的视频的色情检测模型的训练方法或者视频的色情检测方法。

此外，根据本发明的方法还可以实现为一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。

或者，本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质)，其上存储有可执行代码(或计算机程序、或计算机指令代码)，当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时，使所述处理器执行根据本发明的上述方法的各个步骤。

本领域技术人员还将明白的是，结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种视频的色情检测模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，根据所述数条训练数据中的各条所述训练数据中的预设数量的训练图片、对应的所述视频的色情类型以及预先迁移来的色情检测模型的冻结层，训练所述色情检测模型的分类层，包括：

将所述数条训练数据中的各条训练数据中的所述预设数量的训练图片输入至预先迁移来的所述色情检测模型的冻结层进行迁移学习，获取学习后所述色情检测模型的冻结层输出的特征表达；

根据所述特征表达和对应的所述视频的已知色情类型，训练所述色情检测模型的分类层。

3.根据权利要求2所述的方法，其特征在于，根据所述特征表达和对应的所述视频的已知色情类型，训练所述色情检测模型的分类层，包括：

将所述特征表达输入至所述色情检测模型的分类层中，获取所述色情检测模型的分类层预测所述视频为色情视频的概率；

根据预测的所述视频为色情视频的概率和所述视频的已知色情类型，调整所述色情检测模型的分类层的参数，使得预测的所述视频为色情视频的概率与所述视频的已知色情类型一致。

4.根据权利要求3所述的方法，其特征在于，所述色情检测模型的分类层是基于XGBoost算法实现对所述视频为色情视频的概率的预测。

5.根据权利要求1所述的方法，其特征在于，根据所述数条训练数据中的各条所述训练数据中的预设数量的训练图片、对应的所述视频的已知色情类型以及预先迁移来的色情检测模型的冻结层，训练所述色情检测模型的分类层之前，所述方法还包括：

从基于ImageNet图像训练好的Inception-V3模型中迁移出输入层到瓶颈层，作为所述色情检测模型的冻结层。

6.根据权利要求1所述的方法，其特征在于，根据所述数条训练数据中的各条所述训练数据中的预设数量的训练图片、对应的所述视频的已知色情类型以及预先迁移来的色情检测模型的冻结层，训练所述色情检测模型的分类层之前，所述方法还包括：

从已知的Inception-V3模型中迁移出输入层到瓶颈层，作为所述色情检测模型的冻结层；

为所述冻结层的参数随机配置数值。

7.根据权利要求1-6任一所述的方法，其特征在于，从视频的色情类型已知的视频库中采集数条训练数据，包括：

从视频的色情类型已知的所述视频库中的各条视频中，获取封面图片和多个预设时刻的图片，构成一组预设数量的训练图片，同时获取相应的所述视频的色情类型，一起作为所述视频对应的一条训练数据。

8.一种视频的色情检测方法，其特征在于，所述方法包括：

从待检测视频中抽取预设数量的图片；

根据已经训练好的色情检测模型和所述预设数量的图片，检测所述待检测视频是否为色情视频；所述色情检测模型包括预先迁移来的冻结层和训练好的分类层，使得采用训练数据对所述色情检测模型训练时，仅对所述分类层进行训练，便能够实现对所述色情检测模型的训练。.

9.根据权利要求8所述的方法，其特征在于，从待检测视频中抽取预设数量的图片，包括：

从所述待检测视频中获取封面图片和多个预设时刻的图片，得到所述预设数量的图片。

10.根据权利要求8述的方法，其特征在于，根据已经训练好的色情检测模型和所述预设数量的图片，检测所述待检测视频是否为色情视频，包括：

将所述预设数量的图片输入至所述色情检测模型中，获取所述色情检测模型预测所述待检测视频为色情视频的概率；

检测所述概率是否大于预设的概率阈值，若是，确定所述待检测视频为色情视频。

11.一种视频的色情检测模型的训练装置，其特征在于，所述装置包括：

12.根据权利要求11所述的装置，其特征在于，所述训练模块，包括：

学习单元，用于将所述数条训练数据中的各条训练数据中的所述预设数量的训练图片输入至预先迁移来的所述色情检测模型的冻结层进行迁移学习，获取学习后所述色情检测模型的冻结层输出的特征表达；

训练单元，用于根据所述特征表达和对应的所述视频的已知色情类型，训练所述色情检测模型的分类层。

13.根据权利要求12所述的装置，其特征在于，所述训练单元，用于：

14.根据权利要求13所述的装置，其特征在于，所述色情检测模型的分类层是基于XGBoost算法实现对所述视频为色情视频的概率的预测。

15.根据权利要求11所述的装置，其特征在于，所述装置还包括：

迁移模块，用于从基于ImageNet图像训练好的Inception-V3模型中迁移出输入层到瓶颈层，作为所述色情检测模型的冻结层。

16.根据权利要求11所述的装置，其特征在于，所述迁移模块，用于：

为所述冻结层的参数随机配置数值。

17.根据权利要求11-16任一所述的装置，其特征在于，所述采集模块，用于：

18.一种视频的色情检测装置，其特征在于，所述装置包括：

抽取模块，用于从待检测视频中抽取预设数量的图片；

检测模块，用于根据已经训练好的色情检测模型和所述预设数量的图片，检测所述待检测视频是否为色情视频；所述色情检测模型包括预先迁移来的冻结层和训练好的分类层，使得采用训练数据对所述色情检测模型训练时，仅对所述分类层进行训练，便能够实现对所述色情检测模型的训练。

19.根据权利要求18所述的装置，其特征在于，所述抽取模块，用于从所述待检测视频中获取封面图片和多个预设时刻的图片，得到所述预设数量的图片。

20.根据权利要求18述的装置，其特征在于，所述检测模块，用于：

21.一种计算设备，包括：

处理器；以及

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1-7中任何一项所述的方法，或者执行如权利要求8-10中任何一项所述的方法。

22.一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1至7中任一项所述的方法，或者执行如权利要求8-10中任何一项所述的方法。