CN110414581B

CN110414581B - 图片检测方法和装置、存储介质及电子装置

Info

Publication number: CN110414581B
Application number: CN201910656512.6A
Authority: CN
Inventors: 陈志博; 石楷弘
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-07-19
Filing date: 2019-07-19
Publication date: 2023-05-30
Anticipated expiration: 2039-07-19
Also published as: CN110414581A

Abstract

本发明公开了一种图片检测方法和装置、存储介质及电子装置。其中，该方法包括：获取待检测的目标图片；将目标图片输入至图片识别模型中，获得图片识别模型输出的目标图片的类别，其中，图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型；根据目标图片的类别对目标图片进行检测，得到检测结果，其中，检测结果用于指示目标图片是否为异常图片。本发明解决了通过图片识别模型进行检测的准确度不高的技术问题。本发明实施例的图片检测方法中，通过机器学习的方法训练获得图片识别模型，从而对图片类别进行识别。

Description

图片检测方法和装置、存储介质及电子装置

技术领域

本发明涉及计算机领域，具体而言，涉及一种图片检测方法和装置、存储介质及电子装置。

背景技术

随着互联网技术的发展，用户可以在网络上获取或发布各种各样的信息，例如搜索、浏览或发布各种图片。但是，对于部分类别的图片并不适合在网络上流传，例如色情图片。对于这些图片是否为色情等异常图片的检测，发明人在相关技术中使用神经网络模型进行识别检测。但是现有的神经网络模型的识别准确度与神经网络模型的训练直接相关，在相关技术中通过大量图片训练获得的神经网络模型识别准确度不高。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种图片检测方法和装置、存储介质及电子装置，以至少解决通过图片识别模型进行检测的准确度不高的技术问题。

根据本发明实施例的一个方面，提供了一种图片检测方法，包括：获取待检测的目标图片；将目标图片输入至图片识别模型中，获得图片识别模型输出的目标图片的类别，其中，图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在多轮训练中的当前轮中使用多个第一样本图片集合中与当前轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源大于在多轮训练中当前轮的上一轮中使用多个第一样本图片集合中与上一轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源；根据目标图片的类别对目标图片进行检测，得到检测结果，其中，检测结果用于指示目标图片是否为异常图片。

根据本发明实施例的另一方面，还提供了一种图片检测装置，包括：第一获取单元，用于获取待检测的目标图片；第二获取单元，用于将目标图片输入至图片识别模型中，获得图片识别模型输出的目标图片的类别，其中，图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在多轮训练中的当前轮中使用多个第一样本图片集合中与当前轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源大于在多轮训练中当前轮的上一轮中使用多个第一样本图片集合中与上一轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源；检测单元，用于根据目标图片的类别对目标图片进行检测，得到检测结果，其中，检测结果用于指示目标图片是否为异常图片。

根据本发明实施例的又一方面，还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述图片检测方法。

根据本发明实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述的图片检测方法。

在本发明实施例中，采用获取待检测的目标图片，将目标图片输入至图片识别模型中，获得图片识别模型的输出的目标图片的类别，根据目标图片的类型对目标图片进行检测得到检测结果的方式，通过多个第一样本图片集合对初始图片识别模型进行多轮训练得到图片识别模型，且在多轮训练中当前轮训练使用的样本图片集合比上一轮训练所使用的样本图片集合的识别难度高，所消耗的运算资源相应高于上一轮，从而通过先使用识别难度低，也就是所消耗的运算资源低的样本图片集进行训练，并在多轮训练中提高所使用的样本图片集合中的样本图片的识别难度，达到了提高训练获得的图片识别模型的识别准确度的目的，从而实现了提高对图片进行检测的准确度的技术效果，进而解决了通过图片识别模型进行检测的准确度不高的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的图片检测方法的应用环境的示意图；

图2是根据本发明实施例的一种可选的图片检测方法的流程示意图；

图3是根据本发明实施例的一种深度残差网络模型的示意图；

图4是根据本发明实施例的另一种可选的图片检测方法的流程示意图；

图5是根据本发明实施例的又一种可选的图片检测方法的流程示意图；

图6是根据本发明实施例的一种可选的图片检测装置的结构示意图；

图7是根据本发明实施例的另一种可选的图片检测装置的结构示意图；

图8是根据本发明实施例的一种可选的电子装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本发明实施例的图片检测方法中，通过机器学习的方法训练获得图片识别模型，从而对图片类别进行识别。

根据本发明实施例的一个方面，提供了一种图片检测方法，可选地，作为一种可选的实施方式，上述图片检测方法可以但不限于应用于如图1所示的环境中。

终端设备102可以通过处理器106执行步骤S110，获取待检测的目标图片；S112，将目标图片输入至图片识别模型中，获得图片识别模型输出的目标图片的类别，其中，图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在多轮训练中的当前轮中使用多个第一样本图片集合中与当前轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源大于在多轮训练中当前轮的上一轮中使用多个第一样本图片集合中与上一轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源；S114，根据目标图片的类别对目标图片进行检测，得到检测结果，其中，检测结果用于指示目标图片是否为异常图片。这里，通过多个第一样本图片集合对初始图片识别模型进行多轮训练得到图片识别模型，且在多轮训练中当前轮训练使用的样本图片集合比上一轮训练所使用的样本图片集合的识别难度高，所消耗的运算资源相应高于上一轮，从而通过先使用识别难度低，也就是所消耗的运算资源低的样本图片集进行训练，并在多轮训练中提高所使用的样本图片集合中的样本图片的识别难度，从而可以提高训练获得的图片识别模型的识别准确度。这里，终端设备102还可以通过显示器108显示目标图片，通过存储器104存储图片识别模型。

可以理解的是，上述待检测的目标图片可以是用户设备上的目标应用通过网络传输至终端设备102，由终端设备102对目标图片进行检测。这里的目标应用可以是社交应用，目标应用可以在登录该目标应用的帐号发送请求发布目标图片的情况下，请求终端设备102对目标图片进行检测。

可选地，在本实施例中，上述图片检测方法可以但不限于应用于终端设备102中，用于协助目标应用对所发布的目标图片进行检测。其中，上述目标应用可以但不限于运行在用户设备中，该用户设备可以但不限于为手机、平板电脑、笔记本电脑、PC机等支持运行应用客户端的终端设备。上述服务器102和用户设备可以但不限于通过网络实现数据交互，上述网络可以包括但不限于无线网络或有线网络。其中，该无线网络包括：蓝牙、WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于：广域网、城域网、局域网。上述仅是一种示例，本实施例中对此不作任何限定。

可选地，作为一种可选的实施方式，如图2所示，上述图片检测方法包括：

S202，获取待检测的目标图片；

S204，将目标图片输入至图片识别模型中，获得图片识别模型输出的目标图片的类别，其中，图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在多轮训练中的当前轮中使用多个第一样本图片集合中与当前轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源大于在多轮训练中当前轮的上一轮中使用多个第一样本图片集合中与上一轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源；

S206，根据目标图片的类别对目标图片进行检测，得到检测结果，其中，检测结果用于指示目标图片是否为异常图片。

在本发明实施例中，采用获取待检测的目标图片，将目标图片输入至图片识别模型中，获得图片识别模型的输出的目标图片的类别，根据目标图片的类型对目标图片进行检测得到检测结果的方式，通过多个第一样本图片集合对初始图片识别模型进行多轮训练得到图片识别模型，且在多轮训练中当前轮训练使用的样本图片集合比上一轮训练所使用的样本图片集合的识别难度高，所消耗的运算资源相应高于上一轮，从而通过先使用识别难度低，也就是所消耗的运算资源低的样本图片集进行训练，并在多轮训练中提高所使用的样本图片集合中的样本图片的识别难度，从而可以有效提高训练获得的图片识别模型的识别准确度，进而提高了对目标图片进行检测的准确度。这里的识别难度，也就是对样本图片进行识别所消耗的运算资源可以设置为简单、中等、困难。相应的第一样本图片集合的数量为3个，这里对困难相对应的第一样本图片集合中的样本图片进行识别所消耗的运算资源大于中等相对应的第一样本图片集合中的样本图片进行识别所消耗的运算资源，对中等相对应的第一样本图片集合中的样本图片进行识别所消耗的运算资源大于简单相对应的第一样本图片集合中的样本图片进行识别所消耗的运算资源。当然可以理解的是，上述举例说明，对于第一样本图片集合的数量本发明实施例并不作出限定。

本发明实施例中的图片识别模型可以对输入的图片的类别进行识别，相应的在本发明可选实施例中，对图片识别模型进行训练的多个第一样本图片集合中可以包括多个类别的样本图片，从而便于更好的对图片识别模型进行训练。对于图片识别模型所能识别的图片类型可以包括：暴恐、涉政、色情、正常等。可以理解的是，在本发明实施例中，若目标图片的类别为包括暴恐、涉政、色情的第一目标类别，则可以得到目标图片为异常图片的检测结果。

可选的，在获取待检测的目标图片之前，方法还包括：获取第二样本图片集合，其中，第二样本图片集合中的每个样本图片的类别已被确定；使用第二样本图片集合中的样本图片对原始图片识别模型进行训练，获得训练后的初始图片识别模型；获取多个第一样本图片集合，其中，多个第一样本图片集合中的每个样本图片的类别未被确定；使用多个第一样本图片集合对初始图片识别模型进行训练，获得训练后的图片识别模型。

在本发明实施例中，获取第二样本图片集合，使用第二样本图片集合对原始图片识别模型进行训练，这里的第二样本图片集合中的每个样本图片的类别已被确定，从而可以获得训练后的初始图片识别模型。可以理解的是，这里的第二样本图片集合中的图片可以是通过人工标注的方式对图片的类别进行打标，从而便于对原始图片识别模型进行训练。再通过第一样本图片集合中的样本图片对初始图片识别模型进行训练，从而可以提高模型训练的效率。

可选的，上述获取多个第一样本图片集合，包括：获取多个第三样本图片集合，其中，第三样本图片集合与图片识别模型所识别的图片类别一一对应，每一个第三样本图片集合中的样本图片根据与第三样本图片集合相对应的目标关键词搜索获得，每个第三样本图片集合相对应的目标关键词与第三样本图片集合所对应的图片类别相匹配，每个第三样本图片集合中的样本图片的类别均未被确定；

重复执行以下操作，直至确定出每个第三样本图片集合所对应的多个类型的子集合，其中，在执行一次以下操作的过程中将执行以下操作的第三样本图片集合确定为目标样本图片集合：确定出目标样本图片集合中的每个样本图片的样本密度，其中目标样本图片集合中的两个样本图片所对应的样本密度用于指示两个样本图片之间的相似度；根据目标密度聚类算法和目标样本图片集合中的每个样本图片的样本密度，对目标样本图片集合中的样本图片进行聚类，获得多个类型的子集合，其中，对不同类型的子集合中的样本图片分别进行图片类别的识别所消耗的运算资源的差值大于阈值；

将每个第三样本图片集合所对应的多个类型的子集合中相同类型的子集合聚合，获得多个第一样本图片集合。

这里，获取多个第三样本图片集合，并对第三样本图片集合进行处理，将每个第三样本图片集合所对应的多个类型的子集合中相同类型的子集合聚合，获得多个第一样本图片集合。可以理解的是，在对模型进行训练的过程中需要大量的样本，从而便于模型的学习。为了满足模型训练的需要，通过对每个样本图片进行人工打标的方式显然所需耗费的人力资源以及所需的时间过长。故而，在本发明实施例中，所获取的第三样本图片集合中的样本图片根据与第三样本图片集合相对应的目标关键词搜索获得，每个第三样本图片集合相对应的目标关键词与第三样本图片集合所对应的图片类别相匹配。例如，对于一个第三样本图片集合，其可以与色情这一维度的图片类别相对应，可以通过搜索与色情图片类别相匹配的目标关键词，例如裸体等搜索获得该第三样本图片集合，从而使得得到的第三样本图片集合中的每个样本图片的类别未知，但是又与色情这一维度有关，从而无需人工对每一张样本图片进行打标，有效提高了模型训练的效率。对于目标密度聚类算法可以是模糊C-均值聚类算法(fuzzy c-means algorithm)。当然可以理解的，本发明并不对所使用的密度聚类算法作出限定。

对于确定出每个第三样本图片集合所对应的多个类型的子集合下面通过举例进行说明。继续以上述中的色情图片类别对应的第三样本图片集合为例，对该第三样本图片集合中的样本图片的样本密度进行确定，从而根据目标密度聚类算法和每个样本图片的样本密度进行聚类，从而可以得到多个聚类后的子集合。在每一个子集合中的样本图片之间较为相似，例如，同样是色情图片，有些图片的线条较为简单，对这些图片进行识别所消耗的运算资源相对较少，有些图片的线条复杂，对这些线条复杂的图片进行所消耗的运算资源相对较多。故而，通过对第三样本图片集合中的样本图片进行聚类，可以将相似的样本图片聚在一个子集合中。相对应的，对不同子集合中的样本图片进行识别所消耗的运算资源的差值较大，而相同子集合中的样本图片进行识别所消耗的运算资源差值较小。以上述对样本图片进行识别所消耗的运算资源可以设置为简单、中等、困难为例，可以通过聚类算法将每个第三样本图片集合聚类为3个子集合，从而每一个子集合分别对应简单、中等、困难。进而将不同的第三样本图片集合中的简单对应的子集合聚合、中等对应的子集合聚合、困难对应的子集合聚合，从而得到第一样本图片集合。可以理解的是，可以通过选取不同的密度聚类算法改变聚类获得的子集合的数量。

可选的，确定出目标样本图片集合中的每个样本图片的样本密度，包括：重复执行以下操作，直至确定出目标样本图片集合中的每个样本图片的样本密度，其中，在执行一次以下操作的过程中将执行操作的样本图片确定为目标样本图片：确定目标样本图片与目标样本图片集中除目标样本图片之外的每个样本图片之间的第一欧式距离；将所获得的与目标样本图片集合中的样本图片的数量相同数量的第一欧式距离中小于或等于目标欧式距离的第一欧式距离的数量，确定为目标样本图片的样本密度。

可选的，将所获得的与目标样本图片集合中的样本图片的数量相同数量的第一欧式距离中小于或等于目标欧式距离的第一欧式距离的数量，确定为目标样本图片的样本密度之前，方法还包括：获取目标样本图片集合中的任意两个样本图片之间的第二欧式距离；对所获得的多个第二欧式距离进行排序，将排序中位于目标次序的第二欧式距离确定为目标欧式距离。

这里，对于目标欧式距离可以将样本集合中的每个样本图片之间的欧式距离进行排序，选取目标次序出的欧式距离为目标距离。例如，对每个样本图片之间的欧式距离按照升序的方式进行排序，可以将序列中位于整个序列比例的60％处的欧式距离确定为目标欧式距离。可以理解的是，上述数值仅为举例说明，本发明并不对具体的数值作出限定。

可选的，使用多个第一样本图片集合对初始图片识别模型进行训练，获得训练后的图片识别模型，包括：重复执行以下操作，直至多个第一样本图片集合中的每一个第一样本图片集合均被使用对初始图片识别模型进行训练，其中，在执行一次以下操作的过程中将执行操作的第一样本图片集合确定为目标样本图片集合：获取目标样本图片集合，其中，使用目标样本图片集合中的样本图片进行训练所消耗的运算资源大于上一轮次中使用的样本图片进行训练所消耗的运算资源，且小于第一样本图片集合中除目标样本图片集合以外的样本图片集合中的样本图片进行训练所消耗的运算资源；利用目标样本图片集合，以及上一轮训练所使用的样本图片集合，对上一轮训练后的初始图片识别模型进行训练，获得本次训练后的初始图片识别模型。在本发明实施例中，通过使用所消耗的运算资源大于上一轮所使用的样本图片所消耗的运算资源的样本图片集合，以及上一轮训练所使用的样本图片集合进行本次的训练，从而即使得训练的难度有所增加，又通过增加上一轮所使用的样本图片集合增大了训练数据，可以有效提高模型训练的效果，提高训练后获得的图片识别模型对图片进行识别的准确率。以上述对样本图片进行识别所消耗的运算资源可以设置为简单、中等、困难为例进行说明，可以在第一轮训练中使用简单难度所对应的第一样本图片集合对初始图片识别模型进行训练；在训练完成后，使用中等难度所对应的第一样本图片集合，以及简单难度所对应的第一样本图片集合对上一轮训练后的初始图片识别模型进行训练；在训练完成后，使用困难难度所对应的第一样本图片集合，以及中等难度所对应的第一样本图片集合和简单难度所对应的第一样本图片集合对上一轮训练后的初始图片识别模型进行训练，在训练后获得图片识别模型。从而通过依次增加所使用的样本图片的识别难度，对初始图片识别模型进行循序渐进的训练，从而提高训练获得的图片识别模型对图片进行识别的准确度。

如图4所示的，在本发明可选实施例中，上述步骤S202-S204之后，方法还可以包括：

S402，获取目标图片上的文字信息；

S404，将文字信息输入至向量模型中，获得向量模型输出的目标向量，其中，目标向量用于指示文字信息是否为异常信息；

S406，根据目标图片的类别和目标向量，对目标图片进行检测，得到检测结果。

在本发明实施例中，发明人考虑到在相关技术中，图片本身可能并不是异常图片，但是可能被加上一些文字，例如“访问xx网址观看xx电源”，从而在正常图片上增加访问色情网站的文字信息，从而使得图片也属于异常图片，此时若仅对图片本身进行识别则可能无法得到正确的检测结果。故而，在本发明实施例中，还对目标图片上的文字信息进行获取，将文字信息输入至向量模型中，获得文字信息对应的目标向量，从而在对目标图片进行检测时，可以通过图片的类别和目标向量检测获得检测结果。

下面结合图5，对本发明实施例进行举例说明。

S502，对于待检测的目标图像，通过长短期记忆网络(Long Short Term Memorynetworks)模型对图片进行检测，检测图片是否为异常图像；可以理解的是，上述模型可以但不限于长短期记忆网络模型，还可以是深度残差网络模型或其他神经网络模型；

S504，对图像中的文字进行检测；这里，可以对目标图像中是否存在文字信息进行检测；

S506，对文字进行识别，获得文字信息；

S508，对于文字信息，通过深度残差网络模型ResNrt进行检测；可以理解的是，上述模型可以但不限于深度残差网络模型，还可以是长短期记忆网络模型或其他神经网络模型；

S510，获得检测结果，根据分别对图片和文字信息检测获得的图片类别和文字信息检测得到的目标向量，判断图片是否异常，也就是判断图片是否是违规图片。

可选的，上述将文字信息输入至向量模型中，获得向量模型输出的目标向量可以包括：对文字信息进行分词处理，并将处理结果输入至向量模型，从而得到向量模型输出的目标向量。这里，向量模型可以对分词后的词组进行识别，从而提高输出的用于指示文字信息是否为异常信息的目标向量的准确度。可选的，对文字信息进行分词处理后，还可以进行预处理，例如合并、过滤处理等，从而将预处理后的处理结果输入至向量模型，减少向量模型所需的运算量。

可选的，根据目标图片的类别和目标向量，对目标图片进行检测，得到检测结果，包括：在目标图片的类别为第一目标类别，或目标向量大于或等于阈值的情况下，得到第一检测结果，其中，第一检测结果用于指示目标图片被确定为异常图片；在目标图片的类别为第二目标类别，且目标向量小于阈值的情况下，得到第二检测结果，其中，第二检测结果用于指示目标图片未被确定为异常图片。在本发明实施例中，对于向量模型输出的目标向量可以用于判断输入的文字信息是否异常，在输出的目标向量大于阈值的情况下，可以确定该文字信息异常。在本发明实施例中，第一目标类别为异常图片类别，例如上述举例中提及的色情、暴恐、恐怖、涉政。第二目标类别为正常图片类别。在目标图片的目标向量大于或等于阈值的情况下，或者目标图片的类别为第一目标类别，可以得到目标图片被确定为异常图片的第一检测结果。

可选的，在获取待检测的目标图片之前，方法还包括：获取文字集合；使用文字集合中的文字对深度残差网络模型进行训练，获得训练后的深度残差网络模型，其中，深度残差网络模型包括多个深度残差网络单元，每个深度残差网络单元中添加有残差模块，残差模块用于将深度残差网络单元前一时刻的输入值叠加至本次输出的结果中；将训练后的深度残差网络模型确定为向量模型。在本发明实施例中，深度残差网络模型包括多个深度残差网络单元，每个深度残差网络单元中添加有残差模块，残差模块用于将深度残差网络单元前一时刻的输入值叠加至本次输出的结果中。也就是用残差来重构网络的映射，就是把输入值再次引入到结果，这样堆叠层的权重会趋向于零，深度残差网络学习起来会简单，能更加方便完成训练。如图3所示的，将x经过网络映射为F(x)+x，那么网络的映射F(x)自然就趋向于F(x)＝0。所示中的残差模块主体包括：恒等变换(identity mapping)和平原层(weight layer)。通过在每个深度残差网络单元中设置残差模块，梯度可以在这个变体中通过直连shortcut无阻碍地传播到前面的任何一层，从而提升了深度残差网络模型的性能。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

根据本发明实施例的另一个方面，还提供了一种用于实施上述图片检测方法的图片检测装置。如图6所示，该装置包括：

第一获取单元602，用于获取待检测的目标图片；

第二获取单元604，用于将目标图片输入至图片识别模型中，获得图片识别模型输出的目标图片的类别，其中，图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在多轮训练中的当前轮中使用多个第一样本图片集合中与当前轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源大于在多轮训练中当前轮的上一轮中使用多个第一样本图片集合中与上一轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源；

检测单元606，用于根据目标图片的类别对目标图片进行检测，得到检测结果，其中，检测结果用于指示目标图片是否为异常图片。

可选的，上述装置还可以包括：第三获取单元，用于获取第二样本图片集合，其中，第二样本图片集合中的每个样本图片的类别已被确定；第一训练单元，用于使用第二样本图片集合中的样本图片对原始图片识别模型进行训练，获得训练后的初始图片识别模型；第四获取单元，用于获取多个第一样本图片集合，其中，多个第一样本图片集合中的每个样本图片的类别未被确定；第二训练单元，用于使用多个第一样本图片集合对初始图片识别模型进行训练，获得训练后的图片识别模型。

可选的，第四获取单元包括：第一获取模块，用于获取多个第三样本图片集合，其中，第三样本图片集合与图片识别模型所识别的图片类别一一对应，每一个第三样本图片集合中的样本图片根据与第三样本图片集合相对应的目标关键词搜索获得，每个第三样本图片集合相对应的目标关键词与第三样本图片集合所对应的图片类别相匹配，每个第三样本图片集合中的样本图片的类别均未被确定；第一执行模块，用于重复执行以下操作，直至确定出每个第三样本图片集合所对应的多个类型的子集合，其中，在执行一次以下操作的过程中将执行以下操作的第三样本图片集合确定为目标样本图片集合：确定出目标样本图片集合中的每个样本图片的样本密度，其中目标样本图片集合中的两个样本图片所对应的样本密度用于指示两个样本图片之间的相似度；根据目标密度聚类算法和目标样本图片集合中的每个样本图片的样本密度，对目标样本图片集合中的样本图片进行聚类，获得多个类型的子集合，其中，对不同类型的子集合中的样本图片分别进行图片类别的识别所消耗的运算资源的差值大于阈值；第二获取模块，用于将每个第三样本图片集合所对应的多个类型的子集合中相同类型的子集合聚合，获得多个第一样本图片集合。

这里，获取多个第三样本图片集合，并对第三样本图片集合进行处理，将每个第三样本图片集合所对应的多个类型的子集合中相同类型的子集合聚合，获得多个第一样本图片集合。可以理解的是，在对模型进行训练的过程中需要大量的样本，从而便于模型的学习。为了满足模型训练的需要，通过对每个样本图片进行人工打标的方式显然所需耗费的人力资源以及所需的时间过长。故而，在本发明实施例中，所获取的第三样本图片集合中的样本图片根据与第三样本图片集合相对应的目标关键词搜索获得，每个第三样本图片集合相对应的目标关键词与第三样本图片集合所对应的图片类别相匹配。例如，对于一个第三样本图片集合，其可以与色情这一维度的图片类别相对应，可以通过搜索与色情图片类别相匹配的目标关键词，例如裸体等搜索获得该第三样本图片集合，从而使得得到的第三样本图片集合中的每个样本图片的类别未知，但是又与色情这一维度有关，从而无需人工对每一张样本图片进行打标，有效提高了模型训练的效率。

可选的，上述第一执行模块具体用于：重复执行以下操作，直至确定出目标样本图片集合中的每个样本图片的样本密度，其中，在执行一次以下操作的过程中将执行操作的样本图片确定为目标样本图片：确定目标样本图片与目标样本图片集中除目标样本图片之外的每个样本图片之间的第一欧式距离；将所获得的与目标样本图片集合中的样本图片的数量相同数量的第一欧式距离中小于或等于目标欧式距离的第一欧式距离的数量，确定为目标样本图片的样本密度。

可选的，上述第一执行模块还具体用于：获取目标样本图片集合中的任意两个样本图片之间的第二欧式距离；对所获得的多个第二欧式距离进行排序，将排序中位于目标次序的第二欧式距离确定为目标欧式距离。

可选的，第二训练单元包括：第二执行模块，用于重复执行以下操作，直至多个第一样本图片集合中的每一个第一样本图片集合均被使用对初始图片识别模型进行训练，其中，在执行一次以下操作的过程中将执行操作的第一样本图片集合确定为目标样本图片集合：获取目标样本图片集合，其中，使用目标样本图片集合中的样本图片进行训练所消耗的运算资源大于上一轮次中使用的样本图片进行训练所消耗的运算资源，且小于第一样本图片集合中除目标样本图片集合以外的样本图片集合中的样本图片进行训练所消耗的运算资源；利用目标样本图片集合，以及上一轮训练所使用的样本图片集合，对上一轮训练后的初始图片识别模型进行训练，获得本次训练后的初始图片识别模型。在本发明实施例中，通过使用所消耗的运算资源大于上一轮所使用的样本图片所消耗的运算资源的样本图片集合，以及上一轮训练所使用的样本图片集合进行本次的训练，从而即使得训练的难度有所增加，又通过增加上一轮所使用的样本图片集合增大了训练数据，可以有效提高模型训练的效果，提高训练后获得的图片识别模型对图片进行识别的准确率。以上述对样本图片进行识别所消耗的运算资源可以设置为简单、中等、困难为例进行说明，可以在第一轮训练中使用简单难度所对应的第一样本图片集合对初始图片识别模型进行训练；在训练完成后，使用中等难度所对应的第一样本图片集合，以及简单难度所对应的第一样本图片集合对上一轮训练后的初始图片识别模型进行训练；在训练完成后，使用困难难度所对应的第一样本图片集合，以及中等难度所对应的第一样本图片集合和简单难度所对应的第一样本图片集合对上一轮训练后的初始图片识别模型进行训练，在训练后获得图片识别模型。从而通过依次增加所使用的样本图片的识别难度，对初始图片识别模型进行循序渐进的训练，从而提高训练获得的图片识别模型对图片进行识别的准确度。

如图7所示的，在本发明可选实施例中，上述装置还可以包括：第五获取单元702，用于获取目标图片上的文字信息；第六获取单元704，用于将文字信息输入至向量模型中，获得向量模型输出的目标向量，其中，目标向量用于指示文字信息是否为异常信息；上述检测单元包括：检测模块，用于根据目标图片的类别和目标向量，对目标图片进行检测，得到检测结果。在本发明实施例中，发明人考虑到在相关技术中，图片本身可能并不是异常图片，但是可能被加上一些文字，例如“访问xx网址观看xx电源”，从而在正常图片上增加访问色情网站的文字信息，从而使得图片也属于异常图片，此时若仅对图片本身进行识别则可能无法得到正确的检测结果。故而，在本发明实施例中，还对目标图片上的文字信息进行获取，将文字信息输入至向量模型中，获得文字信息对应的目标向量，从而在对目标图片进行检测时，可以通过图片的类别和目标向量检测获得检测结果。

可选的，上述检测模块具体用于：在目标图片的类别为第一目标类别，或目标向量大于或等于阈值的情况下，得到第一检测结果，其中，第一检测结果用于指示目标图片被确定为异常图片；在目标图片的类别为第二目标类别，且目标向量小于阈值的情况下，得到第二检测结果，其中，第二检测结果用于指示目标图片未被确定为异常图片。在本发明实施例中，对于向量模型输出的目标向量可以用于判断输入的文字信息是否异常，在输出的目标向量大于阈值的情况下，可以确定该文字信息异常。在本发明实施例中，第一目标类别为异常图片类别，例如上述举例中提及的色情、暴恐、恐怖、涉政。第二目标类别为正常图片类别。在目标图片的目标向量大于或等于阈值的情况下，或者目标图片的类别为第一目标类别，可以得到目标图片被确定为异常图片的第一检测结果。

可选的，上述装置还可以包括：第七获取单元，用于获取文字集合；第三训练单元，用于使用文字集合中的文字对深度残差网络模型进行训练，获得训练后的深度残差网络模型，其中，深度残差网络模型包括多个深度残差网络单元，每个深度残差网络单元中添加有残差模块，残差模块用于将深度残差网络单元前一时刻的输入值叠加至本次输出的结果中；确定单元，用于将训练后的深度残差网络模型确定为向量模型。在本发明实施例中，深度残差网络模型包括多个深度残差网络单元，每个深度残差网络单元中添加有残差模块，残差模块用于将深度残差网络单元前一时刻的输入值叠加至本次输出的结果中，也就是用残差来重构网络的映射，就是把输入值再次引入到结果，这样堆叠层的权重会趋向于零，深度残差网络学习起来会简单，能更加方便完成训练。

根据本发明实施例的又一个方面，还提供了一种用于实施上述图片检测方法的电子装置，如图8所示，该电子装置包括存储器802和处理器804，该存储器802中存储有计算机程序，该处理器804被设置为通过计算机程序执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取待检测的目标图片；

S2，将目标图片输入至图片识别模型中，获得图片识别模型输出的目标图片的类别，其中，图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在多轮训练中的当前轮中使用多个第一样本图片集合中与当前轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源大于在多轮训练中当前轮的上一轮中使用多个第一样本图片集合中与上一轮对应的第一样本图片集合对初始图片识别模型进行训练所消耗的运算资源；

S3，根据目标图片的类别对目标图片进行检测，得到检测结果，其中，检测结果用于指示目标图片是否为异常图片。

可选地，本领域普通技术人员可以理解，图8所示的结构仅为示意，电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如，电子装置还可包括比图8中所示更多或者更少的组件(如网络接口等)，或者具有与图8所示不同的配置。

其中，存储器802可用于存储软件程序以及模块，如本发明实施例中的图片检测方法和装置对应的程序指令/模块，处理器804通过运行存储在存储器802内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的图片检测方法。存储器802可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器802可进一步包括相对于处理器804远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中，存储器802具体可以但不限于用于存储图片识别模型等信息。作为一种示例，如图8所示，上述存储器802中可以但不限于包括上述图片检测装置中的第一获取单元602、第二获取单元604、及检测单元606。此外，还可以包括但不限于上述图片检测装置中的其他模块单元，本示例中不再赘述。

可选地，上述的传输装置806用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置806包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置806为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

此外，上述电子装置还包括：显示器808，用于显示目标图片；和连接总线810，用于连接上述电子装置中的各个模块部件。

根据本发明的实施例的又一方面，还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，获取待检测的目标图片；

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种图片检测方法，其特征在于，包括：

获取待检测的目标图片；

将所述目标图片输入至图片识别模型中，获得所述图片识别模型输出的所述目标图片的类别，其中，所述图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在所述多轮训练中的当前轮中使用所述多个第一样本图片集合中与所述当前轮对应的第一样本图片集合对所述初始图片识别模型进行训练所消耗的运算资源大于在所述多轮训练中所述当前轮的上一轮中使用所述多个第一样本图片集合中与所述上一轮对应的第一样本图片集合对所述初始图片识别模型进行训练所消耗的运算资源；

根据所述目标图片的类别对所述目标图片进行检测，得到检测结果，其中，所述检测结果用于指示所述目标图片是否为异常图片。

2.根据权利要求1所述的方法，其特征在于，在获取待检测的目标图片之前，所述方法还包括：

获取第二样本图片集合，其中，所述第二样本图片集合中的每个样本图片的类别已被确定；

使用所述第二样本图片集合中的样本图片对原始图片识别模型进行训练，获得训练后的所述初始图片识别模型；

获取所述多个第一样本图片集合，其中，所述多个第一样本图片集合中的每个样本图片的类别未被确定；

使用所述多个第一样本图片集合对所述初始图片识别模型进行训练，获得训练后的所述图片识别模型。

3.根据权利要求2所述的方法，其特征在于，所述获取所述多个第一样本图片集合，包括：

获取多个第三样本图片集合，其中，所述第三样本图片集合与所述图片识别模型所识别的图片类别一一对应，每一个所述第三样本图片集合中的样本图片根据与所述第三样本图片集合相对应的目标关键词搜索获得，每个所述第三样本图片集合相对应的所述目标关键词与所述第三样本图片集合所对应的图片类别相匹配，每个所述第三样本图片集合中的样本图片的类别均未被确定；

重复执行以下操作，直至确定出每个所述第三样本图片集合所对应的多个类型的子集合，其中，在执行一次以下操作的过程中将执行以下操作的所述第三样本图片集合确定为目标样本图片集合：

确定出所述目标样本图片集合中的每个样本图片的样本密度，其中所述目标样本图片集合中的两个样本图片所对应的样本密度用于指示所述两个样本图片之间的相似度；

根据目标密度聚类算法和所述目标样本图片集合中的每个样本图片的所述样本密度，对所述目标样本图片集合中的样本图片进行聚类，获得所述多个类型的子集合，其中，对不同类型的所述子集合中的样本图片分别进行图片类别的识别所消耗的运算资源的差值大于阈值；

将每个所述第三样本图片集合所对应的所述多个类型的子集合中相同类型的子集合聚合，获得所述多个第一样本图片集合。

4.根据权利要求3所述的方法，其特征在于，所述确定出所述目标样本图片集合中的每个样本图片的样本密度，包括：

重复执行以下操作，直至确定出所述目标样本图片集合中的每个样本图片的样本密度，其中，在执行一次以下操作的过程中将执行操作的样本图片确定为目标样本图片：

确定所述目标样本图片与所述目标样本图片集中除所述目标样本图片之外的每个样本图片之间的第一欧式距离；

将所获得的与所述目标样本图片集合中的样本图片的数量相同数量的所述第一欧式距离中小于或等于目标欧式距离的第一欧式距离的数量，确定为所述目标样本图片的所述样本密度。

5.根据权利要求4所述的方法，其特征在于，将所获得的与所述目标样本图片集合中的样本图片的数量相同数量的所述第一欧式距离中小于或等于目标欧式距离的第一欧式距离的数量，确定为所述目标样本图片的所述样本密度之前，所述方法还包括：

获取所述目标样本图片集合中的任意两个样本图片之间的第二欧式距离；

对所获得的多个所述第二欧式距离进行排序，将所述排序中位于目标次序的所述第二欧式距离确定为所述目标欧式距离。

6.根据权利要求2所述的方法，其特征在于，使用所述多个第一样本图片集合对所述初始图片识别模型进行训练，获得训练后的所述图片识别模型，包括：

重复执行以下操作，直至所述多个第一样本图片集合中的每一个第一样本图片集合均被使用对所述初始图片识别模型进行训练，其中，在执行一次以下操作的过程中将执行操作的所述第一样本图片集合确定为目标样本图片集合：

获取所述目标样本图片集合，其中，使用所述目标样本图片集合中的样本图片进行训练所消耗的运算资源大于上一轮次中使用的样本图片进行训练所消耗的运算资源，且小于所述第一样本图片集合中除所述目标样本图片集合以外的样本图片集合中的样本图片进行训练所消耗的运算资源；

利用所述目标样本图片集合，以及上一轮训练所使用的样本图片集合，对上一轮训练后的初始图片识别模型进行训练，获得本次训练后的初始图片识别模型。

7.根据权利要求1所述的方法，其特征在于，

在将所述目标图片输入至图片识别模型中，获得所述图片识别模型输出的所述目标图片的类别之后，所述方法还包括：获取所述目标图片上的文字信息；将所述文字信息输入至向量模型中，获得所述向量模型输出的目标向量，其中，所述目标向量用于指示所述文字信息是否为异常信息；

根据所述目标图片的类别对所述目标图片进行检测，得到检测结果包括：根据所述目标图片的类别和所述目标向量，对所述目标图片进行检测，得到检测结果。

8.根据权利要求7所述的方法，其特征在于，根据所述目标图片的类别和所述目标向量，对所述目标图片进行检测，得到检测结果，包括：

在所述目标图片的类别为第一目标类别，或所述目标向量大于或等于阈值的情况下，得到第一检测结果，其中，所述第一检测结果用于指示所述目标图片被确定为异常图片；

在所述目标图片的类别为第二目标类别，且所述目标向量小于所述阈值的情况下，得到第二检测结果，其中，所述第二检测结果用于指示所述目标图片未被确定为异常图片。

9.根据权利要求7所述的方法，其特征在于，在获取待检测的目标图片之前，所述方法还包括：

获取文字集合；

使用所述文字集合中的文字对深度残差网络模型进行训练，获得训练后的深度残差网络模型，其中，所述深度残差网络模型包括多个深度残差网络单元，每个所述深度残差网络单元中添加有残差模块，所述残差模块用于将所述深度残差网络单元前一时刻的输入值叠加至本次输出的结果中；

将所述训练后的深度残差网络模型确定为所述向量模型。

10.一种图片检测装置，其特征在于，包括：

第一获取单元，用于获取待检测的目标图片；

第二获取单元，用于将所述目标图片输入至图片识别模型中，获得所述图片识别模型输出的所述目标图片的类别，其中，所述图片识别模型为使用多个第一样本图片集合中的样本图片对初始图片识别模型进行多轮训练获得的模型，在所述多轮训练中的当前轮中使用所述多个第一样本图片集合中与所述当前轮对应的第一样本图片集合对所述初始图片识别模型进行训练所消耗的运算资源大于在所述多轮训练中所述当前轮的上一轮中使用所述多个第一样本图片集合中与所述上一轮对应的第一样本图片集合对所述初始图片识别模型进行训练所消耗的运算资源；

检测单元，用于根据所述目标图片的类别对所述目标图片进行检测，得到检测结果，其中，所述检测结果用于指示所述目标图片是否为异常图片。

11.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，所述程序运行时执行上述权利要求1至9任一项中所述的方法。

12.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至9任一项中所述的方法。