CN106446932A

CN106446932A - 基于机器学习与图片识别的可进化违禁图片批量处理方法

Info

Publication number: CN106446932A
Application number: CN201610771081.4A
Authority: CN
Inventors: 盛斌; 吴凡
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2016-08-30
Filing date: 2016-08-30
Publication date: 2017-02-22

Abstract

本发明涉及一种基于机器学习与图片识别的可进化违禁图片批量处理方法，包括以下步骤：a)通过使用卷积神经网络来进行图片识别，设置学习训练装置对卷积神经网络进行训练优化；b)针对实际的实用需求，为用户提供调节选项，允许用户针对自身需求进行选择。与现有技术相比，本发明各个部分之间具有较好的独立性，且能很好的协同工作，具有较好的可扩展性等优点。

Description

基于机器学习与图片识别的可进化违禁图片批量处理方法

技术领域

本发明涉及图片检测处理技术领域，尤其是涉及一种基于机器学习与图片识别的可进化违禁图片批量处理方法。

背景技术

每时每刻，数量惊人的图片流经互联网，其中有许多图片都包含非法不良信息。这些信息可能毒害青少年的身心健康，或是危害社会的和谐稳定。以往为了监控这些不良信息，必须要动用许多的人力去人工审查图片。这样相较于计算机自动进行批量处理无疑显得效率低下。同时，一些图片甚至对于审查人员都有毒害作用，以至于许多鉴黄师工作几年就会换工作。可见自动地批量的处理这些图片由多必要。然而，识别系统可能并不总是那么奏效。必须要有人进行人为修正，不仅仅针对于识别结果，也针对于识别系统本身。所以，我们也配合识别系统提供简单易操作的训练软件。

但是，一个完善而高效的违禁图片批量处理系统却并不容易获得。在最初开始对图片进行管制时，方法非常简单粗暴---许多网站都是简单地靠识别颜色来鉴别图片，一张人的全脸照就有极大可能被识别为裸照。尽管那种非常不可靠的识别很快就消失了，但对于违禁图片批量处理系统的需求却从来没有减弱，甚至可能是相反地在加强。

毋庸置疑，图像识别技术已经取得了巨大的进步，受限于知识与经验，我们难以从本质上进行更好的改进，所以参考当前比较成熟而有效的识别算法R-CNN加以利用。

应用CNN识别图片时，CNN网络的质量将对识别效果产生巨大作用。任何一个静态的CNN网络都无法被证明是最优的，所以永远存在着对CNN的改进。一个可进化的CNN网络对于识别系统具有巨大作用。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于机器学习与图片识别的可进化违禁图片批量处理方法。

本发明的目的可以通过以下技术方案来实现：

一种基于机器学习与图片识别的可进化违禁图片批量处理方法，其特征在于，包括以下步骤：

a)通过使用卷积神经网络来进行图片识别，设置学习训练装置对卷积神经网络进行训练优化；

b)针对实际的实用需求，为用户提供调节选项，允许用户针对自身需求进行选择。

该方法具体包括以下步骤：

1)采用卷积神经网络CNN对图片进行识别；

2)通过提高颜色对比度并减小阈值来改善识别效果；

3)考虑到识别的实际需求，设置参数设置模块；

4)对CNN进行训练及优化的数据集，提供数据集更新的功能，用于满足用户对于提升CNN网络性能的实际需求；

5)用户获取自身的数据集进行CNN训练；

6)加入数据集添加及数据集删除模块，用于使用户基于数据集对CNN网络进行改进的能力得到进一步增强；

7)对识别的参数进行调整，由人体局部识别改为整个裸露人体识别。

所述的参数设置模块提供“精度优先模式”、“速度优先模式”和“自定义模式”的选项。

所述的步骤3)中的“自定义模式”为用户通过调节参数来获得一个自己最合适的识别模式。

所述的步骤5)中用户获取自身的数据集具体为：

(1)找到需要训练的图片所在的目录，确认后则找到文件夹中的第一张图片。

(2)如果图片中存在目标识别物，对图片中的目标识别物品进行框选操作并对目标识别物进行命名，生成此图片对应的xml文件；

(3)进入后一图片，重复(2)操作直至此文件夹中所有图片都进行了处理。

与现有技术相比，本发明通过使用卷积神经网络来进行图片识别，能够改进识别效果；而给用户提供更加简单的学习训练装置，使所有的本发明的使用者都能够改进本发明的识别性能。

附图说明

图1为本发明的界面示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

本发明针对构建系统的用途与较为实际的客户需要，提供简单易于操作的软件系统。该系统各个部分之间具有较好的独立性，且能很好的协同工作，具有较好的可扩展性。此系统充分利用了已有算法与平台，给用户极大的自主性。

本发明包括以下方面：

1)本发明系统不仅仅自己提供了原始的CNN(深度卷积网络)，还允许用户自己训练CNN。经过简单的操作就可以更新CNN网络。识别精度可以通过CNN网络进化而提升。能够更新CNN对于一个较大的网络系统则具有重要的意义，它使得更多不十分熟悉系统用户参与CNN网络更新成为可能。

2)正如之前所说，针对淫秽图片识别，过去大多数的系统的简单的通过颜色的识别来进行，这样的识别精度确实难以保证且无疑会极大地增加误报的可能。(例如:将全脸识别为裸体，将粉色的物体识别为淫秽图片)而采用了CNN来进行识别，同时考虑到了形状与颜色两方面的影响，且判定机制与人脸的识别更加相似。故而精度能提高的同时，误报率也可以下降。

3)本发明系统拥有参数调节模块，针对不同的情景，可以调节识别精度，可以适应更多的应用环境。

4)本发明做了较好的整合，将学习训练与识别处理整合为同一软件，方便用户的使用。

本发明具体实施例包括以下步骤：

第一步、尝试CNN识别：由于目标识别物体(乳房)并非较为理想的物体(理想的物体与周围的环境存在较大的颜色对比度；一般而言，识别开始前需要首先确定可能存在物体的区域，而识别实际上是针对于那些已经被认为存在着物体的区域进行。与已经较为成熟的人脸识别进行以对比说明。尽管，人脸毫无疑问也是人体的一部分，故而认为人脸是一个物体似乎也不十分容易。但经过进一步的比较，无论是侧视图还是正视图，人脸始终如一的保持者一个特征——有三面与周围的环境有较大颜色对比度仅仅由脖子和人体相连。不仅仅在识别时神经网络可以用到这一特征，在寻找可能存在人脸的区域时这一特征使得人脸与周围环境的颜色对比度较为明显，使用selective search寻找区域时也可以设置较低的颜色对比度。而本发明选择的目标识别物的，无法拥有一个像人脸一样显著特征，目标识别物的侧视图和正视图特征差别较大，而且即便本发明将目标识别物进一步划分侧视图与正视图，正视图中目标识别物欲周围环境颜色对比不明显的特征并不适合selectivesearch。也就是说，确定可能存在物体的区域并不容易。正是由于这个原因，识别效果并不十分理想。

第二步、基于第一步的实践与分析，本发明试图改进识别效果。通过提高颜色对比度并减小阈值的改进，识别的效果有了明显的提高。但此时识别总时间由于selectivesearch部分运行时间的增加而出现了较为巨大的增幅。

第三步、考虑到识别的实际需求并基于第二步的实践工作，本发明认为提供一个参数功能对于用户多变的使用具有较大的作用。参数设置模块提供了“精度优先”和“速度优先”选项去满足两类基本要求外，特意设置了自定义模式，允许用户调节参数找到一个自己最喜欢的识别模式。

第四步、由于本发明的识别算法是基于CNN网络的，所以对CNN网络进行的优化必将使得优化效果更好。本发明的数据集很小很难保证CNN网络足够优秀。但本发明可以让用户去提升CNN网络，也就是说本发明必须允许用户去自己训练CNN网络。因此，本发明的系统提供了数据集更新的功能去满足用户对于提升CNN网络性能的实际需求。

第五步、基于第四步，本发明知道用户如果拥有数据集则可以对使用数据集对CNN进行变更。然而，用户不一定都拥有自己的数据集。本发明必须允许用户经过简单的操作获取自己的数据集第四步才更具有实用价值。得到类似图片查看器的软件模块，客户可以用鼠标进行框选操作仅过如下步骤即可得到训练集合：

(1)找到需要训练的图片所在的目录，确认后则可以看到文件夹中的第一张图片。

(2)如果图片中存在目标识别物，对图片中的目标识别物品用鼠标进行框选操作并对目标识别物进行命名，点击“生成”(或者按“enter”)则可生成此图片对应的xml文件。

(3)点击“后一图片”(或者按“方向键左键”)，可以看到下一图片，重复(3)操作直至此文件夹中所有图片都进行了处理。

第六步、在实际使用中，目标识别物的种类可能会增加。允许用户去添加自己的数据集是必须的。数据集添加及数据集删除模块的加入使得用户基于数据集对CNN网络进行改进的能力得到进一步增强。

第七步、由第二步及第三步的讨论，通过增大颜色对比度并减小阈值的方法可以提升识别效果却增加了识别的总耗时。经过对问题的分析，本发明做出了适当的调整不对人体的局部进行识别而是选择整个裸露的人体去进行识别。这大大降低了selectivesearch的用时。经过实验测试，调整参数后，在相似的识别准确度下，本发明的识别总耗时大约降至之前的十分之一。这样的调整是有益的。同时，这种识别方式可能会面临问题，在对色情信息做进一步分类时并不像之前的算法方便。

实施效果

依照上述步骤，本发明对测试集进行测试，测试集包含96张图片，其中50张为随机抽取的色情图片，25张为从VOC2007数据集中随机抽取的非色情图片，21张为从互联网中挑选出来的人物干扰图片。实验在PC计算机中完成，主要参数为：Inter Core i5 2。6GHz处理器，ubuntu14.04操作系统，4GB DDR3 1600MHZ内存，NVIDA GeForce GT 740M(2G)显卡，软件设置为高速模式。运行时间为149.65s，单张图片平均检测时间为1.56s。结果显示，最终识别出42张色情图片，另有1张图片被误检，漏检率为8％，误检率为2.4％，漏检率和误检率都相对较低，达到了良好的检测效果。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于机器学习与图片识别的可进化违禁图片批量处理方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于机器学习与图片识别的可进化违禁图片批量处理方法，其特征在于，该方法具体包括以下步骤：

1)采用卷积神经网络CNN对图片进行识别；

2)通过提高颜色对比度并减小阈值来改善识别效果；

3)考虑到识别的实际需求，设置参数设置模块；

5)用户获取自身的数据集进行CNN训练；

3.根据权利要求2所述的一种基于机器学习与图片识别的可进化违禁图片批量处理方法，其特征在于，所述的参数设置模块提供“精度优先模式”、“速度优先模式”和“自定义模式”的选项。

4.根据权利要求3所述的一种基于机器学习与图片识别的可进化违禁图片批量处理方法，其特征在于，所述的步骤3)中的“自定义模式”为用户通过调节参数来获得一个自己最合适的识别模式。

5.根据权利要求2所述的一种基于机器学习与图片识别的可进化违禁图片批量处理方法，其特征在于，所述的步骤5)中用户获取自身的数据集具体为：