CN109948639A

CN109948639A - 一种基于深度学习的图片垃圾识别方法

Info

Publication number: CN109948639A
Application number: CN201811563728.XA
Authority: CN
Inventors: 洒海涛; 韩炜
Original assignee: Junku (shanghai) Information Technology Co Ltd
Current assignee: Junku (shanghai) Information Technology Co Ltd
Priority date: 2019-05-23
Filing date: 2019-05-23
Publication date: 2019-06-28

Abstract

本发明公开了一种基于深度学习的图片垃圾识别方法，包括如下步骤，S1：建立大规模的图片训练集，在训练集中训练基于卷积神经网络的深度学习分类器，提取其中的卷积层作为深度特征提取器；S2：构建单个非线性分类器，将高质量图片库和图片垃圾库中的图片输入到步骤S1中获得的深度特征提取器，得到特征表示向量；S3：将步骤S2中得到的特征向量作为非线性分类器的输入，再利用相应的标签进行监督学习，得到可用的图片垃圾分类器；S4：将长图通过滑窗裁剪得到多张图片，利用深度特征提取器提取各段特征后，用图片垃圾分类器进行分类，将各个结果综合集成得到最终结果。

Description

一种基于深度学习的图片垃圾识别方法

技术领域

本发明涉及计算机图片处理技术领域，具体为一种基于深度学习的图片垃圾识别方法。

背景技术

随着互联网技术的发展，网络上储存的信息量有了巨大的增长，但是其内容构成更加的复杂，包含了大量低质量、高噪声的垃圾信息，用户不得不花费大量时间和精力去筛选各类信息。从图片搜索和分类的角度，不相关或者低质量的图片会降低用户体验，比如在搜索“风景”时出现了食物，搜索 “建筑”时出现了广告，如果这些能够被自动化的过滤掉，能帮助用户节省许多时间和精力。

现有的图片识别方法主要是针对规整数据上特定物体的识别，需要特定的数据集来训练，而且通常要求输入图片的长宽比为1比1；然而在网站的实际生产环境中，用户上传的图片中，包含大通过拼接、涂改、添加文字等形成的图片，以及一些不相关的或者带有大量广告内容的图片，这些图片对于浏览，搜索而言，在某些场景下是属于图片垃圾，是需要过滤掉的。

实际生产环境中，相当数量的一部分图片的长宽比是非常大的，直接缩放到1比1会造成图片内容的高度失真，这给传统识别方法带来了困难。

发明内容

本发明的目的在于提供一种基于深度学习的图片垃圾识别方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种基于深度学习的图片垃圾识别方法，包括如下步骤：

S1：建立大规模的图片训练集，在训练集中训练基于卷积神经网络的深度学习分类器，提取其中的卷积层作为深度特征提取器；

S2：构建单个非线性分类器，将高质量图片库和图片垃圾库中的图片输入到步骤S1中获得的深度特征提取器，得到特征表示向量；

S3：将步骤S2中得到的特征向量作为非线性分类器的输入，再利用相应的标签进行监督学习，得到可用的图片垃圾分类器；

S4：将长图通过滑窗裁剪得到多张图片，利用深度特征提取器提取各段特征后，用图片垃圾分类器进行分类，将各个结果综合集成得到最终结果。

优选的，所述步骤S1包括如下步骤：

S11：下载大规模的图像分类数据集，搭建深度卷积网络；

S12：裁剪、缩放图片以满足网络的输入要求；

S13：利用基于梯度下降法的优化算法训练深度神经网络，降低损失函数；

S14：移除全连接层，得到深度特征提取器。

优选的，所述步骤S11中，深度卷积网络包含大量的卷积层，将最后一层的输出展平成向量，最后通过多层全连接层输出类别，采用交叉熵作为损失函数；所述步骤S12中，要求输入的长宽比固定为1比1。

优选的，所述步骤S2包括如下步骤：

S21：准备特定场景下的图片垃圾数据集以及特定场景下的优质图片数据集；

S22：将上述图片集输入到深度学习特征提取器，提取所有图片的深度特征为R¹的向量；

S23：构建非线性分类器。

优选的，所述步骤S21中，除去图片垃圾数据集、优质图片数据集中的长图片，并对图片进行缩放、剪裁等处理，满足深度特征提取器的输入标准；所述步骤S23中，构建的非线性分类器包含两层隐藏层，每个隐层按照全连接、ReLU、随机失活的顺序堆叠而成，最后加权输出一个值。

优选的，所述步骤S3将深度特征输入非线性分类器，利用相应的标签来进行训练；训练结果中0代表不是图片垃圾，π/2代表图片垃圾，利用优化算法最小化损失函数，公式为：loss＝∑_i|arctan(y_i')-y_i|²+γ|arctan(y_i')-y_i|。

优选的，所述步骤S4包括以下步骤：

S41：将长图长度按照短边缩放，保持长宽比不变；

S42：计算需要截取的段数和相应的滑窗偏移量，裁剪长图得到一组子图；

S43：将获得的一组图片送入深度特征提取器，抽取一组特征向量；

S44：将上述特征向量输入非线性分类器，得到一组激活值，通过一个阈值对各个子图进行判定；

S45：综合各个子图的判定结果，得到最终结果。

优选的，所述步骤S45中，判定结果方法有两种，其中一种为，只要长图片的任意一部分被判定为图片垃圾，则整个图片被判定为图片垃圾；另外一种为，在一张长图的判定结果中，若判断为垃圾图片的比例超过某一数值，则整个图片被判定为图片垃圾。

与现有技术相比，本发明的有益效果是：本发明充分利用了深度卷积网络的特征抽取能力，避免了人工设计特征，抽取的特征性质较好；特征抽取与类别预测互相分离，针对不同场景训练不同的分类器，大大节约了计算以及训练成本；同时可以针对长图灵活处理，能够有效识别包含垃圾信息的长图片，取得较好的实际效果。

附图说明

图1为本发明的整体步骤示意图；

图2为本发明的步骤S1示意图；

图3为本发明的步骤S2示意图；

图4为本发明的步骤S4示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-4，本发明提供一种技术方案：一种基于深度学习的图片垃圾识别方法，包括如下步骤：

进一步的，所述步骤S1包括如下步骤：

S11：下载大规模的图像分类数据集，搭建深度卷积网络；

S12：裁剪、缩放图片以满足网络的输入要求；

S14：移除全连接层，得到深度特征提取器。

进一步的，所述步骤S11中，深度卷积网络包含大量的卷积层，将最后一层的输出展平成向量，最后通过多层全连接层输出类别，采用交叉熵作为损失函数；所述步骤S12中，要求输入的长宽比固定为1比1。

进一步的，所述步骤S2包括如下步骤：

S23：构建非线性分类器。

进一步的，所述步骤S21中，除去图片垃圾数据集、优质图片数据集中的长图片，并对图片进行缩放、剪裁等处理，满足深度特征提取器的输入标准；所述步骤S23中，构建的非线性分类器包含两层隐藏层，每个隐层按照全连接、ReLU、随机失活的顺序堆叠而成，最后加权输出一个值。

进一步的，所述步骤S4包括以下步骤：

S41：将长图长度按照短边缩放，保持长宽比不变；

S45：综合各个子图的判定结果，得到最终结果。

进一步的，所述步骤S45中，判定结果方法有两种，其中一种为，只要长图片的任意一部分被判定为图片垃圾，则整个图片被判定为图片垃圾；另外一种为，在一张长图的判定结果中，若判断为垃圾图片的比例超过某一数值，则整个图片被判定为图片垃圾。

工作原理：在步骤S1中建立图片训练集，利用图片训练集搭建深度卷积网络，深度卷积网络包含大量的卷积层，将最后一层的输出展平成向量，最后通过多层全连接层输出类别，最后移出全连接层，得到深度特征提取器；其中通过利用基于梯度下降法的优化算法训练深度神经网络，降低损失函数；在图片训练集搭建网络的过程中，对图片进行删减，保持其窗宽比为1:1。步骤S2中构建非线性分类器，同时准备图片垃圾数据集以及优质图片数据集，图片集输入步骤S1中的深度特征提取器获取特征表示向量；步骤S3中，将特征表示向量输入非线性分类器中，对步骤S2的非线性分类器的标签进行训练，获得训练结果，训练结果中0代表不是图片垃圾，π/2代表图片垃圾；步骤S4中，对长图进行整理，先将长图剪裁呈多个尺寸较小的子图，以符合深度特征提取器输入标准，提取子图的特征向量，将子图的特征向量输入非线性分类器，获得激活值，对子图判定从而对长图判定；判定方法设置两种，一种为，只要长图片的任意一部分被判定为图片垃圾，则整个图片被判定为图片垃圾；另外一种为，在一张长图的判定结果中，若判断为垃圾图片的比例超过某一数值，则整个图片被判定为图片垃圾。最终完成对长图的垃圾识别。

较传统方式，抽取特征性质较好，计算、训练成本简单，同时能够灵活对长图处理，处理效果优异。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于深度学习的图片垃圾识别方法，其特征在于：包括如下步骤：

2.根据权利要求1所述的一种基于深度学习的图片垃圾识别方法，其特征在于：所述步骤S1包括如下步骤：

S11：下载大规模的图像分类数据集，搭建深度卷积网络；

S12：裁剪、缩放图片以满足网络的输入要求；

S14：移除全连接层，得到深度特征提取器。

3.根据权利要求2所述的一种基于深度学习的图片垃圾识别方法，其特征在于：所述步骤S11中，深度卷积网络包含大量的卷积层，将最后一层的输出展平成向量，最后通过多层全连接层输出类别，采用交叉熵作为损失函数；所述步骤S12中，要求输入的长宽比固定为1比1。

4.根据权利要求1所述的一种基于深度学习的图片垃圾识别方法，其特征在于：所述步骤S2包括如下步骤：

S22：将上述图片集输入到深度学习特征提取器，提取所有图片的深度特征为R1的向量；

S23：构建非线性分类器。

5.根据权利要求4所述的一种基于深度学习的图片垃圾识别方法，其特征在于：所述步骤S21中，除去图片垃圾数据集、优质图片数据集中的长图片，并对图片进行缩放、剪裁等处理，满足深度特征提取器的输入标准；所述步骤S23中，构建的非线性分类器包含两层隐藏层，每个隐层按照全连接、ReLU、随机失活的顺序堆叠而成，最后加权输出一个值；。

6.根据权利要求1所述的一种基于深度学习的图片垃圾识别方法，其特征在于：所述步骤S3中将深度特征输入非线性分类器，利用相应的标签来进行训练；训练结果中0代表不是图片垃圾，π/2代表图片垃圾，利用优化算法最小化损失函数，公式为：。

7.根据权利要求1所述的一种基于深度学习的图片垃圾识别方法，其特征在于：所述步骤S4包括以下步骤：

S41：将长图长度按照短边缩放，保持长宽比不变；

S45：综合各个子图的判定结果，得到最终结果。

8.根据权利要求1所述的一种基于深度学习的图片垃圾识别方法，其特征在于：所述步骤S45中，判定结果方法有两种，其中一种为，子图中的任意一个被判定为图片垃圾，则整个长图被判定为图片垃圾；另外一种为，在一系列子图的判定结果中，若判断为垃圾图片的比例超过某一数值，则整个长图被判定为图片垃圾。