CN104063720A

CN104063720A - 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法

Info

Publication number: CN104063720A
Application number: CN201410315984.2A
Authority: CN
Inventors: 陈纯; 阮莹; 宋明黎; 张瑞; 周星辰; 卜佳俊
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2014-07-03
Filing date: 2014-07-03
Publication date: 2014-09-24

Abstract

本发明公开了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测的方法。此方法由三个有效步骤组成：1）利用深度玻尔兹曼机模型对大量违禁商品图片样本以及负样本进行训练，得到较好的检测模型初始化参数，即违禁商品检测方法判别特征；2）利用反馈神经网络模型对步骤1）中所得参数进行微调，得到检测模型的最终参数；3）利用滑动窗口方法，对检测图片进行多尺度缩放，在不同尺度下进行滑动窗口操作，利用步骤2）中得到的模型检测每个窗口中是否存在违禁商品，最终判定待检测图片中是否包含违禁商品。通过DBM模型训练图像样本的过程，能够在保证训练速度的同时提取对数据有更本质刻画的特征，进而保证了目标检测的准确率和召回率。

Description

基于深度玻尔兹曼机的电商网站违禁商品图片检测方法

技术领域

本发明属于计算机视觉领域，涉及电商网站中违禁商品图片检测方法。

背景技术

随着电子商务的高速发展，越来越多的商品可以进行网上交易，一些法律违禁商品，也在电子商务平台上日益活跃，如枪支、刀具、药品等。为了逃避法律责任追究，贩卖违禁商品的卖家往往不会直接在商品名称上标注枪支、刀具等，而是将所卖物品以图片方式呈现，给清查过程带来很大难度，在目前的工业应用中也没有成熟的方法。因此，电商网站中违禁商品图片检测成为一个急需解决的问题。

传统的图片检测方法，特征提取都是基于浅层学习，使用深度学习方法进行图片检测的研究很少。与浅层学习相比，深度学习能够提取更好的图片特征，对数据有更本质的刻画，从而更利于图片的分类。

玻尔兹曼机是深度学习的一个典型应用。深度玻尔兹曼机（DBM，Deep Boltzmann Machine）模型是多个限制玻尔兹曼机（RBM，Restricted Boltzmann Machine）模型的叠加。RBM模型是一个两层结构、对称连接、层内无连接、层间全连接的无自反馈的随机神经网络模型，包括可见层和隐层。RBM模型在给定可见层（输入数据）时，各个隐层节点的激活概率相互独立；反之，在给定隐层时，各个可见层节点的激活概率相互独立。多个RBM模型堆叠：前一个RBM的隐层作为后一个RBM的可见层，构成DBM模型。

发明内容

本发明的主要目的是针对电商网站中出现的各类违禁商品图片，利用深度玻尔兹曼机模型实现一种简单有效的检测方法，在保证训练时间不大幅增加的基础上，提升违禁商品图片检测的准确率。

本发明提供了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，包括以下步骤：

1）采集图片数据，对图片数据进行预处理。

2）构建DBM模型，确定模型的层数，可见层、隐层节点数目。

3）训练DBM模型。

4）利用反向传播算法对步骤3）得到的DBM模型初始化参数微调。

5）利用滑动窗口方法在待检测图片上检测违禁商品，统计待检测图片的所有尺度所有窗口的判定结果，判断待检测图片中是否含有违禁商品，以及违禁商品位置。

所述的违禁商品图片检测方法适用于各类目标的检测，针对不同的检测目标，采集不同的图片数据。

所述的采集图片数据，以刀具检测为例。图片大小为200*200像素，刀具占据图片内容主体部分，图片数目10000张。

所述的图片数据预处理方法是将每张图片切分为只包含违禁商品的部分和只包含背景的部分，统一缩放为28*28像素大小的灰度图片。只包含刀具的灰度图片作为模型输入的正样本，只包含背景的灰度图片作为模型输入的负样本。取5000张的正样本和同等数目的负样本作为模型的训练集，取1500张的正样本和同等数目的负样本作为模型的测试集。

所述的构建DBM模型包括设置DBM模型层数，可见层、隐层节点数目。DBM层数越多，模型泛化能力越强，但训练耗时也越多，兼顾模型精度和训练时间，将DBM模型层数设置为3层；DBM模型可见层节点由图片样本本身28*28=784个像素以及图片中心区域10*10=100个像素的组合构成，共884个节点，我们认为，样本图片的中心区域包含的信息比边缘区域更丰富，叠加后能够增加中心区域部分的权重，利于DBM模型从图片样本中提取更鲁棒的特征；DBM模型隐层1节点数目为3000个，相当于将884个节点的可见层映射到3000个节点的隐层中，将可见层进一步展开，可以发现更多信息；隐层2节点数目为450个，相当于对隐层1结果进行采样，从中总结出有用信息。

所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练，迭代次数为70次。

所述的DBM模型初始化参数微调是在DBM模型第二层隐层上增加2个节点的输出层，表示当前可见层接受的输入数据样本的所属类别，采用反向传播算法以及训练集、测试集数据对DBM模型进行迭代训练，迭代次数为50次，得到DBM模型的最终参数，即违禁商品图片检测的判别特征。

所述的滑动窗口方法是将待检测图片缩放到不同尺度，分别进行滑动窗口操作。滑动窗口大小设置为28*28，与DBM模型训练集、测试集样本大小一致，滑动窗口步长设置为2个像素，每次将滑动窗口中的图片内容转换为灰度图，作为DBM模型的可见层输入，结合微调后的参数，计算输出层结果，判定该窗口中当前图片部分是否是刀具。

本发明在保证训练时间不大幅增加的基础上，提升了图片检测的准确率。

附图说明

图1是本发明一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法流程图。

图2是深度玻尔兹曼机模型结构图。

图3是检测违禁商品图片结果示意图。

具体实施方式

下面结合本发明中的附图，对本发明的技术方案进行清晰、完整地描述。基于本发明的实施例，本领域普通技术人员在没有做创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，图1展示了该方法的整体流程。基于深度玻尔兹曼机的电商网站违禁商品图片检测方法具体实施步骤如下：

步骤1，采集图片数据，对图片数据进行预处理。以刀具检测为例，采集图片数据为刀具图片，图片大小为200*200像素。每张图片中违禁商品占据图片内容主体部分，图片数目10000张。将每张图片切分为只包含违禁商品的部分和只包含背景的部分，统一缩放为28*28大小的灰度图片。只包含违禁商品的灰度图片作为模型输入的正样本，只包含背景的灰度图片作为模型输入的负样本。取5000张正样本和同等数目的负样本作为模型的训练集，取1500张正样本和同等数目的负样本作为模型的测试集。

步骤2，构建DBM模型。如图2矩形框内模型结构所示，设定DBM模型层数为3层，可见层节点数为884个，隐层1节点数为3000个，隐层2节点数目为450个。层与层之间无向全连接，层内无连接。

步骤3，训练DBM模型。采用吉布斯交叉采样方法对DBM模型逐层训练，迭代次数为70次，得到模型初始化参数。

步骤4，利用反向传播算法对步骤3得到的DBM模型的初始化参数微调。在DBM模型隐层2上增加包含2个节点的输出层，如图2中顶部的2个节点，表示当前可见层接受的输入数据样本的所属类别，采用反向传播算法以及训练集、测试集数据对DBM模型进行迭代训练，迭代次数为50次，得到DBM模型的最终参数，即违禁商品图片检测的判别特征。

步骤5，利用滑动窗口方法在待检测图片上检测违禁商品。将图3中左侧两张图片作为待检测图片，缩放到不同尺度，分别进行滑动窗口操作。滑动窗口大小设置为28*28，与DBM模型训练集、测试集样本大小一致，滑动窗口步长设置为2个像素，每次将滑动窗口中的图片内容转换为灰度图，作为DBM模型的可见层输入，结合微调后的参数，计算输出层结果，判定该窗口中当前图片部分是否是违禁商品。然后统计待测图片所有滑动窗口结果，判断待检测图片中是否含有违禁商品，以及违禁商品位置。检测结果如图3中右侧两张图片所示，图片中违禁商品被识别出并用红色矩形框标识。

最后，以上所述仅为本发明较有代表性的实施例。本领域的普通技术人员可在不脱离本发明的发明思想情况下，对上述实施例做出种种修改或变化，因而本发明的保护范围并不被上述实施例所限，而应该是符合权利要求数提到的创新性特征的最大范围。

Claims

1. 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于该方法包括如下步骤：

1）采集图片数据，对图片数据进行预处理；

2）构建DBM模型，确定模型的层数，可见层、隐层节点数目；

3）训练DBM模型；

4）利用反向传播算法对步骤3）得到的DBM模型初始化参数微调；

2.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：图片数据预处理的方法为：将每张图片切分为只包含违禁商品的部分和只包含背景的部分，统一缩放为28*28像素大小的灰度图片：只包含刀具的灰度图片作为模型输入的正样本，只包含背景的灰度图片作为模型输入的负样本；取5000张的正样本和同等数目的负样本作为模型的训练集，取1500张的正样本和同等数目的负样本作为模型的测试集。

3.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：所述的DBM模型层数设置为三层。

4.根据权利要求3所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：三层结构的DBM模型包含一个可见层和两个隐层：可见层用于接受样本输入，隐层用于拟合样本分布。

5.根据权利要求4所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：所述的DBM模型可见层节点由图片样本本身28*28 = 784个像素以及图片中心区域10*10=100个像素的组合构成，共884个节点。

6.根据权利要求4所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：DBM模型的三层节点数目如下：与可见层连接的第一隐层节点数目为3000个，与第一隐层连接的第二隐层节点数目为450个。

7.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练，迭代次数为70次。

8.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：所述的DBM模型初始化参数微调是在DBM模型第二隐层上增加一个包含2个节点的输出层，2个节点的输出层，表示当前可见层接受的输入数据样本的所属类别，使用训练集、测试集数据，通过反向传播算法对DBM模型进行迭代训练，迭代次数为50次，得到DBM模型的最终参数，即违禁商品图片检测的判别特征。

9.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法，其特征在于：所述的滑动窗口方法是将待检测图片缩放到不同尺度，分别进行滑动窗口操作；滑动窗口大小设置为28*28，与DBM模型训练集、测试集样本大小一致，滑动窗口步长设置为2个像素，每次将滑动窗口中的图片转换为灰度图，作为DBM模型的可见层输入，结合微调后的参数，计算输出层结果，判定该窗口中当前图片部分是否是违禁商品。