CN104063720A - 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 - Google Patents

基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 Download PDF

Info

Publication number
CN104063720A
CN104063720A CN201410315984.2A CN201410315984A CN104063720A CN 104063720 A CN104063720 A CN 104063720A CN 201410315984 A CN201410315984 A CN 201410315984A CN 104063720 A CN104063720 A CN 104063720A
Authority
CN
China
Prior art keywords
model
violated
boltzmann machine
picture
dbm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410315984.2A
Other languages
English (en)
Inventor
陈纯
阮莹
宋明黎
张瑞
周星辰
卜佳俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201410315984.2A priority Critical patent/CN104063720A/zh
Publication of CN104063720A publication Critical patent/CN104063720A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测的方法。此方法由三个有效步骤组成:1)利用深度玻尔兹曼机模型对大量违禁商品图片样本以及负样本进行训练,得到较好的检测模型初始化参数,即违禁商品检测方法判别特征;2)利用反馈神经网络模型对步骤1)中所得参数进行微调,得到检测模型的最终参数;3)利用滑动窗口方法,对检测图片进行多尺度缩放,在不同尺度下进行滑动窗口操作,利用步骤2)中得到的模型检测每个窗口中是否存在违禁商品,最终判定待检测图片中是否包含违禁商品。通过DBM模型训练图像样本的过程,能够在保证训练速度的同时提取对数据有更本质刻画的特征,进而保证了目标检测的准确率和召回率。

Description

基于深度玻尔兹曼机的电商网站违禁商品图片检测方法
技术领域
本发明属于计算机视觉领域,涉及电商网站中违禁商品图片检测方法。
背景技术
随着电子商务的高速发展,越来越多的商品可以进行网上交易,一些法律违禁商品,也在电子商务平台上日益活跃,如枪支、刀具、药品等。为了逃避法律责任追究,贩卖违禁商品的卖家往往不会直接在商品名称上标注枪支、刀具等,而是将所卖物品以图片方式呈现,给清查过程带来很大难度,在目前的工业应用中也没有成熟的方法。因此,电商网站中违禁商品图片检测成为一个急需解决的问题。
传统的图片检测方法,特征提取都是基于浅层学习,使用深度学习方法进行图片检测的研究很少。与浅层学习相比,深度学习能够提取更好的图片特征,对数据有更本质的刻画,从而更利于图片的分类。
玻尔兹曼机是深度学习的一个典型应用。深度玻尔兹曼机(DBM,Deep Boltzmann Machine)模型是多个限制玻尔兹曼机(RBM,Restricted Boltzmann Machine)模型的叠加。RBM模型是一个两层结构、对称连接、层内无连接、层间全连接的无自反馈的随机神经网络模型,包括可见层和隐层。RBM模型在给定可见层(输入数据)时,各个隐层节点的激活概率相互独立;反之,在给定隐层时,各个可见层节点的激活概率相互独立。多个RBM模型堆叠:前一个RBM的隐层作为后一个RBM的可见层,构成DBM模型。
发明内容
本发明的主要目的是针对电商网站中出现的各类违禁商品图片,利用深度玻尔兹曼机模型实现一种简单有效的检测方法,在保证训练时间不大幅增加的基础上,提升违禁商品图片检测的准确率。
本发明提供了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,包括以下步骤:
1)采集图片数据,对图片数据进行预处理。
2)构建DBM模型,确定模型的层数,可见层、隐层节点数目。
3)训练DBM模型。
4)利用反向传播算法对步骤3)得到的DBM模型初始化参数微调。
5)利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度所有窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。
所述的违禁商品图片检测方法适用于各类目标的检测,针对不同的检测目标,采集不同的图片数据。
所述的采集图片数据,以刀具检测为例。图片大小为200*200像素,刀具占据图片内容主体部分,图片数目10000张。
所述的图片数据预处理方法是将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为28*28像素大小的灰度图片。只包含刀具的灰度图片作为模型输入的正样本,只包含背景的灰度图片作为模型输入的负样本。取5000张的正样本和同等数目的负样本作为模型的训练集,取1500张的正样本和同等数目的负样本作为模型的测试集。
所述的构建DBM模型包括设置DBM模型层数,可见层、隐层节点数目。DBM层数越多,模型泛化能力越强,但训练耗时也越多,兼顾模型精度和训练时间,将DBM模型层数设置为3层;DBM模型可见层节点由图片样本本身28*28=784个像素以及图片中心区域10*10=100个像素的组合构成,共884个节点,我们认为,样本图片的中心区域包含的信息比边缘区域更丰富,叠加后能够增加中心区域部分的权重,利于DBM模型从图片样本中提取更鲁棒的特征;DBM模型隐层1节点数目为3000个,相当于将884个节点的可见层映射到3000个节点的隐层中,将可见层进一步展开,可以发现更多信息;隐层2节点数目为450个,相当于对隐层1结果进行采样,从中总结出有用信息。
所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练,迭代次数为70次。
所述的DBM模型初始化参数微调是在DBM模型第二层隐层上增加2个节点的输出层,表示当前可见层接受的输入数据样本的所属类别,采用反向传播算法以及训练集、测试集数据对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。
所述的滑动窗口方法是将待检测图片缩放到不同尺度,分别进行滑动窗口操作。滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口中的图片内容转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是刀具。
本发明在保证训练时间不大幅增加的基础上,提升了图片检测的准确率。
附图说明
图1是本发明一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法流程图。
图2是深度玻尔兹曼机模型结构图。
图3是检测违禁商品图片结果示意图。
具体实施方式
下面结合本发明中的附图,对本发明的技术方案进行清晰、完整地描述。基于本发明的实施例,本领域普通技术人员在没有做创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,图1展示了该方法的整体流程。基于深度玻尔兹曼机的电商网站违禁商品图片检测方法具体实施步骤如下:
步骤1,采集图片数据,对图片数据进行预处理。以刀具检测为例,采集图片数据为刀具图片,图片大小为200*200像素。每张图片中违禁商品占据图片内容主体部分,图片数目10000张。将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为28*28大小的灰度图片。只包含违禁商品的灰度图片作为模型输入的正样本,只包含背景的灰度图片作为模型输入的负样本。取5000张正样本和同等数目的负样本作为模型的训练集,取1500张正样本和同等数目的负样本作为模型的测试集。
步骤2,构建DBM模型。如图2矩形框内模型结构所示,设定DBM模型层数为3层,可见层节点数为884个,隐层1节点数为3000个,隐层2节点数目为450个。层与层之间无向全连接,层内无连接。
步骤3,训练DBM模型。采用吉布斯交叉采样方法对DBM模型逐层训练,迭代次数为70次,得到模型初始化参数。
步骤4,利用反向传播算法对步骤3得到的DBM模型的初始化参数微调。在DBM模型隐层2上增加包含2个节点的输出层,如图2中顶部的2个节点,表示当前可见层接受的输入数据样本的所属类别,采用反向传播算法以及训练集、测试集数据对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。
步骤5,利用滑动窗口方法在待检测图片上检测违禁商品。将图3中左侧两张图片作为待检测图片,缩放到不同尺度,分别进行滑动窗口操作。滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口中的图片内容转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是违禁商品。然后统计待测图片所有滑动窗口结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。检测结果如图3中右侧两张图片所示,图片中违禁商品被识别出并用红色矩形框标识。
最后,以上所述仅为本发明较有代表性的实施例。本领域的普通技术人员可在不脱离本发明的发明思想情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求数提到的创新性特征的最大范围。

Claims (9)

1. 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于该方法包括如下步骤:
1)采集图片数据,对图片数据进行预处理;
2)构建DBM模型,确定模型的层数,可见层、隐层节点数目;
3)训练DBM模型;
4)利用反向传播算法对步骤3)得到的DBM模型初始化参数微调;
5)利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度所有窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。
2.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:图片数据预处理的方法为:将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为28*28像素大小的灰度图片:只包含刀具的灰度图片作为模型输入的正样本,只包含背景的灰度图片作为模型输入的负样本;取5000张的正样本和同等数目的负样本作为模型的训练集,取1500张的正样本和同等数目的负样本作为模型的测试集。
3.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的DBM模型层数设置为三层。
4.根据权利要求3所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:三层结构的DBM模型包含一个可见层和两个隐层:可见层用于接受样本输入,隐层用于拟合样本分布。
5.根据权利要求4所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的DBM模型可见层节点由图片样本本身28*28 = 784个像素以及图片中心区域10*10=100个像素的组合构成,共884个节点。
6.根据权利要求4所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:DBM模型的三层节点数目如下:与可见层连接的第一隐层节点数目为3000个,与第一隐层连接的第二隐层节点数目为450个。
7.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练,迭代次数为70次。
8.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的DBM模型初始化参数微调是在DBM模型第二隐层上增加一个包含2个节点的输出层,2个节点的输出层,表示当前可见层接受的输入数据样本的所属类别,使用训练集、测试集数据,通过反向传播算法对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。
9.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的滑动窗口方法是将待检测图片缩放到不同尺度,分别进行滑动窗口操作;滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口中的图片转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是违禁商品。
CN201410315984.2A 2014-07-03 2014-07-03 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 Pending CN104063720A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410315984.2A CN104063720A (zh) 2014-07-03 2014-07-03 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410315984.2A CN104063720A (zh) 2014-07-03 2014-07-03 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法

Publications (1)

Publication Number Publication Date
CN104063720A true CN104063720A (zh) 2014-09-24

Family

ID=51551422

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410315984.2A Pending CN104063720A (zh) 2014-07-03 2014-07-03 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法

Country Status (1)

Country Link
CN (1) CN104063720A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463865A (zh) * 2014-12-05 2015-03-25 浙江大学 一种人像分割方法
CN106446932A (zh) * 2016-08-30 2017-02-22 上海交通大学 基于机器学习与图片识别的可进化违禁图片批量处理方法
CN107229946A (zh) * 2017-05-11 2017-10-03 宸盛科华(北京)科技有限公司 基于人工神经网络的色情图片检测方法及装置
CN107886061A (zh) * 2017-11-02 2018-04-06 华南理工大学 基于多模态深度玻尔兹曼机的人体行为识别方法及系统
CN108537289A (zh) * 2018-04-24 2018-09-14 百度在线网络技术(北京)有限公司 数据识别模型的训练方法、装置及存储介质
CN110261923A (zh) * 2018-08-02 2019-09-20 浙江大华技术股份有限公司 一种违禁品检测方法及装置
CN111681229A (zh) * 2020-06-10 2020-09-18 创新奇智(上海)科技有限公司 深度学习模型训练方法、可穿戴衣服瑕疵识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021900A (zh) * 2007-03-15 2007-08-22 上海交通大学 利用降维方法进行人脸姿态估计的方法
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103810503A (zh) * 2013-12-26 2014-05-21 西北工业大学 一种基于深度学习的自然图像中显著区域的检测方法
CN103823845A (zh) * 2014-01-28 2014-05-28 浙江大学 一种基于深度学习的遥感影像自动标注方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021900A (zh) * 2007-03-15 2007-08-22 上海交通大学 利用降维方法进行人脸姿态估计的方法
CN103729678A (zh) * 2013-12-12 2014-04-16 中国科学院信息工程研究所 一种基于改进dbn模型的水军检测方法及系统
CN103810503A (zh) * 2013-12-26 2014-05-21 西北工业大学 一种基于深度学习的自然图像中显著区域的检测方法
CN103823845A (zh) * 2014-01-28 2014-05-28 浙江大学 一种基于深度学习的遥感影像自动标注方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463865A (zh) * 2014-12-05 2015-03-25 浙江大学 一种人像分割方法
CN106446932A (zh) * 2016-08-30 2017-02-22 上海交通大学 基于机器学习与图片识别的可进化违禁图片批量处理方法
CN107229946A (zh) * 2017-05-11 2017-10-03 宸盛科华(北京)科技有限公司 基于人工神经网络的色情图片检测方法及装置
CN107886061A (zh) * 2017-11-02 2018-04-06 华南理工大学 基于多模态深度玻尔兹曼机的人体行为识别方法及系统
CN108537289A (zh) * 2018-04-24 2018-09-14 百度在线网络技术(北京)有限公司 数据识别模型的训练方法、装置及存储介质
CN108537289B (zh) * 2018-04-24 2023-04-07 百度在线网络技术(北京)有限公司 数据识别模型的训练方法、装置及存储介质
CN110261923A (zh) * 2018-08-02 2019-09-20 浙江大华技术股份有限公司 一种违禁品检测方法及装置
CN110261923B (zh) * 2018-08-02 2024-04-26 浙江大华技术股份有限公司 一种违禁品检测方法及装置
CN111681229A (zh) * 2020-06-10 2020-09-18 创新奇智(上海)科技有限公司 深度学习模型训练方法、可穿戴衣服瑕疵识别方法及装置

Similar Documents

Publication Publication Date Title
Wang et al. Automatic detection and classification of steel surface defect using deep convolutional neural networks
CN110084292B (zh) 基于DenseNet和多尺度特征融合的目标检测方法
Czimmermann et al. Visual-based defect detection and classification approaches for industrial applications—a survey
CN104063720A (zh) 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法
CN106683091B (zh) 一种基于深度卷积神经网络的目标分类及姿态检测方法
Doumanoglou et al. Recovering 6D object pose and predicting next-best-view in the crowd
CN111598860B (zh) 基于嵌入自注意力门模块的yolov3网络的锂电池缺陷检测方法
CN105426919B (zh) 基于显著性指导非监督特征学习的图像分类方法
WO2020134102A1 (zh) 物品识别方法、装置、售货系统和存储介质
CN107871102A (zh) 一种人脸检测方法及装置
CN106980858A (zh) 一种语言文本检测与定位系统及应用该系统的语言文本检测与定位方法
CN107169956A (zh) 基于卷积神经网络的色织物疵点检测方法
CN108345827A (zh) 识别文档方向的方法、系统和神经网络
CN108898141A (zh) 基于图像检测的商品货架分割和层信息统计方法
CN109558902A (zh) 一种快速目标检测方法
CN109284779A (zh) 基于深度全卷积网络的物体检测方法
Adem et al. Defect detection of seals in multilayer aseptic packages using deep learning
CN114821102A (zh) 密集柑橘数量检测方法、设备、存储介质及装置
CN103544499A (zh) 一种基于机器视觉的表面瑕疵检测的纹理特征降维方法
CN115272652A (zh) 基于多元回归和自适应焦点损失的密集物体图像检测方法
CN108875456A (zh) 目标检测方法、目标检测装置和计算机可读存储介质
CN103390170A (zh) 一种基于多光谱遥感图像纹理元的地物类型纹理分类方法
CN104361600B (zh) 运动识别方法及系统
CN112766161A (zh) 基于集成约束多示例学习的高光谱目标检测方法
WO2024159563A1 (zh) 基于变分贝叶斯推理的烟支外观缺陷检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140924