CN104063720A - 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 - Google Patents
基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 Download PDFInfo
- Publication number
- CN104063720A CN104063720A CN201410315984.2A CN201410315984A CN104063720A CN 104063720 A CN104063720 A CN 104063720A CN 201410315984 A CN201410315984 A CN 201410315984A CN 104063720 A CN104063720 A CN 104063720A
- Authority
- CN
- China
- Prior art keywords
- violated
- model
- commodity
- boltzmann machine
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测的方法。此方法由三个有效步骤组成:1)利用深度玻尔兹曼机模型对大量违禁商品图片样本以及负样本进行训练,得到较好的检测模型初始化参数,即违禁商品检测方法判别特征;2)利用反馈神经网络模型对步骤1)中所得参数进行微调,得到检测模型的最终参数;3)利用滑动窗口方法,对检测图片进行多尺度缩放,在不同尺度下进行滑动窗口操作,利用步骤2)中得到的模型检测每个窗口中是否存在违禁商品,最终判定待检测图片中是否包含违禁商品。通过DBM模型训练图像样本的过程,能够在保证训练速度的同时提取对数据有更本质刻画的特征,进而保证了目标检测的准确率和召回率。
Description
技术领域
本发明属于计算机视觉领域,涉及电商网站中违禁商品图片检测方法。
背景技术
随着电子商务的高速发展,越来越多的商品可以进行网上交易,一些法律违禁商品,也在电子商务平台上日益活跃,如枪支、刀具、药品等。为了逃避法律责任追究,贩卖违禁商品的卖家往往不会直接在商品名称上标注枪支、刀具等,而是将所卖物品以图片方式呈现,给清查过程带来很大难度,在目前的工业应用中也没有成熟的方法。因此,电商网站中违禁商品图片检测成为一个急需解决的问题。
传统的图片检测方法,特征提取都是基于浅层学习,使用深度学习方法进行图片检测的研究很少。与浅层学习相比,深度学习能够提取更好的图片特征,对数据有更本质的刻画,从而更利于图片的分类。
玻尔兹曼机是深度学习的一个典型应用。深度玻尔兹曼机(DBM,Deep Boltzmann Machine)模型是多个限制玻尔兹曼机(RBM,Restricted Boltzmann Machine)模型的叠加。RBM模型是一个两层结构、对称连接、层内无连接、层间全连接的无自反馈的随机神经网络模型,包括可见层和隐层。RBM模型在给定可见层(输入数据)时,各个隐层节点的激活概率相互独立;反之,在给定隐层时,各个可见层节点的激活概率相互独立。多个RBM模型堆叠:前一个RBM的隐层作为后一个RBM的可见层,构成DBM模型。
发明内容
本发明的主要目的是针对电商网站中出现的各类违禁商品图片,利用深度玻尔兹曼机模型实现一种简单有效的检测方法,在保证训练时间不大幅增加的基础上,提升违禁商品图片检测的准确率。
本发明提供了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,包括以下步骤:
1)采集图片数据,对图片数据进行预处理。
2)构建DBM模型,确定模型的层数,可见层、隐层节点数目。
3)训练DBM模型。
4)利用反向传播算法对步骤3)得到的DBM模型初始化参数微调。
5)利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度所有窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。
所述的违禁商品图片检测方法适用于各类目标的检测,针对不同的检测目标,采集不同的图片数据。
所述的采集图片数据,以刀具检测为例。图片大小为200*200像素,刀具占据图片内容主体部分,图片数目10000张。
所述的图片数据预处理方法是将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为28*28像素大小的灰度图片。只包含刀具的灰度图片作为模型输入的正样本,只包含背景的灰度图片作为模型输入的负样本。取5000张的正样本和同等数目的负样本作为模型的训练集,取1500张的正样本和同等数目的负样本作为模型的测试集。
所述的构建DBM模型包括设置DBM模型层数,可见层、隐层节点数目。DBM层数越多,模型泛化能力越强,但训练耗时也越多,兼顾模型精度和训练时间,将DBM模型层数设置为3层;DBM模型可见层节点由图片样本本身28*28=784个像素以及图片中心区域10*10=100个像素的组合构成,共884个节点,我们认为,样本图片的中心区域包含的信息比边缘区域更丰富,叠加后能够增加中心区域部分的权重,利于DBM模型从图片样本中提取更鲁棒的特征;DBM模型隐层1节点数目为3000个,相当于将884个节点的可见层映射到3000个节点的隐层中,将可见层进一步展开,可以发现更多信息;隐层2节点数目为450个,相当于对隐层1结果进行采样,从中总结出有用信息。
所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练,迭代次数为70次。
所述的DBM模型初始化参数微调是在DBM模型第二层隐层上增加2个节点的输出层,表示当前可见层接受的输入数据样本的所属类别,采用反向传播算法以及训练集、测试集数据对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。
所述的滑动窗口方法是将待检测图片缩放到不同尺度,分别进行滑动窗口操作。滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口中的图片内容转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是刀具。
本发明在保证训练时间不大幅增加的基础上,提升了图片检测的准确率。
附图说明
图1是本发明一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法流程图。
图2是深度玻尔兹曼机模型结构图。
图3是检测违禁商品图片结果示意图。
具体实施方式
下面结合本发明中的附图,对本发明的技术方案进行清晰、完整地描述。基于本发明的实施例,本领域普通技术人员在没有做创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,图1展示了该方法的整体流程。基于深度玻尔兹曼机的电商网站违禁商品图片检测方法具体实施步骤如下:
步骤1,采集图片数据,对图片数据进行预处理。以刀具检测为例,采集图片数据为刀具图片,图片大小为200*200像素。每张图片中违禁商品占据图片内容主体部分,图片数目10000张。将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为28*28大小的灰度图片。只包含违禁商品的灰度图片作为模型输入的正样本,只包含背景的灰度图片作为模型输入的负样本。取5000张正样本和同等数目的负样本作为模型的训练集,取1500张正样本和同等数目的负样本作为模型的测试集。
步骤2,构建DBM模型。如图2矩形框内模型结构所示,设定DBM模型层数为3层,可见层节点数为884个,隐层1节点数为3000个,隐层2节点数目为450个。层与层之间无向全连接,层内无连接。
步骤3,训练DBM模型。采用吉布斯交叉采样方法对DBM模型逐层训练,迭代次数为70次,得到模型初始化参数。
步骤4,利用反向传播算法对步骤3得到的DBM模型的初始化参数微调。在DBM模型隐层2上增加包含2个节点的输出层,如图2中顶部的2个节点,表示当前可见层接受的输入数据样本的所属类别,采用反向传播算法以及训练集、测试集数据对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。
步骤5,利用滑动窗口方法在待检测图片上检测违禁商品。将图3中左侧两张图片作为待检测图片,缩放到不同尺度,分别进行滑动窗口操作。滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口中的图片内容转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是违禁商品。然后统计待测图片所有滑动窗口结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。检测结果如图3中右侧两张图片所示,图片中违禁商品被识别出并用红色矩形框标识。
最后,以上所述仅为本发明较有代表性的实施例。本领域的普通技术人员可在不脱离本发明的发明思想情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求数提到的创新性特征的最大范围。
Claims (9)
1. 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于该方法包括如下步骤:
1)采集图片数据,对图片数据进行预处理;
2)构建DBM模型,确定模型的层数,可见层、隐层节点数目;
3)训练DBM模型;
4)利用反向传播算法对步骤3)得到的DBM模型初始化参数微调;
5)利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度所有窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。
2.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:图片数据预处理的方法为:将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为28*28像素大小的灰度图片:只包含刀具的灰度图片作为模型输入的正样本,只包含背景的灰度图片作为模型输入的负样本;取5000张的正样本和同等数目的负样本作为模型的训练集,取1500张的正样本和同等数目的负样本作为模型的测试集。
3.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的DBM模型层数设置为三层。
4.根据权利要求3所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:三层结构的DBM模型包含一个可见层和两个隐层:可见层用于接受样本输入,隐层用于拟合样本分布。
5.根据权利要求4所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的DBM模型可见层节点由图片样本本身28*28 = 784个像素以及图片中心区域10*10=100个像素的组合构成,共884个节点。
6.根据权利要求4所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:DBM模型的三层节点数目如下:与可见层连接的第一隐层节点数目为3000个,与第一隐层连接的第二隐层节点数目为450个。
7.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练,迭代次数为70次。
8.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的DBM模型初始化参数微调是在DBM模型第二隐层上增加一个包含2个节点的输出层,2个节点的输出层,表示当前可见层接受的输入数据样本的所属类别,使用训练集、测试集数据,通过反向传播算法对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。
9.根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于:所述的滑动窗口方法是将待检测图片缩放到不同尺度,分别进行滑动窗口操作;滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口中的图片转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是违禁商品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410315984.2A CN104063720A (zh) | 2014-07-03 | 2014-07-03 | 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410315984.2A CN104063720A (zh) | 2014-07-03 | 2014-07-03 | 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104063720A true CN104063720A (zh) | 2014-09-24 |
Family
ID=51551422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410315984.2A Pending CN104063720A (zh) | 2014-07-03 | 2014-07-03 | 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104063720A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463865A (zh) * | 2014-12-05 | 2015-03-25 | 浙江大学 | 一种人像分割方法 |
CN106446932A (zh) * | 2016-08-30 | 2017-02-22 | 上海交通大学 | 基于机器学习与图片识别的可进化违禁图片批量处理方法 |
CN107229946A (zh) * | 2017-05-11 | 2017-10-03 | 宸盛科华(北京)科技有限公司 | 基于人工神经网络的色情图片检测方法及装置 |
CN107886061A (zh) * | 2017-11-02 | 2018-04-06 | 华南理工大学 | 基于多模态深度玻尔兹曼机的人体行为识别方法及系统 |
CN108537289A (zh) * | 2018-04-24 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 数据识别模型的训练方法、装置及存储介质 |
CN110261923A (zh) * | 2018-08-02 | 2019-09-20 | 浙江大华技术股份有限公司 | 一种违禁品检测方法及装置 |
CN111681229A (zh) * | 2020-06-10 | 2020-09-18 | 创新奇智(上海)科技有限公司 | 深度学习模型训练方法、可穿戴衣服瑕疵识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021900A (zh) * | 2007-03-15 | 2007-08-22 | 上海交通大学 | 利用降维方法进行人脸姿态估计的方法 |
CN103729678A (zh) * | 2013-12-12 | 2014-04-16 | 中国科学院信息工程研究所 | 一种基于改进dbn模型的水军检测方法及系统 |
CN103810503A (zh) * | 2013-12-26 | 2014-05-21 | 西北工业大学 | 一种基于深度学习的自然图像中显著区域的检测方法 |
CN103823845A (zh) * | 2014-01-28 | 2014-05-28 | 浙江大学 | 一种基于深度学习的遥感影像自动标注方法 |
-
2014
- 2014-07-03 CN CN201410315984.2A patent/CN104063720A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021900A (zh) * | 2007-03-15 | 2007-08-22 | 上海交通大学 | 利用降维方法进行人脸姿态估计的方法 |
CN103729678A (zh) * | 2013-12-12 | 2014-04-16 | 中国科学院信息工程研究所 | 一种基于改进dbn模型的水军检测方法及系统 |
CN103810503A (zh) * | 2013-12-26 | 2014-05-21 | 西北工业大学 | 一种基于深度学习的自然图像中显著区域的检测方法 |
CN103823845A (zh) * | 2014-01-28 | 2014-05-28 | 浙江大学 | 一种基于深度学习的遥感影像自动标注方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463865A (zh) * | 2014-12-05 | 2015-03-25 | 浙江大学 | 一种人像分割方法 |
CN106446932A (zh) * | 2016-08-30 | 2017-02-22 | 上海交通大学 | 基于机器学习与图片识别的可进化违禁图片批量处理方法 |
CN107229946A (zh) * | 2017-05-11 | 2017-10-03 | 宸盛科华(北京)科技有限公司 | 基于人工神经网络的色情图片检测方法及装置 |
CN107886061A (zh) * | 2017-11-02 | 2018-04-06 | 华南理工大学 | 基于多模态深度玻尔兹曼机的人体行为识别方法及系统 |
CN108537289A (zh) * | 2018-04-24 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 数据识别模型的训练方法、装置及存储介质 |
CN108537289B (zh) * | 2018-04-24 | 2023-04-07 | 百度在线网络技术(北京)有限公司 | 数据识别模型的训练方法、装置及存储介质 |
CN110261923A (zh) * | 2018-08-02 | 2019-09-20 | 浙江大华技术股份有限公司 | 一种违禁品检测方法及装置 |
CN110261923B (zh) * | 2018-08-02 | 2024-04-26 | 浙江大华技术股份有限公司 | 一种违禁品检测方法及装置 |
CN111681229A (zh) * | 2020-06-10 | 2020-09-18 | 创新奇智(上海)科技有限公司 | 深度学习模型训练方法、可穿戴衣服瑕疵识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104063720A (zh) | 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法 | |
CN107690657B (zh) | 根据影像发现商户 | |
Shabut et al. | An intelligent mobile-enabled expert system for tuberculosis disease diagnosis in real time | |
Khan et al. | Real-time plant health assessment via implementing cloud-based scalable transfer learning on AWS DeepLens | |
CN106688011B (zh) | 用于多类别物体检测的方法和系统 | |
CN103778214B (zh) | 一种基于用户评论的商品属性聚类方法 | |
CN106408030B (zh) | 基于中层语义属性和卷积神经网络的sar图像分类方法 | |
WO2019019291A1 (zh) | 基于卷积神经网络的图像识别技术的结算方法和装置 | |
CN108664897A (zh) | 票据识别方法、装置及存储介质 | |
CN104778186B (zh) | 将商品对象挂载到标准产品单元的方法及系统 | |
CN113642431B (zh) | 目标检测模型的训练方法及装置、电子设备和存储介质 | |
CN107077625A (zh) | 分层深卷积神经网络 | |
CN104915673B (zh) | 一种基于视觉词袋模型的目标分类方法和系统 | |
Mai et al. | 3D object detection with SLS-fusion network in foggy weather conditions | |
US11042975B2 (en) | Estimating a number of containers by digital image analysis | |
CN115272652A (zh) | 基于多元回归和自适应焦点损失的密集物体图像检测方法 | |
US20220292131A1 (en) | Method, apparatus and system for retrieving image | |
CN106202181A (zh) | 一种情感分类方法、装置及系统 | |
Lian et al. | Towards unified on-road object detection and depth estimation from a single image | |
Nadeem et al. | Smart diet diary: real-Time mobile application for food recognition | |
Geetha et al. | Design of waste management system using ensemble neural networks | |
Barbarella et al. | Application of supervised machine learning technique on LiDAR data for monitoring coastal land evolution | |
Jiang et al. | Rdd-yolov5: road defect detection algorithm with self-attention based on unmanned aerial vehicle inspection | |
CN105488061B (zh) | 一种验证数据有效性的方法及装置 | |
Thwe et al. | A semi-supervised learning approach for automatic detection and fashion product category prediction with small training dataset using FC-YOLOv4 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140924 |
|
WD01 | Invention patent application deemed withdrawn after publication |