CN103413278B - 一种商品图片背景噪声的过滤方法 - Google Patents

一种商品图片背景噪声的过滤方法 Download PDF

Info

Publication number
CN103413278B
CN103413278B CN201310368239.XA CN201310368239A CN103413278B CN 103413278 B CN103413278 B CN 103413278B CN 201310368239 A CN201310368239 A CN 201310368239A CN 103413278 B CN103413278 B CN 103413278B
Authority
CN
China
Prior art keywords
pixel
commodity picture
background
region
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310368239.XA
Other languages
English (en)
Other versions
CN103413278A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shuzhilian Technology Co Ltd
Original Assignee
Chengdu Shuzhilian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shuzhilian Technology Co Ltd filed Critical Chengdu Shuzhilian Technology Co Ltd
Priority to CN201310368239.XA priority Critical patent/CN103413278B/zh
Publication of CN103413278A publication Critical patent/CN103413278A/zh
Application granted granted Critical
Publication of CN103413278B publication Critical patent/CN103413278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种商品图片背景噪声的过滤方法,将商品图片的四个角区域作为样本空间进行背景颜色统计,像素点最多的n个类颜色作为背景类,然后,分别从商品图片四个角的第一个像素点开始,向中心扩散,将与背景类或者已标记背景“bkg”的相邻像素点颜色差别在阈值内的像素点,标记为背景“bkg”,不在阈值内的像素点则标记为前景“obj,最后保留商品图片中像素点最多的联通区域,将其它区域都用背景色即纯黑色填充,得到背景噪声过滤的商品图片,这样再提取商品图片的图像颜色特征属性值,则去掉了复杂背景的干扰信息,只和商品图片中的对象部分即商品有关,根据这样的图像颜色特征属性值建立商品图片索引、进行商品搜索,则提高了提高商品搜索的准确率。

Description

一种商品图片背景噪声的过滤方法
技术领域
本发明属于电子商务技术领域,更为具体地讲,涉及一种商品图片背景噪声的过滤方法。
背景技术
电子商务中,传统搜索购物方法是基于商品分类检索或关键词搜索进行的,然而,由于商品种类繁多,同一种商品也具有多种不同型号,检索或搜索的准确度不高,需要逐个查看检索或搜索到的商品,这样用户对于商品的搜索购物还存在一定的繁琐。
现在用户已不仅仅满足于使用文字对商品进行搜索,并且在使用关键词进行搜索时,对商品图片加属性标签的工作量非常大。并且在很多时候,用户看到感兴趣的商品时仅仅是对商品的颜色、形状、纹理有一个视觉感官的认识,用户并不能得到商品相关的文字信息,这对通过文字搜索得到相关商品信息产生了一些限制,因此用户更加希望通过视觉感官的特征也就是商品图像特征来得到商品信息。
在用户上传商品图片进行搜索时,往往更关注图片中的商品,传统的基于图像内容的商品搜索方法的搜索结果往往非常容易受到图片背景的干扰,特别是复杂背景的商品图片,降低了商品搜索的准确度
发明内容
本发明的目的在于克服现有技术的不足,提供一种商品图片背景噪声的过滤方法,以降低复杂背景对获得商品图片中商品部分视觉特征即图像颜色特征属性值的影响,提高商品搜索的准确率。
为实现以上目的,本发明商品图片背景噪声的过滤方法,包括以下步骤:
(1)、选取商品图片四个角区域作为样本空间;
(2)、对每个样本空间按照RGB颜色,统计像素点最多的n个类颜色作为背景类;
(3)、分别从商品图片四个角的第一个像素点开始,向中心扩散;在扩散过程中,若像素点和步骤(2)得到的对应角区域的n个背景类或者和已标记背景“bkg”的相邻像素点颜色差别在阈值内,则标记为背景“bkg”,反之,则标记为前景“obj”;
(4)、对商品图片中,标记为前景“obj”像素点构成的每个联通区域,利用广度优先遍历算法统计每个区域的像素点个数;
(5)、保留商品图片中像素点最多的联通区域,将其它区域都用背景色即纯黑色填充,得到背景噪声过滤的商品图片。
本发明的目的是这样实现的:
本发明商品图片背景噪声的过滤方法,依据商品图片中商品位于中央的特征,将商品图片的四个角区域作为样本空间进行背景颜色统计,像素点最多的n个类颜色作为背景类,然后,分别从商品图片四个角的第一个像素点开始,向中心扩散,将与背景类或者已标记背景“bkg”的相邻像素点颜色差别在阈值内的像素点,标记为背景“bkg”,不在阈值内的像素点则标记为前景“obj,最后保留商品图片中像素点最多的联通区域,将其它区域都用背景色即纯黑色填充,得到背景噪声过滤的商品图片,这样再提取商品图片的图像颜色特征属性值,则去掉了复杂背景的干扰信息,只和商品图片中的对象部分即商品有关,根据这样的图像颜色特征属性值建立商品图片索引、进行商品搜索,则提高了提高商品搜索的准确率。
附图说明
图1是本发明中商品图片一具体实例;
图2是图1所示商品图片过滤过程中颜色直方图;
图3是本发明商品图片背景噪声的过滤方法的流程图;
图4是图3所示统计阶段的流程图;
图5是图1所示商品图片进行颜色类型统计图;
图6是图3所示扩散阶段的流程图;
图7是去掉背景颜色后的商品图片;
图8是图3所示二次净化阶段的流程图;
图9是二值化后的商品图片P2;
图10是经过背景噪声过滤之后的商品图片;
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
图1是本发明中商品图片一具体实例。如图1(a)所示,商品图片中的背景和左侧的价格标识、品牌广告语部分,就会干扰获取的图像颜色特征属性值。因为用户更关心商品图片中商品部分的视觉特征,如图1(b)所示,用户更加希望能够得到方框中标注的商品对象。为了得到关注区域的视觉特征即图像颜色特征属性值。
在本实施例中,选用颜色直方图进行分析,并忽略背景颜色所在的维度,在这个例子中,就忽略图像颜色直方图特征中黑色所在维度的值,就得到图像中的颜色分布比例特征向量值,该向量值在原始商品图片、前景提取后商品图片和背景噪声过滤之后的商品图片中有如图2所示变化(从上到下)。
本发明商品图片背景噪声的过滤方法如图3所示,可分为统计阶段S11、扩散阶段S12以及二次净化阶段S13。
S11:根据商品图片中商品对象一般集中在中间部分的特征,通过商品图片四个角上的颜色类型的统计,得到商品图片背景部分的颜色类型统计结果,如图4所示,其步骤如下:
a1、选取商品图片的四个角区域作为样本空间,角区域大小为(lx/20)*(ly/20),其中lx为目标图像的横向像素点数,ly为目标图像的纵向像素点数,如图5所示;
a2、将一个角区域第一个像素点作为第一类,记作C1类,并把这个像素的RGB颜色分量即属性值作为C1类的特征值;
a3、将C1类放入类别集合C中;
a4、依次遍历此区间的下一个像素点,计算下一个像素点与集合C中每个类的RGB特征值的差值,如果它和类别集合C有一Ck类的差值小于设定的阈值,步骤a6,否则即与所有类的RGB特征值的差值都不小于设定的阈值,就到步骤a5;
a5、建立新的类别Cn+1类,并加入到类别集合C中,转步骤a7;
a6、把该像素点归为Ck类,并把Ck类的计数加1,转步骤a7;
a7、判断是否遍历完整的一个区域,若未遍历完,则到a4,
a8、若已经遍历完,则对下一个角进行步骤a2~a7,直到4个角区域的背景颜色统计完成,然后对每个角取背景颜色统计数最多的n=5类作为该角区域的背景类。
S12:在统计阶段之后进入扩散阶段,扩散阶段是根据统计阶段统计的背景类在商品图片中去掉背景颜色,如图6所示其步骤如下:
b1、将商品图片一个角的第一个像素点作为背景像素点对整张商品图片进行扩散,依次计算商品图片中背景像素点在扩散方向上的相邻像素点的RGB属性值和它本身的RGB属性值以及此角区间统计的5个类的RGB属性值的差值;
b2、判断是否有差值在阈值范围内,如果有,则将该相邻像素点标记为背景“bkg”,否则,标记为前景“obj”;
b3、然后对这些标记为背景“bkg”的相邻像素点在扩展方向上的相邻像素点进行相同的判断和标记,直到遍历完整张商品图片;
b4、选择商品图片下一个角的第一个像素,则重复步骤b1~b3,直到四个角都完成扩散;
b5、在商品图片中,将四个角扩散过程中标记为背景“bkg”的像素点设定为背景颜色,在本实施例中,设定为黑色,这样可以得到去掉背景颜色后的商品图片,如图7所示。
S13:二次净化阶段
去掉背景颜色后的商品图片需要进行二次净化,以去除商品LOGO和商品广告语的小联通区域,留下最大的连通区域,以得到只包含商品对象的商品图片,如图8所示,二次净化的步骤如下:
c1、记去掉背景颜色后的商品图片P1,对商品图片P1进行二值化处理,用单通道存储图像副本信息,将商品图片P1中所有的背景像素点设置为0,即纯黑色,前景像素点设置为255,即纯白色,得到二值化后的商品图片P2,如图9所示;
c2、遍历商品图片P2中的像素点,如果像素点为255即前景像素点,就转动步骤c3,否则,执行步骤c4;
c3、就从该像素点开始用广度优先搜索算法遍历所有的邻接的具有255像素值的像素点,并用整数i进行标记,用线性表list(i)记录此联通区域的像素点个数,然后,执行步骤c4;
c4、判断是否遍历完商品图片P2,遍历完转到步骤c5,没有遍历完,则对下一个像素点执行c2步骤;
c5、选取线性表list(i)记录像素点最多的那个标记,如果商品图片P2中具有该标号,就把商品图片中对应的像素点保留,其它像素则都设置为背景。
经过以上步骤,可以得到二值化以后的商品图片P2中所对应的连通区域的信息,在去掉背景颜色后的商品图片中保留最大连通区域所对应的像素点,而将小连通区域对应像素点设置为背景颜色,就可以得到经过背景噪声过滤之后的商品图片,如图10所示。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (4)

1.一种商品图片背景噪声的过滤方法,包括以下步骤:
(1)、选取商品图片左上、右上、左下以及右下的四个角区域作为样本空间;
(2)、对每个样本空间按照RGB颜色,统计像素点最多的n个类颜色作为背景类;
(3)、分别从商品图片四个角区域向中心扩散;在扩散过程中,将商品图片一个角区域的第一个像素点作为背景像素点对整张商品图片进行扩散,依次计算商品图片中背景像素点在扩散方向上的相邻像素点的RGB属性值,若该相邻像素点和步骤(2)得到的对应角区域的n个背景类或者和已标记为背景“bkg”的该相邻像素点的相邻点颜色差别在阈值内,则将该相邻像素点标记为背景“bkg”,反之,则该相邻像素点标记为前景“obj”;
(4)、对商品图片中,标记为前景“obj”的像素点构成的每个连通区域,利用广度优先遍历算法统计每个连通区域的像素点个数;
(5)、保留商品图片中像素点最多的连通区域,将其它连通区域都用背景色即纯黑色填充,得到背景噪声过滤的商品图片。
2.根据权利要求1所述的过滤方法,其特征在于,步骤(2)中所述每个样本空间按照RGB颜色,统计像素点最多的n个类颜色作为背景类为:
2.1)、将一个角区域第一个像素点作为第一类,记作C1类,并把这个像素的RGB颜色分量即属性值作为C1类的特征值;
2.2)、将C1类放入类别集合C中;
2.3)、依次遍历此角区域的下一个像素点,计算下一个像素点与集合C中每个类的特征值的差值,如果它和类别集合C有一Ck类的差值小于设定的阈值,转到步骤2.5),否则即与所有类的特征值的差值都不小于设定的阈值,就转到步骤2.4);
2.4)、建立新的类别Cn+1类,并加入到类别集合C中,转到步骤2.6);
2.5)、把该像素点归为Ck类,并把Ck类的计数加1,转到步骤2.6);
2.6)、判断是否遍历完整的一个角区域,若未遍历完,则转到2.3),
2.7)、若已经遍历完,则对下一个角区域进行步骤2.1)~2.7),直到4个角区域的背景颜色统计完成,然后对每个角区域取背景颜色统计数最多的n类作为该角区域的背景类。
3.根据权利要求1所述的过滤方法,其特征在于,步骤(3)具体为:
b1、将商品图片一个角区域的第一个像素点作为背景像素点对整张商品图片进行扩散,依次计算商品图片中背景像素点在扩散方向上的相邻像素点的RGB属性值和它本身的RGB属性值以及此角区域统计的5个类的RGB属性值的差值;
b2、判断是否有差值在阈值范围内,如果有,则将该相邻像素点标记为背景“bkg”,否则,标记为前景“obj”;
b3、然后对这些标记为背景“bkg”的相邻像素点在扩展方向上的相邻像素点进行相同的判断和标记,直到遍历完整张商品图片;
b4、选择商品图片下一个角区域的第一个像素,则重复步骤b1~b3,直到四个角区域都完成扩散;
b5、在商品图片中,将四个角区域扩散过程中标记为背景“bkg”的像素点设定为背景颜色,所述背景颜色为黑色,得到去掉背景颜色后的商品图片。
4.根据权利要求3所述的过滤方法,其特征在于,步骤(4)、(5)具体为:
c1、记去掉背景颜色后的商品图片P1,对商品图片P1进行二值化处理,用单通道存储图像副本信息,将商品图片P1中所有的背景像素点的像素值设置为0,即纯黑色,前景像素点的像素值设置为255,即纯白色,得到二值化后的商品图片P2;
c2、遍历商品图片P2中的像素点,如果像素点的像素值为255,即前景像素点,就转到步骤c3,否则,执行步骤c4;
c3、就从该像素点开始用广度优先遍历算法遍历所有的邻接的具有255像素值的像素点,并用整数i进行标记,用线性表list(i)记录此连通区域的像素点个数,然后,执行步骤c4;
c4、判断是否遍历完商品图片P2,遍历完转到步骤c5,没有遍历完,则对下一个像素点执行c2步骤;
c5、选取线性表list(i)记录像素点最多的那个标记,如果商品图片P2中具有该标记,就把商品图片P1中对应的像素点保留,其它像素则都设置为背景。
CN201310368239.XA 2013-08-22 2013-08-22 一种商品图片背景噪声的过滤方法 Active CN103413278B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310368239.XA CN103413278B (zh) 2013-08-22 2013-08-22 一种商品图片背景噪声的过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310368239.XA CN103413278B (zh) 2013-08-22 2013-08-22 一种商品图片背景噪声的过滤方法

Publications (2)

Publication Number Publication Date
CN103413278A CN103413278A (zh) 2013-11-27
CN103413278B true CN103413278B (zh) 2016-06-01

Family

ID=49606283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310368239.XA Active CN103413278B (zh) 2013-08-22 2013-08-22 一种商品图片背景噪声的过滤方法

Country Status (1)

Country Link
CN (1) CN103413278B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096355B (zh) * 2014-05-08 2019-09-17 腾讯科技(深圳)有限公司 图像处理方法和系统
CN104133896B (zh) * 2014-07-31 2017-11-03 可牛网络技术(北京)有限公司 一种网页广告过滤方法及装置
CN104200462B (zh) * 2014-08-04 2017-05-17 深圳市新良田科技股份有限公司 去除图文并茂文档中底色的方法
CN107168968A (zh) * 2016-03-07 2017-09-15 中国艺术科技研究所 面向情感的图像色彩提取方法及系统
CN107564018A (zh) * 2017-08-30 2018-01-09 北京航空航天大学 一种利用改进迭代算法提取目标图像的方法
CN112070786B (zh) * 2020-07-17 2023-11-24 中国人民解放军63892部队 一种警戒雷达ppi图像目标和干扰提取方法
CN112055247B (zh) * 2020-09-11 2022-07-08 北京爱奇艺科技有限公司 一种视频播放方法、装置、系统及存储介质
CN113012202A (zh) * 2021-03-31 2021-06-22 开放智能机器(上海)有限公司 目标跟踪方法、装置、设备、介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768406A (en) * 1994-07-14 1998-06-16 Philips Electronics North America Mass detection in digital X-ray images using multiple threshold levels to discriminate spots
CN101867790A (zh) * 2010-04-23 2010-10-20 刘文萍 毫米波图像分析方法、火灾监控方法和系统
CN101909145A (zh) * 2009-06-05 2010-12-08 鸿富锦精密工业(深圳)有限公司 影像杂讯过滤系统及方法
CN102254152A (zh) * 2011-06-17 2011-11-23 东南大学 基于彩色跳变点和颜色密度的车牌定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768406A (en) * 1994-07-14 1998-06-16 Philips Electronics North America Mass detection in digital X-ray images using multiple threshold levels to discriminate spots
CN101909145A (zh) * 2009-06-05 2010-12-08 鸿富锦精密工业(深圳)有限公司 影像杂讯过滤系统及方法
CN101867790A (zh) * 2010-04-23 2010-10-20 刘文萍 毫米波图像分析方法、火灾监控方法和系统
CN102254152A (zh) * 2011-06-17 2011-11-23 东南大学 基于彩色跳变点和颜色密度的车牌定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种二值图像连通区域标记快速算法;曹长虎等;《科学技术与工程》;20101130;第10卷(第33期);第8168-8171页 *

Also Published As

Publication number Publication date
CN103413278A (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
CN103413278B (zh) 一种商品图片背景噪声的过滤方法
CN104424230B (zh) 一种网络商品推荐方法及装置
CN103412937B (zh) 一种基于手持终端的搜索购物方法
CN102375823B (zh) 搜索结果聚合显示方法及系统
CN103412938A (zh) 一种基于图片交互式多目标提取的商品比价方法
CN106250431B (zh) 一种基于分类服装的颜色特征提取方法及服装检索系统
CN102800085B (zh) 一种在复杂图像中实现对主体目标图像检测及提取的方法
CN106127507A (zh) 一种基于用户评价信息的商品舆情分析方法及系统
CN102930264A (zh) 基于图像识别技术的商品陈列信息采集分析系统及方法
CN103258037A (zh) 一种针对多组合内容的商标识别检索方法
CN106021575A (zh) 一种视频中同款商品检索方法及装置
CN102663448A (zh) 一种基于网络的增强现实物体识别分析方法
Shajini et al. An improved landmark-driven and spatial–channel attentive convolutional neural network for fashion clothes classification
CN116109947A (zh) 一种基于大核等效卷积注意力机制的无人机图像目标检测方法
CN109145911A (zh) 一种街拍照片目标人物提取方法
CN103577993A (zh) 颜色选取方法及装置
Liu et al. Sdm-bsm: A fusing depth scheme for human action recognition
CN106557489A (zh) 一种基于移动终端的服饰搜索方法
CN103049512A (zh) 一种基于商品图像显著图分块加权匹配检索方法
CN110992103A (zh) 一种基于人脸交互的智能货柜商品促销方法
CN106844394B (zh) 基于行人上下衣颜色判别的视频检索方法
CN112446308B (zh) 基于语义增强的多尺度特征金字塔融合的行人检测方法
CN111143638B (zh) 应用于群体间数据关系分析的可视化布局方法、系统、存储介质及计算机设备
CN107451243B (zh) 基于属性的复杂查询方法
CN113065928A (zh) 一种基于大数据的电商交易方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: The inventor has waived the right to be mentioned

Inventor before: The inventor has waived the right to be mentioned

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 610041 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan

Patentee after: Chengdu shuzhilian Technology Co.,Ltd.

Address before: No.2, floor 4, building 1, Jule road crossing, Section 1, West 1st ring road, Wuhou District, Chengdu City, Sichuan Province 610041

Patentee before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd.