CN102800085B - 一种在复杂图像中实现对主体目标图像检测及提取的方法 - Google Patents
一种在复杂图像中实现对主体目标图像检测及提取的方法 Download PDFInfo
- Publication number
- CN102800085B CN102800085B CN201210206666.3A CN201210206666A CN102800085B CN 102800085 B CN102800085 B CN 102800085B CN 201210206666 A CN201210206666 A CN 201210206666A CN 102800085 B CN102800085 B CN 102800085B
- Authority
- CN
- China
- Prior art keywords
- image
- region
- complicated
- subject goal
- main target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种在复杂图像中实现对主体目标图像检测及提取的方法,自动对输入的复杂图像进行主体目标图像检测及提取。采用快速图分割算法将图像分割成多个区域后,结合主体目标位置正态分布假设,对于每一个分割之后的区域,考虑位置权重以及区域大小,对图像分割后的每个区域计算主体目标的权重值,权值最大的区域为主体目标图像。本方法尤其适合在电子商务和在线购物网站使用,消除复杂图像背景的影响,辨识和分析主体目标图像,为购物图像搜索引擎服务。
Description
所属技术领域
本发明涉及图像处理以及搜索引擎技术领域,具体是一种针对购物图像中主体目标/商品(包括:衣物、包、鞋等商品)的提取方法。
背景技术
基于内容的购物图像搜索是近年来学术界和工业界的研究热点,然而图像背景杂乱、多目标共存、物体遮挡等问题使得大规模图像搜索成为一个具有挑战性的研究课题。同时,在电子商务和在线购物网站,如淘宝、腾讯拍拍等,商家主要通过拍摄的商品图像向顾客展示商品的细节、式样等多方面信息。除了纯色背景下的简单商品图像,为了吸引顾客,商家往往会将大多数商品置于自然场景下,或通过模特试穿展示其真实的效果,并将这些具有复杂背景的商品照片,用于电子商务网站或者购物网站以方便消费者挑选购买。因此,这些图像通常不仅包含要出售的商品本身,还包含一些复杂的背景,和一些起衬托作用的物品(例如,商家会在一个需要出售的女包旁边摆上一束鲜花来衬托这款包,或商品背景中存在房子和汽车等背景)。这些背景噪声会极大地影响基于内容的购物图像搜索引擎的搜索效果。为消除背景的影响,辨识和分析目标,更好地为购物图像搜索引擎服务,需将主体商品目标提取出来,用于后期的特征提取。
Pedro F.Felzenszwalb提出了一种基于图(Graph)的快速图像分割算法,Pedro F.Felzenszwalb,Daniel P.Huttenlocher:Efficient Graph-BasedImage Segmentation.International Journal of Computer Vision 59(2):167-181(2004)由于其具有执行效率高、分割精度准等优点,该算法成为图像分割领域重要的算法之一。在该算法中,图像被映射为一个无向图,边被赋以权值,代表这条边所连接的两个顶点的相似度。快速图分割算法[1]期望对图像进行分割后,同一区域中的像素相似度很高,而不同区域之间的相似度很低,即同一个区域中像素之间的边权值很高,而连接不同区域的边权值则很低。然而该算法用于图像分割,没有直接用于主体目标检测。
发明内容
鉴于现有技术的以上缺点,本发明的目的是,提供一种在复杂图像中实现对主体目标图像检测及提取的方法,自动对输入的复杂图像进行主体目标图像检测及提取。
本发明的目的是通过如下的手段实现的。
一种在复杂图像中实现对主体目标图像检测及提取的方法,自动对输入的复杂图像进行主体目标图像检测及提取,其特征在于,包含如下的步骤:
1)图像预处理:对复杂图像进行降低图像中噪声干扰的预处理;
2)图像分割:1)处理过后的图像,采用基于图的快速图像分割算法(Felzenszwalb算法)进行分割,将图像分割成多个区域;
3)对2)所获图像分块进行图像位置正态分布分布建模,根据正态分布模型计算图像中每个块的权重,即概率值;
4)主体目标提取:结合主体目标位置正态分布假设,对于每一个分割之后的区域,考虑位置权重以及区域大小,对图像分割后的每个区域计算主体目标的权重值,权值最大的区域即为主体目标图像;
5)输出所获主体目标图像信号。
本发明方法考虑到商品或主体目标在购物图像中通常处于中心位置,且其具有一定大小,在快速图分割算法的基础上,根据购物图像的特点,综合考虑分割后形成的区域所处的位置以及区域大小这两个因素,将区域中分块位置与图像中心的距离构建为一个高斯分布,形成了区域位置权重,并结合区域的大小,本发明提出的一种针对购物图像的主体商品目标检测和提取算法,用于更加准确地获取购物图像中的主体商品或目标对象。
附图说明:
图1是本发明购物图像衣物商品主体目标提取算法的流程图。
图2为位置权重正态分布模型。从图中可以看出,块b越靠近图像中心,它是主体目标的可能性就越大(中心区域),越往图像边缘靠近这个块是图像主体目标的可能性就越小(边缘区域)。
图3为图像被分为nxn的块,以及所对应的位置权重分布。
图4-9是本发明实施效果图。其中图4、5、6为女包图像,图7、8、9为衣物图像,从左至右依次为原图像、快速图分割结果图、主体目标提取结果图。由实验结果可知,本发明对提取购物图像主体目标具有较好的结果。
具体实施方式
下面结合附图及具体实施例对本发明做进一步详细的说明,但本发明不限于本实施例。
步骤1:对图像进行预处理,可以采用中值滤波或者高斯平滑处理来过滤图像中的部分噪声;
步骤2:使用快速图分割算法对图像进行分割,得到若干个区域S=(R1,...,Rr),其中区域Ri对应图像中的某个对象或对象的一部分。
步骤3:建立购物图像位置权重正态分布模型。
将图像均匀划分为n×n的块,每个块b到图像中心的距离为r。此处也可以不对图像进行分块,直接把每个像素点看成一个块,根据与中心的距离而获得其权重值。
用如下式所示的正态分布描述图像中每个块b是主体目标的概率,
其中p(r)表示到图像中心距离为r的块是商品主体目标的概率;若b越接近图像中心,那么p(r)的值就越大,即该块b是商品主体目标的可能性越大。μ处于图像中心,且当b位于图像中心(r=0)时p(r)取得最大值。
计算由步骤2得到的分割后的图像中每个区域是主体目标的概率。
分割后的图像中每个区域Ri由有限个离散的块b组成,将这些块成为主体目标的概率进行加和后得到这个块是主体目标的权重,如下式所示:
p(Ri)表示每个区域Ri是主体目标的权重,bj表示Ri中的块,rj表示每个块bj到图像中心的距离。
步骤4:对购物图像进行主体目标检测。提取权重p(Ri)最大的区域作为主体目标。
具体算法实现如下:
输入:带检测图像I 输出:主目标O
中间步骤:
1.对图像进行预处理,这里进行平滑处理;
2.构建图像I的无向图G(V,E),且V中含有n个顶点,E中包含有m条边;
3.将集合E中的边依据权值递增排序构成集合μ=(o1,...,om);
4.构造图G的初始分割S0,S0中每个顶点vi构成一个独立的区域;
5.令q=1,...,m.重复执行步骤4;
6.已知Sq-1求解Sq。vi和vj代表μ中第q条边的两个顶点,即oq=(vi,vj);代表分割Sq-1中包含顶点vi,而代表分割Sq-1中包含顶点vj;如果并且那么通过合并Sq-1中的区域和区域得到分割Sq;
否则Sq=Sq-1;图G的分割S=Sq,Sq由若干区域构成,即Sq=(R1,...,Rr);
7.对R1,...,Rr所有区域,计算每个区域是主目标影响力权值
Claims (2)
1.一种在复杂图像中实现对主体目标图像检测及提取的方法,自动对输入的复杂图像进行主体目标图像检测及提取,其特征在于,包含如下的步骤:
1)图像预处理:对复杂图像进行降低图像中噪声干扰的预处理;
2)图像分割:1)处理过后的图像,采用基于图的快速图像分割Felzenszwalb算法进行分割,将图像分割成多个区域;
3)对2)所获图像分块进行图像位置正态分布分布建模,根据正态分布模型计算图像中每个块的权重,即概率值;
4)主体目标提取:结合主体目标位置正态分布假设,对于每一个分割之后的区域,考虑位置权重以及区域大小,对图像分割后的每个区域计算主体目标的权重值,权值最大的区域即为主体目标图像;
5)输出所获主体目标图像信号。
2.根据权利要求1所述的在复杂图像中实现对主体目标图像检测及提取的方法,其特征在于,采用以下的算法对所述复杂图像进行降低图像中噪声干扰的预处理:中值滤波、高斯平滑处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210206666.3A CN102800085B (zh) | 2012-06-21 | 2012-06-21 | 一种在复杂图像中实现对主体目标图像检测及提取的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210206666.3A CN102800085B (zh) | 2012-06-21 | 2012-06-21 | 一种在复杂图像中实现对主体目标图像检测及提取的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102800085A CN102800085A (zh) | 2012-11-28 |
CN102800085B true CN102800085B (zh) | 2015-01-28 |
Family
ID=47199183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210206666.3A Active CN102800085B (zh) | 2012-06-21 | 2012-06-21 | 一种在复杂图像中实现对主体目标图像检测及提取的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102800085B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740792B (zh) * | 2016-01-25 | 2019-03-12 | 浙江生辉照明有限公司 | 目标检测方法和装置 |
CN108802062B (zh) * | 2017-04-27 | 2020-12-18 | 珠海汇金科技股份有限公司 | 一种检测盖章图像印油情况的检测方法及盖章设备 |
CN108921157A (zh) * | 2018-06-04 | 2018-11-30 | 四川斐讯信息技术有限公司 | 一种图像中感兴趣物体的选择方法及系统 |
CN109165557A (zh) * | 2018-07-25 | 2019-01-08 | 曹清 | 景别判断系统及景别判断方法 |
CN110276767B (zh) * | 2019-06-28 | 2021-08-31 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN110149482B (zh) * | 2019-06-28 | 2021-02-02 | Oppo广东移动通信有限公司 | 对焦方法、装置、电子设备和计算机可读存储介质 |
CN110428366B (zh) * | 2019-07-26 | 2023-10-13 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN110490196B (zh) * | 2019-08-09 | 2022-11-15 | Oppo广东移动通信有限公司 | 主体检测方法和装置、电子设备、计算机可读存储介质 |
CN111958601A (zh) * | 2020-08-19 | 2020-11-20 | 西南交通大学 | 一种基于深度学习的自动化寻径与物料识别方法 |
CN116978319B (zh) * | 2023-08-09 | 2024-06-11 | 山东晶大光电科技有限公司 | 一种分布式led信息显示系统及控制方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101789005A (zh) * | 2010-01-22 | 2010-07-28 | 深圳创维数字技术股份有限公司 | 一种基于感兴趣区域的图像检索方法 |
CN102289797B (zh) * | 2011-08-02 | 2013-01-23 | 于元隆 | 一种基于巴氏距离的层级式图像分割方法 |
-
2012
- 2012-06-21 CN CN201210206666.3A patent/CN102800085B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102800085A (zh) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102800085B (zh) | 一种在复杂图像中实现对主体目标图像检测及提取的方法 | |
John et al. | RVNet: Deep sensor fusion of monocular camera and radar for image-based obstacle detection in challenging environments | |
Hoi et al. | Logo-net: Large-scale deep logo detection and brand recognition with deep region-based convolutional networks | |
US8798362B2 (en) | Clothing search in images | |
US9817900B2 (en) | Interactive clothes searching in online stores | |
CN104298749A (zh) | 一种图像视觉和文本语义融合商品检索方法 | |
CN103383700B (zh) | 基于边缘方向差直方图的图像检索方法 | |
CN107679960B (zh) | 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法 | |
CN104281679B (zh) | 基于图像特征的商品分类方法及装置 | |
CN106021575A (zh) | 一种视频中同款商品检索方法及装置 | |
CN106021603A (zh) | 一种基于分割和特征匹配的服装图像检索方法 | |
CN106933867A (zh) | 一种图像查询方法和装置 | |
CN108985285B (zh) | 一种基于机器识别的商品专利获取方法及系统 | |
CN106250431B (zh) | 一种基于分类服装的颜色特征提取方法及服装检索系统 | |
CN102170447A (zh) | 一种基于最近邻及相似度测量检测钓鱼网页的方法 | |
CN102779270A (zh) | 一种针对购物图像搜索的目标衣物图像提取方法 | |
CN101950400A (zh) | 网络购物导航方法 | |
JP6571200B2 (ja) | 製品インデキシング方法およびそのシステム | |
CN108959379A (zh) | 一种基于视觉显著区域和手绘草图的服装图像检索方法 | |
CN104281572A (zh) | 一种基于互信息的目标匹配方法及其系统 | |
CN102034116A (zh) | 基于互补特征和类描述的商品图像分类方法 | |
CN103049512B (zh) | 一种基于商品图像显著图分块加权匹配检索方法 | |
CN103353865A (zh) | 一种基于位置的易货电子交易商品推荐方法 | |
CN103942693A (zh) | 识别杂货铺的方法、装置及搜索店铺的方法、系统 | |
Xu et al. | Human activity recognition based on pose points selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |