CN103049513A - 一种服饰鞋包类商品图像多视觉特征融合方法 - Google Patents
一种服饰鞋包类商品图像多视觉特征融合方法 Download PDFInfo
- Publication number
- CN103049513A CN103049513A CN2012105456168A CN201210545616A CN103049513A CN 103049513 A CN103049513 A CN 103049513A CN 2012105456168 A CN2012105456168 A CN 2012105456168A CN 201210545616 A CN201210545616 A CN 201210545616A CN 103049513 A CN103049513 A CN 103049513A
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- commodity
- different
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明公开了一种基于多种视觉特征融合的服饰鞋包类商品图像检索方法,该方法首先对输入商品图像做背景检测,根据输入图背景的复杂程度,采用不同策略抽取多种视觉特征,在图像库中匹配时,根据不同商品类目的不同特征权重进行融合,通过融合后的相似度度量作为检索图像的排序准则,从而能根据不同类目的不同检索标准得到合理的检索结果;提高了查全率和查准率。本发明有很强的扩展性,对新增类目的商品图像检索,通过类目权重表的设置能很好兼顾到新的类目需求。
Description
技术领域
本发明涉及信息检索和数据挖掘技术领域,特别是涉及一种基于多种视觉特征融合的图片检索方法。
背景技术
图像检索研究兴起自上世纪90时代,早期的图像检索更多的是基于文本的图像检索,随着互联网和多媒体技术的快速发展,图像等多媒体信息呈爆炸性增长。传统基于文本的信息检索技术已经逐步不能满足人们的检索需求。市场调查显示,面对一件衣服,用户给出多个文本描述词汇,都很难从现有的海量网络商品图库中检索出自己所想找的那件商品。Toml等在《A Picture is Wortha Thousand Keywords:Image-Based Object Searchon a Mobile Platform》一文中明显提到在图像搜索中图像内容相对于文本的高效性。同时图像本身具有信息丰富、不受语言限制、便于交流等优点。在这种背景下,基于内容的图像检索技术得到了广泛的发展。利用图像视觉特征,如颜色、形状、纹理等信息,如何迅速而准确地从浩瀚的海量图像数据库中检索到所需的图像,成为近年来计算机视觉领域的研究热点问题,基于内容的图像检索技术因此应运而生。
现有的图像检索方法中,基本的检索步骤包括以下几步:提取图像视觉底层特征写入对应的图像库;将用户输入的待检索图像进行视觉底层特征提取;与图像库中的特征进行相似度匹配度量,按相似度度量排序返回给用户。其中,视觉底层特征的提取主要包括颜色特征、形状特征以及纹理特征。颜色特征提取中常用的算法有颜色直方图、颜色矩方法等;形状特征中的常用算法包括zernike矩、HU不变矩、GIST等方法;纹理特征算法主要有Tamura纹理特征(粗糙度、方向度、对比度)、共生矩阵、Gabor滤波算法等等。
在针对商品图片的图像检索应用过程中,通过市场调研发现用户针对不同类目的商品会有不同的关注点,例如对于服饰,因为存在模特图和商品平铺图,图像中的商品难免存在形变,所以用户对服饰的关注度从主到次依次是:纹理、颜色、形状;而对于鞋包类商品图,由于此类商品形变较小,则用户更关注商品的款式,所以关注度从主到次依次是:形状、颜色、纹理。现有的图像检索方法在图像库内匹配时大多是通用型匹配模式,这很难满足用户在各类目上的检索需求。另外在没有人工交互框选的情况下,对于形状特征,在背景复杂的商品图像上效果均不佳,合理地针对商品图像的背景做些区分,对形状特征的检索效果也有较大提升。
发明内容
本发明的目的是克服现有技术的不足,提供一种能根据待检索商品图像背景复杂与否,并能结合不同商品类目能采取不同融合策略的多视觉特征融合的图像检索方法,从而能满足用户不同类目的检索需求。
本发明的目的是通过以下技术方案来实现的:
(1)图像库特征的提取:提取图像库中的每个图像的颜色、纹理、形状视觉特征,其中部分颜色和形状特征,采用主动分块策略,分为上、下、左、右、图像中心块5个子块和全图块,共6个块图像,提取出每个块的视觉特征。将多种特征合并成为表示该图像的特征向量加入图像库;
(2)由于海量图像库中检索,对步骤1)得到的图像特征库进行KMeans聚类切分,保证查全率的前提下,提升检索性能;
(3)对于用户输入的待检索商品图像,用背景检测算法检测该图像的背景复杂度,并根据复杂度对检索图像提取不同的视觉底层特征(形状,颜色,纹理等),并将多种特征合并成为表示该图像的特征向量;
(4)计算步骤3得到的待检索的图像特征向量与聚类切分后的各个聚类中心的距离度量,寻找最近聚类簇;
(5)计算步骤3得到的待检索的图像特征向量与步骤4)得到的最近聚类簇中的所有图像特征向量之间的相似度度量:先对各种类型的特征(颜色、形状、纹理等)分别计算距离度量,然后对度量分别做聚类簇内的归一化,在按不同类目配置的权重,线性组合得到最终的相似度度量;
(6)将步骤5得到的相似度度量进行升序排序,将排序后的前若干个结果返回给用户,即为所检索的结果;
本发明的有益效果是,本发明首先对用户输入的待检索商品图片,以图片背景单一或者复杂进行分类,并根据背景单一与复杂两种不同的情况,相应地抽取不同的多种底层视觉特征;在与图像库中匹配过程中引入了商品类目相关的底层视觉特征权重表,这样检索的结果能体现出不同商品类目的视觉特性相应的偏重,从而满足不同商品类目检索的客户需求,提高了用户体验效果。
附图说明
图1是图片数据集入库的流程图;
图2是检索用户输入商品图片的流程图。
具体实施方式
下面结合附图详细描述本发明,本发明的目的和效果将变得更加明显。
如图1所示,本发明多视觉特征融合方法中图像库特征提取过程包括如下步骤:
步骤1:图像库的视觉特征提取。
在本专利中具体采用以下几种视觉特征:
颜色特征采用了颜色直方图描述符、颜色结构描述符、颜色布局描述符。
颜色直方图描述符(Color Histogram Descriptor,CHD),表达了图像颜色分布统计上的信息,在本专利中对64维的颜色直方图特征进行提取。
MPEG-7的颜色结构描述符(Color Structure Descriptor,CSD),反应了颜色聚合度,对于背景单一的商品图像,对商品主题进行了较好的描述,本专利采用了64维的颜色结构特征。
MPEG-7的颜色布局描述符(Color layout Descriptor,CLD),表达了颜色在空间的分布信息。本发明对该算子采用主动分块策略(即分为上、下、左、右、图像中心块5个子块和全图块,共6个块图像分别抽取特征),采用了72维(12*6)颜色布局特征。
纹理特征采用了MPEG-7的边缘直方图描述符(Edge Histogram Descriptor,EHD),提取了描述来自16个子图像的内容的80维数据。
形状特征采用了,Aude Oliva,Antonio Torralba:Modeling the Shapeof the Scene:A Holistic Representation of the SpatialEnvelope.International Journal of Computer Vision,Vol.42(3):145-175(2001)的GIST特征方法,提取了512维度的特征向量维度,并对数据进行PCA降维为53维度,并采用了主动分块策略,6个子块图像特征数据长度共计为318维(53*6)。
本专利采用了以上5种特征对商品库进行特征提取并入库,每幅图像共598维特征数据。
步骤2:对商品库图像进行根据相似度进行聚类切分。
如图2所示,对于输入的商品图像,背景是单一还是复杂,两者所提取的图像特征不同,若背景单一,则采用CSD、GIST、CLD、EHD等特征,若复杂则采用CHD、CLD、EHD等特征,CLD特征和EHD特征是两者所公有的特征。在聚类切分时,依据CLD特征和EHD特征上的距离度量来做聚类,保证了检索效果的稳定性。
步骤3对用户输入的商品查询图像进行特征提取。
首先对查询图像判断其背景是否复杂,通过图像分割的方法,自动提取前景(商品主体)。然后对背景部分(商品主体外部分)区域的颜色、边缘和纹理进行分析得到该查询图像背景是否复杂,若复杂则提取其CHD、CLD、EHD等特征,若背景单一,则提取CSD、GIST、CLD、EHD等特征数据。
步骤4:对输入商品查询图像在商品库中寻找最近聚类簇。
根据步骤3中提取得到的查询图像的视觉特征,根据CLD和EHD特征数据,同各个簇的中心数据进行比较,查找到与查询图像最相近的聚类簇;这些聚类簇构成了后续进行相似度度量的基础数据源。
步骤5:待检索的图像特征向量与图像库的特征向量的相似度计算。
首先根据查询图像的背景复杂度,选择不同的特征数据进行距离度量。
对背景单一的查询商品图像,采用步骤2中提取的采用CSD、GIST、CLD、EHD等特征进行度量,若背景复杂的查询图像,则采用CHD、CLD、EHD等特征进行度量。
上述五种特征描述符所采用的距离度量,除EHD特征数据外,在本专利中统一采用了L1距离进行度量:
边缘直方图描述符(EHD),以MPEG-7中EHD专用的距离度量,具体可以参见《Text of ISO/IEC 15938-8 PDTR(Extraction and Use of MPEG-7Descriptions)》。
另外,CLD特征和GIST特征均为分块特征,在实验中,各个块的在匹配度量时的权重系数分别为:全图块和中心块的权重系数为0.3,其他四个子块权重系数为0.1,待检索的图像Iq和图像库中图像Im的度量距离D(Iq,Im)为:
式中,Di为特征数据,然后对各个类型特征的特征距离进行归一化,特征在聚类簇内的归一化公式:
其中,Dmin=min{D(Iq,Im)|Im in the Cluster},
Dmax=max{D(Iq,Im)|Im in the Cluster};
最终相似度度量公式:
若输入图像是背景单一的图像:
DSim=wCSD*DCSD+wCLD*DCLD+wEHD*DEHD+wGIST*DGIST,
若输入图像是背景复杂的图像:
DSim=DCHD+DCLD+DEHD。
其中,DSim是相似度距离度量,DCHD,DCSD,DCLD,DEHD,DGIST分别是对应的各种特征在簇内归一化后的距离,wCSD,wCLD,wEHD,wGIST分别是对应的视觉特征相应的权重。
在此特别说明一下wCSD,wCLD,wEHD,wGIST等权重值,具体数据是通过一定的类目样本集训练得到的,权重值体现了客户检索的需求。如服饰类非刚体商品,颜色特征CSD,CLD对应的权重所占的比例较大,而对于鞋包,GIST和EHD的权重比值较大。
步骤6按照相似度大小,显示给用户。
最终按簇内所有的特征向量的相似度距离进行升序排序,度量值越小,对应的图像越和输入图相似。将排序后的序列前若干个图像作为检索结果返回用户。
本专利通过对输入图像背景检测结果,采用不同的特征提取策略对图像视觉特征进行提取,然后在检索匹配时,针对商品的不同类目,采用不同的融合权重,通过调整类目权重表,来满足用户在不同类目上的检索需求,且可扩展性强。同时根据不同的特征抽取策略,采用公共部分的特征向量的距离度量对图像库特征向量进行聚类切分,使得本方法在保证检索效果的前提下,加速了检索性能,实现在海量图像数据中的实时检索。
Claims (1)
1.一种服饰鞋包类商品图像多视觉特征融合方法,其特征在于,包括如下步骤:
(1)图像库特征的提取:提取图像库中的每个图像的颜色、纹理、形状视觉特征,其中部分颜色和形状特征,采用主动分块策略,分为上、下、左、右、图像中心块5个子块和全图块,共6个块图像,提取出每个块的颜色和形状特征;将上述特征合并成为表示该图像的特征向量加入图像库;
(2)对步骤(1)得到的图像特征向量库根据相似度进行KMeans聚类切分,在保证查全率的前提下,提升检索性能;
(3)对用户输入的商品查询图像进行特征提取:对于用户输入的待检索商品图像,用背景检测算法来检测该图像的背景是否单一,并以此来采用相应的策略提取所需的多种视觉底层特征(形状,颜色,纹理等),并将多种特征合并成为表示该输入图像的特征向量;
(4)计算步骤3得到的待检索的图像特征向量与步骤2得到的聚类切分后的各个聚类中心的距离,寻找最近聚类簇;
(5)计算步骤3得到的待检索的图像特征向量与步骤4得到的最近聚类簇中的所有图像特征向量之间的相似度距离度量:先对各种类型的特征(颜色、形状、纹理等)分别计算距离度量,然后对距离度量分别做聚类簇内的归一化,再按不同类目的不同特征权重,线性组合得到最终的相似度度量;
(6)将步骤5得到的相似度度量进行升序排序,将排序后的前若干个结果返回给用户,即为所检索的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105456168A CN103049513A (zh) | 2012-12-14 | 2012-12-14 | 一种服饰鞋包类商品图像多视觉特征融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105456168A CN103049513A (zh) | 2012-12-14 | 2012-12-14 | 一种服饰鞋包类商品图像多视觉特征融合方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103049513A true CN103049513A (zh) | 2013-04-17 |
Family
ID=48062154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012105456168A Pending CN103049513A (zh) | 2012-12-14 | 2012-12-14 | 一种服饰鞋包类商品图像多视觉特征融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103049513A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744934A (zh) * | 2013-12-30 | 2014-04-23 | 南京大学 | 一种基于位置敏感哈希的分布式索引方法 |
CN103955543A (zh) * | 2014-05-20 | 2014-07-30 | 电子科技大学 | 基于多模态的服装图像检索方法 |
CN104298775A (zh) * | 2014-10-31 | 2015-01-21 | 北京工商大学 | 多特征基于内容的图像检索方法和系统 |
CN104298749A (zh) * | 2014-10-14 | 2015-01-21 | 杭州淘淘搜科技有限公司 | 一种图像视觉和文本语义融合商品检索方法 |
CN104991954A (zh) * | 2015-07-20 | 2015-10-21 | 河海大学 | 基于图像搜索的购物搜索系统及其实现方法 |
CN111008210A (zh) * | 2019-11-18 | 2020-04-14 | 浙江大华技术股份有限公司 | 商品识别方法、装置、编解码器及存储装置 |
CN111798286A (zh) * | 2020-04-26 | 2020-10-20 | 北京沃东天骏信息技术有限公司 | 物品搭配方法、物品搭配模型的构建方法和计算机 |
CN113362543A (zh) * | 2021-05-21 | 2021-09-07 | 北京百度网讯科技有限公司 | 结算方法、装置、电子设备以及存储介质 |
CN113554091A (zh) * | 2021-07-21 | 2021-10-26 | 长江存储科技有限责任公司 | 分解半导体结构的布局的方法、装置、系统和存储介质 |
CN115495603A (zh) * | 2022-09-26 | 2022-12-20 | 江苏衫数科技集团有限公司 | 一种服装图像检索方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021857A (zh) * | 2006-10-20 | 2007-08-22 | 鲍东山 | 基于内容分析的视频搜索系统 |
CN101551823A (zh) * | 2009-04-20 | 2009-10-07 | 浙江师范大学 | 一种综合多特征图像检索方法 |
-
2012
- 2012-12-14 CN CN2012105456168A patent/CN103049513A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021857A (zh) * | 2006-10-20 | 2007-08-22 | 鲍东山 | 基于内容分析的视频搜索系统 |
CN101551823A (zh) * | 2009-04-20 | 2009-10-07 | 浙江师范大学 | 一种综合多特征图像检索方法 |
Non-Patent Citations (3)
Title |
---|
刘鹏宇: "《基于内容的图像特征提取算法的研究》", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
张薷等: "《基于内容的图像检索技术在购物网站中的应用研究》", 《情报科学》 * |
林丽惠等: "《基于内容的图像检索在电子商务中的应用》", 《吉林师范大学学报(自然科学版)》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744934A (zh) * | 2013-12-30 | 2014-04-23 | 南京大学 | 一种基于位置敏感哈希的分布式索引方法 |
CN103955543A (zh) * | 2014-05-20 | 2014-07-30 | 电子科技大学 | 基于多模态的服装图像检索方法 |
CN104298749A (zh) * | 2014-10-14 | 2015-01-21 | 杭州淘淘搜科技有限公司 | 一种图像视觉和文本语义融合商品检索方法 |
CN104298775A (zh) * | 2014-10-31 | 2015-01-21 | 北京工商大学 | 多特征基于内容的图像检索方法和系统 |
CN104991954A (zh) * | 2015-07-20 | 2015-10-21 | 河海大学 | 基于图像搜索的购物搜索系统及其实现方法 |
CN104991954B (zh) * | 2015-07-20 | 2018-08-21 | 河海大学 | 基于图像搜索的购物搜索系统及其实现方法 |
CN111008210A (zh) * | 2019-11-18 | 2020-04-14 | 浙江大华技术股份有限公司 | 商品识别方法、装置、编解码器及存储装置 |
CN111008210B (zh) * | 2019-11-18 | 2023-08-11 | 浙江大华技术股份有限公司 | 商品识别方法、装置、编解码器及存储装置 |
CN111798286A (zh) * | 2020-04-26 | 2020-10-20 | 北京沃东天骏信息技术有限公司 | 物品搭配方法、物品搭配模型的构建方法和计算机 |
CN113362543A (zh) * | 2021-05-21 | 2021-09-07 | 北京百度网讯科技有限公司 | 结算方法、装置、电子设备以及存储介质 |
CN113362543B (zh) * | 2021-05-21 | 2023-10-31 | 北京百度网讯科技有限公司 | 结算方法、装置、电子设备以及存储介质 |
CN113554091A (zh) * | 2021-07-21 | 2021-10-26 | 长江存储科技有限责任公司 | 分解半导体结构的布局的方法、装置、系统和存储介质 |
CN115495603A (zh) * | 2022-09-26 | 2022-12-20 | 江苏衫数科技集团有限公司 | 一种服装图像检索方法和系统 |
CN115495603B (zh) * | 2022-09-26 | 2023-11-24 | 江苏衫数科技集团有限公司 | 一种服装图像检索方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103049513A (zh) | 一种服饰鞋包类商品图像多视觉特征融合方法 | |
Strehl et al. | Relationship-based clustering and visualization for high-dimensional data mining | |
CN107679960B (zh) | 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法 | |
CN108614884A (zh) | 一种基于卷积神经网络的服装图像检索方法 | |
US20080144943A1 (en) | System and method for enabling image searching using manual enrichment, classification, and/or segmentation | |
CN104298749A (zh) | 一种图像视觉和文本语义融合商品检索方法 | |
EP2092444A2 (en) | Image recognition system for use in analysing images of objects and applications thereof | |
CN107729900A (zh) | 一种利用图片属性提取完成录入信息补全的方法及设备 | |
CN105868686A (zh) | 视频分类方法及装置 | |
CN105205135B (zh) | 一种基于主题模型的3d模型检索方法及其检索装置 | |
CN103186538A (zh) | 一种图像分类方法和装置、图像检索方法和装置 | |
CN101950400A (zh) | 网络购物导航方法 | |
CN105740378B (zh) | 一种数字病理全切片图像检索方法 | |
CN101937549A (zh) | 网络购物导航系统 | |
Alnihoud | Content-based image retrieval system based on self organizing map, fuzzy color histogram and subtractive fuzzy clustering. | |
CN109934258A (zh) | 特征加权和区域整合的图像检索方法 | |
CN105183795A (zh) | 基于内容的遥感图像变化检测信息检索方法 | |
CN107622071B (zh) | 通过间接相关反馈在无查源下的衣服图像检索系统及方法 | |
WO2008142675A1 (en) | A method and a system for organizing an image database | |
CN106407281B (zh) | 图像检索方法及装置 | |
Hsiao et al. | On visual similarity based interactive product recommendation for online shopping | |
Ait-Aoudia et al. | YACBIR: yet another content based image retrieval system | |
Oussalah | Content based image retrieval: review of state of art and future directions | |
Khodaskar et al. | Image mining: an overview of current research | |
Zeng et al. | A color boosted local feature extraction method for mobile product search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130417 |