CN102819566A - 一种商品图像跨类目检索方法 - Google Patents

一种商品图像跨类目检索方法 Download PDF

Info

Publication number
CN102819566A
CN102819566A CN2012102465339A CN201210246533A CN102819566A CN 102819566 A CN102819566 A CN 102819566A CN 2012102465339 A CN2012102465339 A CN 2012102465339A CN 201210246533 A CN201210246533 A CN 201210246533A CN 102819566 A CN102819566 A CN 102819566A
Authority
CN
China
Prior art keywords
commodity
classification
picture
retrieve
carried out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102465339A
Other languages
English (en)
Inventor
王海洋
黄琦
林建聪
孙凯
张继霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU TAOTAOSOU TECHNOLOGY Co Ltd
Original Assignee
HANGZHOU TAOTAOSOU TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU TAOTAOSOU TECHNOLOGY Co Ltd filed Critical HANGZHOU TAOTAOSOU TECHNOLOGY Co Ltd
Priority to CN2012102465339A priority Critical patent/CN102819566A/zh
Publication of CN102819566A publication Critical patent/CN102819566A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种商品图像跨类目检索方法,该方法可以对服饰类商品图像进行自动分类,从而有效减少用户交互,方便快捷,改善了用户基于商品视觉信息购物体验,本发明通过提取商品的布局和形状等特征,通过特征选择方法,对数据进行降维操作,复杂度低且分类识别率高。

Description

一种商品图像跨类目检索方法
技术领域
本发明涉及图像搜索技术领域和图像分类技术领域,尤其涉及一种基于用户交互的图像检索系统。
背景技术
在当今商品购物网站上,用户对自己商品搜索通常采用传统的文本搜索方法。但是文本信息往往很难描述出所有商品的细节,比如商品的多种视觉特性(颜色、形状和纹理等)。结合商品图像能够更为直接同时较为全面的描述商品的各种视觉特性,实现快速查找目标商品信息的导购系统。
在图像搜索技术中,对于跨类目搜索,往往不能够达到理想的效果。比如:搜索一只鞋,在搜索过程中往往会找到与之相似的其它类目的商品(如裤子)。为了改善用户的视觉搜索购物体验,采用用户选取类目的方法来提高搜索的效率和效果,但此方法又会给用户带来过于繁琐的人机交互操作。为简化用户操作,提出采用机器学习的自动分类方法,对用户指定的商品图像进行自动分类,以达到减少用户人机交互的目的。
发明内容
本发明的目的在于针对现有技术的不足,提供一种商品图像跨类目检索方法。
本发明的目的是通过以下技术方案来实现的:一种商品图像跨类目检索方法,该方法包括以下步骤:
(1)用户交互框选图片中商品区域,选择商品主体区域;
(2)对商品图片进行布局和形状特征提取,为后续图片类目识别提供特征数据;
(3)对特征数据进行融合和选择;
(4)对图片进行商品分类,得到属于各个商品类目的归属概率。
(5)对分类归属概率进行置信度评估,判断分类是否成功。
(6)进入检索流程,分析分类是否成功,并进入不同的商品库进行检索:若分类成功,则进入子商品类目库进行检索,若分类失败则进入商品全类目库进行检索。
本发明的有益效果是,本发明商品图像跨类目检索方法可以对服饰类商品(也可以应用到其它的商品类目)图像进行自动分类,从而有效减少用户交互,方便快捷,改善了用户基于商品视觉信息购物体验,本发明通过提取商品的布局和形状等特征,通过特征选择方法,对数据进行降维操作,复杂度低且分类识别率高。
附图说明
图1是系统框架图;
图2是图像分类流程图;
图3是分类器训练流程图。
具体实施方式
下面以服饰类图像的分类检索为例,结合附图对本发明做进一步详细的说明。整个系统的框架及流程如附图1所示。
本发明商品图像跨类目检索方法包括以下步骤:
步骤1:用户交互框选图片中商品区域,选择商品主体区域。
用户上传的商品图片可能存在拍摄的商品图片中含有其他非商品对象的情况,需要通过人机交互来选择商品主题区域。
在上传图像显示区域中,通过鼠标左键拖动框选出包围商品主体区域的矩形框,某些商品图像,由于商品主体的摆放可能倾斜,需要做出适当调整,可以点选角度按钮进行适当的旋转,直到商品主体正向摆放为止。
步骤2:对商品图片进行布局和形状特征提取,为后续图片类目识别提供特征数据。
在本发明中,布局构图TOPOLOGY特征采用了MPEG-7中的CLD颜色和EHD[2]纹理特征进行提取。其中,基于CLD抽取的特征向量维度为18,基于EHD抽取的特征维度为80。
在形状特征中,采用了Aude Oliva,Antonio Torralba:Modeling the Shapeof the Scene: A Holistic Representation of the SpatialEnvelope.International Journal of Computer Vision,Vol. 42(3):145-175(2001)的特征抽取方法,提取了GIST512维度的特征向量维度。
步骤3:对特征数据进行融合和选择
在上述步骤中,颜色、纹理和形状三者共提取的特征共为610维,为了将三种特征融合在一起,对其规范化处理。在实验中将5000个训练样本图像的特征抽取后,计算其均值和方差,并采用以下公式,对每一个样本进行规范化:
x · ehd = ( x ehd - mean ehd ) / δ ehd ,
x · cld = ( x cld - mean cld ) / δ ckd ,
x · gist = ( x gist - mean gist ) / δ gist .
融合后的特征为一个610维的特征向量为:
x . merge = [ x . ehd , x . cld , x . gist ] .
式中,
meanehd、meancld、meangist分别表示对样本规范化得到的纹理、颜色、形状维度的均值;
δehd、δcld、δgist分别表示对样本规范化得到的纹理、颜色、形状维度的方差;
xehd、xcld、xgist分别表示每个样本规范化前的纹理、颜色、形状特征;
Figure BDA00001896555300032
xgist分别表示每个样本规范化后的纹理、颜色、形状特征;
Figure BDA00001896555300033
为规范化后每个样本的融合特征数据,由纹理、颜色、形状三个维
度规范化后的数据构成。
特征的长度过长,会使分类模型的计算复杂度变得过高同时还会影响分类器的泛化能力。本发明选择Mark A.Hall Correlation-based Feature Selectionfor Machine Learning.Hamilton.New Zealand(1999)的CFS方法作为特征选择的工具,可以将特征从融合后原始的610维降至100维,降低了数据的冗余性,而分类效果与特征选择前相比并没有下降,并减少了系统的计算复杂度,快速且有效。
步骤4:对图片进行商品分类,得到属于各个商品类目的归属概率。
用户框选的图片经过特征提取后,进入商品分类器,计算得到该商品图片隶属于各个商品类目的归属概率。分类整体流程如附图2所示,其中的分类器需要事先经过线下训练。本发明提出的分类方法可以对上衣和裙子、下衣、鞋和包四大商品类目自动分类,分类器训练具体流程如附图3所示。
通过分类器对输入的框选图片的特征进行分类识别,本发明选择Hsuan-TienLin,Chih-Jen Lin,and Ruby C.Weng:A note on Platt’s probabilisticoutputs for support vector machines.Technical report,Department ofComputer Science,National Taiwan University,(2003)的SVM作为分类器,实验中采用5000个训练样本和1000个测试样本对该分类器进行训练和实验,商品类目分类准确率可达87.6%,不同类目的分类混淆度矩阵如附表1所示。
表1:分类器分类结果(混淆矩阵)
  商品类标签   包   下衣   鞋   上衣
  包   702   10   65   96
  下衣   13   808   15   73
  鞋   55   13   1118   60
  上衣   70   64   56   1544
步骤5:对分类归属概率进行置信度评估,判断分类是否成功。
根据分类器给出的不同类目的归属概率,需要进行置信度评估分析。基于信息熵理论计算可得到分类结果的信息熵。该值越大,认为分类结果越不可靠;反之,认为该分类结果可信度越高。本发明推荐阈值为THRD=0.2。若熵值大于该阈值,则认为分类失败,若小于该阈值则认为分类成功,选择其中分类置信度最大的商品类目作为分类任务的分类结果。
步骤:6:进入检索流程,分析分类是否成功,并进入不同的商品库进行检索。
若分类成功,则进入子商品类目库进行检索,若分类失败则进入商品全类目库进行检索,具体的搜索方法,可参见发明王海洋,黄琦,徐舒畅,郑聃,林建聪:一种基于感性认知的图像检索结果排序方法(2010)。
本发明通过用户对交互框选择商品主体,然后对商品类目进行自动分类,从而有效减少用户交互,改善用户基于商品视觉信息购物体验,本发明通过提取商品的布局和形状等特征,然后通过特征选择,对数据进行降维操作,复杂度低且分类识别率高。

Claims (1)

1.一种商品图像跨类目检索方法,其特征在于,该方法包括以下步骤:
(1)用户交互框选图片中商品区域,选择商品主体区域;
(2)对商品图片进行布局和形状特征提取,为后续图片类目识别提供特征数据;
(3)对特征数据进行融合和选择;
(4)对图片进行商品分类,得到属于各个商品类目的归属概率;
(5)对分类归属概率进行置信度评估,判断分类是否成功;
(6)进入检索流程,分析分类是否成功,并进入不同的商品库进行检索:若分类成功,则进入子商品类目库进行检索,若分类失败则进入商品全类目库进行检索。
CN2012102465339A 2012-07-17 2012-07-17 一种商品图像跨类目检索方法 Pending CN102819566A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102465339A CN102819566A (zh) 2012-07-17 2012-07-17 一种商品图像跨类目检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102465339A CN102819566A (zh) 2012-07-17 2012-07-17 一种商品图像跨类目检索方法

Publications (1)

Publication Number Publication Date
CN102819566A true CN102819566A (zh) 2012-12-12

Family

ID=47303677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102465339A Pending CN102819566A (zh) 2012-07-17 2012-07-17 一种商品图像跨类目检索方法

Country Status (1)

Country Link
CN (1) CN102819566A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150631A (zh) * 2013-03-11 2013-06-12 苏州斯普锐智能系统有限公司 基于图像匹配的自动物品管理方法及其系统
CN103412937A (zh) * 2013-08-22 2013-11-27 成都数之联科技有限公司 一种基于手持终端的搜索购物方法
WO2014187408A1 (zh) * 2013-12-18 2014-11-27 中兴通讯股份有限公司 视觉搜索方法、系统以及移动终端
WO2015120772A1 (zh) * 2014-02-11 2015-08-20 阿里巴巴集团控股有限公司 一种计算商品图像牛皮癣分值的方法和装置
CN105792010A (zh) * 2014-12-22 2016-07-20 Tcl集团股份有限公司 基于图像内容解析及图片索引的电视购物的方法与装置
CN107220876A (zh) * 2017-05-26 2017-09-29 北京三快在线科技有限公司 商品信息管理方法、装置及移动终端
CN107729910A (zh) * 2016-08-11 2018-02-23 阿里巴巴集团控股有限公司 一种图形识别的方法、装置及系统
CN109145947A (zh) * 2018-07-17 2019-01-04 昆明理工大学 一种基于部件检测和视觉特征的时尚女装图像细粒度分类方法
CN110263803A (zh) * 2019-04-22 2019-09-20 阿里巴巴集团控股有限公司 样本数据的处理方法、装置、服务器和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
CN101506843A (zh) * 2006-08-14 2009-08-12 微软公司 图像中的对象的自动分类
CN102057371A (zh) * 2008-06-06 2011-05-11 汤姆逊许可证公司 用于图像的类似性搜索的系统和方法
CN102054178A (zh) * 2011-01-20 2011-05-11 北京联合大学 一种基于局部语义概念的国画图像识别方法
CN102214222A (zh) * 2011-06-15 2011-10-12 中国电信股份有限公司 通过手机摄像获取景物资讯的预分类及交互系统和方法
CN102509111A (zh) * 2011-11-02 2012-06-20 大连理工大学 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101506843A (zh) * 2006-08-14 2009-08-12 微软公司 图像中的对象的自动分类
CN102057371A (zh) * 2008-06-06 2011-05-11 汤姆逊许可证公司 用于图像的类似性搜索的系统和方法
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
CN102054178A (zh) * 2011-01-20 2011-05-11 北京联合大学 一种基于局部语义概念的国画图像识别方法
CN102214222A (zh) * 2011-06-15 2011-10-12 中国电信股份有限公司 通过手机摄像获取景物资讯的预分类及交互系统和方法
CN102509111A (zh) * 2011-11-02 2012-06-20 大连理工大学 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150631A (zh) * 2013-03-11 2013-06-12 苏州斯普锐智能系统有限公司 基于图像匹配的自动物品管理方法及其系统
CN103150631B (zh) * 2013-03-11 2016-11-09 苏州斯普锐智能系统有限公司 基于图像匹配的自动物品管理方法及其系统
CN103412937B (zh) * 2013-08-22 2016-12-28 成都数之联科技有限公司 一种基于手持终端的搜索购物方法
CN103412937A (zh) * 2013-08-22 2013-11-27 成都数之联科技有限公司 一种基于手持终端的搜索购物方法
WO2014187408A1 (zh) * 2013-12-18 2014-11-27 中兴通讯股份有限公司 视觉搜索方法、系统以及移动终端
CN104731784A (zh) * 2013-12-18 2015-06-24 中兴通讯股份有限公司 视觉搜索方法、系统以及移动终端
CN104731784B (zh) * 2013-12-18 2019-03-26 中兴通讯股份有限公司 视觉搜索方法、系统以及移动终端
WO2015120772A1 (zh) * 2014-02-11 2015-08-20 阿里巴巴集团控股有限公司 一种计算商品图像牛皮癣分值的方法和装置
US10127470B2 (en) 2014-02-11 2018-11-13 Alibaba Group Holding Limited Computerized method and apparatus for determining obstructed portions of displayed digital content
CN105792010A (zh) * 2014-12-22 2016-07-20 Tcl集团股份有限公司 基于图像内容解析及图片索引的电视购物的方法与装置
CN107729910A (zh) * 2016-08-11 2018-02-23 阿里巴巴集团控股有限公司 一种图形识别的方法、装置及系统
CN107220876A (zh) * 2017-05-26 2017-09-29 北京三快在线科技有限公司 商品信息管理方法、装置及移动终端
CN107220876B (zh) * 2017-05-26 2023-10-24 北京三快在线科技有限公司 商品信息管理方法、装置及移动终端
CN109145947A (zh) * 2018-07-17 2019-01-04 昆明理工大学 一种基于部件检测和视觉特征的时尚女装图像细粒度分类方法
CN109145947B (zh) * 2018-07-17 2022-04-12 昆明理工大学 一种基于部件检测和视觉特征的时尚女装图像细粒度分类方法
CN110263803A (zh) * 2019-04-22 2019-09-20 阿里巴巴集团控股有限公司 样本数据的处理方法、装置、服务器和存储介质

Similar Documents

Publication Publication Date Title
CN102819566A (zh) 一种商品图像跨类目检索方法
US11423076B2 (en) Image similarity-based group browsing
EP3267362B1 (en) Machine learning image processing
CN107861972B (zh) 一种用户录入商品信息后显示商品全结果的方法及设备
US9817900B2 (en) Interactive clothes searching in online stores
KR102127191B1 (ko) 쇼핑 정보를 제공하는 방법, 장치 및 컴퓨터 프로그램
CN106776619B (zh) 用于确定目标对象的属性信息的方法和装置
TWI631474B (zh) Method and device for product identification label and method for product navigation
KR101511050B1 (ko) 상품 정보를 제공하고 표시하는 방법, 장치, 시스템 및 컴퓨터 프로그램
KR101806169B1 (ko) 쇼핑 정보를 제공하는 방법, 장치, 시스템 및 컴퓨터 프로그램
TWI559242B (zh) 視覺化服飾檢索
CN107679960B (zh) 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法
JP6950912B2 (ja) 映像検索情報提供方法、装置およびコンピュータプログラム
US20160314512A1 (en) Visual search in a controlled shopping environment
US9424466B2 (en) Shoe image retrieval apparatus and method using matching pair
US20210390607A1 (en) Method, apparatus and computer program for style recommendation
US10769524B1 (en) Non-binary gender filter
KR102024818B1 (ko) 영상 검색 정보 제공 방법, 장치 및 컴퓨터 프로그램
US11531882B2 (en) Method and system for automatically classifying images
US11475500B2 (en) Device and method for item recommendation based on visual elements
KR20220054896A (ko) 이미지 특징 데이터 추출 및 사용
WO2017114237A1 (zh) 一种图像查询方法和装置
US10776417B1 (en) Parts-based visual similarity search
CN111767420A (zh) 一种生成服饰搭配数据的方法和装置
CN107622071B (zh) 通过间接相关反馈在无查源下的衣服图像检索系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121212