CN102509111A - 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 - Google Patents
基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 Download PDFInfo
- Publication number
- CN102509111A CN102509111A CN2011103407618A CN201110340761A CN102509111A CN 102509111 A CN102509111 A CN 102509111A CN 2011103407618 A CN2011103407618 A CN 2011103407618A CN 201110340761 A CN201110340761 A CN 201110340761A CN 102509111 A CN102509111 A CN 102509111A
- Authority
- CN
- China
- Prior art keywords
- image
- class
- local feature
- distance
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明涉及的是一种商品图像的自动分类方法,提供了一种基于视觉信息的商品图像自动分类方法。这种方法提取图像局部特征,采用分级聚类和图像-类距离计算的方法实现类别识别。本发明的效果和益处能够根据商品图像的视觉内容实现商品自动分类;采用每类图像局部特征描述子聚类的方法,大大减少了图像-类距离计算中的穷尽搜素问题,大大提高了计算效率。在计算图像块之间距离时,充分考虑特征所在位置信息,能够提高分类效果。
Description
技术领域
本发明涉及的是一种商品图像的自动分类方法,具体是一种基于局部特征分级聚类及图像-类距离计算的商品图像分类算法。
背景技术
随着互联网的发展,电子商务的逐渐普及。电子商务网站需要通过对在线销售商品进行标注以方便用户进行搜索。但“一图胜千言”,传统的基于人工标注的方法不但费时费力,又难做到准确完整。如果在网站中设置图片分类过滤器,无疑能方便用户进行浏览。基于视觉信息的图像自动分类技术能够方便商家和用户,如进行商品自动标注和辅助图像检索。
基于视觉信息的图像自动分类是是根据图像的视觉特征对图像进行自动语义分类,需要克服类内差异、遮挡、姿态变化和背景干扰对分类带来的不利影响,目前是计算机视觉领域最具挑战的课题之一。针对商品图像分类,B.Tomasik等(Tagging products using image classification,in Proceedings of the 32ndinternational ACM SIGIR conference on Research and development in informationretrieval.2009,ACM:Boston,MA,USA.)探讨了运用图像分类进行图像标注的方法,在2-3类商品图像上取得了66%-96%的准确率。Oren Boiman等(In Defense ofNearest-Neighbor Based Image Classification,Proceedings of IEEE Conference onComputer Vision and Pattern Recognition)提出了一种朴素贝叶斯最近邻的分类器NBNN,(Naive-Bayes Nearest-Neighbor),在图像局部特征空间采用最近邻方法,计算图像-类之间的距离,并且证明了在基于贝叶斯假设下,这种分类器可以近似理论上最优的图像分类器。但由于这种方式基于穷尽搜索,当标记图像数目比较多、类别数比较大时,运行时间就会变得越来越大,很难达到实际应用的要求。本发明在此基础上提出了基于局部特征聚类及朴素贝叶斯分类器的商品图像分类算法。首先在图像局部特征空间进行分级层次聚类,形成若干个分级聚类中心,在计算图像-类距离时,首先计算图像和每类各个分级聚类中心之间的距离,找出每类最近邻的聚类中心。在此聚类包含的所有描述子中计算图像各描述子的最近邻,将图像各描述子与其对应最近邻描述子的距离进行相加,得到的距离之和即为图像-类之间的距离。测试图像的类别即为最小距离所对应的类别。
本发明可在保证较高正确率的情况下有效提高计算速度,适用于较大规模的商品图像分类。
发明内容
本发明要解决的技术问题是基于视觉特征的商品图像自动分类,提供了一种基于视觉信息的商品图像自动分类方法,这种方法提取图像局部特征,采用分级聚类和图像-类距离计算的方法实现类别识别。
本发明的技术方案如下:
步骤一.取已分好类的商品图像作为分类器标记样本;
步骤二.以稠密采样方式提取并描述各标记图像类的局部图像特征(如:SIFT)。
步骤三.将各类内训练图片提取的局部特征进行层次聚类,形成若干个分级聚类中心,并标记隶属于每个聚类中心的图像块描述子;
步骤四.以稠密采样方式提取并描述测试图片局部特征(SIFT);
步骤六.依次计算测试图像每个图像块到各类各分级聚类中心的L2距离,找出每个测试图像块与每个标记类距离和最小的聚类中心;
步骤七.在相应最近邻聚类中,依次计算各图像局部特征块的最近邻描述子,并计算对应L2距离;
步骤八.对应L2距离和最小的类别即为分类结果。
本发明的效果和益处能够根据商品图像的视觉内容实现商品自动分类;采用每类图像局部特征描述子分级层次聚类的方法,大大减少了图像-类距离计算中的穷尽搜素问题,大大提高了计算效率。在计算图像块之间距离时,充分考虑特征所在位置信息,能够提高分类效果。
附图说明
附图1是本发明算法基本过程示意框图。
附图2是本发明算法训练和测试过程流程图。
附图3是图像-类距离计算方法示意图。
附图4是本发明实施例中的部分图库示意图。
具体实施方式
如图1所示,具体描述如下步骤如下:
步骤一.获取取已知类别的商品图像样本,每类10~50个样本;
步骤二.以稠密采样方式提取各标记图像类的图片特征,采样间隔为8个像素,每个采样图像块大小为16*16;将每个图像块表示为SIFT特征描述子。
步骤三.依次对每个图像标记类中的局部图像块描述子进行分级层次聚类,(聚类层级数与每级聚类中心数目可以根据训练集大小适当设定,一般设层级数为2,第一级聚类中心数5-10,第二级聚类中心数10~20,每类可以不同);训练图像数量较多时,可以抽取其中一部分进行聚类,形成多级聚类中心;但要计算所有标记图像描述子属于哪一个聚类中心。
聚类方法递归使用K-means方法。
(1)随机选择K个局部描述子为聚类中心;mk,k=1....K
(2)计算所有局部描述子Xi与聚类中心的距离,找出每个局部描述子L2距离最小的聚类中心,所有与此聚类中心最近的描述子形成一个聚类,即Xi属于聚类C(i):
N为局部特征描述子的个数。
(3)对每个聚类,重新计算聚类中心,
(4)重复步骤(2),即按照重新计算的每个描述子与各聚类中心的距离,重新进行聚类。
(5)重复步骤(3)直到,聚类中心的误差达到阈值要求,或迭代达到一定次数。
K均值聚类最小化类内距离:
步骤四.计算每个图像标记类中与测试图像距离最小的聚类中心;计算方法如下(设聚类层级为2):
(1)计算测试图像块描述子与第一级聚类中心的L2距离,找出与其距离最近的一级聚类中心;
(2)计算测试图像块描述子与最近邻一级聚类中心中各个二级聚类中心之间的L2距离,找出与其距离最近邻二级聚类中心;
(3)计算测试图像块描述子与最近邻二级聚类中各个描述子之间的L2距离,找出与其距离最近的描述子;
步骤五.在步骤四得出的每类最近邻聚类中心中,计算测试图像各图像块的最近邻描述子,各图像块到各最近邻描述子L2距离之和即为测试图像到该图像标记类的距离。
计算描述子之间距离时,要考虑到对应描述子之间的位置关系。计算公式如下所示:
步骤六.对应测试图像-图像类之间距离之和最小的类别即为测试图像类别。
下面结合附图对本发明的实施例做详细说明,本实例以发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但发明的保护范围不限于下述的实施实例.
图库采用微软研究院产品图像分类库(PI100),包含了100类共10000幅商品图像.从MSN购物网站收集而来.图4是PI100图像库的部分示例图像.
本实验在配置了Intel Pentium CPU 2.66GHz,2GB RAM,运行windows 7操作系统和MATLAB 2010,visual C++2010的计算机上进行。
步骤一:取每类30幅图像作为已标记图像,取每类30幅图像进行分类测试。
步骤二:分别以稠密方式提取每类30幅标记图像的局部特征(SIFT),每个图像块大小为16*16,采样间隔为8个像素;
步骤三:按照实施部分所述方法依次对每个图像标记类中的局部图像块描述子进行分级层次聚类;第一级聚类中心数5,第二级聚类中心数10.
步骤四:同样以稠密采样方式提取测试图像局部特征描述子(SIFT),按照实施部分所述方法计算图像-类的距离;对应距离最小的类别为分类结果。位置加权系数通过3重交叉验证方式确定.
步骤五:对每类30幅测试图像进行分类测试,测试结果以平均分类正确率来衡量。
100类分类实验对比结果如下所示:
本文方法 | 现有方法(Oren Boiman) | |
平均分类正确率: | 80.2% | 80.4% |
平均每幅图像分类时间 | 7.2s | 120.5s |
Claims (1)
1.基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法,其特征在于如下步骤,
步骤一.取已分好类的商品图像作为分类器标记样本;
步骤二.以稠密采样方式提取并描述各标记图像类的局部图像特征(SIFT);
步骤三.将各类内训练图片提取的局部特征进行层次聚类,形成若干个分级聚类中心,并标记隶属于每个聚类中心的图像块描述子;
步骤四.以稠密采样方式提取并描述测试图片局部特征(SIFT);
步骤六.依次计算测试图像每个图像块到各类各分级聚类中心的L2距离,找出测试图像与每个标记类距离和最小的聚类中心;
步骤七.与每类最近临聚类中,依次计算测试各图像局部特征块的最近邻描述子,并计算对应L2距离之和;
步骤八.对应L2距离和最小的类别即为分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110340761.8A CN102509111B (zh) | 2011-11-02 | 2011-11-02 | 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110340761.8A CN102509111B (zh) | 2011-11-02 | 2011-11-02 | 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102509111A true CN102509111A (zh) | 2012-06-20 |
CN102509111B CN102509111B (zh) | 2014-08-27 |
Family
ID=46221192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110340761.8A Expired - Fee Related CN102509111B (zh) | 2011-11-02 | 2011-11-02 | 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102509111B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819566A (zh) * | 2012-07-17 | 2012-12-12 | 杭州淘淘搜科技有限公司 | 一种商品图像跨类目检索方法 |
CN104281679A (zh) * | 2014-09-30 | 2015-01-14 | 东软集团股份有限公司 | 基于图像特征的商品分类方法及装置 |
CN106384124A (zh) * | 2016-09-05 | 2017-02-08 | 华东师范大学 | 一种塑封邮件图像地址块定位方法 |
CN106874923A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种商品的风格分类确定方法及装置 |
CN107545271A (zh) * | 2016-06-29 | 2018-01-05 | 阿里巴巴集团控股有限公司 | 图像识别方法、装置和系统 |
CN110175590A (zh) * | 2019-05-31 | 2019-08-27 | 北京华捷艾米科技有限公司 | 一种商品识别方法及装置 |
CN110597719A (zh) * | 2019-09-05 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种用于适配测试的图像聚类方法、装置及介质 |
CN111008210A (zh) * | 2019-11-18 | 2020-04-14 | 浙江大华技术股份有限公司 | 商品识别方法、装置、编解码器及存储装置 |
CN112215287A (zh) * | 2020-10-13 | 2021-01-12 | 中国光大银行股份有限公司 | 基于距离的多节聚类方法和装置、存储介质及电子装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
-
2011
- 2011-11-02 CN CN201110340761.8A patent/CN102509111B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
Non-Patent Citations (2)
Title |
---|
贾世杰等: "基于SIFT的图像匹配算法", 《大连交通大学学报》 * |
贾世杰等: "基于互补特征和类描述的商品图像自动分类", 《电子与信息学报》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819566A (zh) * | 2012-07-17 | 2012-12-12 | 杭州淘淘搜科技有限公司 | 一种商品图像跨类目检索方法 |
CN104281679A (zh) * | 2014-09-30 | 2015-01-14 | 东软集团股份有限公司 | 基于图像特征的商品分类方法及装置 |
CN104281679B (zh) * | 2014-09-30 | 2018-04-06 | 东软集团股份有限公司 | 基于图像特征的商品分类方法及装置 |
CN106874923A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种商品的风格分类确定方法及装置 |
CN107545271B (zh) * | 2016-06-29 | 2021-04-09 | 阿里巴巴集团控股有限公司 | 图像识别方法、装置和系统 |
CN107545271A (zh) * | 2016-06-29 | 2018-01-05 | 阿里巴巴集团控股有限公司 | 图像识别方法、装置和系统 |
CN106384124A (zh) * | 2016-09-05 | 2017-02-08 | 华东师范大学 | 一种塑封邮件图像地址块定位方法 |
CN110175590A (zh) * | 2019-05-31 | 2019-08-27 | 北京华捷艾米科技有限公司 | 一种商品识别方法及装置 |
CN110597719A (zh) * | 2019-09-05 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种用于适配测试的图像聚类方法、装置及介质 |
CN110597719B (zh) * | 2019-09-05 | 2021-06-15 | 腾讯科技(深圳)有限公司 | 一种用于适配测试的图像聚类方法、装置及介质 |
CN111008210A (zh) * | 2019-11-18 | 2020-04-14 | 浙江大华技术股份有限公司 | 商品识别方法、装置、编解码器及存储装置 |
CN111008210B (zh) * | 2019-11-18 | 2023-08-11 | 浙江大华技术股份有限公司 | 商品识别方法、装置、编解码器及存储装置 |
CN112215287A (zh) * | 2020-10-13 | 2021-01-12 | 中国光大银行股份有限公司 | 基于距离的多节聚类方法和装置、存储介质及电子装置 |
CN112215287B (zh) * | 2020-10-13 | 2024-04-12 | 中国光大银行股份有限公司 | 基于距离的多节聚类方法和装置、存储介质及电子装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102509111B (zh) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102509111B (zh) | 基于局部特征多级聚类及图像-类距离计算的商品图像自动分类算法 | |
Zhou et al. | Online feature selection for high-dimensional class-imbalanced data | |
CN101350069B (zh) | 从训练数据构建分类器并使用分类器检测在测试数据中的移动对象的计算机实现方法 | |
CN101506843B (zh) | 图像中的对象的自动分类 | |
CN101187927B (zh) | 一种刑事案件的串并案智能分析方法 | |
CN104599275A (zh) | 基于概率图模型的非参数化的rgb-d场景理解方法 | |
CN105488809A (zh) | 基于rgbd描述符的室内场景语义分割方法 | |
CN104794500A (zh) | 一种tri-training半监督学习方法及装置 | |
CN102081655A (zh) | 基于贝叶斯分类算法的信息检索方法 | |
CN108280430B (zh) | 一种流程图像识别方法 | |
CN103092931A (zh) | 多策略结合文档自动分类方法 | |
CN102024030A (zh) | 基于最大期望参数估计的多分类器集成方法 | |
Zanibbi et al. | Math spotting: Retrieving math in technical documents using handwritten query images | |
CN113706547B (zh) | 一种基于类别同异性引导的无监督域适应语义分割方法 | |
CN106203401A (zh) | 一种车道线的快速检测方法 | |
CN102855473B (zh) | 一种基于相似性度量的图像多目标检测方法 | |
CN102521622A (zh) | 基于广告投放的人脸检测系统 | |
CN102930291A (zh) | 用于图形图像的k近邻局部搜索遗传自动聚类方法 | |
Ghanmi et al. | Table detection in handwritten chemistry documents using conditional random fields | |
Bai et al. | An incremental structured part model for object recognition | |
CN111783738A (zh) | 一种通信辐射源异常运动轨迹检测方法 | |
Abudalfa et al. | Semi-supervised target-dependent sentiment classification for micro-blogs | |
CN103761433A (zh) | 一种网络服务资源分类方法 | |
Zanwar et al. | A comprehensive survey on soft computing based optical character recognition techniques | |
Mehrentsev et al. | The algorithm and software for timber batch measurement by using image analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140827 Termination date: 20181102 |