CN105404657A - 一种基于cedd特征和phog特征的图像检索方法 - Google Patents

一种基于cedd特征和phog特征的图像检索方法 Download PDF

Info

Publication number
CN105404657A
CN105404657A CN201510740450.9A CN201510740450A CN105404657A CN 105404657 A CN105404657 A CN 105404657A CN 201510740450 A CN201510740450 A CN 201510740450A CN 105404657 A CN105404657 A CN 105404657A
Authority
CN
China
Prior art keywords
image
feature
phog
cedd
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510740450.9A
Other languages
English (en)
Other versions
CN105404657B (zh
Inventor
汪友生
金铭
王丽婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201510740450.9A priority Critical patent/CN105404657B/zh
Publication of CN105404657A publication Critical patent/CN105404657A/zh
Application granted granted Critical
Publication of CN105404657B publication Critical patent/CN105404657B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Abstract

一种基于CEDD特征和PHOG特征的图像检索方法,针对单一特征检索效果的不足,从图像的多特征入手,先使用颜色和边缘的方向性描述符提取图像的颜色和纹理特征,再将图像的颜色和纹理特征合并成为图像的CEDD特征;使用分层梯度方向直方图提取图像的形状特征,作为图像的PHOG特征;采用图像底层特征串行关联的方法将CEDD特征和PHOG特征结合,对图像进行相似性匹配,输出相似性高的图像作为检索结果。不同于传统的基于文本的图像检索,本检索过程是一种模糊查询技术,其根据视觉特性进行检索的特性,减少了人工标注的主观性;由于CEDD特征和PHOG特征占用空间小、特征表达紧凑的特点,从很大程度上提高了检索效率。

Description

一种基于CEDD特征和PHOG特征的图像检索方法
技术领域
本发明涉及一种基于CEDD特征和PHOG特征的图像检索方法,属于基于内容的图像检索领域。
背景技术
基于内容的图像检索(Content-basedimageretrieval,CBIR),是使用图像的可视特征对图像进行相似性匹配的检索方式,这种检索方式可以自动提取图像库中所有图片的底层视觉特征,以高维向量的形式存储并建立特征库,检索时以计算向量间距离的方式获得相似性最高的若干张图像返回给用户。与基于文本的图像检索方式相比,CBIR系统工作时更高效,但其检索准确性依赖于特征提取算法。
图像检索中常用的图像特征主要有颜色特征、纹理特征和形状特征等。颜色特征是描述图像最直观的底层视觉特征,也是在图像检索中应用最广泛的视觉特征。颜色特征通常和图像中所包含的对象或图像的场景非常相关,能最直接地描述人类视觉系统对图像的感知,此外,与其他底层视觉特征相比,颜色特征对图像自身的尺寸、视角、方向等敏感度不高,从而在检索时具有较高的鲁棒性。纹理特征是描述图像的另一种重要的底层特征,通常认为纹理是图像上表现出的灰度或颜色分布的某种规律性,这种规律性在不同类别的纹理中有着不同的特点,能够刻画出像素邻域的灰度空间分布规律,因此可以用来识别出不同的图像。形状特征是描述物体最本质的特征,也是描述难度非常大的图像特征,是进行物体识别的关键信息。其不因周围环境而改变,鲁棒性非常高,对形状的理解往往决定了对整幅图像涵义的理解。目前,已经有很多文献基于以上单一特征进行图像检索,而单一特征只有在对相应特征比较敏感的特定图像集内才能取得较好的检索效果,对于那些特征综合性较强、内容比较复杂的图像,检索效率则比较低,所以迫切地需要研究融合多种图像特征的检索方法来提高CBIR的工作效率。
目前有一些特征提取算法结合了图像的颜色和纹理特征,但是如何将这两种底层特征紧凑地表示成向量,是一个很有难度的问题。在这个背景下,SAChatzichristofis等人提出了结合图像颜色和纹理两方面信息的颜色和边缘方向性描述符(ColorandEdgeDirectivityDescriptor,CEDD)算法,该方法复杂度低,实现简单,但没有考虑图像的形状特征,导致检索准确率不高。分层梯度方向直方图(PyramidHistogramofOrientedGradients,PHOG)最早由Bosch等提出,是一种描述空间形状能力较强的特征向量,但由于它仅仅包含了图像的形状特征,故对颜色和纹理特征显著的自然背景图像检索效果不佳。考虑到CEDD和PHOG的缺点,将两者结合能提取图像的三种基本特征,且两种算法能起到互补的作用。
发明内容
本发明的目的是要提供一种多特征融合的图像检索方法,其实现框图如图1所示。该方法针对CEDD和PHOG的缺点,使用底层特征串行关联方法将两种算法提取的三种图像底层视觉特征进行融合,使用Corel标准图像集进行测试,结果表明本文方法的查准率和Avgp值比两种原算法均有提高。
具体的实现步骤如下:
Step1:对图像库中所有图像I,提取CEDD特征,存入CEDD特征库:
Step1.1:将任意大小的图像都分成1600个图像块;
Step1.2:将图像块的颜色空间从RGB空间转到HSV空间,将HSV值经过10-bins模糊过滤器;
Step1.3:将10-bins模糊过滤器输出的值经过24-bins模糊过滤器。过滤后输出为一个24维向量,构成图像块的颜色信息;
Step1.4:将图像块的颜色空间转到YIQ空间,提取出图像的亮度值,采用MPEG-7标准中边缘直方图描述符提取纹理特征;
Step1.5:依照框图2将所有图像块的颜色特征和纹理特征进行合并和量化,成为代表整个图像的CEDD特征向量,存入CEDD特征库。CEDD特征中颜色特征和纹理特征的分布如图3所示。
Step2:对图像库中所有图像I,提取PHOG特征,存入PHOG特征库:
Step2.1:将彩色图像转换为灰度图像;
Step2.2:使用Canny算子对灰度图像进行边缘检测;
Step2.3:对图像进行金字塔分割,设图像共被分割成L层(本文取L=3),则在第l层,图像被分成4l块;
Step2.4:在每一个图像块上计算轮廓点处的梯度方向和梯度模,将梯度方向单位以度来表示时,范围为[0°,180°]或[0°,360°](本文取[0°,180°]);
Step2.5:将梯度角度分为K个区间,在各个区间上累加梯度模的值作为该区间的权值。根据文献[phog原文]中对K不同取值时算法性能的测试,范围为[0°,180°]时取K=20算法性能较好,故本文选取K=20,即20个区间中每个区间9度;
Step2.6:依照权值得到每个区间的梯度方向直方图,将梯度直方图合并成为PHOG特征,合并时需要进行归一化,将第l层梯度方向直方图合并时需乘以最终得到的PHOG特征维数为维。
Step3:输入一张检索图片Ir,提取Ir的颜色和纹理特征向量,记为XC
Step4:计算XC与CEDD特征库中各特征的欧式距离,对距离进行排序,取前P个数据,即取前P幅相似图像,记相似图像集合为SP={I1P,I2P,...,IPP}。
Step5:提取Ir的分层梯度方向直方图特征向量,记为XS
Step6:计算XS与图像集合SP中各图像的PHOG特征向量的欧式距离,对计算后的欧式距离进行排序,取P个距离中的前Q个,即从P幅图像中使用PHOG特征过滤,取前Q幅图像,作为检索的结果。
在本文的检索系统中,CEDD特征和PHOG特征占用的空间均较小,且使用特征串行关联的方法将图像的三种主要特征进行融合,弥补了CEDD没有考虑图像形状信息的缺点,并且计算量小,灵活性大,实现了对检索结果的过滤功能。从计算步骤上来看,是一种有效且计算相对简单的检索方法。
附图说明
图1是CEDD特征提取步骤框图;
图2是CEDD特征中颜色和纹理特征分布的结构;
图3是本发明方法的流程图。
具体实施方式
本发明是采用以下技术手段实现的:
一种基于CEDD特征和PHOG特征的图像检索方法。先使用颜色和边缘方向性描述符提取图像的颜色和纹理特征,将颜色和纹理特征合并成为CEDD特征,再使用分层梯度方向直方图提取图像的形状特征,成为图像的PHOG特征;最后使用底层特征串行关联的方法将CEDD特征和PHOG特征融合进行检索。
上述基于CEDD特征和PHOG特征的图像检索方法,包括下述步骤:
步骤1:对图像库中所有图像I,提取CEDD特征,存入CEDD特征库:
步骤1.1:将任意大小的图像都分成1600个图像块;
步骤1.2:将图像块的颜色空间从RGB空间转到HSV空间,将HSV值经过10-bins模糊过滤器;
步骤1.3:将10-bins模糊过滤器输出的值经过24-bins模糊过滤器。过滤后输出为一个24维向量,构成图像块的颜色信息;
步骤1.4:将图像块的颜色空间转到YIQ空间,提取出图像的亮度值,采用MPEG-7标准中边缘直方图描述符提取纹理特征;
步骤1.5:依照框图2将所有图像块的颜色特征和纹理特征进行合并和量化,成为代表整个图像的CEDD特征向量,存入CEDD特征库。CEDD特征中颜色特征和纹理特征的分布如图3所示。
步骤2:对图像库中所有图像I,提取PHOG特征,存入PHOG特征库:
步骤2.1:将彩色图像转换为灰度图像;
步骤2.2:使用Canny算子对灰度图像进行边缘检测;
步骤2.3:对图像进行金字塔分割,设图像共被分割成L层(本文取L=3),则在第l层,图像被分成4l块;
步骤2.4:在每一个图像块上计算轮廓点处的梯度方向和梯度模,将梯度方向单位以度来表示时,范围为[0°,180°]或[0°,360°](本文取[0°,180°]);
步骤2.5:将梯度角度分为K个区间,在各个区间上累加梯度模的值作为该区间的权值。根据文献[phog原文]中对K不同取值时算法性能的测试,范围为[0°,180°]时取K=20算法性能较好,故本文选取K=20,即20个区间中每个区间9度;
步骤2.6:依照权值得到每个区间的梯度方向直方图,将梯度直方图合并成为PHOG特征,合并时需要进行归一化,将第l层梯度方向直方图合并时需乘以最终得到的PHOG特征维数为维。
步骤3:输入一张检索图片Ir,提取Ir的颜色和纹理特征向量,记为XC
步骤4:计算XC与CEDD特征库中各特征的欧式距离,对距离进行排序,取前P个数据,即取前P幅相似图像,记相似图像集合为SP={I1P,I2P,...,IPP}。
步骤5:提取Ir的分层梯度方向直方图特征向量,记为XS
步骤6:计算XS与图像集合SP中各图像的PHOG特征向量的欧式距离,对计算后的欧式距离进行排序,取P个距离中的前Q个,即从P幅图像中使用PHOG特征过滤,取前Q幅图像,作为检索的结果。

Claims (1)

1.一种基于CEDD特征和PHOG特征的图像检索方法,其特征在于,包括以下步骤:
步骤1:对图像库中所有图像I,提取CEDD特征,存入CEDD特征库:
步骤1.1:将任意大小的图像都分成1600个图像块;
步骤1.2:将图像块的颜色空间从RGB空间转到HSV空间,将HSV值经过10-bins模糊过滤器;
步骤1.3:将10-bins模糊过滤器输出的值经过24-bins模糊过滤器;过滤后输出为一个24维向量,构成图像块的颜色信息;
步骤1.4:将图像块的颜色空间转到YIQ空间,提取出图像的亮度值,采用MPEG-7标准中边缘直方图描述符提取纹理特征;
步骤1.5:依照框图2将所有图像块的颜色特征和纹理特征进行合并和量化,成为代表整个图像的CEDD特征向量,存入CEDD特征库;CEDD特征中颜色特征和纹理特征的分布如图3所示;
步骤2:对图像库中所有图像I,提取PHOG特征,存入PHOG特征库:
步骤2.1:将彩色图像转换为灰度图像;
步骤2.2:使用Canny算子对灰度图像进行边缘检测;
步骤2.3:对图像进行金字塔分割,设图像共被分割成L层(本文取L=3),则在第l层,图像被分成4l块;
步骤2.4:在每一个图像块上计算轮廓点处的梯度方向和梯度模,将梯度方向单位以度来表示时,范围为[0°,180°]或[0°,360°](本文取[0°,180°]);
步骤2.5:将梯度角度分为K个区间,在各个区间上累加梯度模的值作为该区间的权值;根据文献[phog原文]中对K不同取值时算法性能的测试,范围为[0°,180°]时取K=20算法性能较好,故本文选取K=20,即20个区间中每个区间9度;
步骤2.6:依照权值得到每个区间的梯度方向直方图,将梯度直方图合并成为PHOG特征,合并时需要进行归一化,将第l层梯度方向直方图合并时需乘以最终得到的PHOG特征维数为维;
步骤3:输入一张检索图片Ir,提取Ir的颜色和纹理特征向量,记为XC
步骤4:计算XC与CEDD特征库中各特征的欧式距离,对距离进行排序,取前P个数据,即取前P幅相似图像,记相似图像集合为SP={I1P,I2P,...,IPP};
步骤5:提取Ir的分层梯度方向直方图特征向量,记为XS
步骤6:计算XS与图像集合SP中各图像的PHOG特征向量的欧式距离,对计算后的欧式距离进行排序,取P个距离中的前Q个,即从P幅图像中使用PHOG特征过滤,取前Q幅图像,作为检索的结果。
CN201510740450.9A 2015-11-04 2015-11-04 一种基于cedd特征和phog特征的图像检索方法 Expired - Fee Related CN105404657B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510740450.9A CN105404657B (zh) 2015-11-04 2015-11-04 一种基于cedd特征和phog特征的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510740450.9A CN105404657B (zh) 2015-11-04 2015-11-04 一种基于cedd特征和phog特征的图像检索方法

Publications (2)

Publication Number Publication Date
CN105404657A true CN105404657A (zh) 2016-03-16
CN105404657B CN105404657B (zh) 2018-11-02

Family

ID=55470147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510740450.9A Expired - Fee Related CN105404657B (zh) 2015-11-04 2015-11-04 一种基于cedd特征和phog特征的图像检索方法

Country Status (1)

Country Link
CN (1) CN105404657B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930499A (zh) * 2016-05-09 2016-09-07 深圳市数极科技有限公司 一种图片搜索方法及系统
CN108268463A (zh) * 2016-12-30 2018-07-10 广东精点数据科技股份有限公司 一种基于分块技术的图像检索方法
CN108345624A (zh) * 2017-01-24 2018-07-31 阿里巴巴集团控股有限公司 生成页面的方法及装置
CN108447051A (zh) * 2018-03-09 2018-08-24 东北大学 一种基于计算机视觉的金属产品表面缺陷等级评定方法
CN108829711A (zh) * 2018-05-04 2018-11-16 上海得见计算机科技有限公司 一种基于多特征融合的图像检索方法
CN109086764A (zh) * 2018-07-25 2018-12-25 北京达佳互联信息技术有限公司 台标检测方法、装置及存储介质
CN110245670A (zh) * 2019-06-11 2019-09-17 观博云标(北京)文化科技有限公司 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置
CN110321966A (zh) * 2019-07-11 2019-10-11 同方知网数字出版技术股份有限公司 一种加快图书相似性分析速度的方法
CN113313126A (zh) * 2021-04-30 2021-08-27 杭州好安供应链管理有限公司 用于图像识别的方法、计算设备和计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1227430A2 (en) * 2001-01-24 2002-07-31 Eastman Kodak Company System and method for determining image similarity
CN101770578A (zh) * 2010-03-24 2010-07-07 上海交通大学 图像特征提取方法
CN101789005A (zh) * 2010-01-22 2010-07-28 深圳创维数字技术股份有限公司 一种基于感兴趣区域的图像检索方法
CN103885978A (zh) * 2012-12-20 2014-06-25 天津职业技术师范大学 一种多层分级图像检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1227430A2 (en) * 2001-01-24 2002-07-31 Eastman Kodak Company System and method for determining image similarity
CN101789005A (zh) * 2010-01-22 2010-07-28 深圳创维数字技术股份有限公司 一种基于感兴趣区域的图像检索方法
CN101770578A (zh) * 2010-03-24 2010-07-07 上海交通大学 图像特征提取方法
CN103885978A (zh) * 2012-12-20 2014-06-25 天津职业技术师范大学 一种多层分级图像检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨舒 等: "基于Contourlet变换和Hu不变矩的图像检索算法", 《红外与激光工程》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930499B (zh) * 2016-05-09 2019-11-22 深圳市数极科技有限公司 一种图片搜索方法及系统
CN105930499A (zh) * 2016-05-09 2016-09-07 深圳市数极科技有限公司 一种图片搜索方法及系统
CN108268463A (zh) * 2016-12-30 2018-07-10 广东精点数据科技股份有限公司 一种基于分块技术的图像检索方法
CN108345624A (zh) * 2017-01-24 2018-07-31 阿里巴巴集团控股有限公司 生成页面的方法及装置
CN108447051B (zh) * 2018-03-09 2019-12-24 东北大学 一种基于计算机视觉的金属产品表面缺陷等级评定方法
CN108447051A (zh) * 2018-03-09 2018-08-24 东北大学 一种基于计算机视觉的金属产品表面缺陷等级评定方法
CN108829711A (zh) * 2018-05-04 2018-11-16 上海得见计算机科技有限公司 一种基于多特征融合的图像检索方法
CN108829711B (zh) * 2018-05-04 2021-06-01 上海得见计算机科技有限公司 一种基于多特征融合的图像检索方法
CN109086764A (zh) * 2018-07-25 2018-12-25 北京达佳互联信息技术有限公司 台标检测方法、装置及存储介质
CN110245670A (zh) * 2019-06-11 2019-09-17 观博云标(北京)文化科技有限公司 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置
CN110245670B (zh) * 2019-06-11 2021-08-20 观博云标(北京)文化科技有限公司 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置
CN110321966A (zh) * 2019-07-11 2019-10-11 同方知网数字出版技术股份有限公司 一种加快图书相似性分析速度的方法
CN110321966B (zh) * 2019-07-11 2022-02-15 同方知网数字出版技术股份有限公司 一种加快图书相似性分析速度的方法
CN113313126A (zh) * 2021-04-30 2021-08-27 杭州好安供应链管理有限公司 用于图像识别的方法、计算设备和计算机存储介质

Also Published As

Publication number Publication date
CN105404657B (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN105404657A (zh) 一种基于cedd特征和phog特征的图像检索方法
CN205721777U (zh) 视觉搜索设备和系统
US7848577B2 (en) Image processing methods, image management systems, and articles of manufacture
CN102542058B (zh) 一种融合全局与局部视觉特征的层次化地标识别方法
JP2012530287A (ja) 代表的な画像を選択するための方法及び装置
CN105069042A (zh) 基于内容的无人机侦察图像数据检索方法
CN106126585B (zh) 基于质量分级与感知哈希特征组合的无人机图像检索方法
JP5018614B2 (ja) 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム
Yadav et al. Survey on content-based image retrieval and texture analysis with applications
CN104239420A (zh) 一种基于视频指纹的视频相似度匹配方法
JP2004062605A (ja) シーン識別方法および装置ならびにプログラム
CN103678552A (zh) 基于显著区域特征的遥感影像检索方法及系统
Reta et al. Color uniformity descriptor: An efficient contextual color representation for image indexing and retrieval
Khotanzad et al. Color image retrieval using multispectral random field texture model and color content features
CN116415210A (zh) 图像侵权检测方法、装置及存储介质
Ali et al. Human-inspired features for natural scene classification
Chen et al. Edge region color autocorrelogram: A new low-level feature applied in CBIR
Acharya et al. Image retrieval based on visual attention model
CN106886783A (zh) 一种基于区域特征的图像检索方法及系统
Ngo et al. Exploiting image indexing techniques in DCT domain
Kumar et al. A CBIR scheme using active contour and edge histogram descriptor in YCbCr color space
Jayanthi et al. Efficient fuzzy color and texture feature extraction technique for content based image retrieval system
Sai et al. New feature vector for image retrieval: Sum of value of histogram bins
Kumar et al. A hierarchical approach based CBIR scheme using shape, texture, and color for accelerating retrieval process
Shambharkar et al. A comparative study on retrieved images by content based image retrieval system based on binary tree, color, texture and canny edge detection approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181102

Termination date: 20211104