CN111125416A - 一种基于多特征融合的图像检索方法 - Google Patents

一种基于多特征融合的图像检索方法 Download PDF

Info

Publication number
CN111125416A
CN111125416A CN201911378972.3A CN201911378972A CN111125416A CN 111125416 A CN111125416 A CN 111125416A CN 201911378972 A CN201911378972 A CN 201911378972A CN 111125416 A CN111125416 A CN 111125416A
Authority
CN
China
Prior art keywords
image
retrieved
color
feature
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911378972.3A
Other languages
English (en)
Inventor
李玉华
邓璐娟
张王卫
韩旭
贺智强
李璞
师夏阳
陈明
马军霞
朱少林
马欢
孙玉胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhengzhou University of Light Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Light Industry filed Critical Zhengzhou University of Light Industry
Priority to CN201911378972.3A priority Critical patent/CN111125416A/zh
Publication of CN111125416A publication Critical patent/CN111125416A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于多特征融合的图像检索方法,用以解决基于单一特征的图像检索方法无法满足用户的查询需求的。本发明的步骤为:利用滤波方法对待检索图像进行降噪处理;利用改进的HSV颜色空间进行特征量化提取待检索图像的全局特征;对降噪后的图像进行多尺度形态梯度提取待检索图像的局部特征;将全局特征和局部特征进行自适应融合得到自适应融合图像;对自适应融合图像进行哈希编码,通过哈希码计算待检索图像与数据库中所有图像的相似度,选择与待检索图像似度最高的前几个图像作为待检索图像的检索结果。本发明充分提取图像的特征点,并在局部特征提取过程中,更加全面地保护图像的边缘信息,提高了检索的准确性,缩短了检索时间。

Description

一种基于多特征融合的图像检索方法
技术领域
本发明涉及图像检索的技术领域,尤其涉及一种基于多特征融合的图像检索方法。
背景技术
随着物联网,大数据和移动互联网等下一代信息技术的广泛应用,多媒体数据目前呈现出几何增长的趋势,对人们的日常学习,工作和生活产生了深远的影响。如何快速,准确地在海量图像数据中找到所需的目标已成为当前计算机研究领域的热点之一。90年代提出了基于内容的图像检索,主要工作流程是提取图像颜色、纹理和形状等低级特征,将其低级特征映射到图像特征向量和特征库中,并通过检索查询图像。比较特征库中的特征向量,计算图像之间的相似度,并根据相似度大小返回搜索结果。基于内容的图像检索(CBIR)技术克服了依靠手动注释的基于文本的图像检索的缺点,并且难以准确表达图像语义信息。目前,CBIR技术的研究已取得一定成果,应用于基于Web的图像搜索、医学和遥感图像分析与处理、商标知识产权保护、公安部门指纹识别和人脸识别、交通领域个性化图片搜索等方面。
然而,现有的图像检索技术在各自领域仍然存在相应的缺陷,例如,基于文本的图像检索方法具有人工工作量大、主观性和文本注释不能完全覆盖图像本身内容的缺陷。与基于文本的图像检索相比,基于内容的图像检索方法可以更好地满足用户的实际需求,但是有必要研究适当的图像特征提取方法和相似性度量。因此,在不同图像之间进行搜索时,算法要求很高,指标也不同。基于语义的图像检索方法尚不成熟,大部分结果应用于特定领域,离通用应用还有很长的路要走,不利于扩展。
为了克服当前技术的缺点,更好地表达图像内容,并进一步提高图像检索的准确性,国内外研究人员针对不同类型的图像引入了机器学习、神经网络和其他检索方法,尽管这些方法也显示出很好的检索结果,但是重复训练数据需要花费很长时间。
目前已经提出了一些用于图像检索的方法。例如,深层神经网络中的无监督方法和有监督方法是在大数据量下进行图像检索的很好的算法,但是由于它占用大量存储空间并且计算时间使得检索效率大大降低。
考虑到不同种类的图像在某种程度上有显着差异,有些图像仅包含简单的颜色和形状信息,而有些图像也具有文本信息。因此,应根据相应的特征对相应的图像进行分类,这有助于进行比较实验。根据不同类型图像的特征,可以将图像分为四种类型:(1)字符图像:主要是指由字符、字母、数字和其他字符组成的图像;(2)实体图像:由简单直观的几何或实体组成;(3)组合图像:由字符和图形混合而成;(4)三维图像:由三维标记或包含其他标记的三维标记组成的标记。三维图像可以是产品本身的形状、产品包装或其他三维徽标。
发明内容
针对现有海量的多媒体数据,基于单一特征的图像检索方法无法满足用户的查询需求的技术问题,本发明提出一种基于多特征融合的图像检索方法,可以有效提高图像检索性能,在各种图像检索中具有良好的鲁棒性。
为了达到上述目的,本发明的技术方案是这样实现的:一种基于多特征融合的图像检索方法,其步骤如下:
步骤一:读取待检索图像,利用滤波方法对待检索图像进行降噪处理;
步骤二:利用改进的HSV颜色空间对降噪处理后图像进行特征量化,提取待检索图像的全局特征;
步骤三:对步骤一降噪后的图像进行多尺度形态梯度处理,提取待检索图像的局部特征;
步骤四:将步骤二得到全局特征和步骤三得到的局部特征进行自适应融合,得到自适应融合图像;
步骤五:对自适应融合图像进行哈希编码,得到待检索图像的哈希码,通过哈希码计算待检索图像与数据库中所有图像的相似度,选择与待检索图像似度最高的前几个图像作为待检索图像的检索结果。
所述步骤一中滤波方法由中值滤波器实现,中值滤波器为图像的每个像素选择一个邻域,然后对邻域中像素的灰度值进行重新排序,并取中间的灰度值代替,则二维的中值滤波器输出为:
f1(x,y)=Med{f(x-k,y-l),且(k,l∈W)} (1)
其中,f(x,y)和f1(x,y)分别是原始待检索图像和已降噪图像在坐标(x,y)处的像素值,W是二维像素模板,k和l分别是从二维像素模板W选取的像素区域,函数Med{}是将选取的像素区域值进行排序,并取平均值作为坐标(x,y)的像素值。
所述改进的HSV颜色空间的实现方法为:使用平均分块策略,将降噪处理后图像按照4×4的模板进行分割,形成16个大小相同的分块,选取占比例最大的几种颜色,将分块重新定义以满足HSV颜色空间量化,提取全局颜色特征信息后获得16个色块所占的比重:I={(ci,pi),i=1,…N,N<=16};
其中,ci代表彩色像素块的数量,pi代表彩色块的数量;
使用归一化方法重新计算数量pi的值:
Figure BDA0002341763980000021
其中,P为统计颜色比重最大的色块的个数,p1到pN代表N种色块的数量;
调用量化函数quantiz()输入量化值P,得到对不同颜色区域的特征提取图像。
所述HSV颜色空间量化对HSV颜色空间执行166维量化,计算一维特征矢量:L=9H+3S+V,采用维度量化,将色调H分量量化成18份,饱和度S和亮度V量化成4份,通过计算特征矢量L把三个颜色分量合成一维特征向量,计算特征矢量L的颜色直方图,采用Matlab构建颜色直方图函数hist(X),这里X参数即表示计算出的特征矢量L的值;使用二维数组存储每个分类图像的像素数;其中,H表示色调,S表示饱和度,V表示亮度;特征矢量L的取值范围为[0,1,…165],且特征矢量L获得166个一维直方图。
所述步骤三中多尺度形态梯度的实现方法为:
将结构元素b对滤波图像f1的位置(x,y)进行腐蚀:
(f1⊙b)(x,y)=min{f1(x+s,y+t)-b(s,t)}(s,t)∈Db
将结构元素b在滤波图像f1的位置(x,y)进行扩展:
Figure BDA0002341763980000031
腐蚀和膨胀操作运算后得到的图像的多尺度形态梯度为:
Figure BDA0002341763980000032
其中,⊙表示同或运算符,
Figure BDA0002341763980000033
表示异或运算符,Db表示整幅图像的区域空间,s,t均表示在某一坐标(x,y)的基础上所要遍历的像素点的值。
画出待检测图像和实验样本图像一维直方图,比较待检测图像和实验样本图像的直方图频谱分布,设定相似度阈值,根据阈值的设定比较多组图像相似度,如果多组图像相同,进一步测量每个相似颜色区域的形状特征的相似性:总体差异评估方程为:
D=(1-ρ)*D(s)+ρ*D(c);
其中,D表示融合后的图像特征与原图像的差异程度,ρ是基于颜色和空间特征的权重;D(s)和D(c)分别是颜色相似度和质心相似度自适应系数。
在检索商标图像的过程中,对自适应融合获得的图像特征进行哈希编码;对于任何输入的待检索图像,待检索图像和用于检索的图像哈希码之间的汉明距离反映了两者之间的相似性:S=||Yq-Yn||;
其中,Yq,Yn∈{0,1}分别表示待检索图像和用于检索的图像的哈希码,S表示汉明距离;
根据汉明距离S按升序返回用于检索的图像,从而得到与待检索图像相似度最高的前m个图像。
本发明的有益效果:本发明采用多特征融合,分别提取图像的全局特征和局部特征,使所获得的特征点能够更准确,完整地反映图像信息;然后定义模糊直方图分析技术,以计算每个图像的自适应系数,并准确描述这些图像的颜色和空间形状,而无需对数据集进行重复训练。本发明充分提取图像的特征点,并在局部特征提取过程中,更加全面地保护图像的边缘信息,提高了检索的准确性,缩短了检索时间;通过使用查询图像和图像哈希码之间的汉明距离进行检索以反映两者之间的相似性,可以完成图像的检索。与现有技术相比,本发明即使在海量数据集的情况下,也可以准确地提取每个图像的特征点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程图。
图2为本发明滤波方法的效果示意图的灰度图,其中,(a)为原始待检索图像,(b)为中值滤波方法处理的图像,
图3为本发明对图2(b)进行全局特征提取时的分块示意图。
图4为本发明利用改进的HSV颜色空间进行量化得到特征的图像,其中,(a)为红色区域特征,(b)为蓝色区域特征,(c)为黄色区域特征,(d)为代表白色区域特征。
图5为本发明分别提取图4中不同颜色区域的空间形状特征的图像,其中,(a)为红色区域形状特征,(b)为黄色区域形状特征,c)为蓝色区域形状特征,(d)为白色区域形状特。
图6为本发明得到的自适应融合图像。
图7为本发明的部分测试图像示例图。
图8为本发明对动物类型图像的检索效果比较图,其中,(a)为查询图像,(b)为文献[1]检索结果,(c)为本发明的检测结果。
图9为本发明对商标图片的检索效果比较图,其中,(a)为查询图像,(b)为文献[2]检索结果,(c)为本发明的检测结果。
图10为本发明对羊毛织物图像的检索效果比较图,其中,(a)为查询图像,(b)为文献[3]检索结果,(c)为本发明的检测结果。
图11为本发明与现有算法的P-R曲线比较图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于多特征融合的图像检索方法,其步骤如下:
步骤一:读取待检索图像,利用滤波方法对待检索图像进行降噪处理。
待检索图像的大小为325*260像素。在图像采集过程中,由于外部环境,设备本身以及操作人员的技术和心理因素的影响,图像中会有一些噪声。噪波被误认为某些重要信息,这对图像的后续处理产生不利影响。因此,在执行图像检索之前,必须对待检索图像进行去噪处理以提高图像质量。
目前,图像降噪通常是通过滤波器来实现的,例如小波变换。但是,小波变换容易去除重要的图像边缘信息,并且在去除噪声的同时模糊图像的边缘轮廓。中值滤波是一种非线性平滑降噪方法,为图像的每个像素选择一个特定尺寸的邻域,然后按尺寸对邻域中像素的灰度值进行重新排序,并取中间尺寸的灰度值代替;当前像素值使得周围的像素值接近真实值,从而消除了孤立的噪声点。中值滤波器可以有效克服偶然因素引起的波动干扰,对温度和液位变化缓慢的被测参数具有良好的滤波效果。二维中值滤波器输出为:
f1(x,y)=Med{f(x-k,y-l),且(k,l∈W)} (1)
其中,f(x,y)和f1(x,y)是原始待检索图像和已降噪图像在坐标(x,y)处的像素值,W是二维像素模板,通常是2*2或者3*3区域,k和l分别是从二维像素模板W选取的像素区域。Med{}函数是将选取的像素区域值进行排序,并取平均值作为某一点的像素值。
对于包含噪声的图像,使用中值滤波可获得良好的效果。如图1所示,其中,(a)为原始待检索图像,(b)为中值滤波方法处理的图像,中值滤波方法可以消除商标图像中的噪声斑点,从而抑制图像中的噪声,从而使图像更清晰。
步骤二:利用改进的HSV颜色空间对降噪处理后图像进行特征量化,提取待检索图像的全局特征。
在HSV颜色模型中,颜色模型空间中两种颜色之间的距离越短,两种颜色越相似。如果在HSV颜色模型的三维空间中,则统一选择几个量化点作为枢轴点。然后,根据颜色相似距离最短的原理,将其他量化点聚类到枢轴点上。只要枢轴点尽可能均匀,就可以达到在最低平均方差下将最小数量的颜色聚类的目的。在全局特征提取过程中,将降噪处理后图像中每个像素的RGB值转换为HSV颜色空间后执行简单聚类。由于H分量是HSV颜色空间中颜色表示的最重要分量,因此使用此实验的定量降维方法不仅可以改善H分量的分类,还可以增加量化维数。对于全局色彩特征的提取,检索效果大大提高。
根据大量测试,对HSV颜色空间执行166维量化,首先基于一维特征向量:L=9H+3S+V,其中,L表示一维特征矢量,H表示色调,S表示饱和度;V表示亮度。特征矢量L的取值范围为[0,1,…165],并且特征矢量L获得166个一维直方图。采用维度量化,将色调H分量量化成18份,取值(0~17),饱和度S和亮度V量化成4份,取值(0~3),通过计算特征矢量L把三个颜色分量合成一维特征向量,这里计算的是L的颜色直方图,采用Matlab构建颜色直方图函数hist(X),这里X参数即表示计算出的特征矢量L的值。
根据人们对颜色属性的感知程度,对各分量进行量化。H的取值范围是0~360,将H分成18份(0,1,2,3…17)当H在[0,20]时,令值为0,后面的1,2,3…17部分也采用这种设定好的方式对其进行量化处理。S,V的取值范围则不同,均为0~1,,将其分成4份(0,1,2,3)当S或V在[0,0.2]时,令值为0,后面的1,2,3部分也采用这种方式量化。在量化的过程中,分的份过多或过少都会造成颜色比例的失调,所以在多次实验后,选择这种量化方式。
然后,使用二维数组L1存储每个分类图像的像素数。使用平均分块策略,将滤波图像即图2(b)分为16个块,编号为H1到H16,如图3所示。平均分块策略将一幅图像按照4×4的模板进行分割,形成16个大小相同的分块,用于提取各子模块的颜色特征,统计各颜色所占整幅图的比重。此外,由于图像中的对象通常分布在图片的中央,因此中间的H6、H7、H10、和H11块重叠并分开。当提取颜色特征时,从块H1到H16顺序地提取,并分别存储16个子块的颜色特征。图像的每个子块的颜色权重的选取一般根据图像特征确定。通常,图像的中间区域的权重较大以反映图像的颜色信息,从而提取每个颜色块的图像信息,然后对每个颜色信息进行积分。我们选取占比例最大的几种颜色,将图像重新定义以满足HSV颜色空间量化。因此,在提取全局颜色特征信息后获得图像的表达:
I={(ci,pi),i=1,…N,N<=16} (2)
其中,ci代表彩色像素块的数量,pi代表彩色块的数量。此时,数量pi不仅受数量ci的影响,而且还受源图像中其他颜色的影响。为了消除组件之间的不同值引起的不兼容,我们使用归一化方法重新计算该数量pi的值。
Figure BDA0002341763980000061
I根据i的取值不同,这里i取1~16的正整数,得到这16个色块所占的比重。为了消除各色块之间的干扰,定义P统计颜色比重最大的色块的个数。其中,p1到pN代表这N种色块的数量。
使用上述改进的HSV颜色空间量化方法从图2(b)的不同颜色区域中提取特征,即使用的是matlab图像编译工具,在统计出个数P的值后,调用量化函数quantiz(),输入量化值P,得到并通过imshow()展示对不同颜色区域的特征提取,在本次实验选择的图像中,存在4种颜色比重。提取这4种颜色所在区域的整体特征,效果如图4所示。
由于提取的特征图像是部分图像,相对于原图像来说,部分对整体的估计是一种模糊估计,部分与整体差异越大,模糊性越强,部分趋于整体时,模糊性渐渐消失。在对于颜色特征提取时,将图像中的各颜色区域出现的频率存储在数组中,然后将颜色区域的形状特征也按照这种方式存储起来,用MATLAB画出对应的频谱图,比较原始图像对应特征的图像分布情况,舍弃差距较大的散点,保留接近的散点部分,得到模糊直方图,这样保存下来的部分点的特征就几乎接近原始图像的特征。
步骤三:对步骤一降噪后的图像进行多尺度形态梯度处理,提取待检索图像的局部特征。
在描述图像的局部空间特征时,不仅要考虑特征点提取的强度,还要考虑诸如图像比例变换、照度和边缘目标等因素。常见的局部特征描述方法包括:约束元方法、小波描述符、边界特征方法、傅立叶形状描述方法、几何参数方法、形状不变矩方法等。这些方法可以很好地表示图像形状轮廓内的信息,但是计算量大并且时间复杂度高。多尺度形态学算法通常用于图像检索,且不仅可以有效地使用图像轮廓信息,还可以使用关于图像内部区域的信息,该信息对图像目标区域的位置、照度和比例变化不敏感。
膨胀和腐蚀是形态图像处理领域中最基本的两个操作。腐蚀是图像中“缩小”或“缩小”的操作。将结构元素b对滤波图像f1的位置(x,y)的腐蚀定义为公式(4),并且在与结构元素b一致的区域中包括蚀刻工艺。确定为所有值选择的最小值;扩展是图像中的“扩展”或“增厚”操作。将结构元素b在滤波图像f1的位置(x,y)处的扩展定义为公式(5),并且扩展处理包括在与结构元素b一致的区域中,图像膨胀和腐蚀是两种操作,针对的都是统一结构元素。确定为所有值选择的最大值。可以将腐蚀和膨胀操作运算后得到的图像G(x,y)的多尺度形态梯度定义为等式(6),这表明梯度图像的计算结果主要取决于结构元素的大小和形状。
(f1⊙b)(x,y)=min{f1(x+s,y+t)-b(s,t)}(s,t)∈Db (4)
Figure BDA0002341763980000071
Figure BDA0002341763980000072
其中,⊙表示同或运算符,当f1,b值相同时为真,不同时为假,输出结果分别为0和1。
Figure BDA0002341763980000073
表示异或运算符,与⊙所表达的含义刚好相反,当f1,b值相同时为假,不同时为真,输出结果分别为0和1,Db代表整幅图像的区域空间,s,t都是在某一点(x,y)的基础上所要遍历的像素点的值。
使用多尺度形态学梯度算法提取图2(b)中不同颜色区域的空间形状特征,效果如图6所示。从图6中可以看出,多尺度形态学梯度处理的效果很好,提取的空间形状图像功能很明显,在实验中通过对比Roberts算子、canny算子等常用的边缘检测算法得出多尺度形态学梯度处理的效果最好。
步骤四:将步骤二得到全局特征和步骤三得到的局部特征进行自适应融合,得到自适应融合图像。
首先确定多组图像是否具有相似的颜色特性,通过画出一维直方图,比较待检测图像和实验样本图像的直方图频谱分布,这里可以自行设定相似度阈值,根据阈值的设定比较相似度。如果没有,则认为这些图像不同。如果它们相同,则进一步测量每个相似颜色区域的形状特征的相似性。总体差异评估方程定义为:
D=(1-ρ)*D(s)+ρ*D(c) (7)
其中,ρ是基于颜色和空间特征的权重,是自行设定的阈值;D(s)和D(c)分别是颜色相似度和质心相似度自适应系数,通过大量的实验得到的一个在该商标图像样本中的系数。自适应地融合颜色和形状特征以获得图6的效果,这个图像是融合了颜色和形状特征后得到的特征图像,与原图的相似度通过差异程度D来进行评估,一般将该值>0.7的情况认定为是可靠的。
步骤五:对自适应融合图像进行哈希编码,得到待检索图像的哈希码,通过哈希码计算待检索图像与数据库中所有图像的相似度,选择与待检索图像似度最高的前几个图像作为待检索图像的检索结果。
在检索商标图像的过程中,对通过自适应融合获得的图像特征进行哈希编码。对于任何输入的待检索图像,查询图像和用于检索的图像哈希码之间的汉明距离用于反映两者之间的相似性,表达式如下:
S=||Yq-Yn|| (8)
其中,Yq,Yn∈{0,1}分别表示待检索图像和用于检索的图像的哈希码,S表示汉明距离,该数值越小,表明两个图像越相似。汉明距离越小,两个图像越相似。根据汉明距离按升序返回用于检索的图像,从而检索与查询图像相似度最高的前m个图像。
在测试本发明的检索效果时,基于四种图像分类对组合图像和三维图像的检索效果进行了测试。由于不同形式的图像的复杂性不同,对于不同类型的图像,相同的算法可能具有不同的图像检索效果。
检索图像时需要获取图像数据集。当前,有一些图像数据集,例如,Imagenet数据集是在深度学习图像领域中广泛使用的字段。图像分类、定位和检测的研究工作主要基于此数据集。Imagenet数据集包含详细的文档,并由特殊的团队维护,并且使用非常方便。它广泛用于计算机视觉领域的研究中,并已成为该领域深度学习图像性能测试的“标准”数据集。MNIST也是最流行的图像数据集之一,一个手写的数字数据集,包含一组60000个样本训练集和一组10000个样本的测试集。这是一个很好的数据库,可用于尝试学习实际数据中的技术和深度识别模式。本发明选择Imagenet数据集作为图像数据集,并根据不同类型的图像选择织物、动物、商标等图像作为实验图像数据。
对于图像检索实验,从Imagenet数据集中选择了1000种不同的图像,以形成实验训练数据集。图像大小约为325*260像素。测试环境为:Core I5四核CPU,3.5GHz,8GB运行内存,Win7系统。使用MATLAB R2014b进行了仿真实验。为了使本发明的检索方案更加优越,检索结果更具说服力。选择了一种代表性的搜索算法:用于比较实验的wei文献[1]-[Liu,Siying,and Jie Jiang."Remote sensing image registration based on featurepoints of global edge."2017 IEEE International Conference on Imaging Systemsand Techniques(IST).IEEE,2017],文献[2]-[Liu,Jing,et al."An improved imageretrieval method based on SIFT algorithm and saliency map."2014 11thInternational Conference on Fuzzy Systems and Knowledge Discovery(FSKD).IEEE,2014.]和文献[3]-[Nan,Bingfei,et al."Content-based image retrieval using localtexture-based color histogram."2015 IEEE 2nd International Conference onCybernetics(CYBCONF).IEEE,2015]。检索算法的性能由P-R曲线评估。图7是测试集中使用的某些图像类型的示例。
通过反复实验证明,本发明的方法是合适的,在实验中为了说明效果选择了检索前16张与之最为相似的图像。当然可以根据需要自行设定检索图像个数,因为数据集中的图像数量和种类比较多,不清楚同一类图像的数量有多少,所以通过设置不同的参数改变检索个数。
结合本发明提到的图像检索算法,首先与文献[1]进行了对比实验。选择动物类型作为查询图像,搜索到的前16个图像,如图8所示。从图8中可以看出,在文献[1]中返回的搜索结果中,有3个与查询图像无关的动物图像,它们与给定的查询图像有很大不同,并在图8(b)中进行了标记。尽管采用了从整体中提取颜色特征的方法,但是在提取特征时很难平衡每个颜色成分的重量。本发明的出色结果引入了一种颜色特征检测器,该颜色特征检测器通过HSV颜色空间进行了量化以增强颜色区域。通过计算每个图像的自适应系数,可以更准确地提取混合的颜色和空间形状特征,从而准确地表示图像的特征。
接下来,利用文献[2]进行了比较实验。这次选择QQ商标图片作为查询图片,测试结果如图9所示。文献[2]使用SIFT来描述图像的形状特征,在计算特征的主方向时,主要取决于局部区域中像素的梯度方向,而忽略了图像的全局特征,从而使得特征匹配精度不令人满意并且易于错误搜索。在本发明中,使用多尺度形态学梯度来提取已划分为良好色块的区域中的局部空间形状特征,并很好地保护边缘信息,从而可以更准确地提取图像的局部特征,从而极大地改善了检索结果准确性。
最后,使用文献[3]进行了对比实验。这次我们选择羊毛织物图像作为查询图像,测试结果如图10所示。文献[3]使用纹理检索方法提取图像的特征。从检索结果可以看出,对于三维图像,纹理特征不能用作特征提取的主要因素。当三维图像受照明、噪声、模糊(和组合)影响时,还会导致纹理信息减弱。
为了定量衡量每种算法的检索性能,我们通过几次实验计算出每种算法的Precision-Recall图,如图11所示,△所在曲线表示本发明的精度和查全率,×所在曲线表示文献[1]的P-R曲线,米形所在曲线表示文献[2]的P-R曲线,五角星所在曲线表示文献[3]的P-R曲线,代表了文献[1]-文献[3]中所提出方法的精度和召回率。从比较实验结果可以看出,本发明的执行很好,并且检索结果明显优于其他算法。
本发明使用改进的HSV颜色空间量化方法对图像颜色区域进行分割,并对不同颜色区域执行局部特征提取;然后,基于融合特征的自适应系数,进一步完成图像检索。实验结果表明,本发明可以有效提高图像检索性能,在各种图像检索中具有良好的鲁棒性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于多特征融合的图像检索方法,其特征在于,其步骤如下:
步骤一:读取待检索图像,利用滤波方法对待检索图像进行降噪处理;
步骤二:利用改进的HSV颜色空间对降噪处理后图像进行特征量化,提取待检索图像的全局特征;
步骤三:对步骤一降噪后的图像进行多尺度形态梯度处理,提取待检索图像的局部特征;
步骤四:将步骤二得到全局特征和步骤三得到的局部特征进行自适应融合,得到自适应融合图像;
步骤五:对自适应融合图像进行哈希编码,得到待检索图像的哈希码,通过哈希码计算待检索图像与数据库中所有图像的相似度,选择与待检索图像似度最高的前几个图像作为待检索图像的检索结果。
2.根据权利要求1所述的基于多特征融合的图像检索方法,其特征在于,所述步骤一中滤波方法由中值滤波器实现,中值滤波器为图像的每个像素选择一个邻域,然后对邻域中像素的灰度值进行重新排序,并取中间的灰度值代替,则二维的中值滤波器输出为:
f1(x,y)=Med{f(x-k,y-l),且(k,l∈W)} (1)
其中,f(x,y)和f1(x,y)分别是原始待检索图像和已降噪图像在坐标(x,y)处的像素值,W是二维像素模板,k和l分别是从二维像素模板W选取的像素区域,函数Med{}是将选取的像素区域值进行排序,并取平均值作为坐标(x,y)的像素值。
3.根据权利要求1或2所述的基于多特征融合的图像检索方法,其特征在于,所述改进的HSV颜色空间的实现方法为:使用平均分块策略,将降噪处理后图像按照4×4的模板进行分割,形成16个大小相同的分块,选取占比例最大的几种颜色,将分块重新定义以满足HSV颜色空间量化,提取全局颜色特征信息后获得16个色块所占的比重:I={(ci,pi),i=1,…N,N<=16};
其中,ci代表彩色像素块的数量,pi代表彩色块的数量;
使用归一化方法重新计算数量pi的值:
Figure FDA0002341763970000011
其中,P为统计颜色比重最大的色块的个数,p1到pN代表N种色块的数量;
调用量化函数quantiz()输入量化值P,得到对不同颜色区域的特征提取图像。
4.根据权利要求3所述的基于多特征融合的图像检索方法,其特征在于,所述HSV颜色空间量化对HSV颜色空间执行166维量化,计算一维特征矢量:L=9H+3S+V,采用维度量化,将色调H分量量化成18份,饱和度S和亮度V量化成4份,通过计算特征矢量L把三个颜色分量合成一维特征向量,计算特征矢量L的颜色直方图,采用Matlab构建颜色直方图函数hist(X),这里X参数即表示计算出的特征矢量L的值;使用二维数组存储每个分类图像的像素数;其中,H表示色调,S表示饱和度,V表示亮度;特征矢量L的取值范围为[0,1,…165],且特征矢量L获得166个一维直方图。
5.根据权利要求1或2所述的基于多特征融合的图像检索方法,其特征在于,所述步骤三中多尺度形态梯度的实现方法为:
将结构元素b对滤波图像f1的位置(x,y)进行腐蚀:
(f1⊙b)(x,y)=min{f1(x+s,y+t)-b(s,t)}(s,t)∈Db
将结构元素b在滤波图像f1的位置(x,y)进行扩展:
Figure FDA0002341763970000021
腐蚀和膨胀操作运算后得到的图像的多尺度形态梯度为:
Figure FDA0002341763970000022
其中,⊙表示同或运算符,
Figure FDA0002341763970000023
表示异或运算符,Db表示整幅图像的区域空间,s,t均表示在某一坐标(x,y)的基础上所要遍历的像素点的值。
6.根据权利要求5所述的基于多特征融合的图像检索方法,其特征在于,画出待检测图像和实验样本图像一维直方图,比较待检测图像和实验样本图像的直方图频谱分布,设定相似度阈值,根据阈值的设定比较多组图像相似度,如果多组图像相同,进一步测量每个相似颜色区域的形状特征的相似性:总体差异评估方程为:
D=(1-ρ)*D(s)+ρ*D(c);
其中,D表示融合后的图像特征与原图像的差异程度,ρ是基于颜色和空间特征的权重;D(s)和D(c)分别是颜色相似度和质心相似度自适应系数。
7.根据权利要求1或6所述的基于多特征融合的图像检索方法,其特征在于,在检索商标图像的过程中,对自适应融合获得的图像特征进行哈希编码;对于任何输入的待检索图像,待检索图像和用于检索的图像哈希码之间的汉明距离反映了两者之间的相似性:S=||Yq-Yn||;
其中,Yq,Yn∈{0,1}分别表示待检索图像和用于检索的图像的哈希码,S表示汉明距离;
根据汉明距离S按升序返回用于检索的图像,从而得到与待检索图像相似度最高的前m个图像。
CN201911378972.3A 2019-12-27 2019-12-27 一种基于多特征融合的图像检索方法 Pending CN111125416A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911378972.3A CN111125416A (zh) 2019-12-27 2019-12-27 一种基于多特征融合的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911378972.3A CN111125416A (zh) 2019-12-27 2019-12-27 一种基于多特征融合的图像检索方法

Publications (1)

Publication Number Publication Date
CN111125416A true CN111125416A (zh) 2020-05-08

Family

ID=70504246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911378972.3A Pending CN111125416A (zh) 2019-12-27 2019-12-27 一种基于多特征融合的图像检索方法

Country Status (1)

Country Link
CN (1) CN111125416A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639212A (zh) * 2020-05-27 2020-09-08 中国矿业大学 一种矿用智能视频分析中的图像检索方法
CN112381733A (zh) * 2020-11-13 2021-02-19 四川大学 面向图像恢复的多尺度神经网络结构搜索方法及网络应用
CN112561991A (zh) * 2020-11-20 2021-03-26 西安石油大学 基于surf特征提取和颜色分割的液位计图像识别方法
CN112861985A (zh) * 2021-02-24 2021-05-28 郑州轻工业大学 基于人工智能的图书自动分类方法
CN113254688A (zh) * 2021-04-28 2021-08-13 广东技术师范大学 一种基于深度哈希的商标检索方法
CN113298853A (zh) * 2021-06-28 2021-08-24 郑州轻工业大学 一种逐级递进的二阶段医学图像配准方法
CN113721859A (zh) * 2021-09-08 2021-11-30 郑州轻工业大学 一种基于人工智能的图像重复数据删除方法
CN114170522A (zh) * 2022-02-14 2022-03-11 北京中科慧眼科技有限公司 基于色谱相似性度量的颜色分类识别方法和系统
CN114241484A (zh) * 2022-02-23 2022-03-25 北京嘉沐安科技有限公司 一种面向社交网络的图像大数据精准检索方法及系统
CN114357214A (zh) * 2022-03-18 2022-04-15 苏州浪潮智能科技有限公司 一种图像检索方法、装置及相关设备
CN115017357A (zh) * 2022-06-01 2022-09-06 特赞(上海)信息科技有限公司 图像检索方法、图像库构建方法、电子设备及存储介质
CN115116577A (zh) * 2022-07-26 2022-09-27 青岛美迪康数字工程有限公司 基于二维码的质控数据传输方法及装置
CN115661584A (zh) * 2022-11-18 2023-01-31 浙江莲荷科技有限公司 一种模型训练方法、开放域目标检测方法及相关装置
CN116309216A (zh) * 2023-02-27 2023-06-23 南京博视医疗科技有限公司 基于多波段的伪彩色图像融合方法及图像融合系统
CN116825259A (zh) * 2023-08-31 2023-09-29 四川省医学科学院·四川省人民医院 一种基于物联网的医疗数据管理方法
CN117197700A (zh) * 2023-11-07 2023-12-08 成都中轨轨道设备有限公司 智能化无人巡检接触网缺陷识别系统
CN117874278A (zh) * 2024-03-11 2024-04-12 盛视科技股份有限公司 基于多区域特征组合的图像检索方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763429A (zh) * 2010-01-14 2010-06-30 中山大学 一种基于颜色和形状特征的图像检索方法
CN104021234A (zh) * 2014-06-30 2014-09-03 中国科学院自动化研究所 一种基于自适应位分配哈希算法的大规模图像库检索方法
CN106407352A (zh) * 2016-09-06 2017-02-15 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于深度学习的交通图像检索方法
US20190206077A1 (en) * 2018-01-02 2019-07-04 Chung Ang University Industry Academic Cooperation Foundation Apparatus and method for re-identifying object in image processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763429A (zh) * 2010-01-14 2010-06-30 中山大学 一种基于颜色和形状特征的图像检索方法
CN104021234A (zh) * 2014-06-30 2014-09-03 中国科学院自动化研究所 一种基于自适应位分配哈希算法的大规模图像库检索方法
CN106407352A (zh) * 2016-09-06 2017-02-15 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于深度学习的交通图像检索方法
US20190206077A1 (en) * 2018-01-02 2019-07-04 Chung Ang University Industry Academic Cooperation Foundation Apparatus and method for re-identifying object in image processing

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
帅勤: "基于MPEG-7的纹理和颜色特征的图像检索技术", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
田流芳: "基于中值滤波和小波变换的图像去噪算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
陶晓勋 等: "基于多尺度形态梯度的灰度图像边缘检测", 《遥感信息》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639212B (zh) * 2020-05-27 2023-09-05 中国矿业大学 一种矿用智能视频分析中的图像检索方法
CN111639212A (zh) * 2020-05-27 2020-09-08 中国矿业大学 一种矿用智能视频分析中的图像检索方法
CN112381733B (zh) * 2020-11-13 2022-07-01 四川大学 面向图像恢复的多尺度神经网络结构搜索方法及网络应用
CN112381733A (zh) * 2020-11-13 2021-02-19 四川大学 面向图像恢复的多尺度神经网络结构搜索方法及网络应用
CN112561991A (zh) * 2020-11-20 2021-03-26 西安石油大学 基于surf特征提取和颜色分割的液位计图像识别方法
CN112561991B (zh) * 2020-11-20 2024-04-09 西安石油大学 基于surf特征提取和颜色分割的液位计图像识别方法
CN112861985A (zh) * 2021-02-24 2021-05-28 郑州轻工业大学 基于人工智能的图书自动分类方法
CN112861985B (zh) * 2021-02-24 2023-01-31 郑州轻工业大学 基于人工智能的图书自动分类方法
CN113254688A (zh) * 2021-04-28 2021-08-13 广东技术师范大学 一种基于深度哈希的商标检索方法
CN113298853A (zh) * 2021-06-28 2021-08-24 郑州轻工业大学 一种逐级递进的二阶段医学图像配准方法
CN113721859A (zh) * 2021-09-08 2021-11-30 郑州轻工业大学 一种基于人工智能的图像重复数据删除方法
CN113721859B (zh) * 2021-09-08 2023-07-21 欧亚高科数字技术有限公司 一种基于人工智能的图像重复数据删除方法
CN114170522A (zh) * 2022-02-14 2022-03-11 北京中科慧眼科技有限公司 基于色谱相似性度量的颜色分类识别方法和系统
CN114241484A (zh) * 2022-02-23 2022-03-25 北京嘉沐安科技有限公司 一种面向社交网络的图像大数据精准检索方法及系统
CN114357214A (zh) * 2022-03-18 2022-04-15 苏州浪潮智能科技有限公司 一种图像检索方法、装置及相关设备
CN115017357A (zh) * 2022-06-01 2022-09-06 特赞(上海)信息科技有限公司 图像检索方法、图像库构建方法、电子设备及存储介质
CN115116577A (zh) * 2022-07-26 2022-09-27 青岛美迪康数字工程有限公司 基于二维码的质控数据传输方法及装置
CN115661584A (zh) * 2022-11-18 2023-01-31 浙江莲荷科技有限公司 一种模型训练方法、开放域目标检测方法及相关装置
CN116309216A (zh) * 2023-02-27 2023-06-23 南京博视医疗科技有限公司 基于多波段的伪彩色图像融合方法及图像融合系统
CN116309216B (zh) * 2023-02-27 2024-01-09 南京博视医疗科技有限公司 基于多波段的伪彩色图像融合方法及图像融合系统
CN116825259A (zh) * 2023-08-31 2023-09-29 四川省医学科学院·四川省人民医院 一种基于物联网的医疗数据管理方法
CN116825259B (zh) * 2023-08-31 2023-11-07 四川省医学科学院·四川省人民医院 一种基于物联网的医疗数据管理方法
CN117197700A (zh) * 2023-11-07 2023-12-08 成都中轨轨道设备有限公司 智能化无人巡检接触网缺陷识别系统
CN117197700B (zh) * 2023-11-07 2024-01-26 成都中轨轨道设备有限公司 智能化无人巡检接触网缺陷识别系统
CN117874278A (zh) * 2024-03-11 2024-04-12 盛视科技股份有限公司 基于多区域特征组合的图像检索方法及系统
CN117874278B (zh) * 2024-03-11 2024-05-28 盛视科技股份有限公司 基于多区域特征组合的图像检索方法及系统

Similar Documents

Publication Publication Date Title
CN111125416A (zh) 一种基于多特征融合的图像检索方法
CN111860494B (zh) 图像目标检测的优化方法、装置、电子设备和存储介质
CN105518668B (zh) 基于内容的图像检索
Wang et al. Visual saliency by selective contrast
JP4098021B2 (ja) シーン識別方法および装置ならびにプログラム
CN107967482A (zh) 图标识别方法及装置
JP2017004480A (ja) 顕著性情報取得装置及び顕著性情報取得方法
CN101551823A (zh) 一种综合多特征图像检索方法
JP2002203246A (ja) 画像オブジェクトのランク付け
Guedri et al. Indexing and images retrieval by content
CN107622280B (zh) 基于场景分类的模块化处方式图像显著性检测方法
Feng et al. A color image segmentation method based on region salient color and fuzzy c-means algorithm
Casanova et al. Texture analysis using fractal descriptors estimated by the mutual interference of color channels
Liu et al. A novel color-texture descriptor based on local histograms for image segmentation
CN106557740A (zh) 一种遥感图像中油库目标的识别方法
Bai et al. Principal pixel analysis and SVM for automatic image segmentation
CN109299295B (zh) 蓝印花布图像数据库搜索方法
Mata-Montero et al. A texture and curvature bimodal leaf recognition model for identification of costa rican plant species
Yousefi et al. Water-body segmentation in satellite imagery applying modified kernel kmeans
CN106846377A (zh) 一种基于颜色属性和主动特征提取的目标跟踪算法
JP2009123234A (ja) オブジェクト識別方法および装置ならびにプログラム
CN109446963A (zh) 基于hsv和lbp结合的地表状态识别算法
Saputra et al. Integration GLCM and geometric feature extraction of region of interest for classifying tuna
JP4285640B2 (ja) オブジェクト識別方法および装置ならびにプログラム
CN106340038A (zh) 一种基于单目图像中物体的深度次序推理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination