CN110737796B - 图像检索方法、装置、设备及计算机可读存储介质 - Google Patents

图像检索方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110737796B
CN110737796B CN201910989436.0A CN201910989436A CN110737796B CN 110737796 B CN110737796 B CN 110737796B CN 201910989436 A CN201910989436 A CN 201910989436A CN 110737796 B CN110737796 B CN 110737796B
Authority
CN
China
Prior art keywords
shape
image
scale
processed
matched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910989436.0A
Other languages
English (en)
Other versions
CN110737796A (zh
Inventor
钟宝江
周雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Tengshuicheng Technology Co ltd
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201910989436.0A priority Critical patent/CN110737796B/zh
Publication of CN110737796A publication Critical patent/CN110737796A/zh
Application granted granted Critical
Publication of CN110737796B publication Critical patent/CN110737796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种图像检索方法、装置、设备及计算机可读存储介质。其中,方法包括分别提取待处理图像和各待匹配图像的轮廓边缘,并等距离采样多个点作为形状表示;利用多尺度高度函数子计算上述各图像在形状融合多尺度空间下的形状描述子;尺度高度函数子为在形态学尺度参数和高斯平滑尺度参数作用下的高度函数描述子;基于各形状描述子,通过计算待处理图像和各待匹配图像在单尺度空间的形状相似度,生成多个单尺度检索结果集;利用权重赋值函数为各待匹配图像形状设置新相似度值,并根据重新赋值的各单尺度检索结果集确定待处理图像的检索结果,实现了在保证高检索率的前提下,同时能很好地处理噪声干扰、类内变化甚至是不规则变化形状。

Description

图像检索方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及计算机视觉与图像处理技术领域,特别是涉及一种图像检索方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机科学、通信技术及Internet网络的迅速发展,信息化社会快速普及并蔓延。如何有效获取和存储多媒体材料,以及在海量的多媒体信息中快速、有效地访问感兴趣地多媒体信息在信息化社会中尤为重要。由此,信息检索技术受到了广泛的研究和关注。图像信息作为多媒体信息中最常见的一种,具有信息数据大、抽象程度低的特点。如何从海量的图像信息中有效地获取有用信息,即图像信息检索,显得日益重要。
自上世纪70年代以来,图像检索和匹配受到数据库管理系统和计算机视觉的推动,成为一个非常活跃的研究领域。同时,基于文本和关键字的图像检索技术得到了广泛应用,其通过两种方法实现,一种为通过对图像进行人工标注关键字进行检索;另一种为根据图像的外部信息,比如图像文件名、目录名和周围的文字说明等信息进行检索。但是,由于大量注释性文字的手工输入需要花费大量人力和物力,且不同用户对图像的理解存在主观性,此外,简短的文本描述难以体现图像丰富的内容,因此常常检索出许多无关的内容,这些原因导致上述技术存在一定的局限性。
针对基于文本和关键字的图像检索技术的局限性,90年代出现了基于内容的图像检索技术,并成为国内外研究的一个新热点。该技术为基于图像视觉特征的图像检索,根据图像所包含的颜色、纹理、形状、空间关系等信息建立索引,并通过特征向量之间的距离计算相似度。基于内容的图像检索技术综合应用了图像工程、数字信号处理、人工智能等相关学科的知识,直接比较图像的内容,更符合人眼的视觉习惯。且它能真实有效的表示图像内容,帮助用户快速有效地访问感兴趣的图像。在实际生产应用中,图像数据库及其检索的研究对多媒体数字图书馆、医学图像管理、卫星遥感图像和计算机辅助设计和制造、地理信息系统、犯罪识别系统、商标版权的管理,生物的辨识分类等方面提出了有力的支持。
形状特征为图像的重要特征之一,图像的形状信息不随图像颜色的变化而变化,是物体稳定的特征,因此可以利用形状特征,实现对形状特征比较明显的各类图像库进行检索,例如百度和谷歌搜索引擎中,均推出“以图搜图”的功能。在以查询与图像具有相似形状为主要目的检索中,形状特征显示出颜色、纹理所不能比拟的优越性能。形状及其特征主要有以下两个特点:1)人对形状的感知是视网膜感受和人关于现实世界的知识之间的综合结果,因此形状目前还没有确切的数学定义,其几何、统计等测度使之能与人的感觉一致;2)形状常与人们感兴趣的目标联系在一起,有一定的语义,可以看作是比颜色或纹理高层一些的特征,对形状的描述是一个相当复杂的问题,比对颜色或纹理的表达从本质上要复杂的多。形状特征本身的优点使得它将不同的图像目标区分开。作为人类辨别物体的基础依据,形状的匹配和识别在计算机视觉领域里具有重要的研究价值。形状匹配算法按照一定的衡量标准判别形状间的相似程度,已广泛应用于图像检索领域。
在国内外形状匹配算法的研究过程中,形状的轮廓信息是完成形状识别的重要线索之一,并以此为基础提出了多种具有代表性的形状描述子,例如全局形状描述子和局部形状描述子,全局描述子对于局部变换有较好的鲁棒性,但是难以获取形状重要的局部细节;而局部形状描述子能准确表征局部特征,但在面临强烈噪声和局部变换时存在不足。相关技术通过形状某一点与其他轮廓点的相对空间分布(距离和方向)关系生成一系列向量描述形状,尽管其对轮廓的描述能力强,但是较为复杂,抗噪能力差,图像检索准确率不高。
发明内容
本公开提供了一种图像检索方法、装置、设备及计算机可读存储介质,在保证高检索率的前提下,能同时处理噪声干扰、类内变化甚至是不规则变化形状。
为解决上述技术问题,本公开提供以下技术方案:
本发明实施例一方面提供了一种图像检索方法,包括:
分别提取待处理图像和各待匹配图像的轮廓边缘,并等距离采样多个点作为形状表示;
利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子;所述尺度高度函数子为在形态学尺度参数和高斯平滑尺度参数作用下的高度函数描述子;
基于各形状描述子,通过计算所述待处理图像和各待匹配图像在各单尺度空间下的形状相似度,生成多个单尺度检索结果集;
利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,并根据重新赋值后的各单尺度检索结果集确定所述待处理图像的检索结果。
可选的,所述利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子为:
利用修正高度函数描述子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子,所述修正高度函数描述子为:
Figure BDA0002237764200000031
式中,
Figure BDA0002237764200000032
为第i个采样点的在形状融合多尺度空间下的形状描述子,N为采样点总数,
Figure BDA0002237764200000033
为形态学尺度参数,σ为高斯平滑尺度参数,hi,N为第i个采样点到基准轴lN的高度函数值。
可选的,所述利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值为:
利用相似度赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,所述相似度赋值函数为:
Figure BDA0002237764200000034
式中,
Figure BDA0002237764200000041
为尺寸检索结果集St中的第i张待匹配图像的形状的新相似度值,
Figure BDA0002237764200000042
为尺寸检索结果集St中的第i张待匹配图像的形状。
可选的,所述根据重新赋值后的各单尺度检索结果集确定所述待处理图像的检索结果包括:
将重新赋值后的各单尺度检索结果集的并集作为所述待处理图像的形状检索结果集;
利用相似度计算关系式计算所述待处理图像和所述形状检索结果集中各待匹配图像的形状的相似度值:
Figure BDA0002237764200000043
式中,Fj为所述待处理图像和所述形状检索结果集的第j张待匹配图像的相似度值,wk为第k个尺寸检索结果集Sk的权重系数,n为所述形状检索结果集中包含待匹配图像的总个数,
Figure BDA0002237764200000044
为第j张待匹配图像的新相似度值;
按照Fj的降序排列顺序对所述形状检索结果集中各待匹配图像进行排序,并将排序后的形状检索结果集作为所述待处理图像的检索结果。
可选的,所述利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子包括:
计算所述待处理图像的每个采样点分别到其他各采样点的切线的距离,以作为所述待处理图像的形状序列特征;
利用预设多尺度函数计算所述形状序列特征的多尺度特征,以作为所述待处理图像的形状描述子;所述多尺度函数为根据形态学尺度参数和高斯平滑尺度参数生成,且形态学尺度参数值和高斯平滑尺度参数值随着所述待处理图像形状的形变程度增大而增大。
本发明实施例另一方面提供了一种图像检索装置,包括:
轮廓边缘提取模块,用于分别提取待处理图像和各待匹配图像的轮廓边缘,并等距离采样多个点作为形状表示;
形状描述子生成模块,用于利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子;所述尺度高度函数子为在形态学尺度参数和高斯平滑尺度参数作用下的高度函数描述子;
单尺度检索结果集生成模块,用于基于各形状描述子,通过计算所述待处理图像和各待匹配图像在各单尺度空间下的形状相似度,生成多个单尺度检索结果集;
多尺度融合结果生成模块,用于利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,并根据重新赋值后的各单尺度检索结果集确定所述待处理图像的检索结果。
可选的,所述形状描述子生成模块为利用修正高度函数描述子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子的模块,所述修正高度函数描述子为:
Figure BDA0002237764200000051
式中,
Figure BDA0002237764200000052
为第i个采样点的在形状融合多尺度空间下的形状描述子,N为采样点总数,
Figure BDA0002237764200000053
为形态学尺度参数,σ为高斯平滑尺度参数,hi,N为第i个采样点到基准轴lN的高度函数值。
可选的,所述多尺度融合结果生成模块包括:
初始检索结果集生成子模块,用于将重新赋值后的各单尺度检索结果集的并集作为所述待处理图像的形状检索结果集;
相似度计算子模块,用于利用相似度计算关系式计算所述待处理图像和所述形状检索结果集中各待匹配图像的形状的相似度值:
Figure BDA0002237764200000054
式中,Fj为所述待处理图像和所述形状检索结果集的第j张待匹配图像的相似度值,wk为第k个尺寸检索结果集Sk的权重系数,n为所述形状检索结果集中包含待匹配图像的总个数,
Figure BDA0002237764200000055
为第j张待匹配图像的新相似度值;
排序子模块,用于按照Fj的降序排列顺序对所述形状检索结果集中各待匹配图像进行排序;
最终检索结果集生成子模块,用于将排序后的形状检索结果集作为所述待处理图像的检索结果。
本发明实施例还提供了一种图像检索设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述图像检索方法的步骤。
本发明实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有图像检索程序,所述图像检索程序被处理器执行时实现如前任一项所述图像检索方法的步骤。
本申请提供的技术方案的优点在于,利用多尺度形状描述待处理图像和各待匹配图像,在基于高度函数对图像描述丰富的形状特征基础上,通过形态尺度空间的形状处理,可以很好地解决形状的边缘波动性和剧烈的形状缝隙,极大地提高了与同类形状的相似程度;通过高斯尺度空间的形状处理可以有效过滤轮廓处噪声点及不重要的形状特征,具有很好的平滑效果;不仅具有较好的抗干扰性能,还能同时处理形状的类内变换或不规则变换;通过对各单尺度检索结果集进行多尺度融合,有效地将多尺度独立提取的检索结果进行组合,有效地提高了基于形状的图像检索的准确率和鲁棒性。
此外,本发明实施例还针对图像检索方法提供了相应的实现装置、设备及计算机可读存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机可读存储介质具有相应的优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚的说明本发明实施例或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图像检索方法的流程示意图;
图2为本发明实施例提供的形态尺度空间中处理严重形变图像后的效果展示图;
图3为本发明实施例提供的高斯尺度空间中处理边缘噪声后的效果展示图;
图4为本发明实施例提供的一种融合尺度空间尺度下的形状处理结果展示图;
图5为本发明实施例提供的另一种融合尺度空间尺度下的形状处理结果展示图;
图6为本发明实施例提供的再一种融合尺度空间尺度下的形状处理结果展示图;
图7为本发明实施例提供的一种高度函数特征描述子的原理示意图;
图8为本发明实施例提供的融合尺度空间中五边形中心点的高度函数描述图;
图9为本发明实施例提供的多尺度融合尺度空间待识别形状骆驼的前20个检索结果图;
图10为本发明实施例提供的另一种图像检索方法的流程示意图;
图11为本发明实施例提供的不同高斯噪声程度下的形状轮廓示意图;
图12为本发明实施例提供的Kimia-99数据库上不同算法的鲁棒性测试结果示意图;
图13为本发明实施例提供的图像检索装置的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种图像检索方法的流程示意图,本发明实施例可包括以下内容:
S101:分别提取待处理图像和各待匹配图像的轮廓边缘,并等距离采样多个点作为形状表示。
在本申请中,从数据库中为待处理图像匹配相似或相同图像,数据库中包含多张图像,每张图像即为本申请所述的待匹配图像。可采用任何一种轮廓提取方法对待处理图像和各待匹配图像的轮廓边缘,并在得到轮廓边缘图像后,利用任何一种采样方法对待处理图像和各待匹配图像的轮廓边缘图像进行等距离采样,采样点组合起来作为各图像的形状表示。
S102:利用预设多尺度高度函数子计算待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子。
在本申请中,尺度高度函数子为在形态学尺度参数和高斯平滑尺度参数作用下的高度函数描述子,例如可首先基于高度函数描述方法,提取各图形的形状序列特征;然后,结合形态学操作和高斯平滑两种策略获取多尺度下的形状特征,作为新的形状描述子。也就是说,可通过计算待处理图像和各待匹配图像的每个采样点分别到其他各采样点的切线的距离,作为待处理图像和各待匹配图像的形状序列特征;利用预设多尺度函数计算形状序列特征的多尺度特征,以作为待处理图像的的形状描述子。多尺度函数为根据形态学尺度参数和高斯平滑尺度参数生成,低尺度下对形状的局部细节具有较强的表征能力,而高尺度下能保持稳定的形状特征,尤其在噪声或局部变换情况下。为更有效地获取形状特征,形态学尺度参数值和高斯平滑尺度参数值随着待处理图像形状的形变程度增大而增大。
可以理解的是,一张二维图像f(x,y)的尺度空间生成需要两个基本步骤。首先,图像f(x,y)通过一组平滑算子s(x,y;r)可生成图像从粗到精的表示,尺度r下平滑后的形状可表示为I(x,y;r)=Φ(f(x,y),s(x,y,r))。
其中,尺度参数r可以是离散的(r∈Z),也可以是连续的(r∈R)。图像的平滑程度由核函数s(x,y;r)中r的大小决定,平滑操作Φ分为线性和非线性两种模式。总的来说,低尺度下能提取图像细节特征,高尺度下提取图像的整体特征。
其次,对平滑图像I(x,y;r)进行特征提取以获得所需要的图形特征。特征提取描述子Π取决于具体的计算模式,可能由几个级联操作组成,分别表示特定的函数。提取的特征可表示为{(x,y,r)|Π(I(x,y;r))}。
如果Φ是线性卷积运算,则平滑核h(x,y;r)为高斯,导出三维尺度空间(x,y,r)称为高斯尺度空间。若用形态学开闭运算等非线性操作代替Φ,尺度r替换为结构函数s的空间范围(对于灰度图像),或者结构元素B的大小(对于二值图像),则(x,y,r)生成形态尺度空间。当基于形状特征检索对象时,进行检索的结果很容易受到视觉习惯的影响。形态学运算和高斯平滑是两种常见的视觉习惯。高斯平滑能有效去除轮廓边缘的噪声,尤其针对形状细微变换时,它与人类视觉习惯保持高度一致。但是,这种做法无法很好地处理剧烈变换的形状。因此,为了仿真人类视觉,高斯平滑不能单独使用进行改进。另一方面,形态学操作可以很好地保持形状的主要结构,可基于以上两种尺度空间建立形状的融合尺度描述,以获得由粗到精、整体与局部相结合的形状特征。
形态学操作是图像分析中处理二值图像的一种方法,通过结构元素改变形状的形态。形态学算子根据形状的不同需求定义为不同的SE值或不同运算规则。基础的形态学操作有膨胀和腐蚀,形状S经过结构元素B处理后,数学涵义表示分别为:
Figure BDA0002237764200000101
其中,S+b和S-b为形状S经过+b和-b的变形,可直观理解为形状边界的扩展或收缩。而膨胀和腐蚀通过相同的SE值结合,形成了开运算和闭运算。开运算是先腐蚀后膨胀,闭运算则是先膨胀后腐蚀,本申请中,在对待处理图像和各待匹配图像进行形态学尺度空间操作时,可采用闭运算
Figure BDA0002237764200000102
作为仿真人类视觉特征的操作,在尺度
Figure BDA0002237764200000103
下在保持形状主要结构的同时,改变形状的形态,
Figure BDA00022377642000001012
表示膨胀和腐蚀操作SE值的强度。具体地说,可首先使用Matlab的“strel”函数,通过改变不同的尺度
Figure BDA00022377642000001013
值来创建扁平的圆盘状结构元素,保证形状的旋转不变性。然后,在不同形态尺度下生成一系列形状。然后在使用圆盘状结构元素建立二值图像的多尺度描述,提取不同尺度下边缘的曲率过零点,统计曲率过零点的个数以达到图像平滑的效果。假设闭合形状S的边缘
Figure BDA0002237764200000104
包含固定数量的不规则点,
Figure BDA0002237764200000105
为尺度为
Figure BDA0002237764200000106
的圆盘,
Figure BDA0002237764200000107
定位为轮廓
Figure BDA0002237764200000108
曲率过零点的数量,则
Figure BDA0002237764200000109
同时,
Figure BDA00022377642000001010
随着尺度
Figure BDA00022377642000001011
的增加呈单调递减。即随着尺度的增加,曲率过零点减少,形状逐渐变成全凸。也就是说,通过形态尺度空间的形状处理,可以很好地解决形状的边缘波动性和剧烈的形状缝隙。为了使本领域技术人员更加清楚明白形态学尺度空间的处理效果,图2(b)给出一幅严重变形的形状,图2(a)是同属一个类别的形状,图2(c)是经过形态学尺度空间操作之后的处理结果。从处理结果对比结果中可知,形态尺度空间能很好地处理带有剧烈变形的形状,填补多余的形状缝隙,使其符合人眼视觉特征。根据本申请技术方案,以图2为例,未经形态学处理前,圆(a)与圆(b)的非相似度值(距离)为93.46,而圆(a)与圆(c)的非相似度值为2.10。从量化结果可以看出,形态尺度空间对于处理较强的缝隙缺陷和噪声影响的形状极其必要,极大地提高了与同类形状的相似程度。
可以理解的是,高斯平滑为一个传统的多尺度形状表示的核函数,可以有效过滤轮廓处噪声点及不重要的形状特征,具有很好的平滑效果,形状轮廓可定义为:C=(x(u),y(u),u为归一化的弧长参数。一维高斯滤波器可定义为:
Figure BDA0002237764200000111
其中,σ为高斯核的宽度,也是本申请中形状描述子的尺度参数之一。另X(u,σ)和Y(u,σ)为尺度σ下轮廓曲线的坐标函数,通过X(u,σ)=x(u)*g(u,σ)和Y(u,σ)=y(u)*g(u,σ)的卷积操作计算得到。为了使本领域技术人员更加清楚明白高斯尺度空间的处理效果,图3展示了形状高斯平滑后的视觉对比效果及与相同类别和不同类别形状的相似度计算。其中图2(a)为原形状,图2(b)为高斯平滑后的处理形状。形状A为待识别形状,B为同类形状,C为异类形状。根据本申请技术的技术方案,形状未经处理前,形状A与B的非相似度值(距离)为59.25,形状A与C的非相似度值为56.34;而经过高斯平滑后,形状A’与B’的非相似度值为53.16;而其与C’的非相似度值增至57.85。由此可以看出,形状经过高斯平滑后大大减小了边缘噪声的影响,具有更佳的特征描述能力,使其满足模式识别中类内距离最小化,类间距离最大化的基本原则。因此,建立高斯尺度空间对形状的特征提取同样至关重要。
综上所述,结合形态尺度空间中处理较强缝隙缺陷或形变,高斯尺度空间中处理形状边缘噪声的优势,为提高形状检索的有效性和鲁棒性,可在不同的形态学参数
Figure BDA0002237764200000112
和高斯参数σ的基础上提出一种融合多尺度即
Figure BDA0002237764200000113
的形状描述:
Figure BDA0002237764200000114
σi=i·Δσ(i∈N)。
其中,
Figure BDA0002237764200000115
和Δσ为融合尺度空间中的基准值。如图4-图6所示,不同的尺度参数对形状的影响不同,图4为在尺度参数
Figure BDA0002237764200000116
σ=0的两幅图的形状,图a为“fork”形状,图b为“device”形状;图5为图4中的两幅图在尺度参数
Figure BDA0002237764200000117
σ=8的形状;图6为图4的两幅图在尺度参数
Figure BDA0002237764200000118
σ=16的形状。由图可知,“fork”形状在尺度参数
Figure BDA0002237764200000119
σ=8下可以保存最佳结构信息,而尺度参数
Figure BDA00022377642000001110
σ=16下更符合“device”形状的人眼视觉特征。通过大量的实验验证,可以得知较小形变的形状在低尺度下表现更佳,而具有剧烈形变的形状需要在高尺度下进行处理。因此,将不同尺度下得到的单个结果进行融合,以同时处理不同的转换。
高度函数描述子为一种能描述丰富的形状特征的描述子。该方法将每个采样点作为参考点,计算参考点到其他参考点的切线的距离作为该点的高度值,并作为形状特征。如图7所示为高度函数特征描述子的原理图。令形状表示形状轮廓的等距取样点的集合,其中,N为形状采样点的总个数。将pi作为采样点,则该点的切线方向li作为基准轴,同时规定形状的逆时针方向为正方向。除该点之外的所有取样点与基准轴之间的垂直距离即为本申请中的高度函数,高度值的正负性更好地描述了取样点与基准轴之间的相对位置关系。
当计算pi处的高度函数时,切线li并非是采样点pi的真正切线,而是平行于pi的左右相邻两个采样点pi-1和pi+1的连线l。因此,高度函数值采用采样点到直线l的垂直距离。根据线性代数中行列式与三角形面积的基本关系,形状轮廓的采样点pj相对于轴l的垂直距离均可由点pi-1,pi+1和pj按如下关系求出。若pi-1(xi-1,yi-1),pj(xj,yj)和pi+1(xi+1,yi+1)分别表示pi-1,pj和pi+1三点在形状中的空间位置,则这三点组成的有向三角形面积表示为:
Figure BDA0002237764200000121
其中,Hi,j为采样点pj在点pi处的高度函数值。则
Figure BDA0002237764200000122
这样,可以统计处形状轮廓C上点pi处其他N-1个采样点至基准轴l的高度函数值。根据规定的点序方向排列得到的高度函数值,那么,点pi对应的高度函数可表示为
Figure BDA0002237764200000123
需要说明的是,式中计算高度函数值时,不包括采样点pi本身到基准轴li的高度函数值hi,i,这是因为在本申请描述子的定义中,采样点本身至其切线方向的高度值恒为0。
尽管高度函数描述子能表征丰富的形状特征,但面对较大的轮廓形变和较强的轮廓噪声的形状时,该形状描述的局限性会很大程度地影响算法的检索性能和鲁棒性。因此,本申请融合上述两种多尺度策略,在保证检索精确率的情况下,可以同时处理形状类内变换和噪声影响的问题,以提升其检索性能。
基于此,本申请可利用修正高度函数描述子计算待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子,对于形状轮廓C在融合尺度空间中形态学参数
Figure BDA0002237764200000131
和高斯平滑参数σ下,采样点i处的高度函数描述子,也即修正高度函数描述子可为:
Figure BDA0002237764200000132
式中,
Figure BDA0002237764200000133
为第i个采样点的在形状融合多尺度空间下的形状描述子,N为采样点总数,
Figure BDA0002237764200000134
为形态学尺度参数,σ为高斯平滑尺度参数,hi,N为第i个采样点到基准轴lN的高度函数值。
图8展示了形状在融合尺度空间中高度函数描述函数图,其中融合尺度参数保持与图4-图6中的参数一致。从图中可知,不同的尺度空间下,对应的高度函数曲线差异明显,可以由粗到精地描述形状特征,低尺度可以更加准确地获取形状的局部特征,而高尺度下可以过滤噪声影响,保留形状符合人眼视觉效果下基础的轮廓特征。总之,本申请技术方案可进一步解决轮廓的局部形变与边缘噪声对形状特征描述的影响。
S103:基于各形状描述子,通过计算待处理图像和各待匹配图像在各单尺度空间下的形状相似度,生成多个单尺度检索结果集。
可以理解的是,基于形状的形状描述子进行形状检索时,还需要高效的形状匹配算法。依据形状描述子来计算两个形状轮廓之间的相似度,寻找两个轮廓点序之间的最佳配对关系,进而求出形状轮廓之间的距离,从而实现形状匹配。
对于两个形状轮廓A={p1,p2,...,pN}和B={q1,q2,...,qN},在融合尺度
Figure BDA0002237764200000135
下,它们之间任意两个轮廓点pi和qj的匹配代价定义为这两个点的多尺度高度函数描述间的欧式距离,可表示为:
Figure BDA0002237764200000136
则两个形状轮廓之间的相似度计算可通过二者的匹配代价矩阵(N×N)得到:
Figure BDA0002237764200000141
一种实施方式中,可采用动态规划算法寻找匹配代价矩阵中形状轮廓A和B之间的最优匹配点对,并且在轮廓A中的采样点pi可以在轮廓B中找到唯一的配对点qπ(i),可表示为
Figure BDA0002237764200000142
形状A和B之间的非相似度(距离)d(A,B)为d(A,B)=min fA,B(π)。d(A,B)的值越小,表明形状轮廓A和B距离越小,二者越相似。
S104:利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,并根据重新赋值后的各单尺度检索结果集确定待处理图像的检索结果。
在S103得到了不同尺度下的形状检索结果,为了融合不同尺度下的检索结果,可选取n个尺度进行融合。在每个尺度下,按照形状相似度的度量值升序排列,保留最相似的m个形状。值得注意的是,由于形状在尺度空间下受不同程度地形态学操作和高斯平滑的影响,会改变形状数据库的整体结构,不同尺度空间下的相似度值是不可比较的。因此,可通过为不同尺度下的返回形状建立统一标准进行融合,也即可利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值。权重赋值函数可根据实际用于场景进行预先设定,本申请对此不做任何限定。在各单尺度检索结果集具有统一的融合标准后,可根据重新赋值后的各单尺度检索结果集和预先设定的检索结果输出条件确定待处理图像的检索结果,检索结果输出条件例如可为待处理图像的匹配结果,即仅仅输出与待处理图像相似度最高的待匹配图像;检索结果输出条件例如可为待处理图像的推荐结果,即输出与待处理图像相似度最高的前n张待匹配图像。
在本发明实施例提供的技术方案中,利用多尺度形状描述待处理图像和各待匹配图像,在基于高度函数对图像描述丰富的形状特征基础上,通过形态尺度空间的形状处理,可以很好地解决形状的边缘波动性和剧烈的形状缝隙,极大地提高了与同类形状的相似程度;通过高斯尺度空间的形状处理可以有效过滤轮廓处噪声点及不重要的形状特征,具有很好的平滑效果;不仅具有较好的抗干扰性能,还能同时处理形状的类内变换或不规则变换;通过对各单尺度检索结果集进行多尺度融合,有效地将多尺度独立提取的检索结果进行组合,有效地提高了基于形状的图像检索的准确率和鲁棒性。
作为一种优选的实施方式,S104步骤可通过下述方法进行实现:
假设尺度St下返回的形状集合为
Figure BDA0002237764200000151
对于St中的每一张形状,基于形状返回的排序,可对其进行赋值,使其在不同尺度下具有可比性及可操作性。新的相似度值可利用相似度赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,相似度赋值函数为:
Figure BDA0002237764200000152
式中,
Figure BDA0002237764200000153
为尺寸检索结果集St中的第i张待匹配图像的形状的新相似度值,
Figure BDA0002237764200000154
为尺寸检索结果集St中的第i张待匹配图像的形状。上述函数是递减的,其描述出相同尺度下返回形状与检索形状的相似性。
Figure BDA0002237764200000155
的值越大,二者越相似。
可使用返回形状集的并集生成最终的检索结果,也即将重新赋值后的各单尺度检索结果集的并集作为待处理图像的形状检索结果集。形状检索结果集可表示为U={S0,S1,...,Sn},最终集合中的每一张形状均被赋为新的相似度值。由于某张形状在形状检索结果集U中可能有多重响应,集合U的大小介于m与m·n之间。需要注意的是,若形状轮廓Cj在某一尺度下未被检索出,可设置在该尺度下其相似度值
Figure BDA0002237764200000156
j∈{1,2,...,m}。那么形状检索结果集U中的每一张返回形状与输入形状的相似度值可利用相似度计算关系式计算所述待处理图像和所述形状检索结果集中各待匹配图像的形状的相似度值:
Figure BDA0002237764200000157
式中,Fj为所述待处理图像和所述形状检索结果集的第j张待匹配图像的相似度值,wk为第k个尺寸检索结果集Sk的权重系数,n为所述形状检索结果集中包含待匹配图像的总个数,
Figure BDA0002237764200000161
为第j张待匹配图像的新相似度值。wk为决定某尺度空间下检索结果的权重系数。基于人眼视觉特征,理论上当尺度增大时,形状的形变程度较大,其对应的权重应偏小。
然后可按照Fj的降序排列顺序对形状检索结果集中各待匹配图像进行排序,并将排序后的形状检索结果集作为待处理图像的检索结果。根据预先设置的检索结果输出个数N,将形状检索结果集前N张图像输出,作为待处理图像的匹配结果。
为了使本领域技术人员更加清楚本申请的技术方案,本申请还可通过一个示意性例子以详细阐述本申请技术方案的优越性。请参阅图9和图10所示,图10为本申请技术方案的整体框架图,图9为检索结果展示图。给定形状A和B,形状检索的具体流程如下:(1)提取形状A和B的轮廓边缘,并等距离采样N个点作为形状表示;利用
Figure BDA0002237764200000162
计算形状融合多尺度空间下的形状描述子;分析形状特征之间的匹配代价函数,计算形状A和B之间的代价矩阵D,根据d(A,B)=min fA,B(π)计算单尺度下的形状非相似度,并得到检索结果;融合尺度空间下的检索结果,通过
Figure BDA0002237764200000163
计得到形状A和B的最终距离F(A,B),筛选得到最终的检索形状。
需要说明的是,融合尺度空间下的形状匹配过程中,形状存在翻转或镜面反射的情况,其对匹配结果有一定影响。本申请可固定形状A(待处理图像的形状),分别计算与形状B(待匹配图像的形状)以及镜面反射的形状B′的匹配代价,取其中的最小值作为形状间距离结果。如图9所示,其中,待识别形状为一只骆驼,返回单尺度下前20张的检索结果。图中椭圆或者方形标记表述与待识别形状的错误分类。可以清楚地看出,多尺度融合策略下的检索结果(融合结果)优越于最初的结果(
Figure BDA0002237764200000171
下的结果),同时优于单独融合尺度下的结果。值得一提的是,对于数据库中的其他形状来说,单尺度下的检索结果可能比最终的融合结果更佳,实际中,对如何选择最佳尺度缺乏先验知识,可以保证本申请技术方案的检索结果平均优于任何单尺度结果。
最后,为了验证本申请技术方案的有效性和检索结果精准性,本申请还以MPEG-7数据库为例的测试实施例。具体如下所述:
MPEG-7数据库为形状检索中广泛使用以评估算法精度的数据库。此数据库含有70个不同的类别,每个类别均有20个样本,包含旋转、缩放、遮挡等多种类内变换,共计1400张形状。在形状检索的研究中,常用Bulls-eye Score获取MPEG-7数据库的检索率:首先将数据库中的每张形状作为待识别形状,使用本申请技术方案在整个数据库中寻找与待识别形状最相似的40张形状,统计其中与其属于同一类的形状个数。按照此方法统计整个数据库的检索情况,对其求和之后除以28000(1400×20),即为形状检索率。
在MPEG-7数据库上,本申请技术方案与其他8个具有代表性的现有技术方案检索率对比结果如表1所示。其中本申请技术方案有最高的检索率。对于MPEG-7数据库,可提取5个尺度下的形状特征,即
Figure BDA0002237764200000172
Figure BDA0002237764200000173
采用上述相似度赋值函数计算单尺度下每张返回形状的新相似度,且相似度计算关系式中的权重系数分别取w0=0.4,w1=0.2,w2=0.2,w3=0.1,w4=0.1。
表1 MPEG-7数据库中不同算法检索率对比
Figure BDA0002237764200000174
Figure BDA0002237764200000181
Kimia数据库包含Kimia-25,Kimia-99和Kimia-216三个数据集,由于Kimia-25数据集的形状数量有限,不具备充分的论证效果,因此本申请在Kimia-99和Kimia-216两个数据集上进行形状检索实验,包括旋转、缩放、非刚性变形、遮挡等形状。Kimia-99数据集包含99张形状,可分成9类。与MPEG-7数据集不同的是,检索率为统计前1到10张最相似的同属一类的形状个数,最好的识别结果为99。具体实验中设置了3个尺度σ∈{0,8,16},且相似度计算关系式中的权重系数设置为w0=0.4,w1=0.3,w2=0.3。
Kimia-216数据集由18类形状组成,每类12张,共216个形状。同样地,统计前11张最相似的同属一类的形状个数,最好的结果是216。具体实验中设置了4个尺度
Figure BDA0002237764200000182
Figure BDA0002237764200000183
且相似度计算关系式中的权重系数设置为w0=w1=w2=w3=0.25。本申请技术方案在两个数据集的检索率如表2和表3所示,可知,本申请技术方案均较于当前主流算法,均取得最高的检索结果,突出本申请技术方案的有效性。
表2 Kimia-99数据集的检索对比结果
Figure BDA0002237764200000184
Figure BDA0002237764200000191
表3 Kimia-216数据集的检索对比结果
Figure BDA0002237764200000192
为了评估本申请技术方案的鲁棒性,本申请还在Kimia-99数据集上对形状轮廓添加均值为0、标准差不同的高斯噪声。如图11所示,图11a为输入形状,图11b-e为标准差从0.2以0.2的步长递增至0.8时的图像形状轮廓,标准差越大,噪声强度越大。对加噪之后的形状进行识别,检索结果如表4所示。图12展示了本申请技术方案与其他现有技术方案鲁棒性的对比情况,从Kimia-99数据集上的平均结果可知,本申请技术方案在不同程度的噪声干扰下能保持稳定的检索性能,且与其他三个代表性现有技术方案相比取得最好的识别结果
表4噪声干扰下Kimia-99数据集的检索结果
Figure BDA0002237764200000193
为了验证本申请技术方案的计算效率,本申请在MPEG-7数据库上进行实验测试。使用不同的技术方案对数据库中的每个形状进行检索,统计所需的平均计算时间,对比结果如表5所示。从表中可知,本申请技术方案在同一数据库中所需计算时间是60ms,与其他5个代表性形状检索算法相比较,具有明显的计算效率优越性。
表5 MPEG-7数据库中不同方法的计算效率对比
Figure BDA0002237764200000201
由上可知,本发明实施例为了同时处理强噪声、类内变换和各种不规则变换,采用形态学算子和高斯平滑两种符合人眼视觉特征的操作作为多尺度信息,形成多尺度高度函数描述子,提取更丰富的形状特征。此外,基于本申请提出的融合尺度空间策略获得不同尺度下的融合检索结果。根据上述多个实验的结果表明,本申请技术方案在MPEG-7,Kimia数据库中较于当前主流的形状检索技术方案,具有明显的识别有效性、良好的抗噪性及优越的时间效率。
本发明实施例还针对图像检索方法提供了相应的实现装置,进一步使得所述方法更具有实用性。下面对本发明实施例提供的图像检索装置进行介绍,下文描述的图像检索装置与上文描述的图像检索方法可相互对应参照。
参见图13,图13为本发明实施例提供的图像检索装置在一种具体实施方式下的结构图,该装置可包括:
轮廓边缘提取模块131,用于分别提取待处理图像和各待匹配图像的轮廓边缘,并等距离采样多个点作为形状表示。
形状描述子生成模块132,用于利用预设多尺度高度函数子计算待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子;尺度高度函数子为在形态学尺度参数和高斯平滑尺度参数作用下的高度函数描述子。
单尺度检索结果集生成模块133,用于基于各形状描述子,通过计算待处理图像和各待匹配图像在各单尺度空间下的形状相似度,生成多个单尺度检索结果集。
多尺度融合结果生成模块134,用于利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,并根据重新赋值后的各单尺度检索结果集确定待处理图像的检索结果。
可选的,在本实施例的一些实施方式中,所述形状描述子生成模块132还可为利用修正高度函数描述子计算待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子的模块,修正高度函数描述子为:
Figure BDA0002237764200000211
式中,
Figure BDA0002237764200000212
为第i个采样点的在形状融合多尺度空间下的形状描述子,N为采样点总数,
Figure BDA0002237764200000213
为形态学尺度参数,σ为高斯平滑尺度参数,hi,N为第i个采样点到基准轴lN的高度函数值。
在另外一些实施方式中,所述多尺度融合结果生成模块134例如还可包括:
初始检索结果集生成子模块,用于将重新赋值后的各单尺度检索结果集的并集作为待处理图像的形状检索结果集;
相似度计算子模块,用于利用相似度计算关系式计算待处理图像和形状检索结果集中各待匹配图像的形状的相似度值:
Figure BDA0002237764200000214
式中,Fj为待处理图像和形状检索结果集的第j张待匹配图像的相似度值,wk为第k个尺寸检索结果集Sk的权重系数,n为形状检索结果集中包含待匹配图像的总个数,
Figure BDA0002237764200000215
为第j张待匹配图像的新相似度值;
排序子模块,用于按照Fj的降序排列顺序对形状检索结果集中各待匹配图像进行排序;
最终检索结果集生成子模块,用于将排序后的形状检索结果集作为待处理图像的检索结果。
作为一种优选的实施方式,所述形状描述子生成模块132例如还可包括:
轮廓特征计算子模块,用于计算待处理图像的每个采样点分别到其他各采样点的切线的距离,以作为待处理图像的形状序列特征;
形状描述子生成子模块,用于利用预设多尺度函数计算形状序列特征的多尺度特征,以作为所述待处理图像的形状描述子;多尺度函数为根据形态学尺度参数和高斯平滑尺度参数生成,且形态学尺度参数值和高斯平滑尺度参数值随着所述待处理图像形状的形变程度增大而增大。
可选的,所述多尺度融合结果生成模块134还可为利用相似度赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值的模块,相似度赋值函数为:
Figure BDA0002237764200000221
式中,
Figure BDA0002237764200000222
为尺寸检索结果集St中的第i张待匹配图像的形状的新相似度值,
Figure BDA0002237764200000223
为尺寸检索结果集St中的第i张待匹配图像的形状。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明实施例基于同一构思,具体内容可参见本发明实施例中的叙述,此处,便不再赘述。
由上可知,本发明实施例在保证高检索率的前提下,能同时处理噪声干扰、类内变化甚至是不规则变化形状。
本发明实施例还提供了一种图像检索设备,具体可包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序以实现如上任意一实施例所述图像检索方法的步骤。
本发明实施例所述图像检索设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例在保证高检索率的前提下,能同时处理噪声干扰、类内变化甚至是不规则变化形状。
本发明实施例还提供了一种计算机可读存储介质,存储有图像检索程序,所述图像检索程序被处理器执行时如上任意一实施例所述图像检索方法的步骤。
本发明实施例所述计算机可读存储介质的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例在保证高检索率的前提下,能同时处理噪声干扰、类内变化甚至是不规则变化形状。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种图像检索方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种图像检索方法,其特征在于,包括:
分别提取待处理图像和各待匹配图像的轮廓边缘,并等距离采样多个点作为形状表示;
利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子;所述多尺度高度函数子为在形态学尺度参数和高斯平滑尺度参数作用下的高度函数描述子;
基于各形状描述子,通过计算所述待处理图像和各待匹配图像在各单尺度空间下的形状相似度,生成多个单尺度检索结果集;
利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,并根据重新赋值后的各单尺度检索结果集确定所述待处理图像的检索结果;
其中,利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子包括:
计算所述待处理图像的每个采样点分别到其他各采样点的切线的距离,以作为所述待处理图像的形状序列特征;
利用预设多尺度函数计算所述形状序列特征的多尺度特征,以作为所述待处理图像的形状描述子;所述多尺度函数为根据形态学尺度参数和高斯平滑尺度参数生成,且形态学尺度参数值和高斯平滑尺度参数值随着所述待处理图像形状的形变程度增大而增大。
2.根据权利要求1所述的图像检索方法,其特征在于,所述利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子为:
利用修正高度函数描述子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子,所述修正高度函数描述子为:
Figure FDA0003562786280000011
式中,
Figure FDA0003562786280000012
为第i个采样点的在形状融合多尺度空间下的形状描述子,N为采样点总数,
Figure FDA0003562786280000013
为形态学尺度参数,σ为高斯平滑尺度参数,hi,N为第i个采样点到基准轴lN的高度函数值。
3.根据权利要求1所述的图像检索方法,其特征在于,所述利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值为:
利用相似度赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,所述相似度赋值函数为:
Figure FDA0003562786280000021
式中,
Figure FDA0003562786280000022
为尺寸检索结果集St中的第i张待匹配图像的形状的新相似度值,
Figure FDA0003562786280000023
为尺寸检索结果集St中的第i张待匹配图像的形状。
4.根据权利要求1-3任意一项所述的图像检索方法,其特征在于,所述根据重新赋值后的各单尺度检索结果集确定所述待处理图像的检索结果包括:
将重新赋值后的各单尺度检索结果集的并集作为所述待处理图像的形状检索结果集;
利用相似度计算关系式计算所述待处理图像和所述形状检索结果集中各待匹配图像的形状的相似度值:
Figure FDA0003562786280000024
式中,Fj为所述待处理图像和所述形状检索结果集的第j张待匹配图像的相似度值,wk为第k个尺寸检索结果集Sk的权重系数,n为所述形状检索结果集中包含待匹配图像的总个数,
Figure FDA0003562786280000025
为第j张待匹配图像的新相似度值;
按照Fj的降序排列顺序对所述形状检索结果集中各待匹配图像进行排序,并将排序后的形状检索结果集作为所述待处理图像的检索结果。
5.一种图像检索装置,其特征在于,包括:
轮廓边缘提取模块,用于分别提取待处理图像和各待匹配图像的轮廓边缘,并等距离采样多个点作为形状表示;
形状描述子生成模块,用于利用预设多尺度高度函数子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子;所述多尺度高度函数子为在形态学尺度参数和高斯平滑尺度参数作用下的高度函数描述子;
单尺度检索结果集生成模块,用于基于各形状描述子,通过计算所述待处理图像和各待匹配图像在各单尺度空间下的形状相似度,生成多个单尺度检索结果集;
多尺度融合结果生成模块,用于利用预设权重赋值函数对各单尺度检索结果集中的每个待匹配图像设置新相似度值,并根据重新赋值后的各单尺度检索结果集确定所述待处理图像的检索结果;
其中,所述形状描述子生成模块进一步用于:计算所述待处理图像的每个采样点分别到其他各采样点的切线的距离,以作为所述待处理图像的形状序列特征;利用预设多尺度函数计算所述形状序列特征的多尺度特征,以作为所述待处理图像的形状描述子;所述多尺度函数为根据形态学尺度参数和高斯平滑尺度参数生成,且形态学尺度参数值和高斯平滑尺度参数值随着所述待处理图像形状的形变程度增大而增大。
6.根据权利要求5所述的图像检索装置,其特征在于,所述形状描述子生成模块为利用修正高度函数描述子计算所述待处理图像和各待匹配图像在形状融合多尺度空间下的形状描述子的模块,所述修正高度函数描述子为:
Figure FDA0003562786280000031
式中,
Figure FDA0003562786280000032
为第i个采样点的在形状融合多尺度空间下的形状描述子,N为采样点总数,
Figure FDA0003562786280000033
为形态学尺度参数,σ为高斯平滑尺度参数,hi,N为第i个采样点到基准轴lN的高度函数值。
7.根据权利要求5或6所述的图像检索装置,其特征在于,所述多尺度融合结果生成模块包括:
初始检索结果集生成子模块,用于将重新赋值后的各单尺度检索结果集的并集作为所述待处理图像的形状检索结果集;
相似度计算子模块,用于利用相似度计算关系式计算所述待处理图像和所述形状检索结果集中各待匹配图像的形状的相似度值:
Figure FDA0003562786280000034
式中,Fj为所述待处理图像和所述形状检索结果集的第j张待匹配图像的相似度值,wk为第k个尺寸检索结果集Sk的权重系数,n为所述形状检索结果集中包含待匹配图像的总个数,
Figure FDA0003562786280000041
为第j张待匹配图像的新相似度值;
排序子模块,用于按照Fj的降序排列顺序对所述形状检索结果集中各待匹配图像进行排序;
最终检索结果集生成子模块,用于将排序后的形状检索结果集作为所述待处理图像的检索结果。
8.一种图像检索设备,其特征在于,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至4任一项所述图像检索方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图像检索程序,所述图像检索程序被处理器执行时实现如权利要求1至4任一项所述图像检索方法的步骤。
CN201910989436.0A 2019-10-17 2019-10-17 图像检索方法、装置、设备及计算机可读存储介质 Active CN110737796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910989436.0A CN110737796B (zh) 2019-10-17 2019-10-17 图像检索方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910989436.0A CN110737796B (zh) 2019-10-17 2019-10-17 图像检索方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110737796A CN110737796A (zh) 2020-01-31
CN110737796B true CN110737796B (zh) 2022-06-10

Family

ID=69270066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910989436.0A Active CN110737796B (zh) 2019-10-17 2019-10-17 图像检索方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110737796B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200738A (zh) * 2020-09-29 2021-01-08 平安科技(深圳)有限公司 形状的突起识别方法、装置以及计算机设备
CN114428876B (zh) * 2021-12-29 2023-03-07 广州盖盟达工业品有限公司 一种工业器械的图像搜索方法、装置、存储介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2128796A1 (en) * 1999-07-15 2009-12-02 Mitsubishi Electric Information Technology Centre Europe B.V. Method and device for displaying or searching for object in image and computer-readable storage medium
CN107133648A (zh) * 2017-05-05 2017-09-05 南京航空航天大学 基于自适应多尺度融合稀疏保持投影的一维距离像识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712109B2 (en) * 2009-05-08 2014-04-29 Microsoft Corporation Pose-variant face recognition using multiscale local descriptors

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2128796A1 (en) * 1999-07-15 2009-12-02 Mitsubishi Electric Information Technology Centre Europe B.V. Method and device for displaying or searching for object in image and computer-readable storage medium
CN107133648A (zh) * 2017-05-05 2017-09-05 南京航空航天大学 基于自适应多尺度融合稀疏保持投影的一维距离像识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于二次引导滤波的局部立体匹配算法》;王凯 等;《激光与光电子学进展》;20190430;第56卷(第8期);第081004-1至081004-7页 *
《基于形状的图像匹配及商标图形检索系统的研究》;曾硕;《中国优秀硕士学位论文全文数据库信息科技辑》;20170315(第03期);第I138至4052页 *

Also Published As

Publication number Publication date
CN110737796A (zh) 2020-01-31

Similar Documents

Publication Publication Date Title
Biasotti et al. Sub-part correspondence by structural descriptors of 3D shapes
US20190295296A1 (en) Gragnostics rendering
CN101295305A (zh) 图像检索装置
CN108492160A (zh) 信息推荐方法和装置
CN110737796B (zh) 图像检索方法、装置、设备及计算机可读存储介质
Atlam et al. Comparative study on CBIR based on color feature
CN104751463B (zh) 一种基于草图轮廓特征的三维模型最佳视角选取方法
Neto et al. Efficient computation and visualization of multiple density-based clustering hierarchies
CN106407281B (zh) 图像检索方法及装置
Shanmugavadivu et al. FOSIR: fuzzy-object-shape for image retrieval applications
López-Cifuentes et al. Attention-based knowledge distillation in scene recognition: the impact of a dct-driven loss
KR100849631B1 (ko) 문서 그룹화 시스템과 그 그룹화 방법 및 이를 기록한기록매체
Pandey et al. A hierarchical clustering approach for image datasets
Eler et al. Using otsu's threshold selection method for eliminating terms in vector space model computation
CN109740013A (zh) 图像数据处理方法及图像检索方法
Tan et al. Local features and manifold ranking coupled method for sketch-based 3D model retrieval
Wu et al. Similar image retrieval in large-scale trademark databases based on regional and boundary fusion feature
Boudani et al. Content-Based Image Retrieval for Surface Defects of Hot Rolled Steel Strip Using Wavelet-Based LBP
Minarno et al. A Systematic Literature Review on Batik Image Retrieval
Fonseca et al. Generic shape classification for retrieval
Feng et al. A Descriptor for Voxel Shapes Based on the Skeleton Cut Space.
Zhou et al. Shape description and retrieval in a fused scale space
Mahiddine et al. Partial 3D-object retrieval using level curves
Pournazari et al. Video Summarization Based on a Fuzzy Based Incremental Clustering.
Barkalle et al. An Effective Content Based Image Retrieval System Based on Global Representation and Multi-Level Searching

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231107

Address after: Room 4908, building 2, dongfangzhimen building, 199 Xinggang street, Suzhou Industrial Park, Suzhou, Jiangsu 215000

Patentee after: Suzhou tengshuicheng Technology Co.,Ltd.

Address before: No.8 Jixue Road, Xiangcheng District, Suzhou City, Jiangsu Province

Patentee before: SOOCHOW University

TR01 Transfer of patent right