CN108536827B - 一种相似频谱图片搜索方法 - Google Patents

一种相似频谱图片搜索方法 Download PDF

Info

Publication number
CN108536827B
CN108536827B CN201810318190.XA CN201810318190A CN108536827B CN 108536827 B CN108536827 B CN 108536827B CN 201810318190 A CN201810318190 A CN 201810318190A CN 108536827 B CN108536827 B CN 108536827B
Authority
CN
China
Prior art keywords
picture
centroid
pictures
value
picture library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810318190.XA
Other languages
English (en)
Other versions
CN108536827A (zh
Inventor
任侃
王佳佳
陈钱
顾国华
钱惟贤
路东明
朱宇遥
孟思歧
张晓敏
程成
吕彦瑶
叶宏量
宋聪聪
陈雪琦
杨文广
蔡贵霞
顾烨怡
史小仲
彭志勇
王凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201810318190.XA priority Critical patent/CN108536827B/zh
Publication of CN108536827A publication Critical patent/CN108536827A/zh
Application granted granted Critical
Publication of CN108536827B publication Critical patent/CN108536827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/478Contour-based spectral representations or scale-space representations, e.g. by Fourier analysis, wavelet analysis or curvature scale-space [CSS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/42Analysis of texture based on statistical description of texture using transform domain methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种相似频谱图片搜索方法,包括以下步骤:步骤1,接收用户输入的图片库和需要搜索的源图片;步骤2,对用户输入的图片库按照预设的方法进行处理;步骤3,将源图片与经过预设处理的图片库的图片进行相似度对比,输出与源图片相似的所有图片及其相似度。

Description

一种相似频谱图片搜索方法
技术领域
本发明涉及一种图片检索技术,特别是一种相似频谱图片搜索方法。
背景技术
在信号采集中,我们会得到的众多相似性比较大的频谱信号,这些信号需要分类或对比,从而提取出有效的实验结论,但用肉眼来分辨比较困难且工作量很大,所以需要一种自动图像搜索、相似度对比的方法。
现在的相似图形搜索技术中,精确度不够高,基本搜索出来的图像对于图片内容、大小以及旋转性等容错性很高,对于频谱信号这种对于细微变化就分属不同类别的、精度要求比较高的图像来说并不适用。例如“得到图像的pHash值”方法,通过汉明距离的对比来实现相似图片搜索。这种方法在信号频谱匹配这种精度要求比较高的图像匹配中并不适用。
发明内容
本发明的目的在于提供一种相似频谱图片搜索方法,该方法可以提高对匹配精度要求高的频谱图像的相似性检测。
实现本发明目的的技术方案为:一种相似频谱图片搜索方法,包括以下步骤:
步骤1,接收用户输入的图片库和需要搜索的源图片;
步骤2,对用户输入的图片库按照预设的方法进行处理;
步骤3,将源图片与经过预设处理的图片库的图片进行相似度对比,输出与源图片相似的所有图片及其相似度。
采用上述防范,步骤2的具体过程在于:
步骤2.1,对图片库中图片进行裁剪获得有效频谱的特征区域,并将该特征区域存入第二图片库;
步骤2.2,对第二图片库中的频谱图片进行形态学处理得到第三图库;
步骤2.3,提取第三图库中的图片的形心并经过二次剪裁获得第四图片库。采用上述方法,步骤3的具体过程为:
步骤3.1,将图片库4中图片缩小,并灰度化以简化计算量;
步骤3.2,对灰度化图片进行DCT变换,得到DCT系数矩阵;
步骤3.3,保留左上角一定A区域的DCT系数;
步骤3.4,计算每张图片的DTC系数的均值;
步骤3.5,对每张图片按照预设的方法提取hash值;
步骤3.6,对比图像的hash值的汉明距离,当汉明距离大于一阈值时,则不相似;
步骤3.7,得到图像之间的相似度。
本发明与现有技术相比,其显著优点为:(1)精度高,对于相似对比较高的图片,可以区别开来,满足对频谱信号图片等高精度图片搜索的需求;(2)鲁棒性强,在图片间有位移情况下可以实现相似度匹配,不受位移情况的影响。
下面结合说明书附图对本发明作进一步描述。
附图说明
图1是本发明的算法流程图。
图2是一次裁剪后信号频谱图。
图3是膨胀处理过程示意图。
图4是提取信号的轮廓过程示意图。
图5是提取多组质心过程示意图。
图6是检测整体频谱图的形心过程示意图。
图7是二次裁剪的结果示意图。
具体实施方式
结合图1,一种相似频谱图片搜索方法,包括以下步骤:
步骤S101,接收用户输入的图片库和需要搜索的源图片;
步骤S102,对图片库中图片进行裁剪获得有效频谱的特征区域,并将该特征区域存入第二图片库;
步骤S103,对第二图片库中的频谱图片进行形态学处理得到第三图库;
步骤S104,提取第三图库的图片的各边缘轮廓;
步骤S105,获取各部分轮廓围成部分的质心;
步骤S106,获取整体图像质心;
步骤S107,对一次裁剪后图片进行二次裁剪,裁剪形状为以频谱信号形心为形心的矩形,二次剪裁后的图片存入第四图片库;
步骤S108,对第四图片库的图片进行DCT变换;
步骤S109,提取每张图片的hash值;
步骤S110,对比图像的hash值的汉明距离,当汉明距离大于一阈值时,则不相似;并得到图像之间的相似度。
步骤S101中,图片库中的图片统一进行编号,后续输出图片以编号形式输出。
步骤S102的具体过程为:有效频谱的特征区域为包含完整频谱信号的特征区域。
步骤S103中对第二图片库中的频谱图片进行膨胀处理以强化其边缘信息便于提取,膨胀处理后的图片存入第三图库。
步骤S104的具体过程为:
步骤S1041,对第三图库的图片先将图像灰度化后进行高斯滤波,去除噪声;
步骤S1042,通过Canny算法检测图像边缘,得到一副二值图像,边缘图像是不连续的多部分图像;如图4所示,可以看到轮廓为多段不连续部分;
步骤S1043,通过findContour函数得到各部分边缘图像所对应的多组轮廓信息,每个轮廓被表示成一个point向量;
步骤S1044,对每一组轮廓信息进行遍历,利用moments函数计算每一个轮廓的力矩即轮廓距,得到频谱信号的多组轮廓距。
步骤S105的具体过程为:
步骤S1051,根据下式获得各组轮廓的质心
Figure BDA0001624467910000031
Figure BDA0001624467910000032
Figure BDA0001624467910000033
其中,m10、m01分别为x轴和y轴的轮廓距,m00为轮廓的面积;
步骤S1052,对得到的各组轮廓的质心信息进行筛选,剃除不属于频谱信号区域的噪声信号的无效质心信息,即质心坐标为负值的坐标信息,留下有效的质心信息。
步骤S106中,在留下的有效质心中取所有质心横坐标的最大值和最小值的均值作为形心横坐标,取所有质心的纵坐标的最大值和最小值的均值作为形心的纵坐标,由此得到频谱信号的形心,即质心。
步骤S107中,得到频谱信号形心后,对一次裁剪后图片进行二次裁剪,裁剪形状为以频谱信号形心为形心的矩形,且该矩形为能包含整个信号有效区域的最小面积的矩形。
步骤S108中的具体过程为:
步骤S1081,将图片库4中图片缩小,并灰度化;
步骤S1082,对灰度化图片进行DCT变换,得到DCT系数矩阵;
步骤S1083,保留左上角一定A区域的DCT系数;
步骤S1084,计算每张图片的DTC系数的均值。
步骤S109的具体过程为:将每个DCT系数值与DCT系数均值进行对比,若大于DCT系数均值,则设为1,否则设为0,并按照从左到右,从上到下的顺序用十六进制进行保存得到一个整数,该证书为hash值。
步骤S110中相似度Dism计算公式如下:
Figure BDA0001624467910000041
其中,A为A区域矩阵元素个数,dist为汉明距离。
实施例一
一种相似频谱图片搜索方法,包括以下步骤:
首先,通过图像处理方法对图像信号有效区域进行预处理。其次,通过边缘检测来提取频谱信号的形心,进行二次裁剪。最后,对处理后的图像通过感知哈希的方法对比得到相似度。
输入待搜索图片库,图片库内图片需要统一的编号。
首先对图片库内图片提取主要频谱信号有效区域,其中有效区域指包含完整频谱信号的特征区域,提取方法为对该区域进行一次裁剪,裁剪形状为矩形且矩形长宽比尽量保持为1:1,从而获得图片库2,如图2所示,将图片库1中图片裁剪掉无用的白边后留下包含有效区域的频谱信号图片;对得到的图片进行膨胀的形态学处理,对图像中高亮部分进行膨胀,处理后图片库3中图片拥有比原图更大的高亮区域,这里选择的膨胀系数为3即可达到需要的膨胀效果,处理过程如图3所示,处理后图片轮廓信息更突出。
先将图像灰度化后进行高斯滤波处理,去除噪声,利用Canny算法检测图像边缘,得到一副二值图像,边缘图像是不连续的多部分图像,如图4所示,可以看到轮廓为多段不连续部分,通过findContour函数计算,可以得到各部分边缘图像所对应的多组轮廓信息,每个轮廓被表示成一个point向量。然后计算各组轮廓距,对每一组轮廓信息进行遍历,利用moments函数计算每一个轮廓的力矩即轮廓距,得到频谱信号的多组轮廓距。根据得到的轮廓距,根据公式
Figure BDA0001624467910000051
Figure BDA0001624467910000052
可以计算出质心信息,其中质心坐标是
Figure BDA0001624467910000053
m10、m01分别为x轴和y轴的轮廓距,m00为轮廓的面积。对得到的各组轮廓的质心信息进行筛选,剃除不属于频谱信号区域的噪声信号的无效质心信息,即质心坐标为负值的坐标信息,留下有效的质心信息。如图5所示,矩形框表示的是findContour函数找出的多组轮廓信息,白色点则是找出的各组轮廓的有效质心。在留下的有效质心中取所有质心横坐标的最大值和最小值的均值作为形心横坐标,取所有质心的纵坐标的最大值和最小值的均值作为形心的纵坐标,由此得到频谱信号的形心,如图6所示,白点即为整个频谱信号的形心。得到频谱信号形心后,对一次裁剪后图片库2中图片进行二次裁剪,裁剪形状为以频谱信号形心为形心的矩形,且该矩形为能包含整个信号有效区域的最小面积的矩形,提取区域长宽比尽量接近1:1,从而得到图片库4,裁剪后如图7所示,裁剪后频谱信号的形心为整个图像的形心。这样可以保证所有频谱信号位于图片的中心,便于下面图片相似度比较。
相似度对比模块:首先对图片库中图片归一化,缩放为32*32尺寸的图片,这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异,对缩放后图片灰度化以简化计算量,然后进行离散余弦即DCT变换,得到32*32的DCT系数矩阵;其次缩小DCT系数矩阵,保留左上角8*8的矩阵,因为这部分呈现了图片中的最低频率,包含主要的数据特征。最后,计算每张频谱信号图片的hash值,对这个8x8区域求DCT系数的均值,将得到的平均值和每个DCT值对比,若大于DCT系数均值,则设为“1”,否则设为“0”,并按照从左到右,从上到下的顺序设置0或1的64位的hash值,用十六进制进行保存,可以得到一个整数,这个整数就是每张图片的hash值,根据每张图片的hash值,计算汉明距离,即等长字符串在对应位置上不同字符的数目,对图片间汉明距离大于2时,认为图片不相似;否则认定为是相似图像。相似度计算公式如下:
Figure BDA0001624467910000061
其中Dsim为相似度,64为8*8位hash值位数,dist为汉明距离。

Claims (8)

1.一种相似频谱图片搜索方法,其特征在于,包括以下步骤:
步骤1,接收用户输入的图片库和需要搜索的源图片;
步骤2,对用户输入的图片库按照预设的方法进行处理;
步骤3,将源图片与经过预设处理的图片库的图片进行相似度对比,输出与源图片相似的所有图片及其相似度;
步骤2的具体过程在于:
步骤2.1,对图片库中图片进行裁剪获得有效频谱的特征区域,并将该特征区域存入第二图片库;
步骤2.2,对第二图片库中的频谱图片进行形态学处理得到第三图库;
步骤2.3,提取第三图库中的图片的形心并经过二次剪裁获得第四图片库;
步骤2.3的具体过程在于:
步骤2.3.1,对第三图库的图片先将图像灰度化后进行高斯滤波;
步骤2.3.2,检测图像边缘,且该边缘为不连续的多部分图像;
步骤2.3.4,获得各部分边缘图像所对应的多组轮廓信息;
步骤2.3.5,计算每一个轮廓的轮廓距,得到频谱信号的多组轮廓距;
步骤2.3.6,根据下式获得各组轮廓的质心
Figure 703091DEST_PATH_IMAGE001
Figure 276024DEST_PATH_IMAGE002
Figure 586919DEST_PATH_IMAGE003
其中,
Figure 123074DEST_PATH_IMAGE004
Figure 468605DEST_PATH_IMAGE005
分别为x轴和y轴的轮廓距,
Figure 946859DEST_PATH_IMAGE006
为轮廓的面积;
步骤2.3.7,对得到的各组轮廓的质心信息进行筛选,剃除质心坐标为负值的坐标信息;
步骤2.3.8,在留下的有效质心中取所有质心横坐标的最大值和最小值的均值作为形心横坐标,取所有质心的纵坐标的最大值和最小值的均值作为形心的纵坐标,由此得到频谱信号的形心;
步骤2.3.9,得到频谱信号形心后,对一次裁剪后图片进行二次裁剪,裁剪形状为以频谱信号形心为形心的矩形,且该矩形为能包含整个信号有效区域的最小面积的矩形,且提取区域长宽比为1:1。
2.根据权利要求1所述的方法,其特征在于,步骤2.1的具体过程在于:
有效频谱的特征区域为包含完整频谱信号的特征区域;
对有效频谱的特征区域进行矩形裁剪且矩形长宽比为1:1。
3.根据权利要求1所述的方法,其特征在于,步骤2.2中对第二图片库中的频谱图片进行膨胀处理得到第三图库。
4.根据权利要求1所述的方法,其特征在于,步骤3的具体过程为:
步骤3.1,将第四图片库中图片缩小,并灰度化;
步骤3.2,对灰度化图片进行离散余弦变换,得到DCT系数矩阵;
步骤3.3,保留左上角部分A区域的DCT系数;
步骤3.4,计算每张图片的DTC系数的均值;
步骤3.5,对每张图片按照预设的方法提取hash值;
步骤3.6,对比图像的hash值的汉明距离,当汉明距离大于一阈值时,则不相似;
步骤3.7,得到图像之间的相似度。
5.根据权利要求4所述的方法,其特征在于,步骤2.5的具体过程为:将每个DCT系数值与DCT系数均值进行对比,若大于DCT系数均值,则设为1,否则设为0,并按照从左到右,从上到下的顺序用十六进制进行保存得到一个整数,该整数为hash值。
6.根据权利要求4所述的方法,其特征在于,步骤3.7中相似度Dism计算公式如下:
Figure 745051DEST_PATH_IMAGE007
其中,A为A区域矩阵元素个数,dist为汉明距离。
7.根据权利要求4所述的方法,其特征在于,步骤3.1中将第四图片库中图片缩小为32*32的图像。
8.根据权利要求4所述的方法,其特征在于,步骤3.3中保留左上角8*8区域的DCT系数。
CN201810318190.XA 2018-04-11 2018-04-11 一种相似频谱图片搜索方法 Active CN108536827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810318190.XA CN108536827B (zh) 2018-04-11 2018-04-11 一种相似频谱图片搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810318190.XA CN108536827B (zh) 2018-04-11 2018-04-11 一种相似频谱图片搜索方法

Publications (2)

Publication Number Publication Date
CN108536827A CN108536827A (zh) 2018-09-14
CN108536827B true CN108536827B (zh) 2021-09-03

Family

ID=63479891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810318190.XA Active CN108536827B (zh) 2018-04-11 2018-04-11 一种相似频谱图片搜索方法

Country Status (1)

Country Link
CN (1) CN108536827B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191058B (zh) * 2019-12-27 2023-08-29 青岛海洋科技中心 一种图片检索方法
CN111242053B (zh) * 2020-01-16 2023-07-18 国网山西省电力公司电力科学研究院 一种输电线路火焰检测方法及系统
CN111897982B (zh) * 2020-06-17 2023-03-14 昆明理工大学 一种医学ct图像存储与检索方法
CN113159009A (zh) * 2021-06-25 2021-07-23 华东交通大学 一种车站预防逃票的智能监控识别方法及系统
CN113520172A (zh) * 2021-08-06 2021-10-22 广东福尔电子有限公司 一种耐压型电锅温度传感器侦测装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956020A (zh) * 2016-04-22 2016-09-21 广州精点计算机科技有限公司 一种基于感知哈希的相似图像搜索方法和装置
CN106570475A (zh) * 2016-11-03 2017-04-19 南京航空航天大学 一种紫砂壶印章检索方法
CN106650829A (zh) * 2017-01-04 2017-05-10 华南理工大学 一种图片相似度计算方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100490395B1 (ko) * 2001-10-29 2005-05-17 삼성전자주식회사 움직임 벡터 추정 방법 및 이에 적합한 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956020A (zh) * 2016-04-22 2016-09-21 广州精点计算机科技有限公司 一种基于感知哈希的相似图像搜索方法和装置
CN106570475A (zh) * 2016-11-03 2017-04-19 南京航空航天大学 一种紫砂壶印章检索方法
CN106650829A (zh) * 2017-01-04 2017-05-10 华南理工大学 一种图片相似度计算方法

Also Published As

Publication number Publication date
CN108536827A (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN108536827B (zh) 一种相似频谱图片搜索方法
EP2783328B1 (en) Text detection using multi-layer connected components with histograms
Shen et al. Improving OCR performance with background image elimination
WO2020143325A1 (zh) 一种电子文档的生成方法及设备
CN103942797A (zh) 基于直方图和超像素的场景图像文字检测方法及系统
CN105740872B (zh) 图像特征提取方法及其装置
Wagh et al. Text detection and removal from image using inpainting with smoothing
CN107135401A (zh) 关键帧选取方法及系统
Zhang et al. A combined algorithm for video text extraction
Bai et al. A fast stroke-based method for text detection in video
KR20090065099A (ko) 디지털 영상 특징 관리 시스템 및 그 방법
CN116758045B (zh) 一种半导体发光二极管的表面缺陷检测方法及系统
Dai et al. Scene text detection based on enhanced multi-channels MSER and a fast text grouping process
CN109460763B (zh) 一种基于多层次文本组件定位与生长的文本区域提取方法
Malviya et al. Copy move forgery detection using low complexity feature extraction
CN111405260B (zh) 一种自适应白平衡控制方法及其系统
Acharya et al. Image retrieval based on visual attention model
JP2004152087A (ja) 画像の特徴量を抽出する方法および装置
JP2988994B2 (ja) 位置合わせ装置
Margalit et al. Using feature probabilities to reduce the expected computational cost of template matching
Aarthi et al. Saliency based modified chamfers matching method for sketch based image retrieval
CN108898607B (zh) 一种图像多尺度特征提取方法
Basak et al. Image based information retrieval
Liu et al. An efficient method for text detection from indoor panorama images using extremal regions
Nagabhushan et al. A hybrid method for text extraction from mosaiced image of text dominant video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant