CN112488240A - 一种基于互相关性的图像频域差分材质匹配方法 - Google Patents
一种基于互相关性的图像频域差分材质匹配方法 Download PDFInfo
- Publication number
- CN112488240A CN112488240A CN202011500825.1A CN202011500825A CN112488240A CN 112488240 A CN112488240 A CN 112488240A CN 202011500825 A CN202011500825 A CN 202011500825A CN 112488240 A CN112488240 A CN 112488240A
- Authority
- CN
- China
- Prior art keywords
- image
- value
- frequency domain
- template
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于互相关性的图像频域差分材质匹配方法,包括以下步骤:通过滑动窗口搜索待检图像;将不同尺度的窗口缩放到和图像模板一样;对图像模板和多个尺度窗口的图像区进行傅立叶变换;取傅立叶变换后的图像模板的最大值和最小值,再对图像模板进行归一化处理;把多个尺度窗口的傅立叶变换的数值范围统一到与图像模板一致的数值空间,使得窗口的频域值与图像模板的频域值一致;对不同尺度的窗口和图像模板进行互相关运算、差分操作,把差分后的数值与互相关运算的数值进行元素相乘;对上述数值进行比较,寻找最大值及其对应的尺度;若最大值小于阈值,则视为当前位置匹配,并把对应位置和对应尺度所在的图像区域进行标记。
Description
技术领域
本发明涉及图像频域匹配方法,具体涉及一种基于互相关性的图像频域差分材质匹配方法。
背景技术
信号的互相关性主要用于判断两组信号的相位偏移,在图像处理中,互相关性常用于对图像模板匹配,也就是通过模板,在目标图像中寻找与模板一摸一样的图像区域的位置。但在互相关性进行模板匹配的缺点就是待搜索区域必须与模板一摸一样,形状材质上的变化会导致匹配失败。
为此,现有技术中提出材质匹配的方法,材质匹配相较于模板匹配具有更大灵活性和适应性。在图像识别处理的工作中,常常遇到需要寻找某种特定材质的问题,常用的方法主要使用机器学习,提取特定材质的特征进行训练得到模型,然后再在待识别图像的各个区域对每个区域提取同样的特征放入训练所得的模型中进行预测判断。其中,由于使用机器学习的方法常常需要收集一定数量的匹配模板图像,进行相关的处理,然后训练学习;同时在训练学习的过程中常常需要反复进行多次实验,以获得较好的匹配效果。
上述处理过程需要消耗大量的人力和时间,同时需要大量的材质模板素材,因此难以进行快速开发验证。
发明内容
本发明的目的在于克服上述存在的问题,提供一种基于互相关性的图像频域差分材质匹配方法,该图像频域差分材质匹配方法对材质模板数量要求极低,同时在工作过程中不需要进行模型训练,极大的节约了开发时间和使用成本。
本发明的目的通过以下技术方案实现:
一种基于互相关性的图像频域差分材质匹配方法,包括以下步骤:
获取待匹配的图像模板,存储该图像模板为后续使用;
通过滑动窗口搜索待检图像,通过多尺度窗口的方式对每个滑动窗口位置使用不同尺寸的窗口;对不同尺度的窗口进行缩放,使不同尺度的窗口缩放到和图像模板一样;
对图像模板和多个尺度窗口的图像区进行傅立叶变换,得到各自的频域图像;
取傅立叶变换后的图像模板的最大值和最小值,用于后续各窗口规范化的基础值,再对图像模板进行归一化处理;
对多个尺度窗口的傅立叶变换的图像进行规范化处理,把数值范围统一到与图像模板一致的数值空间,使得窗口的频域值与图像模板的频域值一致;
对不同尺度的窗口和图像模板进行互相关运算;将各尺度的窗口的频域值与图像模板的频域值进行差分操作,取绝对值;把差分后的数值与互相关运算的数值进行元素相乘;
对上述操作取得的数值进行比较,寻找最大值及其对应的尺度;
得到最大值后,将其设定的阈值进行对比;若最大值大于阈值,则认为当前位置的图像区域与图像模板不匹配;若小于阈值,则视为当前位置匹配,并把对应位置和对应尺度所在的图像区域进行标记;
将定位窗口移动到下一个位置,重复上面的步骤,直至全图匹配完成。
本发明的一个优选方案,其中,所述图像模板的尺寸为r×r个像素,r为奇数。
优选地,在滑动窗口进行滑动过程中,每个检索窗口的尺寸的个数自定义为N个,N取偶数;
每个尺寸从分辨率(r-N)×(r-N)开始,每次分辨率增大2个像素,直到(r+N)×(r+N)。
本发明的一个优选方案,其中,滑动窗口的搜索操作为:滑动窗口从左上角开始,横向滑动,滑动到每个位置即进行匹配;若匹配判断为真,则认为滑动窗口的当前区域材质与模板相同;否则忽略让滑动窗口继续移动继续下一步搜索。
优选地,在匹配过程中,在一个位置需要匹配多个尺度的窗口,不同尺度的匹配的窗口预示了同一材质在不同尺度下的表现。这是多尺度匹配的关键。当图像区域材质与模板材质相同时,总能找到一个尺度与材质模板相同;若区域与模板材质不同,则不存在任何一个尺度与材质模板匹配。
本发明的一个优选方案,其中,傅立叶变换通过以下公式将图像表达的空间信号转换为以信号频率为表达的频谱图:
kxy=0,1...,Nxy-1;
本发明的一个优选方案,其中,所述归一化处理的计算公式为:
norm(V)=(V-Vmin)/(Vmax-Vmin)。
本发明的一个优选方案,其中,所述互相关运算为将两组数进行点乘运算。
本发明的一个优选方案,其中,所述差分操作为将窗口的频域值与图像模板的频域值相减。
本发明的一个优选方案,其中,所述把差分后的数值与互相关运算的数值进行元素相乘的操作为:
本发明与现有技术相比具有以下有益效果:
1、本发明中的图像频域差分材质匹配方法对材质模板数量要求极低,同时在工作过程中不需要进行模型训练,极大的节约了开发时间和使用成本。
2、本发明在模板匹配的过程中,利用多尺度检测窗口技术,对待检图像待检区域对应的尺度有很高的灵活性,可以匹配由拍摄造成的不同尺度检测的问题。
3、本发明对进行傅立叶变换后图像模板的最大最小值作为归一化的范围值,对后续检测窗口内的数据,统一约束到与模板相同的取值区间,便于后续差分操作和数值比较等运算。
4、本发明的图像频域差分材质匹配方法是旋转不变的,因为在傅立叶变换的过程中,图像只保留了频率分布的属性,而方向变化的属性被抛弃,故在模板匹配过程中可以实现旋转不变,即不论待检区域如何旋转,匹配度是一样的。
附图说明
图1为本发明中的基于互相关性的图像频域差分材质匹配方法的流程图。
图2为本发明中的通过滑动窗口进行搜索的示意图。
图3为本发明中的一种示例图片。
图4为本发明中的一种图像模板。
图5为本发明中的计算得到的数值三维化数据显示示例,越低表示与模板材质越接近
图6为本发明中的计算得到的数值热图显示示例,越接近蓝色表示与材质越接近
具体实施方式
为了使本领域的技术人员很好地理解本发明的技术方案,下面结合实施例和附图对本发明作进一步描述,但本发明的实施方式不仅限于此。
参见图1-2,本实施例中的基于互相关性的图像频域差分材质匹配方法,包括以下步骤:
根据实际情况,选取不大(如51×51)的但是能有一定材质代表性的图片作为模板。选择此模板的目的是保存具有代表性的,并且能涵盖大多数信息图片,只有模板图片涵盖足够信息,才能满足后期匹配中有足够的信息。
通过滑动窗口搜索待检图像,滑动窗口从左上角开始,横向滑动,滑动过程中的步进s由用户确定,每个检索窗口将使用N个不同尺寸,N取偶数,每个尺寸从分辨率(r-N)×(r-N)开始,每次分辨率增大2个像素,直到(r+N)×(r+N)。N为自行定义的需要检索的每个位置的尺度的个数,由用户自行确定。
进一步,滑动到每个位置即进行匹配;若匹配判断为真,则认为滑动窗口的当前区域材质与模板相同;否则忽略让滑动窗口继续移动继续下一步搜索。在匹配过程中,在一个位置需要匹配多个尺度的窗口,不同尺度的匹配的窗口预示了同一材质在不同尺度下的表现。这是多尺度匹配的关键。当图像区域材质与模板材质相同时,总能找到一个尺度与材质模板相同;若区域与模板材质不同,则不存在任何一个尺度与材质模板匹配。
针对不同尺度的窗口,由于运算的需求,对不同尺度的窗口进行缩放,使不同尺度的窗口缩放到和图像模板一样。
对图像模板和多个尺度窗口的图像区进行傅立叶变换,得到各自的频域图像;其中,傅立叶变换通过以下公式将图像表达的空间信号转换为以信号频率为表达的频谱图:
kxy=0,1...,Nxy-1;
取傅立叶变换后的图像模板的最大值和最小值,用于后续各窗口规范化的基础值,再对图像模板进行归一化处理;其中,所述归一化处理的计算公式为:
norm(V)=(V-Vmin)/(Vmax-Vmin)。
对多个尺度窗口的傅立叶变换的图像进行规范化处理,把数值范围统一到与图像模板一致的数值空间,使得窗口的频域值与图像模板的频域值一致。
对不同尺度的窗口和图像模板进行互相关运算,亦即将两组数进行点乘运算;再将各尺度的窗口的频域值与图像模板的频域值进行差分操作,亦即将窗口的频域值与图像模板的频域值相减,取绝对值;把差分后的数值与互相关运算的数值进行元素相乘,把差分后的数值与互相关运算的数值进行元素相乘的操作为:
对上述操作取得的数值进行比较,寻找最大值及其对应的尺度;得到最大值后,将其设定的阈值进行对比;若最大值大于阈值,则认为当前位置的图像区域与图像模板不匹配;若小于阈值,则视为当前位置匹配,并把对应位置和对应尺度所在的图像区域进行标记。
将定位窗口移动到下一个位置,重复上面的步骤,直至全图匹配完成。
具体地,参见图3-6,本实施例中的示例图片为草坪,树木和天空,如图3,模板图片为草坪一小部分,如图4。
为说明识别出对应的数值,本实施例将暂时不使用阈值进行区分,而直接将识别的值记录下来,同时通过热图展示出识别的结果,如图5,由图可以看出,图片对应的天空位置,数值最大,数目,人行道等位置数值次之,而草坪位置的识别数值最低。由图6可以看出,草坪部位完整的识别出来(深蓝色),而其他部位则被剔除出识别结果中。
上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所做的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种基于互相关性的图像频域差分材质匹配方法,其特征在于,包括以下步骤:
获取待匹配的图像模板,存储该图像模板为后续使用;
通过滑动窗口搜索待检图像,通过多尺度窗口的方式对每个滑动窗口位置使用不同尺寸的窗口;对不同尺度的窗口进行缩放,使不同尺度的窗口缩放到和图像模板一样;
对图像模板和多个尺度窗口的图像区进行傅立叶变换,得到各自的频域图像;
取傅立叶变换后的图像模板的最大值和最小值,用于后续各窗口规范化的基础值,再对图像模板进行归一化处理;
对多个尺度窗口的傅立叶变换的图像进行规范化处理,把数值范围统一到与图像模板一致的数值空间,使得窗口的频域值与图像模板的频域值一致;
对不同尺度的窗口和图像模板进行互相关运算;将各尺度的窗口的频域值与图像模板的频域值进行差分操作,取绝对值;把差分后的数值与互相关运算的数值进行元素相乘;
对上述操作取得的数值进行比较,寻找最大值及其对应的尺度;
得到最大值后,将其设定的阈值进行对比;若最大值大于阈值,则认为当前位置的图像区域与图像模板不匹配;若小于阈值,则视为当前位置匹配,并把对应位置和对应尺度所在的图像区域进行标记;
将定位窗口移动到下一个位置,重复上面的步骤,直至全图匹配完成。
2.根据权利要求1所述的基于互相关性的图像频域差分材质匹配方法,其特征在于,所述图像模板的尺寸为r×r个像素,r为奇数。
3.根据权利要求2所述的基于互相关性的图像频域差分材质匹配方法,其特征在于,在滑动窗口进行滑动过程中,每个检索窗口的尺寸的个数自定义为N个,N取偶数;
每个尺寸从分辨率(r-N)×(r-N)开始,每次分辨率增大2个像素,直到(r+N)×(r+N)。
4.根据权利要求1或3所述的基于互相关性的图像频域差分材质匹配方法,其特征在于,滑动窗口的搜索操作为:滑动窗口从左上角开始,横向滑动,滑动到每个位置即进行匹配;若匹配判断为真,则认为滑动窗口的当前区域材质与模板相同;否则忽略让滑动窗口继续移动继续下一步搜索。
5.根据权利要求4所述的基于互相关性的图像频域差分材质匹配方法,其特征在于,在匹配过程中,在一个位置需要匹配多个尺度的窗口。
7.根据权利要求1所述的基于互相关性的图像频域差分材质匹配方法,其特征在于,所述归一化处理的计算公式为:
norm(V)=(V-Vmin)/(Vmax-Vmin)。
8.根据权利要求1所述的基于互相关性的图像频域差分材质匹配方法,其特征在于,所述互相关运算为将两组数进行点乘运算。
9.根据权利要求1所述的基于互相关性的图像频域差分材质匹配方法,其特征在于,所述差分操作为将窗口的频域值与图像模板的频域值相减。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011500825.1A CN112488240B (zh) | 2020-12-16 | 2020-12-16 | 一种基于互相关性的图像频域差分材质匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011500825.1A CN112488240B (zh) | 2020-12-16 | 2020-12-16 | 一种基于互相关性的图像频域差分材质匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112488240A true CN112488240A (zh) | 2021-03-12 |
CN112488240B CN112488240B (zh) | 2023-02-03 |
Family
ID=74914631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011500825.1A Active CN112488240B (zh) | 2020-12-16 | 2020-12-16 | 一种基于互相关性的图像频域差分材质匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112488240B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001052167A (ja) * | 1999-08-09 | 2001-02-23 | Murata Mfg Co Ltd | 画像処理方法 |
EP1255226A1 (de) * | 2001-05-04 | 2002-11-06 | Compushack production electronic GmbH | Verfahren zur Bewegungserkennung aus einer Folge von digitalisierten Bildern |
US20160098619A1 (en) * | 2014-10-02 | 2016-04-07 | Xerox Corporation | Efficient object detection with patch-level window processing |
CN107590502A (zh) * | 2017-09-18 | 2018-01-16 | 西安交通大学 | 一种全场稠密点快速匹配方法 |
CN108229583A (zh) * | 2018-02-02 | 2018-06-29 | 北京邮电大学 | 一种基于主方向差分特征的快速模板匹配的方法及装置 |
CN108830279A (zh) * | 2018-04-03 | 2018-11-16 | 南昌奇眸科技有限公司 | 一种图像特征提取与匹配方法 |
CN108845999A (zh) * | 2018-04-03 | 2018-11-20 | 南昌奇眸科技有限公司 | 一种基于多尺度区域特征比对的商标图像检索方法 |
CN109241819A (zh) * | 2018-07-07 | 2019-01-18 | 西安电子科技大学 | 基于快速多尺度及联合模板匹配的多目标行人检测方法 |
CN109785371A (zh) * | 2018-12-19 | 2019-05-21 | 昆明理工大学 | 一种基于归一化互相关和sift的太阳图像配准方法 |
-
2020
- 2020-12-16 CN CN202011500825.1A patent/CN112488240B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001052167A (ja) * | 1999-08-09 | 2001-02-23 | Murata Mfg Co Ltd | 画像処理方法 |
EP1255226A1 (de) * | 2001-05-04 | 2002-11-06 | Compushack production electronic GmbH | Verfahren zur Bewegungserkennung aus einer Folge von digitalisierten Bildern |
US20160098619A1 (en) * | 2014-10-02 | 2016-04-07 | Xerox Corporation | Efficient object detection with patch-level window processing |
CN107590502A (zh) * | 2017-09-18 | 2018-01-16 | 西安交通大学 | 一种全场稠密点快速匹配方法 |
CN108229583A (zh) * | 2018-02-02 | 2018-06-29 | 北京邮电大学 | 一种基于主方向差分特征的快速模板匹配的方法及装置 |
CN108830279A (zh) * | 2018-04-03 | 2018-11-16 | 南昌奇眸科技有限公司 | 一种图像特征提取与匹配方法 |
CN108845999A (zh) * | 2018-04-03 | 2018-11-20 | 南昌奇眸科技有限公司 | 一种基于多尺度区域特征比对的商标图像检索方法 |
CN109241819A (zh) * | 2018-07-07 | 2019-01-18 | 西安电子科技大学 | 基于快速多尺度及联合模板匹配的多目标行人检测方法 |
CN109785371A (zh) * | 2018-12-19 | 2019-05-21 | 昆明理工大学 | 一种基于归一化互相关和sift的太阳图像配准方法 |
Non-Patent Citations (1)
Title |
---|
陈耀东: "基于机器视觉的移印品缺陷检测技术的研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112488240B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rocco et al. | Efficient neighbourhood consensus networks via submanifold sparse convolutions | |
Lopez-Antequera et al. | Appearance-invariant place recognition by discriminatively training a convolutional neural network | |
CN110580723B (zh) | 一种利用深度学习和计算机视觉进行精准定位的方法 | |
CN109829467A (zh) | 图像标注方法、电子装置及非暂态电脑可读取储存媒体 | |
CN110347854B (zh) | 基于目标定位的图像检索方法 | |
CN104850850A (zh) | 一种结合形状和颜色的双目立体视觉图像特征提取方法 | |
AU2020103716A4 (en) | Training method and device of automatic identification device of pointer instrument with numbers in natural scene | |
CN104182973A (zh) | 基于圆形描述算子csift的图像复制粘贴检测方法 | |
CN111339975A (zh) | 基于中心尺度预测与孪生神经网络的目标检测识别跟踪方法 | |
CN105718552A (zh) | 基于服装手绘草图的服装图像检索方法 | |
US8027978B2 (en) | Image search method, apparatus, and program | |
CN109766752B (zh) | 一种基于深度学习的目标匹配和定位方法及系统、计算机 | |
CN111932582A (zh) | 一种视频图像中的目标跟踪方法及装置 | |
US20130243341A1 (en) | Frequency domain interest point descriptor | |
CN110659637A (zh) | 一种结合深度神经网络和sift特征的电能表示数与标签自动识别方法 | |
Jelača et al. | Vehicle matching in smart camera networks using image projection profiles at multiple instances | |
Wang et al. | Online visual place recognition via saliency re-identification | |
Ko et al. | SVM-based salient region (s) extraction method for image retrieval | |
CN101118544A (zh) | 一种图像形状轮廓描述符的构造方法 | |
CN112488240B (zh) | 一种基于互相关性的图像频域差分材质匹配方法 | |
JP2006260311A (ja) | マッチング方法およびマッチング装置ならびにプログラム | |
CN110084736A (zh) | 一种基于surf和金字塔算法的水印检测方法及系统 | |
CN111768436B (zh) | 一种基于Faster-RCNN改进的图像特征块配准方法 | |
CN104462111A (zh) | 图像检索数据库建立方法 | |
Cheng et al. | Visual object retrieval via block-based visual-pattern matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |