CN103823889B - 基于l1范数全局几何一致性检验的错误匹配检测方法 - Google Patents

基于l1范数全局几何一致性检验的错误匹配检测方法 Download PDF

Info

Publication number
CN103823889B
CN103823889B CN201410084657.0A CN201410084657A CN103823889B CN 103823889 B CN103823889 B CN 103823889B CN 201410084657 A CN201410084657 A CN 201410084657A CN 103823889 B CN103823889 B CN 103823889B
Authority
CN
China
Prior art keywords
images
matching
calculated
matrix
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410084657.0A
Other languages
English (en)
Other versions
CN103823889A (zh
Inventor
林宙辰
林旸
杨李
许晨
查红彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201410084657.0A priority Critical patent/CN103823889B/zh
Publication of CN103823889A publication Critical patent/CN103823889A/zh
Application granted granted Critical
Publication of CN103823889B publication Critical patent/CN103823889B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于L1范数全局几何一致性检验的错误匹配检测方法:使用尺度不变特征变换及词袋模型来提取并匹配两幅图像中的特征点;计算两幅图像的平方距离矩阵;使用黄金分割搜索法来求解:minλ>0||D1‑λ.D2||1;计算差异矩阵E=||D1‑λ*.D2||1;计算E矩阵各行元素之和并从大到小排序,并计算排序后各行和值的二次差分,取达到最大二次差分值的点作为门限值,所有行和高于门限值的,则该行所对应特征点对被判定为错误匹配对;去掉错误匹配对后,再根据两幅图像的真实匹配点对来计算图像间的相似度,继而根据相似度由大到小排序输出图像检索结果。本发明允许相似图像间存在复杂背景、部分遮挡以及各种相似几何变换;只利用了特征点的坐标信息,非常简单且高效。

Description

基于L1范数全局几何一致性检验的错误匹配检测方法
技术领域
本发明属于图像检索领域,特别是部分重复图像检索领域中,一种检测图像与图像之间的错误匹配点的方法。
背景技术
近几年,包括Tineye、百度识图以及谷歌相似图像搜索等在内的许多检索引擎在内的重复图像搜索技术发展较为迅速,其在版权检测、医疗诊断、暴力检测以及地理信息检索等方面有广泛的应用。在该项技术中,图像之间误匹配特征点对的检测是其中的一项关键步骤,如何利用图像间的几何信息来正确过滤错误匹配以便获得更加精确的检索结果,是这项技术的核心。
部分重复图像主要是指拍摄相同场景不同角度的图片或者经过图像处理软件进行处理前后的图片。这样的图片在色调、光照、尺度、旋转和遮挡等方面有些不同,这使得在大规模数据库下检索该类图片变得十分困难。为解决这一问题,学界提出了许多基于局部特征和词袋模型结合的方法来处理相似性问题。这些方法的一个典型流程如下:首先使用尺度不变特征变换(SIFT)来检测和描述图像的局部特征,然后使用词袋模型(BagofFeatures,BoF)来建立视觉字索引,之后根据索引来进行图像间的特征点匹配对,最后根据匹配情况计算图与图之间的相似度并据此排序输出检索结果。
词袋模型的使用,极大地减少了SIFT特征耗时的匹配过程,但是却同时引入了一些错误匹配点对,这造成了检索结果与真实情况的差异。为了解决这一问题,人们提出了很多使用几何先验信息来验证匹配是否错误的方法,具体分为局部和全局几何一致性假设两类。
第一类方法着眼于使用局部几何一致性假设,这类方法都是基于一个相似变换的模型:其中,(x1i,y1i)和(x2i,y2i)代表第i个特征点在两幅图像中的坐标,s和θ分别是两幅图像间的缩放尺度和旋转角度,他们是由两幅图像各自SIFT特征点的尺度和主方向计算得到的,具体为:s=s2/s1,θ=θ21.在此模型基础上,Herve Jegou等人[1]提出了弱几何一致性(WCG)的方法,它利用所有特征点计算出的s和θ值的统计分布来去除错误匹配对;Wan-Lei Zhao等人[2]改进了WCG,提出了加强弱几何一致性(EWCG)的方法,它利用平移量(tx,ty)模长的统计分布来去除错误匹配对;而JunqiangWang等人[3]提出了强几何一致性(SGC)的方法,它使用平移量(tx,ty)两个维度本身的统计分布来去除错误匹配对。局部方法的共同特点是处理高效,但是往往检测精度不高,不能完美地去除所有错误匹配对。
第二类方法则希望利用全局的几何一致性假设来检测并去除错误匹配对,这类方法会对一幅图像上的所有特征点进行统一的验证,这样做可以弥补局部几何一致性方法在处理跨局部区域间一致性时的不足。J.Philbin等人[4]提出应用经典的随机抽样一致性(RANSAC)算法来处理透视变换模型下的错误匹配检测问题,但是使用RANSAC会导致计算上较大的耗时,故不适合大尺度下的检索问题。另一种思路是由Wengang Zhou等人[5]提出的几何编码(GC)方法,这种方法首先对每幅图像中特征点的相互位置信息和旋转变换信息进行编码,然后再比较不同图像间的编码差异来检测错误匹配点,由于使用了特征点的尺度和主方向信息,这种方法仍然比较耗时。全局方法的特点是检测效果较好,能够适应更复杂的几何变换模型,缺点是耗时过大不利于大尺度下的检索这一应用背景。
发明内容
针对上述问题,本发明提出了一种基于L1范数全局几何一致性检验的错误匹配检测方法。
本发明提供的技术方案如下:
一种基于L1范数全局几何一致性检验的错误匹配检测方法,包括如下步骤(流程见图1):
步骤1:对于两幅待比较图像,首先使用尺度不变特征变换(SIFT)及词袋模型(BoF)来提取并匹配两幅图像中的特征点,得到两幅图像中各特征点的坐标:a1i=(x1i,y1i)T,a2i=(x2i,y2i)T,其中i的顺序为特征点匹配后的排序,T表示转置,a1i和a2i均为列向量;
步骤2:分别计算两幅图像的平方距离矩阵D1和D2
步骤3:使用黄金分割搜索法来求解如下问题:minλ>0||D1-λ.D2||1,该问题的解为λ*=argminλ>0||D1-λ.D2||1,它是两幅图像间的缩放尺度估计值;
步骤4:计算差异矩阵E=||D1*.D2||1,该矩阵中的非零元素被认为是由错误匹配对造成的;
步骤5:计算E矩阵各行元素之和并从大到小排序,并计算排序后各行和值的二次差分,取达到最大二次差分值的点作为门限值,所有行和高于门限值的,则该行所对应特征点对被判定为错误匹配对,如图2所示;
步骤6:去掉错误匹配对后,再使用业界成型的方法,如参考文献[5]中所述:根据两幅图像的真实匹配点对来计算图像间的相似度,继而根据相似度由大到小排序输出图像检索结果。
优选的:
所述的错误匹配检测方法,步骤2中,所述的平方距离矩阵的计算方法为: 其中n表示匹配特征点对的个数,该方案执行速度较慢。
所述的错误匹配检测方法,步骤2中,所述的平方距离矩阵的计算方法为:D1=α1eT-2A1 TA1+eα1 T,D2=α2eT-2A2 TA2+eα2 T
其中,e为全一列向量, 该方案执行速度较快。
所述的错误匹配检测方法,步骤6中,所述的相似度用用匹配点个数进行衡量。
本发明的有益效果主要包括如下三点:
该方法提供了一种基于L1范数全局几何一致性的错误匹配对检测方法,它允许相似图像间存在复杂背景、部分遮挡以及各种相似几何变换;
该方法非常简单且无需特征点先验知识,该方法只利用了特征点的坐标信息,而其他方法均使用了许多额外的几何先验信息(如SIFT特征点的主方向及尺度信息);
该方法耗时很短,通过使用黄金分割搜索算法,该方法的计算时效远高于其他全局几何一致性方法,且与局部几何一致性方法的时效相当(甚至更快)。
附图说明
图1是发明操作流程示意图。
图2是通过差异矩阵来检测错误匹配对的示意图。
图3本发明与业界最优方法的平均检索精度比较。
具体实施方式
一种基于L1范数全局几何一致性检验的错误匹配检测方法,包括如下步骤(流程见图1):
步骤1:对于两幅待比较图像,首先使用尺度不变特征变换(SIFT)及词袋模型(BoF)来提取并匹配两幅图像中的特征点,得到两幅图像中各特征点的坐标:a1i=(x1i,y1i)T,a2i=(x2i,y2i)T,其中i的顺序为特征点匹配后的排序,T表示转置,a1i和a2i均为列向量;
步骤2:分别计算两幅图像的平方距离矩阵D1和D2。所述的平方距离矩阵的一种计算方法为: D 1 = { | | a 1 i - a 1 j | | 2 } i , j = 1 n , D 2 = { | | a 2 i - a 2 j | | 2 } i , j = 1 n , 其中n表示匹配特征点对的个数,该方案执行速度较慢;所述的平方距离矩阵的另一种计算方法为:D1=α1eT-2A1 TA1+eα1 T,D2=α2eT-2A2 TA2+eα2 T,其中,e为全一列向量,该方案执行速度较快。
步骤3:使用黄金分割搜索法来求解如下问题:minλ>0||D1-λ.D2||1,该问题的解为λ*=argminλ>0||D1-λ.D2||1,它是两幅图像间的缩放尺度估计值;
步骤4:计算差异矩阵E=||D1*.D2||1,该矩阵中的非零元素被认为是由错误匹配对造成的;
步骤5:计算E矩阵各行元素之和并从大到小排序,并计算排序后各行和值的二次差分,取达到最大二次差分值的点作为门限值,所有行和高于门限值的,则该行所对应特征点对被判定为错误匹配对,如图2所示;
步骤6:去掉错误匹配对后,再使用业界成型的方法,如参考文献[5]中所述:根据两幅图像的真实匹配点对来计算图像间的相似度,继而根据相似度由大到小排序输出图像检索结果。所述的相似度用用匹配点个数进行衡量,匹配点个数越多,则相似度越高。
下面,对本发明的实施示例进行具体描述。
实施例1:
数据集:采用两个较为流行的数据集作为被检索数据集,分别是Holiday数据集以及DupImage数据集。其中Holiday数据集一共包含1491张图像,近似重复图片组数为500组;而DupImage数据集一共含有1104张部分重复图片,组数一共为33组。此外,为了让示例变得更加真实,本实施例还特别采用了混淆图片数据集MIRFlickr1M,它包含一百万张网页上下载的无关图片。本实施例用每个被检索数据集中的一张图片作为目标图片,将同组其他图片混杂到混淆图片中,据此来检验检索效果。
评价指标:本实施例使用能够体现图像检索性能的通用的平均检索精度(mAP)以及平均检索时间来检验本发明与其他业界最优方法来进行比较。
实施步骤:
a)使用尺度不变特征变换(SIFT)来对所有图片进行特征点的提取;
b)使用词袋模型(BoF),以训练好的100K大小的视觉字字典来索引所有特征点,并随后匹配所有索引值相同的特征点作为初始特征匹配对;
c)分别在混淆数据集为一千张、一万张和十万张规模的情况下,使用本发明及业界最优方法(RANSAC[4]、GC[5]、WGC[1]、EWGC[2]、SGC[3])分别去除初始特征匹配对中的错误匹配。
d)对所有方法处理后剩余的正确匹配结果,计算图像间相似度并据此得出检索排名结果。
e)由排名结果得到各个方法和本发明的平均检索精度与平均检索时间,以用于比较。
方案示例的比较结果如图3及表1所示。
表1本发明与现有业界最优方法的平均检索时间比较。
Holiday Dataset DupImage Dataset
本发明所述方法 1.03 0.94
RANSAC 18.36 53.64
GC 9.36 5.37
WGC 0.50 0.45
EWGC 0.94 0.41
SGC 1.55 2.23
参考文献
[1]Herve Jegou,Matthijs Douze,and Cordelia Schmid,“Hamming embeddingand weak geometric consistency for large scale image search,”in EuropeanConference on Computer Vision,2008,vol.5302,pp.304-317.
[2]Wan-Lei Zhao,Xiao Wu,and Chong-Wah Ngo,“On the annotation of webvideos by effiicient near-duplicate search,”IEEE Transactions on Multimedia,vol.12,no.5,pp.448-461,2010.
[3]Junqiang Wang,Jinhui Tang,and Yu-Gang Jiang,“Strong geometricalconsistency in large scale partialduplicate image search,”in Proceedings ofthe21st ACM International Conference on Multimedia,2013,pp.633-636.
[4]J.Philbin,O.Chum,M.Isard,J.SiVic,and A.Zisserman,“Objectretrievalwith large vocabularies and fast spatial matching,”in IEEE Conference onComputer Vision and Pattern Recognition,2007,pp.1-8.
[5]Wengang Zhou,Houqiang Li,Yijuan Lu,and Qi Tian,“SIFT matchverification by geometric coding for large scale partial-duplicate web imagesearch,”ACM Trans.on Multimedia Comput.Commun.Appl.,vol.9,no.1,pp.4∶1-4∶18,2013.

Claims (4)

1.一种基于L1范数全局几何一致性检验的错误匹配检测方法,其特征是,包括如下步骤:
步骤1:对于两幅待比较图像,首先使用尺度不变特征变换及词袋模型来提取并匹配两幅图像中的特征点,得到两幅图像中各特征点的坐标:a1i=(x1i,y1i)T,a2i=(x2i,y2i)T,其中i的顺序为特征点匹配后的排序,T表示转置,a1i和a2i均为列向量;
步骤2:分别计算两幅图像的平方距离矩阵D1和D2
步骤3:使用黄金分割搜索法来求解如下问题:minλ>0||D1-λ·D2||1,该问题的解为λ*=argminλ>0||D1-λ·D2||1,它是两幅图像间的缩放尺度估计值;
步骤4:计算差异矩阵E=||D1*·D2||1,该矩阵中的非零元素被认为是由错误匹配对造成的;
步骤5:计算E矩阵各行元素之和并从大到小排序,并计算排序后各行和值的二次差分,取达到最大二次差分值的点作为门限值,所有行和高于门限值的,则该行所对应特征点对被判定为错误匹配对;
步骤6:去掉错误匹配对后,再根据两幅图像的真实匹配点对来计算图像间的相似度,继而根据相似度由大到小排序输出图像检索结果。
2.如权利要求1所述的错误匹配检测方法,其特征是,步骤2中,所述的平方距离矩阵的计算方法为:其中n表示匹配特征点对的个数。
3.如权利要求1所述的错误匹配检测方法,其特征是,步骤2中,所述的平方距离矩阵的计算方法为:D1=α1eT-2A1 TA1+eα1 T,D2=α2eT-2A2 TA2+eα2 T
其中,e为全一列向量,
4.如权利要求1所述的错误匹配检测方法,其特征是,步骤6中,所述的相似度用匹配点个数进行衡量。
CN201410084657.0A 2014-03-10 2014-03-10 基于l1范数全局几何一致性检验的错误匹配检测方法 Active CN103823889B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410084657.0A CN103823889B (zh) 2014-03-10 2014-03-10 基于l1范数全局几何一致性检验的错误匹配检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410084657.0A CN103823889B (zh) 2014-03-10 2014-03-10 基于l1范数全局几何一致性检验的错误匹配检测方法

Publications (2)

Publication Number Publication Date
CN103823889A CN103823889A (zh) 2014-05-28
CN103823889B true CN103823889B (zh) 2017-02-01

Family

ID=50758953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410084657.0A Active CN103823889B (zh) 2014-03-10 2014-03-10 基于l1范数全局几何一致性检验的错误匹配检测方法

Country Status (1)

Country Link
CN (1) CN103823889B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105551022B (zh) * 2015-12-07 2018-03-30 北京大学 一种基于形状交互矩阵的图像错误匹配检验方法
CN109186616B (zh) * 2018-09-20 2020-04-07 禾多科技(北京)有限公司 基于高精度地图和场景检索的车道线辅助定位方法
CN116630017B (zh) * 2023-05-06 2023-11-21 广州市良策网络技术有限公司 贷款产品自动匹配方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833765A (zh) * 2010-04-30 2010-09-15 天津大学 基于双向匹配和三角形约束的特征匹配方法
CN102436652A (zh) * 2011-08-31 2012-05-02 航天恒星科技有限公司 一种多源遥感图像自动配准方法
WO2013071141A1 (en) * 2011-11-09 2013-05-16 Board Of Regents Of The University Of Texas System Geometric coding for billion-scale partial-duplicate image search
CN103605980A (zh) * 2013-12-04 2014-02-26 西安电子科技大学 基于局部特征匹配的isar目标部件检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833765A (zh) * 2010-04-30 2010-09-15 天津大学 基于双向匹配和三角形约束的特征匹配方法
CN102436652A (zh) * 2011-08-31 2012-05-02 航天恒星科技有限公司 一种多源遥感图像自动配准方法
WO2013071141A1 (en) * 2011-11-09 2013-05-16 Board Of Regents Of The University Of Texas System Geometric coding for billion-scale partial-duplicate image search
CN103605980A (zh) * 2013-12-04 2014-02-26 西安电子科技大学 基于局部特征匹配的isar目标部件检测方法

Also Published As

Publication number Publication date
CN103823889A (zh) 2014-05-28

Similar Documents

Publication Publication Date Title
Huang et al. Text-guided graph neural networks for referring 3d instance segmentation
Simonyan et al. Learning local feature descriptors using convex optimisation
CN103336957B (zh) 一种基于时空特征的网络同源视频检测方法
Wang et al. Sketch-based 3d shape retrieval using convolutional neural networks
CN105844669B (zh) 一种基于局部哈希特征的视频目标实时跟踪方法
Qin et al. Query adaptive similarity for large scale object retrieval
CN102254015B (zh) 基于视觉词组的图像检索方法
CN103823887B (zh) 基于低秩全局几何一致性检验的错误匹配检测方法
CN104615676B (zh) 一种基于最大相似度匹配的图片检索方法
CN109344845B (zh) 一种基于Triplet深度神经网络结构的特征匹配方法
CN105551022B (zh) 一种基于形状交互矩阵的图像错误匹配检验方法
Noh et al. Image retrieval with deep local features and attention-based keypoints
An et al. Hypergraph propagation and community selection for objects retrieval
CN103823889B (zh) 基于l1范数全局几何一致性检验的错误匹配检测方法
Lu et al. It’s okay to be wrong: Cross-view geo-localization with step-adaptive iterative refinement
Lei et al. Sketch based image retrieval via image-aided cross domain learning
CN105760875A (zh) 基于随机森林算法的判别二进制图像特征相似实现方法
CN104835174A (zh) 基于超图模式搜索的鲁棒模型拟合方法
Chen et al. AugTarget data augmentation for infrared small target detection
CN107526772A (zh) Spark平台下基于SURF‑BIT算法的图像检索系统
Ng et al. VRAG: Region attention graphs for content-based video retrieval
CN111597367A (zh) 基于视图和哈希算法的三维模型检索方法
CN104123382B (zh) 一种社会媒体下的图像集摘要生成方法
Hu et al. STRNN: End-to-end deep learning framework for video partial copy detection
CN106547867B (zh) 图像检索中基于密度的几何校验方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant