WO2015165037A1 - 一种基于级联二值编码的图像匹配方法 - Google Patents

一种基于级联二值编码的图像匹配方法 Download PDF

Info

Publication number
WO2015165037A1
WO2015165037A1 PCT/CN2014/076474 CN2014076474W WO2015165037A1 WO 2015165037 A1 WO2015165037 A1 WO 2015165037A1 CN 2014076474 W CN2014076474 W CN 2014076474W WO 2015165037 A1 WO2015165037 A1 WO 2015165037A1
Authority
WO
WIPO (PCT)
Prior art keywords
hash
feature points
image
candidate
hamming distance
Prior art date
Application number
PCT/CN2014/076474
Other languages
English (en)
French (fr)
Inventor
程健
冷聪
吴家祥
卢汉清
Original Assignee
中国科学院自动化研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中国科学院自动化研究所 filed Critical 中国科学院自动化研究所
Priority to PCT/CN2014/076474 priority Critical patent/WO2015165037A1/zh
Priority to CN201480000156.8A priority patent/CN104081435A/zh
Priority to US15/306,983 priority patent/US9996764B2/en
Publication of WO2015165037A1 publication Critical patent/WO2015165037A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Definitions

  • the present invention relates to the field of image processing, and in particular, to an image matching method based on cascaded binary coding. Background technique
  • Image matching is a key technology in the fields of computer vision and image processing. It has a wide range of applications in 3D reconstruction, image mosaic, and target recognition. Especially in the three-dimensional reconstruction problem of a large-scale scene, since the matching between large-scale images takes a lot of time, the speed of three-dimensional reconstruction is very slow. Therefore, fast and accurate image matching is an urgent problem to be solved.
  • Image matching techniques can be roughly divided into three categories: point matching, line matching, and area matching. Because of its robustness to illumination changes, affine transformations, and viewing angle changes, point matching is highly valued, and many efficient algorithms are proposed. However, point matching is usually very time consuming, and the computational time complexity of a pair of image matching is 0 ( ⁇ 2 ), where N is the average number of feature points per image. In the case of violent matching, the feature point matching problem can be regarded as a nearest neighbor finding problem. As an alternative, approximate nearest neighbor lookups are proposed, of which the more well known is the tree-based model, in which data is stored very efficiently, resulting in very fast search speeds. But all tree-based methods have greatly reduced search efficiency in high-dimensional situations, sometimes even less as simple linear lookups. Summary of the invention
  • the object of the present invention is to provide an image matching method based on cascaded binary coding for the deficiencies of the prior art, which can achieve efficient and accurate image matching.
  • the present invention provides an image matching method based on concatenated binary encoding, the method comprising: Step S1, performing rough selection on candidate feature points in the image by using a hash search method based on multiple hash tables to obtain candidate subsets of candidate feature points;
  • Step S2 mapping the candidate subset of the candidate feature points to the high-dimensional Hamming space; step S3, establishing a hash table of the Hamming distance-data address; querying the hash table of the Hamming distance-data address, thereby obtaining Best match feature points.
  • step S1 is specifically as follows: Step S1 l, performing a rough hash query by using a short hash code, and all feature points in the image are mapped to a hash of the m-bit hash function by a local position sensitive hash method. code.
  • step S11 is specifically: for the first feature point p in the first image I, a hash lookup table is established by using the m-bit hash code, and all the first feature points p in the second image J fall to Feature points in the same hash bucket are returned;
  • step S2 is specifically: mapping the candidate feature points into the high-dimensional Hamming space by the n-bit hash function (n>m), and then calculating and sorting the Hamming distances in the high-dimensional Hamming space.
  • step S3 is specifically:
  • the search starts from the bucket with the smallest key value until the preset candidate feature points are found.
  • the preset candidate feature points found are the preset candidate feature points with the smallest distance from the query point Hamming.
  • the image matching method of the invention uses a three-layer hash structure to achieve fast and accurate feature point matching through a layer-by-layer screening process, which has a fast processing speed and good effect, and can achieve efficient and accurate image matching.
  • FIG. 1 is a flow chart of an image matching method based on cascaded binary coding according to the present invention. detailed description
  • the image matching method of the invention proposes a cascading binary encoding method from coarse to fine, and combines the query and sorting search strategies of the hash method, which greatly improves the matching speed of image feature points, and the matching uses one.
  • the three-layer hash structure enables fast and accurate feature point matching through a layer-by-layer screening process.
  • FIG. 1 is a flowchart of an image matching method based on concatenated binary encoding according to the present invention. As shown in the figure, the present invention specifically includes the following steps:
  • Step 101 Perform rough selection of candidate feature points in the image by using a hash search method based on multiple hash tables to obtain candidate subsets of candidate feature points;
  • This step is based on the candidate feature point query of the multi-hash table.
  • the shortest hash query is performed by a short hash code, that is, Hashing Lookup 0 , in which all feature points in the image are mapped into m-bit hash codes by a local position-sensitive hash method. .
  • Hashing Lookup 0 a short hash code
  • all feature points in the image are mapped into m-bit hash codes by a local position-sensitive hash method.
  • For the feature point p in image I in order to find its matching point in image J, it is necessary to establish a hash lookup table with these m-bit hash codes. All feature points in image J that fall into the same hash bucket with point p will be returned.
  • the hash lookup has a constant time complexity.
  • a hash lookup method based on multiple hash tables is used. Specifically, L different types are generated by local position sensitive hash (LSH)
  • LSH local position sensitive hash
  • ⁇ (p) 3 ⁇ 4 2 £ 1 ⁇ 2)
  • J ... t L
  • Step 102 Map candidate subsets of candidate feature points to a high-dimensional Hamming space
  • the candidate subset obtained in step 101 can be accurately searched in step 102, for example, calculating the Euclidean distance between each candidate feature point and the query point.
  • the present invention maps these candidate feature points to high-dimensional Hamming through a longer n-bit hash function (n>m). In space, you can then calculate and sort Hamming distances in this space.
  • Step 103 Establish a hash table of the Hamming distance-data address; query a hash table of the Hamming distance-data address to obtain the best matching feature point.
  • the Hamming distance between the query point and the candidate feature point is first calculated, and at the same time, the Hamming distance is used as a key, and the memory address of the candidate feature point is used. Construct a hash table for the value.
  • a hash table of "Hamming distance-data address" can be completely established after traversing the entire database once.
  • the candidate points found through this process must be the smallest point from the query point Hamming.
  • the image matching method of the present invention first performs feature point detection on two images ( ⁇ and 2 ) to be matched, and then performs feature vector representation on the detected feature points.
  • the feature points of an image can be detected by the SI FT method and expressed as a 128-dimensional feature vector.
  • concatenated preclude the use of three binary encoding method, an image matching treating 2-one matching and feature point 12 on the overlapping area.
  • the number of feature points in each image is set.
  • the time complexity for calculating the Euclidean distance is denoted as ' ⁇ ⁇
  • the time complexity for calculating the Hamming distance is recorded as . It should be noted that, under the modern CPU architecture, the Hamming distance of the 128-dimensional 0-1 vector is only required to be one clock cycle, so the computational cost of the Hamming distance is much smaller than the computational overhead of the Euclidean distance.
  • the matching algorithm based on brute force search is to determine the matching result of each feature point in image i. It is necessary to traverse all the feature points in image 3 ⁇ 4, calculate the Euclidean distance one by one, and determine the nearest neighbor and the next nearest neighbor, so the final total time
  • the complexity is o( ' ⁇ ⁇ :).
  • the tree-based matching algorithm is for each feature point in the image ⁇ , the search process for finding the nearest neighbor and the next nearest neighbor in the feature point set of the image is tree-based, and on average, it is necessary to calculate k W times of the European giant, so Total time complexity is
  • the matching algorithm of the present invention is that for each feature point in the image ⁇ , after the first round of hash query based on multiple hash tables (the time overhead of the step is negligible), an average feature point enters the candidate set; For each feature point in the candidate set, you need to calculate the Hamming distance one by one and select the k elements with the smallest distance.
  • the time complexity is 0 ( ⁇ / 2 ⁇
  • the complexity is 0 (,3 ⁇ 4 . ); therefore, the total time complexity is o( ⁇ 2 7 ⁇ s
  • the matching algorithm based on brute force search has the highest time complexity.
  • RAM random access memory
  • ROM read-only memory
  • electrically programmable ROM electrically erasable programmable ROM
  • registers hard disk, removable disk, CD-ROM, or technical field Any other form known In the storage medium.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于级联二值编码的图像匹配方法,所述方法包括:步骤S1,利用基于多个哈希表的哈希查找方法对图像中的候选特征点进行粗筛选,得到候选特征点的候选子集;步骤S2,将所述候选特征点的候选子集映射到高维汉明空间;步骤S3,建立汉明距离-数据地址的哈希表;查询所述汉明距离-数据地址的哈希表,从而得到最佳匹配特征点。该图像匹配方法,处理速度快,效果好,可实现高效和准确的图像匹配。

Description

一种基于级联二值编码的图像匹配方法 技术领域
本发明涉及图像处理领域, 尤其涉及一种基于级联二值编码的图像匹配 方法。 背景技术
图像匹配是计算机视觉、 图像处理等领域的关键技术, 在三维重建、 图 像拼接、 目标识别等方面具有广泛的应用。 特别是在大范围场景的三维重建 问题中, 由于大规模图像之间的匹配需要耗费大量时间, 导致三维重建的速 度非常慢。 因此, 快速、 准确的图像匹配是亟待解决的问题。
图像匹配技术大致可以分为三类: 点匹配, 线匹配和区域匹配。 由于其 对光照变化、 仿射变换和视角变化的鲁棒性, 点匹配的重视程度较高, 许多 有效的算法被提出。 然而, 点匹配通常是非常耗时的, 一对图像匹配的计算 时间复杂性为 0(^2), 其中 N为平均每幅图像的特征点个数。 在暴力匹配情况 下, 特征点匹配问题可以被看作是一个最近邻查找问题。 作为替代方案, 提 出了近似最邻近查找, 其中比较著名的是基于树的模型, 在这种模型下, 数 据被非常有效地存储, 从而取得非常快的搜索速度。 但是所有基于树的方法 在高维情况其搜索效率大大下降, 有时候甚至不如简单的线性查找。 发明内容
本发明的目的是针对现有技术的不足, 提供一种基于级联二值编码的图 像匹配方法, 可以实现高效和准确的图像匹配。
为实现上述目的,本发明提供了一种基于级联二值编码的图像匹配方法, 所述方法包括: 步骤 Sl, 利用基于多个哈希表的哈希查找方法对图像中的候选特征点进 行粗 选, 得到候选特征点的候选子集;
步骤 S2, 将所述候选特征点的候选子集映射到高维汉明空间; 步骤 S3, 建立汉明距离-数据地址的哈希表; 查询所述汉明距离-数据地 址的哈希表, 从而得到最佳匹配特征点。
进一步的, 所述步骤 S1具体为: 步骤 Sl l, 通过短的哈希码做粗哈希查 询, 图像中的所有特征点通过局部位置敏感哈希方法映射成 m位的哈希函数 的哈希码。
进一步的, 所述步骤 S11具体为: 对于第一图像 I 中的第一特征点 p, 用 m位哈希码建立一个哈希查找表, 第二图像 J中所有和第一特征点 p落到 同一个哈希桶中的特征点被返回;
其中 , 通过局部位置敏感哈希生成 L 个不同 的哈希函数 gr(?) 二 i 、.K- ( : k . " US)) ' ' 1 二 H , 对 4 工于母个入哈入希函7数, 建、 入 ϋ一个 哈希表, 将第一图像 I 中的第一特征点 p 投入到哈希桶 (Ρ)中, 其中, = 1,2 „. JL。
进一步的, 所述步骤 S2具体为: 通过 n位哈希函数(n>m )将这些候选 特征点映射到高维汉明空间中, 然后在所述高维汉明空间中进行汉明距离的 计算并排序。
进一步的, 所述步骤 S3具体为:
计算查询点与候选特征点之间的第一汉明距离;
以所述第一汉明距离为键, 以候选特征点的内存地址为值建哈希表; 遍历所述汉明距离 -数据地址的哈希表的数据库, 并建立汉明距离 -数据 地址哈希表;
从键值最小的桶开始查找, 直到找满预设个候选特征点为止, 找到的预 设个候选特征点是与查询点汉明距离最小的预设个候选特征点。 本发明图像匹配方法, 其匹配釆用了一个三层的哈希结构, 通过逐层筛 选的过程实现快速准确的特征点匹配, 处理速度快, 效果好, 可实现高效和 准确的图像匹配。 附图说明
图 1为本发明一种基于级联二值编码的图像匹配方法的流程图。 具体实施方式
下面通过附图和实施例, 对本发明的技术方案做进一步的详细描述。 本发明图像匹配方法提出了一种由粗到细的级联二值编码方法, 综合了 哈希方法的查询和排序两种查找策略, 大大提升了图像特征点匹配的速度, 匹配釆用了一个三层的哈希结构, 通过逐层筛选的过程实现快速准确的特征 点匹配。
图 1为本发明一种基于级联二值编码的图像匹配方法的流程图, 如图所 示, 本发明具体包括如下步骤:
步骤 101, 利用基于多个哈希表的哈希查找方法对图像中的候选特征点 进行粗 选, 得到候选特征点的候选子集;
本步骤是基于多哈希表的候选特征点查询。
具体的,通过短的哈希码做一次最粗略的哈希查询,即哈希查找( Hashing Lookup )0 其中, 图像中的所有特征点通过局部位置敏感哈希方法映射成 m位 的哈希码。 对于图像 I 中的特征点 p, 为了找到它在图像 J中的匹配点, 需 要用这些 m位哈希码建立一个哈希查找表。 图像 J中所有和点 p落到同一个 哈希桶中的特征点将被返回。
哈希查找具有常数的时间复杂度, 在本发明中, 釆用一种基于多个哈希 表的哈希查找方法。 具体的, 通过局部位置敏感哈希(LSH )生成 L个不同的 哈希函数 g: ) = ¾2 £½), J = ... t L, 对应于每个哈希函数, 可以建立一个哈希表。 对于图像 I中的特征点 p, 将其投入到哈希桶^ (p)中, 其中, = H L。
因为越长的哈希码判别力越强, 从而使得相似点落到同一个桶中的概 率 和相异点落到同一个桶的概率 2的差距变大。 当 m增大时, ?^将减少, 即要使 L充分大从而保证真正的近邻至少有一次和查询点落在同一个桶 中。 具体的, 这个概率为 1 - (i -
Figure imgf000005_0001
需要为不同的应用选择不同的参数 m和 L。例如在三维重建中的图像匹 配, 分别选择参数 m=8或 10, L=6。
步骤 102, 将候选特征点的候选子集映射到高维汉明空间;
在步骤 101的粗搜索之后, 可以在步骤 102中对步骤 101得到的候选 子集进行精确搜索, 例如计算每一个候选特征点与查询点之间的欧氏距 离。 但是, 因为候选子集的规模仍然很大, 直接计算欧式距离需要很大的 计算量, 本发明釆用通过更长的 n位哈希函数(n>m ) 将这些候选特征点 映射到高维汉明空间中, 然后就可以在这个空间中进行汉明距离的计算并 排序。
步骤 103, 建立汉明距离-数据地址的哈希表; 查询汉明距离-数据地址 的哈希表, 从而得到最佳匹配特征点。
为了进行最精确的查找, 需要找到汉明空间中的前 K个近邻, 并且在 其中找到欧氏距离最近的前两名来判断是否匹配。
通常来说, 为了找到前 κ个近邻, 需要遍历数据库 K次, 当数据库非 常大时, 这个过程也是很耗时的。 在本发明中, 提出一种基于哈希的前 κ 名的查找方法, 仅需要遍历数据库一次就可以定位前 κ名。
具体的, 在遍历数据库的过程中, 首先计算查询点与候选特征点之间 的汉明距离, 与此同时, 以这个汉明距离为键, 以候选特征点的内存地址 为值建哈希表。于是,在遍历整个数据库一次之后能够完整的建立一个 "汉 明距离 -数据地址" 的哈希表。
为了定位前 κ名, 只要从键值最小的桶开始查找, 如果第一个桶中的 候选点个数少于 κ, 则到第二个桶中查找, 以此类推, 直到找满 κ个候选 点为止。 通过这个过程找到的 Κ个候选点一定是与查询点汉明距离最小的 Κ个点。
综上, 本发明图像匹配方法在图像特征点提取与表示阶段, 首先对两 幅待匹配的图像( ^和 2 )分别进行特征点检测, 然后对检测到的特征点进 行特征向量表示。 例如, 可以用 S I FT方法检测图像的特征点, 并表示成 128维的特征向量。
在基于级联二值编码的特征点匹配阶段, 釆用三层的级联二值编码方 法, 对待匹配图像2和12中重叠区域上的特征点进行一对一的匹配。 对于图 像^中的任何一个特征点 xs, 首先釆用一种基于多个哈希表的哈希查找方 法, 按照汉明距离大小, 对图像中 i:i的所有特征点 yj进行粗略筛选, 得到 一个候选子集?; 然后把候选子集?中的所有特征点映射到高维汉明空间; 最后从候选子集 Ϊ中快速查询到前 K个最近匹配点, 这里的 K可以根据不 同应用设置不同的数目, 例如, 三维重建中的图像匹配往往设置 K=2。
对于两幅待匹配的图像(分别记为 ^和 Ls. ) , 4叚设每幅图像中的特征点 的数量均为 。 计算欧式距离的时间复杂度记为' τε, 计算汉明距离的时间 复杂度记为 。 需要说明的是, 在现代 CPU架构下, 计算 128维 0-1向量 的汉明距离仅需 1个时钟周期, 因此汉明距离的计算开销 是远小于欧式 距离的计算开销 的。
基于暴力搜索的匹配算法是为确定图像 i中每个特征点的匹配结果, 需要对图像 ¾中的所有特征点进行遍历, 逐个计算欧式距离, 从而确定最 近邻与次近邻, 因此最终的总时间复杂度为 o( ' τε:)。 基于树的匹配算法是对于图像^中每个特征点,在图像½的特征点集合 中寻找最近邻和次近邻的搜索过程是基于树的, 平均情况下需要计算 k W 次欧式巨离, 因此总时间复杂度为
Figure imgf000007_0001
本发明的匹配算法是对于图像 ^中每个特征点, 经过第一轮的基于多 个哈希表的哈希查询 (该步骤的时间开销可忽略) , 平均会有 个特 征点进入候选集合;对于候选集合中每个特征点,需要逐个计算汉明距离, 并选出距离最小的 k个元素, 时间复杂度为 0( ΛΓ/2Ί 对于距离最小的 k 个元素, 需要分别计算欧式距离, 时间复杂度为 0(,¾ . ); 因此, 总时间复 杂度为 o(^27 ■ s
通过上述时间复杂度分析可以看出, 基于暴力搜索的匹配算法的时间 复杂度最高; 基于树的匹配算法与基于哈希的暴力匹配算法相比, 在图像 中特征点数量较多时,时间复杂度较低,但在大多数情况下两者较为接近; 而本发明提出的匹配方法, 如果参数选择得当 (m和 L较小的情况下, 如 m=8, L=6 ) , 匹配速度可以达到基于 KdTree的匹配算法的 1 0倍以上。
专业人员应该还可以进一步意识到, 结合本文中所公开的实施例描述的 各示例的单元及算法步骤, 能够以电子硬件、 计算机软件或者二者的结合来 实现, 为了清楚地说明硬件和软件的可互换性, 在上述说明中已经按照功能 一般性地描述了各示例的组成及步骤。 这些功能究竟以硬件还是软件方式来 执行, 取决于技术方案的特定应用和设计约束条件。 专业技术人员可以对每 个特定的应用来使用不同方法来实现所描述的功能, 但是这种实现不应认为 超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、 处理 器执行的软件模块, 或者二者的结合来实施。 软件模块可以置于随机存储器 ( RAM ) 、 内存、 只读存储器(ROM ) 、 电可编程 R0M、 电可擦除可编程 R0M、 寄存器、 硬盘、 可移动磁盘、 CD-ROM , 或技术领域内所公知的任意其它形式 的存储介质中。
以上所述的具体实施方式, 对本发明的目的、 技术方案和有益效果进行 了进一步详细说明, 所应理解的是, 以上所述仅为本发明的具体实施方式而 已, 并不用于限定本发明的保护范围, 凡在本发明的精神和原则之内, 所做 的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。

Claims

权 利 要 求 书
1、一种基于级联二值编码的图像匹配方法,其特征在于,所述方法包括: 步骤 Sl, 利用基于多个哈希表的哈希查找方法对图像中的候选特征点进 行粗 选, 得到候选特征点的候选子集;
步骤 S2, 将所述候选特征点的候选子集映射到高维汉明空间;
步骤 S3, 建立汉明距离-数据地址的哈希表; 查询所述汉明距离-数据地 址的哈希表, 从而得到最佳匹配特征点。
2、 根据权利要求 1所述的方法, 其特征在于, 所述步骤 S1具体为: 步骤 Sl l, 通过短的哈希码做粗哈希查询, 图像中的所有特征点通过局 部位置敏感哈希方法映射成 m位的哈希函数的哈希码。
3、 根据权利要求 2所述的方法, 其特征在于, 所述步骤 S11具体为: 对 于第一图像 I 中的第一特征点 p, 用 m位哈希码建立一个哈希查找表, 第二 图像 J中所有和第一特征点 P落到同一个哈希桶中的特征点被返回;
其中 , 通过局部位置敏感哈希生成 L 个不同 的哈希函数
'
Figure imgf000009_0001
' '·' ·" , 对应于每个哈希函数, 建立一个 哈希表, 将第一图像 I 中的第一特征点 ρ 投入到哈希桶 中, 其中,
I - :。
4、 根据权利要求 1所述的方法, 其特征在于, 所述步骤 S2具体为: 通过 n位哈希函数 ( n>m )将这些候选特征点映射到高维汉明空间中, 然 后在所述高维汉明空间中进行汉明距离的计算并排序。
5、 根据权利要求 1所述的方法, 其特征在于, 所述步骤 S 3具体为: 计算查询点与候选特征点之间的第一汉明距离;
以所述第一汉明距离为键, 以候选特征点的内存地址为值建哈希表; 遍历所述汉明距离 -数据地址的哈希表的数据库, 并建立汉明距离 -数据 地址哈希表;
从键值最小的桶开始查找, 直到找满预设个候选特征点为止, 找到的预 设个候选特征点是与查询点汉明距离最小的预设个候选特征点。
PCT/CN2014/076474 2014-04-29 2014-04-29 一种基于级联二值编码的图像匹配方法 WO2015165037A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/CN2014/076474 WO2015165037A1 (zh) 2014-04-29 2014-04-29 一种基于级联二值编码的图像匹配方法
CN201480000156.8A CN104081435A (zh) 2014-04-29 2014-04-29 一种基于级联二值编码的图像匹配方法
US15/306,983 US9996764B2 (en) 2014-04-29 2014-04-29 Image matching method based on cascaded binary encoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/076474 WO2015165037A1 (zh) 2014-04-29 2014-04-29 一种基于级联二值编码的图像匹配方法

Publications (1)

Publication Number Publication Date
WO2015165037A1 true WO2015165037A1 (zh) 2015-11-05

Family

ID=51601306

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/076474 WO2015165037A1 (zh) 2014-04-29 2014-04-29 一种基于级联二值编码的图像匹配方法

Country Status (3)

Country Link
US (1) US9996764B2 (zh)
CN (1) CN104081435A (zh)
WO (1) WO2015165037A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190065819A1 (en) * 2017-08-30 2019-02-28 Fujitsu Limited Biological-image processing unit and method and program for processing biological image
CN111046715A (zh) * 2019-08-29 2020-04-21 郑州大学 一种基于图像检索的人体动作对比分析方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104081435A (zh) * 2014-04-29 2014-10-01 中国科学院自动化研究所 一种基于级联二值编码的图像匹配方法
CN104751459B (zh) * 2015-03-27 2017-05-17 东南大学 多维特征的相似性度量优化方法及图像匹配方法
CN104778675B (zh) * 2015-04-28 2017-07-28 中国矿业大学 一种采煤综掘工作面动态视频图像融合方法
CN105550368A (zh) * 2016-01-22 2016-05-04 浙江大学 一种高维数据的近似最近邻检索方法及检索系统
CN105844667A (zh) * 2016-03-25 2016-08-10 中国矿业大学 一种紧凑颜色编码的结构化目标跟踪方法
CN106126668B (zh) * 2016-06-28 2019-07-19 北京小白世纪网络科技有限公司 一种基于哈希重建的图像特征点匹配方法
CN106886785A (zh) * 2017-02-20 2017-06-23 南京信息工程大学 一种基于多特征哈希学习的航拍图像快速匹配算法
CN107341507B (zh) * 2017-06-20 2020-01-21 华中科技大学 一种基于gpu与级联哈希的快速图像sift特征匹配方法
WO2019047245A1 (zh) * 2017-09-11 2019-03-14 深圳市柔宇科技有限公司 图像处理方法、电子装置和计算机可读存储介质
CN109840525B (zh) * 2017-11-27 2022-09-20 中国科学院沈阳计算技术研究所有限公司 圆周二进制特征的提取与匹配搜索方法
CN109949218B (zh) * 2017-12-21 2023-04-18 富士通株式会社 图像处理装置和方法
CN109416689B (zh) * 2018-01-16 2021-08-03 深圳力维智联技术有限公司 海量特征向量数据的相似检索方法及设备、存储介质
CN108959441A (zh) * 2018-06-13 2018-12-07 新华智云科技有限公司 一种基于局部敏感哈希的近相似快速查找方法
CN109376256B (zh) 2018-09-29 2021-03-26 京东方科技集团股份有限公司 图像搜索方法及装置
CN109598726A (zh) * 2018-10-26 2019-04-09 哈尔滨理工大学 一种基于slic的自适应图像目标区域分割方法
CN110083762B (zh) * 2019-03-15 2023-01-24 平安科技(深圳)有限公司 房源搜索方法、装置、设备及计算机可读存储介质
CN110297879B (zh) * 2019-05-15 2023-05-30 平安科技(深圳)有限公司 一种基于大数据的数据去重的方法、装置及存储介质
CN110851633B (zh) * 2019-11-18 2022-04-22 中山大学 一种实现同时定位和哈希的细粒度图像检索方法
WO2022040621A1 (en) 2020-08-21 2022-02-24 Cyborg Inc. System and method for encrypted search using hash vectorization models
CN112102475B (zh) * 2020-09-04 2023-03-07 西北工业大学 一种基于图像序列轨迹跟踪的空间目标三维稀疏重构方法
CN112614187B (zh) * 2020-12-31 2024-03-26 深圳市优必选科技股份有限公司 回环检测方法、装置、终端设备和可读存储介质
CN113542750B (zh) * 2021-05-27 2024-06-25 绍兴市北大信息技术科创中心 采用两套以上哈希表进行搜索的数据编码方法
CN115935200B (zh) * 2023-01-12 2023-09-08 北京三维天地科技股份有限公司 一种基于哈希和海明距离的海量数据相似性计算方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158967A (zh) * 2007-11-16 2008-04-09 北京交通大学 一种基于分层匹配的快速音频广告识别方法
CN101710334A (zh) * 2009-12-04 2010-05-19 大连理工大学 基于图像哈希的大规模图像库检索方法
CN101887457A (zh) * 2010-07-02 2010-11-17 杭州电子科技大学 基于内容的复制图像检测方法
CN102508910A (zh) * 2011-11-11 2012-06-20 大连理工大学 基于多哈希表映射误差最小化的图像检索方法
CN103020321A (zh) * 2013-01-11 2013-04-03 广东图图搜网络科技有限公司 近邻搜索方法与系统
US20130254191A1 (en) * 2011-12-06 2013-09-26 The Trustees Of Columbia University In The City Of New York Systems and methods for mobile search using bag of hash bits and boundary reranking
CN103345496A (zh) * 2013-06-28 2013-10-09 新浪网技术(中国)有限公司 多媒体信息检索方法和系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5776662A (en) * 1980-10-31 1982-05-13 Toshiba Corp Erasure system for picture information
US5021971A (en) * 1989-12-07 1991-06-04 Unisys Corporation Reflective binary encoder for vector quantization
US5457371A (en) * 1993-08-17 1995-10-10 Hewlett Packard Company Binary locally-initializing incremental encoder
US5398239A (en) * 1993-12-08 1995-03-14 The United States Of America As Represented By The Secretary Of The Navy Crosspoint analog data selector
CA2219809A1 (en) * 1997-10-31 1999-04-30 Shen-En Qian System for interactive visualization and analysis of imaging spectrometry datasets over a wide-area network
GB2358719B (en) * 2000-01-27 2004-05-05 Automatic Parallel Designs Ltd Method and apparatus for binary encoding logic circuits
US7594162B2 (en) * 2005-05-13 2009-09-22 Texas Instruments Incorporated Viterbi pretraceback for partial cascade processing
US9842090B2 (en) * 2007-12-05 2017-12-12 Oracle International Corporation Efficient streaming evaluation of XPaths on binary-encoded XML schema-based documents
CN101697232B (zh) * 2009-09-18 2012-03-07 浙江大学 面向近重复图像匹配的sift特征裁减方法
CN101877143B (zh) * 2009-12-09 2012-07-04 中国科学院自动化研究所 一种二维图像组的三维场景重建方法
CN103632362B (zh) * 2012-08-28 2017-03-01 中国电信股份有限公司 图像匹配处理方法、装置及系统
CN103593838B (zh) * 2013-08-01 2016-04-13 华中科技大学 一种快速互相关灰度图像匹配方法与装置
CN104081435A (zh) * 2014-04-29 2014-10-01 中国科学院自动化研究所 一种基于级联二值编码的图像匹配方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158967A (zh) * 2007-11-16 2008-04-09 北京交通大学 一种基于分层匹配的快速音频广告识别方法
CN101710334A (zh) * 2009-12-04 2010-05-19 大连理工大学 基于图像哈希的大规模图像库检索方法
CN101887457A (zh) * 2010-07-02 2010-11-17 杭州电子科技大学 基于内容的复制图像检测方法
CN102508910A (zh) * 2011-11-11 2012-06-20 大连理工大学 基于多哈希表映射误差最小化的图像检索方法
US20130254191A1 (en) * 2011-12-06 2013-09-26 The Trustees Of Columbia University In The City Of New York Systems and methods for mobile search using bag of hash bits and boundary reranking
CN103020321A (zh) * 2013-01-11 2013-04-03 广东图图搜网络科技有限公司 近邻搜索方法与系统
CN103345496A (zh) * 2013-06-28 2013-10-09 新浪网技术(中国)有限公司 多媒体信息检索方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190065819A1 (en) * 2017-08-30 2019-02-28 Fujitsu Limited Biological-image processing unit and method and program for processing biological image
US10755073B2 (en) * 2017-08-30 2020-08-25 Fujitsu Limited Biological-image processing unit and method and program for processing biological image
CN111046715A (zh) * 2019-08-29 2020-04-21 郑州大学 一种基于图像检索的人体动作对比分析方法
CN111046715B (zh) * 2019-08-29 2023-03-14 郑州大学 一种基于图像检索的人体动作对比分析方法

Also Published As

Publication number Publication date
US20170053182A1 (en) 2017-02-23
CN104081435A (zh) 2014-10-01
US9996764B2 (en) 2018-06-12

Similar Documents

Publication Publication Date Title
WO2015165037A1 (zh) 一种基于级联二值编码的图像匹配方法
US11048966B2 (en) Method and device for comparing similarities of high dimensional features of images
CN104035949B (zh) 一种基于局部敏感哈希改进算法的相似性数据检索方法
CN107577990B (zh) 一种基于gpu加速检索的大规模人脸识别方法
Sattler et al. Fast image-based localization using direct 2d-to-3d matching
Zheng et al. Packing and padding: Coupled multi-index for accurate image retrieval
TWI528196B (zh) Similar image recognition method and apparatus
Nakai et al. Use of affine invariants in locally likely arrangement hashing for camera-based document image retrieval
JP5164222B2 (ja) 画像検索方法およびシステム
CN104991959B (zh) 一种基于内容检索相同或相似图像的方法与系统
TWI536186B (zh) 三維圖檔搜尋方法與三維圖檔搜尋系統
CN111868710A (zh) 搜索大规模非结构化数据的随机提取森林索引结构
Chen et al. A High-precision Duplicate Image Deduplication Approach.
CN108875828A (zh) 一种相似图像的快速匹配方法和系统
Feng et al. Real-time SLAM relocalization with online learning of binary feature indexing
CN105302833A (zh) 一种基于内容的视频检索数学模型建立方法
CN112102475A (zh) 一种基于图像序列轨迹跟踪的空间目标三维稀疏重构方法
Iwamura et al. Improvement of Retrieval Speed and Required Amount of Memory for Geometric Hashing by Combining Local Invariants.
CN115408555A (zh) 一种声纹检索方法、系统、存储介质及电子设备
Wu et al. Visual loop closure detection by matching binary visual features using locality sensitive hashing
Cui et al. A novel DIBR 3D image hashing scheme based on pixel grouping and NMF
Wadhwa et al. Distributed locality sensitivity hashing
TWI578240B (zh) 特徵描述方法及應用其之特徵描述器
Zhou et al. Inquiring of the Sights from the Web via Camera Mobiles
JP5909199B2 (ja) アドレス解決システム及び方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14890722

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 15306983

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14890722

Country of ref document: EP

Kind code of ref document: A1