CN101911100A - 用于图像识别的基于特征的签名 - Google Patents

用于图像识别的基于特征的签名 Download PDF

Info

Publication number
CN101911100A
CN101911100A CN2008801244383A CN200880124438A CN101911100A CN 101911100 A CN101911100 A CN 101911100A CN 2008801244383 A CN2008801244383 A CN 2008801244383A CN 200880124438 A CN200880124438 A CN 200880124438A CN 101911100 A CN101911100 A CN 101911100A
Authority
CN
China
Prior art keywords
image
representation
steps
regions
deriving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008801244383A
Other languages
English (en)
Other versions
CN101911100B (zh
Inventor
米罗斯瓦夫·博贝尔
保罗·布拉斯尼特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lotte Group Co ltd
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN101911100A publication Critical patent/CN101911100A/zh
Application granted granted Critical
Publication of CN101911100B publication Critical patent/CN101911100B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/48Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

描述了一种导出图像表示的方法。所述方法涉及处理对应于所述图像的信号。识别出所述图像中代表该图像的至少一个区域。在一种实施方式中,各个识别出的区域对应于该图像的一个特征。对于各个识别出的图像区域,导出所述图像区域的至少一部分的二维函数并对其进行处理,以便得到所述图像区域的所述至少一部分的中间表示。由所述图像区域中至少一个图像区域的所述中间表示导出所述图像的表示。

Description

用于图像识别的基于特征的签名
技术领域
本发明涉及一种表示图像的方法和装置,另外,涉及例如出于搜索或验证的目的而比较或匹配图像的方法和装置。
背景技术
本发明涉及对更早公开的共同待决的欧洲专利申请EP 06255239.3和英国专利申请GB 0700468.2、GB 0712388.8以及GB 0719833.6的图像识别技术的改进,将这些申请的全部内容通过引用并入本文。这些更早的共同待决的专利申请中公开的发明和实施方式的细节类似地适用于本发明和实施方式。
EP 06255239.3、GB 0700468.2、GB 0712388.8以及GB 0719833.6描述的方法和装置中使用的图像识别技术均从图像提取短的二进制描述符(参见图2)。这些技术解决了现有技术的很多缺陷,并且具体地,其特征在于:
·同时减小了特征提取和匹配的计算复杂度,
·减小了图像描述符的大小,
·增强了对各种图像修改的鲁棒性,以及
·对于各种各样的图像修改,在维持99.8%的检测率的同时,将虚警率降低到百万分(ppm)之0.05的水平。
这些方法提供了对很多常见图像修改的非常高水平的鲁棒性。然而,这些方法没有提供对诸如平移和剪切等图像内容的重要部分丢失或被替换的这类图像修改所需水平的鲁棒性。
因此,希望显著改进对涉及图像内容部分丢失的一类图像修改的鲁棒性。
发明内容
根据第一方面,本发明提供了一种如所附权利要求1中定义的导出图像表示的方法。
根据第二方面,本发明提供了一种通过比较根据本发明第一方面导出的图像表示来比较图像的方法,例如,用于图像匹配。
本发明的其他方面包括根据本发明第一方面导出的图像表示的使用方法、执行根据本发明第一和/或第二方面的方法的装置及计算机程序。
本发明涉及一种以基于区域的Trace变换描述符描述的少量感兴趣区域为基础来表示图像的新方法。其还涉及一种图像匹配的新方法。
根据本发明的实施方式,从图像中选择具有代表性的小的兴趣点集合或特征点集合。在该选择过程中使用一些约束,诸如先前选择的特征周围的禁区。利用修改的基于Trace变换的方法,从各个所选择的兴趣区域提取二进制“特征签名”。所述特征签名用于刻画所述特征的局部邻域。利用多个局部特征签名及其几何关系来表示图像。
根据本发明的实施方式,通过两个阶段的处理执行图像匹配程序,其涉及在应用几何约束之前利用累计Hamming距离快速识别特征点匹配对的候选集,以便提高该方法的准确率。具体地,由从所述图像中选择的特征点的几何形状提供的信息有助于显著减少虚警率。所述几何信息还可用于确定图像变换的类别和变换参数。
本发明的实施方式被设计为对EP 06255239.3、GB 0700468.2、GB0712388.8以及GB 0719833.6描述的图像识别装置及方法的补充。本发明有利地提供了对特定图像修改的额外的鲁棒性。然而,利用现有技术的处理资源,独立使用本发明的技术也许在搜索速度方面不能提供与前述在先的共同待决的专利申请中所提出的技术相同的性能。具体地,根据本发明的实施方式的识别潜在特征对的处理可能比先前提出的方法至少慢一个数量级。尽管可以独立使用根据本发明的方法以及在先的共同待决的专利申请中的一种或更多种方法,但优选的是将这些方法结合起来。这样,如以下所述,利用较快方法得到的结果可以传递到本发明的相对较慢的方法中,以便进一步分析。当联合应用时,速度方面性能改善,且虚警率和鲁棒性都最大化。
根据以下描述和所附权利要求书,本发明的其他特征和优势将更加明显。
附图说明
现在将参考附图描述本发明的实施方式,在附图中:
图1a示出了一幅图像;
图1b示出了图1a所示图像的缩小版本;
图1c示出了图1a所示图像的旋转版本;
图1d示出了图1a所示图像的模糊版本;
图1e示出了图1a所示图像的(左-右)翻转版本;
图1f示出了图1a所示图像的严重压缩版本;
图1g示出了图1a所示图像的裁剪版本;
图2示出了一幅图像以及根据现有技术的对所述图像的比特串表示;
图3示出了利用基于梯度的特征检测器检测到的兴趣点集的示例;
图4示出了特征未被选择的图像边界区域以及基于强度的最终特征集;
图5示出了利用Hamming距离从(a)原始图像和(b)(a)的旋转版本找到的匹配的兴趣点,其中,兴趣点之间的直线长度用于施加几何约束;以及
图6是根据本发明的一个实施方式的装置的框图。
具体实施方式
以下将描述用于获取图像表示(具体而言为图像标识符)以及出于对一幅或多幅图像进行识别、匹配或者验证的目的而使用这样的表示/标识符的各种实施方式。本发明对于识别图像尤其有用,但并不限于此。在所描述的实施方式中,“图像标识符”(也简称为“标识符”、“签名”或“图像签名”)是图像表示的一个例子,且该术语仅用来表达图像的表示或者描述符。
本领域技术人员将能理解,根据本发明的实施方式的图像识别装置和方法的具体设计细节以及图像识别中使用的图像标识符的导出由与图像修改类型相关的要求决定,其对标识符的大小、提取及匹配的复杂度、目标虚警率等应当是鲁棒的。
以下示例示出了一般性设计,其导致对图像的以下修改具有鲁棒性的标识符(非详尽的列表):
·颜色缩减,
·模糊,
·亮度变化,
·(左-右&上-下)翻转,
·灰度级转换,
·直方图均衡,
·JPEG压缩,
·噪声,
·旋转,
·裁剪,
·缩放,
·平移,
·倾斜,以及
·视角转变。
已经发现,所提出的设计通常可以在广泛的图像类别上实现低于百万分(ppm)之10的低虚警率以及通常高于95.0%的检测率。
图1示出了一幅图像的示例以及所述图像的修改版本。更具体地,图1a是初始图像,图1b是图1a所示图像的缩小(缩放)版本,图1c是图1a所示图像的旋转版本,图1d是图1a所示图像的模糊版本,图1e是图1a所示图像的翻转版本,图1f是图1a所示图像的压缩版本,而图1g是图1a所示图像的裁剪版本。
本发明一种实施方式通过处理与图像对应的信号和/或图像数据而导出图像的表示,更具体地,导出图像标识符。
与EP 06255239.3、GB 0700468.2、GB 0712388.8以及GB 0719833.6一致,在提取图像标识符的初始阶段,可选地,通过大小调整以及滤波来对所述图像进行预处理。大小调整的步骤用来在进行处理之前对所述图像进行归一化。滤波的步骤可包括用于去除诸如混叠之类效应的滤波,其还可以包括区域选择和逐渐缩减(tapering)。在一种实施方式中,将图像大小调整为192×N或者N×192的分辨率,其中N≥192,并保持此纵横比。在另一种实施方式中,将所述图像大小调整为192×192的正方形。然后,利用3×3高斯核对所述图像进行低通滤波。从图像中心提取圆形区域,以便进一步处理。所述预处理步骤是可选的,可包括以上步骤的任意组合。
在接下来的阶段,检测图像中的兴趣点。一种实施方式使用特征检测器基于对图像梯度的测量来检测图像中的潜在特征及其强度。一种合适的图像梯度特征检测器是Harris特征检测器。图3示出了将Harris特征检测器施加于图2所示图像的示例结果。应用一种选择过程来选取代表性特征集。在一种实施方式中,选取多达16个特征。在图像中特征未被选择的边缘附近设置边界,在本实施方式中,所述边界宽度为16个像素。首先从所检测到的特征中选择可允许特征中的最强特征。在如下约束下按强度顺序选择随后的特征:如果一个特征位于先前选择的特征周围的禁区(exclusion zone)内,则不选择该特征。在一种实施方式中,使用半径为10个像素的圆形区域作为所述禁区。一旦已经选择了预定数量的代表性特征(例如,在所述优选实施方式中为16个像素),或者不再有特征剩余,则所述选择过程终止。图4示出了从图3中检测到的那些特征中选择的特征集合。
既然已经选择了特征(或兴趣)点的位置,优选地,例如利用诸如OpenCV(FindCornerSubpix)03/01/2008中描述的方法将它们的位置细化到亚像素分辨率(sub-pixel resolution),其可在互联网上从http://opencvlibrary.sourceforge.net/CvReference(参见参考文献[1])处获得。
在通过引用并入本文的GB 0719833.6中,公开了一种提取二进制图像签名或者图像表示的方法。在本发明的一种实施方式中,应用GB0719833.6所述的方法从特征点周围的区域提取二进制“特征签名”。
因而,各个特征签名是与检测到的特征相关联的图像区域的二进制表示。在一种实施方式中,选择以特征点为中心且半径为32个像素的圆形图像区域,并对所述图像区域计算二进制签名。优选地,例如利用三次插值以亚像素级的准确率提取所述圆形区域。然后,利用根据GB0719833.6所述的方法对所提取的区域进行处理,以导出相应的图像标识符。以下提供此方法的简要概述。
通过在所述图像上将利用d、θ参数化的所有可能的直线进行投影并在这些直线上应用第一泛函T来对所述图像区域进行Trace变换T(d,θ)。可以根据GB 0700468.2中公开的方法对所述Trace变换的结果进行分解,以便减小其在d、θ维度之一或二者中的分辨率。与EP 06255239.3和GB0700468.2所述的方法一样,可以将第二泛函P应用于所述Trace变换的列,以便给出实数向量(即,一个一维函数)。此第二泛函被称为直径泛函(diametrical functional),而所得到的向量被称为圆函数(circus function)。
尽管所述优选实施方式中没有使用以下步骤,但仍可将第三泛函(即,圆泛函)应用于所述圆函数,以便给出单个数字。
或者,根据GB 0719833.6所述的方法,可以得到所谓的“带圆(band-circus)”函数作为以上讨论的圆函数的替换,通过选择并处理仅来自于所述Trace变换的一部分的值,将所述Trace变换限制在所述图像的线的子集上。
可以通过适当地选择第一、第二和/或第三泛函(Trace泛函、直径泛函以及圆泛函)来控制所述结果的性质。
经由频率表示而从圆函数(或者带圆函数)提取图像区域的二进制标识符。例如,可以对傅里叶变换的幅度系数来定义函数c(ω)。此函数的一个例子是取相邻系数之差
c(ω)=|F(ω)|-|F(ω+1)|。
可以通过将阈值应用于所得到的向量来提取二进制串,使得
Figure BPA00001182192600071
对于所有ω
S的合适选择包括S=0和S=mean(c)。然后,图像区域的二进制表示由这些二进制串值B={b0,...,bn}组成。
在本发明的一种实施方式中,由于使用了局部图像区域(与在GB0719833.6中使用整个图像不同),需要对此里描述的签名提取技术进行一些修改。具体地,根据EP 06255239.3中公开的方法,利用以下泛函从完全Trace变换的圆函数提取出两个标识符:
max(ξ(t))                                        (1)
以及
∫|ξ(t)′|dt。                                   (2)
根据GB 0700468.2中公开的方法,可以通过利用因子8、16和32分解(或降采样(sub-sample))Trace变换的距离(d)参数并应用(1)和(2),从这样得到的圆函数提取另外的六个“多分辨率”标识符。
根据GB 0712388.8中公开的方法从Trace变换的频带中选择另外的三个函数,并且根据GB 0719833.6中公开的方法,从所述迹环函数(trace-annulus function)提取两个函数并从所述迹圆函数(trace-circular function)提取一个函数。
已经知道各个特征标识符总共为112比特,那么,这14个组成标识符中的每一个均为8比特。将特征点(在预处理后的图像中)的坐标与所述标识符一起存储,作为关于相应特征/图像区域的几何信息。可选地,可以选择或者导出这112个比特的子集。
可以用多种方式表示完整的特征点集合。在所述优选实施方式中,图像描述符是包含多个信息字段的比特流,第一字段是特征数量。然后,在所述标识符之后,在比特流中各个特征被表示为特征点坐标(x和y)。可选地,并不存储特征数量,而是采用填充(padding)方式,设置一个标志来表示未使用的字段。
如上所述,图像特征之间的完全匹配过程涉及两个阶段。
第一个阶段涉及将来自一个图像的所有特征与来自第二图像的所有特征进行比较。为了在长度均为N的两个特征签名B1和B2之间执行匹配,采用Hamming距离:
H ( B 1 , B 2 ) = Σ B 1 ⊗ B 2 - - - ( 3 )
其中,是异或(XOR)算子。
在一种实施方式中,找到了具有最小Hamming距离H的三个唯一的对,并且两个图像之间基于特征的累计Hamming距离是三个单独Hamming距离之和。
第二步涉及应用几何约束来确定所述图像是真正匹配还是虚假匹配。与Hamming距离相比,应用几何约束在计算上代价相对较大。为了最小化复杂度,利用所述几何方法仅比较累计Hamming距离小于预定的潜在匹配阈值的图像对。在一种可能的实施方式中,选取三个特征点(a、b和c)的集合。利用这三个点,可以使用所述特征之间的线段长度比作为约束,如图5所示。通过利用标识符中相关联的坐标信息找到该集合的这三个特征点之间的欧氏距离ab、ac和bc来计算线段长度比。找到了两个线段长度比
L 1 = ab ac ,
以及
L 2 = ab bc .
来自图像A和B的线段长度比之间的距离度量定义为:
G 1 = | L 1 A - L 1 B | L 1 A + L 1 B , G 2 = | L 2 A - L 2 B | L 2 A + L 2 B .
有利地,图像中所定义的点之间的线段长度比对于诸如旋转、平移和缩放等变换是不变的,从而以上几何约束适于对经历了这样的几何变换的图像进行匹配。然而,可以根据设计要求而使用其他合适的几何约束。
在一种实施方式中,将两个阈值应用于所述距离测量,一个阈值用来限制单个测量值的幅度,而另一个阈值用来限制距离之和。
或者,可以利用累计(和/或成对的)Hamming距离约束来预先选择三个特征点对的多个候选集。然后,依次将所述几何约束应用于各个候选集(可能例如按照累计Hamming距离进行了排序),直到找到了几何匹配并且不再有候选集剩余。
如上所述的本发明的图像匹配技术可以与诸如GB 0719833.6中公开的方法的其他图像匹配技术相结合。对于包含所有单个标识符的每个图像产生一个描述符。在所述优选实施方式中,所述标识符比特流包含基于GB 0719833.6的两个标识符以及本发明的描述符。在基于GB0719833.6的这两个标识符中,第一个是通过对图像进行用于维持图像纵横比的预处理而生成,而另一个被处理成正方形。
优选地,首先利用GB 0719833.6的较快算法以非常低的虚警阈值执行所述匹配。低于该阈值的任何图像对均被视为一个匹配,然后,根据本发明对高于所述阈值(即,不被GB 0719833.6认为是一个匹配)的对进行处理。首先,应用累计Hamming距离,高于所述阈值的三个对的集合被认为是不同的(不匹配)。对低于所述累计Hamming距离阈值的三个对的集合应用几何约束。如果所述三个对的集合的几何度量低于所述几何度量的阈值水平,则认为所述图像对是一个匹配;否则,认为它们不同。
图6示出了根据一种实施方式的用于执行上述方法的实现本发明的装置。所述实现涉及为图像数据库230中存储的图像建立标识符数据库240。所述两个数据库230和240可以是相同的数据库,也可以是单独的数据库。所述装置使得可以搜索从查询图像250中提取出的标识符260,从而在标识符数据库140中找到匹配。将可能经过了排序的图像列表返回给用户290或者返回给查询应用。
本领域技术人员将理解,可以对上述实施方式进行多种改变和修改。例如,虽然所述的实施方式是基于特征检测而对导出了图像签名的图像区域进行识别,但是,也可以使用其他技术来识别代表所述图像的图像区域或者所述图像内部重要的图像区域。并且,尽管所述实施方式使用基于图像梯度方法的特征检测器,但是,也可以使用很多其他合适的方法对图像中的兴趣点或区域进行检测。类似地,也可以使用其他技术来选择最佳或所最强的检测到的特征或兴趣点。
此外,可以使用除所述实施方式中使用的关于与三个特征点的集合相关联的线段长度比的距离度量之外的各种几何约束中的一种或更多种。例如,可以结合距离度量使用任何数量个特征点。或者,其他几何约束可以基于特征点之间的角度。并且,可以使用仿射模型来限定所述几何约束。
旨在包括落入本发明的精神和范围之内的所有这样的变型、修改和等同方式。
参考文献
[1]OpenCV Reference Manual,Chapter 1:Image Processing Gradients,Edge and Corners-″FindCornerSubPix″http://opencvlibrary.sourceforge.net/CvReference

Claims (35)

1.一种通过处理对应于图像的信号来导出该图像的表示的方法,该方法包括以下步骤:
识别所述图像的多个区域,其中,各个区域对于所述图像具有代表性或者有重要意义;以及
对于所识别出的各个图像区域:
导出所述图像区域的至少一部分的函数;并且
使用所述函数得到所述图像区域的所述至少一部分的中间表示,以及
由所述多个图像区域中的两个或者多个图像区域的中间表示导出所述图像的表示。
2.根据权利要求1所述的方法,该方法包括以下步骤:
对于所识别出的各个图像区域:
导出所述图像区域的函数,其中,所述图像的经过平移、缩放或旋转后的版本的所述函数是所述图像区域的函数的经过平移或缩放后的版本。
3.根据权利要求1或权利要求2所述的方法,其中,该识别所述图像的多个区域的步骤包括以下步骤:
识别所述图像的特征,以及
选择与所述图像的识别出的特征相对应的图像区域。
4.根据权利要求3所述的方法,其中,该选择图像区域的步骤包括以下步骤:
根据特征强度选择所述图像的多个所识别出的特征,以及
确定与所选择的多个所识别出的特征相对应的图像区域。
5.根据权利要求3或权利要求4所述的方法,其中,所述图像区域基于围绕图像特征的预定图像范围。
6.根据权利要求3、4或5所述的方法,其中,该选择图像区域的步骤包括以下步骤:
根据在图像中的位置而选择与所述图像的识别出的特征相对应的多个图像区域。
7.根据权利要求6所述的方法,其中,所选择的多个图像区域大致分布在整个图像上。
8.根据权利要求6或权利要求7所述的方法,其中,各个所选择的图像区域对应于在所述图像中与所选择的其他图像区域的特征至少分隔开预定距离的特征。
9.根据权利要求3至8中任意一项所述的方法,其中,该识别所述图像的特征的步骤使用灰度图像梯度法来检测特征。
10.根据前述权利要求中任意一项所述的方法,其中:
该导出所述图像区域的至少一部分的函数的步骤包括以下步骤:沿着所述图像区域上的直线应用第一泛函;
所述方法进一步包括以下步骤:
对所导出的函数应用第二泛函,以得到所述图像区域的所述至少一部分的中间表示。
11.根据前述权利要求中任意一项所述的方法,其中所述中间表示是一维函数。
12.根据前述权利要求中任意一项所述的方法,其中该从两个或更多个所述图像区域的所述中间表示导出所述图像的表示的步骤包括以下步骤:
由所述图像区域的所述中间表示导出各个图像区域的表示,以及
利用图像区域的多个所导出的表示而导出所述图像的表示。
13.根据权利要求12所述的方法,其中,由所述图像区域的所述中间表示导出各个图像区域的表示的步骤包括以下步骤:
利用所述中间表示的频率表示的多个频率分量处理所述图像区域的所述至少一部分的所述中间表示。
14.根据前述权利要求中任意一项所述的方法,其中,该导出所述图像的表示的步骤包括以下步骤:
对由所选择的多个识别出的图像区域的相应中间表示导出的这些图像区域的表示的所选择的部分进行组合。
15.根据前述权利要求中任意一项所述的方法,其中,由所述多个图像区域中的两个或更多个图像区域的所述中间表示导出所述图像的表示的步骤使用预定数量的图像区域的中间表示,其中,所述预定数量优选地在2至256的范围内。
16.根据前述权利要求中任意一项所述的方法,该方法进一步包括以下步骤:
将关于各个图像区域的几何信息与所识别出的图像区域的所导出的表示关联起来。
17.一种图像识别方法,该方法包括以下步骤:
利用前述权利要求中任意一项所述的方法导出所述图像的表示,以及
将所述表示与所述图像关联起来。
18.一种图像比较方法,该方法包括以下步骤:利用前述权利要求中任意一项所述的方法导出各个图像的表示。
19.根据权利要求18所述的图像比较方法,该方法包括以下步骤:
将第一图像的表示所关联的图像区域与第二图像的表示所关联的图像区域进行比较。
20.根据权利要求19所述的方法,该方法包括以下步骤:
利用第一图像和第二图像的表示来确定所述第一图像的图像区域的表示与所述第二图像的图像区域的表示之间的Hamming距离,以及
如果对应图像区域的表示之间的Hamming距离低于第一预定阈值,则将所述第一图像和所述第二图像识别为潜在匹配。
21.根据权利要求20所述的方法,该方法包括以下步骤:确定所述第一图像及所述第二图像的多个图像区域的表示的Hamming距离。
22.根据权利要求21所述的方法,该方法进一步包括以下步骤:
识别所述第一图像和所述第二图像的预定数量的图像区域对,所识别出的对的相应表示具有低于所述第一预定阈值的所确定的最小Hamming距离。
23.根据权利要求22所述的方法,其中,所识别出的图像区域对中的各个区域是唯一的。
24.根据权利要求21、22或23所述的方法,该方法进一步包括以下步骤:
利用所识别出的图像区域对的表示的Hamming距离之和确定累计Hamming距离,以及
如果所识别出的图像区域对的表示的累计Hamming距离低于第二预定阈值,则将所述第一图像和所述第二图像识别为潜在匹配。
25.根据权利要求20至24中任一项所述的方法,该方法包括以下步骤:
对确定为可能匹配的多对图像区域对的或图像的几何信息应用几何约束,以确定所述图像是否匹配。
26.根据权利要求25所述的方法,其中,该应用几何约束的步骤包括以下步骤:
确定所述第一图像中的预定数量的图像区域之间的第一距离比;
确定所述第二图像中的预定数量的图像区域之间的第二距离比;以及
如果所述第一比与所述第二比之差低于第三预定阈值,则确定所述第一图像和所述第二图像为匹配。
27.根据权利要求26所述的方法,其中,所述预定数量是三个。
28.根据权利要求27所述的方法,其中,该应用几何约束的步骤包括以下步骤:
对于各个所述第一图像和所述第二图像:
利用下式计算对应于三个图像区域的点(a、b、c)之间的欧氏
距离之比:
L 1 = ab ac , L 2 = ab bc , 以及
利用下式测量所述第一图像和第二图像(A,B)的线段长度比(L1,L2)之间的距离:
G 1 = | L 1 A - L 1 B | L 1 A + L 1 B , G 2 = | L 2 A - L 2 B | L 2 A + L 2 B .
29.根据权利要求28所述的方法,其中,所述第三阈值包括针对G1,G2和G1+G2中的一个或更多个的阈值。
30.根据权利要求18至权利要求29中任意一项所述的方法,该方法包括以下步骤:基于对表示的比较从所述多个图像中选择匹配图像。
31.利用根据权利要求1至29中任意一项的方法导出的表示的使用,该使用例如是发送或接收。
32.用于执行根据权利要求1至29中任意一项的方法的装置。
33.根据权利要求30所述的装置,该装置包括控制设备,所述控制设备对执行根据权利要求1至29中任意一项所述的方法的设备的操作进行控制。
34.根据权利要求31所述的装置,该装置进一步包括用于存储图像和/或图像的表示的一个或更多个存储单元、显示单元以及图像选择单元,所述存储单元例如是图像数据库和/或描述符数据库。
35.一种包括指令的计算机存储介质,当所述指令由计算机执行时,实现根据权利要求1至29中任意一项所述的方法。
CN200880124438.3A 2008-01-09 2008-06-30 用于图像识别的基于特征的签名 Active CN101911100B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB0800364.2A GB0800364D0 (en) 2008-01-09 2008-01-09 Feature-based signatures for image identification
GB0800364.2 2008-01-09
PCT/GB2008/002262 WO2009087340A1 (en) 2008-01-09 2008-06-30 Feature-based signatures for image identification

Publications (2)

Publication Number Publication Date
CN101911100A true CN101911100A (zh) 2010-12-08
CN101911100B CN101911100B (zh) 2015-08-26

Family

ID=39144682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880124438.3A Active CN101911100B (zh) 2008-01-09 2008-06-30 用于图像识别的基于特征的签名

Country Status (7)

Country Link
US (1) US8660385B2 (zh)
EP (1) EP2240887B1 (zh)
JP (1) JP5431362B2 (zh)
KR (1) KR101506060B1 (zh)
CN (1) CN101911100B (zh)
GB (1) GB0800364D0 (zh)
WO (1) WO2009087340A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104520878A (zh) * 2012-08-07 2015-04-15 Metaio有限公司 提供用于描述对象表示的至少一个特征的特征描述符的方法
CN105074729A (zh) * 2012-12-26 2015-11-18 微软技术许可有限责任公司 光度边缘描述
CN108596883A (zh) * 2018-04-12 2018-09-28 福州大学 一种基于深度学习和距离约束的航拍图像防震锤滑移故障诊断方法
CN113095156A (zh) * 2021-03-23 2021-07-09 西安深信科创信息技术有限公司 一种基于逆灰度方式的双流网络签名鉴定方法及装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0807411D0 (en) 2008-04-23 2008-05-28 Mitsubishi Electric Inf Tech Scale robust feature-based indentfiers for image identification
KR101355299B1 (ko) * 2009-04-14 2014-01-23 닛본 덴끼 가부시끼가이샤 이미지 시그니처 추출 장치
JP5862413B2 (ja) 2012-03-28 2016-02-16 富士通株式会社 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法
US9977499B2 (en) 2012-05-09 2018-05-22 Apple Inc. Thresholds for determining feedback in computing devices
WO2014138745A2 (en) * 2013-03-08 2014-09-12 Curalate, Inc. Method and system for clustering and classifying online visual information
US9939901B2 (en) 2014-09-30 2018-04-10 Apple Inc. Haptic feedback assembly
US10031925B2 (en) * 2014-10-15 2018-07-24 Thinkcx Technologies, Inc. Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph
US9390315B1 (en) * 2015-06-25 2016-07-12 A9.Com, Inc. Image match for featureless objects
KR101963446B1 (ko) 2018-10-18 2019-03-28 남양진흥기업(주) 터널 시공방법 및 그 구조

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330414A (ja) * 1996-06-12 1997-12-22 Yoshihiko Nomura 画像マッチング方法およびその装置
CN1588424A (zh) * 2004-07-02 2005-03-02 清华大学 基于断纹检测的指纹识别方法
CN1776716A (zh) * 2004-04-27 2006-05-24 微软公司 使用多尺度取向片段的多图像匹配

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7375745B2 (en) * 2004-09-03 2008-05-20 Seiko Epson Corporation Method for digital image stitching and apparatus for performing the same
US7570794B2 (en) * 2005-09-02 2009-08-04 Gm Global Technology Operations, Inc. System and method for evaluating a machined surface of a cast metal component
EP1912160B1 (en) 2006-10-11 2012-05-16 Mitsubishi Electric R&D Centre Europe B.V. Image descriptor for image recognition
GB0700468D0 (en) 2007-01-10 2007-02-21 Mitsubishi Electric Inf Tech Improved image identification
GB0712388D0 (en) 2007-06-26 2007-08-01 Mitsubishi Electric Inf Tech High Performance Image Identification
GB0719833D0 (en) 2007-10-10 2007-11-21 Mitsubishi Electric Inf Tech Enhanced image identification

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330414A (ja) * 1996-06-12 1997-12-22 Yoshihiko Nomura 画像マッチング方法およびその装置
CN1776716A (zh) * 2004-04-27 2006-05-24 微软公司 使用多尺度取向片段的多图像匹配
CN1588424A (zh) * 2004-07-02 2005-03-02 清华大学 基于断纹检测的指纹识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104520878A (zh) * 2012-08-07 2015-04-15 Metaio有限公司 提供用于描述对象表示的至少一个特征的特征描述符的方法
CN105074729A (zh) * 2012-12-26 2015-11-18 微软技术许可有限责任公司 光度边缘描述
CN105074729B (zh) * 2012-12-26 2019-07-05 微软技术许可有限责任公司 用于光度边缘描述的方法、系统和介质
CN108596883A (zh) * 2018-04-12 2018-09-28 福州大学 一种基于深度学习和距离约束的航拍图像防震锤滑移故障诊断方法
CN113095156A (zh) * 2021-03-23 2021-07-09 西安深信科创信息技术有限公司 一种基于逆灰度方式的双流网络签名鉴定方法及装置
CN113095156B (zh) * 2021-03-23 2022-08-16 西安深信科创信息技术有限公司 一种基于逆灰度方式的双流网络签名鉴定方法及装置

Also Published As

Publication number Publication date
US20110038541A1 (en) 2011-02-17
GB0800364D0 (en) 2008-02-20
US8660385B2 (en) 2014-02-25
CN101911100B (zh) 2015-08-26
JP2011511340A (ja) 2011-04-07
EP2240887A1 (en) 2010-10-20
JP5431362B2 (ja) 2014-03-05
KR20100112155A (ko) 2010-10-18
WO2009087340A1 (en) 2009-07-16
EP2240887B1 (en) 2014-01-01
KR101506060B1 (ko) 2015-03-25

Similar Documents

Publication Publication Date Title
CN101911100B (zh) 用于图像识别的基于特征的签名
KR101649766B1 (ko) 이미지 식별을 위한 스케일 안정적 특징-기반 식별자
Kuznetsov Digital image forgery detection using deep learning approach
Lee Copy-move image forgery detection based on Gabor magnitude
Hashmi et al. Copy-move image forgery detection using an efficient and robust method combining un-decimated wavelet transform and scale invariant feature transform
US9552642B2 (en) Apparatus and method for tracking object using feature descriptor, and apparatus and method for removing garbage feature
US20160253359A1 (en) Efficient image matching for large sets of images
Al-Qershi et al. Enhanced block-based copy-move forgery detection using k-means clustering
Thajeel et al. A Novel Approach for Detection of Copy Move Forgery using Completed Robust Local Binary Pattern.
CN101821753A (zh) 增强的图像识别
Abir et al. An automatic enhanced filters with frequency-based copy-move forgery detection for social media images
Nawaz et al. Image authenticity detection using DWT and circular block-based LTrP features
Chalamalasetty et al. Research perception towards copy-move image forgery detection: challenges and future directions
Sreelakshmy et al. An improved method for copy-move forgery detection in digital forensic
Sujin et al. Copy-Move Geometric Tampering Estimation Through Enhanced SIFT Detector Method.
Cyganek Road signs recognition by the scale-space template matching in the log-polar domain
CN114266703A (zh) 一种图像拼接方法和系统
Yan et al. Adaptive local feature based multi-scale image hashing for robust tampering detection
Dixit et al. Detection of copy-move forgery exploiting LBP features with discrete wavelet transform
Soni et al. Image Copy-Move Forgery Detection
Zhao et al. An overview on passive image forensics technology for automatic computer forgery
Mahdi et al. A Review Study on Forgery and Tamper Detection Techniques in Digital Images
KOSHY et al. Detection of Copy Move Forgery Using Rootsift and Feature Point Matching
Tembe et al. Copy-paste forgery detection in digital image forensic
Vhanmane et al. A Survey on Accurate and Efficient Image Forgery Detection Using SIFT Descriptor to Improve Detection Accuracy

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190606

Address after: Tokyo, Japan, Japan

Patentee after: Rakuten Inc.

Address before: Tokyo, Japan, Japan

Patentee before: Mitsubishi Electric Corporation

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: Tokyo, Japan

Patentee after: Lotte Group Co.,Ltd.

Address before: Tokyo, Japan

Patentee before: Rakuten, Inc.

CP01 Change in the name or title of a patent holder