CN101821753B - 增强的图像识别 - Google Patents

增强的图像识别 Download PDF

Info

Publication number
CN101821753B
CN101821753B CN2008801110872A CN200880111087A CN101821753B CN 101821753 B CN101821753 B CN 101821753B CN 2008801110872 A CN2008801110872 A CN 2008801110872A CN 200880111087 A CN200880111087 A CN 200880111087A CN 101821753 B CN101821753 B CN 101821753B
Authority
CN
China
Prior art keywords
image
value
parameter
dimensional representation
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008801110872A
Other languages
English (en)
Other versions
CN101821753A (zh
Inventor
保罗·布拉斯尼特
米罗斯瓦夫·博贝尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lotte Group Co.,Ltd.
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN101821753A publication Critical patent/CN101821753A/zh
Application granted granted Critical
Publication of CN101821753B publication Critical patent/CN101821753B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/48Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

描述了一种用于导出图像的表示的方法。该方法包括对与该图像相对应的信号进行处理的步骤。导出该图像的三维表示。使用该图像的三维表示导出该图像的表示。在一个实施方式中,图像的各直线由第一参数(d)和第二参数(θ)限定,各直线上的位置由第三参数(t)限定,并且该三维表示由该第一、第二和第三参数进行参数化。以第一参数的值从该三维表示中提取值的集合,并且沿着所提取值的集合的直线(或者直线的几部分)应用泛函,这些直线沿着第二或第三参数的值延伸。

Description

增强的图像识别
技术领域
本发明涉及用于表示图像的方法和装置,此外,还涉及例如为了搜索或验证而比较或匹配图像的方法和装置。
背景技术
本发明涉及从图像的迹变换(trace transform)中提取特征的新方法,该新方法对在共同待审欧洲专利申请EP 06255239.3、共同待审UK专利申请GB 0700468.2以及GB 0712388.8中描述的图像识别方法及装置进行了改进。以引证方式将EP 06255239.3、GB 0700468.2和GB 0712388.8中的内容合并与此,其中描述的发明细节和实施方式也同样适用于本发明和实施方式。
EP 06255239.3、GB 0700468.2和GB 0712388.8中描述的各图像识别方法和装置从图像中提取短的二进制描述符(参见图2),从而解决了现有技术的许多缺陷,具体而言,其特征在于,
●减少了特征提取和匹配的计算复杂度,
●减小了图像描述符的尺寸,
●增大了对各种图像修整的鲁棒性,以及
●将虚警率减小至0.1ppm的水平,而同时对广泛的图像修整仍维持99.8%的检测率。
但是,在实际应用中,期望虚警率低于0.1ppm并且期望检测率维持在或者高于99.8%。还期望在更困难的测试条件下(包括复杂的图像修整)维持该性能水平。
发明内容
根据第一方面,本发明提供了一种由所附权利要求1或21所限定的、用于导出图像的表示的方法。
根据第二方面,本发明提供了一种通过对根据本发明的第一方面导出图像的表示进行比较的图像比较(例如用于图像匹配)方法。
本发明的其它方面包括根据本发明的第一方面导出的图像表示的使用方法、以及用于执行根据本发明的第一和/或第二方面的方法的装置和计算机程序。
本发明涉及从图像的迹变换(或图像的等效的二维函数)提取特征的新方法。如本领域所公知的,迹变换对图像上的所有可能的直线进行投影,并且该表示已用于专利申请EP 06255239.3、GB 0700468.2和GB0712388.8所公开的技术中。
所描述的本发明的实施方式通过从图像提取圆信息而扩展了现有技术。可以在执行迹变换的同时,非常有效地提取该圆信息。
在EP 06255239.3、GB 0700468.2和GB 0712388.8中,通过沿着计算图像强度的特定泛函T或色彩函数时的直线对图像进行追踪来计算迹变换。泛函是矢量空间V上的实值函数,通常由函数组成。在迹变换的情况下,将泛函应用于图像中的直线上。对于给定的输入图像,使用不同的泛函T产生了不同的迹变换。因为在2D平面中,直线由角度θ和距离d两个参数来表征,所以图像的迹变换是各个迹线的参数的2D函数。接着,通过沿着迹变换的距离参数应用直径泛函(diametrical functional)P来计算圆函数。
在EP 06255239.3中,通过(例如,借助于傅里叶变换)计算圆函数的频率表示、以及通过取在频率幅度分量上定义的特定函数(例如,该函数可以是任意两个相邻频率幅度的幅度差)的符号(sign)来构造分量二进制识别符。
在GB 0700468.2中,另外利用条(strip)和/或双锥(double cone)对图像进行追踪。使用不同宽度的条和/或不同张开角的锥获得迹变换的多分辨率表示并由此而获得圆函数。如EP 06255239.3中那样从各个圆函数提取二进制识别符。在GB 0712388.8,使用迹域中的空间受限的区域(带)来计算圆函数,这些空间受限的区域对应于图像域的锥。同样地,通过计算频率表示来构造分量二进制识别符。通过将从一“族”分量识别符中选择的串片段(string fragment)组合为单个描述符而获得该识别符,该“族”分量识别符是利用条和/或双锥和/或不同空间受限带使用不同泛函得到的。
附图说明
将参照附图描述本发明的实施方式,在附图中:
图1a示出了一幅图像;
图1b示出了缩小版本的图1a的图像;
图1c示出了旋转版本的图1a的图像;
图1d示出了模糊版本的图1a的图像;
图1e示出了翻转(左-右)版本的图1a的图像;
图1f示出了大幅度压缩版本的图1a的图像;
图1g示出了剪切后(Cropped)版本的图1a的图像;
图2示出了一幅图像以及根据现有技术的位串表示;
图3是例示了二进制识别符提取的图;
图4是例示了迹变换的直线参数化(line parameterisation)的图;
图5示出了根据角度θ、距离d以及直线上的位置t的图像的3D表示,此处称作“迹立方体(trace-cube)”;
图6示出了如何通过沿着成角度θ的直线应用泛函以获得与图像中的圆有关的信息,从而在迹立方体中提取与图像域中的圆信息(circularinformation)等效的信息;1D迹圆函数位于直线t上与该圆的半径对应的位置处;
图7示出了可以从迹立方体中获得的其他圆信息,通过沿着线位置t中的间隔应用泛函,可以获得关于图像中的圆带(circular band)的信息;以及
图8是根据本发明的一个实施方式的装置的框图。
具体实施方式
下面将描述用于得到图像表示(具体地说为图像识别符)以及使用这种表示/识别符进行例如一个或多个图像的识别、匹配或验证的各种实施方式。本发明尤其适用于(但不限于)图像识别。在所描述的实施方式中,“图像识别符”(或简称为“识别符”)是图像表示的一个示例,该术语仅仅用于代表图像表示或描述符。
本领域的技术人员应了解,根据本发明的实施方式,图像识别装置和方法的具体设计细节、以及得到图像识别符以用于图像识别是由与图像修整的类型有关的需求决定的,其应当对识别符的尺寸、提取和匹配复杂度、目标虚警率等具有鲁棒性。
在实施方式中,本发明包括(i)将迹变换扩展到3维(此处称作“迹立方体”),(ii)一种新类别的有效圆图像特征,(iii)从迹立方体中进行特征提取的方法,以及(iv)特征匹配的方法。根据本发明的一个方面,当执行图像的迹变换时,除了在迹变换中常规使用的参数d、θ以外,通过引入表示沿着迹线位置的附加参数t来获得图像的3D表示。根据本发明的另一个方面,从三维结构中截取片段(slice)以生成中间表示,即,所提取的三维结构的值的集合。根据本发明的另一个方面,在d=0处截取片段,并且提取两种类型的圆信息,将其用于创建识别符。
下面的例子例示了产生识别符的一般设计,该识别符对图像的下述修整(其并非穷举列表)具有鲁棒性:
色彩减退,
模糊,
亮度变化,
翻转(左-右&上-下),
灰度转换,
直方图均衡(Histogram Equalisation),
JEPG压缩,
噪声,
旋转,
剪切(cropping)以及
缩放。
已发现该一般设计在广泛类别的图像上能够实现小于百万分之0.05(0.05ppm)的极低虚警率,并且检测率通常在99.7%以上。
图1示出了一个图像以及该图像的修改版本的示例。更具体地说,图1a是原始图像,图1b是缩小版本的图1a的图像,图1c是旋转版本的图1a的图像,图1d是模糊版本的图1a的图像,图1e是翻转版本的图1a的图像,图1f示出了压缩版本的图1a的图像,而图1g是剪切版本的图1a的图像;
本发明的一个实施方式通过处理与图像对应的信号而导出该图像的表示,更具体地说,导出图像识别符。
在提取的初始阶段,可选地通过改变尺寸和滤波对图像进行预处理。改变尺寸步骤用于在处理之前对图像进行归一化。滤波步骤可包括进行滤波以去除诸如混淆之类的影响,其还可以包括区域选择和锥削(tapering)。在优选的实施方式中,将图像尺寸改变为分辨率192×N或N×192,其中,N≥192,并且保持纵横比(aspect ratio)。在另一个实施方式中,将图像尺寸改变为192×192的方形。然后通过3×3的高斯核对该图像进行低通滤波。从该图像的中央提取出一个圆形区域用于后续处理。对于某些转换,通过在提取该圆形中央区域时使用圆锥形边缘(tapered edge)来改善性能。优选的实施方式使用7个像素的圆锥尺寸。预处理步骤是可选的,并且可以包括以上的任意组合。可以使用另选的值,例如,不同的图像尺寸改变或不同的高斯核尺寸。
迹变换对图像上所有可能的直线进行投影,并对这些直线应用泛函。泛函是矢量空间V上的实值函数,通常由多个函数组成。在迹变换的情况下,将泛函应用于图像中的直线。如图4所示,直线被参数化为距离d、角度θ以及直线上的位置t。可以将另一个泛函应用于迹变换的列以给出实数的矢量。该第二个泛函称为直径泛函(diametrical functional),所得到的矢量称为圆函数(circus function)。可以将第三个泛函即圆泛函应用于该圆函数以给出单个数。可以通过适当选择三个不同泛函(迹泛函、直径泛函和圆泛函)来控制该结果的特性。在例如以下参考文献[1]中可以得到迹变换的全部细节(包括图像和相应的迹变换的示例),以引证方式将其合并与此。
尽管迹变换涉及从图像中提取直线,但是可以将迹变换的概念及其提取步骤扩展以有效地从图像中提取出一些圆信息。根据本发明,按照图5所示的参数d、θ和t来生成图像的3D表示。这里将该新的表示(其是3D体积)称作“迹立方体”。迹立方体承载了比常规迹变换多得多的信息,包括与图像的非线性区域(诸如圆或椭圆)有关的信息。根据本发明的一个实施方式,在d=0的位置处从迹立方体截取一个片段,使得能够提取两种类型的圆信息。
如图6所示,第一类型信息的提取步骤沿着θ参数来应用泛函,这等效于在图像域中围绕着圆来应用该泛函。所得到的是关于在直线上的位置t的一维函数,在这种情况下,t与圆的半径有关。这里,该函数被称作迹圆(trace-circular)。
如图7所示,第二类型的圆信息涉及图像域中的圆区域。通过以间隔t0≤|t|≤t1仅对直线的一部分应用泛函,我们得到关于角度θ的一维信号。虽然图7示出了t0=0,但这并不是必需的,采用更大的值t0>0将给出圆环(annulus)。该圆环由两个同心圆组成。该值t0和t1定义了同心圆的半径。该函数被称作迹环(trace-annulus)。
实际上,离散数据d=0有可能是不可用的,在该情况下,可以使用与+/-Δd对应的两个片段。通过例如针对两个片段将所得到的迹圆或迹环加在一起而将这两个片段组合。
在该方法的一个特殊的例子中,泛函由下式给出
∫ξ(t)dt,    (1)
但是,如本领域技术人员所理解的,可以根据特定的应用需求而使用其它类型的泛函。
然后,利用与专利申请EP 06255239.3、GB 0700468.2和GB0712388.8中描述的方法类似的方法,将根据本发明提取的迹环函数和迹圆函数转换成二进制识别符,出于完整性的目的而将在下面进行描述。
对于上面列出的许多图像修整操作,通过适当选择泛函,图像a的迹环函数或迹圆函数f(a)仅仅是修整后图像a’的函数f(a’)的经平移或(在幅度上)缩放后的版本
f(a′)=κf(a-θ)          (2)
然后,通过对式2进行傅里叶变换,可以得到
F(Φ)=F[κf(a-θ)]        (3)
     =κF[f(a-θ)]        (4)
     =κexp-jθφF[f(a)]  (5)
然后,取式5的幅度得到
|F(Φ)|=|κF[f(a)]|        (6)
从式6中可以看出,现在,除了缩放因子κ以外,修整后的图像与原始图像等效。
图3示出了对傅里叶变换系数定义二进制函数的方法。具体而言,在步骤171中得到傅里叶变换谐波之后,在步骤172中得到多个傅里叶变换谐波的幅度的对数。
根据该实施方式,在步骤173中,针对多个傅里叶变换谐波的幅度系数定义了函数c(ω)。该函数的一个例子是取出相邻谐波之间的幅度差,
c(ω)=|F(ω)|-|F(ω+1)|    (7)
通过对所生成的矢量(式7)应用阈值而在步骤174中提取出二进制串,使得
b &omega; = 0 , c ( &omega; ) < S 1 , c ( &omega; ) &GreaterEqual; S 对于全部的ω    (8)
S的适当选择包括S=0和S=mean(c)。然后,输出的图像识别符(步骤175)由这些值B={b0,...,bn}组成。
为了在两个不同的识别符B1和B2之间执行识别符匹配,利用长度N得到归一化的汉明距离
H ( B 1 , B 2 ) = 1 N &Sigma; N B 1 &CircleTimes; B 2 , - - - ( 9 )
其中,
Figure GPA00001088632800073
是异或(XOR)运算符。另选的是,因为识别符中的不同分量(比特的子集)携带独立的信息,因此可以利用可缩放的识别符结构和可缩放的匹配。N比特的整个识别符可划分为S个不重叠(不相交)的比特子集{B1,B2,...,BS}。
然后,根据所要求的性能或者可应用的计算/存储/传输资源,可以对选择的子集执行匹配。
在该优选的实施方式中,N=512,并且基于所需的性能选择了4个子集,每个子集是128比特。与子集B1匹配通常得到98.82%的检测率,子集B1∪B2的检测率为99.60%,而B1∪B2和B1∪B2∪B3的检测率为99.69%。整个集合N的性能通常为99.72%。
如本领域技术人员所理解的,集合的数量及其构成取决于应用的要需求。还应注意的是,可以选择特定子集来提供对特定修整的鲁棒性。可以使用其它的对识别符或表示进行比较的方法。
通过选择识别符中的某些比特能进一步改善性能。与频率变换中的较低频率对应的比特通常更鲁棒,而较高的比特则更有区分性。在本发明的一个特定实施方式中,对应于DC分量的第一比特b0被忽略,从而识别符由接下来的48个比特组成。
在一个优选实施方式中,将如本发明所述从圆信息中提取的比特与如EP 06255239.3、GB 0700468.2和GB 0712388.8中的一个或多个所述提取的比特组合起来。如果没有本发明的圆信息,则利用GB 0712388.8的优选实施方式得到了最佳性能,在误检率为百万分之0.05时的性能是98.9%,而在加入了本发明所述的圆信息的情况下,性能通常能增加到99.7%。
在该优选实施方式中,如GB 0712388.8所述从图像中提取17个基本识别符。另外,从迹圆函数提取一个识别符,并从3个迹环函数提取3个识别符。迹环函数对应于半径增加的圆环。
图8示出了应用根据本发明的一个实施方式的发明执行上述方法的装置的示例。该应用包括针对存储在数据库230中的图像建立识别符的数据库240。这两个数据库230和240可以是同一数据库或者是分离的数据库。该装置使得能够对从查询图像250提取的识别符260进行搜索以找到数据库中的匹配。图像列表(可能经过了排序)被返回至用户290或被返回至查询应用。
另选实现
在该优选实施方式中,在d=0处从迹立方体截取片段。另选的是,可以在d≠0处截取片段,该片段中的信息对应于图像域中的椭圆而不是圆。
从迹环函数和迹圆函数导出的识别符优选地与在EP 06255239.3、GB0700468.2和GB 0712388.8中描述的识别符组合起来。但是,这种组合不是重要的,可以通过仅使用迹环函数和/或迹圆函数来得到良好的识别性能。
另选应用
识别符还可以用于对视频序列中的帧进行索引。假设可以从帧中提取新的识别符序列,则可以执行搜索以找到相同的序列。这对于版权检测和序列识别来说很有用。
多个广播公司经常发送相同的内容,例如,广告或股票新闻镜头。识别符可用于形成在广播公司之间进行导览(navigation)的内容之间的链接。
图像识别符提供通过图像来链接内容的机会。如果用户对网页上的特定图像感兴趣,则没有有效途径找到具有相同图像的其它页面。识别符可用于提供图像之间的导览路由。
识别符可用于检测广播源(broadcast feed)中的广告。这可用于为提供对广告客户的自动监测以追踪其活动计划。
目前有多种图像数据库,包括大型成套商用图像数据库到个人计算机上的小型图像集合。除非数据库被严格控制,否则在图像集合中通常存在重复图像,从而要求不必要的额外存储空间。识别符可用作对这些数据库中的重复图像进行去除或链接的工具。
在接收到质量差、有可能严重压缩的图像时,用户可能希望找到更高质量的版本。该识别符可用于在数据库中或互联网上搜索高分辨率的版本。
在本说明书中,术语“图像”用于描述图像单元(包括经过诸如滤波、改变分辨率、上采样、下采样之类的处理后的图像单元),但是该术语还适用于其它类似的术语,诸如帧、场、图片、或图像及帧的子单元或区域。在说明书中,除了从上下文中明显可知的以外,术语“图像”表示整个图像或表示图像的区域。类似地,图像的区域可表示整个图像。图像包括帧或场,并且涉及静止图像或图像序列(诸如电影或视频)中的图像、或者相关图像组中的图像。图像可以是灰度图像或彩色图像,或者其它类型的多频谱图像,例如,IR、UV或其它电磁图像或声学图像等。
在所描述的实施方式中,利用傅里叶变换导出了频率表示,但是还可以利用其它技术(诸如哈尔变换)导出频率表示。此外,术语傅里叶变换旨在涵盖诸如DFT和FFT之类的各种变型。
优选地通过利用合适的装置处理电信号来实现本发明。
可以利用经过适当修改的软件和/或硬件在例如计算机系统中实现本发明。例如,可以利用计算机等来实现本发明,该计算机具有控制或处理单元(诸如处理器或控制设备)、包括图像存储单元的数据存储单元(诸如存储器、磁存储器、CD、DVD等)、数据输出单元(诸如显示器或监视器或打印机)、数据输入单元(诸如键盘)、以及图像输入单元(诸如扫描仪)、或者这种组件与其它组件的任意组合。可以以软件和/或硬件的形式或者在专用装置或专用模块(诸如芯片)中提供本发明的多个方面。可以例如通过互联网从其它组件远程地提供根据本发明的一个实施方式的装置中的系统的组件。
本领域技术人员应理解的是,可以对所述实施方式做出各种变型和修改。例如,尽管所描述的实施方式通过扩展迹变换的概念而生成了图像的三维表示时,但可以利用其它技术来在三维中表示图像。此外,可以使用其它技术来得到非线性信息(诸如,圆信息或椭圆信息)。旨在将落入本发明的精神和范围内的全部这种变型、修改和等效物包括在内。
参考文献
[1]Alexander Kadyrov and Maria Petrou,“The Trace Transform and ItsApplications”,IEEE Trans.PAMI,23(8),Aug.,2001,pp 811-828.

Claims (28)

1.一种通过对与图像相对应的信号进行处理而导出所述图像的表示的方法,该方法的特征在于:
通过以下步骤对所述图像进行处理以得到所述图像的三维表示:
对所述图像上的直线进行跟踪,所述图像上的各直线由第一距离参数d和第二角度参数θ限定,其中,各直线上的位置由第三位置参数t限定;以及
导出由所述第一距离参数d、所述第二角度参数θ和所述第三位置参数t及各参数对应的像素值代表的所述图像的三维表示;
通过以下步骤利用所述图像的所述三维表示而导出所述图像的所述表示;
针对所述第一距离参数d的预定值提取所述三维表示的值;以及
沿着所述三维表示的所提取值的一条或更多条直线来应用泛函,各直线以所述第三位置参数t的相应的可变值沿着所述第二角度参数θ的值延伸,以获得在第三位置参数t的一维函数。
2.一种通过对与图像相对应的信号进行处理而导出所述图像的表示的方法,该方法的特征在于:
通过以下步骤对所述图像进行处理以得到所述图像的三维表示:
对所述图像上的直线进行跟踪,所述图像上的各直线由第一距离参数d和第二角度参数θ限定,其中,各直线上的位置由第三位置参数t限定;以及
导出由所述第一距离参数d、所述第二角度参数θ和所述第三位置参数t及各参数对应的像素值代表的所述图像的三维表示;
通过以下步骤利用所述图像的所述三维表示而导出所述图像的所述表示;
针对所述第一距离参数d的预定值提取所述三维表示的值;以及
沿着所提取值的直线的一个或更多个线段来应用泛函,所述线段由所述第三位置参数t的预定位置之间的间隔限定,各直线以所述第二角度参数θ的相应的可变值沿着所述第三位置参数t的固定值延伸,以获得在第二位置参数θ的一维函数。
3.根据权利要求2所述的方法,该方法包括以下步骤:
沿着多个相邻线段应用所述泛函。
4.根据权利要求1或2所述的方法,该方法包括以下步骤:
针对等于0的所述第一距离参数d来提取所述三维表示的值。
5.根据权利要求1或2所述的方法,该方法包括以下步骤:
针对所述第一距离参数d的预定正值来提取所述三维表示的值以导出所提取值的第一集合,以及
针对相当于所述预定正值的所述第一距离参数d的负值提取所述三维表示的值以导出所提取值的第二集合。
6.根据权利要求5所述的方法,该方法还包括以下步骤:
使用权利要求1或权利要求2所述的方法从所提取值的所述第一集合和所述第二集合中导出各自的第一函数和第二函数,以及
将所述第一函数和所述第二函数组合。
7.根据权利要求1或2所述的方法,该方法还包括以下步骤:
使用所述一维函数导出所述图像的二进制表示。
8.根据权利要求1或2所述的方法,该方法包括以下步骤:使用频率分量的幅度导出所述图像的表示。
9.根据权利要求8所述的方法,其中,使用傅里叶变换或哈尔变换确定所述频率分量。
10.根据权利要求8所述的方法,其中,使用频率分量的幅度的步骤包括以下步骤:
计算多个频率系数的幅度,以及
确定各系数与其后一个系数二者的幅度之差。
11.根据权利要求10所述的方法,该方法还包括通过以下步骤导出二进制函数:
对各个所确定的差应用阈值以导出一系列二进制值,其中,如果所述差小于阈值,则应用所述阈值的步骤得到二进制值0,而如果所述差大于或等于所述阈值,则应用所述阈值的步骤得到二进制值1。
12.根据权利要求1或2所述的方法,该方法包括导出具有n个数字或比特的表示的步骤,该方法还包括选择具有m个数字或比特的子集的步骤。
13.根据权利要求1或2所述的方法,该方法包括下步骤:通过沿着所述三维表示的直线应用多个不同的泛函而导出所述图像的多个表示,并且将所述多个表示中的两个或更多个进行组合。
14.根据权利要求13所述的方法,其中,所述组合步骤包括将所述两个或更多个表示连接起来。
15.根据权利要求1所述的方法,其中,沿着所述三维表示的线应用泛函的步骤相当于围绕所述图像的圆应用所述泛函。
16.根据权利要求2所述的方法,其中,沿着所述三维表示的线应用泛函的步骤相当于围绕所述图像的圆或者环形区域应用所述泛函。
17.一种使用根据前述权利要求1或2所述的方法对图像进行识别或比较的方法。
18.一种图像识别方法,该方法包括以下步骤:使用根据前述权利要求1或2所述的方法导出所述图像的表示,以及将所述表示与所述图像关联起来。
19.一种图像比较方法,该方法包括以下步骤:对使用根据前述权利要求1或2所述的方法导出的各图像的表示进行比较。
20.根据权利要求19所述的方法,其中,所述比较步骤包括以下步骤:使用下式确定汉明距离:
H ( B 1 , B 2 ) = 1 N &Sigma; N B 1 &CircleTimes; B 2 , - - - ( 10 )
其中,是异或(XOR)运算符,而N是二进制识别符B1和B2的长度,其中,所述二进制识别符是基于使用权利要求1或2所述的方法导出的每个图像的表示。
21.根据权利要求19所述的方法,该方法包括以下步骤:基于对表示的所述比较来选择图像。
22.利用根据权利要求1或2所述的方法导出的表示的发送方法或接收方法。
23.一种通过对与图像相对应的信号进行处理而导出所述图像的表示的装置,该装置的特征在于包括:
处理单元,其通过以下步骤对所述图像进行处理以得到所述图像的三维表示:
对所述图像上的直线进行跟踪,所述图像上的各直线由第一距离参数d和第二角度参数θ限定,其中,各直线上的位置由第三位置参数t限定;以及
导出由所述第一距离参数d、所述第二角度参数θ和所述第三位置参数t及各参数对应的像素值代表的所述图像的三维表示;
导出单元,其通过以下步骤利用所述图像的所述三维表示而导出所述图像的所述表示;
针对所述第一距离参数d的预定值提取所述三维表示的值;以及
沿着所述三维表示的所提取值的一条或更多条直线来应用泛函,各直线以所述第三位置参数t的相应的可变值沿着所述第二角度参数θ的值延伸,以获得在第三位置参数t的一维函数。
24.一种通过对与图像相对应的信号进行处理而导出所述图像的表示的装置,该装置的特征在于包括:
处理单元,其通过以下步骤对所述图像进行处理以得到所述图像的三维表示:
对所述图像上的直线进行跟踪,所述图像上的各直线由第一距离参数d和第二角度参数θ限定,其中,各直线上的位置由第三位置参数t限定;以及
导出由所述第一距离参数d、所述第二角度参数θ和所述第三位置参数t及各参数对应的像素值代表的所述图像的三维表示;
导出单元,其通过以下步骤利用所述图像的所述三维表示而导出所述图像的所述表示;
针对所述第一距离参数d的预定值提取所述三维表示的值;以及
沿着所提取值的直线的一个或更多个线段来应用泛函,所述线段由所述第三位置参数t的预定位置之间的间隔限定,各直线以所述第二角度参数θ的相应的可变值沿着所述第三位置参数t的固定值延伸,以获得在第二位置参数θ的一维函数。
25.一种使用权利要求23或24的装置对图像进行识别或比较的装置。
26.一种图像比较装置,其中,该图像比较装置包括:
比较单元,其对使用权利要求23或23所述的装置导出的各图像的表示进行比较;
选择单元,其基于对表示的所述比较来选择图像。
27.一种发送装置,其发送使用权利要求23或24所述的装置所导出的各图像的表示。
28.一种接收装置,其接收使用权利要求23或24所述的装置所导出的各图像的表示。
CN2008801110872A 2007-10-10 2008-06-30 增强的图像识别 Active CN101821753B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB0719833.6A GB0719833D0 (en) 2007-10-10 2007-10-10 Enhanced image identification
GB0719833.6 2007-10-10
PCT/GB2008/002251 WO2009047471A1 (en) 2007-10-10 2008-06-30 Enhanced image identification

Publications (2)

Publication Number Publication Date
CN101821753A CN101821753A (zh) 2010-09-01
CN101821753B true CN101821753B (zh) 2013-09-04

Family

ID=38787959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801110872A Active CN101821753B (zh) 2007-10-10 2008-06-30 增强的图像识别

Country Status (7)

Country Link
US (1) US8515158B2 (zh)
EP (1) EP2195765B1 (zh)
JP (1) JP5261493B2 (zh)
KR (1) KR101191516B1 (zh)
CN (1) CN101821753B (zh)
GB (1) GB0719833D0 (zh)
WO (1) WO2009047471A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI503760B (zh) * 2014-03-18 2015-10-11 Univ Yuan Ze Image description and image recognition method

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2315161A1 (en) * 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
GB0800364D0 (en) 2008-01-09 2008-02-20 Mitsubishi Electric Inf Tech Feature-based signatures for image identification
GB0807411D0 (en) 2008-04-23 2008-05-28 Mitsubishi Electric Inf Tech Scale robust feature-based indentfiers for image identification
ES2901385T3 (es) * 2013-12-12 2022-03-22 Fund Centro De Tecnologias De Interaccion Visual Y Comunicaciones Vicomtech Método y sistema para describir una imagen
US9830532B1 (en) 2014-08-22 2017-11-28 Matrox Electronic Systems Ltd. Object detection in images using distance maps
US10031925B2 (en) * 2014-10-15 2018-07-24 Thinkcx Technologies, Inc. Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph
CN105224919B (zh) * 2015-09-11 2019-02-26 深圳Tcl新技术有限公司 纹理特征提取方法及装置
CN107358239B (zh) * 2017-06-07 2018-05-18 南京航空航天大学 基于圆迹变换的图像不变特征提取方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030036855A1 (en) * 1998-03-16 2003-02-20 Praelux Incorporated, A Corporation Of New Jersey Method and apparatus for screening chemical compounds
US6421463B1 (en) * 1998-04-01 2002-07-16 Massachusetts Institute Of Technology Trainable system to search for objects in images
KR100308456B1 (ko) 1999-07-09 2001-11-02 오길록 주파수 공간상에서의 질감표현방법 및 질감기반 검색방법
JP2003271177A (ja) * 2002-03-15 2003-09-25 Sharp Corp 特徴量抽出方法、音声および音響に関する識別装置、画像および画像状態に関する識別装置ならびに特徴量抽出プログラム
JP2005208979A (ja) * 2004-01-23 2005-08-04 Fuji Xerox Co Ltd 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
EP2315161A1 (en) 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
GB0700468D0 (en) 2007-01-10 2007-02-21 Mitsubishi Electric Inf Tech Improved image identification
GB0712388D0 (en) 2007-06-26 2007-08-01 Mitsubishi Electric Inf Tech High Performance Image Identification

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Abbie L. Warrick等.Detection of Linear Features using a Localized Radon Transform.《Signals,systems and computers》.1996,第2卷1245-1249. *
Copeland.A.C等.Localized radon transform-based detection of ship wakes in sar images.《Geoscience and remote Sensing》.1995,第33卷(第1期), *
吕艳娜等.计算机数字图像处理常用颜色空间及其转换.《计算机与数字工程》.2006,第34卷(第11期), *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI503760B (zh) * 2014-03-18 2015-10-11 Univ Yuan Ze Image description and image recognition method

Also Published As

Publication number Publication date
KR101191516B1 (ko) 2012-10-15
EP2195765B1 (en) 2012-09-12
CN101821753A (zh) 2010-09-01
WO2009047471A1 (en) 2009-04-16
US8515158B2 (en) 2013-08-20
GB0719833D0 (en) 2007-11-21
US20100310153A1 (en) 2010-12-09
EP2195765A1 (en) 2010-06-16
JP2011501257A (ja) 2011-01-06
KR20100076015A (ko) 2010-07-05
JP5261493B2 (ja) 2013-08-14

Similar Documents

Publication Publication Date Title
CN101821753B (zh) 增强的图像识别
CN102317957B (zh) 改进的图像识别
CN101523415B (zh) 导出图像的表示的方法、对图像进行识别和比较的方法及其装置
Zhang Fundamentals of image data mining
WO2018157746A1 (zh) 一种视频数据的推荐方法和装置
Soulard et al. Quaternionic wavelets for texture classification
CN103383700B (zh) 基于边缘方向差直方图的图像检索方法
CN102385578A (zh) 图片搜索的方法和装置
WO2003041000A1 (en) Image capture and identification system and process
Costa et al. Comparing textural features for music genre classification
CN101711394B (zh) 高性能图像识别
Muhammad et al. Copy move image forgery detection method using steerable pyramid transform and texture descriptor
CN101894251A (zh) 一种视频检测方法及装置
CN104317946A (zh) 一种基于多张关键图的图像内容检索方法
En et al. Pattern localization in historical document images via template matching
CN104462111A (zh) 图像检索数据库建立方法
Bergstrom et al. Image quality and object detection performance of convolutional neural networks
Wang Extraction algorithm of English text information from color images based on radial wavelet transform
Chen et al. A multi-scale phase method for content based image retrieval
Koerich et al. Comparing Textural Features for Music Genre Classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190612

Address after: Tokyo, Japan, Japan

Patentee after: Rakuten Inc.

Address before: Tokyo, Japan, Japan

Patentee before: Mitsubishi Electric Corporation

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Tokyo, Japan

Patentee after: Lotte Group Co.,Ltd.

Address before: Tokyo, Japan

Patentee before: Rakuten, Inc.