CN102317957A - 改进的图像识别 - Google Patents
改进的图像识别 Download PDFInfo
- Publication number
- CN102317957A CN102317957A CN2007800521435A CN200780052143A CN102317957A CN 102317957 A CN102317957 A CN 102317957A CN 2007800521435 A CN2007800521435 A CN 2007800521435A CN 200780052143 A CN200780052143 A CN 200780052143A CN 102317957 A CN102317957 A CN 102317957A
- Authority
- CN
- China
- Prior art keywords
- image
- function
- dimensional
- representation
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000005070 sampling Methods 0.000 claims abstract description 11
- 230000005540 biological transmission Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 34
- 230000009466 transformation Effects 0.000 description 33
- 238000000354 decomposition reaction Methods 0.000 description 8
- 238000000844 transformation Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/48—Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请描述了一种通过处理与图像相对应的信号来获得所述图像的表示的方法和设备。该方法包括:获取二维函数(T(d,θ))(例如图像的轨迹变换);在两个维度的至少一维上分解二维函数(T(d,θ))(例如通过二次采样),以得到降低分辨率的轨迹变换。然后,分解得到的二维函数用以获得图像的表示。
Description
技术领域
本申请涉及用于表示图像的方法和装置,另外也涉及用来对图像进行比较或匹配(例如用于搜索或验证)的方法和装置。
背景技术
本申请涉及对欧洲专利申请EP 06255239.3中说明的图像识别技术的改进。EP 06255239.3整体纳入本文作为参考。EP 06255239.3中的发明细节和实施方式可类似地在本申请和其实施方式中应用。
EP 06255239.3中描述的图像识别方法和装置从图像中提取短二进制描述符(参见图2),探讨现有技术中的许多缺陷,其特点主要包括:
●在特征提取和匹配方面降低运算复杂度;
●降低的图像描述符大小;
●提高对多种不同图像的稳健性;
●大范围修改方面,在保持大约80%检测率的同时,错误报警率降低至1ppm的水平。
然而,实际应用中需要更高的检测率。特别是平均检测率需要提高到98%以上,另外在噪声和直方图均衡修改的稳健性方面也需要有显著的提高。
发明内容
依照第一方面,本申请提供了在权利要求1中确定的获得图像表示的方法。
更进一步,本申请包括使用依照本申请第一方面的方法获得的图像表示,和用来实施本申请的第一方面的方法的装置,以及包括指令的计算机可读存储介质,当指令运行时,执行实现本申请的第一方面的方法。
本申请中实施方式的优选的和可选的特征在从属权利要求中列出。
本申请涉及一种从图像的轨迹变换(或者等同的图像的二维函数)中提取可视识别特征的新方法。该方法可在识别符提取(例如,利用傅立叶变换的量值)之前,通过轨迹执行基于区域的图像轨迹变换处理来创建图像的多分辨率表示。
本申请中,术语“泛函”具有其通用的数学含义。特别地,泛函表示在向量空间V上的实数值函数,通常为多个函数。在轨迹变换的情况下,泛函应用于图像中直线上。
在专利申请EP 06255239.3中描述的方法中,利用直线对图像进行追踪计算出轨迹变换,其中沿这些直线计算图像强度或颜色函数的特定泛函T。对于单个输入图象不同的泛函T生成不同的轨迹变换。由于在2D平面中直线可以由两个参数,距离d和角度θ来表示,因此图像的轨迹变换是每条轨迹线的2D函数。接下来,通过沿轨迹变换的列使用直径泛函P以得到“圆周函数”。这样就获得了圆周函数的频率表示(例如傅立叶变换),并限定了频率幅度分量上的函数,并将其作为二进制描述符。
本申请具体实施方式中的方法可利用相似的技术来获取图像的表示。然而不论用何种方法,在执行下一步以获得图像表示(例如二进制描述符)之前,需要获取降低分辨率的图像函数,例如降低分辨率的轨迹变换。分辨率的降低应保留图像所独有的重要部分(也就是说,其可见识别特征),同时降低处理的数据量。特别地,经过处理后,所述的降低分辨率的图像函数体现了被选择或采样的图像的典型值,这一点在后续说明中可以显而易见的看到。
根据本申请的一个具体实施方式,通过直线集追踪图像,可以获得降低分辨率的图像函数,其中这些直线的参数为预定间隔Δd和Δθ,并且需要利用直线集中的全部直线的(代替穿过图像的全部直线)进行轨迹变换(或等同的)。在图像域中,这些直线对应到带线上(如图10所示)和/或对顶圆锥(double cone,如图11所示)。这样就可获得图像的降低分辨率(也就是粗分辨率)轨迹变换,下文将会对此做详细说明。
根据本申请的另一具体实施方式,首先以通用的方式,通过追踪穿过图像的所有直线获取轨迹变换(或等同的)。接着,在轨迹域中将图象的轨迹变换应用到不同角参数值的带线上,并在距离参数d的间隔内(如图12中所示)进行分辨率的降低操作,和/或将图象的轨迹变换应用到不同距离参数值的带线上,并在角度参数θ的间隔上(如图13中所示)进行分辨率的降低操作,从而获得降低分辨率的二维图像函数,接下来会有更详细的说明。
有利地,在轨迹域中沿带线和/或锥状线隐含地计算轨迹变换数值,可以非常有效的实现本申请中此实施方式的方法,下文将会对此做详细说明。
在共同未决的专利申请EP 06255239.3揭示的方法中,根据本申请实施方式的方法组合了通过不同泛函从标识符“族”中得到的被选片段。此外,在某些实施方式中,使用带线和/或双锥线得到的标识符被组合为单个描述符。另外,在一些实施方式中,不同宽度的带线和/或不同张角的锥状线被使用,从而获得多分辨率表示。
附图说明
将参照附图来对本申请的实施方式进行说明,其中:
图1a示出了一个图像;
图1b示出了经缩减的图1a的图像;
图1c示出了经旋转的图1a的图像;
图1d示出了经模糊处理的图1a的图像;
图2示出了一个图像和根据现有技术的对该图像的位串表示;
图3是本申请的一个实施方式的方法的步骤的图;
图4是本申请的一个实施方式的另一方法的步骤的图;
图5是轨迹变换的直线参数化的图;
图6a至c例示了从经过不同处理的图像导出的函数;
图7是根据本申请的一个实施方式的装置的框图;
图8示出了使用多个轨迹变换的的实施方式的框图;
图9示出了根据图8的实施方式产生的位流。
图10示出了分解轨迹变换的d参数时在原始图像中的间隔带线;
图11示出了分解轨迹变换的θ参数时在原始图像中的双锥线;
图12示出了轨迹变换在d参数的分解;
图13示出了轨迹变换在θ参数的分解。
具体实施方式
下面将对获得图像的表示,特别是图像标识符,以及将这种表示/标识符用于例如一个图像或多个图像的识别、匹配或者验证的各种实施方式进行说明。本申请对于识别图像特别有用,但不限于图像识别。在已说明的实施方式中,“图像标识符”(有时简称“标识符”)是图像表示的例示,该术语仅被用来指示图像的表示或者描述符。
本领域技术人员可以理解,设计需求决定了对根据本申请的实施方式的图像识别装置和方法以及图像识别中应用的图像标识符的推导作的特定设计。设计需求涉及图像修改类型,从而对于标识符的大小、提取和匹配复杂度、目标虚警率等,图像标识符应当是稳健的。
接下来的实施方式例示了一种通用设计,该设计获得了对于以下图像修改(这不是穷举)而言稳健的标识符:
●颜色缩减,
●模糊,
●亮度改变,
●翻转(左右&上下),
●灰度变换,
●直方图均衡,
●JPEG压缩,
●噪声,
●旋转,以及
●缩放。
对于多种类型的图像而言,通用设计可典型地实现百万分之一(ppm)的极低虚警率。
图1示出了一个图像以及经修改的该图像。更明确的说,图1a是原始图像,图1b为经缩减的图1a的图像,图1c是经旋转的图1a的图像,以及图1d是经模糊处理的图1a的图像。
通过处理对应于图像的信号,本申请的实施方式获得了图像的表示,更明确的说,获得了图像标识符。
图3示出了根据本申请的一个实施方式获得图像标识符的方法的步骤,即,标识符提取处理。
在提取过程的最初阶段,通过调整大小(步骤110)和可选的滤波(步骤120)对图像进行预处理。调整大小的步骤110用于在处理前将图像归一化。步骤120可包含滤波处理,该滤波处理用于去除诸如由对该图像和/或所选择的区域而不是使用完整的原始图像执行的任意处理而造成的混叠(aliasing)等的影响。在该方法的优选实施方式中,从图像的中央提取一个圆形区域以供进一步处理。
在步骤130,执行轨迹变换T(d,θ)。轨迹变换将所有可能的直线都投影到图像上,并对这些直线应用一个或者多个泛函。如之前所述,泛函是向量空间V上的实值函数,通常由函数组成。在轨迹变换的情况下,对图像中的直线应用泛函。如图5所示,以两个参数d和θ对直线进行参数化。之后在步骤140将描述,轨迹变换的结果可被分解以降低分辨率。接着,在步骤150,针对轨迹变换的列可应用另一个泛函以给出实数向量。该第二个泛函P被称为直径泛函,而所得到的向量被称为圆周函数。可以对圆周函数应用第三个泛函(圆周泛函)以给出单个数字。通过适当选择这三个不同泛函(轨迹泛函、直径泛函以及圆周泛函),可以控制所得结果的性质。例如,在参考文献[1]:Alexander Kadyrov和Maria Petrou的“The轨迹Transform and Its Applications”,IEEE Trans.PAMI,23(8),Aug.,2001,pp.811-828中可以得到轨迹变换的详细内容,其中包括图像的示例以及对应的轨迹变换,通过引证的方式将该文结合于此。在本实施方式的方法中,在轨迹变换中仅取前两个步骤,以获得1D圆周函数。
在该方法的一个特定示例中,图像的轨迹变换T(d,θ)通过轨迹泛函T提取
∫ξ(t)dt, (1)
而使用直径泛函P可获得圆周函数
max(ξ(t)) (2)
在图6中可看到圆周函数如何受不同的图像处理操作影响的示例,其示出了与经过不同处理的图像相对应的圆周函数。图6(a)对应于原始图像;图6(b)对应于经旋转的该图像,以及图6(c)对应于经过模糊处理的该图像。可以看出,旋转使该函数发生移位(而且造成缩放变化)。
对于以上所列出的大部分图像修改操作,可以看出,通过选择适当的泛函T、P,图像a的圆周函数f(a)仅是经修改的图像a’的圆周函数f(a’)的经移位的或(在幅度上)经缩放的形式(见文献[1]中的第三节)。
f(a′)=kf(a-θ) (3)
根据共同未决的欧洲专利申请EP06255239.3中描述的方法,可使用圆周函数的频率表示的频率分量获得图像标识符。可以理解,其它获得图像标识符的技术也是可能的,并且可结合本申请使用。例如,可通过圆周函数的傅立叶变换(或者等同地,haar变换)获取图像标识符。
于是,对等式(3)进行傅立叶变换,我们得到:
F(Φ)=F[kf(a-θ)] (4)
=kF[f(a-θ)] (5)
=kexp-jθΦF[f(a)] (6)
接下来对等式(6)取幅值,得到:
|F(Φ)|=|kF[f(a)]| (7)
从等式(7)可以看出,现在除缩放因子k之外,修改后的图像和原始图像是相当的。
根据该示例,对多个傅里叶变换系数的幅度系数定义函数c(ω)。该函数的一个例子是每个系数和其相邻系数的差
c(ω)=|F(ω)|-|F(ω+1)| (8)
通过将阈值应用于所得到的向量(等式8),可以提取二进制串,例如,对于所有的ω,
之后,图像标识符由这些值B={b0,...,bn}构成。
为了执行两个不同的标识符B1和B2(长度均为N)之间的标识符匹配,取归一化的汉明(Hamming)距离为
通过选择标识符中的某些位可进一步提高性能。对应于低频的位通常更加稳健,同时对应于高频的位更加具备区分性。在本申请的一个特定实施方式中,忽略第一位,在之后,标识符由接下来的64位构成。
依照本申请的一个实施方式,分解来自于轨迹变换(或类似的)的图像的二维函数的步骤140中包括降低分辨率。可通过对两个维数d或θ的任何一个或者全部进行处理获得降低的分辨率。
于是,可通过在轨迹域(轨迹-domain)对d-参数进行子采样可在距离维度上降低分辨率,例如,沿列(对应于θ的数值)在用于d的间隔上进行累加或者积分,参照图12。如图10所示,这对应于在轨迹变换中的图像(也就是说,在图像域)上投影宽度Δd的带线。可以理解的是,任何沿用于距离参数d的间隔降低轨迹变换的分辨率的子采样技术均可被使用。因此,任何降低数据量同时保持数据本质的统计计算均可被采用,累加和基本仅仅是其中的示例。
作为选择,或者另外地,可在“轨迹域”的角度维度上,对θ参数进行子采样,例如,沿行在用于θ的间隔上累加或积分,可降低分辨率,参见图13。这对应于在轨迹变换中的图像(也就是说,在图像域)上投影开角为Δθ的双锥线。可以理解的是,任何沿用于距离参数θ的间隔降低轨迹变换的分辨率的子采样技术均可被使用。因此,任何降低数据量同时保持数据本质的统计计算均可被采用,累加和基本仅仅是其中的示例。
根据本申请的另一实施方式,分解的步骤140可以在“图像域”中执行,也就是说,在步骤120之后,并且典型地与图3中的步骤130结合。在一个例子中,步骤140可以结合或分解图像自身的直线集合,并且在这些直线上执行轨迹变换(或其它操作)从而获得图像标识符。例如,一像素宽的图像线可被合并,从而在步骤130中图像的多条直线可一起被有效处理。比如,直线集合可以分别为图10和11中所示的平行直线和/或由双锥线限定的直线。组合的直线的数量对应于上述的间隔。因此,在本实施方式中,轨迹变换被有效的修改从而追踪被选择的穿过图像的直线集合,而不是在传统轨迹变换中追踪穿过图像的所有线。
本领域技术人员能够理解,用于在图像域分解的其它技术均是可能的。
在图7中示出了用于执行上述方法的根据本申请的一个实施方式的装置的例子。具体来说,图像100由图像存储模块210接收并存储在图像数据库230中。此外,根据本申请的方法,标识符提取器和存储模块220提取用于所接收的各图像的图像标识符,并且将图像标识符存储在标识符数据库240中,可选的,可适当地结合关于图像内容的其它信息。
图7还示出了实现图像搜索引擎的装置,其使用通过上述方法提取的图像标识符。响应于对查询图像250的接收,可以由图像搜索引擎来执行图像验证或匹配。根据本申请的方法,在标识符提取器模块260中对查询图像250的图像标识符进行提取。标识符匹配模块270将查询图像250的图像标识符与存储在标识符数据库240中的图像标识符进行比较。如在下面更详细讨论的,图像检索模块280从图像数据库230中检索出匹配图像290,其中匹配图像290具有与查询图像标识符相匹配的图像标识符。
图4示出了对傅里叶变换系数而定义二进制函数的另选方法。具体地说,在获得傅里叶变换系数(步骤171)后,得到了多个傅里叶变换系数的幅度的对数(步骤172和步骤173)。与上面的式(8)相似,计算与随后系数的差(步骤174),然后取该差的符号并根据该符号而分配二进制值(步骤175),随后这些二进制值被用于形成二进制标识符。可以理解,该技术可被应用于图像函数的其它频率表示的频率系数,包括Haar变换。
如图8和9所示,通过使用多重降低分辨率的轨迹变换导出各自的标识符并且将来自单独标识符的位进行组合,可以改善前述的基本标识符。用于组合来自两个单独的降低分辨率轨迹变换的二进制串361和362的特定方法具体为将二者连接(concatenate)以获得标识符363。
使用上面的式(1)中的轨迹泛函T与上面的式(2)中给出的直径泛函P而得到一个二进制串,并且之后使用轨迹泛函(1)与直径泛函(11)
∫|ξ(t)′|dt,(11)
从而得到第二个串,通过这种方式可获得良好的结果。跳过各二进制串的首位,并将这两个二进制串的后续64位连接起来以获得128位的标识符。
根据本申请,可通过轨迹变换的多分辨率表示获得显著的性能提高。特别地,可在一个或者两个维度上进行分解。之后可应用直径泛函和之前提取的二进制串。典型的结果表明,使用分解可将检测率从大约80%到90%提高到百万分之一的错误率。
如前所述,可通过对原始轨迹变换两个维度d和θ中的一个或者两个维度上进行子采样,以降低分辨率,从而创建多分辨率轨迹变换。在“轨迹域”,可通过例如图12中沿列的间隔积分的方式对d参数进行子采样。这相应于在轨迹变换中在图像上投影宽度为Δd的带线,如图10所示。也可以使用例如沿行方向在θ参数的间隔上进行积分的方法进行子采样,参见图13。这近似等同于在轨迹变换中沿张角为Δθ的双锥线进行积分,参见图11。如上所述,可选择地,这些操作在“图像域”中执行。
通过使用多分辨率分解可以从单个轨迹变换中抽取多个基本标识符,其中在不同的间隔宽度的范围上进行子采样,从而生成由多个基本标识符组成的多分辨率表示。理想情况下,多分辨率表示使用通过间隔宽度范围获得的多个标识符。例如,每一间隔宽度可以为不同于其它间隔宽度的两个因素之一。典型地,可使用一系统获得良好的结果,该系统中轨迹变换的输出为600×384的大小,在之后通过利用宽度为8、16、32、64和128的带线进行积分,对d参数进行子采样,类似地,例如,利用宽度3、6、12和24的带进行积分对θ参数进行子采样。
标识符的一项应用是作为图像搜索引擎。通过提取图像的二进制标识符并与其相关联的信息,例如文件名、图像、摄影师、拍摄日期和时间以及任何其它有用信息一起存储而构建数据库。之后,当给定查询图像aq时,提取二进制标识符并将其与数据库中的所有标识符B0...BM进行比较。返回与查询图像的汉明距离低于一阈值的所有图像。
可供选择的实现
可以使用一系列不同的轨迹泛函和直径泛函,例如(非穷举):
∫ξ(t)dt, (A1)
(∫|ξ(t)|qdt)r,其中q>0 (A2)
∫|ξ(t)′|dt, (A3)
∫(t-X1)2ξ(t)dt,其中
max(ξ(t)), (A6)
A6-min(ξ(t))。 (A7)
可以合并两个或者更多个标识符以更好的表征图像。优选地,通过将多个标识符连接起来而进行组合。
对于比旋转、平移和缩放更高阶的几何变换而言,上述标识符的形式是不恰当的;式(3)的关系不成立。使用归一化处理(详情见之下的文献[2])可将标识符的稳健性扩展至仿射变换(affine transformation)。引入了两个步骤对圆周函数进行归一化,第一个步骤包括寻找所谓的关联圆,之后第二个步骤包括寻找经归一化的关联圆周函数。在归一化之后,表明式(3)中的关系为真。现在可以与以前一样进行标识符的提取处理。
在之下的(G1)和(G2)给出了适用于归一化处理的一些轨迹泛函,(G3)中给出了直径函数的一种适宜选择。
P(h(t))=∑k|h(tk-1)-h(tk)| (G3)
其中r≡t-c,c≡median({tk}k,{|g(tk)|}k)。使用非负的权重w1,w2,...,wn的序列y1,y2,...,yn的加权中值被定义为:相对于
识别最大索引m,其中假设序列根据权重以上升的顺序被筛选。如果不等式(12)为严格不等式,中值为ym。不过,如果不等式成为等式,那么中值为(ym+ym-1)/2。
可以通过试验进行选择,而不是从连续的比特块中构造标识符。具体做法的一个例子是,有两个数据集:i)独立的图像和ii)原始和修改的图像。通过比较独立数据的错误接受率和原始和修改数据的错误拒绝率测量标识符的性能。关注点为在错误接受率为1×10-6时的等错误率或错误拒绝率。优化开始时,没有位被选择。可以每次检查一个位以了解哪个位具有最优的性能(假设就等错误率或某些类似测度而言),这是可能的。具有最优性能的比特被选择。之后,测试余下的所有位以找出哪一位与第一位结合而给出了最佳性能。同样地,选择具有最低错误率的比特。重复这一步骤直至所有位均被选择。通过这种方式,可以确定得到整体最佳性能的位组合。
如之上所述的,可以通过在参数(d或者θ)的间隔上累加或积分,生成轨迹变换的多分辨率分解。如上文揭示的,可以应用任何统计技术获得分解或者分辨率的降低,并且其它可能性包括计算学统计,例如中值、最大值和最小值等等。也可在这些间隔上应用其它泛函。
此外,可以将一种结构应用于标识符以提高搜索性能。例如,可以实现两阶段搜索,这些位的一半被用于初始搜索,随后只有那些具有给定准确度水平的位被接受以用于搜索第二阶段。
可以使用诸如Reed-Muller解码器或Wyner-Ziv解码器之类的方法对标识符进行压缩以进一步减少其大小。
可供选择的应用
标识符还可以用于对视频序列中的帧进行索引。给定一个新的序列,可以从帧中提取标识符,之后可进行搜索以寻找相同的序列。这对于版权检测以及序列识别而言是有用的。
多个广播台经常发送相同的内容,例如,广告或股票新闻片。标识符可用于形成内容之间的链接以用于广播台之间的导航。图像标识符提供通过图像链接内容的可能。如果用户对网页上的特定图像感兴趣但是没有找到具有该图片的其它网页的有效方法。使用标识符可提供图像间的导航路径。
标识符可用于检测广播馈送(broadcast feed)中的广告。这可以用于为广告商提供自动监控以跟踪他们的活动。
存在着非常多的图像数据库,从巨大的商用集合到个人计算机上的小的集合。除非对数据库进行严格的控制,否则在集合中经常会存在需要不必要的额外存储的重复图像。可以使用标识符作为用于消除或链接这些数据集中的重复图像的工具。
在本说明书中,术语“图像”用于描述一个图像单元,包括诸如滤波、改变分辨率、上采样(upsampling)、下采样(downsampling)处理后的图像单元,但是该术语还适用于其它类似的术语,诸如帧、字段、图片、或图像、帧等的子单元或区域。在本说明书中,除了从上下文显而易见的以外,图像这一术语表示整个图像或图像的区域。类似地,图像的区域可以表示整个图像。图像包括帧或字段,并且图像涉及静止图像或者图像序列(诸如电影或视频)中或相关的图像组中的图像。该图像可以是灰度图像或彩色图像,或者是其它类型的多光谱图像(例如,IR、UV或其它电磁图像)、或声图像。
在本实施方式中,使用傅里叶变换导出了频率表示,但是还可以使用诸如Haar变换的其它技术而导出频率表示。在权利要求中,术语傅里叶变换旨在包含诸如DFT和FFT等变型。
优选地,本申请通过使用适当的装置对电信号进行处理而实现。
通过对软件和/或硬件进行适当的修改,可以在例如计算机系统中实现本申请。例如,可以使用具有诸如处理器或控制设备、数据存储装置之类的控制或处理装置的计算机等来实现本申请,这些控制或处理装置包括图像存储装置(诸如存储器、磁存储器、CD、DVD等)、数据输出装置(诸如显示器、监视器或打印机)、数据输入装置(诸如键盘)、以及图像输入装置(诸如扫描仪)、或这些部件连同附加部件的任意组合。可以通过软件和/或硬件的形式来提供本发明的多个方面,或者可以在诸如芯片之类的专用装置或专用模块中提供本发明的多个方面。根据本申请的一个实施方式的装置中的系统的部件例如可以通过互联网从另一部件远程地提供。
参考文献
Alexander Kadyrov和Maria Petrou,“The Trace Transform and ItsApplication”,IEEE Trans.PAMI,23(8),Aug.,2001,pp 811-828。
Maria Petrou和Alexander Kadyrov,“Affine Invariant Featuresfrom the Trace Transform”,IEEE Trans.On PAMI,26(1),Jan,2004,pp30-44。
本领域技术人员应该理解的是,可以对所述实施方式做出很多变型或修改。例如,本申请可以通过组合本领域技术人员熟知的已存在的并且相关的技术的实施方式来实现。如在所附权利要求中限定的一样,本申请旨在将落入本申请的精神和范围的所有这种变型、修改或等同物包括在内。
Claims (26)
1.一种通过处理对应于图像的信号以获得该图像的表示的方法,该方法包括以下步骤:
处理图像或者图像的二维函数,以获得降低分辨率的二维图像函数;以及
利用该降低分辨率的二维图像函数以获得图像的表示。
2.根据权利要求1所述的方法,其中所述处理图像或者图像的二维函数的步骤包括在二维图像函数的至少一个参数的预定间隔内对图像进行二次采样。
3.根据权利要求2所述的方法,其中所述的二次采样包括在图像或者二维图像函数的至少一个参数的预定间隔上对图像或者图像的函数的值进行计算,优选为累加或者积分。
4.根据权利要求1、2或3所述的方法,其中所述的处理步骤包括利用图像的直线集来处理图像。
5.根据权利要求4所述的方法,其中所述直线集与被二维图像函数的第一个参数的间隔限定的直线带,以及被二维图像函数的第二个参数的间隔限定的双锥线中的一个或者多个相对应。
6.根据权利要求4或5所述的方法,其中所述处理包括对所述的直线集上应用泛函以获得降低分辨率的二维图像函数。
7.根据权利要求1、2或3所述的方法,其中所述的处理步骤包括通过在第一维度的预定间隔内对二维图像函数进行二次采样来处理二维图像函数,以在第一维度上降低二维图像函数的分辨率。
8.根据权利要求1、2、3或7所述的方法,其中所述处理步骤包括通过在第二维度的预定间隔内对二维图像函数进行二次采样来处理图像的二维函数,以在第二维度上降低二维图像函数的分辨率。
9.根据权利要求7或8所述的方法,其中二维图像函数包括在图像的所有直线上应用泛函推导出的图像的轨迹变换,该二维函数在具有距离和角度参数的轨迹域中限定图像值。
10.根据前述任一权利要求所述的方法,其中利用降低分辨率的二维图像函数以获得图像的表示的步骤包括:推导出图像的一维函数。
11.根据前述任一权利要求所述的方法,进一步包括:
获得图像的进一步函数,其中对图像进行平移、缩放或者旋转得到的进一步函数是平移或者缩放的进一步的图像函数。
12.根据权利要求10或权利要求11所述的方法,其中所述的一维函数或进一步函数为圆周函数或者从圆周函数推导出的函数。
13.根据权利要求10、11和12中任意一项所述的方法,其中利用降低分辨率的二维图像函数来获取图像的表示的步骤包括:
使用所述一维函数或者进一步函数的频率表示的多个频率分量以获得图像的表示。
14.根据权利要求13所述的方法,其中所述频率分量通过傅立叶变换或者Haar变换确定。
15.根据权利要求13或14所述的方法,其中图像的表示通过以下步骤获得:
计算多个频率系数的幅值或者幅值的对数,以及
确定每个系数和其后连续的系数的幅值的差值或者幅值的对数的差值。
16.根据权利要求15所述的方法,进一步包括:
对各个所确定的差值应用阈值以获得二进制值,其中如果所述差值小于0,则记为0,如果所述差值大于或者等于0,则记为1。
17.根据权利要求16所述的方法,其中图像的表示包括由多个频率分量的幅值或者幅值的对数确定的二进制值。
18.根据上述权利要求中任意一项所述的方法,其中该方法包括通过在不同宽度的所述间隔内执行所述处理步骤,以获得图像的多个表示,并且结合多个表示以生成多分辨率表示。
19.根据权利要求18所述的方法,其中所述不同的间隔宽度至少有两个彼此不同的因素。
20.一种识别图像的方法,包括:
利用上述任何一项权利要求的方法获得图像的表示,以及
将所述表示与图像进行关联。
21.一种比较图像的方法,包括比较利用上述任何一项权利要求的方法获得的图像的表示。
22.根据权利要求21所述的方法,其中比较包括确定汉明距离。
23.根据权利要求21或22所述的方法,包括通过比较图像的表示来选择图像。
24.针对利用权利要求1至19中任意一项所述的方法获得的图像的表示的应用,包括传输、接受或者处理。
25.执行权利要求1至23中任意一项所述方法的装置。
26.包括指令的计算机可读介质,当指令运行时执行权利要求1到23中任何一项的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0700468.2A GB0700468D0 (en) | 2007-01-10 | 2007-01-10 | Improved image identification |
GB0700468.2 | 2007-01-10 | ||
PCT/GB2007/004676 WO2008084185A1 (en) | 2007-01-10 | 2007-12-06 | Improved image identification |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102317957A true CN102317957A (zh) | 2012-01-11 |
CN102317957B CN102317957B (zh) | 2014-04-09 |
Family
ID=37809751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780052143.5A Active CN102317957B (zh) | 2007-01-10 | 2007-12-06 | 改进的图像识别 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20090316993A1 (zh) |
EP (2) | EP2450833A1 (zh) |
JP (1) | JP5054122B2 (zh) |
CN (1) | CN102317957B (zh) |
GB (1) | GB0700468D0 (zh) |
WO (1) | WO2008084185A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484418A (zh) * | 2014-12-17 | 2015-04-01 | 中国科学技术大学 | 一种基于双分辨率的特征量化方法及系统 |
CN107358239A (zh) * | 2017-06-07 | 2017-11-17 | 南京航空航天大学 | 基于圆迹变换的图像不变特征提取方法 |
CN107424583A (zh) * | 2017-07-03 | 2017-12-01 | 威创集团股份有限公司 | 异形图像的显示数据处理方法和系统 |
CN108460393A (zh) * | 2018-03-12 | 2018-08-28 | 南昌航空大学 | 基于多分辨率Trace变换的图像不变特征提取方法 |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7593550B2 (en) | 2005-01-26 | 2009-09-22 | Honeywell International Inc. | Distance iris recognition |
US8098901B2 (en) | 2005-01-26 | 2012-01-17 | Honeywell International Inc. | Standoff iris recognition system |
US8049812B2 (en) * | 2006-03-03 | 2011-11-01 | Honeywell International Inc. | Camera with auto focus capability |
US8090157B2 (en) | 2005-01-26 | 2012-01-03 | Honeywell International Inc. | Approaches and apparatus for eye detection in a digital image |
US8064647B2 (en) | 2006-03-03 | 2011-11-22 | Honeywell International Inc. | System for iris detection tracking and recognition at a distance |
US8705808B2 (en) * | 2003-09-05 | 2014-04-22 | Honeywell International Inc. | Combined face and iris recognition system |
US8442276B2 (en) | 2006-03-03 | 2013-05-14 | Honeywell International Inc. | Invariant radial iris segmentation |
WO2007101276A1 (en) | 2006-03-03 | 2007-09-07 | Honeywell International, Inc. | Single lens splitter camera |
KR101308368B1 (ko) | 2006-03-03 | 2013-09-16 | 허니웰 인터내셔널 인코포레이티드 | 홍채 품질 측정을 갖는 홍채 인식 시스템 |
GB2450023B (en) | 2006-03-03 | 2011-06-08 | Honeywell Int Inc | An iris image encoding method |
JP2009529197A (ja) * | 2006-03-03 | 2009-08-13 | ハネウェル・インターナショナル・インコーポレーテッド | モジュールバイオメトリクス収集システムアーキテクチャ |
EP2315161A1 (en) * | 2006-10-11 | 2011-04-27 | Mitsubishi Electric Information Technology Centre Europe B.V. | Image descriptor for image recognition |
US8063889B2 (en) | 2007-04-25 | 2011-11-22 | Honeywell International Inc. | Biometric data collection system |
GB0719833D0 (en) | 2007-10-10 | 2007-11-21 | Mitsubishi Electric Inf Tech | Enhanced image identification |
GB0800364D0 (en) | 2008-01-09 | 2008-02-20 | Mitsubishi Electric Inf Tech | Feature-based signatures for image identification |
GB0807411D0 (en) | 2008-04-23 | 2008-05-28 | Mitsubishi Electric Inf Tech | Scale robust feature-based indentfiers for image identification |
US8436907B2 (en) | 2008-05-09 | 2013-05-07 | Honeywell International Inc. | Heterogeneous video capturing system |
US8090246B2 (en) | 2008-08-08 | 2012-01-03 | Honeywell International Inc. | Image acquisition system |
US8280119B2 (en) * | 2008-12-05 | 2012-10-02 | Honeywell International Inc. | Iris recognition system using quality metrics |
US8630464B2 (en) * | 2009-06-15 | 2014-01-14 | Honeywell International Inc. | Adaptive iris matching using database indexing |
US8472681B2 (en) | 2009-06-15 | 2013-06-25 | Honeywell International Inc. | Iris and ocular recognition system using trace transforms |
US8742887B2 (en) | 2010-09-03 | 2014-06-03 | Honeywell International Inc. | Biometric visitor check system |
US20120133777A1 (en) * | 2010-11-30 | 2012-05-31 | Microsoft Corporation | Camera tracking with user script control |
ES2901385T3 (es) | 2013-12-12 | 2022-03-22 | Fund Centro De Tecnologias De Interaccion Visual Y Comunicaciones Vicomtech | Método y sistema para describir una imagen |
US9811760B2 (en) * | 2015-07-31 | 2017-11-07 | Ford Global Technologies, Llc | Online per-feature descriptor customization |
KR101891410B1 (ko) * | 2016-12-09 | 2018-08-23 | 포항공과대학교 산학협력단 | 트레이스 변환을 이용한 역합성 개구면 레이더 영상의 표적 분류 장치 및 그 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020028027A1 (en) * | 2000-09-07 | 2002-03-07 | Fuji Xerox Co., Ltd. | Image processing device, image processing method, and recording medium storing image processing program |
US20050058195A1 (en) * | 2003-07-18 | 2005-03-17 | Samsung Electronics Co., Ltd. | GoF/GoP texture description method, and texture-based GoF/GoP retrieval method and apparatus using the same |
US20050111738A1 (en) * | 2003-10-07 | 2005-05-26 | Sony Corporation | Image matching method, program, and image matching system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10080012B4 (de) * | 1999-03-19 | 2005-04-14 | Matsushita Electric Works, Ltd., Kadoma | Dreidimensionales Verfahren zum Erkennen von Gegenständen und System zum Aufnehmen eines Gegenstandes aus einem Behältnis mit Verwendung des Verfahrens |
KR100308456B1 (ko) * | 1999-07-09 | 2001-11-02 | 오길록 | 주파수 공간상에서의 질감표현방법 및 질감기반 검색방법 |
JP2003067739A (ja) * | 2001-08-28 | 2003-03-07 | Monolith Co Ltd | 画像変換方法および装置 |
JP2003271177A (ja) * | 2002-03-15 | 2003-09-25 | Sharp Corp | 特徴量抽出方法、音声および音響に関する識別装置、画像および画像状態に関する識別装置ならびに特徴量抽出プログラム |
EP1498848A3 (en) * | 2003-07-18 | 2007-03-07 | Samsung Electronics Co., Ltd. | GoF/GoP texture description, and texture-based GoF/GoP retrieval |
US7581171B2 (en) * | 2004-01-06 | 2009-08-25 | Microsoft Corporation | Positionally encoded document image analysis and labeling |
US8600193B2 (en) * | 2008-07-16 | 2013-12-03 | Varian Medical Systems, Inc. | Image stitching and related method therefor |
-
2007
- 2007-01-10 GB GBGB0700468.2A patent/GB0700468D0/en not_active Ceased
- 2007-12-06 CN CN200780052143.5A patent/CN102317957B/zh active Active
- 2007-12-06 WO PCT/GB2007/004676 patent/WO2008084185A1/en active Application Filing
- 2007-12-06 JP JP2009545215A patent/JP5054122B2/ja active Active
- 2007-12-06 EP EP11195008A patent/EP2450833A1/en not_active Withdrawn
- 2007-12-06 US US12/522,669 patent/US20090316993A1/en not_active Abandoned
- 2007-12-06 EP EP07858778A patent/EP2126789B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020028027A1 (en) * | 2000-09-07 | 2002-03-07 | Fuji Xerox Co., Ltd. | Image processing device, image processing method, and recording medium storing image processing program |
US20050058195A1 (en) * | 2003-07-18 | 2005-03-17 | Samsung Electronics Co., Ltd. | GoF/GoP texture description method, and texture-based GoF/GoP retrieval method and apparatus using the same |
US20050111738A1 (en) * | 2003-10-07 | 2005-05-26 | Sony Corporation | Image matching method, program, and image matching system |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484418A (zh) * | 2014-12-17 | 2015-04-01 | 中国科学技术大学 | 一种基于双分辨率的特征量化方法及系统 |
CN104484418B (zh) * | 2014-12-17 | 2017-10-31 | 中国科学技术大学 | 一种基于双分辨率的特征量化方法及系统 |
CN107358239A (zh) * | 2017-06-07 | 2017-11-17 | 南京航空航天大学 | 基于圆迹变换的图像不变特征提取方法 |
CN107424583A (zh) * | 2017-07-03 | 2017-12-01 | 威创集团股份有限公司 | 异形图像的显示数据处理方法和系统 |
CN108460393A (zh) * | 2018-03-12 | 2018-08-28 | 南昌航空大学 | 基于多分辨率Trace变换的图像不变特征提取方法 |
CN108460393B (zh) * | 2018-03-12 | 2021-08-13 | 南昌航空大学 | 基于多分辨率Trace变换的图像不变特征提取方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2126789A1 (en) | 2009-12-02 |
JP5054122B2 (ja) | 2012-10-24 |
GB0700468D0 (en) | 2007-02-21 |
CN102317957B (zh) | 2014-04-09 |
WO2008084185A8 (en) | 2009-10-01 |
JP2010515991A (ja) | 2010-05-13 |
EP2450833A1 (en) | 2012-05-09 |
EP2126789B1 (en) | 2012-10-10 |
WO2008084185A1 (en) | 2008-07-17 |
US20090316993A1 (en) | 2009-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102317957A (zh) | 改进的图像识别 | |
US8655103B2 (en) | Deriving an image representation using frequency components of a frequency representation | |
Hayat et al. | Forgery detection in digital images via discrete wavelet and discrete cosine transforms | |
US8934545B2 (en) | Extraction of video fingerprints and identification of multimedia using video fingerprinting | |
EP3023882B1 (en) | Method and apparatus for generating fingerprint of an audio signal | |
KR101191516B1 (ko) | 향상된 이미지 식별 | |
US20120321125A1 (en) | Image processing method and apparatus | |
JP5199349B2 (ja) | 高性能画像識別 | |
Hazzaa | Manipulation detection in uncompressed video | |
Akle et al. | Use of wavelet-based basis functions to extract rotation invariant features for automatic image recognition | |
Sarma et al. | Image Forgery in Digital Image Forensics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190606 Address after: Tokyo, Japan, Japan Patentee after: Rakuten Inc. Address before: Tokyo, Japan Patentee before: Mitsubishi Electric Corporation |
|
TR01 | Transfer of patent right | ||
CP01 | Change in the name or title of a patent holder |
Address after: Tokyo, Japan Patentee after: Lotte Group Co.,Ltd. Address before: Tokyo, Japan Patentee before: Rakuten, Inc. |
|
CP01 | Change in the name or title of a patent holder |