CN105023021A - 一种基于主方向模板的特征匹配方法 - Google Patents
一种基于主方向模板的特征匹配方法 Download PDFInfo
- Publication number
- CN105023021A CN105023021A CN201510398992.2A CN201510398992A CN105023021A CN 105023021 A CN105023021 A CN 105023021A CN 201510398992 A CN201510398992 A CN 201510398992A CN 105023021 A CN105023021 A CN 105023021A
- Authority
- CN
- China
- Prior art keywords
- grid
- template
- sample graph
- gradient
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明属于图像处理技术领域,特别是涉及一种基于主方向模板的特征匹配方法。本发明包括以下步骤:步骤1:将目标图和样本图都分割为网格,且网格的大小相同,计算每个网格中的像素点的梯度值和梯度方向;步骤2:每个网格使用其最大的梯度方向进行表示,且将梯度方向和是否具有明显的梯度值使用字节进行存储;步骤3:样本图与目标图的网格模板特征按位异或匹配;步骤4:匹配结果为“111”,则两个网格模板特征匹配,并确定样本图中的匹配网格数量。本发明对模板特征进行压缩,且使用单字节进行存储,降低了内存的消耗。
Description
技术领域
本发明属于图像处理技术领域,特别是涉及一种基于主方向模板的特征匹配方法,通过目标图像和样本图像主方向模板的最大梯度方向进行特征匹配的方法。
背景技术
近年来,模板匹配吸引了很多的关注,已经成为物体检测的重要方法之一,其目标在于在图像(样本)中寻找特定的物体(目标)。模板匹配一般使用全局特征,而目标的特征描述被称为模板。其优点在于能够通过添加和学习不同的模板而适应不同场合的需要。它通过在样本图像中滑动小窗口,并且比较小窗口与目标的内容进行判断。其特点是定位过程比较简单,但是遍历图片的运算复杂度较高,因此需要快速有效地表示和匹配模板的特征。
为了加快特征的提取与匹配速度,Hinterstoisser[1]等人提出了主方向模板(Dominant Orientation Template,简称DOT)特征。主方向模板特征既保留了局部统计方法的优点,又将滑动窗口分割为网格。在对网格中的梯度进行统计的时候,主方向模板特征将梯度的方向量化到7个,并且只保留网格中梯度较大的方向,额外增加1个比特用于表明网格中没有明显的梯度变化,从而可以保存到一个字节(8个比特)中。两个主方向模板特征的相似程度即可用匹配的网格数量体现。此外,主方向模板特征还使用了按位的表示法和计算,从而大幅度降低了提取与比较特征的计算复杂度。对于两个主方向模板特征中匹配的网格,按位与(AND)操作结果为1。为了进一步加速匹配,DOT特征匹配使用的函数利用SSE2指令集进行并行处理。为了适应多目标检索和旋转、仿射变换等情况下的不变性,模板匹配模型往往需要训练大量的模板。对于主方向模板特征而言,在使用默认设置的情况下,原始的实现方式对目标使用范围[-7,7]之间的变形矩阵,并在360度的圆周内每10度提取一个模板特征。这样,在线训练的结果会产生大约500个模板。即使使用聚类的方法消除部分较为相似的模板,模板的总数仍然还有200个左右。存储该模板特征需要消耗大量的空间。此外,主方向模板特征对按位与操作的16比特结果建立查询表并获得匹配的网格数量,该查询表也占用了大量内存空间。
参考文献:
[1].Hinterstoisser S,Lepetit V,Ilic S,etal.Dominant orientationtemplates for real-time detection of texture-less objects[C],Proceedings of IEEE Computer Society Conference on ComputerVision and Pattern Recognition.New York:IEEE,2010:2257-2264。
发明内容
针对模板数量较大之时主方向模板特征在存储空间上消耗过大的问题,提出了一种基于主方向模板的特征匹配方法,对于模板特征采用紧凑表示法并设计了与之对应的匹配过程。
本发明采用如下技术方案:
一种基于主方向模板的特征匹配方法,其特征在于包括如下步骤:
步骤1:将目标图和样本图都分割为网格,且网格的大小相同,目标图被分割为N个网格,用Ai表示目标图中第i个网格,样本图被分割为M个网格,用Bj表示样本图中第j个网格;计算目标图和样本图的每个网格中的像素梯度,像素点(k,l)的梯度值公式为:
梯度方向公式为:
其中,zk,l为像素坐标点(k,l)位置的灰度值;
步骤2:比较每个网格中所有的像素点的梯度值,获取最大的梯度值对应的梯度方向,将像素梯度方向量化到7个组上,梯度量化公式为:
其中,integer()表示对括号里的值取整,引入一个组用于表示该网格是否有明显的梯度值,网格的模板特征包括最大梯度方向和是否具有明显梯度值,用3个比特的二进制数值表示为X,目标图网格的模板特征Ai=X,而样本图网格的模板特征Bj=~X,将计算结果按位取反作为样本图网格的梯度特征;
步骤3:样本图与目标图的模板特征匹配,即样本图中所有网格与目标图中的部分网格进行模板特征匹配,匹配结果公式为Ai⊕Bj;
步骤4:匹配结果为“111”,则两个网格模板特征匹配,并确定样本图中的匹配网格数量,当网格匹配数为样本图的网格总数M时,则确定样本图在目标图中的位置。
进一步的,步骤2中网格的模板特征可用单字节、双字节、四字节或八字节存储。
进一步的,步骤2中将两个网格的模板特征存储在一个字节中。
进一步的,步骤2中用一个字节中的高六位或低六位存储两个网格的模板特征。
进一步的,步骤2梯度量化公式为其中round()为四舍五入函数。
进一步的,步骤4还包括查表法,对比查询表,确定网格匹配数量,所述查询表包括匹配结果与相对应的网格匹配数量。
相对于主方向模板特征,本发明具有以下优点:1.本发明只使用网格中最大的1个梯度方向作为该网格的模板特征描述,使得模板特征描述的种类从28降低到23。这样,原有的8个比特的表示方法就可以压缩到3个比特当中,实现特征的压缩。2.本发明的能量方程用异或操作,查表法改为对异或操作的结果进行查表。由于本发明使用单字节单位进行存储,因此只需对8比特的异或操作结果建立查询表,这样就使得内存消耗进一步降低。
附图说明
图1是主方向模板与本发明一实施例的梯度特征表示法对比图;
图2是基于主方向模板的特征匹配方法的部分查询表。
具体实施方式
为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
现结合附图和具体实施方式对本发明进一步说明。
本发明提出了一种基于主方向模板的特征匹配方法,包括以下几个步骤:
步骤1:将目标图和样本图都分割为网格,且网格的大小相同,计算每个网格中的像素点的梯度值和梯度方向。
该实施例将目标图和样本图分割为大小相同的网格,每个网格均为7×7像素。本领域的技术人员可知,网格的大小不限于7×7像素,还可分割为其他大小的像素。根据需要,技术人员可自定义网格大小。
目标图被分割为N个网格,用Ai表示目标图中第i个网格;样本图被分割为M个网格,用Bj表示样本图中第j个网格。计算目标图和样本图的每个网格中的像素梯度,像素点(k,l)的梯度值公式为:
梯度方向公式为:
其中,zk,l为像素坐标点(k,l)位置的灰度值;
步骤2:每个网格使用其最大的梯度方向进行表示,且将梯度方向和是否具有明显的梯度值使用字节进行存储。比较每个网格中所有的像素点的梯度值,获取最大的梯度值对应的梯度方向,并将像素梯度方向量化到7个组上,梯度量化公式为:
其中,round()表示四舍五入函数。同时,引入一个组用于表示该网格是否有明显的梯度值,最大值为8的数可以用3个比特的二进制数值表示。网格的模板特征包括最大梯度方向和是否具有明显梯度值,可用3个比特的二进制数值表示为X。目标图网格的模板特征Ai=X,而样本图网格的模板特征Bj=~X,(将计算结果按位取反作为样本图网格的梯度特征)。如果某个网格在0度上得到明显的梯度值,其模板特征X=000,则目标图中的网格的模板特征表示为Ai=X=000,而样本图中的网格的模板特征表示为Bj=~X=111。参阅图1所示,为主方向模板与本发明一实施例的梯度特征表示法对比图,将原有的8个比特的模板特征表示方法压缩为3个比特中,大大减少了模板特征的存储空间。
步骤3:样本图与目标图的模板特征匹配,即样本图中所有网格与目标图中的部分网格进行模板特征匹配,匹配公式为Ai⊕Bj。假设样本图中的网格Bj=101,目标图中的网格Ai=010,匹配结果为Ai⊕Bj=111;若Ai+1=011,匹配结果为Ai+1⊕Bj=110。
将3个比特的单个网格模板特征放到字节单位之中,无法填满整个字节,将其余的比特舍弃,置为零。计算机在处理数据时会调用SSE2指令集,根据SSE2指令集的设置,可并行处理的字节单位大小可以为单字节(8比特)、双字节(16比特)、四字节(32比特)和八字节(64比特)。为了能够使用计算机中的SSE2指令进行匹配处理,网格的模板特征需要放入1个字节(8个比特)的整数倍的存储单位中。
步骤4:检查样本图中所有网格模板特征的匹配结果,匹配结果为“111”,则表示样本图和目标图的网格模板特征匹配。并确定样本图中的匹配网格数量,当网格匹配数为样本图的网格总数M时,则确定样本图在目标图中的位置。
需要说明的是,梯度量化公式,该实施例采用的是四舍五入取整,本领域的技术人员可知,还可采用其他的方式取整,如截去小数取整,截去小数向上取整数,截去小数向下取整等。
为了加快计算速度,使用查表法获得样本图匹配的网格数量。查表法所使用的查询表可以事先离线计算获得,保存在磁盘与内存中。查询表包括匹配结果与相对应的网格匹配数量。
字节单位的大小会影响查表法使用的查询表大小以及比特的利用率。比特的利用率还进一步影响到模板特征匹配的处理时间。比特的利用率越高,则SSE2指令所处理的模板特征的矢量长度就越短,处理时间也会大幅度降低。虽然8比特字节单位浪费了最多的比特数,但是其查询表却最小,而且相对于原始主方向模板特征的查询表更小。16比特字节单位比8比特字节单位的比特利用率高,但是查询表略大,与原始主方向模板特征的查询表相同。32比特字节单位与64比特字节单位的查询表过大,一般无法直接放入内存中。
综合以上考虑,本发明使用8比特的字节单位,即将3个比特的梯度特征放入单字节(8比特)中。因此,一个字节中可以存放两个网格的特征描述,剩余2个比特舍弃不用。存储方式为00aaabbb或aaabbb00,还可采用其他类型的存储方式。参阅图2所示,为基于主方向模板的特征匹配方法的部分查询表。对每个字节单位的匹配数量求和,获得样本图中所有网格的模板特征匹配数量。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
Claims (6)
1.一种基于主方向模板的特征匹配方法,其特征在于包括如下步骤:
步骤1:将目标图和样本图都分割为网格,且网格的大小相同,目标图被分割为N个网格,用Ai表示目标图中第i个网格,样本图被分割为M个网格,用Bj表示样本图中第j个网格;计算目标图和样本图的每个网格中的像素梯度,像素点(k,l)的梯度值公式为:
梯度方向公式为:
其中,zk,l为像素坐标点(k,l)位置的灰度值;
步骤2:比较每个网格中所有的像素点的梯度值,获取最大的梯度值对应的梯度方向,将像素梯度方向量化到7个组上,梯度量化公式为:
其中,integer()表示对括号里的值取整,引入一个组用于表示该网格是否有明显的梯度值,网格的模板特征包括最大梯度方向和是否具有明显梯度值,用3个比特的二进制数值表示为X,目标图网格的模板特征Ai=X,而样本图网格的模板特征Bj=~X,将计算结果按位取反作为样本图网格的梯度特征;
步骤3:样本图与目标图的模板特征匹配,即样本图中所有网格与目标图中的部分网格进行模板特征匹配,匹配结果公式为Ai⊕Bj;
步骤4:匹配结果为“111”,则两个网格模板特征匹配,并确定样本图中的匹配网格数量,当网格匹配数为样本图的网格总数M时,则确定样本图在目标图中的位置。
2.如权利要求1所述的基于主方向模板的特征匹配方法,其特征在于:所述步骤2中网格的模板特征可用单字节、双字节、四字节或八字节存储。
3.如权利要求2所述的基于主方向模板的特征匹配方法,其特征在于:所述步骤2中将两个网格的模板特征存储在一个字节中。
4.如权利要求3所述的基于主方向模板的特征匹配方法,其特征在于:所述步骤2中用一个字节中的高六位或低六位存储两个网格的模板特征。
5.如权利要求1所述的基于主方向模板的特征匹配方法,其特征在于:所述步骤2梯度量化公式为其中round()为四舍五入函数。
6.如权利要求1所述的基于主方向模板的特征匹配方法,其特征在于:所述步骤4还包括查表法,对比查询表,确定网格匹配数量,所述查询表包括匹配结果与相对应的网格匹配数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510398992.2A CN105023021A (zh) | 2015-07-09 | 2015-07-09 | 一种基于主方向模板的特征匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510398992.2A CN105023021A (zh) | 2015-07-09 | 2015-07-09 | 一种基于主方向模板的特征匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105023021A true CN105023021A (zh) | 2015-11-04 |
Family
ID=54412975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510398992.2A Pending CN105023021A (zh) | 2015-07-09 | 2015-07-09 | 一种基于主方向模板的特征匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105023021A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107481273A (zh) * | 2017-07-12 | 2017-12-15 | 南京航空航天大学 | 一种航天器自主导航快速图像匹配方法 |
CN111079802A (zh) * | 2019-12-02 | 2020-04-28 | 易思维(杭州)科技有限公司 | 一种基于梯度信息的匹配方法 |
CN112367522A (zh) * | 2020-10-30 | 2021-02-12 | 京东方科技集团股份有限公司 | 图像压缩、解压缩处理方法和系统 |
CN112925710A (zh) * | 2021-02-26 | 2021-06-08 | 西南民族大学 | 一种基于梯度下降优化的模糊测试方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101553869A (zh) * | 2006-11-06 | 2009-10-07 | 诺基亚公司 | 用于进行有效压缩的动态量化器结构 |
CN102968632A (zh) * | 2012-10-15 | 2013-03-13 | 北京大学 | 获取图像的紧凑全局特征描述子的方法及图像检索方法 |
CN104615634A (zh) * | 2014-11-10 | 2015-05-13 | 广东智冠信息技术股份有限公司 | 基于方向特征的手掌静脉指导性快速检索方法 |
-
2015
- 2015-07-09 CN CN201510398992.2A patent/CN105023021A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101553869A (zh) * | 2006-11-06 | 2009-10-07 | 诺基亚公司 | 用于进行有效压缩的动态量化器结构 |
CN102968632A (zh) * | 2012-10-15 | 2013-03-13 | 北京大学 | 获取图像的紧凑全局特征描述子的方法及图像检索方法 |
CN104615634A (zh) * | 2014-11-10 | 2015-05-13 | 广东智冠信息技术股份有限公司 | 基于方向特征的手掌静脉指导性快速检索方法 |
Non-Patent Citations (1)
Title |
---|
HINTERSTOISSER STEFAN等: ""Dominant orientation templates for real-time detection of texture-less objects"", 《PROCEEDINGS OF IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107481273A (zh) * | 2017-07-12 | 2017-12-15 | 南京航空航天大学 | 一种航天器自主导航快速图像匹配方法 |
CN107481273B (zh) * | 2017-07-12 | 2021-01-15 | 南京航空航天大学 | 一种航天器自主导航快速图像匹配方法 |
CN111079802A (zh) * | 2019-12-02 | 2020-04-28 | 易思维(杭州)科技有限公司 | 一种基于梯度信息的匹配方法 |
CN111079802B (zh) * | 2019-12-02 | 2023-04-07 | 易思维(杭州)科技有限公司 | 一种基于梯度信息的匹配方法 |
CN112367522A (zh) * | 2020-10-30 | 2021-02-12 | 京东方科技集团股份有限公司 | 图像压缩、解压缩处理方法和系统 |
CN112925710A (zh) * | 2021-02-26 | 2021-06-08 | 西南民族大学 | 一种基于梯度下降优化的模糊测试方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Object detection based on RGC mask R‐CNN | |
CN107169563B (zh) | 应用于二值权重卷积网络的处理系统及方法 | |
CN106250939B (zh) | 基于fpga+arm多层卷积神经网络的手写体字符识别方法 | |
CN109741318B (zh) | 基于有效感受野的单阶段多尺度特定目标的实时检测方法 | |
CN108416422A (zh) | 一种基于fpga的卷积神经网络实现方法及装置 | |
CN110222760B (zh) | 一种基于winograd算法的快速图像处理方法 | |
CN105023021A (zh) | 一种基于主方向模板的特征匹配方法 | |
CN106570141A (zh) | 近似重复图像检测方法 | |
CN109117950A (zh) | 基于人工智能设备的分层稀疏张量压缩方法 | |
CN111428557A (zh) | 基于神经网络模型的手写签名的自动校验的方法和装置 | |
CN109886341A (zh) | 一种训练生成人脸检测模型的方法 | |
JP2021503123A (ja) | ビデオ要約生成方法及び装置、電子機器並びにコンピュータ記憶媒体 | |
CN112257844B (zh) | 一种基于混合精度配置的卷积神经网络加速器及其实现方法 | |
CN111191685A (zh) | 一种损失函数动态加权的方法 | |
CN104504406A (zh) | 一种快速高效的近似重复图像匹配方法 | |
CN109740758A (zh) | 一种基于量子计算的核方法 | |
CN109685208A (zh) | 一种用于神经网络处理器数据稀梳化加速的方法及装置 | |
Peng et al. | New network based on D-LinkNet and densenet for high resolution satellite imagery road extraction | |
CN110768864B (zh) | 一种网络流量批量生成图像的方法及装置 | |
CN104933733A (zh) | 一种基于稀疏特征选择的目标跟踪方法 | |
CN111738021A (zh) | 神经机器翻译模型的词向量处理方法、装置及存储介质 | |
CN106502775A (zh) | 一种分时调度dsp算法的方法和系统 | |
CN107247944A (zh) | 基于深度学习的人脸检测速度优化方法及装置 | |
Wang et al. | The Four Arithmetic Operations for Handwritten Digit Recognition Based On Convolutional Neural Network | |
CN112036501A (zh) | 基于卷积神经网络的图片的相似度检测方法及其相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151104 |
|
RJ01 | Rejection of invention patent application after publication |