CN111899180A - 一种图像关键像素方向定位方法 - Google Patents

一种图像关键像素方向定位方法 Download PDF

Info

Publication number
CN111899180A
CN111899180A CN201910366124.4A CN201910366124A CN111899180A CN 111899180 A CN111899180 A CN 111899180A CN 201910366124 A CN201910366124 A CN 201910366124A CN 111899180 A CN111899180 A CN 111899180A
Authority
CN
China
Prior art keywords
image
sigma
key
gradient
positioning method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910366124.4A
Other languages
English (en)
Other versions
CN111899180B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Voicetune Info Tech Co ltd
Original Assignee
Shanghai Voicetune Info Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Voicetune Info Tech Co ltd filed Critical Shanghai Voicetune Info Tech Co ltd
Priority to CN201910366124.4A priority Critical patent/CN111899180B/zh
Publication of CN111899180A publication Critical patent/CN111899180A/zh
Application granted granted Critical
Publication of CN111899180B publication Critical patent/CN111899180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种图像关键像素方向定位方法,具体包括以下步骤:1)输入原始图像I(x,y)和关键点坐标;2)对原始图像I(x,y)做尺度σ的高斯模糊,获得I(x,y,σ);3)在每个关键点周围m*σ邻域,做高斯加权,获得图像边缘信息的点梯度dx和dy;4)计算块梯度DX,Dy,并通过θ=tan‑1(Dx/Dy)公式获得方向角;5)计算旋转矩阵,以实现图像的旋转不变性。本发明属于图像处理领域,对图像关键像素表达赋予高精度方向定位,有利于在图像拼接和识别领域增强匹配能力,加强数据聚合力,减低数据空间表达维数。

Description

一种图像关键像素方向定位方法
技术领域
本发明属于图像处理领域,对图像关键像素表达赋予高精度方向定位,有利于在图像拼接和识别领域增强匹配能力,加强数据聚合力,减低数据空间表达维数。
背景技术
在图像处理中,图像描述子是局部图像表达的重要方法,在图像拼接和图像识别中有重要应用,目前国际流行的局部图像描述子有SIFT,SURF和ORB,前二者是专利技术,后者是非专利技术。这些技术通过在图像中搜索关键像素点,也称角点,然后在角点附近产生局部描述向量,跟角点坐标一起作为判别特征。这些用于描述的特征都具有方向性,以便于相关匹配。每种方法对方向的定义各不相同,SIFT使用梯度直方图,获得10度误差的方向角,SURF使用HAAR小波,获得11.5度的方向误差。ORB使用灰度质心可获得更高精度的方向角,但对光照比较敏感。三者对特定环境下的使用均具有一定的局限性,比如首先在计算复杂度上就限制了很多环境下的应用。
发明内容
本发明中,我们用I(x,y)表示最原始数字图像,它是具有宽度和高度限制的二维数字函数。譬如QVGA模式320x240,VGA模式640x480,甚至更高。用I(x,y,σ)表示对原始图像做方差σ的高斯滤波,也称为高斯平滑或高斯模糊,其中
Figure 66128DEST_PATH_IMAGE001
(1)
是高斯密度函数。在图像多尺度分析中,高斯模糊是非常重要的工具,其中的σ被称为尺度因子。图像经过高斯模糊就变得平滑连续,因此可以求导数,在离散数字图像中求导是用差分代替的,由此获得如下的差分方向图像
dx(x,y) = I(x+1,y, σ) – I(x-1,y, σ); (2)
dy(x,y)= I(x,y+1, σ) – I(x,y-1, σ); (3)
dx,dy代表了图像的边缘信息,目前常用的方法是用方向图计算图像梯度图,就是在每个像素位置,做dx,dy平方和的根方,其表达式为
Figure 983268DEST_PATH_IMAGE002
,梯度图受光线影响较低,人眼对其最敏感。因此SIFT对关键点的局部描述是这样生成的:在关键点周围m*σ邻域,分成36个扇形,然后通过高斯加权,计算每个扇形的梯度直方图,寻找直方图中最大的柱就是当前角点的方向。优点是角点方向不受光线影响,缺点是精度很差,误差至少10度,计算也复杂,在统计过程中还要做高斯加权。由于局部范围的点只有100多个,再分区计算,数据量太少,也会造成统计稳定差。SURF则是用HAAR小波,等同于求图像梯度。
本发明为了降低计算复杂度,提高定向精度,不再使用梯度图,也不用划分区域,但继续使用差分方向图像dx和dy,具体包括以下步骤:1)输入原始图像I(x,y)和关键点坐标;2)对原始图像I(x,y)做尺度σ的高斯模糊,获得I(x,y, σ);3)在每个关键点周围m*σ邻域,做高斯加权,获得图像边缘信息的点梯度dx 和dy;4)计算块梯度DX,Dy,并通过θ= tan-1(Dx/Dy)公式获得方向角;5)计算旋转矩阵
Figure 451421DEST_PATH_IMAGE003
,以实现图像的旋转不变性。
在步骤3)中,所述常量m取值范围为3≤m≤8,优选的,本发明取值为4.5即能获得满意效果。
在步骤4)中,所述块梯度DX和Dy的计算公式如下:
DX(x,y)=
Figure 846630DEST_PATH_IMAGE004
*dx(x+i,y+j)
Dy(x,y)=
Figure 864265DEST_PATH_IMAGE005
*dy(x+i,y+j)
公式中的
Figure 686727DEST_PATH_IMAGE006
是权变量, 通常取2σ为方差的高斯密度函数,本发明也可以取值为1,使算法更加简化,r为关键点周围邻域的半径,取值为步骤3)中的m*σ,本发明取为4.5σ;
另外,DX和Dy也可以通过其他类型梯度算子计算,比如SOBEL算子或HAAR小波计算,从而能够适应于积分图像的应用中。
在步骤5)中,所述旋转矩阵
Figure 953761DEST_PATH_IMAGE003
的两个参数,可用如下计算获得
Figure 74032DEST_PATH_IMAGE007
=
Figure 742911DEST_PATH_IMAGE008
Figure 939537DEST_PATH_IMAGE009
=
Figure 693867DEST_PATH_IMAGE010
上述描述,也可以推广到SURF中,只是差分方向用HAAR小坡取代,邻域半径做相应调整,就可获得更加简单便捷的方向计算方法。因此本发明完全可以替代所有现存像素方向定义,以便获得更精确和积极的计算效果,同时提高算法性能。
本发明因为没有使用梯度图,也不用划分区域,所以计算量大大下降,比如利用SIFT方式,在关键点对比上需要进行平方根运算,使用本发明的方式只需要加碱运算即可完成,而且角点精度误差由10度降低到1度,更适应嵌入式环境应用。
本发明提出的这种更合理的方向定义,其计算简单,方向精确,并且对光照环境要求也不高,所以具有很强的现实意义和产业化价值。
附图说明
图1为本发明的步骤框图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
在本发明的实施中,需要图像采集装置,我们使用了100MHz的ARM7芯片加QVGA数字摄像头,用数码管显示方向。在大多应用中,角点由角点探测算法直接产生的。我们为了模拟实验,用按键做角点坐标选择作为输入,模拟角点探侧器。一旦摄像头对准一个目标,输入角点坐标,数码管就会显示出当前坐标点的方向,范围为0到359。
本发明具体实施方式包括以下步骤:
1)输入原始图像I(x,y)和关键点坐标,其中关键点坐标即上述按键输入的角点坐标;
2)对原始图像I(x,y)做尺度σ的高斯模糊,获得I(x,y, σ);
3)在每个关键点周围4.5σ邻域,做高斯加权,获得图像边缘信息dx 和dy
4)计算块梯度DX,Dy,并通过θ= tan-1(Dx/Dy)公式获得方向角,为了节省计算量,我们可以把tan-1(Dx/Dy)部分做成一个表格,通过查表,可快速获得精度为1度的方向角;
其中DX和Dy的计算公式如下:
DX(x,y)=
Figure 788468DEST_PATH_IMAGE004
*dx(x+i,y+j)
Dy(x,y)=
Figure 436487DEST_PATH_IMAGE005
*dy(x+i,y+j)
公式中的
Figure 554747DEST_PATH_IMAGE006
是权变量, 通常取2σ为方差的高斯密度函数,也可以取值为1,使算法更加简化,r为关键点周围邻域的半径,取值为步骤3)中的4.5σ。;
5)计算旋转矩阵
Figure 796372DEST_PATH_IMAGE003
,以实现图像的旋转不变性。因为在很多相关应用中,方向角是不需要的,而代之用旋转矩阵,旋转矩阵的两个参数,可用如下计算获得
Figure 274758DEST_PATH_IMAGE007
=
Figure 918229DEST_PATH_IMAGE008
Figure 253396DEST_PATH_IMAGE009
=
Figure 903689DEST_PATH_IMAGE010
综上所述,本发明的关键像素方向算法,大大简化了计算复杂度,对方向定位更准确,对光照环境要求不高,可以用简单的ARM7实现。通过本发明提供的一种图像关键像素方向定位方法,不仅使得计算复杂度大幅降低,角点精度大大提高,而且算法稳定,受光照影响降低,特别适合对成本要求较高的嵌入式环境应用。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及领域应用,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (6)

1.一种图像关键像素方向定位方法,包括以下步骤:1)输入原始图像I(x,y)和关键点坐标;2)对原始图像I(x,y)做尺度σ的高斯模糊,获得I(x,y, σ);3)在每个关键点周围m*σ邻域,做高斯加权,获得图像边缘信息的点梯度dx 和dy;4)计算块梯度DX,Dy,并通过θ= tan-1(Dx/Dy)公式获得方向角;5)计算旋转矩阵
Figure 195522DEST_PATH_IMAGE001
,以实现图像的旋转不变性。
2.根据权利要求1所述的一种图像关键像素方向定位方法,其特征在于:所述步骤3)中的m取值范围为3≤m≤8。
3.根据权利要求1所述的一种图像关键像素方向定位方法,其特征在于:所述步骤4)中的块梯度DX和Dy的计算公式如下:
DX(x,y)=
Figure 138070DEST_PATH_IMAGE002
*dx(x+i,y+j)
Dy(x,y)=
Figure 185792DEST_PATH_IMAGE003
*dy(x+i,y+j)
其中
Figure 809671DEST_PATH_IMAGE004
表示权变量, 通常取2σ为方差的高斯密度函数,r为关键点周围邻域的半径,取值为所述步骤3)中的m*σ。
4.根据权利要求3所述的一种图像关键像素方向定位方法,其特征在于:所述
Figure 282241DEST_PATH_IMAGE004
也可以取值为1。
5.根据权利要求1所述的一种图像关键像素方向定位方法,其特征在于:所述步骤5)中的旋转矩阵的两个参数,可用如下计算获得:
Figure 317062DEST_PATH_IMAGE005
=
Figure 445555DEST_PATH_IMAGE006
Figure 669863DEST_PATH_IMAGE007
=
Figure 731360DEST_PATH_IMAGE008
6.根据权利要求3所述的一种图像关键像素方向定位方法,其特征在于:所述块梯度DX和Dy的计算公式,也可以通过其他类型梯度算子计算,比如SOBEL算子或HAAR小波计算,从而也适应于积分图像的应用中。
CN201910366124.4A 2019-05-05 2019-05-05 一种图像关键像素方向定位方法 Active CN111899180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910366124.4A CN111899180B (zh) 2019-05-05 2019-05-05 一种图像关键像素方向定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910366124.4A CN111899180B (zh) 2019-05-05 2019-05-05 一种图像关键像素方向定位方法

Publications (2)

Publication Number Publication Date
CN111899180A true CN111899180A (zh) 2020-11-06
CN111899180B CN111899180B (zh) 2023-11-17

Family

ID=73169065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910366124.4A Active CN111899180B (zh) 2019-05-05 2019-05-05 一种图像关键像素方向定位方法

Country Status (1)

Country Link
CN (1) CN111899180B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930287A (zh) * 2012-09-26 2013-02-13 上海理工大学 一种针对俯视行人的检测计数系统及方法
CN103593850A (zh) * 2013-11-26 2014-02-19 北京航空航天大学深圳研究院 一种在cuda平台上基于递归高斯滤波的sift并行化系统及方法
CN103729654A (zh) * 2014-01-22 2014-04-16 青岛新比特电子科技有限公司 基于改进sift算法的图像匹配检索系统
CN105913068A (zh) * 2016-04-27 2016-08-31 北京以萨技术股份有限公司 一种用于描述图像特征的多维方向梯度表示方法
CN106204429A (zh) * 2016-07-18 2016-12-07 合肥赑歌数据科技有限公司 一种基于sift特征的图像配准方法
CN107833249A (zh) * 2017-09-29 2018-03-23 南京航空航天大学 一种基于视觉引导的舰载机着陆过程姿态预估方法
CN108229579A (zh) * 2018-01-26 2018-06-29 南京信息工程大学 基于鲁棒旋转不变纹理特征的花粉图像分类识别方法
CN108364013A (zh) * 2018-03-15 2018-08-03 苏州大学 基于邻域高斯微分分布的图像关键点特征描述符提取方法、系统
CN109522878A (zh) * 2018-12-18 2019-03-26 南京信息工程大学 一种基于梯度的简单高效的指纹方向场计算方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930287A (zh) * 2012-09-26 2013-02-13 上海理工大学 一种针对俯视行人的检测计数系统及方法
CN103593850A (zh) * 2013-11-26 2014-02-19 北京航空航天大学深圳研究院 一种在cuda平台上基于递归高斯滤波的sift并行化系统及方法
CN103729654A (zh) * 2014-01-22 2014-04-16 青岛新比特电子科技有限公司 基于改进sift算法的图像匹配检索系统
CN105913068A (zh) * 2016-04-27 2016-08-31 北京以萨技术股份有限公司 一种用于描述图像特征的多维方向梯度表示方法
CN106204429A (zh) * 2016-07-18 2016-12-07 合肥赑歌数据科技有限公司 一种基于sift特征的图像配准方法
CN107833249A (zh) * 2017-09-29 2018-03-23 南京航空航天大学 一种基于视觉引导的舰载机着陆过程姿态预估方法
CN108229579A (zh) * 2018-01-26 2018-06-29 南京信息工程大学 基于鲁棒旋转不变纹理特征的花粉图像分类识别方法
CN108364013A (zh) * 2018-03-15 2018-08-03 苏州大学 基于邻域高斯微分分布的图像关键点特征描述符提取方法、系统
CN109522878A (zh) * 2018-12-18 2019-03-26 南京信息工程大学 一种基于梯度的简单高效的指纹方向场计算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王强;成虹;: "一种新的图像关键点描述子", 成都工业学院学报, no. 02 *

Also Published As

Publication number Publication date
CN111899180B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN106960451B (zh) 一种提升图像弱纹理区域特征点数量的方法
CN108427924B (zh) 一种基于旋转敏感特征的文本回归检测方法
CN108122256B (zh) 一种逼近状态下旋转目标位姿测量的方法
CN111080529A (zh) 一种加强鲁棒性的无人机航拍图像拼接方法
Schmidt et al. Comparative assessment of point feature detectors in the context of robot navigation
CN111401266B (zh) 绘本角点定位的方法、设备、计算机设备和可读存储介质
Han et al. CAD-based 3D objects recognition in monocular images for mobile augmented reality
CN111680699B (zh) 一种基于背景抑制的空地红外时敏弱小目标检测方法
Hsu et al. Regressive tree structured model for facial landmark localization
CN106296587B (zh) 轮胎模具图像的拼接方法
US20210350165A1 (en) Methods and apparatus for generating point cloud histograms
Kang et al. Yolo-6d+: single shot 6d pose estimation using privileged silhouette information
Zhang et al. A robust visual odometry based on RGB-D camera in dynamic indoor environments
CN111626307A (zh) 一种基于l-orb算法的植株图像实时拼接方法
Ma et al. Color-saliency-aware correlation filters with approximate affine transform for visual tracking
Dai et al. An Improved ORB Feature Extraction Algorithm Based on Enhanced Image and Truncated Adaptive Threshold
CN113240656A (zh) 视觉定位方法及相关装置、设备
Akman et al. Multi-cue hand detection and tracking for a head-mounted augmented reality system
Wu et al. Exploiting superpixel and hybrid hash for kernel-based visual tracking
Brynte et al. Rigidity preserving image transformations and equivariance in perspective
CN111899180B (zh) 一种图像关键像素方向定位方法
CN113570535B (zh) 视觉定位方法及相关装置、设备
CN111161408B (zh) 一种实现增强现实的方法及其应用、计算设备
He et al. A cylindrical shape descriptor for registration of unstructured point clouds from real-time 3D sensors
EP3942469B1 (en) A method and device for recognizing a gesture in real-time

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant