CN102004921A - 基于图像特征分析的目标辨识方法 - Google Patents
基于图像特征分析的目标辨识方法 Download PDFInfo
- Publication number
- CN102004921A CN102004921A CN2010105598545A CN201010559854A CN102004921A CN 102004921 A CN102004921 A CN 102004921A CN 2010105598545 A CN2010105598545 A CN 2010105598545A CN 201010559854 A CN201010559854 A CN 201010559854A CN 102004921 A CN102004921 A CN 102004921A
- Authority
- CN
- China
- Prior art keywords
- gradient
- unique point
- image
- identification method
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种基于图像特征分析的目标辨识方法,包括如下步骤:以SIFT特征点为中心,选取2×2个子区域;将每个所述子区域的8个梯度方向的梯度幅值进行规范化处理,从所述8个梯度方向中选取梯度幅值最大的梯度方向,将所述梯度幅值最大的梯度方向旋转至X轴或者Y轴,旋转后,选取位于X轴和Y轴上的4个梯度方向;计算并比较梯度幅值的大小,在特征点向量匹配阈值范围内,选取梯度方向集中的特征点作为所述图像的SIFT特征点。本发明的方法减少了SIFT特征向量的维数和特征点的数量而不影响图像匹配效果,加强了对环境目标识别的速度和准确度,提高了整个算法的实时在线运行速度和匹配的准确度。
Description
技术领域
本发明涉及一种基于图像特征分析的目标辨识方法,尤其涉及一种在智能移动机器人探测未知空间的局部环境领域内,基于图像特征分析的目标辨识方法。
背景技术
人类对外界环境信息的获取有70%以上都来自于视觉,可见视觉导航方式是智能移动机器人导航的一个主要发展方向。现有技术公开的文献(李桂芝和安成万.基于场景识别的移动机器人定位方法研究[J].机器人,2005.27(2):23-26)提出了一种基于电荷耦合元件(Charge-coupled Device,CCD)视频采集对场景进行识别的移动机器人定位方法,以全局特征场景识别对移动机器人定位,通过Gabor滤波器提取图像的全局纹理特征,并使用支持向量机(Support VectorMachine,SVM)对其进行分类,实现基于图像的场景识别。由于每类图像对应于机器人工作环境中的某个位置,从而实现机器人的逻辑定位。此种方法的不足之处在于:机器人在未知环境中采集的场景样本图像很多,属于小样本识别问题的向量机并不适用于大样本的基于全局特征的场景匹配问题。
现有技术公开的另一文献(庄严,徐晓东和王伟,移动机器人几何-拓扑混合地图的构建及自定位研究[J].控制与决策,2005.20(7):817-822.)提出基于墙角、房门和通路等高级环境特征的辨识与提取,以对局部环境特征进行辨识。也有学者根据移动机器人工作环境和具体导航要求的不同,采取相应的数字图像处理技术对室内环境中的垂直边缘与激光传感器提取的水平线段特征进行处理,以此作为机器人进行定位的简单几何特征。加拿大科学家David Lowe提出尺度不变特征转换(Scale-invariant feature transform,SIFT)技术,详见公开文献(Lowe,D.G.,Distinctive Image Features from Scale-Invariant Keypoints[J].International Journal of Computer Vision 2004.60(2):91-110.)。该方法在尺度空间上计算高斯之差,并根据其最大最小值决定具有尺度、旋转和平移不变性的兴趣点位置,数据经过处理后作为路标。正因为提供了一种自底向上的良好的自然环境特征提取方案,且所提取的特征具有良好的尺度等不变性,SIFT方法很快在移动机器人视觉建模与定位领域得到了比较广泛的采用。SIFT方法在特征提取的可靠性、稳定性、计算效率、匹配精度等方面的综合性高。
然而,在上述SIFT方法中,标准的SIFT特征描述向量维度有128位,无论在计算或是储存过程中都需要占用大量的资源。而且每幅图像的特征点较多,例如,150幅图像库的特征点数量可达近40,000个,如此庞大的数据不仅对实时在线的特征匹配计算造成重要的负担,而且还容易形成错误的匹配。
发明内容
本发明的目的在于提供一种能够减少SIFT特征向量的维数和减少特征点的数量而不影响图像匹配效果的基于图像特征分析的目标辨识方法。
一种基于图像特征分析的目标辨识方法,包括如下步骤:以SIFT特征点为中心,选取2×2个子区域;将每个所述子区域的8个梯度方向的梯度幅值进行规范化处理,从所述8个梯度方向中选取梯度幅值最大的梯度方向,将所述梯度幅值最大的梯度方向旋转至X轴或者Y轴,旋转后,选取位于X轴和Y轴上的4个梯度方向;计算并比较梯度幅值的大小,在特征点向量匹配阈值范围内,选取梯度方向集中的特征点作为所述图像的SIFT特征点。
本发明优选的一种技术方案,所述SIFT特征点向量为2x2x4=16维数。
本发明优选的一种技术方案,所述将梯度幅值进行规范化处理的步骤通过将梯度幅值除以某一常数或者最大梯度幅值实现。
本发明优选的一种技术方案,将所述梯度幅值最大的梯度方向旋转至X轴正方向。
本发明优选的一种技术方案,选取梯度方向集中的特征点作为所述图像的SIFT特征点的步骤中,选取的特征点占总的特征点数的25%~30%。
本发明优选的一种技术方案,当所述图像为320x240的图像时,选取的特征点的个数为50。
本发明优选的一种技术方案,采用计算两个特征点向量之间的欧几里得距离,并将所述距离与所述阈值比较,若所述距离在所述阈值范围内,则所述两个特征点之间匹配。
与现有技术相比,本发明的基于图像特征分析的目标辨识方法可以显著地减少SIFT特征向量的维数和图像的SIFT特征点的数量,减少了占用的储存资源和计算时间,对于实时在线计算要求严格的任务来说,本方法有着较大的优势。另外梯度向量经过旋转处理后,对图像发生旋转的影响产生了较好的鲁棒性,提高了实时在线的运算速度和准确度。
附图说明
图1是本发明的基于图像特征分析的目标辨识方法的流程图。
图2是以特征点为中心的领域梯度方向的示意图。
图3是图2所示的关键特征点的向量示意图。
图4是本发明的基于图像特征分析的目标辨识方法中最大梯度旋转前的示意图。
图5是本发明的基于图像特征分析的目标辨识方法中最大梯度旋转后的示意图。
具体实施方式
本发明的基于图像特征分析的目标辨识方法主要包括如下三个步骤:降低特征点向量的维度;最大梯度旋转规范化;减少特征点的数量。下面结合附图对本发明的基于图像特征分析的目标辨识方法作进一步的详细描述。
请参阅图1,图1是本发明的基于图像特征分析的目标辨识方法的流程图。首先,以SIFT特征点为中心,选取2×2个子区域。因为传统的SIFT特征点向量维度是128位,也就是4x4x8,每个子区域的梯度方向有8个方向组成,这8个方向在直角坐标系上间隔45度分布,而这样的子区域以特征点为中心共有4x4=16个。实际上,在标准的SIFT算法中,在计算子区域的梯度向量时,由于以特征点为中心的二维高斯加权函数的约束,使远离特征点中心的子区域梯度幅值减小,其参与特征点梯度计算的权值也相应的降低了,因而,离特征点中心最近的子区域在SIFT特征向量的计算中起主导作用,如图2、图3所示。而且,在机器人SLAM(Simultaneous Localization And Mapping)环境中,机器人需要识别的是较大的局部环境特征,而不是像医学图像(如组织器官等)的辨认、样本产品分析那样进行局部微小片断的识别。因此,本方法只取以特征点为中心的2x2个子区域,每个子区域取4个梯度方向,由此得出的特征点向量就变成了2x2x4=16维数。
最大梯度旋转规范化主要包括两个步骤:将每个子区域的8个梯度方向的梯度幅值进行规范化处理;从所述8个梯度方向中选取梯度幅值最大的梯度方向,旋转所述幅值最大梯度的方向。优选的,所述将梯度幅值进行规范化处理的步骤通过将梯度幅值除以某一常数或者最大梯度幅值实现。将8个梯度方向的梯度幅值进行规范化处理后,得到幅值规范化的一组梯度向量,以具备对图像明暗变化的鲁棒性(Robustness)。从8个梯度方向中找到幅值最大的梯度方向,并将该方向旋转至Y轴的正向,如图4所示。梯度经过旋转处理后,对图像发生旋转的影响产生鲁棒性,此时,取位于X轴和Y轴上的4个梯度方向,如图5所示。至此,完成特征向量维度的优化,该过程是在图像的SIFT产生过程中实现的。本发明的基于图像特征分析的目标辨识方法中,减少向量的维度只有在非常细微辨别方面的辨识功能降低了。
最后,减少特征点的数量,此过程在特征点匹配的过程中进行。两个对应的特征点向量的匹配方法是采用计算其欧几里得(Euclidean)距离来决定的,当这个距离在一定的门限内时,就认为两点是匹配的,定义这个匹配最小距离值为阈值,当这个阈值越小时,可能匹配的点就越少,但是匹配的正确率却越高。因此,在计算一幅图像的特征点时,选取具有明显特征的特征点,通过计算比较其梯度的幅值(Magnitude)大小,选取梯度方向集中(mono-Orientation)的特征点作为所述图像的SIFT特征点。当区域中有3~5个正确的特征点就可以完成识别的任务。优选的,选取的特征点占总的特征点数的25%~30%。当所述图像为320x240的图像时,所述特征点的个数为50。
与现有技术相比,本发明的基于图像特征分析的目标辨识方法可以显著地减少SIFT特征向量的维数,使SIFT特征向量从128维/点变成16维/点,并且图像的SIFT特征点的数据减少到原来的25%左右,因此,不仅存在储存方面的优势,在计算时间上也有很大提高,对于实时在线计算要求严格的任务来说,本方法有着较大的优势。
本发明虽然减少了维度的数量,会出现一些假的匹配点,但是通过提高特征点匹配的要求,即降低匹配阈值,实现正确选取少的特征点,并不会降低图像匹配率。另外梯度向量经过旋转处理后,对图像发生旋转的影响产生了较好的鲁棒性,提高了实时在线的运算速度和准确度。
本发明的基于图像特征分析的目标辨识方法有效地降低了基于视觉的移动机器人的导航与定位算法的复杂度,通过对周围环境的图像分析和理解,加强对局部环境中目标特征的识别效率,提高了实时在线的运算速度和定位的准确度,对于智能移动机器人在探测未知空间环境应用上,有效地提高了机器人的自身定位和创建环境地图的可靠性、稳定性以及高效性。
本发明的基于图像特征分析的目标辨识方法的最大梯度旋转规范化步骤中,从8个梯度方向中找到幅值最大的梯度方向,并将该方向旋转至Y轴的正向,也可以将该方向旋转至Y轴的负向、或者X轴的正向或者负向上,但并不限于上述实施方式所述。
在不偏离本发明的精神和范围的情况下还可以构成许多有很大差别的实施例。应当理解,除了如所附的权利要求所限定的,本发明不限于在说明书中所述的具体实施例。
Claims (7)
1.一种基于图像特征分析的目标辨识方法,其特征在于,包括如下步骤:
以SIFT特征点为中心,选取2×2个子区域;
将每个所述子区域的8个梯度方向的梯度幅值进行规范化处理,从所述8个梯度方向中选取梯度幅值最大的梯度方向,将所述梯度幅值最大的梯度方向旋转至X轴或者Y轴,旋转后,选取位于X轴和Y轴上的4个梯度方向;
计算并比较梯度幅值的大小,在特征点向量匹配阈值范围内,选取梯度方向集中的特征点作为所述图像的SIFT特征点。
2.如权利要求1所述的基于图像特征分析的目标辨识方法,其特征在于,所述SIFT特征点向量为2x2x4=16维数。
3.如权利要求1所述的基于图像特征分析的目标辨识方法,其特征在于,所述将梯度幅值进行规范化处理的步骤通过将梯度幅值除以某一常数或者最大梯度幅值实现。
4.如权利要求1所述的基于图像特征分析的目标辨识方法,其特征在于,将所述梯度幅值最大的梯度方向旋转至X轴正方向。
5.如权利要求1所述的基于图像特征分析的目标辨识方法,其特征在于,选取梯度方向集中的特征点作为所述图像的SIFT特征点的步骤中,选取的特征点占总的特征点数的25%~30%。
6.如权利要求1所述的基于图像特征分析的目标辨识方法,其特征在于,当所述图像为320x240的图像时,选取的特征点的个数为50。
7.如权利要求1所述的基于图像特征分析的目标辨识方法,其特征在于,采用计算两个特征点向量之间的欧几里得距离,并将所述距离与所述阈值比较,若所述距离在所述阈值范围内,则所述两个特征点之间匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105598545A CN102004921A (zh) | 2010-11-24 | 2010-11-24 | 基于图像特征分析的目标辨识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105598545A CN102004921A (zh) | 2010-11-24 | 2010-11-24 | 基于图像特征分析的目标辨识方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102004921A true CN102004921A (zh) | 2011-04-06 |
Family
ID=43812273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105598545A Pending CN102004921A (zh) | 2010-11-24 | 2010-11-24 | 基于图像特征分析的目标辨识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102004921A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184411A (zh) * | 2011-05-09 | 2011-09-14 | 中国电子科技集团公司第二十八研究所 | 基于彩色信息的尺度不变特征点描述和匹配方法 |
CN102564424A (zh) * | 2011-12-29 | 2012-07-11 | 上海电机学院 | 一种基于多传感器的数据融合方法 |
CN102592130A (zh) * | 2012-02-16 | 2012-07-18 | 浙江大学 | 一种针对水下显微视频的目标识别系统及其视频编码方法 |
CN103632149A (zh) * | 2013-12-17 | 2014-03-12 | 上海电机学院 | 一种基于图像特征分析的人脸识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
CN101493891A (zh) * | 2009-02-27 | 2009-07-29 | 天津大学 | 基于sift的具有镜面翻转不变性的特征提取和描述方法 |
CN101714254A (zh) * | 2009-11-16 | 2010-05-26 | 哈尔滨工业大学 | 联合多尺度sift和区域不变矩特征的配准控制点提取方法 |
US20100195914A1 (en) * | 2009-02-02 | 2010-08-05 | Michael Isard | Scalable near duplicate image search with geometric constraints |
-
2010
- 2010-11-24 CN CN2010105598545A patent/CN102004921A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
US20100195914A1 (en) * | 2009-02-02 | 2010-08-05 | Michael Isard | Scalable near duplicate image search with geometric constraints |
CN101493891A (zh) * | 2009-02-27 | 2009-07-29 | 天津大学 | 基于sift的具有镜面翻转不变性的特征提取和描述方法 |
CN101714254A (zh) * | 2009-11-16 | 2010-05-26 | 哈尔滨工业大学 | 联合多尺度sift和区域不变矩特征的配准控制点提取方法 |
Non-Patent Citations (3)
Title |
---|
《测绘科学技术学报》 20101031 陈敏等 一种多尺度特征点探测算子 357-360 1-7 第27卷, 第5期 * |
《计算机仿真》 20101031 甘玲等 基于sift特征描述符的多尺度图像配准方法 207-210 1-7 第27卷, 第10期 * |
王海军: "未知环境下移动机器人即时定位与地图创建", 《CNKI-中国博士学位论文全文数据库》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184411A (zh) * | 2011-05-09 | 2011-09-14 | 中国电子科技集团公司第二十八研究所 | 基于彩色信息的尺度不变特征点描述和匹配方法 |
CN102184411B (zh) * | 2011-05-09 | 2012-09-05 | 中国电子科技集团公司第二十八研究所 | 基于彩色信息的尺度不变特征点描述和匹配方法 |
CN102564424A (zh) * | 2011-12-29 | 2012-07-11 | 上海电机学院 | 一种基于多传感器的数据融合方法 |
CN102592130A (zh) * | 2012-02-16 | 2012-07-18 | 浙江大学 | 一种针对水下显微视频的目标识别系统及其视频编码方法 |
CN103632149A (zh) * | 2013-12-17 | 2014-03-12 | 上海电机学院 | 一种基于图像特征分析的人脸识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dubé et al. | Segmatch: Segment based place recognition in 3d point clouds | |
Zhu et al. | Single image 3D object detection and pose estimation for grasping | |
Zhu et al. | Gosmatch: Graph-of-semantics matching for detecting loop closures in 3d lidar data | |
CN104200495B (zh) | 一种视频监控中的多目标跟踪方法 | |
Yang et al. | Aligning 2.5 D scene fragments with distinctive local geometric features and voting-based correspondences | |
CN103488972B (zh) | 基于深度信息的指尖检测方法 | |
Dubé et al. | Segmatch: Segment based loop-closure for 3d point clouds | |
CN101556647A (zh) | 一种基于改进sift算法的移动机器人视觉定位方法 | |
CN107798691B (zh) | 一种基于视觉的无人机自主着陆地标实时检测跟踪方法 | |
CN104867137A (zh) | 一种基于改进ransac算法的图像配准方法 | |
Liu et al. | Deep-learning and depth-map based approach for detection and 3-D localization of small traffic signs | |
CN102853835A (zh) | 基于尺度不变特征变换的无人飞行器景象匹配定位方法 | |
CN102004921A (zh) | 基于图像特征分析的目标辨识方法 | |
CN102034103B (zh) | 一种遥感影像的线性要素提取方法 | |
Wang et al. | Hand posture recognition from disparity cost map | |
CN102564424A (zh) | 一种基于多传感器的数据融合方法 | |
CN104036494A (zh) | 一种用于水果图像的快速匹配计算方法 | |
CN103559492A (zh) | 一种车标识别装置及方法 | |
Chen et al. | Extracting and matching lines of low-textured region in close-range navigation for tethered space robot | |
Wu et al. | Visual data driven approach for metric localization in substation | |
Kang et al. | An automatic airborne image mosaicing method based on the SIFT feature matching | |
Ai et al. | Geometry preserving active polygon-incorporated sign detection algorithm | |
Zhang et al. | A LiDAR-intensity SLAM and loop closure detection method using an intensity cylindrical-projection shape context descriptor | |
Xuming et al. | Semantic maps for cross-view relocalization of terrestrial to uav point clouds | |
Feryanto et al. | Location recognition using detected objects in an image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110406 |