CN102004921A

CN102004921A - 基于图像特征分析的目标辨识方法

Info

Publication number: CN102004921A
Application number: CN2010105598545A
Authority: CN
Inventors: 王海军; 孙强
Original assignee: Shanghai Dianji University
Current assignee: Shanghai Dianji University
Priority date: 2010-11-24
Filing date: 2010-11-24
Publication date: 2011-04-06

Abstract

本发明涉及一种基于图像特征分析的目标辨识方法，包括如下步骤：以SIFT特征点为中心，选取2×2个子区域；将每个所述子区域的8个梯度方向的梯度幅值进行规范化处理，从所述8个梯度方向中选取梯度幅值最大的梯度方向，将所述梯度幅值最大的梯度方向旋转至X轴或者Y轴，旋转后，选取位于X轴和Y轴上的4个梯度方向；计算并比较梯度幅值的大小，在特征点向量匹配阈值范围内，选取梯度方向集中的特征点作为所述图像的SIFT特征点。本发明的方法减少了SIFT特征向量的维数和特征点的数量而不影响图像匹配效果，加强了对环境目标识别的速度和准确度，提高了整个算法的实时在线运行速度和匹配的准确度。

Description

基于图像特征分析的目标辨识方法

技术领域

本发明涉及一种基于图像特征分析的目标辨识方法，尤其涉及一种在智能移动机器人探测未知空间的局部环境领域内，基于图像特征分析的目标辨识方法。

背景技术

人类对外界环境信息的获取有70％以上都来自于视觉，可见视觉导航方式是智能移动机器人导航的一个主要发展方向。现有技术公开的文献(李桂芝和安成万.基于场景识别的移动机器人定位方法研究[J].机器人，2005.27(2)：23-26)提出了一种基于电荷耦合元件(Charge-coupled Device，CCD)视频采集对场景进行识别的移动机器人定位方法，以全局特征场景识别对移动机器人定位，通过Gabor滤波器提取图像的全局纹理特征，并使用支持向量机(Support VectorMachine，SVM)对其进行分类，实现基于图像的场景识别。由于每类图像对应于机器人工作环境中的某个位置，从而实现机器人的逻辑定位。此种方法的不足之处在于：机器人在未知环境中采集的场景样本图像很多，属于小样本识别问题的向量机并不适用于大样本的基于全局特征的场景匹配问题。

现有技术公开的另一文献(庄严，徐晓东和王伟，移动机器人几何-拓扑混合地图的构建及自定位研究[J].控制与决策，2005.20(7)：817-822.)提出基于墙角、房门和通路等高级环境特征的辨识与提取，以对局部环境特征进行辨识。也有学者根据移动机器人工作环境和具体导航要求的不同，采取相应的数字图像处理技术对室内环境中的垂直边缘与激光传感器提取的水平线段特征进行处理，以此作为机器人进行定位的简单几何特征。加拿大科学家David Lowe提出尺度不变特征转换(Scale-invariant feature transform，SIFT)技术，详见公开文献(Lowe，D.G.，Distinctive Image Features from Scale-Invariant Keypoints[J].International Journal of Computer Vision 2004.60(2)：91-110.)。该方法在尺度空间上计算高斯之差，并根据其最大最小值决定具有尺度、旋转和平移不变性的兴趣点位置，数据经过处理后作为路标。正因为提供了一种自底向上的良好的自然环境特征提取方案，且所提取的特征具有良好的尺度等不变性，SIFT方法很快在移动机器人视觉建模与定位领域得到了比较广泛的采用。SIFT方法在特征提取的可靠性、稳定性、计算效率、匹配精度等方面的综合性高。

然而，在上述SIFT方法中，标准的SIFT特征描述向量维度有128位，无论在计算或是储存过程中都需要占用大量的资源。而且每幅图像的特征点较多，例如，150幅图像库的特征点数量可达近40,000个，如此庞大的数据不仅对实时在线的特征匹配计算造成重要的负担，而且还容易形成错误的匹配。

发明内容

本发明的目的在于提供一种能够减少SIFT特征向量的维数和减少特征点的数量而不影响图像匹配效果的基于图像特征分析的目标辨识方法。

一种基于图像特征分析的目标辨识方法，包括如下步骤：以SIFT特征点为中心，选取2×2个子区域；将每个所述子区域的8个梯度方向的梯度幅值进行规范化处理，从所述8个梯度方向中选取梯度幅值最大的梯度方向，将所述梯度幅值最大的梯度方向旋转至X轴或者Y轴，旋转后，选取位于X轴和Y轴上的4个梯度方向；计算并比较梯度幅值的大小，在特征点向量匹配阈值范围内，选取梯度方向集中的特征点作为所述图像的SIFT特征点。

本发明优选的一种技术方案，所述SIFT特征点向量为2x2x4＝16维数。

本发明优选的一种技术方案，所述将梯度幅值进行规范化处理的步骤通过将梯度幅值除以某一常数或者最大梯度幅值实现。

本发明优选的一种技术方案，将所述梯度幅值最大的梯度方向旋转至X轴正方向。

本发明优选的一种技术方案，选取梯度方向集中的特征点作为所述图像的SIFT特征点的步骤中，选取的特征点占总的特征点数的25％～30％。

本发明优选的一种技术方案，当所述图像为320x240的图像时，选取的特征点的个数为50。

本发明优选的一种技术方案，采用计算两个特征点向量之间的欧几里得距离，并将所述距离与所述阈值比较，若所述距离在所述阈值范围内，则所述两个特征点之间匹配。

与现有技术相比，本发明的基于图像特征分析的目标辨识方法可以显著地减少SIFT特征向量的维数和图像的SIFT特征点的数量，减少了占用的储存资源和计算时间，对于实时在线计算要求严格的任务来说，本方法有着较大的优势。另外梯度向量经过旋转处理后，对图像发生旋转的影响产生了较好的鲁棒性，提高了实时在线的运算速度和准确度。

附图说明

图1是本发明的基于图像特征分析的目标辨识方法的流程图。

图2是以特征点为中心的领域梯度方向的示意图。

图3是图2所示的关键特征点的向量示意图。

图4是本发明的基于图像特征分析的目标辨识方法中最大梯度旋转前的示意图。

图5是本发明的基于图像特征分析的目标辨识方法中最大梯度旋转后的示意图。

具体实施方式

本发明的基于图像特征分析的目标辨识方法主要包括如下三个步骤：降低特征点向量的维度；最大梯度旋转规范化；减少特征点的数量。下面结合附图对本发明的基于图像特征分析的目标辨识方法作进一步的详细描述。

请参阅图1，图1是本发明的基于图像特征分析的目标辨识方法的流程图。首先，以SIFT特征点为中心，选取2×2个子区域。因为传统的SIFT特征点向量维度是128位，也就是4x4x8，每个子区域的梯度方向有8个方向组成，这8个方向在直角坐标系上间隔45度分布，而这样的子区域以特征点为中心共有4x4＝16个。实际上，在标准的SIFT算法中，在计算子区域的梯度向量时，由于以特征点为中心的二维高斯加权函数的约束，使远离特征点中心的子区域梯度幅值减小，其参与特征点梯度计算的权值也相应的降低了，因而，离特征点中心最近的子区域在SIFT特征向量的计算中起主导作用，如图2、图3所示。而且，在机器人SLAM(Simultaneous Localization And Mapping)环境中，机器人需要识别的是较大的局部环境特征，而不是像医学图像(如组织器官等)的辨认、样本产品分析那样进行局部微小片断的识别。因此，本方法只取以特征点为中心的2x2个子区域，每个子区域取4个梯度方向，由此得出的特征点向量就变成了2x2x4＝16维数。

最大梯度旋转规范化主要包括两个步骤：将每个子区域的8个梯度方向的梯度幅值进行规范化处理；从所述8个梯度方向中选取梯度幅值最大的梯度方向，旋转所述幅值最大梯度的方向。优选的，所述将梯度幅值进行规范化处理的步骤通过将梯度幅值除以某一常数或者最大梯度幅值实现。将8个梯度方向的梯度幅值进行规范化处理后，得到幅值规范化的一组梯度向量，以具备对图像明暗变化的鲁棒性(Robustness)。从8个梯度方向中找到幅值最大的梯度方向，并将该方向旋转至Y轴的正向，如图4所示。梯度经过旋转处理后，对图像发生旋转的影响产生鲁棒性，此时，取位于X轴和Y轴上的4个梯度方向，如图5所示。至此，完成特征向量维度的优化，该过程是在图像的SIFT产生过程中实现的。本发明的基于图像特征分析的目标辨识方法中，减少向量的维度只有在非常细微辨别方面的辨识功能降低了。

最后，减少特征点的数量，此过程在特征点匹配的过程中进行。两个对应的特征点向量的匹配方法是采用计算其欧几里得(Euclidean)距离来决定的，当这个距离在一定的门限内时，就认为两点是匹配的，定义这个匹配最小距离值为阈值，当这个阈值越小时，可能匹配的点就越少，但是匹配的正确率却越高。因此，在计算一幅图像的特征点时，选取具有明显特征的特征点，通过计算比较其梯度的幅值(Magnitude)大小，选取梯度方向集中(mono-Orientation)的特征点作为所述图像的SIFT特征点。当区域中有3～5个正确的特征点就可以完成识别的任务。优选的，选取的特征点占总的特征点数的25％～30％。当所述图像为320x240的图像时，所述特征点的个数为50。

与现有技术相比，本发明的基于图像特征分析的目标辨识方法可以显著地减少SIFT特征向量的维数，使SIFT特征向量从128维/点变成16维/点，并且图像的SIFT特征点的数据减少到原来的25％左右，因此，不仅存在储存方面的优势，在计算时间上也有很大提高，对于实时在线计算要求严格的任务来说，本方法有着较大的优势。

本发明虽然减少了维度的数量，会出现一些假的匹配点，但是通过提高特征点匹配的要求，即降低匹配阈值，实现正确选取少的特征点，并不会降低图像匹配率。另外梯度向量经过旋转处理后，对图像发生旋转的影响产生了较好的鲁棒性，提高了实时在线的运算速度和准确度。

本发明的基于图像特征分析的目标辨识方法有效地降低了基于视觉的移动机器人的导航与定位算法的复杂度，通过对周围环境的图像分析和理解，加强对局部环境中目标特征的识别效率，提高了实时在线的运算速度和定位的准确度，对于智能移动机器人在探测未知空间环境应用上，有效地提高了机器人的自身定位和创建环境地图的可靠性、稳定性以及高效性。

本发明的基于图像特征分析的目标辨识方法的最大梯度旋转规范化步骤中，从8个梯度方向中找到幅值最大的梯度方向，并将该方向旋转至Y轴的正向，也可以将该方向旋转至Y轴的负向、或者X轴的正向或者负向上，但并不限于上述实施方式所述。

在不偏离本发明的精神和范围的情况下还可以构成许多有很大差别的实施例。应当理解，除了如所附的权利要求所限定的，本发明不限于在说明书中所述的具体实施例。

Claims

1.一种基于图像特征分析的目标辨识方法，其特征在于，包括如下步骤：

以SIFT特征点为中心，选取2×2个子区域；

将每个所述子区域的8个梯度方向的梯度幅值进行规范化处理，从所述8个梯度方向中选取梯度幅值最大的梯度方向，将所述梯度幅值最大的梯度方向旋转至X轴或者Y轴，旋转后，选取位于X轴和Y轴上的4个梯度方向；

计算并比较梯度幅值的大小，在特征点向量匹配阈值范围内，选取梯度方向集中的特征点作为所述图像的SIFT特征点。

2.如权利要求1所述的基于图像特征分析的目标辨识方法，其特征在于，所述SIFT特征点向量为2x2x4＝16维数。

3.如权利要求1所述的基于图像特征分析的目标辨识方法，其特征在于，所述将梯度幅值进行规范化处理的步骤通过将梯度幅值除以某一常数或者最大梯度幅值实现。

4.如权利要求1所述的基于图像特征分析的目标辨识方法，其特征在于，将所述梯度幅值最大的梯度方向旋转至X轴正方向。

5.如权利要求1所述的基于图像特征分析的目标辨识方法，其特征在于，选取梯度方向集中的特征点作为所述图像的SIFT特征点的步骤中，选取的特征点占总的特征点数的25％～30％。

6.如权利要求1所述的基于图像特征分析的目标辨识方法，其特征在于，当所述图像为320x240的图像时，选取的特征点的个数为50。

7.如权利要求1所述的基于图像特征分析的目标辨识方法，其特征在于，采用计算两个特征点向量之间的欧几里得距离，并将所述距离与所述阈值比较，若所述距离在所述阈值范围内，则所述两个特征点之间匹配。