CN104008400A - 结合sift和bp网络进行物体识别的方法 - Google Patents
结合sift和bp网络进行物体识别的方法 Download PDFInfo
- Publication number
- CN104008400A CN104008400A CN201410265752.0A CN201410265752A CN104008400A CN 104008400 A CN104008400 A CN 104008400A CN 201410265752 A CN201410265752 A CN 201410265752A CN 104008400 A CN104008400 A CN 104008400A
- Authority
- CN
- China
- Prior art keywords
- point
- sift
- unique point
- network
- neighborhood
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
结合SIFT和BP网络进行物体识别的方法,首先提取标准图像和待识别图像的SIFT特征,然后将标准图像的SIFT特征输入BP网络进行训练,并保存该网络,最后将待识别图像的SIFT特征输入到该网络中进行分类识别,提高了识别率。
Description
技术领域
本发明涉及物体识别,尤其涉及一种结合SIFT和BP网络进行物体识别的方法。
背景技术
物体识别是模式识别领域和计算机视觉领域中的一个重要研究方向,被广泛地应用于工业检测、医学分析、机器人抓取工件、自动导航、自动检测等方面。目前大量的研究人员和学者投入了大量的人力物力进行该研究,并提出多种理论和方法。一般来说,物体识别方法可分为两类: 基于全局特征的物体识别方法和基于局部特征的物体识别方法。前者提取物体的全局特征, 然后结合主成分分析、支持向量机、隐马尔可夫模型等方法进行识别。此类方法可成功识别部分遮挡物体和带噪声的图像, 但是不能准确识别发生旋转变化的物体,当遮挡区域增加时识别率也会明显下降。
发明内容
为解决上述技术问题,采用SIFT和BP(Back Propagation)网络相结合的方法进行物体识别。首先提取标准图像和待识别图像的SIFT特征,然后将标准图像的SIFT特征输入BP网络进行训练,并保存该网络,最后将待识别图像的SIFT特征输入到该网络中进行分类识别,提高了识别率。
为实现上述技术目的,本发明所采用的技术方案是:结合SIFT和BP网络进行物体识别的方法,其特征在于:
1)建立DOG金字塔;对图像进行不同分辨率的采样,并在相邻尺度空间建立金字塔,金字塔结构采用不同的高斯函数进行滤波,将相邻的高斯滤波相减构成高斯差分金字塔。
2)检测极值点;在DOG空间,比较每个点与其相邻尺度的相邻点,看该点是否都小于或者都大于其同尺度的8个邻点和上下相邻该尺度的各9个邻点,这样可保证该点在该尺度和二维空间均为极值点。通过该方法获得的特征点称为候选特征点。
3)特征点的确定;获取候选特征点后,对其进行稳定性检测,去除对噪声敏感的低对比度点和不稳定的边缘响应点,通过稳定性检测的点称为SIFT特征点。
4)确定每个特征点的方向参数;利用梯度直方图确定特征点的主方向,在以特征点为中心的邻域内,用直方图计算邻域像素的梯度方向,梯度方向直方图的峰值表示该特征点邻域梯度的主方向,也就是该特征点的主方向,点(x,y)的梯度模值与方向可定义为
(2)
(3)
5)生成SIFT特征向量;将特征点作为中心,选择16X16的邻域,并将该邻域划分为16个4 X4的子区域。然后在该子区域上计算共8个方向上的梯度累加值,以得梯度直方图,所以对每个特征点,可生成16X8维的特征向量,其表示如下:
(4)
6)将生成的SIFT特征向量输入至BP神经网络;对要识别的物体进行识别。
本发明的有益效果是:该方法利用局部特征进行识别,其抗干扰能力强,对缩放变化有较好的适应性,识别率高。
附图说明
图1为本发明检测极值点的示意图;
图2为本发明BP神经网络的示意图;
图3为物体的六个变化示意图;
图4为变化示意图的特征点检测示意图。
具体实施方式
1. SIFT特征的提取
SIFT算法主要有以下五个步骤:
1)建立DOG金字塔。对图像进行不同分辨率的采样,并在相邻尺度空间建立金字塔。金字塔结构采用不同的高斯函数进行滤波,将相邻的高斯滤波相减构成高斯差分金字塔(different of Gaussuans, DOG)。DOG算子可定义为两个不同尺度的高斯核的差分:
(1)
式中k为常数。
2)检测极值点。在DOG空间,比较每个点与其相邻尺度的相邻点,看该点是否都小于或者都大于其同尺度的8个邻点和上下相邻该尺度的各9个邻点(如图1所示)。这样可保证该点在该尺度和二维空间均为极值点。通过该方法获得的特征点称为候选特征点。
3)特征点的确定。获取候选特征点后,还要对其进行稳定性检测,即去除对噪声敏感的低对比度点和不稳定的边缘响应点,来加强特征点匹配的稳定性,同时提高抗噪能力。通过稳定性检测的点称为SIFT特征点。
4)为每个特征点确定方向参数,以使算子具有旋转不变性。这里主要用梯度直方图确定特征点的主方向。在以特征点为中心的邻域内,用直方图计算邻域像素的梯度方向。梯度方向直方图的峰值表示该特征点邻域梯度的主方向,也就是该特征点的主方向。点(x,y)的梯度模值与方向可定义为
(2)
(3)
5)生成SIFT特征向量。将特征点作为中心,选择16X16的邻域,并将该邻域划分为16个4 X4的子区域。然后在该子区域上计算共8个方向上的梯度累加值,以得梯度直方图,所以对每个特征点,可生成16X8维的特征向量,其表示如下:
(4)
2. 用BP神经网络进行识别
BP 神经网络是以有教师示教的模式来学习的一种网络,其一般由输入层、隐含层和输出层共三层组成,如图2所示。1989年Robert Hecht-Nielson已证明,一个三层BP网络可以实现任意精度、近似任何连续函数。首先由教师对每种输入模式设定一个期望的输出值,而后对网络输入实际的数据进行学习并记忆,最后由输入层经中间层向输出层进行传播,该过程称为正向传播。实际输出与期望输出的差值就是误差。根据误差平方最小这一原理,从输出层往中间层逐层调整连接权值,该过程称为误差逆向传播。所以误差逆向传播的神经网络称为BP(Back Propagation) 网络。正向传播和误差逆向传播过程的反复交替进行,网络的实际输出逐渐逼近其对应的期望输出。通过不断的学习训练,各层间的连接权值确定之后,就可用于识别。
BP神经网络用于物体识别时,网络的输入节点的数目ni等于样本物体的特征数,即每个输入节点表示样本的一个特征;输出节点的数目no等于要识别物体的类别数,所有的输出节点构成一个输出矢量,并对应一个物体类别;隐含层节点的数目nh的确定:在经过大量实验的基础上,可通过以下公式获得
(5)
在训练阶段,若输入样本的类别号是x,那么在此时的期望输出中,假设第x个输出节点的值为1,而其它输出节点的值均为0。在识别阶段,将每个未知类别的样本物体的特征作用到刚已训练好的BP网络的输入端,在输出端就可获得一组矢量,将该样本类别判定为这组矢量中最大值的输出节点对应的类别。
3. 实验结果及分析
本次实验采用的实验环境为matlab 7.0语言环境, Windows XP操作系统, Intel(R) Core(TM)i3 CPU (3.40GHz)和3.43G RAM。为了验证本文方法的鲁棒性,具体采用Coil-20数据库中的物体进行实验。图3列出了其中具有代表性的一个物体,(a)是标准图像,(b)是该物体放大1.15倍后的图像,(c)是缩小0.75倍后的图像,(d)是旋转15度后的图像,(e)是添加高斯噪声后的图像,(f)是添加椒盐噪声后的图像。实验中共选取了10个不同物体,选取每个物体的36幅经不同变化(缩放、旋转、高斯噪声和椒盐噪声)的图像作为训练图像,50幅作为测试图像。
实验用的每幅图像都先用SIFT算法检测特征点,如图4所示,并提取其特征构成特征向量,然后将该SIFT特征向量输入BP神经网络进行训练和识别。实验时,BP神经网络的输入层节点数取为128,与提取的SIFT特征向量的维数一致;输出层节点数取为10,与要识别的物体类别数一致;隐含层节点数由公式(5)获得,取为69。其具体的识别结果如表1-3所示。为了验证本文算法的有效性,我们也在同样的实验环境和条件下,计算了物体的修正HU不变矩特征,并输入到BP网络进行训练和识别。
表1 发生缩放变化的物体识别比较
算法 | 测试图像数 | 正确识别图像数 | 识别率(%) |
SIFT | 122 | 114 | 93.4 |
修正的HU不变矩 | 122 | 107 | 87.7 |
表2 发生旋转变化的物体识别比较
算法 | 测试图像数 | 正确识别图像数 | 识别率(%) |
SIFT | 238 | 215 | 90.3 |
修正的HU不变矩 | 238 | 203 | 85.2 |
表3 有噪声的物体识别比较
算法 | 测试图像数 | 正确识别图像数 | 识别率(%) |
SIFT | 140 | 128 | 91.4 |
修正的HU不变矩 | 140 | 121 | 86.4 |
从表1-3可以看出,本文算法对缩放变化有较好的适应性,识别率较高;噪声变化对特征点的检测和识别存在一定的干扰,识别率稍有下降;旋转对于特征的提取影响较大,相对于缩放和旋转变化,其识别率有所下降,但是在三种情况下,本文算法的识别率均高于90%。同时也可以看出,在缩放、旋转、噪声不同畸变情况下,SIFT算法的识别率明显高于修正HU不变矩算法的识别率。尤其是在发生缩放变化时,本文算法的识别率比修正HU不变矩算法的识别率高出5.7%。这主要是因为SIFT算法提取物体的128维特征,而修正HU不变矩算法提取物体的7维特征,提取特征向量的维数多,输入到BP神经网络的节点数多,对识别准确性的贡献大,识别率就高。
本文采用SIFT和BP网络相结合的方法完成物体识别。先提取标准图像和待识别图像的SIFT特征,再将标准图像的SIFT特征输入BP网络进行训练,最后将待识别图像的SIFT特征输入到该网络中进行分类识别,并将SIFT算法和修正的HU不变矩算法的识别进行比较。实验结果表明本文算法对缩放变化具有较好的适应性;在相同的实验条件下,对不同的畸变,SIFT算法比修正的HU不变矩算法的识别率明显提高了,主要应用于对识别率要求较高的场合。
Claims (3)
1.结合SIFT和BP网络进行物体识别的方法,其特征在于:
1)建立DOG金字塔;对图像进行不同分辨率的采样,并在相邻尺度空间建立金字塔,金字塔结构采用不同的高斯函数进行滤波,将相邻的高斯滤波相减构成高斯差分金字塔;
2)检测极值点;在DOG空间,比较每个点与其相邻尺度的相邻点,看该点是否都小于或者都大于其同尺度的8个邻点和上下相邻该尺度的各9个邻点,这样可保证该点在该尺度和二维空间均为极值点。
2.通过该方法获得的特征点称为候选特征点;
3)特征点的确定;获取候选特征点后,对其进行稳定性检测,去除对噪声敏感的低对比度点和不稳定的边缘响应点,通过稳定性检测的点称为SIFT特征点;
4)确定每个特征点的方向参数;利用梯度直方图确定特征点的主方向,在以特征点为中心的邻域内,用直方图计算邻域像素的梯度方向,梯度方向直方图的峰值表示该特征点邻域梯度的主方向,也就是该特征点的主方向,点(x,y)的梯度模值与方向可定义为
(2)
(3)
5)生成SIFT特征向量;将特征点作为中心,选择16X16的邻域,并将该邻域划分为16个4 X4的子区域。
3.然后在该子区域上计算共8个方向上的梯度累加值,以得梯度直方图,所以对每个特征点,可生成16X8维的特征向量,其表示如下:
(4)
6)将生成的SIFT特征向量输入至BP神经网络;对要识别的物体进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410265752.0A CN104008400A (zh) | 2014-06-16 | 2014-06-16 | 结合sift和bp网络进行物体识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410265752.0A CN104008400A (zh) | 2014-06-16 | 2014-06-16 | 结合sift和bp网络进行物体识别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104008400A true CN104008400A (zh) | 2014-08-27 |
Family
ID=51369049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410265752.0A Pending CN104008400A (zh) | 2014-06-16 | 2014-06-16 | 结合sift和bp网络进行物体识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104008400A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056121A (zh) * | 2016-05-27 | 2016-10-26 | 河北工业大学 | 基于sift图像特征匹配的卫星装配工件快速识别方法 |
CN109101979A (zh) * | 2018-07-11 | 2018-12-28 | 中国艺术科技研究所 | 一种紫砂壶底部款识真伪鉴别方法 |
CN109117773A (zh) * | 2018-08-01 | 2019-01-01 | Oppo广东移动通信有限公司 | 一种图像特征点检测方法、终端设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100169576A1 (en) * | 2008-12-31 | 2010-07-01 | Yurong Chen | System and method for sift implementation and optimization |
CN101944183A (zh) * | 2010-09-02 | 2011-01-12 | 北京航空航天大学 | 一种利用sift树进行物体识别的方法 |
US20110255781A1 (en) * | 2010-04-20 | 2011-10-20 | Qualcomm Incorporated | Efficient descriptor extraction over multiple levels of an image scale space |
CN102629328A (zh) * | 2012-03-12 | 2012-08-08 | 北京工业大学 | 融合颜色的显著特征概率潜在语义模型物体图像识别方法 |
CN103678558A (zh) * | 2013-12-06 | 2014-03-26 | 中科联合自动化科技无锡有限公司 | 基于sift特征的嫌疑车辆检索方法 |
-
2014
- 2014-06-16 CN CN201410265752.0A patent/CN104008400A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100169576A1 (en) * | 2008-12-31 | 2010-07-01 | Yurong Chen | System and method for sift implementation and optimization |
US20110255781A1 (en) * | 2010-04-20 | 2011-10-20 | Qualcomm Incorporated | Efficient descriptor extraction over multiple levels of an image scale space |
CN101944183A (zh) * | 2010-09-02 | 2011-01-12 | 北京航空航天大学 | 一种利用sift树进行物体识别的方法 |
CN102629328A (zh) * | 2012-03-12 | 2012-08-08 | 北京工业大学 | 融合颜色的显著特征概率潜在语义模型物体图像识别方法 |
CN103678558A (zh) * | 2013-12-06 | 2014-03-26 | 中科联合自动化科技无锡有限公司 | 基于sift特征的嫌疑车辆检索方法 |
Non-Patent Citations (5)
Title |
---|
中国科学技术协会: "《2012-2013体视学学科发展报告》", 30 April 2014 * |
查颖: ""基于SIFT和BP神经网络的车牌识别技术研究"", 《黑龙江科技信息》 * |
王殿君 等,: "《移动机器人自主定位技术》", 30 March 2013 * |
苏爱军 等,: "《"长江三峡工程库区巫山新城区地质环境与移民对策"》", 31 January 2008 * |
诸克军 等,: "《管理运筹学及智能方法》", 30 June 2013 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056121A (zh) * | 2016-05-27 | 2016-10-26 | 河北工业大学 | 基于sift图像特征匹配的卫星装配工件快速识别方法 |
CN109101979A (zh) * | 2018-07-11 | 2018-12-28 | 中国艺术科技研究所 | 一种紫砂壶底部款识真伪鉴别方法 |
CN109101979B (zh) * | 2018-07-11 | 2022-03-18 | 中国艺术科技研究所 | 一种紫砂壶底部款识真伪鉴别方法 |
CN109117773A (zh) * | 2018-08-01 | 2019-01-01 | Oppo广东移动通信有限公司 | 一种图像特征点检测方法、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110824450B (zh) | 一种噪声环境下的雷达目标hrrp鲁棒识别方法 | |
CN105787482A (zh) | 一种基于深度卷积神经网络的特定目标轮廓图像分割方法 | |
KR101901961B1 (ko) | 부품을 인식하기 위한 장치 및 그 방법 | |
CN104537647A (zh) | 一种目标检测方法及装置 | |
CN107424161B (zh) | 一种由粗至精的室内场景图像布局估计方法 | |
CN105809672A (zh) | 一种基于超像素和结构化约束的图像多目标协同分割方法 | |
CN111028292A (zh) | 一种亚像素级图像匹配导航定位方法 | |
CN104820997A (zh) | 一种基于分块稀疏表达与hsv特征融合的目标跟踪方法 | |
CN108171119B (zh) | 基于残差网络的sar图像变化检测方法 | |
CN112052802A (zh) | 一种基于机器视觉的前方车辆行为识别方法 | |
CN109410248B (zh) | 一种基于r-K算法的浮选泡沫运动特征提取方法 | |
CN104091350A (zh) | 一种利用运动模糊信息的物体跟踪方法 | |
Chaki et al. | Recognition of whole and deformed plant leaves using statistical shape features and neuro-fuzzy classifier | |
CN107067410A (zh) | 一种基于增广样本的流形正则化相关滤波目标跟踪方法 | |
CN104008400A (zh) | 结合sift和bp网络进行物体识别的方法 | |
CN109740672B (zh) | 多流特征距离融合系统与融合方法 | |
CN104156723A (zh) | 一种具有尺度不变性的最稳定极值区域的提取方法 | |
Tobeta et al. | E2pose: Fully convolutional networks for end-to-end multi-person pose estimation | |
CN105184257A (zh) | 目标检测方法与装置 | |
CN102831445A (zh) | 基于语义Hough变换和偏最小二乘法的目标检测方法 | |
CN105488099B (zh) | 一种基于相似度学习的车辆检索方法 | |
CN113792660B (zh) | 基于改进YOLOv3网络的行人检测方法、系统、介质、设备 | |
CN113316080B (zh) | 基于Wi-Fi与图像融合指纹的室内定位方法 | |
CN105719272A (zh) | 保持空间结构的图像特征点匹配方法 | |
CN113030849B (zh) | 一种基于自编码器与并行网络的近场源定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140827 |
|
RJ01 | Rejection of invention patent application after publication |