CN104008400A - 结合sift和bp网络进行物体识别的方法 - Google Patents

结合sift和bp网络进行物体识别的方法 Download PDF

Info

Publication number
CN104008400A
CN104008400A CN201410265752.0A CN201410265752A CN104008400A CN 104008400 A CN104008400 A CN 104008400A CN 201410265752 A CN201410265752 A CN 201410265752A CN 104008400 A CN104008400 A CN 104008400A
Authority
CN
China
Prior art keywords
point
sift
unique point
network
neighborhood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410265752.0A
Other languages
English (en)
Inventor
张蕾
刘森
刘中华
张茉莉
黄涛
普杰信
胡良文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Science and Technology
Original Assignee
Henan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Science and Technology filed Critical Henan University of Science and Technology
Priority to CN201410265752.0A priority Critical patent/CN104008400A/zh
Publication of CN104008400A publication Critical patent/CN104008400A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

结合SIFT和BP网络进行物体识别的方法,首先提取标准图像和待识别图像的SIFT特征,然后将标准图像的SIFT特征输入BP网络进行训练,并保存该网络,最后将待识别图像的SIFT特征输入到该网络中进行分类识别,提高了识别率。

Description

结合SIFT和BP网络进行物体识别的方法
技术领域
本发明涉及物体识别,尤其涉及一种结合SIFT和BP网络进行物体识别的方法。
背景技术
物体识别是模式识别领域和计算机视觉领域中的一个重要研究方向,被广泛地应用于工业检测、医学分析、机器人抓取工件、自动导航、自动检测等方面。目前大量的研究人员和学者投入了大量的人力物力进行该研究,并提出多种理论和方法。一般来说,物体识别方法可分为两类: 基于全局特征的物体识别方法和基于局部特征的物体识别方法。前者提取物体的全局特征, 然后结合主成分分析、支持向量机、隐马尔可夫模型等方法进行识别。此类方法可成功识别部分遮挡物体和带噪声的图像, 但是不能准确识别发生旋转变化的物体,当遮挡区域增加时识别率也会明显下降。
发明内容
为解决上述技术问题,采用SIFT和BP(Back Propagation)网络相结合的方法进行物体识别。首先提取标准图像和待识别图像的SIFT特征,然后将标准图像的SIFT特征输入BP网络进行训练,并保存该网络,最后将待识别图像的SIFT特征输入到该网络中进行分类识别,提高了识别率。
为实现上述技术目的,本发明所采用的技术方案是:结合SIFT和BP网络进行物体识别的方法,其特征在于:
1)建立DOG金字塔;对图像进行不同分辨率的采样,并在相邻尺度空间建立金字塔,金字塔结构采用不同的高斯函数进行滤波,将相邻的高斯滤波相减构成高斯差分金字塔。
2)检测极值点;在DOG空间,比较每个点与其相邻尺度的相邻点,看该点是否都小于或者都大于其同尺度的8个邻点和上下相邻该尺度的各9个邻点,这样可保证该点在该尺度和二维空间均为极值点。通过该方法获得的特征点称为候选特征点。
3)特征点的确定;获取候选特征点后,对其进行稳定性检测,去除对噪声敏感的低对比度点和不稳定的边缘响应点,通过稳定性检测的点称为SIFT特征点。
4)确定每个特征点的方向参数;利用梯度直方图确定特征点的主方向,在以特征点为中心的邻域内,用直方图计算邻域像素的梯度方向,梯度方向直方图的峰值表示该特征点邻域梯度的主方向,也就是该特征点的主方向,点(x,y)的梯度模值与方向可定义为
                 (2)
                     (3)
5)生成SIFT特征向量;将特征点作为中心,选择16X16的邻域,并将该邻域划分为16个4     X4的子区域。然后在该子区域上计算共8个方向上的梯度累加值,以得梯度直方图,所以对每个特征点,可生成16X8维的特征向量,其表示如下:
                                         (4)
6)将生成的SIFT特征向量输入至BP神经网络;对要识别的物体进行识别。
本发明的有益效果是:该方法利用局部特征进行识别,其抗干扰能力强,对缩放变化有较好的适应性,识别率高。
附图说明
图1为本发明检测极值点的示意图;
图2为本发明BP神经网络的示意图;
图3为物体的六个变化示意图;
图4为变化示意图的特征点检测示意图。
具体实施方式
1.     SIFT特征的提取
SIFT算法主要有以下五个步骤:
1)建立DOG金字塔。对图像进行不同分辨率的采样,并在相邻尺度空间建立金字塔。金字塔结构采用不同的高斯函数进行滤波,将相邻的高斯滤波相减构成高斯差分金字塔(different of Gaussuans, DOG)。DOG算子可定义为两个不同尺度的高斯核的差分:
                             (1)
式中k为常数。
2)检测极值点。在DOG空间,比较每个点与其相邻尺度的相邻点,看该点是否都小于或者都大于其同尺度的8个邻点和上下相邻该尺度的各9个邻点(如图1所示)。这样可保证该点在该尺度和二维空间均为极值点。通过该方法获得的特征点称为候选特征点。
3)特征点的确定。获取候选特征点后,还要对其进行稳定性检测,即去除对噪声敏感的低对比度点和不稳定的边缘响应点,来加强特征点匹配的稳定性,同时提高抗噪能力。通过稳定性检测的点称为SIFT特征点。
4)为每个特征点确定方向参数,以使算子具有旋转不变性。这里主要用梯度直方图确定特征点的主方向。在以特征点为中心的邻域内,用直方图计算邻域像素的梯度方向。梯度方向直方图的峰值表示该特征点邻域梯度的主方向,也就是该特征点的主方向。点(x,y)的梯度模值与方向可定义为
                 (2)
                     (3)
5)生成SIFT特征向量。将特征点作为中心,选择16X16的邻域,并将该邻域划分为16个4     X4的子区域。然后在该子区域上计算共8个方向上的梯度累加值,以得梯度直方图,所以对每个特征点,可生成16X8维的特征向量,其表示如下:
                                   (4)
2.     用BP神经网络进行识别
BP 神经网络是以有教师示教的模式来学习的一种网络,其一般由输入层、隐含层和输出层共三层组成,如图2所示。1989年Robert Hecht-Nielson已证明,一个三层BP网络可以实现任意精度、近似任何连续函数。首先由教师对每种输入模式设定一个期望的输出值,而后对网络输入实际的数据进行学习并记忆,最后由输入层经中间层向输出层进行传播,该过程称为正向传播。实际输出与期望输出的差值就是误差。根据误差平方最小这一原理,从输出层往中间层逐层调整连接权值,该过程称为误差逆向传播。所以误差逆向传播的神经网络称为BP(Back Propagation) 网络。正向传播和误差逆向传播过程的反复交替进行,网络的实际输出逐渐逼近其对应的期望输出。通过不断的学习训练,各层间的连接权值确定之后,就可用于识别。
BP神经网络用于物体识别时,网络的输入节点的数目ni等于样本物体的特征数,即每个输入节点表示样本的一个特征;输出节点的数目no等于要识别物体的类别数,所有的输出节点构成一个输出矢量,并对应一个物体类别;隐含层节点的数目nh的确定:在经过大量实验的基础上,可通过以下公式获得
                                       (5)
在训练阶段,若输入样本的类别号是x,那么在此时的期望输出中,假设第x个输出节点的值为1,而其它输出节点的值均为0。在识别阶段,将每个未知类别的样本物体的特征作用到刚已训练好的BP网络的输入端,在输出端就可获得一组矢量,将该样本类别判定为这组矢量中最大值的输出节点对应的类别。
3.     实验结果及分析
本次实验采用的实验环境为matlab 7.0语言环境, Windows XP操作系统, Intel(R) Core(TM)i3  CPU (3.40GHz)和3.43G RAM。为了验证本文方法的鲁棒性,具体采用Coil-20数据库中的物体进行实验。图3列出了其中具有代表性的一个物体,(a)是标准图像,(b)是该物体放大1.15倍后的图像,(c)是缩小0.75倍后的图像,(d)是旋转15度后的图像,(e)是添加高斯噪声后的图像,(f)是添加椒盐噪声后的图像。实验中共选取了10个不同物体,选取每个物体的36幅经不同变化(缩放、旋转、高斯噪声和椒盐噪声)的图像作为训练图像,50幅作为测试图像。
实验用的每幅图像都先用SIFT算法检测特征点,如图4所示,并提取其特征构成特征向量,然后将该SIFT特征向量输入BP神经网络进行训练和识别。实验时,BP神经网络的输入层节点数取为128,与提取的SIFT特征向量的维数一致;输出层节点数取为10,与要识别的物体类别数一致;隐含层节点数由公式(5)获得,取为69。其具体的识别结果如表1-3所示。为了验证本文算法的有效性,我们也在同样的实验环境和条件下,计算了物体的修正HU不变矩特征,并输入到BP网络进行训练和识别。
            表1 发生缩放变化的物体识别比较
算法 测试图像数 正确识别图像数 识别率(%)
SIFT 122 114 93.4
修正的HU不变矩 122 107 87.7
          表2 发生旋转变化的物体识别比较
算法 测试图像数 正确识别图像数 识别率(%)
SIFT 238 215 90.3
修正的HU不变矩 238 203 85.2
               表3 有噪声的物体识别比较
算法 测试图像数 正确识别图像数 识别率(%)
SIFT 140 128 91.4
修正的HU不变矩 140 121 86.4
从表1-3可以看出,本文算法对缩放变化有较好的适应性,识别率较高;噪声变化对特征点的检测和识别存在一定的干扰,识别率稍有下降;旋转对于特征的提取影响较大,相对于缩放和旋转变化,其识别率有所下降,但是在三种情况下,本文算法的识别率均高于90%。同时也可以看出,在缩放、旋转、噪声不同畸变情况下,SIFT算法的识别率明显高于修正HU不变矩算法的识别率。尤其是在发生缩放变化时,本文算法的识别率比修正HU不变矩算法的识别率高出5.7%。这主要是因为SIFT算法提取物体的128维特征,而修正HU不变矩算法提取物体的7维特征,提取特征向量的维数多,输入到BP神经网络的节点数多,对识别准确性的贡献大,识别率就高。
本文采用SIFT和BP网络相结合的方法完成物体识别。先提取标准图像和待识别图像的SIFT特征,再将标准图像的SIFT特征输入BP网络进行训练,最后将待识别图像的SIFT特征输入到该网络中进行分类识别,并将SIFT算法和修正的HU不变矩算法的识别进行比较。实验结果表明本文算法对缩放变化具有较好的适应性;在相同的实验条件下,对不同的畸变,SIFT算法比修正的HU不变矩算法的识别率明显提高了,主要应用于对识别率要求较高的场合。

Claims (3)

1.结合SIFT和BP网络进行物体识别的方法,其特征在于:
1)建立DOG金字塔;对图像进行不同分辨率的采样,并在相邻尺度空间建立金字塔,金字塔结构采用不同的高斯函数进行滤波,将相邻的高斯滤波相减构成高斯差分金字塔;
2)检测极值点;在DOG空间,比较每个点与其相邻尺度的相邻点,看该点是否都小于或者都大于其同尺度的8个邻点和上下相邻该尺度的各9个邻点,这样可保证该点在该尺度和二维空间均为极值点。
2.通过该方法获得的特征点称为候选特征点;
3)特征点的确定;获取候选特征点后,对其进行稳定性检测,去除对噪声敏感的低对比度点和不稳定的边缘响应点,通过稳定性检测的点称为SIFT特征点;
4)确定每个特征点的方向参数;利用梯度直方图确定特征点的主方向,在以特征点为中心的邻域内,用直方图计算邻域像素的梯度方向,梯度方向直方图的峰值表示该特征点邻域梯度的主方向,也就是该特征点的主方向,点(x,y)的梯度模值与方向可定义为
                        (2)
                               (3)
5)生成SIFT特征向量;将特征点作为中心,选择16X16的邻域,并将该邻域划分为16个4    X4的子区域。
3.然后在该子区域上计算共8个方向上的梯度累加值,以得梯度直方图,所以对每个特征点,可生成16X8维的特征向量,其表示如下:
                                                  (4)
6)将生成的SIFT特征向量输入至BP神经网络;对要识别的物体进行识别。
CN201410265752.0A 2014-06-16 2014-06-16 结合sift和bp网络进行物体识别的方法 Pending CN104008400A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410265752.0A CN104008400A (zh) 2014-06-16 2014-06-16 结合sift和bp网络进行物体识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410265752.0A CN104008400A (zh) 2014-06-16 2014-06-16 结合sift和bp网络进行物体识别的方法

Publications (1)

Publication Number Publication Date
CN104008400A true CN104008400A (zh) 2014-08-27

Family

ID=51369049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410265752.0A Pending CN104008400A (zh) 2014-06-16 2014-06-16 结合sift和bp网络进行物体识别的方法

Country Status (1)

Country Link
CN (1) CN104008400A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056121A (zh) * 2016-05-27 2016-10-26 河北工业大学 基于sift图像特征匹配的卫星装配工件快速识别方法
CN109101979A (zh) * 2018-07-11 2018-12-28 中国艺术科技研究所 一种紫砂壶底部款识真伪鉴别方法
CN109117773A (zh) * 2018-08-01 2019-01-01 Oppo广东移动通信有限公司 一种图像特征点检测方法、终端设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100169576A1 (en) * 2008-12-31 2010-07-01 Yurong Chen System and method for sift implementation and optimization
CN101944183A (zh) * 2010-09-02 2011-01-12 北京航空航天大学 一种利用sift树进行物体识别的方法
US20110255781A1 (en) * 2010-04-20 2011-10-20 Qualcomm Incorporated Efficient descriptor extraction over multiple levels of an image scale space
CN102629328A (zh) * 2012-03-12 2012-08-08 北京工业大学 融合颜色的显著特征概率潜在语义模型物体图像识别方法
CN103678558A (zh) * 2013-12-06 2014-03-26 中科联合自动化科技无锡有限公司 基于sift特征的嫌疑车辆检索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100169576A1 (en) * 2008-12-31 2010-07-01 Yurong Chen System and method for sift implementation and optimization
US20110255781A1 (en) * 2010-04-20 2011-10-20 Qualcomm Incorporated Efficient descriptor extraction over multiple levels of an image scale space
CN101944183A (zh) * 2010-09-02 2011-01-12 北京航空航天大学 一种利用sift树进行物体识别的方法
CN102629328A (zh) * 2012-03-12 2012-08-08 北京工业大学 融合颜色的显著特征概率潜在语义模型物体图像识别方法
CN103678558A (zh) * 2013-12-06 2014-03-26 中科联合自动化科技无锡有限公司 基于sift特征的嫌疑车辆检索方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
中国科学技术协会: "《2012-2013体视学学科发展报告》", 30 April 2014 *
查颖: ""基于SIFT和BP神经网络的车牌识别技术研究"", 《黑龙江科技信息》 *
王殿君 等,: "《移动机器人自主定位技术》", 30 March 2013 *
苏爱军 等,: "《"长江三峡工程库区巫山新城区地质环境与移民对策"》", 31 January 2008 *
诸克军 等,: "《管理运筹学及智能方法》", 30 June 2013 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056121A (zh) * 2016-05-27 2016-10-26 河北工业大学 基于sift图像特征匹配的卫星装配工件快速识别方法
CN109101979A (zh) * 2018-07-11 2018-12-28 中国艺术科技研究所 一种紫砂壶底部款识真伪鉴别方法
CN109101979B (zh) * 2018-07-11 2022-03-18 中国艺术科技研究所 一种紫砂壶底部款识真伪鉴别方法
CN109117773A (zh) * 2018-08-01 2019-01-01 Oppo广东移动通信有限公司 一种图像特征点检测方法、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CN110824450B (zh) 一种噪声环境下的雷达目标hrrp鲁棒识别方法
CN105787482A (zh) 一种基于深度卷积神经网络的特定目标轮廓图像分割方法
KR101901961B1 (ko) 부품을 인식하기 위한 장치 및 그 방법
CN104537647A (zh) 一种目标检测方法及装置
CN107424161B (zh) 一种由粗至精的室内场景图像布局估计方法
CN105809672A (zh) 一种基于超像素和结构化约束的图像多目标协同分割方法
CN111028292A (zh) 一种亚像素级图像匹配导航定位方法
CN104820997A (zh) 一种基于分块稀疏表达与hsv特征融合的目标跟踪方法
CN108171119B (zh) 基于残差网络的sar图像变化检测方法
CN112052802A (zh) 一种基于机器视觉的前方车辆行为识别方法
CN109410248B (zh) 一种基于r-K算法的浮选泡沫运动特征提取方法
CN104091350A (zh) 一种利用运动模糊信息的物体跟踪方法
Chaki et al. Recognition of whole and deformed plant leaves using statistical shape features and neuro-fuzzy classifier
CN107067410A (zh) 一种基于增广样本的流形正则化相关滤波目标跟踪方法
CN104008400A (zh) 结合sift和bp网络进行物体识别的方法
CN109740672B (zh) 多流特征距离融合系统与融合方法
CN104156723A (zh) 一种具有尺度不变性的最稳定极值区域的提取方法
Tobeta et al. E2pose: Fully convolutional networks for end-to-end multi-person pose estimation
CN105184257A (zh) 目标检测方法与装置
CN102831445A (zh) 基于语义Hough变换和偏最小二乘法的目标检测方法
CN105488099B (zh) 一种基于相似度学习的车辆检索方法
CN113792660B (zh) 基于改进YOLOv3网络的行人检测方法、系统、介质、设备
CN113316080B (zh) 基于Wi-Fi与图像融合指纹的室内定位方法
CN105719272A (zh) 保持空间结构的图像特征点匹配方法
CN113030849B (zh) 一种基于自编码器与并行网络的近场源定位方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140827

RJ01 Rejection of invention patent application after publication