CN107516069A - 基于几何重构和多尺度分析的目标识别方法 - Google Patents
基于几何重构和多尺度分析的目标识别方法 Download PDFInfo
- Publication number
- CN107516069A CN107516069A CN201710621822.5A CN201710621822A CN107516069A CN 107516069 A CN107516069 A CN 107516069A CN 201710621822 A CN201710621822 A CN 201710621822A CN 107516069 A CN107516069 A CN 107516069A
- Authority
- CN
- China
- Prior art keywords
- neural network
- image
- frequency
- training
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于目标几何重构和多尺度分析理论的目标识别方法,首先对目标姿态进行重构:包括飞行姿态归一化和图像预处理;然后采用Contourlet变换提取图像的低频及高频特征向量作为BP神经网络的基础输入训练集和修正基入训练集;最后进行BP神经网络的设计,设计出BP神经网络修正模型,利用高频细节数据修正低频轮廓数据,并确定输入输出层、中间层个数和算法,训练好的网络具有识别能力。选用红外图片库中不同机型互不重叠的图片素材测试该识别方法的精度,结果显示识别率高、识别时间短。证明该发明具有较高的工程可适用性,有一定意义和广泛应用前景。
Description
技术领域
本发明属于雷达数据处理中的机动目标识别领域。
背景技术
对于红外图像的目标识别,主要难点在于:1,飞行目标图像通常是抓拍所得,姿态多样性、几何特征不一,增加了识别的难度,如何进行飞行姿态的重构及图像预处理,2,提取特征向量的方法,使其具有良好的目标表征能力;3,模式识别方法,使其识别精度高、时间短。
目前在目标识别领域,图像特征向量提取的方法很多,例如使用小波变换,但小波变换反映的是信号的点奇异性,无法精确描述图像边缘的方向,也无法实现对图像的稀疏表示,从而影响识别精度;识别的方法也很多,有的应用角点特征和核聚类算法,有的是用小波变换进行特征有的基于闭合轮廓特征,有的采用模板匹配等等。
发明内容
本发明的目的在于提供一种机动目标识别方法,该方法对飞行姿态进行几何重构,再使用Contourlet变换的多尺度分析方法提取图像低频特征向量和高频特征向量,以低频特征为原始输入参数,通过BP神经网络训练以高频特征向量修正模型,快速有效的实现对不同机型、多种飞行姿态、不同光照明暗变化下的飞行目标进行识别。
实现本发明的技术解决方案为:采用Contourlet变换的图像识别方法和BP神经网络特征向量训练方法相结合的方法。首先对图片库中红外目标图像进行飞行姿态的几何重构;然后基于Contourlet变换的图像特征提取,对机型库中目标图像采用2层Contourlet变换提取特征向量,用表达轮廓的低频特征作为基础输入训练集,提取表达细节信息的高频特征向量作为BP神经网络修正训练集输入网络;最后BP神经网络建模,进行网络设计,包括样本归一化,确定BP神经网络层数,确定隐含层节点个数和中间层、输出层的传递函数;为测试训练结束后的网络精度,对图片库中每种机型各随机选取不重复的若干幅图像用于识别测试。
本发明与现有方法相比,其显著优点为:
1.通过几何重构,调整抓拍图像的目标姿态,对图像多尺度分析提供重要基础。
2.Contourlet变换是一种基于非分离型滤波器组实现的图像多尺度几何分析工具,其思想是通过类似于轮廓段(Contoursegment)的基结构来逼近图像,其算法继承了小波的多分辨和时频局部化特性,同时又兼具良好的方向性和各向异性,克服了小波变换只能反映信号的点奇异性,无法精确描述图像边缘的方向,也无法实现对图像的稀疏表示的局限性。而多尺度几何分析方法正是为了克服小波这一局限性而产生的,
对于一个二次连续可微的目标函f∈L2(R2),如果fm是其重构函数,m是其系数重量,则Contourlet变换时,误差逼近满足
而采用小波变换时,误差逼近满足
由此可看出,Contourlet变换比小波变换具有更好的逼近能量,对图像中的曲线、直线具有更“稀疏”的表达,更有利于对红外图像进行预处理提取特征信息。
3.BP神经网络具有一层或多层的网络结构,输入层、中间层、输出层有多个并行节点,并行处理能力强因而识别速度快、效率高;具有自学习算法因而识别预测准确、稳健性好,非常适合用来处理非线性输入输出的关系;可以实现离线数据的在线修正:输入数据通过BP神经网络的各层到达输出层后比较输入输出的差值是否达到,如果没有达到则返回各层不间断调整各层权值,以达到期望的输出。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为红外图像几何重构和灰度归一化对比图;
图2为某幅目标图像的高频特征16个方向分布图;
图3为BP神经网络结构示意图;
图4为BP神经网络修正流程图;
图5为目标辨识流程图;
图6为识别结果。
具体实施方式
识别算法步骤主要分为三步,首先进行飞行姿态的图像归一化处理,然后提取特征向量,最后进行BP神经网络修正训练。
1、飞行目标姿态的几何重构。
(1)用于红外抓拍到的飞行目标具有姿态多样性,对识别造成一定干扰,现将飞行姿态进行姿态重构,调整为机头向上,需提取出飞行目标中心点,沿其机身轴线进行等尺度平移、旋转,可将飞行目标归一为机头向上的图像。
首先提取飞机中心原点
其中f(x′,y′)为图像函数,当(x′,y′)属于目标区时,f(x′,y′)=1,当(x′,y′)不属于目标区时,f(x′,y′)=0。a、b、c、d为跟踪窗口边界坐标。
获得圆点后,以0~360度向周围做直线,在该直线上寻找飞机图像的边缘点,边缘点到形心的距离最长的线段对应的角度α,即为飞机图像轴线方向,该边缘点所在位置即机头位置,同样,由机头经形心向机尾搜索目标边缘点,可找到机尾坐标。将轴线方向沿角度α旋转可将飞行目标图像转为为机头向上的标准图像。
(2)对图像预处理分为两步,第一步进行图片几何标准化处理,由于目标在整个红外图像中的位置、大小不同,因此会影响识别效果,需要通过校准、定位等方法对目标图像进行矫正,本发明将待识别目标的区域放大并将图像校准为像素为64×64,使得目标特征更为明显。第二步进行灰度归一化处理,由于不同图像受环境影响较大,需要对不同光照条件、光线方向下得到的图像进行补偿,以减弱不同环境条件下拍摄的图像信号变化,方便后续特征向量的提取。飞行姿态几何重构前后对比图如图1所示。
2、基于Contourlet变换的图像特征提取。
目标图像的特征提取是识别过程中关键的环节,通过提取特征量来刻画目标图像的轮廓特征,为BP神经网络训练提供输入参数。采用Contourlet变换分别提取出低频特征和高频能量特征。
低频特征向量包含了大部分能量信息,能平滑逼近图像的轮廓信息,该部分分量可以作为BP识别中的基础特征向量。但在实际采集的图片中不同光线下拍摄的目标图像包含高频噪声,Contourlet变换的低频分量对光线变换并不敏感。
高频系数能反映目标各个方向的边缘、细节等信息,是具有较高识别效率的特征,故本方法选取高频特征向量作为BP神经网络训练的修正向量,利用BP神经网络的修正思想,可以对低频特征训练进行修正。图2为直升飞机红外图像进行Contourlet变换提取出的16个方向高频特征,为分解出来的目标边缘和轮廓信息在各个方向、各个位置的分布情况。
3、BP神经网络建模
BP神经网络具有一层或多层的前馈网络,对实例训练是通过利用输出层误差沿着与输入信号相反的方向逐级反向传递来自动获取知识。一般有输入出、中间层、输出层,各层顺次连接,结构示意图如图3所示。
(1)输入输出层设计
BP神经网络输入节点数取决于数据的维度,也就是特征向量的个数。本发明通过Contourlet分解可以提取16维目标特征向量,故输入参数为特征向量集[x1,x2…x16],输入层节点数为16。
输出节点数由红外图像数据库的目标种类数决定,如红外图像数据库的目标类别为N则输出节点数即设置为N个。本发明采用包含三种机型的红外图像库数据,因此BP神经网络的输出节点数为3,输入参数为特征向量集[y1,y2,y3]。
(2)中间层设计。
前馈型BP神经网络的中间层一般可包含有一至多个隐藏层,隐藏层的非线性传递函数神经元可以学习输入输出之间的线性和非线性关系,采用多个隐藏层数或增加隐藏层的节点数均可提高网络精度,但隐藏层增多或隐藏层节点数增多都会增加了网络自学习的时间,影响效率,不利于识别方法的推广;若隐层节点数太少,训练时间虽然变短,但可能训练不出来或容错性大。
为了便于观察和调整,本文采用三层网络,即一层隐藏层,再通过调节隐藏层结点个数来达到在高网络精度和低训练时间的之间的最优化策略。利用公式或公式n1=log2n(其中n为输入节点数,m为输出节点数,α为1~10之间的常数)可推算出中间层节点数的取值范围。综合考虑实验结果:当中间层为一层隐藏层且神经元个数为14时,识别率高误差低且收敛时间短,网络训练达到目标结束。因此确定中间层个数为14。
(3)学习算法设计
传递函数是BP神经网络的重要组成,必须是连续可微的。本发明采用的中间层的传递函数为tan-sigmoid,输出层传递函数为log-sigmoid,训练采用Levenberg-Marquardt算法,收敛准则为训练的误差≤0.001。构建过程包括训练原始数据归一化、网络结构优化和数据反归一化等几个过程。考虑到训练时间,设定迭代次数<10,000时,超过则退出程序
(4)BP神经网络修正训练
本发明采用红外飞行数据库作为样本集,库中包含直升机、战斗机、民航客机不同姿态、不同环境下的红外图片,训练图片和测试图片互不重叠。
首先对训练集目标图像分解出低频子带上的特征向量,作为网络原始输入,再进行2层Contourlet分解,提取得到16维高频特征向量,作为修正参数输入网络训练,输出目标集设定为[y1,y2,y3]=[1,0,0]、[0,1,0]、[0,0,1]。
BP神经网络修正的思想是:对特征向量进行分组,所分组数根据图片库大小或机型种类数多少而定,通过高频的细节特征对其低频特征所表达的轮廓信息进行修正,训练好的网络能得到一组输出数据,把这组输出数据作为修正得到的数据送入网络,用第2组高频特征向量进行第2次修正,以此类推。通过图象的低频数据和高频数据在BP神经网络中的多次训练,使得训练好的网络具有良好的识别能量,同时支持今后机型库和图片库的扩展。网络修正流程图如图4所示。
为验证网络精度,将测试集目标图像经过姿态重构后进行Contourlet分解,同样提取低频特征向量和16维高频特征向量,将其作为测试数据送入训练好的网络模型进行辨识,并计算仿真结果的误差值。目标辨识流程图如图5所示。
(5)识别方法有效性验证
为了验证模型有效性,本发明对库中80幅不同机型飞行红外图像进行图像预处理、特征提取和BP神经网络训练,并对战斗机、直升机、民航客机的每种机型各随机选取不重复的3幅图像用于测试。训练过程中:训练函数会根据设定的显示训练结果的间隔步数值自动显示当前训练结果信息,并给出网络误差实时变化曲线。如图6所示,当训练至22步时,训练达到性能目标。当训练步数大于训练设定步数、训练误差小于训练目标误差、训练时间超过训练允许时间,或误差梯度值小于训练中最小允许梯度值时,训练都将被终止,并返回训练后的对象。训练结果为:当中间层神经元个数为15时,误差达到给定要求且训练时间最短,网络训练结束。因此确定中间阶段个数为15。
识别率如下表所示,识别率较高,可以说明本发明的有效性。
表1三种机型红外图片识别结果
机型 | 识别率 |
战斗机 | 98.13% |
直升机 | 99.93% |
民航客机 | 99.60% |
测试结果表明本发明目标识别率高,具有很好的精确性,能满足不同类型空中目标的准确识别要求。同时本发明对于红外图像明暗光照变化、目标姿态变换均具有良好的鲁棒性。
Claims (3)
1.一种基于几何重构和多尺度分析的目标识别方法,其特征在于包括以下步骤:
步骤1:对图片库中红外目标图像进行飞行姿态的几何重构;
步骤2:基于Contourlet变换的图像特征提取:对机型库中目标图像采用2层Contourlet变换提取特征向量,用表达轮廓的低频特征作为基础输入训练集,提取表达细节信息的高频特征向量作为BP神经网络修正训练集输入网络;
步骤3:BP神经网络建模:进行神经网络的设计,包括样本归一化,确定神经网络层数,确定隐含层节点个数和中间层、输出层的传递函数;为测试训练结束后的网络精度,对图片库中每种机型各随机选取不重复的若干幅图像用于识别测试。
2.根据权利要求1所述的基于几何重构和多尺度分析的目标识别方法,其特征在于所述步骤1包括:提取出飞机中心点,进而提取机身中轴,将轴线方向沿一定角度α旋转可将飞行目标图像转为为机头向上的标准图像;其次进行图像预处理图片几何标准化处理和灰度归一化处理。
3.根据权利要求1或2所述的基于几何重构和多尺度分析的目标识别方法,其特征在于所述BP神经网络修正训练为:对特征向量进行分组,所分组数根据图片库大小或机型种类数多少而定,通过高频的细节特征对其低频特征所表达的轮廓信息进行修正,训练好的神经网络能得到一组输出数据,把这组输出数据作为修正得到的数据送入网络,用第2组高频特征向量进行第2次修正,以此类推;通过图像的低频数据和高频数据在神经网络中的多次训练,使得训练好的神经网络具有良好的识别能量,同时支持今后机型库和图片库的扩展。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710621822.5A CN107516069A (zh) | 2017-07-27 | 2017-07-27 | 基于几何重构和多尺度分析的目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710621822.5A CN107516069A (zh) | 2017-07-27 | 2017-07-27 | 基于几何重构和多尺度分析的目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107516069A true CN107516069A (zh) | 2017-12-26 |
Family
ID=60722871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710621822.5A Pending CN107516069A (zh) | 2017-07-27 | 2017-07-27 | 基于几何重构和多尺度分析的目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107516069A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109115229A (zh) * | 2018-09-17 | 2019-01-01 | 中国人民解放军国防科技大学 | 利用低频测姿传感器对航天器高频姿态进行测量的方法 |
CN111104823A (zh) * | 2018-10-25 | 2020-05-05 | 北京奇虎科技有限公司 | 人脸识别方法、装置及存储介质、终端设备 |
CN111860548A (zh) * | 2019-04-02 | 2020-10-30 | 北京京东尚科信息技术有限公司 | 图像识别方法及其装置、计算机可存储介质 |
CN116959121A (zh) * | 2023-09-21 | 2023-10-27 | 湖南开放大学(湖南网络工程职业学院、湖南省干部教育培训网络学院) | 一种基于图像识别的3d立体拍摄的计算机智能控制系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8064694B2 (en) * | 2006-06-21 | 2011-11-22 | Hewlett-Packard Development Company, L.P. | Nonhuman animal integument pixel classification |
US20140099029A1 (en) * | 2012-10-05 | 2014-04-10 | Carnegie Mellon University | Face Age-Estimation and Methods, Systems, and Software Therefor |
CN105760883A (zh) * | 2016-02-15 | 2016-07-13 | 西安科技大学 | 基于红外热像的带式输送机关键部件自动识别方法 |
CN106529447A (zh) * | 2016-11-03 | 2017-03-22 | 河北工业大学 | 一种小样本人脸识别方法 |
CN106845478A (zh) * | 2016-12-30 | 2017-06-13 | 同观科技(深圳)有限公司 | 一种字符置信度的二次车牌识别方法及装置 |
CN106919925A (zh) * | 2017-03-07 | 2017-07-04 | 南京师范大学 | 一种基于小波熵与人工神经网络的福特汽车检测方法 |
-
2017
- 2017-07-27 CN CN201710621822.5A patent/CN107516069A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8064694B2 (en) * | 2006-06-21 | 2011-11-22 | Hewlett-Packard Development Company, L.P. | Nonhuman animal integument pixel classification |
US20140099029A1 (en) * | 2012-10-05 | 2014-04-10 | Carnegie Mellon University | Face Age-Estimation and Methods, Systems, and Software Therefor |
CN105760883A (zh) * | 2016-02-15 | 2016-07-13 | 西安科技大学 | 基于红外热像的带式输送机关键部件自动识别方法 |
CN106529447A (zh) * | 2016-11-03 | 2017-03-22 | 河北工业大学 | 一种小样本人脸识别方法 |
CN106845478A (zh) * | 2016-12-30 | 2017-06-13 | 同观科技(深圳)有限公司 | 一种字符置信度的二次车牌识别方法及装置 |
CN106919925A (zh) * | 2017-03-07 | 2017-07-04 | 南京师范大学 | 一种基于小波熵与人工神经网络的福特汽车检测方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109115229A (zh) * | 2018-09-17 | 2019-01-01 | 中国人民解放军国防科技大学 | 利用低频测姿传感器对航天器高频姿态进行测量的方法 |
CN109115229B (zh) * | 2018-09-17 | 2019-05-31 | 中国人民解放军国防科技大学 | 利用低频测姿传感器对航天器高频姿态进行测量的方法 |
CN111104823A (zh) * | 2018-10-25 | 2020-05-05 | 北京奇虎科技有限公司 | 人脸识别方法、装置及存储介质、终端设备 |
CN111104823B (zh) * | 2018-10-25 | 2024-08-20 | 北京奇虎科技有限公司 | 人脸识别方法、装置及存储介质、终端设备 |
CN111860548A (zh) * | 2019-04-02 | 2020-10-30 | 北京京东尚科信息技术有限公司 | 图像识别方法及其装置、计算机可存储介质 |
CN116959121A (zh) * | 2023-09-21 | 2023-10-27 | 湖南开放大学(湖南网络工程职业学院、湖南省干部教育培训网络学院) | 一种基于图像识别的3d立体拍摄的计算机智能控制系统 |
CN116959121B (zh) * | 2023-09-21 | 2024-01-30 | 湖南开放大学(湖南网络工程职业学院、湖南省干部教育培训网络学院) | 一种基于图像识别的3d立体拍摄的计算机智能控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685115B (zh) | 一种双线性特征融合的细粒度概念模型及学习方法 | |
CN107657279B (zh) | 一种基于少量样本的遥感目标检测方法 | |
CN107610141B (zh) | 一种基于深度学习的遥感图像语义分割方法 | |
CN105825511B (zh) | 一种基于深度学习的图片背景清晰度检测方法 | |
CN111753828B (zh) | 一种基于深度卷积神经网络的自然场景水平文字检测方法 | |
CN100492399C (zh) | 利用降维方法进行人脸姿态估计的方法 | |
CN107516069A (zh) | 基于几何重构和多尺度分析的目标识别方法 | |
CN109191455A (zh) | 一种基于ssd卷积网络的大田作物病虫害检测方法 | |
CN110135459B (zh) | 一种基于双三元组深度度量学习网络的零样本分类方法 | |
CN110197205A (zh) | 一种多特征来源残差网络的图像识别方法 | |
CN111368885A (zh) | 一种基于深度学习和信息融合的航空发动机气路故障诊断方法 | |
CN106408030A (zh) | 基于中层语义属性和卷积神经网络的sar图像分类方法 | |
CN108830312B (zh) | 一种基于样本自适应扩充的集成学习方法 | |
CN104268538A (zh) | 一种易拉罐点阵喷码字符在线视觉检测方法 | |
CN110097053A (zh) | 一种基于改进Faster-RCNN的电力设备外观缺陷检测方法 | |
CN109492750B (zh) | 基于卷积神经网络和因素空间的零样本图像分类方法 | |
CN108416318A (zh) | 基于数据增强的合成孔径雷达图像目标深度模型识别方法 | |
CN108847223A (zh) | 一种基于深度残差神经网络的语音识别方法 | |
CN112907614A (zh) | 基于深度特征融合的yolov5-segnet绝缘子串轮廓提取方法 | |
CN107203752A (zh) | 一种联合深度学习和特征二范数约束的人脸识别方法 | |
CN108932712A (zh) | 一种转子绕组质量检测系统及方法 | |
CN104091181A (zh) | 基于深度受限玻尔兹曼机的害虫图像自动识别方法及系统 | |
CN104680185B (zh) | 基于边界点重分类的高光谱图像分类方法 | |
CN114359702A (zh) | 一种基于Transformer的宅基地遥感图像违建识别方法及系统 | |
CN105631477A (zh) | 基于极限学习机和自适应提升的交通标志识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171226 |
|
WD01 | Invention patent application deemed withdrawn after publication |