CN110222700A - 基于多尺度特征与宽度学习的sar图像识别方法及装置 - Google Patents
基于多尺度特征与宽度学习的sar图像识别方法及装置 Download PDFInfo
- Publication number
- CN110222700A CN110222700A CN201910460194.6A CN201910460194A CN110222700A CN 110222700 A CN110222700 A CN 110222700A CN 201910460194 A CN201910460194 A CN 201910460194A CN 110222700 A CN110222700 A CN 110222700A
- Authority
- CN
- China
- Prior art keywords
- sar image
- lbp
- feature
- lpq
- width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000004927 fusion Effects 0.000 claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000005070 sampling Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 9
- 230000009467 reduction Effects 0.000 claims abstract description 9
- 239000000284 extract Substances 0.000 claims abstract description 3
- 230000002708 enhancing effect Effects 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 6
- 230000000295 complement effect Effects 0.000 abstract description 5
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/88—Radar or analogous systems specially adapted for specific applications
- G01S13/89—Radar or analogous systems specially adapted for specific applications for mapping or imaging
- G01S13/90—Radar or analogous systems specially adapted for specific applications for mapping or imaging using synthetic aperture techniques, e.g. synthetic aperture radar [SAR] techniques
- G01S13/9021—SAR image post-processing techniques
- G01S13/9027—Pattern recognition for feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Remote Sensing (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Radar, Positioning & Navigation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Electromagnetism (AREA)
- Computer Networks & Wireless Communication (AREA)
- Astronomy & Astrophysics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明公开了基于多尺度特征与宽度学习的SAR图像识别方法及装置,通过质心定位法对原始SAR图像提取感兴趣区域,对图像旋转并添加噪声以增强数据量,对图像下采样处理,提取LBP特征,提取LPQ特征,将LBP特征向量XLBP和LPQ特征向量XLPQ级联后通过主成分分析方法降维得到融合特征数据Xm,输入融合特征数据Xm到宽度学习网络进行图像识别并输出识别结果;通过融合LBP特征和LPQ特征充分利用互补信息的同时降低了冗余信息,使用宽度学习网络提升训练速度,降低时间成本;使得识别效果更加稳定、鲁棒、可靠。
Description
技术领域
本发明涉及图像识别领域,特别是基于多尺度特征与宽度学习的SAR图像识别方法及装置。
背景技术
SAR是当前对地观测的重要手段之一。由于具有全天候性和强穿透成像能力,SAR已经被广泛应用于战场侦查和情报获取等领域。但由于SAR图像对成像的方位比较敏感,并且目标数据存在大量环境噪声;传统的识别分类方法在分类准确率上取得一定的高度,但还存在诸多缺陷,例如对于SAR图像特征提取性能低,矩阵收敛速度较慢,训练时间较长,参数估计复杂,效率较低。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供了SAR图像识别方法及装置,通过多尺度特征和宽度学习网络提升SAR图像识别的性能。
本发明解决其问题所采用的技术方案是:
本发明的第一方面,提供了基于多尺度特征与宽度学习的SAR图像识别方法,包括以下步骤:
输入原始SAR图像;
通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像;
对包含感兴趣区域的SAR图像旋转并添加噪声以增强数据量,得到数据增强的SAR图像;
对数据增强的SAR图像下采样处理,得到多尺度的SAR图像;
对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP;
对多尺度的SAR图像提取LPQ特征,并得到LPQ特征向量XLPQ;
将LBP特征向量XLBP和LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm;
输入融合特征数据Xm到宽度学习网络进行图像识别并输出识别结果。
上述基于多尺度特征与宽度学习的SAR图像识别方法至少具有以下的有益效果:用融合LBP特征和LPQ特征的融合特征数据作为宽度学习网络的输入,在充分利用互补信息的同时降低了冗余信息并提高特征提取性能;利用宽度学习网络对SAR图像识别,训练速度快,重构代价小,时间成本大大降低,同时减小SAR图像中的噪声对识别结果的影响;使得识别效果更加稳定、鲁棒、可靠。
根据本发明的第一方面,所述通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像具体包括以下步骤:通过质心公式确定质心坐标;以质心为中心得到L*L的感兴趣区域,进而得到包含感兴趣区域的SAR图像;其中,L为感兴趣区域的边长;质心公式为(xc,yc)为质心坐标,m10和m01为原始SAR图像的一阶原始矩阵,m00为原始SAR图像的零阶原始矩阵。
根据本发明的第一方面,所述对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP具体为:将多尺度的SAR图像经过LBP特征算子提取LBP特征,将LBP特征级联融合得到LBP特征向量XLBP;其中,LBP特征算子为为质心坐标,gc为质心灰度值,gp为等距离分布于以质心为圆心、r为半径的圆周上的像素点,p为gp的数量。
根据本发明的第一方面,所述输入融合特征数据Xm到宽度学习网络进行图像识别并输出识别结果具体包括:
将融合特征数据Xm分为训练集X1和测试集X2;
输入训练集X1至宽度学习网络,训练宽度学习网络优化连接权重;
输入测试集X2至训练后的宽度学习网络得到识别结果。
根据本发明的第一方面,所述输入训练集X1至宽度学习网络,训练宽度学习网络优化连接权重具体包括:
生成特征节点:输入训练集X1实现投影并产生i组特征节点,其中第i组特征节点为Zi=φ(X1Wei+βei),式中Wei为随机矩阵,βei为偏置,φ(·)为非线性激活函数;
生成增强节点:输入训练集X1产生m组增强节点,其中第m组特征节点为Hm≡ξ(ZnWhm+βhm),式中Whm为与Wei不同的随机矩阵,βhm为与βei不同的偏置,ξ(·)为与φ(·)不同的非线性激活函数,Zn表示所有特征节点;
优化连接权重:将i组特征节点和m组增强节点相互连接得到合并矩阵作为宽度学习网络的实际输入,根据输出矩阵Y计算宽度学习网络的连接权重为:Wm=[Zi|Hm]+Y;通过训练集X1对宽度学习网络不断训练以优化连接权重。
本发明的第二方面,提供了应用本发明第一发明所述的基于多尺度特征与宽度学习的SAR图像识别方法的基于多尺度特征与宽度学习的SAR图像识别装置,包括:
图像输入模块,用于输入原始SAR图像;
感兴趣区域提取模块,用于通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像;
数据增强模块,用于对包含感兴趣区域的SAR图像旋转并添加噪声以增强数据量,得到数据增强的SAR图像;
下采样模块,用于对数据增强的SAR图像下采样处理,得到多尺度的SAR图像;
LBP特征提取模块,用于对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP;
LPQ特征提取模块,用于对多尺度的SAR图像提取LPQ特征,并得到LPQ特征向量XLPQ;
融合特征模块,用于将LBP特征向量XLBP和LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm;
宽度学习网络模块,用于输入融合特征数据Xm进行图像识别并输出识别结果。
上述基于多尺度特征与宽度学习的SAR图像识别装置至少具有以下的有益效果:网络架构简单且分工明确;用融合LBP特征和LPQ特征的融合特征数据作为宽度学习网络的输入,在充分利用互补信息的同时降低了冗余信息并提高特征提取性能;利用宽度学习网络对SAR图像识别,训练速度快,时间成本大大降低,同时减小SAR图像中的噪声影响;使得识别效果更加稳定、鲁棒、可靠。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明实施例基于多尺度特征与宽度学习的SAR图像识别方法的流程图;
图2是图1中步骤S800的具体流程图;
图3是本发明实施例基于多尺度特征与宽度学习的SAR图像识别装置的结构示意图。
具体实施方式
本部分将详细描述本发明的具体实施例,本发明之较佳实施例在附图中示出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
参照图1,本发明实施例提供了,基于多尺度特征与宽度学习的SAR图像识别方法,包括以下步骤:
S100、输入原始SAR图像;
S200、通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像;
S300、对包含感兴趣区域的SAR图像旋转并添加噪声以增强数据量,得到数据增强的SAR图像;
S400、对数据增强的SAR图像下采样处理,得到多尺度的SAR图像;
S500、对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP;
S600、对多尺度的SAR图像提取LPQ特征,并得到LPQ特征向量XLPQ;
S700、将LBP特征向量XLBP和LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm;
S800、输入融合特征数据Xm到宽度学习网络进行图像识别并输出识别结果。
在该实施例中,用融合LBP特征和LPQ特征的融合特征数据作为宽度学习网络的输入,在充分利用互补信息的同时降低了冗余信息并提高特征提取性能;利用宽度学习网络对SAR图像识别,训练速度快,重构代价小,时间成本大大降低,同时减小SAR图像中的噪声对识别结果的影响;使得识别效果更加稳定、鲁棒、可靠。
进一步,在步骤S200中,通过质心公式确定质心坐标;以质心为中心得到L*L的感兴趣区域,进而得到包含感兴趣区域的SAR图像;其中,L为感兴趣区域的边长,L比原始SAR图像的长和宽都要小;质心公式为(xc,yc)为质心坐标,m10和m01为原始SAR图像的一阶原始矩阵,m00为原始SAR图像的零阶原始矩阵。通过步骤S200减少图像的维度,降低背景噪声的影响。
进一步,在步骤S300中,对包含感兴趣区域的SAR图像每隔1度旋转一次,旋转360度,实现360倍的数据增强;对旋转后的SAR图像加入随机整数作为随机噪声再进一步增强数据,随机整数为[-8,8]中的任意整数。步骤S300大大增强了SAR图像的数据量,有利于识别准确率的提高。
进一步,在步骤S400中,对数据增强的SAR图像下采样处理,下采样处理为对图像进行缩小像素处理以得到多尺度的SAR图像。例如,一张原尺寸为64像素*64像素的SAR图像,下采样后得到54像素*54像素、45像素*45像素、20像素*20像素的SAR图像。
进一步,在步骤S500中,将多尺度的SAR图像经过LBP特征算子提取LBP特征。LBP特征为数据矩阵,级联融合即是将LBP特征对应的数据矩阵横向并联,进而得到LBP特征向量XLBP。其中,LBP特征算子为(xc,yc)为质心坐标,gc为质心灰度值,gp为等距离分布于以质心为圆心、r为半径的圆周上的像素点,p为gp的数量。
在步骤S600中,对多尺度的SAR图像通过LPQ算法提取LPQ特征,并得到LPQ特征向量XLPQ。LPQ算法是利用傅里叶变换相位的模糊不变性,提高对模糊图像识别的鲁棒性;在SAR图像的每个像素点的邻域内计算傅里叶变换后的相位信息,并在低频分量上进行量化进而形成数据矩阵形式的LPQ特征。将LPQ特征级联融合,进而得到LPQ特征向量XLPQ。
在步骤S700中,将步骤S500中得到的LBP特征向量XLBP以及步骤S600中得到的LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm。融合LBP特征和LPQ特征的融合特征数据具有更强的数据特征,有利于提高SAR图像识别的准确性。
主成分分析方法是将n维特征映射到k维特征上。k维特征是全新的正交特征,也被称为主成分。主成分分析方法是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与n维特征的数据本身是密切相关的。其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的,第三个轴是与第1、2个轴正交的平面中方差最大的。依次类推,可以得到n个这样的坐标轴,通过这种方式获得的新的坐标轴。只保留前面k个含有绝大部分方差的坐标轴,而忽略包含方差几乎为0的坐标轴,实现对数据特征的降维处理。
参照图2,在步骤S800中,输入融合特征数据Xm到宽度学习网络。
S810、将融合特征数据Xm分为训练集X1和测试集X2,并对训练集X1和测试集X2进行z分数标准化。
S820、输入训练集X1,对宽度学习网络进行训练;
S821、生成特征节点:
输入训练集X1实现投影并产生i组特征节点,则第i组特征节点为Zi=φ(X1Wei+βei),其中Wei为随机矩阵,βei为偏置,φ(·)为非线性激活函数。
S822、生成增强节点:
输入训练集X1产生m组增强节点,则第m组特征节点为Hm≡ξ(ZnWhm+βhm),其中Whm为与Wei不同的随机矩阵,βhm为与βei不同的偏置,ξ(·)为与φ(·)不同的非线性激活函数,Zn表示所有特征节点。
S823、优化连接权重:
将i组特征节点和m组增强节点相互连接得到合并矩阵,作为系统的实际输入,宽度学习网络的输出矩阵为:Y==[Zi|Hm]Wm;那么宽度学习网络的连接权重为:Wm=[Zi|Hm]+Y;通过训练集X1对宽度学习网络不断训练以优化连接权重。
S830、输入测试集X2到训练后的宽度学习网络中得到识别结果;利用宽度学习网络的资源需求量少、快速训练和增量学习特性,实现了准确、快速、自适应的SAR图像识别技术。
参照图3,本发明另一个实施例提供了,应用上述的基于多尺度特征与宽度学习的SAR图像识别方法的SAR图像识别装置,包括:
图像输入模块1,执行步骤S100,用于输入原始SAR图像;
感兴趣区域提取模块2,执行步骤S200,用于通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像;
数据增强模块3,执行步骤S300,用于对包含感兴趣区域的SAR图像旋转并添加噪声以增强数据量,得到数据增强的SAR图像;
下采样模块4,执行步骤S400,用于对数据增强的SAR图像下采样处理,得到多尺度的SAR图像;
LBP特征提取模块5,执行步骤S500,用于对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP;
LPQ特征提取模块6,执行步骤S600,用于对多尺度的SAR图像提取LPQ特征,并得到LPQ特征向量XLPQ;
融合特征模块7,执行步骤S700,用于将LBP特征向量XLBP和LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm;
宽度学习网络模块8,执行步骤S810至步骤S830,用于输入融合特征数据Xm进行图像识别并输出识别结果。
进一步,在感兴趣区域提取模块2中,先通过质心公式确定质心坐标;再以质心为中心得到L*L的感兴趣区域,进而得到包含感兴趣区域的SAR图像;其中,L为感兴趣区域的边长,L比原始SAR图像的长和宽都要小;质心公式为(xc,yc)为质心坐标,m10和m01为原始SAR图像的一阶原始矩阵,m00为原始SAR图像的零阶原始矩阵。
进一步,在数据增强模块3中,对包含感兴趣区域的SAR图像每隔1度旋转一次,旋转360度,实现360倍的数据增强;对旋转后的SAR图像加入随机整数作为随机噪声再进一步增强数据,随机整数为[-8,8]中的任意整数。
进一步,在下采样模块4中,对数据增强的SAR图像下采样处理,下采样处理为对图像进行缩小像素处理以得到多尺度的SAR图像。
进一步,在LBP特征提取模块5中,将多尺度的SAR图像经过LBP特征算子提取LBP特征。LBP特征为数据矩阵,级联融合即是将LBP特征对应的数据矩阵横向并联,进而得到LBP特征向量XLBP。其中,LBP特征算子为为质心坐标,gc为质心灰度值,gp为等距离分布于以质心为圆心、r为半径的圆周上的像素点,p为gp的数量。
进一步,在LPQ特征提取模块6中,对多尺度的SAR图像通过LPQ算法提取LPQ特征,再将LPQ特征级联融合,进而得到LPQ特征向量XLPQ。
进一步,在融合特征模块7中,将LBP特征提取模块5中得到的LBP特征向量XLBP以及LPQ特征提取模块6中得到的LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm。融合LBP特征和LPQ特征的融合特征数据具有更强的数据特征,有利于提高SAR图像识别的准确性。
进一步,宽度学习网络模块8包含了宽度学习网络的模型。先输入从融合特征模块7得到的融合特征数据Xm,再将融合特征数据Xm分为训练集X1和测试集X2,并对训练集X1和测试集X2进行z分数标准化。
输入训练集X1,对宽度学习网络进行训练;
生成特征节点:
输入训练集X1实现投影并产生i组特征节点,则第i组特征节点为Zi=φ(X1Wei+βei),其中Wei为随机矩阵,βei为偏置,φ(·)为非线性激活函数。
生成增强节点:
输入训练集X1产生m组增强节点,则第m组特征节点为Hm≡ξ(ZnWhm+βhm),其中Whm为与Wei不同的随机矩阵,βhm为与βei不同的偏置,ξ(·)为与φ(·)不同的非线性激活函数,Zn表示所有特征节点。
优化连接权重:
将i组特征节点和m组增强节点相互连接得到合并矩阵,作为系统的实际输入,宽度学习网络的输出矩阵为:Y==[Zi|Hm]Wm;那么宽度学习网络的连接权重为:Wm=[Zi|Hm]+Y;通过训练集X1对宽度学习网络不断训练以优化连接权重。
输入测试集X2到训练后的宽度学习网络中得到识别结果;利用宽度学习网络的资源需求量少、快速训练和增量学习特性,实现了准确、快速、自适应的SAR图像识别技术。
此外,本发明另一个实施例提供了SAR图像识别装置,包括处理器和用于与所述处理器连接的存储器;所述存储器存储有可被所述处理器执行的指令,所述指令被所述处理器执行,以使所述处理器能够执行如上所述的基于多尺度特征与宽度学习的SAR图像识别方法。
本发明另一个实施例提供了一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上所述的基于多尺度特征与宽度学习的SAR图像识别方法。
上述应用了基于多尺度特征与宽度学习的SAR图像识别方法的SAR图像识别装置及存储介质,通过利用融合LBP特征和LPQ特征的融合特征数据作为宽度学习网络的输入,在充分利用互补信息的同时降低了冗余信息并提高特征提取性能;利用宽度学习网络对SAR图像识别,训练速度快,时间成本大大降低,同时减小SAR图像中的噪声影响;使得识别效果更加稳定、鲁棒、可靠。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。
Claims (6)
1.基于多尺度特征与宽度学习的SAR图像识别方法,其特征在于,包括以下步骤:
输入原始SAR图像;
通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像;
对包含感兴趣区域的SAR图像旋转并添加噪声以增强数据量,得到数据增强的SAR图像;
对数据增强的SAR图像下采样处理,得到多尺度的SAR图像;
对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP;
对多尺度的SAR图像提取LPQ特征,并得到LPQ特征向量XLPQ;
将LBP特征向量XLBP和LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm;
输入融合特征数据Xm到宽度学习网络进行图像识别并输出识别结果。
2.根据权利要求1所述的基于多尺度特征与宽度学习的SAR图像识别方法,其特征在于,所述通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像具体包括以下步骤:通过质心公式确定质心坐标;以质心为中心得到L*L的感兴趣区域,进而得到包含感兴趣区域的SAR图像;其中,L为感兴趣区域的边长;质心公式为(xc,yc)为质心坐标,m10和m01为原始SAR图像的一阶原始矩阵,m00为原始SAR图像的零阶原始矩阵。
3.根据权利要求2所述的基于多尺度特征与宽度学习的SAR图像识别方法,其特征在于,所述对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP具体为:将多尺度的SAR图像经过LBP特征算子提取LBP特征,将LBP特征级联融合得到LBP特征向量XLBP;其中,LBP特征算子为 (xc,yc)为质心坐标,gc为质心灰度值,gp为等距离分布于以质心为圆心、r为半径的圆周上的像素点,p为gp的数量。
4.根据权利要求1所述的基于多尺度特征与宽度学习的SAR图像识别方法,其特征在于,所述输入融合特征数据Xm到宽度学习网络进行图像识别并输出识别结果具体包括:
将融合特征数据Xm分为训练集X1和测试集X2;
输入训练集X1至宽度学习网络,训练宽度学习网络优化连接权重;
输入测试集X2至训练后的宽度学习网络得到识别结果。
5.根据权利要求4所述的基于多尺度特征与宽度学习的SAR图像识别方法,其特征在于,所述输入训练集X1至宽度学习网络,训练宽度学习网络优化连接权重具体包括:
生成特征节点:输入训练集X1实现投影并产生i组特征节点,其中第i组特征节点为Zi=φ(X1Wei+βei),式中Wei为随机矩阵,βei为偏置,φ(·)为非线性激活函数;
生成增强节点:输入训练集X1产生m组增强节点,其中第m组特征节点为Hm≡ξ(ZnWhm+βhm),式中Whm为与Wei不同的随机矩阵,βhm为与βei不同的偏置,ξ(·)为与φ(·)不同的非线性激活函数,Zn表示所有特征节点;
优化连接权重:将i组特征节点和m组增强节点相互连接得到合并矩阵作为宽度学习网络的实际输入,根据输出矩阵Y计算宽度学习网络的连接权重为:Wm=[Zi|Hm]+Y;通过训练集X1对宽度学习网络不断训练以优化连接权重。
6.应用权利要求1-5任一项所述的基于多尺度特征与宽度学习的SAR图像识别方法的基于多尺度特征与宽度学习的SAR图像识别装置,其特征在于,包括:
图像输入模块,用于输入原始SAR图像;
感兴趣区域提取模块,用于通过质心定位法对原始SAR图像提取感兴趣区域,得到包含感兴趣区域的SAR图像;
数据增强模块,用于对包含感兴趣区域的SAR图像旋转并添加噪声以增强数据量,得到数据增强的SAR图像;
下采样模块,用于对数据增强的SAR图像下采样处理,得到多尺度的SAR图像;
LBP特征提取模块,用于对多尺度的SAR图像提取LBP特征,并得到LBP特征向量XLBP;
LPQ特征提取模块,用于对多尺度的SAR图像提取LPQ特征,并得到LPQ特征向量XLPQ;
融合特征模块,用于将LBP特征向量XLBP和LPQ特征向量XLPQ级联后通过主成分分析方法实现降维得到融合特征数据Xm;
宽度学习网络模块,用于输入融合特征数据Xm进行图像识别并输出识别结果。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910460194.6A CN110222700A (zh) | 2019-05-30 | 2019-05-30 | 基于多尺度特征与宽度学习的sar图像识别方法及装置 |
US16/530,453 US10977526B2 (en) | 2019-05-30 | 2019-08-02 | Method and apparatus for SAR image recognition based on multi-scale features and broad learning |
PCT/CN2020/102822 WO2020239140A1 (zh) | 2019-05-30 | 2020-07-17 | 基于多尺度特征与宽度学习的sar图像识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910460194.6A CN110222700A (zh) | 2019-05-30 | 2019-05-30 | 基于多尺度特征与宽度学习的sar图像识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110222700A true CN110222700A (zh) | 2019-09-10 |
Family
ID=67818896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910460194.6A Pending CN110222700A (zh) | 2019-05-30 | 2019-05-30 | 基于多尺度特征与宽度学习的sar图像识别方法及装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10977526B2 (zh) |
CN (1) | CN110222700A (zh) |
WO (1) | WO2020239140A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046936A (zh) * | 2019-12-05 | 2020-04-21 | 湖北民族大学 | 基于级联宽度神经网络桥梁裂缝分类识别方法 |
CN111982302A (zh) * | 2020-08-24 | 2020-11-24 | 广东工业大学 | 一种带噪声滤波和环境温度补偿的测温方法 |
WO2020239140A1 (zh) * | 2019-05-30 | 2020-12-03 | 五邑大学 | 基于多尺度特征与宽度学习的sar图像识别方法及装置 |
CN112215095A (zh) * | 2020-09-24 | 2021-01-12 | 西北工业大学 | 违禁品检测方法、装置、处理器和安检系统 |
CN114926753A (zh) * | 2022-06-16 | 2022-08-19 | 无锡慧眼人工智能科技有限公司 | 一种海量图像条件下的快速目标场景信息提取方法 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929622B (zh) * | 2019-11-15 | 2024-01-05 | 腾讯科技(深圳)有限公司 | 视频分类方法、模型训练方法、装置、设备及存储介质 |
CN112819007B (zh) * | 2021-01-07 | 2023-08-01 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
CN112784856A (zh) * | 2021-01-29 | 2021-05-11 | 长沙理工大学 | 胸部x射线图像的通道注意力特征提取方法和识别方法 |
DE102021102633A1 (de) * | 2021-02-04 | 2022-08-04 | Jungheinrich Aktiengesellschaft | Verfahren zur Bestimmung einer Orientierung eines Flurförderzeugs |
CN112926662B (zh) * | 2021-02-25 | 2022-05-03 | 电子科技大学 | 一种基于多尺度语言嵌入rec的目标检测方法 |
CN113673534B (zh) * | 2021-04-22 | 2024-06-11 | 江苏大学 | 一种基于Faster RCNN的RGB-D图像果实检测方法 |
CN113378660B (zh) * | 2021-05-25 | 2023-11-07 | 广州紫为云科技有限公司 | 一种低数据成本的人脸识别的方法及装置 |
CN113390806B (zh) * | 2021-06-15 | 2023-11-10 | 崔薇 | 基于多尺度图像的生菜重金属含量检测方法 |
CN113870194B (zh) * | 2021-09-07 | 2024-04-09 | 燕山大学 | 深层特征和浅层lbp特征融合的乳腺肿瘤超声图像处理装置 |
CN114037867A (zh) * | 2021-11-04 | 2022-02-11 | 大连交通大学 | 一种基于宽度学习的风机叶片表面损伤分类识别方法 |
JP7383212B1 (ja) * | 2022-01-24 | 2023-11-17 | 三菱電機株式会社 | データ拡張方法、及びデータ拡張装置 |
CN114744946B (zh) * | 2022-05-18 | 2023-06-06 | 江南大学 | 基于宽度学习干扰观测器的永磁同步电机控制方法及系统 |
CN114821133B (zh) * | 2022-06-27 | 2022-09-09 | 江苏瑞立环保工程股份有限公司 | 一种基于人工智能的环保设备故障检测方法及系统 |
CN115393301B (zh) * | 2022-08-16 | 2024-03-12 | 中山大学附属第一医院 | 一种肝脏二维剪切波弹性图像的影像组学分析方法和装置 |
CN117036893B (zh) * | 2023-10-08 | 2023-12-15 | 南京航空航天大学 | 一种基于局部跨阶段和快速下采样的图像融合方法 |
CN118230175B (zh) * | 2024-05-23 | 2024-08-13 | 济南市勘察测绘研究院 | 基于人工智能的不动产测绘数据处理方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020654A (zh) * | 2012-12-12 | 2013-04-03 | 北京航空航天大学 | 基于样本产生与核局部特征融合的sar图像仿生识别方法 |
CN103605993A (zh) * | 2013-12-04 | 2014-02-26 | 康江科技(北京)有限责任公司 | 一种基于面向场景判别性分析的图像到视频人脸识别方法 |
CN104732601A (zh) * | 2014-11-19 | 2015-06-24 | 东北大学 | 一种基于人脸识别技术的高识别率自动考勤装置及方法 |
US20160217319A1 (en) * | 2012-10-01 | 2016-07-28 | The Regents Of The University Of California | Unified face representation for individual recognition in surveillance videos and vehicle logo super-resolution system |
CN106650568A (zh) * | 2016-08-31 | 2017-05-10 | 浙江大华技术股份有限公司 | 一种人脸识别方法及装置 |
CN108805915A (zh) * | 2018-04-19 | 2018-11-13 | 南京市测绘勘察研究院股份有限公司 | 一种抗视角变化的近景影像区域特征匹配方法 |
CN108960422A (zh) * | 2018-06-19 | 2018-12-07 | 河南工业大学 | 一种基于主成分分析的宽度学习方法 |
CN109585021A (zh) * | 2018-11-28 | 2019-04-05 | 华南理工大学 | 基于全息投影技术的精神状态评估系统及其工作方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101314293B1 (ko) * | 2012-08-27 | 2013-10-02 | 재단법인대구경북과학기술원 | 조명변화에 강인한 얼굴인식 시스템 |
SG10201405182WA (en) * | 2014-08-25 | 2016-03-30 | Univ Singapore Technology & Design | Method and system |
CN107430678A (zh) * | 2015-03-27 | 2017-12-01 | 英特尔公司 | 使用高斯接收场特征的低成本面部识别 |
CN106940782B (zh) * | 2016-01-05 | 2020-08-07 | 中国科学院空天信息创新研究院 | 基于变差函数的高分sar新增建设用地提取软件 |
CN106682621B (zh) * | 2016-12-28 | 2019-01-29 | 西安电子科技大学 | 基于贝叶斯网络的sar图像识别方法 |
US20190108447A1 (en) * | 2017-11-30 | 2019-04-11 | Intel Corporation | Multifunction perceptrons in machine learning environments |
CN108416378B (zh) * | 2018-02-28 | 2020-04-14 | 电子科技大学 | 一种基于深度神经网络的大场景sar目标识别方法 |
CN108921877B (zh) * | 2018-07-25 | 2021-07-16 | 大连海事大学 | 一种基于宽度学习的长期目标跟踪方法 |
CN110222700A (zh) * | 2019-05-30 | 2019-09-10 | 五邑大学 | 基于多尺度特征与宽度学习的sar图像识别方法及装置 |
-
2019
- 2019-05-30 CN CN201910460194.6A patent/CN110222700A/zh active Pending
- 2019-08-02 US US16/530,453 patent/US10977526B2/en active Active
-
2020
- 2020-07-17 WO PCT/CN2020/102822 patent/WO2020239140A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160217319A1 (en) * | 2012-10-01 | 2016-07-28 | The Regents Of The University Of California | Unified face representation for individual recognition in surveillance videos and vehicle logo super-resolution system |
CN103020654A (zh) * | 2012-12-12 | 2013-04-03 | 北京航空航天大学 | 基于样本产生与核局部特征融合的sar图像仿生识别方法 |
CN103605993A (zh) * | 2013-12-04 | 2014-02-26 | 康江科技(北京)有限责任公司 | 一种基于面向场景判别性分析的图像到视频人脸识别方法 |
CN104732601A (zh) * | 2014-11-19 | 2015-06-24 | 东北大学 | 一种基于人脸识别技术的高识别率自动考勤装置及方法 |
CN106650568A (zh) * | 2016-08-31 | 2017-05-10 | 浙江大华技术股份有限公司 | 一种人脸识别方法及装置 |
CN108805915A (zh) * | 2018-04-19 | 2018-11-13 | 南京市测绘勘察研究院股份有限公司 | 一种抗视角变化的近景影像区域特征匹配方法 |
CN108960422A (zh) * | 2018-06-19 | 2018-12-07 | 河南工业大学 | 一种基于主成分分析的宽度学习方法 |
CN109585021A (zh) * | 2018-11-28 | 2019-04-05 | 华南理工大学 | 基于全息投影技术的精神状态评估系统及其工作方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020239140A1 (zh) * | 2019-05-30 | 2020-12-03 | 五邑大学 | 基于多尺度特征与宽度学习的sar图像识别方法及装置 |
CN111046936A (zh) * | 2019-12-05 | 2020-04-21 | 湖北民族大学 | 基于级联宽度神经网络桥梁裂缝分类识别方法 |
CN111982302A (zh) * | 2020-08-24 | 2020-11-24 | 广东工业大学 | 一种带噪声滤波和环境温度补偿的测温方法 |
CN111982302B (zh) * | 2020-08-24 | 2023-12-29 | 广东工业大学 | 一种带噪声滤波和环境温度补偿的测温方法 |
CN112215095A (zh) * | 2020-09-24 | 2021-01-12 | 西北工业大学 | 违禁品检测方法、装置、处理器和安检系统 |
CN114926753A (zh) * | 2022-06-16 | 2022-08-19 | 无锡慧眼人工智能科技有限公司 | 一种海量图像条件下的快速目标场景信息提取方法 |
CN114926753B (zh) * | 2022-06-16 | 2023-10-13 | 无锡慧眼人工智能科技有限公司 | 一种海量图像条件下的快速目标场景信息提取方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200380294A1 (en) | 2020-12-03 |
US10977526B2 (en) | 2021-04-13 |
WO2020239140A1 (zh) | 2020-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110222700A (zh) | 基于多尺度特征与宽度学习的sar图像识别方法及装置 | |
Lei et al. | Coupled adversarial training for remote sensing image super-resolution | |
CN111178260B (zh) | 一种基于生成对抗网络的调制信号时频图分类系统及其运行方法 | |
CN111062885B (zh) | 基于多阶段迁移学习的标志检测模型训练及标志检测方法 | |
CN108345827B (zh) | 识别文档方向的方法、系统和神经网络 | |
Kongskov et al. | Directional total generalized variation regularization | |
CN110765882B (zh) | 一种视频标签确定方法、装置、服务器及存储介质 | |
CN109815919A (zh) | 一种人群计数方法、网络、系统和电子设备 | |
Xiao et al. | Combined blur, translation, scale and rotation invariant image recognition by Radon and pseudo-Fourier–Mellin transforms | |
CN112598643A (zh) | 深度伪造图像检测及模型训练方法、装置、设备、介质 | |
CN111144566B (zh) | 神经网络权重参数的训练方法、特征分类方法及对应装置 | |
CN107862680B (zh) | 一种基于相关滤波器的目标跟踪优化方法 | |
Kim et al. | Label-preserving data augmentation for mobile sensor data | |
Shu et al. | LVC-Net: Medical image segmentation with noisy label based on local visual cues | |
CN114155397B (zh) | 一种小样本图像分类方法及系统 | |
CN115861462B (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
TWI803243B (zh) | 圖像擴增方法、電腦設備及儲存介質 | |
CN110135435B (zh) | 一种基于广度学习系统的显著性检测方法及装置 | |
CN117197462A (zh) | 基于多尺度特征融合和对齐的轻量地基云分割方法及系统 | |
CN117576497A (zh) | 记忆狄利克雷过程高斯混合模型的训练方法及装置 | |
Dong et al. | Scene-oriented hierarchical classification of blurry and noisy images | |
CN115035463B (zh) | 行为识别方法、装置、设备和存储介质 | |
CN114863164B (zh) | 一种面向小目标超分辨重建图像的目标识别模型构建方法 | |
CN113688655B (zh) | 干扰信号的识别方法、装置、计算机设备和存储介质 | |
CN114708307A (zh) | 基于相关滤波器的目标跟踪方法、系统、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190910 |