CN107977683B - 基于卷积特征提取和机器学习的联合sar目标识别方法 - Google Patents

基于卷积特征提取和机器学习的联合sar目标识别方法 Download PDF

Info

Publication number
CN107977683B
CN107977683B CN201711382006.XA CN201711382006A CN107977683B CN 107977683 B CN107977683 B CN 107977683B CN 201711382006 A CN201711382006 A CN 201711382006A CN 107977683 B CN107977683 B CN 107977683B
Authority
CN
China
Prior art keywords
convolution
image
feature
pixels
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711382006.XA
Other languages
English (en)
Other versions
CN107977683A (zh
Inventor
张兴敢
乔卫磊
柏业超
高健
王琼
唐岚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201711382006.XA priority Critical patent/CN107977683B/zh
Publication of CN107977683A publication Critical patent/CN107977683A/zh
Application granted granted Critical
Publication of CN107977683B publication Critical patent/CN107977683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于卷积特征提取和机器学习的联合SAR目标识别方法,读取SAR原始图像数据集,并做预处理;使用卷积变换提取SAR图像特征,卷积层使用卷积核在输入层上通过滑动窗口计算卷积再通过激活函数作为输出,得到多个特征图,每个特征图也是由多个图卷积组合而成,亚采样层对上层的得到的特征图亚采样,减小特征图的大小,最后生成1行128列的特征值;将特征值分别使用softmax回归、支持向量机、K邻近训练分类模型;预测的未知类别图像所属类别,最终的预测结果是依靠三种分类器预测结果综合处理得到。本发明联合三种机器学习方法,识别准确率高,方法鲁棒性强。

Description

基于卷积特征提取和机器学习的联合SAR目标识别方法
技术领域
本发明属于雷达技术领域,涉及基于卷积特征提取和机器学习的联合SAR目标识别方法。
背景技术
合成孔径雷达可以全天候在各种天气环境下工作,因而在军事防御、资源探测、灾难预警和救援等方面得到广泛的应用。随着越来多高精度SAR投入使用,并且原始SAR信号具有大量噪声,这使得使用人工识别目标变得越来越困难。已有的利用主成成分分析(PCA)结合支持向量机(SVM)对目标分类识别、基于主成成分分析、独立分量分析和小波决策融合的识别方法虽然已经达到一定的正确率,但是依然需要人工经验对原始信号进行复杂的变换和多维度的特征提取,从而给不同情况下的识别结果带来不确定性。
自从2006年Hinton等人提出深度学习这一概念后,深度学习领域得到飞速发展,其广泛应用于目标识别领域。卷积神经网络是深度学习的一种,其特点是使用类似于生物神经网络的局部感受野、权值共享策略与时间或空间的亚采样,降低模型的复杂度与计算量,避免传统算法的特征提取与数据重建过程。
发明内容
本发明的目的在于提供基于卷积特征提取和机器学习的联合SAR目标识别方法,解决了传统算法的特征提取与数据重建过程复杂,识别结果不准确的问题。
本发明所采用的技术方案是按照以下步骤进行:
步骤1.读取SAR原始图像数据集,并做预处理;
步骤2.使用卷积变换提取SAR图像特征,卷积层使用卷积核在输入层上通过滑动窗口计算卷积再通过激活函数作为输出,得到多个特征图,每个特征图也是由多个图卷积组合而成,亚采样层对上层的得到的特征图亚采样,减小特征图的大小,最后生成1行128列的特征值;
步骤3将步骤2中得到的特征值分别使用softmax回归、支持向量机、K邻近训练分类模型;
步骤4预测的未知类别图像所属类别;
进一步,步骤1的实现过程如下,
步骤1.1将每幅图像尺寸变换为48*48像素大小;
步骤1.2对剪裁后的图像通过镜像变化,随机剪裁对数据集扩充;
步骤1.3将数据集归一化,设有m幅原始图片,经过尺寸变换后,每幅图像有2304个像素点,设Vk,i,j为第k幅图的第i行第j列的元素值,V* k,i,j为第k幅图的第i行第j列归一化之后的元素值,Vk,min第k幅图最小的像素值,Vk,max第k幅图最大的像素值,则归一化的计算公式为:
Figure GDA0002991217110000021
进一步,步骤2的实现过程如下,
步骤2.1卷积层1,使用32种不同的卷积核对每幅图像做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成32个48*48的特征图;对于一个有C个类别和N个训练样本的多分类问题,第l层第j个神经元的输出为:
Figure GDA0002991217110000022
其中Mj表示第j个输入特征图,
Figure GDA0002991217110000025
为额外的偏置,
Figure GDA0002991217110000026
为卷积核;
步骤2.2亚采样层1,使用3*3像素大小的卷积核对步骤2.1生成的每幅特征图做卷积运算,每次移动2个像素点,卷积后生成32个24*24的特征图;卷积核k为:
Figure GDA0002991217110000023
定义
Figure GDA0002991217110000024
即g(i,j)=∑h,df(i+h,j+d)k(h,d),并按以下步骤计算:
步骤2.2.1滑动卷积核,使其中心位于输入图像g的第i行第j列像素上;
步骤2.2.2利用上式求和,得到g(i,j)的像素值;
步骤2.2.3每次滑动2个像素点,直至求出所有像素值;
步骤2.3卷积层2,使用2种不同的卷积核对步骤2.2生成的每幅特征图做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成64个24*24的特征图,具体步骤如步骤2.1;
步骤2.4亚采样层2,使用4*4像素大小的卷积核对步骤2.3生成的每幅特征图做卷积运算,每次移动4个像素点,卷积后生成64个6*6的特征图,具体步骤如步骤2.2;
步骤2.5数据降维,将步骤2.4生成的每幅特征图中的像素转换为1行128列的特征值,减小数据维度,去除冗余信息;
进一步,步骤3的实现过程如下,
步骤3.1使用误差逆传播算法训练softmax分类模型;
步骤3.1.1前向传播阶段,假设网络的输出为
Figure GDA0002991217110000031
则误差函数如下:
Figure GDA0002991217110000032
其中
Figure GDA0002991217110000033
是第n个样本对应的实际标签的第k维,
Figure GDA0002991217110000034
是由模型的第n个样本预测得到的标签第k维,由于在整个训练集上的误差是将每个样本误差简单累加,所以以单个样本为例进行推导,在单个样本上,误差函数转换为:
Figure GDA0002991217110000035
对于普通的全连接层,用如下的BP规则来求解E关于权重的偏导:
xl=f(ul),ul=Wlxl-1+bl
其中1为当前的层数,f(·)为f(t)=(1+e∧(-βt))∧(-1);
步骤3.1.2向后传播阶段,在向后传播过程中,误差被认为是关于有偏置项扰动的灵敏度:
Figure GDA0002991217110000036
又因为
Figure GDA0002991217110000037
所以灵敏度是某一个单元所有输入产生的误差的偏导,那么第l层的灵敏度与第l+1层的灵敏度的关系表示为:
Figure GDA00029912171100000312
其中
Figure GDA00029912171100000313
表示点乘,对于上式中的误差函数,输出神经元的灵敏性如下:
Figure GDA0002991217110000038
在完成误差函数的反向传播后,利用梯度下降策略以误差函数的负梯度方向对网络中的参数进行更新,以达到损失函数最小化的目的,E对第l层的求Wl和bl的偏导为:
Figure GDA0002991217110000039
Figure GDA00029912171100000310
根据梯度下降策略可得第l层神经元的权值更新变化量为:
Figure GDA00029912171100000311
其中η为学习率,控制着算法每一轮迭代中的更新步长;
步骤3.1.3重复步骤3.1.1和步骤3.1.2,直到误差小于要求的阈值;
步骤3.2训练基于RBF核函数的支持向量机分类模型;
构建规划方程组,设x为步骤2得到的特征值向量,f(x)为预测的类别:
Figure GDA0002991217110000041
其中w和b是模型参数;求解目标是:
Figure GDA0002991217110000042
Figure GDA0002991217110000043
根据对偶性质,上式转换为:
Figure GDA0002991217110000044
Figure GDA0002991217110000045
其中k(xi,xj)为核函数,
Figure GDA0002991217110000046
σ为高斯函数的带宽;
步骤3.3K邻近分类,具体步骤如下:
步骤3.3.1计算待识别图像的特征值与训练样本图像的特征值的距离:
Figure GDA0002991217110000047
其中fi表示待识别图像的第i个特征,
Figure GDA0002991217110000048
表示第k类图像的第i个特征的均值,
Figure GDA0002991217110000049
表示第k类图像的第i个特征的方差,n为128;
步骤3.3.2得到目前k个最邻近样本,并统计k个类别中出现次数最多的类别就是预测的结果。
进一步,步骤4的实现过程如下,
步骤4.1将图像尺寸变换为48*48像素大小;
步骤4.2对图像归一化;
步骤4.3根据步骤2,使用32种不同的卷积核对每幅图像做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成32个48*48的特征图;
步骤4.4根据步骤2.2,使用3*3像素大小的卷积核对步骤4.3生成的每幅特征图做卷积运算,每次移动2个像素点,卷积后生成32个24*24的特征图;
步骤4.5根据步骤2.3,使用2种不同的卷积核对步骤4.4生成的每幅特征图做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成64个24*24的特征图;
步骤4.6根据步骤2.4,使用4*4像素大小的卷积核对步骤4.5生成的每幅特征图做卷积运算,每次移动4个像素点,卷积后生成64个6*6的特征图;
步骤4.7根据步骤2.5,将步骤4.6生成的每幅特征图中的像素转换为1行128列的特征值,减小数据维度,去除冗余信息;
步骤4.8根据步骤3中训练得到的模型,分别用softmax分类器、支持向量机、K邻近分类得到的结果综合判断得到最终结果。
本发明的有益效果是有效地减少特征值的维度,减小了训练与预测过程的运算量,加快了预测速度,提高了预测的准确率。
具体实施方式
下面结合具体实施方式对本发明进行详细说明。
本发明方法按照以下步骤进行:
步骤1.读取SAR原始图像数据集,并做预处理。
步骤1.1将每幅图像尺寸变换为48*48像素大小;
步骤1.2对剪裁后的图像通过镜像变化,随机剪裁对数据集扩充;
步骤1.3将数据集归一化,设有m幅原始图片,经过尺寸变换后,每幅图像有2304个像素点,设Vk,i,j为第k幅图的第i行第j列的元素值,V* k,i,j为第k幅图的第i行第j列归一化之后的元素值,Vk,min第k幅图最小的像素值,Vk,max第k幅图最大的像素值,则归一化的计算公式为:
Figure GDA0002991217110000051
步骤2.使用卷积变换提取SAR图像特征,卷积层使用卷积核在输入层上通过滑动窗口计算卷积再通过激活函数作为输出,得到多个特征图,每个特征图也是由多个图卷积组合而成。亚采样层对上层的得到的特征图亚采样,减小特征图的大小。最后生成1行128列的特征值;
步骤2.1卷积层1,使用32种不同的卷积核对每幅图像做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成32个48*48的特征图;对于一个有C个类别和N个训练样本的多分类问题,第l层第j个神经元的输出为:
Figure GDA0002991217110000061
其中Mj表示第j个输入特征图。
Figure GDA0002991217110000066
为额外的偏置,
Figure GDA0002991217110000067
为卷积核。
步骤2.2亚采样层1,使用3*3像素大小的卷积核对步骤2.1生成的每幅特征图做卷积运算,每次移动2个像素点,卷积后生成32个24*24的特征图;卷积核k为:
Figure GDA0002991217110000062
定义
Figure GDA0002991217110000063
即g(i,j)=∑h,df(i+h,j+d)k(h,d),并按以下步骤计算:
步骤2.2.1滑动卷积核,使其中心位于输入图像g的第i行第j列像素上;
步骤2.2.2利用上式求和,得到g(i,j)的像素值;
步骤2.2.3每次滑动2个像素点,直至求出所有像素值;
步骤2.3卷积层2,使用2种不同的卷积核对步骤2.2生成的每幅特征图做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成64个24*24的特征图,具体步骤如步骤2.1;
步骤2.4亚采样层2,使用4*4像素大小的卷积核对步骤2.3生成的每幅特征图做卷积运算,每次移动4个像素点,卷积后生成64个6*6的特征图,具体步骤如步骤2.2;
步骤2.5数据降维,将步骤2.4生成的每幅特征图中的像素转换为1行128列的特征值,减小数据维度,去除冗余信息;
步骤3将步骤2中得到的特征值分别使用softmax回归、支持向量机(SVM)、K邻近(KNN)训练分类模型:
步骤3.1使用误差逆传播算法训练softmax分类模型;
步骤3.1.1前向传播阶段,假设网络的输出为
Figure GDA0002991217110000064
则误差函数如下:
Figure GDA0002991217110000065
其中
Figure GDA0002991217110000071
是第n个样本对应的实际标签的第k维,
Figure GDA0002991217110000079
是由模型的第n个样本预测得到的标签第k维。由于在整个训练集上的误差是将每个样本误差简单累加,所以我们以单个样本为例进行推导。在单个样本上,误差函数可转换为:
Figure GDA0002991217110000072
对于普通的全连接层,我们用如下的BP规则来求解E关于权重的偏导:
xl=f(ul),ul=Wlxl-1+bl
其中1为当前的层数,f(·)为f(t)=(1+e∧(-βt))∧(-1);
步骤3.1.2向后传播阶段,在向后传播过程中,误差可以被认为是关于有偏置项扰动的灵敏度:
Figure GDA0002991217110000073
又因为
Figure GDA0002991217110000074
所以灵敏度是某一个单元所有输入产生的误差的偏导。那么第l层的灵敏度与第l+1层的灵敏度的关系可以表示为:
Figure GDA00029912171100000710
其中
Figure GDA00029912171100000711
表示点乘。对于上式中的误差函数,输出神经元的灵敏性如下:
Figure GDA0002991217110000075
在完成误差函数的反向传播后,利用梯度下降策略以误差函数的负梯度方向对网络中的参数进行更新,以达到损失函数最小化的目的。E对第l层的求Wl和bl的偏导为:
Figure GDA0002991217110000076
Figure GDA0002991217110000077
根据梯度下降策略可得第l层神经元的权值更新变化量为:
Figure GDA0002991217110000078
其中η为学习率,控制着算法每一轮迭代中的更新步长。
步骤3.1.3重复步骤3.1.1和步骤3.1.2,直到误差小于要求的阈值。
步骤3.2训练基于RBF核函数的支持向量机分类模型;
构建规划方程组,设x为步骤2得到的特征值向量,f(x)为预测的类别:
Figure GDA0002991217110000081
其中w和b是模型参数;所以求解目标是:
Figure GDA0002991217110000082
Figure GDA0002991217110000083
根据对偶性质,上式可以转换为:
Figure GDA0002991217110000084
Figure GDA0002991217110000085
其中k(xi,xj)为核函数,
Figure GDA0002991217110000086
σ为高斯函数的带宽;
步骤3.3K邻近分类,具体步骤如下:
步骤3.3.1计算待识别图像的特征值与训练样本图像的特征值的距离:
Figure GDA0002991217110000087
其中fi表示待识别图像的第i个特征,
Figure GDA0002991217110000088
表示第k类图像的第i个特征的均值,
Figure GDA0002991217110000089
表示第k类图像的第i个特征的方差,n为128;
步骤3.3.2得到目前k个最邻近样本,并统计k个类别中出现次数最多的类别就是预测的结果;
步骤4预测的未知类别图像所属类别,具体过程如下:
步骤4.1将图像尺寸变换为48*48像素大小;
步骤4.2对图像归一化具体步骤如步骤1.3;
步骤4.3根据步骤2.1,使用32种不同的卷积核对每幅图像做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成32个48*48的特征图;
步骤4.4根据步骤2.2,使用3*3像素大小的卷积核对步骤4.3生成的每幅特征图做卷积运算,每次移动2个像素点,卷积后生成32个24*24的特征图;
步骤4.5根据步骤2.3,使用2种不同的卷积核对步骤4.4生成的每幅特征图做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成64个24*24的特征图;
步骤4.6根据步骤2.4,使用4*4像素大小的卷积核对步骤4.5生成的每幅特征图做卷积运算,每次移动4个像素点,卷积后生成64个6*6的特征图;
步骤4.7根据步骤2.5,将步骤4.6生成的每幅特征图中的像素转换为1行128列的特征值,减小数据维度,去除冗余信息;
步骤4.8根据步骤3中训练得到的模型,分别用softmax分类器、支持向量机、K邻近分类得到的结果综合判断得到最终结果。
步骤4.8.1如果Lable2,Lable3相同,则最终结果为Lable2;
步骤4.8.2如果Lable2,Lable3不相同,则最终结果为Lable1。
本发明的核心内容就是设计了用卷积提取SAR图像特征值,并用softmax分类器、支持向量机、K邻近算法分别训练模型和预测,最后将三个分类器的预测结果综合判断输出,有效地减少特征值的维度,减小了训练与预测过程的运算量,加快了预测速度,提高了预测的准确率和方法的鲁棒性,这在要求精确性、实时性和稳定性的SAR目标识别领域无疑有着极大地应用价值。
以上所述仅是对本发明的较佳实施方式而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施方式所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。

Claims (1)

1.基于卷积特征提取和机器学习的联合SAR目标识别方法,其特征在于,按照以下步骤进行:
步骤1.读取SAR原始图像数据集,并做预处理;
步骤2.使用卷积变换提取SAR图像特征,卷积层使用卷积核在输入层上通过滑动窗口计算卷积再通过激活函数作为输出,得到多个特征图,每个特征图也是由多个图卷积组合而成,亚采样层对上层的得到的特征图亚采样,减小特征图的大小,最后生成1行128列的特征值;
步骤3将步骤2中得到的特征值分别使用softmax回归、支持向量机、K邻近训练分类模型;
步骤4预测未知类别图像所属的类别;
所述步骤3的实现过程如下,
步骤3.1使用误差逆传播算法训练softmax分类模型:
步骤3.1.1前向传播阶段,假设网络的输出为
Figure FDA0002991217100000011
则误差函数如下:
Figure FDA0002991217100000012
其中
Figure FDA0002991217100000013
是第n个样本对应的实际标签的第k维,
Figure FDA0002991217100000014
是由模型的第n个样本预测得到的标签第k维,由于在整个训练集上的误差是将每个样本误差简单累加,所以以单个样本为例进行推导,在单个样本上,误差函数转换为:
Figure FDA0002991217100000015
对于普通的全连接层,用如下的BP规则来求解E关于权重的偏导:
xl=f(ul),ul=Wlxl-1+bl
其中1为当前的层数,f(·)为f(t)=(1+e^(-βt))^(-1);
步骤3.1.2向后传播阶段,在向后传播过程中,误差被认为是关于有偏置项扰动的灵敏度:
Figure FDA0002991217100000016
又因为
Figure FDA0002991217100000017
所以灵敏度是某一个单元所有输入产生的误差的偏导,那么第l层的灵敏度与第l+1层的灵敏度的关系表示为:
Figure FDA0002991217100000018
其中
Figure FDA0002991217100000019
表示点乘,对于上式中的误差函数,输出神经元的灵敏性如下:
Figure FDA0002991217100000021
在完成误差函数的反向传播后,利用梯度下降策略以误差函数的负梯度方向对网络中的参数进行更新,以达到损失函数最小化的目的,E对第l层的求Wl和bl的偏导为:
Figure FDA0002991217100000022
Figure FDA0002991217100000023
根据梯度下降策略可得第l层神经元的权值更新变化量为:
Figure FDA0002991217100000024
其中η为学习率,控制着算法每一轮迭代中的更新步长;
步骤3.1.3重复步骤3.1.1和步骤3.1.2,直到误差小于要求的阈值;
步骤3.2训练基于RBF核函数的支持向量机分类模型:
构建规划方程组,设x为步骤2得到的特征值向量,f(x)为预测的类别;
Figure FDA0002991217100000025
其中w和b是模型参数;求解目标是:
Figure FDA0002991217100000026
Figure FDA0002991217100000027
根据对偶性质,上式转换为:
Figure FDA0002991217100000028
Figure FDA0002991217100000029
其中k(xi,xj)为核函数,
Figure FDA00029912171000000210
σ为高斯函数的带宽;
步骤3.3K邻近分类,具体步骤如下:
步骤3.3.1计算待识别图像的特征值与训练样本图像的特征值的距离:
Figure FDA0002991217100000031
其中fi表示待识别图像的第i个特征,
Figure FDA0002991217100000032
表示第k类图像的第i个特征的均值,
Figure FDA0002991217100000033
表示第k类图像的第i个特征的方差,n为128;
步骤3.3.2得到目前k个最邻近样本,并统计k个类别中出现次数最多的类别就是预测的结果;
所述步骤1的实现过程如下,
步骤1.1将每幅图像尺寸变换为48*48像素大小;
步骤1.2对剪裁后的图像通过镜像变化,随机剪裁对数据集扩充;
步骤1.3将数据集归一化,设有m幅原始图片,经过尺寸变换后,每幅图像有2304个像素点,设Vk,i,j为第k幅图的第i行第j列的元素值,V* k,i,j为第k幅图的第i行第j列归一化之后的元素值,Vk,min第k幅图最小的像素值,Vk,max第k幅图最大的像素值,则归一化的计算公式为:
Figure FDA0002991217100000034
所述步骤2的实现过程如下:
步骤2.1卷积层1,使用32种不同的卷积核对每幅图像做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成32个48*48的特征图;对于一个有C个类别和N个训练样本的多分类问题,第l层第j个神经元的输出为:
Figure FDA0002991217100000035
其中Mj表示第j个输入特征图,
Figure FDA0002991217100000036
为额外的偏置,
Figure FDA0002991217100000037
为卷积核;
步骤2.2亚采样层1,使用3*3像素大小的卷积核对步骤2.1生成的每幅特征图做卷积运算,每次移动2个像素点,卷积后生成32个24*24的特征图;卷积核k为:
Figure FDA0002991217100000041
定义
Figure FDA0002991217100000042
即g(i,j)=∑h,df(i+h,j+d)k(h,d),并按以下步骤计算:
步骤2.2.1滑动卷积核,使其中心位于输入图像g的第i行第j列像素上;
步骤2.2.2利用上式求和,得到g(i,j)的像素值;
步骤2.2.3每次滑动2个像素点,直至求出所有像素值;
步骤2.3卷积层2,使用2种不同的卷积核对步骤2.2生成的每幅特征图做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成64个24*24的特征图,具体步骤如步骤2.1;
步骤2.4亚采样层2,使用4*4像素大小的卷积核对步骤2.3生成的每幅特征图做卷积运算,每次移动4个像素点,卷积后生成64个6*6的特征图,具体步骤如步骤2.2;
步骤2.5数据降维,将步骤2.4生成的每幅特征图中的像素转换为1行128列的特征值,减小数据维度,去除冗余信息;
所述步骤4的实现过程如下:
步骤4.1将图像尺寸变换为48*48像素大小;
步骤4.2对图像归一化;
步骤4.3根据步骤2,使用32种不同的卷积核对每幅图像做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成32个48*48的特征图;
步骤4.4根据步骤2.2,使用3*3像素大小的卷积核对步骤4.3生成的每幅特征图做卷积运算,每次移动2个像素点,卷积后生成32个24*24的特征图;
步骤4.5根据步骤2.3,使用2种不同的卷积核对步骤4.4生成的每幅特征图做卷积运算,卷积核的大小均为5*5像素,每次移动步长为1个像素点,在图像每个边缘补充2个像素,卷积后生成64个24*24的特征图;
步骤4.6根据步骤2.4,使用4*4像素大小的卷积核对步骤4.5生成的每幅特征图做卷积运算,每次移动4个像素点,卷积后生成64个6*6的特征图;
步骤4.7根据步骤2.5,将步骤4.6生成的每幅特征图中的像素转换为1行128列的特征值,减小数据维度,去除冗余信息;
步骤4.8根据步骤3中训练得到的模型,分别用softmax分类器、支持向量机、K邻近分类得到的结果综合判断得到最终结果。
CN201711382006.XA 2017-12-20 2017-12-20 基于卷积特征提取和机器学习的联合sar目标识别方法 Active CN107977683B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711382006.XA CN107977683B (zh) 2017-12-20 2017-12-20 基于卷积特征提取和机器学习的联合sar目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711382006.XA CN107977683B (zh) 2017-12-20 2017-12-20 基于卷积特征提取和机器学习的联合sar目标识别方法

Publications (2)

Publication Number Publication Date
CN107977683A CN107977683A (zh) 2018-05-01
CN107977683B true CN107977683B (zh) 2021-05-18

Family

ID=62006891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711382006.XA Active CN107977683B (zh) 2017-12-20 2017-12-20 基于卷积特征提取和机器学习的联合sar目标识别方法

Country Status (1)

Country Link
CN (1) CN107977683B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985231B (zh) * 2018-07-12 2021-08-13 广州麦仑信息科技有限公司 一种基于多尺度卷积核的掌静脉特征提取方法
CN109272031B (zh) * 2018-09-05 2021-03-30 宽凳(北京)科技有限公司 一种训练样本生成方法及装置、设备、介质
WO2020050687A1 (ko) * 2018-09-07 2020-03-12 주식회사 더웨이브톡 미생물 정보 제공 장치 및 방법
CN109460735B (zh) * 2018-11-09 2021-02-02 中国科学院自动化研究所 基于图半监督学习的文档二值化处理方法、系统、装置
CN110287759B (zh) * 2019-03-25 2022-08-02 广东工业大学 一种基于简化输入卷积神经网络o-cnn的眼部疲劳检测方法
CN111340089A (zh) * 2020-02-21 2020-06-26 苏州工业园区服务外包职业学院 图像特征学习方法、模型、装置和计算机存储介质
CN111368826B (zh) * 2020-02-25 2023-05-05 安徽炬视科技有限公司 一种基于可变卷积核的明火检测算法
CN112506687B (zh) * 2020-11-24 2022-03-01 四川长虹电器股份有限公司 基于多周期分段滑动窗口标准差的故障诊断方法
CN115331077B (zh) * 2022-08-22 2024-04-26 北京百度网讯科技有限公司 特征提取模型的训练方法、目标分类方法、装置、设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139028A (zh) * 2015-08-13 2015-12-09 西安电子科技大学 基于分层稀疏滤波卷积神经网络的sar图像分类方法
CN106407986A (zh) * 2016-08-29 2017-02-15 电子科技大学 一种基于深度模型的合成孔径雷达图像目标识别方法
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139028A (zh) * 2015-08-13 2015-12-09 西安电子科技大学 基于分层稀疏滤波卷积神经网络的sar图像分类方法
CN106407986A (zh) * 2016-08-29 2017-02-15 电子科技大学 一种基于深度模型的合成孔径雷达图像目标识别方法
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于分层卷积深度学习系统的植物叶片识别研究;张帅 等;《北京林业大学学报》;20160930;第38卷(第09期);第108-114页 *
基于卷积神经网络的人脸识别;王嘉鑫 等;《电脑知识与技术》;20161031;第12卷(第29期);第187-189页 *

Also Published As

Publication number Publication date
CN107977683A (zh) 2018-05-01

Similar Documents

Publication Publication Date Title
CN107977683B (zh) 基于卷积特征提取和机器学习的联合sar目标识别方法
CN107229904B (zh) 一种基于深度学习的目标检测与识别方法
CN110033473B (zh) 基于模板匹配和深度分类网络的运动目标跟踪方法
CN107563433B (zh) 一种基于卷积神经网络的红外小目标检测方法
US10699192B1 (en) Method for optimizing hyperparameters of auto-labeling device which auto-labels training images for use in deep learning network to analyze images with high precision, and optimizing device using the same
CN111160176B (zh) 基于融合特征的一维卷积神经网络地面雷达目标分类方法
CN108921877B (zh) 一种基于宽度学习的长期目标跟踪方法
EP3690741A2 (en) Method for automatically evaluating labeling reliability of training images for use in deep learning network to analyze images, and reliability-evaluating device using the same
CN111126332B (zh) 基于轮廓特征的跳频信号分类方法
CN110569971B (zh) 一种基于LeakyRelu激活函数的卷积神经网络单目标识别方法
CN110276784B (zh) 基于记忆机制与卷积特征的相关滤波运动目标跟踪方法
CN110705600A (zh) 一种基于互相关熵的多深度学习模型融合方法、终端设备及可读存储介质
CN112733942A (zh) 一种基于多级特征自适应融合的变尺度目标检测方法
Dorbe et al. FCN and LSTM based computer vision system for recognition of vehicle type, license plate number, and registration country
CN113408398A (zh) 基于通道注意力及概率上采样的遥感图像云检测方法
CN114492634B (zh) 一种细粒度装备图片分类识别方法及系统
CN110827327B (zh) 一种基于融合的长期目标跟踪方法
Bandi et al. Assessing car damage with convolutional neural networks
Pillai et al. Fine-Tuned EfficientNetB4 Transfer Learning Model for Weather Classification
CN115984223A (zh) 基于PCANet及多分类器融合的图像溢油检测方法
CN116030300A (zh) 一种用于零样本sar目标识别的渐进式域自适应识别方法
CN115909086A (zh) 基于多级增强网络的sar目标检测识别方法
Jumanov et al. Mechanisms for using image properties and neural networks in identification of micro-objects
CN109946667B (zh) 基于卷积神经网络的识别变体飞机高分辨距离像方法
Dos Santos et al. Performance comparison of convolutional neural network models for object detection in tethered balloon imagery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant