CN113569632A - 一种基于wgan的小样本地面慢速运动目标分类方法 - Google Patents
一种基于wgan的小样本地面慢速运动目标分类方法 Download PDFInfo
- Publication number
- CN113569632A CN113569632A CN202110668793.4A CN202110668793A CN113569632A CN 113569632 A CN113569632 A CN 113569632A CN 202110668793 A CN202110668793 A CN 202110668793A CN 113569632 A CN113569632 A CN 113569632A
- Authority
- CN
- China
- Prior art keywords
- sample
- time
- wgan
- moving target
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 39
- 238000012360 testing method Methods 0.000 claims abstract description 19
- 238000013145 classification model Methods 0.000 claims abstract description 10
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 238000009826 distribution Methods 0.000 claims description 49
- 230000006870 function Effects 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 18
- 238000001228 spectrum Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 abstract description 6
- 230000009466 transformation Effects 0.000 abstract description 4
- 238000005259 measurement Methods 0.000 abstract description 3
- 238000007635 classification algorithm Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 238000000354 decomposition reaction Methods 0.000 abstract 1
- 238000002474 experimental method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 230000004913 activation Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 description 1
- 101150064138 MAP1 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011550 data transformation method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明属于雷达信号处理技术领域,公开了一种基于WGAN的小样本地面慢速运动目标分类方法,首先,基于实测数据利用短时傅里叶变换方法,构建了地面慢速运动目标时频谱图样本库;其次,引入WGAN技术对地面慢速目标的时频谱图样本库进行扩充;最后,将原始样本库分成训练集和测试集,新生成的样本均放入训练集,引用VGGNet进行网络训练至网络收敛,得到分类模型,在测试集中利用分类模型进行地面慢速运动目标的分类;该方法引入WGAN技术对地面慢速目标的时频谱图样本进行扩充,提高了地面慢速运动目标数据的数量和多样性,从而显著提高基于神经网络的小样本地面慢速运动目标分类算法性能。
Description
技术领域
本发明属于雷达信号处理技术领域,尤其涉及基于韦氏距离生成式对抗网络(Wasserstein Generative Adversarial Network,WGAN)的小样本地面慢速运动目标分类方法,用于提升地面慢速运动目标数据的数量和多样性,从而显著提高基于神经网络的小样本地面慢速运动目标分类算法性能。
背景技术
地面慢速目标的检测和分类可应用在广场监视、机场场面监视、灾后救援、防恐处突、辅助医疗等军用和民用领域,具有重要的研究意义。行人与车辆目标是地面监视雷达的主要监视对象。
传统的基于手动提取特征的分类方法依赖于先验知识,只能针对特定的应用场景,普适性低。深度学习算法通常需要丰富的数据进行支撑,而数据的丰富性不仅体现在数量,同时体现在多样性,二者缺一不可。在现实应用场景中,标记训练数据总是稀少的,因此深度学习算法很容易发生过拟合问题。因此,需要对样本进行增强和扩充。传统的数据增强方法包括仿射变换、滑窗和加噪等。Bjerrum等人提出了基于仿射变换的数据增强方法,通过对样本图像进行放大、缩小、平移、旋转以实现生成类似样本,将原始样本和新样本混合作为训练集输入到神经网络中,训练完成后模型的分类误差控制在0.35%以下。它们对原有数据进行某种变换,并没有研究数据的内在分布,因此,所生成的数据与原有数据相比相差不大,没有显著提升数据的多样性。另一种数据增强思路是采用生成模型对其内在分布进行学习,能够同时提升数据的数量和多样性。等人在小样本情况下利用自编码器进行网络参数的初始化,再利用卷积网络对辅助和非辅助的行人室内运动进行分类,获得了较好的结果。但该方法具有不稳定性,也会出现难以收敛的情况。Goodfellow等人在2014年提出了生成式对抗网络(Generative Adversarial Network,GAN)。它是一种生成式模型,通过生成器和判别器的博弈过程,最终达到纳什均衡,生成与原图像特征相似但不相同的新的图像。但GAN存在收敛不稳定,容易出现样本相似性大的问题。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种基于WGAN的小样本地面慢速运动目标分类方法,本发明构建了基于实测数据的地面慢速运动目标时频谱图数据库,引入WGAN技术,对地面慢速目标的时频谱图样本进行扩充,提高数据库的丰富性,可弥补神经网络用于目标分类时由于样本数量稀少、特征单一而可能发生的过拟合或算法效果不佳的问题,为基于神经网络的小样本地面慢速目标分类奠定了一定的基础。
本发明的技术原理是:首先,基于实测数据利用短时傅里叶变换方法,构建了地面慢速运动目标时频谱图样本库;其次,引入WGAN技术对地面慢速目标的时频谱图样本库进行扩充;最后,将原始样本库分成训练集和测试集,新生成的样本均放入训练集,引用VGGNet进行网络训练至网络收敛,得到分类模型,在测试集中利用分类模型进行地面慢速运动目标的分类。
为了达到上述目的,本发明采用以下技术方案予以实现。
一种基于WGAN的小样本地面慢速运动目标分类方法,包括以下步骤:
步骤1,基于地面慢速运动目标回波数据,利用短时傅里叶变换方法,构建地面慢速运动目标时频谱图样本库;
步骤2,引入WGAN技术对地面慢速目标的时频谱图样本库进行扩充,得到扩充后的样本;
步骤3,将原始样本库分成训练集和测试集,将所述扩充后的样本放入所述训练集中,采用VGGNet进行网络训练至模型收敛,得到分类模型;在所述测试集中利用所述分类模型进行地面慢速运动目标的分类。
本发明技术方案的特点和进一步的改进为:
(1)步骤1具体为:
短时傅里叶变换通过时间滑窗,计算每个时间窗内信号的傅里叶变换,得到变换后的时频谱信号S(t,f):
S(t,f)=∫z(t)ω(t-τ)exp(-j2πfτ)dτ
其中,t为时间,f为频率,ω(t)为窗函数,τ为窗函数的长度,z(t)为所要分析的连续信号,j表示复数的虚部;
在工程应用中,采用变换后的时频谱信号S(t,f)的离散形式S(a,b)为:
其中,k为离散采样点,z(k)为待分析信号的离散形式,T为时间采样间隔,F为频率采样间隔,a为时间采样,b为频率采样,ω(k)为窗函数的离散形式;
信号的时频谱图为S(a,b)模的平方,其表达式为:
Spec(a,b)=|S(a,b)|2。
(2)步骤2具体包含以下子步骤:
子步骤2.1,构建基于WGAN的地面慢速运动目标样本扩充网络;
子步骤2.2,利用地面慢速运动目标时频谱图样本训练所述基于WGAN的地面慢速运动目标样本扩充网络,并生成扩充后的样本。
(3)子步骤2.1中,所述WGAN的主要结构分为判别器和生成器两部分,生成器用于捕捉真实地面慢速目标时频谱图的分布模型,然后利用捕获的分布模型生成新的数据样本;判别器是一个二值分类器,用于判别输入是真实数据还是生成的数据;所述判别器和所述生成器均由深度卷积网络构成。
(4)子步骤2.2中,所述WGAN在进行网络训练时,引入Wasserstein距离来衡量生成数据分布和真实数据分布之间的差异;其中,Wasserstein距离如下:
其中,Pr表示真实分布,Pg表示生成分布,∏(Pr,Pg)表示分布Pr和Pg组合起来的所有可能的联合分布的集合;对于每一个可能的联合分布η而言,可以从中采样(x,y)~η得到一个真实样本x和一个生成样本y,并计算出该对样本的距离||x-y||;因此,可以计算该联合分布η下样本对距离的期望值E(x,y)~η[||x-y||];在所有可能的联合分布中,该期望值的下界为并定义为Wasserstein距离;
在fw的Lipschitz常数||fw||L不超过K的情况下,对所有满足条件的fw取上界的1/K;对于连续函数fw,||fw||L的定义为,存在一个常数C使得fw定义域内的任意两个元素x1和x2均满足
|fw(x1)-fw(x2)|≤C|x1-x2|
则fw对应的||fw||L为C;
对于条件||fw||L<K,只需K不是正无穷即可,并不关心它的具体数值;因此,限制判别器fw的所有参数w不超过某个范围[-c,c],此时也不会超过某个范围,则一定存在某个常数K能够满足||fw||L<K;
因此,设置判别器和生成器的损失函数分别为,
判别器损失函数的反即为Pr与Pg的Wasserstein距离的近似值。
与现有技术相比,本发明的有益效果为:
(1)本发明引入WGAN技术对地面慢速目标的时频谱图样本进行扩充,解决了小样本条件下深度学习方法用于地面慢速目标分类精度不理想的问题。
(2)本发明解决了GAN用于地面慢速目标分类时训练不稳定的问题,不再需要平衡生成器和判别器的训练程度,并且在实现生成样本的多样性的同时确保了生成器图像的质量。
附图说明
下面结合附图和具体实施例对本发明做进一步详细说明。
图1为本发明一种基于WGAN的小样本地面慢速目标分类方法的流程图;
图2为本发明一种实施例所构建的WGAN判别器网络结构示意图;
图3为本发明一种实施例所构建的WGAN生成器网络结构示意图;
图4为本发明一种实施例所构建的VGGNet结构示意图;
图5为本发明一种实施例所构建的地面慢速运动目标时频谱图数据库示意图;其中,(a)为行人时频谱图;(b)为车辆时频谱图;
图6为本发明一种实施例所构建的WGAN生成的地面慢速运动目标时频谱图样本示意图;其中(a)为生成的行人时频谱图;(b)为生成的车辆时频谱图;
图7为本发明一种实施例所用于对比的DCGAN生成的地面慢速运动目标时频谱图样本示意图;其中(a)为生成的行人时频谱图;(b)为生成的车辆时频谱图;
图8为本发明一种实施例所进行的分类实验结果图;(a)为实验1的实验结果,(b)为实验2的实验结果。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域的技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。
参考图1,本发明提供的一种基于WGAN的小样本地面慢速目标分类方法,包括以下步骤:
步骤1,基于地面慢速运动目标回波数据,利用短时傅里叶变换方法,构建地面慢速运动目标时频谱图样本库。
具体的,短时傅里叶变换(STFT)通过时间滑窗,计算每个时间窗内信号的傅里叶变换(FT),即可得到信号的二维时频分布。STFT的定义为:
S(t,f)=∫z(t)ω(t-τ)exp(-j2πfτ)dτ
其中,t为时间,f为频率,ω(t)为窗函数,τ为窗函数的长度,z(t)为所要分析的连续信号,S(t,f)为变换后的时频谱信号,j表示复数的虚部。
在工程应用中,采用其离散形式为:
其中,k为离散采样点,z(k)为待分析信号的离散形式,T为时间采样间隔,F为频率采样间隔,a为时间采样,b为频率采样,ω(k)为窗函数的离散形式。
信号的时频谱图为STFT模的平方,其表达式为:
Spec(a,b)=|S(a,b)|2
步骤2,引入WGAN技术对地面慢速目标的时频谱图样本库进行扩充。
具体的,步骤2包含以下子步骤:
子步骤2.1,构建基于WGAN的地面慢速运动目标样本扩充网络。
WGAN的主要结构分为判别器和生成器两部分,生成器用于捕捉真实地面慢速目标时频谱图的分布模型,然后利用捕获的分布模型生成新的数据样本。判别器是一个二值分类器,它判别输入是真实数据还是生成的数据。二者均由深度卷积网络构成。有三个深度卷积网络中常用的概念:
(1)批归一化(Batch Normalization,BN)
具体实施方式为
其中,S为批大小,xi为输入特征图,μB、分别为xi的均值和方差,ε为避免除数为0时使用的微小正数,为归一化后的输入,γ和β是两个可学习的重构系数,BNγ,β为BN层函数,yi为BN层的训练样本输出。当网络训练收敛后,记录μB、和重构系数γ、β的取值,在测试时设测试样本为x,BN层对测试样本的输出为y,则
(2)LeakyReLU激活函数
LeakyReLU具体计算方法为
在本发明构建的WGAN网络中,leak将取为0.2。
(3)转置卷积
转置卷积的具体实施方式为,对输入特征图的元素进行等间隔的补零操作,然后对其进行卷积,同时,设置转置卷积中的卷积核个数小于原特征图的通道数。
本发明构建的WGAN的判别器网络结构如附图2所示。判别器的输入维度为[256,256,1]。经过5个卷积层,输出维度为[8,8,128],其中,每个卷积层使特征图的长和宽变为原来的1/2,使特征图的通道数加倍。之后,通过矩阵重排将该特征图重排为一维特征向量,长度为8192。最后,经过一个全连接层将该特征向量映射为一个连续值并为判别器添加梯度剪裁的结构。
本发明构建的WGAN的生成器网络结构如附图3所示。生成器的输入为100维噪声向量,首先,通过全连接将该特征向量映射为8192维的特征向量。其次,通过矩阵重排,将该特征重排为张量结构,单个样本的维度为[4,4,512]。之后,通过5个转置卷积层后形成维度为[128,128,16]的特征图,其中,每个转置卷积层使特征图长和宽变为原来的2倍,使特征图的通道数变为原来的1/2。最后通过一个转置卷积将特征图的维度与真实样本的维度变为一致,再经过Tanh进行非线性激活(Tanh(z)=(ez-e-z)/(ez+e-z),e代表自然常数,z代表输入特征图),从而构成生成器最终的输出。
子步骤2.2,利用地面慢速运动目标时频谱图样本训练WGAN,并生成扩充后的地面慢速运动目标时频谱图样本库。
具体的,WGAN在进行网络训练时,引入Wasserstein距离来衡量生成数据分布和真实数据分布之间的差异。因此,在设置WGAN的生成器和判别器的损失函数之前,首先说明Wasserstein距离。
Wasserstein距离又叫Earth-Mover(EM)距离,定义如下:
其中,Pr表示真实分布,Pg表示生成分布,∏(Pr,Pg)表示分布Pr和Pg组合起来的所有可能的联合分布的集合。对于每一个可能的联合分布η而言,可以从中采样(x,y)~η得到一个真实样本x和一个生成样本y,并计算出该对样本的距离||x-y||。因此,可以计算该联合分布η下样本对距离的期望值E(x,y)~η[||x-y||]。在所有可能的联合分布中,该期望值的下界为并定义为Wasserstein距离。由于无法直接求解,可以对其变换形式进行求解,即,
其中,fw表示判别器,w为判别器的网络参数,||fw||L为fw的Lipschitz常数,和分别表示判别器在真实样本分布和生成样本分布上的期望。上式的解释为,在fw的Lipschitz常数||fw||L不超过K的情况下,对所有满足条件的fw取上界的1/K。对于连续函数fw,||fw||L的定义为,存在一个常数C使得fw定义域内的任意两个元素x1和x2均满足
|fw(x1)-fw(x2)|≤C|x1-x2|
则fw对应的||fw||L为C。
对于条件||fw||L<K,只需K不是正无穷即可,并不关心它的具体数值。因此,限制判别器fw的所有参数w不超过某个范围[-c,c],此时也不会超过某个范围,则一定存在某个常数K能够满足||fw||L<K。
因此,设置判别器和生成器的损失函数分别为,
判别器损失函数的反即为Pr与Pg的Wasserstein距离的近似值。
由上述分析可知,本发明使用WGAN用于样本扩充,WGAN引入的Wasserstein距离比起其他散度有着更好的衡量准则。当两个分布即使重叠很小或者根本不存在重叠时,Wasserstein距离也能够衡量二者的远近。在进行网络训练时,在近似最优判别器下优化生成器使得Wasserstein距离缩小,从而有效拉近生成分布与真实分布。
步骤3,将原始样本库分成训练集和测试集,步骤2中新生成的样本均放入训练集,采用VGGNet进行网络训练至模型收敛,得到分类模型,在测试集中利用分类模型进行地面慢速运动目标的分类。
将原始样本库划分为两部分,用于训练WGAN的实测样本作为第一部分,剩余实测样本作为第二部分。设置两个实验组:第一个实验组使用第一部分原始样本作为训练集,第二部分样本作为测试集;第二个实验组使用第一部分原始样本和WGAN生成样本共同作为训练集,第二部分样本作为测试集。
分别进行上述两个实验,采用VGGNet进行地面慢速运动目标分类,VGGNet的网络结构如附图4所示。网络具有5段卷积(每段包含2或3个卷积层,均进行ReLU激活),每段卷积后进行一次最大池化。之后,将特征图进行重排,形成一维特征向量,进行4层全连接,前三层全连接后进行ReLU激活,最后一层全连接输出的特征向量维度为2。最后,使用Softmax分类器输出最终的类别概率。
实验
针对以上本发明的具体实施方法,利用实测雷达数据进行本发明的方法验证:
1、构建地面慢速运动目标时频谱图样本库
本发明所设实验使用的实测数据包含行人和车辆两类样本,实验设置和数据集参数如表1所示。
表1实测地面慢速目标数据参数
本发明所设实验对实测地面慢速运动目标数据进行STFT,并得到其时频谱图样本库。实验得到的样本总数为351,包含173个车辆目标的时频谱图和128个行人目标的时频谱图。
实例性的,如附图5所示,为本发明所设实验利用实测地面慢速运动目标数据获得的时频谱图,(a)为行人的时频谱图,(b)为车辆的时频谱图。
2、利用所建WGAN网络对上述时频谱图样本进行扩充
本发明所设实验在进行WGAN网络训练时的网络参数如表2所示:
表2 WGAN网络训练参数
当生成器和判别器的对抗学习达到收敛后,对生成器输入噪声向量,并对生成分布进行采样,获得生成样本,如附图6所示,(a)为实测行人目标样本库的WGAN生成器采样,(b)为实测车辆目标样本库的WGAN生成器采样。附图7所示为利用DCGAN方法生成的地面慢速目标时频谱图样本,与附图5相比,由DCGAN生成的时频谱图背景噪声较为严重。
为了进一步评估WGAN扩充数据集的质量,利用图像评估指标,对由WGAN生成的地面慢速运动目标时频谱图的图像质量进行评估;其中,图像质量评价指标包括:均值、方差、信息熵、动态范围、模糊线性指数、平均梯度、均方差和灰度差。
(1)均值
图像的均值(Mean)表明图像总体能量的大小。设图像I的大小为M×N,其定义为:
其中,I(m,n)代表图像(m,n)处的灰度值。
(2)方差
方差(Variance)衡量了样本相对均值的偏离程度,方差越大表明样本的数据分布越不均匀,其定义为:
(2)信息熵
信息熵(Entropy)可表示图像的信息量,同时反映图像的聚焦程度,其表达式为:
其中,pmn为图像上像素点I(m,n)的概率值。信息熵越小,图像越聚焦。
(4)动态范围
动态范围(Dyzone)为灰度图像最大值与最小值之比,其对数表达形式为
其中,Imax和Imin分别为灰度图像的最大值和最小值。动态范围越大,图像对比度越大。
(5)模糊线性指数
模糊线性指数(Linear index of fuzziness,LIF)用于描述图像的模糊程度。其定义是
LIF越小,图像越清晰。
(6)平均梯度
平均梯度(Average gradient,AG)可定义为
(7)均方差
图像的均方差(Mean square deviation,MSD)表示图像像素值的波动程度。
其定义为
MSD越大,表示图像越干净。
(8)灰度差
图像的灰度差(Gray Level Difference,GLD)可描述图像中感兴趣的目标区域的边缘清晰度。其定义为
GLD越大,表明图像边缘越清晰。
分别计算WGAN生成样本和DCGAN生成样本的上述图像评估指标,表3给出了基于行人和车辆实测数据的DCGAN和WGAN图像评价指标偏离原始数据集评价指标的方差,以衡量二者生成图像分布相比原始图像分布的差异。各项指标的数值越小,说明生成图像和原始图像的统计分布越接近。
表3 DCGAN与WGAN评价指标相对原始数据集的方差
由表3可以看出:(1)在行人数据集中,本发明的WGAN方法在LIF指标上略高于DCGAN,其它指标都更接近原始数据。(2)在车辆数据集中,本发明的WGAN方法在MEAN和LIF指标上高于DCGAN,其它指标都更接近原始数据。(3)综合行人和车辆数据集,本发明的WGAN方法的评价指标普遍优于DCGAN。
3、地面慢速运动目标的分类实验
根据本发明具体实施步骤3中的数据集划分方式设置对比试验,在完成每一个轮次的训练时,记录网络在训练集上的分类精度,如附图8所示。由图可知,实验1在训练了约50个Epoch后趋于基本平稳,且前期训练出现震荡和不稳定的情况,而实验2在训练了3个Epoch后达到稳定,且前期处于稳步上升状态,训练比较稳定。在测试中,实验1的分类精度为95.31%,实验2的分类精度为96.25%。进一步验证了本发明通过WGAN进行样本扩充后,提高了网络对于地面慢速运动目标的分类性能。进一步验证了本发明通过WGAN进行样本扩充后,提高了网络对于地面慢速运动目标的分类性能。
虽然,本说明书中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (5)
1.一种基于WGAN的小样本地面慢速运动目标分类方法,其特征在于,包括以下步骤:
步骤1,基于地面慢速运动目标回波数据,利用短时傅里叶变换方法,构建地面慢速运动目标时频谱图样本库;
步骤2,引入WGAN技术对地面慢速目标的时频谱图样本库进行扩充,得到扩充后的样本;
步骤3,将原始样本库分成训练集和测试集,将所述扩充后的样本放入所述训练集中,采用VGGNet进行网络训练至模型收敛,得到分类模型;在所述测试集中利用所述分类模型进行地面慢速运动目标的分类。
2.根据权利要求1所述的基于WGAN的小样本地面慢速运动目标分类方法,其特征在于,步骤1具体为:
短时傅里叶变换通过时间滑窗,计算每个时间窗内信号的傅里叶变换,得到变换后的时频谱信号S(t,f):
S(t,f)=∫z(t)ω(t-τ)exp(-j2πfτ)dτ
其中,t为时间,f为频率,ω(t)为窗函数,τ为窗函数的长度,z(t)为所要分析的连续信号,j表示复数的虚部;
在工程应用中,采用变换后的时频谱信号S(t,f)的离散形式S(a,b)为:
其中,k为离散采样点,z(k)为待分析信号的离散形式,T为时间采样间隔,F为频率采样间隔,a为时间采样,b为频率采样,ω(k)为窗函数的离散形式;
信号的时频谱图为S(a,b)模的平方,其表达式为:
Spec(a,b)=|S(a,b)|2。
3.根据权利要求1所述的基于WGAN的小样本地面慢速运动目标分类方法,其特征在于,步骤2具体包含以下子步骤:
子步骤2.1,构建基于WGAN的地面慢速运动目标样本扩充网络;
子步骤2.2,利用地面慢速运动目标时频谱图样本训练所述基于WGAN的地面慢速运动目标样本扩充网络,并生成扩充后的样本。
4.根据权利要求3所述的基于WGAN的小样本地面慢速运动目标分类方法,其特征在于,子步骤2.1中,所述WGAN的主要结构分为判别器和生成器两部分,生成器用于捕捉真实地面慢速目标时频谱图的分布模型,然后利用捕获的分布模型生成新的数据样本;判别器是一个二值分类器,用于判别输入是真实数据还是生成的数据;所述判别器和所述生成器均由深度卷积网络构成。
5.根据权利要求4所述的基于WGAN的小样本地面慢速运动目标分类方法,其特征在于,子步骤2.2中,所述WGAN在进行网络训练时,引入Wasserstein距离来衡量生成数据分布和真实数据分布之间的差异;其中,Wasserstein距离如下:
其中,Pr表示真实分布,Pg表示生成分布,∏(Pr,Pg)表示分布Pr和Pg组合起来的所有可能的联合分布的集合;对于每一个可能的联合分布η而言,可以从中采样(x,y)~η得到一个真实样本x和一个生成样本y,并计算出该对样本的距离||x-y||;因此,可以计算该联合分布η下样本对距离的期望值E(x,y)~η[||x-y||];在所有可能的联合分布中,该期望值的下界为并定义为Wasserstein距离;
在fw的Lipschitz常数||fw||L不超过K的情况下,对所有满足条件的fw取上界的1/K;对于连续函数fw,||fw||L的定义为,存在一个常数C使得fw定义域内的任意两个元素x1和x2均满足
|fw(x1)-fw(x2)|≤C|x1-x2|
则fw对应的||fw||L为C;
对于条件||fw||L<K,只需K不是正无穷即可,并不关心它的具体数值;因此,限制判别器fw的所有参数w不超过某个范围[-c,c],此时也不会超过某个范围,则一定存在某个常数K能够满足||fw||L<K;
因此,设置判别器和生成器的损失函数分别为,
判别器损失函数的反即为Pr与Pg的Wasserstein距离的近似值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110668793.4A CN113569632A (zh) | 2021-06-16 | 2021-06-16 | 一种基于wgan的小样本地面慢速运动目标分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110668793.4A CN113569632A (zh) | 2021-06-16 | 2021-06-16 | 一种基于wgan的小样本地面慢速运动目标分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113569632A true CN113569632A (zh) | 2021-10-29 |
Family
ID=78162113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110668793.4A Pending CN113569632A (zh) | 2021-06-16 | 2021-06-16 | 一种基于wgan的小样本地面慢速运动目标分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569632A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115221929A (zh) * | 2022-09-15 | 2022-10-21 | 中国电子科技集团公司第二十九研究所 | 一种基于时频图像的信号识别方法 |
CN115277189A (zh) * | 2022-07-27 | 2022-11-01 | 中国人民解放军海军航空大学 | 基于生成式对抗网络的无监督式入侵流量检测识别方法 |
CN115525786A (zh) * | 2022-10-11 | 2022-12-27 | 中国传媒大学 | 一种电离层频高图分类样本库的构建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020172838A1 (zh) * | 2019-02-26 | 2020-09-03 | 长沙理工大学 | 一种改进辅助分类器gan的图像分类方法 |
CN112946600A (zh) * | 2021-03-17 | 2021-06-11 | 西安电子科技大学 | 基于wgan-gp的雷达hrrp数据库构建方法 |
CN112966740A (zh) * | 2021-03-05 | 2021-06-15 | 西安邮电大学 | 基于核心样本自适应扩充的小样本高光谱图像分类方法 |
-
2021
- 2021-06-16 CN CN202110668793.4A patent/CN113569632A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020172838A1 (zh) * | 2019-02-26 | 2020-09-03 | 长沙理工大学 | 一种改进辅助分类器gan的图像分类方法 |
CN112966740A (zh) * | 2021-03-05 | 2021-06-15 | 西安邮电大学 | 基于核心样本自适应扩充的小样本高光谱图像分类方法 |
CN112946600A (zh) * | 2021-03-17 | 2021-06-11 | 西安电子科技大学 | 基于wgan-gp的雷达hrrp数据库构建方法 |
Non-Patent Citations (1)
Title |
---|
李雅欣: "基于深度学习的地面慢速目标分类及精细化识别方法", 硕士电子期刊, vol. 2021, no. 05, 16 April 2021 (2021-04-16), pages 22 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115277189A (zh) * | 2022-07-27 | 2022-11-01 | 中国人民解放军海军航空大学 | 基于生成式对抗网络的无监督式入侵流量检测识别方法 |
CN115277189B (zh) * | 2022-07-27 | 2023-08-15 | 中国人民解放军海军航空大学 | 基于生成式对抗网络的无监督式入侵流量检测识别方法 |
CN115221929A (zh) * | 2022-09-15 | 2022-10-21 | 中国电子科技集团公司第二十九研究所 | 一种基于时频图像的信号识别方法 |
CN115525786A (zh) * | 2022-10-11 | 2022-12-27 | 中国传媒大学 | 一种电离层频高图分类样本库的构建方法 |
CN115525786B (zh) * | 2022-10-11 | 2024-02-20 | 中国传媒大学 | 一种电离层频高图分类样本库的构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113569632A (zh) | 一种基于wgan的小样本地面慢速运动目标分类方法 | |
CN111028146B (zh) | 基于双判别器的生成对抗网络的图像超分辨率方法 | |
CN109683161B (zh) | 一种基于深度admm网络的逆合成孔径雷达成像的方法 | |
CN108614992B (zh) | 一种高光谱遥感图像的分类方法、设备及存储设备 | |
US11880903B2 (en) | Bayesian image denoising method based on distribution constraint of noisy images | |
Zheng et al. | Advanced discrete wavelet transform fusion algorithm and its optimization by using the metric of image quality index | |
CN107229918A (zh) | 一种基于全卷积神经网络的sar图像目标检测方法 | |
JP2007503903A (ja) | 局所適応的な非線形ノイズ削減 | |
CN112818764B (zh) | 一种基于特征重建模型的低分辨率图像人脸表情识别方法 | |
Qiusheng et al. | Compressed sensing MRI based on the hybrid regularization by denoising and the epigraph projection | |
Ramzi et al. | Denoising score-matching for uncertainty quantification in inverse problems | |
Cao et al. | Acceleration of histogram‐based contrast enhancement via selective downsampling | |
CN112435162A (zh) | 一种基于复数域神经网络的太赫兹图像超分辨重建方法 | |
Zhou et al. | MSAR‐DefogNet: Lightweight cloud removal network for high resolution remote sensing images based on multi scale convolution | |
Cherian et al. | A Novel AlphaSRGAN for Underwater Image Super Resolution. | |
CN106971382A (zh) | 一种sar图像相干斑抑制方法 | |
CN112686297B (zh) | 一种雷达目标运动状态的分类方法及系统 | |
CN113033106A (zh) | 一种基于ebsd与深度学习方法的钢铁材料性能预测方法 | |
CN116228520A (zh) | 基于Transformer生成对抗网络的图像压缩感知重建方法及系统 | |
CN115471580A (zh) | 一种物理智能高清磁共振扩散成像方法 | |
CN111652311B (zh) | 基于稀疏椭圆rbf神经网络的图像稀疏表示方法 | |
CN112529826B (zh) | 截断式张量贝叶斯多光谱图像压缩感知重构方法 | |
He et al. | Learning priors in high-frequency domain for inverse imaging reconstruction | |
CN107832796B (zh) | 基于曲线波深度阶梯网络模型的sar图像分类方法 | |
Pu et al. | ORTP: A video SAR imaging algorithm based on low-tubal-rank tensor recovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |