CN112966740B - 基于核心样本自适应扩充的小样本高光谱图像分类方法 - Google Patents
基于核心样本自适应扩充的小样本高光谱图像分类方法 Download PDFInfo
- Publication number
- CN112966740B CN112966740B CN202110244446.9A CN202110244446A CN112966740B CN 112966740 B CN112966740 B CN 112966740B CN 202110244446 A CN202110244446 A CN 202110244446A CN 112966740 B CN112966740 B CN 112966740B
- Authority
- CN
- China
- Prior art keywords
- training
- sample
- training sample
- data
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 237
- 238000012360 testing method Methods 0.000 claims abstract description 38
- 238000003062 neural network model Methods 0.000 claims abstract description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000001228 spectrum Methods 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 230000004069 differentiation Effects 0.000 claims description 3
- 230000006872 improvement Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 abstract description 11
- 230000006870 function Effects 0.000 description 23
- 230000008485 antagonism Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000007123 defense Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于核心样本自适应扩充的小样本高光谱图像分类方法,首先对高光谱图像进行数据预处理,得到训练样本和测试样本;采用MCFSFDP聚类方法自适应确定测试样本中的核心样本;将核心样本加入至训练样本中,扩充得到训练样本集;将训练样本集代入至生成对抗网络中进行训练,生成与训练样本集数量一致的生成样本,并将生成样本加入至训练样本集中,扩充得到训练样本数据集;将训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型;将测试样本代入至最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果,通过对训练样本进行两次自适应样本扩充,有效提高了神经网络的泛化能力和小样本高光谱图像分类精度。
Description
技术领域
本发明涉及高光谱图像处理领域,特别是涉及一种基于核心样本自适应扩充的小样本高光谱图像分类方法。
背景技术
近年来,由于高光谱图像的独特性质以及所包含的海量信息,对于高光谱图像的分析与处理已经成为遥感影像研究领域的热点之一,而其中的高光谱图像分类又对地质勘探、农作物检测、国防军事等领域起着实质性的重要作用。
然而,高光谱图像标注困难,费时费力,往往只存在少量标注数据作为先验,因此,高光谱图像分类问题往往是小样本问题。目前存在的小样本高光谱图像像素级分类方法主要有两类:一类是基于样本扩充的方法;另一类是基于迁移学习的方法。而在现有的高光谱图像样本生成方法,通常使用GAN生成与原始训练样本分布大致相同的高光谱图像样本加入训练样本,进而得到更多的训练样本,以提高神经网络模型的泛化能力,提高测试精度,得到有效的分类结果。然而,这种方法中,GAN生成的高光谱图像训练样本往往只是与原始少量的训练样本相关,而这些少量样本并非一定是核心样本,因此,其生成的样本一般也不是核心样本,只是增加了样本的数量而非质量,对于神经网络的泛化能力的提高是非常有限的,进而存在对于小样本高光谱图像来说一般生成的不是核心样本,难以有效提高小样本高光谱图像分类精度的问题。
因此,目前亟需一种基于核心样本自适应扩充的小样本高光谱图像分类方法,以解决现有的高光谱图像样本分类方法存在的神经网络泛化能力差、分类精度低的问题。
发明内容
本发明的目的是提供一种基于核心样本自适应扩充的小样本高光谱图像分类方法,将基于快速寻找密度峰值的聚类算法(Clustering by Fast Search and Find ofDensity Peaks,CFSFDP)引入到样本扩充中,通过将CFSFDP方法改进为MCFSFDP方法,可以自适应确定核心样本并将核心样本标注后加入到训练样本中,形成训练样本集进行神经网络训练,生成与训练样本集中样本数量相等的生成样本并将其扩充加入到训练样本集中,实现对训练样本的自适应扩充,不仅从测试样本中准确的找到了核心样本,还使训练样本的质量、数量得到同步提升,提高了神经网络的泛化能力,有效提升小样本高光谱图像分类精度。
为实现上述目的,本发明提供了如下方案:
一种基于核心样本自适应扩充的小样本高光谱图像分类方法,包括:
对高光谱图像进行数据预处理,得到训练样本和测试样本;
采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本;
将所述核心样本加入至所述训练样本中,扩充得到训练样本集;
将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集;
将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型;
将所述测试样本代入至所述最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果。
可选的,所述对高光谱图像进行数据预处理,得到训练样本和测试样本,具体包括:
随机从高光谱图像R的每一个类别中选取5%的光谱像素点作为训练样本所述训练样本的数量表示为M,所述训练样本的尺寸为h×1,h为光谱数;
将剩余95%的光谱像素点作为测试样本所述测试样本的数量表示为N。
可选的,所述采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本,具体包括:
将所述测试样本作为聚类数据集,j表示所述聚类数据集中的数据点,且j的取值范围为[1,N];
计算每一个数据点j的局部密度ρj:
其中,ρj表示数据点j的局部密度,k表示数据点j之外的另一个数据点,djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离,dc表示截断距离;当djk-dc<0时,则χ(djk-dc)=1,否则χ(djk-dc)=0,χ(·)表示判断函数;
δj表示数据点j与比所述数据点j的局部密度高的所有数据点之间的最近距离,如公式(2)所示:
其中,ρk表示数据点k的局部密度;djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离;
对于拥有最大局部密度的数据点,其距离为所有数据点与数据点之间的距离的最大值δj=maxk(dkj);dkj为数据点k与数据点j之间的欧氏距离;
对于每个数据点j,都有与其对应的密度值ρj和距离值δj;距离阈值δ为选择数据点为聚类结果的唯一标准,则有:
numv=f(δv) (3)
其中,δv表示所有数据点的距离值,numv为δj≥δv的数据点j的个数;
对公式(3)求微分得到:
conv=[f(δv+1)-f(δv)]/(δv+1-δv) (4)
其中,conv为数据点个数与距离值的微分;δv和δv+1表示拥有数据点的距离阈值的相邻值,且δv+1>δv;
对公式(4)中的距离阈值的相邻值δv和δv+1上的conv与conv+1做商,再对结果求绝对值,即有:
quov=|conv/conv+1| (5)
quov表示两个相邻距离阈值上微分的商的绝对值;
当在某距离阈值区间δr(δv-1,δv,δv+1)上的数据点数numv趋近稳定时,在这个距离阈值区间的距离阈值δv上存在quov的局部极大值,则将当前的距离阈值δv确定为自适应距离阈值δA;
当数据点j的距离δj>δA时,所述数据点j被选择为聚类中心点,所述聚类中心点即为所述核心样本,并对所述核心样本的类别进行人为标注,得到自适应确定的核心样本。
可选的,所述将所述核心样本加入至所述训练样本中,扩充得到训练样本集,具体包括:
将所述核心样本的数量定义为T;
将所述核心样本加入到所述训练样本中进行扩充,得到训练样本集;
由于所述训练样本的数量为M,所述核心样本的数量为T,则扩充后得到的训练样本集中训练样本的数量为M+T,将所述训练样本集记为
可选的,所述将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集,具体包括:
将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本;由于所述训练样本集中训练样本的数量为M+T,所述生成样本的数量也为M+T;
将数量为M+T的所述生成样本加入至样本数量同为M+T的所述训练样本集中进行扩充,得到训练样本数量为2*(M+T)的训练样本数据集,将所述训练样本数据集记为
可选的,所述生成对抗网络包括生成器G和判别器D,所述生成器G用于捕捉潜在分布的真实数据并生成新的数据,所述判别器D是一个二值分类器,用于判断输入的训练样本的真实性。
可选的,将所述训练样本集代入至生成对抗网络中进行训练,具体包括:
假设真实数据x具备数据分布p(x)且输入噪声变量具有一个先验p(z),所述生成器接收一个输入噪声,并产生一个到虚假数据G(z)空间的映射;D(x)估计来自训练样本的真实数据x的概率;
在生成对抗网络训练的优化过程中,所述判别器被训练为最大化log(D(x)),被训练为最大化log(D(x))的所述判别器为正确源分配正确标签的概率,此时所述生成器被训练为最小化log(1-D(G(z))),将生成对抗网络的优化问题作为一个求解极大极小的问题,则所述生成对抗网络的目标函数为:
其中,V(D,G)表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,p(x)表示数据分布,G(z)表示虚假数据,D(x)表示估算的来自训练样本的真实数据x的概率,log(D(x))表示所述判别器被训练最大化,log(1-D(G(z)))表示所述生成器被训练最小化;
则计算所述生成器G的损失函数收敛值为:
其中,F(D,G)表示损失函数收敛值,f(D,G)表示优化后的损失函数收敛值,V(D,G)表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,p(x)表示数据分布,G(z)表示虚假数据,D(x)表示估算的来自训练样本的真实数据x的概率,log(D(x))表示所述判别器被训练最大化,log(1-D(G(z)))表示所述生成器被训练最小化。
对所述训练样本集中的训练样本进行一次生成对抗网络训练,得到损失函数收敛值F(D,G),若所述损失函数收敛值F(D,G)为r,则再次进行生成对抗网络训练,直到得到的损失函数收敛值F(D,G)>r时,即当F(D,G)=r+At时,At表示收敛增值,停止训练。
可选的,所述收敛增值At的取值为0.5。
可选的,所述将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型,具体包括:
将所述训练样本数据集中的各个训练样本代入至BP神经网络模型;
不断误差反馈、迭代更新所述BP神经网络模型的权重;
将最大迭代次数设置为1000次,当达到最大迭代次数时完成训练,得到最终的BP神经网络模型。
可选的,所述BP神经网络模型包括一个输入层、三个隐含层和一个Softmax分类器;所述BP神经网络模型的每一个输入节点代表高光谱图像样本中的一个元素。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明通过改进的基于快速寻找密度峰值的聚类算法(MCFSFDP),对测试样本进行聚类,自适应得到核心样本并进行标记,并将其加入训练样本形成新的训练样本数据集,再利用GAN对新的训练样本数据进行训练并生成与新的训练样本数据数量相等的生成样本加入新的训练样本数据集,形成最终的训练样本数据集,最后对训练样本数据集中的训练样本进行神经网络训练及测试样本测试。
与传统的样本扩充算法相比,本发明在确定核心样本后,将核心样本加入至训练样本中,实现对训练样本的第一次扩充,得到训练样本集,然后又将训练样本集代入至生成对抗网络中训练,生成与训练样本集中样本数量相同的生成样本,再将生成样本加入至训练样本中,实现对训练样本的第二次扩充,通过对训练样本进行两次自适应样本扩充,实现对训练样本的质量和数量的同步提升,最终真实、有效的提高了神经网络的泛化能力,提升了小样本高光谱图像分类精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的基于核心样本自适应扩充的小样本高光谱图像分类方法的流程示意图;
图2为本发明实施例1提供的生成对抗网络GAN网络的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于核心样本自适应扩充的小样本高光谱图像分类方法,将基于快速寻找密度峰值的聚类算法(Clustering by Fast Search and Find ofDensity Peaks,CFSFDP)引入到样本扩充中,通过将CFSFDP方法改进为MCFSFDP方法,可以自适应确定核心样本并将核心样本标注后加入到训练样本中,形成训练样本集进行神经网络训练,生成与训练样本集中样本数量相等的生成样本并将其扩充加入到训练样本集中,实现对训练样本的自适应扩充,不仅从测试样本中准确的找到了核心样本,还使训练样本的质量、数量得到同步提升,提高了神经网络的泛化能力,有效提升小样本高光谱图像分类精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
如图1所示,本实施例提供了一种基于核心样本自适应扩充的小样本高光谱图像分类方法,具体包括以下步骤:
S1、对高光谱图像进行数据预处理,得到训练样本和测试样本。
本实施例中,在选择训练样本和测试样本时,随机从高光谱图像R的每一个类别中选取5%的光谱像素点作为训练样本从而得到所述训练样本,所述训练样本的数量表示为M,所述训练样本的尺寸为h×1,h为光谱数。
将剩余95%的光谱像素点作为测试样本从而得到所述测试样本,所述测试样本的数量表示为N。
S2、采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本。具体包括:
将所述测试样本作为聚类数据集,j表示所述聚类数据集中的数据点,且j的取值范围为[1,N];
计算每一个数据点j的局部密度ρj:
其中,ρj表示数据点j的局部密度,k表示数据点j之外的另一个数据点,djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离,dc为截断距离,表示所有数据点与数据点之间的欧式距离中,由小到大排列占总数2%的所有欧式距离的数值;当djk-dc<0时,则χ(djk-dc)=1,否则χ(djk-dc)=0,χ(·)表示判断函数;
δj表示数据点j与比所述数据点j的局部密度高的所有数据点之间的最近距离,如公式(2)所示:
其中,ρk表示数据点k的局部密度;djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离;
对于拥有最大局部密度的数据点,其距离为所有数据点与数据点之间的距离的最大值δj=maxk(dkj);dkj为数据点k与数据点j之间的欧氏距离;
对于每个数据点j,都有与其对应的密度值ρj和距离值δj;距离阈值δ为选择数据点为聚类结果的唯一标准,则有:
numv=f(δv) (3)
其中,δv表示所有数据点的距离值,numv为δj≥δv的数据点j的个数;
对公式(3)求微分得到:
conv=[f(δv+1)-f(δv)]/(δv+1-δv) (4)
其中,conv为数据点个数与距离值的微分;δv和δv+1表示拥有数据点的距离阈值的相邻值,且δv+1>δv;
对公式(4)中的距离阈值的相邻值δv和δv+1上的conv与conv+1做商,再对结果求绝对值,即有:
quov=|conv/conv+1| (5)
quov表示两个相邻距离阈值上微分的商的绝对值;
当在某距离阈值区间δr(δv-1,δv,δv+1)上的数据点数numv趋近稳定时,在这个距离阈值区间的距离阈值δv上存在quov的局部极大值,则将当前的距离阈值δv确定为自适应距离阈值δA;
当数据点j的距离δj>δA时,所述数据点j被选择为聚类中心点,所述聚类中心点即为所述核心样本,并对所述核心样本的类别进行人为标注,得到自适应确定的核心样本。
本实施例通过改进的基于快速寻找密度峰值的聚类算法(MCFSFDP),对测试样本进行聚类,自适应得到核心样本并进行标记,可准确的确定核心样本,解决了现有的高光谱图像样本扩充方法无法确定核心样本的问题。
S3、将所述核心样本加入至所述训练样本中,扩充得到训练样本集。具体包括:
将所述核心样本的数量定义为T;
将所述核心样本加入到所述训练样本中进行扩充,得到训练样本集;
由于所述训练样本的数量为M,所述核心样本的数量为T,则扩充后得到的训练样本集中训练样本的数量为M+T,将所述训练样本集记为
本实施例中,通过将核心样本加入至训练样本中,完成第一次训练样本的自适应样本扩充,得到的训练样本集中训练样本的数量包括M个原始训练样本和T个具有标记符号的核心样本。
S4、将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集。具体包括:
将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,且所述生成样本中也具有标记符号;由于所述训练样本集中训练样本的数量为M+T,所述生成样本的数量也为M+T;
将数量为M+T的所述生成样本加入至样本数量同为M+T的所述训练样本集中进行扩充,得到训练样本数量为2*(M+T)的训练样本数据集,将所述训练样本数据集记为
本实施例中,通过将生成样本加入至训练样本集中,完成第二次训练样本的自适应样本扩充,得到的训练样本数据集中训练样本的数量包括M个原始训练样本、T个具有标记符号的核心样本和M+T个具有标记符号的生成样本,共计2*(M+T)个训练样本,使得训练样本的数量大幅增加,从而使训练样本得到数量和质量上的同步提升,解决了GAN生成的生成样本不仅不是核心样本,还在样本扩充时只增加样本的数量而非质量的问题。
图2是本发明实施例1提供的生成对抗网络的结构框图,如图2所示,所述生成对抗网络即GAN网络,包括生成器G和判别器D,所述生成器G用于捕捉潜在分布的真实数据x并生成新的数据,所述判别器D是一个二值分类器,用于判断输入的训练样本的真实性。
GAN的核心思想来源于博弈论的纳什均衡,设定参与游戏双方分别为一个生成器G和一个判别器D,生成器G的目的是尽量去学习真实的数据分布,而判别器D的目的是尽量正确判别输入数据是来自真实数据x还是来自生成器G的虚假数据G(z);为了取得游戏胜利,生成器G和判别器D这两个游戏参与者需要不断优化,各自提高自己的生成能力和判别能力,这个学习优化过程就是寻找二者之间的一个纳什均衡的过程。
假设真实数据x具备数据分布p(x)且输入噪声变量具有一个先验p(z),所述生成器G接收一个随机噪声作为输入,即输入噪声z,并产生一个到虚假数据G(z)空间的映射;D(x)估计来自训练样本的真实数据x的概率;
在生成对抗网络训练的优化过程中,所述判别器D被训练为最大化log(D(x)),被训练为最大化log(D(x))的所述判别器D为正确源分配正确标签的概率,此时所述生成器G被训练为最小化log(1-D(G(z))),将生成对抗网络的优化问题作为一个求解极大极小的问题,则所述生成对抗网络的目标函数为:
其中,V(D,G)表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,p(x)表示数据分布,G(z)表示虚假数据,D(x)表示估算的来自训练样本的真实数据x的概率,log(D(x))表示所述判别器D被训练最大化,log(1-D(G(z)))表示所述生成器G被训练最小化。
应说明的是,经过计算后,当判别器D发现一个真实样本的高概率分布时,判别器D的梯度消失,训练停止。为了确定当判别器D的分类精度高时生成器G有适当的梯度,生成器G的损失函数通常通过将样本判断为真的概率最大化制定,这里需要生成的样本越真实越好,而不是通过将样本判断为假的概率最小化制定,这里是说不需要判别器D判别生成样本是伪样本的概率最小。
则计算所述生成器G的损失函数收敛值为:
其中,F(D,G)表示损失函数收敛值,f(D,G)表示优化后的损失函数收敛值,V(D,G)表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,p(x)表示数据分布,G(z)表示虚假数据,D(x)表示估算的来自训练样本的真实数据x的概率,log(D(x))表示所述判别器被训练最大化,log(1-D(G(z)))表示所述生成器被训练最小化。
还应当说明的是,生成器G的参数更新是基于判别器D反馈的,而不是直接使用真实样本数据反馈的。然而,这里需要生成样本与输入GAN网络的训练样本有所区别,最好是与输入样本相似但还存在不同。因此,需要对GAN网络先训练一次得到损失函数收敛值F(D,G)。
因此,对所述训练样本集中的训练样本进行一次生成对抗网络训练,得到损失函数收敛值F(D,G),若所述损失函数收敛值F(D,G)为r,则再次进行生成对抗网络训练,直到得到的损失函数收敛值F(D,G)>r时,即当F(D,G)=r+At时,停止训练,其中At表示收敛增值,r为预设损失函数收敛值。
本实施例中,将所述收敛增值At的取值设置为0.5。
需要注意的是,本发明中的收敛增值At的值并不是唯一的,对r的值也不做限定,At和r的具体数值视实际情况自行确定,任何关于At和r的取值范围都应在本发明的保护范围之内。
S5、将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型。具体包括:
将所述训练样本数据集中的各个训练样本代入至BP神经网络模型;
不断误差反馈、迭代更新所述BP神经网络模型的权重;
将最大迭代次数设置为1000次,当达到最大迭代次数时完成训练,得到最终的BP神经网络模型。
S6、将所述测试样本代入至所述最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果。
所述BP神经网络模型包括一个输入层、三个隐含层和一个Softmax分类器;所述BP神经网络模型的每一个输入节点代表高光谱图像样本中的一个元素,在通过训练样本数据集将BP神经网络模型训练好后,将测试样本代入至训练好的BP神经网络模型中,直接正向计算即可得到准确的小样本高光谱图像的分类结果。
简单来说,本发明提出的一种基于核心样本自适应扩充的小样本高光谱图像分类方法,首先确定训练样本和测试样本,然后对测试样本进行聚类处理,自适应选取聚类中心样本作为核心样本并进行标注;然后,将标注过的核心样本加入到训练样本中进行第一次样本扩充,得到扩充后的训练样本集;然后在对训练样本集进行生成对抗网络训练,生成与该训练样本集数量相同的生成样本并附带标签,将生成样本加入到训练样本集中进行第二次样本扩充,得到训练样本数据集;最后,将训练样本数据集对BP神经网络模型进行训练,再将训练好的BP神经网络模型对测试样本进行测试,从而实现小样本高光谱图像的分类。
本发明的方法不仅确定了核心样本,还基于核心样本对训练样本进行了两次样本扩充,针对训练样本的两次自适应样本扩充,第一次扩充加入了核心样本,第二次扩充加入了相同数量的生成样本,且核心样本和生成样本均具有标记标签,两次样本扩充使得训练样本的数量成倍增加,实现对训练样本的质量和数量的同步提升,真实有效的提高了神经网络的泛化能力,提升了小样本高光谱图像分类精度,解决现有的高光谱图像样本生成方法存在的神经网络泛化能力差、分类精度低的问题,可提升高光谱图像的分类效果,有利于高光谱图像分类的应用和发展。
本说明书中各个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。本说明书中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (5)
1.一种基于核心样本自适应扩充的小样本高光谱图像分类方法,其特征在于,包括:
对高光谱图像进行数据预处理,得到训练样本和测试样本;
采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本;
将所述核心样本加入至所述训练样本中,扩充得到训练样本集;
将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集;
将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型;
将所述测试样本代入至所述最终的BP神经网络模型中,正向计算得到小样本高光谱图像的分类结果;
所述将所述核心样本加入至所述训练样本中,扩充得到训练样本集,具体包括:
将所述核心样本的数量定义为T;
将所述核心样本加入到所述训练样本中进行扩充,得到训练样本集;
由于所述训练样本的数量为M,所述核心样本的数量为T,则扩充后得到的训练样本集中训练样本的数量为M+T,将所述训练样本集记为
所述将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本,并将所述生成样本加入至所述训练样本集中,扩充得到训练样本数据集,具体包括:
将所述训练样本集代入至生成对抗网络中进行训练,生成与所述训练样本集数量一致的生成样本;由于所述训练样本集中训练样本的数量为M+T,所述生成样本的数量也为M+T;
将数量为M+T的所述生成样本加入至样本数量同为M+T的所述训练样本集中进行扩充,得到训练样本数量为2*(M+T)的训练样本数据集,将所述训练样本数据集记为
所述方法在确定核心样本后,将核心样本加入至训练样本中,实现对训练样本的第一次扩充,得到训练样本集,然后又将训练样本集代入至生成对抗网络中训练,生成与训练样本集中样本数量相同的生成样本,再将生成样本加入至训练样本中,实现对训练样本的第二次扩充,通过基于核心样本对训练样本进行两次自适应样本扩充,实现对训练样本的质量和数量的同步提升;
所述对高光谱图像进行数据预处理,得到训练样本和测试样本,具体包括:
随机从高光谱图像R的每一个类别中选取5%的光谱像素点作为训练样本所述训练样本的数量表示为M,所述训练样本的尺寸为h×1,h为光谱数;
将剩余95%的光谱像素点作为测试样本所述测试样本的数量表示为N;
所述生成对抗网络包括生成器G和判别器D,所述生成器G用于捕捉潜在分布的真实数据并生成新的数据,所述判别器D是一个二值分类器,用于判断输入的训练样本的真实性;
将所述训练样本集代入至生成对抗网络中进行训练,具体包括:
假设真实数据x具备数据分布p(x)且输入噪声变量具有一个先验p(z),所述生成器接收一个输入噪声,并产生一个到虚假数据G(z)空间的映射;D(x)估计来自训练样本的真实数据x的概率;
在生成对抗网络训练的优化过程中,所述判别器被训练为最大化log(D(x)),被训练为最大化log(D(x))的所述判别器为正确源分配正确标签的概率,此时所述生成器被训练为最小化log(1-D(G(z))),将生成对抗网络的优化问题作为一个求解极大极小的问题,则所述生成对抗网络的目标函数为:
其中,V(D,G)表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,p(x)表示数据分布,G(z)表示虚假数据,D(x)表示估算的来自训练样本的真实数据x的概率,log(D(x))表示所述判别器被训练最大化,log(1-D(G(z)))表示所述生成器被训练最小化;
则计算所述生成器G的损失函数收敛值为:
其中,F(D,G)表示损失函数收敛值,f(D,G)表示优化后的损失函数收敛值,V(D,G)表示目标函数,E为期望运算符,G表示生成器,D表示判别器,z表示输入噪声,x表示真实数据,p(x)表示数据分布,G(z)表示虚假数据,D(x)表示估算的来自训练样本的真实数据x的概率,log(D(x))表示所述判别器被训练最大化,log(1-D(G(z)))表示所述生成器被训练最小化;
对所述训练样本集中的训练样本进行一次生成对抗网络训练,得到损失函数收敛值F(D,G),若所述损失函数收敛值F(D,G)为r,则再次进行生成对抗网络训练,直到得到的损失函数收敛值F(D,G)>r时,即当F(D,G)=r+At时,At表示收敛增值,停止训练。
2.如权利要求1所述的小样本高光谱图像分类方法,其特征在于,所述采用MCFSFDP聚类方法自适应确定所述测试样本中的核心样本,具体包括:
将所述测试样本作为聚类数据集,j表示所述聚类数据集中的数据点,且j的取值范围为[1,N];
计算每一个数据点j的局部密度ρj:
其中,ρj表示数据点j的局部密度,k表示数据点j之外的另一个数据点,djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离,dc表示截断距离;当djk-dc<0时,则χ(djk-dc)=1,否则χ(djk-dc)=0,χ(·)表示判断函数;
δj表示数据点j与比所述数据点j的局部密度高的所有数据点之间的最近距离,如公式(2)所示:
其中,ρk表示数据点k的局部密度;djk=dist(j,k)表示数据点j和数据点k之间的欧氏距离;
对于拥有最大局部密度的数据点,其距离为所有数据点与数据点之间的距离的最大值δj=maxk(dkj);dkj为数据点k与数据点j之间的欧氏距离;
对于每个数据点j,都有与其对应的密度值ρj和距离值δj;距离阈值δ为选择数据点为聚类结果的唯一标准,则有:
numv=f(δv) (3)
其中,δv表示所有数据点的距离值,numv为δj≥δv的数据点j的个数;
对公式(3)求微分得到:
conv=[f(δv+1)-f(δv)]/(δv+1-δv) (4)
其中,conv为数据点个数与距离值的微分;δv和δv+1表示拥有数据点的距离阈值的相邻值,且δv+1>δv;
对公式(4)中的距离阈值的相邻值δv和δv+1上的conv与conv+1做商,再对结果求绝对值,即有:
quov=|conv/conv+1| (5)
quov表示两个相邻距离阈值上微分的商的绝对值;
当在某距离阈值区间δr(δv-1,δv,δv+1)上的数据点数numv趋近稳定时,在这个距离阈值区间的距离阈值δv上存在quov的局部极大值,则将当前的距离阈值δv确定为自适应距离阈值δA;
当数据点j的距离δj>δA时,所述数据点j被选择为聚类中心点,所述聚类中心点即为所述核心样本,并对所述核心样本的类别进行人为标注,得到自适应确定的核心样本。
3.如权利要求1所述的小样本高光谱图像分类方法,其特征在于,所述收敛增值At的取值为0.5。
4.如权利要求1所述的小样本高光谱图像分类方法,其特征在于,所述将所述训练样本数据集代入至BP神经网络模型中进行训练,得到最终的BP神经网络模型,具体包括:
将所述训练样本数据集中的各个训练样本代入至BP神经网络模型;
不断误差反馈、迭代更新所述BP神经网络模型的权重;
将最大迭代次数设置为1000次,当达到最大迭代次数时完成训练,得到最终的BP神经网络模型。
5.如权利要求4所述的小样本高光谱图像分类方法,其特征在于,所述BP神经网络模型包括一个输入层、三个隐含层和一个Softmax分类器;所述BP神经网络模型的每一个输入节点代表高光谱图像样本中的一个元素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110244446.9A CN112966740B (zh) | 2021-03-05 | 2021-03-05 | 基于核心样本自适应扩充的小样本高光谱图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110244446.9A CN112966740B (zh) | 2021-03-05 | 2021-03-05 | 基于核心样本自适应扩充的小样本高光谱图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966740A CN112966740A (zh) | 2021-06-15 |
CN112966740B true CN112966740B (zh) | 2024-03-29 |
Family
ID=76276627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110244446.9A Active CN112966740B (zh) | 2021-03-05 | 2021-03-05 | 基于核心样本自适应扩充的小样本高光谱图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966740B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569632A (zh) * | 2021-06-16 | 2021-10-29 | 西安电子科技大学 | 一种基于wgan的小样本地面慢速运动目标分类方法 |
CN113298184B (zh) * | 2021-06-21 | 2022-09-02 | 哈尔滨工程大学 | 用于小样本图像识别的样本抽取、扩充方法及存储介质 |
CN114419033A (zh) * | 2022-03-15 | 2022-04-29 | 深圳市信润富联数字科技有限公司 | 缺陷识别方法、装置、电子装置及可读存储介质 |
CN116503385B (zh) * | 2023-06-25 | 2023-09-01 | 吉林大学 | 基于虚拟全局代理的糖网眼底图像分级方法和设备 |
CN117476125B (zh) * | 2023-12-27 | 2024-04-05 | 豆黄金食品有限公司 | 一种基于数据分析的腐竹余液回收数据处理系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805188A (zh) * | 2018-05-29 | 2018-11-13 | 徐州工程学院 | 一种基于特征重标定生成对抗网络的图像分类方法 |
CN109978071A (zh) * | 2019-04-03 | 2019-07-05 | 西北工业大学 | 基于数据增广和分类器融合的高光谱图像分类方法 |
CN110097103A (zh) * | 2019-04-22 | 2019-08-06 | 西安电子科技大学 | 基于生成对抗网络的半监督图像分类方法 |
CN110852227A (zh) * | 2019-11-04 | 2020-02-28 | 中国科学院遥感与数字地球研究所 | 高光谱图像深度学习分类方法、装置、设备及存储介质 |
CN112016395A (zh) * | 2020-07-14 | 2020-12-01 | 华北电力大学(保定) | 一种基于cgan-cnn的同步电机转子匝间短路故障判别方法 |
-
2021
- 2021-03-05 CN CN202110244446.9A patent/CN112966740B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805188A (zh) * | 2018-05-29 | 2018-11-13 | 徐州工程学院 | 一种基于特征重标定生成对抗网络的图像分类方法 |
CN109978071A (zh) * | 2019-04-03 | 2019-07-05 | 西北工业大学 | 基于数据增广和分类器融合的高光谱图像分类方法 |
CN110097103A (zh) * | 2019-04-22 | 2019-08-06 | 西安电子科技大学 | 基于生成对抗网络的半监督图像分类方法 |
CN110852227A (zh) * | 2019-11-04 | 2020-02-28 | 中国科学院遥感与数字地球研究所 | 高光谱图像深度学习分类方法、装置、设备及存储介质 |
CN112016395A (zh) * | 2020-07-14 | 2020-12-01 | 华北电力大学(保定) | 一种基于cgan-cnn的同步电机转子匝间短路故障判别方法 |
Non-Patent Citations (3)
Title |
---|
丁晨.基于自适应卷积神经网络的高光谱图像分类方法研究.《中国博士学位论文全文数据库》.2020,第2-5章. * |
基于自适应卷积神经网络的高光谱图像分类方法研究;丁晨;《中国博士学位论文全文数据库》;第2-5章 * |
面向高光谱影像分类的生成式对抗网络;张鹏强;刘冰;余旭初;谭熊;杨帆;周增华;;测绘通报(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112966740A (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112966740B (zh) | 基于核心样本自适应扩充的小样本高光谱图像分类方法 | |
CN113378632B (zh) | 一种基于伪标签优化的无监督域适应行人重识别方法 | |
CN110163110B (zh) | 一种基于迁移学习和深度特征融合的行人重识别方法 | |
CN110837850B (zh) | 一种基于对抗学习损失函数的无监督域适应方法 | |
CN109583342B (zh) | 基于迁移学习的人脸活体检测方法 | |
CN111967294A (zh) | 一种无监督域自适应的行人重识别方法 | |
CN105844669B (zh) | 一种基于局部哈希特征的视频目标实时跟踪方法 | |
CN111814871A (zh) | 一种基于可靠权重最优传输的图像分类方法 | |
CN107633226B (zh) | 一种人体动作跟踪特征处理方法 | |
CN104952073B (zh) | 基于深度学习的镜头边缘检测方法 | |
CN106570851B (zh) | 一种基于加权分配d-s证据理论的显著图融合方法 | |
CN110929679A (zh) | 一种基于gan的无监督自适应行人重识别方法 | |
CN106951915A (zh) | 一种基于类别置信度的一维距离像多分类器融合识别法 | |
CN109785359B (zh) | 一种基于深度特征金字塔与跟踪损失的视频目标检测方法 | |
Shi et al. | Dual pseudo-labels interactive self-training for semi-supervised visible-infrared person re-identification | |
CN108921872B (zh) | 一种适用于长程跟踪的鲁棒性视觉目标跟踪方法 | |
CN112364881B (zh) | 一种进阶采样一致性图像匹配方法 | |
CN115861738A (zh) | 一种类别语义信息引导的遥感目标检测主动采样方法 | |
CN102236786A (zh) | 一种光照自适应的人体肤色检测方法 | |
CN115761408A (zh) | 一种基于知识蒸馏的联邦域适应方法及系统 | |
CN111144462A (zh) | 一种雷达信号的未知个体识别方法及装置 | |
CN116433909A (zh) | 基于相似度加权多教师网络模型的半监督图像语义分割方法 | |
CN113139564A (zh) | 关键点检测模型的训练方法、装置、电子设备及存储介质 | |
CN113033345B (zh) | 基于公共特征子空间的v2v视频人脸识别方法 | |
CN113065395A (zh) | 一种基于生成对抗网络的雷达目标新类检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |