CN112766161B - 基于集成约束多示例学习的高光谱目标检测方法 - Google Patents

基于集成约束多示例学习的高光谱目标检测方法 Download PDF

Info

Publication number
CN112766161B
CN112766161B CN202110074633.7A CN202110074633A CN112766161B CN 112766161 B CN112766161 B CN 112766161B CN 202110074633 A CN202110074633 A CN 202110074633A CN 112766161 B CN112766161 B CN 112766161B
Authority
CN
China
Prior art keywords
network
loss
equal
hyperspectral
feature extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110074633.7A
Other languages
English (en)
Other versions
CN112766161A (zh
Inventor
焦昶哲
李嘉铭
缑水平
王秀秀
毛莎莎
陈晓莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202110074633.7A priority Critical patent/CN112766161B/zh
Publication of CN112766161A publication Critical patent/CN112766161A/zh
Application granted granted Critical
Publication of CN112766161B publication Critical patent/CN112766161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于集成约束多示例学习的高光谱目标检测方法,用于解决现有技术对复杂场景下的高光谱目标检测效果差的问题,实现步骤为:1)获取训练样本集和测试样本集;2)构建集成约束多示例学习网络W;3)对集成约束多示例学习网络W进行迭代训练;4)获取高光谱的目标检测结果。本发明将集成约束与多示例学习相结合,使得包中每一个像素点都能参与到网络的训练过程中,提高了不精确标记的高光谱目标的检测结果,减小了过拟合现象,可用于爆炸物检测,精准农业,食物安全的分析与检查。

Description

基于集成约束多示例学习的高光谱目标检测方法
技术领域
本发明属于图像处理技术领域,涉及一种高光谱目标检测方法,具体涉及一种基于集成约束多示例学习的高光谱目标检测方法,可用于爆炸物检测、精准农业和食物安全等领域的分析与检查。
背景技术
高光谱图像(Hyperspectral Images,HSI)具有比一般图像更加优秀的分析能力,它在许多相邻接连且十分窄的光谱带中获取光谱曲线,光谱带通常跨过可见光、近红外和中红外部分,规模大致在0.4μm到2.5μm,这使得它可以为场景中的每个像素构建基本上接连的辐射光谱,传感器同时捕捉地上物质的空间信息,构成共同的三维立方体的数据形式。在高光谱数据中,每种地面物质都可以由一条单一的光谱曲线适当地表示,被称为“光谱签名”,用来表示每个场景中不同种类的物质的共同特性,这些特点使得高光谱数据在包含空间信息的同时可以含有丰富的光谱信息。
在高光谱目标分类任务中,存在两个主要挑战:1)光谱特征的空间变异性大;2)与高维高光谱数据相比,训练样本有限。第一个挑战通常是由许多因素带来的,比如光照、环境、大气和时间条件的变化。第二个挑战会导致某些方法出现不适定问题,降低分类器的泛化能力。
多示例学习第一次提出是被用于分子活性检测,麝香分子具有多种同分异构体,可以紧密附着在比本身大许多的分子上(如酶或者蛋白质)的结构被定义为活性分子,由于同分异构体的存在,其中只要一种或者几种分子结构是有效的。Ditterich等人通过将包括活性分子的都看作正包,非活性分子看作负包,分子作为包中的一个示例,来示现从包的等级学习有效的分子结构。由此开始,引出了多示例问题:假如一个包中包括目标点,则这个包的标签为正,若是包中全部为非目标点,则标签为负。问题的核心就是通过不精确标记的样本尝试得到精确的判断。这种特性使得多示例学习逐渐在图像检索、文本分类、目标检测等各个领域得到了广泛的应用。因此将高光谱不精确标记下的目标检测问题建模为多示例问题,近年来逐渐成为研究的热点。
目前多示例学习算法可以分为基于示例水平空间的多示例算法、基于嵌入空间的多示例算法和基于包水平的多示例算法。
基于示例水平空间的多示例算法主要有Andrews等人提出的mi-SVM算法,它首先通过把包的标签分给每个示例,基于所有的示例训练一个初始的标准SVM分类器,然后用该分类器重新对正包中的示例进行分类,当正包中所有的示例被标记为负时,就把其中置信度最大的那个示例分成正示例,基于这些标记为正的示例和所有负包中的示例重新训练分类器,不断训练和标记,直至标签不发生变化则停止。这种方法的不足之处在于当训练数据不平衡时,标准的SVM分类器难以获得良好的分类效果,且当数据量较大时,求解过程漫长。
基于嵌入空间的多示例算法主要有Yixin Chen等人提出的MILES算法,该算法通过将每个数据包映射到所有示例构成的空间的方式,获得每个包在该空间的特征映射,然后训练SVM分类器获得包级水平的分类器,测试时通过反推正包中每个示例对包的分类的贡献,确定正包中的正示例。这种方法存在的缺点是当获取的特征子集的规模非常大,就会导致整个映射阶段的计算量变得很大。因为特征子集的大小与整个算法的执行效率密切相关,所以上述情况下整个算法执行缓慢,学习过程也十分耗时,算法执行效率过低。特征子集中若含有一些对分类不起作用,或者说有效性信息很少的示例,它们不但会降低算法的执行效率,同时还可能影响算法的精度。
基于包水平的多示例算法主要有Leistner等人提出的MIForests方法,该方法把正包中各个示例的标签看作隐变量,利用了随机森林易并行、准确率高的优点,结合确定性退火算法,实现了多示例的随机森林树。相比于基于示例水平空间的多示例算法和基于嵌入空间的多示例算法,基于包水平的多示例算法能够有效提高分类的效率,且可以平衡不平衡数据带来的误差,但是在噪声较大的分类问题上容易产生过拟合,影响检测精度的进一步提升。为了减少过拟合对检测结果的影响,研发人员提出来一种对MIForests方法改进后的高光谱目标检测方法,该方法首先建立多示例深度卷积特征提取网络,得到一维向量特征集合,根据自注意力机制公式计算一维向量特征集的权重集合,并将一维向量特征集合与权重集合进行加权计算,得到包的代表性特征;然后将包的代表性特征送入建立的检测网络进行检测,得到检测结果。该方法引入带有L1正则约束的交叉熵损失函数Loss,使得非目标的像素点的权重趋于0,使目标像素和非目标像素具有区分度,但是因为聚合特征没有对包中所有示例进行学习,导致在噪声较大的分类问题上容易产生过拟合,检测精度仍然较低。
发明内容
本发明的目的是为了解决现有技术的不足,提出一种基于集成约束多示例学习的高光谱目标检测方法,用于解决现有技术中存在的检测精度较低的技术问题。
为实现上述目的,本发明采取的技术方案包括如下步骤:
(1)获取训练样本集和测试样本集:
(1a)从高光谱图像数据集中获取包含C种目标类别共N幅大小为W×H×Q高光谱图像A={An|1≤n≤N},每幅高光谱图像An至少包含一个目标,其中C≥2,N≥5,An表示第n幅高光谱图像,W和H分别表示An的行和列像素的个数,Q表示An的波段个数,W≥300,H≥300,Q≥72;
(1b)选取A中的m幅高光谱图像,并切割出每幅高光谱图像中标记为目标的区域作为正包,得到正包集合
Figure BDA0002907138820000031
将每幅高光谱图像中标记为非目标的区域作为负包,得到负包集合
Figure BDA0002907138820000032
集合Se +和集合Se -构成包集合Se,将Se中每个包中的每个像素作为一个示例,其中,
Figure BDA0002907138820000033
表示第e幅图像中第q个大小为a×b×Q的正包,P表示正包的个数,1≤P≤15,a≥5,b≥5,
Figure BDA0002907138820000034
表示第e幅图像中第p个负包;
(1c)将m幅高光谱图像正包和负包中的示例作为训练样本集,将其余N-m幅高光谱图像中的像素作为测试样本集;
(2)构建集成约束多示例学习网络W:
构建包括依次级联的特征提取子网络G和检测子网络fc,损失函数为Loss的集成约束多示例学习网络W;特征提取子网络G包括多个级联的特征提取模块,检测子网络fc包括依次连接的第一全连接层、LeakyReLU层、Dropout层、第二全连接层和Sigmoid层,Loss的表达式为:
Loss=Loss1+Loss2
Figure BDA0002907138820000035
Figure BDA0002907138820000036
Figure BDA0002907138820000037
其中,Loss1表示W的交叉熵损失函数,Loss2表示W的距离损失函数,∑表示求和,Li表示第i个包级别的真值,Yi表示第i个包的集成约束方式为
Figure BDA0002907138820000038
的检测概率,yij表示第i个包中第j个示例的检测概率,参数γ控制二者的融合方式,
Figure BDA0002907138820000041
表示最小值操作,
Figure BDA0002907138820000042
表示最大值操作,
Figure BDA0002907138820000043
表示平均值操作;
(3)对集成约束多示例学习网络W进行迭代训练:
(3a)设迭代次数为t,最大迭代次数为M,M≥500,当前集成约束多示例学习网络为Wt,并令t=1,Wt=W;
(3b)将训练样本集作为集成约束多示例学习网络Wt的输入进行前向传播,特征提取子网络G提取训练样本集每个像素的高层一维向量特征,得到一维向量特征集合H={Hij|1≤i≤(m×(P+1)),1≤j≤(a×b)},检测子网络fc对一维向量特征集合H进行检测,得到目标示例的检测概率yij,其中Hij表示第i个包中第j个示例对应的特征;
(3c)对目标示例的检测概率yij进行
Figure BDA0002907138820000044
方式的集成约束,得到检测概率Yi,并采用损失函数Loss,通过yij和Yi计算Wt的损失值Losst,然后采用随机梯度下降法,并通过损失值Losst对特征提取子网络G的权值
Figure BDA0002907138820000045
检测子网络fc的权值
Figure BDA0002907138820000046
进行更新,得到更新后的Wt
(3d)判断t=M是否成立,若是,得到训练好的集成约束多示例学习网络W*,否则,令t=t+1,并执行步骤(3b);
(4)获取高光谱的目标检测结果:
将测试样本集作为训练好的集成约束多示例学习网络W*的输入进行目标检测,得到目标分类与位置的预测结果。
本发明与现有技术相比,具有以下优点:
本发明所构建的集成约束多示例学习网络包括依次级联的特征提取子网络和检测子网络,在模型进行训练的过程中,通过特征提取子网络提取训练样本集每个像素的高层一维向量特征,得到一维向量特征集合,检测子网络对一维向量特征集合进行检测,得到目标示例的检测概率,对目标示例的检测概率进行集成约束,得到包的检测概率,集成约束与多示例学习相结合,使得包中每一个像素点都能参与到网络的训练过程中,增强了泛化能力,且在损失函数中加入了距离损失函数,能够约束正包与负包的区别,使目标像素和非目标像素更加具有区分度,可以更好地平衡不平衡数据带来的误差,与现有技术相比,在保证检测效率的前提下,有效地提高了噪声较大的图像分类问题的检测精度。
附图说明
图1是本发明的实现流程图;
图2是本发明仿真实验采用的高光谱图像目标标记的示意图。
具体示施方式
以下结合附图和具体实施例,对本发明作进一步详细描述。
参照图1,本发明包括如下步骤:(2个点加入)
步骤1)获取训练样本集和测试样本集:
步骤1a)从高光谱图像数据集中获取包含C种目标类别共N幅大小为W×H×Q高光谱图像A={An|1≤n≤N},每幅高光谱图像An至少包含一个目标,其中C≥2,N≥5,An表示第n幅高光谱图像,W和H分别表示An的行和列像素的个数,Q表示An的波段个数,W≥300,H≥300,Q≥72;本实例中,C=4,N=5,W=325,H=337,Q=72;
步骤1b)选取A中的m幅高光谱图像,并切割出每幅高光谱图像中标记为目标的区域作为正包,得到正包集合
Figure BDA0002907138820000051
将每幅高光谱图像中标记为非目标的区域作为负包,得到负包集合
Figure BDA0002907138820000052
集合Se +和集合Se -构成包集合Se,将Se中每个包中的每个像素作为一个示例,其中,
Figure BDA0002907138820000053
表示第e幅图像中第q个大小为a×b×Q的正包,P表示正包的个数,1≤P≤15,a≥5,b≥5,
Figure BDA0002907138820000054
表示第e幅图像中第p个负包;本实施例中,a=5,b=5,m=4,有四种不同颜色棕色(Brown),豌豆绿色(Pea Green),浅绿色(Dark Green)与人造葡萄园绿色(Faux Vineyard Green,FVG)的目标,除FVG类别的每幅图像包含P数目为12个,其余种类每幅P数目均为15个目标;
步骤1c)将m幅高光谱图像正包和负包中的示例作为训练样本集,将其余N-m幅高光谱图像中的像素作为测试样本集;本实施例中,训练样本集包含4幅高光谱图像,测试样本集包含1幅高光谱图像;
步骤2)构建集成约束多示例学习网络W:
构建包括依次级联的特征提取子网络G和检测子网络fc,损失函数为Loss的集成约束多示例学习网络W;其中,特征提取子网络G包括多个级联的特征提取模块,本发明中特征提取子网络G包括5个特征提取模块,特征提取模块的数量为5个,其中,第一、第二和第五特征提取模块均包括层叠的一维卷积层、激活函数层和最大池化层,第三和第四特征提取模块均包括层叠的一维卷积层与激活函数层。模块中一维卷积层的卷积核的大小均为1×3,卷积核步长为1,卷积核数量大于20,激活函数层使用的是函数LeakyReLU。LeakyReLU激活函数与最大池化层分别实现非线性映射和降维处理,深度神经网络多层的连接关系是矩阵的乘积关系,引入了非线性激活函数后增加了网络的非线性,最大池化层可以对特征进行降维,避免特征向量过大,模型参数过多,不易训练,同时保留不变性特征,检测子网络fc包括依次连接的第一全连接层、LeakyReLU层、Dropout层、第二全连接层和Sigmoid层,Loss的表达式为:
Loss=Loss1+Loss2
Figure BDA0002907138820000061
Figure BDA0002907138820000062
Figure BDA0002907138820000063
其中,Loss1表示W的交叉熵损失函数,Loss2表示W的距离损失函数,∑表示求和,Li表示第i个包级别的真值,Yi表示第i个包的集成约束方式为
Figure BDA0002907138820000064
的检测概率,yij表示第i个包中第j个示例的检测概率,参数γ控制二者的融合方式,
Figure BDA0002907138820000065
表示最小值操作,
Figure BDA0002907138820000066
表示最大值操作,
Figure BDA0002907138820000067
表示平均值操作;
对于Yi表示第i个包的集成约束方式为
Figure BDA0002907138820000068
的检测概率,设计三种参数γ的参与方式,第一种是对γ取0.3,将该方法命名为fc_mil-valid,第二种是设置其为网络模型中的变量,参与网络的训练,将该方法命名为fc_mil-learning,第三种是设计一种随着迭代次数增加,γ的值随之变化的方式,将该方法命名为fc_mil-change。
对于fc_mil-change方法,此处参考深度学习中的学习率衰减策略,对于γ的值使其可以随着迭代次数增多,其值逐渐增大,然后接近于1。
γ=1-init_rate×decay_rateepoch/10
其中init_rate为初始值1.0,decay_rate为指数运算的底数值0.95,控制γ变化速度,epoch为迭代次数,通过所设计的公式的γ变化方式,使得集成约束随着迭代次数的变化而改变,有效完成示例级别目标检测网络的训练;
将集成约束与多示例学习相结合,使得包中每一个像素点都能参与到网络的训练过程中,增强了泛化能力,在损失函数中加入了距离损失函数,能够约束正包与负包的区别,使目标像素和非目标像素更加具有区分度,可以更好地平衡不平衡数据带来的误差;
步骤3)对集成约束多示例学习网络W进行迭代训练:
步骤3a)设迭代次数为t,最大迭代次数为M,M≥500,当前集成约束多示例学习网络为Wt,并令t=1,Wt=W;
步骤3b)将训练样本集作为集成约束多示例学习网络Wt的输入进行前向传播,特征提取子网络G提取训练样本集每个像素的高层一维向量特征,得到一维向量特征集合H={Hij|1≤i≤(m×(P+1)),1≤j≤(a×b)},检测子网络fc对一维向量特征集合H进行检测,得到目标示例的检测概率yij,其中Hij表示第i个包中第j个示例对应的特征;
步骤3c)对目标示例的检测概率yij进行
Figure BDA0002907138820000071
方式的集成约束,得到检测概率Yi,并采用损失函数Loss,通过yij和Yi计算Wt的损失值Losst,然后采用随机梯度下降法,并通过损失值Losst对特征提取子网络G的权值
Figure BDA0002907138820000072
检测子网络fc的权值
Figure BDA0002907138820000073
进行更新,得到更新后的Wt,更新公式分别为:
Figure BDA0002907138820000074
Figure BDA0002907138820000075
其中η表示梯度下降参数,
Figure BDA0002907138820000076
表示更新后的特征提取子网络G参数,
Figure BDA0002907138820000077
表示更新前的特征提取子网络G参数,
Figure BDA0002907138820000078
表示更新后的检测子网络fc参数,
Figure BDA0002907138820000079
表示更新前的检测子网络fc,
Figure BDA00029071388200000710
表示求导操作;
步骤3d)判断t=M是否成立,若是,得到训练好的集成约束多示例学习网络W*,否则,令t=t+1,并执行步骤3b);
步骤4)获取高光谱的目标检测结果:
将测试样本集作为训练好的集成约束多示例学习网络W*的输入进行目标检测,得到目标分类与位置的预测结果。
以下结合仿真实验,对本发明的技术效果作进一步说明。
1.仿真条件和内容:
本实验使用的服务器配置为3.2GHz的Intel i5-6500 CPU和一张12-GB的NVIDIATitan-X GPU,使用PyTorch代码框架实现深度网络模型,开发语言为Python 3.6。
仿真所用的图像是不同时间的五个航次的同一场景的五幅高光谱图像,每一幅图像的尺寸为325×337,包含72个波段,光谱范围从367.7nm到1043.4nm,其中,每幅图像中目标类别有四类,分别是A、B、C、D四个目标。如图2所示,其中A目标用圆形表示,B目标用菱形表示,C目标用三角形表示,D目标用矩形表示。将第一幅高光谱图像、第二幅高光谱图像、第三幅高光谱图像和第四幅高光谱图像作为训练集,第五幅高光谱图像作为测试集;
对本发明和基于L1正则约束深度多示例学习的高光谱目标检测方法在本发明所获取的测试数据集的A、B、C和D目标的ROC曲线的NAUC值进行对比,结果如表1。
2.仿真结果分析:
表1
Figure BDA0002907138820000081
由表1可以看出,本方法提出的基于集成约束多示例学习的高光谱目标检测方法相比于现有的基于L1正则约束深度多示例学习的高光谱目标检测方法,NAUC提升了明显,说明本方法有效缓解了在噪声较大的分类问题上引起的模型过拟合现象,从而提升了目标检测精度,因而具有重要的实际意义。

Claims (3)

1.一种基于集成约束多示例学习的高光谱目标检测方法,其特征在于,包括如下步骤:
(1)获取训练样本集和测试样本集:
(1a)从高光谱图像数据集中获取包含C种目标类别共N幅大小为W×H×Q高光谱图像A={An|1≤n≤N},每幅高光谱图像An至少包含一个目标,其中C≥2,N≥5,An表示第n幅高光谱图像,W和H分别表示An的行和列像素的个数,Q表示An的波段个数,W≥300,H≥300,Q≥72;
(1b)选取A中的m幅高光谱图像,并切割出每幅高光谱图像中标记为目标的区域作为正包,得到正包集合
Figure FDA0002907138810000011
将每幅高光谱图像中标记为非目标的区域作为负包,得到负包集合
Figure FDA0002907138810000012
集合Se +和集合Se -构成包集合Se,将Se中每个包中的每个像素作为一个示例,其中,
Figure FDA0002907138810000013
Figure FDA0002907138810000014
表示第e幅图像中第q个大小为a×b×Q的正包,P表示正包的个数,1≤P≤15,a≥5,b≥5,
Figure FDA0002907138810000015
表示第e幅图像中第p个负包;
(1c)将m幅高光谱图像正包和负包中的示例作为训练样本集,将其余N-m幅高光谱图像中的像素作为测试样本集;
(2)构建集成约束多示例学习网络W:
构建包括依次级联的特征提取子网络G和检测子网络fc,损失函数为Loss的集成约束多示例学习网络W;特征提取子网络G包括多个级联的特征提取模块,检测子网络fc包括依次连接的第一全连接层、LeakyReLU层、Dropout层、第二全连接层和Sigmoid层,Loss的表达式为:
Loss=Loss1+Loss2
Figure FDA0002907138810000016
Figure FDA0002907138810000017
Figure FDA0002907138810000021
其中,Loss1表示W的交叉熵损失函数,Loss2表示W的距离损失函数,∑表示求和,Li表示第i个包级别的真值,Yi表示第i个包的集成约束方式为
Figure FDA0002907138810000022
的检测概率,yij表示第i个包中第j个示例的检测概率,参数γ控制二者的融合方式,
Figure FDA0002907138810000023
表示最小值操作,
Figure FDA0002907138810000024
表示最大值操作,
Figure FDA0002907138810000025
表示平均值操作;
(3)对集成约束多示例学习网络W进行迭代训练:
(3a)设迭代次数为t,最大迭代次数为M,M≥500,当前集成约束多示例学习网络为Wt,并令t=1,Wt=W;
(3b)将训练样本集作为集成约束多示例学习网络Wt的输入进行前向传播,特征提取子网络G提取训练样本集每个像素的高层一维向量特征,得到一维向量特征集合H={Hij|1≤i≤(m×(P+1)),1≤j≤(a×b)},检测子网络fc对一维向量特征集合H进行检测,得到目标示例的检测概率yij,其中Hij表示第i个包中第j个示例对应的特征;
(3c)对目标示例的检测概率yij进行
Figure FDA0002907138810000026
方式的集成约束,得到检测概率Yi,并采用损失函数Loss,通过yij和Yi计算Wt的损失值Losst,然后采用随机梯度下降法,并通过损失值Losst对特征提取子网络G的权值
Figure FDA0002907138810000027
检测子网络fc的权值
Figure FDA0002907138810000028
进行更新,得到更新后的Wt
(3d)判断t=M是否成立,若是,得到训练好的集成约束多示例学习网络W*,否则,令t=t+1,并执行步骤(3b);
(4)获取高光谱的目标检测结果:
将测试样本集作为训练好的集成约束多示例学习网络W*的输入进行目标检测,得到目标分类与位置的预测结果。
2.根据权利要求1所述的基于集成约束多示例学习的高光谱目标检测方法,其特征在于,步骤(2)中所述的特征提取子网络G,包括的特征提取模块的数量为5个,其中,第一、第二和第五特征提取模块均包括层叠的一维卷积层、激活函数层和最大池化层,第三和第四特征提取模块均包括层叠的一维卷积层与激活函数层。
3.根据权利要求1所述的基于集成约束多示例学习的高光谱目标检测方法,其特征在于,步骤(3c)中所述的对特征提取子网络G的权值
Figure FDA0002907138810000031
检测子网络fc的权值
Figure FDA0002907138810000032
进行更新,更新公式分别为:
Figure FDA0002907138810000033
Figure FDA0002907138810000034
其中,η表示梯度下降参数,
Figure FDA0002907138810000035
表示更新后的特征提取子网络G的权值,
Figure FDA0002907138810000036
表示更新后的检测子网络fc的权值,
Figure FDA0002907138810000037
表示求导操作。
CN202110074633.7A 2021-01-20 2021-01-20 基于集成约束多示例学习的高光谱目标检测方法 Active CN112766161B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110074633.7A CN112766161B (zh) 2021-01-20 2021-01-20 基于集成约束多示例学习的高光谱目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110074633.7A CN112766161B (zh) 2021-01-20 2021-01-20 基于集成约束多示例学习的高光谱目标检测方法

Publications (2)

Publication Number Publication Date
CN112766161A CN112766161A (zh) 2021-05-07
CN112766161B true CN112766161B (zh) 2022-12-02

Family

ID=75703507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110074633.7A Active CN112766161B (zh) 2021-01-20 2021-01-20 基于集成约束多示例学习的高光谱目标检测方法

Country Status (1)

Country Link
CN (1) CN112766161B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723482B (zh) * 2021-08-20 2024-04-02 西安电子科技大学 基于多示例孪生网络的高光谱目标检测方法
CN113887652B (zh) * 2021-10-20 2023-04-28 西安电子科技大学 基于形态和多示例学习的遥感图像弱小目标检测方法
CN114187528B (zh) * 2021-11-28 2022-12-23 中国电子科技集团公司第二十研究所 基于多示例空谱信息联合提取的高光谱目标检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839084A (zh) * 2014-03-12 2014-06-04 湖州师范学院 一种应用于行人再识别的多核支持向量机多示例学习算法
CN106127247A (zh) * 2016-06-21 2016-11-16 广东工业大学 基于多任务多示例支持向量机的图像分类方法
CN106504255A (zh) * 2016-11-02 2017-03-15 南京大学 一种基于多标签多示例学习的多目标图像联合分割方法
CN110210412A (zh) * 2019-06-04 2019-09-06 河海大学 一种基于深度学习和多示例学习的高光谱影像分类方法
CN110688968A (zh) * 2019-09-30 2020-01-14 西安电子科技大学 基于多示例深度卷积记忆网络的高光谱目标检测方法
CN111368917A (zh) * 2020-03-04 2020-07-03 西安邮电大学 一种用于刑侦图像分类的多示例集成学习方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5776694B2 (ja) * 2010-09-09 2015-09-09 日本電気株式会社 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839084A (zh) * 2014-03-12 2014-06-04 湖州师范学院 一种应用于行人再识别的多核支持向量机多示例学习算法
CN106127247A (zh) * 2016-06-21 2016-11-16 广东工业大学 基于多任务多示例支持向量机的图像分类方法
CN106504255A (zh) * 2016-11-02 2017-03-15 南京大学 一种基于多标签多示例学习的多目标图像联合分割方法
CN110210412A (zh) * 2019-06-04 2019-09-06 河海大学 一种基于深度学习和多示例学习的高光谱影像分类方法
CN110688968A (zh) * 2019-09-30 2020-01-14 西安电子科技大学 基于多示例深度卷积记忆网络的高光谱目标检测方法
CN111368917A (zh) * 2020-03-04 2020-07-03 西安邮电大学 一种用于刑侦图像分类的多示例集成学习方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《Deep Multiple Instance Learning Ensemble for the Acoustic Detection of Tropical Birds》;Jorge Castro等;《2020 19th IEEE International Conference on Machine Learning and Applications (ICMLA)》;20201231;第264-269页 *
《Multi-Instance Learning with Discriminative Bag Mapping》;Jia Wu等;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》;20180630;第30卷(第6期);第1065-1080页 *
《基于稀疏编码和集成学习的多示例多标记图像分类方法》;宋相法等;《电子与信息学报》;20130331;第35卷(第3期);第622-626页 *
《融合包空间和示例空间特征的多示例学习》;李宗民等;《计算机辅助设计与图形学学报》;20180531;第30卷(第5期);第851-858页 *

Also Published As

Publication number Publication date
CN112766161A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
Ghaderizadeh et al. Hyperspectral image classification using a hybrid 3D-2D convolutional neural networks
CN112766161B (zh) 基于集成约束多示例学习的高光谱目标检测方法
Guirado et al. Deep-learning versus OBIA for scattered shrub detection with Google earth imagery: Ziziphus Lotus as case study
Guidici et al. One-Dimensional convolutional neural network land-cover classification of multi-seasonal hyperspectral imagery in the San Francisco Bay Area, California
US11783569B2 (en) Method for classifying hyperspectral images on basis of adaptive multi-scale feature extraction model
CN110717553B (zh) 一种基于自衰减权重和多局部约束的交通违禁品识别方法
Liu et al. SVM or deep learning? A comparative study on remote sensing image classification
CN109145992B (zh) 协作生成对抗网络和空谱联合的高光谱图像分类方法
Lv et al. Iterative training sample expansion to increase and balance the accuracy of land classification from VHR imagery
CN103971123B (zh) 基于线性回归与Fisher判别字典学习的高光谱图像分类方法
CN102324047B (zh) 基于稀疏核编码skr的高光谱图像地物识别方法
CN108830188A (zh) 基于深度学习的车辆检测方法
CN106503739A (zh) 联合光谱和纹理特征的高光谱遥感影像svm分类方法及系统
Rahaman et al. An efficient multilevel thresholding based satellite image segmentation approach using a new adaptive cuckoo search algorithm
CN106845430A (zh) 基于加速区域卷积神经网络的行人检测与跟踪方法
CN110309780A (zh) 基于bfd-iga-svm模型的高分辨率影像房屋信息快速监督识别
CN108280396A (zh) 基于深度多特征主动迁移网络的高光谱图像分类方法
Doi et al. The effect of focal loss in semantic segmentation of high resolution aerial image
CN107895136A (zh) 一种煤矿区域识别方法及系统
Gudžius et al. Deep learning-based object recognition in multispectral satellite imagery for real-time applications
CN111639697B (zh) 基于非重复采样与原型网络的高光谱图像分类方法
CN111222545B (zh) 基于线性规划增量学习的图像分类方法
Rajendran et al. Hyperspectral image classification model using squeeze and excitation network with deep learning
Qamar et al. Pixel-wise classification of high-resolution ground-based urban hyperspectral images with convolutional neural networks
Asming et al. Processing and classification of landsat and sentinel images for oil palm plantation detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant