CN113065520A - 一种面向多模态数据的遥感图像分类方法 - Google Patents

一种面向多模态数据的遥感图像分类方法 Download PDF

Info

Publication number
CN113065520A
CN113065520A CN202110449967.8A CN202110449967A CN113065520A CN 113065520 A CN113065520 A CN 113065520A CN 202110449967 A CN202110449967 A CN 202110449967A CN 113065520 A CN113065520 A CN 113065520A
Authority
CN
China
Prior art keywords
model
remote sensing
learning
detection model
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110449967.8A
Other languages
English (en)
Inventor
张涛
张占杰
金波
周磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Research Center Of Digital City Engineering
Jiangnan University
Original Assignee
Shenzhen Research Center Of Digital City Engineering
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Research Center Of Digital City Engineering, Jiangnan University filed Critical Shenzhen Research Center Of Digital City Engineering
Priority to CN202110449967.8A priority Critical patent/CN113065520A/zh
Publication of CN113065520A publication Critical patent/CN113065520A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种面向多模态数据的遥感图像分类方法,包括,基于自步学习策略建立场景目标检测模型,并通过场景目标检测模型进行跨模态学习;基于搜索策略和场景目标检测模型构建深度网络检测模型,通过深度网络检测模型对多模态信息进行处理;基于深度网络检测模型与自步学习策略构建多任务学习模型,利用多任务学习模型对遥感图像进行分类;本发明结合深度学习的训练方法与优化方法构建多任务学习模型,通过多任务学习模型实现遥感图像的准确分类,并且多任务学习模型的误差损失较小。

Description

一种面向多模态数据的遥感图像分类方法
技术领域
本发明涉及图像处理和神经网络的技术领域,尤其涉及一种面向多模态数据的遥感图像分类方法。
背景技术
遥感图像分类算法主要分为以下几类:无监督分类,主要是建立统计识别函数,根据典型样本训练方法进行分类的技术。非监督分类,以不同影像在特征空间中类别特征的差别为依据的一种无先验类别标准的图像分类,主要以集群理论为基础,代表性的如K-mean。神经网络图像分类法,主要通过模人脑神经元对信息进行加工、处理、储存、搜索的过程,此方法不需要进行任何统计分布的先验知识。模糊聚类分类法,主要以一种模糊数学的方法,对不确定性事物进行分析。决策树分类法,利用决策树分类法的树结构原则,定义每个分支,由上而下,根据各个类别的相似程度,逐级向上聚类的过程。专家系统分类法,主要是以专家的经验和是知识以某种形式形成知识库。支持向量机分类法,这是一种有监督的学习模型,通常应用于对对象进行模式识别,能够相对更好的平衡模型中的复杂性和学习能力。面向对象的分类法,通常用于解读高分辨率和纹理影像数据的纹理特征,通过与现实世界中建立关系以达到真正的相互匹配,并以此利用基于像元分类中几乎不可利用的背景信息。
现有的图像分类方法需要对目标图像进行人工特征描述和提取,难以解决了人工提取特征和分类器选择的难题。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种面向多模态数据的遥感图像分类方法,解决了传统的多模态模型中没有明确的目标给模型去发现跨模态之间的相关性和只有一个模态用于监督训练和测试的问题。
为解决上述技术问题,本发明提供如下技术方案:包括,基于自步学习策略建立场景目标检测模型,并通过所述场景目标检测模型进行跨模态学习;基于搜索策略和所述场景目标检测模型构建深度网络检测模型,通过所述深度网络检测模型对多模态信息进行处理;基于所述深度网络检测模型与所述自步学习策略构建多任务学习模型,利用所述多任务学习模型对遥感图像进行分类。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:建立所述场景目标检测模型包括,构建深度网络模型;基于强化学习设计优化策略A,对所述深度网络模型进行优化;基于所述自步学习策略设计优化策略B,对优化后的深度网络模型进行正则化处理,生成所述场景目标检测模型;其中,所述深度网络模型由n个流构成,即为n个图像信息、n个音频信息和n个文本信息,每个流都由6个层组成,分别是1个输入层、4个中间层和1个输出层。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:所述优化策略A包括,在数据生成阶段,利用Q网络与数据所在的网络环境进行交互;通过所述深度网络模型观察当前数据网络层,并使用ε-贪心算法进行检测和优化;在训练阶段,所述深度网络模型会利用存储在重放记忆M中的数据来对网络进行训练,更新模型参数。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:所述优化策略B包括,定义目标函数如下:
Figure BDA0003038290900000021
通过目标函数对所述优化后的深度网络模型进行所述正则化处理,使所述优化后的深度网络模型稀疏,进而获得所述场景目标检测模型;
其中,xi,yi∈Rm为双时相遥感图像中的对应像素,m为频带数,n为像素总数,x和y是融入专家知识后的筛选后的像素区域,ω为权值,T为矩阵的转置,i为像素区域的横坐标,j为像素区域的纵坐标。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:构建所述深度网络检测模型包括,通过设计深度网络检测模型的强化学习机制和优化策略,训练场景目标检测模型的参数;设计深度网络检测模型特征的降维算法,以求取卷积后的高层特征v的投影矩阵。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:所述强化学习机制和优化策略包括,定义y为深度网络检测模型检测到的窗口,窗口y的数据分布p(y)如下式:
Figure BDA0003038290900000031
根据下式固定所述深度网络检测模型被降解的底层分布,使得所述窗口y的数据分布p(v)达到最优:
Figure BDA0003038290900000032
逐层训练深度网络检测模型的模型参数,获得概率分布如下:
Figure BDA0003038290900000033
Figure BDA0003038290900000034
其中,x为继续贝叶斯降解后的低层特征,q(x)为图像信息、音频信息和文本信息上的经验分布,p(y|v)为深度网络检测模型被降解的底层分布,p(v)为深度网络检测模型被降解高层的分布;p(s|v)为卷积后的高层特征分布;s为层数,yvisi代表p(y|v,s),α代表映射关系,i表示具体的层数,k,j∈n且k≠j,k和j表示n层中随机两层之间的关系,
Figure BDA0003038290900000035
表示层si+1和si之间的相关性,
Figure BDA0003038290900000036
是投票函数和其他部分之间的相关性的权值,
Figure BDA0003038290900000037
Figure BDA0003038290900000038
表示偏置项。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:所述降维算法包括,利用同类样本的稀疏表示构造图,通过所述构造图描述样本间的稀疏重构关系;基于所述稀疏重构关系,利用非参数离差矩阵来提取类间鉴别信息;通过求解广义特征值问题求得所述卷积后的高层特征v的投影矩阵。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:构建所述多任务学习模型包括,基于所述深度网络检测模型与所述自步学习策略搭建卷积神经网络框架;基于卷积神经网络框架建立多尺度轻量化的深度学习模型,对所述遥感图像进行多阶段检测;建立基于强化学习与自步学习的优化控制策略,引导所述多尺度轻量化的深度学习模型完成遥感图像样本的学习。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:所述多尺度轻量化的深度学习模型包括,通过所述深度网络模型检测后生成大量的候选检测窗口;利用带标记的场景样本训练所述深度网络模型,提取网络中每一个卷积层的特征,并将特征进行级联;利用基于决策树的级联AdaBoost分类器对所述每一个卷积层的特征分别进行训练,将第一个卷积层得到的特征送入k1个弱分类器,通过第二个卷积层训练k2个弱分类器,若网络中共有N个卷积层,则训练得到N个分类器模型H(x),即多尺度轻量化的深度学习模型:
Figure BDA0003038290900000041
其中,x表示候选窗口样本,
Figure BDA0003038290900000042
表示在第i个卷积层上的第j个弱分类器。
作为本发明所述的面向多模态数据的遥感图像分类方法的一种优选方案,其中:所述优化控制策略包括,将数据网络层的属性特征加入到奖赏函数中,通过奖赏塑形策略丰富属性特征包含的信息量。
本发明的有益效果:本发明结合深度学习的训练方法与优化方法构建多任务学习模型,通过多任务学习模型实现遥感图像的准确分类,并且多任务学习模型的误差损失较小。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的一种面向多模态数据的遥感图像分类方法的深度网络模型结构示意图;
图2为本发明第二个实施例所述的一种面向多模态数据的遥感图像分类方法的帕维亚中心的遥感数据示意图;
图3为本发明第二个实施例所述的一种面向多模态数据的遥感图像分类方法的帕维亚中心遥感图片的标注数据示意图;
图4为本发明第二个实施例所述的一种面向多模态数据的遥感图像分类方法的帕维亚大学的遥感数据示意图;
图5为本发明第二个实施例所述的一种面向多模态数据的遥感图像分类方法的帕维亚大学遥感图片的标注数据示意图;
图6为本发明第二个实施例所述的一种面向多模态数据的遥感图像分类方法的AlexNet模型训练的损失函数与精度曲线示意图;
图7为本发明第二个实施例所述的一种面向多模态数据的遥感图像分类方法的训练损失函数与精度曲线示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明的第一个实施例,该实施例提供了一种面向多模态数据的遥感图像分类方法,包括:
S1:基于自步学习策略建立场景目标检测模型,并通过场景目标检测模型进行跨模态学习。
需要说明的是,自步学习策略是在每次迭代过程中倾向于从所有样本中选择具有很小的训练误差、高似然值的样本,然后更新模型参数;每次迭代选择样本的数量由权重参数确定,该参数通过逐次衰减实现引入更多的样本,当所有样本已被选择或者代价函数无法再降低则停止迭代。
建立场景目标检测模型的步骤如下:
(1)构建深度网络模型;
参照图1,本实施例面向多模态构建的深度网络模型由n个流(stream)构成,即为n个图像信息、n个音频信息和n个文本信息,这n个流的结构是完全相同的,每个流都由6个层组成,分别是1个输入层、4个中间层和1个输出层。
(2)基于强化学习设计优化策略A,对深度网络模型进行优化;
传统的多模态模型存在两个问题,第一,没有明确的目标提供给模型去发现跨模态间的相关性;第二,在跨模态学习布置中只有一个模态用于监督训练和测试,这样的模型显得很笨拙;因此,本实施例基于强化学习设计优化策略A,对深度网络模型进行优化。
具体的,优化策略A如下:
①在数据生成阶段,利用Q网络与数据所在的网络环境进行交互;
需要说明的是,Q网络(Depp Q-Network,DQN)是一个深度强化学习算法,其利用神经网络对图像的强大的表征能力,把视频帧数据作为强化学习中的状态,并作为神经网络模型的输入;随后神经网络模型输出每个动作对应的价值(Q值),得到要执行的动作。
此处的数据为图像信息、音频信息和文本信息。
②通过深度网络模型观察当前数据网络层,并使用ε-贪心算法进行检测和优化;
ε-贪心算法基于一个概率来对探索和利用进行折中:每次尝试时以ε的概率进行探索,以1-ε的概率进行利用。
③在训练阶段,深度网络模型会利用存储在重放记忆M中的数据来对网络进行训练,更新模型参数。
假设超参数n表示经历重放的数量,对于每一次经历重放,都会从有限大小的重放记忆M中随机采样出一个包含若干次交互经历的迷你缓存器B;该深度网络模型会在从缓存器B中采样进行训练,该深度网络模型的参数会在贝尔曼目标的方向上迭代式地更新。
(3)基于自步学习设计优化策略B,对优化后的深度网络模型进行正则化处理,生成场景目标检测模型;
优化策略B如下:
①定义目标函数如下:
Figure BDA0003038290900000071
其中,xi,yi∈Rm为双时相遥感图像中的对应像素,m为频带数,n为像素总数,x和y是融入专家知识后的筛选后的像素区域,ω为权值,T为矩阵的转置,i为像素区域的横坐标,j为像素区域的纵坐标;
②通过目标函数对优化后的深度网络模型进行正则化处理,使优化后的深度网络模型稀疏,进而获得场景目标检测模型。
正则化是对最小化经验误差函数上加约束,这样的约束可以解释为先验知识(正则化参数等价于对参数引入先验分布)。
S2:基于搜索策略和场景目标检测模型构建深度网络检测模型,通过深度网络检测模型对多模态信息进行处理。
根据以下步骤搭建深度网络检测模型:
(1)通过设计深度网络检测模型的强化学习机制和优化策略,训练场景目标检测模型的参数;
(2)定义y为深度网络检测模型检测到的窗口,从概率的角度,可以得到窗口y的数据分布p(y),如下式:
Figure BDA0003038290900000081
其中,v为卷积后的高层特征,x为继续贝叶斯降解后的低层特征,q(x)为图像信息、音频信息和文本信息上的经验分布,p(y|v)为深度网络检测模型被降解的底层分布,p(v)为深度网络检测模型被降解高层的分布;
(3)通过设置p(y|v,s)根据下式固定深度网络检测模型被降解的底层分布,使得窗口y的数据分布p(v)达到最优;
若分层训练的话,通过固定p(v|y),仅仅能够学习到先验p(v),当p(v|y)没有保留数据的全部特征的时候,这个先验值将不是最优的,因此拟p(y|v,s)来实现p(v|y):
Figure BDA0003038290900000089
Figure BDA0003038290900000082
其中,p(s|v)为卷积后的高层特征分布;s为层数,yvisi代表p(y|v,s);
(4)逐层训练深度网络检测模型的模型参数,获得概率分布如下:
Figure BDA0003038290900000083
Figure BDA0003038290900000084
其中,α代表映射关系,i表示具体的层数,k,j∈n且k≠j,k和j表示n层中随机两层之间的关系,
Figure BDA0003038290900000085
表示层si+1和si之间的相关性,
Figure BDA0003038290900000086
是投票函数和其他部分之间的相关性的权值,
Figure BDA0003038290900000087
Figure BDA0003038290900000088
表示偏置项。
(2)设计深度网络检测模型特征的降维算法,以求取卷积后的高层特征v的投影矩阵。
深度网络检测模型特征的降维算法如下:
(1)利用同类样本的稀疏表示构造图,通过构造图描述样本间的稀疏重构关系;
(2)基于稀疏重构关系,利用非参数离差矩阵来提取类间鉴别信息;
(3)通过求解广义特征值问题求得卷积后的高层特征v的投影矩阵。
通过广义特征值问题:XSX′w=rXX′w,计算特征向量,获得最优投影矩阵w;其中r是特征值。
S3:基于深度网络检测模型与自步学习策略构建多任务学习模型,利用多任务学习模型对遥感图像进行分类。
根据下列步骤构建多任务学习模型:
(1)基于深度网络检测模型与自步学习策略搭建卷积神经网络框架;
首先通过运用滑动窗口对测试样本进行多尺度多范围的扫描检测,以确定基于遥感数据的场景密度等级分类层的参数;第一阶段的深度网络模型为目标类别估计的基本框架,采用无监督学习的优化PCANet网络结构,将原先的直方图处理以及哈希编码替换为最大池化以及最小池化过程,用传统的手工通道特征作为网络的第一层,主要包括颜色通道、梯度幅值通道以及梯度直方图通道,然后在每个特征通道对样本图像用PCA正交变换方法得到每个特征通道的滤波器核,将滤波器核与特征通道图进行卷积以及池化过程,得到最终粗精度的结果;本实施例通过训练一个基于决策树的级联分类器,作为深度网络检测模型,该层网络中滤波器的学习是使用标准的正交变换方法,在每个特征通道上最小化正交向量的重构误差:
Figure BDA0003038290900000091
其中的V由主特征向量构成,通过对V进行转换,得到每个特征通道上的滤波器核。主特征向量能够表达通道特征图中的主要信息,有利于用网络模型提取更高层次的特征;较佳的是,本实施例搭建的卷积神经网络框架为精细化检测提供了基础。
(2)基于卷积神经网络框架建立多尺度轻量化的深度学习模型,对遥感图像进行多阶段检测;
具体的,建立多尺度轻量化的深度学习模型的步骤如下:
①通过深度网络模型检测后生成大量的候选检测窗口;
②利用带标记的场景样本训练深度网络模型,提取网络中每一个卷积层的特征,并将特征进行级联;
③利用基于决策树的级联AdaBoost分类器对每一个卷积层的特征分别进行训练,将第一个卷积层得到的特征送入k1个弱分类器,通过第二个卷积层训练k2个弱分类器,若网络中共有N个卷积层,则训练得到N个分类器模型H(x),即多尺度轻量化的深度学习模型:
Figure BDA0003038290900000101
其中,x表示候选窗口样本,
Figure BDA0003038290900000102
表示在第i个卷积层上的第j个弱分类器。
(3)建立基于强化学习与自步学习的优化控制策略,引导多尺度轻量化的深度学习模型由易到难地学习遥感图像样本,完成遥感图像样本的学习。
本实施例利用Pointwise LTR(Learning to Rank)对遥感数据进行了一些对比实验,发现Pointwise LTR这种直接在密度图特征上进行学习的方式在求取策略梯度的时候,能够将不同排序策略更为显著地区分开;因此,本实施例将场景目标的一些属性特征加入到奖赏函数的定义中,通过奖赏塑形(Reward Shaping)的方法丰富其包含的信息量;同时将反馈机制引入到多任务学习模型中,利用后验概率对估计结果的关系建立一套反馈条件,从而引导模型由易到难的选择性学习样本,最终学习完整的数据。
其中需要说明的是,样本的选择并不是随机的,是在一次迭代中全部纳入训练过程中,通过一种由简到难的有意义的方式进行选择的,选择简单的样本,即选择损失小的样本,也就是在线性回归问题中和模型间距离近的样本。
实施例2
为了对本方法中采用的技术效果加以验证说明,本实施例选择AlexNet模型和采用本方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。
AlexNet模型的模型参数庞大,需要耗费大量计算时间,训练过程中容易产生梯度消失。
为验证本方法相对AlexNet模型具有较高的遥感图像分类精度,本实施例中将采用AlexNet模型和本方法分别对遥感图像进行分类对比。
本实施例选用帕维亚中心和大学(Pavia Centre and University)的数据集,该数据集是在飞往意大利北部的帕维亚途中,感应器拍摄到的现场;选用8类图像(水,树,沥青,阻挡效应砖,瓷砖,阴影,草地,裸露的土壤),每类30张,实验前需要将图像进行裁剪,将其裁剪为227*227大小的图片;丢弃一些模糊、不具代表性的图片;并设置模型的学习率为0.0001。
实验环境:处理器:Intel(R)Core(TM)i7-8550U CPU@1.80GHz 1.99GHz软件环境:TensorFlow、Python。
使用帕维亚中心和大学数据集对AlexNet模型和本方法构建的多任务学习模型进行训练与分类;将训练后的损失函数与精度(类精度、平均精度),使用相应的评估系数进行分析对比;
类精度(Accuracy)为:
Figure BDA0003038290900000111
平均精度(Average Accuracy,AA)为:
Figure BDA0003038290900000112
其中,类精度表示每一类正确分类的像素的概率;平均精度表示分类精度的平均值。
AlexNet模型获得的训练损失与精度如图6所示,本方法获得的训练损失与精度如图7所示,可以得到,本方法训练数据集的分类精度可以达到95%左右,而测试数据集的分类精度也可以达到93%左右,与训练数据集的精度非常接近;且训练数据集的损失误差几乎只有2%左右,测试数据集的损失误差也只有10%。
综合实验结果可得,本方法构建的多任务学习模型的分类精度高于AlexNet模型,并且误差损失也比AlexNet模型小。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种面向多模态数据的遥感图像分类方法,其特征在于:包括,
基于自步学习策略建立场景目标检测模型,并通过所述场景目标检测模型进行跨模态学习;
基于搜索策略和所述场景目标检测模型构建深度网络检测模型,通过所述深度网络检测模型对多模态信息进行处理;
基于所述深度网络检测模型与所述自步学习策略构建多任务学习模型,利用所述多任务学习模型对遥感图像进行分类。
2.如权利要求1所述的面向多模态数据的遥感图像分类方法,其特征在于:建立所述场景目标检测模型包括,
构建深度网络模型;
基于强化学习设计优化策略A,对所述深度网络模型进行优化;
基于所述自步学习策略设计优化策略B,对优化后的深度网络模型进行正则化处理,生成所述场景目标检测模型;
其中,所述深度网络模型由n个流构成,即为n个图像信息、n个音频信息和n个文本信息,每个流都由6个层组成,分别是1个输入层、4个中间层和1个输出层。
3.如权利要求2所述的面向多模态数据的遥感图像分类方法,其特征在于:所述优化策略A包括,
在数据生成阶段,利用Q网络与数据所在的网络环境进行交互;
通过所述深度网络模型观察当前数据网络层,并使用ε-贪心算法进行检测和优化;
在训练阶段,所述深度网络模型会利用存储在重放记忆M中的数据来对网络进行训练,更新模型参数。
4.如权利要求2或3所述的面向多模态数据的遥感图像分类方法,其特征在于:所述优化策略B包括,
定义目标函数如下:
Figure FDA0003038290890000011
通过目标函数对所述优化后的深度网络模型进行所述正则化处理,使所述优化后的深度网络模型稀疏,进而获得所述场景目标检测模型;
其中,xi,yi∈Rm为双时相遥感图像中的对应像素,m为频带数,n为像素总数,x和y是融入专家知识后的筛选后的像素区域,ω为权值,T为矩阵的转置,i为像素区域的横坐标,j为像素区域的纵坐标。
5.如权利要求4所述的面向多模态数据的遥感图像分类方法,其特征在于:构建所述深度网络检测模型包括,
通过设计深度网络检测模型的强化学习机制和优化策略,训练场景目标检测模型的参数;
设计深度网络检测模型特征的降维算法,以求取卷积后的高层特征v的投影矩阵。
6.如权利要求5所述的面向多模态数据的遥感图像分类方法,其特征在于:所述强化学习机制和优化策略包括,
定义y为深度网络检测模型检测到的窗口,窗口y的数据分布p(y)如下式:
Figure FDA0003038290890000021
根据下式固定所述深度网络检测模型被降解的底层分布,使得所述窗口y的数据分布p(v)达到最优:
Figure FDA0003038290890000022
逐层训练深度网络检测模型的模型参数,获得概率分布如下:
Figure FDA0003038290890000023
Figure FDA0003038290890000024
其中,x为继续贝叶斯降解后的低层特征,q(x)为图像信息、音频信息和文本信息上的经验分布,p(y|v)为深度网络检测模型被降解的底层分布,p(v)为深度网络检测模型被降解高层的分布;p(s|v)为卷积后的高层特征分布;s为层数,yvisi代表p(y|v,s),α代表映射关系,i表示具体的层数,k,j∈n且k≠j,k和j表示n层中随机两层之间的关系,
Figure FDA0003038290890000025
表示层si +1和si之间的相关性,
Figure FDA0003038290890000026
是投票函数和其他部分之间的相关性的权值,
Figure FDA0003038290890000027
Figure FDA0003038290890000028
表示偏置项。
7.如权利要求5或6所述的面向多模态数据的遥感图像分类方法,其特征在于:所述降维算法包括,
利用同类样本的稀疏表示构造图,通过所述构造图描述样本间的稀疏重构关系;
基于所述稀疏重构关系,利用非参数离差矩阵来提取类间鉴别信息;
通过求解广义特征值问题求得所述卷积后的高层特征v的投影矩阵。
8.如权利要求1或2所述的面向多模态数据的遥感图像分类方法,其特征在于:构建所述多任务学习模型包括,
基于所述深度网络检测模型与所述自步学习策略搭建卷积神经网络框架;
基于卷积神经网络框架建立多尺度轻量化的深度学习模型,对所述遥感图像进行多阶段检测;
建立基于强化学习与自步学习的优化控制策略,引导所述多尺度轻量化的深度学习模型完成遥感图像样本的学习。
9.如权利要求8所述的面向多模态数据的遥感图像分类方法,其特征在于:所述多尺度轻量化的深度学习模型包括,
通过所述深度网络模型检测后生成大量的候选检测窗口;
利用带标记的场景样本训练所述深度网络模型,提取网络中每一个卷积层的特征,并将特征进行级联;
利用基于决策树的级联AdaBoost分类器对所述每一个卷积层的特征分别进行训练,将第一个卷积层得到的特征送入k1个弱分类器,通过第二个卷积层训练k2个弱分类器,若网络中共有N个卷积层,则训练得到N个分类器模型H(x),即多尺度轻量化的深度学习模型:
Figure FDA0003038290890000031
其中,x表示候选窗口样本,
Figure FDA0003038290890000032
表示在第i个卷积层上的第j个弱分类器。
10.如权利要求8或9所述的面向多模态数据的遥感图像分类方法,其特征在于:所述优化控制策略包括,
将数据网络层的属性特征加入到奖赏函数中,通过奖赏塑形策略丰富属性特征包含的信息量。
CN202110449967.8A 2021-04-25 2021-04-25 一种面向多模态数据的遥感图像分类方法 Pending CN113065520A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110449967.8A CN113065520A (zh) 2021-04-25 2021-04-25 一种面向多模态数据的遥感图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110449967.8A CN113065520A (zh) 2021-04-25 2021-04-25 一种面向多模态数据的遥感图像分类方法

Publications (1)

Publication Number Publication Date
CN113065520A true CN113065520A (zh) 2021-07-02

Family

ID=76568393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110449967.8A Pending CN113065520A (zh) 2021-04-25 2021-04-25 一种面向多模态数据的遥感图像分类方法

Country Status (1)

Country Link
CN (1) CN113065520A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434037A (zh) * 2023-04-21 2023-07-14 大连理工大学 基于双层优化学习的多模态遥感目标鲁棒识别方法
CN116956212A (zh) * 2023-06-27 2023-10-27 四川九洲视讯科技有限责任公司 一种多源视觉信息特征识别与提取方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434037A (zh) * 2023-04-21 2023-07-14 大连理工大学 基于双层优化学习的多模态遥感目标鲁棒识别方法
CN116434037B (zh) * 2023-04-21 2023-09-22 大连理工大学 基于双层优化学习的多模态遥感目标鲁棒识别方法
CN116956212A (zh) * 2023-06-27 2023-10-27 四川九洲视讯科技有限责任公司 一种多源视觉信息特征识别与提取方法

Similar Documents

Publication Publication Date Title
CN110689086B (zh) 基于生成式对抗网络的半监督高分遥感图像场景分类方法
CN111368896B (zh) 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN109086658B (zh) 一种基于生成对抗网络的传感器数据生成方法与系统
WO2020114378A1 (zh) 视频水印的识别方法、装置、设备及存储介质
CN113657425B (zh) 基于多尺度与跨模态注意力机制的多标签图像分类方法
CN107169117B (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
Cong et al. Self-supervised online metric learning with low rank constraint for scene categorization
CN107766933A (zh) 一种解释卷积神经网络的可视化方法
CN111639719A (zh) 基于时空运动和特征融合的足迹图像检索方法
CN109239670B (zh) 基于结构嵌入和深度神经网络的雷达hrrp识别方法
CN113297936B (zh) 一种基于局部图卷积网络的排球群体行为识别方法
CN113065520A (zh) 一种面向多模态数据的遥感图像分类方法
CN112732921A (zh) 一种虚假用户评论检测方法及系统
CN114937173A (zh) 一种基于动态图卷积网络的高光谱图像快速分类方法
CN116110089A (zh) 一种基于深度自适应度量学习的面部表情识别方法
Zhang et al. Hyperspectral image classification using an unsupervised neuro-fuzzy system
CN111898704A (zh) 对内容样本进行聚类的方法和装置
CN113344069B (zh) 一种基于多维关系对齐的无监督视觉表征学习的图像分类方法
CN115032602A (zh) 一种基于多尺度卷积胶囊网络的雷达目标识别方法
Abd El-Khalek et al. A Robust Machine Learning Algorithm for Cosmic Galaxy Images Classification Using Neutrosophic Score Features.
CN115392474B (zh) 一种基于迭代优化的局部感知图表示学习方法
CN111401440A (zh) 目标分类识别方法、装置、计算机设备及存储介质
CN110443169A (zh) 一种边缘保留判别分析的人脸识别方法
CN116246102A (zh) 一种基于自编码器与决策树的图像分类方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination