CN114973019A - 一种基于深度学习的地理空间信息变化检测分类方法及系统 - Google Patents

一种基于深度学习的地理空间信息变化检测分类方法及系统 Download PDF

Info

Publication number
CN114973019A
CN114973019A CN202210674204.8A CN202210674204A CN114973019A CN 114973019 A CN114973019 A CN 114973019A CN 202210674204 A CN202210674204 A CN 202210674204A CN 114973019 A CN114973019 A CN 114973019A
Authority
CN
China
Prior art keywords
layer
model
geospatial information
feature
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210674204.8A
Other languages
English (en)
Inventor
吴磊
孙世山
尹治平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Dark Blue Space Remote Sensing Technology Co ltd
Original Assignee
Suzhou Dark Blue Space Remote Sensing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Dark Blue Space Remote Sensing Technology Co ltd filed Critical Suzhou Dark Blue Space Remote Sensing Technology Co ltd
Priority to CN202210674204.8A priority Critical patent/CN114973019A/zh
Publication of CN114973019A publication Critical patent/CN114973019A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的地理空间信息变化检测分类方法,包括以下步骤:基于深度学习语义分割与变化检测方法生成编译‑解译结构的多层次多维度网络模型;构建了数据清洗预处理并分割聚类生成样本数据集的方法;基于迁移学习技术,架构迁移学习框架,应用新的数据集在基础模型上通过训练自动化快速地更新修正模型,生成融合模型应用于新的地理空间信息变化检测与分类领域。本发明还公开了一种基于深度学习的地理空间信息变化检测分类系统。本发明基于基础模型、样本数据利用迁移学习技术对基础模型再训练,获得适应于不同领域、不同场景的地理空间信息变化检测及分类的动态成长模型,提高了精度与效率。

Description

一种基于深度学习的地理空间信息变化检测分类方法及系统
技术领域
本发明涉及卫星遥感影像技术领域,尤其涉及一种基于深度学习的地理空间信息变化检测分类方法及系统。
背景技术
基于遥感影像数据的地理信息数据调查已广泛应用于各领域,但由于地理空间信息具有多样性、复杂性、易变性,数据信息变化难以准确提取,且影响因子较多。关于遥感影像的变化分类,传统的遥感技术大多分析遥感影像的光谱、纹理信息,提取各分类特征采用监督分类方法进行分类,但由于忽略了地理空间关联关系和复杂的内部组成结构,问题较多精度较差;或依赖人工进行检测分类,依赖人力资源且生产效率低,随着遥感影像数据的不断增加,显而易见,传统的遥感技术已经不适用。因此,依托于现如今算力水平的不断提升,基于深度学习语义分割架构模型处理遥感大数据,提取变化特征精确分类的研究具有重要意义。
发明内容
针对现有技术不足问题,本发明的目的是提出一种基于深度学习的地理空间信息变化检测分类方法,解决多源遥感影像数据以及地理空间变化关系的混乱、破碎难以系统性的检测分类问题。基于深度学习技术,基于深度学习技术建立基础的动态模型,具备学习能力,基于迁移学习,重训练模型,扩大模型的认知,进而对不同的遥感影像进行系统性、高精度的变化检测与分类。
本发明公开一种基于深度学习的地理空间信息变化检测分类方法,包括以下步骤:
基于深度学习语义分割与变化检测方法生成编译-解译结构的网络模型,对所述编译-解译结构的网络模型进行训练测试,获得基础模型;
基于迁移学习技术和所述基础模型,构建迁移学习框架;使用样本数据集在所述迁移学习框架上进行迁移学习,构建迁移学习的新模型;
所述迁移学习的新模型与所述基础模型整合,形成融合模型;
根据所述融合模型对待检测遥感影像进行检测分类。
优选地,样本数据集的获取方法为:清洗历史遥感影像数据并制作地理空间信息变化检测分类的样本数据集。
优选地,清洗数据并制作地理空间信息变化检测分类的样本数据集,具体步骤为:
获取历史遥感影像数据,对历史遥感影像数据进行预处理,得到预处理影像数据;
所述预处理影像数据分割提取纹理特征向量;采用高斯混合聚类方法将纹理特征向量进行聚类,得到带有特征词典的聚类后影像;
所述聚类后影像进行切片处理,得到样本数据集。
优选地,基于深度学习语义分割与变化检测方法生成编译-解译结构的网络模型,对所述编译-解译结构的网络模型进行训练测试,获得基础模型,具体步骤为:
构建深度学习语义分割与变化检测方法的编译-解译结构的网络模型,深度学习语义分割与变化检测方法的编译-解译结构的网络模型包括跨层组合分布的地理空间信息特征基本提取层、地理空间信息特征基本映射层和地理空间信息特征基本输出层;
对所述编译-解译结构的网络模型进行训练、测试,获得基础模型。
优选地,构建深度学习语义分割与变化检测方法的编译-解译结构的网络模型,包括跨层组合分布的地理空间信息特征基本提取层、地理空间信息特征基本映射层和地理空间信息特征基本输出层,包括:
构建地理空间信息特征提取层,用于生成地理空间信息特征关系矩阵;
构建地理空间信息特征映射层,用于学习聚类特征向量;
构建地理空间信息特征输出层,用于输出地理空间信息变化及检测分类结果;
基于地理空间信息特征提取层、地理空间信息特征映射层和地理空间信息特征输出层,定义一个网络模型。
优选地,训练、测试完成基础模型,具体步骤如下:
获取公开影像数据集,公开影像数据集拆分为训练数据、检验数据、测试数据;
在编译-解译结构的网络模型引入损失函数,评估其对数据集的建模程度,量化评价模型预测值与实际目标值偏离;
使用训练数据训练模型,再使用检验数据集检验模型,接着通过测试数据测试模型,得到基础模型。
优选地,基于迁移学习技术和所述基础模型,构建迁移学习框架;使用样本数据集在所述迁移学习框架上进行迁移学习,构建迁移学习的新模型,具体步骤为:
进入基础模型并冻结所有层,使用基本模型的所有输出特征映射的平均值作为输入权重,在冻结层之上添加新的池层;
在新的池层上添加用Softmax函数;
在新的池层上定义修正优化方法并编译模型;
使用样本数据集中的训练样本和测试样本在新的池层上训练模型;
调整修正优化方法并使用样本数据集中的测试样本测试模型,得到迁移学习的新模型。
优选地,对历史遥感影像数据进行预处理,得到预处理影像数据,具体步骤包括:
清洗预处理遥感影像数据的信号强度或反射率,使之接近真实值;
计算最小化的均方误差Error公式如下:
Figure BDA0003694213740000031
式中,a,b表示系数,s表示实际接收到的信号强度或反射率,
Figure BDA0003694213740000032
表示s的平均值,μ表示真实信号强度或反射率;
Figure BDA0003694213740000033
式中,
Figure BDA0003694213740000034
表示方差,s表示实际接收到的信号强度或反射率,
Figure BDA0003694213740000035
表示真实信号强度或反射率,m表示参数,μ、
Figure BDA0003694213740000036
为不同符号代表相同含义。
优选地,构建地理空间信息特征提取层,用于生成地理空间信息特征关系矩阵,具体步骤为:
构建全局地理空间信息特征提取单元,应用卷积计算和激活函数,组成特征提取单元,生成当前单元的地理空间信息特征关系矩阵;
基于样本的离散化过程,应用计算和激活函数提取同内核重叠的输入区域的最大值,组成局部二次特征提取单元,生成当前单元的局部地理空间信息特征关系矩阵;
在局部二次特征提取单元通过正则化技术注入噪声,增强数据在训练中的难度提高鲁棒性;
特征提取单元和局部二次特征提取单元组成特征基本提取层;所述地理空间信息特征提取层的输入为上一层地理空间信息特征提取层的输出,第一层地理空间信息特征提取层的输入为样本;所述地理空间信息特征提取层为多层并跨层组合分布,特征提取层的输入为上一层地理空间信息特征提取层的输出,特征提取层的输出为下一层地理空间信息特征提取层的输入,第一层地理空间信息提取层的输入为样本,最终一层地理空间信息特征提取层的输出为第一层地理空间信息特征映射层的输入;
构建地理空间信息特征映射层,用于学习聚类特征向量;具体步骤为:
映射层学习特征基本提取单元输出的高级特征的非线性组合,提取特征的分布式特征表示映射到样本标记多维度空间,生成多维度特征分类;
应用激活函数引入非线性;
应用正则化技术减少神经网络过度拟合,正则化技术使用离散型概率分布,离散型概率分布选择伯努利分布;使用伯努利分布的样本以概率p随机将输入张量的一些连接归零;
所述地理空间信息特征映射层为多层并跨层组合分布,特征映射层的输入为上一层地理空间信息特征映射层的输出,特征映射层的输出为下一层地理空间信息特征映射层的输入,第一层地理空间信息映射层的输入为最终一层地理空间信息特征提取层的输出,最终一层地理空间信息特征映射层的输出为地理空间信息特征输出层的输入;
构建地理空间信息特征输出层,用于输出地理空间信息变化及检测分类结果;具体步骤为:
输出层应用归一化指数函数后最终输出地理空间信息变化及检测分类结果;
所述地理空间信息输出层为一层,输出层的输入为最终一层地理空间信息映射层的输出,输出层的输出为地理空间信息变化及检测分类结果。
本发明还公开一种用于实现上述基于深度学习的地理空间信息变化检测分类方法的系统,包括:
样本数据集模块:用于对数据进行清洗,进行特征提取,构建特征词典,制作样本数据集;
检测识别分类模型模块:用于构建基于深度学习语义分割与变化检测方法的编译-解译结构的网络模型,训练、测试、研究生成基础模型;
迁移学习模块:用于基于迁移学习技术和基础模型架构迁移学习框架,根据不同领域需求在所述基础模型上更新修正生成新模型;
融合模型模块:用于所述迁移学习的新模型与所述基础模型整合,形成融合模型;
检测分类与识别分类模块:用于将检测遥感影像输入到所述融合模型后,根据所述融合模型对待检测遥感影像进行检测分类。
与现有技术比较,本发明的有益效果为:
本发明基于深度学习语义分割与变化检测方法,生成编译-解译结构的网络基础模型,所述模型采用多层跨层组合分布、多维度特征分类,使得地理空间信息特征在网络中多维度传递,通过抽象化特征表示,减少计算,使得算力得以保障,同时避免过度拟合。通过正则化技术注入噪声,训练、检验、测试后完成的基础模型,具有更好的鲁棒性,更高精度的检测与识别。
本发明基于迁移学习技术,根据不同影像、不同场景类别,在基础模型基础上自动化快速地更新修正模型,应用新的数据集于基础模型顶层进行修改、部分重新训练,深度学习新的典型地理空间信息特征关系,更新模型并重新应用于基础地理信息数据、遥感影像变化检测等新的变化检测分类领域。
本发明的融合模型适用于不同领域的地理空间变化检测需求,例如地表覆盖分类、陆地景观分布、森林监测、火点检测、农业的作物分布、耕地分布,土地利用规划等精确监测识别,基于迁移学习生成适应于不同场景的智能检测模型,同传统检测方法相比,本发明方法从样本数据集中基于模型可以自动学习深度地理空间关系特征,适应不同遥感影像检测识别分类,节约人力和时间,大幅提升效率;同其它深度学习方法相比,本发明方法可以基于迁移学习技术更新基础模型,根据场景类别自动迁移学习进行模型训练和解译。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种基于深度学习的地理空间信息变化检测分类方法的流程示意图;
图2是本发明提取聚类特征向量计算方法示意图;
图3是本发明构建基于深度学习语义分割与变化检测方法的编译-解译结构的网络模型方法示意图;
图4是本发明编译提取地理空间信息特征结构网络模型,计算方法示意图;
图5是本发明架构迁移学习框架示意图;
图6是历史遥感影像数据的示例图;
图7是现有技术检测分类后所得结果的示例图;
图8是本发明地理空间信息变化及检测分类结果的示例图。
具体实施方式
下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。
如图1所示,本发明提出了一种基于深度学习的地理空间信息变化检测分类方法,具体步骤如下:
步骤1,数据清洗预处理,并进行特征提取,构建特征词典,制作地理空间信息变化检测分类样本数据集,具体步骤为:
步骤1.1,获取历史遥感影像数据,进行清洗预处理,即噪声过滤,提高特征提取质量;得到预处理影像数据;
计算最小化的均方误差Error公式如下:
Figure BDA0003694213740000061
式中,a,b表示系数,s表示实际接收到的信号强度或反射率,
Figure BDA0003694213740000062
表示s的平均值,μ表示真实信号强度或反射率,μ、
Figure BDA0003694213740000063
为不同符号代表相同含义。
计算真实信号强度或反射率
Figure BDA00036942137400000610
公式如下:
Figure BDA0003694213740000064
式中,
Figure BDA0003694213740000065
表示方差,s表示实际接收到的信号强度或反射率,
Figure BDA0003694213740000066
表示真实信号强度或反射率,m表示参数设置为4.7。
步骤1.2,预处理影像数据划分为若干(n*n)单元块,使用局部二值模式(LBP)提取块的纹理特征,统计块的LBP直方图,通过归一化处理标准化直方图进行,生成纹理特征向量;
Figure BDA0003694213740000067
Figure BDA0003694213740000068
式中,P是邻域像素的数量,ni代表第i个邻域像素强度,c代表中心像素,Gc表示中心像素强度,x代表所述中心像素点的周边像素点的像素灰度值与该中心像素点灰度值的差值。
步骤1.3,采用基于贝叶斯定理和期望最大化算法的高斯混合聚类方法将纹理特征向量进行分类,构建特征词典,得到带有特征词典的聚类后影像;
计算示例如图2所示,步骤如下:
步骤A1,基于贝叶斯定理,计算zj的后验分布概率p:
Figure BDA0003694213740000069
式中:μi表示向量i的平均值,∑i向量i的协方差,K表示高斯分布数量,z代表假设,x代表数据样本、α代表系数、j代表指标变量、l代表指标变量、αi代表i对应的系数,αl代表l对应的系数,p(xji,∑i)代表极大似然概率。
步骤A2,基于期望最大化算法进行迭代:
计算均值向量μi
Figure BDA0003694213740000071
式中:m表示样本量,j代表指标变量。
计算协方差矩阵∑i
Figure BDA0003694213740000072
式中:T表示最大迭代次数。
计算混合系数Φi
Figure BDA0003694213740000073
步骤A3,重复步骤A1、步骤A2,满足终止条件;终止条件为似然函数值(即极大似然概率)不再增大时终止。
步骤A4,基于均值向量μi、协方差矩阵∑i、混合系数Φi定义高斯混合聚类:
Figure BDA0003694213740000074
基于特征向量将样本聚类为符合高斯概率密度函数的K个簇,各样本中混合系数最大的类作为标签,标签即为特征词典,得到带有特征词典的聚类后影像;
特征词典可以采用居民建筑、农田、工业建筑、森林等。
步骤1.4,对聚类后影像进行切片处理,生成标准尺寸样本,作为标注生成样本数据集。
切片方法为:基于聚类后影像的中心点像素,对于每一幅图像,在其中心点处以64*64像素尺寸裁切图像切片。
样本数据集随机按(0.75∶0.15∶0.1)的比例拆分为训练样本、检验样本、测试样本;
步骤2,构建基于深度学习语义分割与变化检测方法的编译-解译结构的网络模型,编译-解译结构的网络模型训练、测试、研究形成基础模型,计算示例如图3所示,具体步骤如下:
步骤2.1,编译结构网络模型,提取地理空间信息特征,计算示例如图4所示,具体步骤为:
步骤2.1.1,构建地理空间信息特征提取层,用于生成地理空间信息特征关系矩阵,为编译结构部分;
应用卷积(Conv)计算和正则化线性单元ReLu激活函数,组成特征提取单元,生成当前单元全局的地理空间信息特征关系矩阵;
卷积计算如下:
H=I*K
式中,H表示输出矩阵(即特征)具有三个维度,I表示输入矩阵具有四个维度,K表示权重矩阵具有四个维度。
ReLu激活函数公式如下:
Figure BDA0003694213740000081
计算单元特征矩阵Fi
Figure BDA0003694213740000082
式中,n表示第n层网络,i表示n层的第i个矩阵单元,Ker表示权重矩阵参数,Bias表示卷积计算的偏置参数,
Figure BDA0003694213740000085
表示n-1层网络的第i个矩阵单元的输出矩阵。
基于样本的离散化过程,应用卷积计算和激活函数提取同内核重叠的输入区域的最大值,组成局部二次特征提取单元,生成当前单元的局部地理空间信息特征关系矩阵;这样可以减少卷积特征空间大小,以抽象表示卷积特征减少过度拟合,对提取的信息进一步降维减少计算量,加强图像特征的不变性,使之增加图像的偏移、旋转等方面的鲁棒性,减少参数误差造成估计均值的偏移;
Sigmoid激活函数公式如下:
f(x)=max(0,x)
计算单元特征矩阵Fp
Figure BDA0003694213740000083
在局部二次特征提取单元通过正则化技术注入噪声,增强数据在训练中的难度提高鲁棒性。正则化技术使用离散型概率分布,离散型概率分布选择伯努利分布,把噪音作用于权重,通过权重注入噪声是对该随机变量采样得到的一个随机值,权重为不确定的随机变量符合概率p分布;
伯努利分布公式如下:
Figure BDA0003694213740000084
Figure BDA0003694213740000091
Figure BDA0003694213740000092
式中,p表示概率;q=1-p;fX(x)表示概率质量函数、E[X]表示期望值、var[X]表示方差。
特征提取单元和局部二次特征提取单元多端跨层组合组成地理空间信息特征提取层;
地理空间信息特征提取层的输入为上一层地理空间信息特征提取层的输出,第一层地理空间信息特征提取层的输入为样本。
地理空间信息特征提取层为多层并跨层组合分布,特征提取层的输入为上一层地理空间信息特征提取层的输出,特征提取层的输出为下一层地理空间信息特征提取层的输入,第一层地理空间信息提取层的输入为样本,最终一层地理空间信息特征提取层的输出为第一层地理空间信息特征映射层的输入。
步骤2.1.2,构建地理空间信息特征映射层,用于学习聚类特征向量;为编译结构部分;
再次应用Sigmoid激活函数和ReLu激活函数;在特征映射层聚类特征向量时增加非线性因素,解决线性模型表达能力不足的缺陷;
应用正则化技术减少神经网络过度拟合,基于伯努利分布的样本以概率p随机将输入张量的一些连接归零,丢弃部分网络单元集成网络的输出由所有子网络输出的平均给出;
所有子网络输出的加权平均:
Figure BDA0003694213740000093
所有子网络输出的几何平均:
Figure BDA0003694213740000094
几何平均归一化,保证多个概率分布是一个概率分布,概率归一化公式:
Figure BDA0003694213740000095
式中,
Figure BDA0003694213740000096
表示掩码向量,
Figure BDA0003694213740000097
表示各网络的输出的概率分布,
Figure BDA0003694213740000098
表示
Figure BDA0003694213740000099
的概率分布,d表示可被丢弃的单元的数量,y∈{1,2,3,…,N}表示分类的类别,
Figure BDA00036942137400000910
表示输入向量。
步骤2.2,构建地理空间信息特征输出层,用于输出地理空间信息变化及检测分类结果;为解译结构部分:
在特征输出层后添加特征输出层并应用归一化指数(Softmax)函数后输出地理空间信息变化及检测分类结果;
Softmax函数公式如下:
Figure BDA0003694213740000101
式中,σ表示Softmax函数;z表示输入向量;
Figure BDA0003694213740000102
表示输入向量的标准指数函数;K表示多类分类器中的数量;
Figure BDA0003694213740000103
表示输出向量的标准指数函数;j代表指标变量。
步骤2.3,基于步骤2.2的特征提取层、特征映射层和特征输出层,定义一个网络模型,作为编译-解译结构的网络模型;
地理空间信息输出层为一层,输出层的输入为最终一层地理空间信息映射层的输出,输出层的输出为地理空间信息变化及检测分类结果。
步骤2.4,编译-解译结构的网络模型进行训练、测试,完成后得到基础模型,步骤如下:
步骤B1,下载公开影像数据集S1&2 Image Pairs Dataset,公开影像数据集随机按(0.8:0.15:0.5)的比例拆分为训练数据集、检验数据集、测试数据集;
步骤B2,使用训练数据集训练编译-解译结构的网络模型,设置交叉熵(CrossEntropy)函数在深度学习反向传播中进行梯度下降,修正更新函数的各个参数的方向、大小,使得更新后的各个参数让损失函数值不断逼近全局最小;
公式如下:
Figure BDA0003694213740000104
式中,p表示概率,M表示簇的数量,ti表示样本i的真值其取值为0或1,pi表示样本i的归一化预测概率。
推导得以下公式:
Figure BDA0003694213740000105
式中:loss表示交叉熵损失函数,x表示样本,class表示簇,j表示某一个簇,exp表示样本为x属于j簇的期望值。
在该步骤中,使用检验数据集在训练模型过程中不断测试模型的误差,误差随着训练次数增加会呈现先减小后增加的,在误差降至最小时训练完成输出模型。
步骤B3,应用检验数据集检验模型在每次训练数据集训练模型后,训练完成后输出模型使用测试数据进行测试,完成基础模型;
在该步骤中,使用测试数据集和检验数据集训练完成输出最优模型后,使用测试数据集进行模型预测,用来衡量该模型的性能和预测准确度。
步骤3中,基于迁移学习技术,根据步骤2得到的基础模型架构迁移学习框架,如图5所示,迁移学习框架的构建包括以下步骤:
步骤3.1,冻结基础模型的层,使用基本模型的所有输出特征映射的权重平均值作为输入权重,在冻结层之上添加新的池层;
步骤3.2,在新的池层上添加一个应用Softmax函数,包含相应分类类别的输出层;
步骤3.3,在新的池层上定义Stochastic Gradient Descent为修正优化方法,设置学习率0.01,动量参数0.6,衰减值0.01,并编译;
步骤3.4,基于样本数据集中的训练样本和检验样本,在新的池层上训练模型,学习对样本数据集的变化检测与预测;
步骤3.5,微调修正优化方法Stochastic Gradient Descent中的其它权重,学习率调整为0.005,动量参数调整为0.6,衰减值调整为0.001,设置交叉熵;
步骤3.6,基于样本数据集中的测试样本,测试新模型,包括冻结的部分或整个新模型;
步骤4中,应用步骤1的样本数据集在步骤3的迁移学习框架上进行迁移学习,模型融合进行地理空间信息变化检测分类,生成相应产品;
步骤4.1,基于样本数据集和步骤3得到的迁移学习框架,迁移学习生成迁移学习的新模型;
步骤4.2,迁移学习的新模型与步骤2得到的基础模型整合,形成融合模型;
输出地理空间信息变化及检测分类结果;
步骤4.3,将待检测的遥感影像输入所述融合模型,生成地理空间信息变化及检测分类结果。
与上述方法相对应,本发明还提出一种基于深度学习的地理空间信息变化检测分类系统,所述系统包括:
样本数据集模块:对历史遥感影像数据进行特征提取,构建特征词典,制作样本数据集;
检测识别分类模型模块:构建基于深度学习语义分割与变化检测方法的编译-解译结构的网络模型,训练、测试、研究生成基础模型;
迁移学习模块:基于迁移学习技术和基础模型架构迁移学习框架,根据不同领域需求在所述基础模型上更新修正生成新模型;
融合模型模块:基于深度学习网络进行新模型同基础模型的融合;
检测分类与识别分类模块:将待检测影像输入到所述融合模型,生成地理空间信息变化及检测分类结果。
以上对本发明所提供的技术方案进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块、模组或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元、模组或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。
所述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本发明的方法中限定的上述功能。需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于深度学习的地理空间信息变化检测分类方法,其特征在于,包括以下步骤:
基于深度学习语义分割与变化检测方法生成编译-解译结构的网络模型,对所述编译-解译结构的网络模型进行训练测试,获得基础模型;
基于迁移学习技术和所述基础模型,构建迁移学习框架;使用样本数据集在所述迁移学习框架上进行迁移学习,构建迁移学习的新模型;
所述迁移学习的新模型与所述基础模型整合,形成融合模型;
根据所述融合模型对待检测遥感影像进行检测分类。
2.根据权利要求1所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于:
样本数据集的获取方法为:清洗历史遥感影像数据并制作地理空间信息变化检测分类的样本数据集。
3.根据权利要求2所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于,清洗历史遥感影像数据并制作地理空间信息变化检测分类的样本数据集,具体步骤为:
获取历史遥感影像数据,对历史遥感影像数据进行预处理,得到预处理影像数据;
所述预处理影像数据分割提取纹理特征向量;采用高斯混合聚类方法将纹理特征向量进行聚类,得到带有特征词典的聚类后影像;
所述聚类后影像进行切片处理,得到样本数据集。
4.根据权利要求3所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于,基于深度学习语义分割与变化检测方法生成编译-解译结构的网络模型,对所述编译-解译结构的网络模型进行训练测试,获得基础模型,具体步骤为:
构建深度学习语义分割与变化检测方法的编译-解译结构的网络模型,深度学习语义分割与变化检测方法的编译-解译结构的网络模型包括跨层组合分布的地理空间信息特征基本提取层、地理空间信息特征基本映射层和地理空间信息特征基本输出层;
对所述编译-解译结构的网络模型进行训练、测试,获得基础模型。
5.根据权利要求4所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于,构建深度学习语义分割与变化检测方法的编译-解译结构的网络模型,包括跨层组合分布的地理空间信息特征基本提取层、地理空间信息特征基本映射层和地理空间信息特征基本输出层,包括:
构建地理空间信息特征提取层,用于生成地理空间信息特征关系矩阵;
构建地理空间信息特征映射层,用于学习聚类特征向量;
构建地理空间信息特征输出层,用于输出地理空间信息变化及检测分类结果;
基于地理空间信息特征提取层、地理空间信息特征映射层和地理空间信息特征输出层,定义一个网络模型。
6.根据权利要求4所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于,训练、测试完成基础模型,具体步骤如下:
获取公开影像数据集,公开影像数据集拆分为训练数据、检验数据、测试数据;
在编译-解译结构的网络模型引入损失函数,评估其对数据集的建模程度,量化评价模型预测值与实际目标值偏离;
使用训练数据训练模型,再使用检验数据集检验模型,接着通过测试数据测试模型,得到基础模型。
7.根据权利要求3所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于,基于迁移学习技术和所述基础模型,构建迁移学习框架;使用样本数据集在所述迁移学习框架上进行迁移学习,构建迁移学习的新模型,具体步骤为:
进入基础模型并冻结所有层,使用基本模型的所有输出特征映射的平均值作为输入权重,在冻结层之上添加新的池层;
在新的池层上添加用Softmax函数;
在新的池层上定义修正优化方法并编译模型;
使用样本数据集中的训练样本和测试样本在新的池层上训练模型;
调整修正优化方法并使用样本数据集中的测试样本测试模型,得到迁移学习的新模型。
8.根据权利要求3所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于,对历史遥感影像数据进行预处理,得到预处理影像数据,具体步骤包括:
清洗预处理遥感影像数据的信号强度或反射率,使之接近真实值;
计算最小化的均方误差Error公式如下:
Figure FDA0003694213730000021
式中,a,b表示系数,s表示实际接收到的信号强度或反射率,
Figure FDA0003694213730000022
表示s的平均值,μ表示真实信号强度或反射率;
Figure FDA0003694213730000023
式中,
Figure FDA0003694213730000031
表示方差,s表示实际接收到的信号强度或反射率,
Figure FDA0003694213730000032
表示真实信号强度或反射率,m表示参数,μ、
Figure FDA0003694213730000033
为不同符号代表相同含义。
9.根据权利要求5所述的一种基于深度学习的地理空间信息变化检测分类方法,其特征在于:
构建地理空间信息特征提取层,用于生成地理空间信息特征关系矩阵,具体步骤为:
构建全局地理空间信息特征提取单元,应用卷积计算和激活函数,组成特征提取单元,生成当前单元的地理空间信息特征关系矩阵;
基于样本的离散化过程,应用计算和激活函数提取同内核重叠的输入区域的最大值,组成局部二次特征提取单元,生成当前单元的局部地理空间信息特征关系矩阵;
在局部二次特征提取单元通过正则化技术注入噪声,增强数据在训练中的难度提高鲁棒性;
特征提取单元和局部二次特征提取单元组成特征基本提取层;所述地理空间信息特征提取层的输入为上一层地理空间信息特征提取层的输出,第一层地理空间信息特征提取层的输入为样本;所述地理空间信息特征提取层为多层并跨层组合分布,特征提取层的输入为上一层地理空间信息特征提取层的输出,特征提取层的输出为下一层地理空间信息特征提取层的输入,第一层地理空间信息提取层的输入为样本,最终一层地理空间信息特征提取层的输出为第一层地理空间信息特征映射层的输入;
构建地理空间信息特征映射层,用于学习聚类特征向量;具体步骤为:
映射层学习特征基本提取单元输出的高级特征的非线性组合,提取特征的分布式特征表示映射到样本标记多维度空间,生成多维度特征分类;
应用激活函数引入非线性;
应用正则化技术减少神经网络过度拟合,正则化技术使用离散型概率分布,离散型概率分布选择伯努利分布;使用伯努利分布的样本以概率p随机将输入张量的一些连接归零;
所述地理空间信息特征映射层为多层并跨层组合分布,特征映射层的输入为上一层地理空间信息特征映射层的输出,特征映射层的输出为下一层地理空间信息特征映射层的输入,第一层地理空间信息映射层的输入为最终一层地理空间信息特征提取层的输出,最终一层地理空间信息特征映射层的输出为地理空间信息特征输出层的输入;
构建地理空间信息特征输出层,用于输出地理空间信息变化及检测分类结果;具体步骤为:
输出层应用归一化指数函数后最终输出地理空间信息变化及检测分类结果;
所述地理空间信息输出层为一层,输出层的输入为最终一层地理空间信息映射层的输出,输出层的输出为地理空间信息变化及检测分类结果。
10.一种用于实现如权利要求1-9任一项所述一种基于深度学习的地理空间信息变化检测分类方法的系统,其特征在于,包括:
样本数据集模块:用于对数据进行清洗,进行特征提取,构建特征词典,制作样本数据集;
检测识别分类模型模块:用于构建基于深度学习语义分割与变化检测方法的编译-解译结构的网络模型,训练、测试、研究生成基础模型;
迁移学习模块:用于基于迁移学习技术和基础模型架构迁移学习框架,根据不同领域需求在所述基础模型上更新修正生成新模型;
融合模型模块:用于所述迁移学习的新模型与所述基础模型整合,形成融合模型;
检测分类与识别分类模块:用于将检测遥感影像输入到所述融合模型后,根据所述融合模型对待检测遥感影像进行检测分类。
CN202210674204.8A 2022-06-14 2022-06-14 一种基于深度学习的地理空间信息变化检测分类方法及系统 Pending CN114973019A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210674204.8A CN114973019A (zh) 2022-06-14 2022-06-14 一种基于深度学习的地理空间信息变化检测分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210674204.8A CN114973019A (zh) 2022-06-14 2022-06-14 一种基于深度学习的地理空间信息变化检测分类方法及系统

Publications (1)

Publication Number Publication Date
CN114973019A true CN114973019A (zh) 2022-08-30

Family

ID=82962655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210674204.8A Pending CN114973019A (zh) 2022-06-14 2022-06-14 一种基于深度学习的地理空间信息变化检测分类方法及系统

Country Status (1)

Country Link
CN (1) CN114973019A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115937681A (zh) * 2022-12-05 2023-04-07 中铁第四勘察设计院集团有限公司 一种遥感影像样本数据清洗方法
CN117237823A (zh) * 2023-11-10 2023-12-15 中国科学院空天信息创新研究院 一种基于零样本学习的遥感基础模型迁移方法及其装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115937681A (zh) * 2022-12-05 2023-04-07 中铁第四勘察设计院集团有限公司 一种遥感影像样本数据清洗方法
CN115937681B (zh) * 2022-12-05 2024-04-19 中铁第四勘察设计院集团有限公司 一种遥感影像样本数据清洗方法
CN117237823A (zh) * 2023-11-10 2023-12-15 中国科学院空天信息创新研究院 一种基于零样本学习的遥感基础模型迁移方法及其装置
CN117237823B (zh) * 2023-11-10 2024-03-08 中国科学院空天信息创新研究院 一种基于零样本学习的遥感基础模型迁移方法及其装置

Similar Documents

Publication Publication Date Title
CN110135267B (zh) 一种大场景sar图像细微目标检测方法
US11783569B2 (en) Method for classifying hyperspectral images on basis of adaptive multi-scale feature extraction model
CN110533631B (zh) 基于金字塔池化孪生网络的sar图像变化检测方法
CN112101278A (zh) 基于k近邻特征提取和深度学习的宅基地点云分类方法
Sun et al. Classification for remote sensing data with improved CNN-SVM method
CN113392931B (zh) 基于自监督学习及多任务学习的高光谱开放集分类方法
CN107491734B (zh) 基于多核融合与空间Wishart LapSVM的半监督极化SAR图像分类方法
CN114973019A (zh) 一种基于深度学习的地理空间信息变化检测分类方法及系统
CN114842264B (zh) 一种基于多尺度空谱特征联合学习的高光谱图像分类方法
CN111428625A (zh) 一种基于深度学习的交通场景目标检测方法及系统
CN109919202A (zh) 分类模型训练方法及装置
CN113159048A (zh) 一种基于深度学习的弱监督语义分割方法
Biard et al. Automated detection of weather fronts using a deep learning neural network
CN114863348B (zh) 基于自监督的视频目标分割方法
CN112270285B (zh) 一种基于稀疏表示和胶囊网络的sar图像变化检测方法
CN115393631A (zh) 基于贝叶斯层图卷积神经网络的高光谱图像分类方法
He et al. SAR target recognition and unsupervised detection based on convolutional neural network
CN114926693A (zh) 基于加权距离的sar图像小样本识别方法及装置
CN115311502A (zh) 基于多尺度双流架构的遥感图像小样本场景分类方法
CN107423670A (zh) 基于深度置信网络的modis雾监测方法
CN117152427A (zh) 基于扩散模型和知识蒸馏的遥感图像语义分割方法与系统
CN111242028A (zh) 基于U-Net的遥感图像地物分割方法
CN118279320A (zh) 基于自动提示学习的目标实例分割模型建立方法及其应用
CN113869136A (zh) 基于多分支网络的半监督极化sar图像分类方法
CN117636183A (zh) 一种基于自监督预训练的小样本遥感图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination