CN115311318A - 一种基于知识蒸馏的遥感变化检测方法 - Google Patents

一种基于知识蒸馏的遥感变化检测方法 Download PDF

Info

Publication number
CN115311318A
CN115311318A CN202211046284.9A CN202211046284A CN115311318A CN 115311318 A CN115311318 A CN 115311318A CN 202211046284 A CN202211046284 A CN 202211046284A CN 115311318 A CN115311318 A CN 115311318A
Authority
CN
China
Prior art keywords
models
model
function
knowledge distillation
remote sensing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211046284.9A
Other languages
English (en)
Inventor
王兵
王春月
刘思言
付璐
秦磊
于海洋
赵宇恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chang Guang Satellite Technology Co Ltd
Original Assignee
Chang Guang Satellite Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chang Guang Satellite Technology Co Ltd filed Critical Chang Guang Satellite Technology Co Ltd
Priority to CN202211046284.9A priority Critical patent/CN115311318A/zh
Publication of CN115311318A publication Critical patent/CN115311318A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于知识蒸馏的遥感变化检测方法。所述方法具体包括:首先设计两个模型,所述两个模型分别为参数量大的教师模型和参数量小的轻量化学生模型,教师模型拥有更好的计算结果,学生模型具有更高的计算效率;其次,使用真实的遥感变化检测数据集对两个模型进行联合训练,与此同时设计一个度量函数,约束两个模型的预测,使得两个模型的预测结果保持一致,此过程称之为全局预测知识蒸馏;最后,针对编码器的输出进行了距离的约束,该约束过程称之为编码表示知识蒸馏。所述的方法对模型进行优化后,模型在大规模数据集上的推理速度大大提高,同时推理结果也相比大模型不降反升,无疑达到了被期待的结果。

Description

一种基于知识蒸馏的遥感变化检测方法
技术领域
本发明属于高分辨率遥感图像的变化检测技术领域,特别是涉及一种基于知识蒸馏的遥感变化检测方法。所述遥感变化检测可以用于违章建筑物检测,灾害监控,城市扩建等应用场景。
背景技术
遥感变化检测任务试图利用两张拍摄于相同的位置、不同的时间的遥感数字图像,定量地分析地表特征或人类活动变化,如图1所示的建筑物的变化。
现有的遥感变化检测算法基本都关注于如何设计一个更好的神经网络结构,提高模型在各个数据集上的表现。但其实,相比于语义分割、目标检测等数字图像处理任务,遥感变化检测是一种消耗计算资源的任务,因为(1)每一个样本都包含两张双时相的图像或多张多时相的图像,这无疑比只需要单张图像的任务更消耗显存和计算时间;(2)遥感图像往往是高分辨率的,这也对计算资源的要求更加严苛;(3)随着深度神经网络的出现,想要达到比较杰出的检测精度,就需要利用参数量很大的网络,例如ResNet50有2300万的可学习参数,ResNet101有4200万参数,随着网络参数的增多,中间的计算量会指数型的增加,因此会占用大量的计算内存。
解决这一计算资源消耗的办法就是减少深度神经网络的参数规模,最简单的方式是利用较小(参数量少)的网络进行训练和推理,例如MobileNet仅有200万的参数。然而,减小参数的代价就是效果的降低,那么本发明要解决的就是这一问题,希望一个较小的模型也能达到大模型的效果。通过本发明所述的方法对模型进行优化后,模型在大规模数据集上的推理速度大大提高,同时推理结果也相比大模型不降反升,无疑达到了被期待的结果。
发明内容
本发明目的是为了解决现有关于遥感图像变化检测的工作大部分关注于深度学习模型的改进,或者关注于如何更有效地利用现有数据,而没有工作关注于变化检测模型的计算效率问题,提出了一种基于知识蒸馏的遥感变化检测方法。
本发明是通过以下技术方案实现的,本发明提出一种基于知识蒸馏的遥感变化检测方法,所述方法具体包括:
首先设计两个模型,所述两个模型分别为参数量大的教师模型和参数量小的轻量化学生模型,教师模型拥有更好的计算结果,学生模型具有更高的计算效率;其次,使用真实的遥感变化检测数据集对两个模型进行联合训练,与此同时设计一个度量函数,约束两个模型的预测,使得两个模型的预测结果保持一致,此过程称之为全局预测知识蒸馏(GP-KD);最后,针对编码器的输出进行了距离的约束,该约束过程称之为编码表示知识蒸馏(ER-KD)。
进一步地,获取到两张拍摄于相同的地点、不同的时间的遥感RGB图像
Figure BDA0003822503830000021
Figure BDA0003822503830000022
Figure BDA0003822503830000023
变化检测方法预测出的变化图为yi∈{0,1}2×H×W,其中0表示像素没有发生变化,反之1表示发生了变化,H和W分别表示图像的高度和宽度。
进一步地,公式化所述两个模型为
Figure BDA0003822503830000024
Figure BDA0003822503830000025
所述教师模型与学生模型共用孪生结构,两个模型在孪生结构中的神经网络层数不同,其中编码器为
Figure BDA0003822503830000026
解码器为
Figure BDA0003822503830000027
进一步地,全局预测知识蒸馏的目标函数是一个KL散度函数,具体的计算公式如下:
Figure BDA0003822503830000028
Figure BDA0003822503830000029
Figure BDA00038225038300000210
其中N表示双时相图像的规模,
Figure BDA00038225038300000211
是一个融合函数,两张图像经过孪生编码器
Figure BDA00038225038300000212
得到两个特征矩阵,融合函数将二者整合为一个特征便于后续的解码。
进一步地,KL散度函数的计算公式还包括:
Figure BDA00038225038300000213
KL散度
Figure BDA00038225038300000214
是一个度量两个概率分布之间距离的函数,μ(·)是一个softmax激活函数用来将
Figure BDA00038225038300000215
规模化为像素级别的概率分布。
进一步地,所述编码表示知识蒸馏(ER-KD)具体为:
获得公式(5)中的隐层表示;
Figure BDA00038225038300000216
Figure BDA00038225038300000217
所述ER-KD能够直接拉近同一图像不同模型的隐层表示,从而直接蒸馏知识,因此利用公式(6)中的L2范式对其进行约束;
Figure BDA0003822503830000031
其中We∈RL′×L是一个可学习的降维矩阵,||·||n表示Ln范式用来衡量两个向量之间的距离,ν(·)是一个函数,将patch级别的隐层表示矩阵拉平为图像级别的表示向量。
进一步地,教师模型和学生模型需要进行联合训练,其中监督训练损失如下:
Figure BDA0003822503830000032
Figure BDA0003822503830000033
Figure BDA0003822503830000034
其中,lCE(·,·)为交叉熵损失函数,α是一个可控的超参数。
进一步地,整体的优化目标函数如下:
Figure BDA0003822503830000035
其中,β和γ是可控的超参数,用于平衡多个目标函数的训练强度。
本发明提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述一种基于知识蒸馏的遥感变化检测方法的步骤。
本发明提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述一种基于知识蒸馏的遥感变化检测方法的步骤。
本发明至少具有如下优点:本发明所述的方法对模型进行优化后,模型在大规模数据集上的推理速度大大提高,同时推理结果也相比大模型不降反升,无疑达到了被期待的结果。
附图说明
图1为遥感变化检测的实例图;
图2为孪生网络基本结构示意图;
图3为基于知识蒸馏的遥感变化检测方法流程框架图;
图4为实例分析结果图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明使用模型压缩技术——知识蒸馏令小模型学习到大模型中的知识(大和小表示深度神经网络的参数量多或少)。
结合图2-图4,本发明提出一种基于知识蒸馏的遥感变化检测方法,所述方法具体包括:
首先设计两个模型,所述两个模型分别为参数量大的教师模型和参数量小的轻量化学生模型,教师模型拥有更好的计算结果,学生模型具有更高的计算效率;其次,使用真实的遥感变化检测数据集对两个模型进行联合训练,与此同时设计一个度量函数,约束两个模型的预测,使得两个模型的预测结果保持一致,此过程称之为全局预测知识蒸馏(GP-KD);最后,现有的变化检测模型往往是基于孪生神经网络,本发明针对编码器的输出进行了距离的约束,该约束过程称之为编码表示知识蒸馏(ER-KD)。
任务符号化定义:
获取到两张拍摄于相同的地点、不同的时间的遥感RGB图像
Figure BDA0003822503830000041
Figure BDA0003822503830000042
变化检测方法希望训练一个深度学习模型准确地预测出变化图yi∈{0,1}2×H×W,其中0表示像素没有发生变化,反之1表示发生了变化,H和W分别表示图像的高度和宽度。现有的变化检测方法都是基于孪生神经网络,一个参数共享的编码器
Figure BDA0003822503830000043
可以获得一个上下文图像密集表示,一个利用下采样的解码器
Figure BDA0003822503830000044
将这一密集表示转化为上文所述的变化图yi。在本发明中,
Figure BDA0003822503830000045
Figure BDA0003822503830000046
都是基于卷积神经网络CNN的结构,例如经典的残差神经网络ResNet系列。
教师模型和学生模型设计:
教师模型是一个大模型,具有丰富的学习能力和预测能力,学生模型是一个轻量模型,用于快速地推理。知识蒸馏的动机是将教师模型的优势和知识迁移到学生模型中,本发明所述方法分别公式化所述两个模型为
Figure BDA0003822503830000047
Figure BDA0003822503830000048
图2展示了教师和学生模型共用的孪生结构,所述教师模型与学生模型共用孪生结构,两个模型在孪生结构中的神经网络层数不同,其中编码器(encoder)为
Figure BDA0003822503830000049
解码器(decoder)为
Figure BDA00038225038300000410
全局预测知识蒸馏(GP-KD):
全局预测知识蒸馏的目标函数是一个Kullback-Leibler(KL)散度函数,具体的计算公式如下:
Figure BDA00038225038300000411
Figure BDA00038225038300000412
Figure BDA00038225038300000413
其中N表示双时相图像的规模,
Figure BDA0003822503830000051
是一个融合函数,例如特征拼接、相加、相减等,两张图像经过孪生编码器
Figure BDA0003822503830000052
得到两个特征矩阵,融合函数将二者整合为一个特征便于后续的解码。
KL散度函数的计算公式还包括:
Figure BDA0003822503830000053
KL散度
Figure BDA0003822503830000054
是一个度量两个概率分布之间距离的函数,μ(·)是一个softmax激活函数用来将
Figure BDA0003822503830000055
规模化为像素级别的概率分布。
随机优化算法如Adam、SGD可以将
Figure BDA0003822503830000056
向全局最小化方向进行优化,随着最小化这一目标函数,两个预测
Figure BDA0003822503830000057
Figure BDA0003822503830000058
将被拉近从而达到教师模型和学生模型之间的预测知识迁移。
编码表示知识蒸馏(ER-KD):
考虑教师模型和学生模型只在预测层面进行蒸馏会有错误传播问题,本发明设计了另外一种表示层面的蒸馏,即编码表示知识蒸馏,所述编码表示知识蒸馏(ER-KD)具体为:
获得公式(5)中的隐层表示;
Figure BDA0003822503830000059
Figure BDA00038225038300000510
所述ER-KD能够直接拉近同一图像不同模型的隐层表示,从而直接蒸馏知识,因此利用公式(6)中的L2范式对其进行约束;
Figure BDA00038225038300000511
其中We∈RL′×L是一个可学习的降维矩阵,||·||n表示Ln范式用来衡量两个向量之间的距离,ν(·)是一个函数,将patch级别的隐层表示矩阵拉平为图像级别的表示向量。
整体的优化目标:
教师模型和学生模型需要进行联合训练,其中监督训练损失如下:
Figure BDA00038225038300000512
Figure BDA00038225038300000513
Figure BDA00038225038300000514
其中,lCE(·,·)为交叉熵损失函数,α是一个可控的超参数。
综上所述,整体的优化目标函数如下:
Figure BDA0003822503830000061
其中,β和γ是可控的超参数,用于平衡多个目标函数的训练强度。
为了更好的说明本发明所述方法的效果,通过以下方式验证:
学生模型的效果提升:
表1展示了本发明提出的模型在两个公开的变化检测数据集上的表现。其中教师模型为“-”表示没有使用本发明所述的方法进行优化。对比使用本发明所述方法前后的各类评价指标,例如当教师模型为ResNet101时,本发明所述的方法使ResNet34学生模型的效果在F1上提升9.12%,这是相当可观的表现。另外,大部分学生模型在使用教师模型进行蒸馏后的结果甚至超过了教师模型的表现。
表1主要实验结果
Figure BDA0003822503830000062
实例分析:
本发明也给出一些可视化的结果,来对比蒸馏前后的效果,在图4中,其中(d)和(i)表示未蒸馏的结果,(e)和(j)表示蒸馏之后的结果,(c)和(h)为真实变化标签。通过对比可以发现,蒸馏之后一些识别错误的细节和不平滑的边缘都得以改善。
时间复杂度分析:
为了判断知识蒸馏的方法会不会大幅提高训练成本,本发明也给出了一些如表2所示的时间成本分析。总结下来,训练一个带有知识蒸馏的模型的时间相当于教师模型和学生模型分别训练的时间总和,因此并不会带来大量额外的计算时间负担。
表2时间复杂度分析结果
Figure BDA0003822503830000071
本发明还提出一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述一种基于知识蒸馏的遥感变化检测方法的步骤。
本发明还提出一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时实现所述一种基于知识蒸馏的遥感变化检测方法的步骤。
本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasablePROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambusRAM,DR RAM)。应注意,本发明描述的方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,高密度数字视频光盘(digital video disc,DVD))、或者半导体介质(例如,固态硬盘(solid state disc,SSD))等。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
应注意,本申请实施例中的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
以上对本发明所提出的一种基于知识蒸馏的遥感变化检测方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于知识蒸馏的遥感变化检测方法,其特征在于,所述方法具体包括:
首先设计两个模型,所述两个模型分别为参数量大的教师模型和参数量小的轻量化学生模型,教师模型拥有更好的计算结果,学生模型具有更高的计算效率;其次,使用真实的遥感变化检测数据集对两个模型进行联合训练,与此同时设计一个度量函数,约束两个模型的预测,使得两个模型的预测结果保持一致,此过程称之为全局预测知识蒸馏(GP-KD);最后,针对编码器的输出进行了距离的约束,该约束过程称之为编码表示知识蒸馏(ER-KD)。
2.根据权利要求1所述的方法,其特征在于,获取到两张拍摄于相同的地点、不同的时间的遥感RGB图像
Figure FDA0003822503820000011
Figure FDA0003822503820000012
变化检测方法预测出的变化图为yi∈{0,1}2×H×W,其中0表示像素没有发生变化,反之1表示发生了变化,H和W分别表示图像的高度和宽度。
3.根据权利要求2所述的方法,其特征在于,公式化所述两个模型为
Figure FDA0003822503820000013
Figure FDA0003822503820000014
所述教师模型与学生模型共用孪生结构,两个模型在孪生结构中的神经网络层数不同,其中编码器为
Figure FDA0003822503820000015
解码器为
Figure FDA0003822503820000016
4.根据权利要求3所述的方法,其特征在于,全局预测知识蒸馏的目标函数是一个KL散度函数,具体的计算公式如下:
Figure FDA0003822503820000017
Figure FDA0003822503820000018
Figure FDA0003822503820000019
其中N表示双时相图像的规模,
Figure FDA00038225038200000110
是一个融合函数,两张图像经过孪生编码器
Figure FDA00038225038200000111
得到两个特征矩阵,融合函数将二者整合为一个特征便于后续的解码。
5.根据权利要求4所述的方法,其特征在于,KL散度函数的计算公式还包括:
Figure FDA00038225038200000112
KL散度
Figure FDA00038225038200000113
是一个度量两个概率分布之间距离的函数,μ(·)是一个softmax激活函数用来将
Figure FDA00038225038200000114
规模化为像素级别的概率分布。
6.根据权利要求5所述的方法,其特征在于,所述编码表示知识蒸馏(ER-KD)具体为:
获得公式(5)中的隐层表示;
Figure FDA0003822503820000021
Figure FDA0003822503820000022
所述ER-KD能够直接拉近同一图像不同模型的隐层表示,从而直接蒸馏知识,因此利用公式(6)中的L2范式对其进行约束;
Figure FDA0003822503820000023
其中We∈RL′×L是一个可学习的降维矩阵,||·||n表示Ln范式用来衡量两个向量之间的距离,ν(·)是一个函数,将patch级别的隐层表示矩阵拉平为图像级别的表示向量。
7.根据权利要求6所述的方法,其特征在于,教师模型和学生模型需要进行联合训练,其中监督训练损失如下:
Figure FDA0003822503820000024
Figure FDA0003822503820000025
Figure FDA0003822503820000026
其中,lCE(·,·)为交叉熵损失函数,α是一个可控的超参数。
8.根据权利要求7所述的方法,其特征在于,整体的优化目标函数如下:
Figure FDA0003822503820000027
其中,β和γ是可控的超参数,用于平衡多个目标函数的训练强度。
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8任一项所述方法的步骤。
10.一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-8任一项所述方法的步骤。
CN202211046284.9A 2022-08-30 2022-08-30 一种基于知识蒸馏的遥感变化检测方法 Pending CN115311318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211046284.9A CN115311318A (zh) 2022-08-30 2022-08-30 一种基于知识蒸馏的遥感变化检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211046284.9A CN115311318A (zh) 2022-08-30 2022-08-30 一种基于知识蒸馏的遥感变化检测方法

Publications (1)

Publication Number Publication Date
CN115311318A true CN115311318A (zh) 2022-11-08

Family

ID=83865684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211046284.9A Pending CN115311318A (zh) 2022-08-30 2022-08-30 一种基于知识蒸馏的遥感变化检测方法

Country Status (1)

Country Link
CN (1) CN115311318A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116665064A (zh) * 2023-07-27 2023-08-29 城云科技(中国)有限公司 基于生成蒸馏与特征扰动的城市变化图生成方法及其应用
CN116993663A (zh) * 2023-06-12 2023-11-03 阿里巴巴(中国)有限公司 图像处理方法、图像处理模型的训练方法
CN117475155A (zh) * 2023-12-26 2024-01-30 厦门瑞为信息技术有限公司 基于半监督学习的轻量级遥感图像分割方法
CN117521848A (zh) * 2023-11-10 2024-02-06 中国科学院空天信息创新研究院 面向资源受限场景的遥感基础模型轻量化方法、装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116993663A (zh) * 2023-06-12 2023-11-03 阿里巴巴(中国)有限公司 图像处理方法、图像处理模型的训练方法
CN116993663B (zh) * 2023-06-12 2024-04-30 阿里巴巴(中国)有限公司 图像处理方法、图像处理模型的训练方法
CN116665064A (zh) * 2023-07-27 2023-08-29 城云科技(中国)有限公司 基于生成蒸馏与特征扰动的城市变化图生成方法及其应用
CN116665064B (zh) * 2023-07-27 2023-10-13 城云科技(中国)有限公司 基于生成蒸馏与特征扰动的城市变化图生成方法及其应用
CN117521848A (zh) * 2023-11-10 2024-02-06 中国科学院空天信息创新研究院 面向资源受限场景的遥感基础模型轻量化方法、装置
CN117521848B (zh) * 2023-11-10 2024-05-28 中国科学院空天信息创新研究院 面向资源受限场景的遥感基础模型轻量化方法、装置
CN117475155A (zh) * 2023-12-26 2024-01-30 厦门瑞为信息技术有限公司 基于半监督学习的轻量级遥感图像分割方法
CN117475155B (zh) * 2023-12-26 2024-04-02 厦门瑞为信息技术有限公司 基于半监督学习的轻量级遥感图像分割方法

Similar Documents

Publication Publication Date Title
CN115311318A (zh) 一种基于知识蒸馏的遥感变化检测方法
CN111819580A (zh) 用于密集图像预测任务的神经架构搜索
CN113159073B (zh) 知识蒸馏方法及装置、存储介质、终端
CN110910422A (zh) 目标跟踪方法、装置、电子设备和可读存储介质
CN111210446B (zh) 一种视频目标分割方法、装置和设备
US20230063148A1 (en) Transfer model training method and apparatus, and fault detection method and apparatus
He et al. STNN: A spatio-temporal neural network for traffic predictions
CN112966754B (zh) 样本筛选方法、样本筛选装置及终端设备
CN113065013B (zh) 图像标注模型训练和图像标注方法、系统、设备及介质
WO2023116632A1 (zh) 基于时空记忆信息的视频实例分割方法和分割装置
Li et al. Optimizing the Deep Neural Networks by Layer‐Wise Refined Pruning and the Acceleration on FPGA
CN113327599B (zh) 语音识别方法、装置、介质及电子设备
CN117217368A (zh) 预测模型的训练方法、装置、设备、介质及程序产品
CN117693754A (zh) 训练用于图像修复的经掩模的自动编码器
Zhou et al. Ship detection based on multi-scale weighted fusion
WO2023185209A1 (zh) 模型剪枝
CN116662411A (zh) 场景模板库的构建方法、对象预测方法及装置、电子设备
WO2022223052A1 (zh) 加速器、计算机系统和方法
CN116128048A (zh) 光学遥感图像云检测模型训练方法、检测方法和装置
WO2021146977A1 (zh) 网络结构搜索方法和装置
CN115082820A (zh) 一种监控视频中群体全局异常行为检测方法和装置
CN114708110A (zh) 续保行为预测模型的联合训练方法、装置及电子设备
CN114298290A (zh) 一种基于自监督学习的神经网络编码方法及编码器
Wang et al. An input sampling scheme to radar echo extrapolation for RNN-based models
Zhu et al. Uncertainty-aware boundary attention network for real-time semantic segmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination