CN111931747B - 一种适于多任务迭代学习记忆的遥感图像分类方法 - Google Patents
一种适于多任务迭代学习记忆的遥感图像分类方法 Download PDFInfo
- Publication number
- CN111931747B CN111931747B CN202011074327.5A CN202011074327A CN111931747B CN 111931747 B CN111931747 B CN 111931747B CN 202011074327 A CN202011074327 A CN 202011074327A CN 111931747 B CN111931747 B CN 111931747B
- Authority
- CN
- China
- Prior art keywords
- model
- classifier
- task
- parameter
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
技术领域
本发明涉及遥感图像处理与识别技术领域,尤其涉及一种适于多任务迭代学习记忆的遥感图像分类方法。
背景技术
在当前大数据和人工智能快速发展的时代,在面临不断更新迭代的海量数据时,深度学习模型也需要不断的进行学习和更新,不断的调整模型以满足当前人们的需求。然而,现有的深度学习模型一旦在特定的任务上训练完成后,该模型就只能用于该项任务的预测,一旦模型继续学习新的任务,就会在之前已经学习过的任务上出现灾难性遗忘的现象,即模型无法保持在旧任务上的性能。而每次都将所有的数据混合在一起重新对模型进行训练的方式不仅浪费了存储空间,而且也将消耗大量的时间来训练模型,大大降低了深度学习算法的实用化和商业化的可能性。因此,灾难性遗忘问题严重影响了深度学习模型在持续学习多个任务时的性能。
为了减轻深度学习模型中存在的灾难性遗忘问题,过去的一些研究主要可以分为三大类:1)基于正则化的连续学习方法;2)基于结构化的连续学习方法;3)基于预排练的连续学习方法。其中,基于正则化的连续学习方法包括弹性权重巩固EWC、记忆感知突触MAS等方法,通过约束对旧任务重要参数的更新来减轻模型对旧任务的灾难性遗忘,然而,随着学习的新任务数量的增加,重要参数的累积误差增加,模型无法找到满足所有任务的公共解空间,因而造成模型克服灾难性遗忘的能力下降;基于结构化的连续学习方法例如CWR,通过冻结一部分神经元结构来保护模型在旧任务上的性能,但是这种方法丧失了学习新任务时对网络结构调整的灵活性;基于预排练的连续学习方法认为,不定期的让模型见到一些旧任务的样本有助于唤醒模型对旧任务的性能,例如在iCARL方法中,使用了一个范例集来存储旧任务的典型的部分样本数据。基于预排练的方法不仅能够有效地控制灾难性遗忘,而且还能提高模型在旧任务上的准确性,但该方法需要存储旧任务的历史数据。当前克服灾难性遗忘的方法存在以上弊端,因此,需要一种更加精确、实用、可靠、有效的方法来解决深度学习模型中灾难性遗忘的问题,进而适于多任务迭代学习记忆的遥感图像分类方法。
发明内容
有鉴于此,本发明的目的在于提供一种适于多任务迭代学习记忆的遥感图像分类方法,所述方法基于参数敏感性与结构化相结合,能够有效的克服深度学习模型中存在的灾难性遗忘的问题,适于解决多任务迭代学习记忆的遥感图像分类问题。
本发明的目的是这样实现的,一种适于多任务迭代学习记忆的遥感图像分类方法,包括以下步骤:
步骤6,每当进来一个新任务对其进行训练时,重复步骤3、步骤4和步骤5即可;
步骤7,使用训练好的模型分类器对遥感图像进行分类。
每当新进来一个任务时,按照下列公式对在其任务的原有损失函数上添加一个正则项来限制分类器之前的参数的更新:
其中,avg(tw)为临时权重tw的所有类的均值。
具体地,步骤5中所述的利用新任务的训练数据计算模型中每个参数的敏感性矩阵,将当前任务的敏感性矩阵与之前任务的敏感性矩阵进行累加并取均值,作为下一个任务训练的损失函数中添加的参数的敏感性矩阵,包括以下步骤:
与现有方法相比,本发明的优点在于:(1)本发明提出了一种新的将参数敏感性与冻结旧任务神经元结构相结合的方法,该方法可以有效减轻深度学习模型中灾难性遗忘的问题;(2)本发明提出的计算参数敏感性的方法可以与场景无关的,可以在任意场景中使用本发明提出的方法来计算模型中每个参数的重要程度;(3)本发明提出的方法在计算参数敏感性时不需要标签,使得该方法能够更适用于真实分类场景中。
附图说明
图1示出了本发明实施例的流程示意图;
图2示出了本发明实施例选用的CLRS数据集每类场景部分影像实施例示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明实施例的流程示意图,一种适于多任务迭代学习记忆的遥感图像分类方法,包括以下步骤:
步骤1,初始化模型分类器之前的参数、分类器的固定权重cw=0以及分类器的临时权重tw=0,使用随机梯度下降训练第一个任务,学习得到和tw,将分类器的临时权重tw赋值给固定权重cw,利用和cw预测性能;
其中,avg(tw)为临时权重tw的所有类的均值。
Hessian矩阵的计算复杂度很高,因此,利用对角Fisher信息矩阵来近似的逼近Hessian矩阵,对于多分类问题,使用输出函数的l2范数的平方对参数的梯度来代替计算参数敏感性,只需要通过一次反向传播就可以计算出参数的敏感性矩阵。公式如下:
每当新进来一个任务时,按照下列公式对在其任务的原有损失函数上添加一个正则项来限制分类器之前的参数的更新:
步骤4,在分类器中拓展新的神经元用于学习新任务中的新的类,重新初始化分类器的临时权重tw=0,使用随机梯度下降训练模型,学习得到分类器的临时权重tw,将分类器的临时权重tw赋值给固定权重cw,利用和cw预测性能;
其中,avg(tw)为临时权重tw的所有类的均值。
步骤6,每当进来一个新任务对其进行训练时,重复步骤3、步骤4和步骤5即可。
步骤7,使用训练好的模型分类器对遥感图像进行分类。
实验主要从在单增量应用场景中,深度学习模型学习多个任务后的精度表现来对本发明提出的方法的有效性进行评价。本发明的实验主要是用来证明本发明提出的方法能够有效的减轻深度学习模型中的灾难性遗忘问题。
基于CLRS数据集,如图2,在CLRS数据集提供的新的类场景(NC场景)中让模型依次学习五个任务。使用19层的ResNet模型作为基础的场景分类网络,使用了随机翻转的数据增强方式以及使用了dropout来防止模型出现过拟合,dropout值设置为0.5,所有的参数均使用Xavier初始化,利用随机梯度下降法来对网络进行优化,学习率大小设置为0.001,batch size大小设置为64,利用了单增量任务场景中的分类精度(Accuracy)指标来评估不同方法的性能。
结果表明,在NC场景中,由于没有任何控制遗忘的措施,SGD方法的性能是最差的,旧任务的场景类被模型几乎完全遗忘。三种正则化的方法EWC、MAS以及LWF在该场景中的性能表现不佳;相比正则化的方法,结构化的方法CWR在克服灾难性遗忘方面的性能有了很大提升,然而,由于模型在学习完第一个任务后,分类器之前的所有层的参数均被冻结,所以CWR方法也降低了灵活学习新任务的能力。与其他方法相比,本发明提出的方法在性能上取得了最佳。此外,与CWR相比,本文提出的方法可以灵活的调整分类器之前的参数。通过与其他连续学习方法的对比,本发明提出的方法在NC场景上可以很好的克服灾难性遗忘。此外,在学习完五个任务后,本发明提出的方法的精度曲线仍然呈上升趋势,未达到饱和,这表明,本发明提出的方法仍然能够较好的学习更长序列的任务。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
Claims (2)
1.一种适于多任务迭代学习记忆的遥感图像分类方法,其特征在于,包括以下步骤:
步骤1,初始化模型分类器之前的参数、分类器的固定权重以及分类器的临时权重,使用随机梯度下降训练第一个任务,学习得到和,将分类器的临时权重赋值给固定权重,利用和预测性能;所述的将分类器的临时权重赋值给固定权重,包括以下步骤:
步骤5,利用新任务的训练数据计算模型中每个参数的敏感性矩阵,将当前任务的敏感性矩阵与之前任务的敏感性矩阵进行累加并取均值,作为下一个任务训练的损失函数中添加的参数的敏感性矩阵;具体按照下列公式计算累加之后取均值的参数的敏感性矩阵:
步骤6,每当进来一个新任务对其进行训练时,重复步骤3、步骤4和步骤5即可;
步骤7,使用训练好的模型分类器对遥感图像进行分类。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011074327.5A CN111931747B (zh) | 2020-10-10 | 2020-10-10 | 一种适于多任务迭代学习记忆的遥感图像分类方法 |
AU2021101580A AU2021101580A4 (en) | 2020-10-10 | 2021-03-27 | Remote sensing image classification method for multi-task iterative learning and memorizing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011074327.5A CN111931747B (zh) | 2020-10-10 | 2020-10-10 | 一种适于多任务迭代学习记忆的遥感图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931747A CN111931747A (zh) | 2020-11-13 |
CN111931747B true CN111931747B (zh) | 2021-01-29 |
Family
ID=73334306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011074327.5A Active CN111931747B (zh) | 2020-10-10 | 2020-10-10 | 一种适于多任务迭代学习记忆的遥感图像分类方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111931747B (zh) |
AU (1) | AU2021101580A4 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115410051B (zh) * | 2022-11-02 | 2023-01-24 | 华中科技大学 | 一种再可塑性启发的连续图像分类方法与系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5086157B2 (ja) * | 2008-04-03 | 2012-11-28 | 株式会社日立製作所 | 画像判読支援方法 |
CN104217214B (zh) * | 2014-08-21 | 2017-09-19 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb‑d人物行为识别方法 |
CN104850836B (zh) * | 2015-05-15 | 2018-04-10 | 浙江大学 | 基于深度卷积神经网络的害虫图像自动识别方法 |
WO2017086960A1 (en) * | 2015-11-19 | 2017-05-26 | Halliburton Energy Services, Inc. | Simultaneous error correction and inversion |
US10217236B2 (en) * | 2016-04-08 | 2019-02-26 | Orbital Insight, Inc. | Remote determination of containers in geographical region |
CN106485286B (zh) * | 2016-10-29 | 2020-10-20 | 华东理工大学 | 一种基于局部敏感判别的矩阵分类模型 |
CN107179291B (zh) * | 2017-05-10 | 2020-02-14 | 中国科学院合肥物质科学研究院 | 基于太赫兹光谱与深度自动编码器的土壤重金属元素含量预测方法 |
EP3657653A1 (en) * | 2018-11-23 | 2020-05-27 | Ingeteam Power Technology, S.A. | Modulation method for an electronic power conversion system |
CN109754079A (zh) * | 2018-12-13 | 2019-05-14 | 中南大学 | 一种基于参数重要性克服灾难性遗忘的方法 |
CN111208425B (zh) * | 2020-01-13 | 2022-02-18 | 郑州轻工业大学 | 高精度异步电机系统状态模型的构建方法及异步电机状态检测方法 |
CN111281385B (zh) * | 2020-03-06 | 2023-01-31 | 中国人民解放军第四军医大学 | 一种基于组织空间分布特征和阻抗随频率变化特性的电阻抗成像方法 |
-
2020
- 2020-10-10 CN CN202011074327.5A patent/CN111931747B/zh active Active
-
2021
- 2021-03-27 AU AU2021101580A patent/AU2021101580A4/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN111931747A (zh) | 2020-11-13 |
AU2021101580A4 (en) | 2021-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109816032B (zh) | 基于生成式对抗网络的无偏映射零样本分类方法和装置 | |
CN110866530A (zh) | 一种字符图像识别方法、装置及电子设备 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN114387486A (zh) | 基于持续学习的图像分类方法以及装置 | |
CN114842343A (zh) | 一种基于ViT的航空图像识别方法 | |
CN114612721A (zh) | 基于多层次自适应特征融合类增量学习的图像分类方法 | |
CN115358305A (zh) | 一种基于边界样本迭代生成的增量学习鲁棒性提升方法 | |
CN114548591A (zh) | 一种基于混合深度学习模型和Stacking的时序数据预测方法及系统 | |
Lee et al. | Learning in the wild: When, how, and what to learn for on-device dataset adaptation | |
CN111160526B (zh) | 基于mape-d环形结构的深度学习系统在线测试方法与装置 | |
CN111931747B (zh) | 一种适于多任务迭代学习记忆的遥感图像分类方法 | |
Szadkowski et al. | Continually trained life-long classification | |
CN110705631B (zh) | 一种基于svm的散货船舶设备状态检测方法 | |
Qin et al. | Remaining useful life prediction using temporal deep degradation network for complex machinery with attention-based feature extraction | |
CN111652264B (zh) | 基于最大均值差异的负迁移样本筛选方法 | |
CN112819100A (zh) | 无人机平台多尺度目标检测方法和装置 | |
CN117154256A (zh) | 锂电池的电化学修复方法 | |
CN112527959A (zh) | 基于无池化卷积嵌入和注意分布神经网络的新闻分类方法 | |
CN116579468A (zh) | 基于云系记忆的台风生成预测方法、装置、设备及介质 | |
Thirumaladevi et al. | Improved transfer learning of CNN through fine-tuning and classifier ensemble for scene classification | |
CN116992937A (zh) | 神经网络模型的修复方法和相关设备 | |
Shankarampeta et al. | Few-Shot Class Incremental Learning with Generative Feature Replay. | |
CN113033212B (zh) | 文本数据处理方法及装置 | |
He et al. | Collective neurodynamic optimization for image segmentation by binary model with constraints | |
Netto et al. | Prediction of environmental conditions for maritime navigation using a network of sensors: A practical application of graph neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |