CN115019183A - 基于知识蒸馏和图像重构的遥感影像模型迁移方法 - Google Patents
基于知识蒸馏和图像重构的遥感影像模型迁移方法 Download PDFInfo
- Publication number
- CN115019183A CN115019183A CN202210900359.9A CN202210900359A CN115019183A CN 115019183 A CN115019183 A CN 115019183A CN 202210900359 A CN202210900359 A CN 202210900359A CN 115019183 A CN115019183 A CN 115019183A
- Authority
- CN
- China
- Prior art keywords
- model
- data
- data set
- tested
- teacher
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 21
- 230000005012 migration Effects 0.000 title claims abstract description 17
- 238000013508 migration Methods 0.000 title claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 230000015556 catabolic process Effects 0.000 claims description 11
- 238000006731 degradation reaction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 230000002950 deficient Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 2
- 238000004821 distillation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于知识蒸馏和图像重构的遥感影像模型迁移方法,包括:在样本充足和标注完整的数据集A中训练第一目标检测模型,获得教师模型;利用知识蒸馏对所述教师模型进行压缩,获得学生模型,并在样本不足的数据集B中进行训练;利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别,获得第一判别结果;重构所述待测试数据,使所述待测试数据与所述数据集A的数据类型相同,利用所述教师模型对重构后的待测试数据进行判别,获得第二判别结果;将所述第一判别结果和所述第二判别结果的全连接层进行加权融合,获得用于判别所述待测试数据的第二目标检测模型。该方法可实现不同类型遥感影像的模型迁移。
Description
技术领域
本发明涉及深度学习与模型迁移识别技术领域,尤其涉及一种基于知识蒸馏和图像重构的遥感影像模型迁移方法。
背景技术
由不同卫星获取的遥感图像存在数据类型差异较大、获取的数据数量不均衡和标注难度也各有不同的问题,导致不同数据之间的模型无法直接相互迁移使用,而且某些遥感卫星数据量(样本较少)难以支撑大规模训练,尤其是对于相似任务不同类型的新卫星获取的遥感图像数据,在使用这些数据时存在标注困难和常常需要重复标注等一系列的应用难题,效率低。
在不同类型数据的模型迁移任务中,现有主流的深度学习方法主要为基于预训练模型进行迁移学习训练,但是需要重复标注、耗时耗力,且预训练模型在新的数据量较小的情况下也无法达到较好的学习效果,往往也仍旧需要对新的数据进行重新标注和训练。
发明内容
为解决上述现有技术存在的技术问题,本发明的目的在于提供一种基于知识蒸馏和图像重构的遥感影像模型迁移方法,实现不同类型遥感影像的模型迁移。
为实现上述发明目的,本发明的技术方案是:
本发明提供一种基于知识蒸馏和图像重构的遥感影像模型迁移方法,包括:
在样本充足和标注完整的数据集A中训练第一目标检测模型,获得教师模型;
利用知识蒸馏对所述教师模型进行压缩,获得学生模型,并在样本不足的数据集B中进行训练;
利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别,获得第一判别结果;
重构所述待测试数据,使所述待测试数据与所述数据集A的数据类型相同,利用所述教师模型对重构后的待测试数据进行判别,获得第二判别结果;
将所述第一判别结果和所述第二判别结果的全连接层进行加权融合,获得用于判别所述待测试数据的第二目标检测模型。
根据本发明的一个方面,所述数据集A和所述数据集B分别包含不同数据类型的遥感影像。
根据本发明的一个方面,在样本充足和标注完整的数据集A中训练第一目标检测模型,获得教师模型,包括:
判断所述数据集A中遥感影像的目标名称和目标区域,使用最小外接倾斜矩形框标注所述目标区域,标注所述目标名称和所述矩形框的四个角点位置;
对标注的遥感影像进行切片和翻转的预处理;
将处理后的遥感影像输入所述第一目标检测模型进行训练,获得教师模型。
根据本发明的一个方面,所述第一目标检测模型采用主干网络为resnet50的残差网络结构,采用Faster R-CNN算法对所述第一目标检测模型进行训练。
根据本发明的一个方面,利用知识蒸馏对所述教师模型进行压缩,获得学生模型,并在样本不足的数据集B中进行训练,包括:
在所述教师模型的全连接层的softmax输出中引入玻尔兹曼分布的温度系数,获得学生模型,当所述温度系数越趋向于0且所述温度系数越大,所述学生模型更接近于所述教师模型;
对所述教师模型和所述学生模型的交叉熵进行最小化,利用样本不足的数据集B训练优化所述学生模型,得到所述交叉熵最小的系数所对应的学生模型。
根据本发明的一个方面,所述学生模型为:
所述最小化的交叉熵为:
根据本发明的一个方面,利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别,获得第一判别结果,包括:
将与所述数据集B的数据类型相同的待测试数据输入训练后的学生模型中;
利用所述训练后的学生模型采用two-stage目标检测算法对所述待测试数据的目标进行推理定位和判别,输出每个定位框的第一判别结果;
判断所述第一判别结果是否满足第一预设阈值,并记录满足所述第一预设阈值的目标位置和判别概率,作为最终的第一判别结果。
根据本发明的一个方面,重构所述待测试数据,使所述待测试数据与所述数据集A的数据类型相同,包括:
对所述数据集B和所述数据集A的数据类型进行比较和判断;
对所述数据集A中的数据进行处理,获得与所述数据集B的数据类型相同的数据集Ab;
根据本发明的一个方面,利用所述教师模型对重构后的待测试数据进行判别,获得第二判别结果,包括:
将重构后与所述数据集A的数据类型相同的待测试数据输入所述教师模型中;
利用所述教师模型对所述待测试数据进行推理定位、回归和分类,输出每个定位框的第二判别结果;
判断所述第二判别结果是否满足第二预设阈值,并记录满足所述第二预设阈值的目标位置和判别概率,作为最终的第二判别结果。
根据本发明的一个方面,所述加权融合的公式为:
与现有技术相比,本发明具有如下优点:
根据本发明的方案,利用知识蒸馏构建了教师-学生网络模型,使用样本充足、标注完整的遥感数据训练得到教师网络模型,对教师网络模型蒸馏出数据量小,标注目标少的不同类型遥感数据所对应的学生网络模型。不同于传统的知识蒸馏只保留学生模型作为最终模型,本发明利用图像重构模型使得新类型数据可以转化为教师模型对应类型的数据,对教师模型进行再次利用,并最终将学生模型、教师模型和图像重构模型三者融为一个模型,实现不同类型遥感影像的模型迁移。
根据本发明的一个方案,利用图像重构模型,可以将数据量少的数据转化为已有模型(教师模型)对应的数据类型,便可以直接利用已有模型对新类型的数据进行推理,大大较少了对新数据的数据量和标注量的需求,节省了人力物力,将对新数据的重新训练过程转化为新数据类型变为旧数据类型的过程,可以更好地利用已经训练好的网络模型。
附图说明
为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性表示本发明实施例公开的一种基于知识蒸馏和图像重构的遥感影像模型迁移方法的实现流程图;
图2示意性表示本发明实施例公开的知识蒸馏的实现流程图;
图3示意性表示本发明实施例公开的构建和优化图像重构模型的实现流程图;
图4示意性表示本发明实施例公开的获得第二目标检测模型与联合判别的实现流程图。
具体实施方式
此说明书实施方式的描述应与相应的附图相结合,附图应作为完整的说明书的一部分。在附图中,实施例的形状或是厚度可扩大,并以简化或是方便标示。再者,附图中各结构的部分将以分别描述进行说明,值得注意的是,图中未示出或未通过文字进行说明的元件,为所属技术领域中的普通技术人员所知的形式。
此处实施例的描述,有关方向和方位的任何参考,均仅是为了便于描述,而不能理解为对本发明保护范围的任何限制。以下对于优选实施方式的说明会涉及到特征的组合,这些特征可能独立存在或者组合存在,本发明并不特别地限定于优选的实施方式。本发明的范围由权利要求书所界定。
参见图1,本发明实施例公开的一种基于知识蒸馏和图像重构的遥感影像模型迁移方法,包括以下步骤:
步骤100、在样本充足和标注完整的数据集A中训练第一目标检测模型,获得教师模型。需要注意的是,数据集A包含的是数据量足够大、标注数据足够多且标注准确,用于训练得到稳定的深度检测识别模型的遥感影像数据。
在一个实施例中,步骤100中在样本充足和标注完整的数据集A中训练第一目标检测模型,获得教师模型的具体实施过程包括:
步骤101、判断所述数据集A中遥感影像的目标名称和目标区域(即目标位置),使用最小外接倾斜矩形框标注所述目标区域,标注所述目标名称和所述矩形框的四个角点位置。
步骤102、对标注的遥感影像进行切片和翻转的预处理。
步骤103、将处理后的遥感影像输入所述第一目标检测模型进行训练,获得教师模型。具体的,该第一目标检测模型采用主干网络为resnet50的残差网络结构。将处理后的遥感影像输入第一目标检测模型后,采用Faster R-CNN算法对第一目标检测模型进行训练,获得教师模型。
步骤200、利用知识蒸馏对所述教师模型进行压缩,获得学生模型,并在样本不足的数据集B中进行训练。需要注意的是,数据集B包含的是数据量较少且不足以训练得到稳定的深度检测识别模型的遥感影像数据。
在一个实施例中,参见图2,步骤200中利用知识蒸馏对所述教师模型进行压缩,获得学生模型,并在样本不足的数据集B中进行训练的具体实施过程包括:
步骤201、在所述教师模型的全连接层的softmax输出中引入玻尔兹曼分布的温度系数,获得学生模型,当所述温度系数越趋向于0且所述温度系数越大,所述学生模型更接近于所述教师模型。将教师模型的最后一层也就是全连接层(或softmax层)的softmax输出作为教师的知识指导学生模型,引入的玻尔兹曼分布中的温度系数可以使教师模型的输出更平滑,温度系数越趋向于0时,模型越收敛为one-hot向量,温度系数越大,新模型(学生模型)更接近于原模型(教师模型)。
步骤202、对所述教师模型和所述学生模型的交叉熵C(Cross-entropy)进行最小化,利用样本不足的数据集B训练优化所述学生模型,也就是对所述处理后的教师模型的输出在数据集B上进行优化,得到使得所述交叉熵最小的系数,将该系数对应的教师模型的输出模型q作为训练最后得到的学生模型。
具体的,在教师模型对学生模型的指导训练过程中,所述最小化的交叉熵C为:
在一个实施例中,所述数据集A和所述数据集B分别所包含的遥感影像的数据类型不同。
步骤300、利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别,获得第一判别结果。
在一个实施例中,参见图4,步骤300中利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别,获得第一判别结果的具体实施过程包括:
步骤301、将与所述数据集B的数据类型相同的待测试数据输入训练后的学生模型中,也就是所述步骤202最后得到的学生模型q中。
步骤302、利用所述训练后的学生模型采用two-stage目标检测算法对所述待测试数据的目标进行推理定位和判别,输出每个定位框的第一判别结果,即softmax判别结果Ps。
步骤303、判断所述第一判别结果是否满足第一预设阈值,并记录满足所述第一预设阈值的目标位置和判别概率,作为最终的第一判别结果。需要注意的是,这里满足的条件指的是第一判别结果大于等于第一预设阈值。
步骤400、重构所述待测试数据,使所述待测试数据与所述数据集A的数据类型相同,利用所述教师模型对重构后的待测试数据进行判别,获得第二判别结果。
在一个实施例中,参见图3,步骤400中重构所述待测试数据,使所述待测试数据与所述数据集A的数据类型相同的具体实施过程包括:
步骤401、对所述数据集B和所述数据集A的数据类型进行比较和判断。
步骤402、对所述数据集A中的数据进行处理,获得与所述数据集B的数据类型相同的数据集Ab。
其中, 为所述退化模型 的反投影, 为随机噪声, 为图像重构模型,在训练过程中,利用基于峰值信噪比建立的损失函数对所述退化模型的反投影进行迭代优化,获得所述图像重构模型。由于重构前的待测试数据与数据集B中的数据类型相同,所以可以利用使得数据集B与数据集A的数据类型相同的重构过程及其相应的图像重构模型对待测试数据进行重构,使其数据类型与数据集A的相同。
在一个实施例中,参见图4,步骤400中利用所述教师模型对重构后的待测试数据进行判别,获得第二判别结果的具体实施过程包括:
步骤405、将重构后与所述数据集A的数据类型相同的待测试数据输入所述教师模型中。
步骤406、利用所述教师模型对所述待测试数据进行推理定位、回归和分类,输出每个定位框的第二判别结果,即softmax判别结果Pt。
步骤407、判断所述第二判别结果是否满足第二预设阈值,并记录满足所述第二预设阈值的目标位置和判别概率,作为最终的第二判别结果。需要注意的是,这里满足的条件指的是第二判别结果大于等于第二预设阈值。
步骤500、将所述第一判别结果和所述第二判别结果的全连接层进行加权融合,获得用于判别所述待测试数据的第二目标检测模型。
在一个实施例中,所述加权融合的公式为:
其中, 为权重系数, 为所述第一判别结果, 为所述第二判别结果, 为所述第二目标检测模型的全连接层。全连接层即为softmax层,所述第二目标检测模型即为融合后的softmax层。对所述第一判别结果和所述第二判别结果的全连接层进行加权融合时,相同区域取最大并集。利用融合后的结果,即融合后的softmax层或第二目标检测模型对待测试数据进行综合判别,得到最终的判别结果综合利用的信息广,实现高精度判别。
本发明实施例提供的基于知识蒸馏和图像重构的遥感影像模型迁移方法,在数据量较大、标注数据较多的遥感影像数据集A中训练的模型作为教师模型,在数据量较小的遥感影像数据集B中使用知识蒸馏的方法压缩教师模型,得到学生模型。利用学生模型对与数据集B同类型的待测试数据进行判别,得到判别结果一,利用图像重构模型对数据集B进行处理,获得与数据集A同一类型的数据,再利用该重构方法对待测试数据重构为与数据集A相同类型的数据,并使用教师模型进行判别,得到判别结果二,最后将判别结果一和判别结果二的softmax层进行加权融合,再利用融合后的softmax层的进行总判别,得到高精度识别与数据集A类型不同的待测试数据的目标检测模型,从而实现不同类型的遥感图像之间的模型迁移。
该方法改变了传统深度学习中使用预训练模型进行模型迁移和传统模型迁移中需要对新的数据进行再次训练的方法,通过知识蒸馏和图像变换的方法以达到不同类型遥感影像模型迁移的目的,实现不同卫星遥感影像之间的模型迁移,而且比传统方法减少了对新模型数据量的依赖。
对于本发明的方法所涉及的上述各个步骤的序号并不意味着方法执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本发明的实施方式的实施过程构成任何限定。
以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.一种基于知识蒸馏和图像重构的遥感影像模型迁移方法,包括:
在样本充足和标注完整的数据集A中训练第一目标检测模型,获得教师模型;
利用知识蒸馏对所述教师模型进行压缩,获得学生模型,并在样本不足的数据集B中进行训练;
利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别,获得第一判别结果;
重构所述待测试数据,使所述待测试数据与所述数据集A的数据类型相同,利用所述教师模型对重构后的待测试数据进行判别,获得第二判别结果;
将所述第一判别结果和所述第二判别结果的全连接层进行加权融合,获得用于判别所述待测试数据的第二目标检测模型。
2.根据权利要求1所述的方法,其特征在于,所述数据集A和所述数据集B分别包含不同数据类型的遥感影像。
3.根据权利要求1所述的方法,其特征在于,在样本充足和标注完整的数据集A中训练第一目标检测模型,获得教师模型,包括:
判断所述数据集A中遥感影像的目标名称和目标区域,使用最小外接倾斜矩形框标注所述目标区域,标注所述目标名称和所述矩形框的四个角点位置;
对标注的遥感影像进行切片和翻转的预处理;
将处理后的遥感影像输入所述第一目标检测模型进行训练,获得教师模型。
4.根据权利要求3所述的方法,其特征在于,所述第一目标检测模型采用主干网络为resnet50的残差网络结构,采用Faster R-CNN算法对所述第一目标检测模型进行训练。
5.根据权利要求1所述的方法,其特征在于,利用知识蒸馏对所述教师模型进行压缩,获得学生模型,并在样本不足的数据集B中进行训练,包括:
在所述教师模型的全连接层的softmax输出中引入玻尔兹曼分布的温度系数,获得学生模型,当所述温度系数越趋向于0且所述温度系数越大,所述学生模型更接近于所述教师模型;
对所述教师模型和所述学生模型的交叉熵进行最小化,利用样本不足的数据集B训练优化所述学生模型,得到所述交叉熵最小的系数所对应的学生模型。
7.根据权利要求1所述的方法,其特征在于,利用训练后的学生模型对与所述数据集B的数据类型相同的待测试数据进行判别,获得第一判别结果,包括:
将与所述数据集B的数据类型相同的待测试数据输入训练后的学生模型中;
利用所述训练后的学生模型采用two-stage目标检测算法对所述待测试数据的目标进行推理定位和判别,输出每个定位框的第一判别结果;
判断所述第一判别结果是否满足第一预设阈值,并记录满足所述第一预设阈值的目标位置和判别概率,作为最终的第一判别结果。
8.根据权利要求1所述的方法,其特征在于,重构所述待测试数据,使所述待测试数据与所述数据集A的数据类型相同,包括:
对所述数据集B和所述数据集A的数据类型进行比较和判断;
对所述数据集A中的数据进行处理,获得与所述数据集B的数据类型相同的数据集Ab;
9.根据权利要求1所述的方法,其特征在于,利用所述教师模型对重构后的待测试数据进行判别,获得第二判别结果,包括:
将重构后与所述数据集A的数据类型相同的待测试数据输入所述教师模型中;
利用所述教师模型对所述待测试数据进行推理定位、回归和分类,输出每个定位框的第二判别结果;
判断所述第二判别结果是否满足第二预设阈值,并记录满足所述第二预设阈值的目标位置和判别概率,作为最终的第二判别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210900359.9A CN115019183B (zh) | 2022-07-28 | 2022-07-28 | 基于知识蒸馏和图像重构的遥感影像模型迁移方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210900359.9A CN115019183B (zh) | 2022-07-28 | 2022-07-28 | 基于知识蒸馏和图像重构的遥感影像模型迁移方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115019183A true CN115019183A (zh) | 2022-09-06 |
CN115019183B CN115019183B (zh) | 2023-01-20 |
Family
ID=83065312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210900359.9A Active CN115019183B (zh) | 2022-07-28 | 2022-07-28 | 基于知识蒸馏和图像重构的遥感影像模型迁移方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115019183B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204770A (zh) * | 2022-12-12 | 2023-06-02 | 中国公路工程咨询集团有限公司 | 一种用于桥梁健康监测数据异常检测的训练方法及装置 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
CN111626330A (zh) * | 2020-04-23 | 2020-09-04 | 南京邮电大学 | 基于多尺度特征图重构和知识蒸馏的目标检测方法与系统 |
CN112200318A (zh) * | 2020-10-10 | 2021-01-08 | 广州云从人工智能技术有限公司 | 一种目标检测方法、装置、机器可读介质及设备 |
CN112418343A (zh) * | 2020-12-08 | 2021-02-26 | 中山大学 | 多教师自适应联合知识蒸馏 |
CN113344206A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 融合通道与关系特征学习的知识蒸馏方法、装置及设备 |
CN113486665A (zh) * | 2021-07-05 | 2021-10-08 | 哈尔滨工业大学(深圳) | 隐私保护文本命名实体识别方法、装置、设备及存储介质 |
CN113487482A (zh) * | 2021-07-01 | 2021-10-08 | 国网山东省电力公司威海供电公司 | 一种基于元迁移学习的自适应超分辨率方法 |
CN113486990A (zh) * | 2021-09-06 | 2021-10-08 | 北京字节跳动网络技术有限公司 | 内窥镜图像分类模型的训练方法、图像分类方法和装置 |
US20210383238A1 (en) * | 2020-06-05 | 2021-12-09 | Aref JAFARI | Knowledge distillation by utilizing backward pass knowledge in neural networks |
CN113793265A (zh) * | 2021-09-14 | 2021-12-14 | 南京理工大学 | 一种基于深度特征关联性的图像超分辨率方法及系统 |
CN114049513A (zh) * | 2021-09-24 | 2022-02-15 | 中国科学院信息工程研究所 | 一种基于多学生讨论的知识蒸馏方法和系统 |
US20220067274A1 (en) * | 2020-09-02 | 2022-03-03 | Zhejiang Lab | Compression method and platform of pre-training language model based on knowledge distillation |
CN114140442A (zh) * | 2021-12-01 | 2022-03-04 | 北京邮电大学 | 一种基于频域和图像域退化感知的深度学习稀疏角度ct重建方法 |
CN114170655A (zh) * | 2021-11-29 | 2022-03-11 | 西安电子科技大学 | 一种基于知识蒸馏的人脸伪造线索迁移方法 |
CN114241285A (zh) * | 2021-11-25 | 2022-03-25 | 华南理工大学 | 一种基于知识蒸馏和半监督学习的船舶快速检测方法 |
CN114677304A (zh) * | 2022-03-28 | 2022-06-28 | 东南大学 | 一种基于知识蒸馏和深度神经网络的图像去模糊算法 |
-
2022
- 2022-07-28 CN CN202210900359.9A patent/CN115019183B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
CN111626330A (zh) * | 2020-04-23 | 2020-09-04 | 南京邮电大学 | 基于多尺度特征图重构和知识蒸馏的目标检测方法与系统 |
US20210383238A1 (en) * | 2020-06-05 | 2021-12-09 | Aref JAFARI | Knowledge distillation by utilizing backward pass knowledge in neural networks |
US20220067274A1 (en) * | 2020-09-02 | 2022-03-03 | Zhejiang Lab | Compression method and platform of pre-training language model based on knowledge distillation |
CN112200318A (zh) * | 2020-10-10 | 2021-01-08 | 广州云从人工智能技术有限公司 | 一种目标检测方法、装置、机器可读介质及设备 |
CN112418343A (zh) * | 2020-12-08 | 2021-02-26 | 中山大学 | 多教师自适应联合知识蒸馏 |
CN113344206A (zh) * | 2021-06-25 | 2021-09-03 | 江苏大学 | 融合通道与关系特征学习的知识蒸馏方法、装置及设备 |
CN113487482A (zh) * | 2021-07-01 | 2021-10-08 | 国网山东省电力公司威海供电公司 | 一种基于元迁移学习的自适应超分辨率方法 |
CN113486665A (zh) * | 2021-07-05 | 2021-10-08 | 哈尔滨工业大学(深圳) | 隐私保护文本命名实体识别方法、装置、设备及存储介质 |
CN113486990A (zh) * | 2021-09-06 | 2021-10-08 | 北京字节跳动网络技术有限公司 | 内窥镜图像分类模型的训练方法、图像分类方法和装置 |
CN113793265A (zh) * | 2021-09-14 | 2021-12-14 | 南京理工大学 | 一种基于深度特征关联性的图像超分辨率方法及系统 |
CN114049513A (zh) * | 2021-09-24 | 2022-02-15 | 中国科学院信息工程研究所 | 一种基于多学生讨论的知识蒸馏方法和系统 |
CN114241285A (zh) * | 2021-11-25 | 2022-03-25 | 华南理工大学 | 一种基于知识蒸馏和半监督学习的船舶快速检测方法 |
CN114170655A (zh) * | 2021-11-29 | 2022-03-11 | 西安电子科技大学 | 一种基于知识蒸馏的人脸伪造线索迁移方法 |
CN114140442A (zh) * | 2021-12-01 | 2022-03-04 | 北京邮电大学 | 一种基于频域和图像域退化感知的深度学习稀疏角度ct重建方法 |
CN114677304A (zh) * | 2022-03-28 | 2022-06-28 | 东南大学 | 一种基于知识蒸馏和深度神经网络的图像去模糊算法 |
Non-Patent Citations (7)
Title |
---|
ABDOLMAGED ALKHULAIFI等: "Knowledge distillation in deep learning and its applications", 《PEERJ COMPUTER SCIENCE》 * |
LIN WANG等: "Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks", 《JOURNAL OF LATEX CLASS FILES》 * |
宋邵乐: "基于知识迁移的图像场景与目标信息提取方法", 《中国博士学位论文全文数据库 信息科技辑》 * |
楚玉春等: "基于YOLOv4的目标检测知识蒸馏算法研究", 《计算机科学》 * |
洪华秀: "python 在图像超分辨率重建中的应用", 《科技与信息》 * |
袁年曾: "基于知识蒸馏的无监督图像超分辨率重建", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
黄震华等: "知识蒸馏研究综述", 《计算机学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204770A (zh) * | 2022-12-12 | 2023-06-02 | 中国公路工程咨询集团有限公司 | 一种用于桥梁健康监测数据异常检测的训练方法及装置 |
CN116204770B (zh) * | 2022-12-12 | 2023-10-13 | 中国公路工程咨询集团有限公司 | 一种用于桥梁健康监测数据异常检测的训练方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN115019183B (zh) | 2023-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109949317B (zh) | 基于逐步对抗学习的半监督图像实例分割方法 | |
CN109492099B (zh) | 一种基于领域对抗自适应的跨领域文本情感分类方法 | |
CN108229550B (zh) | 一种基于多粒度级联森林网络的云图分类方法 | |
CN110134757A (zh) | 一种基于多头注意力机制的事件论元角色抽取方法 | |
CN110866536A (zh) | 一种基于PU learning的跨区域企业偷漏税识别方法 | |
CN111709518A (zh) | 一种基于社区感知和关系注意力的增强网络表示学习的方法 | |
CN112699953B (zh) | 基于多信息路径聚合的特征金字塔神经网络架构搜索方法 | |
CN112633382A (zh) | 一种基于互近邻的少样本图像分类方法及系统 | |
CN114912423A (zh) | 一种基于迁移学习的方面级别情感分析方法及装置 | |
CN113095229B (zh) | 一种无监督域自适应行人重识别系统及方法 | |
CN112434628A (zh) | 基于主动学习和协同表示的小样本极化sar图像分类方法 | |
CN111143567A (zh) | 一种基于改进神经网络的评论情感分析方法 | |
CN114863091A (zh) | 一种基于伪标签的目标检测训练方法 | |
CN113537304A (zh) | 一种基于双向cnn的跨模态语义聚类方法 | |
CN115292532A (zh) | 基于伪标签一致性学习的遥感图像域适应检索方法 | |
CN115019183B (zh) | 基于知识蒸馏和图像重构的遥感影像模型迁移方法 | |
CN114881125A (zh) | 基于图一致性和半监督模型的标签含噪图像分类方法 | |
CN117516937A (zh) | 基于多模态特征融合增强的滚动轴承未知故障检测方法 | |
CN117496124A (zh) | 基于深度卷积神经网络的大区域光伏板检测和提取方法 | |
CN114780723A (zh) | 基于向导网络文本分类的画像生成方法、系统和介质 | |
CN112668633B (zh) | 一种基于细粒度领域自适应的图迁移学习方法 | |
CN113076490B (zh) | 一种基于混合节点图的涉案微博对象级情感分类方法 | |
CN114860973A (zh) | 一种面向小样本场景的深度图像检索方法 | |
CN113065520B (zh) | 一种面向多模态数据的遥感图像分类方法 | |
CN113920379A (zh) | 一种基于知识辅助的零样本图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |