CN116188995B - 一种遥感图像特征提取模型训练方法、检索方法及装置 - Google Patents
一种遥感图像特征提取模型训练方法、检索方法及装置 Download PDFInfo
- Publication number
- CN116188995B CN116188995B CN202310390641.1A CN202310390641A CN116188995B CN 116188995 B CN116188995 B CN 116188995B CN 202310390641 A CN202310390641 A CN 202310390641A CN 116188995 B CN116188995 B CN 116188995B
- Authority
- CN
- China
- Prior art keywords
- remote sensing
- sample
- sensing image
- module
- support set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000012549 training Methods 0.000 title claims abstract description 74
- 238000002372 labelling Methods 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims description 33
- 238000005457 optimization Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 230000004927 fusion Effects 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 239000012633 leachable Substances 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000010191 image analysis Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000008447 perception Effects 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012407 engineering method Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开遥感图像特征提取模型训练方法、检索方法及装置,训练方法包括:构建遥感图像特征提取模型;获取样本集,样本集包括图像样本及标注类别的真实标签;从样本集采样支持集和查询集,分别输入模型,得到支持集和查询集中样本特征;根据支持集的各类样本特征,计算支持集中各类样本的代表特征;计算查询集中各样本特征与支持集中各代表特征的协方差距离;根据协方差距离,确定查询集样本与支持集样本的特征相似度,并将相似度最高的支持集样本的真实标签作为查询集样本的预测标签;根据查询集样本的真实标签和预测标签,计算损失,优化模型;重复上述步骤训练模型,直至训练完成。本发明模型特征感知能力强,解决遥感图像标签匮乏的问题。
Description
技术领域
本发明涉及遥感图像观测技术领域,尤其涉及一种遥感图像特征提取模型训练方法、检索方法及装置。
背景技术
随着对地观测技术的发展,遥感图像数量发生了爆炸式增长,遥感数据的分辨率也越来越高。如何快速地从海量遥感图像中检索到感兴趣的遥感影像变成了一个难题。基于内容的遥感图像检索技术能挖掘遥感图像的视觉特征并从海量图像中检索出所需图像,因而成为了研究热点。
近年来,基于卷积神经网络(Convolutional Neural Network,CNN)的方法因其高质量的特征提取能力而受到关注。与传统特征工程方法相比,CNN由大量神经元组成,可以从原始数据中提取抽象和高层的语义特征,以压倒性的性能优势迅速成为遥感图像检索领域的主流方法。然而,CNN是一种数据驱动模型,基于CNN的遥感图像检索方法使用优化算法(如 Adam、RMSProp或SGD)对网络参数更新,利用大量标记数据从新开始为每个新任务训练深度神经网络模型。然而,如果新的遥感场景任务只有很少的标记样本并且缺乏相似的数据集,那么具有大量参数的深度神经网络模型很容易过拟合。因此,当标记样本稀缺且不同数据集之间的差异很大时,快速适应一个新的任务数据集对深度检索模型是一个巨大的挑战。
为了解决标注数据有限和难以获取的问题,小样本学习(Few-shot Learning,FSL)方法被提出。通常情况下,小样本学习能够利用类别中的少量标注样本训练便可达到相应学习任务的要求。通过模型在基类上的训练,后续只需少量样本的学习就可以适应新类别的能力,是处理遥感标签匮乏问题的有效手段。当前,小样本学习算法大多遵循基于度量学习的元学习框架,通过元学习嵌入深度度量方法使得嵌入空间的图像距离维持了语义一致性。然而,现有的小样本学习算法中使用的欧式距离度量函数忽略了样本特征维度间的相关性,存在类内样本相对于数据分布不敏感的缺点。
此外,受成像环境与地物分布的影响,遥感图像存在大量的背景信息,反映图像语义信息的前景目标往往只占据图像的小部分区域,且形状较小很难被准确捕捉。因此,利用遥感图像的上下文信息挖掘小目标的语义信息成为了提升模型判别能力的关键。但是,由于CNN卷积池化交替工作的结构特点,卷积运算的感受野一般只与卷积核的尺寸相仿,不利于图像全局上下文信息的捕获。
发明内容
基于此,有必要针对上述问题,提出了一种遥感图像特征提取模型训练方法、检索方法及装置。
本发明公开了一种遥感图像特征提取模型训练方法,所述方法包括:
S110、基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
S120、获取遥感图像样本集,所述遥感图像样本集包括若干遥感图像样本,以及对所述遥感图像样本的类别进行标注的真实标签;
S130、随机从所述遥感图像样本集中采样支持集和查询集,并分别输入所述遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
S140、根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
S150、计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
S160、根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
S170、根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据所述损失,对所述遥感图像特征提取模型进行参数优化;
S180、重复执行步骤S130至步骤S170,对所述遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型。
进一步的,所述遥感图像特征提取模型,具体包括:
嵌入模块,用于将输入图像划分为图片块,并对每个图片块进行线性变换,映射到恒定的维度,实现特征变换;
融合模块,用于在嵌入模块的基础上,将可学习的位置嵌入信息分配给每个图片块,生成图片块编码,并将图片块编码与输入图像对应的类别编码和位置编码进行融合,得到融合向量;
编码模块,由若干编码器堆叠而成,每个编码器均由多头自注意力部分和残差连接部分组成,用于实现对融合向量进行自注意力运算。
进一步的,根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征,具体包括:
根据支持集的各类样本的所有特征,通过以下公式,计算支持集中各类样本的中心特征,并将中心特征作为支持集中各类样本的代表特征:
其中,表示支持集中第/>类样本中的样本数量,/>表示遥感图像特征提取模型,表示支持集中第/>类的第/>个样本,/>表示支持集中第/>类样本的中心特征。
进一步的,计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离,具体包括:
通过以下公式,计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离:
其中,表示支持集中第/>类样本,/>表示比例系数,/>表示支持集中第/>类样本的类内协方差矩阵,/>表示支持集中类间协方差矩阵,/>为单位矩阵,/>为矩阵缩放系数,表示查询集中样本/>与支持集中第n类样本的协方差矩阵,/>表示查询集中样本/>与支持集中第n类样本中心特征之间的协方差距离。
进一步的,根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,具体包括:
根据所述协方差距离,利用softmax函数,确定查询集中各样本与支持集中各类样本的特征相似度,softmax函数公式如下:
其中,和/>表示查询集中样本/>和支持集中第/>类及第j类样本的中心特征之间的协方差距离,/>表示查询集中样本/>属于类别/>的概率,即查询集中样本/>与支持集中第/>类样本的特征相似度,/>表示支持集中样本的类别数量。
进一步的,根据查询集中各样本的真实标签和预测标签,进行损失计算,具体包括:
根据查询集中各样本的真实标签和预测标签,进行Arcface损失计算。
另一方面,本发明还公开了一种遥感图像检索方法,所述方法包括:
获取待检索遥感图像,利用上述训练方法中所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取,得到待检索特征;
获取若干遥感图像样本,利用上述训练方法中所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
计算所述待检索特征与各样本特征的欧氏距离;
根据所述欧氏距离,确定所述待检索遥感图像与各遥感图像样本的特征相似度;
根据所述特征相似度,从所述遥感图像样本中匹配所述待检索遥感图像的目标图像。
另一方面,本发明还公开了一种遥感图像特征提取模型训练装置,所述装置包括:
模型构建模块,用于基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
样本获取模块,用于获取遥感图像样本集,所述遥感图像样本集包括若干遥感图像样本,以及对所述遥感图像样本的类别进行标注的真实标签;
特征提取模块,用于随机从所述遥感图像样本集中采样支持集和查询集,并分别输入所述遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
支持集代表特征计算模块,用于根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
协方差距离计算模块,用于计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
预测模块,用于根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
模型优化模块,用于根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据所述损失,对所述遥感图像特征提取模型进行参数优化;
模型训练模块,用于重复执行特征提取模块、支持集代表特征计算模块、协方差距离计算模块、预测模块、模型优化模块的功能,对所述遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型。
另一方面,本发明还公开了一种遥感图像检索装置,所述装置包括:
待检索特征获取模块,用于获取待检索遥感图像,利用上述训练方法中所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取,得到待检索特征;
样本特征获取模块,用于获取若干遥感图像样本,利用上述训练方法中所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
欧氏距离计算模块,用于计算所述待检索特征与各样本特征的欧氏距离;
相似度确定模块,用于根据所述欧氏距离,确定所述待检索遥感图像与各遥感图像样本的特征相似度;
目标图像匹配模块,用于根据所述特征相似度,从所述遥感图像样本中匹配所述待检索遥感图像的目标图像。
另一方面,本发明还公开了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下遥感图像特征提取模型训练方法的步骤:
S110、基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
S120、获取遥感图像样本集,所述遥感图像样本集包括若干遥感图像样本,以及对所述遥感图像样本的类别进行标注的真实标签;
S130、随机从所述遥感图像样本集中采样支持集和查询集,并分别输入所述遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
S140、根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
S150、计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
S160、根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
S170、根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据所述损失,对所述遥感图像特征提取模型进行参数优化;
S180、重复执行步骤S130至步骤S170,对所述遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型;
和/或执行以下遥感图像检索方法的步骤:
获取待检索遥感图像,利用上述训练方法中所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取,得到待检索特征;
获取若干遥感图像样本,利用上述训练方法中所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
计算所述待检索特征与各样本特征的欧氏距离;
根据所述欧氏距离,确定所述待检索遥感图像与各遥感图像样本的特征相似度;
根据所述特征相似度,从所述遥感图像样本中匹配所述待检索遥感图像的目标图像。
采用本发明,具有如下有益效果:
1、本发明中,基于自注意力机制的Transformer模型,构建遥感图像特征提取模型,可以对遥感图像的上下文信息进行充分感知,提高模型的特征感知能力;
2、本发明中,基于小样本学习算法,使得模型具备仅通过少量的样本训练就能快速探测新样本的能力,有效解决遥感图像标签匮乏的问题;
3、本发明中,采用协方差距离度量方法支撑小样本学习算法,有效解决现有的小样本学习算法中使用欧式距离度量函数造成的忽略样本特征维度间的相关性,存在类内样本相对于数据分布不敏感的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中遥感图像特征提取模型训练方法的流程图;
图2为一个实施例中遥感图像检索方法的流程图;
图3为一个实施例中遥感图像特征提取模型训练装置的结构框图;
图4为一个实施例中遥感图像检索装置的结构框图;
图5为一个实施例中计算机设备的结构框图。
附图标记说明:模型构建模块110,样本获取模块120,特征提取模块130,支持集代表特征计算模块140,协方差距离计算模块150,预测模块160,模型优化模块170,模型训练模块180,待检索特征获取模块210,样本特征获取模块220,欧氏距离计算模块230,相似度确定模块240,目标图像匹配模块250。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,在一个实施例中,提供了一种遥感图像特征提取模型训练方法,该方法具体包括如下步骤:
S110、基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
S120、获取遥感图像样本集,遥感图像样本集包括若干遥感图像样本,以及对遥感图像样本的类别进行标注的真实标签;
S130、随机从遥感图像样本集中采样支持集和查询集,并分别输入遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
S140、根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
S150、计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
S160、根据协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
S170、根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据损失,对遥感图像特征提取模型进行参数优化;
S180、重复执行步骤S130至步骤S170,对遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型。
本实施例中,基于自注意力机制的Transformer模型构建遥感图像特征提取模型,利用自注意力的方式捕捉遥感图像的全局信息,建立特征之间的长距离依赖关系,对遥感图像的上下文信息进行充分感知,有效提高模型的特征感知能力,进而增强模型的判别能力。
同时,本实施例中,采用小样本学习方式解决遥感图像的标签稀缺问题。小样本学习是指在给定训练样本较少的前提下,模型仅通过少量的样本训练就能快速探测新样本。
具体而言,小样本学习过程分为了训练过程和测试过程,首先构建一个真实的测试任务,即需要实现在只有少量具有真实标签的样本的情况下,将所有测试样本正确归类,其中少量有真实标签的样本组成的集合称为支持集,大量无标签待归类样本组成查询集,一般称这样的一个小样本任务为N-way K-shot任务,即支持集中有N个类别,每个类别中只有K个样本,测试过程就是由大量这样的小样本学习任务组成。于此同时,为了有效训练模型,在训练过程中,同样模拟了大量和测试过程一样的N-way K-shot任务,在这些任务中,同样由支持集和查询集进行,但训练过程中的支持集和查询集中的样本都是有预先标注的真实标签的,以便模型进行能力训练。
为此,对小样本学习进行形式化表达。小样本学习的实现过程可分为元训练阶段和元测试阶段/>,其中/>目的是通过迁移学习来训练度量模块,/>主要是执行任务学习。元训练阶段/>需要训练数据/>,元测试阶段/>需要测试数据。在学习过程中,小样本学习以“任务”为单位,因此需要为每个任务都建立一个支持集/>和一个查询集/>。其中,支持集/>包含/>个类,每个类有/>个标注图像,查询集/>包括个未标记的图像。小样本学习的目的是在/>阶段中只通过/>的少量样本就能检测出/>中的样本。
以及,本实施例中,预设训练停止条件可以包括例如损失的值小于或等于预设的阈值,或者迭代训练次数达到预设的次数阈值等条件。训练过程中可以采用例如梯度下降法对遥感图像特征提取模型进行参数优化。
此外,本实施例中,小样本学习中涉及的度量方式,并非采用传统深度学习的全连接层,而是选择距离度量的方式,从而使得模型在运算过程中所涉及的参数量更小且不容易过拟合。具体而言,距离度量作为一种空间映射的方法,在数据转换为特征向量的基础上,衡量在嵌入空间中两个或者多个目标特征的相似度或者距离,如果同属相同的类特征则距离较近或相似度较高,反之属于不同的类特征则距离较远或相似度较低。
更具体的,本实施例中,小样本学习中采用的是协方差距离度量方法,而并非普通的欧氏距离度量方法,进而有效解决欧式距离度量带来的忽略样本特征维度间的相关性,存在类内样本相对于数据分布不敏感的问题。
进一步的,一实施例中,遥感图像特征提取模型,具体包括:
嵌入模块,用于将输入图像划分为图片块,并对每个图片块进行线性变换,映射到恒定的维度,实现特征变换;
融合模块,用于在嵌入模块的基础上,将可学习的位置嵌入信息分配给每个图片块,生成图片块编码,并将图片块编码与输入图像对应的类别编码和位置编码进行融合,得到融合向量;
编码模块,由若干编码器堆叠而成,每个编码器均由多头自注意力部分和残差连接部分组成,用于实现对融合向量进行自注意力运算。
本实施例中,遥感图像特征提取模型包括:Token嵌入模块、 Token融合模块和编码模块,其中,Token 代表图像中的某一块,上述三个模块通过逐层堆叠的方式连接在一起。具体而言,上述三个模块的详细信息为:
(1)Token嵌入模块:假设定义输入的图像为,其中H表示图像高度,W表示图像宽度,C表示图像通道数。首先完整的图像划分为大小相同的扁平图片块(Patch),定义其形式化表达为/>,(P,P)表示每个图像块的分辨率,/>表示图像块的数量,由于Transformer模型在所有层中使用恒定的宽度,因此每个patch通过线性变换将其映射到恒定的维度,同时也起到特征变换功能,该过程称为块嵌入;
(2)Token融合模块:在块嵌入的基础上,将可学习的位置嵌入信息分配给每个patch作为编码器的输入,同时,考虑到后续任务,模型还引入一个可学习的类别编码(Class Token),最后,将Patch编码、类别编码与位置编码融合的向量输入Transformer编码模块中,进行自注意力运算;
(3)编码模块:编码模块主要是由L个相同的编码器块堆叠而成。编码器块主要由两部分组成,分别是多头自注意力和残差连接,公式如下:
其中,代表上一层编码器块的输出,同时也是本层编码器块的输入,/>代表本层编码器块的输出,LN代表层归一化,MLP代表多层感知机,MSA代表多头注意力。
此外,在融合向量输入编码模块进行自注意力运算结束后,编码模块输出的特征还可以通过一个线性映射转换为长度为256维的特征投影表示。
进一步的,一实施例中,步骤S140,具体包括:
根据支持集的各类样本的所有特征,通过以下公式,计算支持集中各类样本的中心特征,并将中心特征作为支持集中各类样本的代表特征:
其中,表示支持集中第/>类样本中的样本数量,/>表示遥感图像特征提取模型,表示支持集中第/>类的第/>个样本,/>表示支持集中第/>类样本的中心特征。
支持集中各样本分别归属于不同的标签类别,而同属一个类别中的样本的特征相似度很高,故本实施例中,可以通过每一类样本中各样本的特征计算出每一类样本的中心特征,再将该中心特征作为代表特征,仅通过各个代表特征对支持集中的各类样本进行统一的特征表示,将后续步骤中查询集各样本特征与支持集各样本特征的协方差距离计算,转换为查询集各样本特征与支持集各代表特征的协方差距离计算,有效减少模型的运算量,提升模型训练速度。
进一步的,一实施例中,步骤S150,具体包括:
通过以下公式,计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离:
其中,表示支持集中第/>类样本,/>表示比例系数,/>表示支持集中第/>类样本的类内协方差矩阵,/>表示支持集中类间协方差矩阵,/>为单位矩阵,/>为矩阵缩放系数,表示查询集中样本/>与支持集中第n类样本的协方差矩阵,/>表示查询集中样本/>与支持集中第n类样本中心特征之间的协方差距离。
进一步的,一实施例中,步骤S160中,根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,具体包括:
根据所述协方差距离,利用softmax函数,确定查询集中各样本与支持集中各类样本的特征相似度,softmax函数公式如下:
其中,和/>表示查询集中样本/>和支持集中第/>类及第j类样本的中心特征之间的协方差距离,/>表示查询集中样本/>属于类别/>的概率,即查询集中样本/>与支持集中第/>类样本的特征相似度,/>表示支持集中样本的类别数量。
本实施例中,协方差距离是有效计算两个样本特征相似度的方法,协方差距离解决了欧氏距离在小样本学习中对于类内样本相对于中心特征分布不敏感的缺点,通过协方差矩阵考虑到了特征维度间的关联性。
进一步的,一实施例中,步骤S170中,根据查询集中各样本的真实标签和预测标签,进行损失计算,具体包括:
根据查询集中各样本的真实标签和预测标签,进行Arcface损失计算。
本实施例中,为了提高遥感图像的类间可分性,使用Arcface损失函数优化模型训练。在实施方式上,通过协方差距离确定的预测标签与真实标签计算Arcface损失,Arcface损失利用特征向量的归一化和角裕度,显著扩大了类间距离,减小了类内距离。
另一方面,如图2所示,在一个实施例中,还提供了一种遥感图像检索方法,所述方法包括:
S210、获取待检索遥感图像,利用上述训练方法中的训练完成的遥感图像特征提取模型对待检索遥感图像进行特征提取,得到待检索特征;
S220、获取若干遥感图像样本,利用上述训练方法中的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
S230、计算待检索特征与各样本特征的欧氏距离;
S240、根据欧氏距离,确定待检索遥感图像与各遥感图像样本的特征相似度;
S250、根据特征相似度,从遥感图像样本中匹配待检索遥感图像的目标图像。
本实施例实际为训练完成的遥感图像特征提取模型的具体应用,由于待检索图像完全未知,而并非模型训练过程中的样本数据,无需考虑待检索图像与所获取的图像样本的特征相关性,故在遥感图像特征提取模型已经通过训练,具备完善的特征提取能力后,仅需计算待检索图像特征与样本特征的欧氏距离,即可确定待检索图像与样本图像的特征相似度,再根据特征相似度,按照检索需求从遥感图像样本中匹配待检索遥感图像的目标图像,进而实现从海量图像中检索挖掘所需图像的目的。
另一方面,如图3所示,在一个实施例中,还提供了一种遥感图像特征提取模型训练装置,所述装置包括:
模型构建模块110,用于基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
样本获取模块120,用于获取遥感图像样本集,遥感图像样本集包括若干遥感图像样本,以及对遥感图像样本的类别进行标注的真实标签;
特征提取模块130,用于随机从遥感图像样本集中采样支持集和查询集,并分别输入遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
支持集代表特征计算模块140,用于根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
协方差距离计算模块150,用于计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
预测模块160,用于根据协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
模型优化模块170,用于根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据损失,对遥感图像特征提取模型进行参数优化;
模型训练模块180,用于重复执行特征提取模块、支持集代表特征计算模块、协方差距离计算模块、预测模块、模型优化模块的功能,对遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型。
另一方面,如图4所示,在一个实施例中,还提供了一种遥感图像检索装置,所述装置包括:
待检索特征获取模块210,用于获取待检索遥感图像,利用上述训练方法中的训练完成的遥感图像特征提取模型对待检索遥感图像进行特征提取,得到待检索特征;
样本特征获取模块220,用于获取若干遥感图像样本,利用上述训练方法中的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
欧氏距离计算模块230,用于计算待检索特征与各样本特征的欧氏距离;
相似度确定模块240,用于根据欧氏距离,确定待检索遥感图像与各遥感图像样本的特征相似度;
目标图像匹配模块250,用于根据特征相似度,从遥感图像样本中匹配待检索遥感图像的目标图像。
图5示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图5所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现上述遥感图像特征提取模型训练方法,和/或上述遥感图像检索方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行上述遥感图像特征提取模型训练方法,和/或上述遥感图像检索方法。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下遥感图像特征提取模型训练方法的步骤:
S110、基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
S120、获取遥感图像样本集,所述遥感图像样本集包括若干遥感图像样本,以及对所述遥感图像样本的类别进行标注的真实标签;
S130、随机从遥感图像样本集中采样支持集和查询集,并分别输入遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
S140、根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
S150、计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
S160、根据协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
S170、根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据损失,对遥感图像特征提取模型进行参数优化;
S180、重复执行步骤S130至步骤S170,对遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型;
和/或执行以下遥感图像检索方法的步骤:
获取待检索遥感图像,利用上述训练方法中的训练完成的遥感图像特征提取模型对待检索遥感图像进行特征提取,得到待检索特征;
获取若干遥感图像样本,利用上述训练方法中的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
计算待检索特征与各样本特征的欧氏距离;
根据欧氏距离,确定待检索遥感图像与各遥感图像样本的特征相似度;
根据特征相似度,从遥感图像样本中匹配待检索遥感图像的目标图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种遥感图像特征提取模型训练方法,其特征在于,所述方法包括:
S110、基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
S120、获取遥感图像样本集,所述遥感图像样本集包括若干遥感图像样本,以及对所述遥感图像样本的类别进行标注的真实标签;
S130、随机从所述遥感图像样本集中采样支持集和查询集,并分别输入所述遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
S140、根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
S150、计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
S160、根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
S170、根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据所述损失,对所述遥感图像特征提取模型进行参数优化;
S180、重复执行步骤S130至步骤S170,对所述遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型;
所述遥感图像特征提取模型包括:Token嵌入模块、Token融合模块和编码模块,其中,Token代表图像中的一个图像块,所述Token嵌入模块、Token融合模块和编码模块通过逐层堆叠的方式连接在一起;所述Token嵌入模块、Token融合模块和编码模块的信息为:
(1)Token嵌入模块:假设定义输入的图像为其中H表示图像高度,W表示图像宽度,C表示图像通道数,图像划分为大小相同的扁平图片块,定义其形式化表达为(P,P)表示每个图像块的分辨率,N=HW/P2表示图像块的数量,每个图像块通过线性变换映射到恒定的维度,起到特征变换功能,该过程称为块嵌入;
(2)Token融合模块:在块嵌入的基础上,将可学习的位置嵌入信息分配给每个图像块作为编码器的输入,同时,还引入一个可学习的类别编码,将图像块编码、类别编码与位置编码融合的向量输入编码模块中,进行自注意力运算;
(3)编码模块:由L个相同的编码器块堆叠而成,编码器块由两部分组成,分别是多头自注意力和残差连接,公式如下:
fl′=MSA(LN(fl-1))+fl-1,∈[1,L]
fl=MLP(LN(fl′))+l′,∈[1,L]
其中,fl-1代表上一层编码器块的输出,同时也是本层编码器块的输入,fl代表本层编码器块的输出,LN代表层归一化,MLP代表多层感知机,MSA代表多头注意力。
2.根据权利要求1所述的一种遥感图像特征提取模型训练方法,其特征在于,根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征,具体包括:
根据支持集的各类样本的所有特征,通过以下公式,计算支持集中各类样本的中心特征,并将中心特征作为支持集中各类样本的代表特征:
其中,K表示支持集中第n类样本中的样本数量,F表示遥感图像特征提取模型,xni表示支持集中第n类的第i个样本,Cn表示支持集中第n类样本的中心特征。
3.根据权利要求2所述的一种遥感图像特征提取模型训练方法,其特征在于,计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离,具体包括:
通过以下公式,计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离:
λn=|Sn|/(∣Sn∣+1)
Qn=λnMn+(1-λn)M+βI
其中,Sn表示支持集中第n类样本,λn表示比例系数,Mn表示支持集中第n类样本的类内协方差矩阵,M表示支持集中类间协方差矩阵,I为单位矩阵,β为矩阵缩放系数,Qn表示查询集中样本mi与支持集中第n类样本的协方差矩阵,d(mi,Cn)表示查询集中样本mi与支持集中第n类样本中心特征之间的协方差距离。
4.根据权利要求2所述的一种遥感图像特征提取模型训练方法,其特征在于,根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,具体包括:
根据所述协方差距离,利用softmax函数,确定查询集中各样本与支持集中各类样本的特征相似度,softmax函数公式如下:
其中,d(F(mi),Cn)和d(F(mi),Cj)表示查询集中样本mi和支持集中第n类及第j类样本的中心特征之间的协方差距离,Pni表示查询集中样本mi属于类别n的概率,即查询集中样本mi与支持集中第n类样本的特征相似度,C表示支持集中样本的类别数量。
5.根据权利要求1所述的一种遥感图像特征提取模型训练方法,其特征在于,根据查询集中各样本的真实标签和预测标签,进行损失计算,具体包括:
根据查询集中各样本的真实标签和预测标签,进行Arcface损失计算。
6.一种遥感图像检索方法,其特征在于,所述方法包括:
获取待检索遥感图像,利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取,得到待检索特征;
获取若干遥感图像样本,利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
计算所述待检索特征与各样本特征的欧氏距离;
根据所述欧氏距离,确定所述待检索遥感图像与各遥感图像样本的特征相似度;
根据所述特征相似度,从所述遥感图像样本中匹配所述待检索遥感图像的目标图像。
7.一种遥感图像特征提取模型训练装置,其特征在于,所述装置包括:
模型构建模块,用于基于自注意力机制的Transformer模型,构建遥感图像特征提取模型;
样本获取模块,用于获取遥感图像样本集,所述遥感图像样本集包括若干遥感图像样本,以及对所述遥感图像样本的类别进行标注的真实标签;
特征提取模块,用于随机从所述遥感图像样本集中采样支持集和查询集,并分别输入所述遥感图像特征提取模型,得到支持集和查询集中所有样本的特征;
支持集代表特征计算模块,用于根据支持集的各类样本的所有特征,计算支持集中各类样本的代表特征;
协方差距离计算模块,用于计算查询集中各样本的特征与支持集中各代表特征之间的协方差距离;
预测模块,用于根据所述协方差距离,确定查询集中各样本与支持集中各类样本的特征相似度,并将特征相似度最高的支持集中样本的真实标签作为对应的查询集中样本的预测标签;
模型优化模块,用于根据查询集中各样本的真实标签和预测标签,进行损失计算,并根据所述损失,对所述遥感图像特征提取模型进行参数优化;
模型训练模块,用于重复执行特征提取模块、支持集代表特征计算模块、协方差距离计算模块、预测模块、模型优化模块的功能,对所述遥感图像特征提取模型进行迭代训练,直至达到预设训练停止条件,得到训练完成的遥感图像特征提取模型;
所述遥感图像特征提取模型包括:Token嵌入模块、Token融合模块和编码模块,其中,Token代表图像中的一个图像块,所述Token嵌入模块、Token融合模块和编码模块通过逐层堆叠的方式连接在一起;所述Token嵌入模块、Token融合模块和编码模块的信息为:
(1)Token嵌入模块:假设定义输入的图像为其中H表示图像高度,W表示图像宽度,C表示图像通道数,图像划分为大小相同的扁平图片块,定义其形式化表达为(P,P)表示每个图像块的分辨率,N=HW/P2表示图像块的数量,每个图像块通过线性变换映射到恒定的维度,起到特征变换功能,该过程称为块嵌入;
(2)Token融合模块:在块嵌入的基础上,将可学习的位置嵌入信息分配给每个图像块作为编码器的输入,同时,还引入一个可学习的类别编码,将图像块编码、类别编码与位置编码融合的向量输入编码模块中,进行自注意力运算;
(3)编码模块:由L个相同的编码器块堆叠而成,编码器块由两部分组成,分别是多头自注意力和残差连接,公式如下:
fl′=MSA(LN(fl-1))+fl-1,l∈[1,L]
fl=MLP(LN(fl′))+fl′,l∈[1,L]
其中,fl-1代表上一层编码器块的输出,同时也是本层编码器块的输入,fl代表本层编码器块的输出,LN代表层归一化,MLP代表多层感知机,MSA代表多头注意力。
8.一种遥感图像检索装置,其特征在于,所述装置包括:
待检索特征获取模块,用于获取待检索遥感图像,利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对所述待检索遥感图像进行特征提取,得到待检索特征;
样本特征获取模块,用于获取若干遥感图像样本,利用权利要求1至5任一项所述的训练完成的遥感图像特征提取模型对各遥感图像样本进行特征提取,得到若干样本特征;
欧氏距离计算模块,用于计算所述待检索特征与各样本特征的欧氏距离;
相似度确定模块,用于根据所述欧氏距离,确定所述待检索遥感图像与各遥感图像样本的特征相似度;
目标图像匹配模块,用于根据所述特征相似度,从所述遥感图像样本中匹配所述待检索遥感图像的目标图像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述的遥感图像特征提取模型训练方法,和/或权利要求6所述的遥感图像检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310390641.1A CN116188995B (zh) | 2023-04-13 | 2023-04-13 | 一种遥感图像特征提取模型训练方法、检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310390641.1A CN116188995B (zh) | 2023-04-13 | 2023-04-13 | 一种遥感图像特征提取模型训练方法、检索方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116188995A CN116188995A (zh) | 2023-05-30 |
CN116188995B true CN116188995B (zh) | 2023-08-15 |
Family
ID=86444576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310390641.1A Active CN116188995B (zh) | 2023-04-13 | 2023-04-13 | 一种遥感图像特征提取模型训练方法、检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116188995B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116597384B (zh) * | 2023-06-02 | 2024-03-05 | 中国人民解放军国防科技大学 | 基于小样本训练的空间目标识别方法、装置及计算机设备 |
CN118097323A (zh) * | 2024-04-22 | 2024-05-28 | 阿里巴巴达摩院(杭州)科技有限公司 | 自回归生成模型的训练方法、图像处理方法以及电子设备 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020232905A1 (zh) * | 2019-05-20 | 2020-11-26 | 平安科技(深圳)有限公司 | 基于超对象信息的遥感图像目标提取方法、装置、电子设备及介质 |
WO2020253663A1 (zh) * | 2019-06-20 | 2020-12-24 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像区域识别方法、模型训练方法及装置 |
WO2021013095A1 (zh) * | 2019-07-24 | 2021-01-28 | 华为技术有限公司 | 图像分类方法、图像分类模型的训练方法及其装置 |
WO2021077984A1 (zh) * | 2019-10-23 | 2021-04-29 | 腾讯科技(深圳)有限公司 | 对象识别方法、装置、电子设备及可读存储介质 |
CN112818903A (zh) * | 2020-12-10 | 2021-05-18 | 北京航空航天大学 | 一种基于元学习和协同注意力的小样本遥感图像目标检测方法 |
CN112949693A (zh) * | 2021-02-02 | 2021-06-11 | 北京嘀嘀无限科技发展有限公司 | 图像分类模型的训练方法、图像分类方法、装置和设备 |
CN113222011A (zh) * | 2021-05-10 | 2021-08-06 | 西北工业大学 | 一种基于原型校正的小样本遥感图像分类方法 |
CN113902256A (zh) * | 2021-09-10 | 2022-01-07 | 支付宝(杭州)信息技术有限公司 | 训练标签预测模型的方法、标签预测方法和装置 |
WO2022041678A1 (zh) * | 2020-08-30 | 2022-03-03 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 张量协作图判别分析遥感图像特征提取方法 |
CN114299362A (zh) * | 2021-12-27 | 2022-04-08 | 南京邮电大学 | 一种基于k-means聚类的小样本图像分类方法 |
CN114550000A (zh) * | 2022-01-05 | 2022-05-27 | 中国科学院计算机网络信息中心 | 一种基于多分辨率特征融合的遥感图像分类方法和装置 |
CN114596500A (zh) * | 2022-01-12 | 2022-06-07 | 南通大学 | 一种基于通道-空间注意力和DeeplabV3plus的遥感影像语义分割方法 |
CN114821322A (zh) * | 2022-04-27 | 2022-07-29 | 上海海洋大学 | 基于注意力机制的小样本遥感影像分类方法及系统 |
CN115049944A (zh) * | 2022-06-02 | 2022-09-13 | 北京航空航天大学 | 一种基于多任务优化的小样本遥感图像目标检测方法 |
WO2022206604A1 (zh) * | 2021-04-01 | 2022-10-06 | 腾讯科技(深圳)有限公司 | 分类模型训练和分类方法、装置、计算机设备和存储介质 |
CN115292532A (zh) * | 2022-06-24 | 2022-11-04 | 中南大学 | 基于伪标签一致性学习的遥感图像域适应检索方法 |
CN115481659A (zh) * | 2022-08-31 | 2022-12-16 | 西安电子科技大学 | 基于深度布朗距离的小样本sar图像目标识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985238B (zh) * | 2018-07-23 | 2021-10-22 | 武汉大学 | 联合深度学习和语义概率的不透水面提取方法及系统 |
-
2023
- 2023-04-13 CN CN202310390641.1A patent/CN116188995B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020232905A1 (zh) * | 2019-05-20 | 2020-11-26 | 平安科技(深圳)有限公司 | 基于超对象信息的遥感图像目标提取方法、装置、电子设备及介质 |
WO2020253663A1 (zh) * | 2019-06-20 | 2020-12-24 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像区域识别方法、模型训练方法及装置 |
WO2021013095A1 (zh) * | 2019-07-24 | 2021-01-28 | 华为技术有限公司 | 图像分类方法、图像分类模型的训练方法及其装置 |
WO2021077984A1 (zh) * | 2019-10-23 | 2021-04-29 | 腾讯科技(深圳)有限公司 | 对象识别方法、装置、电子设备及可读存储介质 |
WO2022041678A1 (zh) * | 2020-08-30 | 2022-03-03 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 张量协作图判别分析遥感图像特征提取方法 |
CN112818903A (zh) * | 2020-12-10 | 2021-05-18 | 北京航空航天大学 | 一种基于元学习和协同注意力的小样本遥感图像目标检测方法 |
CN112949693A (zh) * | 2021-02-02 | 2021-06-11 | 北京嘀嘀无限科技发展有限公司 | 图像分类模型的训练方法、图像分类方法、装置和设备 |
WO2022206604A1 (zh) * | 2021-04-01 | 2022-10-06 | 腾讯科技(深圳)有限公司 | 分类模型训练和分类方法、装置、计算机设备和存储介质 |
CN113222011A (zh) * | 2021-05-10 | 2021-08-06 | 西北工业大学 | 一种基于原型校正的小样本遥感图像分类方法 |
CN113902256A (zh) * | 2021-09-10 | 2022-01-07 | 支付宝(杭州)信息技术有限公司 | 训练标签预测模型的方法、标签预测方法和装置 |
CN114299362A (zh) * | 2021-12-27 | 2022-04-08 | 南京邮电大学 | 一种基于k-means聚类的小样本图像分类方法 |
CN114550000A (zh) * | 2022-01-05 | 2022-05-27 | 中国科学院计算机网络信息中心 | 一种基于多分辨率特征融合的遥感图像分类方法和装置 |
CN114596500A (zh) * | 2022-01-12 | 2022-06-07 | 南通大学 | 一种基于通道-空间注意力和DeeplabV3plus的遥感影像语义分割方法 |
CN114821322A (zh) * | 2022-04-27 | 2022-07-29 | 上海海洋大学 | 基于注意力机制的小样本遥感影像分类方法及系统 |
CN115049944A (zh) * | 2022-06-02 | 2022-09-13 | 北京航空航天大学 | 一种基于多任务优化的小样本遥感图像目标检测方法 |
CN115292532A (zh) * | 2022-06-24 | 2022-11-04 | 中南大学 | 基于伪标签一致性学习的遥感图像域适应检索方法 |
CN115481659A (zh) * | 2022-08-31 | 2022-12-16 | 西安电子科技大学 | 基于深度布朗距离的小样本sar图像目标识别方法 |
Non-Patent Citations (1)
Title |
---|
大载荷长航时无人机航空应急测绘系统设计与实现;王中祥等;《测绘通报》(第09期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116188995A (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116188995B (zh) | 一种遥感图像特征提取模型训练方法、检索方法及装置 | |
CN110457985B (zh) | 基于视频序列的行人再识别方法、装置及计算机设备 | |
CN109285105A (zh) | 水印检测方法、装置、计算机设备和存储介质 | |
US11709880B2 (en) | Method of image searching based on artificial intelligence and apparatus for performing the same | |
CN102542067A (zh) | 基于尺度学习和关联标号传播的自动图像语义标注方法 | |
CN110991284B (zh) | 一种基于场景预分类的光学遥感图像语句描述生成方法 | |
CN116597384B (zh) | 基于小样本训练的空间目标识别方法、装置及计算机设备 | |
CN111862260B (zh) | 基于跨域对偶生成式对抗网络的偏见消除方法与装置 | |
CN113065409A (zh) | 一种基于摄像分头布差异对齐约束的无监督行人重识别方法 | |
CN112232971A (zh) | 反欺诈检测方法、装置、计算机设备和存储介质 | |
CN113158831A (zh) | 检测摄像设备移动的方法、装置、计算机设备和存储介质 | |
CN110580507B (zh) | 一种城市肌理分类识别方法 | |
CN117115565B (zh) | 一种基于自主感知的图像分类方法、装置及智能终端 | |
Lin et al. | An unsupervised transformer-based multivariate alteration detection approach for change detection in VHR remote sensing images | |
CN112579816B (zh) | 遥感图像的检索方法、装置、电子设备及存储介质 | |
CN117233869A (zh) | 一种基于GRU-BiTCN的站点短期风速预测方法 | |
CN117079051A (zh) | 一种金相智能识别方法、装置及介质 | |
CN113657145B (zh) | 一种基于汗孔特征及神经网络的指纹检索方法 | |
CN114036326B (zh) | 一种图像检索与分类方法、系统、终端及存储介质 | |
CN116524258A (zh) | 一种基于多标签分类的滑坡检测方法和系统 | |
CN114579794A (zh) | 特征一致性建议的多尺度融合地标图像检索方法及系统 | |
Liu et al. | Matchable image retrieval for large-scale UAV images: an evaluation of SfM-based reconstruction | |
CN117830874B (zh) | 一种多尺度模糊边界条件下的遥感目标检测方法 | |
CN116798010A (zh) | 一种车辆图像检索模型的训练方法、装置、设备及介质 | |
CN116629348B (zh) | 一种智能车间数据采集分析方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |