CN114998748A - 遥感图像目标精细识别方法、电子设备及存储介质 - Google Patents
遥感图像目标精细识别方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114998748A CN114998748A CN202210900842.7A CN202210900842A CN114998748A CN 114998748 A CN114998748 A CN 114998748A CN 202210900842 A CN202210900842 A CN 202210900842A CN 114998748 A CN114998748 A CN 114998748A
- Authority
- CN
- China
- Prior art keywords
- target
- similarity
- remote sensing
- sensing image
- fine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种遥感图像目标精细识别方法、电子设备及存储介质,以遥感图像提取的目标特征向量作为输入,充分利用其中编码的多实例信息,将同一幅图片上各实例的相似度信息进行对比学习,结合粗粒度的任意目标检测网络进行端到端的训练,而无需额外设计,通过已知的目标类别标签应用于分类损失以训练相似度计算网络;同时应用于对比损失,增大相同细粒度类别实例之间的相似度,而削减不同细粒度类别实例之间的相似度,增强了模型对实例之间的辨别区分能力。
Description
技术领域
本发明涉及一种遥感图像目标精细识别方法、电子设备及存储介质。
背景技术
遥感图像目标检测在农林牧渔、交通、国防等领域有着广泛的应用前景。受益于深度卷积神经网络和高性能计算技术的发展,深度学习方法相对于传统图像处理方法能够有效提升遥感图像目标检测与识别的精度,但其对于遥感图像中的目标精细识别,即目标的细粒度分类还存在较大困难。
现有的主流的目标检测器均利用深度学习网络作为其骨干和检测网络,分别从输入图像中提取特征,进行分类和定位。目标检测方法通常分为两类:一类是two-stage检测器,先由算法生成一系列作为样本的候选框,然后再在候选框层面上进一步做分类与位置回归,最具代表性的是Faster R-CNN。另一种是one-stage检测器,其直接回归得到不同目标的类别与位置,如YOLO、SSD。一般而言,two-stage检测器具有较高的定位和目标识别精度,而one-stage检测器具有较高的推理速度。
对细粒度识别模型,可以按照其使用的监督信息的多少,分为“基于强监督信息的分类模型”和“基于弱监督信息的分类模型”两大类。前者为了提升模型对目标高辨识力区域的学习能力,在图像目标框和目标类别标签基础上,还使用了重要部位标注点等额外的人工标注信息,但由于重要部位标注点等信息的人工标注相当繁重,因此,目前细粒度识别模型多聚焦于仅基于图像层面的弱监督标注信息进行学习。
细粒度识别由于其数据集规模通常较小,并且具有类内差异大和类间差异细微等特点,与常规的目标检测任务相比,其更具有挑战性。进行细粒度识别的方法可粗略分为两类:基于图像重要区域定位的方法:该方法致力于利用弱监督信息寻找图像中有判别力的区域,较为典型的方法采用区域候选网络(RPN)来在目标上提取有识别力的区域并提取特征,然后利用它们与类别标签的一致性提高分类精度;基于图像精细化特征表达的方法:该方法提出使用高维度的图像特征对图像信息进行高阶编码,如借助层次化信息编码不同层级的类别之间的关联关系,通过层次语义嵌入框架以学习更细致的图像特征表达。
在上面所提及的两类主要方法中,基于图像重要区域定位的方法由于能直接捕捉不同子类的细微差异,一般而言结果更好,并且在可解释性方面有优势。但是基于RPN的方法在对局部特征进行筛选时,大多以基于特征的预测结果的置信度进行排序进而筛选,这种做法虽然合理,但是不可避免地鼓励了RPN去提取尽可能大的区域来包含较多的特征以提高置信度,而没有真正定位到重要的特征上。而基于图像精细化特征表达的方法通常是不可解释的,因为其难以寻找模型区分出具有细微差异的子类别的根据。
以遥感图像飞机目标精细识别为例,从人类观察分类的角度来看,对同一张图片上的多个实例进行对比分辨是十分必要的,尤其是在飞机翼展和长度等底层的尺寸信息上。
发明内容
鉴于上述技术问题,本发明提出一种遥感图像目标精细识别方法、电子设备和存储介质,可以方便的结合在粗粒度的任意目标检测网络上进行端到端训练,而无需特别的额外设计,增强模型对实例之间的辨别区分能力,有效地提升模型在细粒度检测上的性能。
实现本发明目的的技术解决方案为:一种遥感图像目标精细识别方法,包括以下步骤:
步骤S1、获取遥感图像,构建包含目标实例的数据集;
步骤S2、获取目标实例的特征向量,并利用特征向量进行粗粒度检测;
步骤S3、利用步骤S2中得到的目标实例的特征向量,计算任意两个目标实例的特征向量之间的相似度,得到其相似度矩阵,并利用交叉熵损失和对比损失来训练相似度计算网络;
步骤S4、构建总损失函数,训练得到遥感图像目标精细识别模型;
步骤S5、利用训练好的遥感图像目标精细识别模型实现遥感图像目标精细识别。
根据本发明的一个方面,在所述步骤S2中,获取目标实例的特征向量,具体包括:
步骤S21、将输入遥感图像通过残差网络提取特征,得到多层级的特征图;
步骤S22、利用多层级的特征图,获得通道数对齐的多尺度输入;
步骤S23、将通道数对齐的多尺度输入经过三角函数的位置编码和可学习的层级编码后,输入encoder结构进行自注意力编码;
根据本发明的一个方面,在步骤S2中,利用特征向量进行粗粒度检测,具体包括:
根据本发明的一个方面,在步骤S2中,还包括:
步骤S28、计算分类与回归损失,公式为:
根据本发明的一个方面,在步骤S3中,计算任意两个目标实例的特征向量之间的相似度,得到其相似度矩阵,具体包括:
根据本发明的一个方面,在步骤S3中,利用交叉熵损失和对比损失来训练相似度计算网络,具体包括:
步骤S34、利用相似度矩阵,计算交叉熵损失函数以训练此相似度计算网络,交叉熵损失函数额计算公式为:
步骤S35、利用相似度矩阵,计算对比损失函数以增大相同细粒度类别实例之间的相似度,削减不同细粒度类别实例之间的相似度,对比损失函数的计算公式为:
根据本发明的一个方面,在步骤S3中,还包括:
步骤S36、利用分类与回归损失函数、交叉熵损失函数和对比损失函数,计算总损失函数,公式为:
根据本发明的一个方面,在训练好的遥感图像目标精细识别模型后,还包括:
步骤S41、获取遥感图像,构建包含目标实例的验证集;
步骤S42、利用验证集验证遥感图像目标精细识别模型的精度。
根据本发明的一个方面,提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行如上述技术方案中任一项所述的一种遥感图像目标精细识别方法。
根据本发明的一个方面,提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,实现如上述技术方案中任一项所述一种遥感图像目标精细识别方法。
根据本发明的构思,提出一种遥感图像目标精细识别方法、电子设备和计算机可读存储介质,以遥感图像提取的目标特征向量作为输入,充分利用其中编码的多实例信息,将同一幅图片上各实例的相似度信息进行对比学习,结合粗粒度的任意目标检测网络进行端到端的训练,而无需额外设计,通过已知的目标类别标签应用于分类损失以训练相似度计算网络;同时应用于对比损失,增大相同细粒度类别实例之间的相似度,而削减不同细粒度类别实例之间的相似度,增强了模型对实例之间的辨别区分能力。
并且,通过对同一张图片上多个实例的相似度计算,利用该信息来约束模型,在增加少许计算量的前提下,有效提高模型在细粒度识别上的性能,尤其适用于典型场景内特定目标的精细识别与监测,比如机场内不同型号的飞机、港口内不同类型的船只等。
附图说明
图1示意性表示根据本发明一种实施方式的遥感图像目标精细识别方法的模型训练流程图;
图2示意性表示根据本发明一种实施方式的遥感图像目标精细识别方法的流程图;
图3示意性表示根据本发明一种实施方式的步骤S2的流程图;
图4示意性表示根据本发明另一种实施方式的步骤S2的流程图;
图5示意性表示根据本发明一种实施方式的步骤S3的流程图;
图6示意性表示根据本发明另一种实施方式的步骤S3的流程图。
具体实施方式
为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅为本发明的一些实施方式,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
下面结合附图和具体实施方式对本发明作详细地描述,实施方式不能在此一一赘述,但本发明的实施方式并不因此限定于以下实施方式。
如图1至图6所示,本发明的一种遥感图像目标精细识别方法,包括以下步骤:
步骤S1、获取遥感图像,构建包含目标实例的数据集;
步骤S2、获取目标实例的特征向量,并利用特征向量进行粗粒度检测;
步骤S3、利用步骤S2中得到的目标实例的特征向量,计算任意两个目标实例的特征向量之间的相似度,得到其相似度矩阵,并利用交叉熵损失和对比损失来训练相似度计算网络;
步骤S4、构建总损失函数,训练得到遥感图像目标精细识别模型;
步骤S5、利用训练好的遥感图像目标精细识别模型实现遥感图像目标精细识别。
在该实施例中,以遥感图像提取的目标特征向量作为输入,充分利用其中编码的多实例信息,将同一幅图片上各实例的相似度信息进行对比学习,结合粗粒度的任意目标检测网络进行端到端的训练,而无需额外设计,通过已知的目标类别标签应用于分类损失以训练相似度计算网络;同时应用于对比损失,增大相同细粒度类别实例之间的相似度,而削减不同细粒度类别实例之间的相似度,增强了模型对实例之间的辨别区分能力。
并且,通过对同一张图片上多个实例的相似度计算,利用该信息来约束模型,在增加少许计算量的前提下,有效提高模型在细粒度识别上的性能,尤其适用于典型场景内特定目标的精细识别与监测,比如机场内不同型号的飞机、港口内不同类型的船只等。
例如,在FAIR1M遥感细粒度数据集上选取其中含有飞机实例的标注与对应图片,在获取遥感图像,构建包含飞机的数据集时,可同时构造训练集和验证集,以2/3的数据集作为训练集,1/3的数据作为验证集,在完成训练之后,以验证集用于验证遥感图像目标精细识别模型的精度。
如图1所示,在粗粒度检测之后,利用全连接层进行最后的分类和位置回归之前的特征向量,计算实例之间两两的相似度,可以省去通过实例的位置坐标回到原图提取patch,再重新对其抽取特征向量的重复计算,减少运算,提升效率。该特征向量对于RCNN结构的卷积检测模型,为建议框在ROI 池化后的特征向量;对于DETR结构的transformer检测模型,为解码器输出的查询向量对应的特征向量。
如图3所示,在本发明的一个实施例中,优选地,在所述步骤S2中,获取目标实例的特征向量,具体包括:
步骤S21、将输入遥感图像通过残差网络提取特征,得到多层级的特征图,具体地:
步骤S22、利用多层级的特征图,获得通道数对齐的多尺度输入,
步骤S23、将通道数对齐的多尺度输入经过三角函数的位置编码和可学习的层级编码后,输入encoder结构进行自注意力编码;
如图4所示,在本发明的一个实施例中,优选地,在步骤S2中,利用特征向量进行粗粒度检测,具体包括:
在本发明的一个实施例中,优选地,在步骤S2中,还包括:
步骤S28、计算分类与回归损失,公式为:
如图5所示,在本发明的一个实施例中,优选地,在步骤S3中,计算任意两个目标实例的特征向量之间的相似度,得到其相似度矩阵,具体包括:
如图6所示,在本发明的一个实施例中,优选地,在步骤S3中,利用交叉熵损失和对比损失来训练相似度计算网络,具体包括:
步骤S34、利用相似度矩阵,计算交叉熵损失函数以训练此相似度计算网络,交叉熵损失函数额计算公式为:
步骤S35、利用相似度矩阵,计算对比损失函数以增大相同细粒度类别实例之间的相似度,削减不同细粒度类别实例之间的相似度,对比损失函数的计算公式为:
在本发明的一个实施例中,优选地,在步骤S3中,还包括:
步骤S36、利用分类与回归损失函数、交叉熵损失函数和对比损失函数,计算总损失函数,公式为:
在本发明的一个实施例中,优选地,在训练好的遥感图像目标精细识别模型后,还包括:
步骤S41、获取遥感图像,构建包含目标实例的验证集;
步骤S42、利用验证集验证遥感图像目标精细识别模型的精度。
根据本发明的一个方面,提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行如上述技术方案中任一项所述的一种遥感图像目标精细识别方法。
根据本发明的一个方面,提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,实现如上述技术方案中任一项所述一种遥感图像目标精细识别方法。
综上所述,本发明提出了一种遥感图像目标精细识别方法、电子设备和计算机可读存储介质,以遥感图像提取的目标特征向量作为输入,充分利用其中编码的多实例信息,将同一幅图片上各实例的相似度信息进行对比学习,结合粗粒度的任意目标检测网络进行端到端的训练,而无需额外设计,通过已知的目标类别标签应用于分类损失以训练相似度计算网络;同时应用于对比损失,增大相同细粒度类别实例之间的相似度,而削减不同细粒度类别实例之间的相似度,增强了模型对实例之间的辨别区分能力。
并且,通过对同一张图片上多个实例的相似度计算,利用该信息来约束模型,在增加少许计算量的前提下,有效提高模型在细粒度识别上的性能,尤其适用于典型场景内特定目标的精细识别与监测,比如机场内不同型号的飞机、港口内不同类型的船只等。
此外,需要说明的是,本发明可提供为方法、装置或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
最后需要说明的是,以上所述是本发明优选实施方式,应当指出,尽管已描述了本发明优选实施例,但对于本技术领域的技术人员来说,一旦得知了本发明的基本创造性概念,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
Claims (10)
1.一种遥感图像目标精细识别方法,包括以下步骤:
步骤S1、获取遥感图像,构建包含目标实例的数据集;
步骤S2、获取目标实例的特征向量,并利用特征向量进行粗粒度检测;
步骤S3、利用步骤S2中得到的目标实例的特征向量,计算任意两个目标实例的特征向量之间的相似度,得到其相似度矩阵,并利用交叉熵损失和对比损失来训练相似度计算网络;
步骤S4、构建总损失函数,训练得到遥感图像目标精细识别模型;
步骤S5、利用训练好的遥感图像目标精细识别模型实现遥感图像目标精细识别。
3.根据权利要求2所述的方法,其特征在于,在步骤S2中,利用特征向量进行粗粒度检测,具体包括:
8.根据权利要求7所述的方法,其特征在于,在训练好的遥感图像目标精细识别模型后,还包括:
步骤S41、获取遥感图像,构建包含目标实例的验证集;
步骤S42、利用验证集验证遥感图像目标精细识别模型的精度。
9.一种电子设备,其特征在于,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行如权利要求1-8任一项所述一种遥感图像目标精细识别方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-8任一项所述遥感图像目标精细识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210900842.7A CN114998748B (zh) | 2022-07-28 | 2022-07-28 | 遥感图像目标精细识别方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210900842.7A CN114998748B (zh) | 2022-07-28 | 2022-07-28 | 遥感图像目标精细识别方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114998748A true CN114998748A (zh) | 2022-09-02 |
CN114998748B CN114998748B (zh) | 2023-02-03 |
Family
ID=83021909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210900842.7A Active CN114998748B (zh) | 2022-07-28 | 2022-07-28 | 遥感图像目标精细识别方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114998748B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116503733A (zh) * | 2023-04-25 | 2023-07-28 | 北京卫星信息工程研究所 | 遥感图像目标检测方法、设备及存储介质 |
CN117423032A (zh) * | 2023-10-20 | 2024-01-19 | 大连理工大学 | 时空细粒度人体动作时序分割方法、电子设备和计算机可读存储介质 |
CN117746193A (zh) * | 2024-02-21 | 2024-03-22 | 之江实验室 | 一种标签优化方法、装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090290802A1 (en) * | 2008-05-22 | 2009-11-26 | Microsoft Corporation | Concurrent multiple-instance learning for image categorization |
CN111079602A (zh) * | 2019-12-06 | 2020-04-28 | 长沙千视通智能科技有限公司 | 基于多尺度区域特征约束的车辆细粒度识别方法及装置 |
CN111612066A (zh) * | 2020-05-21 | 2020-09-01 | 成都理工大学 | 基于深度融合的卷积神经网络的遥感图像分类方法 |
CN113159066A (zh) * | 2021-04-12 | 2021-07-23 | 南京理工大学 | 基于类间相似度的分布式标签的细粒度图像识别算法 |
CN113902926A (zh) * | 2021-12-06 | 2022-01-07 | 之江实验室 | 一种基于自注意力机制的通用图像目标检测方法和装置 |
-
2022
- 2022-07-28 CN CN202210900842.7A patent/CN114998748B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090290802A1 (en) * | 2008-05-22 | 2009-11-26 | Microsoft Corporation | Concurrent multiple-instance learning for image categorization |
CN111079602A (zh) * | 2019-12-06 | 2020-04-28 | 长沙千视通智能科技有限公司 | 基于多尺度区域特征约束的车辆细粒度识别方法及装置 |
CN111612066A (zh) * | 2020-05-21 | 2020-09-01 | 成都理工大学 | 基于深度融合的卷积神经网络的遥感图像分类方法 |
CN113159066A (zh) * | 2021-04-12 | 2021-07-23 | 南京理工大学 | 基于类间相似度的分布式标签的细粒度图像识别算法 |
CN113902926A (zh) * | 2021-12-06 | 2022-01-07 | 之江实验室 | 一种基于自注意力机制的通用图像目标检测方法和装置 |
Non-Patent Citations (1)
Title |
---|
魏花: "基于卷积神经网络的细粒度图像识别关键技术分析与研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116503733A (zh) * | 2023-04-25 | 2023-07-28 | 北京卫星信息工程研究所 | 遥感图像目标检测方法、设备及存储介质 |
CN116503733B (zh) * | 2023-04-25 | 2024-02-06 | 北京卫星信息工程研究所 | 遥感图像目标检测方法、设备及存储介质 |
CN117423032A (zh) * | 2023-10-20 | 2024-01-19 | 大连理工大学 | 时空细粒度人体动作时序分割方法、电子设备和计算机可读存储介质 |
CN117423032B (zh) * | 2023-10-20 | 2024-05-10 | 大连理工大学 | 时空细粒度人体动作时序分割方法、电子设备和计算机可读存储介质 |
CN117746193A (zh) * | 2024-02-21 | 2024-03-22 | 之江实验室 | 一种标签优化方法、装置、存储介质及电子设备 |
CN117746193B (zh) * | 2024-02-21 | 2024-05-10 | 之江实验室 | 一种标签优化方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114998748B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | A survey on object detection in optical remote sensing images | |
Ammar et al. | Aerial images processing for car detection using convolutional neural networks: Comparison between faster r-cnn and yolov3 | |
Sun et al. | Facial expression recognition in the wild based on multimodal texture features | |
Zhang et al. | Real-time sow behavior detection based on deep learning | |
CN111709311B (zh) | 一种基于多尺度卷积特征融合的行人重识别方法 | |
CN114998748B (zh) | 遥感图像目标精细识别方法、电子设备及存储介质 | |
Mathur et al. | Crosspooled FishNet: transfer learning based fish species classification model | |
Tarawneh et al. | Invoice classification using deep features and machine learning techniques | |
Ju et al. | Fish species recognition using an improved AlexNet model | |
Subbiah et al. | An extensive study and comparison of the various approaches to object detection using deep learning | |
CN112149538A (zh) | 一种基于多任务学习的行人重识别方法 | |
Salhi et al. | Fast and efficient face recognition system using random forest and histograms of oriented gradients | |
Mehrjardi et al. | A survey on deep learning-based image forgery detection | |
Najibi et al. | Towards the success rate of one: Real-time unconstrained salient object detection | |
Qian et al. | A fire monitoring and alarm system based on channel-wise pruned YOLOv3 | |
Li et al. | An outstanding adaptive multi-feature fusion YOLOv3 algorithm for the small target detection in remote sensing images | |
Zhou et al. | Learning a superpixel-driven speed function for level set tracking | |
Wu et al. | Research on asphalt pavement disease detection based on improved YOLOv5s | |
Shishkin et al. | Implementation of yolov5 for detection and classification of microplastics and microorganisms in marine environment | |
Parseh et al. | Semantic-aware visual scene representation | |
Liu et al. | Small target detection for UAV aerial images based on improved YOLOv3 | |
Sainos-Vizuett et al. | Satellite Imagery Classification Using Shallow and Deep Learning Approaches | |
Pham et al. | Scalable local features and hybrid classifiers for improving action recognition | |
Chen et al. | Outdoor scene classification using labeled segments | |
Farrajota et al. | A deep neural network video framework for monitoring elderly persons |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |