CN109446368A - 一种基于类别信息的鸟类检索方法及系统 - Google Patents
一种基于类别信息的鸟类检索方法及系统 Download PDFInfo
- Publication number
- CN109446368A CN109446368A CN201811108809.0A CN201811108809A CN109446368A CN 109446368 A CN109446368 A CN 109446368A CN 201811108809 A CN201811108809 A CN 201811108809A CN 109446368 A CN109446368 A CN 109446368A
- Authority
- CN
- China
- Prior art keywords
- birds
- image
- characteristic pattern
- neural networks
- birds image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于类别信息的鸟类图像检索方法,具体内容为:(1)构建鸟类图像数据库;(2)基于改进的VGG16网络模型训练鸟类图像识别模型;(3)根据步骤(2)获得的VGG16网络,提取图像的基于CAMs(类激活图)的特征表达;(4)对查询图像特征与数据库图像特征使用余弦距离进行相似度计算,根据用户所需从数据库中返回与查询图像距离最小的图像作为查询结果,完成检索。该发明有效解决了目前检索技术不能有效利用类别信息的问题,获得了更高的检索准确率。
Description
技术领域
本发明涉及计算机视觉与模式识别的交叉领域,更具体地,涉及一种基于类别信息的鸟类检索方法及系统。
背景技术
传统的鸟类图像检索是基于文本的,即用户通过输入鸟类的名称进行检索。而由于鸟类图像中类繁多、颜色形状等多变,普通人难以准确识别和描述鸟类图像,导致用户查询输入的文本描述难以符合用户自身实际查询需求。
基于内容的图像检索则能有效地利用图像自身特征,减少用户的主观描述。传统的图像检索使用简单的图像低层特征,如形状、颜色、纹理、关键点等,但对于鸟类图像描述能力有限。近些年来以VGG为代表的卷积神经网络模型等在计算机视觉如图像分类、目标识别等领域实现了较好的效果,开始从VGG中提取卷积特征用于图像的检索,但是这种特征缺乏了图像的类别信息,导致在鸟类数据集上检索效果较为一般。
发明内容
针对现有技术的缺陷,本发明的目的在于解决现有鸟类图像检索技术由于对鸟类图像的描述能力有限,以及采用卷积神经网络模型检索缺乏图像的类别信息,导致鸟类图像检索效果比较一般的技术问题。
为实现上述目的,一方面,本发明提供一种基于类别信息的鸟类检索方法,包括以下步骤:
(1)构建鸟类图像数据库,所述鸟类图像数据库中包括不同类别的鸟类图像,以及不同背景和不同姿态的相同类别的鸟类图像;
(2)在现有卷积神经网络模型的基础上,增加批归一化层、两个卷积层以及输出层,对卷积神经网络进行改进,得到改进的卷积神经网络模型,基于改进的卷积神经网络模型对所述鸟类图像数据块训练得到鸟类图像识别模型;
(3)通过所述鸟类图像识别模型提取待检索鸟类图像的特征信息;
(4)使用余弦相似性指标将待检索鸟类图像的特征信息与鸟类图像数据库中各个图像的特征信息进行对比,确定鸟类图像数据库中与待检索鸟类图像相似度满足预设条件的至少一张鸟类图像。
具体地,预设条件可以为相似度排名第一,或者相似度排名在前n,或者相似度排名前s%。n大于1的整数,s为正数。
可选地,所述步骤(2)具体包括以下步骤:
步骤2.1,在卷积神经网络VGG16的基础之上,增加批归一化BN层、3x3卷积层、1x1卷积层、输出Dropout层,对卷积神经网络VGG16进行改进,得到改进的卷积神经网络VGG16;
步骤2.2,将鸟类图像数据库的80%作为改进的卷积神经网络VGG16的训练集,并采用水平翻转、[-5°,5°]的角度随机旋转以及[-5,5]个像素水平平移的方式对数据集进行增强,将余下的20%作为验证集,使用随机梯度下降SGD优化器进行参数更新,设置L2正则化防止过拟合,将网络训练60轮,并且1-15轮、15-30轮、30-40轮、40-50轮、50-60轮的学习率分别为0.001、0.0005、0.0001、0.00005、0.00001;
步骤2.3,使用迁移学习对网络参数更新,使用预训练的网络参数对构建网络参数初始化,对conv1~conv4层参数进行冻结,只更新余下层的参数,得到鸟类图像识别模型。
可选地,所述步骤(3)具体包括如下步骤:
步骤3.1,从鸟类图像识别模型的最后一个卷积层提取尺寸为W×H的K个特征图以及具有预设类别信息的CAMs,并将CAMs归一到[0,1],尺寸调整到W×H,第c个类别的CAMs的计算方式如下:
其中,K为大于1的整数,W为特征图的宽,H为特征图的高,conv表示卷积,convk表示GAP层前卷积层的第k个特征图,wk,c表示第k个特征图与第c个类别连接的权重,1≤k≤K;
步骤3.2,对于给定的类别c,将特征图与其所对应的CAM进行点乘,实现对特征图的加权,之后利用求和池化sum-pooling将加权后的K个特征图聚合成K维特征向量F,其中,特征向量F带有语义类别信息;
步骤3.3,将带有语义类别信息的特征向量F进行l2范数归一化,得到图像的K维特征表达D。
可选地,所述步骤3.2具体包括如下步骤:
步骤3.2.1,计算每个特征图中非0特征值所占的比例,即:
其中,Qk为第k个特征图中非0特征值所占的比例,χ表示特征图,表示第k个特征图的第i,j像素点所对应的像素,W和H分别表示特征图的宽和高;
步骤3.2.2,确定第k个特征图的通道加权系数CWk:
步骤3.2.3,对求和池化后的特征向量进行加权得到预设类对应的特征向量F,F中每个元素的计算方式如下:
其中,fk表示第k个特征图对应在特征向量F中的元素,CAMi,j表示第(i,j)像素所对应的CAM值。
可选地,所述步骤(4)具体包括如下步骤:
使用余弦相似性指标来计算待检索鸟类图像的特征信息与鸟类图像数据库特征之间的相似性,从而根据用户需求生成相似性最大的排序列表,得到检索结果。
可选地,所述鸟类图像数据库中图像不同背景包括:海面、森林、天空和草地。
可选地,所述鸟类图像数据库中鸟类不同姿态包括:行走、站立、跳跃和觅食。
另一方面,本发明提供一种基于类别信息的鸟类检索系统,包括:
数据库构建模块,用于构建鸟类图像数据库,所述鸟类图像数据库中包括不同类别的鸟类图像,以及不同背景和不同姿态的相同类别的鸟类图像;
鸟类图像识别模型构建模块,用于在现有卷积神经网络模型的基础上,增加批归一化层、两个卷积层以及输出层,对卷积神经网络进行改进,得到改进的卷积神经网络模型,基于改进的卷积神经网络模型对所述鸟类图像数据块训练得到鸟类图像识别模型;
特征提取模块,用于通过所述鸟类图像识别模型提取待检索鸟类图像的特征信息;
检索模块,用于余弦相似性指标将待检索鸟类图像的特征信息与鸟类图像数据库中各个图像的特征信息进行对比,确定鸟类图像数据库中与待检索鸟类图像相似度满足预设条件的至少一张鸟类图像。
可选地,所述鸟类图像识别模型构建模块通过以下步骤构建得到:
在卷积神经网络VGG16的基础之上,增加批归一化BN层、3x3卷积层、1x1卷积层、输出Dropout层,对卷积神经网络VGG16进行改进,得到改进的卷积神经网络VGG16;
将鸟类图像数据库的80%作为改进的卷积神经网络VGG16的训练集,并采用水平翻转、[-5°,5°]的角度随机旋转以及[-5,5]个像素水平平移的方式对数据集进行增强,将余下的20%作为验证集,使用随机梯度下降SGD优化器进行参数更新,设置L2正则化防止过拟合,将网络训练60轮,并且1-15轮、15-30轮、30-40轮、40-50轮、50-60轮的学习率分别为0.001、0.0005、0.0001、0.00005、0.00001;
使用迁移学习对网络参数更新,使用预训练的网络参数对构建网络参数初始化,对conv1~conv4层参数进行冻结,只更新余下层的参数,得到鸟类图像识别模型。
可选地,所述特征提取模块从鸟类图像识别模型的最后一个卷积层提取尺寸为W×H的K个特征图以及具有预设类别信息的CAMs,并将CAMs归一到[0,1],尺寸调整到W×H,第c个类别的CAMs的计算方式如下:其中,K为大于1的整数,W为特征图的宽,H为特征图的高,conv表示卷积,convk表示GAP层前卷积层的第k个特征图,wk,c表示第k个特征图与第c个类别连接的权重,1≤k≤K;对于给定的类别c,将特征图与其所对应的CAM进行点乘,实现对特征图的加权,之后利用求和池化sum-pooling将加权后的K个特征图聚合成K维特征向量F,其中,特征向量F带有语义类别信息;将带有语义类别信息的特征向量F进行l2范数归一化,得到图像的K维特征表达D。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
本发明提出的基于类别信息的鸟类检索方法及系统,使用基于改进的卷积神经网络模型提取检索所需要的图像特征,以获得对图像更好的表征,以及在特征中加入图像的类别信息,以提升检索效果。
附图说明
图1是本发明提供的基于类别信息的鸟类检索方法的实现流程图;
图2是本发明提供的基于类别信息的鸟类检索方法的基于CAMs的图像特征表达;
图3是本发明提供的基于类别信息的鸟类检索方法的改进的卷积神经网络结构图;
图4是本发明提供的基于类别信息的鸟类检索系统的架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
针对上述问题,本发明目的是提出一种基于类别信息鸟类检索方法,利用卷积神经网络中语义类别信息获得图像的表达特征,以获得在鸟类数据集上更高的检索效果。
如图1所示,本发明实施例的一种基于类别信息的鸟类检索方法,该方法包括以下步骤:
步骤(1)构建来源真实场景的鸟类图像数据,并且同一类别之内具有一定的差异,即同一类的鸟类具有不同的背景(如,海面、森林、天空、草地等)及不同的姿态(如,行走、站立、跳跃、觅食等),构建9313张鸟类数据图像。
步骤(2)基于改进的VGG16网络模型训练鸟类图像识别模型,具体实施方式如下:
步骤(2.1)构建基于VGG16的改进的卷积神经网络模型。在VGG16的基础之上,增加BN层、3x3卷积层、1x1卷积层、Dropout层,对卷积神经网络进行改进,改进后的结构如图3所示,各层参数如表1所示。
表1各层参数
如表1所示,3×3和1×1分别表示3×3和1×1的卷积核,其后的数字表示特征图个数,如64表示64个特征图。
步骤(2.2)训练步骤(2.1)构建完成的网络模型。将步骤(1)构建的数据集的80%作为训练集,并采用水平翻转、[-5°,5°]的角度随机旋转、[-5,5]个像素水平平移的方式对数据集进行增强,将余下的20%作为验证集。使用SGD(随机梯度下降)优化器进行参数更新,设置L2正则化防止过拟合,将网络训练60轮,并且1-15轮、15-30轮、30-40轮、40-50轮、50-60轮的学习率分别为0.001、0.0005、0.0001、0.00005、0.00001。
步骤(2.3)迁移学习。使用迁移学习对步骤(2.1)中构建的网络的参数进行更新,使用在ImageNet上预训练的网络参数对网络参数进行初始化,对conv1~conv4层参数进行冻结,只更新余下层的参数。
步骤(3)根据步骤(2)获得的VGG16网络,提取图像的基于的CAMs特征表达,如图2所示,其具体步骤如下:
步骤(3.1)卷积特征与CAMs提取。将步骤(1)构建的数据集(包括查询图像和数据库图像)输入到步骤(2)训练完成的VGG16网络,从最后一个卷积层提取尺寸为W×H的K个特征图(χ)以及具有特定类别信息的CAMs,并将CAMs归一到[0,1],尺寸resize到W×H。第c个类别的CAMs的计算方式如下:
其中,convk表示GAP层前卷积层的第k个特征图,wk,c表示第k个特征图与第c个类别连接的权重。
步骤(3.2)特征加权与池化。对于给定的类别c,将特征图与其所对应的CAM进行点乘,实现对特征图的加权。之后利用求和池化(sum-pooling)将加权后的K个特征图聚合成K维特征向量F。具体来说:
步骤3.2.1,计算每个特征图中非0特征值所占的比例Qk,即:
其中,χ表示特征图,表示第k个特征图的第(i,j)所对应的像素,W和H分别表示特征图的宽和高。
步骤3.2.2,通道加权系数CWk计算方式如式(3)所示:
步骤3.2.3,最后,对求和池化后的特征向量进行加权得到特定类对应的特征向量F,F中每个元素的计算方式如式(4)所示:
其中,CAMi,j表示第(i,j)像素所对应的CAM值。
步骤(3.3)特征表达。将步骤(3.2)得到的带有语义类别信息的特征向量F进行l2范数归一化,得到图像的K维特征表达D。
步骤(4)使用余弦相似性指标来计算步骤(3)获得的查询图像特征与数据库特征之间的相似性,从而根据用户需要生成相似性最高的排序列表,得到检索结果。
图4是本发明提供的基于类别信息的鸟类检索系统的架构图。如图4所示,包括:数据库构建模块、鸟类图像识别模型构建模块、特征提取模块以及检索模块;
数据库构建模块,用于构建鸟类图像数据库,所述鸟类图像数据库中包括不同类别的鸟类图像,以及不同背景和不同姿态的相同类别的鸟类图像;
鸟类图像识别模型构建模块,用于在现有卷积神经网络模型的基础上,增加批归一化层、两个卷积层以及输出层,对卷积神经网络进行改进,得到改进的卷积神经网络模型,基于改进的卷积神经网络模型对所述鸟类图像数据块训练得到鸟类图像识别模型;
特征提取模块,用于通过所述鸟类图像识别模型提取待检索鸟类图像的特征信息;
检索模块,用于余弦相似性指标将待检索鸟类图像的特征信息与鸟类图像数据库中各个图像的特征信息进行对比,确定鸟类图像数据库中与待检索鸟类图像相似度满足预设条件的至少一张鸟类图像。
具体地,各个模块的功能可参见上述方法实施例中的详细介绍,在此不做赘述。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于类别信息的鸟类检索方法,其特征在于,包括以下步骤:
(1)构建鸟类图像数据库,所述鸟类图像数据库中包括不同类别的鸟类图像,以及不同背景和不同姿态的相同类别的鸟类图像;
(2)在现有卷积神经网络模型的基础上,增加批归一化层、两个卷积层以及输出层,对卷积神经网络进行改进,得到改进的卷积神经网络模型,基于改进的卷积神经网络模型对所述鸟类图像数据块训练得到鸟类图像识别模型;
(3)通过所述鸟类图像识别模型提取待检索鸟类图像的特征信息;
(4)使用余弦相似性指标将待检索鸟类图像的特征信息与鸟类图像数据库中各个图像的特征信息进行对比,确定鸟类图像数据库中与待检索鸟类图像相似度满足预设条件的至少一张鸟类图像。
2.根据权利要求1所述的基于类别信息的鸟类检索方法,其特征在于,所述步骤(2)具体包括以下步骤:
步骤2.1,在卷积神经网络VGG16的基础之上,增加批归一化BN层、3x3卷积层、1x1卷积层、输出Dropout层,对卷积神经网络VGG16进行改进,得到改进的卷积神经网络VGG16;
步骤2.2,将鸟类图像数据库的80%作为改进的卷积神经网络VGG16的训练集,并采用水平翻转、[-5°,5°]的角度随机旋转以及[-5,5]个像素水平平移的方式对数据集进行增强,将余下的20%作为验证集,使用随机梯度下降SGD优化器进行参数更新,设置L2正则化防止过拟合,将网络训练60轮,并且1-15轮、15-30轮、30-40轮、40-50轮、50-60轮的学习率分别为0.001、0.0005、0.0001、0.00005、0.00001;
步骤2.3,使用迁移学习对网络参数更新,使用预训练的网络参数对构建网络参数初始化,对conv1~conv4层参数进行冻结,只更新余下层的参数,得到鸟类图像识别模型。
3.根据权利要求1或2所述的基于类别信息的鸟类检索方法,其特征在于,所述步骤(3)具体包括如下步骤:
步骤3.1,从鸟类图像识别模型的最后一个卷积层提取尺寸为W×H的K个特征图以及具有预设类别信息的CAMs,并将CAMs归一到[0,1],尺寸调整到W×H,第c个类别的CAMs的计算方式如下:
其中,K为大于1的整数,W为特征图的宽,H为特征图的高,conv表示卷积,convk表示GAP层前卷积层的第k个特征图,wk,c表示第k个特征图与第c个类别连接的权重,1≤k≤K;
步骤3.2,对于给定的类别c,将特征图与其所对应的CAM进行点乘,实现对特征图的加权,之后利用求和池化sum-pooling将加权后的K个特征图聚合成K维特征向量F,其中,特征向量F带有语义类别信息;
步骤3.3,将带有语义类别信息的特征向量F进行l2范数归一化,得到图像的K维特征表达D。
4.根据权利要求3所述的基于类别信息的鸟类检索方法,其特征在于,所述步骤3.2具体包括如下步骤:
步骤3.2.1,计算每个特征图中非0特征值所占的比例,即:
其中,Qk为第k个特征图中非0特征值所占的比例,χ表示特征图,表示第k个特征图的第i,j像素点所对应的像素,W和H分别表示特征图的宽和高;
步骤3.2.2,确定第k个特征图的通道加权系数CWk:
步骤3.2.3,对求和池化后的特征向量进行加权得到预设类对应的特征向量F,F中每个元素的计算方式如下:
其中,fk表示第k个特征图对应在特征向量F中的元素,CAMi,j表示第(i,j)像素所对应的CAM值。
5.根据权利要求1所述的基于类别信息的鸟类检索方法,其特征在于,所述步骤(4)具体包括如下步骤:
使用余弦相似性指标来计算待检索鸟类图像的特征信息与鸟类图像数据库特征之间的相似性,从而根据用户需求生成相似性最大的排序列表,得到检索结果。
6.根据权利要求1至5任一项所述的基于类别信息的鸟类检索方法,其特征在于,所述鸟类图像数据库中图像不同背景包括:海面、森林、天空和草地。
7.根据权利要求1至5任一项所述的基于类别信息的鸟类检索方法,其特征在于,所述鸟类图像数据库中鸟类不同姿态包括:行走、站立、跳跃和觅食。
8.一种基于类别信息的鸟类检索系统,其特征在于,包括:
数据库构建模块,用于构建鸟类图像数据库,所述鸟类图像数据库中包括不同类别的鸟类图像,以及不同背景和不同姿态的相同类别的鸟类图像;
鸟类图像识别模型构建模块,用于在现有卷积神经网络模型的基础上,增加批归一化层、两个卷积层以及输出层,对卷积神经网络进行改进,得到改进的卷积神经网络模型,基于改进的卷积神经网络模型对所述鸟类图像数据块训练得到鸟类图像识别模型;
特征提取模块,用于通过所述鸟类图像识别模型提取待检索鸟类图像的特征信息;
检索模块,用于余弦相似性指标将待检索鸟类图像的特征信息与鸟类图像数据库中各个图像的特征信息进行对比,确定鸟类图像数据库中与待检索鸟类图像相似度满足预设条件的至少一张鸟类图像。
9.根据权利要求8所述的基于类别信息的鸟类检索系统,其特征在于,所述鸟类图像识别模型构建模块通过以下步骤构建得到:
在卷积神经网络VGG16的基础之上,增加批归一化BN层、3x3卷积层、1x1卷积层、输出Dropout层,对卷积神经网络VGG16进行改进,得到改进的卷积神经网络VGG16;
将鸟类图像数据库的80%作为改进的卷积神经网络VGG16的训练集,并采用水平翻转、[-5°,5°]的角度随机旋转以及[-5,5]个像素水平平移的方式对数据集进行增强,将余下的20%作为验证集,使用随机梯度下降SGD优化器进行参数更新,设置L2正则化防止过拟合,将网络训练60轮,并且1-15轮、15-30轮、30-40轮、40-50轮、50-60轮的学习率分别为0.001、0.0005、0.0001、0.00005、0.00001;
使用迁移学习对网络参数更新,使用预训练的网络参数对构建网络参数初始化,对conv1~conv4层参数进行冻结,只更新余下层的参数,得到鸟类图像识别模型。
10.根据权利要求8所述的基于类别信息的鸟类检索系统,其特征在于,所述特征提取模块从鸟类图像识别模型的最后一个卷积层提取尺寸为W×H的K个特征图以及具有预设类别信息的CAMs,并将CAMs归一到[0,1],尺寸调整到W×H,第c个类别的CAMs的计算方式如下:其中,K为大于1的整数,W为特征图的宽,H为特征图的高,conv表示卷积,convk表示GAP层前卷积层的第k个特征图,wk,c表示第k个特征图与第c个类别连接的权重,1≤k≤K;对于给定的类别c,将特征图与其所对应的CAM进行点乘,实现对特征图的加权,之后利用求和池化sum-pooling将加权后的K个特征图聚合成K维特征向量F,其中,特征向量F带有语义类别信息;将带有语义类别信息的特征向量F进行l2范数归一化,得到图像的K维特征表达D。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811108809.0A CN109446368B (zh) | 2018-09-21 | 2018-09-21 | 一种基于类别信息的鸟类检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811108809.0A CN109446368B (zh) | 2018-09-21 | 2018-09-21 | 一种基于类别信息的鸟类检索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109446368A true CN109446368A (zh) | 2019-03-08 |
CN109446368B CN109446368B (zh) | 2020-07-10 |
Family
ID=65530723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811108809.0A Expired - Fee Related CN109446368B (zh) | 2018-09-21 | 2018-09-21 | 一种基于类别信息的鸟类检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109446368B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532441A (zh) * | 2019-08-23 | 2019-12-03 | 广州医科大学 | 一种电子元器件智慧管理方法及其系统 |
CN111178292A (zh) * | 2019-12-31 | 2020-05-19 | 东软集团(北京)有限公司 | 一种车型识别方法、装置及设备 |
CN113515660A (zh) * | 2021-07-16 | 2021-10-19 | 广西师范大学 | 基于三维张量对比策略的深度特征对比加权图像检索方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120288186A1 (en) * | 2011-05-12 | 2012-11-15 | Microsoft Corporation | Synthesizing training samples for object recognition |
CN107729363A (zh) * | 2017-09-06 | 2018-02-23 | 上海交通大学 | 基于GoogLeNet网络模型鸟类种群识别分析方法 |
CN108537777A (zh) * | 2018-03-20 | 2018-09-14 | 西京学院 | 一种基于神经网络的作物病害识别方法 |
-
2018
- 2018-09-21 CN CN201811108809.0A patent/CN109446368B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120288186A1 (en) * | 2011-05-12 | 2012-11-15 | Microsoft Corporation | Synthesizing training samples for object recognition |
CN107729363A (zh) * | 2017-09-06 | 2018-02-23 | 上海交通大学 | 基于GoogLeNet网络模型鸟类种群识别分析方法 |
CN108537777A (zh) * | 2018-03-20 | 2018-09-14 | 西京学院 | 一种基于神经网络的作物病害识别方法 |
Non-Patent Citations (1)
Title |
---|
符保龙等: "基于改进布谷鸟搜索算法的相关反馈图像检索", 《电视技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532441A (zh) * | 2019-08-23 | 2019-12-03 | 广州医科大学 | 一种电子元器件智慧管理方法及其系统 |
CN111178292A (zh) * | 2019-12-31 | 2020-05-19 | 东软集团(北京)有限公司 | 一种车型识别方法、装置及设备 |
CN113515660A (zh) * | 2021-07-16 | 2021-10-19 | 广西师范大学 | 基于三维张量对比策略的深度特征对比加权图像检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109446368B (zh) | 2020-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hao et al. | HSME: Hypersphere manifold embedding for visible thermal person re-identification | |
Xia et al. | AID: A benchmark data set for performance evaluation of aerial scene classification | |
Zhang et al. | A lightweight and discriminative model for remote sensing scene classification with multidilation pooling module | |
Zhou et al. | PatternNet: A benchmark dataset for performance evaluation of remote sensing image retrieval | |
Zhu et al. | Adaptive deep sparse semantic modeling framework for high spatial resolution image scene classification | |
Li et al. | Building-a-nets: Robust building extraction from high-resolution remote sensing images with adversarial networks | |
Liu et al. | Similarity-based unsupervised deep transfer learning for remote sensing image retrieval | |
Dieleman et al. | Exploiting cyclic symmetry in convolutional neural networks | |
Zhou et al. | Learning deep features for scene recognition using places database | |
Gong et al. | Diversity-promoting deep structural metric learning for remote sensing scene classification | |
Zhao et al. | Land-use scene classification using a concentric circle-structured multiscale bag-of-visual-words model | |
CN104680173B (zh) | 一种遥感图像场景分类方法 | |
Merler et al. | Semantic model vectors for complex video event recognition | |
Liang et al. | Cross-modality transformer with modality mining for visible-infrared person re-identification | |
CN109543602A (zh) | 一种基于多视角图像特征分解的行人再识别方法 | |
US20220222918A1 (en) | Image retrieval method and apparatus, storage medium, and device | |
Tang et al. | Two-stage reranking for remote sensing image retrieval | |
CN109376603A (zh) | 一种视频识别方法、装置、计算机设备及存储介质 | |
Fu et al. | Tagging personal photos with transfer deep learning | |
CN106909924A (zh) | 一种基于深度显著性的遥感影像快速检索方法 | |
Wulamu et al. | Multiscale road extraction in remote sensing images | |
Yang et al. | An improved Bag-of-Words framework for remote sensing image retrieval in large-scale image databases | |
Zheng et al. | Differential Learning: A Powerful Tool for Interactive Content-Based Image Retrieval. | |
CN109446368A (zh) | 一种基于类别信息的鸟类检索方法及系统 | |
CN109086405A (zh) | 基于显著性和卷积神经网络的遥感图像检索方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200710 Termination date: 20210921 |