CN115292535B - 一种基于深度极化哈希的分层车辆图像检索方法 - Google Patents
一种基于深度极化哈希的分层车辆图像检索方法 Download PDFInfo
- Publication number
- CN115292535B CN115292535B CN202211016552.2A CN202211016552A CN115292535B CN 115292535 B CN115292535 B CN 115292535B CN 202211016552 A CN202211016552 A CN 202211016552A CN 115292535 B CN115292535 B CN 115292535B
- Authority
- CN
- China
- Prior art keywords
- hash
- features
- vehicle image
- class
- polarization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010287 polarization Effects 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000006870 function Effects 0.000 claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于深度极化哈希的分层车辆图像检索方法,包括获取车辆图像数据集并进行预处理;搭建分层极化网络模型,进行极化损失函数和优化器的配置,并导入车辆图像数据集进行特征学习和哈希函数学习的训练;利用训练好的分层极化网络模型提取数据集中查询图像和数据库图像的超类特征和子类特征,并利用学习后的哈希函数对超类特征和子类特征进行哈希化,得到哈希码;通过得到的哈希码的超类哈希特征和哈希子类特征计算相似度进行分层图像检索,得到检索结果。本发明通过利用车辆图片的超类子类标签学习超类子类哈希特征,采用分层哈希检索的方式,检索出与查询图片同一型号的车辆,加快车辆图像检索的速度和精度。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于深度极化哈希的分层车辆图像检索方法。
背景技术
从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(CBIR)技术。CBIR还包括对动态视频、音频等其它形式多媒体信息的检索技术。
后来随着深度学习的广泛应用,以及CNN提取图像深度特征的强大能力,研究人员开始通过深度学习来提取图像特征,这种深度特征比传统的GIST、SIFT等方法提取的特征有用的多,应用到图像检索上面十分有效。
而对于车辆检索领域,在当前的大数据时代,每条公路上都有好多监控摄像头,每天都会产生大量的车辆图片数据。车辆图像检索的任务就是从这些海量的车辆图像数据中检索出与给定查询图片同一型号甚至同一车牌的图片,但是这些大量车辆图像数据的检索数据库变得越来越大,通过深度学习提取图像的特征越来越慢、越来越繁琐,从而导致检索的速度和精度都有所损失。为了加快检索速度,研究人员引入哈希码,将图片的特征进行哈希化,通过汉明距离计算他们之间的相似度以加快检索速度。而训练哈希函数的量化损失往往是不可微的,因此无法通过梯度下降法反向传播更新网络参数,有的研究人员就通过近似的方法逼近要学习的哈希函数,但是这样通常或多或少会存在一些量化误差,导致最终的检索结果并没有达到最好。
发明内容
本发明的目的克服现有技术存在的不足,为实现以上目的,采用一种基于深度极化哈希的分层车辆图像检索方法,以解决上述背景技术中提出的问题。
一种基于深度极化哈希的分层车辆图像检索方法,包括:
获取车辆图像数据集并进行预处理;
搭建分层极化网络模型,进行极化损失函数和优化器的配置,并导入车辆图像数据集进行特征学习和哈希函数学习的训练;
利用训练好的分层极化网络模型提取数据集中查询图像和数据库图像的超类特征和子类特征,并利用学习后的哈希函数对超类特征和子类特征进行哈希化,得到哈希码;
通过得到的哈希码的超类哈希特征和哈希子类特征计算相似度进行分层图像检索,得到检索结果。
作为本发明的进一步的方案:所述获取车辆图像数据集并进行预处理的具体步骤包括:
获取车辆图像数据集,所述车辆图像数据集包括m张图像的训练集和n张图像的测试集,其中将m张图像的训练集作为待检索数据库;
对车辆图像训练集进行预处理,根据车辆品牌划分为若干个超类,再在每个超类品牌中根据不同车辆型号划分为若干个子类;
对输入的车辆图像训练集的RBG通道归一化处理,限定于-1至1之间,并采用裁剪、翻转,以及旋转的数据增强方法对车辆图像固定大小尺寸。
作为本发明的进一步的方案:所述搭建分层极化网络模型,进行极化损失函数和优化器的配置,并导入车辆图像数据集进行特征学习和哈希函数学习的训练的具体步骤包括:
获取车辆图像数据集的训练集和测试集;
搭建分层极化网络模型,制定深度模型训练策略,其中训练集与测试集的比例为m:n=4:1;
再对输入的车辆图像样本进行归一化处理:(image/255)×2-1;
其中,image为输入的车辆图像样本,采用数据增强方法扩大训练样本量,对车辆图像统一调整尺寸大小到256*256,然后剪裁尺寸大小到224*224;
通过模型的骨干网络学习深度特征,对划分为超类和子类分支学习对应的超类特征和子类特征;
将模型的优化器设定为Adam,采用可微分的极化损失函数优化网络参数,设置哈希函数的初始化长度为bit位的{1,-1}随机值,然后采用自适应更新的方式更新超类和子类对应的哈希函数。
作为本发明的进一步的方案:所述通过模型的骨干网络学习深度特征,对划分为超类和子类分支学习对应的超类特征和子类特征的具体步骤包括:
将ResNet50网络作为骨干网络提取每张图片的深度特征,公式为:X=ResNet(T);
然后设置超类分支为一个全连接层网络学习超类特征Vsup=FC(X),子类分支为d个全连接层网络学习每一个超类的子类特征Vi sub=FC(X),i∈{1,2,…,d};
其中,ResNet()为ResNet50网络,FC()为全连接层网络,d为超类类别数。
作为本发明的进一步的方案:所述采用可微分的极化损失函数优化网络参数的具体步骤包括:
采用可微分的极化损失函数使得骨干网络的输出特征V中的每个元素均偏离0,所述极化损失函数的公式:
其中,v为每个分支的超类子类特征,t为要学习的哈希函数,m为阈值,用于控制极化损失的极化程度,K为哈希位数bit;
得到目标函数为:
其中,w为网络中要学习的权重,L为类别数,Cx为第x类的样本集;
将得到的超类损失Lp sup和d个子类损失Lpi sub之和作为最终的总损失,i∈{1,2,…,d}。
作为本发明的进一步的方案:所述采用自适应更新的方式更新超类和子类对应的哈希函数的具体步骤包括:
对于每一个类别c,获取其预测正确的特征vc,然后将该特征值符号化作为更新后的哈希值,即tc_new=sign(vc),其中sign()为符号函数。
作为本发明的进一步的方案:所述利用学习后的哈希函数对超类特征和子类特征进行哈希化的具体步骤包括:
获取数据集中的查询图像和数据库图像,提取对应的超类特征和子类特征;
对得到的超类特征和子类特征,采用三元赋值的方式和学习后的哈希函数进行哈希化,得到最终的哈希码,公式为:
其中,x为超类和子类特征的各个元素的特征值,m为极化损失中的阈值。
作为本发明的进一步的方案:所述通过得到的哈希码的超类哈希特征和哈希子类特征计算相似度进行分层图像检索,得到检索结果的具体步骤包括:
利用数据集中的查询图像和数据库图像的超类哈希特征计算之间的汉明距离,得到一个候选排序结果,汉明距离的计算公式为:
其中,b和t分别代表要计算的两个向量,K代表哈希位数bit;
获取候选排序结果中的前k个数据库图像进行子类特征相似度计算,其中k为数据库图像数量的1/10;
最后计算子类哈希特征之间的汉明距离得到最终的检索排序结果。
与现有技术相比,本发明存在以下技术效果:
采用上述的技术方案,通过以基于深度哈希的模型为基础,根据车辆图片的品牌和型号分层式的提取超类和子类特征,并通过可微分的极化损失函数优化网络参数,其中利用分步更新的方式更新网络各层的参数,并利用自适应的方式更新哈希函数。分层检索时首先提取查询图像和数据库图像的超类和子类特征,利用学习到的哈希函数将对应的超类和子类特征转换为哈希特征,然后根据超类哈希特征计算他们之间的汉明距离,筛选出前k个图片根据子类哈希特征计算他们之间的汉明距离得到最终的检索结果。实现了快速分层车辆图像检索,提高了针对车辆图像检索的检索速度和检索精度,解决了常规图像检索应用于特定场景图像中检索效果差的问题。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1为本申请公开的实施例的结构示意图;
图2为本申请公开的实施例的分层车辆图像检索的步骤示意图;
图3为本申请公开的实施例的分层极化网络结构示意图;
图4为本申请公开的实施例的分层车辆检索结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1和图2,本发明实施例中,一种基于深度极化哈希的分层车辆图像检索方法,包括:
S1、获取车辆图像数据集并进行预处理,本实施例中,具体步骤包括:
获取车辆图像数据集,所述车辆图像数据集包括m张图像的训练集和n张图像的测试集,其中将m张图像的训练集作为待检索数据库;
对车辆图像训练集进行预处理,根据车辆品牌划分为若干个超类,再在每个超类品牌中根据不同车辆型号划分为若干个子类;
对输入的车辆图像训练集的RBG通道归一化处理,限定于-1至1之间,并采用裁剪、翻转,以及旋转的数据增强方法对车辆图像固定大小尺寸。
S2、搭建分层极化网络模型,进行极化损失函数和优化器的配置,并导入车辆图像数据集进行特征学习和哈希函数学习的训练,具体步骤包括:
S21、获取车辆图像数据集的训练集和测试集;
设置车辆图像的训练集为m张图像T={T1,T2,…,Ti,…,Tm},设置m张训练集图片对应的超类标签为Lsup={l1 sup,l2 sup,…,li sup,…,lm sup},子类标签为Lsub={l1 sub,l2 sub,…,li sub,…,lm sup},其中Ti表示训练集中第i张图像,li sup表示训练集中第i张图像的超类标签,li sub表示训练集中第i张图像的子类标签;
设置n张车辆图像的测试集查询图片为Q={Q1,Q2,…,Qi,…,Qn},其中Qi表示测试集中第i张图像;
S22、搭建分层极化网络模型,制定深度模型训练策略,其中训练集与测试集的比例为m:n=4:1;
再对输入的车辆图像样本进行归一化处理:(image/255)×2-1;
其中,image为输入的车辆图像样本,采用数据增强方法扩大训练样本量,对车辆图像统一调整尺寸大小到256*256,然后剪裁尺寸大小到224*224;
S23、通过模型的骨干网络学习深度特征,对划分为超类和子类分支学习对应的超类特征和子类特征,本实施例中,其具体步骤包括:
本实施例中,如图3所示,图示为分层极化网络结构示意图。
将ResNet50网络作为骨干网络提取每张图片的深度特征,公式为:X=ResNet(T);
然后设置超类分支为一个全连接层网络学习超类特征Vsup=FC(X),子类分支为d个全连接层网络学习每一个超类的子类特征Vi sub=FC(X),i∈{1,2,…,d};
其中,ResNet()为ResNet50网络,FC()为全连接层网络,d为超类类别数。
S24、将模型的优化器设定为Adam,采用可微分的极化损失函数优化网络参数,设置哈希函数的初始化长度为bit位的{1,-1}随机值,然后采用自适应更新的方式更新超类和子类对应的哈希函数。
具体的,所述采用可微分的极化损失函数优化网络参数的具体步骤包括:
采用可微分的极化损失函数使得骨干网络的输出特征V中的每个元素均偏离0,所述极化损失函数的公式:
其中,v为每个分支的超类子类特征,t为要学习的哈希函数,m为阈值,用于控制极化损失的极化程度,K为哈希位数bit;
得到目标函数为:
其中,w为网络中要学习的权重,L为类别数,Cx为第x类的样本集;
将得到的超类损失Lp sup和d个子类损失Lpi sub之和作为最终的总损失,i∈{1,2,…,d}。
上述损失是一种可微分的极化损失,可以通过梯度下降法直接反向传播更新网络参数w,我们在更新的时候采用分步更新的方式,具体做法为首先根据超类标签Lsup和对应的哈希函数优化超类分支和骨干网络的网络参数,然后冻结骨干网络的参数,根据所属超类的子类标签Li sub和对应的哈希函数优化子类分支的网络参数。
本实施例中,所述采用自适应更新的方式更新超类和子类对应的哈希函数的具体步骤包括:
对于每一个类别c,获取其预测正确的特征vc,然后将该特征值符号化作为更新后的哈希值,即tc_new=sign(vc),其中sign()为符号函数。
S3、利用训练好的分层极化网络模型提取数据集中查询图像和数据库图像的超类特征和子类特征,并利用学习后的哈希函数对超类特征和子类特征进行哈希化,得到哈希码;
本实施例中,如图4所示,图示为分层车辆检索结构示意图,所述利用学习后的哈希函数对超类特征和子类特征进行哈希化的具体步骤包括:
获取数据集中的查询图像和数据库图像,提取对应的超类特征和子类特征;
对于查询图像Q和数据库图像,即m张训练集图像T={T1,T2,…,Ti,…,Tm},输入到搭建的分层极化网络模型中提取其对应的超类特征vQsup、vTsup和子类特征vQsub、vTsub;
其中,vQsup为查询图像的超类特征,vTsup为数据库图像的超类特征,vQsub为查询图像的子类特征,vTsub为数据库图像的子类特征;
后面我们会利用哈希函数将这些特征进行哈希化,具体的,采用一种三元赋值的方式,由于分层极化网络会将超类特征和子类特征的特征值偏离0,但其中一些预测错误的样本得到的特征值处于-1到1之间,即在阈值m范围内,而预测正确的样本特征值往往会大于1或者小于-1,即在阈值m范围外,因此通过利用三元赋值方式得到最终的哈希码:
其中,x为超类和子类特征的各个元素的特征值,m为极化损失中的阈值,本实施例中,m默认为1,因此得到的哈希码可以使预测错误的那些的特征值变为0以减小误差。
S4、通过得到的哈希码的超类哈希特征和哈希子类特征计算相似度进行分层图像检索,得到检索结果,其具体步骤包括:
本实施例中,根据得到的哈希码HQsup、HTsup、HQsub、HTsub,其中HQsup为查询图像Q的超类哈希特征、HTsup为数据库图像T的超类哈希特征、HQsub为查询图像Q的对应该超类的子类哈希特征、HTsub为数据库图像T的对应该超类的子类哈希特征;
我们首先利用查询图像和数据库图像的超类哈希特征HQsup、HTsup计算其之间的汉明距离,得到一个候选排序结果,汉明距离的计算公式为:
其中,b和t分别代表要计算的两个向量,K代表哈希位数bit;
获取候选排序结果中的前k个数据库图像进行子类特征相似度计算,其中k为数据库图像数量的1/10,即k=m/10;
最后我们进行子类特征相似度的计算,利用查询图片和k个数据库图片子类哈希特征HQsub、HTsub之间的汉明距离得到最终的检索排序结果。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于深度极化哈希的分层车辆图像检索方法,其特征在于,包括:
获取车辆图像数据集并进行预处理;
搭建分层极化网络模型,进行极化损失函数和优化器的配置,并导入车辆图像数据集进行特征学习和哈希函数学习的训练,其具体步骤包括:
获取车辆图像数据集的训练集和测试集;
搭建分层极化网络模型,制定深度模型训练策略,其中训练集与测试集的比例为M:N=4:1;
再对输入的车辆图像样本进行归一化处理:(image/255)×2-1;
其中,image为输入的车辆图像样本,采用数据增强方法扩大训练样本量,对车辆图像统一调整尺寸大小到256*256,然后剪裁尺寸大小到224*224;
通过模型的骨干网络学习深度特征,对划分为超类和子类分支学习对应的超类特征和子类特征,其具体步骤包括:
将ResNet50网络作为骨干网络提取每张图片的深度特征,公式为:X=ResNet(T),其中T为训练集的车辆图像;
然后设置超类分支为一个全连接层网络学习超类特征Vsup=FC(X),子类分支为d个全连接层网络学习每一个超类的子类特征Vi sub=FC(X),i∈{1,2,…,d};
其中,ResNet()为ResNet50网络,FC()为全连接层网络,d为超类类别数;
将模型的优化器设定为Adam,采用可微分的极化损失函数优化网络参数,设置哈希函数的初始化长度为bit位的{1,-1}随机值,然后采用自适应更新的方式更新超类和子类对应的哈希函数;
利用训练好的分层极化网络模型提取数据集中查询图像和数据库图像的超类特征和子类特征,并利用学习后的哈希函数对超类特征和子类特征进行哈希化,得到哈希码;
通过得到的哈希码的超类哈希特征和子类哈希特征计算相似度进行分层图像检索,得到检索结果。
2.根据权利要求1所述一种基于深度极化哈希的分层车辆图像检索方法,其特征在于,所述获取车辆图像数据集并进行预处理的具体步骤包括:
获取车辆图像数据集,所述车辆图像数据集包括m张图像的训练集和n张图像的测试集,其中将m张图像的训练集作为待检索数据库;
对车辆图像训练集进行预处理,根据车辆品牌划分为若干个超类,再在每个超类品牌中根据不同车辆型号划分为若干个子类;
对输入的车辆图像训练集的RBG通道归一化处理,限定于-1至1之间,并采用裁剪、翻转,以及旋转的数据增强方法对车辆图像固定大小尺寸。
3.根据权利要求1所述一种基于深度极化哈希的分层车辆图像检索方法,其特征在于,所述采用可微分的极化损失函数优化网络参数的具体步骤包括:
采用可微分的极化损失函数使得骨干网络的输出特征V中的每个元素均偏离0,所述极化损失函数的公式:
其中,v为每个分支的超类子类特征,即超类特征Vsup和子类特征Vi sub,t为目标哈希中心,m为阈值,用于控制极化损失的极化程度,K为哈希位数bit;
得到目标函数为:
其中,w为网络中要学习的权重,L为类别数,Cx为第x类的样本集;
将得到的超类损失Lp sup和d个子类损失Lpi sub之和作为最终的总损失,i∈{1,2,…,d}。
4.根据权利要求1所述一种基于深度极化哈希的分层车辆图像检索方法,其特征在于,所述采用自适应更新的方式更新超类和子类对应的哈希函数的具体步骤包括:
对于每一个类别c,获取其预测正确的特征vc,然后将该特征值符号化作为更新后的哈希值,即tc_new=sign(vc),其中sign()为符号函数。
5.根据权利要求1所述一种基于深度极化哈希的分层车辆图像检索方法,其特征在于,所述利用学习后的哈希函数对超类特征和子类特征进行哈希化的具体步骤包括:
获取数据集中的查询图像和数据库图像,提取对应的超类特征和子类特征;
对得到的超类特征和子类特征,采用三元赋值的方式和学习后的哈希函数进行哈希化,得到最终的哈希码,公式为:
其中,x为超类和子类特征的各个元素的特征值,m为极化损失中的阈值。
6.根据权利要求1所述一种基于深度极化哈希的分层车辆图像检索方法,其特征在于,所述通过得到的哈希码的超类哈希特征和子类哈希特征计算相似度进行分层图像检索,得到检索结果的具体步骤包括:
利用数据集中的查询图像和数据库图像的超类哈希特征计算之间的汉明距离,得到一个候选排序结果,汉明距离的计算公式为:
其中,为哈希特征,t为目标哈希中心,K代表哈希位数bit;
获取候选排序结果中的前k个数据库图像进行子类特征相似度计算,其中k为数据库图像数量的1/10;
最后计算子类哈希特征之间的汉明距离得到最终的检索排序结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211016552.2A CN115292535B (zh) | 2022-08-24 | 2022-08-24 | 一种基于深度极化哈希的分层车辆图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211016552.2A CN115292535B (zh) | 2022-08-24 | 2022-08-24 | 一种基于深度极化哈希的分层车辆图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115292535A CN115292535A (zh) | 2022-11-04 |
CN115292535B true CN115292535B (zh) | 2023-07-25 |
Family
ID=83831678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211016552.2A Active CN115292535B (zh) | 2022-08-24 | 2022-08-24 | 一种基于深度极化哈希的分层车辆图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115292535B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966755A (zh) * | 2021-03-10 | 2021-06-15 | 深圳市固电电子有限公司 | 电感缺陷检测方法、设备及可读存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512273A (zh) * | 2015-12-03 | 2016-04-20 | 中山大学 | 一种基于可变长深度哈希学习的图像检索方法 |
CN107480261B (zh) * | 2017-08-16 | 2020-06-16 | 上海荷福人工智能科技(集团)有限公司 | 一种基于深度学习细粒度人脸图像快速检索方法 |
CN109241313B (zh) * | 2018-08-14 | 2021-11-02 | 大连大学 | 一种基于高阶深度哈希学习的图像检索方法 |
CN110059206A (zh) * | 2019-03-29 | 2019-07-26 | 银江股份有限公司 | 一种基于深度表征学习的大规模哈希图像检索方法 |
CN110427509A (zh) * | 2019-08-05 | 2019-11-08 | 山东浪潮人工智能研究院有限公司 | 一种基于深度学习的多尺度特征融合图像哈希检索方法及系统 |
CN111626408B (zh) * | 2020-05-22 | 2021-08-06 | 深圳前海微众银行股份有限公司 | 哈希编码方法、装置、设备及可读存储介质 |
CN111950712A (zh) * | 2020-08-14 | 2020-11-17 | 深圳前海微众银行股份有限公司 | 模型网络参数处理方法、设备及可读存储介质 |
-
2022
- 2022-08-24 CN CN202211016552.2A patent/CN115292535B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966755A (zh) * | 2021-03-10 | 2021-06-15 | 深圳市固电电子有限公司 | 电感缺陷检测方法、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115292535A (zh) | 2022-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107679250B (zh) | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 | |
CN111198959B (zh) | 一种基于卷积神经网络的两阶段图像检索方法 | |
US11949964B2 (en) | Generating action tags for digital videos | |
US11023523B2 (en) | Video content retrieval system | |
US20240078258A1 (en) | Training Image and Text Embedding Models | |
US8254699B1 (en) | Automatic large scale video object recognition | |
CN102549603B (zh) | 基于相关性的图像选择 | |
CN110516095B (zh) | 基于语义迁移的弱监督深度哈希社交图像检索方法和系统 | |
CN102334118B (zh) | 基于用户兴趣学习的个性化广告推送方法与系统 | |
CN111581510A (zh) | 分享内容处理方法、装置、计算机设备和存储介质 | |
US12038970B2 (en) | Training image and text embedding models | |
Mohamed et al. | Content-based image retrieval using convolutional neural networks | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN112417381B (zh) | 应用于图像版权保护的快速定位侵权图像的方法及装置 | |
CN112948601B (zh) | 一种基于受控语义嵌入的跨模态哈希检索方法 | |
CN114358188A (zh) | 特征提取模型处理、样本检索方法、装置和计算机设备 | |
CN116975615A (zh) | 基于视频多模态信息的任务预测方法和装置 | |
CN114186013A (zh) | 实体识别模型热更新方法及其装置、设备、介质、产品 | |
Shen et al. | Elastic net regularized dictionary learning for image classification | |
CN116049412A (zh) | 文本分类方法、模型训练方法、装置及电子设备 | |
Zhang et al. | Video copy detection based on deep CNN features and graph-based sequence matching | |
CN114491115B (zh) | 一种基于深度哈希的多模型融合的集成图像检索方法 | |
Kumar et al. | Content based video retrieval using deep learning feature extraction by modified VGG_16 | |
Hou et al. | Remote sensing image retrieval with deep features encoding of Inception V4 and largevis dimensionality reduction | |
Tian et al. | Deep image retrieval of large-scale vessels images based on BoW model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |