CN110704664B - 一种哈希检索方法 - Google Patents

一种哈希检索方法 Download PDF

Info

Publication number
CN110704664B
CN110704664B CN201910801571.8A CN201910801571A CN110704664B CN 110704664 B CN110704664 B CN 110704664B CN 201910801571 A CN201910801571 A CN 201910801571A CN 110704664 B CN110704664 B CN 110704664B
Authority
CN
China
Prior art keywords
hash
image data
trained
data set
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910801571.8A
Other languages
English (en)
Other versions
CN110704664A (zh
Inventor
袁明汶
钱江波
辛宇
谢锡炯
陈海明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rihong Culture Communication Henan Co ltd
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN201910801571.8A priority Critical patent/CN110704664B/zh
Publication of CN110704664A publication Critical patent/CN110704664A/zh
Application granted granted Critical
Publication of CN110704664B publication Critical patent/CN110704664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种哈希检索方法,特点是首先从待检索图像数据所在的原始图像数据集中选取训练数据集,定义待训练的哈希模型,将训练数据集随机打乱后随机抽取N个图像数据输入待训练的哈希模型,根据输出结果与对应的原始标签信息修正模型参数,最终得到训练后的哈希模型,再用训练后的哈希模型分别对原始图像数据集及待检索图像数据进行哈希编码,最后对待检索图像数据进行哈希检索;优点是利用哈希编码重构原始标签信息,使得待训练的哈希模型在学习二进制编码的同时,能更加精细地利用标签信息,通过在损失函数中引入相似矩阵,能够指导卷积神经网络学习保相似性特征,提高哈希检索方法的准确度,从而提高检索准确性。

Description

一种哈希检索方法
技术领域
本发明涉及一种图像检索方法,尤其是一种哈希检索方法。
背景技术
随着数据规模和维度增大,图像检索的代价急剧增加,哈希作为一种实现图像高效检索的重要方式,受到了广泛的关注。然而,大多数图像哈希算法都是直接利用机器学习机制将图像的特征映射为二进制编码,这些特征无法有效地保证图像之间的语义相似性,导致得到的编码检索效率较低。
发明内容
本发明所要解决的技术问题是提供一种检索准确度较高的哈希检索方法。
本发明解决上述技术问题所采用的技术方案为:一种哈希检索方法,包括以下步骤:
①定义待检索图像数据所在的图像数据集为原始图像数据集,将原始图像数据集的M个图像数据中任意选取m个图像数据作为训练数据集,m≥0.2M,并对训练数据集中的每一个图像数据设置对应的原始标签信息;
②定义待训练的哈希模型,包括输入数据层、卷积子网络层、全卷积层、哈希层、哈希编码输出层和采用softmax分类器的分类输出层,其中,输入数据层用于输入训练数据集里的图像数据,卷积子网络层由五个卷积池化模块组成,全卷积层连续两次的采用1024个1×1的卷积核,哈希层采用K个1×1的卷积核并采用光滑的tanh激活函数,哈希编码输出层用于输出哈希层得到的哈希编码;
③随机打乱训练数据集中的m个图像数据得到打乱后的数据集,将打乱后的数据集随机抽取N个图像数据输入待训练的哈希模型,N<m,N=32或N=64,根据输出结果修正模型参数,最终得到训练后的哈希模型,具体过程如下:
③-1设置最大迭代次数,定义待训练的哈希模型的损失函数如下:
minL(W)=λ1Ls2Lh,其中W为哈希函数的权值矩阵,Ls表示softmax分类器输出的分类标签信息与原始标签信息的误差,
Figure BDA0002182465540000021
其中,H=[h1,……,hN],h1,……,hN表示打乱后的数据集随机抽取的N个图像数据在哈希层对应输出的哈希编码,HT是H的转置,S是迹为零的相似矩阵,λ1=0.5,λ2=0.5;
③-2根据待训练的哈希模型的损失函数,使用RMSProp优化算法对待训练的哈希模型进行迭代优化,直到达到设置的最大迭代次数时,停止迭代过程,得到训练后的哈希模型;
④使用训练后的哈希模型对原始图像数据集进行哈希编码,得到对应的原始图像数据哈希编码,使用训练后的哈希模型对待检索图像数据进行编码,得到对应的待检索图像哈希编码;
⑤在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的数据,并将该数据在原始图像数据集中对应的图像作为最终的检索结果,完成对待检索图像数据的哈希检索过程。
所述的步骤②中K=16或32或48或64。用于生成对应长度的哈希编码。
所述的步骤③-1中设置最大迭代次数为10000次。经过测验,迭代次数至少为10000次才能有效保证检索准确度。
与现有技术相比,本发明的优点在于首先定义包括输入数据层、卷积子网络层、全卷积层、哈希层、哈希编码输出层和采用softmax分类器的分类输出层的待训练的哈希模型,该哈希模型采用全卷积网络,从待检索图像数据所在的原始图像数据集中选取训练数据集,将训练数据集随机打乱后输入待训练的哈希模型,根据输出结果与对应的原始标签信息修正模型参数,最终得到训练后的哈希模型,再用训练后的哈希模型分别对原始图像数据集及待检索图像数据进行哈希编码,最后在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的数据,并将该数据在原始图像数据集中对应的图像作为最终的检索结果,完成对待检索图像数据的哈希检索过程,其中,利用卷积神经网络能够提取图像的高层语义特征,接着为了增强网络对图像的学习能力,增加全卷积层进一步提升特征的表达能力;最后,在全卷积层与分类输出层之间添加隐藏层作为哈希层,采用光滑的tanh函数激活哈希层,能够保证输出的实值码分布在+1或-1附近,利用哈希编码重构类别标签,使得待训练的哈希模型在学习二进制编码的同时,能更加精细地利用原始标签信息,其中通过在损失函数中引入相似矩阵,能够指导卷积神经网络学习保相似性特征,提高哈希检索方法的准确度,从而提高检索准确性,通过在标准图像数据集上的对比实验,显示了本发明所采用检索方法的检索准确率较高。
附图说明
图1为本发明的步骤流程图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
一种哈希检索方法,包括以下步骤:
①定义待检索图像数据所在的图像数据集为原始图像数据集,将原始图像数据集的M个图像数据中任意选取m个图像数据作为训练数据集,m≥0.2M,并对训练数据集中的每一个图像数据设置对应的原始标签信息;
②定义待训练的哈希模型,包括输入数据层、卷积子网络层、全卷积层、哈希层、哈希编码输出层和采用softmax分类器的分类输出层,其中,输入数据层用于输入训练数据集里的图像数据,卷积子网络层由五个卷积池化模块组成,全卷积层连续两次的采用1024个1×1的卷积核,哈希层采用K个1×1的卷积核并采用光滑的tanh激活函数,K=16或32或48或64,哈希编码输出层用于输出哈希层得到的哈希编码;
③随机打乱训练数据集中的m个图像数据得到打乱后的数据集,将打乱后的数据集随机抽取N个图像数据输入待训练的哈希模型,N<m,N=32或N=64,根据输出结果修正模型参数,最终得到训练后的哈希模型,具体过程如下:
③-1设置最大迭代次数为10000次,定义待训练的哈希模型的损失函数如下:
minL(W)=λ1Ls2Lh,其中W为哈希函数的权值矩阵,Ls表示softmax分类器输出的分类标签信息与原始标签信息的误差,
Figure BDA0002182465540000031
其中,H=[h1,……,hN],h1,……,hN表示打乱后的数据集随机抽取的N个图像数据在哈希层对应输出的哈希编码,HT是H的转置,S是迹为零的相似矩阵,λ1=0.5,λ2=0.5;
③-2根据待训练的哈希模型的损失函数,使用RMSProp优化算法对待训练的哈希模型进行迭代优化,直到达到设置的最大迭代次数时,停止迭代过程,得到训练后的哈希模型;
④使用训练后的哈希模型对原始图像数据集进行哈希编码,得到对应的原始图像数据哈希编码,使用训练后的哈希模型对待检索图像数据进行编码,得到对应的待检索图像哈希编码;
⑤在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的数据,并将该数据在原始图像数据集中对应的图像作为最终的检索结果,完成对待检索图像数据的哈希检索过程。

Claims (3)

1.一种哈希检索方法,其特征在于包括以下步骤:
①定义待检索图像数据所在的图像数据集为原始图像数据集,将原始图像数据集的M个图像数据中任意选取m个图像数据作为训练数据集,m≥0.2M,并对训练数据集中的每一个图像数据设置对应的原始标签信息;
②定义待训练的哈希模型,包括输入数据层、卷积子网络层、全卷积层、哈希层、哈希编码输出层和采用softmax分类器的分类输出层,其中,输入数据层用于输入训练数据集里的图像数据,卷积子网络层由五个卷积池化模块组成,全卷积层连续两次的采用1024个1×1的卷积核,哈希层采用K个1×1的卷积核并采用光滑的tanh激活函数,哈希编码输出层用于输出哈希层得到的哈希编码;
③随机打乱训练数据集中的m个图像数据得到打乱后的数据集,将打乱后的数据集随机抽取N个图像数据输入待训练的哈希模型,N<m,N=32或N=64,根据输出结果修正模型参数,最终得到训练后的哈希模型,具体过程如下:
③-1设置最大迭代次数,定义待训练的哈希模型的损失函数如下:
minL(W)=λ1Ls2Lh,其中W为哈希函数的权值矩阵,Ls表示softmax分类器输出的分类标签信息与原始标签信息的误差,
Figure FDA0002182465530000011
其中,H=[h1,……,hN],h1,……,hN表示打乱后的数据集随机抽取的N个图像数据在哈希层对应输出的哈希编码,HT是H的转置,S是迹为零的相似矩阵,λ1=0.5,λ2=0.5;
③-2根据待训练的哈希模型的损失函数,使用RMSProp优化算法对待训练的哈希模型进行迭代优化,直到达到设置的最大迭代次数时,停止迭代过程,得到训练后的哈希模型;
④使用训练后的哈希模型对原始图像数据集进行哈希编码,得到对应的原始图像数据哈希编码,使用训练后的哈希模型对待检索图像数据进行编码,得到对应的待检索图像哈希编码;
⑤在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的数据,并将该数据在原始图像数据集中对应的图像作为最终的检索结果,完成对待检索图像数据的哈希检索过程。
2.根据权利要求1所述的一种哈希检索方法,其特征在于所述的步骤②中K=16或32或48或64。
3.根据权利要求1所述的一种哈希检索方法,其特征在于所述的步骤③-1中设置最大迭代次数为10000次。
CN201910801571.8A 2019-08-28 2019-08-28 一种哈希检索方法 Active CN110704664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910801571.8A CN110704664B (zh) 2019-08-28 2019-08-28 一种哈希检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910801571.8A CN110704664B (zh) 2019-08-28 2019-08-28 一种哈希检索方法

Publications (2)

Publication Number Publication Date
CN110704664A CN110704664A (zh) 2020-01-17
CN110704664B true CN110704664B (zh) 2022-04-05

Family

ID=69193722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910801571.8A Active CN110704664B (zh) 2019-08-28 2019-08-28 一种哈希检索方法

Country Status (1)

Country Link
CN (1) CN110704664B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625258B (zh) * 2020-05-22 2021-08-27 深圳前海微众银行股份有限公司 默克尔树更新方法、装置、设备及可读存储介质
CN115294284B (zh) * 2022-10-09 2022-12-20 南京纯白矩阵科技有限公司 一种保障生成模型唯一性的高分辨率三维模型生成方法
CN117668549B (zh) * 2023-12-07 2024-09-20 中国人民解放军63620部队 一种数据抽取方法、装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165306A (zh) * 2018-08-09 2019-01-08 长沙理工大学 基于多任务哈希学习的图像检索方法
CN109241313A (zh) * 2018-08-14 2019-01-18 大连大学 一种基于高阶深度哈希学习的图像检索方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10515429B2 (en) * 2016-07-01 2019-12-24 Digimarc Corporation Image-based pose determination

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165306A (zh) * 2018-08-09 2019-01-08 长沙理工大学 基于多任务哈希学习的图像检索方法
CN109241313A (zh) * 2018-08-14 2019-01-18 大连大学 一种基于高阶深度哈希学习的图像检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FP-CNNH:一种基于深度卷积神经网络的快速图像哈希算法;刘冶等;《计算机科学》;20160915(第09期);全文 *

Also Published As

Publication number Publication date
CN110704664A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN110413785B (zh) 一种基于bert和特征融合的文本自动分类方法
CN110490946B (zh) 基于跨模态相似度和生成对抗网络的文本生成图像方法
CN110704664B (zh) 一种哈希检索方法
Jain et al. Subic: A supervised, structured binary code for image search
CN106203624B (zh) 基于深度神经网络的矢量量化系统及方法
CN113064959B (zh) 一种基于深度自监督排序哈希的跨模态检索方法
CN112732864B (zh) 一种基于稠密伪查询向量表示的文档检索方法
CN110688501B (zh) 一种基于深度学习的全卷积网络的哈希检索方法
CN113077388B (zh) 一种数据增广的深度半监督超限学习图像分类方法及系统
CN106033426A (zh) 一种基于潜在语义最小哈希的图像检索方法
CN111027595A (zh) 双阶段语义词向量生成方法
CN112434159B (zh) 一种利用深度神经网络进行论文多标签分类的方法
CN111400494B (zh) 一种基于GCN-Attention的情感分析方法
CN112733866A (zh) 一种提高可控图像文本描述正确性的网络构建方法
CN110955745A (zh) 一种基于深度学习的文本哈希检索方法
CN112256727B (zh) 基于人工智能技术的数据库查询处理及优化方法
CN114780767B (zh) 一种基于深度卷积神经网络的大规模图像检索方法及系统
CN109918507B (zh) 一种基于TextCNN改进的文本分类方法
CN114780677B (zh) 基于特征融合的中文事件抽取方法
CN115795065A (zh) 基于带权哈希码的多媒体数据跨模态检索方法及系统
CN114138971A (zh) 一种基于遗传算法的极大多标签分类方法
CN116226357B (zh) 一种输入中包含错误信息场景下的文档检索方法
CN111666375B (zh) 文本相似度的匹配方法、电子设备和计算机可读介质
CN117011943A (zh) 基于多尺度自注意力机制的解耦的3d网络的动作识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220802

Address after: Room 2202, 22 / F, Wantong building, No. 3002, Sungang East Road, Sungang street, Luohu District, Shenzhen City, Guangdong Province

Patentee after: Shenzhen dragon totem technology achievement transformation Co.,Ltd.

Address before: 315211, Fenghua Road, Jiangbei District, Zhejiang, Ningbo 818

Patentee before: Ningbo University

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221214

Address after: 471,000 Room 103, Facade Room, Building 1, Longrui District C, intersection of Gucheng Road and Shifu East Street, Luolong District, Luoyang City, Henan Province

Patentee after: Rihong Culture Communication (Henan) Co.,Ltd.

Address before: Room 2202, 22 / F, Wantong building, No. 3002, Sungang East Road, Sungang street, Luohu District, Shenzhen City, Guangdong Province

Patentee before: Shenzhen dragon totem technology achievement transformation Co.,Ltd.

TR01 Transfer of patent right