CN110688501B

CN110688501B - 一种基于深度学习的全卷积网络的哈希检索方法

Info

Publication number: CN110688501B
Application number: CN201910801726.8A
Authority: CN
Inventors: 袁明汶; 钱江波; 辛宇; 谢锡炯; 陈海明
Original assignee: Ningbo University
Current assignee: Zhejiang Dianwei Information Technology Co.,Ltd.
Priority date: 2019-08-28
Filing date: 2019-08-28
Publication date: 2022-04-05
Anticipated expiration: 2039-08-28
Also published as: CN110688501A

Abstract

本发明公开了一种基于深度学习的全卷积网络的哈希检索方法，特点是首先从待检索图像数据所在的原始图像数据集中选取训练数据集，定义待训练的哈希模型，将训练数据集随机打乱后输入待训练的哈希模型，根据输出结果与对应的原始标签信息修正模型参数，最终得到训练后的哈希模型，再用训练后的哈希模型分别对原始图像数据集及待检索图像数据进行哈希编码，最后对待检索图像数据进行哈希检索；优点是利用哈希编码重构原始标签信息，使得待训练的哈希模型在学习二进制编码的同时，能更加精细地利用标签信息，其中损失函数用于减少实值哈希编码与二进制编码的损失，从而提高检索效率和准确性。

Description

一种基于深度学习的全卷积网络的哈希检索方法

技术领域

本发明涉及一种图像检索方法，尤其是一种基于深度学习的全卷积网络的哈希检索方法。

背景技术

随着数据规模和维度增大，图像检索的代价急剧增加。哈希作为一种实现图像高效检索的重要方式，受到了广泛的关注。然而，大多数图像哈希算法都是直接利用机器学习机制将图像的特征映射为二进制编码，这些特征无法有效地保证图像之间的语义相似性，导致得到的编码检索效率较低。

发明内容

本发明所要解决的技术问题是提供一种检索准确度较高的基于深度学习的全卷积网络的哈希检索方法。

本发明解决上述技术问题所采用的技术方案为：一种基于深度学习的全卷积网络哈希检索方法，包括以下步骤：

①定义待检索图像数据所在的图像数据集为原始图像数据集，将原始图像数据集的M个图像数据中任意选取m个图像数据作为训练数据集，m≥0.2M，并对训练数据集中的每一个图像数据设置对应的原始标签信息；

②定义待训练的哈希模型，包括输入数据层、卷积子网络层、全卷积层、哈希层、哈希编码输出层和采用softmax分类器的分类输出层，其中，输入数据层用于输入训练数据集里的图像数据，卷积子网络层由五个卷积池化模块组成，全卷积层连续两次的采用1024个1×1的卷积核，哈希层采用K个1×1的卷积核并采用光滑的tanh激活函数，哈希编码输出层用于输出哈希层得到的哈希编码；

③随机打乱训练数据集中的m个图像数据得到打乱后的数据集，将打乱后的数据集输入待训练的哈希模型，根据输出结果与对应的原始标签信息修正模型参数，最终得到训练后的哈希模型；

④使用训练后的哈希模型对原始图像数据集进行哈希编码，得到对应的原始图像数据哈希编码，使用训练后的哈希模型对待检索图像数据进行编码，得到对应的待检索图像哈希编码；

⑤在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的数据，并将该数据在原始图像数据集中对应的图像作为最终的检索结果，完成对待检索图像数据的哈希检索过程。

所述的步骤③中将打乱后的数据集输入待训练的哈希模型，根据输出结果与对应的原始标签信息修正模型参数，最终得到训练后的哈希模型的具体过程如下：

③-1设置最大迭代次数，定义待训练的哈希模型的损失函数如下：

minL_T(W,b)＝λ₁L_c+λ₂L_q，其中，λ₁＝0.5，λ₂＝0.5，L_c表示softmax分类器输出的分类标签信息与原始标签信息的误差，

其中，h表示对哈希层输出的哈希编码进行离散化操作后得到的二进制编码，s表示哈希层输出的哈希编码，

表示h-s的2-范数的平方；

③-2根据待训练的哈希模型的损失函数，使用RMSProp优化算法对待训练的哈希模型进行迭代优化，直到达到设置的最大迭代次数时，停止迭代过程，得到训练后的哈希模型。

所述的步骤③-1中设置最大迭代次数为10000次。保证哈希检索的准确度，经过测验，最大迭代次数至少为10000次及以上。

与现有技术相比，本发明的优点在于首先从待检索图像数据所在的原始图像数据集中选取训练数据集，定义包括输入数据层、卷积子网络层、全卷积层、哈希层、哈希编码输出层和采用softmax分类器的分类输出层的待训练的哈希模型，该哈希模型采用卷积神经网络，将训练数据集随机打乱后输入待训练的哈希模型，根据输出结果与对应的原始标签信息修正模型参数，最终得到训练后的哈希模型，再用训练后的哈希模型分别对原始图像数据集及待检索图像数据进行哈希编码，最后在原始图像数据哈希编码中查找出与待检索图像哈希编码的海明距离最近的数据，并将该数据在原始图像数据集中对应的图像作为最终的检索结果，完成对待检索图像数据的哈希检索过程；该方法中的哈希模型首先利用卷积神经网络提取图像的高层语义特征；接着为了增强网络对图像的学习能力，增加全卷积层进一步提升特征的表达能力；最后，在全卷积层与分类输出层之间添加隐藏层作为哈希层，利用哈希编码重构原始标签信息，使得待训练的哈希模型在学习二进制编码的同时，能更加精细地利用标签信息，其中损失函数用于减少实值哈希编码与二进制编码的损失，从而提高检索效率和准确性，通过在标准图像数据集上的对比实验，显示了采用本发明的哈希检索方法对待检索图像数据进行检索的检索准确率较高。

附图说明

图1为本发明的步骤流程图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

一种基于深度学习的全卷积网络的哈希检索方法，包括以下步骤：

①定义待检索图像数据所在的图像数据集为原始图像数据集，将原始图像数据集的M个图像数据中任意选取m个图像数据作为训练数据集，m≥0.2M，并对训练数据集中的每一个图像数据设置对应的原始标签信息。

②定义待训练的哈希模型，包括输入数据层、卷积子网络层、全卷积层、哈希层、哈希编码输出层和采用softmax分类器的分类输出层，其中，输入数据层用于输入训练数据集里的图像数据，卷积子网络层由五个卷积池化模块组成，全卷积层连续两次的采用1024个1×1的卷积核，哈希层采用K个1×1的卷积核并采用光滑的tanh激活函数，哈希编码输出层用于输出哈希层得到的哈希编码。

③随机打乱训练数据集中的m个图像数据得到打乱后的数据集，将打乱后的数据集输入待训练的哈希模型，根据输出结果修正模型参数，最终得到训练后的哈希模型,具体过程如下：

③-1设置最大迭代次数为10000次，定义待训练的哈希模型的损失函数如下：

表示h-s的2-范数的平方；

④使用训练后的哈希模型对原始图像数据集进行哈希编码，得到对应的原始图像数据哈希编码，使用训练后的哈希模型对待检索图像数据进行编码，得到对应的待检索图像哈希编码。

Claims

1.一种基于深度学习的全卷积网络的哈希检索方法，其特征在于包括以下步骤：

③随机打乱训练数据集中的m个图像数据得到打乱后的数据集，将打乱后的数据集输入待训练的哈希模型，根据输出结果修正模型参数，最终得到训练后的哈希模型，具体过程如下：

表示h-s的2-范数的平方；

③-2根据待训练的哈希模型的损失函数，使用RMSProp优化算法对待训练的哈希模型进行迭代优化，直到达到设置的最大迭代次数时，停止迭代过程，得到训练后的哈希模型；

2.根据权利要求1所述的一种基于深度学习的全卷积网络的哈希检索方法，其特征在于所述的步骤③-1中设置最大迭代次数为10000次。