CN110674335B

CN110674335B - 一种基于多生成多对抗的哈希码与图像双向转换方法

Info

Publication number: CN110674335B
Application number: CN201910870507.5A
Authority: CN
Inventors: 曾宪华; 徐黎明
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2019-09-16
Filing date: 2019-09-16
Publication date: 2022-08-23
Anticipated expiration: 2039-09-16
Also published as: CN110674335A

Abstract

本发明请求保护一种基于多生成多对抗的哈希码与图像双向转换方法，包括：输入原始图像，通过深度哈希网络将输入图像编码为紧凑的二进制哈希码；输入二进制哈希码，通过逆哈希网络将紧凑的二进制哈希码解码为原始图像；在图像和哈希码之间构建对抗损失，实现哈希码和图像之间的双向转换；深度哈希网络将原始图像编码为二进制哈希码时，利用监督流形相似度来减少相似样本之间的海明距离，同时增大非相似样本之间的海明距离；逆哈希网络将二进制哈希码解码为图像时，引入位平衡项，使得哈希码近似服从泊松分布，进一步拟合真实数据分布；在哈希码和图像之间构建内容保真度量，本发明能够在跨模态图像与哈希码之间进行双向转换，在保证高精度检索率的同时，提高用户主观反馈，进一步减少存储开销。

Description

一种基于多生成多对抗的哈希码与图像双向转换方法

技术领域

本发明属于信息检索领域，结合深度哈希方法、多生成对抗框架、数据空间流形相似性以及多个损失函数实现原始图像与哈希码之间的双向转换。

背景技术

过去的十年中，随着多媒体的爆炸式增长和社交媒体的迅速发展，吸引了越来越多研究者对于大规模数据次近邻检索的研究。在这项研究中，除了传统的基于内容的检索方法之外，哈希检索方法也受到了越来越多学者的关注。哈希算法利用哈希函数将高维数据映射为紧凑二进制哈希码，然后通过计算哈希码之间的海明距离来实现快速、有效的检索。现阶段，已经提出了一系列基于深度学习的哈希方法，该方法通过使用深度神经网络同时学习特征表示和哈希码。此外，也有些学者使用生成对抗机制来进一步提高深度哈希的性能。

现阶段的哈希算法忽略了哈希码带来了存储优势和主观评价，要解决这两个问题，需要解决三个子问题：(1)学习将原始图像编码为紧凑的二进制哈希码的非线性哈希函数；(2)在哈希函数的学习过程中需要保证良好的检索性能和用户反馈；(3)学习将紧凑的二进制哈希码逆向映射为高质量图像的逆向哈希函数。自生成对抗机制提出的这近几年里，哈希学习和对抗性学习在哈希编码和图像合成领域取得了巨大的进展，同时也为本发明解决上述三个问题提供了切实可行的思路。

根据上述讨论和分析，利用多生成多对抗网络实现哈希码与图像之间的双向转换。引入监督流形相似度来减少相似实例之间的海明距离，同时增加不同实例之间的距离，在获得高精度检索结果基础上，进一步提高用户反馈。然后，借助多生成多对抗机制，利用循环一致性策略从哈希码重建原始数据。在逆哈希生成过程中，引入内容保真，避免训练不稳定和模式坍塌的问题，同时利用由大量哈希码构成的泊松分布来初始化生成分布，更好地拟合真实数据分布。

发明内容

本发明旨在解决以上现有技术的问题。提出了一种能够实现原始数据图像和二进制哈希码之间双向转换的方法，同时避免生成对抗机制中的模式坍塌，训练不稳定等问题，在保证较高的检索精度的同时，提高用户的相关反馈，进一步减少存储开销的方法。本发明的技术方案如下：

一种基于多生成多对抗的哈希码与图像双向转换方法，其包括以下步骤：

步骤1、输入原始图像，通过深度哈希网络将输入图像编码为紧凑的(二进制代码中只有-1和+1两种表示)二进制哈希码，所述深度哈希网络将原始图像编码为二进制哈希码时，利用监督流形相似度来减少相似样本之间的海明距离，同时增大非相似样本之间的海明距离；

步骤2、输入二进制哈希码，通过逆哈希网络将紧凑的二进制哈希码解码为原始图像；逆哈希网络将二进制哈希码解码为原始图像时，引入位平衡项，使得哈希码近似服从泊松分布，拟合真实数据分布；

步骤3、在原始图像和哈希码之间构建对抗损失，实现哈希码和图像之间的双向转换。

进一步的，所述步骤1中，通过深度哈希网络将原始图像编码为二进制哈希码，具体表示为：

其中，G，D，F和C分别表示生成网络，判别网络，哈希网络和分类网络，

表示期望，s_ij表示数据点之间的监督流形相似度、J(F,G,D,C)表示包含4个网络的目标函数。β是权重系数，x是生成目标，S表示监督流形相似度矩阵。

进一步的，为了简化表达，可以将上式划分为两个部分：哈希编码和哈希解码，引入位平衡项

γ表示用于衡量位平衡项在整个目标函数中的权重。在哈希编码过程中使得哈希码服从泊松分布，然后通过理论验证，服从泊松分布的数据能够用来初始化生成分布并拟合真实数据，哈希编码表示为：

其中，

表示位平衡项，用来平衡哈希码中-1和+1的个数，w_ij表示处理数据不平衡问题的权重、L_F表示哈希函数损失、α表示用于衡量位量化损失在整个目标函数中的权重、h_i表示第i个哈希码、N分别表示数据样本的大小，<h_i,h_j>表示哈希码h_i和h_j之间的内积；

解码过程可以表示为：

其中，

表示期望，P_h表示哈希分布，P_r表示哈希分布，h表示对应的哈希码。

进一步的，所述步骤1利用监督流形相似度，在减少相似样本之间海明距离的同时，增加非相似样本之间的海明距离，监督流形相似度表示为：

S_M＝S_po⊙S_pa

其中，S_po和S_pa分别表示点对相似度量矩阵和成对相似度量矩阵，⊙表示元素对之间的点乘。

进一步的，所述步骤2构建逆哈希网络具体包括：

构建哈希码与图像之间的内容保真，并且较少对抗损失在优化过程中的权重，

θ_g表示生成网络G的参数，L_G表示生成网络的损失。进一步的，在原始图像和哈希码之间构建条件对抗损失，通过计算损失并反向传播梯度(常见表示为：

代码实现过程中，通过批处理方法，算出损失，然后将损失输入到优化器中(如：python中的SGD或者Adam优化器)，最后封装好的模型根据自动求导梯度并向前传播。)使得网络的输出与输入的流形空间保持相似，表示为：

θ_d表示判别网络D的参数、L_D表示表示判别网络的损失。进一步的，通过循环一致性策略(简单来说，循环一致性策略指的是，网络A将数据A转化为B，网络B将数据B转化为A’，循环一致性策略则保证A和A’之间的差距最小。详情请查阅参考文献[2])，在提出的多生成多对抗框架下，实现哈希码和图像之间的双向转换，具体表示为：

本发明的优点及有益效果如下：

本发明创新点：1)提出了哈希码与图像之间的双向转换方法。现有的深度哈希方法多是单向转换，例如从图像数据固定地转换到二进制哈希码。本发明利用多生成多对抗网络来实现哈希码和图像之间的双向转换，在实现快速、有效检索的同时，减少存储成本。2)提出了监督流形相似度。现有深度哈希方法仅仅利用了单一的监督信息，如：点对的标签信息或者成对的近邻信息，故本发明同时考虑点对和成对的监督信息，提出了监督流形相似度，克服单一监督信息的不足。3)内容保真项的提出。内容保真项利用2范数损失项来约束逆哈希网络的输出，使得重建图像与原始图像更加接近。4)本发明为了保持海明空间与原始数据空间之间流形结构的相似性，在多对抗网络中引入分类网络，驱动生成数据的流形结构与原始数据的流形结构相似。5)本发明利用了由大量哈希码组成的泊松分布初始化生成分布，从理论上验证了泊松分布等可加性分布具有拟合真实数据分布的特性。

附图说明

图1是本发明提供优选实施例算法框架图；

图2为本发明的重建实验结果图。

图3为本发明的较少存储容量的对比图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

本发明解决上述技术问题的技术方案是：

1)、信息检索领域数据能够以原始图像和哈希码两种状态保存。首先，通过深度哈希网络将原始图像编码为二进制哈希码，然后通过逆哈希网络将对应的二进制哈希码解码为原始图像。在这过程中，通过循环一致性策略实现哈希码和图像之间的双向转换；

2)、哈希编码过程中，深度哈希网络将原始图像数据编码为紧凑的二进制哈希码，以此提高检索效率和存储开销；

3)、哈希编码过程中，提出监督流形度量，对比点对和成对的监督度量方式，所提出的度量能够在减少相似样本之间海明距离的同时，增加非相似样本之间的海明距离，进而在提高检索性能的同时，提高用户反馈；

4)、哈希解码的过程中，构建哈希码与图像之间的对抗损失，通过逆向哈希网络将哈希码解码为原始图像数据，将储存方式由“存储原始图像数据”改变为“存储哈希码和逆哈希网络”，进一步减少存储开销；

5)、哈希解码过程中，构建哈希码与图像之间的内容保真，并且较少对抗损失在优化过程中的权重，从而避免生成对抗机制中的模式坍塌，训练不稳定等经典问题；

6)、哈希编码过程中，引入位平衡项，使得哈希码服从泊松分布，然后通过理论验证，服从泊松分布的数据能够用来初始化生成分布并拟合真实数据。此外，进一步证明，任何满足可加性的分布的数据都能够用来初始化生成分布并拟合真实数据。

进一步的，所述步骤1)中，通过深度哈希网络将原始图像编码为二进制哈希码，然后通过逆哈希网络将对应的二进制哈希码解码为原始图像。在这过程中，通过循环一致性策略实现哈希码和图像之间的双向转换，具体表示为：

其中，G，D，F和C分别表示生成网络，判别网络，哈希网络和分类网络。为了简化表达，可以将上式划分为两个部分：哈希编码和哈希解码。哈希编码表示为：

其中，

表示位平衡项，用来平衡哈希码中-1和+1的个数。<h_i,h_j>表示哈希码h_i和h_j之间的内积。

解码过程可以表示为：

其中，P_h表示哈希分布，P_r表示哈希分布，β是权重系数。x是生成目标，h表示对应的哈希码。

进一步的，步骤2)中，所述深度哈希网络将原始图像数据编码为紧凑的二进制哈希码，以此提高检索效率和存储开销。将原始图像数据转换为二进制哈希码的具体方法为：将原始图像数据输入由深度神经网络构成的哈希网络中，再保持海明空间和原始空间流行结构相似的条件下，进行非线性映射。所述转换图像数据过程定义为：

H＝F(X|S)

其中，X为原始的图像数据，F为由神经网络构成的哈希网络，S表示样本的相似性度量。

进一步的，在步骤3)中，提出监督流形度量，在减少相似样本之间海明距离的同时，增加非相似样本之间的海明距离，进而在提高检索性能的同时，提高用户反馈。监督流形相似度表示为：

S_M＝S_po⊙S_pa

其中，S_po和S_pa分别表示点对相似度量矩阵和成对相似度量矩阵。⊙表示元素对之间的点乘。

进一步的，步骤4)中，构建哈希码与图像之间的对抗损失，通过逆向哈希网络将哈希码解码为原始图像数据，将储存方式由“存储原始图像数据”改变为“存储哈希码和逆哈希网络”，进一步减少存储开销。具体表示为：

其中，S表示监督流形相似度。上式中前两项表示对抗损失，后两项表示分类损失。对抗损失旨在区分重建图像和原始图像之间的真实性，而后者则用于二分类任务，驱动重建图像的流形结构重合与原始图像的流形结构。

进一步的，步骤5)中，构建哈希码与图像之间的内容保真，并且较少对抗损失在优化过程中的权重，从而避免生成对抗机制中的模式坍塌，训练不稳定等经典问题。具体表示为：

其中，x是重建目标，h表示哈希码。P_h表示哈希分布，β是权重系数，用于控制保真项和对抗损失之间的比例。

进一步的，步骤6)中，引入位平衡项，使得哈希码服从泊松分布，并验证服从泊松分布的数据能够用来初始化生成分布并拟合真实数据。证明如下：

令

为同一类分布，当

和

相互独立，如果

那么P_h可以用来初始化为生成分布。

证明：令P_r和P_h分别为真实分布和哈希分布，假设

||g₁-1||≤δ₁和||g₂+1||≤δ₂，使得

那么：

作为GANs的一般情况，当且仅当

实现全局最小值。进一步可得：

上式则表明：使用哈希分布初始化生成分布，能够拟合真实的数据分布。该结论可以进步扩展为：任何满足可加性的分布的数据都能够用来初始化生成分布并拟合真实数据。

为了在获得较高检索精度的基础上，提高用户的相关反馈，减少数据存储开销，通过深度神经网络实现哈希码和原始图像之间的双向非线性映射，进一步达到哈希码和原始图像之间的相互转换。将原始图像数据输入到有神经网络组成哈希网络中，得到对应的二进制哈希码；类似地，将二进制哈希码输入到由神经网络组成的逆哈希网络中，重建处对应的原始图像。在原始图像和哈希码之间构建条件对抗损失，通过计算损失并反向传播梯度使得网络的输出与输入的流形空间保持相似。利用双向循环一致性损失来对哈希网络和逆哈希网络进行有效性进行验证。利用监督流形度量，在减少相似样本之间海明距离的同时，增加非相似样本之间的海明距离，进而在提高检索性能的同时，提高用户反馈。构建哈希码与图像之间的内容保真，并且较少对抗损失在优化过程中的权重，从而避免生成对抗机制中的模式坍塌，训练不稳定等经典问题。引入位平衡项，在哈希编码过程中使得哈希码服从泊松分布，然后通过理论验证，服从泊松分布的数据能够用来初始化生成分布并拟合真实数据。

下面将详细说明本发明的技术方案：一种基于多生成多对抗的哈希码与图像双向转换方法，包括：

为了在获得较高检索精度的基础上，提高用户的相关反馈，减少数据存储开销，通过深度神经网络实现哈希码和原始图像之间的双向非线性映射，进一步达到哈希码和原始图像之间的相互转换。

将原始图像数据输入到有神经网络组成哈希网络中，得到对应的二进制哈希码；类似地，将二进制哈希码输入到由神经网络组成的逆哈希网络中，重建处对应的原始图像。

在原始图像和哈希码之间构建条件对抗损失，通过计算损失并反向传播梯度使得网络的输出与输入的流形空间保持相似。表示为：

构建哈希码与图像之间的内容保真，并且较少对抗损失在优化过程中的权重，从而避免生成对抗机制中的模式坍塌，训练不稳定等经典问题。

利用监督流形度量，在减少相似样本之间海明距离的同时，增加非相似样本之间的海明距离，进而在提高检索性能的同时，提高用户反馈。监督流形相似度表示为：

S_M＝S_po⊙S_pa

引入位平衡项，在哈希编码过程中使得哈希码服从泊松分布，然后通过理论验证，服从泊松分布的数据能够用来初始化生成分布并拟合真实数据。具体表示为：

具体步骤表示为：

步骤一：构建哈希网络

在哈希编码过程中，利用由神经网络组成的哈希网络将原始数据编码为二进制哈希码。表示为：

其中S表示监督流形相似度矩阵。

步骤二：构建监督流形相似度

本发明提出利用监督流形相似度，在减少相似样本之间海明距离的同时，增加非相似样本之间的海明距离，进而在提高检索性能的同时，提高用户反馈。

监督流形相似度表示为：

S_M＝S_po⊙S_pa

步骤三：添加位平衡项

引入位平衡项

在哈希编码过程中使得哈希码服从泊松分布，然后通过理论验证，服从泊松分布的数据能够用来初始化生成分布并拟合真实数据。因此，哈希编码过程可以进一步表示为：

步骤四：构建逆哈希网络

步骤五：构建对抗损失

步骤六：构建多生成多对抗框架，实现哈希码与原始图像之间的双向转换通过循环一致性策略，在提出的多生成多对抗框架下，实现哈希码和图像之间的双向转换，具体表示为：

综上所述，本发明的创新和优势：

本发明提出的哈希码与图像之间的双向转换方法，利用多生成多对抗网络来实现哈希码和图像之间的双向转换，在实现快速、有效检索的同时，减少存储成本。

本发明提出的监督流形相似度，针对现有深度哈希方法仅仅利用了单一的监督信息，如：点对的标签信息或者成对的近邻信息，故本发明同时考虑点对和成对的监督信息，提出了监督流形相似度，克服单一监督信息的不足。

本发明提出内容保真项，利用2范数损失项来约束逆哈希网络的输出，使得重建图像与原始图像更加接近。

本发明在多对抗网络中引入分类网络，驱动生成数据的流形结构与原始数据的流形结构相似，进而保持海明空间与原始数据空间之间流形结构的相似性。

本发明利用了由大量哈希码组成的泊松分布初始化生成分布，从理论上验证了泊松分布等可加性分布具有拟合真实数据分布的特性。

[1]Simonyan K,Zisserman A.Very Deep Convolutional Networks for Large-Scale Image Recognition[C]//International conference on learningrepresentations,2015:1-14.

[2]J.Zhu,T.Park,P.Isola,A.Efros,Unpaired image-to-image translationusing cycle-consistent adversarial networks[C]//IEEE International Conferenceon Computer Vision,2017:2242–2251.

以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后，技术人员可以对本发明作各种改动或修改，这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims

1.一种基于多生成多对抗的哈希码与图像双向转换方法，其特征在于，包括以下步骤：

步骤1、输入原始图像，通过深度哈希网络将输入图像编码为紧凑二进制哈希码，即二进制代码中只有-1和+1两种表示，所述深度哈希网络将原始图像编码为二进制哈希码时，利用监督流形相似度来减少相似样本之间的海明距离，同时增大非相似样本之间的海明距离；

步骤2、输入二进制哈希码，通过逆哈希网络将紧凑的二进制哈希码解码为原始图像；逆哈希网络将二进制哈希码解码为原始图像时，引入位平衡项，使得哈希码近似服从泊松分布，拟合真实数据分布；在逆哈希生成过程中，引入内容保真；

步骤3、在原始图像和哈希码之间构建对抗损失，实现哈希码和图像之间的双向转换；

所述步骤1中，通过深度哈希网络将原始图像编码为二进制哈希码，具体表示为：

表示期望，s_ij表示数据点之间的监督流形相似度、J(F,G,D,C)表示包含4个网络的目标函数，β是权重系数，x是生成目标，S表示监督流形相似度矩阵；

为了简化表达，可以将上式划分为两个部分：哈希编码和哈希解码，引入位平衡项

γ表示用于衡量位平衡项在整个目标函数中的权重；在哈希编码过程中使得哈希码服从泊松分布，然后通过理论验证，服从泊松分布的数据能够用来初始化生成分布并拟合真实数据，哈希编码表示为：

其中，

解码过程可以表示为：

其中，

表示期望，P_h表示哈希分布，P_r表示哈希分布，h表示对应的哈希码；

所述步骤1利用监督流形相似度，在减少相似样本之间海明距离的同时，增加非相似样本之间的海明距离，监督流形相似度表示为：

S_M＝S_po⊙S_pa

2.根据权利要求1所述的一种基于多生成多对抗的哈希码与图像双向转换方法，其特征在于，所述步骤2构建逆哈希网络具体包括：

θ_g表示生成网络G的参数，L_G表示生成网络的损失。

3.根据权利要求2所述的一种基于多生成多对抗的哈希码与图像双向转换方法，其特征在于，在原始图像和哈希码之间构建条件对抗损失，通过计算损失并反向传播梯度，表示为：

代码实现过程中，通过批处理方法，算出损失，然后将损失输入到优化器中，最后封装好的模型根据自动求导梯度并向前传播，使得网络的输出与输入的流形空间保持相似，表示为：

θ_d表示判别网络D的参数、L_D表示判别网络的损失。

4.根据权利要求3所述的一种基于多生成多对抗的哈希码与图像双向转换方法，其特征在于，通过循环一致性策略，在提出的多生成多对抗框架下，实现哈希码和图像之间的双向转换，循环一致性策略指的是，网络A将数据A转化为B，网络B将数据B转化为A’，循环一致性策略则保证A和A’之间的差距最小，具体表示为：