CN107273505B

CN107273505B - 基于非参数贝叶斯模型的监督跨模态哈希检索方法

Info

Publication number: CN107273505B
Application number: CN201710466670.6A
Authority: CN
Inventors: 王秀美; 王鑫鑫; 高新波; 张天真; 李洁; 田春娜; 邓成
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2017-06-20
Filing date: 2017-06-20
Publication date: 2020-04-14
Anticipated expiration: 2037-06-20
Also published as: CN107273505A

Abstract

本发明提出了一种基于非参数贝叶斯模型的监督跨模态哈希检索方法，用于解决现有跨模态哈希检索方法中存在的检索精度低的技术问题。实现步骤为：获取归一化训练数据和测试数据；对归一化训练数据进行分类；获取归一化训练数据的三个训练数据参数；获取归一化图像训练数据和归一化文本训练数据同属于每一类的概率；获取训练数据后验概率；获取归一化图像训练数据和归一化文本训练数据的统一哈希编码；获取测试数据哈希编码；计算测试数据哈希编码与归一化图像训练数据和归一化文本训练数据统一哈希编码的汉明距离矩阵；获取测试数据的检索结果。本发明的检索精度高，可用于移动终端设备以及物联网的图像与文本互搜索服务。

Description

基于非参数贝叶斯模型的监督跨模态哈希检索方法

技术领域

本发明属于计算机视觉和模式识别领域，涉及图像与文本的互检索，具体涉及一种基于非参数贝叶斯模型的监督跨模态哈希检索方法，可用于移动终端设备以及物联网的图像与文本互搜索服务。

背景技术

近年来，随着社会经济的迅速发展和科学技术的不断进步，多媒体数据已经成为互联网上的主要信息载体。这些数据呈现爆炸式增长，现阶段，大数据改变着人们的工作和生活，同时也对学术界的科学研究产生了很大的影响。如何利用这些大数据，如何对其进行高效率的存储和管理，便成为我们最为关注的问题。基于哈希的最近邻搜索是解决大规模多媒体数据存储和管理有效的技术手段。现有的哈希方法研究方向大致划分为三类：单模态哈希方法、多视图哈希方法和跨模态哈希方法。基于哈希算法的单一模态数据检索方法在图像检索领域已经得到了较为充分地研究。而多视图哈希方法在特定情况下可以转换成单模态或者跨模态哈希问题，所以，对多视图哈希方法的研究比较少。为了促进大规模相似性搜索的发展，近年来一些跨模态哈希检索方法被提出。跨模态哈希方法可以分为无监督方法和有监督方法，无监督方法主要通过挖掘和保持多模态数据的潜在相关性来获得哈希编码，而有监督跨模态哈希方法旨在利用训练数据类标信息的语义相似性，来提高哈希检索的检索精度。现实生活中，多媒体数据量大、维度较高并且不同模态之间具有语义关联性，所以如何得到高检索精度的监督哈希算法，实现跨模态数据之间的检索，是我们现阶段急需解决的问题。现阶段，研究人员已经提出部分监督跨模态哈希检索方法。

例如Bronstein M，Bronstein A和Michel F等人在2010年的Computer Visionand Pattern Recognition会议，发表了名为“Data Fusion through Cross-ModalityMetric Learning using Similarity Sensitive Hashing”的文章，提出了一种监督的跨模态相似性敏感哈希方法。这一方法通过产生一些正负样本对，然后将每一位哈希编码的学习过程表示为一个二元分类问题，最后利用Boosting的方式进行求解。但这一方法只保持了模态间的相似性，没有考虑模态内的相似性，检索精度有待提高。

综上，现阶段存在的监督跨模态哈希检索方法利用数据类标信息不全面，对数据的描述不准确，从而影响跨模态检索精度。

发明内容

本发明的目的在于针对上述已有技术的不足，提出了一种基于非参数贝叶斯模型的监督跨模态哈希检索方法，用于解决现有监督跨模态哈希检索方法中存在的检索精度低的技术问题。

为实现上述目的，本发明采取的技术方案包括有如下步骤：

(1)获取原始训练数据，并对原始训练数据进行归一化，得到归一化训练数据X^(t)，其中，t表示归一化训练数据的类型，且t∈{1,2}，X⁽¹⁾表示归一化图像训练数据，X⁽²⁾表示归一化文本训练数据；

(2)获取原始测试数据，并对原始测试数据进行归一化，得到归一化测试数据Y^(t)，其中，t表示归一化测试数据的类型，且t∈{1,2}，Y⁽¹⁾表示归一化图像测试数据，Y⁽²⁾表示归一化文本测试数据；

(3)对归一化训练数据X^(t)进行分类：根据归一化训练数据X^(t)所对应的类标信息L，将归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾均分为C类；

(4)获取归一化训练数据X^(t)的三个训练数据参数：

(4a)获取归一化训练数据X^(t)的三个后验分布：采用非参数贝叶斯模型，对归一化训练数据X^(t)中的每一个训练数据点

进行描述，得到归一化训练数据X^(t)的训练数据整体均值

服从的后验分布、训练数据所属类别均值

服从的后验分布

以及训练数据协方差矩阵的逆

服从的后验分布，其中,i表示第i个训练数据点，且i＝1,2,…,n，n表示数据点的个数，c表示分类类别，且c＝1,2,…,C；

(4b)获取归一化训练数据X^(t)的三个训练数据参数：将每一个训练数据点

分别代入三个后验分布，计算归一化训练数据X^(t)的训练数据整体均值

训练数据所属类别均值

以及训练数据协方差矩阵的逆

(5)获取归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾同属于每一类的概率P(X⁽¹⁾,X⁽²⁾|K)：

(5a)获取归一化训练数据X^(t)每一个训练数据点

属于第c类的概率

假设归一化训练数据X^(t)的所有训练数据服从高斯分布，即

分别计算每一个训练数据

属于第c类的概率

(5b)获取图像训练数据点

和对应的文本训练数据点

同属于第c类的概率

将

与

相乘，得到图像训练数据点

和对应的文本训练数据点

同属于第c类的概率

其中，K表示分类类别集合，且K∈{1,2,…,C}，

表示归一化训练数据X^(t)的训练数据协方差矩阵；

(6)获取训练数据后验概率P(K|X⁽¹⁾,X⁽²⁾)：将概率P(X⁽¹⁾,X⁽²⁾|K)代入贝叶斯公式，计算训练数据后验概率P(K|X⁽¹⁾,X⁽²⁾)；

(7)获取归一化图像训练数据X⁽¹)和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr：

(7a)随机生成一个矩阵M＝[m_ch]_C×r，其中，m_ch表示矩阵M中的一个元素，且m_ch∈(0,1)；

(7b)将训练数据后验概率P(K|X⁽¹⁾,X⁽²⁾)和矩阵M＝[m_ch]_C×r相乘，得到归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr的后验概率P(B_tr|X⁽¹⁾,X⁽²⁾)；

(7c)对归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr的后验概率P(B_tr|X⁽¹⁾,X⁽²⁾)中的每一个元素

进行伯努利采样，得到归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr；

(8)获取归一化测试数据Y^(t)的r位哈希编码

(8a)获取归一化测试数据Y^(t)属于每一类的概率P(Y^(t)|K)：假设归一化测试数据Y^(t)的所有测试数据服从高斯分布，即

分别计算每一个测试数据点

属于第c类的概率

(8b)获取归一化测试数据后验概率P(K|Y^(t))：将概率P(Y^(t)|K)代入贝叶斯公式，计算得到归一化测试数据后验概率P(K|Y^(t))；

(8c)将归一化测试数据后验概率P(K|Y^(t))和矩阵M＝[m_ch]_C×r相乘，得到归一化测试数据Y^(t)的r位哈希编码

的后验概率

(8d)对归一化测试数据Y^(t)的r位哈希编码

的后验概率

中的每一个元素

进行伯努利采样，得到归一化测试数据Y^(t)的r位哈希编码

其中，j表示第j个测试数据点，且j＝1,2,…,n_te，n_te表示测试数据点的个数；

(9)计算归一化测试数据Y^(t)的哈希编码

与归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr的汉明距离矩阵Dh；

(10)获取归一化测试数据Y^(t)的检索结果：分别获取汉明距离矩阵Dh中每一行最小的前a个汉明距离值，并将得到的每一行的a个汉明距离值所对应的训练数据作为归一化测试数据Y^(t)的检索结果，完成基于非参数贝叶斯模型的监督跨模态哈希检索。

本发明与现有技术相比，具有以下优点：

本发明利用数据类标信息对训练数据进行分类，按照数据实际分布情况，将训练数据分为整体均值、所属类别均值以及误差三部分，使用狄利克雷过程作为实际数据所属类别均值的先验分布，使用非参数贝叶斯模型对数据分布进行有效地描述，明显提高了跨模态哈希检索的精度。

附图说明

图1为本发明的实现流程图；

图2为本发明与现有跨模态哈希检索方法在Wiki数据库下的采样前300个检索结果精度随着编码长度变化的曲线对比图,其中，图2(a)为采样前300个检索结果的图像查询文本的精度随着编码长度变化曲线图，图2(b)为采样前300个检索结果的文本查询图像的精度随着编码长度变化曲线图；

图3为本发明与现有跨模态哈希检索方法在Wiki数据库下的精度-召回率实验结果曲线对比图，其中，图3(a)为编码长度取32位的图像查询文本精度-召回率曲线图，图3(b)为编码长度取32位的文本查询图像精度-召回率曲线图；

图4为本发明与现有跨模态哈希检索方法在LabelMe数据库下的采样前300个检索结果精度随着编码长度变化的曲线对比图,其中，图4(a)为采样前300个检索结果的图像查询文本的精度随着编码长度变化曲线图，图4(b)为采样前300个检索结果的文本查询图像的精度随着编码长度变化曲线图；

图5为本发明与现有跨模态哈希检索方法在LabelMe数据库下的精度-召回率实验结果曲线对比图，其中，图5(a)为编码长度取32位的图像查询文本精度-召回率曲线图，图5(b)为编码长度取32位的文本查询图像精度-召回率曲线图。

具体实施方式

下面结合附图和具体实施例，对本发明作进一步详细描述。

参照图1，基于非参数贝叶斯模型的监督跨模态哈希检索方法，包括如下步骤：

步骤1)获取原始训练数据，并对原始训练数据进行归一化，得到归一化训练数据X^(t)，其中，t表示归一化训练数据的类型，且t∈{1,2}，X⁽¹⁾表示归一化图像训练数据，X⁽²⁾表示归一化文本训练数据；

步骤2)获取原始测试数据，并对原始测试数据进行归一化，得到归一化测试数据Y^(t)，其中，t表示归一化测试数据的类型，且t∈{1,2}，Y⁽¹⁾表示归一化图像测试数据，Y⁽²⁾表示归一化文本测试数据；

步骤3)对归一化训练数据X^(t)进行分类：根据归一化训练数据X^(t)所对应的类标信息L，将归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾均分为C类；

步骤4)获取归一化训练数据X^(t)的三个训练数据参数：

进行描述，得到归一化训练数据X^(t)的训练数据整体均值

服从的后验分布、训练数据所属类别均值

服从的后验分布

以及训练数据协方差矩阵的逆

服从的后验分布：

(i)归一化训练数据X^(t)的训练数据整体均值

服从的后验分布的表达式为：

(ii)归一化训练数据X^(t)的训练数据所属类别均值

服从的后验分布

的表达式为：

(iii)归一化训练数据X^(t)的训练数据协方差矩阵的逆

服从的后验分布的表达式为：

其中,i表示第i个训练数据点，且i＝1,2,…,n，n表示数据点的个数，c表示分类类别，且c＝1,2,…,C，

表示含有C个主成分的高斯混合模型，

表示第c个高斯的权重，

n_c表示归一化训练数据第c类所含的训练数据点个数，归一化训练数据所属类别均值

服从的后验分布

是通过假设归一化训练数据所属类别均值

先验分布服从狄利克雷过程推导得到的，即

δ_·表示δ函数，ν_i表示第i个训练数据点的所属类别均值，

I_d表示d维单位矩阵，d为每一个训练数据点x^(t)的维数，α₀表示调节参数，G₀表示狄利克雷过程的基础分布，训练数据协方差矩阵的逆

服从的后验分布是通过假设归一化训练数据X^(t)的训练数据协方差矩阵的逆

先验分布服从威沙特分布推导得到的，即

m表示自由度，V_D表示p×p的尺度矩阵；

训练数据所属类别均值

以及训练数据协方差矩阵的逆

步骤5)获取归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾同属于每一类的概率P(X⁽¹⁾,X⁽²⁾|K)：

(5a)获取归一化训练数据X^(t)每一个训练数据点

属于第c类的概率

假设归一化训练数据X^(t)的所有训练数据服从高斯分布，即

分别计算每一个训练数据

属于第c类的概率

(5b)获取图像训练数据点

和对应的文本训练数据点

同属于第c类的概率

将

与

相乘，得到图像训练数据点

和对应的文本训练数据点

同属于第c类的概率

其中，K表示分类类别集合，且K∈{1,2,…,C}，

表示归一化训练数据X^(t)的训练数据协方差矩阵；

步骤6)获取训练数据后验概率P(K|X⁽¹⁾,X⁽²⁾)：将概率P(X⁽¹⁾,X⁽²⁾|K)代入贝叶斯公式，计算训练数据后验概率P(K|X⁽¹⁾,X⁽²⁾)，计算训练数据后验概率P(K|X⁽¹⁾,X⁽²⁾)的表达式为：

其中，P(X⁽¹⁾,X⁽²⁾|c)表示归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾同属于第c类的概率，P(K)表示类别的边缘分布，P(K)中有C个元素，此处假设P(K)中每一个元素均服从均匀分布，即

步骤7)获取归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr：

(7c)对归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr的后验概率P(B_tr|X⁽¹⁾,X⁽²⁾)中的每一个元素p_btr进行伯努利采样，得到归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr，伯努利采样的过程如下：

(7c1)随机产生一个和归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr的后验概率P(B_tr|X⁽¹⁾,X⁽²⁾)同大小的随机数矩阵T_tr；

(7c2)比较归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr的后验概率P(B_tr|X⁽¹⁾,X⁽²⁾)中的每一个元素

和随机数矩阵T_tr中对应位置元素的大小，得到哈希编码B_tr对应位置元素b_tr，其中，t_tr为随机数矩阵T_tr中与

对应元素的表示，且t_tr∈(0,1)，

步骤8)获取归一化测试数据Y^(t)的r位哈希编码

分别计算每一个测试数据点

属于第c类的概率

(8b)获取归一化测试数据后验概率P(K|Y^(t))：将概率P(Y^(t)|K)代入贝叶斯公式，计算得到归一化测试数据后验概率P(K|Y^(t))，计算归一化测试数据后验概率P(K|Y^(t))的表达式为：

其中，P(Y^(t)|c)表示归一化测试数据Y^(t)属于第c类的概率；

的后验概率

(8d)对归一化测试数据Y^(t)的r位哈希编码

的后验概率

中的每一个元素

进行伯努利采样，得到归一化测试数据Y^(t)的r位哈希编码

伯努利采样过程为：

(8d1)随机产生一个和归一化测试数据Y^(t)的r位哈希编码

的后验概率

同大小的测试数据随机数矩阵T_te；

(8d2)比较归一化测试数据Y^(t)的r位哈希编码

的后验概率

和测试数据随机数矩阵T_te中对应位置元素的大小，得到测试数据哈希编码

中对应位置元素

其中，j表示第j个测试数据点，且j＝1,2,…,n_te，n_te表示测试数据点的个数，t_te为随机数矩阵T_te中与

对应元素的表示，且t_te∈(0,1)，

步骤9)计算归一化测试数据Y(t)的哈希编码

步骤10)获取归一化测试数据Y^(t)的检索结果：分别获取汉明距离矩阵Dh中每一行最小的前a个汉明距离值，并将得到的每一行a个汉明距离值所对应的训练数据作为归一化测试数据Y^(t)的检索结果，完成基于非参数贝叶斯模型的监督跨模态哈希检索。

以下结合仿真实验，对本发明的技术效果作进一步说明。

1.仿真条件：

本发明的仿真是在中央处理器为Intel(R)Core(TM)i3-2100 3.10GHZ、内存16G、WINDOWS 7操作系统上，运用MATLAB软件进行的实验仿真，每种仿真均重复独立运行10次，取其平均值作为最终结果。

实验中的参数设置为：对于Wiki数据库和LabelMe数据库，设置调节参数α₀＝1，基础分布G₀为标准正态分布。设置Wiki数据库尺度矩阵V_D＝0.001I，设置LabelMe数据库尺度矩阵V_D＝0.1I。

2.仿真内容及结果分析

本发明与现有跨模态哈希检索方法进行了对比，作为对比的哈希方法分别是协同矩阵分解哈希(Collective Matrix Factorization Hashing,CMFH)方法、跨媒体哈希(Inter-Media Hashing，IMH)方法以及跨视角哈希(Cross-View Hashing,CVH)方法。

仿真实验中，设置编码长度分别为16位、32位、64位以及128位，对Wiki数据库和LabelMe数据库来评估检索精度。图2和图3为Wiki数据库的仿真结果图；图4和图5为LabelMe数据库的仿真结果图。

仿真1：在Wiki数据库下分别采用本发明方法和现有三种跨模态哈希检索方法进行性能对比，实验结果图如图2和图3所示。其中，

图2(a)为随着编码长度的变化采样前300图像查询文本精度曲线图，横轴表示哈希编码长度，纵轴表示采样前300图像查询文本结果的精度。图中可见，本发明的图像查询文本的精度完全高于其它三个对比方法，表现出了良好的图像对文本的检索性能。

图2(b)为随着编码长度的变化采样前300文本查询图像精度曲线图，横轴表示哈希编码长度，纵轴表示采样前300文本查询图像结果的精度。图中可见，本发明的文本查询图像的精度完全高于其它三个对比方法，表现出了良好的文本对图像的检索性能。

图3(a)为编码长度取32位的图像查询文本精度-召回率曲线图，横轴表示召回率，纵轴表示精度。图中可见，本发明结果曲线与坐标轴所围的面积和CMFH方法持平，表示在编码长度取32位时，两者的图像检索文本性能相差不多。

图3(b)为编码长度取32位的文本查询图像精度-召回率曲线图，横轴表示召回率，纵轴表示精度。图中可见，本发明结果曲线与坐标轴所围的面积比其它三种对比方法都大，表示在编码长度取32位时，本发明的文本检索图像性能良好。

仿真2：在LabelMe数据库下分别采用本发明方法和现有三种跨模态检索方法进行检索结果对比，实验结果图如图4和图5所示。其中，

图4(a)为随着编码长度的变化采样前300图像查询文本精度曲线图，横轴表示哈希编码长度，纵轴表示采样前300图像查询文本结果的精度。图中可见，本发明的图像查询文本的精度完全高于其它三个对比方法，表现出了良好的图像对文本的检索性能。

图4(b)为随着编码长度的变化采样前300文本查询图像精度曲线图，横轴表示哈希编码长度，纵轴表示采样前300文本查询图像结果的精度。图中可见，本发明的文本查询图像的精度完全高于其它三个对比方法，表现出了良好的文本对图像的检索性能。

图5(a)为编码长度取32位的图像查询文本精度-召回率曲线图，横轴表示召回率，纵轴表示精度。图中可见，本发明结果曲线与坐标轴所围的面积比其它三种对比方法都大，表示在编码长度取32位时，本发明的图像检索文本性能良好。

图5(b)为编码长度取32位的文本查询图像精度-召回率曲线图，横轴表示召回率，纵轴表示精度。图中可见，本发明结果曲线与坐标轴所围的面积比其它三种对比方法稍大，表示在编码长度取32位时，本发明的文本检索图像性能比其它三种对比方法稍好。

由图2、图3、图4和图5的仿真结果可见，采用本发明进行跨模态检索的精度高于采用现有方法进行跨模态检索的精度。所以，与现有的技术相比，本发明能够有效利用非参数贝叶斯模型描述数据实际分布，提高跨模态检索的精度。

Claims

1.一种基于非参数贝叶斯模型的监督跨模态哈希检索方法，包括如下步骤：

(4)获取归一化训练数据X^(t)的三个训练数据参数：

进行描述，得到归一化训练数据X^(t)的训练数据整体均值

服从的后验分布、训练数据所属类别均值

服从的后验分布

以及训练数据协方差矩阵的逆

训练数据所属类别均值

以及训练数据协方差矩阵的逆

(5a)获取归一化训练数据X^(t)每一个训练数据点

属于第c类的概率

假设归一化训练数据X^(t)的所有训练数据服从高斯分布，即

分别计算每一个训练数据

属于第c类的概率

(5b)获取图像训练数据点

和对应的文本训练数据点

同属于第c类的概率

将

与

相乘，得到图像训练数据点

和对应的文本训练数据点

同属于第c类的概率

其中，K表示分类类别集合，且K∈{1,2,…,C}，

表示归一化训练数据X^(t)的训练数据协方差矩阵；

(7)获取归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr：

(8)获取归一化测试数据Y^(t)的r位哈希编码

(8a)获取归一化测试数据Y(t)属于每一类的概率P(Y^(t)|K)：假设归一化测试数据Y^(t)的所有测试数据服从高斯分布，即

分别计算每一个测试数据点

属于第c类的概率

的后验概率

(8d)对归一化测试数据Y^(t)的r位哈希编码

的后验概率

中的每一个元素

进行伯努利采样，得到归一化测试数据Y^(t)的r位哈希编码

(9)计算归一化测试数据Y^(t)的哈希编码

2.根据权利要求1所述的基于非参数贝叶斯模型的监督跨模态哈希检索方法，其特征在于，步骤(4a)所述的归一化训练数据X^(t)的训练数据整体均值

服从的后验分布、训练数据所属类别均值

服从的后验分布

以及训练数据协方差矩阵的逆

服从的后验分布，其表达式分别为：

(i)归一化训练数据X^(t)的训练数据整体均值

服从的后验分布，其表达式为：

其中，

表示含有C个主成分的高斯混合模型，

表示第c个高斯的权重，

n_c表示归一化训练数据第c类所含的训练数据点个数；

(ii)归一化训练数据X^(t)的训练数据所属类别均值

服从的后验分布

其表达式为：

其中，归一化训练数据所属类别均值

服从的后验分布

是通过假设归一化训练数据所属类别均值

先验分布服从狄利克雷过程推导得到的，即

δ_.表示δ函数，ν_i表示第i个训练数据点的所属类别均值，

I_d表示d维单位矩阵，d为每一个训练数据点x^(t)的维数，α₀表示调节参数，G₀表示狄利克雷过程的基础分布；

(iii)归一化训练数据X^(t)的训练数据协方差矩阵的逆

服从的后验分布，其表达式为：

其中，训练数据协方差矩阵的逆

先验分布服从威沙特分布推导得到的，即

m表示自由度，V_D表示p×p的尺度矩阵。

3.根据权利要求1所述的基于非参数贝叶斯模型的监督跨模态哈希检索方法，其特征在于，步骤(6)中所述的训练数据后验概率P(K|X⁽¹⁾,X⁽²⁾)，其表达式为：

4.根据权利要求1所述的基于非参数贝叶斯模型的监督跨模态哈希检索方法，其特征在于，步骤(7c)中所述的对归一化图像训练数据X⁽¹⁾和归一化文本训练数据X⁽²⁾统一的r位哈希编码B_tr的后验概率P(B_tr|X⁽¹⁾,X⁽²⁾)中的每一个元素

进行伯努利采样，实现步骤为：

对应元素的表示，且t_tr∈(0,1)，

5.根据权利要求1所述的基于非参数贝叶斯模型的监督跨模态哈希检索方法，其特征在于，步骤(8b)所述的归一化测试数据后验概率P(K|Y^(t))，其表达式为：

其中，P(Y^(t)|c)表示归一化测试数据Y^(t)属于第c类的概率，P(K)表示类别的边缘分布，P(K)中有C个元素，此处假设P(K)中每一个元素均服从均匀分布，即

6.根据权利要求1所述的基于非参数贝叶斯模型的监督跨模态哈希检索方法，其特征在于，步骤(8d)中所述的对归一化测试数据Y^(t)的r位哈希编码

的后验概率

中的每一个元素

进行伯努利采样，实现步骤为：

(8d1)随机产生一个和归一化测试数据Y^(t)的r位哈希编码

的后验概率

同大小的测试数据随机数矩阵T_te；

(8d2)比较归一化测试数据Y^(t)的r位哈希编码

的后验概率

中对应位置元素

其中，t_te为随机数矩阵T_te中与

对应元素的表示，且t_te∈(0,1)，