CN112241475B - 基于维度分析量化器哈希学习的数据检索方法 - Google Patents

基于维度分析量化器哈希学习的数据检索方法 Download PDF

Info

Publication number
CN112241475B
CN112241475B CN202011107446.6A CN202011107446A CN112241475B CN 112241475 B CN112241475 B CN 112241475B CN 202011107446 A CN202011107446 A CN 202011107446A CN 112241475 B CN112241475 B CN 112241475B
Authority
CN
China
Prior art keywords
projection
dimension
matrix
hash
data retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011107446.6A
Other languages
English (en)
Other versions
CN112241475A (zh
Inventor
曹媛
陈娜
桂杰
许晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN202011107446.6A priority Critical patent/CN112241475B/zh
Publication of CN112241475A publication Critical patent/CN112241475A/zh
Application granted granted Critical
Publication of CN112241475B publication Critical patent/CN112241475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于维度分析量化器哈希学习的数据检索方法,该方法包括:获取待分析数据,提取相应特征向量;基于哈希算法对得到的特征向量进行投影;对得到的投影维度进行重要性分析,选取更具信息性的子集;使用量化器将选定的更具信息性的子集划分为几个区域,每个区域都使用对应代码本进行量化;通过得到量化结果实现数据检索,输出。利用本发明进行数据搜索的精度更高,本发明提供的DAQ方法在各个方面的性能与其他量化方法相比都更为优越。

Description

基于维度分析量化器哈希学习的数据检索方法
技术领域
本发明涉及一种数据检索方法,属于深度学习和数据分析技术领域。
背景技术
近些年大数据时代迅速的兴起,近似最近邻搜索成了许多应用程序(例如大规模图像检索)中的基本问题,关于近似最近邻搜索问题,早期研究集中于使用空间分区和递归超平面分解来构建新的数据结构,其中包括k-d树,度量树,覆盖树以及其他相关结构。但是,在处理高维数据时,这些基于树的方法的时间性能下降为线性扫描。近几年的研究工作主要集中在学习哈希码以进行有效的相似度搜索。
随着深度学习的飞速发展,已经提出了许多深度哈希方法。Xia等人提出了卷积神经网络哈希(CNNH),首先从成对相似性矩阵分解中学习近似哈希码,然后利用原始图像像素同时学习图像特征和哈希函数。Jiang等人提出了深度成对监督散列(DPSH),利用成对标签为应用程序执行同时特征学习和哈希码学习;Jiang等人还提出了深度离散监督哈希算法(DDSH),它可以利用成对监督信息直接指导离散编码过程和深度特征学习过程,从而增强这两个重要过程之间的反馈。
大多数哈希方法都使用SBQ生成哈希码,并通过汉明距离评估两个哈希码之间的相似性。但是,SBQ的一个问题是阈值通常位于最高点密度的区域,因此许多接近阈值的邻近点将被量化为完全不同的哈希码,这依据哈希原理是不合理的。因此,Liu等人提出了一种层次哈希算法(HH),通过使用三个阈值将投影维度的前一半全部划分为四个区域,并用两个哈希位对每个区域进行量化,来解决该问题。然而,最远区域中的两点之间的汉明距离与附近区域中的两点之间的汉明距离相同(例如,{00,01,11,10}),这显然是不合理的。Liu等人提出了一种新颖的量化策略,称为双比特量化(DBQ),以有效地保留数据之间的相邻结构。DBQ的基本思想是将所有前半部分投影维划分为三个具有两个自适应学习阈值的区域,并使用双哈希位(例如{01,00,10})对每个区域进行量化。DBQ是解决SBQ和HH里问题的好方法,而且性能明显优于它们。为了进一步提高搜索准确性,有人提出了曼哈顿哈希(MH)来用自然二进制代码(NBC)的多个位(例如{0,1,2,3})对所有第一个多个投影维进行量化,通过计算两个哈希码之间的曼哈顿距离进行相似性搜索。由于MH可以有效保留数据之间的邻域结构,因此MH的性能明显优于SBQ,HH和DBQ。
但是,上述方法忽略了由投影数据提供的原始数据,无法充分学习携带更多信息的实值代表值,且忽略了投影数据的分布,只是通过样本均来近似的表示特征,难以实现高精度的搜索。
发明内容
本发明的目的是提供一种基于维度分析量化器哈希学习的数据检索方法,以弥补现有技术的不足。
由于损失函数的复杂优化问题难以解决,因此大多数哈希方法将哈希码学习问题分解为两个步骤:投影和量化。在量化步骤中,二进制代码被广泛使用,因为按汉明距离进行排序非常高效;但是,在需要高搜索精度的应用(例如图像检索)中,应减少量化步骤产生的大量信息丢失。由于许多两步哈希方法在投影步骤中会产生不均匀的投影维度。然而现有的量化算法中一部分根本没有考虑投影数据的分布情况,另一部分认为第一个投影维度更重要但是并没有提供详细的重要性分析,因而现有的量化算法并没有很好的利用投影维度里的有效信息。
基于此,本发明采取的具体技术方案如下:
一种基于维度分析量化器哈希学习的数据检索方法,该方法包括以下步骤:
S1:获取待分析数据,提取相应特征向量;
S2:基于哈希算法对S1得到的特征向量进行投影;
S3:对S2得到的投影维度进行重要性分析,选取更具信息性的子集;
S4:使用量化器将S3选定的更具信息性的子集划分为几个区域,每个区域都使用对应代码本进行量化;
S5:通过S4得到量化结果实现数据检索,输出。
进一步的,所述S3中投影维度重要性分析具体为:
将投影数据矩阵表示为G=P X∈RK×N,其中投影矩阵表示整个投影过程,IA的第一步是生成集中矩阵U,以确保每个投影维度均零均值化:
Figure BDA0002727437120000021
其中,gki和uki分别表示G和U的第k行和第i列中的元素;因此,
Figure BDA0002727437120000022
表示第k个投影维度的方差(依据概率论),将协方差矩阵C∈RK×K计算为:
Figure BDA0002727437120000023
其中UT是矩阵U的转置,很容易发现C的第k个对角元素是第k个投影维度的方差:
Figure BDA0002727437120000031
但是,其不确定C是否为对角矩阵,因此将C对角化为对角矩阵Λ;因为C是一个实对称矩阵,所以将C对角化的过程可以表示为ECET=Λ,其中E∈RK*K,E中的第k列是对应于特征值λk的特征向量;K个特征值构成Λ的对角元素:Λ=diag(λ1,λ2,...,λK);λk表示在k个投影维度彼此独立的情况下的第k个投影维度的方差,因为在Λ中所有非对角元素均为零;将λk定义为第k个投影维度的区分度。
这是因为,如果投影维度的λk较大,则点在该投影维度上的分布会更加分散,这意味着该投影维度会承载更多信息。因此,我们选择具有较大区分度的几个投影维度,并使用更多具有代表性的点对其进行量化,以近似的达到原始数据分布。
进一步的,所述S3中选取更具信息性的子集具体为:
将前述选择的投影维度数用M表示,用于量化每个选定的投影维的哈希位数用S表示,要量化总共有K个哈希位的投影点,则S*M=K,通过观察不同M产生的性能并选择最佳M来确定M的值,还将说明理论上设置参数M的方法,如上述,Λ=diag(λ1,...,λK)表示K个投影维度的区分度(假设{λ1,...,λK}已按降序排序),再计算M,以便M个选定的投影维度可以覆盖至少98%的总信息量,此外,K必须可被M整除。
更进一步的,计算M的详细步骤:整个信息量Δ的计算公式为:
Figure BDA0002727437120000032
然后,使选定的r个投影维度至少覆盖整个信息量的98%的第一个折点计算为:
Figure BDA0002727437120000033
其中
Figure BDA0002727437120000034
包含所有断点,这些断点使b选定的投影维度至少覆盖整个信息量的98%;由于K必须可以被M整除,因此首先计算Num,其中包含M的所有可能值:
Num={in|K mod in=0,in∈In}
其中In={1,...,K},计算M包含了在Num中找到最接近r的数:
Figure BDA0002727437120000035
其中num∈Num和|·|表示绝对值。
进一步的,所述S4具体操作如下:
S4-1:使用量化器划分区域并将分区量化
关于第k个投影维度,由于S个哈希位可以编码2S不同区域,需要分别学习(2S-1)个阈值
Figure BDA0002727437120000041
和2S个码本
Figure BDA0002727437120000042
第k个投影维的量化步长定义为:
Figure BDA0002727437120000043
要学习最优
Figure BDA0002727437120000044
Figure BDA0002727437120000045
需要使同一区域中的点彼此之间的相似度远高于不同区域中的点;
S4-2:提出一个目标函数,以最小化第k个投影维度的平方失真误差:
Figure BDA0002727437120000046
其中E表示平方失真误差的数学期望;该目标函数通过针对固定ck优化tk和固定tk优化ck的迭代过程实现全局最优;即固定阈值,更新码本以最小化目标函数中的平方失真误差;固定码本,阈值通过计算两个相邻码本的平均值来更新。
其中,选择均方误差的原因是因为在哈希方法中始终假定数据遵循高斯分布,尽管考虑了投影维度,但它们始终显示与原始空间中数据相似的分布,另外均方误差对离群值敏感。
另外,所述基于维度分析量化器哈希学习的数据检索方法能够用于多种场合的数据检索,更优先应用于图像检索技术。
本发明的优点和技术效果:
本发明提出了一种新颖的基于维度分析的量化方法用于数据检索,首先对投影维度进行重要性分析,然后从中选择更信息性的子集;再使用量化器(阈值和代码本)将所选的投影维度分为几个区域,每个区域都使用其相应的代码本进行量化;最后,两个散列码之间的相似性由它们对应的代码本之间的曼哈顿距离来估计,这样能有效利用投影维度的有效信息提高搜索精度。
本发明提供的DAQ与现有常见的量化方法相比,因为分析了每种投影方法在不同数据集上的最佳M值,并选择了更多信息性的投影维,这些维被更密集地划分以更好地保留数据之间的相邻结构,其数据搜索的精度更高,DAQ方法在各个方面的性能都更为优越。
附图说明
图1为本发明的技术流程框图。
图2为DAQ方法进行哈希学习的整个过程流程图。
图3为实施例2中MAP在不同数据集的结果对比图。
图4为实施例2中SIFT-1M数据集上精度-召回曲线结果对比图。
图5为实施例2中CIRAR-10数据集上精度-召回曲线结果对比图。
图6为实施例2中MNIST数据集上精度-召回曲线结果对比图。
具体实施方式
以下通过具体实施例并结合附图对本发明进一步解释和说明。
实施例1:
一种基于维度分析量化器哈希学习的数据检索方法,该方法基本流程如图1所示。
S1:获取待分析数据,提取相应特征向量;
S2:基于哈希算法对S1得到的特征向量进行投影;
S3:对S2得到的投影维度进行重要性分析,选取更具信息性的子集;
S4:使用量化器将S3选定的更具信息性的子集划分为几个区域,每个区域都使用对应代码本进行量化;
S5:通过S4得到量化结果实现数据检索(对输入的数据进行投影,计算与代码本之间的距离得到距离矩阵,通过距离矩阵得到二进制编码,通过查询数据二进制编码得到查询结果),输出。
其中,
如图2所示,假设其中向量是从图像提取的描述符,在训练集上,参数学习如下:
S1.投影维度重要性分析和选取更具信息性的子集
S1.1投影维度重要性分析
提出了一种重要性分析(IA)方法来分析投影维度的重要性,将投影数据矩阵表示为G=P X∈RK×N,其中投影矩阵表示整个投影过程,IA的第一步是生成集中矩阵U,以确保每个投影维度均具有零均值:
Figure BDA0002727437120000051
其中,gki和uki分别表示G和U的第k行和第i列中的元素。因此,
Figure BDA0002727437120000052
表示第k个投影维度的方差(依据概率论)。为了便于分析,我们将协方差矩阵C∈RK×K计算为:
Figure BDA0002727437120000053
其中UT是矩阵U的转置。很容易发现C的第k个对角元素是第k个投影维度的方差:
Figure BDA0002727437120000054
但是,其不确定C是否为对角矩阵。因此,我们将C对角化为对角矩阵Λ。因为C是一个实对称矩阵,所以将C对角化的过程可以表示为ECET=Λ,其中E∈RK*K,E中的第k列是对应于特征值λk的特征向量。K个特征值构成Λ的对角元素:Λ=diag(λ1,λ2,...,λK)。现在,λk表示在k个投影维度彼此独立的情况下的第k个投影维度的方差,因为在Λ中所有非对角元素均为零。将λk定义为第k个投影维度的区分度。这是因为,如果投影维度的λk较大,则点在该投影维度上的分布会更加分散,这意味着该投影维度会承载更多信息。因此,在DAQ方法中,选择具有较大区分度的几个投影维度,并使用更多具有代表性的点对其进行量化,以近似的达到原始数据分布。
S1.2选取更具信息性的子集
将前述选择的投影维度数用M表示,用于量化每个选定的投影维的哈希位数用S表示,要量化总共有K个哈希位的投影点,则S*M=K。在实验中,通过观察不同M产生的性能并选择最佳M来确定M的值。在这一部分中,还将说明理论上设置参数M的方法。如上部分中所述,Λ=diag(λ1,...,λK)表示K个投影维度的区分度(假设{λ1,...,λK}已按降序排序)。再计算M,以便M个选定的投影维度可以覆盖至少98%的总信息量。此外,K必须可被M整除。下面,给出计算M的详细步骤。整个信息量Δ的计算公式为:
Figure BDA0002727437120000061
然后,使选定的r个投影维度至少覆盖整个信息量的98%的第一个折点计算为:
Figure BDA0002727437120000062
其中
Figure BDA0002727437120000063
包含所有断点,这些断点使b选定的投影维度至少覆盖整个信息量的98%。由于K必须可以被M整除,因此首先计算Num,其中包含M的所有可能值:
Num={in|K mod in=0,in∈In}
其中In={1,...,K}。因此,计算M包含了在Num中找到最接近r的数:
Figure BDA0002727437120000064
其中num∈Num和|·|表示绝对值。
关于上述贡献中所提第二部分所述,提出了一个量化器(阈值和代码本),将选定的投影维度划分为几个区域,每个区域都使用对应代码本进行量化。具体操作如下:
S2.使用量化器划分区域并将分区量化
关于第k个投影维度,由于S个哈希位可以编码2S不同区域,需要分别学习(2S-1)个阈值
Figure BDA0002727437120000065
和2S个码本
Figure BDA0002727437120000066
在DAQ方法中,第k个投影维的量化步长定义为:
Figure BDA0002727437120000071
要学习最优
Figure BDA0002727437120000072
Figure BDA0002727437120000073
需要使同一区域中的点彼此之间的相似度远高于不同区域中的点。因此提出了一个目标函数,以最小化第k个投影维度的平方失真误差:
Figure BDA0002727437120000074
其中E表示平方失真误差的数学期望。选择均方误差的原因是因为在哈希方法中始终假定数据遵循高斯分布。尽管考虑了投影维度,但它们始终显示与原始空间中数据相似的分布。从另一角度来看,众所周知,均方误差对离群值敏感。但是,每个投影维度上间隔的有限性可以轻松排除它们。上述目标函数可以通过针对固定ck优化tk和固定tk优化ck的迭代过程轻松解决,事实证明可以实现全局最优。即固定阈值,更新码本以最小化目标函数中的平方失真误差;固定码本,阈值通过计算两个相邻码本的平均值来更新。
具体的:
在基础集
Figure BDA0002727437120000075
上,首先将X映射到投影空间GM=PMX∈RM*N,其中PM∈RM*D表示投影矩阵P∈RK*D的M行,也表示是第M个最大区分度。GM表示X在利用PM投影后的投影矩阵。然后,对于每个基点xi学习M个标签
Figure BDA0002727437120000076
以在M个投影维度上有效的索引对应的代码本。xi的第k个投影维度的标签定义为:
Figure BDA0002727437120000077
其中gki表示GM中的第k行和第i列元素。例如,在图2中,S=2意味着将每个投影维度划分为2S=4个区域,并且每个区域的标签的值是从0到(2S-1=3)。创建标签矩阵
Figure BDA0002727437120000078
的目标是为每个基点有效地索引对应的M个代码本。
在查询集上,首先将查询点
Figure BDA0002727437120000079
映射到f=PMq,其中
Figure BDA00027274371200000710
表示q经过使用PM的投影。然后对于k=1,...,M,我们通过以下公式计算fk
Figure BDA00027274371200000711
之间的曼哈顿距离:
Figure BDA00027274371200000712
其中
Figure BDA0002727437120000081
表示距离矩阵
Figure BDA0002727437120000082
中第k行和第s列的元素。创建A的目的是减少对几点进行排名时的距离计算量。使用A,我们将q和xi之间的距离计算转换为查找表操作:
Figure BDA0002727437120000083
其中,Dis(q,xi)表示使用DAQ方法的q与xi之间的距离。这样只需要M个查询表的操作和(M-1)个加法操作。
实施例2:
本实施例以实施例1提供的搜索方法为基础,在三个公共基准上进行了实验,包括SIFT-1M,CIFAR-10和MNIST。SIFT-1M由128-D签名描述符组成。SIFT-1M包含10,000个查询描述符,100,000个训练描述符和1,000,000个基本描述符。此外,对于通过欧几里得距离评估的每个查询描述符,提供了100个真正的最近邻居。
CIFAR-10是一个微小图像数据集,使用的版本包含60,000张尺寸为32×32像素的图像,这些图像已分为10类(飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船和卡车)。整个数据集分为59,000张图像的基本集和1,000张图像的查询集,从基本集中选择3,000个样本作为学习参数的训练集,我们用在3个不同的比例(8、8、4)上计算出的384-D灰度GIST描述符和从密集SIFT特征量化得到的300-D视觉词袋的组合来表示图像,从而产生684-D的向量。对于通过欧几里得相似度测量的每个查询图像,五十个真实的最近邻点被用来识别基本图像对于给定的查询图像是否为真实正值。
MNIST是NIST手写数字中较大集合的子集。它包含70,000张尺寸为28×28像素的图像。它由69,000个基本图像和1,000个查询图像组成。基本图像还用作学习参数的训练图像。所有图像均由784-D签名向量表示。此外,对于通过欧几里得距离评估的每个查询图像,使用300个真正的最近邻点来评估返回的图像是否是查询图像的最近邻点之一,表1中列出了这三个基础集的构造。
表1
Datasets Query Training Base Dimeusionality True Neighbors
SIFT-1M 10,000 100,000 1,000,000 128 100
CIFAR-10 1,000 3,000 59,000 684 50
MNIST 1,000 69,000 69,000 784 300
实验结果使用三个标准评估量化和排名方法的性能:召回率,精确度和均值平均精度(MAP)。
对SH,PCAH和ITQ这三种著名的投影方法进行了实验,并使用SBQ,DBQ,MH和AsyE这四种最先进的量化和排名方法对性能进行了比较。且当投影方法产生不均匀的投影维度时,DAQ效果更好。从所有实验中,发现DBQ的性能优于SBQ,这是因为DBQ可以更有效地保留数据之间的相邻结构。实验结果还显示MH和AsyE的性能几乎相似,并且比SBQ和DBQ更好。主要原因是MH使用自然二进制码编码,而AsyE使用实值代表点编码。MH和AsyE都更密集地划分距离空间。
从实验部分中的所有MAP(如图3所示)和精度-召回曲线(如图4,图5,图6所示),可以看到DAQ方法始终比四个基线表现出更好的性能,并且在更长的代码长度下,优势更加明显。正如前述分析,当使用更长的代码长度时,后面的位将不如所选的位提供的信息更多。因此,与四个最新基本量化方法相比,利用包含更多信息的投影维度的DAQ算法可以实现更高的精度。实验结果表示,与SIFT-1M上的Hamm,DBQ,MH和AsyE相比,DAQ分别获得了更高的MAP性能,分别高39.3%,30.7%,27.1%和25.2%。总体而言,DAQ方法在SIFT-1M数据集上的性能提升比在CIFAR-10和MNIST更大。然而,与Hamm,DBQ,MH和AsyE相比,我们仍然分别获得了23.4%,17.2%,13.8%和13.7%的MAP性能增长。
与四个基本量化方法相比,DAQ方法能够获得如此实质性性能提升的主要原因是,我们的阈值和码本学习算法可以尽可能近似地估计所选M个投影维度的分布。尽管使用了较小的投影维度,但由于它们比其他维度更具参考价值,因此量化损失仍然较低。在实验过程中将CIFAR-10上参数S的所有最佳值都设置为2,在这种情况下,除了阈值和码本学习算法,DAQ方法类似于MH。实验结果发现,DAQ方法依然始终优于MH,这证明我们的阈值和码本学习算法更有效。
从另一个角度来看,DAQ方法与SH和PCAH投影方法相结合的效果要优于ITQ投影方法。这是因为ITQ通过旋转矩阵使量化误差最小化,并且每个投影维几乎均等的提高最终搜索精度。特别是在SIFT-1M上,M的最佳值变化很小。
综上,DAQ方法与ITQ投影方法相结合的效果不及其他组合,但在大多数情况下,其性能仍优于四个基本量化方法。

Claims (5)

1.一种基于维度分析量化器哈希学习的数据检索方法,其特征在于,该方法包括以下步骤:
S1:获取待分析数据,提取相应特征向量;
S2:基于哈希算法对S1得到的特征向量进行投影;
S3:对S2得到的投影维度进行重要性分析,选取更具信息性的子集;所述S3中选取更具信息性的子集具体为:
将投影维度数用M表示,用于量化每个选定的投影维的哈希位数用S表示,要量化总共有K个哈希位的投影点,则S*M=K,通过观察不同M产生的性能并选择最佳M来确定M的值,Λ=diag(λ1,...,λK)表示K个投影维度的区分度,假设{λ1,...,λK}已按降序排序,再计算M,以便M个选定的投影维度可以覆盖至少98%的总信息量,此外,K必须可被M整除;
S4:使用量化器将S3选定的更具信息性的子集划分为几个区域,每个区域都使用对应代码本进行量化;
S5:通过S4得到量化结果实现数据检索,输出。
2.如权利要求1所述的数据检索方法,其特征在于,所述S3中投影维度重要性分析具体为:
将投影数据矩阵表示为G=P X∈RK×N,其中投影矩阵表示整个投影过程,IA的第一步是生成集中矩阵U:
Figure FDA0003527591840000011
其中,gki和uki分别表示G和U的第k行和第i列中的元素;因此,
Figure FDA0003527591840000012
表示第k个投影维度的方差,将协方差矩阵C∈RK×K计算为:
Figure FDA0003527591840000013
其中UT是矩阵U的转置,C的第k个对角元素是第k个投影维度的方差:
Figure FDA0003527591840000014
将C对角化为对角矩阵Λ;因为C是一个实对称矩阵,所以将C对角化的过程表示为ECET=Λ,其中E∈RK*K,E中的第k列是对应于特征值λk的特征向量;K个特征值构成Λ的对角元素:Λ=diag(λ1,λ2,...,λK);λk表示在k个投影维度彼此独立的情况下的第k个投影维度的方差,因为在Λ中所有非对角元素均为零;将λk定义为第k个投影维度的区分度。
3.如权利要求1所述的数据检索方法,其特征在于,计算M的详细步骤:整个信息量Δ的计算公式为:
Figure FDA0003527591840000015
然后,使选定的r个投影维度至少覆盖整个信息量的98%的第一个折点计算为:
Figure FDA0003527591840000021
其中
Figure FDA0003527591840000022
包含所有断点,这些断点使b选定的投影维度至少覆盖整个信息量的98%;由于K必须可以被M整除,因此首先计算Num,其中包含M的所有可能值:
Num={in|K mod in=0,in∈In}
其中In={1,...,K},计算M包含了在Num中找到最接近r的数:
Figure FDA0003527591840000023
其中num∈Num和|·|表示绝对值。
4.如权利要求1所述的数据检索方法,其特征在于,所述S4具体操作如下:
S4-1:使用量化器划分区域并将分区量化
关于第k个投影维度,由于S个哈希位可以编码2S不同区域,需要分别学习(2S-1)个阈值
Figure FDA0003527591840000024
和2S个码本
Figure FDA0003527591840000025
第k个投影维的量化步长定义为:
Figure FDA0003527591840000026
要学习最优
Figure FDA0003527591840000027
Figure FDA0003527591840000028
需要使同一区域中的点彼此之间的相似度高于不同区域中的点;
S4-2:提出一个目标函数,以最小化第k个投影维度的平方失真误差:
Figure FDA0003527591840000029
其中E表示平方失真误差的数学期望;该目标函数通过针对固定ck优化tk和固定tk优化ck的迭代过程实现全局最优;即固定阈值,更新码本以最小化目标函数中的平方失真误差;固定码本,阈值通过计算两个相邻码本的平均值来更新。
5.权利要求1所述的数据检索方法能够应用于图像检索。
CN202011107446.6A 2020-10-16 2020-10-16 基于维度分析量化器哈希学习的数据检索方法 Active CN112241475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011107446.6A CN112241475B (zh) 2020-10-16 2020-10-16 基于维度分析量化器哈希学习的数据检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011107446.6A CN112241475B (zh) 2020-10-16 2020-10-16 基于维度分析量化器哈希学习的数据检索方法

Publications (2)

Publication Number Publication Date
CN112241475A CN112241475A (zh) 2021-01-19
CN112241475B true CN112241475B (zh) 2022-04-26

Family

ID=74169336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011107446.6A Active CN112241475B (zh) 2020-10-16 2020-10-16 基于维度分析量化器哈希学习的数据检索方法

Country Status (1)

Country Link
CN (1) CN112241475B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113177132B (zh) * 2021-06-30 2021-09-14 中国海洋大学 基于联合语义矩阵的深度跨模态哈希的图像检索方法
TWI819627B (zh) * 2022-05-26 2023-10-21 緯創資通股份有限公司 用於深度學習網路的優化方法、運算裝置及電腦可讀取媒體

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013129580A1 (ja) * 2012-02-28 2013-09-06 公立大学法人大阪府立大学 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
CN106997385A (zh) * 2017-03-09 2017-08-01 杭州电子科技大学 一种基于双倍比特量化及加权的最近邻搜索方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014050952A1 (ja) * 2012-09-27 2014-04-03 日本電気株式会社 バイナリデータ変換方法と装置及びプログラム
CN104123375B (zh) * 2014-07-28 2018-01-23 清华大学 数据搜索方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013129580A1 (ja) * 2012-02-28 2013-09-06 公立大学法人大阪府立大学 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
CN106997385A (zh) * 2017-03-09 2017-08-01 杭州电子科技大学 一种基于双倍比特量化及加权的最近邻搜索方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
An Effective Network Intrusion Detection Framework Based on Learning to Hash;Wenrui Zhou, Yuan Cao etc.;《2019 IEEE International Conference on Smart Internet of Things》;20191231;全文 *
Hashing with Graphs;Wei Liu etc.;《Proceedings of the 28 th International Conference》;20110131;全文 *
Unsupervised adaptive hashing based on feature clustering;Tongtong Yuan etc.;《Neurocomputing》;20181015;第323卷;全文 *
基于投影残差量化哈希的近似最近邻搜索;杨定中,陈心浩;《计算机工程》;20151231;第41卷(第12期);全文 *

Also Published As

Publication number Publication date
CN112241475A (zh) 2021-01-19

Similar Documents

Publication Publication Date Title
Aljuaid et al. Proper imputation techniques for missing values in data sets
CN113190699B (zh) 一种基于类别级语义哈希的遥感图像检索方法及装置
Gu et al. Clustering-driven unsupervised deep hashing for image retrieval
Lee et al. Efficient structure learning of markov networks using $ l_1 $-regularization
CN110110080A (zh) 文本分类模型训练方法、装置、计算机设备及存储介质
CN109271486B (zh) 一种相似性保留跨模态哈希检索方法
CN109815357B (zh) 一种基于非线性降维及稀疏表示的遥感图像检索方法
CN110647907B (zh) 利用多层分类和字典学习的多标签图像分类算法
CN109284411B (zh) 一种基于有监督超图离散化图像二值编码方法
CN112241475B (zh) 基于维度分析量化器哈希学习的数据检索方法
CN111785329A (zh) 基于对抗自动编码器的单细胞rna测序聚类方法
CN110188827B (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN109871454B (zh) 一种鲁棒离散监督跨媒体哈希检索方法
CN110046660B (zh) 一种基于半监督学习的乘积量化方法
CN109871379B (zh) 一种基于数据块学习的在线哈希最近邻查询方法
CN115795065A (zh) 基于带权哈希码的多媒体数据跨模态检索方法及系统
CN114093445B (zh) 一种基于偏多标记学习的患者筛选标记方法
CN112307225A (zh) 基于改进哈希学习算法的大规模数据检索方法
Aljuaid et al. Intelligent imputation technique for missing values
CN112613391A (zh) 一种基于反向学习二进制水稻育种算法的高光谱图像波段选择方法
Lin et al. Addressing spectral variability in hyperspectral unmixing with unsupervised neural networks
De Stefano et al. A GA-based feature selection algorithm for remote sensing images
CN116304213A (zh) 基于图神经网络的rdf图数据库子图匹配查询优化方法
CN113469270B (zh) 基于分解多目标差分进化超像素的半监督直觉聚类方法
Xu et al. Semi-supervised feature selection by mutual information based on kernel density estimation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant