CN116561398B - 一种哈希检索模型构建方法、系统、电子设备及存储介质 - Google Patents
一种哈希检索模型构建方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116561398B CN116561398B CN202310842571.9A CN202310842571A CN116561398B CN 116561398 B CN116561398 B CN 116561398B CN 202310842571 A CN202310842571 A CN 202310842571A CN 116561398 B CN116561398 B CN 116561398B
- Authority
- CN
- China
- Prior art keywords
- objective function
- optimal
- matrix
- hash
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 163
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000006870 function Effects 0.000 claims description 175
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 230000009977 dual effect Effects 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 7
- 238000012549 training Methods 0.000 abstract description 7
- 238000013528 artificial neural network Methods 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9014—Indexing; Data structures therefor; Storage structures hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Library & Information Science (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供的一种哈希检索模型构建方法、系统、电子设备及存储介质,通过输入相似度矩阵以及输出相似度矩阵构建第一目标函数并求解得到最优投影矩阵,再引入旋转矩阵构建第二目标函数,将第二目标函数分解成第一子目标函数以及第二子目标函数,分别求解最优输出变量以及最优旋转矩阵,使得通过训练旋转矩阵,能够学习到数据不同维度的特征以及数据各维度信息平衡的紧凑二值编码,解决现有技术中存在数据信息丢失以及数据不均匀分布的问题;同时,基于最优输出变量以及最优旋转矩阵得到哈希检索模型用于数据检索,相较于基于神经网络的图像数据分类方法,能够针对不同的检索数据进行检索,从而数据提高检索效果。
Description
技术领域
本发明涉及数据检索技术领域,特别是涉及一种哈希检索模型构建方法、系统、电子设备及存储介质。
背景技术
随着互联网技术的高速发展图像、视频等多媒体数据急剧增长,这使得基于大规模数据的检索难度不断提升。目前,现有技术如公开号为CN111783033A,名称为一种数据稀疏投影算法、系统、电子装置及存储介质的专利中,公开了通过学习输入数据样本之间的相似度,对低维度数据进行升维再做稀疏二值的处理,求解离散的目标函数的最优解,从而获得最优的投影矩阵以取得到高维的数据稀疏二值编码的方法。但该方法未能有效的考虑数据样本之间的信息方差。具体来说,方差较大的输入数据维度包含更多的信息,而其他方差较小的维度包含的信息量较少。然而,大多数的工作都是将每个数据特征编码为具有相同权重的二值编码(1/0),这将不可避免的导致具有较大方差维度的数据的信息丢失,导致了数据的不均衡分布。并且该技术方案求解离散目标函数的算法的收敛性和唯一性无法保证。
又如公开号为CN114037055A,名称为数据处理系统、方法、装置、设备及存储介质的专利文件中,公开了通过神经网络生成算法,利用数据集训练分类网络以通过分类任务训练出通用的视觉表达。但技术方案中神经网络训练过程只局限于特定的图像分类任务,使得模型局限在基于图像特征的分类任务。无法实现有效的数据检索。
发明内容
本发明所要解决的技术问题是:提供一种基于哈希编码的检索方法、系统、电子设备及存储介质,提高数据检索效果。
为了解决上述技术问题,本发明采用的技术方案为:
一种哈希检索模型构建方法,包括:
获取输入数据以及初始投影矩阵;所述输入数据为多维数据,所述初始投影矩阵通过随机的方式生成,且与所述输入数据的维度相同;
根据所述初始投影矩阵构建初始哈希函数;
通过所述初始哈希函数对所述输入数据进行哈希处理,得到输出变量;
根据所述输入数据对应的输入相似度矩阵以及所述输出变量对应的输出相似度矩阵之间距离的最小值构建第一目标函数,并根据所述第一目标函数得到最优投影矩阵;
获取初始旋转矩阵,并根据所述初始旋转矩阵更新所述第一目标函数,得到第二目标函数;
根据所述第二目标函数分别得到第一子目标函数以及第二子目标函数,并依次求解所述第一子目标函数以及第二子目标函数得到最优旋转矩阵;
根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型。
为了解决上述技术问题,本发明采用的另一技术方案为:
一种哈希检索系统,包括:
构建模块,用于根据如上述的一种哈希检索模型构建方法的各个步骤构建得到哈希检索模型;
检索模块,用于获取检索数据,并根据所述哈希检索模型对所述检索数据进行检索,得到与所述检索数据对应的相似数据。
为了解决上述技术问题,本发明采用的另一技术方案为:
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的一种哈希检索模型构建方法中的各个步骤。
为了解决上述技术问题,本发明采用的另一技术方案为:
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的一种哈希检索模型构建方法各个步骤。
本发明的有益效果在于:由初始投影矩阵构建初始哈希函数后,对输入数据进行哈希处理得到输出变量,进而根据输入相似度矩阵以及输出相似度矩阵构建第一目标函数并求解得到最优投影矩阵,能够最大程度的保留数据间的相似性,再引入旋转矩阵构建第二目标函数,将第二目标函数分解成第一子目标函数以及第二子目标函数,分别求解最优输出变量以及最优旋转矩阵,使得通过训练旋转矩阵,能够学习到数据不同维度的特征以及数据各维度信息平衡的紧凑二值编码,解决现有技术中存在数据信息丢失以及数据不均匀分布的问题;同时,基于最优输出变量以及最优旋转矩阵得到哈希检索模型用于数据检索,利用哈希模型输出二值紧凑编码可以提高大规模检索任务的检索速度,方便检索问题进行扩展及应用到多种现实应用场景中,相较于基于神经网络的图像数据分类方法,能够针对不同的检索数据进行检索,从而数据提高检索效果。
附图说明
图1为本发明实施例中的一种哈希检索模型构建方法的步骤流程图;
图2为本发明实施例中的一种哈希检索模型构建方法的算法流程图;
图3为本发明实施例中的一种哈希检索系统的模块示意图;
图4为不同检索模型对应的检索召回率随哈希长度的变化图;
图5为不同检索模型对应的检索召回率随检索样本数量的变化图;
图6为不同检索模型在第一数据集和第二数据集的学习速度结果;
图7为不同检索模型在第三数据集和第四数据集的学习速度结果;
图8为本发明实施例中的一种电子设备的结构示意图。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种哈希检索模型构建方法,包括:
获取输入数据以及初始投影矩阵;所述输入数据为多维数据,所述初始投影矩阵通过随机的方式生成,且与所述输入数据的维度相同;
根据所述初始投影矩阵构建初始哈希函数;
通过所述初始哈希函数对所述输入数据进行哈希处理,得到输出变量;
根据所述输入数据对应的输入相似度矩阵以及所述输出变量对应的输出相似度矩阵之间距离的最小值构建第一目标函数,并根据所述第一目标函数得到最优投影矩阵;
获取初始旋转矩阵,并根据所述初始旋转矩阵更新所述第一目标函数,得到第二目标函数;
根据所述第二目标函数分别得到第一子目标函数以及第二子目标函数,并依次求解所述第一子目标函数以及第二子目标函数得到最优旋转矩阵;
根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型。
由上述描述可知,本发明的有益效果在于:由初始投影矩阵构建初始哈希函数后,对输入数据进行哈希处理得到输出变量,进而根据输入相似度矩阵以及输出相似度矩阵构建第一目标函数并求解得到最优投影矩阵,能够最大程度的保留数据间的相似性,再引入旋转矩阵构建第二目标函数,将第二目标函数分解成第一子目标函数以及第二子目标函数,分别求解最优输出变量以及最优旋转矩阵,使得通过训练旋转矩阵,能够学习到数据不同维度的特征以及数据各维度信息平衡的紧凑二值编码,解决现有技术中存在数据信息丢失以及数据不均匀分布的问题;同时,基于最优输出变量以及最优旋转矩阵得到哈希检索模型用于数据检索,利用哈希模型输出二值紧凑编码可以提高大规模检索任务的检索速度,方便检索问题进行扩展及应用到多种现实应用场景中,相较于基于神经网络的图像数据分类方法,能够针对不同的检索数据进行检索,从而数据提高检索效果。
进一步地,所述根据所述第一目标函数得到最优投影矩阵包括:
获取第一约束条件,并根据所述第一约束条件更新所述第一目标函数,得到约束化目标函数;其中,所述第一目标函数包括:;所述第一约束条件包括:;所述约束化目标函数包括:/>;
以所述输入数据零中心化为条件更新所述约束化目标函数,得到简化目标函数;其中,所述数据零中心化条件包括:;所述简化目标函数包括:/>;
根据所述简化目标函数求解得到所述最优投影矩阵;上式中,为所述输入相似度矩阵,/>为所述输出相似度矩阵,/>为所述输入数据,/>为所述输入数据的稠密表达,/>为所述初始旋转矩阵。
由上述描述可知,通过第一约束条件对第一目标函数进行约束,使得在第一约束条件下不同数据样本的哈希函数平衡且独立,再以数据为零中心化的条件下简化目标函数,从而提高模型精度的同时,也提高了模型计算效率。
进一步地,所述根据所述第二目标函数分别得到第一子目标函数以及第二子目标函数,并依次求解所述第一子目标函数以及第二子目标函数得到最优旋转矩阵包括:
设置所述第二目标函数以求解最优输出变量为目标,得到所述第一子目标函数;根据所述最优投影矩阵以及所述第一子目标函数求解得到最优输出变量;
设置所述第二目标函数以求解所述最优旋转矩阵为目标,得到所述第二子目标函数;根据所述最优输出变量以及所述第二子目标函数求解得到最优旋转矩阵。
由上述描述可知,根据第二目标函数先对最优输出变量进行求解后,再基于最优输出变量对最优旋转矩阵进行求解,简化了对目标函数的求解,使得模型构建过程更加地高效。
进一步地,所述根据所述第一子目标函数求解得到最优输出变量包括:
以所述最优投影矩阵作为所述第一子目标函数的固定参数,将所述第一子目标函数转化为拉格朗日对偶函数的形式,得到第一拉格朗日函数;基于第一梯度条件以及第一对角矩阵条件下计算所述拉格朗日函数,得到所述最优输出变量;其中,所述第一子目标函数包括:;所述第一拉格朗日函数包括:;
所述根据所述最优输出变量以及所述第二子目标函数求解得到最优旋转矩阵包括:
以所述最优输出变量作为所述第二子目标函数的固定参数,将所述第二子目标函数转化为拉格朗日对偶函数的形式,得到第二拉格朗日函数;基于第二梯度条件以及对第二角矩阵条件下计算所述拉格朗日函数,得到所述最优旋转矩阵;其中,所述第二目标函数包括:;所述第二拉格朗日函数包括:/>;
上式中,为待求解输出变量,/>为最优输出变量;/>为给定任意的旋转矩阵,/>为待求解旋转矩阵;/>、/>为拉格朗日算子;其中/>表示对角矩阵,每个对角元素的值为/>;/>表示一个对角矩阵,每个对角元素的值为/>。
由上述描述可知,基于拉格朗日函数和约束条件求解其对偶函数的最优解,避免了因约束条件放宽而造成的数据信息丢失的情况发生,从而提高对最优输出变量以及最优旋转矩阵的计算精度,进而提高模型检索精度。
进一步地,所述根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型包括:
迭代所述最优输出变量以及最优旋转矩阵,直至在所述最优投影矩阵条件下所述最优旋转矩阵不再变化;
根据所述最优投影矩阵以及最终迭代的所述最优旋转矩阵得到哈希检索模型。
由上述描述可知,通过随机初始化旋转矩阵和迭代的方式不断优化输出变量以及旋转矩阵,使得输出的数据编码更加紧凑,并且对数据相似度特征具有更好的保护效果,提高数据检索精度。
本发明另一实施例提供一种哈希检索系统,包括:
构建模块,用于根据上述的一种哈希检索模型构建方法的各个步骤构建得到哈希检索模型;
检索模块,用于获取检索数据,并根据所述哈希检索模型对所述检索数据进行检索,得到与所述检索数据对应的相似数据。
本发明另一实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的一种哈希检索模型构建方法中的各个步骤。
本发明另一实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的一种哈希检索模型构建方法各个步骤。
实施例一
请参照图1和图2,一种哈希检索模型构建方法,包括:
S1、获取输入数据以及初始投影矩阵;所述输入数据为多维数据,所述初始投影矩阵通过随机的方式生成,且与所述输入数据的维度相同;如给定原始输入数据的稠密表达为:,/>代表输入数据样本个数,/>代表输入数据维度;计算所述输入数据对应的输入相似度矩阵,得到/>;随机初始化投影矩阵/>,k代表初始投影矩阵列数。
S2、根据所述初始投影矩阵构建初始哈希函数;即得到所述初始哈希函数为:;其中,/>代表符号函数。
S3、通过所述初始哈希函数对所述输入数据进行哈希处理,得到输出变量;即将输入数据新的表达形式通过初始哈希函数进行二值化得到输出变量:,并计算其对应的输出相似度矩阵,得到/>。
S4、根据所述输入数据对应的输入相似度矩阵以及所述输出变量对应的输出相似度矩阵之间距离的最小值构建第一目标函数,并根据所述第一目标函数得到最优投影矩阵;即此时目标问题可用数学表达式定义为计算得到一个最优的投影矩阵,最小化输入相似度矩阵/>和输出相似度矩阵/>的距离,得到所述第一目标函数为:/>(1),能够最大程度的保留数据间的相似性;
进一步地,参考基于拉普拉斯矩阵的谱哈希算法求解离散问题的先验工作,放宽对的二值化的离散约束,并对投影矩阵/>加入了正交约束;即获取第一约束条件:,并根据所述第一约束条件更新所述第一目标函数,得到约束化目标函数:/>(2);其中,/>表示一个对角矩阵,每个对角元素的值为1;
再进一步地,以所述输入数据零中心化为条件更新所述约束化目标函数,即令,其中/>为输入数据,使得约束条件/>恒成立,得到简化目标函数:(3);
最终根据所述简化目标函数求解得到所述最优投影矩阵;其中,求解简化目标函数的最优投影矩阵等价转换成求解矩阵/>的最大/>维特征向量。
S5、获取初始旋转矩阵,并根据所述初始旋转矩阵更新所述第一目标函数,得到第二目标函数;具体的,由于成对的高维向量正交的可能性较高对检索问题造成较大误差,通过引入定义自正交的旋转矩阵,更新所述初始哈希函数得到新的哈希函数:。
S6、根据所述第二目标函数分别得到第一子目标函数以及第二子目标函数,并依次求解所述第一子目标函数以及第二子目标函数得到最优旋转矩阵,即将原始问题分解成两个子问题进行求解;如在一可选的实施方式中,通过先固定旋转矩阵求最优输出变量再固定输出变量/>求最优旋转矩阵/>的方式求解;或通过类似的方式,先求解其他的中间变量后,再求解得到最优旋转矩阵。
S7、根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型;具体的,通过随机和迭代的方式不断优化所述最优输出变量以及最优旋转矩阵,直至在所述最优投影矩阵条件下所述最优旋转矩阵不再变化;根据所述最优投影矩阵以及最终迭代的所述最优旋转矩阵得到哈希检索模型即最终的哈希函数,即得到;基于得到的最优哈希函数表达式,实现对于给定任意的稠密表达,都可以求得与其对应的二值紧凑编码,并且能够保证二值紧凑编码的输出相似度矩阵和输入数据的输入相似度矩阵之间的距离最小即与初始数据的相似度高;而二值紧凑编码可以提高大规模检索任务的检索速度,方便检索问题进行扩展及应用到多种现实应用场景中。
实施例二
本实施例与实施例一的区别在于具体限定了最优输出变量以及最优旋转矩阵的求解方法,具体的:
S61、设置所述第二目标函数以求解最优输出变量为目标,得到所述第一子目标函数;即给定任意的,求解最优输出变量/>的目标问题可得到,所述第一子目标函数为:(4);其中,此时式子中的旋转矩阵W为固定参数;
进一步地,设置约束条件为,对所述第一子目标函数进行转化,得到:(5);其中/>表示一个对角矩阵,每个对角元素的值为u。
将转化后的所述第一子目标函数再进一步地转化为拉格朗日对偶函数的形式,得到第一拉格朗日函数:(6);其中,/>为拉格朗日算子;
再基于第一梯度条件以及第一对角矩阵条件下计算所述拉格朗日函数,具体的:
假设为最优解,对于任意/>维度求导,根据KKT条件:
(1)梯度要求:,Yd是Y的每一个维度;
(2)原始约束条件:;
根据梯度要求,可得,由/>是对称的,可得/>是对称的;当时,假设/>是满秩的,从而/>是可逆的;这时,对/>进行SVD奇异值分解,,最优解可表示为/>;将最优解带入到问题(5),可得:
(7)
。
其中,;/>为矩阵/>的对角线元素,/>为矩阵/>的对角线元素。
根据原始约束条件:
(8)
。
其中,即为对角线元素乘积的固定值;
对于给定的:
(9)
。
综上可得,公式(7)的上界可表示为:;对于任意给定的/>,是给定任意/>维度中的元素的值;
公式(9)的等号成立即达到最大值,,这时:
(10);
综上可得,。
S62、设置所述第二目标函数以求解所述最优旋转矩阵为目标,得到所述第二子目标函数,即给定最优输出变量,解唯一的最优旋转矩阵/>,得到所述第二子目标函数:(11);
进一步地,设置约束条件为,对所述第二子目标函数进行转化,得到:(12);其中/>表示一个对角矩阵,每个对角元素的值为1;
将转化后的所述第二子目标函数再进一步地转化为拉格朗日对偶函数的形式,得到第而拉格朗日函数:(13);其中,/>为拉格朗日算子;
基于第二梯度条件以及对第二角矩阵条件下计算所述拉格朗日函数,得到所述最优旋转矩阵,具体的:
假设为最优解,对于任意/>维度求导,根据KKT条件:
(1)梯度要求:;Rd是R的每一个维度;
(2)原始约束条件:;
根据梯度要求,可得,由/>是对称的,可得/>是对称的;当/>时,假设/>是满秩的,从而/>是可逆的;
这时,对进行SVD奇异值分解,/>,最优解可表示为;将最优解带入(12)得:
(14)
。
其中,,/>是矩阵/>的对角线元素,/>是矩阵/>的对角线元素。
根据原始约束条件:
。
其中,为对角线元素乘积的固定值;
综上可得,公式(15)的上界可表示为:;对于任意给定的/>,公式(15)的等号成立即达到最大值,/>,这时:
(16);
综上可得,。
实施例三
请参照图3,本实施例提供一种哈希检索系统,包括:
构建模块,用于根据如实施例一种的一种哈希检索模型构建方法的各个步骤构建得到哈希检索模型;
检索模块,用于获取检索数据,并根据所述哈希检索模型对所述检索数据进行检索,得到与所述检索数据对应的相似数据;具体的:
对于任意的新的查询数据,均能够基于哈希检索模型求得其对应的低维紧凑二值表达/>。同理,任意检索数据/>也可得相应的低维二值紧凑表达,并且对于检索问题,能够找到与/>最相似的/>个数据/>;
将本实施例中构建的哈希检索模型(HSR)与现有的检索模型在四个数据集上进行检索效力的对比;请参照图4和图5,为检索效力在四个数据集上实验结果(前5%的检索精度),其中,图4表示检索召回率随哈希长度的变化,图5表示检索召回率随检索样本数量的变化(哈希长度为);从图4和图5中可以看出,本实施例构建的哈希检索模型的检索效力在四个数据集上均高于其他所有的对比算法;
将本实施例中构建的哈希检索模型与现有的检索模型在四个数据集上进行学习速度的对比;请参照图6、图7以及表1,本实施例的哈希检索模型的学习速度在四个数据集上虽然相对比其他方法是最长的,但其可扩展性好,且在保证检索效力的基础上,因此学习时长是可被接受的;其中,图6和图7中,x轴表示各种散列长度(),y轴表示对数刻度的学习时间(以2的底的对数)。
表1:检索方法的学习速度在SIFT数据集上的实验结果,表示不同的哈希长度()对应不同的学习时长。
。
实施例四
请参照图8,一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如实施例一中所述的一种哈希检索模型构建方法中的各个步骤。
实施例五
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如实施例一中所述的一种哈希检索模型构建方法各个步骤。
综上所述,本发明提供的一种哈希检索模型构建方法、系统、电子设备及存储介质,通过设定目标函数,参考谱哈希和拉普拉斯图的前序工作,将离散的目标函数放宽约束条件转化成连续的目标函数,求得最优投影矩阵,再根据朗格朗日函数和对偶问题的前序工作,将目标函数分解成两个子问题,分别求解最优输出变量/>和最优旋转矩阵/>,具体的:由初始投影矩阵构建初始哈希函数后,对输入数据进行哈希处理得到输出变量,进而根据输入相似度矩阵以及输出相似度矩阵构建第一目标函数并求解得到最优投影矩阵,能够最大程度的保留数据间的相似性,而且通过哈希函数对输出数据进行二值化形成二值紧凑编码,降低了在检索模型在实际检索问题中的计算成本,从而提高大规模检索任务的检索速度,并且能够方便地对检索问题进行扩展及应用到多种现实应用场景中,即检索模型具有良好的可扩展,训练过程不局限在图像数据。再引入旋转矩阵构建第二目标函数,将第二目标函数分解成第一子目标函数以及第二子目标函数,分别求解最优输出变量以及最优旋转矩阵,使得通过训练旋转矩阵,能够学习到数据不同维度的特征以及数据各维度信息平衡的紧凑二值编码,解决现有技术中存在数据信息丢失以及数据不均匀分布的问题;同时,基于最优输出变量以及最优旋转矩阵得到哈希检索模型用于数据检索,相较于基于神经网络的图像数据分类方法,能够针对不同的检索数据进行检索,从而数据提高检索效果。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (5)
1.一种哈希检索模型构建方法,其特征在于,包括:
获取输入数据以及初始投影矩阵;所述输入数据为多维数据,所述初始投影矩阵通过随机的方式生成,且与所述输入数据的维度相同;
根据所述初始投影矩阵构建初始哈希函数;
通过所述初始哈希函数对所述输入数据进行哈希处理,得到输出变量;
根据所述输入数据对应的输入相似度矩阵以及所述输出变量对应的输出相似度矩阵之间距离的最小值构建第一目标函数,并根据所述第一目标函数得到最优投影矩阵,具体的:
得到所述第一目标函数为;
获取第一约束条件:,并根据所述第一约束条件更新所述第一目标函数,得到约束化目标函数:/>;
以所述输入数据零中心化为条件更新所述约束化目标函数,得到简化目标函数:;
根据所述简化目标函数求解得到所述最优投影矩阵;
其中,为所述输入相似度矩阵,/>为所述输出相似度矩阵,/>为所述输入数据,/>为所述输入数据的稠密表达,/>为初始投影矩阵;/>表示一个对角矩阵,每个对角元素的值为1;
获取初始旋转矩阵,并根据所述初始旋转矩阵更新所述第一目标函数,得到第二目标函数;具体的,由于成对的高维向量正交的可能性较高对检索问题造成较大误差,通过引入定义自正交的旋转矩阵,k代表所述旋转矩阵行列数,更新所述初始哈希函数得到新的哈希函数:/>;
根据所述第二目标函数分别得到第一子目标函数以及第二子目标函数,并依次求解所述第一子目标函数以及第二子目标函数得到最优旋转矩阵,具体的:
设置所述第二目标函数以求解最优输出变量为目标,得到所述第一子目标函数;即给定任意的旋转矩阵,求解最优输出变量/>的目标问题可得到,所述第一子目标函数为:;其中,此时式子中的旋转矩阵W为固定参数;
根据所述最优投影矩阵以及所述第一子目标函数求解得到最优输出变量;
设置所述第二目标函数以求解所述最优旋转矩阵为目标,得到所述第二子目标函数;根据所述最优输出变量以及所述第二子目标函数求解得到最优旋转矩阵;根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型;
所述根据所述第一子目标函数求解得到最优输出变量包括:
以所述最优投影矩阵作为所述第一子目标函数的固定参数,将所述第一子目标函数转化为拉格朗日对偶函数的形式,得到第一拉格朗日函数;基于第一梯度条件以及第一对角矩阵条件下计算所述拉格朗日函数,得到所述最优输出变量;
所述根据所述最优输出变量以及所述第二子目标函数求解得到最优旋转矩阵包括:
以所述最优输出变量作为所述第二子目标函数的固定参数,将所述第二子目标函数转化为拉格朗日对偶函数的形式,得到第二拉格朗日函数;基于第二梯度条件以及对第二角矩阵条件下计算所述拉格朗日函数,得到所述最优旋转矩阵;
所述第一拉格朗日函数包括:;
所述第二目标函数包括:;
所述第二拉格朗日函数包括:;
其中,为待求解输出变量,/>为最优输出变量;/>为待求解旋转矩阵;/>拉格朗日算子;其中/>表示对角矩阵,每个对角元素的值为/>;/>表示一个对角矩阵,每个对角元素的值为/>;
所述基于第二梯度条件以及对第二角矩阵条件下计算所述拉格朗日函数,得到所述最优旋转矩阵,具体的:
假设为最优解,对于任意/>维度求导,根据KKT条件:
(1)梯度要求:;Rd是R的每一个维度;
(2)原始约束条件:;
根据梯度要求,可得,由/>是对称的,可得是对称的;当/>时,假设/>是满秩的,从而/>是可逆的;
这时,对进行SVD奇异值分解,/>,最优解可表示为;将最优解带入/>得:
其中,,/>是矩阵/>的对角线元素,/>是矩阵
根据原始约束条件:
其中,为对角线元素乘积的固定值;
综上可得,上式的上界可表示为:;对于任意给定的/>,上式的等号成立即达到最大值,/>,这时:
;
综上可得,=/>;/>为最优旋转矩阵。
2.根据权利要求1所述一种哈希检索模型构建方法,其特征在于,所述根据所述最优旋转矩阵以及最优投影矩阵得到哈希检索模型包括:
迭代所述最优输出变量以及最优旋转矩阵,直至在所述最优投影矩阵条件下所述最优旋转矩阵不再变化;
根据所述最优投影矩阵以及最终迭代的所述最优旋转矩阵得到哈希检索模型。
3.一种哈希检索系统,其特征在于,包括:
构建模块,用于根据如权利要求1-2中任一项所述的一种哈希检索模型构建方法的各个步骤构建得到哈希检索模型;
检索模块,用于获取检索数据,并根据所述哈希检索模型对所述检索数据进行检索,得到与所述检索数据对应的相似数据。
4.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-2任意一项所述的一种哈希检索模型构建方法中的各个步骤。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-2任意一项所述的一种哈希检索模型构建方法各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310842571.9A CN116561398B (zh) | 2023-07-11 | 2023-07-11 | 一种哈希检索模型构建方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310842571.9A CN116561398B (zh) | 2023-07-11 | 2023-07-11 | 一种哈希检索模型构建方法、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116561398A CN116561398A (zh) | 2023-08-08 |
CN116561398B true CN116561398B (zh) | 2024-01-23 |
Family
ID=87490181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310842571.9A Active CN116561398B (zh) | 2023-07-11 | 2023-07-11 | 一种哈希检索模型构建方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116561398B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112925962A (zh) * | 2021-01-20 | 2021-06-08 | 同济大学 | 基于哈希编码的跨模态数据检索方法、系统、设备及介质 |
CN115080801A (zh) * | 2022-07-22 | 2022-09-20 | 山东大学 | 基于联邦学习和数据二进制表示的跨模态检索方法及系统 |
CN115878757A (zh) * | 2022-12-09 | 2023-03-31 | 大连理工大学 | 一种基于概念分解的混合超图正则化半监督跨模态哈希方法 |
-
2023
- 2023-07-11 CN CN202310842571.9A patent/CN116561398B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112925962A (zh) * | 2021-01-20 | 2021-06-08 | 同济大学 | 基于哈希编码的跨模态数据检索方法、系统、设备及介质 |
CN115080801A (zh) * | 2022-07-22 | 2022-09-20 | 山东大学 | 基于联邦学习和数据二进制表示的跨模态检索方法及系统 |
CN115878757A (zh) * | 2022-12-09 | 2023-03-31 | 大连理工大学 | 一种基于概念分解的混合超图正则化半监督跨模态哈希方法 |
Non-Patent Citations (1)
Title |
---|
Learning Sparse Binary Code for Maximum Inner Product Search:Learning Sparse Binary Code for Maximum Inner Product Search;Changyi Ma 等;《Virtual Event》;第3308-3312页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116561398A (zh) | 2023-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Frequency-domain dynamic pruning for convolutional neural networks | |
CN107516129B (zh) | 基于维度自适应的Tucker分解的深度网络压缩方法 | |
Huang et al. | A flexible and efficient algorithmic framework for constrained matrix and tensor factorization | |
WO2019091020A1 (zh) | 权重数据存储方法和基于该方法的神经网络处理器 | |
Wang et al. | IK-SVD: dictionary learning for spatial big data via incremental atom update | |
KR20190016539A (ko) | 신경망 및 신경망 트레이닝 방법 | |
JP2007172384A5 (zh) | ||
CN111310050A (zh) | 一种基于多层注意力的推荐方法 | |
Kvyetnyy et al. | Modification of fractal coding algorithm by a combination of modern technologies and parallel computations | |
Naderahmadian et al. | Correlation based online dictionary learning algorithm | |
Yang et al. | A fast non-smooth nonnegative matrix factorization for learning sparse representation | |
Rahebi | Vector quantization using whale optimization algorithm for digital image compression | |
CN113377964A (zh) | 知识图谱链接预测方法、装置、设备及存储介质 | |
Geshkovski et al. | A mathematical perspective on transformers | |
Li et al. | Incoherent dictionary learning with log-regularizer based on proximal operators | |
CN111241076A (zh) | 一种基于张量链分解的流式数据增量处理方法及装置 | |
Li et al. | A graphical approach for filter pruning by exploring the similarity relation between feature maps | |
CN116561398B (zh) | 一种哈希检索模型构建方法、系统、电子设备及存储介质 | |
Yin et al. | Nimble gnn embedding with tensor-train decomposition | |
CN116611731A (zh) | 一种评分模型训练方法、用户推送方法及装置 | |
Sattigeri et al. | Implementation of a fast image coding and retrieval system using a GPU | |
Zhu et al. | Revisiting multi-codebook quantization | |
Giffon et al. | PSM-nets: Compressing neural networks with product of sparse matrices | |
CN115457638A (zh) | 模型训练方法、数据检索方法、装置、设备及存储介质 | |
CN114637751A (zh) | 一种Hadamard矩阵引导的多模态哈希检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |