CN104881449A - 基于流形学习数据压缩哈希的图像检索方法 - Google Patents
基于流形学习数据压缩哈希的图像检索方法 Download PDFInfo
- Publication number
- CN104881449A CN104881449A CN201510250462.3A CN201510250462A CN104881449A CN 104881449 A CN104881449 A CN 104881449A CN 201510250462 A CN201510250462 A CN 201510250462A CN 104881449 A CN104881449 A CN 104881449A
- Authority
- CN
- China
- Prior art keywords
- image
- matrix
- data
- data matrix
- hash
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000013144 data compression Methods 0.000 title claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 88
- 238000012360 testing method Methods 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims description 217
- 239000013598 vector Substances 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 238000004088 simulation Methods 0.000 description 8
- 230000007547 defect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于流形学习数据压缩哈希的图像检索方法,主要解决图像检索中内存占用率大、检索性能低的问题。其实现步骤为:1.提取原始图像特征,并对其作归一化处理;2.将归一化数据划分为训练数据和测试数据;3.对训练数据压缩,得到综合压缩数据;4.对综合压缩数据进行低维嵌入,得到低维的综合压缩数据;5.通过图模型,分别得到综合压缩数据与训练数据、测试数据之间的近邻关系矩阵;6.分别阈值化综合压缩数据与两个近邻关系矩阵的乘积,得到训练数据和测试数据的哈希码;7.根据训练数据和测试数据哈希码之间的汉明距离得到检索结果。本发明降低了内存消耗,提高图像检索性能,可用于物联网和移动设备图片搜索服务。
Description
技术领域
本发明属于图像处理领域,更进一步涉及大规模图像数据的快速检索方法,可用于对图像进行二元编码,提高图像检索性能。
背景技术
随着互联网技术的快速发展以及数字多媒体的广泛应用,大量图像数据应运而生。海量的图像数据以及图像的复杂性给图像检索带来了巨大的挑战,如何快速准确地检索出人们需要的图像成为亟待解决的问题,图像检索更是成为了人们关注的焦点。但是传统的一些图像检索算法无法满足人们日益增长的需求。为了在大数据中高效地检索到有价值的图像,人们提出了哈希算法。哈希算法将高维图像数据映射到低维汉明空间,使用二进制编码表示图像。哈希算法既可以降低存储空间,也可以提高检索速度,因此研究基于哈希的图像检索技术具有重要意义。
天格科技(杭州)有限公司申请的专利“一种基于局部敏感哈希的相似人脸快速检索方法”(申请号:201310087561.5,公开号:CN103207898A)公开了一种基于局部敏感哈希的人脸图像哈希索引方法。该方法通过人脸区域检测、眼睛和嘴巴特征检测和特征提取、肤色检测、人脸肤色分布特征提取等步骤将图像表示为人脸特征向量,然后利用局部敏感哈希方法对人脸特征向量构建索引,从而提高查询时的速度。该专利申请提出的方法存在的不足之处是:该方法需要长代码保证高的查准率,但长代码使得查全率降低且耗费更多的存储空间;另外受随机性的影响,该方法的稳定性也不能令人满意。
大连理工大学提出的专利申请“基于多哈希表映射误差最小化的图像检索方法”(申请号:201110357850.3,公开号:CN102508910A)公开了一种基于多哈希表映射误差最小化的图像检索方法。该方法首先提取图像特征,再计算训练特征的主成分方向并采用迭代量化法对主成分方向进行优化,将待检索特征和查询特征投影到优化后的主成分方向上,得到其对应的哈希码;然后对先前训练特征进行能量弱化得到新的训练特征,重复该过程得到多组哈希码。该方法克服了单哈希表在召回率较高时汉明球半径较大的缺点,又采用相同哈希码长的多个哈希表,提高了检索的准确率。但是,该方法仍存在两方面的不足:一方面要通过线性降维方式得到主成分方向,不符合现实中大多数数据的非线性特性,且后续的迭代优化主成分方向过程会增加算法时间复杂度;另一方面针对大数据,多哈希表的使用增加了存储空间的占用率。
Yunchao Gong和Svetlana Lazebnik在文章“Iterative Quantization:A ProcrusteanApproach to Learning Binary Codes”(IEEE Conference on Computer Vision and PatternRecognition,2011,pp.817-824)中提出一种迭代量化方法,该方法首先对图像提取底层特征,再使用主成分分析方法对底层特征降维,得到低维特征;然后对低维特征旋转并量化得到图像的编码。该方法使得旋转后的主成分方向的方差尽量保持平衡,提高了获取哈希编码序列的性能。但是,该方法的前提假设是图像数据服从高斯分布,而实际数据可能并不服从高斯分布,并且该方法没有考虑图像之间的近邻关系,使得图像检索的查准率和查全率降低。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种基于流形学习数据压缩哈希的图像检索方法,以节省哈希编码的存储空间,降低检索的时间复杂度,有效提高图像检索的查准率与查全率。
本发明的技术思路是:在训练模式下,对图像训练数据通过随机近邻压缩,得到训练数据的综合压缩数据集合,根据综合压缩数据集合,运用流形学习方法计算出训练数据的哈希值,得到图像训练数据哈希编码。在测试模式下,获得测试数据哈希编码,计算测试数据与训练数据哈希编码间的汉明距离,得到检索结果。
根据上述思路,本发明的实现步骤如下:
(1)调用图像数据库中原始图像,对原始图像数据进行特征提取,得到图像特征数据;
(2)对图像特征数据做归一化处理,得到归一化数据矩阵;
(3)从归一化数据矩阵中随机选取五分之一的数据矩阵作为图像测试数据矩阵VT,其余的数据矩阵作为图像训练数据矩阵VX;
(4)对图像训练数据矩阵VX进行随机近邻压缩,得到图像训练数据矩阵VX的综合压缩数据矩阵S:
4a)在图像训练数据矩阵VX中随机选取400个数据点,作为图像训练数据矩阵初始的综合压缩数据矩阵S';
4b)通过随机近邻压缩算法不断优化图像训练数据矩阵初始的综合压缩数据矩阵S',得到优化的综合压缩数据矩阵S;
(5)对综合压缩数据矩阵S进行t分布随机近邻嵌入,得到低维的综合压缩数据矩阵Y;
(6)构造低维的综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻图,得到综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻关系矩阵RX:
6a)根据低维的综合压缩数据矩阵Y和图像训练数据矩阵VX,求得这两个矩阵两两数据点之间的相似度,并用这些相似度组合成相似度矩阵ZX;
6b)对相似度矩阵ZX进行归一化处理,得到综合压缩数据矩阵和图像训练数据矩阵之间的近邻关系矩阵RX;
(7)将低维的综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻关系矩阵RX与低维的综合压缩数据矩阵Y进行相乘,得到图像训练数据流形嵌入矩阵EX;
(8)构造低维的综合压缩数据矩阵Y和图像测试数据矩阵VT之间的近邻图,得到综合压缩数据矩阵和图像测试数据矩阵之间的近邻关系矩阵RT;
(9)将综合压缩数据矩阵Y和图像测试数据矩阵VT之间的近邻关系矩阵RT和低维的综合压缩数据矩阵Y进行相乘,得到图像测试数据流形嵌入矩阵ET;
(10)将图像训练数据流形嵌入矩阵EX和图像测试数据流形嵌入矩阵ET进行阈值化,分别得到训练数据矩阵的哈希码BX和测试数据的哈希码BT;
(11)从测试数据矩阵的哈希码BT中取其中的一个测试数据的哈希码,计算该哈希码与训练数据矩阵的哈希码BX之间的汉明距离,得到汉明距离向量;
(12)将汉明距离向量中的数值按从小到大的顺序排序,输出对应的原始图像,得到检索结果。
本发明与现有技术相比具有以下优点:
第一,本发明由于引入了流形学习方法,使得在低维流形空间中保存了高维数据的近邻结构,克服了现有技术中图像原有的近邻信息在映射空间中丢失的缺点,改善了哈希码性能,提高了检索精度。
第二,本发明由于运用了数据压缩算法学习到综合压缩数据集来替代原始数据集,减少了寻找相似最近邻数据点的时间。
第三,本发明由于采用流形学习获得单组哈希编码,克服了现有技术采用多组哈希编码而占用内存空间、消耗检索时间的缺点,使得本发明所提出的方法在图像检索中效率更高。
附图说明
图1为本发明的实现流程图;
图2为本发明与现有哈希方法在MNIST数据库下查准率-查全率、平均准确率的实验对比图;
图3为本发明与现有哈希方法在CIFAR-10数据库下查准率-查全率、平均准确率的实验对比图。
具体实施方案
以下结合附图,对本发明的具体实现方法和技术效果作进一步描述。
参照图1,本发明实现步骤如下:
步骤1,获取原始图像。
从给定的图像数据库MNIST或CIFAR-10中提取5000个图像,作为原始图像。
步骤2,对原始图像进行gist特征提取,得到图像特征数据。
对原始图像可以采用现有的sift特征或gist特征提取等方法,本实例采用gist特征提取,其步骤如下:
(2a)对每一张原始图像3个颜色通道的像素值取均值,得到该原始图像数据的灰度图像;
(2b)利用Gabor滤波器对灰度图像进行4个尺度、8个方向的滤波,得到灰度图像的32个特征图;
(2c)将每个特征图分成大小为4×4的子网格,分别对每个子网格中的所有像素取均值,将该均值排列在一个向量中,得到这张图像的特征数据。
步骤3,对图像特征数据做归一化处理,得到归一化数据矩阵V。
(3a)对图像特征数据取均值,用图像特征数据中的每个图像特征数据减去该均值,得到相应的图像特征数据的中心化向量;
(3b)对每个图像特征数据的中心化向量的各个分量进行平方和开根号运算,得到该向量的模;
(3c)用每个图像特征数据中心化向量除以该向量的模,得到每个图像特征数据的归一化向量;
(3d)将图像特征数据的归一化向量进行合并,得到图像特征数据的归一化矩阵V。
步骤4,从归一化数据矩阵V中随机选取五分之一的数据矩阵点作为图像测试数据矩阵VT,其余的归一化数据矩阵作为图像训练数据矩阵VX。
步骤5,对图像训练数据矩阵VX进行随机近邻压缩,得到图像训练数据矩阵的综合压缩数据矩阵S。
(5a)在图像训练数据矩阵VX中随机选取400个数据点,作为图像训练数据矩阵VX初始的综合压缩数据矩阵S';
(5b)计算图像训练数据矩阵VX中任意点和综合压缩数据矩阵S'中任意点之间的欧氏距离d0;
(5c)根据数据点之间的欧氏距离d0,通过相似度公式求得图像特征数据矩阵VX和综合压缩数据矩阵S'之间任意两点之间的相似度u,并将任意两点之间的相似度组合成相似度矩阵W,其中σ=0.9;
(5d)对相似度矩阵W做归一化处理,得到相似度概率分布矩阵P;
(5e)根据相似度概率分布矩阵P,通过最小化LKL(S)=-∑log(P),得到最优的图像训练数据矩阵的综合压缩数据矩阵S。
步骤6,对综合压缩数据矩阵S进行t分布随机近邻嵌入,得到低维的综合压缩数据矩阵Y。
对图像训练数据矩阵VX可以采用现有t分布随机近邻嵌入、局部线性嵌入等流形学习方法,本实例采用t分布随机近邻嵌入,其步骤如下:
(6a)随机生成一个服从标准正态分布的随机高斯矩阵Q;
(6b)最小化综合压缩数据矩阵S和随机高斯矩阵Q之间的相对熵,得到优化的低维的综合压缩数据矩阵Y。
步骤7,构造综合压缩数据矩阵S和图像训练数据矩阵VX之间的近邻图模型,得到综合压缩数据矩阵S和图像训练数据矩阵VX之间的近邻关系矩阵RX。
(7a)将综合压缩数据矩阵S每个数据点作为节点,求得每个节点到图像训练数据矩阵VX所有数据点的欧氏距离dX,合并所有欧氏距离得到训练数据距离矩阵DX;
(7b)将训练数据距离矩阵DX每行中的最小的5个值保持不变,每行中其余的所有值设置为1×106,得到综合压缩数据矩阵S的欧氏训练数据近邻矩阵OX;
(7c)通过相似度公式求得欧氏训练数据近邻矩阵OX任意矩阵元素的相似度mX,并将相似度mX组合,得到图像训练数据相似度矩阵ZX,其中σ=0.9;
(7d)对图像训练数据相似度矩阵ZX进行归一化处理,得到综合压缩数据矩阵和图像训练数据矩阵之间的近邻关系矩阵RX。
步骤8,将综合压缩数据矩阵和图像训练数据矩阵之间的近邻关系矩阵RX与低维的综合压缩数据矩阵Y相乘,得到图像训练数据流形嵌入矩阵EX。
步骤9,构造综合压缩数据矩阵S和图像测试数据矩阵VT之间的近邻图,得到综合压缩数据矩阵和图像测试数据矩阵之间的近邻关系矩阵RT。
(9a)将综合压缩数据矩阵S每个数据点作为节点,求得每个节点到图像测试数据矩阵VT所有数据点的欧氏距离dT,合并所有欧氏距离得到测试数据距离矩阵DT;
(9b)将测试数据距离矩阵DT每行中的最小的5个值保持不变,每行中其余的所有值设置为1×106,得到综合压缩数据矩阵S的欧氏测试数据近邻矩阵OT;
(9c)通过相似度公式求得欧氏测试数据近邻矩阵OT任意矩阵元素的相似度mT,并将相似度mT组合,得到图像测试数据相似度矩阵ZT,其中σ=0.9;
(9d)对图像测试数据相似度矩阵ZT进行归一化处理,得到综合压缩数据矩阵和图像测试数据矩阵之间的近邻关系矩阵RT。
步骤10,将综合压缩数据矩阵和图像测试数据矩阵之间的近邻关系矩阵RT与低维的综合压缩数据矩阵Y相乘,得到图像训练数据流形嵌入矩阵ET。
步骤11,将图像训练数据流形嵌入矩阵EX和图像测试数据流形嵌入矩阵ET进行阈值化,分别得到训练数据矩阵的哈希码BX和测试数据的哈希码BT。
(11a)将图像训练数据流形嵌入矩阵EX中大于等于0的元素赋值为1,小于0的元素赋值为0,从而得到图像训练数据矩阵的哈希码BX;
(11b)将图像测试数据流形嵌入矩阵ET中大于等于0的元素赋值为1,小于0的元素赋值为0,从而得到图像测试数据矩阵的哈希码BT。
步骤12,求取汉明向量。
(12a)从测试数据矩阵的哈希码BT中取其中的一个测试数据的哈希码b,将该图像测试数据的哈希码b与每一个图像训练数据的哈希码进行异或处理,得到哈希码中不同编码值的位数;
(12b)将不同编码值的位数作为汉明距离进行组合,得到汉明距离向量。
步骤13,将汉明距离向量中的数值按从小到大的顺序排序,输出对应的原始图像,得到检索结果。
本发明的效果结合以下仿真实验进一步说明:
1.仿真条件
本发明是在中央处理器为Intel(R)Core i5-34702.80GHZ、内存8G、WINDOWS 7操作系统上,运用MATLAB软件进行的实验仿真。
2.仿真内容
将本发明的方法与现有四种哈希方法进行了对比,这四种方法分别是:局部敏感哈希LSH方法、迭代量化ITQ方法、谱哈希SH方法、主成分分析哈希PCAH方法。
仿真实验中,分别画出数据检索的查准率-查全率曲线和平均准确率曲线去评估图像检索性能。其中,查准率:在某具体汉明距离中,查询得到的与查询点相关的图像数据点个数和所有的查询得到的图像数据点个数之比。查全率:在某具体汉明距离中,查询得到的与查询点相关的图像数据点个数和数据集中与查询点相关的全部图像数据点个数之比。
仿真1:在MNIST数据库下分别采用本发明方法和现有四种哈希方法进行查准率-查全率、平均准确率的对比实验,实验结果如图2所示。其中,
图2(a)为哈希编码长度取24位的查全率-查准率曲线图,横轴表示查全率,纵轴表示查准率。
图2(b)为哈希编码长度取32位的查全率-查准率曲线图,横轴表示查全率,纵轴表示查准率。
图2(c)为哈希编码长度取48位的查全率-查准率曲线图,横轴表示查全率,纵轴表示查准率。
图2(d)为各个不同哈希编码长度下平均准确率曲线图,横轴表示哈希编码长度,纵轴表示平均准确率。
仿真2:在CIFAR-10数据库下分别采用本发明方法和现有四种哈希方法进行查准率-查全率、平均准确率的对比实验,实验结果如图3所示。其中,
图3(a)为哈希编码长度取16位的查全率-查准率曲线图,横轴表示查全率,纵轴表示查准率。
图3(b)为哈希编码长度取24位的查全率-查准率曲线图,横轴表示查全率,纵轴表示查准率。
图3(c)为哈希编码长度取32位的查全率-查准率曲线图,横轴表示查全率,纵轴表示查准率。
图3(d)为各个不同哈希编码长度下平均准确率曲线图,横轴表示哈希编码长度,纵轴表示平均准确率。
3.仿真结果分析
由图2和图3的仿真结果可见,采用本发明进行图像检索的查全率-查准率性能及平均准确率性能都优于现有的哈希方法。因此,与现有技术相比,本发明利用流形学习方法,使得在低维流形空间中保存了高维数据的近邻结构,并且运用数据压缩算法学习到综合压缩数据集来替代原始数据集,能有效获取原始图像数据的哈希码,减少寻找相似最近邻数据点的时间,从而提高了图像检索的性能。
Claims (8)
1.一种基于流形学习数据压缩哈希的图像检索方法,包括如下步骤:
(1)调用图像数据库中原始图像,对原始图像数据进行特征提取,得到图像特征数据;
(2)对图像特征数据做归一化处理,得到归一化数据矩阵;
(3)从归一化数据矩阵中随机选取五分之一的数据矩阵作为图像测试数据矩阵VT,其余的数据矩阵作为图像训练数据矩阵VX;
(4)对图像训练数据矩阵VX进行随机近邻压缩,得到图像训练数据矩阵VX的综合压缩数据矩阵S:
4a)在图像训练数据矩阵VX中随机选取400个数据点,作为图像训练数据矩阵初始的综合压缩数据矩阵S';
4b)通过随机近邻压缩算法不断优化图像训练数据矩阵初始的综合压缩数据矩阵S',得到优化的综合压缩数据矩阵S;
(5)对综合压缩数据矩阵S进行t分布随机近邻嵌入,得到低维的综合压缩数据矩阵Y;
(6)构造低维的综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻图,得到综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻关系矩阵RX:
6a)根据低维的综合压缩数据矩阵Y和图像训练数据矩阵VX,求得这两个矩阵两两数据点之间的相似度,并用这些相似度组合成相似度矩阵ZX;
6b)对相似度矩阵ZX进行归一化处理,得到综合压缩数据矩阵和图像训练数据矩阵之间的近邻关系矩阵RX;
(7)将低维的综合压缩数据矩阵Y和图像训练数据矩阵VX之间的近邻关系矩阵RX与低维的综合压缩数据矩阵Y进行相乘,得到图像训练数据流形嵌入矩阵EX;
(8)构造低维的综合压缩数据矩阵Y和图像测试数据矩阵VT之间的近邻图,得到综合压缩数据矩阵和图像测试数据矩阵之间的近邻关系矩阵RT;
(9)将综合压缩数据矩阵Y和图像测试数据矩阵VT之间的近邻关系矩阵RT和低维的综合压缩数据矩阵Y进行相乘,得到图像测试数据流形嵌入矩阵ET;
(10)将图像训练数据流形嵌入矩阵EX和图像测试数据流形嵌入矩阵ET进行阈值化,分别得到训练数据矩阵的哈希码BX和测试数据的哈希码BT;
(11)从测试数据矩阵的哈希码BT中取其中的一个测试数据的哈希码,计算该哈希码与训练数据矩阵的哈希码BX之间的汉明距离,得到汉明距离向量;
(12)将汉明距离向量中的数值按从小到大的顺序排序,输出对应的原始图像,得到检索结果。
2.根据权利要求1所述的基于流形学习数据压缩哈希的图像检索方法,其特征在于,步骤(1)所述的对原始图像数据进行特征提取,按如下步骤进行:
(1a)对每一张原始图像3个颜色通道的像素值取均值,得到该原始图像数据的灰度图像;
(1b)利用Gabor滤波器对灰度图像进行4个尺度、8个方向的滤波,得到灰度图像的32个特征图;
(1c)将每个特征图分成大小为4×4的子网格,分别对每个子网格中的所有像素取均值,将该均值排列在一个向量中,得到图像的特征数据。
3.根据权利要求1所述的基于流形学习数据压缩哈希的图像检索方法,其特征在于,步骤(2)所述的对图像特征数据做归一化处理,按如下步骤进行:
(2a)对图像特征数据取均值,用图像特征数据中的每个图像特征数据分别减去该均值,得到相应的图像特征数据的中心化向量;
(2b)对每个图像特征数据中心化向量的各个分量的平方和开根号得到该向量的模;
(2c)用每个图像特征数据中心化向量除以该向量的模,得到每个图像特征数据的归一化向量。
4.根据权利要求1所述的基于流形学习数据压缩哈希的图像检索方法,其特征在于,步骤(4b)所述的用随机近邻压缩算法优化图像训练数据矩阵初始的综合压缩数据矩阵S',得到优化的综合压缩数据矩阵S,按如下步骤进行:
(4b1)计算图像训练数据矩阵VX中任意点和初始的综合压缩数据矩阵S'中任意点之间的欧氏距离d°;
(4b2)根据数据点之间的欧氏距离d°,通过相似度公式求得图像特征数据矩阵VX与初始的综合压缩数据矩阵S'之间任意两点之间的相似度u,并将任意两点之间的相似度u组合成相似度矩阵W,其中σ=0.9;
(4b3)对相似度矩阵W做归一化处理,得到相似度概率分布矩阵P;
(4b4)根据相似度概率分布矩阵P,通过最小化LKL(S)=-Σlog(P),得到最优的图像训练数据矩阵的综合压缩数据矩阵S。
5.根据权利要求1所述的基于流形学习数据压缩哈希的图像检索方法,其特征在于,所述步骤(6a)中求得低维的综合压缩数据矩阵Y和图像训练数据矩阵VX两矩阵两两数据点之间的相似度,并用这些相似度组合成相似度矩阵ZX,按如下步骤进行:
(6a1)将综合压缩数据矩阵S每个数据点作为节点,求得每个节点到图像训练数据矩阵VX所有数据点的欧氏距离dX,合并所有欧氏距离得到训练距离矩阵DX;
(6a2)将训练距离矩阵DX每行中的最小的5个值保持不变,将训练距离矩阵DX其余的所有值设置为1×106,得到综合压缩数据矩阵S的欧氏训练近邻矩阵OX;
(6a3)通过高斯核函数求得欧氏训练近邻矩阵OX任意矩阵元素的相似度mX,将相似度mX组合,得到图像训练数据相似度矩阵ZX,其中σ=0.9。
6.根据权利要求1所述的基于流形学习数据压缩哈希的图像检索方法,其特征在于,所述步骤(10)中获得图像训练数据矩阵的哈希码BX,是将图像训练数据流形嵌入矩阵EX中大于等于0的元素赋值为1,小于0的元素赋值为0,得到图像训练数据矩阵VX的哈希码BX。
7.根据权利要求1所述的基于流形学习数据压缩哈希的图像检索方法,其特征在于,所述步骤(10)中获得图像测试数据矩阵的哈希码BT,是将图像测试数据流形嵌入矩阵ET中大于等于0的元素赋值为1,小于0的元素赋值为0,得到图像测试数据矩阵VT的哈希码BT。
8.根据权利要求1所述的基于流形学习数据压缩哈希的图像检索方法,其特征在于,所述步骤(11)中计算一个测试数据哈希码与训练数据矩阵的哈希码BX之间的汉明距离,是将该图像测试数据的哈希编码与每一个图像训练数据的哈希编码进行异或处理,得到哈希编码中不同编码值的位数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510250462.3A CN104881449B (zh) | 2015-05-15 | 2015-05-15 | 基于流形学习数据压缩哈希的图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510250462.3A CN104881449B (zh) | 2015-05-15 | 2015-05-15 | 基于流形学习数据压缩哈希的图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104881449A true CN104881449A (zh) | 2015-09-02 |
CN104881449B CN104881449B (zh) | 2018-03-06 |
Family
ID=53948943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510250462.3A Active CN104881449B (zh) | 2015-05-15 | 2015-05-15 | 基于流形学习数据压缩哈希的图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104881449B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740893A (zh) * | 2016-01-27 | 2016-07-06 | 大连楼兰科技股份有限公司 | 一种基于流形的车辆特征提取识别算法 |
CN105843555A (zh) * | 2016-03-18 | 2016-08-10 | 南京邮电大学 | 分布式存储中基于随机梯度下降的谱哈希方法 |
CN106204451A (zh) * | 2016-07-08 | 2016-12-07 | 西安电子科技大学 | 基于约束固定邻域嵌入的图像超分辨重建方法 |
CN106484782A (zh) * | 2016-09-18 | 2017-03-08 | 重庆邮电大学 | 一种基于多核哈希学习的大规模医学图像检索方法 |
CN107423309A (zh) * | 2016-06-01 | 2017-12-01 | 国家计算机网络与信息安全管理中心 | 基于模糊哈希算法的海量互联网相似图片检测系统及方法 |
CN107481232A (zh) * | 2017-08-17 | 2017-12-15 | 上海华力微电子有限公司 | 图形匹配方法 |
CN107506400A (zh) * | 2017-08-02 | 2017-12-22 | 大连理工大学 | 一种基于认知特征和流形排序的图像检索方法 |
CN115658307A (zh) * | 2022-10-26 | 2023-01-31 | 中国人民大学 | 一种基于压缩数据直接计算的智能负载处理方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070217676A1 (en) * | 2006-03-15 | 2007-09-20 | Kristen Grauman | Pyramid match kernel and related techniques |
CN103412960A (zh) * | 2013-08-31 | 2013-11-27 | 西安电子科技大学 | 基于双边随机投影的图像感知哈希方法 |
CN104182538A (zh) * | 2014-09-01 | 2014-12-03 | 西安电子科技大学 | 基于半监督哈希的图像检索方法 |
CN104317902A (zh) * | 2014-10-24 | 2015-01-28 | 西安电子科技大学 | 基于局部保持迭代量化哈希的图像检索方法 |
-
2015
- 2015-05-15 CN CN201510250462.3A patent/CN104881449B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070217676A1 (en) * | 2006-03-15 | 2007-09-20 | Kristen Grauman | Pyramid match kernel and related techniques |
CN103412960A (zh) * | 2013-08-31 | 2013-11-27 | 西安电子科技大学 | 基于双边随机投影的图像感知哈希方法 |
CN104182538A (zh) * | 2014-09-01 | 2014-12-03 | 西安电子科技大学 | 基于半监督哈希的图像检索方法 |
CN104317902A (zh) * | 2014-10-24 | 2015-01-28 | 西安电子科技大学 | 基于局部保持迭代量化哈希的图像检索方法 |
Non-Patent Citations (1)
Title |
---|
张贝贝: "基于内容的图像检索若干关键问题研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740893A (zh) * | 2016-01-27 | 2016-07-06 | 大连楼兰科技股份有限公司 | 一种基于流形的车辆特征提取识别算法 |
CN105843555A (zh) * | 2016-03-18 | 2016-08-10 | 南京邮电大学 | 分布式存储中基于随机梯度下降的谱哈希方法 |
CN105843555B (zh) * | 2016-03-18 | 2018-11-02 | 南京邮电大学 | 分布式存储中基于随机梯度下降的谱哈希方法 |
CN107423309A (zh) * | 2016-06-01 | 2017-12-01 | 国家计算机网络与信息安全管理中心 | 基于模糊哈希算法的海量互联网相似图片检测系统及方法 |
CN106204451B (zh) * | 2016-07-08 | 2019-04-23 | 西安电子科技大学 | 基于约束固定邻域嵌入的图像超分辨重建方法 |
CN106204451A (zh) * | 2016-07-08 | 2016-12-07 | 西安电子科技大学 | 基于约束固定邻域嵌入的图像超分辨重建方法 |
CN106484782A (zh) * | 2016-09-18 | 2017-03-08 | 重庆邮电大学 | 一种基于多核哈希学习的大规模医学图像检索方法 |
CN106484782B (zh) * | 2016-09-18 | 2019-11-12 | 重庆邮电大学 | 一种基于多核哈希学习的大规模医学图像检索方法 |
CN107506400A (zh) * | 2017-08-02 | 2017-12-22 | 大连理工大学 | 一种基于认知特征和流形排序的图像检索方法 |
CN107506400B (zh) * | 2017-08-02 | 2019-06-25 | 大连理工大学 | 一种基于认知特征和流形排序的图像检索方法 |
CN107481232A (zh) * | 2017-08-17 | 2017-12-15 | 上海华力微电子有限公司 | 图形匹配方法 |
CN115658307A (zh) * | 2022-10-26 | 2023-01-31 | 中国人民大学 | 一种基于压缩数据直接计算的智能负载处理方法和系统 |
CN115658307B (zh) * | 2022-10-26 | 2023-04-18 | 中国人民大学 | 一种基于压缩数据直接计算的智能负载处理方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104881449B (zh) | 2018-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104881449B (zh) | 基于流形学习数据压缩哈希的图像检索方法 | |
CN104317902B (zh) | 基于局部保持迭代量化哈希的图像检索方法 | |
Hong et al. | Combining LBP difference and feature correlation for texture description | |
CN104182538B (zh) | 基于半监督哈希的图像检索方法 | |
Gu et al. | Clustering-driven unsupervised deep hashing for image retrieval | |
CN108491430B (zh) | 一种基于对特征方向进行聚类的无监督哈希检索方法 | |
KR101581112B1 (ko) | 계층적 패턴 구조에 기반한 기술자 생성 방법 및 이를 이용한 객체 인식 방법과 장치 | |
CN108984642B (zh) | 一种基于哈希编码的印花织物图像检索方法 | |
CN113918753B (zh) | 基于人工智能的图像检索方法及相关设备 | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
Wei et al. | Projected residual vector quantization for ANN search | |
CN108021908B (zh) | 人脸年龄段识别方法及装置、计算机装置及可读存储介质 | |
CN111125469B (zh) | 一种社交网络的用户聚类方法、装置以及计算机设备 | |
CN112434553B (zh) | 一种基于深度字典学习的视频鉴别方法及系统 | |
CN104036012A (zh) | 字典学习、视觉词袋特征提取方法及检索系统 | |
CN106780639B (zh) | 基于显著性特征稀疏嵌入和极限学习机的哈希编码方法 | |
CN106033426A (zh) | 一种基于潜在语义最小哈希的图像检索方法 | |
CN104199923A (zh) | 基于最优k均值哈希算法的大规模图像库检索方法 | |
CN105740428B (zh) | 一种基于b+树的高维磁盘索引结构和图像检索方法 | |
CN110110120B (zh) | 一种基于深度学习的图像检索方法和装置 | |
CN114996493A (zh) | 一种基于数据清除消冗的电力场景图像数据筛选方法 | |
Chen et al. | Image retrieval based on quadtree classified vector quantization | |
CN110674334B (zh) | 基于一致性区域深度学习特征的近重复图像检索方法 | |
CN116246086A (zh) | 一种图像聚类方法、装置、电子设备及存储介质 | |
CN104484418B (zh) | 一种基于双分辨率的特征量化方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |