CN106650829B - 一种图片相似度计算方法 - Google Patents
一种图片相似度计算方法 Download PDFInfo
- Publication number
- CN106650829B CN106650829B CN201710003657.7A CN201710003657A CN106650829B CN 106650829 B CN106650829 B CN 106650829B CN 201710003657 A CN201710003657 A CN 201710003657A CN 106650829 B CN106650829 B CN 106650829B
- Authority
- CN
- China
- Prior art keywords
- hash
- pictures
- dct
- value
- grayscale image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图片相似度计算方法,包括:(1)用基于DCT的hash方法分别计算待比较的两个图片的hash值;(2)计算两个hash值之间的汉明距离dis_h;(3)若汉明距离不在设定范围内,直接通过公式计算两图片的相似度;(4)若汉明距离在设定范围内,再用基于径向投影的hash方法计算hash值;(5)计算上一步得到的hash值的皮尔逊相关系数,并结合第二步得到的汉明距离计算两图片的相似度。本发明对图像旋转有一定的鲁棒性、避免伽马校正或颜色直方图被调整带来的影响,提高了图片相似度结果的准确率。
Description
技术领域
本发明涉及计算机算法领域,具体涉及一种图片相似度计算方法,可应用于相似图片检索、视频关键帧相似度的计算。
背景技术
目前,图片相似度计算广泛应用于相似图片搜索、视频相似度计算等领域,pHash方法作为图片相似度计算的主要方法之一,主要有基于DCT的hash方法和基于径向投影的hash方法。两种方法是从不同角度来表达图像,最后通过计算两图片hash值的汉明距离来计算相似度。
方法一基于DCT的hash方法的思路是使用离散余弦变换(DCT)提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,只要图片的整体结构保持不变,指纹就不变,能够避免伽马校正或颜色直方图被调整带来的影响,最后通过计算两图片指纹的汉明距离来得到相似度。
方法二基于径向投影的hash方法的思路是首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,最后通过计算两指纹间的皮尔逊相关系数来得到两图片间的相似度。此方法可以保留图像中的几何特征,且对图像旋转有一定的鲁棒性,但由于需要计算皮尔逊相关系数,计算速度比方法一慢。
但是这两种方法均是通过单一的pHash算法计算图片相似度,经常会出现内容截然不同的图片间计算得到的相似度非常高的情况,极有可能产生误判,不能保证结果的准确性。
发明内容
本发明的目的是针对上述现有技术的不足,提供了一种图片相似度计算方法,该方法将基于DCT的hash方法和基于径向投影的hash方法融合来计算图片的相似度,解决了相似图片搜索、视频关键帧相似度计算领域中单一pHash方法算得不同内容图片的相似度非常高、图片相似度结果不够准确的问题。
本发明的目的可以通过如下技术方案实现:
一种图片相似度计算方法,所述方法包括以下步骤:
1)用基于DCT的hash方法分别计算待比较的两张图片的hash值h_a与h_b;
2)计算步骤1)中两张图片的hash值h_a与h_b之间的汉明距离dis_h;
3)若汉明距离dis_h不在设定范围10<dis_h<25内,直接通过公式计算两张图片的相似度P,所述公式为:
4)若汉明距离dis_h在设定范围10<dis_h<25内,再用基于径向投影的hash方法分别计算两张图片的hash值h2_a与h2_b;
5)计算步骤4)得到的两张图片的hash值h2_a与h2_b之间的皮尔逊相关系数pcc,并结合步骤2)得到的汉明距离dis_h计算两张图片的相似度P。
优选的,步骤1)中,所述基于DCT的hash方法使用离散余弦变换提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,所述基于DCT的hash方法包括以下具体步骤:
一、将图片缩小到32*32并灰度化得到灰度图,以减小计算量;
二、计算步骤一得到的灰度图的DCT变换,得到32*32的系数矩阵,所述DCT变换公式为:
其中,F(u,v)是灰度图的DCT系数矩阵,u、v分别是灰度图在频域中水平方向和竖直方向的频率,f(i,j)为灰度图中坐标(i,j)处的像素值,N是灰度图的边长,此处N=32;
三、取步骤二得到的32*32的系数矩阵左上角的8*8矩阵,计算该8*8矩阵的均值avg;
四、对步骤三得到的8*8矩阵的每一个元素,大于等于avg的置1,小于avg的置0;
五、按固定顺序将步骤四得到的8*8矩阵拉伸成1*64的hash值。
优选的,步骤2)中两张图片的hash值h_a与h_b之间的汉明距离dis_h取值范围在0~64之间。
优选的,步骤4)中,所述基于径向投影的hash方法首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,所述基于径向投影的hash方法包括以下具体步骤:
(1)将图片转化为灰度图;
(2)过步骤(1)得到的灰度图中心等角度取180条直线,计算每条直线上像素点的方差,180个方差构成一个特征向量;
(3)计算上述特征向量的DCT变换,得到DCT系数向量;
(4)取前64个DCT系数向量构成新向量,计算新向量的均值avg2;
(5)对新向量中的每个元素,大于等于avg2的置1,小于avg2的置0,得到的新向量即hash值。
优选的,步骤5)中,所述计算两张图片的hash值h2_a与h2_b的皮尔逊相关系数pcc的具体公式如下:
其中,X、Y分别代指两张图片的hash值h2_a与h2_b,ρX,Y是h2_a与h2_b的皮尔逊相关系数;
通过以下公式结合汉明距离dis_h和皮尔逊相关系数pcc,得到图片相似度P:
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用了将“基于DCT的hash方法”和“基于径向投影的hash方法”融合后进行图片相似度计算的方案,该方案通过使用两种不同方法计算图片的hash值并计算不同方案下的图片相似度dis_h、pcc,然后综合dis_h、pcc计算出图像的相似度,结合了两种方法的优点,从而在不降低计算速度的同时,极大的提高了图片相似度结果的准确率。
2、本发明从多角度提取图像特征并计算图像相似度,鲁棒性强,可用于各类图像。
附图说明
图1为本发明实施例的一种图片相似度计算方法的具体流程图。
图2为本发明实施例的一种图片相似度计算方法中步骤1)的方法流程图。
图3为本发明实施例的一种图片相似度计算方法中步骤4)的方法流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例:
本实施例提供了一种图片相似度计算方法,如图1所示,为该方法的具体流程图,该方法包括以下步骤:
1)用基于DCT的hash方法分别计算待比较的两张图片的hash值h_a与h_b;
本步骤中,所述基于DCT的hash方法使用离散余弦变换提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,所述基于DCT的hash方法流程图如图2所示,包括以下具体步骤:
一、将图片缩小到32*32并灰度化得到灰度图,以减小计算量;
二、计算步骤一得到的灰度图的DCT变换,得到32*32的系数矩阵,所述DCT变换公式为:
其中,F(u,v)是灰度图的DCT系数矩阵,u、v分别是灰度图在频域中水平方向和竖直方向的频率,f(i,j)为灰度图中坐标(i,j)处的像素值,N是灰度图的边长,此处N=32;
三、取步骤二得到的32*32的系数矩阵左上角的8*8矩阵,计算该8*8矩阵的均值avg;
四、对步骤三得到的8*8矩阵的每一个元素,大于等于avg的置1,小于avg的置0;
五、按固定顺序将步骤四得到的8*8矩阵拉伸成1*64的hash值。
2)计算步骤1)中两张图片的hash值h_a与h_b之间的汉明距离dis_h;
本步骤中两张图片的hash值h_a与h_b之间的汉明距离dis_h取值范围在0~64之间。
3)若汉明距离dis_h不在设定范围10<dis_h<25内,直接通过公式计算两张图片的相似度P,所述公式为:
4)若汉明距离dis_h在设定范围10<dis_h<25内,再用基于径向投影的hash方法分别计算两张图片的hash值h2_a与h2_b;
本步骤中,所述基于径向投影的hash方法首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,所述基于径向投影的hash方法流程图如图3所示,包括以下具体步骤:
(1)将图片转化为灰度图;
(2)过步骤(1)得到的灰度图中心等角度取180条直线,计算每条直线上像素点的方差,180个方差构成一个特征向量;
(3)计算上述特征向量的DCT变换,得到DCT系数向量;
(4)取前64个DCT系数向量构成新向量,计算新向量的均值avg2;
(5)对新向量中的每个元素,大于等于avg2的置1,小于avg2的置0,得到的新向量即hash值。
5)计算步骤4)得到的两张图片的hash值h2_a与h2_b之间的皮尔逊相关系数pcc,并结合步骤2)得到的汉明距离dis_h计算两张图片的相似度P;
本步骤中,所述计算两张图片的hash值h2_a与h2_b的皮尔逊相关系数pcc的具体公式如下:
其中,X、Y分别代指两张图片的hash值h2_a与h2_b,ρX,Y是h2_a与h2_b的皮尔逊相关系数;
通过以下公式结合汉明距离dis_h和皮尔逊相关系数pcc,得到图片相似度P:
以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。
Claims (3)
1.一种图片相似度计算方法,其特征在于:所述方法包括以下步骤:
1)用基于DCT的hash方法分别计算待比较的两张图片的hash值h_a与h_b;
2)计算步骤1)中两张图片的hash值h_a与h_b之间的汉明距离dis_h;
3)若汉明距离dis_h不在设定范围10<dis_h<25内,直接通过公式计算两张图片的相似度P,所述公式为:
4)若汉明距离dis_h在设定范围10<dis_h<25内,再用基于径向投影的hash方法分别计算两张图片的hash值h2_a与h2_b;
所述基于径向投影的hash方法首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,包括以下具体步骤:
(1)将图片转化为灰度图;
(2)过步骤(1)得到的灰度图中心等角度取180条直线,计算每条直线上像素点的方差,180个方差构成一个特征向量;
(3)计算上述特征向量的DCT变换,得到DCT系数向量;
(4)取前64个DCT系数向量构成新向量,计算新向量的均值avg2;
(5)对新向量中的每个元素,大于等于avg2的置1,小于avg2的置0,得到的新向量即hash值;
5)计算步骤4)得到的两张图片的hash值h2_a与h2_b之间的皮尔逊相关系数pcc,并结合步骤2)得到的汉明距离dis_h计算两张图片的相似度P;
所述计算两张图片的hash值h2_a与h2_b的皮尔逊相关系数pcc的具体公式如下:
其中,X、Y分别代指两张图片的hash值h2_a与h2_b,ρX,Y是h2_a与h2_b的皮尔逊相关系数;
通过以下公式结合汉明距离dis_h和皮尔逊相关系数pcc,得到图片相似度P:
2.根据权利要求1所述的一种图片相似度计算方法,其特征在于:步骤1)中,所述基于DCT的hash方法使用离散余弦变换提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,所述基于DCT的hash方法包括以下具体步骤:
一、将图片缩小到32*32并灰度化得到灰度图,以减小计算量;
二、计算步骤一得到的灰度图的DCT变换,得到32*32的系数矩阵,所述DCT变换公式为:
其中,F(u,v)是灰度图的DCT系数矩阵,u、v分别是灰度图在频域中水平方向和竖直方向的频率,f(i,j)为灰度图中坐标(i,j)处的像素值,N是灰度图的边长,此处N=32;
三、取步骤二得到的32*32的系数矩阵左上角的8*8矩阵,计算该8*8矩阵的均值avg;
四、对步骤三得到的8*8矩阵的每一个元素,大于等于avg的置1,小于avg的置0;
五、按固定顺序将步骤四得到的8*8矩阵拉伸成1*64的hash值。
3.根据权利要求1所述的一种图片相似度计算方法,其特征在于:步骤2)中两张图片的hash值h_a与h_b之间的汉明距离dis_h取值范围在0~64之间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710003657.7A CN106650829B (zh) | 2017-01-04 | 2017-01-04 | 一种图片相似度计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710003657.7A CN106650829B (zh) | 2017-01-04 | 2017-01-04 | 一种图片相似度计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106650829A CN106650829A (zh) | 2017-05-10 |
CN106650829B true CN106650829B (zh) | 2019-07-16 |
Family
ID=58842642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710003657.7A Active CN106650829B (zh) | 2017-01-04 | 2017-01-04 | 一种图片相似度计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106650829B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967478A (zh) * | 2017-12-08 | 2018-04-27 | 奕响(大连)科技有限公司 | 一种简化dct像素灰度图片相似判定方法 |
CN108052969A (zh) * | 2017-12-08 | 2018-05-18 | 奕响(大连)科技有限公司 | 一种dct像素灰度图片相似判定方法 |
CN107909076A (zh) * | 2017-12-11 | 2018-04-13 | 奕响(大连)科技有限公司 | 一种基于lbp的图片相似判定方法 |
CN108052972A (zh) * | 2017-12-11 | 2018-05-18 | 奕响(大连)科技有限公司 | 一种双拼的单通道的图片相似判定方法 |
CN108052971A (zh) * | 2017-12-11 | 2018-05-18 | 奕响(大连)科技有限公司 | 一种基于hog改进的图片相似判定方法 |
CN107907995B (zh) * | 2017-12-22 | 2020-05-01 | 深圳市易瞳科技有限公司 | 一种基于双成像设备的三维景深的计算方法及系统 |
CN108492280A (zh) * | 2018-03-02 | 2018-09-04 | 广州坚和网络科技有限公司 | 一种自动判断数字图片质量的装置及方法 |
CN108536827B (zh) * | 2018-04-11 | 2021-09-03 | 南京理工大学 | 一种相似频谱图片搜索方法 |
CN109491888A (zh) * | 2018-09-29 | 2019-03-19 | 中国平安人寿保险股份有限公司 | 应用程序兼容性测试方法、装置、及计算机可读存储介质 |
CN109409245A (zh) * | 2018-09-30 | 2019-03-01 | 江苏满运软件科技有限公司 | 身份核验方法、系统、电子设备和存储介质 |
CN109447154B (zh) * | 2018-10-29 | 2021-06-04 | 网易(杭州)网络有限公司 | 图片相似度检测方法、装置、介质及电子设备 |
CN109685112A (zh) * | 2018-11-29 | 2019-04-26 | 昆明理工大学 | 一种基于颜色差值算法和DHash的图像相似判定方法 |
CN109670070B (zh) * | 2018-11-29 | 2022-07-29 | 昆明理工大学 | 一种基于双重Hash的图像相似判定方法 |
CN109685114B (zh) * | 2018-11-29 | 2022-04-15 | 昆明理工大学 | 一种基于预筛选法和PHash的图像相似判定方法 |
CN109961530B (zh) * | 2019-01-16 | 2024-03-08 | 深圳市武智科技有限公司 | 基于图像识别的考勤方法、装置、计算机设备及存储介质 |
CN109934262B (zh) * | 2019-01-31 | 2023-08-22 | 平安科技(深圳)有限公司 | 图片差异性判断方法、装置、计算机设备和存储介质 |
CN110929793A (zh) * | 2019-11-27 | 2020-03-27 | 谢国宇 | 用于生态环境监测的时空域模型建模方法及系统 |
CN113704532B (zh) * | 2020-11-25 | 2024-04-26 | 天翼数字生活科技有限公司 | 一种提升图片检索召回率的方法和系统 |
CN112861954A (zh) * | 2021-02-01 | 2021-05-28 | 深圳无域科技技术有限公司 | 图片相似度计算方法、系统、设备及计算机可读介质 |
CN112836688B (zh) * | 2021-03-26 | 2023-09-26 | 广东电网有限责任公司江门供电局 | 瓦片图像的特征提取方法、装置、电子设备及存储介质 |
CN113281310B (zh) * | 2021-04-06 | 2022-12-02 | 安徽工程大学 | 一种光学介质材料的透光率和均匀度检测方法 |
CN113191661B (zh) * | 2021-05-17 | 2024-07-23 | 上海鑫尤视网络科技有限公司 | 广告监播的方法、装置、存储介质及处理器 |
CN113505690B (zh) * | 2021-07-09 | 2023-05-05 | 中国矿业大学(北京) | 一种实时的煤岩视觉识别方法 |
CN113520172A (zh) * | 2021-08-06 | 2021-10-22 | 广东福尔电子有限公司 | 一种耐压型电锅温度传感器侦测装置 |
CN114494729B (zh) * | 2022-04-02 | 2022-07-12 | 广州市开富信息科技有限责任公司 | 基于ai识别技术的汽车配件识别方法及装置 |
CN115797707B (zh) * | 2023-02-06 | 2023-05-05 | 威海海洋职业学院 | 一种基于计算机视觉的物品识别方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308567A (zh) * | 2008-06-21 | 2008-11-19 | 华中科技大学 | 一种基于内容的鲁棒图像拷贝检测方法 |
CN102509257A (zh) * | 2011-11-23 | 2012-06-20 | 上海交通大学 | 基于人类视觉特性压缩感知的灰度图像篡改检测方法 |
CN104091303A (zh) * | 2014-07-11 | 2014-10-08 | 湖南大学 | 一种基于Radon变换和不变特征的鲁棒图像哈希方法及其装置 |
CN104504120A (zh) * | 2014-12-29 | 2015-04-08 | 北京奇艺世纪科技有限公司 | 一种相似图片检测方法及装置 |
-
2017
- 2017-01-04 CN CN201710003657.7A patent/CN106650829B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308567A (zh) * | 2008-06-21 | 2008-11-19 | 华中科技大学 | 一种基于内容的鲁棒图像拷贝检测方法 |
CN102509257A (zh) * | 2011-11-23 | 2012-06-20 | 上海交通大学 | 基于人类视觉特性压缩感知的灰度图像篡改检测方法 |
CN104091303A (zh) * | 2014-07-11 | 2014-10-08 | 湖南大学 | 一种基于Radon变换和不变特征的鲁棒图像哈希方法及其装置 |
CN104504120A (zh) * | 2014-12-29 | 2015-04-08 | 北京奇艺世纪科技有限公司 | 一种相似图片检测方法及装置 |
Non-Patent Citations (3)
Title |
---|
A Short Survey on Perceptual Hash Function;Arambam Neelima;《ADBU Journal of Engineering Technology》;20141231;第1卷;第1-6页 |
关于对图像哈希算法的研究与应用;姚永明;《西安文理学院学报》;20160930;第19卷(第5期);第30-34页 |
基于数据投影降维机制与对称局部二值模式的紧凑图像哈希算法;王彦超;《激光与光电子学进展》;20161116;第1-12页 |
Also Published As
Publication number | Publication date |
---|---|
CN106650829A (zh) | 2017-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106650829B (zh) | 一种图片相似度计算方法 | |
CN109472267A (zh) | 图片相似度比对算法 | |
CN113034383B (zh) | 一种基于改进网格运动统计获取视频图像的方法 | |
CN103400142B (zh) | 一种行人计数方法 | |
CN107066969A (zh) | 一种人脸识别方法 | |
CN106875331B (zh) | 一种全景图像的非对称映射方法 | |
CN106534833B (zh) | 一种联合空间时间轴的双视点立体视频稳定方法 | |
CN104079800A (zh) | 一种视频监控中视频图像的抗抖动方法 | |
Wang et al. | An edge detection algorithm based on improved Canny operator | |
CN103714544B (zh) | 一种基于sift特征点匹配的优化方法 | |
CN104537663A (zh) | 一种图像抖动的快速校正方法 | |
CN114663344A (zh) | 一种基于图像融合的列车轮对踏面缺陷识别方法及装置 | |
CN109766896A (zh) | 一种相似度度量方法、装置、设备和存储介质 | |
CN109801273B (zh) | 一种基于极平面线性相似度的光场图像质量评价方法 | |
WO2023019699A1 (zh) | 一种基于3d人脸模型的俯角人脸识别方法及系统 | |
CN106021610B (zh) | 一种基于显著区域的视频指纹提取方法 | |
CN108961182A (zh) | 针对视频图像的竖直方向灭点检测方法及视频扭正方法 | |
Yang et al. | Contrast limited adaptive histogram equalization for an advanced stereo visual slam system | |
CN103093467A (zh) | 一种基于双重检测模型的镜头边界检测方法 | |
CN103902954A (zh) | 一种不良视频的鉴别方法和系统 | |
CN113255449A (zh) | 一种双目视频图像的实时匹配方法 | |
CN108010076B (zh) | 一种面向密集工业棒材图像检测的端面外观建模方法 | |
Yang et al. | Research and application of 3D face modeling algorithm based on ICP accurate alignment | |
Li et al. | An improved method for eliminating ghosting in image stitching | |
CN114283199B (zh) | 一种面向动态场景的点线融合语义slam方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |