CN106650829B - 一种图片相似度计算方法 - Google Patents

一种图片相似度计算方法 Download PDF

Info

Publication number
CN106650829B
CN106650829B CN201710003657.7A CN201710003657A CN106650829B CN 106650829 B CN106650829 B CN 106650829B CN 201710003657 A CN201710003657 A CN 201710003657A CN 106650829 B CN106650829 B CN 106650829B
Authority
CN
China
Prior art keywords
hash
pictures
dct
value
grayscale image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710003657.7A
Other languages
English (en)
Other versions
CN106650829A (zh
Inventor
胡丹
李楚怡
余卫宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201710003657.7A priority Critical patent/CN106650829B/zh
Publication of CN106650829A publication Critical patent/CN106650829A/zh
Application granted granted Critical
Publication of CN106650829B publication Critical patent/CN106650829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种图片相似度计算方法,包括:(1)用基于DCT的hash方法分别计算待比较的两个图片的hash值;(2)计算两个hash值之间的汉明距离dis_h;(3)若汉明距离不在设定范围内,直接通过公式计算两图片的相似度;(4)若汉明距离在设定范围内,再用基于径向投影的hash方法计算hash值;(5)计算上一步得到的hash值的皮尔逊相关系数,并结合第二步得到的汉明距离计算两图片的相似度。本发明对图像旋转有一定的鲁棒性、避免伽马校正或颜色直方图被调整带来的影响,提高了图片相似度结果的准确率。

Description

一种图片相似度计算方法
技术领域
本发明涉及计算机算法领域,具体涉及一种图片相似度计算方法,可应用于相似图片检索、视频关键帧相似度的计算。
背景技术
目前,图片相似度计算广泛应用于相似图片搜索、视频相似度计算等领域,pHash方法作为图片相似度计算的主要方法之一,主要有基于DCT的hash方法和基于径向投影的hash方法。两种方法是从不同角度来表达图像,最后通过计算两图片hash值的汉明距离来计算相似度。
方法一基于DCT的hash方法的思路是使用离散余弦变换(DCT)提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,只要图片的整体结构保持不变,指纹就不变,能够避免伽马校正或颜色直方图被调整带来的影响,最后通过计算两图片指纹的汉明距离来得到相似度。
方法二基于径向投影的hash方法的思路是首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,最后通过计算两指纹间的皮尔逊相关系数来得到两图片间的相似度。此方法可以保留图像中的几何特征,且对图像旋转有一定的鲁棒性,但由于需要计算皮尔逊相关系数,计算速度比方法一慢。
但是这两种方法均是通过单一的pHash算法计算图片相似度,经常会出现内容截然不同的图片间计算得到的相似度非常高的情况,极有可能产生误判,不能保证结果的准确性。
发明内容
本发明的目的是针对上述现有技术的不足,提供了一种图片相似度计算方法,该方法将基于DCT的hash方法和基于径向投影的hash方法融合来计算图片的相似度,解决了相似图片搜索、视频关键帧相似度计算领域中单一pHash方法算得不同内容图片的相似度非常高、图片相似度结果不够准确的问题。
本发明的目的可以通过如下技术方案实现:
一种图片相似度计算方法,所述方法包括以下步骤:
1)用基于DCT的hash方法分别计算待比较的两张图片的hash值h_a与h_b;
2)计算步骤1)中两张图片的hash值h_a与h_b之间的汉明距离dis_h;
3)若汉明距离dis_h不在设定范围10<dis_h<25内,直接通过公式计算两张图片的相似度P,所述公式为:
4)若汉明距离dis_h在设定范围10<dis_h<25内,再用基于径向投影的hash方法分别计算两张图片的hash值h2_a与h2_b;
5)计算步骤4)得到的两张图片的hash值h2_a与h2_b之间的皮尔逊相关系数pcc,并结合步骤2)得到的汉明距离dis_h计算两张图片的相似度P。
优选的,步骤1)中,所述基于DCT的hash方法使用离散余弦变换提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,所述基于DCT的hash方法包括以下具体步骤:
一、将图片缩小到32*32并灰度化得到灰度图,以减小计算量;
二、计算步骤一得到的灰度图的DCT变换,得到32*32的系数矩阵,所述DCT变换公式为:
其中,F(u,v)是灰度图的DCT系数矩阵,u、v分别是灰度图在频域中水平方向和竖直方向的频率,f(i,j)为灰度图中坐标(i,j)处的像素值,N是灰度图的边长,此处N=32;
三、取步骤二得到的32*32的系数矩阵左上角的8*8矩阵,计算该8*8矩阵的均值avg;
四、对步骤三得到的8*8矩阵的每一个元素,大于等于avg的置1,小于avg的置0;
五、按固定顺序将步骤四得到的8*8矩阵拉伸成1*64的hash值。
优选的,步骤2)中两张图片的hash值h_a与h_b之间的汉明距离dis_h取值范围在0~64之间。
优选的,步骤4)中,所述基于径向投影的hash方法首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,所述基于径向投影的hash方法包括以下具体步骤:
(1)将图片转化为灰度图;
(2)过步骤(1)得到的灰度图中心等角度取180条直线,计算每条直线上像素点的方差,180个方差构成一个特征向量;
(3)计算上述特征向量的DCT变换,得到DCT系数向量;
(4)取前64个DCT系数向量构成新向量,计算新向量的均值avg2;
(5)对新向量中的每个元素,大于等于avg2的置1,小于avg2的置0,得到的新向量即hash值。
优选的,步骤5)中,所述计算两张图片的hash值h2_a与h2_b的皮尔逊相关系数pcc的具体公式如下:
其中,X、Y分别代指两张图片的hash值h2_a与h2_b,ρX,Y是h2_a与h2_b的皮尔逊相关系数;
通过以下公式结合汉明距离dis_h和皮尔逊相关系数pcc,得到图片相似度P:
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用了将“基于DCT的hash方法”和“基于径向投影的hash方法”融合后进行图片相似度计算的方案,该方案通过使用两种不同方法计算图片的hash值并计算不同方案下的图片相似度dis_h、pcc,然后综合dis_h、pcc计算出图像的相似度,结合了两种方法的优点,从而在不降低计算速度的同时,极大的提高了图片相似度结果的准确率。
2、本发明从多角度提取图像特征并计算图像相似度,鲁棒性强,可用于各类图像。
附图说明
图1为本发明实施例的一种图片相似度计算方法的具体流程图。
图2为本发明实施例的一种图片相似度计算方法中步骤1)的方法流程图。
图3为本发明实施例的一种图片相似度计算方法中步骤4)的方法流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例:
本实施例提供了一种图片相似度计算方法,如图1所示,为该方法的具体流程图,该方法包括以下步骤:
1)用基于DCT的hash方法分别计算待比较的两张图片的hash值h_a与h_b;
本步骤中,所述基于DCT的hash方法使用离散余弦变换提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,所述基于DCT的hash方法流程图如图2所示,包括以下具体步骤:
一、将图片缩小到32*32并灰度化得到灰度图,以减小计算量;
二、计算步骤一得到的灰度图的DCT变换,得到32*32的系数矩阵,所述DCT变换公式为:
其中,F(u,v)是灰度图的DCT系数矩阵,u、v分别是灰度图在频域中水平方向和竖直方向的频率,f(i,j)为灰度图中坐标(i,j)处的像素值,N是灰度图的边长,此处N=32;
三、取步骤二得到的32*32的系数矩阵左上角的8*8矩阵,计算该8*8矩阵的均值avg;
四、对步骤三得到的8*8矩阵的每一个元素,大于等于avg的置1,小于avg的置0;
五、按固定顺序将步骤四得到的8*8矩阵拉伸成1*64的hash值。
2)计算步骤1)中两张图片的hash值h_a与h_b之间的汉明距离dis_h;
本步骤中两张图片的hash值h_a与h_b之间的汉明距离dis_h取值范围在0~64之间。
3)若汉明距离dis_h不在设定范围10<dis_h<25内,直接通过公式计算两张图片的相似度P,所述公式为:
4)若汉明距离dis_h在设定范围10<dis_h<25内,再用基于径向投影的hash方法分别计算两张图片的hash值h2_a与h2_b;
本步骤中,所述基于径向投影的hash方法首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,所述基于径向投影的hash方法流程图如图3所示,包括以下具体步骤:
(1)将图片转化为灰度图;
(2)过步骤(1)得到的灰度图中心等角度取180条直线,计算每条直线上像素点的方差,180个方差构成一个特征向量;
(3)计算上述特征向量的DCT变换,得到DCT系数向量;
(4)取前64个DCT系数向量构成新向量,计算新向量的均值avg2;
(5)对新向量中的每个元素,大于等于avg2的置1,小于avg2的置0,得到的新向量即hash值。
5)计算步骤4)得到的两张图片的hash值h2_a与h2_b之间的皮尔逊相关系数pcc,并结合步骤2)得到的汉明距离dis_h计算两张图片的相似度P;
本步骤中,所述计算两张图片的hash值h2_a与h2_b的皮尔逊相关系数pcc的具体公式如下:
其中,X、Y分别代指两张图片的hash值h2_a与h2_b,ρX,Y是h2_a与h2_b的皮尔逊相关系数;
通过以下公式结合汉明距离dis_h和皮尔逊相关系数pcc,得到图片相似度P:
以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (3)

1.一种图片相似度计算方法,其特征在于:所述方法包括以下步骤:
1)用基于DCT的hash方法分别计算待比较的两张图片的hash值h_a与h_b;
2)计算步骤1)中两张图片的hash值h_a与h_b之间的汉明距离dis_h;
3)若汉明距离dis_h不在设定范围10<dis_h<25内,直接通过公式计算两张图片的相似度P,所述公式为:
4)若汉明距离dis_h在设定范围10<dis_h<25内,再用基于径向投影的hash方法分别计算两张图片的hash值h2_a与h2_b;
所述基于径向投影的hash方法首先会过灰度图中心计算朝等角度间隔的180个方向上像素值的方差,然后计算由这180个方差构成的特征向量的DCT,并从DCT系数矩阵中提取出64位的hash值作为指纹,包括以下具体步骤:
(1)将图片转化为灰度图;
(2)过步骤(1)得到的灰度图中心等角度取180条直线,计算每条直线上像素点的方差,180个方差构成一个特征向量;
(3)计算上述特征向量的DCT变换,得到DCT系数向量;
(4)取前64个DCT系数向量构成新向量,计算新向量的均值avg2;
(5)对新向量中的每个元素,大于等于avg2的置1,小于avg2的置0,得到的新向量即hash值;
5)计算步骤4)得到的两张图片的hash值h2_a与h2_b之间的皮尔逊相关系数pcc,并结合步骤2)得到的汉明距离dis_h计算两张图片的相似度P;
所述计算两张图片的hash值h2_a与h2_b的皮尔逊相关系数pcc的具体公式如下:
其中,X、Y分别代指两张图片的hash值h2_a与h2_b,ρX,Y是h2_a与h2_b的皮尔逊相关系数;
通过以下公式结合汉明距离dis_h和皮尔逊相关系数pcc,得到图片相似度P:
2.根据权利要求1所述的一种图片相似度计算方法,其特征在于:步骤1)中,所述基于DCT的hash方法使用离散余弦变换提取图片的低频成分,先将图片转换成标准大小的灰度图,然后对灰度图做DCT变换,再从系数矩阵中提取出64位的hash值作为指纹,所述基于DCT的hash方法包括以下具体步骤:
一、将图片缩小到32*32并灰度化得到灰度图,以减小计算量;
二、计算步骤一得到的灰度图的DCT变换,得到32*32的系数矩阵,所述DCT变换公式为:
其中,F(u,v)是灰度图的DCT系数矩阵,u、v分别是灰度图在频域中水平方向和竖直方向的频率,f(i,j)为灰度图中坐标(i,j)处的像素值,N是灰度图的边长,此处N=32;
三、取步骤二得到的32*32的系数矩阵左上角的8*8矩阵,计算该8*8矩阵的均值avg;
四、对步骤三得到的8*8矩阵的每一个元素,大于等于avg的置1,小于avg的置0;
五、按固定顺序将步骤四得到的8*8矩阵拉伸成1*64的hash值。
3.根据权利要求1所述的一种图片相似度计算方法,其特征在于:步骤2)中两张图片的hash值h_a与h_b之间的汉明距离dis_h取值范围在0~64之间。
CN201710003657.7A 2017-01-04 2017-01-04 一种图片相似度计算方法 Active CN106650829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710003657.7A CN106650829B (zh) 2017-01-04 2017-01-04 一种图片相似度计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710003657.7A CN106650829B (zh) 2017-01-04 2017-01-04 一种图片相似度计算方法

Publications (2)

Publication Number Publication Date
CN106650829A CN106650829A (zh) 2017-05-10
CN106650829B true CN106650829B (zh) 2019-07-16

Family

ID=58842642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710003657.7A Active CN106650829B (zh) 2017-01-04 2017-01-04 一种图片相似度计算方法

Country Status (1)

Country Link
CN (1) CN106650829B (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967478A (zh) * 2017-12-08 2018-04-27 奕响(大连)科技有限公司 一种简化dct像素灰度图片相似判定方法
CN108052969A (zh) * 2017-12-08 2018-05-18 奕响(大连)科技有限公司 一种dct像素灰度图片相似判定方法
CN107909076A (zh) * 2017-12-11 2018-04-13 奕响(大连)科技有限公司 一种基于lbp的图片相似判定方法
CN108052972A (zh) * 2017-12-11 2018-05-18 奕响(大连)科技有限公司 一种双拼的单通道的图片相似判定方法
CN108052971A (zh) * 2017-12-11 2018-05-18 奕响(大连)科技有限公司 一种基于hog改进的图片相似判定方法
CN107907995B (zh) * 2017-12-22 2020-05-01 深圳市易瞳科技有限公司 一种基于双成像设备的三维景深的计算方法及系统
CN108492280A (zh) * 2018-03-02 2018-09-04 广州坚和网络科技有限公司 一种自动判断数字图片质量的装置及方法
CN108536827B (zh) * 2018-04-11 2021-09-03 南京理工大学 一种相似频谱图片搜索方法
CN109491888A (zh) * 2018-09-29 2019-03-19 中国平安人寿保险股份有限公司 应用程序兼容性测试方法、装置、及计算机可读存储介质
CN109409245A (zh) * 2018-09-30 2019-03-01 江苏满运软件科技有限公司 身份核验方法、系统、电子设备和存储介质
CN109447154B (zh) * 2018-10-29 2021-06-04 网易(杭州)网络有限公司 图片相似度检测方法、装置、介质及电子设备
CN109685112A (zh) * 2018-11-29 2019-04-26 昆明理工大学 一种基于颜色差值算法和DHash的图像相似判定方法
CN109670070B (zh) * 2018-11-29 2022-07-29 昆明理工大学 一种基于双重Hash的图像相似判定方法
CN109685114B (zh) * 2018-11-29 2022-04-15 昆明理工大学 一种基于预筛选法和PHash的图像相似判定方法
CN109961530B (zh) * 2019-01-16 2024-03-08 深圳市武智科技有限公司 基于图像识别的考勤方法、装置、计算机设备及存储介质
CN109934262B (zh) * 2019-01-31 2023-08-22 平安科技(深圳)有限公司 图片差异性判断方法、装置、计算机设备和存储介质
CN110929793A (zh) * 2019-11-27 2020-03-27 谢国宇 用于生态环境监测的时空域模型建模方法及系统
CN113704532B (zh) * 2020-11-25 2024-04-26 天翼数字生活科技有限公司 一种提升图片检索召回率的方法和系统
CN112861954A (zh) * 2021-02-01 2021-05-28 深圳无域科技技术有限公司 图片相似度计算方法、系统、设备及计算机可读介质
CN112836688B (zh) * 2021-03-26 2023-09-26 广东电网有限责任公司江门供电局 瓦片图像的特征提取方法、装置、电子设备及存储介质
CN113281310B (zh) * 2021-04-06 2022-12-02 安徽工程大学 一种光学介质材料的透光率和均匀度检测方法
CN113191661B (zh) * 2021-05-17 2024-07-23 上海鑫尤视网络科技有限公司 广告监播的方法、装置、存储介质及处理器
CN113505690B (zh) * 2021-07-09 2023-05-05 中国矿业大学(北京) 一种实时的煤岩视觉识别方法
CN113520172A (zh) * 2021-08-06 2021-10-22 广东福尔电子有限公司 一种耐压型电锅温度传感器侦测装置
CN114494729B (zh) * 2022-04-02 2022-07-12 广州市开富信息科技有限责任公司 基于ai识别技术的汽车配件识别方法及装置
CN115797707B (zh) * 2023-02-06 2023-05-05 威海海洋职业学院 一种基于计算机视觉的物品识别方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308567A (zh) * 2008-06-21 2008-11-19 华中科技大学 一种基于内容的鲁棒图像拷贝检测方法
CN102509257A (zh) * 2011-11-23 2012-06-20 上海交通大学 基于人类视觉特性压缩感知的灰度图像篡改检测方法
CN104091303A (zh) * 2014-07-11 2014-10-08 湖南大学 一种基于Radon变换和不变特征的鲁棒图像哈希方法及其装置
CN104504120A (zh) * 2014-12-29 2015-04-08 北京奇艺世纪科技有限公司 一种相似图片检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308567A (zh) * 2008-06-21 2008-11-19 华中科技大学 一种基于内容的鲁棒图像拷贝检测方法
CN102509257A (zh) * 2011-11-23 2012-06-20 上海交通大学 基于人类视觉特性压缩感知的灰度图像篡改检测方法
CN104091303A (zh) * 2014-07-11 2014-10-08 湖南大学 一种基于Radon变换和不变特征的鲁棒图像哈希方法及其装置
CN104504120A (zh) * 2014-12-29 2015-04-08 北京奇艺世纪科技有限公司 一种相似图片检测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A Short Survey on Perceptual Hash Function;Arambam Neelima;《ADBU Journal of Engineering Technology》;20141231;第1卷;第1-6页
关于对图像哈希算法的研究与应用;姚永明;《西安文理学院学报》;20160930;第19卷(第5期);第30-34页
基于数据投影降维机制与对称局部二值模式的紧凑图像哈希算法;王彦超;《激光与光电子学进展》;20161116;第1-12页

Also Published As

Publication number Publication date
CN106650829A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN106650829B (zh) 一种图片相似度计算方法
CN109472267A (zh) 图片相似度比对算法
CN113034383B (zh) 一种基于改进网格运动统计获取视频图像的方法
CN103400142B (zh) 一种行人计数方法
CN107066969A (zh) 一种人脸识别方法
CN106875331B (zh) 一种全景图像的非对称映射方法
CN106534833B (zh) 一种联合空间时间轴的双视点立体视频稳定方法
CN104079800A (zh) 一种视频监控中视频图像的抗抖动方法
Wang et al. An edge detection algorithm based on improved Canny operator
CN103714544B (zh) 一种基于sift特征点匹配的优化方法
CN104537663A (zh) 一种图像抖动的快速校正方法
CN114663344A (zh) 一种基于图像融合的列车轮对踏面缺陷识别方法及装置
CN109766896A (zh) 一种相似度度量方法、装置、设备和存储介质
CN109801273B (zh) 一种基于极平面线性相似度的光场图像质量评价方法
WO2023019699A1 (zh) 一种基于3d人脸模型的俯角人脸识别方法及系统
CN106021610B (zh) 一种基于显著区域的视频指纹提取方法
CN108961182A (zh) 针对视频图像的竖直方向灭点检测方法及视频扭正方法
Yang et al. Contrast limited adaptive histogram equalization for an advanced stereo visual slam system
CN103093467A (zh) 一种基于双重检测模型的镜头边界检测方法
CN103902954A (zh) 一种不良视频的鉴别方法和系统
CN113255449A (zh) 一种双目视频图像的实时匹配方法
CN108010076B (zh) 一种面向密集工业棒材图像检测的端面外观建模方法
Yang et al. Research and application of 3D face modeling algorithm based on ICP accurate alignment
Li et al. An improved method for eliminating ghosting in image stitching
CN114283199B (zh) 一种面向动态场景的点线融合语义slam方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant