CN110349191A - 一种基于感知哈希算法的视觉跟踪方法 - Google Patents

一种基于感知哈希算法的视觉跟踪方法 Download PDF

Info

Publication number
CN110349191A
CN110349191A CN201910553684.0A CN201910553684A CN110349191A CN 110349191 A CN110349191 A CN 110349191A CN 201910553684 A CN201910553684 A CN 201910553684A CN 110349191 A CN110349191 A CN 110349191A
Authority
CN
China
Prior art keywords
picture
dct
hash
follows
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910553684.0A
Other languages
English (en)
Inventor
杜庆治
王昭
邵玉斌
龙华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910553684.0A priority Critical patent/CN110349191A/zh
Publication of CN110349191A publication Critical patent/CN110349191A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/262Analysis of motion using transform domain methods, e.g. Fourier domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20052Discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明涉及一种基于感知哈希算法的视觉跟踪方法,属于视觉跟踪技术领域。通过将目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的。本发明在于基于值的计算,将高维的数据降低到低维,从而大大降低计算的效率,其次对目标实现了很好的视觉跟踪,大大降低了人力成本。

Description

一种基于感知哈希算法的视觉跟踪方法
技术领域
本发明涉及一种基于感知哈希算法的视觉跟踪方法,属于视觉跟踪技术领域。
背景技术
目标跟踪是计算机视觉领域中一个非常热门的研究课题,原因在于它在车辆导航、交通监控和人机交互等方面具有重要意义。尽管目标跟踪这个课题被研究了几十年,许许多多的跟踪算法被提出,但它任然是一个非常具有挑战的问题。因为目标外观受到多种因素的干扰,例如光照变化、姿态变化、完全或部分遮挡以及突然运动等等。因此,在上述因素的干扰下,开发一个高性能跟踪系统是一个具有挑战性的问题。
发明内容
本发明要解决的技术问题是提出一种基于感知哈希算法的视觉跟踪方法,将人机交互中获取的目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的。
本发明的技术方案是:一种基于感知哈希算法的视觉跟踪方法,通过将目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的,具体步骤为:
Step1:缩小图片尺寸:pHash以小图片开始,限制图片规格不大于640*480,去除图片的高频和细节部分,将图片设置成8*8,总共64个像素点,不保持纵横比,只要将其变成8*8正方形;
Step2:简化色彩:将8*8伪彩的红外图片转换成灰度图片;进一步简化计算。
Step3:利用小波变换,能够对图像的的频率信息进行捕获,提取各频率成分,具体为:设图片为f(i,j),WT变换的过程如下:
其中,小波变换有三个变量,尺度伸缩量a和二维平移变量b1,b2,尺度a控制小波函数的伸缩,平移变量b1,b2控制小波函数的平移,尺度对应于频率,成反比,平移对应于时间,式中因子是为了保证小波伸缩前后能量不变引入的因子;
Step4:计算图片的DCT变换,得到32*32的DCT系数矩阵,DCT变换的过程如下:
设图片为f(i,j),则其DCT变换为F(u,v):
其中,
DCT矩阵的变换形式为:F=AfAT,其中,
二维DCT变换就是将二维图像从空间域转换到频率域。形象的说,就是计算图像由哪些二维余弦波构成,计算出的结果为c(u,v),其中u为二维波的水平方向频率,v为二维波的垂直方向频率;最终得出很多的c(u,v),每个c称为一个DCT系数,代表的频率为(u,v)的二维波的振幅(或者能量),所有这些二维波的叠加就是那个原始图片。
Step5:计算平均值:类似于均值Hash,计算出所有64个像素的灰度平均值;
Step6:计算Hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,就构成64位的整数,从而形成图片的指纹;
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的哈希码的汉明距离,如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。
本发明的有益效果是:简单快速,不受图片大小缩放或改变纵横比的影响,增加或减少亮度或对比度,或改变颜色,对Hash值都不会太大的影响。本发明在于基于值的计算,将高维的数据降低到低维,从而大大降低计算的效率,其次对目标实现了很好的视觉跟踪,大大降低了人力成本。
附图说明
图1是本发明计算图片Hash值的步骤流程图;
图2是本发明图片相似性对比的追踪流程图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1-2所示,一种基于感知哈希算法的视觉跟踪方法,通过将目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的,具体步骤为:
Step1:缩小图片尺寸:pHash以小图片开始,限制图片规格不大于640*480(300KB),用最快的方式去除图片的高频和细节部分,将图片设置成8*8,总共64个像素点,不保持纵横比,只要将其变成8*8正方形;这样做不仅可以比较任意大小的图片,还摒弃了不同尺寸、比例带来的差异,而且可以简化计算,但没有减小频率。
Step2:简化色彩:将8*8伪彩的红外图片转换成灰度图片;进一步简化计算。
Step3:利用小波变换,能够对图像的的频率信息进行捕获,提取各频率成分,具体为:设图片为f(i,j),WT变换的过程如下:
其中,小波变换有三个变量,尺度伸缩量a和二维平移变量b1,b2,尺度a控制小波函数的伸缩,平移变量b1,b2控制小波函数的平移,尺度对应于频率,成反比,平移对应于时间,式中因子是为了保证小波伸缩前后能量不变引入的因子;
Step4:计算图片的DCT变换,得到32*32的DCT系数矩阵,DCT变换的过程如下:
设图片为f(i,j),则其DCT变换为F(u,v):
其中,
DCT矩阵的变换形式为:F=AfAT,其中,
二维DCT变换就是将二维图像从空间域转换到频率域。形象的说,就是计算图像由哪些二维余弦波构成,计算出的结果为c(u,v),其中u为二维波的水平方向频率,v为二维波的垂直方向频率;最终得出很多的c(u,v),每个c称为一个DCT系数,代表的频率为(u,v)的二维波的振幅(或者能量),所有这些二维波的叠加就是那个原始图片。
Step5:计算平均值:类似于均值Hash,计算出所有64个像素的灰度平均值;
Step6:计算Hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,就构成64位的整数,从而形成图片的指纹;
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的哈希码的汉明距离,如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。汉明距离最小的扫描口就是和目标最相似的,也就为该帧的目标所在位置。
实施例2:一种基于感知哈希算法的视觉跟踪方法,具体为:
Step1:缩小尺寸:将图片缩小成8*8,共计64像素,以简化后面的DCT的计算。
Step2:简化色彩:将图片转化成灰度图片,进一步简化计算。
Step3:时频分析:运用小波变换去分析图像的每一行每一列,这样就可以得到时域上不同的频率成分。
Step4:计算DCT:通过离散余弦正变换,将图片用二维余弦波表示,利用离散余弦反变换进行二维波叠加之后就能形成原图。
Step5:计算平均值:计算所有64个像素的灰度平均值。
Step6:计算Hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:将每个像素的灰度与灰度平均值进行对比,大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,就构成64位的整数,即而形成图片的指纹。
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的Hash码的汉明距离,汉明距离最小的扫描口就是和目标最相似的,也就是该帧的目标所在位置。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (1)

1.一种基于感知哈希算法的视觉跟踪方法,其特征在于:
Step1:缩小图片尺寸:pHash以小图片开始,限制图片规格不大于640*480,去除图片的高频和细节部分,将图片设置成8*8,总共64个像素点,不保持纵横比,只要将其变成8*8正方形;
Step2:简化色彩:将8*8伪彩的红外图片转换成灰度图片;
Step3:利用小波变换,对图像的的频率信息进行捕获,提取各频率成分,具体为:设图片为f(i,j),WT变换的过程如下:
其中,小波变换有三个变量,尺度伸缩量a和二维平移变量b1,b2,尺度a控制小波函数的伸缩,平移变量b1,b2控制小波函数的平移,尺度对应于频率,成反比,平移对应于时间,式中因子是为了保证小波伸缩前后能量不变引入的因子;
Step4:计算图片的DCT变换,得到32*32的DCT系数矩阵,DCT变换的过程如下:
设图片为f(i,j),则其DCT变换为F(u,v):
其中,
DCT矩阵的变换形式为:F=AfAT,其中,
Step5:计算平均值:Hash,计算出所有64个像素的灰度平均值;
Step6:计算Hash值:根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,构成64位的整数,从而形成图片的指纹;
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的哈希码的汉明距离,如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。
CN201910553684.0A 2019-06-25 2019-06-25 一种基于感知哈希算法的视觉跟踪方法 Pending CN110349191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910553684.0A CN110349191A (zh) 2019-06-25 2019-06-25 一种基于感知哈希算法的视觉跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910553684.0A CN110349191A (zh) 2019-06-25 2019-06-25 一种基于感知哈希算法的视觉跟踪方法

Publications (1)

Publication Number Publication Date
CN110349191A true CN110349191A (zh) 2019-10-18

Family

ID=68182966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910553684.0A Pending CN110349191A (zh) 2019-06-25 2019-06-25 一种基于感知哈希算法的视觉跟踪方法

Country Status (1)

Country Link
CN (1) CN110349191A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062975A (zh) * 2019-11-18 2020-04-24 江苏艾佳家居用品有限公司 一种基于感知哈希算法加快视频帧实时目标检测的方法
CN111091118A (zh) * 2019-12-31 2020-05-01 北京奇艺世纪科技有限公司 图像的识别方法、装置及电子设备和存储介质
CN111123962A (zh) * 2019-12-16 2020-05-08 中国计量大学 一种用于电力杆塔巡检的旋翼无人机重定位拍照方法
CN111709345A (zh) * 2020-06-12 2020-09-25 重庆电政信息科技有限公司 一种固定环境内异常物品实时检测方法
CN117812440A (zh) * 2024-02-28 2024-04-02 南昌理工学院 一种监控视频摘要生成方法、系统、计算机及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760875A (zh) * 2016-03-10 2016-07-13 西安交通大学 基于随机森林算法的判别二进制图像特征相似实现方法
CN105844669A (zh) * 2016-03-28 2016-08-10 华中科技大学 一种基于局部哈希特征的视频目标实时跟踪方法
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN107657629A (zh) * 2017-10-27 2018-02-02 广东工业大学 一种目标的跟踪方法和跟踪系统
CN108897775A (zh) * 2018-06-01 2018-11-27 昆明理工大学 一种基于感知哈希的快速图像识别系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760875A (zh) * 2016-03-10 2016-07-13 西安交通大学 基于随机森林算法的判别二进制图像特征相似实现方法
CN105844669A (zh) * 2016-03-28 2016-08-10 华中科技大学 一种基于局部哈希特征的视频目标实时跟踪方法
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN107657629A (zh) * 2017-10-27 2018-02-02 广东工业大学 一种目标的跟踪方法和跟踪系统
CN108897775A (zh) * 2018-06-01 2018-11-27 昆明理工大学 一种基于感知哈希的快速图像识别系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
尹玉梅等: "《基于双重Hash的图像相似检索算法研究》", 《信息通信技术》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062975A (zh) * 2019-11-18 2020-04-24 江苏艾佳家居用品有限公司 一种基于感知哈希算法加快视频帧实时目标检测的方法
CN111062975B (zh) * 2019-11-18 2022-07-08 江苏艾佳家居用品有限公司 一种基于感知哈希算法加快视频帧实时目标检测的方法
CN111123962A (zh) * 2019-12-16 2020-05-08 中国计量大学 一种用于电力杆塔巡检的旋翼无人机重定位拍照方法
CN111091118A (zh) * 2019-12-31 2020-05-01 北京奇艺世纪科技有限公司 图像的识别方法、装置及电子设备和存储介质
CN111709345A (zh) * 2020-06-12 2020-09-25 重庆电政信息科技有限公司 一种固定环境内异常物品实时检测方法
CN117812440A (zh) * 2024-02-28 2024-04-02 南昌理工学院 一种监控视频摘要生成方法、系统、计算机及存储介质

Similar Documents

Publication Publication Date Title
CN110349191A (zh) 一种基于感知哈希算法的视觉跟踪方法
Wei et al. Multiscale patch-based contrast measure for small infrared target detection
Wang et al. Fast image dehazing method based on linear transformation
CN103530599B (zh) 一种真实人脸和图片人脸的区别方法和系统
EP3364343A1 (en) Method for image processing for object detection
WO2000016259A1 (fr) Dispositif visuel
CN103020920A (zh) 一种低照度图像增强方法
CN105913390B (zh) 一种图像去雾方法及系统
EP3905104B1 (en) Living body detection method and device
CN108537865A (zh) 一种基于视觉三维重建的古建筑模型生成方法和装置
CN107845145B (zh) 一种电子显微场景下的三维重构系统及方法
CN111553845B (zh) 一种基于优化的三维重建的快速图像拼接方法
CN109271996A (zh) 基于surf特征和哈希感知算法的fpc图像自动配准方法
CN111027415A (zh) 一种基于偏振图像的车辆检测方法
CN112907493A (zh) 无人机蜂群协同侦察下的多源战场图像快速镶嵌融合算法
Wang et al. An edge detection algorithm based on improved Canny operator
CN114677479A (zh) 一种基于深度学习的自然景观多视图三维重建方法
CN111222459B (zh) 一种视角无关的视频三维人体姿态识别方法
Li et al. Weak moving object detection in optical remote sensing video with motion-drive fusion network
CN109064536B (zh) 一种基于双目结构光的书页三维重建方法
CN109934283A (zh) 一种融合cnn和sift光流的自适应运动目标检测方法
CN109241932A (zh) 一种基于运动方差图相位特征的热红外人体动作识别方法
KR100640761B1 (ko) 단일카메라 기반의 영상 특징점의 3차원 위치 검출방법
Fei et al. Robust visual tracking based on improved perceptual hashing for robot vision
Tan et al. A distortion image correction method based on machine vision

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191018

RJ01 Rejection of invention patent application after publication