CN110349191A - 一种基于感知哈希算法的视觉跟踪方法 - Google Patents
一种基于感知哈希算法的视觉跟踪方法 Download PDFInfo
- Publication number
- CN110349191A CN110349191A CN201910553684.0A CN201910553684A CN110349191A CN 110349191 A CN110349191 A CN 110349191A CN 201910553684 A CN201910553684 A CN 201910553684A CN 110349191 A CN110349191 A CN 110349191A
- Authority
- CN
- China
- Prior art keywords
- picture
- dct
- hash
- follows
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000000007 visual effect Effects 0.000 title claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 8
- 238000013519 translation Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 4
- 230000003993 interaction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/262—Analysis of motion using transform domain methods, e.g. Fourier domain methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20052—Discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明涉及一种基于感知哈希算法的视觉跟踪方法,属于视觉跟踪技术领域。通过将目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的。本发明在于基于值的计算,将高维的数据降低到低维,从而大大降低计算的效率,其次对目标实现了很好的视觉跟踪,大大降低了人力成本。
Description
技术领域
本发明涉及一种基于感知哈希算法的视觉跟踪方法,属于视觉跟踪技术领域。
背景技术
目标跟踪是计算机视觉领域中一个非常热门的研究课题,原因在于它在车辆导航、交通监控和人机交互等方面具有重要意义。尽管目标跟踪这个课题被研究了几十年,许许多多的跟踪算法被提出,但它任然是一个非常具有挑战的问题。因为目标外观受到多种因素的干扰,例如光照变化、姿态变化、完全或部分遮挡以及突然运动等等。因此,在上述因素的干扰下,开发一个高性能跟踪系统是一个具有挑战性的问题。
发明内容
本发明要解决的技术问题是提出一种基于感知哈希算法的视觉跟踪方法,将人机交互中获取的目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的。
本发明的技术方案是:一种基于感知哈希算法的视觉跟踪方法,通过将目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的,具体步骤为:
Step1:缩小图片尺寸:pHash以小图片开始,限制图片规格不大于640*480,去除图片的高频和细节部分,将图片设置成8*8,总共64个像素点,不保持纵横比,只要将其变成8*8正方形;
Step2:简化色彩:将8*8伪彩的红外图片转换成灰度图片;进一步简化计算。
Step3:利用小波变换,能够对图像的的频率信息进行捕获,提取各频率成分,具体为:设图片为f(i,j),WT变换的过程如下:
其中,小波变换有三个变量,尺度伸缩量a和二维平移变量b1,b2,尺度a控制小波函数的伸缩,平移变量b1,b2控制小波函数的平移,尺度对应于频率,成反比,平移对应于时间,式中因子是为了保证小波伸缩前后能量不变引入的因子;
Step4:计算图片的DCT变换,得到32*32的DCT系数矩阵,DCT变换的过程如下:
设图片为f(i,j),则其DCT变换为F(u,v):
其中,
DCT矩阵的变换形式为:F=AfAT,其中,
二维DCT变换就是将二维图像从空间域转换到频率域。形象的说,就是计算图像由哪些二维余弦波构成,计算出的结果为c(u,v),其中u为二维波的水平方向频率,v为二维波的垂直方向频率;最终得出很多的c(u,v),每个c称为一个DCT系数,代表的频率为(u,v)的二维波的振幅(或者能量),所有这些二维波的叠加就是那个原始图片。
Step5:计算平均值:类似于均值Hash,计算出所有64个像素的灰度平均值;
Step6:计算Hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,就构成64位的整数,从而形成图片的指纹;
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的哈希码的汉明距离,如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。
本发明的有益效果是:简单快速,不受图片大小缩放或改变纵横比的影响,增加或减少亮度或对比度,或改变颜色,对Hash值都不会太大的影响。本发明在于基于值的计算,将高维的数据降低到低维,从而大大降低计算的效率,其次对目标实现了很好的视觉跟踪,大大降低了人力成本。
附图说明
图1是本发明计算图片Hash值的步骤流程图;
图2是本发明图片相似性对比的追踪流程图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1-2所示,一种基于感知哈希算法的视觉跟踪方法,通过将目标图片缩小,灰度化,在通过计算图片的DCT值,对图片进行降维处理,最后,通过目标图片的哈希值与图像哈希值进行对比,从而达到跟踪的目的,具体步骤为:
Step1:缩小图片尺寸:pHash以小图片开始,限制图片规格不大于640*480(300KB),用最快的方式去除图片的高频和细节部分,将图片设置成8*8,总共64个像素点,不保持纵横比,只要将其变成8*8正方形;这样做不仅可以比较任意大小的图片,还摒弃了不同尺寸、比例带来的差异,而且可以简化计算,但没有减小频率。
Step2:简化色彩:将8*8伪彩的红外图片转换成灰度图片;进一步简化计算。
Step3:利用小波变换,能够对图像的的频率信息进行捕获,提取各频率成分,具体为:设图片为f(i,j),WT变换的过程如下:
其中,小波变换有三个变量,尺度伸缩量a和二维平移变量b1,b2,尺度a控制小波函数的伸缩,平移变量b1,b2控制小波函数的平移,尺度对应于频率,成反比,平移对应于时间,式中因子是为了保证小波伸缩前后能量不变引入的因子;
Step4:计算图片的DCT变换,得到32*32的DCT系数矩阵,DCT变换的过程如下:
设图片为f(i,j),则其DCT变换为F(u,v):
其中,
DCT矩阵的变换形式为:F=AfAT,其中,
二维DCT变换就是将二维图像从空间域转换到频率域。形象的说,就是计算图像由哪些二维余弦波构成,计算出的结果为c(u,v),其中u为二维波的水平方向频率,v为二维波的垂直方向频率;最终得出很多的c(u,v),每个c称为一个DCT系数,代表的频率为(u,v)的二维波的振幅(或者能量),所有这些二维波的叠加就是那个原始图片。
Step5:计算平均值:类似于均值Hash,计算出所有64个像素的灰度平均值;
Step6:计算Hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,就构成64位的整数,从而形成图片的指纹;
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的哈希码的汉明距离,如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。汉明距离最小的扫描口就是和目标最相似的,也就为该帧的目标所在位置。
实施例2:一种基于感知哈希算法的视觉跟踪方法,具体为:
Step1:缩小尺寸:将图片缩小成8*8,共计64像素,以简化后面的DCT的计算。
Step2:简化色彩:将图片转化成灰度图片,进一步简化计算。
Step3:时频分析:运用小波变换去分析图像的每一行每一列,这样就可以得到时域上不同的频率成分。
Step4:计算DCT:通过离散余弦正变换,将图片用二维余弦波表示,利用离散余弦反变换进行二维波叠加之后就能形成原图。
Step5:计算平均值:计算所有64个像素的灰度平均值。
Step6:计算Hash值:这是最主要的一步,根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:将每个像素的灰度与灰度平均值进行对比,大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,就构成64位的整数,即而形成图片的指纹。
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的Hash码的汉明距离,汉明距离最小的扫描口就是和目标最相似的,也就是该帧的目标所在位置。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (1)
1.一种基于感知哈希算法的视觉跟踪方法,其特征在于:
Step1:缩小图片尺寸:pHash以小图片开始,限制图片规格不大于640*480,去除图片的高频和细节部分,将图片设置成8*8,总共64个像素点,不保持纵横比,只要将其变成8*8正方形;
Step2:简化色彩:将8*8伪彩的红外图片转换成灰度图片;
Step3:利用小波变换,对图像的的频率信息进行捕获,提取各频率成分,具体为:设图片为f(i,j),WT变换的过程如下:
其中,小波变换有三个变量,尺度伸缩量a和二维平移变量b1,b2,尺度a控制小波函数的伸缩,平移变量b1,b2控制小波函数的平移,尺度对应于频率,成反比,平移对应于时间,式中因子是为了保证小波伸缩前后能量不变引入的因子;
Step4:计算图片的DCT变换,得到32*32的DCT系数矩阵,DCT变换的过程如下:
设图片为f(i,j),则其DCT变换为F(u,v):
其中,
DCT矩阵的变换形式为:F=AfAT,其中,
Step5:计算平均值:Hash,计算出所有64个像素的灰度平均值;
Step6:计算Hash值:根据8*8的DCT矩阵,设置0或者1的64位的Hash值,计算规则为:大于等于DCT均值的设为“1”,小于DCT均值的设为“0”,组合在一起,构成64位的整数,从而形成图片的指纹;
Step7:相似性对比:把要跟踪的目标保存好,按照上述步骤计算它的Hash码,然后在每一帧来临的时候扫描整个图像,计算每个扫描窗口的Hash码,最后比较它和目标的哈希码的汉明距离,如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910553684.0A CN110349191A (zh) | 2019-06-25 | 2019-06-25 | 一种基于感知哈希算法的视觉跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910553684.0A CN110349191A (zh) | 2019-06-25 | 2019-06-25 | 一种基于感知哈希算法的视觉跟踪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110349191A true CN110349191A (zh) | 2019-10-18 |
Family
ID=68182966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910553684.0A Pending CN110349191A (zh) | 2019-06-25 | 2019-06-25 | 一种基于感知哈希算法的视觉跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110349191A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062975A (zh) * | 2019-11-18 | 2020-04-24 | 江苏艾佳家居用品有限公司 | 一种基于感知哈希算法加快视频帧实时目标检测的方法 |
CN111091118A (zh) * | 2019-12-31 | 2020-05-01 | 北京奇艺世纪科技有限公司 | 图像的识别方法、装置及电子设备和存储介质 |
CN111123962A (zh) * | 2019-12-16 | 2020-05-08 | 中国计量大学 | 一种用于电力杆塔巡检的旋翼无人机重定位拍照方法 |
CN111709345A (zh) * | 2020-06-12 | 2020-09-25 | 重庆电政信息科技有限公司 | 一种固定环境内异常物品实时检测方法 |
CN117812440A (zh) * | 2024-02-28 | 2024-04-02 | 南昌理工学院 | 一种监控视频摘要生成方法、系统、计算机及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760875A (zh) * | 2016-03-10 | 2016-07-13 | 西安交通大学 | 基于随机森林算法的判别二进制图像特征相似实现方法 |
CN105844669A (zh) * | 2016-03-28 | 2016-08-10 | 华中科技大学 | 一种基于局部哈希特征的视频目标实时跟踪方法 |
CN105912643A (zh) * | 2016-04-08 | 2016-08-31 | 浙江理工大学 | 一种基于内容改进型均值哈希的图像检索方法 |
CN107657629A (zh) * | 2017-10-27 | 2018-02-02 | 广东工业大学 | 一种目标的跟踪方法和跟踪系统 |
CN108897775A (zh) * | 2018-06-01 | 2018-11-27 | 昆明理工大学 | 一种基于感知哈希的快速图像识别系统及方法 |
-
2019
- 2019-06-25 CN CN201910553684.0A patent/CN110349191A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760875A (zh) * | 2016-03-10 | 2016-07-13 | 西安交通大学 | 基于随机森林算法的判别二进制图像特征相似实现方法 |
CN105844669A (zh) * | 2016-03-28 | 2016-08-10 | 华中科技大学 | 一种基于局部哈希特征的视频目标实时跟踪方法 |
CN105912643A (zh) * | 2016-04-08 | 2016-08-31 | 浙江理工大学 | 一种基于内容改进型均值哈希的图像检索方法 |
CN107657629A (zh) * | 2017-10-27 | 2018-02-02 | 广东工业大学 | 一种目标的跟踪方法和跟踪系统 |
CN108897775A (zh) * | 2018-06-01 | 2018-11-27 | 昆明理工大学 | 一种基于感知哈希的快速图像识别系统及方法 |
Non-Patent Citations (1)
Title |
---|
尹玉梅等: "《基于双重Hash的图像相似检索算法研究》", 《信息通信技术》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062975A (zh) * | 2019-11-18 | 2020-04-24 | 江苏艾佳家居用品有限公司 | 一种基于感知哈希算法加快视频帧实时目标检测的方法 |
CN111062975B (zh) * | 2019-11-18 | 2022-07-08 | 江苏艾佳家居用品有限公司 | 一种基于感知哈希算法加快视频帧实时目标检测的方法 |
CN111123962A (zh) * | 2019-12-16 | 2020-05-08 | 中国计量大学 | 一种用于电力杆塔巡检的旋翼无人机重定位拍照方法 |
CN111091118A (zh) * | 2019-12-31 | 2020-05-01 | 北京奇艺世纪科技有限公司 | 图像的识别方法、装置及电子设备和存储介质 |
CN111709345A (zh) * | 2020-06-12 | 2020-09-25 | 重庆电政信息科技有限公司 | 一种固定环境内异常物品实时检测方法 |
CN117812440A (zh) * | 2024-02-28 | 2024-04-02 | 南昌理工学院 | 一种监控视频摘要生成方法、系统、计算机及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110349191A (zh) | 一种基于感知哈希算法的视觉跟踪方法 | |
Wei et al. | Multiscale patch-based contrast measure for small infrared target detection | |
Wang et al. | Fast image dehazing method based on linear transformation | |
CN103530599B (zh) | 一种真实人脸和图片人脸的区别方法和系统 | |
EP3364343A1 (en) | Method for image processing for object detection | |
WO2000016259A1 (fr) | Dispositif visuel | |
CN103020920A (zh) | 一种低照度图像增强方法 | |
CN105913390B (zh) | 一种图像去雾方法及系统 | |
EP3905104B1 (en) | Living body detection method and device | |
CN108537865A (zh) | 一种基于视觉三维重建的古建筑模型生成方法和装置 | |
CN107845145B (zh) | 一种电子显微场景下的三维重构系统及方法 | |
CN111553845B (zh) | 一种基于优化的三维重建的快速图像拼接方法 | |
CN109271996A (zh) | 基于surf特征和哈希感知算法的fpc图像自动配准方法 | |
CN111027415A (zh) | 一种基于偏振图像的车辆检测方法 | |
CN112907493A (zh) | 无人机蜂群协同侦察下的多源战场图像快速镶嵌融合算法 | |
Wang et al. | An edge detection algorithm based on improved Canny operator | |
CN114677479A (zh) | 一种基于深度学习的自然景观多视图三维重建方法 | |
CN111222459B (zh) | 一种视角无关的视频三维人体姿态识别方法 | |
Li et al. | Weak moving object detection in optical remote sensing video with motion-drive fusion network | |
CN109064536B (zh) | 一种基于双目结构光的书页三维重建方法 | |
CN109934283A (zh) | 一种融合cnn和sift光流的自适应运动目标检测方法 | |
CN109241932A (zh) | 一种基于运动方差图相位特征的热红外人体动作识别方法 | |
KR100640761B1 (ko) | 단일카메라 기반의 영상 특징점의 3차원 위치 검출방법 | |
Fei et al. | Robust visual tracking based on improved perceptual hashing for robot vision | |
Tan et al. | A distortion image correction method based on machine vision |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191018 |
|
RJ01 | Rejection of invention patent application after publication |