CN103208125A - 视频帧图像中颜色和运动全局对比度的视觉显著性算法 - Google Patents
视频帧图像中颜色和运动全局对比度的视觉显著性算法 Download PDFInfo
- Publication number
- CN103208125A CN103208125A CN201310080831XA CN201310080831A CN103208125A CN 103208125 A CN103208125 A CN 103208125A CN 201310080831X A CN201310080831X A CN 201310080831XA CN 201310080831 A CN201310080831 A CN 201310080831A CN 103208125 A CN103208125 A CN 103208125A
- Authority
- CN
- China
- Prior art keywords
- color
- motion
- mean
- individual zone
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明公开了一种视频帧图像中颜色和运动全局对比度的视觉显著性算法,其步骤为:(1)输入原始视频帧图像,把原始的视频帧图像预分割为个区域,;(2)计算第个区域的颜色显著性值;(3)计算第个区域的像素点归一化的颜色显著性值;(4)计算第个区域的运动显著性值;(5)计算第个区域的像素点归一化的运动显著性值;(6)计算整幅视频帧图像的颜色和运动的显著性值。该方法将视频帧图像中颜色显著性图和视频帧图像中运动显著性图两个方面融合,计算出视频帧图像中的颜色和运动显著性图,能将视频帧图像中的显著对象凸显出来,将非显著性的背景区域抑制下去,该算法对于不同类型的视频帧图像均能取得较好效果,适合用于视频缩放等应用。
Description
技术领域
本发明涉及计算机视觉领域,具体涉及一种视频帧图像中颜色和运动全局对比度的视觉显著性计算方法。
背景技术
人眼在面对复杂场景时,能够迅速将注意力集中到少数几个比较突出的区域,这些突出的区域被称为视觉显著性区域。视觉显著性算法是通过模拟人眼观察图像的过程,进而提取人眼感兴趣区域,最后得到一幅与视觉关注度相对应的视觉显著性图。通过将图像划分为若干个区域,将这些区域与整幅图像进行对比,度量出各个区域的显著性大小的方法称为全局对比度法。目前国内外研究学者提出了一些基于全局对比度的视觉显著性算法,如Cheng(参考:M. M. Cheng, G. X. Zhang, N. J. Mitra, X. Huang and S. M. Hu.Global contrast based salient region detection, IEEE CVPR, pp. 409-416, Feb. 2011.)提出一种用稀疏直方图比较来计算区域对比度的显著性计算方法,采用区域的颜色信息建立直方图,通过直方图对比来度量区域间的颜色距离,找出整幅图像中与其它区域差异最大的区域为图像的视觉显著性区域。Cheng的方法简单有效,但是由于其只利用了图像的颜色信息,缺少对运动信息的考量,因而不适用于视频中帧图像的显著性计算。
Andres(参考: B. Andres, W. Joachim, F. Christian, K. Timo, S. Christoph. Real-Time optic flow computation with variational methods, Computer Science, vol. 2756, pp. 222-229, 2003.)提出一种采用变分法来加速光流法的计算效率的方法,光流法是通过检测视频帧图像中像素点的强度随时间的变化,估算出各像素点的移动速度和方向,进而得到各个像素点的运动矢量。本发明用光流法来计算像素点的运动矢量。
发明内容
本发明的目的在于针对现有技术中存在的缺陷,提出一种视频帧图像中颜色和运动全局对比度的视觉显著性算法,该方法能够将不同类型的视频帧图像中的显著对象凸显出来,将非显著性的背景区域抑制下去。为了达到上述目的,本发明的视频帧图像中颜色和运动全局对比度的视觉显著性算法,其具体步骤如下:
(6)、计算整幅视频帧图像的颜色和运动的显著性值。
(2-3)、将全局颜色直方图按照频率的高低进行降序排列,然后从前到后选择原始视频帧图像95%以上的颜色出现的频率,将没有被选择的颜色的频率叠加到已选择的最相近的颜色的频率中,选择后的颜色种数为;
(1)
其中,表示第个区域的颜色直方图中的第种颜色所占的概率,表示第个区域的颜色直方图, 表示是颜色直方图,表示是第个区域的个数序号,,表示颜色直方图中的第种颜色的种数序号,,表示颜色直方图中的第种颜色的颜色值,表示全局颜色直方图中的第种颜色所占的概率,表示全局颜色直方图,0表示是整幅图像的全局直方图, 表示全局颜色直方图中的第种颜色的种数序号,,表示全局颜色直方图中的第种颜色的颜色值,表示颜色空间中颜色和之间的欧式距离, 表示颜色种数,表示第个区域的颜色显著性值。
(3-1)、计算第个区域中像素点归一化前的颜色显著性值,其计算式为:
(3)
上述步骤(4)所述的计算第 个区域的运动显著性值,其具体步骤如下:
(4-2)、将个区域的各个像素点的运动矢量的幅值归一化,归一化后,再量化成11等分,将个区域的各个像素点的运动矢量的方向角量化成8等分,再将各个像素点的运动矢量的幅值和对应的方向角组合,组合成种像素点的运动矢量;
(4)
其中,表示第个区域的运动直方图中第种运动矢量所占的概率,表示第个区域的运动直方图, 表示是运动直方图,表示是第个区域的个数序号,,表示运动直方图中的第种运动矢量的种数序号,,表示运动直方图中第种运动矢量的值,表示全局运动直方图中第个运动矢量所占的概率,表示全局运动直方图,0表示是整幅图像的全局直方图, 表示全局运动直方图中的第种运动矢量的种数序号,,表示全局运动直方图中的第种运动矢量的值, 表示运动矢量和之间的距离,表示运动矢量和之间的夹角,表示运动矢量的幅值,表示运动矢量的幅值,表示运动矢量的种数,表示第个区域的运动显著性值。
(6)
上述步骤(6)所述的计算整幅图像的颜色和运动的显著性值,其具体步骤如下:
其中, 表示第个区域中像素点的归一化前的颜色和运动的显著性值,表示求最小值的函数,表示求最大值的函数,表示第个区域中像素点归一化的颜色和运动的显著性值,其范围为0~1,该第个区域中像素点归一化的颜色和运动的显著性值作为整幅视频帧图像的颜色和运动显著性值,该显著性值越大表示该像素点越显著,该显著性值越小表示该像素点越不显著。
本发明的视频帧图像中颜色和运动全局对比度的视觉显著性算法具有如下优点:该方法通过视频帧图像中颜色直方图和视频帧图像中运动直方图两个方面融合,计算出视频帧图像中的颜色和运动显著性值,能够将视频帧图像中的显著对象凸显出来,将非显著性的背景区域抑制下去,该算法对于不同类型的视频帧图像均能取得较好的效果,适合用于视频缩放以及视频分割等应用。
附图说明
图1是本发明的视频帧图像中颜色和运动全局对比度的视觉显著性算法的流程图;
图2是图1中步骤(1)中所述的输入的原始视频帧图像;
图3是图1中步骤(3)中所述的整幅视频帧图像的颜色显著性图;
图4是图1中步骤(4)中所述的量化后的运动矢量的幅值的示意图;
图5是图1中步骤(4)中所述的量化后的运动矢量示意图;
图6是图1中步骤(5)中所述的整幅视频帧图像的运动显著性图;
图7是图1中步骤(6)中所述的整幅视频帧图像的颜色和运动显著性图;
图8是摄像镜头上下平移的电影视频的颜色和运动显著性图,图中,第1列(a)是原始视频帧图像,第2列(b)是颜色显著性图,第3列(c)是运动显著性图,第4列(d)是整幅视频帧图像的颜色和运动显著性图;
图9是摄像镜头静止的室外监控视频的颜色和运动显著性图,图中,第1列(a)是原始视频帧图像,第2列(b)是颜色显著性图,第3列(c)是运动显著性图,第4列(d)是整幅视频帧图像的颜色和运动显著性图;
图10是摄像镜头剧烈抖动的室外监控视频的颜色和运动显著性图,图中,第1列(a)是原始视频帧图像,第2列(b)是颜色显著性图,第3列(c)是运动显著性图,第4列(d)是整幅视频帧图像的颜色和运动显著性图。
具体实施方式
下面结合说明书附图对本发明的实施作进一步说明。
本发明进行的仿真实验是在CPU为2.53GHz、内存为1.96GB的PC测试平台上编程实现。
如图1所示,本发明的视频帧图像中颜色和运动全局对比度的视觉显著性算法,采用以下步骤加以详述:
其中,表示第个区域的颜色直方图中的第种颜色所占的概率,表示第个区域的颜色直方图, 表示是颜色直方图,表示是第个区域的个数序号,,表示颜色直方图中的第种颜色的种数序号,,表示颜色直方图中的第种颜色的颜色值,表示全局颜色直方图中的第种颜色所占的概率,表示全局颜色直方图,0表示是整幅图像的全局直方图, 表示全局颜色直方图中的第种颜色的种数序号,,表示全局颜色直方图中的第种颜色的颜色值,表示颜色空间中颜色和之间的欧式距离, 表示颜色种数,表示第个区域的颜色显著性值。
其中, 表示像素点的归一化前的颜色显著性值,表示求最小值的函数,表示求最大值的函数,表示第个区域中像素点归一化的颜色显著性值,其范围为0~1,该第个区域中像素点的颜色显著性值作为整幅视频帧图像的颜色显著性值,如图3所示,该显著性值越大表示该像素点越显著,显著性值越小表示该像素点越不显著;
(4)、计算第个区域的运动显著性值,其具体步骤如下:
(4-2)、将个区域的各个像素点的运动矢量的幅值归一化后,再将归一化后的所有运动矢量的幅值分成11个等分,即11个等分为(0.00~0.05), (0.05~0.15),(0.15~0.25),(0.25~0.35), (0.35~0.45), (0.45~0.55), (0.55~0.65), (0.65~0.75), (0.75~0.85),(0.85~0.95), (0.95~1.00),如图4所示;将个区域的各个像素点的运动矢量的方向角量化成8个运动矢量方向角,即所有运动矢量的方向角量化为0~360度量化成8等分的运动矢量方向角,其8个扇形区为:东扇形区,东南扇形区,南扇形区,西南扇形区,西扇形区,西北扇形区,北扇形区,东北扇形区,再将运动矢量的幅值和方向角组合,组合成种像素点的运动矢量,例如,运动矢量为: (0.1,东), (0.1,东南), (0.1,南),……,(0.1,北), (0.1,东北), (0.2,东), (0.2,东南),(0.2,南),……,(0.2,北), (0.2,东北),……,(1,东), (1,东南), (1,南),……,(1,北), (1,东北),如图5所示;
其中,表示第个区域的运动直方图中第种运动矢量所占的概率,表示第个区域的运动直方图, 表示是运动直方图,表示是第个区域的个数序号,,表示运动直方图中的第种运动矢量的种数序号,,表示运动直方图中第种运动矢量的值,表示全局运动直方图中第个运动矢量所占的概率,表示全局运动直方图,0表示是整幅图像的全局直方图, 表示全局运动直方图中的第种运动矢量的种数序号,,表示全局运动直方图中的第种运动矢量的值, 表示运动矢量和之间的距离,表示运动矢量和之间的夹角,表示运动矢量的幅值,表示运动矢量的幅值,表示运动矢量的种数,表示第个区域的运动显著性值。
(6)
其中, 表示像素点的未归一化的运动显著性值,表示求最小值的函数,表示求最大值的函数,表示第个区域中像素点归一化的运动显著性值,其范围为0~1,该第个区域中像素点归一化的运动显著性值作为整幅视频帧图像的运动显著性值,该显著性值越大表示该像素点越显著,该显著性值越小表示该像素点越不显著,如图6所示。
(6)、计算整幅视频帧图像的颜色和运动的显著性值,其具体步骤如下:
其中, 表示第个区域中像素点的归一化前的颜色和运动的显著性值,表示求最小值的函数,表示求最大值的函数,表示第个区域中像素点归一化的颜色和运动的显著性值,其范围为0~1,该第个区域中像素点归一化的颜色和运动的显著性值作为整幅视频帧图像的颜色和运动显著性值,该显著性值越大表示该像素点越显著,该显著性值越小表示该像素点越不显著,如图7所示。
为了验证使用本发明的视频帧图像中颜色和运动全局对比度的视觉显著性算法的效果,采用本发明的算法分别对电影、新闻、动画视频帧图像作实验,如图8、图9、图10所示,图8、图9、图10中,第1列均为原始视频帧图像,第2列均为颜色显著性图,第3列均为运动显著性图,第4列均为整幅视频帧图像的颜色和运动显著性图。从三幅图可以看出,通过视频帧图像中颜色显著性图与视频帧图像中运动显著性图的融合,对于不同类型的视频帧图像,生成的整幅视频帧图像的颜色和运动显著性图均能够有效地抑制非显著性的背景区域,并更好地凸显出显著对象。
Claims (6)
(2-2)、统计组合后的163种颜色在视频帧图像上出现的频率,组成全局颜色直方图,记为;
(2)
(3-2)、计算第个区域中像素点归一化的颜色显著性值,得到整幅视频帧图像的颜色显著性值,其计算式为:
(4-2)、将个区域的各个像素点的运动矢量的幅值归一化,归一化后,再量化成11等分,将个区域的各个像素点的运动矢量的方向角量化成8等分,再将各个像素点的运动矢量的幅值和对应的方向角组合,组合成种像素点的运动矢量;
6.根据权利要求5所述的视频帧图像中颜色和运动全局对比度的视觉显著性算法,其特征在于,上述步骤(6)所述的计算整幅图像的颜色和运动的显著性值,其具体步骤如下:
(8)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310080831.XA CN103208125B (zh) | 2013-03-14 | 2013-03-14 | 视频帧图像中颜色和运动全局对比度的视觉显著性算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310080831.XA CN103208125B (zh) | 2013-03-14 | 2013-03-14 | 视频帧图像中颜色和运动全局对比度的视觉显著性算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103208125A true CN103208125A (zh) | 2013-07-17 |
CN103208125B CN103208125B (zh) | 2015-12-09 |
Family
ID=48755340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310080831.XA Expired - Fee Related CN103208125B (zh) | 2013-03-14 | 2013-03-14 | 视频帧图像中颜色和运动全局对比度的视觉显著性算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103208125B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021220A (zh) * | 2014-06-24 | 2014-09-03 | 中国科学院深圳先进技术研究院 | 基于显著性模型的图像检索方法 |
CN104504692A (zh) * | 2014-12-17 | 2015-04-08 | 上海大学 | 基于区域对比度的图像中显著对象的提取方法 |
CN104778713A (zh) * | 2015-04-27 | 2015-07-15 | 清华大学深圳研究生院 | 一种图像处理方法 |
CN105224914A (zh) * | 2015-09-02 | 2016-01-06 | 上海大学 | 一种基于图的无约束视频中显著物体检测方法 |
CN105488812A (zh) * | 2015-11-24 | 2016-04-13 | 江南大学 | 一种融合运动特征的时空显著性检测方法 |
CN113225586A (zh) * | 2020-02-05 | 2021-08-06 | 字节跳动有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN114640850A (zh) * | 2022-02-28 | 2022-06-17 | 上海顺久电子科技有限公司 | 视频图像的运动估计方法、显示设备和芯片 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101621636A (zh) * | 2008-06-30 | 2010-01-06 | 北京大学 | 基于视觉注意力模型的广告标志插入和变换方法及系统 |
CN101765018A (zh) * | 2008-12-25 | 2010-06-30 | 中国移动通信集团公司 | 色深变换、传输色深变换后图像的方法和装置 |
-
2013
- 2013-03-14 CN CN201310080831.XA patent/CN103208125B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101621636A (zh) * | 2008-06-30 | 2010-01-06 | 北京大学 | 基于视觉注意力模型的广告标志插入和变换方法及系统 |
CN101765018A (zh) * | 2008-12-25 | 2010-06-30 | 中国移动通信集团公司 | 色深变换、传输色深变换后图像的方法和装置 |
Non-Patent Citations (2)
Title |
---|
ANDRES BRUHN ET AL: "real time optic flow comutation with variational methods", 《CAIP 2003 LNCS》, vol. 2756, 31 December 2003 (2003-12-31) * |
MING-MING CHENG ET AL: "Global Contrast based Salient Region Detection", 《2011 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, 25 June 2011 (2011-06-25), pages 409 - 416 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021220A (zh) * | 2014-06-24 | 2014-09-03 | 中国科学院深圳先进技术研究院 | 基于显著性模型的图像检索方法 |
CN104021220B (zh) * | 2014-06-24 | 2017-09-05 | 中国科学院深圳先进技术研究院 | 基于显著性模型的图像检索方法 |
CN104504692A (zh) * | 2014-12-17 | 2015-04-08 | 上海大学 | 基于区域对比度的图像中显著对象的提取方法 |
CN104504692B (zh) * | 2014-12-17 | 2017-06-23 | 上海大学 | 基于区域对比度的图像中显著对象的提取方法 |
CN104778713A (zh) * | 2015-04-27 | 2015-07-15 | 清华大学深圳研究生院 | 一种图像处理方法 |
CN104778713B (zh) * | 2015-04-27 | 2017-07-07 | 清华大学深圳研究生院 | 一种图像处理方法 |
CN105224914A (zh) * | 2015-09-02 | 2016-01-06 | 上海大学 | 一种基于图的无约束视频中显著物体检测方法 |
CN105224914B (zh) * | 2015-09-02 | 2018-10-23 | 上海大学 | 一种基于图的无约束视频中显著物体检测方法 |
CN105488812A (zh) * | 2015-11-24 | 2016-04-13 | 江南大学 | 一种融合运动特征的时空显著性检测方法 |
CN113225586A (zh) * | 2020-02-05 | 2021-08-06 | 字节跳动有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN113225586B (zh) * | 2020-02-05 | 2023-03-10 | 字节跳动有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN114640850A (zh) * | 2022-02-28 | 2022-06-17 | 上海顺久电子科技有限公司 | 视频图像的运动估计方法、显示设备和芯片 |
Also Published As
Publication number | Publication date |
---|---|
CN103208125B (zh) | 2015-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103208125A (zh) | 视频帧图像中颜色和运动全局对比度的视觉显著性算法 | |
CN110717527B (zh) | 结合空洞空间金字塔结构的目标检测模型确定方法 | |
Changzhen et al. | A traffic sign detection algorithm based on deep convolutional neural network | |
CN111242127B (zh) | 基于非对称卷积的具有粒度级多尺度特性的车辆检测方法 | |
Peng et al. | A hybrid approach to estimate the complex motions of clouds in sky images | |
TWI667621B (zh) | 人臉辨識方法 | |
CN107844785A (zh) | 一种基于尺度估计的人脸检测方法 | |
US11367195B2 (en) | Image segmentation method, image segmentation apparatus, image segmentation device | |
CN103530619A (zh) | 基于rgb-d数据构成的少量训练样本的手势识别方法 | |
CN103530638A (zh) | 多摄像头下的行人匹配方法 | |
Lin et al. | Foreground detection in surveillance video with fully convolutional semantic network | |
CN112528913A (zh) | 一种基于图像的砂石颗粒物粒径检测分析系统 | |
CN102034267A (zh) | 基于关注度的目标物三维重建方法 | |
Xu et al. | Dynamic obstacle detection based on panoramic vision in the moving state of agricultural machineries | |
CN103955888A (zh) | 一种基于sift的高清视频图像拼接方法及装置 | |
CN103778436A (zh) | 一种基于图像处理的行人姿态检测方法 | |
CN109753985A (zh) | 视频分类方法及装置 | |
Singh et al. | Learning to Predict Video Saliency using Temporal Superpixels. | |
Zhu et al. | Anomaly detection via 3D-HOF and fast double sparse representation | |
CN101815225A (zh) | 生成深度图的方法及其设备 | |
Dong et al. | Adaptive Object Detection and Visibility Improvement in Foggy Image. | |
CN108229281B (zh) | 神经网络的生成方法和人脸检测方法、装置及电子设备 | |
CN103530879B (zh) | 特定场景下的行人颜色提取方法 | |
CN114119670A (zh) | 一种基于智能手机获取河流视频的流速测量方法 | |
Morar et al. | Time-consistent segmentation of indoor depth video frames |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151209 |
|
CF01 | Termination of patent right due to non-payment of annual fee |