CN103065316A - 一种基于巴氏相似性的目标视觉感知方法 - Google Patents
一种基于巴氏相似性的目标视觉感知方法 Download PDFInfo
- Publication number
- CN103065316A CN103065316A CN201210582688XA CN201210582688A CN103065316A CN 103065316 A CN103065316 A CN 103065316A CN 201210582688X A CN201210582688X A CN 201210582688XA CN 201210582688 A CN201210582688 A CN 201210582688A CN 103065316 A CN103065316 A CN 103065316A
- Authority
- CN
- China
- Prior art keywords
- perception
- pasteur
- zone
- similarity
- histogram model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于巴氏相似性的目标视觉感知方法,包括以下步骤:(1)根据输入的视频图像序列,通过手动方式对场景的感知区域进行设置,并在视频图像序列中对感知区域进行标记;(2)建立感知区域当前直方图模型,建立感知区域自适应背景直方图模型;(3)利用巴氏相似性计算公式,结合感知区域当前直方图模型和感知区域自适应背景直方图模型,计算感知区域直方图模型巴氏相似性系数;(4)用算得的巴氏相似性系数进行巴氏相似性目标视觉感知;(5)对感知区域进行自适应背景更新。本发明方法不仅适用于视频监控场合,也适用于仅有静态图像传送的监控场合,更加符合人类对目标的视觉感知方式,有着广泛的应用前景。
Description
技术领域
本发明属于计算机视觉感知技术领域,具体来说是一种基于巴氏相似性的目标视觉感知方法。
背景技术
在一些特定场景视频监控场合,需要对感兴趣区域的目标进行感知,感知的结果可用于目标检测,目标统计以及报警等用途。然而,目前基于视觉的主流方法都是以基于目标跟踪技术的检测或者基于目标运动的检测,该系列方法不稳定,且不适用于只允许静态图像传输的应用场合。然而除了利用目标运动信息,还可以利用感兴趣区域当前目标与背景的相似性度量作为目标视觉感知的另一种方法。这种方法不仅适用于视频监控场合,也同样适用于仅有静态图像传送的监控场合,同时进一步融入感知区域的自适应更新策略,使得本方法更加符合人类对目标的视觉感知方式。
发明内容
本发明提供了一种基于巴氏相似性的目标视觉感知方法,融合巴氏相似性度量对目标进行感知,其结果更加符合人类对目标的视觉感知方式。
一种基于巴氏相似性的目标视觉感知方法,包括:
(1) 根据输入的视频图像序列,通过手动方式对场景的感知区域进行设置,并在视频图像序列中对感知区域进行标记。
(2) 建立感知区域当前直方图模型,建立感知区域自适应背景直方图模型。
(3) 利用巴氏相似性计算公式,结合感知区域当前直方图模型和感知区域自适应背景直方图模型,计算感知区域直方图模型巴氏相似性系数。
(4) 用(3)算得的巴氏相似性系数进行巴氏相似性目标视觉感知。
(5) 对感知区域进行自适应背景更新。
所述的根据输入的视频图像序列,通过手动方式对场景的感知区域进行设置,并在视频图像序列中对感知区域进行标记包括以下步骤:
1)利用鼠标选择矩形框区域的方式或手工输入矩形框左上角与右下角(x, y)坐标的方式,对场景的感知区域进行设置。
2)利用1)获取的矩形框左上角与右下角(x,y)坐标,在每帧视频图像中对感知区域进行标记。
3)存储感知区域的当前视频图像数据,初始化感知区域自适应背景。
所述的建立感知区域当前直方图模型,建立感知区域自适应背景直方图模型包括以下步骤:
1)读入感知区域当前视频图像数据,读入感知区域自适应背景视频图像数据。
2)初始化感知区域当前直方图模型,初始化感知区域自适应背景直方图模型。
3)将感知区域当前直方图模型和感知区域自适应背景直方图模型划分为互不重叠的512个区间。
4)将每个视频图像像素的R取值、G取值和B取值,由原来的[0, 255]取值区间共256个取值,压缩至[0, 7] 取值区间共8个取值。
5)根据压缩后的每个视频图像像素新的R取值、G取值和B取值建立感知区域当前直方图模型和感知区域自适应背景直方图模型。
所述的利用巴氏相似性计算公式,结合感知区域当前直方图模型和感知区域自适应背景直方图模型,计算感知区域直方图模型巴氏相似性系数包括以下步骤:
1)输入已建立的感知区域当前直方图模型和感知区域自适应背景直方图模型。
2)利用巴氏相似性计算公式,结合1),算得巴氏相似性系数。
所述的用(3)算得的巴氏相似性系数进行巴氏相似性目标视觉感知包括以下步骤:
1)如果巴氏相似性系数大于上阈值THIGH(THIGH=0.85)则上阈值标记T h =1,下阈值标记T l =0。
2)如果巴氏相似性系数低于下阈值TLOW(TLOW=0.7)则下阈值标记T l =1。
3)当上阈值标记T h 与下阈值标记T l 均等于1时,则感知到目标,否则未感知到目标。
4)当上阈值标记T h 与下阈值标记T l 均等于1时,上阈值标记T h 与下阈值标记T l 均复位为0。
所述的对感知区域进行自适应背景更新包括以下步骤:
1)获得感知区域的背景差视频图像F cb 。
2)根据给定的阈值T b (T b =4),将背景差视频图像F cb 二值化为F b 。
3)判断F b 每个像素的取值,如果F b 的某个像素的灰度值为0,则当前感知区域对应点的R、G、B像素值拷贝至感知区域自适应背景视频图像对应点的R、G、B像素值。
本发明的有益效果:
本发明提供了一种基于巴氏相似性的目标视觉感知方法。该方法除了利用目标运动信息,还融合了感知区域目标与背景直方图模型的相似性度量对目标进行视觉感知。这种方法不仅适用于视频监控场合,也适用于仅有静态图像传送的监控场合。同时,这种方法进一步融入感知区域的自适应更新策略,使得本方法更加符合人类对目标的视觉感知方式,有着广泛的应用前景。
附图说明
图1为本发明的方法流程图;
图2为感知区域设置图。
具体实施方式
以下结合附图对本发明作进一步说明。
如图1所示,一种基于巴氏相似性的目标视觉感知方法,包括:
(1) 根据输入的视频图像序列,通过手动方式对场景的感知区域进行设置,并在视频图像序列中对感知区域进行标记。
(2) 建立感知区域当前直方图模型,建立感知区域自适应背景直方图模型。
(3) 利用巴氏相似性计算公式,结合感知区域当前直方图模型和感知区域自适应背景直方图模型,计算感知区域直方图模型巴氏相似性系数。
(4) 用(3)算得的巴氏相似性系数进行巴氏相似性目标视觉感知。;
(5) 对感知区域进行自适应背景更新。
根据输入的视频图像序列,通过手动方式对场景的感知区域进行设置,并在视频图像序列中对感知区域进行标记的具体过程包括以下步骤:
1)利用鼠标选择矩形框区域的方式或手工输入矩形框左上角与右下角(x, y)坐标的方式,对场景的感知区域进行设置。
如图2所示,通过鼠标选择或手工输入的方式获得左上角坐标(Ltopx,Ltopy)与右下角坐标(Rtopx,Rtopy)。
2)利用1)获取的矩形框左上角与右下角(x, y)坐标,在每帧视频图像中对感知区域进行标记。
如图2中所示,对每个视频图像,利用左上角坐标(Ltopx,Ltopy)与右下角坐标(Rtopx,Rtopy),在视频图像中叠加如图2中所示的虚线框,并实时显示感知区域的位置。
3)存储感知区域的当前视频图像数据,初始化感知区域自适应背景。
开辟内容空间,存储当前感知区域的视频图像数据;并将首次获取的感知区域视频图像数据用做感知区域的自适应背景,以完成感知区域自适应背景的初始化。
建立感知区域当前直方图模型,建立感知区域自适应背景直方图模型的具体过程包括以下步骤:
1)读入感知区域当前视频图像数据,读入感知区域自适应背景视频图像数据。
2)初始化感知区域当前直方图模型,初始化感知区域自适应背景直方图模型。
a) 定义感知区域当前直方图模型,为一单精度浮点型的数组:float histogramcur[HISTOGRAM_LENGTH](HISTOGRAM_LENGTH=512)。
b) 定义感知区域自适应背景直方图模型,为一单精度浮点型的数组:float phistogrammodel [HISTOGRAM_LENGTH](HISTOGRAM_LENGTH=512)。
c) 将两个单精度浮点型的数组空间清零。
3)将感知区域当前直方图模型和感知区域自适应背景直方图模型划分为互不重叠的512个区间。
在2)中,已经将数组长度指定为512,则相当于8×8×8种可能,对应于压缩后的R、G、B的512种可能取值。
4)将每个视频图像像素的R取值、G取值和B取值,由原来的[0, 255]取值区间共256个取值,压缩至[0, 7] 取值区间共8个取值。
将R值、G值、B值分别除于32,过程如下:
R ← R / 32
G ← G / 32
G ← G / 32
5)根据压缩后的每个视频图像像素新的R取值、G取值和B取值建立感知区域当前直方图模型和感知区域自适应背景直方图模型。
a) 建立感知区域当前直方图模型:histogramcur[16×R + 8×G + B]←histogramcur[16×R + 8×G + B] +1。
b) 建立感知区域自适应背景直方图模型:phistogrammodel [16×R + 8×G + B]←phistogrammodel[16×R + 8×G + B] +1。
c) 归一化感知区域当前直方图模型和感知区域自适应背景直方图模型。
利用巴氏相似性计算公式,结合感知区域当前直方图模型和感知区域自适应背景直方图模型,计算感知区域直方图模型巴氏相似性系数的具体过程包括以下步骤:
1)输入已建立的感知区域当前直方图模型和感知区域自适应背景直方图模型。
2)利用巴氏相似性计算公式,结合1),算得巴氏相似性系数。
使用巴氏相似性系数(Bhattacharyya系数)作为相似性函数,其计算公式为:
巴氏相似性系数
用算得的巴氏相似性系数进行巴氏相似性目标视觉感知的具体过程包括以下步骤:
1)如果巴氏相似性系数大于上阈值THIGH(THIGH=0.85)则上阈值标记T h =1,下阈值标记T l =0。
2)如果巴氏相似性系数低于下阈值TLOW(TLOW=0.7)则下阈值标记T l =1。
3)当上阈值标记T h 与下阈值标记T l 均等于1时,则感知到目标,否则未感知到目标。
4)当上阈值标记T h 与下阈值标记T l 均等于1时,上阈值标记T h 与下阈值标记T l 均复位为0。
对感知区域进行自适应背景更新的具体过程包括以下步骤:
1)获得感知区域的背景差视频图像F cb 。
2)根据给定的阈值T b (T b =4),将背景差视频图像F cb 二值化为F b 。
3)判断F b 每个像素的取值,如果F b 的某个像素的灰度值为0,则当前感知区域对应点的R、G、B像素值拷贝至感知区域自适应背景视频图像对应点的R、G、B像素值。
Claims (6)
1. 一种基于巴氏相似性的目标视觉感知方法,其特征在于该方法包括如下步骤:
步骤(1)根据输入的视频图像序列,通过手动方式对场景的感知区域进行设置,并在视频图像序列中对感知区域进行标记;
步骤(2)建立感知区域当前直方图模型,建立感知区域自适应背景直方图模型;
步骤(3)利用巴氏相似性计算公式,结合感知区域当前直方图模型和感知区域自适应背景直方图模型,计算感知区域直方图模型巴氏相似性系数;
步骤(4)用巴氏相似性系数进行巴氏相似性目标视觉感知;
步骤(5)对感知区域进行自适应背景更新。
2.根据权利要求1所述的一种基于巴氏相似性的目标视觉感知方法,其特征在于:步骤(1)包括以下步骤:
1)利用鼠标选择矩形框区域的方式或手工输入矩形框左上角与右下角(x,y)坐标的方式,对场景的感知区域进行设置;
2)利用1)获取的矩形框左上角与右下角(x,y)坐标,在每帧视频图像中对感知区域进行标记;
3)存储感知区域的当前视频图像数据,初始化感知区域自适应背景。
3.根据权利要求1所述的一种基于巴氏相似性的目标视觉感知方法,其特征在于:步骤(2)的具体过程如下:
1)读入感知区域当前视频图像数据,读入感知区域自适应背景视频图像数据;
2)初始化感知区域当前直方图模型,初始化感知区域自适应背景直方图模型;
3)将感知区域当前直方图模型和感知区域自适应背景直方图模型划分为互不重叠的512个区间;
4)将每个视频图像像素的R取值、G取值和B取值,由原来的[0, 255]取值区间共256个取值,压缩至[0, 7]取值区间共8个取值;
5)根据压缩后的每个视频图像像素新的R取值、G取值和B取值建立感知区域当前直方图模型和感知区域自适应背景直方图模型。
4.根据权利要求1所述的一种基于巴氏相似性的目标视觉感知方法,其特征在于:步骤(3)包括以下步骤:
1)输入已建立的感知区域当前直方图模型和感知区域自适应背景直方图模型;
2)利用巴氏相似性计算公式,结合1),算得巴氏相似性系数。
5.根据权利要求1所述的一种基于巴氏相似性的目标视觉感知方法,其特征在于:步骤(4)包括以下步骤:
1)如果巴氏相似性系数大于上阈值THIGH,则上阈值标记T h =1,下阈值标记T l =0;
2)如果巴氏相似性系数低于下阈值TLOW,则下阈值标记T l =1;
3)当上阈值标记T h 与下阈值标记T l 均等于1时,则感知到目标,否则未感知到目标;
4)当上阈值标记T h 与下阈值标记T l 均等于1时,上阈值标记T h 与下阈值标记T l 均复位为0。
6.根据权利要求1所述的一种基于巴氏相似性的目标视觉感知方法,其特征在于:步骤(5) 包括以下步骤:
1)获得感知区域的背景差视频图像F cb ;
2)根据给定的阈值T b ,将背景差视频图像F cb 二值化为F b ;
3)判断F b 每个像素的取值,如果F b 的某个像素的灰度值为0,则当前感知区域对应点的R、G、B像素值拷贝至感知区域自适应背景视频图像对应点的R、G、B像素值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210582688.XA CN103065316B (zh) | 2012-12-28 | 2012-12-28 | 一种基于巴氏相似性的目标视觉感知方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210582688.XA CN103065316B (zh) | 2012-12-28 | 2012-12-28 | 一种基于巴氏相似性的目标视觉感知方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103065316A true CN103065316A (zh) | 2013-04-24 |
CN103065316B CN103065316B (zh) | 2016-03-30 |
Family
ID=48107933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210582688.XA Expired - Fee Related CN103065316B (zh) | 2012-12-28 | 2012-12-28 | 一种基于巴氏相似性的目标视觉感知方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103065316B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251928A (zh) * | 2008-03-13 | 2008-08-27 | 上海交通大学 | 基于核的对象跟踪方法 |
JP2009187204A (ja) * | 2008-02-05 | 2009-08-20 | Toyota Motor Corp | 画像処理装置 |
-
2012
- 2012-12-28 CN CN201210582688.XA patent/CN103065316B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187204A (ja) * | 2008-02-05 | 2009-08-20 | Toyota Motor Corp | 画像処理装置 |
CN101251928A (zh) * | 2008-03-13 | 2008-08-27 | 上海交通大学 | 基于核的对象跟踪方法 |
Non-Patent Citations (3)
Title |
---|
ZHI-HAI SUN: "Vehicle detecting in traffic scenes with introduction of subtractive clustering algorithm", 《FUZZY SYSTEMS AND KNOWLEDGE DISCOVERY (FSKD), 2010 SEVENTH INTERNATIONAL CONFERENCE ON》 * |
刘献如: "视频图像序列目标跟踪算法及其应用研究", 《万方学位论文数据库》 * |
孙志海 等: "非参数核密度估计视频目标空域定位技术研究", 《光电工程》 * |
Also Published As
Publication number | Publication date |
---|---|
CN103065316B (zh) | 2016-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102968772B (zh) | 一种基于暗通道信息的图像去雾方法 | |
CN105740945B (zh) | 一种基于视频分析的人群计数方法 | |
CN108388882B (zh) | 基于全局-局部rgb-d多模态的手势识别方法 | |
WO2017084204A1 (zh) | 一种二维视频流中的人体骨骼点追踪方法及系统 | |
CN102509099B (zh) | 一种图像显著区域检测方法 | |
CN105160310A (zh) | 基于3d卷积神经网络的人体行为识别方法 | |
CN103020992B (zh) | 一种基于运动颜色关联的视频图像显著性检测方法 | |
CN106203423B (zh) | 一种融合上下文探测的弱结构感知视觉目标跟踪方法 | |
CN102542571B (zh) | 一种运动目标检测方法及装置 | |
CN103440645A (zh) | 一种基于自适应粒子滤波和稀疏表示的目标跟踪算法 | |
CN111027505B (zh) | 一种基于显著性检测的分层多目标跟踪方法 | |
CN102592115B (zh) | 一种人手定位方法及系统 | |
CN102999926B (zh) | 一种基于底层特征融合的图像视觉显著性计算方法 | |
CN111160291B (zh) | 基于深度信息与cnn的人眼检测方法 | |
CN101877143A (zh) | 一种二维图像组的三维场景重建方法 | |
CN102831427A (zh) | 一种融合视觉显著性和灰度共生矩的纹理特征提取方法 | |
CN104050685A (zh) | 基于粒子滤波视觉注意力模型的运动目标检测方法 | |
CN105989611A (zh) | 带有阴影去除的分块感知哈希跟踪方法 | |
CN103714556A (zh) | 一种基于金字塔表观模型的运动目标跟踪方法 | |
CN102663777A (zh) | 基于多视点视频的目标跟踪方法及系统 | |
CN106529441A (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
CN103456012B (zh) | 基于最大稳定曲率区域的视觉人手检测跟踪方法及系统 | |
CN103037140A (zh) | 一种基于块匹配的鲁棒性极强的目标跟踪算法 | |
CN103077383B (zh) | 基于时空梯度特征的分部位的人体运动识别方法 | |
CN104866826A (zh) | 一种基于knn和像素比梯度特征的静态手语识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160330 Termination date: 20161228 |