CN104537687B - 一种具有速度信息的时序模板动作表示方法 - Google Patents
一种具有速度信息的时序模板动作表示方法 Download PDFInfo
- Publication number
- CN104537687B CN104537687B CN201410811099.3A CN201410811099A CN104537687B CN 104537687 B CN104537687 B CN 104537687B CN 201410811099 A CN201410811099 A CN 201410811099A CN 104537687 B CN104537687 B CN 104537687B
- Authority
- CN
- China
- Prior art keywords
- light stream
- action
- pixel
- expressing
- optical flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种带有速度信息的时序模板动作表示方法。其首先使用高斯混合模型进行前景提取,只计算运动区域的光流能够减少运算量,然后对前景区域计算视频的稠密光流,最后使用孟塞尔颜色系统对光流着色。本方法能够在描述动作整体轮廓的同时也强调动作的最大速度分布情况,对于单人动作和双人交互动作都有较好的识别结果,可以有效地区分一些外形相似但是速度分布不同的动作,例如用力拍打和轻拍,从而可避免对于外形相似的动作被误分为同一个动作的问题。本动作表示方法可用于智能视频监控和虚拟现实,以提高其准确性。
Description
技术领域:
本发明属于人体行为识别领域,特别是涉及一种具有速度信息的时序模板动作表示方法。
技术背景:
随着计算视觉及模式识别技术的快速发展,人体行为识别在智能监控、虚拟现实、人机交互和运动分析中得到了广泛的应用。比如,智能监控被广泛应用于酒店、机场和银行等特殊环境中,对人员的动作进行识别能够及时发现异常行为并发出告警;人的身体动作和手势等包含大量信息,传统的人机交互主要是通过鼠标和键盘对机器进行操作,高级的人机交互通过对人体动作识别进而使计算机做出反应;虚拟现实目前被较为广泛地应用于X-BOX360和PX3等游戏机中;在体育视频中,对运动员的身体动作进行分析、判断,建立最优模型,在运动员的速度和姿势方面做出改进,从而能够帮助运动员提高竞争力。
模板匹配方法主要是使用时序模板(运动历史图像和运动能量图像)对动作进行描述,用二维图像来描述视频中一个人的完整动作,方法简单,并且具备一定的鲁棒性。该方法虽然能够较好地描述动作的整体轮廓,但是对于动作的速度信息描述不够明显。
另外,原有的时序模板方法主要描述动作的运动区域形状,对动作的速度分布情况表现不够突出,因此我们只能够识别出外观相差较大的动作,而对于某些形状相似但用力程度不同的动作识别率却较低,例如用力拍打和轻拍。
发明内容:
为了解决上述问题,本发明的目的在于提供一种带有速度信息的时序模板动作表示方法。
为了达到上述目的,本发明提供的带有速度信息的时序模板动作表示方法包括按顺序进行的下列步骤:
1)使用混合高斯模型提取出视频帧的前景运动区域;
2)计算上述前景运动区域的稠密光流,并比较前后两帧视频上同一像素点的光流,保留较大的光流,得到动作最大光流的分布;
3)最后使用孟塞尔颜色系统对上述保留的光流进行着色,不同的颜色对应不同方向,颜色的深浅表示速度的大小,最终得到最大光流图像。
在步骤1)中,所述的使用混合高斯模型提取出视频帧的前景运动区域的方法为,在时间域内,用K个多维高斯分布来模拟图像中每个像素点的变化,将混合高斯模型中的K个高斯分布按大小排序,取前面N个高斯分布作为背景模型。将当前像素与背景模型的高斯分布做差,若差值小于一定范围,则判定为背景。
在步骤2)中,所述的计算上述前景运动区域的稠密光流,并比较前后两帧视频上同一像素点的光流,保留较大的光流,得到动作最大光流的分布的方法为,假设特征窗口内的各像素点具有大致相同的光流速度;用多项式展开来近似每个像素周围邻近的点,每个特征窗口用局部多项式f(x)=xTAx+bTx+c近似,于是得到:A(x)d(x)=△b(x),其中d(x)为前后两帧像素点的光流位移,假设前后两帧像素点的位移变化是缓慢的,于是得到同一像素点前后两帧的光流位移;将此光流与前一帧的光流做对比,保留较大光流值。
在步骤3)中,所述的最后使用孟塞尔颜色系统对上述保留的光流进行着色,不同的颜色对应不同方向,颜色的深浅表示速度的大小,最终得到最大光流图像的方法为,首先定义颜色轮经度,把一周均分成五种主色,并将五种主色互相调和成五种中间色:红、红黄、黄、黄绿、绿、绿蓝、蓝、蓝紫、紫、紫红,相邻的两个位置之间再均分成10份,共100份;根据计算得到的每个像素点光流的水平位移和垂直位移得到运动方向和大小,将运动方向和大小与孟塞尔颜色轮相对应。
本发明提供的带有速度信息的时序模板动作表示方法首先使用高斯混合模型进行前景提取,只计算运动区域的光流能够减少运算量,然后对前景区域使用Farneback算法计算视频的稠密光流,最后使用孟塞尔颜色系统对光流着色。本方法能够在描述动作整体轮廓的同时也强调动作的最大速度分布情况,对于单人动作和双人交互动作都有较好的识别结果,可以有效地区分一些外形相似但是速度分布不同的动作,例如用力拍打和轻拍,从而可避免对于外形相似的动作被误分为同一个动作的问题。本动作表示方法可用于智能视频监控和虚拟现实,以提高其准确性。
附图说明
图1为本发明提供的具有速度信息的时序模板动作表示方法流程图。
具体实施方式:
下面结合附图和具体实施例对本发明提供的具有速度信息的时序模板动作表示方法进行详细说明。
如图1所示,本发明提供的具有速度信息的时序模板动作表示方法包括按顺序进行的下列步骤:
1)使用混合高斯模型提取出视频帧的前景运动区域;
前景提取的目的是从图像中获得比较完整的前景运动区域。背景减除法是前景提取最常用的方法之一,其基本思想是利用背景的参数模型来近似估计背景图像像素点的像素值,计算当前帧与背景图像的差值,其中与背景模型区别较大的像素区域被认为是运动区域,而区别较小的像素区域被认为是背景区域。背景减除法主要包括基于背景模型的方法和基于全局阈值的方法等。混合高斯模型属于基于背景模型的方法,其是依据像素的历史变化而建立背景模型,并对其不断进行更新以获得前景,对变化复杂的场景也具有一定的适应能力。
将混合高斯模型(Mixture of Gaussians,MoG)用于背景建模时,在时间域内,用K个多维高斯分布来模拟图像中每个像素点的变化,像素点I(x,y)的观测值序列∑i,t为{X1,X2,...,Xt},在t时刻该像素点值为Xt的概率为其中:K为高斯分布的个数,wi,t为第i个高斯分布的权值,N(X,μ,∑)为高斯分布概率密度函数,μi,t和Σi,t分别为第i个高斯分布的均值和协方差矩阵。
将混合高斯模型中的K个高斯分布按大小排序,取前面N个高斯分布作为背景模型。将当前像素与背景模型的高斯分布做差,若差值小于一定范围,则判定为背景,用一个二值变量Bt来表示,即:
然后更新权值与背景模型:
wi,t=(1-λ)wi,t-1+λBt
μi,t=(1-α)μi,t-1+αXi,t
∑i,t=(1-α)∑i,t-1+α(Xi,t-μi,t)(Xi,t-μi,t)T
式中:λ为学习率,
2)计算上述前景运动区域的稠密光流,并比较前后两帧视频上同一像素点的光流,保留较大的光流,得到动作最大光流的分布;
令5*5为特征窗口大小,假设窗口内的各像素点具有大致相同的光流速度;用多项式展开来近似每个像素周围邻近的点,每个特征窗口用局部多项式f(x)=xTAx+bTx+c近似,A1(x),b1(x),c1(x)为第一幅图像的多项式参数,A2(x),b2(x),c2(x)为第二幅图像的多项式参数;
令
于是得到:
A(x)d(x)=△b(x)
假设前后两帧像素点的位移变化是缓慢的,
其中w(△x)为像素点周围点的权函数,给中心点赋予最大的权值,其余沿径向方向减少;
将上式最小化得到位移:
d(x)=(ΣwATA)-1ΣwATΔb
其中F(x,y)t为t时刻图像中位于(x,y)位置的像素点的光流,则:
依次计算视频中前后两帧的光流,并与前一组光流比较相同像素点的光流,保留较大光流值。
3)最后使用孟塞尔颜色系统对上述保留的光流进行着色,不同的颜色对应不同方向,颜色的深浅表示速度的大小,最终得到最大光流图像。
光流是既有大小又有方向的矢量,能够表示像素点的瞬时速度。本步骤使用孟塞尔颜色系统对光流进行表示,使光流变得更加直观。孟塞尔颜色系统是色度学里用透明度、色相和色度三个维度来描述颜色的方法。经度即色相,把一周均分成五种主色,并将五种主色互相调和成五种中间色(红(R)、红黄(YR)、黄(Y)、黄绿(GY)、绿(G)、绿蓝(BG)、蓝(B)、蓝紫(PB)、紫(P)、紫红(RP)),相邻的两个位置之间再均分成10份,共100份。南北轴为明度的深浅,从全黑至全灰至全白。色度表示色调的纯度,其数值从中间(0)向外随着色调的纯度增加。孟塞尔颜色轮上一周不同的颜色与光流的方向相对应。颜色的深浅代表光流速度的大小。根据计算得到的每个像素点光流的水平位移和垂直位移得到运动方向(角度)和大小(幅值),将运动方向和大小与孟塞尔颜色轮相对应。
Claims (1)
1.一种具有速度信息的时序模板动作表示方法,其特征在于:按顺序进行的下列步骤:
1)使用混合高斯模型提取出视频帧的前景运动区域;
2)采用Farneback光流算法,计算上述前景运动区域的稠密光流,并比较前后两帧视频上同一像素点的光流,保留较大的光流,得到动作最大光流的分布;
3)最后使用孟塞尔颜色系统对上述保留的光流进行着色,不同的颜色对应不同方向,颜色的深浅表示速度的大小,最终得到最大光流图像;
在步骤2)中,所述的计算上述前景运动区域的稠密光流,并比较前后两帧视频上同一像素点的光流,保留较大的光流,得到动作最大光流的分布的方法为,假设特征窗口内的各像素点具有大致相同的光流速度;用多项式展开来近似每个像素周围邻近的点,每个特征窗口用局部多项式f(x)=xTAx+bTx+c近似,假设前后两帧像素点的位移变化是缓慢的,于是得到同一像素点前后两帧的光流位移;将此光流与前一帧的光流做对比,保留较大光流值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410811099.3A CN104537687B (zh) | 2014-12-22 | 2014-12-22 | 一种具有速度信息的时序模板动作表示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410811099.3A CN104537687B (zh) | 2014-12-22 | 2014-12-22 | 一种具有速度信息的时序模板动作表示方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104537687A CN104537687A (zh) | 2015-04-22 |
CN104537687B true CN104537687B (zh) | 2017-06-16 |
Family
ID=52853206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410811099.3A Expired - Fee Related CN104537687B (zh) | 2014-12-22 | 2014-12-22 | 一种具有速度信息的时序模板动作表示方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104537687B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107305692B (zh) * | 2016-04-14 | 2021-01-26 | 上海乐相科技有限公司 | 一种确定待测对象的运动信息的方法及装置 |
CN110842918B (zh) * | 2019-10-24 | 2020-12-08 | 华中科技大学 | 一种基于点云伺服的机器人移动加工自主寻位方法 |
CN113313042B (zh) * | 2021-06-08 | 2024-01-05 | 成都鼎辉智慧农业科技有限公司 | 一种图像处理方法、摄食状态检测方法及存储介质 |
CN113804917A (zh) * | 2021-09-17 | 2021-12-17 | 山东新一代信息产业技术研究院有限公司 | 一种基于点扩散估计的河流表面流速测量方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663429A (zh) * | 2012-04-11 | 2012-09-12 | 上海交通大学 | 运动目标的运动模式分类和动作识别的方法 |
-
2014
- 2014-12-22 CN CN201410811099.3A patent/CN104537687B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663429A (zh) * | 2012-04-11 | 2012-09-12 | 上海交通大学 | 运动目标的运动模式分类和动作识别的方法 |
Non-Patent Citations (1)
Title |
---|
光流场计算及其若干优化技术研究;路子赟;《万方学位论文数据库》;20121130;正文第22-23页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104537687A (zh) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428765B (zh) | 一种基于全局卷积、局部深度卷积融合的目标检测方法 | |
CN107168527B (zh) | 基于区域卷积神经网络的第一视角手势识别与交互方法 | |
CN105469113B (zh) | 一种二维视频流中的人体骨骼点追踪方法及系统 | |
CN103914699B (zh) | 一种基于色彩空间的自动唇彩的图像增强的方法 | |
CN104091348B (zh) | 融合显著特征和分块模板的多目标跟踪方法 | |
CN104537687B (zh) | 一种具有速度信息的时序模板动作表示方法 | |
CN101719015B (zh) | 指示手势的手指尖定位方法 | |
CN103098076B (zh) | 电视机控制用手势识别系统 | |
CN104318558B (zh) | 复杂场景下基于多信息融合的手势分割方法 | |
CN105718878A (zh) | 基于级联卷积神经网络的第一视角空中手写和空中交互方法 | |
CN107220949A (zh) | 公路监控视频中运动车辆阴影的自适应消除方法 | |
CN103218605B (zh) | 一种基于积分投影与边缘检测的快速人眼定位方法 | |
CN104835175B (zh) | 一种基于视觉注意机制的核环境中目标检测方法 | |
CN110176016B (zh) | 一种基于人体轮廓分割与骨骼识别的虚拟试衣方法 | |
Fei et al. | Visual tracking based on improved foreground detection and perceptual hashing | |
CN104167006B (zh) | 一种任意手形的手势跟踪方法 | |
CN105528794A (zh) | 基于混合高斯模型与超像素分割的运动目标检测方法 | |
Qiu-yu et al. | Hand gesture segmentation method based on YCbCr color space and K-means clustering | |
CN105739702A (zh) | 用于自然人机交互的多姿态指尖跟踪方法 | |
CN108320274A (zh) | 一种基于双通道循环生成对抗网络的红外视频彩色化方法 | |
CN103226708A (zh) | 一种基于Kinect的多模型融合视频人手分割方法 | |
CN104484040B (zh) | 一种多媒体互动教学控制系统及教学控制方法 | |
CN108830913A (zh) | 基于用户颜色引导的语义级别线稿上色方法 | |
CN104679242A (zh) | 基于单目视觉复杂背景下的手势分割方法 | |
CN105046721A (zh) | 基于Grabcut及LBP跟踪质心矫正模型的Camshift算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170616 Termination date: 20171222 |
|
CF01 | Termination of patent right due to non-payment of annual fee |