CN105678276A - 一种人体动作特征提取方法 - Google Patents
一种人体动作特征提取方法 Download PDFInfo
- Publication number
- CN105678276A CN105678276A CN201610036573.9A CN201610036573A CN105678276A CN 105678276 A CN105678276 A CN 105678276A CN 201610036573 A CN201610036573 A CN 201610036573A CN 105678276 A CN105678276 A CN 105678276A
- Authority
- CN
- China
- Prior art keywords
- motion vector
- vector data
- data
- motion
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人体动作特征提取方法,利用快速行人检测算法检测解码图像帧中的行人;剔除行人区域中的运动矢量数据获取相机运动参数估计数据;利用相机运动的对称性及矢量差分理论,基于前一步获得的数据估计相机运动参数;根据参数估计值,消除图像运动矢量数据中的相机运动矢量,还原实际人体运动矢量数据;基于修正后的矢量数据及解码图像提取人体动作局部时空特征。本方法通过重用视频码流中的编码数据进行快速相机运动消除,提升了人体动作局部时空特征描述的精确性,提高了人体动作识别率。
Description
技术领域
本发明属于自动视频分析技术领域,涉及一种快速人体动作自动识别方法,具体涉及一种人体动作特征快速提取方法。
背景技术
随着互联网的不断发展、视频监控系统的不断推广,视频数据量急剧增长。面对海量涌现的视频数据,如何快速分析其中包含的人体动作行为成为一个亟待解决的问题。目前运动特征提取算法运行速度慢,达不到在线快速视频分析工程要求。
发明内容
为了解决上述技术问题,本发明提供了一种快速的人体动作特征快速提取方法。
本发明所采用的技术方案是:一种人体动作特征提取方法,其特征在于,包括以下步骤:
步骤1:解码视频码流获取视频原始图像及图像运动矢量数据;
步骤2:在视频原始图像中检测行人;
步骤3:剔除行人区域中的图像运动矢量数据,获得相机运动参数估计矢量数据;
步骤4:基于相机运动的对称性及矢量差分理论,对相机运动参数估计矢量数据进行相机运动参数估计;
步骤5:根据估计参数值,消除视频运动矢量数据中的相机运动矢量,还原实际目标运动矢量数据,获得修正后的矢量数据;
步骤6:基于修正后的矢量数据及解码图像提取人体动作局部时空特征。
作为优选,步骤1中是利用开源工具FFMPEG解码视频码流获取视频原始图像及图像运动矢量数据,FFMPEG解码器根据视频码流编码格式,自动调用相应的解码器对码流进行解码,得到原始图像帧Fm和图像运动矢量数据MV={MV(k1),MV(k2),…,MV(K)},其中K为视频码流中宏块数。
作为优选,步骤2中是利用快速行人检测算法yolo在视频原始图像中检测行人,利用基于行人检测图片数据集事先离线训练好的yolo算法参数模型,检测原始图像帧Fm中的行人,获取行人在图像中的区域位置。
作为优选,步骤4的具体实现过程为,在视频解码得到压缩域P帧运动矢量数据后,基于图像中心原点构建图像坐标系XOY,X轴方向向右,Y轴方向向下;P帧中的每一个运动矢量能分解为平衡分量、伸缩分量和旋转分量的组合;相机运动参数方程表示为:
其中,tx和ty分别表示X轴和Y轴上的平衡变化;a1和a2控制伸缩和旋转变化;由此,相机运动估计转换为对tx、ty、a1和a2四个参数的估计;
在图像坐标系XOY下,任意点zi位置的运动矢量表示为:
MV(zi)=f(zi|A,T)-zi=(A-I)zi+T(2);
相机平移运动参数求解公式如下:
其中zI,zII,zIII,zIV分别为图像坐标系XOY第一、二、三、四象限中的像素点坐标;
应用公式3和公式4基于P帧运动矢量数据计算,得到参数T的初步估计值集合Tinit={TI_III,1,TI_III,2,…,TI_III,M,TII_IV,1,TII_IV,2,…,TII_IV,N};然后计算所有Ti数据的均值,并计算所有数据与此均值的残差,再将残差的绝对平均值作为阈值剔除对应残差绝对值大于这个阈值的异常数据,剩余初始Ti参数数据的均值作为最终参数T的估计值Testi=(tx_esti,ty_esti)T;
参数a1和a2求解公式如下:
其中z1=(i1,cy)T,z2=(i2,cy)T,i2=i1+sx,z3=(cx,j1)T,z4=(cx,j2)T,j2=j1+sy;
应用公式5、公式6、公式7和公式8基于P帧运动矢量数据计算,得到参数a1,a2的初步估计值集合a1_init={a1X_1,a1X_2,…,a1X_L,a1Y_1,a1Y_2,…,a1Y_K}和a2_init={a2X_1,a2X_2,…,a2X_R,a2Y_1,a2Y_2,…,a2Y_S},计算所有a1_i,a2_i参数数据均值,然后再计算所有数据与此均值的残差,并将残差的绝对平均值作为阈值剔除对应残差绝对值大于这个阈值的异常数据,剩余初始a1_i,a2_i参数数据的均值被作为最终参数a1,a2的估计值a1_esti,a2_esti。
作为优选,步骤5中所述消除视频压缩域运动矢量数据的相机运动矢量,计算公式如下:
作为优选,步骤6的具体实现过程为,将视频立体块按16行×16列×5帧切分成小块,并按小块计算HOG、HOF和MBH值;对小块视频HOG、HOF和MBH值按2×2×3块进行拼接,得到人体动作特征描述向量。
相对于现有技术,本发明的有益效果为:明显提升了动作特征提取速度,可应用于在线快速动作分析。
附图说明
图1是本发明实施例的流程图。
图2是本发明实施例的相机伸缩、旋转运动矢量对称消减示例图。
图3是本发明实施例的人体动作HOG、HOF、MBH特征提取方法图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
参见图1,本发明实施例提供的一种人体动作特征快速提取方法,具体包括以下步骤:
步骤1:利用开源工具FFMPEG解码视频码流获取视频原始图像及图像运动矢量数据。FFMPEG解码器根据视频码流编码格式,自动调用相应的解码器对码流进行解码,得到原始图像帧Fm和图像运动矢量数据MV={MV(k1),MV(k2),…,MV(K)},其中K为视频码流中宏块数。
步骤2:利用快速行人检测算法yolo在视频原始图像中检测行人。利用基于行人检测图片数据集事先离线训练好的yolo算法参数模型,检测原始图像帧Fm中的行人,获取行人在图像中的区域位置。
步骤3:剔除行人区域中的图像运动矢量数据,获得相机运动参数估计矢量数据MVesti={MV(l1),MV(l2),…,MV(L)}。
步骤4:利用相机运动的对称性及矢量差分理论,基于视频压缩域运动矢量数据进行相机运动参数估计。在相机运动参数估计矢量数据中,基于图像中心原点构建图像坐标系XOY(参见图2),X轴方向向右,Y轴方向向下。P帧中的每一个运动矢量可以分解为平衡分量、伸缩分量和旋转分量的组合。相机运动参数方程可以表示为:
其中,tx和ty分别表示X轴和Y轴上的平衡变化。a1和a2控制伸缩和旋转变化。由此,相机运动估计转换为对tx、ty、a1和a2四个参数的估计。
在图2所示的图像坐标系XOY下,任意点zi位置的运动矢量可表示为:
MV(zi)=f(zi|A,T)-zi=(A-I)zi+T(2);
请见图2,因为伸缩分量和旋转分量基于原点对称,所以第一、三象限和二、四象限的运动矢量和旋转分量可以对称消减,消减后剩下平移分量。因此,相机平移运动参数求解公式如下:
其中zI,zII,zIII,zIV分别为图像坐标系XOY第一、二、三、四象限中的像素点坐标;
应用公式3和公式4基于相机运动参数估计矢量数据MVesti计算,得到参数T的初步估计值集合Tinit={TI_III,1,TI_III,2,…,TI_III,M,TII_IV,1,TII_IV,2,…,TII_IV,N}。然后计算所有Ti数据的均值,并计算所有数据与此均值的残差,再将残差的绝对平均值作为阈值剔除对应残差绝对值大于这个阈值的异常数据,剩余初始Ti参数数据的均值作为最终参数T的估计值Testi=(tx_esti,ty_esti)T;
参数a1和a2求解公式如下:
其中z1=(i1,cy)T,z2=(i2,cy)T,i2=i1+sx,z3=(cx,j1)T,z4=(cx,j2)T,j2=j1+sy;
应用公式5、公式6、公式7和公式8基于相机运动参数估计矢量MVesti计算,得到参数a1,a2初步估计值集合a1_init={a1X_1,a1X_2,…,a1X_L,a1Y_1,a1Y_2,…,a1Y_K}和a2_init={a2X_1,a2X_2,…,a2X_R,a2Y_1,a2Y_2,…,a2Y_S},计算所有a1_i,a2_i参数数据均值,然后再计算所有数据与此均值的残差,并将残差的绝对平均值作为阈值剔除对应残差绝对值大于这个阈值的异常数据,剩余初始a1_i,a2_i参数数据的均值被作为最终参数a1,a2的估计值a1_esti,a2_esti。
步骤5:根据估计参数值,消除视频压缩域运动矢量数据中的相机运动矢量,还原实际目标运动矢量数据。计算公式如下:
步骤6:基于修正后的矢量数据MV′(z)及解码图像,提取HOG、HOF、MBH人体动作局部时空特征。对于视频每一帧(除去第1帧和最后14帧),连同其后14帧数据一起形成视频立体块。请见图3,将视频立体块按16行×16列×5帧切分成小块,并按小块计算HOG、HOF和MBH值。对小块视频HOG、HOF和MBH值按2×2×3块进行拼接,得到人体动作特征描述向量。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (6)
1.一种人体动作特征提取方法,其特征在于,包括以下步骤:
步骤1:解码视频码流获取视频原始图像及图像运动矢量数据;
步骤2:在视频原始图像中检测行人;
步骤3:剔除行人区域中的图像运动矢量数据,获得相机运动参数估计矢量数据;
步骤4:基于相机运动的对称性及矢量差分理论,对相机运动参数估计矢量数据进行相机运动参数估计;
步骤5:根据估计参数值,消除视频运动矢量数据中的相机运动矢量,还原实际目标运动矢量数据,获得修正后的矢量数据;
步骤6:基于修正后的矢量数据及解码图像提取人体动作局部时空特征。
2.根据权利要求1所述的人体动作特征提取方法,其特征在于:步骤1中是解码视频码流获取视频原始图像及图像运动矢量数据,得到原始图像帧Fm和图像运动矢量数据MV={MV(k1),MV(k2),…,MV(K)},其中K为视频码流中宏块数。
3.根据权利要求1所述的人体动作特征提取方法,其特征在于:步骤2中是利用快速行人检测算法在视频原始图像中检测行人,获取行人在图像中的区域位置。
4.根据权利要求1所述的人体动作特征提取方法,其特征在于:步骤4的具体实现过程为,在视频解码得到压缩域P帧运动矢量数据后,基于图像中心原点构建图像坐标系XOY,X轴方向向右,Y轴方向向下;P帧中的每一个运动矢量能分解为平衡分量、伸缩分量和旋转分量的组合;相机运动参数方程表示为:
其中,tx和ty分别表示X轴和Y轴上的平衡变化;a1和a2控制伸缩和旋转变化;由此,相机运动估计转换为对tx、ty、a1和a2四个参数的估计;
在图像坐标系XOY下,任意点zi位置的运动矢量表示为:
MV(zi)=f(zi|A,T)-zi=(A-I)zi+T(2);
相机平移运动参数求解公式如下:
其中zI,zII,zIII,zIV分别为图像坐标系XOY第一、二、三、四象限中的像素点坐标;
应用公式3和公式4基于P帧运动矢量数据计算,得到参数T的初步估计值集合Tinit={TI_III,1,TI_III,2,…,TI_III,M,TII_IV,1,TII_IV,2,…,TII_IV,N};然后计算所有Ti数据的均值,并计算所有数据与此均值的残差,再将残差的绝对平均值作为阈值剔除对应残差绝对值大于这个阈值的异常数据,剩余初始Ti参数数据的均值作为最终参数T的估计值Testi=(tx_esti,ty_esti)T;
参数a1和a2求解公式如下:
其中z1=(i1,cy)T,z2=(i2,cy)T,i2=i1+sx,z3=(cx,j1)T,z4=(cx,j2)T,j2=j1+sy;
应用公式5、公式6、公式7和公式8基于P帧运动矢量数据计算,得到参数a1,a2的初步估计值集合a1_init={a1X_1,a1X_2,…,a1X_…,a1Y_1,a1Y_2,…,a1Y_K}和a2_init={a2X_1,a2X_2,…,a2X_R,a2Y_1,a2Y_2,…,a2Y_S},计算所有a1_i,a2_i参数数据均值,然后再计算所有数据与此均值的残差,并将残差的绝对平均值作为阈值剔除对应残差绝对值大于这个阈值的异常数据,剩余初始a1_i,a2_i参数数据的均值被作为最终参数a1,a2的估计值a1_esti,a2_esti。
5.根据权利要求4所述的人体动作特征提取方法,其特征在于:步骤5中所述消除视频压缩域运动矢量数据的相机运动矢量,计算公式如下:
6.根据权利要求4所述的人体动作特征提取方法,其特征在于:步骤6的具体实现过程为,将视频立体块按16行×16列×5帧切分成小块,并按小块计算HOG、HOF和MBH值;对小块视频HOG、HOF和MBH值按2×2×3块进行拼接,得到人体动作特征描述向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610036573.9A CN105678276A (zh) | 2016-01-19 | 2016-01-19 | 一种人体动作特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610036573.9A CN105678276A (zh) | 2016-01-19 | 2016-01-19 | 一种人体动作特征提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105678276A true CN105678276A (zh) | 2016-06-15 |
Family
ID=56302011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610036573.9A Pending CN105678276A (zh) | 2016-01-19 | 2016-01-19 | 一种人体动作特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105678276A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934344A (zh) * | 2017-01-23 | 2017-07-07 | 西北大学 | 一种基于神经网络的快速行人检测方法 |
CN107330387A (zh) * | 2017-06-21 | 2017-11-07 | 哈尔滨工业大学深圳研究生院 | 基于图像数据的行人检测方法 |
CN107463912A (zh) * | 2017-08-10 | 2017-12-12 | 武汉大学深圳研究院 | 基于运动显著性的视频人体行为识别方法 |
CN108537117A (zh) * | 2018-03-06 | 2018-09-14 | 哈尔滨思派科技有限公司 | 一种基于深度学习的乘客检测方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101453557A (zh) * | 2008-12-30 | 2009-06-10 | 浙江大学 | 一种基于运动矢量对消和差分原理的快速全局运动估计方法 |
CN101453649A (zh) * | 2008-12-30 | 2009-06-10 | 浙江大学 | 压缩域视频流的关键帧提取方法 |
CN101511022A (zh) * | 2009-03-20 | 2009-08-19 | 北京航空航天大学 | 一种机载视频压缩与目标跟踪联合实现方法 |
WO2015044518A1 (en) * | 2013-09-29 | 2015-04-02 | Nokia Technologies Oy | Method and apparatus for video anti-shaking |
CN104866841A (zh) * | 2015-06-05 | 2015-08-26 | 中国人民解放军国防科学技术大学 | 一种人体目标奔跑行为检测方法 |
-
2016
- 2016-01-19 CN CN201610036573.9A patent/CN105678276A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101453557A (zh) * | 2008-12-30 | 2009-06-10 | 浙江大学 | 一种基于运动矢量对消和差分原理的快速全局运动估计方法 |
CN101453649A (zh) * | 2008-12-30 | 2009-06-10 | 浙江大学 | 压缩域视频流的关键帧提取方法 |
CN101511022A (zh) * | 2009-03-20 | 2009-08-19 | 北京航空航天大学 | 一种机载视频压缩与目标跟踪联合实现方法 |
WO2015044518A1 (en) * | 2013-09-29 | 2015-04-02 | Nokia Technologies Oy | Method and apparatus for video anti-shaking |
CN104866841A (zh) * | 2015-06-05 | 2015-08-26 | 中国人民解放军国防科学技术大学 | 一种人体目标奔跑行为检测方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934344A (zh) * | 2017-01-23 | 2017-07-07 | 西北大学 | 一种基于神经网络的快速行人检测方法 |
CN106934344B (zh) * | 2017-01-23 | 2020-01-31 | 西北大学 | 一种基于神经网络的快速行人检测方法 |
CN107330387A (zh) * | 2017-06-21 | 2017-11-07 | 哈尔滨工业大学深圳研究生院 | 基于图像数据的行人检测方法 |
CN107463912A (zh) * | 2017-08-10 | 2017-12-12 | 武汉大学深圳研究院 | 基于运动显著性的视频人体行为识别方法 |
CN108537117A (zh) * | 2018-03-06 | 2018-09-14 | 哈尔滨思派科技有限公司 | 一种基于深度学习的乘客检测方法和系统 |
CN108537117B (zh) * | 2018-03-06 | 2022-03-11 | 哈尔滨思派科技有限公司 | 一种基于深度学习的乘客检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105678276A (zh) | 一种人体动作特征提取方法 | |
CN107784294B (zh) | 一种基于深度学习的人脸检测与跟踪方法 | |
US20150302313A1 (en) | Method of predicating ultra-short-term wind power based on self-learning composite data source | |
CN104023225B (zh) | 基于空时域自然场景统计特征的无参考视频质量评估方法 | |
CN105426827A (zh) | 活体验证方法、装置和系统 | |
CN104036243B (zh) | 一种基于光流信息的行为识别方法 | |
JP2015069648A (ja) | 目標検出方法及び目標検出システム | |
EP2418622A3 (en) | Image processing method and image processing apparatus | |
CA2575211A1 (en) | Apparatus and method for processing video data | |
CN104966304A (zh) | 基于卡尔曼滤波与非参数背景模型的多目标检测跟踪方法 | |
CN101290682A (zh) | 一种运动目标检测方法及装置 | |
CN105376563A (zh) | 基于双目融合特征相似度的无参考立体图像质量评价方法 | |
CN104683802A (zh) | 一种基于h.264/avc压缩域的运动目标跟踪的方法 | |
CN104091350A (zh) | 一种利用运动模糊信息的物体跟踪方法 | |
TW201328359A (zh) | 基於壓縮域的移動物件偵測方法及裝置 | |
CN107093186A (zh) | 基于边缘投影匹配的剧烈运动检测方法 | |
Tiede et al. | GetContours: an interactive tongue surface extraction tool | |
CN103037206B (zh) | 视频传输方法和系统 | |
CN102118547A (zh) | 图像加权滤波的方法 | |
CN114359333A (zh) | 运动目标提取方法、装置、计算机设备和存储介质 | |
CN103824074A (zh) | 一种基于背景减除和纹理特征的人群密度估计方法及系统 | |
CN101877135A (zh) | 一种基于背景重构的运动目标检测方法 | |
KR102177494B1 (ko) | 모션벡터의 궤적 및 패턴을 이용한 압축영상의 이상모션 객체 식별 방법 | |
CN103647963A (zh) | 基于GoP场景复杂度的视频质量评价方法 | |
JP2020149604A (ja) | 路面状態検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160615 |
|
RJ01 | Rejection of invention patent application after publication |