CN105930789B - 基于对数欧式空间词袋模型的人体行为识别 - Google Patents

基于对数欧式空间词袋模型的人体行为识别 Download PDF

Info

Publication number
CN105930789B
CN105930789B CN201610241082.8A CN201610241082A CN105930789B CN 105930789 B CN105930789 B CN 105930789B CN 201610241082 A CN201610241082 A CN 201610241082A CN 105930789 B CN105930789 B CN 105930789B
Authority
CN
China
Prior art keywords
space
logarithm
video
behavioural characteristic
theorem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610241082.8A
Other languages
English (en)
Other versions
CN105930789A (zh
Inventor
解梅
黄成挥
程石磊
周扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Houpu Clean Energy Group Co ltd
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201610241082.8A priority Critical patent/CN105930789B/zh
Publication of CN105930789A publication Critical patent/CN105930789A/zh
Application granted granted Critical
Publication of CN105930789B publication Critical patent/CN105930789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于对数欧式空间词袋模型的人体行为识别,属于数字图像处理技术领域。本发明首先将输入视频分成固定长度且相互重叠的视频段,然后再将各视频段切分为固定大小并部分重叠的时空立方块,对每个时空立方块提取梯度与光流特征协方差或者形状特征协方差,并采用对称正定矩阵降维方法对协方差矩阵进行降维。对协方差矩阵进行对数变化,提取对数协方差上三角特征转换为对数欧式空间向量。在对数欧式采用词袋模型进行行为建模,采用谱聚类对行为特征聚类生成码本,并采用局部约束线性编码技术LLC对行为特征进行编码。利用非线性支撑向量机对行为特征进行训练与识别分类。本发明用于人体行为识别,其鲁棒性极好。

Description

基于对数欧式空间词袋模型的人体行为识别
技术领域
本发明属于数字图像处理技术领域,涉及计算机视觉、模式识别等相关理论知识,尤其是基于对数欧式空间词袋模型的人体行为识别。
背景技术
人体行为识别是计算机视觉领域的研究热点和难点,其核心是利用计算机视觉技术自动从视频序列中检测、跟踪、识别人并对其行为进行理解和描述。人体运动分析和行为识别算法是人体行为理解的核心内容,主要包括对视频人体检测,跟踪运动人体,获取人体行为的相关参数,最终达到理解人体行为的目的。
人体行为识别方法主要运用于智能监控系统,主动、实时地分析视频中人体行为,及时报告可疑行为;基于内容的视频检索,对视频内容进行分析和理解,简历结构和索引;还广泛应用于人体交互、机器人、智能房间和看护中心。
人体行为识别主要由人体行为表示和人体行为识别分类两个基本步骤构成,它们对人体行为识别率有显著的影响。当前人体行为识别方法主要有:
一):基于时空兴趣点云的行为识别。从不同的时间尺度提取兴趣点积累成点云,并避免对背景和静态前景检测。采用近邻分类或者支撑向量机SVM进行识别分类。该方式可以捕获平滑运动,对视角改变具有鲁棒性,遮挡处理代价小,详见文献“Matteo Bregonzio,Shaogang Gong and Tao Xiang.Recognising Action as Clouds of Space-TimeInterest Points.IEEE Conference on Computer Vision and Pattern Recognition(CVPR),June 2009.”;
二):基于深度轨迹的行为识别。对每帧像素进行深度采样,并利用深度光流场中位移信息跟踪特征点。基于一机遇运动边界直方图的描述子,对相机运动具有鲁棒性。深度轨迹对不规则运动以及镜头边界具有鲁棒性,能很好的提取视频中的运动信息。实验结果表明比大部分特征描述方法具有更好的识别准确率,详见文献“Heng Wang,Klaser,A.,Schmid,C.,Cheng-Lin Liu.Action Recognition by Dense Trajectories.IEEEConference on Computer Vision and Pattern Recognition(CVPR),June 2011.”;
三):基于协方差的行为识别方法。提取连续视频序列中的协方差特征,转换到对数欧式空间,使用对数欧式空间距离度量方式。采用最近邻分类算法或者稀疏线性估计算法进行识别分类。该方式框架简单,计算复杂度低,能很好的应对人体行为差异、视角变换以及低分辨率等问题,并且识别准确率极高,详见文献“Kai Guo,Prakash Ishwar,JanuszKonrad.Action Recognition from Video Using Feature Covariance Matrices.IEEETransactions on Image Processing,Mar 2013.”。
人体行为识别在实现时由于受到人体行为的类间变化和类内变化、行为执行环境和摄像机位置和人体行为在时空中的变化等因素的影响,大大限制了识别准确率的提升。行为表征中往往不能有效融合不同特征,降低特征表征力度,减少外界干扰。
发明内容
本发明的发明目的在于:针对上述存在的问题,提出了一种基于局部协方差特征的人体行为识别方法。
本发明的基于局部协方差特征的人体行为识别方法包括下列步骤:
步骤1:提取输入视频的行为特征:
将输入视频分成长度固定且相互重叠的视频段,再将视频段分为固定大小且相互重叠的时空立方块,按照时间轴的方向来看,则时空立方块为长方体;
对时空立方块中各像素点进行特征提取,得到像素点(x,y,t)的行为特征向量f(x,y,t),其中(x,y)表示像素点的平面坐标,t表示像素点的视频帧信息;特征提取的方式为梯度光流特征或者形状特征:当采用梯度光流特征时,分别计算像素点(x,y,t)沿x、y方向的一阶、二阶梯度绝对值:|Ix|,|Iy|,|Ixx|,|Iyy|,沿x,y,t方向的光流u,v,w,以及u,v,w对t求偏导数,则f(x,y,t)=[g,o],其中当采用形状特征时,提取当前时空立方块的前景图像,再在前景图像中,分别计算坐标位置(x,y,t)到前景图像的轮廓边界的水平与垂直四个方向的距离dE,dw,dS,dN,坐标位置(x,y,t)到前景图像的轮廓的最小外接矩形的顶点的距离dNE,dSW,dSE,dNW;计算像素点(x,y,t)所在视频帧与当前时空立方块的起始帧的间隔帧数、与当前时空立方块的结束帧的间隔帧数,则
为了简化描述,用f(s)表示为特征向量f(x,y,t),其中s对应像素点(x,y,t)。基于每个视频段的各时空立方块的行为特征f(s)构建协方差矩阵F,即一个时空立方块对应一个协方差矩阵F,
其中协方差矩阵F:其中S表示视频段的不同时空立方块对应的区域,|S|表示时空立方块S中像素点总数目,s表示区域S中的像素点;
步骤2:将协方差矩阵F转换为对数协方差矩阵,再转换为对数欧式空间的向量,采用词袋模型进行行为建模,并对所述对数欧式空间的向量进行谱聚类,生成行为特征码本;
步骤3:基于行为特征码本,采用基于局部坐标编码LLC对所述对数欧式空间的向量进行编码,得到编码行为特征;
步骤4:采用SVM分类对编码行为特征进行行为分类器训练,得到不同行为的行为分类器;
步骤5:对待识别视频执行步骤1-4,基于行为分类器进行人体行为识别处理。
优选的,在将协方差矩阵F转换为对数协方差矩阵前,还包括采用对称正定矩阵降维方法对协方差矩阵F进行降维处理。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
(1)提出两种特征表示方法(特征提取方式),梯度光流特征或者形状协方差特征,能够有效地描述人体运动信息,从而保证识别准确率。
(2)在对称正定矩阵空间对协方差进行降维,不仅可以降低特征维数并且可以提高特征类内聚合度以及类间离散度,从而提高计算速度和识别准确率。
(3)采用谱聚类方式生成码本,其建立在谱图理论基础上,能在任意形状空间上聚类且收敛于全局最优解的优点。
(4)采用LLC对行为特征进行编码,使编码具有良好的重构性,保持局部平滑,并且具有解析解。
附图说明
图1是具体实施方式中,本发明的处理流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合实施方式和附图,对本发明作进一步地详细描述。
参见图1,本发明的实现包括下列步骤:
步骤S01:输入视频。
步骤S02:提取输入视频的协方差特征,即提取行为特征向量f(s)。
首先,将输入视频分成长度为L帧(一个完整的人体行为大约为0.4s~0.6s,L的长度至少设置为涵盖完整人体行为,通常L可取20)且相互重叠的视频段。提取视频段的移动步长可根据实际情况调整(如设置为8帧)。将视频段分为相互重叠的长方体块,即将每个视频段划分为多个固定大小且重叠的时空立方块,视频段的每帧图像按照相同的划分方式将图像划分为多个固定大小且重叠的图像块,视频段所有图像帧的同一位置的图像块构成一个时空立方块。图像块的大小根据图像像素设置(如12*12),移动步长决定重叠区域,根据实验进行调整(如4(像素))。相互重叠的时空立方块是为了保持局部特征以及空间位置特征。
对时空立方块中各像素点进行特征提取,得到像素点(x,y,t)的行为特征向量f(x,y,t),令f(s)=f(x,y,t),对行为特征向量f(s)进行组合计算协方差矩阵F,即其中其中cov(F)表示协方差矩阵F,S表示视频段的不同时空立方块对应的区域,|S|表示时空立方块S中像素点总数目,s表示区域S中的像素点。若对像素点(x,y,t)采用梯度光流特征进行行为特征向量提取时,则可得到12*12维的协方差矩阵F;若对像素点(x,y,t)采用形状特征进行行为特征向量提取时,则可得到13*13维的协方差矩阵F。
采用对称正定矩阵降维方法对cov(F)进行降维,得到降维后的协方差矩阵F′,其中F′为n*n维协方差矩阵。
步骤S03:对协方差矩阵F′进行对数变化得到对数协方差矩阵log(F′),其中即将协方差矩阵F′进行特征值分解为F′=U diag(λ12,…,λn)UT,diag(λ12,…,λn)是协方差矩阵F′的特征值构成的对角矩阵,再基于特征值分解Udiag(λ12,…,λn)UT得到log(F′)。
将log(F′)转换为对数欧式空间的向量 其中F′为n*n维对数协方差矩阵。
步骤S04:对步骤S03中得到的对数欧式空间的向量vec(F′)进行谱聚,输出聚类结果;
步骤S05:基于步骤S04输出的聚类结果,生成行为特征码本;
步骤S06:基于行为特征码本,采用基于局部坐标编码LLC对vec(F′)进行编码,得到编码行为特征;
步骤S07:采用交叉验证的方法随机提取各人体行为对应的视频段的编码行为特征进行分类器训练,得到不同行为的行为分类器;
在样本测试时,将基于步骤S01-S06得到的对应视频段的编码行为特征作为各行为分类器的输入,输出匹配结果,取最佳匹配结果作为当前测试的视频段的识别结果。
将本发明在标准人体行为数据库Weizmann、KTH、ADL进行实验表明,本发明提出的技术方案相较于传统方案具有更好的识别准确率,并对视角变化、人体行为差异以及低分辨率具有良好的鲁棒性。
以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。

Claims (1)

1.一种基于对数欧式空间词袋模型的人体行为识别,其特征在于,包括下列步骤:
步骤1:提取输入视频的行为特征:
将输入视频分成长度固定且相互重叠的视频段,再将视频段分为固定大小且相互重叠的时空立方块;
对时空立方块中各像素点进行特征提取,得到像素点(x,y,t)的行为特征向量f(x,y,t),其中(x,y)表示像素点的平面坐标,t表示像素点的视频帧信息;
特征提取的方式为梯度光流特征或者形状协方差特征:当采用梯度光流特征时,分别计算像素点(x,y,t)沿x、y方向的一阶、二阶梯度绝对值:|Ix|,|Iy|,|Ixx|,|Iyy|,沿x,y,t方向的光流u,v,w,以及u,v,w对t求偏导数,则f(x,y,t)=[g,o],其中当采用形状特征时,提取当前时空立方块的前景图像,再在前景图像中,分别计算坐标位置(x,y,t)到前景图像的轮廓边界的水平与垂直四个方向的距离dE,dw,dS,dN,坐标位置(x,y,t)到前景图像的轮廓的最小外接矩形的顶点的距离dNE,dSW,dSE,dNW;计算像素点(x,y,t)所在视频帧与当前时空立方块的起始帧的间隔帧数与当前时空立方块的结束帧的间隔帧数
基于每个视频段的各时空立方块的行为特征向量f(x,y,t)构建协方差矩阵F:其中S表示视频段的不同时空立方块对应的区域,|S|表示时空立方块S中像素点总数目;
步骤2:采用对称正定矩阵降维方法对协方差矩阵F进行降维处理,得到降维后的协方差矩阵F′,其中F′为n*n维协方差矩阵;
将协方差矩阵F′进行特征值分解为F′=Udiag(λ12,…,λn)UT,diag(λ12,…,λn)是协方差矩阵F′的特征值构成的对角矩阵,再基于特征值分解F′=Udiag(λ12,…,λn)UT得到对数协方差矩阵log(F′),其中log(F′)=Udiag(log(λ1),log(λ2),…,log(λn))UT
将log(F′)转换为对数欧式空间的向量:
采用词袋模型进行行为建模,并对所述对数欧式空间的向量vec(F′)进行谱聚类;再基于聚类结果生成行为特征码本;
步骤3:基于行为特征码本,采用基于局部坐标编码LLC对所述对数欧式空间的向量vec(F′)进行编码,得到编码行为特征;
步骤4:采用SVM分类对编码行为特征进行行为分类器训练,得到不同行为的行为分类器;
步骤5:对待识别视频执行步骤1-4,基于行为分类器进行人体行为识别处理。
CN201610241082.8A 2016-04-18 2016-04-18 基于对数欧式空间词袋模型的人体行为识别 Active CN105930789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610241082.8A CN105930789B (zh) 2016-04-18 2016-04-18 基于对数欧式空间词袋模型的人体行为识别

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610241082.8A CN105930789B (zh) 2016-04-18 2016-04-18 基于对数欧式空间词袋模型的人体行为识别

Publications (2)

Publication Number Publication Date
CN105930789A CN105930789A (zh) 2016-09-07
CN105930789B true CN105930789B (zh) 2019-08-13

Family

ID=56838315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610241082.8A Active CN105930789B (zh) 2016-04-18 2016-04-18 基于对数欧式空间词袋模型的人体行为识别

Country Status (1)

Country Link
CN (1) CN105930789B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777050B (zh) * 2016-12-09 2019-09-06 大连海事大学 一种基于词袋模型且兼顾语义相关性的鞋印花纹表达方法及系统
CN110533636B (zh) * 2019-07-31 2023-08-04 平安科技(深圳)有限公司 一种图像分析装置
CN111723740A (zh) * 2020-06-19 2020-09-29 深圳前海微众银行股份有限公司 数据识别方法、装置、设备及计算机可读存储介质
US11693919B2 (en) * 2020-06-22 2023-07-04 Shanghai United Imaging Intelligence Co., Ltd. Anatomy-aware motion estimation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036243A (zh) * 2014-06-06 2014-09-10 电子科技大学 一种基于光流信息的行为识别方法
CN104299007A (zh) * 2014-09-17 2015-01-21 电子科技大学 一种用于行为识别的分类器训练方法
CN104778476A (zh) * 2015-04-10 2015-07-15 电子科技大学 一种图像分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036243A (zh) * 2014-06-06 2014-09-10 电子科技大学 一种基于光流信息的行为识别方法
CN104299007A (zh) * 2014-09-17 2015-01-21 电子科技大学 一种用于行为识别的分类器训练方法
CN104778476A (zh) * 2015-04-10 2015-07-15 电子科技大学 一种图像分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Action Recognition in Video by Covariance Matching of Silhouette Tunnels;Kai Guo et al.;《XXII Brazilian Symposium on Computer Graphics and Image Processing》;20100122;第299-306页 *
From Manifold to Manifold: Geometry-Aware Dimensionality Reduction for SPD Matrices;Mehrtash T. Harandi et al.;《Recognizing Complex Events in Videos by Learning Key Static-Dynamic Evidences》;20140731;第17-32页 *
基于视频的人体动作分析与识别的研究;杨江峰;《中国博士学位论文全文数据库 信息科技辑》;20160315;第I138-118页 *

Also Published As

Publication number Publication date
CN105930789A (zh) 2016-09-07

Similar Documents

Publication Publication Date Title
Ding et al. Violence detection in video by using 3D convolutional neural networks
CN104933414B (zh) 一种基于wld-top的活体人脸检测方法
Avgerinakis et al. Recognition of activities of daily living for smart home environments
Huang et al. Human action recognition using histogram of oriented gradient of motion history image
Ramya et al. A modified frame difference method using correlation coefficient for background subtraction
CN105930790B (zh) 基于核稀疏编码的人体行为识别方法
CN105930789B (zh) 基于对数欧式空间词袋模型的人体行为识别
JP2017531883A (ja) 画像の主要被写体を抽出する方法とシステム
Fan et al. Iterative particle filter for visual tracking
Khan et al. Multiple human detection in depth images
KR20170036747A (ko) 장면 내 키포인트를 추적하기 위한 방법
CN106909883A (zh) 一种基于ros的模块化手部区域检测方法和装置
CN110458235A (zh) 一种视频中运动姿势相似度比对方法
Wu et al. Recognition of Student Classroom Behaviors Based on Moving Target Detection.
Saif et al. Real time vision based object detection from UAV aerial images: a conceptual framework
KR20190009006A (ko) 전역적 움직임 기반의 실시간 다중 객체 추적 장치 및 방법
Basavaiah et al. Robust Feature Extraction and Classification Based Automated Human Action Recognition System for Multiple Datasets.
Yang et al. Wearable social camera: Egocentric video summarization for social interaction
Guangjing et al. Research on static image recognition of sports based on machine learning
Li et al. Combining localized oriented rectangles and motion history image for human action recognition
Chung et al. Face detection and posture recognition in a real time tracking system
Yang et al. MediaCCNY at TRECVID 2012: Surveillance Event Detection.
Lo et al. Motion boundary trajectory for human action recognition
Supreeth et al. An adaptive SVM technique for object tracking
Gupta et al. Comparative analysis of movement and tracking techniques for Indian sign language recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210513

Address after: No.3, 11th floor, building 6, no.599, shijicheng South Road, Chengdu hi tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610041

Patentee after: Houpu clean energy Co.,Ltd.

Address before: 611731, No. 2006, West Avenue, Chengdu hi tech Zone (West District, Sichuan)

Patentee before: University of Electronic Science and Technology of China

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: No.3, 11th floor, building 6, no.599, shijicheng South Road, Chengdu hi tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610041

Patentee after: Houpu clean energy (Group) Co.,Ltd.

Address before: No.3, 11th floor, building 6, no.599, shijicheng South Road, Chengdu hi tech Zone, China (Sichuan) pilot Free Trade Zone, Chengdu, Sichuan 610041

Patentee before: Houpu clean energy Co.,Ltd.

CP01 Change in the name or title of a patent holder