CN110458235B - 一种视频中运动姿势相似度比对方法 - Google Patents

一种视频中运动姿势相似度比对方法 Download PDF

Info

Publication number
CN110458235B
CN110458235B CN201910748094.3A CN201910748094A CN110458235B CN 110458235 B CN110458235 B CN 110458235B CN 201910748094 A CN201910748094 A CN 201910748094A CN 110458235 B CN110458235 B CN 110458235B
Authority
CN
China
Prior art keywords
similarity
node
motion
difference
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910748094.3A
Other languages
English (en)
Other versions
CN110458235A (zh
Inventor
李进
姜冲
莫康华
王显珉
雷震光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kejia Smart Technology Co.,Ltd.
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN201910748094.3A priority Critical patent/CN110458235B/zh
Publication of CN110458235A publication Critical patent/CN110458235A/zh
Application granted granted Critical
Publication of CN110458235B publication Critical patent/CN110458235B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/248Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Abstract

本发明属于计算机视觉领域,为视频中运动姿势相似度比对方法,包括步骤:数据提取,并生成含有多个人体节点的骨架关键节点图;数据预处理,生成节点时序状态图;去除节点时序状态图中无变化部分,只保留节点在不同时间下的变化状态,生成节点时序变化特征图;根据节点时序变化特征图,通过差异算法计算得到差异值,综合每个节点在不同时间段的差异值组成全部节点的差异矩阵;根据差异矩阵通过相似度算法,计算出两个动作在动作姿势、动作幅度、动作速度三个维度的相似度。通过本发明所提供的相似度比对技术可高效快速准确的比对出运动姿势包括动作姿势、动作速度、动作幅度三个维度的相似度,可以应用在体育运动、健身纠错等领域。

Description

一种视频中运动姿势相似度比对方法
技术领域
本发明属于计算机视觉领域,具体涉及一种视频中运动姿势相似度比对方法。
背景技术
对视频中的运动姿势分析是计算机视觉研究与应用领域中的基本课题。随着人工智能技术的发展,这一课题也吸引着人们越来越多的兴趣。一方面是因为视频中的运动姿势在体育运动分析、动作纠错矫正等领域有着广泛的应用前景。另一方面,针对不同视频中的运动姿势比对分析技术包含着大量挑战,例如:运动视频提取角度的变化、光线的影响等等。
于2018年11月2日公布的发明专利申请CN108734104A,公开了一种基于深度学习的图像识别运动动作纠错系统。其训练的人体关节识别模型是基于VGG神经网络生成的,利用简单的欧式距离计算相似性,从识别准确度和识别速度上来看对于纠错运动动作有很大的局限性,并且上述发明申请重点应用场景是结合音乐节奏的运动动作,通过音乐来控制运动的开始和结束,还无法扩展到不受音乐约束的场景中去。
于2019年3月8日授权公告的发明专利CN103914677B,公开了一种动作识别方法及装置。其对动作的识别主要通过获取初始动作所对应的图像中人体轮廓的中心点为第一向量,和终止动作所对应的图像中人体局部轮廓的中心点为第二向量;计算所述第一向量和第二向量的差值;将所述差值与数据库中预置的数据列表进行比较,并根据比较结果将所述差值与相应的动作相关联。最终根据差分处理结果确定动作所对应的图像相似度。该专利只能针对一个视频处理,无法扩展到同时比对两个视频;同时,只能实现对动作姿势的比对,无法实现动作速度以及动作幅度的比对。
于2018年7月10日授权公告的发明专利CN105046193B,公开了一种基于融合稀疏表示矩阵的人体动作识别方法。依靠人体身上佩戴的传感器来获取动作矩阵,在动作识别阶段通过计算待识别动作向量与融合稀疏表示矩阵中各列向量的线性加权差值,选择线性加权差值最小的列向量所对应的动作种类为最终的识别结果。该发明受限于传感器的佩戴,无法大规模应用于动作识别领域,同时在比对过程中没有考虑动作速度、幅度的差异,导致在运动姿势相似度比对中表现一般。
因此,如何突破传统动作姿态比对技术方案的局限性,快速准确地实现视频中运动姿势相似度比对是目前此应用领域需要解决的问题。
发明内容
为了解决现有技术所存在的问题,本发明提供一种视频中运动姿势相似度比对方法,结合时序、空间距离等约束场景实现了将不同视频中人体运动的姿势进行提取对比分析。
根据本发明的视频中运动姿势相似度比对方法,包括以下步骤:
S1、数据提取,将视频图像以一定频率截取,将截取的视频图像生成含有多个人体节点的骨架关键节点图;
S2、数据预处理,分别对骨架关键节点图中的每个节点在不同时间段的运动变化状态进行分析,生成节点时序状态图,对节点时序状态图进行阈值处理;
S3、数据处理,去除节点时序状态图中无变化部分,只保留节点在不同时间下的变化状态,生成节点时序变化特征图;
S4、生成差异矩阵,根据节点时序变化特征图,将不同图像中的相同节点的变化特征从多个维度进行加权计算,通过差异算法计算得到差异值,综合每个节点在不同时间段的差异值组成全部节点的差异矩阵;
S5、差异化度量,根据差异矩阵通过相似度算法,计算出两个动作在动作姿势、动作幅度、动作速度三个维度的相似度。
与现有技术相比,本发明取得了如下技术效果:
1、本发明可实现将两个视频图像进行比对,应用场景更宽泛。
2、在识别阶段,本发明通过简单的视频采集并采用识别算法就可以提取人体中25个关键节点;经试验测试,准确度完全符合做下一步相似度比对的条件。
3、在运动姿势比对阶段,本发明考虑了时间差、动作幅度、动作速度等多个维度,实现了更全面的相似度比对分析。
附图说明
图1是本发明的相似度比对流程图;
图2中,(a)是骨架节点坐标图,(b)是归一化节点坐标图;
图3是节点时序状态图,其中(a)是某节点的原始序列图,(b)是对该节点采取高斯平滑过滤后的序列图。
图4是节点时序变化特征图,其中(a)、(b)、(c)、(d)分别由不同的节点时序状态图通过波峰波谷剪切法所得的子序列。
具体实施方式
为使本发明的目的、技术方案更加清楚明白,以下结合附图及实施例对本发明进行详细说明,但本发明的实施方式不限于此。
实施例
视频中运动姿势对比在体育科学训练中有着重要的作用,本发明需要解决关键问题是如何针对两段视频中相似的运动姿势进行对比并得到其相似度。例如在健身过程中,我们可以利用摄像头将动作姿势拍摄保存,通过技术处理后将自身健身动作与专业健身动作进行对比分析,从而进行纠错完善。
本发明首先使用基于OpenPose的人体动作识别算法对视频中的运动姿势进行识别检测,将识别的动作生成骨架关键节点图;随后针对每个骨架关键节点在不同时间段的运动变化,用阈值处理的方法生成节点时序状态图;利用剪切的手法对节点时序状态图进行修改得到节点变化特征图;最后运用差异算法得到不同视频之间的差异矩阵,从而计算出不同视频中运动姿势的相似度。本发明涉及的一些基本概念如下:
(1)OpenPose:OpenPose人体姿势识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以caffe为框架开发的开源库。可以实现人体动作、面部表情、手指运动等姿势估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿势估计应用,基于它的实例如雨后春笋般涌现。人体姿势估计技术在运动、动作采集、3D试衣、舆情监测等领域具有广阔的应用前景。针对本发明所应用于动作识别的场景,OpenPose可以高效精确的提供技术支持。
(2)归一化处理:数据的归一化处理是将数据按比例缩放,使之落入一个小的特定区间。由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。图像归一化是指对图像进行了一系列标准的处理变换,使之变换为一固定标准形式的过程,该标准图像称作归一化图像。
(3)阈值处理算法:图像阈值处理是实现图像分割的一种方法,由于阈值处理直观、实现简单且计算速度快,因此图像阈值处理在图像分割中处于核心地位。以ReLU函数和高斯滤波算法为核心,对节点时序状态图进行阈值处理可以突出节点的变化特征。其中,高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。
ReLU函数定义为:
x=max(x,0)
本实施例的视频中运动姿势相似度比对方法,包括以下步骤:
S1、数据提取,将视频图像以每秒5到10帧的频率截取,将截取的视频图像输入基于OpenPose的人体动作识别平台,生成含有25个人体节点的骨架关键节点图,如图2的(a)所示;对骨架关键节点归一化和平移操作,得到标准统一化的骨架关键节点图,如图2的(b)所示。归一化系数len为:
Figure BDA0002166270010000041
其中,i、j为骨架关键节点图中相连的节点,x、y为骨架关键节点的横坐标与纵坐标。将骨架关键节点中的节点按照归一化系数进行等比例缩放,可得到标准统一化的骨架节点图。
S2、数据预处理,分别对骨架关键节点图中的每个节点在不同时间段的运动变化状态进行分析,生成节点时序状态图,并用ReLU函数和高斯滤波算法对节点时序状态图进行阈值处理,强调节点在不同时间段的运动变化状态,如图3的(a)、(b)所示,实线是表示待对比动作序列,虚线是已有标准动作序列。
其中,对高斯滤波的泛化参数定义为8,即使用:
cv2.bilateralFilter(array,8)
S3、数据处理,利用波峰波谷剪切的手法去除节点时序状态图中无变化部分,只保留节点在不同时间下的变化状态(相当于只提取时序状态中的峰值),生成节点时序变化特征图,如图4,实线是表示待对比动作子序列,虚线是已有标准动作子序列。
S4、生成差异矩阵,根据节点时序变化特征图,将不同图像中的相同节点的变化特征从积分(S)、时间序列相似度量(DTW)、时间差(T)、平均值(A)、方差(V)、最大相似度等多个维度进行加权计算,通过差异算法计算得到差异值(例如相减得到差异值),综合每个节点在不同时间段的差异值组成全部节点的差异矩阵M。
Figure BDA0002166270010000042
N代表由波峰波谷波剪切法所得N个子序列(如图3,图4综合所示),将子序列所求得的DTW、S、T、A、V代入差异矩阵,即可通过卷积网络降维至(0-100)得分之间,其中0代表完全不相似,100代表完全相似。
其中,积分S、时间差T、平均值A、方差V等的定义分别如下:
Figure BDA0002166270010000043
Figure BDA0002166270010000044
Figure BDA0002166270010000045
Figure BDA0002166270010000051
S5、差异化度量,根据差异矩阵通过相似度算法,计算出两个动作的相似度。
本实施例中,将节点的差异矩阵中不同节点全时间段的差异值加权相加,得出两个动作的整体差异值DTW。其中,对DTW的定义为:
Figure BDA0002166270010000052
其中,a为待对比动作序列,b为已有标准动作序列,i、j分别为a、b序列的时间帧。
待对比动作序列a与已有标准动作序列b的最长公共子串的长度记为c。且设置了一个最大标准差的偏移容忍。也就是说,若a、b(a≠b)之间由抖动所产生的差值在这个最大标准差的偏移容忍内,则可认为属于抖动情况,也一并归入c中,并定义α为惩罚因子以抑制正常抖动对量化匹配相似度的影响:
Figure BDA0002166270010000053
将整体差异值运用相似度算法可得两个动作在动作姿势、动作幅度、动作速度三个维度的相似度,从而将本发明比对方法应用在体育运动、健身纠错等领域。其中,相似度acc计算方法如下:
Figure BDA0002166270010000054
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种视频中运动姿势相似度比对方法,其特征在于,包括以下步骤:
S1、数据提取,将视频图像以一定频率截取,将截取的视频图像生成含有多个人体节点的骨架关键节点图;
S2、数据预处理,分别对骨架关键节点图中的每个节点在不同时间段的运动变化状态进行分析,生成节点时序状态图,对节点时序状态图进行阈值处理;
S3、数据处理,去除节点时序状态图中无变化部分,只保留节点在不同时间下的变化状态,生成节点时序变化特征图;
S4、生成差异矩阵,根据节点时序变化特征图,将不同图像中的相同节点的时序变化特征从多个维度进行加权计算,通过差异算法计算得到差异值,综合每个节点在不同时间段的差异值组成全部节点的差异矩阵;
S5、差异化度量,根据差异矩阵通过相似度算法,计算出两个动作在动作姿势、动作幅度、动作速度三个维度的相似度;
步骤S4所述多个维度包括积分S、时间序列相似度量DTW、时间差T、平均值A、方差V和最大相似度。
2.根据权利要求1所述的视频中运动姿势相似度比对方法,其特征在于,步骤S1还对骨架关键节点归一化和平移操作,得到标准统一化的骨架关键节点图。
3.根据权利要求2所述的视频中运动姿势相似度比对方法,其特征在于,归一化的系数len为:
Figure FDA0003396668800000011
其中,i、j为骨架关键节点图中相连的节点,x、y为骨架关键节点的横坐标与纵坐标。
4.根据权利要求1所述的视频中运动姿势相似度比对方法,其特征在于,步骤S2用ReLU函数和高斯滤波算法对节点时序状态图进行阈值处理。
5.根据权利要求1所述的视频中运动姿势相似度比对方法,其特征在于,步骤S5进行差异化度量时,将节点的差异矩阵中不同节点全时间段的差异值加权相加,得出两个动作的整体差异值,将整体差异值运用相似度算法得到两个动作在动作姿势、动作幅度、动作速度三个维度的相似度。
6.根据权利要求5所述的视频中运动姿势相似度比对方法,其特征在于,整体差异值DTW的定义为:
Figure FDA0003396668800000021
其中,a为待对比动作序列,b为已有标准动作序列,i、j分别为a、b序列的时间帧。
7.根据权利要求6所述的视频中运动姿势相似度比对方法,其特征在于,设待对比动作序列a与已有标准动作序列b的最长公共子串的长度为c;设置一个最大标准差的偏移容忍,若待对比动作序列a与已有标准动作序列b之间由抖动所产生的差值在所述最大标准差的偏移容忍内,则认为属于抖动情况,也一并归入c中;定义α为惩罚因子以抑制正常抖动对量化匹配相似度的影响:
Figure FDA0003396668800000022
则相似度acc计算方法如下:
Figure FDA0003396668800000023
CN201910748094.3A 2019-08-14 2019-08-14 一种视频中运动姿势相似度比对方法 Active CN110458235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910748094.3A CN110458235B (zh) 2019-08-14 2019-08-14 一种视频中运动姿势相似度比对方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910748094.3A CN110458235B (zh) 2019-08-14 2019-08-14 一种视频中运动姿势相似度比对方法

Publications (2)

Publication Number Publication Date
CN110458235A CN110458235A (zh) 2019-11-15
CN110458235B true CN110458235B (zh) 2022-04-01

Family

ID=68486471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910748094.3A Active CN110458235B (zh) 2019-08-14 2019-08-14 一种视频中运动姿势相似度比对方法

Country Status (1)

Country Link
CN (1) CN110458235B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507301B (zh) * 2020-04-26 2021-06-08 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备以及存储介质
CN111556358B (zh) * 2020-05-20 2022-03-01 维沃移动通信(杭州)有限公司 显示方法、装置和电子设备
CN113505662B (zh) * 2021-06-23 2024-03-01 广州大学 一种健身指导方法、装置及存储介质
CN115223240B (zh) * 2022-07-05 2023-07-07 北京甲板智慧科技有限公司 基于动态时间规整算法的运动实时计数方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577793B (zh) * 2012-07-27 2017-04-05 中兴通讯股份有限公司 手势识别方法及装置
US10078780B2 (en) * 2015-03-27 2018-09-18 Intel Corporation Gesture recognition mechanism
CN105512621B (zh) * 2015-11-30 2019-04-09 华南理工大学 一种基于Kinect的羽毛球动作指导系统
CN108664896A (zh) * 2018-04-16 2018-10-16 彭友 基于OpenPose的击剑动作获取方法及计算机存储介质
CN108764120B (zh) * 2018-05-24 2021-11-09 杭州师范大学 一种人体规范动作评价方法

Also Published As

Publication number Publication date
CN110458235A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
Jegham et al. Vision-based human action recognition: An overview and real world challenges
CN110458235B (zh) 一种视频中运动姿势相似度比对方法
Du et al. Representation learning of temporal dynamics for skeleton-based action recognition
Zeng et al. Silhouette-based gait recognition via deterministic learning
CN109815826B (zh) 人脸属性模型的生成方法及装置
KR102174595B1 (ko) 비제약형 매체에 있어서 얼굴을 식별하는 시스템 및 방법
Ji et al. Interactive body part contrast mining for human interaction recognition
CN109919977B (zh) 一种基于时间特征的视频运动人物跟踪与身份识别方法
Ji et al. Learning contrastive feature distribution model for interaction recognition
CN107169117B (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
CN111339847A (zh) 一种基于图卷积神经网络的人脸情绪识别方法
CN111401211B (zh) 一种采用图像增广和小样本学习的虹膜识别方法
Bu Human motion gesture recognition algorithm in video based on convolutional neural features of training images
Xia et al. LAGA-Net: Local-and-global attention network for skeleton based action recognition
Zhang et al. A survey on face anti-spoofing algorithms
Kishore et al. Selfie sign language recognition with convolutional neural networks
Qian et al. Joint optimal transport with convex regularization for robust image classification
Lee et al. Enhanced iris recognition method by generative adversarial network-based image reconstruction
Yang et al. A robust iris segmentation using fully convolutional network with dilated convolutions
Wu et al. Appearance-based gaze block estimation via CNN classification
CN112906520A (zh) 一种基于姿态编码的动作识别方法及装置
Zhang et al. A Gaussian mixture based hidden Markov model for motion recognition with 3D vision device
Zhou et al. A study on attention-based LSTM for abnormal behavior recognition with variable pooling
Lu et al. Image-specific prior adaptation for denoising
Angelopoulou et al. Evaluation of different chrominance models in the detection and reconstruction of faces and hands using the growing neural gas network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230505

Address after: 901, No. 4 Yunchuang Street, Huangpu District, Guangzhou City, Guangdong Province, 510000 (Part 1)

Patentee after: Guangzhou Kejia Smart Technology Co.,Ltd.

Address before: 510006 No. 230 West Ring Road, Panyu District University, Guangdong, Guangzhou

Patentee before: Guangzhou University