CN111680586A - 一种羽毛球运动员运动姿态估计方法及系统 - Google Patents
一种羽毛球运动员运动姿态估计方法及系统 Download PDFInfo
- Publication number
- CN111680586A CN111680586A CN202010452902.4A CN202010452902A CN111680586A CN 111680586 A CN111680586 A CN 111680586A CN 202010452902 A CN202010452902 A CN 202010452902A CN 111680586 A CN111680586 A CN 111680586A
- Authority
- CN
- China
- Prior art keywords
- point
- human body
- camera
- image
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 14
- 210000000988 bone and bone Anatomy 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 4
- 230000000873 masking effect Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 3
- 239000011435 rock Substances 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 abstract description 6
- 210000003414 extremity Anatomy 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 210000003423 ankle Anatomy 0.000 description 4
- 210000003127 knee Anatomy 0.000 description 4
- 210000000707 wrist Anatomy 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000004247 hand Anatomy 0.000 description 2
- 210000001364 upper extremity Anatomy 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/23—Recognition of whole body movements, e.g. for sport training
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/96—Management of image or video recognition tasks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/90—Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人体姿态估计领域,具体涉及一种羽毛球运动员运动姿态估计方法及系统;本发明先采集包含羽毛球运动员运动姿态图像,并对所述运动姿态图像进行预处理;再将预处理后所述运动姿态图像输入到预先训练好的预测网络模型中进行预测,最后输出一组图像像素坐标系下的人体骨骼点坐标。本发明通过以一种新的深度神经网络模型对单帧图像进行预测的方法,来得到在图像像素坐标系下的一组人体骨骼点坐标。本发明提出的深度神经网络模型在整体流程中减少了卷积层的数量,缩短了预测的时间,与传统的人体姿态估计模型相比,该模型预测时间更短,效率更高。
Description
技术领域
本发明涉及人体姿态估计领域,特别是一种羽毛球运动员运动姿态估计方法及系统。
背景技术
人体姿态估计的主要目的是通过摄像头等设备让计算机在复杂场景下估计人体姿态的具体内容,以方便进行后续的动作分类和评估。大多数方法都将人体姿态评估转化为人体骨骼点的预测,其中有两个主流方向:一是使用双目视觉系统(或单目视觉系统加深度相机)采集图像像素坐标系下的坐标,通过图像像素坐标系向世界坐标系下进行转换,计算人体骨骼点的三维坐标坐标;二是使用单目视觉系统借助深度神经网络预测图像像素坐标系下人体姿态的坐标。
目前来说,使用深度相机方法所形成的Kinect等产品虽然可以生成世界坐标系(三维坐标系)下采集人体骨骼点坐标,但是由于视觉系统的限制导致其产品价格居高不下,导致Kinect的应用层面并不广泛。而使用单目视觉方法所形成的大多都还局限与理论和实验室层面,预测网络模型对于硬件平台的要求高,虽然大多预测出的都是图像像素坐标系下的人体骨骼点坐标,但是后续的姿态评估不完善。
发明内容
本发明的目的在于:针对现有技术中针对图像像素坐标系下的姿态评估不完善、以及成本高的问题,提供一种羽毛球运动员运动姿态估计方法及系统。
为了实现上述目的,本发明采用的技术方案为:
一种羽毛球运动员运动姿态估计方法,包括以下步骤:
S1:采集包含人体骨骼点的羽毛球运动员运动姿态图像,并对所述运动姿态图像进行预处理;
S2:将所述运动姿态图像输入到预先训练好的预测网络模型中进行预测,输出一组图像像素坐标系下的人体骨骼点坐标;
其中,所述预测网络模型包括:VGG阶段以及4个stage阶段;所述VGG阶段由多个卷积层以及池化层依次串联而成;每个所述stage阶段包含两个分支:一条分支用于计算人体肢体概率置信图,一条分支用于计算人体关节点概率置信图;所述人体骨骼点坐标通过提取最后一个所述stage阶段中人体关节点概率置信图上的峰值点得到。
本发明通过以一种新的深度神经网络模型对单帧图像进行预测的方法,来得到在图像像素坐标系下的一组人体骨骼点坐标;同时,本发明提出的深度神经网络模型在整体流程中减少了卷积层的数量,缩短了预测的时间,与传统的人体姿态估计模型相比,该模型预测时间更短,效率更高,成本更低。
作为本发明的优选方案,所述步骤S1包括:
S11:初始化采集的摄像头,并以预设的采样间隔从多个摄像头同时获取带有摄像头ID的图像,对所述带有摄像头ID的图像进行放缩操作,调整所述带有摄像头ID的图像的帧率和分辨率参数;其中,所述带有摄像头ID的图像包含运动员运动姿态的人体骨骼点;
S12:从所述带有摄像头ID的图像中提取出图像像素数据,将图所述像像素数据转换成cv::Mat格式输出。
本发明利用初始化流程来兼容不同的摄像头驱动。同时提出预处理操作,创新性地在人体姿态估计系统中加入了间隔采样和放缩操作。等间隔采样使羽毛球运动员的姿态变换离散化,让系统实时性得到保证;放缩操作保证了输入到预测网络模型前的采集图像大小,解决了分辨率不同对预测网络模型预测时间的影响。
作为本发明的优选方案,所述步骤S11中摄像头基于ICmera基类进行设计,初始化步骤包括:
a:检测输入的摄像头ID对应的摄像头是否正常连接;
b:从连接的多个摄像头中选择所需摄像头的摄像头ID;
c:显示选择的所述摄像头的相关参数;
d:修改选择的所述摄像头的帧率和分辨率参数。
本发明提出的摄像头初始化流程,通过独有的基类ICmera来兼容不同摄像头的驱动,有利于数据的传输和存储。
作为本发明的优选方案,每个所述stage阶段的每个所述分支包括至少5个卷积层。
作为本发明的优选方案,所述人体骨骼点为羽毛球运动员运动姿态的特征点,包括neck点(颈部点)、Rshoulder点(右肩点)、Relbow点(右手肘点)、Rwrist点(右手腕点)、Lshoulder点(左肩点)、Leblow点(左手肘点)、Lwrist点(左手腕点)、Rhip点(右臀点)、Rknee点(右膝点)、Rankle点(右脚踝点)、Lhip点(左臀点)、Lknee点(左膝点)以及Rankle点(左脚踝点)。
本发明将局部评估的思想应用于对羽毛球运动员人体姿态的评估中,提出了一种新的人体姿态模型。该策略使用了针对羽毛球运动员运动姿态设计的13点人体姿态模型,取消了头部区域的评估。传统人体姿态评估是通用性的人体姿态评估,其评姿态范围包括行走、奔跑、挥手乃至各种运动相比,因此传统人体姿态模型对人体骨骼点的分布覆盖全身,而羽毛球运动属于上肢运动,使用新的人体姿态模型放大了肢体对姿态的贡献度,排除了无关人体骨骼点对姿态的影响。
作为本发明的优选方案,所述步骤S2所述预测网络模型的训练过程满足:
a)模型训练过程的数据集包括含有人体的图像和羽毛球运动员的图像,每幅图像都具有人体骨骼点的13个点坐标;
b)模型训练过程初始化时基础学习率为5e-5,卷积层权重初始值为5e-4,卷积层修正值初始值为0.01;
c)模型训练时使用随机梯度下降来更新模型权重参数;
d)模型训练时使用损失函数监控训练过程。
本发明采用随机梯度下降来对权重参数进行优化,对所有样本进行计算,可以覆盖所有情况;由全数据集来确定方向,能够更好地代表样本总体,从而更准确地朝向极值所在的方向。通过在训练过程中对各个的损失函数进行监控,使得整体预测损失下降。当目标函数为凸函数时,随机梯度下降一定能够得到全局最优。与传统的人体姿态估计模型相比,该模型预测时间更短,而在训练中加入羽毛球运动员运动姿态的数据集,也大大的提高了预测精度。
作为本发明的优选方案,所述损失函数为:
其中,i为stage层数,stage_w1i为stagei层中人体肢体特征概率置信图进行掩膜处理后的特征图,stage_w2i为stagei层中人体关节点概率置信图进行掩膜处理后的特征图,batch_size为输入图像的个数,pafmap为预设图像的人体肢体矢量灰度图、heatmap为预设图像的人体关节灰度图,所述预设图像从所述模型训练过程的数据集中选取。
一种羽毛球运动员运动姿态估计系统,包括摄像头以及处理模块;
所述摄像头用于采集包含人体骨骼点的羽毛球运动员运动姿态图像,并发送所述运动姿态图像到所述处理模块;
所述处理模块对所述运动姿态图像进行预处理,并输入到预先训练好的预测网络模型中进行预测,输出一组图像像素坐标系下的人体骨骼点坐标;
其中,所述预测网络模型包括:VGG阶段以及4个stage阶段;所述VGG阶段由多个卷积层以及池化层依次串联而成;每个所述stage阶段包含两个分支:一条分支用于计算人体肢体概率置信图,一条分支用于计算人体关节点概率置信图;所述人体骨骼点坐标通过提取最后一个所述stage阶段中人体关节点概率置信图上的峰值点得到。
作为本发明的优选方案,所述摄像头的参数满足预设条件;所述预设条件包括接口型号、像素、帧率、焦距、摆放高度以及摆放角度。本发明通过对摄像头参数的限定,最大限度的保障了本发明方法的应用效果,也更加有便于后面的处理。
作为本发明的优选方案,所述接口型号为USB3.0;所述像素不小于800万;所述帧率不小于60帧;所述焦距为3.1mm;所述摆放高度满足区间[1.0m,1.4m];所述摆放角度为摄像头光轴与球网的夹角,满足区间[50°,70°]。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明通过以一种新的深度神经网络模型对单帧图像进行预测的方法,来得到在图像像素坐标系下的一组人体骨骼点坐标;同时,本发明提出的深度神经网络模型在整体流程中减少了卷积层的数量,缩短了预测的时间,与传统的人体姿态估计模型相比,该模型预测时间更短,效率更高。
2、本发明利用初始化流程来兼容不同的摄像头驱动。同时提出预处理操作,创新性地在人体姿态估计系统中加入了间隔采样和放缩操作。等间隔采样使羽毛球运动员的姿态变换离散化,让系统实时性得到保证;放缩操作保证了输入到预测网络模型前的采集图像大小,解决了分辨率不同对预测网络模型预测时间的影响。
3、本发明提出的摄像头初始化流程,通过独有的基类ICmera来兼容不同摄像头的驱动,有利于数据的传输和存储。
4、本发明将局部评估的思想应用于对羽毛球运动员人体姿态的评估中,提出了一种新的人体姿态模型。该策略使用了针对羽毛球运动员运动姿态设计的13点人体姿态模型,取消了头部区域的评估。传统人体姿态评估是通用性的人体姿态评估,其评姿态范围包括行走、奔跑、挥手乃至各种运动相比,因此传统人体姿态模型对人体骨骼点的分布覆盖全身,而羽毛球运动属于上肢运动,使用新的人体姿态模型放大了肢体对姿态的贡献度,排除了无关骨骼点对姿态的影响。
5、本发明采用随机梯度下降来对权重参数进行优化,对所有样本进行计算,可以覆盖所有情况;由全数据集来确定方向,能够更好地代表样本总体,从而更准确地朝向极值所在的方向。通过在训练过程中对各个的损失函数进行监控,使得整体预测损失下降。当目标函数为凸函数时,随机梯度下降一定能够得到全局最优。与传统的人体姿态估计模型相比,该模型预测时间更短,而在训练中加入羽毛球运动员运动姿态的数据集,也大大的提高了预测精度。
6、本发明通过对摄像头参数的限定,最大限度的保障了本发明方法的应用效果,也更加有便于后面的处理。
附图说明
图1是本发明实施例1所述的一种羽毛球运动员运动姿态估计方法的流程示意图;
图2为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的13点人体骨骼点坐标模型图;
图3为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的软件接口层结构图;
图4为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的软件架构运行流程图;
图5为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的预测网络模型图;
图6为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的详细网络设置图;
图7为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的预测网络模型训练流程图;
图8为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的人体肢体特征概率置信图的损失曲线图;
图9为本发明实施例1中所述的一种羽毛球运动员运动姿态估计方法的人体关节点概率置信图的损失曲线图;
图10为本发明实施例2中所述的一种羽毛球运动员运动姿态估计方法的具体应用效果图。
具体实施方式
下面结合附图,对本发明作详细的说明。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
如图1所示,一种羽毛球运动员运动姿态估计方法,包括以下步骤:
S1:采集包含人体骨骼点的羽毛球运动员运动姿态图像,并对所述运动姿态图像进行预处理;其中,如图2所示,所述人体骨骼点为羽毛球运动员运动姿态的特征点,包括neck点(颈部点)、Rshoulder点(右肩点)、Relbow点(右手肘点)、Rwrist点(右手腕点)、Lshoulder点(左肩点)、Leblow点(左手肘点)、Lwrist点(左手腕点)、Rhip点(右臀点)、Rknee点(右膝点)、Rankle点(右脚踝点)、Lhip点(左臀点)、Lknee点(左膝点)以及Rankle点(左脚踝点),同时,在采集时工作人员可以依据需要增加或删除其中的特征点,使本发明方法更加灵活实用。
S2:将所述运动姿态图像输入到预先训练好的预测网络模型中进行预测,输出一组图像像素坐标系下的人体骨骼点坐标;
其中,所述预测网络模型包括:VGG阶段以及4个stage阶段;所述VGG阶段由多个卷积层以及池化层依次串联而成;每个所述stage阶段包含两个分支:一条分支用于计算人体肢体概率置信图,一条分支用于计算人体关节点概率置信图;所述人体骨骼点坐标通过提取最后一个所述stage阶段中人体关节点概率置信图上的峰值点得到。
其中,步骤S1包括:
S11:初始化采集的摄像头,并以预设的采样间隔从多个摄像头同时获取带有摄像头ID的图像,对所述带有摄像头ID的图像进行放缩操作,调整所述带有摄像头ID的图像的帧率和分辨率参数;其中,所述带有摄像头ID的图像包含运动员运动姿态的13个骨骼点;
S12:从所述带有摄像头ID的图像中提取出图像像素数据,将图所述像像素数据转换成cv::Mat格式输出。
其中,所述摄像头参数需满足下表:
所述摄像头的采集软件架构的设计重心在于摄像头接口层。由于摄像头的驱动都是独自开发,导致摄像头使用的驱动不同意,因此本系统设计摄像头接口层来去驱动进行兼容,整体的软件接口层设计(即所述步骤S2中的软件架构)如图3所示,摄像头采集模块的基类ICmera中提供了4个检测函数和1个工作函数。
如图4所示,检测摄像头checkCmera和设置摄像头IDsetID用于系统初次部署:由于计算机可能搭载多个摄像头而每个摄像头在计算机中有其单独的硬件ID,因此需要根据需要设置系统中使用的摄像头的ID。然后,显示摄像头参数showParam和设置摄像头参数setParam用于系统调试:由于用于对场地环境、人体姿态评估准确率要求的不同,需要更改摄像头中帧率、分辨率等参数,因此开放了这两个函数接口。最后,ICmera需要一个提供连续图像输出的函数work,通常摄像头采集到的图像是以矩阵的形式存储在摄像头内置缓冲区中的,根据摄像头驱动的不同将数据封装成不同的数据格式在输出到计算机中,这也就导致了图像存储的数据格式混乱,而实际上图像中的数据没有改变,只是添加了诸如宽高、分辨率等信息,这些信息对于系统没用,因此通过该函数将采集到的图像转换为cv::Mat格式(OpenCV中的通用图像存储格式)。
通过基类ICmera可以兼容其他摄像头的驱动模块,并以ICmera的形式进入系统的后续流程。因此,本发明不需要具体的摄像头型号,只要满足参数要求的摄像头,都可以通过继承基类的方式设置驱动。在实际测试中如果效果不好,还可以根据ICmera的功能函数修正摄像头参数。
步骤S2中所述预测网络模型,结构如图5所示,在训练过程中,该模型input有两部分,一部分是input层,即将输入图片经过剪切、旋转、掩膜等操作,从维度[height,width,channels]转换到[bantch,height,weight,channels];另一部分是mask层,在COCO数据集中提供了训练集中人体的ROI区域,训练时需要读入以方便后续每个stage与其做比较计算loss。
接下来是VGG阶段,主要是借助已经训练好的VGG参数对input层在128个维度上进行卷积,以提取不同尺度空间下的图像特征。
最后由4个stage阶段组成,为了提高预测速度,每个stage阶段有两个分支,每个分支各5个卷积层;在stage阶段会得到13个人体关节点概率置信图,依次在这些概率置信图上寻找峰值点即为预测到人体骨骼点,峰值点坐标即为预测到的人体骨骼点坐标。
如图6所示,本发明的一种详细网络设置,包括了3个池化层以及52个卷积层。
如图7所示,所述预测网络模型训练流程包括收集数据,制作训练数据集,设置权重参数初始值,进行训练以及输出权重参数等步骤。
其中,所述训练数据集包括COCO数据集中含有人的图像以及摄像头采集图像,图像资料来源于羽毛球运动视频,且所述训练数据集中的每张图像都包含13个在图像像素坐标系下符合人体姿态模型的真实坐标。
在训练过程中,设置批次参数量batch_size为10,最大迭代次数max_iter为200000,基础学习率base_lr为5e-5。而权重初始值和权重修正值的初始值与学习率有关,根据基础学习率base_lr的量级,将权重值初始值weight_decay设置为为5e-4,权重修正值lamdb设置为0.01。
其中,所述优化器optimizer使用的是随机梯度下降Gradient Decent,其优点在于:(1)一次迭代是对所有样本进行计算,可以覆盖所有情况;(2)由全数据集确定的方向能够更好地代表样本总体,从而更准确地朝向极值所在的方向。当目标函数为凸函数时,随机梯度下降一定能够得到全局最优。
损失函数loss如公式:
其中,i为stage层数,stage_w1i为stagei层中人体肢体特征概率置信图进行掩膜处理后的特征图,stage_w2i为stagei层中人体关节点概率置信图进行掩膜处理后的特征图,batch_size为输入图像的个数,pafmap为预设图像的人体肢体矢量灰度图、heatmap为预设图像的人体关节灰度图,所述预设图像从所述模型训练过程的数据集中选取。
训练后的损失loss曲线有两条,分别为stage4层的人体肢体特征概率置信图产生的stage4_L1_loss和人体关节点概率置信图产生的stage4_L2_loss如图8和图9所示。
在训练结束后,得到预测网络模型权重参数文件。
实施例2
本实施例为本发明一种羽毛球运动员运动姿态估计方法的具体应用实例。
摄像头选取参数为:
在预测网络模型中进行预测,得到的预测点展示效果如图10所示。
实施例3
一种羽毛球运动员运动姿态估计系统,包括摄像头以及处理模块;
所述摄像头用于采集包含人体骨骼点的羽毛球运动员运动姿态图像,并发送所述运动姿态图像到所述处理模块;
所述处理模块对所述运动姿态图像进行预处理,并输入到预先训练好的预测网络模型中进行预测,输出一组图像像素坐标系下的人体骨骼点坐标;
其中,所述预测网络模型包括:VGG、stage1、stage2、stage3、stage4,所述VGG部分由多个卷积层以及池化层依次串联而成;所述stage1、stage2、stage3、stage4的结构相同,包含两个分支:一条分支用于计算人体肢体概率置信图,一条分支用于计算人体关节点概率置信图;所述人体骨骼点坐标通过提取stage4部分中人体关节点概率置信图上的峰值点得到。
所述摄像头的参数需满足预设条件;所述预设条件包括接口型号、像素、帧率、焦距、摆放高度以及摆放角度。所述接口型号为USB3.0;所述像素不小于800万;所述帧率不小于60帧;所述焦距为3.1mm;所述摆放高度满足区间[1.0m,1.4m];所述摆放角度为摄像头光轴与球网的夹角,满足区间[50°,70°]。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种羽毛球运动员运动姿态估计方法,其特征在于:包括以下步骤:
S1:采集包含人体骨骼点的羽毛球运动员运动姿态图像,并对所述运动姿态图像进行预处理;
S2:将所述运动姿态图像输入到预先训练好的预测网络模型中进行预测,输出一组图像像素坐标系下的人体骨骼点坐标;
其中,所述预测网络模型包括:VGG阶段以及4个stage阶段;所述VGG阶段由多个卷积层以及池化层依次串联而成;每个所述stage阶段包含两个分支:一条分支用于计算人体肢体概率置信图,一条分支用于计算人体关节点概率置信图;所述人体骨骼点坐标通过提取最后一个所述stage阶段中人体关节点概率置信图上的峰值点得到。
2.根据权利要求1所述的一种羽毛球运动员运动姿态估计方法,其特征在于:所述步骤S1包括:
S11:初始化采集的摄像头,并以预设的采样间隔从多个摄像头同时获取带有摄像头ID的图像,对所述带有摄像头ID的图像进行放缩操作,调整所述带有摄像头ID的图像的帧率和分辨率参数;其中,所述带有摄像头ID的图像包含运动员运动姿态的人体骨骼点;
S12:从所述带有摄像头ID的图像中提取出图像像素数据,将图所述像像素数据转换成cv::Mat格式输出。
3.根据权利要求2所述的一种羽毛球运动员运动姿态估计方法,其特征在于:所述步骤S11中摄像头基于ICmera基类进行设计,初始化步骤包括:
a:检测输入的摄像头ID对应的摄像头是否正常连接;
b:从连接的多个摄像头中选择所需摄像头的摄像头ID;
c:显示选择的所述摄像头的相关参数;
d:修改选择的所述摄像头的帧率和分辨率参数。
4.根据权利要求1所述的一种羽毛球运动员运动姿态估计方法,其特征在于:每个所述stage阶段的每个所述分支包括至少5个卷积层。
5.根据权利要求1所述的一种羽毛球运动员运动姿态估计方法,其特征在于:所述人体骨骼点为羽毛球运动员运动姿态的特征点,包括neck点、Rshoulder点、Relbow点、Rwrist点、Lshoulder点、Leblow点、Lwrist点、Rhip点、Rknee点、Rankle点、Lhip点、Lknee点以及Rankle点。
6.根据权利要求5所述的一种羽毛球运动员运动姿态估计方法,其特征在于:所述步骤S2所述预测网络模型的训练过程满足:
a)模型训练过程的数据集包括含有人体的图像和羽毛球运动员的图像,每幅图像都具有人体骨骼点的13个点坐标;
b)模型训练过程初始化时基础学习率为5e-5,卷积层权重初始值为5e-4,卷积层修正值初始值为0.01;
c)模型训练时使用随机梯度下降来更新模型权重参数;
d)模型训练时使用损失函数监控训练过程。
8.一种羽毛球运动员运动姿态估计系统,其特征在于:包括摄像头以及处理模块;
所述摄像头用于采集包含13个人体骨骼点的羽毛球运动员运动姿态图像,并发送所述运动姿态图像到所述处理模块;
所述处理模块对所述运动姿态图像进行预处理,并输入到预先训练好的预测网络模型中进行预测,输出一组图像像素坐标系下的人体骨骼点坐标;
其中,所述预测网络模型包括:VGG阶段以及4个stage阶段;所述VGG阶段由多个卷积层以及池化层依次串联而成;每个所述stage阶段包含两个分支:一条分支用于计算人体肢体概率置信图,一条分支用于计算人体关节点概率置信图;所述人体骨骼点坐标通过提取最后一个所述stage阶段中人体关节点概率置信图上的峰值点得到。
9.根据权利要求8所述的一种羽毛球运动员运动姿态估计系统,其特征在于:所述摄像头的参数满足预设条件;所述预设条件包括接口型号、像素、帧率、焦距、摆放高度以及摆放角度。
10.根据权利要求8所述的一种羽毛球运动员运动姿态估计系统,其特征在于:所述接口型号为USB3.0;所述像素不小于800万;所述帧率不小于60帧;所述焦距为3.1mm;所述摆放高度满足区间[1.0m,1.4m];所述摆放角度为摄像头光轴与球网的夹角,满足区间[50°,70°]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010452902.4A CN111680586B (zh) | 2020-05-26 | 2020-05-26 | 一种羽毛球运动员运动姿态估计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010452902.4A CN111680586B (zh) | 2020-05-26 | 2020-05-26 | 一种羽毛球运动员运动姿态估计方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680586A true CN111680586A (zh) | 2020-09-18 |
CN111680586B CN111680586B (zh) | 2022-08-26 |
Family
ID=72434604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010452902.4A Expired - Fee Related CN111680586B (zh) | 2020-05-26 | 2020-05-26 | 一种羽毛球运动员运动姿态估计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680586B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613405A (zh) * | 2020-12-23 | 2021-04-06 | 电子科技大学 | 任意视角动作识别方法 |
CN112891922A (zh) * | 2021-03-18 | 2021-06-04 | 山东梦幻视界智能科技有限公司 | 一种虚拟现实体感交互方法 |
CN113361333A (zh) * | 2021-05-17 | 2021-09-07 | 重庆邮电大学 | 一种非接触式骑行运动状态监测方法及其系统 |
CN113392758A (zh) * | 2021-06-11 | 2021-09-14 | 北京科技大学 | 一种面向救援培训的行为检测与效果评价的方法及装置 |
CN114849209A (zh) * | 2022-06-10 | 2022-08-05 | 厦门大学嘉庚学院 | 一种智能发球的球体训练装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599198A (zh) * | 2016-12-14 | 2017-04-26 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种多级联结循环神经网络的图像描述方法 |
CN109376681A (zh) * | 2018-11-06 | 2019-02-22 | 广东工业大学 | 一种多人姿态估计方法及系统 |
CN110069987A (zh) * | 2019-03-14 | 2019-07-30 | 中国人民武装警察部队海警学院 | 基于改进vgg网络的单阶段船舶检测算法及装置 |
CN110084138A (zh) * | 2019-04-04 | 2019-08-02 | 高新兴科技集团股份有限公司 | 一种2d多人姿态估计方法 |
CN110619316A (zh) * | 2019-09-26 | 2019-12-27 | 联想(北京)有限公司 | 人体关键点检测方法、装置和电子设备 |
CN110766746A (zh) * | 2019-09-05 | 2020-02-07 | 南京理工大学 | 一种基于联合2d-3d神经网络的3d驾驶员姿态估计方法 |
CN111094952A (zh) * | 2017-09-06 | 2020-05-01 | 科磊股份有限公司 | 用于缺陷检测及分类的统一神经网络 |
-
2020
- 2020-05-26 CN CN202010452902.4A patent/CN111680586B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599198A (zh) * | 2016-12-14 | 2017-04-26 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种多级联结循环神经网络的图像描述方法 |
CN111094952A (zh) * | 2017-09-06 | 2020-05-01 | 科磊股份有限公司 | 用于缺陷检测及分类的统一神经网络 |
CN109376681A (zh) * | 2018-11-06 | 2019-02-22 | 广东工业大学 | 一种多人姿态估计方法及系统 |
CN110069987A (zh) * | 2019-03-14 | 2019-07-30 | 中国人民武装警察部队海警学院 | 基于改进vgg网络的单阶段船舶检测算法及装置 |
CN110084138A (zh) * | 2019-04-04 | 2019-08-02 | 高新兴科技集团股份有限公司 | 一种2d多人姿态估计方法 |
CN110766746A (zh) * | 2019-09-05 | 2020-02-07 | 南京理工大学 | 一种基于联合2d-3d神经网络的3d驾驶员姿态估计方法 |
CN110619316A (zh) * | 2019-09-26 | 2019-12-27 | 联想(北京)有限公司 | 人体关键点检测方法、装置和电子设备 |
Non-Patent Citations (4)
Title |
---|
BRUCE XIAOHAN NIE等: "Joint Action Recognition and Pose Estimation From Video", 《2015 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
HANNA RYU等: "Skeleton-based Human Action Recognition Using Spatio-Temporal Geometry", 《2019 19TH INTERNATIONAL CONFERENCE ON CONTROL, AUTOMATION AND SYSTEMS (ICCAS)》 * |
JIANXIN WU等: "Real-Time Human Detection Using Contour Cues", 《2011 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION》 * |
ZHE CAO等: "OpenPose: Realtime Multi-Person 2D Pose Estimation Using Part Affinity Fields", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613405A (zh) * | 2020-12-23 | 2021-04-06 | 电子科技大学 | 任意视角动作识别方法 |
CN112613405B (zh) * | 2020-12-23 | 2022-03-25 | 电子科技大学 | 任意视角动作识别方法 |
CN112891922A (zh) * | 2021-03-18 | 2021-06-04 | 山东梦幻视界智能科技有限公司 | 一种虚拟现实体感交互方法 |
CN112891922B (zh) * | 2021-03-18 | 2022-11-22 | 山东梦幻视界智能科技有限公司 | 一种虚拟现实体感交互方法 |
CN113361333A (zh) * | 2021-05-17 | 2021-09-07 | 重庆邮电大学 | 一种非接触式骑行运动状态监测方法及其系统 |
CN113392758A (zh) * | 2021-06-11 | 2021-09-14 | 北京科技大学 | 一种面向救援培训的行为检测与效果评价的方法及装置 |
CN114849209A (zh) * | 2022-06-10 | 2022-08-05 | 厦门大学嘉庚学院 | 一种智能发球的球体训练装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111680586B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680586B (zh) | 一种羽毛球运动员运动姿态估计方法及系统 | |
JP7427188B2 (ja) | 3dポーズ取得方法及び装置 | |
CN103733227B (zh) | 三维对象建模拟合与跟踪 | |
CN112069933A (zh) | 基于体态识别和人体生物力学的骨骼肌肉受力估计方法 | |
CN104036488B (zh) | 一种基于双目视觉的人体姿态动作研究方法 | |
CN102855470B (zh) | 基于深度图像的人体姿态估计方法 | |
CN104794737B (zh) | 一种深度信息辅助粒子滤波跟踪方法 | |
CN109176512A (zh) | 一种体感控制机器人的方法、机器人及控制装置 | |
CN109758756B (zh) | 基于3d相机的体操视频分析方法及系统 | |
CN108154104A (zh) | 一种基于深度图像超像素联合特征的人体姿态估计方法 | |
CN111862299A (zh) | 人体三维模型构建方法、装置、机器人和存储介质 | |
CN111507184B (zh) | 基于并联空洞卷积和身体结构约束的人体姿态检测方法 | |
CN117671738B (zh) | 基于人工智能的人体姿态识别系统 | |
CN111194122A (zh) | 一种体感互动灯光控制系统 | |
CN110675453A (zh) | 一种已知场景中运动目标的自定位方法 | |
CN111998862A (zh) | 一种基于bnn的稠密双目slam方法 | |
CN113255514A (zh) | 基于局部场景感知图卷积网络的行为识别方法 | |
CN115115672A (zh) | 基于目标检测和特征点速度约束的动态视觉slam方法 | |
CN115376034A (zh) | 一种基于人体三维姿态时空关联动作识别的运动视频采集剪辑方法及装置 | |
CN116740539A (zh) | 基于轻量化目标检测网络的视觉slam方法及系统 | |
CN104732586B (zh) | 一种三维人体动态形体和三维运动光流快速重建方法 | |
CN111833439A (zh) | 基于人工智能的弹药投掷分析及移动仿真训练方法 | |
CN117238031A (zh) | 一种虚拟人的动作捕捉方法与系统 | |
CN110910489A (zh) | 一种基于单目视觉的智能球场运动信息采集系统与方法 | |
KR102407802B1 (ko) | 인공신경망 학습 기반의 실내외 3차원 좌표 및 방위 추정 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220826 |