CN110472554B - 基于姿态分割和关键点特征的乒乓球动作识别方法及系统 - Google Patents

基于姿态分割和关键点特征的乒乓球动作识别方法及系统 Download PDF

Info

Publication number
CN110472554B
CN110472554B CN201910739254.8A CN201910739254A CN110472554B CN 110472554 B CN110472554 B CN 110472554B CN 201910739254 A CN201910739254 A CN 201910739254A CN 110472554 B CN110472554 B CN 110472554B
Authority
CN
China
Prior art keywords
video
arm
video frame
image
key point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910739254.8A
Other languages
English (en)
Other versions
CN110472554A (zh
Inventor
李晓飞
黄尔俊
丁朔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201910739254.8A priority Critical patent/CN110472554B/zh
Publication of CN110472554A publication Critical patent/CN110472554A/zh
Application granted granted Critical
Publication of CN110472554B publication Critical patent/CN110472554B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于姿态分割和关键点特征的乒乓球动作识别方及系统,方法包括以下过程:获取拍摄了乒乓球运动员训练时接发球动作的视频;从视频中分割出仅包含手臂区域的视频帧图像;对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计,获取每个视频帧图像中手臂骨架关键点信息;根据每个视频帧图像中骨架关键点信息,获取每帧内骨架关键点的空间结构特征和时序特征;根据骨架关键点的空间结构特征和时序特征,对运动员接发球动作进行识别分类。本发明分析了接发球动作的时空关系建立了时空特征,提高了动作识别的准确率。

Description

基于姿态分割和关键点特征的乒乓球动作识别方法及系统
技术领域
本发明涉及图像与视频分析技术领域,具体涉及一种基于人体姿态分割结合骨架关键点特征的乒乓球接发球动作识别方法及系统。
背景技术
随着信息化进程的加快以及人工智能领域技术的不断发展,体育运动作为社会活动的组成部分,人工智能的应用将极大影响传统的运动训练、竞赛、竞技体育管理的组织形式。传统的乒乓球接发球训练主要靠教练员从旁指导,随着技术的发展逐渐出现了嵌入智能设备的运动装备,用于采集运动信息和人体指标等数据,通过网对数据进行储存和分析,用于指导运动员的训练方式和规范,为教练员制定训练计划提供参考。但是,传统方法人工代价较大耗时费力,智能设备成本高制作复杂不易于普及。
随着计算机视觉的迅速发展,尤其是深度学习在视频理解、行为识别、目标检测、图像与视频分析等诸多领域都取得了巨大成功。因此,基于机器视觉实现乒乓球运动员接发球训练的动作识别评判是一种能够广泛应用和推广的手段。
发明内容
本发明的目的在于克服现有技术中的不足,提出了一种基于姿态分割和关键点特征的乒乓球动作识别方法及系统,分析了接发球动作的时空关系建立了时空特征,提高了动作识别的准确率。
为解决上述技术问题,本发明提供了一种基于姿态分割和关键点特征的乒乓球动作识别方法,其特征是,包括以下过程:
获取拍摄了乒乓球运动员训练时接发球动作的视频;
从视频中分割出仅包含手臂区域的视频帧图像;
对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计,获取每个视频帧图像中手臂骨架关键点信息;
根据每个视频帧图像中骨架关键点信息,获取每帧内骨架关键点的空间结构特征和时序特征;
根据骨架关键点的空间结构特征和时序特征,对运动员接发球动作进行识别分类。
进一步的,从视频中分割出仅包含手臂区域的视频帧图像包括:
利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像。
进一步的,利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像的具体过程为:
(1)通过训练过的RPN网络将当前视频帧图像经过多次卷积操作提取生成多目标特征图,在目标特征图上运用滑动窗口框选目标区域,并通过卷积层和全连接层计算生成目标区域;
(2)将RPN提取出的目标区域划分为k x k个小特征图并通过双线性插值法对这些区域计算固定尺寸的像素值来代表不同目标区域更精确的特征;
(3)对每个目标区域的特征图输出二进制图像掩码,通过卷积提供的像素间的关系为每个目标区域生成一个掩码表示,根据获取到的掩码将每帧图像中包含动作信息的手臂区域分割出来,剔出与动作信息无关的区域。
进一步的,对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计包括:
利用OpenCV技术进行手臂区域的骨架关节点估计。
进一步的,根据每个视频帧图像中骨架关键点信息获取每帧内骨架关键点的空间结构特征和时序特征的具体过程为:
首先将提取的骨架关键点坐标矢量映射进行初步编码处理,接着,将所有关键点坐标馈入GCN网络进行训练,将关键点坐标构建成图的结构,以此表示出每帧图像手臂部位关键点的空间结构特征;
将得到的空间结构特征通过LSTM进行时序建模,获得每帧图像手臂部位关键点的时序特征。
相应的,本发明还提供了一种基于姿态分割和关键点特征的乒乓球动作识别系统,其特征是,视频获取模块、图像分割模块、关键点提取模块、特征提取模块和动作识别模块;
视频获取模块,用于获取拍摄了乒乓球运动员训练时接发球动作的视频;
图像分割模块,用于从视频中分割出仅包含手臂区域的视频帧图像;
关键点提取模块,用于对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计,获取每个视频帧图像中手臂骨架关键点信息;
特征提取模块,用于根据每个视频帧图像中骨架关键点信息,获取每帧内骨架关键点的空间结构特征和时序特征;
动作识别模块,用于根据骨架关键点的空间结构特征和时序特征,对运动员接发球动作进行识别分类。
进一步的,图像分割模块中,从视频中分割出仅包含手臂区域的视频帧图像包括:
利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像。
进一步的,图像分割模块中,利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像的具体过程为:
(1)通过训练过的RPN网络将当前视频帧图像经过多次卷积操作提取生成多目标特征图,在目标特征图上运用滑动窗口框选目标区域,并通过卷积层和全连接层计算生成目标区域;
(2)将RPN提取出的目标区域划分为k x k个小特征图并通过双线性插值法对这些区域计算固定尺寸的像素值来代表不同目标区域更精确的特征;
(3)对每个目标区域的特征图输出二进制图像掩码,通过卷积提供的像素间的关系为每个目标区域生成一个掩码表示,根据获取到的掩码将每帧图像中包含动作信息的手臂区域分割出来,剔出与动作信息无关的区域。
进一步的,关键点提取模块中,对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计包括:
利用OpenCV技术进行手臂区域的骨架关节点估计。
进一步的,特征提取模块中,根据每个视频帧图像中骨架关键点信息获取每帧内骨架关键点的空间结构特征和时序特征的具体过程为:
首先将提取的骨架关键点坐标矢量映射进行初步编码处理,接着,将所有关键点坐标馈入GCN网络进行训练,将关键点坐标构建成图的结构,以此表示出每帧图像手臂部位关键点的空间结构特征;
将得到的空间结构特征通过LSTM进行时序建模,获得每帧图像手臂部位关键点的时序特征。
与现有技术相比,本发明所达到的有益效果是:
1、本发明所需硬件设备简单,无需运动员穿戴设备完全基于网络摄像机传输视频流,获取运动员训练视频数据;
2、利用实例分割框架分割出用于主要区分动作类别的手臂区域,弱化和剔除静态背景及人体其他躯干,使得动作特征提取更专注于关键区域。通过姿态分割后的视频帧图像进行关节点估计,在空间上利用注意机制提取关节点信息,在时间上通过多个LSTM的时序堆叠网络获取详细的时序动态特征作为多分类器进行分类的标签,该方法充分分析了接发球动作的时空关系,建立了鲁棒的时空特征,提高了动作识别的准确率。
附图说明
图1为本发明方法的流程图示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的一种基于姿态分割和关键点特征的乒乓球动作识别方法,参见图1所示,包括以下步骤:
步骤1,获取拍摄了乒乓球运动员训练时接发球动作的视频;
将网络摄像头放置在运动员前方,用于拍摄乒乓球运动员训练时的接发球动作,从网络摄像头获取此拍摄了乒乓球运动员训练时接发球动作的视频。
步骤2,从视频中分割出仅包含手臂区域的视频帧图像;
由于乒乓球接发球动作的动作类别主要由手臂的动作进行区分,因此手臂区域的动作包含能用于动作识别的主要特征信息。构建实例分割框架Mask RCNN网络(此网络是现有技术),将上一部获取的视频帧图像作为网络输入,该网络包括含有五层卷积层和全连接层的Reginal Proposal Network(RPN)网络用于提取候选目标区域(即手臂区域、人体其他区域以及背景),并将由RPN提取出的候选框进行精确定位分割出不同区域的位置,接着对分割出的每个区域生成二进制掩码用于代表不同区域的类别,根据掩码对图像中的区域进行分类分割,获取用于提取动作特征的手臂区域的视频帧图像。
利用实例分割架构Mask RCNN网络进行运动员手臂区域分割的具体过程为:
(1)通过训练过的RPN网络将当前视频帧图像经过多次卷积操作提取生成多目标特征图,表示选取的包含手臂区域、人体其他区域以及背景等k个目标区域的特征,在目标特征图上运用滑动窗口框选目标区域(大概位置),并通过卷积层和全连接层计算生成目标区域;
(2)将RPN提取出的目标区域划分为k x k个小特征图并通过双线性插值法(一种图像缩放算法,它充分的利用了原图中虚拟点四周的四个真实存在的像素值来共同决定目标图中的一个像素值)对这些区域计算固定尺寸的像素值来代表不同目标区域更精确的特征,避免引入量化操作引起误差,使原图中的像素和特征图中的像素完全对齐(即同一帧图像的特征图和原图的相对位置相同不产生空间位置的偏移),有利于提高目标检测和实例分割的精度;
(3)对每个目标区域的特征图输出二进制图像掩码(通过卷积核算子重新计算图像中各个像素的值并根据权重因子对原像素点进行加权平均),通过卷积提供的像素间的关系为每个目标区域生成一个掩码表示,根据获取到的掩码将每帧图像中包含动作信息的手臂区域分割出来,剔出与动作信息无关的区域。
步骤3,对仅包含手臂区域的视频帧图像利用OpenCV技术进行手臂区域的骨架关节点估计,获取每个视频帧图像中手臂骨架关键点信息;
步骤4,根据每个视频帧图像中骨架关键点信息,获取每帧内骨架关键点的空间结构特征和时序特征。
首先将提取的骨架关键点坐标矢量映射进行初步编码处理,即将坐标归一化到[0,255]避免异常数据的影响。接着,将所有关键点坐标馈入图卷积网络(GraphConvolutional Networks,GCN)进行训练,将关键点坐标构建成图的结构,将相邻的关键点称为邻近节点。将每一节点的坐标编码后的特征向量发送给邻近节点,接着每个节点将邻近节点的特征信息聚集起来进行局部结构信息的融合,通过GCN网络反复迭代更新参数最终将各个节点的信息进行融合,以此表示出每帧图像手臂部位关键点的空间结构特征。
从所有邻近节点接收的关键点信息为
Figure BDA0002163356800000071
Figure BDA0002163356800000072
其中
Figure BDA0002163356800000073
表示从节点i接收的节点k的信息,
Figure BDA0002163356800000074
是时间步骤t-1的节点i的状态,Wm是共享的线性权重,bm为偏差。提取节点级输出作为每帧内关键点间的空间结构关系
Figure BDA0002163356800000075
最后将各节点的信息融合计算每一帧关键点的高维空间结构特征序列。
将得到的空间结构特征序列通过LSTM(长短期记忆网络)进行时序建模。LSTM网络包含遗忘门,输入门和输出门。将门的开闭状态用于判断模型网络的记忆态(之前网络的状态)在该层输出的结果是否达到阈值从而加入到当前该层的计算中。每一层包括阀门节点的权重都会在每一次模型反向传播训练过程中更新。时间序列是依赖于视频前后帧的相互关系,而LSTM对时间序列的记忆能力能够提取出视频动作在时间上的详细特征。
将长时特征序列划分为多个连续的短时片段,每个片段通过LSTM网络进行时序建模,不同片段之间的LSTM共享参数。将每个短时片段最后的隐含层的状态用来表示这个片段,再将当前片段及之前的所有片段的参数进行累加,得到所包含的所有详细的时序特征。为了更好地保持表示从开始到当前片段的长时序列之间的时序关系,可以将该动态特征作为下一个短时片段的LSTM网络的初始化参数。利用增量式损失函数提升网络对细微动作的理解,加速网络收敛防止过拟合,最终获取详细的时序特征。
步骤5,将以上获得的包含动作信息的骨架关键点空间结构特征和时序特征作为多分类器进行分类的标签,对视频中运动员接发球动作进行识别分类,将识别结果发送到前端系统进行展示并存储到数据库中,作为运动员在训练时进行动作的评判和训练制定计划的辅助参考。
本发明利用实例分割框架分割出用于主要区分动作类别的手臂区域,弱化和剔除静态背景及人体其他躯干,使得动作特征提取更专注于关键区域。通过姿态分割后的视频帧图像进行关节点估计,在空间上利用注意机制提取关节点信息,在时间上通过多个LSTM的时序堆叠网络获取详细的时序动态特征作为多分类器进行分类的标签,该方法充分分析了接发球动作的时空关系,建立了鲁棒的时空特征,提高了动作识别的准确率。
相应的,本发明还提供了一种基于姿态分割和关键点特征的乒乓球动作识别系统,其特征是,视频获取模块、图像分割模块、关键点提取模块、特征提取模块和动作识别模块;
视频获取模块,用于获取拍摄了乒乓球运动员训练时接发球动作的视频;
图像分割模块,用于从视频中分割出仅包含手臂区域的视频帧图像;
关键点提取模块,用于对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计,获取每个视频帧图像中手臂骨架关键点信息;
特征提取模块,用于根据每个视频帧图像中骨架关键点信息,获取每帧内骨架关键点的空间结构特征和时序特征;
动作识别模块,用于根据骨架关键点的空间结构特征和时序特征,对运动员接发球动作进行识别分类。
进一步的,图像分割模块中,从视频中分割出仅包含手臂区域的视频帧图像包括:
利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像。
进一步的,图像分割模块中,利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像的具体过程为:
(1)通过训练过的RPN网络将当前视频帧图像经过多次卷积操作提取生成多目标特征图,在目标特征图上运用滑动窗口框选目标区域,并通过卷积层和全连接层计算生成目标区域;
(2)将RPN提取出的目标区域划分为k x k个小特征图并通过双线性插值法对这些区域计算固定尺寸的像素值来代表不同目标区域更精确的特征;
(3)对每个目标区域的特征图输出二进制图像掩码,通过卷积提供的像素间的关系为每个目标区域生成一个掩码表示,根据获取到的掩码将每帧图像中包含动作信息的手臂区域分割出来,剔出与动作信息无关的区域。
进一步的,关键点提取模块中,对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计包括:
利用OpenCV技术进行手臂区域的骨架关节点估计。
进一步的,特征提取模块中,根据每个视频帧图像中骨架关键点信息获取每帧内骨架关键点的空间结构特征和时序特征的具体过程为:
首先将提取的骨架关键点坐标矢量映射进行初步编码处理,接着,将所有关键点坐标馈入GCN网络进行训练,将关键点坐标构建成图的结构,以此表示出每帧图像手臂部位关键点的空间结构特征;
将得到的空间结构特征通过LSTM进行时序建模,获得每帧图像手臂部位关键点的时序特征。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (6)

1.一种基于姿态分割和关键点特征的乒乓球动作识别方法,其特征是,包括以下过程:
获取拍摄了乒乓球运动员训练时接发球动作的视频;
从视频中分割出仅包含手臂区域的视频帧图像;
对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计,获取每个视频帧图像中手臂骨架关键点信息;
根据每个视频帧图像中骨架关键点信息,获取每帧内骨架关键点的空间结构特征和时序特征;
根据骨架关键点的空间结构特征和时序特征,对运动员接发球动作进行识别分类;
从视频中分割出仅包含手臂区域的视频帧图像包括:
利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像;
利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像的具体过程为:
(1)通过训练过的RPN网络将当前视频帧图像经过多次卷积操作提取生成多目标特征图,在目标特征图上运用滑动窗口框选目标区域,并通过卷积层和全连接层计算生成目标区域;
(2)将RPN提取出的目标区域划分为k x k个小特征图并通过双线性插值法对这些区域计算固定尺寸的像素值来代表不同目标区域更精确的特征;
(3)对每个目标区域的特征图输出二进制图像掩码,通过卷积提供的像素间的关系为每个目标区域生成一个掩码表示,根据获取到的掩码将每帧图像中包含动作信息的手臂区域分割出来,剔出与动作信息无关的区域。
2.根据权利要求1所述的一种基于姿态分割和关键点特征的乒乓球动作识别方法,其特征是,对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计包括:
利用OpenCV进行手臂区域的骨架关节点估计。
3.根据权利要求1所述的一种基于姿态分割和关键点特征的乒乓球动作识别方法,其特征是,根据每个视频帧图像中骨架关键点信息获取每帧内骨架关键点的空间结构特征和时序特征的具体过程为:
首先将提取的骨架关键点坐标矢量映射进行初步编码处理,接着,将所有关键点坐标馈入GCN网络进行训练,将关键点坐标构建成图的结构,以此表示出每帧图像手臂部位关键点的空间结构特征;
将得到的空间结构特征通过LSTM进行时序建模,获得每帧图像手臂部位关键点的时序特征。
4.一种基于姿态分割和关键点特征的乒乓球动作识别系统,其特征是,视频获取模块、图像分割模块、关键点提取模块、特征提取模块和动作识别模块;
视频获取模块,用于获取拍摄了乒乓球运动员训练时接发球动作的视频;
图像分割模块,用于从视频中分割出仅包含手臂区域的视频帧图像;
关键点提取模块,用于对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计,获取每个视频帧图像中手臂骨架关键点信息;
特征提取模块,用于根据每个视频帧图像中骨架关键点信息,获取每帧内骨架关键点的空间结构特征和时序特征;
动作识别模块,用于根据骨架关键点的空间结构特征和时序特征,对运动员接发球动作进行识别分类;
图像分割模块中,从视频中分割出仅包含手臂区域的视频帧图像包括:
利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像;
图像分割模块中,利用实例分割架构Mask RCNN网络从视频中分割出仅包含手臂区域的视频帧图像的具体过程为:
(1)通过训练过的RPN网络将当前视频帧图像经过多次卷积操作提取生成多目标特征图,在目标特征图上运用滑动窗口框选目标区域,并通过卷积层和全连接层计算生成目标区域;
(2)将RPN提取出的目标区域划分为k x k个小特征图并通过双线性插值法对这些区域计算固定尺寸的像素值来代表不同目标区域更精确的特征;
(3)对每个目标区域的特征图输出二进制图像掩码,通过卷积提供的像素间的关系为每个目标区域生成一个掩码表示,根据获取到的掩码将每帧图像中包含动作信息的手臂区域分割出来,剔出与动作信息无关的区域。
5.根据权利要求4所述的一种基于姿态分割和关键点特征的乒乓球动作识别系统,其特征是,关键点提取模块中,对仅包含手臂区域的视频帧图像进行手臂区域的骨架关节点估计包括:
利用OpenCV技术进行手臂区域的骨架关节点估计。
6.根据权利要求4所述的一种基于姿态分割和关键点特征的乒乓球动作识别系统,其特征是,特征提取模块中,根据每个视频帧图像中骨架关键点信息获取每帧内骨架关键点的空间结构特征和时序特征的具体过程为:
首先将提取的骨架关键点坐标矢量映射进行初步编码处理,接着,将所有关键点坐标馈入GCN网络进行训练,将关键点坐标构建成图的结构,以此表示出每帧图像手臂部位关键点的空间结构特征;
将得到的空间结构特征通过LSTM进行时序建模,获得每帧图像手臂部位关键点的时序特征。
CN201910739254.8A 2019-08-12 2019-08-12 基于姿态分割和关键点特征的乒乓球动作识别方法及系统 Active CN110472554B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910739254.8A CN110472554B (zh) 2019-08-12 2019-08-12 基于姿态分割和关键点特征的乒乓球动作识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910739254.8A CN110472554B (zh) 2019-08-12 2019-08-12 基于姿态分割和关键点特征的乒乓球动作识别方法及系统

Publications (2)

Publication Number Publication Date
CN110472554A CN110472554A (zh) 2019-11-19
CN110472554B true CN110472554B (zh) 2022-08-30

Family

ID=68510486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910739254.8A Active CN110472554B (zh) 2019-08-12 2019-08-12 基于姿态分割和关键点特征的乒乓球动作识别方法及系统

Country Status (1)

Country Link
CN (1) CN110472554B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4053734A4 (en) * 2019-11-20 2023-01-04 Guangdong Oppo Mobile Telecommunications Corp., Ltd. MANUAL GESTURE ESTIMATION METHOD AND APPARATUS, DEVICE AND COMPUTER STORAGE MEDIA
CN111160395A (zh) * 2019-12-05 2020-05-15 北京三快在线科技有限公司 图像识别方法、装置、电子设备和存储介质
CN110969133B (zh) * 2019-12-05 2023-04-07 浙江大学 一种乒乓球比赛视频的智能数据采集方法
CN111310616B (zh) * 2020-02-03 2023-11-28 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
JP2022522551A (ja) 2020-02-03 2022-04-20 ベイジン センスタイム テクノロジー ディベロップメント カンパニー リミテッド 画像処理方法及び装置、電子機器並びに記憶媒体
CN113222995A (zh) * 2020-02-06 2021-08-06 阿里巴巴集团控股有限公司 视频处理方法、视频处理装置及电子设备
CN111368685B (zh) * 2020-02-27 2023-09-29 北京字节跳动网络技术有限公司 关键点的识别方法、装置、可读介质和电子设备
CN111401270A (zh) * 2020-03-19 2020-07-10 南京未艾信息科技有限公司 一种人体运动姿态识别评价方法及其系统
CN111553247B (zh) * 2020-04-24 2023-08-08 上海锘科智能科技有限公司 一种基于改进骨干网络的视频结构化系统、方法及介质
CN112151194B (zh) * 2020-09-25 2023-12-19 泰康保险集团股份有限公司 康体训练监测系统及方法、存储介质及电子设备
CN112381760A (zh) * 2020-10-12 2021-02-19 萱闱(北京)生物科技有限公司 一种人体姿态骨节点和手部mask掩码识别方法
CN112237731A (zh) * 2020-10-19 2021-01-19 上海名图软件有限公司 羽毛球比赛自动记分系统及其计分方法
CN112464847B (zh) * 2020-12-07 2021-08-31 北京邮电大学 视频中人体动作切分方法及装置
CN112434666B (zh) * 2020-12-11 2022-03-08 东莞先知大数据有限公司 重复动作识别方法、装置、介质及设备
CN113515998B (zh) * 2020-12-28 2024-07-23 腾讯科技(深圳)有限公司 一种视频数据处理方法、设备以及可读存储介质
CN113052061A (zh) * 2021-03-22 2021-06-29 中国石油大学(华东) 一种基于人体姿态估计的速度滑冰运动员动作识别方法
CN113312973B (zh) * 2021-04-25 2023-06-02 北京信息科技大学 一种手势识别关键点特征提取方法及系统
CN113111842B (zh) * 2021-04-26 2023-06-27 浙江商汤科技开发有限公司 一种动作识别方法、装置、设备及计算机可读存储介质
CN113239848B (zh) * 2021-05-27 2024-02-02 数智引力(厦门)运动科技有限公司 动作感知方法、系统、终端设备及存储介质
CN113642498B (zh) * 2021-08-20 2024-05-03 浙江大学 一种基于多层次时空特征融合的视频目标检测系统及方法
CN114302234B (zh) * 2021-12-29 2023-11-07 杭州当虹科技股份有限公司 一种空中技巧快速包装方法
CN116189028B (zh) * 2022-11-29 2024-06-21 北京百度网讯科技有限公司 图像识别方法、装置、电子设备以及存储介质
CN117953588B (zh) * 2024-03-26 2024-06-21 南昌航空大学 一种融合场景信息的羽毛球运动员动作智能识别方法
CN117953591B (zh) * 2024-03-27 2024-06-14 中国人民解放军空军军医大学 一种智能肢体康复辅助方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709453A (zh) * 2016-12-24 2017-05-24 北京工业大学 一种基于深度学习的体育视频关键姿态提取方法
CN108388876A (zh) * 2018-03-13 2018-08-10 腾讯科技(深圳)有限公司 一种图像识别方法、装置以及相关设备
CN108985259A (zh) * 2018-08-03 2018-12-11 百度在线网络技术(北京)有限公司 人体动作识别方法和装置
CN110096950A (zh) * 2019-03-20 2019-08-06 西北大学 一种基于关键帧的多特征融合行为识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709453A (zh) * 2016-12-24 2017-05-24 北京工业大学 一种基于深度学习的体育视频关键姿态提取方法
CN108388876A (zh) * 2018-03-13 2018-08-10 腾讯科技(深圳)有限公司 一种图像识别方法、装置以及相关设备
CN108985259A (zh) * 2018-08-03 2018-12-11 百度在线网络技术(北京)有限公司 人体动作识别方法和装置
CN110096950A (zh) * 2019-03-20 2019-08-06 西北大学 一种基于关键帧的多特征融合行为识别方法

Also Published As

Publication number Publication date
CN110472554A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
CN110472554B (zh) 基于姿态分割和关键点特征的乒乓球动作识别方法及系统
CN108256433B (zh) 一种运动姿态评估方法及系统
CN109829436B (zh) 基于深度表观特征和自适应聚合网络的多人脸跟踪方法
CN110569795B (zh) 一种图像识别方法、装置以及相关设备
CN109241829B (zh) 基于时空注意卷积神经网络的行为识别方法及装置
CN112734775B (zh) 图像标注、图像语义分割、模型训练方法及装置
CN111784747B (zh) 一种基于关键点检测和校正的车辆多目标跟踪系统及方法
CN110738101A (zh) 行为识别方法、装置及计算机可读存储介质
CN110674785A (zh) 一种基于人体关键点跟踪的多人姿态分析方法
CN109325440B (zh) 人体动作识别方法及系统
CN112446342B (zh) 关键帧识别模型训练方法、识别方法及装置
CN110942006A (zh) 运动姿态识别方法、运动姿态识别装置、终端设备及介质
CN107944431A (zh) 一种基于运动变化的智能识别方法
CN107633226A (zh) 一种人体动作跟踪识别方法及系统
CN109902565B (zh) 多特征融合的人体行为识别方法
CN113033523B (zh) 跌倒判断模型的构建方法及系统、跌倒判断方法及系统
CN111931654A (zh) 一种人员跟踪智能监测方法、系统和装置
CN111105443A (zh) 一种基于特征关联的视频群体人物运动轨迹跟踪方法
CN113052061A (zh) 一种基于人体姿态估计的速度滑冰运动员动作识别方法
Vainstein et al. Modeling video activity with dynamic phrases and its application to action recognition in tennis videos
Faujdar et al. Human pose estimation using artificial intelligence with virtual gym tracker
CN111950507B (zh) 数据处理和模型训练方法、装置、设备及介质
CN108846344A (zh) 一种融合深度学习的行人姿势多特征智能辨识方法
CN117095386A (zh) 基于改进yolov7的吸烟行为的检测方法
CN112487926A (zh) 一种基于时空图卷积网络的景区投喂行为识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant