CN111079535B - 一种人体骨架动作识别方法、装置及终端 - Google Patents

一种人体骨架动作识别方法、装置及终端 Download PDF

Info

Publication number
CN111079535B
CN111079535B CN201911124255.8A CN201911124255A CN111079535B CN 111079535 B CN111079535 B CN 111079535B CN 201911124255 A CN201911124255 A CN 201911124255A CN 111079535 B CN111079535 B CN 111079535B
Authority
CN
China
Prior art keywords
joint
skeleton
human
length
human body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911124255.8A
Other languages
English (en)
Other versions
CN111079535A (zh
Inventor
赵欢
巫晓康
唐敏杰
丁汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201911124255.8A priority Critical patent/CN111079535B/zh
Publication of CN111079535A publication Critical patent/CN111079535A/zh
Application granted granted Critical
Publication of CN111079535B publication Critical patent/CN111079535B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种人体骨架动作识别方法及装置,该方法包括:获取人体骨架数据,其中,人体骨架数据包括多个关节点位置;处理人体骨架数据,并提取动作序列中的特征向量;基于特征向量和预先动作识别模型,确定动作序列的类型。本发明以髋关节中心为坐标原点建立正交坐标系,将人体骨架数据由原始坐标系转移到该坐标系下表达,从而保证提取得到的特征是相对于位向具有不变性的,即不会因相机拍摄的角度和相机与人之间的距离而导致提取到的特征存在差异,可以提高人体骨架动作识别的效率和精准度。

Description

一种人体骨架动作识别方法、装置及终端
技术领域
本发明属于模式识别技术与人机协作技术领域,更具体地,涉及一种人体骨架动作识别方法、装置及终端。
背景技术
随着科学技术的不断发展,机器人越来越融入到人类社会中,应用也越来越广泛。机器人与人产生交互协作的场景也越来越多,二者之间共融是未来的重要发展趋势。得益于近年来价格低廉的深度相机的广泛的应用以及利用深度图估计人体关节位置的方法不断完善,机器人感知环境中人类的行为的能力得到了极大地提高。根据人体骨架对人类动作进行识别的方法成为了亟待解决的难题。
目前机器人感知环境中的人类的主要方式是深度相机中提取的人类骨架,其具有数据量小、易于实现实时处理的特点,更适应于当前人机协作的应用场景。但仅仅通过离线编程的方式让机器人机械地对人类骨架运动进行响应是远远不够的,机器人无法理解人类正在进行动作的含义,从而无法智能地对协作任务进行规划。因此,行业内仍然缺乏针对人类骨架的高效动作识别算法以实现机器人对于人类活动的智能感知。
相应地,本领域亟待一种人类骨架的动作识别的算法,以实现人机交互过程中机器人对于环境中的人类行为理解。
发明内容
针对现有技术问题,本发明提供一种人体骨架动作识别方法和装置,所述技术方案如下:
第一方面,本发明提供一种人体骨架动作识别方法,包括:获取人体骨架数据,其中,所述人体骨架数据包括多个关节点位置;
处理所述人体骨架数据,并提取动作序列中的特征向量;
基于所述特征向量和预先动作识别模型,确定所述动作序列的类型。
进一步地,以所述人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离。
进一步地,处理所述人体骨架数据,包括,获取所述各关节点的平均骨架长度,将所述各关节的长度替换为所述各关节点的平均骨架长度。
进一步地,从训练集中学习所述人体骨架数据中各关节的平均骨架长度,具体公式如下;
Figure BDA0002276329030000021
其中,li对应关节的平均骨架长度,n对应训练集中的帧数总和,lik表示第k帧中对应关节i处的骨架长度;
根据广度优先搜索的方式在保持所述各关节方向不变的前提下,将其替换为所述各关节点的平均骨架长度。
进一步地,根据所述广度优先搜索的方式从所述髋关节中心开始,对所述动作序列中的关节长度进行替换,并保持方向不变,具体公式如下:
Figure BDA0002276329030000022
其中,posold和posnew分别表示之前关节点的位置和新的关节点位置,posroot表示根关节的位置,即与该需替换关节最接近且相较于该关节更靠近髋关节中心的关节,norm(·)表示求二范数的函数。
进一步地,将所述处理后的人体骨架数据,围绕所述坐标系多次旋转处理后,得到相对应的多个特征向量。
进一步地,将所述多个特征向量进行并联,得到特征矩阵,其中,所述特征矩阵与所述动作序列相对应。
进一步地,从所述特征矩阵中提取特征向量,输入所述动作识别模型,确定所述动作序列的类型。
第二方面,本发明提供一种人体骨架动作识别装置,包括:
获取模块,用于获取人体骨架数据,其中,所述人体骨架数据包括多个关节点位置;
处理模块,用于处理所述人体骨架数据,并提取动作序列中的特征向量;
确定模块,用于基于所述特征向量和预先动作识别模型,确定所述动作序列的类型。
进一步地,所述处理模块,包括以所述人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离;
进一步地,处理所述人体骨架数据,包括,获取所述各关节点的平均骨架长度,将所述各关节的长度替换为所述各关节点的平均骨架长度;
进一步地,将所述处理后的人体骨架数据,围绕所述坐标系多次旋转处理后,得到相对应的多个特征向量;
进一步地,将所述多个特征向量进行并联,得到特征矩阵,其中,所述特征矩阵与所述动作序列相对应。
进一步地,所述确定模块,用于从所述特征矩阵中提取特征向量,输入所述动作识别模型,确定所述动作序列的类型。
第三方面,本发明提供一种终端,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行一种人体骨架动作识别方法,包括:获取人体骨架数据,其中,所述人体骨架数据包括多个关节点位置;
处理所述人体骨架数据,并提取动作序列中的特征向量;
基于所述特征向量和预先动作识别模型,确定所述动作序列的类型。
进一步地,以所述人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离。
进一步地,处理所述人体骨架数据,包括,获取所述各关节点的平均骨架长度,将所述各关节的长度替换为所述各关节点的平均骨架长度。
进一步地,将所述处理后的人体骨架数据,围绕所述坐标系多次旋转处理后,得到相对应的多个特征向量。
进一步地,将所述多个特征向量进行并联,得到特征矩阵,其中,所述特征矩阵与所述动作序列相对应。
进一步地,从所述特征矩阵中提取特征向量,输入所述动作识别模型,确定所述动作序列的类型。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
1.本发明以髋关节中心为坐标原点建立正交坐标系,将人体骨架数据由原始坐标系转移到该坐标系下表达,从而保证提取得到的特征是相对于位向具有不变性的,即不会因相机拍摄的角度和相机与人之间的距离而导致提取到的特征存在差异。
2.本发明针对人体骨架大小具有个体差异的特点,学习得到训练集合中的平均骨架长度,在保证关节方向不变的前提下,将关节长度替换为平均骨架长度,从而保证提取到的特征具有一致性。
3.本发明采用旋转投影的方式来提取特征,保证单帧所包含的特征充分,空间特征足以描述人类的动作,并且处理速度快,耗费计算时间少。
附图说明
图1是本发明实施例提供的一种系统架构的示意图;
图2是本发明实施提供的一种人体骨架动作识别方法的流程图;
图3是本发明实施提供的一种人体骨架的示意说明;
图4是本发明实施提供的一种人体骨架动作识别装置的结构示意图;
图5为本发明实施提供的滑动窗口法示意图.
在所有附图中,同样的附图标记表示相同的技术特征,具体为:101为脊柱关节,102为髋关节中心,103为左髋关节,104为右髋关节。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
图1示例性的示出了本发明实施例所适用的一种系统架构,该系统架构可以服务器100,该服务器100可以包括处理器110、通信接口120和存储器130。
其中,通信接口120用于终端设备进行通信,收发终端设备传输的信息,实现通信。
处理器110是服务器100的控制中心,利用各种接口和路线连接整个服务器100的各个部分,通过运行或执行存储在存储器130内的软件程序/或模块,以及调用存储在存储器130内的数据,执行服务器100的各种功能和处理数据。可选地,处理器110可以包括一个或多个处理单元。
存储器130可用于存储软件程序以及模块,处理器110通过运行存储在存储器130的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器130可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据业务处理所创建的数据等。此外,存储器130可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
需要说明的是,上述图1所示的结构仅是一种人体骨架动作识别方法示例,本发明实施例对此不做限定。
基于上述描述,图2详细的示出了本发明实施例提供的一种人体骨架动作识别方法的流程,该流程可以由应急突发场景专题图生成的装置执行,该装置可以位于如图1所示服务器100内,也可以是该服务器100。
如图2所示,该流程具体包括:
步骤S201,获取人体骨架数据,其中,人体骨架数据包括多个关节点位置;
步骤S202,如图3所示,根据人体骨架的构型来构建以髋关节中心为原点的正交坐标系,具体的方法如下:
求出右髋关节、左髋关节和脊柱关节三个者所构成平面的法向量,使得该法向量过髋关节中心,并对该向量进行单位化,得到坐标系的y轴。
进一步地,计算坐标轴y轴与右髋关节、左髋关节和脊柱关节三个者所构成平面之间的交点P,连接P点与脊柱关节,得到向量
Figure BDA0002276329030000064
向量的方向指向脊柱关节,将该向量的起点平移到髋关节中心位置,并对该向量进行单位化,得到坐标系的z轴。
进一步地,计算z轴方向单位向量与y轴方向单位向量的向量积,得到坐标系的x轴。即,
Figure BDA0002276329030000061
其中
Figure BDA0002276329030000062
分别表示沿坐标轴方向的单位向量。
进一步地,将原骨架坐标系转换到新的坐标系当中:
P=R*P′+T
其中,
Figure BDA0002276329030000063
T=[xh,yh,zh]-1
P和P′分别代表原坐标系和新建立的坐标系,R代表两坐标之间的旋转矩阵,(a1,a2,a3)、(a4,a4,a5)、(a7,a8,a9)分别表示新的坐标系中x轴、y轴、z轴方向上的单位向量,T代表髋关节中心的位置坐标。
本发明实施例以髋关节中心建立正交坐标系,将骨架数据由原始坐标系转移到该坐标系下表达,从而保证提取得到的特征是相对于位向具有不变性的,即不会因相机拍摄的角度和相机与人之间的距离而导致提取到的特征存在差异。
步骤S203,从训练集中学习各关节平均骨架的长度,优选的,利用广度优先搜索的方式在保持关节方向不变的前提下替换为学习得到的关节长度,具体的方法如下:
从所有训练集中的对应的各关节的骨架长度,提取出来求平均值得到各关节的平均骨架长度。
Figure BDA0002276329030000071
其中,li对应关节的平均骨架长度,n对应训练集中的帧数总和,lik表示第k帧中对应关节i处的骨架长度。
优选地,利用广度优先搜索的方式从髋关节中心开始,对各个动作序列中的关节长度进行替换,并保持关节的方向不变。
Figure BDA0002276329030000072
其中,posold和posnew分别表示之前关节点的位置和新的关节点位置,posroot表示根关节的位置,即与该需替换关节最接近且相较于该关节更靠近髋关节中心的关节,norm(·)表示求二范数的函数。
本发明实施例针对人体骨架大小具有个体差异的特点,学习得到训练集合中的平均骨架长度,利用广度优先搜索的方法,在保证关节方向不变的前提下,将关节长度替换为平均骨架长度,从而保证提取到的特征具有一致性。
步骤S204,获取动作序列中单帧的特征向量。具体方法如下:
进一步地,将人体骨架绕着新建立的坐标系进行旋转。
Skeletonrot=RXYZ·Skeleton
其中,
Figure BDA0002276329030000081
Figure BDA0002276329030000082
Skeleton和Skeletonrot分别代表旋转前的骨架位置和旋转后的骨架位置。RXYZ代表一次绕x轴、y轴、z轴分别旋转θ的旋转矩阵,θ代表旋转的角度,nrot代表总共旋转骨架的次数。
进一步地,将旋转后得到的骨架向xoy平面进行投影,并在xoy平面内计算各个关节位置到髋关节中心位置之间的距离,将距离按照既定的关节顺序进行排序。
进一步地,将多次旋转投影的结果进行串联,得到当前帧的特征向量,特征向量的维度应该为nrot×(nskeleton-1),其中nskeleton代表人体骨架中关节点个数。
本发明实施例采用旋转投影的方式来提取特征,保证单帧所包含的特征充分,空间特征足以描述人类的动作,并且处理速度快,耗费计算时间少。
步骤S205,将得到的单个动作序列的所有帧级特征进行并联,得到单个动作序列对应的特征矩阵。
特征矩阵的维度应该为(nrot×(nskeleton-1))×nframes,其中nframes代表该动作序列中的帧数。
步骤S206,对整个特征矩阵利用方向梯度直方图(HOG)的方法来提取进一步的特征表达。具体方法如下:
进一步地,对特征矩阵进行分割,将整个特征当成图片分割为多个小块,以50%重叠的方式对整个特征矩阵进行遍历。
进一步地,计算每个区块的方向梯度直方图。
Figure BDA0002276329030000091
Figure BDA0002276329030000092
其中,Ix和Iy分别表示水平和垂直方向上的梯度值,M(x,y)代表梯度的幅度值,θ(x,y)则代表梯度的方向。
进一步地,将2π划分为nbin个区间,将上述计算得到的方向和梯度归并到各个区间当中。
进一步地,将各个区间中得到的直方图进行串联得到最终的重表达特征。
步骤S207,将得到的特征放到支持向量机(SVM)中进行训练,得到分类器。
步骤S208,将需要识别的动作序列进行上述类似的特征提取流程,将动作序列对应的特征放到分类器中获取当前动作的类型。
本发明实施例实现的动作分类准确率较高,在多个数据集上测试均获得较高的分类准确率。
在本发明的实施例中,步骤S204中可以将旋转后的骨架投影到其他平面,如yoz平面、xoz平面,或者投影到多个平面后将各个平面得到的特征进行串联得到合并的特征。
在本发明的实施方式中,人体骨架动作识别可以结合滑动窗口的方式实现实时的人体骨架动作识别;
进一步地,由于在实际中人的动作是连续的,而识别需要单个动作片段,采用滑动窗口法将实际的连续动作序列截取为一个个动作片段,如图5所示,如果所要识别的动作持续时间较短,滑动窗口的窗口大小可以设置为30帧,步长设置为10帧。
进一步地,滑动窗口法包括,获取待处理的连续动作序列,并生成待处理动作序列地多个候选裁剪框;
进一步地,上述待处理的连续动作序列可以是计算机设备接收到的其它设备发送的待处理的连续动作序列,如拍摄装置、其它计算机设备等,也可以是计算机设备本地存储的待处理的连续动作序列,或者是其它来源的待处理的连续动作序列;总之,计算机设备需要对待处理的连续动作序列进行裁剪处理。
进一步地,上述多个候选裁剪框的生成过程可以如下:生成不同大小、不同纵横比的滑动窗口,然后基于不同滑动窗口,在待处理动作序列上采用不同滑动幅度对滑动窗口进行滑动,可以是水平滑动,也可以是竖直滑动;滑动幅度可以自定义,取决于期望的候选裁剪框的数量;滑动窗口的纵横比可以自定义,如常见的4:3,3:4,2:3等,也可以基于待处理动作序列的纵横比,确定与该纵横比接近的一系列纵横比作为滑动窗口的纵横比;滑动窗口的大小也可以自定义,如原图的10%、30%、40%、……、100%等;当然,也可以将上述比例,作为滑动窗口与待处理动作序列的长度之比,和/或,宽度之比,以此计算滑动窗口的大小。
当然,上述各候选裁剪框也不限于是长方形,也可以是圆形、椭圆形、心形、扇形等,可以自行定义,本发明实施例对此并不限制。
在本发明的其他实施方式中,可以结合时间权重化方法实现实时的人体骨架动作识别。
基于相同的技术构思,图4示例性的示出了本发明实施例提供的一种人体骨架动作识别装置的结构,该装置可以执行应急突发场景专题图生成的流程,该装置可以位于图1所示的服务器100内,也可以是该服务器100。
如图4所示,该装置具体包括:
获取模块401,用于获取人体骨架数据,其中,所述人体骨架数据包括多个关节点位置;
处理模块402,用于处理所述人体骨架数据,并提取动作序列中的特征向量;
确定模块403,用于基于所述特征向量和预先动作识别模型,确定所述动作序列的类型。
进一步地,处理模块,包括以人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离;
进一步地,处理人体骨架数据,包括,获取各关节点的平均骨架长度,将各关节的长度替换为所述各关节点的平均骨架长度;
进一步地,将处理后的人体骨架数据,围绕所述坐标系多次旋转处理后,得到相对应的多个特征向量;
进一步地,将多个特征向量进行并联,得到特征矩阵,其中,特征矩阵与动作序列相对应。
进一步地,确定模块用于从特征矩阵中提取特征向量,输入动作识别模型,确定动作序列的类型。
基于相同的技术构思,本发明提供一种终端,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行一种人体骨架动作识别方法,包括:获取人体骨架数据,其中,所述人体骨架数据包括多个关节点位置;
处理所述人体骨架数据,并提取动作序列中的特征向量;
基于所述特征向量和预先动作识别模型,确定所述动作序列的类型。
进一步地,以所述人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离。
进一步地,处理所述人体骨架数据,包括,获取所述各关节点的平均骨架长度,将所述各关节的长度替换为所述各关节点的平均骨架长度。
进一步地,将所述处理后的人体骨架数据,围绕所述坐标系多次旋转处理后,得到相对应的多个特征向量。
进一步地,将所述多个特征向量进行并联,得到特征矩阵,其中,所述特征矩阵与所述动作序列相对应。
进一步地,从所述特征矩阵中提取特征向量,输入所述动作识别模型,确定所述动作序列的类型。
基于相同的技术构思,本发明实施例还提供了一种终端,包括:
存储器,用于存储程序指令;
处理器,用于调用存储器中存储的程序指令,按照获得的程序执行上述应急突发场景专题图生成的方法。
基于相同的技术构思,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行计算机可读指令时,使得计算机执行上述应急突发场景专题图生成的方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种人体骨架动作识别方法,其特征在于,包括:
获取人体骨架数据,其中,所述人体骨架数据包括多个关节点位置;处理所述人体骨架数据,并提取动作序列中的特征向量;
所述处理人体骨架数据包括:
以所述人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离;
所述处理人体骨架数据还包括:采用旋转投影的方式获取动作序列中单帧的特征向量,具体而言:
将人体骨架绕着新建立的坐标系进行旋转;
Figure 629727DEST_PATH_IMAGE001
其中,
Figure 78025DEST_PATH_IMAGE002
Figure 388921DEST_PATH_IMAGE003
Figure 315289DEST_PATH_IMAGE004
Figure 864082DEST_PATH_IMAGE005
分别代表旋转前的骨架位置和旋转后的骨架位置;
Figure 217703DEST_PATH_IMAGE006
代 表一次绕x轴、y轴、z轴分别旋转
Figure 15894DEST_PATH_IMAGE007
的旋转矩阵,
Figure 745953DEST_PATH_IMAGE007
代表旋转的角度,
Figure 945990DEST_PATH_IMAGE008
代表总共旋转骨架 的次数;
将旋转后得到的骨架向
Figure 736092DEST_PATH_IMAGE009
平面进行投影,并在
Figure 21580DEST_PATH_IMAGE009
平面内计算各个关节位置到髋 关节中心位置之间的距离,将距离按照既定的关节顺序进行排序;
将多次旋转投影的结果进行串联,得到当前帧的特征向量,特征向量的维度应该为
Figure 289750DEST_PATH_IMAGE010
,其中
Figure 547556DEST_PATH_IMAGE011
代表人体骨架中关节点个数;
将得到动作序列的帧级特征向量进行并联,得到特征矩阵,其中,所述特征矩阵与所述动作序列相对应;从所述特征矩阵中提取特征向量,基于所述特征向量和预先动作识别模型,确定所述动作序列的类型。
2.根据权利要求1所述的一种人体骨架动作识别方法,其特征在于:处理所述人体骨架数据,包括,获取所述各关节点的平均骨架长度,将所述各关节的长度替换为所述各关节点的平均骨架长度。
3.根据权利要求2所述的一种人体骨架动作识别方法,其特征在于:从训练集中学习所述人体骨架数据中各关节的平均骨架长度,具体公式如下;
Figure 508559DEST_PATH_IMAGE012
其中,
Figure 546922DEST_PATH_IMAGE013
对应关节的平均骨架长度,
Figure 353204DEST_PATH_IMAGE014
对应训练集中的帧数总和,
Figure 527833DEST_PATH_IMAGE015
表示第
Figure 597420DEST_PATH_IMAGE016
帧中对应 关节
Figure 860430DEST_PATH_IMAGE017
处的骨架长度;
根据广度优先搜索的方式在保持所述各关节方向不变的前提下,将其替换为所述各关节点的平均骨架长度。
4.根据权利要求3所述的一种人体骨架动作识别方法,其特征在于:根据所述广度优先搜索的方式从所述髋关节中心开始,对所述动作序列中的关节长度进行替换,并保持方向不变,具体公式如下:
Figure 735982DEST_PATH_IMAGE018
其中,
Figure 765118DEST_PATH_IMAGE019
Figure 67923DEST_PATH_IMAGE020
分别表示之前关节点的位置和新的关节点位置,
Figure 752983DEST_PATH_IMAGE021
表示根 关节的位置,即与需替换关节最接近且相较于该关节更靠近髋关节中心的关节,
Figure 166646DEST_PATH_IMAGE022
表示求二范数的函数。
5.一种人体骨架动作识别装置,其特征在于,所述装置包括:
获取模块,用于获取人体骨架数据,其中,所述人体骨架数据包括多个关节点位置;
处理模块,用于处理所述人体骨架数据,并提取动作序列中的特征向量;
所述处理人体骨架数据包括:
以所述人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离;
所述处理人体骨架数据还包括:采用旋转投影的方式获取动作序列中单帧的特征向量,具体而言:
将人体骨架绕着新建立的坐标系进行旋转;
Figure 315868DEST_PATH_IMAGE001
其中,
Figure 789575DEST_PATH_IMAGE002
Figure 758668DEST_PATH_IMAGE003
Figure 913706DEST_PATH_IMAGE004
Figure 917434DEST_PATH_IMAGE005
分别代表旋转前的骨架位置和旋转后的骨架位置;
Figure 562042DEST_PATH_IMAGE006
代 表一次绕x轴、y轴、z轴分别旋转
Figure 284010DEST_PATH_IMAGE007
的旋转矩阵,
Figure 39476DEST_PATH_IMAGE007
代表旋转的角度,
Figure 632132DEST_PATH_IMAGE008
代表总共旋转骨架 的次数;
将旋转后得到的骨架向
Figure 447641DEST_PATH_IMAGE009
平面进行投影,并在
Figure 391326DEST_PATH_IMAGE009
平面内计算各个关节位置到髋 关节中心位置之间的距离,将距离按照既定的关节顺序进行排序;
将多次旋转投影的结果进行串联,得到当前帧的特征向量,特征向量的维度应该为
Figure 153746DEST_PATH_IMAGE010
,其中
Figure 866487DEST_PATH_IMAGE011
代表人体骨架中关节点个数;
将得到动作序列的帧级特征向量进行并联,得到特征矩阵,其中,所述特征矩阵与所述动作序列相对应;从所述特征矩阵中提取特征向量,基于所述特征向量和预先动作识别模型,确定所述动作序列的类型。
6.根据权利要求5所述的一种人体骨架动作识别装置,其特征在于:
所述处理模块,包括以所述人体骨架数据中的髋关节中心为原点,构建坐标系,确定各关节点与所述髋关节中心之间的距离;
处理所述人体骨架数据,包括,获取所述各关节点的平均骨架长度,将所述各关节的长度替换为所述各关节点的平均骨架长度;
从训练集中学习所述人体骨架数据中各关节的平均骨架长度,具体公式如下;
Figure 578529DEST_PATH_IMAGE012
其中,
Figure 9511DEST_PATH_IMAGE013
对应关节的平均骨架长度,
Figure 372359DEST_PATH_IMAGE014
对应训练集中的帧数总和,
Figure 205186DEST_PATH_IMAGE015
表示第
Figure 96918DEST_PATH_IMAGE016
帧中对应 关节
Figure 218458DEST_PATH_IMAGE017
处的骨架长度;
根据广度优先搜索的方式在保持所述各关节方向不变的前提下,将其替换为所述各关节点的平均骨架长度;
根据所述广度优先搜索的方式从所述髋关节中心开始,对所述动作序列中的关节长度进行替换,并保持方向不变,具体公式如下:
Figure 916156DEST_PATH_IMAGE018
其中,
Figure 541172DEST_PATH_IMAGE019
Figure 134964DEST_PATH_IMAGE020
分别表示之前关节点的位置和新的关节点位置,
Figure 274959DEST_PATH_IMAGE021
表示 根关节的位置,即与需替换关节最接近且相较于该关节更靠近髋关节中心的关节,
Figure 979609DEST_PATH_IMAGE022
表示求二范数的函数。
7.一种终端,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至4任一项所述的方法。
CN201911124255.8A 2019-11-18 2019-11-18 一种人体骨架动作识别方法、装置及终端 Active CN111079535B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911124255.8A CN111079535B (zh) 2019-11-18 2019-11-18 一种人体骨架动作识别方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911124255.8A CN111079535B (zh) 2019-11-18 2019-11-18 一种人体骨架动作识别方法、装置及终端

Publications (2)

Publication Number Publication Date
CN111079535A CN111079535A (zh) 2020-04-28
CN111079535B true CN111079535B (zh) 2022-09-16

Family

ID=70311040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911124255.8A Active CN111079535B (zh) 2019-11-18 2019-11-18 一种人体骨架动作识别方法、装置及终端

Country Status (1)

Country Link
CN (1) CN111079535B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932607A (zh) * 2020-06-05 2020-11-13 北京西米兄弟未来科技有限公司 关节点坐标的获取方法、装置和电子设备
CN111933280A (zh) * 2020-09-15 2020-11-13 广东电网有限责任公司电力科学研究院 一种员工心理健康状态评估方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107301370A (zh) * 2017-05-08 2017-10-27 上海大学 一种基于Kinect三维骨架模型的肢体动作识别方法
CN107577451A (zh) * 2017-08-03 2018-01-12 中国科学院自动化研究所 多Kinect人体骨架坐标变换方法及处理设备、可读存储介质
CN108764107A (zh) * 2018-05-23 2018-11-06 中国科学院自动化研究所 基于人体骨架序列的行为与身份联合识别方法及装置
WO2019120108A1 (zh) * 2017-12-19 2019-06-27 华为技术有限公司 图像编码方法、动作识别的方法及计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107301370A (zh) * 2017-05-08 2017-10-27 上海大学 一种基于Kinect三维骨架模型的肢体动作识别方法
CN107577451A (zh) * 2017-08-03 2018-01-12 中国科学院自动化研究所 多Kinect人体骨架坐标变换方法及处理设备、可读存储介质
WO2019120108A1 (zh) * 2017-12-19 2019-06-27 华为技术有限公司 图像编码方法、动作识别的方法及计算机设备
CN108764107A (zh) * 2018-05-23 2018-11-06 中国科学院自动化研究所 基于人体骨架序列的行为与身份联合识别方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Structured Multi-Feature Representation for Recognizing Human Action and Interaction;Bangli Liu et al;《Neurocomputing》;20181130;第3节 *
Joint angles similarities and HOG2 for action recognition;OHN-BAR E et al;《Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops》;20131231;全文 *
Mihai Zanfir et al.The Moving Pose: An Efficient 3D Kinematics Descriptor for Low-Latency Action Recognition and Detection.《2013 IEEE International Conference on Computer Vision》.2014, *
The Moving Pose: An Efficient 3D Kinematics Descriptor for Low-Latency Action Recognition and Detection;Mihai Zanfir et al;《2013 IEEE International Conference on Computer Vision》;20140303;第2-5节 *
基于3D人体骨架的动作识别;张友梅等;《电子学报》;20170430;全文 *

Also Published As

Publication number Publication date
CN111079535A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
US10936911B2 (en) Logo detection
Sahu et al. Artificial intelligence (AI) in augmented reality (AR)-assisted manufacturing applications: a review
CN111325823B (zh) 人脸纹理图像的获取方法、装置、设备及存储介质
CN108764048B (zh) 人脸关键点检测方法及装置
CN107742311B (zh) 一种视觉定位的方法及装置
US11928800B2 (en) Image coordinate system transformation method and apparatus, device, and storage medium
WO2021093453A1 (zh) 三维表情基的生成方法、语音互动方法、装置及介质
CN104050449B (zh) 一种人脸识别方法及装置
CN109816769A (zh) 基于深度相机的场景地图生成方法、装置及设备
US8442307B1 (en) Appearance augmented 3-D point clouds for trajectory and camera localization
CN108629843B (zh) 一种实现增强现实的方法及设备
CN111710036B (zh) 三维人脸模型的构建方法、装置、设备及存储介质
EP3992919B1 (en) Three-dimensional facial model generation method and apparatus, device, and medium
CN112070782B (zh) 识别场景轮廓的方法、装置、计算机可读介质及电子设备
CN111881755B (zh) 一种视频帧序列的裁剪方法及装置
CN107563978A (zh) 人脸去模糊方法及装置
CN111652974A (zh) 三维人脸模型的构建方法、装置、设备及存储介质
CN111079535B (zh) 一种人体骨架动作识别方法、装置及终端
CN112749611B (zh) 人脸点云模型生成方法及装置、存储介质、电子设备
CN115008454A (zh) 一种基于多帧伪标签数据增强的机器人在线手眼标定方法
JP2023109570A (ja) 情報処理装置、学習装置、画像認識装置、情報処理方法、学習方法、画像認識方法
CN114299230A (zh) 一种数据生成方法、装置、电子设备及存储介质
CN113591562A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN113591433A (zh) 一种文本排版方法、装置、存储介质及计算机设备
CN110598785B (zh) 一种训练样本图像的生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant