CN114494341A - 一种融合时空约束的光学动作捕捉标记点实时补全方法 - Google Patents

一种融合时空约束的光学动作捕捉标记点实时补全方法 Download PDF

Info

Publication number
CN114494341A
CN114494341A CN202111665416.1A CN202111665416A CN114494341A CN 114494341 A CN114494341 A CN 114494341A CN 202111665416 A CN202111665416 A CN 202111665416A CN 114494341 A CN114494341 A CN 114494341A
Authority
CN
China
Prior art keywords
time
real
points
mark
coordinate system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111665416.1A
Other languages
English (en)
Other versions
CN114494341B (zh
Inventor
翁冬冬
王怡晗
李冬
郭署山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202111665416.1A priority Critical patent/CN114494341B/zh
Publication of CN114494341A publication Critical patent/CN114494341A/zh
Application granted granted Critical
Publication of CN114494341B publication Critical patent/CN114494341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种融合时空约束的光学动作捕捉标记点实时补全方法,旨在基于人体运动的时空约束,采用权重位置损失函数描述人体不同关节节点对整体位姿的影响,用标记点间距损失函数描述同一段骨骼上标记点之间的刚性结构,用于出前后帧损失函数描述标记点运动轨迹的时间连续性,并将以上损失函数加权组合用于训练深度学习网络,解决“光学动作捕捉系统丢失标记点实时补全”问题,本发明补全后的标记点位置更符合人体运动规律,提高了标记点补全的精度。

Description

一种融合时空约束的光学动作捕捉标记点实时补全方法
技术领域
本发明属于光学动作捕捉技术领域,具体涉及一种融合时空约束的光学动作捕捉标记点实时补全方法。
背景技术
基于标记点的光学动作捕捉是运动获取、分析和映射等过程中的一项关键技术,该技术由空间中的相机等设备采集标记点图像坐标并重建各标记点的空间位置,再根据标记点云的三维位置坐标计算人体各骨骼当前时刻的位置和朝向.空间环境和人体自身动作很容易遮挡标记点,由此造成的标记点丢失可能会导致由标记点重建位姿失败.如何在标记点丢失时对其进行补全是基于标记点的光学动作捕捉技术亟待解决的问题。
基于深度学习的方法精度高,实时性好,但现有方法在训练过程中通常使用标记点位置真实值与预测值的欧式距离作为损失函数,没有全面考虑人体运动的时空约束,有些补全后的标记点会形成不合理的姿态,鲁棒性不足。
文献“Kucherenko T,Beskow J,
Figure BDA0003451744540000011
H.A neural network approach tomissing marker reconstruction in human motion capture[OL],[2018-09-25]”将连续64帧有丢失的归一化标记点位置坐标输入双层LSTM(长短期记忆)网络中,输出补全后的标记点序列。其中,损失函数为标记点预测值与真实值的欧式距离。该技术方案鲁棒性不足,补全后的标记点可能会形成扭曲的人体位姿,且标记点轨迹抖动严重。
发明内容
有鉴于此,本发明的目的是提供一种融合时空约束的光学动作捕捉标记点实时补全方法,可以使得补齐后标记点位置更符合人体运动规律,提高了标记点补全的精度。
一种融合时空约束的光学动作捕捉标记点实时补全方法,包括如下步骤:
步骤1、获取训练数据,具体为:
获取已有的各标记点连续多帧的在光学坐标系中三维位置坐标作为原始输入数据;
将原始输入数据从光学坐标系转换至根节点坐标系;根节点坐标系以腰部的标记点的几何中心为原点;
将原始输入数据中标记点位置坐标随机置零来模拟标记点丢失,得到训练数据;
步骤2、网络训练,具体为:
将步骤1的训练数据输入到能处理时间序列的网络结构中,对网络进行训练,其中训练时采用下式所示的融合时空约束的组合损失函数进行网络模型训练:
L=Lwp+wmdLmd+wfdLfd
L=Lwp+wmdLmd+wfdLfd
其中,Lwp为权重位置损失:
Figure BDA0003451744540000021
wmax为人体关节链的根节点和末端子节点上的标记点权重,wmiddle为位于其他关节点处的标记点权重,wmin为其余不在关节上的标记点权重;三者大小关系为:wmax>wmiddle>wmin
Figure BDA0003451744540000022
为人体关节链的根节点和末端子节点标记点中标记点的预测位置,
Figure BDA0003451744540000023
为标记点对应的真实位置;
Figure BDA0003451744540000024
表示人体关节链上除根节点和末端子节点上标记点的预测位置,
Figure BDA0003451744540000025
为对应的真实位置;
Figure BDA0003451744540000026
为除人体关节链上的其他标记点的预测位置,
Figure BDA0003451744540000027
为对应的真实位置;
Lmd为标记点间距损失:
Figure BDA0003451744540000028
其中,h,g为间距保持不变的两个标记点索引,Dhg为标记点h,g的真实距离;
Lfd为前后帧损失:
Figure BDA0003451744540000029
其中,
Figure BDA00034517445400000210
表示第l个标记点在t时刻的预测值,
Figure BDA00034517445400000211
表示第l个标记点在t-1时刻的预测值;
步骤3、对于实时获取的需要补点的一段动作序列,将各标记点的坐标转换到根节点坐标系,再输入到步骤2训练好的网络模型中,得到位置坐标补齐后的动作序列。
较佳的,所述步骤1中根节点坐标系的建立过程为:
记根节点坐标系的三个坐标轴x,y,z的归一化向量分别为rx,ry,rz,用最优化方法取距离腰部上所有标记点最近的直线和平面,则直线的方向向量和平面的法向量的初始值分别定义为rx’和ry’,则z轴归一化向量表示为:
rz=rx’×ry’ (1)
令rx’与坐标轴z的归一化向量rx一致,即rx=rx’,则:ry=rz×rx
由此建立根节点坐标系。
较佳的,所述步骤1中标记点位置坐标随机置零的方法为:
将原始输入数据中各标记点的位置矩阵表示为Praw∈Rf×N,其中位置矩阵的行数为该段序列的帧数f,列数与标记点数量N一致,每个元素存储的为各标记点的根节点坐标系的坐标;
随机置零的过程为:首先生成与位置矩阵大小一致的随机数矩阵A,其中的每个元素aij∈[0,1],设定丢失率为α,若aij<(1-α),则aij=1,反之aij=0,则得到新的矩阵Ap,则随机置零后的训练数据矩阵为:
Pmiss=Ap·Praw
较佳的,所述步骤2的网络结构为BiLSTM网络或者LSTM网络。
较佳的,所述步骤2中,权重wmax、权重wmiddle与权重wmin比值为4:2:1。
较佳的,所述步骤2中,权值wmd取0.3-0.7之间的数值。
较佳的,所述步骤2中,取小于0.01的值。
本发明具有如下有益效果:
本发明提供一种融合时空约束的光学动作捕捉标记点实时补全方法,旨在基于人体运动的时空约束,采用权重位置损失函数描述人体不同关节节点对整体位姿的影响,用标记点间距损失函数描述同一段骨骼上标记点之间的刚性结构,用于出前后帧损失函数描述标记点运动轨迹的时间连续性,并将以上损失函数加权组合用于训练深度学习网络,解决“光学动作捕捉系统丢失标记点实时补全”问题,本发明补全后的标记点位置更符合人体运动规律,提高了标记点补全的精度。
附图说明
图1为本发明的方法流程图;
图2为将标记点从光学坐标系转换至局部坐标系示意图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提出一种融合时空约束的光学动作捕捉标记点实时补全方法,通过采用融合时空约束的损失函数训练深度学习网络,来实时补全光学动捕的丢失标记点,整体结构和主要流程如图1所示。
本发明的技术方案主要包括数据获取、数据预处理、网络训练以及网络模型的应用。其中,训练网络时的原始输入数据从光学动作捕捉数据集HDM05获取,网络实际应用时的原始输入数据由光学动作捕捉系统实时捕捉,原始输入数据为光学坐标系中各标记点连续多帧的三维位置坐标,训练和实际应用时的原始输入数据均需要经过数据预处理后再输入标记点补全网络。
步骤1、数据预处理
数据预处理的主要目的是将原始输入数据从光学坐标系转换至根节点坐标系,如图2所示,本发明默认位于腰部的四个标记点不会丢失,记标记点在光学坐标系中的位置坐标为
Figure BDA0003451744540000041
则局部坐标系的原点为该四个标记点的几何中心,即原点为:
Figure BDA0003451744540000042
记根节点坐标系的三个坐标轴为归一化向量rx,ry,rz,用最优化方法取距离腰部4个标记点最近的直线和平面,则直线的方向向量和平面的法向量分别坐标轴rx和ry的初始值rx’和ry’,则z轴向量为:
rz=rx’×ry’ (1)
由于初始的rx’和ry’不一定正交,令rx’与坐标轴rx一致,即rx=rx’,则:
ry=rz×rx(2)
索引号为i的标记点在局部坐标系的三维位置坐标为:
Figure BDA0003451744540000043
对于训练数据,在将标记点转换至局部坐标系后,还需要通过将标记点位置坐标随机置零来模拟标记点丢失。记一段动作序列中的完整标记点的位置矩阵为Praw∈Rf×N,其中位置矩阵的行数为该段序列的帧数f,列数与标记点数量N一致,每个元素存储的为各标记点的根节点坐标系坐标;
随机置零的过程为:首先生成与位置矩阵大小一致的随机数矩阵A,其中的每个元素aij∈[0,1],设定丢失率为α,若aij<(1-α),则aij=1,反之aij=0,则得到新的矩阵Ap,则丢失后的标记点位置为:
Pmiss=Ap·Praw (3)
步骤2、网络训练
将步骤1的训练数据输入到能处理时间序列的网络结构中,如BiLSTM,LSTM等,对网络进行训练,其中训练时采用式(4)所示的融合时空约束的组合损失函数进行网络模型训练:
L=Lwp+wmdLmd+wfdLfd (4)
其中,Lwp为权重位置损失,就人体运动而言,肢体末端节点如手、脚、头的位置变化相较于其他关节点更容易被察觉,腰部根节点作为全部关节链的根节点,其运动误差会直接导致所有关节点的误差,为此本发明对不同关节造成的预测误差赋予不同权重,优先保证肢体末端节点和根节点的预测精度,降低了骨骼预测误差对用户视觉体验的影响。本发明在为各关节位置预测误差赋予权重时,不考虑手指和脚趾,将人体关节链的根节点(腰)和末端子节点(头、手腕和脚踝)上的标记点权重wmax设置最大权值,位于其他关节点处的标记点权重wmiddle次之,其余不在关节上的标记点权重wmin最小,损失函数具体形式如式(5):
Figure BDA0003451744540000051
其中,权重wmax、重wmiddle与权重wmin比值为4:2:1;
Figure BDA0003451744540000052
为人体关节链的根节点和末端子节点标记点中标记点的预测位置,
Figure BDA0003451744540000053
为标记点对应的真实位置;
Figure BDA0003451744540000054
表示人体关节链上除根节点和末端子节点上标记点的预测位置,
Figure BDA0003451744540000059
为对应的真实位置;
Figure BDA0003451744540000055
为除人体关节链上的其他标记点的预测位置,
Figure BDA0003451744540000056
为对应的真实位置。
Lmd为标记点间距损失,在空间上,人体骨架在运动中仍保持刚性结构,理想状态下,为了保持人体骨架的稳定结构,位于同一段骨骼的标记点间距在运动过程中应始终保持不变,则损失函数具体公式为式(6):
Figure BDA0003451744540000057
其中,h,g为间距保持不变的两个标记点索引,Dhg为标记点h,g的真实距离。权值wmd一般取0.3-0.7之间。
Lfd为前后帧损失,在摄像机采集帧率较高时,标志点的空间坐标在时间轴上应保持连续,同一标记点在连续两帧之间的位置之差较小,具体形式为式(7)。
Figure BDA0003451744540000058
其中,
Figure BDA0003451744540000061
表示第l个标记点在t时刻的预测值,
Figure BDA0003451744540000062
表示第l个标记点在t-1时刻的预测值。正常情况下,运动的标记点在前后两帧的位置不会完全一致,故Lfd对应的权重不能设置得太大,一般取小于0.01。
步骤3、网络应用
对于实时获取的需要补点的一段动作序列,按照步骤1的方法对数据进行坐标转换,输入到步骤2训练好的网络模型中,可得到位置坐标补齐后的动作序列。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,包括如下步骤:
步骤1、获取训练数据,具体为:
获取已有的各标记点连续多帧的在光学坐标系中三维位置坐标作为原始输入数据;
将原始输入数据从光学坐标系转换至根节点坐标系;根节点坐标系以腰部的标记点的几何中心为原点;
将原始输入数据中标记点位置坐标随机置零来模拟标记点丢失,得到训练数据;
步骤2、网络训练,具体为:
将步骤1的训练数据输入到能处理时间序列的网络结构中,对网络进行训练,其中训练时采用下式所示的融合时空约束的组合损失函数进行网络模型训练:
L=Lwp+wmdLmd+wfdLfd
其中,Lwp为权重位置损失:
Figure FDA0003451744530000011
wmax为人体关节链的根节点和末端子节点上的标记点权重,wmiddle为位于其他关节点处的标记点权重,wmin为其余不在关节上的标记点权重;三者大小关系为:wmax>wmiddle>wmin
Figure FDA0003451744530000012
为人体关节链的根节点和末端子节点标记点中标记点的预测位置,
Figure FDA0003451744530000013
为标记点对应的真实位置;
Figure FDA0003451744530000014
表示人体关节链上除根节点和末端子节点上标记点的预测位置,
Figure FDA0003451744530000015
为对应的真实位置;
Figure FDA0003451744530000016
为除人体关节链上的其他标记点的预测位置,
Figure FDA0003451744530000017
为对应的真实位置;
Lmd为标记点间距损失:
Figure FDA0003451744530000018
其中,h,g为间距保持不变的两个标记点索引,Dhg为标记点h,g的真实距离;
Lfd为前后帧损失:
Figure FDA0003451744530000019
其中,
Figure FDA00034517445300000110
表示第l个标记点在t时刻的预测值,
Figure FDA00034517445300000111
表示第l个标记点在t-1时刻的预测值;
步骤3、对于实时获取的需要补点的一段动作序列,将各标记点的坐标转换到根节点坐标系,再输入到步骤2训练好的网络模型中,得到位置坐标补齐后的动作序列。
2.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤1中根节点坐标系的建立过程为:
记根节点坐标系的三个坐标轴x,y,z的归一化向量分别为rx,ry,rz,用最优化方法取距离腰部上所有标记点最近的直线和平面,则直线的方向向量和平面的法向量的初始值分别定义为rx,和ry,,则z轴归一化向量表示为:
rz=rx,×ry, (1)
令rx,与坐标轴z的归一化向量rx一致,即rx=rx,,则:ry=rz×rx
由此建立根节点坐标系。
3.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤1中标记点位置坐标随机置零的方法为:
将原始输入数据中各标记点的位置矩阵表示为Praw∈Rf×N,其中位置矩阵的行数为该段序列的帧数f,列数与标记点数量N一致,每个元素存储的为各标记点的根节点坐标系的坐标;
随机置零的过程为:首先生成与位置矩阵大小一致的随机数矩阵A,其中的每个元素aij∈[0,1],设定丢失率为α,若aij<(1-α),则aij=1,反之aij=0,则得到新的矩阵Ap,则随机置零后的训练数据矩阵为:
Pmiss=Ap·Praw
4.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2的网络结构为BiLSTM网络或者LSTM网络。
5.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2中,权重wmax、权重wmiddle与权重wmin比值为4:2:1。
6.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2中,权值wmd取0.3-0.7之间的数值。
7.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2中,取小于0.01的值。
CN202111665416.1A 2021-12-31 2021-12-31 一种融合时空约束的光学动作捕捉标记点实时补全方法 Active CN114494341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111665416.1A CN114494341B (zh) 2021-12-31 2021-12-31 一种融合时空约束的光学动作捕捉标记点实时补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111665416.1A CN114494341B (zh) 2021-12-31 2021-12-31 一种融合时空约束的光学动作捕捉标记点实时补全方法

Publications (2)

Publication Number Publication Date
CN114494341A true CN114494341A (zh) 2022-05-13
CN114494341B CN114494341B (zh) 2024-07-12

Family

ID=81508389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111665416.1A Active CN114494341B (zh) 2021-12-31 2021-12-31 一种融合时空约束的光学动作捕捉标记点实时补全方法

Country Status (1)

Country Link
CN (1) CN114494341B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152670A (zh) * 2023-10-31 2023-12-01 江西拓世智能科技股份有限公司 一种基于人工智能的行为识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017133009A1 (zh) * 2016-02-04 2017-08-10 广州新节奏智能科技有限公司 一种基于卷积神经网络的深度图像人体关节定位方法
CN108376405A (zh) * 2018-02-22 2018-08-07 国家体育总局体育科学研究所 基于双体感追踪系统的人体运动捕捉系统及捕捉方法
CN113688683A (zh) * 2021-07-23 2021-11-23 网易(杭州)网络有限公司 光学运动捕捉数据处理方法、模型训练方法及装置
CN113808047A (zh) * 2021-09-22 2021-12-17 武汉商学院 一种人体运动捕捉数据去噪方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017133009A1 (zh) * 2016-02-04 2017-08-10 广州新节奏智能科技有限公司 一种基于卷积神经网络的深度图像人体关节定位方法
CN108376405A (zh) * 2018-02-22 2018-08-07 国家体育总局体育科学研究所 基于双体感追踪系统的人体运动捕捉系统及捕捉方法
CN113688683A (zh) * 2021-07-23 2021-11-23 网易(杭州)网络有限公司 光学运动捕捉数据处理方法、模型训练方法及装置
CN113808047A (zh) * 2021-09-22 2021-12-17 武汉商学院 一种人体运动捕捉数据去噪方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152670A (zh) * 2023-10-31 2023-12-01 江西拓世智能科技股份有限公司 一种基于人工智能的行为识别方法及系统

Also Published As

Publication number Publication date
CN114494341B (zh) 2024-07-12

Similar Documents

Publication Publication Date Title
CN110222665B (zh) 一种基于深度学习和姿态估计的监控中人体动作识别方法
CN104700433B (zh) 一种基于视觉的实时人体全身体运动捕捉方法及其系统
WO2017133009A1 (zh) 一种基于卷积神经网络的深度图像人体关节定位方法
CN106650687A (zh) 一种基于深度信息和骨骼信息的姿势矫正方法
KR20220025023A (ko) 애니메이션 처리 방법 및 장치, 컴퓨터 저장 매체 그리고 전자 디바이스
CN111724459B (zh) 一种面向异构人体骨骼的运动重定向的方法及系统
CN101520902A (zh) 低成本动作捕捉与演示系统及方法
CN113205595B (zh) 一种3d人体姿态估计模型的构建方法及其应用
CN100361070C (zh) 一种基于光学的运动捕获数据的骨骼运动提取方法
CN113642379B (zh) 基于注意力机制融合多流图的人体姿态预测方法及系统
CN106600626A (zh) 三维人体运动捕获方法与系统
WO2023185703A1 (zh) 虚拟角色的动作控制方法、装置、设备和存储介质
CN113158459A (zh) 一种基于视觉和惯性信息融合的人体姿态估计方法
CN117671738B (zh) 基于人工智能的人体姿态识别系统
CN113989283B (zh) 3d人体姿态估计方法、装置、电子设备与存储介质
CN112183316A (zh) 一种运动员人体姿态测量方法
CN102156994B (zh) 一种单视角无标记人体运动跟踪的关节定位方法
CN114494341A (zh) 一种融合时空约束的光学动作捕捉标记点实时补全方法
CN110559639B (zh) 体操运动的机器人教学方法及机器人
CN110264551B (zh) 一种运动重定向方法及系统
CN116129467A (zh) 一种变电运维人员姿态与行为以及工器具姿态的识别方法
CN116749168A (zh) 一种基于体势手势示教的康复轨迹获取方法
Hao et al. Cromosim: A deep learning-based cross-modality inertial measurement simulator
CN115018962A (zh) 一种基于虚拟人物模型的人体运动姿态数据集生成方法
CN115294228A (zh) 基于模态引导的多图人体姿态生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant