CN114494341A - 一种融合时空约束的光学动作捕捉标记点实时补全方法 - Google Patents
一种融合时空约束的光学动作捕捉标记点实时补全方法 Download PDFInfo
- Publication number
- CN114494341A CN114494341A CN202111665416.1A CN202111665416A CN114494341A CN 114494341 A CN114494341 A CN 114494341A CN 202111665416 A CN202111665416 A CN 202111665416A CN 114494341 A CN114494341 A CN 114494341A
- Authority
- CN
- China
- Prior art keywords
- time
- real
- points
- mark
- coordinate system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000003287 optical effect Effects 0.000 title claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 14
- 239000003550 marker Substances 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims 2
- 230000001502 supplementing effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 17
- 238000013135 deep learning Methods 0.000 abstract description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 210000003414 extremity Anatomy 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 210000003423 ankle Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000002683 foot Anatomy 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种融合时空约束的光学动作捕捉标记点实时补全方法,旨在基于人体运动的时空约束,采用权重位置损失函数描述人体不同关节节点对整体位姿的影响,用标记点间距损失函数描述同一段骨骼上标记点之间的刚性结构,用于出前后帧损失函数描述标记点运动轨迹的时间连续性,并将以上损失函数加权组合用于训练深度学习网络,解决“光学动作捕捉系统丢失标记点实时补全”问题,本发明补全后的标记点位置更符合人体运动规律,提高了标记点补全的精度。
Description
技术领域
本发明属于光学动作捕捉技术领域,具体涉及一种融合时空约束的光学动作捕捉标记点实时补全方法。
背景技术
基于标记点的光学动作捕捉是运动获取、分析和映射等过程中的一项关键技术,该技术由空间中的相机等设备采集标记点图像坐标并重建各标记点的空间位置,再根据标记点云的三维位置坐标计算人体各骨骼当前时刻的位置和朝向.空间环境和人体自身动作很容易遮挡标记点,由此造成的标记点丢失可能会导致由标记点重建位姿失败.如何在标记点丢失时对其进行补全是基于标记点的光学动作捕捉技术亟待解决的问题。
基于深度学习的方法精度高,实时性好,但现有方法在训练过程中通常使用标记点位置真实值与预测值的欧式距离作为损失函数,没有全面考虑人体运动的时空约束,有些补全后的标记点会形成不合理的姿态,鲁棒性不足。
发明内容
有鉴于此,本发明的目的是提供一种融合时空约束的光学动作捕捉标记点实时补全方法,可以使得补齐后标记点位置更符合人体运动规律,提高了标记点补全的精度。
一种融合时空约束的光学动作捕捉标记点实时补全方法,包括如下步骤:
步骤1、获取训练数据,具体为:
获取已有的各标记点连续多帧的在光学坐标系中三维位置坐标作为原始输入数据;
将原始输入数据从光学坐标系转换至根节点坐标系;根节点坐标系以腰部的标记点的几何中心为原点;
将原始输入数据中标记点位置坐标随机置零来模拟标记点丢失,得到训练数据;
步骤2、网络训练,具体为:
将步骤1的训练数据输入到能处理时间序列的网络结构中,对网络进行训练,其中训练时采用下式所示的融合时空约束的组合损失函数进行网络模型训练:
L=Lwp+wmdLmd+wfdLfd
L=Lwp+wmdLmd+wfdLfd
其中,Lwp为权重位置损失:
wmax为人体关节链的根节点和末端子节点上的标记点权重,wmiddle为位于其他关节点处的标记点权重,wmin为其余不在关节上的标记点权重;三者大小关系为:wmax>wmiddle>wmin;
为人体关节链的根节点和末端子节点标记点中标记点的预测位置,为标记点对应的真实位置;表示人体关节链上除根节点和末端子节点上标记点的预测位置,为对应的真实位置;为除人体关节链上的其他标记点的预测位置,为对应的真实位置;
Lmd为标记点间距损失:
其中,h,g为间距保持不变的两个标记点索引,Dhg为标记点h,g的真实距离;
Lfd为前后帧损失:
步骤3、对于实时获取的需要补点的一段动作序列,将各标记点的坐标转换到根节点坐标系,再输入到步骤2训练好的网络模型中,得到位置坐标补齐后的动作序列。
较佳的,所述步骤1中根节点坐标系的建立过程为:
记根节点坐标系的三个坐标轴x,y,z的归一化向量分别为rx,ry,rz,用最优化方法取距离腰部上所有标记点最近的直线和平面,则直线的方向向量和平面的法向量的初始值分别定义为rx’和ry’,则z轴归一化向量表示为:
rz=rx’×ry’ (1)
令rx’与坐标轴z的归一化向量rx一致,即rx=rx’,则:ry=rz×rx;
由此建立根节点坐标系。
较佳的,所述步骤1中标记点位置坐标随机置零的方法为:
将原始输入数据中各标记点的位置矩阵表示为Praw∈Rf×N,其中位置矩阵的行数为该段序列的帧数f,列数与标记点数量N一致,每个元素存储的为各标记点的根节点坐标系的坐标;
随机置零的过程为:首先生成与位置矩阵大小一致的随机数矩阵A,其中的每个元素aij∈[0,1],设定丢失率为α,若aij<(1-α),则aij=1,反之aij=0,则得到新的矩阵Ap,则随机置零后的训练数据矩阵为:
Pmiss=Ap·Praw。
较佳的,所述步骤2的网络结构为BiLSTM网络或者LSTM网络。
较佳的,所述步骤2中,权重wmax、权重wmiddle与权重wmin比值为4:2:1。
较佳的,所述步骤2中,权值wmd取0.3-0.7之间的数值。
较佳的,所述步骤2中,取小于0.01的值。
本发明具有如下有益效果:
本发明提供一种融合时空约束的光学动作捕捉标记点实时补全方法,旨在基于人体运动的时空约束,采用权重位置损失函数描述人体不同关节节点对整体位姿的影响,用标记点间距损失函数描述同一段骨骼上标记点之间的刚性结构,用于出前后帧损失函数描述标记点运动轨迹的时间连续性,并将以上损失函数加权组合用于训练深度学习网络,解决“光学动作捕捉系统丢失标记点实时补全”问题,本发明补全后的标记点位置更符合人体运动规律,提高了标记点补全的精度。
附图说明
图1为本发明的方法流程图;
图2为将标记点从光学坐标系转换至局部坐标系示意图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提出一种融合时空约束的光学动作捕捉标记点实时补全方法,通过采用融合时空约束的损失函数训练深度学习网络,来实时补全光学动捕的丢失标记点,整体结构和主要流程如图1所示。
本发明的技术方案主要包括数据获取、数据预处理、网络训练以及网络模型的应用。其中,训练网络时的原始输入数据从光学动作捕捉数据集HDM05获取,网络实际应用时的原始输入数据由光学动作捕捉系统实时捕捉,原始输入数据为光学坐标系中各标记点连续多帧的三维位置坐标,训练和实际应用时的原始输入数据均需要经过数据预处理后再输入标记点补全网络。
步骤1、数据预处理
数据预处理的主要目的是将原始输入数据从光学坐标系转换至根节点坐标系,如图2所示,本发明默认位于腰部的四个标记点不会丢失,记标记点在光学坐标系中的位置坐标为则局部坐标系的原点为该四个标记点的几何中心,即原点为:
记根节点坐标系的三个坐标轴为归一化向量rx,ry,rz,用最优化方法取距离腰部4个标记点最近的直线和平面,则直线的方向向量和平面的法向量分别坐标轴rx和ry的初始值rx’和ry’,则z轴向量为:
rz=rx’×ry’ (1)
由于初始的rx’和ry’不一定正交,令rx’与坐标轴rx一致,即rx=rx’,则:
ry=rz×rx(2)
对于训练数据,在将标记点转换至局部坐标系后,还需要通过将标记点位置坐标随机置零来模拟标记点丢失。记一段动作序列中的完整标记点的位置矩阵为Praw∈Rf×N,其中位置矩阵的行数为该段序列的帧数f,列数与标记点数量N一致,每个元素存储的为各标记点的根节点坐标系坐标;
随机置零的过程为:首先生成与位置矩阵大小一致的随机数矩阵A,其中的每个元素aij∈[0,1],设定丢失率为α,若aij<(1-α),则aij=1,反之aij=0,则得到新的矩阵Ap,则丢失后的标记点位置为:
Pmiss=Ap·Praw (3)
步骤2、网络训练
将步骤1的训练数据输入到能处理时间序列的网络结构中,如BiLSTM,LSTM等,对网络进行训练,其中训练时采用式(4)所示的融合时空约束的组合损失函数进行网络模型训练:
L=Lwp+wmdLmd+wfdLfd (4)
其中,Lwp为权重位置损失,就人体运动而言,肢体末端节点如手、脚、头的位置变化相较于其他关节点更容易被察觉,腰部根节点作为全部关节链的根节点,其运动误差会直接导致所有关节点的误差,为此本发明对不同关节造成的预测误差赋予不同权重,优先保证肢体末端节点和根节点的预测精度,降低了骨骼预测误差对用户视觉体验的影响。本发明在为各关节位置预测误差赋予权重时,不考虑手指和脚趾,将人体关节链的根节点(腰)和末端子节点(头、手腕和脚踝)上的标记点权重wmax设置最大权值,位于其他关节点处的标记点权重wmiddle次之,其余不在关节上的标记点权重wmin最小,损失函数具体形式如式(5):
其中,权重wmax、重wmiddle与权重wmin比值为4:2:1;为人体关节链的根节点和末端子节点标记点中标记点的预测位置,为标记点对应的真实位置;表示人体关节链上除根节点和末端子节点上标记点的预测位置,为对应的真实位置;为除人体关节链上的其他标记点的预测位置,为对应的真实位置。
Lmd为标记点间距损失,在空间上,人体骨架在运动中仍保持刚性结构,理想状态下,为了保持人体骨架的稳定结构,位于同一段骨骼的标记点间距在运动过程中应始终保持不变,则损失函数具体公式为式(6):
其中,h,g为间距保持不变的两个标记点索引,Dhg为标记点h,g的真实距离。权值wmd一般取0.3-0.7之间。
Lfd为前后帧损失,在摄像机采集帧率较高时,标志点的空间坐标在时间轴上应保持连续,同一标记点在连续两帧之间的位置之差较小,具体形式为式(7)。
步骤3、网络应用
对于实时获取的需要补点的一段动作序列,按照步骤1的方法对数据进行坐标转换,输入到步骤2训练好的网络模型中,可得到位置坐标补齐后的动作序列。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,包括如下步骤:
步骤1、获取训练数据,具体为:
获取已有的各标记点连续多帧的在光学坐标系中三维位置坐标作为原始输入数据;
将原始输入数据从光学坐标系转换至根节点坐标系;根节点坐标系以腰部的标记点的几何中心为原点;
将原始输入数据中标记点位置坐标随机置零来模拟标记点丢失,得到训练数据;
步骤2、网络训练,具体为:
将步骤1的训练数据输入到能处理时间序列的网络结构中,对网络进行训练,其中训练时采用下式所示的融合时空约束的组合损失函数进行网络模型训练:
L=Lwp+wmdLmd+wfdLfd
其中,Lwp为权重位置损失:
wmax为人体关节链的根节点和末端子节点上的标记点权重,wmiddle为位于其他关节点处的标记点权重,wmin为其余不在关节上的标记点权重;三者大小关系为:wmax>wmiddle>wmin;
为人体关节链的根节点和末端子节点标记点中标记点的预测位置,为标记点对应的真实位置;表示人体关节链上除根节点和末端子节点上标记点的预测位置,为对应的真实位置;为除人体关节链上的其他标记点的预测位置,为对应的真实位置;
Lmd为标记点间距损失:
其中,h,g为间距保持不变的两个标记点索引,Dhg为标记点h,g的真实距离;
Lfd为前后帧损失:
步骤3、对于实时获取的需要补点的一段动作序列,将各标记点的坐标转换到根节点坐标系,再输入到步骤2训练好的网络模型中,得到位置坐标补齐后的动作序列。
2.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤1中根节点坐标系的建立过程为:
记根节点坐标系的三个坐标轴x,y,z的归一化向量分别为rx,ry,rz,用最优化方法取距离腰部上所有标记点最近的直线和平面,则直线的方向向量和平面的法向量的初始值分别定义为rx,和ry,,则z轴归一化向量表示为:
rz=rx,×ry, (1)
令rx,与坐标轴z的归一化向量rx一致,即rx=rx,,则:ry=rz×rx;
由此建立根节点坐标系。
3.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤1中标记点位置坐标随机置零的方法为:
将原始输入数据中各标记点的位置矩阵表示为Praw∈Rf×N,其中位置矩阵的行数为该段序列的帧数f,列数与标记点数量N一致,每个元素存储的为各标记点的根节点坐标系的坐标;
随机置零的过程为:首先生成与位置矩阵大小一致的随机数矩阵A,其中的每个元素aij∈[0,1],设定丢失率为α,若aij<(1-α),则aij=1,反之aij=0,则得到新的矩阵Ap,则随机置零后的训练数据矩阵为:
Pmiss=Ap·Praw。
4.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2的网络结构为BiLSTM网络或者LSTM网络。
5.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2中,权重wmax、权重wmiddle与权重wmin比值为4:2:1。
6.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2中,权值wmd取0.3-0.7之间的数值。
7.如权利要求1所述的一种融合时空约束的光学动作捕捉标记点实时补全方法,其特征在于,所述步骤2中,取小于0.01的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111665416.1A CN114494341B (zh) | 2021-12-31 | 2021-12-31 | 一种融合时空约束的光学动作捕捉标记点实时补全方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111665416.1A CN114494341B (zh) | 2021-12-31 | 2021-12-31 | 一种融合时空约束的光学动作捕捉标记点实时补全方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114494341A true CN114494341A (zh) | 2022-05-13 |
CN114494341B CN114494341B (zh) | 2024-07-12 |
Family
ID=81508389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111665416.1A Active CN114494341B (zh) | 2021-12-31 | 2021-12-31 | 一种融合时空约束的光学动作捕捉标记点实时补全方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114494341B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117152670A (zh) * | 2023-10-31 | 2023-12-01 | 江西拓世智能科技股份有限公司 | 一种基于人工智能的行为识别方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017133009A1 (zh) * | 2016-02-04 | 2017-08-10 | 广州新节奏智能科技有限公司 | 一种基于卷积神经网络的深度图像人体关节定位方法 |
CN108376405A (zh) * | 2018-02-22 | 2018-08-07 | 国家体育总局体育科学研究所 | 基于双体感追踪系统的人体运动捕捉系统及捕捉方法 |
CN113688683A (zh) * | 2021-07-23 | 2021-11-23 | 网易(杭州)网络有限公司 | 光学运动捕捉数据处理方法、模型训练方法及装置 |
CN113808047A (zh) * | 2021-09-22 | 2021-12-17 | 武汉商学院 | 一种人体运动捕捉数据去噪方法 |
-
2021
- 2021-12-31 CN CN202111665416.1A patent/CN114494341B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017133009A1 (zh) * | 2016-02-04 | 2017-08-10 | 广州新节奏智能科技有限公司 | 一种基于卷积神经网络的深度图像人体关节定位方法 |
CN108376405A (zh) * | 2018-02-22 | 2018-08-07 | 国家体育总局体育科学研究所 | 基于双体感追踪系统的人体运动捕捉系统及捕捉方法 |
CN113688683A (zh) * | 2021-07-23 | 2021-11-23 | 网易(杭州)网络有限公司 | 光学运动捕捉数据处理方法、模型训练方法及装置 |
CN113808047A (zh) * | 2021-09-22 | 2021-12-17 | 武汉商学院 | 一种人体运动捕捉数据去噪方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117152670A (zh) * | 2023-10-31 | 2023-12-01 | 江西拓世智能科技股份有限公司 | 一种基于人工智能的行为识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114494341B (zh) | 2024-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110222665B (zh) | 一种基于深度学习和姿态估计的监控中人体动作识别方法 | |
CN104700433B (zh) | 一种基于视觉的实时人体全身体运动捕捉方法及其系统 | |
WO2017133009A1 (zh) | 一种基于卷积神经网络的深度图像人体关节定位方法 | |
CN106650687A (zh) | 一种基于深度信息和骨骼信息的姿势矫正方法 | |
KR20220025023A (ko) | 애니메이션 처리 방법 및 장치, 컴퓨터 저장 매체 그리고 전자 디바이스 | |
CN111724459B (zh) | 一种面向异构人体骨骼的运动重定向的方法及系统 | |
CN101520902A (zh) | 低成本动作捕捉与演示系统及方法 | |
CN113205595B (zh) | 一种3d人体姿态估计模型的构建方法及其应用 | |
CN100361070C (zh) | 一种基于光学的运动捕获数据的骨骼运动提取方法 | |
CN113642379B (zh) | 基于注意力机制融合多流图的人体姿态预测方法及系统 | |
CN106600626A (zh) | 三维人体运动捕获方法与系统 | |
WO2023185703A1 (zh) | 虚拟角色的动作控制方法、装置、设备和存储介质 | |
CN113158459A (zh) | 一种基于视觉和惯性信息融合的人体姿态估计方法 | |
CN117671738B (zh) | 基于人工智能的人体姿态识别系统 | |
CN113989283B (zh) | 3d人体姿态估计方法、装置、电子设备与存储介质 | |
CN112183316A (zh) | 一种运动员人体姿态测量方法 | |
CN102156994B (zh) | 一种单视角无标记人体运动跟踪的关节定位方法 | |
CN114494341A (zh) | 一种融合时空约束的光学动作捕捉标记点实时补全方法 | |
CN110559639B (zh) | 体操运动的机器人教学方法及机器人 | |
CN110264551B (zh) | 一种运动重定向方法及系统 | |
CN116129467A (zh) | 一种变电运维人员姿态与行为以及工器具姿态的识别方法 | |
CN116749168A (zh) | 一种基于体势手势示教的康复轨迹获取方法 | |
Hao et al. | Cromosim: A deep learning-based cross-modality inertial measurement simulator | |
CN115018962A (zh) | 一种基于虚拟人物模型的人体运动姿态数据集生成方法 | |
CN115294228A (zh) | 基于模态引导的多图人体姿态生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |