CN112819849B - 一种基于三目的无标记点视觉运动捕捉方法 - Google Patents

一种基于三目的无标记点视觉运动捕捉方法 Download PDF

Info

Publication number
CN112819849B
CN112819849B CN202110047189.XA CN202110047189A CN112819849B CN 112819849 B CN112819849 B CN 112819849B CN 202110047189 A CN202110047189 A CN 202110047189A CN 112819849 B CN112819849 B CN 112819849B
Authority
CN
China
Prior art keywords
human body
motion
smpl
camera
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110047189.XA
Other languages
English (en)
Other versions
CN112819849A (zh
Inventor
郑亚莉
郑旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110047189.XA priority Critical patent/CN112819849B/zh
Publication of CN112819849A publication Critical patent/CN112819849A/zh
Application granted granted Critical
Publication of CN112819849B publication Critical patent/CN112819849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Abstract

该发明公开了一种基于三目的无标记点视觉运动捕捉方法,属于计算机视觉领域。与已有的vicon系统相比,提出的方法只需要3个视觉相机捕捉视频序列,仅需测试者穿上紧身的衣裤,无需在人体上贴反光标记;获得人体运动不只是关节点的运动,而是整个人体形状的运动。本发明洗现有技术相比,提高了性能、可靠性、降低了成本、简化了工艺。本发明的技术需要的硬件设备相机更少;现有技术通常捕获的动作为3维的点,而本发明捕获的为3D的网格,包含人体的体型和姿态。

Description

一种基于三目的无标记点视觉运动捕捉方法
技术领域
本发明属于计算机视觉领域,特别是基于三目的无标记点视觉运动捕捉方法。
背景技术
运动捕捉在影视动画制作等领域有着广泛的需求,通常利用惯性运动传感器和视觉传感器来实现。其中利用惯性运动传感器进行运动捕捉精度较低,利用光学传感器进行运动捕捉精度高。以vicon为代表的光学运动捕捉系统采用4路或6路以上的高速红外摄像机采集贴在人体关节点上的被动发光标记点,利用视觉测量的方法构建人体关节运动三维数据,已经在行业内得到了成熟的应用。为了获得准确完整的人体关节点信息,使用vicon系统必须在人体表面贴上反光球,且必须安装4路以上的高速红外摄像机。安装的红外相机越多,重建的人体运动越准确,受遮挡影响也越小,但成本也越高。除了利用红外摄像机捕捉人体运动,还有诸多方法利用深度传感器来实现人体运动重建。例如已有授权专利“一种基于单个Kinect的简易高效三维人体重建方法”(201610502690X)利用单个的Kinect RGBD传感器实现人体运动捕捉,公开专利“基于骨架跟踪的动态实时三维人体重建方法及系统”(2017114088488),“一种基于合成深度数据的三维人体重建方法”(2019105400408)均是利用采集的深度图来实现。
发明内容
本发明的目的在于提出一种利用3路相机深度生成人体形状,捕捉人体运动的方法。与已有的vicon系统相比,提出的方法只需要3个视觉相机捕捉视频序列,仅需测试者穿上紧身的衣裤,无需在人体上贴反光标记;获得人体运动不只是关节点的运动,而是整个人体形状的运动。
本发明技术方案为一种基于三目的无标记点视觉运动捕捉方法,该方法包括:
步骤1:从水平的三个方向采集目标视频,这三个方向两两之间夹角相等;
步骤2:从视频图像中提取每一帧中目标的轮廓;
步骤3:建立深度神经网络预测人体形状与姿态;
建立的神经网络结构包括两部分,分别为:轮廓特征提取和人体SMPL模型参数预测;其中轮廓特征提取采用深度残差网络、或U形网络、或叠层沙漏网络;人体SMPL参数模型,该参数模型中人体形状表示为10个形状参数和72个姿态参数,SMPL模型参数预测采用多层感知机或误差迭代网络;轮廓特征提取采用叠加的双层沙漏网络与深度残差网络的组合,人体SMPL模型参数预测采用误差迭代网络;叠加的双层沙漏网络中输出2D关节点分别为P0,P1,采用Pgt作为中间监督信息,人体参数预测输出为人体体型参数向量
Figure GDA0003245408190000021
人体姿态参数
Figure GDA0003245408190000022
人体相对于三相机视野中心偏移量
Figure GDA0003245408190000023
步骤4:训练深度神经网络;
训练的目标函数如下:
Figure GDA0003245408190000024
Figure GDA0003245408190000025
其中,λregpβθ分别为2D关节点误差权重,骨架反投影误差权重,SMPL体型参数误差权重和SMPL姿态参数误差权重;
Figure GDA0003245408190000026
表示三维关节点集合,
Figure GDA0003245408190000027
表示3D关键点个数,Γ(·)表示人体的SMPL模型关键点映射函数;P0,P1分别是网络中间部分预测的2D关节点,Pgt为2D关节点的真值,i表示第i个关节点,由于存在三个视角这里将三个视角的向量,合并后Pgt长度为
Figure GDA0003245408190000028
Figure GDA0003245408190000029
表示由SMPL参数模型生成的人体网格;c表示相机的编号,Πc表示相机编号为c的相机投影函数;
步骤5:利用步骤4训练的人体形状生成网络针对单帧进行人体形状计算,再对计算得到的单帧人体形状进行防穿模计算;在时间序列下多帧连续处理过程中采用如下优化函数进行优化;
Figure GDA00032454081900000210
设相机的帧率FPS≥F,F为阈值,视人体在帧与帧之间的运动为匀速运动,针对位于滑动窗口中的帧,滑动窗口大小为2N+1;优化函数中,Dc为编号为c相机下二值轮廓图像,tj表示第j时刻,
Figure GDA00032454081900000211
为tj时刻编号为c相机下二值轮廓图像;Πc为编号为c的相机投影模型,投影后结果为二值轮廓图像;
Figure GDA00032454081900000212
为tj时刻SMPL的姿态参数,
Figure GDA00032454081900000213
为tj时刻相对于时三相机中心位置的偏移量;
Figure GDA0003245408190000031
代表tj时刻位于第p个关节点的球体半径;N(k)为第k关键点的邻接关键点集合;d(·)为距离函数。
与现有技术相比,本发明所具有的优点和有益效果,性能的提高、可靠性的提高、成本的降低、工艺的简化、节能环保等。本发明的技术需要的硬件设备相机更少;现有技术通常捕获的动作为3维的点,而本发明捕获的为3D的网格,包含人体的体型和姿态。
步骤4的目标函数主要有以下三点优势:
1.本方法对人体的体型姿态参数进行监督,使得网络可以学习到人体的形状信息,而并非传统方法的多个标记点。该优势的主要原因为本方法中使用人体形状模型,该模型拥有人体形状的先验知识。
2.本方法中同时将轮廓作为输入信息与监督信息,输入信息更少分布更单一网络训练时间更短。同时因为输入为轮廓信息与场景无关,训练数据可以通过生成大量获得。
3.本方法中使用三相机同时对人体进行捕捉,相比传统姿态捕捉系统的相机数量更少,同时本方法也不需要在人体表面贴状标记点,只需要人体的服装紧身即可。传统方法在人体全身安装标记点,为了获得准确标记点的位置每个标记点需要至少被两台相机所观测到故需要多台相机同时工作,本方法由于在训练过程中有人体形状的真值对相机的个数需求并不高,只需要三台相机消除轮廓信息所带来的不确定性即可。
步骤5的优化函数主要有以下三点优势:
1.能够减小由深度神经网络带来的误差。由于本方法的输入信息为轮廓,理想情况下生成的人体形状与输入信息应保持一致,通过输入信息直接对结果进行监督可以进一步优化深度神经网络生成的人体形状的误差。
2.能够减少自穿模不合理情况发生。使用轮廓信息作为输入轮廓内部细节不明确,容易导致自穿模现象的发生,通过在人体形状内部添加防碰撞球体能够减少人体形状的自碰撞情况。
3.能够利用连续时间信息进一步对减少误差。人体在运动过程中形状的变化应该是连续的,通过对人体的速度变化进行约束优化时间上连续性,能够减小中间帧输出结果突变的情况,进一步减小重构结果误差。
附图说明
图1为本发明硬件系统示意图。
图2为本发明输入图像的实例。
图3为方碰撞球体添加示意图。
图4为3D人体形状序列重建方法流程图。
图5为单帧轮廓重构结果图。
图6为连续16帧轮廓重建图。
图7为连续10帧“跳”的动作轮廓重建图。
图8为连续10帧“走0”的动作轮廓重建图。
图9为连续10帧“走1”的动作轮廓重建图。
图10为连续10帧“跑0”的动作轮廓重建图。
图11为连续10帧“跑1”的动作轮廓重建图。
具体实施方式
1.本发明硬件系统由三个相机组成,相机之间的夹角为θ,高度为h,相机距离人体距离为d,相机视野范围为
Figure GDA0003245408190000044
人体在三相机视野公共范围内运动。采集环境背景需要设置为单一背景,比如绿色,待重建对象着紧身的衣物,且衣物颜色与背景色差距较大,以便于人体轮廓提取。三个相机需要在捕获数据前进行校正获得各自的相机内参矩阵K0,K1,K2用以矫正其后2D、3D关节点坐标。
2.轮廓提取。轮廓提取采用现有图像分割技术进行,由于背景颜色与人体颜色不同,可以直接将人体从背景中直接分割出来,形成人体轮廓,作为第3步的输入。
3.建立深度神经网络预测人体形状与姿态。神经网络结构分为两部分,轮廓特征提取与人体SMPL模型参数预测。其中轮廓特征提取可使用现有各种深度神经网络结构,例如深度残差网络,U形网络,叠层沙漏网络等等;本发明采用人体SMPL参数模型,该参数模型将人体形状表示成10个形状参数和72个姿态参数,SMPL模型参数预测可采用多层感知机,误差迭代网络等等。本发明中深度神经网络采用特征提取采用叠层沙漏网络与深度残差网络的组合,人体参数预测采用误差迭代网络;叠加的双层沙漏网络中输出2D关节点分别为P0,P1采用Pgt作为中间监督信息,人体参数预测输出人体体型参数向量
Figure GDA0003245408190000041
人体姿态参数
Figure GDA0003245408190000042
人体相对于三相机视野中心偏移量
Figure GDA0003245408190000043
4.训练深度神经网络。深度神经网络训练期间采用人体轮廓数据作为输入,数据采用MOSH数据集(包含不同人体形状不同姿态序列的数据集)作为人体形状的真实值,并使用渲染器(PyRender)设置与硬件系统一致的三个虚拟相机,渲染出在三个视角下的人体轮廓作为输入,渲染结果示意图如图2所示。训练的目标函数如下:
Figure GDA0003245408190000051
Figure GDA0003245408190000052
其中λregpβθ分别为2D关节点误差权重,骨架反投影误差权重,SMPL体型参数误差权重和SMPL姿态参数误差权重。
Figure GDA0003245408190000053
表示三维关节点集合,
Figure GDA0003245408190000054
表示3D关键点个数,Γ(·)表示人体的SMPL模型关键点映射函数。P0,P1分别是网络中间部分预测的2D关节点,Pgt为2D关节点的真值,i表示第i个关节点,由于存在三个视角这里将三个视角的向量,合并后Pgt长度为
Figure GDA0003245408190000055
Figure GDA0003245408190000056
表示由SMPL参数模型生成的人体网格。c表示相机的编号,Πc表示相机编号为c的相机投影函数。
5.利用步骤4训练的人体形状生成网络针对单帧进行人体形状预测,再优化人体形状重建序列,同时考虑穿模情况。在人体形状关节点上添加球体,球体添加的情况如图4所示。在图4中灰色圆点代表人体网格所组成的点,其中黑色叉状点代表着添加球体的中心部位,在人体左膝盖灰色球体为添加球体在模型内的示意情况。
对时间序列进行处理的过程中,假设相机的帧率FPS≥F,F为阈值,视人体在帧与帧之间的运动为匀速运动,针对位于滑动窗口中的帧(滑动窗口大小为2N+1),建立如下优化函数:
Figure GDA0003245408190000057
其中Dc为编号为c相机下二值轮廓图像,tj表示第j时刻,
Figure GDA0003245408190000058
为tj时刻编号为c相机下二值轮廓图像;Πc为编号为c的相机投影模型,投影后结果为二值轮廓图像;
Figure GDA0003245408190000059
为tj时刻SMPL的姿态参数,
Figure GDA00032454081900000510
为tj时刻相对于时三相机中心位置的偏移量;
Figure GDA00032454081900000511
代表tj时刻位于第p个关节点的球体半径;N(k)为第k关键点的邻接关键点集合。d(·)为距离函数。
在实验中,相机间夹角均设置约为θ=120°,相机视野范围约
Figure GDA00032454081900000512
若相机视野范围大于该角度则通过图像裁剪获得该范围的图像。相机高度约h=0.8m,相机距离人体约t=4m。帧率阈值F=120,窗口大小2N+1=5。
为进一步评定本发明的有效性,进行定量误差分析实验。实验中采用MOSH数据集中未被训练部分作为真实值,并采用步骤4中的策略生成三视角轮廓信息作为输入,对神经网络输出和最终结果进行误差分析。实验中采用平均网格点误差与平均关节点误差作为评判标准,其中平均网格点误差为网格上点与点之间的欧式距离平均值,平均关节点位置误差为关节点的欧式距离误差平均值。
表1.序列定量分析,重建误差(单位:cm)
Figure GDA0003245408190000061

Claims (1)

1.一种基于三目的无标记点视觉运动捕捉方法,该方法包括:
步骤1:从水平的三个方向采集目标视频,这三个方向两两之间夹角相等;
步骤2:从视频图像中提取每一帧中目标的轮廓;
步骤3:建立深度神经网络预测人体形状与姿态;
建立的神经网络结构包括两部分,分别为:轮廓特征提取和人体SMPL模型参数预测;人体SMPL参数模型,该参数模型中人体形状表示为10个形状参数和72个姿态参数,SMPL模型参数预测采用多层感知机或误差迭代网络;轮廓特征提取采用叠加的双层沙漏网络与深度残差网络的组合;叠加的双层沙漏网络中输出2D关节点分别为P0,P1,采用Pgt作为中间监督信息,人体参数预测输出为人体体型参数向量
Figure FDA0003266997640000011
人体姿态参数
Figure FDA0003266997640000012
人体相对于三相机视野中心偏移量
Figure FDA0003266997640000013
步骤4:训练深度神经网络;
训练的目标函数如下:
Figure FDA0003266997640000014
Figure FDA0003266997640000015
其中,λregpβθ分别为2D关节点误差权重,骨架反投影误差权重,SMPL体型参数误差权重和SMPL姿态参数误差权重;
Figure FDA0003266997640000016
表示三维关节点集合,
Figure FDA0003266997640000017
表示三维关节点个数,Γ(·)表示人体的SMPL模型关节点映射函数;P0,P1分别是网络中间部分预测的2D关节点,Pgt为2D关节点的真值,i表示第i个关节点,由于存在三个视角这里将三个视角的向量,合并后Pgt长度为
Figure FDA0003266997640000018
Figure FDA0003266997640000019
表示由SMPL参数模型生成的人体网格;c表示相机的编号,Πc表示相机编号为c的相机投影函数;
步骤5:利用步骤4训练的人体形状生成网络针对单帧进行人体形状计算,再对计算得到的单帧人体形状进行防穿模计算,得到单帧的人体形状;然后在时间序列下多帧连续处理;
其特征在于,所述步骤5中在时间序列下多帧连续处理过程中采用如下优化函数进行优化;
Figure FDA0003266997640000021
设相机的帧率FPS≥F,F为阈值,视人体在帧与帧之间的运动为匀速运动,针对位于滑动窗口中的帧,滑动窗口大小为2N+1;优化函数中,Dc为编号为c相机下二值轮廓图像,tj表示第j时刻,
Figure FDA0003266997640000022
为tj时刻编号为c相机下二值轮廓图像;Πc为编号为c的相机投影模型,投影后结果为二值轮廓图像;
Figure FDA0003266997640000023
为tj时刻SMPL的姿态参数,
Figure FDA0003266997640000024
为tj时刻相对于相机中心位置的偏移量;
Figure FDA0003266997640000025
代表tj时刻位于第p个关节点的球体半径;N(b)为第b关节点的邻接关节点集合;d(·)为距离函数。
CN202110047189.XA 2021-01-14 2021-01-14 一种基于三目的无标记点视觉运动捕捉方法 Active CN112819849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110047189.XA CN112819849B (zh) 2021-01-14 2021-01-14 一种基于三目的无标记点视觉运动捕捉方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110047189.XA CN112819849B (zh) 2021-01-14 2021-01-14 一种基于三目的无标记点视觉运动捕捉方法

Publications (2)

Publication Number Publication Date
CN112819849A CN112819849A (zh) 2021-05-18
CN112819849B true CN112819849B (zh) 2021-12-03

Family

ID=75869436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110047189.XA Active CN112819849B (zh) 2021-01-14 2021-01-14 一种基于三目的无标记点视觉运动捕捉方法

Country Status (1)

Country Link
CN (1) CN112819849B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115861592B (zh) * 2023-02-16 2023-05-26 之江实验室 基于神经网络的动作捕捉系统的速度精度优化方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016207311A1 (en) * 2015-06-24 2016-12-29 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Skinned multi-person linear model
CN108053469A (zh) * 2017-12-26 2018-05-18 清华大学 多视角相机下的复杂动态场景人体三维重建方法及装置
CN108629801A (zh) * 2018-05-14 2018-10-09 华南理工大学 一种视频序列的三维人体模型姿态与形状重构方法
WO2020099338A1 (en) * 2018-11-16 2020-05-22 Kokkinos Iason Three-dimensional object reconstruction
CN111627101A (zh) * 2020-05-22 2020-09-04 北京工业大学 一种基于图卷积的三维人体重构方法
CN111738220A (zh) * 2020-07-27 2020-10-02 腾讯科技(深圳)有限公司 三维人体姿态估计方法、装置、设备及介质
CN111783497A (zh) * 2019-04-03 2020-10-16 北京京东尚科信息技术有限公司 视频中目标的特征确定方法、装置和计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016207311A1 (en) * 2015-06-24 2016-12-29 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Skinned multi-person linear model
CN108053469A (zh) * 2017-12-26 2018-05-18 清华大学 多视角相机下的复杂动态场景人体三维重建方法及装置
CN108629801A (zh) * 2018-05-14 2018-10-09 华南理工大学 一种视频序列的三维人体模型姿态与形状重构方法
WO2020099338A1 (en) * 2018-11-16 2020-05-22 Kokkinos Iason Three-dimensional object reconstruction
CN111783497A (zh) * 2019-04-03 2020-10-16 北京京东尚科信息技术有限公司 视频中目标的特征确定方法、装置和计算机可读存储介质
CN111627101A (zh) * 2020-05-22 2020-09-04 北京工业大学 一种基于图卷积的三维人体重构方法
CN111738220A (zh) * 2020-07-27 2020-10-02 腾讯科技(深圳)有限公司 三维人体姿态估计方法、装置、设备及介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Temporally Refined Graph U-Nets for Human Shape and Pose Estimation From Monocular Videos;Yang Zhao et al.;《IEEE Signal Processing Letters》;20201023;第27卷;第1950-1951页 *
VIBE: Video Inference for Human Body Pose and Shape Estimation;Muhammed Kocabas et al.;《2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)》;20200619;全文 *
基于卷积神经网络的人体行为分析与步态识别研究;李超;《中国博士学位论文全文数据库 信息科技辑》;20190815(第08期);全文 *

Also Published As

Publication number Publication date
CN112819849A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN102903096B (zh) 一种基于单目视频的对象深度提取方法
Mitrokhin et al. EV-IMO: Motion segmentation dataset and learning pipeline for event cameras
CN109800689B (zh) 一种基于时空特征融合学习的目标跟踪方法
CN108648161B (zh) 非对称核卷积神经网络的双目视觉障碍物检测系统及方法
CN109934848B (zh) 一种基于深度学习的运动物体精准定位的方法
CN108416840A (zh) 一种基于单目相机的三维场景稠密重建方法
CN107818326A (zh) 一种基于场景多维特征的船只检测方法及系统
CN108932725B (zh) 基于卷积神经网络的场景流估计方法
CN108364344A (zh) 一种基于回环测试的单目实时三维重建方法
CN103729860B (zh) 一种图像目标跟踪的方法和装置
CN106815578A (zh) 一种基于深度运动图‑尺度不变特征变换的手势识别方法
CN107680116A (zh) 一种监测视频图像中运动目标的方法
CN106600632A (zh) 一种改进匹配代价聚合的立体匹配算法
CN106022266A (zh) 一种目标跟踪方法及装置
CN111914615A (zh) 基于立体视觉的消防区域可通过性分析系统
CN114036969A (zh) 一种多视角情况下的3d人体动作识别算法
CN110889868B (zh) 一种结合梯度和纹理特征的单目图像深度估计方法
CN112819849B (zh) 一种基于三目的无标记点视觉运动捕捉方法
Wang et al. Recurrent neural network for learning densedepth and ego-motion from video
Yang et al. Human action recognition based on skeleton and convolutional neural network
CN117132952A (zh) 一种基于多摄像头的鸟瞰视角车辆感知系统
CN117132651A (zh) 一种融合彩色图像和深度图像的三维人体姿态估计方法
Zhou et al. Mh pose: 3d human pose estimation based on high-quality heatmap
CN114548224A (zh) 一种用于强交互人体运动的2d人体位姿生成方法及装置
Chen et al. Bidirectional optical flow NeRF: high accuracy and high quality under fewer views

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant