CN117612203A - 基于多振镜相机的远距离人体定位和动捕的方法及系统 - Google Patents
基于多振镜相机的远距离人体定位和动捕的方法及系统 Download PDFInfo
- Publication number
- CN117612203A CN117612203A CN202311568758.0A CN202311568758A CN117612203A CN 117612203 A CN117612203 A CN 117612203A CN 202311568758 A CN202311568758 A CN 202311568758A CN 117612203 A CN117612203 A CN 117612203A
- Authority
- CN
- China
- Prior art keywords
- galvanometer
- human body
- camera
- target person
- cameras
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000001514 detection method Methods 0.000 claims abstract description 28
- 230000000007 visual effect Effects 0.000 claims abstract description 11
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 7
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 10
- 230000007547 defect Effects 0.000 abstract description 4
- 230000033001 locomotion Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009012 visual motion Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000002478 hand joint Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C3/00—Measuring distances in line of sight; Optical rangefinders
- G01C3/10—Measuring distances in line of sight; Optical rangefinders using a parallactic triangle with variable angles and a base of fixed length in the observation station, e.g. in the instrument
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/145—Illumination specially adapted for pattern recognition, e.g. using gratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/34—Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Electromagnetism (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Artificial Intelligence (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种基于多振镜相机的远距离人体定位和动捕的方法及系统,该方法包括:采用多台振镜相机实时同步采集同一个目标人物的图像;通过人体2D关键点检测算法模型,检测出目标人物的人体及骨骼关键点在图像坐标系中的位置坐标;通过2D‑3D投影的三角算法计算出人体的3D空间坐标和骨骼关键点的3D坐标。本发明基于多振镜相机实时远距离跟踪捕捉目标,属于视觉被动式3D定位技术,由于振镜相机的捕捉范围很宽广,有效解决了固定相机定位区域小的缺点,且不用主动投射光源,不受距离限制,被定位目标也无需佩戴接收器。
Description
技术领域
本申请属于视觉跟踪技术领域,具体涉及一种基于多振镜相机的远距离人体定位和动捕的方法。
背景技术
现有的远距离动作捕捉技术,主要有基于惯导的动捕服、基于视觉的被动式动作捕捉、基于结构光的主动式视觉动作捕捉、基于激光发射/接收器模式的主动式动作捕捉等技术,现有的远距离3D空间定位技术,主要有:UWB空间定位、GPS空间定位、视觉被动式空间定位、激光/毫米波雷达空间定位等多种方式。
然而,现有的远距离动作捕捉技术中,基于惯导的穿戴式动捕服,具有穿戴起来不方便运动和信号传输距离近的弱点。基于结构光的主动式视觉动作捕捉,受结构光源发射功率限制,有捕捉距离近的弱点。基于激光发射/接受器模式的主动式动作捕捉,受发射功率限制,具有穿戴起来不方便、捕捉距离近的弱点。基于视觉的被动式动作捕捉,在远距离捕捉时,具有成像小捕捉范围小的弱点。
现有的远距离3D空间定位技术中,UWB空间定位和GPS空间定位都属于发射器/接收器模式,被捕捉目标需佩戴定位接收器,很不方便。激光/毫米波雷达空间定位属于主动投射式,但受到发射源功率限制,具有定位距离空间有限的弱点。视觉被动式3D空间定位大都为固定相机,视觉捕捉的空间是有限的,定位区域小。
在远距离视觉定位和动作捕捉中,如何在保证捕捉范围的前提下,提供一种定位区域大、且不用主动投射光源、不受距离限制、被定位目标也无需佩戴接收器的一种方法或系统是目前需要解决的主要技术问题。
发明内容
本申请的目的在于提供一种基于多振镜相机的远距离人体定位和动捕的方法及系统,以解决传统的远距离视觉定位和动捕中存在的成像捕捉范围小、需设置主动光源、受距离限制、需被定位目标佩戴接收器等问题。
根据上述目的,本申请的第一方面,提供了一种基于多振镜相机的远距离人体定位和动捕的方法,所述方法包括:
采用多台振镜相机实时同步采集同一个目标人物的图像;
通过人体2D关键点检测算法模型,检测出目标人物的人体及骨骼关键点在图像坐标系中的位置坐标;
通过2D-3D投影的三角算法计算出人体的3D空间坐标和骨骼关键点的3D坐标。
进一步地,采用多台振镜相机实时同步采集同一目标人物的图像包括:
使用多台振镜相机分别采集到视野图像后,通过人体检测模型检测出人体;
控制振镜相机跟踪到目标人物的人体;
通过对齐时间戳的方式同步多个相机的图像。
进一步地,通过对齐时间戳的方式同步多个相机的图像包括:
将多个振镜相机采集的图像以时间顺序放入各自的图像队列中,然后再异步对齐每个队列中时间戳最近的图像,并将他们拼接成一帧,其中,将时间戳的误差容许阈值设置为帧间隔的一半以内。
进一步地,所述振镜相机由高速相机、二维可控振镜、振镜驱动板、振镜控制板和电脑组成,所述电脑通过网线分别与所述高速相机和振镜控制板相连,所述电脑发送旋转控制指令给所述振镜控制板,所述振镜控制板接收该旋转控制指令后,驱动二维可控振镜偏转,以实时跟踪目标人物,其中,捕捉到的目标人物的图像反射于所述高速相机中。
进一步地,所述振镜相机为两组。
本发明的第二方面,提供了一种基于多振镜相机的远距离人体定位和动捕的系统,所述系统包括:
目标采集模块,通过多台振镜相机实时同步采集同一目标人物的图像;
位置坐标检测模块,通过人体2D关键点检测算法模型,检测出目标人物的人体及骨骼关键点在图像坐标系中的位置坐标;
3D坐标转化模块,通过2D-3D投影的三角算法计算出人体的3D空间坐标和骨骼关键点的3D坐标。
本申请实施例所公开的一种基于多振镜相机的远距离人体定位和动捕的方法及系统,属于视觉被动式3D定位技术,基于多振镜相机的捕捉范围很宽广,有效解决了固定相机定位区域小的缺点,同时,可实时远距离跟踪被捕捉目标,被捕捉目标无需穿戴任何接收器设备,为被动式感知,无投射光源,不受光源发射功率限制,捕捉范围和距离不受限制。
附图说明
图1为本实施例中的基于多振镜相机的远距离人体定位和动捕的方法的应用场景示意图。
图2为本实施例中的振镜相机的结构原理图。
图3为本实施例中的基于多振镜相机的远距离人体定位和动捕的方法的原理图。
图4为本实施例中的基于多振镜相机的远距离人体定位和动捕的系统的结构原理图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想。
本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
本说明书中所引用的如“前”、“、后”、“左”、“右”、“中间”、“纵向”、“横向”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,亦仅为了便于简化叙述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
实施例一
参照图1~图3所示,本申请的实施例一提供了一种基于多振镜相机的远距离人体定位和动捕的方法,该方法包括:
步骤S1、采用多台振镜相机实时同步采集同一个目标人物的图像。
具体的,此处的多台振镜相机,至少包括两组,为方便说明,本实施例仅以如图1所示的两组为例,两组间隔安装于不同位置,并同时对同一目标人物的图像进行采集。
参照图2所示,本实施例中的振镜相机的硬件结构实质上是由高速相机、二维可控振镜、振镜驱动板、振镜控制板和电脑组成,所述电脑通过网线分别与所述高速相机和振镜控制板相连,振镜驱动板分别通过信号线连接振镜控制板和二维可控振镜,二维可控振镜与高速相机间隔相对设置,高速相机的镜头朝向振镜的镜面,振镜捕捉到的图像将反射于高速相机中,高速相机应处于开机状态,高速相机将包含目标人物的图像传输给电脑,电脑根据目标人物的位置点变化,发送旋转控制指令给所述振镜控制板,所述振镜控制板接收该旋转控制指令后,驱动二维可控振镜偏转,以实时跟踪目标人物,其中,捕捉到的目标人物的图像反射于所述高速相机中。
其中,采用多台振镜相机实时同步采集同一目标人物的图像包括:
S11、使用多台振镜相机分别采集到视野图像后,通过人体检测模型检测出人体;其中,人体检测模型可以采用目前市面上比较通用的一些模型,比如Alphapose、Openpose、Openpifpaf或者fastpose等人体姿态估计模型。
S12、控制振镜相机跟踪到目标人物的人体;其中,振镜的旋转角度则是根据电脑计算给出的控制指令。
S13、通过对齐时间戳的方式同步多个相机的视野图像。
在步骤S13中,通过对齐时间戳的方式同步多个相机的视野图像包括如下过程:
将多个振镜相机采集的图像以时间顺序放入各自的图像队列中,然后再异步对齐每个队列中时间戳最近的图像,并将他们拼接成一帧,其中,将时间戳的误差容许阈值设置为帧间隔的一半以内,以保证采集的精度,比如100帧的捕捉帧率,则每台相机的时间戳误差在5ms以内。
步骤S2、通过人体2D关键点检测算法模型,检测出目标人物的人体及骨骼关键点在图像坐标系中的位置坐标。
具体的,人体关键点检测(Human Keypoints Detection)又称为人体姿态估计,是计算机视觉中一个相对基础的任务,是人体动作识别、行为分析、人机交互等的前置任务。一般情况下可以将人体关键点检测细分为单人/多人关键点检测、2D/3D关键点检测,同时有算法在完成关键点检测之后还会进行关键点的跟踪,也被称为人体姿态跟踪。多人人体骨骼关键点检测主要有两个方向,一种是自上而下,一种是自下而上,其中自上而上的人体骨骼关键点定位算法主要包含两个部分,人体检测和单人人体关键点检测,即首先通过目标检测算法将每一个人检测出来,然后在检测框的基础上针对单个人做人体骨骼关键点检测,其中代表性算法有G-RMI,CFN、RMPE、Mask R-CNN、CPN等。人体关键点算法模型可以采用现有技术中通用的技术,故在此不再赘述。
步骤S3、通过2D-3D投影的三角算法计算出人体的3D空间坐标和骨骼关键点的3D坐标。人体骨骼关键点检测可以用于捕捉人体的运动,例如电影制作、游戏开发等领域。人体骨骼关键点检测技术可以帮助计算机自动识别人体的关键点位置信息,如关节、手脚等部位,从而实现对人体姿态和行为的预测。特别是在人体动作捕捉领域,可以帮助制作人员更准确地捕捉人体的运动动作,从而制作出更逼真的动画效果。
具体的,三角测量(triangulation)法就是在不同的姿态下观察同一个对象,根据图像上的同名点的像素坐标,计算对象的三维坐标。在双目视觉中,分左右相机,同时可以获得左视图和右视图,根据匹配的同名点和左右相机的投影矩阵,就可以计算出匹配同名点的世界坐标。
本申请以两台振镜相机,在60米以外的空间范围跟踪捕捉跑步的运动员3D姿态和位置(测试场地太小,实测距离还可进一步延长),实测精度可达到10厘米以内的位置精度和姿态关节角度2.5度以内的精度,真正意义上实现了高精度、非穿戴、远距离高速定位人体位置和捕捉姿态的目的。
实施例二
参照图4所示,本申请的另一实施例,还提供了一种基于多振镜相机的远距离人体定位和动捕的系统,所述系统包括:
目标采集模块,通过多台振镜相机实时同步采集同一目标人物的图像;
位置坐标检测模块,通过人体2D关键点检测算法模型,检测出目标人物的人体及骨骼关键点在图像坐标系中的位置坐标;
3D坐标转化模块,通过2D-3D投影的三角算法计算出人体的3D空间坐标和骨骼关键点的3D坐标。
本发明实施例所公开的一种基于多振镜相机的远距离人体定位和动捕的系统,属于视觉被动式3D定位技术,由于振镜相机的捕捉范围很宽广,有效解决了固定相机定位区域小的缺点,且不用主动投射光源,不受距离限制,被定位目标也无需佩戴接收器,也提高了用户体验。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (6)
1.一种基于多振镜相机的远距离人体定位和动捕的方法,其特征在于,所述方法包括:
采用多台振镜相机实时同步采集同一个目标人物的图像;
通过人体2D关键点检测算法模型,检测出目标人物的人体及骨骼关键点在图像坐标系中的位置坐标;
通过2D-3D投影的三角算法计算出人体的3D空间坐标和骨骼关键点的3D坐标。
2.根据权利要求1所述的标定方法,其特征在于,采用多台振镜相机实时同步采集同一个目标人物的图像包括:
使用多台振镜相机分别采集到视野图像后,通过人体检测模型检测出人体;
控制振镜相机跟踪到目标人物的人体;
通过对齐时间戳的方式同步多个相机中的图像。
3.根据权利要求2所述的标定方法,其特征在于,通过对齐时间戳的方式同步多个相机中的图像包括:
将多个振镜相机采集的图像以时间顺序放入各自的图像队列中,然后再异步对齐每个队列中时间戳最近的图像,并将他们拼接成一帧,其中,将时间戳的误差容许阈值设置为帧间隔的一半以内。
4.根据权利要求1所述的标定方法,其特征在于,所述振镜相机由高速相机、二维可控振镜、振镜驱动板、振镜控制板和电脑组成,所述电脑通过网线分别与所述高速相机和振镜控制板相连,所述电脑发送旋转控制指令给所述振镜控制板,所述振镜控制板接收该旋转控制指令后,驱动二维可控振镜偏转,以实时跟踪目标人物,其中,捕捉到的目标人物的图像反射于所述高速相机中。
5.根据权利要求1所述的标定方法,其特征在于,所述振镜相机为两组。
6.一种基于多振镜相机的远距离人体定位和动捕的系统,其特征在于,所述系统包括:
目标采集模块,通过多台振镜相机实时同步采集同一个目标人物的图像;
位置坐标检测模块,通过人体2D关键点检测算法模型,检测出目标人物的人体及骨骼关键点在图像坐标系中的位置坐标;
3D坐标转化模块,通过2D-3D投影的三角算法计算出人体的3D空间坐标和骨骼关键点的3D坐标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311568758.0A CN117612203A (zh) | 2023-11-22 | 2023-11-22 | 基于多振镜相机的远距离人体定位和动捕的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311568758.0A CN117612203A (zh) | 2023-11-22 | 2023-11-22 | 基于多振镜相机的远距离人体定位和动捕的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117612203A true CN117612203A (zh) | 2024-02-27 |
Family
ID=89943579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311568758.0A Pending CN117612203A (zh) | 2023-11-22 | 2023-11-22 | 基于多振镜相机的远距离人体定位和动捕的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117612203A (zh) |
-
2023
- 2023-11-22 CN CN202311568758.0A patent/CN117612203A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
State et al. | Superior augmented reality registration by integrating landmark tracking and magnetic tracking | |
US20170337701A1 (en) | Method and system for 3d capture based on structure from motion with simplified pose detection | |
CN109374008A (zh) | 一种基于三目摄像头的图像采集系统及方法 | |
US20070076090A1 (en) | Device for generating three dimensional surface models of moving objects | |
JP6293110B2 (ja) | 点群データ取得システム及びその方法 | |
CN104685541A (zh) | 用于确定三维对象上注视点的方法和装置 | |
CN106643699A (zh) | 一种虚拟现实系统中的空间定位装置和定位方法 | |
CN108846867A (zh) | 一种基于多目全景惯导的slam系统 | |
CN108227929A (zh) | 基于bim技术的增强现实放样系统及实现方法 | |
CN108156450A (zh) | 用于校准摄像机的方法、校准设备、校准系统以及机器可读的存储介质 | |
CN106843507A (zh) | 一种虚拟现实多人互动的方法及系统 | |
CN106256394A (zh) | 混合动作捕捉的训练装置及系统 | |
US20130179119A1 (en) | Data collection and point cloud generation system and method | |
CN108693532A (zh) | 基于增强型双目相机与3d毫米波雷达的可穿戴避障方法及装置 | |
CN109242887A (zh) | 一种基于多摄像机和imu的实时人体上肢动作捕捉方法 | |
JP2016006415A (ja) | 光学式モーションキャプチャにおける光学式マーカーの位置の推定方法及び装置 | |
US20070076096A1 (en) | System and method for calibrating a set of imaging devices and calculating 3D coordinates of detected features in a laboratory coordinate system | |
KR20190063153A (ko) | 단일 카메라 영상을 이용하여 초기 3차원 궤적 및 속도를 동시에 복원하는 시스템 및 그 방법 | |
CN207164367U (zh) | Ar眼镜及其追踪系统 | |
CN206819290U (zh) | 一种虚拟现实多人互动的系统 | |
CN111947650A (zh) | 基于光学追踪与惯性追踪的融合定位系统及方法 | |
CN107564051A (zh) | 一种深度信息采集方法及系统 | |
US20190228583A1 (en) | Systems and methods for tracking object location and orientation in virtual reality environments using ultra-wideband signals, inertia measurement units, and reflective markers | |
CN117612203A (zh) | 基于多振镜相机的远距离人体定位和动捕的方法及系统 | |
CN113487726B (zh) | 动作捕捉系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |