CN109461203B - 手势三维图像生成方法、装置、计算机设备及存储介质 - Google Patents

手势三维图像生成方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109461203B
CN109461203B CN201811081908.4A CN201811081908A CN109461203B CN 109461203 B CN109461203 B CN 109461203B CN 201811081908 A CN201811081908 A CN 201811081908A CN 109461203 B CN109461203 B CN 109461203B
Authority
CN
China
Prior art keywords
image
dimensional image
depth
gesture
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811081908.4A
Other languages
English (en)
Other versions
CN109461203A (zh
Inventor
彭明浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811081908.4A priority Critical patent/CN109461203B/zh
Publication of CN109461203A publication Critical patent/CN109461203A/zh
Application granted granted Critical
Publication of CN109461203B publication Critical patent/CN109461203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/08Indexing scheme for image data processing or generation, in general involving all processing steps from image acquisition to 3D model generation

Abstract

本发明公开了手势三维图像生成方法、装置、计算机设备及存储介质,可首先获取用户手势的二维图像,之后可确定出二维图像对应的深度图像,进而可基于确定出的深度图像生成用户手势的3D图像,从而摆脱了对于3D相机的依赖,降低了实现成本,而且二维图像的获取非常方便,从而可适用于各种不同的场景,具有广泛适用性等。

Description

手势三维图像生成方法、装置、计算机设备及存储介质
【技术领域】
本发明涉及计算机应用技术,特别涉及手势三维图像生成方法、装置、计算机设备及存储介质。
【背景技术】
人机交互是对电子产品的用户体验影响最直接的技术之一。当年借由电容触控屏,将键盘、鼠标、轨迹球等一众技术拉下马的景象,至今仍令人记忆犹新。而今天,人机交互技术又来到了一个新的阶段,如通过三维(3D,Three Dimensions)手势交互。
与触控技术在二维(2D,Two Dimensions)平面上的写写画画相比,3D手势加上了一个Z轴深度的测量,使其可以承载更多的人机交互信息,可以实现非接触的感应和控制,给产品的设计带来更大的想象空间。
目前的处理方式中,通常采用3D相机来获取手势的3D图像,进而基于获取到的3G图像完成后续的3D手势交互。
但是3D相机的价格通常都比较高,从而增加了实现成本,而且在没有3D相机的场景下则无法实现3D手势交互,造成了很大的局限性。
【发明内容】
有鉴于此,本发明提供了手势三维图像生成方法、装置、计算机设备及存储介质。
具体技术方案如下:
一种手势三维图像生成方法,包括:
获取用户手势的二维图像;
确定出所述二维图像对应的深度图像;
基于所述深度图像生成用户手势的三维3D图像。
根据本发明一优选实施例,所述确定出所述二维图像对应的深度图像包括:
将所述二维图像作为输入,根据预先训练得到的深度网络模型,确定出所述二维图像对应的深度图像。
根据本发明一优选实施例,所述深度网络模型的获取方式包括:
获取训练样本,每个训练样本中包括:用户手势的二维图像以及对应的深度图像;
根据所述训练样本训练得到所述深度网络模型。
根据本发明一优选实施例,所述获取训练样本包括:利用kinect技术获取所述训练样本;
所述深度网络模型包括:生成式对抗网络GAN模型。
根据本发明一优选实施例,所述基于所述深度图像生成用户手势的3D图像包括:
结合所述深度图像以及所述二维图像生成所述3D图像。
一种手势三维图像生成装置,包括:获取单元、确定单元以及生成单元;
所述获取单元,用于获取用户手势的二维图像;
所述确定单元,用于确定出所述二维图像对应的深度图像;
所述生成单元,用于基于所述深度图像生成用户手势的三维3D图像。
根据本发明一优选实施例,所述确定单元将所述二维图像作为输入,根据预先训练得到的深度网络模型,确定出所述二维图像对应的深度图像。
根据本发明一优选实施例,所述装置中进一步包括:预处理单元;
所述预处理单元,用于获取训练样本,每个训练样本中包括:用户手势的二维图像以及对应的深度图像,根据所述训练样本训练得到所述深度网络模型。
根据本发明一优选实施例,所述预处理单元利用kinect技术获取所述训练样本;
所述深度网络模型包括:生成式对抗网络GAN模型。
根据本发明一优选实施例,所述生成单元结合所述深度图像以及所述二维图像生成所述3D图像。
一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
基于上述介绍可以看出,采用本发明所述方案,可首先获取用户手势的二维图像,之后可确定出二维图像对应的深度图像,进而可基于确定出的深度图像生成用户手势的3D图像,从而摆脱了对于3D相机的依赖,降低了实现成本,而且二维图像的获取非常方便,从而可适用于各种不同的场景,具有广泛适用性等。
【附图说明】
图1为本发明所述手势三维图像生成方法第一实施例的流程图。
图2为现有kinect设备的整体结构示意图。
图3为本发明所述深度图像的示意图。
图4为本发明所述手势三维图像生成方法第二实施例的流程图。
图5为本发明所述手势三维图像生成装置实施例的组成结构示意图。
图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。
【具体实施方式】
本发明中提出一种手势三维图像生成方式,可根据手势的二维图像来生成手势的三维图像。所述二维图像可为红绿蓝(RGB,Red Green Blue)图像或灰度图像等任意类型的二维图像。
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案进行进一步说明。以下各实施例中,均以二维图像为RGB图像为例进行说明。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明所述手势三维图像生成方法第一实施例的流程图。如图1所示,包括以下具体实现方式。
在101中,获取用户手势的RGB图像。
在102中,确定出获取到的RGB图像对应的深度图像。
在103中,基于确定出的深度图像生成用户手势的3D图像。
RGB色彩模式是工业界的一种颜色标准,通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。
可按照现有方式获取用户手势的RGB图像,即2D图像,之后可确定出获取到的RGB图像对应的深度图像,进而可基于确定出的深度图像生成用户手势的3D图像。深度图像中的每个像素值代表的是物体到相机xy平面的距离。
其中,在确定获取到的RGB图像对应的深度图像时,可将RGB图像作为输入,根据预先训练得到的深度网络模型,得到RGB图像对应的深度图像。
为此,需要首先获取训练样本,每个训练样本中可包括:用户手势的RGB图像以及对应的深度图像,进而可根据获取到的训练样本训练得到深度网络模型。
在实际应用中,可利用kinect技术来获取上述训练样本。图2为现有kinect设备的整体结构示意图。如图2所示,从外观上看,kinect设备有三只“眼睛”,从左到右分别为:红外摄影机、彩色摄像头和红外摄像头,此外,还暗藏着四只“耳朵”,即L形布局的麦克风阵列,除了语音指令和体感操作指令外,kinect设备没有其它形式的用户输入,其输入系统的关键是由麦克风和摄像头组成的感应器系统。其中,红外摄影机用于主动投射近红外光谱,照射到粗糙物体、或是穿透毛玻璃后,光谱发生扭曲,会形成随机的反射斑点,即散斑,进而能被红外摄像头读取。红外摄像头用于分析红外光谱,创建可视范围内的人体、物体的深度图像。彩色摄像头用于拍摄视角范围内的彩色图像。
采用上述kinect设备,可获取到对应的两幅图像,分别为普通的RGB三通道彩色图像以及对应的深度图像。通常,RGB图像和深度图像是配准的,像素点之间具有一对一的对应关系。如图3所示,图3为本发明所述深度图像的示意图。
本实施例中,在获取到由用户手势的RGB图像以及对应的深度图像组成的训练样本后,可利用训练样本训练得到所需的深度网络模型。
优选地,深度网络模型为生成式对抗网络(GAN,Generative AdversarialNetworks)模型。
GAN模型是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一,主要包括两个部分:生成器(Generator)与判别器(Discriminator)。其中,生成器主要用来学习真实图像分布从而让自身生成的图像更加真实,以骗过判别器,判别器则需要对接收到的图像进行真假判别。在整个过程中,生成器努力地让生成的图像更加真实,而判别器则努力地去识别出图像的真假,这个过程相当于一个二人博弈,随着时间的推移,生成器和判别器在不断地进行对抗,最终两个网络达到了一个动态均衡:生成器生成的图像接近于真实图像分布,而判别器识别不出真假图像。
针对训练完成的GAN模型,可将获取到的用户手势的RGB图像作为输入,从而得到RGB图像对应的深度图像。
之后,可基于得到的深度图像生成用户手势的3D图像。具体地,可结合得到的深度图像以及RGB图像生成所需的3D图像。如前所述,深度图像中的每个像素值代表的是物体到相机xy平面的距离,而RGB图像与深度图像的像素点之间通常具有一对一的对应关系,因此通过两者的结合,可生成3D图像。
基于上述介绍,图4为本发明所述手势三维图像生成方法第二实施例的流程图。如图4所示,包括以下具体实现方式。
在401中,利用kinect技术获取训练样本,每个训练样本中包括:用户手势的RGB图像以及对应的深度图像。
训练样本的具体数量可根据实际需要而定。
在402中,根据获取到的训练样本训练得到GAN模型。
如何根据训练样本训练得到GAN模型为现有技术。
在403中,获取用户手势的RGB图像。
可采用各种常用的RGB图像获取方式来获取用户手势的RGB图像。
在404中,将获取到的RGB图像作为输入,根据GAN模型,得到RGB图像对应的深度图像。
基于GAN模型,可确定出RGB图像对应的深度图像。
在405中,结合获取到的深度图像以及RGB图像生成用户手势的3D图像。
在人机交互过程中,对于按照本发明所述方式获取到的3D图像,可按照与现有利用3D相机获取到的3D图像相同的方式进行后续处理。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
总之,采用本发明方法实施例所述方案,可首先获取用户手势的RGB图像,之后可确定出RGB图像对应的深度图像,进而可基于确定出的深度图像生成用户手势的3D图像,从而摆脱了对于3D相机的依赖,降低了实现成本,而且RGB图像的获取非常方便,从而可适用于各种不同的场景,具有广泛适用性等。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
图5为本发明所述手势三维图像生成装置实施例的组成结构示意图。如图5所示,包括:获取单元501、确定单元502以及生成单元503。
获取单元501,用于获取用户手势的RGB图像。
确定单元502,用于确定出RGB图像对应的深度图像。
生成单元503,用于基于深度图像生成用户手势的3D图像。
其中,确定单元502可将获取单元501获取到的RGB图像作为输入,根据预先训练得到的深度网络模型,确定出RGB图像对应的深度图像。
相应地,图5所示装置中可进一步包括:预处理单元500。
预处理单元500,用于获取训练样本,每个训练样本中包括:用户手势的RGB图像以及对应的深度图像,根据训练样本训练得到深度网络模型。
预处理单元500可利用kinect技术来获取训练样本。深度网络模型可为GAN模型。
针对训练完成的GAN模型,确定单元502可将获取到的用户手势的RGB图像作为输入,从而得到RGB图像对应的深度图像。
之后,生成单元503可基于得到的深度图像生成用户手势的3D图像。具体地,生成单元503可结合得到的深度图像以及RGB图像生成所需的3D图像。
图5所示装置实施例的具体工作流程请参照前述方法实施例中的相关说明,不再赘述。
总之,采用本发明装置实施例所述方案,可首先获取用户手势的RGB图像,之后可确定出RGB图像对应的深度图像,进而可基于确定出的深度图像生成用户手势的3D图像,从而摆脱了对于3D相机的依赖,降低了实现成本,而且RGB图像的获取非常方便,从而可适用于各种不同的场景,具有广泛适用性等。
图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图6显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器(处理单元)16,存储器28,连接不同系统组件(包括存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现图1或图4所示实施例中的方法。
本发明同时公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时将实现如图1或图4所示实施例中的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (8)

1.一种手势三维图像生成方法,其特征在于,包括:
获取用户手势的二维图像;
确定出所述二维图像对应的深度图像;
基于所述深度图像生成用户手势的三维3D图像,包括:结合所述深度图像以及所述二维图像生成所述3D图像;
所述确定出所述二维图像对应的深度图像包括:
将所述二维图像作为输入,根据预先训练得到的深度网络模型,得到所述二维图像对应的深度图像。
2.根据权利要求1所述的方法,其特征在于,
所述深度网络模型的获取方式包括:
获取训练样本,每个训练样本中包括:用户手势的二维图像以及对应的深度图像;
根据所述训练样本训练得到所述深度网络模型。
3.根据权利要求2所述的方法,其特征在于,
所述获取训练样本包括:利用kinect技术获取所述训练样本;
所述深度网络模型包括:生成式对抗网络GAN模型。
4.一种手势三维图像生成装置,其特征在于,包括:获取单元、确定单元以及生成单元;
所述获取单元,用于获取用户手势的二维图像;
所述确定单元,用于确定出所述二维图像对应的深度图像;
所述生成单元,用于基于所述深度图像生成用户手势的三维3D图像;
其中,所述生成单元结合所述深度图像以及所述二维图像生成所述3D图像;
所述确定单元将所述二维图像作为输入,根据预先训练得到的深度网络模型,确定出所述二维图像对应的深度图像。
5.根据权利要求4所述的装置,其特征在于,
所述装置中进一步包括:预处理单元;
所述预处理单元,用于获取训练样本,每个训练样本中包括:用户手势的二维图像以及对应的深度图像,根据所述训练样本训练得到所述深度网络模型。
6.根据权利要求5所述的装置,其特征在于,
所述预处理单元利用kinect技术获取所述训练样本;
所述深度网络模型包括:生成式对抗网络GAN模型。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~3中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~3中任一项所述的方法。
CN201811081908.4A 2018-09-17 2018-09-17 手势三维图像生成方法、装置、计算机设备及存储介质 Active CN109461203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811081908.4A CN109461203B (zh) 2018-09-17 2018-09-17 手势三维图像生成方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811081908.4A CN109461203B (zh) 2018-09-17 2018-09-17 手势三维图像生成方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN109461203A CN109461203A (zh) 2019-03-12
CN109461203B true CN109461203B (zh) 2020-09-29

Family

ID=65606704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811081908.4A Active CN109461203B (zh) 2018-09-17 2018-09-17 手势三维图像生成方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109461203B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368668B (zh) * 2020-02-25 2023-05-23 北京字节跳动网络技术有限公司 三维手部识别方法、装置、电子设备及存储介质
CN111782041A (zh) * 2020-06-24 2020-10-16 Oppo广东移动通信有限公司 打字方法及装置、设备、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496138A (zh) * 2011-11-15 2012-06-13 华东师范大学 一种二维图像转换为三维图像的方法
CN103941866A (zh) * 2014-04-08 2014-07-23 河海大学常州校区 一种基于Kinect深度图像的三维手势识别方法
CN104182772A (zh) * 2014-08-19 2014-12-03 大连理工大学 一种基于深度学习的手势识别方法
CN105528082A (zh) * 2016-01-08 2016-04-27 北京暴风魔镜科技有限公司 三维空间及手势识别追踪交互方法、装置和系统
CN106254854A (zh) * 2016-08-19 2016-12-21 深圳奥比中光科技有限公司 三维图像的获得方法、装置及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105107200B (zh) * 2015-08-14 2018-09-25 济南中景电子科技有限公司 基于实时深度体感交互与增强现实技术的变脸系统及方法
DE102016200225B4 (de) * 2016-01-12 2017-10-19 Siemens Healthcare Gmbh Perspektivisches Darstellen eines virtuellen Szenebestandteils
CN106682585A (zh) * 2016-12-02 2017-05-17 南京理工大学 一种基于kinect2的动态手势识别方法
CN106920263B (zh) * 2017-03-10 2019-07-16 大连理工大学 基于Kinect的无畸变集成成像三维显示方法
CN107479693A (zh) * 2017-07-07 2017-12-15 大圣科技股份有限公司 基于rgb信息的实时手部识别方法、存储介质、电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496138A (zh) * 2011-11-15 2012-06-13 华东师范大学 一种二维图像转换为三维图像的方法
CN103941866A (zh) * 2014-04-08 2014-07-23 河海大学常州校区 一种基于Kinect深度图像的三维手势识别方法
CN104182772A (zh) * 2014-08-19 2014-12-03 大连理工大学 一种基于深度学习的手势识别方法
CN105528082A (zh) * 2016-01-08 2016-04-27 北京暴风魔镜科技有限公司 三维空间及手势识别追踪交互方法、装置和系统
CN106254854A (zh) * 2016-08-19 2016-12-21 深圳奥比中光科技有限公司 三维图像的获得方法、装置及系统

Also Published As

Publication number Publication date
CN109461203A (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
CN111328396B (zh) 用于图像中的对象的姿态估计和模型检索
CN109902659B (zh) 用于处理人体图像的方法和装置
US20220319139A1 (en) Multi-endpoint mixed-reality meetings
CN109345510A (zh) 物体检测方法、装置、设备、存储介质及车辆
CN110189336B (zh) 图像生成方法、系统、服务器及存储介质
CN108895981A (zh) 一种三维测量方法、装置、服务器和存储介质
US20220237812A1 (en) Item display method, apparatus, and device, and storage medium
CN110969687B (zh) 一种碰撞检测方法、装置、设备和介质
US11373373B2 (en) Method and system for translating air writing to an augmented reality device
CN110390327A (zh) 前景提取方法、装置、计算机设备及存储介质
CN109461203B (zh) 手势三维图像生成方法、装置、计算机设备及存储介质
CN109784185A (zh) 基于微表情识别的客户餐饮评价自动获取方法及装置
CN111680670B (zh) 一种跨模态人头检测方法及装置
CN113934297A (zh) 一种基于增强现实的交互方法、装置、电子设备及介质
CN112764530A (zh) 一种基于触控手柄和增强现实眼镜的弹药识别方法
Kim et al. Generative multiview inpainting for object removal in large indoor spaces
CN109857244B (zh) 一种手势识别方法、装置、终端设备、存储介质及vr眼镜
US11348320B2 (en) Object identification utilizing paired electronic devices
CN114387315A (zh) 图像处理模型训练、图像处理方法、装置、设备及介质
CN112764531A (zh) 一种增强现实弹药识别方法
CN113269782A (zh) 数据生成方法、装置及电子设备
CN112560678A (zh) 表情识别方法、装置、设备及计算机存储介质
CN109919121B (zh) 一种人体模型的投影方法、装置、电子设备及存储介质
Bhowmik Natural and intuitive user interfaces with perceptual computing technologies
Patil et al. Virtual interactive hand gestures recognition system in real time environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant