CN106774942A - 一种实时3d远程人机交互系统 - Google Patents

一种实时3d远程人机交互系统 Download PDF

Info

Publication number
CN106774942A
CN106774942A CN201710034162.0A CN201710034162A CN106774942A CN 106774942 A CN106774942 A CN 106774942A CN 201710034162 A CN201710034162 A CN 201710034162A CN 106774942 A CN106774942 A CN 106774942A
Authority
CN
China
Prior art keywords
service operations
customer interaction
processing module
module
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710034162.0A
Other languages
English (en)
Inventor
杨辰光
王尊冉
贺波涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Morning Intelligent Technology Co Ltd
South China University of Technology SCUT
Original Assignee
Suzhou Morning Intelligent Technology Co Ltd
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Morning Intelligent Technology Co Ltd, South China University of Technology SCUT filed Critical Suzhou Morning Intelligent Technology Co Ltd
Priority to CN201710034162.0A priority Critical patent/CN106774942A/zh
Publication of CN106774942A publication Critical patent/CN106774942A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality

Abstract

本发明公开了一种实时3D远程人机交互系统,该系统至少包括服务操作端和客户交互端,服务操作端至少包括一台电脑、深度摄像机、图像处理模块、数据发送\接收模块、服务操作端命令处理模块、3D图像显示模块;客户交互端至少包括一台电脑、leap motion、3D图像显示模块、命令处理模块、图像处理模块、数据发送\接收模块、手的信息处理模块。本发明利用廉价的深度摄像头采集操作者信息,并利用局域网将操作信息传送到客户端,实现实时传输。在交互方面,利用Leap Motion采集人手信息,去控制模拟鼠标,实现人与3D投影交互,操作方便,简单。

Description

一种实时3D远程人机交互系统
技术领域
本发明涉及到人机交互和实时远程3D视频通信领域,尤其是涉及到一种实时3D远程人机交互系统的技术背景。
背景技术
如今,双目摄像头快速发展,如ZED、KINECT等双目摄像头,使获取深度图像信息越来越便利,并且成本低、精度高。特别是KINECT双目摄像头,用户可以很方便去获取和使用3D点云数据。将KINCKET运用到一种实时3D远程人机交互系统中,可以做到在一个较高的精度下节约制造成本。
PCL(Point Cloud Library)的出现,人们处理3D图片操作变得更加简单,结果更加稳定。一种实时3D远程AR交互系统使用PCL去处理采集到的3D点云数据,具有很大的优势。
AR技术的兴起,各种识别人身体部位的3D信息的设备得到快速发展,LEAP MOTION能够快速、稳定、准确采集到人的手部3D信息,这个为一种实时3D远程人机交互系统提供了交互技术硬件支持。
学术界已经有一些应用于远程人机交互系统和3D视频实时传输的相关专利,主要有:
1.中国公开专利:CN 103793060 A 一种用户交互系统和方法:交互界面的虚拟物体跟随提取人手的3D位置信息移动,该发明实现了3D交互系统,但是该发明只是单方向交互,并且用户必须佩戴头戴式3D显示器等,使用者操作繁琐。
2.中国公开专利:CN 105389006 A 一种基于Kinect的裸眼3D交互改进方法:利用Kinect 采集到人手关节信息进行交互,但是在交互之前必须调整Kinect 到合适的位置和角度,由于安装复杂,限制了其使用范围。
3.中国公开专利:CN 103269423 A 可拓展式三维显示远程视频通信方法:利用RGB-D相机采集到人物图像,经过处理并发送到第二个用户,第二个用户接收并显示任务图像信息和播放声音,该发明只是实现了信息提取和传输,并没有双向交互过程。
发明内容
本发明是实现一种实时3D远程交互系统,目的是在裸眼3D效果下,实现人与3D投影交互,其中3D投影是远程的操作的替身。本发明可概述为两大部分,分别是服务操作端、客户交互端,其中客户交互端为移动机器人。服务操作端至少包括一台电脑、深度摄像机、服务操作端图像处理模块、服务操作端数据发送\接收模块、服务操作端命令处理模块、服务操作端3D图像显示模块;客户交互端至少包括一台电脑、leap motion、客户交互端3D图像显示模块、客户交互端命令处理模块、客户交互端图像处理模块、客户交互端数据发送\接收模块、手的信息处理模块。
服务操作端和客户交互端实现实时在线通讯,服务操作端将3D图像和操作命令发送给客户交互端,客户交互端把交互结果发送给服务操作端。
服务操作端数据发送\接收模块和客户交互端数据发送\接收模块,用来发送和接收网络数据,且必须可以处理大数据。
服务操作端可显示交互结果的3D效果,客户交互端可显示操作者信息和命令(或者指导信息)的3D效果。
服务操作端图像处理模块和服务操作端命令处理模块,分别用来对点云数据进行处理(如滤波、分割、重建)、处理操作者命令和客户交互端发送过来的命令;客户交互端图像处理模块、渲染模块和客户交互端命令处理模块,分别用来对点云数据进行存储(如滤波、分割、重建)、渲染3D图像、处理服务操作端发送过来的操作者命令和客户交互的结果。
客户交互端手的信息处理模块,可以对leap motion获得数据进行处理,从而达到对模拟鼠标的控制。
服务操作端可以对客户交互端的移动机器人进行控制,可以在客户交互端显示操作者的命令;客户在客户交互端可以和3D投影进行交互,交互结果可以更新在投影上和发送到服务操作端。
本发明具体操作过程如下:
服务操作端:实现操作者上本身的3D点云数据采集、3D点云数据处理、命令处理、数据发送\接收功能。实施步骤如下:
1.深度相机采集操作者上身的3D点云数据,3D点云数据通过串口传输到近端电脑上;
2.服务操作端电脑接收到3D点云数据,将3D点云数据进行滤波、分割、重建等处理工作;
3.将处理好的3D点云数据和操作者对远端的操作命令一起打包数据包;
4.把打包好的数据包发送远端和接收客户交互端发送过来的命令;
5.解析远端发送反馈过来的命令,显示给操作者;
6.循环1-5步骤。
客户交互端:实现3D点云数据和近端发送的命令的接收、渲染3D点云数据、利用leap motion进行交互、发送交互结果到服务操作端的功能。实施步骤如下;
1.客户交互端接收到服务操作端发送过来的数据包,将数据包拆包,并存在相应的缓存中,比如点云数据缓存区、命令寄存器等。
2.将命令寄存器的命令解析成相应的文字,将点云数据缓存区的点云数据和渲染3D图片,以及将命令的文字赋给Text标签的值并渲染Text标签。
3.利用投影仪将渲染出来的效果投影到贴有幕布的玻璃上。
4.使用中断方式实现leap motion交互,其中,leap motion提取客户的手掌的位置信息、手掌法线、各个手指的向量等信息,然后把手掌的位置信息赋给模拟鼠标的位置,让模拟鼠标跟随手掌运动;利用手掌法线和手指向量信息识别两种手势,作为模拟鼠标的左右点击。当模拟鼠标移动到Text处,点击Text会触发中断,不同的Text会得到不同的命令。
5.将得到的命令打包,发送给服务操作端,并显示给操作者。
6.重复1-5步骤,其中步骤1和2是并行进行的,处于不同的线程,步骤4中,leapmotion处理客户手的信息也是处于不同的线程。
本发明的优点:
本发明结合不同领域的知识,利用廉价的深度摄像头采集操作者信息,并利用局域网将操作信息传送到客户端,实现实时传输。在交互方面,利用Leap Motion 采集人手信息,去控制模拟鼠标,实现人与3D投影交互,操作方便,简单。
附图说明
图1为本发明整体结构流程图
图2为本发明服务操作端图像处理模块
图3为本发明客户交互端图像处理模块
图4为本发明客户交互端手的信息处理模块
图5为本发明交互信息控制流程图
其中0为操作者、1为深度摄像机、2为服务操作端图像处理模块、3为服务操作端3D图像显示模块、4为服务操作端命令处理模块、5为服务操作端数据发送\接收模块、6为客户交互端数据发送\接收模块、7为客户交互端命令处理模块、8为客户交互端图像处理模块、9为渲染模块、10为投影仪、11为客户交互端3D图像显示模块、12为手的信息处理模块、13为客户的操作手、14为leap motion。
具体实施方式
下面结合附图1到附图5以及实施例对本发明作进一步详细的描述。
如图1所示,本发明整体流程大致包括14个模块,其中由两大部分组成,分别是服务操作端和客户交互端,服务操作端利用深度摄像头采集操作者的上半身的信息,经过图像处理后,然后组合操作者的命令成数据包,一起发送到客户交互端。客户交互端接收到网络传过来的数据,然后将数据包分包,存入不同的缓冲区,然后显示相关信息,其中这个需要一台投影仪和贴着玻璃幕布的玻璃板,最终可以在客户面前显示相关的3D信息。在客户交互端,客户可以通过leap motion和3D投影图像交互,交互的结果同样会显示在客户交互端的玻璃板上,该结果同时通过局域网传到服务操作端。
在服务操作端至少包括操作者0、深度摄像机1、服务操作端图像处理模块2、服务操作端3D图像显示模块3、服务操作端命令处理模块4、服务操作端数据发送\接收模块5。其中,深度摄像机1在本次实施中使用Kinect摄像机,目的是采集操作者0上本身的3D点云信息;服务操作端图像处理模块2是处理3D点云信息,具体是对3D点云信息进行滤波、分割、重建;服务操作端3D图像显示模块3是显示采集处理后的信息和交互结果信息;服务操作端命令处理模块4是对操作者的命令处理和交互结果的解析,为显示\发送做好准备;服务操作端数据发送\接收模块5是发送3D点云信息和操作者的命令、接收客户交互端交互的结果。
在客户交互端包括客户交互端数据发送\接收模块6、客户交互端命令处理模块7、客户交互端图像处理模块8、渲染模块9、投影仪10、客户交互端3D图像显示模块11、手的信息处理模块12、客户的操作手13、leap motion 14。其中,客户交互端为移动机器人,移动机器人包括以上模块。客户交互端数据发送\接收模块6是接收服务操作端发送过来的点云信息和命令、发送客户交互端交互的结果;客户交互端命令处理模块7是对操作者的命令解析和交互结果的处理,为显示\发送命令做好准备;客户交互端图像处理模块8是处理点云信息和命令,具体是把点云数据和命令存在不同的缓存区,并把点云数据赋给PCL对象,为渲染做好准备;渲染模块9是把点云信息和命令在客户交互端的电脑GRU上渲染;投影仪10是把渲染好信息投影到贴有幕布的玻璃板上;手的信息处理模块12是处理leap motion 14采集到手一些信息,如手掌法线、手指向量、手掌位置等,在利用这一些信息之前也要进行滤波处理。利用手掌的位置信息赋给模拟鼠标的位置,这样模拟鼠标就可以跟随手掌移动,当模拟鼠标移动到Text标签时候(Text标签可以是一些指导信息或者一些交互命令,客户可以查看各种指导信息和触发各种命令),可以点击Text标签,这些结果会更新到幕布玻璃板上,同时也反馈到服务操作端,服务操作端接收到命令后,做出相应的反应,然后传送到客户交互端更新3D显示内容,从而完成一次交互动作。
下面具体解释每个步骤:
在服务操作端,利用深度摄像机1提取操作者0的上半身的3D点云数据,本实施是使用是Kinect摄像机, kinect 摄像机安装在操作者前方,调整好角度,便可以固定。本实施没有使用微软官方的驱动,使用了第三方的SensorKinect 作为本实例的驱动,然后利用第三方 OpenNI库进行获取点云数据,其中利用其Grabber对象进行获取点数据。
如图2,当服务操作端电脑获取到点云数据后,利用第三方PCL库进行处理,首先是进行滤波,具体方法是使用统计滤波器( StatisticalOutlierRemoval )去除奇异点,接着使用双边滤波器平滑3D图像。接下来是分割图像,得到人的上半身的3D图像,分割是基于随机采样一致性(RANSAC)分割算法,得到操作上身的模型。但是,如果不对3D点云数据进行重建,那么会导致人的脸部缺失,重建是使用基于快速Delaunay三角化曲面重建算法,到此得到了最终处理后的点云数据。
处理好点云数据后,操作者发出的命令经过服务操作端命令处理模块4转换成发送命令的格式,结合点云数据打包成数据包,服务操作端发送\接收模块5是使用Boost中asio 模块传输,发送先是把数据放入buffer流中,先发送数据大小然后发送整个数据包;在客户交互端,接收到网络数据包之后,首先从数据包中提取数据大小,然后分别接收3D点云数据和命令数据,接收后放在对应的缓存区。当客户交互端得到交互结果,同样先经过客户交互端命令处理模块7再打包数据,先发送数据大小,再发送数据;当服务操作端接收到网络数据,首先从数据包中提取数据大小,然后接收交互结果数据,接着把交互信息显示给操作者。
如图3,客户交互端得到服务操作端的数据后,把命令缓存区的数据转换成string类型,接着,利用PCL中 CloudViewer 对象,把命令数据赋给Text标签的值,最后对接收好的3D点云数据和Text标签进行渲染。同时,投影议会将渲染好的3D效果投影到贴有幕布的人形玻璃板上。
在客户交互端,客户裸眼可以看到3D效果图,其中由操作者的上半身图像和一些命令信息,这些命令信息可以是指导信息也可以是操作者对客户的要求等等。客户可以使用leap motion 14进行交互,交互信息可以传回给服务操作端。首先介绍本发明如何去提取客户的手信息来控制模拟鼠标(即手的信息处理模块12),接下来介绍整个交互过程。
如图4所示,当客户的手放在leap motion 14的识别区域,leap motion 14会自动读取手的信息,如手掌的位置、手掌的法线和各个手指的向量等。这些数据经过滤波后就可得到较高的精度信息,把手掌位置赋给模拟鼠标的位置,即可让模拟鼠标跟随手掌一起运动。利用手掌的法线和各个手指的向量即可识别手势,本实例中识别两种手势,分别是握拳和只有拇指张开,分别代表是鼠标的左右点击。
图5为这个系统交互的流程图,在客户交互端,leap motion 14获得客户的手信息,传送给手的信息处理模块12,当有点击命令发生时,会触发程序中断,中断程序会检测点击位置,然后根据位置确定点击是哪个Text标签,然后根据标签确定哪个命令,然后将命令传送回服务操作端。如果是指导信息,在客户交互端会更新投影图像,显示相关的指导信息。当命令通过局域网传输到服务操作端,服务操作端接收到命令,把命令解析并显示给操作者,操作者会根据交互的结果做出相应的命令,该命令同样会通过局域网传送到客户交互端,然后通过客户交互端图像处理模块6和渲染模块7,将操作者发送的命令显示给客户,如果命令是控制移动机器人运动,则该命令会传给移动机器人控制面板。
上述实施例为本发明的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种实时3D远程人机交互系统,其特征在于:所述的实时3D远程人机交互系统至少包括服务操作端和客户交互端,服务操作端至少包括一台电脑、深度摄像机、服务操作端图像处理模块、服务操作端数据发送\接收模块、服务操作端命令处理模块、服务操作端3D图像显示模块;客户交互端至少包括一台电脑、leap motion、客户交互端3D图像显示模块、客户交互端命令处理模块、客户交互端图像处理模块、客户交互端数据发送\接收模块、手的信息处理模块,其中客户交互端为移动机器人。
2.根据权利1要求的一种实时3D远程人机交互系统,其特征在于:服务操作端和客户交互端实现实时在线通讯,服务操作端将3D图像和操作命令发送给客户交互端,客户交互端把交互结果发送给服务操作端。
3.根据权利2要求的一种实时3D远程人机交互系统,其特征在于:服务操作端数据发送\接收模块和客户交互端数据发送\接收模块,用来发送和接收网络数据,且必须可以处理大数据。
4.根据权利1要求的一种实时3D远程人机交互系统,其特征在于:服务操作端可显示交互结果的3D效果,客户交互端可显示操作者信息和命令(或者指导信息)的3D效果。
5.根据权利4要求的一种实时3D远程人机交互系统,其特征在于:服务操作端图像处理模块和服务操作端命令处理模块,分别用来对点云数据进行处理(如滤波、分割、重建)、处理操作者命令和客户交互端发送过来的命令;客户交互端图像处理模块、渲染模块和客户交互端命令处理模块,分别用来对点云数据进行存储(如滤波、分割、重建)、渲染3D图像、处理服务操作端发送过来的操作者命令和客户交互的结果。
6.根据权利4和权利5要求的一种实时3D远程人机交互系统,其特征在于:手的信息处理模块,可以对leap motion获得数据进行处理,从而达到对模拟鼠标的控制。
7.根据权利1要求的一种实时3D远程人机交互系统,其特征在于:服务操作端可以对客户交互端的移动机器人进行控制,可以在客户交互端显示操作者的命令;客户在客户交互端可以和3D投影进行交互,交互结果可以更新在投影上和发送到服务操作端。
CN201710034162.0A 2017-01-18 2017-01-18 一种实时3d远程人机交互系统 Pending CN106774942A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710034162.0A CN106774942A (zh) 2017-01-18 2017-01-18 一种实时3d远程人机交互系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710034162.0A CN106774942A (zh) 2017-01-18 2017-01-18 一种实时3d远程人机交互系统

Publications (1)

Publication Number Publication Date
CN106774942A true CN106774942A (zh) 2017-05-31

Family

ID=58947226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710034162.0A Pending CN106774942A (zh) 2017-01-18 2017-01-18 一种实时3d远程人机交互系统

Country Status (1)

Country Link
CN (1) CN106774942A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108044625A (zh) * 2017-12-18 2018-05-18 中南大学 一种基于多Leapmotion虚拟手势融合的机器人机械臂操控方法
CN108320051A (zh) * 2018-01-17 2018-07-24 哈尔滨工程大学 一种基于gru网络模型的移动机器人动态避碰规划方法
CN110349094A (zh) * 2019-06-12 2019-10-18 西安工程大学 基于统计离群和自适应双边混合滤波的3d点云去噪方法
CN112363667A (zh) * 2020-11-12 2021-02-12 四川长虹电器股份有限公司 一种触摸遥控方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034322A (zh) * 2011-09-30 2013-04-10 德信互动科技(北京)有限公司 人机互动系统和方法
CN103529943A (zh) * 2013-10-17 2014-01-22 合肥金诺数码科技股份有限公司 一种基于流体物理模拟系统的人体投影交互方法
US20160100034A1 (en) * 2011-10-28 2016-04-07 Magic Leap, Inc. System and method for augmented and virtual reality
CN105643590A (zh) * 2016-03-31 2016-06-08 河北工业大学 一种手势控制的轮式移动机器人及其操作方法
CN205788098U (zh) * 2016-05-27 2016-12-07 江苏奇胜信息科技有限公司 基于双目机器视觉的非接触投影交互系统
CN206532245U (zh) * 2017-01-18 2017-09-29 华南理工大学 一种实时3d远程人机交互系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034322A (zh) * 2011-09-30 2013-04-10 德信互动科技(北京)有限公司 人机互动系统和方法
US20160100034A1 (en) * 2011-10-28 2016-04-07 Magic Leap, Inc. System and method for augmented and virtual reality
CN103529943A (zh) * 2013-10-17 2014-01-22 合肥金诺数码科技股份有限公司 一种基于流体物理模拟系统的人体投影交互方法
CN105643590A (zh) * 2016-03-31 2016-06-08 河北工业大学 一种手势控制的轮式移动机器人及其操作方法
CN205788098U (zh) * 2016-05-27 2016-12-07 江苏奇胜信息科技有限公司 基于双目机器视觉的非接触投影交互系统
CN206532245U (zh) * 2017-01-18 2017-09-29 华南理工大学 一种实时3d远程人机交互系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108044625A (zh) * 2017-12-18 2018-05-18 中南大学 一种基于多Leapmotion虚拟手势融合的机器人机械臂操控方法
CN108320051A (zh) * 2018-01-17 2018-07-24 哈尔滨工程大学 一种基于gru网络模型的移动机器人动态避碰规划方法
CN110349094A (zh) * 2019-06-12 2019-10-18 西安工程大学 基于统计离群和自适应双边混合滤波的3d点云去噪方法
CN112363667A (zh) * 2020-11-12 2021-02-12 四川长虹电器股份有限公司 一种触摸遥控方法及系统

Similar Documents

Publication Publication Date Title
KR101705924B1 (ko) 공간 운영 시스템을 위한 공간, 다중-모드 제어 장치
CN106774942A (zh) 一种实时3d远程人机交互系统
US20180136734A1 (en) Spatial, multi-modal control device for use with spatial operating system
US8669939B2 (en) Spatial, multi-modal control device for use with spatial operating system
CN108509026B (zh) 基于增强交互方式的远程维修支持系统及方法
US20130010071A1 (en) Methods and systems for mapping pointing device on depth map
CN106200944A (zh) 一种对象的控制方法、控制装置和控制系统
CN105357312B (zh) 远程控制游艺方法及装置
CN102789313A (zh) 一种用户交互系统和方法
CN205581784U (zh) 一种基于现实场景的可交互混合现实平台
WO2018071119A1 (en) Complexity reduction of human interacted object recognition
CN102789312A (zh) 一种用户交互系统和方法
CN107122045A (zh) 一种基于混合现实技术的虚拟人机示教系统及方法
Nishino et al. 3d object modeling using spatial and pictographic gestures
CN206209206U (zh) 带固定采样点的3d眼镜及便携式多人交互的虚拟现实系统
Wolff et al. A modular architecture for an interactive real-time simulation and training environment for satellite on-orbit servicing
CN106708255A (zh) 虚拟界面交互控制方法及系统
CN206532245U (zh) 一种实时3d远程人机交互系统
O'Hagan et al. Visual gesture interfaces for virtual environments
CN103309466A (zh) 指向性影像操控装置及其方法
Tan et al. Virtual reality based immersive telepresence system for remote conversation and collaboration
CN108459716B (zh) 一种在vr中实现多人协作完成任务的方法
CN109643182A (zh) 信息处理方法、装置、云处理设备及计算机程序产品
CN115131528A (zh) 虚拟现实场景确定方法、装置及系统
CN103747192B (zh) 一种信息处理方法和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170531