CN110941416A - 一种增强现实中人与虚拟物的交互方法及装置 - Google Patents
一种增强现实中人与虚拟物的交互方法及装置 Download PDFInfo
- Publication number
- CN110941416A CN110941416A CN201911119942.0A CN201911119942A CN110941416A CN 110941416 A CN110941416 A CN 110941416A CN 201911119942 A CN201911119942 A CN 201911119942A CN 110941416 A CN110941416 A CN 110941416A
- Authority
- CN
- China
- Prior art keywords
- virtual
- virtual image
- instruction
- voice
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
Abstract
本发明公开了一种增强现实中人与虚拟物的交互方法及装置,该方法包括:根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;拾取用户声音,对待识别的声音信号进行预处理;将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;所述3D虚拟图像根据所述执行动作指令,完成相应动作。该方法可有效增强人与虚拟物之间的互动,能通过语音达到对虚拟物执行动作的控制,增强了AR互动的趣味性和可玩性,丰富了相关的AR应用中人与虚拟物的交互性。
Description
技术领域
本发明涉及互联网技术领域,特别涉及一种增强现实中人与虚拟物的交互方法及装置。
背景技术
增强现实(Augmented Reality,简称AR),是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术,是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。这种技术最早于1990年提出。随着随身电子产品运算能力的提升,增强现实的用途越来越广。
目前的AR技术还没有人与虚拟物交流的大范围应用,目前停留在比如点触让虚拟物进行舞蹈、唱跳、说段子的动画形式。交互方式比较单一,难以满足用户的好奇心。
因此,如何提供一种新的交互方式,使交互更容易,提高趣味性,是从业人员亟待解决的问题。
发明内容
本发明的目的在于提供一种增强现实中人与虚拟物的交互方法,可解决目前交互方式单一,缺乏趣味性的问题。
本发明实施例提供一种增强现实中人与虚拟物的交互方法,包括:
S1、根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;
S2、拾取用户声音,对待识别的声音信号进行预处理;
S3、将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;
S4、所述3D虚拟图像根据所述执行动作指令,完成相应动作。
在一个实施例中,所述步骤S1,包括:
在AR实景模式下,获取用户选择模型的指令;所述模型为预设的3D虚拟图像;
识别平面并展示网格,获取用户点击网格的指令,在所述网格处显示所述3D虚拟图像。
在一个实施例中,所述步骤S1,包括:
在虚拟环境模式下,获取用户选择模型的指令;所述模型为预设的3D虚拟图像;
显示所述3D虚拟图像。
在一个实施例中,所述步骤S1,包括:
获取对预设图片或物体的扫描信息,显示相对应的所述3D虚拟图像。
在一个实施例中,所述步骤S2,包括:
拾取用户声音,对待识别的声音信号进行预加重、分帧和加窗处理;本实施例中,可对声音信号进行预加重、分帧和加窗处理后再与对话及动作数据库中的数据进行匹配,可以去除声音信号中的噪声,避免干扰,提高匹配的准确率。
第二方面,本发明实施例还提供一种增强现实中人与虚拟物的交互装置,包括:
显示模块,用于根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;
预处理模块,用于拾取用户声音,对待识别的声音信号进行预处理;
查找模块,用于将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;
执行模块,用于所述3D虚拟图像根据所述执行动作指令,完成相应动作。
本发明实施例提供的一种增强现实中人与虚拟物的交互方法,根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;拾取用户声音,对待识别的声音信号进行预处理;将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;所述3D虚拟图像根据所述执行动作指令,完成相应动作。该方法可有效增强人与虚拟物之间的互动,能通过语音达到对虚拟物执行动作的控制,增强了AR互动的趣味性和可玩性,丰富了相关的AR应用中人与虚拟物的交互性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的增强现实中人与虚拟物的交互方法的流程图。
图2为本发明实施例提供的增强现实中人与虚拟物的交互装置的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1所示,为本发明实施例增强现实中人与虚拟物的交互方法,包括:
S1、根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;
S2、拾取用户声音,对待识别的声音信号进行预处理;
S3、将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;
S4、所述3D虚拟图像根据所述执行动作指令,完成相应动作。
其中,步骤S1中,3D虚拟图像,比如是通过美术人员用3Dmax等美术工具建模制作动画,利用unity开发工具,并配以相应动作的虚拟物。
触发AR场景的指令,显示预设的3D虚拟图像;一般可通过下述三种触发方式:
第一种:比如在AR实景模式下,获取到用户选择模型的指令;其中模型是指预设的3D虚拟图像;在AR实景模式下,点击模型,会先提示识别平面,识别平面后会出现白色网格,点击网格,AR物体就会出现在网格处。
第二种:在剧场模式下,没有实景,在一个虚拟环境中操控,点击模型,虚拟物就会出现;比如选择KTV模式,点击选择一个人物模型,则该人物即可显示在KTV的场景中。
第三种:比如打开手机摄像头扫描或对准预设的图片或物体,比如可以是内置了AR信息的图片,或是将该物体加入到AR玩偶数据库中,当识别到AR信息或是物体的轮廓特征时,可对应的显示3D虚拟图像。
步骤S2中,当出现3D虚拟图像后,可通过语音与其交流;该步骤获取用户的声音,然后对该声音信号进行预处理。在对语音信号进行分析和处理之前,必须对其进行预加重、分帧、加窗等预处理操作。这些操作的目的是消除因为人类发声器官本身和由于采集语音信号的设备所带来的混叠、高次谐波失真、高频等等因素,对语音信号质量的影响。尽可能保证后续语音处理得到的信号更均匀、平滑,为信号参数提取提供优质的参数,提高语音处理质量。
步骤S3中,将经预处理后的声音信息,可转换为文本信息;在预设的对话及动作数据库中进行遍历,查找与该文本信息对应的动作指令。当匹配到相应的指令后,步骤S4可根据返回的指令,执行相应的动作或对话。
该3D虚拟图像可执行相应的动作或对话;比如:根据语音指令,开始舞蹈、讲段子、笑话、故事等、或还可以执行其他跑步、跳跃、后退、下蹲等动作。
下面对本发明一种增强现实中人与虚拟物的交互方法以AR-App为例进行说明。
1、根据本发明实施例提供的方法实现的AR-App,可以实现利用手机话筒获取用户语音,实现3D虚拟图像回答对话或执行动作。比如开启APP后,可以选择用户喜欢的3D角色,比如某一明星、贴纸、卡通人物进行下载;开启手机的摄像头,识别镜头所显示的平面,根据用户的点击位置放置该3D虚拟图像;进一步的,获取用户的声音,比如用户说:“请唱首歌吧”,通过手机话筒识别该声音,并经过处理分析后,将唱歌这一功能赋予给该3D虚拟角色。再比如用户说:“给我跳一段舞蹈”,该3D虚拟图像可执行跳舞的动作。
2、用户根据屏幕所显示的场景,比如:电影院、KTV、舞台、讲台、足球场或篮球场等等;选择加载其中一个场景,然后再选择一个3D虚拟角色。将该3D虚拟角色加载在上述选择的场景中,用户根据语音指挥该3D虚拟角色动作。以篮球场场景为例,3D虚拟角色为卡通人物;用户发出“投3分球”的语音指令,该3D虚拟角色便执行“膝盖略微弯曲,身体下蹲,凝视前方,双腿猛然发力,高高弹起,手臂将球向上推去,手腕轻轻一抖将球向篮筐送去”的动作。
3、用户扫描某一特定物体,比如:猫咪玩偶、可乐瓶子;可以显示该物体的3D虚拟图像,并可根据用户的语音指令,执行相应的动作。
用户还可以扫描某一特定图像,比如在当用户身处医院时,可扫描医院张贴的一张导航图,可显示该医院的3D虚拟图像,用户询问“内科20诊室在哪里”,可在该3D虚拟图像中显示导航路线,并发出语音对话“请直行50米,上扶梯,到达2楼,左转10米即可到达内科20诊室”。
利用手机话筒获取用户语音,将语音预加重、分帧、加窗等预处理操作,然后调用回答或动作。除了为人们带去娱乐的用途外,语音交互的方式还能为用户提供客服功能,为用户指导操作,告知等,可广泛应用于商超,办公区、医院、酒店等办理业务的场所。比如可根据具体应用环境不同,将3D虚拟图像设计成智能客服,实现表演节目、解答问题、查询天气、新闻、查询高铁、航班等功能。
本发明实施例提供的增强现实中人与虚拟物的交互方法,可有效增强人与虚拟物之间的互动,能通过语音达到对虚拟物执行动作的控制,增强了AR互动的趣味性和可玩性,丰富了相关的AR应用中人与虚拟物的交互性。
基于同一发明构思,本发明实施例还提供了一种增强现实中人与虚拟物的交互装置,由于该装置所解决问题的原理与前述方法相似,因此该装置的实施可以参见前述方法的实施,重复之处不再赘述。
第二方面,本发明实施例还提供一种增强现实中人与虚拟物的交互装置,参照图2所示,包括:
显示模块21,用于根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;
预处理模块22,用于拾取用户声音,对待识别的声音信号进行预处理;
查找模块23,用于将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;
执行模块24,用于所述3D虚拟图像根据所述执行动作指令,完成相应动作。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种增强现实中人与虚拟物的交互方法,其特征在于,包括:
S1、根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;
S2、拾取用户声音,对待识别的声音信号进行预处理;
S3、将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;
S4、所述3D虚拟图像根据所述执行动作指令,完成相应动作。
2.如权利要求1所述的一种增强现实中人与虚拟物的交互方法,其特征在于,所述步骤S1,包括:
在AR实景模式下,获取用户选择模型的指令;所述模型为预设的3D虚拟图像;
识别平面并展示网格,获取用户点击网格的指令,在所述网格处显示所述3D虚拟图像。
3.如权利要求1所述的一种增强现实中人与虚拟物的交互方法,其特征在于,所述步骤S1,包括:
在虚拟环境模式下,获取用户选择模型的指令;所述模型为预设的3D虚拟图像;
显示所述3D虚拟图像。
4.如权利要求1所述的一种增强现实中人与虚拟物的交互方法,其特征在于,所述步骤S1,包括:
获取对预设图片或物体的扫描信息,显示相对应的所述3D虚拟图像。
5.如权利要求1所述的一种增强现实中人与虚拟物的交互方法,其特征在于,所述步骤S2,包括:
拾取用户声音,对待识别的声音信号进行预加重、分帧和加窗处理。
6.一种增强现实中人与虚拟物的交互装置,其特征在于,包括:
显示模块,用于根据获取到的触发AR场景的指令,显示预设的3D虚拟图像;
预处理模块,用于拾取用户声音,对待识别的声音信号进行预处理;
查找模块,用于将经预处理后的声音信息,与预设的对话及动作数据库进行匹配,查找对应的执行动作指令;
执行模块,用于所述3D虚拟图像根据所述执行动作指令,完成相应动作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911119942.0A CN110941416A (zh) | 2019-11-15 | 2019-11-15 | 一种增强现实中人与虚拟物的交互方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911119942.0A CN110941416A (zh) | 2019-11-15 | 2019-11-15 | 一种增强现实中人与虚拟物的交互方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110941416A true CN110941416A (zh) | 2020-03-31 |
Family
ID=69906619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911119942.0A Pending CN110941416A (zh) | 2019-11-15 | 2019-11-15 | 一种增强现实中人与虚拟物的交互方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110941416A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111522930A (zh) * | 2020-04-22 | 2020-08-11 | 深圳创维-Rgb电子有限公司 | 一种场景减压数据处理方法、显示设备及存储介质 |
CN111640183A (zh) * | 2020-06-04 | 2020-09-08 | 上海商汤智能科技有限公司 | 一种ar数据展示控制方法及装置 |
CN113990128A (zh) * | 2021-10-29 | 2022-01-28 | 重庆电子工程职业学院 | 基于ar的智能显示系统 |
WO2022036484A1 (zh) * | 2020-08-17 | 2022-02-24 | 南京智导智能科技有限公司 | 一种基于数字孪生的医院科室ar引导系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160205378A1 (en) * | 2015-01-08 | 2016-07-14 | Amir Nevet | Multimode depth imaging |
CN107016733A (zh) * | 2017-03-08 | 2017-08-04 | 北京光年无限科技有限公司 | 基于增强现实ar的交互系统及交互方法 |
CN107274891A (zh) * | 2017-05-23 | 2017-10-20 | 武汉秀宝软件有限公司 | 一种基于语音识别引擎的ar界面交互方法及系统 |
CN107390875A (zh) * | 2017-07-28 | 2017-11-24 | 腾讯科技(上海)有限公司 | 信息处理方法、装置、终端设备和计算机可读存储介质 |
US20190332400A1 (en) * | 2018-04-30 | 2019-10-31 | Hootsy, Inc. | System and method for cross-platform sharing of virtual assistants |
CN110412765A (zh) * | 2019-07-11 | 2019-11-05 | Oppo广东移动通信有限公司 | 增强现实图像拍摄方法、装置、存储介质及增强现实设备 |
-
2019
- 2019-11-15 CN CN201911119942.0A patent/CN110941416A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160205378A1 (en) * | 2015-01-08 | 2016-07-14 | Amir Nevet | Multimode depth imaging |
CN107016733A (zh) * | 2017-03-08 | 2017-08-04 | 北京光年无限科技有限公司 | 基于增强现实ar的交互系统及交互方法 |
CN107274891A (zh) * | 2017-05-23 | 2017-10-20 | 武汉秀宝软件有限公司 | 一种基于语音识别引擎的ar界面交互方法及系统 |
CN107390875A (zh) * | 2017-07-28 | 2017-11-24 | 腾讯科技(上海)有限公司 | 信息处理方法、装置、终端设备和计算机可读存储介质 |
US20190332400A1 (en) * | 2018-04-30 | 2019-10-31 | Hootsy, Inc. | System and method for cross-platform sharing of virtual assistants |
CN110412765A (zh) * | 2019-07-11 | 2019-11-05 | Oppo广东移动通信有限公司 | 增强现实图像拍摄方法、装置、存储介质及增强现实设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111522930A (zh) * | 2020-04-22 | 2020-08-11 | 深圳创维-Rgb电子有限公司 | 一种场景减压数据处理方法、显示设备及存储介质 |
CN111640183A (zh) * | 2020-06-04 | 2020-09-08 | 上海商汤智能科技有限公司 | 一种ar数据展示控制方法及装置 |
WO2022036484A1 (zh) * | 2020-08-17 | 2022-02-24 | 南京智导智能科技有限公司 | 一种基于数字孪生的医院科室ar引导系统 |
CN113990128A (zh) * | 2021-10-29 | 2022-01-28 | 重庆电子工程职业学院 | 基于ar的智能显示系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110941416A (zh) | 一种增强现实中人与虚拟物的交互方法及装置 | |
CN109462776B (zh) | 一种视频特效添加方法、装置、终端设备及存储介质 | |
CN112131988B (zh) | 确定虚拟人物唇形的方法、装置、设备和计算机存储介质 | |
US11158102B2 (en) | Method and apparatus for processing information | |
US11017779B2 (en) | System and method for speech understanding via integrated audio and visual based speech recognition | |
CN112074899A (zh) | 基于多模态传感输入的人机对话的智能发起的系统和方法 | |
CN109525891B (zh) | 多用户视频特效添加方法、装置、终端设备及存储介质 | |
US20190371318A1 (en) | System and method for adaptive detection of spoken language via multiple speech models | |
CN112669417B (zh) | 虚拟形象的生成方法、装置、存储介质及电子设备 | |
US11017551B2 (en) | System and method for identifying a point of interest based on intersecting visual trajectories | |
US11308312B2 (en) | System and method for reconstructing unoccupied 3D space | |
US20220101856A1 (en) | System and method for disambiguating a source of sound based on detected lip movement | |
CN109600559B (zh) | 一种视频特效添加方法、装置、终端设备及存储介质 | |
US20190251716A1 (en) | System and method for visual scene construction based on user communication | |
CN113923462A (zh) | 视频生成、直播处理方法、设备和可读介质 | |
WO2008087621A1 (en) | An apparatus and method for animating emotionally driven virtual objects | |
US20190251350A1 (en) | System and method for inferring scenes based on visual context-free grammar model | |
CN112560605A (zh) | 交互方法、装置、终端、服务器和存储介质 | |
US20190253724A1 (en) | System and method for visual rendering based on sparse samples with predicted motion | |
JP2023552854A (ja) | ヒューマンコンピュータインタラクション方法、装置、システム、電子機器、コンピュータ可読媒体及びプログラム | |
CN114287030A (zh) | 用于跨真实和增强现实的自适应对话管理的系统和方法 | |
CN111429907A (zh) | 语音服务模式切换方法、装置、设备及存储介质 | |
KR20180105861A (ko) | 외국어 학습 어플리케이션 및 이에 포함된 콘텐츠를 이용한 외국어 학습 시스템 | |
KR20220129989A (ko) | 아바타에 기초한 인터랙션 서비스 방법 및 장치 | |
CN111260509A (zh) | 一种智能点餐服务系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |