CN113552949A

CN113552949A - 多功能的沉浸式影音交互方法、装置和系统

Info

Publication number: CN113552949A
Application number: CN202110875672.7A
Authority: CN
Inventors: 汪思倩; 贾子苗; 杨柳; 孙翔翔; 刘满辉; 雷雪龙; 胡朝辉; 刘兵兵
Original assignee: Beijing Kaihua Meiya Technology Co ltd
Current assignee: Beijing Kaihua Meiya Technology Co ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-10-26

Abstract

本发明公开了一种多功能的沉浸式影音交互方法、装置和系统，影音交互技术领域，其包括建立基于面部信息和手势信息的初始数据识别库；获取当前环境的信息数据，生成初始接收信息；其中，初始接收信息包括面部和手势信息；结合初始数据识别库识别处理初始接收信息，并建立手势发起人、面部信息和手势信息之间的一一对应关系；以及，当手势为某一预设的交互触发手势，则输出移动交互、音频交互和图像交互指令至交互模组。本申请具有提高影音系统的交互性能，改善用户的沉浸体验的效果。

Description

多功能的沉浸式影音交互方法、装置和系统

技术领域

本申请涉及影音交互技术领域，尤其是涉及一种多功能的沉浸式影音交互方法、装置和系统。

背景技术

现有影音系统，一般采用人力为主、机器为辅的模式，其由人的主观感受支配机器的影音系统；另外，还有一部分影音系统，其具备简单交互功能，但依赖于人工采集、识别和控制信息，导致使用操作繁琐、工作效率低，造成部分影音运行系统的资源浪费。

现有影音系统是采用半自动化，机器对人工配合要求高，中大型复杂环境适应能力偏弱，易发生无法同步等现象，且这种半自动式运行模式降低场景中人的体验感，因此本申请提出一种新的技术方案。

发明内容

为了提高影音系统的交互性能，改善用户的沉浸体验，本申请提供一种多功能的沉浸式影音交互方法、装置和系统。

第一方面，本申请提供一种多功能的沉浸式影音交互方法，采用如下的技术方案：

一种多功能的沉浸式影音交互方法，包括：

建立基于面部信息和手势信息的初始数据识别库；

获取当前环境的信息数据，生成初始接收信息；其中，初始接收信息包括面部和手势信息；

结合初始数据识别库识别处理初始接收信息，并建立手势发起人、面部信息和手势信息之间的一一对应关系；以及，

当手势为某一预设的交互触发手势，则输出移动交互、音频交互和图像交互指令至交互模组；

其中，所述交互模组包括交互机器人以及与之连接的主场音频和图像系统。

可选的，所述交互机器人至少包括处理单元以及与之连接的通信单元、行走系统、音频采集/播放系统和图像采集/播放系统；

所述移动交互指令包括：靠近手势发起人指导间距为L1；

所述音频交互和图像交互指令包括：展示交互机器人当前采集的音频和图像作为主场音频和图像。

可选的，所述通信单元为无线通信且包括4G/5G/WIFI通信的一种或多种。

第二方面，本申请提供一种多功能的沉浸式影音交互系统，采用如下的技术方案：

一种多功能的沉浸式影音交互系统，包括：

采集单元，其被配置为：用于配合建立基于面部信息和手势信息的初始数据识别库；用于获取当前环境的信息数据，生成初始接收信息；

评价单元，其包括分析单元、确定单元、控制单元和展示单元，且被配置为：用于结合初始数据识别库识别处理初始接收信息，并建立手势发起人、面部信息和手势信息之间的一一对应关系；用于当手势为某一预设的交互触发手势，则输出移动交互、音频交互和图像交互指令至交互模组；

反馈单元，其被配置为：用于连接采集单元和评价单元，基于某一次货多次两单元的运行，将运行过程数据收集、分析，并储存于数据库。

第三方面，本申请提供一种多功能的沉浸式影音交互装置，采用如下的技术方案：

一种多功能的沉浸式影音交互装置，包括处理器和存储器，所述存储器中存储有可被处理器加载并执行实现如上述方法的计算机程序。

综上所述，本申请包括以下至少一种有益技术效果：可利用机器人具备低速无人驾驶功的平台，实现半自动化加载到机器人平台，具有防疫、服务、采集信息、5G数据传输等功能；可基于视觉识别与语音交互实现系统智能化，通过场景的声场与视觉神经网络实现高效识别，提升用户体验实现影音交互系统沉浸式体验。

附图说明

图1是本申请的全周期示意图；

图2是本申请的运行模式示意图；

图3是本申请的系统结构框图。

具体实施方式

以下结合附图1-3对本申请作进一步详细说明。

实施例1

本申请实施例公开一种多功能的沉浸式影音交互方法。

参照图1和图2，多功能的沉浸式影音交互方法包括：

建立基于面部信息和手势信息的初始数据识别库；

当手势为某一预设的交互触发手势，则输出移动交互、音频交互和图像交互指令至交互模组。

上述交互模组包括交互机器人以及与之连接的主场音频和图像系统。

交互机器人至少包括处理单元以及与之连接的通信单元、行走系统、音频采集/播放系统和图像采集/播放系统；其中，行走系统，保证机器人可以执行移动交互指令；音频采集系统和图像采集系统，则可用于获取当前环境的信息数据；为保证信息交互的时效和无延迟交互，交互机器人的通信模块优选的4G/5G/WIFI等高速通信模块的一种或多种。

对应的，移动交互指令包括：靠近手势发起人，具体靠近直至间距为L1,L1为工作人员预设的参数。

音频交互和图像交互指令包括：展示交互机器人当前采集的音频和图像作为主场音频和图像。

以一个学术会议为例：

在会议前，参会者需通过手机等终端上传照片，用于后期视觉识别。

在会议期间，某一参会者可以举手示意(相当于预设的交互触发手势)。当机器人识别参会者的手势特征，配合面部信息，机器人本体将自动移动到参会者的面前，将摄像头(图像采集)面向参会者；此时，布置于会场中的音响和屏幕系统，即上述主场音频和图像系统，显示切换到举手人；另外，当机器人识别有新出现举手人时，再次重复上述内容，自动切换场景。

根据上述内容，本方法可利用机器人具备低速无人驾驶功的平台，实现半自动化加载到机器人平台，具有防疫、服务、采集信息、5G数据传输等功能；可基于视觉识别与语音交互实现系统智能化，通过场景的声场与视觉神经网络实现高效识别，提升用户体验实现影音交互系统沉浸式体验。

实施例2

本申请实施例还公开一种多功能的沉浸式影音交互系统。

参照图3，多功能的沉浸式影音交互系统包括：

实施例3

本申请实施例还公开一种多功能的沉浸式影音交互装置。

多功能的沉浸式影音交互装置，其包括处理器和存储器，其中，存储器中存储有可被处理器加载并执行实现如上述的方法的计算机程序。

以上均为本申请的较佳实施例，并非依此限制本申请的保护范围，故：凡依本申请的结构、形状、原理所做的等效变化，均应涵盖于本申请的保护范围之内。

Claims

1.一种多功能的沉浸式影音交互方法，其特征在于，包括：

建立基于面部信息和手势信息的初始数据识别库；

2.根据权利要求1所述的多功能的沉浸式影音交互方法，其特征在于：所述交互机器人至少包括处理单元以及与之连接的通信单元、行走系统、音频采集/播放系统和图像采集/播放系统；

所述移动交互指令包括：靠近手势发起人指导间距为L1；

3.根据权利要求2所述的多功能的沉浸式影音交互方法，其特征在于：所述通信单元为无线通信且包括4G/5G/WIFI通信的一种或多种。

4.一种多功能的沉浸式影音交互系统，其特征在于：

5.一种多功能的沉浸式影音交互装置，其特征在于：包括处理器和存储器，所述存储器中存储有可被处理器加载并执行实现如权利要求1-3任一所述的方法的计算机程序。