CN110428831A

CN110428831A - 一种语音助手多场景交互方法

Info

Publication number: CN110428831A
Application number: CN201910679628.1A
Authority: CN
Inventors: 张博
Original assignee: Beijing Enhanced Intelligence Technology Co Ltd
Current assignee: Beijing Enhanced Intelligence Technology Co Ltd
Priority date: 2019-07-26
Filing date: 2019-07-26
Publication date: 2019-11-08

Abstract

本发明公开了一种语音助手多场景交互方法，具体涉及智能语音领域，一种语音助手多场景交互方法，包括单击输入状态和长按输入状态，语音助手多场景交互方法包括以下操作步骤：S1、首先进行输入语音内容，语音进行自动识别并储存，S2、然后用户根据需求，单击唤醒语音系统并对储存的对S1中语音信息进行传统语音方式处理；本发明通过悬浮框或实体按键的长按、短按，用户可以自由选择使用哪种方案；悬浮按钮会根据不同应用场景，展示不同方式及交互方式，语音助手反馈会根据不同场景而反馈不同形式。

Description

一种语音助手多场景交互方法

技术领域

本发明涉及智能语音技术领域，更具体地说，本发明涉及一种语音助手多场景交互方法。

背景技术

语音助手已经逐渐成为手机随机标配系统。智能语音在家居、智能穿戴设备上也开始了长足的发展。

但目前智能语音交互方案主要还停留在两个方向，1.纯语音输入输出交互2.类siri独立语音助手交互体系。目前认为智能语音应该是个建立在现有GUI体系下的一套辅助GUI的系统。在不同GUI场景下，语音助手的显示及辅助方式应该是不同的，另外目前存在两种语音助手使用逻辑：1.问答逻辑；2.先记录后推荐逻辑。

无论上述的语音方案还是语音逻辑在使用过程中只能采取一种语音功能，导致在使用过程中的灵活性差，无法针对实际情况得到最符合用户目前状态的帮助，实用价值低。

发明内容

为了克服现有技术的上述缺陷，本发明的实施例提供一种语音助手多场景交互方法，通过悬浮框或实体按键的长按、短按，用户可以自由选择使用哪种方案，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种语音助手多场景交互方法，包括单击输入状态和长按输入状态，语音助手多场景交互方法包括以下操作步骤：

S1、首先进行输入语音内容，语音进行自动识别并储存，

S2、然后用户根据需求，单击唤醒语音系统并对储存的对S1中语音信息进行传统语音方式处理；

S3、根据用户需求，长按唤醒语音系统并根据手机场景模块对S1中语音信息进行智能语音处理。

智能语音问答模块包括以下操作步骤：

A1、根据手机场景模块的不同，智能语音系统自动识别场景；

A2、智能语音系统场景模块的不同，给予相对应的声音画面回复；

其中，场景模块包括远程状态、息屏状态、锁屏状态、桌面状态和应用使用状态，所述远程状态无法使用长按唤醒输入方式。

在一个优选地实施方式中，所述智能语音问答模块操作包括以下步骤：

B1、用户语音唤醒语音系统，此时根据语音场景提供对应的悬浮框对语音进行展示；

B2、无法识别并提醒用户二次按键发出语音指示或识别指示并完成指示等待下步指示；

B3、三秒内无指示将关闭悬浮框和语音系统，三秒内有指示将回到B2回答问题并等待下步指示。

在一个优选地实施方式中，传统语音系统的语音语意处理和对记录进行语音语意处理的方式是出于两种不同UI状态，对于记录进行处理的逻辑，语音记录悬浮框位于最上层。

在一个优选地实施方式中，所述远程状态为手机远离用户状态，所述息屏状态为手机屏幕关闭状态，所述锁屏状态为手机屏幕打开锁定状态，所述桌面状态为手机解锁为使用应用状态，所述应用使用状态为手机应用使用状态。

在一个优选地实施方式中，所述智能语音系统中激活的悬浮框在语音激活逻辑前可以自主设置开关，当打开悬浮框状态后，唤醒语音系统时。

在一个优选地实施方式中，长按输入方式可以为包括对悬浮键的长时间点击输入方式、底部输入键长按输入方式和特定声音词输入方式中的其中一种。

本发明的技术效果和优点：

1、本发明同时存在两种智能语音交互逻辑，灵活性强；

2、本发明通过悬浮框或实体按键的长按方式、短按方式，用户可以自由选择使用哪种方案；

3、本发明悬浮按钮会根据不同应用场景，展示不同方式及交互方式。

4、本发明语音助手反馈会根据不同场景而反馈不同形式，根据语音内容的不同，反馈不同形式，然后用户可以通过GUI或语音的方式进行交互。

附图说明

图1为本发明的案件语音输入流程示意图。

图2为本发明的底部键输入流程示意图。

图3为本发明的悬浮键输入流程示意图。

图4为本发明的智能语音问答模块框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如附图1与附图4所示的一种语音助手多场景交互方法，包括单击输入状态和长按输入状态，语音助手多场景交互方法包括以下操作步骤：

S1、首先进行输入语音内容，语音进行自动识别并储存，

智能语音问答模块包括以下操作步骤：

传统语音系统的语音语意处理和对记录进行语音语意处理的方式是出于两种不同UI状态，对于记录进行处理的逻辑，语音记录悬浮框位于最上层，所述远程状态为手机远离用户状态，所述息屏状态为手机屏幕关闭状态，所述锁屏状态为手机屏幕打开锁定状态，所述桌面状态为手机解锁为使用应用状态，所述应用使用状态为手机应用使用状态，所述智能语音系统中激活的悬浮框在语音激活逻辑前可以自主设置开关，当打开悬浮框状态后，唤醒语音系统时，长按输入方式可以为包括对悬浮键的长时间点击输入方式。

实施例2

具体与实施例1的区别为底部输入键长按方式。

实施例3

具体与实施例1的区别为特定声音词输入方式

采用上述技术手段，将长按方式扩展为三种手段激活，极大的增加了该装置激活的灵活性，方便了用户根据自己来决定实用哪种技术手段，极大的增加了该装置的便捷性。

最后应说明的几点是：首先，在本申请的描述中，需要说明的是，除非另有规定和限定，术语“安装”、“相连”、“连接”应做广义理解，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变，则相对位置关系可能发生改变；

其次：本发明公开实施例附图中，只涉及到与本公开实施例涉及到的结构，其他结构可参考通常设计，在不冲突情况下，本发明同一实施例及不同实施例可以相互组合；

最后：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种语音助手多场景交互方法，包括单击输入状态和长按输入状态，其特征在于：语音助手多场景交互方法包括以下操作步骤：

S1、首先进行输入语音内容，语音进行自动识别并储存，

智能语音问答模块包括以下操作步骤：

2.根据权利要求1所述的一种语音助手多场景交互方法，其特征在于：所述智能语音问答模块操作包括以下步骤：

3.根据权利要求1所述的一种语音助手多场景交互方法，其特征在于：传统语音系统的语音语意处理和对记录进行语音语意处理的方式是出于两种不同UI状态，对于记录进行处理的逻辑，语音记录悬浮框位于最上层。

4.根据权利要求1所述的一种语音助手多场景交互方法，其特征在于：所述远程状态为手机远离用户状态，所述息屏状态为手机屏幕关闭状态，所述锁屏状态为手机屏幕打开锁定状态，所述桌面状态为手机解锁为使用应用状态，所述应用使用状态为手机应用使用状态。

5.根据权利要求1所述的一种语音助手多场景交互方法，其特征在于：所述智能语音系统中激活的悬浮框在语音激活逻辑前可以自主设置开关，当打开悬浮框状态后，唤醒语音系统时。

6.根据权利要求1所述的一种语音助手多场景交互方法，其特征在于：长按输入方式可以为包括对悬浮键的长时间点击输入方式、底部输入键长按输入方式和特定声音词输入方式中的其中一种。