CN112133305A

CN112133305A - 语音助手开启方法、装置、设备及可读存储介质

Info

Publication number: CN112133305A
Application number: CN202011054712.3A
Authority: CN
Inventors: 王蒙; 张建强; 邓成林
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2020-09-29
Filing date: 2020-09-29
Publication date: 2020-12-25

Abstract

本发明涉及金融科技技术领域，公开了一种语音助手开启方法、装置、设备及计算机可读存储介质。该语音助手开启方法包括：在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数；判断所述终端摇动参数是否为符合摇动条件的有效参数；在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令。通过提供摇动开启语音助手功能，以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能，避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败，简化了语音助手功能的唤醒操作，提高了语音助手的开启效率以及用户体验，解决了目前语音助手开启方法效率低下的问题。

Description

语音助手开启方法、装置、设备及可读存储介质

技术领域

本发明涉及金融科技(Fintech)技术领域，尤其涉及一种语音助手开启方法、装置、设备及计算机可读存储介质。

背景技术

随着计算机技术的发展，越来越多的技术应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变，但由于金融行业的安全性、实时性要求，也对技术提出了更高的要求。

智能型的手机应用一般都包含语音助手功能，用于通过智能对话与即时问答的智能交互，实现帮用户解决问题。目前的语音助手一般是通过含有特定唤醒词的语音输入来“触发”，启用语音识别系统实现语音交互以开启语音助手功能。但是，当用户处于公共场合中或处于嘈杂环境时语音识别率下降，导致无法通过唤醒词准确开启语音助手服务。

发明内容

本发明的主要目的在于提供一种语音助手开启方法、装置、设备及可读存储介质，旨在解决目前语音助手开启方法效率低下的问题。

为实现上述目的，本发明提供一种语音助手开启方法，其特征在于，所述语音助手开启方法包括：

在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数；

判断所述终端摇动参数是否为符合摇动条件的有效参数；

在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令。

可选地，所述终端摇动参数包括终端摇动轨迹，所述判断所述终端摇动参数是否为符合摇动条件的有效参数的步骤具体包括：

判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配，其中，与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。

可选地，所述终端摇动参数包括摇动频率，所述判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配的步骤之后，还包括：

在所述终端摇动轨迹与所述预设轨迹相匹配，判断所述摇动频率是否与所述摇动条件中的预设频率相匹配，其中，与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数为所述有效参数。

可选地，所述在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数的步骤具体包括：

在检测到摇动信号时，获取所述目标终端的当前界面，并判断所述当前界面是否为语音助手功能界面；

若所述当前界面不是所述语音助手功能界面，则获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数。

可选地，所述在检测到摇动信号时，获取所述目标终端的当前界面，并判断所述当前界面是否为语音助手功能界面的步骤之后，还包括：

若所述当前界面为所述语音助手功能界面，则生成并输出是否关闭语音助手功能的提醒消息，并在接收到用户反馈的摇动确认指令时，关闭所述语音助手功能。

可选地，所述在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令的步骤之后，还包括：

在接收到用户输入的目标语音指令时，基于语音识别技术ASR，将所述目标语音指令转化成对应的目标文字指令；

根据自然语言理解技术NLU，将所述目标文字指令转换为所述目标终端可识别的目标终端命令，以控制所述目标终端执行所述目标终端命令对应操作。

可选地，所述根据自然语言理解技术NLU，将所述目标文字指令转换为所述目标终端可识别的目标终端命令，以控制所述目标终端执行所述目标终端命令对应操作的步骤还包括：

根据自然语言生成技术NLG以及所述目标终端执行所述目标终端命令对应操作的操作结果，生成目标语言文本结果指令；

根据语音合成技术TTS，将所述目标语言文本结果指令转换为对应的目标语音执行结果，并输出所述目标语音执行结果。

此外，为实现上述目的，本发明还提供一种语音助手开启装置，所述语音助手开启装置包括：

摇动参数获取模块，用于在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数；

摇动参数判断模块，用于判断所述终端摇动参数是否为符合摇动条件的有效参数；

助手功能开启模块，用于在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令。

此外，为实现上述目的，本发明还提供一种语音助手开启设备，所述语音助手开启设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音助手开启程序，所述语音助手开启程序被所述处理器执行时实现如上所述的语音助手开启方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有语音助手开启程序，所述语音助手开启程序被处理器执行时实现如上所述的语音助手开启方法的步骤。

本发明提供一种语音助手开启方法、装置、设备及计算机可读存储介质，通过在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数；判断所述终端摇动参数是否为符合摇动条件的有效参数；在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令。通过提供摇动开启语音助手功能，以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能，避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败，简化了语音助手功能的唤醒操作，提高了语音助手的开启效率，并提升了用户体验，解决了目前语音助手开启方法效率低下的问题。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图；

图2为本发明语音助手开启方法第一实施例的流程示意图；

图3为本发明语音助手开启方法第二实施例的流程示意图；

图4为本发明语音助手开启装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。

本发明实施例语音助手开启设备可以是智能手机，也可以是平板电脑、便携计算机等终端设备。

如图1所示，该终端可以包括：处理器1001，例如CPU(Central Processing Unit，中央处理器)，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真Wireless-Fidelity，Wi-Fi接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、Wi-Fi模块等等。其中，传感器比如光传感器、运动传感器、压力传感器和振动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示屏的亮度，接近传感器可在终端移动到耳边时，关闭显示屏和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等。压力传感器用于获取按压信号，包括按压力度和按压时长等。振动传感器用于进行振动提醒。当然，终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的语音助手开启设备结构并不构成对语音助手开启设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及语音助手开启程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的语音助手开启程序，并执行以下操作：

判断所述终端摇动参数是否为符合摇动条件的有效参数；

进一步地，所述终端摇动参数包括终端摇动轨迹，处理器1001可以调用存储器1005中存储的语音助手开启程序，还执行以下操作：

进一步地，所述终端摇动参数包括摇动频率，处理器1001可以调用存储器1005中存储的语音助手开启程序，还执行以下操作：

进一步地，处理器1001可以调用存储器1005中存储的语音助手开启程序，还执行以下操作：

基于上述硬件结构，提出本发明语音助手开启方法的各实施例。

本发明提供一种语音助手开启方法。

参照图2，图2为本发明语音助手开启方法第一实施例的流程示意图。

在本实施例中，提供了语音助手开启方法的实施例，需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

在本实施例中，该语音助手开启方法包括：

步骤S10，在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数；

目前，智能型的手机应用一般都包含语音助手功能，用于通过智能对话与即时问答的智能交互，实现帮用户解决问题。

但是，语音助手一般是通过含有特定唤醒词的语音输入来“触发”，启用语音识别系统实现语音交互以开启语音助手功能。然而：

1)嘈杂环境中语音识别率下降，容易导致无法通过唤醒词准确开启语音助手服务；

2)公共场合中，通过唤醒词开启语音助手服务会影响到他人，导致唤醒操作不便；

3)用户需要准确记住唤醒词并且要保证发音可被识别，才能够开启语音助手，唤醒难度较大。

为了解决上述问题，本实施例通过提供摇动开启语音助手功能，以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能，避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败，简化了语音助手功能的唤醒操作，提高了语音助手的开启效率，并提升了用户体验。由此，用户无需担心身边环境是否嘈杂、是否处在尴尬的公共场合，无需记住唤醒词，只需通过摇一摇，便可随时开启语音助手功能。

具体地，摇动信号为移动终端被摇动时所产生的信号，用于触发语音助手功能的开启。在检测到摇动信号时，移动终端的摇动信号可以通过内置的传感器来检测。例如，当用户摇动手机、平板电脑等移动终端时，若内置的加速度传感器所述检测到短时间段内的加速度的方向相反，则可以判断检测到了移动终端的摇动信号；又如，当用户摇动移动终端时，若通过移动终端的定位方法检测到短时间段内该移动终端的移动方向相反，则可以判断检测到了移动终端的摇动信号。在检测到摇动信号时，即表示用户可能需要启用语音助手功能，为了防止误操作，进一步获取所述目标终端的位置信息，即在预设时间内的位置变化信息。根据所述位置信息可以获取所述目标终端的终端摇动参数，所述终端摇动参数为所述终端在用户摇动时由于位置变化产生的数据。

步骤S20，判断所述终端摇动参数是否为符合摇动条件的有效参数；

本实施例中，将所述终端摇动参数与预设设定的摇动条件中的预设值进行比对，若所述终端摇动参数符合所述摇动条件，即为有效参数，否则为无效参数。

其中，所述终端摇动参数包括终端摇动轨迹，所述步骤S20具体包括：

其中，所述终端摇动参数包括摇动频率，所述步骤S20具体包括：

本实施例中，为了进一步防止误启用，在正常摇动手机触发摇一摇动作判断后开启语音助手服务。但手机的一般移动、摔落、震动不可判断为摇一摇。具体地，所述终端摇动参数包括终端摇动轨迹和摇动频率。在所述终端摇动轨迹符合所述摇动条件中的预设轨迹时，即匹配的摇动规律以及摇动范围。其中，与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。为了防止普通晃动误启，在所述终端摇动轨迹与所述预设轨迹相匹配之后，进一步判断摇动频率，比如快速震动导致的异常摇动频率，即判定为不符合摇动条件的无效参数。与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数判定为所述有效参数。即可启用语音助手功能。

步骤S30，在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令。

其中，所述步骤S30之后，还包括：

本实施例中，通过摇一摇唤起语音助手服务后，语音助手通过以下功能点实现人机对话交互，以便帮助用户解决问题：

1)语音识别(ASR)：将声音转化成文字的过程，即将所述目标语音指令转化成对应的目标文字指令；

2)自然语言理解(NLU)：理解和处理文本的过程，即将所述目标文字指令转换为所述目标终端可识别的目标终端命令，以控制所述目标终端执行所述目标终端命令对应操作；

3)自然语言生成(NLG)：自动生成语言文本的过程，即控制所述目标终端执行所述目标终端命令对应操作的操作结果，并生成目标语言文本结果指令；

4)语音合成(TTS)：把文本转换成语音的过程，即将所述目标语言文本结果指令转换为对应的目标语音执行结果，并输出所述目标语音执行结果。

本发明实施例提供一种语音助手开启方法、装置、设备及计算机可读存储介质，通过在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数；判断所述终端摇动参数是否为符合摇动条件的有效参数；在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令。通过提供摇动开启语音助手功能，以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能，避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败，简化了语音助手功能的唤醒操作，提高了语音助手的开启效率，并提升了用户体验，解决了目前语音助手开启方法效率低下的问题。

进一步地，基于上述第一实施例，提出本发明语音助手开启方法的第二实施例。

参照图3，图3为本发明语音助手开启方法第二实施例的流程示意图。

在本实施例中，上述步骤S10具体包括：

步骤S11，在检测到摇动信号时，获取所述目标终端的当前界面，并判断所述当前界面是否为语音助手功能界面；

步骤S12，若所述当前界面不是所述语音助手功能界面，则获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数。

步骤S13，若所述当前界面为所述语音助手功能界面，则生成并输出是否关闭语音助手功能的提醒消息，并在接收到用户反馈的摇动确认指令时，关闭所述语音助手功能。

本实施例中，为了进一步提升用户体验，还进一步提供用户摇一摇关闭语音助手功能。具体地，在检测到摇动信号时，获取所述目标终端的当前界面，以根据所述当前界面判断所述目标终端当前是否为已开启语音助手。若当前未开启语音助手，则当前摇一摇产生的终端摇动参数为开启指令。即获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数，然后进行终端摇动参数是否有效的判断步骤。若已开启语音助手，则当前摇一摇产生的终端摇动参数为关闭指令。则生成并输出是否关闭语音助手功能的提醒消息，并在接收到用户反馈的摇动确认指令时，关闭所述语音助手功能。更多实施例中，还可以进一步提供摇一摇进行撤销，摇一摇进行返回等功能。

本实施例除了通过提供摇动开启语音助手功能，进一步提供摇一摇关闭语音助手等功能，以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能，避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败，简化了语音助手功能的唤醒操作，提高了语音助手的开启效率，并提升了用户体验，解决了目前语音助手开启方法效率低下的问题。

本发明还提供一种语音助手开启装置。

参照图4，图4为本发明语音助手开启装置第一实施例的功能模块示意图。

如图4所示，所述语音助手开启装置包括：

摇动参数获取模块10，用于在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数；

摇动参数判断模块20，用于判断所述终端摇动参数是否为符合摇动条件的有效参数；

助手功能开启模块30，用于在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令。

进一步地，所述终端摇动参数包括终端摇动轨迹，所述摇动参数判断模块20具体包括：

第一判断单元，用于判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配，其中，与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。

进一步地，所述终端摇动参数包括摇动频率，所述摇动参数判断模块20具体还包括：

第二判断单元，用于在所述终端摇动轨迹与所述预设轨迹相匹配，判断所述摇动频率是否与所述摇动条件中的预设频率相匹配，其中，与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数为所述有效参数。

进一步地，所述摇动参数获取模块10具体包括：

第三判断单元，用于在检测到摇动信号时，获取所述目标终端的当前界面，并判断所述当前界面是否为语音助手功能界面；

参数生成单元，用于若所述当前界面不是所述语音助手功能界面，则获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数。

进一步地，所述摇动参数获取模块10具体还包括：

功能关闭单元，用于若所述当前界面为所述语音助手功能界面，则生成并输出是否关闭语音助手功能的提醒消息，并在接收到用户反馈的摇动确认指令时，关闭所述语音助手功能。

进一步地，所述语音助手开启装置还包括：

语音指令转化模块，用于在接收到用户输入的目标语音指令时，基于语音识别技术ASR，将所述目标语音指令转化成对应的目标文字指令；

文字指令转换模块，用于根据自然语言理解技术NLU，将所述目标文字指令转换为所述目标终端可识别的目标终端命令，以控制所述目标终端执行所述目标终端命令对应操作。

进一步地，所述语音助手开启装置还包括：

命令执行模块，用于根据自然语言生成技术NLG以及所述目标终端执行所述目标终端命令对应操作的操作结果，生成目标语言文本结果指令；

结果输出模块，用于根据语音合成技术TTS，将所述目标语言文本结果指令转换为对应的目标语音执行结果，并输出所述目标语音执行结果。

其中，上述语音助手开启装置中各个模块的功能实现与上述语音助手开启方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质上存储有语音助手开启程序，所述语音助手开启程序被处理器执行时实现如以上任一项实施例所述的语音助手开启方法的步骤。

本发明计算机可读存储介质的具体实施例与上述语音助手开启方法各实施例基本相同，在此不作赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种语音助手开启方法，其特征在于，所述语音助手开启方法包括：

判断所述终端摇动参数是否为符合摇动条件的有效参数；

2.如权利要求1所述的语音助手开启方法，其特征在于，所述终端摇动参数包括终端摇动轨迹，所述判断所述终端摇动参数是否为符合摇动条件的有效参数的步骤具体包括：

3.如权利要求2所述的语音助手开启方法，其特征在于，所述终端摇动参数包括摇动频率，所述判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配的步骤之后，还包括：

4.如权利要求1所述的语音助手开启方法，其特征在于，所述在检测到摇动信号时，获取目标终端的位置信息，并根据所述位置信息生成终端摇动参数的步骤具体包括：

5.如权利要求4所述的语音助手开启方法，其特征在于，所述在检测到摇动信号时，获取所述目标终端的当前界面，并判断所述当前界面是否为语音助手功能界面的步骤之后，还包括：

6.如权利要求1至5中任一项所述的语音助手开启方法，其特征在于，所述在所述终端摇动参数为所述有效参数时，开启语音助手功能，并启用语音识别系统，以接收用户语音指令的步骤之后，还包括：

7.如权利要求6所述的语音助手开启方法，其特征在于，所述根据自然语言理解技术NLU，将所述目标文字指令转换为所述目标终端可识别的目标终端命令，以控制所述目标终端执行所述目标终端命令对应操作的步骤还包括：

8.一种语音助手开启装置，其特征在于，所述语音助手开启装置包括：

9.一种语音助手开启设备，其特征在于，所述语音助手开启设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音助手开启程序，所述语音助手开启程序被所述处理器执行时实现如权利要求1至7中任一项所述的语音助手开启方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有语音助手开启程序，所述语音助手开启程序被处理器执行时实现如权利要求1至7中任一项所述的语音助手开启方法的步骤。