CN112133305A - 语音助手开启方法、装置、设备及可读存储介质 - Google Patents

语音助手开启方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112133305A
CN112133305A CN202011054712.3A CN202011054712A CN112133305A CN 112133305 A CN112133305 A CN 112133305A CN 202011054712 A CN202011054712 A CN 202011054712A CN 112133305 A CN112133305 A CN 112133305A
Authority
CN
China
Prior art keywords
shaking
voice assistant
terminal
voice
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011054712.3A
Other languages
English (en)
Inventor
王蒙
张建强
邓成林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011054712.3A priority Critical patent/CN112133305A/zh
Publication of CN112133305A publication Critical patent/CN112133305A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明涉及金融科技技术领域,公开了一种语音助手开启方法、装置、设备及计算机可读存储介质。该语音助手开启方法包括:在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;判断所述终端摇动参数是否为符合摇动条件的有效参数;在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。通过提供摇动开启语音助手功能,以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能,避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败,简化了语音助手功能的唤醒操作,提高了语音助手的开启效率以及用户体验,解决了目前语音助手开启方法效率低下的问题。

Description

语音助手开启方法、装置、设备及可读存储介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种语音助手开启方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
智能型的手机应用一般都包含语音助手功能,用于通过智能对话与即时问答的智能交互,实现帮用户解决问题。目前的语音助手一般是通过含有特定唤醒词的语音输入来“触发”,启用语音识别系统实现语音交互以开启语音助手功能。但是,当用户处于公共场合中或处于嘈杂环境时语音识别率下降,导致无法通过唤醒词准确开启语音助手服务。
发明内容
本发明的主要目的在于提供一种语音助手开启方法、装置、设备及可读存储介质,旨在解决目前语音助手开启方法效率低下的问题。
为实现上述目的,本发明提供一种语音助手开启方法,其特征在于,所述语音助手开启方法包括:
在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;
判断所述终端摇动参数是否为符合摇动条件的有效参数;
在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。
可选地,所述终端摇动参数包括终端摇动轨迹,所述判断所述终端摇动参数是否为符合摇动条件的有效参数的步骤具体包括:
判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。
可选地,所述终端摇动参数包括摇动频率,所述判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配的步骤之后,还包括:
在所述终端摇动轨迹与所述预设轨迹相匹配,判断所述摇动频率是否与所述摇动条件中的预设频率相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数为所述有效参数。
可选地,所述在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数的步骤具体包括:
在检测到摇动信号时,获取所述目标终端的当前界面,并判断所述当前界面是否为语音助手功能界面;
若所述当前界面不是所述语音助手功能界面,则获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数。
可选地,所述在检测到摇动信号时,获取所述目标终端的当前界面,并判断所述当前界面是否为语音助手功能界面的步骤之后,还包括:
若所述当前界面为所述语音助手功能界面,则生成并输出是否关闭语音助手功能的提醒消息,并在接收到用户反馈的摇动确认指令时,关闭所述语音助手功能。
可选地,所述在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令的步骤之后,还包括:
在接收到用户输入的目标语音指令时,基于语音识别技术ASR,将所述目标语音指令转化成对应的目标文字指令;
根据自然语言理解技术NLU,将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作。
可选地,所述根据自然语言理解技术NLU,将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作的步骤还包括:
根据自然语言生成技术NLG以及所述目标终端执行所述目标终端命令对应操作的操作结果,生成目标语言文本结果指令;
根据语音合成技术TTS,将所述目标语言文本结果指令转换为对应的目标语音执行结果,并输出所述目标语音执行结果。
此外,为实现上述目的,本发明还提供一种语音助手开启装置,所述语音助手开启装置包括:
摇动参数获取模块,用于在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;
摇动参数判断模块,用于判断所述终端摇动参数是否为符合摇动条件的有效参数;
助手功能开启模块,用于在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。
此外,为实现上述目的,本发明还提供一种语音助手开启设备,所述语音助手开启设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音助手开启程序,所述语音助手开启程序被所述处理器执行时实现如上所述的语音助手开启方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音助手开启程序,所述语音助手开启程序被处理器执行时实现如上所述的语音助手开启方法的步骤。
本发明提供一种语音助手开启方法、装置、设备及计算机可读存储介质,通过在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;判断所述终端摇动参数是否为符合摇动条件的有效参数;在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。通过提供摇动开启语音助手功能,以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能,避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败,简化了语音助手功能的唤醒操作,提高了语音助手的开启效率,并提升了用户体验,解决了目前语音助手开启方法效率低下的问题。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明语音助手开启方法第一实施例的流程示意图;
图3为本发明语音助手开启方法第二实施例的流程示意图;
图4为本发明语音助手开启装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例语音助手开启设备可以是智能手机,也可以是平板电脑、便携计算机等终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU(Central Processing Unit,中央处理器),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真Wireless-Fidelity,Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、Wi-Fi模块等等。其中,传感器比如光传感器、运动传感器、压力传感器和振动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等。压力传感器用于获取按压信号,包括按压力度和按压时长等。振动传感器用于进行振动提醒。当然,终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的语音助手开启设备结构并不构成对语音助手开启设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及语音助手开启程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的语音助手开启程序,并执行以下操作:
在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;
判断所述终端摇动参数是否为符合摇动条件的有效参数;
在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。
进一步地,所述终端摇动参数包括终端摇动轨迹,处理器1001可以调用存储器1005中存储的语音助手开启程序,还执行以下操作:
判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。
进一步地,所述终端摇动参数包括摇动频率,处理器1001可以调用存储器1005中存储的语音助手开启程序,还执行以下操作:
在所述终端摇动轨迹与所述预设轨迹相匹配,判断所述摇动频率是否与所述摇动条件中的预设频率相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数为所述有效参数。
进一步地,处理器1001可以调用存储器1005中存储的语音助手开启程序,还执行以下操作:
在检测到摇动信号时,获取所述目标终端的当前界面,并判断所述当前界面是否为语音助手功能界面;
若所述当前界面不是所述语音助手功能界面,则获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数。
进一步地,处理器1001可以调用存储器1005中存储的语音助手开启程序,还执行以下操作:
若所述当前界面为所述语音助手功能界面,则生成并输出是否关闭语音助手功能的提醒消息,并在接收到用户反馈的摇动确认指令时,关闭所述语音助手功能。
进一步地,处理器1001可以调用存储器1005中存储的语音助手开启程序,还执行以下操作:
在接收到用户输入的目标语音指令时,基于语音识别技术ASR,将所述目标语音指令转化成对应的目标文字指令;
根据自然语言理解技术NLU,将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作。
进一步地,处理器1001可以调用存储器1005中存储的语音助手开启程序,还执行以下操作:
根据自然语言生成技术NLG以及所述目标终端执行所述目标终端命令对应操作的操作结果,生成目标语言文本结果指令;
根据语音合成技术TTS,将所述目标语言文本结果指令转换为对应的目标语音执行结果,并输出所述目标语音执行结果。
基于上述硬件结构,提出本发明语音助手开启方法的各实施例。
本发明提供一种语音助手开启方法。
参照图2,图2为本发明语音助手开启方法第一实施例的流程示意图。
在本实施例中,提供了语音助手开启方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中,该语音助手开启方法包括:
步骤S10,在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;
目前,智能型的手机应用一般都包含语音助手功能,用于通过智能对话与即时问答的智能交互,实现帮用户解决问题。
但是,语音助手一般是通过含有特定唤醒词的语音输入来“触发”,启用语音识别系统实现语音交互以开启语音助手功能。然而:
1)嘈杂环境中语音识别率下降,容易导致无法通过唤醒词准确开启语音助手服务;
2)公共场合中,通过唤醒词开启语音助手服务会影响到他人,导致唤醒操作不便;
3)用户需要准确记住唤醒词并且要保证发音可被识别,才能够开启语音助手,唤醒难度较大。
为了解决上述问题,本实施例通过提供摇动开启语音助手功能,以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能,避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败,简化了语音助手功能的唤醒操作,提高了语音助手的开启效率,并提升了用户体验。由此,用户无需担心身边环境是否嘈杂、是否处在尴尬的公共场合,无需记住唤醒词,只需通过摇一摇,便可随时开启语音助手功能。
具体地,摇动信号为移动终端被摇动时所产生的信号,用于触发语音助手功能的开启。在检测到摇动信号时,移动终端的摇动信号可以通过内置的传感器来检测。例如,当用户摇动手机、平板电脑等移动终端时,若内置的加速度传感器所述检测到短时间段内的加速度的方向相反,则可以判断检测到了移动终端的摇动信号;又如,当用户摇动移动终端时,若通过移动终端的定位方法检测到短时间段内该移动终端的移动方向相反,则可以判断检测到了移动终端的摇动信号。在检测到摇动信号时,即表示用户可能需要启用语音助手功能,为了防止误操作,进一步获取所述目标终端的位置信息,即在预设时间内的位置变化信息。根据所述位置信息可以获取所述目标终端的终端摇动参数,所述终端摇动参数为所述终端在用户摇动时由于位置变化产生的数据。
步骤S20,判断所述终端摇动参数是否为符合摇动条件的有效参数;
本实施例中,将所述终端摇动参数与预设设定的摇动条件中的预设值进行比对,若所述终端摇动参数符合所述摇动条件,即为有效参数,否则为无效参数。
其中,所述终端摇动参数包括终端摇动轨迹,所述步骤S20具体包括:
判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。
其中,所述终端摇动参数包括摇动频率,所述步骤S20具体包括:
在所述终端摇动轨迹与所述预设轨迹相匹配,判断所述摇动频率是否与所述摇动条件中的预设频率相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数为所述有效参数。
本实施例中,为了进一步防止误启用,在正常摇动手机触发摇一摇动作判断后开启语音助手服务。但手机的一般移动、摔落、震动不可判断为摇一摇。具体地,所述终端摇动参数包括终端摇动轨迹和摇动频率。在所述终端摇动轨迹符合所述摇动条件中的预设轨迹时,即匹配的摇动规律以及摇动范围。其中,与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。为了防止普通晃动误启,在所述终端摇动轨迹与所述预设轨迹相匹配之后,进一步判断摇动频率,比如快速震动导致的异常摇动频率,即判定为不符合摇动条件的无效参数。与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数判定为所述有效参数。即可启用语音助手功能。
步骤S30,在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。
其中,所述步骤S30之后,还包括:
在接收到用户输入的目标语音指令时,基于语音识别技术ASR,将所述目标语音指令转化成对应的目标文字指令;
根据自然语言理解技术NLU,将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作。
根据自然语言生成技术NLG以及所述目标终端执行所述目标终端命令对应操作的操作结果,生成目标语言文本结果指令;
根据语音合成技术TTS,将所述目标语言文本结果指令转换为对应的目标语音执行结果,并输出所述目标语音执行结果。
本实施例中,通过摇一摇唤起语音助手服务后,语音助手通过以下功能点实现人机对话交互,以便帮助用户解决问题:
1)语音识别(ASR):将声音转化成文字的过程,即将所述目标语音指令转化成对应的目标文字指令;
2)自然语言理解(NLU):理解和处理文本的过程,即将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作;
3)自然语言生成(NLG):自动生成语言文本的过程,即控制所述目标终端执行所述目标终端命令对应操作的操作结果,并生成目标语言文本结果指令;
4)语音合成(TTS):把文本转换成语音的过程,即将所述目标语言文本结果指令转换为对应的目标语音执行结果,并输出所述目标语音执行结果。
本发明实施例提供一种语音助手开启方法、装置、设备及计算机可读存储介质,通过在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;判断所述终端摇动参数是否为符合摇动条件的有效参数;在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。通过提供摇动开启语音助手功能,以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能,避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败,简化了语音助手功能的唤醒操作,提高了语音助手的开启效率,并提升了用户体验,解决了目前语音助手开启方法效率低下的问题。
进一步地,基于上述第一实施例,提出本发明语音助手开启方法的第二实施例。
参照图3,图3为本发明语音助手开启方法第二实施例的流程示意图。
在本实施例中,上述步骤S10具体包括:
步骤S11,在检测到摇动信号时,获取所述目标终端的当前界面,并判断所述当前界面是否为语音助手功能界面;
步骤S12,若所述当前界面不是所述语音助手功能界面,则获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数。
步骤S13,若所述当前界面为所述语音助手功能界面,则生成并输出是否关闭语音助手功能的提醒消息,并在接收到用户反馈的摇动确认指令时,关闭所述语音助手功能。
本实施例中,为了进一步提升用户体验,还进一步提供用户摇一摇关闭语音助手功能。具体地,在检测到摇动信号时,获取所述目标终端的当前界面,以根据所述当前界面判断所述目标终端当前是否为已开启语音助手。若当前未开启语音助手,则当前摇一摇产生的终端摇动参数为开启指令。即获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数,然后进行终端摇动参数是否有效的判断步骤。若已开启语音助手,则当前摇一摇产生的终端摇动参数为关闭指令。则生成并输出是否关闭语音助手功能的提醒消息,并在接收到用户反馈的摇动确认指令时,关闭所述语音助手功能。更多实施例中,还可以进一步提供摇一摇进行撤销,摇一摇进行返回等功能。
本实施例除了通过提供摇动开启语音助手功能,进一步提供摇一摇关闭语音助手等功能,以使用户在嘈杂环境或公共场合中无需通过唤醒词语音唤醒语音助手功能,避免外界嘈杂环境导致特定唤醒词开启语音助手功能失败,简化了语音助手功能的唤醒操作,提高了语音助手的开启效率,并提升了用户体验,解决了目前语音助手开启方法效率低下的问题。
本发明还提供一种语音助手开启装置。
参照图4,图4为本发明语音助手开启装置第一实施例的功能模块示意图。
如图4所示,所述语音助手开启装置包括:
摇动参数获取模块10,用于在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;
摇动参数判断模块20,用于判断所述终端摇动参数是否为符合摇动条件的有效参数;
助手功能开启模块30,用于在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。
进一步地,所述终端摇动参数包括终端摇动轨迹,所述摇动参数判断模块20具体包括:
第一判断单元,用于判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。
进一步地,所述终端摇动参数包括摇动频率,所述摇动参数判断模块20具体还包括:
第二判断单元,用于在所述终端摇动轨迹与所述预设轨迹相匹配,判断所述摇动频率是否与所述摇动条件中的预设频率相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数为所述有效参数。
进一步地,所述摇动参数获取模块10具体包括:
第三判断单元,用于在检测到摇动信号时,获取所述目标终端的当前界面,并判断所述当前界面是否为语音助手功能界面;
参数生成单元,用于若所述当前界面不是所述语音助手功能界面,则获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数。
进一步地,所述摇动参数获取模块10具体还包括:
功能关闭单元,用于若所述当前界面为所述语音助手功能界面,则生成并输出是否关闭语音助手功能的提醒消息,并在接收到用户反馈的摇动确认指令时,关闭所述语音助手功能。
进一步地,所述语音助手开启装置还包括:
语音指令转化模块,用于在接收到用户输入的目标语音指令时,基于语音识别技术ASR,将所述目标语音指令转化成对应的目标文字指令;
文字指令转换模块,用于根据自然语言理解技术NLU,将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作。
进一步地,所述语音助手开启装置还包括:
命令执行模块,用于根据自然语言生成技术NLG以及所述目标终端执行所述目标终端命令对应操作的操作结果,生成目标语言文本结果指令;
结果输出模块,用于根据语音合成技术TTS,将所述目标语言文本结果指令转换为对应的目标语音执行结果,并输出所述目标语音执行结果。
其中,上述语音助手开启装置中各个模块的功能实现与上述语音助手开启方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有语音助手开启程序,所述语音助手开启程序被处理器执行时实现如以上任一项实施例所述的语音助手开启方法的步骤。
本发明计算机可读存储介质的具体实施例与上述语音助手开启方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音助手开启方法,其特征在于,所述语音助手开启方法包括:
在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;
判断所述终端摇动参数是否为符合摇动条件的有效参数;
在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。
2.如权利要求1所述的语音助手开启方法,其特征在于,所述终端摇动参数包括终端摇动轨迹,所述判断所述终端摇动参数是否为符合摇动条件的有效参数的步骤具体包括:
判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹为所述有效参数。
3.如权利要求2所述的语音助手开启方法,其特征在于,所述终端摇动参数包括摇动频率,所述判断所述终端摇动轨迹是否与所述摇动条件中的预设轨迹相匹配的步骤之后,还包括:
在所述终端摇动轨迹与所述预设轨迹相匹配,判断所述摇动频率是否与所述摇动条件中的预设频率相匹配,其中,与所述预设轨迹相匹配的终端摇动轨迹且与所述预设频率相匹配的终端摇动参数为所述有效参数。
4.如权利要求1所述的语音助手开启方法,其特征在于,所述在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数的步骤具体包括:
在检测到摇动信号时,获取所述目标终端的当前界面,并判断所述当前界面是否为语音助手功能界面;
若所述当前界面不是所述语音助手功能界面,则获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数。
5.如权利要求4所述的语音助手开启方法,其特征在于,所述在检测到摇动信号时,获取所述目标终端的当前界面,并判断所述当前界面是否为语音助手功能界面的步骤之后,还包括:
若所述当前界面为所述语音助手功能界面,则生成并输出是否关闭语音助手功能的提醒消息,并在接收到用户反馈的摇动确认指令时,关闭所述语音助手功能。
6.如权利要求1至5中任一项所述的语音助手开启方法,其特征在于,所述在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令的步骤之后,还包括:
在接收到用户输入的目标语音指令时,基于语音识别技术ASR,将所述目标语音指令转化成对应的目标文字指令;
根据自然语言理解技术NLU,将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作。
7.如权利要求6所述的语音助手开启方法,其特征在于,所述根据自然语言理解技术NLU,将所述目标文字指令转换为所述目标终端可识别的目标终端命令,以控制所述目标终端执行所述目标终端命令对应操作的步骤还包括:
根据自然语言生成技术NLG以及所述目标终端执行所述目标终端命令对应操作的操作结果,生成目标语言文本结果指令;
根据语音合成技术TTS,将所述目标语言文本结果指令转换为对应的目标语音执行结果,并输出所述目标语音执行结果。
8.一种语音助手开启装置,其特征在于,所述语音助手开启装置包括:
摇动参数获取模块,用于在检测到摇动信号时,获取目标终端的位置信息,并根据所述位置信息生成终端摇动参数;
摇动参数判断模块,用于判断所述终端摇动参数是否为符合摇动条件的有效参数;
助手功能开启模块,用于在所述终端摇动参数为所述有效参数时,开启语音助手功能,并启用语音识别系统,以接收用户语音指令。
9.一种语音助手开启设备,其特征在于,所述语音助手开启设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音助手开启程序,所述语音助手开启程序被所述处理器执行时实现如权利要求1至7中任一项所述的语音助手开启方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音助手开启程序,所述语音助手开启程序被处理器执行时实现如权利要求1至7中任一项所述的语音助手开启方法的步骤。
CN202011054712.3A 2020-09-29 2020-09-29 语音助手开启方法、装置、设备及可读存储介质 Pending CN112133305A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011054712.3A CN112133305A (zh) 2020-09-29 2020-09-29 语音助手开启方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011054712.3A CN112133305A (zh) 2020-09-29 2020-09-29 语音助手开启方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112133305A true CN112133305A (zh) 2020-12-25

Family

ID=73843247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011054712.3A Pending CN112133305A (zh) 2020-09-29 2020-09-29 语音助手开启方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112133305A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937863A (zh) * 2012-09-19 2013-02-20 北京小米科技有限责任公司 基于移动终端的应用程序控制方法、装置和一种移动终端
CN103309618A (zh) * 2013-07-02 2013-09-18 姜洪明 移动操作系统
CN104216351A (zh) * 2014-02-10 2014-12-17 美的集团股份有限公司 家用电器语音控制方法及系统
CN104380254A (zh) * 2014-06-11 2015-02-25 华为技术有限公司 快速启动应用服务的方法和终端
CN104978014A (zh) * 2014-04-11 2015-10-14 维沃移动通信有限公司 一种快速调用应用程序或系统功能的方法及其移动终端
CN105302596A (zh) * 2015-09-29 2016-02-03 努比亚技术有限公司 移动终端应用开启装置及方法
CN106251605A (zh) * 2016-09-22 2016-12-21 珠海格力电器股份有限公司 语音识别功能的启动方法、装置和系统及遥控器
CN111443803A (zh) * 2020-03-26 2020-07-24 捷开通讯(深圳)有限公司 模式切换方法、装置、存储介质及移动终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937863A (zh) * 2012-09-19 2013-02-20 北京小米科技有限责任公司 基于移动终端的应用程序控制方法、装置和一种移动终端
CN103309618A (zh) * 2013-07-02 2013-09-18 姜洪明 移动操作系统
CN104216351A (zh) * 2014-02-10 2014-12-17 美的集团股份有限公司 家用电器语音控制方法及系统
CN104978014A (zh) * 2014-04-11 2015-10-14 维沃移动通信有限公司 一种快速调用应用程序或系统功能的方法及其移动终端
CN104380254A (zh) * 2014-06-11 2015-02-25 华为技术有限公司 快速启动应用服务的方法和终端
CN105302596A (zh) * 2015-09-29 2016-02-03 努比亚技术有限公司 移动终端应用开启装置及方法
CN106251605A (zh) * 2016-09-22 2016-12-21 珠海格力电器股份有限公司 语音识别功能的启动方法、装置和系统及遥控器
CN111443803A (zh) * 2020-03-26 2020-07-24 捷开通讯(深圳)有限公司 模式切换方法、装置、存储介质及移动终端

Similar Documents

Publication Publication Date Title
US10832674B2 (en) Voice data processing method and electronic device supporting the same
EP3779969B1 (en) Electronic devices managing a plurality of intelligent agents
US11804224B2 (en) Electronic device and method for operation thereof
KR20200073733A (ko) 전자 장치의 기능 실행 방법 및 이를 사용하는 전자 장치
US11817082B2 (en) Electronic device for performing voice recognition using microphones selected on basis of operation state, and operation method of same
US11749271B2 (en) Method for controlling external device based on voice and electronic device thereof
EP3696660B1 (en) Method of providing speech recognition service and electronic device for same
US20200125603A1 (en) Electronic device and system which provides service based on voice recognition
US11151995B2 (en) Electronic device for mapping an invoke word to a sequence of inputs for generating a personalized command
CN110944056A (zh) 交互方法、移动终端及可读存储介质
KR20210044509A (ko) 음성 인식의 향상을 지원하는 전자 장치
EP3779963A1 (en) Voice recognition service operating method and electronic device supporting same
CN112684936A (zh) 一种信息识别方法、存储介质及计算机设备
KR20210061091A (ko) 인텔리전트 어시스턴스 서비스를 제공하기 위한 전자 장치 및 그의 동작 방법
CN112133305A (zh) 语音助手开启方法、装置、设备及可读存储介质
KR20200119531A (ko) 자연어 응답을 생성하는 전자 장치 및 자연어 응답 생성 방법
CN112542171A (zh) 使用语音识别功能执行动作的电子装置及其方法
CN111640429B (zh) 提供语音识别服务的方法和用于该方法的电子装置
US20220415325A1 (en) Electronic device and method for processing user input
US20220413988A1 (en) Electronic device and method for processing user input
CN114265542A (zh) 机器人的语音交互方法、装置和电子设备
US20220262391A1 (en) Electronic device and method for speech recognition processing of electronic device
CN117012189A (zh) 一种语音识别方法和电子设备
KR20220125566A (ko) 전자 장치 및 전자 장치의 기기 연결 방법
KR20200115259A (ko) 탈취된 사용자 발화를 검출하기 위한 전자 장치 및 그 동작 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination