CN106384591A

CN106384591A - 一种与语音助手应用交互的方法和装置

Info

Publication number: CN106384591A
Application number: CN201610968785.0A
Authority: CN
Inventors: 宋杰美
Original assignee: LeTV Holding Beijing Co Ltd; LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Current assignee: LeTV Holding Beijing Co Ltd; LeTV Mobile Intelligent Information Technology Beijing Co Ltd
Priority date: 2016-10-27
Filing date: 2016-10-27
Publication date: 2017-02-08

Abstract

本发明实施例提出一种与语音助手应用交互的方法和装置，方法包括：响应语音指令，比较所述语音指令识别后的语音识别文本与预设文本是否一致或所述语音指令与预设语音指令是否一致；若一致，获取所述预设文本或所述预设语音指令对应的播放内容；所述预设文本或所述预设语音指令至少为一个，所述预设文本或所述预设语音指令与所述播放内容之间预先建立有对应关系；在显示屏上播放所述播放内容。本发明实施例使当用户对语音助手应用发出语音指令时，语音助手应用会给用户一个友好的回应，增加了使用移动终端上的语音助手应用的趣味性，使语音助手应用的使用方式多样化，提高了用户体验。

Description

一种与语音助手应用交互的方法和装置

技术领域

本发明涉及电子领域，尤其涉及一种与语音助手应用交互的方法和装置。

背景技术

随着语音识别技术的提升，语音助手应用逐渐被越来越多的用户使用，使用语音输入使用户不需要费力的打字，而且也能够提高输入速度。

发明人在实现发明实施例的过程中发现，不同应用提供商提供的语音助手应用的使用方法都大概相似，如：打开语音助手应用，出现语音助手应用的主页或者语音输入界面，等待用户输入语音。

当前的语音助手应用提供的都是一样的开启模式和一样的语音输入模式，没有提供多样化的使用方式。

发明内容

基于以上问题，本发明实施例提出一种与语音助手应用交互的方法和装置，本发明实施例通过获取与语音指令对应的播放内容并播放的方式，使用户在对移动终端上的语音助手应用发出语音指令时，语音助手应用会给用户一个友好的回应(即播放内容)，增加了用户使用语音助手应用的趣味性，使语音助手应用的使用方式多样化，提高了用户体验。

一方面，本发明实施例提出一种与语音助手应用交互的方法，包括：

响应语音指令，比较所述语音指令识别后的语音识别文本与预设文本是否一致或所述语音指令与预设语音指令是否一致；

若一致，获取所述预设文本或所述预设语音指令对应的播放内容；所述预设文本或所述预设语音指令至少为一个，所述预设文本或所述预设语音指令与所述播放内容之间预先建立有对应关系；

在显示屏上播放所述播放内容。

可选的，在比较所述语音指令识别后的语音识别文本与预设文本是否一致之前，还包括：

比较所述语音识别文本的字数是否小于预设字数阈值；

所述比较所述语音指令识别后的语音识别文本与预设文本是否一致为：若小于，则比较所述语音识别文本与所述预设文本是否一致。

可选的，在比较所述语音指令与预设语音指令是否一致之前还包括：

比较所述语音指令的语音长度是否小于预设语音长度；

所述比较所述语音指令与预设语音指令是否一致为：

若小于，则比较所述语音指令与预设语音指令是否一致。

可选的，所述预设文本或所述预设语音指令的类型包括情感类型和/或问候类型。

可选的，所述播放内容包括图片和/或声音。

可选的，所述图片包括：静态图片和/或动态图片。

可选的，所述播放内容还包括：交互界面，所述交互界面包含至少一个交互项，所述交互项用于与用户进行交互操作。

另一方面，本发明实施例提出一种与语音助手应用交互的装置，包括：

第一比较模块，用于响应语音指令，比较所述语音指令识别后的语音识别文本与预设文本是否一致或所述语音指令与预设语音是否指令一致；

获取模块，用于获取所述预设文本或所述预设语音指令对应的播放内容，所述预设文本或所述预设语音指令至少为一个，所述预设文本或所述预设语音指令与所述播放内容之间预先建立有对应关系；

显示模块，用于在显示屏上播放所述播放内容。

可选的，所述装置还包括：

第二比较模块，用于在比较所述语音指令识别后的语音识别文本与预设文本是否一致之前，比较所述语音识别文本的字数是否小于预设字数阈值；

则所述第一比较模块用于：若小于，则比较所述语音指令识别后的语音识别文本与所述预设文本是否一致。

可选的，所述装置还包括：

第三比较模块，用于在比较所述语音指令与预设语音指令是否一致之前，比较所述语音指令的语音长度是否小于预设语音长度；

则第一比较模块用于：若小于，则比较所述语音指令与所述预设语音指令是否一致。

采用上述技术方案，具有以下有益效果：

本发明实施例通过获取与语音指令对应的播放内容并播放的方式，使用户在对移动终端上的语音助手应用发出语音指令时，语音助手应用会给用户一个友好的回应(即播放内容)，增加了用户使用语音助手应用的趣味性，使语音助手应用的使用方式多样化，提高了用户体验。

附图说明

图1是根据本发明一个实施例的与语音助手应用交互的方法的流程图；

图2是根据本发明另一个实施例的交互界面的示意图；

图3是根据本发明另一个实施例的与语音助手应用交互的方法的流程图；

图4是根据本发明另一个实施例的与语音助手应用交互的装置的框图；

图5是根据本发明的另一个实施例的电子设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1，本发明实施例提出一种与语音助手应用交互的方法，语音助手应用可以预先安装在移动终端上，语音助手应用用于识别用户输入的语音并根据语音执行拨打电话、发送短信或数据搜索等功能。例如该方法的执行主体可以为移动终端，移动终端可以为手机、平板电脑、智能手表和笔记本电脑等电子设备，该方法例如可以包括：

步骤S001，响应语音指令，比较语音指令识别后的语音识别文本与预设文本是否一致或语音指令与预设语音指令是否一致；

步骤S002，若一致，获取预设文本或预设语音指令对应的播放内容；预设文本或预设语音指令至少为一个，预设文本或预设语音指令与播放内容之间预先建立有对应关系；

步骤S003，在显示屏上播放播放内容。

需要说明的是，移动终端除了能将输入的语音指令转为文字以外，还包括很多其它功能：如直接将转换后的文字作为短信、邮件、微博或微信等信息发送出去，也可以将转化后的文字作为用户的问题并根据用户的问题提供答案，如：用户输入语音指令“今天天气如何”，移动终端将语音指令转为文字后，通过在网络搜索得到今天的天气预报信息，将天气预报信息显示给用户或者将天气预报信息生成语音播放语音给用户。

以在手机上使用语音助手为例进行说明。

在步骤S001中，首先在接收到用户输入的语音指令之后，可以对语音指令进行文字识别，获得语音识别文本，判断该语音识别文本与预设文本是否一致，在步骤S002中，若一致，则获取与预设文本对应的播放内容。预设文本可以包括以下文本，如：“您好”、“我爱你”或“和你永远在一起”。

获取语音识别文本后，判断语音识别文本的字数是否大于或等于预设字数阈值，若大于，则认为不需要进一步与预设文本进行比较，直接舍弃，从而实现通过简单的预判断即可以将无效的语音指令过滤掉的目的，节约了与预设文本进行比较所需的时间和内存。

或者对语音指令与预设语音指令比较，若一致，则认为语音指令为有效指令，获取预设语音指令对应的播放内容。预设语音指令为预先设置在手机中的语音指令，如预设语音指令为“您好”、“Hello”、“我爱你”、“我想你”或“和你永远在一起”。

播放内容包括但不限于以下任意一种或任意多种的组合：图片、声音、图片与声音结合、交互界面。其中，图片包括静态图片和/或动态图片，声音包括语音和/或音乐。

在本发明的一个实施例中，在对语音指令进行文字识别之后，且在判断该语音识别文本与预设文本是否一致之前，也可以先对该语音识别文本的字数进行判断，如果语音识别文本的字数大于或等于预设字数阈值，则认为该语音指令为无效的语音指令，不需要进一步与预设文本进行比较，可直接舍弃，从而实现通过简单的预判断即可以将无效的语音指令过滤掉的目的，节约了时间和内存，提高了移动终端的处理速度。

在本发明的另一个实施例中，在比较语音指令与预设语音指令是否一致之前还包括：比较语音指令的语音长度是否小于预设语音长度；若小于，则比较语音指令与预设语音指令是否一致。语音指令的语音长度为语音指令的时长，例如：语音指令的语音长度为30秒，而预设语音长度为60秒，则语音指令的语音长度小于预设语音长度，之后才进一步比较语音指令与预设语音指令是否一致。

预设语音指令或预设文本存储在语音助手应用的存储区域中。预设语音指令或预设文本与播放内容对应存储在语音助手应用的存储区域，预设语音指令或预设文本与播放内容为一一映射关系或者为一对多的映射关系。以一维数组或二维数组的方式存储预设语音指令与播放内容，或者通过其它数据存储方式存储预设语音指令与播放内容。其中，多个预设语音指令通过预设语音指令库来保存。

在其中的一个实施例中，当用户输入的输入语音指令为“我爱你”，手机系统接收到输入的语音指令后，先通过对输入的语音指令的长度或输入语音指令转为文字的字数进行检测，检测该语音指令是否为有效的语音指令，若检测为有效的语音指令，再将输入的语音指令与预设语音指令进行比较，当比较得到预设语音指令“我爱你”与输入语音指令一致时，在存储预设语音指令与播放内容的存储区域，根据二者的映射关系，找到“我爱你”对应的播放内容，如播放内容为一个带有鲜花与爱心的图片和一段浪漫的音乐。

当播放内容为交互界面时，如游戏交互界面时，用户可以对游戏交互界面的交互项进行操作，如点击一个爆竹图案的交互项，则会出现烟花效果。参照图2,游戏交互界面20上面包括至少一个交互项201。

如果播放内容为一组静态图片和一个音乐文件，当播放该播放内容时，以播放PPT的方式播放一组静态图片，同时播放该音乐文件。

在步骤S003中，在显示屏上播放播放内容。

当找到播放内容以后，在语音助手应用的显示界面上播放播放内容。如播放内容为动态图片和一个音乐文件，则显示该动态图片，同时播放该音乐文件。

在本发明实施例中，若语音指令与预设语音指令一致或者语音指令识别后的语音识别文本与预设文本一致，还可以检测语音助手应用是否开启，若未开启，则开启语音助手应用，并获取预设语音指令对应的播放内容。若开启，则直接获取预设语音指令对应的播放内容。

可以理解的，当语音助手应用未开启时，若输入的语音指令与预设语音指令一致或者语音指令识别后的语音识别文本与预设文本一致，则直接将语音助手应用开启，通过输入的语音指令将语音助手应用自动开启，使用户不需要手动去开启语音助手应用，方便了用户操作，给用户方便的用户体验。

在本发明实施例中，预设文本、预设语音指令的类型包括情感类型和/或问候类型。当用户将移动终端的语音助手应用作为一个朋友去交流时，更多的倾向使用情感类或问候类的语音，使语音助手应用对于用户来说，不只是一个应用，而是带给用户更多的亲切感。情感类的预设语音指令如：“我爱你”、“我想你”或“和你永远在一起”。问候类的预设语音指令如：“您好”、“hello”或“早上好”。

其中，播放内容包括：图片和/或声音，图片包括：静态图片或动态图片。

可以理解的，通过图片、声音或二者结合的方式给用户一个回馈，使用户身心感到愉悦，起到了良好的沟通作用。图片可以为从网络下载的图片或者用户自己绘制的图片。

另外，播放内容还包括：交互界面，交互界面提供至少一个交互项。在交互界面上提供交互项，使用户可以通过交互项与语音助手应用进行交互，不同的交互项提供不同的交互效果。如点击一个种子交互项，出现一束鲜花。

参照图3，说明本发明一个实施例的流程。

步骤S301，响应语音指令，比较语音指令识别后的语音识别文本的字数是否小于预设字数阈值或者比较语音指令的语音长度是否小于预设语音长度；

步骤S302，若语音识别文本的字数小于预设字数阈值或者语音指令的语音长度小于预设语音长度，则比较语音识别文本与预设文本是否一致或语音指令与预设语音指令是否一致，若一致，则获取预设文本或预设语音指令对应的播放内容；预设文本或预设语音指令至少为一个，预设文本或预设语音指令与播放内容之间预先建立有对应关系；

步骤S303，获取到的播放内容为一组静态图片和一个音乐文件；

步骤S304，以播放PPT的方式播放这组静态图片，同时播放音乐文件。

参照图4，本发明实施例提出一种与语音助手应用交互的装置，包括：

第一比较模块401，用于响应语音指令，比较语音指令识别后的语音识别文本与预设文本是否一致或语音指令与预设语音是否指令一致；

获取模块402，用于获取预设文本或预设语音指令对应的播放内容，预设文本或预设语音指令至少为一个，预设文本或预设语音指令与播放内容之间预先建立有对应关系；

显示模块403，用于在显示屏上播放播放内容。

本发明实施例通过响应和判断语音指令，去获取播放内容并播放的方式，使当用户对移动终端发出语音指令时，移动终端的语音助手应用会给用户一个友好的回应，增加了使用移动终端上的语音助手应用的趣味性，使语音助手应用的使用方式多样化，提高了用户体验。

可选地，装置还包括第一判断模块，用于在判断对语音指令识别后的语音识别文本与预设文本一致之前，判断语音识别文本的字数是否小于预设字数阈值，若小于，则进一步判断语音识别文本与预设文本是否一致。

可选地，装置还包括第二判断模块，用于在判断语音指令与预设语音指令一致之前，判断语音指令的语音长度是否小于预设语音长度，若小于，则进一步判断语音指令与预设语音指令是否一致。

可选地，预设文本或预设语音指令的类型包括情感类型和/或问候类型。

可选地，播放内容包括图片和/或声音。

可选地，图片包括：静态图片和/或动态图片。

可选地，播放内容还包括：交互界面，交互界面包含至少一个交互项。

如图5所示，本发明实施例还提出一种电子设备，包括：

至少一个处理器710；以及，

与所述至少一个处理器通信连接的存储器720；其中，

所述存储器存储可被所述一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

在显示屏上播放所述播放内容。

另外，该电子设备还可以包括：输入装置和输出装置。

处理器710、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接，图5中以通过总线750连接为例。

存储器720作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的视频加载方法对应的程序指令/模块。处理器710通过运行存储在存储器720中的非易失性软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例的视频加载方法。

存储器720可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据视频加载装置的使用所创建的数据等。此外，存储器720可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器720可选包括相对于处理器710远程设置的存储器，这些远程存储器可以通过网络连接至视频加载装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置730可接收输入的数字或字符信息，以及产生与视频加载装置的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。

所述一个或者多个模块存储在所述存储器720中，当被所述一个或者多个处理器710执行时，执行上述任意方法实施例中的方法。

上述产品可执行本申请实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请实施例所提供的方法。

本发明实施例的电子设备以多种形式存在，包括但不限于：

(1)移动通信设备：这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括：智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括：PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备：这类设备可以显示和播放多媒体内容。该类设备包括：音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)服务器：提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、系统总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

本发明实施例还提出一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，当计算机执行所述计算机指令时，用于执行：

在显示屏上播放所述播放内容。

本发明实施例还提出一种计算机程序产品，其包括计算机可读介质，所述计算机可读介质包括：第一组代码，响应语音指令，比较所述语音指令识别后的语音识别文本与预设文本是否一致或所述语音指令与预设语音指令是否一致；第二组代码，若一致，获取所述预设文本或所述预设语音指令对应的播放内容；所述预设文本或所述预设语音指令至少为一个，所述预设文本或所述预设语音指令与所述播放内容之间预先建立有对应关系；第三组代码，在显示屏上播放所述播放内容。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种与语音助手应用交互的方法，其特征在于，包括：

在显示屏上播放所述播放内容。

2.根据权利要求1所述的与语音助手应用交互的方法，其特征在于：在比较所述语音指令识别后的语音识别文本与预设文本是否一致之前，还包括：

比较所述语音识别文本的字数是否小于预设字数阈值；

3.根据权利要求1所述的与语音助手应用交互的方法，其特征在于：在比较所述语音指令与预设语音指令是否一致之前还包括：

比较所述语音指令的语音长度是否小于预设语音长度；

所述比较所述语音指令与预设语音指令是否一致为：若小于，则比较所述语音指令与预设语音指令是否一致。

4.根据权利要求1至3任一项所述的与语音助手应用交互的方法，其特征在于：所述预设文本或所述预设语音指令的类型包括情感类型和/或问候类型。

5.根据权利要求1至3任一项所述的与语音助手应用交互的方法，其特征在于：所述播放内容包括图片和/或声音。

6.根据权利要求5所述的与语音助手应用交互的方法，其特征在于：所述图片包括：静态图片和/或动态图片。

7.根据权利要求5所述的与语音助手应用交互的方法，其特征在于：所述播放内容还包括：交互界面，所述交互界面包含至少一个交互项，所述交互项用于与用户进行交互操作。

8.一种与语音助手应用交互的装置，其特征在于，包括：

显示模块，用于在显示屏上播放所述播放内容。

9.根据权利要求8所述的与语音助手应用交互的装置，其特征在于：所述装置还包括：

10.根据权利要求8所述的与语音助手应用交互的装置，其特征在于：所述装置还包括：