CN110544473A

CN110544473A - 语音交互方法和装置

Info

Publication number: CN110544473A
Application number: CN201810523966.1A
Authority: CN
Inventors: 钱科明; 谢秋生; 邓译文; 薛志荣; 雷冬冬; 王金辉
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-05-28
Filing date: 2018-05-28
Publication date: 2019-12-06
Anticipated expiration: 2038-05-28
Also published as: US11238858B2; US20190362720A1; CN110544473B

Abstract

本申请提出一种语音交互方法和装置，其中，方法包括：在对应用程序的界面进行展示过程中，探测第一用户操作；响应于第一用户操作，根据界面所属的应用程序，查询应用程序关联的语音指令，以及查询系统通用语音指令；将应用程序关联的语音指令以及系统通用语音指令作为应用程序的适用语音指令；根据适用语音指令进行提示，以执行语音交互。该方法能够实现用户可以在应用程序的界面进行展示过程中，实时查询应用程序的适用语音指令，从而用户可以根据适用语音指令，执行语音交互过程，降低智能设备语音识别失败的概率。

Description

语音交互方法和装置

技术领域

本申请涉及语音交互技术领域，尤其涉及一种语音交互方法和装置。

背景技术

随着人工智能技术以及语音交互技术的不断发展，智能设备，例如智能机器人、终端设备等不断普及，越来越多的用户购买智能设备，通过输入语音命令，控制智能设备完成预设功能。

现有技术中，当用户输入语音命令的过程中，或者，当用户使用唤醒词对智能设备进行语音唤醒后，智能设备无任何语音指令提示，只有在用户输入完语音命令后，才有相关语音指令提示，从而用户可以根据相关语音指令提示，执行语音交互过程。

这种方式下，需要用户预先获知语音命令，并且记住语音命令，对用户的依赖程度较高。此外，由于语音命令/说法太多，用户输入正确的语音命令的概率较低，可能导致智能设备语音识别失败，从而不受控制的情况发生。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种语音交互方法，以实现用户可以在应用程序的界面进行展示过程中，实时查询应用程序的适用语音指令，从而用户可以根据适用语音指令，执行语音交互过程，降低智能设备语音识别失败的概率。此外，根据适用语音指令进行提示，不依赖于用户的主观认知程度，能够引导用户熟悉当前界面所属应用程序的适用语音指令，减少陌生感，并且能够引导用户使用应用程序的新功能，利于应用程序深度功能的展示和使用。

本申请的第二个目的在于提出一种语音交互装置。

本申请的第三个目的在于提出一种计算机设备。

本申请的第四个目的在于提出一种非临时性计算机可读存储介质。

本申请的第五个目的在于提出一种计算机程序产品。

为达上述目的，本申请第一方面实施例提出了一种语音交互方法，包括：

在对应用程序的界面进行展示过程中，探测第一用户操作；

响应于所述第一用户操作，根据所述界面所属的应用程序，查询所述应用程序关联的语音指令，以及查询系统通用语音指令；

将所述应用程序关联的语音指令以及系统通用语音指令作为所述应用程序的适用语音指令；

根据所述适用语音指令进行提示，以执行语音交互。

本申请实施例的语音交互方法，通过在对应用程序的界面进行展示过程中，探测第一用户操作，而后响应于第一用户操作，根据界面所属的应用程序，查询应用程序关联的语音指令，以及查询系统通用语音指令，将应用程序关联的语音指令以及系统通用语音指令作为应用程序的适用语音指令，最后根据适用语音指令进行提示，以执行语音交互。本申请中，用户可以在应用程序的界面进行展示过程中，实时查询应用程序的适用语音指令，从而用户可以根据适用语音指令，执行语音交互过程，降低智能设备语音识别失败的概率。此外，根据适用语音指令进行提示，不依赖于用户的主观认知程度，能够引导用户熟悉当前界面所属应用程序的适用语音指令，减少陌生感，并且能够引导用户使用应用程序的新功能，利于应用程序深度功能的展示和使用。

为达上述目的，本申请第二方面实施例提出了一种语音交互装置，包括：

探测模块，用于在对应用程序的界面进行展示过程中，探测第一用户操作；

查询模块，用于响应于所述第一用户操作，根据所述界面所属的应用程序，查询所述应用程序关联的语音指令，以及查询系统通用语音指令；

处理模块，用于将所述应用程序关联的语音指令以及系统通用语音指令作为所述应用程序的适用语音指令；

提示模块，用于根据所述适用语音指令进行提示，以执行语音交互。

本申请实施例的语音交互装置，通过在对应用程序的界面进行展示过程中，探测第一用户操作，而后响应于第一用户操作，根据界面所属的应用程序，查询应用程序关联的语音指令，以及查询系统通用语音指令，将应用程序关联的语音指令以及系统通用语音指令作为应用程序的适用语音指令，最后根据适用语音指令进行提示，以执行语音交互。本申请中，用户可以在应用程序的界面进行展示过程中，实时查询应用程序的适用语音指令，从而用户可以根据适用语音指令，执行语音交互过程，降低智能设备语音识别失败的概率。此外，根据适用语音指令进行提示，不依赖于用户的主观认知程度，能够引导用户熟悉当前界面所属应用程序的适用语音指令，减少陌生感，并且能够引导用户使用应用程序的新功能，利于应用程序深度功能的展示和使用。

为达上述目的，本申请第三方面实施例提出了一种计算机设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如本申请第一方面实施例提出的语音交互方法。

为了实现上述目的，本申请第四方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如本申请第一方面实施例提出的语音交互方法。

为了实现上述目的，本申请第五方面实施例提出了一种计算机程序产品，当所述计算机程序产品中的指令由处理器执行时，执行如本申请第一方面实施例提出的语音交互方法。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请实施例一所提供的语音交互方法的流程示意图；

图2为本申请实施例的语音输入界面示意图一；

图3为本申请实施例二所提供的语音交互方法的流程示意图；

图4为本申请实施例三所提供的语音交互方法的流程示意图；

图5为本申请实施例四所提供的语音交互方法的流程示意图；

图6为本申请实施例的语音输入界面示意图二；

图7为本申请实施例的应用场景示意图；

图8为本申请实施例五所提供的语音交互装置的结构示意图；

图9为本申请实施例六所提供的语音交互装置的结构示意图；

图10示出了适于用来实现本申请实施方式的示例性计算机设备的框图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

本申请主要针对现有技术中智能设备的语音交互功能对用户的依赖程度较高的技术问题，提出一种语音交互方法。

下面参考附图描述本申请实施例的语音交互方法和装置。

图1为本申请实施例一所提供的语音交互方法的流程示意图。

本申请实施例提供的语音交互方法，可以由本申请提供的语音交互装置实现，该语音交互装置可以被配置在智能设备中，以使该智能设备可以实现语音交互功能。

其中，智能设备可以为任意一种具有计算处理能力的设备、器械或者机器，例如智能设备可以为智能机器人，或者为其他设备(比如终端设备等)，对此不作限制。终端设备可以为手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。

如图1所示，该语音交互方法可以包括以下步骤：

步骤101，在对应用程序的界面进行展示过程中，探测第一用户操作。

本申请实施例中，应用程序是指可以运行在终端设备上、为用户提供任意服务的软件程序，例如为导航类应用程序、搜索类应用程序、娱乐类应用程序、拍照类应用程序等等。

本申请实施例中，第一用户操作为用户触发的，第一用户操作例如可以为用户触发语音输入控件的操作。具体地，应用程序的界面可以具有语音输入控件，用户可以通过触发语音输入控件，生成第一用户操作，比如用户可以单击语音输入控件，生成第一用户操作。

具体地，智能设备中可以设置监听器，在对应用程序的界面进行展示过程中，通过监听器对第一用户操作进行监听。当监听到用户触发第一用户操作时，可以触发步骤102，而当未监听到第一用户操作时，可以继续执行步骤101，直到监听到第一用户操作时，触发步骤102。

步骤102，响应于第一用户操作，根据界面所属的应用程序，查询应用程序关联的语音指令，以及查询系统通用语音指令。

步骤103，将应用程序关联的语音指令以及系统通用语音指令作为应用程序的适用语音指令。

本申请实施例中，每个应用程序均具有与自身关联的语音指令，例如，对于搜索类应用程序，比如浏览器而言，当用户打开浏览器时，用户可能具有打开预设链接的需求，因此，与浏览器关联的语音指令可以为：打开预设链接、访问预设链接、打开收藏夹、打开历史记录等等。或者，对于娱乐类应用程序，比如音乐播放器而言，当用户打开音乐播放器时，用户可能具有听音乐的需求，因此，与音乐播放器关联的语音指令可以为：播放预设歌曲、循环播放预设歌曲、下载预设歌曲、查看推荐榜单等等。

系统通用的语音指令可以为各个应用程序均适用的语音指令，例如可以为：打开预设应用程序、关闭预设应用程序、退出预设应用程序等等。

本申请实施例中，在探测到第一用户操作时，语音交互装置可以响应于第一用户操作，根据界面所属的应用程序，查询应用程序关联的语音指令，以及查询系统通用语音指令，将应用程序关联的语音指令以及系统通用语音指令作为应用程序的适用语音指令。

可以理解的是，当界面所属的应用程序不同时，应用程序关联的语音指令不同，因此，应用程序的适用语音指令也是不同的。举例而言，当界面所属的应用程序为浏览器时，浏览器的适用语音指令可以为：打开预设链接、访问预设链接、打开收藏夹、打开历史记录、关闭浏览器、退出浏览器等等，而当界面所属的应用程序为音乐播放器时，音乐播放器的适用语音指令可以为：播放预设歌曲、循环播放预设歌曲、下载预设歌曲、查看推荐榜单、播放预设歌曲的MV、关闭音乐播放器、退出音乐播放器等等。

步骤104，根据适用语音指令进行提示，以执行语音交互。

本申请实施例中，在确定界面所属的应用程序的适用语音指令后，可以根据适用语音指令进行提示，以执行语音交互。由此，用户可以在应用程序的界面进行展示过程中，实时查询应用程序的适用语音指令，从而用户可以根据适用语音指令，执行语音交互过程。

作为一种可能的实现方式，为了便于用户实时查看适用语音指令，可以将适用语音指令以文字的形式在界面进行展示，以使用户根据界面上展示的文字，生成相应语音命令，执行语音交互过程。

当然，也可以将适用语音指令以语音的形式进行播报，从而用户可以根据智能设备播报的内容，生成相应语音命令，执行语音交互过程。

作为一种应用场景，当应用程序为音乐播放器时，当用户触发音乐播放器的界面上的语音输入按键后，可以跳转到如图2所示的语音输入界面，在语音输入界面上可以以文字的形式，展示音乐播放器的适用语音指令，从而用户可以根据展示的文字，触发语音输入按键21，生成相应语音指令，执行语音交互过程。

作为一种可能的实现方式，为了实现在用户进行语音输入时，可以具有相关语音指令的提示，本申请中，参见图3，在图1所示实施例的基础上，在步骤103之后，该语音交互方法还可以包括以下步骤：

步骤201，若探测到用于语音输入的第二用户操作，响应于第二用户操作，从适用语音指令中，选取推荐语音指令。

本申请实施例中，第二用户操作为用户触发的，第二用户操作例如可以为用户触发语音输入控件，具体地，用户可以通过触发语音输入控件，生成第二用户操作，比如用户可以长按语音输入控件，生成第二用户操作。或者，第二用户操作可以为用户语音输入唤醒词，具体地，智能设备中可以设置有采集用户语音的模块，用户可以通过该模块输入唤醒词，生成第二用户操作，对此不作限制。

具体地，可以通过智能设备中设置的监听器，监听第二用户操作，当监听到用户触发的用于语音输入的第二用户操作时，例如用户长按语音输入控件时，或者用户语音输入唤醒词时，可以从适用语音指令中，选取推荐语音指令。

作为一种可能的实现方式，可以查询适用语音指令的使用次数，根据使用次数，从适用语音指令中，选取推荐语音指令。例如，可以将使用次数超过预设阈值的适用语音指令，作为推荐语音指令，或者，可以将适用语音指令按照使用次数的高低依次进行排序，按序选取预设个数的适用语音指令，作为推荐语音指令。由此，可以实现向用户提示常用语音指令，从而实现有针对性地向用户进行提示，提升用户的语音交互体验。

其中，预设阈值和预设个数可以由智能设备的内置程序预先设置，或者，也可以由用户进行设置，对此不作限制。

作为另一种可能的实现方式，可以查询新增各适用语音指令的软件更新版本，而后根据软件更新版本，从适用语音指令中，选取最近新增的适用语音指令作为推荐语音指令。从而可以引导用户使用应用程序的新功能，利于应用程序深度功能的展示和使用。

举例而言，当界面所属的应用程序为游戏类应用程序时，假设该应用程序的最新版本中的游戏角色新增了某项装备，因此，为了便于用户及时获知新增的装备，推荐语音指令可以为：展示新增装备、新增装备等。

步骤202，根据推荐语音指令进行提示。

本申请实施例中，在确定推荐语音指令后，可以根据推荐语音指令进行提示。

作为一种可能的实现方式，为了便于用户实时查看推荐语音指令，可以将推荐语音指令以文字的形式在界面进行展示，以使用户根据界面上展示的文字，生成相应语音命令，执行语音交互过程。

当然，也可以将推荐语音指令以语音的形式进行播报，从而用户可以根据智能设备播报的内容，生成相应语音命令，执行语音交互过程。

作为一种可能的实现方式，在选取最近新增的适用语音指令作为推荐语音指令之前，还可以根据各软件更新版本的版本号，确定最近新增的适用语音指令，确定将最近新增的适用语音指令作为推荐语音指令进行提示的次数不大于阈值次数。

其中，阈值次数例如可以为智能设备的内置程序预先设置的，或者，阈值次数可以由用户进行设置，例如阈值次数可以为3次。

可以理解的是，当最近新增的适用语音指令作为推荐语音指令进行提示的次数大于阈值次数时，可能发生用户已经熟记推荐语音指令的情况，此时，将推荐语音指令推荐给用户已经没有任何意义，用户对该推荐语音指令已经不感兴趣，因此，本申请中，可以判断将最近新增的适用语音指令作为推荐语音指令进行提示的次数是否大于阈值次数，若是，则不选取其作为推荐语音指令进行提示，若否，则选取其作为推荐语音指令进行提示。

作为一种可能的实现方式，为了提升用户成功输入适用语音指令的概率，本申请中，参见图4，在图3所示实施例的基础上，该语音交互方法还可以包括以下步骤：

步骤301，获取到用户语音后，将用户语音与适用语音指令匹配。

本申请实施例中，在获取到用户语音后，可以将用户语音与适用语音指令匹配。例如，可以对用户语音进行分析，得到各音节，而后将各音节与适用语音指令中的相应音节进行比对，以确定用户语音是否与适用语音指令匹配。

其中，可以利用预先训练的声学模型，对用户语音进行识别，得到各音节。具体地，可以预先获取大量语音数据，作为训练样本，而后对训练样本中的各音节进行标注，利用标注后的训练样本对声学模型进行训练。在确定用户语音后，可以将用户语音输入至训练后的声学模型，获取用户语音的各音节。

步骤302，若与适用语音指令不匹配，则根据推荐语音指令进行提示。

本申请实施例中，当用户语音与适用语音指令不匹配时，则根据推荐语音指令进行提示，从而可以引导用户根据提示，重新生成相应语音命令，执行语音交互过程。若与适用语音指令匹配，则在界面上显示智能设备执行适用语音指令后的界面，以及与当前界面相关的语音指令。举例而言，当适用语音指令为：播放歌曲A时，此时，可以播放歌曲A，并在界面上显示歌曲A相关的信息。

本申请实施例中，通过获取到用户语音后，将用户语音与适用语音指令匹配，若与适用语音指令不匹配，根据推荐语音指令进行提示。由此，可以提升用户输入适用语音指令的成功率，从而提升智能设备识别用户语音的成功率。

作为一种可能的实现方式，参见图5，在图1-图4所示实施例的基础上，根据适用语音指令进行提示，具体包括以下步骤：

步骤401，查询探测到第一用户操作之前，已探测到的非语音操作。

本申请实施例中，非语音操作为用户触发的，非语音操作例如可以为触控、按键等操作，比如可以为用户启动预设应用程序、关闭预设应用程序、退出预设应用程序、手动点击预设应用程序中的预设功能等等。

本申请实施例中，可以判断在探测到第一用户操作之前，是否已探测到用户触发的非语音操作，若是，则执行步骤402。

步骤402，根据非语音操作，从适用语音指令中确定对应的目标语音指令。

本申请实施例中，当语音交互装置已探测到用户触发的非语音操作时，可以根据非语音操作，从适用语音指令中确定对应的目标语音指令。

举例而言，当非语音操作为：用户手动启动应用程序A时，则根据非语音操作，可以确定对应的目标语音指令为系统通用语音指令中的：打开应用程序A。

步骤403，展示适用语音指令，并对目标语音指令进行标注。

本申请实施例中，在确定非语音操作对应的目标语音指令后，可以展示适用语音指令，并对目标语音指令进行标注。由此，可以实现在用户执行触控或者按键操作后，提示用户可以执行的目标语音指令，从而用户可以使用目标语音指令代替该触控或者按键操作，提升用户的使用体验。

作为一种示例，参见图6，当非语音操作为：用户点击播放歌曲A时，则根据非语音操作，可以确定对应的目标语音指令为应用程序关联的语音指令中的：播放歌曲A，则可以对界面上显示的<播放歌曲A>进行标注，例如可以对<播放歌曲A>进行加粗和放大显示，或者还可以改变字形等，以进行醒目显示，从而在用户执行触控或者按键操作后，提示用户可以执行的语音指令，以便用户使用目标语音指令代替该触控或者按键操作，提升用户的使用体验。

作为一种应用场景，参见图7，图7为本申请实施例的应用场景示意图。当用户单击任一应用程序中的语音输入控件(语音按键)时，可以在界面上显示应用程序的适用语音指令，从而用户可以实时查询应用程序的适用语音指令，根据适用语音指令，执行语音交互过程，降低智能设备语音识别失败的概率。

当用户长按语音按键，等待语音输入时，或者，用户语音输入唤醒词时，可以在界面上显示推荐语音指令/常用语音指令，从而可以实现有针对性地向用户进行提示，提升用户的语音交互体验。

当用户完成语音输入时，可以将用户语音与适用语音指令进行匹配，若与适用语音指令不匹配，则在界面上显示推荐语音指令/常用语音指令，若与适用语音指令匹配，则在界面上显示智能设备执行语音指令后的界面，以及与当前界面相关的语音指令。

为了实现上述实施例，本申请还提出一种语音交互装置。

图8为本申请实施例五所提供的语音交互装置的结构示意图。

如图8所示，该语音交互装置100包括：探测模块101、查询模块102、处理模块103，以及提示模块104。其中，

探测模块101，用于在对应用程序的界面进行展示过程中，探测第一用户操作。

查询模块102，用于响应于第一用户操作，根据界面所属的应用程序，查询应用程序关联的语音指令，以及查询系统通用语音指令。

处理模块103，用于将应用程序关联的语音指令以及系统通用语音指令作为应用程序的适用语音指令。

提示模块104，用于根据适用语音指令进行提示，以执行语音交互。

进一步地，在本申请实施例的一种可能的实现方式中，参见图9，在图8所示实施例的基础上，该语音交互装置100还可以包括：

选取模块105，用于在将应用程序关联的语音指令以及系统通用语音指令作为应用程序的适用语音指令之后，若探测到用于语音输入的第二用户操作，响应于第二用户操作，从适用语音指令中，选取推荐语音指令。

作为一种可能的实现方式，选取模块105，具体用于查询适用语音指令的使用次数；根据使用次数，从适用语音指令中，选取推荐语音指令。

作为另一种可能的实现方式，选取模块105，具体用于查询新增各适用语音指令的软件更新版本；根据软件更新版本，从适用语音指令中，选取最近新增的适用语音指令作为推荐语音指令。

可选地，选取模块105，还用于在根据软件更新版本，从适用语音指令中，选取最近新增的适用语音指令作为推荐语音指令之前，根据各软件更新版本的版本号，确定最近新增的适用语音指令；确定将最近新增的适用语音指令作为推荐语音指令进行提示的次数不大于阈值次数。

提示模块104，还用于根据推荐语音指令进行提示。

匹配模块106，用于在获取到用户语音后，将用户语音与适用语音指令匹配。

提示模块104，还用于在与适用语音指令不匹配时，根据推荐语音指令进行提示。

作为一种可能的实现方式，提示模块104，具体用于查询探测到第一用户操作之前，已探测到的非语音操作；根据非语音操作，从适用语音指令中确定对应的目标语音指令；展示适用语音指令，并对目标语音指令进行标注。

需要说明的是，前述对语音交互方法实施例的解释说明也适用于该实施例的语音交互装置100，此处不再赘述。

为了实现上述实施例，本申请还提出一种计算机设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如本申请前述实施例提出的语音交互方法。

为了实现上述实施例，本申请还提出一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如本申请前述实施例提出的语音交互方法。

为了实现上述实施例，本申请还提出一种计算机程序产品，当所述计算机程序产品中的指令由处理器执行时，执行如本申请前述实施例提出的语音交互方法。

图10示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图10显示的计算机设备12仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图10所示，计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture；以下简称：ISA)总线，微通道体系结构(Micro Channel Architecture；以下简称：MAC)总线，增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation；以下简称：VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection；以下简称：PCI)总线。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory；以下简称：RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图10未显示，通常称为“硬盘驱动器”)。尽管图10中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如：光盘只读存储器(Compact Disc Read OnlyMemory；以下简称：CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory；以下简称：DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机设备12交互的设备通信，和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network；以下简称：LAN)，广域网(Wide Area Network；以下简称：WAN)和/或公共网络，例如因特网)通信。如10图所示，网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白，尽管图10中未示出，可以结合计算机设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现前述实施例中提及的语音交互方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种语音交互方法，其特征在于，所述方法包括以下步骤：

在对应用程序的界面进行展示过程中，探测第一用户操作；

根据所述适用语音指令进行提示，以执行语音交互。

2.根据权利要求1所述的语音交互方法，其特征在于，所述将所述应用程序关联的语音指令以及系统通用语音指令作为所述应用程序的适用语音指令之后，还包括：

若探测到用于语音输入的第二用户操作，响应于所述第二用户操作，从所述适用语音指令中，选取推荐语音指令；

根据所述推荐语音指令进行提示。

3.根据权利要求2所述的语音交互方法，其特征在于，从所述适用语音指令中，选取推荐语音指令，包括：

查询所述适用语音指令的使用次数；

根据所述使用次数，从所述适用语音指令中，选取推荐语音指令。

4.根据权利要求2所述的语音交互方法，其特征在于，从所述适用语音指令中，选取推荐语音指令，包括：

查询新增各所述适用语音指令的软件更新版本；

根据所述软件更新版本，从所述适用语音指令中，选取最近新增的适用语音指令作为所述推荐语音指令。

5.根据权利要求4所述的语音交互方法，其特征在于，所述根据所述软件更新版本，从所述适用语音指令中，选取最近新增的适用语音指令作为所述推荐语音指令之前，还包括：

根据各软件更新版本的版本号，确定最近新增的适用语音指令；

确定将所述最近新增的适用语音指令作为所述推荐语音指令进行提示的次数不大于阈值次数。

6.根据权利要求2所述的语音交互方法，其特征在于，所述方法还包括：

获取到用户语音后，将所述用户语音与所述适用语音指令匹配；

若与所述适用语音指令不匹配；

根据所述推荐语音指令进行提示。

7.根据权利要求1-6任一项所述的语音交互方法，其特征在于，所述根据所述适用语音指令进行提示，包括：

查询探测到所述第一用户操作之前，已探测到的非语音操作；

根据所述非语音操作，从所述适用语音指令中确定对应的目标语音指令；

展示所述适用语音指令，并对所述目标语音指令进行标注。

8.一种语音交互装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如权利要求1-7中任一所述的语音交互方法。

10.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的语音交互方法。

11.一种计算机程序产品，其特征在于，当所述计算机程序产品中的指令由处理器执行时，执行如权利要求1-7中任一所述的语音交互方法。