CN107342083A

CN107342083A - 用于提供语音服务的方法和装置

Info

Publication number: CN107342083A
Application number: CN201710543537.6A
Authority: CN
Inventors: 周建亮; 沈光昊; 吴芮生
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Shanghai Xiaodu Technology Co Ltd
Priority date: 2017-07-05
Filing date: 2017-07-05
Publication date: 2017-11-10
Anticipated expiration: 2037-07-05
Also published as: US11360737B2; JP6582100B2; CN107342083B; US20190012138A1; JP2019050554A

Abstract

本申请公开了用于提供语音服务的方法和装置。该方法的一具体实施方式包括：接收设备发送的请求信息，其中，请求信息包括第一事件信息和语音信息，其中，第一事件信息用于指示发送请求信息时设备所发生的第一事件，其中，第一事件信息包括用于指示用户输入语音信息的语音输入事件信息；基于第一事件信息和语音信息，生成针对设备的、包括操作指令的响应信息；发送响应信息至所针对的设备，以供所针对的设备执行操作指令所指示的操作。该实施方式提高了提供语音服务的效率。

Description

用于提供语音服务的方法和装置

技术领域

本申请涉及计算机技术领域，具体涉及人工智能领域，尤其涉及用于提供语音服务的方法和装置。

背景技术

随着计算机技术的发展和网络数据的不断积累，人工智能技术飞速发展。在人工智能领域中，集语音识别、自然语言处理以及机器学习技术于一身的智能语音服务具有越来越广泛的应用。

然而，现有的语音服务方式，存在着效率较低问题。

发明内容

本申请的目的在于提出一种改进的用于提供语音服务的方法和装置，来解决以上背景技术部分提到的技术问题。

第一方面，本申请实施例提供了一种用于提供语音服务的方法，上述方法包括：接收设备发送的请求信息，其中，上述请求信息包括第一事件信息和语音信息，其中，第一事件信息用于指示发送上述请求信息时设备所发生的第一事件，其中，第一事件信息包括用于指示用户输入上述语音信息的语音输入事件信息；基于上述第一事件信息和上述语音信息，生成针对设备的、包括操作指令的响应信息；发送上述响应信息至所针对的设备，以供所针对的设备执行上述操作指令所指示的操作。

在一些实施例中，在上述接收设备发送的请求信息之前，上述方法还包括：接收设备发送的响应通道建立请求，其中，上述响应通道建立请求用于请求建立向终端设备返回响应信息的通道，并保持所建立的响应通道处于连通状态；接收设备发送的第二事件信息和第二状态信息，其中，第二事件信息用于指示发送上述响应通道建立请求时设备所发生的第二事件，第二状态信息用于指示第二事件所处于的状态。

在一些实施例中，在上述接收设备发送的请求信息之前，上述方法还包括：接收设备发送的功能接口目录，其中，功能接口目录包括以下至少一个操作接口的标识：语音输入接口、语音输出接口、扬声器控制接口、音频播放控制接口、闹钟设置接口和屏幕展示接口；对应存储功能接口目录和发送功能接口目录的设备的设备标识。

在一些实施例中，在基于上述第一事件信息和上述语音信息，生成针对设备的、包括操作指令的响应信息之前，上述方法还包括：接收设备发送的状态报告消息，上述状态报告消息包括第三事件信息和第三状态信息，其中，上述第三事件信息用于指示设备的发送上述状态报告消息时发生的第三事件，上述第三状态信息用于指示上述第三事件所处于的状态。

在一些实施例中，上述请求信息还包括第一状态信息，第一状态信息用于指示第一事件所处于的状态；以及上述基于上述事件信息、上述状态信息和上述语音信息中的至少一项，生成针对设备的、包括操作指令的响应信息，包括：解析上述语音信息，确定所针对的设备；根据上述第一事件信息、上述第二事件信息和上述第三事件信息中的至少一项，确定所针对的设备的当前事件信息和与上述当前事件信息对应的当前状态信息；根据所针对的设备的当前事件信息、当前状态信息和功能接口目录和上述语音信息，生成上述响应信息。

在一些实施例中，上述响应信息还包括待播放音频信息，上述操作指令包括播放上述待播放音频信息的音频播放指令；以及上述发送上述响应信息至所针对的设备，以供所针对的设备执行上述操作指令所指示的操作，包括：发送上述待播放音频信息和上述音频播放指令至所针对的设备，以供所针对的设备根据上述音频播放指令，调用语音输出接口，播放上述待播放音频信息。

在一些实施例中，上述响应信息还包括待展示视图信息，上述操作指令还包括绘制上述待展示视图的视图绘制指令，其中，视图信息包括以下至少一项：图像、网页和视频；以及上述发送上述响应信息至所针对的设备，以供所针对的设备执行上述操作指令所指示的操作，还包括：发送上述待展示视图信息和上述视图绘制指令至所针对的设备，以供所针对的设备根据上述视图绘制指令，调用屏幕展示接口，绘制并展示上述待展示视图信息。

第二方面，本申请实施例提供了一种用于提供语音服务的装置，上述装置包括：第一接收单元，用于接收设备发送的请求信息，其中，上述请求信息包括第一事件信息和语音信息，其中，第一事件信息用于指示发送上述请求信息时设备所发生的第一事件，其中，第一事件信息包括用于指示用户输入上述语音信息的语音输入事件信息；生成单元，用于基于上述第一事件信息和上述语音信息，生成针对设备的、包括操作指令的响应信息；发送单元，用于发送上述响应信息至所针对的设备，以供所针对的设备执行上述操作指令所指示的操作。

在一些实施例中，上述装置还包括：第二接收单元，用于接收设备发送的响应通道建立请求，其中，上述响应通道建立请求用于请求建立向终端设备返回响应信息的通道，并保持所建立的响应通道处于连通状态；第三接收单元，用于接收设备发送的第二事件信息和第二状态信息，其中，第二事件信息用于指示发送上述响应通道建立请求时设备所发生的第二事件，第二状态信息用于指示第二事件所处于的状态。

在一些实施例中，上述装置还包括：第四接收单元，用于接收设备发送的功能接口目录，其中，功能接口目录包括以下至少一个操作接口的标识：语音输入接口、语音输出接口、扬声器控制接口、音频播放控制接口、闹钟设置接口和屏幕展示接口；存储单元，用于对应存储功能接口目录和发送功能接口目录的设备的设备标识。

在一些实施例中，上述装置还包括：第五接收单元，用于接收设备发送的状态报告消息，上述状态报告消息包括第三事件信息和第三状态信息，其中，上述第三事件信息用于指示设备的发送上述状态报告消息时发生的第三事件，上述第三状态信息用于指示上述第三事件所处于的状态。

在一些实施例中，上述请求信息还包括第一状态信息，第一状态信息用于指示第一事件所处于的状态；以及上述生成单元进一步用于：解析上述语音信息，确定所针对的设备；根据上述第一事件信息、上述第二事件信息和上述第三事件信息中的至少一项，确定所针对的设备的当前事件信息和与上述当前事件信息对应的当前状态信息；根据所针对的设备的当前事件信息、当前状态信息和功能接口目录和上述语音信息，生成上述响应信息。

在一些实施例中，上述响应信息还包括待播放音频信息，上述操作指令包括播放上述待播放音频信息的音频播放指令；以及上述发送单元进一步用于：发送上述待播放音频信息和上述音频播放指令至所针对的设备，以供所针对的设备根据上述音频播放指令，调用语音输出接口，播放上述待播放音频信息。

在一些实施例中，上述响应信息还包括待展示视图信息，上述操作指令还包括绘制上述待展示视图的视图绘制指令，其中，视图信息包括以下至少一项：图像、网页和视频；以及上述发送单元进一步用于：发送上述待展示视图信息和上述视图绘制指令至所针对的设备，以供所针对的设备根据上述视图绘制指令，调用屏幕展示接口，绘制并展示上述待展示视图信息。

第三方面，本申请实施例提供了一种服务器，上述服务器包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当上述一个或多个程序被上述一个或多个处理器执行时，使得上述一个或多个处理器实现如第一方面的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面的方法。

本申请实施例提供的用于提供语音服务的方法和装置，通过在向服务器发送语音信息的同时，发送第一事件信息，可以方便服务器快速启动与事件信息的功能或者生成与事件对应的响应信息，提高了提供语音服务的效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的用于提供语音服务的方法的一个实施例的流程图；

图3是根据本申请的用于提供语音服务的方法的一个应用场景的示意图；

图4是根据本申请的用于提供语音服务的方法的又一个实施例的流程图；

图5是根据本申请的用于提供语音服务的装置的一个实施例的结构示意图；

图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于提供语音服务的方法或用于提供语音服务的装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端101，设备102、103，网络104和服务器105。网络104用以在终端101和服务器105之间提供通信链路的介质，以及在设备102、103与服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户110可以使用终端101通过网络104与服务器105交互，以接收或发送消息等。终端101上可以安装有与服务器105进行交互的应用，例如网页浏览器应用、语音服务客户端应用等。终端101可以使具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、台式计算机等。

设备102、103也可以通过网络104与服务器105交互，以接收或发送消息等。设备102、103可以是具有音频输入接口和音频输出接口的电子设备，例如可以为具有麦克风的音箱。

服务器105可以是提供各种服务的服务器，例如对终端101上显示的网页内容进行支持、并对设备102、103执行的音频输出操作进行控制的语音服务器。语音服务器可以对用户110通过终端101发出的针对设备102、103进行语音服务操作的请求进行处理，并将处理结果(例如音频数据和音频输出接口的控制指令)发送至设备102、103。设备102、103可以通过网络104接收服务器105发送的音频数据和控制指令，并执行相应的操作，从而实现了将设备102、103接入语音服务器105提供的语音服务。

需要说明的是，本申请实施例所提供用于提供语音服务的方法一般由服务器105执行，相应地，用于提供语音服务的装置一般设置于服务器105中。

应该理解，图1中的终端、设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。例如服务器可以为集群式的服务器，包括部署了不同进程的多台服务器。

继续参考图2，其示出了根据本申请的用于提供语音服务的方法的一个实施例的流程200。上述的用于提供语音服务的方法，包括以下步骤：

步骤201，接收设备发送的请求信息。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以接收设备发送的请求信息。

在本实施例中，请求信息可以包括第一事件信息和语音信息。在这里，第一事件信息用于指示设备发送上述请求信息时，设备所发生的第一事件。

在本实施例中，第一事件信息可以包括语音输入事件信息，上述语音输入事件信息用于指示用户输入语音信息这一事件。

需要说明的是，设备的事件信息可以是由设备和服务器预先约定的。设备可以实现的功能分为多个功能类型。每种功能类型可以对应一种事件类型。设备向服务器发送的事件信息，可以使服务器根据事件信息快速定位所应开启的功能以及生成事件信息可能对应的操作指令。

例如，服务器可以响应于接收到语音输入事件信息，开启语音识别功能。服务器可以响应于接收到音量改变事件，定位到可能要生成调整音量操作指令。

在本实施例的一些可选的实现方式中，上述请求信息还可以包括第一状态信息，第一状态信息用于指示第一事件处于的状态。

作为示例，可以将事件的进度进行归类，预先设置用于指示事件可以处于的状态的状态信息。

在本实施例的一些可选的实现方式中，可以针对设备能够实现的功能设置功能接口，对于功能接口可以设置与功能接口对应的操作指令，利用对应的操作指令可以调用功能接口执行操作。

需要说明的是，不同的设备能够实现的功能可能有所不同，所以不同的设备的功能接口可能不同。

在本实施例的一些可选的实现方式，设备在与服务器建立通信连接之后，可以向服务器发送功能接口目录。服务器可以将功能接口目录和发送功能接口目录的设备的设备标识对应存储。

在本实施例的一些可选的实现方式，功能接口目录可以包括以下至少一个操作接口的标识：语音输入接口、语音输出接口、扬声器控制接口、音频播放控制接口、闹钟设置接口和屏幕展示接口。

在本实施例的一些可选的实现方式中，可以按照设备的功能类型，对该功能类型对应的事件信息、状态信息、指令信息和功能接口信息进行封装。将各个功能类型的封装结果作为一个安装包。设备安装此安装包即可与服务器进行通信，向服务器请求语音服务。

作为示例，设备可以将服务器发送的指令与安装包中的指令信息进行比对，调用对应的功能接口。

在本实施例的一些可选的实现方式中，安装包中还可以定义消息格式和消息传输协议，消息格式和消息传输协议也是预先与服务器约定的。

作为示例，事件类型可以包括语音输入类型、语音输出类型、扬声器控制类型、音频播放类型、播放控制类型、闹钟类型等。分别对应设备的语音输入功能、语音输出功能、扬声器控制功能、音频播放功能、播放控制功能、闹钟功能等。

作为示例，每种事件类型可以包括多种具体的事件信息。语音输入类型可以包括语音输入事件信息。语音输出类型可以包括语音播报开始事件信息和语音播报结束事件信息。扬声器控制类型可以包括音量变化事件信息和静音开关事件信息。音频播放类型可以包括音频播放开始事件信息、音频播放结束事件信息、音频播放将要结束事件信息、音频播放错误事件信息和音频播放停止事件信息等。播放控制类型可以包括“播放”按钮点击事件信息、“暂停”按钮点击事件信息、“上一首”按钮点击事件信息、“下一首”按钮点击事件等。闹钟类型可以包括闹钟设置成功事件信息、闹钟设置失败事件信息、闹钟删除成功事件信息、闹钟删除失败事件信息、闹钟开始事件信息、闹钟完成事件信息和闹钟停止事件信息等。

作为示例，语音输出类型的事件信息对应的状态信息可以是正在播报信息、播报结束信息。扬声器控制类型的事件信息对应的状态信息可以是是否静音信息、音量值信息。音频播放类型的事件信息对应的状态信息可以是正在播放信息、播放被停止信息和播放完成信息等。闹钟类型的事件信息对应的状态信息可以是当前闹钟数量信息和当前闹钟事件信息等。

步骤202，基于第一事件信息和语音信息，生成针对设备的、包括操作指令的响应信息。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以基于第一事件信息和语音信息，生成针对设备的、包括操作指令的响应信息。

在本实施例中，服务器接收到语音输入事件信息，可以启动语音识别功能。然后利用语音识别功能对上述语音信息进行解析，分析用户意图，生成对应的响应信息。需要说明的是，如何对语音信息进行解析和分析用户意图，本领域技术人员可以根据现有技术实现，在此不再赘述。

在本实施例的一些可选的实现方式中，所针对设备可以是发送请求信息的设备，也可以是其它设备。作为示例，如果用户在手机上输入语音信息“打开音响”，那语音信息所针对的设备即是与手机具有绑定关系的音响。

步骤203，发送响应信息至所针对的设备。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以发送响应信息至所针对的设备。在这里，所针对的设备可以执行上述操作指令所指示的操作。

在本实施例的一些可选的实现方式中，响应信息还可以包括待播放音频信息，操作指令可以包括播放上述待播放音频信息的音频播放指令。这样步骤203可以包括：发送待播放音频信息和音频播放指令至所针对的设备，以供所针对的设备根据音频播放指令，调用语音输出接口，播放待播放音频信息。

在本实施例的一些可选的实现方式中，响应信息还可以包括待展示视图信息，操作指令还可以包括绘制待展示视图的视图绘制指令，其中，视图信息包括以下至少一项：图像、网页和视频。这样，步骤203可以包括：发送待展示视图信息和上述视图绘制指令至所针对的设备，以供所针对的设备根据用于视图绘制指令，调用屏幕展示接口，绘制并展示待展示视图信息。

继续参见图3，图3是根据本实施例的用于提供语音服务的方法的应用场景的一个示意图。在图3的应用场景中，如图3所示，在一个场景中，用户C通过在设备A进行操作，开启语音服务。设备A响应于检测到用户的操作，可以在步骤301中向语音服务器B发送请求信息，请求为设备A提供目标语音服务，在这里，请求信息包括第一事件信息和语音信息，其中，第一事件信息用于指示发送请求信息时设备所发生的第一事件，其中，第一事件信息包括用于指示用户输入语音信息的语音输入事件信息。语音服务器B在步骤302中对请求信息进行处理，得出针对设备的、包括操作指令的响应信息，并在步骤303中向设备A发送响应信息，以供设备A执行上述操作指令。

本申请的上述实施例提供的方法，通过在向服务器发送语音信息的同时，发送第一事件信息，可以方便服务器快速启动与事件信息的功能或者生成与事件对应的响应信息，提高了提供语音服务的效率。

进一步参考图4，其示出了用于提供语音服务的方法的又一个实施例的流程400。该用于提供语音服务的方法的流程400，包括以下步骤：

步骤401，接收设备发送的响应通道建立请求。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以接收设备发送的响应通道建立请求。在这里，响应通道建立请求用于请求建立向终端设备返回响应信息的通道，并保持所建立的响应通道处于连通状态。

在本实施例的一些可选的实现方式中，步骤401可以包括：设备与服务建立物理连接。在物理连接内创建一个数据流并发送连接请求，此数据流为下行消息通道，即由服务器向设备发送消息的通道。在设备端需要上报事件信息时，在物理连接内部创建新的数据流，发送请求事件上报请求；在请求或响应结束后关闭该数据流。每隔预定的时长，可以在物理连接内部，创建新的数据流，发送保持连接请求，此请求是设备请求服务器与设备的连接。

步骤402，接收设备发送的第二事件信息和第二状态信息。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以接收设备发送的第二事件信息和第二状态信息。在这里，第二事件信息用于指示发送响应通道建立请求时设备所发生的第二事件，第二状态信息用于指示第二事件所处于的状态。

在本实施例中，上述服务器还可以接收设备发送的功能接口目录，其中，功能接口目录包括以下至少一个操作接口的标识：语音输入接口、语音输出接口、扬声器控制接口、音频播放控制接口、闹钟设置接口和屏幕展示接口；对应存储功能接口目录和发送功能接口目录的设备的设备标识。

步骤403，接收设备发送的请求信息。

在本实施例的一些可选的实现方式中，上述电子设备还可以接收设备发送的状态报告消息，状态报告消息包括第三事件信息和第三状态信息，其中，第三事件信息用于指示设备的发送状态报告消息时发生的第三事件，第三状态信息用于指示第三事件所处于的状态。

在本实施例的一些可选的实现方式中，设备发送的请求信息中也可以包括设备标识和访问令牌等。访问令牌是服务器预先向设备发送的允许访问的凭证。

步骤404，解析语音信息，确定所针对的设备。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以解析语音信息，确定所针对的设备。

步骤405，根据第一事件信息、第二事件信息和第三事件信息中的至少一项，确定所针对的设备的当前事件信息和与当前事件信息对应的当前状态信息。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以根据第一事件信息、第二事件信息和第三事件信息中的至少一项，确定所针对的设备的当前事件信息和与当前事件信息对应的当前状态信息。

在这里，可以根据第一事件、第三事件和第三事件发生的先后顺序，将发生在最后的事件作为所针对的设备的当前事件。

步骤406，根据所针对的设备的当前事件信息、当前状态信息和功能接口目录和语音信息，生成响应信息。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以根据所针对的设备的当前事件信息、当前状态信息和功能接口目录和语音信息，生成响应信息。

作为示例，用户的语音信息为“调大音响声音”，在音响发送至服务器的多个音量改变事件和多个音量值状态中，确定当前音响的音量值，生成调用音响的扬声器控制接口调整音量的操作指令。

需要说明的是，可以根据设备端的功能接口目录，准确获知设备端所具有的功能。可以当前事件信息、当前状态信息，避免语音服务的可能生成的操作指令与设备端当前发生的事件冲突导致语音服务响应发生延迟。

步骤407，发送响应信息至所针对的设备。

在本实施例中，用于提供语音服务的方法运行于其上的电子设备(例如图1所示的服务器)可以发送响应信息至所针对的设备，在这里，所针对的设备执行操作指令所指示的操作。

从图4中可以看出，与图2对应的实施例相比，本实施例中的用于提供语音服务的方法的流程400突出了确定所针对的设备和根据所针对的设备的当前事件信息和状态信息生成响应信息的步骤。由此，本实施例描述的方案可以提高语音服务的准确率和交互效率。

进一步参考图5，作为对上述各图所示方法的实现，本申请提供了一种用于提供语音服务的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例上述的用于提供语音服务的装置500包括：第一接收单元501、生成单元502和发送单元503。其中，第一接收单元501，用于接收设备发送的请求信息，其中，上述请求信息包括第一事件信息和语音信息，其中，第一事件信息用于指示发送上述请求信息时设备所发生的第一事件，其中，第一事件信息包括用于指示用户输入上述语音信息的语音输入事件信息；生成单元502，用于基于上述第一事件信息和上述语音信息，生成针对设备的、包括操作指令的响应信息；发送单元503，用于发送上述响应信息至所针对的设备，以供所针对的设备执行上述操作指令所指示的操作。

在本实施例中，第一接收单元501、生成单元502和发送单元503的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202和步骤203的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，上述装置500还可以包括：第二接收单元(未示出)，用于接收设备发送的响应通道建立请求，其中，上述响应通道建立请求用于请求建立向终端设备返回响应信息的通道，并保持所建立的响应通道处于连通状态；第三接收单元(未示出)，用于接收设备发送的第二事件信息和第二状态信息，其中，第二事件信息用于指示发送上述响应通道建立请求时设备所发生的第二事件，第二状态信息用于指示第二事件所处于的状态。

在本实施例的一些可选的实现方式中，上述装置还可以包括：第四接收单元(未示出)，用于接收设备发送的功能接口目录，其中，功能接口目录包括以下至少一个操作接口的标识：语音输入接口、语音输出接口、扬声器控制接口、音频播放控制接口、闹钟设置接口和屏幕展示接口；存储单元(未示出)，用于对应存储功能接口目录和发送功能接口目录的设备的设备标识。

在本实施例的一些可选的实现方式中，上述装置还可以包括：第五接收单元(未示出)，用于接收设备发送的状态报告消息，上述状态报告消息包括第三事件信息和第三状态信息，其中，上述第三事件信息用于指示设备的发送上述状态报告消息时发生的第三事件，上述第三状态信息用于指示上述第三事件所处于的状态。

在本实施例的一些可选的实现方式中，上述请求信息还可以包括第一状态信息，第一状态信息用于指示第一事件所处于的状态；以及上述生成单元502可以进一步用于：解析上述语音信息，确定所针对的设备；根据上述第一事件信息、上述第二事件信息和上述第三事件信息中的至少一项，确定所针对的设备的当前事件信息和与上述当前事件信息对应的当前状态信息；根据所针对的设备的当前事件信息、当前状态信息和功能接口目录和上述语音信息，生成上述响应信息。

在本实施例的一些可选的实现方式中，上述响应信息还可以包括待播放音频信息，上述操作指令包括播放上述待播放音频信息的音频播放指令；以及上述发送单元503可以进一步用于：发送上述待播放音频信息和上述音频播放指令至所针对的设备，以供所针对的设备根据上述音频播放指令，调用语音输出接口，播放上述待播放音频信息。

在本实施例的一些可选的实现方式中，上述响应信息还可以包括待展示视图信息，上述操作指令还可以包括绘制上述待展示视图的视图绘制指令，其中，视图信息包括以下至少一项：图像、网页和视频；以及上述发送单元503可以进一步用于：发送上述待展示视图信息和上述视图绘制指令至所针对的设备，以供所针对的设备根据上述视图绘制指令，调用屏幕展示接口，绘制并展示上述待展示视图信息。

需要说明的是，本实施例提供的用于提供语音服务的装置中各单元的实现细节和技术效果可以参考本申请中其它实施例的说明，在此不再赘述。

下面参考图6，其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。图6示出的服务器仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时，执行本申请的方法中限定的上述功能。

需要说明的是，本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括第一接收单元、生成单元和发送单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一接收单元还可以被描述为“接收设备发送的请求信息的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：接收设备发送的请求信息，其中，上述请求信息包括第一事件信息和语音信息，其中，第一事件信息用于指示发送上述请求信息时设备所发生的第一事件，其中，第一事件信息包括用于指示用户输入上述语音信息的语音输入事件信息；基于上述第一事件信息和上述语音信息，生成针对设备的、包括操作指令的响应信息；发送上述响应信息至所针对的设备，以供所针对的设备执行上述操作指令所指示的操作。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种用于提供语音服务的方法，其特征在于，所述方法包括：

接收设备发送的请求信息，其中，所述请求信息包括第一事件信息和语音信息，其中，所述第一事件信息用于指示发送所述请求信息时设备所发生的第一事件，其中，所述第一事件信息包括用于指示用户输入所述语音信息的语音输入事件信息；

基于所述第一事件信息和所述语音信息，生成针对设备的、包括操作指令的响应信息；

发送所述响应信息至所针对的设备，以供所针对的设备执行所述操作指令所指示的操作。

2.根据权利要求1所述的方法，其特征在于，在所述接收设备发送的请求信息之前，所述方法还包括：

接收设备发送的响应通道建立请求，其中，所述响应通道建立请求用于请求建立向终端设备返回响应信息的通道，并保持所建立的响应通道处于连通状态；

接收设备发送的第二事件信息和第二状态信息，其中，第二事件信息用于指示发送所述响应通道建立请求时设备所发生的第二事件，第二状态信息用于指示第二事件所处于的状态。

3.根据权利要求2所述的方法，其特征在于，在所述接收设备发送的请求信息之前，所述方法还包括：

接收设备发送的功能接口目录，其中，功能接口目录包括以下至少一个操作接口的标识：语音输入接口、语音输出接口、扬声器控制接口、音频播放控制接口、闹钟设置接口和屏幕展示接口；

对应存储功能接口目录和发送功能接口目录的设备的设备标识。

4.根据权利要求3所述的方法，其特征在于，在基于所述第一事件信息和所述语音信息，生成针对设备的、包括操作指令的响应信息之前，所述方法还包括：

接收设备发送的状态报告消息，所述状态报告消息包括第三事件信息和第三状态信息，其中，所述第三事件信息用于指示设备的发送所述状态报告消息时发生的第三事件，所述第三状态信息用于指示所述第三事件所处于的状态。

5.根据权利要求4所述的方法，其特征在于，所述请求信息还包括第一状态信息，所述第一状态信息用于指示所述第一事件所处于的状态；以及

所述基于所述第一事件信息和所述语音信息，生成针对设备的、包括操作指令的响应信息，包括：

解析所述语音信息，确定所针对的设备；

根据所述第一事件信息、所述第二事件信息和所述第三事件信息中的至少一项，确定所针对的设备的当前事件信息和与所述当前事件信息对应的当前状态信息；

根据所针对的设备的当前事件信息、当前状态信息和功能接口目录和所述语音信息，生成所述响应信息。

6.根据权利要求1-5中任一项所述的方法，其特征在于，所述响应信息还包括待播放音频信息，所述操作指令包括播放所述待播放音频信息的音频播放指令；以及

所述发送所述响应信息至所针对的设备，以供所针对的设备执行所述操作指令所指示的操作，包括：

发送所述待播放音频信息和所述音频播放指令至所针对的设备，以供所针对的设备根据所述音频播放指令，调用语音输出接口，播放所述待播放音频信息。

7.根据权利要求6所述的方法，其特征在于，所述响应信息还包括待展示视图信息，所述操作指令还包括绘制所述待展示视图的视图绘制指令，其中，视图信息包括以下至少一项：图像、网页和视频；以及

所述发送所述响应信息至所针对的设备，以供所针对的设备执行所述操作指令所指示的操作，还包括：

发送所述待展示视图信息和所述视图绘制指令至所针对的设备，以供所针对的设备根据所述视图绘制指令，调用屏幕展示接口，绘制并展示所述待展示视图信息。

8.一种用于提供语音服务的装置，其特征在于，所述装置包括：

第一接收单元，用于接收设备发送的请求信息，其中，所述请求信息包括第一事件信息和语音信息，其中，第一事件信息用于指示发送所述请求信息时设备所发生的第一事件，其中，第一事件信息包括用于指示用户输入所述语音信息的语音输入事件信息；

生成单元，用于基于所述第一事件信息和所述语音信息，生成针对设备的、包括操作指令的响应信息；

发送单元，用于发送所述响应信息至所针对的设备，以供所针对的设备执行所述操作指令所指示的操作。

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

第二接收单元，用于接收设备发送的响应通道建立请求，其中，所述响应通道建立请求用于请求建立向终端设备返回响应信息的通道，并保持所建立的响应通道处于连通状态；

第三接收单元，用于接收设备发送的第二事件信息和第二状态信息，其中，第二事件信息用于指示发送所述响应通道建立请求时设备所发生的第二事件，第二状态信息用于指示第二事件所处于的状态。

10.根据权利要求9所述的装置，其特征在于，所述装置还包括：

第四接收单元，用于接收设备发送的功能接口目录，其中，功能接口目录包括以下至少一个操作接口的标识：语音输入接口、语音输出接口、扬声器控制接口、音频播放控制接口、闹钟设置接口和屏幕展示接口；

存储单元，用于对应存储功能接口目录和发送功能接口目录的设备的设备标识。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

第五接收单元，用于接收设备发送的状态报告消息，所述状态报告消息包括第三事件信息和第三状态信息，其中，所述第三事件信息用于指示设备的发送所述状态报告消息时发生的第三事件，所述第三状态信息用于指示所述第三事件所处于的状态。

12.根据权利要求11所述的装置，其特征在于，所述请求信息还包括第一状态信息，第一状态信息用于指示第一事件所处于的状态；以及

所述生成单元进一步用于：

解析所述语音信息，确定所针对的设备；

13.根据权利要求8-12中任一项所述的装置，其特征在于，所述响应信息还包括待播放音频信息，所述操作指令包括播放所述待播放音频信息的音频播放指令；以及

所述发送单元进一步用于：

14.根据权利要求13所述的装置，其特征在于，所述响应信息还包括待展示视图信息，所述操作指令还包括绘制所述待展示视图的视图绘制指令，其中，视图信息包括以下至少一项：图像、网页和视频；以及

所述发送单元进一步用于：

15.一种服务器，其特征在于，所述服务器包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的方法。