CN105224278A

CN105224278A - 语音交互服务处理方法及装置

Info

Publication number: CN105224278A
Application number: CN201510520712.0A
Authority: CN
Inventors: 张莉; 祖明; 沈毅
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2015-08-21
Filing date: 2015-08-21
Publication date: 2016-01-06
Anticipated expiration: 2035-08-21
Also published as: CN105224278B

Abstract

本申请提出一种语音交互服务处理方法和装置，其中，该方法包括：接收用户发送的语音信息；根据所述语音信息获取所述用户的行为意图和行为对象；获取与所述行为意图对应的服务资源；根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。通过本申请提供的语音交互服务处理方法和装置，实现了根据用户输入的语音信息对用户行为进行分析，向用户提供便捷直达的语音服务，减少了人机交互的处理次数，提高了处理效率和用户体验度。

Description

语音交互服务处理方法及装置

技术领域

本申请涉及通信技术领域，尤其涉及一种语音交互服务处理方法及装置。

背景技术

语音是比文字更早、更自然的表达方式。在移动互联网时代，用户已习惯对着麦克风说出搜索需求，搜索信息上传至搜索引擎，搜索引擎将语音转化为文字，返回相应的搜索结果，来完成用户对信息的渴求。

现有技术中，当用户进行语音智能搜索时，点击并开启一个对话界面，在界面中完成搜索需求的语音或文字输入，智能搜索根据关键词人以文本、图片或链接等形式反馈相应结果信息，用户从大量的文本、图片或链接等信息中进一步地选择、查找、打开相应内容，从而获取自己真正所需要的信息。

由此可见，现有技术的语音搜索服务仅仅是根据用户的语音输入进行检索，并返回海量的相关信息，用户还要进一步地进行筛选获取需要的信息，导致用户的查询效率低。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种语音交互服务处理方法，该方法根据用户输入的语音信息对用户行为进行分析，向用户提供便捷直达的语音服务，减少了人机交互的处理次数，提高了处理效率和用户体验度。

本申请的第二个目的在于提出一种语音交互服务处理装置。

为达上述目的，本申请第一方面实施例提出了一种语音交互服务处理方法，包括：接收用户发送的语音信息；根据所述语音信息获取所述用户的行为意图和行为对象；获取与所述行为意图对应的服务资源；根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。

本申请实施例的语音交互服务处理方法，首先接收用户发送的语音信息，然后根据所述语音信息获取所述用户的行为意图和行为对象，进而获取与所述行为意图对应的服务资源，最后根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。由此，根据用户输入的语音信息对用户行为进行分析，向用户提供便捷直达的语音服务，减少了人机交互的处理次数，提高了处理效率和用户体验度。

为达上述目的，本申请第二方面实施例提出了一种语音交互服务处理装置，包括：第一接收模块，用于接收用户发送的语音信息；第一获取模块，用于根据所述语音信息获取所述用户的行为意图和行为对象；第二获取模块，用于获取与所述行为意图对应的服务资源；处理模块，用于根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。

本申请实施例的语音交互服务处理装置，通过第一接收模块接收用户发送的语音信息；通过第一获取模块根据所述语音信息获取所述用户的行为意图和行为对象；通过第二获取模块获取与所述行为意图对应的服务资源；通过处理模块根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。由此，根据用户输入的语音信息对用户行为进行分析，向用户提供便捷直达的语音服务，减少了人机交互的处理次数，提高了处理效率和用户体验度。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本申请一个实施例的语音交互服务处理方法的流程图；

图2所示为卡通造型的虚拟三维立体模型；

图3是本申请另一个实施例的语音交互服务处理方法的流程图；

图4为语音交互服务示意效果图一；

图5为语音交互服务示意效果图二；

图6是本申请另一个实施例的语音交互服务处理方法的流程图；

图7为语音交互服务示意效果图三；

图8为语音交互服务示意效果图四；

图9为语音交互服务示意效果图五；

图10是本申请一个实施例的语音交互服务处理装置的结构示意图；

图11是本申请一个实施例的语音交互服务处理装置的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的语音交互服务处理方法及装置。

图1是本申请一个实施例的语音交互服务处理方法的流程图。

如图1所示，该语音交互服务处理方法包括：

步骤101，接收用户发送的语音信息。

本发明实施例提供的语音交互服务处理方法应用于具有语音输入输出功能的终端设备中，一般情况下，终端设备通过人机语音交互接口实现语音输入输出功能，具体的语音输入接口可以为麦克风等设备，语音输出接口可以为音响等设备。

当用户需要获取语音交互服务时，向人机语音交互接口输入语音信息，人机语音交互接口用于接收用户输入的语音信息，通过相关应用进行处理后，向用户输出语音信息，以使用户获取相应的语音交互服务。需要说明的是，终端设备可以通过能够访问人机语音交互接口的应用来为用户提供语音交互服务，该应用可以根据实际需要进行选择，例如：具有语音输入输出功能的搜索引擎等，本实施例对此不作限制。

进一步地，为了提升用户使用语音交互服务的体验，增加趣味性，在另一个实施例中，在步骤101之前，所述方法还包括：

接收所述用户发送的语音服务开启指令；

配置与所述用户对应的虚拟三维立体模型，所述虚拟三维立体模型用于配合人机语音交互接口与所述用户进行语音交互服务。

具体地，当用户进入提供语音服务的网络应用客户端，发送语音服务开启指令，根据语音服务开启指令为用户配置对应的虚拟三维立体模型。虚拟三维立体模型是通过图像处理等技术生成的，用于配合人机语音交互接口与用户进行语音交互服务。可以根据用户的语音服务开启指令主动为用户配置，也可以让用户根据自身的喜好选择感兴趣的虚拟三维立体模型，例如：图2所示为卡通造型的虚拟三维立体模型，本实施例对具体的形象不作限制。从而用户会在应用中的相对平面内看到自己所选的虚拟三维立体模型，虚拟三维立体模型配合人机语音交互接口与用户进行语音交互服务。

步骤102，根据所述语音信息获取所述用户的行为意图和行为对象。

在获取用户输入的语音信息之后，通过对该语音信息分析获取用户的行为意图和行为对象。需要说明的是，本发明实施例中涉及的行为意图指的是用户要做的事件，行为对象指的是做的事件内容，举例说明如下：

1)当用户输入的语音信息为：“带我去附近的麦当劳”时，用户的行为意图为“我去”，用户的行为对象为“附近的麦当劳”；

2)当用户输入的语音信息为：“我要看熊出没第二集”时，用户的行为意图为“我要看”，用户的行为对象为“熊出没第二集”；

3)当用户输入的语音信息为：“我要给妈妈打电话”时，用户的行为意图为“打电话”，用户的行为对象为“妈妈”；

4)当用户输入的语音信息为：“天空为什么是蓝色的”时，用户的行为意图为“为什么”，用户的行为对象为“天空是蓝色”。

根据语音信息获取用户的行为意图和行为对象的实现方式有很多，根据实际需要进行选择，举例说明如下：

方式一：直接通过语音特征值进行匹配检测，

具体来说，可以提取用户输入的语音信息的特征值，根据预先建立的语音特征库对所提取的特征值进行检测，语音特征库中存储了大量描述用户行为意图和行为对象的语音样本值，通过检测语音样本值与所提取的特征值的匹配度，从语音信息中获取用户的行为意图和行为对象。

方式二，通过将语音转换成文字进行检测，具体为：

具体来说，首先通过语音文字转换系统将用户输入的语音信息转换成文字信息，然后对文字信息进行语义分析，判断文字信息中是否包含预设的语义类型，从而获取用户的行为意图和行为对象。

其中，语义分析过程可以包括以下方式的至少一种，

1)判断文字信息中是否包含预设的指令意图类型语义，例如：指令意图类型语义包含“去xxx”、“看xxx”、“吃xxx”，以及“给xxx打电话”等；

若判断获知该文字信息中包含预设的指令意图类型语义，则获取与指令意图类型语义对应的指令对象。举例说明：当用户输入的语音信息转为文字信息为“去附近的麦当劳”时，则通过语义分析获知包含指令意图类型语义“去xx”，与指令意图类型语义对应的指令对象为“附近的麦当劳”。

2)判断文字信息中是否包含预设的提问意图类型语义，例如：提问意图类型语义包含“为什么”、“是什么”、“怎么样”，以及“怎么说”等；

若判断获知该文字信息中包含预设的提问意图类型语义，则获取与提问意图类型语义对应的提问对象。举例说明：当将用户输入的语音信息转为文字信息为“今天天气怎么样”时，则通过语义分析获知包含提问意图类型语义“怎么样”，与提问意图类型语义对应的提问对象为“今天天气”。

3)判断文字信息中是否包含预设的触发意图类型语义，例如：触发意图类型语义包含“XX点提醒看XXX”、“XX分钟后吃XXX”等；

若判断获知该文字信息中包含预设的触发意图类型语义，则获取与触发意图类型语义对应的触发对象。举例说明：当将用户输入的语音信息转为文字信息为“八点提醒看熊出没第二集”时，则通过语义分析获知包含触发意图类型语义“八点提醒看”，与触发意图类型语义对应的触发对象为“熊出没第二集”。

步骤103，获取与所述行为意图对应的服务资源。

具体来说，在获取用户的行为意图和行为对象之后，首先获取与用户的行为意图对应的服务资源，服务资源的具体形式有很多，具体包括：应用程序、第三方数据平台，以及搜索引擎，可以根据需要获取其中的一种或者多种。继续以步骤102中的例子举例说明：

1)当用户输入的语音信息为：“带我去附近的麦当劳”时，用户的行为意图为“我去XXX”，则调用与该行为意图对应的服务资源为地图应用，或者导航应用。

2)当用户输入的语音信息为：“我要看熊出没第二集”时，用户的行为意图为“我要看XXX”，则调用与该行为意图对应的服务资源为视频应用，或者已经接入的第三方多媒体平台。

3)当用户输入的语音信息为：“我要给妈妈打电话”时，用户的行为意图为“打电话”，则调用与该行为意图对应的服务资源为电话簿。

4)当用户输入的语音信息为：“天空为什么是蓝色的”时，用户的行为意图为“为什么”，则调用与该行为意图对应的服务资源为搜索引擎。

步骤104，根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。

具体地，首先从上述服务资源中获取与行为对象对应的服务信息，然后根据该服务信息向用户提供与行为意图匹配的语音服务。

需要说明的是，由于用户的行为意图和行为对象不同，因此，根据上述服务资源所提供的语音服务的过程也不同，为了更加清楚的描述具体的语音服务提供过程，通过以下实施例进行具体说明：

图3是本申请另一个实施例的语音交互服务处理方法的流程图。

如图3所示，本实施例是仅仅反馈语音的服务方式，针对步骤104，可以包括以下步骤：

步骤201，根据所述服务资源获取与所述行为对象对应的资讯信息；

步骤202，根据所述行为意图将所述资讯信息语音输出给所述用户。

具体地，本实施例中向用户提供的语音服务过程，首先从上述获取的服务资源中提取与行为对象对应的资讯信息，然后根据行为意图直接将该资讯信息语音输出给用户，比如：以步骤102中的语义分析为例，当用户的行为意图是指令意图类型语义时，或者提问类型语义时，就直接将该资讯信息语音输出给用户，当用户的行为意图是触发意图类型语义时，就在满足触发条件时将该资讯信息语音输出给用户。

为了更加清楚的说明图3所示实施例的过程，以图4和图5所示实施例为例说明。图4为语音交互服务示意效果图一，本发明各实施例的示意效果图中均选择以图2所示的虚拟三维立体模型配合人机语音交互接口与用户进行语音交互服务，以下不再赘述。

参见图4，当用户对应用客户端输入语音信息时，就具有与虚拟三维立体模型对话的效果，当用户输入的语音信息为“天空为什么是蓝色的？”、“今天天气怎么样”时，通过将语音信息转换为文字信息后，判断获知文字信息中包含预设的提问意图类型语义，即“为什么”、“怎么样”；则获取与提问意图类型语义对应的提问对象。举例说明：当将用户输入的语音信息转为文字信息为“今天天气怎么样”时，则通过语义分析获知包含提问意图类型语义“怎么样”，与提问意图类型语义对应的提问对象为“今天天气”。

获取与提问意图对应的服务资源为搜素引擎，并在搜素引擎搜索“今天天气”，获取对应的资讯信息，由于用户不是触发类语义，不需要满足触发条件，就及时将获取的资讯信息通过人机语音交互接口返回给用户，但是从交互界面上，实现了通过虚拟三维立体模型向用户提供语音交互服务的效果。

图5为语音交互服务示意效果图二，参见图5，本实施例中，当用户输入的语音信息为“我想听芭比公主的故事”时，通过将语音信息转换为文字信息后，判断获知文字信息中包含预设的指令意图类型语义，即“我想听”；则获取与指令意图类型语义对应的提问对象“芭比公主的故事”。

获取与指令意图对应的服务资源为接入的第三方数据平台，并在第三方数据平台中搜索“芭比公主的故事”，获取对应的资讯信息，由于用户不是触发类语义，不需要满足触发条件，就及时将获取的资讯信息通过人机语音交互接口返回给用户，同时，持续性的通过虚拟三维立体模型显示与资讯信息相应的数据片段，从交互界面上，实现了通过虚拟三维立体模型向用户提供语音交互和数据片段交互服务的效果。

图6是本申请另一个实施例的语音交互服务处理方法的流程图。

如图6所示，本实施例是向用户返回提示语音，并且向用户提供服务资源界面的方式，针对步骤104，可以包括以下步骤：

步骤301，根据所述服务资源获取与所述行为对象对应的资讯信息和提示信息；

步骤302，根据所述行为意图将所述提示信息语音输出给所述用户，且向所述用户提供与所述资讯信息对应的服务资源。

具体地，本实施例中向用户提供的语音服务过程，首先从上述获取的服务资源中提取与行为对象对应的资讯信息和提示信息，然后根据行为意图直接将该提示信息语音输出给用户，且向用户提供与资讯信息对应的服务资源。比如：以步骤102中的语义分析为例，当用户的行为意图是指令意图类型语义、提问类型语义等非触发意图类语义时，就直接将该提示信息语音输出给用户，并提供相关的服务资源界面，当用户的行为意图是触发意图类型语义时，就在满足触发条件时将该提示信息语音输出给用户，并提供相关的服务资源界面。

为了更加清楚的说明图6所示实施例的过程，以图7至图9所示实施例为例说明如下：

图7为语音交互服务示意效果图三，参见图7，本实施例中，当用户输入的语音信息为“带我去附近的麦当劳”时，通过将语音信息转换为文字信息后，判断获知文字信息中包含预设的指令意图类型语义，即“带我去”；则获取与指令意图类型语义对应的提问对象“附近的麦当劳”。

获取与指令意图对应的服务资源为地图应用软件，如百度导航，并在地图应用软件中搜索“起始地点，用户当前位置，可以通过GPS获取，目标地点，麦当劳”，获取对应的提示信息和资讯信息，由于用户不是触发类语义，不需要满足触发条件，就及时将获取的提示信息通过人机语音交互接口返回给用户，其中提示信息为“已经找到最近的麦当劳，距离96米，正在切换到百度导航”(左侧图)，同时，向用户提供与资讯信息对应的服务资源，即带有导航路线的百度导航用户界面(中间图)。

继续参见图7，当用户输入的语音信息为“我要看熊出没第二集”时，通过将语音信息转换为文字信息后，判断获知文字信息中包含预设的指令意图类型语义，即“我要看”；则获取与指令意图类型语义对应的提问对象“熊出没第二集”。

获取与指令意图对应的服务资源为视频应用软件，如百度视频，并在视频应用软件中搜索“熊出没第二集”，获取对应的提示信息和资讯信息，由于用户不是触发类语义，不需要满足触发条件，就及时将获取的提示信息通过人机语音交互接口返回给用户，其中提示信息为“已经找到视频资源，正在打开”(左侧图)，同时，向用户提供与资讯信息对应的服务资源，即带有熊出没第二集节目单的百度视频用户界面(右侧图)。

图8为语音交互服务示意效果图四，参见图8，本实施例中，当用户输入的语音信息为“我要给妈妈打电话”时，通过将语音信息转换为文字信息后，判断获知文字信息中包含预设的指令意图类型语义，即“打电话”；则获取与指令意图类型语义对应的提问对象“妈妈”。

获取与指令意图对应的服务资源为电话薄，并在电话薄中搜索“妈妈”，获取对应的提示信息和资讯信息，由于用户不是触发类语义，不需要满足触发条件，就及时将获取的提示信息通过人机语音交互接口返回给用户，其中提示信息为“已经查找到妈妈电话，请问拨打哪个”(左侧图)，同时，向用户提供与资讯信息对应的服务资源，即带有妈妈电话的电话薄(右侧图)。

图9为语音交互服务示意效果图五，参见图9，本实施例中，当用户输入的语音信息为“提醒八点看动画片熊出没第二集”时，通过将语音信息转换为文字信息后，判断获知文字信息中包含预设的触发意图类型语义，即“提醒八点看”；则获取与触发意图类型语义对应的提问对象“动画片熊出没”。

获取与触发意图对应的服务资源为视频应用软件，如百度视频，并在应用软件中搜索“动画片熊出没”，获取对应的提示信息和资讯信息，由于用户输入的是触发类语义，需要满足触发条件，当通过计时器等应用计时，到达八点时触发，将获取的提示信息通过人机语音交互接口返回给用户，其中提示信息为“八点了，正在打开动画片熊出没”(左侧图)，同时，向用户提供与资讯信息对应的服务资源，即带有熊出没节目单的百度视频(右侧图)。

为了实现上述实施例，本申请还提出一种语音交互服务处理装置。

图10是本申请一个实施例的语音交互服务处理装置的结构示意图。

如图10所示，该语音交互服务处理装置包括：

第一接收模块11，用于接收用户发送的语音信息；

第一获取模块12，用于根据所述语音信息获取所述用户的行为意图和行为对象；

第二获取模块13，用于获取与所述行为意图对应的服务资源；

处理模块14，用于根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。

需要说明的是，前述对语音交互服务处理方法实施例的解释说明也适用于该实施例的语音交互服务处理装置，此处不再赘述。

图11是本申请一个实施例的语音交互服务处理装置的结构示意图，如图11所示，基于图10所示实施例，所述第一获取模块12，包括：

转换单元121，用于将所述语音信息转换成文字信息；

分析单元122，用于对所述文字信息进行语义分析，获取所述用户的行为意图和行为对象。

其中，分析单元122，具体用于：

判断所述文字信息中是否包含预设的指令意图类型语义，若是，则获取与所述指令意图类型语义对应的指令对象；和/或，

判断所述文字信息中是否包含预设的提问意图类型语义，若是，则获取与所述提问意图类型语义对应的提问对象；和/或，

判断所述文字信息中是否包含预设的触发意图类型语义，若是，则获取与所述触发意图类型语义对应的触发内容。

进一步地，所述处理模块14，包括：

第一获取单元141，用于根据所述服务资源获取与所述行为对象对应的资讯信息；

第一输出单元142，用于根据所述行为意图将所述资讯信息语音输出给所述用户。

进一步地，所述处理模块14，包括：

第二获取单元143，用于根据所述服务资源获取与所述行为对象对应的资讯信息和提示信息；

第二输出单元144，用于根据所述行为意图将所述提示信息语音输出给所述用户，且向所述用户提供与所述资讯信息对应的服务资源。

进一步地，所述装置还包括：

第二接收模块15，用于接收所述用户发送的语音服务开启指令；

配置模块16，用于配置与所述用户对应的虚拟三维立体模型，所述虚拟三维立体模型用于配合人机语音交互接口与所述用户进行语音交互服务。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种语音交互服务处理方法，其特征在于，包括以下步骤：

接收用户发送的语音信息；

根据所述语音信息获取所述用户的行为意图和行为对象；

获取与所述行为意图对应的服务资源；

根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。

2.如权利要求1所述的语音交互服务处理方法，其特征在于，所述根据所述语音信息获取所述用户的行为意图和行为对象，包括：

将所述语音信息转换成文字信息；

对所述文字信息进行语义分析，获取所述用户的行为意图和行为对象。

3.如权利要求2所述的语音交互服务处理方法，其特征在于，所述对所述文字信息进行语义分析，获取所述用户的行为意图和行为对象，包括：

4.如权利要求1所述的语音交互服务处理方法，其特征在于，所述服务资源，包括以下至少之一：

应用程序、第三方数据平台，以及搜索引擎。

5.如权利要求1所述的语音交互服务处理方法，其特征在于，所述根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务，包括：

根据所述服务资源获取与所述行为对象对应的资讯信息；

根据所述行为意图将所述资讯信息语音输出给所述用户。

6.如权利要求1所述的语音交互服务处理方法，其特征在于，所述根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务，包括：

根据所述服务资源获取与所述行为对象对应的资讯信息和提示信息；

根据所述行为意图将所述提示信息语音输出给所述用户，且向所述用户提供与所述资讯信息对应的服务资源。

7.如权利要求1-6任一所述的语音交互服务处理方法，其特征在于，所述接收用户发送的语音信息之前，还包括：

接收所述用户发送的语音服务开启指令；

8.一种语音交互服务处理装置，其特征在于，包括：

第一接收模块，用于接收用户发送的语音信息；

第一获取模块，用于根据所述语音信息获取所述用户的行为意图和行为对象；

第二获取模块，用于获取与所述行为意图对应的服务资源；

处理模块，用于根据所述服务资源向所述用户提供与所述行为意图和所述行为对象匹配的语音服务。

9.如权利要求8所述的语音交互服务处理装置，其特征在于，所述第一获取模块，包括：

转换单元，用于将所述语音信息转换成文字信息；

分析单元，用于对所述文字信息进行语义分析，获取所述用户的行为意图和行为对象。

10.如权利要求9所述的语音交互服务处理装置，其特征在于，所述分析单元，具体用于：

11.如权利要求8所述的语音交互服务处理装置，其特征在于，所述处理模块，包括：

第一获取单元，用于根据所述服务资源获取与所述行为对象对应的资讯信息；

第一输出单元，用于根据所述行为意图将所述资讯信息语音输出给所述用户。

12.如权利要求8所述的语音交互服务处理装置，其特征在于，所述处理模块，包括：

第二获取单元，用于根据所述服务资源获取与所述行为对象对应的资讯信息和提示信息；

第二输出单元，用于根据所述行为意图将所述提示信息语音输出给所述用户，且向所述用户提供与所述资讯信息对应的服务资源。

13.如权利要求8-12任一所述的语音交互服务处理装置，其特征在于，所述装置还包括：

第二接收模块，用于接收所述用户发送的语音服务开启指令；

配置模块，用于配置与所述用户对应的虚拟三维立体模型，所述虚拟三维立体模型用于配合人机语音交互接口与所述用户进行语音交互服务。