CN110377676B

CN110377676B - 一种语音指令的处理方法、装置、设备和计算机存储介质

Info

Publication number: CN110377676B
Application number: CN201910556021.4A
Authority: CN
Inventors: 丁世强; 黄际洲
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-06-25
Filing date: 2019-06-25
Publication date: 2022-05-27
Anticipated expiration: 2039-06-25
Also published as: CN110377676A

Abstract

本发明提供了一种语音指令的处理方法、装置、设备和计算机存储介质，其中方法包括：识别用户输入的语音指令是否具有泛化需求；如果是，将所述用户的属性与所述语音指令所包含泛化兴趣点(POI)的属性进行匹配；利用匹配结果，生成精确需求引导语句用于返回给所述用户。本发明能够帮助用户输入符合用户需求的精确需求语音指令，简化用户操作，提高交互效率。

Description

一种语音指令的处理方法、装置、设备和计算机存储介质

【技术领域】

本发明涉及计算机应用技术领域，特别涉及一种语音指令的处理方法、装置、设备和计算机存储介质。

【背景技术】

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就被认为是现有技术。

随着语音交互技术的不断发展，越来越多的应用搭载了语音交互技术。用户能够通过输入语音指令获取对应的服务，从而在很大程度上解放双手。在很多应用产品中，当用户输入语音指令后，会利用输入的语音指令进行搜索，从而返回搜索结果。但当用户输入具有泛化需求的语音指令时，往往不能够向用户提供符合用户需求的搜索结果，而需要用户重新思考输入恰当的语音指令，从而造成操作不便、交互效率低下。一个典型的应用场景：在地图类应用中，当用户输入一个具有泛化需求的语音指令“帮我找一个吃饭的地方”，经过搜索排序后，会向用户返回“为您找到U鼎冒菜、九鼎辉煌美食广场、麦当劳”，而这些具体的餐馆名称往往很难精确命中用户需求。用户需要重新构思输入合适的语音指令，往往需要多次尝试输入才能得到符合自己需求的结果。

【发明内容】

有鉴于此，本发明提供了一种语音指令的处理方法、装置、设备和计算机存储介质，以便于简化用户操作，提高语音交互效率。

具体技术方案如下：

第一方面，本发明提供了一种语音指令的处理方法，该方法包括：

识别用户输入的语音指令是否具有泛化需求；

如果是，将所述用户的属性与所述语音指令所包含泛化兴趣点POI的属性进行匹配；

利用匹配结果，生成精确需求引导语句用于返回给所述用户。

根据本发明一优选实施方式，所述识别用户输入的语音指令是否具有泛化需求包括：

将所述用户输入的语音指令与预先配置的精确POI词典进行匹配，若所述语音指令包含精确POI，则确定所述语音指令具有精确需求；

将所述用户输入的语音指令与预先配置的泛化POI词典和精确属性词典进行匹配，如果所述语音指令包含泛化POI和精确属性的组合，则确定所述语音指令具有精确需求，如果所述语音指令仅包含泛化POI，则确定所述语音指令具有泛化需求。

根据本发明一优选实施方式，将所述用户的属性与所述语音指令所包含泛化兴趣点POI的属性进行匹配包括：

查询预先构建的POI知识图谱，确定所述语音指令所包含泛化POI的属性；将所述用户的属性与所述泛化POI的属性进行匹配；

所述利用匹配结果，生成精确需求引导语句包括：

利用与所述泛化POI的属性匹配的用户属性、所述泛化POI以及预先设置的第一类引导语句模板，生成精确需求引导语句。

根据本发明一优选实施方式，该方法还包括：

如果所述语音指令具有精确需求，则生成包含精确POI的搜索结果用于返回给所述用户。

根据本发明一优选实施方式，在生成包含精确POI的搜索结果的同时，还包括：

将所述用户的属性与所述搜索结果所包含精确POI的属性进行匹配；

利用匹配结果，生成选择性引导语句用于与所述搜索结果一起返回给所述用户。

根据本发明一优选实施方式，将所述用户的属性与所述搜索结果所包含精确POI的属性进行匹配包括：

查询预先构建的POI知识图谱，确定所述搜索结果所包含精确POI的属性；将所述用户的属性与所述精确POI的属性进行匹配；

所述利用匹配结果，生成选择性引导语句包括：

利用与所述用户的属性匹配的精确POI的属性以及预先设置的第二类引导语句模板，生成选择性引导语句。

根据本发明一优选实施方式，所述用户的属性的确定包括：

利用所述用户的历史搜索记录与预先构建的知识图谱中的各精确属性进行匹配，将匹配状况满足预设要求的精确属性作为所述用户的属性。

根据本发明一优选实施方式，所述POI知识图谱的构建包括：

针对各泛化POI标注对应的泛化属性；

针对各所述泛化属性标注对应的精确属性；

将各精确POI与各所述精确属性进行对应关联。

根据本发明一优选实施方式，所述将各精确POI与各所述精确属性进行对应关联包括：

将网页数据与预设的模板进行匹配，将与同一模板匹配的精确POI和精确属性进行对应关联，所述预设的模板从同时包含精确POI和精确属性的句子表达中提取；或者，

从网页数据中统计精确POI和精确属性在同一句子或段落中的共现状况，将共现状况满足预设共现要求的精确POI和精确属性进行对应关联。

第二方面，本发明提供了一种语音指令的处理装置，该装置包括：

识别单元，用于识别用户输入的语音指令是否具有泛化需求；

第一匹配单元，用于若所述识别单元识别出所述语音指令具有泛化需求，则将所述用户的属性与所述语音指令所包含泛化兴趣点POI的属性进行匹配；

第一生成单元，用于利用所述第一匹配单元的匹配结果，生成精确需求引导语句用于返回给所述用户。

根据本发明一优选实施方式，所述识别单元具体用于：

根据本发明一优选实施方式，所述第一匹配单元，具体用于查询预先构建的POI知识图谱，确定所述语音指令所包含泛化POI的属性；将所述用户的属性与所述泛化POI的属性进行匹配；

所述第一生成单元，具体用于利用与所述泛化POI的属性匹配的用户属性、所述泛化POI以及预先设置的第一类引导语句模板，生成精确需求引导语句。

根据本发明一优选实施方式，该装置还包括：

第二生成单元，用于若所述识别单元识别出所述语音指令具有精确需求，则生成包含精确POI的搜索结果用于返回给所述用户。

根据本发明一优选实施方式，该装置还包括：

第二匹配单元，用于若所述识别单元识别出所述语音指令具有精确需求，将所述用户的属性与所述搜索结果所包含精确POI的属性进行匹配；

所述第二生成单元，还用于利用所述第二匹配单元的匹配结果，生成选择性引导语句用于与所述搜索结果一起返回给所述用户。

根据本发明一优选实施方式，所述第二匹配单元，用于查询预先构建的POI知识图谱，确定所述搜索结果所包含精确POI的属性；将所述用户的属性与所述精确POI的属性进行匹配；

所述第二生成单元，具体用于利用与所述用户的属性匹配的精确POI的属性以及预先设置的第二类引导语句模板，生成选择性引导语句。

根据本发明一优选实施方式，该装置还包括：

确定单元，用于利用所述用户的历史搜索记录与预先构建的知识图谱中的各精确属性进行匹配，将匹配状况满足预设要求的精确属性作为所述用户的属性。

根据本发明一优选实施方式，该装置还包括：

构建单元，具体用于采用以下方式构建POI知识图谱：

针对各泛化POI标注对应的泛化属性；

针对各所述泛化属性标注对应的精确属性；

将各精确POI与各所述精确属性进行对应关联。

根据本发明一优选实施方式，所述构建单元在将各精确POI与各所述精确属性进行对应关联时，具体执行：

将网页数据与预设的模板进行匹配，将与同一模板匹配的精确POI和精确属性进行对应关联，所述预设的模板从同时包含精确POI和精确属性的句子表达中提取。

第三方面，本发明还提供了一种设备，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上所述的方法。

第四方面，本发明还提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如上所述的方法。

由以上技术方案可以看出，本发明在识别出用户输入的语音指令具有泛化需求时，将用户的属性与语音指令所包含泛化POI的属性进行匹配，利用匹配结果生成精确需求引导语句用于返回给用户，从而帮助用户输入符合用户需求的精确需求语音指令，简化用户操作，提高交互效率。

【附图说明】

图1示出可以应用本发明实施例的示例性系统架构；

图2为本发明实施例提供的语音指令的处理方法流程图；

图3为本发明实施例提供的构建POI知识图谱的方法流程图；

图4a、图4b和图4c为POI知识图谱的组成实例图；

图5为本发明实施例提供的语音指令的处理装置的结构示意图；

图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器的框图。

【具体实施方式】

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

图1示出了可以应用本发明实施例的语音指令的处理方法或语音指令的处理装置的示例性系统架构。

如图1所示，该系统架构可以包括终端设备101和102，网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101和102通过网络103与服务器104交互。终端设备101和102上可以安装有各种应用，例如语音交互应用、网页浏览器应用、通信类应用等。

终端设备101和102可以是支持语音交互的各种电子设备，可以是有屏设备，也可以是无屏设备。包括但不限于智能手机、平板电脑、智能音箱、智能电视等等。本发明所提供的语音指令的处理装置可以设置并运行于上述服务器104中。其可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块，在此不做具体限定。

例如，语音指令的处理装置设置并运行于上述服务器104中，终端设备101将用户输入的语音指令通过网络103发送至服务器104。服务器104采用本发明实施例提供的方法进行语音指令处理，依据处理结果返回至终端设备101，进而由终端设备101提供给用户。

服务器104可以是单一服务器，也可以是是多个服务器构成的服务器群组。应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

针对现有技术中当用户输入具有泛化需求的语音指令时，往往不能够向用户提供符合用户需求的搜索结果，而需要用户重新思考输入恰当的语音指令而导致的操作不便、交互效率低下的技术问题。本发明在识别出用户输入的语音指令具有泛化需求时，将用户的属性与语音指令所包含泛化POI(Point of Interest，兴趣点)的属性进行匹配，利用匹配结果生成精确需求引导语句用于返回给用户，从而帮助用户输入符合用户需求的精确需求语音指令，简化用户操作，提高交互效率。下面结合具体实施例对本发明进行详细描述。

图2为本发明实施例提供的语音指令的处理方法流程图，如图2中所示，该方法可以包括以下步骤：

在201中，获取用户输入的语音指令。

终端设备接收用户输入的语音指令，这些语音指令可以是用户通过终端设备中的应用程序输入的，例如通过地图类应用、点评类应用等。终端设备将该语音指令发送给对应应用的服务器，从而使得服务器获取到用户输入的语音指令。

特别地，本发明实施例中涉及到的语音指令指的是针对POI的指令，可以是针对某POI的查询。其中POI指的是兴趣点，是地理信息系统中的一个术语，泛指一切可以抽象为点的地理对象。POI的主要用途是对事物或事件的位置进行描述，从而增强对事物或事件位置的描述能力和查询能力。

其中POI可以是精确的，在本发明实施例中称为精确POI，其精确描述一个事物或事件。例如：中关村森林公园、中关村一小、北大国际医院、乐满堂(一个餐厅)，等等。POI也可以是泛化的，在本发明实施例中称为泛化POI，其通常宽泛地描述一类事物或事件。例如：公园、学校、医院、餐厅，等等。

在本发明实施例中涉及的语音指令可以是包含POI信息的查询指令。其中的POI信息可以是标准POI名称，也可以是标准POI的别名、同义表述等等。例如，用户输入语音指令“帮我找一个餐厅”，其中“餐厅”是标准POI名称。再例如，用户输入语音指令“帮我找一个吃饭的地方”，其中“吃饭的地方”是标准POI“餐厅”的同义表述。

在202中，识别用户输入的语音指令是否具有泛化需求，如果具有泛化需求，执行203；如果具有精确需求，执行205。

本步骤中对于语音指令泛化需求和精确需求的识别可以基于词典的方式，即预先配置精确POI词典和泛化POI词典。其中精确POI词典中包含各精确POI的信息，例如精确POI的名称。泛化POI词典中包含泛化POI的信息，例如泛化POI的名称。

作为其中一种实现方式，可以将用户输入的语音指令与预先配置的精确POI词典进行匹配，如果语音指令包含精确POI，则确定该语音指令具有精确需求。举个例子，假设用户输入的语音指令为“想去中关村森林公园”或者“中关村森林公园”，语音指令中包含的“中关村森林公园”为精确POI词典中的精确POI，因此语音指令“想去中关村森林公园”或者“中关村森林公园”可以识别为具有精确需求。

将用户输入的语音指令与预先配置的泛化POI词典和精确属性词典进行匹配，如果语音指令包含泛化POI和精确属性的组合，则确定语音指令具有精确需求；如果语音指令仅包含泛化POI，则确定该语音指令具有泛化需求。与POI相类似地，对于POI的属性而言，也可以划分为精确属性和泛化属性。精确属性指的是明确的属性，例如“安静”、“免费停车”、“遛娃圣地”、“适合跑步”等等。而泛化属性通常指的是一类明确属性的概括，例如“环境氛围”、“配套设施”、“地理位置”、“性价比”等等。

举个例子：假设用户输入的语音指令为“帮我找个安静的粤菜餐馆”，其中“餐馆”匹配到泛化POI，“安静”和“粤菜”匹配到精确属性，则该语音指令被识别为具有精确需求。

假设用户输入的语音指令为“帮我找一个吃饭的地方”，其中“吃饭的地方”匹配到泛化POI词典中的“餐馆”，该语音指令被识别为具有泛化需求。

更具体地，可以将语音指令与预先配置的泛化需求模板进行匹配，如果匹配到泛化需求模板，则确定所述用户输入的语音指令具有泛化需求；将所述用户输入的语音指令与预先配置的精确需求模板进行匹配，如果匹配到精确需求模板，则确定所述用户输入的语音指令具有精确需求。

其中，泛化需求模板可以诸如：

【泛化POI】

【W:0～20】【泛化POI】【W:0～20】

精确需求模板可以诸如：

【W:0～20】【精确POI】【W:0～20】

【精确属性】【泛化POI】

其中，【W:0～20】指长度在0～20的字符。

除此之外，在识别用户输入的语音指令具有泛化需求或精确需求时，还可以采用其他方式，例如采用预先训练得到的分类模型。预先收集或标注一些具有泛化需求的语音指令和具有精确需求的语音指令训练分类模型，其中语音指令作为分类模型的输入，对应需求作为分类模型的输出。在进行识别时，将用户输入的语音指令输入训练得到的分类模型，就可以得到对该语音指令的分类结果，即是泛化需求还是精确需求。

在203中，将该用户的属性与语音指令所包含泛化POI的属性进行匹配。

本步骤中，可以查询预先构建的POI知识图谱，确定语音指令所包含泛化POI的属性，将用户的属性与泛化POI的属性进行匹配。

为了方便对本发明实施例的理解，首先对POI知识图谱的构建进行描述。如图3所示，POI知识图谱的构建方法可以包括以下步骤：

在301中，获取并记录各泛化POI和精确POI。

本步骤中，可以从预先配置的泛化POI词典和精确POI词典中获取各泛化POI和精确POI，并进行记录用以构建POI知识图谱。

在302中，针对各泛化POI标注对应的泛化属性。

本步骤中可以由人工配置，即获取标注用户针对各泛化POI标注的泛化属性。举个例子，如图4a中所示，对于泛化POI“餐厅”，可以标注其泛化属性包括“地理位置”、“配套设施”、“环境氛围”、“菜品风格”、“性价比”、“服务态度”。

在303中，针对各泛化属性标注对应的精确属性。

本步骤同样可以由人工配置，即获取标注用户针对各泛化属性标注的精确属性。举个例子，如图4b中所示，针对图中的泛化属性“配套设施”标注其对应的精确属性包括“停车位”、“会议室”、“包间”、“儿童座椅”、“Wifi”、“电视”等等。

在304中，将各精确POI与各精确属性进行对应关联。

本步骤同样可以由人工配置，但鉴于标注工作量大且具有较大主观性，因此在此提供一种优选的实施方式，即从网页数据中进行挖掘的方式。将网页数据与预设的模板进行匹配，将与同一模板匹配的精确POI和精确属性进行对应关联。

其中，网页数据可以是地图类应用中用户提交的数据、点评类应用中用户提交的数据等，也可以是诸如广告、新闻等网页数据。

预设的模板从同时包含精确POI和精确属性的句子表达中提取，也可以人工配置。例如模板可以包括：

【精确POI】提供【精确属性】

【精确POI】有【精确属性】

【精确POI】没有【精确属性】

【精确POI】被称为【精确属性】

……

举个例子，在点评类应用中存在用户提交的点评内容：“中关村森林公园提供大量免费停车位”、“中关村森林公园被称为遛娃圣地”、“中关村森林公园有中心湖”，等等。可以对这些点评内容进行打分，例如依据用户信誉等级、应用的信誉等级、点评内容出现的次数等等，然后筛选出分数达到预设要求的点评内容，将其与预设的模板进行匹配，获得精确POI与精确属性的对应关系。接续上例，可以得到“中关村森林公园”对应精确属性“免费停车位”、“遛娃圣地”、“有中心湖”，等等，如图4c所示。

除了模板匹配的方式之外，还可以从网页数据中统计精确POI和精确属性在同一句子或段落中的共现状况，将共现状况满足预设共现要求的精确POI和精确属性进行对应关联。其中共现状况可以是共现次数、共现频率等。例如，若在点评类应用用户提供的点评内容中，“中关村森林公园”与“允许露营”大量共现(即共同出现)于同一个句子中，共现次数超过了预设的共现次数阈值，则可以将“中关村森林公园”与“允许露营”进行对应关联，如图4c所示。

至此，POI知识图谱构建完成，该POI知识图谱中包括泛化POI、泛化POI的泛化属性、泛化属性对应的精确属性、精确POI以及精确POI与精确属性的对应关系。

因此步骤203中可以查询POI知识图谱，确定语音指令所包含泛化POI的属性。由于需要将用户的属性与泛化POI的属性进行匹配，在此对用户的属性如何确定进行描述。

作为一种优选的实施方式，可以利用用户的历史搜索记录与预先构建的知识图谱中的各精确属性进行匹配，将匹配状况满足预设要求的精确属性作为该用户的属性。其中用户的历史搜索记录可以包括但不限于：用户历史采用的搜索词(query)、点击的搜索结果的标题、浏览的网页等。举个例子，用户历史搜索记录中，用户多次采用query“好吃的粤菜”，其中“粤菜”与知识图谱中的精确属性匹配，若匹配的次数超过了预设的次数阈值，则可以将“粤菜”作为用户的属性。再举个例子，用户历史搜索记录中，用户点击搜索结果的标题为“安静的就餐环境”，其中“安静”与知识图谱中的精确属性匹配，若匹配的次数超过了预设的次数阈值，则可以将“安静”作为用户的属性。再举个例子，譬如用户搜索了中关村森林公园这个精确POI，那么中关村森林公园对应的精确属性，例如“安静”、“免费停车”、“遛娃圣地”、“适合跑步”，就会作为用户属性的候选，与用户其他搜索的精确POI对应的精确属性进行合并，当这个精确属性的次数超过一定阈值，则作为用户的属性。

通过将用户的属性与泛化POI的属性进行匹配，就可以得到与泛化POI的属性匹配的用户属性。举个例子，假设用户输入语音指令“帮我找一个吃饭的地方”，其包括的泛化POI为“餐厅”，其在知识图谱中对应的属性如图4a中所示。用户的属性包括“儿童座椅”、“安静”、“粤菜”等，其中“儿童座椅”与泛化POI的属性“配套设施”匹配，“安静”与泛化POI的属性“环境氛围”匹配，“粤菜”与泛化POI的属性“菜品风格”匹配。

继续参见图2，在204中，利用匹配结果，生成精确需求引导语句用于返回给该用户。

本步骤中，可以利用与泛化POI的属性匹配的用户属性、语音指令所包含泛化POI以及预先设置的第一类引导语句模板，生成精确需求引导语句。其中精确需求引导语句用于引导用户进一步输入精确需求的语音指令。

接续上例，由于针对语音指令“帮我找一个吃饭的地方”，确定出的与泛化POI的属性匹配的用户属性包括“儿童座椅”、“安静”、“粤菜”，假设预先配置的第一类引导语句模板为：

根据您的喜好，需要找一个【用户属性】的【泛化POI】吗？

则生成的精确需求引导语句可以为“根据您的喜好，需要找一个能提供儿童座椅、安静的粤菜的餐厅吗”。其中生成的引导语句可以根据语法表达等进行适应性调整，以使其更加符合习惯或更通顺。

服务器将精确需求引导语句发送给对应终端设备，由终端设备提供给用户。

继续上例，由于返回给用户的响应结果“根据您的喜好，需要找一个能提供儿童座椅、安静的粤菜的餐厅吗”是根据用户属性得到的，因此很大概率是符合用户需求的。用户很可能回答“可以”，此时可以认为用户的查询需求为“能提供儿童座椅、安静的粤菜的餐厅”，此时可以认为用户输入的语音指令为“能提供儿童座椅、安静的粤菜的餐厅”，继续转至执行步骤201。

在205中，生成包含精确POI的搜索结果用于返回给用户。

在识别出用户输入的语音指令为精确需求时，可能包含两种情况：

第一种情况：语音指令包含精确POI。举个例子，用户输入“中关村森林公园”。对于这种情况，搜索“中关村森林公园”，具体搜索结果可以依据具体应用提供的服务决定。例如在地图类应用中，可以返回包含中关村森林公园位置信息的搜索结果。

第二种情况：语音指令包含精确属性和泛化POI。举个例子，用户输入“能提供儿童座椅、安静的粤菜的餐厅”，则搜索能提供儿童座椅、安静的粤菜的餐厅，将搜索到的各餐厅作为搜索结果。例如：乐满堂、港丽、太兴……。

在206中，将用户的属性与搜索结果所包含精确POI的属性进行匹配。

本步骤可以查询预先构建的POI知识图谱，确定搜索结果所包含精确POI的属性；将用户的属性与确定出的精确POI的属性进行匹配，可以确定出与用户属性匹配的精确POI的属性。

在207中，利用匹配结果，生成选择性引导语句用于与上述搜索结果一起返回给用户。

本步骤中，可以利用与用户的属性匹配的精确POI的属性以及预先设置的第二类引导语句模板，生成选择性引导语句。其中，选择性引导语句用于引导用户从该语句提供的选项中选择一个作为进一步输入的语音指令。

举个例子，对于语音指令“中关村森林公园”，返回的搜索结果中包含精确POI“中关村森林公园”的定位结果。假设与用户的属性进行匹配后，得到与用户的属性匹配的精确POI的属性为“遛娃”，预设的第二类引导语句模板为：

为你找到【精确POI】，很不错的【精确POI的属性】地点，去这里可以吗？

则可以生成的选择性引导语句为“为你找到中关村森林公园，很不错的遛娃地点，去这里可以吗”。

服务器将上述包含精确POI的搜索结果以及选择性引导语句一起发送给对应终端设备，由终端设备提供给用户。若用户回答“可以”，则为用户进一步提供到中关村森林公园的路线。

再举个例子，对于语音指令“能提供儿童座椅、安静的粤菜的餐厅”，搜索结果为“乐满堂、港丽、太兴……”，假设与用户属性进行匹配后，均能够匹配到“儿童座椅”、“安静”、“粤菜”，预设的第二类引导语句模板为：

为您找到【精确POI】，提供【精确POI的属性】，请您选择。

则可以生成的选择性引导语句为“为您找到乐满堂、港丽、太兴，提供儿童座椅、安静的粤菜，请您选择”。用户可以继续从中选择一个具体的餐厅作为语音指令。然后可以继续转至执行步骤201。

除了此方式之外，也可以不执行206和207，仅将包含精确POI的搜索结果发送给对应终端设备，由终端设备提供给用户。

在此进行一个比较，对于同一个用户而言，输入语音指令“帮我找一个吃饭的地方”，采用现有技术中的方式向用户返回的结果为“为您找到U鼎冒菜、九鼎辉煌美食广场、麦当劳”，这些通常是按照搜索热度排列的。但若用户的属性包括“儿童座椅”、“安静”、“粤菜”，则很显然现有技术返回的这些结果完全不是用户需要的。用户需要重新去构思如何输入合适的语音指令。但往往一个不熟知该语音交互产品工作模式的用户很难构思出合适的语音指令来找到自己需要的结果，就可能会反复尝试输入直至找到合适的结果。很显然操作不便，交互效率低下。

若采用本发明实施例提供的方式，则向用户返回结果“根据您的喜好，需要找一个能提供儿童座椅、安静的粤菜的餐厅吗”，这一结果是根据用户属性得到的，很大概率符合用户需求。用户直接回答“可以”即可进一步为用户返回具体的能够提供儿童座椅、安静的粤菜的餐厅。大大简化了用户操作，提高了交互效率。

图5为本发明实施例提供的语音指令的处理装置的结构示意图，该装置可以设置于服务器端，可以是位于服务器端的应用，也可以是位于服务器端的应用中的插件或软件开发工具包(Software Development Kit，SDK)等功能单元。当然如果终端设备具有足够的存储和计算能力，该装置也可以设置于终端设备，本发明对此不进行特别限制。如图5中所示，该装置可以包括：识别单元01、第一匹配单元02和第一生成单元03，还可以进一步包括第二生成单元04、第二匹配单元05、确定单元06和构建单元07。其中各组成单元的主要功能如下：

识别单元01负责识别用户输入的语音指令是否具有泛化需求。

其中，识别单元01可以将用户输入的语音指令与预先配置的精确POI词典进行匹配，若语音指令包含精确POI，则确定语音指令具有精确需求；将用户输入的语音指令与预先配置的泛化POI词典和精确属性词典进行匹配，如果语音指令包含泛化POI和精确属性的组合，则确定语音指令具有精确需求，如果语音指令仅包含泛化POI，则确定语音指令具有泛化需求。

除此之外，识别单元01在识别用户输入的语音指令具有泛化需求或精确需求时，还可以采用其他方式，例如采用预先训练得到的分类模型。预先收集或标注一些具有泛化需求的语音指令和具有精确需求的语音指令训练分类模型，其中语音指令作为分类模型的输入，对应需求作为分类模型的输出。在进行识别时，将用户输入的语音指令输入训练得到的分类模型，就可以得到对该语音指令的分类结果，即是泛化需求还是精确需求。

若识别单元01识别出语音指令具有泛化需求，则第一匹配单元02将用户的属性与语音指令所包含泛化兴趣点POI的属性进行匹配。

第一生成单元03负责利用第一匹配单元02的匹配结果，生成精确需求引导语句用于返回给用户。

具体地，第一匹配单元02可以查询预先构建的POI知识图谱，确定语音指令所包含泛化POI的属性；将用户的属性与泛化POI的属性进行匹配。第一生成单元03利用与泛化POI的属性匹配的用户属性、泛化POI以及预先设置的第一类引导语句模板，生成精确需求引导语句。

若识别单元01识别出语音指令具有精确需求，则第二生成单元04生成包含精确POI的搜索结果用于返回给用户。

更进一步地，若识别单元01识别出语音指令具有精确需求，第二匹配单元05将用户的属性与搜索结果所包含精确POI的属性进行匹配；第二生成单元04利用第二匹配单元05的匹配结果，生成选择性引导语句用于与搜索结果一起返回给用户。

具体地，第二匹配单元05查询预先构建的POI知识图谱，确定搜索结果所包含精确POI的属性；将用户的属性与精确POI的属性进行匹配。第二生成单元04利用与用户的属性匹配的精确POI的属性以及预先设置的第二类引导语句模板，生成选择性引导语句。

确定单元06负责利用用户的历史搜索记录与预先构建的知识图谱中的各精确属性进行匹配，将匹配状况满足预设要求的精确属性作为用户的属性。

构建单元07负责构建POI知识图谱，具体地，可以针对各泛化POI标注对应的泛化属性，针对各泛化属性标注对应的精确属性，将各精确POI与各精确属性进行对应关联。

其中，构建单元07在将各精确POI与各精确属性进行对应关联时，具体执行：将网页数据与预设的模板进行匹配，将与同一模板匹配的精确POI和精确属性进行对应关联，预设的模板从同时包含精确POI和精确属性的句子表达中提取。

图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器012的框图。图6显示的计算机系统/服务器012仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于：一个或者多个处理器或者处理单元016，系统存储器028，连接不同系统组件(包括系统存储器028和处理单元016)的总线018。

总线018表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器028可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统034可以用于读写不可移动的、非易失性磁介质(图6未显示，通常称为“硬盘驱动器”)。尽管图6中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块042的程序/实用工具040，可以存储在例如存储器028中，这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。

计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信，在本发明中，计算机系统/服务器012与外部雷达设备进行通信，还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信，和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且，计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白，尽管图6中未示出，可以结合计算机系统/服务器012使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元016通过运行存储在系统存储器028中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的方法流程。

上述的计算机程序可以设置于计算机存储介质中，即该计算机存储介质被编码有计算机程序，该程序在被一个或多个计算机执行时，使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如，被上述一个或多个处理器执行本发明实施例所提供的方法流程。

随着时间、技术的发展，介质含义越来越广泛，计算机程序的传播途径不再受限于有形介质，还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种语音指令的处理方法，其特征在于，该方法包括：

识别用户输入的语音指令是否具有泛化需求；

如果是，查询预先构建的POI知识图谱，确定所述语音指令所包含泛化POI的属性；将所述用户的属性与所述泛化POI的属性进行匹配；

利用与所述泛化POI的属性匹配的用户属性、所述泛化POI以及预先设置的第一类引导语句模板，生成精确需求引导语句用于返回给所述用户；其中，

所述POI知识图谱的构建包括：

针对各泛化POI标注对应的泛化属性；

针对各所述泛化属性标注对应的精确属性；

将各精确POI与各所述精确属性进行对应关联。

2.根据权利要求1所述的方法，其特征在于，所述识别用户输入的语音指令是否具有泛化需求包括：

3.根据权利要求1所述的方法，其特征在于，该方法还包括：

4.根据权利要求3所述的方法，其特征在于，在生成包含精确POI的搜索结果的同时，还包括：

5.根据权利要求4所述的方法，其特征在于，将所述用户的属性与所述搜索结果所包含精确POI的属性进行匹配包括：

所述利用匹配结果，生成选择性引导语句包括：

6.根据权利要求1所述的方法，其特征在于，所述用户的属性的确定包括：

7.根据权利要求1所述的方法，其特征在于，所述将各精确POI与各所述精确属性进行对应关联包括：

8.一种语音指令的处理装置，其特征在于，该装置包括：

第一匹配单元，用于若所述识别单元识别出所述语音指令具有泛化需求，则查询预先构建的POI知识图谱，确定所述语音指令所包含泛化POI的属性；将所述用户的属性与所述泛化POI的属性进行匹配；

第一生成单元，用于利用与所述泛化POI的属性匹配的用户属性、所述泛化POI以及预先设置的第一类引导语句模板，生成精确需求引导语句用于返回给所述用户；

该装置还包括：

构建单元，具体用于采用以下方式构建POI知识图谱：

针对各泛化POI标注对应的泛化属性；

针对各所述泛化属性标注对应的精确属性；

将各精确POI与各所述精确属性进行对应关联。

9.根据权利要求8所述的装置，其特征在于，所述识别单元具体用于：

10.根据权利要求8所述的装置，其特征在于，该装置还包括：

11.根据权利要求10所述的装置，其特征在于，该装置还包括：

12.根据权利要求11所述的装置，其特征在于，所述第二匹配单元，用于查询预先构建的POI知识图谱，确定所述搜索结果所包含精确POI的属性；将所述用户的属性与所述精确POI的属性进行匹配；

13.根据权利要求8所述的装置，其特征在于，该装置还包括：

14.根据权利要求8所述的装置，其特征在于，所述构建单元在将各精确POI与各所述精确属性进行对应关联时，具体执行：

15.一种设备，其特征在于，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

16.一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的方法。