CN115588433A

CN115588433A - 语音交互方法、服务器及计算机可读存储介质

Info

Publication number: CN115588433A
Application number: CN202211480470.3A
Authority: CN
Inventors: 樊骏锋; 丁鹏傑; 赵群; 宁洪珂
Original assignee: Guangzhou Xiaopeng Motors Technology Co Ltd
Current assignee: Guangzhou Xiaopeng Motors Technology Co Ltd
Priority date: 2022-11-24
Filing date: 2022-11-24
Publication date: 2023-01-10

Abstract

本申请公开了一种语音交互方法，包括：接收车辆转发的语音请求；处理语音请求，确定响应语音请求的目标车载系统小程序以及目标车载系统小程序中用于实现语音请求的目标功能页面，以通过车辆展示目标功能页面完成语音交互。本申请中，用户通过语音与车辆进行交互，服务器可确定能够实现功能需求的目标车载系统小程序中的目标功能页面。车辆可直接展示目标功能页面完成语音交互过程。本申请的语音交互方法可识别用户语音请求的功能需求，开始运行相应车载系统小程序并直达实现目标功能的页面，无需用户进行过多的手动操作便可实现功能需求，提高语音交互的便捷性和车载系统小程序的使用效率，改善用户体验。

Description

语音交互方法、服务器及计算机可读存储介质

技术领域

本申请涉及车载语音技术领域，特别涉及一种语音交互方法、服务器及计算机可读存储介质。

背景技术

目前，车载语音技术可以支持用户通过语音在车辆座舱内进行交互，例如控制车辆零部件或与车载系统用户界面中的组件进行交互。在用户与车载系统小程序进行语音交互的场景中，仅支持语音控制小程序的打开或关闭，用户若需实现小程序中的具体功能往往需要多次手动操作，影响语音交互的流畅性和便捷性，用户使用体验不佳。

发明内容

本申请提供了一种语音交互方法、服务器及计算机可读存储介质。

本申请的语音交互方法，包括：

接收车辆转发的语音请求；

处理所述语音请求，确定响应所述语音请求的目标车载系统小程序以及所述目标车载系统小程序中用于实现所述语音请求的目标功能页面，以通过所述车辆展示所述目标功能页面完成所述语音交互。

如此，本申请中，在用户需要实现小程序中具体功能时，可通过语音与车辆进行交互，服务器对接收的语音请求进行处理后，可确定能够实现功能需求的目标车载系统小程序，以及具有实现功能的目标功能页面。车辆可直接展示目标功能页面完成语音交互过程。本申请的语音交互方法可识别用户语音请求的功能需求，运行相应车载系统小程序并直达实现目标功能的页面，无需用户进行过多的手动操作便可实现功能需求，提高语音交互的便捷性和车载系统小程序的使用效率，改善用户体验。

所述方法还包括：

根据处理所述语音请求得到的意图信息，确认通过车载系统小程序实现所述语音请求。

如此，可根据语音请求的意图信息，确定语音请求的需由车载系统小程序来实现。用户即可通过语音交互实现对车载系统小程序的控制，提高了车内语音交互的便捷性以及车载系统小程序的使用率。

所述根据处理所述语音请求，确定响应所述语音请求的目标车载系统小程序以及所述目标车载系统小程序中用于实现所述语音请求的目标功能页面，以通过所述车辆展示所述目标功能页面完成所述语音交互，包括：

根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面。

如此，可根据上述车载系统小程序的自定义词表及小程序流程节点的匹配关系，结合提取到的语音请求的槽位信息，以确定目标车载系统小程序以及目标功能页面。

所述根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面，包括：

根据所述槽位信息确定所述目标车载小程序；

根据所述目标车载小程序的小程序流程节点匹配关系，对所述槽位信息进行匹配处理，得到多个对应流程节点，其中，每个对应流程节点与一个功能页面的定位标识对应。

如此，根据用户语音请求的槽位信息确定目标车载小程序，并将槽位信息按小程序流程节点的匹配关系与流程节点进行匹配。槽位信息对应多个流程节点，以确定目标流程节点。

所述槽位信息包括用户自定义元素，所述根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面，包括：

在所述用户自定义元素存在于所述自定义词表中的情况下，将多个所述对应流程节点进行串联组合，确定所述目标流程节点。

如此，可在语音请求槽位信息中包含的用户自定义元素存在于自定义词表中时，串联每个槽位信息的对应流程节点，并确定为目标流程节点，便于确定目标功能页面，提高用户使用体验。

确定与所述目标流程节点对应的所述目标功能页面的定位标识；

对每个对应流程节点赋值相对应的槽位信息，以得到所述目标流程节点的信息；

根据所述目标流程节点的信息和所述定位标识，确定所述目标功能页面。

如此，可根据匹配结果得到目标流程节点的信息，并确定目标功能页面，以便最终通过车辆展示目标功能页面，实现目标功能，并完成语音交互。

在所述用户自定义元素不存在于所述自定义词表中的情况下，将与所述用户自定义元素对应的流程节点的前一流程节点确定为目标流程节点。

如此，可在语音请求槽位信息中包含的用户自定义元素不存在于自定义词表中时，返回前一流程节点并将其确定为目标流程节点，而不是直接结束语音交互流程，便于用户在自定义词表中进行其他选择，提高用户使用体验。

所述预定类别的车载系统小程序包括餐饮类、出行类、音乐类和/或支付类车载系统小程序。

如此，可实现多类型车载系统小程序的目标功能页面直达，使用户体验更加多元化。

处理所述语音请求得到意图信息和槽位信息；

对所述槽位信息进行归一化处理；

根据所述意图信息和所述归一化处理后的槽位信息，确定所述目标车载系统小程序和所述目标功能页面。

如此，在用户与非购物类车载系统小程序之间的语音交互的场景中，可处理语音请求得到的意图信息，结合归一化后的槽位信息，确定目标车载系统小程序，并直接打开目标功能页面，使语音交互过程更省时方便。

本申请的服务器，包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述的方法。

本申请的计算机可读存储介质，存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现上述的方法。

本申请的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实施方式的实践了解到。

附图说明

本申请的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解，其中：

图1是本申请语音交互方法的流程示意图之一；

图2是本申请语音交互方法的流程示意图之二。

具体实施方式

下面详细描述本申请的实施方式，实施方式的示例在附图中示出，其中，相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本申请的实施方式，而不能理解为对本申请的实施方式的限制。

请参阅图1及图2，本申请提供一种语音交互方法，包括：

01：接收车辆转发的语音请求；

02：处理语音请求，确定响应语音请求的目标车载系统小程序以及目标车载系统小程序中用于实现语音请求的目标功能页面，以通过车辆展示目标功能页面完成语音交互。

本申请还提供了一种服务器，服务器包括存储器和处理器。本申请的语音处理方法可以由本申请的服务器实现。具体地，存储器中存储有计算机程序，处理器用于接收车辆转发的语音请求，处理语音请求，确定响应语音请求的目标车载系统小程序以及目标车载系统小程序中用于实现语音请求的目标功能页面，以通过车辆展示目标功能页面完成语音交互。

随着车辆电子技术的发展与普及，车辆的显示装置例如中控显示屏，在交互功能方面得到较大的丰富，越来越多的服务以小程序的形态接入车机端。小程序平台的引入满足了驾驶员和乘客行驶过程中的多样体验。然而，语音操作也仅提供用户通过语音打开小程序，进入小程序后的操作仍然只能由用户手动完成，便捷性较差，用户体验不佳。相关技术中，为了方便用户操作，可通过语音实现小程序的页面直达或页面形式的元素直达。例如，当用户发出的语音请求为“我想点一份餐饮小程序A的商品a”时，仅支持语音控制小程序的打开或关闭，而无法直接完成商品选择、收货地址设置后直接跳转至确认支付信息页面，便捷性较差，用户体验不佳。因此，在用户需求场景步骤更为复杂的情况下，无法高效地利用相应的小程序来满足需求。

本申请可支持根据语音请求内容的小程序元素直达。如图2所示，本申请的一个示例中，用户发出“我想点一份餐饮小程序A的商品a”，服务器可使小程序直达显示最后提交订单页面，用户仅需确认支付信息即可。其中，“餐饮小程序A”和“商品a”均可根据用户的需求变化进行改变。

本申请中涉及的车载系统小程序，是面向用户根据个人需要，运行在车载系统上的小程序，无需车辆预先安装和适配。目标车载系统小程序是能够响应用户的语音请求并实现语音请求功能需求的车载系统小程序。目标功能页面即为目标车载系统小程序中具有实现语音请求功能需求能力的页面。服务器在接收到该类语音请求后，可确定相应语音请求的目标车载系统小程序，并直达用于实现语音请求的目标功能页面，最终可通过车辆展示目标功能页面，完成语音交互过程。

进一步地，在上述实施例中，还可以通过地点限定语音请求的实际内容。例如，用户发出语音请求为“点一份餐饮小程序A的商品a到公司”，当历史订单信息中存在用户设置的“公司”的位置信息的情况下，可在完成“餐饮小程序A”和“商品a”的选择后，将收货地址自动填写为用户设置的“公司”所在地址，小程序可直达到最后提交订单页面，用户仅需在该页面中确认支付信息即可。本申请的语音交互方法，可以使用户无需进行过多手动操作而实现车载系统小程序具体功能。

综上，本申请中，在用户需要实现小程序中具体功能时，通过语音与车辆进行交互，服务器对接收的语音请求进行处理后，可确定能够实现功能需求的目标车载系统小程序，以及具有实现功能的目标功能页面。车辆可直接展示目标功能页面完成语音交互过程。本申请的语音交互方法可识别用户语音请求的功能需求，开始运行相应车载系统小程序并直达实现目标功能的页面，无需用户进行过多的手动操作便可实现功能需求，提高语音交互的便捷性和车载系统小程序的使用效率，改善用户体验。

语音交互方法还包括：

根据处理语音请求得到的意图信息，确认通过车载系统小程序实现语音请求。

处理器用于根据处理语音请求得到的意图信息，确认通过车载系统小程序实现语音请求。

具体地，请参阅图2，可对所有接入车载系统的小程序的功能进行梳理，分析用户语音请求意图信息所在的业务领域。例如，在上述示例中，语音请求的意图信息存在“购物车”时，判断该语音请求是需要通过车载系统小程序来实现的，服务器即可在车载系统用户界面中运行相应的车载系统小程序。

预定类别的车载系统小程序包括餐饮类、出行类、音乐类和/或支付类车载系统小程序。

具体地，车载系统小程序包括餐饮类、出行类、音乐类及支付类，一个车载系统可能包含其中一种或多种车载系统小程序。车载系统中每种小程序中各项功能的实现可能包括一个多个页面的展示。其中，对各类小程序的数量和具体小程序不作限定。

步骤02包括：

根据处理语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定目标车载系统小程序以及目标功能页面。

处理器用于根据处理语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定目标车载系统小程序以及目标功能页面。

自定义词表是车载系统小程序的信息提供方在车载系统小程序内存储的含多种元素的词表，可供语音交互参考。如表1所示，预定类别的车载系统小程序包括餐饮类、出行类、音乐类以及支付类车载系统小程序。服务器可接入由外部数据平台建立的小程序与其对应的自定义词表。

表1

具体地，可将语音请求的槽位信息与服务器中接入的车载系统小程序的自定义词表相对应，得到小程序流程节点匹配关系。请参阅表2，以餐饮小程序A为例，小程序运行过程中小程序流程节点的匹配关系如表所示。

表2

可根据上述车载系统小程序的自定义词表及小程序流程节点的匹配关系，结合提取到的语音请求的槽位信息，确定目标车载系统小程序以及目标功能页面。

根据处理语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定目标车载系统小程序以及目标功能页面的步骤包括：

根据槽位信息确定目标车载小程序；

根据目标车载小程序的小程序流程节点匹配关系，对槽位信息进行匹配处理，得到多个对应流程节点。

处理器用于根据槽位信息确定目标车载小程序，以及根据目标车载小程序的小程序流程节点匹配关系，对槽位信息进行匹配处理，得到多个对应流程节点。

其中，每个对应流程节点与一个功能页面的定位标识对应。具体地，服务器可对用户发出的语音请求进行处理得到语音请求的槽位信息。例如在用户语音请求为“点一份餐饮小程序A的商品a到公司”时，提取到的槽位信息为“餐饮小程序A”、“商品a”、“一份”“公司”。由此可得到目标车载系统小程序为“餐饮小程序A”。

随后，可根据目标小程序对应的流程节点匹配关系，对每个槽位信息进行匹配处理，即名称=“餐饮小程序A”、搜索=“商品a”、数量=“1”以及地址=“公司”。匹配所得元素直达已设置的流程节点，即槽位信息“餐饮小程序A”对应“节点一”；“商品a”对应“节点三”；“公司”对应“节点六”。

如此，可根据用户语音请求的槽位信息确定目标车载小程序，并将槽位信息按小程序流程节点的匹配关系与流程节点进行匹配。槽位信息对应多个流程节点，以确定目标流程节点。

在用户自定义元素存在于自定义词表中的情况下，将多个对应流程节点进行串联组合，确定目标流程节点。

处理器用于在用户自定义元素存在于自定义词表中的情况下，将多个对应流程节点进行串联组合，确定目标流程节点。

具体地，请参阅图2，用户自定义元素包括用户根据喜好或需求定义的各项元素。当用户发出的语音请求的槽位信息中包含用户自定义元素，且该用户自定义元素存在于自定义词表中时，将包含用户自定义元素的槽位信息与流程节点的匹配完成后，可通过串联的方式组合多个对应流程节点，最终按一定流程顺序可确定目标流程节点。

例如，用户发出语音请求“点一份餐饮小程序A的商品a到公司”，其中“餐饮小程序A”、“商品a”、“一份”“公司”均为自定义词表中的自定义元素，可将每个自定义元素匹配所得的流程节点，即槽位信息“餐饮小程序A”对应“节点一”；“商品a”和“一份”对应“节点三”；“公司”对应“节点六”，按小程序流程顺序进行串联，以此可确定目标流程节点为节点七，即“确认支付信息”节点。

确定与目标流程节点对应的目标功能页面的定位标识；

对每个对应流程节点赋值相对应的槽位信息，以得到目标流程节点的信息；

根据目标流程节点的信息和定位标识，确定目标功能页面。

处理器用于确定与目标流程节点对应的目标功能页面的定位标识，并对每个对应流程节点赋值相对应的槽位信息，以得到目标流程节点的信息，以及根据目标流程节点的信息和定位标识，确定目标功能页面。

具体地，以餐饮小程序A为例，请参阅表2，每一个节点都有对应的定位标识，定位标识可以选取统一资源定位符，定位标识的类型选取在此不作限定。例如，在语音请求“点一份餐饮小程序A的商品a到公司”中，串联得到目标流程节点对应的目标功能页面的定位标识，即“Confirm payment”。执行目标功能页面对应的定位标识可以实现向用户呈现包含语音请求槽位信息的页面。

在槽位信息与流程节点的对应关系匹配完成后，服务器可在每个节点上都赋予槽位信息，即Open=“餐饮小程序A”，Search=商品a，Specifications=default，Number=1，Addaddress=“公司”。赋值完毕得到该节点的信息为：Search=商品a; Specifications=default; Number=1; Add address=“公司”; Confirm Payment，得到目标流程节点为“节点七”。

最后，可根据目标流程节点的信息，即节点七，和定位标识，即“Confirmpayment”，确定目标功能页面为“确认支付信息”页面。可实现用户通过发出语音请求“点一份餐饮小程序A的商品a到公司”后，车载系统无需经过用户手动操作即可完成打开页面、搜索商品、选择商品规格、添加购物车、确认订单、添加收货地址等步骤，直达用户确认支付信息页面，用户即可直接在页面内确认支付信息。

根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面包括：

在用户自定义元素不存在于自定义词表中的情况下，将与用户自定义元素对应的流程节点的前一流程节点确定为目标流程节点。

处理器用于在用户自定义元素不存在于自定义词表中的情况下，将与用户自定义元素对应的流程节点的前一流程节点确定为目标流程节点。

具体地，用户一条语音请求对应一个具体的意图信息，每个具体的意图信息对应唯一的定位标识，这使服务器仅支持页面直达而不能直接对页面中的元素进行操作。若要做到“自定义”的元素直达，需提前对自定义词表中的元素进行定义。由于每个语音请求都对应一个新的意图信息，如“点一份餐饮小程序A的商品a到公司”和“点一份餐饮小程序A的商品b到公司”两条语音请求虽仅有所点商品不同，但由于是需要在购物车里存放不同的商品，所对应的定位标识也不同，因此类似于定义最小维度的定位标识的过程类似于穷举。在上述示例中，对于语音请求“点一份餐饮小程序A的商品a到公司”中，若餐饮小程序下架了商品a，则与商品a相对应的定位标识就不再存在于自定义词表中。若此时语音助手无法执行用户发出的包含“商品a”的语音请求，并向用户反馈“听不懂”及其类似的语音，且不返回上一个页面让用户选择其他产品，则不仅降低了语音交互过程的效率，并且用户体验感不佳。

本申请中，当用户自定义元素不存在于自定义词表中时，只需要查询自定义词表，例如，当“商品a”被商家下架而不存在词表中时，无需直达目标功能页面，而是将前一个不含“商品a”的流程节点确定为目标流程节点。即在语音请求为“点一份餐饮小程序A的商品a到公司”时，“商品a”不再存在于词表中。此时小程序无法直达确认支付信息的页面，可向用户发出“商品a已下架”等语音回复，并退回到选择商品的页面，以便用户重新选择其他商品。

步骤02还包括：

处理语音请求得到意图信息和槽位信息；

对槽位信息进行归一化处理；

根据意图信息和归一化处理后的槽位信息，确定目标车载系统小程序和目标功能页面。

处理器用于处理语音请求得到意图信息和槽位信息，并对槽位信息进行归一化处理，以及根据意图信息和归一化处理后的槽位信息，确定目标车载系统小程序和目标功能页面。

具体地，在用户与非购物类车载系统小程序之间的语音交互的场景中，不需要多页面按顺序展示，可用更简化的步骤完成语音交互过程。首先通过自然语言理解处理用户发出的语音请求，得到语音请求的意图信息和槽位信息，而后对槽位信息进行归一化处理，最终确定目标车载系统小程序和目标功能页面，并直接打开车载系统小程序及相应页面。

用户出示个人健康状态识别信息的过程，需要自行点击进入并且打开对应二级页面，过程相对耗时。在本申请一个示例中，而当用户发出的语音请求“打开健康小程序A自查”时，可通过自然语言理解识别到语音请求中的意图信息为“打开健康小程序A”；槽位信息为“健康小程序A”和“自查”，归一化后得到槽位信息为“健康小程序A”与“本人健康状态识别信息自查询”。最后可结合意图信息，并根据归一化后的槽位信息，确定目标车载系统小程序和目标功能页面，直接打开相应目标功能页面，即健康状态识别信息页面，完成语音交互过程。

本申请的计算机可读存储介质，存储有计算机程序，当计算机程序被一个或多个处理器执行时，实现上述的方法。

在本说明书的描述中，参考术语“上述”、“具体地”、“类似地”、“进一步地”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行请求的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

尽管上面已经示出和描述了本申请的实施方式，可以理解的是，上述实施方式是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施方式进行变化、修改、替换和变型。

Claims

1.一种语音交互方法，其特征在于，包括：

接收车辆转发的语音请求；

2.根据权利要求1所述的语音交互方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的语音交互方法，其特征在于，所述处理所述语音请求，确定响应所述语音请求的目标车载系统小程序以及所述目标车载系统小程序中用于实现所述语音请求的目标功能页面，以通过所述车辆展示所述目标功能页面完成所述语音交互，包括：

4.根据权利要求3所述的语音交互方法，其特征在于，所述根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面，包括：

根据所述槽位信息确定所述目标车载小程序；

5.根据权利要求4所述的语音交互方法，其特征在于，所述槽位信息包括用户自定义元素，所述根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面，包括：

在所述用户自定义元素存在于所述自定义词表中的情况下，将多个所述对应流程节点进行串联组合，确定目标流程节点。

6.根据权利要求5所述的语音交互方法，其特征在于，所述根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面，包括：

7.根据权利要求5所述的语音交互方法，其特征在于，所述根据处理所述语音请求得到的槽位信息和预先构建的预定类别的车载系统小程序的自定义词表、小程序流程节点匹配关系，确定所述目标车载系统小程序以及所述目标功能页面，包括：

8.根据权利要求3所述的语音交互方法，其特征在于，所述预定类别的车载系统小程序包括餐饮类、出行类、音乐类和/或支付类车载系统小程序。

9.根据权利要求3所述的语音交互方法，其特征在于，所述根据处理所述语音请求，确定响应所述语音请求的目标车载系统小程序以及所述目标车载系统小程序中用于实现所述语音请求的目标功能页面，以通过所述车辆展示所述目标功能页面完成所述语音交互，包括：

处理所述语音请求得到意图信息和槽位信息；

对所述槽位信息进行归一化处理；

10.一种服务器，其特征在于，所述服务器包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现权利要求1-9任意一项所述的方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现如权利要求1-9任意一项所述的方法。