CN117059095B

CN117059095B - 基于ivr的服务提供方法、装置、计算机设备及存储介质

Info

Publication number: CN117059095B
Application number: CN202310906200.2A
Authority: CN
Inventors: 欧俊健; 陈锷
Original assignee: Guangzhou Ruixiang Communication Technology Co ltd
Current assignee: Guangzhou Ruixiang Communication Technology Co ltd
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2024-04-30
Anticipated expiration: 2043-07-21
Also published as: CN117059095A

Abstract

本申请实施例属于人工智能领域，涉及一种基于IVR的服务提供方法、装置、计算机设备及存储介质，方法包括：基于与用户终端建立的IVR连接，获取用户的用户语音；对用户语音进行语音识别，并基于得到的语音识别结果生成用户文本；通过联合模型对用户文本进行意图识别得到用户意图，以及对用户文本进行事件提取得到事件提取结果，并根据用户意图和事件提取结果生成用户需求信息；从完整菜单树中生成与用户需求信息相匹配的目标菜单树，目标菜单树中各菜单项的排序位置按照与用户需求信息的匹配度确定；根据目标菜单树，通过用户终端与用户进行交互，以向用户提供IVR服务。本申请提高了IVR服务的准确性以及效率。

Description

基于IVR的服务提供方法、装置、计算机设备及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种基于IVR的服务提供方法、装置、计算机设备及存储介质。

背景技术

IVR(Interactive Voice Response)即交互式语音应答，它是一种自动化电话系统技术，用于处理和响应来自电话呼叫者(即用户)的语音输入。IVR系统通过预先录制的音频提示或合成的语音提示来与用户进行交互，并根据用户的输入提供相应的信息或执行特定的操作。IVR系统可以提供多种功能，例如通过语音菜单提供自助服务，让用户根据自己的需求选择相应的选项，如查询账户余额、了解产品信息等；或者，用户可以通过语音命令获取实时信息，如天气预报、股票行情、交通状况等。IVR系统可以减轻人工客服的负担，提供全天不间断的服务。

然而，当前的IVR系统只能实现固定的IVR服务流程，不管什么用户接入，IVR系统都是播报固定的菜单。当业务逻辑复杂时，菜单也会变得复杂，这使得用户需要花费较长时间收听菜单提示音，并可能中途遗忘某个菜单项以及需要进行的操作，或者无法及时获取到所需的服务，导致IVR系统的服务效率较低。

发明内容

本申请实施例的目的在于提出一种基于IVR的服务提供方法、装置、计算机设备及存储介质，以解决IVR系统服务效率较低的问题。

为了解决上述技术问题，本申请实施例提供一种基于IVR的服务提供方法，采用了如下所述的技术方案：

基于与用户终端建立的I VR连接，获取用户的用户语音；

对所述用户语音进行语音识别，并基于得到的语音识别结果生成用户文本；

通过联合模型对所述用户文本进行意图识别得到用户意图，以及对所述用户文本进行事件提取得到事件提取结果，并根据所述用户意图和所述事件提取结果生成用户需求信息；

从完整菜单树中生成与所述用户需求信息相匹配的目标菜单树，所述目标菜单树中各菜单项的排序位置按照与所述用户需求信息的匹配度确定；

根据所述目标菜单树，通过所述用户终端与所述用户进行交互，以向所述用户提供I VR服务。

为了解决上述技术问题，本申请实施例还提供一种基于I VR的服务提供装置，采用了如下所述的技术方案：

语音获取模块，用于基于与用户终端建立的I VR连接，获取用户的用户语音；

文本生成模块，用于对所述用户语音进行语音识别，并基于得到的语音识别结果生成用户文本；

需求生成模块，用于通过联合模型对所述用户文本进行意图识别得到用户意图，以及对所述用户文本进行事件提取得到事件提取结果，并根据所述用户意图和所述事件提取结果生成用户需求信息；

菜单树生成模块，用于从完整菜单树中生成与所述用户需求信息相匹配的目标菜单树，所述目标菜单树中各菜单项的排序位置按照与所述用户需求信息的匹配度确定；

服务提供模块，用于根据所述目标菜单树，通过所述用户终端与所述用户进行交互，以向所述用户提供I VR服务。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如上所述的基于I VR的服务提供方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上所述的基于I VR的服务提供方法的步骤。

与现有技术相比，本申请实施例主要有以下有益效果：与用户终端建立I VR连接后，获取用户的用户语音，以进行语音识别并生成用户文本；通过联合模型对用户文本进行意图识别得到用户意图，以及进行事件提取得到事件提取结果，根据用户意图和事件提取结果生成用户需求信息，用户需求信息可以完整反应用户本次请求服务的目的；I VR系统中具有完整菜单树，完整菜单树可以表示I VR系统提供的全部业务服务；从完整菜单树中生成与用户需求信息相匹配的目标菜单树，目标菜单树与用户需求信息具有较强的匹配度，目标菜单树中，节点与用户需求信息的匹配度越高，节点所对应的菜单项在目标菜单树中的排序位置越靠前；当根据目标菜单树与用户进行交互时，用户可以更快地获取到与自己需求相关的菜单项信息，并跳过与自己需求无关的菜单项信息，提高了I VR系统服务的效率以及准确性。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的基于I VR的服务提供方法的一个实施例的流程图；

图3是根据本申请的一个完整菜单树的示意图；

图4是根据本申请的基于I VR的服务提供装置的一个实施例的结构示意图；

图5是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio LayerIV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的基于IVR的服务提供方法一般由服务器执行，相应地，基于IVR的服务提供装置一般设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的基于IVR的服务提供方法的一个实施例的流程图。所述的基于IVR的服务提供方法，包括以下步骤：

步骤S201，基于与用户终端建立的IVR连接，获取用户的用户语音。

在本实施例中，基于IVR的服务提供方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端设备进行交互。需要指出的是，上述无线连接方式可以包括但不限于3G/4G/5G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

具体地，服务器中设置有IVR(Interactive Voice Response，交互式语音应答)系统，服务器可以通过IVR系统与用户持有的用户终端建立IVR(Interactive VoiceResponse)连接。IVR连接是指与IVR系统之间建立的连接，例如，用户通过用户终端呼叫预设号码，则建立的通话连接可以作为IVR连接。IVR系统通过IVR连接为用户提供IVR(Interactive Voice Response)服务。

步骤S202，对用户语音进行语音识别，并基于得到的语音识别结果生成用户文本。

具体地，用户终端与IVR系统建立IVR连接后，IVR系统可以先指示用户以语音的方式说明发起请求的缘由，并通过用户终端采集得到用户语音。

IVR系统对用户语音进行语音识别，得到语音识别结果，将语音信息转化成文本信息。语音识别结果中的文本信息可能带有口语化的表述，可以根据预设的预处理方式对语音识别结果进行规范化处理，例如去除语音识别结果中的语气词和停顿词，将预处理后的语音识别结果确定为用户文本。

步骤S203，通过联合模型对用户文本进行意图识别得到用户意图，以及对用户文本进行事件提取得到事件提取结果，并根据用户意图和事件提取结果生成用户需求信息。

具体地，IVR系统需要对用户文本进行意图识别，以获取用户意图；以及对用户文本进行事件提取，得到事件提取结果，事件提取结果反应用户语音中的事件，以固定格式表示用户想要做的事情。

IVR系统中具有联合模型，联合模型既可以执行意图识别任务，也可以执行事件提取任务，并可以对意图识别任务和事件提取任务进行联合建模，使两个任务可以共享参数，提高意图识别任务和事件提取任务的准确性。可以理解，用户意图和事件提取结果是有联系的，它们以不同形式表示用户想要做的事情、表达用户的需求。根据用户意图和事件提取结果，可以生成用户需求信息，用户需求信息可以完整且具体地表示用户的目的。

用户意图是指用户在与I VR系统交互时所表达的目的或意图，例如查询账户余额、订购产品、安排预约等。意图识别可以使用自然语言处理(NLP)技术，如文本分类、机器学习模型或预定义的规则来识别用户意图。

事件是指用户的输入中包含的具体事项、请求或操作。事件提取的目标是从用户文本中识别和提取出相关的事件信息。可能涉及到命名实体识别(NER)技术来识别文本中的特定实体，如日期、时间、地点、产品名称等。

用户意图和事件之间的联系可以通过分析用户文本得到。意图识别可以帮助I VR系统理解用户想要实现的目标，而事件提取则可以帮助系统获取关键信息，进一步处理用户请求。例如，当用户说：“我想预订明天下午2点的医生预约”，语音识别得到用户文本。通过意图识别，I VR系统可以确定用户的意图是“预约医生”；通过事件提取，I VR系统可以提取出关键信息，如日期(明天)和时间(下午2点)。联系起来，I VR系统可以理解用户的意图是预约医生，具体的事件是预定明天下午2点的医生预约。这样，系统可以继续处理该请求，例如检查医生的可用时间并安排预约。

步骤S204，从完整菜单树中生成与用户需求信息相匹配的目标菜单树，目标菜单树中各菜单项的排序位置按照与用户需求信息的匹配度确定。

具体地，I VR系统中具有完整菜单树，完整菜单树是预先生成并存储在I VR系统中的，可以体现I VR系统提供的完整业务服务。I VR系统可以提供不同类型的业务服务，每种业务服务又可以包含多个低级别的业务服务，低级别的业务服务又可以包含更低级别的业务服务，从而构成树形结构，得到完整菜单树。

图3是一个实施例中完整菜单树的示意图，具体地，参照图3，完整菜单树包含三个层级，第一层级为根节点，节点的业务类型/节点描述信息为“主菜单”。根节点包含三个子节点(即三个第二层级节点)，其业务类型/节点描述信息依次为“1.查询余额”、“2.转账”和“3.其他服务”。其中，节点“2.转账”又包含两个子节点“2.1本行转账”和“2.2跨行转账”(即两个第三层级节点)，这两个节点也是完整菜单树的叶子节点；节点“3.其他服务”又包含两个子节点“3.1办理信用卡”和“3.2修改个人信息”，这两个节点也是完整菜单树的叶子节点。

可以理解，图3中的完整菜单树仅仅是示意性的，随着业务复杂性的提高，每一层级的节点数可能会很多。对于图3中的完整菜单树，现有的I VR系统在播放完主菜单的信息后，会分别播放每个第二层级节点的信息，如果这一层级节点数量很多，语音播放时间会较长，当用户所需业务类型的节点靠后时，用户需要花费较长时间收听语音，且在收听过程中可能忘记前边的业务类型，例如收听到“3.其他服务”的信息时，可能会忘记第二层级中的第一个菜单项“1.查询余额”，导致重新收听，降低了I VR系统的服务提供效率以及准确性。

在得到用户需求信息后，从完整菜单树中生成与用户需求信息相匹配的目标菜单树，目标菜单树的生成过程也是对完整菜单树提取子结构的过程，提取到的每个节点构成目标菜单树的菜单项。

提取到的目标菜单树与用户需求信息具有较强的相关性或匹配度，且目标菜单树中节点与用户需求信息的相关性/匹配度越高，节点/菜单项在目标菜单树中的排序位置越靠前。即，目标菜单树中节点的排序位置是有意义的。

举例说明，根据用户需求信息，用户想要进行转账，并提到想将一笔存款从A银行转账到B银行，则从完整菜单树中选取节点“2.转账”、“2.1本行转账”和“2.2跨行转账”构成目标菜单树，选取到的三个节点构成目标菜单树的菜单项，且菜单项“2.2跨行转账”的排序位置优先于菜单项“2.1本行转账”，这代表着当I VR系统播放语音时，会先播放菜单项“2.2跨行转账”的信息，再播放菜单项“2.1本行转账”的信息。

步骤S205，根据目标菜单树，通过用户终端与用户进行交互，以向用户提供I VR服务。

具体地，I VR系统基于目标菜单树，通过用户终端与用户进行交互，例如，根据目标菜单树生成服务语音并发送至用户终端，用户终端进行语音播报，告知用户如何操作。由于目标菜单树以及其中菜单项的排序位置都与用户需求信息相关，用户可以快速获取到所需信息，而不用接收与用户需求无关的信息/执行与用户需求无关的操作，提高了I VR系统服务的效率以及准确性。

本实施例中，与用户终端建立I VR连接后，获取用户的用户语音，以进行语音识别并生成用户文本；通过联合模型对用户文本进行意图识别得到用户意图，以及进行事件提取得到事件提取结果，根据用户意图和事件提取结果生成用户需求信息，用户需求信息可以完整反应用户本次请求服务的目的；I VR系统中具有完整菜单树，完整菜单树可以表示IVR系统提供的全部业务服务；从完整菜单树中生成与用户需求信息相匹配的目标菜单树，目标菜单树与用户需求信息具有较强的匹配度，目标菜单树中，节点与用户需求信息的匹配度越高，节点所对应的菜单项在目标菜单树中的排序位置越靠前；当根据目标菜单树与用户进行交互时，用户可以更快地获取到与自己需求相关的菜单项信息，并跳过与自己需求无关的菜单项信息，提高了I VR系统服务的效率以及准确性。

进一步的，上述步骤S202可以包括：对用户语音进行语音识别，得到语音识别结果；查询用户的历史服务信息；从历史服务信息中提取服务状态为未完成状态的历史服务信息；根据提取到的历史服务信息和语音识别结果，生成用户的用户文本。

具体地，I VR系统首先对用户语音进行语音识别，得到语音识别结果。然后从数据库中查询用户的历史服务信息，历史服务信息是用户在过去与I VR系统进行交互产生的记录信息。每次交互(例如用户每次拨打预设的客服电话)都产生一条历史服务信息。历史服务信息具有服务状态，包括完成状态和未完成状态两种。其中，完成状态表示I VR系统已经完成了对用户的服务、解决了用户需求，例如用户查询某个快递的物流信息，I VR系统查询到快递的物流信息并反馈给用户；未完成状态表示I VR系统尚未完成对用户的服务、尚未解决用户需求，例如用户查询某个快递的物流信息，I VR系统暂时无法查询到快递的物流信息，服务尚未完成。

从历史服务信息中，提取服务状态为未完成状态的历史服务信息，将提取到的历史服务信息和语音识别结果进行合并，得到用户文本。由于存在未完成的服务，故用户本次交互可能与未完成的服务相关，即，用户希望继续之前未完成的服务。因此，根据未完成状态的历史服务信息和语音识别结果生成用户文本，确保了后续意图识别和事件提取的准确性。

本实施例中，对用户语音进行语音识别，得到语音识别结果；获取服务状态为未完成状态的历史服务信息，根据未完成状态的历史服务信息和语音识别结果，生成用户的用户文本，确保了后续意图识别和事件提取的准确性。

进一步的，联合模型包括嵌入表示层、共享编码层、意图识别层和事件提取层，则上述步骤S203可以包括：通过嵌入表示层对用户文本进行嵌入表示，得到文本向量；将文本向量输入共享编码层进行上下文信息提取，得到已编码信息；将已编码信息输入意图识别层进行意图识别，得到用户意图；将已编码信息输入事件提取层进行事件提取，得到事件提取结果；根据用户意图和事件提取结果生成用户需求信息。

具体地，嵌入表示层对用户文本进行嵌入表示，将其转换为固定长度的文本向量。嵌入表示层可以使用预训练的词向量模型(如Word2Vec或GloVe)，或者将用户文本输入编码器(如循环神经网络RNN或Transformer)得到。

然后将文本向量输入共享编码层，共享编码层可以是双向循环神经网络(BiLSTM)或Transformer编码器，用于捕捉上下文信息、提取句子级别的语义信息，并输出已编码信息。

意图识别层也是意图分类层，设置于在共享编码层之上，用于预测用户文本的意图类别。意图识别层可以是全连接层或者softmax分类器，根据需要输出相应数量的意图类别及其对应的概率值。在一个实施例中，选取最大概率值所对应的意图类别，作为用户意图。

事件提取层也是事件槽填充层，设置于在共享编码层之上，用于预测用户文本中的事件槽信息。这一层可以是一系列的CRF(条件随机场)层或者全连接层，用于对文本序列进行标记或分类。

事件槽(Slot)是自然语言处理(NLP)和对话系统中的一个重要概念。它指的是语句或对话中具体信息的特定位置或占位符，用于表示关键数据或实体。在对话系统中，事件槽用于标识对话中需要从用户输入中提取或填充的特定信息。它可以表示一种期望的数据类型，如日期、时间、地点、人名、产品名称等。事件槽通常与用户意图相关联，用于捕捉和处理用户的请求。事件槽可以帮助对话系统有效地解析用户的输入，并提取重要的信息，以便进行后续的处理。通过填充事件槽，系统可以了解用户的需求，了解需要执行的操作或提供的服务，并在对话过程中与用户进行更有针对性的交互。

共享编码层被意图识别层和事件提取层共用，意图识别任务和事件提取任务在共享编码层实现参数共享，可以减少模型的参数量，提高模型的训练效率和推理速度。共享编码层可以使意图识别任务和事件提取任务共享上下文信息，不同任务可能具有一定的相似性和相关性，共享编码层可以帮助模型更好地理解和利用这些共享的上下文信息。共享编码层可以学习到更丰富的特征表示，通过在共享编码层中共同学习特征表示，模型可以获得更具泛化性的特征表示，从而在不同任务上都能受益。共享编码层可以促进不同任务之间的知识传递，通过共享编码层，模型可以通过一种任务中学到的知识或表示来改善其他任务的性能，提高整体模型的效果。共享编码层还可以增加模型的鲁棒性和泛化能力，共享编码层可以同时从意图识别任务和事件提取任务中受益，通过学习通用的特征表示，提高模型对新数据的泛化能力。

在联合模型中，可以使用预训练的语言模型作为共享编码层，将用户文本输入进行编码和表示。这样可以借助预训练模型的强大语义理解能力，提取输入文本的上下文信息，以更好地进行意图识别和事件提取。

最后合并用户意图和事件提取结果，生成用户需求信息。

本实施例中，将用户文本输入联合模型后，通过嵌入表示层对用户文本进行嵌入表示，得到文本向量；通过共享编码层进行上下文信息提取，得到已编码信息；将已编码信息输入意图识别层进行意图识别，得到用户意图；将已编码信息输入事件提取层进行事件提取，得到事件提取结果；共享编码层被意图识别任务和事件提取任务共享，提高了意图识别和事件提取的准确性，并提高了根据用户意图和事件提取结果生成的用户需求信息的准确性。

进一步的，在上述根据用户意图和事件提取结果生成用户需求信息的步骤之后，还可以包括：将用户需求信息发送至用户终端，以通过用户终端将用户需求信息呈现给用户；当接收到用户通过用户终端触发的确认指令时，从完整菜单树中生成与用户需求信息相匹配的目标菜单树。

具体地，I VR系统将用户需求信息发送至用户终端，通过用户终端将用户需求信息呈现给用户，例如由用户终端通过语音播报用户需求信息，以供用户进行确认。

当接收到用户通过用户终端触发的确认指令时，从完整菜单树中生成与用户需求信息相匹配的目标菜单树。

当用户通过用户终端触发否认指令时，表示用户需求信息错误或不准确，I VR系统可以重新生成用户需求信息，或者提醒用户重新输入用户语音，或者给用户分配人工客服对象，由人工客服为用户提供服务。

本实施例中，将用户需求信息发送至用户终端由用户进行确认，当接收到用户触发的确认指令时，表明用户需求信息准确，从完整菜单树中生成与用户需求信息相匹配的目标菜单树，确保了用户需求信息和目标菜单树的准确性。

进一步的，上述步骤S204可以包括：获取预先建立的完整菜单树，并按照完整菜单树的层级结构遍历完整菜单树中的各节点；对于遍历到的每个节点，计算节点的节点描述信息和用户需求信息的语义相似度，并将语义相似度作为节点和用户需求信息的匹配度；当匹配度符合预设的匹配条件时，确定节点与用户需求信息相匹配，将节点确定为目标节点，并对目标节点的子节点进行迭代匹配，直至到达完整菜单树中的叶子节点；根据得到的各目标节点的层级信息及其与用户需求信息的匹配度，对各目标节点进行组合得到目标菜单树，其中，各目标节点构成目标菜单树中的各菜单项。

具体地，获取预先建立的完整菜单树，例如图3中的完成菜单树，按照完整菜单树的层级结构遍历完整菜单树中的各节点。

完整菜单树中每个节点都具有节点描述信息，需要为完整菜单树中每个节点和用户需求信息构建语义表示，例如使用预训练的词向量模型(如Word2Vec、GloVe或BERT)构建语义表示，将节点描述信息和用户需求信息编码为向量表示。

然后计算节点和用户需求信息之间的语义相似度，例如计算向量之间的余弦相似度作为语义相似度，并将语义相似度作为节点和用户需求信息的匹配度。

本申请预先设置了匹配条件，具体可以是设置匹配度阈值，当匹配度大于等于匹配度阈值时，匹配度符合匹配条件，表明节点与用户需求信息相匹配，将节点确定为目标节点。目标节点将被添加到目标菜单树。

在一个实施例中，不同层级节点的节点描述信息所包含的信息维度不同，通常层级越低的节点，节点描述信息越详细。例如图3中，第二层级节点“2.转账”中的节点描述信息记载该节点涉及转账服务，而第三层级节点“2.2跨行转账”的节点描述信息记载该节点支持跨行转账业务，跨行转账业务需要用户提供什么信息等。因此，对于不同层级的节点，可以采用不同的匹配度阈值。

对于目标节点，如果目标节点还存在子节点，还要对目标节点的子节点进行迭代匹配，迭代匹配的过程与上述目标节点的寻找过程相同，在此不再赘述。这样，从某一层级开始，找到一个目标节点，对目标节点的下一层级节点进行迭代匹配，直至到达完整菜单树中的叶子节点。可以采用深度优先的策略遍历完整菜单树。

对于遍历到的节点A，如果节点A不符合预设的匹配条件，则节点A的子节点也不符合预设的匹配条件，此时，不再对节点A的子节点进行迭代匹配，而是转向判断节点A的同层级节点B，判断节点B是否符合预设的匹配条件。

在遍历完成后，根据找到的各目标节点的层级信息及其与用户需求信息的匹配度，对各目标节点进行组合得到目标菜单树，组合的过程可以视作从完整菜单树中提取子结构得到目标菜单树。其中，层级信息包括目标节点在完整菜单树中的层级，以及与其他目标节点的关联关系。例如在图3中，目标节点“2.转账”的层级为第二层级，“2.1本行转账”和“2.2跨行转账”的层级为第三层级，“2.1本行转账”的层级信息中还记录“2.1本行转账”与“2.转账”存在关联关系，且“2.1本行转账”是“2.转账”的子节点。

可以理解，各目标节点构成目标菜单树中的各菜单项。

本实施例中，获取完整菜单树，并按照完整菜单树的层级结构遍历完整菜单树中的各节点；对于遍历到的每个节点，计算节点的节点描述信息和用户需求信息的语义相似度，得到节点和用户需求信息的匹配度；当匹配度符合预设的匹配条件时，确定节点与用户需求信息相匹配，将节点确定为有用的目标节点，并对目标节点的子节点进行迭代匹配以继续查找目标节点，直至到达完整菜单树中的叶子节点，确保可以找到全部的目标节点；根据各目标节点的层级信息及其与用户需求信息的匹配度，对各目标节点进行组合得到目标菜单树，目标菜单树根据用户需求信息生成，与用户需求关联度较强，可以准确快速地为用户提供I VR服务。

进一步的，上述根据得到的各目标节点的层级信息及其与用户需求信息的匹配度，对各目标节点进行组合得到目标菜单树的步骤可以包括：根据得到的各目标节点的层级信息，对各目标节点进行层级组合；对于每个层级，按照层级内各目标节点与用户需求信息的匹配度，确定层级内各目标节点的排序位置，以生成目标菜单树。

具体地，在组合得到目标节点树时，先对各目标节点进行层级组合，根据层级信息确定各目标节点所属的层级，以及不同层级目标节点之间的关联关系。可以理解，目标节点在完整菜单树中具有相对层级关系，该相对层级关系在目标菜单树中依然成立。例如，节点C为图3中的“2.转账”，属于第二层级，节点D为节点“3.1办理信用卡”，属于第三层级，节点C的层级高于节点D，到了目标菜单树中，节点C的层级仍然高于节点D。假设节点E为“2.2跨行转账”，则节点E与节点C在完整菜单树中存在关联关系，且节点E是节点C的子节点，则在目标菜单树中，节点E与节点C依然存在关联关系，且节点E依然是节点C的子节点。

在每个层级中，可能有多个目标节点，且各目标节点具有排序位置。排序位置根据目标节点与用户需求信息的匹配度确定，匹配度越高，目标节点的排序位置越靠前，参考图3，某节点的子节点存在左右关系，“2.1本行转账”属于左节点，“2.2跨行转账”属于右节点，“2.1本行转账”处于“2.2跨行转账”左边的位置。在目标节点树中，匹配度更高的目标节点总是处于更靠左的位置。

本实施例中，根据各目标节点的层级信息，对各目标节点进行层级组合，层级组合包括确定各目标节点的层级，以及不同目标节点之间的关联关系；对于每个层级，按照层级内各目标节点与用户需求信息的匹配度，确定层级内各目标节点的排序位置，匹配度越高，排序位置越靠前，从而有序地生成目标菜单树。

进一步的，在上述将相似度作为节点和用户需求信息的匹配度的步骤之后，还可以包括：当得到的匹配度均不符合预设的匹配条件时，获取用户的用户画像；将用户画像和用户需求信息输入客服对象分类模型，得到与用户匹配的客服对象类型；在客服对象类型所对应的客服对象中选取客服对象，并将用户需求信息发送至客服对象持有的客服终端，以通过客服对象为用户提供服务。

具体地，在对完整菜单树遍历结束后，如果得到的各匹配度均不符合预设的匹配条件，则表明无法通过菜单树为用户提供服务，需要转接人工客服。

此时，获取预先建立的该用户的用户画像，将用户画像和用户需求信息输入训练完毕的客服对象分类模型，客服对象分类模型根据用户画像和用户需求信息判断本次适合用户的客服对象类型。客服对象分类模型基于神经网络构建，例如可以基于随机森林构建。

每种客服对象类型都可以对应有多个客服对象，在客服对象类型所对应的客服对象中选取客服对象，例如选取当前空闲，或者工作量较少的客服对象，或者预测即将完成进行中服务的客服对象。然后将用户需求信息发送至客服对象持有的客服终端，以便客服对象通过客服终端查看用户需求信息，进而为用户提供服务。

本实施例中，当得到的匹配度均不符合预设的匹配条件时，表示无法通过菜单树为用户提供服务，则获取用户的用户画像；将用户画像和用户需求信息输入客服对象分类模型，得到适合用户的客服对象类型；在客服对象类型所对应的客服对象中选取客服对象，并由该客服对象为用户提供服务，在IVR系统无法自动为用户提供服务的情况下，依然可以为用户提供准确的服务。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图4，作为对上述图2所示方法的实现，本申请提供了一种基于I VR的服务提供装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图4所示，本实施例所述的基于I VR的服务提供装置300包括：语音获取模块301、文本生成模块302、需求生成模块303、菜单树生成模块304以及服务提供模块305，其中：

语音获取模块301，用于基于与用户终端建立的I VR连接，获取用户的用户语音。

文本生成模块302，用于对用户语音进行语音识别，并基于得到的语音识别结果生成用户文本。

需求生成模块303，用于通过联合模型对用户文本进行意图识别得到用户意图，以及对用户文本进行事件提取得到事件提取结果，并根据用户意图和事件提取结果生成用户需求信息。

菜单树生成模块304，用于从完整菜单树中生成与用户需求信息相匹配的目标菜单树，目标菜单树中各菜单项的排序位置按照与用户需求信息的匹配度确定。

服务提供模块305，用于根据目标菜单树，通过用户终端与用户进行交互，以向用户提供I VR服务。

在本实施例的一些可选的实现方式中，文本生成模块302可以包括：语音识别子模块、历史查询子模块、信息提取子模块以及文本生成子模块，其中：

语音识别子模块，用于对用户语音进行语音识别，得到语音识别结果。

历史查询子模块，用于查询用户的历史服务信息。

信息提取子模块，用于从历史服务信息中提取服务状态为未完成状态的历史服务信息。

文本生成子模块，用于根据提取到的历史服务信息和语音识别结果，生成用户的用户文本。

在本实施例的一些可选的实现方式中，联合模型包括嵌入表示层、共享编码层、意图识别层和事件提取层，则需求生成模块303可以包括：嵌入表示子模块、编码子模块、意图识别子模块、事件提取子模块以及需求生成子模块，其中：

嵌入表示子模块，用于通过嵌入表示层对用户文本进行嵌入表示，得到文本向量。

编码子模块，用于将文本向量输入共享编码层进行上下文信息提取，得到已编码信息。

意图识别子模块，用于将已编码信息输入意图识别层进行意图识别，得到用户意图。

事件提取子模块，用于将已编码信息输入事件提取层进行事件提取，得到事件提取结果。

需求生成子模块，用于根据用户意图和事件提取结果生成用户需求信息。

在本实施例的一些可选的实现方式中，基于I VR的服务提供装置300还可以包括信息发送模块，其中：

信息发送模块，用于将用户需求信息发送至用户终端，以通过用户终端将用户需求信息呈现给用户。

所述菜单树生成模块304还用于当接收到用户通过用户终端触发的确认指令时，从完整菜单树中生成与用户需求信息相匹配的目标菜单树。

在本实施例的一些可选的实现方式中，菜单树生成模块304可以包括：节点遍历子模块、匹配度确定子模块、迭代遍历子模块以及菜单树生成子模块，其中：

节点遍历子模块，用于获取预先建立的完整菜单树，并按照完整菜单树的层级结构遍历完整菜单树中的各节点。

匹配度确定子模块，用于对于遍历到的每个节点，计算节点的节点描述信息和用户需求信息的语义相似度，并将语义相似度作为节点和用户需求信息的匹配度。

迭代遍历子模块，用于当匹配度符合预设的匹配条件时，确定节点与用户需求信息相匹配，将节点确定为目标节点，并对目标节点的子节点进行迭代匹配，直至到达完整菜单树中的叶子节点。

菜单树生成子模块，用于根据得到的各目标节点的层级信息及其与用户需求信息的匹配度，对各目标节点进行组合得到目标菜单树，其中，各目标节点构成目标菜单树中的各菜单项。

在本实施例的一些可选的实现方式中，菜单树生成子模块可以包括：层级组合单元以及位置确定单元，其中：

层级组合单元，用于根据得到的各目标节点的层级信息，对各目标节点进行层级组合。

位置确定单元，用于对于每个层级，按照层级内各目标节点与用户需求信息的匹配度，确定层级内各目标节点的排序位置，以生成目标菜单树。

在本实施例的一些可选的实现方式中，菜单树生成模块304还可以包括：画像获取子模块、类型确定子模块以及客服选取子模块，其中：

画像获取子模块，用于当得到的匹配度均不符合预设的匹配条件时，获取用户的用户画像。

类型确定子模块，用于将用户画像和用户需求信息输入客服对象分类模型，得到与用户匹配的客服对象类型。

客服选取子模块，用于在客服对象类型所对应的客服对象中选取客服对象，并将用户需求信息发送至客服对象持有的客服终端，以通过客服对象为用户提供服务。

本实施例中，当得到的匹配度均不符合预设的匹配条件时，表示无法通过菜单树为用户提供服务，则获取用户的用户画像；将用户画像和用户需求信息输入客服对象分类模型，得到适合用户的客服对象类型；在客服对象类型所对应的客服对象中选取客服对象，并由该客服对象为用户提供服务，在I VR系统无法自动为用户提供服务的情况下，依然可以为用户提供准确的服务。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图5，图5为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件41-43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如基于IVR的服务提供方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行所述基于IVR的服务提供方法的计算机可读指令。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

本实施例中提供的计算机设备可以执行上述基于IVR的服务提供方法。此处基于IVR的服务提供方法可以是上述各个实施例的基于IVR的服务提供方法。

本实施例中，与用户终端建立IVR连接后，获取用户的用户语音，以进行语音识别并生成用户文本；通过联合模型对用户文本进行意图识别得到用户意图，以及进行事件提取得到事件提取结果，根据用户意图和事件提取结果生成用户需求信息，用户需求信息可以完整反应用户本次请求服务的目的；IVR系统中具有完整菜单树，完整菜单树可以表示IVR系统提供的全部业务服务；从完整菜单树中生成与用户需求信息相匹配的目标菜单树，目标菜单树与用户需求信息具有较强的匹配度，目标菜单树中，节点与用户需求信息的匹配度越高，节点所对应的菜单项在目标菜单树中的排序位置越靠前；当根据目标菜单树与用户进行交互时，用户可以更快地获取到与自己需求相关的菜单项信息，并跳过与自己需求无关的菜单项信息，提高了IVR系统服务的效率以及准确性。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于IVR的服务提供方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种基于I VR的服务提供方法，其特征在于，包括下述步骤：

基于与用户终端建立的IVR连接，获取用户的用户语音；

通过联合模型对所述用户文本进行意图识别得到用户意图，以及对所述用户文本进行事件提取得到事件提取结果，并根据所述用户意图和所述事件提取结果生成用户需求信息；所述联合模型包括嵌入表示层、共享编码层、意图识别层和事件提取层；所述通过联合模型对所述用户文本进行意图识别得到用户意图，以及对所述用户文本进行事件提取得到事件提取结果，并根据所述用户意图和所述事件提取结果生成用户需求信息的步骤包括：

通过所述嵌入表示层对所述用户文本进行嵌入表示，得到文本向量；

将所述文本向量输入所述共享编码层进行上下文信息提取，得到已编码信息；

将所述已编码信息输入所述意图识别层进行意图识别，得到用户意图；

将所述已编码信息输入所述事件提取层进行事件提取，得到事件提取结果；其中，事件提取的目标是从用户文本中识别和提取出相关的事件信息，使用命名实体识别技术来识别文本中的特定实体；

根据所述用户意图和所述事件提取结果生成用户需求信息；

从完整菜单树中生成与所述用户需求信息相匹配的目标菜单树，所述目标菜单树中各菜单项的排序位置按照与所述用户需求信息的匹配度确定，所述目标菜单树为从所述完整菜单树提取子结构得到，所述目标菜单树中节点与所述用户需求信息匹配度越高，节点在所述目标菜单树中排序位置越靠前；

根据所述目标菜单树，通过所述用户终端与所述用户进行交互，以向所述用户提供IVR服务；

所述基于得到的语音识别结果生成用户文本的步骤包括：

对所述用户语音进行语音识别，得到语音识别结果；

查询所述用户的历史服务信息；

从所述历史服务信息中提取服务状态为未完成状态的历史服务信息；

根据提取到的历史服务信息和所述语音识别结果，生成所述用户的用户文本。

2.根据权利要求1所述的基于IVR的服务提供方法，其特征在于，在所述根据所述用户意图和所述事件提取结果生成用户需求信息的步骤之后，还包括：

将所述用户需求信息发送至所述用户终端，以通过所述用户终端将所述用户需求信息呈现给所述用户；

当接收到所述用户通过所述用户终端触发的确认指令时，执行所述从完整菜单树中生成与所述用户需求信息相匹配的目标菜单树的步骤。

3.根据权利要求1所述的基于IVR的服务提供方法，其特征在于，所述从完整菜单树中生成与所述用户需求信息相匹配的目标菜单树的步骤包括：

获取预先建立的完整菜单树，并按照所述完整菜单树的层级结构遍历所述完整菜单树中的各节点；

对于遍历到的每个节点，计算所述节点的节点描述信息和所述用户需求信息的语义相似度，并将所述语义相似度作为所述节点和所述用户需求信息的匹配度；

当所述匹配度符合预设的匹配条件时，确定所述节点与所述用户需求信息相匹配，将所述节点确定为目标节点，并对所述目标节点的子节点进行迭代匹配，直至到达所述完整菜单树中的叶子节点；

根据得到的各目标节点的层级信息及其与所述用户需求信息的匹配度，对所述各目标节点进行组合得到目标菜单树，其中，所述各目标节点构成所述目标菜单树中的各菜单项。

4.根据权利要求3所述的基于IVR的服务提供方法，其特征在于，所述根据得到的各目标节点的层级信息及其与所述用户需求信息的匹配度，对所述各目标节点进行组合得到目标菜单树的步骤包括：

根据得到的各目标节点的层级信息，对所述各目标节点进行层级组合；

对于每个层级，按照所述层级内各目标节点与所述用户需求信息的匹配度，确定所述层级内各目标节点的排序位置，以生成目标菜单树。

5.根据权利要求3所述的基于IVR的服务提供方法，其特征在于，在所述将所述相似度作为所述节点和所述用户需求信息的匹配度的步骤之后，还包括：

当得到的匹配度均不符合预设的匹配条件时，获取所述用户的用户画像；

将所述用户画像和所述用户需求信息输入客服对象分类模型，得到与所述用户匹配的客服对象类型；

在所述客服对象类型所对应的客服对象中选取客服对象，并将所述用户需求信息发送至所述客服对象持有的客服终端，以通过所述客服对象为所述用户提供服务。

6.一种基于IVR的服务提供装置，其特征在于，包括：

语音获取模块，用于基于与用户终端建立的IVR连接，获取用户的用户语音；

需求生成模块，用于通过联合模型对所述用户文本进行意图识别得到用户意图，以及对所述用户文本进行事件提取得到事件提取结果，并根据所述用户意图和所述事件提取结果生成用户需求信息；所述联合模型包括嵌入表示层、共享编码层、意图识别层和事件提取层；所述通过联合模型对所述用户文本进行意图识别得到用户意图，以及对所述用户文本进行事件提取得到事件提取结果，并根据所述用户意图和所述事件提取结果生成用户需求信息的步骤包括：

根据所述用户意图和所述事件提取结果生成用户需求信息；

菜单树生成模块，用于从完整菜单树中生成与所述用户需求信息相匹配的目标菜单树，所述目标菜单树中各菜单项的排序位置按照与所述用户需求信息的匹配度确定，所述目标菜单树为从所述完整菜单树提取子结构得到，所述目标菜单树中节点与所述用户需求信息匹配度越高，节点在所述目标菜单树中排序位置越靠前；

服务提供模块，用于根据所述目标菜单树，通过所述用户终端与所述用户进行交互，以向所述用户提供IVR服务；

所述文本生成模块还用于对所述用户语音进行语音识别，得到语音识别结果；查询所述用户的历史服务信息；从所述历史服务信息中提取服务状态为未完成状态的历史服务信息；根据提取到的历史服务信息和所述语音识别结果，生成所述用户的用户文本。

7.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的基于IVR的服务提供方法的步骤。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的基于IVR的服务提供方法的步骤。