CN112925894B

CN112925894B - 对话中标问匹配方法、系统及装置

Info

Publication number: CN112925894B
Application number: CN202110331055.0A
Authority: CN
Inventors: 许慢; 李秋逸; 毛顺亿; 许腾; 张金剑; 周梦迪
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-03-26
Filing date: 2021-03-26
Publication date: 2022-07-05
Anticipated expiration: 2041-03-26
Also published as: CN112925894A

Abstract

本说明书实施例公开了一种对话中标问匹配方法、系统以及装置。其中，所述方法包括获取用户话语以及与所述用户话语对应的至少一个候选标问；获取对话状态跟踪信息，所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图；至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型，分别确定对应于每个候选标问的评估值；基于每一个候选标问的评估值，确定对应于所述用户话语的目标标问。通过使用用户对话中的对话状态跟踪信息来增加标准问题的匹配依据，提高对应于用户话语的目标问题匹配精度。

Description

对话中标问匹配方法、系统及装置

技术领域

本说明书涉及自然语言处理技术领域，特别涉及一种对话中标问匹配方法、系统及装置。

背景技术

近年来，随着人工智能技术的不断发展，助理机器人、客服机器人等人机交互系统应用到越来越多的行业领域。这些智能交互系统可以采用问答的形式，对用户的输入给出对应的问题的答案。在其过程中，智能交互系统可以针对用户输入的话语匹配出较最为接近的问题，并基于该问题获取对应的答案反馈给用户。

目前，基于问答系统对用户的话语进行问题匹配的匹配精度有待提高。由此需要一种对话中标问匹配方法和系统。

发明内容

本说明书实施例之一提供一种对话中标问匹配方法。所述方法包括：获取用户话语以及与所述用户话语对应的至少一个候选标问；获取对话状态跟踪信息，所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图；至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型，分别确定对应于每个候选标问的评估值；基于每一个候选标问的评估值，确定对应于所述用户话语的目标标问。

本说明书实施例之一提供一种对话中标问匹配系统，所述系统包括：第一获取模块，用于获取用户话语以及与所述用户话语对应的至少一个候选标问；第二获取模块，用于获取对话状态跟踪信息，所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图；第一确定模块，用于至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型，分别确定对应于每个候选标问的评估值；第二确定模块：用于基于每一个候选标问的评估值，确定对应于所述用户话语的目标标问。

本说明书实施例之一提供一种对话中标问匹配装置，包括处理器，所述处理器用于执行以上所述的对话中标问匹配方法。

附图说明

本说明书将以示例性实施例的方式进一步说明，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本说明书一些实施例所示的标问匹配系统的应用场景示意图；

图2是根据本说明书一些实施例所示的对话中标问匹配系统方法的示例性流程图；

图3是根据本说明书一些实施例所示的利用匹配模型确定每个候选标问评估值的流程示意图；以及

图4是根据本说明书一些实施例所示的示例性标问匹配系统的模块图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本说明书的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换所述词语。

如本说明书和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

目前，用户在与智能人机交互系统进行对话时，智能人机交互系统可以根据用户所输入的内容确定用户的意图和/或想要得到的反馈内容，并将对应的信息发送至用户。例如，智能人机交互系统中的FAQ问答系统，可以根据用户的输入，如用户的陈述或问题，从标问库中选择最接近该问题的标准问题，并将该标准问题对应的答案反馈给用户。但在某些情况下，用户的话语比较简单，单纯基于该用户话语并不能准确的确定对应的标准问题。例如，假定用户与智能人机交互系统的对话中咨询某一服务的相关信息时，用户询问“可以购买么？”。由于缺失更多的信息，智能人机交互系统并不能很好的反馈用户。

为解决上述存在的问题，提高对话过程中的问题匹配的精度，本说明书一些实施例中提出一种对话中标问匹配方法和系统，该方法可以基于用户话语以及对话状态跟踪信息(其包含了上下文信息以及用户所表达的意图和/或关键词)确定候选标问的评估值，并基于这些评估值确定标问，解决了只使用当前对话输入带来的重要信息丢失问题，提高了话语对应的问题匹配精度。

以下是对本说明书一些实施例提出的一种对话中标问匹配方法和系统的详细说明。

图1是根据本说明书一些实施例所示的一种人机对话的应用场景示意图。如图1所示，场景100可以包含处理设备110、网络120、用户终端130以及存储设备140。

处理设备110可以用于处理数据。在一些实施例中，处理设备110可以作为云客服平台，比如云助理机器人或云智能人机交互系统，为用户提供智能客服服务。在一些实施例中，处理设备110上部署有标问匹配系统400。处理设备110可以获取用户话语及与所述用户话语对应的至少一个标问。又例如，处理设备110可以获取对话状态跟踪信息，所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图。还例如，处理设备110可以至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型分别确定对应于每个候选标问的评估值。再例如，处理设备110可以基于每一个候选标问的评估值，确定对应于所述用户话语的目标标问。

在一些实施例中，处理设备110可以是独立的服务器或者服务器组。该服务器组可以是集中式的或者分布式的(如：处理设备110可以是分布系统)。在一些实施例中，处理设备110可以是区域的或者远程的。例如，处理设备110可通过网络访问存储用户终端130中的信息和/或资料。在一些实施例中，处理设备110可直接与用户终端130直接连接以访问存储于其中的信息和/或资料。在一些实施例中，处理设备110可在云平台上执行。例如，该云平台可包括私有云、公共云、混合云、社区云、分散式云、内部云等中的一种或其任意组合。在一些实施例中，处理设备110可包含一个或多个子处理设备(例如，单芯处理设备或多核多芯处理设备)。仅仅作为范例，处理设备110可包含中央处理器(CPU)、专用集成电路(ASIC)、专用指令处理器(ASIP)、图形处理器(GPU)、物理处理器(PPU)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编辑逻辑电路(PLD)、控制器、微控制器单元、精简指令集电脑(RISC)、微处理器等或以上任意组合。

网络120可促进数据和/或信息的交换，数据和/或信息可以包括用户终端130发送给处理设备110用户在用户终端130上输入的话语。在一些实施例中，场景100中的一个或多个组件(处理设备110、用户终端130以及存储设备140)可通过网络120发送数据和/或信息给场景100中的其他组件。在一些实施例中，网络120可是任意类型的有线或无线网络。例如，网络120有线网络、光纤网络、远程通信网络、内部网络、互联网、局域网(LAN)、广域网(WAN)、无线局域网(WLAN)、城域网(MAN)、广域网(WAN)、公共交换电话网络(PSTN)、蓝牙网络、紫蜂网络、近场通讯(NFC)网络、全球移动通讯系统(GSM)网络、码分多址(CDMA)网络、时分多址(TDMA)网络、通用分组无线服务(GPRS)网络、增强数据速率GSM演进(EDGE)网络、宽带码分多址接入(WCDMA)网络、高速下行分组接入(HSDPA)网络、长期演进(LTE)网络、用户数据报协议(UDP)网络、传输控制协议/互联网协议(TCP/IP)网络、短讯息服务(SMS)网络、无线应用协议(WAP)网络、超宽带(UWB)网络、移动通信(3G、4G、5G)网络、Wi-Fi、Li-Fi、窄带物联网(NB-IoT)、红外通信等中的一种或多种组合。在一些实施例中，网络120可包括一个或多个网络进出点。例如，网络120可包含有线或无线网络进出点，如基站和/或网际网络交换点120-1、120-2、…，通过这些进出点，场景100的一个或多个组件可连接到网络120上以交换数据和/或信息。

用户终端130可以是一种具有数据接收和/或发送功能的设备的终端，可包括手机130-1、平板电脑130-2、笔记本电脑130-3、智能手表130-4等中的一种或任意组合。上述示例仅用于说明设备范围的广泛性而非对其范围的限制。用户终端130上可以安装有多种应用程序，例如，电脑程序、移动应用程序(手机APP)等。用户终端130的使用者(也可以被称为“用户”)可以使用安装于其上的应用程序以达到各种目的，例如，用户可以通过应用程序与智能客服进行沟通以了解各种服务相关信息。用户可以通过多种输入方式，例如，文字输入、语音输入、图像输入、视频输入等，将包含咨询意图的信息输入至用户终端130。用户终端130在接收到这些话语后，可以将其传输至处理设备110进行处理(例如，通过网络120进行传输)。同时，用户终端130还可以接收处理设备110发送的针对用户的话语的回复信息并呈现给用户。

存储设备140可以储存数据和/或指令。数据可以包括用户的历史对话信息、标问数据集(或标问库)等。在一些实施例中，存储设备140可以存储从用户终端130处获得的数据。在一些实施例中，存储设备140可存储供处理设备110执行或使用的信息和/或指令，以执行本申请中描述的示例性方法。在一些实施例中，存储设备140可包括大容量存储器、可移动存储器、挥发性读写存储器(例如，随机存取存储器RAM)、只读存储器(ROM)等或以上任意组合。在一些实施例中，存储设备140可在云平台上实现。例如，该云平台可包括私有云、公共云、混合云、社区云、分散式云、内部云等或以上任意组合。

在一些实施例中，存储设备140可通过网络120与场景100中的一个或多个组件(例如，处理设备110、用户终端130等)通讯。场景100中的一个或多个组件可通过网络120访问存储于存储设备140中的资料或指令。在一些实施例中，存储设备140可直接与场景100中的一个或多个组件(例如，处理设备110、用户终端130等)连接或通讯。在一些实施例中，存储设备140可以是处理设备110的一部分。

图2是根据本说明书一些实施例所示的对话中标问匹配方法的示例性流程图。在一些实施例中，流程200可以由图1中所示的处理设备110执行。例如，流程200可以以程序或指令的形式存储在存储装置(如处理设备110的自带存储单元或外接存储设备)中，所述程序或指令在被执行时，可以实现流程200。在一些实施例中，流程200可以由部署于处理设备110上的标问匹配系统400实现。如图2所示，流程200可以包括下述步骤。

步骤202，获取用户话语以及与所述用户话语对应的至少一个候选标问。该步骤可由第一获取模块410执行。

可以理解，对话可以是参与方输出信息以表达己方的意愿或回应其他参与方的信息的一种交流行为。例如，前端用户(本说明书中可简称为“用户”)与服务提供方后端的智能人机交互系统之间的咨询对话。则所述用户话语可以是指用户所输出的，输入至智能人机交互系统的信息。作为示例，假设用户向某一服务提供方后端的智能客服机器人咨询相关的服务信息，则所述用户话语可以是用户所输入的与服务相关的问题，和/或用户在发起提问前所输入的描述信息。例如，用户想要确定是否可以请求服务提供方所提供的服务(比如保险服务)，则用户可以将与该服务(比如保险期数)和/或自身相关的一些信息(比如保险请求人的年龄、健康状况等)作为前提条件首先传输至智能人机交互系统。所述用户话语则可以是用户在参与对话时最新输入的对话信息。在一些实施例中，用户可以通过用户终端130输入信息。第一获取模块410可以通过网络120与用户终端130进行通信，以获取用户所输入的信息作为所述用户话语。

在一些实施例中，所述候选标问可以是与所述用户话语所表达的内容较为接近的标准问题。可以知道的是，服务提供方可以事先确定与其提供的服务相关的多个问题及答案。例如，在保险服务中，服务提供方可以事先确定诸如各类保险品种的介绍、保期、赔偿款等一系列相关的问题及答案。在与用户进行对话时，可以从这些事先确定的问题中找寻与用户话语中所表达的疑问接近的问题，并将对应的答案反馈给用户。这样，可以提升对话效率，提高用户体验度。在以上的说明中，预先设置的问题则可以称为标准问题(也可以被称为标问)。

在一些实施例中，第一获取模块410可以基于用户话语，利用匹配算法从标问库中确定至少一个候选标问。所述标问库可以是用于存储预先确定的标准问题及其对应的答案的数据库。例如，处理设备110的自带的存储设备或外界存储设备，例如，存储设备140。

在一些实施例中，所述匹配算法可以包括规则匹配算法或关键词匹配算法。示例性的规则匹配算法可以包括RETE、TREAT、Matchbox等。示例性的关键词匹配算法可以包括AC算法、CW算法、MPHF算法、Index算法、后缀树算法等。例如，可从用户话语中提取一个或多个关键词，以便执行关键词匹配算法。第一获取模块410可以通过规则匹配算法或关键词匹配算法将所述用户话语与标问库中每个标问进行匹配，以获取每个标问对应的匹配评分。并基于这些匹配评分将标问库中的标问进行排序。匹配程度越高，对应的标问与用户话语越匹配。则，第一获取模块410可以获取匹配程度从高至低靠前的多个标问作为候选标问。由此，可以通过匹配算法先基于用户话语与标问库中的标问做初步筛选，以使在后续进行筛选时，更具有针对性，避免了后续对大量标问进行比对，节约处理资源。

在一些实施例中，所述匹配算法可以预先存储于处理设备110自带存储单元或外接存储设备中。第一获取模块410可以与以上自带存储单元或外界存储设备中获取所述匹配算法并使用。所述匹配算法也可以是存储于其他位置例如云端，需要使用时可以被调用。

步骤204，获取对话状态跟踪信息，所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图。该步骤可以通过第二获取模块420执行。

在一些实施例中，所述对话状态跟踪信息可以是用于表示在对话中用户所表达出的目标需求的信息和/或在对话中用户所提供的关键信息。例如，在对话中用户咨询保险购买相关服务，则“购买保险”可以是用户的目标需求，用户所提供的购买人的信息例如姓名、年龄等则是关键信息。所述对话上文可以是指在对话中发生在所述用户话语之前的部分或全部历史对话。例如，假定用户与智能人机交互系统的过程中产生了五句话语，那么第五句是最新产生的用户话语。而之前的用户话语(如一句、两句、三句或四句话语)和/或客服话术(如机器人话术)可以被称为对话上文。在一些实施例中，所述对话上文可以是对话中用户话语发生之前预设时间内的一句或多句历史对话。例如，假定对话进行了10分钟，则所述对话上文可以是在第10分钟时产生的用户话语之前5分钟的所有历史对话。也就是说，从第五分钟开始到第九分钟结束的五分钟内的所有的历史对话。所述预设时间可以是任意设置的，本说明书中不对其做出限定。在对话进行时，处理设备110可以在每得到一句用户话语和客服话术时将其进行存储，并赋予对话顺序标签或时间标签。基于这些标签，可以确定所述对话上文。

在一些实施例中，所述关键词也可以被称为槽位(slot)，可以是预先设定的结构化文本。例如，所述关键词可以是时间、地点、人物、年龄、行为、请求的服务等结构化数据。作为示例，对于某一话语“今天是晴天”，所述关键词可以是与时间相关的，即“今天”。还可以是与天气相关的，即“晴天”。又例如，对于另一话语“我父亲今年63岁，想要购买长期医疗保险”，所述关键词可以是与人物相关的，即“父亲”。还可以是与年龄相关的，即“63岁”。还可以是与行为相关的，即“购买”。还可以是与请求的服务相关的，即“长期医疗保险”。在一些实施例中，第二获取模块420可以利用实体抽取算法或槽位确定模型处理所述对话上文以确定关键词。示例性的槽位确定模型可以是基于概率图的机器学习模型，例如，隐马尔可夫模型(HMM)、最大熵马尔科夫模型(MEMM)、条件随机场(CRF)、维特比算法(Viterbialgorithm)等或其任意组合。也可以是基于神经网络的深度学习模型，例如，RNN+CRF、LSTM+CRF、CNN+CRF、BiLSTM+CRF、BiLSTM+CNN+CRF等或其任意组合。

在一些实施例中，所述意图可以是指用户在对话中所表述出的意愿或需求。例如，对于某一用户话语“XX基金如今的收益如何”，则所述意图可以是用户想要了解XX基金相关的收益信息。在一些实施例中，第二获取模块420可以利用意图识别模型处理所述对话上文以确定所述与用户话语相关的意图。例如，意图识别模型可以是多分类模型，输入为对话上文，输出为多个意图类别的分值，可以将分值较高的一个或多个意图类型作为该对话上文的意图。示例性的意图识别模型可以包括GRU+CRF联合模型、RecNN+Viterbi联合模型、CNN+Tri-CRF联合模型、attention-based CNN模型、Online-RNN-LU联合模型等中的一种或多种的组合。

在一些实施例中，所述槽位确定模型和/或所述意图确定模型可以是预先设置于处理设备110中的，也可以存储于其他位置例如云端，需要使用时可以被调用。

在一些实施例中，随着对话的深入，与用户话语相关的关键词或用户意图会发生变化，所述对话状态跟踪信息可以根据对话的进行而更新的，因此所述对话状态跟踪信息可以至少包括基于对话上文确定的与用户话语相关的关键词和/或用户意图。例如，在对话开始时用户咨询了有关服务A的相关信息，随后咨询了有关服务B的相关信息。则所述对话状态信息在对话开始时，所述与用户话语相关的关键词和/或意图可以是与服务A相关。而在对话后半段，则所述与用户话语相关的关键词和/或意图可以是与服务B相关。同样的，由于对话的不断进行，所述对话上文也是在不断的更新。例如，可以将从当前用户话语起前n轮(如5轮)的历史对话作为对话上文，进而实现对话上文的更新。第二获取模块420可以不断使用前述模型处理更新后的对话上文，进而获得与当前用户话语相关的关键词或用户意图。

在一些实施例中，第二获取模块420可以直接获取所述与用户话语相关的关键词和/或意图。基于前述的说明，在对话进行时，处理设备110可以在每得到一句话语时将其进行存储。则处理设备110之外的处理设备可以获取到这些存储的对话的话语数据，并对其进行处理以确定所述与用户话语相关的关键词和/或意图。第二获取模块420可以与这些处理设备进行通信，以获取所述与用户话语相关的关键词和/或意图。

在一些实施例中，所述对话状态跟踪信息还可以包括对话中的至少部分对话上文文本。例如，可以包括全部对话上文，或者从当前用户话语起前n轮(如5轮)的对话上文。

步骤206，至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型，分别确定对应于每个候选标问的评估值。该步骤可由第一确定模块430执行。

在一些实施例中，第一确定模块430利用匹配模型处理基于用户话语、至少一个候选标问以及对话状态跟踪信息所构建的输入数据，得到每个候选标问的评估值。该评估值可以用于表示对应的候选标问与所述用户话语之间的相似度。评估值越高，则说明该评估值对应的候选标问与所述用户话语越相似，越能说明所述用户话语中反映的内容接近该候选标问中包含的内容。

在一些实施例中，所述匹配模型可以是机器学习模型。例如，所述匹配模型可以是基于神经网络的深度学习模型。例如，所述匹配模型可以是两个或以上的神经网络模型和/或神经网络层组合在一起的复合模型。所述匹配模型的输入可以是至少由所述用户话语、候选标问以及所述对话状态跟踪信息所确定的输入文本，输出可以是候选标问的评估值，由此，通过所述匹配模型可以确定每个候选标问与所述用户话语的匹配程度。

在一些实施例中，对于每一个候选标问，第一确定模块430可以基于所述用户话语、所述候选标问以及所述对话状态跟踪信息，确定第一输入。例如，第一确定模块430可以将以上信息进行首尾拼接，获取所述第一输入。作为示例，所述第一输入的格式可以如下所示：[DST]\[current_query]\[candidate]。其中，DST可以表示所述对话状态跟踪信息，current_query可以表示所述用户话语，candidate可以表示所述候选标问。可以理解的是，以上信息的拼接顺序可以是任意的，所述示例并构成对所述第一输入的限定。在一些实施例中，所述对话跟踪信息还可以再进行拆分后再与所述用户话语和所述候选标问再进行拼接。例如，所述对话跟踪信息中所包含的槽位、意图以及对话上文可以作为独立的部分，与所述用户话语和所述候选标问进行拼接，以确定所述第一输入。作为示例，所述第一输入的格式也可以如下所示：[history]\[current_query]\[slot]\[intent]\[candidate]。其中，history可以表示对话上文，current_query可以表示所述用户话语，slot可以表示所述槽位，intent可以表示所述意图，candidate可以表示所述候选标问。同样的，以上信息的拼接顺序可以是任意的，所述示例并构成对所述第一输入的限定。在一些实施例中，第一输入可以是上述拼接文本中各字符的嵌入向量组成的嵌入向量序列。所述字符可以是中文汉字或西文单词。而字符的嵌入向量进一步可以包括多类嵌入向量的叠加，其中多类嵌入向量可以是字符嵌入向量(如，token embedding)、位置嵌入向量(如，position embedding)或句子嵌入向量(如，segment embedding)等。

在一些实施例中，第一确定模块430可以通过所述匹配模型的第一部分处理所述第一输入，获得第一向量。所述匹配模型的第一部分可以BERT模型。BERT模型在对所述第一输入进行处理后，可以输出一个第一向量。例如，基于BERT模型的输入中对应的[CLS]符号在输出中对应的向量作为所述第一向量。

在一些实施例中，第一确定模块430可以基于所述第一向量，确定所述评估值。作为示例，第一确定模块430可以利用匹配模型的评分网络处理所述第一向量以确定所述评估值。所述评分网络可以是基于神经网络的深度学习网络，例如，MLP、CNN、DNN、RNN等。在一些实施例中，所述评分网络可以是所述匹配模型的一部分。在一些实施例中，所述评分网络可以是独立于所述匹配模型的另一模型。

在一些实施例中，第二获取模块420还可以获取用于描述对话、用户话语、对话跟踪信息、用户以及用户历史行为的数据，并将这些数据作为所述匹配模型的另一部分输入。例如，第一确定模块430可以基于这些数据构建所述匹配模型的第二输入，并将第一输入连同该第二输入一起输入至所述匹配模型，以确定所述评估值。关于该部分的详细描述可以参考本说明书其他部分，例如，图3。

步骤208，基于每一个候选标问的评估值，确定对应于所述用户话语的目标标问。该步骤可由第二确定模块440执行。

在一些实施例中，所述目标标问可以是指在所述至少一个候选标问中最接近用户话语所表达的内容的标准问题。通过每个候选标问对应的评估值，第二确定模块440可以在初次筛选的至少一个候选标问里中确定出所述目标标问，并将所述目标标问对应的答案反馈给用户。

在一些实施例中，第二确定模块440可以确定至少一个候选标问的评估值中的最大值。例如，第二确定模块440可以对所述至少一个候选标问各自对应的评估值进行排序比如按降序排列，以得到这些评估值中的最大值。在一些实施例中，第二确定模块440可以确定最大值是否大于预设阈值。若所述最大值大于预设阈值，则第二确定模块440可以确定最大值对应的候选标问作为目标标问。

所述预设阈值用于预先设置的相似度的边界，避免在计算过程错误和/或用户话语中所包含问题模糊不清的情况下，多个候选标问中最相似的标准问题也不满足用户话语中用户所表述的询问需求。这样，将最大评估值对应的候选标问的答案反馈给用户也解决不了用户的问题。由此，需要有一个判定的过程。当评估值中的最大值高于预设阈值的时，说明评估值中的最大值对应的候选标问可以满足用户话语中的用户所表述的询问需求。第二确定模块440可以将评估值中的最大值对应的候选标问确定为用户话语所对应的目标标问。

在一些实施例中，当评估值中的最大值低于预设阈值时，则说明多个候选标问中并不存在满足用户话语中用户所表述的询问需求的标准问题。第二确定模块440可以将所述至少一个候选标问的评估值按匹配程度的高低进行排序，并将排序靠前的预设个数个的候选标问一起反馈给用户，让用户从中选择与自己需求最合适的标准问题。

应当注意的是，上述有关图2中的各个步骤的描述仅仅是为了示例和说明，而不限定本说明书的适用范围。对于本领域技术人员来说，在本说明书的指导下可以对图2中的各个步骤进行各种修正和改变。然而，这些修正和改变仍在本说明书的范围之内。

在一些实施例中，匹配模型可以采用Wide&Deep构架的机器学习模型。第二获取模块420还可以获取描述特征，并将其作为匹配模型的另一部分(如wide部分)的输入，并将第一输入作为匹配模型的第一部分(如deep部分)的输入，以确定所述评估值。

图3是根据本说明书一些实施例所示的一种匹配模型的结构示意图。下面结合图3，阐述本说明一些实施例利用匹配模型确定每个候选标问评估值的流程。

如图3所示，所述匹配模型可以包括第一部分310、第二部分320以及评估网络340。在一些实施例中，所述匹配模型可以为Wide&Deep构架的机器学习模型。其中，所述匹配模型的第一部分310(本说明书中也可以被称为Deep部分)可以是基于神经网络的深度学习模型，可以将输入数据(例如，文本输入数据)进行处理，以获取低维(例如，0-100维)的稠密向量。所述匹配模型的第二部分320(本说明书中也可以被称为Wide部分)可以是线性模型，例如，线性神经网络层，同样可以实现向量转换。在一些实施例中，所述匹配模型可以利用其Deep部分和Wide部分分别处理不同的输入数据，最终进行融合得到一个更佳的输出。例如，所述匹配模型的评估网络340可以处理Deep部分和Wide部分输出的融合结果，获得评估值。

所述匹配模型的第一部分310可以处理基于用户话语311、候选标问312以及对话跟踪信息313所确定的第一输入。关于确定所述第一输入的描述可以参考图2中步骤206。所述匹配模型的第二部分320可以处理由至少一个描述特征321确定的第二输入。在一些实施例中，第二获取模块420可以获取至少一个描述特征，并基于所述至少一个描述特征确定所述第二输入。

在一些实施例中，所述描述特征可以是用于说明对话、用户话语、用户的相关属性/行为信息等数据的特征。例如，所述描述特征可以是用于说明对话进行时长、对话总轮数、用户的自身属性、用户的历史行为的特征。在一些实施例中，所述描述特征可以至少包括所述用户话语在所述对话中的对话轮数、所述用户话语的句式类型、用户的历史行为特征等。

在一些实施例中，所述用户话语在所述对话中的对话轮数可以是指所述用户话语在所述对话中所处的轮数。其中对话中，每一参与方的话语或话术可以看作一轮，或者将对话中的一“问”一答看作一轮。例如，假定用户与智能人机交互系统所展开的对话如下：机器人欢迎0、(用户输入话语1、机器人反馈1)、(用户输入话语2、机器人反馈2、)、(用户输入话语3)，该对话的轮数可以是6轮，也可以是4轮，相应的，所述用户话语(例如，用户输入话语3)在对话中的对话轮数可以是6或者4。对话轮数旨在反映当前用户话语所在对话的深度，轮数的计算方式可以灵活多样，对此不做限制。

在一些实施例中，所述句式类型可以是用户描述所述用户话语所属的类型，包括陈述句、疑问句、肯定句、否定句、感叹句等。当所述用户话语属于疑问句时，所述句式类型还可以进行进一步的划分。例如，是否为典型的是或否的问句(yes_no)、如何处理某种状态或如何进行某种操作类(how)、功能或菜单入口位置咨询类(where)、服务解释类(what)、描述异常产生原因现象类(why)、服务规则咨询类(rule)、期限或者时间咨询类(when)、咨询A服务与B服务是否相同类(diff)以及其他类型(other)。

在一些实施例中，所述用户的历史行为特征可以指用户参与的此次对话前所产生的行为特征。例如，用户的平台内的历史对话所咨询的内容、在平台内的操作(如开通了某项新的服务或者购买了某个产品或者浏览了哪些内容)又或者用户历史操作所反映的行为偏好等。

在一些实施例中，第二获取模块420可以随着对话的进行实时的确定所述用户话语在所述对话中的对话轮数以及所述用户话语的句式类型。对于所述用户历史行为特征，第二获取模块420可以通过与存储该数据的存储设备进行通讯以获取。

类似于所述第一输入的确定方式，第一确定模块430可以对各个描述特征进行拼接以获取所述第二输入。作为示例，所述第二输入的格式可以如下所示：[type]\[round]\[historical_behavior]。其中，type可以表示所述句式类型，round可以表示所述对话轮数，historical_behavior可以表示所述用户历史行为特征。同样的，以上描述特征的拼接顺序可以是任意的，所述示例并构成对所述第二输入的限定。

继续参考图3，所述第一输入可以被所述匹配模型的第一部分310处理，以获取第一向量。第一部分310可以是神经网络，例如，CNN、RNN、LSTM、BiLSTM、NNLM、ELMo、GPT、BERT等。在一些实施例中，第一部分310可以是BERT。所述第二输入可以被所述匹配模型的第二部分320处理，以获取第二向量。第二部分320可以是线性模型，例如，逻辑回归模型、最大熵模型、支持向量机、线性神经网络、线性感知机、稠密神经网络层等。

在一些实施例中，基于第一向量314和第二向量322，第一确定模块430可以确定第三向量330。作为示例，第一确定模块430可以将第一向量314和第二向量322进行拼接(如首尾拼接或上下拼接)或按位相加，以获取第三向量330。

继续参考图3，第三向量330可以被评估网络340处理以获取候选标问的评估值350。在一些实施例中，用于获取评估值的评估网络340可以是多层感知器、CNN、DNN、RNN等神经网络。

图4是根据本说明书一些实施例所示的对话中标问匹配系统的模块图。如图4所示，标问匹配系统400可以包括第一获取模块410、第二获取模块420、第一确定模块430和第二确定模块440。

第一获取模块410可以获取用户话语以及与所述用户话语对应的至少一个候选标问。所述用户话语则可以是用户在参与对话时最新输出的对话信息。所述候选标问可以是与所述用户话语所表达的内容较为接近的标准问题。第一获取模块410可以基于用户话语，利用匹配算法从标问库中确定至少一个候选标问。所述匹配算法可以包括规则匹配算法或关键词匹配算法。

第二获取模块420可以获取对话状态跟踪信息。所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图。所述对话上文可以是指在对话中发生在所述用户话语之前的部分或全部历史对话。所述关键词也可以被称为槽位(slot)，可以是预先设定的结构化文本。所述意图可以是指用户在对话中所表述出的意愿或需求。在一些实施例中，第二获取模块420可以基于槽位确定模型和/或意图确定模型确定所述关键词和/或意图。在一些实施例中，与用户话语相关的关键词或用户意图会发生变化，所述对话状态跟踪信息可以根据对话的进行而更新的。第二获取模块420可以不断使用前述模型处理更新后的对话上文，进而获得与当前用户话语相关的关键词或用户意图。在一些实施例中，第二获取模块420可以直接获取所述与用户话语相关的关键词和/或意图。例如，第二获取模块420可以与其他用于确定所述与用户话语相关的关键词和/或意图的设备进行通信，以获取所述与用户话语相关的关键词和/或意图。

第一确定模块430可以至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型分别确定对应于每个候选标问的评估值。在一些实施例中，第一确定模块430利用匹配模型处理基于用户话语、至少一个候选标问以及对话状态跟踪信息所构建的输入数据，得到每个候选标问的评估值。该评估值可以用于表示对应的候选标问与所述用户话语之间的相似度。一些实施例中，所述匹配模型可以是机器学习模型。例如，所述匹配模型可以是基于神经网络的深度学习模型。例如，所述匹配模型可以是两个或以上的神经网络模型和/或神经网络层组合在一起的复合模型。在一些实施例中，对于每一个候选标问，第一确定模块430可以基于所述用户话语、所述候选标问以及所述对话状态跟踪信息，确定第一输入。并通过所述匹配模型的第一部分处理所述第一输入，获得第一向量。所述匹配模型的第一部分可以BERT模型。在一些实施例中，第一确定模块430可以基于所述第一向量，确定所述评估值。作为示例，第一确定模块430可以利用匹配模型的评分网络处理所述第一向量以确定所述评估值。所述评分网络可以是基于神经网络的深度学习网络，例如，MLP、CNN、DNN、RNN等。在一些实施例中，所述评分网络可以是所述匹配模型的一部分。在一些实施例中，所述评分网络可以是独立于所述匹配模型的另一模型。

在一些实施例中，匹配模型可以采用Wide&Deep构架的机器学习模型。第二获取模块420还可以获取描述特征。第一确定模块430还可以将所述描述特征作为匹配模型的另一部分(如wide部分)的输入，并将第一输入作为匹配模型的第一部分(如deep部分)的输入，以确定所述评估值。

在一些实施例中，所述描述特征可以是用于说明对话、用户话语、用户的相关属性/行为信息等数据的特征。例如，所述描述特征可以是用于说明对话进行时长、对话总轮数、用户的自身属性、用户的历史行为的特征。在一些实施例中，所述描述特征可以至少包括所述用户话语在所述对话中的对话轮数、所述用户话语的句式类型、用户的历史行为特征等。第一确定模块430可以对各个描述特征进行拼接以获取所述第二输入。

在一些实施例中，所述第一输入可以被所述匹配模型的第一部分处理，以获取第一向量。该第一部分可以是神经网络，例如，CNN、RNN、LSTM、BiLSTM、NNLM、ELMo、GPT、BERT等。所述第二输入可以被所述匹配模型的第二部分处理，以获取第二向量。该第二部分可以是线性模型，例如，逻辑回归模型、最大熵模型、支持向量机、线性神经网络、线性感知机、稠密神经网络层等。在一些实施例中，基于第一向量和第二向量，第一确定模块430可以确定第三向量。作为示例，第一确定模块430可以将第一向量和第二向量进行拼接(如首尾拼接或上下拼接)或按位相加，以获取第三向量。第三向量可以被评估网络处理以获取候选标问的评估值。在一些实施例中，用于获取评估值的评估网络可以是多层感知器、CNN、DNN、RNN等神经网络。

第二确定模块440可以基于每一个候选标问的评估值，确定对应于所述用户话语的目标标问。所述目标标问可以是指在所述至少一个候选标问中最接近用户话语所表达的内容的标准问题。在一些实施例中，第二确定模块440可以确定至少一个候选标问的评估值中的最大值。例如，第二确定模块440可以对所述至少一个候选标问各自对应的评估值进行排序比如按降序排列，以得到这些评估值中的最大值。在一些实施例中，第二确定模块440可以确定最大值是否大于预设阈值。若所述最大值大于预设阈值，则第二确定模块440可以确定最大值对应的候选标问作为目标标问。

关于以上模块的其他描述可以参考本说明书流程图部分，例如，图2-图3。

应当理解，图4所示的系统及其模块可以利用各种方式来实现。例如，在一些实施例中，系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

需要注意的是，以上对于候选项显示、确定系统及其模块的描述，仅为描述方便，并不能把本说明书限制在所举实施例范围之内。可以理解，对于本领域的技术人员来说，在了解该系统的原理后，可能在不背离这一原理的情况下，对各个模块进行任意组合，或者构成子系统与其他模块连接。例如，第一获取模块410、和第二获取模块420可以是两个模块，也可以是一个模块同时具有获取多种数据的功能。又例如，各个模块可以共用一个存储模块，各个模块也可以分别具有各自的存储模块。诸如此类的变形，均在本说明书的保护范围之内。

本说明书实施例可能带来的有益效果包括但不限于：(1)通过使用对话状态跟踪信息(包含了对话上文以及基于对话上文确定的与用户话语相关的关键词和/或意图)，让匹配模型在处理数据时获取更多匹配依据，使得模型能够感知到历史对话信息，从而解决那些需要依赖历史信息带来的匹配错误问题。(2)在一些应用场景下，对话状态跟踪信息可以不包含对话上文，减少了模型的输入数据量，有助于提高模型的运算效率。(3)基于使用具备Deep&Wide架构的问题匹配模型，通过增加Wide部分可以自定义添加特征，提高对应于用户话语的目标问题匹配精度。需要说明的是，不同实施例可能产生的有益效果不同，在不同的实施例里，可能产生的有益效果可以是以上任意一种或几种的组合，也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本说明书的限定。虽然此处并没有明确说明，本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议，所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时，本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或在云计算环境中，或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的服务器或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本说明书披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本说明书实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明所述数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外，对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是，如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方，以本说明书的描述、定义和/或术语的使用为准。

最后，应当理解的是，本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

1.一种对话中标问匹配方法，其中，所述方法包括：

获取用户话语以及与所述用户话语对应的至少一个候选标问；

获取对话状态跟踪信息，所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图；

获取至少一个描述特征，所述描述特征包括以下至少一个：所述用户话语在所述对话中的对话轮数、所述用户话语的句类型、用户的历史行为特征；

至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型，分别确定对应于每个候选标问的评估值；包括对于每一个候选标问：

基于所述用户话语、候选标问以及所述对话状态跟踪信息，确定第一输入；

基于所述至少一个描述特征，确定第二输入；

将所述第一输入和所述第二输入输入至所述匹配模型，确定该候选标问对应的评估值；

基于所述评估值，从所述至少一个候选标问中确定对应于所述用户话语的目标标问。

2.根据权利要求1所述的方法，其中，所述获取所述用户话语对应的至少一个候选标问，包括：

基于所述用户话语，利用匹配算法从标问库中确定至少一个候选标问；其中，所述匹配算法包括规则匹配算法、关键词匹配算法。

3.根据权利要求1所述的方法，其中，所述匹配模型为Wide&Deep构架的机器学习模型。

4.根据权利要求1所述的方法，其中，所述将所述第一输入和所述第二输入输入至所述匹配模型，确定该候选标问对应的评估值，包括：

通过所述匹配模型的第一部分处理所述第一输入，获得第一向量；所述第一部分为神经网络；

通过所述匹配模型的第二部分处理所述第二输入，获得第二向量；所述第二部分为线性模型；

基于所述第一向量和所述第二向量，确定所述评估值。

5.根据权利要求4所述的方法，其中，所述第一部分为BERT模型；

所述基于所述第一向量和所述第二向量，确定所述评估值，包括：

基于所述第一向量和所述第二向量，确定第三向量；

通过多层感知器处理所述第三向量，获得所述评估值。

6.根据权利要求1所述的方法，其中，所述基于每个候选标问的评估值，确定对应于所述用户话语的目标标问，包括：

确定所述至少一个候选标问的评估值中的最大值；

确定所述最大值是否大于预设阈值；

若所述最大值大于所述预设阈值，确定所述最大值对应的候选标问作为所述目标标问。

7.根据权利要求1所述的方法，其中，所述对话状态跟踪信息还包括所述对话中的至少部分对话上文文本。

8.一种对话中标问匹配系统，其中，所述系统包括：

第一获取模块，用于获取用户话语以及与所述用户话语对应的至少一个候选标问；

第二获取模块，用于获取对话状态跟踪信息，所述对话状态跟踪信息至少包括基于对话上文确定的与所述用户话语相关的关键词和/或意图；

所述第二获取模块还用于,获取至少一个描述特征，所述描述特征包括以下至少一个：所述用户话语在所述对话中的对话轮数、所述用户话语的句类型、用户的历史行为特征；

第一确定模块，用于至少基于所述用户话语、所述至少一个候选标问以及所述对话状态跟踪信息，利用匹配模型，分别确定对应于每个候选标问的评估值，所述第一确定模块还用于对于每一个候选标问：基于所述用户话语、候选标问以及所述对话状态跟踪信息，确定第一输入；基于所述至少一个描述特征，确定第二输入；将所述第一输入和所述第二输入输入至所述匹配模型，确定该候选标问对应的评估值；

第二确定模块，用于基于所述评估值，从所述至少一个候选标问中确定对应于所述用户话语的目标标问。

9.根据权利要求8所述的系统，其中，为获取所述用户话语对应的至少一个候选标问，所述第一获取模块用于：

基于所述用户话语，利用匹配算法从标问库中确定至少一个候选标问；其中，所述匹配算法包括规则匹配算法或关键词匹配算法。

10.根据权利要求8所述的系统，其中，所述匹配模型为Wide&Deep构架的机器学习模型。

11.根据权利要求8所述的系统，其中，为将所述第一输入和所述第二输入输入至所述匹配模型，确定该候选标问对应的评估值，所述第一确定模块用于：

基于所述第一向量和所述第二向量，确定所述评估值。

12.根据权利要求11所述的系统，其中，所述第一部分为BERT模型；

为基于所述第一向量和所述第二向量，确定所述评估值，所述第一确定模块用于：

基于所述第一向量和所述第二向量，确定第三向量；

通过多层感知器处理所述第三向量，获取所述评估值。

13.根据权利要求8所述的系统，其中，为基于每一个候选标问的评估值，确定对应于所述用户话语的目标标问，所述第二确定模块用于：

确定所述至少一个候选标问的评估值中的最大值；

确定所述最大值是否大于预设阈值；

14.根据权利要求8所述的系统，其中，所述对话状态跟踪信息还包括所述对话中的至少部分对话上文文本。

15.一种对话中标问匹配装置，其中，包括处理器，所述处理器用于执行权利要求1-7任一项所述的对话中标问匹配方法。