CN112632252B

CN112632252B - 对话应答方法、装置、计算机设备和存储介质

Info

Publication number: CN112632252B
Application number: CN202011561592.6A
Authority: CN
Inventors: 唐文军; 贾晓谦; 宋子岳; 王冉
Original assignee: Zhongdian Jinxin Software Co Ltd
Current assignee: Zhongdian Jinxin Software Co Ltd
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2021-09-17
Anticipated expiration: 2040-12-25
Also published as: CN112632252A

Abstract

本申请涉及人工智能技术领域，提供了一种对话应答方法、装置、计算机设备和存储介质。本申请从预先构建的应答语句库中获取与待应答语句的话题和句式结构相匹配的至少一个候选应答语句，以实现粗粒度的相关性应答语句筛选，进一步确定各候选应答语句所关联的各被应答语句，将各被应答语句中各语素类型对应的第一语素词汇与待应答语句中各语素类型对应的第二语素词汇进行词汇级别的相似度匹配，使话题层面的相关性下钻到词汇层面，以实现词汇级别精细化的相关性应答语句筛选，由此可根据词汇相似度，从多个候选应答语句中选取用于对待应答语句进行应答的目标应答语句，提高应答语句与待应答语句间的匹配度。

Description

对话应答方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种对话应答方法、装置、计算机设备和存储介质。

背景技术

随着人工智能技术的发展，出现了智能对话系统，通过智能对话系统，能够在智能运维、客服和电销服务等领域为用户提供相应问答服务，提高信息交互效率。

目前的技术所提供的对话应答方案一般是通过预定规则配置关键词对应关系，根据待应答语句中的关键字与各应答语句的相关性从中筛选出相关性评分较高的应答语句进行应答。然而，这种技术在面对例如包含前述关键字的近义词或者同义词等词汇的待应答语句时所提供的应答语句匹配度较低。

发明内容

基于此，有必要针对上述技术问题，提供一种对话应答方法、装置、计算机设备和存储介质。

一种对话应答方法，所述方法包括：

获取对话中的待应答语句；

确定所述待应答语句对应的话题，确定所述待应答语句具有的句式结构；

从预先构建的应答语句库中获取与所述话题和所述句式结构相匹配的至少一个候选应答语句；

针对所述至少一个候选应答语句中的每一候选应答语句，确定各候选应答语句关联的各被应答语句；

提取所述各被应答语句中各语素类型对应的第一语素词汇，提取所述待应答语句中各语素类型对应的第二语素词汇；

基于所述第一语素词汇与所述第二语素词汇的词汇相似度，从所述至少一个候选应答语句中确定出目标应答语句，以便对所述待应答语句进行应答。

一种对话应答装置，包括：

第一获取模块，用于获取对话中的待应答语句；

第一确定模块，用于确定所述待应答语句对应的话题，确定所述待应答语句具有的句式结构；

第二获取模块，用于从预先构建的应答语句库中获取与所述话题和所述句式结构相匹配的至少一个候选应答语句；

第二确定模块，用于针对所述至少一个候选应答语句中的每一候选应答语句，确定各候选应答语句关联的各被应答语句；

词汇提取模块，用于提取所述各被应答语句中各语素类型对应的第一语素词汇，提取所述待应答语句中各语素类型对应的第二语素词汇；

选取模块，用于基于所述第一语素词汇与所述第二语素词汇的词汇相似度，从所述至少一个候选应答语句中确定出目标应答语句，以便对所述待应答语句进行应答。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取对话中的待应答语句；确定所述待应答语句对应的话题，确定所述待应答语句具有的句式结构；从预先构建的应答语句库中获取与所述话题和所述句式结构相匹配的至少一个候选应答语句；针对所述至少一个候选应答语句中的每一候选应答语句，确定各候选应答语句关联的各被应答语句；提取所述各被应答语句中各语素类型对应的第一语素词汇，提取所述待应答语句中各语素类型对应的第二语素词汇；基于所述第一语素词汇与所述第二语素词汇的词汇相似度，从所述至少一个候选应答语句中确定出目标应答语句，以便对所述待应答语句进行应答。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述对话应答方法、装置、计算机设备和存储介质，通过对待应答语句的话题和句式结构进行分析，从预先构建的应答语句库中获取与待应答语句的话题和句式结构相匹配的至少一个候选应答语句，以实现粗粒度的相关性应答语句筛选，进一步确定每个候选应答语句所关联的每个被应答语句，提取每个被应答语句中各语素类型对应的第一语素词汇以及提取待应答语句中各语素类型对应的第二语素词汇，将各被应答语句对应的第一语素词汇与待应答语句对应的第二语素词汇进行词汇级别的相似度匹配，使话题层面的相关性下钻到词汇层面，以实现词汇级别精细化的相关性应答语句筛选，由此可根据词汇相似度，从前述至少一个候选应答语句中选取用于对待应答语句进行应答的目标应答语句，提高应答语句与待应答语句间的匹配度，可解决目前的技术中存在的面对包含关键字的近义词或者同义词等词汇的待应答语句时无法提供高匹配度的应答语句的技术问题，使得智能对话系统的对话过程更加流畅和智能。

附图说明

图1为一个实施例中对话应答方法的流程示意图；

图2为一个应用实例中对话应答的流程示意图；

图3为一个应用实例中多轮对话应答的流程示意图；

图4为一个实施例中对话应答装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，如图1所示，提供了一种对话应答方法，该方法可以由计算机设备执行，该计算机设备可以是终端，也可以是服务器；其中，终端但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备；服务器则可以用独立的服务器或者是多个服务器组成的服务器集群来实现。具体的，该对话应答方法，可以包括如下步骤：

步骤S101，获取对话中的待应答语句；

本步骤中，计算机设备可获取通过文字或者语音等形式录入的待应答语句。具体的，用户可向计算机设备录入语音，计算机设备采集该语音，通过例如语音-文本转化工具将录入的该语音转化为文字，作为待应答语句。

步骤S102，确定待应答语句对应的话题，确定待应答语句具有的句式结构；

本步骤中，计算机设备确定待应答语句对应的话题和句式结构。对于话题，示例性的，对于待应答语句为“销管系统谁来处理”，其话题可被确定为“salemanage”，对于待应答语句为“协议无效或已过期”，其话题可被确定为“agreement”。句式结构是指该待应答语句整体所具有的句式结构，可以是简单句结构和复合句结构。其中，对于具有复合句结构的待应答语句，可以进一步包括主句和从句(或称副句)，示例性的，“投保过程中提示：协议无效或已过期”属于复合句结构的待应答语句，其主句可被识别为“协议无效或已过期”，从句可被识别为“投保过程中提示”。

在一些实施例中，主句和从句可对应不同的话题，仍以“投保过程中提示：协议无效或已过期”为例，主句“协议无效或已过期”对应的话题可被识别为“agreement”、从句“投保过程中提示”对应的话题可被识别为“buy”。进一步的，在一些实施例中，计算机设备还可以确定具有复合句结构的待应答语句中的主句和从句之间的主从关系，该主从关系可以包括：deduction(总分关系)、contract(承接关系)、progressive(递进关系)、choice(选择关系)、adversative(转折关系)、supposition(假设关系)、condition(条件关系)、causal(因果关系)等。

在另外一些实施例中，计算机设备还可以确定待应答语句对应的提问角度。其中，提问角度可以包括statement(陈述)、which(有哪些)、what(是什么)、how(怎么样)、where(在哪里)、when(什么时候)、who(谁)、is(是否)等。

在本步骤中，计算机设备可采用预先构建的话题捕捉模型确定前述待应答语句对应的话题，以及可采用预先构建的句式识别模型确定前述待应答语句的句式结构。具体的，话题捕捉模型和句式识别模型都可以基于神经网络进行构建。其中，可采用基于RoBERTa-BiLSTM-CRF的神经网络构建话题捕捉模型，RoBERTa为中文全词遮蔽预训练模型RoBERTa-wwm-ext，简称RoBERTa；可采用基于RoBERTa-BiLSTM的神经网络构建句式识别模型。

对于话题捕捉模型的构建，计算机设备可获取历史对话记录，将历史对话记录中包含的对话主体的提问语句等话术语句作为标注样本，其中的实体通过BIO标注，此处所标注的实体可以包括话术语句中各语素类型对应的词汇实例，其中，该语素类型可以包括对象类型(object)、动作类型(action)和状态(status)类型，示例性的，对于“销管已经维护好了，还是不行”这一话术语句，对象类型对应的词汇为“销管”、动作类型对应的词汇为“维护”、状态类型对应的词汇为“好了”。接着，将BIO标注样本输入RoBERTa-BiLSTM-CRF模型，通过反向传播过程，不断迭代模型权重，当损失函数达到最小值，模型收敛，固化模型权重参数，从而构建得到话题捕捉模型。

对于句式识别模型的构建，计算机设备可将历史对话记录中的对话主体的提问语句等话术语句对应的提问角度及主从关系作为标注结果，具体的，简单句标注结果可以包括statement(陈述)、which(有哪些)、what(是什么)、how(怎么样)、where(在哪里)、when(什么时候)、who(谁)、is(是否)等，复合句标注结果可以包括deduction(总分关系)、contract(承接关系)、progressive(递进关系)、choice(选择关系)、adversative(转折关系)、supposition(假设关系)、condition(条件关系)、causal(因果关系)等。其中，对于复合句结构，由于其主从句顺序存在差异，因而其标注结果需要按照主从句顺序加以区分。示例性的：condition(条件关系)包含正向、负向；其中，正向是指从句在前，主句在后；负向是指从句在后，主句在前。接着，将标注好的样本输入RoBERTa-BiLSTM模型，通过反向传播过程，不断迭代模型权重，当损失函数达到最小值，模型收敛，固化模型权重参数，从而构建得到句式识别模型。

步骤S103，从预先构建的应答语句库中获取与话题和句式结构相匹配的至少一个候选应答语句；

本步骤中，计算机设备可从预先构建的应答语句库中获取一个或者多个候选应答语句，这些候选应答语句需要与待应答语句对应的话题和句式结构相匹配。具体的，应答语句库中可以包括多个已知的应答语句，每个已知的应答语句可以对应于一个或者多个话题，以及对应于一个或者多个句式结构，其中，已知的应答语句与话题、句式结构的对应关系可以通过与该已知的应答语句本身关联的被应答语句建立，而该被应答语句就是指使用过该已知的应答语句进行应答的提问语句，该被应答语句也具有对应的话题和句式结构，根据该被应答语句对应的话题和句式结构与待应答语句对应的话题和句式结构进行匹配，从应答语句库中获取相应的候选应答语句。

从该应答语句库中获取的候选应答语句的数量可以是多个，示例性的，对于“销管系统谁来处理”这一待应答语句，计算机设备可从应答语句库中获取到与该“销管系统谁来处理”对应的话题和句式结构匹配的例如“负责销管系统的同事”、“您可以联系下销管的同事或提交运维单”等候选应答语句，而这种匹配方式可以通过与“负责销管系统的同事”、“您可以联系下销管的同事或提交运维单”关联的提问语句建立，其中，与“负责销管系统的同事”关联的被应答语句可以为“销管系统谁能查看？”、与“您可以联系下销管的同事或提交运维单”关联的被应答语句可以为“销管谁维护的？”，这两个被应答语句对应的话题和句式结构与“销管系统谁来处理”对应的话题和句式结构具有匹配关系，例如都是属于“salemanage”话题和简单句结构。

在一些实施例中，应答语句库可以被包含在预先构建的话术知识库中。其中，话术知识库是指智能对话系统应答话术的全集，可以包括该智能对话系统所有可能返回的应答话术。具体的，话术知识库可以采用结构化存储数据，其所存储的每条数据维度可以包括唯一数据标识、语素类型中的对象类型(object)、对象标准值(即对应的词汇实例)、语素类型中的动作类型(action)、动作标准值(即对应的词汇实例)、语素类型中的状态类型(status)、状态标准值(即对应的词汇实例)、提问角度、主从关系、从句标识、应答语句。其中，当话术为简单句时，主从关系和从句标识为空，当话术为复合句时，主从关系为主句和从句之间的关系，可以包括总分关系、承接关系、递进关系、选择关系、转折关系、假设关系、条件关系、因果关系等，从句标识为该条数据对应的从句的唯一数据标识，该从句标识所对应数据须为简单句。进一步的，每条数据可以对应多条备选应答语句，各条应答语句的主题重心应该保持相互独立，以在一条应答语句无法解决用户提问时，提供更多维度、更加丰富的应答策略。

步骤S104，针对前述至少一个候选应答语句中的每一候选应答语句，确定各候选应答语句关联的各被应答语句；

步骤S105，提取前述各被应答语句中各语素类型对应的第一语素词汇，提取前述待应答语句中各语素类型对应的第二语素词汇；

上述步骤S104和S105中，从应答语句库中获取的候选应答语句的数量可以是多个，计算机设备可进一步在词汇级别上对候选应答语句作进一步筛选。具体的，计算机设备提取待应答语句中各语素类型对应的第二语素词汇，示例性的，对于“销管系统谁来处理”这一待应答语句，计算机设备提取对象类型(object)对应的第二语素词汇“销管系统”、提取动作类型(action)对应的第二语素词汇“处理”；计算机设备还需要提取各候选应答语句关联的各被应答语句中各语素类型对应的第一语素词汇，以两个被应答语句为例，对于“销管系统谁能查看？”，计算机设备可提取对象类型(object)对应的第一语素词汇“销管系统”、提取动作类型(action)对应的第一语素词汇“查看”。

步骤S106，基于第一语素词汇与第二语素词汇的词汇相似度，从至少一个候选应答语句中确定出目标应答语句，以便对待应答语句进行应答。

本步骤中，计算机设备计算各语素类型对应的第一语素词汇与第二语素词汇的词汇相似度，得到与各语素类型对应的多个词汇相似度，接着，计算机设备可以综合该多个词汇相似度从多个候选应答语句中筛选出用于对待应答语句进行应答的目标应答语句，以便对前述待应答语句进行应答。在一些实施例中，计算机设备可以利用预先构建的相似性检索模型确定第一语素词汇与第二语素词汇的词汇相似度，具体的，将各语素类型对应的第一语素词汇与第二语素词汇分别输入至相应语素类型的相似性检索模型，由相似性检索模型判断各语素类型对应的第一语素词汇与第二语素词汇间的词汇相似度。其中，可基于局部敏感哈希(Locality Sensitive Hashing)构建相似性检索模型，计算机设备可对历史对话记录中标注的每个话题下的不同语素类型对应的词汇实例进行语义编码，经过哈希函数变换，映射到不同的分桶，使每个分桶中的数据相似概率大，不同分桶间的相似概率小，还可以保存各分桶集合数据，而对于前述词汇相似度可采用余弦相似计算方法。通过各语素类型对应的相似性检索模型可得到各语素类型对应的第一语素词汇与第二语素词汇的词汇相似度，可依据词汇相似度从多个候选应答语句中为待应答语句匹配目标应答语句，并使用该目标应答语句对待应答语句进行应答。

上述对话应答方法，计算机设备通过对待应答语句的话题和句式结构进行分析，从预先构建的应答语句库中获取与待应答语句的话题和句式结构相匹配的至少一个候选应答语句，以实现粗粒度的相关性应答语句筛选，计算机设备进一步确定每个候选应答语句所关联的每个被应答语句，提取每个被应答语句中各语素类型对应的第一语素词汇以及提取待应答语句中各语素类型对应的第二语素词汇，并将各被应答语句对应的第一语素词汇与待应答语句对应的第二语素词汇进行词汇级别的相似度匹配，使话题层面的相关性下钻到词汇层面，以实现词汇级别精细化的相关性应答语句筛选，由此计算机设备可根据词汇相似度，从前述至少一个候选应答语句中选取用于对待应答语句进行应答的目标应答语句，提高应答语句与待应答语句间的匹配度，可解决目前的技术中存在的面对包含关键字的近义词或者同义词等词汇的待应答语句时无法提供高匹配度的应答语句的技术问题，使得智能对话系统的对话过程更加流畅和智能。

具体对句式识别模型处理和话题捕捉模型的处理过程进行介绍：

其中，基于RoBERTa-BiLSTM的句式识别模型处理过程为：文字通过预训练模型特定分词器分词，进行块嵌入(Token Embedding)、段嵌入(Segment Embedding)、位置嵌入(Position Embedding)得到块编码、段编码、位置编码，块嵌入在每句头尾添加“[CLS]”、“[SEP]”标志句子的开始和结束，通过预训练的块嵌入模型为每个块生成768维的块向量，段编码在此处是全为0的索引向量，对应块嵌入的每一个块，位置编码计算公式如下：

其中，pos表示汉字的位置信息，i用来表达编码维度，dmodel是模型最大序列长度，本实施例中dmodel可以为512，则i为0到255。用于表征块在段中的位置信息，将三种编码加和后输入到12个注意力单元，每个注意力单元内存在一个自注意力层和一个前馈神经网络层，自注意力层将每个编码向量通过如下公式计算：

其中，Attention是注意力头向量，Q、K和V分别是模型训练过程中获得的权重与输入的编码向量进行相乘获得的查询向量、键向量和值向量，d_k为经验常量。RoBERTa拥有12个注意力头，将12个注意力头计算得到的矩阵拼接为一个矩阵，与原输入矩阵进行加和归一化后输入前馈神经网络，输出结果进行再一次加和归一化，输入下一个注意力单元，重复上述过程。RoBERTa输出将按顺序依次输入正反向LSTM单元进行计算，正反向计算结果拼接后输入最终softmax层，得到每一个句式结构的概率分布，取概率最高的句式结构作为句式识别的最终结果。

而基于RoBERTa-BiLSTM-CRF的话题捕捉模型前部分的处理过程同句式识别模型，由于模型训练样本存在差异，两个模型内部有着完全不同的权重参数，因而处理得到的输出也不尽相同。后部分的处理过程如下：在经过正反向LSTM后，得到每个字符对应的标注序列概率分布，输入条件随机场，其内部应用多个特征函数来得出综合评分，该评分具有全局性；特征函数分为状态特征和转移特征，建立在序列节点上的特征函数为状态特征，建立在序列边界上的特征函数为转移特征；设观测序列X＝(X1,X2,X3)，输出标记序列Y＝(Y1,Y2,Y3)，Y1、Y2和Y3取值于(O,B-XX,I-XX)，该XX为对象类型(object)、动作类型(action)、状态类型(status)，则状态特征函数的一般形式f(X,i,Y_i)，i为序列位置，在选择该节点路径时，该函数取值为上层BiLSTM输出的该标注的概率值，否则为0；转移特征函数的一般形式为f(X,i,Y_i,Y_i-1)，考虑当前序列位置和前一个序列位置的情况，在状态转移时，函数值为转移矩阵中的转移概率值，否则为0；通过维特比动态路径规划算法，将状态特征和转移特征加权求和，分数最高的标注序列作为最终标记序列。通过CRF(条件随机场)对预测序列进行句子级别的约束，以保证句子开头应该是B-XX或O，而不是I-XX，杜绝连续序列中不同话题点混淆现象，并使I-XX不会成为话题点标注的起始位置，从而保证预测序列的有效性。

在一个实施例中，在句式结构为复合句结构的情况下；步骤S103中的从预先构建的应答语句库中获取与话题和句式结构相匹配的至少一个候选应答语句，具体包括：

确定待应答语句中的主句；将前述预先构建的应答语句库中与待应答语句中的主句对应的话题和语句特征相匹配的应答语句，作为初选应答语句；初选应答语句的数量为多个时，确定待应答语句中的从句，并将多个初选应答语句中与待应答语句中的从句对应的话题和语句特征相匹配的初选应答语句，作为候选应答语句。

本实施例主要是在为具有复合句结构的待应答语句形成候选应答语句过程中，优先匹配满足主句的话题和语句特征的应答语句，当满足主句的话题和语句特征的应答语句存在多条时，再从中筛选满足从句的话题和语句特征的应答语句，由此可以尽可能优先解决待应答语句中主句的问题以提高应答语句与待应答语句间的匹配度。具体的，计算机设备在得到待应答语句后可确定出其主句和从句，并提取主句对应的话题和语句特征，其中，语句特征可以包括但不限于是对象类型、行为类型、状态类型、提问角度等。然后，计算机设备将上述应答语句库中与该主句对应的话题和语句特征相匹配的应答语句，作为初选应答语句。至此计算机设备所得到的初选应答语句的数量也一般是多个，计算机设备结合从句的特点对初选应答语句实施进一步筛选。具体的，计算机设备可提取从句对应的话题和语句特征，并从该多个初选应答语句中选取出与该从句对应的话题和语句特征相匹配的初选应答语句作为候选应答语句，至此计算机设备完成为具有复合句结构的待应答语句形成候选应答语句的过程。

在一些实施例中，计算机设备可采用如下方式从多个候选应答语句中选取用于对待应答语句进行应答的目标应答语句，也即上述步骤S106中的基于第一语素词汇与第二语素词汇的词汇相似度，从前述至少一个候选应答语句中选取用于对待应答语句进行应答的目标应答语句，可以包括：

根据各语素类型对应的第一语素词汇和第二语素词汇，得到各语素类型对应的词汇相似度；根据各语素类型对应的词汇相似度的乘积，确定待应答语句分别与各被应答语句的语句相似度；将对应于语句相似度最大的候选应答语句作为用于对待应答语句进行应答的目标应答语句。

本实施例主要是依据各语素类型对应的词汇相似度的乘积选取用于对待应答语句进行应答的目标应答语句。具体的，计算机设备可获取各语素类型对应的第一语素词汇和第二语素词汇，从而得到各语素类型对应的词汇相似度，然后将每个语素类型对应的词汇相似度进行相乘，将其乘积作为待应答语句分别与相应被应答语句的语句相似度，由此每一个被应答语句均可对应有一个语句相似度，计算机设备可将对应于语句相似度最大的候选应答语句作为用于对待应答语句进行应答的目标应答语句。

示例性的，以其中一个被应答语句的语句相似度计算为例进行说明，设语素类型包括对象类型(object)、动作类型(action)和状态(status)类型，该被应答语句中各语素类型对应的第一语素词汇设为SO、SA和SS，而待应答语句中各语素类型对应的第二语素词汇设为CO、CA和CS，设计算得到各语素类型对应的第一语素词汇和第二语素词汇的词汇相似度分别为SIM_SO-CO、SIM_SA-CA和SIM_SS-CS，则上述语句相似度SIM_reply＝SIM_SO-CO×SIM_SA-CA×SIM_SS-CS。其中，对于未识别到相应话题的语素类型对应的词汇相似度可以设为1。通过这种本实施例的方案，可使得未捕捉到相应话题的语素类型不影响最终的语句相似度计算结果，对捕捉到话题却语义不符的情况可施加惩罚，这种方式更加符合人类在对话中的思维特点。

如图2所示，结合一应用实例对目标应答语句的选取过程进行说明，其中，对于用户输入的待应答语句“销管系统谁来处理”，计算机设备可在应答语句库中获取候选应答语句1“负责销管系统的同事”和候选应答语句2“您可以联系下销管的同事或提交运维单”，然后将利用相似性检索模型获取在“salemanage”话题下与“object”和“action”对应的词汇相似度，也即“销管系统”、“销管”分别与“销管系统”在“object”对应的词汇相似度，“维护”、“查看”分别与“处理”在“action”对应的词汇相似度，然后采用乘积的方式计算相应候选应答语句的语句相似度分别为0.4和0.72，从而计算机设备选取候选应答语句2“您可以联系下销管的同事或提交运维单”作为最终的目标应答语句。

进一步的，对于具有复合句结构的待应答语句的语句相似度，则可以分别根据主句和从句中各语素类型对应的词汇相似度的乘积进行计算。对此，在一些实施例中，上述根据各语素类型对应的词汇相似度的乘积，确定待应答语句分别与各被应答语句的语句相似度，具体包括：

根据各被应答主句中各语素类型对应的第一语素词汇和待应答主句中各语素类型对应的第二语素词汇，得到针对待应答主句的各语素类型对应的词汇相似度，作为各语素类型对应的主句词汇相似度；其中，各被应答主句为各被应答语句的主句；待应答主句为待应答语句的主句；

以及，根据各被应答从句中各语素类型对应的第一语素词汇和待应答从句中各语素类型对应的第二语素词汇，得到针对待应答从句的各语素类型对应的词汇相似度，作为各语素类型对应的从句词汇相似度；其中，各被应答从句为各被应答语句的从句；待应答从句为待应答语句的从句。

本实施例主要是可以分别计算主句中各语素类型对应的词汇相似度即主句词汇相似度，以及从句中各语素类型对应的词汇相似度即从句词汇相似度。具体的，与待应答语句的句式结构匹配的各被应答语句也包含主句和从句，因此可以分别针对主句和从句依据上述实施例对应的方案分别计算出上述各语素类型对应的主句词汇相似度和各语素类型对应的从句词汇相似度。

在此基础之上，上述根据各语素类型对应的词汇相似度的乘积，确定待应答语句分别与各被应答语句的语句相似度，具体包括：根据各语素类型对应的主句词汇相似度与各语素类型对应的从句词汇相似度的乘积，确定语句相似度。也即，计算机设备可将各语素类型对应的主句词汇相似度与各语素类型对应的从句词汇相似度相乘得到语句相似度，从而为具有复合句结构的待应答语句提供一种计算语句相似度并以此选取应答语句的可行方案。

在一些实施例中，计算机设备可以与用户进行多轮对话，在多轮对话过程中，用户在当前轮次的对话中发出的提问语句可以作为待应答语句，该待应答语句可能会存在语素缺省，例如对于“还是不行”这一待应答语句，则缺少语素类型中的对象类型(object)及其对应的词汇。基于此，计算机设备可以具体采用如下方式实现步骤S102中的确定待应答语句对应的话题，具体包括：

确定各历史轮次的对话所对应的话题，得到各历史话题；获取各历史话题对应的话题消融概率，并获取各历史轮次分别与当前轮次的轮次差；基于话题消融概率和轮次差，从各历史话题中确定待应答语句对应的话题。

本实施例主要是从历史轮次发生的对话的话题中选取一个话题作为待应答语句对应的话题。具体的，计算机设备可确定已发生的多轮对话中各历史轮次的对话所对应的话题，作为历史话题并得到多个历史话题。然后，计算机设备获取各历史话题对应的话题消融概率，该话题消融概率用于表征在多轮对话的进行过程中某个历史话题被消融的可能性，消融则用于表征用户与计算机设备是否已经结束了某个话题的问答，若计算机设备判断某个话题的问答已经结束，则计算机设备认为该话题已消融。计算机设备还获取各历史轮次分别与当前轮次的轮次差，设当前轮次为n+2轮对话，则n+1轮对话与当前轮次的轮次差为(n+2)－(n+1)＝1。

在得到话题消融概率和轮次差后，计算机设备基于该话题消融概率和轮次差从各历史话题中确定待应答语句对应的话题。具体的，在一些实施例中，计算机设备可采用如下方式确定待应答语句对应的话题，具体包括：

根据话题消融概率和轮次差，确定各历史话题在当前轮次的对话中的话题继承概率；将对应于话题继承概率最大的历史话题作为待应答语句对应的话题。

本实施例中，话题继承概率用于表征历史话题被继承到当前轮次的对话中使用的概率，计算机设备可将对应于话题继承概率最大的历史话题作为待应答语句对应的话题。其中，计算机设备可将话题继承概率设置为与话题消融概率呈负相关关系，以及将话题继承概率设置为与轮次差呈负相关关系，由此更好地从历史话题中进行话题继承选择。

示例性的，计算机设备检测到具有复合句结构的待应答语句中主句存在语素缺省，可触发话题适配模式或称话题继承模式。适配话题选择过程具体为：设当前轮次为m轮，检测第n轮(n小于m)的话题，设n轮的话题被标记为话题消融概率为P，因而该n轮话题的话题继承概率可以表示

至此，计算机设备可依据继承的话题进一步对候选应答语句进行筛选。在一些实施例中，计算机设备根据继承的话题所筛选的候选应答语句中不包含第一历史对话中已使用的应答语句。其中，第一历史对话是指对应于话题继承概率最大的历史话题(也即被集成话题)所在历史轮次的对话。

另外，计算机设备根据继承的话题所筛选的候选应答语句中还可以不包含具有第二历史对话中已应答语句中的与第一设定语素类型对应的词汇的应答语句。其中，第一设定语素类型可以是对象类型，设该第一设定语素类型即对象类型对应的词汇为“销管系统”，则计算机设备最终所选取的候选应答语句中不包含“销管系统”；其中，第二历史对话是指轮间消融话题所在历史轮次的对话，该轮间消融话题是指第一历史对话所在轮次与当前轮次之间的消融话题。这种机制模仿了人类在某条思路上无法解决问题时，转换其他思路的试错机制，利用多个候选应答语句可提供多种解决问题的思路。

在一些实施例中，计算机设备可通过如下方式确定各轮次的历史对话对应的话题消融概率，具体步骤包括：

若当前轮次的对话与上一轮次的历史对话具有相同话题，则根据待应答语句中与第二设定语素类型对应的词汇，确定上一轮次的历史对话对应的话题消融概率；若上一轮次的历史对话对应的话题消融概率大于预设话题消融概率阈值，将上一轮次的历史对话对应的历史话题设为消融话题。

本实施例主要是在相同话题在对话的上下文重复出现时，触发话题消融机制。具体的，计算机设备可在当前轮次的对话与上一轮次的历史对话具有相同话题时，获取当前轮次的对话中待应答语句中与第二设定语素类型对应的词汇，该第二设定语素类型可以是状态(status)类型，基于待应答语句中状态(status)类型对应的词汇可判断该待应答语句所对应的话题所处状态，得到上一轮次的历史对话对应的关于该相同话题的话题消融概率。在一些实施例中，计算机设备可利用预先构建的话题状态判定模型获取该话题消融概率，具体的，计算机设备可将待应答语句作为话题状态判定模型的输入，该待应答语句可以是主句、从句和简单句中的任意一种类型，话题状态判定模型输出的话题状态检测结果为二元概率分布，即话题已解决的概率和话题未解决的概率。当计算机设备判断上一轮次的历史对话对应的话题消融概率大于预设话题消融概率阈值(如0.5)时，可将上一轮次的历史对话对应的历史话题标记为消融话题。其中，计算机设备可基于RoBERTa-BiLSTM的神经网络构建话题状态判定模型，在构建过程中，计算机设备只需将对历史对话记录的标注内容设为话题状态，即该标注结果包括resolved(已解决)、unresolved(未解决)，标注话题内容为话题捕捉模型中标注的表明话题状态的词汇实例，如“没解决”、“成功了”、“搞好了”、“不行”等，将标注好的样本输入RoBERTa-BiLSTM模型，通过反向传播过程，不断迭代模型权重，当损失函数达到最小值，模型收敛，固化模型权重参数，得到话题状态判定模型。

结合图3对多轮对话的处理过程进行说明，具体的，在第n轮历史对话中，捕捉到buy_object，buy_aciton，agreement_object，agreement_status话题下的语素类型，复合句式为条件句式(condition)，通过相关性筛选并经过话题下钻，筛选出匹配的应答语句如“好的，那您可以先到销管系统中确认下代理机构/代理人是否为有效状态及协议是否已经过期，并操作报审核，审核通过后再重试用一下”；在第n+1轮对话中，捕捉到salemanage_object，salemanage_action话题下的语素类型，提问角度为谁(who)，通过相关性筛选并经过话题下钻，筛选出匹配的应答语句“您可以联系下销管的同事或提交运维单”；在第n+2轮对话中，副句(即从句)中再次捕捉到salemanage_object，salemanage_action话题下的语素类型，复合句式检测为转折(adversative)，此时触发话题消融机制，将salemanage_status对应的词汇实例“好了”输入话题状态判定模型，输出已解决概率为0.9，标记salemanage相关话题为消融话题，记录消融概率为0.9。而第n+2轮对话中，复合句主句存在缺省语素，捕捉到adapter_status继承话题下的语素类型，触发话题继承模式。适配话题点选择过程具体为：

检测第n+1轮对话的话题，由于n+1轮对话的话题记录有消融概率0.9，因而该话题的继承概率为

即继承概率为0.1，检测第n轮对应的话题，由于n轮的话题没有消融概率，即消融概率为0，因而该话题的继承概率为0.5。至此，图3中在第n+2轮对话中继承第n轮的话题，将主句捕捉到的adapter_status状态词汇实例输入话题状态判定模型，输出已解决概率为0.15，小于0.5，标记为未消融话题，未消融话题的对象类型对应为被继承话题的对象类型即第n轮话题对应的对象类型，进而依据重新确定的第n轮话题选取候选应答语句并排除第n轮的应答语句，以及筛选出不包含轮间消融话题(即继承轮次第n轮到当前轮次第n+2轮之间消融的话题)下对象类型对应的词汇实例的备用应答语句，此处消融话题下对象类型对应的词汇实例为“销管系统”，得出返回不包含“销管系统”应答语句。这种机制模仿了人类在某条思路无法解决问题时，转换其他思路的试错机制，这里的备用应答语句，就提供了多种解决思路。

本申请提供的对话应答方法提供了多轮对话话题消融机制、语素缺省自适应及相关性筛选中的话题下钻机制，有效提升多轮对话中复合句的处理能力，通过主从句和主从关系识别，可以很好地捕捉复合句的逻辑特性，也可以进一步将整个复合句任务切分为主句分析、从句分析两个子任务，从而进行有针对性的处理。其中，通过多轮对话话题消融机制，可以将已结束话题进行继承性衰减处理，约束返回应答语句的方向性；语素缺省自适应则可以依据话题消融概率及轮次差，进行自主继承话题选择，提升用户体验及对话流畅性；相关性筛选中的话题下钻机制，利用人类思维的逐层纵深特性，在词汇粒度上进行相关匹配，得到精细化的相关性匹配度，能够区分更加细腻的语义差别。由此可见，本申请提供的技术方案通过话题消融、话题下钻等技术手段，能够很好地模拟人脑的对话运作机制，例如可以很好地模拟人脑对于已解决问题、结束话题的记忆衰减现象及处理概念的由顶而下不断精微的层次化思维过程，可解决多轮对话中的痛点问题，使智能问答系统在多轮对话过程中更加智能化、人性化。

应该理解的是，虽然图1至3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1至3中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种对话应答装置，该装置400包括：

第一获取模块401，用于获取对话中的待应答语句；

第一确定模块402，用于确定所述待应答语句对应的话题，确定所述待应答语句具有的句式结构；

第二获取模块403，用于从预先构建的应答语句库中获取与所述话题和所述句式结构相匹配的至少一个候选应答语句；

第二确定模块404，用于针对所述至少一个候选应答语句中的每一候选应答语句，确定各候选应答语句关联的各被应答语句；

词汇提取模块405，用于提取所述各被应答语句中各语素类型对应的第一语素词汇，提取所述待应答语句中各语素类型对应的第二语素词汇；

选取模块406，用于基于所述第一语素词汇与所述第二语素词汇的词汇相似度，从所述至少一个候选应答语句中确定出目标应答语句，以便对所述待应答语句进行应答。

在一个实施例中，所述句式结构包括复合句结构；第二获取模块403，进一步用于确定所述待应答语句中的主句；将所述应答语句库中与所述主句对应的话题和语句特征相匹配的应答语句，作为初选应答语句；所述初选应答语句的数量为多个时，确定所述待应答语句中的从句，并将多个所述初选应答语句中与所述从句对应的话题和语句特征相匹配的初选应答语句，作为所述候选应答语句。

在一个实施例中，选取模块406，进一步用于根据所述各语素类型对应的所述第一语素词汇和第二语素词汇，得到所述各语素类型对应的词汇相似度；根据所述各语素类型对应的词汇相似度的乘积，确定所述待应答语句分别与所述各被应答语句的语句相似度；将对应于所述语句相似度最大的候选应答语句作为所述用于对所述待应答语句进行应答的目标应答语句。

在一个实施例中，所述句式结构包括复合句结构；选取模块406，进一步用于根据各被应答主句中各语素类型对应的第一语素词汇和待应答主句中各语素类型对应的第二语素词汇，得到针对所述待应答主句的所述各语素类型对应的词汇相似度，作为所述各语素类型对应的主句词汇相似度；所述各被应答主句为所述各被应答语句的主句；所述待应答主句为所述待应答语句的主句；根据各被应答从句中各语素类型对应的第一语素词汇和待应答从句中各语素类型对应的第二语素词汇，得到针对所述待应答从句的所述各语素类型对应的词汇相似度，作为所述各语素类型对应的从句词汇相似度；所述各被应答从句为所述各被应答语句的从句；所述待应答从句为所述待应答语句的从句；根据所述各语素类型对应的主句词汇相似度与所述各语素类型对应的从句词汇相似度的乘积，确定所述语句相似度。

在一个实施例中，所述待应答语句存在语素缺省；所述对话包括多轮对话；第一确定模块402，进一步用于确定各历史轮次的对话所对应的话题，得到各历史话题；获取所述各历史话题对应的话题消融概率，并获取所述各历史轮次分别与当前轮次的轮次差；基于所述话题消融概率和轮次差，从所述各历史话题中确定所述待应答语句对应的话题。

在一个实施例中，第一确定模块402，进一步用于根据所述话题消融概率和轮次差，确定所述各历史话题在所述当前轮次的对话中的话题继承概率；所述话题继承概率与所述话题消融概率呈负相关，所述话题继承概率与所述轮次差呈负相关；将对应于所述话题继承概率最大的历史话题作为所述待应答语句对应的话题；其中，所述候选应答语句不包含第一历史对话中已使用的应答语句；所述第一历史对话为所述对应于所述话题继承概率最大的历史话题所在历史轮次的对话；所述候选应答语句不包含具有第二历史对话中已应答语句中的与第一设定语素类型对应的词汇的应答语句；所述第二历史对话为轮间消融话题所在历史轮次的对话，所述轮间消融话题为所述第一历史对话所在轮次与所述当前轮次之间的消融话题。

在一个实施例中，第一确定模块402，进一步还用于若所述当前轮次的对话与上一轮次的历史对话具有相同话题，则根据所述待应答语句中与第二设定语素类型对应的词汇，确定所述上一轮次的历史对话对应的话题消融概率；若所述上一轮次的历史对话对应的话题消融概率大于预设话题消融概率阈值，将所述上一轮次的历史对话对应的历史话题设为消融话题。

关于对话应答装置的具体限定可以参见上文中对于对话应答方法的限定，在此不再赘述。上述对话应答装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储候选应答语句等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对话应答方法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种对话应答方法，其特征在于，所述方法包括：

获取对话中的待应答语句；

提取所述各被应答语句中各语素类型对应的第一语素词汇，提取所述待应答语句中各语素类型对应的第二语素词汇；所述语素类型包括对象类型、动作类型和状态类型；

基于所述对象类型、动作类型和状态类型分别对应的第一语素词汇与所述对象类型、动作类型和状态类型分别对应的第二语素词汇的词汇相似度的乘积，从所述至少一个候选应答语句中确定出目标应答语句，以便对所述待应答语句进行应答。

2.根据权利要求1所述的方法，其特征在于，所述句式结构包括复合句结构；所述从预先构建的应答语句库中获取与所述话题和所述句式结构相匹配的至少一个候选应答语句，包括：

确定所述待应答语句中的主句；

将所述应答语句库中与所述主句对应的话题和语句特征相匹配的应答语句，作为初选应答语句；

所述初选应答语句的数量为多个时，确定所述待应答语句中的从句，并将多个所述初选应答语句中与所述从句对应的话题和语句特征相匹配的初选应答语句，作为所述候选应答语句。

3.根据权利要求1所述的方法，其特征在于，所述基于所述对象类型、动作类型和状态类型分别对应的第一语素词汇与所述对象类型、动作类型和状态类型分别对应的第二语素词汇的词汇相似度的乘积，从所述至少一个候选应答语句中确定出目标应答语句，包括：

根据所述对象类型、动作类型和状态类型分别对应的所述第一语素词汇和第二语素词汇，得到所述对象类型、动作类型和状态类型分别对应的词汇相似度；

根据所述对象类型、动作类型和状态类型分别对应的词汇相似度的乘积，确定所述待应答语句分别与所述各被应答语句的语句相似度；

将对应于所述语句相似度最大的候选应答语句作为所述目标应答语句。

4.根据权利要求3所述的方法，其特征在于，所述句式结构包括复合句结构；

所述根据所述对象类型、动作类型和状态类型分别对应的所述第一语素词汇和第二语素词汇，得到所述对象类型、动作类型和状态类型分别对应的词汇相似度，包括：

根据各被应答主句中所述对象类型、动作类型和状态类型分别对应的第一语素词汇和待应答主句中所述对象类型、动作类型和状态类型分别对应的第二语素词汇，得到针对所述待应答主句的所述对象类型、动作类型和状态类型分别对应的词汇相似度，作为所述对象类型、动作类型和状态类型分别对应的主句词汇相似度；所述各被应答主句为所述各被应答语句的主句；所述待应答主句为所述待应答语句的主句；

根据各被应答从句中所述对象类型、动作类型和状态类型分别对应的第一语素词汇和待应答从句中所述对象类型、动作类型和状态类型分别对应的第二语素词汇，得到针对所述待应答从句的所述对象类型、动作类型和状态类型分别对应的词汇相似度，作为所述对象类型、动作类型和状态类型分别对应的从句词汇相似度；所述各被应答从句为所述各被应答语句的从句；所述待应答从句为所述待应答语句的从句；

所述根据所述对象类型、动作类型和状态类型分别对应的词汇相似度的乘积，确定所述待应答语句分别与所述各被应答语句的语句相似度，包括：

根据所述对象类型、动作类型和状态类型分别对应的主句词汇相似度与所述对象类型、动作类型和状态类型分别对应的从句词汇相似度的乘积，确定所述语句相似度。

5.根据权利要求1所述的方法，其特征在于，所述待应答语句存在语素缺省；所述对话包括多轮对话；所述确定所述待应答语句对应的话题，包括：

确定各历史轮次的对话所对应的话题，得到各历史话题；

获取所述各历史话题对应的话题消融概率，并获取所述各历史轮次分别与当前轮次的轮次差；

基于所述话题消融概率和轮次差，从所述各历史话题中确定所述待应答语句对应的话题。

6.根据权利要求5所述的方法，其特征在于，所述基于所述话题消融概率和轮次差，从所述各历史话题中确定所述待应答语句对应的话题，包括：

根据所述话题消融概率和轮次差，确定所述各历史话题在所述当前轮次的对话中的话题继承概率；所述话题继承概率与所述话题消融概率呈负相关，所述话题继承概率与所述轮次差呈负相关；

将对应于所述话题继承概率最大的历史话题作为所述待应答语句对应的话题；

其中，所述候选应答语句不包含第一历史对话中已使用的应答语句；所述第一历史对话为所述对应于所述话题继承概率最大的历史话题所在历史轮次的对话；所述候选应答语句不包含具有第二历史对话中已应答语句中的与第一设定语素类型对应的词汇的应答语句；所述第二历史对话为轮间消融话题所在历史轮次的对话，所述轮间消融话题为所述第一历史对话所在轮次与所述当前轮次之间的消融话题。

7.根据权利要求5或6所述的方法，其特征在于，所述方法还包括：

若所述当前轮次的对话与上一轮次的历史对话具有相同话题，则根据所述待应答语句中与第二设定语素类型对应的词汇，确定所述上一轮次的历史对话对应的话题消融概率；

若所述上一轮次的历史对话对应的话题消融概率大于预设话题消融概率阈值，将所述上一轮次的历史对话对应的历史话题设为消融话题。

8.一种对话应答装置，其特征在于，包括：

第一获取模块，用于获取对话中的待应答语句；

词汇提取模块，用于提取所述各被应答语句中各语素类型对应的第一语素词汇，提取所述待应答语句中各语素类型对应的第二语素词汇；所述语素类型包括对象类型、动作类型和状态类型；

选取模块，用于基于所述对象类型、动作类型和状态类型分别对应的第一语素词汇与所述对象类型、动作类型和状态类型分别对应的第二语素词汇的词汇相似度的乘积，从所述至少一个候选应答语句中确定出目标应答语句，以便对所述待应答语句进行应答。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。