CN114861680A

CN114861680A - 对话处理方法及装置

Info

Publication number: CN114861680A
Application number: CN202210585842.2A
Authority: CN
Inventors: 白安琪; 蒋宁; 王洪斌; 吴海英
Original assignee: Mashang Xiaofei Finance Co Ltd
Current assignee: Mashang Xiaofei Finance Co Ltd
Priority date: 2022-05-27
Filing date: 2022-05-27
Publication date: 2022-08-05
Anticipated expiration: 2042-05-27
Also published as: CN114861680B

Abstract

本说明书实施例提供了对话处理方法及装置，其中，一种对话处理方法，包括：获取用户在目标服务输入的对话文本；识别对话文本的文本特征信息，将对话文本输入真伪检测模型进行真伪检测输出文本属性概率，以及根据文本属性概率确定对话文本的真伪类别；根据文本特征信息、真伪类别和历史用户信息，确定对话状态；基于历史用户信息和对话状态确定用户在目标服务的置信度，以及在目标服务的候选违约影响因子中确定目标违约影响因子；根据历史用户信息中包含的历史对话信息、目标违约影响因子和置信度生成对话文本的响应文本。采用本申请实施例可通过对话交互形式挖掘用户针对目标服务的真实意向。

Description

对话处理方法及装置

技术领域

本申请涉及数据处理技术领域，尤其涉及一种对话处理方法及装置。

背景技术

随着互联网技术的不断发展，互联网平台推出越来越多的互联网服务，比如购物服务、交易服务以及资金服务等，利用互联网技术来实现对应的目标服务是大部分企业的发展趋势。在互联网服务的对话服务中，针对用户提出的问题或者输入的对话内容需要进行及时响应，通过双方的沟通实现目标服务的交付。但在相关技术中，一般是基于用户的特征和行为历史数据以及用户当前的对话文本，通过机器学习的方法构建的响应文本预测模型来得到对应的响应文本，这种通过静态的历史数据进行模型训练后得到的响应文本预测模型，所预测得到的响应文本在实际应用中准确性不高。

发明内容

为了解决响应文本准确性不高的问题，第一方面，本申请实施例提供了一种对话处理方法，包括：

获取用户在目标服务输入的对话文本；

识别所述对话文本的文本特征信息，将所述对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，以及根据所述文本属性概率确定所述对话文本的真伪类别；

根据所述文本特征信息、所述真伪类别和历史用户信息，确定对话状态；

基于所述历史用户信息和所述对话状态，确定所述用户针对所述目标服务的置信度，以及在所述目标服务的候选违约影响因子中确定目标违约影响因子；

根据所述历史用户信息中包含的历史对话信息、所述目标违约影响因子和所述置信度生成所述对话文本的响应文本。

第二方面，本申请实施例提供了一种对话处理装置，包括：

对话文本获取模块，用于获取用户在目标服务输入的对话文本；

真伪检测模块，用于识别所述对话文本的文本特征信息，将所述对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，以及根据所述文本属性概率确定所述对话文本的真伪类别；

对话状态确定模块，用于根据所述文本特征信息、所述真伪类别和历史用户信息，确定对话状态；

影响因子确定模块，用于基于所述历史用户信息和所述对话状态，确定所述用户针对所述目标服务的置信度，以及在所述目标服务的候选违约影响因子中确定目标违约影响因子；

响应文本生成模块，用于根据所述历史用户信息中包含的历史对话信息、所述目标违约影响因子和所述置信度生成所述对话文本的响应文本。

第三方面，本申请实施例提供了一种对话处理设备，包括：处理器；以及，被配置为存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器执行第一方面所述的对话处理方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现如第一方面所述的对话处理方法。

可以看出，在本申请实施例中，从用户在目标服务输入的对话文本出发，识别对话文本的文本特征信息，以及借助真伪检测模型计算该对话文本的文本属性概率，并根据文本属性概率确定对话文本的真伪类别，通过对话文本的真伪类别分析获知用户是否说谎，以此通过对对话交互过程中用户输入的对话文本进行分析处理，全面获知对话交互过程中用户针对目标服务的真实意向，并以文本特征信息、对话文本的真伪类别和历史用户信息确定的对话状态为依据，结合历史用户信息确定用户针对目标服务的置信度，以及在目标服务的候选违约影响因子中选择目标违约影响因子，综合目标违约影响因子、历史对话信息和置信度，生成对话文本的响应文本，以此在获知的用户针对目标服务的真实意向的基础上，确定引导用户进行更深层次的对话交互的响应文本，也即，本申请实施例生成的响应文本更符合用户或者是平台方的意图，提高了响应文本的准确性；进一步地，通过对话交互的方式更加深入地挖掘用户针对目标服务产生违约行为的违约风险，同时结合静态的历史信息和对话交互过程中产生的动态信息，预测用户针对目标服务的违约风险，提升违约风险的预测精准度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图；

图1为本申请实施例提供的一种对话处理方法处理流程图；

图2为本申请实施例提供的一种应用于贷款服务场景的对话处理处理过程的示意图；

图3为本申请实施例提供的一种应用于贷款服务场景的对话处理方法处理流程图；

图4为本申请实施例提供的一种对话处理装置示意图；

图5为本申请实施例提供的一种对话处理设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请实施例中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本申请实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请的保护范围。

实际应用中，特别是针对购物服务、交易服务以及资金服务等高风险的应用场景时，所得到的响应文本需要根据用户的违约风险的大小得到不同的响应文本。在预测用户针对目标服务的违约风险的过程中，往往借助用户的特征信息(比如年龄、职业等)和历史资金行为信息这些静态数据进行违约风险预测，缺少有效的方法检测用户刻意隐瞒的真实意向，进而无法结合真实意向预测用户的违约风险，因此使得得到的响应文本不准确。

针对于此，本实施例提供的对话处理方法，在目标服务下的对话交互过程中，获取用户输入的对话文本，并识别对话文本的文本特征信息，借助真伪检测模型对对话文本进行真伪检测，获得文本属性概率，通过文本属性概率确定对话文本的真伪类别，从而借助对对话文本的真伪类别判断，获知用户刻意隐瞒的在目标服务的真实意向，进一步将文本特征信息、对话文本的真伪类别和历史用户信息结合起来，确定对话状态，以对话状态和历史用户信息为依据，确定用户针对目标服务的置信度以及在目标服务的候选违约影响因子中选择目标违约影响因子，并通过目标违约影响因子、历史对话信息和置信度，生成对话文本的响应文本，以此，在获知用户刻意隐瞒的针对目标服务的真实意向的基础上，结合真实意向生成与用户进行更深度、更广度的对话交互的响应文本，也即，该响应文本能够更准确地反映真实意图，同时从静态的历史信息和对话交互过程中产生的动态信息两个角度，预测用户针对目标服务的违约风险，有助于提升用户针对目标服务的违约风险的预测精准度。

参照图1，本实施例提供的对话处理方法，具体包括步骤S102至步骤S110。

步骤S102，获取用户在目标服务输入的对话文本。

本实施例所述目标服务，包括资金服务，具体可以是线上和线下结合的信贷机构的贷款服务、线上信贷机构的贷款服务、或者信用卡的分期借款服务，此外，目标服务还包括与资金相关的其它服务。

具体实施时，用户在访问目标服务的过程中可输入对话文本，开启对话交互，比如，用户针对资金服务存在疑虑困惑，具体用户针对贷款服务的贷款合同签订款项存在疑虑、用户针对贷款审批流程存在疑虑、用户针对贷款逾期细则存在疑虑，在此情况下，用户可将自己存在的疑虑困惑通过对话文本的形式展现出来，在目标服务输入对话文本。

实际应用中，为了提升对话交互的便捷性，针对目标服务可设置对话交互界面，在对话交互界面配置对话文本输入接口，用户通过触发该对话文本输入接口可输入对话文本，此外，对话交互界面也可配置对话语音输入接口，用户通过触发该对话语音输入接口输入对话语音，对对话语音进行语音识别，获得对话文本，通过文本和语音多种输入方式进行对话交互，适应多种对话交互场景。

此外，在获取用户在目标服务输入的对话文本之前，可获取用户特征信息和/或历史行为信息，根据用户特征信息和/或历史行为信息生成开启文本向用户展示，该开启文本根据用户特征信息和/或历史行为信息个性化生成，具体该开启文本可以是欢迎文本。其中，所述用户特征信息，包括与用户本身特征相关的信息，比如性别、职业、年龄等等；所述历史行为信息，包括历史各期的资金信息，比如历史各期的资金逾期天数、逾期总金额、催收次数；

例如，目标服务为贷款服务，用户u的用户特征信息中性别为男，历史资金行为信息中记录有1次逾期还款3天，则可针对用户u生成开启文本“xx先生，您的贷款已逾期3天，请您尽快结清贷款”。

通过用户特征信息和/或历史行为信息生成开启文本，在用户访问目标服务的过程中向用户进行展示，在与用户进行正常对话交互的同时，可针对每个用户不同的行为信息对用户进行灵活化提醒，提升用户体验，有助于提升用户在目标服务的活跃度。

步骤S104，识别所述对话文本的文本特征信息，将所述对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，以及根据所述文本属性概率确定所述对话文本的真伪类别。

本实施例所述文本特征信息，是指与对话文本本身特征相关的信息，具体可以是在对话文本中直接提取的特征信息，也可以是由对话文本获得的特征信息，此外，文本特征信息还可包括其它形式的特征信息；所述文本特征信息，包括对话意图、情感极性、实体特征信息和/或真伪类别。

例如，目标服务为资金服务下的贷款服务，对话文本为“我还得还车贷，暂时没有多余的钱”，对话意图为“还款金额不足”，情感极性为“消极”，实体特征信息为“车贷”、“钱”，真伪类别为“真类别”。

所述文本属性概率，包括对话文本在真伪属性层面的属性概率，即针对用户输入的对话文本确定对话文本的真伪类别的对比概率；比如文本属性概率为90％，根据预先配置策略“文本属性概率＞85％，对话文本的真伪类别为真类别；文本属性概率≤85％，对话文本的真伪类别为伪类别”，确定文本属性概率90％>85％时，对话文本的真伪类别为真类别。

具体实施时，上述获取用户在目标服务输入的对话文本，为了了解用户的真实需求，根据用户真实需求对用户输入的对话文本做出回复，同时进一步引导用户说明在目标服务的真实意向，可识别对话文本的文本特征信息，并将对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，借助文本属性概率，确定对话文本的真伪类别，通过从对话交互过程中用户动态输入的对话文本出发，了解用户内心的真实想法，挖掘用户真实意向，并进一步通过多轮对话交互，提升挖掘用户真实意向的深度和广度。

在具体的执行过程中，识别对话文本的文本特征信息，具体包括针对对话文本进行意图识别获得对话意图；对对话文本进行情感识别获得情感极性；对对话文本进行实体识别获得实体特征信息；针对对话文本进行多方面全方位的剖析，有助于了解用户内心的真实意向。本实施例提供的一种可选实施方式中，在识别对话文本的文本特征信息的过程中，具体执行如下操作：

对所述对话文本进行意图识别，得到所述对话文本的对话意图；

从所述对话文本中提取与所述目标服务关联的实体特征信息，以及确定所述对话文本的情感极性。

具体的，预先存储有与目标服务关联的预设意图类别，在预设意图类别中选择该对话文本的意图类别即对话意图；从对话文本中提取与目标服务关联的实体特征信息，以及预先存储有预设情感极性，在预设情感极性中选择该对话文本的情感极性。

例如，将对话文本输入意图识别模型进行意图识别，输出对话文本的对话意图，在意图识别模型中存储有与资金服务关联的预设意图类别，意图识别模型基于对话文本在预设意图类别中确定该对话文本的对话意图，比如资金服务为贷款服务，预设意图类别为“故意推迟还款”、“还款金额不足”、“还款方式更改(等额本息、等额本金)”，对话文本为“我还得还车贷，暂时没有多余的钱”，对话意图为“还款金额不足”；

将对话文本输入实体识别模型进行实体特征提取，具体从对话文本中进行实体特征提取，输出对话文本的实体特征信息；比如，对话文本为：“我还得还车贷，暂时没有多余的钱”，实体特征信息为“车贷”、“钱”；

将对话文本输入情感识别模型进行情感识别，输出对话文本的情感极性，在情感识别模型中存储有预设情感极性，情感识别模型基于对话文本在预设情感极性中确定该对话文本的情感极性，比如预设情感极性为“消极”、“积极”、“中立”，对话文本为“我还得还车贷，暂时没有多余的钱”，该对话文本的情感极性为“消极”。

具体实施时，为了提升挖掘的用户真实意向的有效性，通过对对话文本进行真伪检测，辨别对话文本的真伪类别，通过辨别对话文本的真伪类别进一步确定用户是否说谎，以增强挖掘的用户真实意向的准确性。在真伪检测的过程中，采用真伪检测模型进行，将对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，并根据文本属性概率确定对话文本的真伪类别，本实施例提供的一种可选实施方式中，真伪检测模型采用如下方式进行真伪检测：

对所述对话文本进行分词处理获得词片段，以及在词向量表中查找与所述词片段映射的词向量；

将所述词向量输入卷积神经网络进行卷积运算和池化处理，输出池化处理结果；

根据所述池化处理结果计算所述对话文本的所述文本属性概率。

其中，所述词向量表，是指表征词片段与词向量之间映射关系的表。

例如，利用分词算法或者分词模型对对话文本进行分词处理获得词片段，并在词向量表中查找到词片段映射的词向量，将词向量输入卷积神经网络模型(CNN，Convolutional Neural Networks)先对词向量进行卷积运算，针对卷积运算结果再进行池化处理，输出池化处理结果，最后将池化处理结果输入多层感知网络(MLP，Multi-LayerPerception)计算对话文本的文本属性概率，在计算文本属性概率的过程中，可采用归一化指数函数(比如softmax函数)计算。

在上述计算获得对话文本的文本属性概率的基础上，根据文本属性概率确定对话文本的真伪类别，比如文本属性概率为90％，根据预先配置策略“文本属性概率＞85％，对话文本的真伪类别为真类别；文本属性概率≤85％，对话文本的真伪类别为伪类别”，确定文本属性概率90％>85％时，对话文本的真伪类别为真类别。

此外，在获取用户在目标服务输入的对话文本之后，也可将对话文本传入自然语言理解(NLU，Natural Language Understanding)部分，自然语言理解中包含意图识别、情感分类、真伪检测以及实体识别4个子部分，即将对话文本并行输入意图识别、情感分类、真伪检测以及实体识别子部分，分别输出对话文本的对话意图、对话文本的情感极性、对话文本的真伪类别以及对话文本中的实体特征信息；通过集成化的实现方式，提升对话交互过程中的对话处理效率；另外，上述4个子部分也可都为模型的形式，即意图识别模型、情感分类模型、真伪检测模型以及实体识别模型。

实际应用中，真伪检测模型在具体应用之前，还可进行离线训练，即真伪检测模型的执行处理过程分为离线训练和在线检测2个阶段；上述已说明真伪检测模型的具体应用过程，下述详细说明模型离线训练过程。

(1)构建用于训练模型的对话样本数据集。

在历史数据库中抽取用户对话数据，根据对话标识和对话时间对所述用户对话数据进行分割处理，获得交互信息对，针对所述交互信息对进行格式转换和数据清洗，并对数据清洗后的交互信息对进行真伪类别标注，生成所述对话样本数据集。

其中，所述对话标识，包括针对对话交互过程的标记；所述对话时间，是指在对话交互过程中的实时对话时间；所述交互信息对，包括目标服务的服务方与用户2方在对话交互过程中产生的问答形式的信息对，比如，服务方：“请问您什么时间能还款？”，用户：“我还得还车贷，暂时没有多余的钱”，服务方与用户的问答形式组成交互信息对。

具体的，在历史数据库中抽取用户对话数据的过程中，可抽取预设数量的用户对话数据，也可抽取预设时间段内的用户对话数据，比如抽取10万份用户对话数据，再比如抽取x月1日-x月5日之间的用户对话数据，本实施例针对用户对话数据的具体抽取规则不作限定，根据实际应用场景确定。

在抽取获得用户对话数据之后，可在对话标识下按对话时间将用户对话数据分割为交互信息对，通过对交互信息对的真伪类别进行标注，实现数据标记的精细化，进一步通过对样本数据的精细化处理，提升模型的精确度。由于交互信息对可能不支持标注工具的数据格式，导致无法进行后续真伪类别的标注，所以为了更好地匹配标注工具，可针对交互信息对进行格式转换处理，再针对格式转换处理后的交互信息对进行数据清洗，以过滤掉空白、重复、系统自动生成、不规范等的交互信息对，提升样本数据的准确性，在此之后，针对数据清洗后的交互信息对进行真伪类别标注生成对话样本数据集，在具体标注的过程中，可利用标注工具进行标注，生成类别标签。

(2)构建初始真伪检测模型。

a.设置词向量输入参数，并基于所述词向量输入参数构建针对词片段进行词向量转换的转换函数。

b.设计卷积网络模型，用于对词向量进行卷积处理和池化处理。

c.构建多层感知网络，用于利用池化处理结果计算预测概率，在此过程中，可基于归一化指数函数计算预测概率；此处的预测概率为真伪检测模型的输出结果。

例如，多层感知网络为MLP(multi-layer perceptron)，采用softmax函数

计算预测概率。

需要说明的是，在构建初始真伪检测模型的过程中，可根据实际需求构建预设数量的初始真伪检测模型，比如构建10个初始真伪检测模型。

此外，还可设计基于交叉熵的损失函数计算预测值和标签值的差值，并基于梯度下降的反向传播算法更新模型参数。

(3)对上述对话样本数据集进行数据预处理，获得预处理后的对话样本数据集。

a.针对对话样本数据集中的对话样本进行分词处理，获得词片段，并对词片段进行词性标注，根据词性标注结果对对话样本中不符合样本要求的对话信息进行过滤；将过滤获得的词片段输入转换函数，输出该词片段对应的词向量；建立该词片段和该词向量的映射关系；基于该映射关系构建词向量表。

b.从对话样本数据集中提取真伪类别的类别标签，针对类别标签设置对应的类别标识；建立该类别标签与该类别标识的映射关系，并基于映射关系构建类别双向映射表。

(4)对初始真伪检测模型进行模型训练，获得真伪检测模型。

将预处理后的对话样本数据集随机分成第二预设数量且互不相交的子集，采用交叉验证的方式训练预设数量的初始真伪检测模型。

例如，将预处理后的对话样本数据集随机分成10份子集，其中8份子集作为训练集，1份作为验证集，1份作为测试集。针对初始真伪检测模型进行模型训练的训练过程在TensorFlow(基于数据流编程的符号数学系统)平台上完成。在模型训练过程中，加入测试集，目的在于防止在模型最终结果上作弊的作弊行为，保证模型最终结果的有效性。

步骤S106，根据所述文本特征信息、所述真伪类别和历史用户信息，确定对话状态。

本实施例所述对话状态，包括对话交互过程中对话的进行状态，比如，目标服务为贷款服务，用户针对贷款审批阶段开启对话交互，而贷款审批阶段涉及的执行状态有：递交材料、核对材料、签订合同、贷款审批、贷款发放，具体对话状态即是指对话文本中呈现的执行状态。

所述历史用户信息，包括但不限于用户的历史特征、历史资金行为信息、历史对话状态、对话文本、历史对话文本。

具体实施时，上述识别对话文本的文本特征信息，将对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，以及根据文本属性概率确定对话文本的真伪类别，本步骤中，将文本特征信息、真伪类别与历史用户信息进行结合，综合确定对话状态，依据多样化的数据来源，提升对话状态的确定准确性。

在具体的执行过程中，为了进一步提升对话状态的确定准确性，可采用模型确定对话状态，本实施例提供的一种可选实施方式中，在根据文本特征信息、真伪类别和历史用户信息，确定对话状态的过程中，执行如下操作：

将所述文本特征信息、所述真伪类别和所述历史用户信息输入对话状态确定模型进行对话状态确定，输出所述对话文本的对话状态。

其中，所述对话状态确定模型可以采用神经网络模型。

沿用上例，文本特征信息分别为：对话意图“还款金额不足”，情感极性“消极”，实体特征信息“车贷”、“钱”，真伪类别为“真类别”，历史用户信息“职业”，将文本特征信息、真伪类别和历史用户信息输入神经网络模型，输出对话状态为“贷款逾期”。

此外，在识别所述对话文本的文本特征信息，将所述对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，以及根据所述文本属性概率确定所述对话文本的真伪类别之后，在根据所述文本特征信息、所述真伪类别和历史用户信息，确定对话状态之前，还可将获取的用户在目标服务输入的对话文本添加至用户的历史对话文本作为历史对话信息。

步骤S108，基于所述历史用户信息和所述对话状态，确定所述用户针对所述目标服务的置信度，以及在所述目标服务的候选违约影响因子中确定目标违约影响因子。

本实施例所述置信度，包括用户遵守目标服务的相关规定的可信度，比如置信度为90％，说明用户有90％的概率遵守目标服务的相关规定。

所述候选违约影响因子，是指用户针对目标服务产生违约行为的影响因素，所述候选违约影响因子，包括但不限于：年龄、性别、职业、行为特征(行为次数、违约次数、违约金额)；所述目标违约影响因子，是指在候选违约影响因子中选择的重要性较高的影响因子。比如，目标服务为资金服务，行为次数为资金行为次数，违约次数为资金违约次数，违约金额为资金违约金额，再比如资金服务为贷款服务，行为次数为贷款次数，违约次数为贷款逾期次数，违约金额为贷款逾期金额。

上述根据文本特征信息、真伪类别和历史用户信息，确定对话状态，在此基础上，本步骤中，以历史用户信息和对话状态为依据，确定用户在目标服务的置信度，具体确定用户遵守目标服务的相关规定的可信度，并以历史用户信息和对话状态为依据，在目标服务的候选违约影响因子中选择目标违约影响因子。

具体实施时，采用决策模型进行影响因子排序和置信度计算，提升排序和置信度计算的效率，本实施例提供的一种可选实施方式中，在基于历史用户信息和对话状态，确定用户在目标服务的置信度，以及在目标服务的候选违约影响因子中确定目标违约影响因子的过程中，执行如下操作：

将所述历史用户信息和所述对话状态输入决策模型进行影响因子排序和置信度计算，输出影响因子排序结果以及所述置信度；所述影响因子排序结果由所述候选违约影响因子构成；

在所述影响因子排序结果中筛选排序位置处于预设位置之前的候选违约影响因子作为所述目标违约影响因子。

其中，预设位置可以是第5个，也可以是第3个，针对预设位置本实施例在此不作具体限定，根据实际应用场景需求确定预设位置；所述影响因子排序结果可以是影响因子排序列表。

实际应用中，确定的用户在目标服务的置信度可能未达到要求，基于此，可配置规则引擎，在基于历史用户信息和对话状态，确定用户在目标服务的置信度之后，判断该置信度是否符合置信度要求，若符合置信度要求，则将该置信度作为最终的置信度结果，并再生成对话文本的第一响应动作，进而基于第一响应动作生成第一响应文本作为所述响应文本；若不符合置信度要求，则利用规则引擎生成第二响应动作，再基于第二响应动作生成第二响应文本作为所述响应文本，以通过2种响应动作的生成方式，提升响应动作的有效性和准确性。

本实施例提供的一种可选实施方式中，基于历史用户信息和对话状态，确定用户在目标服务的置信度，以及在目标服务的候选违约影响因子中确定目标违约影响因子执行之后，根据历史用户信息中包含的历史对话信息、目标违约影响因子和置信度生成对话文本的响应文本执行之前，还执行如下操作：

在所述置信度大于预设置信度阈值的情况下，执行所述根据所述历史用户信息中包含的历史对话信息、所述目标违约影响因子和所述置信度生成所述对话文本的响应文本；

在所述置信度小于或者等于预设置信度阈值的情况下，将所述历史用户信息输入规则引擎进行响应动作确定，输出所述对话文本的第一响应动作；

基于所述第一响应动作从所述历史对话信息中提取文本关键信息，将所述文本关键信息填充至文本生成模板，生成所述对话文本的第一响应文本作为所述响应文本。

其中，所述第一响应动作，是指基于规则引擎生成的针对对话文本的响应动作，包括反问、确认、澄清、信息收集、开启和/或结束，此外，第一响应动作还可包括其它形式的响应动作。

所述文本关键信息，是指在生成响应文本的过程中所要用到的关键信息，比如，对话文本为“我还得还车贷，暂时没有多余的钱”，资金服务的服务方未理解该对话文本，第一响应动作为“反问”，则在该对话文本中提取的文本关键信息为“车贷”、“钱”，针对反问的文本生成模板为“请问xx吗？”，将提取的文本关键信息“车贷”、“钱”填充至文本生成模板中，可获得第一响应文本为“请问您是还完自己的车贷，没有多余的钱还贷款吗？”。

在置信度小于或者等于预设置信度阈值的情况下，也可将历史用户信息输入规则引擎进行响应动作确定，输出对话文本的第一响应动作；将第一响应动作和历史对话信息输入文本生成模型进行响应文本生成，输出对话文本的第二响应文本作为响应文本。

步骤S110，根据所述历史用户信息中包含的历史对话信息、所述目标违约影响因子和所述置信度生成所述对话文本的响应文本。

本实施例所述历史对话信息，包括用户当前输入的对话文本以及历史输入的对话文本；所述响应文本，是指针对用户输入的对话文本向用户展示的回复文本。

具体实施时，上述基于历史用户信息和对话状态，确定用户在目标服务的置信度，以及在目标服务的候选违约影响因子中确定目标违约影响因子，本步骤中，借助目标违约影响因子、置信度以及历史用户信息中包含的历史对话信息，生成对话文本的响应文本，进一步通过向用户展示的响应文本引导用户进行更深度的对话交互，提升还款意向的精确度。

在具体的执行过程中，在上述通过对置信度的判断，确定响应文本的生成方式的基础上，本实施例在置信度大于预设置信度阈值的情况下，先生成第二响应动作，再基于第二响应动作生成响应文本。本实施例提供的一种可选实施方式中，具体根据历史用户信息中包含的历史对话信息、目标违约影响因子和置信度生成对话文本的响应文本，包括：

根据所述历史对话信息、所述目标违约影响因子和所述置信度，确定所述对话文本的第二响应动作；

将所述第二响应动作和所述历史对话信息输入文本生成模型，输出所述对话文本的响应文本。

此外，在确定第二响应动作的过程中，可采用决策模型进行，将历史对话信息、目标违约影响因子和置信度输入决策模型进行响应动作确定，输出对话文本的第二响应动作，再将第二响应动作和历史对话信息输入文本生成模型，输出对话文本的响应文本。

需要说明的是，在根据历史用户信息中包含的历史对话信息、目标违约影响因子和置信度生成对话文本的响应文本的过程中，也可根据历史对话信息、目标违约影响因子和置信度，确定对话文本的第二响应动作；基于第二响应动作从历史对话信息中提取文本关键信息，将文本关键信息填充至文本生成模板，生成对话文本的第一响应文本作为响应文本。

另外，若用户在目标服务的置信度，是通过决策模型输出，则在输出的置信度未达到要求的情况下，可在配置决策模型的同时，再配置规则引擎，与决策模型配合进行处理，在决策模型输出置信度之后，判断输出的置信度是否符合置信度要求，若符合置信度要求，则将决策模型输出的置信度作为最终的置信度结果，并再利用决策模型生成对话文本的第一响应动作，进而基于第一响应动作生成第一响应文本作为所述响应文本；若不符合置信度要求，则利用规则引擎生成第二响应动作，再基于第二响应动作生成对话文本的响应文本，以此通过模型与规则引擎的配合，判断模型和规则引擎二者中哪一者适合针对当前对话文本计算置信度，提升置信度的有效性和准确性。

需要补充的是，在基于历史用户信息和对话状态，确定用户在目标服务的置信度的基础上，也可直接将历史对话信息、目标违约影响因子和置信度输入决策模型进行响应动作确定，输出对话文本的第一响应文本；在此基础上，将历史用户信息输入规则引擎进行响应动作确定，输出对话文本的第二响应动作；将第一响应动作和第二响应动作进行融合处理，获得所述响应动作。

在针对第一响应动作和第二响应动作进行融合处理的过程中，若第一响应动作和第二响应动作一致，则将第一响应动作或者第二响应动作作为所述响应动作；若第一响应动作和第二响应动作不一致，则判断第一响应动作对应的置信度是否大于第二响应动作对应的置信度；若大于，则将第一响应动作作为所述响应动作，若小于则将第二响应动作作为所述响应动作。

下述以本实施例提供的一种对话处理方法在贷款服务场景的应用为例，结合附图2和附图3对本实施例提供的应用于贷款服务场景的对话处理方法进行进一步说明，参见图3，应用于贷款服务场景的对话处理方法，具体包括步骤S302至步骤S318。

如图2所示，应用于贷款服务场景的对话处理处理过程，分为自然语言理解(NLU，Natural Language Understanding)、对话管理(DM，Dialog Management)以及自然语言生成(NLG，Natural-language generation)3个处理阶段，用户u在贷款服务输入的对话文本并行经过谎言检测、实体识别、意图识别以及情感识别，依次输出关于是否说谎的谎言类别、实体特征信息、对话意图以及情感极性4者；将该4者传入神经网络模型确定对话状态，再经过决策模型对候选违约影响因子进行排序，并且计算用户针对贷款服务的置信度，由此生成对话文本的响应动作，其中，响应动作的类型有反问、确认、澄清、信息收集、开启以及结束，此外，响应动作还可以是其它类型的动作，基于响应动作与历史对话信息并采用文本生成模型或者文本生成模板生成对话文本的响应文本，便于用户理解，提升用户体验。

步骤S302，获取用户在贷款服务输入的对话文本。

在此之前，可获取用户特征信息和/或历史资金行为信息，根据用户特征信息和/或历史资金行为信息生成开启文本向用户展示，该开启文本根据用户特征信息和/或历史资金行为信息个性化生成。其中，所述用户特征信息，包括与用户本身特征相关的信息，比如性别、职业、年龄等等；所述历史资金行为信息，包括历史各期的资金信息，比如历史各期的资金逾期天数、逾期总金额、催收次数。

例如，用户u的用户特征信息中性别为男，历史资金行为信息中记录有1次逾期还款3天，则可针对用户u生成开启文本“xx先生，您的贷款已逾期3天，请您尽快结清贷款”；用户u在贷款服务输入的对话文本为“我还得还车贷，暂时没有多余的钱”。

步骤S304，对对话文本进行意图识别，得到对话文本的对话意图。

沿用上例，针对用户u在贷款服务输入的对话文本“我还得还车贷，暂时没有多余的钱”进行意图识别，获得该对话文本的对话意图为“还款金额不足”。

步骤S306，从对话文本中提取与贷款服务关联的实体特征信息，以及确定对话文本的情感极性。

沿用上例，针对用户u在贷款服务输入的对话文本“我还得还车贷，暂时没有多余的钱”进行实体识别，即从该对话文本中提取与贷款服务关联的实体特征信息“车贷”、“钱”；同时，对对话文本进行情感识别，输出对话文本的情感极性为“消极”。

步骤S308，将对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，以及根据文本属性概率确定对话文本的真伪类别。

假设真伪检测模型输出的文本属性概率为90％，根据预先配置策略“文本属性概率＞85％，对话文本的真伪类别为真类别；文本属性概率≤85％，对话文本的真伪类别为伪类别”；在文本属性概率90％>85％的情况下，该对话文本的真伪类别为真类别。

步骤S310，将对话文本的对话意图、实体特征信息、情感极性、真伪类别和历史用户信息输入神经网络模型进行对话状态确定，输出对话文本的对话状态。

此处的神经网络模型为对话状态确定模型，此外，神经网络模型还可被替换为其他形式的模型。

其中，历史用户信息，包括但不限于用户的历史特征、历史资金行为信息、历史对话状态、对话文本、历史对话文本。

沿用上例，将对话文本的对话意图“还款金额不足”，实体特征信息“车贷”、“钱”，情感极性“消极”、真伪类别“真类别”和历史用户信息“男，1次逾期还款3天”输入神经网络模型进行对话状态确定，输出对话状态为“贷款逾期状态”。

步骤S312，将历史用户信息和对话状态输入决策模型进行影响因子排序和置信度计算，输出影响因子列表以及置信度。

其中，影响因子列表由候选违约影响因子组成。

例如，候选违约影响因子包括：年龄、性别、职业、行为特征(资金行为次数、资金违约次数、违约金额)，决策模型输出的影响因子列表为：行为特征、职业、年龄、性别，输出的置信度为85％。

步骤S314，在影响因子列表中筛选排序位置处于预设位置之前的候选违约影响因子作为目标违约影响因子。

沿用上例，在影响因子列表中筛选前2位的候选违约影响因子作为目标违约影响因子：行为特征、职业。

步骤S316，若该置信度大于预设置信度阈值，则根据历史对话信息、目标违约影响因子和置信度，确定对话文本的响应动作。

假设预设置信度阈值为86％，在85％>86％的情况下，该置信度大于预设置信度阈值。

沿用上例，根据历史对话信息、目标违约影响因子“行为特征、职业”和置信度，确定对话文本的响应动作为“反问”。

此外，若该置信度小于或者等于预设置信度阈值，则将历史用户信息输入规则引擎进行响应动作确定，输出对话文本的第一响应动作；基于第一响应动作从历史对话信息中提取文本关键信息，将文本关键信息填充至文本生成模板，生成对话文本的响应文本。

步骤S318，将响应动作和历史对话信息输入文本生成模型，输出对话文本的响应文本。

沿用上例，在基于响应动作和历史对话信息生成响应文本的过程中，可采用文本生成模型进行，提升响应文本生成的效率，具体生成响应文本“请问您是还完自己的车贷，没有多余的钱还贷款吗？”，以引导用户进行更深层次的对话交互。

此外，在生成响应文本的过程中，也可基于响应动作从历史对话信息中提取文本关键信息，将文本关键信息填充至文本生成模板，生成对话文本的响应文本。

本说明书提供的一种对话处理装置实施例如下：

在上述的实施例中，提供了一种对话处理方法，与之相对应的，还提供了一种对话处理装置，下面结合附图进行说明。

参照图4，其示出了本实施例提供的一种对话处理装置示意图。

由于装置实施例对应于方法实施例，所以描述得比较简单，相关的部分请参见上述提供的方法实施例的对应说明即可。下述描述的装置实施例仅仅是示意性的。

本实施例提供一种对话处理装置，包括：

对话文本获取模块402，用于获取用户在目标服务输入的对话文本；

真伪检测模块404，用于识别所述对话文本的文本特征信息，将所述对话文本输入真伪检测模型进行真伪检测，输出文本属性概率，以及根据所述文本属性概率确定所述对话文本的真伪类别；

对话状态确定模块406，用于根据所述文本特征信息、所述真伪类别和历史用户信息，确定对话状态；

影响因子确定模块408，用于基于所述历史用户信息和所述对话状态，确定所述用户针对所述目标服务的置信度，以及在所述目标服务的候选违约影响因子中确定目标违约影响因子；

响应文本生成模块410，用于根据所述历史用户信息中包含的历史对话信息、所述目标违约影响因子和所述置信度生成所述对话文本的响应文本。

本说明书提供的一种对话处理设备实施例如下：

对应上述描述的一种对话处理方法，基于相同的技术构思，本申请实施例还提供一种对话处理设备，该对话处理设备用于执行上述提供的对话处理方法，图5为本申请实施例提供的一种对话处理设备的结构示意图。

本实施例提供的一种对话处理设备，包括：

如图5所示，对话处理设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器501和存储器502，存储器502中可以存储有一个或一个以上存储应用程序或数据。其中，存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对话处理设备中的一系列计算机可执行指令。更进一步地，处理器501可以设置为与存储器502通信，在对话处理设备上执行存储器502中的一系列计算机可执行指令。对话处理设备还可以包括一个或一个以上电源503，一个或一个以上有线或无线网络接口504，一个或一个以上输入/输出接口505，一个或一个以上键盘506等。

在一个具体的实施例中，对话处理设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对对话处理设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

获取用户在目标服务输入的对话文本；

本说明书提供的一种计算机可读存储介质实施例如下：

对应上述描述的一种对话处理方法，基于相同的技术构思，本申请实施例还提供一种计算机可读存储介质。

本实施例提供的计算机可读存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现以下流程：

获取用户在目标服务输入的对话文本；

需要说明的是，本说明书中关于计算机可读存储介质的实施例与本说明书中关于对话处理方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应方法的实施，重复之处不再赘述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本领域内的技术人员应明白，本申请实施例可提供为方法、系统或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程对话处理设备的处理器以产生一个机器，使得通过计算机或其他可编程对话处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程对话处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程对话处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本文件的实施例而已，并不用于限制本文件。对于本领域技术人员来说，本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本文件的权利要求范围之内。

Claims

1.一种对话处理方法，其特征在于，所述方法包括：

获取用户在目标服务输入的对话文本；

2.根据权利要求1所述的方法，其特征在于，所述基于所述历史用户信息和所述对话状态，确定所述用户针对所述目标服务的置信度，以及在所述目标服务的候选违约影响因子中确定目标违约影响因子，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述历史用户信息和所述对话状态，确定所述用户针对所述目标服务的置信度，以及在所述目标服务的候选违约影响因子中确定目标违约影响因子执行之后，所述根据所述历史用户信息中包含的历史对话信息、所述目标违约影响因子和所述置信度生成所述对话文本的响应文本执行之前，还包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述历史用户信息中包含的历史对话信息、所述目标违约影响因子和所述置信度生成所述对话文本的响应文本，包括：

5.根据权利要求1所述的方法，其特征在于，所述识别所述对话文本的文本特征信息，包括：

6.根据权利要求1所述的方法，其特征在于，所述真伪检测模型采用如下方式进行真伪检测：

7.根据权利要求1所述的方法，其特征在于，所述根据所述文本特征信息、所述真伪类别和历史用户信息，确定对话状态，包括：

8.一种对话处理装置，其特征在于，所述装置包括：

9.一种对话处理设备，其特征在于，所述设备包括：

处理器；以及，被配置为存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器执行如权利要求1-7任一项所述的对话处理方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现如权利要求1-7任一项所述的对话处理方法。