CN117114695B

CN117114695B - 基于钢铁行业智能客服的交互方法及装置

Info

Publication number: CN117114695B
Application number: CN202311352807.7A
Authority: CN
Inventors: 孙闻初; 邵剑超; 张可; 王方
Original assignee: Benxi Steel Group Information Automation Co ltd
Current assignee: Benxi Steel Group Information Automation Co ltd
Priority date: 2023-10-19
Filing date: 2023-10-19
Publication date: 2024-01-26
Anticipated expiration: 2043-10-19
Also published as: CN117114695A

Abstract

本发明提供一种基于钢铁行业智能客服的交互方法及装置，通过获取多轮历史问答信息和每轮历史问答信息对应的业务标签，以及当前问询信息对应的业务标签，并据此在钢铁业务规则库里进行检索，基于检索结果确定用户的当前会话的会话类型；若用户的当前会话的会话类型为固定流程交互，则基于当前会话对应的固定流程确定与当前问询信息相关的历史问答信息，在将当前问询信息输入到智能客服之前解决了相关上下文提取过程中存在的噪声问题和长距离依赖问题，规避了智能客服在多轮对话场景下存在的弊端，然后将当前问询信息及与当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到当前问询信息的当前答复信息，提升了智能客服的交互性能。

Description

基于钢铁行业智能客服的交互方法及装置

技术领域

本发明涉及人机交互技术领域，尤其涉及一种基于钢铁行业智能客服的交互方法及装置。

背景技术

目前智能客服在各行业都得到了广泛应用，钢铁行业也不例外。智能客服的实时响应和24小时值守等特点，为销售、售后和异议处理等交互问题提供了有效的解决方案。通过部署智能客服系统，钢铁企业可以在任何时间提供高质量的服务，满足客户的需求，提高客户满意度。

然而，在多轮对话的场景下，智能客服的交互性能面临一些挑战。钢铁行业的业务规则通常比较复杂，导致一次完整的会话中可能包含多轮的对话。这就意味着在多轮对话中存在大量的上下文信息，而这些信息可能会引入大量噪声，干扰智能客服对于当前对话及其上下文的语义理解，从而降低智能客服的交互性能。另外一个重要的问题是智能客服背后的语言模型在处理多轮对话时仍然受到长距离依赖问题的影响，尤其在上下文文本长度不固定的情况下，提取与当前对话相关的上下文信息变得更加困难。

发明内容

本发明提供一种基于钢铁行业智能客服的交互方法及装置，用以解决现有技术中钢铁行业智能客服的交互性能欠佳的缺陷。

本发明提供一种基于钢铁行业智能客服的交互方法，包括：

接收用户输入的当前问询信息，并获取所述用户对应的多轮历史问答信息和每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签；

基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；

若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

根据本发明提供的一种基于钢铁行业智能客服的交互方法，若所述用户的当前会话的会话类型为非固定流程交互，所述方法还包括：

获取所述当前问询信息及所述多轮历史问答信息的融合编码；所述融合编码为固定数量的嵌入向量组成的序列；

基于所述当前问询信息及所述多轮历史问答信息的融合编码中的各个嵌入向量，利用多维度编码模型的维度编码层，获取全局维度向量和局部维度向量；其中，获取所述全局维度向量时，所述各个嵌入向量的权重相同；获取所述局部维度向量时，所述各个嵌入向量的权重不同；

基于所述多维度编码模型的融合层，将所述全局维度向量和所述局部维度向量融合，得到多维度融合向量；

将所述多维度融合向量输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

根据本发明提供的一种基于钢铁行业智能客服的交互方法，所述基于所述当前问询信息及所述多轮历史问答信息的融合编码中的各个嵌入向量，利用多维度编码模型的维度编码层，获取全局维度向量和局部维度向量，具体包括：

求取所述各个嵌入向量中每个元素的平均值，并基于所述每个元素的平均值组合成所述全局维度向量；

基于所述各个嵌入向量各自对应的权重，对所述各个嵌入向量中的每个元素进行加权求和，并基于每个元素的加权和组合成所述局部维度向量；其中，任一嵌入向量对应的权重是基于线性整流函数对第一转换矩阵与所述当前问询信息及所述多轮历史问答信息的融合编码的乘积进行处理，得到第一整流结果后，再基于sigmoid函数对所述任一嵌入向量在所述当前问询信息及所述多轮历史问答信息的融合编码中的位置对应的位置调节系数与所述第一整流结果的乘积进行处理后得到的；所述第一转换矩阵与各个位置对应的位置调节系数的取值是在所述多维度编码模型的训练过程中学习到的。

根据本发明提供的一种基于钢铁行业智能客服的交互方法，所述多维度编码模型是基于多维度冗余损失优化得到的；在所述多维度编码模型的任一轮迭代训练过程中，所述多维度冗余损失是基于如下步骤计算得到的：

分别获取所述任一轮迭代训练过程对应的各个训练样本的样本融合编码；

基于各个训练样本的样本融合编码，利用多维度编码模型的维度编码层，获取各个训练样本各自对应的样本全局维度向量和样本局部维度向量；

针对任一训练样本，计算所述任一训练样本对应的互信息损失和距离损失，并基于所述任一训练样本对应的互信息损失和距离损失确定所述任一训练样本的单样本冗余损失；其中，所述任一训练样本对应的互信息损失是所述任一训练样本对应的样本全局维度向量和样本局部维度向量之间的互信息的相反数，所述任一训练样本对应的距离损失是所述任一训练样本对应的样本全局维度向量的分布与所述任一训练样本对应的样本局部维度向量的分布之间的KL距离；

对各个训练样本的单样本冗余损失求和，得到所述多维度冗余损失。

根据本发明提供的一种基于钢铁行业智能客服的交互方法，所述将所述全局维度向量和所述局部维度向量融合，得到多维度融合向量，具体包括：

基于所述全局维度向量对应的第一融合调节系数和所述局部维度向量对应的第二融合调节系数，对所述全局维度向量和所述局部维度向量进行加权求和，得到所述多维度融合向量；

其中，所述第一融合调节系数和所述第二融合调节系数之和为1；所述第一融合调节系数是基于线性整流函数对第二转换矩阵与所述全局维度向量和所述局部维度向量之和的乘积进行处理，得到第二整流结果后，再基于sigmoid函数对第三转换矩阵与所述第二整流结果的乘积进行处理后得到的；所述第二转换矩阵与所述第三转换矩阵的取值是在所述多维度编码模型的训练过程中学习到的。

根据本发明提供的一种基于钢铁行业智能客服的交互方法，所述智能客服是基于如下步骤构建的：

获取钢铁行业客户服务中的实际对话数据；

获取预训练语言模型作为初始模型，并基于所述实际对话数据对所述初始模型进行微调，得到所述智能客服。

根据本发明提供的一种基于钢铁行业智能客服的交互方法，所述基于所述实际对话数据对所述初始模型进行微调之后还包括：

若用户输入的当前问询信息为业务规则调整指令，则对所述用户进行鉴权，得到所述用户的鉴权结果；

若所述用户的鉴权结果指示所述用户具备规则库调整权限，则确定所述当前问询信息中包含的调整前业务规则和调整后业务规则，并基于所述调整前业务规则和所述调整后业务规则确定待更新对象及所述待更新对象的更新值；

基于所述待更新对象的更新值修改所述钢铁业务规则库中所述待更新对象的值。

本发明还提供一种基于钢铁行业智能客服的交互装置，包括：

信息接收单元，用于接收用户输入的当前问询信息，并获取所述用户对应的多轮历史问答信息和每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签；

会话类型确定单元，用于基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；

应答单元，用于若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述基于钢铁行业智能客服的交互方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述基于钢铁行业智能客服的交互方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述基于钢铁行业智能客服的交互方法。

本发明提供的基于钢铁行业智能客服的交互方法及装置，通过获取多轮历史问答信息和每轮历史问答信息对应的业务标签，以及当前问询信息对应的业务标签，并据此在钢铁业务规则库里进行检索，基于检索结果确定用户的当前会话的会话类型；若用户的当前会话的会话类型为固定流程交互，则基于当前会话对应的固定流程确定与当前问询信息相关的历史问答信息，可以有效滤除多轮历史问答信息中的噪声信息，并且，即使多轮历史问答信息中与当前问询信息相关的部分相隔较远，也能通过利用上述方式准确地获取相关信息，在将当前问询信息输入到智能客服之前解决了相关上下文提取过程中存在的噪声问题和长距离依赖问题，规避了智能客服在多轮对话场景下存在的弊端，然后将当前问询信息及与当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到当前问询信息的当前答复信息，提升了智能客服的交互性能。

此外，若用户的当前会话的会话类型为非固定流程交互，则获取当前问询信息及多轮历史问答信息的融合编码，基于该融合编码中的各个嵌入向量，获取全局维度向量和局部维度向量；其中，全局维度向量和局部维度向量之间的公共信息即为对于当前问询信息对应的任务有帮助的语义信息，通过将全局维度向量和局部维度向量融合，可以得到多维度融合向量，且该多维度融合向量中包含有丰富的对于当前问询信息对应的任务有帮助的语义信息，同一解决了相关上下文提取过程中存在的噪声问题和长距离依赖问题；再将该多维度融合向量输入至智能客服，智能客服可以快速提取出多维度融合向量中的上述语义信息，从而返回当前问询信息的更准确的当前答复信息，提升了智能客服的交互性能。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于钢铁行业智能客服的交互方法的流程示意图之一；

图2是本发明提供的基于钢铁行业智能客服的交互方法的流程示意图之二；

图3是本发明提供的多维度冗余损失计算方法的流程示意图；

图4是本发明提供的基于钢铁行业智能客服的交互装置的结构示意图；

图5是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明提供的基于钢铁行业智能客服的交互方法的流程示意图，如图1所示，该方法包括：

步骤110，接收用户输入的当前问询信息，并获取所述用户对应的多轮历史问答信息和每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签。

具体地，历史问答信息包括历史问询信息和历史答复信息，且历史问询信息和历史答复信息对应同一业务标签。为了获取当前问询信息和历史问答信息对应的业务标签以确定当前问询信息和历史问答信息所属的业务环节，可以基于已训练的分类器对当前问询信息和历史问答信息进行业务环节分类，得到相应的业务标签。其中，分类器可以基于样本问询信息以及人工标注的该样本问询信息的监督标签（用于指示该样本问询信息所属的业务环节）对任一语言模型（例如Bert模型或GPT模型等）训练得到。需要说明的是，可以依据钢铁行业知识库，将各类钢铁业务分解为多个基本业务环节，即任一钢铁业务可以由若干个基本业务环节组成，并将分解为一系列基本业务环节的钢铁业务存放于钢铁业务规则库中。分解为一系列基本业务环节的钢铁业务包括该钢铁业务包含的基本业务环节序列以及该序列中各个基本业务环节的具体操作。在对分类器进行有监督训练时人工标注的监督标签以及分类器实际使用过程中输出的业务标签均对应某一基本业务环节。

步骤120，基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互。

具体地，将每轮历史问答信息对应的业务标签以及当前问询信息对应的业务标签组合成一个业务环节序列，基于该业务环节序列在钢铁业务规则库里进行检索，以查询钢铁业务规则库中是否存在包含该业务环节序列的钢铁业务。若检索结果不为空，表明钢铁业务规则库中存在包含该业务环节序列的钢铁业务，因此可以确定该用户的当前会话的会话类型为固定流程交互，而在当前会话的会话类型为固定流程交互的情况下，可以根据预先获取的各个钢铁业务中各个基础业务环节之间的相关性，确定历史问答信息中与当前问询信息相关的部分。若检索结果为空，表明钢铁业务规则库中不存在包含该业务环节序列的钢铁业务，因此可以确定该用户的当前会话的会话类型为非固定流程交互。

步骤130，若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

具体地，在当前会话的会话类型为固定流程交互的情况下，可以根据检索结果对应的钢铁业务的固定流程中各个基础业务环节之间的相关性这一先验知识，结合各轮历史问答信息的业务标签所指示的基本业务环节和当前问询信息的业务标签所指示的基本业务环节，确定多轮历史问答信息中与当前问询信息相关的部分。通过该方式从大量的历史问答信息中获取其中与当前问询信息相关的部分，可以有效滤除多轮历史问答信息中的噪声信息，并且，即使多轮历史问答信息中与当前问询信息相关的部分相隔较远（即存在长距离依赖问题），也能通过利用上述先验知识准确地获取相关信息，在将当前问询信息输入到智能客服之前解决了相关上下文提取过程中存在的噪声问题和长距离依赖问题，规避了智能客服在多轮对话场景下存在的弊端，从而提升了智能客服的交互性能。

具体在将当前问询信息输入至智能客服时，可以基于预训练的编码模型（例如Bert模型）对当前问询信息及与当前问询信息相关的历史问答信息的拼接结果进行编码，得到当前问询信息及与其相关的历史问答信息的融合编码。需要说明的是，该融合编码为固定数量的嵌入向量组成的序列，且嵌入向量的长度也是固定的。将上述融合编码输入至智能客服，由于该融合编码中包含了当前问询信息的语义信息以及与当前问询信息相关的历史问答信息的语义信息，智能客服可以从中获取到上述语义信息并生成相应的答复文本，从而得到该智能客服返回的该当前问询信息的当前答复信息。

在另一些实施例中，当该用户的当前会话的会话类型为非固定流程交互时，如图2所示，可以通过如下方式对当前问询信息进行应答：

步骤210，获取所述当前问询信息及所述多轮历史问答信息的融合编码；所述融合编码为固定数量的嵌入向量组成的序列；

步骤220，基于所述当前问询信息及所述多轮历史问答信息的融合编码中的各个嵌入向量，利用多维度编码模型的维度编码层，获取全局维度向量和局部维度向量；其中，获取所述全局维度向量时，所述各个嵌入向量的权重相同；获取所述局部维度向量时，所述各个嵌入向量的权重不同；

步骤230，基于所述多维度编码模型的融合层，将所述全局维度向量和所述局部维度向量融合，得到多维度融合向量；

步骤240，将所述多维度融合向量输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

其中，类似于当前问询信息及与当前问询信息相关的历史问答信息的融合编码的获取方式，可以基于预训练的编码模型对当前问询信息及多轮历史问答信息的拼接结果进行编码，得到当前问询信息及多轮历史问答信息的融合编码。其中，该融合编码为固定数量的嵌入向量组成的序列，且嵌入向量的长度也是固定的。将当前问询信息及多轮历史问答信息的融合编码输入至训练好的多维度编码模型中，利用多维度编码模型的维度编码层对当前问询信息及多轮历史问答信息的融合编码进行多维度编码，得到全局维度向量和局部维度向量。其中，在获取全局维度向量时，该融合编码中的各个嵌入向量的权重相同；在获取局部维度向量时，该融合编码中的各个嵌入向量的权重不同。

在一些实施例中，维度编码层在提取全局维度向量时，可以求取当前问询信息及多轮历史问答信息的融合编码中各个嵌入向量中每个元素的平均值，并基于每个元素的平均值组合成全局维度向量。在提取局部维度向量时，可以基于上述融合编码中各个嵌入向量各自对应的权重，针对各个嵌入向量中的每个元素分别进行加权求和，并基于每个元素的加权和组成成局部维度向量。其中，任一嵌入向量对应的权重是基于线性整流函数（RELU）对第一转换矩阵（假设为W1）与当前问询信息及多轮历史问答信息的融合编码（假设为S）的乘积进行处理，得到第一整流结果（即RELU (W1·S)）后，再基于sigmoid函数对该嵌入向量在当前问询信息及多轮历史问答信息的融合编码中的位置（假设为i）对应的位置调节系数（假设为ai）与上述第一整流结果的乘积进行处理后得到的，即该嵌入向量对应的权重为sigmoid (ai·RELU (W1·S))。其中，第一转换矩阵与各个位置对应的位置调节系数的取值是在多维度编码模型的训练过程中学习到的，为可学习参数。

可见，全局维度向量和局部维度向量中所提取的文本语义不完全相同，但是均包含有与当前问询信息对应的任务相关的语义信息，即全局维度向量和局部维度向量之间的公共信息即为对于当前问询信息对应的任务有帮助的语义信息，而全局维度向量和局部维度向量不共享的部分可以视作对于当前问询信息对应的任务没有帮助的冗余信息。而在多维度编码模型的训练过程中，会尽可能最大化全局维度向量和局部维度向量之间的公共信息，并最小化全局维度向量和局部维度向量之间不共享的部分，以优化全局维度向量和局部维度向量的语义表征能力。因此，通过多维度编码模型的融合层将全局维度向量和局部维度向量融合，可以得到多维度融合向量，且该多维度融合向量中包含有丰富的对于当前问询信息对应的任务有帮助的语义信息。再将该多维度融合向量输入至智能客服，智能客服可以快速提取出多维度融合向量中的上述语义信息，从而返回当前问询信息的更准确的当前答复信息。

具体在融合全局维度向量和局部维度向量时，可以基于全局维度向量对应的第一融合调节系数α和局部维度向量对应的第二融合调节系数β，对全局维度向量LG和局部维度向量LL进行加权求和，得到多维度融合向量（即αLG+βLL）。其中，第一融合调节系数和第二融合调节系数之和为1；第一融合调节系数是基于线性整流函数对第二转换矩阵（假设为W2）与全局维度向量和局部维度向量之和的乘积进行处理，得到第二整流结果（即RELU(W2·(LG +LL))）后，再基于sigmoid函数对第三转换矩阵（假设为W3）与上述第二整流结果的乘积进行处理后得到的，即第一融合调节系数为sigmoid (W3·RELU (W2·(LG +LL)))。第二转换矩阵与第三转换矩阵的取值同样是在多维度编码模型的训练过程中学习到的，均为可学习参数。

通过上述多维度编码方式，从当前问询信息和多轮历史问答信息中准确提取出对于当前问询信息对应的任务有帮助的语义信息，在非固定流程交互的场景下，也可以有效滤除多轮历史问答信息中的噪声信息，并且对于长距离依赖问题，由于全局维度向量和局部维度向量可以不同程度地提取出长文本中不同位置的语义信息，且全局维度向量和局部维度向量之间的公共信息是对于当前问询信息对应的任务有帮助的语义信息，因此通过融合全局维度向量和局部维度向，即使是历史问答信息中与当前问询信息相距较远的相关信息也能通过上述方式捕捉得到，解决了相关上下文提取过程中存在的噪声问题和长距离依赖问题，从而提升了智能客服的交互性能。

其中，多维度编码模型是基于多维度冗余损失优化得到的，从而实现最大化全局维度向量和局部维度向量之间的公共信息，并最小化全局维度向量和局部维度向量之间不共享的部分的目的。在一些实施例中，如图3所示，在多维度编码模型的任一轮迭代训练过程中，可以采用如下方式计算多维度冗余损失：

步骤310，分别获取所述任一轮迭代训练过程对应的各个训练样本的样本融合编码；

步骤320，基于各个训练样本的样本融合编码，利用多维度编码模型的维度编码层，获取各个训练样本各自对应的样本全局维度向量和样本局部维度向量；

步骤330，针对任一训练样本，计算所述任一训练样本对应的互信息损失和距离损失，并基于所述任一训练样本对应的互信息损失和距离损失确定所述任一训练样本的单样本冗余损失；

其中，所述任一训练样本对应的互信息损失是所述任一训练样本对应的样本全局维度向量和样本局部维度向量之间的互信息的相反数，所述任一训练样本对应的距离损失是所述任一训练样本对应的样本全局维度向量的分布与所述任一训练样本对应的样本局部维度向量的分布之间的KL距离；

步骤340，对各个训练样本的单样本冗余损失求和，得到所述多维度冗余损失。

具体而言，为了计算该轮迭代训练过程对应的多维度冗余损失，可以分别获取该轮迭代训练过程对应的各个训练样本的样本融合编码（样本融合编码也可以通过上述预训练的编码模型编码得到）。基于各个训练样本的样本融合编码，利用多维度编码模型的维度编码层，以与上述实施例中类似的方式获取各个训练样本各自对应的样本全局维度向量和样本局部维度向量。针对任一训练样本，计算该训练样本对应的互信息损失和距离损失，并将该训练样本对应的互信息损失和距离损失的总和作为该训练样本的单样本冗余损失。对各个训练样本的单样本冗余损失求和，得到该轮迭代训练过程对应的多维度冗余损失，并据此调整多维度编码模型的参数，完成此轮迭代训练。

此处，该训练样本对应的互信息损失是该训练样本对应的样本全局维度向量和样本局部维度向量之间的互信息的相反数，该训练样本对应的距离损失是该训练样本对应的样本全局维度向量的分布与该训练样本对应的样本局部维度向量的分布之间的KL距离。其中，由于KL距离不具备对称性，因此在计算该训练样本对应的样本全局维度向量的分布与该训练样本对应的样本局部维度向量的分布之间的KL距离时，需要分别计算样本全局维度向量的分布到样本局部维度向量的分布的KL距离，以及样本局部维度向量的分布到样本全局维度向量的分布的KL距离，并将两者求和作为样本全局维度向量的分布与样本局部维度向量的分布之间的KL距离。另外，在确定任一训练样本对应的样本全局维度向量的分布以及样本局部维度向量的分布时，可以利用基于神经网络构建的均值模型分别获取该训练样本对应的样本全局维度向量的均值向量以及样本局部维度向量的均值向量，并利用基于另一神经网络构建的标准差模型分别获取该训练样本对应的样本全局维度向量的标准差向量以及样本局部维度向量的标准差向量，然后基于样本全局维度向量的均值向量和标准差向量构建高斯分布，作为样本全局维度向量的分布，基于样本局部维度向量的均值向量和标准差向量构建高斯分布，作为样本局部维度向量的分布。

在一些实施例中，智能客服可以基于如下步骤构建得到：

1）获取钢铁行业客户服务中的实际对话数据。其中实际对话数据包括产品售后、订单跟进等实际钢铁业务对应的诸多对话数据。此外，由于钢铁行业涉及许多专业词汇，如各种钢材品种、化学成分等。可以将这些专业词汇构建成词表并纳入智能客服的训练,提高智能客服对于专业词汇的理解能力。

2）获取预训练语言模型作为初始模型，并基于上述实际对话数据对该初始模型进行微调。其中可以采用BERT或GPT模型等预训练语言模型作为初始模型，本发明实施例对此不作具体限定。随后使用收集的钢铁行业实际对话数据对该初始模型进行Fine-tuning，通过调整初始模型的参数，使其适应钢铁行业的客户服务场景，得到可应用于钢铁业务场景的智能客服。

在基于实际对话数据对上述初始模型进行微调之后，还可以收集客户的反馈数据，并使用客户的反馈数据进一步微调模型，持续优化智能客服的响应质量。此外，考虑到钢铁业务规则更新频繁，一旦某一钢铁业务规则发生了变化，需要将智能客服依赖的钢铁业务规则库同步进行更新。为了克服人工更新钢铁业务规则库所带来的效率低下、易出错（尤其是一个钢铁业务规则的变化可能带来连锁反应，导致与其关联的其他钢铁业务规则也需要同步更新的时候，人工更新易遗漏更新对象）等问题，可以利用智能客服的交互能力实现钢铁业务规则库库的自动更新。

具体而言，具备规则库调整权限的用户（例如管理员）可以通过输入业务规则调整指令，以交互的方式控制智能客服自主调整钢铁业务规则库。此处，考虑到钢铁业务规则库中的数据是企业内部的核心数据，因此需要对用户进行鉴权，防止钢铁业务规则库被恶意修改。例如，可以在用户输入的当前问询信息为业务规则调整指令时，对该用户进行鉴权，例如可以获取该用户的用户名确定其权限，从而得到该用户的鉴权结果。若该用户的鉴权结果指示该用户不具备规则库调整权限，则拒绝应答该业务规则调整指令。若该用户的鉴权结果指示该用户具备规则库调整权限，则确定当前问询信息中包含的调整前业务规则和调整后业务规则，并基于调整前业务规则和调整后业务规则确定待更新对象及该待更新对象的更新值。需要说明的是，可以预先为业务规则调整指令设定固定的指令格式，以明确该指令中哪一部分为调整前业务规则、哪一部分为调整后业务规则。通过比对调整前业务规则和调整后业务规则，可以确定待更新对象及该待更新对象的更新值。随后，可以基于待更新对象的更新值修改钢铁业务规则库中所有包含该待更新对象的钢铁业务规则中该待更新对象的值。

综上所述，本发明实施例提供的方法，通过获取多轮历史问答信息和每轮历史问答信息对应的业务标签，以及当前问询信息对应的业务标签，并据此在钢铁业务规则库里进行检索，基于检索结果确定用户的当前会话的会话类型；若用户的当前会话的会话类型为固定流程交互，则基于当前会话对应的固定流程确定与当前问询信息相关的历史问答信息，可以有效滤除多轮历史问答信息中的噪声信息，并且，即使多轮历史问答信息中与当前问询信息相关的部分相隔较远，也能通过利用上述方式准确地获取相关信息，在将当前问询信息输入到智能客服之前解决了相关上下文提取过程中存在的噪声问题和长距离依赖问题，规避了智能客服在多轮对话场景下存在的弊端，然后将当前问询信息及与当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到当前问询信息的当前答复信息，提升了智能客服的交互性能。

下面对本发明提供的基于钢铁行业智能客服的交互装置进行描述，下文描述的基于钢铁行业智能客服的交互装置与上文描述的基于钢铁行业智能客服的交互方法可相互对应参照。

基于上述任一实施例，图4是本发明提供的基于钢铁行业智能客服的交互装置的结构示意图，如图4所示，该装置包括：

信息接收单元410，用于接收用户输入的当前问询信息，并获取所述用户对应的多轮历史问答信息和每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签；

会话类型确定单元420，用于基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；

应答单元430，用于若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

本发明实施例提供的装置，通过获取多轮历史问答信息和每轮历史问答信息对应的业务标签，以及当前问询信息对应的业务标签，并据此在钢铁业务规则库里进行检索，基于检索结果确定用户的当前会话的会话类型；若用户的当前会话的会话类型为固定流程交互，则基于当前会话对应的固定流程确定与当前问询信息相关的历史问答信息，可以有效滤除多轮历史问答信息中的噪声信息，并且，即使多轮历史问答信息中与当前问询信息相关的部分相隔较远，也能通过利用上述方式准确地获取相关信息，在将当前问询信息输入到智能客服之前解决了相关上下文提取过程中存在的噪声问题和长距离依赖问题，规避了智能客服在多轮对话场景下存在的弊端，然后将当前问询信息及与当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到当前问询信息的当前答复信息，提升了智能客服的交互性能。

基于上述任一实施例，若所述用户的当前会话的会话类型为非固定流程交互，所述应答单元430还用于：

基于上述任一实施例，所述基于所述当前问询信息及所述多轮历史问答信息的融合编码中的各个嵌入向量，利用多维度编码模型的维度编码层，获取全局维度向量和局部维度向量，具体包括：

基于上述任一实施例，所述多维度编码模型是基于多维度冗余损失优化得到的；在所述多维度编码模型的任一轮迭代训练过程中，所述多维度冗余损失是基于如下步骤计算得到的：

基于上述任一实施例，所述将所述全局维度向量和所述局部维度向量融合，得到多维度融合向量，具体包括：

基于上述任一实施例，所述智能客服是基于如下步骤构建的：

获取钢铁行业客户服务中的实际对话数据；

基于上述任一实施例，该装置还包括模型调整单元，在所述基于所述实际对话数据对所述初始模型进行微调之后，模型调整单元用于：

图5是本发明提供的电子设备的结构示意图，如图5所示，该电子设备可以包括：处理器(processor)510、存储器(memory)520、通信接口(Communications Interface)530和通信总线540，其中，处理器510，存储器520，通信接口530通过通信总线540完成相互间的通信。处理器510可以调用存储器520中的逻辑指令，以执行基于钢铁行业智能客服的交互方法，该方法包括：接收用户输入的当前问询信息，并获取所述用户对应的多轮历史问答信息和每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签；基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

此外，上述的存储器520中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的基于钢铁行业智能客服的交互方法，该方法包括：接收用户输入的当前问询信息，并获取所述用户对应的多轮历史问答信息和每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签；基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的基于钢铁行业智能客服的交互方法，该方法包括：接收用户输入的当前问询信息，并获取所述用户对应的多轮历史问答信息和每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签；基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于钢铁行业智能客服的交互方法，其特征在于，包括：

基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；所述钢铁业务规则库中保存了被分解为多个基本业务环节的钢铁业务，所述被分解为多个基本业务环节的钢铁业务包括该钢铁业务包含的基本业务环节序列以及该序列中各个基本业务环节的具体操作；所述历史问答信息对应的业务标签以及所述当前问询信息对应的业务标签对应某一基本业务环节；

若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息；

若所述用户的当前会话的会话类型为非固定流程交互，所述方法还包括：

2.根据权利要求1所述的基于钢铁行业智能客服的交互方法，其特征在于，所述基于所述当前问询信息及所述多轮历史问答信息的融合编码中的各个嵌入向量，利用多维度编码模型的维度编码层，获取全局维度向量和局部维度向量，具体包括：

3.根据权利要求1所述的基于钢铁行业智能客服的交互方法，其特征在于，所述多维度编码模型是基于多维度冗余损失优化得到的；在所述多维度编码模型的任一轮迭代训练过程中，所述多维度冗余损失是基于如下步骤计算得到的：

4.根据权利要求1所述的基于钢铁行业智能客服的交互方法，其特征在于，所述将所述全局维度向量和所述局部维度向量融合，得到多维度融合向量，具体包括：

5.根据权利要求1至4任一项所述的基于钢铁行业智能客服的交互方法，其特征在于，所述智能客服是基于如下步骤构建的：

获取钢铁行业客户服务中的实际对话数据；

6.根据权利要求5所述的基于钢铁行业智能客服的交互方法，其特征在于，所述基于所述实际对话数据对所述初始模型进行微调之后还包括：

7.一种基于钢铁行业智能客服的交互装置，其特征在于，包括：

会话类型确定单元，用于基于所述每轮历史问答信息对应的业务标签，以及所述当前问询信息对应的业务标签在钢铁业务规则库里进行检索，并基于检索结果确定所述用户的当前会话的会话类型；其中，若检索结果不为空，则确定所述用户的当前会话的会话类型为固定流程交互，否则确定所述用户的当前会话的会话类型为非固定流程交互；所述钢铁业务规则库中保存了被分解为多个基本业务环节的钢铁业务，所述被分解为多个基本业务环节的钢铁业务包括该钢铁业务包含的基本业务环节序列以及该序列中各个基本业务环节的具体操作；所述历史问答信息对应的业务标签以及所述当前问询信息对应的业务标签对应某一基本业务环节；

应答单元，用于若所述用户的当前会话的会话类型为固定流程交互，则基于所述当前会话对应的固定流程确定与所述当前问询信息相关的历史问答信息，并将所述当前问询信息及与所述当前问询信息相关的历史问答信息的融合编码输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息；

若所述用户的当前会话的会话类型为非固定流程交互，获取所述当前问询信息及所述多轮历史问答信息的融合编码；所述融合编码为固定数量的嵌入向量组成的序列；基于所述当前问询信息及所述多轮历史问答信息的融合编码中的各个嵌入向量，利用多维度编码模型的维度编码层，获取全局维度向量和局部维度向量；其中，获取所述全局维度向量时，所述各个嵌入向量的权重相同；获取所述局部维度向量时，所述各个嵌入向量的权重不同；基于所述多维度编码模型的融合层，将所述全局维度向量和所述局部维度向量融合，得到多维度融合向量；将所述多维度融合向量输入至智能客服，得到所述智能客服返回的所述当前问询信息的当前答复信息。

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述基于钢铁行业智能客服的交互方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于钢铁行业智能客服的交互方法。