CN113516379B

CN113516379B - 一种智能质检的工单评分方法

Info

Publication number: CN113516379B
Application number: CN202110710471.1A
Authority: CN
Inventors: 谭旭; 吴俊江; 曹维; 吴璞
Original assignee: Shenzhen Institute of Information Technology
Current assignee: Shenzhen Institute of Information Technology
Priority date: 2021-06-25
Filing date: 2021-06-25
Publication date: 2022-08-16
Anticipated expiration: 2041-06-25
Also published as: CN113516379A

Abstract

一种智能质检的工单评分方法，属于数据处理技术领域，用于解决客服工单评分不能进行全量准确的质检，存在较大误差的问题，工单评分方法包括：获取文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb；将文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb分别进行concat操作得到第一分类向量和第二分类向量的Logit向量；采用损失函数分别对第一分类向量和第二分类向量进行计算；采用交叉熵损失函数对分别对Logit向量进行计算得到对应的交叉熵损失值和加权的最终损失值；对工单的优劣程度进行预测，根据其概率值判断是否为问题工单。本发明的工单评分方法可确定工单的优劣程度，保障客服服务工单质量，同时提升识别准确率。

Description

一种智能质检的工单评分方法

技术领域

本发明属于数据处理技术领域，具体涉及一种智能质检的工单评分方法。

背景技术

在智能客服领域中，自动化的对答是目前众多工业界的研究对象，但是对人工客服服务的工单进行质量管理也是很重要的事情；对人工服务工单进行质检评分不仅能够保障人工服务的质量而且可以作为日常考核的依据。目前对人工服务工单进行评分的最常用办法是“用户满意度”即在服务结束时让用户对服务情况进行评分；但是这种方法不能进行全量准确的质检，存在着较大的误差，因此有必要探索一种新的客服工单评分方式。

目前质检中的工单评分模型常是传统的基于机器学习或者深度学习的二分类模型，类似于CTR相关模型；比如LR模型、LR+GBDT、FM/FFM、WDL、DeepFM等诸多机器学习或深度学习模型。如LR模型具有结构简单、易于并行化实现、可解释性强等优点而被广泛使用，但是它是线性模型本，不能处理特征和目标之间的非线性关系，因此模型效果依赖于特征工程。另外，基于树的模型(GBDT)能够自动学习特征交叉组合，但是却不适合学习高度稀疏数据的特征组合，一方面高度稀疏数据的特征维度一般很高，这时基于树的模型学习效率很低，甚至不可行；另一方面树模型也不能学习到训练数据中很少或没有出现的特征组合。FM通过特征对之间的隐变量内积来提取特征组合，能学习到二阶的特征组合，但是对于复杂的特征组合无法学习；DeepFM则是将FM应用在神经网络中，模型可以以端对端的方式来学习不同阶的组合特征关系，并且不需要其他特征工程；DCN在学习特定阶数组合特征的时候效率非常高，而且同样不需要特征工程，引入的额外的复杂度也是微乎其微的。

而且，目前的工单评分模型中如LR、GBDT、FM等机器学习模型需要构建人工特征，并且对于高阶的特征组合的学习有所欠缺，而DeepFM、DCN等深度学习模型考虑了不同阶的特征关系，不需要引入特征工程；但是在工单评分实践中没有考虑到对会话级的文本信息的抽取与应用；同时没有考虑到特征间、样本-特征、样本-样本等诸多额外的信息。

发明内容

为解决上述问题，本发明提供一种智能质检的工单评分方法。

本发明采用如下技术方案：

一种智能质检的工单评分方法，所述方法包括：

步骤一：获取文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb，其中：

所述文本信息最终输入向量FTemb的获取方法为：获取工单会话，然后通过多轮文本编码层将工单会话进行编码，将工单会话中的词向量组转换为句向量，然后将多个句向量交互后进行编码得到文本信息最终输入向量FTemb；

所述人工特征输出向量FEmb的获取方法为：获取人工提取特征，然后通过人工特征编码层对输入的人工提取特征进行编码运算，得到人工特征输出向量FEmb；

所述HGAT输出向量FGemb的获取方法为：对人工提取特征进行异构图构建，然后使用HGAT异构图编码器对异构图进行编码，得到HGAT输出向量FGemb；

步骤二：将文本信息最终输入向量FTemb和人工特征输出向量FEmb进行concat操作得到第一分类向量ClsEmb1＝[FTemb:FEmb]，将人工特征输出向量FEmb与HGAT输出向量FGemb进行concat操作得到第二分类向量ClsEmb2＝[FGemb:FEmb]；

步骤三：采用损失函数分别对第一分类向量和第二分类向量进行计算得出第一分类向量和第二分类向量的Logit向量Logit1＝R^c和Logit2＝R^c，其中，C为分类类别数量；

步骤四：采用交叉熵损失函数对分别对Logit1和logit2进行计算得到对应的交叉熵损失值loss₁和loss₂，其中：

CE为交叉熵损失函数，y为工单的真实标签；

然后得到加权的最终损失值Loss＝f₁*loss₁+(1-f₁)*loss₂；

步骤五：对工单的优劣程度进行预测，通过融合计算Logit1＝R^c和Logit2＝R^c的分值获取该工单的质检结果分布，所述融合计算具体为cls＝softmax(Logit1+Logit2)，其中cls∈R^c代表该工单属于C个类别的概率，根据其概率值作为问题工单的判断依据，概率值最大的类别表示模型预测该工单属于该类别，并且概率值越大属于该类别的可能性越大。

可选地，所述步骤一中，人工特征编码层包括：DCN编码结构和Transformer编码结构，对人工输入的人工提取特征进行编码，所述人工提取特征经过DCN编码结构和Transformer编码结构得到的emb进行concat操作得到人工特征输出向量FEmb＝[CEmb:MEmb:TEmb]。

可选地，所述人工提取特征包括：Feature Embedding、Text Embedding和/或Audio Feature。

可选地，所述步骤一中，多轮文本编码层包括：句子编码器、交互层和Session编码层，所述句子编码器对工单会话进行编码生成句向量，所述交互层对生成的句向量进行交互操作得到句向量组，使得用户和客服的文本信息得以交互融合，所述Session编码层对句向量组编码后得到Session编码向量，然后采用人工特征的最终向量Femb与Session编码向量做门控过滤得到文本信息的最终输入向量FTemb。

可选地所述步骤一中，工单会话包括：用户询问会话：U＝{u₁,u₂,...,u_n}和客服回复会话：A＝{a₁,a₂,...,a_n}，其中：u_i,a_i为单轮的句子输入，n为会话轮数，u_i/a_i＝{w₁,w₂,...w_m}，表示每轮句子u_i,a_i由m个词w_i组成。

可选地，所述句子编码器分别对工单会话中的用户询问会话U和客服回复A进行编码，其中，所述句子编码器对用户询问会话进行编码得到用户询问的句向量UEmb＝{ue₁,ue₂,...,ue_n}，所述句子编码器对客服回复会话进行编码得到客服回复的句向量AEmb＝{ae₁,ae₂,...,ae_n}，其中ue_i∈R^d,ae_i∈R^d，d为句向量维度。

可选地，所述交互层的交互操作采用Multi-head Attention的方式对句向量UEmb,AEmb进行交互操作，在使用Multi-head Attention计算score时采用一个MaskAttention矩阵对U和A进行位置掩码，具体如下：

MA＝(1-ma)*-1e¹²；

其中ma是位置掩码矩阵，MA的元素值为0/1，1代表参考该位置的向量；

交互操作后得到两种句向量组U_sentEmb＝{ue₁,ue₂,...,ue_n}和A_sentEmb＝{ae₁,ae₂,...,ae_n}，以及对两种向量组进行逐轮的Concat操作得到的合并向量组AU_sentEmb＝{ae₁:ue₁,ae₂:ue₂,...,ae_n:ue_n}，三个向量组分别代表以用户信息为主的、以客服向量为主的以及两者兼顾的三种句向量组。

可选地，所述Session编码层分别对三个句向量组分别进行BiGRU+CNN以及Transformer编码，取mean_pool得到三种不同的Session编码向量：

u_se＝MeanPool(BiGRU_CNN(U_sentEmb))

ua_se＝MeanPool(Transfomer(AU_sentEmb))

a_se＝MeanPool(BiGRU_CNN(A_sentEmb))；

然后，采用人工特征的最终向量Femb与上述三种Session编码向量做门控过滤，得到文本信息的最终输入向量，具体为：

u_seg＝u_se·Sigmoid(w_u[u_se:Femb])

a_seg＝a_se·Sigmoid(w_a[a_se:Femb])

ua_seg＝ua_se·Sigmoid(w_ua[ua_se:Femb])

FTemb＝sum(u_seg,a_seg,ua_seg)。

可选地，所述步骤一中对人工提取特征进行异构图构建具体如下：根据特征间相关性、以及样本下特征的数值来构建，异构图中共有N个训练样本和未标注样本，M个特征，在异构图构建时，根据样本-特征关系和特征间关系构建邻接矩阵Adj∈R^(N+M)×(N+M)，其中：

样本-特征间关系判断样本下该特征是否为0，若样本i下特征j值为0，则Adj_ij＝0，否则Adj_ij＝1；

特征间关系通过样本计算特征间的皮尔逊相关性系数r，设定阈值s，判断在阈值范围内特征间关系是否为0，若为0则邻接矩阵的对应值设为0，否则为相关性系数的绝对值|r|，如下式特征X_f和特征X_l的邻接矩阵值构建：

通过构建得到工单特征的邻接矩阵Adj∈R^(N+M)×(N+M)以及每个节点的类型id：tmi∈R^(N+M)×1。

可选地，所述HGAT异构图编码器对异构图进行编码具体如下：

训练模型采用GraphSAGE中的Inductive Learning策略，对训练样本进行二阶随机游走采样，采样范围为[n1,n2]，其中n1和n2为数值，经过采样得到三个图模型输入:

I₀∈R^(N+M)×1、I₁∈R^(N+M)×n1、I₂∈R^{(N+M)×n1×n2}；

其中：I₀∈R^(N+M)×1为图神经网络的输入节点id；I₁∈R^(N+M)×n1，表示输入节点I₀在一阶邻居节点进行n₁次随机游走得到n₁个节点id；I₂∈R^{(N+M)×n1×n2}表示在n₁个一阶邻居节点在进行n₂次随机游走得到的节点id；

图输入节点设初始节点embedding维度为d，则初始输入节点I₀可以映射为IE₀∈R^(N+M)×1×d，构建节点类型矩阵TM∈R^T×d×d，T为节点类型，d是embedding的维度，根据节点类型tmi以及TM进行id映射得到每个节点的权重w_t∈R^(N+M)×d×d，随后把一个节点的相邻节点的向量进行聚合，加入节点权重w_t计算得到两个节点间的相似度，进行归一化处理后进行特征加权求和：

a_ij＝Softmax(e_ij)

得到输出向量u_hgat∈R^d，最后参照文本的处理方式，构建门控机制获取HGAT的输出向量：FGemb＝u_hgat·Sigmoid(w_hagt[u_hgat:Femb])。

本发明智能质检的工单评分方法能应用到智能质检中，通过对质检工单进行分类的方式，确定工单的优劣以及优劣程度，保障客服服务工单质量，通过融合工单会话级文本信息与特征工程信息，考虑特征间、样本间相关性，构建样本特征图结构，使用GAT对样本特征图进行编码，使用异构图进行编码，同时增强了不同类型节点、关系的特征捕获能力，能学习得到更高质量的节点表征，能够实现工单评分判断工单是否是正常单，为智能质检提供质检基础。另外，本发明的工单评分方法采用混合编码器，从文本特征、人工特征、图特征等多种层面提取信息，使得提取的工单信息更加丰富，从而提升识别准确率，根据试验测试结果显示，相比单一编码器平均能提升3％的模型准确率。

附图说明

图1为本发明工单评分模型示意图；

图2为本发明多轮会话编码示意图；

图3为本发明工单特征编码层示意图；

图4为本发明工单特征异构图示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

如图1所示，一种智能质检的工单评分方法，所述方法包括：

CE为交叉熵损失函数，y为工单的真实标签，工单真实标签可由用户自行定义，可定义为0或1；

然后得到加权的最终损失值Loss＝f₁*loss₁+(1-f₁)*loss₂；

步骤五：对工单的优劣程度进行预测，通过融合计算Logit1＝R^c和Logit2＝R^c的分值获取该工单的质检结果分布，所述融合计算具体为cls＝softmax(Logit1+Logit2)，其中cls∈R^c代表该工单属于C个类别的概率，根据其概率值作为问题工单的判断依据，例如，当C＝2时表示该工单评分是二分类模型，1表示问题单，0表示正常单，当类别1概率值越大越趋向于问题单；当C＝3时表示工单评分是三分类模型，2表示问题单，1表示疑似问题单，0表示正常单，3分类的概率值最大的类别表示模型预测该工单属于哪个类别，并且概率值越大属于该类别的可能性越大；C＝4以此类推。

如图3所示，所述步骤一中，所述人工特征编码层包括：DCN编码结构和Transformer编码结构，对人工输入的人工提取特征进行编码，所述人工提取特征包括：Feature Embedding(特征嵌入)、Text Embedding(文本嵌入)和/或Audio Feature(音频特征)。所述DCN编码结构中每一层都应用feature crossing，高效的学习了不同层次组合特征；所述transformer编码结构是用于多样化的捕获特征的关系。所述人工提取特征经过DCN编码结构和Transformer编码结构得到的词嵌入emb进行concat操作得到人工特征输出向量FEmb＝[CEmb:MEmb:TEmb]，其中，Cemb为DCN模型的编码输出向量，MEmb为MLP模型的编码输出向量，TEmb为transformer模型编码输出向量。

如图2所示，所述步骤一中，所述多轮文本编码层包括：句子编码器、交互层和Session编码层，所述句子编码器对工单会话进行编码生成句向量，所述交互层对生成的句向量进行交互操作得到句向量组，使得用户和客服的文本信息得以交互融合，所述Session编码层对句向量组编码后得到Session编码向量，然后采用人工特征的最终向量Femb与Session编码向量做门控过滤得到文本信息的最终输入向量FTemb。

所述工单会话包括：用户询问会话：U＝{u₁,u₂,...,u_n}和客服回复会话：A＝{a₁,a₂,...,a_n}，其中u_i,a_i为单轮的句子输入，n为会话轮数，u_i/a_i＝{w₁,w₂,...w_m}，表示每轮句子u_i,a_i由m个词w_i组成。所述句子编码器分别对工单会话中的用户询问会话U和客服回复A进行编码，其中，所述第一句子编码器对用户询问会话进行编码得到用户询问的句向量UEmb＝{ue₁,ue₂,...,ue_n}，所述第二句子编码器对客服回复会话进行编码得到客服回复的句向量AEmb＝{ae₁,ae₂,...,ae_n}，其中ue_i∈R^d,ae_i∈R^d，d为句向量维度，所述句子编码器可采用BILSTM模型。

所述交互层的交互操作采用Multi-head Attention的方式对句向量UEmb,AEmb进行交互操作，在使用Multi-head Attention计算score时采用一个Mask Attention矩阵对U和A进行位置掩码，具体如下：

MA＝(1-ma)*-1e¹²；

其中ma是位置掩码矩阵，MA的元素值为0/1，1代表参考该位置的向量，其目的是当前用户询问句子输入u_i只参考上文的客服回复a_j(j<i)的信息，同样当前用户a_i只参考上文u_j(j<i)的信息，使得文本编码更符合逻辑；Q为输入向量，K、V为被attention的向量，MA为mask矩阵，表示每个词获取对应的哪些词的向量。

所述Session编码层分别对三个句向量组分别进行BiGRU+CNN以及Transformer编码，取mean_pool得到三种不同的Session编码向量：

u_se＝MeanPool(BiGRU_CNN(U_sentEmb))

ua_se＝MeanPool(Transfomer(AU_sentEmb))

a_se＝MeanPool(BiGRU_CNN(A_sentEmb))；

然后，考虑到人工构建特征和文本特征的交互行为，以及对文本信息的过滤，采用人工特征的最终向量Femb与上述三种Session编码向量做门控过滤，得到文本信息的最终输入向量，具体为：

u_seg＝u_se·Sigmoid(w_u[u_se:Femb])

a_seg＝a_se·Sigmoid(w_a[a_se:Femb])

ua_seg＝ua_se·Sigmoid(w_ua[ua_se:Femb])

FTemb＝sum(u_seg,a_seg,ua_seg)。

如图4所示，所述步骤一中，所述对人工提取特征进行异构图构建具体如下：根据特征间相关性、以及样本下特征的数值来构建，特征间具有相关性则构建一条边；样本下特征为0说明该特征没有取值或者不重要，则不构建边，异构图中共有N个训练样本和未标注样本，M个特征，训练样本为人工已经标注正常单/问题单的工单，未标注样本为大量的没有人工标注的工单，异构图中具有T＝2种类型的节点，其中T＝2代表“样本/特征”两种类型的特征，若是将特征细分层F个类型，则共有F+1个种类的节点。

在异构图构建时，根据样本-特征关系和特征间关系构建邻接矩阵Adj∈R^(N ^+M)×(N+M)，其中：N为训练样本个数和M为特征个数，

然后使用HGAT异构图编码器对异构图进行编码，得到HGAT输出向量：

训练模型采用GraphSAGE中的Inductive Learning策略，对训练样本进行二阶随机游走采样，采样范围为[n1,n2]，其中n1和n2为数值，n1可取值为80，n2可取值为100，也可以调整为其他的数值，经过采样得到三个图模型输入:

I₀∈R^(N+M)×1、I₁∈R^(N+M)×n1、I₂∈R^{(N+M)×n1×n2}；

其中：I₀∈R^(N+M)×1为图神经网络的输入节点id；I₁∈R^(N+M)×n1，表示输入节点I₀在一阶邻居节点进行n₁次随机游走得到n₁个节点id；I₂∈R^{(N+M)×n1×n2}表示在n₁个一阶邻居节点在进行n₂次随机游走得到的节点id。

a_ij＝Softmax(e_ij)

Claims

1.一种智能质检的工单评分方法，其特征在于，所述方法包括：

CE为交叉熵损失函数，y为工单的真实标签；

然后得到加权的最终损失值Loss＝f₁*loss₁+(1-f₁)*loss₂；

步骤五：对工单的优劣程度进行预测，通过融合计算Logit1＝R^c和Logit2＝R^c的分值获取该工单的质检结果分布，所述融合计算具体为cls＝softmax(Logit1+Logit2)，其中cls∈R^c代表该工单属于C个类别的概率，将其概率值作为问题工单的判断依据，概率值最大的类别表示模型预测该工单属于该类别，并且概率值越大属于该类别的可能性越大。

2.根据权利要求1所述的工单评分方法，其特征在于，所述步骤一中，人工特征编码层包括：DCN编码结构和Transformer编码结构，对人工输入的人工提取特征进行编码，所述人工提取特征经过DCN编码结构和Transformer编码结构得到的emb进行concat操作得到人工特征输出向量FEmb＝[CEmb:MEmb:TEmb]，其中，CEmb为DCN模型的编码输出向量，MEmb为MLP模型的编码输出向量，TEmb为transformer模型编码输出向量。

3.根据权利要求2所述的工单评分方法，其特征在于，所述人工提取特征包括：FeatureEmbedding、Text Embedding和/或Audio Feature。

4.根据权利要求1所述的工单评分方法，其特征在于，所述步骤一中，多轮文本编码层包括：句子编码器、交互层和Session编码层，所述句子编码器对工单会话进行编码生成句向量，所述交互层对生成的句向量进行交互操作得到句向量组，使得用户和客服的文本信息得以交互融合，所述Session编码层对句向量组编码后得到Session编码向量，然后采用人工特征的最终向量Femb与Session编码向量做门控过滤得到文本信息的最终输入向量FTemb。

5.根据权利要求4所述的工单评分方法，其特征在于，所述步骤一中，工单会话包括：用户询问会话：U＝{u₁,u₂,...,u_n}和客服回复会话：A＝{a₁,a₂,...,a_n}，其中：u_i,a_i为单轮的句子输入，n为会话轮数，u_i/a_i＝{w₁,w₂,...w_m}，表示每轮句子u_i,a_i由m个词w_i组成。

6.根据权利要求5所述的工单评分方法，其特征在于，所述句子编码器分别对工单会话中的用户询问会话U和客服回复A进行编码，其中，所述句子编码器对用户询问会话进行编码得到用户询问的句向量UEmb＝{ue₁,ue₂,...,ue_n}，所述句子编码器对客服回复会话进行编码得到客服回复的句向量AEmb＝{ae₁,ae₂,...,ae_n}，其中ue_i∈R^d,ae_i∈R^d，d为句向量维度。

7.根据权利要求6所述的工单评分方法，其特征在于，所述交互层的交互操作采用Multi-head Attention的方式对句向量UEmb,AEmb进行交互操作，在使用Multi-headAttention计算score时采用一个Mask Attention矩阵对U和A进行位置掩码，具体如下：

MA＝(1-ma)*-1e¹²；

8.根据权利要求7所述的工单评分方法，其特征在于，所述Session编码层分别对三个句向量组分别进行BiGRU+CNN以及Transformer编码，取mean_pool得到三种不同的Session编码向量：

u_se＝MeanPool(BiGRU_CNN(U_sentEmb))

ua_se＝MeanPool(Transfomer(AU_sentEmb))

a_se＝MeanPool(BiGRU_CNN(A_sentEmb))；

u_seg＝u_se·Sigmoid(w_u[u_se:Femb])

a_seg＝a_se·Sigmoid(w_a[a_se:Femb])

ua_seg＝ua_se·Sigmoid(w_ua[ua_se:Femb])

FTemb＝sum(u_seg,a_seg,ua_seg)。

9.根据权利要求1所述的工单评分方法，其特征在于，所述步骤一中对人工提取特征进行异构图构建具体如下：根据特征间相关性、以及样本下特征的数值来构建，异构图中共有N个训练样本和未标注样本，M个特征，在异构图构建时，根据样本-特征关系和特征间关系构建邻接矩阵Adj∈R^(N+M)×(N+M)，其中：

通过构建得到工单特征的邻接矩阵Adj∈R^(N+M)×(N+M)以及每个节点的类型id：tmi∈R^(N ^+M)×1。

10.根据权利要求9所述的工单评分方法，其特征在于，所述HGAT异构图编码器对异构图进行编码具体如下：

I₀∈R^(N+M)×1、I₁∈R^(N+M)×n1、I₂∈R^{(N+M)×n1×n2}；

图输入节点设初始节点embedding维度为d，则初始输入节点I₀可以映射为IE₀∈R^(N ^+M)×1×d，构建节点类型矩阵TM∈R^T×d×d，T为节点类型，d是embedding的维度，根据节点类型tmi以及TM进行id映射得到每个节点的权重w_t∈R^(N+M)×d×d，随后把一个节点的相邻节点的向量进行聚合，加入节点权重w_t计算得到两个节点间的相似度，进行归一化处理后进行特征加权求和：

a_ij＝Softmax(e_ij)