CN113516379B - 一种智能质检的工单评分方法 - Google Patents

一种智能质检的工单评分方法 Download PDF

Info

Publication number
CN113516379B
CN113516379B CN202110710471.1A CN202110710471A CN113516379B CN 113516379 B CN113516379 B CN 113516379B CN 202110710471 A CN202110710471 A CN 202110710471A CN 113516379 B CN113516379 B CN 113516379B
Authority
CN
China
Prior art keywords
vector
work order
sentence
femb
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110710471.1A
Other languages
English (en)
Other versions
CN113516379A (zh
Inventor
谭旭
吴俊江
曹维
吴璞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Information Technology
Original Assignee
Shenzhen Institute of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Information Technology filed Critical Shenzhen Institute of Information Technology
Priority to CN202110710471.1A priority Critical patent/CN113516379B/zh
Publication of CN113516379A publication Critical patent/CN113516379A/zh
Application granted granted Critical
Publication of CN113516379B publication Critical patent/CN113516379B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)
  • Character Discrimination (AREA)

Abstract

一种智能质检的工单评分方法,属于数据处理技术领域,用于解决客服工单评分不能进行全量准确的质检,存在较大误差的问题,工单评分方法包括:获取文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb;将文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb分别进行concat操作得到第一分类向量和第二分类向量的Logit向量;采用损失函数分别对第一分类向量和第二分类向量进行计算;采用交叉熵损失函数对分别对Logit向量进行计算得到对应的交叉熵损失值和加权的最终损失值;对工单的优劣程度进行预测,根据其概率值判断是否为问题工单。本发明的工单评分方法可确定工单的优劣程度,保障客服服务工单质量,同时提升识别准确率。

Description

一种智能质检的工单评分方法
技术领域
本发明属于数据处理技术领域,具体涉及一种智能质检的工单评分方法。
背景技术
在智能客服领域中,自动化的对答是目前众多工业界的研究对象,但是对人工客服服务的工单进行质量管理也是很重要的事情;对人工服务工单进行质检评分不仅能够保障人工服务的质量而且可以作为日常考核的依据。目前对人工服务工单进行评分的最常用办法是“用户满意度”即在服务结束时让用户对服务情况进行评分;但是这种方法不能进行全量准确的质检,存在着较大的误差,因此有必要探索一种新的客服工单评分方式。
目前质检中的工单评分模型常是传统的基于机器学习或者深度学习的二分类模型,类似于CTR相关模型;比如LR模型、LR+GBDT、FM/FFM、WDL、DeepFM等诸多机器学习或深度学习模型。如LR模型具有结构简单、易于并行化实现、可解释性强等优点而被广泛使用,但是它是线性模型本,不能处理特征和目标之间的非线性关系,因此模型效果依赖于特征工程。另外,基于树的模型(GBDT)能够自动学习特征交叉组合,但是却不适合学习高度稀疏数据的特征组合,一方面高度稀疏数据的特征维度一般很高,这时基于树的模型学习效率很低,甚至不可行;另一方面树模型也不能学习到训练数据中很少或没有出现的特征组合。FM通过特征对之间的隐变量内积来提取特征组合,能学习到二阶的特征组合,但是对于复杂的特征组合无法学习;DeepFM则是将FM应用在神经网络中,模型可以以端对端的方式来学习不同阶的组合特征关系,并且不需要其他特征工程;DCN在学习特定阶数组合特征的时候效率非常高,而且同样不需要特征工程,引入的额外的复杂度也是微乎其微的。
而且,目前的工单评分模型中如LR、GBDT、FM等机器学习模型需要构建人工特征,并且对于高阶的特征组合的学习有所欠缺,而DeepFM、DCN等深度学习模型考虑了不同阶的特征关系,不需要引入特征工程;但是在工单评分实践中没有考虑到对会话级的文本信息的抽取与应用;同时没有考虑到特征间、样本-特征、样本-样本等诸多额外的信息。
发明内容
为解决上述问题,本发明提供一种智能质检的工单评分方法。
本发明采用如下技术方案:
一种智能质检的工单评分方法,所述方法包括:
步骤一:获取文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb,其中:
所述文本信息最终输入向量FTemb的获取方法为:获取工单会话,然后通过多轮文本编码层将工单会话进行编码,将工单会话中的词向量组转换为句向量,然后将多个句向量交互后进行编码得到文本信息最终输入向量FTemb;
所述人工特征输出向量FEmb的获取方法为:获取人工提取特征,然后通过人工特征编码层对输入的人工提取特征进行编码运算,得到人工特征输出向量FEmb;
所述HGAT输出向量FGemb的获取方法为:对人工提取特征进行异构图构建,然后使用HGAT异构图编码器对异构图进行编码,得到HGAT输出向量FGemb;
步骤二:将文本信息最终输入向量FTemb和人工特征输出向量FEmb进行concat操作得到第一分类向量ClsEmb1=[FTemb:FEmb],将人工特征输出向量FEmb与HGAT输出向量FGemb进行concat操作得到第二分类向量ClsEmb2=[FGemb:FEmb];
步骤三:采用损失函数分别对第一分类向量和第二分类向量进行计算得出第一分类向量和第二分类向量的Logit向量Logit1=Rc和Logit2=Rc,其中,C为分类类别数量;
步骤四:采用交叉熵损失函数对分别对Logit1和logit2进行计算得到对应的交叉熵损失值loss1和loss2,其中:
Figure GDA0003651179540000021
CE为交叉熵损失函数,y为工单的真实标签;
然后得到加权的最终损失值Loss=f1*loss1+(1-f1)*loss2
步骤五:对工单的优劣程度进行预测,通过融合计算Logit1=Rc和Logit2=Rc的分值获取该工单的质检结果分布,所述融合计算具体为cls=softmax(Logit1+Logit2),其中cls∈Rc代表该工单属于C个类别的概率,根据其概率值作为问题工单的判断依据,概率值最大的类别表示模型预测该工单属于类别,并且概率值越大属于该类别的可能性越大。
可选地,所述步骤一中,人工特征编码层包括:DCN编码结构和Transformer编码结构,对人工输入的人工提取特征进行编码,所述人工提取特征经过DCN编码结构和Transformer编码结构得到的emb进行concat操作得到人工特征输出向量FEmb=[CEmb:MEmb:TEmb]。
可选地,所述人工提取特征包括:Feature Embedding、Text Embedding和/或Audio Feature。
可选地,所述步骤一中,多轮文本编码层包括:句子编码器、交互层和Session编码层,所述句子编码器对工单会话进行编码生成句向量,所述交互层对生成的句向量进行交互操作得到句向量组,使得用户和客服的文本信息得以交互融合,所述Session编码层对句向量组编码后得到Session编码向量,然后采用人工特征的最终向量Femb与Session编码向量做门控过滤得到文本信息的最终输入向量FTemb。
可选地所述步骤一中,工单会话包括:用户询问会话:U={u1,u2,...,un}和客服回复会话:A={a1,a2,...,an},其中:ui,ai为单轮的句子输入,n为会话轮数,ui/ai={w1,w2,...wm},表示每轮句子ui,ai由m个词wi组成。
可选地,所述句子编码器分别对工单会话中的用户询问会话U和客服回复A进行编码,其中,所述句子编码器对用户询问会话进行编码得到用户询问的句向量UEmb={ue1,ue2,...,uen},所述句子编码器对客服回复会话进行编码得到客服回复的句向量AEmb={ae1,ae2,...,aen},其中uei∈Rd,aei∈Rd,d为句向量维度。
可选地,所述交互层的交互操作采用Multi-head Attention的方式对句向量UEmb,AEmb进行交互操作,在使用Multi-head Attention计算score时采用一个MaskAttention矩阵对U和A进行位置掩码,具体如下:
Figure GDA0003651179540000041
MA=(1-ma)*-1e12
其中ma是位置掩码矩阵,MA的元素值为0/1,1代表参考该位置的向量;
交互操作后得到两种句向量组UsentEmb={ue1,ue2,...,uen}和AsentEmb={ae1,ae2,...,aen},以及对两种向量组进行逐轮的Concat操作得到的合并向量组AUsentEmb={ae1:ue1,ae2:ue2,...,aen:uen},三个向量组分别代表以用户信息为主的、以客服向量为主的以及两者兼顾的三种句向量组。
可选地,所述Session编码层分别对三个句向量组分别进行BiGRU+CNN以及Transformer编码,取mean_pool得到三种不同的Session编码向量:
use=MeanPool(BiGRU_CNN(UsentEmb))
uase=MeanPool(Transfomer(AUsentEmb))
ase=MeanPool(BiGRU_CNN(AsentEmb));
然后,采用人工特征的最终向量Femb与上述三种Session编码向量做门控过滤,得到文本信息的最终输入向量,具体为:
useg=use·Sigmoid(wu[use:Femb])
aseg=ase·Sigmoid(wa[ase:Femb])
uaseg=uase·Sigmoid(wua[uase:Femb])
FTemb=sum(useg,aseg,uaseg)。
可选地,所述步骤一中对人工提取特征进行异构图构建具体如下:根据特征间相关性、以及样本下特征的数值来构建,异构图中共有N个训练样本和未标注样本,M个特征,在异构图构建时,根据样本-特征关系和特征间关系构建邻接矩阵Adj∈R(N+M)×(N+M),其中:
样本-特征间关系判断样本下该特征是否为0,若样本i下特征j值为0,则Adjij=0,否则Adjij=1;
特征间关系通过样本计算特征间的皮尔逊相关性系数r,设定阈值s,判断在阈值范围内特征间关系是否为0,若为0则邻接矩阵的对应值设为0,否则为相关性系数的绝对值|r|,如下式特征Xf和特征Xl的邻接矩阵值构建:
Figure GDA0003651179540000051
Figure GDA0003651179540000052
通过构建得到工单特征的邻接矩阵Adj∈R(N+M)×(N+M)以及每个节点的类型id:tmi∈R(N+M)×1
可选地,所述HGAT异构图编码器对异构图进行编码具体如下:
训练模型采用GraphSAGE中的Inductive Learning策略,对训练样本进行二阶随机游走采样,采样范围为[n1,n2],其中n1和n2为数值,经过采样得到三个图模型输入:
I0∈R(N+M)×1、I1∈R(N+M)×n1、I2∈R(N+M)×n1×n2
其中:I0∈R(N+M)×1为图神经网络的输入节点id;I1∈R(N+M)×n1,表示输入节点I0在一阶邻居节点进行n1次随机游走得到n1个节点id;I2∈R(N+M)×n1×n2表示在n1个一阶邻居节点在进行n2次随机游走得到的节点id;
图输入节点设初始节点embedding维度为d,则初始输入节点I0可以映射为IE0∈R(N+M)×1×d,构建节点类型矩阵TM∈RT×d×d,T为节点类型,d是embedding的维度,根据节点类型tmi以及TM进行id映射得到每个节点的权重wt∈R(N+M)×d×d,随后把一个节点的相邻节点的向量进行聚合,加入节点权重wt计算得到两个节点间的相似度,进行归一化处理后进行特征加权求和:
Figure GDA0003651179540000061
Figure GDA0003651179540000062
Figure GDA0003651179540000063
aij=Softmax(eij)
Figure GDA0003651179540000064
得到输出向量uhgat∈Rd,最后参照文本的处理方式,构建门控机制获取HGAT的输出向量:FGemb=uhgat·Sigmoid(whagt[uhgat:Femb])。
本发明智能质检的工单评分方法能应用到智能质检中,通过对质检工单进行分类的方式,确定工单的优劣以及优劣程度,保障客服服务工单质量,通过融合工单会话级文本信息与特征工程信息,考虑特征间、样本间相关性,构建样本特征图结构,使用GAT对样本特征图进行编码,使用异构图进行编码,同时增强了不同类型节点、关系的特征捕获能力,能学习得到更高质量的节点表征,能够实现工单评分判断工单是否是正常单,为智能质检提供质检基础。另外,本发明的工单评分方法采用混合编码器,从文本特征、人工特征、图特征等多种层面提取信息,使得提取的工单信息更加丰富,从而提升识别准确率,根据试验测试结果显示,相比单一编码器平均能提升3%的模型准确率。
附图说明
图1为本发明工单评分模型示意图;
图2为本发明多轮会话编码示意图;
图3为本发明工单特征编码层示意图;
图4为本发明工单特征异构图示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,一种智能质检的工单评分方法,所述方法包括:
步骤一:获取文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb,其中:
所述文本信息最终输入向量FTemb的获取方法为:获取工单会话,然后通过多轮文本编码层将工单会话进行编码,将工单会话中的词向量组转换为句向量,然后将多个句向量交互后进行编码得到文本信息最终输入向量FTemb;
所述人工特征输出向量FEmb的获取方法为:获取人工提取特征,然后通过人工特征编码层对输入的人工提取特征进行编码运算,得到人工特征输出向量FEmb;
所述HGAT输出向量FGemb的获取方法为:对人工提取特征进行异构图构建,然后使用HGAT异构图编码器对异构图进行编码,得到HGAT输出向量FGemb;
步骤二:将文本信息最终输入向量FTemb和人工特征输出向量FEmb进行concat操作得到第一分类向量ClsEmb1=[FTemb:FEmb],将人工特征输出向量FEmb与HGAT输出向量FGemb进行concat操作得到第二分类向量ClsEmb2=[FGemb:FEmb];
步骤三:采用损失函数分别对第一分类向量和第二分类向量进行计算得出第一分类向量和第二分类向量的Logit向量Logit1=Rc和Logit2=Rc,其中,C为分类类别数量;
步骤四:采用交叉熵损失函数对分别对Logit1和logit2进行计算得到对应的交叉熵损失值loss1和loss2,其中:
Figure GDA0003651179540000071
CE为交叉熵损失函数,y为工单的真实标签,工单真实标签可由用户自行定义,可定义为0或1;
然后得到加权的最终损失值Loss=f1*loss1+(1-f1)*loss2
步骤五:对工单的优劣程度进行预测,通过融合计算Logit1=Rc和Logit2=Rc的分值获取该工单的质检结果分布,所述融合计算具体为cls=softmax(Logit1+Logit2),其中cls∈Rc代表该工单属于C个类别的概率,根据其概率值作为问题工单的判断依据,例如,当C=2时表示该工单评分是二分类模型,1表示问题单,0表示正常单,当类别1概率值越大越趋向于问题单;当C=3时表示工单评分是三分类模型,2表示问题单,1表示疑似问题单,0表示正常单,3分类的概率值最大的类别表示模型预测该工单属于哪个类别,并且概率值越大属于该类别的可能性越大;C=4以此类推。
如图3所示,所述步骤一中,所述人工特征编码层包括:DCN编码结构和Transformer编码结构,对人工输入的人工提取特征进行编码,所述人工提取特征包括:Feature Embedding(特征嵌入)、Text Embedding(文本嵌入)和/或Audio Feature(音频特征)。所述DCN编码结构中每一层都应用feature crossing,高效的学习了不同层次组合特征;所述transformer编码结构是用于多样化的捕获特征的关系。所述人工提取特征经过DCN编码结构和Transformer编码结构得到的词嵌入emb进行concat操作得到人工特征输出向量FEmb=[CEmb:MEmb:TEmb],其中,Cemb为DCN模型的编码输出向量,MEmb为MLP模型的编码输出向量,TEmb为transformer模型编码输出向量。
如图2所示,所述步骤一中,所述多轮文本编码层包括:句子编码器、交互层和Session编码层,所述句子编码器对工单会话进行编码生成句向量,所述交互层对生成的句向量进行交互操作得到句向量组,使得用户和客服的文本信息得以交互融合,所述Session编码层对句向量组编码后得到Session编码向量,然后采用人工特征的最终向量Femb与Session编码向量做门控过滤得到文本信息的最终输入向量FTemb。
所述工单会话包括:用户询问会话:U={u1,u2,...,un}和客服回复会话:A={a1,a2,...,an},其中ui,ai为单轮的句子输入,n为会话轮数,ui/ai={w1,w2,...wm},表示每轮句子ui,ai由m个词wi组成。所述句子编码器分别对工单会话中的用户询问会话U和客服回复A进行编码,其中,所述第一句子编码器对用户询问会话进行编码得到用户询问的句向量UEmb={ue1,ue2,...,uen},所述第二句子编码器对客服回复会话进行编码得到客服回复的句向量AEmb={ae1,ae2,...,aen},其中uei∈Rd,aei∈Rd,d为句向量维度,所述句子编码器可采用BILSTM模型。
所述交互层的交互操作采用Multi-head Attention的方式对句向量UEmb,AEmb进行交互操作,在使用Multi-head Attention计算score时采用一个Mask Attention矩阵对U和A进行位置掩码,具体如下:
Figure GDA0003651179540000091
MA=(1-ma)*-1e12
其中ma是位置掩码矩阵,MA的元素值为0/1,1代表参考该位置的向量,其目的是当前用户询问句子输入ui只参考上文的客服回复aj(j<i)的信息,同样当前用户ai只参考上文uj(j<i)的信息,使得文本编码更符合逻辑;Q为输入向量,K、V为被attention的向量,MA为mask矩阵,表示每个词获取对应的哪些词的向量。
交互操作后得到两种句向量组UsentEmb={ue1,ue2,...,uen}和AsentEmb={ae1,ae2,...,aen},以及对两种向量组进行逐轮的Concat操作得到的合并向量组AUsentEmb={ae1:ue1,ae2:ue2,...,aen:uen},三个向量组分别代表以用户信息为主的、以客服向量为主的以及两者兼顾的三种句向量组。
所述Session编码层分别对三个句向量组分别进行BiGRU+CNN以及Transformer编码,取mean_pool得到三种不同的Session编码向量:
use=MeanPool(BiGRU_CNN(UsentEmb))
uase=MeanPool(Transfomer(AUsentEmb))
ase=MeanPool(BiGRU_CNN(AsentEmb));
然后,考虑到人工构建特征和文本特征的交互行为,以及对文本信息的过滤,采用人工特征的最终向量Femb与上述三种Session编码向量做门控过滤,得到文本信息的最终输入向量,具体为:
useg=use·Sigmoid(wu[use:Femb])
aseg=ase·Sigmoid(wa[ase:Femb])
uaseg=uase·Sigmoid(wua[uase:Femb])
FTemb=sum(useg,aseg,uaseg)。
如图4所示,所述步骤一中,所述对人工提取特征进行异构图构建具体如下:根据特征间相关性、以及样本下特征的数值来构建,特征间具有相关性则构建一条边;样本下特征为0说明该特征没有取值或者不重要,则不构建边,异构图中共有N个训练样本和未标注样本,M个特征,训练样本为人工已经标注正常单/问题单的工单,未标注样本为大量的没有人工标注的工单,异构图中具有T=2种类型的节点,其中T=2代表“样本/特征”两种类型的特征,若是将特征细分层F个类型,则共有F+1个种类的节点。
在异构图构建时,根据样本-特征关系和特征间关系构建邻接矩阵Adj∈R(N +M)×(N+M),其中:N为训练样本个数和M为特征个数,
样本-特征间关系判断样本下该特征是否为0,若样本i下特征j值为0,则Adjij=0,否则Adjij=1;
特征间关系通过样本计算特征间的皮尔逊相关性系数r,设定阈值s,判断在阈值范围内特征间关系是否为0,若为0则邻接矩阵的对应值设为0,否则为相关性系数的绝对值|r|,如下式特征Xf和特征Xl的邻接矩阵值构建:
Figure GDA0003651179540000101
Figure GDA0003651179540000102
通过构建得到工单特征的邻接矩阵Adj∈R(N+M)×(N+M)以及每个节点的类型id:tmi∈R(N+M)×1
然后使用HGAT异构图编码器对异构图进行编码,得到HGAT输出向量:
训练模型采用GraphSAGE中的Inductive Learning策略,对训练样本进行二阶随机游走采样,采样范围为[n1,n2],其中n1和n2为数值,n1可取值为80,n2可取值为100,也可以调整为其他的数值,经过采样得到三个图模型输入:
I0∈R(N+M)×1、I1∈R(N+M)×n1、I2∈R(N+M)×n1×n2
其中:I0∈R(N+M)×1为图神经网络的输入节点id;I1∈R(N+M)×n1,表示输入节点I0在一阶邻居节点进行n1次随机游走得到n1个节点id;I2∈R(N+M)×n1×n2表示在n1个一阶邻居节点在进行n2次随机游走得到的节点id。
图输入节点设初始节点embedding维度为d,则初始输入节点I0可以映射为IE0∈R(N+M)×1×d,构建节点类型矩阵TM∈RT×d×d,T为节点类型,d是embedding的维度,根据节点类型tmi以及TM进行id映射得到每个节点的权重wt∈R(N+M)×d×d,随后把一个节点的相邻节点的向量进行聚合,加入节点权重wt计算得到两个节点间的相似度,进行归一化处理后进行特征加权求和:
Figure GDA0003651179540000111
Figure GDA0003651179540000112
Figure GDA0003651179540000113
aij=Softmax(eij)
Figure GDA0003651179540000114
得到输出向量uhgat∈Rd,最后参照文本的处理方式,构建门控机制获取HGAT的输出向量:FGemb=uhgat·Sigmoid(whagt[uhgat:Femb])。
本发明智能质检的工单评分方法能应用到智能质检中,通过对质检工单进行分类的方式,确定工单的优劣以及优劣程度,保障客服服务工单质量,通过融合工单会话级文本信息与特征工程信息,考虑特征间、样本间相关性,构建样本特征图结构,使用GAT对样本特征图进行编码,使用异构图进行编码,同时增强了不同类型节点、关系的特征捕获能力,能学习得到更高质量的节点表征,能够实现工单评分判断工单是否是正常单,为智能质检提供质检基础。另外,本发明的工单评分方法采用混合编码器,从文本特征、人工特征、图特征等多种层面提取信息,使得提取的工单信息更加丰富,从而提升识别准确率,根据试验测试结果显示,相比单一编码器平均能提升3%的模型准确率。

Claims (10)

1.一种智能质检的工单评分方法,其特征在于,所述方法包括:
步骤一:获取文本信息最终输入向量FTemb、人工特征输出向量FEmb、HGAT输出向量FGemb,其中:
所述文本信息最终输入向量FTemb的获取方法为:获取工单会话,然后通过多轮文本编码层将工单会话进行编码,将工单会话中的词向量组转换为句向量,然后将多个句向量交互后进行编码得到文本信息最终输入向量FTemb;
所述人工特征输出向量FEmb的获取方法为:获取人工提取特征,然后通过人工特征编码层对输入的人工提取特征进行编码运算,得到人工特征输出向量FEmb;
所述HGAT输出向量FGemb的获取方法为:对人工提取特征进行异构图构建,然后使用HGAT异构图编码器对异构图进行编码,得到HGAT输出向量FGemb;
步骤二:将文本信息最终输入向量FTemb和人工特征输出向量FEmb进行concat操作得到第一分类向量ClsEmb1=[FTemb:FEmb],将人工特征输出向量FEmb与HGAT输出向量FGemb进行concat操作得到第二分类向量ClsEmb2=[FGemb:FEmb];
步骤三:采用损失函数分别对第一分类向量和第二分类向量进行计算得出第一分类向量和第二分类向量的Logit向量Logit1=Rc和Logit2=Rc,其中,C为分类类别数量;
步骤四:采用交叉熵损失函数对分别对Logit1和logit2进行计算得到对应的交叉熵损失值loss1和loss2,其中:
Figure FDA0003651179530000011
CE为交叉熵损失函数,y为工单的真实标签;
然后得到加权的最终损失值Loss=f1*loss1+(1-f1)*loss2
步骤五:对工单的优劣程度进行预测,通过融合计算Logit1=Rc和Logit2=Rc的分值获取该工单的质检结果分布,所述融合计算具体为cls=softmax(Logit1+Logit2),其中cls∈Rc代表该工单属于C个类别的概率,将 其概率值作为问题工单的判断依据,概率值最大的类别表示模型预测该工单属于类别,并且概率值越大属于该类别的可能性越大。
2.根据权利要求1所述的工单评分方法,其特征在于,所述步骤一中,人工特征编码层包括:DCN编码结构和Transformer编码结构,对人工输入的人工提取特征进行编码,所述人工提取特征经过DCN编码结构和Transformer编码结构得到的emb进行concat操作得到人工特征输出向量FEmb=[CEmb:MEmb:TEmb],其中,CEmb为DCN模型的编码输出向量,MEmb为MLP模型的编码输出向量,TEmb为transformer模型编码输出向量。
3.根据权利要求2所述的工单评分方法,其特征在于,所述人工提取特征包括:FeatureEmbedding、Text Embedding和/或Audio Feature。
4.根据权利要求1所述的工单评分方法,其特征在于,所述步骤一中,多轮文本编码层包括:句子编码器、交互层和Session编码层,所述句子编码器对工单会话进行编码生成句向量,所述交互层对生成的句向量进行交互操作得到句向量组,使得用户和客服的文本信息得以交互融合,所述Session编码层对句向量组编码后得到Session编码向量,然后采用人工特征的最终向量Femb与Session编码向量做门控过滤得到文本信息的最终输入向量FTemb。
5.根据权利要求4所述的工单评分方法,其特征在于,所述步骤一中,工单会话包括:用户询问会话:U={u1,u2,...,un}和客服回复会话:A={a1,a2,...,an},其中:ui,ai为单轮的句子输入,n为会话轮数,ui/ai={w1,w2,...wm},表示每轮句子ui,ai由m个词wi组成。
6.根据权利要求5所述的工单评分方法,其特征在于,所述句子编码器分别对工单会话中的用户询问会话U和客服回复A进行编码,其中,所述句子编码器对用户询问会话进行编码得到用户询问的句向量UEmb={ue1,ue2,...,uen},所述句子编码器对客服回复会话进行编码得到客服回复的句向量AEmb={ae1,ae2,...,aen},其中uei∈Rd,aei∈Rd,d为句向量维度。
7.根据权利要求6所述的工单评分方法,其特征在于,所述交互层的交互操作采用Multi-head Attention的方式对句向量UEmb,AEmb进行交互操作,在使用Multi-headAttention计算score时采用一个Mask Attention矩阵对U和A进行位置掩码,具体如下:
Figure FDA0003651179530000031
MA=(1-ma)*-1e12
其中ma是位置掩码矩阵,MA的元素值为0/1,1代表参考该位置的向量;
交互操作后得到两种句向量组UsentEmb={ue1,ue2,...,uen}和AsentEmb={ae1,ae2,...,aen},以及对两种向量组进行逐轮的Concat操作得到的合并向量组AUsentEmb={ae1:ue1,ae2:ue2,...,aen:uen},三个向量组分别代表以用户信息为主的、以客服向量为主的以及两者兼顾的三种句向量组。
8.根据权利要求7所述的工单评分方法,其特征在于,所述Session编码层分别对三个句向量组分别进行BiGRU+CNN以及Transformer编码,取mean_pool得到三种不同的Session编码向量:
use=MeanPool(BiGRU_CNN(UsentEmb))
uase=MeanPool(Transfomer(AUsentEmb))
ase=MeanPool(BiGRU_CNN(AsentEmb));
然后,采用人工特征的最终向量Femb与上述三种Session编码向量做门控过滤,得到文本信息的最终输入向量,具体为:
useg=use·Sigmoid(wu[use:Femb])
aseg=ase·Sigmoid(wa[ase:Femb])
uaseg=uase·Sigmoid(wua[uase:Femb])
FTemb=sum(useg,aseg,uaseg)。
9.根据权利要求1所述的工单评分方法,其特征在于,所述步骤一中对人工提取特征进行异构图构建具体如下:根据特征间相关性、以及样本下特征的数值来构建,异构图中共有N个训练样本和未标注样本,M个特征,在异构图构建时,根据样本-特征关系和特征间关系构建邻接矩阵Adj∈R(N+M)×(N+M),其中:
样本-特征间关系判断样本下该特征是否为0,若样本i下特征j值为0,则Adjij=0,否则Adjij=1;
特征间关系通过样本计算特征间的皮尔逊相关性系数r,设定阈值s,判断在阈值范围内特征间关系是否为0,若为0则邻接矩阵的对应值设为0,否则为相关性系数的绝对值|r|,如下式特征Xf和特征Xl的邻接矩阵值构建:
Figure FDA0003651179530000041
Figure FDA0003651179530000042
通过构建得到工单特征的邻接矩阵Adj∈R(N+M)×(N+M)以及每个节点的类型id:tmi∈R(N +M)×1
10.根据权利要求9所述的工单评分方法,其特征在于,所述HGAT异构图编码器对异构图进行编码具体如下:
训练模型采用GraphSAGE中的Inductive Learning策略,对训练样本进行二阶随机游走采样,采样范围为[n1,n2],其中n1和n2为数值,经过采样得到三个图模型输入:
I0∈R(N+M)×1、I1∈R(N+M)×n1、I2∈R(N+M)×n1×n2
其中:I0∈R(N+M)×1为图神经网络的输入节点id;I1∈R(N+M)×n1,表示输入节点I0在一阶邻居节点进行n1次随机游走得到n1个节点id;I2∈R(N+M)×n1×n2表示在n1个一阶邻居节点在进行n2次随机游走得到的节点id;
图输入节点设初始节点embedding维度为d,则初始输入节点I0可以映射为IE0∈R(N +M)×1×d,构建节点类型矩阵TM∈RT×d×d,T为节点类型,d是embedding的维度,根据节点类型tmi以及TM进行id映射得到每个节点的权重wt∈R(N+M)×d×d,随后把一个节点的相邻节点的向量进行聚合,加入节点权重wt计算得到两个节点间的相似度,进行归一化处理后进行特征加权求和:
Figure FDA0003651179530000051
Figure FDA0003651179530000052
Figure FDA0003651179530000053
aij=Softmax(eij)
Figure FDA0003651179530000054
得到输出向量uhgat∈Rd,最后参照文本的处理方式,构建门控机制获取HGAT的输出向量:FGemb=uhgat·Sigmoid(whagt[uhgat:Femb])。
CN202110710471.1A 2021-06-25 2021-06-25 一种智能质检的工单评分方法 Active CN113516379B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110710471.1A CN113516379B (zh) 2021-06-25 2021-06-25 一种智能质检的工单评分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110710471.1A CN113516379B (zh) 2021-06-25 2021-06-25 一种智能质检的工单评分方法

Publications (2)

Publication Number Publication Date
CN113516379A CN113516379A (zh) 2021-10-19
CN113516379B true CN113516379B (zh) 2022-08-16

Family

ID=78065935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110710471.1A Active CN113516379B (zh) 2021-06-25 2021-06-25 一种智能质检的工单评分方法

Country Status (1)

Country Link
CN (1) CN113516379B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4174748A1 (en) * 2021-10-29 2023-05-03 Tata Consultancy Services Limited Systems and methods for recommendation of items and controlling an associated bias thereof
CN114328908A (zh) * 2021-11-08 2022-04-12 腾讯科技(深圳)有限公司 一种问答语句质检方法、装置及相关产品
CN116401600A (zh) * 2023-03-07 2023-07-07 深圳市丰宜科技有限公司 工单系统的同步节点信息的获取方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611375A (zh) * 2019-07-03 2020-09-01 北京航空航天大学 一种基于深度学习和转折关系的文本情感分类方法
CN111737551A (zh) * 2020-05-26 2020-10-02 国家计算机网络与信息安全管理中心 一种基于异构图注意力神经网络的暗网线索检测方法
CN112347362A (zh) * 2020-11-16 2021-02-09 安徽农业大学 一种基于图自编码器的个性化推荐方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10984167B2 (en) * 2019-01-29 2021-04-20 Accenture Global Solutions Limited Visual content optimization system using artificial intelligence (AI) based design generation and validation
US11651194B2 (en) * 2019-11-27 2023-05-16 Nvidia Corp. Layout parasitics and device parameter prediction using graph neural networks
CN112862092B (zh) * 2021-01-26 2021-11-26 中山大学 一种异构图卷积网络的训练方法、装置、设备和介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611375A (zh) * 2019-07-03 2020-09-01 北京航空航天大学 一种基于深度学习和转折关系的文本情感分类方法
CN111737551A (zh) * 2020-05-26 2020-10-02 国家计算机网络与信息安全管理中心 一种基于异构图注意力神经网络的暗网线索检测方法
CN112347362A (zh) * 2020-11-16 2021-02-09 安徽农业大学 一种基于图自编码器的个性化推荐方法

Also Published As

Publication number Publication date
CN113516379A (zh) 2021-10-19

Similar Documents

Publication Publication Date Title
CN113516379B (zh) 一种智能质检的工单评分方法
CN104657718A (zh) 一种基于人脸图像特征极限学习机的人脸识别方法
CN109165275B (zh) 基于深度学习的智能变电站操作票信息智能搜索匹配方法
CN111931505A (zh) 一种基于子图嵌入的跨语言实体对齐方法
CN113326377A (zh) 一种基于企业关联关系的人名消歧方法及系统
CN113378913A (zh) 一种基于自监督学习的半监督节点分类方法
CN114818703B (zh) 基于BERT语言模型和TextCNN模型的多意图识别方法及系统
CN113269239B (zh) 一种基于多通道卷积神经网络的关系网络节点分类方法
CN115526236A (zh) 一种基于多模态对比学习的文本网络图分类方法
CN113255366B (zh) 一种基于异构图神经网络的方面级文本情感分析方法
CN117237559B (zh) 面向数字孪生城市的三维模型数据智能分析方法及系统
CN114756686A (zh) 一种基于知识图谱的知识推理和故障诊断方法
CN111598476A (zh) 一种基于稀疏自编码与svm的智慧城市环卫资源调度系统
CN113052254A (zh) 多重注意力幽灵残差融合分类模型及其分类方法
CN111985152B (zh) 一种基于二分超球面原型网络的事件分类方法
CN111460097B (zh) 一种基于tpn的小样本文本分类方法
CN111783879B (zh) 基于正交注意力机制的层次化压缩图匹配方法及系统
CN111523943A (zh) 一种电影票房预测模型的构建方法及电影票房预测方法
CN113705242B (zh) 面向教育咨询服务的智能语义匹配方法和装置
CN117807232A (zh) 商品分类方法、商品分类模型构建方法及装置
CN116452241B (zh) 一种基于多模态融合神经网络的用户流失概率计算方法
CN116304773A (zh) 基于图神经网络的社区发现方法
CN109978013A (zh) 一种用于人物动作识别的深度聚类方法
CN115170888A (zh) 基于视觉信息和语义属性的电子元器件零样本识别模型及方法
CN114780767A (zh) 一种基于深度卷积神经网络的大规模图像检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant