CN113919811A

CN113919811A - 基于强化关联的热线事件分拨方法

Info

Publication number: CN113919811A
Application number: CN202111202977.8A
Authority: CN
Inventors: 承孝敏; 陈钢; 佘祥荣; 陈健鹏
Original assignee: Yangtze River Delta Information Intelligence Innovation Research Institute
Current assignee: Yangtze River Delta Information Intelligence Innovation Research Institute
Priority date: 2021-10-15
Filing date: 2021-10-15
Publication date: 2022-01-11
Anticipated expiration: 2041-10-15
Also published as: CN113919811B

Abstract

本发明公开了一种基于强化关联的热线事件分拨方法，首先，通过指针生成网络构建事件画像并得到事件编码。其次，使用基于强化联系的注意力机制来捕获事件编码与“三定”职责拼接向量中的关联信息，得到“事件‑三定”匹配结果。然后，将匹配结果与部门简介编码拼接并输入分类器。最后，经过答案重排序后输出热线事件所对应的分拨部门。该方法有助于辅助热线接线员自动完成工单分拨，克服了接线员手工分拨费时费力的缺陷；同时，为政府提供了数字化、智能化、精细化基层治理的技术基础。

Description

基于强化关联的热线事件分拨方法

技术领域

本发明涉及一种基于强化关联的热线事件分拨方法。

背景技术

近年来，各地政府在推动热线数字化转型中取得了一些成效，但在事件分派过程中仍然存在问题。话务员对市民诉求分类的准确判断和对各政府部门职能的深入了解程度决定了事件分拨的质量。然而，市民致电诉求内容长短不一，大部分以叙事性描述为主，往往存在描述不清，要素不全等问题。此外，话务员难以在对市民诉求充分理解的基础上从几十个处置部门中挑选正确的部门完成事件分拨，这就导致了人工事件分拨的准确率不高，甚至造成大量的二次分拨。随着热线受理事件类型越来越多、数量越来越庞大，单纯利用热线文本大数据难以实现城市事件的准确分拨，因此，研究一种能够准确定位事件处置部门的分拨方法具有重要意义。

发明内容

本发明的目的是提供一种基于强化关联的热线事件分拨方法，该方法有助于辅助热线接线员自动完成工单分拨，克服了接线员手工分拨费时费力的缺陷；同时，为政府提供了数字化、智能化、精细化基层治理的技术基础。

为了实现上述目的，本发明提供了一种基于强化关联的热线事件分拨方法，该方法包括：

步骤1、构建事件画像；

步骤2、嵌入政府部门“三定”信息，包括定职能配置、定内设机构、定人员编制相关数据，由基于强化联系的注意力机制ARA和部门简介编码两个部分构成；其中，ARA以事件描述和“三定”职责的拼接为输入，以得到相应的注意力分布为输出；在完成事件画像后，事件描述被指针生成网络的编码器转换为不定长度的事件内容语义编码向量V_event，以V_event作为事件描述的输入；

步骤3、候选答案重排序，对所有“事件-三定”匹配概率使用加权平均的方式进行重排序以完成部门选择；对于“三定”权重的选择，使用基于事件先验知识的权重设定方案，针对各部门历史事件进行建模，构建各部门历史事件匹配概率分布模型，以设定各部门“三定”权重；

步骤4、输出热线事件分拨部门。

优选地，步骤1中包括：

步骤1.1、构建编码器：采用Bi-LSTM网络作为编码器，从前后两个方向对输入的信息计算，输入候选词序列X＝{x₁,x₂,...,x_n}，其中，n为输入序列的长度；按照顺序先输入到Embedding层，将候选词映射到高维向量上；然后，再将处理好的序列输入到编码器中，得到每个序列的隐藏状态集合 E＝{e₁,e₂,...,e_n}；

步骤1.2、构建解码器：采用单向LSTM网络作为解码器，解码器的输入为Y＝{y₁,y₂,...,y_m}，其中，m为解码器输入序列个数；在解码过程中，输入序列按照顺序先输入到Embedding层，将输入序列映射到高维向量上，得到每个输入序列的词向量表示；然后，再将处理好的序列输入到解码器中，得到每个序列的隐藏状态集合D＝{d₁,d₂,...,d_m}；将注意力机制用在输入序列上以使得更重要的信息输入至解码器；同时，引入覆盖机制解决生成重复文本的问题：

α^t＝soft max(u^t) (3)

其中，c^t是先前时间步的注意力权重叠加后得到的覆盖向量；

步骤1.3、计算单词表分布：对上下文向量u^t进行softmax激活函数操作后，得到的结果视为在输入序列元素上的概率分布，其中，v^T、W₁、W₂、 W_c和b是模型学习参数；在时刻t的输入序列表征为

将e_t和d_t经过两个线性层得到单词表分布：

P_v(W)＝softmax(V'(V[e_t,d_t]+b)+b') (4)

权重w_g的计算方式为：

w_g＝σ(W′₁e_t+W′₂d_t+W′₃x_t+b)(5)

其中，W₁′、W₂'、W₃'和b是模型学习参数；经过扩充之后的单词表，在时间步t的词概率分布为：

优选地，步骤2中包括：

步骤2.1、拼接“事件-三定”编码：针对“三定”职责输入，采用政务相关领域知识语料对RoBERTa2RoBERTa模型进行fine-tune，并使用fine-tune 后的模型的编码器对“三定”职责进行编码，得到相应的语义编码向量V_sanding；同时，对V_event和V_sanding两个向量进行拼接，得到拼接后的“事件-三定”编码作为注意力层的输入：

V_concat＝concat(V_event,V_sanding) (7)；

步骤2.2、构造注意力矩阵：在注意力层，使用自注意力机制筛选拼接编码V_concat中的重要信息：

α_x＝softmax(Max(M_es)) (9)

其中，

为可学习的注意力参数矩阵，d_c是拼接向量V_concat的长度，α_x和α_y是在两个维度上的联合注意力分布，Max选取矩阵中包含最大化信息的行或列；为了最大化保留拼接向量中的关联信息，采用 Leaky-ReLU进行注意力矩阵的激活处理：

由于构成M_es的两个输入向量相同，因而M_es矩阵的整体学习目标是更接近斜对称矩阵，即：

在生成两个方向上的注意力权重后，将拼接编码和两个注意力权重相乘，得到在两个方向上的注意力得分向量：

步骤2.3、对部门简介进行编码：同步骤2.2采用RoBERTa2RoBERTa 模型的编码器部分对部门简介输入部分进行编码，得到相应的语义编码向量 Vdepart；

步骤2.4、输出“事件-三定”匹配概率：将V_depart与两个注意力向量拼接后作为输出结果输入到全连接层，最终使用softmax函数输出相应的“事件-三定”匹配概率：

P_dep＝softmax(concat(s_x,s_y,V_depart)) (15)。

优选地，在步骤1的事件画像构建和步骤2的“三定”嵌入过程中，需要构建模型训练损失函数；在事件画像模块中，t时刻模型损失值可通过对目标输出单词y_t和覆盖向量计算覆盖损失求得：

根据输出端的概率分布，得到输入序列概率最高的L个候选词作为该事件的标签，刻画事件主要特征。

优选地，在“三定”嵌入过程中，使用标准的交叉熵损失函数对“事件 -三定”匹配模型进行训练：

其中，p_i是事件三定匹配概率，y_i是指示变量0或1。

优选地，采用联合损失函数对整个网络进行优化，最终的目标函数为最小化以上两个损失函数：

L＝λ₁L_event+λ₂L_ARA (19)。

优选地，步骤3中包括：

步骤3.1、统计热线事件数据集中所有n个部门分拨处理的历史事件数量Q_depart＝{Q₁,Q₂,...,Q_n}；

步骤3.2、统计部门i内所有m个“三定”职责匹配到的历史事件数量

步骤3.3、部门i内的第j个“三定”权重

的计算方式为

步骤3.4、重复步骤3.2和步骤3.3，直到得到所有“三定”的权重。

优选地，步骤4中包括：“三定”权重确定之后，答案重排序模块对各部门“三定”职责描述匹配度的概率值进行加权平均计算各部门概率得分，最终选取得分最高的部门作为事件的最终分拨部门。

根据上述技术方案，本发明首先对热线事件文本中的事件内容、事件类型、事件地点等关键信息进行提取并在此基础上构建事件画像；然后，将事件画像输入“三定”嵌入模块，与政府部门“三定”职责进行匹配，得到适用于该事件的“三定”职责列表并将其转换为对应部门；最后，对相关答案进行重排序，输出热线事件的分拨部门。其中，“三定”数据即定职能配置、定内设机构、定人员编制，主要包含机构规格、主要职责、内设机构及其具体职责、人员编制和领导职数等方面内容。因其与政府部门存在强相关性，故可以将“三定”数据加入事件匹配任务以提高分拨准确度。在技术上， word2vec、glove等词向量模型往往无法关注到上下文的关联信息，难以处理自然语言文本中一词多义的情况，而预训练语言模型可以有效解决这类问题。同时，相对于单向长短期记忆循环神经网络(LSTM)，双向LSTM (Bi-LSTM)通过双向语义编码结构获取上下文信息，能够更好地对热线事件信息进行提取。进一步的，注意力机制可以更深层次地挖掘热线事件和政府部门“三定”数据的关联关系。

本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明，但并不构成对本发明的限制。在附图中：

图1是本发明提供的基于强化关联的热线事件分拨方法的流程图；

图2是本发明提供的基于强化关联的热线事件分拨方法的模型结构图；

图3是本发明提供的基于强化关联的热线事件分拨方法中构建事件画像的示意图；

图4是本发明提供的基于强化关联的热线事件分拨方法中ARA事件画像示意图；

图5是本发明提供的基于强化关联的热线事件分拨方法的中最佳分拨部门选择流程图。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

参见图1，本发明提供一种基于强化关联的热线事件分拨方法，该基于强化关联的热线事件分拨方法包括：

步骤1、构建事件画像；

步骤2、嵌入政府部门“三定”信息，包括定职能配置、定内设机构、定人员编制相关数据，由基于强化联系的注意力机制ARA和部门简介编码两个部分构成；其中，ARA(见图4)以事件描述和“三定”职责的拼接为输入，以得到相应的注意力分布为输出；在完成事件画像后，事件描述被指针生成网络的编码器转换为不定长度的事件内容语义编码向量V_event，以 V_event作为事件描述的输入；

步骤4、输出热线事件分拨部门。

同时，该分拨方法包括事件画像模块、“三定”嵌入模块和答案重排序模块三个组成部分，如图2所示。首先，将热线事件文本信息输入到Bi-LSTM 网络，对其中的上下文信息进行编码，将编码后形成的表征向量送入指针生成网络后产生事件描述向量和事件画像。事件描述向量是由指针生成网络的编码器部分对表征向量进行编码与归一化处理后所生成的包含一系列上下文信息的表征向量，将其送入“三定”嵌入模块与“三定”职责编码输入进行答案选择匹配。事件画像则是由解码器部分将事件描述编码向量解码成对应的事件关键信息。

在“三定”嵌入模块中，本发明采用针对事件领域知识微调(fine-tune) 后的RoBERTa2RoBERTa模型(即基于RoBERTa的seq2seq模型)的编码器部分对“三定”职责进行编码，将编码后的“三定”职责向量与事件描述向量进行拼接后送入到注意力网络中，生成对应的注意力表征向量。将注意力表征向量分别与“三定”职责向量、事件描述向量相乘得到用于答案选择的注意力向量表示，将注意力向量表示与部门简介编码向量进行拼接，并将拼接结果接入softmax函数得到对应的部门概率分布，最终通过重排序模块输出热线事件的分拨部门。

具体的，步骤1中包括：

步骤1.1、构建编码器：采用Bi-LSTM网络作为编码器，从前后两个方向对输入的信息计算，输入候选词序列X＝{x₁,x₂,...,x_n}，其中，n为输入序列的长度；按照顺序先输入到Embedding层，将候选词映射到高维向量上；然后，再将处理好的序列输入到编码器中，得到每个序列的隐藏状态集合 E＝{e₁,e₂,...,e_n}；对第i个隐藏状态e_i来说，由于采用的是Bi-LSTM网络，算法会从前往后和从后往前两个方向计算，得到的隐藏状态e_i会充分关联上下文信息。

步骤1.2、构建解码器：采用单向LSTM网络作为解码器，解码器的输入为Y＝{y₁,y₂,...,y_m}，其中，m为解码器输入序列个数；在解码过程中，输入序列按照顺序先输入到Embedding层，将输入序列映射到高维向量上，得到每个输入序列的词向量表示；然后，再将处理好的序列输入到解码器中，得到每个序列的隐藏状态集合D＝{d₁,d₂,...,d_m}；为了使解码器产生更合适的输出，本发明将注意力机制用在输入序列上以将更重要的信息输入至解码器，同时，引入覆盖机制来解决生成重复文本的问题：

α^t＝soft max(u^t) (3)

将e_t和d_t经过两个线性层得到单词表分布：

P_v(W)＝softmax(V'(V[e_t,d_t]+b)+b') (4)

权重w_g的计算方式为：

w_g＝σ(W₁′e_t+W′₂d_t+W′₃x_t+b) (5)

在完成步骤1.1至步骤1.3后，即可根据热线文本生成相应的关键词，根据时间、地点、人物、事件触发信息等对所生成的关键词进行组织进而得到该热线的事件画像。构建事件画像如图3所示。

步骤2中包括：

步骤2.1、拼接“事件-三定”编码：针对“三定”职责输入，采用政务相关领域知识语料对RoBERTa2RoBERTa模型进行fine-tune，并使用fine-tune 后的模型的编码器对“三定”职责进行编码，得到相应的语义编码向量V_sanding；同时，为了更完整的获取二者的语义信息，对V_event和V_sanding两个向量进行拼接，得到拼接后的“事件-三定”编码作为注意力层的输入：

V_concat＝concat(V_event,V_sanding) (7)；

α_x＝softmax(Max(M_es)) (9)

其中，

为可学习的注意力参数矩阵，d_c是拼接向量V_concat的长度，α_x和α_y是在两个维度上的联合注意力分布，Max选取矩阵中包含最大化信息的行或列。注意到M_es应尽可能多地包含事件内容和“三定”职责之间的关联信息，若使用tanh作为激活函数，矩阵中的元素m_i∈M_es的取值会被压缩在(-1，1)的区间范围内，进而导致Max(M_es)和Max(M^T _es)向量中包含大量的1，元素之间的差距不明显。考虑到softmax函数在差距较大的分布中对大数更为敏感，为了最大化保留拼接向量中的关联信息，采用 Leaky-ReLU进行注意力矩阵的激活处理：

经过激活处理后，注意力矩阵中正值权重被完整保留，负值权重不会被完全抛弃，而是被加以压缩后予以保留，压缩比例由系数a_i决定。使用这样的激活方式可以尽可能最大化保留注意力矩阵中的差异化信息，同时强化正向注意力的效果。由于构成M_es的两个输入向量相同，因而M_es矩阵的整体学习目标是更接近斜对称矩阵，即：

P_dep＝softmax(concat(s_x,s_y,V_depart)) (15)。

此外，在步骤1的事件画像构建和步骤2的“三定”嵌入过程中，需要构建模型训练损失函数；在事件画像模块中，t时刻模型损失值可通过对目标输出单词y_t和覆盖向量计算覆盖损失求得：

在“三定”嵌入过程中，使用标准的交叉熵损失函数对“事件-三定” 匹配模型进行训练：

其中，p_i是事件三定匹配概率，y_i是指示变量0或1。

本发明采用联合损失函数对整个网络进行优化，最终的目标函数为最小化以上两个损失函数：

L＝λ₁L_event+λ₂L_ARA (19)。

热线事件经过模型处理后得到与所有“三定”职责描述匹配度的概率值列表，而后送入答案重排序模块。由于一个部门包含多个职责，因而需要以部门为标准对匹配结果进行重排序以获得最终输出结果。本发明提出的答案重排序模块对所有“事件-三定”匹配概率使用加权平均的方式进行重排序，进而完成部门选择。对于“三定”权重的选择，本发明使用基于事件先验知识的权重设定方案。考虑到新事件的“三定”匹配概率分布服从历史事件中 “三定”匹配概率分布，本发明针对各部门历史事件进行建模，构建各部门历史事件匹配概率分布模型，以此设定各部门“三定”权重。

具体的，如图5所示，步骤3中包括：

步骤3.3、部门i内的第j个“三定”权重

的计算方式为

另外，步骤4中包括：“三定”权重确定之后，答案重排序模块对各部门“三定”职责描述匹配度的概率值进行加权平均计算各部门概率得分，最终选取得分最高的部门作为事件的最终分拨部门。

综上所述，本发明在“事件-部门”匹配任务中引入对责任部门的“三定”描述，提出基于答案选择的“事件-三定”匹配模型，将“事件-部门” 匹配的单目标问题转化为“事件-三定-部门”的多阶段问题，利用“三定” 职责描述提升事件分拨的准确率。同时，提出基于强化关联的注意力机制 ARA并应用到“事件-三定”匹配的答案选择模型中，使得模型在计算事件与“三定”的匹配度过程中能更有效地从“三定”中选择提取相关信息，提升对“事件-三定”的匹配预测成功率。其次，使用基于政务语料库训练的 BERT模型，有效地加入了政务领域的先验知识，实现了对“三定”职责和部门简介更为准确的嵌入表示。还利用了热线历史事件分拨结果构建基于先验知识的重排序模型，以此计算“事件-部门”最终的匹配结果。

以上结合附图详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种简单变型，这些简单变型均属于本发明的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

此外，本发明的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明的思想，其同样应当视为本发明所公开的内容。

Claims

1.一种基于强化关联的热线事件分拨方法，其特征在于，所述基于强化关联的热线事件分拨方法包括：

步骤1、构建事件画像；

步骤4、输出热线事件分拨部门。

2.根据权利要求1所述的基于强化关联的热线事件分拨方法，其特征在于，步骤1中包括：

步骤1.1、构建编码器：采用Bi-LSTM网络作为编码器，从前后两个方向对输入的信息计算，输入候选词序列X＝{x₁,x₂,...,x_n}，其中，n为输入序列的长度；按照顺序先输入到Embedding层，将候选词映射到高维向量上；然后，再将处理好的序列输入到编码器中，得到每个序列的隐藏状态集合E＝{e₁,e₂,...,e_n}；