WO2023165111A1

WO2023165111A1 - 客服热线中用户意图轨迹识别的方法及系统

Info

Publication number: WO2023165111A1
Application number: PCT/CN2022/118511
Authority: WO
Inventors: 徐雪帆; 韩伟; 陈志刚; 穆玉芝; 张健; 陈运文; 纪达麒
Original assignee: 达而观信息科技（上海）有限公司
Priority date: 2022-03-01
Filing date: 2022-09-13
Publication date: 2023-09-07
Also published as: CN114818738B; CN114818738A

Abstract

一种客服热线中用户意图轨迹识别的方法以及基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别的系统，该方法包括：获得用户行为轨迹数据和对话文本；将完整对话文本转化为对话片段，依照时间节点将对话片段与用户行为轨迹数据关联；分别得到文本特征表示、用户行为特征表示和上文用户意图特征表示，特征拼接后，作为样本特征表示输出；使用多层感知神经网络作为意图分类算法模型，以样本特征表示作为输入，取最后一层的向量作为输出结果；使用Beam Search策略生成最优的用户意图轨迹。

Description

客服热线中用户意图轨迹识别的方法及系统

本申请要求在2022年03月01日提交中国专利局、申请号为202210199654.6的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能领域，例如涉及一种基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别的方法及系统。

背景技术

银行、保险公司、电商平台、手机运营商等服务类行业都开发了客服热线系统，单日接线量已十分庞大。在人工智能技术日新月异的当下，企业也纷纷利用语音识别技术把客服热线录音转成半结构化的文本数据，利用自然语言处理技术进行文本挖掘，以此提升客服热线分析的效率。在客服热线分析的广泛领域内，用户的意图识别是十分常见也是被认为能带来高度业务价值的需求，针对用户意图的分析挖掘有利于指导企业的市场推广和产品运营。

在专利号为CN104951433A的中国申请专利中，公开了一种基于上下文进行意图识别的方法，该方法将上文意图分类结果one-hot作为特征结合当前语句共同预测当前意图。但是这个方法对上文意图分类结果是否正确有极高依赖，上文意图分类结果错误可能会导致之后的意图结果连续错误。而且，仅依赖文本进行意图识别也存在一定局限性，在热线对话过程中用户的行为轨迹，例如边通话边浏览商品页面，或者在通话过程中办理购买产品等，也会对该时间点之后的用户意图识别提供有价值的信息。

经过认真分析，相关技术中解决文本意图轨迹识别时存在如下难点：

难点1)上文意图分类结果错误会导致下文连续意图识别错误，在客服对话中即便是相同的语句也可能表示不同的用户意图，这是因为当前语句包含信息有限，上文邻近用户意图作为隐藏状态对当前意图识别可以起到巨大作用。但正因为如此，假使上文用户意图识别错误，也增大了当前意图识别错误的可能性；并且错误会随着对话传递放大，直到整个用户意图轨迹产生巨大偏差。

难点2)相同语句对应的不同用户行为轨迹可能会导致不同的用户真实意图，在客服对话的过程中，用户也实时在产生行为动作，例如浏览商品详情页面，或者办理购买产品等，这些动作可能也隐含着用户接下来的意图，但是语句中的表述模棱两可，从而提升了分析用户真实意图的难度。

发明内容

本申请提供一种客服热线中用户意图轨迹识别的方法和系统。本申请的方法和系统要求能够有效降低上文意图错误对当前语句意图识别的错误传递，在建模中考虑了前文对话时用户的行为轨迹。

本申请提供一种客服热线中用户意图轨迹识别的方法，基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别，包括：

数据获得，获得用户行为轨迹数据和对话文本；

数据切片和数据关联，对所述对话文本滑动切片，将一通完整的对话文本转化为N条有先后顺序的对话片段，依照每条对话片段和所述用户行为轨迹发生的时间节点将N条对话片段与所述用户行为轨迹数据关联；

特征处理，使用语料预训练的模型对所述对话文本进行特征提取，将所述模型的输出向量作为文本特征表示；对所述用户行为轨迹数据进行归一化和one-hot处理，其中，对所述用户行为轨迹数据中连续型的数值特征进行归一化处理以使处理后的特征符合标准正态分布，对所述用户行为轨迹数据中离散型的数值特征先采用one-hot进行编码，再对编码后的特征进行归一化处理，得到用户行为特征表示；采用one-hot对上文用户意图进行特征编码，再对编码后的所述上文用户意图进行归一化处理，得到上文用户意图特征表示；将所述文本特征表示、所述用户行为特征表示和所述上文用户意图特征表示拼接，作为样本特征表示输出；

意图分类，使用多层感知(Multilayer Perceptron，MLP)神经网络作为意图分类算法模型，以所述样本特征表示作为所述意图分类算法模型的输入，以获得用户意图的one-hot向量作为目标；在所述意图分类算法模型的训练阶段，使用交叉熵损失函数与反向传播机制对网络参数进行更新，保存训练后的模型参数；在预测阶段，搭建与所述MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将所述样本特征表示输入加载模型参数后所述MLP模型，将所述MLP模型的最后一层的向量作为输出结果；

生成最优的用户意图轨迹，根据所述用户意图的one-hot向量以及Beam Search策略在所述预测阶段生成所述最优的用户意图轨迹。

本申请还提供一种客服热线中用户意图轨迹识别的系统，设置为基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别，包括数据切片模块、特征处理模块、意图分类模块和Beam Search策略模块；

所述数据切片模块设置为接收用户行为轨迹数据和对话文本，将所述对话本切成N条4句话组成的对话片段，以将一通完整的对话文本转化成N条有先后顺序的对话片段，将N条对话片段与所述用户行为轨迹数据关联，关联依据为每条对话片段和所述用户行为轨迹发生的时间节点，在训练语料中，人工给每条对话片段标准正确的用户意图类别，输出数据至所述特征处理模块；

所述特征处理模块，设置为使用含有12层Transformer的来自Transformer的双向编码器表示(Bidirectional Encoder Representations from Transformer，BERT)模型对所述对话文本进行特征提取，获得文本特征向量表示；使用归一化和one-hot对所述用户行为轨迹数据进行处理，获得用户行为轨迹特征表示；使用one-hot对上文用户意图进行特征编码，在one-hot编码后采用Z-score归一化处理，获得上文用户意图特征表示；将所述文本特征表示、所述用户行为特征表示和所述上文用户意图特征表示拼接，作为样本特征表示输出至所述意图分类模块；

所述意图分类模块设置为使用多层感知神经网络作为意图分类算法模型，以所述样本特征表示作为所述意图分类算法模型的输入，以获得用户意图的one-hot向量作为目标，在所述意图分类算法模型的训练阶段，使用交叉熵损失函数与反向传播机制对网络参数进行更新，保存训练后的模型参数；在预测阶段，搭建与所述MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将所述特征处理模块输出的所述样本特征表示输入加载模型参数后所述MLP模型，将所述MLP模型的最后一层的向量作为输出结果至所述Beam Search策略模块；

所述Beam Search策略模块设置为根据所述用户意图的one-hot向量以及Beam Search策略在所述预测阶段生成最优的用户意图轨迹作为整个对话文本的用户意图轨迹输出，其中，所述最优的用户意图轨迹为最终选择的概率最高的一个意图轨迹。

本申请还提供一种电子设备，包括：

至少一个处理器；

存储装置，设置为存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现上述的客服热线中用户意图轨迹识别的方法。

本申请还提供一种计算机存储介质，存储有计算机程序，所述程序被处理器执行时实现上述的客服热线中用户意图轨迹识别的方法。

附图说明

图1是本申请实施例提供的一种客服热线中用户意图轨迹识别的方法的整体操作流程示意图；

图2是本申请实施例提供的一种客服热线中用户意图轨迹识别的系统中的文本特征表示示意图；

图3是本申请实施例提供的一种客服热线中用户意图轨迹识别的系统中的意图分类模型示意图；

图4是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和具体的实施例来对本申请提供的客服热线中用户意图轨迹识别的方法和系统进行说明。

如图1所示，本申请提供一种客服热线中用户意图轨迹识别的方法，该方法基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别。该方法包括：

第一步，数据获得，获得用户行为轨迹数据和对话文本。

第二步，数据切片和数据关联，对对话文本滑动切片，将一通完整的对话文本转化为N条有先后顺序的对话片段，依照每条对话片段和用户行为轨迹发生的时间节点将N条对话片段与用户行为轨迹数据关联。

第三步，特征处理，对于对话文本内容，使用语料预训练的模型对对话文本进行特征提取，将模型的输出向量作为文本特征表示；对于用户行为轨迹数据使用归一化和one-hot进行处理，对用户行为轨迹数据中连续型的数值特征进行归一化处理以使处理后的特征符合标准正态分布，对用户行为轨迹数据中离散型的数值特征先采用one-hot进行编码，然后再采用归一化处理，得到用户行为特征表示；采用one-hot对上文用户意图进行特征编码，然后再采用归一化处理，得到上文用户意图特征表示；再将文本特征表示、用户行为特征表示和上文用户意图特征表示拼接，作为样本特征表示输出。

第四步，意图分类，使用多层感知神经网络作为意图分类算法模型，以样本特征表示作为意图分类算法模型的输入，目标是获得用户意图的one-hot向量，在训练时使用交叉熵损失函数与反向传播机制对网络参数进行更新，训练后将模型参数保存，在预测阶段，搭建与MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将样本特征表示输入模型，取最后一层的向量作为输出结果。

第五步，生成最优的用户意图轨迹，使用Beam Search策略在预测阶段生成最优的用户意图轨迹。

在上述第二步中，对对话文本数据切片时，以一个大小为4，步长为2的窗口对对话文本滑动切片，把原文本切成N条4句话组成的对话片段，每条对话片段都是客服句-用户句-客服句-用户句的顺序，到最后一条对话片段如果以客服句结尾则用空白的用户句填补在最后一条对话片段的最后。

在训练语料中，对于数据切片后的对话片段，需要人工给每条对话片段标注正确的用户意图类别。

在第三步特征处理时，如图2所示，使用包含大量先验知识的语料预训练的含有12层Transformer的BERT模型对对话文本进行特征提取，在训练阶段，先搭建一个基础版的12层的BERT模型连接一个全连接层的分类模型，这个模型的输入是token化的对话文本数据，目标是用户意图的one-hot向量，此模型先训练少量轮次，训练时冻结前8层Transformer，使其参数不会被更新，使用交叉熵损失函数与反向传播机制对后4层Transformer和全连接层的参数进行更新，训练后将BERT模型参数保存；在预测阶段，搭建与12层的BERT模型相同结构的BERT模型并加载训练好的模型参数，将token化的对话文本数据输入模型，取最后一层的[CLS]符号对应的向量作为输出，此向量即为文本特征表示。

在客服热线中用户意图轨迹识别的方法中，所述的第三步使用归一化和one-hot对用户行为轨迹数据进行处理，针对连续型的数值特征，采用Z-score归一化，经过处理的特征符合标准正态分布，即均值为0，标准差为1，转化函数为：

其中，μ为所有样本数据的均值，σ为所有样本数据的标准差。

针对离散的类型特征，先采用one-hot进行编码，并在one-hot编码后采用Z-score归一化处理。

在客服热线中用户意图轨迹识别的方法中，所述第四步中MLP神经网络的结构包括2层隐藏层和1层输出层，前2层隐藏层分别拥有128个神经元和64个神经元、使用随机线性整流(Randomized Leaky ReLU，ReLU)作为激活函数，输出层的神经元数量与用户意图one-hot向量维度相同，使用softmax函数作为激活函数，在训练时使用交叉熵损失函数与反向传播机制对网络参数进行更新，在输入层和第1层隐藏层使用inverted dropout机制降低训练过拟合，使用Early Stopping机制监控验证集上损失，并当验证集损失在一定轮数内不再下降时停止训练，从而避免训练过拟合，训练后将模型参数保存；在预测阶段，搭建与MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将样本特征表示输入模型，取最后一层的向量作为输出结果，此向量每一个元素都是 0-1之间的浮点数，表示相应的用户意图的概率值大小，且此向量的多个元素之和等于1。

在客服热线中用户意图轨迹识别的方法中，在第五步使用Beam Search策略处理意图分类模型的输出时，每次都保留概率最大的k个意图类别(beam size)，beam size的数量k取2-3，在预测对话片段T+1的用户意图时，将在对话片段T下保留的k个意图类别分别作为上文用户意图特征输入，以此类推，直到预测完最后一条对话片段的用户意图，选择概率最高的一个意图轨迹作为整个对话文本的用户意图轨迹。

如图1所示，本申请提供一种客服热线中用户意图轨迹识别的系统，该系统基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别，包括数据切片模块、特征处理模块、意图分类模块和Beam Search策略模块。

所述数据切片模块接收用户行为轨迹数据和对话文本，把原文本切成N条4句话组成的对话片段，将一通完整的对话文本转化成N条有先后顺序的对话片段，再将N条对话片段与用户行为轨迹数据关联，关联依据为每条对话片段和用户行为轨迹发生的时间节点，在训练语料中，人工给每条对话片段标注正确的用户意图类别，输出数据至所述特征处理模块。

所述特征处理模块，该模块对对话文本内容使用含有12层Transformer的BERT模型对对话文本进行特征提取，获得文本特征向量表示；使用归一化和one-hot对用户行为轨迹数据进行处理，获得用户行为轨迹特征表示；使用one-hot对上文用户意图进行特征编码，在one-hot编码后采用Z-score归一化处理，获得上文用户意图特征表示；将文本特征表示、用户行为特征表示和上文用户意图特征表示拼接，作为样本特征表示输出至意图分类模块。

所述意图分类模块使用多层感知神经网络作为意图分类算法模型，以样本特征表示作为输入，目标是获得用户意图的one-hot向量，在训练时使用交叉熵损失函数与反向传播机制对网络参数进行更新，训练后将模型参数保存，在预测阶段，搭建与MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将特征处理模块输出的样本特征表示输入模型，取最后一层的向量作为输出结果至Beam Search策略模块。

所述Beam Search策略模块在预测阶段生成最优的用户意图轨迹，最终选择概率最高的一个意图轨迹作为整个对话文本的用户意图轨迹输出。

对于上述的数据切片模块，本模块以一个大小为4，步长为2的窗口将对话文本滑动切片，把原文本切成N条4句话组成的对话片段，每条对话片段都是客服句-用户句-客服句-用户句的顺序，到最后一条对话片段如果以客服句结尾则用空白的用户句填补在最后一条对话片段的最后。即一通完整对话文本转化成N条有先后顺序的对话片段。同时，本模块将文本片段与用户行为轨迹数据关联，关联依据为对话片段和用户行为轨迹发生的时间节点。在训练语料中，人工给每条对话片段标注正确的用户意图类别。举例如下表1所示：

表1

因对话文本内容数据敏感，故训练语料样例中使用无实际意义的数字代替真实语句。

在特征处理模块中，对于对话文本内容，本模块使用包含大量先验知识的语料预训练的含有12层Transformer的BERT模型对对话文本进行特征提取。在训练阶段，先搭建一个基础版的12层的BERT模型连接一个全连接层的分类模型，这个模型的输入是token化的对话文本数据，目标是用户意图的one-hot向量。此模型先训练少量轮次，训练时冻结前8层Transformer，使其参数不会被更新，使用交叉熵损失函数与反向传播机制对后4层Transformer和全连接层的参数进行更新。训练后将BERT模型参数保存。在预测阶段，搭建与12层的BERT模型相同结构的BERT模型并加载训练好的模型参数，将token化的对话文本数据输入模型，取最后一层的[CLS]符号对应的向量作为输出，此向量即为文本特征表示。

在特征处理模块中，对于用户行为轨迹数据，本模块使用归一化和one-hot对用户行为轨迹数据进行处理形成用户行为轨迹特征表示。针对连续型的数值特征，采用Z-score归一化，经过处理的特征符合标准正态分布，即均值为0，标准差为1。转化函数为：

在特征处理模块中，对于上文用户意图，本模块使用one-hot对上文用户意图进行特征编码，并在one-hot编码后采用Z-score归一化处理，形成上文用户意图特征表示。

在特征处理模块中，后面进行特征拼接，本模块将文本特征表示、用户行为轨迹特征表示和上文用户意图特征表示拼接，作为样本特征表示输出。

如图3所示，在意图分类模块中，本模块使用MLP神经网络作为意图分类算法模型，此模型的输入是特征处理模块的输出，即样本特征表示，目标是用户意图的one-hot向量。结构上共2层隐藏层和1层输出层，前2层隐藏层分别拥有128个神经元和64个神经元、使用ReLU作为激活函数，输出层的神经元数量与用户意图one-hot向量维度相同，使用softmax函数作为激活函数。此模型在训练时使用交叉熵损失函数与反向传播机制对网络参数进行更新，在输入层和第1层隐藏层使用inverted dropout机制降低训练过拟合，使用EarlyStopping机制监控验证集上损失，并当验证集损失在一定轮数内不再下降时停止训练，从而避免训练过拟合。训练后将模型参数保存。在预测阶段，搭建与MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将特征处理模块输出的样本特征表示输入模型，取最后一层的向量作为输出结果。此向量每一个元素都是0-1之间的浮点数，表示相应的用户意图的概率值大小，且此向量的多个元素之和等于1。

对于Beam Search策略模块，本模块使用Beam Search策略在预测阶段生成最优的用户意图轨迹。就是在处理意图分类模型的输出时，每次都保留概率最大的k个意图类别(beam size)，beam size的数量k取2-3即可。在预测对话片段T+1的用户意图时，将在对话片段T下保留的k个意图类别分别作为上文用户意图特征输入，以此类推。

举例来说，假设用户意图一共有[A,B,C]3类，beam size的数量取2。第一条对话片段的模型输出意图概率分别为[0.4,0.5,0.1]，这时保留概率最大的2个意图类别候选，即A和B。预测第二条对话片段的用户意图时，将A作为上文意图特征输入，得到意图概率分别为[0.1,0.7,0.2]；将B作为上文意图特征输入，得到意图概率分别为[0.5,0.2,0.3]。此时再次计算概率最大的2个输出：AA＝0.4*0.1＝0.04；AB＝0.4*0.7＝0.28；AC＝0.4*0.2＝0.08；BA＝0.5*0.5＝0.25；BB＝0.5*0.2＝0.1；BC＝0.5*0.3＝0.15，取概率最大的两个意图轨迹就是AB和BA，再继续预测第三条对话片段的用户意图，以此类推，直到最后一条对话片段，选择概率最高的一个意图轨迹作为整个对话文本的用户意图轨迹。Beam Search策略模块通过Beam Search策略扩大搜索范围从而保证更高的正确率，能够有效降低上文意图错误对当前语句意图识别的错误传递。

基于上述技术方案，本申请提供的基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别的方法及系统，通过Beam Search策略扩大搜索范围从而保证更高的正确率，就是在处理意图分类模型的输出时，每次都保留概率最大的k个意图类别。在预测对话片段T+1的用户意图时，将在对话片段T下保留的k个意图类别分别作为上文用户意图特征输入，以此类推。相比每次只保留概率最大的意图类别的贪心策略，Beam Search策略能有效降低上文意图错误对当前语句意图识别的错误传递，从而在预测阶段生成最优的用户意图轨迹；关联对话过程中的用户行为轨迹数据，并将其特征处理后与文本特征拼接，共同参与用户意图分类的训练和预测，对文本表述模棱两可的情况能够提升识别准确率。

图4是本申请实施例提供的一种电子设备的结构示意图。图4示出了适于用来实现本申请实施方式的电子设备412的框图。图4显示的电子设备412仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图4所示，电子设备412以通用计算设备的形式表现。电子设备412的组件可以包括但不限于：一个或者多个处理器416，存储装置428，连接不同系统组件(包括存储装置428和处理器416)的总线418。

总线418表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry Standard Architecture，ISA)总线，微通道体系结构(MicroChannel Architecture，MCA)总线，增强型ISA总线、视频电子标准协会(Video Electronics Standards Association，VESA)局域总线以及外围组件互连(Peripheral Component Interconnect，PCI)总线。

电子设备412包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备412访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储装置428可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory，RAM)430和/或高速缓存存储器432。电子设备412可以包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统434可以设置为读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供设置为对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如只读光盘(Compact Disc-ReadOnly Memory，CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory，DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储装置428可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本申请实施例的功能。

具有一组(至少一个)程序模块426的程序436，可以存储在例如存储装置428中，这样的程序模块426包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或一种组合中可能包括网络环境的实现。程序模块426通常执行本申请所描述的实施例中的功能和/或方法。

电子设备412也可以与一个或多个外部设备414(例如键盘、指向设备、摄像头、显示器424等)通信，还可与一个或者多个使得用户能与该电子设备412交互的设备通信，和/或与使得该电子设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output，I/O)接口422进行。并且，电子设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(Local Area Network，LAN)，广域网(Wide Area Network，WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器420通过总线418与电子设备412的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备412使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks，RAID)系统、磁带驱动器以及数据备份存储系统等。

处理器416通过运行存储在存储装置428中的程序，从而执行多种功能应用以及数据处理，例如实现本申请上述实施例所提供的方法。

本申请实施例还提供一种存储计算机程序的计算机存储介质，所述计算机程序在由计算机处理器执行时用于执行本申请上述实施例任一所述的客服热线中用户意图轨迹识别的方法。

本申请实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、ROM、可擦式可编程只读存储器((Erasable Programmable Read Only Memory，EPROM)或闪存)、光纤、CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括LAN或WAN连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

Claims

一种客服热线中用户意图轨迹识别的方法，用于基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别，包括：

数据获得，获得用户行为轨迹数据和对话文本；

数据切片和数据关联，对所述对话文本滑动切片，将一通完整的对话文本转化为N条有先后顺序的对话片段，依照每条对话片段和所述用户行为轨迹发生的时间节点将N条对话片段与所述用户行为轨迹数据关联；

特征处理，使用语料预训练的模型对所述对话文本进行特征提取，将所述模型的输出向量作为文本特征表示；对所述用户行为轨迹数据进行归一化和one-hot处理，其中，对所述用户行为轨迹数据中连续型的数值特征进行归一化处理以使处理后的特征符合标准正态分布，对所述用户行为轨迹数据中离散型的数值特征先采用one-hot进行编码，再对编码后的特征进行归一化处理，得到用户行为特征表示；采用one-hot对上文用户意图进行特征编码，再对编码后的所述上文用户意图进行归一化处理，得到上文用户意图特征表示；将所述文本特征表示、所述用户行为特征表示和所述上文用户意图特征表示拼接，作为样本特征表示；

意图分类，使用多层感知MLP神经网络作为意图分类算法模型，以所述样本特征表示作为所述意图分类算法模型的输入，以获得用户意图的one-hot向量作为目标；在所述意图分类算法模型的训练阶段，使用交叉熵损失函数与反向传播机制对网络参数进行更新，保存训练后的模型参数；在预测阶段，搭建与所述MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将所述样本特征表示输入加载模型参数后所述MLP模型，将所述MLP模型的最后一层的向量作为输出结果；

生成最优的用户意图轨迹，根据所述用户意图的one-hot向量以及Beam Search策略在所述预测阶段生成所述最优的用户意图轨迹。
根据权利要求1所述的客服热线中用户意图轨迹识别的方法，其中，所述对所述对话文本滑动切片，将一通完整的对话文本转化为N条有先后顺序的对话片段，包括：

以一个大小为4，步长为2的窗口对所述对话文本滑动切片，将所述对话文本切成N条4句话组成的对话片段，每条对话片段的结构为客服句-用户句-客服句-用户句，在最后一条对话片段以客服句结尾的情况下用空白的用户句填补在所述最后一条对话片段的结尾。
根据权利要求1所述的客服热线中用户意图轨迹识别的方法，在所述对所述对话文本滑动切片，将一通完整的对话文本转化为N条有先后顺序的对话片段之后，还包括：

在训练语料中，人工给每条对话片段标注正确的用户意图类别。
根据权利要求1所述的客服热线中用户意图轨迹识别的方法，其中，所述语料预训练的模型为使用包含预设数量先验知识的语料预训练的含有12层Transformer的来自Transformer的双向编码器表示BERT模型；

所述方法还包括：

在所述语料预训练的模型的训练阶段，将一个12层的BERT模型连接一个全连接层的分类模型作为预设模型，其中，所述预设模型的输入是token化的对话文本数据，以获得用户意图的one-hot向量作为目标；

对所述预设模型训练预设轮数，在训练的过程中冻结前8层Transformer，使所述前8层Transformer的参数不被更新，使用交叉熵损失函数与反向传播机制对后4层Transformer和全连接层的参数进行更新，训练后将BERT模型参数保存；

所述使用语料预训练的模型对所述对话文本进行特征提取，将所述模型的输出向量作为文本特征表示，包括：

在预测阶段，搭建与所述12层的BERT模型相同结构的BERT模型并加载训练好的模型参数，将token化的所述对话文本输入加载模型参数后的所述BERT模型，将加载模型参数后的所述BERT模型的最后一层的[CLS]符号对应的向量作为所述文本特征表示。
根据权利要求1或4所述的客服热线中用户意图轨迹识别的方法，其中，所述对所述用户行为轨迹数据中连续型的数值特征进行归一化处理以使处理后的特征符合标准正态分布，包括：

针对所述连续型的数值特征，采用Z-score归一化，经过处理的特征符合均值为0，标准差为1的标准正态分布，转化函数为：

其中，μ为所有样本数据的均值，σ为所有样本数据的标准差；

所述对所述用户行为轨迹数据中离散型的数值特征先采用one-hot进行编码，再对编码后的特征进行归一化处理，包括：

针对所述离散的类型特征，先采用one-hot进行编码，并在one-hot编码后采用Z-score归一化处理。
根据权利要求1所述的客服热线中用户意图轨迹识别的方法，其中，所述多层感知神经网络的结构包括2层隐藏层和1层输出层，前2层隐藏层分别拥有128个神经元和64个神经元、使用随机线性整流ReLU作为激活函数，所述输出层的神经元数量与用户意图one-hot向量维度相同，使用softmax函数作为激活函数；所述MLP模型的最后一层的向量中每一个元素是0-1之间的浮点数，表示相应的用户意图的概率值大小，所述向量的多个元素之和等于1；

所述使用交叉熵损失函数与反向传播机制对网络参数进行更新，包括：

在输入层和第1层隐藏层使用inverted dropout机制降低训练过拟合，使用EarlyStopping机制监控验证集上损失，并在验证集损失在预设轮数内不再下降的情况下停止训练，以避免训练过拟合。
根据权利要求1所述的客服热线中用户意图轨迹识别的方法，其中，所述根据所述用户意图的one-hot向量以及Beam Search策略在所述预测阶段生成所述最优的用户意图轨迹，包括：

使用Beam Search策略处理所述意图分类算法模型的输出，每次保留概率最大的k个意图类别，其中，k为2或3，在预测对话片段T+1的用户意图的情况下，将在对话片段T下保留的k个意图类别分别作为上文用户意图特征输入Beam Search策略，直到预测完最后一条对话片段的用户意图，选择概率最高的一个意图轨迹作为整个对话文本的用户意图轨迹。
一种客服热线中用户意图轨迹识别的系统，设置为基于用户行为轨迹和上下文进行客服热线中用户意图轨迹识别，包括数据切片模块、特征处理模块、意图分类模块和Beam Search策略模块；

所述数据切片模块设置为接收用户行为轨迹数据和对话文本，将所述对话文本切成N条4句话组成的对话片段，以将一通完整的对话文本转化成N条有先后顺序的对话片段，将N条对话片段与所述用户行为轨迹数据关联，关联依据为每条对话片段和所述用户行为轨迹发生的时间节点，在训练语料中，人工给每条对话片段标注正确的用户意图类别，输出数据至所述特征处理模块；

所述特征处理模块，设置为使用含有12层Transformer的来自Transformer的双向编码器表示BERT模型对所述对话文本进行特征提取，获得文本特征向量表示；使用归一化和one-hot对所述用户行为轨迹数据进行处理，获得用户行为轨迹特征表示；使用one-hot对上文用户意图进行特征编码，在one-hot编码后采用Z-score归一化处理，获得上文用户意图特征表示；将所述文本特征表示、所述用户行为特征表示和所述上文用户意图特征表示拼接，作为样本特征表示输出至所述意图分类模块；

所述意图分类模块设置为使用多层感知MLP神经网络作为意图分类算法模型，以所述样本特征表示作为所述意图分类算法模型的输入，以获得用户意图的one-hot向量作为目标，在所述意图分类算法模型的训练阶段，使用交叉熵损失函数与反向传播机制对网络参数进行更新，保存训练后的模型参数；在预测阶段，搭建与所述MLP神经网络相同结构的MLP模型并加载训练好的模型参数，将所述特征处理模块输出的所述样本特征表示输入加载模型参数后所述MLP模型，将所述MLP模型的最后一层的向量作为输出结果至所述Beam Search策略模块；

所述Beam Search策略模块设置为根据所述用户意图的one-hot向量以及Beam Search策略在所述预测阶段生成最优的用户意图轨迹作为整个对话文本的用户意图轨迹输出，其中，所述最优的用户意图轨迹为最终选择的概率最高的一个意图轨迹。
一种电子设备，包括：

至少一个处理器；

存储装置，设置为存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-7中任一项所述的客服热线中用户意图轨迹识别的方法。
一种计算机存储介质，存储有计算机程序，所述程序被处理器执行时实现如权利要求1-7中任一项所述的客服热线中用户意图轨迹识别的方法。