WO2020019866A1

WO2020019866A1 - 为客服系统日志打标签的方法、客服系统和存储介质

Info

Publication number: WO2020019866A1
Application number: PCT/CN2019/089289
Authority: WO
Inventors: 刘俊仕; 刘云峰; 吴悦; 胡晓; 汶林丁
Original assignee: 深圳追一科技有限公司
Priority date: 2018-07-25
Filing date: 2019-05-30
Publication date: 2020-01-30
Also published as: CN109033356A

Abstract

一种为客服系统日志打标签的方法，包括：收集历史会话日志，并对所述历史会话日志进行人工标注标签；对所述历史会话日志进行清洗；利用语义分析模型将清洗后会话日志映射到相应业务标签上；对所述相应业务标签进行整合得到至少一个标签；分析所述至少一个标签与人工标注标签，并根据分析结果修正所述语义分析模型参数；将新的会话日志输入修正参数后的语义分析模型进行自动打标签。

Description

为客服系统日志打标签的方法、客服系统和存储介质

相关申请的交叉引用

本申请要求于2018年07月25日提交中国专利局、申请号为201810830223.9、发明名称为“为客服系统日志打标签的方法及客服系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及自然语言处理技术领域，尤其是一种为客服系统日志打标签的方法、客服系统和非易失性计算机可读存储介质。

背景技术

为节约人工客服成本，智能客服机器人被引入客服系统。智能客服机器人是一种能够使用自然语言处理和语音识别技术与用户进行交流的人工智能信息系统。它能够用于多种用户服务场景,提供用户服务咨询、业务查询办理、产品营销推广等功能，为用户带来全新的沟通体验，它可以替代人工客服完成大量的重复性日常工作，为用户解答常见问题，大幅降低现有用户服务人员的劳动强度，从而削减企业人工成本。

为客服系统日志打标签广泛存在于智能客服机器人系统中，其作用是为客户与客服的会话日志进行打标签，标签可以有一个或者多个，也可以涉及多个模态，比如用户意图、情感、服务满意程度。通过打标签可以帮助提升产品的用户体验，帮助企业建立用户画像改进营销策略。

相关技术中，客服专员在与客户结束当前轮对话后通过系统来手动打标签。但由于人工手动打标签，客服专员需要从标签系统中选择适配的标签一个一个勾选，不仅效率低，而且由于客服专员会在会话结束后很短的时间内马上接入下一个用户，从而导致没有时间给当前对话打上准确标签，甚至当用户很多时，会出现一些对话漏打标签的状况。

发明内容

根据本申请的各种实施例，提供一种为客服系统日志打标签的方法、客服系统和非易失性计算机可读存储介质。

一种为客服系统日志打标签的方法，包括：

收集历史会话日志，并对所述历史会话日志进行人工标注标签；

对所述历史会话日志进行清洗；

利用语义分析模型将清洗后会话日志映射到相应业务标签上；

对所述相应业务标签进行整合得到至少一个标签；

分析所述至少一个标签与人工标注标签，并根据分析结果修正所述语义分析模型参数；

将新的会话日志输入修正参数后的语义分析模型进行自动打标签。

一种客服系统，包括：

收集模块，用于收集历史会话日志；

清洗模块，用于对所述历史会话日志进行清洗；

标签映射模块，用于将清洗后会话日志映射到相应业务标签上；

标签整合模块，用于筛选出至少一个最准确标签。

一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下操作收集历史会话日志，并对所述历史会话日志进行人工标注标签；

对所述历史会话日志进行清洗；

对所述相应业务标签进行整合得到至少一个标签；

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

本发明的一个或多个实施例的细节在下面的附图和描述中提出。本发明的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

为了更好地描述和说明本申请公开的实施例和/或示例，可以参考一副或者多副附图。用于描述附图的附加细节或示例不应当被认为是对所公开的发明、目前描述的实施例和/或示例以及目前理解的这些发明的最佳模式中的任何一者的范围的限制。

图1是一个或多个实施例提供的为客服系统日志打标签的方法的应用环境图。

图2是一个或多个实施例提供的为客服系统日志打标签的方法的流程示意图。

图3是一个或多个实施例提供的客服系统的模块图。

图4是一个或多个实施例提供的计算机设备的内部结构示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

本申请提供的为客服系统日志打标签的方法，可以应用于如图1所示的应用环境中。该应用环境包括计算机设备102。计算机设备102可以收集历史会话日志，并对历史会话日志进行人工标注标签，对历史会话日志进行清洗利用语义分析模型将清洗后会话日志映射到相对应业务标签上，对相应业务标签进行整合得到至少一个标签，分析至少一个标签与人工标注标签，并根据分析结果修正语义分析模型参数，将新的会话日志输入修正参数后的语义分析模型进行自动打标签。其中，计算机设备102是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等。可选地，计算机设备102也可以是服务器，服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

图2是一个实施例提供的为客服系统日志打标签的方法的流程示意图。

如图2所示，在一个实施例中，提供的为客服系统日志打标签的方法包括：

S21，收集历史会话日志，并对历史会话日志进行人工标注标签。

例如，客户想要办理密码变更业务，可以通过人工将客户咨询的问题“密码如何变更”标注为“密码咨询业务”，进一步细化标签为“密码变更业务”。

标注标签包括文本的业务类别、文本的情感类别和文本的分词词性。通过对标签进行多个维度进行标注，有利于分析用户意图、情感以及服务满意程度，从而帮助提升产品的用户体验。比如通过分析一个时间段内用户意图的分布，就能获取哪些问题是用户常见问题，企业就可以针对这些问题对产品做出相应调整。

S22，对历史会话日志进行清洗。

基于自然语言处理的日志清洗模块主要作用清洗原始日志数据。客服原始日志数据往往有非常多的噪声，比如大量的问候语、表情、系统提示和web链接等，这些都是和用户无关或者难以被利用的，需要在数据清洗过程中将噪声去除，去除噪声后的客服日志需进行错别字的修正，客服或者客户交流往往会出现错别字，这些错别字也是对打标签会有影响。最后是文本的归一化，客服日志中往往过于口语，需要将其转化成标准的表达。

具体的，对历史会话日志进行清洗，可以通过以下三轮过滤完成：

第一轮过滤：将历史会话日志进行规则过滤，得到第一轮过滤结果。规则过滤例如为正则表达式过滤或者为通用语料库过滤。

例如，客服机器人提醒客户“您前面有5人在排队”，当排队人数变更时，客服机器人会重复提醒，因此使用正则表达式“您前面有\d人在排队”只保留排队人个数，过滤掉重复出现的且与语义无关的客服机器人答句。

例如，通用语料库过滤中包含“你好”、“好的”、“谢谢”等通用问候语，当客户的回答中包含上述通用问候语时可通过通用语料库将通用问候语过滤。

第二轮过滤：将第一轮过滤结果进行query改写(Query Rewrite，查询改写)，得到第二轮过滤结果。例如，将客户输入的随意输入的日期通过query改写过滤后生成标准日期格式的日期。

第三轮过滤：将第二轮过滤结果进行错别字纠正，得到清洗后的日志。例如，将客户输入的“密马”通过错别字纠正过滤后得到“密码”。

对日志进行清洗，消除噪声从而减少冗余数据，并且对格式进行标准化、修正错别字，并将清洗后的日志输入到语义分析模型进行训练，提高模型的训练数据准确性。

S23，利用语义分析模型将清洗后会话日志映射到相对应业务标签上。

语义分析模型包括学习模型和预测模型。学习模型为机器学习模型或者为深度学习模型，预测模型为支持向量机模型或者卷积神经网络模型或者循环神经网络模型。学习模型和预测模型具有良好的泛化效果，当客服会话日志出现训练数据中没有的对话信息后，学习模型和预测模型仍能将日志映射到相对应业务标签上。

利用语义分析模型将清洗后会话日志映射到相应业务标签上，包括：

将清洗后会话日志输入预测模型；

将预测模型输出结果输入到学习模型得到类别概率；

取类别概率最大的类别标签作为相应业务标签。

可选地，以深度学习模型和卷积神经网络模型为例进行说明，将将清洗后会话日志输入预测模型，将预测模型输出结果输入到学习模型得到类别概率的过程，包括：

将清洗后的会话日志输入卷积神经网络模型；

通过卷积神经网络模型操作将清洗后会话日志进行多个尺度的卷积；

对卷积的结果进行池化操作；

将池化操作的结果进行拼接；

将拼接的结果输入全连接层后进行输出，得到输出结果；

将输出结果输入到深度学习模型的softmax分类器得到类别概率。

通过对学习模型和预测模型的训练，在新的会话日志产生后，语义分析模型能快速将会话日志进行映射，找到准确标签。

可选地，利用语义分析模型将清洗后会话日志映射到相对应业务标签上的过程还可以包括：针对客户的语句进行语义分析，得到预测标注标签；在语义分析模的基础上对清洗后会话日志进行情感标签标注；为清洗后会话日志进行自定义标签标注，例如在一些对话场景中，可以设置敏感词检测，当客户输入敏感词时，对敏感词进行处理如使用“*”替代敏感词。

其中，情感分析主要是针对客服日志区分出客户的正面情感、中性情感或者负面情感，例如交易信息咨询属于中性情感，而交易争议处理为负面情感，通过将语义与情感相结合，可以更准确的对客服对话进行标注，从而提高标注标签的准确率。并且，通过对会话日志进行情感分析，有助于企业更准确了解用户意图，从而对产品做出改进。

S24，对相应业务标签进行整合得到至少一个标签。

预测模型输出预测标注标签可能包含粒度不同的多个模型的业务标签，因此需要进一步对标签进行整合，从而筛选出最准确的一个或多个标签，整合方法包括：排序筛选法和阈值过滤法。排序筛选法对所有业务标签的准确性进行排序，可以获取排名在前的一个或者多个标签，对获取标签的数量可以掌控；阈值过滤法是预先设置好业务标签准确性阈值，过滤出业务标签准确性大于阈值的业务标签，方法简单快捷。

例如，对相应业务标签根据置信度进行排序，筛选出置信度排名前三的业务标签，或者设置置信度高阈值，筛选出置信度高于置信度高阈值的业务标签。

S25，分析至少一个标签与人工标注标签，并根据分析结果修正语义分析模型参数。

将语义分析模型预测的结果和人工标注的结果做对比，通过人工分析至少一个标签与人工标注标签，当至少一个标签比人工标注标签准确时，则将错误标注的数据按照语义分析模型预测结果进行修正；当人工标注的结果比整合得到的所有标签均准确时，则增加这个数据的损失权值从而提高语义分析模型学习效果。

S26，将新的会话日志输入修正参数后的语义分析模型进行自动打标签。

本实施例中，通过对历史会话日志进行人工标注标签与清洗并将历史会话日志与人工标注标签输入语义分析模型，不断修正语义分析模型参数，并将新的会话日志输入修正参数后的语义分析模型进行自动打标签。从而解决人工手动标注标签效率低等问题，提高客服系统打标签效率，并且提高了标签准确率。

图3是一个实施例提供的客服系统的结构框图。如图3所示，在一个实施例中，提供了一个客服系统，该客服系统包括：

收集模块31，用于收集历史会话日志。

清洗模块32，用于对历史会话日志进行清洗。

标签映射模块33，用于将清洗后会话日志映射到相应业务标签上。

标签整合模块34，用于筛选出至少一个最准确标签。

在一个实施例中，清洗模块32还用于将历史会话日志进行规则过滤，得到第一轮过滤结果，将第一轮过滤结果进行query改写(Query Rewrite，查询改写)，得到第二轮过滤结果，将第二轮过滤结果进行错别字纠正，得到清洗后的日志。

标签映射模块33包括语义分析单元、情感分析单元和自定义单元。

语义分析单元用于针对客户的语句进行语义分析，通过语义模型得到预测标注标签。

情感分析单元在语义分析模块基础上对清洗后会话日志进行情感标签标注，情感分析模块主要是针对客服日志区分出客户的正面情感、中性情感或者负面情感，例如交易信息咨询属于中性情感，而交易争议处理为负面情感，通过将语义与情感相结合，可以更准确的对客服对话进行标注，从而提高标注标签的准确率。并且，通过对会话日志进行情感分析，有助于企业更准确了解用户意图，从而对产品做出改进。

自定义单元为清洗后会话日志进行自定义标签标注，例如在一些对话场景中，可以设置敏感词检测，当客户输入敏感词时，对敏感词进行处理如使用“*”替代敏感词。

标签整合模块34还用于通过排序筛选法和阈值过滤法中的至少一个对标签进行筛选，得到最准确的至少一个标签。

在一个实施例中，清洗模块32还用于将所述历史会话日志进行规则过滤，得到第一轮过滤结果；将所述第一轮过滤结果进行query改写，得到第二轮过滤结果；及将所述第二轮过滤结果进行错别字纠正，得到清洗后的日志。

在一个实施例中，标签映射模块33还用于将清洗后会话日志输入预测模型；将所述预测模型输出结果输入到学习模型得到类别概率；及取类别概率最大的类别标签作为相应业务标签。

在一个实施例中，标签映射模块33还用于将清洗后的会话日志输入卷积神经网络模型；通过所述卷积神经网络模型将清洗后的所述会话日志进行多个尺度的卷积；对卷积的结果进行池化操作；将池化操作的结果进行拼接；将拼接的结果输入全连接层后进行输出，得到输出结果；将所述输出结果输入到深度学习模型的softmax分类器，得到所述类别概率；及取类别概率最大的类别标签作为相应业务标签。

本实施例中，由于标签映射模块包括语义分析模块、情感分析模块和自定义模块，通过将语义与情感相结合，可以更准确的对客服对话进行标注，从而提高标注标签的准确率。进一步的，通过增加自定义模块，以满足不同对话场景需求。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本申请的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本申请的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的操作的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

图4为一个实施例中计算机设备的内部结构示意图。如图3所示，该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种为客户系统日志打标签的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

在一个实施例中，本申请提供的客服系统可以实现为一种计算机程序的形式，计算机程序可在如图4所示的计算机设备上运行。计算机设备的存储器中可存储组成该客服系统的各个程序模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的为客服系统日志打标签的方法中的操作。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个操作或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分操作是可以通过程序来指令相关的硬件完成，的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的操作之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个非易失性计算机可读存储介质中。

上述提到的非易失性计算机可读存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

需要说明的是，本发明不局限于上述最佳实施方式，本领域技术人员在本发明的启示下都可得出其他各种形式的产品，但不论在其形状或结构上作任何变化，凡是具有与本申请相同或相近似的技术方案，均落在本发明的保护范围之内。

Claims

一种为客服系统日志打标签的方法，包括：

收集历史会话日志，并对所述历史会话日志进行人工标注标签；

对所述历史会话日志进行清洗；

利用语义分析模型将清洗后会话日志映射到相应业务标签上；

对所述相应业务标签进行整合得到至少一个标签；

分析所述至少一个标签与人工标注标签，并根据分析结果修正所述语义分析模型参数；

将新的会话日志输入修正参数后的语义分析模型进行自动打标签。
根据权利要求1所述的方法，其特征在于，所述对所述历史会话日志进行清洗，包括：

第一轮过滤：将所述历史会话日志进行规则过滤，得到第一轮过滤结果；

第二轮过滤：将所述第一轮过滤结果进行query改写，得到第二轮过滤结果；

第三轮过滤：将所述第二轮过滤结果进行错别字纠正，得到清洗后的日志。
根据权利要求1所述的方法，其特征在于，所述利用语义分析模型将清洗后的会话日志映射到相应业务标签上，包括：

对清洗后的所述会话日志进行语义分析，得到预测标注标签；

对清洗后的所述会话日志进行情感标签标注；及

对清洗后的所述会话日志进行自定义标签标注。
根据权利要求1所述的方法，其特征在于，所述语义分析模型包括学习模型和预测模型。
根据权利要求1或4任一项所述的方法，其特征在于，所述利用语义分析模型将清洗后会话日志映射到相应业务标签上，包括：

将清洗后会话日志输入预测模型；

将所述预测模型输出结果输入到学习模型得到类别概率；

取类别概率最大的类别标签作为相应业务标签。
根据权利要求5所述的方法，其特征在于，所述将清洗后会话日志输入预测模型，将所述预测模型输出结果输入到学习模型得到类别概率，包括：

将清洗后的会话日志输入卷积神经网络模型；

通过所述卷积神经网络模型将清洗后的所述会话日志进行多个尺度的卷积；

对卷积的结果进行池化操作；

将池化操作的结果进行拼接；

将拼接的结果输入全连接层后进行输出，得到输出结果；

将所述输出结果输入到深度学习模型的softmax分类器，得到所述类别概率。
根据权利要求1所述的方法，其特征在于，所述标注标签包括文本的业务类别、文本的情感类别和文本的分词词性。
根据权利要求1所述的方法，其特征在于，所述对所述相应业务标签进行整合得到至少一个标签，整合方法包括：排序筛选法和阈值过滤法。
一种客服系统，包括：

收集模块，用于收集历史会话日志；

清洗模块，用于对所述历史会话日志进行清洗；

标签映射模块，用于将清洗后会话日志映射到相应业务标签上；

标签整合模块，用于对所述相应业务标签进行整合得到至少一个标签。
根据权利要求9所述的系统，其特征在于，所述系统还包括：

模型修正模块，用于分析所述至少一个标签与人工标注标签，并根据分析结果修正所述语义分析模型参数；

打标签模块，用于将新的会话日志输入修正参数后的语义分析模型进行自动打标签。
根据权利要求9所述的系统，其特征在于，所述标签映射模块包括：语义分析单元、情感分析单元和自定义单元。
根据权利要求11所述的系统，其特征在于，所述情感分析单元用于为清洗后会话日志进行情感标签标注。
根据权利要求11所述的系统，其特征在于，所述自定义模块为清洗后会话日志进行自定义标签标注。
根据权利要求9所述的系统，其特征在于，所述清洗模块还用于将所述历史会话日志进行规则过滤，得到第一轮过滤结果；将所述第一轮过滤结果进行query改写，得到第二轮过滤结果；及将所述第二轮过滤结果进行错别字纠正，得到清洗后的日志。
根据权利要求9所述的系统，其特征在于，所述标签映射模块还用于将清洗后会话日志输入预测模型；将所述预测模型输出结果输入到学习模型得到类别概率；及取类别概率最大的类别标签作为相应业务标签。
根据权利要求15所述的系统，其特征在于，所述标签映射模块还用于将清洗后的会话日志输入卷积神经网络模型；通过所述卷积神经网络模型将清洗后的所述会话日志进行多个尺度的卷积；对卷积的结果进行池化操作；将池化操作的结果进行拼接；将拼接的结果输入全连接层后进行输出，得到输出结果；将所述输出结果输入到深度学习模型的softmax分类器，得到所述类别概率；及取类别概率最大的类别标签作为相应业务标签。
一个或多个存储有计算机可读指令的非易失性计算机可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下操作：收集历史会话日志，并对所述历史会话日志进行人工标注标签；

对所述历史会话日志进行清洗；

利用语义分析模型将清洗后会话日志映射到相应业务标签上；

对所述相应业务标签进行整合得到至少一个标签；

分析所述至少一个标签与人工标注标签，并根据分析结果修正所述语义分析模型参数；

将新的会话日志输入修正参数后的语义分析模型进行自动打标签。
根据权利要求17所述的非易失计算机可读存储介质，其特征在于，所述一个或多个处理器执行所述对所述历史会话日志进行清洗时，还执行如下操作：

将所述历史会话日志进行规则过滤，得到第一轮过滤结果；

将所述第一轮过滤结果进行query改写，得到第二轮过滤结果；

将所述第二轮过滤结果进行错别字纠正，得到清洗后的日志。
根据权利要求17所述的非易失性计算机可读存储介质，其特征在于，所述一个或多个处理器执行所述利用语义分析模型将清洗后的会话日志映射到相应业务标签上时，还执行如下操作：

对清洗后的所述会话日志进行语义分析，得到预测标注标签；

对清洗后的所述会话日志进行情感标签标注；及

对清洗后的所述会话日志进行自定义标签标注。
根据权利要求17所述的非易失性计算机可读存储介质，其特征在于，所述一个或多个处理器执行所述利用语义分析模型将清洗后会话日志映射到相应业务标签上时，还执行如下操作：

将清洗后会话日志输入预测模型；

将所述预测模型输出结果输入到学习模型得到类别概率；

取类别概率最大的类别标签作为相应业务标签。
根据权利要求20所述的非易失性计算机可读存储介质，其特征在于，所述一个或多个处理器所述将清洗后会话日志输入预测模型，将所述预测模型输出结果输入到学习模型得到类别概率时，还执行如下操作：

将清洗后的会话日志输入卷积神经网络模型；

通过所述卷积神经网络模型将清洗后的所述会话日志进行多个尺度的卷积；

对卷积的结果进行池化操作；

将池化操作的结果进行拼接；

将拼接的结果输入全连接层后进行输出，得到输出结果；

将所述输出结果输入到深度学习模型的softmax分类器，得到所述类别概率。