CN113836898A

CN113836898A - 一种电力系统自动派单方法

Info

Publication number: CN113836898A
Application number: CN202111113052.6A
Authority: CN
Inventors: 曹莉; 秦海波; 张萌; 叶宜修; 杨浩
Original assignee: HuaiAn Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Current assignee: HuaiAn Power Supply Co of State Grid Jiangsu Electric Power Co Ltd
Priority date: 2021-09-23
Filing date: 2021-09-23
Publication date: 2021-12-24

Abstract

本发明涉及配电网调度运行技术领域，尤其涉及一种电力系统自动派单方法，其特征在于：步骤1：获取工单来电信息并进行关键字提取，得到工单信息，构建派单模型；步骤2：将得到的工单信息与数据库内历史派单信息进行对比，若历史派单信息中存在与当前工单信息对应的派发路径，则执行步骤3A后执行步骤4，若不存在，则流转至人工处理后执行步骤3B，然后执行步骤4；步骤3A：进行派单行为；步骤3B：记录并训练人工处理结果，形成新的派发路径并更新派单模型同时保存至数据库中；步骤4：通知服务信息：派单完成后向服务对象发送对应的通知信息。本发明快速响应，提升派单率，减少人工的重复操作。

Description

一种电力系统自动派单方法

技术领域

本发明涉及配电网调度运行技术领域，尤其涉及一种电力系统自动派单方法。

背景技术

智能电网的普及和用户数量的增多促使电网公司茁壮成长，这一过程中如何提升用电质量和服务好用电用户成了公司最主要的问题。目前的电力工作中存在着客户信息收集和利用不合理、客户信息和需求传递不科学、容易发生重复派单、规范服务过程管控存在不足、故障类型统计分析不到位等问题。

随着城乡一体化的进程加快，农电抢修中心成立后，以上问题将会进一步突出，这就严重制约了优质服务的工作；根据城乡一体化的要求，要提高供电服务的效率，就必须减少供电服务差异事件的发生，同时需要预防差错发生。随着越来越多的用户参与到电网服务建设中，当前的接派单模式已难以满足快速响应，快速解决的要求，服务指挥平台工单智能接派单模块虽然能实现部分工单的自动接派但在拥有大量需求的工单池中，实现自动派发的仍占少数。

发明内容

本发明的目的是为了提供一种电力系统自动派单方法，快速响应，提升派单率，减少人工的重复操作。

为解决以上技术问题，本发明的技术方案为：一种电力系统自动派单方法，步骤包括：

步骤1：获取工单来电信息并进行关键字提取，得到工单信息，构建派单模型；

步骤2：将得到的工单信息与数据库内历史派单信息进行对比，若历史派单信息中存在与当前工单信息对应的派发路径，则执行步骤3A后执行步骤4，若不存在，则流转至人工处理后执行步骤3B，然后执行步骤4；

步骤3A：进行派单行为；

步骤3B：记录并训练人工处理结果，形成新的派发路径并更新派单模型同时保存至数据库中；

步骤4：通知服务信息：派单完成后向服务对象发送对应的通知信息。

按以上方案，步骤1中，具有来电信息的工单包括：客服系统中投诉受理工单、回访不满意工单、营销系统和配网抢修平台提供的工单。

按以上方案，关键字包括：服务类型、服务对象电话号码、户号、配变名称和用电地址；

数据库内的历史派单信息包括：工单信息和派单路径；工单信息包括：服务类型、服务对象电话号码、户号、配变名称和用电地址；派单路径即历史服务日志；

接单后将此次工单信息与历史派单信息中的工单信息进行对比，若存在相同工单信息对应的派单路径，则直接按照上次派单路径经行自动派单处理，若不存在，则流转到人工，将人工所操作的派发路径并更新派单模型至数据库中。

按以上方案，所述步骤1中，采用TF-IDF算法对来电信息进行关键字提取，提取步骤为：

第一步：计算词频TF，表示词条即关键词在文本中出现的频率；词频TF为词条的频次和所在文件中所有词汇总数的比值；

第二步：计算逆文档频率IDF，某一特定词语的IDF，由总文件数目和包含当前特定词语的文件数目的比值取对数；

第三步：计算TF-IDF：词频TF与逆文档频率IDF相乘得到TF-IDF。

按以上方案，所述步骤3A中，采用C4.5决策树算法进行派单，具体为：

以服务对象需要的服务类型出发，确认服务类型；

对能提供当前服务类型的服务网点进行距离排列，选择距离最近且处于空闲状态的工作人员对服务对象进行服务；

若存在信息不全或网点异常则流转至人工处理。

按以上方案，步骤3A中，选择距离最近的工作人员时使用floyd算法求解服务对象和服务网点两者间的最短距离。

按以上方案，所述步骤3B具体为：

步骤3B.1：对人工处理结果的语句进行特征提取；

步骤3B.2：将提取的特征通过构建的基于RNN的分类器模型进行预测得到预测结果，得到新的派发路径；基于RNN的分类器模型通过LSTM算法训练得到；

步骤3B.3：采用随机森林算法对派单模型进行更新并保存至数据库中。

按以上方案，所述步骤3B.1具体为：

对人工处理结果的语句进行分词并采用Word Embedding将每个词表示成一个数值型的词向量；

将词向量构建与分类器模型维数一致的句向量用于分类器模型的输入。

按以上方案，所述步骤3B.2中，分类器模型结构包括：

LSTM层：以句向量为输入通过一个时间序列的LSTM运算得到n个隐藏LSTM神经单元的状态向量；当前时刻输入X_t进入LSTM神经单元后与上一时刻的状态h_t-1进行运算，得到本时刻的状态h_t输入到下一时刻LSTM神经单元后与下一时刻输入X_t+1进行运算；n表示时间步长，时间步长表示循环神经网络展开的次数；

mean pooling层：对所有状态向量值求均值；

Softmax层：将状态向量均值通过softmax函数映射成为(0,1)的值，得到类别分布概率向量，取概率值最大的类别作为预测结果，获得新的派发路径。

按以上方案，所述步骤3B.3中，采用随机森林算法对派单模型更新的方法为：包括训练过程和预测过程；

训练过程为：

步骤S1：给定训练集S、测试集T和特征维数F；确定参数：使用到的CART树的数量t，每棵树的深度d，每个节点使用到的特征数量f；终止条件：节点上最少样本数s，节点上最少的信息增益m；

对于第1-t棵树，i＝1-t：

步骤S2：从训练集S中有放回的抽取大小和S一样的训练集S(i)，作为根节点的样本，从根节点开始训练；

步骤S3：如果当前节点上达到终止条件，则设置当前节点为叶子节点，如果是分类问题，叶子节点的预测输出为当前节点样本集合中数量最多的那一类c(j)，概率p为c(j)占当前样本集的比例；如果是回归问题，预测输出为当前节点样本集各个样本值的平均值，然后继续训练其他节点；如果当前节点没有达到终止条件，则从F维特征中无放回的随机选取f维特征；利用这f维特征，寻找分类效果最好的一维特征k及其阈值th，当前节点上样本第k维特征小于th的样本被划分到左节点，其余的被划分到右节点，继续训练其他节点；

步骤S4：重复步骤S2、步骤S3直到所有节点都训练过了或者被标记为叶子节点；

预测过程为：

对于第1-t棵树，i＝1-t：

步骤Q1：从当前树的根节点开始，根据当前节点的阈值th，判断是进入左节点(<th)还是进入右节点(>＝th)，直到到达某个叶子节点，并输出预测值；

步骤Q2：重复执行步骤Q1直到所有t棵树都输出了预测值；如果是分类问题，则输出为所有树中预测概率总和最大的那一个类，即对每个c(j)的p进行累计；如果是回归问题，则输出为所有树的输出的平均值。

本发明具有如下有益效果：

本发明将接到的工单进行自动化处理，在出现无法识别的工单时，才将人工操作的过程记录即派发路径训练更新派单模型，在下一次有相同工单时，自动优化派发路径，为工单的处理提升效率，不仅保证了工单处理效率而且也提高了工单处理的准确率。本发明克服了无法快速响应，快速解决的问题，提升了现有的自动派单方法的派单率，减少了人工的重复操作，提供更准确更迅速的电力服务。

附图说明

图1为本发明实施例整体流程图；

图2为本实施例中关键字提取的流程图；

图3为本实施例中C4.5决策树操作流程图；

图4为本实施例中基于RNN的分类器模型的结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，下面结合附图和具体实施例对本发明作进一步详细说明。

请参考图1至图4，本发明为一种电力系统自动派单方法，步骤包括：

本实施例中，使用TF-IDF算法对获取到的来电信息进行关键字提取，其中，具有来电信息的工单包括：客服系统中投诉受理工单、回访不满意工单、营销系统和配网抢修平台提供的工单。对这些工单所需要提取的关键字包括服务类型、服务对象电话号码、户号、配变名称和用电地址，提取步骤如图2所示：

这个数字通常会被归一化(一般是词频除以文本总词数)，以防止它偏向长的文件；

即

其中，n_i,j是该词在文件d_j中出现的次数，分母则是文件d_j中所有词汇出现的次数总和；

如果包含词条t的文档越少，IDF越大，则说明词条具有很好的类别区分能力；

其中，|D|是语料库中的文件总数。|{j:t_i∈d_j}|表示包含词语t_i的文件数目(即n_i,j≠0的文件数目)；如果该词语不在语料库中，就会导致分母为零，因此一般情况下使用1+|{j:t_i∈d_j}|，即

分母之所以要加1，是为了避免分母为0的情况。

第三步：计算TF-IDF：词频TF与逆文档频率IDF相乘得到TF-IDF；

某一特定文件内的高词语频率，以及该词语在整个文件集合中的低文件频率，可以产生出高权重的TF-IDF。因此，TF-IDF倾向于过滤掉常见的词语，保留重要的词语。

TF-IDF＝TF*IDF (5)

数据库是一种面向服务对象的关联数据库，数据库内的历史派单信息包括：工单信息和派单路径；工单信息包括：服务类型、服务对象电话号码、户号、配变名称和用电地址；派单路径即历史服务日志；

接单后将此次工单信息与面向服务对象关联数据库内的历史派单信息中的工单信息进行对比，若存在相同工单信息对应的派单路径即若已有相同问题的历史服务日志，则直接按照上次派单路径经行自动派单处理，若不存在即查无记录，则流转到人工，将人工所操作的派发路径并更新派单模型至服务对象数据库中。

步骤3A：进行派单行为；若有历史记录自动的进行派单处理时，具体使用C4.5决策树算法进行派单，操作流程如图3所示，具体为：以服务对象需要的服务类型出发，确认服务类型；以服务对象的需求为出发点，对能提供当前服务类型的服务网点(供电所、施工队等)进行距离排列，选择距离最近且处于空闲状态的工作人员对服务对象进行服务；若存在信息不全或网点异常则流转至人工处理。

在优先选择距离近的工作人员时，使用floyd(弗洛伊德)算法求解服务对象和服务网点两者间的最短距离。floyd算法是一个经典的动态规划算法，用通俗的语言可以描述为寻找从点i到点j的最短路径。从动态规划的角度来看，需要为这个目标重新做一个诠释(这个诠释正是动态规划最富创造力的精华所在)。

而从任意节点i到任意节点j的最短路径不外乎两种可能。第一种是直接从i到j；第二种是从i经过若干个节点k到j。所以使用floyd(弗洛伊德)算法求解两点间的最短距离的流程如下：

首先，假设Dis(i,j)为节点u到节点v的最短路径的距离。其次，对于每一个节点k，检查Dis(i,k)+Dis(k,j)<Dis(i,j)是否成立；如果成立，就证明了从i到k再到j的路径比i直接到j的路径短，设置Dis(i,j)＝Dis(i,k)+Dis(k,j)。最后，当我们遍历完所有节点k，Dis(i,j)中记录的便是i到j的最短路径的距离。

步骤3B：记录并训练人工处理结果，形成新的派发路径并更新派单模型同时保存至数据库中；记录并训练人工处理结果时，采用LSTM算法记录并人工处理结果，同时使用随机森林算法来实现新旧模型之间的更新。采用LSTM算法对工单进行训练，将获得的规律作为模型保存下来，模型结构图如图4所示，而这一过程说实际是一个文本分类的过程，主要由两部分组成，第一部分为步骤3B.1的句子特征提取，第二部分为步骤3B.2和步骤3B.3的基于RNN的分类器模型。

步骤3B.1：对人工处理结果的语句进行特征提取；

步骤3B.1.1：读取人工处理结果的语句数据，按比例划分训练集和验证集，这里每个句子都生成了相应的mask向量，用以标记每个输入文本的实际长度；这里有几个可选项：

(1)考虑到句子中越靠后的词重要程度越高，因此可对句子进行逆序输入；

(2)样本数较小的时候可选择数据增强，即打乱句子顺序来构建新样本；

(3)对句子按照长短进行排序

(4)打乱样本顺序，随机采样

步骤3B.1.2：对人工处理结果的语句进行分词并采用Word Embedding将每个词表示成一个数值型的词向量，这个过程中对于不同长度的问题文本，pad和截断成一样长度的，太短的就补空格，太长的就截断，从而构建维数一致的模型句向量输入将词向量构建与分类器模型维数一致的句向量，用于作为分类器模型的输入；

分类器模型结构包括LSTM层、mean pooling层和Softmax层；每个词经过embedding之后，进入LSTM层，这里用的是标准的LSTM，然后经过一个时间序列得到的n个隐藏LSTM神经单元的向量，这些向量经过mean pooling层之后，可以得到一个状态向量h，然后紧接着是一个Softmax层，得到一个类别分布概率向量，取概率值最大的类别作为最终预测结果。LSTM层：以句向量为输入通过一个时间序列的LSTM运算得到n个隐藏LSTM神经单元的状态向量；当前时刻输入X_t进入LSTM神经单元后与上一时刻的状态h_t-1进行运算，得到本时刻的状态h_t输入到下一时刻LSTM神经单元后与下一时刻输入X_t+1进行运算；n表示时间步长，时间步长表示循环神经网络展开的次数；

mean pooling层：对所有状态向量值求均值；

当旧的模型中加入新的数据，也就是人工处理的派单信息存入到旧的模型中时，就需要对模型进行更新，本实施例中，采用随机森林算法来实现新旧模型之间的更新。

随机森林指的是利用多棵树对样本进行训练并预测的一种分类器，它是bagging的一个扩展，以决策树为基学习器构建bagging集成的基础上，进一步在决策树的训练过程中引入了随机属性选择。简单来说，随机森林就是由多棵CART(Classification AndRegression Tree)构成的。对于每棵树，它们使用的训练集是从总的训练集中有放回采样出来的，这意味着，总的训练集中的有些样本可能多次出现在一棵树的训练集中，也可能从未出现在一棵树的训练集中。在训练每棵树的节点时，使用的特征是从所有特征中按照一定比例随机地无放回的抽取的，根据Leo Breiman的建议，假设总的特征数量为M，这个比例可以是sqrt(M),1/2sqrt(M),2sqrt(M)。

采用随机森林算法对派单模型更新包括训练过程和预测过程；

训练过程为：

对于第1-t棵树，i＝1-t：

预测过程为：

对于第1-t棵树，i＝1-t：

本发明首先将接收到的工单信息进行关键字提取，建立派单模型；其次建立了面向对象的关联数据库。最后根据历史服务日志，以条件筛选的方法，将类似操作按照已有处理操作进行自动派单，减少人工的重复操作。若是没有历史服务日志，则采用人工处理的方法，同时记录人工处理过程并对其进行训练建立新的派单模型。本发明以智能化为主的方式将接到的工单进行自动化处理，只有出现系统无法识别的工单时，才将此工单流转至人工处理，这样的做法不仅保证了工单处理效率而且也提高了工单处理的准确率；而在系统无法识别工单人工进行处理时，系统可以记录并训练人工处理结果，在下一次有相同工单时，能够在少量人工的干预下，自动优化派发路径，为工单的处理提升效率。

本发明未涉及部分均与现有技术相同或采用现有技术加以实现。

以上内容是结合具体的实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种电力系统自动派单方法，其特征在于，步骤包括：

步骤3A：进行派单行为；

2.根据权利要求1所述的电力系统自动派单方法，其特征在于：步骤1中，具有来电信息的工单包括：客服系统中投诉受理工单、回访不满意工单、营销系统和配网抢修平台提供的工单。

3.根据权利要求1所述的电力系统自动派单方法，其特征在于：关键字包括：服务类型、服务对象电话号码、户号、配变名称和用电地址；

4.根据权利要求1所述的电力系统自动派单方法，其特征在于：所述步骤1中，采用TF-IDF算法对来电信息进行关键字提取，提取步骤为：

第三步：计算TF-IDF：词频TF与逆文档频率IDF相乘得到TF-IDF。

5.根据权利要求1所述的电力系统自动派单方法，其特征在于：所述步骤3A中，采用C4.5决策树算法进行派单，具体为：

以服务对象需要的服务类型出发，确认服务类型；

若存在信息不全或网点异常则流转至人工处理。

6.根据权利要求5所述的电力系统自动派单方法，其特征在于：步骤3A中，选择距离最近的工作人员时使用floyd算法求解服务对象和服务网点两者间的最短距离。

7.根据权利要求1所述的电力系统自动派单方法，其特征在于：所述步骤3B具体为：

步骤3B.1：对人工处理结果的语句进行特征提取；

8.根据权利要求7所述的电力系统自动派单方法，其特征在于：所述步骤3B.1具体为：

9.根据权利要求7所述的电力系统自动派单方法，其特征在于：所述步骤3B.2中，分类器模型结构包括：

LSTM层：以句向量为输入通过一个时间序列的LSTM运算得到n个隐藏LSTM神经单元的状态向量；

mean pooling层：对所有状态向量值求均值；

10.根据权利要求7所述的电力系统自动派单方法，其特征在于：所述步骤3B.3中，采用随机森林算法对派单模型更新的方法为：包括训练过程和预测过程；

训练过程为：

对于第1-t棵树，i＝1-t：

预测过程为：

对于第1-t棵树，i＝1-t：