CN116503025A

CN116503025A - 一种基于工作流引擎的业务工单流程处理方法

Info

Publication number: CN116503025A
Application number: CN202310746008.1A
Authority: CN
Inventors: 谭海宁; 陈庆文; 储灿建; 吴珂; 何相才; 仲飞; 陈志�; 周世宇; 周维奇; 朱江涛
Original assignee: Shenzhen Hi Tech Industrial Park Information Network Co ltd
Current assignee: Shenzhen Hi Tech Industrial Park Information Network Co ltd
Priority date: 2023-06-25
Filing date: 2023-06-25
Publication date: 2023-07-28
Anticipated expiration: 2043-06-25
Also published as: CN116503025B

Abstract

本发明涉及数据处理技术领域，具体涉及一种基于工作流引擎的业务工单流程处理方法，包括：采集工单数据，根据所有历史工单数据中同一个维度的所有数据获取所有决定性维度，获取当前工单数据与每条历史工单数据的相似性，进而得到当前工单数据的相似工单数据，根据当前工单数据的同一时期的历史工单数据以及相似工单数据获取当前工单数据的冲突性程度，结合当前工单数据与每条历史工单数据的相似性获取聚类距离度量优化值，对所有工单数据聚类过程中的聚类距离进行优化校正，得到聚类结果，根据聚类结果获取当前工单数据的异常程度，对当前工单数据进行处理。本发明对异常工单数据识别准确，可以帮助企业进行针对性的优化调整。

Description

一种基于工作流引擎的业务工单流程处理方法

技术领域

本发明涉及数据处理技术领域，具体涉及一种基于工作流引擎的业务工单流程处理方法。

背景技术

在现代企业中，对业务流程的管理和优化是至关重要的，随着企业规模的扩大和业务复杂度的增加，传统的工单处理方式如人工分派和简单自动化已经无法满足高效、准确和规范化的需求，其中基于工作流引擎的业务工单流程处理能够带来显著的效率改进和质量提升，满足企业的自动化与标准化的要求，并且可以实时监控业务流程的状态并随时跟踪处理进度，从而可以有针对性地优化业务流程，降低成本，提高效益。

尽管基于工作流引擎的业务工单流程处理具有诸多优势，但在实际运行过程中仍可能出现异常工单，这类工单可能会导致业务流转延误或错误决策，给企业带来巨大损失，因此对异常类型的工单的检测至关重要。K-Means是传统的异常检测方法，通过对所有工单数据进行聚类，分析每个工单数据之间与所处聚簇的聚簇中心之间的欧式距离来表征异常程度。但是由于在进行K-Means聚类过程中，由于若仅根据工单数据本身的数据特征来进行聚类距离的度量，会使得一些和正常工单数据较为相似异常工单数据被识别为正常工单，并且同时可能会使得正常工单被识别为异常工单，即由于聚类距离度量不合理使得得到的聚簇结果不准确，进而得到错误的异常工单检测结果，因此需要在进行K-Mean聚类过程对聚类距离进行校正以达到准确的K-Means聚类结果。

发明内容

本发明提供一种基于工作流引擎的业务工单流程处理方法，以解决现有的问题。

本发明的一种基于工作流引擎的业务工单流程处理方法采用如下技术方案：

本发明一个实施例提供了一种基于工作流引擎的业务工单流程处理方法，该方法包括以下步骤：

采集当前工单数据以及历史工单数据；

将所有历史工单数据中同一个维度的所有数据按照工单时间戳从小到大的顺序构成一个序列，作为该维度的数据序列；根据每个维度的数据序列获取所有决定性维度；

根据当前工单数据与每条历史工单数据的相似性，获取当前工单数据的相似工单数据；

根据当前工单数据的同一时期的历史工单数据以及相似工单数据获取当前工单数据的冲突性程度；根据当前工单数据与每条历史工单数据的相似性以及当前工单数据的冲突性程度获取聚类距离度量优化值，对所有工单数据聚类过程中的聚类距离进行优化校正，得到聚类结果；

根据聚类结果获取当前工单数据的异常程度，对当前工单数据进行处理。

优选的，所述根据每个维度的数据序列获取所有决定性维度，包括的具体步骤如下：

计算任意两个维度的数据序列之间的皮尔逊相关系数，作为此两个维度之间的相关性值；将任意一个维度作为目标维度，获取与目标维度具有相关性的所有维度；

将与目标维度相关的第个维度的数据序列中出现的数据的种类数和目标维度的第种数据在与目标维度相关的第个维度的数据序列中对应的数据的种类数的比值作为第一比值，获取目标维度的第种数据在与目标维度相关的第个维度的数据序列中对应的每种数据出现的次数的方差，将该方差与第一比值的积作为与目标维度相关的第个维度相对于目标维度的第种数据的随机性；

获取与目标维度相关的每个维度相对于目标维度的每种数据的随机性；根据与目标维度相关的每个维度相对于目标维度的每种数据的随机性获取目标维度的决定性程度；获取每个维度的决定性程度，对所有维度的决定性程度进行线性归一化处理；将线性归一化后的决定性程度大于决定性阈值的维度作为决定性维度。

优选的，所述根据与目标维度相关的每个维度相对于目标维度的每种数据的随机性获取目标维度的决定性程度，包括的具体步骤如下：

其中为目标维度的决定性程度；为与目标维度相关的第个维度和目标维度之间的相关性值；为与目标维度相关的所有维度和目标维度之间的相关性值中的最大值；为与目标维度相关的维度的数量；为与目标维度相关的第个维度相对于目标维度的第种数据的随机性；为目标维度的数据序列中出现的数据的种类数。

优选的，所述根据当前工单数据与每条历史工单数据的相似性，获取当前工单数据的相似工单数据，包括的具体步骤如下：

获取所有历史工单数据的每个决定性维度中，与当前工单数据对应的决定性维度的数值相同的所有历史工单数据，作为每个决定性维度的参考历史工单数据；获取每个决定性维度的所有参考历史工单数据的平均密度；获取当前工单数据与每条历史工单数据的相似性，将与当前工单数据的相似性大于相似性阈值的所有历史工单数据作为当前工单数据的相似工单数据。

优选的，所述获取当前工单数据与每条历史工单数据的相似性，包括的具体步骤如下：

其中，为当前工单数据与第条历史工单数据的相似性；为第个决定性维度的决定性程度；为决定性维度的数量；为当前工单数据的第个决定性维度的参考历史工单数据的平均密度；为第条历史工单数据的第个决定性维度的预测密度，当第条历史工单数据与当前工单数据的第个决定性维度的数值相同时，获取第条历史工单数据中除第个决定性维度外的每个决定性维度的数值与当前工单数据对应决定性维度的数值之间的差值绝对值，将得到的所有差值绝对值的均值作为第条历史工单数据的第个决定性维度的预测密度，当第条历史工单数据与当前工单数据的第个决定性维度的数值不相同时，将第条历史工单数据的第个决定性维度的预测密度设为1；为绝对值符号；为以自然常数为底的指数函数。

优选的，所述根据当前工单数据的同一时期的历史工单数据以及相似工单数据获取当前工单数据的冲突性程度，包括的具体步骤如下：

将时间阈值记为，将时间戳在当前工单数据的时间戳的前天到后天的所有历史工单数据作为当前工单数据的同一时期的历史工单数据；将当前工单数据的同一时期的历史工单数据的数量记为H；

获取当前工单数据的所有相似工单数据的每个决定性维度的所有数据，构成一个序列，记为当前工单数据的每个决定性维度的相似数据序列；构建1×(H+1)大小的滑动窗口，对当前工单数据的每个决定性维度的相似数据序列进行步长为1的滑动，将当前工单数据的每个决定性维度的相似数据序列划分为多个窗口，计算当前工单数据的每个决定性维度的相似数据序列的每个窗口内所有数值的和，作为每个窗口的代表值；将当前工单数据的每个决定性维度的所有窗口的代表值的均值作为每个决定性维度的相似均值；将当前工单数据的每个决定性维度的所有窗口的代表值的标准差作为每个决定性维度的相似标准差；将当前工单数据的每个决定性维度的相似均值以及相似标准差的和作为当前工单数据的每个决定性维度的基准波动值；

根据基准波动值以及当前工单数据的同一时期的历史工单数据获取当前工单数据的冲突性程度。

优选的，所述根据基准波动值以及当前工单数据的同一时期的历史工单数据获取当前工单数据的冲突性程度，包括的具体步骤如下：

其中，为当前工单数据的冲突性程度；为决定性维度的数量；为当前工单数据的第个决定性维度的相似均值；为当前工单数据的第个决定性维度的相似标准差；为当前工单数据的同一时期的所有历史工单数据的数量；为当前工单数据的同一时期的第个历史工单数据的第个决定性维度的数值；为当前工单数据的第个决定性维度的数值；为绝对值符号；为以自然常数为底的指数函数；表示当前工单数据的第个决定性维度的基准波动值。

优选的，所述根据当前工单数据与每条历史工单数据的相似性以及当前工单数据的冲突性程度获取聚类距离度量优化值，对所有工单数据聚类过程中的聚类距离进行优化校正，得到聚类结果，包括的具体步骤如下：

利用1减去当前工单数据的冲突性程度，将所得结果和当前工单数据与所有历史工单数据的相似性的均值相乘，得到聚类距离度量优化值；

根据所有决定性维度对每个历史工单数据进行PCA降维，将每个历史工单数据降维为三维数据，视作三维空间中的一个数据点；将当前工单数据转换为三维空间中的一个数据点，记为当前数据点；

对三维空间中得到的所有数据点进行K-Means聚类，在K-Means聚类过程中，在计算当前数据点到每个聚类中心的聚类距离时，根据聚类距离度量优化值对聚类距离进行优化，获取当前数据点到每个聚类中心的优化距离；

通过K-Means聚类不断迭代，得到最终的聚类结果。

优选的，所述根据聚类距离度量优化值对聚类距离进行优化，获取当前数据点到每个聚类中心的优化距离，包括的具体步骤如下：

其中为当前数据点到第个聚类中心的优化距离；为聚类距离度量优化值；为当前数据点到第个聚类中心的欧式距离；为以自然常数为底的指数函数。

优选的，所述根据聚类结果获取当前工单数据的异常程度，对当前工单数据进行处理，包括的具体步骤如下：

将当前数据点所属的聚簇作为目标聚簇；获取目标聚簇中距离目标聚簇的聚类中心最远的数据点与目标聚簇的聚类中心之间的欧式距离，作为目标聚簇的最远距离；将当前数据点到目标聚簇的聚类中心的优化距离与目标聚簇的最远距离的比值作为当前工单数据的异常程度；若当前工单数据的异常程度大于异常阈值，将当前工单数据作为异常工单，工作系统对当前工单数据进行异常工单预警。

本发明的技术方案的有益效果是：本发明采用自适应的K-Means聚类方法进行异常工单的检测，通过确定不同维度之间的数据组合的分布规律，来获取决定性维度，根据当前工单数据的决定性维度与历史工单数据对应的决定性维度数据之间的相似性特征，并结合相似时间内的工单数据之间的互相影响来获取工单数据对应的聚类距离度量优化值，进而在将工单数据转换为数据坐标点后进行K-Means聚类时，根据每个数据坐标点的聚类距离度量优化值对聚类距离进行校正，从而获取准确的异常工单检测结果，帮助企业进行针对性的优化调整，实现更加合理的资源分配。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的一种基于工作流引擎的业务工单流程处理方法的步骤流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种基于工作流引擎的业务工单流程处理方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种基于工作流引擎的业务工单流程处理方法的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种基于工作流引擎的业务工单流程处理方法的步骤流程图，该方法包括以下步骤：

S001．采集工单数据。

采集当前待处理的工单数据，记为当前工单数据。同时获取企业历史的工单数据，记为历史工单数据。

工单数据包括但不限于：工单时间戳、工单ID、处理时间、优先级、处理人员、处理状态、客户评价等级等数据，将其中每一项作为工单数据的一个维度。当工单数据的一个维度存在缺失值时，以0进行填充处理。为了便于后续分析，将工单数据的各个维度的数据进行数值化处理。

至此，获取了当前工单数据，以及历史工单数据。

S002．获取工单数据中的决定性维度。

需要说明的是，由于在进行K-Means聚类过程中，由于若仅根据工单数据本身的数据特征来进行聚类距离的度量，会使得一些和正常工单数据较为相似的异常工单数据被错误识别为正常工单数据，并且同时可能会使得正常工单被识别为异常工单数据，即由于聚类距离度量不合理使得得到的聚簇结果不准确，进而得到错误的异常工单检测结果。因此需要对每个工单数据进行聚类距离度量的优化，由于工单数据不同维度的数据之间存在较强的联系，例如客户评价等级维度的数据受到处理时间、优先级等维度的数据的影响，因此存在一些维度的数据的变化情况本质不是该维度的数据决定的，而是由与该维度具有较强联系的维度的数据的变化来决定的，因此在分析工单数据的聚类距离度量优化值时，首先需要根据不同维度之间的数据组合的规律分布，确定具有决定性的维度。

在本发明实施例中，将所有历史工单数据中同一个维度的所有数据按照工单时间戳从小到大的顺序构成一个序列，作为该维度的数据序列。计算任意两个维度的数据序列之间的皮尔逊相关系数，作为此两个维度之间的相关性值。

预设一个相关性阈值，其中本实施例以=0.58为例进行叙述，本实施例不进行具体限定，其中可根据具体实施情况而定。当两个维度之间的相关性值大于相关性阈值时，此两个维度具有相关性，当两个维度之间的相关性值小于相关性阈值时，此两个维度不具有相关性。

将任意一个维度作为目标维度，获取与目标维度具有相关性的所有维度。获取目标维度的数据序列中相同的数据视作同一种数据，获取目标维度的数据序列中出现的数据的种类数。

获取与目标维度相关的每个维度相对于目标维度的每种数据的随机性：

其中，为与目标维度相关的第个维度相对于目标维度的第种数据的随机性；为与目标维度相关的第个维度的数据序列中出现的数据的种类数；为目标维度的第种数据在与目标维度相关的第个维度的数据序列中对应的数据的种类数；为目标维度的第种数据在与目标维度相关的第个维度的数据序列中对应的每种数据出现的次数的方差，例如目标维度的数据序列为{1,1,2,1,3}，与目标维度相关的第个维度的数据序列为{2,3,3,2,5}时，目标维度的第1种数据“1”在与目标维度相关的第个维度的数据序列对应的数据为“2”,“3”,“2”，则目标维度的第1种数据在与目标维度相关的第个维度的数据序列中对应的数据的种类数为2。数据“2”出现的次数为2，“3”出现的次数为1，则目标维度的第1种数据在与目标维度相关的第个维度的数据序列中对应的每种数据出现的次数的方差为2和1之间的方差；若目标维度的第种数据在与目标维度相关的第个维度的数据序列中对应多种数据，且对应的每种数据的出现次数变化差异较大时，与目标维度相关的第个维度相对于目标维度的第种数据的随机性越大。

根据与目标维度相关的每个维度相对于目标维度的每种数据的随机性获取目标维度的决定性程度：

其中为目标维度的决定性程度；为与目标维度相关的第个维度和目标维度之间的相关性值；为与目标维度相关的所有维度和目标维度之间的相关性值中的最大值；为与目标维度相关的维度的数量；为与目标维度相关的第个维度相对于目标维度的第种数据的随机性；为目标维度的数据序列中出现的数据的种类数；表示与目标维度相关的第个维度和目标维度之间的相关性值的权重，若与目标维度相关的第个维度和目标维度之间的相关性值越大，则在计算目标维度的决定性程度时，与目标维度相关的第个维度相对于目标维度的每种数据的随机性对目标维度的表征能力就越大，此时越需要参考与目标维度相关的第个维度。

同理，获取每个维度的决定性程度，对所有维度的决定性程度进行线性归一化处理。

预设一个决定性阈值，其中本实施例以=0.65为例进行叙述，本实施例不进行具体限定，其中可根据具体实施情况而定。当一个维度线性归一化后的决定性程度大于决定性阈值时，将该维度作为决定性维度。

至此，获取了所有决定性维度。

S003．根据当前工单数据与历史工单数据的决定性维度获取聚类距离度量优化值。

需要说明的是，步骤S002获取了决定性维度，可根据决定性维度的数据分布情况来获取聚类距离度量优化值。工单数据中决定性维度的数据往往能指示这条工单的完成情况，例如一个处理人员在对应的历史工单数据中的完成情况体现了该处理人员的能力匹配情况，例如同一类型的历史工单数据所用的处理时间基本相同，即当前工单数据的一个维度与历史工单数据中相同维度的数据之间存在相似的情况时，才能表明当前工单数据对应的聚类距离度量优化值的大小。同时为了避免同一时期的工单数据在相似情况下出现冲突的情况，可以相似的历史工单数据为基准，计算同一时期的工单数据的冲突性来对聚类距离度量优化值进行校正。

在本发明实施例中，获取所有历史工单数据的第个决定性维度中，与当前工单数据的第个决定性维度的数值相同的所有历史工单数据，作为第个决定性维度的参考历史工单数据。将第个决定性维度的所有参考历史工单数据中除第个决定性维度外的每个决定性维度的所有数据构成一个序列，作为每个决定性维度的参考序列。获取每个决定性维度的参考序列中所有数据两两之间的差值绝对值，将所有数据两两之间的差值绝对值的均值作为每个决定性维度的参考序列的密度。获取第个决定性维度的所有参考历史工单数据中除第个决定性维度外的所有决定性维度的参考序列的密度的均值，作为第个决定性维度的所有参考历史工单数据的平均密度。

同理获取每个决定性维度的所有参考历史工单数据的平均密度。

获取当前工单数据与每条历史工单数据的相似性：

其中，为当前工单数据与第条历史工单数据的相似性；为第个决定性维度的决定性程度；为决定性维度的数量；为当前工单数据的第个决定性维度的参考历史工单数据的平均密度；为第条历史工单数据的第个决定性维度的预测密度，当第条历史工单数据与当前工单数据的第个决定性维度的数值相同时，获取第条历史工单数据中除第个决定性维度外的每个决定性维度的数值与当前工单数据对应决定性维度的数值之间的差值绝对值，将得到的所有差值绝对值的均值作为第条历史工单数据的第个决定性维度的预测密度，当第条历史工单数据与当前工单数据的第个决定性维度的数值不相同时，将第条历史工单数据的第个决定性维度的预测密度设为1；为绝对值符号；为以自然常数为底的指数函数；当前工单数据的第个决定性维度的参考历史工单数据的平均密度，与第条历史工单数据的第个决定性维度的预测密度之间的差异，若该差异值越大，则当前工单数据与第条历史工单数据之间的相似性越小；将第个决定性维度的决定性程度作为计算相似性时的第个决定性维度的相似性权重，若决定性维度的决定性程度较大，则该决定性维度的数据的变化在所有维度中的越重要，在计算当前工单数据和历史工单数据之间的相似性值时的相似性权重越大。

预设一个时间阈值，其中本实施例以=1为例进行叙述，本实施例不进行具体限定，其中可根据具体实施情况而定。将时间戳在当前工单数据的时间戳的前天到后天的所有历史工单数据作为当前工单数据的同一时期的历史工单数据。将当前工单数据的同一时期的历史工单数据的数量记为H。

预设一个相似性阈值，其中本实施例以=0.65为例进行叙述，本实施例不进行具体限定，其中可根据具体实施情况而定。将与当前工单数据的相似性大于相似性阈值的所有历史工单数据作为当前工单数据的相似工单数据。

获取当前工单数据的所有相似工单数据的每个决定性维度的数据，构成一个序列，记为当前工单数据的每个决定性维度的相似数据序列。构建1×(H+1)大小的滑动窗口，对当前工单数据的每个决定性维度的相似数据序列进行步长为1的滑动，将当前工单数据的每个决定性维度的相似数据序列划分为多个窗口，计算当前工单数据的每个决定性维度的相似数据序列的每个窗口内所有数值的和，作为每个窗口的代表值。将当前工单数据的每个决定性维度的所有窗口的代表值的均值作为每个决定性维度的相似均值。将当前工单数据的每个决定性维度的所有窗口的代表值的标准差作为每个决定性维度的相似标准差。将当前工单数据的每个决定性维度的相似均值以及相似标准差的和作为当前工单数据的每个决定性维度的基准波动值。

获取当前工单数据的冲突性程度：

其中，为当前工单数据的冲突性程度；为决定性维度的数量；为当前工单数据的第个决定性维度的相似均值；为当前工单数据的第个决定性维度的相似标准差；为当前工单数据的同一时期的所有历史工单数据的数量；为当前工单数据的同一时期的第个历史工单数据的第个决定性维度的数值；为当前工单数据的第个决定性维度的数值；为绝对值符号；为以自然常数为底的指数函数；表示当前工单数据的第个决定性维度的基准波动值；表示为当前工单数据的同一时期的所有历史工单数据的第个决定性维度的数值总和，则表征的在第个决定性维度的基准波动范围内剩余数据大小，用来表示当前工单数据的第个决定性维度最大预测数值，则表征的为在第个决定性维度的基准波动范围内当前工单数据的第个决定性维度的最大预测数值与实际数值的差异，当时，越大，说明当前工单数据的第个决定性维度的实际数值越处于第个决定性维度的基准波动范围内，此时当前工单数据的第个决定性维度的冲突程度越小，当若时，越小，说明当前工单数据的第个决定性维度的实际数值越超出了第个决定性维度的基准波动范围，此时当前工单数据的第个决定性维度的冲突程度越大。

获取聚类距离度量优化值：

其中，为聚类距离度量优化值；表示当前工单数据的冲突性程度；为当前工单数据与所有历史工单数据的相似性的均值；当前工单数据的冲突性程度越大，越需要对当前工单数据与所有历史工单数据的相似性的均值进行修正，使得当前工单数据与所有历史工单数据的相似性降低，得到聚类距离度量优化值。

至此，获取了聚类距离度量优化值。

S004．根据聚类距离度量优化值对聚类距离进行优化校正，获取聚类结果，识别当前工单数据异常情况。

根据所有决定性维度对每个历史工单数据进行PCA降维，将每个历史工单数据降维为三维数据，视作三维空间中的一个数据点。同理，将当前工单数据转换为三维空间中的一个数据点，记为当前数据点。

对三维空间中得到的所有数据点进行K-Means聚类，在K-Means聚类过程中，在计算当前数据点到每个聚类中心的聚类距离时，根据聚类距离度量优化值对聚类距离进行优化，获取当前数据点到每个聚类中心的优化距离：

其中为当前数据点到第个聚类中心的优化距离；为聚类距离度量优化值；为当前数据点到第个聚类中心的欧式距离；为以自然常数为底的指数函数。聚类距离度量优化值越大，则表明需要调整的当前工单数据对应的当前数据点与聚类中心的欧式距离越小。

通过K-Means聚类不断迭代，得到最终的聚类结果。将当前数据点所属的聚簇作为目标聚簇。获取目标聚簇中距离目标聚簇的聚类中心最远的数据点与目标聚簇的聚类中心之间的欧式距离，作为目标聚簇的最远距离。将当前数据点到目标聚簇的聚类中心的优化距离与目标聚簇的最远距离的比值作为当前工单数据的异常程度。

预设一个异常阈值，其中本实施例以=0.8为例进行叙述，本实施例不进行具体限定，其中可根据具体实施情况而定。若当前工单数据的异常程度大于异常阈值，当前工单数据可能为异常工单，此时工作系统对当前工单数据进行异常工单预警。

需要说明的是，本发明上述实施例中所用的公式和数学模型可能存在分母为0的情况，但是本发明实施例为了叙述简单易懂，因此没有对分母为0这种形况进行处理；在具体实施时将分子分母同时加一即可避免分母为0的不可实施的情况。

通过以上步骤，完成了业务工单的异常识别。

本发明实施例采用自适应的K-Means聚类方法进行异常工单的检测，通过确定不同维度之间的数据组合的分布规律，来获取决定性维度，根据当前工单数据的决定性维度与历史工单数据对应的决定性维度数据之间的相似性特征，并结合相似时间内的工单数据之间的互相影响来获取工单数据对应的聚类距离度量优化值，进而在将工单数据转换为数据坐标点后进行K-Means聚类时，根据每个数据坐标点的聚类距离度量优化值对聚类距离进行校正，从而获取准确的异常工单检测结果，帮助企业进行针对性的优化调整，实现更加合理的资源分配。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于工作流引擎的业务工单流程处理方法，其特征在于，该方法包括以下步骤：

采集当前工单数据以及历史工单数据；

2.根据权利要求1所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据每个维度的数据序列获取所有决定性维度，包括的具体步骤如下：

将与目标维度相关的第个维度的数据序列中出现的数据的种类数和目标维度的第/>种数据在与目标维度相关的第/>个维度的数据序列中对应的数据的种类数的比值作为第一比值，获取目标维度的第/>种数据在与目标维度相关的第/>个维度的数据序列中对应的每种数据出现的次数的方差，将该方差与第一比值的积作为与目标维度相关的第/>个维度相对于目标维度的第/>种数据的随机性；

3.根据权利要求2所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据与目标维度相关的每个维度相对于目标维度的每种数据的随机性获取目标维度的决定性程度，包括的具体步骤如下：其中/>为目标维度的决定性程度；/>为与目标维度相关的第/>个维度和目标维度之间的相关性值；/>为与目标维度相关的所有维度和目标维度之间的相关性值中的最大值；/>为与目标维度相关的维度的数量；/>为与目标维度相关的第/>个维度相对于目标维度的第/>种数据的随机性；/>为目标维度的数据序列中出现的数据的种类数。

4.根据权利要求1所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据当前工单数据与每条历史工单数据的相似性，获取当前工单数据的相似工单数据，包括的具体步骤如下：

5.根据权利要求4所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述获取当前工单数据与每条历史工单数据的相似性，包括的具体步骤如下：其中，/>为当前工单数据与第/>条历史工单数据的相似性；为第/>个决定性维度的决定性程度；/>为决定性维度的数量；/>为当前工单数据的第/>个决定性维度的参考历史工单数据的平均密度；/>为第/>条历史工单数据的第/>个决定性维度的预测密度，当第/>条历史工单数据与当前工单数据的第/>个决定性维度的数值相同时，获取第/>条历史工单数据中除第/>个决定性维度外的每个决定性维度的数值与当前工单数据对应决定性维度的数值之间的差值绝对值，将得到的所有差值绝对值的均值作为第/>条历史工单数据的第/>个决定性维度的预测密度，当第/>条历史工单数据与当前工单数据的第/>个决定性维度的数值不相同时，将第/>条历史工单数据的第/>个决定性维度的预测密度设为1；/>为绝对值符号；/>为以自然常数为底的指数函数。

6.根据权利要求1所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据当前工单数据的同一时期的历史工单数据以及相似工单数据获取当前工单数据的冲突性程度，包括的具体步骤如下：

将时间阈值记为，将时间戳在当前工单数据的时间戳的前/>天到后/>天的所有历史工单数据作为当前工单数据的同一时期的历史工单数据；将当前工单数据的同一时期的历史工单数据的数量记为H；

7.根据权利要求6所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据基准波动值以及当前工单数据的同一时期的历史工单数据获取当前工单数据的冲突性程度，包括的具体步骤如下：其中，为当前工单数据的冲突性程度；/>为决定性维度的数量；/>为当前工单数据的第/>个决定性维度的相似均值；/>为当前工单数据的第/>个决定性维度的相似标准差；/>为当前工单数据的同一时期的所有历史工单数据的数量；/>为当前工单数据的同一时期的第/>个历史工单数据的第/>个决定性维度的数值；/>为当前工单数据的第/>个决定性维度的数值；/>为绝对值符号；/>为以自然常数为底的指数函数；/>表示当前工单数据的第/>个决定性维度的基准波动值。

8.根据权利要求1所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据当前工单数据与每条历史工单数据的相似性以及当前工单数据的冲突性程度获取聚类距离度量优化值，对所有工单数据聚类过程中的聚类距离进行优化校正，得到聚类结果，包括的具体步骤如下：

通过K-Means聚类不断迭代，得到最终的聚类结果。

9.根据权利要求8所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据聚类距离度量优化值对聚类距离进行优化，获取当前数据点到每个聚类中心的优化距离，包括的具体步骤如下：其中/>为当前数据点到第/>个聚类中心的优化距离；/>为聚类距离度量优化值；/>为当前数据点到第/>个聚类中心的欧式距离；/>为以自然常数为底的指数函数。

10.根据权利要求1所述的一种基于工作流引擎的业务工单流程处理方法，其特征在于，所述根据聚类结果获取当前工单数据的异常程度，对当前工单数据进行处理，包括的具体步骤如下：