CN114816680A

CN114816680A - 一种基于cpu-gpu架构的业务流程模型发现方法

Info

Publication number: CN114816680A
Application number: CN202210232842.4A
Authority: CN
Inventors: 程龙; 李建彬; 吴思行; 毛徐晗
Original assignee: North China Electric Power University
Current assignee: North China Electric Power University
Priority date: 2022-03-09
Filing date: 2022-03-09
Publication date: 2022-07-29

Abstract

本发明提出一种基于CPU‑GPU架构的业务流程模型发现方法，包括，将事件日志从CPU拷贝到GPU中；将事件日志分为多个子日志；GPU中的一个线程调用一个子日志，将子日志转换为一个子直接跟随图；将线程中的所有子直接跟随图合并成为一个最终的直接跟随图；将最终的直接跟随图从GPU拷贝到CPU中，CPU将所述直接跟随图转换为流程模型。本发明充分利用GPU的大规模并行计算的特点，实现流程模型发现的高并行执行，加快业务流程模型发现的速度。其架构相比于分布式系统占据的计算机资源更小。

Description

一种基于CPU-GPU架构的业务流程模型发现方法

技术领域

本发明涉及流程挖掘领域，具体为一种基于CPU-GPU架构的业务流程模型发现方法。

背景技术

流程挖掘是一门相对年轻的研究学科，它一方面位于机器学习和数据挖掘之间，另一方面又位于过程建模和分析中。流程挖掘的理念是通过从事件日志中提取出知识，从而发现、监控和改进实际过程。

业务流程模型发现是流程挖掘的三种主要类型之一，它可以将一个不包括任何先验信息的事件日志转换为一个流程模型，然后用户可以通过流程模型解释该事件日志的行为，给组织带来了许多潜在的好处，如：降低成本、增加透明度、改善客户体验等。但随着数据量的剧增，算法的性能迎来了巨大的挑战。

现有技术公开了基于CPU的顺序或者多线程业务流程模型发现技术，其局限性在于：

并行执行度有限，大数据场景下，性能低，模型发现时间长。业务流程模型发现算法原先采用CPU串行处理事件日志的方法，在碰到大数据量的时候，会导致时间花销过大。

基于分布式的业务流程模型发现技术，其局限性在于：

通过分布式系统可以实现多台服务器协同工作同时处理事件日志，有效地利用数据的并行性，实现高性能。然而，它们的计算是在 CPU上进行的，资源消耗大且它们的并行度可能仍然受到可用计算资源的限制。在实现并行化的时候要考虑计算机资源的花销，如分布式系统处理事件日志时占用的资源过大。即使是集群，其并行度仍然有限。例如，每台服务器的CPU支持16线程，100台服务器的集群并行度是1600，而一个普通GPU例如RTX4000的并行度就可以达到 2304。

发明内容

针对现有技术中存在的缺陷，解决业务流程模型发现算法原先采用CPU串行处理事件日志的方法，在碰到大数据量的时候，会导致时间花销过大的问题。

本发明提出一种基于CPU-GPU架构的业务流程模型发现方法。

为达到以上目的，本发明采取的技术方案是：

第一方面，提供了一种基于CPU-GPU架构的业务流程模型发现方法，

包括以下步骤：

S1：将事件日志从CPU拷贝到GPU中

S2：将事件日志分为多个子日志

S3：GPU中的一个线程调用一个子日志，将子日志转换为一个子直接跟随图

S4：将线程中的所有子直接跟随图合并成为一个最终的直接跟随图

S5：将最终的直接跟随图从GPU拷贝到CPU中。

在上述方案的基础上，所述S5还包括：CPU将所述直接跟随图转换为流程模型。

在上述方案的基础上，所述子直接跟随图为简单有向图。

在上述方案的基础上，使用Alpha Miner、Inductive Miner、 FlexibleHeuristics Miner算法执行。

第二方面，提供一种基于上述方案的处理架构。

第三方面，提供一种基于上述方案的数据处理装置，包括CPU、 GPU以及上述的一种处理架构。

本发明的有益效果：

本发明所述的基于CPU-GPU架构的业务流程模型发现方法，充分利用GPU(图像处理器)的大规模并行计算的特点，实现流程模型发现的高并行执行，加快业务流程模型发现的速度。其CPU-GPU架构相比于分布式系统占据的计算机资源更小。

附图说明

本发明有如下附图：

图1基于CPU-GPU架构的业务流程模型原理图。

具体实施方式

以下结合图1对本发明作进一步详细说明。

如附图所示，一种基于CPU-GPU架构的业务流程模型发现方法，

包括以下步骤：

S1：将事件日志从CPU拷贝到GPU中

S2：将事件日志分为多个子日志

S5：将最终的直接跟随图从GPU拷贝到CPU中。

S5还包括：CPU将直接跟随图转换为流程模型。

子直接跟随图为简单有向图。

上述方案使用Alpha Miner、Inductive Miner、Flexible Heuristics Miner算法执行。

在上述方案的基础上，提供一种基于上述方案的处理架构。

在上述方案的基础上，提供一种基于上述方案的数据处理装置，包括CPU、GPU以及上述的一种处理架构。

以上实施方式仅用于说明本发明专利，而并非对本发明专利的限制，有关技术领域的普通技术人员，在不脱离本发明专利的实质和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明专利的范畴，本发明专利的专利保护范围应由权利要求限定。

本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于CPU-GPU架构的业务流程模型发现方法，其特征在于，

包括以下步骤：

S1：将事件日志从CPU拷贝到GPU中；

S2：将事件日志分为多个子日志；

S3：GPU中的一个线程调用一个子日志，将子日志转换为一个子直接跟随图；

S4：将线程中的所有子直接跟随图合并成为一个最终的直接跟随图；

S5：将最终的直接跟随图从GPU拷贝到CPU中。

2.如权利要求1所述一种基于CPU-GPU架构的业务流程模型发现方法，其特征在于，所述S5还包括：CPU将所述直接跟随图转换为流程模型。

3.如权利要求1所述一种基于CPU-GPU架构的业务流程模型发现方法，其特征在于，所述子直接跟随图为简单有向图。

4.如权利要求1-3任意一项所述一种基于CPU-GPU架构的业务流程模型发现方法，其特征在于，使用Alpha Miner、Inductive Miner、Flexible Heuristics Miner算法执行。

5.一种处理架构，其特征在于，包含权利要求1-3任意一项所述一种基于CPU-GPU架构的业务流程模型发现方法。

6.一种数据处理装置，其特征在于，包含CPU、GPU以及权利要求5所述的一种处理架构。