CN114816680A - 一种基于cpu-gpu架构的业务流程模型发现方法 - Google Patents
一种基于cpu-gpu架构的业务流程模型发现方法 Download PDFInfo
- Publication number
- CN114816680A CN114816680A CN202210232842.4A CN202210232842A CN114816680A CN 114816680 A CN114816680 A CN 114816680A CN 202210232842 A CN202210232842 A CN 202210232842A CN 114816680 A CN114816680 A CN 114816680A
- Authority
- CN
- China
- Prior art keywords
- cpu
- gpu
- process model
- sub
- business process
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000001939 inductive effect Effects 0.000 claims description 3
- 238000005065 mining Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/465—Distributed object oriented systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
Abstract
本发明提出一种基于CPU‑GPU架构的业务流程模型发现方法,包括,将事件日志从CPU拷贝到GPU中;将事件日志分为多个子日志;GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图;将线程中的所有子直接跟随图合并成为一个最终的直接跟随图;将最终的直接跟随图从GPU拷贝到CPU中,CPU将所述直接跟随图转换为流程模型。本发明充分利用GPU的大规模并行计算的特点,实现流程模型发现的高并行执行,加快业务流程模型发现的速度。其架构相比于分布式系统占据的计算机资源更小。
Description
技术领域
本发明涉及流程挖掘领域,具体为一种基于CPU-GPU架构的业务流程模型发现方法。
背景技术
流程挖掘是一门相对年轻的研究学科,它一方面位于机器学习和数据挖掘之间,另一方面又位于过程建模和分析中。流程挖掘的理念是通过从事件日志中提取出知识,从而发现、监控和改进实际过程。
业务流程模型发现是流程挖掘的三种主要类型之一,它可以将一个不包括任何先验信息的事件日志转换为一个流程模型,然后用户可以通过流程模型解释该事件日志的行为,给组织带来了许多潜在的好处,如:降低成本、增加透明度、改善客户体验等。但随着数据量的剧增,算法的性能迎来了巨大的挑战。
现有技术公开了基于CPU的顺序或者多线程业务流程模型发现技术,其局限性在于:
并行执行度有限,大数据场景下,性能低,模型发现时间长。业务流程模型发现算法原先采用CPU串行处理事件日志的方法,在碰到大数据量的时候,会导致时间花销过大。
基于分布式的业务流程模型发现技术,其局限性在于:
通过分布式系统可以实现多台服务器协同工作同时处理事件日志,有效地利用数据的并行性,实现高性能。然而,它们的计算是在 CPU上进行的,资源消耗大且它们的并行度可能仍然受到可用计算资源的限制。在实现并行化的时候要考虑计算机资源的花销,如分布式系统处理事件日志时占用的资源过大。即使是集群,其并行度仍然有限。例如,每台服务器的CPU支持16线程,100台服务器的集群并行度是1600,而一个普通GPU例如RTX4000的并行度就可以达到 2304。
发明内容
针对现有技术中存在的缺陷,解决业务流程模型发现算法原先采用CPU串行处理事件日志的方法,在碰到大数据量的时候,会导致时间花销过大的问题。
本发明提出一种基于CPU-GPU架构的业务流程模型发现方法。
为达到以上目的,本发明采取的技术方案是:
第一方面,提供了一种基于CPU-GPU架构的业务流程模型发现方法,
包括以下步骤:
S1:将事件日志从CPU拷贝到GPU中
S2:将事件日志分为多个子日志
S3:GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图
S4:将线程中的所有子直接跟随图合并成为一个最终的直接跟随图
S5:将最终的直接跟随图从GPU拷贝到CPU中。
在上述方案的基础上,所述S5还包括:CPU将所述直接跟随图转换为流程模型。
在上述方案的基础上,所述子直接跟随图为简单有向图。
在上述方案的基础上,使用Alpha Miner、Inductive Miner、 FlexibleHeuristics Miner算法执行。
第二方面,提供一种基于上述方案的处理架构。
第三方面,提供一种基于上述方案的数据处理装置,包括CPU、 GPU以及上述的一种处理架构。
本发明的有益效果:
本发明所述的基于CPU-GPU架构的业务流程模型发现方法,充分利用GPU(图像处理器)的大规模并行计算的特点,实现流程模型发现的高并行执行,加快业务流程模型发现的速度。其CPU-GPU架构相比于分布式系统占据的计算机资源更小。
附图说明
本发明有如下附图:
图1基于CPU-GPU架构的业务流程模型原理图。
具体实施方式
以下结合图1对本发明作进一步详细说明。
如附图所示,一种基于CPU-GPU架构的业务流程模型发现方法,
包括以下步骤:
S1:将事件日志从CPU拷贝到GPU中
S2:将事件日志分为多个子日志
S3:GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图
S4:将线程中的所有子直接跟随图合并成为一个最终的直接跟随图
S5:将最终的直接跟随图从GPU拷贝到CPU中。
S5还包括:CPU将直接跟随图转换为流程模型。
子直接跟随图为简单有向图。
上述方案使用Alpha Miner、Inductive Miner、Flexible Heuristics Miner算法执行。
在上述方案的基础上,提供一种基于上述方案的处理架构。
在上述方案的基础上,提供一种基于上述方案的数据处理装置,包括CPU、GPU以及上述的一种处理架构。
以上实施方式仅用于说明本发明专利,而并非对本发明专利的限制,有关技术领域的普通技术人员,在不脱离本发明专利的实质和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明专利的范畴,本发明专利的专利保护范围应由权利要求限定。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (6)
1.一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,
包括以下步骤:
S1:将事件日志从CPU拷贝到GPU中;
S2:将事件日志分为多个子日志;
S3:GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图;
S4:将线程中的所有子直接跟随图合并成为一个最终的直接跟随图;
S5:将最终的直接跟随图从GPU拷贝到CPU中。
2.如权利要求1所述一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,所述S5还包括:CPU将所述直接跟随图转换为流程模型。
3.如权利要求1所述一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,所述子直接跟随图为简单有向图。
4.如权利要求1-3任意一项所述一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,使用Alpha Miner、Inductive Miner、Flexible Heuristics Miner算法执行。
5.一种处理架构,其特征在于,包含权利要求1-3任意一项所述一种基于CPU-GPU架构的业务流程模型发现方法。
6.一种数据处理装置,其特征在于,包含CPU、GPU以及权利要求5所述的一种处理架构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210232842.4A CN114816680A (zh) | 2022-03-09 | 2022-03-09 | 一种基于cpu-gpu架构的业务流程模型发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210232842.4A CN114816680A (zh) | 2022-03-09 | 2022-03-09 | 一种基于cpu-gpu架构的业务流程模型发现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114816680A true CN114816680A (zh) | 2022-07-29 |
Family
ID=82529481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210232842.4A Pending CN114816680A (zh) | 2022-03-09 | 2022-03-09 | 一种基于cpu-gpu架构的业务流程模型发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114816680A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011162628A2 (en) * | 2010-06-26 | 2011-12-29 | Paulo Jorge Pimenta Marques | Apparatus and method for data stream processing using massively parallel processors |
CN103559016A (zh) * | 2013-10-23 | 2014-02-05 | 江西理工大学 | 一种基于图形处理器并行计算的频繁子图挖掘方法 |
US20150169304A1 (en) * | 2013-12-17 | 2015-06-18 | International Business Machines Corporation | Adaptable and Extensible Runtime and System for Heterogeneous Computer Systems |
CN105900064A (zh) * | 2014-11-19 | 2016-08-24 | 华为技术有限公司 | 调度数据流任务的方法和装置 |
WO2017173972A1 (zh) * | 2016-04-06 | 2017-10-12 | 中兴通讯股份有限公司 | 流程跟踪方法及装置、存储介质 |
CN111049918A (zh) * | 2019-12-19 | 2020-04-21 | 国网冀北电力有限公司信息通信分公司 | 一种物联网的通信建立方法及装置 |
-
2022
- 2022-03-09 CN CN202210232842.4A patent/CN114816680A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011162628A2 (en) * | 2010-06-26 | 2011-12-29 | Paulo Jorge Pimenta Marques | Apparatus and method for data stream processing using massively parallel processors |
CN103559016A (zh) * | 2013-10-23 | 2014-02-05 | 江西理工大学 | 一种基于图形处理器并行计算的频繁子图挖掘方法 |
US20150169304A1 (en) * | 2013-12-17 | 2015-06-18 | International Business Machines Corporation | Adaptable and Extensible Runtime and System for Heterogeneous Computer Systems |
CN105900064A (zh) * | 2014-11-19 | 2016-08-24 | 华为技术有限公司 | 调度数据流任务的方法和装置 |
WO2017173972A1 (zh) * | 2016-04-06 | 2017-10-12 | 中兴通讯股份有限公司 | 流程跟踪方法及装置、存储介质 |
CN111049918A (zh) * | 2019-12-19 | 2020-04-21 | 国网冀北电力有限公司信息通信分公司 | 一种物联网的通信建立方法及装置 |
Non-Patent Citations (3)
Title |
---|
李龚亮等: "基于图形处理器的并行遗传过程挖掘", 《电子科技大学学报》 * |
陈文斌等: "基于GPU/CPU混合架构的流程序多粒度划分与调度方法研究", 《计算机工程与科学》 * |
鲁法明等: "一种并行化的启发式流程挖掘算法", 《软件学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110134636B (zh) | 模型训练方法、服务器和计算机可读存储介质 | |
Singh et al. | A survey on platforms for big data analytics | |
Elser et al. | An evaluation study of bigdata frameworks for graph processing | |
US7979674B2 (en) | Re-executing launcher program upon termination of launched programs in MIMD mode booted SIMD partitions | |
Li et al. | Map-Balance-Reduce: An improved parallel programming model for load balancing of MapReduce | |
US8566837B2 (en) | Dynamic run time allocation of distributed jobs with application specific metrics | |
US10402223B1 (en) | Scheduling hardware resources for offloading functions in a heterogeneous computing system | |
US10970805B2 (en) | Graphics processing unit operation | |
US9836516B2 (en) | Parallel scanners for log based replication | |
CN103310460A (zh) | 图像特征提取的方法及系统 | |
CN112162854A (zh) | 一种cpu-gpu间计算任务调度方法、系统及介质 | |
Song et al. | Bridging the semantic gaps of GPU acceleration for scale-out CNN-based big data processing: Think big, see small | |
KR20160099762A (ko) | 자동 분산병렬 처리 하둡 시스템을 지원하는 클라우드 시스템 | |
Chen et al. | Pipelined multi-gpu mapreduce for big-data processing | |
Han et al. | Distme: A fast and elastic distributed matrix computation engine using gpus | |
CN107066205B (zh) | 一种数据存储系统 | |
CN111858569A (zh) | 基于流式计算的海量数据清洗的方法 | |
CN109412865B (zh) | 一种虚拟网络资源分配方法、系统及电子设备 | |
CN111914987A (zh) | 基于神经网络的数据处理方法及装置、设备和可读介质 | |
Dai et al. | Research and implementation of big data preprocessing system based on Hadoop | |
Senthilkumar et al. | An efficient FP-Growth based association rule mining algorithm using Hadoop MapReduce | |
CN108319604B (zh) | 一种hive中大小表关联的优化方法 | |
CN1851652A (zh) | 嵌入式sram操作系统进程优先级轮转调度的实现方法 | |
CN114816680A (zh) | 一种基于cpu-gpu架构的业务流程模型发现方法 | |
CN112241289B (zh) | 一种文本数据的处理方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220729 |