CN114816680A - 一种基于cpu-gpu架构的业务流程模型发现方法 - Google Patents

一种基于cpu-gpu架构的业务流程模型发现方法 Download PDF

Info

Publication number
CN114816680A
CN114816680A CN202210232842.4A CN202210232842A CN114816680A CN 114816680 A CN114816680 A CN 114816680A CN 202210232842 A CN202210232842 A CN 202210232842A CN 114816680 A CN114816680 A CN 114816680A
Authority
CN
China
Prior art keywords
cpu
gpu
process model
sub
business process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210232842.4A
Other languages
English (en)
Inventor
程龙
李建彬
吴思行
毛徐晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN202210232842.4A priority Critical patent/CN114816680A/zh
Publication of CN114816680A publication Critical patent/CN114816680A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/465Distributed object oriented systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Abstract

本发明提出一种基于CPU‑GPU架构的业务流程模型发现方法,包括,将事件日志从CPU拷贝到GPU中;将事件日志分为多个子日志;GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图;将线程中的所有子直接跟随图合并成为一个最终的直接跟随图;将最终的直接跟随图从GPU拷贝到CPU中,CPU将所述直接跟随图转换为流程模型。本发明充分利用GPU的大规模并行计算的特点,实现流程模型发现的高并行执行,加快业务流程模型发现的速度。其架构相比于分布式系统占据的计算机资源更小。

Description

一种基于CPU-GPU架构的业务流程模型发现方法
技术领域
本发明涉及流程挖掘领域,具体为一种基于CPU-GPU架构的业务流程模型发现方法。
背景技术
流程挖掘是一门相对年轻的研究学科,它一方面位于机器学习和数据挖掘之间,另一方面又位于过程建模和分析中。流程挖掘的理念是通过从事件日志中提取出知识,从而发现、监控和改进实际过程。
业务流程模型发现是流程挖掘的三种主要类型之一,它可以将一个不包括任何先验信息的事件日志转换为一个流程模型,然后用户可以通过流程模型解释该事件日志的行为,给组织带来了许多潜在的好处,如:降低成本、增加透明度、改善客户体验等。但随着数据量的剧增,算法的性能迎来了巨大的挑战。
现有技术公开了基于CPU的顺序或者多线程业务流程模型发现技术,其局限性在于:
并行执行度有限,大数据场景下,性能低,模型发现时间长。业务流程模型发现算法原先采用CPU串行处理事件日志的方法,在碰到大数据量的时候,会导致时间花销过大。
基于分布式的业务流程模型发现技术,其局限性在于:
通过分布式系统可以实现多台服务器协同工作同时处理事件日志,有效地利用数据的并行性,实现高性能。然而,它们的计算是在 CPU上进行的,资源消耗大且它们的并行度可能仍然受到可用计算资源的限制。在实现并行化的时候要考虑计算机资源的花销,如分布式系统处理事件日志时占用的资源过大。即使是集群,其并行度仍然有限。例如,每台服务器的CPU支持16线程,100台服务器的集群并行度是1600,而一个普通GPU例如RTX4000的并行度就可以达到 2304。
发明内容
针对现有技术中存在的缺陷,解决业务流程模型发现算法原先采用CPU串行处理事件日志的方法,在碰到大数据量的时候,会导致时间花销过大的问题。
本发明提出一种基于CPU-GPU架构的业务流程模型发现方法。
为达到以上目的,本发明采取的技术方案是:
第一方面,提供了一种基于CPU-GPU架构的业务流程模型发现方法,
包括以下步骤:
S1:将事件日志从CPU拷贝到GPU中
S2:将事件日志分为多个子日志
S3:GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图
S4:将线程中的所有子直接跟随图合并成为一个最终的直接跟随图
S5:将最终的直接跟随图从GPU拷贝到CPU中。
在上述方案的基础上,所述S5还包括:CPU将所述直接跟随图转换为流程模型。
在上述方案的基础上,所述子直接跟随图为简单有向图。
在上述方案的基础上,使用Alpha Miner、Inductive Miner、 FlexibleHeuristics Miner算法执行。
第二方面,提供一种基于上述方案的处理架构。
第三方面,提供一种基于上述方案的数据处理装置,包括CPU、 GPU以及上述的一种处理架构。
本发明的有益效果:
本发明所述的基于CPU-GPU架构的业务流程模型发现方法,充分利用GPU(图像处理器)的大规模并行计算的特点,实现流程模型发现的高并行执行,加快业务流程模型发现的速度。其CPU-GPU架构相比于分布式系统占据的计算机资源更小。
附图说明
本发明有如下附图:
图1基于CPU-GPU架构的业务流程模型原理图。
具体实施方式
以下结合图1对本发明作进一步详细说明。
如附图所示,一种基于CPU-GPU架构的业务流程模型发现方法,
包括以下步骤:
S1:将事件日志从CPU拷贝到GPU中
S2:将事件日志分为多个子日志
S3:GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图
S4:将线程中的所有子直接跟随图合并成为一个最终的直接跟随图
S5:将最终的直接跟随图从GPU拷贝到CPU中。
S5还包括:CPU将直接跟随图转换为流程模型。
子直接跟随图为简单有向图。
上述方案使用Alpha Miner、Inductive Miner、Flexible Heuristics Miner算法执行。
在上述方案的基础上,提供一种基于上述方案的处理架构。
在上述方案的基础上,提供一种基于上述方案的数据处理装置,包括CPU、GPU以及上述的一种处理架构。
以上实施方式仅用于说明本发明专利,而并非对本发明专利的限制,有关技术领域的普通技术人员,在不脱离本发明专利的实质和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明专利的范畴,本发明专利的专利保护范围应由权利要求限定。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (6)

1.一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,
包括以下步骤:
S1:将事件日志从CPU拷贝到GPU中;
S2:将事件日志分为多个子日志;
S3:GPU中的一个线程调用一个子日志,将子日志转换为一个子直接跟随图;
S4:将线程中的所有子直接跟随图合并成为一个最终的直接跟随图;
S5:将最终的直接跟随图从GPU拷贝到CPU中。
2.如权利要求1所述一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,所述S5还包括:CPU将所述直接跟随图转换为流程模型。
3.如权利要求1所述一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,所述子直接跟随图为简单有向图。
4.如权利要求1-3任意一项所述一种基于CPU-GPU架构的业务流程模型发现方法,其特征在于,使用Alpha Miner、Inductive Miner、Flexible Heuristics Miner算法执行。
5.一种处理架构,其特征在于,包含权利要求1-3任意一项所述一种基于CPU-GPU架构的业务流程模型发现方法。
6.一种数据处理装置,其特征在于,包含CPU、GPU以及权利要求5所述的一种处理架构。
CN202210232842.4A 2022-03-09 2022-03-09 一种基于cpu-gpu架构的业务流程模型发现方法 Pending CN114816680A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210232842.4A CN114816680A (zh) 2022-03-09 2022-03-09 一种基于cpu-gpu架构的业务流程模型发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210232842.4A CN114816680A (zh) 2022-03-09 2022-03-09 一种基于cpu-gpu架构的业务流程模型发现方法

Publications (1)

Publication Number Publication Date
CN114816680A true CN114816680A (zh) 2022-07-29

Family

ID=82529481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210232842.4A Pending CN114816680A (zh) 2022-03-09 2022-03-09 一种基于cpu-gpu架构的业务流程模型发现方法

Country Status (1)

Country Link
CN (1) CN114816680A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011162628A2 (en) * 2010-06-26 2011-12-29 Paulo Jorge Pimenta Marques Apparatus and method for data stream processing using massively parallel processors
CN103559016A (zh) * 2013-10-23 2014-02-05 江西理工大学 一种基于图形处理器并行计算的频繁子图挖掘方法
US20150169304A1 (en) * 2013-12-17 2015-06-18 International Business Machines Corporation Adaptable and Extensible Runtime and System for Heterogeneous Computer Systems
CN105900064A (zh) * 2014-11-19 2016-08-24 华为技术有限公司 调度数据流任务的方法和装置
WO2017173972A1 (zh) * 2016-04-06 2017-10-12 中兴通讯股份有限公司 流程跟踪方法及装置、存储介质
CN111049918A (zh) * 2019-12-19 2020-04-21 国网冀北电力有限公司信息通信分公司 一种物联网的通信建立方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011162628A2 (en) * 2010-06-26 2011-12-29 Paulo Jorge Pimenta Marques Apparatus and method for data stream processing using massively parallel processors
CN103559016A (zh) * 2013-10-23 2014-02-05 江西理工大学 一种基于图形处理器并行计算的频繁子图挖掘方法
US20150169304A1 (en) * 2013-12-17 2015-06-18 International Business Machines Corporation Adaptable and Extensible Runtime and System for Heterogeneous Computer Systems
CN105900064A (zh) * 2014-11-19 2016-08-24 华为技术有限公司 调度数据流任务的方法和装置
WO2017173972A1 (zh) * 2016-04-06 2017-10-12 中兴通讯股份有限公司 流程跟踪方法及装置、存储介质
CN111049918A (zh) * 2019-12-19 2020-04-21 国网冀北电力有限公司信息通信分公司 一种物联网的通信建立方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李龚亮等: "基于图形处理器的并行遗传过程挖掘", 《电子科技大学学报》 *
陈文斌等: "基于GPU/CPU混合架构的流程序多粒度划分与调度方法研究", 《计算机工程与科学》 *
鲁法明等: "一种并行化的启发式流程挖掘算法", 《软件学报》 *

Similar Documents

Publication Publication Date Title
CN110134636B (zh) 模型训练方法、服务器和计算机可读存储介质
Singh et al. A survey on platforms for big data analytics
Elser et al. An evaluation study of bigdata frameworks for graph processing
US7979674B2 (en) Re-executing launcher program upon termination of launched programs in MIMD mode booted SIMD partitions
Li et al. Map-Balance-Reduce: An improved parallel programming model for load balancing of MapReduce
US8566837B2 (en) Dynamic run time allocation of distributed jobs with application specific metrics
US10402223B1 (en) Scheduling hardware resources for offloading functions in a heterogeneous computing system
US10970805B2 (en) Graphics processing unit operation
US9836516B2 (en) Parallel scanners for log based replication
CN103310460A (zh) 图像特征提取的方法及系统
CN112162854A (zh) 一种cpu-gpu间计算任务调度方法、系统及介质
Song et al. Bridging the semantic gaps of GPU acceleration for scale-out CNN-based big data processing: Think big, see small
KR20160099762A (ko) 자동 분산병렬 처리 하둡 시스템을 지원하는 클라우드 시스템
Chen et al. Pipelined multi-gpu mapreduce for big-data processing
Han et al. Distme: A fast and elastic distributed matrix computation engine using gpus
CN107066205B (zh) 一种数据存储系统
CN111858569A (zh) 基于流式计算的海量数据清洗的方法
CN109412865B (zh) 一种虚拟网络资源分配方法、系统及电子设备
CN111914987A (zh) 基于神经网络的数据处理方法及装置、设备和可读介质
Dai et al. Research and implementation of big data preprocessing system based on Hadoop
Senthilkumar et al. An efficient FP-Growth based association rule mining algorithm using Hadoop MapReduce
CN108319604B (zh) 一种hive中大小表关联的优化方法
CN1851652A (zh) 嵌入式sram操作系统进程优先级轮转调度的实现方法
CN114816680A (zh) 一种基于cpu-gpu架构的业务流程模型发现方法
CN112241289B (zh) 一种文本数据的处理方法和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220729