CN114816926A - 流程监控方法和预测点筛选方法、装置、设备和存储介质 - Google Patents
流程监控方法和预测点筛选方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN114816926A CN114816926A CN202210478229.0A CN202210478229A CN114816926A CN 114816926 A CN114816926 A CN 114816926A CN 202210478229 A CN202210478229 A CN 202210478229A CN 114816926 A CN114816926 A CN 114816926A
- Authority
- CN
- China
- Prior art keywords
- importance
- point
- event
- prediction
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 132
- 230000008569 process Effects 0.000 title claims abstract description 85
- 238000012216 screening Methods 0.000 title claims abstract description 46
- 238000012544 monitoring process Methods 0.000 title claims abstract description 21
- 230000000694 effects Effects 0.000 claims abstract description 46
- 239000013598 vector Substances 0.000 claims abstract description 44
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 239000002699 waste material Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种流程监控方法和预测点筛选方法、装置、设备和存储介质,涉及流程监控技术领域。其中,这种预测点筛选方法包含步骤S1至S5。S1获取待监控流程的原始数据集和Petri网模型。S2对原始数据集进行全局特征编码,获取特征向量集。S3获取预测目标,并根据预测目标和特征向量集,通过XGBoost模型计算得到各个事件属性的重要性。S4根据各个事件属性的重要性,获取Petri网模型中各个活动点的重要性。S5获取阈值,并根据阈值筛选Petri网模型中各个活动点的重要性筛选Petri网模型中的预测点。本发明通过每个活动点所具有的事件属性对预测结果的重要性来筛选重要的预测点,从而剔除贡献度小的预测点,减少了整个流程监控系统的计算量,大大节约了系统资源。
Description
技术领域
本发明涉及流程监控技术领域,具体而言,涉及一种流程监控方法和预测点筛选方法、装置、设备和存储介质。
背景技术
预测性流程监控是对正在运行系统中的流程实例进行持续性地预测,以达到监控的效果,并及时将预测结果反馈给系统。相关工作者可以根据系统反馈的预测结果采取相应的措施,比如根据流程实例的运行现状合理规划现有资源或合理地调整服务的优先等级。预测结果(预测目标)可以是预测剩余时间、预测风险估计、预测下一个活动或预测特定指标(单个或聚合)等,其主要应用领域包括商务领域和医学生物领域。
一般预测性流程监控系统,其核心任务主要分为线下和线上两个阶段。线下阶段的任务是进行数据处理和基于已处理好的数据建立预测模型,而线上阶段的任务则是基于当前输入(在线流程轨迹)和已建立好的模型,进行预测并返回预测结果。
现有技术中,研究重心都放在了如何提高模型的预测准确率上,导致了预测性流程监控模型在运行过程中需要大量的算力,造成了大量的算力浪费。
有鉴于此,申请人在研究了现有的技术后特提出本申请。
发明内容
本发明提供了一种流程监控方法和预测点筛选方法、装置、设备和存储介质,以改善上述技术问题。
第一方面、
本发明实施例提供了一种预测点筛选方法,其包含步骤S1至步骤S5。
S1、获取待监控流程的原始数据集和Petri网模型。其中,原始数据集包含多个流程实例,每个流程实例包含多个事件属性的值。Petri网模型包括多个活动点,每个活动点具有多个事件属性。
S2、对原始数据集进行全局特征编码,获取特征向量集。
S3、获取预测目标,并根据预测目标和特征向量集,通过XGBoost模型计算得到各个事件属性的重要性。
S4、根据各个事件属性的重要性,获取Petri网模型中各个活动点的重要性;其中,活动点的重要性等于活动点所包含的所有事件属性的重要性之和。
S5、获取阈值,并根据阈值筛选Petri网模型中各个活动点的重要性,以获取Petri网模型中的预测点。
第二方面、
本发明实施例提供了一种预测点筛选装置,其包含:
数据获取模块,用于获取待监控流程的原始数据集和Petri网模型。其中,原始数据集包含多个流程实例,每个流程实例包含多个事件属性的值。Petri网模型包括多个活动点,每个活动点具有多个事件属性。
编码模块,用于对原始数据集进行全局特征编码,获取特征向量集。
第一重要性模块,用于获取预测目标,并根据预测目标和特征向量集,通过XGBoost模型计算得到各个事件属性的重要性。
第二重要性模块,用于根据各个事件属性的重要性,获取Petri网模型中各个活动点的重要性;其中,活动点的重要性等于活动点所包含的所有事件属性的重要性之和。
筛选模块,用于获取阈值,并根据阈值筛选Petri网模型中各个活动点的重要性,以获取Petri网模型中的预测点。
第三方面、
本发明实施例提供了一种预测点筛选设备,其包括处理器、存储器,以及存储在存储器内的计算机程序。计算机程序能够被处理器执行,以实现如第一方面所说的预测点筛选方法。
第四方面、
本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如第一方面所说的预测点筛选方法。
第五方面、
本发明实施例提供了一种流程监控方法,其包含步骤:
A1、获取待监控流程的原始数据集和Petri网模型。
A2、根据原始数据集和Petri网模型,获取Petri网模型中的多个预测点。其中,多个预测点根据第一方面所说的预测点筛选方法获取。
A3、根据多个预测点对全局特征编码后的原始数据集进行前缀提取和前缀分桶,以获取各个预测点的分桶数据集。
A4、根据各个预测点的分桶数据集,基于机器学习算法,构建各个预测点的预测模型。
A5、获取待监控流程的在线轨迹,并根据在线轨迹,获取对应的预测点的预测模型。
A6、对在线轨迹进行全局特征编码,获取轨迹编码。
A7、根据轨迹编码和对应的预测点的预测模型,获取预测结果。
通过采用上述技术方案,本发明可以取得以下技术效果:
本发明实施例通过每个活动点所具有的事件属性对预测结果的贡献度(重要性)来筛选重要的预测点,从而剔除贡献度小的预测点,减少了整个流程监控系统的计算量,大大节约了系统资源,具有很好的实际意义。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明第一实施例提供的一种预测点筛选方法的流程示意图。
图2是Petri网模型的示例。
图3是本发明第二实施例提供的一种预测点筛选装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
实施例中提及的“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的实施例能够以除了在这里图示或描述的那些内容以外的顺序实施。
下面结合附图与具体实施方式对本发明作进一步详细描述:
实施例一:
请参阅图1,本发明第一实施例提供一种流程监控方法,其可由流程监控设备来执行。特别地,由流程监控设备中中的一个或多个处理器来执行,以实现步骤A1至步骤A7。
需要说明的是,本发明提供的流程监控方法为预测性流程监控方法,其分为线上阶段和线下阶段。其中,步骤A1至步骤A4为线下阶段,用于根据历史数据构建流程模型中各个预测点的预测模型,然后上传到线上;步骤A5至步骤A7为线上阶段,用于根据预测模型对系统上正在处理的事件进行预测,从而根据预测结果调配系统资源,避免部分流程点上的算力浪费,或者部分流程点算力不够导致的系统崩溃。
A1、获取待监控流程的原始数据集和Petri网模型。
需要说明的是,Petri网模型是待监控流程的流程框架模型。在其它实施例中,还可以使用其它流程模型,本发明对此不作具体限定,其作用等同于Petri网模型,均应属于本发明的保护范围。
在本实施例中,直接通过系统流程抽取流程模型。具体的,首先输入历史数据的原始数据集,然后通过信息提取,将原始数据集转换为事件日志;最后根据事件日志提取系统流程,以抽取并构建出待监控流程的Petri网模型。在其他实施例中,Petri网模型可以直接输入,或者通过流程挖掘算法进行挖掘,本发明对此不做具体限定。
A2、根据原始数据集和Petri网模型,获取Petri网模型中的多个预测点。
在现有技术中,往往是把流程模型中的每个节点都当成预测点来进行预测。但是设置过多的预测点会导致大量的计算负担,大大浪费了系统的算力。
因此,如图1所示,在上述实施例的基础上,本发明的一个可选实施例中还提供一种预测点筛选方法,其通过计算每个候选预测点的重要性,只选取对预测结果贡献度大的预测点,减少了不必要的数据处理和线上系统的计算负担。
具体的,本实施例提供的一种预测点筛选方法可由预测点筛选设备来执行。特别地,由预测点筛选设备中的一个或多个处理器来执行,以实现步骤S1至步骤S5。
S1、获取待监控流程的原始数据集和Petri网模型。其中,原始数据集包含多个流程实例,每个流程实例包含多个事件属性的值。Petri网模型包括多个活动点,每个活动点具有多个事件属性。
需要说明的是,步骤S1和步骤A1是相同的。因此,步骤A2包括步骤S2至步骤S5。当预测点筛选方法单独应用时,则需要步骤S1使得整个筛选方法变得完整。
在一个可选的实施例中,步骤S1包括步骤S11至步骤S13。
S11、获取原始数据集。
S12、将原始数据集转化为事件日志。其中,事件日志包含多个事件。每个事件包含多个事件属性的值。流程实例由一个或一个以上的事件组成。
可以理解的是,原始数据集如表1所示,在原始数据中每一行表示一个流程实例(即一个实际的流程数据)。事件日志如表2所示,在事件日志中每一行表示一个事件。每一个事件包含有流程属性和事件属性,在同一流程实例中,事件属性的值是动态变化的通常称为动态属性,而流程属性值都是相同的通常称为静态属性。
具体的,根据事件日志的格式,在每一个流程实例中提取该流程的流程属性和事件属性,从而将原始数据集转换为事件日志,其实质只是文件格式改变,内容上是一样的。
表1原始数据的子片段
表2常见的事件日志的格式
S13、根据事件日志,抽取得到原始数据集对应的Petri网模型。
图2为Petri网模型的示例。Petri网模型中包含库所节点(圆形节点)和变迁节点(方形节点)。在本实施例中,Petri网模型通过从系统流程(事件日志)中抽取得到。抽取到的流程模型为待监控系统的抽象。
S2、对原始数据集进行全局特征编码,获取特征向量集。
具体的,通过编码能够将日志转换为机器学习可以识别的输入。其中,编码的质量直接决定了后续预测模型的质量。本实施例采用全局特征编码,能够很好的平衡数据抽象和信息丢失之间的关系。
具体的,在上述实施例的基础上,本发明的一个可选地实施例中步骤S2包括步骤S21至步骤S23。
S21、根据Petri网模型,获取基准序列。其中,基准序列包含Petri网模型的所有活动点。具体的,基准序列为包含Petri网模型中所有活动点的一个序列。
S22、根据特征向Gi的量表达式,分别提取原始数据集中各个流程实例所包含的流程属性和事件属性,获取各个流程实例对应的特征向量。其中,特征向量Gi的表达式为:
式中,i为流程实例的序号、为第u个流程属性、为第i个流程实例的第一个事件的第m个事件属性、为第i个流程实例的第r个事件的第n个事件属性、r为基准序列的长度。其中,为了保证特征向量的长度一致,未在流程实例中出现的事件属性,均用0填充。
具体的,特征向量Gi包含Petri网模型中的所有活动点的所有事件属性值,是基于原始数据进行编码的,而不是基于事件日志的数据格式进行编码的。因此,能够尽可能地保留了原始数据中的信息。
具体的,全局特征编码,通过特征提取,将原始数据集中的流程实例的流程属性和事件属性,转换为机器学习能够识别的输入。并且,因为其基于全局特征编码得到,因此能够很好的保留原始数据中的信息,具有很好的实际意义。其中,未出现的事件属性填充0能够保证编码后的特征向量的长度相同,从而符合机器学习的输入的要求。
举例来说:
如图2所示,对流程模型中的活动进行排序,则会得到一些完整的迹:<a,b,c,d,e,f,g,h,i,j,k>,<a,b,c,d,e,g,f,h,i,j,k>,<a,b,c,d,e,h,f,g,i,j,k>,…,<a,b,c,e,h,f,g,i,d,j,k>。
选定σN=<a,b,c,d,e,f,g,h,i,j,k>为基准序列。
如果存在一个前缀轨迹σ2=<a,b,c,d>,那个该前缀轨迹的全局特征向量(即特征向量)
S23、根据各个流程实例对应的特征向量,获取特征向量集。
具体的,各个流程实例进行全局特征编码后得到的多个特征向量组合成特征向量集。
S3、获取预测目标,并根据预测目标和特征向量集,通过XGBoost模型计算得到各个事件属性的重要性。
具体的,XGBoost算法包括三种重要性计算方法,在本实施例中,采用因此XGBoost算法中的feature_importance来计算事件属性的重要性。其具体计算步骤为现有技术,本发明在此不在赘述。
S4、根据各个事件属性的重要性,获取Petri网模型中各个活动点的重要性;其中,活动点的重要性等于活动点所包含的所有事件属性的重要性之和。
具体的,利用流程模型或建立流程模型来分桶比直接利用数据分桶更加直观;划分后,桶内的数据类型也具有一定的针对性和解释性。可以理解的,流程模型中每个节点都可以作为预测点,而过多的预测点则会浪费不必要的算力。
在本实施例中,将流程模型的将每个节点作为候选预测点,然后从中筛选出需要的预测点。
在步骤S3只是计算出了全局特征编码中各个事件属性的重要性。在步骤S4中,将各个事件属性的重要性,转换成Petri网模型中各个活动点的重要性,从而为预测点的筛选提供了判断基础。
在上述实施例的基础上,本发明的一个可选地实施例中步骤S4具体为:
根据各个事件属性的重要性,获取Petri网模型中各个活动点的重要性f(ai)。其中,活动点的重要性f(ai)为第i个活动点ai的重要性,即活动点ai包含的所有事件属性的重要性之和。
1≤i≤n
1≤j≤m
式中,n为Petri网模型的活动点的数量、m为第i个活动点ai包含的事件属性的数量、f(ej)为第j个事件属性ej的重要性。
需要说明的是,所有活动点的重要性之和为1。
S5、获取阈值,并根据阈值筛选Petri网模型中各个活动点的重要性,以获取Petri网模型中的预测点。
在本实施例中,阈值并不是固定值。当预测目标不同时,各个事件属性的事件重要性也会不同,也就是说活动点的重要性也不同。因此,阈值并不是一个固定值,需要综合多方面实际问题进行考虑。通过阈值来去掉一些明显不太重要的活动点,并将保留下来的活动点设为预测点。
在本实施例中,通过比较每个活动点所包含信息对预测目标的贡献度来计算重要性,并将高于重要性阈值的预测点保留,能有效挑选出重要的预测点,并减少了不必要的计算,具有很好的实际意义。
A3、根据多个预测点对全局特征编码后的原始数据集进行前缀提取和前缀分桶,以获取各个预测点的分桶数据集。
可以理解的,从流程模型中选取出预测点,即获得了流程模型的分桶模型。根据分桶模型,对全局特征编码后的原始数据集进行前缀提取和前缀分桶,以获得各个分桶的分桶数据集,属于现有技术,本发明在此不在赘述。
需要说明的是,前缀提取主要是利用了事件日志原始数据中,流程实例的流程属性,将事件日志用轨迹的形式表示,并在此基础上提取出所有可能的前缀轨迹(即前缀日志)。前缀分桶就是按照某种规则将相似的前缀日志划分到一起,具体的,每个分桶表示步骤A2中提取出来的一个预测点。前缀编码是将前缀日志转换成机器学习可以识别的输入。
优选地,在本实施例中,对全局特征编码后的原始数据集进行前缀提取和前缀分桶;其中,全局特征编码步骤S2中所述的全局特征编码相同。可以理解的是,在其它实施例中,还可以采用其它前缀编码的算法,本发明对此不做具体限定。
A4、根据各个预测点的分桶数据集,基于机器学习算法,构建各个预测点的预测模型。
具体的,根据分桶数据集,采用机器学习算法,构建预测模型,属于现有技术,本发明在此不再赘述。
优选的,本实施例中,机器学习算法采用XGBoost模型;使用XGBoost模型进行时间序列预测。其中,根据预测目标是离散值还是连续值,将问题转化为分类问题或回归问题,从而选择分类算法或者回归算法,而XGBoost算法既能用于离散值,也能用于连续值。
A5、获取待监控流程的在线轨迹,并根据在线轨迹,获取对应的预测点的预测模型。
具体的,在事件轨迹活动到预测点对应的活动点时,根据所选取的预测点(即分桶规则),找到在线轨迹对应分桶的预测模型。
A6、对在线轨迹进行全局特征编码,获取轨迹编码。
具体的,通过全局特征编码将在线轨迹从原始数据或事件日志的格式转换为机器学习能够识别的特征向量,从而能够输入预测模型中进行预测。
A7、根据轨迹编码和对应的预测点的预测模型,获取预测结果。
具体的,将轨迹编码输入到对应的预测模型中,获取预测目标对应的预测结果,以便于系统根据预测结果为轨迹接下来的事件活动做准备。
通过对正在运行系统中的流程实例进行持续性地预测,以达到监控预测的效果,能够在运行时提供及时有效的信息,以便采取相应的措施来提高系统的性能和降低风险,具有很好的实际意义。
实施例二、
本发明实施例提供了一种预测点筛选装置,其包含:
数据获取模块1,用于获取待监控流程的原始数据集和Petri网模型。其中,原始数据集包含多个流程实例,每个流程实例包含多个事件属性的值。Petri网模型包括多个活动点,每个活动点具有多个事件属性。
编码模块2,用于对原始数据集进行全局特征编码,获取特征向量集。
第一重要性模块3,用于获取预测目标,并根据预测目标和特征向量集,通过XGBoost模型计算得到各个事件属性的重要性。
第二重要性模块4,用于根据各个事件属性的重要性,获取Petri网模型中各个活动点的重要性;其中,活动点的重要性等于活动点所包含的所有事件属性的重要性之和。
筛选模块5,用于获取阈值,并根据阈值筛选Petri网模型中各个活动点的重要性,以获取Petri网模型中的预测点。
在上述实施例的基础上,本发明一可选的实施例中,数据获取模块1具体包括:
原始数据获取单元,用于获取原始数据集。
转化单元,用于将原始数据集转化为事件日志。其中,事件日志包含多个事件。每个事件包含多个事件属性的值。流程实例由一个或一个以上的事件组成。
抽取单元,用于根据事件日志,抽取得到原始数据集对应的Petri网模型。
在上述实施例的基础上,本发明一可选的实施例中,编码模块2模块,包括:
基准序列单元,用于根据Petri网模型,获取基准序列。其中,基准序列包含Petri网模型的所有活动点。
特征向量单元,用于根据基准序列,分别提取原始数据集中各个流程实例所包含的流程属性和事件属性,获取各个流程实例对应的特征向量。
向量集单元,用于根据各个流程实例对应的特征向量,获取特征向量集。
在上述实施例的基础上,本发明一可选的实施例中,特征向量Gi的表达式为:
在上述实施例的基础上,本发明一可选的实施例中,第二重要性模块4具体用于:
根据各个事件属性的重要性,获取Petri网模型中各个活动点的重要性f(ai)。其中,活动点的重要性f(ai)为第i个活动点ai的重要性,即活动点ai包含的多个事件属性的重要性之和。
1≤i≤n
1≤j≤m
式中,n为所述Petri网模型的活动点的数量、m为第i个活动点ai包含的事件属性数量、f(ej)为第j个事件属性ej的事件属性重要性、n为Petri网模型的活动点的数量。
实施例三、
本发明实施例提供了一种预测点筛选设备,其包括处理器、存储器,以及存储在存储器内的计算机程序。计算机程序能够被处理器执行,以实现如实施例一中所说的预测点筛选方法。
实施例四、
本发明实施例提供了一种计算机可读存储介质,其包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如实施例一中所说的预测点筛选方法或流程监控方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种预测点筛选方法,其特征在于,包含:
获取待监控流程的原始数据集和Petri网模型;其中,所述原始数据集包含多个流程实例,每个流程实例包含多个事件属性的值;所述Petri网模型包括多个活动点,每个活动点具有多个事件属性;
对所述原始数据集进行全局特征编码,获取特征向量集;
获取预测目标,并根据所述预测目标和所述特征向量集,通过XGBoost模型计算得到各个事件属性的重要性;
根据所述各个事件属性的重要性,获取所述Petri网模型中各个活动点的重要性;其中,活动点的重要性等于活动点所包含的所有事件属性的重要性之和;
获取阈值,并根据所述阈值筛选所述Petri网模型中各个活动点的重要性,以获取所述Petri网模型中的预测点。
2.根据权利要求1所述的预测点筛选方法,其特征在于,获取待监控流程的原始数据集和Petri网模型,具体包括:
获取原始数据集;
将所述原始数据集转化为事件日志;其中,所述事件日志包含多个事件;每个事件包含多个事件属性的值;所述流程实例由一个或一个以上的事件组成;
根据所述事件日志,抽取得到所述原始数据集对应的Petri网模型。
3.根据权利要求1所述的预测点筛选方法,其特征在于,对所述原始数据集进行全局特征编码,获取特征向量集,具体包括:
根据所述Petri网模型,获取基准序列;其中,所述基准序列包含所述Petri网模型的所有活动点;
根据所述基准序列,分别提取所述原始数据集中各个流程实例所包含的流程属性和事件属性,获取各个流程实例对应的特征向量;
根据所述各个流程实例对应的特征向量,获取所述特征向量集。
6.一种流程监控方法,其特征在于,包含:
获取待监控流程的原始数据集和Petri网模型;
根据所述原始数据集和所述Petri网模型,获取所述Petri网模型中的多个预测点;其中,所述多个预测点根据权利要求1至5任一项所说的预测点筛选方法获取;
根据所述多个预测点对全局特征编码后的所述原始数据集进行前缀提取和前缀分桶,以获取各个预测点的分桶数据集;
根据所述各个预测点的分桶数据集,基于机器学习算法,构建各个预测点的预测模型;
获取待监控流程的在线轨迹,并根据所述在线轨迹,获取对应的预测点的预测模型;
对所述在线轨迹进行全局特征编码,获取轨迹编码;
根据所述轨迹编码和所述对应的预测点的预测模型,获取预测结果。
7.一种预测点筛选装置,其特征在于,包含:
数据获取模块,用于获取待监控流程的原始数据集和Petri网模型;其中,所述原始数据集包含多个流程实例,每个流程实例包含多个事件属性的值;所述Petri网模型包括多个活动点,每个活动点具有多个事件属性;
编码模块,用于对所述原始数据集进行全局特征编码,获取特征向量集;
第一重要性模块,用于获取预测目标,并根据所述预测目标和所述特征向量集,通过XGBoost模型计算得到各个事件属性的重要性;
第二重要性模块,用于根据所述各个事件属性的重要性,获取所述Petri网模型中各个活动点的重要性;其中,活动点的重要性等于活动点所包含的所有事件属性的重要性之和;
筛选模块,用于获取阈值,并根据所述阈值筛选所述Petri网模型中各个活动点的重要性,以获取所述Petri网模型中的预测点。
8.根据权利要求7所述的预测点筛选装置,其特征在于,所述编码模块,包括:
基准序列单元,用于根据所述Petri网模型,获取基准序列;其中,所述基准序列包含所述Petri网模型的所有活动点;
特征向量单元,用于根据所述基准序列,分别提取所述原始数据集中各个流程实例所包含的流程属性和事件属性,获取各个流程实例对应的特征向量;
向量集单元,用于根据所述各个流程实例对应的特征向量,获取所述特征向量集。
9.一种预测点筛选设备,其特征在于,包括处理器、存储器,以及存储在所述存储器内的计算机程序;所述计算机程序能够被所述处理器执行,以实现如权利要求1至5任意一项所说的预测点筛选方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5任意一项所说的预测点筛选方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210478229.0A CN114816926A (zh) | 2022-05-05 | 2022-05-05 | 流程监控方法和预测点筛选方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210478229.0A CN114816926A (zh) | 2022-05-05 | 2022-05-05 | 流程监控方法和预测点筛选方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114816926A true CN114816926A (zh) | 2022-07-29 |
Family
ID=82511754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210478229.0A Pending CN114816926A (zh) | 2022-05-05 | 2022-05-05 | 流程监控方法和预测点筛选方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114816926A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633254A (zh) * | 2017-07-25 | 2018-01-26 | 平安科技(深圳)有限公司 | 建立预测模型的装置、方法及计算机可读存储介质 |
CN110956309A (zh) * | 2019-10-30 | 2020-04-03 | 南京大学 | 基于crf和lstm的流程活动预测方法 |
CN111082956A (zh) * | 2018-10-22 | 2020-04-28 | 中兴通讯股份有限公司 | 一种事件流处理方法、电子设备和可读存储介质 |
CN111366814A (zh) * | 2020-03-31 | 2020-07-03 | 上海电力大学 | 基于多源数据及多维故障编码空间的电网故障诊断方法 |
CN113537710A (zh) * | 2021-06-10 | 2021-10-22 | 杭州电子科技大学 | 一种数据驱动下基于人工智能的活动时序在线预测方法 |
CN113906416A (zh) * | 2019-12-30 | 2022-01-07 | 尤帕斯公司 | 可解释的过程预测 |
US20220058558A1 (en) * | 2018-12-21 | 2022-02-24 | Odaia Intelligence Inc. | Accurate and transparent path prediction using process mining |
-
2022
- 2022-05-05 CN CN202210478229.0A patent/CN114816926A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633254A (zh) * | 2017-07-25 | 2018-01-26 | 平安科技(深圳)有限公司 | 建立预测模型的装置、方法及计算机可读存储介质 |
CN111082956A (zh) * | 2018-10-22 | 2020-04-28 | 中兴通讯股份有限公司 | 一种事件流处理方法、电子设备和可读存储介质 |
US20220058558A1 (en) * | 2018-12-21 | 2022-02-24 | Odaia Intelligence Inc. | Accurate and transparent path prediction using process mining |
CN110956309A (zh) * | 2019-10-30 | 2020-04-03 | 南京大学 | 基于crf和lstm的流程活动预测方法 |
CN113906416A (zh) * | 2019-12-30 | 2022-01-07 | 尤帕斯公司 | 可解释的过程预测 |
CN111366814A (zh) * | 2020-03-31 | 2020-07-03 | 上海电力大学 | 基于多源数据及多维故障编码空间的电网故障诊断方法 |
CN113537710A (zh) * | 2021-06-10 | 2021-10-22 | 杭州电子科技大学 | 一种数据驱动下基于人工智能的活动时序在线预测方法 |
Non-Patent Citations (1)
Title |
---|
金梦思: "预测性流程监控模型的改进研究", 中国优秀硕士学位论文全文数据库, 31 May 2021 (2021-05-31), pages 19 - 60 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111258767B (zh) | 复杂系统仿真应用的云计算资源智能分配方法与装置 | |
CN105446979B (zh) | 数据挖掘方法和节点 | |
Tran et al. | A multivariate fuzzy time series resource forecast model for clouds using LSTM and data correlation analysis | |
CN109445935B (zh) | 云计算环境下一种高性能大数据分析系统自适应配置方法 | |
CN104679818A (zh) | 一种视频关键帧提取方法及系统 | |
CN113743675B (zh) | 一种云服务QoS深度学习预测模型的构建方法和系统 | |
WO2024087512A1 (zh) | 一种图神经网络压缩方法、装置、电子设备及存储介质 | |
CN112463532B (zh) | 构建snn工作负载自动映射器的方法及自动映射器 | |
CN114816926A (zh) | 流程监控方法和预测点筛选方法、装置、设备和存储介质 | |
CN111368150B (zh) | 预测模型的训练方法、装置及电子设备 | |
CN117035482A (zh) | 一种土地利用综合整治绩效评估方法及系统 | |
Zhao et al. | Urban short-term traffic flow prediction based on stacked autoencoder | |
CN113657501A (zh) | 模型自适应训练方法、装置、设备、介质及程序产品 | |
CN113723538B (zh) | 基于层次化迁移学习的跨平台功耗性能预测方法及系统 | |
CN115907839A (zh) | 一种预测销量的方法、系统、设备和存储介质 | |
CN111950753A (zh) | 一种景区客流预测的方法及装置 | |
CN112783747B (zh) | 一种应用程序的执行时间预测方法及装置 | |
CN112667394B (zh) | 一种计算机资源利用率优化方法 | |
CN112948115B (zh) | 一种基于极限学习机的云工作流调度器压力预测方法 | |
CN113289346A (zh) | 任务模型训练方法、装置、电子设备及存储介质 | |
CN111104569B (zh) | 数据库表的区域切分方法、装置及存储介质 | |
CN117667606B (zh) | 基于用户行为的高性能计算集群能耗预测方法及系统 | |
CN111783486A (zh) | 一种读卡器设备的维护预警方法及装置 | |
CN114819154A (zh) | 一种事件日志简化方法、装置、设备和存储介质 | |
Bauguion et al. | Maximum concurrent flow with incomplete data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |