CN112052232A - 一种基于重演技术的业务流程上下文提取方法 - Google Patents

一种基于重演技术的业务流程上下文提取方法 Download PDF

Info

Publication number
CN112052232A
CN112052232A CN202010705097.1A CN202010705097A CN112052232A CN 112052232 A CN112052232 A CN 112052232A CN 202010705097 A CN202010705097 A CN 202010705097A CN 112052232 A CN112052232 A CN 112052232A
Authority
CN
China
Prior art keywords
attribute
event
context
current
lbc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010705097.1A
Other languages
English (en)
Other versions
CN112052232B (zh
Inventor
孙笑笑
侯文杰
俞东进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010705097.1A priority Critical patent/CN112052232B/zh
Publication of CN112052232A publication Critical patent/CN112052232A/zh
Application granted granted Critical
Publication of CN112052232B publication Critical patent/CN112052232B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于重演技术的业务流程上下文提取方法。方法将业务流程的上下文信息划分为从控制流角度观察的行为上下文和从非控制流角度观察的数据上下文。其中行为上下文采用重演技术利用Petri网来进行捕捉,包括全局行为上下文和局部行为上下文;数据上下文通过对事件的关键属性执行分析获取,包括时间上下文和属性上下文。本发明方法能够从多个视角极好地展现当前实例执行的上下文环境,对后续的业务流程深度分析如异常检测、业务流程预测性等提供支撑。

Description

一种基于重演技术的业务流程上下文提取方法
技术领域
本发明涉及业务流程管理中的上下文提取领域,尤其涉及一种基于重演技术的业务流程上下文提取方法。
背景技术
随着全球经济的快速发展,传统的经营管理模式已经难以支撑企业内部繁重的业务体量,因此越来越多的企业引入业务流程管理(Business Process Management,简称BPM)技术实现企业内部流程的自动化高效管理。作为BPM在企业中的具体实践,业务流程驱动的信息系统(Process-Aware Information Systems,简称PAIS)在企业中大量使用,以支持业务流程建模、设计、执行以及帮助不同部门的员工灵活、高效地完成流程中的业务交付。PAIS以日志的形式记录了业务流程执行时每个活动的相关信息。对日志数据进行分析并从中提取出有价值的信息可以帮助企业提高服务效率、服务速度和服务质量,从而增强其企业竞争力。
业务流程上下文提取是指通过对正在执行的业务流程进行分析,更好地模拟流程执行的环境,其结果进一步应用于后续的业务流程深度分析如异常检测、业务流程预测性等提供支撑。然而目前现有的上下文提取方法大多从控制流视角观察当前活动执行的上下文信息或者从非控制流视角观察当前活动执行的上下文信息,极少将两者进行结合研究,无法综合、高效地反应当前活动执行的完整上下文信息。
发明内容
为了克服上述现有技术的不足,提出了一种基于重演技术的业务流程上下文提取方法。本发明使用重演技术来提取业务流程的行为上下文信息,将其与直接提取的数据上下文信息结合形成完整的业务流程上下文,可有效解决上述问题。
本发明具体采用的技术方案如下:
一种基于重演技术的业务流程上下文提取方法,其包括以下步骤:
S1.数据预处理:输入原始日志,使用过程发现技术从中挖掘出Petri网流程模型PN;
S2.行为上下文提取:利用重演技术基于步骤S1获得的Petri网流程模型PN对当前轨迹进行重演,具体包含S21~S28步骤:
S21.从PN中获取开始活动集合
Figure BDA0002594386650000021
结束活动集合
Figure BDA0002594386650000022
以及PN中的全部活动集合
Figure BDA0002594386650000023
并初始化全局行为上下文向量vgbc为长度
Figure BDA0002594386650000024
的0向量,其中
Figure BDA0002594386650000025
为PN中库所节点的数量;
S22.对日志中的事件根据其发生时间先后进行排序,得到按发生早晚排好序的事件集Elist
S23.依次遍历Elist中的每个事件并根据事件的实例ID属性找到其所属的轨迹T;
S24.对Elist中的每个事件e,按照S25~S28判断其执行活动a的类型,返回更新的事件集E′list,E′list中的每个事件均包含全局行为上下文属性e.gbc和局部行为上下文属性e.lbc;
S25.若a属于开始活动集
Figure BDA0002594386650000026
为开始活动,则执行以下操作:
(1)初始化当前活动的局部行为上下文向量vlbc为长度
Figure BDA0002594386650000027
的0向量;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置的数值加1,对vgbc执行相同的操作,然后将vlbc存储到当前事件e的局部行为上下文属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的全局行为上下文属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到当前轨迹T执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S26.若a不属于
Figure BDA0002594386650000028
但属于
Figure BDA0002594386650000029
为普通活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置处的数值减1,然后将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到轨迹执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S27.若a不属于
Figure BDA0002594386650000031
则当前执行的活动在PN模型中未出现过,为意外活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(3)对vlbc
Figure BDA0002594386650000032
位置上的数值加1来表示该活动执行后的状态,然后将vlbc存储到当前轨迹T的属性T.nextState中;
S28.若当前事件执行的活动属于结束活动集
Figure BDA0002594386650000033
则说明当前轨迹执行完毕,则执行以下步骤:
(1)从全局上下文vgbc中减去当前轨迹带来的托肯,即vgbc=vgbc-T.lastState:
(2)局部行为上下文向量vlbc仍为T.nexState,将vlbc存储到当前事件e的属性e.lbc,将vgbc存储到当前事件e的属性e.gbc中;
S3.时间上下文提取:对事件集E′list中的每个事件发生的时间戳进行处理,得到每个事件当前执行活动的时间上下文e.tcv=[h,m,d,weekday,tsct,td],其中h,m,d,weekday分别表示该时间戳对应的小时、月份、天以及星期的信息,tsct表示当前时间戳距实例开始时间戳的时间间隔,td表示当前时间戳距当天0点的时间间隔;
S4.属性上下文提取:对事件的其余属性根据其属性值是否为数值类型划分为类别属性和数值属性,对类别属性进行编码,然后与数值属性构成的向量合并得到属性上下文e.dev;
S5.完整上下文计算:对事件日志中的每个事件,使用S2中获得的属性e.lbc和属性e.gbc、S3中获得的属性e.tcv以及S4中获得的属性e.dcv进行级联,得到事件对应的完整上下文信息。
作为优选,1中所述的过程发现技术采用Split Miner。
作为优选,步骤S1中所述的Petri网流程模型
Figure BDA0002594386650000041
其中
Figure BDA0002594386650000042
是由全部库所节点组成的有限集合;
Figure BDA0002594386650000043
是由全部变迁节点组成的有限集合,且满足
Figure BDA0002594386650000044
Figure BDA0002594386650000045
Figure BDA0002594386650000046
是活动的有限集合;
Figure BDA0002594386650000047
是一组有向弧,表示流程中变迁与库所之间的关系;
Figure BDA0002594386650000048
是一个映射函数,将每个变迁节点
Figure BDA00025943866500000412
Figure BDA00025943866500000410
中的单个活动或者和不可观察到的活动⊥相映射;Minit表示Petri网的初始状态。
作为优选,步骤S1中所述的全局行为上下文向量vgbc的第
Figure BDA00025943866500000411
位用于接收未知活动执行产生的托肯。
作为优选,步骤S4所述的对类别属性进行编码选用one-hot编码,将类别属性转化为由0和1构成的向量。
本发明使用重演技术来获取流程实例执行的行为上下文,并与属性上下文一起形成了业务流程的完整上下文信息,本法明具有如下收益:1、利用重演技术来获取流程执行的行为上下文能够更好地模拟业务流程实际执行的情况;2、本发明提出的方法后续可用于在线上下文提取,具有更好的时效性。
附图说明
图1为本发明方法的流程图;
图2为本发明方法在准确率上的结果展示图(将本发明的上下文提取结果进一步应用于异常检测);
图3为本发明方法在精确率上的结果展示图(将本发明的上下文提取结果进一步应用于异常检测);
图4为本发明方法在召回率上的结果展示图(将本发明的上下文提取结果进一步应用于异常检测);
图5为本发明方法在F1分数上的结果展示图(将本发明的上下文提取结果进一步应用于异常检测)。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明进行进一步详细说明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
如图1所示,本发明的一种基于重演技术的业务流程上下文提取方法,包括以下步骤:
S1.数据预处理:输入原始日志,使用过程发现技术SplitMiner从中挖掘出Petri网流程模型
Figure BDA0002594386650000051
其中
Figure BDA0002594386650000052
是由全部库所节点组成的有限集合;
Figure BDA0002594386650000053
是由全部变迁节点组成的有限集合,且满足
Figure BDA0002594386650000054
Figure BDA0002594386650000055
是活动的有限集合;
Figure BDA0002594386650000056
是一组有向弧,表示流程中变迁与库所之间的关系;
Figure BDA0002594386650000057
是一个映射函数,将每个变迁节点
Figure BDA0002594386650000058
Figure BDA0002594386650000059
中的单个活动或者和不可观察到的活动⊥相映射;Minit表示Petri网的初始状态。其中Split Miner的执行只需设定两个参数阈值ε和η,即可以从历史事件日志中自动挖掘出一个全面权衡了精度,召回率以及模型复杂度的Petri网模型;其中阈值ε用于控制过滤过程的执行,阈值η用于控制并行关系的检测。
S2.行为上下文提取:利用重演技术基于步骤S1获得的Petri网流程模型PN对当前轨迹进行重演,具体包含如下S21~S28步骤:
S21.从PN中获取开始活动集合
Figure BDA00025943866500000510
结束活动集合
Figure BDA00025943866500000511
以及PN中的全部活动集合
Figure BDA00025943866500000512
并初始化全局行为上下文向量vgbc为长度
Figure BDA00025943866500000513
的0向量,其中
Figure BDA00025943866500000514
为PN中库所节点的数量,第
Figure BDA00025943866500000515
位用于接收未知活动执行产生的托肯(token);
S22.对日志中的事件根据其发生时间先后进行排序,得到按发生早晚排好序的事件集Elist
S23.依次遍历Elist中的每个事件并根据事件的实例ID属性找到其所属的轨迹T;
S24.对Elist中的每个事件e,按照S25~S28判断其执行活动a的类型,返回更新的事件集E′list,E′list中的每个事件均包含全局行为上下文属性e.gbc和局部行为上下文属性e.lbc;
S25.若a属于开始活动集
Figure BDA0002594386650000061
为开始活动,则执行以下操作:
(1)初始化当前活动的局部行为上下文向量vlbc为长度
Figure BDA0002594386650000062
的0向量;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置的数值加1,对vgbc执行相同的操作,然后将vlbc存储到当前事件e的局部行为上下文属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的全局行为上下文属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到当前轨迹T执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S26.若a不属于
Figure BDA0002594386650000063
但属于
Figure BDA0002594386650000064
为普通活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置处的数值减1,然后将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到轨迹执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S27.若a不属于
Figure BDA0002594386650000065
则当前执行的活动在PN模型中未出现过,为意外活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(3)对vlbc
Figure BDA0002594386650000071
位置上的数值加1来表示该活动执行后的状态,然后将vlbc存储到当前轨迹T的属性T.nextState中;
S28.若当前事件执行的活动属于结束活动集
Figure BDA0002594386650000072
则说明当前轨迹执行完毕,则执行以下步骤:
(1)从全局上下文vgbc中减去当前轨迹带来的托肯,即vgbc=vgbc-T.lastState;
(2)局部行为上下文向量vlbc仍为T.nexState,将vlbc存储到当前事件e的属性e.lbc,将vgbc存储到当前事件e的属性e.gbc中;
S3.时间上下文提取:对事件集E′list中的每个事件发生的时间戳进行处理,得到每个事件当前执行活动的时间上下文e.tcv=[h,m,d,weekday,tsct,td],其中h,m,d,weekday分别表示该时间戳对应的小时、月份、天以及星期的信息,tsct表示当前时间戳距实例开始时间戳的时间间隔,td表示当前时间戳距当天凌晨0点的时间间隔;
S4.属性上下文提取:对事件的其余属性根据其属性值是否为数值类型划分为类别属性和数值属性,对类别属性进行one-hot编码,将类别属性转化为由0和1构成的向量,然后与数值属性构成的向量合并得到属性上下文e.dcv;
S5.完整上下文计算:对事件日志中的每个事件,使用S2中获得的属性e.lbc和属性e.gbc、S3中获得的属性e.tcv以及S4中获得的属性e.dcv进行级联,得到事件对应的完整上下文信息。
下面将上述S1~S5应用于一个具体实施例中,以展示其技术效果。
实施例
本实施例步骤与具体实施方式相同,在此不再进行赘述。下面就部分实施过程和实施结果进行展示:
数据源获取:本实施例所用的原始日志文件是从4TU研究数据中心获得的四个真实的业务流程产生的日志:Helpdesk,BPIC2012_A,BPIC2012_O,BPIC2012_W。其中Helpdesk来源于意大利某软件公司服务台的票务管理流程,剩余三个日志来源于荷兰某财政机构,记录了申请贷款业务的流程的相关信息,它们是三个相互交织的子流程。其中每个日志中的相关统计信息见表1。
由于业务流程上下文提取是从多个视角更好地展现当前实例执行的上下文环境,其主要目的是为后续的业务流程深度分析如异常检测、业务流程预测性等提供支撑,因此为了验证本发明技术方案的技术效果,本实施例将采用本发明方法提取的业务流程上下文信息进一步用于业务流程的异常检测,包括属性异常、时间异常和行为异常三种类型。本实施例选取常用的四个指标:准确率、精确率、召回率以及F1分数来衡量检测的性能。此外,为了验证提出的基于重演提取的行为上下文对检测结果的影响,为训练模型分别生成了两类数据样本,其中第一类样本(withBC)将包含本发明提出的行为上下文信息和数据上下文信息,而第二种样本(withoutBC)则仅包含数据上下文(以往的工作均只使用了数据上下文信息)。
图2、3、4、5分别展示了在四个数据集上使用本发明方法进行三类异常检测的准确率、精确率、召回率以及F1分数的变化。由图中可以看到,加入本发明提出的行为上下文信息后,三类异常检测精度均有不同程度的提高,这证明了本发明提出的基于重演技术提取得到的行为上下文信息的有效性。
表1四个真实数据集的统计信息表
Figure BDA0002594386650000081
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (5)

1.一种基于重演技术的业务流程上下文提取方法,其特征在于包括以下步骤:
S1.数据预处理:输入原始日志,使用过程发现技术从中挖掘出Petri网流程模型PN;
S2.行为上下文提取:利用重演技术基于步骤S1获得的Petri网流程模型PN对当前轨迹进行重演,具体包含S21~S28步骤:
S21.从PN中获取开始活动集合
Figure FDA0002594386640000011
结束活动集合
Figure FDA0002594386640000012
以及PN中的全部活动集合
Figure FDA0002594386640000013
并初始化全局行为上下文向量vgbc为长度
Figure FDA0002594386640000014
的0向量,其中
Figure FDA0002594386640000015
为PN中库所节点的数量;
S22.对日志中的事件根据其发生时间先后进行排序,得到按发生早晚排好序的事件集Elist
S23.依次遍历Elist中的每个事件并根据事件的实例ID属性找到其所属的轨迹T;
S24.对Elist中的每个事件e,按照S25~S28判断其执行活动a的类型,返回更新的事件集E′list,E′list中的每个事件均包含全局行为上下文属性e.gbc和局部行为上下文属性e.lbc;
S25.若a属于开始活动集
Figure FDA0002594386640000016
为开始活动,则执行以下操作:
(1)初始化当前活动的局部行为上下文向量vlbc为长度
Figure FDA0002594386640000017
的0向量;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置的数值加1,对vgbc执行相同的操作,然后将vlbc存储到当前事件e的局部行为上下文属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的全局行为上下文属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到当前轨迹T执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S26.若a不属于
Figure FDA0002594386640000018
但属于
Figure FDA0002594386640000019
为普通活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)获得当前活动对应变迁节点的输入集合Spre和输出集合Spost
(3)对Spre中的每个库所节点,将vlbc中该库所节点对应位置处的数值减1,然后将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(4)对Spost中的每个库所节点,将Spre中库所节点的托肯转移到Spost的库所节点中,并对vlbc作出同样的转移,即该库所节点对应位置处的数值加1,被转移的库所节点对应位置处的数值减1,得到轨迹执行当前活动后的状态,并将其保存在当前轨迹T的属性T.nextState中;
S27.若a不属于
Figure FDA0002594386640000021
则当前执行的活动在PN模型中未出现过,为意外活动,则执行以下操作:
(1)当前活动的局部行为上下文向量vlbc为T.nexState,全局行为上下文向量vgbc为vgbc+T.nextState-T.lastState;
(2)将vlbc存储到当前事件e的属性e.lbc和当前轨迹T的属性T.lastState中,将vgbc存储到当前事件e的属性e.gbc中;
(3)对vlbc
Figure FDA0002594386640000022
位置上的数值加1来表示该活动执行后的状态,然后将vlbc存储到当前轨迹T的属性T.nextState中;
S28.若当前事件执行的活动属于结束活动集
Figure FDA0002594386640000023
则说明当前轨迹执行完毕,则执行以下步骤:
(1)从全局上下文vgbc中减去当前轨迹带来的托肯,即vgbc=vgbc-T.lastState:
(2)局部行为上下文向量vlbc仍为T.nexState,将vlbc存储到当前事件e的属性e.lbc,将vgbc存储到当前事件e的属性e.gbc中;
S3.时间上下文提取:对事件集E′list中的每个事件发生的时间戳进行处理,得到每个事件当前执行活动的时间上下文e.tcv=[h,m,d,weekday,tsct,td],其中h,m,d,weekday分别表示该时间戳对应的小时、月份、天以及星期的信息,tsct表示当前时间戳距实例开始时间戳的时间间隔,td表示当前时间戳距当天0点的时间间隔;
S4.属性上下文提取:对事件的其余属性根据其属性值是否为数值类型划分为类别属性和数值属性,对类别属性进行编码,然后与数值属性构成的向量合并得到属性上下文e.dcv;
S5.完整上下文计算:对事件日志中的每个事件,使用S2中获得的属性e.lbc和属性e.gbc、S3中获得的属性e.tcv以及S4中获得的属性e.dcv进行级联,得到事件对应的完整上下文信息。
2.根据权利要求1所述的一种基于重演技术的业务流程上下文提取方法,其特征在于步骤S1中所述的过程发现技术采用Split Miner。
3.根据权利要求1所述的一种基于重演技术的业务流程上下文提取方法,其特征在于步骤S1中所述的Petri网流程模型
Figure FDA0002594386640000031
其中
Figure FDA0002594386640000032
是由全部库所节点组成的有限集合;
Figure FDA0002594386640000033
是由全部变迁节点组成的有限集合,且满足
Figure FDA0002594386640000034
是活动的有限集合;
Figure FDA0002594386640000035
是一组有向弧,表示流程中变迁与库所之间的关系;
Figure FDA0002594386640000036
是一个映射函数,将每个变迁节点
Figure FDA0002594386640000037
Figure FDA0002594386640000038
中的单个活动或者和不可观察到的活动⊥相映射;Minit表示Petri网的初始状态。
4.根据权利要求1所述的一种基于重演技术的业务流程上下文提取方法,其特征在于步骤S1中所述的全局行为上下文向量vgbc的第
Figure FDA0002594386640000039
位用于接收未知活动执行产生的托肯。
5.根据权利要求1所述的一种基于重演技术的业务流程上下文提取方法,其特征在于步骤S4所述的对类别属性进行编码选用one-hot编码,将类别属性转化为由0和1构成的向量。
CN202010705097.1A 2020-07-21 2020-07-21 一种基于重演技术的业务流程上下文提取方法 Active CN112052232B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010705097.1A CN112052232B (zh) 2020-07-21 2020-07-21 一种基于重演技术的业务流程上下文提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010705097.1A CN112052232B (zh) 2020-07-21 2020-07-21 一种基于重演技术的业务流程上下文提取方法

Publications (2)

Publication Number Publication Date
CN112052232A true CN112052232A (zh) 2020-12-08
CN112052232B CN112052232B (zh) 2021-06-01

Family

ID=73601918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010705097.1A Active CN112052232B (zh) 2020-07-21 2020-07-21 一种基于重演技术的业务流程上下文提取方法

Country Status (1)

Country Link
CN (1) CN112052232B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537710A (zh) * 2021-06-10 2021-10-22 杭州电子科技大学 一种数据驱动下基于人工智能的活动时序在线预测方法
CN113537712A (zh) * 2021-06-10 2021-10-22 杭州电子科技大学 一种基于轨迹重演的业务流程剩余活动序列预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509171A (zh) * 2011-10-24 2012-06-20 浙江大学 一种面向规则执行日志的流程挖掘方法
CN103593286A (zh) * 2013-10-22 2014-02-19 上海交通大学 基于自适应点火的软件验证方法
US20140163934A1 (en) * 2012-12-06 2014-06-12 Palo Alto Research Center Incorporated Method and apparatus for determining an average wait time for user activities based on contextual sensors
CN104408573A (zh) * 2014-12-03 2015-03-11 复旦大学 一种基于业务模式的异构业务流程整合方法
CN107121969A (zh) * 2017-03-22 2017-09-01 浙江工业大学 基于邻接矩阵的工厂制造流程模型差别检测方法
CN111191897A (zh) * 2019-12-23 2020-05-22 浙江传媒学院 基于双向gru神经网络的业务流程在线合规性预测方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509171A (zh) * 2011-10-24 2012-06-20 浙江大学 一种面向规则执行日志的流程挖掘方法
US20140163934A1 (en) * 2012-12-06 2014-06-12 Palo Alto Research Center Incorporated Method and apparatus for determining an average wait time for user activities based on contextual sensors
CN103593286A (zh) * 2013-10-22 2014-02-19 上海交通大学 基于自适应点火的软件验证方法
CN104408573A (zh) * 2014-12-03 2015-03-11 复旦大学 一种基于业务模式的异构业务流程整合方法
CN107121969A (zh) * 2017-03-22 2017-09-01 浙江工业大学 基于邻接矩阵的工厂制造流程模型差别检测方法
CN111191897A (zh) * 2019-12-23 2020-05-22 浙江传媒学院 基于双向gru神经网络的业务流程在线合规性预测方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ESTEFANÍA SERRAL等: ""Context-adaptive Petri nets: Supporting adaptation for the execution context"", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
曹斌等: ""基于Petri网的流程间元素映射方法"", 《软件学报》 *
王佳星: ""业务流程模型差异检测方法研究"", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537710A (zh) * 2021-06-10 2021-10-22 杭州电子科技大学 一种数据驱动下基于人工智能的活动时序在线预测方法
CN113537712A (zh) * 2021-06-10 2021-10-22 杭州电子科技大学 一种基于轨迹重演的业务流程剩余活动序列预测方法

Also Published As

Publication number Publication date
CN112052232B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
Al-Sai et al. Big data impacts and challenges: a review
CN112052232B (zh) 一种基于重演技术的业务流程上下文提取方法
CN106022708A (zh) 一种预测员工离职的方法
CN112052233B (zh) 一种基于上下文感知的多角度业务流程异常在线检测方法
Rozinat et al. Workflow simulation for operational decision support using design, historic and state information
US20210287068A1 (en) Log analysis system employing long short-term memory recurrent neural networks
Cheah et al. A noisy 10GB provenance database
Zhang et al. Thoughts on the development of artificial intelligence combined with RPA
Rao et al. An optimal machine learning model based on selective reinforced Markov decision to predict web browsing patterns
Volk et al. Ask the Right Questions: Requirements Engineering for the Execution of Big Data Projects.
CN114020593A (zh) 一种基于轨迹聚类的异质流程日志采样方法与系统
US8489444B2 (en) Chronicling for process discovery in model driven business transformation
Morozov et al. Development of optimization models of complex infocommunication projects based on data mining
EP3864522A1 (en) System and method of data transformation
CN113537710B (zh) 一种数据驱动下基于人工智能的活动时序在线预测方法
CN110162521A (zh) 一种支付系统交易数据处理方法及系统
Pei et al. Estimating global completeness of event logs: A comparative study
Ilieva et al. AI Integration in Business Processes Management
Punn et al. Testing big data application
Pourbafrani et al. Data-Driven Simulation In Process Mining: Introducing A Reference Model.
Petrova et al. Potential of Big Data Analytics for Managing Value Creation
CN107688902B (zh) 一种高新技术创业模式分析评价方法
CN113537712B (zh) 一种基于轨迹重演的业务流程剩余活动序列预测方法
CN114912447B (zh) 基于智慧城市的数据处理方法及设备
US20110055108A1 (en) Refining processes using virtual-worlds to capture process data and replaying for analysis and review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant