CN110084517B - 一种面向教育数据日志的工作流方法 - Google Patents

一种面向教育数据日志的工作流方法 Download PDF

Info

Publication number
CN110084517B
CN110084517B CN201910350266.1A CN201910350266A CN110084517B CN 110084517 B CN110084517 B CN 110084517B CN 201910350266 A CN201910350266 A CN 201910350266A CN 110084517 B CN110084517 B CN 110084517B
Authority
CN
China
Prior art keywords
log
workflow
data
user
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910350266.1A
Other languages
English (en)
Other versions
CN110084517A (zh
Inventor
王磊
成耐克
费蓉
江巧永
赵志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yiyin Technology Co ltd
Original Assignee
Beijing Yiyin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yiyin Technology Co ltd filed Critical Beijing Yiyin Technology Co ltd
Priority to CN201910350266.1A priority Critical patent/CN110084517B/zh
Publication of CN110084517A publication Critical patent/CN110084517A/zh
Application granted granted Critical
Publication of CN110084517B publication Critical patent/CN110084517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Educational Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向教育数据的工作流方法,步骤如下:首先预处理教育日志数据,得到教育数据日志统计分析表;其次构造关系矩阵1,结合α算法生成工作流网N1;工作流网N1中存在孤立点,构造关系矩阵2,结合α算法生成工作流网N2;工作流网N2中存在孤立点,构造关系矩阵3,结合α算法生成工作流网N3;工作流网N3中存在孤立点,定义日志次序关系4,构造关系矩阵4,结合α算法生成不含孤立点的工作流网N4;根据工作流网N4构建活动间的连接关系,计算每个活动的导航度和权威度,最终对于工作流网中设计不合理的活动作出改进。该方法的提出对工作流网的分析、监控提供了更好的支撑。

Description

一种面向教育数据日志的工作流方法
技术领域
本发明属于工作流技术领域,具体涉及一种面向教育数据日志的工作流方法。
背景技术
信息技术的应用和教育信息系统的建立,为收集日志数据提供了基础。在大数据时代,这些日志数据为改进相应的系统和业务设计有着非常重要的意义。传统的业务流程完全依照软件工程师的设计思路进行,其中用户的参与度也仅体现在获取需求方面,与用户操作的实际数据并未结合。因此将日志数据和业务知识结合,对于优化现有业务流程意义重大。
日志数据分析业务流程问题,国内外已有不少的研究,1998年Agrawal最早使用基于有向图的方法提出了工作流挖掘模型,此后又进行了一系列扩展性研究。2003年,Eindhovn大学的Aalst提出了基于Petri网的α算法,并针对α算法挖掘的一系列问题进行了改进。2007年,源于计算智能领域的技术(蚁群算法、遗传程序设计、遗传算法、模拟退火、强化学习、机器学习、神经网络、模糊集、粗糙集等)的发展,A.K.Alves de Medeiros等使用遗传过程挖掘方法不直接把日志转变为模型,而是使用迭代的过程模拟自然演化过程。2010年,Aalst又提出使用两阶段方法进行工作流挖掘,该方法包含两个步骤,第一步构建一个浅层模型(如变迁系统),第二步将浅层模型转换为能够表达并发和其他更加高级的控制流模式的深层模型。近年来,吴俊枝提出在过程挖掘中加入行为轮廓的因素,利用日志与模型间的一致性分析和基于行为轮廓的模型间的一致性分析进行挖掘模型的优化。李雪萍针对医疗系统中的实际业务流程问题,提出了基于事件日志的医疗业务流程挖掘方法,从活动间的行为关系挖掘流程模型。从这些现有研究方法来看,各有优势。两阶段方法在发现的过程中不能表示偏好,并且与α算法及变体相比,运行通常较慢。计算智能方法随着迭代次数变化,才可以获得一个质量可接受的个体(模型),过程比较复杂。原始α算法也存在各种问题,如不可见任务,1循环(形如…aa…),2循环(形如…aba…)问题等。针对这些问题,有学者提出了多种改进思路,但是这些改进思路存在一定的缺陷。
发明内容
本发明的目的是定义了一种新的日志次序关系,通过新的日志次序关系生成不包含孤立点的新的工作流网,通过新的工作流网构建活动间的连接关系,计算每个活动的导航度和权威度可通过,最终对于工作流网设计不合理的活动作出改进,保证形成完整的工作流网,并使用教育数据日志进行验证。
本发明的技术方案是,一种面向教育数据的工作流方法,以教育系统数据日志为输入,以petri网描述的工作流网为输出结果,该方法具体步骤如下:
步骤1、预处理教育日志数据C1,得到与事件相关的紧密属性的教育日志数据C2和教育数据日志统计分析表;
步骤2、基于传统的日志次序关系1和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以传统日志次序关系1为规则,构造关系矩阵1,结合关系矩阵1与α算法,将满足因果关系的行和列组织起来,使用α算法的第5步,移除不是最大的因果关系,生成工作流网N1
步骤3、工作流网N1中存在与其他部分并不相连的孤立点,基于日志次序关系2和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系2为规则,构造关系矩阵2,结合关系矩阵2与α算法,生成工作流网N2
步骤4、工作流网N2中存在与其他部分并不相连的孤立点,基于日志次序关系3和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系3为规则,构造关系矩阵3,结合关系矩阵3与α算法,生成工作流网N3
步骤5、工作流网N3中存在与其他部分并不相连的孤立点,定义日志次序关系4,根据日志次序关系4和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系4为规则,构造关系矩阵4,结合关系矩阵4与α算法,生成不含孤立点的工作流网N4
步骤6、根据工作流网N4构建活动间的连接关系,计算每个活动的导航度和权威度,最终对于工作流网N4中设计不合理的活动作出改进。
本发明的特点还在于,
(1)教育日志数据预处理的具体步骤为:
步骤1.1、去掉准备预处理的教育日志数据C1的部分属性,得到与事件相关的紧密属性的教育日志数据C2;
步骤1.2、制定教育日志数据日志事件和单字母的转换表;
步骤1.3、根据步骤1.2中制定的转换表对教育日志数据C2进行分类,建立和教育日志数据C2中原始数据对应的用户足迹;
步骤1.4、对用户足迹的出现频率和出现类型进行简要的统计分析,得到教育数据日志统计分析表。
(2)日志次序关系4的具体定义为:
令W″′是包含变迁T″′集合的工作流日志,a″′∈T″′,b″′∈T″′:
顺序关系:a″′>W″′b″′当且仅当存在路径σ″′=<t1″′,t2″′,t3″′,...tn″′>,i∈{1,...,n-1},σ″′∈W″′,ti″′=a″′并且ti+1″′=b″′;
因果关系:a″′→″′W″′b″′当且仅当a″′>W″′b″′并且(或者 或者/> );
不相关关系:a″′#″′W″′b″′当且仅当并且/>
并行关系:a″′||″′W″′b″′当且仅当a″′>″′W″′b″′并且b″′>″′W″′a″′并且((ti″′=a″′并且ti+1″′=b″′并且ti+1″′≠ti″′≠ti+2″′)或者(ti″′=a″′并且ti+1″′=b″′并且ti+1″′≠ti″′≠ti+2″′));
其中,W″′表示工作流日志,T″′表示变迁集合,a″′表示变迁集合中的具体活动,b″′表示变迁集合中的具体活动;σ″′表示用户某一操作集合,<t1″′,t2″′,t3″′,...tn″′>表示用户某一次操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti″′表示某一个用户的第i个活动所表示的字母。
(3)传统日志次序关系1定义如下:
令W是包含变迁T集合的工作流日志,a∈T,b∈T:
顺序关系:a>Wb当且仅当存在路径σ=<t1,t2,t3,...tn>,i∈{1,...,n-1},σ∈W,ti=a并且ti+1=b;
因果关系:a→Wb当且仅当a>Wb并且
不相关关系:a#Wb当且仅当并且/>
并行关系:a||Wb当且仅当a>Wb并且b>Wa;
其中,W表示工作流日志,T表示变迁集合,a表示变迁集合中的具体活动,b表示变迁集合中的具体活动;σ表示用户某一操作集合,<t1,t2,t3,...tn>表示用户某一次操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti表示某一个用户的第i个活动所表示的字母。
(4)日志次序关系2定义如下:
令W′是包含变迁T′集合的工作流日志,a′∈T′,b′∈T′:
顺序关系:a′>′W′b′当且仅当存在路径σ′=<t1′,t2′,t3′,…tn′>,i∈{1,...,n-1},σ′∈W′,ti′=a′并且ti+1′=b′;
因果关系:a′>′W′b′当且仅当a′>′W′b′并且(或者/> );
不相关关系:a′#′W′b′当且仅当并且/>
并行关系:a′||′W′b′当且仅当a′>′W′b′并且((b′>′W′a′)并且 );
其中,W′表示工作流日志,T′表示变迁集合,a′表示变迁集合中的具体活动,b′表示变迁集合中的具体活动;σ′表示用户某一操作集合,<t1′,t2′,t3′,...tn′>表示用户某一次操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti′表示某一个用户的第i个活动所表示的字母。
(5)日志次序关系3定义如下:
令W″是包含变迁T″集合的工作流日志,a″∈T″,b″∈T″:
前提条件1:a″ΔW″b″当且仅当存在路径σ″=<t1″,t2″,t3″,...tn″>,i∈{1,...,n-1},σ″∈W″,ti″=ti+2″=a″并且ti+1″=b″;
前提条件2:当且仅当a″ΔW″b″并且b″ΔW″a″;
顺序关系:a″>″W″b″当且仅当存在路径σ″=<t1″,t2″,t3″,...tn″>,i∈{1,...,n-1}如σ″∈W″,ti″=a″并且ti+1″=b″;
因果关系:a″→″W″b″当且仅当a″>″W″b″并且(或者/>);
不相关关系:a″#″W″b″当且仅当并且/>
并行关系:a″||″W″b″当且仅当a″>″W″b″并且b″>″W″a″并且
其中,W″表示工作流日志,T″表示变迁集合,a″表示变迁集合中的具体活动,b″表示变迁集合中的具体活动;σ″表示用户某一操作集合,<t1″,t2″,t3″,...tn″>表示用户某一次操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti″表示某一个用户的第i个活动所表示的字母。
(6)α算法的定义如下:
a:获取日志中出现的所有事件,这些事件最终构成工作流网中的变迁集合;
b:在a中获取到的变迁中查找开始变迁集合;
c:在a中获取到的变迁中查找结束变迁集合;
d:基于工作流路径确定变迁之间的关系,并形成集合;
e:基于d,确定变迁之间的最大集合;
f:加入开始库所和结束库所;
g:形成工作流网络之间的弧;
h:最终构成完整的工作流网。
本发明的有益效果是:
(1)本发明一种面向教育数据的工作流方法,提升了工作流挖掘方法的挖掘能力,保证了构成工作流网的完整性,如果使用不完整的工作流网,则过程挖掘得到的结果是不准确的,这种不完整与根据日志事件统计频率而去掉某些事件是有区别的,因此,该方法的提出对工作流网的分析、监控提供了更好的支撑。
(2)本发明一种面向教育数据的工作流方法与现有方法相比:通过重新设计满足因果关系和并行关系的条件,构造出完整的工作流网,使得日志事件可以全部被纳入网络,不存在孤立点。
附图说明
图1是本发明一种面向教育数据日志的工作流方法的流程图;
图2是本发明一种面向教育数据日志的工作流方法使用传统日志次序关系1构造的工作流网N1
图3是本发明一种面向教育数据日志的工作流方法使用日志次序关系2构造的工作流网N2
图4是本发明一种面向教育数据日志的工作流方法使用日志次序关系3构造的工作流网N3
图5是本发明一种面向教育数据日志的工作流方法使用日志次序关系4构造的工作流网N4
具体实施方式
下面结合附图对本发明做进一步说明:
本发明的一种面向教育数据的工作流方法,先以教育系统数据日志为输入,以petri网描述的工作流网为输出结果,具体流程如图1所示,具体步骤如下:
步骤1、预处理教育日志数据C1,得到与事件相关的紧密属性的教育日志数据C2和教育数据日志统计分析表;
教育日志数据预处理的具体步骤为:
步骤1.1、去掉准备预处理的教育日志数据C1的部分属性,得到与事件相关的紧密属性的教育日志数据C2;
步骤1.2、制定教育日志数据日志事件和单字母的转换表;
步骤1.3、根据步骤1.2中制定的转换表对教育日志数据C2进行分类,建立和教育日志数据C2中原始数据对应的用户足迹;
步骤1.4、对用户足迹的出现频率和出现类型进行简要的统计分析,得到教育数据日志统计分析表。
步骤2、基于传统的日志次序关系1和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以传统日志次序关系1为规则,构造关系矩阵1,结合关系矩阵1与α算法,将满足因果关系的行和列组织起来,使用α算法的第5步,移除不是最大的因果关系,生成工作流网N1
传统日志次序关系1定义如下:
令W是包含变迁T集合的工作流日志,a∈T,b∈T:
顺序关系:a>Wb当且仅当存在路径σ=<t1,t2,t3,...tn>,i∈{1,...,n-1},σ∈W,ti=a并且ti+1=b;
因果关系:a→Wb当且仅当a>Wb并且
不相关关系:a#Wb当且仅当并且/>
并行关系:a||Wb当且仅当a>Wb并且b>Wa;
其中,W表示工作流日志,T表示变迁集合,a表示变迁集合中的具体活动,b表示变迁集合中的具体活动;σ表示用户某一操作集合,<t1,t2,t3,...tn>表示用户某一次操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti表示某一个用户的第i个活动所表示的字母;
步骤3、工作流网N1中存在与其他部分并不相连的孤立点,基于日志次序关系2和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系2为规则,构造关系矩阵2,结合关系矩阵2与α算法,生成工作流网N2
日志次序关系2定义如下:
令W′是包含变迁T′集合的工作流日志,a′∈T′,b′∈T′:
顺序关系:a′>′W′b′当且仅当存在路径σ′=<t1′,t2t3…tn′>,i∈{1,...,n-1},σ′∈W′,ti′=a′并且ti+1′=b′;
因果关系:a′>′W′b′当且仅当a′>′W′b′并且(或者/> );不相关关系:a′#′W′b′当且仅当/>并且/>
并行关系:a′||′W′b′当且仅当a′>′W′b′并且((b′>′W′a′)并且 );
其中,W′表示工作流日志,T′表示变迁集合,a′表示变迁集合中的具体活动,b′表示变迁集合中的具体活动;σ′表示用户某一操作集合<t1′,t2′,t3′,...tn′>表示用户某一次操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti′表示某一个用户的第i个活动所表示的字母;
步骤4、工作流网N2中存在与其他部分并不相连的孤立点,基于日志次序关系3和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系3为规则,构造关系矩阵3,结合关系矩阵3与α算法,生成工作流网N3
日志次序关系3定义如下:
令W″是包含变迁T″集合的工作流日志,a″∈T″,b″∈T″:
前提条件1:a″ΔW″b″当且仅当存在路径σ″=<t1″,t2″,t3″,...tn″>,i∈{1,...,n-1},σ″∈W″,ti″=ti+2″=a″并且ti+1″=b″;
前提条件2:当且仅当a″ΔW″b″并且b″ΔW″a″;
顺序关系:a″>″W″b″当且仅当存在路径σ″=<t1″,t2″,t3″,...tn″>,i∈{1,...,n-1}如σ″∈W″,ti″=a″并且ti+1″=b″;
因果关系:a″→″W″b″当且仅当a″>″W″b″并且(或者/>);
不相关关系:a″#″W″b″当且仅当并且/>
并行关系:a″||″W″b″当且仅当a″>″W″b″并且b″>″W″a″并且
其中,W″表示工作流日志,T″表示变迁集合,a″表示变迁集合中的具体活动,b″表示变迁集合中的具体活动;σ″表示用户某一操作集合,<t1″,t2″,t3″,...tn″>表示用户某一次操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti″表示某一个用户的第i个活动所表示的字母;
步骤5、工作流网N3中存在与其他部分并不相连的孤立点,定义日志次序关系4,根据日志次序关系4和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系4为规则,构造关系矩阵4,结合关系矩阵4与α算法,生成不含孤立点的工作流网N4
日志次序关系4的具体定义为:
令W″′是包含变迁T″′集合的工作流日志,a″′∈T″′,b″′∈T″′:
顺序关系:a″′>W″′b″′当且仅当存在路径σ″′=<t1″′,t2″′,t3″′,...tn″′>,i∈{1,...,n-1},σ″′∈W″′,ti″′=a″′并且ti+1″′=b″′;
因果关系:a″′→″′W″′b″′当且仅当a″′>W″′b″′并且(或者 或者/> );
不相关关系:a″′#″′W″′b″′当且仅当并且/>
并行关系:a″′||″′W″′b″′当且仅当a″′>″′W″′b″′并且b″′>″′W″′a″′并且((ti″′=a″′并且ti+1″′=b″′并且ti+1″′≠ti″′≠ti+2″′)或者(ti″′=a″′并且ti+1″′=b″′并且ti+1″′≠ti″′≠ti+2″′));
其中,W″′表示工作流日志,T″′表示变迁集合,a″′表示变迁集合中的具体活动,b″′表示变迁集合中的具体活动;σ″′表示用户某一操作集合,<t1″′,t2″′,t3″′,...tn″′>表示用户某一操作的具体活动,i表示每一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti″′表示某一个用户的第i个活动所表示的字母。
结合α算法生成不含孤立点的工作流网N4的具体步骤如下:
步骤5.1、结合日志次序关系4和教育数据日志统计分析表中的数据得到教育事件日志的关系矩阵4;
步骤5.2、根据α算法的步骤,得出算法中的变迁集合、开始变迁集合和结束变迁集合;
步骤5.3、使用关系矩阵结合α算法构造工作流网N4
步骤6、根据工作流网N4构建活动间的连接关系,计算每个活动的导航度和权威度,最终对于工作流网N4中设计不合理的活动作出改进。
其中,α算法的定义如下:
a:获取日志中出现的所有事件,这些事件最终构成工作流网中的变迁集合;
b:在a中获取到的变迁中查找开始变迁集合;
c:在a中获取到的变迁中查找结束变迁集合;
d:基于工作流路径确定变迁之间的关系,并形成集合;
e:基于d,确定变迁之间的最大集合;
f:加入开始库所和结束库所;
g:形成工作流网络之间的弧;
h:最终构成完整的工作流网。
下面以一个实例的方式来说明本发明的应用:
实施例1
实验数据:某天用户访问教育系统的日志数据,参照上述步骤,进行以下处理。
步骤1、预处理教育日志数据C1,得到与事件相关的紧密属性的教育日志数据C2和教育数据日志统计分析表;
步骤1.1、去掉准备预处理的教育日志数据C1的部分属性,得到与事件相关的紧密属性的教育日志数据C2;
表1教育日志数据C2
步骤1.2、制定教育数据日志事件和单字母的转换表,得到以下的转换表2;
表2事件转换表
步骤1.3、根据步骤1.2中制定的转换表对教育数据日志C2进行分类,建立和教育日志数据C2中原始数据对应的用户足迹,如下表3所示;
表3转换后的用户足迹
步骤1.4、对用户足迹的出现频率和出现类型进行简要的统计分析,得到教育数据日志统计分析表,如下表4。
表4教育数据日志统计分析表
步骤2、基于传统的日志次序关系1和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以传统日志次序关系1为规则,构造关系矩阵1,结合关系矩阵1与α算法,将满足因果关系的行和列组织起来,使用α算法的第5步,移除不是最大的因果关系,生成工作流网N1
得到教育事件日志的关系矩阵1,如下表5所示:
表5使用原始日志次序关系1得到的关系矩阵1
结合关系矩阵1与α算法,得到变迁集合、开始变迁集合和结束变迁集合,结果如下;
变迁集合:{A,B,C,D,E}
开始变迁集合:{A}
结束变迁集合:{D}
通过α算法构造工作流网N1,可得到如下结果;
(1)TL={A,B,C,D,E};
(2)TI={A};
(3)TO={D};
(4)XL={({A},{B}),({A},{E}),({B},{D}),({E},{D})};
(5)YL={({A},{B,E}),({B,E},{D})};
(6)PL={p({A},{B,E}),p({B,E},{D}),iL,oL};
(7)
(8)α(L)=(PL,TL,FL);
其中,TL表示出现在日志中的活动,TI表示开始活动的集合,TO表示结束活动的集合,XL表示活动之间的连接关系,YL表示连接关系不是最大的集合都被移除,PL表示包含开始库所iL和结束库所oL的关系,FL表示生成工作流网的弧,αL表示最后构成的工作流网,形成的工作流网N1如图2所示。
步骤3、工作流网N1中存在与其他部分并不相连的孤立点,基于日志次序关系2和教育数据日志统计分析表,分别以日志活动为关系矩阵2的行和列,遍历教育日志数据C2,以日志次序关系2为规则,构造关系矩阵2,结合关系矩阵2与α算法,生成工作流网N2
得到教育事件日志的关系矩阵2,如下表6所示:
表6使用改进日志次序关系2得到的关系矩阵2
结合关系矩阵2与α算法,得出算法中的变迁集合、开始变迁集合和结束变迁集合;
变迁集合:{A,B,C,D,E}
开始变迁集合:{A}
结束变迁集合:{D}
通过α算法构造工作流网N2,可得到如下结果;
(1)TL'={A,B,C,D,E};
(2)TI'={A};
(3)TO'={D};
(4)XL'={({A},{B}),({A},{E}),({B},{D}),({E},{D}),({B},{D})};
(5)YL'={({A},{B,E}),({B,E},{D}),(B,(C,D))};
(6);
(7)
(8)α(L)'=(PL',TL',FL');
其中,TL′表示出现在日志中的活动,TI′表示开始活动的集合,TO′表示结束活动的集合,XL′表示活动之间的连接关系,YL′表示连接关系不是最大的集合都被移除,PL′表示包含开始库所iL′和结束库所oL′的关系,FL′表示生成工作流网的弧,αL′表示最后构成的工作流网,形成的工作流网N2如图3所示。
步骤4、工作流网N2中存在与其他部分并不相连的孤立点,基于日志次序关系3和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系3为规则,构造关系矩阵3,结合关系矩阵3与α算法,生成工作流网N3
得到教育事件日志的关系矩阵3,如下表7所示:
表7使用现有改进日志次序关系3得到的关系矩阵3
结合关系矩阵3与α算法,得出算法中的变迁集合、开始变迁集合和结束变迁集合;
变迁集合:{A,B,C,D,E}
开始变迁集合:{A}
结束变迁集合:{D}
通过α算法构造工作流网N3,可得到如下结果;
(1)TL”={A,B,C,D,E};
(2)TI”={A};
(3)TO”={D};
(4)XL”={({A},{B}),({A},{E}),({B},{D}),({E},{D})};
(5)YL”={({A},{B,E}),({B,E},{D})};
(6)PL”={p({A},{B,E}),p({B,E},{D}),iL”,oL″};
(7)
(8)α(L)”=(PL”,TL”,FL”);
其中,TL″表示出现在日志中的活动,TI″表示开始活动的集合,To″表示结束活动的集合,XL″表示活动之间的连接关系,YL″表示连接关系不是最大的集合都被移除,PL″表示包含开始库所iL″和结束库所OL″的关系,FL″表示生成工作流网的弧,αL″表示最后构成的工作流网,形成的工作流网N3如图4所示。
步骤5、工作流网N3中存在与其他部分并不相连的孤立点,定义日志次序关系4,根据日志次序关系4和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系4为规则,构造关系矩阵4,结合关系矩阵4与α算法,生成不含孤立点的工作流网N4
得到教育事件日志的关系矩阵4,如下表8所示:
表8使用我们改进的日志次序关系4得到的关系矩阵4
结合关系矩阵4与α算法,得出算法中的变迁集合,开始变迁集合和结束变迁集合;
变迁集合:{A,B,C,D,E}
开始变迁集合:{A}
结束变迁集合:{D}
通过α算法的构造工作流网N4,可得到如下结果;
(1)TL”'={A,B,C,D,E};
(2)TI”'={A};
(3)TO”'={D};
(4)XL”'={({A},{B}),({A},{E}),({B},{D}),({E},{D}),({B},{C}),({C},{B})};
(5)YL”'={({A},{B,E}),({B,E},{D}),({B},{C,D}),({A,C},{B})};
(6)PL”'={p({A},{B,E}),p({B,E},{D}),p({B},{C,D}),p({A,C},{B}),iL”',oL”'};
(7)
(8)α(L)”'=(PL”',TL”',FL”')
其中,TL″′表示出现在日志中的活动,TI″′表示开始活动的集合,TO″′表示结束活动的集合,XL″′表示活动之间的连接关系,YL″′表示连接关系不是最大的集合都被移除,PL″′表示包含开始库所iL″′和结束库所OL″′的关系,FL″′表示生成工作流网的弧,αL″′表示最后构成的工作流网,形成的工作流网N4如图5所示。
步骤6、根据工作流网N4构建活动间的连接关系,计算每个活动的导航度和权威度,最终对于工作流网中设计不合理的活动作出改进。其中N1和N3不是一个完整的工作流网络,其中包含一个孤立点;其中N2中有一个点中没有输出库所,故而不完整;其中N4是一个完整的工作流网络。
本发明说明书附图的图1、图2以及图3为原始日志次序关系1、变体的日志次序关系2以及日志次序关系3构造出来的工作流网,如图4为使用我们改进的日志次序关系4构造出来的完整工作流网,从结果来看,在图1、图2以及图3中,均将事件C遗漏,事件C在日志中存在…BCB…的形式,故符合2循环问题。在通过使用我们改进的日志次序构造工作流网时,可看出工作流网是完整的,没有任何事件被遗漏,优化效果明显,达到了预期的效果。

Claims (2)

1.一种面向教育数据的工作流方法,其特征在于,以教育系统数据日志为输入,以petri网描述的工作流网为输出结果,具体步骤如下:
步骤1、预处理教育日志数据C1,得到与事件相关的紧密属性的教育日志数据C2和教育数据日志统计分析表;
步骤2、基于传统的日志次序关系1和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以传统日志次序关系1为规则,构造关系矩阵1,结合关系矩阵1与α算法,将满足因果关系的行和列组织起来,使用α算法的第5步,移除不是最大的因果关系,生成工作流网N1
传统日志次序关系1定义如下:
令w是包含变迁T集合的工作流日志,a∈T,b∈T;
顺序关系:
a>wb并且仅当存在路径σ=<t1,t2,t3,...,tn>,i∈{1,...,n-1},σ∈w,ti=a并且ti+1=b;
因果关系:a→wb当且仅当a>wb并且b≯wa:
不相关关系:a≠wb当且仅当a≯wb并且b≯wa:
并行关系:a||wb当且仅当a>wb并且b>wa:
其中,w表示工作流日志,T表示变迁集合,a表示变迁集合中的具体活动,b表示变迁集合中的具体活动;σ表示用户某一操作集合,<t1,t2,t3,...,tn>表示用户某一次操作的具体活动,i表示某一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti表示某一个用户的第i个活动所表示的字母;
步骤3、工作流网N1中存在与其他部分并不相连的孤立点,基于日志次序关系2和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系2为规则,构造关系矩阵2,结合关系矩阵2与α算法,生成工作流网N2
日志次序关系2定义如下:
令w′是包含变迁T′集合的工作流日志,a′∈T′,b′∈T′;:
顺序关系:
a′>w′b′当且仅当存在路径σ′=<t1′t2′t3′,...,tn′>,i∈{1,2,...,n-1},σ′∈w′,ti′=a′并且ti+1′=b′;因果关系:
a′>w′b′当且仅当a′>w′b′并且((b′≯w′a′)或者(并且i∈{1,2,...,n-2}并且ti′=ti+2′=a′并且ti+2′=b′]));
不相关关系:a′≠w′b′当且仅当a′≯w′b′并且a′>w′b′当且仅当b′>w′a′;
并行关系:
a′||w′b′当且仅当a′>w′b′并且((b′>w′a′)并且(并且i∈{1,2,...,n-2}并且ti′=ti+2′=a′并且ti+1=b′])):
其中,w′表示工作流日志,T′表示变迁集合,a′表示变迁集合中的具体活动,b′表示变迁集合中的具体活动;σ′表示用户某一操作集合,<t1′,t2′,t3′,...,tn′>表示用户某一次操作的具体活动,i表示某一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti′表示某一个用户的第i个活动所表示的字母;
步骤4、工作流网N2中存在与其他部分并不相连的孤立点,基于日志次序关系3和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系3为规则,构造关系矩阵3,结合关系矩阵3与α算法,生成工作流网N3
日志次序关系3定义如下:
令w″是包含变迁T″集合的工作流日志,a″∈T″,b″∈T″;
前提条件:
1:a″Δw″b″当且仅当存在路径σ″=<t1″t2″t3″,...,tn″>,t∈{1,2,3,...,n-1},σ″∈w″,ti″=ti+2″=a″并且ti+1″=b″;
2:当且仅当a″Δw″b″并且b″Δw″a″;
顺序关系:
a″>w″b″当且仅当存在路径σ″=<t1″t2″t3″,...,tn″>,i∈{1,2,3,...,n-1},如σ″∈w″,ti″=a″并且ti+1″=b″;
因果关系:a″→w″b″当且仅当a″>w″b″并且((b″≯w″a″)或者
不相关关系:
并行关系:a″||″w″b″当且仅当a″>″w″b″并且b″>″w″a″并且
其中,w″表示工作流日志,T″表示变迁集合,a″表示变迁集合中的具体活动,b″表示变迁集合中的具体活动;σ″表示用户某一操作集合,<t1″,t2″,t3″,...,tn″>表示用户某一次操作的具体活动,i表示某一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti″表示某一个用户的第i个活动所表示的字母;
步骤5、工作流网N3中存在与其他部分并不相连的孤立点,定义日志次序关系4,根据日志次序关系4和教育数据日志统计分析表,分别以日志活动为行和列,遍历教育日志数据C2,以日志次序关系4为规则,构造关系矩阵4,结合关系矩阵4与α算法,生成不含孤立点的工作流网N4
日志次序关系4的具体定义为:
令w″′是包含变迁T″′集合的工作流日志,a″′∈T″′,b″′∈T″″;
顺序关系:a″′>w″′b″′当且仅当存在路径σ″′=<t1″′t2″′t3″′,...,tn″′>,i∈{1,2,3,...,n-1},σ″′∈w″′,ti″′=a″′并且ti+1″′=b″′;
因果关系:a″′→w″′b″′当且仅当a″′>w″′b″′并且(b″′≯w″′a″′)或者(并且i∈(1,2,...,n-2)并且ti″′=ti+2″′=a″′并且ti+1″′=b″′])或((/>并且i∈(1,2,...,n-2)并且ti″′=ti+2″′=b″′并且ti+1″′=a″′]));
不相关关系:a″′#″′w″′b″′当且仅当a″′≯″′w″′b″′并且b″′≯″′w″′a″:
并行关系:a″′||″′w″′b″′当且仅当a″>″′w″′b″′并且b″′>″′w″′a″′并且
(并且i∈(1,2,...,n-2)](ti″′=a″′并且ti+1″′=b″′并且tt+1″′≠ti″′≠ti+2″′)或者(tt″′=a″′并且ti+1″′=b″′并且ti+1″′≠ti″′≠ti+2″′));
其中,w″′表示工作流日志,T″′表示变迁集合,a″′表示变迁集合中的具体活动,b″′表示变迁集合中的具体活动;σ″′表示用户某一操作集合,<t1″′,t2″′,t3″′,...,tn″′>表示用户某一次操作的具体活动,i表示某一条用户足迹包含的活动数目,n表示每一个用户活动足迹的总数目,ti″′表示某一个用户的第i个活动所表示的字母;
步骤6、根据工作流网N4构建活动间的连接关系,计算每个活动的导航度和权威度,最终对于工作流网N4中设计不合理的活动作出改进。
2.根据权利要求1所述的一种面向教育数据日志的工作流方法,其特征在于,教育日志数据预处理的具体步骤为:
步骤1.1、去掉准备预处理的教育日志数据C1的部分属性,得到与事件相关的紧密属性的教育日志数据C2;
步骤1.2、制定教育日志数据日志事件和单字母的转换表;
步骤1.3、根据步骤1.2中制定的转换表对教育日志数据C2进行分类,建立和教育日志数据C2中原始数据对应的用户足迹;
步骤1.4、对用户足迹的出现频率和出现类型进行简要的统计分析,得到教育数据日志统计分析表。
CN201910350266.1A 2019-04-28 2019-04-28 一种面向教育数据日志的工作流方法 Active CN110084517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910350266.1A CN110084517B (zh) 2019-04-28 2019-04-28 一种面向教育数据日志的工作流方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910350266.1A CN110084517B (zh) 2019-04-28 2019-04-28 一种面向教育数据日志的工作流方法

Publications (2)

Publication Number Publication Date
CN110084517A CN110084517A (zh) 2019-08-02
CN110084517B true CN110084517B (zh) 2024-01-30

Family

ID=67417423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910350266.1A Active CN110084517B (zh) 2019-04-28 2019-04-28 一种面向教育数据日志的工作流方法

Country Status (1)

Country Link
CN (1) CN110084517B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7065493B1 (en) * 2000-04-06 2006-06-20 International Business Machines Corporation Workflow system and method
CN101778110A (zh) * 2010-01-04 2010-07-14 北京航空航天大学 业务协议挖掘方法及装置
JP2010271806A (ja) * 2009-05-20 2010-12-02 Fujitsu Ltd 業務フロー処理プログラム、方法及び装置
CN101923672A (zh) * 2010-03-23 2010-12-22 湖南科技大学 一种工作流实例方面成批处理模式的挖掘方法
CN105095491A (zh) * 2015-08-18 2015-11-25 山东科技大学 基于Petri网基本结构的过程模型修复方法
CN107391715A (zh) * 2017-07-31 2017-11-24 山东科技大学 一种自由单循环结构的过程挖掘方法
CN108416365A (zh) * 2018-02-06 2018-08-17 山东科技大学 基于距离的并发完备日志挖掘方法
CN109102150A (zh) * 2018-07-03 2018-12-28 山东科技大学 一种基于阶梯矩阵和过程树的过程模型修正方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160086110A1 (en) * 2014-09-18 2016-03-24 Tin Kam Ho Systems and methods for workflow analysis

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7065493B1 (en) * 2000-04-06 2006-06-20 International Business Machines Corporation Workflow system and method
JP2010271806A (ja) * 2009-05-20 2010-12-02 Fujitsu Ltd 業務フロー処理プログラム、方法及び装置
CN101778110A (zh) * 2010-01-04 2010-07-14 北京航空航天大学 业务协议挖掘方法及装置
CN101923672A (zh) * 2010-03-23 2010-12-22 湖南科技大学 一种工作流实例方面成批处理模式的挖掘方法
CN105095491A (zh) * 2015-08-18 2015-11-25 山东科技大学 基于Petri网基本结构的过程模型修复方法
CN107391715A (zh) * 2017-07-31 2017-11-24 山东科技大学 一种自由单循环结构的过程挖掘方法
CN108416365A (zh) * 2018-02-06 2018-08-17 山东科技大学 基于距离的并发完备日志挖掘方法
CN109102150A (zh) * 2018-07-03 2018-12-28 山东科技大学 一种基于阶梯矩阵和过程树的过程模型修正方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于关系矩阵的工作流日志重复任务识别算法;潘建梁,俞东进,陈耀旺;《计算机集成制造系统》;20180730;第24卷(第7期);全文 *
基于统计α算法的过程挖掘;余建波,董晨阳,李传锋;《北京航空航天大学学报》;20180531;第44卷(第5期);全文 *
面向教育数据日志分析的用户行为预测研究;成耐克;《CNKI优秀硕士学位论文全文库》;20190630;全文 *

Also Published As

Publication number Publication date
CN110084517A (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
McCown Locating agricultural decision support systems in the troubled past and socio-technical complexity of ‘models for management’
Rykiel Jr Artificial intelligence and expert systems in ecology and natural resource management
Leu et al. A multi-disciplinary review of knowledge acquisition methods: From human to autonomous eliciting agents
CN111428056A (zh) 一种科研人员合作社区的构建方法及装置
CN107315775A (zh) 一种指数计算平台和方法
CN111428152A (zh) 一种科研人员相似社区的构建方法及装置
CN107590254A (zh) 具有合并处理方法的大数据支撑平台
Zhu et al. A genetic programming-based iterative approach for the integrated process planning and scheduling problem
CN106570188A (zh) 一种多主题消息传播中结构洞节点的挖掘方法
CN113298131A (zh) 一种基于注意力机制的时序数据缺失值插补方法
Aljehani et al. Preserving Privacy in Association Rule Mining Using Metaheuristic-Based Algorithms: A Systematic Literature Review
CN110084517B (zh) 一种面向教育数据日志的工作流方法
CN103927431A (zh) 基于pyramid时间框架的电站锅炉运行状态监测方法
CN101334863A (zh) 基于要素分析的综合集成研讨环境中的方案生成系统及方法
Chen et al. An Attribute Reduction Algorithm Based on Rough Set Theory and an Improved Genetic Algorithm.
Zhou Complex network evolution game experimental platform based on PyQt5
CN117875726B (zh) 基于深度学习的价值链优化管控方法
Yang et al. Research on the intelligent design of the multidimensional form of a product under a brand cobweb constraint
Li Performance Evaluation of Planning and Design Projects Based on DEA-CART Algorithm
Santos et al. VISUALIZATION OF ASSOCIATION RULES
Guo et al. EEG-based emotion recognition via improved evolutionary convolutional neural network
Târnăveanu Knowledge-Based Decisions in Tourism
Peng et al. A Study of Wordle Reported Outcome Data Based on ARIMA-XGBoost Model
Wang et al. Analysis of Factors Influencing University Performance Based on Feature Selection Optimization Gray Correlation Analysis Model
Fang et al. Relational Knowledge Prediction via Dynamic Bi-Mode Embedding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230629

Address after: 710000 No. B49, Xinda Zhongchuang space, 26th Street, block C, No. 2 Trading Plaza, South China City, international port district, Xi'an, Shaanxi Province

Applicant after: Xi'an Huaqi Zhongxin Technology Development Co.,Ltd.

Address before: 710048 Shaanxi province Xi'an Beilin District Jinhua Road No. 5

Applicant before: XI'AN University OF TECHNOLOGY

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231227

Address after: Room 1104, 11th Floor, Building 16, No. 6 Wenhuayuan West Road, Beijing Economic and Technological Development Zone, Haidian District, Beijing 102600

Applicant after: Beijing Yiyin Technology Co.,Ltd.

Address before: 710000 No. B49, Xinda Zhongchuang space, 26th Street, block C, No. 2 Trading Plaza, South China City, international port district, Xi'an, Shaanxi Province

Applicant before: Xi'an Huaqi Zhongxin Technology Development Co.,Ltd.

GR01 Patent grant
GR01 Patent grant