CN114240179A - 一种基于事件图谱的财务流程挖掘方法和相关装置 - Google Patents
一种基于事件图谱的财务流程挖掘方法和相关装置 Download PDFInfo
- Publication number
- CN114240179A CN114240179A CN202111565057.2A CN202111565057A CN114240179A CN 114240179 A CN114240179 A CN 114240179A CN 202111565057 A CN202111565057 A CN 202111565057A CN 114240179 A CN114240179 A CN 114240179A
- Authority
- CN
- China
- Prior art keywords
- node
- financial
- nodes
- target node
- operation event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 141
- 230000008569 process Effects 0.000 title claims abstract description 93
- 238000005065 mining Methods 0.000 title claims abstract description 52
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 6
- 238000009412 basement excavation Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 10
- 230000002159 abnormal effect Effects 0.000 description 6
- 230000006399 behavior Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004801 process automation Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请公开了一种基于事件图谱的财务流程挖掘方法和相关装置,根据财务系统的操作流程构建业务操作事件图谱,根据用户使用财务系统产生的系统操作日志,确定业务操作事件图谱中相邻节点出现的次数,并作为相邻节点对应的节点连线的权重,基于目标节点和对应节点连线的权重,从业务操作事件图谱中挖掘财务流程。由此,不再需要依赖于大量的专家知识和复杂的预定义的事件‑条件‑动作规则信息,仅根据财务系统的操作流程中操作步骤间的关系,即可挖掘得到财务流程,开发难度降低、成本减少。
Description
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种基于事件图谱的财务流程挖掘方法和相关装置。
背景技术
我国正处于数字技术和经济社会的深层整合、传统产业数字化转化和高度化时期,在新时代背景的推动下,尤其是新的市场经济条件和环境下,业务需求处于不断变化之中,企业必须持续不断投入大量的人力设计新流程以适应新的业务变化。流程挖掘技术是基于流程建模方法和数据挖掘技术应用于业务流程管理的新技术,是财务数字化转型的关键要素之一。
机器人流程自动化(简称RPA)是财务工作是财务数字化转型的关键要素之一,但从机器人流程挖掘的历史经验来看,目前财务人员在日常工作中哪些流程可以通过RPA实现流程自动化不是很清晰,需要通过需求人员和财务人员反复沟通、调研,才能完成业务流程的梳理和挖掘,效率较低。
发明内容
针对上述问题,本申请提供一种基于事件图谱的财务流程挖掘方法和相关装置,用于提高财务流程挖掘的效率。
基于此,本申请实施例公开了如下技术方案:
一方面,本申请实施例提供一种基于事件图谱的财务流程挖掘方法,所述方法包括:
根据财务系统的操作流程构建业务操作事件图谱;所述业务操作事件图谱包括表示操作步骤的节点和标识所述操作步骤间执行顺序的节点连线;
根据用户使用所述财务系统产生的系统操作日志,确定所述业务操作事件图谱中相邻节点出现的次数,并作为所述相邻节点对应的节点连线的权重;
基于目标节点和对应节点连线的权重,从所述业务操作事件图谱中挖掘财务流程,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个。
可选的,所述从所述业务操作事件图谱中挖掘财务流程之前,所述方法还包括:
根据与目标节点连接的前m个节点和后n个节点确定假定事件链条,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个;
获取所述假定事件链条包括的节点连线的第一权重和,以及所述假定事件链条中与所述目标节点连接的目标节点连线的第二权重;
若所述第一权重和与所述第二权重不满足预设条件,删除所述目标节点连线,得到更新后的业务操作事件图谱。
可选的,所述方还包括:
将所述财务流程与所述系统操作日志中包括的流程进行匹配;
若完全匹配,则所述财务流程挖掘成功。
可选的,所述根据财务系统的操作流程构建业务操作事件图谱,包括:
根据所述财务系统的系统使用手册构建初始业务操作事件图谱;
根据用户使用所述财务系统产生的系统操作日志抽取知识链,每条知识链用于标识一个操作流程,包括多个操作步骤和所述操作步骤间的执行顺序;
通过知识对齐将所述知识链添加到所述初始业务操作事件图谱中,生成所述业务操作事件图谱。
可选的,所述基于目标节点和对应节点连线的权重,从所述业务操作事件图谱中挖掘财务流程,包括:
建立包括目标节点的起点集合;
以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合,所述路径集合包括所述起点集合中每个节点到其他节点的节点连线和对应的权重,所述其他节点为所述业务操作事件图谱中除所述起点集合中包括的节点外的节点;
将所述路径集合中权重最大的节点连线对应的节点添加至所述起点集合,执行所述以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合的步骤,直至没有节点添加到所述起点集合中;
根据所述起点集合生成财务流程。
另一方面,本申请实施例提供一种基于事件图谱的财务流程挖掘装置,所述装置包括:构建单元、确定单元和挖掘单元;
所述构建单元,用于根据财务系统的操作流程构建业务操作事件图谱;所述业务操作事件图谱包括表示操作步骤的节点和标识所述操作步骤间执行顺序的节点连线;
所述确定单元,用于根据用户使用所述财务系统产生的系统操作日志,确定所述业务操作事件图谱中相邻节点出现的次数,并作为所述相邻节点对应的节点连线的权重;
所述挖掘单元,用于基于目标节点和对应节点连线的权重,从所述业务操作事件图谱中挖掘财务流程,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个。
可选的,所述装置还包括更新单元,用于:
根据与目标节点连接的前m个节点和后n个节点确定假定事件链条,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个;
获取所述假定事件链条包括的节点连线的第一权重和,以及所述假定事件链条中与所述目标节点连接的目标节点连线的第二权重;
若所述第一权重和与所述第二权重不满足预设条件,删除所述目标节点连线,得到更新后的业务操作事件图谱。
另一方面本申请提供了一种计算机设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行上述方面所述的方法。
另一方面本申请提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的方法。
相对于现有技术,本申请上述技术方案的优点在于:
根据财务系统的操作流程构建业务操作事件图谱,根据用户使用财务系统产生的系统操作日志,确定业务操作事件图谱中相邻节点出现的次数,并作为相邻节点对应的节点连线的权重,基于目标节点和对应节点连线的权重,从业务操作事件图谱中挖掘财务流程。由此,不再需要依赖于大量的专家知识和复杂的预定义的事件-条件-动作规则信息,仅根据财务系统的操作流程中操作步骤间的关系,即可挖掘得到财务流程,开发难度降低、成本减少。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种基于事件图谱的财务流程挖掘方法的流程图;
图2为本申请实施例提供的一种业务操作事件图谱的示意图;
图3为本申请实施例提供的一种业务操作事件图谱的生成示意图;
图4为本申请实施例提供的一种业务操作事件图谱的示意图;
图5为本申请实施例生成财务流程的示意图;
图6为本申请实施例提供的一种基于事件图谱的财务流程挖掘装置的示意图;
图7为本申请实施例提供的一种计算机设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
鉴于财务流程挖掘的效率低,相关技术中,主要使用基于事件日志的可配置流程挖掘方法,通过人为定义大量的事件-条件-动作规则信息,完成事件日志的流程挖掘。但是,基于事件日志的可配置流程挖掘方法的开展依赖于大量的专家知识和复杂的预定义的事件-条件-动作规则信息,开发成本较高。
基于此,本申请实施例提供一种基于事件图谱的财务流程挖掘方法,利用事件图谱良好的组织和利用信息的能力,将非结构化数据与结构化数据知识进行整合,构建完善的业务操作流程事件图谱,并以此为基础实现了财务流程挖掘。无需依赖于大量的专家知识和复杂的预定义的事件-条件-动作规则信息,仅根据财务系统的操作流程中操作步骤间的关系,即可挖掘得到财务流程,开发难度降低、成本减少。
为了使发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。在符合本发明的技术构思前提下,在某个特定实施例中描述的特征、结构、特性或表达细节不排除可以以合适的方式结合或者更多其他的实施例中。附图中所示的流程图仅为示例性说明,不是必须所包括的内容和操作步骤,也不是必须按所描述的顺序进行。例如,有的操作步骤还可以分解,而有的操作步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
下面结合图1,对本申请实施例提供的一种基于事件图谱的财务流程挖掘方法进行介绍。参见图1,该图为本申请实施例提供的一种基于事件图谱的财务流程挖掘方法的流程图,该方法可以包括S101-S103。
S101:根据财务系统的操作流程构建业务操作事件图谱。
目前财务系统日志数据中隐藏的大量有效模式知识,而利用流程挖掘技术可以从控制流、组织和资源等多个视图分析挖掘这些数据,能够更好地实现事件数据和流程模型之间的链接,自动挖掘财务人员日常重复性高、规律性明确的流程,并给出财务人员相关流程自动化的建议。
财务系统中具有很多操作,不同操作之间构成了不同的操作流程,如操作步骤A-操作步骤B-操作步骤C构成一个操作流程,操作步骤B-操作步骤C-操作步骤A构成了另一个操作流程。
基于不同的操作流程可以构建针对于财务系统的业务操作事件图谱,其中,业务操作事件图谱包括多个节点,每个节点表示一个操作步骤,操作步骤之间具有顺序,可以基于操作顺序(节点关系),通过有向线连接两个节点。如图2所示,该图为由上述两个操作流程构成的业务操作事件图谱。
作为一种可能的实现方式,下面介绍根据财务系统的操作流程构建业务操作事件图谱的一个实施例。
S1011:根据财务系统的系统使用手册构建初始业务操作事件图谱。
需要说明的是,财务系统的系统使用手册是在构建财务系统时,为了指导用户如何使用财务系统而构建的内容。可以理解的是,财务系统的系统使用手册属于非结构化数据。
系统使用手册中记载了多个操作步骤以及操作步骤之间的执行顺序,基于系统使用手册可以构建初始业务操作事件图谱,其中,初始业务操作事件图谱中包括了多个节点,每个节点表示一个操作步骤,以及标识操作步骤间执行顺序的节点连线。相比于业务操作事件图谱,初始业务操作事件图谱包括的内容较少,为了完善初始业务操作事件图谱,还会在初始业务操作事件图谱的基础上添加知识链,下面具体说明。
S1012:根据用户使用财务系统产生的系统操作日志抽取知识链。
在实际应用中,用户,或者说财务人员在使用财务系统时会产生系统操作日志,系统操作日志中记载了用户在何时如何使用了财务系统,通过系统操作日志可以清晰的明确到用户在日常工作中哪些操作流程可以通过RPA实现流程自动化,进而通过系统操作日志可以抽取知识链。
其中,一条知识链表征一个用户常用的操作流程,包括多个操作步骤以及多个操作步骤之间的执行顺序。
S1013:通过知识对齐将知识链添加到初始业务操作事件图谱中,生成业务操作事件图谱。
其中,知识对齐是对初始业务操作事件图谱的节点与知识链的节点中同形甚至是同义不同形的节点,按照其对应的节点之间的关系进行合并。
参见图3,该图为本申请实施例提供的一种业务操作事件图谱的生成示意图。图3左图所示的为一种初始业务操作事件图谱,通过S1012生成的知识链为操作步骤A-操作步骤B-操作步骤D,当二者通过知识对齐进行融合后,生成如图3右图所示的业务操作事件图谱。
S102:根据用户使用财务系统产生的系统操作日志,确定业务操作事件图谱中相邻节点出现的次数,并作为相邻节点对应的节点连线的权重。
从系统操作日志中分析业务操作事件图谱中,节点与节点关系的出现次数并将其记录在节点与节点对应的边上。
继续以图2为例,若系统操作日志中操作步骤A-操作步骤B出现10次,则节点A与节点B之间的节点连线对应的权重为10。若系统操作日志中操作步骤B-操作步骤C出现5次,则节点B与节点C之间的节点连线对应的权重为5。若系统操作日志中操作步骤C-操作步骤A出现1次,则节点B与节点C之间的节点连线对应的权重为1。由此,生成如图4所示的带有权重的业务操作事件图谱。
S103:基于目标节点和对应节点连线的权重,从业务操作事件图谱中挖掘财务流程。
以业务操作事件图谱包括的多个节点中的一个节点(目标节点)为例,在业务操作事件图谱中能够得到多条包括目标节点的路径,每条路径对应一条财务流程,通过节点连线的权重能够确定每条路径对应的权重,权重越大可信度越大,从而实现从业务操作事件图谱中财务流程。
由上述方案可以得到,根据财务系统的操作流程构建业务操作事件图谱,根据用户使用财务系统产生的系统操作日志,确定业务操作事件图谱中相邻节点出现的次数,并作为相邻节点对应的节点连线的权重,基于目标节点和对应节点连线的权重,从业务操作事件图谱中挖掘财务流程。由此,不再需要依赖于大量的专家知识和复杂的预定义的事件-条件-动作规则信息,仅根据财务系统的操作流程中操作步骤间的关系,即可挖掘得到财务流程,开发难度降低、成本减少。
作为一种可能的实现方式,建立包括目标节点的起点集合;以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合,所述路径集合包括所述起点集合中每个节点到其他节点的节点连线和对应的权重,所述其他节点为所述业务操作事件图谱中除所述起点集合中包括的节点外的节点;将所述路径集合中权重最大的节点连线对应的节点添加至所述起点集合,执行所述以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合的步骤,直至没有节点添加到所述起点集合中;根据所述起点集合生成财务流程。
下面结合图5以一个实施例对S103的一种可实现方式进行说明。
利用业务操作事件图谱,假设将事件图谱中顶点分成2个集合,分别为起点集合U和路径集合V-U。可以理解的是,起点集合U中包括目标节点,基于目标起点,路径集合V-U中包括与目标节点具有连接关系的节点以及连接关系。每次选取路径集合V-U中节点连线对应权重最大的,将该节点连线连接的节点加入到集合U中,直至将所有可连通的节点加入到起点集合U中,即可得到一种潜在的财务流程。
假如所建立的事件图谱如图5中(a)所示,其中,业务操作事件图谱的中英文字母V(V1-V6)表示节点,节点之间的边代表两个节点之间存在先后关系(此处忽略先后关系),边上数字表示先后关系在系统操作日志中出现的频数。
首先,选取图中的任一节点V作为财务流程的起始节点,之后若向该财务流程中添加节点W,则在节点V和节点W之间必定存在一条边,并且该边的权值在节点V与其他节点之间相连接的权值中最大。
以V2点为起始节点(目标节点),此时的起点集合U={V2},路径集合V-U包括的路径及其对应的权值有V2-V1=1、V2-V4=2、V2-V3=7。取最大的V2-V3,所以将V3点添加到起点集合U中,即U={V2,V3},如图3中(b)所示。
当U={V2,V3}时,路径集合V-U包括的路径及其对应的权值有V2-V1=1,V2-V4=2,V3-V1=4,V3-V4=4,V3-V6=5,取最大的V3-V6,将V6点添加到起点集合U中,即U={V2,V3,V6},如图3中(c)所示。
当U={V2,V3,V6}时,路径集合V-U包括的路径及其对应的权值有V2-V1=1,V2-V4=2,V3-V1=4,V3-V4=4,V6-V4=5,V6-V5=1,取最大的V6-V4,将V4点添加到起点集合U中,即U={V2,V3,V6,V4},如图3中(d)所示。
当U={V2,V3,V6,V4}时,路径集合V-U包括的路径及其对应的权值有V2-V1=1,V2-V4=2,V3-V1=4,V3-V4=4,V6-V5=1,取最大的V3-V1,可以理解的是,若有相同大小的,可以任意去一条,将V1点添加到起点集合U中,即U={V2,V3,V6,V4,V1},如图3中(e)所示。
依次不断选择,直到将所有节点添加完毕,或者说没有节点可以添加到起点集合中,即得到潜在可能的财务流程,如图3中(f)所示。
作为一种可能的实现方式,在S103之前,为了避免异常日志数据带来的影响,可以去除异常节点,使得后续挖掘得到的财务流程更为准确,下面具体说明。
相关技术中,基于Petri网的业务流程低频行为挖掘方法不可避免受到噪音日志或异常行为日志的干扰,往往挖掘的流程是局部最优解而不是全局最优解,基于此,基于Petri网的业务流程低频行为挖掘方法利用行为语义区分低频行为和噪音,但是该种方式仅利用2个节点之间的语义,还是不可避免的辨识率较低。基于此,本申请实施例提供了一种基于多个节点分析,去除异常节点的方式,具体如S201-S203所示。
S201:根据与目标节点连接的前m个节点和后n个节点确定假定事件链条。
其中,m和n为正整数,可以相等也可以不等,本申请对此不做具体限定。下面以m=3,n=3为例,结合目标节点进行说明。
S202:获取假定事件链条包括的节点连线的第一权重和,以及假定事件链条中与目标节点连接的目标节点连线的第二权重。
假定事件链条中包括m+n+1个节点,以及m+n条节点连线,每一条节点连线具备一个权重,由此可以基于m+n条节点连线分别对应的权重,得到第一权重和。
需要说明的是,在假定事件链条中,存在3条与目标节点连接的节点连线,分别是,目标节点与上一个节点的节点连线、目标节点与下一个节点的节点连线,以及前述两条节点连线构成的连线。上述3条节点连线均可以作为目标节点连线,本申请对此不做具体限定。可以理解的是,对应于目标节点连线的不同,对应的第二权重大小不同,后续对应的预设条件也会不同。
S203:若第一权重和与第二权重不满足预设条件,删除目标节点连线,得到更新后的业务操作事件图谱。
若目标节点连线出现的次数较多,对应的第二权重与第一权重和的差距不会太多,则说明目标节点连线不是异常日志数据生成的可能性较大。若目标节点连线出现的次数较少,对应的第二权重与第一权重和的差距会比较大,则说明目标节点连线是异常日志数据生成的可能性较大。
其中,预设条件是用于确定目标节点连线出现的次数较多而设置的,例如,若第二权重超过第一权重和的一半。
作为一种可能的实现方式,可以将业务操作事件图谱中每一条节点连线作为目标节点连线进行判断,得到更新后的业务操作事件图谱,由此得到的业务操作事件图谱的准确性更高,后续挖掘得到的财务流程更为准确。
下面以一个例子进行说明。在业务操作事件图谱中,基于操作步骤间的执行关系,获取目标节点之前的3个节点和之后的3个节点,加上当前节点,一共7个节点构成了一条假定事件链条。以目标节点与上一个节点的节点连线作为目标节点连线,若目标节点连线的第二权重没有超过假定事件链条对应的第一权重和的一半,则认为第一权重和与第二权重不满足预设条件,目标节点出自异常日志的可能性较大,则删除该目标节点连线,得到更新后的业务操作事件图谱。
由此,相较于基于Petri网的业务流程低频行为挖掘方法中利用行为语义区分低频行为和噪音,本申请实施例提供的方式能够从假定事件链条整体出发,而不是仅仅依靠2个事件节点之间的语义关系来区分低频与噪音日志数据,可以提高噪音日志识别率。
进一步的,删除的目标节点可以删除假定事件链条对应的系统操作日志,将财务流程与系统操作日志中包括的流程进行匹配,若完全匹配,则财务流程挖掘成功。若没有完全匹配,则删除该条财务流程,进一步提高财务流程的准确性。
本申请实施例除了提供的基于事件图谱的财务流程挖掘方法外,还提供了基于事件图谱的财务流程挖掘装置,如图6所示,所述装置包括:构建单元601、确定单元602和挖掘单元603;
所述构建单元601,用于根据财务系统的操作流程构建业务操作事件图谱;所述业务操作事件图谱包括表示操作步骤的节点和标识所述操作步骤间执行顺序的节点连线;
所述确定单元602,用于根据用户使用所述财务系统产生的系统操作日志,确定所述业务操作事件图谱中相邻节点出现的次数,并作为所述相邻节点对应的节点连线的权重;
所述挖掘单元603,用于基于目标节点和对应节点连线的权重,从所述业务操作事件图谱中挖掘财务流程,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个。
作为一种可能的实现方式,所述装置还包括更新单元,用于:
根据与目标节点连接的前m个节点和后n个节点确定假定事件链条,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个;
获取所述假定事件链条包括的节点连线的第一权重和,以及所述假定事件链条中与所述目标节点连接的目标节点连线的第二权重;
若所述第一权重和与所述第二权重不满足预设条件,删除所述目标节点连线,得到更新后的业务操作事件图谱。
作为一种可能的实现方式,所述装置还包括匹配单元,用于:
将所述财务流程与所述系统操作日志中包括的流程进行匹配;
若完全匹配,则所述财务流程挖掘成功。
作为一种可能的实现方式,所述构建单元601,用于:
根据所述财务系统的系统使用手册构建初始业务操作事件图谱;
根据用户使用所述财务系统产生的系统操作日志抽取知识链,每条知识链用于标识一个操作流程,包括多个操作步骤和所述操作步骤间的执行顺序;
通过知识对齐将所述知识链添加到所述初始业务操作事件图谱中,生成所述业务操作事件图谱。
作为一种可能的实现方式,所述挖掘单元603,用于:
建立包括目标节点的起点集合;
以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合,所述路径集合包括所述起点集合中每个节点到其他节点的节点连线和对应的权重,所述其他节点为所述业务操作事件图谱中除所述起点集合中包括的节点外的节点;
将所述路径集合中权重最大的节点连线对应的节点添加至所述起点集合,执行所述以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合的步骤,直至没有节点添加到所述起点集合中;
根据所述起点集合生成财务流程。
由上述技术方案可知,根据财务系统的操作流程构建业务操作事件图谱,根据用户使用财务系统产生的系统操作日志,确定业务操作事件图谱中相邻节点出现的次数,并作为相邻节点对应的节点连线的权重,基于目标节点和对应节点连线的权重,从业务操作事件图谱中挖掘财务流程。由此,不再需要依赖于大量的专家知识和复杂的预定义的事件-条件-动作规则信息,仅根据财务系统的操作流程中操作步骤间的关系,即可挖掘得到财务流程,开发难度降低、成本减少。
本申请实施例还提供了一种计算机设备,参见图7,该图示出了本申请实施例提供的一种计算机设备的结构图,如图7所示,所述设备包括处理器710以及存储器720:
所述存储器710用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器720用于根据所述程序代码中的指令执行上述实施例提供的任一种基于事件图谱的财务流程挖掘方法。
本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序于执行上述实施例提供的任一种基于事件图谱的财务流程挖掘方法。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面的各种可选实现方式中提供的基于事件图谱的财务流程挖掘方法。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明以较佳的实例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可以利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为同等变化等效实施例。因此,凡未脱离本发明技术方案的内容,依据本发明技术方案实质对以上实例做出的简单修改等同变化及修饰,均仍属于本发明技术方案保护范围内。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于事件图谱的财务流程挖掘方法,其特征在于,所述方法包括:
根据财务系统的操作流程构建业务操作事件图谱;所述业务操作事件图谱包括表示操作步骤的节点和标识所述操作步骤间执行顺序的节点连线;
根据用户使用所述财务系统产生的系统操作日志,确定所述业务操作事件图谱中相邻节点出现的次数,并作为所述相邻节点对应的节点连线的权重;
基于目标节点和对应节点连线的权重,从所述业务操作事件图谱中挖掘财务流程,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个。
2.根据权利要求1所述的方法,其特征在于,所述从所述业务操作事件图谱中挖掘财务流程之前,所述方法还包括:
根据与目标节点连接的前m个节点和后n个节点确定假定事件链条,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个;
获取所述假定事件链条包括的节点连线的第一权重和,以及所述假定事件链条中与所述目标节点连接的目标节点连线的第二权重;
若所述第一权重和与所述第二权重不满足预设条件,删除所述目标节点连线,得到更新后的业务操作事件图谱。
3.根据权利要求2所述的方法,其特征在于,所述方还包括:
将所述财务流程与所述系统操作日志中包括的流程进行匹配;
若完全匹配,则所述财务流程挖掘成功。
4.根据权利要求1所述的方法,其特征在于,所述根据财务系统的操作流程构建业务操作事件图谱,包括:
根据所述财务系统的系统使用手册构建初始业务操作事件图谱;
根据用户使用所述财务系统产生的系统操作日志抽取知识链,每条知识链用于标识一个操作流程,包括多个操作步骤和所述操作步骤间的执行顺序;
通过知识对齐将所述知识链添加到所述初始业务操作事件图谱中,生成所述业务操作事件图谱。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述基于目标节点和对应节点连线的权重,从所述业务操作事件图谱中挖掘财务流程,包括:
建立包括目标节点的起点集合;
以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合,所述路径集合包括所述起点集合中每个节点到其他节点的节点连线和对应的权重,所述其他节点为所述业务操作事件图谱中除所述起点集合中包括的节点外的节点;
将所述路径集合中权重最大的节点连线对应的节点添加至所述起点集合,执行所述以所述起点集合中包括的节点为起点,确定与所述起点集合中包括的节点具有连接关系的路径集合的步骤,直至没有节点添加到所述起点集合中;
根据所述起点集合生成财务流程。
6.一种基于事件图谱的财务流程挖掘装置,其特征在于,所述装置包括:构建单元、确定单元和挖掘单元;
所述构建单元,用于根据财务系统的操作流程构建业务操作事件图谱;所述业务操作事件图谱包括表示操作步骤的节点和标识所述操作步骤间执行顺序的节点连线;
所述确定单元,用于根据用户使用所述财务系统产生的系统操作日志,确定所述业务操作事件图谱中相邻节点出现的次数,并作为所述相邻节点对应的节点连线的权重;
所述挖掘单元,用于基于目标节点和对应节点连线的权重,从所述业务操作事件图谱中挖掘财务流程,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括更新单元,用于:
根据与目标节点连接的前m个节点和后n个节点确定假定事件链条,所述目标节点为所述业务操作事件图谱包括的多个节点中的一个;
获取所述假定事件链条包括的节点连线的第一权重和,以及所述假定事件链条中与所述目标节点连接的目标节点连线的第二权重;
若所述第一权重和与所述第二权重不满足预设条件,删除所述目标节点连线,得到更新后的业务操作事件图谱。
8.一种计算机设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-5任意一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1-5任意一项所述的方法。
10.一种计算机程序产品,其特征在于,包括计算机程序或指令;当所述计算机程序或指令被处理器执行时,执行权利要求1-5任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111565057.2A CN114240179A (zh) | 2021-12-20 | 2021-12-20 | 一种基于事件图谱的财务流程挖掘方法和相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111565057.2A CN114240179A (zh) | 2021-12-20 | 2021-12-20 | 一种基于事件图谱的财务流程挖掘方法和相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114240179A true CN114240179A (zh) | 2022-03-25 |
Family
ID=80759715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111565057.2A Pending CN114240179A (zh) | 2021-12-20 | 2021-12-20 | 一种基于事件图谱的财务流程挖掘方法和相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114240179A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114926073A (zh) * | 2022-06-02 | 2022-08-19 | 南京英诺森软件科技有限公司 | 一种基于rpa分解日志自动化流程挖掘的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880684A (zh) * | 2012-09-13 | 2013-01-16 | 杭州电子科技大学 | 基于日志记录挖掘与组合验证的工作流建模方法 |
US20170068709A1 (en) * | 2015-09-09 | 2017-03-09 | International Business Machines Corporation | Scalable and accurate mining of control flow from execution logs across distributed systems |
CN111324643A (zh) * | 2020-03-30 | 2020-06-23 | 北京百度网讯科技有限公司 | 知识图谱的生成方法、关系挖掘方法、装置、设备和介质 |
CN112784025A (zh) * | 2021-01-12 | 2021-05-11 | 北京明略软件系统有限公司 | 一种目标事件的确定方法和装置 |
CN113220907A (zh) * | 2021-06-10 | 2021-08-06 | 京东科技控股股份有限公司 | 业务知识图谱的构建方法及装置、介质、电子设备 |
-
2021
- 2021-12-20 CN CN202111565057.2A patent/CN114240179A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880684A (zh) * | 2012-09-13 | 2013-01-16 | 杭州电子科技大学 | 基于日志记录挖掘与组合验证的工作流建模方法 |
US20170068709A1 (en) * | 2015-09-09 | 2017-03-09 | International Business Machines Corporation | Scalable and accurate mining of control flow from execution logs across distributed systems |
CN111324643A (zh) * | 2020-03-30 | 2020-06-23 | 北京百度网讯科技有限公司 | 知识图谱的生成方法、关系挖掘方法、装置、设备和介质 |
CN112784025A (zh) * | 2021-01-12 | 2021-05-11 | 北京明略软件系统有限公司 | 一种目标事件的确定方法和装置 |
CN113220907A (zh) * | 2021-06-10 | 2021-08-06 | 京东科技控股股份有限公司 | 业务知识图谱的构建方法及装置、介质、电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114926073A (zh) * | 2022-06-02 | 2022-08-19 | 南京英诺森软件科技有限公司 | 一种基于rpa分解日志自动化流程挖掘的方法 |
CN114926073B (zh) * | 2022-06-02 | 2023-04-18 | 南京英诺森软件科技有限公司 | 一种基于rpa分解日志自动化流程挖掘的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110502509B (zh) | 一种基于Hadoop与Spark框架的交通大数据清洗方法及相关装置 | |
JP5092165B2 (ja) | データ構築方法とシステム | |
US10936950B1 (en) | Processing sequential interaction data | |
CN112579797B (zh) | 针对知识图谱的业务处理方法及装置 | |
CN110738564A (zh) | 贷后风险评估方法及装置、存储介质 | |
KR101617696B1 (ko) | 데이터 정규표현식의 마이닝 방법 및 장치 | |
CN105389349A (zh) | 词典更新方法及装置 | |
CN103336790A (zh) | 基于Hadoop的邻域粗糙集快速属性约简方法 | |
CN113592156B (zh) | 电厂煤量调度方法、装置、终端设备及存储介质 | |
CN103336791A (zh) | 基于Hadoop的粗糙集快速属性约简方法 | |
CN111222790A (zh) | 风险事件发生概率的预测方法、装置、设备及存储介质 | |
CN114240179A (zh) | 一种基于事件图谱的财务流程挖掘方法和相关装置 | |
CN116881430A (zh) | 一种产业链识别方法、装置、电子设备及可读存储介质 | |
CN105323763A (zh) | 一种垃圾短消息的识别方法及装置 | |
CN110928922B (zh) | 一种基于大数据挖掘的公共政策分析模型部署方法及其系统 | |
CN110765100B (zh) | 标签的生成方法、装置、计算机可读存储介质及服务器 | |
CN112433757A (zh) | 一种确定接口调用关系的方法和装置 | |
CN115374940A (zh) | 基于知识图谱的风险标签确定方法以及装置 | |
CN111967671B (zh) | 基于支持向量数据域描述的跨境活跃用户识别方法及装置 | |
CN114881521A (zh) | 业务评估方法、装置、电子设备以及存储介质 | |
US11288269B2 (en) | Optimizing breakeven points for enhancing system performance | |
CN114443783A (zh) | 一种供应链数据分析和增强处理方法及装置 | |
CN114387088A (zh) | 一种基于知识图谱的贷款风险识别方法及装置 | |
CN113946755A (zh) | 基于关联规则的信息推送方法、装置、设备及存储介质 | |
CN112700005A (zh) | 一种基于蒙特卡洛树搜索的异常事件处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |