CN114707146A - 工作流识别方法、系统、计算机设备和可读存储介质 - Google Patents
工作流识别方法、系统、计算机设备和可读存储介质 Download PDFInfo
- Publication number
- CN114707146A CN114707146A CN202210618643.7A CN202210618643A CN114707146A CN 114707146 A CN114707146 A CN 114707146A CN 202210618643 A CN202210618643 A CN 202210618643A CN 114707146 A CN114707146 A CN 114707146A
- Authority
- CN
- China
- Prior art keywords
- workflow
- identified
- behavior
- business
- regular expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/552—Detecting local intrusion or implementing counter-measures involving long-term monitoring or reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/03—Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
- G06F2221/034—Test or assess a computer or a system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明申请提供一种工作流识别方法、工作流识别中心及可读存储介质,该方法包括提取待识别工作流的特征并生成第一正则表达式;检测系统工作流,并提取所述系统工作流的特征生成第二正则表达式;若所述第一正则表达式与所述第二正则表达式匹配,则确认所述待识别工作流是正确的,否则,确认所述待识别工作流是错误的。本实施例通过将待识别业务工作流的第一正则表达式与系统内预先配置的系统内业务工作流的第二正则表达式匹配,以识别确认工作流,从而通过工作流的管理控制实现业务行为的管理控制,对业务工作流的执行过程进行监控和管理,防止业务工作流在执行的过程中被篡改,保证业务工作流执行可靠性和安全性。
Description
技术领域
本发明涉及计算机领域,具体涉及信息处理技术领域,特别是涉及一种工作流识别方法、系统计算机设备和可读存储介质。
背景技术
普适计算作为一种以人为中心的计算模式,它能够紧密地结合人和周围的物理环境,构建计算和通信无所不在的环境,通过智能化的人机交互方式主动地提供人们所需要的计算能力和信息服务资源,以协助人们更好地工作和生活。工作流活动通常被定义为人类为了实现一个任务而利用身体或工具来操作的一系列具有时间顺序的活动步骤。
工作流管理系统(Workflow Management System, WfMS)是一种在工作流形式化表示的驱动下,完成工作量的定义和管理的系统,协调分布、协同处理各个节点上的活动,按照在系统中预先定义好的工作流逻辑进行工作流实例的执行,以达到对它们的自动执行和有效的管理。
工作流管理系统主要包括三个模块:建立时模块,用于对工作流的业务流程及组成这些业务流程的活动进行定义和建模;运行控制模块,用于在一定运行环境下,负责创建、执行和控制工作流实例,激活相应的资源和应用,并完成过程从一个活动到另一个活动的控制转移,这是工作流管理系统的核心部分;运行交互模块,用于在工作流实例运行中,工作流管理系统与工作流参与者(业务工作的参与者或控制者)及外部应用程序进行交互的功能。
工作流产品主要分为两大类,一类是基础的工作流系统,其提供引擎、设计器、相关接口等。应用系统的开发商可以基于此类系统开发具有工作流管理功能的应用软件,典型产品如ActionTechnologiesInc.的ActionWorkflow、IBM的FlowMark等。另一类是应用工作流技术,其包括内置较完整的工作流功能,直接面向最终用户的流程化应用,并且可以针对应用需要集成其他功能,典型产品如神州数码工作流软件EasyFlow,就是以工作流技术为核心的全面的企业办公自动化(OA)产品。
但无论是基础工作流系统还是应用技术工作流,工作流管理系统均是面向人为管理的工作流,需要人工参与度较多,不具有形式化、自动化、智能化管理的能力,不能适应现代网络信息系统的业务工作流程透明化的安全管理需要。
发明内容
为了解决上述问题,本发明的目的是提供一种工作流识别方法、系统、计算机设备及可读存储介质,该方法对业务工作流的执行过程进行监控和管理,防止业务工作流在执行的过程中被篡改,保证业务工作流执行可靠性和安全性。
基于此,本发明提供了一种工作流识别方法,所述工作流识别方法包括:
提取待识别工作流的特征并生成第一正则表达式;
检测系统工作流,并提取所述系统工作流的特征生成第二正则表达式;
若所述第一正则表达式与所述第二正则表达式匹配,则确认所述待识别工作流是正确的,否则,确认所述待识别工作流是错误的。
在本发明实施例中,所述待识别工作流是依据已知内部机制和结构生成的或检测的未知机制和结构的工作流。
在本发明实施例中,所述待识别工作流是检测的未知机制和结构的工作流,所述提取待识别工作流的特征并生成第一正则表达式的步骤包括:
检测未知机制和结构的业务行为的数据信息及行为链,并基于所述数据信息和行为链构建生成待识别工作流;
提取所述待识别工作流的特征并形式化表达并生成所述第一正则表达式。
在本发明实施例中,所述检测未知机制和结构的业务行为的数据信息及行为链,并基于所述数据信息和行为链构建生成待识别工作流的步骤,包括:
检测并获取所述业务行为在“点”层面的数据信息;
检测并获取所述业务行为在“线”层面的行为链,所述行为链是通过所述业务行为的操作指令触发生成的;
检测并获取所述业务行为在“面”层面的根据所述行为链和所述数据信息的关联关系生成的状态机;
检测并获取所述业务行为在“体”层面的根据所述状态机的调用和交互关系生成的工作流。
在本发明实施例中,所述未知机制和结构的待识别工作流的学习步骤包括:
检测所述待识别工作流的外在行为,获取所述外在行为的数据信息;
学习所述外在行为之间的关联关系;
根据学习结果生成未知业务工作流。
在本发明实施例中,所述学习所述外在行为之间的关联关系,包括学习所述外在行为的组合、子行为、发生序列关系。
在本发明实施例中,当识别出所述待识别工作流错误时,管控处理所述待识别工作流。
本发明还提供了一种工作流识别的AI引擎,包括:
预处理模块,用于获取并预处理待识别工作流的业务数据和特征数据;
模型构建与训练模块,基于所述特征数据构建AI学习模型,并将所述业务数据用作训练集数据,通过训练集数据对所构建的AI学习模型进行模拟训练以建立合适的工作流生成模型;
效果监控与反馈模块,用于监控所述工作流生成模型生成的工作流并反馈到已知工作流库中,以生成用于和未知业务的待识别工作流的第一正则表达式进行匹配的所述工作流的第二正则表达式;
算法库,集成至少一种学习算法,用于所述模型构建与训练模块学习和训练以生成所述工作流生成模型。
本发明还提供了一种工作流识别系统,包括:
业务模块,用于表现业务操作、服务和信息处理的业务行为;
工作流模块,用于管理控制和构建运转的工作流程;
识别模块,用于从所述工作流模块中识别匹配所述业务模块所表现的业务行为对应的业务工作流,所述识别模块实现所述工作流识别方法的步骤。
本发明还提供了一种计算机设备,包括存储器、处理器和网络接口,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现工作流识别方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现工作流识别方法的步骤。
在本发明中,提供一种工作流识别方法,该方法包括提取待识别工作流的特征并生成第一正则表达式;检测系统工作流,并提取所述系统工作流的特征生成第二正则表达式;若所述第一正则表达式与所述第二正则表达式匹配,则确认所述待识别工作流是正确的,否则,确认所述待识别工作流是错误的。本实施例通过将待识别业务工作流的第一正则表达式与系统内预先配置的系统内业务工作流的第二正则表达式匹配,以识别确认工作流,从而通过工作流的管理控制实现业务行为的管理控制,对业务工作流的执行过程进行监控和管理,防止业务工作流在执行的过程中被篡改,保证业务工作流执行可靠性和安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例可以应用于其中的示例性系统架构图;
图2是本发明实施例提供的工作流识别方法的示意图;
图3是本发明实施例提供的工作流管理系统的示意图;
图4是本发明实施例提供的学习引擎框架图;
图5是本发明实施例提供的工作流识别中心的结构示意图;
图6是本发明实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和 服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,完成数字颁发认证过程。终端设备101、102、103通过网络104向服务器105发送证书申请请求、认证请求等。服务器105认证终端设备101、102、103的用户身份,在通过认证时颁发数字证书。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于用户设备、网络设备或用户设备与网络设备通过网络相集成所构成的设备。所述用户设备其包括但不限于任何一种可与用户通过触摸板进行人机交互的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如android操作系统、IOS操作系统等。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络 (Ad Hoc网络)等。当然,本领域技术人员应能理解上述终端设备仅为举例,其他现有的或今后可能出现的终端设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
服务器105是工作流识别应用的服务端,可以通过所述网络104和终端设备101、102、103进行通信,终端设备101、102、103之间可以双方甚至多方连接通信。服务器105可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。其也可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
工作流管理系统,即 Workflow Management System,是一种在工作流形式化表示的驱动下,通过软件的执行而完成工作流定义、管理及执行的系统,其主要目标是对业务过程中各步骤(或称活动、环节)发生的先后次序及同各步骤相关的相应人力或信息资源的调用等进行管理而实现业务过程的自动化。当然此种管理可能会在不同的信息及通信环境下实现,所涉及的范围可以小至一个几人的工作组,也可以大到企业(机构)与企业(机构)之间。
工作流的实现需要三个基本步骤:映射、建模和管理。映射是第一步,它的主要任务是识别并记录组织中所有现有的手工和自动化业务流程;建模是为了开发一个模型,帮助构建简化的业务流程。第三阶段是软件实施和跨所有工作部门、业务单位甚至整个企业的无缝系统集成。
本发明提供一种工作流识别方法,图2是本发明实施例提供的工作流识别方法的示意图,所述方法包括:
201:提取待识别业务工作流的特征并生成第一正则表达式;
202:提取系统工作流的特征并生成第二正则表达式;
203:将所述第一正则表达式与所述第二正则表达式匹配,若匹配则确认所述待识别工作流是正确的,否则,确认所述待识别工作流是错误的。
需要说明的是,任何系统在现实的物理世界表现为外在的业务操作、服务和信息处理的业务行为,业务行为是由系统的内在机制和结构所决定的,也就是说,所述业务行为是由系统内在的工作流决定的,现实世界的业务行为与系统的内在工作流形成对应的映射关系。建立系统业务行为与内在工作流的映射关系,便可通过工作流的管理控制实现外在行为的管理控制。
在本发明实施例中,本实施例通过正则表达式来匹配系统所表现的业务行为与系统内在工作流的映射关系,通过将待识别业务工作流的第一正则表达式与系统内预先配置的系统内业务工作流的第二正则表达式匹配,以识别确认工作流,从而通过工作流的管理控制实现业务行为的管理控制。
需要说明的是,所述待识别包括已知内部机制和结构的工作流和未知内部机制和结构的工作流。对于已知内部机制和结构的工作流可依据机制流程和结构的特征生成第一正则表达式,通过第一正则表达式与系统中的工作流的第二表达式进行匹配识别。对于未知内部机制和结构的工作流,则是通过机器或AI算法学习,自动识别任务元素,通过外在行为学习生成转化成知道系统机制和结构的已知业务工作流,再通过正则表达式进行匹配,实现未知机制的业务工作流的自动化生成和识别。本实施例通过与系统内工作流程自动化匹配,实现业务工作流程的透明化,以智能化管控。
在本实施例的一个实施方式中,所述待识别工作流是已知所述待识别工作流的内部机制和结构的,所述待识别工作流的第一正则表达式是依据机制流程和结构提取特征并生成的。具体地,通过提取内部机制和结构的特征并形式化表达,基于形式化表达的特征生成所述待识别工作流的第一正则表达式。
进一步地,对系统内工作流进行检测,提取系统内工作流程的特征并生成第二正则表达式,将所述第一正则表达式与系统的工作流的第一正则表达式进行匹配,若匹配成功,则认为所述待识别工作流是正确的,否则,确认所述待识别工作流是错误的,存在安全问题,需要进行管控处理,如检测节点和流程的流向,修改流程的功能等。
在本实施例的另一个实施方式中,所述待识别工作流是未知内部机制和结构的,其包括识别和学习两个过程。
需要说明的是,当未知业务中的任务具有可预测性和重复性时,就会发生流程工作流。也就是说,在业务开始工作流之前,就明确数据的流转方向。在案例工作流中,对于数据流转的方向是不明确的。只有收集到大量的数据时,数据流转的方向才会比较明显。
本实施例未知机制业务工作流的学习是通过集成了多种算法库建立的AI学习引擎自动化学习,转化为系统内的已知业务工作流。也就是说,所述系统工作流包括基于机器学习生成的由未知机制和结构的未知业务工作流转化成的已知业务工作流。
具体地,未知业务的学习步骤包括:
检测业务行为。所述业务行为是在现实物理世界的表现出来的业务操作、服务和信息处理等外在行为或活动,包括至少一组有时序性的任务,包括一种或多种状态机,多个外在业务行为的相互作用形成复杂的现实物理世界的工作流。
需要说明的是,所述状态机(state machine)是有限状态自动机的简称,是现实事物运行规则抽象而成的一个数学模型,包括至少两个状态、执行某个操作的触发条件或者口令而发生的事件、事件发生以后要执行动作和状态的变化过程。所述工作流是复杂状态机,依赖外部事件来驱动执行直到完成。具体地,状态机中包含一系列状态(包括初始状态和结束状态)和事件,状态机总是停在一个预设的状态中,直到事件触发之后才会跳转到新的状态上。本实施例可以定义状态,定义工作流如何从一个状态到另外一个状态。当外在行为的事件发生的时候,工作流可以移动到不同的状态。需要说明的是,外在行为可以是宿主程序引发工作流内部事件,也可以是宿主程序编程实现的下一个状态,也可以利用SetState Activity移动到下一个状态。
本实施例是通过AI学习引擎学习所述业务行为的关联关系的,这些关联关系包括但不限于业务行为的组合、子行为关系、发生次序等。
根据学习结果生成未知业务工作流。本实施例通过AI学习引擎学习获取外在行为所形成的行为链,包括但不限于业务操作链、服务树、消息队列等。所述行为链关联的进程、资源、端口、文件、字段、(微)服务、报文、数据等生成状态机,通过多个状态机模型的关联与复合,根据多个所述状态机间的调用和交互关系,生成得到未知业务工作流。
需要说明的是,所述未知业务工作流在学习引擎的学习训练过程中,生成有标记的训练数据集,将未知业务转化为已知业务。
所述工作流的识别过程包括:检测待识别业务工作流中的业务行为的数据信息、业务操作指令和基于所述操作指令进行的业务操作触发生成的行为链,其中所述数据信息包括业务行为关联的进程、资源、端口、文件、字段、(微)服务、报文、数据等信息,所述业务操作指令包括发起指令的用户角色和权限等,所述行为链包括操作链、服务树、消息队列等。然后根据所述行为链的关联关系,生成业务操作的状态机,根据生成的状态机和多个业务的调用和交互关系,生成复杂状态机及待识别工作流。通过提取所述待识别工作流的特征并形式化表达;并基于所述待识别工作流的特征的形式化表达生成所述第一正则表达式。提取所述AI学习引擎中生成的工作流的特征并生成第二正则表达式,将所述第一正则表达式与所述第二正则表达式匹配,若匹配成功,则认为所述待识别工作流是正确的,否则,是错误的,存在安全问题,需要进行管控处理。
本发明实施例还提供了一种工作流识别的AI引擎,包括预处理模块、模型构建与训练模块、效果监控与反馈模块和算法库,其中算法库,集成至少一种学习算法,预处理模块用于获取并预处理待识别工作流的业务数据和特征数据;模型构建与训练模块应用所述算法库中的一种或多种学习算法,基于所述特征数据构建AI学习模型,并将所述业务数据用作训练集数据,通过训练集数据对所构建的AI学习模型进行模拟训练以建立合适的工作流生成模型。效果监控与反馈模块,用于监控所述工作流生成模型生成的工作流并反馈到已知工作流库中,以生成所述工作流的第二正则表达式,进而用于匹配待识别工作流的第一正则表达式。
具体地,所述预处理模块提供工作流数据的归一化、标注等预处理功能。模型构建与训练模块针对不同的业务工作流数据,参数要求,构建相应的AI学习模型,并通过训练集数据进行训练得到所需合适的工作流生成模型。效果监控与反馈模块对得到的工作流模型进行监控并反馈到已知工作流库。
进一步地,所述算法库集成的学习算法库可以是但不限于如下无监督学习算法,以及他们之间相应组合和集成:k-均值聚类、层次聚类、主成分分析、独立成分分析、支持向量机,决策树,朴素贝叶斯算法等。而且,基于这些学习算法,还可以采用一种集成学习算法,如Adaboost、随机森林等,选取最好的算法结果作为最后的学习结果。
在本发明的另一个实施例中,所述工作流识别方法应用于如图3所示的工作流管理系统中。所述工作流管理系统包括AI学习引擎、建模工具、工作流引擎、任务表管理器、应用程序和用户界面等单元。其中所述AI学习引擎集成多种机器学习和智能计算算法,可以自动识别业务行为的任务元素,将其归类并确认后续任务的流转方向。所述建模工具用于提供各种所需的自动化工作流要素、流程等基本模型和形式化建模方法,提供工作流的建模支持;所述工作流引擎是为工作流实例提供运行环境并解释执行工作流实例的软件部件,用于实现工作流的生成、发布、修改、维护、部署等管理功能和包括通知、截止日期、提醒等的自动管理,并可以根据流转方向自动将流程提交至下一角色进行相应处理。所述任务表管理器用于验证工作流程的效率和可行性,以后续对流程进行更改及优化;所述应用程序实现相关的工作流操纵策略和管理控制功能;所述用户界面提供工作流管理系统的用户界面和交互窗口。
需要说明的是,所述AI学习引擎在本质上是可预测的,在使用开始时总是预定义的条件。假设一个签字盖章流程需要得到直接经理和总经理的书面批准,该文件可以以任何顺序签署,根据工作流引擎,这个过程将是预定义的。例如,一开始直接管理人员签署文件,然后是各级领导签署,最后是总经理。因此,在将工作流流向总经理之前,总经理将不会收到文件,直到总经理签字,这个过程是不能改变的。
具体地,如图4所示,本实施例所述AI学习引擎架构对未知业务的学习步骤如下:
41、预定义:对所处理的未知业务进行定义,指出其业务功能与作用。
42、数据准备和标注:获取所定义业务的外在行为及其子行为对应数据,所述数据包括但不限于包括业务行为对应的进程、资源、端口、文件、字段、(微)服务、Flow、Stream等数据,这些数据可通过传感器采集、数据导入等方式获得。
43、预处理与特征提取:对步骤42所获取的数据进行预处理,所述预处理包括但不限于数据缺失值填充、数据异常值处理、数据去噪声、数据归一化等预处理操作,以挖掘高质量的有效数据。然后对预处理后的数据进行特征提取,从原始数据中提取与建模相关的有效特征来建立模型
44、将进行特征提取后的数据集数据拆分为两个数据集:训练数据集、测试数据集。
45、模型构建与训练:通过引入算法库中的算法,选择和构建适合训练数据集的机器学习模型,将训练数据集作为模型的输入,运行AI算法进行训练和迭代计算,多步训练后得到稳定的智能计算参数模型。
46、输出生成未知业务基于操作链和业务树的状态机模型;
47、通过多个状态机模型的关联与复合,得到未知业务的工作流模型。然后通过测试数据集来验证该工作流模型的准确率,如果误差能够控制到一定精度,则可以用该模型来进行未知业务工作流的描述与建模。也可以通过效果监控反馈至步骤42,若模型选择的训练数据时出现特别的问题,模型自动强化训练。
48、将建模获得的未知业务工作流模型应用于在业务数据的处理,完成对应业务工作流模型的应用,并将处理的数据基于此模型进行标注,生成具有标签的数据集,为步骤2的数据准备生成有标记的训练数据集,从而将未知业务转化为已知业务,简化后续建模的工作量。
需要说明的是,步骤42中,特征提取包括以下步骤:
特征分析:目的是初步发现数据特征、规律,为后续数据建模提供输入依据。
特征选择:目的是提升模型输入与建模目标的相关性并降低冗余度,避免“维度灾难”,同时为后续数据处理提供更好的理解。特征选择还有助于减少传感器的安装数量,并可以提高算法的计算效率。
属性降维:降维可以减少计算量,提高计算效率,提高模型的泛化能力,降维之后的数据仍可保留原数据的大部分信息。常用的降维方法包括:PCA(主成分分析)的降维,因子分析和奇异值分析等方法。
需要说明的是,步骤44中,训练数据集占中数据集的比例可以为大于测试数据集。优选地,本实施例中所述训练数据集占70%,测试数据集占30%。
需要说明的是,由于业务行为未知时是没有先验知识可以利用的,因此步骤45中,AI学习只能采用无监督学习的方法。本实施例所述AI学习引擎集成的学习算法库可以是但不限于如下无监督学习算法,以及他们之间相应组合和集成:k-均值聚类、层次聚类、主成分分析、独立成分分析、支持向量机,决策树,朴素贝叶斯算法等;而且,基于这些学习算法,还可以采用一种集成学习算法,如Adaboost、随机森林等,选取最好的算法结果作为最后的学习结果。
图5是本发明实施例提供的工作流识别中心500的示意图,所述装置包括:
业务模块501,用于表现业务操作、服务和信息处理的业务行为;
工作流模块502,用于管理控制构建运转的工作流程;
识别模块503,用于从所述工作流模块中识别匹配所述业务模块所表现的业务行为对应的业务工作流,所述识别模块实现本发明实施例所提供的工作流识别方法的步骤。
需要说明的是,所述工作流识别装置300还包括显示模块(图未示),所述显示模块可以生成图形界面,进而可以向用户展示图形界面,可以用于显示所述工作流识别中心500的交互过程、响应结果或业务请求处理的显示界面。所述展示层还可以用于获取用户输入的操作,例如,获取用户基于展示的图形界面输入的操作。
所述工作流识别装置500还可以包括输入模块(图未示),所述输入模块与所述显示模块相连,所述输入模块可包括按键,可用于输入用户id的账号、密码、名称、数据信息等,并且所述显示模块还可以显示所述用户的其他信息,并将此信息存储起来,方便用户随时进行查看。
需要说明的是,本实施例的 工作流识别中心500,与方法实施例的属于同一构思,其具体实现过程详细见方法实施例,且方法实施例中的技术特征在本实施例中均对应适用,此处不再赘述。
为解决上述技术问题,本申请实施例还提供一种计算机设备心。具体请参阅图6,图6为本实施例计算机设备基本结构框图。
所述计算机设备6包括通过系统总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件61-63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述数字颁发中心备6的内部存储单元,例如该数字颁发中心6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述数字颁发中心6的外部存储设备,例如该数字颁发中心6上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作系统和各类应用软件,例如工作流识别方法的程序代码等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的程序代码或者处理数据,例如运行所述工作流识别方法的程序代码。
所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述数字颁发中心6与其他电子设备之间建立通信连接。
本发明的实施例还提出一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现工作流识别方法的步骤。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
Claims (10)
1.一种工作流识别方法,其特征在于,包括以下步骤:
提取待识别工作流的特征并生成第一正则表达式;
检测系统工作流,并提取所述系统工作流的特征生成第二正则表达式;
若所述第一正则表达式与所述第二正则表达式匹配,则确认所述待识别工作流是正确的,否则,确认所述待识别工作流是错误的。
2.根据权利要求1所述的工作流识别方法,其特征在于,所述待识别工作流是依据已知内部机制和结构生成的或检测的未知机制和结构的工作流。
3.根据权利要求2所述的工作流识别方法,其特征在于,所述待识别工作流是检测的未知机制和结构的工作流,所述提取待识别工作流的特征并生成第一正则表达式的步骤包括:
检测未知机制和结构的业务行为的数据信息及行为链,并基于所述数据信息和行为链构建生成待识别工作流;
提取所述待识别工作流的特征并形式化表达并生成所述第一正则表达式。
4.根据权利要求3所述的工作流识别方法,其特征在于,所述检测未知机制和结构的业务行为的数据信息及行为链,并基于所述数据信息和行为链构建生成待识别工作流的步骤,包括:
检测并获取所述业务行为在“点”层面的数据信息;
检测并获取所述业务行为在“线”层面的行为链,所述行为链是通过所述业务行为的操作指令触发生成的;
检测并获取所述业务行为在“面”层面的根据所述行为链和所述数据信息的关联关系生成的状态机;
检测并获取所述业务行为在“体”层面的根据所述状态机的调用和交互关系生成的工作流。
5.根据权利要求3所述的工作流识别方法,其特征在于,所述未知机制和结构的待识别工作流的学习步骤包括:
检测所述待识别工作流的外在行为,获取所述外在行为的数据信息;
学习所述外在行为之间的关联关系;
根据学习结果生成未知业务工作流。
6.根据权利要求5所述的工作流识别方法,其特征在于,所述学习所述外在行为之间的关联关系,包括学习所述外在行为的组合、子行为、发生序列关系。
7.一种工作流识别的AI引擎,包括:
预处理模块,用于获取并预处理待识别工作流的业务数据和特征数据;
模型构建与训练模块,基于所述特征数据构建AI学习模型,并将所述业务数据用作训练集数据,通过训练集数据对所构建的AI学习模型进行模拟训练以建立合适的工作流生成模型;
效果监控与反馈模块,用于监控所述工作流生成模型生成的工作流并反馈到已知工作流库中,以生成用于和未知业务的待识别工作流的第一正则表达式进行匹配的所述工作流的第二正则表达式;
算法库,集成至少一种学习算法,用于所述模型构建与训练模块学习和训练以生成所述工作流生成模型。
8.一种工作流管理系统,其特征在于,包括:
业务模块,用于表现业务操作、服务和信息处理的业务行为;
工作流模块,用于管理控制和构建运转的工作流程;
识别模块,用于从所述工作流模块中识别匹配所述业务模块所表现的业务行为对应的业务工作流,所述识别模块实现权利要求1至6中任一项所述工作流识别方法的步骤。
9.一种计算机设备,包括存储器、处理器和网络接口,所述存储器存储有计算机程序,其征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述工作流识别方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述工作流识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210618643.7A CN114707146B (zh) | 2022-06-02 | 2022-06-02 | 工作流识别方法、系统、计算机设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210618643.7A CN114707146B (zh) | 2022-06-02 | 2022-06-02 | 工作流识别方法、系统、计算机设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114707146A true CN114707146A (zh) | 2022-07-05 |
CN114707146B CN114707146B (zh) | 2022-10-28 |
Family
ID=82177562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210618643.7A Active CN114707146B (zh) | 2022-06-02 | 2022-06-02 | 工作流识别方法、系统、计算机设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114707146B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115664851A (zh) * | 2022-12-14 | 2023-01-31 | 深圳市永达电子信息股份有限公司 | 一种基于业务行为的安全管控方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101616038A (zh) * | 2009-04-30 | 2009-12-30 | 深圳市永达电子股份有限公司 | Soa安全保障系统及方法 |
US20110320382A1 (en) * | 2010-06-29 | 2011-12-29 | International Business Machines Corporation | Business process analysis method, system, and program |
CN101610265B (zh) * | 2009-07-24 | 2012-05-09 | 深圳市永达电子股份有限公司 | 一种业务工作流的流程识别方法 |
CN109740834A (zh) * | 2018-11-13 | 2019-05-10 | 平安科技(深圳)有限公司 | 工作流引擎控制方法、装置、计算机设备及存储介质 |
CN109767190A (zh) * | 2018-12-29 | 2019-05-17 | 中国工商银行股份有限公司 | 基于区块链的跨机构工作流处理方法、平台及系统 |
CN110460488A (zh) * | 2019-07-01 | 2019-11-15 | 华为技术有限公司 | 业务流识别方法和装置、模型生成方法和装置 |
CN113238923A (zh) * | 2021-07-12 | 2021-08-10 | 深圳市永达电子信息股份有限公司 | 基于状态机的业务行为溯源方法及系统 |
CN114282875A (zh) * | 2020-09-27 | 2022-04-05 | 中国科学院计算机网络信息中心 | 流程审批确定性规则和语义自学习结合判定方法及装置 |
CN114418398A (zh) * | 2022-01-20 | 2022-04-29 | 平安壹钱包电子商务有限公司 | 场景任务开发方法、装置、设备及存储介质 |
-
2022
- 2022-06-02 CN CN202210618643.7A patent/CN114707146B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101616038A (zh) * | 2009-04-30 | 2009-12-30 | 深圳市永达电子股份有限公司 | Soa安全保障系统及方法 |
CN101610265B (zh) * | 2009-07-24 | 2012-05-09 | 深圳市永达电子股份有限公司 | 一种业务工作流的流程识别方法 |
US20110320382A1 (en) * | 2010-06-29 | 2011-12-29 | International Business Machines Corporation | Business process analysis method, system, and program |
CN109740834A (zh) * | 2018-11-13 | 2019-05-10 | 平安科技(深圳)有限公司 | 工作流引擎控制方法、装置、计算机设备及存储介质 |
CN109767190A (zh) * | 2018-12-29 | 2019-05-17 | 中国工商银行股份有限公司 | 基于区块链的跨机构工作流处理方法、平台及系统 |
CN110460488A (zh) * | 2019-07-01 | 2019-11-15 | 华为技术有限公司 | 业务流识别方法和装置、模型生成方法和装置 |
CN114282875A (zh) * | 2020-09-27 | 2022-04-05 | 中国科学院计算机网络信息中心 | 流程审批确定性规则和语义自学习结合判定方法及装置 |
CN113238923A (zh) * | 2021-07-12 | 2021-08-10 | 深圳市永达电子信息股份有限公司 | 基于状态机的业务行为溯源方法及系统 |
CN114418398A (zh) * | 2022-01-20 | 2022-04-29 | 平安壹钱包电子商务有限公司 | 场景任务开发方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
TREVOR MARTIN 等: "A New Approach to Fuzzy Regular Expression Parsers for Cybersecurity Logs", 《2020 IEEE INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS (FUZZ-IEEE)》 * |
黄凯锋: "基于工作流的高校外事管理系统的研究与设计", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115664851A (zh) * | 2022-12-14 | 2023-01-31 | 深圳市永达电子信息股份有限公司 | 一种基于业务行为的安全管控方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114707146B (zh) | 2022-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10839404B2 (en) | Intelligent, interactive, and self-learning robotic process automation system | |
US20160078368A1 (en) | Artificial intelligence & knowledge based automation enhancement | |
CN101432694A (zh) | 业务流程元模型 | |
CN112883116A (zh) | 基于区块链的供应链金融AI DaaS算法仓库平台 | |
US20220291966A1 (en) | Systems and methods for process mining using unsupervised learning and for automating orchestration of workflows | |
CN114707146B (zh) | 工作流识别方法、系统、计算机设备和可读存储介质 | |
WO2021024145A1 (en) | Systems and methods for process mining using unsupervised learning and for automating orchestration of workflows | |
US20130254162A1 (en) | Governing information | |
US11693923B1 (en) | Robotic process automation system with hybrid workflows | |
CN114281707A (zh) | 造数方法、业务应用测试方法及其相关设备 | |
US11431557B1 (en) | System for enterprise event analysis | |
CN112650659B (zh) | 埋点设置方法、装置、计算机设备和存储介质 | |
CN117251228A (zh) | 功能管理方法、装置、计算机设备及存储介质 | |
CN117114618A (zh) | 待办项跟进方法、系统、计算机设备及存储介质 | |
US10733540B2 (en) | Artificial intelligence and knowledge based automation enhancement | |
WO2023155274A1 (zh) | 基于rpa和ai的招聘信息发布方法及装置 | |
CN115686495A (zh) | 应用的生成方法、装置和服务器 | |
CN114881313A (zh) | 基于人工智能的行为预测方法、装置及相关设备 | |
CN112395133B (zh) | 基于虚拟机的数据备份方法、装置和计算机设备 | |
KR20230073056A (ko) | 악성 이벤트로그 자동분석 장치 및 방법 | |
US20230117893A1 (en) | Machine learning techniques for environmental discovery, environmental validation, and automated knowledge repository generation | |
CN117422523A (zh) | 产品上线方法、装置、计算机设备及存储介质 | |
US20240054488A1 (en) | Systems and methods for generating aggregate records | |
CN117390119A (zh) | 任务处理方法、装置、计算机设备及存储介质 | |
Affonso et al. | DmS-Modeler: A Tool for Modeling Decision-making Systems for Self-adaptive Software Domain. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |