CN114926073B - 一种基于rpa分解日志自动化流程挖掘的方法 - Google Patents

一种基于rpa分解日志自动化流程挖掘的方法 Download PDF

Info

Publication number
CN114926073B
CN114926073B CN202210621671.4A CN202210621671A CN114926073B CN 114926073 B CN114926073 B CN 114926073B CN 202210621671 A CN202210621671 A CN 202210621671A CN 114926073 B CN114926073 B CN 114926073B
Authority
CN
China
Prior art keywords
data
log
decomposition
mining
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210621671.4A
Other languages
English (en)
Other versions
CN114926073A (zh
Inventor
叶海亮
钟锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Inossem Software Technology Co ltd
Original Assignee
Nanjing Inossem Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Inossem Software Technology Co ltd filed Critical Nanjing Inossem Software Technology Co ltd
Priority to CN202210621671.4A priority Critical patent/CN114926073B/zh
Publication of CN114926073A publication Critical patent/CN114926073A/zh
Application granted granted Critical
Publication of CN114926073B publication Critical patent/CN114926073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/16Multipoint routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Educational Administration (AREA)
  • Fuzzy Systems (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于RPA分解日志自动化流程挖掘的方法,包括系统构建,系统设置,数据分流及数据挖掘处理等四个步骤。本发明有效实现了流程挖掘和RPA技术二者协同互补,通过RPA配置日志解析的规则,实现自动化抽取日志、日志拆分,从而极大提高了流程挖掘的运行效率;同时有效改善流程所需的完整环境和端到端视角,大大提高自动化效益;并有效实现流程挖掘与自动化评估相结合,持续提高监测RPA的自动化效率、流程合规性、其他KPI和投资回报率。

Description

一种基于RPA分解日志自动化流程挖掘的方法
技术领域
本发明涉及一种基于RPA分解日志自动化流程挖掘的方法,属人工智能及信息技术领域。
背景技术
在大数据不断发展,人们日常生活逐渐数字化的今天,日常接收到的数据量呈爆炸式的增长,并且随着各个企业的内部网络环境和管理系统走向成熟,记录大量用户行为信息的系统日志被保存收集,而这部分用户行为数据背后包含着对公司来说非常具有管理意义的信息,正有待分析挖掘。流程挖掘需要我们自动的从商业日志中获取到商业流程模型,因此被建造出来的流程模型必须真实准确反映这个日志中的所有信息。然而流程挖掘技术在应用于大型事件日志时,在计算需求和生成输出的可解释性方面都存在可伸缩性的问题,因为从大型事件日志中发现的流程模型通常向企业提供的有价值信息比较具有局限性。大多数流程挖掘技术是将一个大型日志直接按照业务活动流的活动顺序行程相对平滑的流程模型,但实际情况指出在遇到大数据集的时候往往会产生适应性方面的问题,这种普通流程挖掘方式经常导致产生非常巨大且复杂的流程模型,同时伴随着低重放适应性度和低精度,他们是衡量流程挖掘质量的重要量化指标,另外还有泛化性和简化行两个量化指标,流程挖掘算法会用其中不同的一两个量化指标做为基准。其中重放适应性数字化反映了挖掘的模型能够准确地再现数据日志中记录的案例的能力,低重放适应度将导致挖掘获得的模型不能重新形成及表示出原始的行为日志,但是过高追求重放适应性可能会造成比较复杂的模型。精确度量化了流程模型中描述日志行为的准确程度,低精确度将会导致挖掘出欠拟合的模型。
因此针对这一问题,迫切需要开发一种全新的光纤表面质量检测设备及检测方法,以满足实际使用的需要。
发明内容
为了解决现有技术上的不足,本发明提供一种基于RPA分解日志自动化流程挖掘的方法。
一种基于RPA分解日志自动化流程挖掘的方法,包括如下步骤:
S1,系统构建,首先构建一个基于大数据计算为基础的数据处理服务器,同时构建若干数据挖掘终端机若干RPA机器人终端,所述基于大数据计算为基础的数据处理服务器通过通讯网络分别与若干数据挖掘终端机建立数据连接,且各数据挖掘终端机间相互并联,同时每个数据挖掘终端机均通过通讯网关与1—4个RPA机器人终端间建立数据连接,且同一数据挖掘终端机所连接的各RPA机器人终端间通过通讯网关相互连接;基于大数据计算为基础的数据处理服务器另通过通讯接口与1个RPA机器人终端建立数据连接,同时将基于大数据计算为基础的数据处理服务器和各数据挖掘终端机分别通过通讯网络与外部工作数据网络建立数据连接;
S2,系统设置,完成S1步骤后,首先在基于大数据计算为基础的数据处理服务器中设置数据处理软件系统、日志文件处理软件系统;在数据挖掘终端机中录入日志文件处理软件系统,然后分别在基于大数据计算为基础的数据处理服务器和据挖掘终端机中分别录入日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略;
S3,数据分流,首先由基于大数据计算为基础的数据处理服务器和各数据挖掘终端机通过通讯网络分别对工作数据网络在日常工作中产生的日志文件进行收集汇总,同时各数据挖掘终端机采集的日志文件均传输至基于大数据计算为基础的数据处理服务器内,由基于大数据计算为基础的数据处理服务器对接收的各日志文件根据S2步骤设置的日志数据管理程序、日志数据存储程序、进行预处理并存储;然后由基于大数据计算为基础的数据处理服务器所连接的RPA机器人终端根据S2步骤设置数据筛选程序、日志文件分解控制策略对各日志文件进行分流;最后将分流后的数据分别发送至各数据挖掘终端机内;
S4,数据挖掘处理,将分流至各数据挖掘终端机的日志文件数据,由数据挖掘终端机根据S2步骤设定的日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略,由其连接的各RPA机器人终端对当前的日志文件数据进行分析处理,最后将分析处理结果集中汇总至基于大数据计算为基础的数据处理服务器,由基于大数据计算为基础的数据处理服务器对各数据挖掘终端机传输的数据进行汇总处理,即可得到完整的数据挖掘分析结果。
进一步的,所述S2步骤中设定的日志文件分解控制策略中包括基于BPMN是BPM及workflow的建模中任意一种或几种共用的数据建模系统,且日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略和数据处理软件系统、日志文件处理软件系统均纳入统一的软件栈中。
进一步的,所述S4步骤在进行数据挖掘处理时,
第一阶段,RPA机器人终端根据日志文件分解控制策略,由RPA机器人终端将采集业务流程中的元数据并进行数据预处理,在RPA中设定需保留的数据项和需删除的数据项,筛选出流程挖掘用到的元数据,包含案例、事件、时间戳,删除流程中特定的业务数据,最终获得的事件日志是适用于事件流程图来构造的形式;
第二阶段,将根据业务流程相中的事件ID,时间戳进行度量,建造出更加反映实际数据形式的事件流程图,将第一步采集的原始元数据集建模为一个有初始节点和结束节点的有向加权图的形式;
第三阶段,对事件流程图进行聚类划分,最终得到划分为不同阶段的流程活动集,并在活动流程之上再次挖掘出子流程图并进行合并,得出流程自动化所达到的最终效果。
进一步的,所述子流程集处理时,按以下三个步骤进行:
第一步,子流程图挖掘,首先基于前面流程分解步骤中的输出,得到了一组流程集的分解,每个分解集中都会存在一个分解点,这个分解点是两个相邻流程的分界线,并会在下一个分解集中也存储一个拷贝,以表明它是本阶段和上一阶段之间的分解点,按照活动事件所属的分解将数据集分成不同的数据子集,每个子集只包含分解内部的流程信息,然后对于这些流程子集进行再一次的流程图构建,将构建基于时间戳,允许活动并行发生的流程图;
第二步,子图聚合,在第一步得到子模型后,初步拟定为每一个子模型内部存在的分解点,将分解点与下一个子模型的初始点进行连接,使两个子模型合并起来;
第三步,聚合图简化与完善,经过第二步得到聚合图以后,一方面再返回至S3步骤,核对是否有被忽略、误删除作业;另一方面还需要再添加额外的边集数据,实现各模块之间连接的交互边。
进一步的,所述RPA机器人终端包括承载壳、辅助驱动电源、数据通讯端口、数据处理电路、数据存储电路、操控界面及绝缘隔板,其中所述承载壳为轴向截面呈矩形的闭合腔体结构,所述绝缘隔板嵌于承载壳内并将承载壳内均分为若干工作腔,其中所述辅助驱动电源、数据处理电路、数据存储电路分别嵌于一个工作腔内,并均与绝缘隔板相互连接,所述操控界面嵌于承载壳上端面,数据通讯端口若干并均嵌于承载壳前端面,所述数据存储电路分别与辅助驱动电源、数据通讯端口、数据处理电路、数据存储电路、操控界面间电气连接,且数据处理电路通过数据通讯端口与外部设备间建立数据连接。
进一步的,所述承载壳下端面设至少两条导向柱,上端面设至少一个横断面呈矩形闭合腔体结构的储物腔,其中所述导向柱对称分布在承载壳轴线两侧,其上端面通过棘轮机构与承载壳下端面铰接,其轴线与承载壳底部呈0°—120°夹角,所述导向柱包括立柱、连接滑槽、导向套,其中所述立柱为至少两级伸缩杆结构,立柱外侧面通过导向套与连接滑槽连接,所述导向套为与立柱同轴分布的空心柱状结构,包覆在立柱外并与立柱同轴分布,且导向套与立柱间另通过至少一个定位销连接,所述导向套外侧面通过铰链与至少一条连接滑槽铰接,所述连接滑槽为横断面呈“凵”字形槽装结构,其轴线与立柱轴线呈0°—90°夹角。
进一步的,所述辅助驱动电源包括蓄电池及多路稳压直流电源;所述操控界面包括信号指示灯、按键、显示器中任意一种或几种共用。
本发明有效实现了流程挖掘和RPA技术二者协同互补,通过RPA配置日志解析的规则,实现自动化抽取日志、日志拆分,从而极大提高了流程挖掘的运行效率;同时有效改善流程所需的完整环境和端到端视角,大大提高自动化效益;并有效实现流程挖掘与自动化评估相结合,持续提高监测RPA的自动化效率、流程合规性、其他KPI和投资回报率。
附图说明
下面结合附图和具体实施方式来详细说明本发明;
图1为本发明方法流程示意图;
图2为进行数据挖掘处理时的方法流程图;
图3为子流程集处理时的方法流程图;
图4为本发明系统构成结构示意图;
图5为RPA机器人终端结构示意图;
图6为RPA机器人终端局部结构示意图;
图7为本发明数据梳理流程示意图;
图8为子流程集处理时流程示意图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于施工,下面结合具体实施方式,进一步阐述本发明。
如图1—8所示,一种基于RPA分解日志自动化流程挖掘的方法,包括如下步骤:
S1,系统构建,首先构建一个基于大数据计算为基础的数据处理服务器,同时构建若干数据挖掘终端机若干RPA机器人终端,所述基于大数据计算为基础的数据处理服务器通过通讯网络分别与若干数据挖掘终端机建立数据连接,且各数据挖掘终端机间相互并联,同时每个数据挖掘终端机均通过通讯网关与1—4个RPA机器人终端间建立数据连接,且同一数据挖掘终端机所连接的各RPA机器人终端间通过通讯网关相互连接;基于大数据计算为基础的数据处理服务器另通过通讯接口与1个RPA机器人终端建立数据连接,同时将基于大数据计算为基础的数据处理服务器和各数据挖掘终端机分别通过通讯网络与外部工作数据网络建立数据连接;
S2,系统设置,完成S1步骤后,首先在基于大数据计算为基础的数据处理服务器中设置数据处理软件系统、日志文件处理软件系统;在数据挖掘终端机中录入日志文件处理软件系统,然后分别在基于大数据计算为基础的数据处理服务器和据挖掘终端机中分别录入日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略;
S3,数据分流,首先由基于大数据计算为基础的数据处理服务器和各数据挖掘终端机通过通讯网络分别对工作数据网络在日常工作中产生的日志文件进行收集汇总,同时各数据挖掘终端机采集的日志文件均传输至基于大数据计算为基础的数据处理服务器内,由基于大数据计算为基础的数据处理服务器对接收的各日志文件根据S2步骤设置的日志数据管理程序、日志数据存储程序、进行预处理并存储;然后由基于大数据计算为基础的数据处理服务器所连接的RPA机器人终端根据S2步骤设置数据筛选程序、日志文件分解控制策略对各日志文件进行分流;最后将分流后的数据分别发送至各数据挖掘终端机内;
S4,数据挖掘处理,将分流至各数据挖掘终端机的日志文件数据,由数据挖掘终端机根据S2步骤设定的日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略,由其连接的各RPA机器人终端对当前的日志文件数据进行分析处理,最后将分析处理结果集中汇总至基于大数据计算为基础的数据处理服务器,由基于大数据计算为基础的数据处理服务器对各数据挖掘终端机传输的数据进行汇总处理,即可得到完整的数据挖掘分析结果。
本实施例中,所述S2步骤中设定的日志文件分解控制策略中包括基于BPMN是BPM及workflow的建模中任意一种或几种共用的数据建模系统,且日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略和数据处理软件系统、日志文件处理软件系统均纳入统一的软件栈中。
需要说明的,所述S4步骤在进行数据挖掘处理时,
第一阶段,RPA机器人终端根据日志文件分解控制策略,由RPA机器人终端将采集业务流程中的元数据并进行数据预处理,在RPA中设定需保留的数据项和需删除的数据项,筛选出流程挖掘用到的元数据,包含案例、事件、时间戳,删除流程中特定的业务数据,最终获得的事件日志是适用于事件流程图来构造的形式;
第二阶段,将根据业务流程相中的事件ID,时间戳进行度量,建造出更加反映实际数据形式的事件流程图,将第一步采集的原始元数据集建模为一个有初始节点和结束节点的有向加权图的形式;
第三阶段,对事件流程图进行聚类划分,最终得到划分为不同阶段的流程活动集,并在活动流程之上再次挖掘出子流程图并进行合并,得出流程自动化所达到的最终效果。
与此同时,所述子流程集处理时,按以下三个步骤进行:
第一步,子流程图挖掘,首先基于前面流程分解步骤中的输出,得到了一组流程集的分解,每个分解集中都会存在一个分解点,这个分解点是两个相邻流程的分界线,并会在下一个分解集中也存储一个拷贝,以表明它是本阶段和上一阶段之间的分解点,按照活动事件所属的分解将数据集分成不同的数据子集,每个子集只包含分解内部的流程信息,然后对于这些流程子集进行再一次的流程图构建,将构建基于时间戳,允许活动并行发生的流程图;
第二步,子图聚合,在第一步得到子模型后,初步拟定为每一个子模型内部存在的分解点,将分解点与下一个子模型的初始点进行连接,使两个子模型合并起来;
第三步,聚合图简化与完善,经过第二步得到聚合图以后,一方面再返回至S3步骤,核对是否有被忽略、误删除作业;另一方面还需要再添加额外的边集数据,实现各模块之间连接的交互边。
此外,所述RPA机器人终端包括承载壳1、辅助驱动电源2、数据通讯端口3、数据处理电路4、数据存储电路5、操控界面6及绝缘隔板7,其中所述承载壳1为轴向截面呈矩形的闭合腔体结构,所述绝缘隔板7嵌于承载壳1内并将承载壳1内均分为若干工作腔8,其中所述辅助驱动电源2、数据处理电路4、数据存储电路5分别嵌于一个工作腔8内,并均与绝缘隔板7相互连接,所述操控界面6嵌于承载壳1上端面,数据通讯端口3若干并均嵌于承载壳1前端面,所述数据存储电路4分别与辅助驱动电源2、数据通讯端口3、数据处理电路4、数据存储电路5、操控界面6间电气连接,且数据处理电路4通过数据通讯端口3与外部设备间建立数据连接。
进一步优化的,所述承载壳1下端面设至少两条导向柱9,上端面设至少一个横断面呈矩形闭合腔体结构的储物腔10,其中所述导向柱9对称分布在承载壳1轴线两侧,其上端面通过棘轮机构与承载壳1下端面铰接,其轴线与承载壳1底部呈0°—120°夹角,所述导向柱9包括立柱91、连接滑槽92、导向套93,其中所述立柱91为至少两级伸缩杆结构,立柱91外侧面通过导向套93与连接滑槽92连接,所述导向套93为与立柱91同轴分布的空心柱状结构,包覆在立柱91外并与立柱91同轴分布,且导向套93与立柱间另通过至少一个定位销94连接,所述导向套93外侧面通过铰链与至少一条连接滑槽92铰接,所述连接滑槽92为横断面呈“凵”字形槽装结构,其轴线与立柱91轴线呈0°—90°夹角。
其中设置的储物腔可进行诸如数据线等辅助设备存储作业的需要。
进一步优化的,所述辅助驱动电源2包括蓄电池及多路稳压直流电源;所述操控界面6包括信号指示灯、按键、显示器中任意一种或几种共用。
此外,所述数据挖掘终端机为PC计算机、工业计算机及服务器中的任意一种。
为了更好的对本发明所记载技术内容进行充分说明,便于本领域技术人员理解本申请文件做涉及的技术内容,现结合本技术在实际运行中的具体事例对本申请文件技术内容进行解释说明:
国内某头部电动车平衡车厂商尝试构建海外统一的销售平台,从而整合海外各大电子商务销售平台的销售业务流程。为了达到优化销售流程,需要对现有业务流程进行业务建模和评估,因为各大电子商务的平台对于业务事件采集的支持能力不一致,有些平台无法提供流程挖掘需要的业务日志,因此决定采用本技术方案:
首先,使用RPA技术定期自动到各电子商务销售平台,公司自有ERP系统,WMS系统抓取销售记录,发货记录等业务数据,通过拆分,整合等数据处理后形成业务流程相关的业务日志,从而快速完成了现有业务流程的建模和挖掘。通过RPA机器人快速抽取业务流程中的日志数据,数据项包含事件ID、时间戳、订单号、订单行号、凭证类型、销售机构、分销渠道、产品组、销售部门、销售组、销售价格、单位、售达方、送达方、货币、付款条件、物料编号、订单数量、工厂、库位、发货日期、收货地址、发运方式、国际贸易条款等,根据事件ID和时间戳对业务流程进行排序、分解,分离出业务流程包含订单创建、订单支付、订单发货、发票、订单退货、索赔等,对这些子业务流程进行聚合简化,形成对接销售平台的完整业务流;。
然后,通过几十个RPA机器人快速抽取了Amazon、Shopify、Costco、Walmart等平台的订单等销售业务数据通过数据清理,拆分,整合等数据处理构建了订单创建,支付,发货,发货确认等业务流程事件。在不修改现有系统功能的情况下快速构建和挖掘出了现有销售相关的各种业务处流程,为构建统一销售管理平台以及后续流程持续改进,评估流程优化效果提供了有力的保证。
本发明有效实现了流程挖掘和RPA二者协同互补,通过RPA配置日志解析的规则,标识日志抽取数据项和业务数据项,实现自动化抽取日志,并将复杂的大量数据日志拆分,将流程分解为子流程,提高了流程挖掘的运行效率,并更容易反映真实数据情况的流程模型。同时,流程挖掘为部署RPA提供改善流程所需的完整环境和端到端视角,并确保自动化流程能够带来成果;流程挖掘在部署RPA前识别出业务流程中最有价值、最需要改进的环节,帮助优化流程,大大提高自动化效益;流程挖掘与自动化评估相结合,持续监测RPA的自动化效率、流程合规性、其他KPI和投资回报率。
流程挖掘为RPA自动化实施带来巨大的优势。在业务流程中,机器人需要处理的变化或者异常越多,实施RPA的成本就越高,而流程挖掘可以查看全流程中所有存在的异常情况,及时反馈哪些流程会导致延误、潜在危险和漏洞,帮助企业在部署RPA前发现瓶颈,改进流程,使RPA实施更加顺利;流程挖掘还可以便捷高效识别更多的自动化节点,帮助持续维护和发展RPA自动化,特别是能使更复杂和更广泛的流程实现自动化。总的来说,企业可通过将RPA与流程挖掘相结合,优化流程,提高业务自动化效率,保证较高的投资回报率。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (7)

1.一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述的基于RPA分解日志自动化流程挖掘的方法包括如下步骤:
S1,系统构建,首先构建一个基于大数据计算为基础的数据处理服务器,同时构建若干数据挖掘终端机若干RPA机器人终端,所述基于大数据计算为基础的数据处理服务器通过通讯网络分别与若干数据挖掘终端机建立数据连接,且各数据挖掘终端机间相互并联,同时每个数据挖掘终端机均通过通讯网关与1—4个RPA机器人终端间建立数据连接,且同一数据挖掘终端机所连接的各RPA机器人终端间通过通讯网关相互连接;基于大数据计算为基础的数据处理服务器另通过通讯接口与1个RPA机器人终端建立数据连接,同时将基于大数据计算为基础的数据处理服务器和各数据挖掘终端机分别通过通讯网络与外部工作数据网络建立数据连接;
S2,系统设置,完成S1步骤后,首先在基于大数据计算为基础的数据处理服务器中设置数据处理软件系统、日志文件处理软件系统;在数据挖掘终端机中录入日志文件处理软件系统,然后分别在基于大数据计算为基础的数据处理服务器和据挖掘终端机中分别录入日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略;
S3,数据分流,首先由基于大数据计算为基础的数据处理服务器和各数据挖掘终端机通过通讯网络分别对工作数据网络在日常工作中产生的日志文件进行收集汇总,同时各数据挖掘终端机采集的日志文件均传输至基于大数据计算为基础的数据处理服务器内,由基于大数据计算为基础的数据处理服务器对接收的各日志文件根据S2步骤设置的日志数据管理程序、日志数据存储程序、进行预处理并存储;然后由基于大数据计算为基础的数据处理服务器所连接的RPA机器人终端根据S2步骤设置数据筛选程序、日志文件分解控制策略对各日志文件进行分流;最后将分流后的数据分别发送至各数据挖掘终端机内;
S4,数据挖掘处理,将分流至各数据挖掘终端机的日志文件数据,由数据挖掘终端机根据S2步骤设定的日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略,由其连接的各RPA机器人终端对当前的日志文件数据进行分析处理,最后将分析处理结果集中汇总至基于大数据计算为基础的数据处理服务器,由基于大数据计算为基础的数据处理服务器对各数据挖掘终端机传输的数据进行汇总处理,即可得到完整的数据挖掘分析结果。
2.根据权利要求1所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述S2步骤中设定的日志文件分解控制策略中包括基于BPMN是BPM及workflow的建模中任意一种或几种共用的数据建模系统,且日志数据管理程序、日志数据存储程序、数据筛选程序、日志文件分解控制策略和数据处理软件系统、日志文件处理软件系统均纳入统一的软件栈中。
3.根据权利要求1所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述S4步骤在进行数据挖掘处理时,
第一阶段,RPA机器人终端根据日志文件分解控制策略,由RPA机器人终端将采集业务流程中的元数据并进行数据预处理,在RPA中设定需保留的数据项和需删除的数据项,筛选出流程挖掘用到的元数据,包含案例、事件、时间戳,删除流程中特定的业务数据,最终获得的事件日志是适用于事件流程图来构造的形式;
第二阶段,将根据业务流程相中的事件ID,时间戳进行度量,建造出更加反映实际数据形式的事件流程图,将第一步采集的原始元数据集建模为一个有初始节点和结束节点的有向加权图的形式;
第三阶段,对事件流程图进行聚类划分,最终得到划分为不同阶段的流程活动集,并在活动流程之上再次挖掘出子流程图并进行合并,得出流程自动化所达到的最终效果。
4.根据权利要求3所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述子流程集处理时,按以下三个步骤进行:
第一步,子流程图挖掘,首先基于前面流程分解步骤中的输出,得到了一组流程集的分解,每个分解集中都会存在一个分解点,这个分解点是两个相邻流程的分界线,并会在下一个分解集中也存储一个拷贝,以表明它是本阶段和上一阶段之间的分解点,按照活动事件所属的分解将数据集分成不同的数据子集,每个子集只包含分解内部的流程信息,然后对于这些流程子集进行再一次的流程图构建,将构建基于时间戳,允许活动并行发生的流程图;
第二步,子图聚合,在第一步得到子模型后,初步拟定为每一个子模型内部存在的分解点,将分解点与下一个子模型的初始点进行连接,使两个子模型合并起来;
第三步,聚合图简化与完善,经过第二步得到聚合图以后,一方面再返回至S3步骤,核对是否有被忽略、误删除作业;另一方面还需要再添加额外的边集数据,实现各模块之间连接的交互边。
5.根据权利要求1所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述RPA机器人终端包括承载壳、辅助驱动电源、数据通讯端口、数据处理电路、数据存储电路、操控界面及绝缘隔板,其中所述承载壳为轴向截面呈矩形的闭合腔体结构,所述绝缘隔板嵌于承载壳内并将承载壳内均分为若干工作腔,其中所述辅助驱动电源、数据处理电路、数据存储电路分别嵌于一个工作腔内,并均与绝缘隔板相互连接,所述操控界面嵌于承载壳上端面,数据通讯端口若干并均嵌于承载壳前端面,所述数据存储电路分别与辅助驱动电源、数据通讯端口、数据处理电路、数据存储电路、操控界面间电气连接,且数据处理电路通过数据通讯端口与外部设备间建立数据连接。
6.根据权利要求5所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述承载壳下端面设至少两条导向柱,上端面设至少一个横断面呈矩形闭合腔体结构的储物腔,其中所述导向柱对称分布在承载壳轴线两侧,其上端面通过棘轮机构与承载壳下端面铰接,其轴线与承载壳底部呈0°—120°夹角,所述导向柱包括立柱、连接滑槽、导向套,其中所述立柱为至少两级伸缩杆结构,立柱外侧面通过导向套与连接滑槽连接,所述导向套为与立柱同轴分布的空心柱状结构,包覆在立柱外并与立柱同轴分布,且导向套与立柱间另通过至少一个定位销连接,所述导向套外侧面通过铰链与至少一条连接滑槽铰接,所述连接滑槽为横断面呈“凵”字形槽装结构,其轴线与立柱轴线呈0°—90°夹角。
7.根据权利要求5所述的一种基于RPA分解日志自动化流程挖掘的方法,其特征在于,所述辅助驱动电源包括蓄电池及多路稳压直流电源;所述操控界面包括信号指示灯、按键、显示器中任意一种或几种共用。
CN202210621671.4A 2022-06-02 2022-06-02 一种基于rpa分解日志自动化流程挖掘的方法 Active CN114926073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210621671.4A CN114926073B (zh) 2022-06-02 2022-06-02 一种基于rpa分解日志自动化流程挖掘的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210621671.4A CN114926073B (zh) 2022-06-02 2022-06-02 一种基于rpa分解日志自动化流程挖掘的方法

Publications (2)

Publication Number Publication Date
CN114926073A CN114926073A (zh) 2022-08-19
CN114926073B true CN114926073B (zh) 2023-04-18

Family

ID=82812844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210621671.4A Active CN114926073B (zh) 2022-06-02 2022-06-02 一种基于rpa分解日志自动化流程挖掘的方法

Country Status (1)

Country Link
CN (1) CN114926073B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115878081B (zh) * 2023-02-23 2023-05-16 安徽思高智能科技有限公司 一种基于流程发现的高价值rpa需求分析系统
CN117406972B (zh) * 2023-12-14 2024-02-13 安徽思高智能科技有限公司 基于拟合度分析的rpa高价值流程实例发现方法及系统
CN117787680A (zh) * 2024-02-27 2024-03-29 西安敦讯信息技术有限公司 一种基于管理系统的业务流程挖掘方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114240179A (zh) * 2021-12-20 2022-03-25 国网汇通金财(北京)信息科技有限公司 一种基于事件图谱的财务流程挖掘方法和相关装置
CN114239406A (zh) * 2021-12-20 2022-03-25 国网汇通金财(北京)信息科技有限公司 一种基于强化学习的财务流程挖掘方法和相关装置
CN114398022A (zh) * 2022-01-11 2022-04-26 广东电力信息科技有限公司 基于行为分析的流程挖掘系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210004711A1 (en) * 2019-07-02 2021-01-07 International Business Machines Corporation Cognitive robotic process automation
US11775889B2 (en) * 2020-03-26 2023-10-03 Cross Commerce Media, Inc. Systems and methods for enhancing and facilitating access to specialized data
US11941414B2 (en) * 2020-11-20 2024-03-26 International Business Machines Corporation Unstructured extensions to rpa

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114240179A (zh) * 2021-12-20 2022-03-25 国网汇通金财(北京)信息科技有限公司 一种基于事件图谱的财务流程挖掘方法和相关装置
CN114239406A (zh) * 2021-12-20 2022-03-25 国网汇通金财(北京)信息科技有限公司 一种基于强化学习的财务流程挖掘方法和相关装置
CN114398022A (zh) * 2022-01-11 2022-04-26 广东电力信息科技有限公司 基于行为分析的流程挖掘系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Imène Benkalaï等.Computing a lower bound for the solution of a Robotic Process Automation (RPA) problem using network flows.2020 7th International Conference on Control, Decision and Information Technologies (CoDIT).2020,全文. *
S. Sujatha等.Cloth Consultant Robot With Temperature & Weather Report Using Uipath – Rpa.2021 Third International Conference on Intelligent Communication Technologies and Virtual Mobile Networks (ICICV).2021,全文. *
曲巨宝.基于数据挖掘的多Agent智能入侵检测系统研究.网络安全技术与应用.2008,(04),全文. *
柯徐亭.RPA技术对注册会计师行业影响浅析.中国注册会计师.2020,(03),全文. *
王彦博;王华军;张月;巩春雨;张超;贾东兴;刘曦子.疫情之下的金融科技创新――自动数据挖掘建模RPA机器人创新技术应用.中国金融电脑.2020,(05),全文. *

Also Published As

Publication number Publication date
CN114926073A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN114926073B (zh) 一种基于rpa分解日志自动化流程挖掘的方法
CN111158983A (zh) 一种一体化运维管理系统
CN112905685B (zh) 一种面向信息化建设的架构管控系统及设备
CN112651126B (zh) 一种基于bim的建筑工程施工优化系统、方法、终端及存储介质
CN111507395A (zh) 一种营销大数据建模方法及平台
WO2014179257A1 (en) Communication data analysis and processing system and method
CN115423289B (zh) 智能板材加工车间数据处理方法及终端
CN111383130A (zh) 一种全生命周期管控平台、移动运维客户端及终端
CN112230893A (zh) 面向船舶制造的多种工业机理模型一站式构建系统及方法
US20070083446A1 (en) Method, system, and program product for providing revisional delta billing and re-billing in a dynamic project environment
CN112347071A (zh) 一种配电网云平台数据融合方法及配电网云平台
CN113642299A (zh) 一种基于电网统计报表一键生成的方法
CN112162960A (zh) 一种卫生健康政务信息共享方法、装置及系统
CN115423429A (zh) 基于图像和声音信息的多模态一体化配网运营系统
TW200421139A (en) System and method for employee performance assessing
CN115016902B (zh) 工业流程数字化管理系统及方法
Hoffmann et al. Interdisciplinary production risk exploration: A grounded approach to integrate data-and knowledge-driven analytics
Mon et al. Evaluation of technological development for the definition of Industries 4.0
CN115270947A (zh) 标准化能效服务模型构建方法、系统、终端及存储介质
CN114860851A (zh) 数据处理方法、装置、设备及存储介质
Aceituno-Rojo et al. Server monitoring model based on Balanced Scorecard and SNMP of an electric power company
CN112734226A (zh) 一种电力客服业务的数据资产管理方法
Maulana et al. Business Process Management and service-oriented architecture implementation for ROOT cause identification on monitoring tools at XYZ Company
Gustafson et al. Fusion of production, operation and maintenance data for underground mobile mining equipment
Mahadevan Automated simulation analysis of overall equipment effectiveness metrics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant