CN112070416A - 基于ai的rpa流程的生成方法、装置、设备及介质 - Google Patents

基于ai的rpa流程的生成方法、装置、设备及介质 Download PDF

Info

Publication number
CN112070416A
CN112070416A CN202010981504.1A CN202010981504A CN112070416A CN 112070416 A CN112070416 A CN 112070416A CN 202010981504 A CN202010981504 A CN 202010981504A CN 112070416 A CN112070416 A CN 112070416A
Authority
CN
China
Prior art keywords
session
sessions
event
rpa
events
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010981504.1A
Other languages
English (en)
Other versions
CN112070416B (zh
Inventor
王建周
胡一川
汪冠春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Original Assignee
Beijing Benying Network Technology Co Ltd
Beijing Laiye Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Benying Network Technology Co Ltd, Beijing Laiye Network Technology Co Ltd filed Critical Beijing Benying Network Technology Co Ltd
Publication of CN112070416A publication Critical patent/CN112070416A/zh
Application granted granted Critical
Publication of CN112070416B publication Critical patent/CN112070416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Abstract

本公开提供了一种基于AI的RPA流程的生成方法、装置、设备及介质,涉及AI和RPA领域,其中,该基于AI的RPA流程的生成方法包括:获取会话数据,其中会话数据包括各个会话的起止标识信息;对会话数据进行会话切割,生成多个会话;以及基于多个会话生成至少一个RPA流程。通过这种方式,实现了依靠机器来自动挖掘流程,避免了依靠人工来挖掘流程,从而提高了流程挖掘的效率。

Description

基于AI的RPA流程的生成方法、装置、设备及介质
相关申请的交叉引用
本申请要求北京奔影网络科技有限公司于2019年12月31日提交的、申请名称为“RPA流程的生成方法以及相应的设备、计算机可读存储介质”的、中国专利申请号“201911423731.6”的优先权。
技术领域
本公开涉及人工智能(Artificial Intelligence,简称AI)和机器人流程自动化(Robotic Process Automation,简称RPA)领域,并且更具体地涉及一种基于AI的RPA流程的生成方法、装置、设备及介质。
背景技术
机器人流程自动化(Robotic Process Automation,简称RPA)是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务,通过机器人操作替代重复、有规则的、稳定的人工操作的技术。RPA的应用范围非常广泛。一些重复化、标准化的工作都可以通过RPA来完成。
人工智能(Artificial Intelligence,简称AI)是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新技术科学。人工智能领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
为了通过RPA协助人工进行作业,需要把人工流程挖掘出来,以便RPA机器人执行这些流程,从而实现代人工作业。目前,基本依靠人工来挖掘这些流程,然而,人工挖掘流程的方式,存在挖掘效率较低的问题。
发明内容
本公开的目的旨在至少在一定程度上解决上述的技术问题之一。
本公开提出了一种基于AI的RPA流程的生成方法、装置、设备及介质,以实现依靠机器来自动挖掘流程,避免了依靠人工来挖掘流程,提高了流程挖掘的效率。
根据本公开的一个方面,提供了一种RPA流程的生成方法,包括:获取会话数据,其中,所述会话数据包括各个会话的起止标识信息;对所述会话数据进行会话切割,生成多个会话;以及基于所述多个会话生成至少一个RPA流程。
根据本公开的一个示例,上述方法还包括:当确定触发执行所述至少一个RPA流程时执行所述至少一个RPA流程。
根据本公开的一个示例,其中,所述多个会话中的每个会话包括多个事件。
根据本公开的一个示例,所述基于所述多个会话生成至少一个RPA流程,包括:
确定与所述多个会话对应的向量;
基于与所述多个会话对应的向量,生成至少一个RPA流程。
根据本公开的一个示例,其中,所述确定与所述多个会话对应的向量,包括:确定与每个会话中的各个事件对应的向量;对与每个会话中的各个事件对应的向量求和,生成与每个会话对应的向量。
根据本公开的一个示例,其中,所述基于与所述多个会话对应的向量生成至少一个RPA流程,包括:基于与所述多个会话对应的向量,对所述多个会话进行聚类,生成多个会话类;针对每个会话类,确定与所述会话类对应的推荐流程;以及基于所述推荐流程生成RPA流程。
根据本公开的一个示例,其中,在所述对所述多个会话进行聚类之前,所述方法还包括:对所述多个会话进行去噪。
根据本公开的一个示例,其中,所述针对每个会话类,确定与所述会话类对应的推荐流程,包括:对所述会话类中各个会话所包括的事件进行相似度计算,以获得相似度计算结果;以及基于所述相似度计算结果,确定与所述会话类对应的推荐流程。
根据本公开的一个示例,其中,所述基于所述相似度计算结果确定与所述会话类对应的推荐流程,包括:从所述会话类中各个会话所包括的事件中确定当前事件;基于所述相似度计算结果,执行至少一次循环过程,其中,所述循环过程包括:判断所述会话类中各个会话所包括的多个事件中除所述当前事件之外的其他事件中是否存在下一事件,其中,所述下一事件与所述当前事件的相似度超过阈值;当所述其他事件中不存在所述下一事件时,停止执行循环过程;当所述其他事件中存在所述下一事件时,从所述其他事件中确定所述下一事件,将所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程;
根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
根据本公开的一个示例,其中,所述根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程,包括:
若所述循环过程执行次数为一次,则根据所述当前事件,确定所述会话类对应的推荐流程;
若所述循环过程执行次数大于一次,则根据每一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
根据本公开的一个示例,其中,所述基于所述推荐流程生成RPA流程,包括:显示所述推荐流程;确定针对所述推荐流程的修改指令;以及根据所述修改指令生成RPA流程。
根据本公开的一个示例,其中,所述显示所述推荐流程,包括:生成与所述推荐流程对应的可视化信息;以及显示所述可视化信息;其中,所述根据所述修改指令生成RPA流程,包括:根据所述修改指令修改所述可视化信息;以及基于修改后的可视化信息生成RPA流程。
根据本公开的一个示例,其中所述获取会话数据包括:从至少一个终端获取会话数据。
根据本公开的一个示例,其中,所述会话数据包括与所述每个会话中的各个事件对应的时间戳。
根据本公开的一个示例,其中,所述每个会话包括各个事件对应客户的标识。
根据本公开的另一方面,提供了一种基于AI的RPA流程的生成装置,包括:获取单元,被配置为获取会话数据,其中,所述会话数据包括各个会话的起止标识信息;第一生成单元,被配置为对所述会话数据进行会话切割,生成多个会话;第二生成单元,被配置为基于所述多个会话生成至少一个RPA流程。
根据本公开的一个示例,上述装置还包括:执行单元,被配置为当确定触发执行所述至少一个RPA流程时,执行所述至少一个RPA流程。
根据本公开的一个示例,其中,所述多个会话中的每个会话包括多个事件。
根据本公开的一个示例,其中,第二生成单元,被配置为确定与所述多个会话对应的向量,以及基于所述多个会话对应的向量,生成至少一个RPA流程。
根据本公开的一个示例,其中,所述确定单元被配置为确定与每个会话中的各个事件对应的向量;对与每个会话中的各个事件对应的向量求和,生成与每个会话对应的向量。
根据本公开的一个示例,其中,所述第二生成单元被配置为:基于与所述多个会话对应的向量,对所述多个会话进行聚类,生成多个会话类;针对每个会话类,确定与所述会话类对应的推荐流程;以及基于所述推荐流程生成RPA流程。
根据本公开的一个示例,上述装置还包括:去噪单元,被配置为在对所述多个会话进行聚类之前,对所述多个会话进行去噪。
根据本公开的一个示例,其中所述第二生成单元被配置为:对所述会话类中各个会话所包括的事件进行相似度计算,以获得相似度计算结果;以及基于所述相似度计算结果,确定与所述会话类对应的推荐流程。
根据本公开的一个示例,其中所述第二生成单元被配置为:从所述会话类中各个会话所包括的事件中确定当前事件;基于所述相似度计算结果,执行至少一次循环过程,其中,所述循环过程包括:判断所述会话类中各个会话所包括的多个事件中除所述当前事件之外的其他事件中是否存在下一事件,其中,所述下一事件与所述当前事件的相似度超过阈值;当所述其他事件中不存在所述下一事件时,停止执行循环过程;当所述其他事件中存在所述下一事件时,从所述其他事件中确定所述下一事件,将所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程;根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
根据本公开的一个示例,其中,所述第二生成单元被配置为:若所述循环过程执行次数为一次,则根据所述当前事件,确定所述会话类对应的推荐流程;若所述循环过程执行次数大于一次,则根据每一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
根据本公开的一个示例,其中,所述第二生成单元被配置为:显示所述推荐流程;确定针对所述推荐流程的修改指令;以及根据所述修改指令生成RPA流程。
根据本公开的一个示例,上述装置还包括:显示单元,被配置为生成与所述推荐流程对应的可视化信息;以及显示所述可视化信息;其中,所述第二生成单元被配置为:根据所述修改指令修改所述可视化信息;以及基于修改后的可视化信息生成RPA流程。
根据本公开的一个示例,其中,所述获取单元被配置为从至少一个终端获取会话数据。
根据本公开的一个示例,其中,所述会话数据包括与每个会话中的各个事件对应的时间戳。
根据本公开的一个示例,其中,每个会话包括事件对应客户的标识。
根据本公开的另一方面,提供了一种基于AI的RPA流程的生成设备,包括:处理器;以及存储器,其中,所述存储器中存储有计算机可执行程序当由所述处理器执行所述计算机可执行程序时,执行上述基于AI的RPA流程的生成方法。
根据本公开的另一方面,提供了一种计算机可读存储介质,其上存储由指令,所述指令在被处理器执行时,使得所述处理器执行上述基于AI的RPA流程的生成方法。
根据本公开上述各个方面的基于AI的RPA流程的生成方法、装置、设备及介质,可以对所获取的会话数据进行会话切割来生成多个会话,并且根据与该多个会话对应的向量来生成RPA流程,从而实现了依靠机器来自动挖掘流程,避免了依靠人工来挖掘流程,进而提高了流程挖掘的效率。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是可在其中应用本公开实施例的系统的架构示意图。
图2是根据本公开实施例的基于AI的RPA流程的生成方法的流程示意图一。
图3是根据本公开实施例的确定与多个会话对应的向量的方法的流程示意图。
图4是根据本公开实施例的基于与多个会话对应的向量生成至少一个RPA流程的方法的流程示意图。
图5是根据本公开实施例的基于相似度计算结果确定与会话类对应的推荐流程的方法的流程示意图。
图6是根据本公开实施例的基于推荐流程生成RPA流程的方法的流程示意图。
图7是根据本公开实施例的基于AI的RPA流程的生成方法的流程示意图二。
图8示出了根据本公开实施例的执行图2所示的方法的装置的结构示意图。
图9示出了根据本公开实施例的执行图2至图7所示的方法的装置的结构示意图。
图10示出了根据本公开实施例的设备的架构示意图。
具体实施方式
为了使得本公开的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本公开的示例实施例。在附图中,相同的参考标号自始至终表示相同的元件。应当理解:这里描述的实施例仅仅是说明性的,而不应被解释为限制本公开的范围。
首先,参照图1来描述可在其中应用本公开实施例的系统的架构示意图。如图1所示,系统100可以包括服务器110和终端120。终端120可以运行用于采集会话(session)数据的客户端,并通过该客户端采集会话数据。并且,终端120可以将所采集的会话数据发送给服务器110。服务器110可以对所获取的会话数据进行会话切割来生成多个会话,并且确定与该多个会话对应的向量,以及基于与该多个会话对应的向量来生成至少一个RPA流程。通过这种方式,实现了依靠机器来挖掘流程,避免了依靠人工来挖掘流程,提高了流程挖掘的效率。
此外,在本公开中,终端120可以是智能手机、平板电脑、膝上型便携式计算机、台式计算机、客服终端等电子设备。服务器110可以是与终端120建立通信链路并且生成RPA流程的设备。
此外,需要认识到,尽管在图1中示出了一个服务器和一个终端,但这只是示意性的,图1所示的系统可以包括多个服务器和/或多个终端。
下面将参照图2来描述根据本公开实施例的基于AI的RPA流程的生成方法。图2是根据本公开实施例的基于AI的RPA流程的生成方法200的流程示意图一。方法200可以由图1中的服务器执行。
如图2所示,方法200可以包括以下步骤:
在步骤S201中,获取会话数据。
例如,在步骤S201中,服务器可以从至少一个终端获取会话数据。此外,终端在采集到会话数据后,可以实时地将会话数据发送给服务器。可替换地,终端在采集到会话数据后,可以非实时地将会话数据发送给服务器。例如,终端在采集到会话数据后,可以先将会话数据存储在终端的存储模块(例如,存储器)中,然后在预设时间之后再将会话数据发送给服务器。
根据本公开的一个示例,步骤S201中的会话数据可以包括各个会话的起止标识信息。每个会话的起止标识信息例如可以是该会话的开始标示符和/或结束标示符。
根据本公开的另一示例,步骤S201中的会话数据还可以包括各个会话的标识信息。每个会话的标识信息例如可以是会话标识(Identification,简称ID)。
根据本公开的另一示例,步骤S201中的会话数据还可以包括多个事件、以及与各个事件对应的时间戳。例如,终端可以根据常规的时间戳确定方法来确定与各个事件对应的时间戳,并将与各个事件对应的时间戳发送给服务器,以便服务器所获取的会话数据包括与各个事件对应的时间戳。
根据本公开的另一示例,步骤S201中的会话数据还可以包括与各个事件对应的页面统一资源定位器(Uniform Resource Locator,简称URL)、页面标题、页面控制元素、页面控制元素属性等中的至少一个。
返回图2,在步骤S202中,对会话数据进行会话切割,生成多个会话。
在本公开中,终端的时钟和服务器的时钟可以同步,也可以不同步。当终端的时钟和服务器的时钟同步时,服务器在对会话数据进行会话分割前不需要对齐会话数据中的各个事件的时间戳。
然而,当终端的时钟和服务器的时钟不同步时,服务器在对会话数据进行会话分割前需要对齐会话数据中的各个事件的时间戳。例如,服务器可以基于终端的时钟与自身的时钟来对齐会话数据中的各个事件的时间戳。具体地,服务器可以确定终端的时钟与自身的时钟之间的时间差,然后根据该时间差对齐会话数据中的各个事件的时间戳。
此外,在步骤S202中,服务器可以根据会话数据中各个会话的起止标识信息,对会话数据进行会话切割。例如,在会话的起止标识信息为会话的开始标示符的示例中,服务器可以根据各个会话的开始标识符来对会话数据进行切割。具体地,服务器可以将相邻两个开始标识符之间的事件作为一个会话所包括的事件,从而实现会话分割。又例如,在会话的起止标识信息为会话的结束标示符的示例中,服务器可以根据各个会话的结束标识符来对会话数据进行切割。具体地,服务器可以将相邻两个结束标识符之间的事件作为一个会话所包括的事件,从而实现会话分割。又例如,在会话的起止标识信息为会话的开始标示符和结束标识符的示例中,服务器可以根据各个会话的开始标识符或者结束标识符来对会话数据进行切割。
在本公开中,会话的起止标示符可以是设定的操作信息。例如,可以由用户(例如,客服)在会话开始或结束时,执行设定操作。该设定操作例如可以是通过输入设备(例如键盘)执行的操作,诸如敲键盘中的“X”键3次,或者,点击键盘中的回车键2次。
在一种实施方式中,会话还可以包括事件对应客户的标识,以解决一个用户(例如,客服)同时为多个客户服务时,多个会话的操作混在一起,无法分辨哪些事件是针对同一客户服务过程的问题。
在本公开中,会话可以是从开始页面访问到结束页面访问所进行的一系列操作,该一系列操作中的每个操作可以称为事件。这里所描述的事件可以是对页面中的控件(例如按钮、输入框)进行的操作,例如点击按钮、在输入框输入文字等。换言之,所生成的每个会话可以包括多个事件。
下面以发票处理流程为例来描述会话和事件。例如,发票处理流程可以包括以下步骤:(1)打开供应商的发票电子邮件;(2)在发票管理软件中创建工作项;(3)检查供应商名称是否正确;(4)检查金额是否正确;(5)如果均正确,计算税金;(6)录入供应商名称、金额以及税金;(7)关闭工作项。上述发票处理流程是一个会话,其包括七个事件,该七个事件分别为上述步骤(1)至(7)。
在本公开中,会话也可以称为“流程”。为了方便使用,在下文中可以互换地使用会话和流程。
返回图2,在步骤S203中,基于多个会话生成至少一个RPA流程。
应当理解的是,会话数据中的多个会话的类别可能不同,不同类别的会话对应的RPA流程可能不同,因此,在本公开实施例的一种可能的实现方式中,为了提升生成的RPA流程的可靠性,可以对多个会话进行聚类,得到多个会话类,然后,可以针对每个会话类,确定与该会话类对应的推荐流程,并基于推荐流程生成至少一个RPA流程。其中,推荐流程可以为会话类对应的标准流程或者格式化流程。
在本公开实施例的另一种可能的实现方式中,针对多个会话中的每个会话,可以确定与该会话对应的向量,之后,可根据与多个会话对应的向量,生成至少一个RPA流程。
在本公开中,针对多个会话中的每个会话,可以根据自然语言处理方法,确定与该会话对应的向量。或者,为了提升每个会话对应的向量计算结果的准确性,还可以根据深度学习技术、机器学习方法,来确定与每个会话对应的向量,本公开对此并不作限制。比如,可以根据基于弱监督学习的自然语言处理中的Word2Vec和Glove等机制,将每个会话表示为一个向量。应当理解的是,还可以优化在机器学习中所使用的损失函数,从而提高用向量表示事件的准确率。
需要说明的是,上述仅是示例性实施例,但本公开不限于此,还可以包括本领域已知的其他的向量计算方法,只要能够得到会话对应的向量即可。
在本公开中,在确定多个会话对应的向量后,可根据与多个会话对应的向量,生成至少一个RPA流程。例如,可以根据多个会话对应的向量对所述多个会话进行聚类,生成多个会话类,然后,可以针对每个会话类,确定与该会话类对应的推荐流程,并基于推荐流程生成至少一个RPA流程。
作为一种可能的实现方式,为了提升每个会话对应的向量计算结果的准确性,本公开中,针对每个会话,可以分别确定该会话中的各个事件对应的向量,从而可根据各个事件对应的向量来确定与每个会话对应的向量。下面将结合图3来描述本公开是如何确定每个会话对应的向量的。图3是根据本公开实施例的确定与多个会话对应的向量的方法300的流程示意图。如图3所示,确定与多个会话对应的向量,可以包括以下二个子步骤,分别为图3中的步骤S301和步骤S302。
首先,在步骤S301中,服务器可以确定与每个会话中的各个事件对应的向量。
具体地,对于每个会话,可以根据常规的机器学习方法将该会话所包括的各个事件表示为向量。例如,可以根据常规的自然语言处理方法将一个事件表示为一个向量,其中该向量具有预设的维度(例如,100维)。例如,可以根据基于弱监督学习的自然语言处理中的Word2Vec和Glove等机制将一个事件表示为一个向量。此外,还可以优化在机器学习中所使用的损失函数,从而提高用向量表示事件的准确率。
在一个会话包括五个事件的示例中,该会话中的第一事件可以被表示为向量a1。类似地,该会话中的第二事件可以被表示为向量a2,该会话中的第三事件可以被表示为向量a3,该会话中的第四事件可以被表示为向量a4,以及该会话中的第五事件可以被表示为向量a5
然后,在步骤S302中,服务器可以根据与每个会话中的各个事件对应的向量来确定与每个会话对应的向量。
例如,服务器可以对与每个会话中的各个事件对应的向量求和,生成与每个会话对应的向量。在一个会话包括五个事件且与该五个事件对应的向量分别为a1、a2、a3、a4和a5的示例中,与该会话对应的向量可以是向量a1、向量a2、向量a3、向量a4和向量a5的和。又例如,服务器还可以通过常规的深度学习模型(例如,变换器(transformer)模型)并且根据与每个会话所包括的各个事件对应的向量来确定与每个会话对应的向量。
下面将结合图4来描述本公开是如何根据与多个会话对应的向量,生成至少一个RPA流程的。图4是根据本公开实施例的基于与多个会话对应的向量生成至少一个RPA流程的方法400的流程示意图。如图4所示,基于与多个会话对应的向量生成至少一个RPA流程,可以包括以下三个子步骤,分别为图4中的步骤S401、步骤S402和步骤S403。
首先,在步骤S401中,服务器可以基于与多个会话对应的向量,对所述多个会话进行聚类,生成多个会话类。
根据本公开的一个示例,为了提升聚类结果的准确性,以及降低计算的工作量,在对多个会话进行聚类之前,服务器可以对多个会话进行去噪。例如,多个会话中的冗余事件可以看作噪声数据,因此,服务器可以去除该多个会话中的冗余事件,从而实现对该多个会话进行去噪。具体地,当该多个会话中的某个事件仅在该多个会话中的单个会话中出现时,该事件可以被认为是冗余事件。可替换地,服务器可以设置冗余事件库,并且当该多个会话中的某个事件与冗余事件库中的事件匹配时,该事件可以被认为是冗余事件。
在该示例中,服务器通过对多个会话进行去噪,可以获得有效会话。然后,服务器可以基于与有效会话对应的向量,对有效会话进行聚类,从而生成多个会话类。
例如,服务器可以根据常规的聚类算法对有效会话进行聚类处理,以生成多个会话类。具体地,聚类算法的输入可以是与有效会话对应的向量,该聚类算法的输出可以是多个会话类。这里所描述的聚合算法可以是K均值(K-Means)聚类算法、均值漂移聚类算法、基于密度的聚类方法、用高斯混合模型的最大期望的聚类算法、凝聚层次聚类算法、图团体检测(Graph Community Detection)算法等。
此外,在该示例中,所生成的多个会话类可以是关于多种业务的会话类。也可以是一种业务的多个子业务的会话类,例如,所生成的多个会话类可以包括关于发票处理流程的会话类、关于人事处理流程的会话类、关于电话客服的会话类等。也可以是票务电话客服中的订票流程会话类、退票流程会话类。
此外,在该示例中,每个会话类可以包括至少一个会话。此外,每个会话类中的各个会话都与同一种业务或子业务有关。例如,当会话类是关于发票处理流程的会话类时,该会话类中的各个会话都与发票处理流程有关。又例如,当会话类是关于订票流程会话类,该会话类中的各个会话都与发票处理流程有关。
然后,在步骤S402中,服务器可以针对每个会话类,确定与该会话类对应的推荐流程。该推荐流程可以作为与该会话类对应的标准流程或者格式化流程。
根据本公开的一个示例,服务器可以对一会话类中各个会话所包括的事件进行相似度计算,以获得相似度计算结果。该相似度计算结果可以包括该会话类中任意两个事件之间的相似度。例如,服务器可以根据常规的相似度计算方法来计算该会话类中任意两个事件之间的相似度。
然后,服务器可以基于所述相似度计算结果,确定与该会话类对应的推荐流程。下面将结合图5来具体描述服务器如何基于相似度计算结果确定与会话类对应的推荐流程的具体过程。图5是根据本公开实施例的基于相似度计算结果确定与会话类对应的推荐流程的方法500的流程示意图。
如图5所示,在步骤S501中,服务器可以从一个会话类中各个会话所包括的事件中确定当前事件。
例如,服务器可以根据该会话类中各个会话的开始标识符,从该会话类中各个会话所包括的事件中选择一个事件作为当前事件。由于该会话类中的各个会话属于同一会话类,因此,可以假设该会话类中的各个会话中的第一个事件是相同的。在该假设下,服务器可以将该会话类中任一会话的开始标识符之后的第一个事件作为当前事件。
然后,在步骤S502中,服务器可以基于相似度计算结果,执行至少一次循环过程,其中,所述循环过程包括:判断该会话类中各个会话所包括的多个事件中除所述当前事件之外的其他事件中是否存在下一事件,其中,所述下一事件与所述当前事件的相似度超过阈值;当所述其他事件中不存在所述下一事件时,停止执行循环过程;当所述其他事件中存在所述下一事件时,从所述其他事件中确定所述下一事件,将所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程。
例如,服务器可以从相似度计算结果中查找与当前事件的相似度超过阈值的事件,并将所查找的事件作为相对于当前事件的下一事件。
此外,这里的阈值的取值可以设置为较大的值,从而使得当前事件和下一事件的相似度较高。
在本公开中,在第一次循环过程中,服务器可以判断所述会话类中各个会话所包括的多个事件中除所述当前事件之外的其他事件中是否存在下一事件,当所述其他事件中不存在下一事件时,服务器可以根据所述当前事件确定与该会话类对应的推荐流程。也就是说,与该会话类对应的推荐流程仅包括当前事件。
此外,当所述其他事件中存在下一事件时,服务器可以从所述其他事件中确定下一事件,并将所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程。也就是说,服务器可以重复执行判断其他事件中是否存在与本次循环过程采用的当前事件的相似度超过阈值的下一事件,当所述其他事件中不存在所述下一事件时,则根据本次循环过程采用的当前事件确定与所述会话类对应的推荐流程,而当所述其他事件中存在所述下一事件时,则采用所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程,直至所述其他事件中不存在下一事件,停止执行循环过程。
然后,在步骤S503中,服务器可以根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
在本公开中,服务器可以根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。具体地,服务器可以确定循环过程执行的次数,若所述循环过程执行次数为一次,则根据所述当前事件,确定所述会话类对应的推荐流程,而若所述循环过程执行次数大于一次,则根据最后一次循环过程采用的当前事件,以及之前每一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程,即根据每一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。例如,与该会话类对应的推荐流程可以包括每一次循环过程采用的当前事件。
下面给出与方法500对应的一个具体示例。假设一会话类包括三个会话且该三个会话中的第一个事件是相同的,并且第一会话包括三个事件,分别表示为P1、P12、P13,第二会话包括三个事件,分别表示为P1、P22、P23,第三会话包括四个事件,分别表示为P1、P32、P33、P34。根据方法500,在步骤S501,可以确定事件P1为当前事件。然后,在步骤S502中,在第一次循环过程中,可以基于相似度计算结果,判断该会话类所包括的除P1之外的剩余事件(P12、P13、P22、P23、P32、P33、P34)中是否存在下一事件。当存在下一事件时,可以从剩余事件(P12、P13、P22、P23、P32、P33、P34)中确定下一事件,例如确定下一事件为事件P22。然后,可以将事件P22作为第二次循环过程采用的当前事件,并执行第二次循环过程,即重复上述步骤S502,可以确定相对于事件P22的下一事件为事件P23,并将事件P23作为第三次循环过程采用的当前事件。然后,重复上述步骤S502,可以确定相对于事件P23的下一事件为事件P34,并将事件P34作为第四次循环过程采用的当前事件。然后,重复上述步骤S502,找不到相对于事件P34的下一事件。然后,在步骤S503中,可以根据第四次循环过程采用的当前事件,即事件P34、以及第一次循环过程采用的当前事件,即事件P1、第二次循环过程采用的当前事件,即事件P22、第三次循环过程采用的当前事件,即事件P23,来确定与该会话类对应的推荐流程,该推荐流程可以包括事件P1、事件P22、事件P23、以及事件P34
此外,根据本公开的另一示例,服务器可以从一个会话类中挖掘会话评分高于第一阈值的会话,并根据所挖掘的会话评分高于第一阈值的会话来确定与该会话类对应的推荐流程。
具体地,首先,服务器可以从每个会话类中挖掘发生频率高于第二阈值的会话。例如,服务器可以统计该会话类中的各个会话的发生频率,然后从该会话类中选择发生频率高于第二阈值的会话。又例如,服务器可以根据常规的循环神经网络(Recurrent NeuralNetwork,简称RNN)深度学习来从每个会话类中挖掘发生频率高于第二阈值的会话。这里所描述的RNN深度学习可以是常规的长短期记忆网络(Long Short-Term Memory,简称LSTM)模型等。
在服务器根据RNN从每个会话类中挖掘发生频率高于第二阈值的会话的示例中,服务器可以根据第二阈值来确定RNN的网络特性。RNN的网络特征可以包括网络参数、网络节点的数量等中的一个或多个。
然后,服务器可以从所挖掘的发生频率高于第二阈值的会话中挖掘会话评分高于第一阈值的会话。例如,对于所挖掘的发生频率高于第二阈值的会话,服务器可以确定这些会话中每个会话的会话评分,然后从这些会话中选择会话评分高于第一阈值的会话。
在本公开中,会话评分可以是关于会话的优先级、会话的投入产出比等中的至少一个的函数。例如,会话评分可以是会话的优先级或者会话的投入产出比。又例如,会话评分可以是会话的优先级和会话的投入产出比的加权平均值。
此外,可以根据会话所包括的事件的数量、会话的发生频率以及会话所花费的时间等中的至少一个来确定会话的投入产出比。例如,会话的投入产出比可以与会话所包括的事件的数量、会话的发生频率以及会话所花费的时间等中的至少一个呈正比。例如,会话的投入产出比可以是会话所包括的事件的数量、会话的发生频率以及会话所花费的时间三者的乘积。然后,服务器可以将所挖掘的会话评分高于第一阈值的会话中的至少一个作为与该会话类对应的推荐流程。例如,当所挖掘的会话评分高于第一阈值的会话的数量是一个时,可以将所挖掘的会话评分高于第一阈值的会话作为与该会话类对应的推荐流程。当所挖掘的会话评分高于第一阈值的会话的数量是多个时,可以从所挖掘的会话评分高于第一阈值的会话中选择一个会话作为与该会话类对应的推荐流程。
返回图4,在步骤S403中,服务器可以基于推荐流程生成RPA流程。
下面将结合图6来具体描述服务器基于推荐流程生成RPA流程的具体流程。图6是根据本公开实施例的服务器基于推荐流程生成RPA流程的方法600的流程示意图。
如图6所示,在步骤S601中,可以显示推荐流程。例如,服务器可以生成与所述推荐流程对应的可视化信息,并显示所述可视化信息。这里所描述的可视化信息可以是与推荐流程对应的图像(例如流程图)、音频文件、视频文件等中的至少一个。
然后,在步骤S602中,可以确定针对推荐流程的修改指令。例如,服务器可以通过服务器的输入装置(例如,鼠标、键盘等)来接收针对该推荐流程的修改指令。
然后,在步骤S603中,可以根据修改指令生成RPA流程。
具体地,服务器可以根据修改指令修改可视化信息,以获得修改后的可视化信息。例如,在可视化信息为流程图的示例中,服务器可以根据修改指令删除、修改或调整流程图中的某些步骤,以获得修改后的流程图。
然后,服务器可以基于修改后的可视化信息生成RPA流程。例如,在可视化信息为流程图的示例中,服务器可以基于修改后的流程图生成RPA流程。
进一步地,参见图7,在图2所示实施例的基础上,在步骤S203之后,方法200还可以包括步骤S204以及步骤S205。
具体地,在步骤S204中,可以确定是否触发执行所生成的至少一个RPA流程。例如,可以生成与RPA流程对应的流程标签。然后,可以确定是否对该流程标签进行了操作(例如,点击),来确定是否触发执行所生成的RPA流程。
当确定触发执行所述至少一个RPA流程时,可以执行步骤S205,即执行所述至少一个RPA流程。当确定未触发执行所述至少一个RPA流程时,可以不执行步骤S205,即不执行所述至少一个RPA流程。
上文描述了由服务器执行方法200的具体过程。根据本公开的另一示例,方法200也可以由图1中的终端执行。需要认识到,由终端执行方法200的过程与上文中由服务器执行方法200的过程类似,主要的不同之处如下所述。
具体地,在由终端执行方法200的示例中,在步骤S201中,终端可以采集会话数据来获取会话数据,也可以从其他终端接收会话数据以获取会话数据。
此外,当终端采集会话数据来获取会话数据时,终端在对会话数据进行会话分割(即步骤S202)前不需要对齐会话数据中的各个事件的时间戳。当终端从其他终端接收会话数据以获取会话数据时,终端可以在对会话数据进行会话分割(即步骤S202)前需要对齐会话数据中的各个事件的时间戳。
根据本公开实施例的生成方法,可以对所获取的会话数据进行会话切割来生成多个会话,并且根据与该多个会话对应的向量来生成RPA流程,从而实现了依靠机器来自动挖掘流程,避免了依靠人工来挖掘流程,进而提高了流程挖掘的效率。
以下,参照图8来描述根据本公开实施例的与图2所示的方法对应的装置。图8示出了根据本公开实施例的执行图2所示的方法的装置700的结构示意图。装置700可以是图1中的服务器110。可替换地,装置700还可以是图1中的终端120。由于装置700的功能与在上文中参照图2描述的方法的细节相同,因此在这里为了简单起见,省略对相同内容的详细描述。如图8所示,装置700包括:获取单元710,被配置为获取会话数据,其中所述会话数据包括各个会话的起止标识信息;第一生成单元720,被配置为对所述会话数据进行会话切割,生成多个会话;以及第二生成单元730,被配置为基于所述多个会话生成至少一个RPA流程。除了这三个单元以外,装置700还可以包括其他部件,然而,由于这些部件与本公开实施例的内容无关,因此在这里省略其图示和描述。
例如,获取单元710可以从至少一个终端获取会话数据。此外,终端在采集到会话数据后,可以实时地将会话数据发送给服务器。可替换地,终端在采集到会话数据后,可以非实时地将会话数据发送给服务器。例如,终端在采集到会话数据后,可以先将会话数据存储在终端的存储模块(例如,存储器)中,然后在预设时间之后再将会话数据发送给服务器。
根据本公开的一个示例,会话数据可以包括各个会话的起止标识信息。每个会话的起止标识信息例如可以是该会话的开始标示符和/或结束标示符。
根据本公开的另一示例,会话数据还可以包括各个会话的标识信息。每个会话的标识信息例如可以是会话标识(Identification,简称ID)。
根据本公开的另一示例,的会话数据还可以包括多个事件、以及与各个事件对应的时间戳。例如,终端可以根据常规的时间戳确定方法来确定与各个事件对应的时间戳,并将与各个事件对应的时间戳发送给服务器,以便服务器所获取的会话数据包括与各个事件对应的时间戳。
根据本公开的另一示例,会话数据还可以包括与各个事件对应的页面统一资源定位器(Uniform Resource Locator,简称URL)、页面标题、页面控制元素、页面控制元素属性等中的至少一个。
在本公开中,终端的时钟和服务器的时钟可以同步,也可以不同步。当终端的时钟和服务器的时钟同步时,服务器在对会话数据进行会话分割前不需要对齐会话数据中的各个事件的时间戳。
然而,当终端的时钟和服务器的时钟不同步时,服务器在对会话数据进行会话分割前需要对齐会话数据中的各个事件的时间戳。例如,服务器可以基于终端的时钟与自身的时钟来对齐会话数据中的各个事件的时间戳。具体地,服务器可以确定终端的时钟与自身的时钟之间的时间差,然后根据该时间差对齐会话数据中的各个事件的时间戳。
此外,第一生成单元720可以根据会话数据中各个会话的起止标识信息,对会话数据进行会话切割。例如,在会话的起止标识信息为会话的开始标示符的示例中,第一生成单元720可以根据各个会话的开始标识符来对会话数据进行切割。具体地,第一生成单元720可以将相邻两个开始标识符之间的事件作为一个会话所包括的事件,从而实现会话分割。又例如,在会话的起止标识信息为会话的结束标示符的示例中,第一生成单元720可以根据各个会话的结束标识符来对会话数据进行切割。具体地,第一生成单元720可以将相邻两个结束标识符之间的事件作为一个会话所包括的事件,从而实现会话分割。又例如,在会话的起止标识信息为会话的开始标示符和结束标识符的示例中,第一生成单元720可以根据各个会话的开始标识符或者结束标识符来对会话数据进行切割。
在本公开中,会话的起止标示符可以是设定的操作信息。例如,可以由用户(例如,客服)在会话开始或结束时,执行设定操作。该设定操作例如可以是通过输入设备(例如键盘)执行的操作,诸如敲键盘中的“X”键3次,或者,点击键盘中的回车键2次。
在一种实施方式中,会话还可以包括事件对应客户的标识,以解决一个用户(例如,客服)同时为多个客户服务时,多个会话的操作混在一起,无法分辨哪些事件是针对同一用户服务过程的问题。
在本公开中,会话可以是从开始页面访问到结束页面访问所进行的一系列操作,该一系列操作中的每个操作可以称为事件。这里所描述的事件可以是对页面中的控件(例如按钮、输入框)进行的操作,例如点击按钮、在输入框输入文字等。换言之,所生成的每个会话可以包括多个事件。
下面以发票处理流程为例来描述会话和事件。例如,发票处理流程可以包括以下步骤:(1)打开供应商的发票电子邮件;(2)在发票管理软件中创建工作项;(3)检查供应商名称是否正确;(4)检查金额是否正确;(5)如果均正确,计算税金;(6)录入供应商名称、金额以及税金;(7)关闭工作项。上述发票处理流程是一个会话,其包括七个事件,该七个事件分别为上述步骤(1)至(7)。
在本公开中,会话也可以称为“流程”。为了方便使用,在下文中可以互换地使用会话和流程。
根据本公开的一个示例,第二生成单元730可以被配置为确定与多个会话对应的向量,以及基于与该多个会话对应的向量,生成至少一个RPA流程。下面将描述第二生成单元730确定与多个会话对应的向量的具体过程。
首先,第二生成单元730可以确定与每个会话中的各个事件对应的向量。具体地,对于每个会话,可以根据常规的机器学习方法将该会话所包括的各个事件表示为向量。例如,可以根据常规的自然语言处理方法将一个事件表示为一个向量,其中该向量具有预设的维度(例如,100维)。例如,可以根据基于弱监督学习的自然语言处理中的Word2Vec和Glove等机制将一个事件表示为一个向量。此外,还可以优化在机器学习中所使用的损失函数,从而提高用向量表示事件的准确率。
在一个会话包括五个事件的示例中,该会话中的第一事件可以被表示为向量a1。类似地,该会话中的第二事件可以被表示为向量a2,该会话中的第三事件可以被表示为向量a3,该会话中的第四事件可以被表示为向量a4,以及该会话中的第五事件可以被表示为向量a5
然后,第二生成单元730可以根据与每个会话中的各个事件对应的向量来确定与每个会话对应的向量。例如,服务器可以对与每个会话中的各个事件对应的向量求和,生成与每个会话对应的向量。在一个会话包括五个事件且与该五个事件对应的向量分别为a1、a2、a3、a4和a5的示例中,与该会话对应的向量可以是向量a1、向量a2、向量a3、向量a4和向量a5的和。又例如,服务器还可以通过常规的深度学习模型(例如,变换器(transformer)模型)并且根据与每个会话所包括的各个事件对应的向量来确定与每个会话对应的向量。
下面将描述第二生成单元730基于与多个会话对应的向量生成至少一个RPA流程的具体过程。
首先,第二生成单元730可以基于与多个会话对应的向量,对所述多个会话进行聚类,生成多个会话类。
根据本公开的一个示例,参见图9,在图8所示实施例的基础上,装置700还可以包括去噪单元740,其被配置为在对多个会话进行聚类之前,对多个会话进行去噪。例如,多个会话中的冗余事件可以看作噪声数据,因此,服务器可以去除该多个会话中的冗余事件,从而实现对该多个会话进行去噪。具体地,当该多个会话中的某个事件仅在该多个会话中的单个会话中出现时,该事件可以被认为是冗余事件。可替换地,服务器可以设置冗余事件库,并且当该多个会话中的某个事件与冗余事件库中的事件匹配时,该事件可以被认为是冗余事件。
在该示例中,去噪单元740通过对多个会话进行去噪,可以获得有效会话。然后,第二生成单元730可以基于与有效会话对应的向量,对有效会话进行聚类,从而生成多个会话类。
例如,第二生成单元730可以根据常规的聚类算法对有效会话进行聚类处理,以生成多个会话类。具体地,聚类算法的输入可以是与有效会话对应的向量,该聚类算法的输出可以是多个会话类。这里所描述的聚合算法可以是K均值(K-Means)聚类算法、均值漂移聚类算法、基于密度的聚类方法、用高斯混合模型的最大期望的聚类算法、凝聚层次聚类算法、图团体检测(Graph Community Detection)算法等。
此外,在该示例中,所生成的多个会话类可以是关于多种业务或一种业务下多个子业务的会话类。例如,所生成的多个会话类可以包括关于发票处理流程的会话类、关于人事处理流程的会话类、关于电话客服的会话类等。也可以是票务电话客服中的订票流程会话类、退票流程会话类。
此外,在该示例中,每个会话类可以包括至少一个会话。此外,每个会话类中的各个会话都与同一种业务或子业务有关。例如,当会话类是关于发票处理流程的会话类时,该会话类中的各个会话都与发票处理流程有关。又例如,当会话类是关于工业流水线的会话类时,该会话类中的各个会话都与工业流水线有关。又例如,当会话类是关于订票流程会话类,该会话类中的各个会话都与发票处理流程有关。
然后,第二生成单元730可以针对每个会话类,确定与该会话类对应的推荐流程。该推荐流程可以作为与该会话类对应的标准流程或者格式化流程。
根据本公开的一个示例,第二生成单元730可以对一会话类中各个会话所包括的事件进行相似度计算,以获得相似度计算结果。该相似度计算结果可以包括该会话类中任意两个事件之间的相似度。例如,第二生成单元730可以根据常规的相似度计算方法来计算该会话类中任意两个事件之间的相似度。
然后,第二生成单元730可以基于所述相似度计算结果,确定与该会话类对应的推荐流程。下面将具体描述第二生成单元730如何基于相似度计算结果确定与会话类对应的推荐流程的具体过程。
首先,第二生成单元730可以从一个会话类中各个会话所包括的事件确定中当前事件。例如,第二生成单元730可以根据该会话类中各个会话的开始标识符,从该会话类中各个会话所包括的事件中选择一个事件作为当前事件。由于该会话类中的各个会话属于同一会话类,因此,可以假设该会话类中的各个会话中的第一个事件是相同的。在该假设下,服务器可以将该会话类中任一会话的开始标识符之后的第一个事件作为当前事件。
然后,第二生成单元730可以基于相似度计算结果,执行至少一次循环过程,其中,所述循环过程包括:判断该会话类中各个会话所包括的多个事件中除所述当前事件之外的其他事件中是否存在下一事件,其中所述下一事件与所述当前事件的相似度超过阈值。
例如,第二生成单元730可以从相似度计算结果中查找与当前事件的相似度超过阈值的事件,并将所查找的事件作为相对于当前事件的下一事件。
此外,这里的阈值的取值可以设置为较大的值,从而使得当前事件和下一事件的相似度较高。
当所述其他事件中不存在下一事件时,第二生成单元730可以停止执行循环过程,当所述其他事件中存在所述下一事件时,从所述其他事件中确定所述下一事件,将所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程。
在本公开中,在第一次循环过程中,第二生成单元730可以判断所述会话类中各个会话所包括的多个事件中除所述当前事件之外的其他事件中是否存在下一事件,当所述其他事件中不存在下一事件时,第二生成单元730可以根据所述当前事件确定与该会话类对应的推荐流程。也就是说,与该会话类对应的推荐流程仅包括当前事件。
此外,当所述其他事件中存在下一事件时,第二生成单元730可以从所述其他事件中确定下一事件,并将所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程。也就是说,第二生成单元730可以重复执行判断其他事件中是否存在与本次循环过程采用的当前事件的相似度超过阈值的下一事件,当所述其他事件中不存在所述下一事件时,则根据本次循环过程采用的当前事件确定与所述会话类对应的推荐流程,而当所述其他事件中存在所述下一事件时,则采用所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程,直至所述其他事件中不存在下一事件,停止执行循环过程的步骤。
然后,第二生成单元730可以根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
具体地,第二生成单元730可以确定循环过程执行的次数,若所述循环过程执行次数为一次,则根据所述当前事件,确定所述会话类对应的推荐流程;若所述循环过程执行次数大于一次,则根据最后一次循环过程采用的当前事件,以及之前每一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程,即生成单元620可以根据每一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。例如,与该会话类对应的推荐流程可以包括每一次循环过程采用的当前事件。
此外,根据本公开的另一示例,第二生成单元730可以从一个会话类中挖掘会话评分高于第一阈值的会话,并根据所挖掘的会话评分高于第一阈值的会话来确定与该会话类对应的推荐流程。
具体地,首先,第二生成单元730可以从每个会话类中挖掘发生频率高于第二阈值的会话。例如,第二生成单元730可以统计该会话类中的各个会话的发生频率,然后从该会话类中选择发生频率高于第二阈值的会话。又例如,第二生成单元730可以根据常规的RNN深度学习来从每个会话类中挖掘发生频率高于第二阈值的会话。这里所描述的RNN深度学习可以是常规的LSTM模型等。
在第二生成单元730根据RNN从每个会话类中挖掘发生频率高于第二阈值的会话的示例中,第二生成单元730可以根据第二阈值来确定RNN的网络特性。RNN的网络特征可以包括网络参数、网络节点的数量等中的一个或多个。
然后,第二生成单元730可以从所挖掘的发生频率高于第二阈值的会话中挖掘会话评分高于第一阈值的会话。例如,对于所挖掘的发生频率高于第二阈值的会话,第二生成单元730可以确定这些会话中每个会话的会话评分,然后从这些会话中选择会话评分高于第一阈值的会话。
在本公开中,会话评分可以是关于会话的优先级、会话的投入产出比等中的至少一个的函数。例如,会话评分可以是会话的优先级或者会话的投入产出比。又例如,会话评分可以是会话的优先级和会话的投入产出比的加权平均值。
此外,可以根据会话所包括的事件的数量、会话的发生频率以及会话所花费的时间等中的至少一个来确定会话的投入产出比。例如,会话的投入产出比可以与会话所包括的事件的数量、会话的发生频率以及会话所花费的时间等中的至少一个呈正比。例如,会话的投入产出比可以是会话所包括的事件的数量、会话的发生频率以及会话所花费的时间三者的乘积。
然后,第二生成单元730可以将所挖掘的会话评分高于第一阈值的会话中的至少一个作为与该会话类对应的推荐流程。例如,当所挖掘的会话评分高于第一阈值的会话的数量是一个时,可以将所挖掘的会话评分高于第一阈值的会话作为与该会话类对应的推荐流程。当所挖掘的会话评分高于第一阈值的会话的数量是多个时,可以从所挖掘的会话评分高于第一阈值的会话中选择一个会话作为与该会话类对应的推荐流程。
下面将具体描述第二生成单元730基于推荐流程生成RPA流程的具体流程。
首先,参见图9,在图8所示实施例的基础上,装置700还可以包括显示单元750,其被配置为显示推荐流程。例如,显示单元750可以生成与所述推荐流程对应的可视化信息,并显示所述可视化信息。这里所描述的可视化信息可以是与推荐流程对应的图像(例如流程图)、音频文件、视频文件等中的至少一个。
然后,第二生成单元730可以确定针对推荐流程的修改指令。例如,第二生成单元730可以通过服务器的输入装置(例如,鼠标、键盘等)来接收针对该推荐流程的修改指令。
然后,第二生成单元730可以根据修改指令生成RPA流程。
具体地,第二生成单元730可以根据修改指令修改可视化信息,以获得修改后的可视化信息。例如,在可视化信息为流程图的示例中,第二生成单元730可以根据修改指令删除、修改或调整流程图中的某些步骤,以获得修改后的流程图。
然后,第二生成单元730可以基于修改后的可视化信息生成RPA流程。例如,在可视化信息为流程图的示例中,第二生成单元730可以基于修改后的流程图生成RPA流程。
此外,参见图9,在图8所示实施例的基础上,装置700还可以包括执行单元760,其被配置为当确定触发执行所述至少一个RPA流程时执行所述至少一个RPA流程。
具体地,执行单元760可以确定是否触发执行所生成的至少一个RPA流程。例如,可以生成与RPA流程对应的流程标签。然后,可以确定是否对该流程标签进行了操作(例如,点击),来确定是否触发执行所生成的RPA流程。
当确定触发执行所述至少一个RPA流程时,执行单元760可以执行所述至少一个RPA流程。当确定未触发执行所述至少一个RPA流程时,执行单元760可以不执行所述至少一个RPA流程。
根据本公开实施例的生成装置,可以对所获取的会话数据进行会话切割来生成多个会话,并且根据与该多个会话对应的向量来生成RPA流程,从而实现了依靠机器来挖掘流程,避免了依靠人工来挖掘流程,提高了流程挖掘的效率。
此外,根据本公开实施例的设备(例如,服务器、终端等)也可以借助于图10所示的计算设备的架构来实现。图10示出了该计算设备的架构示意图。如图10所示,计算设备800可以包括总线810、一个或多个CPU 820、只读存储器(ROM)830、随机存取存储器(RAM)840、连接到网络的通信端口850、输入/输出组件860、硬盘870等。计算设备800中的存储设备,例如ROM 830或硬盘870可以存储计算机处理和/或通信使用的各种数据或文件以及CPU所执行的程序指令。计算设备800还可以包括用户界面880。当然,图10所示的架构只是示例性的,在实现不同的设备时,根据实际需要,可以省略图10示出的计算设备中的一个或多个组件。
本公开的实施例也可以被实现为计算机可读存储介质。根据本公开实施例的计算机可读存储介质上存储有计算机可读指令。当所述计算机可读指令由处理器运行时,可以执行参照以上附图描述的根据本公开实施例的方法。所述计算机可读存储介质包括但不限于例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。
本领域技术人员能够理解,本公开所披露的内容可以出现多种变型和改进。例如,以上所描述的各种设备或组件可以通过硬件实现,也可以通过软件、固件、或者三者中的一些或全部的组合实现。
此外,如本公开和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
此外,本公开中使用了流程图用来说明根据本公开实施例的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
以上对本公开进行了详细说明,但对于本领域技术人员而言,显然,本公开并非限定于本说明书中说明的实施方式。本公开在不脱离由权利要求书的记载所确定的本公开的宗旨和范围的前提下,可以作为修改和变更方式来实施。因此,本说明书的记载是以示例说明为目的,对本公开而言并非具有任何限制性的意义。

Claims (19)

1.一种基于人工智能AI的机器人流程自动化RPA流程的生成方法,包括:
获取会话数据,其中,所述会话数据包括各个会话的起止标识信息;
对所述会话数据进行会话切割,生成多个会话;以及
基于所述多个会话生成至少一个RPA流程。
2.如权利要求1所述的方法,还包括:
当确定触发执行所述至少一个RPA流程时,执行所述至少一个RPA流程。
3.如权利要求1所述的方法,其中,所述多个会话中的每个会话包括多个事件。
4.如权利要求1所述的方法,其中,所述基于所述多个会话生成至少一个RPA流程,包括:
确定与所述多个会话对应的向量;
基于与所述多个会话对应的向量,生成至少一个RPA流程。
5.如权利要求4所述的方法,其中,所述确定与所述多个会话对应的向量,包括:
确定与每个会话中的各个事件对应的向量;
对与每个会话中的各个事件对应的向量求和,生成与每个会话对应的向量。
6.如权利4所述的方法,其中,所述基于与所述多个会话对应的向量,生成至少一个RPA流程,包括:
基于与所述多个会话对应的向量,对所述多个会话进行聚类,生成多个会话类;
针对每个会话类,确定与所述会话类对应的推荐流程;以及
基于所述推荐流程生成RPA流程。
7.如权利要求6所述的方法,其中,在所述对所述多个会话进行聚类之前,所述方法还包括:
对所述多个会话进行去噪。
8.如权利要求6所述的方法,其中,所述针对每个会话类,确定与所述会话类对应的推荐流程,包括:
对所述会话类中各个会话所包括的事件进行相似度计算,以获得相似度计算结果;以及
基于所述相似度计算结果,确定与所述会话类对应的推荐流程。
9.如权利要求8所述的方法,其中,所述基于所述相似度计算结果,确定与所述会话类对应的推荐流程,包括:
从所述会话类中各个会话所包括的事件中确定当前事件;
基于所述相似度计算结果,执行至少一次循环过程,其中,所述循环过程包括:判断所述会话类中各个会话所包括的多个事件中除所述当前事件之外的其他事件中是否存在下一事件,其中,所述下一事件与所述当前事件的相似度超过阈值;当所述其他事件中不存在所述下一事件时,停止执行循环过程;当所述其他事件中存在所述下一事件时,从所述其他事件中确定所述下一事件,将所述下一事件作为下一次循环过程中的当前事件,并执行所述下一次循环过程;
根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
10.如权利要求9所述的方法,其中,所述根据最后一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程,包括:
若所述循环过程执行次数为一次,则根据所述当前事件,确定所述会话类对应的推荐流程;
若所述循环过程执行次数大于一次,则根据每一次循环过程采用的当前事件,确定与所述会话类对应的推荐流程。
11.如权利要求6至10任一项所述的方法,其中,所述基于所述推荐流程生成RPA流程,包括:
显示所述推荐流程;
确定针对所述推荐流程的修改指令;以及
根据所述修改指令生成RPA流程。
12.如权利要求11所述的方法,其中,所述显示所述推荐流程,包括:
生成与所述推荐流程对应的可视化信息;以及
显示所述可视化信息;
其中,所述根据所述修改指令生成RPA流程,包括:
根据所述修改指令修改所述可视化信息;以及
基于修改后的可视化信息生成RPA流程。
13.如权利要求1所述的方法,其中,所述获取会话数据,包括:
从至少一个终端获取会话数据。
14.如权利要求3所述的方法,其中,所述会话数据包括与所述每个会话中的各个事件对应的时间戳。
15.如权利要求3所述的方法,其中,所述每个会话包括各个事件对应客户的标识。
16.一种基于人工智能AI的机器人流程自动化RPA流程的生成装置,包括:
获取单元,被配置为获取会话数据,其中,所述会话数据包括各个会话的起止标识信息;
第一生成单元,被配置为对所述会话数据进行会话切割,生成多个会话;以及
第二生成单元,被配置为基于所述多个会话生成至少一个RPA流程。
17.如权利要求16所述的装置,还包括:
执行单元,被配置为当确定触发执行所述至少一个RPA流程时,执行所述至少一个RPA流程。
18.一种基于人工智能AI的机器人流程自动化RPA流程的生成设备,包括:
处理器;以及
存储器,其中,所述存储器中存储有计算机可执行程序当由所述处理器执行所述计算机可执行程序时,执行权利要求1-15中任一项所述的基于AI的RPA流程的生成方法。
19.一种计算机可读存储介质,其上存储由指令,所述指令在被处理器执行时,使得所述处理器执行如权利要求1-15中任一项所述的基于AI的RPA流程的生成方法。
CN202010981504.1A 2019-12-31 2020-09-17 基于ai的rpa流程的生成方法、装置、设备及介质 Active CN112070416B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019114237316 2019-12-31
CN201911423731 2019-12-31

Publications (2)

Publication Number Publication Date
CN112070416A true CN112070416A (zh) 2020-12-11
CN112070416B CN112070416B (zh) 2024-04-16

Family

ID=73682048

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010981504.1A Active CN112070416B (zh) 2019-12-31 2020-09-17 基于ai的rpa流程的生成方法、装置、设备及介质
CN202011635529.2A Pending CN112949973A (zh) 2019-12-31 2020-12-31 一种结合ai的机器人流程自动化rpa流程的生成方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202011635529.2A Pending CN112949973A (zh) 2019-12-31 2020-12-31 一种结合ai的机器人流程自动化rpa流程的生成方法

Country Status (1)

Country Link
CN (2) CN112070416B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116703339A (zh) * 2023-08-09 2023-09-05 安徽思高智能科技有限公司 一种基于图Transformer模型的RPA流程推荐方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539518A (zh) * 2021-06-28 2021-10-22 北京来也网络科技有限公司 基于rpa和ai的药品数据处理方法、装置及电子设备
CN113379399B (zh) * 2021-08-13 2022-06-07 南京新一代人工智能研究院有限公司 一种基于状态转移概率模型的rpa组件推荐方法
CN116167530B (zh) * 2023-04-25 2023-07-21 安徽思高智能科技有限公司 一种基于多流程节点对齐的rpa流程优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120036256A1 (en) * 2010-08-09 2012-02-09 Ebay Inc. Session analysis systems and methods
CN105389304A (zh) * 2015-10-27 2016-03-09 小米科技有限责任公司 事件提取方法及装置
CN110351440A (zh) * 2019-08-16 2019-10-18 中国联合网络通信集团有限公司 业务流程构建方法及设备
CN110610240A (zh) * 2018-06-14 2019-12-24 埃森哲环球解决方案有限公司 基于人工智能的虚拟自动化辅助

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016200413A1 (en) * 2015-06-08 2016-12-15 Hewlett Packard Enterprise Development Lp Application session analysis and recommendation system
CN109960761B (zh) * 2019-03-28 2023-03-31 深圳市雅阅科技有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN110555165B (zh) * 2019-07-23 2023-04-07 平安科技(深圳)有限公司 信息识别方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120036256A1 (en) * 2010-08-09 2012-02-09 Ebay Inc. Session analysis systems and methods
CN105389304A (zh) * 2015-10-27 2016-03-09 小米科技有限责任公司 事件提取方法及装置
CN110610240A (zh) * 2018-06-14 2019-12-24 埃森哲环球解决方案有限公司 基于人工智能的虚拟自动化辅助
CN110351440A (zh) * 2019-08-16 2019-10-18 中国联合网络通信集团有限公司 业务流程构建方法及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116703339A (zh) * 2023-08-09 2023-09-05 安徽思高智能科技有限公司 一种基于图Transformer模型的RPA流程推荐方法及系统
CN116703339B (zh) * 2023-08-09 2023-11-24 安徽思高智能科技有限公司 一种基于图Transformer模型的RPA流程推荐方法及系统

Also Published As

Publication number Publication date
CN112949973A (zh) 2021-06-11
CN112070416B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN112070416B (zh) 基于ai的rpa流程的生成方法、装置、设备及介质
EP3882783A1 (en) Event argument extraction method, event argument extraction apparatus and electronic device
EP3832488A2 (en) Method and apparatus for generating event theme, device and storage medium
JP2019536185A (ja) コンピュータおよびネットワーク活動を監視および分析するためのシステムおよび方法
JP7222040B2 (ja) モデル訓練、画像処理方法及びデバイス、記憶媒体、プログラム製品
CN115114439B (zh) 多任务模型推理、多任务信息处理的方法和装置
CN113268403A (zh) 时间序列的分析预测方法、装置、设备及存储介质
CN116049379A (zh) 知识推荐方法、装置、电子设备和存储介质
Czarnul et al. Simulation of parallel similarity measure computations for large data sets
CN112070487B (zh) 基于ai的rpa流程的生成方法、装置、设备及介质
CN115186738B (zh) 模型训练方法、装置和存储介质
WO2024040869A1 (zh) 多任务模型的训练方法、信息推荐方法、装置和设备
CN116225848A (zh) 日志监测方法、装置、设备和介质
CN111338609B (zh) 信息获取方法、装置、存储介质及终端
CN114881521A (zh) 业务评估方法、装置、电子设备以及存储介质
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN113657468A (zh) 预训练模型的生成方法、装置、电子设备和存储介质
CN113761272A (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN112750047A (zh) 行为关系信息提取方法及装置、存储介质、电子设备
CN117539948B (zh) 基于深度神经网络的业务数据检索方法及装置
CN111815442B (zh) 一种链接预测的方法、装置和电子设备
CN113821418B (zh) 故障根因分析方法及装置、存储介质和电子设备
CN113220547B (zh) 一种基于仿真的复杂软件系统可靠性指标确定方法
CN116401372A (zh) 知识图谱表示学习方法、装置、电子设备及可读存储介质
CN112100237A (zh) 一种用户数据处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 1902, 19 / F, China Electronics Building, 3 Danling Road, Haidian District, Beijing 100080

Applicant after: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Applicant after: Laiye Technology (Beijing) Co.,Ltd.

Address before: 1902, 19 / F, China Electronics Building, 3 Danling Road, Haidian District, Beijing 100080

Applicant before: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Country or region before: China

Applicant before: BEIJING BENYING NETWORK TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant