CN115048282A - 重复操作的提取方法及电子设备、存储介质 - Google Patents

重复操作的提取方法及电子设备、存储介质 Download PDF

Info

Publication number
CN115048282A
CN115048282A CN202210971903.9A CN202210971903A CN115048282A CN 115048282 A CN115048282 A CN 115048282A CN 202210971903 A CN202210971903 A CN 202210971903A CN 115048282 A CN115048282 A CN 115048282A
Authority
CN
China
Prior art keywords
abstract
subsequence
operations
sequence
occurrence frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210971903.9A
Other languages
English (en)
Other versions
CN115048282B (zh
Inventor
黄博
张泉
周元剑
周健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hongji Information Technology Co ltd
Shanghai Hongji Information Technology Co Ltd
Original Assignee
Beijing Hongji Information Technology Co ltd
Shanghai Hongji Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hongji Information Technology Co ltd, Shanghai Hongji Information Technology Co Ltd filed Critical Beijing Hongji Information Technology Co ltd
Priority to CN202210971903.9A priority Critical patent/CN115048282B/zh
Publication of CN115048282A publication Critical patent/CN115048282A/zh
Application granted granted Critical
Publication of CN115048282B publication Critical patent/CN115048282B/zh
Priority to PCT/CN2023/084305 priority patent/WO2024036974A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • User Interface Of Digital Computer (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种重复操作的提取方法及电子设备、存储介质,该方法通过获取工作操作记录,根据工作操作记录中每一步的具象操作,筛选出特殊操作和普通操作;将特殊操作和普通操作转化为抽象操作,并建立具象操作与抽象操作之间的映射关系;将抽象操作按照对应具象操作的操作时间,排列得到抽象操作序列;进而从抽象操作序列中提取出重复的抽象操作组合,获得抽象操作组合对应的具象操作组合和操作时间,由于无需人工参与重复操作的挖掘,降低了人工挖掘的工作量和成本,提高了效率。

Description

重复操作的提取方法及电子设备、存储介质
技术领域
本申请涉及数据挖掘技术领域,特别涉及一种重复操作的提取方法及电子设备、计算机可读存储介质。
背景技术
RPA(Robotic Process Automation,机器人流程自动化)技术通过模拟人工操作键盘鼠标,自动处理计算机中规则清晰、批量重复的工作与任务。它可以将办公人员从每日的重复工作中解放出来,提高生产效率。举例而言,就像工业时代工厂的流水线机器替代工人劳动一样,可以代替办公人员操作电脑和软件,自动完成各类软件系统的工作和业务处理,准确高效地实现业务流程自动化。
人们的日常工作中常常有很多的重复性操作,比如登记,开票。这些工作可以使用RPA技术一键化,来提高效率。但是这些重复操作需要人来进行挖掘,挖掘本身也需要大量的工作,从而影响了下一步RPA技术的应用。
发明内容
本申请实施例提供了重复操作的提取方法,用以降低人工挖掘重复操作的工作量和成本,提高效率。
本申请实施例提供了一种重复操作的提取方法,包括:
获取工作操作记录,所述工作操作记录包括每一步的具象操作和操作时间;
根据每一步的具象操作,筛选出特殊操作和普通操作;
将所述特殊操作和普通操作转化为抽象操作,并建立所述具象操作与所述抽象操作之间的映射关系;
将所有抽象操作按照对应具象操作的操作时间,排列得到抽象操作序列;
从所述抽象操作序列中提取出重复的抽象操作组合,获得所述抽象操作组合对应的具象操作组合和操作时间。
在一实施例中,所述根据每一步的具象操作,筛选出特殊操作和普通操作,包括:
若所述具象操作包括的元素内容或指令是复制、粘贴和保存中的任意一种,确定所述具象操作为特殊操作;
若所述具象操作不包括应用名或者包括的应用名或窗口名是指定名称,确定所述具象操作为可忽略操作;
除所述特殊操作和所述可忽略操作以外的具象操作为普通操作。
在一实施例中,将所述特殊操作和普通操作转化为抽象操作,包括:
将所述特殊操作以操作名进行存储,得到所述特殊操作对应的抽象操作;
将所述普通操作以应用名和固定窗口名进行存储,得到所述普通操作对应的抽象操作。
在一实施例中,在从所述抽象操作序列中提取出重复的抽象操作组合之前,所述方法还包括:
对所述抽象操作序列进行过滤,去除所述抽象操作序列中出现频次满足第一预设条件的抽象操作。
在一实施例中,对所述抽象操作序列进行过滤,去除所述抽象操作序列中出现频次满足第一预设条件的抽象操作,包括:
删除所述抽象操作序列中出现频次小于第一预设值的抽象操作,得到更新后的抽象操作序列;
从更新后的抽象操作序列中,找出前一连接和后一连接的出现频次均小于第二预设值,且前一连接和后一连接的出现频次之和最小的目标抽象操作;
在所述更新后的抽象操作序列中随机删除一个目标抽象操作,多次重复上述步骤,直到不存在可删除的抽象操作。
在一实施例中,所述从所述抽象操作序列中提取出重复的抽象操作组合,包括:
将所述抽象操作序列中相同的抽象操作合并为一个子序列,得到子序列列表,并通过信息查找表记录每个子序列的出现频次和在所述抽象操作序列中出现的时间位置;
根据所述信息查找表,每次从所述子序列列表中选择一个满足第二预设条件的目标子序列,并将所述目标子序列进行向前和向前扩展,得到延长子序列;
选择一个满足第三预设条件的延长子序列加入所述子序列列表,并在所述子序列列表中删除构成所述延长子序列的子序列,直到所述子序列列表为空;
若所有延长子序列均不满足第三预设条件,将选择的所述目标子序列作为重复的抽象操作组合,并在所述子序列列表中删除所述目标子序列,直到所述子序列列表为空。
在一实施例中,所述根据所述信息查找表,每次从所述子序列列表中选择一个满足第二预设条件的目标子序列,包括:
根据所述信息查找表中记录的每个子序列的出现频次,每次从所述子序列列表中选择出现频次最高的子序列;
若出现频次最高的子序列不止一个,则从中选择一个长度最长的子序列,作为所述目标子序列。
在一实施例中,将所述目标子序列进行向前和向前扩展,得到延长子序列,包括:
根据所述信息查找表中记录的每个子序列在所述抽象操作序列中出现的时间位置,在所述目标子序列对应的时间位置,向前扩展一个抽象操作,得到一个延长子序列;向后扩展一个抽象操作,得到另一个延长子序列。
在一实施例中,所述选择一个满足第三预设条件的延长子序列加入所述子序列列表,包括:
筛选出出现频次大于等于预设频次,出现频率大于预设频率且可延长率大于预设可延长率的延长子序列;
从筛选出的延长子序列中选取出现频次最高的延长子序列加入所述子序列列表。
本申请实施例提供了一种重复操作的提取装置,该装置包括:
记录获取模块,用于获取工作操作记录,所述工作操作记录包括每一步的具象操作和操作时间;
操作筛选模块,用于根据每一步的具象操作,筛选出特殊操作和普通操作;
操作抽象化模块,用于将所述特殊操作和普通操作转化为抽象操作,并建立所述具象操作与所述抽象操作之间的映射关系;
操作排序模块,用于将所有抽象操作按照对应具象操作的操作时间,排列得到抽象操作序列;
重复提取模块,用于从所述抽象操作序列中提取出重复的抽象操作组合,获得所述抽象操作组合对应的具象操作组合和操作时间。
本申请实施例还提供了一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述重复操作的提取方法。
本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成上述重复操作的提取方法。
本申请上述实施例提供的方案,通过获取工作操作记录,根据工作操作记录中每一步的具象操作,筛选出特殊操作和普通操作;将特殊操作和普通操作转化为抽象操作,并建立具象操作与抽象操作之间的映射关系;将抽象操作按照对应具象操作的操作时间,排列得到抽象操作序列;进而从抽象操作序列中提取出重复的抽象操作组合,获得抽象操作组合对应的具象操作组合和操作时间,由于无需人工参与重复操作的挖掘,降低了人工挖掘的工作量和成本,提高了效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
图1为本申请一实施例提供的电子设备的结构示意图;
图2是本申请实施例一种重复操作的提取方法的流程示意图;
图3本申请一实施例提供的过滤抽象操作序列的流程示意图;
图4是图2对应实施例中步骤S250的细节流程图;
图5是本申请一实施例示出的一种重复操作的提取装置的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1是本申请实施例提供的电子设备的结构示意图。该电子设备100可以用于执行本申请实施例提供的重复操作的提取方法。如图1所示,该电子设备100包括:一个或多个处理器102、一个或多个存储处理器可执行指令的存储器104。其中,所述处理器102被配置为执行本申请下述实施例提供的重复操作的提取方法。
所述处理器102可以是网关,也可以为智能终端,或者是包含中央处理单元(CPU)、图像处理单元(GPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元的设备,可以对所述电子设备100中的其它组件的数据进行处理,还可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储器104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的重复操作的提取方法。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
在一实施例中,图1示电子设备100还可以包括输入装置106、输出装置108以及数据采集装置110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备100也可以具有其他组件和结构。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。所述输出装置108可以向外部(例如,用户)输出各种信息(例如,图像或声音),并且可以包括显示器、扬声器等中的一个或多个。所述数据采集装置110可以采集对象的图像,并且将所采集的图像存储在所述存储器104中以供其它组件使用。示例性地,该数据采集装置110可以为摄像头。
在一实施例中,用于实现本申请实施例的重复操作的提取方法的示例电子设备100中的各器件可以集成设置,也可以分散设置,诸如将处理器102、存储器104、输入装置106和输出装置108集成设置于一体,而将数据采集装置110分离设置。
在一实施例中,用于实现本申请实施例的重复操作的提取方法的示例电子设备100可以被实现为诸如智能手机、平板电脑、台式电脑、服务器、车载设备等智能终端。
图2是本申请实施例一种重复操作的提取方法的流程示意图。如图2所示,该方法包括以下步骤S210-步骤S250。
步骤S210:获取工作操作记录,所述工作操作记录包括每一步的具象操作和操作时间。
举例来说,一个专利从业人员“查收邮件,下载专利.docx,打开,修改,关闭保存,发送”就是一个重复的操作任务,一个专利工作者每天的工作包含很多的操作,其中有上述的重复性操作任务。
工作操作记录是指用户一天或一段时间内的操作构成的数据流,例如可以由RPA录制器录制用户一天的操作得到。RPA录制器可以对用户每一步的操作进行解析,解析出鼠标点击操作和特殊键盘按键操作(例如ctrl键和enter键),还可以解析出当前正在操作的应用、窗口、元素以及指令,并记录每一步操作的操作时间。
应用:比如word。
窗口:应用的某一个窗口,比如“任务挖掘专利.docx”。
元素:应用的某一个窗口中的某一个元素,比如一篇文章的标题,再比如在word中右击鼠标后出现的每个选项。
元素内容:元素具体包含的内容,比如元素是一篇文章的标题,那么元素的内容可以是“一种挖掘重复事务的方法”,在比如元素是在word中右击鼠标后出现的每个选项,那么元素内容可以是“剪切”、“复制”等等。
指令:包括鼠标和键盘的操作指令,例如鼠标右键点击、键盘点击“ctrl+c”、“ctrl+v”。
工作操作记录可以包括每一步的具象操作和操作时间,具象操作也就是具体操作,可以包括应用名、窗口名、元素内容、指令等信息。操作时间是指每步操作的具体发生时间。
步骤S220:根据每一步的具象操作,筛选出特殊操作和普通操作。
其中,特殊操作是指复制、粘贴和保存操作。若具象操作包括的元素内容或指令是复制、粘贴和保存中的任意一种,确定该具象操作为特殊操作。如果指令是“ctrl+c”,认为是复制,如果指令是“ctrl+v”,认为是粘贴。如果元素内容是“复制”,认为是复制操作。如果元素内容是“粘贴”,“匹配目标格式”,“保留原格式”等认为是粘贴操作。如果元素内容是“保存”,“save”等,认为是保存操作。
若具象操作不包括应用名或者包括的应用名或窗口名是指定名称,确定所述具象操作为可忽略操作。
其中,不包括应用名可以认为是当前操作不作用于一个应用,当然也可能是RPA录制器解析错误,则此具象操作认为是可忽略操作。如果具象操作包括的应用名是指定名称(例如资源管理器),表示用户可能正在进行应用切换,则此具象操作也认为是可忽略操作。如果具象操作包括的窗口名是包含“新标签页”,“new tab”等字符串的指定名称,则该具象操作也认为是可忽略操作。
除特殊操作和可忽略操作以外的具象操作为普通操作。可以先判断具象操作是否是特殊操作,如果不是,再判断此具象操作是否是可忽略操作,如果不是,则表示是普通操作。根据需要,也可以先判断是否是可忽略操作,如果不是,再判断是否是特殊操作,如果也不是,则表示是普通操作。
步骤S230:将所述特殊操作和普通操作转化为抽象操作,并建立所述具象操作与所述抽象操作之间的映射关系。
其中,将特殊操作和普通操作转化为抽象操作是为了对具象操作进行简化。由于具象操作包括了较多信息,而有些具象操作可以归为同一种操作,故可以对特殊操作和普通操作进行操作抽象化(也就是简化),简化后的特殊操作和普通操作统称抽象操作。
具体的,操作抽象化可以是:将特殊操作以操作名进行存储,得到所述特殊操作对应的抽象操作。将所述普通操作以应用名和固定窗口名进行存储,得到普通操作对应的抽象操作。
其中,操作名是指特殊操作的操作名,如复制、粘贴或保存。故不同应用、窗口下的特殊操作,都可以以特殊操作的操作名,作为抽象操作。而普通操作的应用名+固定窗口名可以作为普通操作对应的抽象操作。其中,固定窗口名是相对易变窗口名而言的,固定窗口名可以从普通操作包括的窗口名中提取。举例来说,窗口名“必应搜索-专利”中,“必应搜索”是固定窗口名,“专利”是易变窗口名。在一实施例中,可以利用提前训练好的关键词提取算法从窗口名中提取固定窗口名,也可以采用规则匹配算法,例如窗口名中的第一个词就是固定窗口名。
在一实施例中,可以用映射表存储具象操作与抽象操作之间的映射关系,从而可以确定属于特殊操作和普通操作的具象操作在抽象化后,分别对应哪个抽象操作。
步骤S240:将所有抽象操作按照对应具象操作的操作时间,排列得到抽象操作序列。
抽象操作序列是所有抽象操作按照操作时间的先后顺序进行排列得到的。而抽象操作的操作时间就是映射表中对应具象操作的操作时间。
步骤S250:从所述抽象操作序列中提取出重复的抽象操作组合,获得所述抽象操作组合对应的具象操作组合和操作时间。
抽象操作组合是指从抽象操作序列中提取的若干抽象操作构成的序列,为进行区分,称为抽象操作组合。重复的抽象操作组合是指该抽象操作组合出现的次数不止一次。
举例来说,抽象操作序列为abcfgfgabcfgabc,其中重复的抽象操作组合有abc和fg两个。具象操作组合是指抽象操作对应的具象操作构成的序列。抽象操作组合的操作时间就是对应具象操作的操作时间,由此,可以确定重复操作何时发生,何时结束以及出现次数。
在一实施例中,在上述步骤S250之前,本申请实施例提供的方法还包括:对所述抽象操作序列进行过滤,去除所述抽象操作序列中出现频次满足第一预设条件的抽象操作。
为了提高挖掘重复操作的效率,可以先去除抽象操作序列中出现频次满足第一预设条件的抽象操作。举例来说,第一预设条件可以是出现频次小于3次。出现频次较少的抽象操作可以认为是干扰噪声,故提前去除,可以减少后续重复操作挖掘的迭代次数。
在一实施例中,如图3所示,上述过滤抽象操作序列的过程具体包括:以下步骤S310-步骤S330。
步骤S310:删除所述抽象操作序列中出现频次小于第一预设值的抽象操作,得到更新后的抽象操作序列。
举例来说,抽象操作序列比如为abcabdceabcdabcabcd,假设第一预设值是3,由于e仅出现1次,故进行删除,abcd均出现超过3次,留下,得到更新后的抽象操作序列为abcabdcabcdabcabcd。
步骤S320:从更新后的抽象操作序列中,找出前一连接和后一连接的出现频次均小于第二预设值,且前一连接和后一连接的出现频次之和最小的目标抽象操作。
其中,前一连接是指某一个抽象操作和它前一个抽象操作构成的序列。后一连接是指某个抽象操作和它后一个抽象操作构成的序列。举例来说,针对抽象操作b,它的前一连接为ab,后一连接为bc。
目标抽象操作是指更新后的抽象操作序列中,满足以下两个条件的抽象操作:
条件1:前一连接和后一连接的出现频次均小于第二预设值(例如3);
条件2:前一连接和后一连接的出现频次之和最小。
举例来说,假设更新后的抽象操作序列为abcabdcabcdabcabcd,abcabdcabcdabcabcd的1连接(将两个抽象操作相邻出现叫做1连接)有:
ab、bc、ca、ab、bd、dc、ab、bc、cd、da、ab、bc、ca、ab、bc、cd。其中,ab的出现频次为5,bc的出现频次为4,ca的出现频次为2,bd的出现频次为1,dc的出现频次为1,cd的出现频次为2,da的出现频次为1。
第1个时间位置的抽象操作a:前一连接和后一连接的出现频次都大于3,不会被删除;
第2个时间位置的抽象操作b:前一连接和后一连接的出现频次都大于3,不会被删除;
第3个时间位置的抽象操作c:前一连接的出现频次大于3,不会被删除;
第4个时间位置的抽象操作a:后一连接的出现频次大于3,不会被删除;
第5个时间位置的抽象操作b:前一连接的出现频次大于3,不会被删除;
第6个时间位置的抽象操作d:前一连接和后一连接的出现频次都小于3,因此,要继续求取前一连接和后一连接的出现频次和为1+1=2;
第7个时间位置的抽象操作c:前一连接和后一连接的出现频次都小于3,因此,要继续求取前一连接和后一连接的出现频次和为1+2=3;
······
第11个时间位置的抽象操作d:前一连接和后一连接的出现频次都小于3,因此,要继续求取前一连接和后一连接的出现频次和为2+1=3;
······
第18个时间位置的抽象操作d:前一连接和后一连接的出现频次都小于3,因此,前一连接和后一连接的出现频次和为1+1=2(这个d没有后一连接,因此,在实际中可以将这种情况的后一连接的出现频次设置为1。同样的,对于没有前一连接的抽象操作,其前一连接的出现频次也设置为1)。
此时可以发现,第6时间位置的抽象操作d的前一连接和后一连接的出现频次都小于3,且前一连接和后一连接的出现频次和为1+1=2(是最小的)。第18时间位置的抽象操作d的前一连接和后一连接的出现频次都小于3,且前一连接和后一连接的出现频次和为1+1=2(也是最小的)。故第6时间位置的抽象操作d和第18时间位置的抽象操作d可以认为是目标抽象操作。
步骤S330:在所述更新后的抽象操作序列中随机删除一个目标抽象操作,多次重复上述步骤,直到不存在可删除的抽象操作。
如果目标抽象操作不止一个,则随机任意删除一个。如果目标抽象操作只有一个,则删除该目标抽象操作即可。多次重复上述步骤是指重复上述步骤S310-步骤S330。可删除的抽象操作包括出现频次小于第一预设值的抽象操作,还包括前一接和后一连接的出现频次均小于第二预设值且前一连接和后一连接的出现频次之和最小的目标抽象操作。
举例来说,假设第6时间位置的抽象操作d和第18时间位置的抽象操作均是目标抽象操作,则可以随机删除一个,比如删除第18个时间位置的抽象操作d。第一轮删除迭代后,抽象操作序列就变为了abcabdcabcdabcabc。
第二轮迭代删除:
抽象操作d仅出现2次,被删除,其他抽象操作超过了3次,留下,抽象操作序列就变为了abcabcabcabcabc。
abcabcabcabcabc的1连接有:
ab、bc、ca、ab、bc、ca、ab、bc、ca、ab、bc、ca、ab、bc,其中,ab的出现频次为5、bc的出现频次为5、ca的出现频次为4。
第1个时间位置的抽象操作a:前一连接和后一连接的出现频次都大于3,不会被删除。
第2个时间位置的抽象操作b:前一连接和后一连接的出现频次都大于3,不会被删除。
第3个时间位置的抽象操作c:前一连接和后一连接的出现频次都大于3,不会被删除。
·······
第15个时间位置的抽象操作c:前一连接和后一连接的出现频次都大于3,不会被删除。
此时,没有可以可删除的抽象操作了。至此,迭代删除结束,得到最终更新完成的抽象操作序列为:abcabcabcabcabc。
在一实施例中,如图4所示,上述步骤S250具体包括以下步骤S410-步骤S430’。
步骤S410:将所述抽象操作序列中相同的抽象操作合并为一个子序列,得到子序列列表,并通过信息查找表记录每个子序列的出现频次和在所述抽象操作序列中出现的时间位置。
相同的抽象操作合并为一个子序列是指将不同时间位置的相同抽象操作合并为一个抽象操作,该抽象操作可以称为子序列。假设抽象操作序列为abcfgfgabcfgabc,则第1时间位置的a、第8时间位置的a和第13时间位置的a合并为一个子序列[a],同理,可以得到其他的子序列[b]、 [c]、 [f] 、[g]。所有子序列构成子序列列表[[a], [b], [c] , [f] ,[g]]。
信息查找表用于记录每个子序列的相关信息,供后续步骤查找。相关信息包括子序列在抽象操作序列中的出现频次和时间位置。时间位置用于表征子序列在抽象操作序列中的次序。举例来说,子序列[a]的出现频次是3次,时间位置是1、8、13。
步骤S420:根据所述信息查找表,每次从所述子序列列表中选择一个满足第二预设条件的目标子序列,并将所述目标子序列进行向前和向前扩展,得到延长子序列。
其中,目标子序列中是指子序列列表中满足第二预设条件的一个子序列。延长子序列是指目标子序列向前扩展一个抽象操作或向后扩展一个抽象操作得到的结果。
在一实施例中,上述步骤S420具体包括:根据所述信息查找表中记录的每个子序列的出现频次,每次从所述子序列列表中选择出现频次最高的子序列;若出现频次最高的子序列不止一个,则从中选择一个长度最长的子序列,作为所述目标子序列。
也就是说,第二预设条件包括:条件1:信息查找表中出现频次最高的子序列;条件2:当多个子序列的出现频次相同,都是最高的,则从中选择长度最长的子序列。特殊情况是:当几个子序列的出现频次都是最高的,且长度也一样长时,随机在这几个子序列中选择一个。
举例来说,假设子序列[a],子序列[b],子序列[c],子序列[f] , 子序列[g]在信息查找表中显示的出现频次都为3次,且长度都是1,则随机取子序列[b],作为本次的目标子序列。
根据所述信息查找表中记录的每个子序列在所述抽象操作序列中出现的时间位置,在所述目标子序列对应的时间位置,向前扩展一个抽象操作,得到一个延长子序列;向后扩展一个抽象操作,得到另一个延长子序列。
假设抽象操作序列为abcfgfgabcfgabc,目标子序列为[b],时间位置为2的子序列[b],向前扩展一个抽象操作为[a,b],向后扩展一个抽象操作为[b,c];时间位置为9的子序列[b],向前扩展一个抽象操作为[a,b],向后扩展一个抽象操作为[b,c];时间位置为14的子序列[b],向前扩展一个抽象操作为[a,b],向后扩展一个抽象操作为[b,c]。
此时,延长子序列有[a,b]、[b,c];[a,b]的出现频次为3,[b,c,]的出现频次为3,延长子序列的出现频次也记录在信息查找表中。
步骤S430:选择一个满足第三预设条件的延长子序列加入所述子序列列表,并在所述子序列列表中删除构成所述延长子序列的子序列,直到所述子序列列表为空。
步骤S430’:若所有延长子序列均不满足第三预设条件,将选择的所述目标子序列作为重复的抽象操作组合,并在所述子序列列表中删除所述目标子序列,直到所述子序列列表为空。
其中,第三预设条件包括:条件1:延长子序列在信息查找表中的出现频次大于等于预设频次(比如3),出现频率大于预设频率(比如1%),可延长率大于预设可延长率(比如20%)。条件2:对于满足条件1的延长子序列,选取在信息查找表中的出现频次最高的延长子序列。
具体的,上述步骤S430包括:筛选出出现频次大于等于预设频次,出现频率大于预设频率且可延长率大于预设可延长率的延长子序列。从筛选出的延长子序列中选取出现频次最高的延长子序列加入所述子序列列表。特殊情况是,如果几个满足条件1的延长子序列在信息查找表中的出现频次一样,都是最高的话,则随机选取一个延长子序列。也即每次只将一个延长序列加入到子序列列表中。
其中,出现频率指延长子序列在信息查找表中的出现频次与所有子序列在信息查找表中的出现频次之和的比值。可延长率指延长子序列在信息查找表中的出现频次与延长前的子序列在信息查找表中的出现频次的比值,代表有多少比例原序列可以被延长成新序列。
举例来说,延长子序列[a,b],出现频次为3次,大于等于预设频次(3次);出现频率为3/15=0.2%,大于1%;可延长率为100%,大于20%。延长子序列[b,c,],出现频次为3次,大于等于预设频次(3次);出现频率为3/15=0.2%,大于1%;可延长率为100%,大于20%。由于延长子序列[a,b]、[b,c]的出现频次相同,因此,随机将延长子序列[a,b]加入到子序列列表中。此时,子序列列表为:[[a], [b], [c] , [f] , [g],[a,b]]。
由于构成延长子序列[a,b]的子序列有[a]和[b],因此删除子序列列表中用于构成延长子序列[a,b]的子序列[a]和[b],得到更新后的子序列列表为[[c] , [f] , [g],[a,b]]。
相反的,假设所有延长子序列均不满足上述第三预设条件,则将用于构成延长子序列的目标子序列作为重复的抽象操作组合,并将目标子序列从子序列列表中删除,由此得到更新后的子序列列表。
之后进行第二轮迭代,再次执行上述步骤S420从更新后的子序列列表中选择一个满足第二预设条件的目标子序列,进行延长,得到延长子序列,进而执行步骤S430,直到子序列列表为空。
举例来说,第二轮迭代:
此时的子序列列表为:[[c] , [f] , [g],[a,b]];
按照上述第二预设条件的规则,所有子序列的出现频次都是3,但子序列[a,b,]最长,那么会取出[a,b]作为目标子序列进行延长。
所有延长的可能性为[a,b,c],出现频次3次;[g,a,b],出现频次2次。
按照上述第三预设条件的规则,只有延长子序列[a,b,c]满足条件,那么将其加入到子序列列表,为:[[c] , [f] , [g] ,[a,b],[a,b,c]]。
之后删除同于构成延长子序列的子序列[a,b,]和[c,],子序列列表更新为:[ [f], [g],[a,b,c]]。至此,第二轮迭代结束。
第三轮迭代:
此时的子序列列表为:[ [f] , [g],[a,b,c]]
按照第二预设条件的规则,所有子序列的出现频次都是3,但子序列[a,b,c]最长,那么会取出[a,b,c]为目标子序列进行延长。
所有延长的可能性为[a,b,c,f],出现频次2次;[g,a,b,c],出现频次2次。
按照上述第三预设条件的规则,没有满足条件的延长子序列,因此延长失败。此时将进入另外一条分支,也就是上述步骤S430’,将无法再延长(延长失败)的目标子序列[a,b,c]加入到结果序列中。同时,将目标子序列[a,b,c]的出现频次和时间位置放入结果序列所对应的信息查找表中,并且在子序列列表中删除无法再延长的目标子序列[a,b,c],则新的子序列列表为:[ [f] , [g]]。
第四轮迭代:·······直至子序列列表为空,就能得到一个结果序列,结果序列中就是所有延长尝试失败的目标子序列的集合,这些目标子序列就是重复的抽象操作组合。
假设抽象操作序列为abcfgfgabcfgabc,初始的子序列列表为:[[a], [b], [c] ,[f] , [g]],最终得到的重复序列(即重复的抽象操作组合)为[a,b,c]和[ f,g]。根据重复序列对应的信息查找表,可以查出[a,b,c]和[ f,g]的出现频次,以及每次出现的时间位置。举例来说,重复的抽象操作组合[a,b,c]一共出现3次,每次的开始时间均不同。
之后,根据步骤S230建立的抽象操作和具象操作之间的映射关系,可以确定抽象操作组合中每个抽象操作对应的具象操作以及该具象操作的操作时间,从而得到重复的具象操作组合以及操作开始时间和结束时间。之后,用户可以分析这些重复操作,改进工作流程或者考虑将其RPA化来提高效率。本申请上述实施例提供的方案,无需人工挖掘,自动准确地分析用户工作操作记录中的重复操作。
下述为本申请装置实施例,可以用于执行本申请上述重复操作的提取方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请重复操作的提取方法实施例。
图5为本申请一实施例示出的一种重复操作的提取装置的框图。如图5所示,该装置包括:
记录获取模块510,用于获取工作操作记录,所述工作操作记录包括每一步的具象操作和操作时间;
操作筛选模块520,用于根据每一步的具象操作,筛选出特殊操作和普通操作;
操作抽象化模块530,用于将所述特殊操作和普通操作转化为抽象操作,并建立所述具象操作与所述抽象操作之间的映射关系;
操作排序模块540,用于将所有抽象操作按照对应具象操作的操作时间,排列得到抽象操作序列;
重复提取模块550,用于从所述抽象操作序列中提取出重复的抽象操作组合,获得所述抽象操作组合对应的具象操作组合和操作时间。
上述装置中各个模块的功能和作用的实现过程具体详见上述重复操作的提取方法中对应步骤的实现过程,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (11)

1.一种重复操作的提取方法,其特征在于,包括:
获取工作操作记录,所述工作操作记录包括每一步的具象操作和操作时间;
根据每一步的具象操作,筛选出特殊操作和普通操作;
将所述特殊操作和普通操作转化为抽象操作,并建立所述具象操作与所述抽象操作之间的映射关系;
将所有抽象操作按照对应具象操作的操作时间,排列得到抽象操作序列;
从所述抽象操作序列中提取出重复的抽象操作组合,获得所述抽象操作组合对应的具象操作组合和操作时间。
2.根据权利要求1所述的方法,其特征在于,所述根据每一步的具象操作,筛选出特殊操作和普通操作,包括:
若所述具象操作包括的元素内容或指令是复制、粘贴和保存中的任意一种,确定所述具象操作为特殊操作;
若所述具象操作不包括应用名或者包括的应用名或窗口名是指定名称,确定所述具象操作为可忽略操作;
除所述特殊操作和所述可忽略操作以外的具象操作为普通操作。
3.根据权利要求1所述的方法,其特征在于,将所述特殊操作和普通操作转化为抽象操作,包括:
将所述特殊操作以操作名进行存储,得到所述特殊操作对应的抽象操作;
将所述普通操作以应用名和固定窗口名进行存储,得到所述普通操作对应的抽象操作。
4.根据权利要求1所述的方法,其特征在于,在从所述抽象操作序列中提取出重复的抽象操作组合之前,所述方法还包括:
对所述抽象操作序列进行过滤,去除所述抽象操作序列中出现频次满足第一预设条件的抽象操作。
5.根据权利要求4所述的方法,其特征在于,对所述抽象操作序列进行过滤,去除所述抽象操作序列中出现频次满足第一预设条件的抽象操作,包括:
删除所述抽象操作序列中出现频次小于第一预设值的抽象操作,得到更新后的抽象操作序列;
从更新后的抽象操作序列中,找出前一连接和后一连接的出现频次均小于第二预设值,且前一连接和后一连接的出现频次之和最小的目标抽象操作;
在所述更新后的抽象操作序列中随机删除一个目标抽象操作,多次重复上述步骤,直到不存在可删除的抽象操作。
6.根据权利要求1所述的方法,其特征在于,所述从所述抽象操作序列中提取出重复的抽象操作组合,包括:
将所述抽象操作序列中相同的抽象操作合并为一个子序列,得到子序列列表,并通过信息查找表记录每个子序列的出现频次和在所述抽象操作序列中出现的时间位置;
根据所述信息查找表,每次从所述子序列列表中选择一个满足第二预设条件的目标子序列,并将所述目标子序列进行向前和向前扩展,得到延长子序列;
选择一个满足第三预设条件的延长子序列加入所述子序列列表,并在所述子序列列表中删除构成所述延长子序列的子序列,直到所述子序列列表为空;
若所有延长子序列均不满足第三预设条件,将选择的所述目标子序列作为重复的抽象操作组合,并在所述子序列列表中删除所述目标子序列,直到所述子序列列表为空。
7.根据权利要求6所述的方法,其特征在于,所述根据所述信息查找表,每次从所述子序列列表中选择一个满足第二预设条件的目标子序列,包括:
根据所述信息查找表中记录的每个子序列的出现频次,每次从所述子序列列表中选择出现频次最高的子序列;
若出现频次最高的子序列不止一个,则从中选择一个长度最长的子序列,作为所述目标子序列。
8.根据权利要求6所述的方法,其特征在于,将所述目标子序列进行向前和向前扩展,得到延长子序列,包括:
根据所述信息查找表中记录的每个子序列在所述抽象操作序列中出现的时间位置,在所述目标子序列对应的时间位置,向前扩展一个抽象操作,得到一个延长子序列;向后扩展一个抽象操作,得到另一个延长子序列。
9.根据权利要求6所述的方法,其特征在于,所述选择一个满足第三预设条件的延长子序列加入所述子序列列表,包括:
筛选出出现频次大于等于预设频次,出现频率大于预设频率且可延长率大于预设可延长率的延长子序列;
从筛选出的延长子序列中选取出现频次最高的延长子序列加入所述子序列列表。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-9任意一项所述的重复操作的提取方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-9任意一项所述的重复操作的提取方法。
CN202210971903.9A 2022-08-15 2022-08-15 重复操作的提取方法及电子设备、存储介质 Active CN115048282B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210971903.9A CN115048282B (zh) 2022-08-15 2022-08-15 重复操作的提取方法及电子设备、存储介质
PCT/CN2023/084305 WO2024036974A1 (zh) 2022-08-15 2023-03-28 一种重复操作的提取方法及电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210971903.9A CN115048282B (zh) 2022-08-15 2022-08-15 重复操作的提取方法及电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN115048282A true CN115048282A (zh) 2022-09-13
CN115048282B CN115048282B (zh) 2022-10-25

Family

ID=83167962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210971903.9A Active CN115048282B (zh) 2022-08-15 2022-08-15 重复操作的提取方法及电子设备、存储介质

Country Status (2)

Country Link
CN (1) CN115048282B (zh)
WO (1) WO2024036974A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024036974A1 (zh) * 2022-08-15 2024-02-22 北京弘玑信息技术有限公司 一种重复操作的提取方法及电子设备、存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195246A1 (en) * 2007-02-08 2008-08-14 Forhealth Technologies, Inc. Centralized sterile drug products distribution and automated management of sterile compounding stations
CN103984769A (zh) * 2014-06-04 2014-08-13 成都美美臣科技有限公司 一种用例数据管理存储方法
CN105975324A (zh) * 2016-07-15 2016-09-28 爱普(福建)科技有限公司 一种记忆人机界面操作习惯的方法
CN112008766A (zh) * 2020-09-03 2020-12-01 国网江苏省电力有限公司南通供电分公司 一种基于rpa机器人的数据补召自动化方法
US20200398427A1 (en) * 2019-06-21 2020-12-24 Robert Bosch Gmbh Method and system for robot manipulation planning
CN113240395A (zh) * 2021-05-19 2021-08-10 上海起策教育科技有限公司 一种基于邮件系统的rpa机器人控制系统
CN114445040A (zh) * 2022-01-21 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的业务流程自动化评估方法、装置及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11281936B2 (en) * 2018-12-31 2022-03-22 Kofax, Inc. Systems and methods for identifying processes for robotic automation and building models therefor
US11433536B2 (en) * 2019-09-19 2022-09-06 UiPath, Inc. Process understanding for robotic process automation (RPA) using sequence extraction
KR20220049296A (ko) * 2020-10-14 2022-04-21 삼성에스디에스 주식회사 로그 기반 워크플로우 생성 방법 및 그 장치
US11734061B2 (en) * 2020-11-12 2023-08-22 Automation Anywhere, Inc. Automated software robot creation for robotic process automation
LU102362B1 (de) * 2020-12-24 2022-06-27 Andre Stuth Verfahren und Vorrichtungen zur intuitiv-unbewussten Lösungsfindung
CN115048282B (zh) * 2022-08-15 2022-10-25 北京弘玑信息技术有限公司 重复操作的提取方法及电子设备、存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080195246A1 (en) * 2007-02-08 2008-08-14 Forhealth Technologies, Inc. Centralized sterile drug products distribution and automated management of sterile compounding stations
CN103984769A (zh) * 2014-06-04 2014-08-13 成都美美臣科技有限公司 一种用例数据管理存储方法
CN105975324A (zh) * 2016-07-15 2016-09-28 爱普(福建)科技有限公司 一种记忆人机界面操作习惯的方法
US20200398427A1 (en) * 2019-06-21 2020-12-24 Robert Bosch Gmbh Method and system for robot manipulation planning
CN112008766A (zh) * 2020-09-03 2020-12-01 国网江苏省电力有限公司南通供电分公司 一种基于rpa机器人的数据补召自动化方法
CN113240395A (zh) * 2021-05-19 2021-08-10 上海起策教育科技有限公司 一种基于邮件系统的rpa机器人控制系统
CN114445040A (zh) * 2022-01-21 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的业务流程自动化评估方法、装置及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024036974A1 (zh) * 2022-08-15 2024-02-22 北京弘玑信息技术有限公司 一种重复操作的提取方法及电子设备、存储介质

Also Published As

Publication number Publication date
WO2024036974A1 (zh) 2024-02-22
CN115048282B (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
US7117294B1 (en) Method and system for archiving and compacting data in a data storage array
CN100462929C (zh) 使用基于时间线的计算环境恢复数据的方法和系统
CN110716739B (zh) 一种代码变更信息统计方法、系统和可读存储介质
KR20210038467A (ko) 이벤트 테마 생성 방법, 장치, 기기 및 저장 매체
US20120143893A1 (en) Pattern Matching Framework for Log Analysis
CN115048282B (zh) 重复操作的提取方法及电子设备、存储介质
CN111176887A (zh) MySQL误操作回滚方法、设备及系统
CN109271535B (zh) 一种ppt动画分析、提取及转换为图片格式的处理方法
CN108108478B (zh) 数据格式转换方法、系统及电子设备
US20130204839A1 (en) Validating Files Using a Sliding Window to Access and Correlate Records in an Arbitrarily Large Dataset
CN111984684A (zh) 数据处理方法及装置
CN106469086B (zh) 事件处理方法和装置
CN114611039B (zh) 异步加载规则的解析方法、装置、存储介质和电子设备
CN116048609A (zh) 配置文件更新方法、装置、计算机设备和存储介质
CN111813769B (zh) 数据加工方法与装置
CN116126658A (zh) 一种屏幕操作日志流程挖掘方法、系统、设备及存储介质
CN112817782A (zh) 一种数据采集上报方法、装置、电子设备和存储介质
CN111858158A (zh) 数据处理方法、装置及电子设备
JPH0561744A (ja) ソフトウエア資産の世代管理方式
CN112836033A (zh) 业务模型的管理方法、装置、设备及存储介质
CN110232050A (zh) 一种基于编程语言对文件进行压缩的方法和电子设备
KR102644076B1 (ko) Fts 색인데이터 기반의 삭제 채팅 메시지 복구 장치 및 방법
CN114546461A (zh) 一种业务项开发方法、装置、设备和可读存储介质
JP7384708B2 (ja) 定型作業抽出装置、定型作業抽出方法及びプログラム
US20230068819A1 (en) Environment construction support device and environment construction support method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant