CN117290325A - 一种任务序列的发现方法、装置及存储介质 - Google Patents

一种任务序列的发现方法、装置及存储介质 Download PDF

Info

Publication number
CN117290325A
CN117290325A CN202311186801.7A CN202311186801A CN117290325A CN 117290325 A CN117290325 A CN 117290325A CN 202311186801 A CN202311186801 A CN 202311186801A CN 117290325 A CN117290325 A CN 117290325A
Authority
CN
China
Prior art keywords
event
similar
events
operation event
task sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311186801.7A
Other languages
English (en)
Inventor
唐琦松
林平
吴鑫
靳志业
蒋奕然
谢涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai I Search Software Co ltd
Original Assignee
Shanghai I Search Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai I Search Software Co ltd filed Critical Shanghai I Search Software Co ltd
Priority to CN202311186801.7A priority Critical patent/CN117290325A/zh
Publication of CN117290325A publication Critical patent/CN117290325A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种任务序列的发现方法、装置及存储介质,所述方法包括获取用于表征计算机桌面操作的原始操作日志数据集;根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列;本发明可以基于用户选定的操作事件,有效地从大量操作日志中识别出了任务序列,提高了任务挖掘的效率。

Description

一种任务序列的发现方法、装置及存储介质
技术领域
本发明涉及一种任务序列的发现方法、装置及存储介质,属于任务挖掘技术领域。
背景技术
在任务挖掘中,往往会获取大量任务不相同的操作日志,比如聊天、发邮件等等。它们的存在不仅导致流程图节点变多,干扰业务分析,还涉及用户隐私,增大分析的难度。因为,需要一种有效的任务相关性判断方法,并自动识别不同任务序列。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种任务序列的发现方法、装置及存储介质,提高任务挖掘原始数据的有效性。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种任务序列的发现方法,包括:
获取用于表征计算机桌面操作的原始操作日志数据集;
根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;
根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列。
进一步的,所述原始操作日志数据集存储有多条日志记录,每条日志记录用于表征计算桌面操作的中一个操作事件,每条日志记录或者每个操作事件配置有如下的字段:位置标识、时间标识、事件类型、操作内容、元素标签以及元素内容。
进一步的,所述位置标识包括窗口标题、页面标题以及应用名称。
进一步的,所述根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列,包括:
在所述原始操作日志数据集表征的时间序列上,以所述目标操作事件出发,在该目标操作事件之后或者之后,且在预设的时间窗口之内搜寻相似操作事件,该相似操作事件是与所述目标操作事件相似的操作事件;
在不满足搜寻动作的停止条件的情况下,基于所述目标操作事件或者基于所述相似操作事件,在所述时间窗口之后的下一时间窗口内搜寻与所述目标操作事件相似的操作事件,或者与所述相似操作事件相似的相似操作事件;并且重复该步骤直到满足所述搜寻动作的停止条件;
基于上述目标操作事件和相似操作事件的时间标识,形成任务序列。
进一步的,通过如下的方法搜寻相似操作事件,包括:
以操作事件中各个字段为特征,从而生成各个字段的特征向量;
基于所述特征向量,比较两个操作事件之间对应特征向量之间的距离;
基于特征向量之间的距离,计算各个特征之间的相似度分值,将所有特征的分值合并以得到判断两个操作事件是否相似的相似度分值;
将满足相似度分值阈值的操作事件,确定为相似操作事件。
进一步的,基于特征向量之间的距离,计算各个特征之间的相似度分值的步骤,包括:
基于特征向量之间的距离,计算各个特征之间的相似度分值;
针对所述特征,区分关键特征和非关键特征;其中,为关键特征赋予高权重,为非关键特征赋予低的权重;
使用所述权重对对应的相似度分值进行加权,再使用加权后的相似度分值,计算操作事件的相似度分值。
进一步的,所述搜寻动作的停止条件至少包括以下之一的条件:
某一个或者某几个连续的时间窗口内没有任何操作事件;
某一个或者某几个连续的时间窗口内没有与目标操作事件相似的操作事件或者没有与该一个或者某几个连续的时间窗口之前一个时间窗口内相似操作事件所相似的操作事件。
第二方面,本发明提供一种任务序列的发现装置,包括:
获取模块,用于获取用于表征计算机桌面操作的原始操作日志数据集;
筛选模块,用于根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;
任务序列形成模块,用于根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列。
第三方面,本发明提供一种电子设备,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据前述任一项所述方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一项所述方法的步骤。
与现有技术相比,本发明所达到的有益效果:
本发明提供一种任务序列的发现方法、装置及存储介质,可以基于用户选定的操作事件,有效地从大量操作日志中识别出了任务序列,提高了任务挖掘的效率。
附图说明
图1是本发明实施例提供的一种任务序列的发现方法的流程图。
图2是本发明实施例提供的一种任务序列的发现装置的框图。
图3为本发明实施例提供的一种电子设备的框图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1
如图1所示,本实施例介绍一种任务序列的发现方法,包括:
获取用于表征计算机桌面操作的原始操作日志数据集;
根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;
根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列。
本实施例提供的任务序列的发现方法,其应用过程具体涉及如下步骤:
步骤100、获取用于表征计算机桌面操作的原始操作日志数据集;
在本实施方式中,原始操作日志数据集可以通过部署在用户终端上的数据集采集器对用户的桌面操作进行采集得到的。
原始操作日志数据集存储有多条日志记录,每条日志记录用于表征计算桌面操作的中一个操作事件;
每条日志记录或者说每个操作事件可以配置有如下的字段:
位置标识,可以包括:窗口标题、页面标题,在一些情况下,该位置标识还可以是应用名称,但是应用名称粒度过大,不便于用于执行任务挖掘;
时间标识,可以是时间戳;
事件类型,可以是鼠标点击、键盘输入等等;
元素标签,可以是在事件类型为鼠标点击的情况下,用户点击的UI元素的元素标签;
元素内容,可以是在事件类型为鼠标点击的情况下,UI元素的文本内容,比如,用户点击显示为“提交”的按钮,在该操作事件中,元素内容为“提交”。
操作内容,可以表示为在事件类型为键盘输入的情况下,用户具体输入的字段。
在一些实施方式中,上述的每条日志记录或者说每个操作事件还可以配置有UIL等字段。
步骤200、根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;
可以理解为用户基于原始操作日志数据集,从中选择一个或者多个日志记录(操作事件);
用户选择日志记录这这一行为,也即是用户赋予该方法的先验信息;用户可以基于自身对于任务的理解,来选择一个或者多个目标操作事件,比如,用户直接根据位置标识,也即是窗口标题或者页面标题来确定目标操作事件,比如,需要自动发现关于费用报销的任务序列,因此用户可以直接将窗口标题中具有费用报销等关键字段的操作事件选择为目标操作事件,因此上述的用户的指令也即是用户选择目标操作事件的指令。
在本实施方式中,上述的一个或者多个目标操作事件可以是关于一个任务的一个或者多个目标操作事件,当用户选了多个目标操作事件时,该多个目标操作事件时可以是关于多个任务的目标操作事件。
在流程挖掘的技术领域中,在一个具体的场景下,流程的概念往往是明确的,比如,一个报销流程中,各个流程的节点往往是事先就已经设置了,只不过在具体执行该流程时,可能会有一个或者多个节点会偏离该流程,但是该流程的理想形态是明确的。
但是在任务挖掘的技术领域中,并没有一个理想的任务形态,对于一个任务该如何执行,用户是不会预先规定好的,比如对于报销流程中的《发起报销》这一流程节点,该流程节点的具体执行过程也即是一个任务序列,对于《发起报销》在现实中往往具有多个任务序列,因为用户可以在CRM中先填写姓名,再填写把报销金额以及事项,还可以先填写事项,再填写姓名金额,可以使用只使用键盘输入,也可以只使用鼠标复制粘贴等等。
因此,反映到原始操作日志数据集,两个差异很大的任务序列,很可能表示的是同一个任务。归根结底,对于一个具体的任务来说,不同的人往往有不同的操作,并且在这些操作中往往还涉及到其他任务的操作或者完全与任务无关的操作。也因此,在本实施方式中,引入了用户的指令,通过用户来选择与任务有关的目标操作事件,通过用户选择的目标操作事件来扩展对对应的任务序列。
步骤300、根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列;
在本实施方式中,该步骤300可以包括:
以所述目标操作事件出发,在该目标操作事件之后或者之后,且在预设的时间窗口之内搜寻相似操作事件,该相似操作事件是与所述目标操作事件相似的操作事件;
在不满足搜寻动作的停止条件的情况下,基于所述目标操作事件或者基于所述相似操作事件,在所述时间窗口之后的下一时间窗口内搜寻与所述目标操作事件相似的操作,或者与所述相似操作事件相似的相似操作事件;并且重复该步骤直到满足所述搜寻动作的停止条件;
基于上述目标操作事件和相似操作事件的时间标识,形成任务序列
在本实施方式中,时间窗口可以是一分钟也可以是半分钟,还是两三分钟,总之是一个小尺度下的时间窗口;之所以引入这种小尺度下时间窗口,是因为我们认为,或者说对于大部分的用户,在小尺度的时间窗口下,操作事件事件之间往往具有关联性。
因此,以目标操作事件为出发点,在时间序列上(每个操作事件都有时间戳,整体上具有时间序列),搜寻与目标操作事件相关的操作事件;可以往前或者往后搜索。
在本实施方式中,可以使用相似性算法进行搜寻,在搜寻的过程中,当某个操作事件与目标操作事件的相似度高于预设的阈值时,即可加入序列中。因此,每当搜索到相似操作事件时,可以基于操作事件的时间标识,来添加该操作事件,以形成任务序列。
在本实施方式中,可以通过如下的方法来搜寻相似操作事件,包括:
从各操作事件(日志记录)提取对应的字段内容,为各个操作事件生成对应的文本表示,也即是通过文本来描述一个操作事件;
生成各个操作事件对应的文本表示的向量,可以使用词袋模型(Bag-of-Words)或词嵌入(Word Embedding)等方法来生成对应的文本向量;
使用相似性度量方法来计算操作事件之间的相似性,比如,可以使用余弦相似度、Jaccard相似度等等。
将满足相似度阈值的操作事件添加至任务序列中。
在一些实施方式中,也可以通过如下的方法来搜寻相似操作事件,包括:
以操作事件中各个字段为特征,从而生成各个字段的特征向量,比如,可以将位置标识、事件类型、元素标签、元素内容、操作内容作为特征,再对特征进行编码,从而得到各个操作事件的特征向量。可以使用多种方式对上述的特征进行编码,以生成特征向量,比如可以使用Embedding的方式,也是通过Embedding Encoding,将各个操作事件的特征,通过词嵌入模型,映射为低维稠密向量,还可以使用独热编码(One-Hot Encoding)的方式,将上述的特征进行编码。
获得了操作事件各个特征的特征向量之后,即可比较两个操作事件之间对应特征向量之间的距离,容易理解的是,应当使用位置标识的特征向量与位置标识的特征向量计算距离,而不应当使用位置标识的特征向量与事件类型的特征向量计算距离。同样可以采用余弦距离进行比较。
基于特征向量之间的距离,计算各个特征之间的相似度分值,最后将所有特征的分值合并即可得到两个操作事件是否相似的相似度分值。
值得注意的是,在上述的实施方式中,可以以操作事件中各个字段为特征,从而生成各个字段的特征向量,但是不同特征对于评价两个操作事件是否相似,其实重要性不同,比如,用户执行多了关于费用报销的操作(可能穿插了一些与费用报销无关的操作),与费用报销有关的操作,其位置标识,比如窗口标题应当是相同的,比如,在CRM中某个关于费用报销的窗口下,用户执行了费用报销的操作,也即是说,位置标识是评价两个操作事件是否相似的重要特征,相应的,某些特征不那么重要,比如,操作类型,同样以上述的例子说明,用户可以在某个关于费用报销的窗口下执行鼠标点击的操作,比如,选择具体报销的部门,还可以执行键盘输入的操作,比如,输入金额。
针对上述的情况,还可以通过如下的方法进行操作事件之间的相似度比较,包括:
从操作事件中选择若干个字段作为特征并且生成对应的特征向量,比如,可以选择位置标识、事件类型、元素标签、元素内容等等,可以不用选择时间标识,因为是使用目标操作事件与一个时间窗口中的操作事件进行相似性比较。
获得了操作事件各个特征的特征向量之后,即可比较两个操作事件之间对应特征向量之间的距离。
基于特征向量之间的距离,计算各个特征之间的相似度分值。
针对选择的特征,区分关键特征和非关键特征,比如,可以将位置标识作为关键特征,其余的特征作为非关键特征,然后为关键特征赋予高权重,相应的,非关键特征赋予低的权重,再使用权重加权各个特征之间的相似度分值
最后使用加权后的相似度分值,计算操作事件的相似度分值。
如上所述的,除了可以使用目标操作事件作为比较对象,还可以以相似操作事件为比较对象,具体的说,比如,用户选定为目标操作事件为A,对应的时间标识为a,在该时间标识a之后(也可以之前)的一个时间窗口内,该时间窗口可以定义为第一时间窗口(时间窗口的尺度可以为b),从原始操作日志数据集中确定若干个操作事件,该若干个操作事件构成一个集合,可以是第一操作事件集合。
使用目标操作事件A与第一件操作事件集合中的若干操作事件进行相似性比较,若是有操作事件满足相似性阈值,则定义为相似操作事件B,按照操作事件的时间标识,将相似操作事件B连接在目标操作事件为A之后,即得到一个任务序列,也即是具有两个操作事件的任务序列,可以对该任务序列进行延伸,使得具有更多的操作事件。延伸的方式可以是在上述第一时间窗口之后延伸一个时间窗口,可以定义为第二时间窗口,同样基于该第二事件窗口从原始操作日志数据集中确定若干个操作事件,该若干个操作事件构成第二操作事件集合,可以使用目标操作事件为A与第二操作事件集合中的若干操作事件进行相似性比较,从而得到相似操作事件C1,还可以使用相似操作事件B与第二操作事件集合中的若干操作事件进行相似性比较,从而得到相似操作事件C2,这种方式的好处在于,如上所述的在任务挖掘的技术领域中,并没有一个理想的任务形态,对于一个任务该如何执行,用户是不会预先规定好的,换言之,任务的概念往往并不那么明确,比如,在某一个任务中,用户可能在某一位置标识下执行了多个操作事件,再转到另外一个或者多个位置标识下执行了相关联的操作事件,这些操作事件构成一个任务序列,同样以上述费用报销的场景进行说明,例如,在费用报销时,用户可以先在CRM中,在关于报销页面的位置标识下,进行若干操作,再跳转到出差页面的位置标识勾选与报销相关的事项(可能执行了不止一个操作)。因此,对于该费用报销的任务序列来说,至少涉及了两种以上的位置标识,若是仅仅基于用户选定的目标操作事件为A来扩展任务序列,可能会导致有些操作事件被漏掉,因此,可以基于目标操作事件为A扩展第一个时间窗口之中的相似操作事件,之后时间窗口之中的相似操作事件可以基于之前一个时间窗口中的相似操作事件进行确定,也即是上述的基于所述目标操作事件或者基于所述相似操作事件,在所述时间窗口之后的下一时间窗口内搜寻与所述目标操作事件相似的操作,或者与所述相似操作事件相似的相似操作事件。在搜寻的过程中,某一时间窗口中的相似操作事件可以基于该一时间窗口之前的时间窗口中的相似操作事件进行确定,这种方法考虑到了在一个任务序列之中,操作事件之间的连续性,可以更好的搜寻到与任务有关的操作事件。
在本实施方式中,上述的搜寻动作的停止条件可以是:
1、某一个或者某几个连续的时间窗口内没有任何操作事件(也即是没有记录),对于这种情况,可以认为用户将任务执行完毕,所以停止了操作,因此可以停止搜寻,得到一条或者多条任务序列。
2、某一个或者某几个连续的时间窗口内没有与目标操作事件相似的操作事件或者没有与该一个或者某几个连续的时间窗口之前一个时间窗口内相似操作事件所相似的操作事件,对于这种情况,可以认为用户去执行其他任务或者执行了与任务无关的操作,因此可以停止搜寻,得到一条或者多条任务序列。
本发明让用户定义与业务相关的操作事件,比如打开某个CRM软件或者页面。先在原始的包含大量无关的事件中匹配这些业务事件,将它们标记为相关事件,然后再使用相似性算法,在指定事件窗口内(比如前后一分钟)寻找强相关的事件,将它们合并到任务序列中,直到无法扩展。这样就自动获得了多段任务序列,并且每个任务序列中都包含了用户期望的业务操作,提高任务挖掘原始数据的有效性。
实施例2
如图2所示,本实施例提供一种任务序列的发现装置,包括:
获取模块,用于获取用于表征计算机桌面操作的原始操作日志数据集;
筛选模块,用于根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;
任务序列形成模块,用于根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列。
实施例3
如图3所示,本实施例提供一种电子设备,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据实施例1中任一项所述方法的步骤。
实施例4
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例1中任一项所述方法的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种任务序列的发现方法,其特征在于,包括:
获取用于表征计算机桌面操作的原始操作日志数据集;
根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;
根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列。
2.根据权利要求1所述的任务序列的发现方法,其特征在于,所述原始操作日志数据集存储有多条日志记录,每条日志记录用于表征计算桌面操作的中一个操作事件,每条日志记录或者每个操作事件配置有如下的字段:位置标识、时间标识、事件类型、操作内容、元素标签以及元素内容。
3.根据权利要求2所述的任务序列的发现方法,其特征在于,所述位置标识包括窗口标题、页面标题以及应用名称。
4.根据权利要求1所述的任务序列的发现方法,其特征在于,所述根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列,包括:
在所述原始操作日志数据集表征的时间序列上,以所述目标操作事件出发,在该目标操作事件之后或者之后,且在预设的时间窗口之内搜寻相似操作事件,该相似操作事件是与所述目标操作事件相似的操作事件;
在不满足搜寻动作的停止条件的情况下,基于所述目标操作事件或者基于所述相似操作事件,在所述时间窗口之后的下一时间窗口内搜寻与所述目标操作事件相似的操作事件,或者与所述相似操作事件相似的相似操作事件;并且重复该步骤直到满足所述搜寻动作的停止条件;
基于上述目标操作事件和相似操作事件的时间标识,形成任务序列。
5.根据权利要求4所述的任务序列的发现方法,其特征在于,通过如下的方法搜寻相似操作事件,包括:
以操作事件中各个字段为特征,从而生成各个字段的特征向量;
基于所述特征向量,比较两个操作事件之间对应特征向量之间的距离;
基于特征向量之间的距离,计算各个特征之间的相似度分值,将所有特征的分值合并以得到判断两个操作事件是否相似的相似度分值;
将满足相似度分值阈值的操作事件,确定为相似操作事件。
6.根据权利要求4所述的任务序列的发现方法,其特征在于,基于特征向量之间的距离,计算各个特征之间的相似度分值的步骤,包括:
基于特征向量之间的距离,计算各个特征之间的相似度分值;
针对所述特征,区分关键特征和非关键特征;其中,为关键特征赋予高权重,为非关键特征赋予低的权重;
使用所述权重对对应的相似度分值进行加权,再使用加权后的相似度分值,计算操作事件的相似度分值。
7.根据权利要求4所述的任务序列的发现方法,其特征在于,所述搜寻动作的停止条件至少包括以下之一的条件:
某一个或者某几个连续的时间窗口内没有任何操作事件;
某一个或者某几个连续的时间窗口内没有与目标操作事件相似的操作事件或者没有与该一个或者某几个连续的时间窗口之前一个时间窗口内相似操作事件所相似的操作事件。
8.一种任务序列的发现装置,其特征在于,包括:
获取模块,用于获取用于表征计算机桌面操作的原始操作日志数据集;
筛选模块,用于根据用户的指令,从原始操作日志数据集中确定一个或者多个目标操作事件;
任务序列形成模块,用于根据确定的目标操作事件,在一定时间窗口内寻找对应的相似操作事件,形成任务序列。
9.一种电子设备,其特征在于:包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1~7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现权利要求1~7任一项所述方法的步骤。
CN202311186801.7A 2023-09-14 2023-09-14 一种任务序列的发现方法、装置及存储介质 Pending CN117290325A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311186801.7A CN117290325A (zh) 2023-09-14 2023-09-14 一种任务序列的发现方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311186801.7A CN117290325A (zh) 2023-09-14 2023-09-14 一种任务序列的发现方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN117290325A true CN117290325A (zh) 2023-12-26

Family

ID=89256376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311186801.7A Pending CN117290325A (zh) 2023-09-14 2023-09-14 一种任务序列的发现方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN117290325A (zh)

Similar Documents

Publication Publication Date Title
US11972203B1 (en) Using anchors to generate extraction rules
US10783324B2 (en) Wizard for configuring a field extraction rule
US10783318B2 (en) Facilitating modification of an extracted field
US9183535B2 (en) Social network model for semantic processing
US7984000B2 (en) Predicting and using search engine switching behavior
US20110282861A1 (en) Extracting higher-order knowledge from structured data
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
KR20090023613A (ko) 다차원 검색 시스템, 다차원 검색을 수행하는 컴퓨터 구현 방법 및 컴퓨터 실행가능 시스템
US20090083266A1 (en) Techniques for tokenizing urls
CN112988784B (zh) 数据查询方法、查询语句生成方法及其装置
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
US20110113006A1 (en) Business process control apparatus, businesses process control method and business process control program
CN111930891A (zh) 基于知识图谱的检索文本扩展方法及相关装置
CN117290325A (zh) 一种任务序列的发现方法、装置及存储介质
CN115756598A (zh) 应用于低代码平台的组件检测方法、系统及装置
CN115878864A (zh) 一种数据检索方法、装置、设备及可读存储介质
CN115291762A (zh) 业务项目的触发方法及装置、存储介质、计算机设备
JP2018088182A (ja) モデル生成装置、クリックログ正解尤度算出装置、文書検索装置、方法、及びプログラム
JP4558369B2 (ja) 情報抽出システム、情報抽出方法、コンピュータプログラム
Jaroszewicz Interactive HMM construction based on interesting sequences
CN115150052B (zh) 攻击团伙的跟踪识别方法、装置、设备及存储介质
CN109085932B (zh) 一种候选词条调整方法、装置、设备及可读存储介质
CN112069236B (zh) 关联文件的展示方法、装置、设备及存储介质
CN112417310B (zh) 建立智能服务索引以及推荐智能服务的方法
CN116888590A (zh) 实体热度生成方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination