CN117539602A - 落后者任务推测的方法及装置、电子设备和存储介质 - Google Patents
落后者任务推测的方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117539602A CN117539602A CN202311604150.9A CN202311604150A CN117539602A CN 117539602 A CN117539602 A CN 117539602A CN 202311604150 A CN202311604150 A CN 202311604150A CN 117539602 A CN117539602 A CN 117539602A
- Authority
- CN
- China
- Prior art keywords
- time
- task
- target
- target task
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013507 mapping Methods 0.000 claims abstract description 71
- 238000012163 sequencing technique Methods 0.000 claims abstract description 30
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 abstract description 17
- 238000005516 engineering process Methods 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 101100020619 Arabidopsis thaliana LATE gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
Abstract
本公开公开了落后者任务推测的方法及装置、电子设备和存储介质,涉及数据处理技术领域,获取目标任务运行进度分数及目标任务在映射阶段已运行的第一时间;基于进度分数和第一时间计算目标任务在映射阶段剩余运行的第二时间;基于目标任务映射阶段与排序阶段的第一目标比值、第一时间及进度分数进行计算,得到目标任务在排序阶段运行的第三时间,第一目标比值为系统默认值;根据第二时间和第三时间确定目标任务执行完成所需的总剩余时间;根据总剩余时间确定目标任务是否为落后者任务,通过以第一时间作为原始参数,根据进度分数及第一目标比值结合第一时间,确定总剩余时间,从而提高估算总剩余时间的准确率,进而提高了推测落后者任务的准确率。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及一种落后者任务推测的方法及装置、电子设备和存储介质。
背景技术
随着信息技术的发展以及互联网技术和应用的普及,各行各业均面临行业数字化的转型。如今,社会每天都产生海量的信息数据。在这种背景下,面对海量数据的存储、处理和应用,“大数据”技术得到快速的发展并广泛应用于电子商务、社交媒体、金融等业务领域。当前大数据面临的重要问题之一是如何有效并高效地管理、处理海量的数据, Hadoop平台由于其自身在数据存储和处理方面的优势被广泛应用。
Hadoop采用推测执行机制来解决落后者问题,推测执行算法能显著减少作业完成时间。该方法采用当检测到落后者任务后则在另一个通用节点上同时运行一个落后者任务副本的方式,同时Hadoop推测执行算法会默认启动多个备份任务,以此完成落后者任务的执行。因此准确地识别落后者任务可以显著地减少作业完成时间,有效提高资源利用率。
Hadoop默认调度方式先进先出(First Input First Output,FIFO)技术提供多种推测执行机制,其中最长近似结束时间(Longest Approximate Time to End,LATE)是一种专为异构集群设计的动态调度技术,该算法中基于任务的当前运行速度进而计算完成任务的预估剩余时间,而完成时间最晚的任务,被确定为落后者,但是仅仅根据任务当前的运行速度确定落后者任务,存在判断结果不够准确的问题。
发明内容
本公开提供了一种落后者任务推测的方法、装置、电子设备和存储介质。其主要目的在于解决现有技术对落后者任务的推测结果不够准确的问题。
根据本公开的第一方面,提供了一种落后者任务推测的方法,其中,包括:
获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;
基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;
基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;
根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;
根据所述总剩余时间确定所述目标任务是否为落后者任务。
可选的,所述确定所述目标任务执行完成所需的总剩余时间,包括:
在确定不存在映射阶段和排序阶段均已完成的历史任务时,基于所述目标任务对应的节点速度和所述目标任务映射阶段数据量进行计算,得到所述目标任务映射阶段第一运行时间;
基于所述第一运行时间及所述第一目标比值计算所述目标任务排序阶段的第二运行时间;
将所述第一运行时间和所述第二运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
可选的,所述确定所述目标任务执行完成所需的总剩余时间包括:
在确定存在映射阶段已完成且排序阶段未完成的历史任务时,则计算所述历史任务映射阶段运行的目标平均时间;
基于所述目标平均时间和所述第一目标比值计算所述目标任务排序阶段的第三运行时间;
将所述目标平均时间和所述第三运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
可选的,在确定存在至少一组映射阶段和排序阶段均已完成的历史任务时,则计算所述历史任务映射阶段运行的第一平均时间及其排序阶段运行的第二平均时间对所述第一目标比值进行调整,得到第二目标比值。
可选的,所述确定所述目标任务执行完成所需的总剩余时间包括:
将所述第一平均时间和所述第二平均时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第二目标比值确定所述目标任务执行完成所需的总剩余时间。
可选的,所述根据所述总剩余时间确定所述目标任务是否为落后者任务包括:
分别对所有任务进行剩余运行时间的计算,得到各任务运行对应的剩余时间;
将所述总剩余时间分别与计算得到的所述剩余时间进行比对;
在确定全部的所述剩余时间均小于所述总剩余时间时,确定所述目标任务为落后者任务。
根据本公开的第二方面,提供了一种落后者任务推测的装置,包括:
获取单元,用于获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;
第一计算单元,用于基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;
第二计算单元,用于基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;
第一确定单元,用于根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;
第二确定单元,用于根据所述总剩余时间确定所述目标任务是否为落后者任务。
可选的,所述第一确定单元还用于:
在确定不存在映射阶段和排序阶段均已完成的历史任务时,基于所述目标任务对应的节点速度和所述目标任务映射阶段数据量进行计算,得到所述目标任务映射阶段第一运行时间;
基于所述第一运行时间及所述第一目标比值计算所述目标任务排序阶段的第二运行时间;
将所述第一运行时间和所述第二运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
可选的,所述第一确定单元还用于:
在确定存在映射阶段已完成且排序阶段未完成的历史任务时,则计算所述历史任务映射阶段运行的目标平均时间;
基于所述目标平均时间和所述第一目标比值计算所述目标任务排序阶段的第三运行时间;
将所述目标平均时间和所述第三运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
可选的,在确定存在至少一组映射阶段和排序阶段均已完成的历史任务时,则计算所述历史任务映射阶段运行的第一平均时间及其排序阶段运行的第二平均时间对所述第一目标比值进行调整,得到第二目标比值。
可选的,所述第一确定单元还用于包括:
将所述第一平均时间和所述第二平均时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第二目标比值确定所述目标任务执行完成所需的总剩余时间。
可选的,所述第二确定单元包括:
计算模块,用于分别对所有任务进行剩余运行时间的计算,得到各任务运行对应的剩余时间;
比对模块,用于将所述总剩余时间分别与计算得到的所述剩余时间进行比对;
确定模块,用于在确定全部的所述剩余时间均小于所述总剩余时间时,确定所述目标任务为落后者任务。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述第一方面所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述第一方面所述的方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如前述第一方面所述的方法。
本公开提供的落后者任务推测的方法、装置、电子设备和存储介质,获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;根据所述总剩余时间确定所述目标任务是否为落后者任务,与相关技术相比,以所述目标任务在映射阶段已运行的所述第一时间作为原始参数,并根据所述目标任务运行的进度分数及所述第一目标比值结合所述第一时间进行计算,以确定所述目标任务运行完成所需的总剩余时间,从而提高了估算所述目标任务运行总剩余时间的准确率,再通过所述总剩余时间确定所述目标任务是否为落后者任务,进而提高了算法推测落后者任务的准确率。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1为本公开实施例所提供的一种落后者任务推测的方法的流程示意图;
图2为本公开实施例提供的一种落后者任务推测的装置的结构示意图;
图3为本公开实施例提供的另一种落后者任务推测的装置的结构示意图;
图4为本公开实施例提供的示例电子设备300的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本公开实施例的落后者任务推测的方法、装置、电子设备和存储介质。
图1为本公开实施例所提供的一种落后者任务推测的方法的流程示意图。
如图1所示,该方法包含以下步骤:
需要了解的是,本公开是基于MapReduce的一种算法,为了便于对本公开的内容进行理解,该处对MapReduce框架进行简介,其中,MapReduce是一种分布式运算程序的编程框架,用于分布式计算环境中的数据计算。其核心思想是“分而治之”,将数据量很大的任务分解成小数据块并行执行,然后将局部计算的结果进行汇总后再进行汇总计算。MapReduce的工作主要有两个阶段,即 Map阶段和Reduce阶段, Map阶段将输入的键值对映射到一组中间键值对,Reduce阶段将接受到的中间键值对作为输入,利用共享键来减少中间值的规模,缩减为一组更小的键值。MapReduce 可以并行处理HDFS中的数据,HDFS 读取输入文件,将每个 Map 任务部署在包含存储数据的服务器上。
MapReduce 的架构由一个主节点(Job Tracker)和多个从节点(Task Tracker)组成。 Job Tracker主节点管理多个Task Tracker从节点。Task Tracker用于完成待处理和待执行的任务。Job Tracker 使用作业调度算法,将任务发送到Task Tracker进行处理。
步骤101,获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;
作为上述步骤101的细化,为了得到初始数据以估算所述目标任务运行完成所需要的剩余时间,即通过获取所述目标任务运行的进度分数即所述目标任务在映射阶段已运行的所述第一时间作为初始数据进行计算,所述映射阶段即为MapReduce计算模型中的第一个阶段,也称为map阶段。在这个阶段,MapReduce框架将输入数据划分为多个小数据块,然后并行处理这些数据块。每个数据块都会被分配给一个Map任务,由该任务进行分析和处理,所述进度分数表示所述目标任务当前进度的得分,范围从0到1,该值从Hadoop框架中获得。
步骤102,基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;
作为上述步骤102的细化,所述目标任务在映射阶段剩余运行的第二时间可以采用公式(1)计算得到,公式(1)如下所示:
令表示所述目标任务/>的当前进度得分,范围从 0 到 1,该值从Hadoop框架中获得。对于每个所述目标任务/>,/>计算为/>中成功处理的数据量与/>处理的总数据量之比。/>表示从任务/>第一次报告其map阶段进度到当前的持续时间即所述第一时间。在任务/>的map阶段期间,map阶段剩余时间/>在当前时间/>的剩余时间,也即所述第二时间可以估算如下:
(1)
是从任务/>第一次报告其map阶段进度到当前的持续时间,也即所述第一时间。
步骤103,基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;
作为上述步骤103的细化,所述排序阶段也称为sort阶段。而所述目标任务在排序阶段运行的所述第三时间可基于公式(2)和公式(3)计算得到,公式(2)和公式(3)如下所示:
在reduce阶段,所述目标任务 T[i] 的reduce阶段的估计执行时间,也即所述第三时间为
(2)
(3)
其中,为map阶段总估计时间,Ratio为map阶段与sort阶段的比值。
步骤104,根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;
作为上述步骤104的细化,所述总剩余时间可基于公式(4)计算得到,公式(4)如下所示:
在所述目标任务处于map阶段时,当前运行的所述目标任务 T[i]的任务剩余估计完成时间,也即所述总剩余时间为:
(4)
步骤105,根据所述总剩余时间确定所述目标任务是否为落后者任务。
作为上述步骤105的细化,根据步骤104计算得到的所述总剩余时间,确定所述目标任务否为落后者任务,即判断所述目标任务运行完成的总剩余时间是否为所有任务中的最长者。
本公开提供的落后者任务推测的方法,获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;根据所述总剩余时间确定所述目标任务是否为落后者任务,与相关技术相比,以所述目标任务在映射阶段已运行的所述第一时间作为原始参数,并根据所述目标任务运行的进度分数及所述第一目标比值结合所述第一时间进行计算,以确定所述目标任务运行完成所需的总剩余时间,从而提高了估算所述目标任务运行总剩余时间的准确率,再通过所述总剩余时间确定所述目标任务是否为落后者任务,进而提高了算法推测落后者任务的准确率。
需要了解的是,前述对所述目标任务运行完成的总剩余时间的估算过程,主要依据所述进度得分计算得到,该计算过程主要是在所述目标任务运行在map阶段的情况下,即任务运行的初期阶段,而该阶段不存在已完成的历史任务运行时间作为参考对最终的估算结果进行校准,而当存在已完成的历史任务的运行时间时,该时间则可以作为反馈数据在计算过程中对所述目标任务运行完成的总剩余时间进行校准。
作为本公开实施例的细化,在确定所述目标任务执行完成所需的总剩余时间时,还可以采用但不限于以下实现方式,例如:在确定不存在映射阶段和排序阶段均已完成的历史任务时,基于所述目标任务对应的节点速度和所述目标任务映射阶段数据量进行计算,得到所述目标任务映射阶段第一运行时间;基于所述第一运行时间及所述第一目标比值计算所述目标任务排序阶段的第二运行时间;将所述第一运行时间和所述第二运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
作为本公开实施例的细化,在确定所述目标任务执行完成所需的总剩余时间时,还可以采用但不限于以下实现方式,例如:在确定存在映射阶段已完成且排序阶段未完成的历史任务时,则计算所述历史任务映射阶段运行的目标平均时间;基于所述目标平均时间和所述第一目标比值计算所述目标任务排序阶段的第三运行时间;将所述目标平均时间和所述第三运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
作为本公开实施例的细化,在确定存在至少一组映射阶段和排序阶段均已完成的历史任务时,则计算所述历史任务映射阶段运行的第一平均时间及其排序阶段运行的第二平均时间对所述第一目标比值进行调整,得到第二目标比值。
作为本公开实施例的细化,在确定所述目标任务执行完成所需的总剩余时间时,还可以采用但不限于以下实现方式,例如:将所述第一平均时间和所述第二平均时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第二目标比值确定所述目标任务执行完成所需的总剩余时间。
为了便于对前述细化说明中的实施例进行理解,以下将通过公式推导及举例说明的方式对上述步骤进行详细介绍,具体内容如下所示:
基于已完成历史任务的运行时间的反馈,可以增强总剩余时间的计算并提高备份任务机制的效率,每个已完成的历史任务或阶段都可以影响map和sort阶段的估算完成时间。设 S 是一组已完成的历史任务。 已完成历史任务的map阶段的平均执行时间,也即第一平均时间可以计算如下:
(5)
其中N是集合S中的历史任务数,是属于S的已完成历史任务中第i个map阶段的执行时间,
(6)
其中是属于 S 的第 i 个已完成任务的排序阶段的执行时间。
map阶段 与 sort 阶段的比率的默认值为 C,但是这个比率也会根据从已完成历史任务收到的反馈进行更新。根据已完成任务收到的反馈,可以调整map阶段的估计时间,在开始时没有历史任务完成时,反馈的默认值是可以初步从节点速度估计map运行时间, map 阶段需要处理的数据量 M。假定节点不忙并且对处理的数据没有任何资源争用或带宽限制,值为开始时的默认值。 如果至少有一个已完成的历史任务,则会调整此值,但它的值的准确性会根据完成map阶段的历史任务数而增加。 那么反馈的map阶段处理时间要么是默认值/>,要么是属于同一个作业的map阶段完成的历史任务的平均执行时间/>,也即第一平均时间。
(7)
(8)
同理,目标任务T[i]的reduce阶段处理时间反馈,,可以是默认值,如果还没有历史任务完成reduce阶段,也可以是同一个作业已完成历史任务中reduce阶段的平均执行时间,也即第二平均时间。
(9)
(10)
该比率是前面提到的默认比率C,但在计算时会随着计算进度的更新而更新。
(11)
因此,在map阶段,目标任务 T[i] 完成map和reduce阶段的估计剩余处理时间可以基于进度分数和反馈两个因子通过将map阶段的估计剩余时间和sort阶段的总评估时间相加来计算,即得到所述总剩余时间T_total [i]:
(12)
从反馈的总map阶段时间估算和当前时间之间的差是基于map阶段反馈的预估剩余时间。
该算法在Map阶段或Reduce阶段找到目标任务T[i]的估计完成时间有四种情况。首先,当 目标任务T[i]处于map阶段并且没有关于属于同一作业的任何已完成历史任务的反馈信息时。其次,目标任务 T[i]处于map阶段,有反馈信息。第三,目标任务T[i]处于排序阶段,没有反馈信息。第四,目标任务T[i] 处于排序阶段,收集有关已完成阶段的信息。公式(10) 适用前两种情况,公式 (11)适用第三种和第四种情况。
进度得分范围从零到一,反馈权重与进度得分呈反比关系,其中初始估计取决于反馈,因为任务的进度得分较低。随着进度分数的增加,反馈的得分会降低。
(13)
作为本公开实施例的细化,在执行步骤105所述根据所述总剩余时间确定所述目标任务是否为落后者任务时,可以采用但不限于以下实现方式,例如:分别对所有任务进行剩余运行时间的计算,得到各任务运行对应的剩余时间;将所述总剩余时间分别与计算得到的所述剩余时间进行比对;在确定全部的所述剩余时间均小于所述总剩余时间时,确定所述目标任务为落后者任务。
综上所述,本公开实施例能达到以下效果:
1. 通过以所述目标任务在映射阶段已运行的所述第一时间作为原始参数,并根据所述目标任务运行的进度分数及所述第一目标比值结合所述第一时间进行计算,以确定所述目标任务运行完成所需的总剩余时间,从而提高了估算所述目标任务运行总剩余时间的准确率,再通过所述总剩余时间确定所述目标任务是否为落后者任务,进而提高了算法推测落后者任务的准确率。
2. 通过目标任务当前阶段的进度分数和已完成阶段的历史任务的反馈这两个因子来预估当前运行任务的完成时间。在算法中,预估的准确性随着已完成历史任务的增加而增加,当前进度分数和已完成历史任务反馈进行结合,能更准确地预估目标任务完成时间。
与上述的落后者任务推测的方法相对应,本发明还提出一种落后者任务推测的装置。由于本发明的装置实施例与上述的方法实施例相对应,对于装置实施例中未披露的细节可参照上述的方法实施例,本发明中不再进行赘述。
图2为本公开实施例提供的一种落后者任务推测的装置的结构示意图,如图2所示,包括:
获取单元21,用于获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;
第一计算单元22,用于基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;
第二计算单元23,用于基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;
第一确定单元24,用于根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;
第二确定单元25,用于根据所述总剩余时间确定所述目标任务是否为落后者任务。
本公开提供的落后者任务推测的装置,获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;根据所述总剩余时间确定所述目标任务是否为落后者任务,与相关技术相比,以所述目标任务在映射阶段已运行的所述第一时间作为原始参数,并根据所述目标任务运行的进度分数及所述第一目标比值结合所述第一时间进行计算,以确定所述目标任务运行完成所需的总剩余时间,从而提高了估算所述目标任务运行总剩余时间的准确率,再通过所述总剩余时间确定所述目标任务是否为落后者任务,进而提高了算法推测落后者任务的准确率。
图3为本公开实施例提供的另一种落后者任务推测的装置的结构示意图,如图3所示,所述第一确定单元24还用于:
在确定不存在映射阶段和排序阶段均已完成的历史任务时,基于所述目标任务对应的节点速度和所述目标任务映射阶段数据量进行计算,得到所述目标任务映射阶段第一运行时间;
基于所述第一运行时间及所述第一目标比值计算所述目标任务排序阶段的第二运行时间;
将所述第一运行时间和所述第二运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
进一步地,在本实施例一种可能的实现方式中,如图3所示,所述第一确定单元24还用于:
在确定存在映射阶段已完成且排序阶段未完成的历史任务时,则计算所述历史任务映射阶段运行的目标平均时间;
基于所述目标平均时间和所述第一目标比值计算所述目标任务排序阶段的第三运行时间;
将所述目标平均时间和所述第三运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
进一步地,在本实施例一种可能的实现方式中,如图3所示,在确定存在至少一组映射阶段和排序阶段均已完成的历史任务时,则计算所述历史任务映射阶段运行的第一平均时间及其排序阶段运行的第二平均时间对所述第一目标比值进行调整,得到第二目标比值。
进一步地,在本实施例一种可能的实现方式中,如图3所示,所述第一确定单元24还用于:
将所述第一平均时间和所述第二平均时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第二目标比值确定所述目标任务执行完成所需的总剩余时间。
进一步地,在本实施例一种可能的实现方式中,如图3所示,所述第二确定单元25包括:
计算模块251,用于分别对所有任务进行剩余运行时间的计算,得到各任务运行对应的剩余时间;
比对模块252,用于将所述总剩余时间分别与计算得到的所述剩余时间进行比对;
确定模块253,用于在确定全部的所述剩余时间均小于所述总剩余时间时,确定所述目标任务为落后者任务。
需要说明的是,前述对方法实施例的解释说明,也适用于本实施例的装置,原理相同,本实施例中不再限定。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图4示出了可以用来实施本公开的实施例的示例电子设备300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图4所示,设备300包括计算单元301,其可以根据存储在ROM(Read-OnlyMemory,只读存储器)302中的计算机程序或者从存储单元308加载到RAM(Random AccessMemory,随机访问/存取存储器) 303中的计算机程序,来执行各种适当的动作和处理。在RAM 303中,还可存储设备300操作所需的各种程序和数据。计算单元301、ROM 302以及RAM303通过总线304彼此相连。I/O(Input/Output,输入/输出) 接口305也连接至总线304。
设备300中的多个部件连接至I/O接口305,包括:输入单元306,例如键盘、鼠标等;输出单元307,例如各种类型的显示器、扬声器等;存储单元308,例如磁盘、光盘等;以及通信单元309,例如网卡、调制解调器、无线通信收发机等。通信单元309允许设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元301的一些示例包括但不限于CPU(Central Processing Unit,中央处理单元)、GPU(Graphic Processing Units,图形处理单元) 、各种专用的AI(ArtificialIntelligence,人工智能) 计算芯片、各种运行机器学习模型算法的计算单元、DSP(Digital Signal Processor,数字信号处理器) 、以及任何适当的处理器、控制器、微控制器等。计算单元301执行上文所描述的各个方法和处理,例如落后者任务推测的方法。例如,在一些实施例中,落后者任务推测的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元308。在一些实施例中,计算机程序的部分或者全部可以经由ROM 302和/或通信单元309而被载入和/或安装到设备300上。当计算机程序加载到RAM 303并由计算单元301执行时,可以执行上文描述的方法的一个或多个步骤。备选地,在其他实施例中,计算单元301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行前述落后者任务推测的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、FPGA(Field Programmable Gate Array,现场可编程门阵列)、ASIC(Application-Specific Integrated Circuit,专用集成电路)、ASSP(Application Specific StandardProduct,专用标准产品)、SOC(System On Chip,芯片上系统的系统)、CPLD(ComplexProgrammable Logic Device,复杂可编程逻辑设备) 、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、RAM、ROM、EPROM(Electrically Programmable Read-Only-Memory,可擦除可编程只读存储器) 或快闪存储器、光纤、CD-ROM(Compact Disc Read-Only Memory,便捷式紧凑盘只读存储器) 、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode-Ray Tube, 阴极射线管)或者LCD(Liquid Crystal Display, 液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:LAN(LocalArea Network,局域网)、WAN(Wide Area Network,广域网) 、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称 "VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
其中,需要说明的是,人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (10)
1.一种落后者任务推测的方法,其特征在于,包括:
获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;
基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;
基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;
根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;
根据所述总剩余时间确定所述目标任务是否为落后者任务。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标任务执行完成所需的总剩余时间,包括:
在确定不存在映射阶段和排序阶段均已完成的历史任务时,基于所述目标任务对应的节点速度和所述目标任务映射阶段数据量进行计算,得到所述目标任务映射阶段第一运行时间;
基于所述第一运行时间及所述第一目标比值计算所述目标任务排序阶段的第二运行时间;
将所述第一运行时间和所述第二运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
3.根据权利要求1所述的方法,其特征在于,所述确定所述目标任务执行完成所需的总剩余时间包括:
在确定存在映射阶段已完成且排序阶段未完成的历史任务时,则计算所述历史任务映射阶段运行的目标平均时间;
基于所述目标平均时间和所述第一目标比值计算所述目标任务排序阶段的第三运行时间;
将所述目标平均时间和所述第三运行时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第一目标比值确定所述目标任务执行完成所需的总剩余时间。
4.根据权利要求1所述的方法,其特征在于,在确定存在至少一组映射阶段和排序阶段均已完成的历史任务时,则计算所述历史任务映射阶段运行的第一平均时间及其排序阶段运行的第二平均时间对所述第一目标比值进行调整,得到第二目标比值。
5.根据权利要求4所述的方法,其特征在于,所述确定所述目标任务执行完成所需的总剩余时间包括:
将所述第一平均时间和所述第二平均时间作为反馈,并结合所述第一时间、所述第二时间、所述进度分数及所述第二目标比值确定所述目标任务执行完成所需的总剩余时间。
6.根据权利要求1-3或5任一项所述的方法,其特征在于,所述根据所述总剩余时间确定所述目标任务是否为落后者任务包括:
分别对所有任务进行剩余运行时间的计算,得到各任务运行对应的剩余时间;
将所述总剩余时间分别与计算得到的所述剩余时间进行比对;
在确定全部的所述剩余时间均小于所述总剩余时间时,确定所述目标任务为落后者任务。
7.一种落后者任务推测的装置,其特征在于,包括:
获取单元,用于获取目标任务运行进度分数及所述目标任务在映射阶段已运行的第一时间;
第一计算单元,用于基于所述进度分数和所述第一时间计算所述目标任务在映射阶段剩余运行的第二时间;
第二计算单元,用于基于所述目标任务映射阶段与排序阶段的第一目标比值、所述第一时间及所述进度分数进行计算,得到所述目标任务在排序阶段运行的第三时间,所述第一目标比值为系统默认值;
第一确定单元,用于根据所述第二时间和所述第三时间确定所述目标任务执行完成所需的总剩余时间;
第二确定单元,用于根据所述总剩余时间确定所述目标任务是否为落后者任务。
8. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
9.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
10.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311604150.9A CN117539602A (zh) | 2023-11-28 | 2023-11-28 | 落后者任务推测的方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311604150.9A CN117539602A (zh) | 2023-11-28 | 2023-11-28 | 落后者任务推测的方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117539602A true CN117539602A (zh) | 2024-02-09 |
Family
ID=89791583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311604150.9A Pending CN117539602A (zh) | 2023-11-28 | 2023-11-28 | 落后者任务推测的方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117539602A (zh) |
-
2023
- 2023-11-28 CN CN202311604150.9A patent/CN117539602A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113343803A (zh) | 模型训练方法、装置、设备和存储介质 | |
CN113377890B (zh) | 一种地图质检方法、装置、电子设备及存储介质 | |
CN116596750A (zh) | 一种点云处理方法、装置、电子设备及存储介质 | |
CN115438007A (zh) | 一种文件合并方法、装置、电子设备及介质 | |
CN117539602A (zh) | 落后者任务推测的方法及装置、电子设备和存储介质 | |
CN113900731A (zh) | 请求处理方法、装置、设备和存储介质 | |
CN115860077B (zh) | 状态数据的处理方法、装置、设备以及存储介质 | |
CN113313261A (zh) | 函数处理方法、装置及电子设备 | |
CN113344213A (zh) | 知识蒸馏方法、装置、电子设备及计算机可读存储介质 | |
CN112683216B (zh) | 用于生成车辆长度信息的方法、装置、路侧设备和云控平台 | |
CN114816758B (zh) | 资源分配方法和装置 | |
EP4036861A2 (en) | Method and apparatus for processing point cloud data, electronic device, storage medium, computer program product | |
CN116416500B (zh) | 图像识别模型训练方法、图像识别方法、装置及电子设备 | |
CN114757304B (zh) | 一种数据识别方法、装置、设备及存储介质 | |
CN115660034B (zh) | 分布式模型训练的方法、装置和系统 | |
CN114331379B (zh) | 用于输出待办任务的方法、模型训练方法和装置 | |
CN117194018A (zh) | 一种多核多芯片环境下系统控温算法的处理方法及装置 | |
CN117933353A (zh) | 强化学习模型训练方法、装置、电子设备及存储介质 | |
CN117910548A (zh) | 分布式模型训练方法、装置、设备、系统、介质及产品 | |
CN117506917A (zh) | 速度曲线规划方法、装置、电子设备及存储介质 | |
CN117632431A (zh) | 云计算任务的调度方法、装置、设备及存储介质 | |
CN116403001A (zh) | 目标检测模型训练及目标检测方法、装置、设备和介质 | |
CN116703963A (zh) | 一种ar跟踪方法、装置、ar设备及存储介质 | |
CN114429211A (zh) | 用于生成信息的方法、装置、设备、介质和产品 | |
CN114092673A (zh) | 图像处理的方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |