CN110188023A - 资源健康检查方法和资源健康检查装置 - Google Patents

资源健康检查方法和资源健康检查装置 Download PDF

Info

Publication number
CN110188023A
CN110188023A CN201910427105.8A CN201910427105A CN110188023A CN 110188023 A CN110188023 A CN 110188023A CN 201910427105 A CN201910427105 A CN 201910427105A CN 110188023 A CN110188023 A CN 110188023A
Authority
CN
China
Prior art keywords
inspection
duration
operation group
inspections
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910427105.8A
Other languages
English (en)
Other versions
CN110188023B (zh
Inventor
陆明
王友焱
李家辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201910427105.8A priority Critical patent/CN110188023B/zh
Publication of CN110188023A publication Critical patent/CN110188023A/zh
Application granted granted Critical
Publication of CN110188023B publication Critical patent/CN110188023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Abstract

本公开提供了一种资源健康检查方法,包括响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量,获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系,基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件,并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果,以及输出所述检查结果。本公开还提供了一种资源健康检查装置。

Description

资源健康检查方法和资源健康检查装置
技术领域
本公开涉及一种资源健康检查方法和资源健康检查装置。
背景技术
在基础设施运维中,需要对系统发生异常情况进行检查。这样的检查过程可能会跨越多种不同的资源逐层展开。例如,当发现运行在云平台虚拟机中的数据库性能变差,会分别从应用性能,应用与数据库网络性能,计算资源性能,宿主机资源竞争情况,存储资源性能等方面分别进行性能检查。这样的检查定位往往按照一定的工作流程一步步推进诊断定位,例如按照应用层到物理层的多个层级逐层进行检查,每一个层次的内容检查完成之后检查下一层次内容,直到按照流程定位到问题位置已告结束。该工作流程具有较强的逻辑顺序,能够有效地排查问题,能够有效展开检查工作。然而,本发明人发现,在复杂的问题定位过程中,上述方法存在问题诊断效率不足的问题。
发明内容
本公开的一个方面提供了一种资源健康检查的方法,包括响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量,获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系,基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件,并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果,以及输出所述检查结果。
可选地,作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。
可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的差值在第一范围内。
可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。
可选地,所述特定条件包括并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。
可选地,所述获得所述检查作业集合中的各个检查作业的预计执行时长包括获得历史记录,基于所述历史记录,确定所述检查作业集合中的各个检查作业的预计执行时长,所述方法还包括在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。
可选地,所述读取与所述检查指令对应的检查作业集合包括,基于所述检查指令,确定多个检查操作,确定所述检查操作的判断标准,以及将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。
本公开的另一个方面提供了一种资源健康检查的装置,包括读取模块、获得模块、处理模块、执行模块以及输出模块。读取模块,用于响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量。获得模块,用于获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系。处理模块,用于基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得在并行执行所述多个作业组时中的检查作业所耗费的总时长满足特定条件。执行模块,用于并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果。输出模块,用于输出所述检查结果。
可选地,作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。
可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的差值在第一范围内。
可选地,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。
可选地,所述特定条件包括并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。
可选地,所述获得模块包括获得子模块和第一确定子模块。获得子模块,用于获得历史记录。第一确定子模块,用于基于所述历史记录,确定所述检查作业集合中的多个检查作业的预计执行时长。所述装置还包括记录模块,用于在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。
可选地,所述读取模块包括第二确定子模块、第三确定子模块以及封装子模块。第二确定子模块,用于基于所述检查指令,确定多个检查操作。第三确定子模块,用于确定所述检查操作的判断标准。封装子模块,用于将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。
本公开的另一个方面提供了一种电子设备,包括,至少一个处理器以及至少一个存储器,用于存储一个或多个计算机可读指令,其中,当所述一个或多个计算机可读指令被所述至少一个处理器执行时,使得所述处理器执行如上所述的方法。
本公开的另一方面提供了一种非易失性存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1A和图1B示意性示出了根据本公开的实施例的资源健康检查的示例性场景;
图2示意性示出了根据本公开实施例的资源健康检查方法的流程图;
图3示意性示出了根据本公开实施例的读取与所述检查指令对应的检查作业集合的流程图;
图4示意性示出了根据本公开实施例的资源健康检查装置的框图;
图5示意性示出了根据本公开另一实施例的资源健康检查装置的框图;
图6示意性示出了根据本公开实施例的读取模块的框图;以及
图7示意性示出了根据本公开实施例的计算机系统的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
本公开的实施例提供了一种资源健康检查方法,包括响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量,获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系,基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件,并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果,以及输出所述检查结果。
图1A和图1B示意性示出了根据本公开的实施例的资源健康检查的示例性场景。
一个通常的检查流程可以由一个有向无环图表示。如图1A所示,该流程从节点A开始,执行节点A对应的检查操作后,可以确定是否定位到异常,如果没有发现异常,可以继续执行节点B,或者执行节点C,或者分别执行节点B和节点C。具体的选择可以根据节点A的检查操作得到的检查结果确定,也可以与节点的检查结果无关。以此类推,直至定位到异常或者流程结束,得到检查报告。
如图1B所示,本公开实施例的方法可以不受标准工作流程的限制,由于多数检查作业之间无依赖关系,可以基于各个检查作业的预计执行时长重构并行检查流程,使得总耗时最短。
下面结合图2对本公开实施例的资源检查方法进行说明。
图2示意性示出了根据本公开实施例的资源健康检查方法的流程图。
如图2所示,该方法包括操作S210~S250。
在操作S210,响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量。根据本公开实施例,不同的检查指令可以对应不同的检查作业集合,不同检查指令允许的并行数量也可以不同。例如,在高性能计算场景和客户端场景中,检查的操作以及相应的判断标准都会不同。例如,测试任务的同一处理速度在客户端场景中是正常的,在高性能计算场景中则有可能是异常的。
图3示意性示出了根据本公开实施例的读取与所述检查指令对应的检查作业集合的流程图。
如图3所示,该方法包括操作S310~S330。
在操作S310,基于所述检查指令,确定多个检查操作。
在操作S320,确定所述检查操作的判断标准。
在操作S330,将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。根据本公开实施例,一个检查操作需要有相应的判断标准才能判断结果是否异常,因此,本公开实施例的检查作业包括检查操作和相应的判断标准。
返回参考图2。在操作S220,获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系。
根据本公开实施例,多个检查作业中的部分检查作业之间可能存在依赖关系,例如,检查作业M包括在设备中安装软件X,检查作业N的执行需要设备中存在软件X才能执行,此时,两个检查作业之间存在依赖关系,检查作业N必须在检查作业M之后执行。多数情况下,检查作业是无侵入性的,存在依赖关系的检查作业较少。
根据本公开实施例,还获得各个检查作业的预计执行时长,例如可以根据理论值对预计执行时长进行估计,或者通过历史记录确定各个检查作业的预计执行时长。获得检查作业集合中的各个检查作业的预计执行时长可以包括,获得历史记录,以及基于所述历史记录,确定所述检查作业集合中的各个检查作业的预计执行时长。
在操作S230,基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件。
本公开实施例的方法可以不受标准工作流程的限制,由于多数检查作业之间无依赖关系,可以基于各个检查作业的预计执行时长重构检查流程,使得总耗时最短。
根据本公开实施例,作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。全部检查作业所需要的时长由作业组中的全部检查作业的预计执行时长确定。例如,一个作业组时长为6小时,另一个作业组时长为7小时,在并行执行时的总耗费时长为7小时;而如果一个作业组时长为3小时,另一个作业组时长为10小时,则总耗费时长为10小时,因此,将作业组时长相近的作业组分配到并行任务中来处理,可以减少总耗费时长。
根据本公开实施例,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的差值在第一范围内。例如,可以确定第一范围为不高于3小时,如果两个作业组的时长的差值高于3小时,可以调整两个作业组中包含的作业,使之不高于3小时,从而缩短总耗费时长。
根据本公开实施例,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。例如,可以确定第二范围为0.8~1.25,如果两个作业组的时长的比值低于0.8或高于1.25,可以调整两个作业组中包含的作业,使之在该第二范围内,从而缩短总耗费时长。
根据本公开实施例,所述特定条件包括并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。例如,可以基于关键路径优化尽可能地减少耗时最长的路径所耗费的时长,从而实现并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。
例如,可以首先将具有依赖关系的作业合并,合并后的多个作业之间不再具有依赖关系,再根据各个作业的预计执行时长,以及允许的并行数量,将多个作业分成时间相近的多个作业组,使得并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。
在操作S240,并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果。
其中,根据本公开实施例,在一个检查作业执行完成之后,所述方法还包括将该检查作业的实际执行时长写入所述历史记录,以供之后的检查指令再次执行该检查操作时能够根据该历史记录估计检查作业的预计执行时长,并用于设计并行作业流程。
在操作S250,输出所述检查结果。该检查结果例如可以包括异常发生的位置和异常发生的原因等。
该方法基于多个作业的预计执行时长,确定并行作业执行流程,使得在更短的时长内完成异常检查,提高效率。
基于同一发明构思,本公开还提供了一种资源健康检查装置,下面参照图4对本公开实施例的资源健康检查装置进行说明。
图4示意性示出了根据本公开实施例的资源健康检查装置400的框图。
如图4所示,该资源健康检查装置400包括读取模块410、获得模块420、处理模块430、执行模块440以及输出模块450。该装置400可以执行上面参考图2和图3描述的方法。
读取模块410,例如执行上文参考图2所描述的操作S210,用于响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量。
获得模块420,例如执行上文参考图2所描述的操作S220,用于获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系。
处理模块430,例如执行上文参考图2所描述的操作S230,用于基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得在并行执行所述多个作业组时中的检查作业所耗费的总时长满足特定条件。
执行模块440,例如执行上文参考图2所描述的操作S240,用于并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果。
输出模块450,例如执行上文参考图2所描述的操作S240,用于输出所述检查结果。
根据本公开实施例,作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。
根据本公开实施例,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的差值在第一范围内。
根据本公开实施例,所述特定条件包括所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。
根据本公开实施例,所述特定条件包括并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。
图5示意性示出了根据本公开另一实施例的资源健康检查装置600的框图。
如图5所示,该资源健康检查装置500在前述实施例的基础上,还包括记录模块510。
记录模块510,用于在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。
其中,所述获得模块420包括获得子模块421和第一确定子模块422。
获得子模块421,用于获得历史记录。
第一确定子模块422,用于基于所述历史记录,确定所述检查作业集合中的多个检查作业的预计执行时长。
图6示意性示出了根据本公开实施例的读取模块600的框图。
如图6所示,该读取模块600包括第二确定子模块610、第三确定子模块620以及封装子模块630。
第二确定子模块610,例如执行上文参考图3所描述的操作S310,用于基于所述检查指令,确定多个检查操作。
第三确定子模块620,例如执行上文参考图3所描述的操作S320,用于确定所述检查操作的判断标准。
封装子模块630,例如执行上文参考图3所描述的操作S330,用于将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,读取模块410、获得模块420、处理模块430、执行模块440、输出模块450、记录模块510、获得子模块421、第一确定子模块422、第二确定子模块610、第三确定子模块620以及封装子模块630中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,读取模块410、获得模块420、处理模块430、执行模块440、输出模块450、记录模块510、获得子模块421、第一确定子模块422、第二确定子模块610、第三确定子模块620以及封装子模块630中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,读取模块410、获得模块420、处理模块430、执行模块440、输出模块450、记录模块510、获得子模块421、第一确定子模块422、第二确定子模块610、第三确定子模块620以及封装子模块630中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图7示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机系统的方框图。图7示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括处理器710和计算机可读存储介质720。该计算机系统700可以执行根据本公开实施例的方法。
具体地,处理器710例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器710还可以包括用于缓存用途的板载存储器。处理器710可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质720,例如可以是非易失性的计算机可读存储介质,具体示例包括但不限于:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;等等。
计算机可读存储介质720可以包括计算机程序721,该计算机程序721可以包括代码/计算机可执行指令,其在由处理器710执行时使得处理器710执行根据本公开实施例的方法或其任何变形。
计算机程序721可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序721中的代码可以包括一个或多个程序模块,例如包括721A、模块721B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器710执行时,使得处理器710可以执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,读取模块410、获得模块420、处理模块430、执行模块440、输出模块450、记录模块510、获得子模块421、第一确定子模块422、第二确定子模块610、第三确定子模块620以及封装子模块630中的至少一个可以实现为参考图7描述的计算机程序模块,其在被处理器710执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (10)

1.一种资源健康检查方法,包括:
响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量;
获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系;
基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得并行执行所述多个作业组的检查的总耗费时长满足特定条件;
并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果;以及
输出所述检查结果。
2.根据权利要求1所述的方法,其中,
作业组时长相近的作业组被分配到并行任务中来处理,其中,作业组时长是执行作业组中的全部检查作业所需要的时长。
3.根据权利要求2所述的方法,其中,所述特定条件包括:
所述多个作业组中的两个作业组的作业组时长的差值在第一范围内;并且/或者
所述多个作业组中的两个作业组的作业组时长的比值在第二范围内。
4.根据权利要求1所述的方法,其中,所述特定条件包括:
并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。
5.根据权利要求1所述的方法,其中,所述获得所述检查作业集合中的各个检查作业的预计执行时长包括:
获得历史记录;
基于所述历史记录,确定所述检查作业集合中的各个检查作业的预计执行时长,
所述方法还包括在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。
6.根据权利要求1所述的方法,其中,所述读取与所述检查指令对应的检查作业集合包括:
基于所述检查指令,确定多个检查操作;
确定所述检查操作的判断标准;以及
将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。
7.一种资源健康检查装置,包括:
读取模块,用于响应于检查指令,读取与所述检查指令对应的检查作业集合以及允许的并行数量;
获得模块,用于获得所述检查作业集合中的各个检查作业的预计执行时长和多个检查作业之间的依赖关系;
处理模块,用于基于所述各个检查作业的预计执行时长、允许的并行数量和多个检查作业之间的依赖关系,将所述多个检查作业分为多个作业组,每个作业组包括一个或多个检查作业,使得在并行执行所述多个作业组时中的检查作业所耗费的总时长满足特定条件;
执行模块,用于并行执行所述多个作业组中的检查作业,检查资源的健康状况,得到检查结果;以及
输出模块,用于输出所述检查结果。
8.根据权利要求7所述的装置,其中,所述特定条件包括:
并行执行所述多个作业组中的检查作业所耗费的总时长达到最小。
9.根据权利要求7所述的装置,其中,所述获得模块包括:
获得子模块,用于获得历史记录;
第一确定子模块,用于基于所述历史记录,确定所述检查作业集合中的多个检查作业的预计执行时长,
所述装置还包括:
记录模块,用于在一个检查作业执行完成之后,将该检查作业的实际执行时长写入所述历史记录。
10.根据权利要求7所述的装置,其中,所述读取模块包括:
第二确定子模块,用于基于所述检查指令,确定多个检查操作;
第三确定子模块,用于确定所述检查操作的判断标准;以及
封装子模块,用于将每个检查操作和相应的判断标准封装为一个检查作业,得到与所述检查指令对应的检查作业集合。
CN201910427105.8A 2019-05-21 2019-05-21 资源健康检查方法和资源健康检查装置 Active CN110188023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910427105.8A CN110188023B (zh) 2019-05-21 2019-05-21 资源健康检查方法和资源健康检查装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910427105.8A CN110188023B (zh) 2019-05-21 2019-05-21 资源健康检查方法和资源健康检查装置

Publications (2)

Publication Number Publication Date
CN110188023A true CN110188023A (zh) 2019-08-30
CN110188023B CN110188023B (zh) 2021-09-14

Family

ID=67717217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910427105.8A Active CN110188023B (zh) 2019-05-21 2019-05-21 资源健康检查方法和资源健康检查装置

Country Status (1)

Country Link
CN (1) CN110188023B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111857984A (zh) * 2020-06-01 2020-10-30 北京文思海辉金信软件有限公司 银行系统中的作业调用处理方法、装置和计算机设备
CN113155133A (zh) * 2021-04-25 2021-07-23 国网山东省电力公司鄄城县供电公司 电力设备的检查线路确定方法、装置以及电子终端
CN113516458A (zh) * 2021-09-09 2021-10-19 中电金信软件有限公司 一种对批量作业进行分组处理的方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949912A (zh) * 2006-11-08 2007-04-18 华为技术有限公司 一种基站健康检查装置和方法
US20130253969A1 (en) * 2012-03-20 2013-09-26 International Business Machines Corporation Broadcast Messaging of Incentives Based on Value
CN103488691A (zh) * 2013-09-02 2014-01-01 用友软件股份有限公司 任务调度装置和任务调度方法
CN104424525A (zh) * 2013-08-30 2015-03-18 国际商业机器公司 辅助确定项目范围的方法和装置
CN105337716A (zh) * 2015-09-30 2016-02-17 武汉虹信通信技术有限责任公司 一种载波聚合下的资源协商和调度方法及装置
CN106611270A (zh) * 2016-01-29 2017-05-03 四川用联信息技术有限公司 一种求解并行机作业车间调度的混合启发式转移瓶颈算法
CN107871194A (zh) * 2016-09-28 2018-04-03 北京北方华创微电子装备有限公司 一种生产线设备的调度方法和装置
CN109725993A (zh) * 2018-06-01 2019-05-07 中国平安人寿保险股份有限公司 任务执行方法、装置、设备及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949912A (zh) * 2006-11-08 2007-04-18 华为技术有限公司 一种基站健康检查装置和方法
US20130253969A1 (en) * 2012-03-20 2013-09-26 International Business Machines Corporation Broadcast Messaging of Incentives Based on Value
CN104424525A (zh) * 2013-08-30 2015-03-18 国际商业机器公司 辅助确定项目范围的方法和装置
CN103488691A (zh) * 2013-09-02 2014-01-01 用友软件股份有限公司 任务调度装置和任务调度方法
CN105337716A (zh) * 2015-09-30 2016-02-17 武汉虹信通信技术有限责任公司 一种载波聚合下的资源协商和调度方法及装置
CN106611270A (zh) * 2016-01-29 2017-05-03 四川用联信息技术有限公司 一种求解并行机作业车间调度的混合启发式转移瓶颈算法
CN107871194A (zh) * 2016-09-28 2018-04-03 北京北方华创微电子装备有限公司 一种生产线设备的调度方法和装置
CN109725993A (zh) * 2018-06-01 2019-05-07 中国平安人寿保险股份有限公司 任务执行方法、装置、设备及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111857984A (zh) * 2020-06-01 2020-10-30 北京文思海辉金信软件有限公司 银行系统中的作业调用处理方法、装置和计算机设备
CN113155133A (zh) * 2021-04-25 2021-07-23 国网山东省电力公司鄄城县供电公司 电力设备的检查线路确定方法、装置以及电子终端
CN113516458A (zh) * 2021-09-09 2021-10-19 中电金信软件有限公司 一种对批量作业进行分组处理的方法及装置

Also Published As

Publication number Publication date
CN110188023B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN110188023A (zh) 资源健康检查方法和资源健康检查装置
CN104123184B (zh) 一种用于为构建过程中的任务分配资源的方法和系统
CN109144695A (zh) 一种任务拓扑关系的处理方法、装置、设备和介质
US11307049B2 (en) Methods, apparatuses, systems, and storage media for storing and loading visual localization maps
TW201530170A (zh) 用於半導體晶粒之晶粒上邏輯分析器
CN108021505A (zh) 数据上线方法、装置和计算机设备
CN109934712A (zh) 应用于分布式系统的对账方法、对账装置和电子设备
CN103593271A (zh) 一种片上系统芯片追踪调试的方法及装置
CN107710166A (zh) 利用符号快速错误检测的硅后验证和调试
CN109189572A (zh) 一种资源预估方法及系统、电子设备和存储介质
US20160239278A1 (en) Generating a schedule of instructions based on a processor memory tree
US9195730B2 (en) Verifying correctness of a database system via extended access paths
CN106126416B (zh) 一种基于流程编排的服务组合路径推导方法
El Mandouh et al. Application of machine learning techniques in post-silicon debugging and bug localization
US10394987B2 (en) Adaptive bug-search depth for simple and deep counterexamples
US9710349B2 (en) Storing first computer trace information in memory of second computer
CN110162423A (zh) 资源检查方法和资源检查装置
CN115952446B (zh) 一种火箭发动机稳态振动响应预测方法、装置及设备
US7484221B2 (en) Method and apparatus for logging the execution history of an operating system kernel
CN116302899B (zh) 一种芯粒故障诊断方法和装置
US9092333B2 (en) Fault isolation with abstracted objects
CN107515803A (zh) 一种存储性能测试方法和装置
CN110427278A (zh) 异常检测方法和装置
CN104598171B (zh) 基于元数据的阵列重建方法及装置
CN106155866A (zh) 一种监控cpu核心频率的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant