CN110231998A - 分布式定时任务的检测方法、装置及存储介质 - Google Patents

分布式定时任务的检测方法、装置及存储介质 Download PDF

Info

Publication number
CN110231998A
CN110231998A CN201910509875.7A CN201910509875A CN110231998A CN 110231998 A CN110231998 A CN 110231998A CN 201910509875 A CN201910509875 A CN 201910509875A CN 110231998 A CN110231998 A CN 110231998A
Authority
CN
China
Prior art keywords
task
subtask
abnormal log
log information
detection device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910509875.7A
Other languages
English (en)
Other versions
CN110231998B (zh
Inventor
吴光友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201910509875.7A priority Critical patent/CN110231998B/zh
Publication of CN110231998A publication Critical patent/CN110231998A/zh
Application granted granted Critical
Publication of CN110231998B publication Critical patent/CN110231998B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services

Abstract

本申请实施例提供一种分布式定时任务的检测方法、装置及存储介质,所述方法包括:第一分布式定时任务的检测装置在接收到至少一个异常日志信息(所述异常日志信息用于指示对应子任务的异常运行信息)后,通过将所述至少一个异常日志信息按照子任务所属任务的不同进行分类得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理,从而使得对应的任务能够正常运行。可见,本申请实施例大大降低了对分布式定时任务的运维工作量,节省了运维成本,且大大提高了运维响应速度。

Description

分布式定时任务的检测方法、装置及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种分布式定时任务的检测方法、装置及存储介质。
背景技术
随着互联网大数据时代的到来,单机数据处理能力出现瓶颈,因此,分布式定时任务得到了广泛应用。目前主流的分布式定时任务架构包括将一个任务分片成为多个子任务在多个服务器上同时执行。
现有技术中,对任务执行状态的管理过程中,通常需要运维人员登陆到多台服务器查看每个子任务的运行状态;若发现子任务运行异常后,则抓取日志(log)文件并提供给程序开发人员进行处理。
因此,现有技术中分布式定时任务的运维工作量较大且运维成本较高。
发明内容
本申请实施例提供一种分布式定时任务的检测方法、装置及存储介质,解决了现有技术中运维工作量较大且运维成本较高的技术问题。
第一方面,本申请实施例提供一种分布式定时任务的检测方法,所述方法应用于第一分布式定时任务的检测装置,所述方法包括:
接收至少一个异常日志信息;其中,所述至少一个异常日志信息为至少一个第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的所述子任务的异常日志信息;所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息;
根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
可选地,所述将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,包括:
根据每个所述异常日志信息中包含的对应子任务所属任务的标识信息,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息。
可选地,所述根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,包括:
根据所述任务与责任终端之间的对应关系,分别确定每个所述任务对应的责任终端;
分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端。
可选地,所述接收至少一个异常日志信息,包括:
接收消息队列MQ中的所述至少一个异常日志信息。
可选地,任意所述子任务的异常日志信息为对应的所述第二分布式定时任务的检测装置在定时向所述子任务发送心跳消息后的预设时长内未收到所述子任务返回的响应消息时所采集的所述子任务的异常日志信息。
可选地,任意所述子任务的异常日志信息为对应的所述第二分布式定时任务的检测装置在根据至少一个预设异常关键字对所述子任务的日志文件进行定时扫描时,确定所述子任务对应的日志文件中包括预设数量个所述预设异常关键字时所采集的所述子任务的异常日志信息。
可选地,所述子任务的异常运行信息,包括以下信息中至少一项:所述子任务所属任务的标识信息、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息。
第二方面,本申请实施例提供一种分布式定时任务的检测方法,所述方法应用于第二分布式定时任务的检测装置,所述方法包括:
定时监测对应的子任务的运行状态;
当监测到所述子任务运行异常时,采集所述子任务的异常日志信息;其中,所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
将所述异常日志信息发送给第一分布式定时任务的检测装置,以使所述第一分布式定时任务的检测装置在接收到至少一个异常日志信息后,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
可选地,所述定时监测对应的子任务的运行状态,包括:
定时向所述子任务发送心跳消息;
若在预设时长内收到所述子任务返回的响应消息,则确定所述子任务运行正常;若在所述预设时长内未收到所述子任务返回的响应消息,则确定所述子任务运行异常。
可选地,所述定时监测对应的子任务的运行状态,包括:
根据至少一个预设异常关键字对所述子任务对应的日志文件进行定时扫描;
若所述子任务对应的日志文件中包括预设数量个所述预设异常关键字,则确定所述子任务运行异常。
可选地,所述将所述异常日志信息发送给第一分布式定时任务的检测装置,包括:
将所述异常日志信息发送到消息队列MQ中,以使所述第一分布式定时任务的检测装置从所述MQ中获取所述异常日志信息。
可选地,所述子任务的异常运行信息,包括以下信息中至少一项:所述子任务所属任务的标识信息、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息。
第三方面,本申请实施例提供一种分布式定时任务的检测装置,所述分布式定时任务的检测装置为第一分布式定时任务的检测装置,所述装置包括:
接收模块,用于接收至少一个异常日志信息;其中,所述至少一个异常日志信息为至少一个第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的所述子任务的异常日志信息;所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
分类模块,用于将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息;
发送模块,用于根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
第四方面,本申请实施例提供一种分布式定时任务的检测装置,所述分布式定时任务的检测装置为第二分布式定时任务的检测装置,所述装置包括:
监测模块,用于定时监测对应的子任务的运行状态;
采集模块,用于当监测到所述子任务运行异常时,采集所述子任务的异常日志信息;其中,所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
发送模块,用于将所述异常日志信息发送给第一分布式定时任务的检测装置,以使所述第一分布式定时任务的检测装置在接收到至少一个异常日志信息后,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
第五方面,本申请实施例提供一种分布式定时任务的检测装置,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面或第二方面中任一项所述的方法。
第六方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面或第二方面中任一项所述的方法。
本申请实施例提供的分布式定时任务的检测方法、装置及存储介质,通过第一分布式定时任务的检测装置在接收到至少一个第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的至少一个异常日志信息(所述异常日志信息用于指示对应子任务的异常运行信息)后,通过将所述至少一个异常日志信息按照子任务所属任务的不同进行分类得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理,从而使得对应的任务能够正常运行。可见,相对于现有技术中通过运维人员登陆到多台服务器查看每个子任务的运行状态,当发现子任务运行异常时,则抓取日志文件并提供给程序开发人员进行处理的方式;本申请实施例中,通过第一分布式定时任务的检测装置及时将第二分布式定时任务的检测装置所发送的异常日志信息发送给对应的责任终端,以使所述责任终端及时地处理的方式,大大降低了对分布式定时任务的运维工作量,节省了运维成本,且大大提高了运维响应速度。
附图说明
图1为本申请实施例提供的应用场景示意图;
图2为本申请一实施例提供的分布式定时任务的检测方法的流程示意图;
图3为本申请另一实施例提供的分布式定时任务的检测方法的流程示意图;
图4A为本申请另一实施例提供的分布式定时任务的检测方法的流程示意图;
图4B为本申请实施例提供的异常日志信息的分类和发送示意图;
图5为本申请一实施例提供的分布式定时任务的检测装置的结构示意图;
图6为本申请另一实施例提供的分布式定时任务的检测装置的结构示意图;
图7为本申请另一实施例提供的分布式定时任务的检测装置的结构示意图。
具体实施方式
首先,对本申请实施例所涉及的应用场景和部分词汇进行介绍。
图1为本申请实施例提供的应用场景示意图。如图1所示,应用场景示意图中可以包括:第一分布式定时任务的检测装置以及至少一个第二分布式定时任务的检测装置(为了便于描述,图1中以至少一个第二分布式定时任务的检测装置包括第二分布式定时任务的检测装置1和第二分布式定时任务的检测装置2为例进行示出)。当然,本申请实施例提供的应用场景示意图中还可以包括其它装置,本申请实施例中对此并不作限制。
本申请实施例中,通过第一分布式定时任务的检测装置与至少一个第二分布式定时任务的检测装置之间的交互,实现了可以实时地检测到运行于各服务器中各任务的异常运行状态,从而可以及时发送给相应的责任终端,以便于相应的责任终端进行相应的处理。
示例性地,每个第二分布式定时任务的检测装置(例如第二分布式定时任务的检测装置1或第二分布式定时任务的检测装置2)用于定时监测对应的子任务的运行状态,并在监测到所述子任务运行异常时,将采集的所述子任务的异常日志信息发送给第一分布式定时任务的检测装置。
第一分布式定时任务的检测装置用于将接收到的至少一个异常日志信息按照子任务所属任务的不同进行分类,并根据任务与责任终端之间的对应关系,分别将每个任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行相应的处理。
本申请实施例中涉及的第一分布式定时任务的检测装置可以是第一服务器,也可以是第一服务器中的装置。示例性地,第一分布式定时任务的检测装置可以通过软件和/或硬件实现。
本申请实施例中涉及的第二分布式定时任务的检测装置可以是第二服务器,也可以是第二服务器中的装置。示例性地,第二分布式定时任务的检测装置可以通过软件和/或硬件实现。
需要说明的是,本申请实施例中涉及的第一服务器和第二服务器可以是相同的服务器,也可以是不同的服务器。
本申请实施例中涉及的任务可以分片成为多个子任务在多个服务器上同时执行。
本申请实施例中涉及的任意子任务可以运行于服务器上,对应地,用于监测所述子任务的第二分布式定时任务的检测装置也设置于对应的服务器上,以便于监测所述子任务的运行状态。
示例性地,本申请实施例中涉及的任意子任务也可以运行于其它机器上,对应地,第一分布式定时任务的检测装置或第二分布式定时任务的检测装置也可以是其它机器,或者是其它机器中的装置。需要说明的是,为了便于描述,本申请实施例中以服务器为例进行说明。
本申请实施例中涉及的子任务的异常日志信息用于指示所述子任务的异常运行信息。示例性地,所述子任务的异常运行信息,可以包括以下信息中至少一项:所述子任务所属任务的标识信息(用于唯一标识所述子任务所属的任务)、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息(用于唯一标识运行所述子任务的异常服务器);当然,所述子任务的异常运行信息还可以包括其它信息,本申请实施例中对此并不作限制。
本申请实施例中涉及的任务与责任终端之间的对应关系可以包括不同任务与对应的责任终端之间的对应关系。例如,任务与责任终端之间的对应关系可以包括:任务1与责任终端1之间的对应关系、任务2与责任终端2之间的对应关系,以及任务3与责任终端2之间的对应关系。
本申请实施例中涉及的预设发送方式可以包括但不限于:预设发送时间和/或预设发送形式(例如短信形式、即时通讯形式、邮件形式或电话形式等)。
本申请实施例提供的分布式定时任务的检测方法、装置及存储介质,通过第二分布式定时任务的检测装置定时监测对应的子任务的运行状态,当监测到所述子任务运行异常时,及时将采集到的异常日志信息发送给第一分布式定时任务的检测装置;进一步地,第一分布式定时任务的检测装置及时将第二分布式定时任务的检测装置所发送的异常日志信息发送给对应的责任终端,以便于所述责任终端及时地处理使得对应的任务能够正常运行,解决了现有技术中运维工作量较大且运维成本较高的技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请一实施例提供的分布式定时任务的检测方法的流程示意图。本申请实施例对第一分布式定时任务的检测装置侧的实现方式进行介绍。如图2所示,本申请实施例的方法可以包括:
步骤S201、接收至少一个异常日志信息。
本申请实施例中,每个第二分布式定时任务的检测装置定时监测其对应的子任务(即其负责监测的子任务)的运行状态;对于任意第二分布式定时任务的检测装置,当检测到其对应的子任务运行异常时,则采集所述子任务的异常日志信息,并将所述异常日志信息发送给第一分布式定时任务的检测装置。
示例性地,所述子任务的异常运行信息,包括以下信息中至少一项:所述子任务所属任务的标识信息、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息;当然,所述子任务的异常运行信息还可以包括其它信息,本申请实施例中对此并不作限制。
本步骤中,第一分布式定时任务的检测装置可以接收至少一个第二分布式定时任务的检测装置所发送的至少一个异常日志信息;其中,任意第二分布式定时任务的检测装置所发送的异常日志信息为所述第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的所述子任务的异常日志信息,用于指示所述第二分布式定时任务的检测装置所监测的所述子任务的异常运行信息。
一种可能的实现方式中,任意第二分布式定时任务的检测装置所发送的子任务的异常日志信息为所述第二分布式定时任务的检测装置在定时向所述子任务发送心跳消息后的预设时长内未收到所述子任务返回的响应消息时所采集的所述子任务的异常日志信息。
另一种可能的实现方式中,任意第二分布式定时任务的检测装置所发送的子任务的异常日志信息为所述第二分布式定时任务的检测装置在根据至少一个预设异常关键字对所述子任务的日志文件进行定时扫描时,确定所述子任务对应的日志文件中包括预设数量个所述预设异常关键字时所采集的所述子任务的异常日志信息。
示例性地,任意第二分布式定时任务的检测装置可以将所采集的异常日志信息发送到消息队列MQ中,从而第一分布式定时任务的检测装置可以接收消息队列(MessageQueue,MQ)中的至少一个异常日志信息。需要说明的是,位于MQ中的至少一个异常日志信息满足先进先出原则。
当然,第一分布式定时任务的检测装置还可以通过其它方式,接收至少一个异常日志信息,本申请实施例中对此并不作限制。
步骤S202、将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息。
本步骤中,第一分布式定时任务的检测装置将在步骤S201中接收到的所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,以便于进一步将每个任务对应的各异常日志信息一并发给相应的责任终端。
示例性地,第一分布式定时任务的检测装置可以根据每个所述异常日志信息中所包括的子任务所属任务的标识信息(用于唯一标识所述子任务所属的任务),将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息。例如,假设第一分布式定时任务的检测装置接收到子任务1的异常日志信息1(包括但不限于子任务1所属任务1的标识信息1)、子任务2的异常日志信息2(包括但不限于子任务2所属任务2的标识信息2)和子任务3的异常日志信息3(包括但不限于子任务3所属任务1的标识信息1),则第一分布式定时任务的检测装置将子任务1的异常日志信息1、子任务2的异常日志信息2和子任务3的异常日志信息3按照子任务所属任务的不同进行分类,得到任务1对应的异常日志信息(包括子任务1的异常日志信息1和子任务3的异常日志信息3)以及任务2对应的异常日志信息(包括子任务2的异常日志信息2)。
示例性地,若任意任务对应的异常日志信息包括多个子任务的异常日志信息,则第一分布式定时任务的检测装置可以按照各子任务的异常日志信息的异常发生时间先后顺序进行排序。
当然,第一分布式定时任务的检测装置还可以通过其它方式,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,本申请实施例中对此并不作限制。
步骤S203、根据任务与责任终端之间的对应关系,分别将每个任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
本申请实施例中,第一分布式定时任务的检测装置中可以预先设置有任务与责任终端之间的对应关系(可以包括不同任务与对应的责任终端之间的对应关系),以便于确定出每个任务对应的责任终端。
示例性地,第一分布式定时任务的检测装置可以根据所述任务与责任终端之间的对应关系,分别确定步骤S202中所得到的每个任务对应的责任终端;进一步地,第一分布式定时任务的检测装置分别将每个任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理,从而解决所述任务的异常运行问题,使得所述任务能够正常运行。
例如,假设在步骤S202中第一分布式定时任务的检测装置得到任务1对应的异常日志信息和任务2对应的异常日志信息,以及任务与责任终端之间的对应关系可以包括任务1与责任终端1之间的对应关系、任务2与责任终端2之间的对应关系,则在步骤S203中第一分布式定时任务的检测装置可以根据任务与责任终端之间的对应关系,确定出任务1对应的责任终端1以及任务2对应的责任终端2;进一步地,第一分布式定时任务的检测装置将任务1对应的异常日志信息发给责任终端1,以使责任终端1根据任务1对应的异常日志信息进行处理,以及将任务2对应的异常日志信息发给责任终端2,以使责任终端2根据任务2对应的异常日志信息进行处理。
示例性地,若任意任务对应的异常日志信息包括多个子任务的异常日志信息,则第一分布式定时任务的检测装置可以按照各子任务的异常日志信息的异常发生时间先后顺序,依次发给所述任务对应的责任终端。
示例性地,第一分布式定时任务的检测装置可以按照预设发送方式,分别将每个任务对应的异常日志信息发送给所述任务对应的责任终端。可选地,预设发送方式可以包括但不限于:预设发送时间和/或预设发送形式(例如短信形式、即时通讯形式、邮件形式或电话形式等)。
需要说明的是,预设发送方式可以为统一的发送方式(即不同任务或不同责任终端对应的发送方式均相同),或者预设发送方式可以根据不同任务或不同责任终端进行设置。例如,若预设发送方式根据不同任务进行设置,则每个任务对应一种或多种预设发送方式;若预设发送方式根据不同责任终端进行设置,则每个责任终端对应一种或多种预设发送方式。
本申请实施例中,第一分布式定时任务的检测装置在接收到至少一个第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的至少一个异常日志信息(所述异常日志信息用于指示对应子任务的异常运行信息)后,通过将所述至少一个异常日志信息按照子任务所属任务的不同进行分类得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理,从而使得对应的任务能够正常运行。可见,相对于现有技术中通过运维人员登陆到多台服务器查看每个子任务的运行状态,当发现子任务运行异常时,则抓取日志文件并提供给程序开发人员进行处理的方式;本申请实施例中,通过第一分布式定时任务的检测装置及时将第二分布式定时任务的检测装置所发送的异常日志信息发送给对应的责任终端,以使所述责任终端及时地处理的方式,大大降低了对分布式定时任务的运维工作量,节省了运维成本,且大大提高了运维响应速度。
图3为本申请另一实施例提供的分布式定时任务的检测方法的流程示意图。在上述实施例的基础上,本申请实施例对任意第二分布式定时任务的检测装置侧的实现方式进行介绍。如图3所示,本申请实施例的方法可以包括:
步骤S301、定时监测对应的子任务的运行状态。
本步骤中,第二分布式定时任务的检测装置定时监测其所负责监测的子任务的运行状态,以便于当监测到所述子任务运行异常时,及时向第一分布式定时任务的检测装置上报异常日志信息。
本申请下述实施例对第二分布式定时任务的检测装置定时监测对应的子任务的运行状态的可实现方式进行介绍:
在一种可能的实现方式中,第二分布式定时任务的检测装置定时向所述子任务发送心跳消息;若在预设时长内收到所述子任务返回的响应消息,则第二分布式定时任务的检测装置可以确定所述子任务运行正常;若在所述预设时长内未收到所述子任务返回的响应消息,则第二分布式定时任务的检测装置可以确定所述子任务运行异常。
本申请实施例中,通过定义视窗操作系统通讯开发平台(Windows CommunicationFoundation,WCF)的服务契约接口以及回调接口;其中,服务方法主要包括:开始(Start)服务(被监控的程序启动时调用,用于通知第二分布式定时任务的检测装置被监控的程序已启动)、停止(Stop)服务(被监控的程序停止时调用,用于通知第二分布式定时任务的检测装置被监控的程序已停止)、报告运行(ReportRunning)服务(被监控的程序运行中定时调用,用于通知第二分布式定时任务的检测装置被监控的程序在正常运行中,同时还用于检测第二分布式定时任务的检测装置是否在运行)、回调(Listen)服务(用于第二分布式定时任务的检测装置主动定时回调被监控的程序(心跳),如果被监控的程序能正常的返回响应,则确定被监控的程序是正常的,否则确定被监控的程序有可能已经“死了”)。
本实现方式中,通过上述回调服务,第二分布式定时任务的检测装置可以定时向所述子任务(或所述子任务对应的程序)发送心跳消息;若在预设时长内收到所述子任务(或所述子任务对应的程序)返回的响应消息,则第二分布式定时任务的检测装置可以确定所述子任务(或所述子任务对应的程序)运行正常;若在所述预设时长内未收到所述子任务(或所述子任务对应的程序)返回的响应消息,则第二分布式定时任务的检测装置可以确定所述子任务(或所述子任务对应的程序)可能已经“死了”,运行发生了异常。
另一种可能的实现方式中,第二分布式定时任务的检测装置根据至少一个预设异常关键字对所述子任务对应的日志文件进行定时扫描;若所述子任务对应的日志文件中包括预设数量个所述预设异常关键字,则第二分布式定时任务的检测装置可以确定所述子任务运行异常。
本实现方式中,第二分布式定时任务的检测装置中预先设置有至少一个预设异常关键字,第二分布式定时任务的检测装置根据所述至少一个预设异常关键字对其所负责监测的子任务对应的日志文件进行定时扫描;若所述子任务对应的日志文件中包括预设数量(例如至少一个)个所述预设异常关键字,则第二分布式定时任务的检测装置可以获知所述子任务对应的日志文件出现异常,从而可以确定所述子任务运行异常。
需要说明的是,上述两种可能的实现方式可以结合,例如,若在所述预设时长内未收到所述子任务返回的响应消息,则根据至少一个预设异常关键字对所述子任务对应的日志文件进行定时扫描,若所述子任务对应的日志文件中包括预设数量个所述预设异常关键字,则确定所述子任务运行异常。
当然,第二分布式定时任务的检测装置还可以通过其它方式,定时监测对应的子任务的运行状态,本申请实施例中对此并不作限制。
步骤S302、当监测到所述子任务运行异常时,采集所述子任务的异常日志信息。
本步骤中,当监测到所述子任务运行异常时,则第二分布式定时任务的检测装置采集所述子任务的异常日志信息;其中,所述异常日志信息用于指示所述子任务的异常运行信息。
示例性地,所述子任务的异常运行信息,包括以下信息中至少一项:所述子任务所属任务的标识信息、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息;当然,所述子任务的异常运行信息还可以包括其它信息,本申请实施例中对此并不作限制。
需要说明的是,第二分布式定时任务的检测装置采集所述子任务的异常日志信息的方式,可以参考相关技术中采集异常日志信息的方式,本申请实施例中对此并不作限制。
步骤S303、将所述异常日志信息发送给第一分布式定时任务的检测装置,以使所述第一分布式定时任务的检测装置在接收到至少一个异常日志信息后,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
本实施例中,对于任意第二分布式定时任务的检测装置,当其监测到其所负责监测的子任务运行异常时,则采集对应子任务的异常日志信息,并发送给第一分布式定时任务的检测装置。
本步骤中,第二分布式定时任务的检测装置将在步骤S302中所采集的运行异常的子任务的异常日志信息发送给第一分布式定时任务的检测装置,以使所述第一分布式定时任务的检测装置在接收到至少一个第二分布式定时任务的检测装置所发送的至少一个异常日志信息后,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理,从而解决所述任务的异常运行问题,使得所述任务能够正常运行。
示例性地,第二分布式定时任务的检测装置可以将所述异常日志信息发送到消息队列MQ中,以使所述第一分布式定时任务的检测装置从所述MQ中获取所述异常日志信息。
本实施例中,当任意第二分布式定时任务的检测装置向第一分布式定时任务的检测装置发送子任务的异常日志信息时,可以将对应子任务的异常日志信息发送到消息队列MQ中,以便于所述第一分布式定时任务的检测装置从所述MQ中获取至少一个第二分布式定时任务的检测装置所发送的至少一个异常日志信息。需要说明的是,位于MQ中的至少一个异常日志信息满足先进先出原则。
当然,第二分布式定时任务的检测装置还可以通过其它方式,将所述异常日志信息发送给第一分布式定时任务的检测装置,本申请实施例中对此并不作限制。
本申请实施例中,通过第二分布式定时任务的检测装置定时监测对应的子任务的运行状态;当监测到所述子任务运行异常时,第二分布式定时任务的检测装置采集所述子任务的异常日志信息;进一步地,第二分布式定时任务的检测装置将所述异常日志信息发送给第一分布式定时任务的检测装置,以使所述第一分布式定时任务的检测装置在接收到至少一个异常日志信息后,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理,从而使得对应的任务能够正常运行。可见,相对于现有技术中通过运维人员登陆到多台服务器查看每个子任务的运行状态,当发现子任务运行异常时,则抓取日志文件并提供给程序开发人员进行处理的方式;本申请实施例中,通过第二分布式定时任务的检测装置及时发现异常运行的任务、及时将所述任务的异常日志信息发送给第一分布式定时任务的检测装置,以及第一分布式定时任务的检测装置及时将第二分布式定时任务的检测装置所发送的异常日志信息发送给对应的责任终端,以使所述责任终端及时地处理的方式,大大降低了对分布式定时任务的运维工作量,节省了运维成本,且大大提高了运维响应速度。
本申请另一实施例提供的分布式定时任务的检测方法中,在上述实施例的基础上,结合第一分布式定时任务的检测装置侧以及至少一个第二分布式定时任务的检测装置侧对本实施例提供的分布式定时任务的检测方法进行介绍。图4A为本申请另一实施例提供的分布式定时任务的检测方法的流程示意图,结合图4A所示,在上述实施例的基础上,本申请实施例提供的分布式定时任务的检测方法可以包括:
1)、每个第二分布式定时任务的检测装置分别定时监测对应的子任务的运行状态。
2)、对于任意第二分布式定时任务的检测装置,当监测到其对应的子任务运行异常时,则采集所述子任务的异常日志信息,并将所述异常日志信息发送到消息队列MQ中。
例如,如图4A所示,对于负责监测子任务A的第二分布式定时任务的检测装置,当其监测到子任务A运行异常时,则采集子任务A的异常日志信息,并将子任务A的异常日志信息发送到消息队列MQ中。
3)、第一分布式定时任务的检测装置可以接收消息队列MQ中的至少一个异常日志信息。
4)、第一分布式定时任务的检测装置将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息。
5)、第一分布式定时任务的检测装置根据任务与责任终端之间的对应关系,分别将每个任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
图4B为本申请实施例提供的异常日志信息的分类和发送示意图,如图4B所示,假设第一分布式定时任务的检测装置中预设有不同任务与责任终端和预设发送方式之间的对应关系(例如,图4B中任务1与责任终端1和微信形式之间的对应关系、任务2与责任终端2和微信形式之间的对应关系)、第一分布式定时任务的检测装置接收到的至少一个异常日志信息可以包括:任务1对应的异常日志信息(例如图4B中的子任务1的异常日志信息1、子任务2的异常日志信息2和子任务3的异常日志信息3)和任务2对应的异常日志信息(例如图4B中的子任务4的异常日志信息4和子任务5的异常日志信息5)。其中,每个异常日志信息中可以包括:子任务所属任务的标识信息、异常发生时间、用于运行所述子任务的异常服务器信息(用于唯一标识异常服务器的信息,例如异常服务器的网络之间互连的协议(InternetProtocol,IP))。
第一分布式定时任务的检测装置可以将接收到的至少一个异常日志信息按照子任务所属任务的不同进行分类,得到任务1对应的异常日志信息(例如图4B中的子任务1的异常日志信息1、子任务2的异常日志信息2和子任务3的异常日志信息3),以及任务2对应的异常日志信息(例如图4B中的子任务4的异常日志信息4和子任务5的异常日志信息5)。进一步地,第一分布式定时任务的检测装置根据不同任务与责任终端和预设发送方式之间的对应关系,分别按照对应的预设发送方式将每个任务对应的异常日志信息发送给所述任务对应的责任终端(例如,按照微信形式将任务1对应的异常日志信息发送给责任终端1,以及按照微信形式将任务2对应的异常日志信息发送给责任终端2),以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理,从而解决所述任务的异常运行问题,使得所述任务能够正常运行。
综上所述,本申请实施例中,通过第二分布式定时任务的检测装置定时监测对应的子任务的运行状态,当监测到所述子任务运行异常时,及时将采集到的异常日志信息发送给第一分布式定时任务的检测装置;进一步地,第一分布式定时任务的检测装置及时将第二分布式定时任务的检测装置所发送的异常日志信息发送给对应的责任终端,以便于所述责任终端及时地处理使得对应的任务能够正常运行,大大降低了对分布式定时任务的运维工作量,节省了运维成本,且大大提高了运维响应速度。
图5为本申请一实施例提供的分布式定时任务的检测装置的结构示意图。可选地,本申请实施例提供的分布式定时任务的检测装置可以为第一分布式定时任务的检测装置。如图5所示,本申请实施例提供的第一分布式定时任务的检测装置50可以包括:接收模块501、分类模块502以及发送模块503。
其中,接收模块501,用于接收至少一个异常日志信息;其中,所述至少一个异常日志信息为至少一个第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的所述子任务的异常日志信息;所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
分类模块502,用于将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息;
发送模块503,用于根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
在一种可能的实现方式中,所述分类模块502具体用于:
根据每个所述异常日志信息中包含的对应子任务所属任务的标识信息,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息。
在一种可能的实现方式中,所述发送模块503包括:
确定单元,用于根据所述任务与责任终端之间的对应关系,分别确定每个所述任务对应的责任终端;
发送单元,用于分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端。
在一种可能的实现方式中,所述接收模块501具体用于:
接收消息队列MQ中的至少一个异常日志信息。
在一种可能的实现方式中,任意所述子任务的异常日志信息为对应的所述第二分布式定时任务的检测装置在定时向所述子任务发送心跳消息后的预设时长内未收到所述子任务返回的响应消息时所采集的所述子任务的异常日志信息。
在一种可能的实现方式中,任意所述子任务的异常日志信息为对应的所述第二分布式定时任务的检测装置在根据至少一个预设异常关键字对所述子任务的日志文件进行定时扫描时,确定所述子任务对应的日志文件中包括预设数量个所述预设异常关键字时所采集的所述子任务的异常日志信息。
在一种可能的实现方式中,所述子任务的异常运行信息,包括以下信息中至少一项:所述子任务所属任务的标识信息、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息。
本实施例提供的第一分布式定时任务的检测装置,可以用于执行本申请上述分布式定时任务的检测装置方法实施例中关于第一分布式定时任务的检测装置的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本申请另一实施例提供的分布式定时任务的检测装置的结构示意图。可选地,本申请实施例提供的分布式定时任务的检测装置可以为第二分布式定时任务的检测装置。如图6所示,本申请实施例提供的第二分布式定时任务的检测装置60可以包括:监测模块601、采集模块602以及发送模块603。
其中,监测模块601,用于定时监测对应的子任务的运行状态;
采集模块602,用于当监测到所述子任务运行异常时,采集所述子任务的异常日志信息;其中,所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
发送模块603,用于将所述异常日志信息发送给第一分布式定时任务的检测装置,以使所述第一分布式定时任务的检测装置在接收到至少一个异常日志信息后,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,并根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
在一种可能的实现方式中,所述监测模块601包括:
发送单元,用于定时向所述子任务发送心跳消息;
第一确定单元,用于若在预设时长内收到所述子任务返回的响应消息,则确定所述子任务运行正常;若在所述预设时长内未收到所述子任务返回的响应消息,则确定所述子任务运行异常。
在一种可能的实现方式中,所述监测模块601包括:
扫描单元,用于根据至少一个预设异常关键字对所述子任务对应的日志文件进行定时扫描;
第二确定单元,用于若所述子任务对应的日志文件中包括预设数量个所述预设异常关键字,则确定所述子任务运行异常。
在一种可能的实现方式中,所述发送模块603具体用于:
将所述异常日志信息发送到消息队列MQ中,以使所述第一分布式定时任务的检测装置从所述MQ中获取所述异常日志信息。
在一种可能的实现方式中,所述子任务的异常运行信息,包括以下信息中至少一项:所述子任务所属任务的标识信息、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息。
本实施例提供的第二分布式定时任务的检测装置,可以用于执行本申请上述分布式定时任务的检测装置方法实施例中关于第二分布式定时任务的检测装置的技术方案,其实现原理和技术效果类似,此处不再赘述。
图7为本申请另一实施例提供的分布式定时任务的检测装置的结构示意图。如图7所示,本申请实施例提供的分布式定时任务的检测装置70可以包括:处理器701以及存储器702。可选地,分布式定时任务的检测装置70还可以包括收发器703,所述收发器703用于和其他设备通信。
其中,所述存储器702,用于存储所述处理器701的可执行指令;所述处理器703配置为经由执行所述可执行指令来执行本申请上述分布式定时任务的检测装置方法实施例中关于第一分布式定时任务的检测装置或第二分布式定时任务的检测装置的技术方案,其实现原理和技术效果类似,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请上述分布式定时任务的检测装置方法实施例中关于第一分布式定时任务的检测装置或第二分布式定时任务的检测装置的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:只读内存(Read-OnlyMemory,简称:ROM)、随机存取存储器(Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种分布式定时任务的检测方法,其特征在于,所述方法应用于第一分布式定时任务的检测装置,所述方法包括:
接收至少一个异常日志信息;其中,所述至少一个异常日志信息为至少一个第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的所述子任务的异常日志信息;所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息;
根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
2.根据权利要求1所述的方法,其特征在于,所述将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息,包括:
根据每个所述异常日志信息中包含的对应子任务所属任务的标识信息,将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息。
3.根据权利要求1所述的方法,其特征在于,所述根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,包括:
根据所述任务与责任终端之间的对应关系,分别确定每个所述任务对应的责任终端;
分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述接收至少一个异常日志信息,包括:
接收消息队列MQ中的所述至少一个异常日志信息。
5.根据权利要求1-3中任一项所述的方法,其特征在于,任意所述子任务的异常日志信息为对应的所述第二分布式定时任务的检测装置在定时向所述子任务发送心跳消息后的预设时长内未收到所述子任务返回的响应消息时所采集的所述子任务的异常日志信息。
6.根据权利要求1-3中任一项所述的方法,其特征在于,任意所述子任务的异常日志信息为对应的所述第二分布式定时任务的检测装置在根据至少一个预设异常关键字对所述子任务的日志文件进行定时扫描时,确定所述子任务对应的日志文件中包括预设数量个所述预设异常关键字时所采集的所述子任务的异常日志信息。
7.根据权利要求1-3中任一项所述的方法,其特征在于,所述子任务的异常运行信息,包括以下信息中至少一项:所述子任务所属任务的标识信息、异常日志内容、异常发生时间、用于运行所述子任务的异常服务器信息。
8.一种分布式定时任务的检测装置,其特征在于,所述分布式定时任务的检测装置为第一分布式定时任务的检测装置,所述装置包括:
接收模块,用于接收至少一个异常日志信息;其中,所述至少一个异常日志信息为至少一个第二分布式定时任务的检测装置在监测到对应的子任务运行异常时所采集的所述子任务的异常日志信息;所述子任务的异常日志信息用于指示所述子任务的异常运行信息;
分类模块,用于将所述至少一个异常日志信息按照子任务所属任务的不同进行分类,得到至少一个任务对应的异常日志信息;
发送模块,用于根据任务与责任终端之间的对应关系,分别将每个所述任务对应的异常日志信息发送给所述任务对应的责任终端,以使所述任务对应的责任终端根据所述任务对应的异常日志信息进行处理。
9.一种分布式定时任务的检测装置,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。
CN201910509875.7A 2019-06-13 2019-06-13 分布式定时任务的检测方法、装置及存储介质 Active CN110231998B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910509875.7A CN110231998B (zh) 2019-06-13 2019-06-13 分布式定时任务的检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910509875.7A CN110231998B (zh) 2019-06-13 2019-06-13 分布式定时任务的检测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110231998A true CN110231998A (zh) 2019-09-13
CN110231998B CN110231998B (zh) 2021-07-20

Family

ID=67859084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910509875.7A Active CN110231998B (zh) 2019-06-13 2019-06-13 分布式定时任务的检测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110231998B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274091A (zh) * 2020-01-17 2020-06-12 北京达佳互联信息技术有限公司 日志的处理方法、装置、计算机设备和存储介质
CN114553578A (zh) * 2022-02-28 2022-05-27 苏州浪潮智能科技有限公司 一种消息队列异常检测方法、装置、电子设备及存储介质
CN115168137A (zh) * 2022-06-17 2022-10-11 北京结慧科技有限公司 针对定时任务的监控方法及系统、计算机设备及存储介质
CN115357689A (zh) * 2022-10-18 2022-11-18 盛业信息科技服务(深圳)有限公司 分布式日志的数据处理方法、装置、介质及计算机设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616205A (zh) * 2014-11-24 2015-05-13 北京科东电力控制系统有限责任公司 一种基于分布式日志分析的电力系统运行状态监视方法
CN105207806A (zh) * 2015-08-20 2015-12-30 百度在线网络技术(北京)有限公司 分布式服务的监控方法及装置
CN106681930A (zh) * 2017-01-23 2017-05-17 北京思特奇信息技术股份有限公司 分布式自动检测应用运行异常方法及系统
CN106992886A (zh) * 2017-04-05 2017-07-28 国家电网公司 一种基于分布式存储的日志分析方法及装置
CN107066519A (zh) * 2017-02-13 2017-08-18 阿里巴巴集团控股有限公司 一种任务检测方法及装置
CN108710537A (zh) * 2018-04-09 2018-10-26 平安科技(深圳)有限公司 一种任务处理方法、存储介质和服务器
CN109088782A (zh) * 2018-11-01 2018-12-25 郑州云海信息技术有限公司 分布式系统的日志收集方法及装置
CN109766323A (zh) * 2018-12-17 2019-05-17 深圳壹账通智能科技有限公司 贷款交易全链路监控方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616205A (zh) * 2014-11-24 2015-05-13 北京科东电力控制系统有限责任公司 一种基于分布式日志分析的电力系统运行状态监视方法
CN105207806A (zh) * 2015-08-20 2015-12-30 百度在线网络技术(北京)有限公司 分布式服务的监控方法及装置
CN106681930A (zh) * 2017-01-23 2017-05-17 北京思特奇信息技术股份有限公司 分布式自动检测应用运行异常方法及系统
CN107066519A (zh) * 2017-02-13 2017-08-18 阿里巴巴集团控股有限公司 一种任务检测方法及装置
CN106992886A (zh) * 2017-04-05 2017-07-28 国家电网公司 一种基于分布式存储的日志分析方法及装置
CN108710537A (zh) * 2018-04-09 2018-10-26 平安科技(深圳)有限公司 一种任务处理方法、存储介质和服务器
CN109088782A (zh) * 2018-11-01 2018-12-25 郑州云海信息技术有限公司 分布式系统的日志收集方法及装置
CN109766323A (zh) * 2018-12-17 2019-05-17 深圳壹账通智能科技有限公司 贷款交易全链路监控方法、装置、计算机设备和存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274091A (zh) * 2020-01-17 2020-06-12 北京达佳互联信息技术有限公司 日志的处理方法、装置、计算机设备和存储介质
CN111274091B (zh) * 2020-01-17 2024-01-09 北京达佳互联信息技术有限公司 日志的处理方法、装置、计算机设备和存储介质
CN114553578A (zh) * 2022-02-28 2022-05-27 苏州浪潮智能科技有限公司 一种消息队列异常检测方法、装置、电子设备及存储介质
CN114553578B (zh) * 2022-02-28 2023-08-11 苏州浪潮智能科技有限公司 一种消息队列异常检测方法、装置、电子设备及存储介质
CN115168137A (zh) * 2022-06-17 2022-10-11 北京结慧科技有限公司 针对定时任务的监控方法及系统、计算机设备及存储介质
CN115357689A (zh) * 2022-10-18 2022-11-18 盛业信息科技服务(深圳)有限公司 分布式日志的数据处理方法、装置、介质及计算机设备
CN115357689B (zh) * 2022-10-18 2023-02-17 盛业信息科技服务(深圳)有限公司 分布式日志的数据处理方法、装置、介质及计算机设备

Also Published As

Publication number Publication date
CN110231998B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN110231998A (zh) 分布式定时任务的检测方法、装置及存储介质
US10915382B2 (en) Event-driven serverless function orchestration
US10878355B2 (en) Systems and methods for incident queue assignment and prioritization
US9256412B2 (en) Scheduled and quarantined software deployment based on dependency analysis
EP1863258B1 (en) System and method for managing web services
CN104579905B (zh) 消息传递方法和系统及mom服务器、接收端
US10454795B1 (en) Intermediate batch service for serverless computing environment metrics
US9229794B1 (en) Signaling service interface module
CN110083439B (zh) 分布式事务系统
CN110392106A (zh) 一种作业状态的推送方法及装置
CN103577251A (zh) 基于事件的互联网计算处理系统及方法
CN113452607A (zh) 分布式链路采集的方法、装置、计算设备和存储介质
CN113672934A (zh) 一种安全漏洞扫描系统及方法、终端、存储介质
CN109558239A (zh) 一种任务调度方法、装置、系统、计算机设备和存储介质
CN106293911A (zh) 分布式调度系统、方法
CN107729213A (zh) 一种后台任务监控方法及装置
CN111210340A (zh) 一种自动任务处理方法、装置、服务器及存储介质
CN112783629A (zh) 服务调用方法、装置、电子设备及存储介质
CN115951923B (zh) 订阅事件管理方法、显示系统、设备和存储介质
CN111628903A (zh) 交易系统运行状态的监控方法及监控系统
US20140173012A1 (en) System and method for managing email send jobs
US11650892B1 (en) Resilient coordination, command, and control of widely distributed test agents
CN115373886A (zh) 服务群组容器停机方法、装置、计算机设备和存储介质
CN114816477A (zh) 服务器升级方法、装置、设备、介质和程序产品
CN112445597A (zh) 定时任务调度方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant