CN113419921A - 一种任务监控方法、装置、设备以及存储介质 - Google Patents

一种任务监控方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113419921A
CN113419921A CN202110739487.5A CN202110739487A CN113419921A CN 113419921 A CN113419921 A CN 113419921A CN 202110739487 A CN202110739487 A CN 202110739487A CN 113419921 A CN113419921 A CN 113419921A
Authority
CN
China
Prior art keywords
alarm
task
target task
alarmed
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110739487.5A
Other languages
English (en)
Other versions
CN113419921B (zh
Inventor
刘丰玮
贾堃
封磊
廖伟达
巴铁凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110739487.5A priority Critical patent/CN113419921B/zh
Publication of CN113419921A publication Critical patent/CN113419921A/zh
Application granted granted Critical
Publication of CN113419921B publication Critical patent/CN113419921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Alarm Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开公开了一种任务监控方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及项目开发中的任务监控报警领域。具体实现方案为:从预先记录的多个任务中,确定待监控的各个目标任务;按照并发监控的方式,监控各个目标任务的运行信息;针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;利用为所述待报警的目标任务所设定报警配置信息,针对所述待报警的目标任务进行报警。

Description

一种任务监控方法、装置、设备以及存储介质
技术领域
本公开涉及计算机技术技术领域,尤其涉及项目开发中的任务监控报警领域。
背景技术
业务方在通过任务调度平台进行任务调度时,通常会出现调度失败、调度异常或调度超时等问题,因此,通常通过监控平台,对任务调度平台中的任务进行监控,以对符合报警条件的任务进行报警。
当前,业务方具有多样化的任务监控需求且对任务监控的效率要求较高。
发明内容
本公开提供了一种任务监控方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种任务监控方法,所述方法包括:
从预先记录的多个任务中,确定待监控的各个目标任务;
按照并发监控的方式,监控各个目标任务的运行信息;
针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;
利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
根据本公开的另一方面,提供了一种任务监控装置,包括:
确定模块,用于从预先记录的多个任务中,确定待监控的各个目标任务;
监控模块,用于按照并发监控的方式,监控各个目标任务的运行信息;
判断模块,用于针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;
报警模块,用于利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的任务监控方法的步骤。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述的任务监控方法的步骤。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述的任务监控方法的步骤。
本公开提供方案中,在确定出待监控的各个目标任务后,按照并发监控的方式,监控各个目标任务的运行信息,可以保证较高的监控效率;并且,在识别目标任务是否为待报警的目标任务时,基于为目标任务设定的报警条件,以及在针对待报警的目标任务进行报警时,依据为待报警的目标任务所设定的报警配置信息,这样能够保证对于各个目标任务的处理,依赖于相对应的任务监控需求。可见,通过本方案,可以兼顾业务方的任务监控需求和监控效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开一种任务监控方法的流程图;
图2是根据本公开的一种任务监控方法的另一流程图;;
图3是根据本公开一种任务监控方法的另一流程图;
图4是根据本公开一种任务监控方法的采用redis进行主从互备的示意图;
图5是根据本公开的任务监控方法的一种流程图;
图6是根据本公开一种任务监控装置的一种结构示意图;
图7是用来实现本公开实施例的任务监控方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
相关技术中,监控报警是项目服务必不可少的一部分,起到关键性的作用。当前厂内定时调度任务的业务处理模式比较常见,但是不同的任务调度平台的报警机制参差不齐,且大部分任务调度平台的报警机制存在功能缺失,导致经常出现任务失败、超时等问题不能及时发现,从而影响线上服务,带来不必要的损失。而针对任务调度平台的监控,现有监控平台采用串行分析任务的方式来进行任务监控,导致存在监控效率较低,不及时的问题。并且,不同的业务方有不同的任务监控需求,现有监控平台的报警维度较少以及配置灵活性较差,导致无法满足业务方的多样化的任务监控需求。例如:关键性任务报警要求更及时,频率更高,非关键性任务可以有一定的报警延迟,失败包容性更高;又如,根据不同的业务场景,报警模式存在多样性,即报警时采用电话、邮件还是指定通讯客户端,也有不同的要求;又如,多数任务需要定期有报表展示失败率,用于服务优化以及隐患问题查找。
基于上述内容,为了兼顾业务方的任务监控需求和监控效率,本公开实施例提供了一种任务监控方法、装置、设备以及存储介质。
下面首先对本公开实施例所提供的一种任务监控方法进行介绍。
本公开实施例所提供的一种任务监控方法可以应用于电子设备。在具体应用中,该电子设备可以为服务器,也可以为终端设备,这都是合理的。具体而言,实现该任务监控方法的功能软件可以为监控平台,该监控平台可以为专门的任务监控软件,或者,嵌入到现有项目服务软件中的任务监控插件。其中,该监控平台可以为结合多方业务需求,重新搭建的一个通用任务监控软件,并且,该监控平台的实现语言可以包括但不局限于Golang(Go又称Golang,是Google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的编程语言)。
并且,监控平台可以从逻辑上拆分为UI(user interface,用户界面)层和监控层,该监控层也称为后端服务(server)层。其中,UI层解决可视化界面问题,让用户方便的管理各个任务,通过表单进行任务配置,简单方便无需开发。监控层解决不同业务的任务报警需求,快速,可靠,准确的进行任务报警。而监控层主要用户功能模块具体实现,完成监控报警的核心功能。基于UI层和监控层的设计,也就是,采用平台整体搭建分层级组合设计的模式,能够带来如下好处:通过合理的架构设计和代码切割,便于后续新增需求减少代码改动,降低维护成本。并且,本方案采用UI层和监控层的设计,也是基于如下考虑:监控平台本身的稳定性,高效性,准确性也是重中之重,后续需求的新增与扩展也需要考虑进来,这就代表整体服务代码需要进行系统的模块化设计,合理的封装才能快速响应新需求。
可以理解的是,为了实现任务监控,监控平台可以与任务调度平台相通信,从而对任务调度平台所调度的各个任务进行监控,示例性的,监控平台通过任务调度平台所提供的调度接口可以与任务调度平台相通信。而任务调度平台可以与业务方的服务器相通信,从而针对业务方进行任务调度。其中,业务方可以为存在任务调度需求和任务监控需求的厂商、企业、团队等。示例性的,信息搜索客户端所属厂商的研发人员在任务调度平台中配置各种任务,例如:数据上传、数据展示、数据统计等,相应的,任务调度平台访问业务方的服务器以执行各个任务,从而监控平台可以对任务调度平台的任务执行过程进行监控。
另外,考虑到监控平台与任务调度平台的通信方式以及监控平台所能够提供的服务,该监控平台也可以分为功能接口模块和监控报警模块两部分。其中,功能接口模块为了配合前端UI层和业务调度使用,提供了一系列功能接口,用于进行监控任务查询,创建,更新,删除,报表计算,报警处理等功能,便于UI层展示数据,用户自助操作以及修改报警任务。而监控报警模块为定时自动监控报警任务,数据信息统计收集过滤,异常任务触发报警等功能,采用并发和管道等多种技术手段,达到高效快速处理报警任务,准确稳定的进行报警。
其中,本公开实施例所提供的一种任务监控方法,可以包括如下步骤:
从预先记录的多个任务中,确定待监控的各个目标任务;
按照并发监控的方式,监控各个目标任务的运行信息;
针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;
利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
本公开提供方案中,在确定出待监控的各个目标任务后,按照并发监控的方式,监控各个目标任务的运行信息,可以保证较高的监控效率;并且,在识别目标任务是否为待报警的目标任务时,基于为目标任务设定的报警条件,以及在针对待报警的目标任务进行报警时,依据为待报警的目标任务所设定的报警配置信息,这样能够保证对于各个目标任务的处理,依赖于相对应的任务监控需求。可见,通过本方案,可以兼顾业务方的任务监控需求和监控效率。
下面结合附图,对本公开实施例所提供的任务监控方法进行介绍。
如图1所示,本公开实施例所提供的一种任务监控方法,可以包括如下步骤:
S101,从预先记录的多个任务中,确定待监控的各个目标任务;
监控平台中预先记录有多个任务,在检测到多个任务中的至少一个任务达到监控触发时机时,可以将该至少一个任务均确定为待监控的目标任务。
本实施例中,监控平台可以定时方式或不定时方式,从预先记录的多个任务中,确定待监控的各个目标任务。示例性,每一任务可以对应有用于判定是否进行监控的监控触发条件,从而保证与任务监控需求相匹配;那么,监控平台可以从预先记录的多个任务中,查询满足所对应监控触发条件的任务;将查询到的满足所对应监控触发条件的各个任务,确定为待监控的各个目标任务。另外,为了方便理解监控触发条件,对监控触发条件进行示例性说明:针对任务A而言,任务A启动时,需要进行监控,则监控触发条件可以为任务A发生启动;或者,针对任务B而言,在任务B启动后,需要对任务B进行周期性监控,则监控触发条件可以为在进入到每一预定周期。
并且,本实施例中,监控平台中预先记录的多个任务可以是预先存储在监控平台对应的数据库中的定时任务,也可以是预先存储在平台对应的数据库中的临时任务。
另外,监控平台中预先记录的多个任务可以是业务方通过监控平台所提供的配置界面所配置的。示例性的,针对每一任务,业务方可以通过监控平台提供的配置界面,配置该任务的标识信息、监控触发条件等等,从而实现对于该任务的配置。本公开实施例对于配置界面的具体形式不做限定。可以理解的是,不同的任务的监控触发条件可以相同或不同,本公开对此不做限定。
S102,按照并发监控的方式,监控各个目标任务的运行信息;
为了保证任务监控具有较高的监控效率,监控平台在确定出各个目标任务后,可以按照并发监控的方式,对各个目标任务的运行过程进行监控,从而得到各个目标任务的运行信息,即得到各个目标任务的作业状态。
其中,所谓并发监控的方式具体指:同步启动对于多个目标任务的监控的方式,相对于串行监控,并发监控的监控效率可以大大提升。示例性的,监控平台可以通过多个线程或协程来实现并发监控的方式,当然并不局限于此。可以理解的是,线程是进程的一个实体,是CPU(Central Processing Unit,中央处理器)调度和分派的基本单位,它是比进程更小的能独立运行的基本单位;而协程是一种用户态的轻量级线程,协程的调度完全由用户控制,协程拥有自己的寄存器上下文和栈。
并且,任一目标任务的运行信息为识别该目标任务是否需要报警时所依赖的信息,示例性的,任一目标任务的运行信息可以为该任务的运行状态、运行时间等等,运行状态可以包括但不局限于此:运行失败、运行异常、运行成功。
S103,针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务。
在按照并发监控的方式监控各个目标任务的运行信息后,可以对各个目标任务进行判断,以识别各个目标任务是否为待报警的目标任务。
其中,报警条件的具体内容与运行信息相关,这样,针对每一目标任务,监控平台可以基于该目标任务的运行信息,来判断该目标任务是否满足报警条件,从而识别到该目标任务是否为待报警的目标任务。示例性的,若运行信息为运行状态,则报警条件的具体内容可以为:任务的运行状态为指定运行状态,该指定运行状态可以为运行失败或运行异常;若运行信息为运行时间,则报警条件的具体内容可以为任务的运行时间超过预定时长。
可以理解的是,由于不同的目标任务有不同的任务报警需求,例如:关键性任务报警要求更及时,频率更高,非关键性作业可以有一定的报警延迟,失败包容性更高,因此,针对每一目标任务,可以为该目标任务设置个性化的报警条件。例如,针对一个目标任务,可以设置例行失败时报警,也可以设置例行超时时报警,该例行超时的设定时长可以是根据目标任务个性化设定的时长。
另外,每一任务的报警条件可以是业务方根据该任务的个性化需求,通过监控平台所提供的配置界面所配置的。
S104,利用为待报警的目标任务所设定的报警配置信息,针对待报警的目标任务进行报警。
为了针对任一需要报警的任务进行有效报警,业务方可以预先为每一任务设定报警配置信息,该报警配置信息是报警时所依据的信息。这样,在监控平台确定出待报警的目标任务后,可以利用为待报警的目标任务所设定的报警配置信息,针对待报警的目标任务进行报警。其中,业务方可以通过监控平台所提供的配置界面来配置每一任务的报警配置信息。
其中,报警配置信息可以包括:各个报警模式,以及每一报警模式下的通讯标识;相应的,利用为待报警的目标任务所设定的报警配置信息,针对待报警的目标任务进行报警,可以包括:
按照为待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对待报警的目标任务的报警信息。
其中,报警信息能够表征出所针对的待报警的目标任务,以及待报警的目标任务当前存在的问题。本公开实施例,对于报警信息的具体信息内容不做限定。
示例性的,所述报警模式可以为电话、邮件或属于即时通讯软件的指定客户端等,该指定客户端可以为任一厂商的客户端。而通讯标识可以为电话号码、邮箱地址和指定客户端的用户账号等。例如,若待报警的目标任务的报警模式为电话报警,则向该报警模式下的通讯标识,即电话号码,发送针对所述待报警的目标任务的报警信息。当然,根据不同的业务场景,报警采用电话,指定客户端还是邮件也有不同的要求,所以报警模式存在多样性,可以为业务方提供灵活的选择。
可选地,若各个报警模式中包括向指定客户端发送报警信息的模式,则通讯标识可以为指定客户端中预定机器人助手的令牌token。其中,该预定机器人助手的令牌token为预先通过配置界面配置于监控平台中。也就是,该指定客户端中的每个机器人助手的token(用于数据传输过程中的加密和解密),被写入到监控平台中,这样,任务报警时可以通过预先配置的固定的token传输消息。其中,机器人助手可以为群组中的助手,这样,机器人助手可以将报警信息分发至所属的工作群中。
由于该客户端可以支持业务方自己设置机器人助手,业务方可以预先通过配置界面配置出多个token,这样可以使得可接收报警信息的机器人助手的数量不受限制。
本公开提供方案中,在确定出待监控的各个目标任务后,按照并发监控的方式,监控各个目标任务的运行信息,可以保证较高的监控效率;并且,在识别目标任务是否为待报警的目标任务时,基于为目标任务设定的报警条件,以及在针对待报警的目标任务进行报警时,依据为待报警的目标任务所设定的报警配置信息,这样能够保证对于各个目标任务的处理,依赖于相对应的任务监控需求。可见,通过本方案,可以兼顾业务方的任务监控需求和监控效率。
另外,本方案中,基于任务调度平台的更新,监控平台访问任务调度平台的接口可以及时更新,从而可以保证有效访问。并且,监控平台可以同时对应多个任务调度平台,在任务调度平台发生更新时,仅仅需要更改监控平台的接口即可,相对于每个任务调度平台对应各自的报警工具时所存在的较高的维护成本而言,可以大大降低维护成本。其中,相关技术中,每个任务调度平台对应各自的报警工具时所存在的维护成本较高,具体指:不同业务方实现自己的报警脚本,各自维护,消耗的人力成本,资源成本都是成倍的,报警需求接入,都存在不便利性,有新需求点改动难,一旦对应调度平台改动,所有对应的报警工具都需要调整,后续维护成本高。
并且,相关技术中,不同的业务方考量的场景不同,多数只能针对自己的业务进行任务监控脚本的开发,功能无法达到通用,无法实现平台化,开发语言也各有不同,功能也存在各种缺陷(例如:开发难度较高导致的功能缺陷),如存在错报,误报,漏报等问题,导致线上问题发现不及时等。本方案所提供的监控平台,提供了通用监控功能,适用于各种业务方的监控需求,无需业务方的开发人员进行难度较高的开发工作,降低监控功能的缺陷;并且,根据业务方的实际需求来进行监控配置,使得监控功能满足业务方的需求;同时,本方案的监控平台可以不用关心任务调度平台的实现语言,实现代码等,只需要配置相应的调度接口即可。
可选地,在本公开的另一实施例中,报警配置信息还可以包括报警辅助信息;其中,报警辅助信息包括报警频率、报警时间和报警后的处理模式中的一种或多种。那么,按照为待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对待报警的目标任务的报警信息,可以包括:
基于报警辅助信息,按照为待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对待报警的目标任务的报警信息。
其中,报警后的处理模式可以包括但不局限于:在发送报警信息后,将待报警的目标任务标记为已报警任务,以停止对该待报警的任务的报警处理;或者,在预定时长内周期性向通讯标识发送针对待报警的目标任务的提醒信息;或者,在发送报警信息若接收到回复信息,则基于回复信息停止报警或延迟报警。
在具体应用中,根据不同的业务场景,报警的频率,报警发送的模式,报警可达的用户,报警处理的模式,都是全部可自由组合的。可见,本公开可以提供定制化报警组合设计模式。这也就意味这整体服务要更加通用,用户可根据自己的需求定制化配置,到达自身的需求。
本实施例中,报警配置信息中还可以根据需求个性化的配置报警辅助信息,不同的任务可以根据业务方需求,灵活的配置报警频率、报警时间和报警后的处理模式中的一种或多种辅助信息。
可选地,在本公开的另一实施例中,该任务监控方法可以采用Pipeline模式和Actor模型相结合的方式来实现,从而大大提升监控效率。其中,Pipeline模式为管道模式,也称为流水线模式,通过预先设定好的一系列的阶段来处理输入的数据,每个阶段的输出即是下一个阶段的输入;而Actor模型是处理并行计算的概念模型,针对并行计算中的任一计算过程均需要创建单独的Actor角色。
下面以协程实现为例,对基于Pipeline模式和Actor模型相结合的方式的任务监控方法进行介绍。
如图2所示,本公开所提供的一种任务监控方法可以包括如下步骤:
S201,主协程从预先记录的多个任务中,确定待监控的各个目标任务;
S202,协程池中的每个处理协程,按照并发监控的方式,监控各个目标任务的运行信息;其中,每一处理协程在每一时间点所监控的目标任务为一个;
S203,每个处理协程基于所监控的目标任务的运行信息和为所监控的目标任务所设定的报警条件,识别所监控的目标任务是否为待报警的目标任务;
S204,报警协程利用为待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
其中,主协程、报警协程是属于协程池以外的协程,协程池所包含的处理协程是指用于对目标任务进行监控的协程,其中,通过协程池来容纳多个处理协程,可以方便对多个处理协程进行调度与管理。
本实施例中,通过主协程、处理协程和报警协程分别执行任务监控方法中各个步骤,即对应不同的处理阶段,其中,主协程所确定出目标任务,作为处理协程的输入内容,而处理协程所确定出的待报警的目标任务作为报警协程的输入内容。这样,任务监控方法便采用了Pipeline模式,从而进一步保证任务监控的监控效率;同时,协程池中的各个处理协程在每一时间点所监控的目标任务为一个,这样,每个处理协程均属于Actor模型中的Actor角色。
并且,处理协程确定出的待报警的目标任务可以放置于报警任务队列,从而报警协程可以从报警任务队列中选择待报警的目标任务进行处理,达到报警服务端并发+队列模式的分离设计,保证进一步提升监控效率。
另外,在需要利用协程池中的处理协程对各个目标任务进行处理时,协程池中的空闲的处理协程的数量可以与目标任务的数量相同,也可以与目标任务的数量不同。若协程池中空闲的处理协程的数量不小于各个目标任务的数量,则每一目标任务可以被分配到一个空闲的处理协程;若协程池中空闲的处理协程的数量小于各个目标任务的数量,则每一空闲的处理协程可以分别监控一个目标任务,并在确定出目标任务是否为待报警的目标任务后,作为空闲的处理协程继续监控未被监控的目标任务。
可选地,在本实施例中,该任务监控方法还可以包括:
主协程检测是否满足针对所述协程池的预定扩容条件,若满足,对协程池进行协程扩容;
主协程检测是否满足针对协程池的预定缩容条件,若满足,对协程池进行协程缩容。
其中,所谓的对协程池进行协程扩容具体指:在协程池中添加新处理协程;相应的,所谓的对协程池进行协程缩容具体指:从协程池中删除处理协程。
当协程池中的处理协程进行并发监控时,若需要监控的目标任务的数量较多,协程池中的每个处理协程都需要处理较多的目标任务,导致处理时间变长,更严重的会造成协程堵塞。因此,当检测到满足针对所述协程池的预定扩容条件,也就是,检测到协程处理时间变长或者协程堵塞,可启动新的处理协程对协程池进行扩容,从而保证监控效率。示例性的,可以设置一个时间阈值,若各个处理协程对于各个目标任务的处理时长大于该时间阈值,则认为满足针对述协程池的预定扩容条件。
当协程池中的处理协程进行并发监控时,若需要监控的目标任务的数量较少,协程池中的处理协程可能会出现空闲的情况,导致协程浪费。因此,当检测到满足针对协程池的预定缩容条件,也就是,检测到协程空闲,可移除空闲处理协程以对协程池进行缩容,从而避免协程浪费。示例性的,可以设置一个时间阈值,若各个处理协程的空闲时长大于该时间阈值,则认为满足针对协程池的预定缩容条件。
另外,预定扩容条件和预定缩容条件也可以根据协程池中处理协程与待监控的目标任务的数量差异来设定。示例性的,若检测是否满足针对协程池的预定缩容条件和预定扩容条件的步骤,是在基于并发监控的方式,监控各个目标任务的运行信息的步骤之前,则预定扩容条件可以为:待监控的目标任务的数量多于协程池中处理协程的数量,而预定缩容条件可以为:待监控的目标任务的数量少于协程池中处理协程的数量。
本实施例所提供的方案,通过并发监控方式以及针对每一目标任务设定报警条件和报警配置信息,可以兼顾业务方的任务监控需求和监控效率。并且,基于Pipeline模式和Actor模型相结合的方式进行任务监控,可以进一步提升监控效率。
为了保证监控及报警服务本身的可用性,在资源有限和降低开发成本的情况下,可以采用redis(Redis是一个开源、内存存储的数据结构服务器,可用作数据库,高速缓存和消息队列代理)进行主从互备,这样,在一台机器出现问题的时候,另外的机器可以快速替补,问题机器恢复正常后可以继续工作,对业务无感知,提高服务稳定性。基于种处理思路,可选地,在本公开的另一实施例中,如图3所示,该任务监控方法,可以包括如下步骤:
S300,确定监控平台所位于的节点设备的设备类型;若节点设备的设备类型为主设备类型,则执行S301;
S301,从预先记录的多个任务中,确定待监控的各个目标任务;
S302,按照并发监控的方式,监控各个目标任务的运行信息;
S303,针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;
S304,利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
其中,步骤S301-步骤S304的内容与上述步骤S101-步骤S104的内容相同,这里不再赘述。
本实施例中,从预先记录的多个任务中,确定待监控的各个目标任务之前,还包括:首先,确定所述监控平台所位于的节点设备的设备类型,也就是,判断所述监控平台所位于的节点设备的设备类型是否是主设备类型,如果响应于所述节点设备的设备类型为主设备类型,则执行所述从预先记录的多个任务从预先记录的多个任务中,确定待监控的各个目标任务的步骤;如果响应于所述节点设备的设备类型为从设备类型,则进入定时检测阶段。
图4是根据本公开一种任务监控方法的采用redis进行主从互备的示意图。其中,服务A、服务B…服务x为位于不同设备的监控平台所提供的服务。并且,服务A、服务B…服务x中存在主服务,以及从服务,主服务所在的设备的设备类型为主设备类型,从服务所在的设备的设备类型为从设备类型。另外,Redis(数据库)中,服务A、服务B…服务x会进行主从备份,主从切换场景中,没有绝对的主和从,只有初始化的主和从,当主服务所在的主设备故障后,其他的从设备可以快速替补,这样,提高服务的稳定性。
本实施例中,不但可以兼顾业务方的任务监控需求和监控效率,而且,通过主从互备的方式,可以保证监控及报警服务稳定性。
若待报警的目标任务为多个,那么可能会存在如下情况:至少两个待报警的目标任务在报警时针对同一通讯标识,这样,会造成信息轰炸,即同一通信标识连续接收到多条报警信息,影响用户体验。
为了避免信息轰炸,从而提升用户体验,可选地,在本公开的另一实施例中,所述按照为待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对待报警的目标任务的报警信息,可以包括步骤A1-步骤A2:
步骤A1,针对为多个待报警的目标任务所设定的每一报警模式,确定多个待报警的目标任务中,设定有该报警模式的至少一个任务;
也就是,针对多个待报警的目标任务,可以对各个待报警的目标任务进行报警信息解析,即识别该多个待报警的目标任务的报警模式,即对多个待报警的目标任务进行任务报警模式(电话、邮件和指定客户端等)归类。
步骤A2,基于预定的信息整合方式,按照该报警模式,向为该至少一个任务所设定的该报警模式下的通讯标识,发送针对所属任务的报警信息;
其中,该信息整合方式为使得同一通讯标识接收一次报警信息的方式。
示例性的,在一种实现方式中,基于预定的信息整合方式,按照该报警模式,向为至少一个任务所设定的该报警模式下的通讯标识,发送针对所属任务的报警信息,可以包括:
若至少一个任务的数量为多个,则将设定有同一通讯标识的至少两个任务的报警信息进行整合,按照该报警模式,将整合后的报警信息发送至所述同一通讯标识;以及,针对除至少两个任务以外每一任务,按照该报警模式,向为该任务所设定的该报警模式下的通讯标识,发送针对该任务的报警信息;
若至少一个任务的数量为一个,按照该报警模式,向为该一个任务所设定的该报警模式下的通讯标识,发送针对该一个任务的报警信息。
也就是,将同一报警模式下的多个待报警的目标任务按照是否具有同一通讯标识的方式进行整合,将具有同一通讯标识的该报警模式的至少两个任务整合后一起发送,来发送报警信息。这样,如果多个待报警目标任务的报警接收用户为同一人,则信息收集后统一发送,解决了多次发送出现报警轰炸的问题。并且,针对除至少两个任务以外每一任务,按照该报警模式,向为该任务所设定的该报警模式下的通讯标识,发送针对该任务的报警信息。也就是,在该报警模式下,若具有同一通讯标识的待报警目标任务为单个任务,则直接向该报警模式下的通讯标识发送针对该任务的报警信息。
基于上述各实施例的相关描述可知,本公开所提供的任务监控方法至少具有如下优势:
(1)监控平台支持自助配置,提供可视化界面。
(2)弥补任务调度平台的监控功能缺失,提供灵活的周期性报警。
(3)整合现有需求,实现通用化监控平台,一个平台满足所有业务需求。
(4)降低后续维护成本,更加拥抱变化,便于后续需求调整及新增。
(5)监控平台可以统一维护权限管理,用户无需担心数据泄露等风险,更安全,更可靠。
(6)支持自助报表获取,可以比对周期性作业失败率,便于任务改进优化。
(7)支持多种报警渠道,自助灵活配置,不同紧急程度的任务可以选择不同的报警方式
(8)处理报警更便捷,直接指定客户端回复即可处理报警任务。
图5图示了本公开实施例的任务监控方法的一种流程图。如图5所示,该任务监控方法可以包括如下步骤:
(1)主协程启动后,即服务启动后,进入主从服务判断,如果为主服务,则可以进行监控任务处理,否则会进入定时检测阶段;其中,定时检测阶段可以以10分钟为周期进行主从服务判断。
(2)主协程判断出当前为主服务后会触发流程函数,获取mysql数据库中的各个任务的任务配置信息,进行信息过滤,选择需要监控报警的任务,即从预先记录的多个任务中,确定待监控的各个目标任务;然后,对各个目标任务进行任务信息聚合,并向协程池中的各个go协程(Goroutine)(即上述的处理协程)下发任务,以进行异步处理。
(3)协程池中的各个go协程对各个目标任务进行并发任务监控,即并发任务处理,这样,能够提高执行效率,快速任务检查;并且,根据处理任务的速度(执行计时)进行协程池自动扩容缩容,以达到高速处理任务并且资源合理利用的效果。其中,通过单次执行时间与预设阈值范围的比较结果,判定进行自动扩容或缩容,
其中,每个go协程独立处理一个目标任务,获取目标任务当前的作业状态(即上述的运行信息),根据作业状态中的任务的状态,运行时间等信息进行综合判断,筛选出需要报警的任务,作为待报警的目标任务;并且,将已经执行过的任务进行数据存储,用于后续报表展示使用,具体可以分为用于记录运行成功的任务的成功表和用于记录运行失败或超时的任务的失败表。其中,图5中的例行失败即表明目标任务运行失败;例行超时即表明目标任务运行超时,超时判断可以根据不同任务设置不同的超时周期;成功则表明目标任务运行成功,成功的作业需要判断之前是否失败或超时,如果失败后手动成功或者超时后成功的作业,需要更改失败表状态,并且写入成功表,相同基准时间只保留最近一条。
每个go协程将处理完的目标任务进行分类,将待报警的目标任务投放至报警任务队列,然后返回协程池等待下次任务安排。
(4)定时报警协程(即上述的报警协程)进行每分钟循环检查报警任务队列,当任务队列不为空时,则开始从报警队列中获取目标任务,进行报警处理,如果队列为空,则等待1分钟再进行队列检查。
定时报警协程从队列中获取到待报警的目标任务,根据该目标任务对应的报警配置信息,进行报警信息解析,从而针对目标任务进行报警。其中,针对目标任务,可以划分任务报警模式,对指定客户端,电话,邮件三种报警渠道分别进行整合,报警接收用户如果为同一人,则将信息收集后统一发送,防止多次发送出现报警轰炸的情况。用户在指定客户端中接收到报警信息后,可以根据指定客户端的机器人回复的方式,进行报警延迟或者停止等功能,或者手动处理任务成功后,报警也会自动停止。
(5)定期清理数据函数可以每天定期清理mysql数据中超过2个月的历史数据,防止无用数据过多导致mysql数据库中数据量过大,拖慢存储和查询效率。
本公开提供方案中,在确定出待监控的各个目标任务后,按照并发监控的方式,监控各个目标任务的运行信息,可以保证较高的监控效率;并且,在识别目标任务是否为待报警的目标任务时,基于为目标任务设定的报警条件,以及在针对待报警的目标任务进行报警时,依据为待报警的目标任务所设定的报警配置信息,这样能够保证对于各个目标任务的处理,依赖于相对应的任务监控需求。可见,通过本方案,可以兼顾业务方的任务监控需求和监控效率。
基于上述的方法实施例,本公开实施例还提供了一种任务监控装置,如图6所示,所述装置包括:
确定模块610,用于从预先记录的多个任务中,确定待监控的各个目标任务;
监控模块620,用于按照并发监控的方式,监控各个目标任务的运行信息;
判断模块630,用于针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;
报警模块640,用于利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
可选地,所述监控模块和所述判断模块通过协程池中的每个处理协程实现,其中,协程池中的每个处理协程,按照并发监控的方式,监控各个目标任务的运行信息;其中,每一处理协程在每一时间点所监控的目标任务为一个;
每个处理协程基于所监控的目标任务的运行信息和为所监控的目标任务所设定的报警条件,识别所监控的目标任务是否为待报警的目标任务。
可选地,所述确定模块通过主协程实现,其中,所述主协程从预先记录的多个任务中,确定待监控的各个目标任务;
所述报警模块通过报警协程实现,其中,报警协程利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
可选地,所述装置还包括:
第一检测模块,用于检测是否满足针对所述协程池的预定扩容条件,若满足,对所述协程池进行协程扩容;
第二检测模块,用于检测是否满足针对所述协程池的预定缩容条件,若满足,对所述协程池进行协程缩容。
可选地,所述装置还包括:
类型确定模块,用于确定模块从预先记录的多个任务中,确定待监控的各个目标任务之前,确定所述报警平台所位于的节点设备的设备类型;
若所述节点设备的设备类型为主设备类型,则触发所述确定模块执行所述从预先记录的多个任务中,确定待监控的各个目标任务的步骤。
可选地,所述报警配置信息包括:各个报警模式,以及每一报警模式下的用户标识;
所述报警模块,包括:
报警子模块,用于按照为所述待报警的目标任务所设定的每一报警模式,向该报警模式下的用户标识,发送针对所述待报警的目标任务的报警信息。
可选地,所述待报警的目标任务为多个;
所述报警子模块具体用于:
针对为多个待报警的目标任务所设定的每一报警模式,确定所述多个待报警的目标任务中,设定有该报警模式的至少一个任务;
基于预定的信息整合方式,按照该报警模式,向为所述至少一个任务所设定的该报警模式下的用户标识,发送针对所属任务的报警信息;
其中,所述信息整合方式为使得同一用户标识接收一次报警信息的方式。
可选地,所述报警子模块基于预定的信息整合方式,按照该报警模式,向为所述至少一个任务所设定的该报警模式下的用户标识,发送针对所属任务的报警信息,包括:
若所述至少一个任务的数量为多个,则将设定有同一用户标识的至少两个任务的报警信息进行整合,按照该报警模式,将整合后的报警信息发送至所述同一用户标识;以及,针对除所述至少两个任务以外每一任务,按照该报警模式,向为该任务所设定的该报警模式下的用户标识,发送针对该任务的报警信息;
若所述至少一个任务的数量为一个,按照该报警模式,向为所述一个任务所设定的该报警模式下的用户标识,发送针对所述一个任务的报警信息。
可选地,所述报警配置信息还包括报警辅助信息;其中,所述报警辅助信息包括报警频率、报警时间和报警后的处理模式中的一种或多种;
所述报警子模块具体用于:基于所述报警辅助信息,按照为所述待报警的目标任务所设定的每一报警模式,向该报警模式下的用户标识,发送针对所述待报警的目标任务的报警信息。
可选地,所述各个报警模式中包括向指定客户端发送报警信息的模式,所述用户标识为所述指定客户端中预定机器人助手的令牌token。其中,所述预定机器人助手的令牌token为预先通过配置界面配置于报警平台中。
可选地,所述确定模块,具体用于:
从预先记录的多个任务中,查询满足所对应监控触发条件的任务;每一业务对应有用于判定是否进行监控的监控触发条件;
将查询到的满足所对应监控触发条件的各个任务,确定为待监控的各个目标任务。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
本公开所提供的一种电子设备,可以包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的任务监控方法的步骤。
本公开所提供的一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一任务监控方法的步骤。
在本公开提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一任务监控方法的步骤。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元709加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线904彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元709,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如任务监控方法。例如,在一些实施例中,任务监控方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元709。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的任务监控方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行任务监控方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (15)

1.一种任务监控方法,所述方法包括:
从预先记录的多个任务中,确定待监控的各个目标任务;
按照并发监控的方式,监控各个目标任务的运行信息;
针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;
利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
2.根据权利要求1所述的方法,其中,所述按照并发监控的方式,监控各个目标任务的运行信息,包括:
协程池中的每个处理协程,按照并发监控的方式,监控各个目标任务的运行信息;其中,每一处理协程在每一时间点所监控的目标任务为一个;
所述针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务,包括:
每个处理协程基于所监控的目标任务的运行信息和为所监控的目标任务所设定的报警条件,识别所监控的目标任务是否为待报警的目标任务。
3.根据权利要求2所述的方法,其中,所述从预先记录的多个任务中,确定待监控的各个目标任务,包括:
主协程从预先记录的多个任务中,确定待监控的各个目标任务;
所述利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警,包括:
报警协程利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
4.根据权利要求3所述的方法,其中,所述方法还包括:
所述主协程检测是否满足针对所述协程池的预定扩容条件,若满足,对所述协程池进行协程扩容;
所述主协程检测是否满足针对所述协程池的预定缩容条件,若满足,对所述协程池进行协程缩容。
5.根据权利要求1所述的方法,其中,所述从预先记录的多个任务中,确定待监控的各个目标任务之前,还包括:
确定所述监控平台所位于的节点设备的设备类型;
若所述节点设备的设备类型为主设备类型,则执行所述从预先记录的多个任务中,确定待监控的各个目标任务的步骤。
6.根据权利要求1-5任一项所述的方法,其中,所述报警配置信息包括:各个报警模式,以及每一报警模式下的通讯标识;
所述利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警,包括:
按照为所述待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对所述待报警的目标任务的报警信息。
7.根据权利要求6所述的方法,其中,所述待报警的目标任务为多个;
所述按照为所述待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对所述待报警的目标任务的报警信息,包括:
针对为多个待报警的目标任务所设定的每一报警模式,确定所述多个待报警的目标任务中,设定有该报警模式的至少一个任务;
基于预定的信息整合方式,按照该报警模式,向为所述至少一个任务所设定的该报警模式下的通讯标识,发送针对所属任务的报警信息;
其中,所述信息整合方式为使得同一通讯标识接收一次报警信息的方式。
8.根据权利要求7所述的方法,其中,所述基于预定的信息整合方式,按照该报警模式,向为所述至少一个任务所设定的该报警模式下的通讯标识,发送针对所属任务的报警信息,包括:
若所述至少一个任务的数量为多个,则将设定有同一通讯标识的至少两个任务的报警信息进行整合,按照该报警模式,将整合后的报警信息发送至所述同一通讯标识;以及,针对除所述至少两个任务以外每一任务,按照该报警模式,向为该任务所设定的该报警模式下的通讯标识,发送针对该任务的报警信息;
若所述至少一个任务的数量为一个,按照该报警模式,向为所述一个任务所设定的该报警模式下的通讯标识,发送针对所述一个任务的报警信息。
9.根据权利要求6所述的方法,其中,所述报警配置信息还包括报警辅助信息;其中,所述报警辅助信息包括报警频率、报警时间和报警后的处理模式中的一种或多种;
所述按照为所述待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对所述待报警的目标任务的报警信息,包括:
基于所述报警辅助信息,按照为所述待报警的目标任务所设定的每一报警模式,向该报警模式下的通讯标识,发送针对所述待报警的目标任务的报警信息。
10.根据权利要求6所述的方法,其中,所述各个报警模式中包括向指定客户端发送报警信息的模式,所述通讯标识为所述指定客户端中预定机器人助手的令牌;
其中,所述预定机器人助手的令牌为预先通过配置界面配置于监控平台中。
11.根据权利要求1-5任一项所述的方法,其中,所述从预先记录的多个任务中,确定待监控的各个目标任务,包括:
从预先记录的多个任务中,查询满足所对应监控触发条件的任务;每一业务对应有用于判定是否进行监控的监控触发条件;
将查询到的满足所对应监控触发条件的各个任务,确定为待监控的各个目标任务。
12.一种任务监控装置,包括:
确定模块,用于从预先记录的多个任务中,确定待监控的各个目标任务;
监控模块,用于按照并发监控的方式,监控各个目标任务的运行信息;
判断模块,用于针对每一目标任务,基于该目标任务的运行信息和为该目标任务所设定的报警条件,识别该目标任务是否为待报警的目标任务;
报警模块,用于利用为所述待报警的目标任务所设定的报警配置信息,针对所述待报警的目标任务进行报警。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-11中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述的方法。
CN202110739487.5A 2021-06-30 2021-06-30 一种任务监控方法、装置、设备以及存储介质 Active CN113419921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110739487.5A CN113419921B (zh) 2021-06-30 2021-06-30 一种任务监控方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110739487.5A CN113419921B (zh) 2021-06-30 2021-06-30 一种任务监控方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN113419921A true CN113419921A (zh) 2021-09-21
CN113419921B CN113419921B (zh) 2023-09-29

Family

ID=77717484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110739487.5A Active CN113419921B (zh) 2021-06-30 2021-06-30 一种任务监控方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113419921B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168137A (zh) * 2022-06-17 2022-10-11 北京结慧科技有限公司 针对定时任务的监控方法及系统、计算机设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1601943A (en) * 1977-03-04 1981-11-04 Post Office System for transmitting alarm information over telephone lines
CN104202201A (zh) * 2014-09-16 2014-12-10 广州金山网络科技有限公司 一种日志处理方法、装置及终端
CN108595300A (zh) * 2018-03-21 2018-09-28 北京奇艺世纪科技有限公司 一种可配置的监控和报警的方法及装置
CN108959034A (zh) * 2018-07-05 2018-12-07 北京木瓜移动科技股份有限公司 一种监控报警方法、装置、电子设备及存储介质
US10474509B1 (en) * 2018-10-17 2019-11-12 Fmr Llc Computing resource monitoring and alerting system
CN110445669A (zh) * 2019-06-26 2019-11-12 苏州浪潮智能科技有限公司 一种基于协程的服务器的监控方法、设备及可读介质
CN110795315A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 监控业务的方法和装置
CN112015551A (zh) * 2020-08-26 2020-12-01 京东方科技集团股份有限公司 协程池的管理方法及装置
WO2020238415A1 (zh) * 2019-05-29 2020-12-03 深圳前海微众银行股份有限公司 一种监控模型训练的方法及装置
CN112235162A (zh) * 2020-10-14 2021-01-15 北京嘀嘀无限科技发展有限公司 基于业务的监控方法、装置、电子设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1601943A (en) * 1977-03-04 1981-11-04 Post Office System for transmitting alarm information over telephone lines
CN104202201A (zh) * 2014-09-16 2014-12-10 广州金山网络科技有限公司 一种日志处理方法、装置及终端
CN108595300A (zh) * 2018-03-21 2018-09-28 北京奇艺世纪科技有限公司 一种可配置的监控和报警的方法及装置
CN108959034A (zh) * 2018-07-05 2018-12-07 北京木瓜移动科技股份有限公司 一种监控报警方法、装置、电子设备及存储介质
CN110795315A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 监控业务的方法和装置
US10474509B1 (en) * 2018-10-17 2019-11-12 Fmr Llc Computing resource monitoring and alerting system
WO2020238415A1 (zh) * 2019-05-29 2020-12-03 深圳前海微众银行股份有限公司 一种监控模型训练的方法及装置
CN110445669A (zh) * 2019-06-26 2019-11-12 苏州浪潮智能科技有限公司 一种基于协程的服务器的监控方法、设备及可读介质
CN112015551A (zh) * 2020-08-26 2020-12-01 京东方科技集团股份有限公司 协程池的管理方法及装置
CN112235162A (zh) * 2020-10-14 2021-01-15 北京嘀嘀无限科技发展有限公司 基于业务的监控方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHENG-LI LIU 等: "An Efficient Fuzzy Alarm System for Improving Human Performance in Supervisory Task", 2017 2ND INTERNATIONAL CONFERENCE ON CYBERNETICS, ROBOTICS AND CONTROL (CRC) *
冯洋;周立辉;卢洪锋;邵利民;: "基于E-mail的远程监控系统报警软件设计", 科技资讯, no. 32 *
唐琳;李伟;韩辉;: "辅助监控系统的研究与应用", 电力系统通信, no. 02 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168137A (zh) * 2022-06-17 2022-10-11 北京结慧科技有限公司 针对定时任务的监控方法及系统、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113419921B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
CN111831420B (zh) 用于任务调度的方法、相关装置及计算机程序产品
CN109634728B (zh) 作业调度方法、装置、终端设备及可读存储介质
US20190303779A1 (en) Digital worker management system
CN111459763B (zh) 跨kubernetes集群监控系统及方法
CN107016480B (zh) 任务调度方法、装置及系统
CN108632106B (zh) 监控服务设备的系统
EP4113299A2 (en) Task processing method and device, and electronic device
CN112199355B (zh) 数据迁移方法、装置、电子设备及存储介质
CN113778486A (zh) 一种代码流水线的容器化处理方法、装置、介质及设备
CN115964153A (zh) 一种异步任务处理方法、装置、设备以及存储介质
CN113419921A (zh) 一种任务监控方法、装置、设备以及存储介质
CN113051134A (zh) 一种应用系统监控管理方法、装置、设备及存储介质
CN111782341A (zh) 用于管理集群的方法和装置
CN108154343B (zh) 一种企业级信息系统的应急处理方法及系统
CN115658248A (zh) 任务调度方法方法、装置、电子设备及存储介质
US20170024288A1 (en) Centralized database system
CN114327819B (zh) 一种任务管理方法、装置、设备及存储介质
CN115437766A (zh) 一种任务处理方法和装置
CN113656239A (zh) 针对中间件的监控方法、装置及计算机程序产品
CN115438056A (zh) 一种数据获取方法、装置、设备以及存储介质
CN114416276A (zh) 设备管理服务的调度方法、装置、电子设备及存储介质
CN115373886A (zh) 服务群组容器停机方法、装置、计算机设备和存储介质
CN111159237A (zh) 系统数据分发方法、装置、存储介质及电子设备
CN110888928B (zh) 基于etl工具服务组件的可视化控制方法
CN109828893A (zh) 基于docker引擎的多任务android性能测试方法及用于执行该方法的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant