CN110289976A - 一种调度任务告警系统及方法 - Google Patents

一种调度任务告警系统及方法 Download PDF

Info

Publication number
CN110289976A
CN110289976A CN201810226194.5A CN201810226194A CN110289976A CN 110289976 A CN110289976 A CN 110289976A CN 201810226194 A CN201810226194 A CN 201810226194A CN 110289976 A CN110289976 A CN 110289976A
Authority
CN
China
Prior art keywords
task
alarm
unit
scheduler
alerted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810226194.5A
Other languages
English (en)
Inventor
张溢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qincang Information Science & Technology Co Ltd
Original Assignee
Shanghai Qincang Information Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qincang Information Science & Technology Co Ltd filed Critical Shanghai Qincang Information Science & Technology Co Ltd
Priority to CN201810226194.5A priority Critical patent/CN110289976A/zh
Publication of CN110289976A publication Critical patent/CN110289976A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/56Unified messaging, e.g. interactions between e-mail, instant messaging or converged IP messaging [CPM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Alarm Systems (AREA)

Abstract

本发明提供一种调度任务告警系统及方法,系统包括信息处理单元和告警单元,所述信息处理单元与告警单元连接,信息处理单元通过实时检测所有调度任务,获取不符合预设条件的任务,并进行告警;信息处理单元包括:信息采集子单元,用于所有调度任务进行实时扫描;超时判断子单元,用于根据任务配置信息判断对应的任务是否超时;状态判断子单元,用于检测任务状态;本发明可以针对各种不同的任务类型,采取不同的方式进行相应的告警,具备24小时全天候监控的能力,为数据计算任务提供保障。

Description

一种调度任务告警系统及方法
技术领域
本发明涉及计算机及通信领域,尤其涉及一种调度任务告警系统及方法。
背景技术
随着社会的发展,信息化的发展的脚步越来越快,伴随而来的IT公司的业务也得到了飞速拓展,整个行业的数据量得到了爆发式增长,承担数据计算的任务以倍数累加,其中大部分计算任务都是在深夜进行跑批处理,大部分对任务进行核查都采用人工的方式,可是随着数据量的大幅度增加,通过人为去核查任务执行状态已经渐渐暴露出以下一些问题:
定时任务失败无任何报警,只能每天依靠人工发现。
夜间任务失败报警不能及时通知到值班人员
一些业务场景需要任务在某个时点必须要完成,即需要任务的超时告警,以免对于下游的线上业务产生影响。
而对于上述这些情况,目前还没有专门的处理方法来解决,因此,需要一种新的技术手段,能够针对各种不同的任务类型,进行相应的告警,具备24小时全天候监控的能力,为数据计算任务提供保障。
发明内容
鉴于以上所述现有技术的缺点,本发明提供一种调度任务告警系统,以解决上述技术问题。
本发明提供的调度任务告警系统,包括:信息处理单元和告警单元,所述信息处理单元与告警单元连接,信息处理单元通过实时检测所有调度任务,获取不符合预设条件的任务,并进行告警;
所述信息处理单元包括:
信息采集子单元,用于所有调度任务进行实时扫描;
超时判断子单元,用于根据任务配置信息判断对应的任务是否超时;
状态判断子单元,用于检测任务状态。
进一步,还包括用于接收告警信息的移动终端设备,所述告警单元与移动终端设备连接。
进一步,所述告警单元设置有控制模块和告警模块,所述移动终端设备包括主用终端和备用终端,所述控制模块预先设置有时间阈值,如果在预设的时间阈值范围内,主用终端没有对告警信息进行处理,控制模块控制告警模块再次发送相同的告警信息至备用终端。
进一步,所述告警模块包括邮件告警模块,短消息告警模块和语音告警模块;
当状态判断子单元检测到任务状态为失败,且失败的任务为核心任务,通过语音告警模块进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于工作时段时,通过邮件告警模块发送异步邮件进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于非工作时段时,通过短消息告警模块进行告警。
本发明还提供调度任务告警方法,包括:
采集所有调度任务,并进行实时扫描;
根据任务配置信息判断任务状态,以及是否超时;
获取不符合预设条件的任务,进行告警。
进一步,告警方式包括邮件告警、短消息告警和语音告警。
进一步,所述语音告警采用主备方式进行告警,所述主备方式包括预先设置时间阈值,如果在预设的时间阈值范围内,主用终端没有对告警信息进行处理,控制模块控制告警模块再次发送相同的告警信息至备用终端。
进一步,当状态判断子单元检测到任务状态为失败,且失败的任务为核心任务,通过语音告警模块进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于工作时段时,通过邮件告警模块发送异步邮件进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于非工作时段时,通过短消息告警模块进行告警。
进一步,任务超时包括时长超时和时点超时,所述时长超时为任务执行的时长大于预设的时间阈值范围,所述时点超时为任务在预设的时间阈值点时,未执行完成。
本发明还提供一种电子终端,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如上述任一项所述调度任务告警方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述调度任务告警方法。
本发明的有益效果:本发明中的调度任务告警系统,通过实时扫描所有调度任务,获取任务状态,以及是否超时,根据预设条件进行告警,本发明可以针对各种不同的任务类型,采取不同的方式进行相应的告警,具备24小时全天候监控的能力,为数据计算任务提供保障。
附图说明
图1是本发明实施例中调度任务告警方法的流程示意图。
图2是本发明实施例中调度任务告警系统的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
如图1所示,本实施例中的调度任务告警系统,包括:信息处理单元和告警单元,所述信息处理单元与告警单元连接,信息处理单元通过实时检测所有调度任务,获取不符合预设条件的任务,并进行告警;
所述信息处理单元包括:
信息采集子单元,用于所有调度任务进行实时扫描;
超时判断子单元,用于根据任务配置信息判断对应的任务是否超时;
状态判断子单元,用于检测任务状态。
在本实施例中,通过实时扫描所有调度任务,会根据每一个任务配置信息,判断配置任务执行结束时间是否超过当前时间,如超时则告警。若扫描到任务状态失败则告警。
在本实施例中,可以通过服务器-终端的方式进行告警,每个责任人携带有移动终端设备,通过服务器将告警信息发送到移动终端设备,实现远程无线告警,通过与移动终端设备配合,可以实现多种方式的接收告警信息。
在本实施例中,告警单元设置有控制模块和告警模块,所述移动终端设备包括主用终端和备用终端,所述控制模块预先设置有时间阈值,如果在预设的时间阈值范围内,主用终端没有对告警信息进行处理,控制模块控制告警模块再次发送相同的告警信息至备用终端。
本实施例中的告警模块包括邮件告警模块,短消息告警模块和语音告警模块;
当状态判断子单元检测到任务状态为失败,且失败的任务为核心任务,通过语音告警模块进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于工作时段时,通过邮件告警模块发送异步邮件进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于非工作时段时,通过短消息告警模块进行告警。
在本实施例中,告警单元可以设置在服务器上,优选地,可以采用云端服务器,将云端服务器作为告警平台,对接入的移动终端设备进行告警。相应地,用户也可以通过移动终端设备可以对正在执行的任务以及相应的任务责任人等相关信息进行远程查询,当然也可以通过移动终端设备进行远程操作,例如远程修改配置信息,设置执行任务,以及修改告警发送方式等操作。
相应地,本实施例还提供一种调度任务告警方法,包括:
采集所有调度任务,并进行实时扫描;
根据任务配置信息判断任务状态,以及是否超时;
获取不符合预设条件的任务,进行告警。
在本实施例中,告警方式包括邮件告警、短消息告警和语音告警,语音告警采用主备方式进行告警,所述主备方式包括预先设置时间阈值,如果在预设的时间阈值范围内,主用终端没有对告警信息进行处理,控制模块控制告警模块再次发送相同的告警信息至备用终端。当状态判断子单元检测到任务状态为失败,且失败的任务为核心任务,通过语音告警模块进行告警;当状态判断子单元检测到失败的任务为非核心任务,且处于工作时段时,通过邮件告警模块发送异步邮件进行告警;当状态判断子单元检测到失败的任务为非核心任务,且处于非工作时段时,通过短消息告警模块进行告警。本实施例中,在工作时段,采用失败任务异步发送邮件,邮件发送目标即失败任务配置的责任人。非工作时段,我们使用短消息推送接口,把失败任务和超时任务发送给责任人。本实施例中的超时任务分为两种情况:第一种是任务执行时长超时,第二种是任务时点超时。任务执行时长超时是指任务在设定的时间段内没有执行完成,而任务时点超时是指任务在设定的时间点没有完成。对于一些会影响线上业务数据的计算任务,例如设定在6点左右必须执行完毕,那么没有及时结束,就能及时反馈(语音+短息消息)给值班人员,使得有足够充分的时间来修复造成任务超时的问题,因此这两项配置是有极为必要的。考虑到短消息在夜间的告警效果不大,也为了避免没有ab角的值班双保险,本实施例还接入了语音告警,通过在所有任务中,预先筛选出核心计算任务,并进行语音配置,当在核心任务在执行失败或者超时的情况下,通过语音告警模块自动将告警信息发送给当天的值班人员,若在预定的时间范围内,例如5分钟内没有认领需处理的任务,则自动发送告警信息之备用终端,即当天的备选值班人员,通过这种方式把失败反馈的等级提升到了最大。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本实施例中的任一项方法。
本实施例还提供一种电子终端,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行本实施例中任一项方法。
本实施例中的计算机可读存储介质,本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例提供了系统的结构示意图,本实施例提供的电子终端,包括处理器、存储器、收发器和通信接口,存储器和通信接口与处理器和收发器连接并完成相互间的通信,存储器用于存储计算机程序,通信接口用于和进行通信,处理器和收发器用于运行计算机程序,使系统执行如上方法的各个步骤。
在本实施例中,存储器可能包含随机存取存储器(RandomAccessMemory,简称RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DigitalSignalProcessing,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种调度任务告警系统,其特征在于,包括:信息处理单元和告警单元,所述信息处理单元与告警单元连接;
所述信息处理单元包括:
信息采集子单元,用于所有调度任务进行实时扫描;
超时判断子单元,用于根据任务配置信息判断对应的任务是否超时;
状态判断子单元,用于检测任务状态。
2.根据权利要求1所述的调度任务告警系统,其特征在于:还包括用于接收告警信息的移动终端设备,所述告警单元与移动终端设备连接。
3.根据权利要求2所述的调度任务告警系统,其特征在于:所述告警单元包括控制模块和告警模块,所述移动终端设备包括主用终端和备用终端,所述控制模块预先设置有时间阈值;如果在预设的时间阈值范围内,主用终端没有对告警信息进行处理,控制模块控制告警模块再次发送相同的告警信息至备用终端。
4.根据权利要求3所述的调度任务告警系统,其特征在于:所述告警模块包括邮件告警模块、短消息告警模块和语音告警模块;
当状态判断子单元检测到任务状态为失败,且失败的任务为核心任务,通过语音告警模块进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于工作时段时,通过邮件告警模块发送异步邮件进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于非工作时段时,通过短消息告警模块进行告警。
5.一种调度任务告警方法,其特征在于,包括:
采集所有调度任务,并进行实时扫描;
根据任务配置信息判断任务状态,以及是否超时;
获取不符合预设条件的任务,进行告警。
6.根据权利要求5所述的调度任务告警方法,其特征在于:告警方式包括邮件告警、短消息告警和语音告警;
所述语音告警采用主备方式进行告警,所述主备方式包括预先设置时间阈值,如果在预设的时间阈值范围内,主用终端没有对告警信息进行处理,控制模块控制告警模块再次发送相同的告警信息至备用终端。
7.根据权利要求6所述的调度任务告警方法,其特征在于:当状态判断子单元检测到任务状态为失败,且失败的任务为核心任务,通过语音告警模块进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于工作时段时,通过邮件告警模块发送异步邮件进行告警;
当状态判断子单元检测到失败的任务为非核心任务,且处于非工作时段时,通过短消息告警模块进行告警。
8.根据权利要求6所述的调度任务告警方法,其特征在于:任务超时包括时长超时和时点超时,所述时长超时为任务执行的时长大于预设的时间阈值范围,所述时点超时为任务在预设的时间阈值点时,未执行完成。
9.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求5至8中任一项所述调度任务告警方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求5至8中任一项所述调度任务告警方法。
CN201810226194.5A 2018-03-19 2018-03-19 一种调度任务告警系统及方法 Pending CN110289976A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810226194.5A CN110289976A (zh) 2018-03-19 2018-03-19 一种调度任务告警系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810226194.5A CN110289976A (zh) 2018-03-19 2018-03-19 一种调度任务告警系统及方法

Publications (1)

Publication Number Publication Date
CN110289976A true CN110289976A (zh) 2019-09-27

Family

ID=68001048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810226194.5A Pending CN110289976A (zh) 2018-03-19 2018-03-19 一种调度任务告警系统及方法

Country Status (1)

Country Link
CN (1) CN110289976A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110708204A (zh) * 2019-11-18 2020-01-17 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、系统、终端及介质
CN112181763A (zh) * 2020-09-22 2021-01-05 中国建设银行股份有限公司 一种智能调度中的智能检测告警方法及装置
CN112232649A (zh) * 2020-10-09 2021-01-15 杭州拼便宜网络科技有限公司 一种任务处理评估方法及其系统、设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321104A (zh) * 2008-07-03 2008-12-10 宁波大学 智能控制局域网
CN101677278A (zh) * 2008-09-17 2010-03-24 中兴通讯股份有限公司 网络信息系统可用性的监控方法及系统
CN104112056A (zh) * 2013-04-18 2014-10-22 腾讯科技(深圳)有限公司 数据处理的故障检测方法和系统
CN104967537A (zh) * 2015-06-30 2015-10-07 北京奇艺世纪科技有限公司 一种报警信息推送方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321104A (zh) * 2008-07-03 2008-12-10 宁波大学 智能控制局域网
CN101677278A (zh) * 2008-09-17 2010-03-24 中兴通讯股份有限公司 网络信息系统可用性的监控方法及系统
CN104112056A (zh) * 2013-04-18 2014-10-22 腾讯科技(深圳)有限公司 数据处理的故障检测方法和系统
CN104967537A (zh) * 2015-06-30 2015-10-07 北京奇艺世纪科技有限公司 一种报警信息推送方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110708204A (zh) * 2019-11-18 2020-01-17 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、系统、终端及介质
CN110708204B (zh) * 2019-11-18 2023-03-31 上海维谛信息科技有限公司 一种基于运维知识库的异常处理方法、系统、终端及介质
CN112181763A (zh) * 2020-09-22 2021-01-05 中国建设银行股份有限公司 一种智能调度中的智能检测告警方法及装置
CN112232649A (zh) * 2020-10-09 2021-01-15 杭州拼便宜网络科技有限公司 一种任务处理评估方法及其系统、设备

Similar Documents

Publication Publication Date Title
US11627195B2 (en) Issuing alerts for IoT devices
CN110289976A (zh) 一种调度任务告警系统及方法
CN109543992A (zh) 智能巡检方法、装置、智能终端及服务器
CN106447826A (zh) 无人机故障诊断方法及系统
CN110858850A (zh) 一种轨道交通系统综合网管方法、装置及系统
CN113852785B (zh) 一种基于5g的智能监控调度方法、装置及系统
CN110908815B (zh) 消息队列数据预警方法、装置和系统、存储介质
CN107230342A (zh) 车辆的停车管理方法和系统、车辆、停车装置和服务器
CN110362455A (zh) 一种数据处理方法和数据处理装置
CN104598241A (zh) 一种窗口监控方法及系统
CN106533914A (zh) 消息通知方法及装置
CN110011843A (zh) 告警信息处理方法、电子设备和存储介质
CN202979030U (zh) 车辆故障和报警信息通知系统
CN102999415A (zh) 一种告警通知功能的优化方法及设备
CN101102217B (zh) 电信网管系统中告警重复和闪断上报及监视的处理方法
CN103929732A (zh) 一种管理终端外设的方法及m2m网关
CN111818184B (zh) 基于可视化便捷流计算的医疗物联网消息路由装置及方法
CN109765833A (zh) 一种监控物联设备控制状态的方法
US10754745B2 (en) Subscription methods and systems for component information of a system
CN207022045U (zh) 设备故障信息实时通知系统
CN114500644A (zh) 一种市政设施监测系统中的物联数据管理方法
CN211151987U (zh) 一种死机自检测自恢复的仓内屏监控终端
CN114217867A (zh) 自动化运维代理装置、设备和存储介质
CN111667615A (zh) 智能锁无线下行数据提醒方法、装置、终端及存储介质
CN204633815U (zh) 一种车载物联网运营平台的中间件系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190927