CN109698763B - 一种巡检的方法、装置及计算机可读存储介质 - Google Patents

一种巡检的方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN109698763B
CN109698763B CN201711002275.9A CN201711002275A CN109698763B CN 109698763 B CN109698763 B CN 109698763B CN 201711002275 A CN201711002275 A CN 201711002275A CN 109698763 B CN109698763 B CN 109698763B
Authority
CN
China
Prior art keywords
resource
inspection
alarm
task
task queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711002275.9A
Other languages
English (en)
Other versions
CN109698763A (zh
Inventor
肖雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201711002275.9A priority Critical patent/CN109698763B/zh
Publication of CN109698763A publication Critical patent/CN109698763A/zh
Application granted granted Critical
Publication of CN109698763B publication Critical patent/CN109698763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • H04L41/048Network management architectures or arrangements comprising network management agents or mobile agents therefor mobile agents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0636Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis based on a decision tree analysis

Abstract

本发明公开了一种巡检的方法,包括:接收到第一告警信号,确定所述第一告警信号对应的告警资源;确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;执行所述第一巡检任务队列得到巡检报告。本发明还公开了一种巡检的装置和计算机可读存储介质。

Description

一种巡检的方法、装置及计算机可读存储介质
技术领域
本发明涉及通信领域,尤其涉及一种巡检的方法、装置及计算机可读存储介质。
背景技术
随着网络规模的递增,网络所需要的网络设备数也会随之递,每一个在网络中运行的设备都有需要进行检查和监控的数据项,设备需要检查的业务项也会随着业务需求的增加而增加,因此,对日常巡检提出更高的要求,在大量设备的日常检查中,保证设备重要业务的检查项定期进行检查,且不影响正常的通讯网络的运行。
目前,通讯业对于日常巡检,主要通过智能化巡检工具来完成巡检。智能化巡检工具主要给用户提供一些固定化、标准化的巡检场景,该巡检场景中包含每个设备相关的详细的业务项、业务项的正常状态评判标准、评判规则等,运维人员可根据个人经验定制日常的巡检模板,该模板中可包含设备、设备相关业务,也可制定作业执行计划,根据固定时间进行日常的设备巡检。
智能化巡检,更多的是采用计划作业、计划任务等自动化方式来解决智能化自动化执行巡检,将巡检任务拆分成更小的业务执行单元,然后针对小的业务执行单元,再根据各个小的业务结果进行采集、分析、将各个小业务结果汇总生成巡检报告。
目前的智能化巡检在发生故障后,需要运维人员多次执行才能找到具体故障原因,或者需要先执行标准的全部任务,然后再做故障定位判定;而且任务的触发时机,需要当值运维人员发现问题后再执行,对于问题的响应度存在一定的滞后性,如存在严重问题,则会在修复响应的时间上出现滞后性。
因此,亟需提供一种巡检的技术方案,能够减少设备故障检测的人为发现的滞后性,减少故障对于通讯网络和运营商的影响。
发明内容
有鉴于此,本发明实施例希望提供一种巡检的方法、装置及计算机可读存储介质,能够减少设备故障检测的人为发现的滞后性,减少故障对于通讯网络和运营商的影响。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种巡检的方法,所述方法包括:
接收到第一告警信号,确定所述第一告警信号对应的告警资源;
确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;
执行所述第一巡检任务队列得到巡检报告。
上述方案中,所述确定所述告警资源的关联资源包括:
根据所述告警资源和关联资源的资源关系序列确定所述告警资源的关联资源。
上述方案中,所述确定资源节点的巡检项目包括:
根据所述告警信号和巡检项目的业务关系序列确定资源节点的巡检项目。
上述方案中,所述根据所述资源节点巡检项目对应的子业务任务生成第一巡检任务队列包括:
根据所述巡检项目的优先级参数确定所述巡检项目对应的子业务任务的队列顺序;
根据所述队列顺序对所述巡检项目对应的子业务任务进行排序生成所述第一巡检任务队列。
上述方案中,所述方法还包括:
检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。
上述方案中,在执行所述第一巡检任务队列之前,所述方法还包括:
检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;
检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。
上述方案中,所述将所述相同的子业务任务进行归并处理包括:
获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;
获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;
根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。
本发明实施例还提供一种巡检的装置,所述装置包括:告警单元、任务生成单元和执行单元;其中,
所述告警单元,用于接收到第一告警信号,确定所述第一告警信号对应的告警资源;
所述任务生成单元,用于确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;
所述执行单元,用于执行所述第一巡检任务队列得到巡检报告,并输出所述巡检报告。
上述方案中,所述装置还包括:拆分单元,用于:
检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。
上述方案中,所述装置还包括:检测单元,用于:
检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;
检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。
上述方案中,所述检测单元,将所述相同的子业务任务进行归并处理包括:
获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;
获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;
根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。
本发明实施例还提供一种巡检的装置,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行上述巡检的方法的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权上述巡检的方法。
本发明实施例的一种巡检的方法、装置及计算机可读存储介质,包括:接收到第一告警信号,确定所述第一告警信号对应的告警资源;确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;执行所述第一巡检任务队列得到巡检报告,并输出所述巡检报告。当业务系统中的站点发生告警信号时,根据告警信号确定告警信号对应的巡检任务队列,从而根据故障发生源和硬件监控点即时反馈信息进行的一个巡检任务处理,从而不需要等待运维人员对告警信号进行重现,以确定故障原因,减少设备故障检测的人为发现的滞后性,从而减少故障对于通讯网络和运营商的影响。
附图说明
图1为本发明实施例一提供的巡检的方法的流程示意图;
图2为本发明实施例二提供的巡检的方法的流程示意图;
图3为本发明实施例二提供的生成巡检任务队列的方法的流程示意图;
图4为本发明实施例二提供的资源树和业务树的示意图;
图5为本发明实施例四提供的一种巡检的方法的流程示意图;
图6为本发明实施例六提供的一种巡检的装置的结构示意图;
图7为本发明实施例六提供的另一种巡检的装置的结构示意图;
图8为本发明实施例七提供的一种巡检的装置的结构示意图。
具体实施方式
下面结合附图对技术方案的实施作进一步的详细描述。
实施例一
本发明实施例一提供一种巡检的方法,如图1所示,所述方法包括:
S101、接收到第一告警信号,确定所述第一告警信号对应的告警资源;
在业务系统中,包括多个站点,每个站点对应一设备。当一站点发生告警时,将告警信号上报给网管设备,其中,网管设备可为发生告警的设备本身,也可为与发生告警的设备在同一业务系统中的另一设备。这里,告警信号可为发生故障情况下的发出的告警的告警信号,也可为基于系统配置发出系统提醒情况下发出的告警的告警信号。比如:信令异常告警、内存过低告警、端口异常告警、时钟异常告警、同步失败告警等。其中,在发出告警信号时,基于发出的告警携带该告警信号对应的告警码、发生告警的物理地址等告警信息,以表征该告警的类型,告警级别等告警信息。
当网管设备接收到第一告警信号时,确定上报第一告警信号的告警资源,告警信号在上报时可携带告警信息,也可只指示当前发生告警,发生告警的告警信息与告警信号分开上报。其中,告警资源为发出告警信号的告警设备,即为告警所处的操作维护对象。告警资源可通过设备标识进行标识。
在本发明实施例中,网管设备可接收到一个告警信号,这里,第一告警信号为接收到的告警信号中的一个告警信号,第二告警信号为接收到的告警信号中除第一告警信号以外的告警信号。
S102、确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;
确定所述告警资源的关联资源包括:根据所述告警资源和关联资源的资源关系序列确定所述告警资源的关联资源。关联资源为与告警资源相关联的资源,为告警资源所波及影响的设备资源,在确定告警资源的关联资源时,可预先构建告警资源和关联资源的资源关系序列,在确定告警资源的关联资源时,直接根据构建的资源关系序列来确定当前所述告警资源的关联资源。比如:系统中的资源包括节点1、节点2、节点3、节点4和节点5,其中,发生告警的告警资源为节点3,且与节点3的操作维护相影响的关联资源为节点1、节点2和节点4,此时,建立的节点3对应的资源关系序列为节点1、节点2和节点4。
这里,通过资源关系序列确定的关联资源和告警资源的关系可通过资源树的方式来表述,比如:同上例,与节点3的操作维护相影响的关联资源为节点1和节点2,且节点1为节点2的父节点,节点2为节点3的父节点。当通过资源树的方式表征告警资源和关联资源之间的关系时,可精确的反映出影响所述告警资源的关联资源和告警资源所影响的关联资源。比如:节点1为节点2的父节点,节点2为节点3的父节点,节点3为节点4的父节点,则节点2的状态受节点1的影响,节点3的状态受节点2的影响,节点4的状态受节点3的影响。这里,资源树中的父节点影响子节点的状态。并且在资源树中各个分支之间的状态不受影响。
确定资源节点的巡检项目包括:根据所述告警信号和巡检项目的业务关系序列确定资源节点的巡检项目。这里,资源节点包括告警资源本身和与告警资源相关联的关联资源。这里,可设定告警信号和巡检项目的业务关系序列,比如:告警信号为端口异常告警,端口异常告警对应的业务关系序列中,端口异常告警对应巡检项目包括:端口巡检、配置巡检、状态巡检;当告警信号为端口异常告警时,巡检项目包括:端口巡检项、配置巡检项、状态巡检项。
这里,通过业务关系序列确定的资源节点的巡检项目可通过业务树的方式来表述,比如:同上例,端口异常告警对应的业务关系序列中,端口异常告警对应巡检项目包括:端口巡检、配置巡检、状态巡检。当将巡检项目构建为业务树的方式时,可精确的定位出当前告警信号对应的巡检项目。其中,业务树可在资源树的基础上实现,比如:资源树中的节点包括节点1、节点2、节点3、和节点4,在业务树中,每个节点都包括该节点的巡检项目,比如:节点1的巡检项目包括项目1、项目2和项目3,节点2的巡检项目包括项目4、项目5,节点3的巡检项目包括项目6、项目7、项目8和项目9,节点4的巡检项目包括项目10。这里,该资源树和业务树为节点3发生告警信号且告警类型为端口异常告警时对应的资源树和业务树。
不同的告警信号可对应不同的业务树,不同的告警资源可对应不同的资源树。
在确定资源节点的巡检项目后,确定各资源节点的巡检项目的子业务任务,根据各资源节点的巡检项目对应的子业务任务生成第一巡检任务队列。在确定告警信号对应的资源节点的巡检项目后,将巡检该资源节点的巡检项目的任务称为巡检任务队列,其中,一个巡检项目对应一个子业务或多个子业务,巡检该巡检项目的任务称为该巡检项目对应的子业务任务,比如:当资源节点的巡检项目为节点1的配置巡检项时,则对应的子业务任务为节点1的配置巡检。
其中,所述根据所述资源节点巡检项目对应的子业务任务生成第一巡检任务队列可包括:根据所述巡检项目的优先级参数确定所述巡检项目对应的子业务任务的队列顺序;根据所述队列顺序对所述巡检项目对应的子业务任务进行排序生成所述第一巡检任务队列。巡检项目的优先级参数可包括优先级信息、价值权重、与该告警业务的关联度等参数中的一个或多个,也可包括其他保证巡检项目优先级的参数。当优先级参数包括多个时,可对多个优先级参数进行权值计算得到最终的优先级参数,比如:a*优先级信息+b*价值权重=优先级参数,a、b分别为优先级参数计算系数,0<a<1,0<b<1。通过优先级参数对资源节点的巡检项目进行排队。比如:资源节点的巡检项目包括:节点1的项目1、项目2和项目3,节点2的项目4、项目5,其中,节点1的项目1、节点1的项目2、节点1的项目3、节点2的项目4和节点2的项目5对应的优先级参数分别为参数1、参数2、参数3、参数4、参数5,其中,根据优先级先后对参数1、参数2、参数3、参数4、参数5进行排序为参数5、参数3、参数1、参数2、参数4,则子业务任务顺序为节点2的项目5的对应的子业务任务、节点1的项目3的对应的子业务任务、节点1的项目1的对应的子业务任务、节点1的项目2的对应的子业务任务、节点2的项目4的对应的子业务任务,则第一巡检队列为节点2的项目5的对应的子业务任务、节点1的项目3的对应的子业务任务、节点1的项目1的对应的子业务任务、节点1的项目2的对应的子业务任务、节点2的项目4的对应的子业务任务。队列顺序可决定第一巡检任务队列中的子业务任务的执行顺序。可通过子业务任务的权重值表征子业务任务在第一巡检任务队列中的执行顺序。
在生成第一巡检任务队列之前,可检测资源节点中是否包括独立的资源节点,这里,独立的资源节点为与其他资源节点相互独立的资源节点,其中,独立资源节点在物理部署上存在一定的独立性,可独立执行任务,设备的可完全独立运行,所有业务分析都是可以独立分析的,不会被其他设备干扰,拥有独立的对外通讯和交互方式。检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。当将独立执行的巡检任务从第一巡检任务队列中拆分出来后,其虽然是独立的任务,但还是属于第一巡检任务队列中的一部分。
需要说明的是,将独立资源节点对应的任务从第一巡检任务队列中拆分出来,可在确定资源节点为独立的资源节点时,与其他资源节点分开确定其对应的子任务队列,也可在确定第一巡检任务队列时,将独立资源节点对应的巡检任务从第一巡检任务队列中独立出来。本发明实施例中对拆分独立资源节点对应的巡检任务的具体时机不进行限定。
在本发明实施例中,当生成一告警信号对应的巡检任务队列后,可将该巡检任务队列存储,以在接收到同样的告警信号时,直接调用该告警信号对应的巡检任务队列。
在实际应用中,当确定告警信号的告警资源后,可将该告警资源对应的资源节点的信息进行存储,当在接收到该告警资源的告警信号时,可直接调用该告警资源对应的资源节点的信息以快速确定该告警资源的资源节点。
需要说明的是,告警信号对应的告警信息本身可能是业务指标,业务指标本身如果要正常运行,会连带一定的业务逻辑模板,即业务关系序列。这个业务逻辑模板中是一系列的环境信息检测,但是有一些是重点的有一些是非重点的,但是巡检的巡检项目可能会将多个巡检项目整合成为一个巡检任务。一个巡检项目可能是一个子任务,也可能多个巡检项目为一个子任务。
S103、执行所述第一巡检任务队列得到巡检报告,并输出所述巡检报告。
在S102中生成第一巡检任务队列后,触发执行第一巡检任务队列,这里,可根据第一告警信号的告警级别立即触发执行第一巡检任务队列,也可设置触发等待时间,在触发等待时间后执行第一巡检任务队列,在执行第一巡检任务队列后,输出执行所述第一巡检任务队列的巡检报告,巡检报告中包括有各子业务任务或独立的巡检任务的执行结果,其中,各执行结果中可输出该巡检项目的实际巡检结果和期望输出结果,以及实际输出结果和期望输出结果的误差,已给出巡检项目的巡检结论,从而根据巡检报告定位告警原因,这里,发生告警时,为节点1发生告警,导致节点1发生告警的实际原因为节点2的指标1发生错误,而在告警信号对应的告警信息中可能值携带节点1的故障原因,无法定位出节点2的指标1发生错误,而通过本发明实施例提供的巡检方法,能够根据节点1的告警信号定位出节点1发生告警的原因,即与节点1关联的节点2的指标1发生错误。。
在实际应用中,当生成巡检报告后,可将生成的巡检报告通过短信、邮件、等方式发送给运维人员,在发送给运维人员的巡检报告中,可只报告定位的故障项目,将执行结果正常的巡检项目不进行报告。
在执行第一巡检任务队列之前,检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。第二巡检任务队列为根据S301和S302的步骤生成的第二告警信号对应的巡检任务队列。这里,第二巡检任务队列为未执行的临时存储的巡检任务队列。
这里,对将所述相同的子业务任务进行归并处理包括:获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。排序信息表征子业务任务在巡检任务队列中的排序前后,其中,排序信息可通过权重值来进行表示,当权重值越大,则表征该子业务任务越与发生告警信号的告警源的关联度越高,执行的顺序越靠前。
在根据所述第一排序信息和所述第二排序信息得到调整后的排序信息时,可将第一排序信息和第二排序信息进行加权平均得到调整后的排序信息,按照调整后的排序信息来确定相同的子业务任务在第一巡检任务中的执行顺序。
在本发明实施例中,当接收到多个告警信号时,根据告警信号的告警级别确定各告警信号对应的巡检任务队列的执行书序,这里,告警级别也可称为故障级别。比如:接收到告警信号1、告警信号2、告警信号3时,分别对应生成巡检任务队列1、巡检任务队列2和巡检任务队列3,其中,告警信号2的告警级别高于信号1的告警级别,告警信号1的告警信号级别高于告警信号3的告警级别,因此,巡检任务队列1、巡检任务队列2和巡检任务队列3的执行顺序为巡检任务队列2、巡检任务队列2、巡检任务队列3。
在执行第一告警信号对应的第一巡检队列时,如果存在告警级别高于第一告警信号的第三告警信号对应的第三巡检任务队列时,第三巡检任务队列先于第一巡检任务队列,此时,在执行第三巡检任务队列时,可确定第三巡检任务队列和生成的且未执行的第一巡检任务队列中是否存在相同的子业务任务,当存在相同的子业务任务时,对相同的子业务任务进行归并处理。
当同时接收到多个同样告警级别的告警信号时,在生成个告警信号对应的巡检任务队列后,检测各巡检任务队列中是否存在相同的子业务任务,当存在相同的子业务任务时,对相同的子业务任务进行归并处理。
在本发明实施例中,通过对不同巡检任务队列中的相同的子业务任务的归并处理,调整相同的子业务任务的执行顺序,从而优先将关联度高的子业务任务进行优先处理,以保证关联度高的子业务任务的执行率。
在执行第一村建任务队列之后,还包括:接收到修复操作通知后,执行所述第一巡检任务队列得到修复报告,并输出所述修复报告。具体的,在执行第一巡检任务队列并生成第一巡检任务队列的巡检报告后,运维人员可根据巡检报告定位发出告警的原因,并基于告警原因进行修复操作,其中,可对发生告警信号的告警资源进行修复操作,也可对关联资源进行修复操作,当对资源节点进行修复操作后,生成修复操作通知,并将修复操作通知发送给网管设备。当网管设备接收到资源修复操作通知后,执行所述第一巡检任务队列,并输出执行所述第一巡检任务队列的修复报告。这里,在接收到修复操作通知后再次执行第一巡检任务队列,以确定告警原因是否修复,并根据修复报告确定修复的结果。
在实际应用中,当设备发生故障时,先通过告警方式进行上报;然后巡检系统根据上报告警,获取告警所处的操作维护对象,重新构建一个该操作维护对象所波及影响的设备资源对象树(资源树);再将根据资源中每个资源设备对象节点,构建其资源设备对象节点相关的维护业务树(业务树),进一步,根据资源树和业务树,以及根据优先级、价值权重、与该告警业务的关联度等信息,生成一个子业务任务巡检项的巡检任务队列。执行该巡检任务队列,根据资源树关系和业务树方式生产巡检报告和修复报告。
需要说明的是,执行过的任务路径会存放在历史库中,一旦发生同样的告警,比较完成后,将从历史库中调用已计算过的资源树和业务树的任务队列,并直接执行该自动化任务,生成巡检报告和修复报告。
在本实施例中,当业务系统中的站点发生告警信号时,基于设定的资源关系序列和业务关系序列确定需要进行巡检的资源节点和巡检项目,根据故障发生源和硬件监控点即时反馈信息进行的一个巡检任务处理,从而不需要等待运维人员对告警信号进行重现,以确定故障原因,减少设备故障检测的人为发现的滞后性,从而减少故障对于通讯网络和运营商的影响。进一步的,能够自动根据告警发生源所在的资源和业务进行双重筛选,创建巡检任务,生成巡检报告,能够很好的提升日常运维的效率,减少运维人员的各人经验的依赖度。
实施例二
在本发明实施例中,对本发明实施例提供的巡检的方法进行进一步说明,如图2所示,巡检的方法包括:
S201、接收告警信号,生成告警信号对应的巡检任务队列;
当设备发生故障时,发出告警信号,此时,发生故障的设备发送告警信号给网管设备,这里,发生故障的设备发送给网管设备的告警信号可不为告警信号本身,只发送告警通知,在告警通知中携带发生告警信号的设备的信息和告警码。这里,生成巡检任务队列的过程如图3所示,具体包括:
S2011、接收到告警信号;
S2012、查询告警资源,并根据资源存储关系构建资源树。
在接收到告警信号后,确定发生告警信号的告警资源,即发生告警的设备,并根据存储的资源关系构建资源树,这里,存储的资源关系即为资源关系序列。
S2013、根据资源树节点,构建查找相应的业务树。
在确定资源树后,根据告警信号的告警类型确定S202中的资源树中的资源节点需要巡检的巡检项目,在资源树的基础上构建业务树。
构建的资源树可如图4所示,在图4所示的资源树中,资源节点包括:网元管理系统(Element Management System,EMS)、代理1、子网1、无线网络控制器(Radio NetworkController,RNC)1、基站收发信台(Base Transceiver Station,BTS)1、BTS2、代理2、子网2、RNC2、BTS3、BTS4,其中,代理1和代理2为EMS的子节点,子网1为代理1的子节点,RNC1为子网1的子节点,BTS1、BTS2为RNC1的子节点,以此类推。其中,在图3中为了对业务树进行说明,只示出了RNC1的部分RNC业务,包括:性能巡检项、告警巡检项、状态巡检项和配置巡检项。
S2014、根据资源、巡检业务构建巡检子业务任务,并根据巡检子业务任务构建巡检任务队列。
这里,根据S202中确定的资源树中的资源节点和S203中确定的业务树中的巡检业务确定资源节点的巡检项目,并根据资源节点的巡检项目确定巡检该巡检项目的子业务任务,根据确定的子业务任务构建巡检任务队列。其中,当资源节点中存在独立资源节点时,将独立资源节点的巡检项目对应的子业务任务根据资源节点进行拆解,拆解成独立的巡检任务。
S202、执行巡检任务序列,输出巡检报告;
当生成巡检任务序列后,执行巡检任务序列,并输出执行巡检任务序列的巡检报告;其中,根据告警信号的级别可立即执行巡检任务队列,也可在一定时间后再执行该告警信号对应的巡检任务队列。
S203、通知运维人员;
在输出巡检报告后,通过短信、邮件的等方式将巡检报告的结果通知给运维人员,其中,通知各运维人员的巡检报告的结果可为巡检报告本身,也可为定位出的故障部分。
S204、接收到修复操作时,执行巡检任务队列,输出修复报告;
当接收到运维人员的修复操作时,执行巡检任务队列,这里,可在接收到修复操作时,生成修复操作同时,基于修复操作的触发执行巡检任务队列。此时,执行巡检任务队列的输出报告为修复报告。
S205、将巡检报告和修复报告进行对比,确认修复效果。
在输出修复报告后,将修复报告和巡检报告进行对比,确定故障是否已修复。
实施例三
在本发明实施例,分别对输入单个告警信号和多个告警信号的情况下的巡检的方法进行说明,具体的:
单个告警输入时,先根据告警发生的告警资源节点,构建对应的资源树,再将根据资源节点中每个资源设备对象节点,构建业务树。根据资源树和业务树确定资源节点的巡检项目,对各资源节点的巡检项目根据优先级、价值权重、与该告警业务的关联度等优先级参数生产巡检任务队列。
当多告警输入时,首先根据告警级别定义需要触发巡检任务的紧急度;如有严重告警,先针对该严重告警生成资源树和业务树,根据资源树和业务树生成巡检任务队列。如在任务触发前,仍有一定的较低级别的告警与该告警生成的资源树和业务树匹配,则将严重告警对应的巡检任务队列和低级别的告警对应的巡检任务队列进行归并,与该严重告警共同生成巡检任务。如告警级别较低,则在一定时间内(10分钟~30分钟)将该时间段内发生的所有的告警的巡检任务,进行对队列子任务归并。
因为巡检设备所处资源存在一定的独立性,即可独立执行任务,在物理部署上存在一定的独立性,如网管物理架构可拆分的独立资源包含:EMS服务器、OMMR服务器、OMMB服务器、RNC、BTS、RNC单板、BTS单板等,而独立资源的相关巡检项是可独立执行,因此在整个告警触发的归并的子任务队列,则需要根据独立资源属性进行拆分,拆分成多个任务;当前该步骤则主要是进行任务拆分。根据资源是否为独立资源,将对应的子业务任务从巡检任务队列中进行拆分,将巡检任务队列拆分成多个独立资源的任务。
在确定独立资源对应的任务时,从已创建的任务表中确认是否已经创建过同样的资源对应的任务队列,如果已有,则直接获取后下发执行,没有则先创建该任务队列并将创建的任务队列进行保存,然后将该任务进行下发执行。这里,首先根据告警的触发类型,生成一套业务模板树,此时如果输入该独立资源信息,即可生成一套匹配完整的资源子任务模板队列。
对于至少来两个巡检任务队列中存在相同的子业务任务时,对于相同的子业务任务进行归并处理,归并处理的归并算法具体如下:如果存在相同的子业务任务,但是其生成的综合排序优先级不一致,会做两个任务加权平均的值进行赋予合并后的子业务任务。
实施例四
在本发明实施例中,对本发明实施例提供的巡检方法进行进一步说明,具体的,如图5所示,包括:
S501、接收告警信号;
S502、根据告警信号的告警资源生成资源树;
S503、确定资源树中的资源节点是否可拆分成独立的资源节点;
当是执行S504,否则执行S505。
S504、根据资源节点拆分为多个可独立的独立资源;
此时,分别对多个独立资源建立巡检任务
S505、根据资源节点建立巡检任务;
S506、对于一资源节点,检测是否已创建相同的资源节点对应的巡检任务队列;
当存在相同的资源节点对应的任务队列时,执行S507直接获取任务队列,否则执行S508、构建资源树;
S509、根据资源树的每个资源节点生成需要巡检的巡检项目,构建业务树;
S510、根据所有资源节点的巡检项目对应的子业务任务生成巡检任务队列;
其中,在生成巡检任务队列时,根据业务的价值、与告警资源的关联度、系统目前预设的可供巡检执行的资源占用量,对子业务任务进行裁剪,根据裁剪后的子业务任务生成巡检任务队列。
在生成巡检任务队列后,将巡检任务队列进行存储,可存储在数据库中。
S511、执行巡检任务队列。
在执行巡检任务队列后,输出巡检报告。
在实际应用中,当系统中存储有资源节点对应的巡检任务队列时,则直接获取,否则,通过构建资源树和业务树的方式生成告警信号对应的巡检任务队列。这里,对一告警信号,可同时存在多个独立的资源节点,则对于存在已建立的任务队列时,则直接获取,对于未存在已建立的任务队列时,则通过资源树和业务树生成任务队列,并将获取的任务队列和生成的任务队列进行合并生成该告警信号对应的巡检任务的队列。
实施例五
在本发明实施例中,通过具体的实例对本发明实施例提供的巡检的方法进行进一步说明。
实例一
RNC(控制器)上报告警19005的告警,EMS收到告警信号的告警信息后,先将告警信息入库,该告警信号属于网元yy-test,网元内的定位为RNC地面资源管理(V4)=1,机架=1,机框=1,单板=26,CPU=1;
根据控制器网元内定位资源位置,将该网元目前的所包含的资源构建一个资源树;再根据每一个资源节点查找需要检查的巡检项;例如:网元包含的巡检项有当前告警统计TOP10,当前历史告警TOP10等;机架1,机框1,单板1则包含单板状态检查巡检项、单板性能检查等;
将资源和该资源需要检查的巡检项组合成多个巡检子任务,并根据巡检项的优先级、重要性、告警关联度等信息配置在子任务信息中。subTask001,该任务信息中,包含子任务的优先级、重要性、告警关联度等信息生成的一个子任务综合衡量指标。该指标的生成算法,属于一个独立配置模块,
依次根据资源树,构建完成所有的子任务。将所有的子任务,根据优先级、重要性、告警关联度、历史任务执行耗时等做一个综合排序。将所有的子任务,构建成一个巡检任务Task10001,并将该任务保存在数据库中,进行记录。
当巡检任务构建完成,开始执行该任务Task10001。任务执行完成,通知运维人员,将该巡检报告已邮件方式发送、短信等方式发送给运维人员。当运维人员修复问题单板后,然后将再执行一次Task10001的任务,并将前后的两次执行结果进行对比,并将该修复方式记录,存放数据库中。
实例二
RNC上报告警19005(该告警级别为轻微),EMS收到告警信号的告警信息后,先将告警入库,该告警信号属于网元yy-test,网元内的定位为RNC地面资源管理(V4)=1,机架=1,机框=1,单板=26,CPU=1。
5分钟后,RNC又上报了告警19006(该告警级别为严重),EMS综合网管收到告警信号的告警信息后,先将告警入库,该告警也属于网元yy-test,网元内的定位为RNC地面资源管理(V4)=1,机架=1,机框=1,单板=27,CPU=2。
基于先接收到19005告警,先根据该告警触发生成巡检任务队列Task0001,并将生成的巡检任务队列Task0001保存至巡检工具临时任务存储中。当严重告警19006发生后,也生成自动生成巡检任务队列Task0002。
触发任务Task0002分发前,去巡检工具临时任务存储查找是否有临时任务,查找发现存在Task0001临时任务,比较是否有相同的子任务;有相同子任务,然后将Task0001和Task0002的相同子任务进行归并生成需要下发的巡检任务队列Task1003。
执行巡检任务队列Task1003,任务执行完成,通知运维人员,将该巡检报告已邮件方式发送、短信等方式发送给运维人员。运维人员修复问题单板后,然后将再执行一次Task1003的任务,并将前后的两次执行结果进行对比。并将该修复方式记录,存放数据库中。
实例三
RNC1上报告警19005(该告警级别为轻微),EMS收到告警信号的告警信息后,先将告警入库,该告警信号属于网元yy-test1,网元内的定位为RNC地面资源管理(V4)=1,机架=1,机框=1,单板=26,CPU=1。
1分钟后,RNC2又上报了告警19006(该告警级别为严重),EMS收到告警信号的告警信息后,先将告警入库,该告警信号也属于网元yy-test2,网元内的定位为RNC2地面资源管理(V4)=1,机架=1,机框=1,单板=27,CPU=2。
接收到19005告警信号,先根据该告警信号触发生成巡检任务队列Task0004,并将Task0004保存至巡检工具临时任务存储中。当严重告警19006发生后,生成对应的巡检任务队列Task0005;
触发任务Task0005分发前,去检工具临时任务存储查找是否有临时任务,查找发现存在Task0001、Task0002、Task0003、Task0004临时任务存在,比较发现Task0001与Task0005归属于同一个独立资源,而其他的临时任务属于其他独立资源并未到归并触发时间;先将Task0001与Task0005两个任务进行归并处理,生成触发任务Task10001,执行下发。
执行巡检任务队列Task10001,任务执行完成,通知运维人员,将该巡检报告已邮件方式发送、短信等方式发送给运维人员。运维人员修复问题单板后,然后将再执行一次Task0003的任务,并将前后的两次执行结果进行对比。并将该修复方式记录,存放数据库中。
实施例六
为实现上述实施例提供的巡检的方法,本发明实施例提供一种巡检的装置,如图6所示,所述装置包括:告警单元601、任务生成单元602和执行单元603;其中,
告警单元601,用于接收到第一告警信号,确定所述第一告警信号对应的告警资源;
任务生成单元602,用于确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;
执行单元603,用于执行所述第一巡检任务队列得到巡检报告,并输出所述巡检报告。
如图7所示,任务生成单元602包括:资源模块6021,用于根据所述告警资源和关联资源的资源关系序列确定所述告警资源的关联资源。
任务生成单元602还包括;业务模块6022,用于根据所述告警信号和巡检项目的业务关系序列确定资源节点的巡检项目。
任务生成单元602包括;任务模块6023,用于:
根据所述巡检项目的优先级参数确定所述巡检项目对应的子业务任务的队列顺序;根据所述队列顺序对所述巡检项目对应的子业务任务进行排序生成所述第一巡检任务队列。
如图7所示,所述装置还包括:拆分单元604,用于:
检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。
所述装置还包括:检测单元605,用于:
检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。
检测单元605,将所述相同的子业务任务进行归并处理包括:获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。
所述装置还包括:分析单元606,用于接收修复操作通知后,执行所述第一巡检任务队列得到修复报告,并输出所述修复报告。
需要说明的是:上述实施例提供的巡检的装置在进行巡检时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的巡检的装置与巡检的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
实施例七
本发明实施例还提供了一种巡检的装置,该巡检的装置包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行:
接收到第一告警信号,确定所述第一告警信号对应的告警资源;确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;执行所述第一巡检任务队列得到巡检报告,并输出所述巡检报告。
所述处理器还用于运行所述计算机程序时,执行所述确定所述告警资源的关联资源包括:根据所述告警资源和关联资源的资源关系序列确定所述告警资源的关联资源。
所述处理器还用于运行所述计算机程序时,执行所述确定资源节点的巡检项目包括:根据所述告警信号和巡检项目的业务关系序列确定资源节点的巡检项目。
所述处理器还用于运行所述计算机程序时,执行所述根据所述资源节点巡检项目对应的子业务任务生成第一巡检任务队列包括:根据所述巡检项目的优先级参数确定所述巡检项目对应的子业务任务的队列顺序;根据所述队列顺序对所述巡检项目对应的子业务任务进行排序生成所述第一巡检任务队列。
所述处理器还用于运行所述计算机程序时,还执行:检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。
所述处理器还用于运行所述计算机程序时,在执行所述第一巡检任务队列之前,还执行:检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。
所述处理器还用于运行所述计算机程序时,执行将所述相同的子业务任务进行归并处理包括:
获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;
获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;
根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。
所述处理器还用于运行所述计算机程序时,还执行:接收修复操作通知后,执行所述第一巡检任务队列得到修复报告,并输出所述修复报告。
基于此,图8是本发明另一实施例的巡检的装置的结构示意图,图8所示的巡检的装置800包括:至少一个处理器801和存储器802。巡检的装置800中的各个组件通过总线系统803耦合在一起。可理解,总线系统803用于实现这些组件之间的连接通信。
可以理解,存储器802可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器802旨在包括但不限于这些和任意其它适合类型的存储器。
本发明实施例中的存储器802用于存储各种类型的数据以支持巡检的装置800的操作。
上述本发明实施例揭示的方法可以应用于处理器801中,或者由处理器801实现。处理器801可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器801中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器801可以是通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器801可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器802,处理器801读取存储器802中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,巡检的装置800可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
实施利八
在示例性实施例中,本发明实施例还提供了一种计算机可读存储介质,例如包括计算机程序的存储器802,上述计算机程序可由巡检的装置的处理器801执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器运行时,执行:接收到第一告警信号,确定所述第一告警信号对应的告警资源;确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;执行所述第一巡检任务队列得到巡检报告,并输出所述巡检报告。
所述计算机程序被处理器运行时,执行所述确定所述告警资源的关联资源包括:根据所述告警资源和关联资源的资源关系序列确定所述告警资源的关联资源。
所述计算机程序被处理器运行时,执行所述确定资源节点的巡检项目包括:根据所述告警信号和巡检项目的业务关系序列确定资源节点的巡检项目。
所述计算机程序被处理器运行时,执行所述根据所述资源节点巡检项目对应的子业务任务生成第一巡检任务队列包括:根据所述巡检项目的优先级参数确定所述巡检项目对应的子业务任务的队列顺序;根据所述队列顺序对所述巡检项目对应的子业务任务进行排序生成所述第一巡检任务队列。
所述计算机程序被处理器运行时,还执行:检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。
所述计算机程序被处理器运行时,在执行所述第一巡检任务队列之前,还执行:检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。
所述计算机程序被处理器运行时,执行所述将所述相同的子业务任务进行归并处理包括:
获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;
获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;
根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。
所述计算机程序被处理器运行时,在执行所述第一巡检任务队列之后,还执行:接收修复操作通知后,执行所述第一巡检任务队列得到修复报告,并输出所述修复报告。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (12)

1.一种巡检的方法,其特征在于,所述方法包括:
接收到第一告警信号,确定所述第一告警信号对应的告警资源;
确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;
执行所述第一巡检任务队列得到巡检报告;
所述确定资源节点的巡检项目包括:
根据所述告警信号和巡检项目的业务关系序列确定资源节点的巡检项目。
2.根据权利要求1所述的方法,其特征在于,所述确定所述告警资源的关联资源包括:
根据所述告警资源和关联资源的资源关系序列确定所述告警资源的关联资源。
3.根据权利要求1所述的方法,其特征在于,所述根据所述资源节点巡检项目对应的子业务任务生成第一巡检任务队列包括:
根据所述巡检项目的优先级参数确定所述巡检项目对应的子业务任务的队列顺序;
根据所述队列顺序对所述巡检项目对应的子业务任务进行排序生成所述第一巡检任务队列。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。
5.根据权利要求1所述的方法,其特征在于,在执行所述第一巡检任务队列之前,所述方法还包括:
检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;
检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。
6.根据权利要求5所述的方法,其特征在于,所述将所述相同的子业务任务进行归并处理包括:
获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;
获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;
根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。
7.一种巡检的装置,其特征在于,所述装置包括:告警单元、任务生成单元和执行单元;其中,
所述告警单元,用于接收到第一告警信号,确定所述第一告警信号对应的告警资源;
所述任务生成单元,用于确定所述告警资源的关联资源,并确定资源节点的巡检项目,根据所述资源节点的巡检项目对应的子业务任务生成第一巡检任务队列,所述资源节点包括所述告警资源和所述关联资源;
所述执行单元,用于执行所述第一巡检任务队列得到巡检报告,并输出所述巡检报告
所述确定资源节点的巡检项目包括:
根据所述告警信号和巡检项目的业务关系序列确定资源节点的巡检项目。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:拆分单元,用于:
检测到所述资源节点中包括相互独立的独立资源节点,将所述独立资源节点对应的子任务队列从所述第一巡检任务队列中拆分为独立执行的巡检任务。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:检测单元,用于:
检测到告警级别不高于所述告警信号的第二告警信号和所述第二告警信号对应的第二巡检任务队列;
检测到所述第一巡检任务队列和所述第二巡检任务队列存在相同的子业务任务,将所述相同的子业务任务进行归并处理,得到调整后的第一巡检任务队列。
10.根据权利要求9所述的装置,其特征在于,所述检测单元,将所述相同的子业务任务进行归并处理包括:
获取所述相同子业务任务在所述第一巡检任务队列中的第一排序信息;
获取所述相同子业务任务在所述第二巡检任务队列中的第二排序信息;
根据所述第一排序信息和所述第二排序信息得到调整后的排序信息,将所述调整后的排序信息作为所述相同子业务任务在所述第一巡检任务队列中的排序信息。
11.一种巡检的装置,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行权利要求1至6任一项所述方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的巡检的方法。
CN201711002275.9A 2017-10-24 2017-10-24 一种巡检的方法、装置及计算机可读存储介质 Active CN109698763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711002275.9A CN109698763B (zh) 2017-10-24 2017-10-24 一种巡检的方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711002275.9A CN109698763B (zh) 2017-10-24 2017-10-24 一种巡检的方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109698763A CN109698763A (zh) 2019-04-30
CN109698763B true CN109698763B (zh) 2021-07-13

Family

ID=66227852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711002275.9A Active CN109698763B (zh) 2017-10-24 2017-10-24 一种巡检的方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109698763B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110365520B (zh) * 2019-06-14 2021-12-14 创新先进技术有限公司 分布式系统中节点的巡检方法、装置及设备
CN111191937B (zh) * 2019-12-31 2023-12-29 深圳市计通智能技术有限公司 一种告警危害评估方法、系统及终端设备
CN112637887B (zh) * 2020-12-16 2023-02-28 中国联合网络通信集团有限公司 Ipran设备巡检方法、装置、设备、介质及产品
CN113747117A (zh) * 2021-07-22 2021-12-03 南方电网深圳数字电网研究院有限公司 视频终端巡检方法及设备、计算机可读存储介质
CN113793428A (zh) * 2021-09-14 2021-12-14 国网江苏省电力有限公司常州供电分公司 手持终端巡检方法和系统
CN115086148B (zh) * 2022-07-15 2024-01-30 中国电信股份有限公司 光网络告警处理方法、系统、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102054297A (zh) * 2009-11-03 2011-05-11 中国移动通信集团辽宁有限公司 基站巡检方法及巡检系统
JP2013254364A (ja) * 2012-06-07 2013-12-19 Toshiba Corp ダム制御装置及び方法
CN103699075A (zh) * 2013-12-11 2014-04-02 国家电网公司 基于视频监控的变电站巡检智能调度与控制系统
CN104301138A (zh) * 2014-09-24 2015-01-21 蓝盾信息安全技术有限公司 一种自动产生系统巡检的方法
CN106972942A (zh) * 2016-01-13 2017-07-21 中国移动通信集团山西有限公司 告警处理方法及系统
CN107195013A (zh) * 2017-05-11 2017-09-22 国网山东省电力公司信息通信公司 一种细粒度控制的运维自动化巡检方法及其系统
CN107270921A (zh) * 2016-04-08 2017-10-20 中国移动通信集团四川有限公司 一种代维巡检路径规划方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102054297A (zh) * 2009-11-03 2011-05-11 中国移动通信集团辽宁有限公司 基站巡检方法及巡检系统
JP2013254364A (ja) * 2012-06-07 2013-12-19 Toshiba Corp ダム制御装置及び方法
CN103699075A (zh) * 2013-12-11 2014-04-02 国家电网公司 基于视频监控的变电站巡检智能调度与控制系统
CN104301138A (zh) * 2014-09-24 2015-01-21 蓝盾信息安全技术有限公司 一种自动产生系统巡检的方法
CN106972942A (zh) * 2016-01-13 2017-07-21 中国移动通信集团山西有限公司 告警处理方法及系统
CN107270921A (zh) * 2016-04-08 2017-10-20 中国移动通信集团四川有限公司 一种代维巡检路径规划方法及装置
CN107195013A (zh) * 2017-05-11 2017-09-22 国网山东省电力公司信息通信公司 一种细粒度控制的运维自动化巡检方法及其系统

Also Published As

Publication number Publication date
CN109698763A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN109698763B (zh) 一种巡检的方法、装置及计算机可读存储介质
CN109995612B (zh) 一种服务巡检方法、装置及电子设备
CN105099783A (zh) 一种实现业务系统告警应急处置自动化的方法及系统
CN110932901B (zh) 一种告警等级调整方法及系统
CN100586202C (zh) 故障定位的方法及装置
KR102200275B1 (ko) 네트워크 장애경보 관리장치 및 방법
US20230327941A1 (en) Alarm processing method and apparatus, device, and readable storage medium
CN109815085A (zh) 告警数据的分类方法、装置和电子设备及存储介质
CN110661660B (zh) 告警信息根源分析方法及装置
CN108804574B (zh) 告警提示方法、装置、计算机可读存储介质及电子设备
WO2023055405A1 (en) Static and dynamic non-deterministic finite automata tree structure application apparatus and method
GB2508499A (en) Determining related messages for filtering groups of error messages
CN115865611A (zh) 一种网络设备的故障处理方法、装置及电子设备
EP4047481A1 (en) Method and apparatus for recommending fault repairing operation, and storage medium
CN114595075A (zh) 一种基于分布式调度的网络编排中异步任务执行方法
CN112214517A (zh) 流数据处理方法及装置、电子设备、存储介质
CN115509714A (zh) 一种任务处理方法、装置、电子设备及存储介质
EP4181475A1 (en) Method, apparatus and system for processing fault
CN115941441A (zh) 系统链路自动化监控运维方法、系统、设备以及介质
CN114860543A (zh) 异常检测方法、装置、设备与计算机可读存储介质
CN110619737B (zh) 一种联防报警方法及装置
CN113918204A (zh) 一种元数据脚本管理方法、装置、电子设备和存储介质
CN113807697A (zh) 基于告警关联的派单方法及装置
CN110825466A (zh) 一种程序卡顿的处理方法以及卡顿处理装置
CN112529438B (zh) 分布调度系统工作流处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant