CN109308252A - 一种故障定位处理方法及装置 - Google Patents

一种故障定位处理方法及装置 Download PDF

Info

Publication number
CN109308252A
CN109308252A CN201710623864.2A CN201710623864A CN109308252A CN 109308252 A CN109308252 A CN 109308252A CN 201710623864 A CN201710623864 A CN 201710623864A CN 109308252 A CN109308252 A CN 109308252A
Authority
CN
China
Prior art keywords
network element
element node
data information
service
different levels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710623864.2A
Other languages
English (en)
Other versions
CN109308252B (zh
Inventor
郭岳
潘宇虹
唐小丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201710623864.2A priority Critical patent/CN109308252B/zh
Publication of CN109308252A publication Critical patent/CN109308252A/zh
Application granted granted Critical
Publication of CN109308252B publication Critical patent/CN109308252B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/366Software debugging using diagnostics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3636Software debugging by tracing the execution of the program
    • G06F11/364Software debugging by tracing the execution of the program tracing values on a bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3644Software debugging by instrumenting at runtime

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种故障定位处理方法及装置。所述方法包括:根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括业务指标及所述业务子系统包括的各级网元节点的运行数据信息;根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。所述装置用于执行上述方法。本发明提供的方法及装置提高了故障定位效率。

Description

一种故障定位处理方法及装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种故障定位处理方法及装置。
背景技术
当前营业厅业务系统的功能早已突破以往单纯的业务办理,逐步走向了以服务营销、品牌传播为主,业务办理和业务咨询为辅的管理模式,因此,营业厅白屏现象作为影响营业厅业务系统的正常运行的问题之一,其故障定位问题越来越受到人们的关注。
由于庞大的营业厅业务系统涉及到了众多的中间件、数据库、主机、存储及交换机等非应用层网元节点,以及Web、网络及App等应用层网元节点,现有技术条件下,传统的监控系统都是针对各个非应用层网元节点进行竖井式监控,如数据库监控系统,主机监控系统和中间件监控系统等,但由于众多非应用层网元节点一般都隶属不同的专业组负责,甚至会跨科室或跨部门,当问题出现时需要调度众多的专业组进行检查分析,一方面调度时间过长,另一方面各专业组一般都只关注本专业组涉及的网元节点的技术问题,即便发现异常也不能确定是否与整个营业厅业务系统的异常有直接关系,需要各个专业组对所有的网元节点的监控信息进行汇总后再由经验丰富的技术人员总体评估判断,才能进行故障定位,且由于依赖于技术人员的经验,对于故障定位的准确性也有一定的影响,上述种种原因都会大大影响业务子系统的故障定位的效率。
因此,如何提出一种方法来提高故障定位的效率是目前业界亟待解决的需要课题。
发明内容
针对现有技术中的缺陷,本发明实施例提供一种故障定位处理方法及装置。
一方面,本发明实施例提供一种故障定位处理方法,包括:
根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括:业务指标及所述业务子系统包括的各级网元节点的运行数据信息;
根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
另一方面,本发明实施例提供一种故障定位处理装置,包括:
采集单元,用于根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括:业务指标及所述业务子系统包括的各级网元节点的运行数据信息;
定位单元,用于根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
又一方面,本发明实施例提供一种电子设备,包括处理器、存储器和总线,其中:
所述处理器,所述存储器通过总线完成相互间的通信;
所述处理器可以调用存储器中的计算机程序,以执行上述方法的步骤。
再一方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
本发明实施例提供的故障定位处理方法及装置,通过根据采集到的各业务子系统的业务数据信息中包括的业务指标,若判断获知所述业务子系统发生业务异常,则根据采集到的各业务子系统的业务数据信息中包括的各级网元节点的运行数据信息确定目标故障网元节点,提高了业务子系统故障定位效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的故障定位处理方法的流程示意图;
图2为本发明实施例提供的故障定位处理方法的整体流程示意图;
图3为本发明实施例提供的故障定位处理装置的结构示意图;
图4为本发明实施例提供的电子设备实体装置结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的故障定位处理方法的流程示意图,如图1所示,本实施例提供一种故障定位处理方法,包括:
S101、根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括业务指标及所述业务子系统包括的各级网元节点的运行数据信息;
具体地,营业厅业务系统包括多个业务子系统,各业务子系统承载不同的业务,由于不同的业务子系统可能涉及相同的网元节点,因此,本发明实施例可以基于现有的整体业务系统构架的部署关系,预先将不同的业务子系统的数据信息配置各自的业务标签,当一个网元节点在不同的业务子系统中承载不同的业务时,故障定位处理装置可以根据所述业务标签在所述网元节点的运行数据信息中选出与当前业务子系统相关的运行数据信息,即所述装置根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括业务指标及所述业务子系统包括的各级网元节点的运行数据信息,所述业务数据信息还可以包括其他信息,具体可以根据实际情况进行调整,此处不做具体限定;其中,所述业务指标可以包括业务办理成功率和业务办理时延,还可以包括其他业务指标;所述各级网元节点至少包括应用层各级网元节点,所述应用层各级网元节点的运行数据信息包括应用日志;所述各级网元节点还可以包括非应用层网元节点,所述非应用层网元节点的运行数据信息包括运行参数,具体可以根据实际情况进行调整,此处不做具体限定。
S102、根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
具体地,所述装置将所述业务子系统的所述业务指标与相应的、预先储存的业务指标健康值进行对比,若判断获知所述业务指标与所述业务指标健康值的差值不小于预设阈值,则确定所述业务子系统发生业务异常,则所述装置根据所述业务子系统的所述各级网元节点的运行数据信息确定目标故障网元节点。应当说明的是,所述业务指标健康值为根据长期运行维护经验进行预先设置的,并且可以每隔预设周期根据本周期内的业务指标的实际情况进行调整和修正,所述业务指标包括但不限于业务办理成功率、业务办理时延流量、进程负载、夯、内存换页、异常会话数、锁堵塞、延迟、中断、应用日志信息异常关键词等。
本发明实施例提供的故障定位处理方法,通过根据采集到的各业务子系统的业务数据信息中包括的业务指标,若判断获知所述业务子系统发生业务异常,则根据采集到的各业务子系统的业务数据信息中包括的各级网元节点的运行数据信息确定目标故障网元节点,提高了业务子系统故障定位效率。
在上述实施例的基础上,进一步地,所述根据所述各级网元节点的运行数据信息确定目标故障网元节点,包括:
根据运行数据信息,按照所述各级网元节点的层级由高到低,依次判断所述各级网元节点是否为故障网元节点;
将所述故障网元节点中层级最低的网元节点作为所述目标故障网元节点。
具体地,所述装置根据运行数据信息,按照所述各级网元节点的层级由高到低,依次判断所述各级网元节点是否为故障网元节点,将获得的所有故障网元节点中层级最低的网元节点作为所述目标故障网元节点。例如,业务子系统A包括的网元节点包括应用层网元节点和非应用层网元节点,其中,应用层网元节点按照层级由高到低依次为A1、A2、A3,非应用层网元节点按照层级由高到低依次为A4和A5,所述装置根据所述应用层网元节点A1、A2、A3的应用日志,依次判断所述应用层网元节点是否为故障网元节点,若A2为故障网元节点,但A3不是故障网元节点,所述装置则直接确定所述应用层节点A2为所述目标故障网元节点;若A2和A3均为故障网元节点,所述装置则根据非应用层网元节点A4和A5的运行参数,依次判断所述非应用层网元节点A4和A5是否为故障网元节点,若所述装置判断获知所述非应用层网元节点A4不是故障节点,则所述装置确定所述目标故障网元节点为应用程网元节点A3;若所述非应用层网元节点A4是故障网元节点,但所述非应用层网元节点A5不是故障网元节点,则所述装置确定所述目标故障网元节点为应用程网元节点A4
在上述实施例的基础上,进一步地,所述方法还包括:
根据所述目标故障网元节点的运行数据信息,确定所述业务子系统对应的异常事件;
根据所述异常事件和预先储存的异常事件处理策略数据库,对所述目标故障网元节点进行故障处理。
具体地,所述装置若判断获知所述目标故障网元节点为应用层网元节点,则根据所述目标故障网元节点的应用日志,确定所述目标故障网元节点对应的异常事件;若判断获知所述目标故障网元节点为非应用层网元节点,则根据所述非应用层网元节点的所述运行参数,确定所述目标故障网元节点对应的异常事件,然后,所述装置根据所述异常事件和预先储存的异常事件处理策略数据库,对所述目标故障网元节点进行故障处理。
本发明实施例提供的故障定位处理方法,通过根据采集到的各业务子系统的业务数据信息中包括的业务指标,若判断获知所述业务子系统发生业务异常,则根据采集到的各业务子系统的业务数据信息中包括的各级网元节点的运行数据信息确定目标故障网元节点,并根据异常事件和预先储存的异常事件处理策略数据库,对所述目标故障网元节点进行故障处理,同时提高了业务子系统故障定位效率和故障处理效率。
在上述实施例的基础上,进一步地,所述异常事件处理策略数据库包括多个标准异常事件,以及各所述标准异常事件对应的处理策略;相应地,所述根据所述异常事件和预先储存的异常事件处理策略数据库,对所述目标故障网元节点进行故障处理,包括:
将所述异常事件与多个标准异常事件进行匹配,若判断获知所述异常事件与所述标准异常事件相匹配,则自动按照所述标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复处理。
具体地,所述异常事件处理策略数据库包括多个标准异常事件,以及各所述标准异常事件对应的处理策略,所述装置将所述异常事件与多个标准异常事件进行匹配,若判断获知所述异常事件为所述标准异常事件中的一个,则所述装置自动按照该标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复。其中,所述标准异常事件包括应用异常、存储故障、操作系统夯、数据库夯、宕机、交换机异常、应用实例异常等,还可以包括其他异常事件;所述标准异常事件对应的处理策略可以包括停机、重启、负载均衡、交换机旁路、中断进程、踢出集群、集群切换、应急接管、堵塞隔离等,还可以包括其他处理策略,具体可以根据实际情况进行调整,此处不做具体限定。例如,应用集群中某个服务器夯导致业务异常,可以通过直接将夯服务器进行强制重启,该服务器所承载的业务会由集群其他实例接管,使得业务恢复正常;再如,数据库因存储异常而导致读写缓慢,导致业务异常,可以通过主备库角色切换,由灾备库进行业务接管,使得业务恢复正常。
应当说明的是,若所述目标故障网元节点为应用层网元节点,则所述目标故障网元节点对应的所述异常事件均为应用异常,其对应的处理策略为重启或负载均衡。另外,还需说明的是,所述装置还可以在判断获知所述异常事件与所述标准异常事件相匹配之后,在所述业务系统的操作界面显示故障恢复处理确认提示信息,在接收到进行故障恢复处理的确认信息后,按照所述标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复处理;当然,所述装置还可以对所述处理策略的有效性进行设置,例如,当所述异常事件对应的处理策略被设置为无效时,则所述装置无法按照所述处理策略对所述目标故障网元节点进行故障恢复处理。
在上述实施例的基础上,进一步地,所述方法还包括:
若判断获知所述异常事件与所述标准异常事件不相匹配,和/或,若判断获知自动按照所述标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复处理后,所述业务异常仍未恢复,则发送告警提示信息。
具体地,所述装置判断获知所述标准异常事件中不包括所述异常事件,则确定所述异常事件与所述标准异常事件不相匹配,则发送告警提示信息;和/或,所述装置判断获知所述异常事件与所述标准异常事件相匹配,且自动按照所述标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复处理后,根据所述业务指标对所述业务异常进行二次判断,若判断获知所述业务异常仍未恢复,则发送告警提示信息。可以理解的是,所述告警提示信息可以是显示在业务系统自身前台的告警提示信号,所述告警提示信号包括声音、指示灯或显示界面上的图标中的任意一种或其组合,也可以是通过语音/短信的API接口发送的语音消息或短信息,以便提示工作人员制定针对所述异常事件的处理策略,进行人工恢复处理。应当说明的是,所述装置还可以在人工恢复处理后,根据所述异常事件及所述异常事件对应的处理策略对所述异常事件处理策略数据库进行更新。
在上述各实施例中,所述各级网元节点包括各级应用层网元节点;相应地,所述运行数据信息包括所述各级应用层网元节点的应用日志。
具体地,所述各级网元节点包括各级应用层网元节点;相应地,所述运行数据信息包括所述各级应用层网元节点的应用日志。其中,所述各应用层网元节点的应用日志可以包括ESB接口日志、WEB层日志、后台进程日志等,还可以包括其他应用日志,具体可以根据实际情况进行调整,此处不做具体限定。
在上述各实施例中,所述各级网元节点还包括各级非应用层网元节点;相应地,所述运行数据信息包括所述各级非应用层网元节点的运行参数。
具体地,所述各级网元节点包括各级非应用层网元节点;相应地,所述运行数据信息包括所述各级非应用层网元节点的运行参数。其中,所述各级非应用层网元节点的运行参数包括运行日志、运行状态和运行性能参数等,还可以包括其他运行参数,具体可以根据实际情况进行调整,此处不做具体限定。
图2为本发明实施例提供的故障定位处理方法的整体流程示意图,如图2所示,本发明实施例提供的故障定位处理方法包括的步骤具体如下:
S201、采集业务数据信息;所述装置根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括业务指标及所述业务子系统包括的各级网元节点的运行数据信息;然后执行步骤S202;
S202、判断是否发生业务异常;所述装置将所述业务子系统的所述业务指标与相应的、预先储存的业务指标健康值进行对比,判断所述业务子系统是否发生业务异常;若是,则执行步骤S203;否则,返回执行步骤S201;
S203、确定目标故障网元节点;所述装置根据运行数据信息,按照所述各级网元节点的层级由高到低,依次判断所述各级网元节点是否为故障网元节点;将所述故障网元节点中层级最低的网元节点作为所述目标故障网元节点;然后执行步骤S204;
S204、确定异常事件;所述装置根据所述目标故障网元节点的运行数据信息,确定所述业务子系统对应的异常事件;然后执行步骤S205;
S205、判断异常事件与标准异常事件是否匹配;若是,则执行步骤S206,否则,执行步骤S211;
S206、判断是否自动进行故障恢复处理;若是,则执行步骤S209,否则,执行步骤S207;
S207、发送故障恢复处理确认提示信息;所述装置在所述业务系统的操作界面显示故障恢复处理确认提示信息;然后执行步骤S208;
S208、判断是否接收到故障恢复处理的确认信息;若是,则执行步骤S209;否则,执行步骤S211;
S209、进行故障恢复处理;所述装置按照所述标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复处理;然后执行步骤S210;
S210、判断业务异常是否恢复;若是,则返回执行步骤S201;否则,执行步骤S211;
S211、发送告警提示信息;所述装置在业务系统自身前台显示告警提示信号,或者通过语音/短信的API接口发送的语音消息或短信息,以便提示工作人员制定针对所述异常事件的处理策略,进行人工恢复处理;然后执行步骤S212;
S212、更新异常事件处理策略数据库;所述装置在工作人员制定针对所述异常事件的处理策略,进行人工恢复处理后,根据所述异常事件及所述异常事件对应的处理策略对所述异常事件处理策略数据库进行更新。
本发明实施例提供的故障定位处理方法,通过根据采集到的各业务子系统的业务数据信息中包括的业务指标,若判断获知所述业务子系统发生业务异常,则根据采集到的各业务子系统的业务数据信息中包括的各级网元节点的运行数据信息确定目标故障网元节点,并根据异常事件和预先储存的异常事件处理策略数据库,对所述目标故障网元节点进行故障处理,同时提高了业务子系统故障定位效率和故障处理效率。
图3为本发明实施例提供的故障定位处理装置的结构示意图,如图3所示,本发明实施例提供一种故障定位处理装置,包括:采集单元301和定位单元302,其中:
采集单元301用于根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括:业务指标及所述业务子系统包括的各级网元节点的运行数据信息;定位单元302用于根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
本发明实施例提供的故障定位处理装置,通过根据采集到的各业务子系统的业务数据信息中包括的业务指标,若判断获知所述业务子系统发生业务异常,则根据采集到的各业务子系统的业务数据信息中包括的各级网元节点的运行数据信息确定目标故障网元节点,提高了业务子系统故障定位效率。
本发明提供的装置的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图4为本发明实施例电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)401、存储器(memory)402和总线403,其中,处理器401,存储器402通过总线403完成相互间的通信。处理器401可以调用存储器402中的计算机程序,以执行如下方法:根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括:业务指标及所述业务子系统包括的各级网元节点的运行数据信息;根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括:业务指标及所述业务子系统包括的各级网元节点的运行数据信息;根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述各方法实施例所提供的方法,例如包括:根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括:业务指标及所述业务子系统包括的各级网元节点的运行数据信息;根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
此外,上述的存储器402中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种故障定位处理方法,其特征在于,包括:
根据预先配置的业务标签,采集各业务子系统的业务数据信息,所述业务数据信息包括业务指标及所述业务子系统包括的各级网元节点的运行数据信息;
根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
2.根据权利要求1所述的方法,其特征在于,所述根据所述各级网元节点的运行数据信息确定目标故障网元节点,包括:
根据运行数据信息,按照所述各级网元节点的层级由高到低,依次判断所述各级网元节点是否为故障网元节点;
将所述故障网元节点中层级最低的网元节点作为所述目标故障网元节点。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述目标故障网元节点的运行数据信息,确定所述业务子系统对应的异常事件;
根据所述异常事件和预先储存的异常事件处理策略数据库,对所述目标故障网元节点进行故障处理。
4.根据权利要求3所述的方法,其特征在于,所述异常事件处理策略数据库包括多个标准异常事件,以及各所述标准异常事件对应的处理策略;相应地,所述根据所述异常事件和预先储存的异常事件处理策略数据库,对所述目标故障网元节点进行故障处理,包括:
将所述异常事件与多个标准异常事件进行匹配,若判断获知所述异常事件与所述标准异常事件相匹配,则自动按照所述标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复处理。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若判断获知所述异常事件与所述标准异常事件不相匹配,和/或,若判断获知自动按照所述标准异常事件对应的处理策略对所述目标故障网元节点进行故障恢复处理后,所述业务异常仍未恢复,则发送告警提示信息。
6.根据权利要求1-5任意一项所述的方法,其特征在于,所述各级网元节点包括各级应用层网元节点;相应地,所述运行数据信息包括所述各级应用层网元节点的应用日志。
7.根据权利要求6所述的方法,其特征在于,所述各级网元节点还包括各级非应用层网元节点;相应地,所述运行数据信息还包括所述各级非应用层网元节点的运行参数。
8.一种异常定位处理装置,其特征在于,包括:
采集单元,用于采集各业务子系统的业务数据信息,所述业务数据信息包括业务指标及所述业务子系统包括的各级网元节点的运行数据信息;
定位单元,用于根据所述业务指标,若判断获知所述业务子系统发生业务异常,则根据所述各级网元节点的运行数据信息确定目标故障网元节点。
9.一种电子设备,其特征在于,包括处理器、存储器和总线,其中:
所述处理器,所述存储器通过总线完成相互间的通信;
所述处理器可以调用存储器中的计算机程序,以执行如权利要求1-7任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任意一项所述方法的步骤。
CN201710623864.2A 2017-07-27 2017-07-27 一种故障定位处理方法及装置 Active CN109308252B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710623864.2A CN109308252B (zh) 2017-07-27 2017-07-27 一种故障定位处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710623864.2A CN109308252B (zh) 2017-07-27 2017-07-27 一种故障定位处理方法及装置

Publications (2)

Publication Number Publication Date
CN109308252A true CN109308252A (zh) 2019-02-05
CN109308252B CN109308252B (zh) 2022-04-01

Family

ID=65202309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710623864.2A Active CN109308252B (zh) 2017-07-27 2017-07-27 一种故障定位处理方法及装置

Country Status (1)

Country Link
CN (1) CN109308252B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977017A (zh) * 2019-03-28 2019-07-05 北京粉笔蓝天科技有限公司 一种系统性能测试例筛选方法及系统
CN110138600A (zh) * 2019-04-28 2019-08-16 北京大米科技有限公司 一种提示信息输出方法、装置、存储介质及服务器
CN110223173A (zh) * 2019-05-20 2019-09-10 深圳壹账通智能科技有限公司 交易链路异常处理方法以及相关设备
CN110430071A (zh) * 2019-07-19 2019-11-08 云南电网有限责任公司信息中心 业务节点故障自愈方法、装置、计算机设备及存储介质
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质
CN112817827A (zh) * 2021-01-22 2021-05-18 中国银联股份有限公司 运维方法、装置、服务器、设备、系统及介质
CN112988831A (zh) * 2019-12-13 2021-06-18 深圳云天励飞技术有限公司 故障定位方法及相关装置
CN113839800A (zh) * 2020-06-24 2021-12-24 中国联合网络通信集团有限公司 异常网元提示方法、装置、电子设备及存储介质
CN113992348A (zh) * 2021-09-22 2022-01-28 北京东方通软件有限公司 一种一体机的监控方法及系统
CN114091930A (zh) * 2021-11-25 2022-02-25 深圳前海微众银行股份有限公司 业务指标预警方法、装置、电子设备和存储介质
CN114363149A (zh) * 2021-12-23 2022-04-15 上海哔哩哔哩科技有限公司 故障处理方法及装置
CN115499302A (zh) * 2022-08-17 2022-12-20 中国电信股份有限公司 业务系统的监测方法、装置、可读存储介质及电子设备
CN115865644A (zh) * 2022-11-09 2023-03-28 浪潮通信信息系统有限公司 业务故障处理方法、装置、设备及存储介质
CN116185787A (zh) * 2023-04-25 2023-05-30 深圳市四格互联信息技术有限公司 自学习型的监控告警方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101489243A (zh) * 2008-01-14 2009-07-22 中国移动通信集团公司 故障分析装置、方法及故障处理系统
CN103973902A (zh) * 2013-01-28 2014-08-06 中国移动通信集团浙江有限公司 一种用户感知业务质量的量化装置、监测系统和方法
CN103973496A (zh) * 2014-05-21 2014-08-06 华为技术有限公司 故障诊断方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101489243A (zh) * 2008-01-14 2009-07-22 中国移动通信集团公司 故障分析装置、方法及故障处理系统
CN103973902A (zh) * 2013-01-28 2014-08-06 中国移动通信集团浙江有限公司 一种用户感知业务质量的量化装置、监测系统和方法
CN103973496A (zh) * 2014-05-21 2014-08-06 华为技术有限公司 故障诊断方法及装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977017A (zh) * 2019-03-28 2019-07-05 北京粉笔蓝天科技有限公司 一种系统性能测试例筛选方法及系统
CN110138600A (zh) * 2019-04-28 2019-08-16 北京大米科技有限公司 一种提示信息输出方法、装置、存储介质及服务器
CN110223173A (zh) * 2019-05-20 2019-09-10 深圳壹账通智能科技有限公司 交易链路异常处理方法以及相关设备
WO2020233066A1 (zh) * 2019-05-20 2020-11-26 深圳壹账通智能科技有限公司 基于数据计算链路的异常处理方法以及相关设备
CN110430071A (zh) * 2019-07-19 2019-11-08 云南电网有限责任公司信息中心 业务节点故障自愈方法、装置、计算机设备及存储介质
CN111193605A (zh) * 2019-08-28 2020-05-22 腾讯科技(深圳)有限公司 一种故障定位方法、装置及存储介质
CN112988831A (zh) * 2019-12-13 2021-06-18 深圳云天励飞技术有限公司 故障定位方法及相关装置
CN112988831B (zh) * 2019-12-13 2024-06-07 深圳云天励飞技术有限公司 故障定位方法及相关装置
CN113839800B (zh) * 2020-06-24 2023-12-12 中国联合网络通信集团有限公司 异常网元提示方法、装置、电子设备及存储介质
CN113839800A (zh) * 2020-06-24 2021-12-24 中国联合网络通信集团有限公司 异常网元提示方法、装置、电子设备及存储介质
CN112817827A (zh) * 2021-01-22 2021-05-18 中国银联股份有限公司 运维方法、装置、服务器、设备、系统及介质
CN113992348A (zh) * 2021-09-22 2022-01-28 北京东方通软件有限公司 一种一体机的监控方法及系统
CN113992348B (zh) * 2021-09-22 2022-08-30 北京东方通软件有限公司 一种一体机的监控方法及系统
CN114091930A (zh) * 2021-11-25 2022-02-25 深圳前海微众银行股份有限公司 业务指标预警方法、装置、电子设备和存储介质
CN114363149B (zh) * 2021-12-23 2023-12-26 上海哔哩哔哩科技有限公司 故障处理方法及装置
CN114363149A (zh) * 2021-12-23 2022-04-15 上海哔哩哔哩科技有限公司 故障处理方法及装置
CN115499302A (zh) * 2022-08-17 2022-12-20 中国电信股份有限公司 业务系统的监测方法、装置、可读存储介质及电子设备
CN115865644A (zh) * 2022-11-09 2023-03-28 浪潮通信信息系统有限公司 业务故障处理方法、装置、设备及存储介质
CN116185787A (zh) * 2023-04-25 2023-05-30 深圳市四格互联信息技术有限公司 自学习型的监控告警方法、装置、设备及存储介质
CN116185787B (zh) * 2023-04-25 2023-08-15 深圳市四格互联信息技术有限公司 自学习型的监控告警方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109308252B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN109308252A (zh) 一种故障定位处理方法及装置
CN103201724B (zh) 在高可用性虚拟机环境中提供高可用性应用程序
CN109586952B (zh) 服务器扩容方法、装置
CN104160378B (zh) 用于启用分布式计算系统中的容错功能的方法和系统
US10489232B1 (en) Data center diagnostic information
CN108572898B (zh) 一种控制接口的方法、装置、设备、以及存储介质
CN107800783B (zh) 远程监控服务器的方法及装置
US9798606B2 (en) Systems and methods for smart diagnosis using hosted resources with intelligent altering of boot order
CN109274531A (zh) 数据采集设备重启方法、系统及计算机可读存储介质
US11119828B2 (en) Digital processing system for event and/or time based triggering management, and control of tasks
CN111104283B (zh) 一种分布式存储系统的故障检测方法、装置、设备及介质
CN108287769A (zh) 一种信息处理方法及装置
CN111897697A (zh) 服务器硬件故障修复方法和装置
CN110502399B (zh) 故障检测方法及装置
US20120233245A1 (en) Voip communication system and method for registering client devices with same
CN113656252A (zh) 故障定位方法、装置、电子设备以及存储介质
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
CN117221085A (zh) 一种网络故障预警方法、装置、电子设备及存储介质
CN110224872B (zh) 一种通信方法、装置及存储介质
CN112784266A (zh) 用于监控航空电子软件应用的方法和电子设备、相关计算机程序和航空电子系统
CN114500327B (zh) 一种服务器集群的检测方法、检测装置及计算设备
CN114679295B (zh) 防火墙安全配置方法及装置
CN114461437B (zh) 一种数据处理方法、电子设备及存储介质
CN114936106A (zh) 一种主机故障的处理方法、装置及介质
CN114579804A (zh) 应急指挥数据的处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant