CN1735047A - 一种故障自诊断方法和装置 - Google Patents

一种故障自诊断方法和装置 Download PDF

Info

Publication number
CN1735047A
CN1735047A CN 200410056114 CN200410056114A CN1735047A CN 1735047 A CN1735047 A CN 1735047A CN 200410056114 CN200410056114 CN 200410056114 CN 200410056114 A CN200410056114 A CN 200410056114A CN 1735047 A CN1735047 A CN 1735047A
Authority
CN
China
Prior art keywords
diagnosis
fault
self
module
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200410056114
Other languages
English (en)
Inventor
戎鹏群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN 200410056114 priority Critical patent/CN1735047A/zh
Publication of CN1735047A publication Critical patent/CN1735047A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明涉及故障自诊断方法和装置,特别提供一种网络设备故障自诊断方法,以提高故障诊断的准确性、可靠性和及时性。一种故障自诊断方法,包括下列步骤:S1:按照故障关联库的数据组织结构将测试对象组织成测试树;S2:收集所述测试对象的状态信息;S3:调取故障关联库中的信息对测试对象的状态信息进行关联分析;S4:输出分析结果。所述装置包括主控模块、OMC或网管中心、接口模块、故障自诊断模块和故障关联库,OMC或网管中心通过主控模块给故障自诊断模块自诊断对象,故障自诊断模块收到自诊断启动命令后,通过接口模块从系统收集对象的状态信息并与故障关联库中的信息进行关联分析,上报分析结果。

Description

一种故障自诊断方法和装置
技术领域
本发明涉及故障测试,特别提供一种网络设备故障自诊断方法和装置。
背景技术
网络设备在运行过程中都可能会出现故障,快速有效地定位网络设备的故障对提高设备的可靠性是非常重要的。目前我们并不缺乏故障定位和诊断的方法。查询设备和链路的各种状态和告警列表是现在最常使用的故障诊断技术和操作,但是该技术方案有如下缺点:
1、使用起来不方便,需要配置台、告警台、维护台的配合,在一些情况下,设备运行的环境并不具备这样的条件;
2、设备故障的环节很多,受设备维护人员的经验限制,不能准确判断可能产生故障的地方,不能有效地去查询相关的告警和状态信息;
3、告警相关性提示信息不够,普通用户难以根据告警之间的关联去定位问题;
4、设备的维护命令比较多,而且专业性较强,对使用人员的要求较高,使用不太方便,有一定的难度。
因此从实际使用情况来看,这种技术对于故障定位不是非常有效,比如大部分非专业人员对这些命令或查询方法并不熟悉,无法做到准确、可靠、迅速地定位故障。另外各传输协议层次和设备的故障定位和测试是孤立和割裂的,相互之间没有有机的联系,不利于故障的定位诊断,而且故障诊断的准确性、可靠性和及时性等方面不能满足用户的需求。
发明内容
本发明提供一种基于对象的故障自诊断方法和装置,以提高故障诊断的准确性、可靠性和及时性。
本发明所述故障自诊断方法包括下列步骤:S1:按照故障关联库的数据组织结构将测试对象组织成测试树;S2:收集所述测试对象的状态信息;S3:调取故障关联库中的信息对测试对象的状态信息进行关联分析;S4:输出分析结果。所述测试树的根对象为网络设备的框对象;所述框对象根据故障关联库的结构分为单板对象和信令链路配置对象,或者分为硬件对象和软件对象。输出模式可以根据需要设置为只显示故障模式或者全显示模式;
本发明所述一种故障自诊断装置,包括主控模块、OMC或网管中心、接口模块;其特征在于还包括:故障自诊断模块和故障关联库,所述OMC或网管中心通过主控模块给故障自诊断模块配置网络设备的自诊断对象以及启动自诊断,故障自诊断模块收到自诊断启动命令后,通过接口模块从系统收集自诊断对象的状态信息并调取故障关联库中的信息进行关联分析,将分析结果上报OMC或网管中心;所述接口模块至少包括下列接口之一:维护接口、整机装配测试接口、单板装配测试接口和调试接口,位于故障自诊断模块和网络设备之间。
应用本发明所述技术方案,提高了网络设备故障诊断的准确性、可靠性和及时性,便于用户更好的分析和定位故障,而且能在最短的时间内采取措施,保证网络设备的可用性和提供网络设备的可维护性、可测试性。
附图说明
下面以具体实施例并结合附图详细说明本发明。
图1为实施例流程图;
图2本发明所述方法原理示意图;
图3故障自诊断对象测试树一;
图4故障自诊断对象测试树二;
图5为故障自诊断装置的结构框图。
具体实施方式
如图1、图2、图5所示,故障自诊断装置是在原有设备的主控模块、OMC或网管中心和接口模块的基础上,增加设置故障自诊断模块和故障关联库形成,共同配合完成设备的自诊断。用户确定监测对象后,将监测对象按照故障关联库的结构组织成测试树(集),通过OMC或网管中心和主控模块输入到给故障自诊断模块,当设备发生变动时,重新输入新的测试树;主控模块中存有所有设备的信息,并控制设备的运行、调制和测试,执行OMC或网管中心的测试命令,指示设备通过接口向故障自诊断模块上报状态信息;故障自诊断模块收到自诊断启动命令后,通过接口模块从系统收集自诊断对象的状态信息并调取故障关联库中的信息进行关联分析,将分析结果上报OMC或网管中心。接口模块为:维护接口、整机装配测试接口、单板装配测试接口和调试接口等模块。
下面分步骤描述如何在上述装置中进行故障自诊断的操作。
步骤一:确定通信网络设备的测试对象,即生成测试对象的测试树;
生成测试树(集)是测试领域的常用方法,本发明将其用于通信设备的故障测试和诊断。对于通信网络设备的故障自诊断,可以将故障自诊断所涉及的芯片、端口、链路、逻辑配置、物理配置等诊断项按照面向对象的方法加以组织。如图3、4所示,如果将框对象作为故障自诊断的“根对象”,在通信网络设备中,框对象一般是指能够具备独立通信能力的CPU,对“框对象”可以细分为“单板对象”和“信令链路配置对象”,而按照单板类型再将“单板对象”划分为“XX单板对象”、“YY单板对象”、“ZZ单板对象”等单板诊断对象。“信令链路配置对象”指与信令相关的全局配置对象和底层的传输链路配置,包括:目的信令点、源信令点、MTP3b配置、SAAL链路以及QAAL2相关的配置等。
又例如对一个设备框的故障自诊断,可以将故障自诊断所涉及的芯片、端口、链路和逻辑配置等诊断项按照面向对象的方法加以组织。将框对象作为故障自诊断的“根对象”,对“框对象”细分为“单板对象”和“软件对象”,而按照单板类型,再将“单板对象”划分为“XX1单板对象”、“XX2单板对象”等,“软件对象”也可以根据具体的实现方式进行划分。
由于要进行关联分析,因此无论采取那种分类方法,框对象的分类应与故障关联库的结构相同。
步骤二:收集所述测试对象的状态信息;
步骤三:根据故障关联库分析所述状态信息;
收集和分析过程主要分为两类,第一类主要针对硬件,包括各个单板、芯片、端口、时钟、光口、DSP(Digital Signal Processor数字信号处理器)、HPI(Host-Port Interface,主机接口)、TDM(Time Division Multiplex,时分多路复用)、CellBus(一种高速背板总线)、温度、CPU占用率等,然后根据已有软件和硬件提供的接口(包括维护接口、整机装备测试接口、单板装备测试接口、调试接口)对硬件状态进行查询,分析硬件状态是否处于正常;第二类主要针对信令链路,对于每一条链路,设置本端环回,然后发送数据报,并进行统计,如果发送的数据包与接收的数据包是一致的,则表示链路是正常的;另外就是通过已有的协议和接口(包括维护接口、整机装备测试接口、单板装备测试接口、调试接口)对链路进行查询和分析,如果查询得到的状态是正常,表示链路是正常的,否则为故障。
如下表所示,故障关联库是根据实际通信网络设备的各种故障分析得到的,把所有的故障按照树型结构进行组织,这样就得到了故障关联库,故障关联库实际上就是故障树,也就是把故障按照树型结构组织所得到。根据故障关联库得到测试对象测试集,这样就可以把收集到的测试对象状态信息直接与测试集关联起来,就得到结果。如下表所示,说明序号1-5的内容存在故障关联,例如“SDH链路故障”一定会引起配置在该SDH链路上的“E1链路”、“IMA组”、“IMA链路”、“UNI链路”、“IUB接口链路”故障,也就是说底层的链路故障(即:序号小的链路)会引起上层链路的故障(即:序号大的链路)。
  序号   故障关联库内容   是否存在故障关联
  ...   …   …
  5   IUB接口链路诊断   存在故障关联处理
  4   IMA链路诊断/UNI链路诊断   存在故障关联处理
  3   IMA组诊断   存在故障关联处理
  2   E1链路诊断   存在故障关联处理
  1   SDH链路诊断   存在故障关联处理
故障关联库是测试集生成的基础,也是诊断和分析网络设备的是否故障的关键。故障关联库一般用于故障的相关性处理,本发明用于网络设备的故障自诊断收到了良好的效果。
步骤四:输出分析结果。
输出分析结果的模式可以设定,包括只显示故障模式或者全显示模式两种,如果用户选择“全诊断”和“全显示”,通过OMC或者网管中心发起故障诊断,通信网络设备主控模块,从框内各个子系统收集故障和状态,并根据故障关联库进行分析,最后把诊断结果发送给OMC或者网管中心。
综上所述,用户只需要启动一个操作,“故障和状态分析与综合”机制就收集这些对象的故障信息,然后与故障关联库中预存的信息进行关联分析得到故障分析数据,显示给用户,收集和分析过程中不需要用户干预。

Claims (8)

1、一种故障自诊断方法,其特征在于包括下列步骤:
S1:按照故障关联库的数据组织结构将测试对象组织成测试树;
S2:收集所述测试对象的状态信息;
S3:调取故障关联库中的信息对测试对象的状态信息进行关联分析;
S4:输出分析结果。
2、如权利要求1所述的方法,其特征在于:所述测试树的根对象为网络设备的框对象。
3、如权利要求2所述的方法,其特征在于:所述框对象包括单板对象和信令链路配置对象。
4、如权利要求1所述的方法,其特征在于:所述步骤S2中,按照所述测试树从根对象出发收集测试对象的状态信息。
5、如权利要求1所述的方法,其特征在于:所述步骤S1还包括一设置并选择输出分析结果模式的步骤,所述输出模式包括只显示故障模式或者全显示模式;以及步骤S4按照所选择的模式输出分析结果。
6、一种故障自诊断装置,包括主控模块、OMC或网管中心、接口模块;其特征在于还包括:故障自诊断模块和故障关联库,所述OMC或网管中心通过主控模块给故障自诊断模块配置网络设备的自诊断对象以及启动自诊断,故障自诊断模块收到自诊断启动命令后,通过接口模块从系统收集自诊断对象的状态信息并调取故障关联库中的信息进行关联分析,将分析结果上报OMC或网管中心。
7、如权利要求6所述的装置,其特征在于:所述装置还包括一输出模块,位于故障自诊断模块和主控模块之间,用以输出自诊断结果。
8、如权利要求6所述的装置,其特征在于:所述接口模块至少包括下列接口之一:维护接口、整机装配测试接口、单板装配测试接口和调试接口,位于故障自诊断模块和网络设备之间。
CN 200410056114 2004-08-12 2004-08-12 一种故障自诊断方法和装置 Pending CN1735047A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410056114 CN1735047A (zh) 2004-08-12 2004-08-12 一种故障自诊断方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410056114 CN1735047A (zh) 2004-08-12 2004-08-12 一种故障自诊断方法和装置

Publications (1)

Publication Number Publication Date
CN1735047A true CN1735047A (zh) 2006-02-15

Family

ID=36077255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410056114 Pending CN1735047A (zh) 2004-08-12 2004-08-12 一种故障自诊断方法和装置

Country Status (1)

Country Link
CN (1) CN1735047A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008138256A1 (fr) * 2007-05-11 2008-11-20 Huawei Technologies Co., Ltd. Procédé servant à fournir des informations anormales, procédé d'autodiagnostic de réseau, terminal et réseau de communication
CN101039498B (zh) * 2007-05-09 2010-06-16 中兴通讯股份有限公司 带有分布式告警处理的基站系统及其告警处理方法
CN101540932B (zh) * 2008-03-21 2011-01-26 大唐移动通信设备有限公司 一种多路设备的故障定位方法及装置
CN101977128A (zh) * 2010-09-14 2011-02-16 中兴通讯股份有限公司 用于通讯设备的接口检测方法和装置
CN102271060A (zh) * 2010-06-03 2011-12-07 上海宝信软件股份有限公司 实时控制系统自动检测通讯状态的方法
CN104683170A (zh) * 2013-11-28 2015-06-03 北车大连电力牵引研发中心有限公司 车辆网络故障诊断系统
CN112152837A (zh) * 2020-08-14 2020-12-29 上海纽盾科技股份有限公司 网络安全设备智能监管的实现方法、装置及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039498B (zh) * 2007-05-09 2010-06-16 中兴通讯股份有限公司 带有分布式告警处理的基站系统及其告警处理方法
WO2008138256A1 (fr) * 2007-05-11 2008-11-20 Huawei Technologies Co., Ltd. Procédé servant à fournir des informations anormales, procédé d'autodiagnostic de réseau, terminal et réseau de communication
CN101540932B (zh) * 2008-03-21 2011-01-26 大唐移动通信设备有限公司 一种多路设备的故障定位方法及装置
CN102271060A (zh) * 2010-06-03 2011-12-07 上海宝信软件股份有限公司 实时控制系统自动检测通讯状态的方法
CN102271060B (zh) * 2010-06-03 2015-04-29 上海宝信软件股份有限公司 实时控制系统自动检测通讯状态的方法
CN101977128A (zh) * 2010-09-14 2011-02-16 中兴通讯股份有限公司 用于通讯设备的接口检测方法和装置
WO2012034366A1 (zh) * 2010-09-14 2012-03-22 中兴通讯股份有限公司 用于通讯设备的接口检测方法和装置
CN101977128B (zh) * 2010-09-14 2015-04-01 中兴通讯股份有限公司 用于通讯设备的接口检测方法和装置
CN104683170A (zh) * 2013-11-28 2015-06-03 北车大连电力牵引研发中心有限公司 车辆网络故障诊断系统
CN112152837A (zh) * 2020-08-14 2020-12-29 上海纽盾科技股份有限公司 网络安全设备智能监管的实现方法、装置及系统
CN112152837B (zh) * 2020-08-14 2024-01-26 上海纽盾科技股份有限公司 网络安全设备智能监管的实现方法、装置及系统

Similar Documents

Publication Publication Date Title
US6385609B1 (en) System and method for analyzing and displaying telecommunications switch report output
JP6461246B2 (ja) インダストリアル・インターネットオペレーションシステムに基づく安全性の検査方法と装置
CN101916507B (zh) 桥梁健康监测系统
CN101707632A (zh) 一种动态监控服务器集群性能并实时报警的方法
CN108521339A (zh) 一种基于集群日志的反馈式节点故障处理方法及系统
CN111209166B (zh) 一种面向b/s架构业务系统的自动巡检系统
CN101594192B (zh) 一种信号处理设备和光接口板的在线故障检测方法和装置
CN111240876B (zh) 微服务的故障定位方法、装置、存储介质及终端
CN111343029B (zh) 一种基于数据转发节点拓扑监控的监控平台及方法
CN1805383A (zh) 业务系统的自动化测试装置及测试方法
WO2021114971A1 (zh) 一种检测基于多层架构的应用系统是否正常运行的方法
CN101196901B (zh) 用于数据库查询的计算机系统和方法
CN109783260A (zh) 智能it全流程运维方法、装置、设备及可读存储介质
CN1838617A (zh) 光同步数字传送体系网络保护系统的自动测试方法
CN112052134A (zh) 一种业务数据的监控方法及装置
CN103017812B (zh) 汽车仪表网络化测试系统及该系统的测试方法
CN101309178A (zh) 一种自动交换光网络系统日志信息的解析方法及装置
CN102291274A (zh) 一种实现网络测试仪表自动适配的系统及方法
CN1735047A (zh) 一种故障自诊断方法和装置
CN101252477B (zh) 一种网络故障根源的确定方法及分析装置
CN101227327A (zh) 一种集中网管系统以及上载下级告警信息的方法
CN103684890B (zh) 服务器压力测试方法及系统
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN117640431A (zh) 实验室设备接入系统
CN1287427A (zh) 一种基于消息录制回放的模拟网元测试方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication