CN106961353A - 一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法 - Google Patents

一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法 Download PDF

Info

Publication number
CN106961353A
CN106961353A CN201710200888.7A CN201710200888A CN106961353A CN 106961353 A CN106961353 A CN 106961353A CN 201710200888 A CN201710200888 A CN 201710200888A CN 106961353 A CN106961353 A CN 106961353A
Authority
CN
China
Prior art keywords
failure
module
network
exchange device
route exchange
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201710200888.7A
Other languages
English (en)
Inventor
雷文虎
刘先桥
冯辉
谭淇文
邱权
王杨
郝青峰
王利军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Jinmei Communication Co Ltd
Original Assignee
Chongqing Jinmei Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Jinmei Communication Co Ltd filed Critical Chongqing Jinmei Communication Co Ltd
Priority to CN201710200888.7A priority Critical patent/CN106961353A/zh
Publication of CN106961353A publication Critical patent/CN106961353A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Abstract

本发明公开了一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法。路由交换设备能够实时掌握各业务单元板的运行状态;故障搜集诊断设备能自动发现通信网络的故障节点,批量搜集和保存硬件故障信息,辅助网络管理人员快速定位设备硬件故障及类型,加快故障排除的进度。本发明有益技术效果是:提供了一种大规模组网时路由交换设备硬件故障在线诊断和批量搜集方法,网络管理人员能够以最少的操作、最低的代价及时发现网络中路由交换设备各业务单元板的硬件故障,加快故障排除的进度。通过对故障历史信息统计分析,能够发现通信网络中故障率较高的设备或单元板,为推动设备质量改进提供信息依据。

Description

一种大规模通信网络路由交换设备硬件故障在线诊断和批量 搜集方法
技术领域
本发明属于通信网络故障诊断领域,尤其涉及一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法。
背景技术
战术通信网络是一种典型的军用网络,具有机动性好、抗毁性强、及时性好等特点,满足了军队在战争中对通信联络的保密、迅速、不间断、准确等高要求。由于战场环境复杂多变、通信装备的运载平台震动大、环境高低温差大、风沙盐雾等自然条件十分恶劣,导致路由交换设备容易出现硬件层面的间歇性故障或者永久性故障,影响通信网络的正常运行。
现有路由交换设备一般由一块控制交换板和若干业务单元板构成,采用背板实现各功能板之间的互连,其硬件结构如图1所示。设备开机时各单元板进行加电自检,主控板对各个单元板的自检信息进行维护,能够在开机时发现单元板硬件故障,网络操作人员需要通过设备面板指示灯或者人机界面查询才能明确故障单元,这属于单节点单设备行为。而在战术通信网络的演训和实战运用过程中,通信节点散布在各个地域,路由交换设备持续工作时间长,出现运行时硬件故障时,需要网络操作人员采用第三方通信手段(例如民用电话网络)进行逐层上报,网络管理人员无法及时获取硬件故障的详细信息,给解决问题带来很大难度。
可见,现有技术对于路由交换设备的硬件诊断方式比较单一,无法及时发现大规模组网时设备的运行时硬件故障。为了保证通信网络的可靠运行,如何以最少的操作、最低的代价及时发现网络中路由交换设备的硬件故障,及时进行维修或者器件替换,仍然是一个棘手的问题。
发明内容
本发明公开了一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法。路由交换设备的各业务单元板需要向控制交换板注册,使得控制交换板能掌握各业务单元板的存在状况,注册过程通过控制交换板的询问和业务单元板的应答实现;注册后控制交换板需要监视各业务单元板的运行状态,监视过程通过控制交换板对各业务单元板的定时询问机制实现。故障搜集诊断设备能够自动发现通信网络中的故障节点,批量搜集和保存设备硬件故障信息,辅助网络管理人员快速定位设备的硬件故障及类型,加快故障排除的进度。
如图2所示,本发明中涉及两种设备:故障搜集诊断设备、路由交换设备。故障搜集诊断设备是负责故障搜集和诊断的计算机终端。路由交换设备是通信网络中的网络交换节点。路由交换设备之间按正常的网间链路互连;故障搜集诊断设备与路由交换设备之间采用ETH链路互连。
如图3所示,本发明中涉及三种软件模块:故障搜集诊断模块、故障搜集模块、故障监控模块。其中:
故障搜集诊断模块运行在故障搜集诊断设备上。该模块能够发起故障搜集请求组播消息;能够接收通信网络中各节点的故障搜集响应单播消息,解析并保存故障搜集结果;能够向网络管理人员显示故障告警信息;能够对通信网络的故障历史信息进行统计分析。
故障搜集模块运行在路由交换设备的控制交换板上。该模块能够接收故障搜集请求组播消息,并将该请求消息在网络中泛洪转播;能够查看故障监控模块中是否存在硬件故障信息;能够生成故障搜集响应单播消息回传给故障搜集诊断设备。
故障监控模块运行在路由交换设备的控制交换板上。该模块能够监控设备各业务单元板的运行状态;发现单元板出现故障时能够主动将故障信息向故障搜集模块汇报。
故障搜集诊断模块与故障搜集模块之间的消息采用UDP报文进行封装,故障搜集模块之间的消息采用UDP报文进行封装,UDP收发端口号均采用固定值。
本发明有益技术效果是:提供了一种大规模组网时路由交换设备硬件故障在线诊断和批量搜集方法,网络管理人员能够以最少的操作、最低的代价及时发现网络中路由交换设备各业务单元板的硬件故障,加快故障排除的进度。通过对故障历史信息的统计分析,能够发现通信网络中故障率较高的设备或单元板,为推动设备质量改进提供信息依据。
附图说明
图1、路由交换设备的硬件结构;
图2、设备间的连接关系图;
图3、设备的功能模块组成及模块间的关系图。
具体实施方式
本发明提供一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法,实现该方法包括故障搜集诊断模块、故障搜集模块、故障监控模块。模块之间关系可参见图3。故障监控模块与业务单元板之间采用板间总线维护通道通信,其交互流程及报文格式在此不作详细阐述。需要说明的是,为了更加清楚、简要的描述本发明的实现方式,图3中省略了节点的原有功能模块,仅仅示出与本发明相关的功能模块。具体实施方式如下:
故障搜集诊断模块主要包括如下功能:
1) 故障搜集诊断模块定期(5-10分钟一次,可配置)向路由交换设备发送故障搜集请求组播消息,消息内部需携带故障搜集诊断设备的通信IP地址、UDP收端口号以及请求消息的序列号,序列号逐次递增;
2) 故障搜集诊断模块接收路由交换设备的故障搜集响应单播消息,解析并保存故障搜集响应消息到数据库中,需要记录下接收时间、响应设备IP地址、故障具体信息等;
3) 能够向网络管理人员显示故障告警信息,明确指出哪一台设备的哪一块业务单元板发生故障,具体信息包括单元板类型、生产厂家代号、硬件版本号、软件版本号、故障编码等;
4) 能够对通信网络的故障历史信息进行统计分析,向网络管理人员提供故障查询、统计、显示等功能,辅助网络管理人员进行故障数据挖掘。
故障搜集模块主要包括如下功能:
1) 全网的故障搜集模块均采用固定统一的UDP端口号接收和发送报文;
2) 故障搜集模块接收故障搜集诊断设备的故障搜集请求组播消息,并将该请求消息在网络中泛洪传输;
3) 故障搜集模块通过故障搜集请求组播消息中携带的序列号进行识别,同一个消息只处理一次,避免在泛洪时形成网络风暴;
4) 故障搜集模块记录下故障诊断设备的通信IP地址及UDP端口号便于回传故障响应报文使用;
5) 故障搜集模块查看故障监控模块是否存在硬件故障信息,如果有则生成故障搜集响应单播消息回传给故障搜集诊断设备;
6) 故障搜集模块接收故障监控模块主动汇报的故障信息,及时生成故障搜集响应单播消息回传给故障搜集诊断设备。
故障监控模块主要包括如下功能:
1) 故障监控模块需要完成对业务单元板的注册及运行状态监视,对各业务单元板进行定时询问,第一轮使用强制WARM询问消息,以后采用定时询问消息;业务单元板收到强制WARM询问消息后,必须使用WARM消息应答;控制交换板收到WARM消息时,向业务单元板应答WARM确认消息;业务单元板在收到控制交换板发送的WARM确认消息后,对以后的定时询问消息使用业务单元板正常消息或故障消息进行应答;如果没有收到WARM确认消息,业务单元板使用WARM消息应答定时询问消息,直到收到WARM确认消息后再使用业务单元板正常消息或故障消息进行应答;
2) 故障监控模块发现某块业务单元板出现硬件故障时,主动将故障信息向故障搜集模块汇报;
3) 故障信息中应包含业务单元板类型、生产厂家代号、硬件版本号、软件版本号、故障编码等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法,其特征在于:涉及故障搜集诊断设备和路由交换设备等两种设备,涉及故障搜集诊断模块、故障搜集模块、故障监控模块等三个软件模块。
2.根据权利要求1所述,其特征在于:故障搜集诊断设备是负责故障诊断的计算机终端。
3.根据权利要求1所述,其特征在于:路由交换设备是通信网络中负责通信和交换的网络节点,一般由一块控制交换板和若干业务单元板构成,采用背板实现各功能板之间的互连。
4.根据权利要求1所述,其特征在于:路由交换设备能够实时掌握各业务单元板的运行状态;故障搜集诊断设备能自动发现通信网络的故障节点,批量搜集和保存硬件故障信息,辅助网络管理人员快速定位设备硬件故障及类型,加快故障排除的进度。
5.根据权利要求1所述,其特征在于:故障搜集诊断模块运行在故障搜集诊断设备上;该模块能够发起故障搜集请求组播消息;能够接收通信网络中各节点的故障搜集响应单播消息,解析并保存故障搜集结果;能够向网络管理人员显示故障告警信息;能够对通信网络的故障历史信息进行统计分析。
6.根据权利要求1所述,其特征在于:故障搜集模块运行在路由交换设备的控制交换板上;该模块能够接收故障搜集请求组播消息,并将该请求消息在网络中泛洪转播;能够查看故障监控模块中是否存在硬件故障信息;能够生成故障搜集响应单播消息回传给故障搜集诊断设备。
7.根据权利要求1所述,其特征在于:故障监控模块运行在路由交换设备的控制交换板上;该模块能够监控设备各业务单元板的运行状态;发现单元板出现故障时能够主动将故障信息向故障搜集模块汇报。
8.根据权利要求1所述,其特征在于:故障搜集诊断模块与故障搜集模块之间的消息采用UDP报文进行封装,故障搜集模块之间的消息采用UDP报文进行封装,UDP收发端口号均采用固定值。
CN201710200888.7A 2017-03-30 2017-03-30 一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法 Withdrawn CN106961353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710200888.7A CN106961353A (zh) 2017-03-30 2017-03-30 一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710200888.7A CN106961353A (zh) 2017-03-30 2017-03-30 一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法

Publications (1)

Publication Number Publication Date
CN106961353A true CN106961353A (zh) 2017-07-18

Family

ID=59471541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710200888.7A Withdrawn CN106961353A (zh) 2017-03-30 2017-03-30 一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法

Country Status (1)

Country Link
CN (1) CN106961353A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107547282A (zh) * 2017-09-21 2018-01-05 国网福建省电力有限公司 一种信息与通信业务影响分析模型建立方法及系统
CN113489607A (zh) * 2021-06-29 2021-10-08 杭州海康威视数字技术股份有限公司 一种业务处理系统、采集设备和汇聚设备
CN116708148A (zh) * 2022-12-29 2023-09-05 荣耀终端有限公司 网络诊断方法和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060039288A1 (en) * 2004-08-17 2006-02-23 National Applied Research Laboratories National Center For High-Performance Computing Network status monitoring and warning method
CN1791007A (zh) * 2004-12-02 2006-06-21 华为技术有限公司 一种通信设备及其内部链路故障的定位方法
CN102752150A (zh) * 2012-07-20 2012-10-24 迈普通信技术股份有限公司 提供远程板卡调试的分布式通信设备及方法
CN103023709A (zh) * 2011-09-21 2013-04-03 中兴通讯股份有限公司 网元线卡诊断信息获取方法及装置
CN104202193A (zh) * 2014-09-05 2014-12-10 上海斐讯数据通信技术有限公司 分布式保护链路故障检测的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060039288A1 (en) * 2004-08-17 2006-02-23 National Applied Research Laboratories National Center For High-Performance Computing Network status monitoring and warning method
CN1791007A (zh) * 2004-12-02 2006-06-21 华为技术有限公司 一种通信设备及其内部链路故障的定位方法
CN103023709A (zh) * 2011-09-21 2013-04-03 中兴通讯股份有限公司 网元线卡诊断信息获取方法及装置
CN102752150A (zh) * 2012-07-20 2012-10-24 迈普通信技术股份有限公司 提供远程板卡调试的分布式通信设备及方法
CN104202193A (zh) * 2014-09-05 2014-12-10 上海斐讯数据通信技术有限公司 分布式保护链路故障检测的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107547282A (zh) * 2017-09-21 2018-01-05 国网福建省电力有限公司 一种信息与通信业务影响分析模型建立方法及系统
CN113489607A (zh) * 2021-06-29 2021-10-08 杭州海康威视数字技术股份有限公司 一种业务处理系统、采集设备和汇聚设备
CN116708148A (zh) * 2022-12-29 2023-09-05 荣耀终端有限公司 网络诊断方法和电子设备
CN116708148B (zh) * 2022-12-29 2024-04-02 荣耀终端有限公司 网络诊断方法和电子设备

Similar Documents

Publication Publication Date Title
CN102111310B (zh) Cdn设备状态监控方法
CN106961353A (zh) 一种大规模通信网络路由交换设备硬件故障在线诊断和批量搜集方法
CN104092585A (zh) 一种智能变电站过程层二次回路故障诊断方法
CN102694871A (zh) 基于手机短信的服务器远程监控及故障处理的装置和方法
CN103514078A (zh) 硬盘监视系统
CN103810076B (zh) 数据复制的监控方法及装置
CN112468592A (zh) 一种基于电力信息采集的终端在线状态侦测方法及系统
CN110723166A (zh) 一种道岔监测方法及系统
CN112163297A (zh) 设备健康预测系统
RU2342793C1 (ru) Автоматизированная система управления радиоэлектронными средствами военных объектов
CN201813382U (zh) 一种用于运载火箭测试和发射控制的网络监测系统
CN102904758B (zh) 一种矿用漏泄通信网络的通信故障检测方法
CN116074184B (zh) 一种电力调度中心网络故障预警系统
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN204706058U (zh) 基于cems系统的gprs上传数据企业监测平台
CN109039768B (zh) 一种lte-m通信网络中cbtc信号告警方法
CN111768884A (zh) 一种核电厂机组运行状态监测系统及方法
CN108234154B (zh) 一种机载交换网络设备故障监控方法
CN116166499A (zh) 数据监测方法、装置、电子设备及非易失性存储介质
CN117134928A (zh) 一种用于列车网络控制系统的攻防靶场系统及其实现方法
CN105656700A (zh) 一种分散式机房综合监控及自动应急决策处理方法及装置
CN112333748A (zh) 一种无线通信终端状态监控系统、方法、装置和设备
CN108322315A (zh) 一种大规模通信网络路由交换设备软件故障诊断方法、系统和设备
CN111865656A (zh) 基于网络报文和远动报文结合的网络通道故障分析方法
CN105044552A (zh) 配网自动化系统的故障诊断方法、系统及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20170718