CN101478440B - 一种故障信息可追溯的系统及方法 - Google Patents

一种故障信息可追溯的系统及方法 Download PDF

Info

Publication number
CN101478440B
CN101478440B CN200910105245XA CN200910105245A CN101478440B CN 101478440 B CN101478440 B CN 101478440B CN 200910105245X A CN200910105245X A CN 200910105245XA CN 200910105245 A CN200910105245 A CN 200910105245A CN 101478440 B CN101478440 B CN 101478440B
Authority
CN
China
Prior art keywords
fault
integrated circuit
circuit board
fault message
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910105245XA
Other languages
English (en)
Other versions
CN101478440A (zh
Inventor
张立超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN200910105245XA priority Critical patent/CN101478440B/zh
Publication of CN101478440A publication Critical patent/CN101478440A/zh
Application granted granted Critical
Publication of CN101478440B publication Critical patent/CN101478440B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种故障信息可追溯的系统和方法,所述系统包括网络管理单元、主控单元以及底层设备,所述网络管理单元包括使能模块、日志显示模块、数据库模块以及筛选模块;所述方法为:使能模块将使能命令通过主控单元发送给底层设备;底层设备收到命令后,若板卡有故障产生/消除,则将故障信息通过主控单元上报给日志显示模块,所述日志显示模块显示故障信息,并在所述故障信息是故障产生信息时将产生故障的板卡号上报给筛选模块;筛选模块查找本次故障的源头,并将查找到的结果保存到数据库对应板卡的日志中。本发明可对故障信息进行准确、清楚的说明,方便使用者和定位故障人员掌握故障产生的原因。

Description

一种故障信息可追溯的系统及方法
技术领域
本发明涉及通信领域,尤其涉及一种故障信息可追溯的系统和方法。
背景技术
各类通信设备在工程现场使用中,都可能会出现一些莫名其妙的问题,包括设备一些潜藏很深的BUG,导致设备不能正常使用。
这时就要由设备供应商的用服人员来对设备进行基本的维修,大的问题对于用服人员来说是很难处理的,所以对于故障信息的追溯在此时就比较关键了,因为设备的开发部门要根据用服人员反馈的故障信息来定位故障的原因。
当前的故障信息追溯方法是查看网管历史信息,对于光传输网络管理系统,历史信息主要看历史告警、历史性能和历史事件。而在实际工程应用中,网元、底层设备的板卡的数量非常庞大,每天所采集的数据也是数十万甚至更多。而随着工程应用的网络不断地扩大,对网管历史数据的管理也提出了一个严峻的挑战。
因此,需要一种简单而又高效的方法来追溯故障信息,这样用服人员就可以快速的定位到问题的根源,也使设备研发人员更清晰的知道现场问题的原因。目前对于历史信息的查询都是通过对历史时间点的查询,网管会列出这个时间点附近的所有历史信息。目前追溯方法和系统的缺陷是:
1、只能将所需关注的历史信息按照时间逐条列出,而不能对其进行宏观地统计汇总或分析,以致无法清楚的解析具体故障信息。
2、没有检查历史数据是否齐全,对丢失的历史数据记录无法统计,这样对于当前时间故障如果没有统计上来,对追溯故障信息就会非常麻烦。
3、对底层设备里多个板卡的历史信息没有区分,列表里一并列出,解析数据较麻烦。
4、对历史告警、性能、事件分开查询,数据量庞大,对于某个板卡的各个信息统计较麻烦。
发明内容
本发明要解决的技术问题是,提供一种故障信息可追溯的系统,并在所述系统的基础上提供一种故障信息可追溯的方法,本发明可对故障信息进行准确、清楚的说明,方便使用者和定位故障人员掌握故障产生的原因。
一种故障信息可追溯的系统,所述系统包括网络管理单元、主控单元以及底层设备,
所述网络管理单元用于通过主控单元以命令形式启动底层设备故障自动上报功能、对上报的故障信息进行显示、保存、筛选以及删除;所述网络管理单元包括日志显示模块、筛选模块及数据库模块,所述日志显示模块用于以日志形式显示底层设备的故障信息,并在所述故障信息为故障产生信息时将产生该故障的板卡号上报给所述筛选模块以供筛选;且在设定时间后日志未被查看的情况下将所述日志保存到所述数据库模块中以供保存;
所述主控单元用于转发所述网络管理单元下发的命令给底层设备以及接收底层设备上报的故障信息并将所述故障信息转发给网络管理单元;
所述底层设备用于在其板卡出现故障/故障消失时自动上报故障信息给所述主控单元。
所述网络管理单元包括使能模块、日志显示模块、数据库模块以及筛选模块;
所述使能模块用于以命令的形式控制底层设备是主动上报故障信息还是被动上报故障信息;
所述日志显示模块用于以日志形式显示底层设备的故障信息,并在所述故障信息为故障产生信息时将产生该故障的板卡号上报给所述筛选模块;且在设定时间后日志未被查看的情况下将所述日志保存到所述数据库模块中;
所述筛选模块用于以收到的板卡号对应的板卡为参考点,根据筛选算法在单向业务链上查找故障的源头,并将结果保存到数据库中的相应板卡的日志中。所述筛选模块通过如下方法查找故障的源头:
步骤a:判断所述参考点板卡前是否有板卡,若有,则执行步骤b;否则,执行步骤c;
步骤b:查看所述参考点板卡的前一个板卡是否有故障,若是,则继续判断向前查看前一个板卡是否有故障,直到前一个板卡没有故障为止,则判定没有故障的板卡的后一个有故障的板卡为故障的源头;否则,执行步骤c;
步骤c:判定所述参考点板卡是故障的源头。
所述使能模块为一个开关。
一种故障信息可追溯的方法,所述方法包括:
步骤一:使能模块使能,将使能命令通过主控单元发送给底层设备;
步骤二:底层设备收到所述命令后,若板卡有故障产生/消除,则将故障信息通过主控单元上报给网络管理单元的日志显示模块,所述日志显示模块以日志形式显示所述故障信息,并在所述故障信息是故障产生信息时将产生故障的板卡号上报给网络管理单元的筛选模块;
步骤三:所述筛选模块以收到的板卡号对应的板卡为参考点板卡,根据筛选算法查找本次故障的源头,并将查找到的结果保存到数据库对应板卡的日志中。
所述步骤二中,若所述故障信息日志在设定时间内未被查看,则将所述日志保存到网络管理单元的数据库中,并在网络管理单元界面中产生故障的板卡上设置标记,所述标记链接于所述保存到数据库中的相应的日志,点击所述标记即可查看相应的日志。
步骤三还包括:在网络管理单元界面中的故障源头板卡上设置标志,所述标志与数据库中对应板卡的故障信息日志链接,点击所述标志即可查看相应的日志。
所述被保存到数据库中的故障信息日志在设定时间后将被删除。
所述故障信息日志包括:告警信息、异常性能信息、异常事件信息和上一次故障发生和或消除的时间。
所述告警信息为紧急告警,包括紧急告警的名称、产生的端口、产生关联的性能量、性能值以及产生/消失时间;所述异常性能信息为异常的性能量,包括异常性能量的名称、性能值、异常性能的端口号以及设定时间段前该性能量的性能值;所述异常事件信息包括异常事件产生/消除时间。
采用本发明,可以使通信设备生产厂家很容易的定位到设备当前故障的源头,通过在底层设备出现故障/故障消除时自动上报故障信息的方式,使使用人员很明了的知道是哪些板卡出现了问题,哪些板卡是问题的源头;使设备供应商的维护人员也更加方便的定位故障的原因,并反馈给设备的研发人员,省去查询和判断大量历史信息的麻烦,直接可以查看具体板卡的故障信息;在故障发生/消除时即上报故障信息并通过日志很清楚的显示每个信息的内容,节省了分类查询告警、性能、事件等故障信息的时间。
附图说明
图1本发明所述系统的原理框图;
图2本发明所述方法的实施例的流程图;
图3本发明所述故障信息日志示意图。
具体实施方式
以下结合附图对本发明做进一步详细介绍。
如图1所示,是本发明所述系统的原理框图,包括网络管理单元、主控单元和底层设备,所述网络管理单元还包括使能模块、日志显示模块、数据库模块以及筛选模块。
所述使能模块用于以命令的形式控制底层设备是主动上报故障信息还是被动上报故障信息;所述使能模块为一个开关,用户使能所述使能模块,即接通开关后,本发明所述系统进入故障信息主动上报模式,即启动本发明所述的工作流程;若所述使能模块未被使能,则底层设备被动上报故障信息,即有查询才上报,否则均不上报,此时本发明与现有技术相同;
所述日志显示模块用于以日志形式显示底层设备的故障信息,并在所述故障信息为故障产生信息时将产生该故障的板卡号上报给所述筛选模块;且在设定时间后日志未被查看的情况下将所述日志保存到所述数据库模块中;
所述筛选模块用于根据筛选算法在单向业务链上查找故障的源头,并结果保存到数据库中相应板卡的日志中;
所述主控单元用于转发所述网络管理单元下发的命令给底层设备以及接收底层设备上报的故障信息并将所述故障信息转发给网络管理单元;
所述底层设备用于在其板卡出现故障/故障消失时自动上报故障信息给所述主控单元。
上述网络管理单元与主控单元的通信总线之间需要事先设定好上报故障信息和下发命令的报文格式,主控单元与底层设备之间也需要事先设定好响应命令及上报故障的报文格式。
如图2所示,是本发明所述方法实施例的流程图,具体步骤如下:
步骤201:开启使能开关,将使能命令通过主控单元发送给底层设备,本发明所述系统进入故障信息主动上报模式;
开启使能开关后,勿需人工操作,底层设备在故障产生/消除时会主动上报故障相关信息,方便操作人员在长时间不在现场时,也可追溯到故障的详细信息;而所述开关不使能时,只有手动下发查询命令时,底层设备才会上报信息。
步骤202:当底层设备的板卡有故障产生/消除时,通过主控单元将故障信息主动上报日志显示模块;
步骤203:所述日志显示模块以日志形式显示收到的故障信息;
如图3所示,是本发明的故障信息日志示意图,所述日志包括:告警信息、异常性能信息、异常事件信息和上一次故障发生和或消除的时间;所述告警信息为紧急告警,包括紧急告警的名称、产生的端口、产生关联的性能量、性能值以及产生/消失时间;所述异常性能信息为异常的性能量,包括异常性能量的名称、性能值、异常性能的端口号以及设定时间段前该性能量的性能值;所述异常事件信息包括异常事件产生/消除时间。
对于监控类板卡,主要关注的是异常事件的产生/消失,因为对于它们最大的故障就是复位和通信连接不上等等;对于其他板卡,则主要关注的是紧急告警和异常的性能。
步骤204日志显示模块判断接收到的故障信息是否为故障产生信息,若是,则执行步骤205;否则,不上报,执行步骤206;
步骤205:将产生故障的板卡号上报给筛选模块,同时执行206和210;
步骤206:日志显示模块判断设定时间-2分钟是否到达,若是,则执行步骤207;否则,执行步骤208;
步骤207:日志显示模块判断是否有人查看当前日志,若是,则执行步骤209;否则,执行步骤208;
步骤208:日志显示模块判断是否有新的故障信息上报,若有,则执行步骤203;否则,执行步骤206;
步骤209:将所述当前日志保存到网络管理单元的数据库中,并在网络管理单元界面产生故障的板卡上设置标记,同时将所述标记链接到所述数据库中相应的日志;所述被保存到数据库中的故障信息日志在设定时间(比如2天)后将被删除;
比如,设定时间为2分钟,则在2分钟后依然无人查看时自动将日志存到数据库中,以便在后一个日志覆盖掉前一个日志时,可以查询前一个故障信息;当使用人需要查看时,只要用鼠标点触相应的标记即可弹出所需日志,对故障信息的追溯很方便;由于数据库空间有限,所以会在2天后删除所述日志。
步骤210:筛选模块以收到的板卡号对应的板卡为参考点,根据筛选算法查找本次故障的源头,并将筛选出的结果保存到数据库中对应板卡的日志里,同时在网络管理单元界面对应的板卡上设置标志,将所述标志链接到所述数据库中相应的日志,故障信息追溯结束。
筛选模块通过如下方法查找故障的源头:
步骤(1):判断参考点板卡前是否有板卡,若有,则执行步骤(2);否则,执行步骤(3);
步骤(2):查看参考点板卡的前一个板卡是否有故障,若是,则继续往前查看前一个板卡是否有故障,直到前一个板卡没有故障为止,则判定没有故障的板卡的后一个有故障的板卡为故障的源头;否则,执行步骤(3);
步骤(3):判定参考点板卡是故障的源头。
筛选模块在使能开关开启后,自动以上述方法对故障信息进行筛选,筛选出来的信息会自动记录到故障源头板卡的日志里,并会在故障源头板卡上设置一个故障源头的小标志,方便使用人在使用时可直接追溯到故障信息。
本说明书所附实施例是体现本发明构思的一种典型方式,并不排除使用体现本发明设计方案的其他实施例。

Claims (9)

1.一种故障信息可追溯的系统,所述系统包括网络管理单元、主控单元以及底层设备,其特征在于,
所述网络管理单元用于通过主控单元以命令形式启动底层设备故障自动上报功能、对上报的故障信息进行显示、保存、筛选以及删除;所述网络管理单元包括日志显示模块、筛选模块及数据库模块,所述日志显示模块用于以日志形式显示底层设备的故障信息,并在所述故障信息为故障产生信息时将产生该故障的板卡号上报给所述筛选模块以供筛选;且在设定时间后日志未被查看的情况下将所述日志保存到所述数据库模块中以供保存;所述筛选模块用于以收到的板卡号对应的板卡为参考点,根据筛选算法在单向业务链上查找故障的源头,并将结果保存到数据库中的相应板卡的日志中;所述筛选模块通过如下方法查找故障的源头:
步骤a:判断所述参考点板卡前是否有板卡,若有,则执行步骤b;否则,执行步骤c;
步骤b:查看所述参考点板卡的前一个板卡是否有故障,若是,则继续向前查看前一个板卡是否有故障,直到前一个板卡没有故障为止,则判定没有故障的板卡的后一个有故障的板卡为故障的源头;否则,执行步骤c;
步骤c:判定所述参考点板卡是故障的源头;
所述主控单元用于转发所述网络管理单元下发的命令给底层设备以及接收底层设备上报的故障信息并将所述故障信息转发给网络管理单元;
所述底层设备用于在其板卡出现故障/故障消失时自动上报故障信息给所述主控单元。
2.如权利要求1所述的一种故障信息可追溯的系统,其特征在于,所述网络管理单元包括使能模块;
所述使能模块用于以命令的形式控制底层设备是主动上报故障信息还是被动上报故障信息。
3.如权利要求2所述的一种故障信息可追溯的系统,其特征在于,所述使能模块为一个开关。
4.一种故障信息可追溯的方法,其特征在于,所述方法包括:
步骤一:使能模块使能,将使能命令通过主控单元发送给底层设备;
步骤二:底层设备收到所述命令后,若板卡有故障产生/消除,则将故障信息通过主控单元上报给网络管理单元的日志显示模块,所述日志显示模块以日志形式显示所述故障信息,并在所述故障信息是故障产生信息时将产生故障的板卡号上报给网络管理单元的筛选模块;
步骤三:所述筛选模块以收到的板卡号对应的板卡为参考点,根据筛选算法查找本次故障的源头,并将查找到的结果保存到数据库对应板卡的日志中;所述筛选模块通过如下方法查找故障的源头:
步骤a:判断所述参考点板卡前是否有板卡,若有,则执行步骤b;否则,执行步骤c;
步骤b:查看所述参考点板卡的前一个板卡是否有故障,若是,则继续向前查看前一个板卡是否有故障,直到前一个板卡没有故障为止,则判定没有故障的板卡的后一个有故障的板卡为故障的源头;否则,执行步骤c;
步骤c:判定所述参考点板卡是故障的源头。
5.如权利要求4所述的故障信息可追溯的方法,其特征在于,所述步骤二中,若所述故障信息日志在设定时间内未被查看,则将所述日志保存到网络管理单元的数据库中,并在网络管理单元界面中产生故障的板卡上设置标记,所述标记链接于所述保存到数据库中的相应的日志。
6.如权利要求4所述的故障信息可追溯的方法,其特征在于,步骤三还包括:在网络管理单元界面中的故障源头板卡上设置标志,所述标志与数据库中对应板卡的故障信息日志链接。
7.如权利要求5所述的故障信息可追溯的方法,其特征在于,所述被保存到数据库中的故障信息日志在设定时间后将被删除。
8.如权利要求4所述的故障信息可追溯的方法,其特征在于,所述故障信息日志包括:告警信息、异常性能信息、异常事件信息和上一次故障发生和或消除的时间。
9.如权利要求8所述的故障信息可追溯的方法,其特征在于,所述告警信息为紧急告警,包括紧急告警的名称、产生的端口、产生关联的性能量、性能值以及产生/消失时间;所述异常性能信息为异常的性能量,包括异常性能量的名称、性能值、异常性能的端口号以及设定时间段前该性能量的性能值;所述异常事件信息包括异常事件产生/消除时间。
CN200910105245XA 2009-01-22 2009-01-22 一种故障信息可追溯的系统及方法 Expired - Fee Related CN101478440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910105245XA CN101478440B (zh) 2009-01-22 2009-01-22 一种故障信息可追溯的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910105245XA CN101478440B (zh) 2009-01-22 2009-01-22 一种故障信息可追溯的系统及方法

Publications (2)

Publication Number Publication Date
CN101478440A CN101478440A (zh) 2009-07-08
CN101478440B true CN101478440B (zh) 2011-12-28

Family

ID=40839075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910105245XA Expired - Fee Related CN101478440B (zh) 2009-01-22 2009-01-22 一种故障信息可追溯的系统及方法

Country Status (1)

Country Link
CN (1) CN101478440B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667929B (zh) * 2009-10-13 2014-11-05 中兴通讯股份有限公司 一种业务系统的维护系统及方法
CN102355368B (zh) * 2011-10-08 2015-03-18 大连环宇移动科技有限公司 一种网络设备的故障处理方法及系统
CN105978703A (zh) * 2015-08-12 2016-09-28 乐视云计算有限公司 一种视频故障反馈的方法、客户端以及服务器
CN105656699B (zh) * 2016-03-29 2018-12-04 网宿科技股份有限公司 内容分发网络的告警管理方法及系统
CN108528219A (zh) * 2018-04-13 2018-09-14 曾祥华 一种动力锂电池的故障处理方法及装置
CN109933555B (zh) * 2019-04-01 2021-12-31 成都思鸿维科技有限责任公司 一种外部板卡管理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1744514A (zh) * 2004-08-30 2006-03-08 华为技术有限公司 一种获取网络设备运行和故障状态信息的方法及装置
CN1885867A (zh) * 2005-06-22 2006-12-27 中兴通讯股份有限公司 一种通信终端自动上报故障的方法
CN1960278A (zh) * 2005-10-31 2007-05-09 华为技术有限公司 网元管理系统采集异常呼叫历史记录的方法
CN101272285A (zh) * 2007-03-23 2008-09-24 中兴通讯股份有限公司 故障定位方法及系统
CN101325517A (zh) * 2008-07-07 2008-12-17 中兴通讯股份有限公司 一种通信系统设备及其检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1744514A (zh) * 2004-08-30 2006-03-08 华为技术有限公司 一种获取网络设备运行和故障状态信息的方法及装置
CN1885867A (zh) * 2005-06-22 2006-12-27 中兴通讯股份有限公司 一种通信终端自动上报故障的方法
CN1960278A (zh) * 2005-10-31 2007-05-09 华为技术有限公司 网元管理系统采集异常呼叫历史记录的方法
CN101272285A (zh) * 2007-03-23 2008-09-24 中兴通讯股份有限公司 故障定位方法及系统
CN101325517A (zh) * 2008-07-07 2008-12-17 中兴通讯股份有限公司 一种通信系统设备及其检测方法

Also Published As

Publication number Publication date
CN101478440A (zh) 2009-07-08

Similar Documents

Publication Publication Date Title
CN101478440B (zh) 一种故障信息可追溯的系统及方法
KR101768810B1 (ko) 풍력단지 통합 제어 모니터링 시스템
CN110505102B (zh) 电力信息通信融合监控与服务标准化管理平台系统及方法
CN103544093B (zh) 监控报警控制方法及其系统
CN117111497A (zh) 远程运维管理系统
CN105871605A (zh) 一种基于电力营销大数据的运维监控平台
CN105282772A (zh) 无线网数通设备监控系统及设备监控方法
CN101095307A (zh) 网络管理设备
CN105262210A (zh) 一种变电站网络安全性分析预警系统和方法
CN102624554B (zh) 一种结合了设备管理和业务管理的综合网络管理方法
CN102567531B (zh) 一种通用的轻量级数据库状态监控方法
CN101778264A (zh) 视频监控方法和系统
CN104850934A (zh) 一种气象装备维护维修管理系统
CN109542091A (zh) 一种挖掘机故障维修与可靠性数据管理系统及其应用
CN107332722A (zh) 一种故障信息的排除方法及系统
CN102521701A (zh) 电力系统预警指挥系统及其方法
CN101777951B (zh) 一种数据监测的方法和系统
CN112671592A (zh) 一种网络设备运维管理系统
CN201371834Y (zh) 轨道交通多功能告警显示器
CN105589800A (zh) 预测复杂系统故障的应用系统
KR20100131181A (ko) 표준업무절차를 이용한 장애 복구 업무 처리 시스템 및 방법
CA2728431A1 (en) Systems, methods, and devices for managing emergency power supply systems
KR100898597B1 (ko) 물관리 자동화 표시시스템
CN218825580U (zh) 高速公路机电系统运行状态监测系统
NL2030719B1 (en) Microservice application observability system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111228

Termination date: 20180122

CF01 Termination of patent right due to non-payment of annual fee