CN101359959A - 一种用于故障定位分析的信息获取方法 - Google Patents

一种用于故障定位分析的信息获取方法 Download PDF

Info

Publication number
CN101359959A
CN101359959A CNA2008102161996A CN200810216199A CN101359959A CN 101359959 A CN101359959 A CN 101359959A CN A2008102161996 A CNA2008102161996 A CN A2008102161996A CN 200810216199 A CN200810216199 A CN 200810216199A CN 101359959 A CN101359959 A CN 101359959A
Authority
CN
China
Prior art keywords
information
abnormal
communication mechanism
getting method
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008102161996A
Other languages
English (en)
Inventor
赵玉海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CNA2008102161996A priority Critical patent/CN101359959A/zh
Publication of CN101359959A publication Critical patent/CN101359959A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种用于故障定位分析的信息获取方法,在嵌入式系统中该方法包括:首先建立一通讯机制,执行日志记录流程和上下文信息记录流程;然后将系统的历史信息通过所述通讯机制上报给外围系统进行存储;接下来建立一查询机制,用于获取系统的当前信息。通过使用所获得的基准信息,分析出故障产生的原因;所述基准信息包括历史信息和当前信息。本发明所述的方法,由于采用了获取历史信息和当前信息相结合的方式来构成完善的基准信息,从而帮助了故障定位分析,到达了为预防故障、及时地规避故障和改善故障提供更多的分析手段之目的。

Description

一种用于故障定位分析的信息获取方法
技术领域
本发明涉及的是在光通讯领域中一种用于故障定位分析的信息获取方法;尤其涉及的是在光通讯嵌入式系统领域中一种用于故障定位分析的信息获取方法。
背景技术
在现有技术中光通讯嵌入式系统的故障定位分析通常包括:分析设备程序是否异常,分析设备单元物理是否异常及分析业务配置操作是否异常等,以便准确地定位业务异常的原因。
操作日志记录是故障定位分析中常用的手段;专利CN200680013932.3提供了一种用安全传输来传输SYSLOG(网络事件日志协议)报文的方法、系统和装置,可以使SYSLOG报文在安全传输和传输层传输之间自由转换。专利CN200710077514.7和专利CN200610138609各自提供了一种记录日志的方法。
在光通讯嵌入式系统的实际故障定位分析中,不是都能通过记录日志信息就能完成故障定位分析;有时还需要获得当前设备状态,业务状态切换上下文等信息才能很方便地定位分析故障产生的原因。怎样获取完善的基准信息来帮助故障定位分析是现有技术未能解决的问题。
因而,现有技术还有待于改进和提高。
发明内容
本发明的目的在于在嵌入式系统中提供一种用于故障定位分析的信息获取方法,通过建立合理的信息获取途径,以获得完善的基准信息,达到帮助故障定位分析之目的。
本发明的技术方案包括:
一种用于故障定位分析的信息获取方法,在嵌入式系统中,该方法包括以下步骤:
A、建立一通讯机制;
B、通过一上报机制获取系统历史信息,以及通过一查询机制获取系统当前信息。
其中所述步骤B中的上报机制包括以下步骤:
B1、执行日志记录流程以及上下文记录流程;
B2、将系统历史信息通过所述通讯机制上报给外围系统进行存储。
其中所述步骤B1还包括:
B11、封装一个异常日志模块,
B12、在预定的异常检测点加入异常判断代码。
B13、当异常产生时,在异常日志模块中记录该异常,并根据异常等级上报相应的异常信息。
其中所述步骤B13还包括:
B131、预先设定异常日志模块保存异常信息记录数的上限;
B132、当在异常日志模块中保存的异常信息记录数到达所述上限时,则将异常信息发送给在线测试发送进程;
B133、所述在线测试发送进程收到所述异常信息,并转发给外围系统进行存储。
其中所述步骤B1还包括:
B14、封装一个上下文信息记录模块;
B15、预先定义影响业务变化的内容,注册需要记录的触发条件;
B16、当所述内容中至少一个满足对应的触发条件时,则记录该内容发生变化时的当前状态;
B17、根据业务等级主动上报上下文信息。
其中所述步骤B16中的所述当前状态包括:输入值和输出值。
其中所述步骤B中的外围系统是按接收信息中的时间戳顺序保存所接收到的信息。
其中所述步骤B中的所述历史信息包括:历史日志信息和历史上下文状态信息。
其中所述步骤A中的所述通讯机制选择下述任一的通讯机制:在线测试通讯机制、网口通迅机制或高级数据链路控制协议通讯机制。
其中所述步骤B中的所述当前信息包括:当前日志信息和当前状态信息。
本发明在嵌入式系统中所提供的一种用于故障定位分析的信息获取方法,由于采用了获取历史信息和当前信息相结合的方式来构成完善的基准信息,从而帮助了故障定位分析,为预防故障、及时地规避故障和改善故障提供了更多的分析手段。
附图说明
图1为本发明一较佳实施例的方法流程图。
具体实施方式
以下结合附图,将对本发明各较佳实施例进行更为详细的说明。
本发明用于故障定位分析信息获取方法的核心是,首先在嵌入式系统中建立一通讯机制,增加日志记录模块和增加上下文信息记录模块;然后将系统的历史信息通过所述通讯机制传输给外围系统进行存储;接下来建立一查询机制,用于获取系统的当前信息,这样就可以得到完善的基准信息,所述基准信息包括历史信息和当前信息。
如图1所示为本发明一较佳实施例的方法流程图,详细说明如下:
S101、在嵌入式系统中建立一通讯机制。
所述通讯机制可以是IST(Inline System Test-在线测试)通讯机制即IST收发进程,也可以是网口通讯机制或HDLC(High Level Data Link Control高级数据链路控制)协议通讯机制等,该较佳实施例选择IST收发进程。
S102、在嵌入式系统中执行日志记录流程。
在实施本发明的应用系统中,在进行日志记录处理时,对日志的记录形式、记录方法、临时存储形式没有限定。该较佳实施例选择的方案是设置条件记录;也就是说,静态记录和动态记录分开,操作日志和异常日志分开。将日志信息临时存在一预先设定大小的内存中;当日志信息达到预定内存的临界值时,然后将日志信息通过IST发送进程传送给外围系统进行存储,所述临界值的选择与具体设备系统有关。传送到外围系统进行存储的日志信息被称作历史日志信息。所述外围系统包括外界设备和应用程序。
下面更进一步描述日志记录流程中异常日志模块的操作流程。先封装一个异常日志模块,在预定的异常检测点加入异常判断代码;然后当异常产生时,在异常日志模块中记录异常,并根据异常等级上报异常信息;具体地,开发人员提供了一个C语言宏,CHECK_ASSERT(condition,level);当condition=TRUE时,代码运行情况正常,走过此段代码;当condition=FALSE时,在异常日志模块中记录异常信息。
每一个具体的应用系统所拥有的内存空间是有限的;根据具体需要,设定异常日志模块保存异常信息的数量上限;当在异常日志模块中保存的异常信息记录数到达所述上限时,则将异常信息发送给在线测试发送进程;所述在线测试发送进程收到所述异常信息,并转发给外围系统进行存储。所述外围系统接受到异常信息后,按照异常信息内容中的时间戳顺序来保存。
下面用一个更具体的例子来加以说明;例如设定异常日志模块对异常信息只保留20条,以节约内存开销;当记录满20时,则发送给IST发送进程转送给网管保存。网管将上报的日志信息按照上报的信息报文头里面的时间点以降序记录,这样最新信息总在记录信息的头部。为预防网管系统崩溃或硬盘损害,网管把记录信息保存到远程数据库中,以备后续故障定位分析查询。
S103、在嵌入式系统中执行上下文信息记录流程。
业务状态发生变化是指业务状态切换,上下文信息就反映出这种变化。先封装一个上下文信息记录模块,在运载程序中预先定义影响业务变化的内容,注册需要记录的触发条件;当所述内容中一个或者多个满足对应的触发条件时,则记录该内容发生时的当前状态,所述当前状态包括输入值和输出值;例如增加业务倒换到监控内容中,当有倒换产生时,则需要记录当前时隙配置内容,激励倒换条件,倒换产生后的结果等信息,最后根据业务等级主动上报上下文信息。将上下文信息临时存在一预先设定大小的内存中;当上下文信息达到预定内存的临界值时,然后将上下文信息通过IST发送进程传送给外围系统进行存储,所述临界值的选择与具体设备系统有关;传送到外围系统进行存储的上下文信息被称作历史上下文信息。
具体地,由程序开发人员来提供一个C语言宏,例如REGISTER_CONTEXT(trigger,istcmdlist);当trigger为真,上下文记录模块会解析istcmdlist中的每个命令,获取相应信息并保存在上下文记录模块的预定临时内存中。Istcmdlist列表是系统的IST调试命令,上下文记录模块解析每个命令,然后发送消息给IST接受进程。当上下文处理进程发现内存用尽时,则利用IST发送进程将上下文信息发送给网管保存,这样空出的这些内存就可以保存其他的上下文信息。网管将上报的上下文信息按照上报的信息报文头里面的时间点以降序记录,这样最新信息总在记录信息的头部。为预防网管系统崩溃或硬盘损害,网管把上下文信息保存到远程数据库中,以备后续故障定位分析查询。
S104、在嵌入式系统中建立一IST查询机制,用于获取系统的当前信息。所述当前信息包括:当前日志信息和当前状态信息。
具体地,建立一IST模块;IST模块提供了一个shell(框架)风格的界面,并提供以下操作get alarm|get perf|get exception|login|logout|...;在故障定位分析时,例如可以通过IST模块获得当前异常信息和当前程序模块状态信息。
S105、根据获取的基准信息进行故障定位分析。
下面用一实例来说明实施本发明所进行的故障定位分析。例如在用户设置SNCI(inherently monitored Sub-Network Connection-固有监视子网连接保护)监视方式时,由于设置的参数错误而抛出异常,导致UNEQ(UNEquipped-未装载)被当成SD(Signal Degrade)送给交叉板,从而引起倒换。利用本发明,可以使用IST模块的GET SLOTCFG指令得到时隙配置,查询实际时隙配置是否存在;如果存在,则可以利用GET PROT MSP指令查询当前是否倒换以及倒换激励条件,确定是否是由于告警产生引起的倒换;如果为真,则在业务板上通过GET EXCEPTION得到异常信息,这样就可查出是由于SNCI设置没有成功,从而导致交叉板业务倒换。
综上所述,在嵌入式系统中,本发明所提供的一种用于故障定位分析的信息获取方法,由于采用了获取历史信息和当前信息相结合的方式来构成完善的基准信息,从而帮助了故障定位分析,到达了为预防故障、及时地规避故障和改善故障提供更多的分析手段之目的。本发明的实施,使故障定位分析即可以在线分析,也可以离线分析(单板跑死情况),另一方面使故障定位分析实现动态实时分析。
应当理解的是,上述针对具体实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本发明的专利保护范围应以所附权利要求为准。

Claims (10)

1、一种用于故障定位分析的信息获取方法,在嵌入式系统中,该方法包括以下步骤:
A、建立一通讯机制;
B、通过一上报机制获取系统历史信息,以及通过一查询机制获取系统当前信息。
2、根据权利要求1所述的信息获取方法,其特征在于,所述步骤B中的上报机制包括以下步骤:
B1、执行日志记录流程以及上下文记录流程;
B2、将系统历史信息通过所述通讯机制上报给外围系统进行存储。
3、根据权利要求1所述的信息获取方法,其特征在于,所述步骤B1还包括:
B11、封装一个异常日志模块,
B12、在预定的异常检测点加入异常判断代码。
B13、当异常产生时,在异常日志模块中记录该异常,并根据异常等级上报相应的异常信息。
4、根据权利要求3所述的信息获取方法,其特征在于,所述步骤B13还包括:
B131、预先设定异常日志模块保存异常信息记录数的上限;
B132、当在异常日志模块中保存的异常信息记录数到达所述上限时,则将异常信息发送给在线测试发送进程;
B133、所述在线测试发送进程收到所述异常信息,并转发给外围系统进行存储。
5、根据权利要求2所述的信息获取方法,其特征在于,所述步骤B1还包括:
B14、封装一个上下文信息记录模块;
B15、预先定义影响业务变化的内容,注册需要记录的触发条件;
B16、当所述内容中至少一个满足对应的触发条件时,则记录该内容发生变化时的当前状态;
B17、根据业务等级主动上报上下文信息。
6、根据权利要求5所述的信息获取方法,其特征在于,所述步骤B16中的所述当前状态包括:输入值和输出值。
7、根据权利要求2至5任一所述的信息获取方法,其特征在于,所述步骤B中的外围系统是按接收信息中的时间戳顺序保存所接收到的信息。
8、根据权利要求2至5任一所述的信息获取方法,其特征在于,所述步骤B中的所述历史信息包括:历史日志信息和历史上下文状态信息。
9、根据权利要求2至5任一所述的信息获取方法,其特征在于,所述步骤A中的所述通讯机制选择下述任一的通讯机制:在线测试通讯机制、网口通迅机制或高级数据链路控制协议通讯机制。
10、根据权利要求1所述的信息获取方法,其特征在于,所述步骤B中的所述当前信息包括:当前日志信息和当前状态信息。
CNA2008102161996A 2008-09-17 2008-09-17 一种用于故障定位分析的信息获取方法 Pending CN101359959A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008102161996A CN101359959A (zh) 2008-09-17 2008-09-17 一种用于故障定位分析的信息获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008102161996A CN101359959A (zh) 2008-09-17 2008-09-17 一种用于故障定位分析的信息获取方法

Publications (1)

Publication Number Publication Date
CN101359959A true CN101359959A (zh) 2009-02-04

Family

ID=40332310

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008102161996A Pending CN101359959A (zh) 2008-09-17 2008-09-17 一种用于故障定位分析的信息获取方法

Country Status (1)

Country Link
CN (1) CN101359959A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102638828A (zh) * 2011-02-12 2012-08-15 苏州达联信息科技有限公司 一种铁路轨道监测传感网络的远程调试方法及装置
CN103049345A (zh) * 2012-12-10 2013-04-17 北京百度网讯科技有限公司 基于异步通信机制的磁盘状态变迁检测方法及装置
CN103207820A (zh) * 2013-02-05 2013-07-17 北京百度网讯科技有限公司 基于raid卡日志的硬盘的故障定位方法及装置
CN106294176A (zh) * 2016-08-19 2017-01-04 暴风集团股份有限公司 Mac OS系统中应用程序故障定位的方法及系统
CN108011752A (zh) * 2017-11-21 2018-05-08 江苏天联信息科技发展有限公司 故障定位分析方法及装置、计算机可读存储介质
CN108628694A (zh) * 2017-03-20 2018-10-09 腾讯科技(深圳)有限公司 一种基于可编程硬件的数据处理方法以及装置
US10324762B2 (en) 2014-06-05 2019-06-18 Huawei Technologies Co., Ltd. Reliability resource allocation method and apparatus
CN113904718A (zh) * 2021-12-09 2022-01-07 深圳市飞速创新技术股份有限公司 光模块检测方法、终端设备及计算机可读存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102638828A (zh) * 2011-02-12 2012-08-15 苏州达联信息科技有限公司 一种铁路轨道监测传感网络的远程调试方法及装置
CN103049345A (zh) * 2012-12-10 2013-04-17 北京百度网讯科技有限公司 基于异步通信机制的磁盘状态变迁检测方法及装置
CN103049345B (zh) * 2012-12-10 2015-11-25 北京百度网讯科技有限公司 基于异步通信机制的磁盘状态变迁检测方法及装置
CN103207820A (zh) * 2013-02-05 2013-07-17 北京百度网讯科技有限公司 基于raid卡日志的硬盘的故障定位方法及装置
CN103207820B (zh) * 2013-02-05 2016-06-29 北京百度网讯科技有限公司 基于raid卡日志的硬盘的故障定位方法及装置
US10324762B2 (en) 2014-06-05 2019-06-18 Huawei Technologies Co., Ltd. Reliability resource allocation method and apparatus
CN106294176B (zh) * 2016-08-19 2018-11-06 暴风集团股份有限公司 Mac OS系统中应用程序故障定位的方法及系统
CN106294176A (zh) * 2016-08-19 2017-01-04 暴风集团股份有限公司 Mac OS系统中应用程序故障定位的方法及系统
CN108628694A (zh) * 2017-03-20 2018-10-09 腾讯科技(深圳)有限公司 一种基于可编程硬件的数据处理方法以及装置
CN108628694B (zh) * 2017-03-20 2023-03-28 腾讯科技(深圳)有限公司 一种基于可编程硬件的数据处理方法以及装置
CN108011752A (zh) * 2017-11-21 2018-05-08 江苏天联信息科技发展有限公司 故障定位分析方法及装置、计算机可读存储介质
CN113904718A (zh) * 2021-12-09 2022-01-07 深圳市飞速创新技术股份有限公司 光模块检测方法、终端设备及计算机可读存储介质
CN113904718B (zh) * 2021-12-09 2022-04-01 深圳市飞速创新技术股份有限公司 光模块检测方法、终端设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN101359959A (zh) 一种用于故障定位分析的信息获取方法
WO2020192733A1 (zh) 定时任务配置方法、服务器、系统和计算机可读存储介质
US9674287B2 (en) Methods and apparatus for event logging in an information network
CN102369523B (zh) 对分布式应用程序的监测
US20150127814A1 (en) Monitoring Server Method
KR102131160B1 (ko) 알람 정보 처리 방법 및 장치, 시스템, 및 컴퓨터 저장 매체
CN108092813A (zh) 数据中心综合管理系统服务器硬件管理框架及实现方法
CN102624554A (zh) 一种结合了设备管理和业务管理的综合网络管理方法
CN108762966A (zh) 系统异常拦截方法、装置、计算机设备及存储介质
JP4055765B2 (ja) ネットワークの監視方法およびシステム
EP4030690A1 (en) Device management method, apparatus, and system
US20230359514A1 (en) Operation-based event suppression
CN104883349A (zh) 一种网络安全规则学习方法及系统
US20060200548A1 (en) Automation engine and method for providing an abstraction layer
CN100421381C (zh) 一种获取网络设备运行和故障状态信息的方法及装置
US7752504B2 (en) System diagnostics with dynamic contextual information of events
EP1146426B1 (en) Dynamic rule sets for generated logs in a network
CN101242620B (zh) 一种直放站监控的实现方法及系统
CN114217867A (zh) 自动化运维代理装置、设备和存储介质
KR20130110442A (ko) Snmp를 이용한 중앙 집중형 plc 관리 시스템 및 방법
CN111681397A (zh) 一种配网自动化短信发送方法、发送系统和存储介质
CN114428715A (zh) 一种日志处理方法、装置、系统及存储介质
CN113581257B (zh) 信息监控方法、装置、存储介质及电子设备
KR100606001B1 (ko) 이벤트 데이터 베이스를 통한 네트워크 관리방법
JP2011113243A (ja) 仮想化環境において稼動中のアプリケーション監視システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20090204