CN101471823A - 一种用于通信系统中故障定位的方法及装置 - Google Patents

一种用于通信系统中故障定位的方法及装置 Download PDF

Info

Publication number
CN101471823A
CN101471823A CNA2007103084051A CN200710308405A CN101471823A CN 101471823 A CN101471823 A CN 101471823A CN A2007103084051 A CNA2007103084051 A CN A2007103084051A CN 200710308405 A CN200710308405 A CN 200710308405A CN 101471823 A CN101471823 A CN 101471823A
Authority
CN
China
Prior art keywords
message
communication system
fault location
sign indicating
indicating number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007103084051A
Other languages
English (en)
Inventor
张力
王宇博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datang Mobile Communications Equipment Co Ltd
Original Assignee
Datang Mobile Communications Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datang Mobile Communications Equipment Co Ltd filed Critical Datang Mobile Communications Equipment Co Ltd
Priority to CNA2007103084051A priority Critical patent/CN101471823A/zh
Publication of CN101471823A publication Critical patent/CN101471823A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种用于通信系统中故障定位的方法及装置,属于电通信技术领域,该方法包括,在系统在处理消息之前,将该消息的关键字和消息特征码存入存储设备中,然后再进行消息的正常处理,一旦系统出现故障时,则可从存储设备中读出出现问题时存入的消息,通过消息的记录流程进行故障排查;并且由于存储设备相对于系统来说属于独立外设,信息内容在单板复位后不需要进行初始化,从而存储的信息不会消失,这样有助于定位系统故障发生的部位和原因,从而有效地提高了系统的可靠性。

Description

一种用于通信系统中故障定位的方法及装置
技术领域
本发明涉及电通信技术领域,尤其涉及一种用于通信系统中故障定位的方法及装置。
背景技术
在现代通信领域中,网络协议是非常重要的概念,作为一种标准其规范着网络中技术的开发和运行。随着通信网络的日趋复杂,通信功能也越来越强大,因此在网络中也越来越多地使用网络协议。由于网络协议一般都比较复杂,而且协议的正确性对整个网络影响很大,所以网络协议的测试就十分重要。
现有的通信系统比较庞大,而且设计也很复杂,所以在调试中难免会有很多的缺陷和Bug(缺陷),因此需要一种高效的记录错误节点信息的装置,从而能够快速推进软件的调试和项目的进展。目前在基于消息交互的通信系统中,调试的手段一般均基于对协议规定的消息的解析判断,采用专用的协议栈设备进行调试,但是对设备内部软件的各个协议层之间的交互缺少监控手段。
如图1所示,为现有协议栈设备测试协议的结构示意图。由图中可知,协议栈测试仪器通过光口或电口于通信系统设备连接,对通信系统设备的协议进行测试,由于是在接口处进行消息测量,对系统本身的问题不能精确定位,这是因为在接口上的消息出问题时,可能是内部的消息在之前的某个时刻已经缺失,从而不能精确的定位到现场,该方法仅仅适用于前期的功能测试,在后期的测试中该种方法基本不能测出系统潜在的问题。
在实现本发明的过程中,发现现有技术中至少存在如下问题:
测试协议栈只能定位到接口上的消息,属于模糊定位,然而对于系统内部的处理错误则不能非常准确的定位到错误点。
发明内容
本发明提供一种用于通信系统中故障定位的方法及装置,使得在系统故障时,能够高效和快速的定位系统故障发生的部位。
本发明提供一种用于通信系统中故障定位的方法,包括:
在所述通信系统处理消息之前,读取需要处理的消息;
从所述消息中提取并存储所述消息中的关键字和消息特征码;
当所述通信系统出现故障时,通过所述关键字和消息特征码的记录流程进行故障定位。
优选地,所述消息特征码包括:记录序列号、消息类型、时间标签、用户标签、消息配置标志位和/或分类信息。
优选地,所述分类消息包括:中断、异常、管理和/或用户消息。
优选地,所述存储消息中的关键字和消息特征码的步骤具体包括:
根据所述消息类型、分类信息和ID标签进行所述关键字和消息特征码的存储。
本发明提供一种用于通信系统中故障定位的装置,包括:
消息接收模块,用于在系统处理消息之前,从消息队列中读取需要处理的消息;
消息处理模块,与所述消息接收模块连接,用于提取并存储消息中的关键字和消息特征码;
故障定位模块,与所述处理模块连接,用于当系统出现故障时,通过所述关键字和消息特征码的记录流程进行故障定位。
优选地,所述装置还包括,故障检测模块,与所述消息读取模块连接,用于检测系统运行是否正常。
优选地,所述消息处理模块包括:
提取单元,与所述读取消息模块连接,用于提取所述消息中的关键字和消息特征码;以及,
存储单元,与所述提取单元连接,用于根据所述消息类型、分类信息和ID标签进行所述关键字和消息特征码的存储。
优选地,所述存储单元包括顺序连接的PMC卡、PCI桥片、FPGA/CPLD以及SRAM。
上述技术方案中的一个技术方案具有如下有益效果:可通过系统在处理消息之前,将该消息的关键字和消息特征码存入存储设备中,然后再进行消息的正常处理,一旦系统出现故障时,则可从存储设备中读出出现问题时存入的消息,通过消息的记录流程进行故障排查;并且由于存储设备相对于系统来说属于独立外设,信息内容在单板复位后不需要进行初始化,从而存储的信息不会消失,这样有助于定位系统故障发生的部位和原因,从而有效地提高了系统的可靠性。
附图说明
图1为本发明的实施例中结构的示意图;
图2为本发明的实施例中用于通信系统中故障定位的方法流程图;
图3为本发明的实施例中用于通信系统中故障定位的装置结构的示意图;
图4位本发明的实施例中存储单元的结构示意图。
具体实施方式
本发明的实施例中系统在处理消息之前,将该消息的关键字和消息特征码存入存储设备中,然后再进行消息的正常处理,当系统出现故障时,从存储设备中读出出现问题时存入的消息,通过消息的记录流程进行故障排查,从而定位系统故障发生的部位,提高了系统的可靠性。
通过上述内容的介绍,为了使本技术领域的技术人员更好地理解本发明的技术方案,下面将结合附图和实施方式对本发明的实施例作进一步的详细说明。
本发明的实施例就是现有系统处理消息的流程之前增加了故障定位的流程,如图2所示,为本发明的实施例中用于通信系统中故障定位的方法流程图,具体步骤如下:
步骤201、在通信系统处理消息之前,从消息队列中提取需要处理的消息。
也就是在本步骤中将需要处理的消息提取出来,为下面的步骤做准备。上述的系统处理消息的步骤属于现有的处理过程,因此在这里不再敷述。
步骤202、提取并存储消息中的关键字和消息特征码。
该消息特征码可包括:记录序列号、消息类型、时间标签、ID标签(用户标签)、消息配置标志位和/或分类信息,其中该分类信息可分为:中断、异常、管理和/或用户消息。
在本步骤中存储的过程,首先通过该消息类型、分类信息和ID标签进行分类,然后将该消息的关键字和消息特征码存储到特定的硬件存储区域,并且每种消息都有固定的存储空间区域。
在本发明的实施例中存储的关键字和消息特征码,即使存储装置复位后也不会丢失,有效地提高了系统的可靠性。
步骤203、存储完关键字和消息特征码后,执行协议栈需要进行的操作。
也就是,存储完关键字和消息特征码后,然后执行正常的消息处理流程,在本步骤中的协议栈进行的操作也就是现有的信息处理流程,所以在此不再敷述。
步骤204、在执行信息处理流程的同时,监测系统运行是否出现故障,若是,执行步骤205,否则,继续执行步骤201。
上述系统出现故障可表现为系统死机或其他因处理消息引起的故障。
步骤205、读取出系统出现故障时存入的消息,可通过消息的记录流程进行故障定位从而查找出故障点。
由于通信系统出现故障时,则停止消息的处理,在本步骤中可通过存储的消息还原出现故障时通信系统运行的情况,从而可定位出出现故障的点。也就是检测出系统出现故障时,可通过消息的出记录流程进行故障排查,用户可快速定位出系统故障发生的部位。
该记录流程中包括存储消息的时间,从而可通过该存储的时间找到系统发生故障的部位。
由上述方法实施例的技术方案可知,通过系统在处理消息之前,将该消息的关键字和消息特征码存入存储设备中,然后再进行消息的正常处理,一旦系统出故障时,则可从存储设备中读出出现问题时存入的消息,通过消息的记录流程进行故障排查,这样有助于定位系统故障发生的部位和原因,从而有效地提高了系统的可靠性。
本发明的实施例还提供了一种用于配合本发明实施例所述方法的装置,下面结合图3进行说明。另需要首先说明的是,由于下述实施例是为实现上述方法实施例,故该装置中的模块都是为了实现上述方法中各步骤而设,但本发明的实施例并不限于下述的实施例,任何可实现上述方法的装置都应包含于本发明的保护范围中。
如图3所示,为本发明的实施例中用于通信系统中故障定位的装置结构的示意图,由图中可知,该故障定位装置35包括:消息接收模块31、消息处理模块32以及故障定位模块33,其中,消息接收模块31用于在系统处理消息之前,从消息队列中读取需要处理的消息;消息处理模块32,与所述消息接收模块31连接,用于提取并存储消息中的关键字和消息特征码;以及故障定位模块33,与所述处理模块连接32,用于在系统出现故障时,用于在系统出现故障时,通过所述消息的记录流程进行故障排查。
根据本发明的另一个实施例,该装置还包括故障检测模块34,与所述消息读取模块33连接,用于检测系统运行中是否出现故障。
根据本发明的另一个实施例,该消息处理模块32包括提取单元321,与所述消息接收模块31连接,用于提取所述消息中的关键字和消息特征码;以及,存储单元322,与所述提取单元321连接,用于根据所述消息类型、分类信息和ID标签进行所述关键字和消息特征码的存储。
如图4所示,为本发明的实施例中存储单元的结构示意图,根据本发明的另一个实施例,该存储单元322可包括顺序连接的PMC(PCI Mezzanine Bus,一种总线标准制式)卡41、PCI(Pedpherd Component Interconnect,周边元件扩展接口)桥片42、FPGA/CPLD(现场可编程逻辑阵列/复杂可编程逻辑器件)43以及SRAM(具有静志存取功能的内存)44。
上述存储单元是一块带有PCI接口,例如:支持66Mhz的32bitsPCI总线的标准PMC卡,实现PCI空间上的存储空间,例如:4Mbytes或者8Mbytes存储空间。由图4可知:PCI桥片42用于将PCI总线的信号转换为本地总线;FPGA/CPLD43用于将本地总线时序转换为SRAM需要的时序和SRAM44通信;SRAM44的大小可以根据需求进行选择。
本存储单元是实现在PCI总线上实现静态存储器,单板复位存储器中内容不消失空间一种简单装置。
该存储单元可以应用于任何带有PMC接口的单板,例如ATCA(AdvancedTelecom Computing Architecture,先进的电信计算平台)和CPCI(紧凑型PCI)上。
该存储单元作为节点信息的存储载体,可连接于有PMC插卡的系统设备单板上,在系统的信息处理中,在每次内部消息处理之前,均将该消息的关键字和消息特征码存入硬件设备中,例如:对外设的操作还可以采用外设的DMA(Direct Memory Access,直接内存存取)属性进行传输,可节省系统的负担,也就提高系统的效率,比没有DMA功能的外设性能要好得多,然后再进行消息的正常处理,处理完当前消息后从消息队列中重新提取新的消息,重复开始新的操作。在系统出故障时,复位单板就可以从硬件设备中读出在处理那个消息时出现问题,有利于系统软件的调试。
由上述技术方案可知,可通过系统在处理消息之前,将该消息的关键字和消息特征码存入存储设备中,然后再进行消息的正常处理,一旦系统出现故障时,则可从存储设备中读出出现问题时存入的消息,可通过消息的记录流程进行故障排查,并且由于存储设备相对于系统来说属于独立外设,信息内容在单板复位后不需要进行初始化,从而存储的信息不会消失,这样有助于定位系统故障发生的部位和原因,从而有效地提高了系统的可靠性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种用于通信系统中故障定位的方法,其特征在于,包括:
在所述通信系统处理消息之前,读取需要处理的消息;
从所述消息中提取并存储所述消息中的关键字和消息特征码;
当所述通信系统出现故障时,通过所述关键字和消息特征码的记录流程进行故障定位。
2.根据权利要求1所述的一种用于通信系统中故障定位的方法,其特征在于,所述消息特征码包括:记录序列号、消息类型、时间标签、用户标签、消息配置标志位和/或分类信息。
3.根据权利要求2所述的一种用于通信系统中故障定位的方法,其特征在于,所述分类消息包括:中断、异常、管理和/或用户消息。
4.根据权利要求2所述的一种用于通信系统中故障定位的方法,其特征在于,所述存储消息中的关键字和消息特征码的步骤具体包括:
根据所述消息类型、分类信息和ID标签进行所述关键字和消息特征码的存储。
5.一种用于通信系统中故障定位的装置,其特征在于,包括:
消息接收模块,用于在通信系统处理消息之前,从消息队列中读取需要处理的消息;
消息处理模块,与所述消息接收模块连接,用于提取并存储消息中的关键字和消息特征码;
故障定位模块,与所述处理模块连接,用于当所述通信系统出现故障时,通过所述关键字和消息特征码的记录流程进行故障定位。
6.根据权利要求5所述的一种用于通信系统中故障定位的装置,其特征在于,所述装置还包括,故障检测模块,与所述消息读取模块连接,用于检测系统运行是否正常。
7.根据权利要求5所述的一种用于通信系统中故障定位的装置,其特征在于,所述消息处理模块包括:
提取单元,与所述读取消息模块连接,用于提取所述消息中的关键字和消息特征码;以及,
存储单元,与所述提取单元连接,用于根据所述消息类型、分类信息和ID标签进行所述关键字和消息特征码的存储。
8.根据权利要求5所述的一种用于通信系统中故障定位的装置,其特征在于,所述存储单元包括顺序连接的PMC卡、PCI桥片、FPGA/CPLD以及SRAM。
CNA2007103084051A 2007-12-29 2007-12-29 一种用于通信系统中故障定位的方法及装置 Pending CN101471823A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2007103084051A CN101471823A (zh) 2007-12-29 2007-12-29 一种用于通信系统中故障定位的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2007103084051A CN101471823A (zh) 2007-12-29 2007-12-29 一种用于通信系统中故障定位的方法及装置

Publications (1)

Publication Number Publication Date
CN101471823A true CN101471823A (zh) 2009-07-01

Family

ID=40828966

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007103084051A Pending CN101471823A (zh) 2007-12-29 2007-12-29 一种用于通信系统中故障定位的方法及装置

Country Status (1)

Country Link
CN (1) CN101471823A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112040328A (zh) * 2020-08-04 2020-12-04 北京字节跳动网络技术有限公司 数据交互方法、装置和电子设备
WO2021253855A1 (zh) * 2020-06-19 2021-12-23 浪潮电子信息产业股份有限公司 一种信息记录方法、装置、设备及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021253855A1 (zh) * 2020-06-19 2021-12-23 浪潮电子信息产业股份有限公司 一种信息记录方法、装置、设备及可读存储介质
US12026037B2 (en) 2020-06-19 2024-07-02 Inspur Electronic Information Industry Co., Ltd. Information recording method, apparatus, and device, and readable storage medium
CN112040328A (zh) * 2020-08-04 2020-12-04 北京字节跳动网络技术有限公司 数据交互方法、装置和电子设备
CN112040328B (zh) * 2020-08-04 2023-03-10 北京字节跳动网络技术有限公司 数据交互方法、装置和电子设备

Similar Documents

Publication Publication Date Title
US6012148A (en) Programmable error detect/mask utilizing bus history stack
CN101976217B (zh) 网络处理器异常检测方法及系统
CN111414268B (zh) 故障处理方法、装置及服务器
CN112732636B (zh) 基于多fpga的芯片原型验证系统的配置方法、装置和设备
CN106294222A (zh) 一种确定pcie设备与插槽对应关系的方法及装置
CN101551762B (zh) 具有抗单粒子效应能力的星载处理平台
CN106537351B (zh) 用于诊断无线通信设备中的电源故障的方法
CN104268061A (zh) 一种适用于虚拟机的存储状态监控机制
US20080270827A1 (en) Recovering diagnostic data after out-of-band data capture failure
CN101493847A (zh) 一种通讯片上系统芯片追踪调试的方法及装置
CN100446129C (zh) 一种内存故障测试的方法及系统
CN106681877A (zh) 芯片调试系统及方法与系统芯片
CN101471823A (zh) 一种用于通信系统中故障定位的方法及装置
CN110287700A (zh) 一种iOS应用安全分析方法及装置
CN116774016B (zh) 芯片测试方法、装置、设备及存储介质
CN109471763A (zh) 抓取NVME硬盘trace的方法、装置、设备及系统
CN104780123A (zh) 一种网络包收发处理装置及其设计方法
EP1210663A2 (en) Method and apparatus for extracting first failure and attendant operating information from computer system devices
CN1932774A (zh) 一种基于多串口资源的嵌入式系统软件快速测试系统和方法
US20070055913A1 (en) Facilitating detection of hardware service actions
CN106886471A (zh) 一种基于linux中磁盘的读写故障检测方法及系统
CN112069006B (zh) 一种检测分析gpu速率状态的方法、装置及计算机可读介质
CN111324516A (zh) 自动记录异常事件的方法及装置、存储介质、电子设备
CN109144800A (zh) 一种服务器故障信息的收集方法、装置及相关设备
CN114970428A (zh) 用于SoC中Flexray总线控制器的验证系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20090701