CN1863106A - 无线通信系统中的板间通信故障检测方法 - Google Patents

无线通信系统中的板间通信故障检测方法 Download PDF

Info

Publication number
CN1863106A
CN1863106A CN 200610072535 CN200610072535A CN1863106A CN 1863106 A CN1863106 A CN 1863106A CN 200610072535 CN200610072535 CN 200610072535 CN 200610072535 A CN200610072535 A CN 200610072535A CN 1863106 A CN1863106 A CN 1863106A
Authority
CN
China
Prior art keywords
message
cpu
sends
chip
loopback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610072535
Other languages
English (en)
Inventor
申纪伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN 200610072535 priority Critical patent/CN1863106A/zh
Publication of CN1863106A publication Critical patent/CN1863106A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明公开了一种无线通信系统中的板间通信故障检测方法,包括:报文发送CPU发送报文,该报文经过需检测芯片后传输至报文检测CPU;报文检测CPU检测是否能接收到所述报文以及报文的正确性,如果一次或多次检测不到正确的报文,则发送故障告警。通过本发明方案使对芯片的故障检测更加全面,并大大提高了故障检测的可靠性。

Description

无线通信系统中的板间通信故障检测方法
技术领域
本发明涉及无线通信技术,特别是指一种无线通信系统中的板间通信故障检测方法。
背景技术
无线通信系统是非常复杂的分布式系统,通常由多种单板共同实现通信功能,每个单板完成通信中的部分处理过程。
当前无线系统内部大多采用异步传输模式(ATM,Asynchronous TransferMode)进行板间通信,每个单板都需要和其他单板进行通信,传递信息,共同完成信令和用户数据的传输、转换和处理。
参见图1所示,图1为一个典型的采用ATM通信技术的单板通信模型示意图。一般在每个单板中都包括有:中央处理器(CPU)、交换芯片、接口芯片、以及通信总线。其中,交换芯片为可选,当单板上有多个CPU时可能存在。
现有技术中,CPU软件会定期读取如交换芯片、接口芯片等各个通信芯片的寄存器信息,判断是否存在芯片故障,当判断出有故障时,则产生告警或进行单板倒换/复位。其中,大多数故障在复位后就会恢复。
现有的检测方法不是一个整体的检测方案,当出现个别芯片故障但是寄存器正常的情况,或者两个芯片间数据总线故障时,无法有效的检测到异常。从而造成故障没有被及时处理(如倒换)而使业务长期中断。
发明内容
有鉴于此,本发明的主要目的在于提供一种无线通信系统中的板间通信故障检测方法,使对芯片的故障检测更加全面,提高故障检测的可靠性。
基于上述目的本发明提供的一种无线通信系统中的板间通信故障检测方法,包括:
A.报文发送CPU发送报文,该报文经过需检测芯片后传输至报文检测CPU;
B.报文检测CPU检测是否能接收到所述报文以及报文的正确性,如果一次或多次检测不到正确的报文,则发送故障告警。
该方法所述报文发送CPU与报文检测CPU为同一CPU,所述报文发送CPU发送的报文为经过需检测芯片后仍返回至该CPU的环回报文。
该方法步骤A前进一步包括在需要检测的各个芯片间开通环回永久虚电路PVC,步骤A中发送CPU沿该环回PVC发送所述环回报文。
该方法步骤A中所述发送环回报文的过程包括:报文发送CPU将发送的环回报文的目的地址设置为该报文发送CPU自身地址后发出。
该方法所述报文发送CPU与报文检测CPU不是同一CPU,所述报文发送CPU发送的报文为经过需检测芯片后至报文检测CPU的握手报文。
该方法步骤A中所述发送握手报文的过程包括:CPU将发送的环回报文的目的地址设置为所述另一CPU的地址后发出。
该方法所述报文检测CPU与报文发送CPU为分别处于两块不同单板的CPU。
该方法所述报文检测CPU所在单板与报文发送CPU所在单板通过通信总线相连。
该方法步骤A中所述报文发送为以预先设置的周期进行发送。
该方法步骤A中所述需检测芯片为所述报文发送CPU所在单板上的芯片。
该方法步骤B中所述多次检测不到正确的报文是连续多次检测不到正确的报文。
该方法步骤B中如果一次或多次检测不到正确的报文,则进一步包括:每间隔预设的一段时间采集芯片寄存器信息作为故障的定位信息。
该方法步骤B后进一步包括:在发送故障告警后,如果又收到报文,则发送恢复告警。
该方法步骤B后进一步包括:在发送故障告警并延迟一段时间后复位所述单板。
从上面所述可以看出,本发明提供的无线通信系统中的板间通信故障检测方法通过由单板中的CPU发送和接收经过待检测芯片的握手报文,从而简单有效地实现了芯片的故障检测,避免了当个别芯片故障但是寄存器正常的情况,或者两个芯片间数据总线故障时,无法有效检测的情况,使对芯片的故障检测更加全面,并大大提高了故障检测的可靠性。
附图说明
图1为典型的采用ATM通信技术的单板通信模型示意图;
图2为本发明第一个较佳实施例中实现板间通信故障检测的单板通信示意图;
图3为本发明第一个较佳实施例的板间通信故障检测流程示意图;
图4为本发明第二个较佳实施例中实现板间通信故障检测的单板通信示意图;
图5为本发明第二个较佳实施例的板间通信故障检测流程示意图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
本发明无线通信系统中的板间通信故障检测方法核心包括:报文发送CPU发送报文,该报文经过需检测芯片后传输至报文检测CPU;报文检测CPU检测是否能接收到所述报文以及报文的正确性,如果一次或多次检测不到正确的报文,则发送故障告警。
其中,至少有两种具体实现方案:方案一、所述报文发送CPU与报文检测CPU为同一CPU,则报文发送CPU发送的报文经过需检测芯片后仍返回至该CPU的环回报文。方案二、所述报文发送CPU与报文检测CPU不是同一CPU,报文发送CPU发送的报文为经过需检测芯片后到达报文检测CPU的握手报文,由报文检测CPU进行检测。
下面分别对上述两个实施方案进行详细描述。
本发明第一个较佳的实现方案参见图2所示,预先在单板内部设置一个从CPU出发并返回到CPU自身的环回永久虚电路(PVC)(ATM连接)。如图2中箭头所示,其环回路径为CPU—>交换芯片(可选)—>接口芯片—>通信总线—>接口芯片—>交换芯片(可选)—>CPU。
这里,如果芯片本身支持环回功能,则可以直接在各个芯片间开通所述环回PVC;如果芯片不支持环回功能,也可以通过总线交换实现环回PVC,即CPU发送的环回报文的目的地址设置为该CPU自身,这样该环回报文从单板输出后通过总线交换,还将返回给该CPU自身。
参见图3所示,检测过程中包括以下步骤:
步骤11,CPU周期发送环回报文;并检测是否能接收到环回报文以及环回报文的正确性。
其中,CPU发送环回报文的周期,可根据检测需要而定,如:每2秒发送一次报文。
步骤12,如果一次或者连续多次,这里即连续一个或多个周期检测不到正确的环回报文,则每间隔一段时间连续采集2次芯片寄存器信息作为定位信息,用于以后的故障定位;并发送环回故障告警,以便于执行进一步的上报告警或倒换/复位单板等操作,比如:在延迟一段时间后复位单板。
本步骤中,一般是根据故障定位的需要来选择采集哪些定位信息,比如:定位信息中可以包括有芯片本身的状态、芯片接收的报文计数等。并且,不一定对单板中的所有芯片都进行采集,比如:根据芯片的能力,选择较重要的芯片来采集其寄存器中的信息。
所述间隔时间的长短可以根据实际要求进行规定,所述的连续采集次数也视实际需要而定。
步骤13,发送环回故障告警后,单板复位前,如果又收到环回报文,则发送环回恢复告警。
该方案中如果一块单板上存在多个CPU,则根据实际情况可以由其中一个CPU执行上述操作,环回报文的环回路径应也经过其他的CPU;也可以由其中一个以上的CPU同时执行上述操作进行故障检测,每个CPU负责单板上一部份的芯片。
此外,通常单板与单板之间通过总线连接,参见图4所示,这样本发明还可以通过在两块或者多块单板间配置专门的检测PVC,由一端单板上CPU发送握手报文,另一端单板上的CPU接收,同样可以检测到故障。该实现方案的核心包括:CPU发送经过需检测芯片后至另一个CPU的握手报文;所述另一个CPU检测是否能接收到握手报文以及握手报文的正确性,如果一次或多次检测不到正确的握手报文,则发送故障告警。
在本发明的第二个实施例中预先设置一个从单板1的CPU出发到单板2的CPU的检测PVC。其路径为单板1的CPU—>交换芯片—>接口芯片—>通信总线—>接口芯片—>交换芯片—>单板2的CPU。
这里,可以通过总线交换实现所述检测PVC,即CPU发送的握手报文的目的地址设置为单板2上CPU的地址,这样该握手报文从单板输出后通过总线交换到达单板2的CPU。
参见图5所示,检测过程中包括以下步骤:
步骤21,单板1的CPU周期发送握手报文;并检测是否能接收到握手报文以及握手报文的正确性。
其中,单板1的CPU发送握手报文的周期,可根据检测需要而定,如:每2秒发送一次报文。
步骤22,如果单板2一次或者连续多次,这里即连续一个或多个周期检测不到正确的环回报文,则每间隔一段时间连续采集2次芯片寄存器信息作为定位信息,用于以后的故障定位;并发送故障告警,以便于执行进一步的上报告警或倒换/复位单板等操作,比如:在延迟一段时间后复位单板1和单板2,如果在单板1和单板2之间还有单板连接在所述通信总线上,则复位所有这些单板。
本步骤中,一般是根据故障定位的需要来选择采集哪些定位信息,比如:定位信息中可以包括有芯片本身的状态、芯片接收的报文计数等。并且,不一定对单板中的所有芯片都进行采集,比如:根据芯片的能力,选择较重要的芯片来采集其寄存器中的信息。
所述间隔时间的长短可以根据实际要求进行规定,所述的连续采集次数也视实际需要而定。
步骤23,发送故障告警后,单板复位前,如果又收到握手报文,则说明故障已恢复,发送恢复告警。
在实际中上面所述的环回PVC或检测PVC可以根据需要选择所经过的芯片,不一定经过单板中的所有芯片。
总之,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种无线通信系统中的板间通信故障检测方法,其特征在于,包括:
A.报文发送CPU发送报文,该报文经过需检测芯片后传输至报文检测CPU;
B.报文检测CPU检测是否能接收到所述报文以及报文的正确性,如果一次或多次检测不到正确的报文,则发送故障告警。
2.根据权利要求1所述的方法,其特征在于,所述报文发送CPU与报文检测CPU为同一CPU,所述报文发送CPU发送的报文为经过需检测芯片后仍返回至该CPU的环回报文。
3.根据权利要求2所述的方法,其特征在于,步骤A前进一步包括在需要检测的各个芯片间开通环回永久虚电路PVC,步骤A中发送CPU沿该环回PVC发送所述环回报文。
4.根据权利要求2所述的方法,其特征在于,步骤A中所述发送环回报文的过程包括:报文发送CPU将发送的环回报文的目的地址设置为该报文发送CPU自身地址后发出。
5.根据权利要求1所述的方法,其特征在于,所述报文发送CPU与报文检测CPU不是同一CPU,所述报文发送CPU发送的报文为经过需检测芯片后至报文检测CPU的握手报文。
6.根据权利要求5所述的方法,其特征在于,步骤A中所述发送握手报文的过程包括:CPU将发送的环回报文的目的地址设置为所述另一CPU的地址后发出。
7.根据权利要求5或6所述的方法,其特征在于,所述报文检测CPU与报文发送CPU为分别处于两块不同单板的CPU。
8.根据权利要求7所述的方法,其特征在于,所述报文检测CPU所在单板与报文发送CPU所在单板通过通信总线相连。
9.根据权利要求1所述的方法,其特征在于,步骤A中所述报文发送为以预先设置的周期进行发送。
10.根据权利要求1所述的方法,其特征在于,步骤A中所述需检测芯片为所述报文发送CPU所在单板上的芯片。
11.根据权利要求1所述的方法,其特征在于,步骤B中所述多次检测不到正确的报文是连续多次检测不到正确的报文。
12.根据权利要求1所述的方法,其特征在于,步骤B中如果一次或多次检测不到正确的报文,则进一步包括:每间隔预设的一段时间采集芯片寄存器信息作为故障的定位信息。
13.根据权利要求1所述的方法,其特征在于,该方法步骤B后进一步包括:在发送故障告警后,如果又收到报文,则发送恢复告警。
14.根据权利要求1所述的方法,其特征在于,该方法步骤B后进一步包括:在发送故障告警并延迟一段时间后复位所述单板。
CN 200610072535 2006-04-07 2006-04-07 无线通信系统中的板间通信故障检测方法 Pending CN1863106A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610072535 CN1863106A (zh) 2006-04-07 2006-04-07 无线通信系统中的板间通信故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610072535 CN1863106A (zh) 2006-04-07 2006-04-07 无线通信系统中的板间通信故障检测方法

Publications (1)

Publication Number Publication Date
CN1863106A true CN1863106A (zh) 2006-11-15

Family

ID=37390438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610072535 Pending CN1863106A (zh) 2006-04-07 2006-04-07 无线通信系统中的板间通信故障检测方法

Country Status (1)

Country Link
CN (1) CN1863106A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102143014A (zh) * 2010-11-03 2011-08-03 华为数字技术有限公司 一种检测单板故障的方法、单板和路由器
CN104079454A (zh) * 2014-07-11 2014-10-01 杭州华三通信技术有限公司 一种设备异常检测方法和设备
CN109218117A (zh) * 2018-11-27 2019-01-15 迈普通信技术股份有限公司 链路检测方法、装置及网络设备
CN110794436A (zh) * 2019-10-28 2020-02-14 捷信(浙江)通信技术有限公司 船舶定位管理系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102143014A (zh) * 2010-11-03 2011-08-03 华为数字技术有限公司 一种检测单板故障的方法、单板和路由器
CN104079454A (zh) * 2014-07-11 2014-10-01 杭州华三通信技术有限公司 一种设备异常检测方法和设备
CN104079454B (zh) * 2014-07-11 2017-12-29 新华三技术有限公司 一种设备异常检测方法和设备
CN109218117A (zh) * 2018-11-27 2019-01-15 迈普通信技术股份有限公司 链路检测方法、装置及网络设备
CN110794436A (zh) * 2019-10-28 2020-02-14 捷信(浙江)通信技术有限公司 船舶定位管理系统

Similar Documents

Publication Publication Date Title
US10374751B2 (en) Increasing communication safety by preventing false packet acceptance in high-speed links
EP1853003B1 (en) System and method for monitoring a data network segment
US11620175B2 (en) Method and apparatus for disconnecting link between PCIe device and host
EP2299633B1 (en) Misdirected packet detection method
CN1503513A (zh) 用于检测通信设备中模块之间发送的消息丢失的系统和方法
CN1195813A (zh) 由分布式计算机系统的一个硬件元件报告错误的系统
CN103957155B (zh) 报文传输方法、装置及互联接口
CN1527547A (zh) 用于在高可行性以太网背板上进行链路故障检测的装置
CN1499780A (zh) 具有高可行性的以太网背板结构
CN1571417A (zh) 网络数据重新路由
CN1941683A (zh) 一种触发链路聚合组重分发业务的方法及系统
CN1912641A (zh) 一种单板在位检测方法及系统
CN1260654C (zh) 由分布式计算机系统的一个硬件元件报告错误的方法
CN1863106A (zh) 无线通信系统中的板间通信故障检测方法
CN101990239A (zh) 提高数据传输可靠性的方法、系统及无线通信设备
CN101051957A (zh) 链路状态以及捆绑链路状态动态调整方法和装置
CN1120379A (zh) 在分组交换设备中用于处理冗余交换平台的方法以及用于实现这种方法的交换设备
CN102843274B (zh) 一种多链路故障检测的方法及装置
CN1842076A (zh) 一种多传输通道数据传输方法
CN1845525A (zh) 主从设备系统
CN101667953A (zh) 一种快速环网物理链路状态的上报方法及装置
CN105721232A (zh) 一种实现链路检测的方法和装置
CN101035028A (zh) 接错检测的方法和网络设备
CN109412968B (zh) 一种时间触发以太网端节点的冗余通信接收管理系统及方法
CN1949724A (zh) 一种以太端口保护的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication