CN1878098A - 一种级联设备可靠性测试的方法及系统 - Google Patents

一种级联设备可靠性测试的方法及系统 Download PDF

Info

Publication number
CN1878098A
CN1878098A CN 200610090390 CN200610090390A CN1878098A CN 1878098 A CN1878098 A CN 1878098A CN 200610090390 CN200610090390 CN 200610090390 CN 200610090390 A CN200610090390 A CN 200610090390A CN 1878098 A CN1878098 A CN 1878098A
Authority
CN
China
Prior art keywords
cascade
cascade device
module
reliability
testing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610090390
Other languages
English (en)
Other versions
CN100396030C (zh
Inventor
张华�
潘玲娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2006100903901A priority Critical patent/CN100396030C/zh
Publication of CN1878098A publication Critical patent/CN1878098A/zh
Application granted granted Critical
Publication of CN100396030C publication Critical patent/CN100396030C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种级联设备可靠性测试的方法,用于级联设备可靠性测试过程中。包括步骤:1)配置级联设备业务;2)下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;3)记录故障模拟前后以及主备用模块倒换后业务信息或/和级联设备信息;4)根据记录结果得出倒换测试性能指标。本发明还公开一种级联设备可靠性测试的系统。本发明可以提高级联设备可靠性测试的准确性和可靠性。

Description

一种级联设备可靠性测试的方法及系统
技术领域
本发明涉及通讯领域,尤其涉及一种级联设备可靠性测试的方法及系统。
背景技术
通信产品中,为了实现大容量设计,系统主要通过多框设备级联,灵活实现各种容量规格的组网特性;设备的级联特性,设备框间级联的高速通道为通信产品的高可靠性带来了挑战;为了保障单点故障不会影响系统的正常工作,级联设备各个物理通道都采用了备份设计;例如对于重要的框间级联信号、级联单板以及级联通道的互连都使用了备份。可靠性设计保障的重点在于发生单点故障时,设备能够正确的检测到故障并自动完成故障屏蔽,实现对业务的无影响。通常级联设备的备份设计、发生故障时的检测、自动触发主备倒换的可靠性、倒换的性能等直接关系到系统的可靠性指标,因此对其测试验证就显的非常重要。
目前对于级联系统的可靠性的测试,采用的是人工的方法进行,测试人员对于1+1备份的级联通道模拟主用通道故障,如采用复位,下电主用级联通道的单板或者拔插主要级联通道光纤等,触发级联模块的倒换,然后来观察倒换是否成功,级联业务通道是否正常等。
但由于倒换测试一般要求进行多次的倒换测试来验证倒换的可靠性,由人工进行的测试,非常耗费时间和人力;尤其对于组网方式灵活的设备,设备软件每次升级后,各种组网模式下的验证,使用手工的方式几乎无法完成。
其次,对于部分故障模拟和状态读取等对时间要求高的测试项目,采用人工测试,会由于时间间隔较长而导致错误。
发明内容
本发明要解决的技术问题是提供一种级联设备可靠性测试的方法及系统,可以提高级联设备可靠性测试的准确性和可靠性。
为解决上述技术问题,本发明的目的是通过以下技术方案实现的:
本发明提供一种级联设备可靠性的测试方法,包括步骤:
1)配置级联设备业务;
2)下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
3)记录故障模拟前后以及主备用模块倒换后业务信息或/和级联设备信息;
4)根据记录结果得出倒换测试性能指标。
所述步骤1)之后所述步骤2)之前包括:
11)查询业务是否正常,若业务正常进入步骤12),若业务不正常则结束该流程;
12)清空测试仪器历史记录;
13)查询备用模块是否正常,若正常则进入步骤2),若不正常则进入步骤3)。
优选的,所述步骤12)还包括:设置测试循环最大次数;
所述步骤12)之后进一步:
121)查询业务是否正常,若正常进入步骤13),若不正常进入步骤3);
所述步骤3)之后包括:
31)循环次数加1,若当前循环次数等于或大于最大循环次数,则进入步骤4),若小于最大循环次数则返回步骤121)。
优选的,所述步骤2)模拟主用模块故障之后进一步:
21)查询故障模拟是否正常完成,若正常完成,则自动触发主备用模块倒换并执行步骤3),若不正常则进入步骤3)。
优选的,所述步骤31)之后进一步:
32)配置级联设备业务,进入步骤121)。
优选的,所述步骤4)中倒换测试性能指标为:倒换成功率或/和业务中断时间;
优选的,倒换成功次数与总的倒换次数的商得到倒换成功率;
优选的,分组业务通过计算丢包个数与发包速率的商得到业务中断时间,窄带业务中:E1帧结构通过计算业务中断个数与8000的商加误码个数与1984000的商得到业务中断时间,STM-1帧结构通过业务中断个数与8000的商加误码个数与149.76百万的商得到业务中断时间。
优选的,所述模拟主用模块故障方法为:下发故障模拟命令改写寄存器关断发送光模块或时钟无输出,或下发故障模拟命令关断单板输出或复位级联芯片。
优选的,所述测试程序使用TCL脚本设计,基于TCL脚本解释器运行。
本发明还提供一种级联设备可靠性测试的系统,包括:
业务配置单元,用于配置级联设备业务;
故障控制单元,用于下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
记录单元,用于记录倒换结果,记录故障模拟前后以及主备用模块倒换后业务信息和/或级联设备信息;
计算单元,用于根据监控结果,得出倒换测试性能指标。
优选的,所述系统还包括:
查询单元,用于查询级联设备故障模拟前后业务信息或/和级联设备信息。
优选的,所述系统还包括:
循环次数设置单元,用于清空测试仪器历史记录,设置测试循环次数最大值,并累加循环次数,比较当前循环次数与最大循环次数,若当前循环次数大于或等于最大循环次数,则通知记录单元将记录结果反馈给计算单元。
以上技术方案可以看出,由于下发控制模拟故障命令到级联设备,可以模拟级联设备主用模块各种器件的故障,故障模拟的范围更广,同时也避免在人工操作中通过拔插光纤或拔插单板模拟故障可能出现的设备损坏的情况。
进一步的,设置循环次数,可以根据需要设置多次循环,不断循环的模拟级联设备的各种故障,可以系统、全面的测试级联设备的可靠性,提高测试的广度和深度。
进一步的,在测试过程中不断的查询业务状况和级联设备的状况,并记录业务异常信息和级联设备异常信息,及时地记录故障模拟后的每个业务和级联设备的异常信息,使得级联设备测试性能的计算更准确,更可靠。
进一步的,测试程序使用TCL脚本设计,可以便利的应用在各种级联系统的测试中,提高了测试的通用性,且TCL在测试领域广泛应用,保证测试的可移植性。
附图说明
图1是本发明提供的方法第一实施例图;
图2是本发明提供的方法第二实施例图;
图3是本发明提供的方法第三实施例图;
图4是本发明提供的方法第四实施例图;
图5是本发明提供的系统第一实施例图;
图6是本发明提供的系统第二实施例图;
图7是本发明提供的系统第三实施例图。
具体实施方式
本发明应用于级联设备可靠性测试过程中,实现级联设备可靠性测试的自动化。其核心思想是:下发故障模拟命令,模拟主备用模块故障触发主备用模块倒换,并记录故障模拟前后以及倒换后业务和级联设备的异常信息,得出倒换测试性能指标。
根据上述核心思想,本发明提供详细的实施例说明。
请参照图1是本发明提供的方法第一实施例。
本实施例中整个测试过程由运行在PC机上的测试程序完成。
测试程序在PC机上运行,使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果,并计算倒换测试性能指标。
该实施例包括步骤:
D1)配置业务;
配置级联设备跨框业务。
D2)下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
测试程序使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果。
模拟主用模块故障主要通过模拟设备硬件故障来实现,测试程序通过OMC网口下发故障模拟控制命令控制实现。需要说明的是级联设备需要实现对设备内部的可控,是级联设备设计的可测性的基本需求。对于级联部分的测试,主要的实现方法有以下几种:
通过测试程序改写寄存器的配置,关断主用光模块。具体改写已经定义好的寄存器里光模块信号状态值(假设:0表示光口发光正常,1表示光口关断)来模拟故障,模拟故障时将寄存器信号状态值由原来的0改为1,关断主用模块的光模块,模拟主用模块故障。
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x01;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
该命令的定义如下:
dopra mem modify<start address><byte 1><byte 2>...<byte n>
<start address>:a HEX number with the prefix′0x′
<byte i>:the new data from<start address>,where:every byte must be a HEXwithout the prefix′0x′n<=255
也可以通过改写寄存器配置模拟主用时钟的故障。主用通过模拟主用时钟芯片故障来关断主用时钟输出,已经定义好的寄存器里的时钟信号状态值(假设:1表示时钟芯片输出正常,0表示时钟芯片无输出或输出不稳定)
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x00;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
关闭主用模块单板电源的输出,即模拟单板硬件故障触发倒换,测试程序通过命令mnt xiadian sn,其中sn为槽位号,假设目前模拟故障的单板在1槽,可以通过mnt xiadian 1命令关断1槽单板的电源。
另外还可以通过复位级联芯片模拟主用模块故障,测试程序通过如下命令复位级联芯片:rst chipid;输入要复位的芯片id号(该id设备中已经预先定义了的,假设级联芯片的id号为0),则输入命令rst 0复位级联芯片,触发级联倒换。
D3)记录业务信息和/或级联设备信息;
记录故障模拟前后以及主备用模块倒换后业务信息和级联设备信息,业务信息主要是业务异常告警、分组业务中业务监测仪器显示的发包速率、丢包个数,TDM业务中业务中断个数、误码个数等,级联设备信息主要是主备用模块倒换不成功次数,倒换成功次数,设备异常告警、设备的中断等信息。
在整个测试过程中,若业务始终正常,则不用记录业务信息,只记录级联设备信息;同样在只有一次测试时,在测试过程中级联设备没有出现上述的异常现象,只记录业务的信息。但在实际的测试过程中,伴随主备用模块的倒换,通常会出现业务异常和级联设备的异常,所以会记录业务信息和级联设备信息。
D4)得出倒换测试性能指标。
根据记录结果计算倒换测试性能指标。
倒换测试性能包括:测试倒换成功率,业务中断时间,异常告警等。其中异常告警作为倒换测试性能指标的参考值,本领域技术人员可以依据经验判定其对倒换测试性能的参考价值。
倒换性能指标的计算,业务中断时间是测试程序在测试过程中自动统计业务的信息并计算;统计记录的倒换不成功次数和倒换成功次数,倒换成功次数除以总的倒换次数,得到倒换成功率。
其中业务中断时间的计算:分组业务根据发包速率(V)、丢包个数(N),计算业务中断时间(T),T=N/V。TDM(窄带)业务,测试仪器根据帧统计并上报一次业务中断个数(N1)和误码个数(N2),可以根据TDM测试仪器统计数据计算业务中断时间;其中E1帧结构的业务中断时间计算公式:T=N1/8K+N2/1984K,STM-1帧结构的业务中断时间计算公式:T=N1/8K+N2/149.76M。
请参照图2是本发明提供的方法第二实施例。
本实施例增加在测试过程中,查询业务以及设备状况,查询模拟故障是否成功,倒换是否成功的过程,在测试过程中增加查询过程使整个测试过程更加完善,整个测试过程更加准确和可靠。
本实施例中整个测试过程由运行在PC机上的测试程序完成。
测试程序在PC机上运行,使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果,并计算倒换测试性能指标。
该实施例包括步骤:
E1)配置业务;
配置级联设备跨框业务。
测试程序在PC机上运行,使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果。
E2)查询业务是否正常;
若业务正常进入步骤E3),若业务不正常则结束该流程;
此处查询业务主要是查询步骤E1)中配置的级联设备业务是否正常。
E3)清空测试仪器历史记录;
E4)查询备用模块是否正常;
若备用模块正常则进入步骤E5),若不正常则进入步骤E8);此处若查询备用模块不正常,则说明级联设备无法进行倒换测试,即可以认为倒换不成功,在记录级联设备信息的时候记录此信息。
E5)下发故障模拟命令到级联设备,模拟主用模块故障;
模拟主用模块故障主要通过模拟设备硬件故障来实现,测试程序通过OMC网口下发故障模拟控制命令控制实现。需要说明的是级联设备需要实现对设备内部的可控,是级联设备设计的可测性的基本需求。对于级联部分的测试,主要的实现方法有以下几种:
通过测试程序改写寄存器的配置,关断主用光模块。具体改写已经定义好的寄存器里光模块信号状态值(假设:0表示光口发光正常,1表示光口关断)来模拟故障,模拟故障时将寄存器信号状态值由原来的0改为1,关断主用模块的光模块,模拟主用模块故障。
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x01;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
该命令的定义如下:
dopra mem modify<start address><byte 1><byte 2>...<byte n>
<start address>:a HEX number with the prefix′0x′
<byte i>:the new data from<start address>,where:every byte must be a HEXwithout the prefix′0x′n<=255
也可以通过改写寄存器配置模拟主用时钟的故障。主用通过模拟主用时钟芯片故障来关断主用时钟输出,已经定义好的寄存器里的时钟信号状态值(假设:1表示时钟芯片输出正常,0表示时钟芯片无输出或输出不稳定)
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x00;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
关闭主用模块单板电源的输出,即模拟单板硬件故障触发倒换,测试程序通过命令mnt xiadian sn,其中sn为槽位号,假设目前模拟故障的单板在1槽,可以通过mnt xiadian 1命令关断1槽单板的电源。
另外还可以通过复位级联芯片模拟主用模块故障,测试程序通过如下命令复位级联芯片:rst chipid;输入要复位的芯片id号(该id设备中已经预先定义了的,假设级联芯片的id号为0),则输入命令rst 0复位级联芯片,触发级联倒换。
E6)查询故障模拟是否正常完成;
若正常完成,则进入步骤E7),若不正常则进入步骤E8)记录级联设备信息;
E7)触发主备用模块倒换;
故障模拟正常完成后自动触发主备用模块倒换。
E8)记录业务信息或/和级联设备信息;
记录故障模拟前后以及主备用模块倒换后业务信息和级联设备信息,业务信息主要是业务异常告警、分组业务中业务监测仪器显示的发包速率、丢包个数,TDM业务中业务中断个数、误码个数等,级联设备信息主要是主备用模块倒换不成功次数,倒换成功次数,设备异常告警、设备的中断等信息。
在模拟故障不成功、备用模块不正常时只记录级联设备信息,故障模拟成功后会同时记录级联设备信息和业务信息。
E9)得出倒换测试性能指标。
根据记录结果计算倒换测试性能指标。
倒换测试性能包括:测试倒换成功率,业务中断时间,异常告警等。其中异常告警作为倒换测试性能指标的参考值,本领域技术人员可以依据经验判定其对倒换测试性能的参考价值。
倒换性能指标的计算,业务中断时间是测试程序在测试过程中自动统计业务的信息并计算;统计记录的倒换不成功次数和倒换成功次数,倒换成功次数除以总的倒换次数,得到倒换成功率。
其中业务中断时间的计算:分组业务根据发包速率(V)、丢包个数(N),计算业务中断时间(T),T=N/V。TDM(窄带)业务,测试仪器根据帧统计并上报一次业务中断个数(N1)和误码个数(N2),可以根据TDM测试仪器统计数据计算业务中断时间;其中E1帧结构的业务中断时间计算公式:T=N1/8K+N2/1984K,STM-1帧结构的业务中断时间计算公式:T=N1/8K+N2/149.76M。
请参阅图3是本发明提供的方法第三实施例
本实施例增加预设最大循环次数,多次循环模拟主用模块的故障,对整个级联设备进行更广、更深度的测试。
本实施例中整个测试过程由运行在PC机上的测试程序完成。
测试程序在PC机上运行,使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果,并计算倒换测试性能指标。
该实施例包括步骤:
F1)配置业务;
配置级联设备跨框业务。
测试程序在PC机上运行,使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果。
F2)查询业务是否正常;
若业务正常进入步骤F3),若业务不正常则结束该流程;
此处查询业务主要是查询步骤F1)中配置的级联设备业务是否正常。
F3)清空测试仪器历史记录,设置测试循环最大次数;
设置测试循环次数最大值根据测试的需要设置最大次数,例如可以设置最大次数为100次或1000次。
F4)查询业务是否正常;
若正常进入步骤F5),若不正常进入步骤F9);
此处查询业务主要查询在主备用模块倒换结束后,进入下一个测试过程之前查询倒换后业务是否正常。
F5)查询备用模块是否正常;
若正常则进入步骤F6),若不正常则进入步骤F9);此处若查询备用模块不正常,则说明级联设备无法进行倒换测试,即可以认为倒换不成功,在记录级联设备信息的时候记录此信息。
F6)下发故障模拟命令到级联设备,模拟主用模块故障;
模拟主用模块故障主要通过模拟设备硬件故障来实现,测试程序通过OMC网口下发故障模拟控制命令控制实现。需要说明的是级联设备需要实现对设备内部的可控,是级联设备设计的可测性的基本需求。对于级联部分的测试,主要的实现方法有以下几种:
通过测试程序改写寄存器的配置,关断主用光模块。具体改写已经定义好的寄存器里光模块信号状态值(假设:0表示光口发光正常,1表示光口关断)来模拟故障,模拟故障时将寄存器信号状态值由原来的0改为1,关断主用模块的光模块,模拟主用模块故障。
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x01;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
该命令的定义如下:
dopra mem modify<start address><byte 1><byte 2>...<byte n>
<start address>:a HEX number with the prefix′0x′
<byte i>:the new data from<start address>,where:every byte must be a HEXwithout the prefix′0x′n<=255
也可以通过改写寄存器配置模拟主用时钟的故障。主用通过模拟主用时钟芯片故障来关断主用时钟输出,已经定义好的寄存器里的时钟信号状态值(假设:1表示时钟芯片输出正常,0表示时钟芯片无输出或输出不稳定)
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x00;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
关闭主用模块单板电源的输出,即模拟单板硬件故障触发倒换,测试程序通过命令mnt xiadian sn,其中sn为槽位号,假设目前模拟故障的单板在1槽,可以通过mnt xiadian 1命令关断1槽单板的电源。
另外还可以通过复位级联芯片模拟主用模块故障,测试程序通过如下命令复位级联芯片:rst chipid;输入要复位的芯片id号(该id设备中已经预先定义了的,假设级联芯片的id号为0),则输入命令rst 0复位级联芯片,触发级联倒换。
F7)查询故障模拟是否正常完成;
若正常完成,则进入步骤F8),若不正常则进入步骤F9)记录级联设备异常信息。
F8)触发主备用模块倒换;
故障模拟正常完成后自动触发主备用模块倒换。
F9)记录业务信息和/或级联设备信息;
记录故障模拟前后以及主备用模块倒换后业务异常信息和级联设备异常信息,业务异常信息主要是业务异常告警、业务监测仪器显示的发包速率、丢包个数,业务中断个数、误码个数等,级联设备异常信息主要是主备用模块是否倒换成功,设备异常告警、设备的中断等信息。
在模拟故障不成功、备用模块不正常时只记录级联设备信息,故障模拟成功后会同时记录级联设备信息和业务信息。
F10)循环次数加1,比较当前循环次数与最大次数;
若当前循环次数等于或大于最大循环次数,则进入步骤F11),若小于最大循环次数则返回步骤F4)。
F11)得出倒换测试性能指标。
根据记录结果计算倒换测试性能指标。
倒换测试性能包括:测试倒换成功率,业务中断时间,异常告警等。其中异常告警作为倒换测试性能指标的参考值,本领域技术人员可以依据经验判定其对倒换测试性能的参考价值。
倒换性能指标的计算,业务中断时间是测试程序在测试过程中自动统计业务的信息并计算,计算使用的各个参数,是多次测试记录的数据取平均值;倒换成功率指标,在多次测试后,统计倒换记录,记录的倒换成功次数除以总的倒换次数,得到倒换成功率。
其中业务中断时间的计算:分组业务根据发包速率(V)、丢包个数(N),计算业务中断时间(T),T=N/V。TDM(窄带)业务,测试仪器根据帧统计并上报一次业务中断个数(N1)和误码个数(N2),可以根据TDM测试仪器统计数据计算业务中断时间;其中E1帧结构的业务中断时间计算公式:T=N1/8K+N2/1984K,STM-1帧结构的业务中断时间计算公式:T=N1/8K+N2/149.76M。
请参阅图4是本发明提供的方法第四实施例。
该实施例中,增加从新设置级联设备业务的步骤;若在整个测试过程中出现业务中断现象或者设备中断现象,则需要从新设置级联设备业务,保证在下次测试开始前业务正常,设备正常运行。
本实施例中整个测试过程由运行在PC机上的测试程序完成。
测试程序在PC机上运行,使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果,并计算倒换测试性能指标。
该实施例包括步骤:
G1)配置业务;
配置级联设备跨框业务。
测试程序在PC机上运行,使用TCL(Tool Command Language)脚本设计,基于TCL脚本解释器运行。
PC机通过网口和串口分别来控制分组和TDM业务测试仪器,目前常用TDM业务测试仪器如网络测试仪器Aglient的37718,WG的ANT20和安立的MP1570,分组业务测试仪器如NetCom公司的网络测试仪器SmartBits等,都支持TCL控制;PC机通过待测级联设备主控框的OMC网口对机框设备进行操作维护管理,待测的级联设备,都是提供控制维护接口的,可以通过这个接口发送控制命令,查询设备的运行信息。测试程序通过查询设备状态以及控制监控仪器的发送接受业务数据流的状态来监控级联设备的工作状态,并记录监控结果。
G2)查询业务是否正常;
若业务正常进入步骤G3),若业务不正常则结束该流程;
此处查询业务主要是查询步骤G1)中配置的级联设备业务是否正常。
G3)清空测试仪器历史记录,设置测试循环最大次数;
设置测试循环次数最大值根据测试的需要设置最大次数,例如可以设置最大次数为100次或1000次。
G4)查询业务是否正常;
若正常进入步骤G5),若不正常进入步骤G9);
此处查询业务主要查询在主备用模块倒换结束后,进入下一个测试过程之前查询倒换后业务是否正常。
G5)查询备用模块是否正常;
若正常则进入步骤G6),若不正常则进入步骤G9);此处若查询备用模块不正常,则说明级联设备无法进行倒换测试,即可以认为倒换不成功,在记录级联设备信息的时候记录此信息。
G6)下发故障模拟命令到级联设备,模拟主用模块故障;
模拟主用模块故障主要通过模拟设备硬件故障来实现,测试程序通过OMC网口下发故障模拟控制命令控制实现。需要说明的是级联设备需要实现对设备内部的可控,是级联设备设计的可测性的基本需求。对于级联部分的测试,主要的实现方法有以下几种:
通过测试程序改写寄存器的配置,关断主用光模块。具体改写已经定义好的寄存器里光模块信号状态值(假设:0表示光口发光正常,1表示光口关断)来模拟故障,模拟故障时将寄存器信号状态值由原来的0改为1,关断主用模块的光模块,模拟主用模块故障。
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x01;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
该命令的定义如下:
dopra mem modify<start address><byte 1><byte 2>...<byte n>
<start address>:a HEX number with the prefix′0x′
<byte i>:the new data from<start address>,where:every byte must be a HEXwithout the prefix′0x′n<=255
也可以通过改写寄存器配置模拟主用时钟的故障。主用通过模拟主用时钟芯片故障来关断主用时钟输出,已经定义好的寄存器里的时钟信号状态值(假设:1表示时钟芯片输出正常,0表示时钟芯片无输出或输出不稳定)
测试程序改写寄存器的命令如下:
do mem modify 0x13000007 0x00;(该改写寄存器的命令针对不同的产品会有不同的命令模式,根据不同产品的内部命令修改测试程序语句,此为现有技术,在此不赘述。)
关闭主用模块单板电源的输出,即模拟单板硬件故障触发倒换,测试程序通过命令mnt xiadian sn,其中sn为槽位号,假设目前模拟故障的单板在1槽,可以通过mnt xiadian 1命令关断1槽单板的电源。
另外还可以通过复位级联芯片模拟主用模块故障,测试程序通过如下命令复位级联芯片:rst chipid;输入要复位的芯片id号(该id设备中已经预先定义,假设级联芯片的id号为0),输入命令rst 0复位级联芯片,触发级联倒换。
G7)查询故障模拟是否正常完成;
若正常完成,则进入步骤G8),若不正常则进入步骤G9)记录级联设备异常信息。
G8)触发主备用模块倒换;
故障模拟正常完成后自动触发主备用模块倒换。
G9)记录业务信息和/或级联设备信息;
记录故障模拟前后以及主备用模块倒换后业务异常信息和级联设备异常信息,业务异常信息主要是业务异常告警、业务监测仪器显示的发包速率、丢包个数,业务中断个数、误码个数等,级联设备异常信息主要是主备用模块是否倒换成功,设备异常告警、设备的中断等信息。
在模拟故障不成功、备用模块不正常时只记录级联设备信息,故障模拟成功后会同时记录级联设备信息和业务信息。
G10)循环次数加1,比较当前循环次数与最大次数;
若当前循环次数等于或大于最大循环次数,则进入步骤G12),若小于最大循环次数则进入步骤G11)。
G11)配置级联设备业务;
此步骤在业务或级联设备出现中断的情况下需要从新配置级联设备业务,保证下次测试前业务及级联设备的正常;配置级联设备业务后进入下一个测试,进入步骤G4);
G12)得出倒换测试性能指标。
根据记录结果计算倒换测试性能指标。
倒换测试性能包括:测试倒换成功率,业务中断时间,异常告警等。其中异常告警作为倒换测试性能指标的参考值,本领域技术人员可以依据经验判定其对倒换测试性能的参考价值。
倒换性能指标的计算,业务中断时间是测试程序在测试过程中自动统计业务的信息并计算,计算使用的各个参数,是多次测试记录的数据取平均值;倒换成功率指标,在多次测试后,统计倒换记录,记录的倒换成功次数除以总的倒换次数,得到倒换成功率。
其中业务中断时间的计算:分组业务根据发包速率(V)、丢包个数(N),计算业务中断时间(T),T=N/V。TDM(窄带)业务,测试仪器根据帧统计并上报一次业务中断个数(N1)和误码个数(N2),可以根据TDM测试仪器统计数据计算业务中断时间;其中E1帧结构的业务中断时间计算公式:T=N1/8K+N2/1984K,STM-1帧结构的业务中断时间计算公式:T=N1/8K+N2/149.76M。
请参阅图5是本发明提供的系统第一实施例。如图所示:包括
业务配置单元100,用于配置级联设备业务;
故障控制单元200,用于下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
记录单元300,用于记录倒换结果,记录故障模拟前后以及主备用模块倒换后业务信息和/或级联设备信息;
计算单元400,用于根据监控结果,得出倒换测试性能指标。
请参阅图6是本发明提供的系统第二实施例,如图所示,包括:
业务配置单元100,用于配置级联设备业务;
故障控制单元200,用于下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
记录单元300,用于记录倒换结果,记录故障模拟前后以及主备用模块倒换后业务信息和/或级联设备信息;
计算单元400,用于根据监控结果,得出倒换测试性能指标;
查询单元500,用于查询级联设备故障模拟前后业务信息或/和级联设备信息。
请参阅图7是本发明提供的系统第三实施例,如图所示,包括:
业务配置单元100,用于配置级联设备业务;
故障控制单元200,用于下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
记录单元300,用于记录倒换结果,记录故障模拟前后以及主备用模块倒换后业务信息和/或级联设备信息;
计算单元400,用于根据监控结果,得出倒换测试性能指标;
查询单元500,用于查询级联设备故障模拟前后业务信息或/和级联设备信息。
循环次数设置单元600,用于清空测试仪器历史记录,设置测试循环次数最大值,并累加循环次数,比较当前循环次数与最大循环次数,若当前循环次数大于或等于最大循环次数,则通知记录单元将记录结果反馈给计算单元。
以上对本发明所提供的一种级联设备可靠性测试的方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1、一种级联设备可靠性的测试方法,其特征在于,包括步骤:
1)配置级联设备业务;
2)下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
3)记录故障模拟前后以及主备用模块倒换后业务信息或/和级联设备信息;
4)根据记录结果得出倒换测试性能指标。
2、根据权利要求1所述的级联设备可靠性的测试方法,其特征在于,所述步骤1)之后所述步骤2)之前包括:
11)查询业务是否正常,若业务正常进入步骤12),若业务不正常则结束该流程;
12)清空测试仪器历史记录;
13)查询备用模块是否正常,若正常则进入步骤2),若不正常则进入步骤3)。
3、根据权利要求2所述的级联设备可靠性的测试方法,其特征在于,所述步骤12)还包括:设置测试循环最大次数;
所述步骤12)之后进一步:
121)查询业务是否正常,若正常进入步骤13),若不正常进入步骤3);
所述步骤3)之后包括:
31)循环次数加1,若当前循环次数等于或大于最大循环次数,则进入步骤4),若小于最大循环次数则返回步骤121)。
4、根据权利要求3所述的级联设备可靠性的测试方法,其特征在于,所述步骤2)模拟主用模块故障之后进一步:
21)查询故障模拟是否正常完成,若正常完成,则自动触发主备用模块倒换并执行步骤3),若不正常则进入步骤3)。
5、根据权利要求4所述的级联设备可靠性的测试方法,其特征在于,所述步骤31)之后进一步:
32)配置级联设备业务,进入步骤121)。
6、根据权利要求1或2、3、4、5所述的级联设备可靠性的测试方法,其特征在于,所述模拟主用模块故障方法为:下发故障模拟命令改写寄存器关断发送光模块或关断时钟输出,或下发故障模拟命令关断单板电源输出或复位级联芯片。
7、根据权利要求6所述的级联设备可靠性的测试方法,其特征在于,所述步骤4)中倒换测试性能指标为:倒换成功率或/和业务中断时间。
8、根据权利要求7所述的级联设备可靠性的测试方法,其特征在于,倒换成功次数与总的倒换次数的商得到倒换成功率。
9、根据权利要求8所述的级联设备可靠性的测试方法,其特征在于,分组业务通过计算丢包个数与发包速率的商得到业务中断时间,窄带业务中:E1帧结构通过计算业务中断个数与8000的商加误码个数与1984000的商得到业务中断时间,STM-1帧结构通过业务中断个数与8000的商加误码个数与149760000的商得到业务中断时间。
10、根据权利要求9所述的级联设备可靠性的测试方法,其特征在于,所述测试程序使用TCL脚本设计,基于TCL脚本解释器运行。
11、一种级联设备可靠性测试的系统,其特征在于,包括:
业务配置单元,用于配置级联设备业务;
故障控制单元,用于下发故障模拟命令到级联设备,模拟主用模块故障,触发主备用模块倒换;
记录单元,用于记录倒换结果,记录故障模拟前后以及主备用模块倒换后业务信息和/或级联设备信息;
计算单元,用于根据监控结果,得出倒换测试性能指标。
12、根据权利要求11所述的级联设备可靠性测试的系统,其特征在于,所述系统还包括:
查询单元,用于查询级联设备故障模拟前后业务信息或/和级联设备信息。
13、根据权利要求11所述的级联设备可靠性测试的系统,其特征在于,所述系统还包括:
循环次数设置单元,用于清空测试仪器历史记录,设置测试循环次数最大值,并累加循环次数,比较当前循环次数与最大循环次数,若当前循环次数大于或等于最大循环次数,则通知记录单元将记录结果反馈给计算单元。
CNB2006100903901A 2006-07-05 2006-07-05 一种级联设备可靠性测试的方法及系统 Expired - Fee Related CN100396030C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100903901A CN100396030C (zh) 2006-07-05 2006-07-05 一种级联设备可靠性测试的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100903901A CN100396030C (zh) 2006-07-05 2006-07-05 一种级联设备可靠性测试的方法及系统

Publications (2)

Publication Number Publication Date
CN1878098A true CN1878098A (zh) 2006-12-13
CN100396030C CN100396030C (zh) 2008-06-18

Family

ID=37510404

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100903901A Expired - Fee Related CN100396030C (zh) 2006-07-05 2006-07-05 一种级联设备可靠性测试的方法及系统

Country Status (1)

Country Link
CN (1) CN100396030C (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103001831A (zh) * 2012-12-19 2013-03-27 迈普通信技术股份有限公司 一种测试多激活检测性能的系统及方法
CN103036737A (zh) * 2012-12-07 2013-04-10 无锡美森微电子科技有限公司 一种大规模微系统芯片的片上多节点系统的自测试方法
CN106452968A (zh) * 2016-10-24 2017-02-22 郑州云海信息技术有限公司 一种pcie设备可靠性的加速检测方法
CN107294594A (zh) * 2017-07-03 2017-10-24 博为科技有限公司 一种无源光网络设备、切换方法及系统
CN108134689A (zh) * 2017-12-11 2018-06-08 杭州迪普科技股份有限公司 一种框式设备内部级联口故障检查方法及装置
CN108763039A (zh) * 2018-04-02 2018-11-06 阿里巴巴集团控股有限公司 一种业务故障模拟方法、装置及设备
CN111638967A (zh) * 2020-06-01 2020-09-08 杭州鸿雁电器有限公司 场景的处理方法、装置、存储介质和处理器

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346527A (zh) * 2014-10-13 2015-02-11 中国船舶重工集团公司第七二六研究所 一种装备系统测试性评价计算方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4875209A (en) * 1988-04-04 1989-10-17 Raytheon Company Transient and intermittent fault insertion
US6779128B1 (en) * 2000-02-18 2004-08-17 Invensys Systems, Inc. Fault-tolerant data transfer
JP4299641B2 (ja) * 2003-11-17 2009-07-22 株式会社日立コミュニケーションテクノロジー 無線基地局試験方法及び試験装置
CN100388692C (zh) * 2004-06-22 2008-05-14 中兴通讯股份有限公司 网络交换设备多网口切换装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103036737A (zh) * 2012-12-07 2013-04-10 无锡美森微电子科技有限公司 一种大规模微系统芯片的片上多节点系统的自测试方法
CN103036737B (zh) * 2012-12-07 2015-08-12 无锡美森微电子科技有限公司 一种大规模微系统芯片的片上多节点系统的自测试方法
CN103001831A (zh) * 2012-12-19 2013-03-27 迈普通信技术股份有限公司 一种测试多激活检测性能的系统及方法
CN106452968A (zh) * 2016-10-24 2017-02-22 郑州云海信息技术有限公司 一种pcie设备可靠性的加速检测方法
CN107294594A (zh) * 2017-07-03 2017-10-24 博为科技有限公司 一种无源光网络设备、切换方法及系统
CN107294594B (zh) * 2017-07-03 2023-11-14 博为科技有限公司 一种无源光网络设备、切换方法及系统
CN108134689A (zh) * 2017-12-11 2018-06-08 杭州迪普科技股份有限公司 一种框式设备内部级联口故障检查方法及装置
CN108134689B (zh) * 2017-12-11 2021-07-23 杭州迪普科技股份有限公司 一种框式设备内部级联口故障检查方法及装置
CN108763039A (zh) * 2018-04-02 2018-11-06 阿里巴巴集团控股有限公司 一种业务故障模拟方法、装置及设备
CN111638967A (zh) * 2020-06-01 2020-09-08 杭州鸿雁电器有限公司 场景的处理方法、装置、存储介质和处理器

Also Published As

Publication number Publication date
CN100396030C (zh) 2008-06-18

Similar Documents

Publication Publication Date Title
CN1878098A (zh) 一种级联设备可靠性测试的方法及系统
CN1252618C (zh) 故障预测系统和方法及设备、打印机和管理服务器
CN1103131C (zh) 电力系统保护控制装置、监控系统及存储程序的存储媒体
CN1199235C (zh) 半导体装置制造中瑕疵聚集的检索方法及装置
CN1264307C (zh) 代理、图像形成装置管理系统、图像形成装置管理方法
CN1601483A (zh) 一种基于脚本解释工具的自动化软件测试系统
CN1702635A (zh) 高速接口电路检查模块、高速接口电路检查对象模块和高速接口电路检查方法
CN1885273A (zh) 一种逻辑测试的功能覆盖率分析方法
CN1080105A (zh) 一种分布控制方法及实现自动保护转换的机械装置
CN1906909A (zh) 数据接收装置
CN101056208A (zh) 业务跟踪方法、网络设备、o&amp;m控制器、业务请求装置
CN1761243A (zh) 传输设备和方法、记录介质、程序和控制设备
CN1770708A (zh) 信息处理系统和方法、电子装置和计算机可读程序
CN1662089A (zh) 一种移动通信系统中对运行或测试数据进行处理和分析的方法和装置
CN1732388A (zh) 半导体试验装置
CN1523814A (zh) 管理网络设备的装置及其方法
CN1924746A (zh) 微型燃汽轮机的数据采集监视控制装置及方法
CN1215619C (zh) 激光振荡器
CN1858754A (zh) 一种电路模块的查找方法及装置
CN1194295C (zh) 程序变换装置及程序变换方法
CN1637756A (zh) 批量生产移交支持系统及半导体制造系统
CN1690956A (zh) 程序制定装置以及程序制定方法
CN1401174A (zh) 光多路通信系统
CN101047573A (zh) 通信设备故障检测系统及通信设备故障检测方法
CN1303789C (zh) 数字传送网上不同的数据帧接入和传送的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080618

Termination date: 20150705

EXPY Termination of patent right or utility model