CN106452968A - 一种pcie设备可靠性的加速检测方法 - Google Patents
一种pcie设备可靠性的加速检测方法 Download PDFInfo
- Publication number
- CN106452968A CN106452968A CN201610946650.4A CN201610946650A CN106452968A CN 106452968 A CN106452968 A CN 106452968A CN 201610946650 A CN201610946650 A CN 201610946650A CN 106452968 A CN106452968 A CN 106452968A
- Authority
- CN
- China
- Prior art keywords
- pcie
- reliability
- measured
- pcie device
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4004—Coupling between buses
- G06F13/4022—Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
Abstract
本发明公开了一种PCIE设备可靠性的加速检测方法,所述方法通过建立PCIE可靠性测试控制单元,实现PCIE设备数据的发送与设备状态控制,待测PCIE设备直连安装于该PCIE可靠性测试控制单元上,所述PCIE可靠性测试控制单元的PCIE数据总线直接连接至待测PCIE设备上,同时所述PCIE可靠性测试控制单元直接控制待测PCIE设备的复位reset信号,实现硬复位控制权限,通过采用多组高强度、高频次的集中式快速强化功能单项测试,将PCIE设备的潜在隐患快速抓取出来。本发明方法可以很方便的实现PCIE设备可靠性的加速检测,不仅达到了可靠性要求,而且实现高性能要求,实现服务器系统的可靠性、稳定性。
Description
技术领域
本发明涉及计算机通信技术领域,具体涉及一种PCIE设备可靠性的加速检测方法,来解决当前PCIE设备可靠性检测中的测试覆盖度不足及测试资源投入大的问题,为了保证服务器系统的快速稳定运行,在实际服务器系统PCIE设备可靠性检测运行过程中,实现可靠性的加速检测尤为重要,并成为决定服务器可靠性优势的关键要素之一。
背景技术
服务器系统中以PCIE协议进行数据交换的设备越来越多,各种数据借助PCIE总线的使用,不断在服务器之间交换。PCIE设备质量可靠性越来越重要,成为服务器系统中关键的传输路径。为了保证当前的服务器系统PCIE设备稳定工作,服务器系统上线使用前,需要经过可靠的设备工作检测,以保证PCIE设备在长期的工作环境中稳定工作。
当前,针对PCIE设备可靠性的检测,均采用开关机重启、系统加压方式,使卡工作在高负载条件下,通过加长测试时间、加大测试样本来使稳定性问题尽可能在服务器出厂呈现出来,当前PCIE设备可靠性的检测方法存在较大的弊端:一是测试方法单一且测试周期长,对于低概率的稳定性问题无法及时复现出来,测试关注焦点仅停留在压力条件下系统的稳定性,对于可能存在稳定性隐患的系统状态切换过程,有效测试力度不足;二是测试资源投入大,需要投入数十台服务器系统进行同步测试。针对当前PCIE设备可靠性检测中的测试覆盖度不足及测试资源投入大的问题,为了保证服务器系统的快速稳定运行,在实际服务器系统PCIE设备可靠性检测运行过程中,实现可靠性的加速检测尤为重要,并成为决定服务器可靠性优势的关键要素之一。
发明内容
本发明要解决的技术问题是:本发明针对服务器PCIE设备可靠性检测过程中遇到的上述问题,结合PCIE链路信号等关键电气因素,提供一种PCIE设备可靠性的加速检测方法。
本发明所采用的技术方案为:
一种PCIE设备可靠性的加速检测方法,所述方法通过建立PCIE可靠性测试控制单元,实现PCIE设备数据的发送与设备状态控制,待测PCIE设备直连安装于该PCIE可靠性测试控制单元上,所述PCIE可靠性测试控制单元的PCIE数据总线直接连接至待测PCIE设备上,同时所述PCIE可靠性测试控制单元直接控制待测PCIE设备的复位reset信号,实现硬复位控制权限,通过采用多组高强度、高频次的集中式快速强化功能单项测试,将PCIE设备的潜在隐患快速抓取出来。
所述方法通过PCIE可靠性测试控制单元,引导PCIE设备完成初始化阶段,监测PCIE链路传输状态,并向PCIE设备发送数据处理包;所述数据处理包为指令响应包,通过要求PCIE设备将指令中的数据进行运算后,反馈给PCIE可靠性测试控制单元,确认待测PCIE设备响应正常。
所述方法通过PCIE可靠性测试控制单元,启动链路速率快速切换模式,通过向待测PCIE设备发送速率切换指令,使PCIE链路在GEN1、GEN2、GEN3之间依次反复切换,总共切换次数为10000次;在向待测PCIE设备发送速率切换指令的同时,对待测PCIE设备的PCIE速率进行读取,若读取当前的待测PCIE设备的PCIE速率与期望值不同,则停止测试,此时待测PCIE设备即呈现出链路速率切换问题。
所述方法通过PCIE可靠性测试控制单元向待测PCIE设备发出复位reset信号,实现硬复位控制,同时PCIE可靠性测试控制单元实时监测待测PCIE设备的复位完成情况,当待测PCIE设备完成复位后,PCIE可靠性测试控制单元再次向待测PCIE设备发出复位reset信号,依次往复,总共测试次数为1000次,若读取当前的待测PCIE设备无法正常复位,则停止测试,此时待测PCIE设备即呈现出复位初始化问题。
所述方法通过PCIE可靠性测试控制单元向PCIE设备发出链路状态切换指令,即将PCIE 链路的power状态在link0、link1(空闲与繁忙)之间切换,同时PCIE可靠性测试控制单元实时监测PCIE 链路的power状态情况,总共切换次数为1000次,若读取当前的PCIE 链路power状态无法正常切换,则停止测试,此时待测PCIE设备即呈现出PCIE 链路power状态问题。
本发明的有益效果为:
本发明方法可以很方便的实现PCIE设备可靠性的加速检测,不仅达到了可靠性要求,而且实现高性能要求,实现服务器系统的可靠性、稳定性。
附图说明
图1为本发明方法实施流程示意图。
具体实施方式
下面根据说明书附图,结合具体实施方式对本发明进一步说明:
1、建立PCIE可靠性测试控制单元,采用基于FPGA芯片实现,带宽设置为X16,待测PCIE设备直连安装于该测试控制单元的PCIE标准槽位上;
2、通过PCIE可靠性测试控制单元,引导待测PCIE设备完成初始化阶段,监测PCIE链路传输状态,并向待测PCIE设备发送数据处理包,确认待测PCIE设备响应正常;
3、通过PCIE可靠性测试控制单元,启动链路速率快速切换模式,通过向待测PCIE设备发送速率切换指令,使PCIE链路在GEN1、GEN2、GEN3之间依次反复切换;
4、通过PCIE可靠性测试控制单元向待测PCIE设备发出复位reset信号,即将reset信号主动设置为低电平,使待测PCIE设备进入复位状态,实现硬复位控制;
5、通过PCIE可靠性测试控制单元向待测PCIE设备发出链路状态切换指令,即将PCIE链路的power状态在link0、link1(空闲与繁忙)之间切换。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (5)
1.一种PCIE设备可靠性的加速检测方法,其特征在于,所述方法通过建立PCIE可靠性测试控制单元,实现PCIE设备数据的发送与设备状态控制,待测PCIE设备直连安装于该PCIE可靠性测试控制单元上,所述PCIE可靠性测试控制单元的PCIE数据总线直接连接至待测PCIE设备上,同时所述PCIE可靠性测试控制单元直接控制待测PCIE设备的复位reset信号,实现硬复位控制权限,通过采用多组高强度、高频次的集中式快速强化功能单项测试,将PCIE设备的潜在隐患快速抓取出来。
2.根据权利要求1所述的一种PCIE设备可靠性的加速检测方法,其特征在于,
所述方法通过PCIE可靠性测试控制单元,引导PCIE设备完成初始化阶段,监测PCIE链路传输状态,并向PCIE设备发送数据处理包;所述数据处理包为指令响应包,通过要求PCIE设备将指令中的数据进行运算后,反馈给PCIE可靠性测试控制单元,确认待测PCIE设备响应正常。
3.根据权利要求1或2所述的一种PCIE设备可靠性的加速检测方法,其特征在于,所述方法通过PCIE可靠性测试控制单元,启动链路速率快速切换模式,通过向待测PCIE设备发送速率切换指令,使PCIE链路在GEN1、GEN2、GEN3之间依次反复切换,在向待测PCIE设备发送速率切换指令的同时,对待测PCIE设备的PCIE速率进行读取,若读取当前的待测PCIE设备的PCIE速率与期望值不同,则停止测试,此时待测PCIE设备即呈现出链路速率切换问题。
4.根据权利要求1或2所述的一种PCIE设备可靠性的加速检测方法,其特征在于,所述方法通过PCIE可靠性测试控制单元向待测PCIE设备发出复位reset信号,实现硬复位控制,同时PCIE可靠性测试控制单元实时监测待测PCIE设备的复位完成情况,当待测PCIE设备完成复位后,PCIE可靠性测试控制单元再次向待测PCIE设备发出复位reset信号,依次往复,若读取当前的待测PCIE设备无法正常复位,则停止测试,此时待测PCIE设备即呈现出复位初始化问题。
5.根据权利要求1或2所述的一种PCIE设备可靠性的加速检测方法,其特征在于,所述方法通过PCIE可靠性测试控制单元向PCIE设备发出链路状态切换指令,即将PCIE 链路的power状态在link0、link1之间切换,同时PCIE可靠性测试控制单元实时监测PCIE 链路的power状态情况,若读取当前的PCIE 链路power状态无法正常切换,则停止测试,此时待测PCIE设备即呈现出PCIE 链路power状态问题。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610946650.4A CN106452968A (zh) | 2016-10-24 | 2016-10-24 | 一种pcie设备可靠性的加速检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610946650.4A CN106452968A (zh) | 2016-10-24 | 2016-10-24 | 一种pcie设备可靠性的加速检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106452968A true CN106452968A (zh) | 2017-02-22 |
Family
ID=58178413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610946650.4A Pending CN106452968A (zh) | 2016-10-24 | 2016-10-24 | 一种pcie设备可靠性的加速检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106452968A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107807867A (zh) * | 2017-09-29 | 2018-03-16 | 曙光信息产业(北京)有限公司 | 测试通信链路稳定性的方法及装置 |
CN110932930A (zh) * | 2019-11-13 | 2020-03-27 | 苏州浪潮智能科技有限公司 | 一种服务器pcie链路稳定性的检测方法、装置及介质 |
CN114817107A (zh) * | 2022-06-28 | 2022-07-29 | 深圳云豹智能有限公司 | Pcie设备切换系统、方法、装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1878098A (zh) * | 2006-07-05 | 2006-12-13 | 华为技术有限公司 | 一种级联设备可靠性测试的方法及系统 |
CN102541723A (zh) * | 2010-12-08 | 2012-07-04 | 上海杉达学院 | 用于软件测试的自动化测试装置 |
CN102739472A (zh) * | 2012-06-29 | 2012-10-17 | 浪潮电子信息产业股份有限公司 | 一种服务器高频数据传输的稳定性测试方法 |
CN102968362A (zh) * | 2012-11-21 | 2013-03-13 | 浪潮电子信息产业股份有限公司 | 一种系统开机过程中检测pcie设备完整性的方法 |
US20150312347A1 (en) * | 2012-01-30 | 2015-10-29 | Doosan Infracore Co., Ltd. | Method of communication between contruction equipment and management server |
-
2016
- 2016-10-24 CN CN201610946650.4A patent/CN106452968A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1878098A (zh) * | 2006-07-05 | 2006-12-13 | 华为技术有限公司 | 一种级联设备可靠性测试的方法及系统 |
CN102541723A (zh) * | 2010-12-08 | 2012-07-04 | 上海杉达学院 | 用于软件测试的自动化测试装置 |
US20150312347A1 (en) * | 2012-01-30 | 2015-10-29 | Doosan Infracore Co., Ltd. | Method of communication between contruction equipment and management server |
CN102739472A (zh) * | 2012-06-29 | 2012-10-17 | 浪潮电子信息产业股份有限公司 | 一种服务器高频数据传输的稳定性测试方法 |
CN102968362A (zh) * | 2012-11-21 | 2013-03-13 | 浪潮电子信息产业股份有限公司 | 一种系统开机过程中检测pcie设备完整性的方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107807867A (zh) * | 2017-09-29 | 2018-03-16 | 曙光信息产业(北京)有限公司 | 测试通信链路稳定性的方法及装置 |
CN107807867B (zh) * | 2017-09-29 | 2020-09-25 | 曙光信息产业(北京)有限公司 | 测试通信链路稳定性的方法及装置 |
CN110932930A (zh) * | 2019-11-13 | 2020-03-27 | 苏州浪潮智能科技有限公司 | 一种服务器pcie链路稳定性的检测方法、装置及介质 |
CN110932930B (zh) * | 2019-11-13 | 2021-08-10 | 苏州浪潮智能科技有限公司 | 一种服务器pcie链路稳定性的检测方法、装置及介质 |
CN114817107A (zh) * | 2022-06-28 | 2022-07-29 | 深圳云豹智能有限公司 | Pcie设备切换系统、方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106452968A (zh) | 一种pcie设备可靠性的加速检测方法 | |
CN102566564B (zh) | 一种车载控制器测试系统 | |
US20120136614A1 (en) | Wafer inspection system | |
CN104767657A (zh) | 光猫注册及测试系统和方法 | |
CN105071995A (zh) | 一种基于带外网络的网络设备巡检方法、装置及系统 | |
CN104954081A (zh) | 一种电子设备的测试系统及其测试方法 | |
CN106201755A (zh) | 网络设备的复位方法及装置 | |
CN102074273B (zh) | 存储器稳态总剂量效应试验测试方法 | |
CN107145426A (zh) | 一种bmc 测试me状态异常的方法 | |
CN102420462B (zh) | 一种智能变电站过程层智能终端设备 | |
CN103018659A (zh) | 一种处理器单粒子效应的频率响应的测试系统及方法 | |
CN116684343A (zh) | 一种交换机自动测试方法、装置、系统、设备及介质 | |
CN106019021B (zh) | 电子设备测试装置的通用测试工装及其测试方法 | |
CN106814728A (zh) | 一种基于产品供电接口时序逻辑的设备检测装置 | |
CN108538132A (zh) | 一种物联网嵌入式单片机远程综合实验实训平台 | |
CN115599438A (zh) | 应用程序的发布包的构建方法、装置、设备及介质 | |
CN104062530A (zh) | 一种移动终端硬件故障检测装置及方法 | |
CN109726055A (zh) | 检测PCIe芯片异常的方法及计算机设备 | |
JP6871980B2 (ja) | 非集中化環境においてデバイスを制御する方法、非集中化ストレージシステム、非集中化ストレージネットワーク | |
CN111106981B (zh) | 一种pcie通道的检修方法及装置 | |
CN107544465A (zh) | 一种对控制装置远程调试的系统及方法 | |
CN111665054A (zh) | 一种便携式发动机数字调节器检测装置 | |
CN113704152A (zh) | PCIe插槽接口转接设备、测试设备、系统和方法 | |
CN104201772A (zh) | 500kV变电站集中监控系统104规约通道巡检方法 | |
CN101072089B (zh) | 一种对传输交叉类单板进行测试的装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |
|
RJ01 | Rejection of invention patent application after publication |