CN108733522A - 一种在机械测试中监测pcie卡在位的方法及系统 - Google Patents

一种在机械测试中监测pcie卡在位的方法及系统 Download PDF

Info

Publication number
CN108733522A
CN108733522A CN201810496267.2A CN201810496267A CN108733522A CN 108733522 A CN108733522 A CN 108733522A CN 201810496267 A CN201810496267 A CN 201810496267A CN 108733522 A CN108733522 A CN 108733522A
Authority
CN
China
Prior art keywords
pcie
test
pcie device
monitoring
place
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810496267.2A
Other languages
English (en)
Inventor
郑明�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810496267.2A priority Critical patent/CN108733522A/zh
Publication of CN108733522A publication Critical patent/CN108733522A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2247Verification or detection of system hardware configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test input/output devices or peripheral units

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明提供一种在机械测试中监测PCIE卡在位的方法及系统,方法包括如下步骤:1.创建测试环境;2.启动测试;3.获取初始PCIE卡连接PCIE设备种类及数量,并存储;4.机械测试开始,实时检测所有PCIE卡连接的PCIE设备;5.当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,存储丢失的PCIE设备信息,进行报警,停止机械测试。系统包括:测试环境创建模块,测试启动模块,初始PCIE设备信息获取模块,初始PCIE设备信息存储模块,PCIE设备信息实时监测模块,报警模块,丢失PCIE设备信息存储模块以及测试停止模块。

Description

一种在机械测试中监测PCIE卡在位的方法及系统
技术领域
本发明属于服务器测试领域,具体涉及一种在机械测试中监测PCIE卡在位的方法及系统。
背景技术
机械可靠性测试,包括HALT、振动、冲击、碰撞、压力以及跌落等测试。
在服务器研发阶段,机械可靠性测试是必不可少的一个环节,在开机振动测试和碰撞测试时,由于时间长,次数多,人力往往不能及时发现PCIE扩展卡及相关网卡的脱落或者离开卡槽,这样往往会对主板造成不可逆的破坏,同时对实验结果造成重大影响。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种在机械测试中监测PCIE卡在位的方法及系统,是非常有必要的。
发明内容
本发明的目的在于,针对上述机械测试中PCIE卡脱落不能及时发现对主板造成损坏的缺陷,提供一种在机械测试中监测PCIE卡在位的方法及系统,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种在机械测试中监测PCIE卡在位的方法,包括如下步骤:
步骤1.创建测试环境;
步骤2.启动测试;
步骤3.获取初始PCIE卡连接的PCIE设备种类及数量,并存储;
步骤4.机械测试开始,实时检测所有PCIE卡连接的PCIE设备;
步骤5.当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,存储丢失的PCIE设备信息,进行报警,停止机械测试。从而使得实验者能及时获知测试问题,检查样机,防止造成更大的样机损坏,记录丢失的PCIE卡连接的设备数据,用于研发阶段技术的改善和更新。
进一步地,步骤1中创建测试环境的具体步骤包括:
步骤11.插接好PCIE卡连接的PCIE设备;
步骤12.安装操作系统;操作系统采用linux系统;
步骤13.将测试脚本导入系统;测试脚本使用shell脚本。使用shell脚本作为软件测试脚本,测试速度快。
进一步地,步骤2中,通过执行测试脚本启动测试。执行软件测试脚本,为实施监控PCIE卡做好准备。
进一步地,步骤3中,通过测试脚本获取初始PCIE卡连接PCIE设备种类及数量。通过软件测试脚本获取PCIE卡初始的状态。
进一步地,步骤4中,通过测试脚本实时检测所有PCIE卡连接的PCIE设备。通过软件测试脚本获取PCIE卡实时的状态。
进一步地,步骤5中,当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,还存储PCIE设备丢失的时间及测试环境信息。存储PCIE设备丢失的时间及测试环境信息为后续研发修改提供详细的环境资料。
进一步地,步骤5中,当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,存储并打印输出丢失的PCIE设备信息,触发蜂鸣器进行报警。及时报警,可防止PCIE卡脱落对主板造成不可逆的损坏。
本发明还给出如下技术方案:
一种在机械测试中监测PCIE卡在位的系统,包括:
测试环境创建模块,用于创建测试环境;
测试启动模块,用于启动测试;
初始PCIE设备信息获取模块,用于获取初始PCIE卡连接PCIE设备种类及数量;
初始PCIE设备信息存储模块,用于存储初始PCIE卡连接PCIE设备种类及数量;
PCIE设备信息实时监测模块,用于机械测试开始后,实时检测所有PCIE卡连接的PCIE设备;
报警模块,用于当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,判定有PCIE设备丢失,进行报警;
丢失PCIE设备信息存储模块,用于当判定PCIE设备丢失时,存储丢失的PCIE设备信息;
测试停止模块,用于停止机械测试。
进一步地,测试环境创建模块,包括
PCIE设备插接单元:用于插接好PCIE卡连接的PCIE设备;
操作系统安装单元:用于安装操作系统;
测试脚本导入单元:用于将测试脚本导入操作系统。
进一步地,还包括:
PCIE设备丢失时间存储模块,用于当判定PCIE设备丢失时,存储PCIE设备丢失时间及测试环境;
PCIE设备丢失信息打印模块,用于当判定PCIE设备丢失时,打印输出丢失的PCIE设备信息。
本发明的有益效果在于:
本发明基于Linux操作系统,使用shell脚本,快速自动识别PCIE卡连接的PCIE设备信息,在可靠性机械测试过程中出现PCIE卡连接设备数量异常及信息异常时,自动报警,以更加及时的反馈信息,确保实验的准确性;同时能合理的保证物料的最大完好性,从而节约了大量的研发费用,在测试过程中不需要人力实时监控服务器运行,大大节省了人力成本,时间成本,易于操作,对测试人员要求较低。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
图1为本发明的方法流程图;
图2为本发明的系统示意图;
其中,1-测试环境创建模块;2-测试启动模块;3-初始PCIE设备信息获取模块;4-初始PCIE设备信息存储模块;5-PCIE设备信息实时监测模块;6-报警模块;7-丢失PCIE设备信息存储模块;8-测试停止模块;9-PCIE设备丢失时间存储模块;10-PCIE设备丢失信息打印模块。
具体实施方式:
为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明具体实施例中的附图,对本发明中的技术方案进行清楚、完整地描述。
实施例1:
如图1所示,本发明提供一种在机械测试中监测PCIE卡在位的方法,包括如下步骤:
步骤1.创建测试环境;具体包括:
步骤11.插接好PCIE卡连接的PCIE设备;
步骤12.安装操作系统;操作系统采用linux系统;
步骤13.将测试脚本导入系统;测试脚本使用shell脚本;
步骤2.通过执行测试脚本启动测试;
步骤3.通过测试脚本获取初始PCIE卡连接的PCIE设备种类及数量,并存储;
步骤4.机械测试开始,通过测试脚本实时检测所有PCIE卡连接的PCIE设备;
步骤5.当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,存储并打印输出丢失的PCIE设备信息,存储PCIE设备丢失的时间及测试环境信息,触发蜂鸣器进行报警,停止机械测试。从而使得实验者能及时获知测试问题,检查样机,防止造成更大的样机损坏,记录丢失的PCIE卡连接的设备数据,用于研发阶段技术的改善和更新;记录PCIE设备丢失的时间及测试环境信息为后续研发修改提供详细的环境资料。
上述实施例,步骤3中用于获取初始PCIE卡连接的PCIE设备种类及数量的测试脚本如下:
#!/bin/bash
lspci|grep-i eth>>/home/lspci.txt
lscpi|grep-i qlogic>>/home/lspci.txt
lscpi|grep-i emulex>>/home/lspci.txt
lspci|grep-i Adaptec>>/home/lspci.txt
lspci|grep-i LSI>>/home/lspci.txt
上述实施例,步骤4中实时检测所有PCIE卡连接的PCIE设备的测试脚本如下:
上述实施例,步骤5中当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,打印输出信息,触发蜂鸣器进行报警的测试脚本如下:
实施例2:
如图2所示,本发明提供一种在机械测试中监测PCIE卡在位的系统,包括:
测试环境创建模块1,用于创建测试环境;
测试环境创建模块1,包括
PCIE设备插接单元:用于插接好PCIE卡连接的PCIE设备;
操作系统安装单元:用于安装操作系统;
测试脚本导入单元:用于将测试脚本导入操作系统;
测试启动模块2,用于启动测试;
初始PCIE设备信息获取模块3,用于获取初始PCIE卡连接PCIE设备种类及数量;
初始PCIE设备信息存储模块4,用于存储初始PCIE卡连接PCIE设备种类及数量;
PCIE设备信息实时监测模块5,用于机械测试开始后,实时检测所有PCIE卡连接的PCIE设备;
报警模块6,用于当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,判定有PCIE设备丢失,进行报警;
丢失PCIE设备信息存储模块7,用于当判定PCIE设备丢失时,存储丢失的PCIE设备信息;
PCIE设备丢失时间存储模块9,用于当判定PCIE设备丢失时,存储PCIE设备丢失时间及测试环境;
测试停止模块8,用于停止机械测试;
PCIE设备丢失信息打印模块10,用于当判定PCIE设备丢失时,打印输出丢失的PCIE设备信息。
本专利对PCIE卡的监测可扩展到网卡,应用本专利技术对网卡的实时监测也在本专利的保护范围之内。
本发明的实施例是说明性的,而非限定性的,上述实施例只是帮助理解本发明,因此本发明不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他的具体实施方式,同样属于本发明保护的范围。

Claims (10)

1.一种在机械测试中监测PCIE卡在位的方法,其特征在于,包括如下步骤:
步骤1.创建测试环境;
步骤2.启动测试;
步骤3.获取初始PCIE卡连接PCIE设备种类及数量,并存储;
步骤4.机械测试开始,实时检测所有PCIE卡连接的PCIE设备;
步骤5.当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,存储丢失的PCIE设备信息,进行报警,停止机械测试。
2.如权利要求1所述的一种在机械测试中监测PCIE卡在位的方法,其特征在于,步骤1中创建测试环境的具体步骤包括:
步骤11.插接好PCIE卡连接的PCIE设备;
步骤12.安装操作系统;
步骤13.将测试脚本导入系统。
3.如权利要求2所述的一种在机械测试中监测PCIE卡在位的方法,其特征在于,步骤2中,通过执行测试脚本启动测试。
4.如权利要求2所述的一种在机械测试中监测PCIE卡在位的方法,其特征在于,步骤3中,通过测试脚本获取初始PCIE卡连接的PCIE设备种类及数量。
5.如权利要求2所述的一种在机械测试中监测PCIE卡在位的方法,其特征在于,步骤4中,通过测试脚本实时检测所有PCIE卡连接的PCIE设备。
6.如权利要求1所述的一种在机械测试中监测PCIE卡在位的方法,其特征在于,步骤5中,当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,还存储PCIE设备丢失的时间及测试环境信息。
7.如权利要求1所述的一种在机械测试汇总监测PCIE卡在位的方法,其特征在于,步骤5中,当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,则判定有PCIE设备丢失,存储并打印输出丢失的PCIE设备信息,触发蜂鸣器进行报警。
8.一种在机械测试中监测PCIE卡在位的系统,其特征在于,包括:
测试环境创建模块,用于创建测试环境;
测试启动模块,用于启动测试;
初始PCIE设备信息获取模块,用于获取初始PCIE卡连接PCIE设备种类及数量;
初始PCIE设备信息存储模块,用于存储初始PCIE卡连接PCIE设备种类及数量;
PCIE设备信息实时监测模块,用于机械测试开始后,实时检测所有PCIE卡连接的PCIE设备;
报警模块,用于当实时检测到PCIE卡连接的PCIE设备数量与初始值不同时,判定有PCIE设备丢失,进行报警;
丢失PCIE设备信息存储模块,用于当判定PCIE设备丢失时,存储丢失的PCIE设备信息;
测试停止模块,用于停止机械测试。
9.如权利要求8所述的一种在机械测试中监测PCIE卡在位的系统,其特征在于,测试环境创建模块,包括
PCIE设备插接单元:用于插接好PCIE卡连接的PCIE设备;
操作系统安装单元:用于安装操作系统;
测试脚本导入单元:用于将测试脚本导入操作系统。
10.如权利要求8所述的一种在机械测试中监测PCIE卡在位的系统,其特征在于,还包括:
PCIE设备丢失时间存储模块,用于当判定PCIE设备丢失时,存储PCIE设备丢失时间及测试环境;
PCIE设备丢失信息打印模块,用于当判定PCIE设备丢失时,打印输出丢失的PCIE设备信息。
CN201810496267.2A 2018-05-22 2018-05-22 一种在机械测试中监测pcie卡在位的方法及系统 Pending CN108733522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810496267.2A CN108733522A (zh) 2018-05-22 2018-05-22 一种在机械测试中监测pcie卡在位的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810496267.2A CN108733522A (zh) 2018-05-22 2018-05-22 一种在机械测试中监测pcie卡在位的方法及系统

Publications (1)

Publication Number Publication Date
CN108733522A true CN108733522A (zh) 2018-11-02

Family

ID=63937818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810496267.2A Pending CN108733522A (zh) 2018-05-22 2018-05-22 一种在机械测试中监测pcie卡在位的方法及系统

Country Status (1)

Country Link
CN (1) CN108733522A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968362A (zh) * 2012-11-21 2013-03-13 浪潮电子信息产业股份有限公司 一种系统开机过程中检测pcie设备完整性的方法
CN203241876U (zh) * 2013-05-09 2013-10-16 浪潮电子信息产业股份有限公司 一种自适应配置的pcie扩展箱
CN103532621A (zh) * 2013-10-25 2014-01-22 华为技术有限公司 PCIe设备在位检测方法和PCIe设备
CN104133716A (zh) * 2014-08-18 2014-11-05 浪潮电子信息产业股份有限公司 一种测试服务器主板硬件稳定性的方法
CN105718346A (zh) * 2016-01-22 2016-06-29 浪潮电子信息产业股份有限公司 一种基于UEFI的计算机主板PCIe插槽功能测试方法
CN106502952A (zh) * 2016-10-24 2017-03-15 郑州云海信息技术有限公司 一种pcie设备安全掉线设计方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968362A (zh) * 2012-11-21 2013-03-13 浪潮电子信息产业股份有限公司 一种系统开机过程中检测pcie设备完整性的方法
CN203241876U (zh) * 2013-05-09 2013-10-16 浪潮电子信息产业股份有限公司 一种自适应配置的pcie扩展箱
CN103532621A (zh) * 2013-10-25 2014-01-22 华为技术有限公司 PCIe设备在位检测方法和PCIe设备
CN104133716A (zh) * 2014-08-18 2014-11-05 浪潮电子信息产业股份有限公司 一种测试服务器主板硬件稳定性的方法
CN105718346A (zh) * 2016-01-22 2016-06-29 浪潮电子信息产业股份有限公司 一种基于UEFI的计算机主板PCIe插槽功能测试方法
CN106502952A (zh) * 2016-10-24 2017-03-15 郑州云海信息技术有限公司 一种pcie设备安全掉线设计方法

Similar Documents

Publication Publication Date Title
US20080270827A1 (en) Recovering diagnostic data after out-of-band data capture failure
CN104731701B (zh) 测试系统及执行测试任务的方法和装置
CN110609778A (zh) 一种保存服务器宕机日志的方法及系统
CN108287780A (zh) 一种监控服务器cpld状态的装置及方法
CN104615519A (zh) 一种linux系统下检测服务器内存容量是否缺失的方法
US5535330A (en) System and method for error location in printed wire assemblies by external power on self test (post) commands
CN116775141A (zh) 异常检测方法、装置、计算机设备及存储介质
CN110489287B (zh) 通过Ipmitool测试热插拔的方法、系统及存储介质
CN111858201A (zh) 一种bmc综合测试方法、系统、终端及存储介质
CN114816022A (zh) 一种服务器电源异常监控方法、系统及存储介质
CN108733522A (zh) 一种在机械测试中监测pcie卡在位的方法及系统
CN108802627A (zh) Bbu独立供电的测试方法、装置、系统及可读存储介质
EP1210663A2 (en) Method and apparatus for extracting first failure and attendant operating information from computer system devices
WO2011035612A1 (zh) 单板启动监控系统及监控方法
CN115934446A (zh) 一种自检方法、服务器、设备和存储介质
CN106354592A (zh) 一种计算机自动开关机测试装置
CN116204361A (zh) 一种资产管理方法、系统、装置及存储介质
CN111884830B (zh) 一种基于bmc保留故障现场的方法及装置
CN114461479A (zh) 调试多媒体处理芯片的方法、装置、存储介质和电子设备
CN112213980A (zh) 一种单片机故障诊断板卡及方法
CN109359001A (zh) 一种固态盘冷重启测试的方法、装置及设备
CN113220510A (zh) 设备检测方法、检测设备和计算机可读存储介质
CN113140251B (zh) 一种在产线测试中检测ram的方法及系统
CN117873771B (zh) 一种系统宕机处理方法、装置、设备、存储介质及服务器
CN114490218A (zh) 核心板压测方法、系统、装置、设备、介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181102

RJ01 Rejection of invention patent application after publication