CN107168838A - 一种raid卡自动测试系统 - Google Patents

一种raid卡自动测试系统 Download PDF

Info

Publication number
CN107168838A
CN107168838A CN201710350208.XA CN201710350208A CN107168838A CN 107168838 A CN107168838 A CN 107168838A CN 201710350208 A CN201710350208 A CN 201710350208A CN 107168838 A CN107168838 A CN 107168838A
Authority
CN
China
Prior art keywords
test system
auto
raid card
test
reboot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710350208.XA
Other languages
English (en)
Inventor
刘栋
王宏运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710350208.XA priority Critical patent/CN107168838A/zh
Publication of CN107168838A publication Critical patent/CN107168838A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明涉及服务器板卡测试领域,具体涉及一种RAID卡自动测试系统。通过使用疲劳机、软件控制、SNMP报警设计等方法提高RAID卡的测试效率,有效降低RAID卡测试的时间成本和人力成本,提高RAID卡测试的覆盖度,将工作有隐患的RAID卡提前筛选出。

Description

一种RAID卡自动测试系统
技术领域
本发明涉及服务器板卡测试领域,具体涉及一种RAID卡自动测试系统。通过使用疲劳机、软件控制、SNMP报警设计等方法提高RAID卡的测试效率,有效降低RAID卡测试的时间成本和人力成本,提高RAID卡测试的覆盖度,将工作有隐患的RAID卡提前筛选出。
背景技术
RAID(Redundant Arrays of Independent Disks磁盘阵列)是一种把多块独立的物理硬盘按不同方式组合起来形成一个逻辑硬盘,从而提供比单个硬盘有着更高的性能和提供数据冗余的技术。服务器作为高性能高可靠性的机器,RAID卡在很多机型中应用广泛,其主要目的是用于提升IO读写吞吐率和增加数据可靠性。RAID卡设计比较复杂,但由于结构空间原因,往往涉及成标准PCIe半高的结构尺寸。在极为有限的板卡空间上有controller、内存颗粒、flash颗粒等封装尺寸大、管脚多、功能复杂的芯片,这对RAID卡的信号走线质量及可靠性是一个很大的挑战。
服务器RAID卡是在服务器上用来实现将PCIe协议转换为SATA/SAS协议,并提供相应的数据冗余及增加吞吐量的功能的部件。RAID卡从对外接口上看,是将PCIe总线协议与SAS/SATA,总线协议转换的设备,当前主流的PCIe Gen3协议速率已经高达8GT/s,SATA总线协议速率为6GT/s,SAS总线协议速率更是高达12GT/s。在如此高速率的总线实时进行较为复杂的数据冗余算法操作,也在一定程度上对板卡的可靠工作引入风险。实时处理如此高速率的数据,并实现复杂的算法运算,对RAID卡工作的稳定性要求是很高的。在实际使用中,RAID卡经常出现工作不稳定的状况,而RAID卡的测试往往又比较复杂,难以做到检测率覆盖100%。RAID卡不但能提供RAID0、RAID1、RAID5、RAID6、RAID10等数据冗余的方式,同时还具有硬盘热备、掉电保护等功能,因此测试项繁多且人工操作复杂,测试的人力成本及时间成本都非常高,甚至对整机的研发测试进度、出货周期造成负担。
针对上述问题,本申请发明一种高效的RAID卡自动测试系统,通过使用疲劳机、软件控制、SNMP报警设计等方法提高RAID卡的测试效率,可以大幅降低测试RAID卡的时间成本及人力成本,提供高质量产品,提高产品竞争力。
发明内容
本申请所述自动测试系统实现方法的主要思想是:通过引入LINUX软件控制、疲劳机、SNMP报警等方法,实现一整套高程度自动化的RAID卡测试系统。
本申请所述的高效的RAID卡自动测试系统该系统可以实现的四个基本功能:
一、AC/DC reboot测试功能
AC/DC reboot测试是借助疲劳机,实现AC/DC reboot的测试。将疲劳机的Server220V供电、Power button output、Power 5V input连接到服务器的相应的接口上。疲劳机可以通过Power button output使server开机,开机后,server自动调用关机脚本自动关机,关机时间可自行设定。疲劳机通过检测Power 5V input是否掉电来判断server是否关机完成。
在关机完成后,如果是运行DC reboot,就可以直接通过Power button output进行开机了,如果是AC reboot,疲劳机通过内部继电器控制AC 220V供电与Server 220V供电断开实现AC reboot。
二、RAID卡性能测试功能
该功能主要通过调用OS或者DOS下的厂商提供的配置软件实现。当前的主流RAID卡芯片以AVAGO和PMC两家为主,两家的配置软件都已经非常成熟,可以在DOS或者OS下调用配置工具实现组件RAID卡支持的RAID类型,常用的RAID类型有RAID0、RAID1、RAID5、RAID6、RAID10、RAID50、RAID60。在OS或者DOS下依次组件各个RAID,并重启后通过FIO或者IOmeter工具加压测试性能,去测试RAID卡的功能及性能。
测试操作内容及测试结果都会记录在log文件中,测试完成后通过查看详尽的log日志查看测试详情。
三、自动报警功能
工具内置SNMP协议规范,当测试fail时,自动调用SNMP协议远程向测试人发送警告邮件,可以实现完全无人状态下的测试及监控,大幅节约人力。
四、硬件power供电监控功能
板卡供电是否稳定可靠影响着板卡整体的稳定性,通过专门设计的探头+电压量测工具,在测试过程中实时监测板卡的供电状态,在供电电压不在spec范围内时,记录故障电压值,并通过SNMP协议随时向测试人报告。
优选的,本申请请求保护一种RAID卡自动测试系统,其特征在于该自动测试系统中的RAID卡具有量测供电的接口,该接口可以连接电压测量装置实时监测电压;该系统的主板具有可以连接疲劳机的相应接口,用于进行AC/DC reboot测试。
如上所述的RAID卡自动测试系统,其特征还在于,自动测试系统进行AC/DCreboot测试是借助疲劳机进行,疲劳机可以通过Power button output使server开机,开机后,server自动调用关机脚本自动关机,关机时间可自行设定,疲劳机通过检测Power 5Vinput是否掉电来判断server是否关机完成。
如上所述的RAID卡自动测试系统,其特征还在于,自动测试系统进行AC/DCreboot测试在关机完成后,如果是运行DC reboot,就可以直接通过Power button output进行开机了,如果是AC reboot,疲劳机通过内部继电器控制AC 220V供电与Server 220V供电断开实现AC reboot。
如上所述的RAID卡自动测试系统,其特征还在于,该自动测试系统在OS或者DOS下依次组件各个RAID,并重启后通过FIO或者IO meter工具加压测试性能,测试RAID卡的功能及性能。
如上所述的RAID卡自动测试系统,其特征还在于,该自动测试系统测试操作的内容及测试结果都会记录在log文件中。
如上所述的RAID卡自动测试系统,其特征还在于,该自动测试系统内置SNMP协议规范,当测试fail时,自动调用SNMP协议远程向测试人发送警告邮件。
如上所述的RAID卡自动测试系统,其特征还在于,该自动测试系统进一步可以包括探头+电压量测工具,在测试过程中实时监测板卡的供电状态,在供电电压不在spec范围内时,记录故障电压值,并通过SNMP协议随时向测试人报告。
附图说明
图1、本发明所述工作原理框图
具体实施方式
本发明提出一种高效的RAID卡自动测试系统。
具体实施方式
本申请所述的发明是一整套的测试系统,同时需要软件和硬件的支撑。按照本申请所述发明的思路,搭建各个软硬件模块,配合使用即可实现该本申请所述发明的功能。
实施方式简述如下:
1、开发RAID卡自身预留量测供电的接口,可以连接电压测量装置实时监测电压。
2、主板预留相应接口可以连接疲劳机实现AC/DC reboot测试。
3、软件集成供应商提供的RAID管理工具包,调用其API,将各个软件操控的测试融合在一起。与疲劳机和供电测试装置配合,实时采集测试信息。
4、开发基于SNMP的软件警报功能,在发生故障时可以及时向测试人发送邮件报警信息。
使用本申请所述的测试系统可以提升RAID卡的测试效率,有效降低RAID卡测试的时间成本和人力成本,提高RAID卡测试的覆盖度,将工作有隐患的RAID卡提前筛选出。测试平台兼容性好,可以轻松移植到其他类型的板卡上。适应广泛,既可用于批量产品产线检测,又可用于新产品的研发测试,测试周期短,降低测试成本,且易于拓展推广,具有极强的实用价值。

Claims (7)

1.一种RAID卡自动测试系统,其特征在于该自动测试系统中的RAID卡具有量测供电的接口,该接口可以连接电压测量装置实时监测电压;该系统的主板具有可以连接疲劳机的相应接口,用于进行AC/DC reboot测试。
2.如权利要求1所述的RAID卡自动测试系统,其特征还在于,自动测试系统进行AC/DCreboot测试是借助疲劳机进行,疲劳机可以通过Power button output使server开机,开机后,server自动调用关机脚本自动关机,关机时间可自行设定,疲劳机通过检测Power 5Vinput是否掉电来判断server是否关机完成。
3.如权利要求2所述的RAID卡自动测试系统,其特征还在于,自动测试系统进行AC/DCreboot测试在关机完成后,如果是运行DC reboot,就可以直接通过Power button output进行开机了,如果是AC reboot,疲劳机通过内部继电器控制AC 220V供电与Server 220V供电断开实现AC reboot。
4.如权利要求3所述的RAID卡自动测试系统,其特征还在于,该自动测试系统在OS或者DOS下依次组件各个RAID,并重启后通过FIO或者IO meter工具加压测试性能,测试RAID卡的功能及性能。
5.如权利要求4所述的RAID卡自动测试系统,其特征还在于,该自动测试系统测试操作的内容及测试结果都会记录在log文件中。
6.如权利要求5所述的RAID卡自动测试系统,其特征还在于,该自动测试系统内置SNMP协议规范,当测试fail时,自动调用SNMP协议远程向测试人发送警告邮件。
7.如权利要求6所述的RAID卡自动测试系统,其特征还在于,该自动测试系统进一步可以包括探头+电压量测工具,在测试过程中实时监测板卡的供电状态,在供电电压不在spec范围内时,记录故障电压值,并通过SNMP协议随时向测试人报告。
CN201710350208.XA 2017-05-16 2017-05-16 一种raid卡自动测试系统 Pending CN107168838A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710350208.XA CN107168838A (zh) 2017-05-16 2017-05-16 一种raid卡自动测试系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710350208.XA CN107168838A (zh) 2017-05-16 2017-05-16 一种raid卡自动测试系统

Publications (1)

Publication Number Publication Date
CN107168838A true CN107168838A (zh) 2017-09-15

Family

ID=59815268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710350208.XA Pending CN107168838A (zh) 2017-05-16 2017-05-16 一种raid卡自动测试系统

Country Status (1)

Country Link
CN (1) CN107168838A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943643A (zh) * 2017-11-28 2018-04-20 郑州云海信息技术有限公司 一种基于moc板卡硬件dc测试方法与系统
CN108051728A (zh) * 2017-11-28 2018-05-18 郑州云海信息技术有限公司 一种基于moc板卡硬件ac测试方法与系统
CN108804269A (zh) * 2018-06-11 2018-11-13 郑州云海信息技术有限公司 一种基于域控制测试raid板卡稳定性的系统及方法
CN108845901A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种实现系统reboot测试状态远程监控的方法及装置
CN109240850A (zh) * 2018-08-21 2019-01-18 郑州云海信息技术有限公司 一种Linux系统下服务器DC Reboot测试方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201378313Y (zh) * 2009-04-16 2010-01-06 浪潮电子信息产业股份有限公司 一种用于微型计算机和服务器开关机疲劳测试的装置
CN101937385A (zh) * 2010-08-30 2011-01-05 浪潮电子信息产业股份有限公司 一种raid卡运行状态监测系统
CN104268044A (zh) * 2014-09-28 2015-01-07 浪潮电子信息产业股份有限公司 一种服务器系统正常开关机循环测试的方法及装置
CN105138437A (zh) * 2015-08-25 2015-12-09 浪潮电子信息产业股份有限公司 一种基于疲劳测试机和4U治具的SmartRack多节点并行reboot测试的方法
CN106201797A (zh) * 2016-07-14 2016-12-07 浪潮电子信息产业股份有限公司 疲劳测试机搭配4u治具实现多节点ac测试的方法
CN106649018A (zh) * 2017-01-09 2017-05-10 郑州云海信息技术有限公司 一种带扩展柜的存储系统稳定性的测试方法
CN106649016A (zh) * 2016-12-29 2017-05-10 郑州云海信息技术有限公司 一种1u2机架式服务器交流电源周期测试的方法
CN107133134A (zh) * 2017-04-28 2017-09-05 郑州云海信息技术有限公司 一种高效的raid卡自动测试系统和方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201378313Y (zh) * 2009-04-16 2010-01-06 浪潮电子信息产业股份有限公司 一种用于微型计算机和服务器开关机疲劳测试的装置
CN101937385A (zh) * 2010-08-30 2011-01-05 浪潮电子信息产业股份有限公司 一种raid卡运行状态监测系统
CN104268044A (zh) * 2014-09-28 2015-01-07 浪潮电子信息产业股份有限公司 一种服务器系统正常开关机循环测试的方法及装置
CN105138437A (zh) * 2015-08-25 2015-12-09 浪潮电子信息产业股份有限公司 一种基于疲劳测试机和4U治具的SmartRack多节点并行reboot测试的方法
CN106201797A (zh) * 2016-07-14 2016-12-07 浪潮电子信息产业股份有限公司 疲劳测试机搭配4u治具实现多节点ac测试的方法
CN106649016A (zh) * 2016-12-29 2017-05-10 郑州云海信息技术有限公司 一种1u2机架式服务器交流电源周期测试的方法
CN106649018A (zh) * 2017-01-09 2017-05-10 郑州云海信息技术有限公司 一种带扩展柜的存储系统稳定性的测试方法
CN107133134A (zh) * 2017-04-28 2017-09-05 郑州云海信息技术有限公司 一种高效的raid卡自动测试系统和方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943643A (zh) * 2017-11-28 2018-04-20 郑州云海信息技术有限公司 一种基于moc板卡硬件dc测试方法与系统
CN108051728A (zh) * 2017-11-28 2018-05-18 郑州云海信息技术有限公司 一种基于moc板卡硬件ac测试方法与系统
CN108804269A (zh) * 2018-06-11 2018-11-13 郑州云海信息技术有限公司 一种基于域控制测试raid板卡稳定性的系统及方法
CN108845901A (zh) * 2018-06-12 2018-11-20 郑州云海信息技术有限公司 一种实现系统reboot测试状态远程监控的方法及装置
CN108845901B (zh) * 2018-06-12 2021-10-08 郑州云海信息技术有限公司 一种实现系统reboot测试状态远程监控的方法及装置
CN109240850A (zh) * 2018-08-21 2019-01-18 郑州云海信息技术有限公司 一种Linux系统下服务器DC Reboot测试方法

Similar Documents

Publication Publication Date Title
CN107168838A (zh) 一种raid卡自动测试系统
US10929260B2 (en) Traffic capture and debugging tools for identifying root causes of device failure during automated testing
US10955461B2 (en) Smart and efficient protocol logic analyzer configured within automated test equipment (ATE) hardware
CN104991629B (zh) 电源失效侦测系统与其方法
US6842865B2 (en) Method and system for testing microprocessor based boards in a manufacturing environment
JP4886601B2 (ja) Usbインタフェース設備に対して操作を行う装置及び方法
CN107590040A (zh) 一种硬盘背板及计算机装置、硬盘故障检测方法及存储器
US11828787B2 (en) Eye diagram capture test during production
US20210111967A1 (en) Graphical user interface for traffic capture and debugging tool
CN107133134A (zh) 一种高效的raid卡自动测试系统和方法
JP6033913B2 (ja) ユニバーサルテストプラットフォーム及びそのテスト方法
US11994970B2 (en) Diagnostic system
US20050015647A1 (en) Storage system, and method for maintaining the storage system
CN113204456A (zh) 一种服务器vpp接口的测试方法、治具、装置及设备
CN111060807B (zh) 基于SoC的高速集成电路测试平台及其测试方法
CN102541705B (zh) 计算机的测试方法和工装板
CN111190779A (zh) 硬盘检盘结构、硬盘检盘方法及硬盘
CN109885437A (zh) 基板管理控制器bmc、终端及上电状态诊断组件、方法
CN111475378B (zh) 一种扩展器Expander的监控方法、装置及设备
CN102411527B (zh) 一种图像处理芯片的检测方法、开发板和检测系统
CN110119370A (zh) 一种基于peci总线的vr芯片控制方法与系统
CN110118925A (zh) 一种核心板测试方法及系统
WO2024121938A1 (ja) ピンエレクトロニクス装置、試験装置、および方法
WO2024121939A1 (ja) ピンエレクトロニクス装置、試験装置、および方法
CN219871510U (zh) 一种电池包的测试装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170915