CN106649011A - 一种服务器设备的检测方法和装置 - Google Patents

一种服务器设备的检测方法和装置 Download PDF

Info

Publication number
CN106649011A
CN106649011A CN201611101355.5A CN201611101355A CN106649011A CN 106649011 A CN106649011 A CN 106649011A CN 201611101355 A CN201611101355 A CN 201611101355A CN 106649011 A CN106649011 A CN 106649011A
Authority
CN
China
Prior art keywords
server
hard disk
detection
restarted
pcie slots
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611101355.5A
Other languages
English (en)
Inventor
庞雄伟
刘建锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN201611101355.5A priority Critical patent/CN106649011A/zh
Publication of CN106649011A publication Critical patent/CN106649011A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提出了一种服务器设备的检测方法和装置,该检测方法包括:获取SAS卡的数量信息;根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存;以及将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存。本发明通过获取SAS卡的数量信息,随后根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存,最后将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存,从而能够自动化的对服务器硬盘和PCIE插槽进行检查,并将获得的测试数据和服务器运行数据结果进行保存,节省了人力成本,提高了检测效率。

Description

一种服务器设备的检测方法和装置
技术领域
本发明涉及服务器领域,具体来说,涉及一种服务器设备的检测方法和装置。
背景技术
随着服务器的密度越来越高,服务器上内置硬盘数量越来越多,并且现有高密度存储服务器的硬盘都是由PCIE扩展卡进行管理的,即PCIE插槽异常降速会导致硬盘无法发挥其正常性能,因此,检测服务器中PCIE插槽速率信息(或带宽信息)以及硬盘得到健康状态显得尤为重要。
但是,现有高密度存储服务器设备的检测技术的存在如下缺点:该检测方法不是针对高密度硬盘的,故无法满足高密度存储服务器硬盘检测,会产生极大的工作量;该检测方法无法应用于PCIE插槽的检测,仅一次性检测无法满足存储服务器可靠性检测要求。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种服务器设备的检测方法和装置,能够自动化的对服务器硬盘和PCIE插槽进行检查,并将获得的测试数据和服务器运行数据结果进行保存,节省了人力成本,提高了检测效率。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种服务器设备的检测方法。
该检测方法包括:
获取SAS卡的数量信息;
根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存;以及
将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存。
根据本发明的一个实施例,检测所有硬盘的状态信息并保存包括:
根据所有硬盘的状态信息,确定每个硬盘是否正常工作;
在硬盘不正常工作的情况下,输出错误信息并保存。
根据本发明的一个实施例,将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存包括:
设置服务器的关机时间和重启次数;
根据关机时间和重启次数,对服务器进行重启,并且在服务器每次重启进入系统后,检测多个PCIE插槽的传输速率并保存。
根据本发明的一个实施例,SAS卡分别连接PCIE插槽和硬盘。
根据本发明的另一方面,提供了一种服务器设备的检测装置。
该检测装置包括:
获取模块,用于获取SAS卡的数量信息;
硬盘检测模块,用于根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存;
PCIE插槽检测模块,用于将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存。
根据本发明的一个实施例,硬盘检测模块包括:
确定模块,用于根据所有硬盘的状态信息,确定每个硬盘是否正常工作;
输出模块,用于在硬盘不正常工作的情况下,输出错误信息并保存。
根据本发明的一个实施例,PCIE插槽检测模块包括:
设置模块,用于设置服务器的关机时间和重启次数;
重启检测模块,用于根据关机时间和重启次数,对服务器进行重启,并且在服务器每次重启进入系统后,检测多个PCIE插槽的传输速率并保存。
根据本发明的一个实施例,SAS卡分别连接PCIE插槽和硬盘。
本发明的有益技术效果在于:
本发明通过获取SAS卡的数量信息,随后根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存,最后将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存,从而能够自动化的对服务器硬盘和PCIE插槽进行检查,并将获得的测试数据和服务器运行数据结果进行保存,节省了人力成本,提高了检测效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的服务器设备的检测方法的流程图;
图2是根据本发明实施例的双路高密度存储服务器的硬件架构;
图3是根据本发明实施例的服务器设备的检测方法的具体流程图;
图4是根据本发明实施例的服务器设备的检测装置的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种服务器设备的检测方法。
如图1所示,根据本发明实施例的服务器设备的检测方法包括:
步骤S101,获取SAS卡的数量信息;
步骤S103,根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存;
步骤S105,将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE(Peripheral Component Interface Express周边装置互联高速)插槽的传输速率并保存。
通过本发明的上述方案,通过获取SAS卡的数量信息,随后根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存,最后将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存,从而能够自动化的对服务器硬盘和PCIE插槽进行检查,并将获得的测试数据和服务器运行数据结果进行保存,节省了人力成本,提高了检测效率。
根据本发明的一个实施例,检测所有硬盘的状态信息并保存包括:
根据所有硬盘的状态信息,确定每个硬盘是否正常工作;
在硬盘不正常工作的情况下,输出错误信息并保存。
根据本发明的一个实施例,将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存包括:
设置服务器的关机时间和重启次数;
根据关机时间和重启次数,对服务器进行重启,并且在服务器每次重启进入系统后,检测多个PCIE插槽的传输速率并保存。
根据本发明的一个实施例,SAS卡分别连接PCIE插槽和硬盘。
为了更好的描述本发明,现在以一个具体的实施例进行详细的描述。
现以双路高密度存储服务器硬件架构为例来介绍本发明,如图2所示,PCIE插槽直接从CPU(Central Processing Unit,中央处理器)里引出,并且每个CPU引出的PCIE插槽上都连接有一块SAS(Serial Attached SCSI,串行连接小型计算机系统接口)卡,SAS卡通过SAS线与下面的硬盘(如硬盘0、硬盘1等)连接,此外,当然可以理解,根据实际需求对SAS卡和硬盘的数量进行设置,本发明对此不做限定。
进一步,如图3所示,首先检测SAS卡的数量以及每块SAS卡连接的硬盘数量,通过SAS卡的数量和每块SAS卡连接的硬盘数量可以确定服务器的硬盘总数并对所有的硬盘进行健康检测,其次通过设置服务器关机时间和重启次数,且在每次重启进入服务器系统后检测PCIE插槽速率信息,经多次重复检测可以保证其检测的可靠性,最后通过输出检查结果确定服务器硬盘和PCIE插槽的健康状态,同时,在检测硬盘健康状态(或能否正常工作)时,当检测出不正常工作或损坏的硬盘时,将该硬盘的信息输出为错误信息并保存。
此外,下面以采用Linux系统下shell脚本实现上述技术方案为例,将该shell脚本打包成压缩包,并且采用两级目录,以及根目录下存放3个文件夹和6个主脚本,其中,上述6个主脚本包括:
test_all.sh为主执行程序,里面嵌套硬盘检测和PCIE检测功能函数,同时,该测试由test_all.sh作为主程序入口,调用其它脚本协同工作完成测试;
hdd_test.sh为硬盘检测程序,自动识别服务器硬盘数量且对所有硬盘进行健康状态检查,并保存结果;
check_pcie.sh为PCIE速率检测程序;
run_dc.sh为设置服务器自动掉电重启次数;
Reboot.sh为重启系统程序;
Config为获取当前目录下文件路径信息;
上述3个文件夹:
Log为存放日志文件,PCIE检测以及掉电重启等执行记录都放在此日志文件中;
Tools为存放硬盘检测文件;
Result为存放检测结果。
根据本发明的实施例,还提供了一种服务器设备的检测装置。
如图4所示,根据本发明实施例的服务器设备的检测装置包括:
获取模块41,用于获取SAS卡的数量信息;
硬盘检测模块42,用于根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存;
PCIE插槽检测模块43,用于将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存。
根据本发明的一个实施例,硬盘检测模块42包括:
确定模块(未示出),用于根据所有硬盘的状态信息,确定每个硬盘是否正常工作;
输出模块(未示出),用于在硬盘不正常工作的情况下,输出错误信息并保存。
根据本发明的一个实施例,PCIE插槽检测模块43包括:
设置模块(未示出),用于设置服务器的关机时间和重启次数;
重启检测模块(未示出),用于根据关机时间和重启次数,对服务器进行重启,并且在服务器每次重启进入系统后,检测多个PCIE插槽的传输速率并保存。
根据本发明的一个实施例,SAS卡分别连接PCIE插槽和硬盘。
综上所述,借助于本发明的上述技术方案,通过获取SAS卡的数量信息,随后根据SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存,最后将服务器进行重启,并且在服务器重启的过程中,检测多个PCIE插槽的传输速率并保存,从而能够自动化的对服务器硬盘和PCIE插槽进行检查,并将获得的测试数据和服务器运行数据结果进行保存,节省了人力成本,提高了检测效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种服务器设备的检测方法,其特征在于,包括:
获取SAS卡的数量信息;
根据所述SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存;以及
将服务器进行重启,并且在所述服务器重启的过程中,检测多个PCIE插槽的传输速率并保存。
2.根据权利要求1所述的检测方法,其特征在于,检测所有硬盘的状态信息并保存包括:
根据所有硬盘的状态信息,确定每个硬盘是否正常工作;
在硬盘不正常工作的情况下,输出错误信息并保存。
3.根据权利要求2所述的检测方法,其特征在于,将服务器进行重启,并且在所述服务器重启的过程中,检测多个PCIE插槽的传输速率并保存包括:
设置所述服务器的关机时间和重启次数;
根据所述关机时间和重启次数,对所述服务器进行重启,并且在所述服务器每次重启进入系统后,检测多个PCIE插槽的传输速率并保存。
4.根据权利要求1所述的检测方法,其特征在于,所述SAS卡分别连接所述PCIE插槽和所述硬盘。
5.一种服务器设备的检测装置,其特征在于,包括:
获取模块,用于获取SAS卡的数量信息;
硬盘检测模块,用于根据所述SAS卡的数量信息,确定每个SAS卡连接的硬盘的数量,并检测所有硬盘的状态信息并保存;
PCIE插槽检测模块,用于将服务器进行重启,并且在所述服务器重启的过程中,检测多个PCIE插槽的传输速率并保存。
6.根据权利要求5所述的检测装置,其特征在于,所述硬盘检测模块包括:
确定模块,用于根据所有硬盘的状态信息,确定每个硬盘是否正常工作;
输出模块,用于在硬盘不正常工作的情况下,输出错误信息并保存。
7.根据权利要求6所述的检测装置,其特征在于,所述PCIE插槽检测模块包括:
设置模块,用于设置所述服务器的关机时间和重启次数;
重启检测模块,用于根据所述关机时间和重启次数,对所述服务器进行重启,并且在所述服务器每次重启进入系统后,检测多个PCIE插槽的传输速率并保存。
8.根据权利要求5所述的检测装置,其特征在于,所述SAS卡分别连接所述PCIE插槽和所述硬盘。
CN201611101355.5A 2016-12-02 2016-12-02 一种服务器设备的检测方法和装置 Pending CN106649011A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611101355.5A CN106649011A (zh) 2016-12-02 2016-12-02 一种服务器设备的检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611101355.5A CN106649011A (zh) 2016-12-02 2016-12-02 一种服务器设备的检测方法和装置

Publications (1)

Publication Number Publication Date
CN106649011A true CN106649011A (zh) 2017-05-10

Family

ID=58820154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611101355.5A Pending CN106649011A (zh) 2016-12-02 2016-12-02 一种服务器设备的检测方法和装置

Country Status (1)

Country Link
CN (1) CN106649011A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062839A (zh) * 2018-07-18 2018-12-21 郑州云海信息技术有限公司 一种检测hba卡的方法、装置和计算机可读存储介质
CN109684149A (zh) * 2018-12-13 2019-04-26 浪潮电子信息产业股份有限公司 一种NVMe硬盘的硬件信息监控方法、装置及设备
CN111124785A (zh) * 2019-12-22 2020-05-08 广东浪潮大数据研究有限公司 一种硬盘故障检查的方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274926A1 (en) * 2009-04-22 2010-10-28 Rajendra Sadanand Marulkar High-speed inline data compression inline with an eight byte data path
CN102420719A (zh) * 2011-11-28 2012-04-18 曙光信息产业股份有限公司 一种测试PCIe总线带宽的装置和方法
CN102799507A (zh) * 2012-06-29 2012-11-28 浪潮电子信息产业股份有限公司 一种测试pcie带宽稳定性的方法
CN103593269A (zh) * 2013-11-01 2014-02-19 浪潮电子信息产业股份有限公司 一种多PCIe设备重启压力的自动化循环测试方法
CN104020825A (zh) * 2014-06-20 2014-09-03 浪潮电子信息产业股份有限公司 一种高密度Rack存储服务器
CN204028898U (zh) * 2014-06-19 2014-12-17 浪潮(北京)电子信息产业有限公司 一种硬盘、兼容多种固态硬盘任意混插的服务器
CN105141478A (zh) * 2015-09-02 2015-12-09 浪潮电子信息产业股份有限公司 一种linux服务器sas卡硬盘状态的监控方法
CN205507751U (zh) * 2016-04-11 2016-08-24 浪潮集团有限公司 一种存储主板

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274926A1 (en) * 2009-04-22 2010-10-28 Rajendra Sadanand Marulkar High-speed inline data compression inline with an eight byte data path
CN102420719A (zh) * 2011-11-28 2012-04-18 曙光信息产业股份有限公司 一种测试PCIe总线带宽的装置和方法
CN102799507A (zh) * 2012-06-29 2012-11-28 浪潮电子信息产业股份有限公司 一种测试pcie带宽稳定性的方法
CN103593269A (zh) * 2013-11-01 2014-02-19 浪潮电子信息产业股份有限公司 一种多PCIe设备重启压力的自动化循环测试方法
CN204028898U (zh) * 2014-06-19 2014-12-17 浪潮(北京)电子信息产业有限公司 一种硬盘、兼容多种固态硬盘任意混插的服务器
CN104020825A (zh) * 2014-06-20 2014-09-03 浪潮电子信息产业股份有限公司 一种高密度Rack存储服务器
CN105141478A (zh) * 2015-09-02 2015-12-09 浪潮电子信息产业股份有限公司 一种linux服务器sas卡硬盘状态的监控方法
CN205507751U (zh) * 2016-04-11 2016-08-24 浪潮集团有限公司 一种存储主板

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062839A (zh) * 2018-07-18 2018-12-21 郑州云海信息技术有限公司 一种检测hba卡的方法、装置和计算机可读存储介质
CN109684149A (zh) * 2018-12-13 2019-04-26 浪潮电子信息产业股份有限公司 一种NVMe硬盘的硬件信息监控方法、装置及设备
CN111124785A (zh) * 2019-12-22 2020-05-08 广东浪潮大数据研究有限公司 一种硬盘故障检查的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110750396B (zh) 一种服务器操作系统兼容性测试方法、装置及存储介质
CN108768730B (zh) 用于操作智能网卡的方法和装置
CN111209151A (zh) 基于linux的NVME SSD热拔插测试方法、系统、终端及存储介质
US9218893B2 (en) Memory testing in a data processing system
US20140298082A1 (en) Testing server, information processing system, and testing method
US20130067298A1 (en) Automatically allocating clients for software program testing
CN114077525A (zh) 异常日志处理方法、装置、终端设备、云服务器及系统
CN109189627B (zh) 一种硬盘故障监控检测方法、装置、终端及存储介质
CN105068920A (zh) 一种基于shell测试rack资产信息稳定性的方法
CN104572386B (zh) 一种Linux下自动测试HBA卡带宽的方法
CN106649011A (zh) 一种服务器设备的检测方法和装置
CN110557299A (zh) 一种网络传输功能批量测试方法、系统、终端及存储介质
CN106909468A (zh) 一种基于uefi固件的计算机故障诊断方法
CN104714863A (zh) 一种基于Linux操作系统的系统宕机后Raid卡日志完整保存的方法
WO2016091085A1 (zh) 数据传输方法、装置和服务器
CN110865944A (zh) 测试用例的数据分析方法、装置、存储介质和测试设备
CN110691009A (zh) 一种网络设备巡检方法和装置
CN107070747A (zh) 一种在网卡绑定模式下自动化测试网卡网络连接稳定性的方法
CN101430658A (zh) 异常复位信息的保存方法及装置
CN109684166A (zh) 自动测试Sensor日志规范性的方法、装置、终端及存储介质
CN107329914A (zh) 一种基于Linux系统检测硬盘乱序的方法及装置
US9104447B2 (en) Restoring a previous version of a virtual machine image
CN112000535A (zh) 一种基于SAS Expander卡的硬盘异常识别方法及处理方法
CN109918221B (zh) 一种硬盘报错解析方法、系统、终端及存储介质
CN110928492A (zh) 分布式文件系统的硬盘更换方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170510