CN107451003B - 一种存储系统的测试方法及装置 - Google Patents

一种存储系统的测试方法及装置 Download PDF

Info

Publication number
CN107451003B
CN107451003B CN201710521347.4A CN201710521347A CN107451003B CN 107451003 B CN107451003 B CN 107451003B CN 201710521347 A CN201710521347 A CN 201710521347A CN 107451003 B CN107451003 B CN 107451003B
Authority
CN
China
Prior art keywords
log file
storage system
test information
information
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710521347.4A
Other languages
English (en)
Other versions
CN107451003A (zh
Inventor
李婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201710521347.4A priority Critical patent/CN107451003B/zh
Publication of CN107451003A publication Critical patent/CN107451003A/zh
Application granted granted Critical
Publication of CN107451003B publication Critical patent/CN107451003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Abstract

本发明实施例提供一种存储系统的测试方法及装置,通过从第一日志文件获取第一测试信息,第一日志文件是上一次主机柜上电启动所保存的日志文件;从第二日志文件获取第二测试信息,第二日志文件是当前主机柜上电启动所保存的日志文件;当第一测试信息与第二测试信息不同,且第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果;其中,第三日志文件是记录存储系统启动次数的日志文件。通过从日志文件中提取有效的测试信息,进行信息粗筛,再通过测试信息的对比,进行信息细筛,这样通过两次信息的筛选,能够有效获取更多存储系统的测试信息,提高了测试质量。

Description

一种存储系统的测试方法及装置
技术领域
本发明涉及存储系统测试技术领域,特别是涉及一种存储系统的测试方法及装置。
背景技术
存储系统通常包括多块硬盘,用于承载系统和用户数据。存储系统的稳定性是保证用户服务和数据安全的关键。
为了保证存储系统的稳定性,通常需要进行存储系统测试。目前的存储系统测试,通常将存储系统进行多次重启;每次重启后,存储系统会生成日志文件,用于记录存储系统中所有硬盘是否正常识别;如果硬盘无法正常识别,就可以判定存储系统是否发生异常。
然而,发明人通过研究发现,由于存储容量的需求,存储系统中通常增加设置多个扩展柜,每个扩展柜中设置由多块硬盘构成的存储阵列,随着扩展柜的增多,存储系统的结构越来越复杂,由于上述测试方法仅是通过对硬盘的识别情况对存储系统的稳定性进行评估,无法提供更详细的测试信息,测试质量差。综上所述,如何提高存储系统的测试质量是本领域技术人员亟需解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种存储系统的测试方法及装置用于解决现有技术中测试质量差的技术问题。
为实现上述目的及其他相关目的,根据本发明的第一方面,本发明实施例提供一种存储系统的测试方法,该方法包括以下步骤:
获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件;
获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件;
当第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统的启动次数,生成测试结果;其中,所述第三日志文件是记录存储系统启动次数的日志文件。
可选地,该方法还包括:
当状态异常的硬盘标识数量大于或等于计数阈值时,生成第一警告信息,用于描述扩展链路产生异常。
可选地,该方法还包括:
当所述第一测试信息与所述第二测试信息相同时,在所述第三日志文件中增加启动标识以及进行关机,所述启动标识用于统计存储系统的启动次数。
可选地,该方法还包括:
对比第一参考文件和第二参考文件;
所述获取第一测试信息包括,当第一参考文件和第二参考文件相同时,获取第一测试信息;
所述获取第二测试信息包括,当第一参考文件和第二参考文件相同时,获取第二测试信息;
所述从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统的启动次数包括,当第一参考文件和第二参考文件相同,第一测试信息与第二测试信息不同,且第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统的启动次数,生成测试结果。
可选地,该方法还包括:
获取与主机柜通信连接的疲劳机发送的上电次数;
当所述上电次数大于所述存储系统的启动次数时,生成第二警告信息,用于描述存储系统上电后异常断电。
可选地,该方法还包括:
获取第一日志文件的第一记录时间,以及第二日志文件的第二记录时间;
当所述第二记录时间与所述第一记录时间的差值绝对值大于或等于时间阈值时,生成第三警告信息,用于描述存储系统上电异常。
根据本发明的第二方面,本发明实施例还提供一种存储系统的测试装置,该装置包括:
第一获取模块,用于获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件;
第二获取模块,用于获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件;
处理模块,用于当第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统的启动次数,生成测试结果;其中,所述第三日志文件是记录存储系统启动次数的日志文件。
可选地,所述处理模块还用于,当状态异常的硬盘标识数量大于或等于计数阈值时,生成第一警告信息,用于描述扩展柜链路产生异常。
可选地,所述处理模块还用于,
获取与主机柜通信连接的疲劳机发送的上电次数;
当所述上电次数大于所述存储系统重启次数时,生成第二警告信息,用于描述存储系统上电后异常断电。
可选地,所述处理模块还用于,
获取第一日志文件的第一记录时间,以及第二日志文件的第二记录时间;
当所述第二记录时间与所述第一记录时间的差值绝对值大于或等于时间阈值时,生成第三警告信息,用于描述存储系统上电异常。
如上所述,本发明实施例提供的一种存储系统的测试方法及装置,具有以下有益效果:通过获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件;获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件;当所述第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果;其中,所述第三日志文件是记录存储系统启动次数的日志文件。通过从日志文件中提取有效的测试信息,进行信息粗筛,再通过测试信息的对比,进行信息细筛,这样通过两次信息的筛选,能够有效获取更多存储系统的测试信息,提高了测试质量。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种存储系统的测试方法的流程示意图;
图2是本发明实施例提供的一种存储系统故障识别方法的流程示意图;
图3是本发明实施例提供的另一种存储系统故障识别方法的流程示意图;
图4是本发明实施例提供的另一种存储系统的测试方法的流程示意图;
图5是本发明实施例提供的一种存储系统的测试装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
请参阅图1至图5。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
在通常的架构中,存储系统由主机柜和扩展柜组成,主机柜可以与一个或多个扩展柜连接;其中,扩展柜中可以设置多个硬盘,所述多个硬盘组成磁盘阵列;主机柜对扩展柜中的磁盘阵列进行访问控制,主机柜与扩展柜可以通过通信线缆、或者总线相连。通过设置扩展柜,能够实现存储系统的扩容,以满足存储需求。
在存储系统测试过程中,通常需要对存储系统进行多次频繁启动。为了实现对存储系统的启动控制,在本发明实施例中还配置有一台或多台疲劳机,该疲劳机是能够实现定时上电和断电的设备;在一示例性实施例中,一台疲劳机可以与主机柜通信连接,具体地,可以通过通信总线或者通信线缆等实现疲劳机与主机柜的通信连接,这样该疲劳机能够检测到主机柜检测点的电压。扩展柜还可以连接有其他的疲劳机。在疲劳机正常工作时,首先进入断电状态;持续一固定时间后,再进入上电状态,实现对主机柜和扩展柜的供电,主机柜可以被配置为上电后自启动,从而方便测试流程的循环进行;上电达到一定时间之后,疲劳机再次进入断电状态,从而开始新的循环。而且,为了方便对存储系统进行测试,存储系统中的硬盘可以以RAID5方式配置为磁盘阵列。
当然,需要说明的是,上述存储系统以及相应的测试硬件环境仅是一示例性实施例,本发明实施例提供的测试方法及装置还可以应用于其他任意架构的存储系统及针对该测试系统搭建的测试硬件环境。
参见图1,是本发明实施例提供的一种存储系统的测试方法的流程示意图。该测试方法可以配置在主机柜上执行,或者其他与主机柜、疲劳机通信连接的终端上执行,如图1所示,本发明实施例示出了主机柜执行该测试方法的过程:
步骤S101:获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件。
在所述第一日志文件中可以携带有上一次存储系统启动后,识别和/或加载成功的硬盘的硬盘标识,以及硬盘在识别和/或加载失败时,所对应产生的状态异常信息。在一示例性实施例中,所述硬盘标识可以为“hdd sdb”、“hdd sdc”等,标识硬盘sdb、硬盘sdc等,所述状态异常信息可以为“sos”、“free”、“fail”等;当然,需要说明的是上述第一日志文件中所包含的内容仅是一示例性实施例,在具体实施时,可以包括任意其他形式的日志内容,在本发明实施例中不做限定。
而且,在首次执行该测试方法时,日志文件进行了首次保存,因此在具体实施时,可以对第一日志文件进行初始化,在首次执行该测试方法时,所述第一日志文件可以被配置为当前主机柜上电启动所保存的日志文件。而且,在后续执行该测试方法的过程中,对第一日志文件进行更新,这样第一日志文件就能够始终保持与上一次主机柜上电启动的日志文件一致。
进一步,从第一日志文件中提取出第一测试信息,在具体实施时,可以通过提取硬盘标识关键词和状态异常信息关键词的方式,完成第一测试信息的提取。以上述实施例所描述的第一日志文件为例,将硬盘标识关键词设置为“hdd”,就能够从第一日志文件中提取出所有的硬盘标识,可以将所述硬盘标识增加到所述第一测试信息中,或者,可以进一步统计,所述硬盘标识的数量,并以统计出的硬盘标识的数量增加到第一测试信息中;将“sos”或“free”作为状态异常信息关键词,从第一日志文件中能够提取出所有包括“sos”或“free”的信息行,该信息行中可以包括发生错误的硬盘的硬盘标识,并将提取到的硬盘标识增加到第一测试信息中。这样,通过对第一日志文件进行筛选,提取出识别和/或加载成功的硬盘的硬盘标识和数量,以及发生错误的、状态异常硬盘的硬盘标识,得到第一测试信息,有效提出了冗余信息,从而有效提高测试信息的对比效率,快速汇总结果,进而提高测试效率。
步骤S102:获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件。
所述第二日志文件可以理解为在当前主机柜上电启动后所保存的日志文件,所述第二日志文件的组织形式可以参见步骤S101中的描述,在此不再赘述。
而且,从第二日志文件中,提取第二测试信息的过程,也同样可以参见步骤S101的描述,在此不再赘述。
步骤S103:当所述第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果;其中,所述第三日志文件是记录存储系统启动次数的日志文件。
对比第一测试信息和第二测试信息,在具体实施时,可以通过使用“cmp”命令等实现第一测试信息和第二测试信息的对比,并且在第一测试信息与第二测试信息相同时,返回一固定的返回值,在第一测试信息与第二测试信息不同时,返回另外一个固定的返回值。
当第一测试信息和第二测试信息不同时,可以通过比对,确定发生错误、状态异常的硬盘所对应的硬盘标识。在与示例性实施中,第一测试信息可以为{“sdb”,“sdc”},第二测试信息可以为{“sdb”,“sdc”,“sdd sos”},第一测试信息与第二测试信息不同,而且第二测试信息中包括状态异常信息“sos”,可以通过对比,提取出第一测试信息与第二测试信息的不同之处即“sdd sos”,表明硬盘标识“sdd”所对应的硬盘出现了异常,可以在最后生成的测试结果中记录所出现异常的硬盘标识“sdd”。
为了对扩展柜的链路进行监控,从而保证存储系统的测试质量,在本发明实施例中,可以对状态异常的硬盘标识进行分析统计,具体过程如下:
在第一种实施情况下,在存储系统的连续测试过程中,可能由此会出现大量硬盘的状态异常,在此种情况下,通常对应存储系统中扩展柜与主机柜之间的链路发生了故障。在本发明实施例中,可以通过第一测试信息和第二测试信息的对比,确定状态异常的硬盘标识数量,例如通过对比,确定第一测试信息和第二测试信息的区别是“sdf sos”和“sdgsos”,则标识硬盘标识为“sdf”和“sdg”两块硬盘发生了状态异常,确定状态异常的硬盘标识数量为2。当状态异常的硬盘标识数量大于或等于计数阈值时,生成第一警告信息,其中,所述计数阈值可以为预设的数值,例如为20、30或者40等,在本发明实施中不做限定;当状态异常的硬盘标识数量大于或等于该计数阈值时,表示存在较多状态异常的硬盘,则生成第一警告信息,所述第一警告信息的形式可以为蜂鸣警报、或者显示屏幕上弹出的警告信息、或者记录在测试结果中用于描述扩展柜链路异常的标识例如“链路error”等,在本发明实施例中不做限定。
在第二种实施情况下,由于主机柜与扩展柜链路的异常,硬盘的状态异常消息,可能在不同硬盘上随机多次出现,为了识别该扩展链路异常,在本发明实施例中,可以在主机柜多次启动过程中,通过第一测试信息和第二测试信息的对比,确定状态异常信息出现的频度;当该频度大于或等于频度阈值时,生成第一警告信息,用于描述扩展柜链路异常。在一示例性实施例中,经过第二次启动,第一测试信息和第二测试信息对比,第二测试信息中出现状态异常信息;经过第三次启动,第二测试信息中没有出现状态异常信息;经过第四次启动,第二测试信息中再次出现状态异常信息;则在上述3次启动中,出现了2次状态异常信息;则状态异常信息出现的频度可以理解为出现次数2,或者出现的概率2/3。当该频度大于或等于频度阈值时,生成第一警告信息,该频度阈值可以为预设的任意数值,在本发明实施例中不做限定,而且,所述第一警告信息的组织形式可以参见上述实施例的描述,在此不再赘述。
为了统计存储系统的启动次数,从而方便测试人员分析存储系统发生的故障,在本发明实施例中,还可以对存储系统的启动次数进行统计,具体过程如下:
当所述第一测试信息与所述第二测试信息相同时,可以建立在所述第三日志文件中增加启动标识以及进行关机,所述启动标识用于统计存储系统的启动次数。
在一示例性实施例中,可以建立独立的第三日志文件,该第三日志文件可以存储在主机柜的系统硬盘中;当第一测试信息与第二测试信息相同时,则在第三日志文件中增加启动标识,该启动标识用于标记进行了一次存储系统启动,在一具体实施例中,该启动标识可以为“boot”等,这样每次统计第三日志文件中启动标识的数量,例如“boot”的数量,就可以计算得到存储系统启动的次数。
进一步地,当第一测试信息和第二测试信息不同,且第二测试信息中包括状态异常信息时,可以根据第三日志文件计算存储系统启动的次数,并将所述存储系统启动的次数增加到存储结果中,这样测试人员可以明确获知在第几次启动后,发生了存储系统故障,从而方便技术人员统计故障发生规律,提高测试质量。
主机柜在启动过程中,可能会发生异常断电,即主机柜上电后,较短的时间内,主机柜断电,而又继续进行新一轮启动,为了统计存储系统上电后异常断电,参见图2,是本发明实施例提供的一种存储系统故障识别方法的流程示意图,在本发明实施例中,该方法还可以包括以下步骤:
步骤S104:获取与主机柜通信连接的疲劳机发送的上电次数。
疲劳机与主机柜通信连接,这样,疲劳机能够实时监控主机柜检测点的电压,当检测点的电压从第一阈值上升到第二阈值,例如从0V上升到12V时,表示主机柜进行了上电,疲劳机能够统计每次电压的变化,从而得到上电次数。在正常情况下,主机柜正常启动,上电次数应该与主机柜的启动次数相等,由于主机柜时存储系统的核心控制部件,因此主机柜的启动次数与存储系统的启动次数相等,这样,所述上电次数应该等于存储系统的启动次数。在异常情况下,疲劳机可能会多次统计电压变化,而由于主机柜无法正常启动,无法得到新的日志文件,这样该上电次数通常会大于通过上述实施例所描述的通过分析第一测试信息和第二测试信息得到的存储系统的启动次数。
步骤S105:当所述上电次数大于所述存储系统的启动次数时,生成第二警告信息,用于描述存储系统上电后异常断电。
当上电次数大于存储系统的启动次数时,表示存储系统启动发生了异常,生成第二警告信息,该第二警告信息的组织形式可以参见上述实施例的描述,在此不再赘述。
在主机柜上电后可能无法正常关机时,这样在疲劳机完成计时,断电后,主机柜在进行关机,这样通常代表存储系统上电异常,为了识别存储系统的上电异常,参见图3,是本发明实施例提供的另一种存储系统故障识别方法的流程示意图,在本发明实施例中,该方法还可以包括以下步骤:
步骤S106:获取第一日志文件的第一记录时间,以及第二日志文件的第二记录时间。
在第一日志文件中携带有生成第一日志文件时的时间,即第一记录时间;在第二日志文件中携带有生成第二日志文件的时间,即第二记录时间。
步骤S107:当所述第二记录时间与所述第一记录时间的差值绝对值大于或等于时间阈值时,生成第三警告信息,用于描述存储系统上电异常。
计算第二记录时间与第一记录时间的差值,为了方便比较,在本发明实施例中,还对计算出的上述差值取绝对值,当该绝对值大于或等于时间阈值时,生成第三警告信息。其中,所述时间阈值可以为疲劳机的上电持续时间,即疲劳机进入上电状态,向外供电的时间;另外,所述第三警告信息的组织形式也可以参见上述实施例的描述,在此不再赘述。
另外,结合上面实施例的描述,该测试结果可以包括状态异常的硬盘标识、发生状态异常时存储系统的启动次数、第一警告信息、第二警告信息和第三警告信息中的任意一种或多种。
由上述实施例的描述可见,本发明实施例提供的一种存储系统的测试方法,通过获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件;获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件;当所述第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果;其中,所述第三日志文件是记录存储系统启动次数的日志文件。通过从日志文件中提取有效的测试信息,进行信息粗筛,再通过测试信息的对比,进行信息细筛,这样通过两次信息的筛选,能够有效获取更多存储系统的测试信息,提高了测试质量。
在执行存储系统的测试方法时,由于存储系统的测试环境需要调整,从而可能需要临时停止存储系统测试的进行,为了增加存储系统测试的灵活性,参见图4,是本发明实施例提供的另一种存储系统的测试方法的流程示意图。如图4所示,在图1所示的测试方法的基础上,本发明实施例的测试方法可以包括以下步骤:
步骤S201:对比第一参考文件和第二参考文件。
所述第一参考文件可以为预先编辑存储在主机柜系统盘中的文件,例如“1.log”;所述第二参考文件可以为预先编辑并存储在主机柜系统盘中的另一个文件,例如“2.log”。而且,所述第一参考文件和第二参考文件可以实时修改,并作为存储系统测试流程的触发条件。
步骤S202:当第一参考文件和第二参考文件相同时,获取第一测试信息。
当第一参考文件和第二参考文件相同时,获取第一测试信息;当第一参考文件和第二参考文件不同时,则停止执行后续步骤。
步骤S203:当第一参考文件和第二参考文件相同时,获取第二测试信息。
当第一参考文件和第二参考文件相同时,获取第二测试信息;当第一参考文件和第二参考文件不同时,则停止执行后续步骤。
步骤S204:当第一参考文件和第二参考文件相同,第一测试信息与第二测试信息不同,且第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果。
当第一参考文件和第二参考文件相同,第一测试信息与第二测试信息不同,且第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果;当第一参考文件和第二参考文件不同时,则停止执行后续步骤。
本发明实施例与上述实施例相同之处,可参见上述实施例的描述,在此不再赘述。
由上述实施例的描述可见,通过设置第一参考文件和第二参考文件,上述两个参考文件能够作为测试方法的触发条件,只有当第一参考文件和第二参考文件相同时,才会执行相应的测试方法流程;当需要随时停止测试时,可以随时修改第一参考文件和第二参考文件为不同的文件,有效提高到了存储系统的测试方法的灵活性。
通过以上的方法实施例的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
与本发明提供的存储系统的测试方法实施例相对应,本发明还提供了一种存储系统的测试装置。
参见图5,是本发明实施例提供的一种存储系统的测试装置的结构示意图。如图5所示,该装置包括:
第一获取模块11,用于获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件;
第二获取模块12,用于获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件;
处理模块13,用于当第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统的启动次数,生成测试结果;其中,所述第三日志文件是记录存储系统启动次数的日志文件。
为了对扩展柜的链路进行监控,从而保证存储系统的测试质量,在本发明实施例中,所述处理模块13还用于,当状态异常的硬盘标识数量大于或等于计数阈值时,生成第一警告信息,用于描述扩展柜链路异常。
为了统计存储系统的启动次数,从而方便测试人员分析存储系统发生的故障,在本发明实施例中,所述处理模块13还用于,当所述第一测试信息与所述第二测试信息相同时,在所述第三日志文件中增加启动标识以及进行关机,所述启动标识用于统计存储系统的启动次数。
主机柜在启动过程中,可能会发生异常断电,即主机柜上电后,较短的时间内,主机柜断电,而又继续进行新一轮启动,为了统计存储系统上电后异常断电,在本发明实施例中,所述处理模块13还用于,获取与主机柜通信连接的疲劳机发送的上电次数;当所述上电次数大于所述存储系统的启动次数时,生成第二警告信息,用于描述存储系统上电后异常断电。
在主机柜上电后可能无法正常关机时,这样在疲劳机完成计时,断电后,主机柜在进行关机,这样通常代表存储系统上电异常,为了识别存储系统的上电异常,在本发明实施例中,所述处理模块13还用于,获取第一日志文件的第一记录时间,以及第二日志文件的第二记录时间;当所述第二记录时间与所述第一记录时间的差值绝对值大于时间阈值时,生成第三警告信息,用于描述存储系统上电异常。
在执行存储系统的测试方法时,由于存储系统的测试环境需要调整,从而可能需要临时停止存储系统测试的进行,为了增加存储系统测试的灵活性,在图3所示的存储系统的测试装置的基础上,该装置还可以包括对比模块14,用于对比第一参考文件和第二参考文件;所述第一获取模块11,还用于当第一参考文件和第二参考文件相同时,获取第一测试信息;所述第二获取模块12,还用于当第一参考文件和第二参考文件相同时,获取第二测试信息;所述第三获取模块13,还用于当第一参考文件和第二参考文件相同,第一测试信息与第二测试信息不同,且第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果。
本发明实施例提供的存储系统的测试装置,具备上述方法实施例所描述的有益效果,未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的存储系统的测试方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种存储系统的测试方法,应用于主机柜,其特征在于,包括以下步骤:
获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件;
获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件;
当所述第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果;其中,所述第三日志文件是记录存储系统启动次数的日志文件;
在主机柜多次启动的过程中,通过第一测试信息和第二测试信息的对比,确定状态异常信息出现的频度,当频度大于或 等于频度阈值时,生成第一警告信息,用于描述扩展柜链路异常。
2.根据权利要求1所述的存储系统的测试方法,其特征在于,还包括:
当状态异常的硬盘标识数量大于或等于计数阈值时,生成第一警告信息,用于描述扩展柜链路异常。
3.根据权利要求1所述的存储系统的测试方法,其特征在于,还包括:
当所述第一测试信息与所述第二测试信息相同时,在所述第三日志文件中增加启动标识以及进行关机,所述启动标识用于统计存储系统的启动次数。
4.根据权利要求1所述的存储系统的测试方法,其特征在于,还包括:
对比第一参考文件和第二参考文件;
所述获取第一测试信息包括,当第一参考文件和第二参考文件相同时,获取第一测试信息;
所述获取第二测试信息包括,当第一参考文件和第二参考文件相同时,获取第二测试信息;
所述从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数包括,当第一参考文件和第二参考文件相同,第一测试信息与第二测试信息不同,且第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统启动次数,生成测试结果。
5.根据权利要求1所述的存储系统的测试方法,其特征在于,还包括:
获取与主机柜通信连接的疲劳机发送的上电次数;
当所述上电次数大于所述存储系统的启动次数时,生成第二警告信息,用于描述存储系统上电后异常断电。
6.根据权利要求1所述的存储系统的测试方法,其特征在于,还包括:
获取第一日志文件的第一记录时间,以及第二日志文件的第二记录时间;
当所述第二记录时间与所述第一记录时间的差值绝对值大于或等于时间阈值时,生成第三警告信息,用于描述存储系统上电异常。
7.一种存储系统的测试装置,其特征在于,包括:
第一获取模块,用于获取第一测试信息,所述第一测试信息包括从第一日志文件中获取的信息,且所述第一日志文件是上一次主机柜上电启动所保存的日志文件;
第二获取模块,用于获取第二测试信息,所述第二测试信息包括从第二日志文件中获取的信息,且所述第二日志文件是当前主机柜上电启动所保存的日志文件;
处理模块,用于当第一测试信息与所述第二测试信息不同,且所述第二测试信息包括状态异常信息时,从第二日志文件中获取状态异常的硬盘标识,以及从第三日志文件中获取存储系统的启动次数;其中,所述第三日志文件是记录存储系统启动次数的日志文件;在主机柜多次启动的过程中,通过第一测试信息和第二测试信息的对比,确定状态异常信息出现的频度,当频度大于或 等于频度阈值时,生成第一警告信息,用于描述扩展柜链路异常。
8.根据权利要求7所述的存储系统的测试装置,其特征在于,所述处理模块还用于,当状态异常的硬盘标识数量大于或等于计数阈值时,生成第一警告信息,用于描述扩展柜链路异常。
9.根据权利要求7所述的存储系统的测试装置,其特征在于,所述处理模块还用于,
获取与主机柜通信连接的疲劳机发送的上电次数;
当所述上电次数大于所述存储系统重启次数时,生成第二警告信息,用于描述存储系统上电后异常断电。
10.根据权利要求7所述的存储系统的测试装置,其特征在于,所述处理模块还用于,
获取第一日志文件的第一记录时间,以及第二日志文件的第二记录时间;
当所述第二记录时间与所述第一记录时间的差值绝对值大于或等于时间阈值时,生成第三警告信息,用于描述存储系统上电异常。
CN201710521347.4A 2017-06-30 2017-06-30 一种存储系统的测试方法及装置 Active CN107451003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710521347.4A CN107451003B (zh) 2017-06-30 2017-06-30 一种存储系统的测试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710521347.4A CN107451003B (zh) 2017-06-30 2017-06-30 一种存储系统的测试方法及装置

Publications (2)

Publication Number Publication Date
CN107451003A CN107451003A (zh) 2017-12-08
CN107451003B true CN107451003B (zh) 2021-03-12

Family

ID=60488497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710521347.4A Active CN107451003B (zh) 2017-06-30 2017-06-30 一种存储系统的测试方法及装置

Country Status (1)

Country Link
CN (1) CN107451003B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109324968B (zh) * 2018-09-26 2022-03-04 北京奇艺世纪科技有限公司 一种系统测试方法及装置
CN110147291A (zh) * 2019-03-29 2019-08-20 努比亚技术有限公司 终端及其日志管控方法、计算机可读存储介质
CN111899731A (zh) * 2020-06-16 2020-11-06 北京百度网讯科技有限公司 语音功能的稳定性测试方法、装置、设备和计算机存储介质
CN112799593A (zh) * 2021-02-01 2021-05-14 联想(北京)有限公司 一种处理方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法
CN105302681A (zh) * 2015-11-04 2016-02-03 浪潮电子信息产业股份有限公司 一种rack整机柜磁盘性能的自动化测试方法
CN106021048A (zh) * 2016-05-17 2016-10-12 浪潮电子信息产业股份有限公司 一种磁盘组乱序验证的方法及装置
CN106649018A (zh) * 2017-01-09 2017-05-10 郑州云海信息技术有限公司 一种带扩展柜的存储系统稳定性的测试方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7574624B2 (en) * 2007-02-20 2009-08-11 Inventec Corporation Integrated test method on multi-operating system platform
CN101763882B (zh) * 2009-11-26 2012-06-06 中兴通讯股份有限公司 一种磁盘阵列的监控方法及系统
CN106598794A (zh) * 2016-12-15 2017-04-26 郑州云海信息技术有限公司 一种存储系统硬盘的测试系统及测试方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法
CN105302681A (zh) * 2015-11-04 2016-02-03 浪潮电子信息产业股份有限公司 一种rack整机柜磁盘性能的自动化测试方法
CN106021048A (zh) * 2016-05-17 2016-10-12 浪潮电子信息产业股份有限公司 一种磁盘组乱序验证的方法及装置
CN106649018A (zh) * 2017-01-09 2017-05-10 郑州云海信息技术有限公司 一种带扩展柜的存储系统稳定性的测试方法

Also Published As

Publication number Publication date
CN107451003A (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
CN107451003B (zh) 一种存储系统的测试方法及装置
US9778988B2 (en) Power failure detection system and method
CN112732477B (zh) 一种带外自检故障隔离的方法
CN111327490B (zh) 区块链的拜占庭容错检测方法及相关装置
CN110992992A (zh) 一种硬盘测试方法、设备以及存储介质
CN112527582A (zh) 服务器线缆的检测方法、检测装置、检测设备及存储介质
CN113238930A (zh) 软件系统的测试方法、装置、终端设备和存储介质
CN111176897A (zh) 一种封闭式bios自修复方法、系统、终端及存储介质
CN114020432A (zh) 任务异常处理方法、装置及任务异常处理系统
US20120310849A1 (en) System and method for validating design of an electronic product
CN108920338A (zh) 一种指示文件系统状态的方法及终端
CN112307647A (zh) 充电桩通信中断的测试方法、装置、存储介质及处理器
CN111290893A (zh) 一种oses读取日志测试装置、方法、终端及存储介质
CN111176878A (zh) 一种服务器bbu备电诊断方法、系统、终端及存储介质
CN115373916A (zh) 异常检测方法、装置、电子设备及计算机可读存储介质
CN115328743A (zh) 安卓设备异常预警处理方法、系统和可读存储介质
CN110968456A (zh) 分布式存储系统中故障磁盘的处理方法及装置
CN111475378B (zh) 一种扩展器Expander的监控方法、装置及设备
CN113836152A (zh) 一种高效率数据一致性校验方法、装置及存储介质
CN113448786A (zh) 一种PCIe设备测试方法、装置、设备及可读存储介质
CN111475323A (zh) 电量消耗故障诊断的方法、装置、设备及计算机可读介质
Sankar et al. Soft failures in large datacenters
CN110544504A (zh) 一种关于内存adddc功能的测试方法、系统及设备
CN114978891B (zh) 网络设备bios配置的处理方法、设备及存储介质
CN112084085B (zh) 系统断电记录方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210219

Address after: Building 9, No.1, guanpu Road, Guoxiang street, Wuzhong Economic Development Zone, Wuzhong District, Suzhou City, Jiangsu Province

Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: Room 1601, 16 / F, 278 Xinyi Road, Zhengdong New District, Zhengzhou City, Henan Province 450018

Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant