CN113688017B - 多节点BeeGFS文件系统自动化异常测试方法及装置 - Google Patents

多节点BeeGFS文件系统自动化异常测试方法及装置 Download PDF

Info

Publication number
CN113688017B
CN113688017B CN202110844819.6A CN202110844819A CN113688017B CN 113688017 B CN113688017 B CN 113688017B CN 202110844819 A CN202110844819 A CN 202110844819A CN 113688017 B CN113688017 B CN 113688017B
Authority
CN
China
Prior art keywords
beegfs
target cluster
test
node
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110844819.6A
Other languages
English (en)
Other versions
CN113688017A (zh
Inventor
李选
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202110844819.6A priority Critical patent/CN113688017B/zh
Publication of CN113688017A publication Critical patent/CN113688017A/zh
Application granted granted Critical
Publication of CN113688017B publication Critical patent/CN113688017B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3414Workload generation, e.g. scripts, playback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3664Environments for testing or debugging software

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种多节点BeeGFS文件系统自动化异常测试方法及装置,所述方法步骤如下:设定BeeGFS文件系统所在集群为目标集群,配置测试环境,对各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;当环境检查正常时,在客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中。本发明实现BeeGFS文件系统自动化异常测试,测试效率高,降低人工成本,并避免了人为测试出现判断失误的问题。

Description

多节点BeeGFS文件系统自动化异常测试方法及装置
技术领域
本发明属于自动化测试技术领域,具体涉及一种多节点BeeGFS文件系统自动化异常测试方法及装置。
背景技术
IOPS,是Input Output Per Second的简称,每秒的输入输出量,又称吞吐量。Buddy mirror,是一种镜像名称。
BeeGFS,是一种并行群集文件系统,将用户数据透明地分布到多个服务器上,通过增加系统中的服务器和磁盘数量,可以简单地将文件系统的性能和容量扩展到所需要的级别。
随着信息化的高速发展,云计算、大数据随着计算规模的增加,存储逐渐成为系统的瓶颈,而并行文件系统BeeGFS可提供高带宽和IOPS,并且集群中元数据和存储节点可通过Buddy mirror实现数据备份冗余,BeeGFS产品除了功能和性能外,产品的数据安全性也至关重要,因此在出厂前需要对产品做各种异常测试并检测确保数据不丢失。
BeeGFS文系统正在写数据时需要人工对服务器做关机、重启、停止网口、停止元数据服务,待环境恢复正常后再检查数据是否有丢失。人工对服务器做关机、重启、停止网口和停止元数据服务需要投入大量的人力,且效率不高。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种多节点BeeGFS文件系统自动化异常测试方法及装置,是非常有必要的。
发明内容
针对现有技术的上述BeeGFS文系统正在写数据时需要人工对服务器进行繁琐的操作,需要投入大量的人力,效率不高的缺陷,本发明提供一种多节点BeeGFS文件系统自动化异常测试方法及装置,以解决上述技术问题。
第一方面,本发明提供一种多节点BeeGFS文件系统自动化异常测试方法,包括如下步骤:
S1.设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;
S2.当环境检查正常时,在目标集群客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;
S3.自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中。
进一步地,步骤S1具体步骤如下:
S11.设定BeeGFS文件系统所在集群为目标集群,设置目标集群中客户端可免密登录各节点;所述节点包括元数据节点和存储节点;
S12.对目标集群中各节点启动测试前的环境检查;
S13.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
S14.判断测试前的环境检查结果是否正常;
若是,进入步骤S2;
若否,进入步骤S15;
S15.在日志文件中记录环境检查异常的操作结果,退出异常测试。设置客户端可免密登录各节点,保证自动化异常测试的顺利进行,避免人工输入密码的繁琐和时间,提高自动化测试效率,测试前的环境检查保障自动化异常测试的顺利进行。
进一步地,步骤S13具体步骤如下:
S131.在目标集群客户端获取异常测试循环次数;
S132.目标集群客户端检查BeeGFS挂载点是否正常;
S133.目标集群客户端查询与集群中各节点的通信状态;
S134.目标集群客户端查询元数据节点的元数据是否正常;
S135.目标集群客户端检查主备元数据在线状态;
步骤S14中,当BeeGFS挂载点不正常,存在节点与客户端无法通信,存在某存储节点的元数据异常,主备元数据在线状态异常中出现任一种状况时,判定测试前的环境检查结果不正常,进入步骤S15。测试前的环境检查通过测试脚本实现,异常测试循环次数可通过客户端获取用户的输入,也可提前设定在测试脚本中。
进一步地,步骤S132中目标集群客户端检查BeeGFS挂载点是否正常;具体如下:
目标集群客户端检查BeeGFS挂载点是否状态正常,检查BeeGFS挂载点是否可正常访问,并在BeeGFS挂载点为正常挂载点,且BeeGFS挂载点可正常访问时,判定BeeGFS挂载点正常,以及在BeeGFS挂载点为非正常挂载点,或BeeGFS挂载点不可正常访问时,判定BeeGFS挂载点异常。BeeGFS挂载点正常首先BeeGFS挂载点需要状态正常,即挂载成功,还需要可以正常访问。
进一步地,步骤S12中,对目标集群中各节点启动测试前的环境检查之前还包括如下步骤:
在目标集群客户端获取异常测试循环次数;
目标集群客户端检查是否有正在运行的vdbench脚本;
若是,获取正在运行的vdbench脚本的进程号,并关闭该vdbench脚本对应vdbench进程,并记录操作结果到日志文件;
若否,进入步骤S12。保证自动化异常测试的循环次数准确,防止有正在进行的vdbench脚本对当前的自动化异常测试进行干扰。
进一步地,步骤S2具体步骤如下:
S21.当环境检查正常时,目标集群客户端执行异常自动化测试;
S22.目标集群客户端运行vdbench脚本向客户端BeeGFS挂载点写入数据;
S23.目标集群客户端判断写入数据持续时间是否达到设定时间段;
若是,进入步骤S24;
若否,返回步骤S23;
S24.执行异常操作步骤,并记录异常操作步骤至日志文件。向客户端BeeGFS挂载点写入数据达到设定时间段后,在仍然向向客户端BeeGFS挂载点写入数据的同时,执行异常操作步骤。
进一步地,所述异常操作步骤包对各节点进行关机、重启、关闭网口或停止元数据服务。异常操作步骤包括但不限于上述种类,执行异常操作步骤可对多节点BeeGFS文件系统安全性进行验证。
进一步地,步骤S24中,目标集群客户端对任一元数据节点执行异常操作步骤,或者对所有元数据节点同时执行异常操作步骤;
或者,目标集群客户端对任一存储节点执行异常操作步骤,或者对所有存储节点同时执行异常操作步骤。通过执行异常操作步骤,可对元数据节点及存储节点安全性进行分别验证。
进一步地,步骤S3具体步骤如下:
S31.执行异常操作步骤时间达到时间阈值时,执行异常操作步骤的相反操作,恢复BeeGFS文件系统;
S32.对目标集群中各节点启动二次测试环境检查;
S33.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
S34.判断二次测试环境检查结果是否正常;
若是,进入步骤S35;
若否,进入步骤S36;
S35.判断异常测试循环次数是否已完成;
若是,测试结束,输出日志文件;
若否,返回步骤S22;
S36.在日志文件中记录二次测试环境检查异常的操作结果,结束。异常操作步骤的相反操作,如步骤S24中执行的异常操作步骤为关机,则此时,步骤S31中,执行关机的相反操作即开机操作;若异常操作步骤为关闭网卡,则执行关闭网卡的相反操作及开启网卡操作;若异常操作步骤为停止元数据服务,则执行停止元数据服务的相反操作即开启元数据服务。
第二方面,本发明提供一种多节点BeeGFS文件系统自动化异常测试装置,包括:
测试环境检查模块,用于设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;
异常测试模块,用于当环境检查正常时,在目标集群客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;
二次测试环境检查模块,用于自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中。
进一步地,测试环境检查模块包括:
免密登录设置单元,用于设定BeeGFS文件系统所在集群为目标集群,设置目标集群中客户端可免密登录各节点;所述节点包括元数据节点和存储节点;
环境检查启动单元,用于对目标集群中各节点启动测试前的环境检查;
环境检查单元,用于检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
环境检查判断单元,用于判断测试前的环境检查结果是否正常;
环境检查异常记录单元,用于当测试前环境检查结果不正常时,在日志文件中记录环境检查异常的操作结果,退出异常测试。
进一步地,环境检查单元包括:
循环测试获取子单元,用于在目标集群客户端获取异常测试循环次数;
挂载点检查子单元,用于目标集群客户端检查BeeGFS挂载点是否正常;
通信状态检查子单元,用于目标集群客户端查询与集群中各节点的通信状态;
元数据查询子单元,用于目标集群客户端查询元数据节点的元数据是否正常;
元数据主备在线状态检查子单元,用于目标集群客户端检查主备元数据在线状态。
进一步地,异常测试模块包括:
异常自动化测试启动单元,用于当环境检查正常时,目标集群客户端执行异常自动化测试;
挂载点数据写入单元,用于目标集群客户端运行vdbench脚本向客户端BeeGFS挂载点写入数据;
写入时间判断单元,用于目标集群客户端判断写入数据持续时间是否达到设定时间段;
异常操作步骤执行单元,用于当写入持续时间达到设定时间段时,执行异常操作步骤,并记录异常操作步骤至日志文件。
进一步地,二次测试环境检查模块包括:
BeeGFS文件系统恢复单元,用于执行异常操作步骤时间达到时间阈值时,执行异常操作步骤的相反操作,恢复BeeGFS文件系统;
二次环境检查启动单元,用于对目标集群中各节点启动二次测试环境检查;
二次环境检查单元,用于检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
二次环境检查判断单元,用于判断二次测试环境检查结果是否正常;
循环次数判断单元,用于在二次环境检查结果正常时,判断异常测试循环次数是否已完成;
结果输出单元,用于在异常测试循环次数完成时,结束测试,输出日志文件;
二次环境检查异常记录单元,用于当二次环境检查结果不正常时,在日志文件中记录二次测试环境检查异常的操作结果。
本发明的有益效果在于,
本发明提供的多节点BeeGFS文件系统自动化异常测试方法及装置,实现BeeGFS文件系统自动化异常测试,测试效率高,降低人工成本,并避免了人为测试出现判断失误的问题。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明多节点BeeGFS文件系统自动化异常测试方法流程示意图一。
图2是本发明多节点BeeGFS文件系统自动化异常测试方法流程示意图二。
图3为本发明多节点BeeGFS文件系统自动化异常测试装置示意图。
图中,1-测试环境检查模块;1.1-免密登录设置单元;1.2-环境检查启动单元;1.3-环境检查单元;1.4-环境检查判断单元;1.5-环境检查异常记录单元;2-异常测试模块;2.1-异常自动化测试启动单元;2.2-挂载点数据写入单元;2.3-写入时间判断单元;2.4-异常操作步骤执行单元;3-二次测试环境检查模块;3.1-BeeGFS文件系统恢复单元;3.2-二次环境检查启动单元;3.3-二次环境检查单元;3.4-二次环境检查判断单元;3.5-循环次数判断单元;3.6-结果输出单元;3.7-二次环境检查异常记录单元。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
vdbench是一个I/O工作负载生成器,用于验证数据完整性和度量直接附加和网络连接的存储的性能。它是一个免费的工具,容易使用,而且常常用于测试和基准测试。可以使用vdbench测试磁盘和文件系统的读写性能。
实施例1:
如图1所示,本发明提供一种多节点BeeGFS文件系统自动化异常测试方法,包括如下步骤:
S1.设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;
S2.当环境检查正常时,在目标集群客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;
S3.自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中。
实施例2:
如图2所示,本发明提供一种多节点BeeGFS文件系统自动化异常测试方法,包括如下步骤:
S1.设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;具体步骤如下:
S11.设定BeeGFS文件系统所在集群为目标集群,设置目标集群中客户端可免密登录各节点;所述节点包括元数据节点和存储节点;
S12.对目标集群中各节点启动测试前的环境检查;
S13.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
S14.判断测试前的环境检查结果是否正常;
若是,进入步骤S2;
若否,进入步骤S15;
S15.在日志文件中记录环境检查异常的操作结果,退出异常测试;
S2.当环境检查正常时,在目标集群客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;具体步骤如下:
S21.当环境检查正常时,目标集群客户端执行异常自动化测试;
S22.目标集群客户端运行vdbench脚本向客户端BeeGFS挂载点写入数据;
S23.目标集群客户端判断写入数据持续时间是否达到设定时间段;
若是,进入步骤S24;
若否,返回步骤S23;
S24.执行异常操作步骤,并记录异常操作步骤至日志文件;
S3.自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中;具体步骤如下:
S31.执行异常操作步骤时间达到时间阈值时,执行异常操作步骤的相反操作,恢复BeeGFS文件系统;
S32.对目标集群中各节点启动二次测试环境检查;
S33.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
S34.判断二次测试环境检查结果是否正常;
若是,进入步骤S35;
若否,进入步骤S36;
S35.判断异常测试循环次数是否已完成;
若是,测试结束,输出日志文件;
若否,返回步骤S22;
S36.在日志文件中记录二次测试环境检查异常的操作结果,结束。
实施例3:
如图2所示,本发明提供一种多节点BeeGFS文件系统自动化异常测试方法,包括如下步骤:
S1.设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;具体步骤如下:
S11.设定BeeGFS文件系统所在集群为目标集群,设置目标集群中客户端可免密登录各节点;所述节点包括元数据节点和存储节点;
在目标集群客户端获取异常测试循环次数;
目标集群客户端检查是否有正在运行的vdbench脚本;
若是,获取正在运行的vdbench脚本的进程号,并关闭该vdbench脚本对应vdbench进程,并记录操作结果到日志文件;
若否,进入步骤S12;
S12.对目标集群中各节点启动测试前的环境检查;
S13.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;具体步骤如下:
S131.在目标集群客户端获取异常测试循环次数;如可设定异常测试循环次数为n;
S132.目标集群客户端检查BeeGFS挂载点是否正常;目标集群客户端检查BeeGFS挂载点是否正常;具体如下:
目标集群客户端检查BeeGFS挂载点是否状态正常,检查BeeGFS挂载点是否可正常访问,并在BeeGFS挂载点为正常挂载点,且BeeGFS挂载点可正常访问时,判定BeeGFS挂载点正常,以及在BeeGFS挂载点为非正常挂载点,或BeeGFS挂载点不可正常访问时,判定BeeGFS挂载点异常;通过mountpoint命令可检查BeeGFS挂载点是否正常;
S133.目标集群客户端查询与集群中各节点的通信状态;通过beegfs-check-servers命令查询客户端与集群中各个节点的通信状态;
S134.目标集群客户端查询元数据节点的元数据是否正常;通过beegfs-fsck--checkfs–readOnly命令查询元数据节点数据是否正常;
S135.目标集群客户端检查主备元数据在线状态;通过beegfs-ctl--listtargets--nodetype=meta--state--mirrorgroups检查元数据buddy mirror主备节点在线状态是否正常;
S14.判断测试前的环境检查结果是否正常;当BeeGFS挂载点不正常,存在节点与客户端无法通信,存在某存储节点的元数据异常,主备元数据在线状态异常中出现任一种状况时,判定测试前的环境检查结果不正常,进入步骤S15;
若是,进入步骤S2;
若否,进入步骤S15;
S15.在日志文件中记录环境检查异常的操作结果,退出异常测试;
S2.当环境检查正常时,在目标集群客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;具体步骤如下:
S21.当环境检查正常时,目标集群客户端执行异常自动化测试;
S22.目标集群客户端运行vdbench脚本向客户端BeeGFS挂载点写入数据;
S23.目标集群客户端判断写入数据持续时间是否达到设定时间段;
若是,进入步骤S24;
若否,返回步骤S23;
S24.执行异常操作步骤,并记录异常操作步骤至日志文件;所述异常操作步骤包对各节点进行关机、重启、关闭网口或停止元数据服务;目标集群客户端对任一元数据节点执行异常操作步骤,或者对所有元数据节点同时执行异常操作步骤;
或者,目标集群客户端对任一存储节点执行异常操作步骤,或者对所有存储节点同时执行异常操作步骤;
S3.自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中;具体步骤如下:
S31.执行异常操作步骤时间达到时间阈值时,执行异常操作步骤的相反操作,恢复BeeGFS文件系统;
S32.对目标集群中各节点启动二次测试环境检查;
S33.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
S34.判断二次测试环境检查结果是否正常;
若是,进入步骤S35;
若否,进入步骤S36;
S35.判断异常测试循环次数是否已完成;
若是,测试结束,输出日志文件;
若否,返回步骤S22;
S36.在日志文件中记录二次测试环境检查异常的操作结果,结束。
在上述实施例3中,以两个元数据节点通过Buddy mirror做镜像,两个存储节点通过Buddy mirror做镜像,目标集群客户端与元数据节点和存储节点配置免密登录,对存储节点和元数据节点进行自动化异常测试,测试存储节点及元数据节点的数据安全性;
步骤S24中,目标集群客户端对一个元数据节点,或者两个元数据节点执行关机、重启、停止管理服务监测心跳的网口、停止元数据服务;
或者,目标集群客户端对一个存储节点,或者两个存储节点执行关机、重启、停止管理服务监测心跳的网口、停止元数据服务。
实施例4:
如图3所示,本发明提供一种多节点BeeGFS文件系统自动化异常测试装置,包括:
测试环境检查模块1,用于设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;测试环境检查模块1包括:
免密登录设置单元1.1,用于设定BeeGFS文件系统所在集群为目标集群,设置目标集群中客户端可免密登录各节点;所述节点包括元数据节点和存储节点;
环境检查启动单元1.2,用于对目标集群中各节点启动测试前的环境检查;
环境检查单元1.3,用于检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;环境检查单元1.3包括:
循环测试获取子单元,用于在目标集群客户端获取异常测试循环次数;
挂载点检查子单元,用于目标集群客户端检查BeeGFS挂载点是否正常;
通信状态检查子单元,用于目标集群客户端查询与集群中各节点的通信状态;
元数据查询子单元,用于目标集群客户端查询元数据节点的元数据是否正常;
元数据主备在线状态检查子单元,用于目标集群客户端检查主备元数据在线状态;
环境检查判断单元1.4,用于判断测试前的环境检查结果是否正常;
环境检查异常记录单元1.5,用于当测试前环境检查结果不正常时,在日志文件中记录环境检查异常的操作结果;
异常测试模块2包括:
异常自动化测试启动单元2.1,用于当环境检查正常时,目标集群客户端执行异常自动化测试;
挂载点数据写入单元2.2,用于目标集群客户端运行vdbench脚本向客户端BeeGFS挂载点写入数据;
写入时间判断单元2.3,用于目标集群客户端判断写入数据持续时间是否达到设定时间段;
异常操作步骤执行单元2.4,用于当写入持续时间达到设定时间段时,执行异常操作步骤,并记录异常操作步骤至日志文件;
二次测试环境检查模块3,用于自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中;二次测试环境检查模块3包括:
BeeGFS文件系统恢复单元3.1,用于执行异常操作步骤时间达到时间阈值时,执行异常操作步骤的相反操作,恢复BeeGFS文件系统;
二次环境检查启动单元3.2,用于对目标集群中各节点启动二次测试环境检查;
二次环境检查单元3.3,用于检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
二次环境检查判断单元3.4,用于判断二次测试环境检查结果是否正常;
循环次数判断单元3.5,用于在二次环境检查结果正常时,判断异常测试循环次数是否已完成;
结果输出单元3.6,用于在异常测试循环次数完成时,结束测试,输出日志文件;
二次环境检查异常记录单元3.7,用于当二次环境检查结果不正常时,在日志文件中记录二次测试环境检查异常的操作结果。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (6)

1.一种多节点BeeGFS文件系统自动化异常测试方法,其特征在于,包括如下步骤:
S1.设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;步骤S1具体步骤如下:
S11.设定BeeGFS文件系统所在集群为目标集群,设置目标集群中客户端可免密登录各节点;所述节点包括元数据节点和存储节点;
S12.对目标集群中各节点启动测试前的环境检查;步骤S12中,对目标集群中各节点启动测试前的环境检查之前还包括如下步骤:
在目标集群客户端获取异常测试循环次数;
目标集群客户端检查是否有正在运行的vdbench脚本;
若是,获取正在运行的vdbench脚本的进程号,并关闭该vdbench脚本对应vdbench进程,并记录操作结果到日志文件;
若否,进入步骤S12;
S13.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
S14.判断测试前的环境检查结果是否正常;
若是,进入步骤S2;
若否,进入步骤S15;
S15.在日志文件中记录环境检查异常的操作结果,退出异常测试;
S2.当环境检查正常时,在目标集群客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;步骤S2具体步骤如下:
S21.当环境检查正常时,目标集群客户端执行异常自动化测试;
S22.目标集群客户端运行vdbench脚本向客户端BeeGFS挂载点写入数据;
S23.目标集群客户端判断写入数据持续时间是否达到设定时间段;
若是,进入步骤S24;
若否,返回步骤S23;
S24.执行异常操作步骤,并记录异常操作步骤至日志文件;所述异常操作步骤包对各节点进行关机、重启、关闭网口或停止元数据服务;
S3.自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中。
2.如权利要求1所述的多节点BeeGFS文件系统自动化异常测试方法,其特征在于,步骤S13具体步骤如下:
S131.在目标集群客户端获取异常测试循环次数;
S132.目标集群客户端检查BeeGFS挂载点是否正常;
S133.目标集群客户端查询与集群中各节点的通信状态;
S134.目标集群客户端查询元数据节点的元数据是否正常;
S135.目标集群客户端检查主备元数据在线状态;
步骤S14中,当BeeGFS挂载点不正常,存在节点与客户端无法通信,存在某存储节点的元数据异常,主备元数据在线状态异常中出现任一种状况时,判定测试前的环境检查结果不正常,进入步骤S15。
3.如权利要求2所述的多节点BeeGFS文件系统自动化异常测试方法,其特征在于,步骤S132中目标集群客户端检查BeeGFS挂载点是否正常;具体如下:
目标集群客户端检查BeeGFS挂载点是否状态正常,检查BeeGFS挂载点是否可正常访问,并在BeeGFS挂载点为正常挂载点,且BeeGFS挂载点可正常访问时,判定BeeGFS挂载点正常,以及在BeeGFS挂载点为非正常挂载点,或BeeGFS挂载点不可正常访问时,判定BeeGFS挂载点异常。
4.如权利要求1所述的多节点BeeGFS文件系统自动化异常测试方法,其特征在于,步骤S24中,目标集群客户端对任一元数据节点执行异常操作步骤,或者对所有元数据节点同时执行异常操作步骤;
或者,目标集群客户端对任一存储节点执行异常操作步骤,或者对所有存储节点同时执行异常操作步骤。
5.如权利要求1所述的多节点BeeGFS文件系统自动化异常测试方法,其特征在于,步骤S3具体步骤如下:
S31.执行异常操作步骤时间达到时间阈值时,执行异常操作步骤的相反操作,恢复BeeGFS文件系统;
S32.对目标集群中各节点启动二次测试环境检查;
S33.检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
S34.判断二次测试环境检查结果是否正常;
若是,进入步骤S35;
若否,进入步骤S36;
S35.判断异常测试循环次数是否已完成;
若是,测试结束,输出日志文件;
若否,返回步骤S22;
S36.在日志文件中记录二次测试环境检查异常的操作结果,结束。
6.一种多节点BeeGFS文件系统自动化异常测试装置,其特征在于,包括:
测试环境检查模块(1),用于设定BeeGFS文件系统所在集群为目标集群,配置目标集群的测试环境,对目标集群中各节点进行环境检查,并当环境检查异常时记录操作结果至日志文件中;测试环境检查模块包括:
免密登录设置单元,用于设定BeeGFS文件系统所在集群为目标集群,设置目标集群中客户端可免密登录各节点;所述节点包括元数据节点和存储节点;
环境检查启动单元,用于对目标集群中各节点启动测试前的环境检查;对目标集群中各节点启动测试前的环境检查之前还包括如下步骤:
在目标集群客户端获取异常测试循环次数;
目标集群客户端检查是否有正在运行的vdbench脚本;
若是,获取正在运行的vdbench脚本的进程号,并关闭该vdbench脚本对应vdbench进程,并记录操作结果到日志文件;
环境检查单元,用于检查BeeGFS挂载点是否正常,检查目标集群客户端与各节点的通信状态是否正常,检查各元数据节点是否正常;
环境检查判断单元,用于判断测试前的环境检查结果是否正常;
环境检查异常记录单元,用于当测试前环境检查结果不正常时,在日志文件中记录环境检查异常的操作结果,退出异常测试;
异常测试模块(2),用于当环境检查正常时,在目标集群客户端执行自动化异常测试,在向客户端BeeGFS挂载点写入数据持续设定时间段后,执行异常操作步骤,并记录异常操作步骤至日志文件中;异常测试模块包括:
异常自动化测试启动单元,用于当环境检查正常时,目标集群客户端执行异常自动化测试;
挂载点数据写入单元,用于目标集群客户端运行vdbench脚本向客户端BeeGFS挂载点写入数据;
写入时间判断单元,用于目标集群客户端判断写入数据持续时间是否达到设定时间段;
异常操作步骤执行单元,用于当写入持续时间达到设定时间段时,执行异常操作步骤,并记录异常操作步骤至日志文件;所述异常操作步骤包对各节点进行关机、重启、关闭网口或停止元数据服务;
二次测试环境检查模块(3),用于自动化异常测试结束后,恢复BeeGFS文件系统,对目标集群中各节点进行二次测试环境检查,并将检查结果记录至日志文件中。
CN202110844819.6A 2021-07-26 2021-07-26 多节点BeeGFS文件系统自动化异常测试方法及装置 Active CN113688017B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110844819.6A CN113688017B (zh) 2021-07-26 2021-07-26 多节点BeeGFS文件系统自动化异常测试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110844819.6A CN113688017B (zh) 2021-07-26 2021-07-26 多节点BeeGFS文件系统自动化异常测试方法及装置

Publications (2)

Publication Number Publication Date
CN113688017A CN113688017A (zh) 2021-11-23
CN113688017B true CN113688017B (zh) 2023-12-22

Family

ID=78578100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110844819.6A Active CN113688017B (zh) 2021-07-26 2021-07-26 多节点BeeGFS文件系统自动化异常测试方法及装置

Country Status (1)

Country Link
CN (1) CN113688017B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10073763B1 (en) * 2017-12-27 2018-09-11 Accenture Global Solutions Limited Touchless testing platform
CN111209188A (zh) * 2019-12-26 2020-05-29 曙光信息产业股份有限公司 一种分布式存储系统的测试方法和装置
CN111258681A (zh) * 2020-02-16 2020-06-09 苏州浪潮智能科技有限公司 一种BeeGFS服务启动方法和装置
CN112148542A (zh) * 2020-09-22 2020-12-29 江苏安超云软件有限公司 一种分布式存储集群的可靠性测试方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10073763B1 (en) * 2017-12-27 2018-09-11 Accenture Global Solutions Limited Touchless testing platform
CN111209188A (zh) * 2019-12-26 2020-05-29 曙光信息产业股份有限公司 一种分布式存储系统的测试方法和装置
CN111258681A (zh) * 2020-02-16 2020-06-09 苏州浪潮智能科技有限公司 一种BeeGFS服务启动方法和装置
CN112148542A (zh) * 2020-09-22 2020-12-29 江苏安超云软件有限公司 一种分布式存储集群的可靠性测试方法、装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ceph云存储中基于混合文件系统的读写性能优化方法;刘辉勇;王勇;俸皓;;微电子学与计算机(05);全文 *

Also Published As

Publication number Publication date
CN113688017A (zh) 2021-11-23

Similar Documents

Publication Publication Date Title
US9569325B2 (en) Method and system for automated test and result comparison
US8806037B1 (en) Remote support automation for a storage server
CN109120522B (zh) 一种多路径状态监测方法及装置
CN108959045B (zh) 一种nas集群故障切换性能的测试方法和系统
US20020002448A1 (en) Means for incorporating software into avilability models
CN105553783A (zh) 一种配置双机资源切换的自动化测试方法
CN109144789A (zh) 一种重启osd的方法、装置及系统
CN110063042A (zh) 一种数据库故障的响应方法及其终端
CN110291505A (zh) 减少应用的恢复时间
US7428655B2 (en) Smart card for high-availability clustering
Broadwell Response time as a performability metric for online services
CN110750445A (zh) 一种yarn组件高可用性功能的测试方法、系统及设备
US20190303233A1 (en) Automatically Detecting Time-Of-Fault Bugs in Cloud Systems
Tang et al. Availability measurement and modeling for an application server
CN113688017B (zh) 多节点BeeGFS文件系统自动化异常测试方法及装置
CN111124724B (zh) 一种分布式块存储系统的节点故障测试方法及装置
CN107562565A (zh) 一种验证内存Patrol Scurb功能的方法
CN104158843A (zh) 分布式文件存储系统的存储单元失效检测方法及装置
US6990609B2 (en) System and method for isolating faults in a network
CN110515757A (zh) 分布式存储系统的信息处理方法、装置、服务器、介质
CN110287066B (zh) 一种服务器分区迁移方法及相关装置
Corsava et al. Intelligent architecture for automatic resource allocation in computer clusters
CN115237641A (zh) 故障检测的方法、装置、电子设备和可读介质
CN106909489B (zh) 一种测试EventLog状态的方法及装置
CN111459734A (zh) 一种故障监控周期的测试方法、系统及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant