CN111897684B - 磁盘故障模拟测试的方法、装置及电子设备 - Google Patents

磁盘故障模拟测试的方法、装置及电子设备 Download PDF

Info

Publication number
CN111897684B
CN111897684B CN202010683397.4A CN202010683397A CN111897684B CN 111897684 B CN111897684 B CN 111897684B CN 202010683397 A CN202010683397 A CN 202010683397A CN 111897684 B CN111897684 B CN 111897684B
Authority
CN
China
Prior art keywords
disk
objective function
target
time delay
delay control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010683397.4A
Other languages
English (en)
Other versions
CN111897684A (zh
Inventor
宋弘毅
郑彩平
姜旭
刘成科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010683397.4A priority Critical patent/CN111897684B/zh
Publication of CN111897684A publication Critical patent/CN111897684A/zh
Application granted granted Critical
Publication of CN111897684B publication Critical patent/CN111897684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种磁盘故障模拟测试的方法、装置及电子设备。上述方法包括获取用于访问目标磁盘的目标函数的状态。根据目标函数的状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数。基于修改后的目标函数访问目标磁盘,以对目标磁盘的故障进行模拟测试。

Description

磁盘故障模拟测试的方法、装置及电子设备
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种磁盘故障模拟测试的方法、装置及电子设备。
背景技术
磁盘作为终端设备或者服务器的核心存储硬件,绝大多数用户数据及运行软件都基于磁盘对外提供服务,其稳定性与安全性直接影响上层业务的连续性与一致性。在存储领域中,无论是集中式存储架构还是分布式存储架构,其上层存储软件的正常运行及处理效率均依赖稳定、健康的硬件环境。然而,受使用年限、自身质量以及人为操作等因素干扰,由磁盘引发的硬件故障层出不穷,磁盘问题已经逐渐成为引起大型机与集群故障的头号威胁。
在实现本公开构思的过程中,发明人发现现有技术中至少存在如下问题:磁盘的大部分故障可由存储软件的健康监测机制进行自动隔离处理,但是以慢盘、输入输出(IO)抖动现象为代表的亚健康类故障受故障现象不明显所限制,存储软件往往难以识别并无法选择合适的处理逻辑。由于磁盘亚健康现象是一个偶发现象,主要由硬件故障造成,而这类硬件故障本身是难以复现的,因此如何针对磁盘的亚健康类故障进行模拟复现以对磁盘故障进行测试成为亟需解决的技术问题。
发明内容
有鉴于此,本公开提供了一种磁盘故障模拟测试的方法、装置及电子设备。
本公开的第一个方面提供了一种磁盘故障模拟测试的方法。上述方法包括:获取用于访问目标磁盘的目标函数的状态。上述方法还包括:根据所述状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数。上述方法还包括:基于修改后的目标函数访问目标磁盘,以对目标磁盘的故障进行模拟测试。
根据本公开的实施例,根据所述状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数包括:当目标函数的状态为执行完访问操作时,在目标函数中添加时间延迟控制参数;以及编译添加时间延迟控制参数的目标函数,得到修改后的目标函数。
根据本公开的实施例,上述方法还包括生成时间延迟控制参数的操作。该生成时间延迟控制参数的操作可以包括:基于获取的随机数生成时间延迟控制参数;或者,构建用于模拟磁盘故障发生的随机模型,并基于所述随机模型生成时间延迟控制参数。
根据本公开的实施例,上述磁盘故障模拟测试的方法还包括:确定目标函数要访问的磁盘是否为目标磁盘。上述确定目标函数要访问的磁盘是否为目标磁盘包括:获取目标函数要访问的磁盘的磁盘标识符(dev)和索引节点(inode);以及根据获取的磁盘标识符和索引节点确定目标函数要访问的磁盘是否为目标磁盘。
根据本公开的实施例,上述磁盘故障模拟测试的方法还包括:在目标磁盘创建至少一个压力进程。上述至少一个压力进程使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
根据本公开的实施例,上述访问包括读写,至少一个压力进程对目标磁盘进行读写的区域为磁盘预留出的不涉及磁盘业务数据的空闲区域。或者,预先在目标磁盘的系统内核(system kemel)的文件系统(file system)创建数据文件(data file),以供上述至少一个压力进程进行访问。
根据本公开的实施例,上述磁盘故障模拟测试的方法还包括:确定目标磁盘中是否存在文件系统。如果确定目标磁盘中存在文件系统,则设定目标磁盘的写缓存的使用率的上限为第一阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。如果确定目标磁盘中不存在文件系统,则设定目标磁盘的输入输出速率的上限为第二阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
本公开的第二个方面提供了一种磁盘故障模拟测试的装置。上述装置包括:目标函数状态获取模块、延时添加模块以及磁盘模拟测试模块。上述目标函数状态获取模块用于获取用于访问目标磁盘的目标函数的状态。上述延时添加模块用于根据所述状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数。其中,时间延迟控制参数用于控制目标函数在执行用于访问目标磁盘的操作后延迟预定时间。上述磁盘模拟测试模块用于基于修改后的目标函数访问目标磁盘,以便对目标磁盘的故障进行模拟测试。
根据本公开的实施例,上述磁盘故障模拟测试的装置还包括:目标磁盘确定模块。该目标磁盘确定模块包括:磁盘信息获取子模块和目标磁盘确定子模块。磁盘信息获取子模块用于获取目标函数要防问的磁盘的磁盘标识符(dev)和索引节点(inode)。目标磁盘确定子模块用于根据获取的磁盘标识符和索引节点确定目标函数要访问的磁盘是否为目标磁盘。
根据本公开的实施例,上述磁盘故障模拟测试的装置还包括:压力进程创建模块。上述压力进程创建模块用于在目标磁盘创建至少一个压力进程。上述至少一个压力进程使得目标磁盘的磁盘业务数据进行读写占据的带宽比率低于预设带宽比率,使得磁盘业务数据的带宽被挤占,以模拟磁盘资源异常。
根据本公开的实施例,上述磁盘故障模拟测试的装置还包括:文件系统确定模块、写缓存限制模块和输入输出速率限制模块。上述文件系统确定模块用于确定目标磁盘中是否存在文件系统。上述写缓存限制模块用于在确定目标磁盘中存在文件系统的情况下,设定目标磁盘的写缓存的使用率的上限为第一阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。上述输入输出速率限制模块用于在确定目标磁盘中不存在文件系统的情况下,设定目标磁盘的输入输出速率的上限为第二阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
本公开的第三个方面提供了一种电子设备。上述电子设备包括:一个或多个处理器;以及用于存储一个或多个程序的存储装置。其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述提及的任一种方法。
本公开的第四个方面提供了一种计算机可读存储介质。该计算机可读存储介质上存储有可执行指令,该指令被处理器执行时使处理器实现上述提及的任一种方法。
根据本公开的实施例,通过在用于访问目标磁盘的目标函数中添加时间延迟控制参数得到修改后的目标函数,基于修改后的目标函数对目标磁盘进行访问,从而可以在不破坏磁盘的情况下模拟出磁盘输入输出抖动的情况并进行测试。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的磁盘故障模拟测试的方法、装置及电子设备的应用场景;
图2示意性示出了根据本公开实施例的磁盘故障模拟测试的方法的流程图;
图3示意性示出了根据本公开实施例的操作S12的详细实施流程图;
图4示意出示出了根据本公开另一实施例的磁盘故障模拟测试的方法的流程图;
图5示意性示出了根据本公开实施例的确定目标函数要访问的磁盘是否为目标磁盘的详细实施流程图;
图6示意性示出了根据本公开实施例的操作S102的详细实施流程图;
图7示意性示出了根据本公开又一实施例的磁盘故障模拟测试的方法的流程图;
图8示意性示出了根据本公开再一实施例的磁盘故障模拟测试的方法流程图;
图9示意性示出了根据本公开实施例的磁盘故障模拟测试的装置的结构框图;
图10示意性示出了根据本公开另一实施例的磁盘故障模拟测试的装置的结构框图;以及
图11示意性示出了根据本公开实施例的电子设备的结构框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种磁盘故障模拟测试的方法、装置及电子设备。上述方法包括获取用于访问目标磁盘的目标函数的状态。根据所述状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数。其中,时间延迟控制参数用于控制目标函数在执行用于访问目标磁盘的操作后延迟预定时间。基于修改后的目标函数访问目标磁盘,以对目标磁盘的故障进行模拟测试。
下面结合图1来描述本公开实施例的磁盘故障模拟测试的方法、装置及电子设备的示例性应用场景。
图1示意性示出了根据本公开实施例的磁盘故障模拟测试的方法、装置及电子设备的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
参照图1所示,在终端设备100和服务器200的内部均设置有用于存储的磁盘,各种用户数据通过存储软件对磁盘进行访问操作,从而实现数据的读写过程或者缓存等。
终端设备100可以是手机101、平板电脑102、笔记本电脑103或者台式计算机等具有用于存储的磁盘的设备。终端设备上可以安装有各种客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
服务器200可以是提供各种服务的服务器。例如是对上述终端设备100所浏览的网站提供支持的后台管理服务器,或者对所述终端设备上的各种软件的更新或者软件上的用户数据、服务内容等提供数据库的服务器。
磁盘的大部分故障可由存储软件的健康监测机制进行自动隔离处理,但是以慢盘、输入输出(IO)抖动现象为代表的亚健康类故障较难被存储软件识别,导致存储软件无法选择合适的处理逻辑。
在集中式存储架构中,少数磁盘的亚健康类故障将拖累整台服务器节点对外提供服务的性能,需要耗费大量的人力和时间成本来定位故障位置与原因,浪费大量的运行维护资源。在分布式存储架构中,受多副本容灾机制的影响,少数磁盘节点的亚健康故障将会导致集群整体IO的异常,这一点在集群写操作上尤为明显。因此磁盘的亚健康类故障的发现和检测对于终端设备及服务器的存储性能有着至关重要的影响。
由于磁盘亚健康现象是一个偶发现象,主要由硬件故障造成,而这类硬件故障本身是难以复现的,因此如何针对磁盘的亚健康类故障进行模拟复现以对磁盘故障进行测试成为亟需解决的技术问题。
特别的,受安全性、稳定性及总所有成本(TCO)的影响,目前全球大部分数据中心的服务器已经开始向Linux平台转移,为防止磁盘的亚健康类故障问题对生产业务造成的不良影响,本公开实施例的磁盘故障模拟测试的方法可以适用于Linux环境下的磁盘故障模拟测试。
当然,本公开实施例的磁盘故障模拟测试的方法、装置及电子设备不仅仅可以适用于上述应用场景,其他应用场景或者语言环境下只要采用本公开的技术构思均在本公开的保护范围之内。
本公开的第一个示例性实施例提供了一种磁盘故障模拟测试的方法。本实施例中针对磁盘的输入输出抖动的亚健康类故障进行模拟以便测试。
图2示意性示出了根据本公开实施例的磁盘故障模拟测试的方法的流程图。
参照图2中实线框所示,本公开实施例的磁盘故障模拟测试的方法包括以下操作:S11、S12和S13。
在操作S11,获取用于访问目标磁盘的目标函数的状态。
在操作S12,根据所述状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数。
其中,时间延迟控制参数用于控制目标函数在执行用于访问目标磁盘的操作后延迟预定时间。
在操作S13,基于修改后的目标函数访问目标磁盘,以对目标磁盘的故障进行模拟测试。
磁盘的输入输出抖动的故障问题可描述为:上层应用访问磁盘的数据存储模块中的存储数据时,磁盘每秒的输入输出量(IOPS)(也可以称为读写次数)出现持续且无法自收敛的震荡现象。由于此时磁盘并非处于IO完全无法响应的状态,因此现有的运行监控难以判断此时磁盘是否出现故障。但是IOPS持续高频抖动带来的是业务进程的平均IO延时上升,总体流量下降等负面影响,严重时将会成为整个系统的性能瓶颈,进而拖慢整个存储集群。
Linux系统中,大部分应用均通过文件系统(file system)对磁盘进行IO访问,依赖系统内核(kernel)提供vfs函数对文件进行访问/读写操作。在未开启直接输入输出(Direct IO)模式下,应用程序对磁盘的读写均通过页高速缓存存储器(Page Cache)进行缓存加速。在Linux系统中读写文件时,基于页高速缓存存储器缓存文件的逻辑内容,从而加快对于磁盘上映像和数据的访问。存储软件基于上述vsf函数对磁盘进行访问以便读取磁盘文件中的用户数据,或者将用户数据写入至磁盘文件中,或者缓存用户数据。用于读写磁盘文件的函数为vfs_write函数和vfs_read函数。存储软件调用vfs_write函数,基于vfs_write函数执行数据的写入操作,vfs_write函数将数据写入页高速缓存存储器中后立即把写入结果返回给存储软件。这一过程中,数据从页高速缓存存储器加载到实际在磁盘的存储模块实现写入是一个异步调用过程。
基于vfs_read函数对磁盘进行读取操作的流程与上述写入的流程相似,存储软件调用vfs_read函数,基于vfs_read函数查询页高速缓存存储器中是否有缓存数据,若未找到,再去查询磁盘。
基于上述分析,本公开的实施例通过在目标函数执行用于访问目标磁盘的操作之后不立即返回,即不是在执行完读写操作之后立即将读写结果返回至存储软件,而是在访问操作完成后延迟预定的时间,然后才返回。上述延迟的时间可以通过构建不同的数学模型来调整,从而模拟不同故障引起的磁盘IO抖动的故障。比如可以构建在一段时间符合高斯分布的随机抖动模型,或是周期性变化的抖动模型等。
根据本公开的实施例,可以利用内核探针(K-probe)来获取目标函数的状态,上述目标函数指的是用于访问目标磁盘的函数。内核探针可以在不破坏系统运行状态的前提下安全的跟踪运行中内核的任意函数或运行中内核执行的指令。
图3示意性示出了根据本公开实施例的操作S12的详细实施流程图。
根据本公开的实施例,参照图3所示,根据所述状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数的操作S12包括以下操作:S121和S122。
在操作S121,当目标函数的状态为执行完访问操作时,在目标函数中添加时间延迟控制参数。
在操作S122,编译添加时间延迟控制参数的目标函数,得到修改后的目标函数。
操作S12中,实质上是根据目标函数的状态确定添加时间延迟控制参数的时机。如果目标函数的状态为开始执行访问操作或者执行访问操作的过程中,则不需要在目标函数中添加时间延迟控制参数。如果目标函数的状态为执行完访问操作,则需要在目标函数中添加时间延迟控制参数。该时间延迟控制参数用于控制目标函数在执行用于访问目标磁盘的操作(用于访问目标磁盘的操作可以简化描述为访问操作)后延迟预定时间。
在需要在目标函数中添加时间延迟控制参数的情况下,在目标函数中添加时间延迟控制参数,以得到修改后的目标函数。添加时间延迟控制参数的方式可以是:在目标函数中加入一段功能性的程序代码,上述功能性的程序代码具有控制时间延迟的功能。然后将加入控制时间延迟功能的程序代码的目标函数进行编译得到生效的修改后的目标函数。
然后基于修改后的目标函数访问目标磁盘,以对目标磁盘的故障进行模拟测试。
在一场景中,例如对目标磁盘的IO抖动故障进行模拟测试,控制目标磁盘在预定的时间段内发生IO抖动故障,在目标函数中添加时间延迟控制参数的添加时机也是处于上述预定的时间段内,在上述预定的时间段内的任意时刻才允许对目标函数添加时间延迟控制参数,超出预定的时间段不允许对目标磁盘添加时间延迟控制参数。可以理解的是,这里结合场景的介绍是为了说明模拟目标磁盘IO抖动的发生时间段。具体在操作S12中根据目标函数的状态确定添加时间延迟控制参数的时机参见前述的介绍,在目标函数的状态为执行完访问操作后,需要对目标函数添加时间延迟控制参数。
上述方法通过在用于访问目标磁盘的目标函数中添加时间延迟控制参数得到修改后的目标函数,基于修改后的目标函数对目标磁盘进行访问,可在受控时间段内向指定的目标磁盘注入预先设计的延迟时间。在未损坏用户数据且不破坏目标磁盘的文件系统运行状态的前提下模拟磁盘IO抖动现象,为存储模块应对磁盘亚健康故障提供有效的测试场景,为复现磁盘亚健康故障提供了可靠有效的工具。
图4示意出示出了根据本公开另一实施例的磁盘故障模拟测试的方法的流程图。
根据本公开的实施例,参照图4中虚线框所示,上述磁盘故障模拟测试的方法除了包括上述操作S11、S12和S13之外,还包括操作S101,确定目标函数要访问的磁盘是否为目标磁盘。
图5示意性示出了根据本公开实施例的确定目标函数要访问的磁盘是否为目标磁盘的详细实施流程图。
参照图5所示,上述确定目标函数要访问的磁盘是否为目标磁盘的操作S10可以包括以下子操作:S101a和S101b。
在子操作S101a,获取目标函数要访问的磁盘的磁盘标识符(dev)和索引节点(inode)。
根据本公开的实施例,可以利用内核探针获取目标函数要访问的磁盘的磁盘标识符和索引节点。在本公开的其它的实施例中,获取磁盘标识符和索引节点的方式可以是其他方式,不局限于本实施例。
根据本公开的实施例,上述索引节点包含文件的元信息。文件的元信息包括以下信息至少一种:文件的字节数、文件拥有者的用户ID、文件的群组ID,文件的读、写、执行权限,文件的时间戳、链接数以及文件数据块的位置。文件的时间戳有三个:ctime、mtime和atime,ctime指的是索引节点上一次变动的时间,mtime指的是文件内容上一次变动的时间,atime指的是文件上一次打开的时间。链接数指的是有多少文件名指向这个文件索引。
在子操作S101b,根据获取的磁盘标识符和索引节点确定目标函数要访问的磁盘是否为目标磁盘。
根据获取的磁盘标识符和索引节点与目标磁盘的磁盘标识符和索引节点的信息进行比对,如果比对结果一致,则确定目标函数要访问的磁盘为目标磁盘。
根据本公开的实施例,上述磁盘故障模拟测试的方法除了包括上述操作S11、S12和S13之外,还包括操作S102,生成时间延迟控制参数。当然上述方法还可以同时包括S102、S101、S11、S12和S13。
图6示意性示出了根据本公开实施例的操作S102的详细实施流程图。
根据本公开的实施例,生成时间延迟控制参数的操作S102可以包括以下子操作S102a和S102b,或者包括子操作S102c和S102d。
在子操作S102a,获取随机数。
获取随机数的方式可以是由用户输入一个随机数,或者由一随机数产生器随机生成一个随机数。
在子操作S102b,基于获取的随机数生成时间延迟控制参数。
基于获取的随机数生成时间延迟控制参数可以包括:将获取的随机数直接作为时间延迟控制参数,或者将获取的随机数通过特定的计算方式计算后得到的值作为时间延迟控制参数,特定的计算方式可以是加减乘除或者其组合的计算方式。
在子操作S102c,构建用于模拟磁盘故障发生的随机模型。
根据本公开的实施例,可以构建在一段时间符合高斯分布的随机抖动模型,或是周期性变化的抖动模型等,来作为模拟磁盘故障发生的随机模型。
在子操作S102d,基于所述随机模型生成时间延迟控制参数。
基于上述构建的随机模型可以生成时间延迟控制参数,上述随机模型中产生抖动的时间段的函数可以作为时间延迟控制参数。具体函数的形式根据实际模拟需要进行设置,例如可以是幂函数、指数函数、一次函数或二次函数等。
本公开的第二个示例性实施例提供了一种磁盘故障模拟测试的方法。本实施例中针对磁盘的资源异常(慢盘)故障进行模拟以便测试。本实施例可以单独实施,从而实现磁盘资源异常的模拟测试。本实施例也可以与第一实施例一起实施,从而实现IO抖动和磁盘资源异常的共同模拟测试。
下面以在第一实施例的基础上进一步模拟磁盘资源异常进行描述。
图7示意性示出了根据本公开又一实施例的磁盘故障模拟测试的方法的流程图。
根据本公开的实施例,上述磁盘故障模拟测试的方法除了包括上述操作S11~S13之外,还可以包括:在目标磁盘创建至少一个压力进程,上述至少一个压力进程使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
该磁盘故障模拟测试的方法还可以包括:S101和S102中至少一个,S11~S13,以及在目标磁盘创建至少一个压力进程的操作。本实施例中,确定目标函数要访问的磁盘是否为目标磁盘的操作对应的序号以S20来进行描述,与第一实施例中以S101来描述的确定目标函数要访问的磁盘是否为目标磁盘的操作是一致的。
本实施例中,在目标磁盘创建至少一个压力进程,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率的具体实施过程可以参照图7示例性描述如下。如图7所示,在操作S21,在目标磁盘创建至少一个压力进程。在操作S22a,在目标磁盘中预留出不涉及磁盘业务数据的空闲区域,作为上述至少一个压力进程对目标磁盘进行访问的区域。或者,在操作S22b,预先在目标磁盘的系统内核(system kernel)的文件系统(filesystem)创建数据文件(data file),以供上述至少一个压力进程进行访问。在操作S23,确定上述至少一个压力进程是否使得磁盘业务数据对目标磁盘进行访问占据的带宽比低于预设带宽比率。如果上述至少一个压力进程使得磁盘业务数据对目标磁盘进行访问占据的带宽比率不是低于预设带宽比率,则执行操作S24,修改压力进程的数量,直至使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
在一实例中,上述预设带宽比率根据实际模拟测试需要进行设置,例如可以是20%、25%、30%、35%或者40%等。
本实施例中,参照图7所示,上述方法还包括操作S20,确定目标函数要访问的磁盘是否为目标磁盘。该操作的具体实施方式可以参照第一实施例中操作S101的介绍,这里不再赘述。
根据本公开的实施例,本实施例中针对磁盘的资源异常(慢盘)故障进行模拟测试的方法可以与第一实施例一起实施,从而实现IO抖动和磁盘资源异常的共同模拟测试。例如需要同时模拟IO抖动和磁盘资源异常两种故障,可以在操作S13执行的同时,执行上述在目标磁盘创建至少一个压力进程的操作,上述至少一个压力进程使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
或者,例如需要在预定时间段内先模拟IO抖动,之后模拟磁盘资源异常,可以在操作S13执行持续预定时长之后,再执行上述在目标磁盘创建至少一个压力进程的操作。
或者,例如需要在预定时间段内先模拟磁盘资源异常,之后模拟IO抖动,可以执行上述在目标磁盘创建至少一个压力进程的操作持续预定时间后,再执行操作S13。
需要说明的是,本实施例的操作与第一实施例中的操作之间执行顺序可以根据实际模拟场景进行适应性设置,不局限于上述实施例。
第二实施例中提出的方法通过利用磁盘带宽挤占的方式来模拟磁盘资源异常,具有操作简洁,易于实现等优势。不过考虑到这类方式在物理上会损耗磁盘的工作寿命,同时,压力进程也大幅度的增加了中央处理器(CPU)或者其他处理模块的计算资源的消耗,因此在本公开的第三个实施例中提出了一种不损耗磁盘工作寿命的磁盘故障模拟测试的方法。
本公开的第三个示例性实施例提供了一种磁盘故障模拟测试的方法。本实施例中针对磁盘的资源异常(慢盘)故障进行模拟以便测试。本实施例可以单独实施,从而实现磁盘资源异常的模拟测试。本实施例也可以与第一实施例一起实施,从而实现IO抖动和磁盘资源异常的共同模拟测试。
下面以在第一实施例的基础上进一步模拟磁盘资源异常进行描述。
图8示意性示出了根据本公开再一实施例的磁盘故障模拟测试的方法流程图。
根据本公开的实施例,参照图8所示,上述磁盘故障模拟测试的方法除了包括上述操作S11~S13之外,还可以包括以下操作:S31、S32a、S32b、S33和S34。
该磁盘故障模拟测试的方法还可以包括:S101和S102中至少一个,S11~S13,以及以下操作:S31、S32a、S32b、S33和S34。本实施例中,确定目标函数要访问的磁盘是否为目标磁盘的操作对应的序号以S30来进行描述,与第一实施例中以S101来描述的确定目标函数要访问的磁盘是否为目标磁盘的操作是一致的。
在操作S31,确定目标磁盘中是否存在文件系统。
在操作S32a,如果确定目标磁盘中存在文件系统,则限制写缓存的使用率。
在操作S32b,如果确定目标磁盘中不存在文件系统,则限制输入输出速率。
在操作S33,确定磁盘业务数据对目标磁盘进行访问占据的带宽比率是否低于预设带宽比率。
在操作S34,在确定磁盘业务数据对目标磁盘进行访问占据的带宽比率不是低于预设带宽比率的情况下,修改限制参数,所述限制参数包括以下一种:写缓存的使用率的限制参数或者输入输出速率的限制参数。
通过确定磁盘业务数据对目标磁盘进行访问占据的带宽比率是否低于预设带宽比率,来调整写缓存的使用率的限制参数,或者调整输入输出速率的限制参数,从而使得盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
根据本公开的实施例,如果确定目标磁盘中存在文件系统,则设定目标磁盘的写缓存的使用率的上限为第一阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
根据本公开的实施例,如果确定目标磁盘中不存在文件系统,则设定目标磁盘的输入输出速率的上限为第二阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
根据本公开的实施例,本实施例中针对磁盘的资源异常(慢盘)故障可以与第一实施例一起实施,从而实现IO抖动和磁盘资源异常的共同模拟测试。例如需要同时模拟IO抖动和磁盘资源异常两种故障,可以在操作S13执行的同时,执行以下操作:S31、S32a、S32b、S33和S34。
或者,例如需要在预定时间段内先模拟IO抖动,之后模拟磁盘资源异常,可以在操作S13执行持续预定时长之后,再执行以下操作:S31、S32a、S32b、S33和S34。
或者,例如需要在预定时间段内先模拟磁盘资源异常,之后模拟IO抖动,可以执行以下操作:S31、S32a、S32b、S33和S34持续预定时间后,再执行操作S13。
需要说明的是,上述执行顺序可以根据实际模拟场景进行适应性设置,不局限于上述实施例。
本公开的第四个示例性实施例提供了一种磁盘故障模拟测试的装置。
图9示意性示出了根据本公开实施例的磁盘故障模拟测试的装置的结构框图。
根据本公开的实施例,参照图9所示,上述装置4包括:目标函数状态获取模块41、延时添加模块42以及磁盘模拟测试模块43。
上述目标函数状态监控模块41用于利用内核探针监控用于访问目标磁盘的目标函数的状态。
上述延时添加模块42用于根据所述状态在目标函数中添加时间延迟控制参数,以得到修改后的目标函数。
其中,时间延迟控制参数用于控制目标函数在执行用于访问目标磁盘的操作后延迟预定时间。
上述磁盘模拟测试模块43用于基于修改后的目标函数访问目标磁盘,以便对目标磁盘的故障进行模拟测试。
根据本公开的实施例,所述延时添加模块42用于在当目标函数的状态为执行完访问操作时,在目标函数中添加时间延迟控制参数;以及编译添加时间延迟控制参数的目标函数,得到修改后的目标函数。
本实施例的磁盘故障模拟测试的装置可以是独立于目标磁盘所在的终端设备或服务器的装置,也可以是处于目标磁盘所在的终端设备或服务器内部的装置。本实施例的磁盘故障模拟测试的装置可以对目标磁盘进行输入输出抖动的模拟测试。
本公开的第五个示例性实施例提供了一种磁盘故障模拟测试的装置。本实施例在第四个实施例的基础上还增加了用于磁盘资源异常的模拟测试的模块。
需要说明的是,本实施例的用于磁盘资源异常的模拟测试的模块也可以单独实施。
图10示意性示出了根据本公开另一实施例的磁盘故障模拟测试的装置的结构框图。
参照图10所示,本实施例的磁盘故障模拟测试的装置4除了包括目标函数状态监控模块41、延时添加模块42以及磁盘模拟测试模块43之外,还包括:压力进程创建模块44。
或者,本实施例的磁盘故障模拟测试的装置4除了包括目标函数状态监控模块41、延时添加模块42以及磁盘模拟测试模块43之外,还包括:文件系统确定模块45、写缓存限制模块46和输入输出速率限制模块47。
或者,本实施例的磁盘故障模拟测试的装置4除了包括目标函数状态监控模块41、延时添加模块42以及磁盘模拟测试模块43之外,还包括:压力进程创建模块44、文件系统确定模块45、写缓存限制模块46和输入输出速率限制模块47。
上述压力进程创建模块44用于在目标磁盘创建至少一个压力进程。上述至少一个压力进程使得目标磁盘的磁盘业务数据进行读写占据的带宽比率低于预设带宽比率,使得磁盘业务数据的带宽被挤占,以模拟磁盘资源异常。
上述文件系统确定模块45用于确定目标磁盘中是否存在文件系统。
上述写缓存限制模块46用于在确定目标磁盘中存在文件系统的情况下,设定目标磁盘的写缓存的使用率的上限为第一阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
上述输入输出速率限制模块47用于在确定目标磁盘中不存在文件系统的情况下,设定目标磁盘的输入输出速率的上限为第二阈值,使得磁盘业务数据对目标磁盘进行访问占据的带宽比率低于预设带宽比率。
根据本公开的实施例,参照图10中虚线框所示,上述装置4还可以包括:目标磁盘确定模块401。
该目标磁盘确定模块401包括:磁盘信息获取子模块401a和目标磁盘确定子模块401b。
上述磁盘信息获取子模块401a用于获取目标函数要访问的磁盘的磁盘标识符(dev)和索引节点(inode)。
上述目标磁盘确定子模块401b用于根据获取的磁盘标识符和索引节点确定目标函数要访问的磁盘是否为目标磁盘。
根据本公开的实施例,参照图10中虚线框所示,上述装置4还可以包括:时间延迟控制参数生成模块402。该时间延迟控制参数生成模块402可以基于获取的随机数生成时间延迟控制参数;或者,基于构建的模拟磁盘故障发生的随机模型生成时间延迟控制参数。
根据本公开的实施例的模块、子模块中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,目标函数状态监控模块41、延时添加模块42以及磁盘模拟测试模块43中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,目标磁盘确定模块40、目标函数状态监控模块41、延时添加模块42、磁盘模拟测试模块43、压力进程创建模块44、文件系统确定模块45、写缓存限制模块46和输入输出速率限制模块47中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,目标磁盘确定模块40、目标函数状态监控模块41、延时添加模块42、磁盘模拟测试模块43、压力进程创建模块44、文件系统确定模块45、写缓存限制模块46和输入输出速率限制模块47中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
本公开的第六个示例性实施例提供了一种电子设备。上述电子设备包括:一个或多个处理器;以及用于存储一个或多个程序的存储装置。其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述提及的任一种方法。
图11示意性示出了根据本公开实施例的电子设备的结构框图。
参照图11所示,根据本公开实施例的电子设备5包括处理器501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。处理器501例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 503中,存储有电子设备5操作所需的各种程序和数据。处理器501、ROM 502以及RAM 503通过总线504彼此相连。处理器501通过执行ROM 502和/或RAM 503中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM502和RAM 503以外的一个或多个存储器中。处理器501也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备5还可以包括输入/输出(I/O)接口505,输入/输出(I/O)接口505也连接至总线504。电子设备5还可以包括连接至I/O接口505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如局域网(LAN)卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
本公开的第七个示例性实施例提供了一种计算机可读存储介质。该计算机可读存储介质上存储有可执行指令,该指令被处理器执行时使处理器实现上述提及的任一种方法。该计算机可读存储介质可以是上述实施例中描述的电子设备/装置中所包含的;也可以是单独存在,而未装配入该电子设备/装置中。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 502和/或RAM 503和/或ROM 502和RAM 503以外的一个或多个存储器。
根据本公开的实施例,根据本公开实施例的方法流程还可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (8)

1.一种磁盘故障模拟测试的方法,包括:
获取用于访问目标磁盘的目标函数的状态;
根据所述状态在所述目标函数中添加时间延迟控制参数,以得到修改后的目标函数;以及
基于所述修改后的目标函数访问所述目标磁盘,以对所述目标磁盘的故障进行模拟测试;
其中,当所述目标函数的状态为执行完访问操作时,在所述目标函数中添加时间延迟控制参数;
编译添加时间延迟控制参数的目标函数,得到修改后的目标函数,其中,目标函数执行用于访问目标磁盘的操作之后不立即返回;
其中,基于获取的随机数生成时间延迟控制参数;或者,
构建用于模拟磁盘故障发生的随机模型,并基于所述随机模型生成时间延迟控制参数。
2.根据权利要求1所述的方法,还包括:确定目标函数要访问的磁盘是否为目标磁盘,所述确定目标函数要访问的磁盘是否为目标磁盘包括:
获取所述目标函数要访问的磁盘的磁盘标识符和索引节点;以及
根据获取的所述磁盘标识符和所述索引节点确定所述目标函数要访问的磁盘是否为目标磁盘。
3.根据权利要求1所述的方法,还包括:
在所述目标磁盘创建至少一个压力进程,所述至少一个压力进程使得磁盘业务数据对所述目标磁盘进行访问占据的带宽比率低于预设带宽比率。
4.根据权利要求3所述的方法,其中,
所述访问包括读写,所述至少一个压力进程对所述目标磁盘进行读写的区域为磁盘预留出的不涉及磁盘业务数据的空闲区域,或者,
预先在所述目标磁盘的系统内核的文件系统创建数据文件,以供所述至少一个压力进程进行访问。
5.根据权利要求1所述的方法,还包括:
确定所述目标磁盘中是否存在文件系统;
如果确定所述目标磁盘中存在文件系统,则设定所述目标磁盘的写缓存的使用率的上限为第一阈值,使得磁盘业务数据对所述目标磁盘进行访问占据的带宽比率低于预设带宽比率;
如果确定目标磁盘中不存在文件系统,则设定目标磁盘的输入输出速率的上限为第二阈值,使得磁盘业务数据对所述目标磁盘进行访问占据的带宽比率低于预设带宽比率。
6.一种磁盘故障模拟测试的装置,包括:
目标函数状态获取模块,用于获取用于访问目标磁盘的目标函数的状态;
延时添加模块,用于根据所述状态在所述目标函数中添加时间延迟控制参数,以得到修改后的目标函数;还用于在当目标函数的状态为执行完访问操作时,在目标函数中添加时间延迟控制参数;以及编译添加时间延迟控制参数的目标函数,得到修改后的目标函数,其中,目标函数执行用于访问目标磁盘的操作之后不立即返回;
磁盘模拟测试模块,用于基于所述修改后的目标函数访问所述目标磁盘,以对所述目标磁盘的故障进行模拟测试;以及
时间延迟控制参数生成模块,用于基于获取的随机数生成时间延迟控制参数;或者,基于构建的模拟磁盘故障发生的随机模型生成时间延迟控制参数。
7.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1-5中任一项所述的方法。
CN202010683397.4A 2020-07-15 2020-07-15 磁盘故障模拟测试的方法、装置及电子设备 Active CN111897684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010683397.4A CN111897684B (zh) 2020-07-15 2020-07-15 磁盘故障模拟测试的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010683397.4A CN111897684B (zh) 2020-07-15 2020-07-15 磁盘故障模拟测试的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111897684A CN111897684A (zh) 2020-11-06
CN111897684B true CN111897684B (zh) 2023-08-15

Family

ID=73192048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010683397.4A Active CN111897684B (zh) 2020-07-15 2020-07-15 磁盘故障模拟测试的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111897684B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114625433B (zh) * 2020-11-27 2024-05-07 北京字跳网络技术有限公司 应用程序启动方法和系统
CN112579379B (zh) * 2020-12-24 2024-02-23 深信服科技股份有限公司 一种卡慢盘的识别处理方法、系统、装置及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273231A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 分布式存储系统硬盘挂住故障检测、处理方法及装置
CN110851342A (zh) * 2019-11-08 2020-02-28 中国工商银行股份有限公司 故障预测方法、装置、计算设备以及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243059B2 (en) * 2003-04-24 2007-07-10 International Business Machines Corporation Simulation of hardware based on smart buffer objects
US9201799B2 (en) * 2013-06-03 2015-12-01 Samsung Electronics Co., Ltd. Method for disk defrag handling in solid state drive caching environment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273231A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 分布式存储系统硬盘挂住故障检测、处理方法及装置
CN110851342A (zh) * 2019-11-08 2020-02-28 中国工商银行股份有限公司 故障预测方法、装置、计算设备以及计算机可读存储介质

Also Published As

Publication number Publication date
CN111897684A (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
US11194566B1 (en) Decentralized, cluster-managed deployment of software updates in a multi-cluster environment
Zhang et al. {History-Based} harvesting of spare cycles and storage in {Large-Scale} datacenters
US9684562B2 (en) Automatic serial starting of resource groups on failover based on the prediction of aggregate resource usage
US9632914B2 (en) Error diagnostic in a production environment
Liu et al. Performance and energy modeling for live migration of virtual machines
Shahid et al. Towards Resilient Method: An exhaustive survey of fault tolerance methods in the cloud computing environment
US20170255527A1 (en) Live rollback for a computing environment
US7930163B2 (en) Modeling a storage environment at various times
US20190026459A1 (en) Methods and systems to analyze event sources with extracted properties, detect anomalies, and generate recommendations to correct anomalies
Brandón et al. Fmone: A flexible monitoring solution at the edge
US20140081901A1 (en) Sharing modeling data between plug-in applications
CN111897684B (zh) 磁盘故障模拟测试的方法、装置及电子设备
US10803166B1 (en) Automated determination of application privileges
US10656934B2 (en) Efficient software testing
US20150302020A1 (en) Multi-tenancy storage node
Sukhwani et al. Monitoring and mitigating software aging on IBM cloud controller system
Attallah et al. Proactive load balancing fault tolerance algorithm in cloud computing
KR20220125198A (ko) 데이터의 추가 기록 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램매체
Xavier et al. Understanding performance interference in multi-tenant cloud databases and web applications
US11921604B2 (en) Evaluating system recovery using emulated production systems
US20220138061A1 (en) Dynamic replacement of degrading processing elements in streaming applications
Chen et al. Survivability modeling and analysis of cloud service in distributed data centers
US20240028323A1 (en) Simulation of nodes of container orchestration platforms
Monteiro et al. Virtualized Web server cluster self-configuration to optimize resource and power use
US11068192B1 (en) Utilizing mutiple snapshot sources for creating new copy of volume in a networked environment wherein additional snapshot sources are reserved with lower performance levels than a primary snapshot source

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant