CN110515757B - 分布式存储系统的信息处理方法、装置、服务器、介质 - Google Patents

分布式存储系统的信息处理方法、装置、服务器、介质 Download PDF

Info

Publication number
CN110515757B
CN110515757B CN201910684765.4A CN201910684765A CN110515757B CN 110515757 B CN110515757 B CN 110515757B CN 201910684765 A CN201910684765 A CN 201910684765A CN 110515757 B CN110515757 B CN 110515757B
Authority
CN
China
Prior art keywords
storage
storage unit
server
read
performance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910684765.4A
Other languages
English (en)
Other versions
CN110515757A (zh
Inventor
褚剑
张新杰
段小勇
林海
王晓宇
李蓓
贾宜彬
张志勇
陶盛凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910684765.4A priority Critical patent/CN110515757B/zh
Publication of CN110515757A publication Critical patent/CN110515757A/zh
Application granted granted Critical
Publication of CN110515757B publication Critical patent/CN110515757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供一种分布式存储系统的信息处理方法及装置、存储服务器、电子设备及非临时性计算机可读存储介质,所述方法应用于分布式存储系统中的任一存储服务器;包括:接收远程管理终端发送的存储单元检测指令;响应于存储单元检测指令,获得存储服务器内表征各存储单元的当前状态的状态信息;在状态信息表征至少一个存储单元存在故障风险的情况下,对各个存储单元进行性能测试,基于测试结果确定各个存储单元之间的性能偏差值;从各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元;对目标存储单元进行修复。通过上述方法有效预防了单个存储单元故障带来的分布式存储系统整体性能降低的情况发生。

Description

分布式存储系统的信息处理方法、装置、服务器、介质
技术领域
本公开涉及存储技术领域,尤其涉及一种分布式存储系统的信息处理方法、装置、存储服务器、非临时性计算机可读存储介质及电子设备。
背景技术
分布式存储系统是将数据分散存储在多台存储服务器上,以通过多台存储服务器下的多个存储单元的并发性能,保证系统的可靠性、可用性和存取效率,可以满足大数据的高性能存储和处理。但是,随着分布式存储系统中存储服务器的增加,存储服务器的存储单元出现故障的概率也在不断增加,实际中,存储服务器中的某个存储单元出现了故障,则会引起整个分布式存储系统的信息处理效率降低。
发明内容
本公开提供一种分布式存储系统的信息处理方法、装置、存储服务器、非临时性计算机可读存储介质及电子设备,以至少解决相关技术中单个存储单元性能下降导致的分布式存储系统的整体性能下降的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种分布式存储系统的信息处理方法,应用于分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器包括多个存储单元,所述分布式存储系统与远程管理终端通信连接,所述方法还包括:
接收所述远程管理终端发送的存储单元检测指令,其中,存储单元为所述存储服务器包括的多个存储单元中的任一存储单元;
响应于所述存储单元检测指令,获得所述存储服务器内表征各存储单元的当前状态的状态信息;
在所述状态信息表征所述存储服务器内的至少一个存储单元存在故障风险的情况下,对所述存储服务器内的各个存储单元进行性能测试,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值;
从所述存储服务器内的各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元;
对所述目标存储单元进行修复。
可选地,获得所述存储服务器内表征各存储单元的当前状态的状态信息,包括:
获得所述存储服务器内当前产生的系统日志;
从所述系统日志中读取表征所述各存储单元的当前状态的状态信息。
可选地,获得所述存储服务器内表征各存储单元的当前状态的状态信息,包括:
对所述存储服务器内的各存储单元进行巡检,并生成巡检结果信息;
将所述巡检结果信息确定为表征各存储单元的当前状态的状态信息。
可选地,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值,包括:
基于测试结果获得每个存储单元各自的读写性能值;
确定所述存储服务器内每两个存储单元各自的读写性能值之间的第一读写性能偏差值;其中,所述第一读写性能偏差值为正数;
从所述存储服务器内的各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元,包括:
将第一读写性能偏差值大于预设偏差范围的两个存储单元中,读写性能值较小的存储单元确定为目标存储单元。
可选地,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值,包括:
基于测试结果获得所述存储服务器内每个存储单元的读写性能值,并确定各个存储单元的平均读写性能值;
确定每个存储单元的读写性能值与所述平均读写性能值之间的第二读写性能偏差值;其中,所述第二读写性能偏差值为正数;
从所述存储服务器内的各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元,包括:
将第二读写性能偏差值大于预设偏差范围的存储单元确定为目标存储单元。
可选地,在对所述目标存储单元进行修复后,所述方法还包括:
在所述目标存储单元未被成功修复的情况下,将所述目标存储单元从所述存储服务器的操作系统中移除;
生成针对所述目标存储单元的故障报告,并将所述故障报告发送给与所述分布式存储系统通信的故障修复系统。
可选地,对所述存储服务器内的各个存储单元进行性能测试,包括:
获得所述存储服务器内的各个存储单元各自的当前负载;
依次从所述存储服务器内的各个存储单元中确定当前负载小于预设负载阈值的待测存储单元,并对所述待测存储单元进行性能测试;
在对所述存储服务器内的各个存储单元均完成性能测试的情况下,根据所述存储服务器内的各个存储单元的性能测试结果,生成性能测试报告。
可选地,所述方法还包括:
在所述状态信息表征所述存储服务器内的至少一个存储单元已经存在故障的情况下,从各所述存储单元中确定故障存储单元;
对所述故障存储单元进行修复。
根据本公开实施例的第二方面,提供一种分布式存储系统的信息处理装置,应用于分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器包括多个存储单元,所述分布式存储系统与远程管理终端通信连接;所述装置还包括:
指令接收单元,被配置为接收所述远程管理终端发送的存储单元检测指令;
状态信息获得单元,被配置为响应于所述存储单元检测指令,获得所述存储服务器内表征各存储单元的当前状态的状态信息;
性能偏差确定单元,被配置为在所述状态信息表征所述存储服务器内的至少一个存储单元存在故障风险的情况下,对所述存储服务器内的各个存储单元进行性能测试,基于性能测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值;
故障确定单元,被配置为从所述存储服务器内的各个存储单元中,确定对应的性能偏差值大于预设偏差范围的目标存储单元;
故障修复单元,被配置为对所述目标存储单元进行修复。
可选地,所述状态信息获得单元,具体被配置为获得所述存储服务器内当前产生的系统日志,以及,从所述系统日志中获得表征所述各存储单元的当前状态的状态信息。
可选地,所述状态信息获得单元,具体被配置为对所述存储服务器内的各存储单元进行巡检,并生成巡检结果信息,以及,将所述巡检结果信息确定为表征各存储单元的当前状态的状态信息。
可选地,所述性能偏差确定单元,具体被配置为基于测试结果获得每个存储单元各自的读写性能值,以及,确定所述存储服务器内每两个存储单元各自的读写性能值之间的第一读写性能偏差值;其中,所述第一读写性能偏差值为正数;
所述故障确定单元,具体被配置为将第一读写性能偏差值大于预设偏差范围的两个存储单元中,读写性能值较小的存储单元确定为目标存储单元。
可选地,所述性能偏差确定单元,具体被配置为基于测试结果获得所述存储服务器内每个存储单元的读写性能值,并确定各个存储单元的平均读写性能值;以及,确定每个存储单元的读写性能值与所述平均读写性能值之间的第二读写性能偏差值;其中,所述第二读写性能偏差值为正数;
所述故障确定单元,具体被配置为将第二读写性能偏差值大于预设偏差范围的存储单元确定为目标存储单元。
可选地,所述装置还包括:
故障移除单元,在所述目标存储单元未被成功修复的情况下,将所述目标存储单元从所述存储服务器的操作系统中移除;
故障发生单元,生成针对所述目标存储单元的故障报告,并将所述故障报告发送给与所述分布式存储系统通信的故障修复系统。
可选地,所述性能偏差确定单元具体可以包括:
负载确定子单元,被配置为获得所述存储服务器内的各个存储单元各自的当前负载;
循环测试子单元,被配置为依次从所述存储服务器内的各个存储单元中确定当前负载小于预设负载阈值的待测存储单元,并对所述待测存储单元进行性能测试;
性能报告生成子单元,被配置为在对所述存储服务器内的各个存储单元均完成性能测试的情况下,根据所述存储服务器内的各个存储单元的性能测试结果,生成性能测试报告。
可选地,所述装置还包括:
故障存储单元确定单元,被配置为在所述状态信息表征所述存储服务器内的至少一个存储单元已经存在故障的情况下,从各所述存储单元中确定故障存储单元;
所述故障修复单元,还被配置为对所述故障存储单元进行修复。
根据本公开实施例的第三方面,提供一种存储服务器,所述存储服务器是分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器上安装有代理模块,所述代理模块用于执行所述的分布式存储系统的信息处理方法。
根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器执行时,使得服务器能够执行所述的分布式存储系统的信息处理方法。
根据本公开实施例的第五方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器被配置:执行如所述的分布式存储系统的信息处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本发明实施例中,分布式存储系统中的各个存储服务器接收远程管理终端发送的存储单元检测指令,响应于所述存储单元检测指令,获得存储服务器内表征各存储单元当前状态的状态信息,若根据状态信息确定存储单元具有故障风险,则对存储服务器内的各存储单元进行性能测试,并根据性能测试的性能测试报告,确定出现故障风险的目标存储单元,进而对目标存储单元进行修复。一方面,由于在通过获得的状态信息确定存在故障风险时,对确定出的出现故障风险的目标存储单元进行修复,可以及时修复性能下降的存储单元,从而保障了分布式存储系统中各个存储单元具有正常的性能,使得各个存储单元的性能水平维持均衡,提高了分布式存储系统的整体性能。另一方面,由于响应于存储单元检测指令,通过获得的状态信息确认存储单元是否存在故障风险,实现了对存储单元进行故障预判,进而可以有效预防单个存储单元故障带来的整体性能降低的情况,提高了分布式存储系统的管理效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种分布式存储系统的信息处理方法的应用环境;
图2是根据一示例性实施例示出的一种分布式存储系统的信息处理方法的流程图;
图3是根据一示例性实施例示出的一种分布式存储系统的信息处理方法的流程图;
图4是根据一示例性实施例示出的一种分布式存储系统的信息处理方法中步骤S23的流程图;
图5是根据一示例性实施例示出的一种分布式存储系统的信息处理装置的框图;
图6是根据一示例性实施例实处的一种存储服务器的框图;
图7是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
对于现有的分布式存储系统而言,在分布式存储系统中某个存储服务器中的某个存储单元出现了故障,才对该出现故障的存储单元进行修复,在对该出现故障的存储单元进行修复期间,该出现故障的存储单元无法对外提供数据读写服务,导致整个分布式存储系统对外提供数据读写服务的效率因受单个出现故障的存储单元而下降,因此,如何预防单个存储单元故障导致分布式存储系统整体对外提供数据读写服务的效率下降,成为需要解决的问题。
本发明实施例提供的一种分布式存储系统的信息处理方法,可以用于预防并解决单个存储单元故障导致分布式存储系统整体对外提供数据读写服务的效率下降的问题。
参照图1,图1是根据一示例性实施例示出的一种分布式存储系统的信息处理方法的应用环境图,其中,分布式存储系统可以是但是不限于下述系统:Ceph、HDFS、Swift等,存储服务器可以是但是不限于元服务器、数据存储服务器。远程管理终端可以是但是不限于下述设备:电脑、智能手机、平板电脑、机顶盒等能进行通信的智能设备。实际中,远程管理终端可以与分布式存储系统中的每个存储服务器进行有线或无线通信。
可选地,在每个存储服务器上可以均安装代理模块,可以由代理模块执行上述的分布式存储系统的信息处理方法。
图2是根据一示例性实施例示出的一种分布式存储系统的信息处理方法的流程图,如图2所示,所述方法用于分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器包括多个存储单元,所述分布式存储系统与远程管理终端通信连接,具体包括以下步骤:
在步骤S21中,接收所述远程管理终端发送的存储单元检测指令,其中,存储单元 为所述存储服务器包括的多个存储单元中的任一存储单元。
本实施例中,存储服务器可以周期性接收远程管理终端发送的存储单元检测指令,这样,每隔一段时间存储服务器便能根据接收到的存储单元检测指令对存储服务器内包括的各个存储单元进行故障检测。
在步骤S22中,响应于所述存储单元检测指令,获得所述存储服务器内表征各存储单元的当前状态的状态信息。
本实施例中,存储服务器内可以包括多个存储单元,存储单元的状态信息可以是指表征该存储单元当前的读写状态、存储状态、连接状态等工作状态的信息。上述的存储单元可以理解为是具有存储数据和读写数据等功能的存储设备,可以是但是不限于机械式硬盘、固态硬盘。
在步骤S23中,在所述状态信息表征所述存储服务器内的至少一个存储单元存在故障风险的情况下,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值。
在步骤S24中,从所述存储服务器内的各个存储单元中,确定对应的性能偏差值大于预设偏差范围的目标存储单元。
在确定存储服务器中的至少一个存储单元存在故障风险时,需要确定存在故障风险的存储单元,本实施例中,存储服务器可以通过对全部的存储单元进行性能测试,根据性能测试的结果确定存在故障风险的存储单元。具体地,存储服务器可以对全部的存储单元均进行性能测试,性能测试结束后可以针对测试结束后生成的性能测试报告确定各个存储单元之间的性能偏差值。其中,在该性能测试报告中可以包括对每个存储单元进行性能测试的测试结果,存储服务器进而可以根据每个存储单元的测试结果确定存储单元的性能值,进而可以确定各个存储单元之间的性能偏差值,将性能偏差值超过预设偏差范围的存储单元确定为存在故障风险的目标存储单元。
其中,性能偏差值可以表征一个存储单元的性能相对于其他存储单元的性能的差距,目标存储单元对应的性能偏差值大于预设偏差范围,则可以表征该目标存储单元的性能与其他存储单元的性能存在较大差距,则可以确定其是存在故障风险引起了性能降低的存储单元。
在步骤S25中,对所述目标存储单元进行修复。
在确定到存在故障风险的目标存储单元时,可以对该目标存储单元进行修复,以使目标存储单元恢复到正常性能,进而避免目标存储单元的性能下降而引起整个分布式存储系统的性能下降。实施时,可以采取将所述目标存储单元从存储服务器的操作系统和其所在的存储阵列中移除,然后再将目标存储单元重新添加至存储阵列及操作系统的方式,对所述目标存储单元进行修复。
本发明实施例,分布式存储系统中的各存储服务器可以预先检测各个存储单元的当前的状态信息,在状态信息表征存储单元出现故障风险时,对各个存储单元进行性能测试,通过性能测试生成的性能测试报告确定出现故障风险的目标存储单元,进而对目标存储单元进行修复。
采用上述技术方案,由于预先通过状态信息确定是否出现故障风险,在出现故障风险时确定出出现故障风险的目标存储单元,进而对目标存储单元进行修复,实现了对存储单元进行故障预判,进而可以有效预防单个存储单元性能降低而带来的整体性能低的情况,保证了分布式存储系统中各个存储单元的性能水平一致,提高了分布式存储系统的运行效率。
结合以上实施例,在一种实施方式中,步骤S22可以包括以下步骤:
步骤S221,获得所述存储服务器内当前产生的系统日志。
步骤S222,从所述系统日志中读取表征所述各存储单元的当前状态的状态信息。
本发明实施方式,可以通过存储服务器当前产生的系统日志,获取状态信息。系统日志可以理解为是记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件。具体地,系统日志可以包括系统报错messages日志,核心启动dmesg日志,查看硬件ipmitool sel list日志,硬盘SMART日志(反映存储单元当前的健康状况的日志)等,不同的日志针对不同的事件和问题,进而可以从系统日志中的上述各日志中读取表征存储单元的问题的信息。
例如,若从messages日志中读取表征存储单元的状态的信息是IOCStatus=0x8000,IOCStatus=0x804b,则表示存储服务器中有存储单元存在故障风险,若从核心启动dmesg日志中读取表征存储单元的状态的信息是Medium Error,Hardware Error,则表示存储服务器中有存储单元存在无法修复的故障问题。
采用上述技术方案,存储服务器可以借助当前产生的系统日志读取各存储单元的当前状态,从而确定是否有存储单元存在故障风险。由于系统日志可以反映整个系统中软硬件问题,提高了状态信息的信息多样性,进而可以通过状态信息获取到存储单元的多个维度的当前状态。
结合以上实施例,在一种实施方式中,步骤S22可以包括以下步骤:
步骤S221’,对所述存储服务器内的各存储单元进行巡检,并生成巡检结果信息。
步骤S222’,将所述巡检结果信息确定为表征各存储单元的当前状态的状态信息。
本发明实施方式,存储服务器也可以对针对各存储单元进行巡检,针对巡检生成巡检结果信息,这样生成的巡检结果信息便可以表征存储单元的当前状态。其中,巡检可以是理解为是对存储服务器内的各个存储单元进行依次检测,直到检测完存储服务器内的全部存储单元时为止。
可选地,存储服务器可以通过执行MegaCLI命令对各个存储单元所在的存储阵列进行巡检,MegaCLI命令可以用于检测存储阵列是否存在问题,这样可以根据执行完MegaCLI命令后产生的巡检结果信息确定存储阵列的状态,进而可以根据存储阵列的状态确定是否有存储单元存在故障。实际中,若巡检结果信息是0,则表征存储服务器中的至少一个存储单元存在故障风险,若巡检结果信息为不为0的值,则表示存储阵列中有存储单元已经出现故障。
当然,实际中,存储服务器也可以通过其他硬件维护软件对各个存储单元进行巡检,本申请实施例在此不做限制。
采用上述技术方案,由于存储服务器是直接针对各个存储单元进行巡检,可以直接根据巡检结果信息确定各个存储单元的当前状态,因此提高了获取状态信息的针对性和高效性。
结合以上实施例,在一种实施方式中,步骤S23可以包括以下步骤:
步骤S231,基于测试结果获得每个存储单元各自的读写性能值。
步骤S232,确定所述存储服务器内每两个存储单元各自的读写性能值之间的第一读写性能偏差值;其中,所述第一读写性能偏差值为正数。
在对各个存储单元进行性能测试后,其性能测试的测试结果中可以包括各个存储单元的读写性能值,该读写性能值可以表征存储单元当前的读写性能,具体地,读写性能值可以包括连续读写带宽、随机读写带宽、连续读写延迟、随机读写延迟等。本实施方式中,可以将上述的任一读写性能值,如随机读写带宽,作为各个存储单元的读写性能值,进而可以确定每两个存储单元各自的读写性能值之间的第一读写性能偏差值,根据各个存储单元之间的第一读写性能偏差值,确定出现故障风险的目标存储单元。计算时,可以将第一读写性能偏差值确定为正数。
示例地,以根据读写性能值中的连续读写带宽确定第一读写性能偏差值为例,在存储服务器中有4个存储单元:HDD1、HDD2、HDD3、HDD4,其中,HDD1的读写带宽为1000MB/S,HDD2的读写带宽为1022MB/S、HDD3的读写带宽为1100MB/S、HDD4的读写带宽为850MB/S。则,HDD1与HDD2之间的读写带宽的读写带宽偏差值是-2%,取正数,为2%,HDD1与HDD3之间的读写带宽的读写带宽偏差值是10%(取正数),HDD1与HDD4之间的读写带宽的读写带宽偏差值是15%(取正数),HDD2与HDD1之间的读写带宽的读写带宽偏差值是2%,HDD2与HDD3之间的读写带宽的读写带宽偏差值是1%,HDD4与HDD2之间的读写带宽的读写带宽偏差值是16%,其中,读写带宽偏差值即为第一读写性能偏差值,以此类推,获取到每两个存储单元之间的第一读写性能偏差值。
相应的,步骤S24可以为以下步骤:
将第一读写性能偏差值大于预设偏差范围的两个存储单元中,读写性能值较小的存储单元确定为目标存储单元。
在确定到第一读写性能偏差值后,则在多个第一读写性能偏差值中确定大于预设偏差范围的目标第一读写性能偏差值,因目标第一读写性能偏差值针对的是两个存储单元,则可以在该两个存储单元中,将具有较小读写性能值的存储单元确定为存在故障风险的目标存储单元。其中,预设偏差范围可以根据实际需要进行设定。
示例地,预设偏差范围设定为:15%-20%,则在HDD1至HDD4中确定到16%和15%的第一读写性能偏差值在此预设偏差范围内,进一步,16%对应的是HDD4与HDD2,则将HDD4确定为目标存储单元,15%对应的是HDD4与HDD1,则将HDD4确定为目标存储单元,最终,确定到目标存储单元为HDD4,表示HDD4存在故障风险。
采用上述技术方案,由于将读写性能值作为各个存储单元的性能指标,进而根据每两个读写性能值的第一读写性能偏差值是否超过预设偏差范围来确定存在故障风险的目标存储单元,使得依据各个存储单元的实际性能的差距来确定故障风险的目标存储单元,进而提高了确定存在故障风险的存储单元的客观性。
结合以上实施例,在一种实施方式中,步骤S23可以包括以下步骤:
步骤S231’,基于测试结果获得所述存储服务器内每个存储单元的读写性能值,并确定各个存储单元的平均读写性能值。
步骤S232’,确定每个存储单元的读写性能值与所述平均读写性能值之间的第二读写性能偏差值,并将各所述第二读写性能偏差值作为性能偏差值;其中,所述第二读写性能偏差值为正数。
本实施方式中,存储服务器在获取到每个存储单元各自的读写性能值后,可以确定平均读写性能值,进而确定每个存储单元的读写性能值与平均读写性能值之间的第二读写性能偏差值,其中,第二读写性能偏差值为正数。本实施方式中,可以将任一读写性能值,如,连续读写带宽,作为各个存储单元的读写性能值,进而将各个存储单元的连续读写带宽的平均值作为平均读写性能值。
示例地,以上述的根据读写性能值中的连续读写带宽确定第一读写性能偏差值为例,上述实施方式中的4个存储单元中,HDD1至HDD4的平均读写性能值为993MB/S,HDD1与平均读写性能值的第二读写性能偏差值为0.7%,HDD2与平均读写性能值的第二读写性能偏差值为2.83%,HDD3与平均读写性能值的第二读写性能偏差值为9.7%,HDD4与平均读写性能值的第二读写性能偏差值为17%。
相应的,步骤S24可以为以下步骤:
将第二读写性能偏差值大于预设偏差范围的存储单元确定为目标存储单元。
在确定到第二读写性能偏差值后,则在多个第二读写性能偏差值中确定大于预设偏差范围的目标第二读写性能偏差值,将目标第二读写性能偏差值对应的存储单元确定为存在故障风险的目标存储单元。
示例地,以上述例子为例,设定预设偏差范围为15%-20%,确定到17%超出了该预设偏差范围,17%对应的是HDD4,则可以直接将HDD4确定为目标存储单元。
采用上述技术方案,由于将读写性能值作为各个存储单元的性能指标,进而根据每个读写性能值与平均读写性能值之间的第二读写性能偏差值是否超过预设偏差范围来确定存在故障风险的目标存储单元,使得是以各存储单元的平均性能作为衡量指标去确定出现故障风险的存储单元,确保了单个存储单元的性能能与各存储单元所构成的集群性能保持一致。
参考图3,示出了在本申请另一实施例提出的分布式存储系统的信息处理方法的流程图,如图3所示,该方法除包括步骤S21-步骤S25外,还包括以下步骤:
步骤S26,在所述目标存储单元未被成功修复的情况下,将所述目标存储单元从所述存储服务器的操作系统中移除。
实际中,对目标存储单元进行修复后,可以通过对该目标存储单元进行针对性的性能测试,根据该目标存储单元的性能测试结果判定是否成功修复该目标存储单元。
可选地,可以对该目标存储单元的性能测试结果进行分析,确定目标存储单元与其他存储单元之间的性能偏差值,若性能偏差值仍然超过预设偏差范围,则可以确定该目标存储单元未被修复成功。
可选地,也可以获得所述存储服务器在修复目标存储单元后的表征各存储单元的状态的后续状态信息,通过后续状态信息确定目标存储单元的修复结果。若后续状态信息仍是表征存在故障风险,则可以确定目标存储单元未被修复,若后续状态信息表征不存在故障风险,则可以确定目标存储单元被成功修复。
实际中,在目标存储单元未被成功修复时,可以将目标存储单元从存储服务器的操作系统中移除,可选地,可以通过执行移除Unmount命令将目标存储单元在操作系统下移除。其中,存储服务器的操作系统可以是但是不限于Linux系统。
步骤S27,生成针对所述目标存储单元的故障报告,并将所述故障报告发送给与所述分布式存储系统通信的故障修复系统。
其中,故障报告中可以包括存储服务器的服务器地址,以及,目标存储单元在存储服务器内的单元地址,这样,故障修复系统便可以根据故障报告中的服务器地址确定到存储服务器,根据单元地址确定到目标存储单元,以便提醒用户将存储服务器中的目标存储单元送检。其中,故障修复系统可以与分布式存储系统中的每个存储服务器通信连接。
采用上述技术方案,由于在目标存储单元未被修复成功时,可以向故障系统发送故障报告,方便管理人员对目标存储单元送检保修,提高了用户体验。
参考图4,示出了在本申请另一实施例提出的分布式存储系统的信息处理方法中步骤S23中,对所述存储服务器内的各个存储单元进行性能测试的步骤的流程图,如图4所示,该步骤具体可以包括以下步骤:
步骤S231,获得所述存储服务器内的各个存储单元各自的当前负载。
实际中,在对各个存储单元进行故障风险监测时,各存储单元都可能在为用户提供数据读写服务,为了不影响存储单元的常规业务的进行,可以在存储单元的负载较小的情况下,对存储单元进行性能测试。
其中,可以通过存储单元的当前数据吞吐量、工作任务的多寡确定当前负载。
步骤S232,依次从所述存储服务器内的各个存储单元中确定当前负载小于预设负载阈值的待测存储单元,并对所述待测存储单元进行性能测试。
步骤S233,在对所述存储服务器内的各个存储单元均完成性能测试的情况下,根据所述存储服务器内的各个存储单元的性能测试结果,生成性能测试报告。
在对当前负载较小的存储单元进行性能测试后,可以继续确定未进行性能的存储单元的当前负载,继而又对当前负载小于预设负载阈值的存储单元进行性能测试,以此循环执行,直到对所有的存储单元都进行了性能测试。在对全部存储单元均进行了性能测试后,则可以根据各个存储单元的性能测试结果,生成性能测试报告,该性能测试报告中包括了每个存储单元的性能测试结果,相应地,可以基于性能测试报告确定所述存储服务器内的各个存储单元之间的性能偏差值。
采用上述技术方案,由于在存储单元负载较低时进行性能测试,使得对存储单元的性能检测不影响存储单元正进行的业务,保证了分布式存储系统的正常业务进行,优化了用户体验。
结合以上实施例,在一种实施方式中,所述方法还可以包括以下步骤:
在所述状态信息表征所述存储服务器内的至少一个存储单元已经存在故障的情况下,从各所述存储单元中确定已经存在故障的故障存储单元;
对所述故障存储单元进行修复。
实际中,在获得的状态信息表征至少一个存储单元已经出现故障时,则可以对已经存在故障的存储单元进行修复。具体实施时,在确定有存储单元出现故障时,可以启动已安装的硬盘检测工具从各所述存储单元中确定故障存储单元。
可选地,在对故障存储单元修复失败时,可以将故障存储单元从其所在的存储阵列中移除,以及,将故障存储单元从存储服务器的操作系统中移除,以避免故障存储单元对分布式存储系统的整体性能的影响。
图5是根据一示例性实施例示出的一种分布式存储系统的信息处理装置的框图。所述的装置应用于分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器包括多个存储单元,所述分布式存储系统与远程管理终端通信连接。
参照图5,该装置可以包括指令接收单元51,状态信息获得单元52,性能偏差确定单元53,故障确定单元54,故障修复单元55。
该指令接收单元51,被配置为接收所述远程管理终端发送的存储单元检测指令;
该状态信息获得单元52,被配置为响应于所述存储单元检测指令,获得所述存储服务器内表征各存储单元的当前状态的状态信息;
该性能偏差确定单元53,被配置为在所述状态信息表征所述存储服务器内的至少一个存储单元存在故障风险的情况下,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值;
该故障确定单元54,被配置为从所述存储服务器内的各个存储单元中,确定对应的性能偏差值大于预设偏差范围的目标存储单元;
该故障修复单元55,被配置为对所述目标存储单元进行修复。
可选地,所述状态信息获得单元52,具体被配置为获得所述存储服务器内当前产生的系统日志,以及,从所述系统日志中获得表征所述各存储单元的当前状态的状态信息。
可选地,所述状态信息获得单元52,具体被配置为对所述存储服务器内的各存储单元进行巡检,并生成巡检结果信息,以及,将所述巡检结果信息确定为表征各存储单元的当前状态的状态信息。
可选地,所述性能偏差确定单元53,具体被配置为基于测试结果获得每个存储单元各自的读写性能值,以及,确定所述存储服务器内每两个存储单元各自的读写性能值之间的第一读写性能偏差值;其中,所述第一读写性能偏差值为正数;
相应的,所述故障确定单元54,具体被配置为将第一读写性能偏差值大于预设偏差范围的两个存储单元中,读写性能值较小的存储单元确定为目标存储单元。
可选地,所述性能偏差确定单元53,具体被配置为基于测试结果获得所述存储服务器内每个存储单元的读写性能值,并确定各个存储单元的平均读写性能值;以及,确定每个存储单元的读写性能值与所述平均读写性能值之间的第二读写性能偏差值;其中,所述第二读写性能偏差值为正数;
相应的,所述故障确定单元54,具体被配置为将第二读写性能偏差值大于预设偏差范围的存储单元确定为目标存储单元。
可选地,所述装置还可以包括以下单元:
故障移除单元,在所述目标存储单元未被成功修复的情况下,将所述目标存储单元从所述存储服务器的操作系统中移除;
故障发生单元,生成针对所述目标存储单元的故障报告,并将所述故障报告发送给与所述分布式存储系统通信的故障修复系统。
可选地,所述性能偏差确定单元具体可以包括以下子单元:
负载确定子单元,被配置为获得所述存储服务器内的各个存储单元各自的当前负载;
循环测试子单元,被配置为依次从所述存储服务器内的各个存储单元中确定当前负载小于预设负载阈值的待测存储单元,并对所述待测存储单元进行性能测试;
性能报告生成子单元,被配置为在对所述存储服务器内的各个存储单元均完成性能测试的情况下,根据所述存储服务器内的各个存储单元的性能测试结果,生成性能测试报告。
可选地,所述装置还可以包括以下单元:
故障存储单元确定单元,被配置为在所述状态信息表征所述存储服务器内的至少一个存储单元已经存在故障的情况下,从各所述存储单元中确定故障存储单元;
所述故障修复单元,还被配置为对所述故障存储单元进行修复。
关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种存储服务器的框图。所述存储服务器600是分布式存储系统包括的多个存储服务器中的任一存储服务器,如图6,所述存储服务器600上安装有代理模块66,所述代理模块66用于执行所述的分布式存储系统的信息处理方法。
具体地,存储服务器600可以包括处理组件64、电源组件61、网络接口62、存储组件65及输入输出接口63,其中,代理模块66可以与处理组件64及存储组件65进行通信,代理模块66上可以存储计算机程序,可以由处理组价64运行所述代理模块66上的计算机程序,以使存储服务器600能够执行上述分布式存储系统的信息处理方法。其中,网络接口62可以将存储服务器600连接到网络中,电源组件61可以执行存储服务器600的电源管理。
图7是根据一示例性实施例示出的一种电子设备700的框图,该电子设备可以用于进行分布式存储系统管理,可以包括存储器72、处理器71及存储在存储器72上并可在处理器上运行的计算机程序,所述处理器被配置为执行所述的分布式存储系统的信息处理方法。
本发明实施例还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器端的处理器执行时,使得服务器能够执行所述的分布式存储系统的信息处理方法。可选地,可读存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (19)

1.一种分布式存储系统的信息处理方法,其特征在于,应用于分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器包括多个存储单元,所述分布式存储系统与远程管理终端通信连接,所述方法还包括:
接收所述远程管理终端发送的存储单元检测指令,其中,存储单元为所述存储服务器包括的多个存储单元中的任一存储单元;
响应于所述存储单元检测指令,获得所述存储服务器内表征各存储单元的当前状态的状态信息,一个存储单元的状态信息用于对该存储单元进行故障预判;
在所述状态信息表征所述存储服务器内的至少一个存储单元存在故障风险的情况下,对所述存储服务器内的各个存储单元进行性能测试,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值;
从所述存储服务器内的各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元;
对所述目标存储单元进行修复,包括:采取将所述目标存储单元从所述存储服务器的操作系统和其所在的存储阵列中移除,再将所述目标存储单元重新添加至所述存储阵列及所述操作系统的方式,对所述目标存储单元进行修复。
2.根据权利要求1所述的方法,其特征在于,获得所述存储服务器内表征各存储单元的当前状态的状态信息,包括:
获得所述存储服务器内当前产生的系统日志;
从所述系统日志中读取表征所述各存储单元的当前状态的状态信息。
3.根据权利要求1所述的方法,其特征在于,获得所述存储服务器内表征各存储单元的当前状态的状态信息,包括:
对所述存储服务器内的各存储单元进行巡检,并生成巡检结果信息;
将所述巡检结果信息确定为表征各存储单元的当前状态的状态信息。
4.根据权利要求1所述的方法,其特征在于,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值,包括:
基于测试结果获得每个存储单元各自的读写性能值;
确定所述存储服务器内每两个存储单元各自的读写性能值之间的第一读写性能偏差值;其中,所述第一读写性能偏差值为正数;
从所述存储服务器内的各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元,包括:
将第一读写性能偏差值大于预设偏差范围的两个存储单元中,读写性能值较小的存储单元确定为目标存储单元。
5.根据权利要求1所述的方法,其特征在于,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值,包括:
基于测试结果获得所述存储服务器内每个存储单元的读写性能值,并确定各个存储单元的平均读写性能值;
确定每个存储单元的写入带宽与所述平均读写性能值之间的第二读写性能偏差值;其中,所述第二读写性能偏差值为正数;
从所述存储服务器内的各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元,包括:
将第二读写性能偏差值大于预设偏差范围的存储单元确定为目标存储单元。
6.根据权利要求1所述的方法,其特征在于,在对所述目标存储单元进行修复后,所述方法还包括:
在所述目标存储单元未被成功修复的情况下,将所述目标存储单元从所述存储服务器的操作系统中移除;
生成针对所述目标存储单元的故障报告,并将所述故障报告发送给与所述分布式存储系统通信的故障修复系统。
7.根据权利要求1所述的方法,其特征在于,对所述存储服务器内的各个存储单元进行性能测试,包括:
获得所述存储服务器内的各个存储单元各自的当前负载;
依次从所述存储服务器内的各个存储单元中确定当前负载小于预设负载阈值的待测存储单元,并对所述待测存储单元进行性能测试;
在对所述存储服务器内的各个存储单元均完成性能测试的情况下,根据所述存储服务器内的各个存储单元的性能测试结果,生成性能测试报告。
8.根据权利要求1至7任一所述的方法,其特征在于,所述方法还包括:
在所述状态信息表征所述存储服务器内的至少一个存储单元已经存在故障的情况下,从各所述存储单元中确定已经存在故障的故障存储单元;
对所述故障存储单元进行修复。
9.一种分布式存储系统的信息处理装置,其特征在于,应用于分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器包括多个存储单元,所述分布式存储系统与远程管理终端通信连接;所述装置还包括:
指令接收单元,被配置为接收所述远程管理终端发送的存储单元检测指令,其中,存储单元为所述存储服务器包括的多个存储单元中的任一存储单元;
状态信息获得单元,被配置为响应于所述存储单元检测指令,获得所述存储服务器内表征各存储单元的当前状态的状态信息,一个存储单元的状态信息用于对该存储单元进行故障预判;
性能偏差确定单元,被配置为在所述状态信息表征所述存储服务器内的至少一个存储单元存在故障风险的情况下,对所述存储服务器内的各个存储单元进行性能测试,基于测试结果确定所述存储服务器内的各个存储单元之间的性能偏差值;
故障确定单元,被配置为从所述存储服务器内的各个存储单元中,确定性能偏差值大于预设偏差范围的目标存储单元;
故障修复单元,被配置为对所述目标存储单元进行修复,包括:采取将所述目标存储单元从所述存储服务器的操作系统和其所在的存储阵列中移除,再将所述目标存储单元重新添加至所述存储阵列及所述操作系统的方式,对所述目标存储单元进行修复。
10.根据权利要求9所述的装置,其特征在于,所述状态信息获得单元,具体被配置为获得所述存储服务器内当前产生的系统日志,以及,从所述系统日志中获得表征所述各存储单元的当前状态的状态信息。
11.根据权利要求9所述的装置,其特征在于,所述状态信息获得单元,具体被配置为对所述存储服务器内的各存储单元进行巡检,并生成巡检结果信息,以及,将所述巡检结果信息确定为表征各存储单元的当前状态的状态信息。
12.根据权利要求9所述的装置,其特征在于,所述性能偏差确定单元,具体被配置为基于测试结果获得每个存储单元各自的读写性能值,以及,确定所述存储服务器内每两个存储单元各自的读写性能值之间的第一读写性能偏差值;其中,所述第一读写性能偏差值为正数;
所述故障确定单元,具体被配置为将第一读写性能偏差值大于预设偏差范围的两个存储单元中,读写性能值较小的存储单元确定为目标存储单元。
13.根据权利要求9所述的装置,其特征在于,所述性能偏差确定单元,具体被配置为基于测试结果获得所述存储服务器内每个存储单元的读写性能值,并确定各个存储单元的平均读写性能值;以及,确定每个存储单元的读写性能值与所述平均读写性能值之间的第二读写性能偏差值;其中,所述第二读写性能偏差值为正数;
所述故障确定单元,具体被配置为将第二读写性能偏差值大于预设偏差范围的存储单元确定为目标存储单元。
14.根据权利要求9所述的装置,其特征在于,所述装置还包括:
故障移除单元,在所述目标存储单元未被成功修复的情况下,将所述目标存储单元从所述存储服务器的操作系统中移除;
故障发生单元,生成针对所述目标存储单元的故障报告,并将所述故障报告发送给与所述分布式存储系统通信的故障修复系统。
15.根据权利要求9所述的装置,其特征在于,所述性能偏差确定单元还包括:
负载确定子单元,被配置为获得所述存储服务器内的各个存储单元各自的当前负载;
循环测试子单元,被配置为依次从所述存储服务器内的各个存储单元中确定当前负载小于预设负载阈值的待测存储单元,并对所述待测存储单元进行性能测试;
性能报告生成子单元,被配置为在对所述存储服务器内的各个存储单元均完成性能测试的情况下,根据所述存储服务器内的各个存储单元的性能测试结果,生成性能测试报告。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
故障存储单元确定单元,被配置为在所述状态信息表征所述存储服务器内的至少一个存储单元已经存在故障的情况下,从各所述存储单元中确定故障存储单元;
所述故障修复单元,还被配置为对所述故障存储单元进行修复。
17.一种存储服务器,其特征在于,所述存储服务器是分布式存储系统包括的多个存储服务器中的任一存储服务器,所述存储服务器包括多个存储单元,所述存储服务器上安装有代理模块,所述代理模块用于执行权利要求1-8任一所述的分布式存储系统的信息处理方法。
18.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由服务器端的处理器执行时,使得服务器能够执行权利要求1-8任一所述的分布式存储系统的信息处理方法。
19.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器被配置:执行如权利要求1-8任一所述的分布式存储系统的信息处理方法。
CN201910684765.4A 2019-07-26 2019-07-26 分布式存储系统的信息处理方法、装置、服务器、介质 Active CN110515757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910684765.4A CN110515757B (zh) 2019-07-26 2019-07-26 分布式存储系统的信息处理方法、装置、服务器、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910684765.4A CN110515757B (zh) 2019-07-26 2019-07-26 分布式存储系统的信息处理方法、装置、服务器、介质

Publications (2)

Publication Number Publication Date
CN110515757A CN110515757A (zh) 2019-11-29
CN110515757B true CN110515757B (zh) 2023-05-23

Family

ID=68624125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910684765.4A Active CN110515757B (zh) 2019-07-26 2019-07-26 分布式存储系统的信息处理方法、装置、服务器、介质

Country Status (1)

Country Link
CN (1) CN110515757B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159029B (zh) * 2019-12-24 2023-07-21 中信银行股份有限公司 自动化测试方法、装置、电子设备及计算机可读存储介质
CN112164414B (zh) * 2020-09-25 2023-12-22 北京浪潮数据技术有限公司 一种测试存储设备稳定性的方法及组件

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850480A (zh) * 2015-05-18 2015-08-19 曙光信息产业(北京)有限公司 高密度存储服务器硬盘性能测试的方法及装置
CN106201347A (zh) * 2016-07-04 2016-12-07 联想(北京)有限公司 信息处理方法及固态硬盘
CN108173672A (zh) * 2017-12-04 2018-06-15 华为技术有限公司 检测故障的方法和装置
CN108664346A (zh) * 2017-03-27 2018-10-16 中国移动通信集团福建有限公司 分布式存储系统的节点异常的定位方法、装置和系统
CN109471765A (zh) * 2018-11-14 2019-03-15 郑州云海信息技术有限公司 一种硬盘质量检测系统及方法
CN109558281A (zh) * 2018-11-29 2019-04-02 郑州云海信息技术有限公司 一种测试方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10552241B2 (en) * 2016-06-22 2020-02-04 International Business Machines Corporation Action recommendation to reduce server management errors

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850480A (zh) * 2015-05-18 2015-08-19 曙光信息产业(北京)有限公司 高密度存储服务器硬盘性能测试的方法及装置
CN106201347A (zh) * 2016-07-04 2016-12-07 联想(北京)有限公司 信息处理方法及固态硬盘
CN108664346A (zh) * 2017-03-27 2018-10-16 中国移动通信集团福建有限公司 分布式存储系统的节点异常的定位方法、装置和系统
CN108173672A (zh) * 2017-12-04 2018-06-15 华为技术有限公司 检测故障的方法和装置
CN109471765A (zh) * 2018-11-14 2019-03-15 郑州云海信息技术有限公司 一种硬盘质量检测系统及方法
CN109558281A (zh) * 2018-11-29 2019-04-02 郑州云海信息技术有限公司 一种测试方法、装置及电子设备

Also Published As

Publication number Publication date
CN110515757A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
EP3617886B1 (en) Hot backup system, hot backup method, and computer device
US10936386B2 (en) Method, device and computer program product for monitoring access request
CN106933843B (zh) 数据库心跳检测方法以及装置
CN109274544B (zh) 一种分布式存储系统的故障检测方法及装置
US20120109919A1 (en) High availability database management system and database management method using same
CN110515757B (zh) 分布式存储系统的信息处理方法、装置、服务器、介质
CN111897697A (zh) 服务器硬件故障修复方法和装置
CN105354102B (zh) 一种文件系统维护和修复的方法和装置
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN105323271B (zh) 一种云计算系统以及云计算系统的处理方法和装置
CN105224416B (zh) 修复方法及相关电子装置
CN116633766A (zh) 故障处理方法、装置、电子设备及存储介质
CN115454958A (zh) 基于人工智能的数据处理方法、装置、设备、系统及介质
CN116149932A (zh) 软件系统状态的检测方法、装置及电子设备
CN110287066B (zh) 一种服务器分区迁移方法及相关装置
CN115686951A (zh) 一种数据库服务器的故障处理方法和装置
CN112463444A (zh) 一种数据不一致修复方法及相关装置
CN111447329A (zh) 呼叫中心中状态服务器的监控方法、系统、设备及介质
CN113688017B (zh) 多节点BeeGFS文件系统自动化异常测试方法及装置
US20230143343A1 (en) Method and system for regular testing of datacenter hardware
CN112084085B (zh) 系统断电记录方法
CN115509822A (zh) 一种自动化检测恢复历史数据库的方法
CN116244105A (zh) 一种数据库业务信息的处理方法、装置、设备及介质
CN116401118A (zh) 一种文件共享服务Samba监测方法及装置
CN116126969A (zh) 分布式数据库的重启方法、装置、存储介质以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant