CN106201834A - 一种磁盘损坏的处理方法和装置 - Google Patents

一种磁盘损坏的处理方法和装置 Download PDF

Info

Publication number
CN106201834A
CN106201834A CN201610530546.7A CN201610530546A CN106201834A CN 106201834 A CN106201834 A CN 106201834A CN 201610530546 A CN201610530546 A CN 201610530546A CN 106201834 A CN106201834 A CN 106201834A
Authority
CN
China
Prior art keywords
disk
mistake
time
configuration file
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610530546.7A
Other languages
English (en)
Inventor
侯志贞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610530546.7A priority Critical patent/CN106201834A/zh
Publication of CN106201834A publication Critical patent/CN106201834A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种磁盘损坏的处理方法,包括:监测磁盘的运行状态;若监测到磁盘数据读写操作发生错误,将错误磁盘的磁盘信息记录至磁盘错误表;从配置文件中移除所述错误磁盘的磁盘信息;若监测到所述错误磁盘被替换为替换磁盘,将替换磁盘的磁盘信息加入所述配置文件。本发明实施例通过监控磁盘的运行状态,将错误磁盘的磁盘信息记录至磁盘错误表,实现了对磁盘错误的监控和记录;通过从配置文件移除错误磁盘及添加替换磁盘,实现了对于错误磁盘替换这一过程的自动操作,简化了磁盘损坏的处理流程,降低人力成本。

Description

一种磁盘损坏的处理方法和装置
技术领域
本发明涉及通信技术领域,特别是指一种磁盘损坏的处理方法和装置。
背景技术
Hadoop为一种高度容错的多副本的集群存储分布式系统,是目前业界广泛使用的数据存储以及查询的分布式解决方案,适用于部署在廉价的PC Server上从而降低了大数据处理的前期成本。对于规模较大的Hadoop磁盘集群而言,磁盘数以万计,基本上每天都会有磁盘损坏,需要工作人员进行更换。
发明人在实现本发明的过程中发现,现有技术中处理磁盘损坏的方法通常为:通过检测磁盘读写等数据判断磁盘是否损坏,若检测到某一磁盘损坏,则人工对该磁盘的配置信息进行改写,将其从集群中移除,经运维人员更换后再人工添加至集群中。这一过程几乎完全依靠人工操作,不但费时费力而且缺乏必要管控,不利于企业在大数据业务上的长期发展与未来规划。
发明内容
有鉴于此,本发明实施例的目的在于提出一种磁盘损坏的处理方法和装置,用以实现在更换损坏磁盘的过程中,对磁盘的配置文件进行自动设置。
基于上述目的,在本发明实施例的一个方面提供一种磁盘损坏的处理方法,包括:
监测磁盘的运行状态;
若监测到磁盘数据读写操作发生错误,将错误磁盘的磁盘信息记录至磁盘错误表;
从配置文件中移除所述错误磁盘的磁盘信息;
若监测到所述错误磁盘被替换,将替换磁盘的磁盘信息加入所述配置文件。
在可选的实施例中,所述磁盘错误表包括ip地址、磁盘名、错误发生时间;所述将错误磁盘的磁盘信息记录至磁盘错误表,具体包括:
将所述错误磁盘的ip地址和磁盘名作为联合主键记录至所述磁盘错误表;
将监测到磁盘数据读写操作发生错误的时间作为错误发生时间记录至所述磁盘错误表。
在可选的实施例中,所述磁盘错误表包括移除时间,所述移除时间的初始值为空;所述从配置文件中移除所述错误磁盘的磁盘信息,具体包括:
定时遍历所述磁盘错误表中各所述错误磁盘的移除时间;
若判定所述移除时间为空,进一步判断所述移除时间对应的错误磁盘的磁盘信息是否存在于所述配置文件中;
若存在于所述配置文件中,从所述配置文件中移除所述移除时间对应错误磁盘的磁盘信息;将所述从配置文件中移除所述错误磁盘的磁盘信息的时间,作为移除时间记录至所述磁盘错误表中。
在可选的实施例中,所述磁盘错误表包括修复时间;所述方法还包括:
将在磁盘集群中监测到所述错误磁盘对应的替换磁盘的时间,作为修复时间记录至所述磁盘错误表。
在可选的实施例中,其特征在于,所述修复时间的初始值为空,所述磁盘错误表包括添加时间,所述若监测到所述错误磁盘被替换,将替换磁盘的磁盘信息加入所述配置文件,具体包括:
定时遍历所述磁盘错误表中各所述错误磁盘的修复时间;
若判定所述修复时间的值不为空,判断所述修复时间对应的替换磁盘的磁盘信息是否存在于配置文件中;
若不存在于所述配置文件中,将所述修复时间对应的替换磁盘的磁盘信息加入所述配置文件;将所述替换磁盘的磁盘信息加入所述配置文件的时间,作为添加时间记录至所述磁盘错误表。
在可选的实施例中,所述添加时间的初始值为空,所述方法还包括:
定时遍历所述磁盘错误表中各错误磁盘的添加时间;
若添加时间不为空,将该添加时间对应错误磁盘的错误信息记录至错误历史记录表,从所述磁盘错误表中删除所述该添加时间对应错误磁盘的错误信息。
在可选的实施例中,所述方法还包括:
判断所述错误磁盘是否记录有日志文件;
若所述错误磁盘记录有日志文件,选择可用磁盘作为临时磁盘;
用所述临时磁盘的磁盘信息替换所述配置文件中所述错误磁盘的磁盘信息。
在可选的实施例中,所述方法还包括:
建立配置记录表,将记录有日志文件的磁盘的磁盘信息记录至所述配置记录表;
所述选择可用磁盘作为临时磁盘,具体包括:
遍历全部所述可用磁盘,确定没有被记录至所述磁盘错误表,且同时没有被记录至所述配置记录表的目标可用磁盘,选择所述目标磁盘作为所述临时磁盘。
基于上述目的,在本发明实施例的另一方面提供一种磁盘损坏的处理装置,包括:
状态监测单元,用于监测磁盘的运行状态;
错误表处理单元,用于在监测到磁盘数据读写操作发生错误后,将错误磁盘的磁盘信息记录至磁盘错误表;
配置文件处理单元,用于从配置文件中移除所述错误磁盘的磁盘信息,在监测到所述错误磁盘被替换后,将替换磁盘的磁盘信息加入所述配置文件。
在可选的实施例中,所述磁盘错误表包括ip地址、磁盘名、错误发生时间;
所述错误表处理单元还用于将所述错误磁盘的ip地址和磁盘名作为联合主键记录至所述磁盘错误表,将监测到磁盘数据读写操作发生错误的时间作为错误发生时间记录至所述磁盘错误表。
在可选的实施例中,所述磁盘错误表包括移除时间,所述移除时间的初始值为空;
所述配置文件处理单元还用于定时遍历所述磁盘错误表中各所述错误磁盘的移除时间,若所述移除时间为空,进一步判断所述移除时间对应的错误磁盘的磁盘信息是否存在于所述配置文件中;若存在于所述配置文件中,从所述配置文件中移除所述移除时间对应错误磁盘的磁盘信息;
所述错误表处理单元还用于将所述从配置文件中移除所述错误磁盘的磁盘信息的时间,作为移除时间记录至所述磁盘错误表中。
在可选的实施例中,所述磁盘错误表包括修复时间;
所述错误表处理单元还用于将在磁盘集群中检测到所述错误磁盘对应的替换磁盘的时间,作为修复时间记录至所述磁盘错误表。
在可选的实施例中,所述修复时间的初始值为空,所述磁盘错误表包括添加时间;
所述配置文件处理单元还用于定时遍历所述磁盘错误表中各所述错误磁盘的修复时间,若判定所述修复时间的值不为空,判断所述修复时间对应的替换磁盘的磁盘信息是否存在于配置文件中,若不存在于配置文件中,将所述修复时间对应的替换磁盘的磁盘信息加入所述配置文件;
所述错误表处理单元还用于将所述替换磁盘的磁盘信息加入所述配置文件的时间作为添加时间记录至所述磁盘错误表。
在可选的实施例中,所述添加时间的初始值为空:
所述配置文件处理单元还用于定时遍历所述磁盘错误表中各所述错误磁盘的添加时间,所述装置还包括:
历史记录表处理单元,用于若添加时间不为空,将所述添加时间对应错误磁盘的错误信息记录至错误历史记录表;
所述错误表处理单元还用于从所述磁盘错误表中删除所述添加时间对应的所述错误磁盘的错误信息。
在可选的实施例中,所述装置还包括:
磁盘处理单元,用于判断所述错误磁盘是否记录有日志文件,若所述错误磁盘记录有日志文件,选择可用磁盘作为临时磁盘,用所述临时磁盘的磁盘信息替换所述配置文件中所述错误磁盘的磁盘信息。
在可选的实施例中,所述装置还包括:
配置记录表单元,用于建立配置记录表,将记录有日志文件的磁盘的磁盘信息记录至所述配置记录表,遍历全部所述可用磁盘,确定没有被记录至所述磁盘错误表,且同时没有被记录至所述配置记录表的目标可用磁盘,选择所述目标磁盘作为所述临时磁盘。
从上面所述可以看出,本发明实施例提供的方法和装置通过监控磁盘的运行状态,将错误磁盘的磁盘信息记录至磁盘错误表,实现了对磁盘错误的监控和记录;通过从配置文件移除错误磁盘及添加替换磁盘,实现了对于错误磁盘替换这一过程的自动操作,简化了磁盘损坏的处理流程,降低人力成本。
附图说明
图1为本发明提供的一种磁盘损坏的处理方法的实施例的流程示意图;
图2为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;
图3为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;
图4为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;
图5为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;
图6为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;
图7为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;
图8为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;
图9为本发明提供的一种磁盘损坏的处理装置的实施例的模块示意图;
图10为本发明提供的一种磁盘损坏的处理装置的另一实施例的模块示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
图1为本发明提供的一种磁盘损坏的处理方法的实施例的流程示意图。如图所示,在本发明提供的磁盘损坏的处理方法的一个实施例中,包括:
S10,监测磁盘的运行状态。
常用的监测指标为,监控磁盘的数据读写操作;若发现磁盘读取或写入数据至少一项的数值超出预设的常规阈值(例如,磁盘读取或写入数据的速度为0)则判定该磁盘运行状态异常。
S11,若监测到磁盘数据读写操作发生错误,将错误磁盘的磁盘信息记录至磁盘错误表。
S12,从配置文件中移除所述错误磁盘的磁盘信息。所述配置文件隶属于上层应用,上层应用根据配置文件中记录的磁盘信息,选择相应磁盘执行数据读写操作,完成数据的存储的调取。
S13,若监测到所述错误磁盘被替换为替换磁盘,将替换磁盘的磁盘信息加入所述配置文件。
在步骤S12、S13中,所述配置文件中预设了一定数量的磁盘,通过Hadoop的基本分布式存储设置方案,对配置文件中的磁盘配置目录。当从所述配置文件中移除所述错误磁盘的磁盘信息后,则选取剩余磁盘重新进行目录的分配或调整;同理,添加替换磁盘后,选取包括替换磁盘在内的全部磁盘重新进行目录的分配或调整。上述目录分配和调整的方法可以根据实际需要由技术人员进行调整,在此不再赘述。需要说明的是,步骤S12、S13执行完毕后,均需要重新启动上层应用,以重新加载配置文件,完成磁盘及目录的分配调整。
综上所述可以看出,本实施例通过监控磁盘的运行状态,将错误磁盘的磁盘信息记录至磁盘错误表,实现了对磁盘错误的监控和记录;通过从配置文件移除错误磁盘及添加替换磁盘,实现了对于错误磁盘替换这一过程的自动操作,简化了磁盘损坏的处理流程,降低人力成本。
在本发明的另一实施例中,给出了所述磁盘错误表的一种具体实现方式,如表1所示:
表1磁盘错误表
步骤S11中,所述错误磁盘的磁盘信息包括表中的集群名称、组名称、ip地址、磁盘名和错误发生时间;其中集群名称和组名称用于定位所述错误磁盘的分组,ip地址和磁盘名作为联合主键对磁盘进行唯一确定。所述错误发生时间是指检测到所述错误磁盘发生错误的时间。通过上传所述磁盘信息,可以将磁盘发生错误的事件进行记录,便于后期统计。
所述移除时间、修复时间和添加时间后续伴随磁盘的修复过程初步添加,用于记录该错误磁盘被修复的全过程。在可选的实施方式中,还可以设置一个变量或表格用于记录单位时间内(例如,一天内)发生错误的磁盘总数,当单位时间内发生错误的磁盘总数超过预设阈值时,则判定可能发生了意外事故,为了防止分布式存储系统因可用磁盘数量过少而停止,后续监测到磁盘发生错误时,不再移除所述磁盘的磁盘信息,而是向管理中心发出警报。
图2为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图。如图所示,在本实施例的一些可选的实施方式中,所述磁盘错误表包括ip地址、磁盘名、错误发生时间,所述磁盘错误表中记录有至少2个所述错误磁盘的磁盘信息;步骤S11中,将错误磁盘的磁盘信息记录至磁盘错误表,具体包括:
S20,将所述错误磁盘的ip地址和磁盘名作为联合主键记录至所述磁盘错误表。所述联合主键用于唯一确定所述错误磁盘。
S21,将监测到磁盘数据读写操作发生错误的时间作为错误发生时间记录至所述磁盘错误表。
经执行上述步骤S20-S21,唯一确定了错误磁盘,并记录了错误磁盘发生错误的时间。
图3为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图。如图所示,在本实施例的一些可选的实施方式中,所述磁盘错误表包括移除时间,所述移除时间的初始值为空;步骤S12中,从上层应用的配置文件中移除所述错误磁盘的磁盘信息,具体包括:
S30,定时遍历所述磁盘错误表中各所述错误磁盘的移除时间。判断移除时间的数值是否为空。
S31,若判定所述移除时间为空,进一步判断所述移除时间对应的错误磁盘的磁盘信息是否存在于所述配置文件中。
S32,若存在于所述配置文件中,从所述配置文件中移除所述移除时间对应错误磁盘的磁盘信息。
S33,将所述从配置文件中移除所述错误磁盘的磁盘信息的时间,作为移除时间记录至所述磁盘错误表中。
本实施例具体说明了从上层应用的配置文件中移除所述错误磁盘的磁盘信息的方法。所述磁盘错误表用于记录错误磁盘,当错误磁盘发生错误后,磁盘错误表中会新建该错误磁盘对应的项目,并记录该错误磁盘的错误发生时间;此时该错误磁盘的磁盘信息尚未从配置文件中被移除,其相应的移除时间的值为空。在遍历磁盘错误表的移除时间时,若发现有移除时间的值为空,则可以确定该移除时间对应的错误磁盘的磁盘信息有很大可能没有从配置文件中移除(不排除在一些特定情况下,为了维持系统稳定,已经由人为将其移除),然后进一步确定磁盘信息是否存在于配置文件中;若存在于配置文件中,则将该磁盘的磁盘信息从配置文件移除并将此时的时间记录为移除时间。在下一次进行遍历时,由于已经存在移除时间,不会对该磁盘的磁盘信息在配置文件中的存在与否进行进一步检测,节省了时间。可选的,当进一步确定磁盘信息是否存在于配置文件中时,发现磁盘信息已经不存在于配置文件,则可能由于一些人为隐私磁盘信息已经被移除,此时将本次检测时间作为移除时间记录至磁盘错误表中。
进一步,本实施方式还可以包括:
S34,从上层应用的配置文件中移除该错误发生时间对应错误磁盘的磁盘信息后,在磁盘错误表中该错误磁盘的错误时间一项添加已处理标记。所述已处理标记可以是特定内容的字符串等易识别的内容,用于标定已经完成移除操作的错误磁盘,这样在下次遍历时无需再次向上层应用查询,可以节省时间和资源。步骤S34使用错误时间这一项目标记错误磁盘移除,也是一种可选的方式。
图4为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;如图所示,在本实施例的一些可选的实施方式中,所述磁盘错误表包括修复时间;所述方法还包括:
S40,将在磁盘集群中检测到该错误磁盘对应的替换磁盘的时间,作为修复时间记录至所述磁盘错误表。
当运维人员将替换磁盘安装完成后,在磁盘集群中可以检测到所述替换磁盘,将这一时间作为修复时间记录至磁盘错误表中,一方面作为维护过程的记录,另一方面还可以作为后续步骤执行的判定依据。
图5为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;如图所示,在本实施例的一些可选的实施方式中,所述修复时间的初始值为空,所述磁盘错误表包括添加时间,步骤S13中,所述若监测到所述错误磁盘被替换为替换磁盘,将替换磁盘的磁盘信息加入所述配置文件,具体包括:
S50,定时遍历所述磁盘错误表中各错误磁盘的修复时间。
S51,若判定修复时间的值不为空,判断该修复时间对应错误磁盘的磁盘信息是否存在于上层应用的配置文件中。
S52,若判定不存在于上层应用的配置文件中,将用于替换该修复时间对应错误磁盘的替换磁盘的磁盘信息加入所述配置文件。
S53,将替换磁盘的磁盘信息加入所述配置文件的时间作为添加时间记录至所述磁盘错误表。
本实施例的步骤通过监测修复时间的值是否为空,判断错误磁盘是否已经被替换为替换磁盘,在判定替换完成后将替换磁盘的磁盘信息加入配置文件中并将加入的时间作为添加时间记录至磁盘错误表,从而完成将替换磁盘的磁盘信息自动加入所述配置文件的过程。
图6为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图;如图所示,在本实施例的一些可选的实施方式中,所述添加时间的初始值为空,所述方法还包括:
S60,定时遍历所述磁盘错误表中各错误磁盘的添加时间;
S61,若添加时间不为空,将该添加时间对应错误磁盘的错误信息记录至错误历史记录表,从所述磁盘错误表中删除所述该添加时间对应错误磁盘的错误信息。若添加时间不为空,则可以判定用于替换该错误磁盘的替换磁盘已经安装并被添加至上层应用的配置文件中,此时可以移除该错误磁盘在磁盘错误表中的记录,并将这些记录转移至错误历史记录表中,以备查看。
所述步骤S61中指出的错误历史记录表所记录的内容与表1所示的磁盘错误表所记载的项目相同,只是功能上用于备份。
图7为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图。如图所示,在本实施例的一些可选的实施方式中,所述方法还包括:
S70,判断所述错误磁盘是否记录有日志文件。
S71,若所述错误磁盘记录有日志文件,选择可用磁盘作为临时磁盘;用所述临时磁盘的磁盘信息替换所述配置文件中所述错误磁盘的磁盘信息。
对于一些特殊磁盘,特别是作为一些服务的日志输出目录的磁盘来说,并不能简单地将其移除,而是需要找到一个替代磁盘作为临时目录记录日志文件。因此本实施例中,若判定错误磁盘为特殊磁盘,将错误磁盘的磁盘信息删除后,选取可用的临时磁盘替换错误磁盘原所属位置,替代其作为日志输出磁盘。
图8为本发明提供的一种磁盘损坏的处理方法的另一实施例的流程示意图。如图所示,在本实施例的一些可选的实施方式中,所述方法还包括:
S80,建立配置记录表,将记录有日志文件的磁盘的磁盘信息记录至所述配置记录表。
由于日志输出磁盘需要承载较大的数据吞吐量,还要担负较为繁重的数据分析业务。如果将两种不同应用的日志选择同一磁盘输出,则会影响到二者的工作效率。因此设置配置记录表,用于记录全部作为日志文件输出目录的磁盘,以便在后续选择时予以排除。步骤S80中指出的配置记录表的一个具体实施方式如表2所示:
表2配置记录表
步骤S71中,选择可用磁盘作为临时磁盘,具体包括:
S81,遍历全部所述可用磁盘,确定没有被记录至所述磁盘错误表,且同时没有被记录至所述配置记录表的目标可用磁盘,选择所述目标磁盘作为所述临时磁盘。
所述可用的磁盘是指能够替换错误磁盘的其他磁盘,例如与错误磁盘属于同一集群、组或类别的磁盘。当确定某一可用磁盘的磁盘信息没有被记录至所述磁盘错误表,且同时没有被记录至所述配置记录表时,则可以确定该磁盘既没有损坏,又不是日志输出磁盘,可以作为临时磁盘使用。
综上所述可以看出,本实施例在对错误磁盘的磁盘信息进行记录时,记录了包括错误发生时间、移除时间、修复时间和添加时间的时间节点信息,在对磁盘修复进程进行监控时,可以通过这些信息明确磁盘修复的阶段以及下一步需要执行的修复项目;另一方面,通过使用这些时间节点信息作为触发条件,实现了对于磁盘配置文件的自动修改,将原本需要人为设置的内容转变为自动设置,节省了人力成本;又一方面,对于记录有日志文件的磁盘进行特殊处理,使用现有可用磁盘进行替代,以保证日志文件的成功输出,保障了系统的完整和安全运行。
图9为本发明提供的一种磁盘损坏的处理装置的实施例的模块示意图。本发明提供的磁盘损坏的处理装置的一个实施例,所述处理装置为计算机、服务器等用于执行管理监控功能的计算设备,本实施例的装置包括:
状态监测单元90,用于监测磁盘的运行状态;
错误表处理单元91,用于在监测到磁盘数据读写操作发生错误后,将错误磁盘的磁盘信息记录至磁盘错误表;
配置文件处理单元92,用于从上层应用的配置文件中移除所述错误磁盘的磁盘信息;还用于在监测到所述错误磁盘被替换为替换磁盘后,将替换磁盘的磁盘信息加入所述配置文件。
从上面所述可以看出,本实施例通过状态监测单元90监控磁盘的运行状态,通过错误表处理单元91将错误磁盘的磁盘信息记录至磁盘错误表,实现了对磁盘错误的监控和记录;通过配置文件处理单元92从配置文件移除错误磁盘及添加替换磁盘,实现了对于错误磁盘替换这一过程的自动操作,简化了磁盘损坏的处理流程,降低人力成本。
图10为本发明提供的一种磁盘损坏的处理装置的另一实施例的模块示意图。如图所示,在另一可选的实施例中,所述磁盘错误表包括ip地址、磁盘名、错误发生时间;所述错误表处理单元91用于将所述错误磁盘的ip地址和磁盘名作为联合主键记录至所述磁盘错误表;还用于将监测到磁盘数据读写操作发生错误的时间作为错误发生时间记录至所述磁盘错误表。
在本实施例的一些可选的实施方式中,所述磁盘错误表包括移除时间,所述移除时间的初始值为空;所述配置文件处理单元92用于定时遍历所述磁盘错误表中各所述错误磁盘的移除时间,若判定所述移除时间为空,进一步判断所述移除时间对应的错误磁盘的磁盘信息是否存在于所述配置文件中;若存在于所述配置文件中,从所述配置文件中移除所述移除时间对应错误磁盘的磁盘信息;所述错误表处理单元91还用于将所述从配置文件中移除所述错误磁盘的磁盘信息的时间,作为移除时间记录至所述磁盘错误表中。
在本实施例的一些可选的实施方式中,所述磁盘错误表包括修复时间;所述错误表处理单元91用于将在磁盘集群中检测到该错误磁盘对应的替换磁盘的时间,作为修复时间记录至所述磁盘错误表。
在本实施例的一些可选的实施方式中,所述修复时间的初始值为空,所述磁盘错误表包括添加时间,所述配置文件处理单元92用于定时遍历所述磁盘错误表中各错误磁盘的修复时间;若判定修复时间的值不为空,判断该修复时间对应错误磁盘的磁盘信息是否存在于上层应用的配置文件中;若判定不存在于上层应用的配置文件中,将用于替换该修复时间对应错误磁盘的替换磁盘的磁盘信息加入所述配置文件;所述错误表处理单元92还用于将替换磁盘的磁盘信息加入所述配置文件的时间作为添加时间记录至所述磁盘错误表。
在本实施例的一些可选的实施方式中,所述添加时间的初始值为空,所述配置文件处理单元92还用于定时遍历所述磁盘错误表中各错误磁盘的添加时间。
所述装置还包括历史记录表处理单元93,用于若添加时间不为空,将所述添加时间对应错误磁盘的错误信息记录至错误历史记录表,所述错误表处理单元91用于从所述磁盘错误表中删除所述该添加时间对应错误磁盘的错误信息。
在本实施例的一些可选的实施方式中,所述装置还包括:
磁盘处理单元94,用于判断所述错误磁盘是否记录有日志文件;若所述错误磁盘记录有日志文件,选择可用磁盘作为临时磁盘,用所述临时磁盘的磁盘信息替换所述配置文件中所述错误磁盘的磁盘信息。
在本实施例的一些可选的实施方式中,所述装置还包括:
配置记录表单元95,用于建立配置记录表,将记录有日志文件的磁盘的磁盘信息记录至所述配置记录表,用于遍历全部可用的磁盘,若判断遍历到的磁盘的磁盘信息没有被记录至所述磁盘错误表,且同时没有被记录至所述配置记录表,则选择该磁盘作为临时磁盘。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种磁盘损坏的处理方法,其特征在于,包括:
监测磁盘的运行状态;
若监测到磁盘数据读写操作发生错误,将错误磁盘的磁盘信息记录至磁盘错误表;
从配置文件中移除所述错误磁盘的磁盘信息;
若监测到所述错误磁盘被替换,将替换磁盘的磁盘信息加入所述配置文件。
2.根据权利要求1所述的方法,其特征在于,所述磁盘错误表包括ip地址、磁盘名、错误发生时间;所述将错误磁盘的磁盘信息记录至磁盘错误表,具体包括:
将所述错误磁盘的ip地址和磁盘名作为联合主键记录至所述磁盘错误表;
将监测到磁盘数据读写操作发生错误的时间作为错误发生时间记录至所述磁盘错误表。
3.根据权利要求2所述的方法,其特征在于,所述磁盘错误表包括移除时间,所述移除时间的初始值为空;所述从配置文件中移除所述错误磁盘的磁盘信息,具体包括:
定时遍历所述磁盘错误表中各所述错误磁盘的移除时间;
若所述移除时间为空,进一步判断所述移除时间对应的错误磁盘的磁盘信息是否存在于所述配置文件中;
若存在于所述配置文件中,从所述配置文件中移除所述移除时间对应错误磁盘的磁盘信息;将所述从配置文件中移除所述错误磁盘的磁盘信息的时间,作为移除时间记录至所述磁盘错误表中。
4.根据权利要求2所述的方法,其特征在于,所述磁盘错误表包括修复时间;所述方法还包括:
将在磁盘集群中监测到所述错误磁盘对应的替换磁盘的时间,作为修复时间记录至所述磁盘错误表。
5.根据权利要求4所述的方法,其特征在于,所述修复时间的初始值为空,所述磁盘错误表包括添加时间,所述若监测到所述错误磁盘被替换,将替换磁盘的磁盘信息加入所述配置文件,具体包括:
定时遍历所述磁盘错误表中各所述错误磁盘的修复时间;
若所述修复时间的值不为空,判断所述修复时间对应的替换磁盘的磁盘信息是否存在于配置文件中;
若不存在于所述配置文件中,将所述修复时间对应的替换磁盘的磁盘信息加入所述配置文件;将所述替换磁盘的磁盘信息加入所述配置文件的时间,作为添加时间记录至所述磁盘错误表。
6.根据权利要求5所述的方法,其特征在于,所述添加时间的初始值为空,所述方法还包括:
定时遍历所述磁盘错误表中各所述错误磁盘的添加时间;
若所述添加时间不为空,从所述磁盘错误表中删除所述添加时间对应的所述错误磁盘的错误信息,将所述添加时间对应的所述错误磁盘的错误信息记录至错误历史记录表。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述错误磁盘是否记录有日志文件;
若所述错误磁盘记录有日志文件,选择可用磁盘作为临时磁盘;
用所述临时磁盘的磁盘信息替换所述配置文件中所述错误磁盘的磁盘信息。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
建立配置记录表,将记录有日志文件的磁盘的磁盘信息记录至所述配置记录表;
所述选择可用磁盘作为临时磁盘,具体包括:
遍历全部所述可用磁盘,确定没有被记录至所述磁盘错误表,且同时没有被记录至所述配置记录表的目标可用磁盘,选择所述目标磁盘作为所述临时磁盘。
9.一种磁盘损坏的处理装置,其特征在于,包括:
状态监测单元,用于监测磁盘的运行状态;
错误表处理单元,用于在监测到磁盘数据读写操作发生错误后,将错误磁盘的磁盘信息记录至磁盘错误表;
配置文件处理单元,用于从配置文件中移除所述错误磁盘的磁盘信息,在监测到所述错误磁盘被替换后,将替换磁盘的磁盘信息加入所述配置文件。
10.根据权利要求9所述的装置,其特征在于,所述磁盘错误表包括ip地址、磁盘名、错误发生时间;
所述错误表处理单元还用于将所述错误磁盘的ip地址和磁盘名作为联合主键记录至所述磁盘错误表,将监测到磁盘数据读写操作发生错误的时间作为错误发生时间记录至所述磁盘错误表。
11.根据权利要求10所述的装置,其特征在于,所述磁盘错误表包括移除时间,所述移除时间的初始值为空;
所述配置文件处理单元还用于定时遍历所述磁盘错误表中各所述错误磁盘的移除时间,若所述移除时间为空,进一步判断所述移除时间对应的错误磁盘的磁盘信息是否存在于所述配置文件中;若存在于所述配置文件中,从所述配置文件中移除所述移除时间对应错误磁盘的磁盘信息;
所述错误表处理单元还用于将所述从配置文件中移除所述错误磁盘的磁盘信息的时间,作为移除时间记录至所述磁盘错误表中。
12.根据权利要求10所述的装置,其特征在于,所述磁盘错误表包括修复时间;
所述错误表处理单元还用于将在磁盘集群中检测到所述错误磁盘对应的替换磁盘的时间,作为修复时间记录至所述磁盘错误表。
13.根据权利要求12所述的装置,其特征在于,所述修复时间的初始值为空,所述磁盘错误表包括添加时间;
所述配置文件处理单元还用于定时遍历所述磁盘错误表中各所述错误磁盘的修复时间,若判定所述修复时间的值不为空,判断所述修复时间对应的替换磁盘的磁盘信息是否存在于配置文件中,若不存在于配置文件中,将所述修复时间对应的替换磁盘的磁盘信息加入所述配置文件;
所述错误表处理单元还用于将所述替换磁盘的磁盘信息加入所述配置文件的时间作为添加时间记录至所述磁盘错误表。
14.根据权利要求13所述的装置,其特征在于,所述添加时间的初始值为空:
所述配置文件处理单元还用于定时遍历所述磁盘错误表中各所述错误磁盘的添加时间,所述装置还包括:
历史记录表处理单元,用于若添加时间不为空,将所述添加时间对应错误磁盘的错误信息记录至错误历史记录表;
所述错误表处理单元还用于从所述磁盘错误表中删除所述添加时间对应的所述错误磁盘的错误信息。
15.根据权利要求9所述的装置,其特征在于,所述装置还包括:
磁盘处理单元,用于判断所述错误磁盘是否记录有日志文件,若所述错误磁盘记录有日志文件,选择可用磁盘作为临时磁盘,用所述临时磁盘的磁盘信息替换所述配置文件中所述错误磁盘的磁盘信息。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
配置记录表单元,用于建立配置记录表,将记录有日志文件的磁盘的磁盘信息记录至所述配置记录表,遍历全部所述可用磁盘,确定没有被记录至所述磁盘错误表,且同时没有被记录至所述配置记录表的目标可用磁盘,选择所述目标磁盘作为所述临时磁盘。
CN201610530546.7A 2016-07-06 2016-07-06 一种磁盘损坏的处理方法和装置 Pending CN106201834A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610530546.7A CN106201834A (zh) 2016-07-06 2016-07-06 一种磁盘损坏的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610530546.7A CN106201834A (zh) 2016-07-06 2016-07-06 一种磁盘损坏的处理方法和装置

Publications (1)

Publication Number Publication Date
CN106201834A true CN106201834A (zh) 2016-12-07

Family

ID=57473540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610530546.7A Pending CN106201834A (zh) 2016-07-06 2016-07-06 一种磁盘损坏的处理方法和装置

Country Status (1)

Country Link
CN (1) CN106201834A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107911713A (zh) * 2017-11-08 2018-04-13 北京奇艺世纪科技有限公司 一种磁盘的确定方法及装置
CN108121620A (zh) * 2017-12-22 2018-06-05 联想(北京)有限公司 分布式文件系统的修复方法及系统和服务器
CN109669796A (zh) * 2018-12-20 2019-04-23 湖南快乐阳光互动娱乐传媒有限公司 一种磁盘故障的预测方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040117610A1 (en) * 2002-12-17 2004-06-17 Hensley John Alan Method of altering a computer operating system to boot and run from protected media
CN101276302A (zh) * 2007-03-29 2008-10-01 中国科学院计算技术研究所 一种磁盘阵列系统中磁盘故障处理和数据重构方法
CN102508760A (zh) * 2011-11-17 2012-06-20 浪潮(北京)电子信息产业有限公司 独立磁盘冗余阵列预警方法和系统
CN102521058A (zh) * 2011-12-01 2012-06-27 北京威视数据系统有限公司 Raid组磁盘数据预迁移方法
CN105242998A (zh) * 2015-09-01 2016-01-13 福建新大陆软件工程有限公司 一种基于hdfs的磁盘故障检测方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040117610A1 (en) * 2002-12-17 2004-06-17 Hensley John Alan Method of altering a computer operating system to boot and run from protected media
CN101276302A (zh) * 2007-03-29 2008-10-01 中国科学院计算技术研究所 一种磁盘阵列系统中磁盘故障处理和数据重构方法
CN102508760A (zh) * 2011-11-17 2012-06-20 浪潮(北京)电子信息产业有限公司 独立磁盘冗余阵列预警方法和系统
CN102521058A (zh) * 2011-12-01 2012-06-27 北京威视数据系统有限公司 Raid组磁盘数据预迁移方法
CN105242998A (zh) * 2015-09-01 2016-01-13 福建新大陆软件工程有限公司 一种基于hdfs的磁盘故障检测方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107911713A (zh) * 2017-11-08 2018-04-13 北京奇艺世纪科技有限公司 一种磁盘的确定方法及装置
CN107911713B (zh) * 2017-11-08 2020-05-22 北京奇艺世纪科技有限公司 一种磁盘的确定方法及装置
CN108121620A (zh) * 2017-12-22 2018-06-05 联想(北京)有限公司 分布式文件系统的修复方法及系统和服务器
CN109669796A (zh) * 2018-12-20 2019-04-23 湖南快乐阳光互动娱乐传媒有限公司 一种磁盘故障的预测方法和装置
CN109669796B (zh) * 2018-12-20 2022-02-11 湖南快乐阳光互动娱乐传媒有限公司 一种磁盘故障的预测方法和装置

Similar Documents

Publication Publication Date Title
CN111600740A (zh) 远程运维管理系统及方法
CN103458086B (zh) 一种智能手机及其故障检测方法
CN107608826A (zh) 一种存储集群的节点的故障恢复方法、装置及介质
CN106201834A (zh) 一种磁盘损坏的处理方法和装置
CN107085546A (zh) 基于故障域技术的数据管理方法和装置
CN103984309A (zh) 一种具有容灾功能的卷烟生产系统及其容灾演练方法
CN103152198B (zh) 基于微服务器的自动化资产管理方法和装置
CN105354102A (zh) 一种文件系统维护和修复的方法和装置
CN108509296B (zh) 一种处理设备故障的方法和系统
DE102015105414B4 (de) Bearbeiten eines Zielspeichers
CN107122254B (zh) 一种计算机修复控制方法及系统、修复方法及系统
CN105224416A (zh) 修复方法及相关电子装置
CN104158843A (zh) 分布式文件存储系统的存储单元失效检测方法及装置
CN107105037A (zh) 一种基于文件校验的分布式视频cdn资源管理系统及方法
CN105652119A (zh) 故障信息的获取方法,装置及系统
CN111625185B (zh) 一种磁盘故障监控的方法、系统及相关组件
CN101201766A (zh) 设备信息修复系统及方法
CN104239182B (zh) 一种集群文件系统脑裂处理方法和装置
US20120084264A1 (en) System for configurable reporting of network data and related method
CN105765908B (zh) 一种多站点自动更新方法、客户端和系统
CN113656358A (zh) 一种数据库日志文件处理方法及系统
CN112328173A (zh) 一种分布式存储系统磁盘故障修复方法及装置
CN106296550A (zh) 列车故障查询系统
CN111813589A (zh) 一种分布式集群故障定位方法、装置、设备及存储介质
CN104407932A (zh) 一种数据备份方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161207