CN105426273A - 恢复物理存储单元数据的方法和服务器 - Google Patents

恢复物理存储单元数据的方法和服务器 Download PDF

Info

Publication number
CN105426273A
CN105426273A CN201511021178.5A CN201511021178A CN105426273A CN 105426273 A CN105426273 A CN 105426273A CN 201511021178 A CN201511021178 A CN 201511021178A CN 105426273 A CN105426273 A CN 105426273A
Authority
CN
China
Prior art keywords
data
server
file system
physical memory
memory cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201511021178.5A
Other languages
English (en)
Other versions
CN105426273B (zh
Inventor
韩晓磊
杨杰
刘军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201511021178.5A priority Critical patent/CN105426273B/zh
Publication of CN105426273A publication Critical patent/CN105426273A/zh
Application granted granted Critical
Publication of CN105426273B publication Critical patent/CN105426273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种恢复磁盘数据的方法和服务器。所述方法应用于服务器,所述服务器具有第一数据通道和第二数据通道。所述方法包括:在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及将接收的所述要恢复的数据传输到服务器的物理存储单元中。

Description

恢复物理存储单元数据的方法和服务器
技术领域
本申请涉及恢复物理存储单元数据的方法和服务器。
背景技术
在系统日常运行过程中,系统管理员都会对环境中的服务器进行相应维护工作,例如软件升级、更新各种配置文件等。由于人为操作失误或者程序严重bug,就会对整个操作系统造成严重的影响,如文件系统配置不当,/etc/inittab文件、/etc/fstab文件等配置错误或丢失,或者非法关机等,都会导致系统错误,而无法启动。
当服务器出现上述问题,系统管理员需要通过服务器所安装的操作系统光盘进入系统恢复模式,逐步对操作系统进行恢复,此种方式,恢复步骤相当复杂,并且稍有不慎,会导致操作系统系统彻底无法恢复。此外,系统管理员被要求去服务器所在的现场进行处理,这导致极高的成本。
为此,期望提供一种恢复物理存储单元数据的方法和服务器,其能够在服务器出现故障的情况下,通过远程方式方便地恢复物理存储单元数据,从而修复服务器。
发明内容
根据本发明实施例,提供了一种恢复磁盘数据的方法,应用于服务器,所述服务器具有第一数据通道和第二数据通道,所述方法包括:
在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及
将接收的所述要恢复的数据传输到服务器的物理存储单元中。
可选地,在所述服务器的操作系统没有出现故障的情况下,通过所述第一数据通道传输数据,以及通过所述第二数据通道传输控制信息。
可选地,所述方法还包括:
响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统。
可选地,将接收的要恢复的数据传输到服务器的物理存储单元中还包括:
将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块;
通过所述物理存储单元驱动控制模块,使用相应的驱动控制命令调用内核驱动;
通过所述内核驱动将接收的要恢复的数据写入物理存储单元中。
可选地,将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块还包括:
使用第一数据传输格式将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块,所述第一数据传输格式包括目录区、数据区以及数据恢复结果与通知,所述目录区包括记录数据恢复目录的字段、指示物理存储单元目录的字段以及指示文件名的字段,所述数据区包括要恢复的数据,所述数据恢复结果与通知包括记录数据恢复结果的字段。
可选地,所述方法还包括:
在将接收的要恢复的数据传输到服务器的物理存储单元中之后,确认数据是否恢复正常,获得第二确认结果;
当所述第二确认结果指示数据恢复正常时,通过所述第二数据通道将所述第二确认结果传输给所述远程设备。
根据本发明另一实施例,提供了一种服务器,包括:
第一数据通道和第二数据通道,用于与远程设备通信以传输数据;
物理存储单元,用于存储各种数据;
数据传输模块,用于在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
文件系统识别模块,用于响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
其中,所述数据传输模块响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及将接收的所述要恢复的数据传输到服务器的物理存储单元中。
可选地,在所述服务器的操作系统没有出现故障的情况下,通过所述第一数据通道传输数据,以及通过所述第二数据通道传输控制信息。
可选地,所述文件系统识别模块进一步配置为:
响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统。
可选地,所述服务器还包括物理存储单元驱动控制模块,
其中,所述数据传输模块进一步配置为:
将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块;
通过所述物理存储单元驱动控制模块,使用相应的驱动控制命令调用内核驱动;
通过所述内核驱动将接收的要恢复的数据写入物理存储单元中。
可选地,所述数据传输模块进一步配置为:
使用第一数据传输格式将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块,所述第一数据传输格式包括目录区、数据区以及数据恢复结果与通知,所述目录区包括记录数据恢复目录的字段、指示物理存储单元目录的字段以及指示文件名的字段,所述数据区包括要恢复的数据,所述数据恢复结果与通知包括记录数据恢复结果的字段。
可选地,所述服务器还包括传输验证模块,用于在将接收的要恢复的数据传输到服务器的物理存储单元中之后,确认数据是否恢复正常,获得第二确认结果,并且当所述第二确认结果指示数据恢复正常时,通过所述第二数据通道将所述第二确认结果传输给所述远程设备。
因此,根据本发明实施例的恢复物理存储单元数据的方法和服务器,能够在服务器出现故障的情况下,通过远程方式方便地恢复物理存储单元数据,从而修复服务器。
附图说明
图1是根据本发明第一实施例的恢复物理存储单元数据的方法的流程图;
图2是根据本发明第二实施例的恢复物理存储单元数据的方法的流程图;
图3是根据本发明第三实施例的恢复物理存储单元数据的方法的流程图;
图4是根据本发明第四实施例的电子设备的模块图;以及
图5是根据本发明第四实施例的电子设备中实现恢复物理存储单元数据的方法的描述图。
具体实施方式
下面,将参考附图详细描述根据本发明实施例的恢复物理存储单元数据的方法和服务器。
目前,随着诸如云计算的数据服务越来越普遍,服务器的需求越来越大。对于服务器的管理也越来越重要。如前面所述的,当服务器的操作系统出现故障时,系统管理员需要通过服务器所安装的操作系统光盘进入系统恢复模式,逐步对操作系统进行恢复,此种方式,恢复步骤相当复杂,并且稍有不慎,会导致操作系统彻底无法恢复。此外,系统管理员被要求去服务器所在的现场进行处理,这导致极高的成本。因此,远程修复服务器的方法变得重要。
另一方面,当服务器的连接网络(例如,数据通道)出现故障时,也无法对服务器进行修复。
考虑以上问题做出了本发明。根据本发明实施例的恢复物理存储单元数据的方法应用于服务器中,所述服务器具有第一数据通道和第二数据通道。
<第一实施例>
根据本发明第一实施例的恢复物理存储单元数据的方法100包括:
步骤S101:在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
步骤S102:响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
步骤S103:响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及
步骤S104:将接收的所述要恢复的数据传输到服务器的物理存储单元中。
具体地,在根据本发明实施例的恢复物理存储单元数据的方法中,与现有的服务器不同的是,预先给服务器配置两条数据通道。与现有技术中一条数据通道同时用于传输数据和控制信息不同的是,在本申请的服务器中,在正常情况下,一条数据通道用于传输常规的数据信息,例如,各种文件数据、要写入磁盘的数据、要传输的数据等等。另一数据通道用于传输控制信息。
另一方面,在所述服务器的操作系统出现故障的情况下,所述第一数据通道不可用,所述第二数据通道仍然可用。
因此,在步骤S101中,在服务器的操作系统出现故障的情况下,通过第二数据通道接收来自远程设备的数据恢复请求。因为第二数据通道在服务器的操作系统出现故障的情况下仍然可用,所以仍然可以与远程设备通信以接收诸如数据恢复请求的控制信息和诸如要恢复的数据的常规数据信息。
然后,在步骤S102中,响应于所述数据恢复请求,首先确定所述服务器的文件系统是否运行正常,获得第一确定结果。因为文件系统具有自身的独立性,所以在服务器的操作系统出现故障的情况下,文件系统仍然可能是可用的。在文件系统可用的情况下,可以进行数据的写入,例如将数据写入磁盘中。
然后,在步骤S103中,响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据。具体地,因为正常情况下默认的用于数据传输的数据通道是第一数据通道,所以在第一数据通道不可用时,需要切换到第二数据通道用于从所述远程设备接收要恢复的数据。
最后,在步骤S104中,可以将接收的要恢复的数据传输到服务器的物理存储单元中。例如,可以将接收的要恢复的操作系统的文件写入目标磁盘中以替换损坏的或丢失的系统文件或配置文件。在用正常的系统文件或配置文件替换损坏的或丢失的系统文件或配置文件之后,可以使得服务器的操作系统恢复正常。
在一个实施例中,将接收的要恢复的数据传输到服务器的物理存储单元中还包括:将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块;通过所述物理存储单元驱动控制模块,使用相应的驱动控制命令调用内核驱动;通过所述内核驱动将接收的要恢复的数据写入物理存储单元中。
具体地,物理存储单元驱动控制模块在接收来自远程设备的要恢复的数据之后,可以将数据缓存在服务器的BMC控制器中。然后,识别并控制诸如磁盘驱动控制器(如RAID卡或SAS卡等)。通过相应驱动控制指令调用内核驱动。然后,驱动程序驱动硬件RAID卡或SAS控制器,最终将数据成功写入磁盘。
此外,将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块还包括:使用第一数据传输格式将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块,所述第一数据传输格式包括目录区、数据区以及数据恢复结果与通知,所述目录区包括记录数据恢复目录的字段、指示物理存储单元目录的字段以及指示文件名的字段,所述数据区包括要恢复的数据,所述数据恢复结果与通知包括记录数据恢复结果的字段。
如下面的表格所示,第一数据传输格式包括目录区、数据区以及数据恢复结果与通知。
因此,根据本发明实施例的恢复物理存储单元数据的方法,通过使用第二数据通道传输要恢复的数据到服务器,能够在服务器出现故障的情况下,通过远程方式方便地恢复物理存储单元中的数据,从而修复服务器。
<第二实施例>
根据本发明第二实施例的恢复物理存储单元数据的方法200包括:
步骤S201:在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
步骤S202:响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
步骤S203:响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统;
步骤S204:响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及
步骤S205:将接收的所述要恢复的数据传输到服务器的物理存储单元中。
具体地,与上述第一实施例相同,在根据本发明第二实施例的恢复物理存储单元数据的方法中,预先给服务器配置两条数据通道,在正常情况下,一条数据通道用于传输常规的数据信息,例如,各种文件数据、要写入磁盘的数据、要传输的数据等等。另一数据通道用于传输控制信息。
另一方面,在所述服务器的操作系统出现故障的情况下,所述第一数据通道不可用,所述第二数据通道仍然可用。
因此,在步骤S201中,在服务器的操作系统出现故障的情况下,通过第二数据通道接收来自远程设备的数据恢复请求。因为第二数据通道在服务器的操作系统出现故障的情况下仍然可用,所以仍然可以与远程设备通信以接收诸如数据恢复请求的控制信息和诸如要恢复的数据的常规数据信息。
然后,在步骤S202中,响应于所述数据恢复请求,首先确定所述服务器的文件系统是否运行正常,获得第一确定结果。因为文件系统具有自身的独立性,所以在服务器的操作系统出现故障的情况下,文件系统仍然可能是可用的。在文件系统可用的情况下,可以进行数据的写入,例如将数据写入磁盘中。
然后,在步骤S203中,响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统。具体地,当确定文件系统运行不正常时,可以使用文件系统检查(fsck)功能进行文件系统修复。该fsck功能用来检查和维护不一致的文件系统。
然后,在步骤S204中,响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据。具体地,响应于fsck功能已经对文件系统修复并且文件系统运行正常,可以切换到第二数据通道以接收要恢复的数据。因为正常情况下默认的用于数据传输的数据通道是第一数据通道,所以在第一数据通道不可用时,需要切换到第二数据通道用于从所述远程设备接收要恢复的数据。
最后,在步骤S205中,可以将接收的要恢复的数据传输到服务器的物理存储单元中。例如,可以将接收的要恢复的操作系统的文件写入目标磁盘中以替换损坏的或丢失的系统文件或配置文件。在用正常的系统文件或配置文件替换损坏的或丢失的系统文件或配置文件之后,可以使得服务器的操作系统恢复正常。
写入物理存储单元的方法与上面第一实施例中描述的方式相同,在此省略其详细描述。
因此,根据本发明实施例的恢复物理存储单元数据的方法,通过使用第二数据通道传输要恢复的数据到服务器,能够在服务器出现故障的情况下,通过远程方式方便地恢复物理存储单元中的数据,从而修复服务器。
<第三实施例>
根据本发明第三实施例的恢复物理存储单元数据的方法300包括:
步骤S301:在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
步骤S302:响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
步骤S303:响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统;
步骤S304:响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;
步骤S305:将接收的所述要恢复的数据传输到服务器的物理存储单元中;
步骤S306:确认数据是否恢复正常,获得第二确认结果;
步骤S307:当所述第二确认结果指示数据恢复正常时,通过所述第二数据通道将所述第二确认结果传输给所述远程设备。
具体地,与上述第一实施例相同,在根据本发明第三实施例的恢复物理存储单元数据的方法中,预先给服务器配置两条数据通道,在正常情况下,一条数据通道用于传输常规的数据信息,例如,各种文件数据、要写入磁盘的数据、要传输的数据等等。另一数据通道用于传输控制信息。
另一方面,在所述服务器的操作系统出现故障的情况下,所述第一数据通道不可用,所述第二数据通道仍然可用。
因此,在步骤S301中,在服务器的操作系统出现故障的情况下,通过第二数据通道接收来自远程设备的数据恢复请求。因为第二数据通道在服务器的操作系统出现故障的情况下仍然可用,所以仍然可以与远程设备通信以接收诸如数据恢复请求的控制信息和诸如要恢复的数据的常规数据信息。
然后,在步骤S302中,响应于所述数据恢复请求,首先确定所述服务器的文件系统是否运行正常,获得第一确定结果。因为文件系统具有自身的独立性,所以在服务器的操作系统出现故障的情况下,文件系统仍然可能是可用的。在文件系统可用的情况下,可以进行数据的写入,例如将数据写入磁盘中。
然后,在步骤S303中,响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统。具体地,当确定文件系统运行不正常时,可以使用文件系统检查(fsck)功能进行文件系统修复。该fsck功能用来检查和维护不一致的文件系统。
然后,在步骤S304中,响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据。具体地,响应于fsck功能已经对文件系统修复并且文件系统运行正常,可以切换到第二数据通道以接收要恢复的数据。因为正常情况下默认的用于数据传输的数据通道是第一数据通道,所以在第一数据通道不可用时,需要切换到第二数据通道用于从所述远程设备接收要恢复的数据。
然后,在步骤S305中,可以将接收的要恢复的数据传输到服务器的物理存储单元中。例如,可以将接收的要恢复的操作系统的文件写入目标磁盘中以替换损坏的或丢失的系统文件或配置文件。在用正常的系统文件或配置文件替换损坏的或丢失的系统文件或配置文件之后,可以使得服务器的操作系统恢复正常。
写入物理存储单元的方法与上面第一实施例中描述的方式相同,在此省略其详细描述。
然后,在步骤306中,可以确认数据是否恢复正常,获得第二确认结果。
最后,在步骤S306中,当所述第二确认结果指示数据恢复正常时,可以通过所述第二数据通道将所述第二确认结果传输给所述远程设备。从而,远程设备的用户可以确定是否本次远程操作是否成功。
因此,根据本发明实施例的恢复物理存储单元数据的方法,通过使用第二数据通道传输要恢复的数据到服务器,能够在服务器出现故障的情况下,通过远程方式方便地恢复物理存储单元中的数据,从而修复服务器。
<第四实施例>
下面将参考图4描述根据本发明第四实施例的服务器。所述服务器400包括:
第一数据通道401和第二数据通道402,用于与远程设备通信以传输数据;
物理存储单元403,用于存储各种数据。物理存储单元403例如包括RAID、SAS卡、磁盘、SAS等等。
数据传输模块404,用于在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
文件系统识别模块405,用于响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
其中,所述数据传输模块响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及将接收的所述要恢复的数据传输到服务器的物理存储单元中。
可选地,在所述服务器的操作系统没有出现故障的情况下,通过所述第一数据通道传输数据,以及通过所述第二数据通道传输控制信息。
可选地,所述文件系统识别模块405进一步配置为:
响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统。
可选地,所述服务器还包括物理存储单元驱动控制模块406,
其中,所述数据传输模块404进一步配置为:
将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块406;
通过所述物理存储单元驱动控制模块406,使用相应的驱动控制命令调用内核驱动;
通过所述内核驱动将接收的要恢复的数据写入物理存储单元中。
可选地,所述数据传输模块404进一步配置为:
使用第一数据传输格式将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块,所述第一数据传输格式包括目录区、数据区以及数据恢复结果与通知,所述目录区包括记录数据恢复目录的字段、指示物理存储单元目录的字段以及指示文件名的字段,所述数据区包括要恢复的数据,所述数据恢复结果与通知包括记录数据恢复结果的字段。
可选地,所述服务器还包括传输验证模块407,用于在将接收的要恢复的数据传输到服务器的物理存储单元中之后,确认数据是否恢复正常,获得第二确认结果,并且当所述第二确认结果指示数据恢复正常时,通过所述第二数据通道将所述第二确认结果传输给所述远程设备。
具体地,如图5所示,除了第一数据通道和第二数据通道之外,根据本发明第四实施例的服务器400包括四个核心模块。
文件系统识别模块405:分析并判断故障服务器文件系统运行是否正常,并向数据传输模块提供相应API;
数据传输模块404:负责接受并传输来自远程端的数据,并将数据缓存至服务器的BMC控制器中,根据文件系统识别模块405提供的API判断文件系统是否可用。
物理存储单元驱动控制模块406:识别并控制磁盘控制器,如RAID卡或者SAS卡等,负责接收数据传输模块传输的数据。并利用RAID卡或者SAS自身功能,最终将数据成功传输至磁盘中;
传输验证模块407:该模块负责数据恢复结果验证,并将验证结果通过带外管理通道反馈给远程用户。
如图5所示,在服务器400中的具体流程描述如下:
1.远程用户发起数据恢复请求,文件系统识别模块405首先判断被恢复服务器文件系统是否运行正常,如正常,则继续,如不正常,则通过fsck功能进行文件系统修复,待文件系统修复完成后,继续;
2.文件系统识别模块405得到文件系统运行正常的确认结果;
3.待确认结果正常之后,文件系统识别模块405会通知数据传输模块404进行数据传输。
4.数据传输模块404将待恢复的数据传输给物理存储单元驱动控制模块406;数据传输格式如上面的表格中所示,包括:目录区、数据区、以及数据恢复结果与通知。
5.物理存储单元驱动控制模块406收到数据后,通过相应驱动控制指令调用内核驱动。
6.驱动程序(Driver)驱动硬件RAID卡或者SAS控制器,最终将数据成功写入磁盘;
7.数据传输模块404将最终数据恢复结果通知给传输验证模块407;
8.传输验证模块407可以去VFSLayer验证恢复数据结果,最终将确认结果通过IPMI通道反馈给远程用户。
因此,根据本发明实施例的恢复物理存储单元数据的服务器,能够在服务器出现故障的情况下,通过远程方式方便地恢复物理存储单元数据,从而修复服务器。
需要注意的是,上面的实施例仅仅是用作示例,本发明不限于这样的示例,而是可以进行各种变化。
需要说明的是,在本说明书中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后,还需要说明的是,上述一系列处理不仅包括以这里所述的顺序按时间序列执行的处理,而且包括并行或分别地、而不是按时间顺序执行的处理。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM(只读存储器)/RAM(随机存取存储器)、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种恢复磁盘数据的方法,应用于服务器,所述服务器具有第一数据通道和第二数据通道,所述方法包括:
在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及
将接收的所述要恢复的数据传输到服务器的物理存储单元中。
2.如权利要求1所述的方法,其中,在所述服务器的操作系统没有出现故障的情况下,通过所述第一数据通道传输数据,以及通过所述第二数据通道传输控制信息。
3.如权利要求1所述的方法,还包括:
响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统。
4.如权利要求1所述的方法,其中,将接收的要恢复的数据传输到服务器的物理存储单元中还包括:
将接收的要恢复的数据传输给服务器的物理存储单元驱动控制器;
通过所述物理存储单元驱动控制器,使用相应的驱动控制命令调用内核驱动;
通过所述内核驱动将接收的要恢复的数据写入物理存储单元中。
5.如权利要求4所述的方法,其中,将接收的要恢复的数据传输给服务器的物理存储单元驱动控制器还包括:
使用第一数据传输格式将接收的要恢复的数据传输给服务器的物理存储单元驱动控制器,所述第一数据传输格式包括目录区、数据区以及数据恢复结果与通知,所述目录区包括记录数据恢复目录的字段、指示物理存储单元目录的字段以及指示文件名的字段,所述数据区包括要恢复的数据,所述数据恢复结果与通知包括记录数据恢复结果的字段。
6.如权利要求1所述的方法,还包括:
在将接收的要恢复的数据传输到服务器的物理存储单元中之后,确认数据是否恢复正常,获得第二确认结果;
当所述第二确认结果指示数据恢复正常时,通过所述第二数据通道将所述第二确认结果传输给所述远程设备。
7.一种服务器,包括:
第一数据通道和第二数据通道,用于与远程设备通信以传输数据;
物理存储单元,用于存储各种数据;
数据传输模块,用于在所述服务器的操作系统出现故障的情况下,通过所述第二数据通道接收来自远程设备的数据恢复请求,其中,所述第一数据通道在所述服务器的操作系统出现故障时不可用,所述第二数据通道在所述服务器的操作系统出现故障时可用;
文件系统识别模块,用于响应于所述数据恢复请求,确定所述服务器的文件系统是否运行正常,获得第一确定结果;
其中,所述数据传输模块响应于所述第一确定结果指示所述文件系统运行正常,切换到所述第二数据通道以从所述远程设备接收要恢复的数据;以及将接收的所述要恢复的数据传输到服务器的物理存储单元中。
8.如权利要求7所述的服务器,其中,在所述服务器的操作系统没有出现故障的情况下,通过所述第一数据通道传输数据,以及通过所述第二数据通道传输控制信息。
9.如权利要求7所述的服务器,其中,所述文件系统识别模块进一步配置为:
响应于所述第一确定结果指示所述文件系统运行不正常,对所述文件系统进行修复,使得所述文件系统运行正常,其中通过文件系统检查功能修复所述文件系统,所述文件系统检查功能用来检查和维护不一致的文件系统。
10.如权利要求7所述的服务器,还包括物理存储单元驱动控制模块,
其中,所述数据传输模块进一步配置为:
将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块;
通过所述物理存储单元驱动控制模块,使用相应的驱动控制命令调用内核驱动;
通过所述内核驱动将接收的要恢复的数据写入物理存储单元中。
11.如权利要求10所述的服务器,其中,所述数据传输模块进一步配置为:
使用第一数据传输格式将接收的要恢复的数据传输给服务器的物理存储单元驱动控制模块,所述第一数据传输格式包括目录区、数据区以及数据恢复结果与通知,所述目录区包括记录数据恢复目录的字段、指示物理存储单元目录的字段以及指示文件名的字段,所述数据区包括要恢复的数据,所述数据恢复结果与通知包括记录数据恢复结果的字段。
12.如权利要求7所述的服务器,还包括传输验证模块,用于在将接收的要恢复的数据传输到服务器的物理存储单元中之后,确认数据是否恢复正常,获得第二确认结果,并且当所述第二确认结果指示数据恢复正常时,通过所述第二数据通道将所述第二确认结果传输给所述远程设备。
CN201511021178.5A 2015-12-30 2015-12-30 恢复物理存储单元数据的方法和服务器 Active CN105426273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511021178.5A CN105426273B (zh) 2015-12-30 2015-12-30 恢复物理存储单元数据的方法和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511021178.5A CN105426273B (zh) 2015-12-30 2015-12-30 恢复物理存储单元数据的方法和服务器

Publications (2)

Publication Number Publication Date
CN105426273A true CN105426273A (zh) 2016-03-23
CN105426273B CN105426273B (zh) 2018-08-10

Family

ID=55504493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511021178.5A Active CN105426273B (zh) 2015-12-30 2015-12-30 恢复物理存储单元数据的方法和服务器

Country Status (1)

Country Link
CN (1) CN105426273B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106993036A (zh) * 2017-03-30 2017-07-28 联想(北京)有限公司 运行环境信息处理方法及交换机
CN109725828A (zh) * 2017-10-27 2019-05-07 阿里巴巴集团控股有限公司 磁盘恢复方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090327813A1 (en) * 2008-06-25 2009-12-31 International Business Machines Corporation Method to recover from a boot device failure during reboot or system ipl
CN103761161A (zh) * 2013-12-31 2014-04-30 华为技术有限公司 恢复数据的方法、服务器及系统
CN104065520A (zh) * 2014-07-21 2014-09-24 中广有线信息网络有限公司 双通道网络管理实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090327813A1 (en) * 2008-06-25 2009-12-31 International Business Machines Corporation Method to recover from a boot device failure during reboot or system ipl
US7861117B2 (en) * 2008-06-25 2010-12-28 International Business Machines Corporation Method to recover from a boot device failure during reboot or system IPL
CN103761161A (zh) * 2013-12-31 2014-04-30 华为技术有限公司 恢复数据的方法、服务器及系统
CN104065520A (zh) * 2014-07-21 2014-09-24 中广有线信息网络有限公司 双通道网络管理实现方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106993036A (zh) * 2017-03-30 2017-07-28 联想(北京)有限公司 运行环境信息处理方法及交换机
CN106993036B (zh) * 2017-03-30 2020-02-21 联想(北京)有限公司 运行环境信息处理方法及交换机
CN109725828A (zh) * 2017-10-27 2019-05-07 阿里巴巴集团控股有限公司 磁盘恢复方法及设备

Also Published As

Publication number Publication date
CN105426273B (zh) 2018-08-10

Similar Documents

Publication Publication Date Title
US6678639B2 (en) Automated problem identification system
CN103677650B (zh) 盘符漂移预防及处理方法及装置
CN102084350B (zh) 数据的远程副本的验证
US6816982B2 (en) Method of and apparatus for computer hard disk drive protection and recovery
CN104834575A (zh) 一种固件恢复方法及装置
CN103853634B (zh) 一种容灾备份系统及方法
CN102541704B (zh) Raid卡的测试方法
CN105653345A (zh) 用于支持对数据的非易失性随机访问的方法和设备
CN104220981A (zh) 用于修改有效固件的固件包
CN105550071B (zh) 系统文件升级及检测方法、通信设备
CN101763294A (zh) 根据时间段查看和备份系统操作日志的方法
CN103186348B (zh) 存储系统及其数据读写方法
CN105426273A (zh) 恢复物理存储单元数据的方法和服务器
CN104750537A (zh) 一种执行测试用例的方法和装置
CN110968456B (zh) 分布式存储系统中故障磁盘的处理方法及装置
US7533297B2 (en) Fault isolation in a microcontroller based computer
CN104020963A (zh) 一种防止误判硬盘读写错误的方法和装置
CN109445909A (zh) 虚拟机数据的备份方法、系统、终端及存储介质
CN102520880A (zh) 一种系统raid管理模块设计方法
CN106776142B (zh) 一种数据存储方法以及数据存储装置
CN101789058A (zh) 数据隐藏保护方法及其硬件
US10747706B2 (en) Server event log storage and retrieval system
CN106598778A (zh) 还原固件信息的方法及装置
CN107544868B (zh) 数据恢复方法和装置
CN102081579A (zh) 双控制器存储设备的缓存镜像系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant