CN113448760A - 一种硬盘异常状态的恢复方法、系统、设备以及介质 - Google Patents

一种硬盘异常状态的恢复方法、系统、设备以及介质 Download PDF

Info

Publication number
CN113448760A
CN113448760A CN202110627984.6A CN202110627984A CN113448760A CN 113448760 A CN113448760 A CN 113448760A CN 202110627984 A CN202110627984 A CN 202110627984A CN 113448760 A CN113448760 A CN 113448760A
Authority
CN
China
Prior art keywords
firmware
hard disk
storage location
firmware stored
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110627984.6A
Other languages
English (en)
Other versions
CN113448760B (zh
Inventor
毕延帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yingxin Computer Technology Co Ltd
Original Assignee
Shandong Yingxin Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yingxin Computer Technology Co Ltd filed Critical Shandong Yingxin Computer Technology Co Ltd
Priority to CN202110627984.6A priority Critical patent/CN113448760B/zh
Publication of CN113448760A publication Critical patent/CN113448760A/zh
Application granted granted Critical
Publication of CN113448760B publication Critical patent/CN113448760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种硬盘异常状态的恢复方法,包括以下步骤:响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;利用加载的第一固件执行后续上电流程;响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;利用第二固件建立与上层系统的连接以使上层系统识别硬盘;接收上层系统下发的命令以恢复硬盘。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案加载正常固件后无法正常执行上电流程时,加载特殊固件,利用特殊固件实现最小系统启动以建立与上层系统的连接,从而保证硬盘正常识别,极大程度的挽回硬盘软件故障对用户造成的影响,保证了用户业务的连续性。

Description

一种硬盘异常状态的恢复方法、系统、设备以及介质
技术领域
本发明涉及存储领域,具体涉及一种硬盘异常状态的恢复方法、系统、设备以及存储介质。
背景技术
随着互联网、云计算、物联网等技术的发展,固态硬盘作为新的一代存储,广泛被应用。
作为数据中心的最底端,SSD承载着存储数据的关键任务。当上电启动时,若固态硬盘出现故障,虽然可以正常加载固件,但是由于故障无法正常进行上电流程,这样导致无法被上层识别,也无法恢复数据。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种硬盘异常状态的恢复方法,包括以下步骤:
响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
利用加载的第一固件执行后续上电流程;
响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
接收所述上层系统下发的命令以恢复所述硬盘。
在一些实施例中,利用所述第二固件建立与上层系统的连接,进一步包括:
建立PCIE链路连接以及根据硬盘协议要求建立正确的上电时序。
在一些实施例中,还包括:
利用所述第二固件对所述硬盘内部的元数据进行恢复;
响应于无法恢复元数据,将所述硬盘设置为异常只读状态。
在一些实施例中,接收所述上层系统下发的命令以恢复所述硬盘,进一步包括:
响应于接收到所述上层系统基于所述异常只读状态下发的格式化命令,对所述硬盘进行格式化处理以清除所述硬盘中的原有的元数据。
在一些实施例中,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件,进一步包括:
检测第一存储位置中存储的第一固件是否正常;
响应于所述第一存储位置中存储的第一固件不正常,加载第三存储位置中存储的第三固件。
在一些实施例中,还包括:
采用乒乓备份的方式,轮流更新所述第一存储位置中存储的第一固件和第四存储位置中存储的第四固件;其中,所述第一存储位置中存储的第一固件的版本高于所述第四存储位置中存储的第四固件的版本;
根据更新后的第一固件更新所述第三存储位置存储的第三固件以及根据更新后的第四固件更新第五存储位置中存储的第五固件。
在一些实施例中,还包括:
检测第三存储位置中存储的第三固件是否正常;
响应于第三固件正常,加载第三存储位置中存储的第三固件;
响应于第三固件不正常,检测第四存储位置中存储的第四固件是否正常;
响应于第四固件正常,加载第四存储位置中存储的第四固件;
响应于第四固件不正常,检测第五存储位置中存储的第五固件是否正常;
响应于第五固件正常,加载所述第五存储位置中存储的第五固件。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种硬盘异常状态的恢复系统,包括:
第一加载模块,配置为响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
执行模块,配置为利用加载的第一固件执行后续上电流程;
第二加载模块,配置为响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
建立连接模块,配置为利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
接收模块,配置为接收所述上层系统下发的命令以恢复所述硬盘。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如上所述的任一种硬盘异常状态的恢复方法的步骤。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行如上所述的任一种硬盘异常状态的恢复方法的步骤。
本发明具有以下有益技术效果之一:本发明提出的方案加载正常固件后无法正常执行上电流程时,加载特殊固件,利用特殊固件实现最小系统启动以建立与上层系统的连接,从而保证盘片正常识别,极大程度的挽回硬盘软件故障对用户造成的影响,增加了硬盘错误处理情况下的友好程度,在某些用户场景下,保证了用户业务的连续性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明的实施例提供的硬盘异常状态的恢复方法的流程示意图;
图2为本发明的实施例提供的硬盘异常状态的恢复系统的结构示意图;
图3为本发明的实施例提供的计算机设备的结构示意图;
图4为本发明的实施例提供的计算机可读存储介质的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
根据本发明的一个方面,本发明的实施例提出一种硬盘异常状态的恢复方法,如图1所示,其可以包括步骤:
S1,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
S2,利用加载的第一固件执行后续上电流程;
S3,响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
S4,利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
S5,接收所述上层系统下发的命令以恢复所述硬盘。
本发明提出的方案加载正常固件后无法正常执行上电流程时,加载特殊固件,利用特殊固件实现最小系统启动以建立与上层系统的连接,从而保证盘片正常识别,极大程度的挽回硬盘软件故障对用户造成的影响,增加了硬盘错误处理情况下的友好程度,在某些用户场景下,保证了用户业务的连续性。
在一些实施例中,步骤S1,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件,进一步包括:
检测第一存储位置中存储的第一固件是否正常;
响应于所述第一存储位置中存储的第一固件不正常,加载第三存储位置中存储的第三固件。
具体的,第一存储位置存储的第一固件可以是版本最高的固件,并且第三存储位置中存储的第三固件是第一固件的备份固件。这样将固件分别存储在第一存储位置和第三存储位置,当第一存储位置或第三存储位置中的固件损坏时,可以使用另一个存储位置中的固件。
在一些实施例中,可以采用采循环冗余校验CRC校验机制,验证第一存储位置中存储的固件是否正常。
具体的,循环冗余校验(Cyclic Redundancy Check,CRC)是一种根据网络数据包或电脑文件等数据产生简短固定位数校验码的一种散列函数,主要用来检测或校验数据传输或者保存后可能出现的错误。它是利用除法及余数的原理来进行错误侦测。
在采用循环冗余校验CRC校验机制对固件进行检测时,可以将固件的头部FW head和文件格式文件中ELF File中包含的数据,通过CRC校验机制,计算得到一个数值,与存储在固件的尾部中的保存的数值作比较,如果一致,则证明读取的固件正常,若不一致,则证明读取的固件不正常。
在一些实施例中,在检测出读取的固件是正常的后,还可以去验证FW head中的标志位是否是预设的标志位,如果是预设的标志位,则进一步验证读取的固件是正常固件,如果不是预设的标志位,则说明读取的固件不是正常固件。
在一些实施例中,还包括:
采用乒乓备份的方式,轮流更新所述第一存储位置中存储的第一固件和第四存储位置中存储的第四固件;其中,所述第一存储位置中存储的第一固件的版本高于所述第四存储位置中存储的第四固件的版本;
根据更新后的第一固件更新所述第三存储位置存储的第三固件以及根据更新后的第四固件更新第五存储位置中存储的第五固件。
具体的,当固件自身出现问题或者是固件出现了高版本的固件时,此时就需要更新固件,这时可以采用乒乓备份的方式进行更新。乒乓备份是指第一次更新第一存储位置中存储的固件,第二次更新第四存储位置中存储的第四固件,采用轮流更新第一存储位置和第四存储位置中存储的固件,是为了在第一存储位置和第四存储位置中能够同时保存两种版本的固件。
需要说明的是,在第一次将固件写入第一存储位置和第四存储位置中时,第一存储位置和第四存储位置中存储的固件是相同,后期对固件进行更新,进而使第一存储位置和第四存储位置中存储的固件的版本不同。由于第三存储位置存储的第三固件是第一存储位置的第一固件的备份,而第五存储位置中存储的第五固件是第四固件的备份,因此可以根据更新后的第一存储位置和第四存储位置中存储的固件,相应的更新第三存储位置和第五存储位置中存储的固件。
在一些实施例中,还包括:
检测第三存储位置中存储的第三固件是否正常;
响应于第三固件正常,加载第三存储位置中存储的第三固件;
响应于第三固件不正常,检测第四存储位置中存储的第四固件是否正常;
响应于第四固件正常,加载第四存储位置中存储的第四固件;
响应于第四固件不正常,检测第五存储位置中存储的第五固件是否正常;
响应于第五固件正常,加载所述第五存储位置中存储的第五固件。
具体的,当在加载第一固件时,检测到第一固件异常,可以首先加载第三存储位置存储的第三固件。同样的,加载后对第三固件检测,若正常,则利用第三固件进行后续的上电流程,若不正常,则可以加载第四存储位置存储的第四固件,同样的,加载后对第四固件检测,若正常,则利用第四固件进行后续的上电流程,若不正常,则可以加载第五存储位置存储的第五固件。
在一些实施例中,利用所述第二固件建立与上层系统的连接,进一步包括:
建立PCIE链路连接以及根据硬盘协议要求建立正确的上电时序。
具体的,当利用加载到的第一固件、第三固件、第四固件或第五固件执行上电流程时出现异常,例如虽然加载的固件正常,但是由于上一次下电时元数据出问题导致本次上电流程无法正常进行,此时可以加载硬盘的第二存储位置中存储的第二固件,该第二固件属于特殊固件,其与其他固件的区别在于第二固件是最小系统启动,只需要保证能够让上层系统识别到硬盘即可,即保证最基本的需要,只需要建立PCIE链路连接以及根据硬盘协议要求建立正确的上电时序即可,无需考虑其他功能需求。
在一些实施例中,第二固件建立链接后,可以判断检查盘片异常,收集系统日志和寄存器日志,尝试恢复元数据和管理Table,并给用户显示合适状态,还可以通过预留的接口接收用户指令,以支持数据恢复。
在一些实施例中,还包括:
利用所述第二固件对所述硬盘内部的元数据进行恢复;
响应于无法恢复元数据,将所述硬盘设置为异常只读状态。
在一些实施例中,接收所述上层系统下发的命令以恢复所述硬盘,进一步包括:
响应于接收到所述上层系统基于所述异常只读状态下发的格式化命令,对所述硬盘进行格式化处理以清除所述硬盘中的原有的元数据。
具体的,第二固件保留了调试接口,这样可以实现接收上层系统下发的相应命令以实现修复。
例如,当在上电阶段无法执行正常流程,则加载保存在硬盘上特定区域的特殊固件,保证硬盘正常识别,并尝试恢复硬盘内部元数据,如元数据恢复正常,则盘片正常使用;如元数据恢复失败,则将盘片设置为异常只读状态,并交由用户处理,如用户下发格式化命令,则能保证清除元数据,正常使用盘片。
本发明提出的方案加载正常固件后无法正常执行上电流程时,加载特殊固件,利用特殊固件实现最小系统启动以建立与上层系统的连接,从而保证盘片正常识别,极大程度的挽回硬盘软件故障对用户造成的影响,增加了硬盘错误处理情况下的友好程度,在某些用户场景下,保证了用户业务的连续性。
基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种硬盘异常状态的恢复系统400,如图2所示,包括:
第一加载模块401,配置为响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
执行模块402,配置为利用加载的第一固件执行后续上电流程;
第二加载模块403,配置为响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
建立连接模块404,配置为利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
接收模块405,配置为接收所述上层系统下发的命令以恢复所述硬盘。
在一些实施例中,建立连接模块404进一步配置为:
建立PCIE链路连接以及根据硬盘协议要求建立正确的上电时序。
在一些实施例中,还包括恢复模块,配置为:
利用所述第二固件对所述硬盘内部的元数据进行恢复;
响应于无法恢复元数据,将所述硬盘设置为异常只读状态。
在一些实施例中,接收模块405还配置为:
响应于接收到所述上层系统基于所述异常只读状态下发的格式化命令,对所述硬盘进行格式化处理以清除所述硬盘中的原有的元数据。
在一些实施例中,第一加载模块401还配置为:
检测第一存储位置中存储的第一固件是否正常;
响应于所述第一存储位置中存储的第一固件不正常,加载第三存储位置中存储的第三固件。
在一些实施例中,还包括更新模块,配置为:
采用乒乓备份的方式,轮流更新所述第一存储位置中存储的第一固件和第四存储位置中存储的第四固件;其中,所述第一存储位置中存储的第一固件的版本高于所述第四存储位置中存储的第四固件的版本;
根据更新后的第一固件更新所述第三存储位置存储的第三固件以及根据更新后的第四固件更新第五存储位置中存储的第五固件。
在一些实施例中,更新模块,还配置为:
检测第三存储位置中存储的第三固件是否正常;
响应于第三固件正常,加载第三存储位置中存储的第三固件;
响应于第三固件不正常,检测第四存储位置中存储的第四固件是否正常;
响应于第四固件正常,加载第四存储位置中存储的第四固件;
响应于第四固件不正常,检测第五存储位置中存储的第五固件是否正常;
响应于第五固件正常,加载所述第五存储位置中存储的第五固件。
本发明提出的方案加载正常固件后无法正常执行上电流程时,加载特殊固件,利用特殊固件实现最小系统启动以建立与上层系统的连接,从而保证盘片正常识别,极大程度的挽回硬盘软件故障对用户造成的影响,增加了硬盘错误处理情况下的友好程度,在某些用户场景下,保证了用户业务的连续性。
基于同一发明构思,根据本发明的另一个方面,如图3所示,本发明的实施例还提供了一种计算机设备501,包括:
至少一个处理器520;以及
存储器510,存储器510存储有可在处理器上运行的计算机程序511,处理器520执行程序时执行以下步骤:
S1,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
S2,利用加载的第一固件执行后续上电流程;
S3,响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
S4,利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
S5,接收所述上层系统下发的命令以恢复所述硬盘。
在一些实施例中,利用所述第二固件建立与上层系统的连接,进一步包括:
建立PCIE链路连接以及根据硬盘协议要求建立正确的上电时序。
在一些实施例中,还包括:
利用所述第二固件对所述硬盘内部的元数据进行恢复;
响应于无法恢复元数据,将所述硬盘设置为异常只读状态。
在一些实施例中,接收所述上层系统下发的命令以恢复所述硬盘,进一步包括:
响应于接收到所述上层系统基于所述异常只读状态下发的格式化命令,对所述硬盘进行格式化处理以清除所述硬盘中的原有的元数据。
在一些实施例中,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件,进一步包括:
检测第一存储位置中存储的第一固件是否正常;
响应于所述第一存储位置中存储的第一固件不正常,加载第三存储位置中存储的第三固件。
在一些实施例中,还包括:
采用乒乓备份的方式,轮流更新所述第一存储位置中存储的第一固件和第四存储位置中存储的第四固件;其中,所述第一存储位置中存储的第一固件的版本高于所述第四存储位置中存储的第四固件的版本;
根据更新后的第一固件更新所述第三存储位置存储的第三固件以及根据更新后的第四固件更新第五存储位置中存储的第五固件。
在一些实施例中,还包括:
检测第三存储位置中存储的第三固件是否正常;
响应于第三固件正常,加载第三存储位置中存储的第三固件;
响应于第三固件不正常,检测第四存储位置中存储的第四固件是否正常;
响应于第四固件正常,加载第四存储位置中存储的第四固件;
响应于第四固件不正常,检测第五存储位置中存储的第五固件是否正常;
响应于第五固件正常,加载所述第五存储位置中存储的第五固件。
本发明提出的方案加载正常固件后无法正常执行上电流程时,加载特殊固件,利用特殊固件实现最小系统启动以建立与上层系统的连接,从而保证盘片正常识别,极大程度的挽回硬盘软件故障对用户造成的影响,增加了硬盘错误处理情况下的友好程度,在某些用户场景下,保证了用户业务的连续性。
基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机可读存储介质601,计算机可读存储介质601存储有计算机程序指令610,计算机程序指令610被处理器执行时执行以下步骤:
S1,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
S2,利用加载的第一固件执行后续上电流程;
S3,响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
S4,利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
S5,接收所述上层系统下发的命令以恢复所述硬盘。
在一些实施例中,利用所述第二固件建立与上层系统的连接,进一步包括:
建立PCIE链路连接以及根据硬盘协议要求建立正确的上电时序。
在一些实施例中,还包括:
利用所述第二固件对所述硬盘内部的元数据进行恢复;
响应于无法恢复元数据,将所述硬盘设置为异常只读状态。
在一些实施例中,接收所述上层系统下发的命令以恢复所述硬盘,进一步包括:
响应于接收到所述上层系统基于所述异常只读状态下发的格式化命令,对所述硬盘进行格式化处理以清除所述硬盘中的原有的元数据。
在一些实施例中,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件,进一步包括:
检测第一存储位置中存储的第一固件是否正常;
响应于所述第一存储位置中存储的第一固件不正常,加载第三存储位置中存储的第三固件。
在一些实施例中,还包括:
采用乒乓备份的方式,轮流更新所述第一存储位置中存储的第一固件和第四存储位置中存储的第四固件;其中,所述第一存储位置中存储的第一固件的版本高于所述第四存储位置中存储的第四固件的版本;
根据更新后的第一固件更新所述第三存储位置存储的第三固件以及根据更新后的第四固件更新第五存储位置中存储的第五固件。
在一些实施例中,还包括:
检测第三存储位置中存储的第三固件是否正常;
响应于第三固件正常,加载第三存储位置中存储的第三固件;
响应于第三固件不正常,检测第四存储位置中存储的第四固件是否正常;
响应于第四固件正常,加载第四存储位置中存储的第四固件;
响应于第四固件不正常,检测第五存储位置中存储的第五固件是否正常;
响应于第五固件正常,加载所述第五存储位置中存储的第五固件。
本发明提出的方案加载正常固件后无法正常执行上电流程时,加载特殊固件,利用特殊固件实现最小系统启动以建立与上层系统的连接,从而保证盘片正常识别,极大程度的挽回硬盘软件故障对用户造成的影响,增加了硬盘错误处理情况下的友好程度,在某些用户场景下,保证了用户业务的连续性。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种硬盘异常状态的恢复方法,其特征在于,包括以下步骤:
响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
利用加载的第一固件执行后续上电流程;
响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
接收所述上层系统下发的命令以恢复所述硬盘。
2.如权利要求1所述的方法,其特征在于,利用所述第二固件建立与上层系统的连接,进一步包括:
建立PCIE链路连接以及根据硬盘协议要求建立正确的上电时序。
3.如权利要求1所述的方法,其特征在于,还包括:
利用所述第二固件对所述硬盘内部的元数据进行恢复;
响应于无法恢复元数据,将所述硬盘设置为异常只读状态。
4.如权利要求3所述的方法,其特征在于,接收所述上层系统下发的命令以恢复所述硬盘,进一步包括:
响应于接收到所述上层系统基于所述异常只读状态下发的格式化命令,对所述硬盘进行格式化处理以清除所述硬盘中的原有的元数据。
5.如权利要求1所述的方法,其特征在于,响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件,进一步包括:
检测第一存储位置中存储的第一固件是否正常;
响应于所述第一存储位置中存储的第一固件不正常,加载第三存储位置中存储的第三固件。
6.如权利要求5所述的方法,其特征在于,还包括:
采用乒乓备份的方式,轮流更新所述第一存储位置中存储的第一固件和第四存储位置中存储的第四固件,其中,所述第一存储位置中存储的第一固件的版本高于所述第四存储位置中存储的第四固件的版本;
根据更新后的第一固件更新所述第三存储位置存储的第三固件以及根据更新后的第四固件更新第五存储位置中存储的第五固件。
7.如权利要求6所述的方法,其特征在于,还包括:
检测第三存储位置中存储的第三固件是否正常;
响应于第三固件正常,加载第三存储位置中存储的第三固件;
响应于第三固件不正常,检测第四存储位置中存储的第四固件是否正常;
响应于第四固件正常,加载第四存储位置中存储的第四固件;
响应于第四固件不正常,检测第五存储位置中存储的第五固件是否正常;
响应于第五固件正常,加载所述第五存储位置中存储的第五固件。
8.一种硬盘异常状态的恢复系统,其特征在于,包括:
第一加载模块,配置为响应于接收到上电指令,加载硬盘的第一存储位置中存储的第一固件;
执行模块,配置为利用加载的第一固件执行后续上电流程;
第二加载模块,配置为响应于执行后续上电流程时出现异常,加载硬盘的第二存储位置中存储的第二固件;
建立连接模块,配置为利用所述第二固件建立与上层系统的连接以使所述上层系统识别所述硬盘;
接收模块,配置为接收所述上层系统下发的命令以恢复所述硬盘。
9.一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如权利要求1-7任意一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1-7任意一项所述的方法的步骤。
CN202110627984.6A 2021-06-05 2021-06-05 一种硬盘异常状态的恢复方法、系统、设备以及介质 Active CN113448760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110627984.6A CN113448760B (zh) 2021-06-05 2021-06-05 一种硬盘异常状态的恢复方法、系统、设备以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110627984.6A CN113448760B (zh) 2021-06-05 2021-06-05 一种硬盘异常状态的恢复方法、系统、设备以及介质

Publications (2)

Publication Number Publication Date
CN113448760A true CN113448760A (zh) 2021-09-28
CN113448760B CN113448760B (zh) 2023-03-10

Family

ID=77810895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110627984.6A Active CN113448760B (zh) 2021-06-05 2021-06-05 一种硬盘异常状态的恢复方法、系统、设备以及介质

Country Status (1)

Country Link
CN (1) CN113448760B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115048244A (zh) * 2022-06-10 2022-09-13 苏州浪潮智能科技有限公司 一种服务器的硬件修复方法、系统、计算机设备及介质
CN115048244B (zh) * 2022-06-10 2024-06-07 苏州浪潮智能科技有限公司 一种服务器的硬件修复方法、系统、计算机设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729275A (zh) * 2014-01-21 2014-04-16 北京众诚天合系统集成科技有限公司 硬盘固件修复系统及硬盘固件修复方法
CN106648999A (zh) * 2016-12-28 2017-05-10 四川秘无痕信息安全技术有限责任公司 一种日立硬盘a工作区中固件模块损坏的修复方法
CN107315616A (zh) * 2017-06-30 2017-11-03 郑州云海信息技术有限公司 一种固件的加载方法、装置及电子设备
CN109282434A (zh) * 2018-09-20 2019-01-29 广东美的暖通设备有限公司 固件安装方法、系统和空调器
CN110704091A (zh) * 2019-09-20 2020-01-17 苏州浪潮智能科技有限公司 一种固件升级方法及装置
CN110990184A (zh) * 2019-12-13 2020-04-10 厦门市美亚柏科信息股份有限公司 一种用于希捷硬盘的故障修复方法和系统
CN112035136A (zh) * 2020-08-12 2020-12-04 中电科技(北京)有限公司 基于uefi的固件镜像恢复方法及系统
CN112463656A (zh) * 2020-11-25 2021-03-09 至誉科技(武汉)有限公司 固态硬盘异常掉电恢复方法、系统及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729275A (zh) * 2014-01-21 2014-04-16 北京众诚天合系统集成科技有限公司 硬盘固件修复系统及硬盘固件修复方法
CN106648999A (zh) * 2016-12-28 2017-05-10 四川秘无痕信息安全技术有限责任公司 一种日立硬盘a工作区中固件模块损坏的修复方法
CN107315616A (zh) * 2017-06-30 2017-11-03 郑州云海信息技术有限公司 一种固件的加载方法、装置及电子设备
CN109282434A (zh) * 2018-09-20 2019-01-29 广东美的暖通设备有限公司 固件安装方法、系统和空调器
CN110704091A (zh) * 2019-09-20 2020-01-17 苏州浪潮智能科技有限公司 一种固件升级方法及装置
CN110990184A (zh) * 2019-12-13 2020-04-10 厦门市美亚柏科信息股份有限公司 一种用于希捷硬盘的故障修复方法和系统
CN112035136A (zh) * 2020-08-12 2020-12-04 中电科技(北京)有限公司 基于uefi的固件镜像恢复方法及系统
CN112463656A (zh) * 2020-11-25 2021-03-09 至誉科技(武汉)有限公司 固态硬盘异常掉电恢复方法、系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115048244A (zh) * 2022-06-10 2022-09-13 苏州浪潮智能科技有限公司 一种服务器的硬件修复方法、系统、计算机设备及介质
CN115048244B (zh) * 2022-06-10 2024-06-07 苏州浪潮智能科技有限公司 一种服务器的硬件修复方法、系统、计算机设备及介质

Also Published As

Publication number Publication date
CN113448760B (zh) 2023-03-10

Similar Documents

Publication Publication Date Title
CN101706802B (zh) 一种数据写入、修改及恢复的方法、装置及服务器
US7849356B2 (en) Parity data management system apparatus and method
CN107315616B (zh) 一种固件的加载方法、装置及电子设备
WO2017215377A1 (zh) 内存硬错误的处理方法及装置
CN104834575A (zh) 一种固件恢复方法及装置
CN109491609B (zh) 一种缓存数据处理方法、装置、设备及可读存储介质
CN111813753A (zh) 保存文件的方法、恢复文件的方法、装置及终端设备
US7308601B2 (en) Program, method and apparatus for disk array control
JP6083480B1 (ja) 監視装置、フォールトトレラントシステムおよび方法
CN112131046B (zh) 一种数据缓存方法、系统、设备以及介质
CN113626262A (zh) 一种bmc恢复方法、系统、设备以及介质
US20190354433A1 (en) Parity log with by-pass
CN113448760B (zh) 一种硬盘异常状态的恢复方法、系统、设备以及介质
WO2017054643A1 (zh) 一种数据抢救方法及文件服务器
US11740969B2 (en) Detecting and recovering a corrupted non-volatile random-access memory
CN115495286A (zh) 配置文件定时备份的测试方法、系统、设备和存储介质
JP2011053984A (ja) ファームウェア保護装置、そのプログラム
JP2010536112A (ja) 中断された書込みの回復のためのデータ記憶方法、機器およびシステム
US10809940B1 (en) Multilevel resiliency
CN114296827A (zh) 数据文件处理方法、装置、设备及存储介质
JP2000330778A (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
CN110795155B (zh) 系统启动方法及装置、电子设备、存储介质
CN107544868B (zh) 数据恢复方法和装置
CN111427718A (zh) 文件备份方法、恢复方法及装置
CN115421974A (zh) 一种基于pfr的bios恢复方法、装置、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant