CN109376029B - 一种scsi硬盘异常超时的处理方法及处理系统 - Google Patents

一种scsi硬盘异常超时的处理方法及处理系统 Download PDF

Info

Publication number
CN109376029B
CN109376029B CN201811135592.2A CN201811135592A CN109376029B CN 109376029 B CN109376029 B CN 109376029B CN 201811135592 A CN201811135592 A CN 201811135592A CN 109376029 B CN109376029 B CN 109376029B
Authority
CN
China
Prior art keywords
instruction
hard disk
scsi hard
issuing
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811135592.2A
Other languages
English (en)
Other versions
CN109376029A (zh
Inventor
王超
刘斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811135592.2A priority Critical patent/CN109376029B/zh
Publication of CN109376029A publication Critical patent/CN109376029A/zh
Application granted granted Critical
Publication of CN109376029B publication Critical patent/CN109376029B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种SCSI硬盘异常超时的处理方法,包括:先向该SCSI硬盘发送预设检测指令,并在该预设检测指令正常返回且该I/O指令下发次数未超过第一阈值时,重新下发该I/O指令;当该下发次数超过该第一阈值时,将下发该I/O指令的链路移除,并在该SCSI硬盘的链路全部移除时,才确认该SCSI硬盘发生故障。本申请在该预设检测指令正常返回时直接重新下发该I/O指令来代替执行reset操作,节省了执行reset操作的成本,提高了SCSI硬盘异常超时的处理效率,保证了整个存储系统产品的稳定性。本申请同时还提供了一种SCSI硬盘异常超时的处理系统、处理设备及计算机可读存储介质,具有上述有益效果。

Description

一种SCSI硬盘异常超时的处理方法及处理系统
技术领域
本申请涉及超时处理领域,特别涉及一种SCSI硬盘异常超时的处理方法、处理系统、处理设备及计算机可读存储介质。
背景技术
现在大多数的企业使用的存储系统产品后端挂载的主流硬盘还是SAS硬盘,硬盘使用的指令协议标准是SCSI标准,因此可以把这种类型的硬盘称之为SCSI硬盘。
对于存储系统产品厂商来说,硬盘的各种异常会导致用户的数据无法读写,严重时会直接导致用户的数据丢失,影响存储产品的稳定性和可靠性,比如硬盘固件的错误会导致硬盘无法继续使用,所以对于存储产品厂商来说,检测硬盘错误是非常必要的。
现有技术中,在检测到SCSI硬盘异常超时时,通常直接对该SCSI硬盘进行reset操作,然而,reset的成本会比较高,在reset之后直到硬盘reday的这段时间内无法处理I/O指令,这使得SCSI硬盘异常超时的处理效率较低。
因此,如何提高SCSI硬盘异常超时的处理效率是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种SCSI硬盘异常超时的处理方法、处理系统、处理设备及计算机可读存储介质,用于提高SCSI硬盘异常超时的处理效率。
为解决上述技术问题,本申请提供一种SCSI硬盘异常超时的处理方法,该处理方法包括:
向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数;
判断所述I/O指令是否在第一预设时间内返回;
若否,则将所述I/O指令标记为短超时I/O指令,并向所述SCSI硬盘发送预设检测指令;
当所述预设检测指令正常返回时,判断所述下发次数是否超过第一阈值;
若所述下发次数未超过所述第一阈值,则返回执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
若所述下发次数超过所述第一阈值,则将下发所述I/O指令的链路移除;
当所述SCSI硬盘的链路全部移除时,确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
可选的,当所述预设检测指令未正常返回时,还包括:
判断所述I/O指令是否在第二预设时间内返回;
若否,则将所述I/O指令标记为长超时指令,并判断所述SCSI硬盘是否执行过reset操作;
若所述SCSI硬盘未执行过所述reset操作,则对所述SCSI硬盘执行所述reset操作,并返回执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
若所述SCSI硬盘执行过所述reset操作,则确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
可选的,当所述I/O指令在所述第二预设时间内返回时,还包括:
上报所述I/O指令存在短超时错误。
可选的,在将所述I/O指令标记为短超时I/O指令,并向所述SCSI硬盘发送预设检测指令之后,还包括:
将下发所述I/O指令的链路的错误计数加一;
判断所述错误计数是否超过第二阈值;
若是,则将下发所述I/O指令的链路移除。
本申请还提供一种SCSI硬盘异常超时的处理系统,该系统包括:
下发模块,用于向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数;
第一判断模块,用于判断所述I/O指令是否在第一预设时间内返回;
标记模块,用于当所述I/O指令未在所述第一预设时间内返回时,将所述I/O指令标记为短超时I/O指令,并向所述SCSI硬盘发送预设检测指令;
第二判断模块,用于当所述预设检测指令正常返回时,判断所述下发次数是否超过第一阈值;
第一返回模块,用于当所述下发次数未超过所述第一阈值时,返回所述下发模块执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
第一链路移除模块,用于当所述下发次数超过所述第一阈值时,将下发所述I/O指令的链路移除;
第一确认模块,用于当所述SCSI硬盘的链路全部移除时,确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
可选的,还包括:
第三判断模块,用于当所述预设检测指令未正常返回时,判断所述I/O指令是否在第二预设时间内返回;
第四判断模块,用于当所述I/O指令未在所述第二预设时间内返回时,将所述I/O指令标记为长超时指令,并判断所述SCSI硬盘是否执行过reset操作;
第二返回模块,用于当所述SCSI硬盘未执行过所述reset操作时,对所述SCSI硬盘执行所述reset操作,并返回所述下发模块执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
第二确认模块,用于当所述SCSI硬盘执行过所述reset操作时,确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
可选的,还包括:
上报模块,用于当所述I/O指令在所述第二预设时间内返回时,上报所述I/O指令存在短超时错误。
可选的,还包括:
计数模块,用于将下发所述I/O指令的链路的错误计数加一;
第五判断模块,用于判断所述错误计数是否超过第二阈值;
第二链路移除模块,用于当所述错误计数超过所述第二阈值时,将下发所述I/O指令的链路移除。
本申请还提供一种SCSI硬盘异常超时的处理设备,该SCSI硬盘异常超时的处理设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述SCSI硬盘异常超时的处理方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述SCSI硬盘异常超时的处理方法的步骤。
本申请所提供SCSI硬盘异常超时的处理方法,包括:向SCSI硬盘下发I/O指令,并记录该I/O指令的下发次数;判断该I/O指令是否在第一预设时间内返回;若否,则将该I/O指令标记为短超时I/O指令,并向该SCSI硬盘发送预设检测指令;当该预设检测指令正常返回时,判断该下发次数是否超过第一阈值;若该下发次数未超过第一阈值,则返回执行该向SCSI硬盘下发I/O指令,并记录该I/O指令的下发次数的步骤;若该下发次数超过该第一阈值,则将下发该I/O指令的链路移除;当该SCSI硬盘的链路全部移除时,确认该SCSI硬盘发生故障,将该SCSI硬盘中的数据进行迁移,并移除该SCSI硬盘。
本申请所提供的技术方案,在检测到SCSI硬盘异常超时时,先向该SCSI硬盘发送预设检测指令,并在该预设检测指令正常返回,且该I/O指令下发次数未超过第一阈值时,重新下发该I/O指令;当该下发次数超过该第一阈值,才将下发该I/O指令的链路移除,并在该SCSI硬盘的链路全部移除时,才确认该SCSI硬盘发生故障,在该预设检测指令正常返回时直接重新下发该I/O指令来代替执行reset操作,节省了执行reset操作的成本,提高了SCSI硬盘异常超时的处理效率,保证了整个存储系统产品的稳定性,提升了整个存储产品的核心竞争力。本申请同时还提供了一种SCSI硬盘异常超时的处理系统、处理设备及计算机可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种SCSI硬盘异常超时的处理方法的流程图;
图2为本申请实施例所提供的另一种SCSI硬盘异常超时的处理方法的流程图;
图3为本申请实施例所提供的再一种SCSI硬盘异常超时的处理方法的流程图;
图4为本申请实施例所提供的一种SCSI硬盘异常超时的处理系统的结构图;
图5为本申请实施例所提供的另一种SCSI硬盘异常超时的处理系统的结构图;
图6为本申请实施例所提供的一种SCSI硬盘异常超时的处理设备的结构图。
具体实施方式
本申请的核心是提供一种SCSI硬盘异常超时的处理方法、处理系统、处理设备及计算机可读存储介质,用于提高SCSI硬盘异常超时的处理效率。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种SCSI硬盘异常超时的处理方法的流程图。
其具体包括如下步骤:
S101:向SCSI硬盘下发I/O指令,并记录该I/O指令的下发次数;
基于现有技术中在检测到SCSI硬盘异常超时时,通常直接对该SCSI硬盘进行reset操作,然而,reset的成本会比较高,在reset之后直到硬盘reday的这段时间内无法处理I/O指令,这使得SCSI硬盘异常超时的处理效率较低;本申请提供了一种SCSI硬盘异常超时的处理方法,用于解决上述问题;
这里提到的向SCSI硬盘下发I/O指令,并记录该I/O指令的下发次数,其目的在于防止出现无上限重复向SCSI硬盘下发I/O指令的情况。
S102:判断该I/O指令是否在第一预设时间内返回;
若否,则进入步骤S103;
当该I/O指令未在第一预设时间内返回时,则证明该SCSI硬盘出现了异常超时的情况,此时进入步骤S103中;
可选的,当该I/O指令在第一预设时间内返回时,则证明该SCSI硬盘未出现异常超时的情况,此时可直接确定该SCSI硬盘未发生故障。
S103:将该I/O指令标记为短超时I/O指令,并向该SCSI硬盘发送预设检测指令;
这里提到的预设检测指令具体可以为用户输入的SCSI test unit ready(简称TUR)指令,test unit ready指令为查询设备是否ready的指令,对于SCSI硬盘来说,testunit ready指令的执行优先级相对于I/O指令较高,响应简单,因此可通过发送预设检测指令至SCSI硬盘,并根据该SCSI硬盘的返回结果确定链路和SCSI硬盘是否正常,如果该预设检测指令正常返回,则证明下发该I/O指令的链路和SCSI硬盘均正常;
进一步的,这里提到的链路指的是控制器连接SCSI硬盘的一个接口,从控制器到SCSI硬盘的路线称之为链路。
S104:当该预设检测指令正常返回时,判断该下发次数是否超过第一阈值;
若是,则进入步骤S105;
可选的,当该下发次数未超过第一阈值时,则还可以返回执行步骤S101,因为该预设检测指令正常返回,则证明下发该I/O指令的链路和SCSI硬盘均正常,此时重新发送该I/O指令,以尽最大努力保证不“冤死”每一块SCSI硬盘。
S105:将下发该I/O指令的链路移除;
当该下发次数超过第一阈值时,则证明重新发送次数已经足够多,可以确定该链路存在问题,此时将下发该I/O指令的链路移除。
S106:当该SCSI硬盘的链路全部移除时,确认该SCSI硬盘发生故障,将该SCSI硬盘中的数据进行迁移,并移除该SCSI硬盘。
基于现在的存储厂商为了冗余的策略一般是双控产品(有两个控制器),后端挂载双端口的SCSI硬盘,因此本申请实施例只有在该SCSI硬盘的链路全部移除时,才确认该SCSI硬盘发生故障;
优选的,在移除该SCSI硬盘之后,还可以输出相应的提示信息,以便于用户能够根据该提示信息查找到该SCSI硬盘中的数据的迁移位置。
基于上述技术方案,本申请所提供的一种SCSI硬盘异常超时的处理方法,通过在检测到SCSI硬盘异常超时时,先向该SCSI硬盘发送预设检测指令,并在该预设检测指令正常返回,且该I/O指令下发次数未超过第一阈值时,重新下发该I/O指令;当该下发次数超过该第一阈值,才将下发该I/O指令的链路移除,并在该SCSI硬盘的链路全部移除时,才确认该SCSI硬盘发生故障,在该预设检测指令正常返回时直接重新下发该I/O指令来代替执行reset操作,节省了执行reset操作的成本,提高了SCSI硬盘异常超时的处理效率,保证了整个存储系统产品的稳定性,提升了整个存储产品的核心竞争力。
针对于上述实施例的步骤S103,在向该SCSI硬盘发送预设检测指令之后,当该预设检测指令未正常返回时,还可以执行如图2所示的步骤,下面结合图2进行说明。
请参考图2,图2为本申请实施例所提供的另一种SCSI硬盘异常超时的处理方法的流程图。
其具体包括以下步骤:
S201:判断I/O指令是否在第二预设时间内返回;
这里提到的第二预设时间大于上文中提到的第一预设时间;
优选的,当该I/O指令在第二预设时间内返回时,还包括:
上报I/O指令存在短超时错误;
当该I/O指令未在第一预设时间内返回,而在第二预设时间内返回时,则证明该I/O指令能够正常返回,但返回时间较长,此时上报I/O指令存在短超时错误,以使用户能够修复该I/O指令返回时间较长的问题。
S202:将I/O指令标记为长超时指令,并判断SCSI硬盘是否执行过reset操作;
若否,则进入步骤S203;若否,则进入步骤S204。
S203:对该SCSI硬盘执行reset操作;
当该SCSI硬盘未执行过reset操作时,则对该SCSI硬盘执行reset操作,并返回执行向SCSI硬盘下发I/O指令,并记录I/O指令的下发次数的步骤。
S204:确认SCSI硬盘发生故障,将SCSI硬盘中的数据进行迁移,并移除SCSI硬盘。
针对于上述实施例的步骤S103,在向该SCSI硬盘发送预设检测指令之后,还可以执行如图2所示的步骤,下面结合图3进行说明。
请参考图3,图3为本申请实施例所提供的再一种SCSI硬盘异常超时的处理方法的流程图。
其具体包括以下步骤:
S301:将下发I/O指令的链路的错误计数加一;
S302:判断该错误计数是否超过第二阈值;
若是,则进入步骤S303。
S303:将下发该I/O指令的链路移除。
请参考图4,图4为本申请实施例所提供的一种SCSI硬盘异常超时的处理系统的结构图。
该系统可以包括:
下发模块100,用于向SCSI硬盘下发I/O指令,并记录I/O指令的下发次数;
第一判断模块200,用于判断I/O指令是否在第一预设时间内返回;
标记模块300,用于当I/O指令未在第一预设时间内返回时,将I/O指令标记为短超时I/O指令,并向SCSI硬盘发送预设检测指令;
第二判断模块400,用于当预设检测指令正常返回时,判断下发次数是否超过第一阈值;
第一返回模块500,用于当下发次数未超过第一阈值时,返回下发模块100执行向SCSI硬盘下发I/O指令,并记录I/O指令的下发次数的步骤;
第一链路移除模块600,用于当下发次数超过第一阈值时,则将下发I/O指令的链路移除;
第一确认模块700,用于当SCSI硬盘的链路全部移除时,确认SCSI硬盘发生故障,将SCSI硬盘中的数据进行迁移,并移除SCSI硬盘。
请参考图5,图5为本申请实施例所提供的另一种SCSI硬盘异常超时的处理系统的结构图。
该系统还可以包括:
第三判断模块,用于当预设检测指令未正常返回时,判断I/O指令是否在第二预设时间内返回;
第四判断模块,用于当I/O指令未在第二预设时间内返回时,将I/O指令标记为长超时指令,并判断SCSI硬盘是否执行过reset操作;
第二返回模块,用于当SCSI硬盘未执行过reset操作时,对SCSI硬盘执行reset操作,并返回下发模块100执行向SCSI硬盘下发I/O指令,并记录I/O指令的下发次数的步骤;
第二确认模块,用于若SCSI硬盘执行过reset操作,则确认SCSI硬盘发生故障,将SCSI硬盘中的数据进行迁移,并移除SCSI硬盘。
该系统还可以包括:
上报模块,用于当I/O指令在第二预设时间内返回时,上报I/O指令存在短超时错误。
该系统还可以包括:
计数模块,用于将下发I/O指令的链路的错误计数加一;
第五判断模块,用于判断错误计数是否超过第二阈值;
第二链路移除模块,用于当错误计数超过第二阈值时,将下发I/O指令的链路移除。
以上系统中的各个组成部分可实际应用于以下的实施例中:
下发模块向SCSI硬盘下发I/O指令,并记录I/O指令的下发次数;第一判断模块判断I/O指令是否在第一预设时间内返回;若是,则标记模块将I/O指令标记为短超时I/O指令,并向SCSI硬盘发送预设检测指令,同时计数模块将下发I/O指令的链路的错误计数加一;第五判断模块判断错误计数是否超过第二阈值;当错误计数超过第二阈值时,第二链路移除模块将下发I/O指令的链路移除;
当预设检测指令正常返回时,第二判断模块判断下发次数是否超过第一阈值;若否,则第一返回模块返回下发模块执行向SCSI硬盘下发I/O指令,并记录I/O指令的下发次数的步骤;若是,则第一链路移除模块将下发I/O指令的链路移除;当SCSI硬盘的链路全部移除时,第一确认模块确认SCSI硬盘发生故障,将SCSI硬盘中的数据进行迁移,并移除SCSI硬盘。
当预设检测指令未正常返回时,第三判断模块判断I/O指令是否在第二预设时间内返回;当I/O指令未在第二预设时间内返回时,上报模块上报I/O指令存在短超时错误,第四判断模块将I/O指令标记为长超时指令,并判断SCSI硬盘是否执行过reset操作;若否,则第二返回模块对SCSI硬盘执行reset操作,并返回下发模块执行向SCSI硬盘下发I/O指令,并记录I/O指令的下发次数的步骤;若是,则第二确认模块确认SCSI硬盘发生故障,将SCSI硬盘中的数据进行迁移,并移除SCSI硬盘。
请参考图6,图6为本申请实施例所提供的一种SCSI硬盘异常超时的处理设备的结构图。
该SCSI硬盘异常超时的处理设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)822(例如,一个或一个以上处理器)和存储器832,一个或一个以上存储应用程序842或数据844的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对装置中的一系列指令操作。更进一步地,中央处理器822可以设置为与存储介质830通信,在SCSI硬盘异常超时的处理设备800上执行存储介质830中的一系列指令操作。
SCSI硬盘异常超时的处理设备800还可以包括一个或一个以上电源828,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口858,和/或,一个或一个以上操作系统841,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述图1至图3所描述的SCSI硬盘异常超时的处理方法中的步骤由SCSI硬盘异常超时的处理设备基于该图6所示的结构实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置、设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,功能调用装置,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请所提供的一种SCSI硬盘异常超时的处理方法、处理系统、处理设备及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种SCSI硬盘异常超时的处理方法,其特征在于,包括:
向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数;
判断所述I/O指令是否在第一预设时间内返回;
若否,则将所述I/O指令标记为短超时I/O指令,并向所述SCSI硬盘发送预设检测指令;
当所述预设检测指令正常返回时,判断所述下发次数是否超过第一阈值;
若所述下发次数未超过所述第一阈值,则返回执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
若所述下发次数超过所述第一阈值,则将下发所述I/O指令的链路移除;
当所述SCSI硬盘的链路全部移除时,确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
2.根据权利要求1所述的处理方法,其特征在于,当所述预设检测指令未正常返回时,还包括:
判断所述I/O指令是否在第二预设时间内返回;
若否,则将所述I/O指令标记为长超时指令,并判断所述SCSI硬盘是否执行过reset操作;
若所述SCSI硬盘未执行过所述reset操作,则对所述SCSI硬盘执行所述reset操作,并返回执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
若所述SCSI硬盘执行过所述reset操作,则确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
3.根据权利要求2所述的处理方法,其特征在于,当所述I/O指令在所述第二预设时间内返回时,还包括:
上报所述I/O指令存在短超时错误。
4.根据权利要求1所述的处理方法,其特征在于,在将所述I/O指令标记为短超时I/O指令,并向所述SCSI硬盘发送预设检测指令之后,还包括:
将下发所述I/O指令的链路的错误计数加一;
判断所述错误计数是否超过第二阈值;
若是,则将下发所述I/O指令的链路移除。
5.一种SCSI硬盘异常超时的处理系统,其特征在于,包括:
下发模块,用于向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数;
第一判断模块,用于判断所述I/O指令是否在第一预设时间内返回;
标记模块,用于当所述I/O指令未在所述第一预设时间内返回时,将所述I/O指令标记为短超时I/O指令,并向所述SCSI硬盘发送预设检测指令;
第二判断模块,用于当所述预设检测指令正常返回时,判断所述下发次数是否超过第一阈值;
第一返回模块,用于当所述下发次数未超过所述第一阈值时,返回所述下发模块执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
第一链路移除模块,用于当所述下发次数超过所述第一阈值时,将下发所述I/O指令的链路移除;
第一确认模块,用于当所述SCSI硬盘的链路全部移除时,确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
6.根据权利要求5所述的处理系统,其特征在于,还包括:
第三判断模块,用于当所述预设检测指令未正常返回时,判断所述I/O指令是否在第二预设时间内返回;
第四判断模块,用于当所述I/O指令未在所述第二预设时间内返回时,将所述I/O指令标记为长超时指令,并判断所述SCSI硬盘是否执行过reset操作;
第二返回模块,用于当所述SCSI硬盘未执行过所述reset操作时,对所述SCSI硬盘执行所述reset操作,并返回所述下发模块执行所述向SCSI硬盘下发I/O指令,并记录所述I/O指令的下发次数的步骤;
第二确认模块,用于当所述SCSI硬盘执行过所述reset操作时,确认所述SCSI硬盘发生故障,将所述SCSI硬盘中的数据进行迁移,并移除所述SCSI硬盘。
7.根据权利要求6所述的处理系统,其特征在于,还包括:
上报模块,用于当所述I/O指令在所述第二预设时间内返回时,上报所述I/O指令存在短超时错误。
8.根据权利要求5所述的处理系统,其特征在于,还包括:
计数模块,用于将下发所述I/O指令的链路的错误计数加一;
第五判断模块,用于判断所述错误计数是否超过第二阈值;
第二链路移除模块,用于当所述错误计数超过所述第二阈值时,将下发所述I/O指令的链路移除。
9.一种SCSI硬盘异常超时的处理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述SCSI硬盘异常超时的处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述SCSI硬盘异常超时的处理方法的步骤。
CN201811135592.2A 2018-09-27 2018-09-27 一种scsi硬盘异常超时的处理方法及处理系统 Active CN109376029B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811135592.2A CN109376029B (zh) 2018-09-27 2018-09-27 一种scsi硬盘异常超时的处理方法及处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811135592.2A CN109376029B (zh) 2018-09-27 2018-09-27 一种scsi硬盘异常超时的处理方法及处理系统

Publications (2)

Publication Number Publication Date
CN109376029A CN109376029A (zh) 2019-02-22
CN109376029B true CN109376029B (zh) 2021-11-19

Family

ID=65402828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811135592.2A Active CN109376029B (zh) 2018-09-27 2018-09-27 一种scsi硬盘异常超时的处理方法及处理系统

Country Status (1)

Country Link
CN (1) CN109376029B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815075B (zh) * 2019-02-28 2020-07-03 苏州浪潮智能科技有限公司 一种gpgpu链结速度的检测方法及装置
CN110750213A (zh) * 2019-09-09 2020-02-04 华为技术有限公司 一种硬盘管理方法及装置
CN111698120B (zh) * 2020-06-02 2022-10-18 浙江大华技术股份有限公司 存储节点隔离方法和装置
CN111858136A (zh) * 2020-06-30 2020-10-30 广东浪潮大数据研究有限公司 固态硬盘异常数据检测方法、系统、电子设备及存储介质
CN112631659B (zh) * 2020-12-07 2022-08-19 苏州浪潮智能科技有限公司 一种处理指令超时的方法、系统、设备及介质
CN113722139A (zh) * 2021-08-27 2021-11-30 东莞盟大集团有限公司 请求效率高且不易丢失数据的数据请求方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6560662B1 (en) * 1999-06-30 2003-05-06 Nec Corporation Time-out processing method and apparatus for SCSI system as well as recording medium on which program is recorded
CN102446123A (zh) * 2010-10-09 2012-05-09 杭州华三通信技术有限公司 一种对scsi感测数据进行处理的方法和装置
CN106708646A (zh) * 2016-12-22 2017-05-24 郑州云海信息技术有限公司 硬盘异常自动复位方法及其装置
CN106980468A (zh) * 2017-03-03 2017-07-25 杭州宏杉科技股份有限公司 触发raid阵列重建的方法及装置
CN108459977A (zh) * 2017-02-20 2018-08-28 中兴通讯股份有限公司 一种存储系统中多控制器之间的io转发方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4723290B2 (ja) * 2005-06-06 2011-07-13 株式会社日立製作所 ディスクアレイ装置及びその制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6560662B1 (en) * 1999-06-30 2003-05-06 Nec Corporation Time-out processing method and apparatus for SCSI system as well as recording medium on which program is recorded
CN102446123A (zh) * 2010-10-09 2012-05-09 杭州华三通信技术有限公司 一种对scsi感测数据进行处理的方法和装置
CN106708646A (zh) * 2016-12-22 2017-05-24 郑州云海信息技术有限公司 硬盘异常自动复位方法及其装置
CN108459977A (zh) * 2017-02-20 2018-08-28 中兴通讯股份有限公司 一种存储系统中多控制器之间的io转发方法及装置
CN106980468A (zh) * 2017-03-03 2017-07-25 杭州宏杉科技股份有限公司 触发raid阵列重建的方法及装置

Also Published As

Publication number Publication date
CN109376029A (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN109376029B (zh) 一种scsi硬盘异常超时的处理方法及处理系统
CN109358947B (zh) 一种虚拟机快照的实现方法及系统
CN107315616B (zh) 一种固件的加载方法、装置及电子设备
EP3147797B1 (en) Data management method, node and system for database cluster
CN107451006B (zh) 限制存储设备中的性能变化的技术
JP6183931B2 (ja) クラスタシステム、サーバ装置、クラスタシステムの管理方法、及びプログラム。
US20170212815A1 (en) Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program
US8782465B1 (en) Managing drive problems in data storage systems by tracking overall retry time
US7171583B2 (en) For PPRC backup systems
JP2017091077A (ja) 擬似故障の発生プログラム、発生方法、及び発生装置
JP2019192032A (ja) 記憶システム、及び、クラスタ構成制御方法
US20110173233A1 (en) Database system and database control method
CN114138838A (zh) 数据处理方法及装置、设备和介质
JP2020021313A (ja) データ処理装置および診断方法
US10782881B2 (en) Storage device for not allowing to write data based on end of life of a disk device
US11704180B2 (en) Method, electronic device, and computer product for storage management
US9348704B2 (en) Electronic storage system utilizing a predetermined flag for subsequent processing of each predetermined portion of data requested to be stored in the storage system
US8589722B2 (en) Methods and structure for storing errors for error recovery in a hardware controller
CN115240759A (zh) 一种固态硬盘检测方法、装置、设备及存储介质
EP2616938B1 (en) Fault handling systems and methods
CN111090491B (zh) 虚拟机任务状态的恢复方法、装置及电子设备
CN114564334A (zh) 一种mrpc数据处理方法、系统及相关组件
CN110795155B (zh) 系统启动方法及装置、电子设备、存储介质
CN111309504A (zh) 嵌入式模块串口冗余传输的控制方法及相关组件
CN110389869A (zh) 一种异常检测方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant