CN101488108B - 一种提高sas域运行稳定性的方法、装置及系统 - Google Patents

一种提高sas域运行稳定性的方法、装置及系统 Download PDF

Info

Publication number
CN101488108B
CN101488108B CN2008102416266A CN200810241626A CN101488108B CN 101488108 B CN101488108 B CN 101488108B CN 2008102416266 A CN2008102416266 A CN 2008102416266A CN 200810241626 A CN200810241626 A CN 200810241626A CN 101488108 B CN101488108 B CN 101488108B
Authority
CN
China
Prior art keywords
physical channel
sas
sas physical
state variation
variation number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008102416266A
Other languages
English (en)
Other versions
CN101488108A (zh
Inventor
胡瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Symantec Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Symantec Technologies Co Ltd filed Critical Huawei Symantec Technologies Co Ltd
Priority to CN2008102416266A priority Critical patent/CN101488108B/zh
Publication of CN101488108A publication Critical patent/CN101488108A/zh
Priority to PCT/CN2009/074395 priority patent/WO2010069195A1/zh
Priority to EP09832877A priority patent/EP2369488A1/en
Application granted granted Critical
Publication of CN101488108B publication Critical patent/CN101488108B/zh
Priority to US13/163,212 priority patent/US20110246685A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3041Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is an input/output interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3044Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is the mechanical casing of the computing system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种提高SAS域运行稳定性的方法、装置及系统。该方法包括监测并记录预定时间内SAS域中SAS物理通道的状态变化次数,对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。通过本发明实施例所述方法,能够提高SAS域运行的稳定性。

Description

一种提高SAS域运行稳定性的方法、装置及系统
技术领域
本发明涉及通信领域,尤其涉及一种提高SAS域运行稳定性的方法和装置以及使用所述装置的系统。
背景技术
SAS(Serial Attached SCSI)即串行连接SCSI(Small Computer SystemInterface,小型计算机系统专用接口),它采用串行技术获得了更高的传输速度,并且通过缩短连结线改善了接口内部空间,是新一代串行点对点的企业级存储设备接口。SAS接口使存储系统应用更加灵活,使用户可以根据实际需求选择SAS磁盘或者SATA磁盘,因此在扩充存储系统时拥有更多的弹性,能够让存储设备发挥最大的投资效益。同时SAS结构有非常好的扩展能力,通过使用SAS扩展设备(是一个方便大量的SAS设备通信的器件,包含至少2个外部接口)最多可以连接16384个磁盘设备,一般将这种由一系列通过服务传输子系统通信的SAS设备组成的集合称为SAS域,将SAS设备与SAS扩展设备连接的通道称为SAS物理通道。
发明人在实现本发明的过程中,发现现有技术中,由于存储设备连接SAS时,每个主机向目标设备发送的请求以及目标设备的响应都是通过点对点建立连接,使用一个特定的物理通道进行数据传输。当某个SAS物理通道的状态发生了变化时,会导致整个SAS域中所有SAS物理通道上的数据暂停传输,性能严重下降,甚至导致系统崩溃,直到系统恢复操作完成,这个SAS域中所有的SAS物理通道才能重新进行正常的数据传输,影响了系统运行的稳定性。
发明内容
本发明实施例提供了一种提高SAS域运行稳定性的方法和装置以及使用所述装置的系统,所述方法和装置提高了SAS域运行的稳定性。
根据本发明的一方面,提供一种提高SAS域运行稳定性的方法,包括:监测并记录预定时间内SAS域中SAS物理通道的状态变化次数;判断所监测的SAS物理通道的状态变化次数是否满足预置的隔离条件;对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
根据本发明的另一方面,提供一种提高SAS域运行稳定性的装置,包括监测记录模块、第一判断模块和隔离模块,所述监测记录模块用于监测并记录预定时间内SAS域中SAS物理通道的状态变化次数,第一判断模块,用于当判断所述监测记录模块所监控的SAS物理通道的状态变化次数满足预置的隔离条件时触发所述隔离模块,所述隔离模块用于对状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
根据本发明的另一方面,提供一种存储系统,包括存储装置和稳定装置,所述存储装置用于存储数据,所述存储装置中至少包含两个存储设备,所述存储设备通过SAS物理通道连接;所述稳定装置用于监测记录预定时间内所述存储装置中的SAS物理通道状态的变化次数,判断所监测的SAS物理通道的状态变化次数是否满足预置的隔离条件,并对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
本发明实施例所述技术方案,通过对SAS域中的SAS物理通道的状态变化进行监控和记录,从而将预定时间内满足一定条件的SAS物理通道视为发生故障的SAS物理通道,并隔离所述发生故障的SAS物理通道,确保了其他SAS物理通道能够正常传输数据,提高了整个SAS域运行的稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的提高SAS域运行稳定性的方法流程示意图;
图2为本发明实施例二提供的提高SAS域运行稳定性的方法的具体流程示意图;
图3为本发明实施例三提供的提高SAS域运行稳定性的方法的具体流程示意图;
图4为本发明实施例四提供的提高SAS域运行稳定性的装置结构示意图;
图5为本发明实施例五提供的提高SAS域运行稳定性的装置结构示意图;
图6为本发明实施例六提供的提高SAS域运行稳定性的装置结构示意图;
图7为本发明实施例七提供的存储系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在SAS域中,具有至少一个SAS扩展设备,所述SAS扩展设备中包含有SAS扩展芯片,在所述SAS扩展芯片中对每一个SAS物理通道都设有相应的控制该SAS物理通道的控制寄存器,还设有相应的监测SAS物理通道状态变化的寄存器(以下简称为监测寄存器)。
图1为本发明实施例一提供的一种提高SAS域运行稳定性的方法流程示意图,如图1所示,所述方法包括:
步骤101:监测并记录预定时间内SAS域中SAS物理通道的状态变化次数;
所述预定时间是为监测并记录SAS物理通道的状态变化次数设定的一个时间周期。所述SAS物理通道的状态变化情况可以通过读取所述SAS物理通道对应的监测寄存器值来获得,所述监测寄存器中寄存有对应的SAS物理通道状态变化的绝对次数,所述SAS物理通道的状态变化次数可以根据所述SAS物理通道相邻两次状态变化绝对次数的差值来获得。
步骤102:对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
所述隔离条件可以根据设备性能或实际使用情况来确定,可以将所述预定的时间内SAS物理通道状态变化次数大于或大于等于门限值的SAS物理通道视为需要隔离的发生故障的SAS物理通道,例如可以设定预定时间为60秒,预定门限值为3次,隔离条件为60秒内状态变化次数大于等于3次,即将在60秒内状态变化次数大于等于3次的SAS物理通道视为满足隔离条件的发生故障的物理通道,对其进行隔离。所述隔离的方法可以通过改变该SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道,从而达到隔离SAS物理通道的目的。
从上述技术方案可以看出,通过监测并记录SAS域中SAS物理通道在预定时间内的状态变化次数,当所述SAS物理通道的状态变化次数满足被隔离的条件时,即认为所述SAS物理通道发生故障,并及时有效的将所述发生故障的SAS物理通道隔离,使所述发生故障的SAS物理通道不影响其他SAS物理通道正常传输数据,提高了整个SAS域运行的稳定性。
图2为本发明实施例二提供的一种提高SAS域运行稳定性的方法的具体流程示意图,如图2所示,所述方法包括:
步骤201:监测并记录所述SAS物理通道的状态变化次数,进入步骤202;
所述SAS物理通道的状态变化情况可以通过读取该SAS物理通道对应的监测寄存器值来获得,所述监测寄存器中寄存有对应的SAS物理通道状态变化的绝对次数,所述SAS物理通道的状态变化次数可以根据所述SAS物理通道相邻两次状态变化绝对次数的差值来获得。
步骤202:判断是否到达预定时间,到达预定时间则进入步骤203,否则进入步骤201继续监测并记录所述SAS物理通道的状态变化次数;
所述预定时间是为监测并记录所述SAS物理通道的状态变化次数设定的一个时间周期,是判断所述SAS物理通道是否发生故障的一个时间条件。
步骤203:判断所述SAS物理通道状态变化次数是否大于预置的门限值,是则进入步骤204,否则进入步骤205;
所述预定时间内SAS物理通道的状态变化次数大于预置的门限值为本发明实施例所示的隔离条件,所述隔离条件还可以为将所述预定的时间内SAS物理通道的状态变化次数大于等于门限值的SAS物理通道视为需要隔离的发生故障的SAS物理通道,所述预定的时间和所述门限值可以根据设备性能或实际使用情况来确定,例如可以设定预定时间为60秒,预定门限值为3次,隔离条件为60秒内状态变化次数大于等于3次,即将在60秒内SAS物理通道的状态变化次数大于等于3次的SAS物理通道视为满足隔离条件的发生故障的物理通道。
步骤204:隔离所述SAS物理通道,进入步骤205;
所述隔离的方法可以通过改变该SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道,从而达到隔离SAS物理通道的目的。
步骤205:判断系统运行是否结束,是则结束,否则进入步骤201继续监测并记录所述SAS物理通道的状态变化次数。
从上述技术方案可以看出,通过监测并记录预定时间内SAS域中SAS物理通道的状态变化次数,根据所述SAS物理通道的状态变化次数来设定隔离条件,即认为满足所述隔离条件的SAS物理通道为发生故障的SAS物理通道,从而将发生故障的SAS物理通道隔离,使所述发生故障的SAS物理通道不影响其他SAS物理通道正常传输数据,保证了整个SAS域运行的稳定性。
图3为本发明实施例三提供的一种提高SAS域运行稳定性的方法的具体流程示意图,如图3所示,所述方法包括:
步骤301:判断SAS域中的SAS物理通道是否连接有存储设备,如果连接有存储设备则进入步骤303,否则进入步骤302;
所述判断SAS物理通道是否连接有存储设备是根据所述SAS域中的SAS扩展设备中预置的寄存器来确定的,所述寄存器用于监测对应物理通道是否连接有存储设备,所述存储设备包括硬盘设备或级联的SAS扩展设备等。
步骤302:将该SAS物理通道的状态变化次数清零,进入步骤303;
所述将该SAS物理通道状态变化次数清零的目的在于当人为反复插拔硬盘或SAS级联扩展设备等存储设备,而使该SAS物理通道没有连接相应的存储设备时,所述SAS物理通道不会被误认为是发生故障的SAS物理通道,从而被误隔离。
步骤303:监测并记录所述SAS物理通道的状态变化次数,进入步骤304;
所述SAS物理通道的状态变化情况可以通过读取所述SAS物理通道对应的监测寄存器值来获得,所述监测寄存器中寄存有对应的SAS物理通道状态变化的绝对次数,所述SAS物理通道的状态变化次数可以根据所述SAS物理通道相邻两次SAS物理通道状态变化绝对次数的差值来获得。
步骤304:判断是否到达预定时间,到达预定时间则进入步骤305,否则进入步骤303继续监测并记录SAS物理通道的状态变化次数;
所述预定时间是为监测并记录所述SAS物理通道的状态变化次数设定的一个时间周期,是判断所述SAS物理通道是否发生故障的一个时间条件。
步骤305:判断该SAS物理通道状态变化次数是否大于预置的门限值,是则进入步骤306,否则进入步骤307;
所述预定时间内SAS物理通道的状态变化次数大于预置的门限值为本发明实施例所示的隔离条件,所述隔离条件还可以为将所述预定时间内SAS物理通道的状态变化次数大于等于门限值的SAS物理通道视为需要隔离的发生故障的SAS物理通道,所述预定的时间和所述门限值可以根据设备性能或实际使用情况来确定,例如可以设定预定时间为60秒,预定门限值为3次,隔离条件为60秒内状态变化次数大于等于3次,即将在60秒内SAS物理通道状态变化次数大于等于3次的SAS物理通道视为满足隔离条件的发生故障的物理通道。
步骤306:隔离该SAS物理通道,进入步骤307;
所述隔离的方法可以通过改变该SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道,从而达到隔离SAS物理通道的目的。
步骤307:判断系统运行是否结束,是则结束,否则继续进入步骤301。
在本发明实施例三所述的方法中,为了提高隔离SAS物理通道的准确性,通过SAS扩展设备中预置的寄存器来监测SAS物理通道是否连接有存储设备,如果该SAS物理通道没有连接存储设备,则将该SAS物理通道的状态变化次数清零,从而保证由人为反复插拔硬盘或级联SAS扩展设备时,不会将该SAS物理通道作为发生故障的SAS物理通道而被误隔离,提高了隔离SAS物理通道的准确性,使发生故障的SAS物理通道不影响其他SAS物理通道正常传输数据,更好的保证了整个SAS域运行的稳定性。
图4为本发明实施四提供的一种提高SAS域运行稳定性的装置结构示意图,如图4所示,所述装置包括:
监测记录模块401:用于监测并记录预定时间内SAS域中SAS物理通道的状态变化次数;
所述预定时间是为监测并记录所述时间内的SAS物理通道的状态变化次数设定的一个时间周期。所述SAS物理通道的状态变化情况可以通过读取所述SAS物理通道对应的监测寄存器值来获得,所述监测寄存器中寄存有对应的SAS物理通道状态变化的绝对次数,所述SAS物理通道的状态变化次数可以根据所述SAS物理通道相邻两次状态变化绝对次数的差值来获得。
隔离模块402:用于根据监测记录模块401的监测记录结果隔离状态变化次数满足预置的隔离条件的SAS物理通道。
所述隔离条件是根据设备性能或实际使用情况来设定,所述隔离条件可以为将所述预定的时间内SAS物理通道的状态变化次数大于或大于等于门限值的SAS物理通道视为需要隔离的发生故障的SAS物理通道,例如可以设定预定时间为60秒,预定门限值为3次,隔离条件为60秒内状态变化次数大于等于3次,即将在60秒内SAS物理通道状态变化次数大于等于3次的SAS物理通道视为满足隔离条件的发生故障的物理通道,对其进行隔离。所述隔离模块402可以通过改变该SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道,从而达到隔离SAS物理通道的目的。
在本发明实施例四所述技术方案中,通过监测记录模块401来监测并记录SAS域中SAS物理通道在预定时间内的状态变化次数,当所述SAS物理通道的状态变化次数满足预置的隔离条件时,即认为所述SAS物理通道发生故障,并触发隔离模块402将所述发生故障的SAS物理通道隔离,使所述发生故障的SAS物理通道不影响其他SAS物理通道正常传输数据,从而使整个SAS域能够稳定运行。
图5为本发明实施例五提供的一种提高SAS域运行稳定性的装置结构示意图,如图5所示,所述装置包括:
监测记录模块501:用于监测并记录所述SAS物理通道的状态变化次数;
所述SAS物理通道的状态变化情况可以通过读取所述SAS物理通道对应的监测寄存器值来获得,所述监测寄存器中寄存有对应的SAS物理通道状态变化的绝对次数,所述SAS物理通道的状态变化次数可以根据所述SAS物理通道相邻两次状态变化绝对次数的差值来获得。
第一判断模块502:用于判断所述监测记录模块501所监控的SAS物理通道状态变化是否满足预置的隔离条件,如果满足隔离条件则触发隔离模块503,否则触发监测记录模块501;
所述隔离条件可以根据设备性能和实际使用情况来设定,可以将所述预定时间内SAS物理通道的状态变化次数大于或大于等于门限值的SAS物理通道视为需要隔离的发生故障的SAS物理通道,例如可以设定预定时间为60秒,预定门限值为3次,隔离条件为60秒内状态变化次数大于等于3次,即将在60秒内SAS物理通道状态变化次数大于等于3次的SAS物理通道视为满足隔离条件的发生故障的物理通道,从而触发隔离模块503。
隔离模块503:用于隔离经过第一判断模块502判断为满足隔离条件的SAS物理通道。
所述隔离模块503可以通过改变该SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道,从而达到隔离SAS物理通道的目的。
在本发明实施例五所述的装置中,通过监测记录模块501来监测并记录预定时间内SAS域中SAS物理通道的状态变化次数,并由第一判断模块502来判断所述监测记录模块501所监控的SAS物理通道状态变化是否满足预置的隔离条件,并由隔离模块503对满足隔离条件的SAS物理通道进行隔离,使所述发生故障的SAS物理通道不影响其他SAS物理通道正常传输数据,提高了整个SAS域运行的稳定性。
图6为本发明实施六提供的一种提高SAS域运行稳定性的装置结构示意图,如图6所示,所述装置包括:
第二判断模块601:用于判断SAS域中的SAS物理通道是否连接有存储设备,如果所述SAS物理通道连接有存储设备则触发监测记录模块603,否则触发初始化模块602;
判断所述SAS物理通道是否连接有存储设备是根据所述SAS域中的SAS扩展设备中预置的寄存器来确定的,所述寄存器用于监测对应物理通道是否连接有存储设备,所述存储设备包括硬盘设备或级联的SAS扩展设备等。
初始化模块602:用于将所述SAS物理通道的状态变化次数清零后触发监测记录模块603;
所述将该SAS物理通道的状态变化次数清零的目的在于当人为反复插拔硬盘或SAS级联扩展设备等存储设备,而使该SAS物理通道没有连接相应的存储设备时,所述SAS物理通道不会被误认为是发生故障的SAS物理通道,从而被误隔离。
监测记录模块603:用于监测并记录所述SAS物理通道的状态变化次数,触发第三判断模块604;
所述SAS物理通道的状态变化情况可以通过读取所述SAS物理通道对应的监测寄存器值来获得,所述监测寄存器中寄存有对应的SAS物理通道状态变化的绝对次数,所述SAS物理通道的状态变化次数可以根据所述SAS物理通道相邻两次状态变化绝对次数的差值来获得。
第三判断模块604:用于根据监测记录模块603的记录结果判断所述SAS物理通道状态变化是否满足隔离条件,如果满足隔离条件则触发隔离模块605,否则触发第二判断模块601;
所述隔离条件可以根据设备性能和实际使用情况来设定,可以将所述预定时间内SAS物理通道的状态变化次数大于或大于等于门限值的SAS物理通道视为需要隔离的发生故障的SAS物理通道,例如可以设定预定时间为60秒,预定门限值为3次,隔离条件为60秒内状态变化次数大于等于3次,即将在60秒内SAS物理通道状态变化次数大于等于3次的SAS物理通道视为满足隔离条件的发生故障的物理通道,从而触发隔离模块605。
隔离模块605:用于隔离经过第三判断模块604判断为满足隔离条件的SAS物理通道。
所述隔离模块605可以通过改变该SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道,从而达到隔离SAS物理通道的目的。
在本发明实施例六所述的提高SAS域运行稳定性的装置中,由于增加了第二判断模块601用于判断SAS域中的SAS物理通道是否连接有存储设备,并通过初始化模块602将未连接有存储设备的SAS物理通道状态变化次数清零后再触发监测记录模块,并将满足隔离条件的SAS物理通道进行隔离,从而提高了隔离SAS物理通道的准确性,保证了由人为反复插拔存储设备而造成该SAS物理通道未连接存储设备时,该SAS物理通道不会被误认为是发生故障的物理通道而被误隔离,更好的提高了整个SAS域运行的稳定性。
图7为本发明实施例七提供的存储系统结构示意图,如图7所示,所述存储系统包括:
存储装置701:用于存储数据,所述存储装置中至少包含两个存储设备,所述存储设备通过SAS物理通道连接;
稳定装置702:用于通过监测记录所述存储装置701中的SAS物理通道的状态变化次数,对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
所述稳定装置702包括:
监测记录模块7021:用于监测并记录预定时间内SAS域中SAS物理通道的状态变化次数;
所述预定时间是为监测并记录所述时间内的SAS物理通道的状态变化次数设定的一个时间周期。所述SAS物理通道的状态变化情况可以通过读取所述SAS物理通道对应的监测寄存器值来获得,所述监测寄存器中寄存有对应的SAS物理通道状态变化的绝对次数,所述SAS物理通道状态变化次数可以根据所述SAS物理通道相邻两次状态变化绝对次数的差值来获得。
隔离模块7022:用于根据监测记录模块7021的监测记录结果对状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
所述隔离条件是根据设备性能或实际使用情况来设定,所述隔离条件可以为将所述预定的时间内SAS物理通道状态变化次数大于或大于等于门限值的SAS物理通道视为需要隔离的发生故障的SAS物理通道,例如可以设定预定时间为60秒,预定门限值为3次,隔离条件为60秒内状态变化次数大于等于3次,即将在60秒内SAS物理通道状态变化次数大于等于3次的SAS物理通道视为满足隔离条件的发生故障的物理通道,对其进行隔离。所述隔离模块7022可以通过改变该SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道,从而达到隔离SAS物理通道的目的。
在本发明实施例七所述的存储系统中,由于采用了使存储装置稳定运行的稳定装置,所述稳定装置通过监测记录模块监测并记录存储装置中连接存储设备的SAS物理通道在预定时间内的状态变化次数,并根据所述SAS物理通道状态变化次数来判断所述SAS物理通道是否发生故障,并通过隔离模块对发生故障的SAS物理通道进行隔离,使其不影响其他SAS物理通道正常传输数据,从而提高了整个存储系统运行的稳定性。
需要说明的是,本发明实施例中所述第一判断模块、第二判断模块和第三判断模块只是为了描述方便在模块的名称上进行的区分,不表示有所述模块之间的先后顺序或功能限定等其它含义。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,所述程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述仅为本发明的几个实施例,可以理解的是,对本领域普通技术人员来说,可以根据本发明实施例的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims (11)

1.一种提高串行连接小型计算机专用接口SAS域运行稳定性的方法,其特征在于,包括:
监测并记录预定时间内SAS域中SAS物理通道的状态变化次数;
判断所监测的SAS物理通道的状态变化次数是否满足预置的隔离条件;
对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
2.根据权利要求1所述方法,其特征在于:所述对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离的方法包括改变所述SAS物理通道对应的控制寄存器值来关闭相应的SAS物理通道。
3.根据权利要求1所述方法,其特征在于:所述SAS物理通道的状态变化次数包括通过读取与所述SAS物理通道对应的监测寄存器值来获得。
4.根据权利要求1所述方法,其特征在于,还包括:判断SAS域中的SAS物理通道是否连接有存储设备,并将没有连接存储设备的SAS物理通道的状态变化次数清零,随后进入监测并记录预定时间内SAS域中SAS物理通道的状态变化次数的步骤。
5.一种提高SAS域运行稳定性的装置,其特征在于,包括:
监测记录模块,用于监测并记录预定时间内SAS域中SAS物理通道的状态变化次数;
第一判断模块,用于当判断所述监测记录模块所监测的SAS物理通道的状态变化次数满足预置的隔离条件时触发隔离模块;
隔离模块,用于对状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
6.根据权利要求5所述的装置,其特征在于:所述监测记录模块通过读取所述SAS物理通道对应的监测寄存器值来获得所监测的SAS物理通道的状态变化次数。
7.根据权利要求5所述的装置,其特征在于:所述隔离模块通过改变所述SAS物理通道对应的控制寄存器值关闭相应的SAS物理通道来隔离所述SAS物理通道。
8.根据权利要求5所述的装置,其特征在于:
所述第一判断模块还用于当判断所述监测记录模块所监控的SAS物理通道的状态变化次数不满足预置的隔离条件时,触发所述监测记录模块。
9.根据权利要求5所述的装置,其特征在于,还包括:
第二判断模块,用于判断SAS域中的SAS物理通道是否连接有存储设备,如果SAS域中的SAS物理通道连接有存储设备则触发所述监测记录模块,否则触发初始化模块;
初始化模块,用于将所述SAS物理通道状态变化次数清零后触发所述监测记录模块;
所述第一判断模块还用于当根据所述监测记录模块的记录结果判断所述SAS物理通道状态变化不满足隔离条件时,触发所述第二判断模块。
10.一种存储系统,其特征在于,包括:
存储装置,用于存储数据,所述存储装置中至少包含两个存储设备,所述存储设备通过SAS物理通道连接;
稳定装置,用于监测并记录预定时间内所述存储装置中的SAS域中SAS物理通道的状态变化次数,判断所监测的SAS物理通道的状态变化次数是否满足预置的隔离条件,并对所述状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
11.根据权利要求10所述的存储系统,其特征在于,所述稳定装置包括:
监测记录模块,用于监测并记录预定时间内所述存储装置中的SAS域中SAS物理通道的状态变化次数;
第一判断模块,用于当判断所述监测记录模块所监测的SAS物理通道的状态变化次数满足预置的隔离条件时触发隔离模块;
隔离模块,用于对状态变化次数满足预置的隔离条件的SAS物理通道进行隔离。
CN2008102416266A 2008-12-17 2008-12-17 一种提高sas域运行稳定性的方法、装置及系统 Active CN101488108B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN2008102416266A CN101488108B (zh) 2008-12-17 2008-12-17 一种提高sas域运行稳定性的方法、装置及系统
PCT/CN2009/074395 WO2010069195A1 (zh) 2008-12-17 2009-10-10 一种提高串行连接小型计算机系统接口域运行稳定性的方法、装置及系统
EP09832877A EP2369488A1 (en) 2008-12-17 2009-10-10 Method, device and system for improving running stability of serial attached small computer system interface domain
US13/163,212 US20110246685A1 (en) 2008-12-17 2011-06-17 Method, apparatus and system for improving running stability of sas domain

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102416266A CN101488108B (zh) 2008-12-17 2008-12-17 一种提高sas域运行稳定性的方法、装置及系统

Publications (2)

Publication Number Publication Date
CN101488108A CN101488108A (zh) 2009-07-22
CN101488108B true CN101488108B (zh) 2010-10-27

Family

ID=40891008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102416266A Active CN101488108B (zh) 2008-12-17 2008-12-17 一种提高sas域运行稳定性的方法、装置及系统

Country Status (4)

Country Link
US (1) US20110246685A1 (zh)
EP (1) EP2369488A1 (zh)
CN (1) CN101488108B (zh)
WO (1) WO2010069195A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488108B (zh) * 2008-12-17 2010-10-27 成都市华为赛门铁克科技有限公司 一种提高sas域运行稳定性的方法、装置及系统
CN103329107B (zh) * 2010-11-30 2016-09-28 惠普发展公司,有限责任合伙企业 改变消息广播错误检测
US9143416B2 (en) * 2012-06-19 2015-09-22 Hewlett-Packard Development Company, L.P. Expander device
CN109032976A (zh) * 2018-07-25 2018-12-18 郑州云海信息技术有限公司 一种物理通道的处理方法和装置
US20230171099A1 (en) * 2021-11-27 2023-06-01 Oracle International Corporation Methods, systems, and computer readable media for sharing key identification and public certificate data for access token verification

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738366B2 (en) * 2005-09-13 2010-06-15 Lsi Corporation Methods and structure for detecting SAS link errors with minimal impact on SAS initiator and link bandwidth
US7412631B2 (en) * 2005-09-13 2008-08-12 Lsi Corporation Methods and structure for verifying domain functionality
TWI307034B (en) * 2005-11-23 2009-03-01 Infortrend Technology Inc Storage virtualization subsystem and system with host-side redundancy via sas connectivity
EP2052326B1 (en) * 2006-06-08 2012-08-15 Dot Hill Systems Corporation Fault-isolating sas expander
US7673185B2 (en) * 2006-06-08 2010-03-02 Dot Hill Systems Corporation Adaptive SAS PHY configuration
US7486083B2 (en) * 2006-12-18 2009-02-03 Emc Corporation Managing system stability
CN101488108B (zh) * 2008-12-17 2010-10-27 成都市华为赛门铁克科技有限公司 一种提高sas域运行稳定性的方法、装置及系统

Also Published As

Publication number Publication date
EP2369488A4 (en) 2011-09-28
US20110246685A1 (en) 2011-10-06
CN101488108A (zh) 2009-07-22
EP2369488A1 (en) 2011-09-28
WO2010069195A1 (zh) 2010-06-24

Similar Documents

Publication Publication Date Title
CN101488108B (zh) 一种提高sas域运行稳定性的方法、装置及系统
US20040267516A1 (en) Method for controlling and emulating functional and logical behaviors of an array of storage devices for different protocols
US8327193B2 (en) Data storage device including a failure diagnostic log
TWI738739B (zh) 硬碟資料抹除方法、伺服器及系統
CN102033796B (zh) 测试系统和方法
CN104850480B (zh) 高密度存储服务器硬盘性能测试的方法及装置
US20090063895A1 (en) Scaleable and maintainable solid state drive
CN103218173A (zh) 存储控制方法及装置
CN107844165A (zh) 硬盘热插拔实现装置
JP2009205316A (ja) ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置
CN102087855A (zh) 存储设备旋转振动测试系统及方法
CN103870367A (zh) Sas扩展卡自动切换系统及方法
CN104932830A (zh) 信息处理方法及电子设备
CN100422968C (zh) 用以激活主机和外围装置之间的实体信道的信号产生电路及其相关方法
EP2527973B1 (en) Computer system with multiple operation modes and method of switching modes thereof
CN109599145A (zh) 一种固态硬盘的测试方法、装置及计算机存储介质
CN100504746C (zh) 数据存储方法及数据存储装置
CN110187994A (zh) 一种故障隔离方法、设备和故障隔离系统
US7603582B2 (en) Systems and methods for CPU repair
CN1945719B (zh) 信息记录设备、摄像装置和信息记录控制方法
TWI502350B (zh) 快閃記憶體的存取裝置及方法
CN104572380B (zh) 一种检测磁盘的方法和装置
CN101187849A (zh) 存储装置和存储系统
CN103985403B (zh) 工作时钟切换方法、存储器控制器与存储器存储装置
CN100334558C (zh) 监控仿真芯片内部eeprom的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: HUAWEI DIGITAL TECHNOLOGY (CHENGDU) CO., LTD.

Free format text: FORMER NAME: CHENGDU HUAWEI SYMANTEC TECHNOLOGIES CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 611731 Chengdu high tech Zone, Sichuan, West Park, Qingshui River

Patentee after: HUAWEI DIGITAL TECHNOLOGIES (CHENG DU) Co.,Ltd.

Address before: 611731 Chengdu high tech Zone, Sichuan, West Park, Qingshui River

Patentee before: CHENGDU HUAWEI SYMANTEC TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221021

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee after: HUAWEI TECHNOLOGIES Co.,Ltd.

Address before: 611731 Qingshui River District, Chengdu hi tech Zone, Sichuan, China

Patentee before: HUAWEI DIGITAL TECHNOLOGIES (CHENG DU) Co.,Ltd.