CN110674539B - 一种硬盘保护设备、方法及系统 - Google Patents

一种硬盘保护设备、方法及系统 Download PDF

Info

Publication number
CN110674539B
CN110674539B CN201910847264.3A CN201910847264A CN110674539B CN 110674539 B CN110674539 B CN 110674539B CN 201910847264 A CN201910847264 A CN 201910847264A CN 110674539 B CN110674539 B CN 110674539B
Authority
CN
China
Prior art keywords
controller
storage hard
group
hard disks
hard disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910847264.3A
Other languages
English (en)
Other versions
CN110674539A (zh
Inventor
王林锋
魏齐良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN201910847264.3A priority Critical patent/CN110674539B/zh
Publication of CN110674539A publication Critical patent/CN110674539A/zh
Application granted granted Critical
Publication of CN110674539B publication Critical patent/CN110674539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/78Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure storage of data
    • G06F21/80Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure storage of data in storage media based on magnetic or optical technology, e.g. disks with sectors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种硬盘保护设备、方法及系统,用于实现硬盘全局共享的功能,每个控制器可以根据需要动态调整硬盘数量,增强硬盘保护机制。该硬盘保护设备包括第一控制器和第二控制器,第一组存储硬盘及第二组存储硬盘,扩展芯片,其中:所述第一控制器基于串行连接小型计算机系统接口SAS协议,通过所述扩展芯片管理所述第一组存储硬盘,及满足调用条件时访问并使用第二组存储硬盘的至少一个存储硬盘;所述第二控制器基于SAS协议,通过所述扩展芯片管理所述第二组存储硬盘,及满足调用条件时访问并使用第一组存储硬盘的至少一个存储硬盘。

Description

一种硬盘保护设备、方法及系统
技术领域
本发明涉及数据存储技术领域,尤其涉及一种硬盘保护设备、方法及系统。
背景技术
控制器存储系统中一个独立冗余磁盘阵列(Redundant Array of IndependentDisk,RAID)包括多个RAID子盘,针对控制器存储系统中RAID子盘出错的情况,目前采用如下两种方式进行解决:
方式一,双层RAID控制器系统:
使用双层RAID控制器系统,有主控制器RAID系统和子控制器RAID系统组成。每个子控制器RAID系统互相独立并各自组了RAID,每个子RAID系统作为主RAID系统的RAID子盘进行管理,形成两级RAID管理对RAID进行数据保护。缺点是双层RAID控制器保护策略在RAID存储写效率上降低很多,两级RAID每次写数据需要进行两级RAID异或校验,双倍增大算法压力,双层RAID校验盘空间浪费更多,可使用有效存储空间明显减少;
方式二,双控系统RAID保护方案:
在双控制器存储系统中,通过使用各自控制器系统上的热备盘顶替方式。当控制器工作中的RAID出现RAID子盘错误,就会剔除该子盘,RAID处于降级状态,然后控制器设备上热备盘顶替该RAID,RAID重新进行同步,起到RAID保护的作用。但是一旦该控制器上热备盘消耗完了,再发生RAID子盘错误,RAID就只能失效,导致数据丢失情况。缺点是双控制器存储系统中各控制器硬盘资源互相独立不能共享,其中一个控制器系统中RAID热备盘一旦消耗完,再发生RAID子盘错误,RAID就只能失效,存在丢失数据的风险。
发明内容
本发明提供一种硬盘保护设备、方法及系统,用于实现在双控存储系统中两个控制器的硬盘资源互相独立,每个控制器的硬盘资源有限的情况下,实现所有硬盘全局共享的功能,每个控制器可以根据需要动态调整硬盘数量,增强硬盘保护机制。
第一方面,本发明提供一种硬盘保护设备,包括第一控制器和第二控制器,第一组存储硬盘及第二组存储硬盘,扩展芯片,其中:
所述第一控制器基于串行连接小型计算机系统接口SAS协议,通过所述扩展芯片管理所述第一组存储硬盘,及满足调用条件时访问并使用第二组存储硬盘的至少一个存储硬盘;
所述第二控制器基于SAS协议,通过所述扩展芯片管理所述第二组存储硬盘,及满足调用条件时访问并使用第一组存储硬盘的至少一个存储硬盘。
第二方面,本发明提供一种硬盘保护方法,该方法包括:
第一控制器基于串行连接小型计算机系统接口SAS协议,通过扩展芯片管理第一组存储硬盘,确定满足调用条件时,访问并使用第二组存储硬盘的至少一个存储硬盘;
第二控制器基于SAS协议,通过所述扩展芯片管理第二组存储硬盘,确定满足调用条件时,访问并使用第一组存储硬盘的至少一个存储硬盘。
第三方面,本发明提供一种硬盘保护系统,包括:多个硬盘保护设备,每个硬盘保护设备包括第一控制器和第二控制器,第一组存储硬盘及第二组存储硬盘及扩展芯片,多个硬盘保护设备的扩展芯片依次级联,其中:
每个第一控制器基于串行连接小型计算机系统接口SAS协议,通过级联的扩展芯片管理该第一控制器所在的第一硬盘保护设备中的第一组存储硬盘,及满足调用条件时访问并使用第一类存储硬盘中的至少一个存储硬盘,所述第一类存储硬盘包括所述第一硬盘保护设备中的第二组存储硬盘和除所述第一硬盘保护设备外的其他硬盘保护设备中的第一组存储硬盘及第二组存储硬盘;
所述第二控制器基于SAS协议,通过级联的扩展芯片管理该第二控制器所在的第一硬盘保护设备中的第二组存储硬盘,及满足调用条件时访问并使用第二类存储硬盘中的至少一个存储硬盘,所述第二类存储硬盘包括所述第一硬盘保护设备中的第一组存储硬盘和除所述第一硬盘保护设备外的其他硬盘保护设备中的第一组存储硬盘及第二组存储硬盘。
第四方面,本发明提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第二方面所述方法的步骤。
本发明提供的一种硬盘保护设备、方法及系统,具有以下有益效果:
用于实现在双控存储系统中整合两个控制器分别管理的硬盘资源,进行所有硬盘全局共享,可以对硬盘进行动态调整划分,大大提高了每个控制器中硬盘工作的安全性,充分保护数据,也可以充分提高双控存储系统中各控制器管理的闲置热备盘的有效使用率。
附图说明
图1为本发明实施例提供的一种硬盘保护设备示意图;
图2A为本发明实施例提供的一种RAID保护设备示意图;
图2B为本发明实施例提供的一种RAID调用示意图;
图2C为本发明实施例提供的一种RAID调用示意图;
图3为本发明实施例提供的一种硬盘保护方法流程图;
图4为本发明实施例提供的一种硬盘调用并归还的流程图;
图5为本发明实施例提供的一种全局存储硬盘资源管理流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面对目前的双控存储系统进行简单介绍:
双控存储系统是一套高密度、高稳定且冗余的存储系统,该系统还支持高速串行计算机扩展总线标准PCIE接口产品,有很强的扩展性,可扩展出网络接口、SAS接口等并预留出各种PCIE设备接口,该系统主要应用在存储领域,具有高密度、高稳定性、冗余且可扩展性强的特点。
一般情况下,双控存储系统可以由两台软硬件完全相同的计算机作为双控存储系统中的两个控制器。每个控制器分别管理对应的磁盘阵列,所述磁盘阵列可以是一个独立冗余磁盘阵列(Redundant Array of Independent Disk,RAID),其中一个RAID包括多个RAID子盘。
双控存储系统根据两个控制器的工作方式分为两类工作模式,分别如下:
模式1、主备模式。
在主备模式下,两个控制器地位不一样,分为主控制器和备控制器。正常工作状态下,客户端的数据请求都由主控制器来处理,备控制器不接收数据请求也不会对管理的磁盘阵列RAID进行操作,备控制器的主要功能是备份缓存数据。主控制器对本地缓存的更新,都必须实时同步到备控制器的缓存中,保证在主控制器故障的情况下,缓存数据也不会丢失。客户端和存储设备之间的连接方式可以采用故障转移或者绑定虚拟IP地址的方式,备控制器时刻监控主控制器是否正常工作,当主控制器发生异常后,客户端接收不到数据请求响应,会使用与备控制器的连接发送命令,此时备控制器上线代替主控制器处理请求,保证了可用性,同时备控制器将缓存中的备份数据做适当处理,写入RAID子盘,或直接作为缓存数据使用。
模式2、双活模式。
在双活模式下,两个控制器可以同时操作磁盘阵列RAID,同时对外提供读写请求服务,两个控制器的地位是对等的,不同的是两个控制器接收到的数据请求是客户端经过协议分发之后的,为了保证缓存数据的可靠性,两个控制器要分别备份对方控制器的缓存数据,每个控制器本身的缓存空间分为两个部分,一部分是当前控制器的缓存数据,另一部分是对方控制器的缓存备份,当其中一个控制器发生异常无法工作后,另一个控制器接管所有的客户端数据请求,不会导致存储服务中断,并且缓存里的数据不会丢失。
但目前的双控存储系统中,当控制器工作中的RAID出现RAID子盘错误,就会剔除该子盘,RAID处于降级状态,然后控制器设备上RAID热备盘顶替该RAID,但是一旦该控制器上热备盘消耗完了,再发生RAID子盘错误,RAID就只能失效,导致数据丢失情况。因此,双控制器存储系统中各控制器硬盘资源互相独立不能共享,其中一个控制器系统中RAID热备盘一旦消耗完,再发生RAID子盘错误,RAID就只能失效,存在丢失数据的风险。
针对上述问题,本发明提出了一种硬盘保护设备,能够实现在双控存储系统中实现所有硬盘全局共享的功能,每个控制器可以根据需要调用硬盘共享资源中的至少一个存储硬盘,每个控制器可以根据需要动态调整管理的硬盘数量,增强硬盘的保护机制。
实施例1
如图1所示,本实施例提供的一种硬盘保护设备包括第一控制器100和第二控制器101,第一组存储硬盘103及第二组存储硬盘104,扩展芯片102,其中:
所述第一控制器基于串行连接小型计算机系统接口SAS协议,通过所述扩展芯片管理所述第一组存储硬盘,及满足调用条件时访问并使用第二组存储硬盘的至少一个存储硬盘;
所述第二控制器基于SAS协议,通过所述扩展芯片管理所述第二组存储硬盘,及满足调用条件时访问并使用第一组存储硬盘的至少一个存储硬盘。
本实施例中的硬盘保护设备可以支持上述两类工作模式包括主备模式和双活模式。
本实施例中的硬盘保护设备中的第一控制器和第二控制器是两个完全相同的控制设备,其中所述第一组存储硬盘和第二组存储硬盘可以是普通的硬盘,也称单盘,也可以是磁盘阵列如独立冗余磁盘阵列(Redundant Array of Independent Disk,RAID),其中RAID可以将多台硬盘通过RAID控制器结合成虚拟单台大容量的硬盘使用,能够提高传输速率和提供容错功能,为存储系统带来巨大利益,可以应用于控制器存储系统。
本实施例中正常工作状态下(无存储硬盘出错状态),所述第一控制器用于管理所述第一组存储硬盘,所述第二控制器用于管理所述第二组存储硬盘,所述第一控制器和所述第二控制器实现完全的物理隔离,即第一控制器传输的路线与第二控制器传输的路线物理上是分开的,不会发生冲突,例如第一控制器和第二控制器分别使用500路线进行传输,各控制器使用的路线不交叉、不共用。
本实施例中的硬盘保护设备,通过扩展芯片基于SAS协议,由扩展芯片和第一组存储硬盘及第二组存储硬盘组成一个服务传递子系统的分区部分ZPSDS(zoned portion ofa service delivery subsystem),也可以称为组成一个ZONE域。
其中,SAS(串行小型计算机系统接口SCSI)协议规定,当基于使用SAS协议组成的SAS系统上电时,SAS系统中的所有设备相互建立起通讯联系,直至确定ZONE域中所连接的设备数量和类型。当SAS系统中增加了一个新设备时,例如新增加一个存储硬盘时,或者当一个设备从SAS系统中卸载时,如一个存储硬盘出错被剔除时,该事件通告会被发送到每一个发起者设备上,使得它们可以重新调整配置。
本实施例中ZONE域中的第一组存储硬盘及第二组存储硬盘通过SAS协议进行各存储硬盘之间的数据通信。因此,本实例中的硬盘保护设备实现了存储硬盘的共享,满足调用条件时第一控制器可以访问并使用第一组存储硬盘和第二组存储硬盘中的至少一个存储硬盘,同样的,满足调用条件时第二控制器也可以访问并使用第一组存储硬盘和第二组存储硬盘中的至少一个存储硬盘。
作为一种可选的实施方式,所述第一组存储硬盘包括多个工作存储硬盘和多个备用存储硬盘,所述第一控制器在满足调用条件时所使用的至少一个存储硬盘为备用存储硬盘;
所述第二组存储硬盘包括多个工作存储硬盘和多个备用存储硬盘,所述第二控制器在满足调用条件时所使用的至少一个存储硬盘为备用存储硬盘。
本实施例中所述存储硬盘为RAID时,所述第一组RAID包括多个RAID第一工作盘组和多个RAID第一热备盘组;所述第二组RAID也包括多个RAID第二工作盘组和多个RAID第二热备盘组。正常工作状态下,RAID第一工作盘组和RAID第二工作盘组中的RAID子盘正常工作,多个RAID第一热备盘组和RAID第二热备盘组中的RAID子盘都处于空闲状态。当其中一个RAID工作盘组中的RAID子盘发生错误时,可以将RAID热备盘组中的RAID子盘顶替到RAID工作盘组中。
本实施例中所述第一控制器在满足调用条件时所使用的至少一个RAID子盘为RAID第二热备盘组中的空闲的RAID子盘;所述第二控制器在满足调用条件时所使用的至少一个RAID子盘为RAID第一热备盘组中的空闲的RAID子盘。
本实施例中所述调用条件可以是:
所述第一控制器/第二控制器确定管理的第一组存储硬盘/第二组存储硬盘中的至少一个存储硬盘出错,且所述第二控制器/第一控制器管理的第二组存储硬盘/第一组存储硬盘存在空闲的存储硬盘。
本实施中所述第一控制器/第二控制器在满足调用条件时访问并使用第二组存储硬盘/第一组存储硬盘的至少一个存储硬盘,其中满足调用条件时可以具有访问并使用的权限,但可以不包括删除该至少一个存储硬盘的权限,即本实施例中的访问并使用权限是暂时的。
作为一种可选的实施方式,所述第一控制器还用于基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第二组存储硬盘的至少一个存储硬盘;
所述第二控制器还用于基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第一组存储硬盘的至少一个存储硬盘。
本实施例中所述归还条件可以是:
待所述第一控制器/第二控制器管理的第一组存储硬盘/第二组存储硬盘中出错的存储硬盘进行修复或者被新硬盘替换后,第一控制器/第二控制器则可以将调用的至少一个存储硬盘进行归还,以保证第一控制器和第二控制器管理的存储硬盘的数量一致。
作为一种可选的实施方式,所述第一控制器/第二控制器通过串行小型计算机系统接口SAS接口连接所述扩展芯片;
所述扩展芯片通过SAS接口或串行高级技术附件SATA接口分别连接所述第一组存储硬盘和第二组存储硬盘。
所述串行高级技术附件(Serial Advanced Technology Attachment,SATA)一种基于行业标准的串行硬件驱动器接口。
本实施例中的存储硬盘可以包括多个RAID子盘,本实施中作为所述RAID子盘的所有类型的存储设备包括但不限于:
SATA磁盘;SAS磁盘;SATA接口SSD存储器。
作为一种可选的实施方式,所述第一控制器满足调用条件时,通过网络或高速串行计算机扩展总线标准PCIE与所述第二控制器通信,确定访问并使用的第二组存储硬盘的至少一个存储硬盘;
所述第二控制器满足调用条件时,通过网络或高速串行计算机扩展总线标准PCIE与所述第一控制器通信,确定访问并使用的第一组存储硬盘的至少一个存储硬盘。
本实施例中的两个控制器之间可以通过网络或高速串行计算机扩展总线标准PCIE进行通信,具体通信的内容可以包括各控制器管理的存储硬盘是否存在多余的空闲的存储硬盘的消息,确定是否存在可调用的存储硬盘的消息等。
实施例2
如图2A所示,本实施例中的存储硬盘为RAID时,提供的一种硬盘保护设备具体包括:第一控制器200和第二控制器201,第一组RAID203及第二组RAID204,扩展芯片202,其中:
所述第一组RAID203包括多个RAID第一工作子盘205和多个RAID第一热备子盘206,所述第二组RAID包括多个RAID第二工作子盘207和多个RAID第二热备子盘208;
所述第一控制器200器基于SAS协议,通过所述扩展芯片202管理所述第一组RAID203,及满足调用条件时访问并使用第二组RAID204的至少一个RAID第二热备子盘208;如图2B所示,将所述第二组RAID204的其中一个RAID第二热备子盘208调用到所述第一组RAID203中以使所述第一控制器访问并使用。
所述第二控制器201基于SAS协议,通过所述扩展芯片202管理所述第二组RAID204,及满足调用条件时访问并使用第一组RAID203的至少一个RAID第一热备子盘206。如图2C所示,将第一组RAID203的其中一个RAID第一热备子盘206调用到所述第二组RAID204中以使所述第二控制器访问并使用。
实施例3
基于上述硬盘保护设备,本发明实施例还提供了一种硬盘保护方法,该方法中的硬盘即上述实施例的硬盘保护设备,包括第一控制器和第二控制器,第一组存储硬盘及第二组存储硬盘,扩展芯片。
如图3所示,该方法具体实施流程如下:
步骤300、第一控制器基于串行连接小型计算机系统接口SAS协议,通过扩展芯片管理第一组存储硬盘,确定满足调用条件时,访问并使用第二组存储硬盘的至少一个存储硬盘;
步骤301、第二控制器基于SAS协议,通过所述扩展芯片管理第二组存储硬盘,确定满足调用条件时,访问并使用第一组存储硬盘的至少一个存储硬盘。
作为一种可选的实施方式,所述第一组存储硬盘包括多个工作存储硬盘和多个备用存储硬盘,所述第一控制器在满足调用条件时所使用的至少一个存储硬盘为备用存储硬盘;
所述第二组存储硬盘包括多个工作存储硬盘和多个备用存储硬盘,所述第二控制器在满足调用条件时所使用的至少一个存储硬盘为备用存储硬盘。
作为一种可选的实施方式,所述第一控制器/第二控制器确定满足调用条件,包括:
所述第一控制器/第二控制器确定管理的第一组存储硬盘/第二组存储硬盘中的至少一个存储硬盘出错,且所述第二控制器/第一控制器管理的第二组存储硬盘/第一组存储硬盘存在空闲的存储硬盘时,确定满足调用条件。
本实施例可提供多种调用条件,包括但不限于:
调用条件1、控制器管理的存储硬盘中存在出错但无可替换的备用存储硬盘。
所述第一控制器确定管理的第一组存储硬盘中的至少一个存储硬盘出错且不存在空闲的存储硬盘,并且所述第二控制器管理的第二组存储硬盘存在空闲的存储硬盘时,确定满足调用条件;或者
所述第二控制器确定管理的第二组存储硬盘中的至少一个存储硬盘出错且不存在空闲的存储硬盘,并且所述第一控制器管理的第一组存储硬盘存在空闲的存储硬盘时,确定满足调用条件;
调用条件2、满足优先级条件且控制器管理的存储硬盘中存在出错但无可替换的备用存储硬盘。
所述第一控制器的优先级高于第二控制器,且所述第一控制器确定管理的第一组存储硬盘中的至少一个存储硬盘出错,且所述第二控制器管理的第二组存储硬盘存在空闲的存储硬盘时,确定满足调用条件;或者
所述第二控制器的优先级高于第一控制器,且所述第二控制器确定管理的第二组存储硬盘中的至少一个存储硬盘出错,且所述第一控制器管理的第一组存储硬盘存在空闲的存储硬盘时,确定满足调用条件。
作为一种可选的实施方式,所述第一控制器/第二控制器满足调用条件时,通过网络或高速串行计算机扩展总线标准PCIE与所述第二控制器/第一控制器通信,确定访问并使用的第二组存储硬盘/第一组存储硬盘的至少一个存储硬盘。
作为一种可选的实施方式,所述第一控制器满足调用条件时,通过网络或PCIE向所述第二控制器发送调用请求消息,收到第二控制器反馈的携带空闲存储硬盘的标识的确认反馈消息时,确定访问并使用的第二组存储硬盘的至少一个存储硬盘;
所述第二控制器满足调用条件时,通过网络或PCIE向所述第一控制器发送调用请求消息,收到第一控制器反馈的携带空闲存储硬盘的标识确认反馈消息时,确定访问并使用的第一组存储硬盘的至少一个存储硬盘。
本实施例中基于全局备用存储硬盘的共享资源池,可以根据需要动态调整划分可用的备用存储硬盘,包括但不限于:
1)本控制器消耗完所有的备用存储硬盘后可分配共享资源池中的备用存储硬盘;
2)根据各控制器的优先级分配共享资源池中的备用存储硬盘。
作为一种可选的实施方式,所述第一控制器基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第二组存储硬盘;
所述第二控制器基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第一组存储硬盘。
作为一种可选的实施方式,确定满足归还条件包括如下任一或任多:
所述第一控制器/第二控制器管理的第一组存储硬盘/第二组存储硬盘中出错的存储硬盘进行修复后,确定满足归还条件;或者
所述第一控制器/第二控制器管理的第一组存储硬盘/第二组存储硬盘中出错的存储硬盘被新硬盘替换后,确定满足归还条件。
作为一种可选的实施方式,所述扩展芯片将第一组存储硬盘和第二组存储硬盘的管理信息,分别在不同存储区域进行管理,确定满足归还条件/调用条件时,还包括:
重新调整不同区域分别对应的第一存储硬盘/第二存储硬盘的管理信息。
实施中,由扩展芯片和第一组存储硬盘及第二组存储硬盘组成一个服务传递子系统的分区部分ZPSDS(zoned portion of a service delivery subsystem),也可以称为组成一个ZONE域。
所述扩展芯片将第一组存储硬盘和第二组存储硬盘的管理信息,分别在不同存储区域进行管理,所述管理信息包括但不限于所述扩展芯片与所述第一组存储硬盘连接的管脚信息,所述扩展芯片与所述第二组存储硬盘连接的管脚信息,也可理解为所述扩展芯片被划分为两个区域,一个区域对应第一组存储硬盘,使得第一控制器可以管理第一组存储硬盘,另一个区域对应第二组存储硬盘,使得第二控制器可以管理第二组存储硬盘,当满足调用条件或归还条件时,通过对所述扩展芯片已划分的两个区域进行重新划分,从而实现存储硬盘的访问或归还。
本实施例中,所述硬盘保护设备能够支持两类工作模式包括主备模式和双活模式。
如图4所示,若处于双活模式下,第一控制器和第二控制器是对称的,优先级是一样的,以第一控制器为例调用并归还的流程如下:
步骤400、第一控制器管理的第一组存储硬盘中的多个工作存储硬盘逐步发生错误;
步骤401、第一控制器把所有的备用存储硬盘全部顶替进工作存储硬盘中,此时第一控制器管理的所有的备用存储硬盘全部消耗完成;
步骤402、第一控制器通过网络或PCIE与第二控制器通信,检测到第二控制器管理的存储硬盘存在多余空闲的备用存储硬盘时,向第二控制器发送调用备用存储硬盘的请求消息;
步骤403、第二控制器通过ZONE域的功能配置将备用存储硬盘调整到第一控制器下管理并向第一控制器发送携带空闲备用存储硬盘的标识确认反馈消息;
步骤404、第一控制器收到确认反馈消息时,确定访问并使用所述空闲备用存储硬盘;
步骤405、确定第一控制器上出错后被剔除的存储硬盘使用新盘替换或修复后,将调用的所述空闲备用存储硬盘归还给第二控制器。
上述调用并归还的流程同样使用于第二控制器。
若处于主备模式下,如第一控制器为主控制器,第二控制器为备控制器,即第一控制器的优先级高于第二控制器,则主控制器可以调用备控制器中所有的存储硬盘资源。
如图5所示,本实施中的全局存储硬盘资源管理流程,具体步骤如下:
步骤500、第一控制器管理的存储硬盘中存在出错的存储硬盘;
步骤501、创建一个管理进程,用于管理全局存储硬盘资源;
步骤502、第一控制器判断管理的存储硬盘中是否存在热备盘,若是执行步骤503,否则执行步骤505;
步骤503、第一控制器判断是否已调用过第二控制器的备用存储硬盘,若是执行步骤504,否则执行步骤501;
步骤504、确定未归还调用的备用存储硬盘时,从所述备用存储硬盘中确定归还不再使用的多余备用存储硬盘给第二控制器,执行步骤508;
步骤505、判断第二控制器管理的存储硬盘中是否存在多余空闲的备用存储硬盘,如果是执行步骤506,否则执行步骤507;
步骤506、第一控制器访问并使用至少一个所述空闲的备用存储硬盘,执行步骤508;
步骤507、提示已没有全局备用存储硬盘,执行步骤501;
步骤508、第一控制器和第二控制器配置为同步。
实施例3
基于上述实施例的一种硬盘保护设备,本实施例还提供一种硬盘保护系统,包括多个硬盘保护设备,每个硬盘保护设备包括第一控制器和第二控制器,第一组存储硬盘及第二组存储硬盘及扩展芯片,多个硬盘保护设备的扩展芯片依次级联,其中:
每个第一控制器基于串行连接小型计算机系统接口SAS协议,通过级联的扩展芯片管理该第一控制器所在的第一硬盘保护设备中的第一组存储硬盘,及满足调用条件时访问并使用第一类存储硬盘中的至少一个存储硬盘,所述第一类存储硬盘包括所述第一硬盘保护设备中的第二组存储硬盘和除所述第一硬盘保护设备外的其他硬盘保护设备中的第一组存储硬盘及第二组存储硬盘;
所述第二控制器基于SAS协议,通过级联的扩展芯片管理该第二控制器所在的第一硬盘保护设备中的第二组存储硬盘,及满足调用条件时访问并使用第二类存储硬盘中的至少一个存储硬盘,所述第二类存储硬盘包括所述第一硬盘保护设备中的第一组存储硬盘和除所述第一硬盘保护设备外的其他硬盘保护设备中的第一组存储硬盘及第二组存储硬盘。
本实施例的硬盘保护系统中,通过级联的扩展芯片和多组存储硬盘组成一个大的服务传递子系统的分区部分ZPSDS(zoned portion of a service delivery subsystem),也可以称为组成一个大的ZONE域,该系统中实现了多个控制器对全局存储硬盘的资源共享,在满足调用条件下,能够访问并使用该全局存储硬盘中的至少一个存储硬盘。
本发明实施还提供一个计算机存储介质,该程序被处理器执行时实现如下步骤:
第一控制器基于串行连接小型计算机系统接口SAS协议,通过扩展芯片管理第一组存储硬盘,确定满足调用条件时,访问并使用第二组存储硬盘的至少一个存储硬盘;
第二控制器基于SAS协议,通过所述扩展芯片管理第二组存储硬盘,确定满足调用条件时,访问并使用第一组存储硬盘的至少一个存储硬盘。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (16)

1.一种硬盘保护设备,其特征在于,包括第一控制器和第二控制器,第一组存储硬盘及第二组存储硬盘,扩展芯片,其中:
所述第一控制器基于串行连接小型计算机系统接口SAS协议,通过所述扩展芯片管理所述第一组存储硬盘,及满足调用条件时访问并使用第二组存储硬盘的至少一个存储硬盘;
所述第二控制器基于SAS协议,通过所述扩展芯片管理所述第二组存储硬盘,及满足调用条件时访问并使用第一组存储硬盘的至少一个存储硬盘。
2.根据权利要求1所述的硬盘保护设备,其特征在于,
所述第一组存储硬盘包括多个工作存储硬盘和多个备用存储硬盘,所述第一控制器在满足调用条件时所使用的至少一个存储硬盘为备用存储硬盘;
所述第二组存储硬盘包括多个工作存储硬盘和多个备用存储硬盘,所述第二控制器在满足调用条件时所使用的至少一个存储硬盘为备用存储硬盘。
3.根据权利要求1所述的硬盘保护设备,其特征在于,
所述第一控制器还用于基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第二组存储硬盘的至少一个存储硬盘;
所述第二控制器还用于基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第一组存储硬盘的至少一个存储硬盘。
4.根据权利要求1所述的硬盘保护设备,其特征在于,
所述第一控制器/第二控制器通过串行小型计算机系统接口SAS接口连接所述扩展芯片;
所述扩展芯片通过SAS接口或串行高级技术附件SATA接口分别连接所述第一组存储硬盘和第二组存储硬盘。
5.根据权利要求1所述的硬盘保护设备,其特征在于,所述存储硬盘包括多个RAID子盘,所述RAID子盘包括如下任一或任多种:
SATA磁盘;SAS磁盘;SATA接口SSD存储器。
6.根据权利要求1所述的硬盘保护设备,其特征在于,
所述第一控制器满足调用条件时,通过网络或高速串行计算机扩展总线标准PCIE与所述第二控制器通信,确定访问并使用的第二组存储硬盘的至少一个存储硬盘;
所述第二控制器满足调用条件时,通过网络或高速串行计算机扩展总线标准PCIE与所述第一控制器通信,确定访问并使用的第一组存储硬盘的至少一个存储硬盘。
7.一种硬盘保护方法,其特征在于,该方法包括:
第一控制器基于串行连接小型计算机系统接口SAS协议,通过扩展芯片管理第一组存储硬盘,确定满足调用条件时,访问并使用第二组存储硬盘的至少一个存储硬盘;
第二控制器基于SAS协议,通过所述扩展芯片管理第二组存储硬盘,确定满足调用条件时,访问并使用第一组存储硬盘的至少一个存储硬盘。
8.根据权利要求7所述的方法,其特征在于,所述第一控制器/第二控制器确定满足调用条件,包括:
所述第一控制器/第二控制器确定管理的第一组存储硬盘/第二组存储硬盘中的至少一个存储硬盘出错,且所述第二控制器/第一控制器管理的第二组存储硬盘/第一组存储硬盘存在空闲的存储硬盘时,确定满足调用条件。
9.根据权利要求8所述的方法,其特征在于,所述第一控制器/第二控制器确定满足调用条件,包括:
所述第一控制器确定管理的第一组存储硬盘中的至少一个存储硬盘出错且不存在空闲的存储硬盘,并且所述第二控制器管理的第二组存储硬盘存在空闲的存储硬盘时,确定满足调用条件;或者
所述第二控制器确定管理的第二组存储硬盘中的至少一个存储硬盘出错且不存在空闲的存储硬盘,并且所述第一控制器管理的第一组存储硬盘存在空闲的存储硬盘时,确定满足调用条件;或者
所述第一控制器的优先级高于第二控制器,且所述第一控制器确定管理的第一组存储硬盘中的至少一个存储硬盘出错,且所述第二控制器管理的第二组存储硬盘存在空闲的存储硬盘时,确定满足调用条件;或者
所述第二控制器的优先级高于第一控制器,且所述第二控制器确定管理的第二组存储硬盘中的至少一个存储硬盘出错,且所述第一控制器管理的第一组存储硬盘存在空闲的存储硬盘时,确定满足调用条件。
10.根据权利要求7所述的方法,其特征在于,还包括:
所述第一控制器基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第二组存储硬盘;
所述第二控制器基于SAS协议,通过所述扩展芯片,确定满足归还条件时归还调用的第一组存储硬盘。
11.根据权利要求10所述的方法,其特征在于,确定满足归还条件包括如下任一或任多:
所述第一控制器/第二控制器管理的第一组存储硬盘/第二组存储硬盘中出错的存储硬盘进行修复后,确定满足归还条件;或者
所述第一控制器/第二控制器管理的第一组存储硬盘/第二组存储硬盘中出错的存储硬盘被新硬盘替换后,确定满足归还条件。
12.根据权利要求7所述的方法,其特征在于,所述第一控制器/第二控制器确定满足调用条件时,访问并使用第二组存储硬盘/第一组存储硬盘的至少一个存储硬盘,包括:
所述第一控制器/第二控制器满足调用条件时,通过网络或高速串行计算机扩展总线标准PCIE与所述第二控制器/第一控制器通信,确定访问并使用的第二组存储硬盘/第一组存储硬盘的至少一个存储硬盘。
13.根据权利要求12所述的方法,其特征在于,所述第一控制器/第二控制器确定满足调用条件时,访问并使用第二组存储硬盘/第一组存储硬盘的至少一个存储硬盘,包括:
所述第一控制器满足调用条件时,通过网络或PCIE向所述第二控制器发送调用请求消息,收到第二控制器反馈的携带空闲存储硬盘的标识的确认反馈消息时,确定访问并使用的第二组存储硬盘的至少一个存储硬盘;
所述第二控制器满足调用条件时,通过网络或PCIE向所述第一控制器发送调用请求消息,收到第一控制器反馈的携带空闲存储硬盘的标识确认反馈消息时,确定访问并使用的第一组存储硬盘的至少一个存储硬盘。
14.根据权利要求7或10所述的方法,其特征在于,所述扩展芯片将第一组存储硬盘和第二组存储硬盘的管理信息,分别在不同存储区域进行管理,确定满足归还条件/调用条件时,还包括:
重新调整不同区域分别对应的第一组存储硬盘/第二组存储硬盘的管理信息。
15.一种硬盘保护系统,其特征在于,包括:多个硬盘保护设备,每个硬盘保护设备包括第一控制器和第二控制器,第一组存储硬盘及第二组存储硬盘及扩展芯片,多个硬盘保护设备的扩展芯片依次级联,其中:
每个第一控制器基于串行连接小型计算机系统接口SAS协议,通过级联的扩展芯片管理该第一控制器所在的第一硬盘保护设备中的第一组存储硬盘,及满足调用条件时访问并使用第一类存储硬盘中的至少一个存储硬盘,所述第一类存储硬盘包括所述第一硬盘保护设备中的第二组存储硬盘和除所述第一硬盘保护设备外的其他硬盘保护设备中的第一组存储硬盘及第二组存储硬盘;
所述第二控制器基于SAS协议,通过级联的扩展芯片管理该第二控制器所在的第一硬盘保护设备中的第二组存储硬盘,及满足调用条件时访问并使用第二类存储硬盘中的至少一个存储硬盘,所述第二类存储硬盘包括所述第一硬盘保护设备中的第一组存储硬盘和除所述第一硬盘保护设备外的其他硬盘保护设备中的第一组存储硬盘及第二组存储硬盘。
16.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求7~14任一所述方法的步骤。
CN201910847264.3A 2019-09-09 2019-09-09 一种硬盘保护设备、方法及系统 Active CN110674539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910847264.3A CN110674539B (zh) 2019-09-09 2019-09-09 一种硬盘保护设备、方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910847264.3A CN110674539B (zh) 2019-09-09 2019-09-09 一种硬盘保护设备、方法及系统

Publications (2)

Publication Number Publication Date
CN110674539A CN110674539A (zh) 2020-01-10
CN110674539B true CN110674539B (zh) 2021-04-16

Family

ID=69076732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910847264.3A Active CN110674539B (zh) 2019-09-09 2019-09-09 一种硬盘保护设备、方法及系统

Country Status (1)

Country Link
CN (1) CN110674539B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905507B (zh) * 2021-03-19 2023-05-26 杭州华澜微电子股份有限公司 一种硬盘转换控制器
CN113268205B (zh) * 2021-05-28 2023-02-03 海信集团控股股份有限公司 一种车载数据存储方法、装置及车载电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103929475A (zh) * 2014-03-27 2014-07-16 华为技术有限公司 一种以太网架构的硬盘存储系统及硬盘数据操作方法
CN104636086A (zh) * 2015-02-06 2015-05-20 浙江宇视科技有限公司 一种ha存储设备、管理ha状态的方法
CN105045533A (zh) * 2015-07-09 2015-11-11 上海爱数软件有限公司 适用于双控高可用存储系统的磁盘心跳收发方法
CN105068771A (zh) * 2015-09-17 2015-11-18 浪潮(北京)电子信息产业有限公司 一种统一存储方法及系统
JP2017138641A (ja) * 2016-02-01 2017-08-10 三菱電機株式会社 計算機システム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021493A (zh) * 2017-12-11 2018-05-11 郑州云海信息技术有限公司 一种简化的控制硬盘指示灯的系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103929475A (zh) * 2014-03-27 2014-07-16 华为技术有限公司 一种以太网架构的硬盘存储系统及硬盘数据操作方法
CN104636086A (zh) * 2015-02-06 2015-05-20 浙江宇视科技有限公司 一种ha存储设备、管理ha状态的方法
CN105045533A (zh) * 2015-07-09 2015-11-11 上海爱数软件有限公司 适用于双控高可用存储系统的磁盘心跳收发方法
CN105068771A (zh) * 2015-09-17 2015-11-18 浪潮(北京)电子信息产业有限公司 一种统一存储方法及系统
JP2017138641A (ja) * 2016-02-01 2017-08-10 三菱電機株式会社 計算機システム

Also Published As

Publication number Publication date
CN110674539A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
US10621060B2 (en) Storage system and control software deployment method
US9348724B2 (en) Method and apparatus for maintaining a workload service level on a converged platform
US9182918B2 (en) Network storage systems having clustered raids for improved redundancy and load balancing
US10642704B2 (en) Storage controller failover system
US11137940B2 (en) Storage system and control method thereof
US8166241B2 (en) Method of improving efficiency of capacity of volume used for copy function and apparatus thereof
US7934068B2 (en) Storage system and method of taking over logical unit in storage system
US20190235777A1 (en) Redundant storage system
JP3772369B2 (ja) 記憶サブシステム
JP2007072538A (ja) ストレージ仮想化装置のデバイス制御引継ぎ方法
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
US20170083417A1 (en) Storage device
WO2014114135A1 (en) Disk fault tolerance method, device and system
JP2008107896A (ja) 物理資源制御管理システム、物理資源制御管理方法および物理資源制御管理用プログラム
WO2019148841A1 (zh) 一种分布式存储系统、数据处理方法和存储节点
JP2006227964A (ja) ストレージシステム、処理方法及びプログラム
US11307789B2 (en) Storage system and storage control method
WO2017167106A1 (zh) 存储系统
CN110674539B (zh) 一种硬盘保护设备、方法及系统
CN104424052A (zh) 一种自动冗余的分布式存储系统及方法
WO2021088367A1 (zh) 数据恢复方法及相关设备
JP2005196490A (ja) データ多重化のためのシステム及び方法
US20210303178A1 (en) Distributed storage system and storage control method
KR20050033060A (ko) 네트워크를 이용한 핫 스페어 구성 시스템 및 방법
US20050198411A1 (en) Commingled write cache in dual input/output adapter

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant