CN107111457A

CN107111457A - 跨集群冗余配置中的非间断的控制器替换

Info

Publication number: CN107111457A
Application number: CN201580072388.9A
Authority: CN
Inventors: A·V·帕纳拉; C·V·帕特尔; H·克雷曼; P·V·马伊穆达; S·乌尼克里斯南; S·K·埃尔普拉; S·M·科亚特尼
Original assignee: NetApp Inc
Current assignee: NetApp Inc
Priority date: 2014-11-13
Filing date: 2015-11-12
Publication date: 2017-08-29
Anticipated expiration: 2035-11-12
Also published as: EP3218793A1; WO2016077562A1; US20190213093A1; JP6317856B2; US20160140003A1; JP2018500648A; CN107111457B; US20170075783A1; EP3218793B1; US11422908B2; US9507678B2; US10282262B2

Abstract

在从第一节点向第二节点的存储冗余交还期间，在由第一节点从第二节点的存储冗余接管之后，第二节点部分地通过接收来自第二节点的节点标识指示符而被初始化。节点标识指示符被包括在由第二节点在存储冗余交还的交还等待阶段期间发送的节点通告消息中。节点标识指示符包括由第一节点使用以确定第二节点是否是集群内接管伙伴的集群内节点连接性标识符。响应于确定第二节点是集群内接管伙伴，第一节点完成向第二节点交还存储资源。

Description

跨集群冗余配置中的非间断的控制器替换

相关申请

本申请要求2014年11月13日提交的、题为“NON-DISRUPTIVE CONTROLLERREPLACEMENT IN A CROSS-CLUSTER REDUNDANCY CONFIGURATION(跨集群冗余配置中的非间断的控制器替换)”的美国专利申请No.14/541,119的优先权，该申请通过引用并入本文。

背景技术

所公开的主题的实施例一般地涉及存储网络领域，更特别地，涉及跨集群冗余配置内的存储控制器替换。

计算机集群实现分布式计算形式。计算机集群由节点集合组成，所述节点以协作的方式配置并通信地耦合，以共享资源并在某些方面作为单个系统而操作。集群的部件通常包括多个服务器节点以及通过局域网(LAN)而互连的一个或多个集群管理节点，其中每个节点运行公共操作系统的其自身的实例。集群经常被部署，以在通常比具有可比速度或可用性的单个计算机更成本高效的同时，将性能和可用性改进到优于集中式计算的性能和可用性。

存储集群是通常以包括多个互连的存储节点为特征的一种类型的网络化计算机集群。每个存储节点由耦合到诸如存储盘或固态驱动器(SSD)阵列的大容量存储单元的控制器组成，有时被称为“后台数据”的数据存储在大容量存储单元上。存储节点控制器执行类似服务器的功能，以用于优化对包括所存储的数据的存储资源的访问和使用。大容量存储单元可以是提供长期、非易失性数据存储的独立磁盘冗余阵列(RAID)。

确保对后台数据的连续、非中断访问是大多数存储集群的重要功能。所谓的高可用性(HA)存储经常用于在对给定存储节点的操作的中断的事件中确保对后端数据的非中断访问。中断可能由于硬件或软件故障，或由于存储节点的维护(例如，替换)。HA配置可以定义集群(HA集群)，或者可以是集群配置特征，诸如在以其他方式定义的集群内的一个或多个HA对。在任一情况下，基本的HA存储配置由在系统控制代码和有关配置设置的管理下执行互相备份作用的至少两个稍独立的存储节点组成。简单地，当节点之一故障时，另一节点立即承担对其HA伙伴节点的操作和存储的控制。

分布式数据存储的与日俱增的规模已经唤起在集群内备份冗余以外扩大对存储数据的保护及非中断访问的需求。这种需求正在通过集群间的数据冗余的普及而得以满足。诸如在数据中心内的、可能物理上相隔几十或甚至几百千米的集群之间的存储冗余，使用诸如通过数据镜像的数据复制。以这种方式，数据及对数据的非中断访问被保护，以防止可能例如由功率损失而导致的全站故障。

附图说明

可以通过参考随附的附图更好地理解实施例。

图1是描绘了根据本公开的实施例的、诸如可以在存储集群内用于备份冗余的高可用性(HA)控制器对的框图；

图2是图示了根据本公开的实施例的存储节点的框图；

图3是描绘了根据本公开的实施例的跨集群存储冗余配置的框图；

图4是图示了根据本发明的实施例的、由高可用性(HA)对在存储控制器替换期间及其后执行的操作的流程图；

图5是描绘了根据本发明的实施例的、由跨集群存储冗余配置的成员节点在存储控制器替换后执行的操作的流程图；以及

图6描绘了用于实现图1-图5中所示的实施例的示例计算机系统。

具体实施方式

以下描述包括体现所公开的主题的技术的示例系统、方法、技术、指令序列及计算机程序产品。然而，应当理解，所描述的实施例可以在没有这些特定细节中的一个或多个的情况下被实践。没有详细示出众所周知的指令实例、协议、结构和技术，以免混淆描述。如本文中所使用的，具有或者不具有附加描述符的术语“节点”(例如，存储节点、控制节点等)可以指代集群配置标识符或诸如图2中所描绘的控制器设备。

被配置为HA对的集群存储广泛用于提供分布式存储，同时防止成员设备中的系统硬件和/或软件故障。节点接管(通常称为“故障转移”)是在存储节点故障或异常终止时由HA对使用以提供对所存储的数据的非中断访问的标准机制。本质上，故障转移使备份节点诸如通过执行存储冗余接管来承担对先前由故障节点控制的存储设备和网络连接的控制，使得备份节点可以提供非中断的数据可用性。在故障节点恢复时，可以执行存储冗余交还以将对存储设备和网络连接的控制交还给此时已恢复的故障节点。

跨集群数据冗余被设计为防止诸如滚动硬件故障之类的较大规模的故障，并且有时以“灾难恢复”冗余或“站点恢复”冗余的措辞被提及。同步数据镜像及非易失性随机存取存储器(NVRAM)写缓存复制可以用于在两个站点之间维持一致的操作状态和聚合数据的版本，不同于给定集群的本地节点，这两个站点不共享数据存储设备。在一个实施例中，本公开涉及在跨集群冗余配置内维持针对控制器替换的HA操作连续性。

A.高可用性集群环境

图1是描绘了一对节点105a和105b的示意性框图，节点105a和105b作为高可用性(HA)集群对100被互连、且被配置为提供与大容量存储设备上的信息的组织和访问有关的存储服务。节点105a和105b包括协作以提供HA故障转移冗余以及分布式存储系统架构的各种功能部件。为此，节点105a和105b中的每一个被配置为网络元件(N模块104a和104b)及数据存储元件(D模块106a和106b)。N模块104a和104b中的每一个包括使得相应的节点104a和104b能够例如通过计算机网络116连接到客户端102的功能，而D模块106a和106b中的每一个连接到一个或多个存储设备，诸如分别在存储阵列125a和125b内的存储驱动器115a-m和115b-n。节点105a和105b通过集群交换结构120而互连，集群交换结构120在所描绘的实施例中可以是千兆以太网交换机。

存储阵列125a和125b中的每一个上的信息存储被优先地实施为被称为存储卷的一个或多个可寻址区域，其驻留在物理存储驱动器115a-m和115b-n的集合上，物理存储驱动器115a-m和115b-n的集合协作以定义一个或多个卷上的卷块编号空间的整体逻辑布置。尽管不是必然的，但每个逻辑卷通常与其自身的文件系统相关联。逻辑卷/文件系统内的存储驱动器可以包括固态驱动器(SSD)和/或磁盘的任何组合，并且通常被组织为一个或多个组，其中每个组可以被操作为独立磁盘冗余阵列(RAID)。

如图1中所进一步描绘的，节点105a和105b还跨集群互连118而耦合，集群互连118提供节点之间的附加通信路径。集群互连118可以是光纤信道(FC)、无限带宽技术或另一适当的传送介质。集群互连118可以用于传送节点105a与节点105b之间的“心跳”信号，这些信号用于监测每个节点的活动状态。集群心跳信号还跨集群交换结构120发送，在集群交换结构120上N模块104与D模块106之间的通信被说明性地传送。节点故障由通过集群互连和存储层二者的心跳丢失来指示。集群互连118还充当存储接管互连。也就是说，如果心跳信号终止(例如，“超时”)，那么故障转移/接管进程通过集群互连118开始。

客户端102可以是被配置为根据信息递送的客户端/服务器模型与节点105a和105b交互的通用计算机。也就是说，客户端102可以或直接或经由托管服务器请求节点的服务，并且该节点通过经由网络116交换分组来响应客户端服务请求。当访问以文件和目录的形式的信息时，客户端可以通过传输控制协议/因特网协议(TCP/IP)发出包括基于文件的访问协议的分组，所述基于文件的访问协议诸如通用因特网文件系统(CIFS)协议或网络文件系统(NFS)协议。备选地，当访问以块的形式的信息时，客户端可以发出包括基于块的访问协议的分组，所述基于块的访问协议诸如通过TCP封装的小型计算机系统接口(SCSI)协议(iSCSI)和通过光纤信道封装的SCSI(FCP)。

诸如HA对100的HA集群对的用途是在诸如控制器替换的维护事件以及诸如硬件或软件故障的意外事件期间，提供操作连续性和非中断的存储资源可用性。在正常集群操作期间，存储控制器节点根据HA配置被标识为驱动器115a-m的“归属(home)”，存储控制器节点诸如连接到存储驱动器115a-m、并具有对存储驱动器115a-m的主要操作控制的节点105a。如此，HA节点105a还在初始化时被标识为“当前所有者”，并且主要负责服务针对包含在存储驱动器115a-m上的卷的块的数据请求。类似地，存储节点105b主要负责表示为存储阵列125b内的存储驱动器115b-n的SSD和/或盘。HA对100被配置为使得在故障或维护停机的情况下，节点105a或105b中的任一节点可以接管另一节点的数据服务能力。如本文所使用的，“接管”可以指代一个HA节点伙伴由另一伙伴的计划接管，或其中接管是由运行时故障或其他意外事件引起的“故障转移”序列。

HA伙伴节点能够借助于对存储设备的共享访问和节点之间写缓存复制，接管另一控制器节点的管理服务。在所描绘的实施例中，节点105a和105b具有对存储阵列125a和125b的共享操作访问。此外，HA对100被配置为使得NVRAM写缓存内容(参照图2所描绘和描述的)在节点105a与105b之间被复制。

如参照图3所进一步详细描绘和说明的，HA对100可以被配置在具有至少一个其他HA对的跨集群配置中，该至少一个其他HA对具有其自身管理的存储阵列。如图1中所示的，节点105a和105b进一步包括冗余管理模块122a和122b，冗余管理模块122a和122b通常包含有节点的相应的存储操作系统实例。如参考图3-图5所进一步说明的，管理模块122a和122b包括指令，该指令当由HA节点中的处理器执行时，使得属于跨集群配置的HA对中的个体节点中的任何一个既能够在接管序列之后非间断地识别HA伙伴节点、又能够在HA对交还序列之后高效地更新节点配置信息。

B.存储系统节点

图2是提供了表示节点105a或105b中的任一个的控制器节点105的更详细说明的框图。如图2中所描绘的，节点105包括将处理器202a和202b、存储器210、网络适配器208、集群访问适配器214、NVRAM 204、存储适配器218及本地存储装置220互连的系统总线225。NVRAM 204可以通过缓存输入的客户端I/O请求而用于I/O分级。本地存储装置210包括诸如磁盘或SSD的一个或多个存储设备，其可以由节点105利用以在本地将配置信息存储在诸如配置表212内。集群访问适配器214包括适于将节点105耦合到HA对100所属的集群的其他节点的多个端口。虽然本领域技术人员将明白，在本文所描述的集群架构内可以利用其他协议和互连，但在所描绘的实施例中，以太网可以用作集群协议和互连介质。

节点105进一步被描绘为执行存储操作系统206的双处理器控制器，存储操作系统206优选地实现诸如文件系统的高级模块，以将信息逻辑地组织为命名数据容器的层次结构，该层次结构诸如SSD或盘上的目录、文件和称为虚拟盘(有时被称为“块”)的特定类型的文件。然而，本领域普通技术人员将明白，节点105可以备选地包括单个或多于两个的处理器系统。在一个实施例中，一个处理器202a执行节点上的N模块104a的功能，而另一处理器202b执行D模块106a的功能。

存储器210包括由处理器和适配器可寻址的存储位置，以用于存储与所公开的实施例相关联的软件程序代码和数据结构。处理器和适配器可以进而包括被配置为执行程序代码和操纵数据结构的处理元件和/或逻辑电路系统。除了其他以外，存储操作系统206通过是调用存储操作来功能地组织节点105以便支持由节点实现的存储服务，存储操作系统206的一些部分通常驻留在存储器中、并由处理元件执行。本领域技术人员将明白，包括各种计算机可读介质的其他处理和存储装置可以用于存储和执行与本文所描述的实施例有关的程序指令。在所描绘的实施例中，存储操作系统206进一步包括跨集群冗余管理模块207，跨集群冗余管理模块207包括程序指令，该程序指令当由一个或多个处理器执行时实现参考图3、图4和图5所描绘和描述的功能中的一项或多项。

网络适配器208包括多个端口，多个端口适于通过点对点链接、广域网、在公共网络上实现的虚拟专用网络或共享局域网将节点105耦合到一个或多个客户端102。网络适配器208因此可以包括将节点105通信地耦合到网络116(图1)所需要的结构和电路系统以及逻辑构造。在一个实施例中，网络116可以是以太网网络或FC网络。每个客户端102可以直接地或经由主机服务器通过网络116通过根据诸如TCP/IP之类的预先限定的协议交换数据的离散帧或分组而与节点105通信。

存储适配器218与存储操作系统206协同工作，以代表客户端102访问存储阵列125a和125b内的存储资源(例如，所请求的信息)。信息可以存储在存储阵列125a和125b中、在任何类型的所附接的可写存储设备介质(诸如磁带、光介质、电子随机存取存储器、SSD及适于存储包括数据和元数据的信号的任何其他类似介质)的阵列上。在所描绘的实施例中，信息被存储在存储阵列125a和125b的存储驱动器115上。存储适配器218进一步包括具有I/O接口电路系统(未描绘)的多个端口，I/O接口电路系统通过诸如FC链接拓扑的I/O互连通信地耦合到驱动器115。

C.跨集群冗余

图3是描绘了跨集群存储系统300的框图，跨集群存储系统300包括形成集群A与群集B内的HA对的存储节点。集群A包括第一存储控制器节点对(A1和A2)，以及第二节点对(A3和A4)。节点对A1/A2和A3/A4也是集群A内的子集群，形成相应的HA集群对。系统300进一步包括两个附加的HA集群对B1/B2和B3/B4，其是集群B的成员，集群B可以物理上远离集群A。尽管被通信地耦合诸如以镜像数据和复制NVRAM内容，但集群A和集群B中的每一个内的控制器节点不与另一集群中的节点共享存储阵列设备的操作控制。

如参考图1和图2所说明的，诸如对A1/A2和B1/B2的HA对通过经由对存储设备的共享操作访问和NVRAM I/O分级缓存的复制提供操作连续性，来最小化由于系统故障或维护的停机时间。除集群内冗余之外，所描绘的实施例通过与另一集群中的HA对相关联地配置属于一个集群的HA对而提供跨集群数据保护和操作连续性。通常，这样配置的关联在系统启动期间建立，并维持到系统为重新配置而关闭为止。图3将HA对的跨集群配置图示为包括第一跨集群配置350和第二跨集群配置355。所描绘的配置350和355每个包括四个节点，这四个节点被分组并划分成集群A和集群B中的每一个中的一个HA对，这是在维持跨集群镜像的同时维持两个集群中的集群内HA冗余所需要的最小数目的HA对和最小总数目的控制节点。

跨集群配置350包括HA对A1/A2，HA对A1/A2通过包括光纤信道(FC)交换机302和304的FC交换网络共享对存储阵列306a和306b的操作访问。配置350包括对应的“伙伴”HA对B1/B2，HA对B1/B2通过包括FC交换机312和314的FC交换网络共享对存储阵列316a和316b的操作访问。跨集群配置355包括HA对A3/A4(包括存储控制器节点325a和325b)，HA对A3/A4通过包括FC交换机322和324的FC交换网络共享对存储阵列326a和326b的操作访问。跨集群配置355还包括HA对B3/B4(包括存储控制器节点335a和335b)，HA对B3/B4通过包括FC交换机332和334的FC交换网络共享对存储阵列336a和336b的操作访问。

配置350和配置355的配置和操作基本上是类似的。为了说明的目的，将描述配置350的集群内HA操作和跨集群冗余操作。在正常运行时操作期间，控制器节点A1 305a和A2305b中的每一个控制其自身分别分配的存储阵列306a和306b的子集。例如，HA对A1/A2可以在集群A内被配置为使得控制器节点305a经由交换机302具有对存储阵列306a的操作控制。对存储阵列306a和306b的共享访问，连同NVRAM I/O分级缓存内容的复制(图3中未示出)，使得在节点305a故障或离线的情况下，节点305b能够承担对存储阵列306a的操作控制以维持操作连续性。类似于HA对A1/A2的操作，在正常运行时操作期间，控制器节点B1 315a和B2315b中的每一个控制其自身分别分配的存储阵列316a和316b的子集。例如，HA对B1/B2可以在集群B内被配置为使得控制器节点315a经由交换机312具有对存储阵列316a的操作控制。对存储阵列316a和316b的共享访问，连同NVRAM I/O分级缓存内容的复制(图3中未示出)，使得在节点315a故障或离线的情况下，节点315b能够承担对存储阵列316a的操作控制以维持操作连续性。

HA对A1/A2和B1/B2在配置350内互相编程并以其他方式被配置为提供跨集群数据冗余和操作连续性。每个节点除了其集群内HA伙伴关系之外，还具有与其两个跨集群伙伴中的每一个的配置指定的关系。在所描绘的示例中，节点A1可以通过具有跨集群“伙伴”关系的配置与节点B1相关联，并进一步通过具有“辅助”(即，备份)跨集群伙伴联系的配置与节点B2相关联。在这样的情况下，节点B1将是节点A1的相互跨集群伙伴，而节点A2将是节点B1的辅助跨集群伙伴。在所描述的实施例中，HA节点对A3/A4和B3/B4可以被类似配置，以形成配置355内的跨集群伙伴和辅助伙伴。

类似于上文所描述的HA对机制，由相应的跨集群冗余伙伴关系和辅助伙伴关系提供的操作连续性部分地通过在相应的伙伴之间同步复制NVRAM I/O分级缓存内容来实现。可以通过经由长距离FC连接342和344在相应的后端存储设备306a、b与316a、b之间同步镜像所存储的数据聚合来在诸如节点A1与节点B1的跨集群伙伴之间复制数据。在一个实施例中，RAID级别的数据镜像可以用于执行跨集群后端存储复制。如所描绘的实施例中所示的，控制节点305a、305b、315a及315b分别包括跨集群冗余管理模块362a、362b、364a及364b。如参考图4和图5所进一步详细描绘和说明的，管理模块包括使得相应的控制器节点能够在跨集群配置中非间断地执行接管/交还HA操作的逻辑。

图4是图示了根据本公开的实施例的由跨集群配置350内的HA对A1/A2在存储控制器替换期间及存储控制器替换后执行的操作的流程图。开始于步骤402处并继续进行到步骤404，HA对A1/A2开始接管进程，在接管进程中节点A1承担对A2先前控制的后端存储阵列306b及对应存储连接的控制。在接管之前，包括长距离FC互连342和344的跨集群配置互连由成员节点A1、A2、B1及B2使用，以镜像每个相应的HA伙伴的NVRAM的日志数据。从A2的这样的NVRAM复制连同其对后端存储306B的共享访问，使得节点A1能够自动地响应于来自A2的故障心跳信号，或如在示例实施例中那样响应于节点A2将被关闭以用于控制器替换的管理员信号而立即承担对A2的进行中的控制器节点功能的控制。

A2节点控制器305b可以包括图2中所描绘的一个或多个部件，包括处理器及相关联的存储器元件，并且还包括NVRAM卡。一旦控制器被替换并通电，如步骤406处所示的，过程继续交还程序，在交还程序中具有新控制器的节点A2将与节点A1进行协商，以再次承担对A2被配置为在正常操作期间所管理的存储设备和连接的控制。早在启动引导过程中，节点A2初始化其与包括交换机302和304的FC结构的连接性接口。在初始化(结构发现)期间，A2通过从交换机302和304获得以交换机的相应全球通用名称(WWN)形式的标识符来确定其集群内存储连接性(步骤410)。WWN或全球通用标识符(WWID)是用在包括光纤信道、先进技术附件或串行附接的SCSI的存储技术中的唯一标识符。在所描绘的实施例中，节点A2确定/发现本地光纤信道交换机302和304的WWN。所发现的WWN可以是例如依据序列号来标识交换机的全球通用节点名称。

节点A2 305b通过多播指示节点A2的身份的节点通告来通报其重新进入到跨集群配置350的FC互连上。如在步骤412处所示的，节点通告多播优选地与交还等待阶段重合，在交还等待阶段期间A2还不具有对其资源的访问，资源诸如在存储阵列306内记录A2的控制器设备ID及跨集群配置ID的邮箱根磁盘。此时，在节点A2具有对其唯一跨集群配置ID的访问之前，过程在步骤414处继续，其中A2向跨集群配置350的所有成员节点(即，A1、B1和B2)多播其节点通告。根据所描绘的实施例，节点通告包括节点标识信息，节点标识信息包括A2在步骤410处获得的交换机标识符。

步骤408描绘了节点A1接收到来自跨集群配置350的任何给定成员节点的任何给定节点通告。通常，节点通告将包括集群ID、节点系统ID及节点配置ID。集群ID标识该节点所属的集群，使得在所描绘的实施例中节点A1和A2将具有相同的集群ID，而节点B1和B2也将具有相同的集群ID。节点系统ID是单独地标识控制器硬件的数字或字母数字代码。在所描绘的实施例中，节点系统ID对于节点A2将发生改变，因为其控制器已被替换。节点配置ID是依据其功能、连接性及与跨集群配置中的其他节点的相互关系来标识节点的代码。因此，不管节点的控制器是否被替换，节点配置ID与给定“节点”相关联地保持相同。

给定跨集群配置350的四节点成员关系，在步骤408处诸如所示的A1的任何成员节点可以接收来自至少三个成员节点中的任何节点的节点通告消息。如上文所说明的，所有成员节点具有相对于其他成员中的每个成员的所定义的作用，并且节点配置ID定义了这一作用。然后，当诸如A2的节点在控制器替换后重新启动时，其不具有对存储在邮箱根磁盘上的其节点配置ID的访问，对其节点配置ID的访问有待由节点A1返还。在针对A2的启动的交还等待阶段期间，节点A1接收到来自A2的多播(步骤408)，该多播包括由节点A2在步骤410处获得的交换机标识符信息。如步骤416处所示的，节点A1确定在来自节点A2的多播中所包括的集群内标识符(在这一情况下的交换机标识符)是否匹配或以其他方式对应于其自身的集群内连接性信息，以确定A2是否是其HA对伙伴。响应于确定包含在A2的节点通告消息中的交换机标识符匹配其自身的集群内连接性信息(例如，匹配其连接到哪个本地交换机的其自身的对应记录)，A1开始交还存储资源(步骤418)，并且该过程以A2在跨集群配置内恢复在线结束。

图5是描绘了根据本公开的实施例的由跨集群配置350的成员节点A1、A2、B1和B2中的一个或多个在节点A2控制器替换后执行的操作的流程图。参考图5所描绘和描述的步骤可以与参考图4所描述的步骤和特征组合，以实现针对集群化存储节点的非间断存储控制器替换，集群化存储节点被配置为HA对并被合并到跨集群冗余域中。如所示的，该过程开始于步骤502处，并且然后继续完成存储资源(对存储设备和网络连接的控制)从节点A1到节点A2的交还。接下来，如步骤504处所示的，节点A2访问其邮箱根磁盘，针对其本身及跨集群配置350的其他三个成员的配置信息存储在其邮箱根磁盘上。如参考图4所描述的，已经重新启动的具有其新的控制器的节点A2已被节点A1识别为A1的HA集群伙伴。然而，节点A2还未相对于跨集群配置350内的节点A1、B1和B2重新建立其作用(作为HA伙伴、跨集群伙伴或辅助跨集群伙伴)。在步骤506和508处，A2读取在A2的邮箱根磁盘中本地存储的针对跨集群配置350的配置信息的副本。该配置信息与上文参考图4所描述的节点通告标识符信息一致。即，本地存储的配置信息包括针对每个成员的集群ID、节点系统ID、节点配置ID，以及按照所描述的实施例的集群内连接性ID。

节点系统ID对应于节点的控制器的设备标识符，通常表示为包含在控制内的NVRAM卡的序列号。在所描绘的示例中，在A2内本地存储的跨集群配置信息的副本将包括被替换为节点系统ID的控制器的标识符。如在步骤508处所示的，A2将本地记录的节点系统ID与其新近安装的控制器设备的标识符进行比较(步骤510)。如果如开始于步骤512处所示的那样，A2确定本地存储的控制器标识符与新近安装的控制器的标识符不同，那么A2生成要被多播到其他跨集群配置成员的控制器替换消息。

控制器替换消息包括被替换的A2控制器的标识符(即，当前本地存储的A2的节点系统ID)及替换的A2控制器的对应标识符，两者都与A2的节点配置ID相关联，如先前所说明的，A2的节点配置ID在控制器替换后保持不变。在接收到多播控制器替换消息之后，接收者成员节点A1、B1和B2中的每一个将指定的节点配置ID用作密钥，以标识哪个成员节点的节点系统ID需要替换(步骤516)。在如步骤518处所示的替换了跨集群配置信息的其本地存储副本中的节点系统ID(即，控制器设备ID)时，每个成员节点向多播发送者A2发送ACK。当确认接收到来自所有成员节点的ACK回复的A2更新其自身的本地配置副本以用新的控制器ID替换先前的控制器ID时，该过程完成(步骤520、522和524)。

图6描绘了具有跨集群冗余管理单元610的示例计算机系统。该计算机系统包括处理器602(可能包括多个处理器、多个核心、多个节点，和/或实现多线程等)。计算机系统包括存储器604，其可以是系统存储器(例如，缓存、SRAM、DRAM、零电容器RAM、双晶体管RAM、eDRAM、EDO RAM、DDR RAM、EEPROM、NRAM、RRAM、SONOS、PRAM等中的一个或多个)或上文已描述的机器可读介质的可能实现中的任何一个或多个。计算机系统还包括互连605(例如，PCI、ISA、PCI-Express、NuBus等)、网络接口606(例如，以太网接口、帧中继接口、SONET接口、无线接口等)及一个或多个存储设备608(例如，光存储装置、磁存储装置等)。冗余管理单元610体现实现上文参考图1-图5所描述的特征的功能。冗余管理单元610可以执行支持管理HA对的接管/交还阶段的操作，使得当被配置在集群化的环境中时执行接管的节点可以高效地识别其HA接管伙伴。冗余管理单元610可以执行如下操作：该操作支持由被配置在跨集群配置中的HA对的成员节点在HA对中的一个中的存储控制器的替换后执行的操作。这些功能中的任何一项可以被部分地(或完全地)实现在硬件中和/或在处理器602上。例如，功能可以使用专用集成电路来实现，可以在处理器602中所实现的逻辑中实现，可以在外围设备或卡上的协同处理器中实现等。另外，实现可以包括更少的部件或者包括未在图6中图示的附加部件(例如，附加的网络接口、外围设备等)。

如本领域技术人员将理解的，所公开的主题的方面可以被体现为系统、方法或计算机程序产品。因此，所公开的主题的实施例可以采取完全硬件实施例、完全软件实施例(包括固件、驻留软件、微代码等)或组合软件和硬件方面的实施例的形式，这些实施例在本文中可以通常都被称为“电路”、“模块”或“系统”。此外，所公开的主题的实施例可以采取计算机程序产品的形式，该计算机程序产品体现在其上体现有计算机可读程序代码的一个或多个计算机可读介质中。

可以利用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以例如是，但不限于：电子的、磁的、光的、电磁的、红外的或半导体的系统、装置或设备，或者前述各项的任何适当组合。计算机可读存储介质的更具体的示例(非穷举的列表)将包括以下：具有一个或多个导线的电气连接，便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)，光纤，便携式压缩碟只读存储器(CD-ROM)，光存储设备，磁存储设备，或前述各项的任何时代那个组合。在本文档的上下文中，计算机可读存储介质可以是可以包含或存储用于由指令执行系统、装置或设备使用或者结合指令执行系统、装置或设备来使用的程序的任何有形介质。

计算机可读信号介质可以包括其中体现有计算机可读程序代码(例如，在基带中或作为载波的一部分)的传播数据信号。这样的传播信号可以采取包括但不限于电磁、光或其任何适当组合的各种形式中的任何形式。计算机可读信号介质可以是任何计算机可读介质，计算机可读介质不是计算机可读存储介质且可以传达、传播或传送用于由指令执行系统、装置或设备使用或者结合指令执行系统、装置或设备来使用的程序。

体现在计算机可读介质上的程序代码可以使用任何合适介质来传输，这些介质包括但不限于无线、电缆、光纤线缆、RF等，或前述各项的任何适当组合。

用于执行针对所公开的主题的多个方面的操作的计算机程序代码可以以一个或多个编程语言的任何组合来编写，这些编程语言包括诸如Java、Smalltalk、C++等的面向对象编程语言及诸如“C”编程语言或类似编程语言的传统过程编程语言。程序代码可以完全地在用户的计算机上执行、部分地在用户的计算机上执行、作为单独软件包来执行、部分地在用户的计算机上且部分地在远程计算机上执行或完全在远程计算机或服务器上执行。在后一情境中，远程计算机可以通过包括局域网(LAN)或广域网(WAN)的任何类型的网络而连接到用户的计算机，或者可以连接到外部计算机(例如，使用因特网服务提供商通过因特网)。

虽然参考各种实现和利用对实施例进行了描述，但是应理解的是这些实施例是说明性的并且所公开的主题的范围不限于这些实施例。一般而言，如本文所描述的用于非间断地替换存储控制器的技术可以利用与任何硬件系统或软件系统一致的设施来实现。许多变化、修改、添加和改进是可能的。

Claims

1.一种用于在存储集群环境内管理节点的方法，所述方法包括：

在从第一节点向第二节点的存储冗余交还期间，在由所述第一节点从所述第二节点的存储冗余接管之后初始化所述第二节点，其中初始化所述第二节点包括：

从所述第二节点接收包括集群内节点连接性标识符的节点标识指示符，以及

基于所述集群内节点连接性标识符，来确定所述第二节点是否是集群内接管伙伴，以及

响应于确定所述第二节点是集群内接管伙伴，执行存储资源从所述第一节点向所述第二节点的交还。

2.根据权利要求1所述的方法，其中所述确定所述第二节点是否是集群内接管伙伴包括：将从所述第二节点接收的所述集群内节点连接性标识符与所述第一节点的集群内连接性信息进行比较。

3.根据权利要求1或2所述的方法，进一步包括：在所述存储冗余交还的交还等待阶段期间，接收由所述第二节点发送的、且包括所述节点标识指示符的节点通告消息。

4.根据权利要求1至3中的任一项所述的方法，其中所述第一节点和所述第二节点经由一个或多个交换机耦合到存储设备，并且其中所述集群内节点连接性标识符包括所述交换机中的至少一个交换机的至少一个标识符。

5.根据权利要求1至4中的任一项所述的方法，其中所述初始化所述第二节点进一步包括：引导所述第二节点，并且其中所述接收节点标识指示符出现在所述引导的交还阶段期间。

6.根据权利要求1至5中的任一项所述的方法，其中所述第一节点和所述第二节点被配置为第一存储集群中的第一高可用性(HA)存储控制器对，并且其中所述存储集群环境进一步包括被配置为第二存储集群中的HA存储控制器对的第三节点和第四节点，所述方法进一步包括：

响应于存储资源从所述第一节点向所述第二节点的所述交还，

读取由所述第二节点本地存储的跨集群配置信息的副本，其中所述第一节点、所述第三节点及所述第四节点单独地存储所述跨集群配置信息的相应本地副本，并且其中所述第一节点、所述第二节点、所述第三节点及所述第四节点属于基于所述跨集群配置信息而被配置的跨集群存储冗余配置，

确定由所述跨集群配置信息的所述第二节点本地副本指定的存储控制器设备标识符不同于与所述第二节点内的存储控制器设备相关联的标识符，以及

响应于确定由所述第二节点本地副本指定的所述存储控制器设备标识符不同于与所述第二节点内的存储控制器设备相关联的标识符，向所述第一节点、所述第三节点及所述第四节点发送存储控制器替换消息。

7.根据权利要求6所述的方法，进一步包括：

所述第二节点基于所述存储控制器替换消息，确定所述第一节点、所述第三节点及所述第四节点每个具有所述跨集群配置信息的修改的本地存储副本；以及

响应于确定所述第一节点、所述第三节点及所述第四节点每个具有所述跨集群配置信息的修改的本地存储副本，所述第二节点修改所述跨集群配置信息的其本地存储副本。

8.根据权利要求6或7所述的方法，其中跨集群重新配置消息指定与节点配置标识符相关联的控制器设备标识符，所述方法进一步包括：

所述第一节点、所述第三节点及所述第四节点中的每个节点基于所述节点配置标识符，分别选择所述跨集群配置信息的相应本地存储副本内的控制器设备标识符以用于替换；以及

所述第一节点、所述第三节点及所述第四节点中的每个节点基于所述选择，分别替换所述跨集群配置信息的相应本地存储副本内的控制器设备标识符。

9.一种用于在存储集群环境内管理节点的计算机程序产品，所述计算机程序产品包括：

非暂态机器可读介质，具有通过其来体现的程序代码，所述程序代码当在所述存储集群环境内被执行时使得所述存储集群环境：

在从第一节点向第二节点的存储冗余交还期间，在由所述第一节点从所述第二节点的存储冗余接管之后初始化所述第二节点，其中初始化所述第二节点的所述程序代码包括以下程序代码：

10.根据权利要求9所述的计算机程序产品，其中通过确定所述第二节点是否是集群内接管伙伴来初始化所述第二节点的所述程序代码包括：将从所述第二节点接收的所述集群内节点连接性标识符与所述第一节点的集群内连接性信息进行比较的程序代码。

11.根据权利要求9或10所述的计算机程序产品，其中初始化所述第二节点的所述程序代码包括：用于引导所述第二节点的程序代码，并且其中所述接收出现在所述引导的交还阶段期间。

12.根据权利要求9、10或11中的任一项所述的计算机程序产品，其中所述第一节点和所述第二节点被配置为第一存储集群中的第一高可用性(HA)存储控制器对，并且其中所述存储集群环境进一步包括：被配置为第二存储集群中的HA存储控制器对的第三节点和第四节点，所述程序代码进一步包括以下程序代码：

读取由所述第二节点本地存储的跨集群配置信息的副本，其中所述第一节点、所述第三节点及所述第四节点单独地存储所述跨集群配置信息的相应本地副本，其中所述第一节点、所述第二节点、所述第三节点及所述第四节点属于基于所述跨集群配置信息而被配置的跨集群存储冗余配置，

13.根据权利要求12所述的计算机程序产品，进一步包括以下程序代码：

基于所述存储控制器替换消息，确定所述第一节点、所述第三节点及所述第四节点每个具有所述跨集群配置信息的修改的本地存储副本；以及

响应于确定所述第一节点、所述第三节点及所述第四节点每个具有所述跨集群配置信息的修改的本地存储副本，修改所述跨集群配置信息的所述第二节点的本地存储副本。

14.根据权利要求12或13所述的计算机程序产品，其中跨集群重新配置消息指定与节点配置标识符相关联的控制器设备标识符，所述程序代码进一步包括以下程序代码：

针对所述第一节点、所述第三节点及所述第四节点中的每个节点，基于所述节点配置标识符，选择所述跨集群配置信息的相应本地存储副本内的控制器设备标识符以用于替换；以及

针对所述第一节点、所述第三节点及所述第四节点中的每个节点，基于所述选择，替换所述跨集群配置信息的相应本地存储副本内的控制器设备标识符。

15.一种存储集群设备，包括：

处理器；以及

具有存储在其中的程序代码的机器可读存储介质，所述程序代码由所述处理器可执行以使得所述存储集群设备：

在从第一节点向第二节点的存储冗余交还期间，在由所述第一节点从所述第二节点的存储冗余接管之后，通过以下来初始化所述第二节点：

16.根据权利要求15所述的存储集群设备，其中通过确定所述第二节点是否是集群内接管伙伴来初始化所述第二节点的所述程序代码进一步包括以下程序代码：所述程序代码由所述处理器可执行，以使得所述存储集群设备将从所述第二节点接收的所述集群内节点连接性标识符与所述第一节点的集群内连接性信息进行比较。

17.根据权利要求15或16所述的存储集群设备，其中初始化所述第二节点的所述程序代码包括：由所述处理器可执行以引导所述第二节点的程序代码，并且其中所述接收出现在所述引导的交还阶段期间。

18.根据权利要求15至17中的任一项所述的存储集群设备，其中所述第一节点和所述第二节点被配置为第一存储集群中的第一高可用性(HA)存储控制器对，并且其中所述存储集群环境进一步包括：被配置为第二存储集群中的HA存储控制器对的第三节点和第四节点，其中所述程序代码进一步包括由所述处理器可执行以使得所述存储集群设备进行以下操作的程序代码：

19.根据权利要求18所述的集群存储设备，进一步包括由所述处理器可执行以使得所述存储集群设备进行以下操作的程序代码：

确定所述第一节点、所述第三节点及所述第四节点每个具有基于所述存储控制器替换消息而修改的、所述跨集群配置信息的本地存储副本；以及

20.根据权利要求18或19所述的计算机程序产品，其中跨集群重新配置消息指定与节点配置标识符相关联的控制器设备标识符，所述程序代码进一步包括使得所述存储集群设备进行以下操作的程序代码：