CN107431643B

CN107431643B - 用于监测存储集群元件的方法和装置

Info

Publication number: CN107431643B
Application number: CN201680017124.8A
Authority: CN
Inventors: A·巴特拉; A·乔拉德; K·尼施梅
Original assignee: NetApp Inc
Current assignee: NetApp Inc
Priority date: 2015-02-03
Filing date: 2016-01-12
Publication date: 2021-02-12
Anticipated expiration: 2036-01-12
Also published as: EP3254197B1; EP3254197A1; US20200034069A1; CN107431643A; US10437510B2; JP6586465B2; US11106388B2; US20160224277A1; WO2016126390A1; JP2018513442A

Abstract

可以在节点范围和集群范围监测相关联但分离的存储集群的健康。监测集群范围内的存储集群包括监测支持存储集群并且连接存储集群的网络元件。最初，每个集群中的架构监测器发现集群拓扑。集群拓扑在整个存储集群的管理存储元件中被传送和维持。在存储集群拓扑已经被发现之后，每个集群的架构监测器可以周期性地确定存储集群的网络元件的状态。这使得存储集群能够维持对互连状态的认知，并且对状态的变化做出反应。此外，每个管理存储元件监测其自己的健康。该信息被聚合以确定何时根据在管理存储元件处定义的规则来触发纠正动作、警报和/或存储特征。

Description

用于监测存储集群元件的方法和装置

相关申请

本申请要求于2015年2月3日提交的题为“MONITORING STORAGE CLUSTERELEMENTS”的美国专利申请No.14/613,085的优先权，其通过引用并入本文。

背景技术

本公开的各方面总体上涉及分布式计算领域，并且更具体地涉及监测跨网络分布的存储元件。

集群通常是指将硬件元件分组在一起以获得硬件元件(例如，磁盘驱动器、存储阵列、文件服务器、存储控制器等)的组(“集群”)的益处，其不能从单独的硬件元件来获得。集群可以用于各种存储特征，其示例包括负载平衡、故障转移支持、增加I/O带宽以及数据可用性。为了支持这些功能，数据在支持的存储元件之间被复制。

发明内容

可以在节点范围和集群范围两者监测相关联的但分离的存储集群的健康。监测集群范围的存储集群包括监测支持存储集群并且连接存储集群的网络元件。最初，每个集群中的架构监测器发现集群拓扑。集群拓扑在整个存储集群的管理存储元件中被传送和维持。在发现存储集群拓扑之后，每个集群的架构监测器可以周期性地确定存储集群的网络元件的状态。这允许存储集群维持对互连状态的认知，并且对状态的变化做出反应。此外，每个管理存储元件监测其自己的健康。该信息被聚合以确定何时根据在管理存储元件处定义的规则来触发纠正动作、警报和/或存储特征。

附图说明

通过参考附图可以更好地理解所公开的示例。

图1描绘了具有用于监测存储集群健康的健康监测器的两个示例存储集群。

图2描绘了用于实施对存储集群的监测的一组示例模块。

图3描绘了用于监测存储集群网络和相关联的存储集群网络的示例操作的流程图。

图4描绘了用于监测事件和事件历史的示例操作的流程图。

图5描绘了具有存储集群健康监测器的示例系统。

具体实施方式

下面的描述包括实施本公开的技术的示例系统、方法、技术、指令序列和计算机程序产品。然而，应当理解，可以在没有这些具体细节的情况下实践所描述的方面。例如，虽然示例涉及存储集群结构，但是可以将各方面应用于其他后端连接配置。在其他情况下，为了不模糊描述，没有详细示出众所周知的指令实例、协议、结构和技术。

术语

本描述使用术语“存储元件”来表示托管和/或管理对数据的访问的存储系统内的任何实体。本文中涉及的存储元件可以被分类为管理存储元件和托管存储元件。管理存储元件与托管存储元件之间的区别源于存储元件的主要功能。管理存储元件主要管理对托管存储元件的访问。管理存储元件处理来自其他设备(例如，客户端)的请求，并且可以发起执行操作(例如，快照操作)的请求。不管请求是来自另一设备还是源自管理存储元件，管理存储元件向托管存储元件传输请求。管理存储元件的示例包括文件服务器和存储控制器。托管存储元件主要执行从管理存储元件的角度最终满足请求的操作。托管存储元件执行对由管理存储元件的请求所指定的位置的读取或写入。这种读取或写入可以在一个磁盘或多个磁盘上被执行。在多层虚拟化的情况下，从管理存储元件的角度来看，可以在看起来是一个磁盘或多个磁盘的内容上执行读取或写入。托管存储元件的示例包括磁盘驱动器、光驱动器、存储阵列和磁带驱动器。

术语管理存储元件和托管存储元件基于存储元件的主要功能来使用，因为在元件之间功能不是排他性的。例如，存储控制器可以具有本地存储在高速缓存中的数据，以加速对访问请求的处理。即使存储控制器可以完成访问请求，存储控制器的主要功能也不是从本地存储器读取数据并且将数据写入本地存储器。类似地，托管存储元件可以包括管理对磁盘的访问的硬件。例如，冗余独立磁盘阵列(RAID)控制器和磁盘阵列可以被容纳在单个壳体内。虽然RAID控制器管理对磁盘阵列的访问，但是被容纳在该单个壳体中的部件的主要功能是完成从管理存储元件接收的请求。

本描述使用术语“带外”和“带内”。这些术语对应于不同的通信信道。例如，带内通信是指通过主要用于存储集群的数据交换、管理等的通信信道进行通信的通信。带外通信是指通过不是主要用于数据交换和/或管理的通信信道进行通信的消息，尽管与带内通信相比，它可以明显更少程度地用于这些目的。这些通信信道可以是物理上不同的(例如，不同的电缆、不同的接口等)和/或可以是不同的通信协议。

本描述还使用术语“网络元件”。术语网络元件是指通过网络引导通信的设备，其中该通信可以包括数据和访问请求。网络元件可以是路由器、交换机、桥接器等。

简介

存储元件的集群(“存储集群”)可以跨越多个网络与另一存储集群相关联/或经由长途连接(例如，数千公里)互连。存储集群彼此相关联，以支持前面提到的一些存储特征。数据可以在存储集群之间被镜像并且在存储集群之间被同步，以实现数据可用性、故障转移、灾难恢复等。大距离分离的相关联的集群降低了对基于位置的灾难的敏感性，并且允许增加的数据可用性。

跨集群支持的一些存储特征(例如，故障转移、镜像等)使用关于存储集群元件的信息。该信息可以包括配置信息、环境信息和统计信息。这些信息在本文中被称为“健康信息”，因为它可以指示存储集群的“健康”(即，操作完整性)。可以在节点范围和集群范围两者监测相关联但分离的存储集群的健康。监测集群范围的存储集群包括监测支持存储集群并且连接存储集群的网络元件。最初，每个集群中的架构监测器发现集群拓扑。集群拓扑在整个存储集群的管理存储元件中被传送和维持。在发现存储集群拓扑之后，每个集群的架构监测器可以周期性地确定存储集群的网络元件的状态。这允许存储集群维持对互连状态的认知，并且对状态的变化做出反应。此外，每个管理存储元件监测其自己的健康。该信息被聚合以确定何时根据在管理存储元件处定义的规则来触发纠正动作、警报和/或存储特征。

图示

图1描绘了具有用于监测存储集群健康的健康监测器的两个示例存储集群。第一存储集群101和第二存储集群103被描绘为具有相同的配置。虚线107描绘存储集群101、103的分离。每个存储集群包括一组互连的管理存储元件(“前端”)和存储后端。图1所示的针对每个存储集群的示例存储后端配置包括四个存储元件组(例如，存储阵列或存储堆栈)、桥接管理存储元件的网络和存储元件的网络(例如，桥接光纤信道到小型计算机系统接口(SCSI))的两个桥接器和两个交换机。存储集群的每个交换机通过被描绘为网络云的长通信距离连接到另一存储集群中的对等交换机。存储集群101的交换机104经由长通信距离网络105连接到存储集群103的交换机106。存储集群101的交换机113经由长通信距离网络123连接到存储集群103的交换机108。当然，其他配置也是可能的。

如上所述，存储集群101、103中的每个还包括四个存储管理元件。存储集群101包括管理存储元件109、115。存储集群103包括管理存储元件116。存储集群101、103的其他管理存储元件未被单独标识用于该图示。管理存储元件109托管节点监测器111。虽然没有被标记，但是存储集群101、103中的所有管理存储元件都托管节点监测器。节点监测器监测管理存储元件的子系统的健康。因此，节点监测器111监测管理存储元件109的子系统的健康。管理存储元件115除了节点监测器之外还托管架构监测器119。架构监测器119监测两个存储集群101、103中的后端架构的网络元件的健康。管理存储元件116也托管架构监测器和节点监测器。在管理存储元件116上运行的架构监测器还监测两个存储集群101、103中的后端架构的健康。如图所示，在每个存储集群中实例化单个架构监测器。管理存储元件116上的架构检测器的操作未被示出，因为它们与架构监测器119的操作类似。

图1中描绘了一系列阶段A-E，作为架构监测器119对后端架构中的特定问题做出反应的示例图示。这些是用于帮助说明架构监测器的功能的示例阶段。这些阶段不用于限制权利要求的范围。

在阶段A，架构监测器发现两个存储集群101、103的拓扑。当端口被连接时，架构监测器开始向连接到管理存储元件115的网络元件发送针对信息的请求。这些针对信息的请求通过直接连接到管理存储元件的网络元件来在整个架构传播。除了拓扑以外，架构监测器119还从存储集群101、103的交换机和桥接器请求健康信息。架构监测器119可以请求关于电源子系统的信息、环境信息、配置信息等。例如，架构监测器119可以发送具有定义与所请求信息相对应的对象的管理信息库(MIB)的简单网络管理协议(SNMP)消息。使用SNMP消息允许架构监测器119在存储集群的完成之前(例如，在光纤信道适配器被安装在管理存储元件115上以连接到其他管理存储元件之前)开始从网络元件收集信息。在发现拓扑之后，管理存储元件115与存储集群101的其他管理存储元件共享拓扑信息。同样，管理存储元件116将发现两个存储集群的拓扑，并且与存储集群103的管理存储元件共享该信息。在集群拓扑被建立之后，架构监测器119周期性地查询存储集群101、103中的网络元件以获得健康信息。

在阶段B，交换机113的健康信息发生改变。健康信息的改变的示例包括虚拟存储区域网络(VSAN)配置的改变和温度的改变。

在阶段C，架构监测器119在其周期性监测请求之一期间查询交换机113。架构监测器119收集信息，包括VSAN配置的改变和交换机113的温度。

在阶段D，架构监测器119利用所收集的信息来更新数据库117。数据库117跨两个存储集群101、103的管理存储元件被维持和同步。当数据库117被更新时，架构监测器119将规则至少应用于数据库117中的经更新的条目。例如，规则可以指示如果交换机113的温度超过定义的温度门限，则应当生成通知，并且如果交换机113的端口未被配置用于特定VSAN，则应当生成通知。

在阶段E，架构监测器119将规则应用于数据库117，并且确定要生成警报通知。架构监测器119生成通知，并且将其传递给管理存储元件115的另一模块。例如，架构监测器119向管理存储元件115的用户界面生成通知，通知交换机113的温度已超过温度警告门限。基于通知，系统或管理员可以采取纠正动作或启动纠正动作计划(例如，减少交换机113上的负载)。

图2描绘了用于实施对存储集群的监测的一组示例模块。图2描绘了架构数据收集器203、架构监测器207、集群监测器209和节点监测器211。所有这些模块可以通过管理接口201来配置。架构数据收集器203、架构监测器207、集群监测器209和节点监测器211也可以生成通知，并且将通知呈现给管理接口201。图2还描绘了子系统213、215。节点监测器211与子系统215交互，并且集群监测器209与子系统213交互。

架构数据收集器203收集关于存储集群和相关联的存储集群的后端架构的数据。架构数据收集器203可以作为后台进程、作业(即一系列程序)等运行。架构数据收集器203发现连接到托管架构数据收集器203的设备(“节点”)的接口的网络元件。架构数据收集器203还发现从托管节点被进一步移除的网络元件(例如，多达n个断开链路的网络元件)。架构数据收集器203可以通过查询被直接连接到托管节点的设备或者分析从这些网络元件收集的信息来发现没有被直接连接到托管节点的网络元件。例如，架构数据收集器203可以分析从网络元件收集的转发表。架构数据收集器203利用从网络元件收集的信息来更新集群数据库205。该信息指示网络元件的集群拓扑结构和健康信息。如之前图1所述，集群数据库205在存储集群的所有管理存储元件之间被传送。

架构监测器207使用集群数据库205和架构数据收集器203来监测存储集群架构的健康。架构监测器207使架构数据收集器203周期性地从架构的网络元件收集健康信息。架构监测器207可以从规则217安装规则或将规则引用到集群数据库205中。当架构数据收集器203更新集群数据库205时，调用已安装的规则以确保更新不违反规则的任何条件。例如，作为更新集群数据库205的部分，架构数据收集器203评估规则。架构监测器207还可以在集群数据库205中注册兴趣，并且当进行更新时接收通知或中断。然后，架构监测器207可以将来自规则217中的规则应用于集群数据库205中经更新的条目。如果违反了规则条件(例如，故障切换电源、端口错误配置等)，则架构监测器207可以生成用于管理界面201的通知。然而，可以定义在生成通知之前需要一定数目的违规和/或违规组合的策略。因此，架构监测器207可以维护违规的历史以确定何时生成通知或警报。

集群监测器209还可以在集群数据库中注册兴趣和/或将来自规则217中的规则安装到集群数据库205中。集群监测器209经由架构数据收集器203和集群数据库205验证存储集群的拓扑。集群监测器209将拓扑规则传送到架构数据收集器203，以确保在存储集群(例如，单个交换架构)的设置中或在部署的存储集群中不存在违规(例如，管理存储元件丢失)。集群监测器209还与子系统213交互以确定其他规则违规。子系统213的示例包括互连的子系统和网络子系统。网络子系统可以具化网络协议的实施、用于联网的结构的管理(例如，逻辑接口、套接字等)、联网特征(例如，故障切换操作)等。集群监测器209可以周期性地(例如，通过应用程序编程接口(API))与任一子系统213接合。通过互连子系统的示例，集群监测器209可以周期性地调用函数以确定与其他管理存储元件的连接状态以及与后端存储的连接状态(例如，协议连接、端口统计等)。通过网络子系统的示例，集群监测器209可以周期性地调用函数来确定为集群间连接配置的逻辑接口的状态。集群监测器209还扫描其存储集群中的管理存储元件。集群监测器209可以扫描管理存储元件以验证连接、配置(例如，用于集群间连接的实例化对象)等。与架构监测器一样，集群监测器209可以根据规定何时生成通知的规则和策略来生成通知。然而，可以定义在生成通知之前需要一定数目的违规、违规组合和/或时间聚合的策略。因此，集群监测器209可以维护违规历史以确定何时生成通知或警报。

节点监测器211监测托管节点的健康。为此，节点监测器211与子系统215交互。子系统的示例包括存储子系统、电力子系统和互连子系统。节点监测器211可以利用API与子系统215交互，或者可以向子系统进程注册以接收特定事件的通知(例如，风扇故障、临界温度、功率损耗、端口故障等)。在某些情况下，可以从建议集群中的问题的子系统215而不是节点本身来生成事件。例如，子系统215可以生成指示集群间接口的故障的事件。节点监测器211将规则应用于事件，该规则将故障指示为可能的“反向铲(back-hoe)”事件。根据事件的规模和/或受影响的网络关系，反向铲事件涉及与站点、系统、集群、区域等的连接的完全丢失。这个事件与反向铲相关联，因为连接丢失的常见原因是实际的反向铲切断电缆。但是，反向铲事件可能是其他事件(例如自然灾害)。可能的反向铲事件的规则可以定义用于节点监测器211通知集群监测器209的动作。作为响应，集群监测器209可以执行一系列操作以确定是否已经发生反向铲事件。例如，集群监测器209可以使存储集群的所有管理存储元件ping相关联的存储集群(例如，灾难恢复对等存储集群)中的所有合作的管理存储元件。

反向铲事件的快速检测允许对反向铲事件的快速响应。当怀疑反向铲事件时，架构监测器207可以触发架构数据收集器203向相关联的存储集群的网络元件发送带外消息(例如，SNMP请求)。此外，集群监测器209可以使存储集群的管理存储元件检查心跳。作为示例，心跳可以被实施为经由光纤信道虚拟接口管理相关联的存储集群中的存储元件的心跳计数器的远程直接存储器访问读取。

所图示的各个模块是基于功能的结构，以帮助理解功能。图2不应当用于将权利要求的范围缩小到特定模块或程序组织。例如，可以实施或描绘单个模块以包含架构监测器207和架构数据收集器203的所示功能。此外，实施方式将根据不同的平台而变化。作为一个示例，监测实施方式可以在多线程单核处理器和多处理器节点之间变化。

虽然前述示例涉及存储集群架构，但是权利要求的范围不限于此。通常，存储集群可以配置有架构(例如，管理存储元件之间的完全连接)，但是不需要连接配置。以下示例将更广泛地指代存储集群网络而不是架构。以下示例是独立于图2所示的特定模块分离的示例操作的流程图。

图3描绘了用于监测存储集群网络和相关联的存储集群网络的示例操作的流程图。框之间的虚线表示操作流不是直接顺序的，并且可以指示等待响应或中断。该图还将存储集群称为集群。参考执行操作的存储集群中的节点来描述操作，其中节点是管理存储元件。

在框301，节点发现其存储集群的网络拓扑，并且相应地更新集群数据库。当连接被建立时，节点发送通信以发现后端中的元件。后端元件可以包括存储元件和网络元件以及其他管理存储元件。节点通过不同的接口/端口/卡被连接到后端，而不是其他管理存储元件。节点可以使用物理接口、逻辑接口、全球名称和网络地址的任意组合来确定存储集群拓扑。节点可以发现具有带外通信和带内通信两者的拓扑。例如，节点可以将SNMP消息发送到带外(例如，除光纤信道外)的网络元件。节点可以首先在第一时间段内(例如在正在建立存储集群和/或正在配置集群关系的同时)发现具有带外通信的拓扑。之后，可以基于带内通信来完成对所收集的拓扑信息的更新。该第二或随后的时间段可以持续到定义的事件发生，例如集群关系的中断或改变。此外，节点可以在带内通信和带外通信之间转换，用于以定义的间隔收集操作信息和/或拓扑信息。定义的间隔可以取决于事件的发生，或者独立于事件。例如，节点可以使用带外通信，直到被通知带内通信已经建立。在可能的反向铲事件的通知之后，节点可以在带内通信和带外通信之间交替定义的时间段，直到可能的反向铲事件的解决。节点利用从存储集群的成员接收或取回的信息来更新集群数据库。节点还发现相关联的存储集群(例如，具有镜像或灾难恢复关系的存储集群)的拓扑。节点确定为集群间连接所配置的接口。例如，可以在管理存储元件上定义逻辑接口，以通过规定的网络元件连接到相关联的集群的管理存储元件。

在框303，节点将验证规则应用到所发现的网络拓扑。在至少一些集群存储拓扑被发现之后，可以将拓扑验证规则应用于信息，以确定所发现的拓扑是否符合由验证规则表示的规范。例如，拓扑验证规则可能需要一定数目的交换机、相关联的存储集群之间的冗余路径、一定数目的管理存储元件等。

在框305，节点根据在框303所应用的拓扑验证规则来确定所发现的集群存储拓扑是否有效。如果所发现的拓扑是有效的，则控制流向框309。如果不是，则控制流向框307。在框307，节点生成所发现的网络拓扑违反验证规则的通知。通知可以指示所违反的拓扑规则(例如，后端架构中最少两个交换机)。

在框309，针对存储集群网络中的每个网络元件开始重复操作。示例重复操作由框311表示。

在框311，节点从存储集群的所发现的网络元件请求操作信息(“健康信息”)。操作信息的示例包括环境信息(例如，当前温度、制造商推荐的操作温度)、配置信息(例如，VSAN配置、协议配置等)、子系统信息(例如，电源信息、风扇信息)和操作统计(例如，吞吐量、丢弃的数据包、每个连接的负载等)。节点可以发送指向网络元件的每个信息源(例如，操作系统、协议模块等)的一系列请求。例如，在发送对于操作统计的单独请求之前，节点可以发送对于关于配置的信息的请求。节点可以发送指示请求所有操作信息的单个请求。消息的格式将事先达成一致。在某些情况下，节点可以在请求操作信息之前配置网络元件。作为示例，节点可以向网络元件通知报告协议和消息的规范。节点可以安装支持报告协议和消息规范的代码。在操作信息的初始收集之后，节点可以在随后的请求中仅请求操作信息的子集。

在框313，节点确定是否存在附加的经发现的网络元件，其中操作信息将从附加的经发现的网络元件处获得。如果在该时间窗口内没有更多网络元件，则控制流向框315。如果存在要查询的附加的经发现的网络元件，则控制流向框309。

在框315，节点等待监测器触发。监测器触发可以是时间段的到期。节点可以被配置为在预定义的时间段从集群成员(包括后端网络元件)收集操作信息。监测器触发也可以是事件驱动或中断驱动的触发。例如，节点子系统中的事件可以使节点在时间段到期之前从全部或指定的集群成员请求全局或特定的操作信息。在监测器触发之后，控制流回到框309。

在框317，节点从存储集群网络的元件接收操作信息。从框311到框317的虚线指示节点接收操作信息。可以在框311的请求之后以及在可以被实施的任何超时机制之前的任何时间接收操作信息。因此，框311和框317之间的序列不一定是顺序的。换言之，在从元件X、Y和Z请求操作信息之后，节点可以正在从元件X接收操作信息。

在框319，节点根据接收到的操作信息来更新集群数据库。节点不一定写入从元件接收的所有操作信息。节点可以仅写入接收到的操作信息的子集。在某些情况下，节点可以不将任何东西写入集群数据库。例如，操作信息可以指示响应元件具有操作风扇并且正在可接受的温度下操作。在这种情况下，节点可能不会使用除元件响应的指示之外的任何内容来更新集群数据库。

在框321，节点确定接收到的操作信息是否违反规则。在概念上，规则可以是交换机的传输功率不能超过定义的门限。在程序代码中，规则将被表示为条件，例如，交换机的传输功率高于定义的门限。因此，违反规则将是满足以程序代码表达规则的条件。规则还可以指示或关联/引用违反规则时要采取的操作。作为示例，如果网络元件的工作电压超过门限，则向管理界面生成警报通知。节点可以通过利用表示操作信息(例如，交换机电压)的参数向规则中进行索引来访问规则集。作为另一示例，集群数据库的条目可以与规则相关联。这些规则可以被引用或者直接嵌入到集群数据库中。当条目被更新时，相应的规则被评估以确定它是否被违反。如果违反了规则，则控制流向框323。否则，当节点再次接收到操作信息时，控制流回到框317。

在框323，节点确定是否生成通知。尽管可能会违反规则，但是可以根据规则定义一种策略来在数目上或随时间来汇总违规。例如，策略可以将通知的生成条件规定为在规定的时间段内针对操作温度规则的警告级别的重复违反。相反，节点可以响应于临界温度水平的单个违反而生成通知。如果通知将被生成，则控制流向框325。在框325，节点根据规则生成通知。规则可以规定在用户界面中产生警报或者更新错误日志。

在框327，节点跟踪规则违反。如果违规的聚合将会触发通知生成，则节点将跟踪规则违反。即使通知被生成，也可以跟踪规则违反。对于相同规则的多次违反，可以生成不同的通知。此外，规则可以规定是否应当执行跟踪。

除了跟踪规则违反之外，节点还可以结合其他事件或累积地跟踪违反规则的事件。尽管图2主要涉及通过API与子系统交互，但是实施方式可以使用消息传递、事件生成和API的任意组合用于监测。

图4描绘了用于监测事件和事件历史的示例操作的流程图。图4的操作参考如图3所示的存储集群中的节点来描述。

在框401，节点接收事件的通知并且评估对应于事件的(多个)规则。节点上的监测进程向节点的另一进程注册以接收事件的通知。监测进程可以规定事件的类型、特定子系统、子系统和事件类型的组合等。监测进程可以向子系统的进程注册，或者向节点的操作系统的中央进程进行注册，例如。节点基于事件通知的内容和起始子系统来确定与事件相对应的规则。可以为每个子系统定义规则集。例如，可以为互连子系统定义规则集。规则可以包括基于统计的规则、连接时间规则、逻辑接口规则等。

在框403，节点根据评估的规则来确定事件是否单独地触发警报通知。如果是，则节点在框405生成警报通知。可以生成警报通知用于经由用户界面、消息传递或者节点的进程之间的通信来呈现。如果事件单独不触发警报通知，则控制流向框407。

在框407，节点确定事件是否可以与另一事件组合触发警报通知。另一事件可以是在给定时间段内发生的不同事件，或者另一事件可以是事件的先前事件。如果事件可以与另一事件组合触发警报通知，则控制流向框409。否则，控制流向框417。

在框409，节点确定其他事件是否已经被记录(即已经发生)。如果是，则控制流向框411。如果不是，则控制流向框413。作为与其他事件组合的事件的示例，其将被配置用于集群间连接的逻辑接口的故障。如果其他节点具有与相关联的存储集群的连接，则逻辑接口的故障可能是本地的。规则可以规定当检测到逻辑接口的故障时，节点将该故障传送到当前正在监测存储集群的节点。如果节点是监测存储集群的节点，则规则可以规定节点将要求其他节点对相关联的存储集群中的对等体进行ping。

在框413，节点确定对应于其他事件的子系统。作为示例，事件可以是超过警告门限但是没有超过临界温度门限的温度。规则可以规定节点应当从冷却子系统确定风扇状态。在某些情况下，子系统可以位于不同的节点上。例如，集群监测器节点将确定它将联系存储集群的其他节点。

在框419，节点查询子系统以确定是否发生了其他事件。如果规则指示节点应当查询冷却子系统，则节点查询冷却子系统以获得风扇状态。如果规则指示节点(作为集群监测器)应当查询其他节点的连接状态，则节点指示其他节点对相关联的存储集群中的对等体进行ping，并且基于结果来请求响应。

在框421，节点接收对查询的响应。在接收到响应之后，控制流向框411。

在框411，节点确定事件的组合是否触发警报通知。如果事件的组合触发警报通知，则控制流向框415，其中节点生成警报通知。否则，控制流向框417。在框417，节点更新事件的历史以指示事件。

流程图被提供以帮助理解说明，而不用于限制权利要求的范围。流程图描绘了可以在本公开的各个方面之间变化的示例操作。可以执行附加的操作；可以执行较少的操作；可以并行地执行操作；并且可以按不同的顺序执行操作。例如，框301和框303中描绘的操作可以重叠。在一段时间之后或在发现配置数目的集群成员之后，节点可以开始应用拓扑规则，并且继续应用这些规则以发现更多的存储集群。作为另一示例，图3似乎描绘了包括框309、框311和框313的操作循环。各方面不需要执行循环，并且允许操作的中断以及来自迭代序列的变化。参考图4，节点可以根据组合事件规则评估的结果来更新事件历史。

如本领域技术人员将理解的，本公开的各方面可以被具化为系统、方法或存储在一个或多个机器可读介质中的程序代码/指令。因此，各方面可以采取硬件、软件(包括固件、常驻软件、微代码等)、或软件和硬件的组合的形式，这些在本文中通常可以被称为“电路”、“模块”或“系统”。在示例图示中作为单个模块/单元呈现的功能可以根据平台(操作系统和/或硬件)、应用生态系统、接口、程序员偏好、编程语言、管理员偏好等中的任意一个来被不同地组织。

可以使用一个或多个机器可读介质的任何组合。机器可读介质可以是机器可读信号介质或机器可读存储介质。机器可读存储介质可以是，例如但不限于，采用电子、磁、光、电磁、红外或半导体技术中的任何一种或组合来存储程序代码的系统、装置或设备。机器可读存储介质的更具体的示例(非详尽列表)包括以下多项：便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备、或上述的任何合适的组合。在本文的上下文中，机器可读存储介质可以是可以包含或存储由或结合指令执行系统、装置或设备使用的程序的任何有形介质。

机器可读信号介质可以包括其中具化有机器可读程序代码的传播数据信号，例如在基带中或作为载波的部分。这种传播信号可以采取各种形式中的任何形式，包括但不限于电磁、光学或其任何合适的组合。机器可读信号介质可以是非机器可读存储介质并且可以传达、传播或传送程序用于由或结合指令执行系统、装置或设备使用的任何机器可读介质。

可以使用任何适当的介质来传输在机器可读介质上具化的程序代码，适当的介质包括但不限于无线、有线、光纤电缆、RF等、或前述的任何合适的组合。

用于执行本公开的各方面操作的计算机程序代码可以用一种或多种编程语言的任何组合来编写，一种或多种语言包括面向对象的编程语言，诸如

编程语言、C++等；动态编程语言，诸如Python；脚本语言，诸如Perl编程语言或PowerShell脚本语言；和传统的程序性编程语言，诸如“C”编程语言或类似的编程语言。程序代码可以完全在独立的计算机上执行、可以以分布式的方式跨多台计算机执行、并且可以在一台计算机上执行，同时在另一台计算机上提供结果和/或接受输入。

示例参照根据本公开的各方面的方法、装置(系统)和程序代码的流程图和/或框图来描述。应当理解，流程图和/或框图的每个框以及流程图和/或框图中的框的组合可以由程序指令来实施。这些程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器，使得经由计算机或其他可编程数据处理装置的处理器执行的指令能够创建用于实施在流程图和/或框图的框中规定的功能/动作的装置。

这些程序指令还可以被存储在机器可读介质中，机器可读介质可以引导计算机、其他可编程数据处理装置或其他设备以特定方式工作，使得存储在机器可读介质中的指令产生包括实施在流程图和/或框图的框中规定的功能/动作的指令的制品。

程序指令还可以被加载到计算机、其他可编程数据处理装置或其他设备上，以使得能够在计算机、其他可编程装置或其他设备上执行一系列操作步骤以产生计算机实施的过程，使得在计算机或其他可编程装置上执行的指令能够提供用于实施在流程图和/或框图的框中规定的功能/动作的过程。

图5描绘了具有存储集群健康监测器的示例系统。系统包括处理器单元501(可能包括多个处理器、多个核、多个节点和/或实现多线程等)。计算机系统包括存储器507。存储器507可以是系统存储器(例如，高速缓存、SRAM、DRAM、零电容器RAM、双晶体管RAM、eDRAM、EDO RAM、DDR RAM、EEPROM、NRAM、RRAM、SONOS、PRAM等中的一个或多个)或以上已经描述的机器可读介质的可能实施方式中的一个或多个。计算机系统还包括总线503(例如，PCI、ISA、PCI-Express、

总线、

总线、NuBus等)、网络接口505(例如，光纤信道、以太网接口、互联网小型计算机系统接口、接口、SONET接口、无线接口等)和(多个)存储设备(例如，光存储装置、磁存储装置等)。该系统还包括存储集群健康监测器511。存储集群健康监测器511监测存储集群的管理存储元件、存储集群的后端元件以及相关联的存储集群的元件的健康。这些功能中的任何一个可以部分地(或完全地)在硬件和/或处理器单元501中被实施。例如，功能可以用专用集成电路、在处理器单元501中实现的逻辑中、在外围设备或卡上的协处理器中等被实施。此外，实施方式可以包括图5中未示出的较少或附加的部件(例如，视频卡、音频卡、附加网络接口、外围设备等)。处理器单元501、存储设备和网络接口505耦合到总线503。尽管被示出为耦合到总线503，但是存储器507可以耦合到处理器单元501。

尽管本公开参考各种实施方式和利用来描述，但是应当理解，描述是说明性的，并且权利要求的范围不限于此。通常，如本文中描述的用于监测存储集群和相关联的存储集群的健康的技术可以利用与任何硬件系统一致的设施或硬件系统来实施。很多变型、修改、添加和改进是可能的。

可以为本文中描述的部件、操作或结构提供多个实例作为单个实例。最后，各种部件、操作和数据存储之间的边界是有些任意的，并且在具体的说明性配置的上下文中示出了特定的操作。功能的其他分配被设想并且可以落在权利要求的范围内。通常，在示例配置中呈现为单独的部件的结构和功能可以被实施为组合的结构或部件。类似地，作为单个部件呈现的结构和功能可以被实施为单独的部件。这些和其他变型、修改、添加和改进可以落在权利要求的范围内。

Claims

1.一种用于在系统中使用的计算机实施的方法，所述系统包括第一存储集群(101)以及与所述第一存储集群相关联的第二存储集群(103)，所述第一存储集群和所述第二存储集群各自具有后端，所述后端包括存储元件和网络元件，所述方法由所述第一存储集群中的节点执行，所述方法包括：

确定(301)所述第一存储集群的所述后端和所述第二存储集群的所述后端的拓扑；

对照拓扑验证规则来验证经确定的所述拓扑；

从所述第一存储集群后端的网络元件以及从所述第二存储集群后端的网络元件周期性地获取(311)第一操作信息；

在从所述网络元件中的任何一个网络元件获取所述第一操作信息之后：

至少部分基于所述第一操作信息来在集群数据库(205)中更新(319)在所述第一存储集群中传送的存储集群信息；

确定(321)所述第一操作信息是否违反一个或多个规则的第一集合中的一个或多个规则；

响应于确定所述第一操作信息违反规则的所述第一集合中的一个或多个规则，确定(323)通知是否应当被生成；

响应于确定所述通知应当被生成，而生成(325)所述通知；

从所述节点的本地子系统获取(401)第二操作信息；

确定(411)所述第二操作信息与所述第一操作信息组合是否违反一个或多个规则的第二集合中的一个或多个规则；以及

如果所述第一操作信息和所述第二操作信息的所述组合违反规则的所述第二集合，则生成(415)通知。

2.根据权利要求1所述的方法，其中确定所述第一存储集群的所述后端和与所述第一存储集群相关联的所述第二存储集群的所述后端的所述拓扑包括：关于所述第一存储集群与所述第二存储集群之间的通信信道，而在带外从所述第二存储集群收集拓扑信息。

3.根据权利要求2所述的方法，还包括：经由带内通信来确定所述第一存储集群和所述第二存储集群二者的前端的拓扑。

4.根据权利要求2或3所述的方法，其中在带外收集所述拓扑信息包括：根据简单网络管理协议来收集所述拓扑信息。

5.根据权利要求1至3中的任一项所述的方法，其中所述第一操作信息包括：环境信息、配置信息、子系统信息或者操作统计；并且策略被定义为：在通知被生成之前，需要一定数目的违规、违规组合或者时间聚合。

6.根据权利要求1至3中的任一项所述的方法，其中周期性地获取所述第一操作信息包括：在第一时间段经由第一通信信道获取所述第一操作信息，以及在第二时间段经由第二通信信道获取所述第一操作信息。

7.根据权利要求1至3中的任一项所述的方法，其中所述操作信息包括配置信息和当前操作信息中的至少一项。

8.根据权利要求1至3中的任一项所述的方法，还包括：

确定所述第二操作信息指示所述第一存储集群与所述第二存储集群之间连通性的丢失；以及

响应于确定了所述第二操作信息指示连通性的所述丢失，确定所述第一操作信息是否也指示所述第一存储集群与所述第二存储集群之间连通性的丢失。

9.一种或多种非暂态机器可读介质，所述非暂态机器可读介质存储有程序代码，所述程序代码在被处理器执行时使节点执行在系统中使用的方法，所述系统包括第一存储集群(101)以及与所述第一存储集群相关联的第二存储集群(103)，所述第一存储集群和所述第二存储集群各自具有后端，所述后端包括存储元件和网络元件，所述节点位于所述第一存储集群中，所述方法包括：

确定(301)所述第一存储集群的后端和所述第二存储集群的所述后端的拓扑；

对照拓扑验证规则来验证经确定的所述拓扑；

从所述第一存储集群后端的网络元件以及从所述第二存储集群后端的网络元件周期性地获取(311)操作信息；

响应于从网络元件接收到操作信息：

至少部分基于来自所述网络元件的所述操作信息来在集群数据库(205)中更新(319)在所述第一存储集群中传送的存储集群信息；

确定(321)所述操作信息是否违反一个或多个规则的第一集合中的一个或多个规则；

响应于确定所述操作信息违反规则的所述第一集合中的一个或多个规则，确定(323)通知是否应当被生成；

响应于确定所述通知应当被生成，而生成(325)所述通知；

从所述节点的本地子系统获取(401)操作信息；

确定(411)来自所述本地子系统的所述操作信息与周期性地获得的所述操作信息组合是否违反一个或多个规则的第二集合中的一个或多个规则；以及

如果操作信息的所述组合违反规则的所述第二集合中的一个或多个规则，则生成(415)通知。

10.根据权利要求9所述的机器可读介质，其中用于确定所述第一存储集群的所述后端和与所述第一存储集群相关联的所述第二存储集群的所述后端的所述拓扑的所述程序代码包括：用于关于所述第一存储集群与所述第二存储集群之间的通信信道，而在带外从所述第二存储集群收集拓扑信息的程序代码。

11.根据权利要求10所述的机器可读介质，所述方法还包括：经由带内通信来确定所述第一存储集群的前端和所述第二存储集群的前端的拓扑。

12.根据权利要求10或11所述的机器可读介质，其中用于带外地收集所述拓扑信息的所述程序代码包括：用于根据简单网络管理协议来收集所述拓扑信息的程序代码。

13.根据权利要求9至11中的任一项所述的机器可读介质，其中所述操作信息包括：环境信息、配置信息、子系统信息或者操作统计；并且策略被定义为：在通知被生成之前，需要一定数目的违规、违规组合或者时间聚合。

14.根据权利要求9至11中的任一项所述的机器可读介质，其中用于从所述网络元件周期性地获取所述操作信息的所述程序代码包括：用于在第一时间段经由第一通信信道从所述网络元件获取所述操作信息、以及在第二时间段经由第二通信信道从所述网络元件获取所述操作信息的程序代码。

15.根据权利要求9至11中的任一项所述的机器可读介质，其中所述操作信息包括配置信息和当前操作信息中的至少一项。

16.根据权利要求9至11中的任一项所述的机器可读介质，所述方法还包括：

确定来自所述本地子系统的所述操作信息指示所述第一存储集群与所述第二存储集群之间连通性的丢失；以及

响应于对来自所述本地子系统的所述操作信息指示连通性的所述丢失的确定，确定来自所述网络元件的所述操作信息是否也指示所述第一存储集群与所述第二存储集群之间连通性的丢失。

17.一种用于管理存储集群元件的装置，包括：

处理器；以及

存储有程序代码的机器可读存储介质，所述程序代码可由所述处理器执行，以使所述装置执行根据权利要求1至8中的任一项所述的方法。

18.一种用于管理存储集群元件的装置，包括第一存储集群(101)中的节点，所述第一存储集群与第二存储集群(103)相关联，所述第一存储集群和所述第二存储集群各自具有后端，所述后端包括存储元件和网络元件，所述节点包括：

处理器；以及

其上存储有程序代码的机器可读存储介质，所述程序代码可由所述处理器执行，以使所述装置：

确定所述第一存储集群的所述后端和所述第二存储集群的所述后端的拓扑；

对照拓扑验证规则来验证经确定的所述拓扑；

从所述第一存储集群后端的网络元件以及从所述第二存储集群后端的网络元件周期性地获取操作信息；

响应于从网络元件接收到操作信息：

至少部分基于来自所述网络元件的所述操作信息来在集群数据库中更新在所述第一存储集群中传送的存储集群信息；

确定所述操作信息是否违反一个或多个规则的第一集合中的一个或多个规则；

响应于确定所述操作信息违反所述一个或多个规则的第一集合中的一个或多个规则，确定通知是否应当被生成；

响应于确定所述通知应当被生成，而生成所述通知；

从所述节点的本地子系统获取操作信息；

确定来自所述节点的所述本地子系统的所述操作信息与周期性地获得的所述操作信息组合是否违反一个或多个规则的第二集合中的一个或多个规则；以及

如果操作信息的所述组合违反所述一个或多个规则的第二集合中的一个或多个规则，则生成通知。

19.根据权利要求18所述的装置，其中使所述装置确定所述第一存储集群的所述后端和与所述第一存储集群相关联的所述第二存储集群的所述后端的所述拓扑的所述程序代码包括由所述处理器可执行以使所述装置关于所述第一存储集群与所述第二存储集群之间的通信信道带外地从所述第二存储集群收集拓扑信息的程序代码。

20.根据权利要求19所述的装置，其中使所述装置带外地收集所述拓扑信息的所述程序代码包括由所述处理器可执行以使所述装置根据简单网络管理协议来收集所述拓扑信息的程序代码。

21.根据权利要求18至20中的任一项所述的装置，所述装置还被使得：

响应于来自所述本地子系统的所述操作信息指示连通性的所述丢失的确定，确定来自所述网络元件的所述操作信息是否也指示所述第一存储集群与所述第二存储集群之间连通性的所述丢失。