WO2024113832A1

WO2024113832A1 - 节点异常事件的处理方法、网卡及存储集群

Info

Publication number: WO2024113832A1
Application number: PCT/CN2023/103864
Authority: WO
Inventors: 杨俊涛; 匡竹青; 赵阳; 李若竹
Original assignee: 华为技术有限公司
Priority date: 2022-11-29
Filing date: 2023-06-29
Publication date: 2024-06-06
Also published as: CN118118321A

Abstract

公开了一种节点异常事件的处理方法、网卡及存储集群，属于存储技术领域。该方法应用于存储设备的网卡，该存储设备还包括多个用于管理存储器的节点，其中，网卡与多个节点中的第一节点通信连接，能够在检测到与该第一节点相关的异常事件的情况下，主动向主机发送通知消息，告知主机该第一节点所在的路径发生异常，便于主机进行路径切换，这种方式能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。

Description

节点异常事件的处理方法、网卡及存储集群

本申请要求于2022年11月29日提交的申请号202211509370.9、发明名称为“一种RDMA网卡”的中国专利申请的优先权，以及，于2023年1月29日提交的申请号202310144857.X、发明名称为“节点异常事件的处理方法、网卡及存储集群”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及存储技术领域，特别涉及一种节点异常事件的处理方法、网卡及存储集群。

背景技术

基于光纤的非易失性内存接口(non-volatile memory express over fabrics，NVMe-oF)规范是一种存储网络协议。目前，基于NVMe-oF的存储设备通常采用多节点架构(节点也可以理解为是一种控制器)来实现主机对存储设备的访问，以提升存储业务的可靠性和连续性。例如，主机分别通过存储设备中节点A(node A)和节点B(node B)所在的两条路径来访问存储设备的存储器，在主机通过节点A所在的路径访问存储器的情况下，节点A发生异常事件后(如节点故障、升级或重启等)，主机可以切换到节点B所在的路径，通过节点B所在的路径来访问存储器。

相关技术中，主机与节点A之间会建立心跳连接，主机能够通过该心跳连接检测节点A是否发生异常事件，在检测到节点A发生异常事件的情况下，切换到节点B所在的路径，通过节点B所在的路径来访问存储器。

然而，上述方法依赖于心跳超时机制，使得节点发生异常后主机成功切换路径的耗时较长，导致切换期间业务跌零的时间较长，从而影响存储业务的可靠性和连续性。

发明内容

本申请提供了一种节点异常事件的处理方法、网卡及存储集群，能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。该技术方案如下：

第一方面，提供了一种节点异常事件的处理方法，应用于存储设备的网卡，所述存储设备包括网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述方法包括：

在检测到与所述第一节点相关的异常事件的情况下，所述网卡向主机发送通知消息，所述通知消息指示所述第一节点所在的路径发生异常，以使所述主机通过所述多个节点中所述第一节点以外的节点所在的路径访问所述存储器。

其中，存储设备的节点也即是存储设备的存储控制器(controller)，能够处理主机下发的命令，对存储器进行管理，等等。与第一节点相关的异常事件可以是第一节点自身发生的异常事件，例如第一节点故障、重启等，也可以是网卡与第一节点之间的通信链路发生的异常事件，例如通信链路断开等，本申请不限于此。在上述方法中，并非被动等待心跳消息来发现故障，而是网卡与多个节点中的第一节点通信连接，从而网卡在检测到与该第一节点相关的异常事件的情况下，主动向主机发送通知消息，告知主机该第一节点所在的路径发生异常，便于主机进行路径切换，这种方式能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。应理解，由于网卡与节点通信连接，且都属于存储设备，因此一旦发生与该节点相关的异常事件，网卡能够及时获知这一异常事件，并快速做出响应，告知主机。

在一些实施例中，所述通知消息包括路径状态信息，所述路径状态信息指示所述第一节点所在的路径发生异常。

在一些实施例中，所述网卡与所述第一节点通过外围组件互连总线(peripheral component interconnect express，PCIe)链路通信连接。

在一些实施例中，所述方法还包括：对所述PCIe链路进行链路异常检测，来确定是否发生与所述第一节点相关的异常事件。

在一些实施例中，所述对所述PCIe链路进行链路异常检测，包括：

对所述PCIe链路进行轮询机制检测和/或中断检测机制检测，当检测到所述PCIe链路异常时，确定发生了与所述第一节点相关的异常事件。

其中，由于网卡与第一节点之间通过PCIe链路通信连接，而PCIe链路的数据传输速率较高，因此网卡能够通过PCIe链路，快速检测到与第一节点相关的异常事件。例如，若网卡检测到PCIe链路断开，或者网卡通过PCIe链路接收到了错包，等等，则网卡认为第一节点有很大可能发生了异常事件，本申请不限于此。

在一些实施例中，所述网卡向主机发送通知消息，包括下述任一项：

所述网卡通过传输层向所述主机发送所述通知消息；

所述网卡通过应用层向所述主机发送所述通知消息。

通过上述方式，网卡能够通过传输层或应用层快速向主机发送通知消息，进而降低主机切换路径的时延。

在一些实施例中，所述方法还包括：

从所述网卡的管理队列信息中获取所述路径状态信息，所述管理队列信息中的所述路径状态信息由所述第一节点根据所述主机下发的第一命令配置，所述第一命令携带所述路径状态信息，所述第一命令指示在检测到与所述第一节点相关的异常事件的情况下，向所述主机发送所述通知消息。

通过上述方式，网卡的管理队列信息中配置有路径状态信息，第一命令是一种异步事件请求命令，从而网卡能够在检测到与第一节点相关的异常事件的情况下，主动向主机发送通知消息。

在一些实施例中，所述方法还包括：

从所述网卡的输入输出队列上下文中获取所述路径状态信息，所述输入输出队列上下文中的所述路径状态信息由所述第一节点根据所述主机下发的第二命令配置，所述第二命令指示基于所述主机的操作系统类型，生成所述路径状态信息，将所述路径状态信息配置于所述输入输出队列上下文中。

在一些实施例中，所述方法还包括：

接收所述主机下发的第三命令，所述第三命令为读命令或写命令，所述第三命令指示在检测到与所述第一节点相关的异常事件的情况下，向所述主机发送所述通知消息。

通过上述方式，网卡的输入输出队列上下文中配置有路径状态信息，从而网卡能够在检测到与第一节点相关的异常事件，且接收到主机下发的第三命令的情况下，向主机发送通知消息，以便主机进行路径切换，这一过程能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。

第二方面，本申请实施例提供了一种节点异常事件的处理方法，应用于主机，所述主机与存储设备的网卡通信连接，所述存储设备包括所述网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述方法包括：

接收所述网卡在检测到与所述第一节点相关的异常事件的情况下发送的通知消息，所述通知消息指示所述第一节点所在的路径发生异常；

基于所述通知消息，通过所述多个节点中所述第一节点以外的节点所在的路径访问所述存储器。

在一些实施例中，所述主机接收所述网卡在检测到与所述第一节点相关的异常事件的情况下发送的通知消息，包括下述任一项：

所述主机通过传输层接收所述通知消息；

所述主机通过应用层接收所述通知消息；

在一些实施例中，所述方法还包括：

向所述第一节点下发第一命令，以使所述第一节点将所述第一命令携带的所述路径状态信息配置于所述管理队列信息中，所述第一命令指示在检测到与所述第一节点相关的异常事件的情况下，向所述主机发送所述通知消息。

在一些实施例中，所述方法还包括：

向所述第一节点下发第二命令，以使所述第一节点根据所述第二命令的指示，基于所述主机的操作系统类型，生成所述路径状态信息，将所述路径状态信息配置于所述输入输出队列上下文中。

在一些实施例中，所述方法还包括：

向所述网卡下发第三命令，所述第三命令为读命令或写命令，所述第三命令指示在检测到与所述第一节点相关的异常事件的情况下，向所述主机发送所述通知消息。

第三方面，本申请实施例提供了一种节点异常事件的处理装置，所述装置配置于存储设备中的网卡，所述存储设备包括所述网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述装置包括至少一个功能单元，用于执行如前述第一方面或第一方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。

第四方面，本申请实施例提供了一种节点异常事件的处理装置，所述装置配置于主机，所述主机与存储设备的网卡通信连接，所述存储设备包括所述网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述装置包括至少一个功能单元，用于执行如前述第二方面或第二方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。

第五方面，本申请实施例提供了一种网卡，所述网卡配置于存储设备，所述网卡包括处理器、存储器和接口，所述接口用于与所述存储设备中的节点通信连接，所述存储器用于存储至少一段程序代码，所述至少一段程序代码由所述处理器加载并实现如前述第一方面或第一方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。

第六方面，本申请实施例提供了一种存储集群，所述存储集群包括网卡、多个节点以及存储器，所述网卡与所述节点通信连接，所述节点用于管理所述存储器，所述网卡用于执行如前述第一方面或第一方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。

在一些实施例中，所述存储集群是集中式存储设备，所述节点是存储控制器，所述网卡与所述节点通过系统总线连接，所述存储器与所述节点通过系统总线连接。

在另一些实施例中，所述存储集群是分布式存储系统，所述分布式存储系统包括多个独立的存储设备，各个所述存储设备之间通过有线网络或者无线网络连接，组成存储网络；其中，每个所述存储设备包括所述网卡、所述节点以及所述存储器，所述网卡与所述节点通过系统总线连接，所述存储器与所述节点通过系统总线连接；或者，每个所述存储设备包括所述网卡和所述节点，所述存储器与每个所述存储设备中的所述节点之间通信连接。

第七方面，本申请实施例提供了一种主机，所述主机包括处理器和存储器，所述处理器用于执行所述存储器中存储的指令，以使所述主机执行如前述第二方面或第二方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。

第八方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质用于存储至少一段程序代码，该至少一段程序代码用于实现前述第一方面或第一方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。或者，该至少一段程序代码用于实现如前述第二方面或第二方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。该存储介质包括但不限于易失性存储器，例如随机访问存储器，非易失性存储器，例如快闪存储器、硬盘(hard disk drive，HDD)、固态硬盘(solid state drive，SSD)。

第九方面，本申请实施例提供了一种计算机程序产品，当该计算机程序产品在存储设备上运行时，使得该存储设备实现前述第一方面或第一方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。或者，当该计算机程序产品在主机上运行时，使得该主机实现前述第二方面或第二方面的任意一种可能的实现方式所提供的节点异常事件的处理方法。该计算机程序产品可以为一个软件安装包，在需要实现前述方法的情况下，可以下载该计算机程序产品并执行该计算机程序产品。

附图说明

图1是本申请实施例提供的一种存储架构的示意图；

图2是本申请实施例提供的一种实施环境的示意图；

图3是本申请实施例提供的另一种实施环境的示意图；

图4是本申请实施例提供的一种主机的结构示意图；

图5是本申请实施例提供的一种存储设备的结构示意图；

图6是本申请实施例提供的一种分布式存储系统的结构示意图；

图7是本申请实施例提供的一种网卡的逻辑单元示意图；

图8是本申请实施例提供的一种节点异常事件的处理方法；

图9是本申请实施例提供的另一种节点异常事件的处理方法；

图10是本申请实施例提供的另一种节点异常事件的处理方法；

图11是本申请实施例提供的一种节点异常事件的处理方法的示意图；

图12是本申请实施例提供的另一种节点异常事件的处理方法的示意图；

图13是本申请实施例提供的一种节点异常事件的处理装置的结构示意图；

图14是本申请实施例提供的另一种节点异常事件的处理装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

为方便理解，下面先对本申请涉及的关键术语和关键概念进行说明。

NVMe，是一组允许固态硬盘(solid state disk，SSD)使用外围组件互连总线(PCI express，PCIe)的软硬件标准；而PCIe是实际的物理连接通道。NVM代表非易失性存储器(non-volatile memory)，是SSD的常见的闪存形式。NVMe主要是为基于闪存的存储设备提供一个低延时、内部并发化的原生界面规范，也为现代中央处理器(central processing unit，CPU)、电脑平台及相关应用提供原生存储并发化的支持，令主机(host)硬件和软件可以充分利用固态存储设备的并行化存储能力。

NVMe命令，是指NVMe协议定义的命令。NVMe协议中命令分为管理(administrator，Admin)命令与输入/输出(input/output，I/O)命令，在一些实施例中，I/O命令也称NVM命令。其中，Admin命令用于管理和控制NVMe存储介质。I/O命令用于传输数据。示意性地，NVMe协议中I/O命令包括NVMe读命令和NVMe写命令。

队列对(queue pair，QP)，是指一对用来承载NVMe命令的队列对，由一个提交队列(submission queue，SQ)和一个完成队列(completion queue，CQ)组成。示意性地，主机通过SQ提交命令给NVMe节点(控制器)，NVMe控制器提交完成状态到CQ。

NVMe-oF规范，是一种建立在NVMe协议的基础之上的高速存储协议，NVMe-oF用于跨网络访问NVMe存储介质。NVMe-oF在NVMe的基础上增加了fabric相关的命令，使得NVMe的应用场景不局限于一个设备内部，而是能扩展到跨网络通信。其中，所谓“fabric”，就是指主机与存储介质之间的网络。fabric的典型形态例如为以太网、光纤通道、无限带宽(InfiniBand，IB)、远程直接内存访问(remote direct memory access，RDMA)等。比如使用基于融合以太网的RDMA(RDMA over converged ethernet，RoCE)实现fabric，本申请不限于此。

RDMA，是一种绕过远端设备的操作系统内核来访问远端设备的内存的技术。由于RDMA技术通常无需经过操作系统，从而不仅节省了大量CPU资源，还提高了吞吐量，降低了网络通信延迟。

命名空间(namespace)，是一种可以被主机直接访问的格式化数量的非易失性内存，也可以理解为是一种存储空间。在一些实施例中，namespace对主机呈现就是一块真实的物理盘，比如一块SSD盘包括两个namespace，那么主机就能访问两块物理盘，并且可以分别对它们进行格式化和分区。

下面对本申请涉及的应用场景和实施环境进行介绍。

本申请实施例提供的技术方案能够应用于基于NVMe-oF的存储架构中，能够提升存储业务的连续性和可靠性。下面参考图1，对本申请涉及的应用场景进行介绍。

图1是本申请实施例提供的一种存储架构的示意图。如图1所示，该存储架构包括主机(host)、交换机以及基于NVMe-oF的存储设备，该存储设备采用双节点架构来实现主机对该存储设备中存储器的访问。其中，该存储设备包括网卡(network interface card，NIC)、节点A(node A)、节点B(node B)以及存储器，存储器中的数据可以通过命名空间(namespace)进行索引，网卡与节点之间通过PCIe链路通信连接。示意性地，主机1能够通过存储设备中节点A和节点B所在的4条冗余路径来访问存储器，在主机1通过节点A所在的路径访问存储器的情况下，节点A发生异常事件后(如节点故障、升级或重启等)，主机1可以切换到节点B所在的路径，通过节点B所在的路径来访问存储器，实现存储业务的连续性。相关技术中，主机1与节点A之间会建立心跳连接，主机1通过该心跳连接来检测节点A是否发生异常事件，在检测到节点A发生异常事件的情况下，切换到节点B所在的路径，通过节点B所在的路径来访问存储器。然而，上述方法依赖于心跳超时机制，使得节点发生异常后主机成功切换路径的耗时较长，导致切换期间业务跌零的时间较长，从而影响存储业务的可靠性和连续性。

基于上述图1所示的应用场景，本申请提供了一种节点异常事件的处理方法，能够在检测到与存储设备中节点相关的异常事件的情况下(或者说节点复位场景下)，降低主机切换路径的时延，提升存储业务的连续性和可靠性。

下面参考图2和图3，对本申请涉及的实施环境进行介绍。

图2是本申请实施例提供的一种实施环境的示意图。如图2所示，该实施环境包括主机100和存储设备200，存储设备200包括网卡201、多个节点202以及存储器203，主机100和存储设备200之间通过有线网络或无线网络直接或间接地连接。应理解，图1和图2都是集中式存储设备(或者说存储阵列)，例如存储区域网络(storage area network，SAN)，示意性地，节点202是存储控制器(controller)，存储器203是持久化存储介质，例如硬盘驱动HDD或者固态硬盘SSD等，本申请不限于此，存储设备200也可以理解为是一种包括多个节点202(也即存储控制器)的存储集群。

主机100是指用于运行存储业务的设备，例如是运行RoCE业务的设备，对此不作限定。示意性地，主机100通过访问存储设备200来运行存储业务。在本申请实施例中，主机100具备路径切换能力，能够从一条路径切换至另一条路径来访问存储设备200，以提升存储业务的连续性和可靠性。例如，主机100为运行有客户端的终端设备或者服务器等，本申请不限于此。示意性地，主机100的协议栈包括：文件系统(filesystem)、块输入/输出(block I/O)、小型计算机系统接口(small computer system interface，SCSI)、NVMe、驱动(driver)以及物理装置(physical devices)等，本申请不限于此。另外，主机100的数量可以是一个或多个，本申请对此不作限定。

存储设备200用于为主机100提供可访问的存储空间，如提供针对磁盘空间的读写访问等。在本申请实施例中，存储设备200包括网卡201、多个节点202以及存储器203。其中，网卡201与节点202之间通过系统总线(如PCIe链路)连接，存储器203与节点202之间通过系统总线连接。其中，节点202也即是存储设备的存储控制器(controller)，能够处理主机下发的命令，对存储器203进行管理，等等。应理解，图中所示的网卡201和节点202的数量，以及网卡201与节点202之间的连接关系仅为示意性说明，一个网卡可以连接一个或多个节点，一个节点也可以连接一个或多个网卡，本申请对此不作限定。在本申请实施例中，网卡201具备针对与节点202相关的异常事件的处理能力，包括针对与节点202相关的异常事件的检测能力以及向主机100通知异常事件的能力。例如，以网卡201与多个节点202中的第一节点通信连接为例，该网卡201能够在检测到与第一节点相关的异常事件的情况下，向主机100发送通知消息，告知主机100第一节点所在的路径发生异常，使得主机100通过多个节点202中第一节点以外的节点所在的路径访问存储器203。

在一些实施例中，该实施环境还包括交换机300，主机100可以通过该交换机300的中转来访问存储设备200，本申请不限于此，应理解，交换机300为可选设备，主机100也可以直接访问存储设备200。

在一些实施例中，上述无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也能够是任何网络，包括但不限于局域网(local area network，LAN)、城域网(metropolitan area network，MAN)、广域网(wide area network，WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实现方式中，使用包括超级文本标记语言(hyper text markup language，HTML)、可扩展标记语言(extensible markup language，XML)等的技术和/或格式来代表通过网络交换的数据。此外还能够使用诸如安全套接字层(secure socket layer，SSL)、传输层安全(transport layer security，TLS)、虚拟专用网络(virtual private network，VPN)、网际协议安全(internet protocol security，IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中，还能够使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

在上述图2所示的实施环境中，存储设备200包括多个节点202，从而主机100能够通过多条路径访问存储设备200。应理解，本申请对于存储设备200的数量不作限定，在存储设备200的数量为多个的情况下，同样适用于本申请提供的节点异常事件的处理方法。下面参考图3所示的分布式架构对这一情况进行介绍。

图3是本申请实施例提供的另一种实施环境的示意图，如图3所示，该实施环境包括主机100和分布式存储系统400，主机100和分布式存储系统400之间通过有线网络或无线网络直接或间接地连接。示意性地，该分布式存储系统400是一种包括多个独立的存储设备200的存储集群，各个存储设备200之间通过有线网络或者无线网络连接，组成存储网络。

主机100通过访问分布式存储系统400来运行存储业务。其中，主机100具备路径切换能力，能够从一个存储设备200切换至另一个存储设备200来运行存储业务，以提升存储业务的连续性和可靠性。主机100的数量可以是一个或多个，本申请对此不作限定。

分布式存储系统400用于为主机100提供可访问的存储空间，如提供针对磁盘空间的读写访问等。示意性地，每个存储设备200包括网卡201、至少一个节点202以及存储器203。其中，每个存储设备200中，网卡201与节点202之间通过系统总线(如PCIe链路)连接，存储器203与节点202之间通过系统总线连接。节点202用于管理存储器203。应理解，图中所示的网卡201和节点202的数量，以及网卡201与节点202之间的连接关系仅为示意性说明，一个网卡可以连接一个或多个节点，一个节点也可以连接一个或多个网卡，本申请对此不作限定。

在一些实施例中，第一网卡和第一节点位于第一存储设备，被主机选择的其他节点位于第二存储设备。其中，被主机选择的其他节点也即是主机切换路径所选择的节点。例如，主机100在访问第一存储设备的情况下，第一网卡检测到与第一节点相关的异常事件，第一网卡向主机100发送通知消息，告知主机100该第一节点所在的路径发生异常，使得主机100访问第二存储设备来运行存储业务(应理解，分布式存储系统400中各个节点202的组合同理于上述图2所示实施环境中的多个节点202，在此不再赘述)。

在一些实施例中，该实施环境还包括交换机300，与上述图2所示实施环境同理，故不再赘述。在一些实施例中，上述无线网络或有线网络使用标准通信技术和/或协议，与上述图2所示实施环境同理，故不再赘述。

需要说明的是，上述图3所示仅为本申请提供的分布式架构的一种形态，在另一些实施例中，在本申请提供的分布式存储系统中，每个存储设备包括网卡和节点，该分布式存储系统的存储器与每个存储设备中的节点之间通信连接。也即是说，分布式存储系统的存储器可以位于存储设备内部，也可以位于存储设备外部。另外，本申请对于分布式存储系统中存储器的数量不作限定，存储器的数量可以是一个，也可以是多个，能够根据实际需求进行配置，在此不再赘述。

下面对上述实施环境涉及设备的硬件结构进行介绍。

图4是本申请实施例提供的一种主机的结构示意图。如图4所示，该主机100包括存储器101、处理器102、通信接口103以及总线104。其中，存储器101、处理器102、通信接口103通过总线104实现彼此之间的通信连接。

存储器101可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其它类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其它类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。示意性地，存储器101用于存储至少一段程序代码，当存储器101中存储的程序代码被处理器102执行时，处理器102和通信接口103用于执行下述节点异常事件的处理方法中主机所涉及的步骤。

处理器102可以是网络处理器(network processor，NP)、中央处理器(central processing unit，CPU)、特定应用集成电路(application-specific integrated circuit，ASIC)或用于控制本申请方案程序执行的集成电路。该处理器102可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。该处理器102的数量可以是一个，也可以是多个。其中，存储器101和处理器102可以分离设置，也可以集成在一起。

通信接口103使用例如收发器一类的收发模块，来实现主机100与其他设备或通信网络之间的通信。例如，可以通过通信接口103向存储设备200下发命令，又例如，接收存储设备200发送的通知消息等，本申请不限于此。

总线104可包括在主机100各个部件(例如，存储器101、处理器102、通信接口103)之间传送信息的通路。

图5是本申请实施例提供的一种存储设备的结构示意图。如图5所示，该存储设备200是一种基于NVMe-oF的集中式存储设备，包括网卡201、多个节点202、存储器203以及总线204。其中，网卡201、多个节点202以及存储器203通过总线204实现彼此之间的通信连接。

网卡201用于实现存储设备200与其他设备或通信网络之间的通信。例如，存储设备200可以通过网卡201向主机100发送通知消息。在本申请实施例中，网卡201具备针对与节点相关的异常事件的处理能力，包括针对与节点相关的异常事件的检测能力以及向主机100通知异常事件的能力。其中，网卡201包括处理器2011、存储器2012和接口2013，该接口2013用于与至少一个节点202通信连接，存储器2012用于存储至少一段程序代码，该至少一段程序代码由处理器2011加载并实现下述节点异常事件的处理方法中网卡所涉及的步骤。其中，该处理器2011可以是NPU、CPU等。另外，该处理器2011可以是一个单核处理器(single-CPU)，也可以是一个多核处理器(multi-CPU，MPU)，本申请不限于此。在一些实施例中，网卡201为RDMA网卡(RNIC)或者其他智能网卡(smart NIC)，本申请不限于此。

节点202用于管理存储器203，处理主机100发送的命令。例如，节点202根据主机100发送的I/O命令，向存储器203中写入数据或者从存储器203中读取数据等，本申请不限于此。在实际应用中，节点202可具有多种形态。示意性地，节点202是处理NVMe-oF协议的主体。例如，节点202包括CPU和内存，CPU用于执行地址转换以及读写数据等操作，内存用于临时存储将要写入存储器203的数据，或者从存储器203读取出来将要发送给主机100的数据，本申请不限于此。

存储器203包括至少一个固态硬盘SSD，用于存储数据。其中，SSD是一种主要以闪存作为永久性存储的存储器。

总线204可包括在存储设备200各个部件(例如，网卡201、多个节点202、存储器203)之间传送信息的通路。

图6是本申请实施例提供的一种分布式存储系统的结构示意图。如图6所示，该分布式存储系统400包括多个独立的存储设备200，每个存储设备包括网卡201、至少一个节点202以及存储器203，每个存储设备200中，网卡201与节点202之间通过系统总线连接，存储器203与节点202之间通过系统总线连接。节点202用于管理存储器203。各个存储设备200之间通过网络连接，其中，该网络可以是广域网或局域网等等，本申请不限于此。具体地，通过各个存储设备200的网卡201与该网络连接。需要说明的是，图6所示的存储集群中任一个存储设备200的结构与前述图5所示的存储设备同理，故在此不再赘述。需要说明的是，基于上述对图3的介绍可知，本申请对于分布式存储系统中存储器所处的位置以及存储器的数量均不作限定，也即是，图6所示仅为本申请提供的分布式存储系统的其中一种形态，并不构成对本申请的限定，在此不再赘述。

下面通过几个方法实施例，对本申请提供的节点异常事件的处理方法进行介绍。

基于上述对存储设备200的介绍可知，存储设备200的网卡201具备针对与节点202相关的异常事件的处理能力，包括针对与节点202相关的异常事件的检测能力以及向主机100通知异常事件的能力。下面参考图7，以逻辑层面为例，对存储设备200的网卡201所具备的能力进行介绍。

图7是本申请实施例提供的一种网卡的逻辑单元示意图。如图7所示，网卡与多个节点中的第一节点之间通过PCIe链路通信连接，网卡上部署有故障反射器，该故障反射器由网卡的处理器来运行，用于提供针对与节点相关的异常事件的处理能力。其中，该故障反射器包括检测逻辑单元和执行逻辑单元，该检测逻辑单元用于检测与第一节点相关的异常事件，在检测到与第一节点相关的异常事件的情况下，通知执行逻辑单元。示意性地，检测逻辑单元可以采用接口调用或芯片内部的其他消息通信方法来通知执行逻辑单元，对此不作限定。例如，该检测逻辑单元由CPU或MPU执行，本申请不限于此。该执行逻辑单元用于根据检测逻辑单元的通知，执行向主机100发送通知消息的步骤，以通知主机100第一节点所在的路径发生异常。例如，该执行逻辑单元由CPU或NPU执行，本申请不限于此。

基于此，下面通过几个方法实施例，以主机100与存储设备200之间的交互为例，来对本申请提供的节点异常事件的处理方法进行介绍。

图8是本申请实施例提供的一种节点异常事件的处理方法。如图8所示，以主机100与存储设备200之间的交互为例进行介绍，该方法包括下述步骤801至步骤805。

801、主机通过存储设备的网卡，与存储设备的多个节点中的第一节点建立通信连接。

在本申请实施例中，该存储设备包括多个节点，该第一节点为多个节点中任一个节点，其中，节点也称为存储控制器。存储设备的网卡与第一节点通信连接。主机通过该网卡，向该第一节点发送通信连接请求，第一节点根据接收到的通信连接请求，与主机建立通信连接，从而主机能够通过第一节点所在的路径来访问存储器。

示意性地，主机与第一节点之间基于NVMe协议建立NVMe连接，从而主机能够向第一节点下发NVMe命令，NVMe命令包括管理命令和输入/输出命令。在一些实施例中，存储设备的网卡为RNIC，主机与第一节点之间能够基于RDMA协议建立RDMA连接，从而主机能够向第一节点下发RDMA命令，实现RDMA功能，不仅节省了大量CPU资源，还提高了吞吐量，降低了网络通信延迟。

802、存储设备的网卡检测与第一节点相关的异常事件。

在本申请实施例中，存储设备的网卡对网卡与第一节点之间的PCIe链路进行链路异常检测，来确定是否发生与第一节点相关的异常事件。其中，与第一节点相关的异常事件可以是第一节点自身发生的异常事件，例如第一节点故障、重启等，也可以是网卡与第一节点之间的PCIe链路发生的异常事件，例如PCIe链路断开等，本申请不限于此。应理解，网卡可以通过PCIe链路异常，推测第一节点发生异常事件。例如，若网卡检测到PCIe链路断开，或者网卡通过PCIe链路接收到了错包，等等，则网卡认为第一节点有很大可能发生了异常事件，本申请不限于此。另外，由于网卡与第一节点之间通过PCIe链路通信连接，而PCIe链路的数据传输速率较高，因此网卡能够通过PCIe链路，快速检测到与第一节点相关的异常事件。

在一些实施例中，网卡对PCIe链路进行轮询机制检测和/或中断检测机制检测，当检测到PCIe链路异常时，确定发生了与第一节点相关的异常事件。其中，轮询机制是指网卡以轮询的方式，监控网卡的外接设备的运行状态。中断检测机制是指网卡的外接设备在发生异常事件的情况下，会主动上报中断信号给网卡，以便网卡获知该外接设备发生异常事件。

当然，网卡还能够采用其他方式来检测与第一节点相关的异常事件，例如，网卡与第一节点之间建立心跳连接，通过该心跳连接检测与第一节点相关的异常事件，等等，本申请不限于此。

803、存储设备的网卡在检测到与第一节点相关的异常事件的情况下，向主机发送通知消息，该通知消息指示该第一节点所在的路径发生异常。

在本申请实施例中，存储设备的网卡在检测到第一节点发生异常事件的情况下，基于在网卡中预先配置的信息，生成通知消息，向主机发送该通知消息。其中，该通知消息包括路径状态信息，该路径状态信息指示第一节点所在的路径发生异常。

另外，在本步骤中，网卡向主机发送通知消息包括以下至少一种方式：

第一种、网卡在检测到与第一节点相关的异常事件的情况下，主动生成通知消息，向主机发送该通知消息。

第二种、网卡在检测到与第一节点相关的异常事件，且网卡接收到主机发送的读命令或写命令的情况下，主动生成通知消息，向主机发送该通知消息。

通过上述方式，网卡能够在检测到与第一节点相关的异常事件的情况下，主动通知主机，以使主机通过多个节点中第一节点以外的节点所在的路径来访问存储器。需要说明的是，上述两种发送通知消息的方式会在后续实施例中进行详细介绍，在此不再赘述。

经过上述步骤802和步骤803，存储设备的网卡能够检测与第一节点相关的异常事件，并在检测到与第一节点相关的异常事件的情况下，主动通知主机。其中，网卡可以周期性检测与第一节点相关的异常事件，也可以持续检测与第一节点相关异常事件，本申请不限于此。另外，结合前述图7的介绍可知，存储设备的网卡上部署有故障反射器，能够提供针对与节点相关的异常事件的处理功能。相应地，上述步骤802可以由故障反射器中的检测逻辑单元执行，上述步骤803可以由故障反射器中的执行检测单元执行。

804、主机接收该通知消息。

805、主机基于该通知消息，通过多个节点中第一节点以外的节点所在的路径访问存储器。

在本申请实施例中，主机从该通知消息中获取到路径状态信息，由于该路径状态信息指示第一节点所在的路径发生异常，从而主机获知到通过该第一节点所在的路径很有可能无法访问到存储器，故主机通过多个节点中第一节点以外的节点所在的路径来访问存储器，实现存储业务的连续性。

在上述节点异常事件的处理方法中，存储设备的网卡与第一节点通信连接，能够在检测到与该第一节点相关的异常事件的情况下，及时向主机发送通知消息，告知主机该第一节点所在的路径发生异常，便于主机进行路径切换，这种方式能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。

基于上述图8所示实施例可知，存储设备的网卡向主机发送通知消息包括至少一种方式，下面分别通过图9和图10所示实施例，对上述涉及的两种方式分别进行介绍。

图9是本申请实施例提供的另一种节点异常事件的处理方法。如图9所示，以主机100与存储设备200之间的交互为例进行介绍，该方法包括下述步骤901至步骤909。

901、主机通过存储设备的网卡，与存储设备的多个节点中的第一节点建立通信连接。

其中，本步骤与前述图8所示实施例中步骤801同理，故不再赘述。

902、主机向第一节点下发第一命令，该第一命令携带路径状态信息，该第一命令指示在检测到与第一节点相关的异常事件的情况下，向主机发送通知消息。

其中，第一命令为管理命令，主机通过管理队列(admin queue)向第一节点下发第一命令，管理队列用于存放NVMe管理命令。示意性地，该第一命令为异步事件请求(asynchronous event request，AER)命令。其中，AER命令是一种异步命令，用于在某些事件发生时，通知主机关于状态、错误、健康信息等，也即是，主机不要求立即报告完成该AER命令，而是在发生异常事件的情况下再报告完成。应理解，主机能够向节点下发至少一个AER命令来使能节点报告异步事件，这个命令不设置超时时间，在有异步事件需要报告给主机时，节点产生一个完成队列条目(completion queue entry，CQE)信息，将该CQE信息发送给主机的完成队列(completion queue，CQ)。

其中，该路径状态信息能够根据实际需求进行配置，本申请对此不作限定。例如，该路径状态信息为03h，其详细定义参考下述表1(应理解，下述表1所示仅为针对路径状态信息的一种示意性说明，相关协议中其他类似能够指示路径状态信息的字段同理能够应用于本申请中，本申请不限于此)。在一些实施例中，该第一命令还携带第一命令的命令标识，本申请不限于此。

表1异步事件信息(asynchronous event information)-错误状态(error status)

903、第一节点接收主机下发的第一命令。

904、第一节点将该第一命令携带的路径状态信息配置于网卡的管理队列信息中。

其中，管理队列信息为网卡所维护的信息，存储于网卡上。第一节点对接收到的第一命令进行解析，得到路径状态信息，调用网卡提供的预置接口，将该路径状态信息配置于管理队列信息中，以便后续在检测到第一节点发生异常事件的情况下，从该管理队列信息中获取路径状态信息，完成第一命令。另外，基于前述步骤902可知，第一命令还包括第一命令的命令标识，可以将第一命令所携带的相关信息统称为第一预置信息，在本步骤中，第一节点能够根据接收到的第一命令，将第一预置信息配置于管理队列信息中。应理解，管理队列信息是一种与管理队列相关的上下文信息，因此该管理队列信息的生命周期与管理队列的生命周期一致。

在一些实施例中，第一节点在第一命令是主机下发的第n个AER命令的情况下，将该路径状态信息配置于管理队列信息中。其中，n为正整数，例如，n为1，即第一命令为主机下发的第一个AER命令，本申请不限于此，能够根据实际需求进行设置。需要说明的是，主机向第一节点下发AER命令的数量有限，或者说第一节点能够处理的AER事件的数量有限，上述过程可以理解为第一节点将某一个AER命令转由网卡来处理，也即是，通过预先设置第一节点将哪个AER命令转由网卡处理，使能网卡报告异步事件。

经过上述步骤902至步骤904，主机通过向第一节点下发第一命令的方式，使得第一节点将路径状态信息配置于网卡的管理队列信息中，从而网卡能够在检测到与第一节点相关的异常事件的情况下，向主机发送相应通知消息。

905、存储设备的网卡检测与第一节点相关的异常事件。

其中，本步骤与前述图8所示实施例中步骤802同理，故不再赘述。

906、存储设备的网卡在检测到与第一节点相关的异常事件的情况下，从网卡的管理队列信息获取路径状态信息，生成通知消息。

其中，基于前述步骤904可知，管理队列信息中预先配置的信息包括路径状态信息，还可以包括第一命令的命令标识，相应地，网卡生成的通知消息包括路径状态信息，还可以包括第一命令的命令标识，在此不再赘述。

下面以通知消息为CQE信息为例，对该通知消息的具体内容进行举例说明，示意性地，该通知消息包括下述内容：

1.DW0：错误状态(error status)包括内置错误状态03h(即路径状态信息，通过驱动和网卡的接口参数指定预配置，参考前述步骤902)；

2.DW1：保留(reserve)：00；

3.DW2：提交队列标识符(submission queue identifier)：0(通过驱动和网卡的接口参数指定预配置，参考前述步骤902)；提交队列头指针(submission queue head pointer，SQHD)：0(通过驱动和网卡的接口参数指定预配置，参考前述步骤902)；

4.DW3：命令标识：对第一命令进行解析得到(通过驱动和网卡的接口参数指定预配置)。

应理解，由于通知消息的作用在于通知主机第一节点所在路径发生异常，故通知消息中除路径状态信息之外的信息为可选信息，能够根据需求进行配置，本申请并不限于上述举例所示内容。例如，根据命令状态域(status field)的状态字段来定义CQE中指示的命令的状态，本申请并不限于上述举例所示内容。

907、存储设备的网卡向主机发送通知消息，该通知消息指示该第一节点所在的路径发生异常。

其中，网卡通过传输层(transport layer)向主机发送该通知消息。例如，该通知消息为基于RDMA的连接管理(communication manager，CM)报文，本申请不限于此。

908、主机接收该通知消息。

909、主机基于该通知消息，通过多个节点中第一节点以外的节点所在的路径访问存储器。

其中，上述步骤907至步骤909与前述图8所示实施例中步骤803至步骤805同理，故不再赘述。

在上述节点异常事件的处理方法中，网卡的管理队列信息中配置有路径状态信息，从而网卡能够在检测到与第一节点相关的异常事件的情况下，主动向主机发送通知消息，以便主机进行路径切换，这一过程能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。

图10是本申请实施例提供的另一种节点异常事件的处理方法。如图10所示，以主机100与存储设备200之间的交互为例进行介绍，该方法包括下述步骤1001至步骤1011。

1001、主机通过存储设备的网卡，与存储设备的多个节点中的第一节点建立通信连接。

1002、主机向第一节点下发第二命令，该第二命令指示基于主机的操作系统类型，生成路径状态信息，将该路径状态信息配置于网卡的输入输出队列上下文中。

其中，该第二命令为管理命令，主机通过管理队列向第一节点下发第二命令。其中，输入输出队列上下文为网卡所维护的信息，存储于网卡上，是一种与输入输出队列相关的上下文信息，该输入输出队列用于存放NVMe I/O命令。

1003、第一节点接收主机下发的第二命令。

1004、第一节点根据第二命令的指示，基于主机的操作系统类型，生成路径状态信息，将路径状态信息配置于输入输出队列上下文中。

其中，第一节点对接收到第二命令进行解析，根据第二命令的指示，基于主机的操作系统类型，生成路径状态信息，调用网卡提供的预置接口，将该路径状态信息配置于输入输出队列上下文中，以便网卡基于该输入输出队列上下文，响应主机下发的I/O命令。应理解，由于输入输出队列上下文是一种与输入输出队列相关的上下文信息，因此该输入输出队列上下文的生命周期与输入输出队列的生命周期一致。在一些实施例中，可以将本步骤生成的路径状态信息称为第二预置信息。

其中，该路径状态信息能够根据实际需求进行配置，本申请对此不作限定。例如，路径状态信息为0×360h，其中，0×3指示路径错误(其详细定义参考下述表2，应理解，下述表2所示仅为针对路径状态信息的一种示意性说明，相关协议中其他类似能够指示路径状态信息的字段同理能够应用于本申请中，本申请不限于此)，0×60指示节点检测到路径错误，本申请不限于此。需要说明的是，上述路径状态信息的具体含义仅为举例说明，并不构成对本申请的限定。

表2状态码(status code)-状态码类型值(status code type values)

经过上述步骤1002至步骤1004，主机通过向第一节点下发第二命令的方式，使得第一节点将路径状态信息配置于网卡的输入输出队列上下文中，从而网卡能够在检测到与第一节点相关的异常事件，且接收到主机下发的I/O命令的情况下，向主机发送相应通知消息。

1005、存储设备的网卡检测与第一节点相关的异常事件。

1006、主机向网卡下发第三命令，该第三命令为读命令或写命令，该第三命令指示在检测到与第一节点相关的异常事件的情况下，向主机发送通知消息。

其中，主机通过输入输出队列向第一节点下发第三命令，由网卡拦截，该第三命令也即是I/O命令。

1007、存储设备的网卡接收该第三命令。

1008、存储设备的网卡在检测到与第一节点相关的异常事件的情况下，从输入输出队列上下文获取路径状态信息，生成通知消息。

在一些实施例中，该通知消息还包括第三命令的命令标识，本申请不限于此。

1.DW0：命令特定(command specific)：0(通过驱动和网卡的接口参数指定预配置，参考前述步骤1004，支持操作系统差异化预配置)；

2.DW1：命令特定(command specific)：0(通过驱动和网卡的接口参数指定预配置，参考前述步骤1004，支持操作系统差异化预配置)；

3.DW2：提交队列标识符(submission queue identifier)：由网卡从第三命令中解析得到(如基于第三命令的基本传输头的队列对序号转换得到，具体转换方式不作限定，能够根据需求进行设置)；提交队列头指针(submission queue head pointer，SQHD)：动态生成，例如为0，本申请不限于此；

4.DW3：路径状态信息：0×360h(通过驱动和网卡的接口参数指定预配置，参考前述步骤1004，支持操作系统差异化预配置)；命令标识：对第三命令进行解析得到。

应理解，由于通知消息的作用在于通知主机第一节点所在路径发生异常，故通知消息中除路径状态信息之外的信息为可选信息，能够根据需求进行配置，本申请并不限于上述举例所示内容。

1009、存储设备的网卡向主机发送通知消息，该通知消息指示该第一节点所在的路径发生异常。

其中，网卡通过应用层(application layer)向主机发送该通知消息。例如，该通知消息为NVMe封装报文，本申请不限于此。

1010、主机接收该通知消息。

1011、主机基于该通知消息，通过多个节点中第一节点以外的节点所在的路径访问存储器。

其中，上述步骤1009至步骤1011与前述图8所示实施例中步骤803至步骤805同理，故不再赘述。

在上述节点异常事件的处理方法中，网卡的输入输出队列上下文中配置有路径状态信息，从而网卡能够在检测到与第一节点相关的异常事件，且接收到主机下发的第三命令的情况下，向主机发送通知消息，以便主机进行路径切换，这一过程能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。

基于上述图9和图10所示实施例，对网卡向主机发送通知消息所涉及的两种方式进行了介绍，应理解，上述图9和图10所示实施例可以结合，即，网卡在检测到与第一节点相关的异常事件的情况下，既能够主动向主机上报AER完成事件，又能够在接收到第三命令的情况下，向主机返回I/O响应，具体过程与前述图9和图10所示实施例同理，故不再赘述。

下面参考图11和图12，以结合上述图9和图10所示实施例为例，对本申请提供的节点异常事件的处理方法进行举例说明。

图11是本申请实施例提供的一种节点异常事件的处理方法的示意图。如图11所示，主机通过存储设备的网卡，与存储设备的多个节点中的第一节点建立通信连接，创建管理队列和输入输出队列，其中，通信连接包括NVMe连接和RDMA连接。接着，主机通过管理队列向第一节点下发第一命令，第一节点接收该第一命令，对该第一命令进行解析，得到第一预置信息，调用网卡提供的预置接口，将该第一预置信息配置于管理队列信息中(第一预置信息参考上述步骤904)。另外，主机通过管理队列向第一节点下发第二命令，第二节点接收该第二命令，根据第二命令的指示，基于主机的操作系统类型，生成第二预置信息，调用网卡提供的预置接口，将第二预置信息配置于输入输出队列上下文中(第二预置信息参考上述步骤1004)。需要说明的是，图11所示流程可以理解为是一种初始化流程，通过图11所示流程，使得存储设备的网卡能够向主机通知与第一节点相关的异常事件。而且，本申请对于第一命令和第二命令的发送顺序不作限定。

图12是本申请实施例提供的另一种节点异常事件的处理方法的示意图。如图12所示，网卡上部署有故障反射器，该故障反射器包括检测逻辑单元和执行逻辑单元。示意性地，检测逻辑单元检测与第一节点相关的异常事件，在检测到与第一节点相关的异常事件的情况下，通知执行逻辑单元第一节点发生了相关的异常事件。在这一过程中，检测逻辑单元还可以标记与第一节点相关的异常事件，从而避免重复处理与第一节点相关的异常事件。接着，执行逻辑单元根据检测逻辑单元的通知，基于第一预置信息，生成通知消息，向主机发送该通知消息，该通知消息也即是AER异步事件完成消息(需要说明的是，在一些实施例中，网卡与多个主机通信连接，网卡遍历当前所有的管理队列，向网卡连接的多个主机发送通知消息，本申请对此不作限定)。另外，在网卡接收到第三命令(即I/O命令)的情况下，基于第二预置信息，生成通知消息，向主机发送该通知消息，该通知消息也即是I/O响应消息。

通过上述方式，存储设备的网卡上部署有故障反射器(一种逻辑单元，包括检测逻辑单元和执行逻辑单元)，故障反射器与节点分离部署，从而在检测到与第一节点相关的异常事件的情况下，由该故障反射器接管NVMe命令，并根据预先配置的异步事件快速返回主机，并且对新接收的NVMe命令返回特定的错误码，实现快速触发主机的路径切换，从而有效降低了主机切换路径的时延，实现正常路径的秒级收敛，提升存储业务的连续性和可靠性。即使在极端场景下，如主机访问存储设备的存储器存在M条冗余路径(M为正整数)，若M-1条路径对应的节点发生异常事件(例如，集群供电单平面整体故障)，通过M-1次的I/O路径反馈和主动上报，只要有一个节点正常，主机就可以秒级快速收敛到一条正常处理的节点路径上，触发I/O秒级切换，提升了存储业务的连续性和可靠性。

图13是本申请实施例提供的一种节点异常事件的处理装置的结构示意图。该装置可以通过软件、硬件或者两者的结合实现前述存储设备中网卡所具备的功能。如图13所示，该装置配置于存储设备上的网卡，该存储设备包括该网卡和多个节点，该网卡与该多个节点中的第一节点通信连接，该节点用于管理存储器，该装置包括：

发送单元1301，用于在检测到与该第一节点相关的异常事件的情况下，向主机发送通知消息，该通知消息指示该第一节点所在的路径发生异常，以使该主机通过该多个节点中该第一节点以外的节点所在的路径访问该存储器。

在一些实施例中，该通知消息包括路径状态信息，该路径状态信息指示该第一节点所在的路径发生异常。

在一些实施例中，该网卡与该第一节点通过外围组件互连总线PCIe链路通信连接。

在一些实施例中，该装置还包括：检测单元，用于：

对PCIe链路进行链路异常检测，来确定是否发生与第一节点相关的异常事件。

在一些实施例中，该检测单元，用于：

对PCIe链路进行轮询机制检测和/或中断检测机制检测，当检测到PCIe链路异常时，确定发生了与第一节点相关的异常事件。

在一些实施例中，该发送单元1301，用于下述任一项：

该网卡通过应用层向该主机发送该通知消息；

该网卡通过传输层向该主机发送该通知消息。

在一些实施例中，该装置还包括：获取单元，用于：

从该网卡的管理队列信息中获取该路径状态信息，该管理队列信息中的该路径状态信息由该第一节点根据该主机下发的第一命令配置，该第一命令携带该路径状态信息，该第一命令指示在检测到与该第一节点相关的异常事件的情况下，向该主机发送该通知消息。

在一些实施例中，该获取单元，还用于：

从该网卡的输入输出队列上下文中获取该路径状态信息，该输入输出队列上下文中的该路径状态信息由该第一节点根据该主机下发的第二命令配置，该第二命令指示基于该主机的操作系统类型，生成该路径状态信息，将该路径状态信息配置于该输入输出队列上下文中。

在一些实施例中，该装置还包括：接收单元，用于：

接收该主机下发的第三命令，该第三命令为读命令或写命令，该第三命令指示在检测到与该第一节点相关的异常事件的情况下，向该主机发送该通知消息。

上述装置能够在检测到与第一节点相关的异常事件的情况下，及时向主机发送通知消息，告知主机该第一节点所在的路径发生异常，便于主机进行路径切换，这种方式能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。

需要说明的是：上述实施例提供的节点异常事件的处理装置在进行节点异常事件的处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的节点异常事件的处理装置与节点异常事件的处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图14是本申请实施例提供的另一种节点异常事件的处理装置的结构示意图。该装置可以通过软件、硬件或者两者的结合实现前述主机所具备的功能。如图14所示，该装置配置于主机，该主机与存储设备的网卡通信连接，该存储设备包括该网卡和多个节点，该网卡与该多个节点中的第一节点通信连接，该节点用于管理存储器，该装置包括：

接收单元1401，用于接收该网卡在检测到与该第一节点相关的异常事件的情况下发送的通知消息，该通知消息指示该第一节点所在的路径发生异常；

访问单元1402，用于基于该通知消息，通过该多个节点中该第一节点以外的节点所在的路径访问该存储器。

在一些实施例中，该接收单元1401，用于下述任一项：

通过传输层接收该通知消息；

通过应用层接收该通知消息；

在一些实施例中，该装置还包括，发送单元，用于：

向该第一节点下发第一命令，以使该第一节点将该第一命令携带的该路径状态信息配置于该管理队列信息中，该第一命令指示在检测到与该第一节点相关的异常事件的情况下，向该主机发送该通知消息。

在一些实施例中，该发送单元，还用于：

向该第一节点下发第二命令，以使该第一节点根据该第二命令的指示，基于该主机的操作系统类型，生成该路径状态信息，将该路径状态信息配置于该输入输出队列上下文中。

在一些实施例中，该发送单元，还用于：

向该网卡下发第三命令，该第三命令为读命令或写命令，该第三命令指示在检测到与该第一节点相关的异常事件的情况下，向该主机发送该通知消息。

上述装置能够接收存储设备的网卡发送的通知消息，从而及时获知第一节点所在的路径发生异常，进行路径切换，这种方式能够有效降低主机切换路径的时延，提升存储业务的连续性和可靠性。

需要说明的是，本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的预置信息等都是在充分授权的情况下获取的。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。还应理解，尽管以下描述使用术语第一、第二等来描述各种元素，但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如，在不脱离各种所述示例的范围的情况下，第一节点可以被称为第二节点，并且类似地，第二节点可以被称为第一节点。第一节点和第二节点都可以是节点，并且在某些情况下，可以是单独且不同的节点。

本申请中术语“至少一个”的含义是指一个或多个，本申请中术语“多个”的含义是指两个或两个以上，例如，多个节点是指两个或两个以上的节点。

以上描述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以程序结构信息的形式实现。该程序结构信息包括一个或多个程序指令。在计算设备上加载和执行该程序指令时，全部或部分地产生按照本申请实施例中的流程或功能。

实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

一种节点异常事件的处理方法，其特征在于，应用于存储设备的网卡，所述存储设备包括所述网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述方法包括：

在检测到与所述第一节点相关的异常事件的情况下，所述网卡向主机发送通知消息，所述通知消息指示所述第一节点所在的路径发生异常，以使所述主机通过所述多个节点中所述第一节点以外的节点所在的路径访问所述存储器。
根据权利要求1所述的方法，其特征在于，所述通知消息包括路径状态信息，所述路径状态信息指示所述第一节点所在的路径发生异常。
根据权利要求1或2所述的方法，其特征在于，所述网卡与所述第一节点通过外围组件互连总线PCIe链路通信连接。
根据权利要求3所述的方法，其特征在于，所述方法还包括：

对所述PCIe链路进行链路异常检测，来确定是否发生与所述第一节点相关的异常事件。
根据权利要求4所述的方法，其特征在于，所述对所述PCIe链路进行链路异常检测，包括：

对所述PCIe链路进行轮询机制检测和/或中断检测机制检测，当检测到所述PCIe链路异常时，确定发生了与所述第一节点相关的异常事件。
根据权利要求2至5中任一项所述的方法，其特征在于，所述网卡向主机发送通知消息，包括下述任一项：

所述网卡通过传输层向所述主机发送所述通知消息；

所述网卡通过应用层向所述主机发送所述通知消息。
根据权利要求2至6中任一项所述的方法，其特征在于，所述方法还包括：

从所述网卡的管理队列信息中获取所述路径状态信息，所述管理队列信息中的所述路径状态信息由所述第一节点根据所述主机下发的第一命令配置，所述第一命令携带所述路径状态信息，所述第一命令指示在检测到与所述第一节点相关的异常事件的情况下，向所述主机发送所述通知消息。
根据权利要求2至6中任一项所述的方法，其特征在于，所述方法还包括：

从所述网卡的输入输出队列上下文中获取所述路径状态信息，所述输入输出队列上下文中的所述路径状态信息由所述第一节点根据所述主机下发的第二命令配置，所述第二命令指示基于所述主机的操作系统类型，生成所述路径状态信息，将所述路径状态信息配置于所述输入输出队列上下文中。
根据权利要求2至6、8中任一项所述的方法，其特征在于，所述方法还包括：

接收所述主机下发的第三命令，所述第三命令为读命令或写命令，所述第三命令指示在检测到与所述第一节点相关的异常事件的情况下，向所述主机发送所述通知消息。
一种节点异常事件的处理方法，其特征在于，应用于主机，所述主机与存储设备的网卡通信连接，所述存储设备包括所述网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述方法包括：

接收所述网卡在检测到与所述第一节点相关的异常事件的情况下发送的通知消息，所述通知消息指示所述第一节点所在的路径发生异常；

基于所述通知消息，通过所述多个节点中所述第一节点以外的节点所在的路径访问所述存储器。
一种节点异常事件的处理装置，其特征在于，所述装置配置于存储设备中的网卡，所述存储设备包括所述网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述装置包括：

发送单元，用于在检测到与所述第一节点相关的异常事件的情况下，向主机发送通知消息，所述通知消息指示所述第一节点所在的路径发生异常，以使所述主机通过所述多个节点中所述第一节点以外的节点所在的路径访问所述存储器。
一种节点异常事件的处理装置，其特征在于，所述装置配置于主机，所述主机与存储设备的网卡通信连接，所述存储设备包括所述网卡和多个节点，所述网卡与所述多个节点中的第一节点通信连接，所述节点用于管理存储器，所述装置包括：

接收单元，用于接收所述网卡在检测到与所述第一节点相关的异常事件的情况下发送的通知消息，所述通知消息指示所述第一节点所在的路径发生异常；

访问单元，用于基于所述通知消息，通过所述多个节点中所述第一节点以外的节点所在的路径访问所述存储器。
一种网卡，其特征在于，所述网卡配置于存储设备，所述网卡包括处理器、存储器和接口，所述接口用于与所述存储设备中的节点通信连接，所述存储器用于存储至少一段程序代码，所述至少一段程序代码由所述处理器加载并实现如权利要求1-9中任一项所述的节点异常事件的处理方法。
一种存储集群，其特征在于，所述存储集群包括网卡、多个节点以及存储器，所述网卡与所述节点通信连接，所述节点用于管理所述存储器，所述网卡用于执行如权利要求1-9中任一项所述的节点异常事件的处理方法。
根据权利要求14所述的存储集群，其特征在于，所述存储集群是集中式存储设备，所述节点是存储控制器，所述网卡与所述节点通过系统总线连接，所述存储器与所述节点通过系统总线连接。
根据权利要求14所述的存储集群，其特征在于，所述存储集群是分布式存储系统，所述分布式存储系统包括多个独立的存储设备，各个所述存储设备之间通过有线网络或者无线网络连接，组成存储网络；

其中，每个所述存储设备包括所述网卡、所述节点以及所述存储器，所述网卡与所述节点通过系统总线连接，所述存储器与所述节点通过系统总线连接；或者，

每个所述存储设备包括所述网卡和所述节点，所述存储器与每个所述存储设备中的所述节点之间通信连接。
一种主机，其特征在于，所述主机包括处理器和存储器，所述处理器用于执行所述存储器中存储的指令，以使所述主机执行如权利要求10所述的节点异常事件的处理方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储至少一段程序代码，所述至少一段程序代码用于执行如权利要求1-9中任一项所述的节点异常事件的处理方法，或者，执行如权利要求10所述的节点异常事件的处理方法。
一种计算机程序产品，其特征在于，当所述计算机程序产品在存储设备上运行时，使得所述存储设备执行如权利要求1-9中任一项所述的节点异常事件的处理方法，或者，当所述计算机程序产品在主机上运行时，使得所述主机执行如权利要求10所述的节点异常事件的处理方法。