WO2022052953A1

WO2022052953A1 - 一种故障链路的切换方法、系统及相关设备

Info

Publication number: WO2022052953A1
Application number: PCT/CN2021/117211
Authority: WO
Inventors: 程继科
Original assignee: 华为技术有限公司
Priority date: 2020-09-10
Filing date: 2021-09-08
Publication date: 2022-03-17
Also published as: EP4210280A4; US20230205654A1; EP4210280A1; CN114257541A

Abstract

本申请提供一种故障链路的切换方法、系统及相关设备。其中，该方法包括：主机接收存储设备发送的故障链路信息，该主机与存储设备之间存在至少两条链路；该主机根据故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。上述方法能够使得主机快速感知故障链路并完成链路切换，缩短链路切换时间，提高系统可靠性。

Description

一种故障链路的切换方法、系统及相关设备

本申请要求于2020年9月10日提交中国专利局、申请号为202010947350.4、申请名称为“一种故障链路的切换方法、系统及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及存储技术领域，尤其涉及一种故障链路的切换方法、系统及相关设备。

背景技术

小型计算机系统接口(small computer system interface，SCSI)协议以及基于网络的非易失性存储标准(Non-Volatile memory express over fabrics，NVMe-oF)是常用的网络存储传输标准协议。在SCSI组网和NVMe-oF组网的场景中，通过采用光纤通道(fiber channel，FC)交换机连接存储设备和服务器主机，建立专用于数据存储的存储区域网络(storage area network，SAN)，在SAN中，主机与存储设备之间存在多条链路，主机通过SAN中的多条链路下发业务。若在主机下发业务的过程中，链路发生故障，则需要将业务从故障链路切换到正常链路进行下发，其中，业务从故障链路切换到正常链路所需要的时间称为业务切换时间，在存储系统中，业务切换时间是衡量系统整体可靠性的重要参数，一般而言，业务切换时间越短，系统的可靠性越高。在业务切换过程中，HBA驱动感知链路断开时间对业务切换时间影响比较大。

目前都是通过手动配置主机总线适配器(host bus adapter，HBA)的驱动感知链路断开时间，如果HBA驱动没有在所配置的时间内接收到I/O执行完成的反馈信息，则HBA确认链路故障，并发送错误码至主机的多路径，使多路径进行业务切换。为了减少业务切换时间，可以将驱动感知链路断开时间设置的比较小，但是设置的太小的话，又可能将闪断误判为链路故障。

发明内容

本发明实施例公开了一种故障链路的切换方法、系统及相关设备，能够快速感知故障链路并完成链路切换，缩短业务切换时间，提高系统可靠性。

第一方面，本申请提供了一种故障链路的切换系统，所述系统包括主机和存储设备，所述主机和所述存储设备之间存在至少两条链路，其中：所述存储设备用于对所述至少两条链路进行监测，并在监测到链路故障时向所述主机发送链路故障信息；所述主机用于接收所述存储设备发送的故障链路信息，并根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。

在本申请提供的方案中，存储设备通过监测链路并向主机发送故障链路信息，以使得主机能够快速的感知到故障链路根据故障链路信息完成链路切换，可以缩短业务切换时间，提高系统可靠性。

结合第一方面，在第一方面的一种可能的实现方式中，所述主机还用于向所述存储设备发送查询所述故障链路信息的查询请求；所述存储设备还用于将所述故障链路信息携带在所述查询请求的反馈信息中，并将所述反馈信息发送至所述主机。

在本申请提供的方案中，主机通过发送查询请求以使得存储设备能够将监测到的故障链路信息携带在该查询请求的反馈信息中并返回至主机，这样可以避免主机主动感知故障链路，能够有效缩短主机感知故障链路的时间。

结合第一方面，在第一方面的一种可能的实现方式中，所述主机还用于根据所述故障链路信息，断开所述故障链路。

在本申请提供的方案中，主机在接收到存储设备返回的故障链路信息之后，主动断开该故障链路，这样有效缩短业务切换时间。可选的，主机可以在接收到故障链路信息之后确定与该故障链路信息匹配的链路标记，然后删除该链路标记以断开故障链路；或者，主机将故障链路的状态标记为不可用状态以断开故障链路。

结合第一方面，在第一方面的一种可能的实现方式中，所述主机在根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路时，具体用于：所述主机的主机总线适配器HBA卡驱动发送错误码至所述主机的多路径软件，所述主机的多路径软件将所述故障链路上的业务切换至所述正常链路。

在本申请提供的方案中，主机断开故障链路之后将会触发HBA卡驱动发送错误码至主机的多路径软件，多路径软件从而根据错误码完成业务切换，这样可以有效缩短HBA卡感知故障链路的时间，提高系统可靠性。

结合第一方面，在第一方面的一种可能的实现方式中，所述主机按照预设周期向所述存储设备发送查询所述故障链路信息的查询请求；或者是，所述主机串行持续向所述存储设备发送查询所述故障链路信息的查询请求。

在本申请提供的方案中，主机可以灵活的向存储设备下发查询请求，以使得存储设备根据该查询请求能够及时的返回故障链路信息。

结合第一方面，在第一方面的一种可能的实现方式中，所述故障链路信息为所述故障链路的唯一标识信息，所述故障链路的唯一标识信息包括启动器和目标器的全球唯一名字WWN或网际互连协议IP地址，所述启动器为所述故障链路在所述主机上的端口，所述目标器为所述故障链路在所述存储设备上的端口。

结合第一方面，在第一方面的一种可能的实现方式中，所述存储设备还用于通过所述至少两条链路中的正常链路向所述主机发送所述故障链路信息。

在本申请提供的方案中，存储设备在将故障链路信息携带在查询请求的反馈信息中之后，通过至少两条链路中的正常链路发送给主机，可以保证主机能够正确的接收到故障链路信息并完成链路切换，正常链路可以为主机能够正常下发业务的链路。

第二方面，本申请提供了一种故障链路的切换方法，包括：主机接收存储设备发送的故障链路信息，所述主机与所述存储设备之间存在至少两条链路；所述主机根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。

在本申请提供的方案中，主机通过接收存储设备发送的故障链路信息将故障链路上的业务切换至正常链路，这样可以缩短主机感知故障链路的时间，进而缩短业务的切换时间，提高了系统可靠性。

结合第二方面，在第二方面的一种可能的实现方式中，所述主机向所述存储设备发送用于查询所述故障链路信息的查询请求；所述主机接收所述存储设备发送的所述查询请求的反馈信息，所述反馈信息中携带所述故障链路信息。

结合第二方面，在第二方面的一种可能的实现方式中，所述主机根据所述故障链路信息，断开所述故障链路。

结合第二方面，在第二方面的一种可能的实现方式中，所述主机的HBA卡驱动发送错误码至所述主机的多路径软件，所述主机的多路径软件将所述故障链路上的业务切换至所述正常链路。

结合第二方面，在第二方面的一种可能的实现方式中，所述主机按照预设周期向所述存储设备发送查询所述故障链路信息的查询请求；或者是，所述主机串行持续向所述存储设备发送查询所述故障链路信息的查询请求。

结合第二方面，在第二方面的一种可能的实现方式中，所述故障链路信息为所述故障链路的唯一标识信息，所述故障链路的唯一标识信息包括启动器和目标器的全球唯一名字WWN或网际互连协议IP地址，所述启动器为所述故障链路在所述主机上的端口，所述目标器为所述故障链路在所述存储设备上的端口。

第三方面，本申请提供了一种故障链路的切换方法，包括：存储设备对与主机交互的链路进行监测，所述存储设备与所述主机之间存在至少两条链路；所述存储设备在监测到链路故障时，向所述主机发送故障链路信息，以使所述主机根据所述故障链路信息将所述故障链路上的业务切换至所述至少两条链路中的正常链路；所述存储设备接收所述主机通过所述正常链路下发的业务。

结合第三方面，在第三方面的一种可能的实现方式中，所述存储设备接收所述主机发送的用于查询所述故障链路信息的查询请求；将所述故障链路信息携带在所述查询请求的反馈信息中，并将所述反馈信息发送至所述主机。

结合第三方面，在第三方面的一种可能的实现方式中，所述存储设备通过所述至少两条链路中的正常链路向所述主机发送所述故障链路信息。

结合第三方面，在第三方面的一种可能的实现方式中，所述存储设备接收所述主机按照预设周期发送的用于查询所述故障链路信息的查询请求；或者是，所述存储设备接收所述主机串行持续发送的用于查询所述故障链路信息的查询请求。

结合第三方面，在第三方面的一种可能的实现方式中，所述故障链路信息为所述故障链路的唯一标识信息，所述故障链路的唯一标识信息包括启动器和目标器的全球唯一名字WWN或网际互连协议IP地址，所述启动器为所述故障链路在所述主机上的端口，所述目标器为所述故障链路在所述存储设备上的端口。

第四方面，本申请提供了一种网络设备，包括：接收单元，用于接收存储设备发送的故障链路信息，所述网络设备与所述存储设备之间存在至少两条链路；处理单元，用于根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。

结合第四方面，在第四方面的一种可能的实现方式中，所述网络设备还包括发送单元，所述发送单元，用于向所述存储设备发送用于查询所述故障链路信息的查询请求；所述接收单元，具体用于接收所述存储设备发送的所述查询请求的反馈信息，所述反馈信息中携带所述故障链路信息。

结合第四方面，在第四方面的一种可能的实现方式中，所述处理单元，还用于根据所述故障链路信息，断开所述故障链路。

结合第四方面，在第四方面的一种可能的实现方式中，所述处理单元，具体用于：将错误码发送至多路径软件，所述多路径软件将所述故障链路上的业务切换至所述正常链路。

第五方面，本申请提供了一种存储设备，包括：监测单元，用于对与主机交互的链路进行监测，所述存储设备与所述主机之间存在至少两条链路；发送单元，用于在所述监测单元监测到链路故障时，向所述主机发送故障链路信息，以使所述主机根据所述故障链路信息将所述故障链路上的业务切换至所述至少两条链路中的正常链路；接收单元，用于接收所述主机通过所述正常链路下发的业务。

结合第五方面，在第五方面的一种可能的实现方式中，所述接收单元，还用于接收所述主机发送的用于查询所述故障链路信息的查询请求；所述发送单元，还用于将所述故障链路信息携带在所述查询请求的反馈信息中，并将所述反馈信息发送至所述主机。

结合第五方面，在第五方面的一种可能的实现方式中，所述发送单元，具体用于：通过所述至少两条链路中的正常链路向所述主机发送所述故障链路信息。

第六方面，本申请提供了一种计算设备，所述计算设备包括处理器和存储器，所述处理器和所述存储器通过内部总线相连，所述存储器中存储有指令，所述处理器调用所述存储器中的指令以执行上述第二方面以及结合上述第二方面中的任意一种实现方式所提供的故障链路的切换方法。

第七方面，本申请提供了一种计算设备，所述计算设备包括处理器和存储器，所述处理器和所述存储器通过内部总线相连，所述存储器中存储有指令，所述处理器调用所述存储器中的指令以执行上述第三方面以及结合上述第三方面中的任意一种实现方式所提供的故障链路的切换方法。

第八方面，本申请提供了一种计算机存储介质，所述计算机存储介质存储有计算机程序，当所述计算机程序被处理器执行时，可以实现上述第二方面以及结合上述第二方面中的任意一种实现方式所提供的故障链路的切换方法的流程。

第九方面，本申请提供了一种计算机存储介质，所述计算机存储介质存储有计算机程序，当所述计算机程序被处理器执行时，可以实现上述第三方面以及结合上述第三方面中的任意一种实现方式所提供的故障链路的切换方法的流程。

第十方面，本申请提供了一种计算机程序产品，该计算机程序包括指令，当该计算机程序被计算机执行时，使得计算机可以执行上述第二方面以及结合上述第二方面中的任意一种实现方式所提供的故障链路的切换方法的流程。

第十一方面，本申请提供了一种计算机程序产品，该计算机程序包括指令，当该计算机程序被计算机执行时，使得计算机可以执行上述第三方面以及结合上述第三方面中的任意一种实现方式所提供的故障链路的切换方法的流程。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种链路倒换的场景示意图；

图2是本申请实施例提供的一种系统架构的示意图；

图3是本申请实施例提供的一种链路故障倒换方法的流程示意图；

图4是本申请实施例提供的一种网络设备的结构示意图；

图5是本申请实施例提供的一种存储设备的结构示意图；

图6是本申请实施例提供的一种计算设备的结构示意图；

图7是本申请实施例提供的又一种计算设备的结构示意图。

具体实施方式

下面结合附图对本申请实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。

首先，结合附图对本申请中所涉及的部分用语和相关技术进行解释说明，以便于本领域技术人员理解。

主机可以部署各种服务和应用程序(例如多路径管理服务、链路感知服务等)，具体可以包括物理机、虚拟机、容器等，用于向存储设备下发业务，例如应用服务器、分布式文件系统服务器等。

存储设备又可以称为存储阵列，具体可以包括外置集中式存储或分布式存储等形态的能够存储数据的设备，用于接收主机下发的业务，例如存储服务器、分布式数据库服务器等。

链路为主机与存储设备之间的通信通路，用于主机与存储设备之间进行信息交互，主机和存储设备之间一般存在多条链路，主机可以选择多条链路中的任意一条下发业务。

小型计算机系统接口(small computer system interface，SCSI)协议主要是在主机和存储设备之间传送命令、状态和块数据，操作系统对外部设备(例如磁盘、磁带、光存储等)的输入/输出(input/output，I/O)操作，可以通过SCSI协议来实现，一般情况下SCSI协议都嵌入到设备驱动器或者主机适配器的板载逻辑中。

基于网络的非易失性存储标准(Non-Volatile memory express over fabrics，NVMe-oF)是为了支持数据中心的网络存储，实现NVMe标准在高速串行计算机扩展总线标准(peripheral component interconnect express，PCIe)总线上的扩展。NVMe-oF使用基于消息的模型通过网络在主机和存储设备之间发送请求和响应，替代PCIe来扩展NVMe主机和NVMe存储子系统进行通信的距离。

存储区域网络(storage area network，SAN)采用FC技术，通过FC交换机连接存储设备和服务器主机，是一种专门为存储建立的独立于传输控制协议/网际协议(transmission control protocol/internet protocol，TCP/IP)网络之外的专用网络，SAN提供了一种与现有局域网(local area network，LAN)连接的方法，并且通过同一物理信道支持广泛使用的SCSI协议和IP协议。

主机总线适配器(host bus adapter，HBA)是能插入计算机或大型主机的板卡，是将主机接入FC网络必不可少的设备。HBA通过光纤信道或SCSI把主机连接到存储设备或存储设备网上，在主机和存储设备之间提供I/O处理和物理连接。

目前在主机向存储设备下发业务的过程中，链路发生故障时，都是由主机侧(例如HBA卡)进行感知，在感知到链路断开以后切换当前故障链路，重新选择另外一条正常链路下发业务，正常链路具体可以是主机能够向存储设备正常下发业务的链路。如图1所示，其示出了一种链路切换的场景示意图，主机110中部署了应用程序1110、多路径软件1120和HBA驱动1130，应用程序1110产生需要下发的业务，并通过HBA驱动1130向存储设备120下发业务，主机110和存储设备120之间通过SAN连接，SAN中存在多条链路，存储设备120中部署了控制器1210，控制器1210用于接收并处理主机110下发的业务，当正在下发业务的链路发生故障或控制器1210发生故障时，经过一段时间后，HBA驱动1130将感知到链路已经断开，例如，HBA驱动可以利用超时机制进行链路故障感知，当HBA驱动在预先设置的时间内没有接收到I/O执行完成的反馈，则HBA驱动则可以确定链路已经断开，无法继续使用该链路下发业务，HBA驱动1130向多路径软件1120返回错误码(例如linkdown)，多路径软件1120在接收到HBA驱动1130返回的错误码后对该错误码进行解析，从而确认当前链路已经断开不可使用，然后选择另外一条链路重新下发业务，若成功下发业务至存储设备120之后，多路径软件1120可以确定重新选择的链路为正常链路，然后通知应用程序1110可以使用重新选择的链路的下发业务。可以看出，在链路出现故障需要进行链路切换从而完成业务切换，整个过程需要消耗的时间为HBA驱动1130感知链路断开的时间、HBA驱动1130处理返回错误码的时间、多路径软件1120切换处理时间以及多路径软件1120确定重新选择的链路为正常链路的时间。其中，多路径软件1120切换处理时间和多路径软件1120确定重新选择的链路为正常链路的时间都比较短暂，通常为几毫秒，因此，整个切换过程所消耗的主要时间为HBA驱动1130感知链路断开的时间和HBA驱动1130处理返回错误码的时间。为了快速完成链路切换，缩短业务切换时间，通常都是通过手动配置HBA的驱动感知链路断开时间，例如在Linux文件系统下使用光纤卡(Qlogic)HBA的FC组网场景中，对SCSI层的dev_loss_tmo参数和Qlogic HBA驱动的qlport_down_retry参数进行配置，将参数值配置到最小值，以使得HBA驱动能够快速感知链路断开并向多路径软件返回错误码，多路径软件根据返回的错误码进行链路切换，将业务通过其它正常链路进行下发，从而达到缩短业务切换时间的目的。

需要说明的是，为了避免链路因为短暂的断开又恢复，从而影响业务的连续性，避免将闪断误判为链路故障，通常不会将HBA驱动感知链路断开时间设置的过小，一般默认的参数值都是大于5秒，因此，目前的解决方案并不能有效的缩短业务切换时间，不能提高系统可靠性。

基于上述，本申请提供了一种故障链路的切换方法，可以由存储设备感知链路是否出现故障并主动告知主机故障链路，由主机下发断开故障链路的指令，从而可以快速完成链路切换，缩短业务切换时间，提高系统可靠性。

本申请实施例的技术方案可以应用于任何需要进行链路切换的系统中，尤其适用于主机和存储设备存在多路径的场景，例如，SCSI组网场景和NVMe-oF场景等。例如，在SCSI组网的SAN存储网络多路径的场景中，主机和存储设备之间的链路出现故障时，存储设备可以使用本申请实施例提供的故障链路的切换方法进行链路切换，以缩短业务切换时间，提高系统可靠性。

图2示出了本申请实施例的一种系统架构的示意图。如图2所示，该系统200包括：主机210和存储设备220，主机210通过FC网络或以太网络(ethernet，ETH)与存储设备220进行连接，主机210和存储设备220之间存在多条链路(例如多条光纤通道)，主机210包括应用程序2110、链路故障处理服务2120、多路径软件2130、NVMe驱动2140、HBA驱动2150和网络接口控制器(network interface controller，NIC)驱动2160；存储设备220包括控制器2210和链路监控器2220。主机210中的链路故障处理服务2120在每条链路上持续或周期性下发链路故障查询请求，应用程序2110产生需要下发的业务并通过多路径软件2130向存储设备220中的控制器2210下发业务，链路监控器2220对主机210和存储设备220之间的各条链路进行监测，当监测到某条链路故障时(例如监测到主机210和存储设备220的某个会话链接的光信号或电信号中断)，链路监控器2220在链路故障处理服务2120下发的链路故障查询请求的反馈信息中将故障链路对应的唯一标识信息(例如启动器和目标器的全球唯一名字(world wide name，WWN)或网际协议(internet protocol，IP)地址)通过其它正常链路返回给链路故障处理服务2120，链路故障处理服务2120接收到故障链路对应的唯一标识信息之后，识别出故障链路对应的链路标记(例如NVMe ctrl)，然后断开故障链路(例如在主机中删除故障链路对应的链路标记或将故障链路的状态设置为不可用状态，所述链路标记在主机与存储设备建立连接时生成，用于标识主机与存储设备之间的链路，每条链路生成一个链路标记)，HBA驱动2150或NIC驱动2160会立即向多路径软件2130返回错误码，多路径软件2130识别错误码并进行链路切换，将应用程序2110产生的业务切换到其它正常链路进行下发。

可以看出，图2所示的故障链路切换系统与图1所示的故障链路切换相比，存储设备感知链路出现故障并主动告知主机，而避免由主机的HBA驱动或NIC驱动去感知链路出现故障，这样可以减少HBA驱动或NIC驱动感知链路断开时间，从而可以快速完成链路切换，缩短业务切换时间，提高系统的可靠性。

结合图2所示的系统架构的示意图，下面将描述本申请实施例提供的故障链路的切换方法。如图3所示，该流程包括：

S301：主机210向存储设备220发送用于查询故障链路信息的查询请求。

具体地，主机210和存储设备220之间通过SAN进行连接，它们之间存在多条链路(例如多条光纤通道)，主机210中部署的链路故障处理服务2120在每条链路都下发用于查询故障链路信息的查询请求。

可选的，主机210可以通过周期定时在每条链路上下发查询请求以查询故障链路信息，其周期可以根据需要进行设置，例如设置为500毫秒；或者是，主机210在每条链路上串行持续下发查询请求以查询故障链路信息，在没有故障出现时，存储设备220将会间隔固定时间(例如5秒)后返回确认消息，一旦出现故障，则存储设备220在查询请求的反馈信息中立即返回故障链路信息。

可以看出，通过周期性下发查询请求查询故障链路信息，不需要一直占用链路资源，但下发操作比较频繁，且存储设备220无法第一时间进行反馈，但是串行持续下发查询请求查询故障链路信息，将导致每条链路都至少有一个I/O一直占用链路资源，但不需要频繁执行下发操作，且存储设备220能够第一时间反馈故障链路信息，提高了反馈效率。本申请对具体选用何种方式不作限定。

S302：存储设备220对与主机210交互的链路进行监测。

具体地，存储设备220中的链路监控器2220对每一条链路都进行监测，若某条链路突然出现故障，则链路监控器2220将会立即感知到，例如，主机210和存储设备220之间的某个链路的光信号或电信号突然中断，则链路监控器2220可以立即感知并确定该链路出现故障。

S303：存储设备220向主机210发送链路故障信息。

具体地，存储设备220中的链路监控器2220在感知到链路出现故障之后，将故障链路的唯一标识信息填充到主机210下发的故障链路查询请求的反馈信息中，由于主机210和存储设备220之间还存在其它正常的链路，所以故障链路的唯一标识信息是可以成功返回至主机210，进而返回至主机210中的链路故障处理服务2120。

应理解，存储设备220不能直接主动的向主机210发送消息，因此，存储设备220即使感知到链路出现故障也不能主动告知主机210相关故障链路信息，主机210需要通过向存储设备220下发查询故障链路信息的查询请求以使存储设备220根据接收到的查询请求进行反馈，进而才能获取到故障链路信息。在存储设备接收到查询请求后，查询每条链路的状态，当确定有链路发生故障后，将链路信息携带在查询请求的反馈信息中，并将该反馈信息发送至主机210。存储设备查询每条链路的状态的方式例如可以为：存储设备的内存中存储了各个链路的状态(例如将某段存储空间全部填充为0或协商好的某个数值以表示链路的状态)，当存储设备220接收到主机210下发的查询请求之后，将查询各个链路的状态，读取各个链路的状态信息，当确定链路出现故障时，则存储设备220将故障链路的信息携带在查询请求的反馈信息中，并将该反馈信息发送至主机210。

需要说明的是，故障链路的唯一标识信息在不同的应用场景中代表不同的含义，例如，在FC-SCSI或FC-NVMe组网场景中，该唯一标识信息可以是启动器和目标器的WWN，启动器为链路在主机210上的端口(即HBA卡的端口)，目标器为链路在存储设备220上的端口；在RoCE-NVMe组网场景中，该唯一标识信息可以是启动器和目标器的IP，这里启动器的端口为ETH网卡的端口(即NIC卡的端口)。应理解，该IP是在主机210和存储设备220在建立连接时分配使用的，是成对出现的，主机210中的每个启动器的IP在存储设备220中都存在唯一一个与之对应的目标器的IP，一个IP对可以唯一标识一条链路。

S304：主机210根据故障链路信息断开故障链路。

具体地，主机210中的链路故障处理服务2120接收到存储设备220反馈的故障链路的启动器和目标器的WWN或IP对后，识别出故障链路对应的链路标记，该链路标记是主机210用于管理链路所创建的一个对象，每一条链路都存在唯一一个链路标记，例如，该链路标记可以是NVMe ctrl。

需要说明的是，主机210中的NVMe驱动2140中预先存储了主机210与存储设备220之间的全量链路信息，每一条链路都用启动器和目标器的WWN或IP对进行标识，且存在唯一一个与之对应的链路标记。

示例性的，链路故障处理服务2120接收到启动器和目标器的WWN或IP对之后，结合NVMelist_subsys命令查看NVMe驱动2140中存储的全量链路信息，从而识别出故障链路对应的链路标记，然后通过多路径软件2130识别出主机210与存储设备220之间还存在其它正常链路之后，通过NVMe disconnect命令删除该链路标记(例如NVMe ctrl)，从而触发HBA驱动2150或NIC驱动2160侦测到该链路标记被删除后，则在已通过所述链路标记对应的链路发送，但还没有收到确认信息的I/O请求中携带错误码，并将所述I/O请求发送至至多路径软件2130，多路径软件2130识别出错误码，确定该链路出现故障，则将所述I/O请求通过正常链路重新发送至存储设备；或者是，链路故障处理服务2120通过下发keep alive命令以触发HBA驱动2150或NIC驱动2160执行例行检测链路故障的操作，即HBA驱动2150或NIC驱动2160将会立即向存储设备220下发检测I/O以检测链路状态，若检测到该链路状态是故障状态时，则删除所述链路标记，并在该链路上还没收到确认信息的IO请求中携带错误码，并将携带了错误码的IO请求发送至多路径软件2130，多路径软件2130识别出错误码，确定该链路出现故障，并将所述IO请求通过正常链路重新下发至存储设备，以执行链路切换。

可以看出，主机是在接收到存储设备返回的故障链路信息之后通过主动下发命令删除故障链路对应的链路标记或触发HBA驱动或NIC驱动执行例测操作，从而促使HBA驱动或NIC驱动立即向多路径软件返回错误码，而不是由HBA驱动或NIC驱动主动感知并确认链路出现故障后向多路径软件返回错误码，这样可以保证多路径软件能够及时接收到错误码从而完成链路切换，大大缩短业务倒换时间，提高了系统可靠性。

S305：主机210通过其它正常链路下发业务。

具体地，多路径软件2130在识别出错误码之后，将当前路径的状态置为故障(fault)状态，重新在剩余的链路中选择一条链路(例如可以随机选择一条链路)进行重试，向存储设备220发送业务I/O，当能够接收到存储设备220返回的成功消息之后，则可以确定重新选择的链路为正常链路，能够支持下发业务，多路径软件2130通知应用程序2110，可以使用重新选择的链路下发业务IO，完成对存储设备220中的数据进行读写操作。

上述详细阐述了本申请实施例的方法，为了便于更好的实施本申请实施例的上述方案，相应地，下面还提供用于配合实施上述方案的相关设备。

参见图4，图4是本申请实施例提供的一种网络设备的结构示意图，该网络设备可以是上述图3所述的方法实施例中的主机，可以执行图3所述的故障链路的切换方法实施例中以主机为执行主体的方法和步骤。如图4所示，该网络设备400包括接收单元410、处理单元420和发送单元430。其中，

接收单元410，用于接收存储设备发送的故障链路信息，所述网络设备与所述存储设备之间存在至少两条链路；

处理单元420，用于根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。

具体地，所述接收单元410用于执行前述步骤S303，且可选的执行前述步骤中可选的方法，所述处理单元420用于执行前述步骤S304，且可选的执行前述步骤中可选的方法，所述发送单元430用于执行前述步骤S301和S305，且可选的执行前述步骤中可选的方法。上述三个单元之间互相可以通过通信通路进行数据传输，应理解，网络设备400包括各单元可以为软件单元、也可以为硬件单元、或部分为软件单元部分为硬件单元。

作为一个实施例，所述发送单元430，用于向所述存储设备发送用于查询所述故障链路信息的查询请求；所述接收单元410，具体用于接收所述存储设备发送的所述查询请求的反馈信息，所述反馈信息中携带所述故障链路信息。

作为一个实施例，所述处理单元420，还用于根据所述故障链路信息，断开所述故障链路。

作为一个实施例，所述处理单元420，具体用于：将错误码发送至多路径软件，所述多路径软件将所述故障链路上的业务切换至所述正常链路。

作为一个实施例，所述发送单元430，具体用于：按照预设周期向所述存储设备发送查询所述故障链路信息的查询请求；或者是，串行持续向所述存储设备发送查询所述故障链路信息的查询请求。

作为一个实施例，所述故障链路信息为所述故障链路的唯一标识信息，所述故障链路的唯一标识信息包括启动器和目标器的全球唯一名字WWN或网际互连协议IP地址，所述启动器为所述故障链路在所述网络设备上的端口，所述目标器为所述故障链路在所述存储设备上的端口。

应理解，上述网络设备的结构仅仅作为一种示例，不应构成具体的限定，可以根据需要对网络设备的各个单元进行增加、减少或合并。此外，网络设备中的各个单元的操作和/或功能分别为了实现上述图3所描述的方法的相应流程，为了简洁，在此不再赘述。

参见图5，图5是本申请实施例提供的一种存储设备的结构示意图。该存储设备可以是上述图3所述的方法实施例中的存储设备，可以执行图3所述的故障链路的切换方法实施例中以存储设备为执行主体的方法和步骤。如图5所示，该存储设备500包括监测单元510、发送单元520和接收单元530。其中，

监测单元510，用于对与主机交互的链路进行监测，所述存储设备与所述主机之间存在至少两条链路；

发送单元520，用于在监测单元510监测到链路故障时，向所述主机发送故障链路信息，以使所述主机根据所述故障链路信息将所述故障链路上的业务切换至所述至少两条链路中的正常链路；

接收单元530，用于接收所述主机通过所述正常链路下发的业务。

具体地，所述监测单元510用于执行前述步骤S302，且可选的执行前述步骤中可选的方法，所述发送单元520用于执行前述步骤S303，且可选的执行前述步骤中可选的方法，所述接收单元530用于执行前述步骤S301和S305，且可选的执行前述步骤中可选的方法。上述三个单元之间互相可以通过通信通路进行数据传输，应理解，存储设备500包括各单元可以为软件单元、也可以为硬件单元、或部分为软件单元部分为硬件单元。

作为一个实施例，所述接收单元530，还用于接收所述主机发送的用于查询所述故障链路信息的查询请求；所述发送单元520，还用于将所述故障链路信息携带在所述查询请求的反馈信息中，并将所述反馈信息发送至所述主机。

作为一个实施例，所述发送单元520，具体用于：通过所述至少两条链路中的正常链路向所述主机发送所述故障链路信息。

作为一个实施例，所述接收单元530，具体用于：接收所述主机按照预设周期发送的用于查询所述故障链路信息的查询请求；或者是，接收所述主机串行持续发送的用于查询所述故障链路信息的查询请求。

作为一个实施例，所述故障链路信息为所述故障链路的唯一标识信息，所述故障链路的唯一标识信息包括启动器和目标器的全球唯一名字WWN或网际互连协议IP地址，所述启动器为所述故障链路在所述主机上的端口，所述目标器为所述故障链路在所述存储设备上的端口。

应理解，上述存储设备的结构仅仅作为一种示例，不应构成具体的限定，可以根据需要对存储设备的各个单元进行增加、减少或合并。此外，存储设备中的各个单元的操作和/或功能分别为了实现上述图3所描述的方法的相应流程，为了简洁，在此不再赘述。

参见图6，图6是本申请实施例提供的一种计算设备的结构示意图。如图6所示，该计算设备600包括：处理器610、通信接口620以及存储器630，所述处理器610、通信接口620以及存储器630通过内部总线640相互连接。

所述计算设备600可以是图2中的主机。图2中的主机所执行的功能实际上是由所述主机的处理器610来执行。

所述处理器610可以由一个或者多个通用处理器构成，例如中央处理器(central processing unit，CPU)，或者CPU和硬件芯片的组合。上述硬件芯片可以是专用集成电路 (application-specific integrated circuit，ASIC)、可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)、现场可编程逻辑门阵列(field-programmable gate array，FPGA)、通用阵列逻辑(generic array logic，GAL)或其任意组合。

总线640可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。所述总线640可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一条粗线表示，但不表示仅有一根总线或一种类型的总线。

存储器630可以包括易失性存储器(volatile memory)，例如随机存取存储器(random access memory，RAM)；存储器630也可以包括非易失性存储器(non-volatile memory)，例如只读存储器(read-only memory，ROM)、快闪存储器(flash memory)、硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)；存储器630还可以包括上述种类的组合。程序代码可以是用来实现网络设备400所示的功能单元，或者用于实现图3所示的方法实施例中以主机为执行主体的方法步骤。

参见图7，图7是本申请实施例提供的又一种计算设备的结构示意图。如图7所示，该计算设备700包括：处理器710、通信接口720以及存储器730，所述处理器710、通信接口720以及存储器730通过内部总线740相互连接。

所述计算设备700可以是图2中的存储设备。图2中的存储设备所执行的功能实际上是由所述存储设备的处理器710来执行。

所述处理器710可以由一个或者多个通用处理器构成，例如CPU，或者CPU和硬件芯片的组合。上述硬件芯片可以是ASIC、PLD或其组合。上述PLD可以是CPLD、FPGA、GAL或其任意组合。

总线740可以是PCI总线或EISA总线等。所述总线740可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但不表示仅有一根总线或一种类型的总线。

存储器730可以包括易失性存储器(volatile memory)，例如RAM；存储器730也可以包括非易失性存储器(non-volatile memory)，例如ROM、快闪存储器(flash memory)、HDD或SSD；存储器730还可以包括上述种类的组合。程序代码可以是用来实现存储设备500所示的功能单元，或者用于实现图3所示的方法实施例中以存储设备为执行主体的方法步骤。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时，可以实现上述方法实施例中记载的任意一种的部分或全部步骤，以及实现上述图6所描述的任意一个功能单元的功能。

本申请实施例还提供了一种计算机程序产品，当其在计算机或处理器上运行时，使得计算机或处理器执行上述任一个方法中的一个或多个步骤。上述所涉及的设备的各组成单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在所述计算机可读取存储介质中。

在上述实施例中，对各个实施例的描述各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

还应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

一种故障链路的切换系统，其特征在于，包括主机和存储设备，所述主机和所述存储设备之间存在至少两条链路，其中：

所述存储设备用于对所述至少两条链路进行监测，并在监测到链路故障时向所述主机发送故障链路信息；

所述主机用于接收所述存储设备发送的故障链路信息，并根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。
如权利要求1所述的系统，其特征在于，

所述主机还用于向所述存储设备发送查询所述故障链路信息的查询请求；

所述存储设备还用于将所述故障链路信息携带在所述查询请求的反馈信息中，并将所述反馈信息发送至所述主机。
如权利要求2所述的系统，其特征在于，所述主机还用于：

根据所述故障链路信息，断开所述故障链路。
如权利要求3所述的系统，其特征在于，所述主机在根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路时，具体用于：

所述主机的主机总线适配器HBA卡驱动发送错误码至所述主机的多路径软件，所述主机的多路径软件将所述故障链路上的业务切换至所述正常链路。
如权利要求1-4任一项所述的系统，其特征在于，

所述存储设备还用于通过所述至少两条链路中的正常链路向所述主机发送所述故障链路信息。
一种故障链路的切换方法，其特征在于，所述方法包括：

主机接收存储设备发送的故障链路信息，所述主机与所述存储设备之间存在至少两条链路；

所述主机根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。
如权利要求6所述的方法，其特征在于，所述方法还包括：

所述主机向所述存储设备发送用于查询所述故障链路信息的查询请求；

所述主机接收所述存储设备发送的故障链路信息包括：

所述主机接收所述存储设备发送的所述查询请求的反馈信息，所述反馈信息中携带所述故障链路信息。
如权利要求6或7所述的方法，其特征在于，所述方法还包括：

所述主机根据所述故障链路信息，断开所述故障链路。
如权利要求8所述的方法，其特征在于，所述主机根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路，包括：

所述主机的HBA卡驱动发送错误码至所述主机的多路径软件，所述主机的多路径软件将所述故障链路上的业务切换至所述正常链路。
一种故障链路的切换方法，其特征在于，所述方法包括：

存储设备对与主机交互的链路进行监测，所述存储设备与所述主机之间存在至少两条链路；

所述存储设备在监测到链路故障时，向所述主机发送故障链路信息，以使所述主机根据所述故障链路信息将所述故障链路上的业务切换至所述至少两条链路中的正常链路；

所述存储设备接收所述主机通过所述正常链路下发的业务。
如权利要求10所述的方法，其特征在于，所述方法还包括：

所述存储设备接收所述主机发送的用于查询所述故障链路信息的查询请求；

所述向所述主机发送故障链路信息包括：

将所述故障链路信息携带在所述查询请求的反馈信息中，并将所述反馈信息发送至所述主机。
如权利要求10或11所述的方法，其特征在于，所述方法还包括：

所述存储设备通过所述至少两条链路中的正常链路向所述主机发送所述故障链路信息。
一种网络设备，其特征在于，包括：

接收单元，用于接收存储设备发送的故障链路信息，所述网络设备与所述存储设备之间存在至少两条链路；

处理单元，用于根据所述故障链路信息将所述故障链路信息对应的故障链路上的业务切换至所述至少两条链路中的正常链路。
如权利要求13所述的网络设备，其特征在于，所述网络设备还包括发送单元，

所述发送单元，用于向所述存储设备发送用于查询所述故障链路信息的查询请求；

所述接收单元，具体用于接收所述存储设备发送的所述查询请求的反馈信息，所述反馈信息中携带所述故障链路信息。
如权利要求13或14所述的网络设备，其特征在于，

所述处理单元，还用于根据所述故障链路信息，断开所述故障链路。
如权利要求15所述的网络设备，其特征在于，所述处理单元，具体用于：

将错误码发送至多路径软件，所述多路径软件将所述故障链路上的业务切换至所述正常链路。
一种存储设备，其特征在于，包括：

监测单元，用于对与主机交互的链路进行监测，所述存储设备与所述主机之间存在至少两条链路；

发送单元，用于在所述监测单元监测到链路故障时，向所述主机发送故障链路信息，以使所述主机根据所述故障链路信息将所述故障链路上的业务切换至所述至少两条链路中的正常链路；

接收单元，用于接收所述主机通过所述正常链路下发的业务。
如权利要求17所述的存储设备，其特征在于，

所述接收单元，还用于接收所述主机发送的用于查询所述故障链路信息的查询请求；

所述发送单元，还用于将所述故障链路信息携带在所述查询请求的反馈信息中，并将所述反馈信息发送至所述主机。
如权利要求17或18所述的存储设备，其特征在于，所述发送单元，具体用于：

通过所述至少两条链路中的正常链路向所述主机发送所述故障链路信息。
一种计算设备，其特征在于，所述计算设备包括存储器和处理器，所述处理器执行所述存储器中存储的计算机指令，使得所述计算设备执行权利要求6-9任一项所述的方法。
一种计算设备，其特征在于，所述计算设备包括存储器和处理器，所述处理器执行所述存储器中存储的计算机指令，使得所述计算设备执行权利要求10-12任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被处理器执行时实现权利要求6-9任一项所述的方法的功能。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被处理器执行时实现权利要求10-12任一项所述的方法的功能。