CN111858414A - 一种io链路故障切换方法、系统、终端及存储介质 - Google Patents

一种io链路故障切换方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN111858414A
CN111858414A CN202010653845.6A CN202010653845A CN111858414A CN 111858414 A CN111858414 A CN 111858414A CN 202010653845 A CN202010653845 A CN 202010653845A CN 111858414 A CN111858414 A CN 111858414A
Authority
CN
China
Prior art keywords
storage controller
port
failure
link
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010653845.6A
Other languages
English (en)
Inventor
范会杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202010653845.6A priority Critical patent/CN111858414A/zh
Publication of CN111858414A publication Critical patent/CN111858414A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller

Abstract

本发明提供一种IO链路故障切换方法、系统、终端及存储介质,包括:确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同;启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。本发明可以缩短存储单节点故障时IO failover时间,降低单节点故障对业务的影响,提升产品竞争力。

Description

一种IO链路故障切换方法、系统、终端及存储介质
技术领域
本发明属于存储系统技术领域,具体涉及一种IO链路故障切换方法、系统、终端及存储介质。
背景技术
现有存储系统中发生单点故障时,依赖主机多路径软件进行IO failover(故障路径切换),但是由于主机端多路径软件的多样性,failover时间不可控。例如,主机多路径软件能够看到H1A1,H1B1,H2A2,H2B2共四条路径。此时若存储B控发生故障,则H1B1和H2B2两条路径发生断开,多路径软件会将IO failover到H1A1和H2A2两条路径上,但是由于多路径的多样性,切换时间从几秒到60S不等,可能对业务的连续性造成影响。
发明内容
针对现有技术的上述不足,本发明提供一种IO链路故障切换方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种IO链路故障切换方法,所述方法包括:
确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同;
启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。
进一步的,所述确认第二存储控制器故障,包括但不限于以下方法的任意一种:
第一存储控制器和第二存储控制器互发心跳信息,若第一存储控制器接收不到第二存储控制器的心跳信息,则判定第二存储控制器故障;
第一存储控制器检测到与第二存储控制器的连接链路故障。
进一步的,在虚拟与第二存储控制器故障物理端口对应的逻辑端口之前,所述方法还包括:
设置第一存储控制器的物理端口与第二存储控制器的物理端口之间的一一映射关系。
第二方面,本发明提供一种IO链路故障切换系统,包括:
端口虚拟单元,配置用于确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同;
端口启动单元,配置用于启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。
进一步的,所述确认第二存储控制器故障,包括但不限于以下方法的任意一种:
第一存储控制器和第二存储控制器互发心跳信息,若第一存储控制器接收不到第二存储控制器的心跳信息,则判定第二存储控制器故障;
第一存储控制器检测到与第二存储控制器的连接链路故障。
进一步的,所述系统还包括:
映射设置单元,配置用于设置第一存储控制器的物理端口与第二存储控制器的物理端口之间的一一映射关系。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的IO链路故障切换方法、系统、终端及存储介质,通过虚拟与故障端口对应的逻辑端口,可以缩短存储单节点故障时IO failover时间,降低单节点故障对业务的影响,提升产品竞争力。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的原理架构图。
图3是本发明一个实施例的系统的示意性框图。
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种IO链路故障切换系统。
如图1所示,该方法100包括:
步骤110,确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同;
步骤120,启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。
为了便于对本发明的理解,下面以本发明IO链路故障切换方法的原理,结合实施例中对IO链路进行故障切换的过程,对本发明提供的IO链路故障切换方法做进一步的描述。
具体的,请参考图2,所述IO链路故障切换方法包括:
S1、确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同。
首先建立两个存储控制器的物理端口之间的映射关系,A1对应B1,A2对应B2。
存储双控正常运行时,主机多路径软件通过H1A1,H1B1,H2A2,H2B2共四条路径下发IO,当B控(存储控制器B)发生故障时,A控(存储控制器A)上的故障检测模块通过心跳消息或者AB控之间的链路LINK DOWN事件检测到该故障,在2S内完成启动NPIV端口功能,在物理端口A1上虚拟逻辑端口B1’,在物理端口A2上虚拟逻辑端口B2’,模拟B控上的两个端口B1、B2(两个虚拟端口的WWPN分别与B1,B2相同)。
S2、启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。
虚拟逻辑端口创建完成后,立即启动逻辑端口B1’和B2’,两个NPIV端口启动后会在1S内分别与H1、H2端口建立login;完成端口漂移后login仍然是H1A1,H1B1,H2A2,H2B2四条。
该过程中主机端感知到的是B1从A路交换机S2端口拔出,H1B1断开(此时会Abort掉H1B1上所有未完成的IO);随后B1接入A路交换机S1端口,H1B1重新建立,可以继续下发IO。整个过程可以控制在2S内。
如图3所示,该系统300包括:
端口虚拟单元210,配置用于确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同;
端口启动单元220,配置用于启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。
可选地,作为本发明一个实施例,所述确认第二存储控制器故障,包括但不限于以下方法的任意一种:
第一存储控制器和第二存储控制器互发心跳信息,若第一存储控制器接收不到第二存储控制器的心跳信息,则判定第二存储控制器故障;
第一存储控制器检测到与第二存储控制器的连接链路故障。
图4为本发明实施例提供的一种终端系统400的结构示意图,该终端系统400可以用于执行本发明实施例提供的IO链路故障切换方法。
其中,该终端系统400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
处理器410为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器410可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元430,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明通过虚拟与故障端口对应的逻辑端口,可以缩短存储单节点故障时IO failover时间,降低单节点故障对业务的影响,提升产品竞争力,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种IO链路故障切换方法,其特征在于,所述方法包括:
确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同;
启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。
2.根据权利要求1所述的方法,其特征在于,所述确认第二存储控制器故障,包括但不限于以下方法的任意一种:
第一存储控制器和第二存储控制器互发心跳信息,若第一存储控制器接收不到第二存储控制器的心跳信息,则判定第二存储控制器故障;
第一存储控制器检测到与第二存储控制器的连接链路故障。
3.根据权利要求1所述的方法,其特征在于,在虚拟与第二存储控制器故障物理端口对应的逻辑端口之前,所述方法还包括:
设置第一存储控制器的物理端口与第二存储控制器的物理端口之间的一一映射关系。
4.一种IO链路故障切换系统,其特征在于,所述系统包括:
确认第二存储控制器故障,在第一存储控制器物理端口上虚拟与第二存储控制器故障物理端口对应的逻辑端口,所述逻辑端口与所述对应故障物理端口的标识符相同;
端口启动单元,配置用于启动逻辑端口,所述逻辑端口通过对应的第一存储器物理端口链路与主机端口建立连接。
5.根据权利要求4所述的系统,其特征在于,所述确认第二存储控制器故障,包括但不限于以下方法的任意一种:
第一存储控制器和第二存储控制器互发心跳信息,若第一存储控制器接收不到第二存储控制器的心跳信息,则判定第二存储控制器故障;
第一存储控制器检测到与第二存储控制器的连接链路故障。
6.根据权利要求4所述的系统,其特征在于,所述系统还包括:
映射设置单元,配置用于设置第一存储控制器的物理端口与第二存储控制器的物理端口之间的一一映射关系。
7.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-3任一项所述的方法。
8.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一项所述的方法。
CN202010653845.6A 2020-07-08 2020-07-08 一种io链路故障切换方法、系统、终端及存储介质 Pending CN111858414A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010653845.6A CN111858414A (zh) 2020-07-08 2020-07-08 一种io链路故障切换方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010653845.6A CN111858414A (zh) 2020-07-08 2020-07-08 一种io链路故障切换方法、系统、终端及存储介质

Publications (1)

Publication Number Publication Date
CN111858414A true CN111858414A (zh) 2020-10-30

Family

ID=73152670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010653845.6A Pending CN111858414A (zh) 2020-07-08 2020-07-08 一种io链路故障切换方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111858414A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104798349A (zh) * 2013-01-30 2015-07-22 惠普发展公司,有限责任合伙企业 响应于端口故障的故障转移
CN107729190A (zh) * 2017-10-19 2018-02-23 郑州云海信息技术有限公司 一种io路径故障转移处理方法和系统
CN109039958A (zh) * 2018-09-13 2018-12-18 郑州云海信息技术有限公司 一种fc端口虚拟化的方法、装置及fc终端设备
CN111352574A (zh) * 2018-12-21 2020-06-30 杭州宏杉科技股份有限公司 路径切换的方法、装置及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104798349A (zh) * 2013-01-30 2015-07-22 惠普发展公司,有限责任合伙企业 响应于端口故障的故障转移
CN107729190A (zh) * 2017-10-19 2018-02-23 郑州云海信息技术有限公司 一种io路径故障转移处理方法和系统
CN109039958A (zh) * 2018-09-13 2018-12-18 郑州云海信息技术有限公司 一种fc端口虚拟化的方法、装置及fc终端设备
CN111352574A (zh) * 2018-12-21 2020-06-30 杭州宏杉科技股份有限公司 路径切换的方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN103181133B (zh) 基于pcie交换的服务器系统及其倒换方法和设备
CN109391514B (zh) 基于高可用性的设备部署方法、服务器、存储介质及装置
CN112235136B (zh) 一种网络文件系统备份方法、系统、终端及存储介质
CN109245926B (zh) 智能网卡、智能网卡系统及控制方法
CN111274077A (zh) 一种磁盘阵列可靠性测试方法、系统、终端及存储介质
CN112463239A (zh) Bios与bmc交互选项默认值修改方法、系统、终端及存储介质
CN112395047A (zh) 虚拟机故障疏散方法、系统及计算机可读介质
CN111181780A (zh) 基于ha集群的主机池切换方法、系统、终端及存储介质
CN110413225B (zh) 高可靠集群存储双活配置方法、系统、终端及存储介质
CN111506331A (zh) 一种服务器bmc刷新方法、系统、终端及存储介质
CN114448828A (zh) 存储双活功能测试方法、系统、终端及存储介质
CN111124780B (zh) 一种UPI Link降速测试方法、系统、终端及存储介质
CN112653576B (zh) 基于Kylin系统的网卡识别处理方法、系统、终端及存储介质
CN113377702A (zh) 两节点集群启动的方法及装置、电子设备和存储介质
CN111221683A (zh) 数据中心交换机双flash热备份方法、系统、终端及存储介质
CN111858414A (zh) 一种io链路故障切换方法、系统、终端及存储介质
CN110620684A (zh) 一种存储双控防脑裂方法、系统、终端及存储介质
CN112491570A (zh) 一种虚拟网卡链路状态设置方法、装置及存储介质
CN111736993A (zh) 一种集群高可用服务配置方法、系统、终端及存储介质
CN111427259A (zh) 一种机框插槽式的主备切换方法、智能设备及存储介质
CN112463195B (zh) 一种集群分组在线升级的方法、系统、终端及存储介质
CN112231170B (zh) 一种数据交互卡监管方法、系统、终端及存储介质
CN112463483A (zh) 一种upi压力测试方法、系统、终端及存储介质
CN114281473A (zh) 云平台测试环境管理方法、系统、终端及存储介质
CN109450682B (zh) 一种ib网卡连通配置方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201030

RJ01 Rejection of invention patent application after publication