CN116319282A - 响应存储网络故障的网口切换方法、系统、终端及介质 - Google Patents

响应存储网络故障的网口切换方法、系统、终端及介质 Download PDF

Info

Publication number
CN116319282A
CN116319282A CN202310330276.5A CN202310330276A CN116319282A CN 116319282 A CN116319282 A CN 116319282A CN 202310330276 A CN202310330276 A CN 202310330276A CN 116319282 A CN116319282 A CN 116319282A
Authority
CN
China
Prior art keywords
network
network interface
storage
switching
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310330276.5A
Other languages
English (en)
Inventor
李孝浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310330276.5A priority Critical patent/CN116319282A/zh
Publication of CN116319282A publication Critical patent/CN116319282A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及存储网络故障处理领域,具体公开一种响应存储网络故障的网口切换方法、系统、终端及介质,创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口;响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口;将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。本发明当某个网络接口发生故障时,查找其他可用的网络接口进行网络配置的切换,原有的应用服务器到存储设备之间的可用路径数量不受影响,最大限度保障的保障存储网络连通性,提升存储网络的高可用性和可靠性,业务更加稳定运行。

Description

响应存储网络故障的网口切换方法、系统、终端及介质
技术领域
本发明涉及存储网络故障处理领域,具体涉及一种响应存储网络故障的网口切换方法、系统、终端及介质。
背景技术
iSCSI(互联网小型计算机系统接口)是一种在TCP/IP上进行数据块传输的标准,iSCSI可以实现在IP网络上运行SCSI协议,使其能够在诸如高速千兆以太网上进行快速的数据存取备份操作。IP-SAN是随着iSCSI出现产生的,因可以使用现网的TCP/IP网络来组建存储网络,相对于以往的网络存储技术,它解决了开放性、容量、传输速度、兼容性、安全性等问题,其优越的性能使其备受关注与青睐。
随着IP-SAN存储网络不断使用和扩展,对存储网络的可靠性和稳定性提出更高的要求,相关的技术是通过使用多条路径冗余来保障存储网络的可靠性。如图1所示为存储网络系统架构示意图,应用服务器一通过路径L1和路径L2与存储设备通信,应用服务器二通过路径L3和路径L4与存储设备通信,实现应用服务器一和应用服务器二的多路径冗余。例如当路径L1发生故障时,应用服务器一自动切换到路径L2实现业务访问。然而在存储网络发生故障时,IP-SAN继续使用可用的网络路径,可用网络路径数量减少,而不对已经故障的网络进行预处理,只是上报存储系统网络故障,存在业务主机使用存储中断的风险。
发明内容
为解决上述问题,本发明提供一种响应存储网络故障的网口切换方法、系统、终端及介质,对故障网络接口进行网络切换,保障原有的应用服务器到存储设备之间的可用路径数量不受影响,业务更加稳定运行。
第一方面,本发明的技术方案提供一种响应存储网络故障的网口切换方法,包括以下步骤:
创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口;
响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口;
将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
在一个可选的实施方式中,将故障网络接口的网络配置切换到目标网络接口之后,还包括以下步骤:
向存储系统上报网络接口故障,并向存储系统提示已切换网络接口。
在一个可选的实施方式中,将故障网络接口的网络配置切换到目标网络接口之后,还包括以下步骤:
实时检测发生故障的网络接口是否恢复正常;
响应于发生故障的网络接口恢复正常,触发回切机制,将恢复正常的网络接口的网络配置从目标网络接口切换回自身。
在一个可选的实施方式中,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口,具体包括:
将故障网络接口所在的存储控制器记为本端存储控制器,与本端存储控制器通过镜像通道连通的存储控制器为对端存储控制器;
检测存储网络故障切换组内归属本端存储控制器网络接口是否存在可用网络接口;
若存在,在归属本端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口;
若不存在,检测存储网络故障切换组内归属对端存储控制器的网络接口是否存在可用网络接口;
若存在,在归属对端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口。
在一个可选的实施方式中,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口,具体还包括:
若归属对端存储控制器的网络接口不存在可用网络接口,向存储系统上报网络接口和链路故障。
在一个可选的实施方式中,将故障网络接口的网络配置切换到目标网络接口,具体包括:
响应于目标网络接口为归属本端存储控制器的网络接口,将故障网络接口的IP地址信息配置到目标网络接口上。
在一个可选的实施方式中,将故障网络接口的网络配置切换到目标网络接口,具体还包括:
响应于目标网络接口为归属对端存储控制器的网络接口,通过镜像通道将故障网络接口的IP地址信息同步到对端存储控制器;
将故障网络接口的IP地址信息配置到目标网络接口上。
第二方面,本发明的技术方案提供一种响应存储网络故障的网口切换系统,包括,
存储网络故障切换组配置模块:创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口;
目标网络接口选择模块:响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口;
网络接口切换模块:将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
第三方面,本发明的技术方案提供一种终端,包括:
存储器,用于存储响应存储网络故障的网口切换程序;
处理器,用于执行所述响应存储网络故障的网口切换程序时实现如上述任一项所述响应存储网络故障的网口切换方法的步骤。
第四方面,本发明的技术方案提供一种计算机可读存储介质,所述可读存储介质上存储有响应存储网络故障的网口切换程序,所述响应存储网络故障的网口切换程序被处理器执行时实现如上述任一项所述响应存储网络故障的网口切换方法的步骤。
本发明提供的一种响应存储网络故障的网口切换方法、系统、终端及介质,相对于现有技术,具有以下有益效果:首先将存储设备的所有网络接口添加到存储网络故障切换组,当某个网络接口发生故障时,在存储网络故障切换组内查找其他可用的网络接口进行网络配置的切换,主动进行故障预处理,原有的应用服务器到存储设备之间的可用路径数量不受影响,最大限度保障的保障存储网络连通性,所有操作全部通过存储侧来完成,而主机侧对存储路径变化的无感知,依然通过原有的网络接口进行存储系统的使用,提升存储网络的高可用性和可靠性,业务更加稳定运行。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是存储网络系统架构示意图。
图2是本发明实施例提供的一种响应存储网络故障的网口切换方法流程示意图。
图3是本发明实施例提供的一种响应存储网络故障的网口切换方法流程示意图。
图4是本发明实施例提供的一种响应存储网络故障的网口切换方法流程示意图。
图5是网络接口故障场景一的切换示意图。
图6是网络接口故障场景二的切换示意图。
图7是网络接口故障场景三的切换示意图。
图8是本发明实施例提供的一种响应存储网络故障的网口切换系统结构示意框图。
图9是本发明实施例提供的一种终端的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
下面对本发明中出现的关键术语进行解释。
IP-SAN:基于IP网络传输SCSI命令,对传统的SCSI存储的解耦,脱离了距离上的限制。
存储设备:由大量的存储单元组成,把多个磁盘组成一个阵列,当作单一磁盘使用,存取数据时,阵列中的相关磁盘一起动作,大幅减低数据的存取时间,同时有更佳的空间利用率。
多路径:主机到存储可以有多条路径可以选择。主机到存储之间的IO由多条路径可以选择。每个主机到所对应的存储可以经过几条不同的路径,每条路径,操作系统会认为是一个实际存在的物理盘,但实际上只是通向同一个物理盘的不同路径而已,这样是在使用的时候,就给用户带来了困惑。 多路径软件就是为了解决上面的问题应运而生的
启动器/目标器:客户端软件通常被称为initiator,也就是启动器,一般部署在应用服务器侧;而服务端软件则被称为target目标器,target端即磁盘阵列,通过iscsi协议target端将磁盘空间映射到网络上,initiator端就可以寻找发现并使用该磁盘。。基于iSCSI协议,当主机连接到存储时,在主机就可以看到一个磁盘,该磁盘与本端磁盘没有任何差别。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
为了方便理解,首先对本申请所适用的系统进行描述。本申请提供的一种响应存储网络故障的网口切换方法,可以应用于如图1所示的存储网络系统架构中。该系统架构中包括应用服务器和存储设备,存储设备包括多个存储控制器,应用服务器的多个网口与多个存储控制器的网口通信,实现应用服务器与存储设备之间的多路径冗余。在IP-SAN组网中,应用服务器作为启动器initiator,存储设备作为目标器target,通过网络连接,使启动器initiator与目标器target的IP可以互通,从而建立连接,存储设备的LUN就可以映射给应用服务器来使用。例如应用服务器一通过路径L1和路径L2与存储设备通信,应用服务器二通过路径L3和路径L4与存储设备通信,网络链路冗余,同时链路进行负载分担,提升性能。
为保证存储网络的可靠性,相关的技术是当应用服务器与存储设备之间的某条路径发生故障时,切换到另一条路径提供业务访问。然而IP-SAN继续使用可用的网络路径,网络可用路径减少,而对已经故障的网络不进行预处理,只是上报存储系统网络故障,存在业务主机使用存储中断的风险。基于此,本发明提供一种响应存储网络故障的网口切换方法,在存储设备的某个网络接口发生故障时,把故障网络接口的网络配置切换到指定网络接口,实现网络故障的预处理,应用服务器与存储设置之间的可用路径数量不变,能够保证存网络不发生中断的风险,保障存储网络的高可靠性。
图2是本发明实施例提供的一种响应存储网络故障的网口切换方法流程示意图,图2执行主体可以为一种响应存储网络故障的网口切换系统,运行于存储设备端的计算机终端中。根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
如图2所示,该方法包括以下步骤。
SS1,创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口。
首先进行存储网络故障切换组的创建,在存储网络故障切换组内添加网络接口成员,包括存储设备的所有网络接口,例如图1中的网络接口A1、A2、B1、B2全部加入到存储网络故障切换组,用于在某个网络接口发生故障时,把故障网络接口的网络配置切换到指定网络接口。
SS2,响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口。
当存储设备的某个网络接口发生故障时,先在存储网络故障切换组中找一个可用的网络接口作为指定的网络接口,之后将故障网络接口的网络配置切换到该指定的网络接口。
SS3,将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
将故障网络接口的网络配置切换到目标网络接口是指将故障网络接口的IP地址信息配置到目标网络接口,此时应用服务器与存储设备之间通过目标网络接口保持通信,而其他未故障的网络接口也依旧保持与应用服务器的通信,应用服务器与存储设备之间的可以路径数量不变。
本实施例提供的响应存储网络故障的网口切换方法,当某个网络接口发生故障时,查找其他可用的网络接口进行网络配置的切换,主动进行故障预处理,原有的应用服务器到存储设备之间的可用路径数量不受影响,最大限度保障的保障存储网络连通性,所有操作全部通过存储侧来完成,而主机侧对存储路径变化的无感知,依然通过原有的网络接口进行存储系统的使用,提升存储网络的高可用性和可靠性,业务更加稳定运行。
图3是本发明实施例提供的一种响应存储网络故障的网口切换方法流程示意图,图3执行主体可以为一种响应存储网络故障的网口切换系统,运行于存储设备端的计算机终端中。根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
如图3所示,该方法包括以下步骤。
SS1,创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口。
SS2,响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口。
SS3,将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
SS4,向存储系统上报网络接口故障,并向存储系统提示已切换网络接口。
当某个网络接口发生故障后,向存储系统上报网络接口故障,告知存储系统发生故障的是哪个网络接口,供管理人员及时处理。同时,向存储系统提示已切换网络接口。
SS5,实时检测发生故障的网络接口是否恢复正常。
之后监测发生故障的网络接口是否已经恢复正常,例如设置检测间隔时长,可周期性地检测发生故障的网络接口是否已经恢复正常,以实现网络回切。
SS6,响应于发生故障的网络接口恢复正常,触发回切机制,将恢复正常的网络接口的网络配置从目标网络接口切换回自身。
网口故障发生后,为了保持业务的可用性,之前通过故障网络接口与存储设备通信的应用服务器在进行网口切换后,会与其他应用服务器共用网络接口,这样的话会增加单个网络接口的负载,因此在网络故障恢复后,会触发回切机制,恢复存储网络原有的链接状态,继续提供网络连接。
本实施例提供的响应存储网络故障的网口切换方法,当某个网络接口发生故障时,查找其他可用的网络接口进行网络配置的切换,主动进行故障预处理,原有的应用服务器到存储设备之间的可用路径数量不受影响,最大限度保障的保障存储网络连通性,所有操作全部通过存储侧来完成,而主机侧对存储路径变化的无感知,依然通过原有的网络接口进行存储系统的使用,提升存储网络的高可用性和可靠性,业务更加稳定运行。同时支持网络回切机制,在故障网络接口故障恢复后,原有的网络配置重新回切到原网口,继续提供网络连接,避免持续增加单个网络接口的负载。
图4是本发明实施例提供的一种响应存储网络故障的网口切换方法流程示意图,图4执行主体可以为一种响应存储网络故障的网口切换系统,运行于存储设备端的计算机终端中。根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
如图4所示,该方法包括以下步骤。
SS1,创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口。
SS2,响应于存储设备的某个网络接口发生故障,检测存储网络故障切换组内归属本端存储控制器网络接口是否存在可用网络接口,若存在则执行步骤SS3,若不存在则执行步骤SS4。
需要说明的是,将故障网络接口所在的存储控制器记为本端存储控制器,与本端存储控制器通过镜像通道连通的存储控制器为对端存储控制器。存储网络故障切换组内包含本端存储控制器和对端存储控制器的所有网络接口。
SS3,在归属本端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口,之后执行步骤SS7。
SS4,检测存储网络故障切换组内归属对端存储控制器的网络接口是否存在可用网络接口,若存在则执行步骤SS5,若不存在则执行步骤SS6。
SS5,在归属对端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口,之后执行步骤SS7。
SS6,向存储系统上报网络接口和链路故障。
本实施例在存储设备的某个网络接口发生故障时,把故障网络接口的网络配置切换到指定的网络接口,并且优先在故障网络接口所归属的本端存储控制器寻找可用网络接口进行切换,其次在对端存储控制器上寻找可用网络接口,最后无可用网络接口的情况下上报存储系统网络端口和链路故障。
SS7,将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
将故障网络接口的网络配置切换到目标网络接口是指将故障网络接口的IP地址信息配置到目标网络接口。本实施例中存在两种情况的网络接口切换,一种是切换到本端存储控制器的可用网络接口,另一种是切换到对端存储控制器的可用网络接口。
第一种情况,响应于目标网络接口为归属本端存储控制器的网络接口,直接将故障网络接口的IP地址信息配置到目标网络接口上。
第二种情况,响应于目标网络接口为归属对端存储控制器的网络接口,首先通过镜像通道将故障网络接口的IP地址信息同步到对端存储控制器,之后将故障网络接口的IP地址信息配置到目标网络接口上。
SS8,向存储系统上报网络接口故障,并向存储系统提示已切换网络接口。
SS9,实时检测发生故障的网络接口是否恢复正常。
SS10,响应于发生故障的网络接口恢复正常,触发回切机制,将恢复正常的网络接口的网络配置从目标网络接口切换回自身。
本实施例提供的响应存储网络故障的网口切换方法,当某个网络接口发生故障时,查找其他可用的网络接口进行网络配置的切换,优先在故障网络接口所归属的本端存储控制器寻找可用网络接口进行切换,其次在对端存储控制器上寻找可用网络接口,最后无可用网络接口的情况下上报存储系统网络端口和链路故障,保障切换效率,实现主动进行故障的预处理,原有的应用服务器到存储设备之间的可用路径数量不受影响,最大限度保障的保障存储网络连通性,所有操作全部通过存储侧来完成,而主机侧对存储路径变化的无感知,依然通过原有的网络接口进行存储系统的使用,提升存储网络的高可用性和可靠性,业务更加稳定运行。同时支持网络回切机制,在故障网络接口故障恢复后,原有的网络配置重新回切到原网口,继续提供网络连接,避免持续增加单个网络接口的负载。
为进一步理解本发明,以下提供几种网络接口故障场景,说明其网口切换过程,以对本发明进一步详细说明。
图5是网络接口故障场景一的切换示意图,当网络接口B1发生故障时,网络故障管理功能模块会查询存储设备故障切换组内是否在 B1所归属的存储控制器B上有可用网络接口,本端存储控制器B内存在可用网络接口B2,网络故障管理功能模块会将网络接口B1上的网络配置会切换到网络接口B2,网络接口B1的IP地址信息会被配置到网络接口B2上,并通知存储系统进行IO切换,此时存储设备通过A1、B2网口保持与应用服务器一通信。此时应用服务器一依然是2条可用路径,并且网络故障管理功能模块上报存储系统网络接口B1故障,并提示已切换网口。
图6是网络接口故障场景二的切换示意图,网络接口A1和B1都发生故障,网络故障管理功能模块通过存储控制器之间的镜像通道检测到,存储控制器A、B上各存在可用网络接口A2和B2,此时网络故障管理功能模块会将A1和B1网口的IP地址信息重新配置到 A2和B2上,并通知存储系统进行IO切换,此时存储设备通过A2、B2网口保持与应用服务器一通信,如此继续提供业务访问。应用服务器一原本的2条可用路A1 、B1径均已故障,存储业务已无法使用,通过上述故障处理切换保障依然是2条可用路径,保障业务不中断,并且网络故障管理功能模块上报存储系统网络接口A1、B1故障,并提示已切换端口。
图7是网络接口故障场景三的切换示意图,网络接口B1和B2都发生故障,网络故障管理功能模块通过存储控制器A、B之间的镜像通道检测到,存储控制器A上存在可用端口A1和A2,此时网络故障管理功能模块会通过存储控制器A、B间的镜像通道将网络接口 B1和B2的IP地址信息同步到存储控制器A,并在A1、A2上进行IP配置,然后通知存储系统进行IO切换,保障了在单个存储控制器故障或无可用网络接口时,存储网络路径依然能够正常使用。并且网络故障管理功能模块会上报存储系统网络接口B1、 B2故障和存储控制器B无可用切换端口,并提示已切换端口。
因为网络故障发生后,为了保持业务的可用性,某个应用服务器会与其他应用服务器共用网络接口,这样的话会增加单个网络接口的负载,因此在网络故障恢复后,网络故障管理功能模块会触发回切机制,恢复存储网络原有的链接状态。如当场景二中的已故障的A1、B1恢复正常,网络故障管理功能模块会触发网络回切机制,已经切换到A2、B2的网络配置会重新切换到A1、B1上,恢复原有的如图1所示的网络连接,网络故障管理功能模块上报存储系统消除网络故障告警。
上文中对于一种响应存储网络故障的网口切换方法的实施例进行了详细描述,基于上述实施例描述的响应存储网络故障的网口切换方法,本发明实施例还提供了一种与该方法对应的响应存储网络故障的网口切换系统。
本实施例中,所述响应存储网络故障的网口切换系统800根据其所执行的功能,可以被划分为多个功能模块,图8是响应存储网络故障的网口切换系统800结构示意框图。所述功能模块可以包括:存储网络故障切换组配置模块810、目标网络接口选择模块820、网络接口切换模块830。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。
存储网络故障切换组配置模块810:创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口。
目标网络接口选择模块820:响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口。
网络接口切换模块830:将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
在一个可选的实施方式中,系统800还包括故障上报模块840,配置用于向存储系统上报网络接口故障,并向存储系统提示已切换网络接口。
在一个可选的实施方式中,系统800还包括网络接口回切模块850,配置用于实时检测发生故障的网络接口是否恢复正常,响应于发生故障的网络接口恢复正常,触发回切机制,将恢复正常的网络接口的网络配置从目标网络接口切换回自身。
在一个可选的实施方式中,目标网络接口选择模块820查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口,具体包括:
将故障网络接口所在的存储控制器记为本端存储控制器,与本端存储控制器通过镜像通道连通的存储控制器为对端存储控制器;
检测存储网络故障切换组内归属本端存储控制器网络接口是否存在可用网络接口;
若存在,在归属本端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口;
若不存在,检测存储网络故障切换组内归属对端存储控制器的网络接口是否存在可用网络接口;
若存在,在归属对端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口。
在一个可选的实施方式中,目标网络接口选择模块820还配置用于若归属对端存储控制器的网络接口不存在可用网络接口,向存储系统上报网络接口和链路故障。
在一个可选的实施方式中,网络接口切换模块830将故障网络接口的网络配置切换到目标网络接口,具体包括:响应于目标网络接口为归属本端存储控制器的网络接口,将故障网络接口的IP地址信息配置到目标网络接口上。
在一个可选的实施方式中,网络接口切换模块830将故障网络接口的网络配置切换到目标网络接口,具体包括:响应于目标网络接口为归属对端存储控制器的网络接口,通过镜像通道将故障网络接口的IP地址信息同步到对端存储控制器;将故障网络接口的IP地址信息配置到目标网络接口上。
图9为本发明实施例提供的一种终端900的结构示意图,包括:处理器910、存储器920及通信单元930。所述处理器910用于实现存储器920中保存的响应存储网络故障的网口切换程序时实现以下步骤:
SS1,创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口;
SS2,响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口;
SS3,将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
本发明首先将存储设备的所有网络接口添加到存储网络故障切换组,当某个网络接口发生故障时,在存储网络故障切换组内查找其他可用的网络接口进行网络配置的切换,主动进行故障预处理,原有的应用服务器到存储设备之间的可用路径数量不受影响,最大限度保障的保障存储网络连通性,所有操作全部通过存储侧来完成,而主机侧对存储路径变化的无感知,依然通过原有的网络接口进行存储系统的使用,提升存储网络的高可用性和可靠性,业务更加稳定运行。
该终端900包括处理器910、存储器920及通信单元930。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器920可以用于存储处理器910的执行指令,存储器920可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器920中的执行指令由处理器910执行时,使得终端900能够执行以下上述方法实施例中的部分或全部步骤。
处理器910为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器920内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC) 组成,例如可以由单颗封装的IC 所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器910可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元930,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,这里所说的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random accessmemory,简称:RAM)等。
计算机存储介质存储有响应存储网络故障的网口切换程序,所述响应存储网络故障的网口切换程序被处理器执行时实现以下步骤:
SS1,创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口;
SS2,响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口;
SS3,将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
本发明首先将存储设备的所有网络接口添加到存储网络故障切换组,当某个网络接口发生故障时,在存储网络故障切换组内查找其他可用的网络接口进行网络配置的切换,主动进行故障预处理,原有的应用服务器到存储设备之间的可用路径数量不受影响,最大限度保障的保障存储网络连通性,所有操作全部通过存储侧来完成,而主机侧对存储路径变化的无感知,依然通过原有的网络接口进行存储系统的使用,提升存储网络的高可用性和可靠性,业务更加稳定运行。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (10)

1.一种响应存储网络故障的网口切换方法,其特征在于,包括以下步骤:
创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口;
响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口;
将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
2.根据权利要求1所述的响应存储网络故障的网口切换方法,其特征在于,将故障网络接口的网络配置切换到目标网络接口之后,还包括以下步骤:
向存储系统上报网络接口故障,并向存储系统提示已切换网络接口。
3.根据权利要求2所述的响应存储网络故障的网口切换方法,其特征在于,将故障网络接口的网络配置切换到目标网络接口之后,还包括以下步骤:
实时检测发生故障的网络接口是否恢复正常;
响应于发生故障的网络接口恢复正常,触发回切机制,将恢复正常的网络接口的网络配置从目标网络接口切换回自身。
4.根据权利要求1、2或3所述的响应存储网络故障的网口切换方法,其特征在于,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口,具体包括:
将故障网络接口所在的存储控制器记为本端存储控制器,与本端存储控制器通过镜像通道连通的存储控制器为对端存储控制器;
检测存储网络故障切换组内归属本端存储控制器网络接口是否存在可用网络接口;
若存在,在归属本端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口;
若不存在,检测存储网络故障切换组内归属对端存储控制器的网络接口是否存在可用网络接口;
若存在,在归属对端存储控制器的可用网络接口中选择一个可用网络接口作为目标网络接口。
5.根据权利要求4所述的响应存储网络故障的网口切换方法,其特征在于,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口,具体还包括:
若归属对端存储控制器的网络接口不存在可用网络接口,向存储系统上报网络接口和链路故障。
6.根据权利要求5所述的响应存储网络故障的网口切换方法,其特征在于,将故障网络接口的网络配置切换到目标网络接口,具体包括:
响应于目标网络接口为归属本端存储控制器的网络接口,将故障网络接口的IP地址信息配置到目标网络接口上。
7.根据权利要求6所述的响应存储网络故障的网口切换方法,其特征在于,将故障网络接口的网络配置切换到目标网络接口,具体还包括:
响应于目标网络接口为归属对端存储控制器的网络接口,通过镜像通道将故障网络接口的IP地址信息同步到对端存储控制器;
将故障网络接口的IP地址信息配置到目标网络接口上。
8.一种响应存储网络故障的网口切换系统,其特征在于,包括,
存储网络故障切换组配置模块:创建存储网络故障切换组,在存储网络故障切换组内添加存储设备的所有网络接口;
目标网络接口选择模块:响应于存储设备的某个网络接口发生故障,查找存储网络故障切换组内其他可用的网络接口,并选择出一个可用网络接口作为目标网络接口;
网络接口切换模块:将故障网络接口的网络配置切换到目标网络接口,基于目标网络接口提供业务访问。
9.一种终端,其特征在于,包括:
存储器,用于存储响应存储网络故障的网口切换程序;
处理器,用于执行所述响应存储网络故障的网口切换程序时实现如权利要求1-7任一项所述响应存储网络故障的网口切换方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质上存储有响应存储网络故障的网口切换程序,所述响应存储网络故障的网口切换程序被处理器执行时实现如权利要求1-7任一项所述响应存储网络故障的网口切换方法的步骤。
CN202310330276.5A 2023-03-30 2023-03-30 响应存储网络故障的网口切换方法、系统、终端及介质 Pending CN116319282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310330276.5A CN116319282A (zh) 2023-03-30 2023-03-30 响应存储网络故障的网口切换方法、系统、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310330276.5A CN116319282A (zh) 2023-03-30 2023-03-30 响应存储网络故障的网口切换方法、系统、终端及介质

Publications (1)

Publication Number Publication Date
CN116319282A true CN116319282A (zh) 2023-06-23

Family

ID=86777861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310330276.5A Pending CN116319282A (zh) 2023-03-30 2023-03-30 响应存储网络故障的网口切换方法、系统、终端及介质

Country Status (1)

Country Link
CN (1) CN116319282A (zh)

Similar Documents

Publication Publication Date Title
US10489254B2 (en) Storage cluster failure detection
EP1410229B1 (en) HIGH-AVAILABILITY CLUSTER VIRTUAL SERVER SYSTEM and method
EP1437658B1 (en) Coordinating persistent status information with multiple file servers
US7594134B1 (en) Dual access pathways to serially-connected mass data storage units
JP2005209201A (ja) 高可用性クラスタにおけるノード管理
EP3214865B1 (en) Cluster arbitration method and multi-cluster coordination system
CN112181660A (zh) 一种基于服务器集群的高可用方法
CN111431980B (zh) 分布式存储系统及其路径切换方法
CN108572976A (zh) 一种分布式数据库中数据恢复方法、相关设备和系统
CN103490914A (zh) 一种网络应用设备多机热备的切换系统及方法
US20070180287A1 (en) System and method for managing node resets in a cluster
CN113328916A (zh) Bfd检测模式的切换方法、装置及设备
EP2069934B1 (en) Fault-tolerant medium access control (mac) address assignment in network elements
CN110675614A (zh) 一种电力监控数据的传输方法
CN106027313B (zh) 网络链路容灾系统及方法
CN105245361A (zh) 用于Linux系统的数据高可用系统、方法和装置
CN117435405A (zh) 双机热备和故障切换系统和方法
CN117421158A (zh) 数据库故障处理方法、系统及存储介质
EP3167372B1 (en) Methods for facilitating high availability storage services and corresponding devices
CN116319282A (zh) 响应存储网络故障的网口切换方法、系统、终端及介质
CN116347489A (zh) 一种基于数据中心的业务处理方法
CN114301763B (zh) 分布式集群故障的处理方法及系统、电子设备及存储介质
JP3621634B2 (ja) 冗長構成切替システム
CN114297178A (zh) 数据库集群的构建方法和电子设备
CN111414411A (zh) 高可用度数据库系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination