CN115022180A - 一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质 - Google Patents

一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质 Download PDF

Info

Publication number
CN115022180A
CN115022180A CN202210542626.XA CN202210542626A CN115022180A CN 115022180 A CN115022180 A CN 115022180A CN 202210542626 A CN202210542626 A CN 202210542626A CN 115022180 A CN115022180 A CN 115022180A
Authority
CN
China
Prior art keywords
service domain
host
member device
equipment
update
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210542626.XA
Other languages
English (en)
Other versions
CN115022180B (zh
Inventor
万红明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cisco Networking Technology Co Ltd
Original Assignee
Inspur Cisco Networking Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cisco Networking Technology Co Ltd filed Critical Inspur Cisco Networking Technology Co Ltd
Priority to CN202210542626.XA priority Critical patent/CN115022180B/zh
Publication of CN115022180A publication Critical patent/CN115022180A/zh
Application granted granted Critical
Publication of CN115022180B publication Critical patent/CN115022180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本说明书实施例公开了一种基于RoCE‑SAN的拓扑管理方法、装置、设备及介质,包括:在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析同步报文得到对应的业务域ID,同步报文包括第一主机的设备信息与业务域ID;当前成员设备根据业务域ID确定第一主机对应的第一业务域;当前成员设备将第一主机的设备信息加入到第一业务域下的设备列表中,并对第一业务域启动更新定时器;若更新定时器的更新时间到期,当前成员设备向第一成员设备发送更新请求报文,并记录第一发送时刻;若当前成员设备在第一发送时刻的第一预设时间后未收到第一成员设备发送的更新请求报文对应的应答报文,在第一业务域下的设备列表中将第一主机的设备信息删除。

Description

一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质
技术领域
本说明书涉及通信工程技术领域,尤其涉及一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质。
背景技术
当前,业内主要使用FC-SAN和IP-SAN网络为各种业务系统提供存储接入服务,但各有缺点和瓶颈。RoCE-SAN是一种基于RoCE协议的高性能存储区域网络,具备零丢包、低时延、即插即用及故障快速收敛等特点,能够兼备FC-SAN和IP-SAN的优点,并且实现FC-SAN与IP-SAN的融合。RoCE-SAN在功能、IOPS性能和故障收敛性能方面均达到并优于FC-SAN和IP-SAN,具备替代FC-SAN和IP-SAN的可行性。
现有的实现方案主要是利用TCP协议构建存储接入网络。如图1所示的RoCE-SAN存储区域网络示意图,Host为主机和存储阵列,两台Spine核心交换机作为TCP server,二者互为备份且整网三层路由可达,其它所有Leaf交换机作为停TCP client,每个server和client之间都需要建立TCP连接并交互协议报文。Leaf交换机之间不需要建立TCP连接,只需要与主机(Host)直连,Spine交换机之间也不需要建立TCP连接,二者互为备份。协议报文是TCP封装的报文,包含设备关键信息的内容承载在TCP报文的Data字段内。Leaf交换机可以通过协议报文将设备关键信息发送给spine交换机,spine交换机汇总后再发往其他所有Leaf交换机。Leaf交换机通过LLDP协议发现本地挂载的Host设备信息并通过协议报文将这些信息发送给Spine,Spine再将这些设备信息发送给所有其它Leaf交换机,每台Leaf交换机下都需要保存本地Host设备信息和远端Host设备信息,本Leaf下的远端Host设备就是其它Leaf下的本地Host设备。
在实际操作过程中,如果Leaf1断电或Leaf1与两个Spine之间的链路全部断开,此时Leaf1跟其它Leaf完全断开联系,Leaf1无法快速感知并及时将所有远端Host(Host3和Host4)设备信息删除,也无法通过状态通知报文通知本地Host设备快速删除它们与远端Host建立的链接。同时Leaf2交换机也无法快速感知Leaf1交换机异常,进而快速删除Leaf2下保存的远端设备Host1和Host2。其中Leaf1会将它的本地设备Host1和Host2信息同步给Leaf2,Host1和Host2就属于Leaf2的远端设备,同样Leaf2下的本地设备Host3和Host4属于Leaf1的远端设备。
发明内容
本说明书一个或多个实施例提供了一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质,用于解决现有技术提出的上述技术问题。
本说明书一个或多个实施例采用下述技术方案:
本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理方法,所述方法应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述方法包括:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理装置,所述装置应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述装置包括:
解析单元,在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
业务域确定单元,所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
列表加入单元,所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
报文发送单元,若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
信息删除单元,若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理设备,所述设备应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述计算机可执行指令设置为:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
本说明书实施例设计了一种RoCE-SAN存储网络中的远端设备管理状态机,可以有效识别每个业务域下是否有远端设备丢失,从而将丢失的远端表项删除,保持网络拓扑的稳定性和健壮性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本说明书一个或多个实施例提供的一种RoCE-SAN存储区域网络示意图;
图2为本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理方法的流程示意图;
图3为本说明书一个或多个实施例提供的一种通信协议报文格式示意图;
图4为本说明书一个或多个实施例提供的一种拓扑管理协议状态机流程;
图5为本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理装置的结构示意图;
图6为本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理设备的结构示意图。
具体实施方式
本说明书实施例提供一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
图2为本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理方法的流程示意图,该流程可以由拓扑管理系统执行,该系统可以快速感知并及时将出现故障的所有远端主机设备信息删除,保持网络拓扑的健壮性和稳定性。流程中的某些输入参数或者中间结果允许人工干预调节,以帮助提高准确性。
本说明书实施例可以应用于RoCE-SAN网络拓扑结构,该拓扑结构包括相互连接的成员设备与广播设备,成员设备可以连接多个主机,每个主机分别对应预先配置的业务域。
本说明书实施例的方法流程步骤如下:
S202,在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID。
在本说明书实施例中,第一主机为远端设备,比如,当前设备可以为图1中的Leaf1,Leaf1的本地设备为Host1(主机1)和Host2(主机2),第一成员设备为图1中的Leaf2,Leaf2下的本地设备Host3(主机3)和Host4(主机4),Host3和Host4属于Leaf1的远端设备,其中,主机3可以为第一主机。
S204,所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域。
由于每台Leaf交换机下都需要保存本地Host设备信息和远端Host设备信息,当前的第一主机的设备信息即为远端Host设备信息,由此,需要执行S106。
S206,所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器。
在本说明书实施例中,当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器的过程中,当前成员设备可以将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并标记为所述第一主机已上线,将所述第一业务域设定为Active状态,对处于Active状态的所述第一业务域启动更新定时器,Active状态可以说明第一主机已上线,可以启用更新定时器,通过更新定时器可以获知第一主机的状态,详细步骤可以参见下述内容。
S208,若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
本说明书实施例在向所述第一成员设备发送更新请求报文后,第一成员设备若可以接收所述更新请求报文,说明第一成员设备并未发生故障,更新请求报文包括业务域ID与当前成员设备的Mac地址,此处的业务域ID与上述提到的业务域ID相同;然后,第一成员设备对所述更新请求报文进行解析,确定出所述业务域ID对应的所述第一业务域及所述当前成员设备的Mac地址;之后,第一成员设备将所述第一业务域下的已上线的第一主机的设备信息、所述业务域ID与所述当前成员设备的Mac地址进行封装,得到所述应答报文;最后,第一成员设备将所述应答报文进行广播。
本说明书实施例在第一成员设备将所述应答报文进行广播后,当前成员设备接收所述应答报文,所述应答报文中的Mac地址字段为所述当前成员设备的Mac地址,则解析所述应答报文,得到所述第一业务域下的已上线的第一主机的设备信息;其他成员设备接在收所述应答报文,所述应答报文中的Mac地址字段并不是其他成员设备的Mac地址,则丢弃所述应答报文。
所述若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,具体包括:
若所述更新定时器的更新时间到期,将第一业务域设定为Update状态,Update状态可以说明第一成员设备的第一业务域处于更新状态,需要接收第一成员设备连接的第一主机进行回应,以确保第一主机处于正常工作的状态;对处于Update状态的所述第一业务域,所述当前成员设备向所述第一成员设备发送更新请求报文,若第一成员设备可以回复应答报文,可以说明第一成员设备与第一主机处于正常状态,否则,可以说明第一成员设备或第一主机处于故障状态,无法回复应答报文。
S210,若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将第一主机的设备信息删除。
在本说明书实施例中,若当前成员设备未收到应答报文,可能存在的情况为,第一成员设备断电或第一成员设备与两个广播设备之间的链路全部断开。第一成员设备与当前成员设备失去通信联系,此时当前成员设备向第一成员设备发送的更新请求报文得不到应答,当前成员设备的设备列表中将第一主机的设备信息删除。若第一成员设备还连接有其他主机,也可以将其他主机的设备信息删除。
在本说明书实施例中,若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,可能第一成员设备已经发送更新请求报文对应的应答报文,但该应答报文并未被当前成员设备接收,所以,所述当前成员设备可以向所述第一成员设备再次发送所述更新请求报文,并记录第二发送时刻;若所述当前成员设备在所述第二发送时刻的第二预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
在本说明书实施例中,若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除,具体包括:
所述若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,将第一业务域设定为Retry状态,Retry状态可以说明第一成员设备的第一业务域首次并未针对当前成员设备的更新请求报文进行回复;对处于Retry状态的所述第一业务域,所述当前成员设备向所述第一成员设备再次发送所述更新请求报文,并记录所述第二发送时刻;所述若所述当前成员设备在所述第二发送时刻的第二预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
需要说明的是,本说明书实施例可以应用于安装RoCE-SAN插件的高性能存储区域网络,为各种系统提供存储接入服务,将智能无损网络应用到存储系统,实现计算和存储网络融合的技术,替代传统的FC-SAN和IP-SAN技术。
本说明书实施例的目的是设计一种RoCE-SAN存储区域网络拓扑管理方法,快速识别感知远端设备故障场景,进而快速发现和删除已丢失的远端设备信息,保持网络拓扑的健壮性和稳定性。
正常情况下,在图1所示的RoCE-SAN存储区域网络示意图中,所有网络设备正常工作,通过配置可以将Host1的IP地址和Host2的IP地址加入同一个配置业务域,也可以加入不同的配置业务域,未配置的Host的IP地址全部加入默认业务域,同一个业务域内的Host设备之间路由可达,不同业务域内的Host设备之间业务隔离,路由不可达,所有的Leaf交换机业务域配置相同。在图1所示的RoCE-SAN存储区域网络示意图中,Host1、Host2分别与Leaf1进行LLDP交互,Leaf1交换机可以将Host1与Host2存入对应业务域内的本地设备列表,并标记它们已上线,然后将它们封装进TCP同步报文并发送给其它所有Leaf交换机。其它Leaf交换机收到TCP同步报文,解析其中的Host设备信息,将该Host表项存入对应业务域下的远端设备列表,并标记它们已上线。需要说明的是,本说明书实施例的Host表项即为Host设备信息。
若Host1和Leaf1交换机之间链路断开,Leaf1交换机下的Host1设备下线,则直接从本地设备列表中删除该表项,Leaf1交换机可以将已下线的Host1设备信息封装进TCP同步报文并发送给其它Leaf交换机,其它Leaf交换机收到TCP同步报文,解析其中的设备Host设备信息,并从对应业务域下的远端设备列表中删除该表项。
其中,Leaf和Spine之间建立TCP连接,Leaf将协议报文发送给Spine,Spine再分发给每一个Leaf交换机,TCP协议报文格式如下图3所示的通信协议报文格式示意图,其中TCP报文的DATA部分主要承载本说明书实施例使用的三种通信协议报文。Version字段代表协议版本号,TYPE字段表示协议报文类型(1表示TCP同步报文,2表示更新请求报文,3表示更新应答报文),TCP同步报文和更新请求报文的源MAC字段填充发送该报文的源Leaf交换机系统MAC地址,更新应答报文的源MAC字段填充其收到的更新请求报文的源MAC字段内容,Host设备列表以TLV的格式封装,TLV中的Type字段为该Host设备IP地址类型(1表示IPV4,2表示IPV6),Lenth表示Host信息长度,value表示要发送的Host设备内容,包括IP地址和上线状态,其它已上线Host设备以同样的TLV格式封装进协议报文中。
针对上述存储接入网络的一种拓扑管理协议状态机流程如图4所示:
S1,Leaf交换机针对每个业务域都维护一套独立的状态机,初始情况下,每个业务域下的远端设备列表为空,此时所有业务域都进入Idle状态。当Leaf交换机收到远端Host上线的TCP同步报文时,解析其中的Host设备信息,根据报文的业务域ID获取该Host属于的业务域,并将该远端Host表项加入对应业务域下的远端设备列表并标记为已上线,该业务域进入Active状态,进入Active状态的业务域启动Update定时器。
S2,如果Update定时器的更新时间到期,该业务域进入Update状态,进入Update状态的业务域向其它所有Leaf交换机发送更新请求报文并记录当前系统时间为T1,其它Leaf交换机收到并解析更新请求报文,获取该请求报文属于的业务域ID及源Leaf交换机MAC地址并封装进更新应答报文中,同时将该业务域下所有已上线的本地设备列表以TLV格式封装进更新应答报文中并发送给其它Leaf交换机。其它Leaf交换机收到更新应答报文中的源MAC字段如果是自己的系统MAC地址,则解析该报文,否则丢弃该报文。
S3,Leaf交换机可以遍历检查每个处于Update状态的业务域下的所有已上线的远端表项,如果有任意一个表项在距离时间T1的特定时间间隔内(默认3秒)没有收到对应的应答报文,则该业务域进入Retry状态,否则该业务域进入Active状态并重新启动Update定时器。
S4,进入Retry状态的业务域尝试向其它所有Leaf交换机再次发送更新请求报文并记录当前系统时间为T2,并等待其它Leaf交换机返回的应答报文,如果重复尝试3次后,该业务域内仍然有远端表项没有收到对应的应答报文,则该业务域进入Delete状态,否则该业务域进入Active状态并重新启动Update定时器。
S5,进入Delete状态的业务域将没有收到应答报文的远端表项从该业务域的远端设备列表中删除,此时如果该业务域的远端设备列表为空,则该业务域进入Idle状态并等待接收下一个远端Host上线的TCP同步报文,否则该业务域进入Active状态并重新启动Update定时器。
进一步地,在图1所示的RoCE-SAN存储区域网络示意图中,如果Leaf1交换机断电或Leaf1与两个Spine之间的链路全部断开,Leaf1与Leaf2失去通信联系,此时Leaf2向Leaf1发送的更新请求报文得不到应答,Leaf2的远端表项Host1和Host2所处的业务域会最终进入Delete状态,并自动删除这两个远端表项。同理,Leaf1的远端表项Host3和Host4所处的业务域会最终进入Delete状态并自动删除这两个远端表项。这种拓扑管理方法可以有效识别每个业务域下的远端表项是否有丢失,从而达到将其删除的目的,保持网络拓扑的健壮性和稳定性。
进一步地,本说明书实施例设计了一种RoCE-SAN存储网络中的远端设备管理状态机,可以有效识别每个业务域下是否有远端设备丢失,从而将丢失的远端表项删除,保持网络拓扑的稳定性和健壮性。
图5为本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理装置的结构示意图,所述装置应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述装置包括:解析单元502、业务域确定单元504、列表加入单元506、报文发送单元508与信息删除单元510。
解析单元502,在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
业务域确定单元504,所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
列表加入单元506,所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
报文发送单元508,若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
信息删除单元510,若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
图6为本说明书一个或多个实施例提供的一种基于RoCE-SAN的拓扑管理设备的结构示意图,所述设备应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述计算机可执行指令设置为:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (10)

1.一种基于RoCE-SAN的拓扑管理方法,其特征在于,所述方法应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述方法包括:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
2.根据权利要求1所述的方法,其特征在于,所述向所述第一成员设备发送更新请求报文后,所述方法还包括:
所述第一成员设备接收所述更新请求报文,所述更新请求报文包括所述业务域ID与当前成员设备的Mac地址;
所述第一成员设备对所述更新请求报文进行解析,确定出所述业务域ID对应的所述第一业务域及所述当前成员设备的Mac地址;
所述第一成员设备将所述第一业务域下的已上线的第一主机的设备信息、所述业务域ID与所述当前成员设备的Mac地址进行封装,得到所述应答报文;
所述第一成员设备将所述应答报文进行广播。
3.根据权利要求2所述的方法,其特征在于,所述第一成员设备将所述应答报文进行广播后,所述方法还包括:
所述当前成员设备接收所述应答报文,所述应答报文中的Mac地址字段为所述当前成员设备的Mac地址,则解析所述应答报文,得到所述第一业务域下的已上线的第一主机的设备信息;
其他成员设备接收所述应答报文,所述应答报文中的Mac地址字段不是其他成员设备的Mac地址,则丢弃所述应答报文。
4.根据权利要求1所述的方法,其特征在于,所述若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除,具体包括:
所述若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,所述当前成员设备向所述第一成员设备再次发送所述更新请求报文,并记录第二发送时刻;
若所述当前成员设备在所述第二发送时刻的第二预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
5.根据权利要求1所述的方法,其特征在于,所述当前成员设备将所述同步报文加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器,具体包括:
所述当前成员设备将所述同步报文加入到所述第一业务域下的设备列表中,并标记为所述第一主机已上线,将所述第一业务域设定为Active状态;
对处于Active状态的所述第一业务域启动更新定时器。
6.根据权利要求1所述的方法,其特征在于,所述若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,具体包括:
若所述更新定时器的更新时间到期,将第一业务域设定为Update状态;
对处于Update状态的所述第一业务域,所述当前成员设备向所述第一成员设备发送更新请求报文。
7.根据权利要求4所述的方法,其特征在于,所述若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除,具体包括:
所述若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,将第一业务域设定为Retry状态;
对处于Retry状态的所述第一业务域,所述当前成员设备向所述第一成员设备再次发送所述更新请求报文,并记录所述第二发送时刻;
所述若所述当前成员设备在所述第二发送时刻的第二预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
8.一种基于RoCE-SAN的拓扑管理装置,其特征在于,所述装置应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述装置包括:
解析单元,在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
业务域确定单元,所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
列表加入单元,所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
报文发送单元,若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
信息删除单元,若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
9.一种基于RoCE-SAN的拓扑管理设备,其特征在于,所述设备应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,应用于RoCE-SAN网络拓扑结构,所述拓扑结构包括相互连接的成员设备与广播设备,所述成员设备连接主机,所述主机对应预先配置的业务域,所述计算机可执行指令设置为:
在当前成员设备收到第一成员设备连接的第一主机上线发送的同步报文时,解析所述同步报文得到对应的业务域ID,所述同步报文包括第一主机的设备信息与所述业务域ID;
所述当前成员设备根据所述业务域ID确定所述第一主机对应的第一业务域;
所述当前成员设备将所述第一主机的设备信息加入到所述第一业务域下的设备列表中,并对所述第一业务域启动更新定时器;
若所述更新定时器的更新时间到期,所述当前成员设备向所述第一成员设备发送更新请求报文,并记录第一发送时刻;
若所述当前成员设备在所述第一发送时刻的第一预设时间后未收到所述第一成员设备发送的所述更新请求报文对应的应答报文,在所述第一业务域下的设备列表中将所述第一主机的设备信息删除。
CN202210542626.XA 2022-05-18 2022-05-18 一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质 Active CN115022180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210542626.XA CN115022180B (zh) 2022-05-18 2022-05-18 一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210542626.XA CN115022180B (zh) 2022-05-18 2022-05-18 一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN115022180A true CN115022180A (zh) 2022-09-06
CN115022180B CN115022180B (zh) 2024-05-28

Family

ID=83069411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210542626.XA Active CN115022180B (zh) 2022-05-18 2022-05-18 一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN115022180B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115883492A (zh) * 2022-11-18 2023-03-31 浪潮思科网络科技有限公司 一种MLAG环境下的RoCE-SAN无损存储网络故障收敛方法
CN115883489A (zh) * 2022-11-17 2023-03-31 浪潮思科网络科技有限公司 一种mlag协议表项同步方法、设备及介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103560961A (zh) * 2013-11-04 2014-02-05 神州数码网络(北京)有限公司 以太网交换机主机路由表项动态更新方法及交换机
CN103560960A (zh) * 2013-11-04 2014-02-05 神州数码网络(北京)有限公司 访问控制列表动态更新方法和以太网交换机
CN103560962A (zh) * 2013-11-04 2014-02-05 神州数码网络(北京)有限公司 以太网交换机主机路由表项自动更新方法及交换机
CN104168140A (zh) * 2014-08-14 2014-11-26 杭州华三通信技术有限公司 Vtep异常情况处理方法及装置
US20150244607A1 (en) * 2014-02-26 2015-08-27 Futurewei Technologies, Inc. Software Defined Networking (SDN) Specific Topology Information Discovery
CN109728972A (zh) * 2018-12-14 2019-05-07 新华三技术有限公司 网络连接检测方法和装置
CN110247784A (zh) * 2018-03-07 2019-09-17 北京京东尚科信息技术有限公司 确定网络拓扑结构的方法和装置
US20200244617A1 (en) * 2019-01-25 2020-07-30 Dell Products L.P. Address Resolution System
CN111682927A (zh) * 2020-04-27 2020-09-18 浪潮思科网络科技有限公司 一种基于mlag环境的报文同步方法、装置、设备及介质
CN111756756A (zh) * 2020-06-28 2020-10-09 深圳市信锐网科技术有限公司 一种终端网络控制方法、装置及电子设备和存储介质
CN114257541A (zh) * 2020-09-10 2022-03-29 华为技术有限公司 一种故障链路的切换方法、系统及相关设备
CN114363238A (zh) * 2021-12-23 2022-04-15 苏州迈科网络安全技术股份有限公司 一种下挂设备信息的展现方法、装置、终端及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103560961A (zh) * 2013-11-04 2014-02-05 神州数码网络(北京)有限公司 以太网交换机主机路由表项动态更新方法及交换机
CN103560960A (zh) * 2013-11-04 2014-02-05 神州数码网络(北京)有限公司 访问控制列表动态更新方法和以太网交换机
CN103560962A (zh) * 2013-11-04 2014-02-05 神州数码网络(北京)有限公司 以太网交换机主机路由表项自动更新方法及交换机
US20150244607A1 (en) * 2014-02-26 2015-08-27 Futurewei Technologies, Inc. Software Defined Networking (SDN) Specific Topology Information Discovery
CN104168140A (zh) * 2014-08-14 2014-11-26 杭州华三通信技术有限公司 Vtep异常情况处理方法及装置
CN110247784A (zh) * 2018-03-07 2019-09-17 北京京东尚科信息技术有限公司 确定网络拓扑结构的方法和装置
CN109728972A (zh) * 2018-12-14 2019-05-07 新华三技术有限公司 网络连接检测方法和装置
US20200244617A1 (en) * 2019-01-25 2020-07-30 Dell Products L.P. Address Resolution System
CN111682927A (zh) * 2020-04-27 2020-09-18 浪潮思科网络科技有限公司 一种基于mlag环境的报文同步方法、装置、设备及介质
CN111756756A (zh) * 2020-06-28 2020-10-09 深圳市信锐网科技术有限公司 一种终端网络控制方法、装置及电子设备和存储介质
CN114257541A (zh) * 2020-09-10 2022-03-29 华为技术有限公司 一种故障链路的切换方法、系统及相关设备
CN114363238A (zh) * 2021-12-23 2022-04-15 苏州迈科网络安全技术股份有限公司 一种下挂设备信息的展现方法、装置、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MOTTI BECK: "Performance evaluation of the RDMA over ethernet (RoCE) standard in enterprise data centers infrastructure", 《PROCEEDINGS OF THE 3RD WORKSHOP ON DATA CENTER - CONVERGED AND VIRTUAL ETHERNET SWITCHING》, 9 September 2011 (2011-09-09) *
李周;刘健;程子敬;: "基于并行冗余协议的网络拓扑快速发现方法", 计算机工程, no. 24, 20 December 2012 (2012-12-20) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115883489A (zh) * 2022-11-17 2023-03-31 浪潮思科网络科技有限公司 一种mlag协议表项同步方法、设备及介质
CN115883492A (zh) * 2022-11-18 2023-03-31 浪潮思科网络科技有限公司 一种MLAG环境下的RoCE-SAN无损存储网络故障收敛方法

Also Published As

Publication number Publication date
CN115022180B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN115022180B (zh) 一种基于RoCE-SAN的拓扑管理方法、装置、设备及介质
US7518983B2 (en) Proxy response apparatus
US20080285436A1 (en) Methods, systems, and computer program products for providing site redundancy in a geo-diverse communications network
CN106878072B (zh) 一种报文传输方法和装置
JP2003258903A (ja) 通信路監視システム
CN109379291B (zh) 一种组网中服务请求的处理方法及装置
WO2014114196A1 (en) Keeping a terminal access location record alive
CN107645386B (zh) 一种获取数据资源的方法和装置
CN105162704A (zh) Overlay网络中组播复制的方法及装置
CN110674096B (zh) 节点故障排查方法、装置、设备及计算机可读存储介质
CN103384211B (zh) 一种具有容错性的数据操作方法及分布式的数据存储系统
CN113839862B (zh) Mclag邻居之间同步arp信息的方法、系统、终端及存储介质
US10404544B2 (en) Network topology determining method and apparatus, and centralized network status information storage device
CN103560962A (zh) 以太网交换机主机路由表项自动更新方法及交换机
US20220345872A1 (en) Method and system for controlling id identifier network mobility based on programmable switch
CN112491638A (zh) 隧道bfd会话建立方法及装置
CN115987871A (zh) 一种基于mqtt的拓扑关系保鲜方法、装置及介质
CN109951388B (zh) 路由不间断方法和主控板
CN104683288A (zh) 消息续传方法和装置
CN115022261B (zh) 一种基于堆叠环境的组播表项同步方法、设备及介质
CN112751907B (zh) 信息处理方法、装置和存储介质及电子装置
CN114006910A (zh) 信息同步的方法及装置
CN113300869B (zh) 带内网络遥感功能通信方法、网络设备及存储介质
CN114430310A (zh) 信息处理方法及其装置、宽带接入服务器、存储介质
CN111224803A (zh) 一种堆叠系统中多主检测方法及堆叠系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant