CN115529236A - 无损网络配置方法、装置及计算机设备 - Google Patents

无损网络配置方法、装置及计算机设备 Download PDF

Info

Publication number
CN115529236A
CN115529236A CN202211076979.1A CN202211076979A CN115529236A CN 115529236 A CN115529236 A CN 115529236A CN 202211076979 A CN202211076979 A CN 202211076979A CN 115529236 A CN115529236 A CN 115529236A
Authority
CN
China
Prior art keywords
network
script
server
lossless
network configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211076979.1A
Other languages
English (en)
Inventor
李夕玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211076979.1A priority Critical patent/CN115529236A/zh
Publication of CN115529236A publication Critical patent/CN115529236A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0886Fully automatic configuration

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种对RoCE网络内的设备进行无损网络配置的方法,包括:将预先整合的无损网络配置流程封装为脚本;将脚本上传至RoCE网络内的目标设备;执行脚本,以对RoCE网络内的每个设备进行无损网络配置。无损网络配置流程包括监测脚本运行环境、检测RoCE网络拓扑完整性、服务器无损网络配置、交换机无损网络配置和存储设备无损网络配置。RoCE网络内的设备包括服务器,交换机,存储设备。本申请能够提高无损网络配置效率。

Description

无损网络配置方法、装置及计算机设备
技术领域
本申请涉及无损网络配置领域,特别是涉及一种对RoCE网络内的设备进行无损网络配置的方法、装置、计算机设备。
背景技术
在现今互联网行业中数据为王的时代,用户对于互联网的使用体验有更高的要求。然而,传统的TCP/IP(Transmission Control Protocol/Internet Protocol,传输控制协议/网际协议)以太网连接占用了大量的CPU资源,并且需要额外的数据处理,已无法再满足当前更快、更高效和可扩展性的用户需求。在这样的大环境下,RoCE(RDMA overConverged Ethernet,基于融合以太网的远程直接存储器访问)逐渐走进了人们的视野。RDMA(Remote Direct Memory Access,远程直接数据存取)就是用于解决网络传输中服务器端数据处理的延迟而产生的,基于IBTA(InfiniBand Trade Association,无限宽带网络协议)标准中定义的网络协议ROCE,允许通过以太网络使用RDMA无需使用CPU(CentralProcessing Unit/Processor,中央处理器),就可以从一个主机或服务器的内存直接访问另一主机或服务器的内存。它释放了CPU去执行其应做的工作,比如运行应用程序和处理大量数据。这既提高了带宽又降低了延迟、抖动和CPU消耗。
在RoCE网络中,需要构建无损以太网用于保证网络传输过程中不丢包。构建无损以太网需支持以下关键特性:PFC(Priority-based Flow Control,基于优先级的流量控制)逐跳提供基于优先级的流量控制,能够实现在以太网链路上运行多种类型的流量而互不影响。ECN(Explicit Congestion Notification,显示拥塞通知)设备发生拥塞时,通过对报文IP头中ECN域的标识,由接收端向发送端发出降低发送速率的CNP(CongestionNotification Packet,拥塞通知报文),实现端到端的拥塞管理,减缓拥塞扩散恶化。
然而,发明人注意到,虽然RoCE网络有众多优点:提高数据传输吞吐量、减少网络延时、降低CPU负载等。但是,实现最优策略网络传输同样需要具备的条件是:两端网络设备均需支持RoCE网卡,支持构建无损网络。这是因为IB(InfiniBand,无限带宽互联结构)的丢包处理机制中,任意一个报文的丢失都会造成大量的重传,严重影响数据传输性能。而且,传统的以太网配置方法是逐个访问拓扑内网络设备,大批量的命令行需要由人工输入。这就需要技术人员拥有足够专业的技术储备,针对于服务器、交换机、存储三层网络设备专业的命令行及代码熟练使用,对于该部分应用,新手不易实现。此外,人工进行大批量的命令行输入还会存在工作耗时冗长,效率低,代码正确性难以保障,自查繁琐的问题。
发明内容
本申请针对上述不足或缺点,提供了一种对RoCE网络内的设备进行无损网络配置的方法、装置及计算机设备。本申请实施例能够将对RoCE网络内的设备的无损网络配置流程整合封装至一个脚本中,该脚本可在服务器或者存储设备任意一端执行。每当需要对RoCE网络内的设备进行无损网络配置时,仅需执行该脚本即可将RoCE网络内的设备进行无损网络配置,无需采用人工录入大批量的命令行的方式。实现无损网络配置流程的便捷化、自动化和精确化。此外,还能提高无损网络配置的可靠性。
本申请根据第一方面提供了一种对RoCE网络内的设备进行无损网络配置的方法,包括:
将预先整合的无损网络配置流程封装为脚本;
将脚本上传至RoCE网络内的目标设备;
执行脚本,以对RoCE网络内的每个设备进行无损网络配置。
在一些实施例中,执行脚本,以对RoCE网络内的每个设备进行无损网络配置,包括:
执行脚本,以依次对RoCE网络内的服务器、交换机和存储设备进行无损网络配置。
在一些实施例中,执行脚本,对RoCE网络内的服务器进行无损网络配置,包括:
执行脚本,以将目标驱动文件加载至服务器的根目录;
执行目标驱动文件,以为服务器安装ofd驱动;ofd为开放版式文档;
为服务器的RoCE网络连接进行以太网卡的ip配置;ip为网络通信协议;
开启服务器的PFC功能,完成无损网络配置;服务器的ECN默认处于开启状态;PFC为基于优先级的流量控制;ECN为显示拥塞通知。
在一些实施例中,执行脚本,对RoCE网络内的交换机进行无损网络配置,包括:
配置多个VLAN,以搭建局域网用于向服务器和存储设备提供局域网连接环境;VLAN为虚拟局域网,
开启交换机的PFC和ECN,完成无损网络配置。
在一些实施例中,在对服务器和交换机完成无损网络配置之后,服务器通过交换机向存储设备发送端口接入指令;执行脚本,对RoCE网络内的交换机进行无损网络配置,包括:
获取来自服务器发送的端口接入指令;存储设备的PFC和ECN默认处于开启状态;
根据端口接入指令依次进行业务端口ip配置和集群端口ip配置,使得存储设备完成无损网络配置。
在一些实施例中,在对RoCE网络内的每个设备进行无损网络配置之前,还包括:
检测服务器和存储设备是否有网卡;
在检测到服务器和存储设备均有网卡时,对RoCE网络内的每个设备进行无损网络配置。
在一些实施例中,检测服务器和存储设备是否有网卡,包括:
执行环境检测指令以确定脚本的运行位置;运行位置为服务器或存储设备;
分别执行服务器查询指令和存储设备查询指令;
根据服务器查询指令的执行结果检测服务器中是否有网卡,以及根据存储设备查询指令的执行结果检测存储设备是否有网卡。
在一些实施例中,方法包括:
监测脚本的全局动态;
若全局动态出现异常,则中断脚本的执行过程,打印脚本的异常位置,根据异常位置设置断点;
若全局动态没有出现异常,则继续执行脚本。
本申请根据另一方面还提供了一种对RoCE网络内的设备进行无损网络配置的装置,包括:
配置流程封装模块:用于将预先整合的无损网络配置流程封装为脚本;
脚本上传模块:用于将脚本上传至RoCE网络内的目标设备;
无损网络配置模块:用于执行脚本,以对RoCE网络内的每个设备进行无损网络配置。
本申请根据另一方面还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述对RoCE网络内的设备进行无损网络配置方法的步骤。
在本申请上述实施例中,采用了一种对RoCE网络内的设备进行无损网络配置方法,能够将对RoCE网络内的设备的无损网络配置流程整合封装至一个脚本中,每当需要对RoCE网络内的设备进行无损网络配置时,仅需执行该脚本,无需重复地人工录入大批量的命令行。在上述实施例中,该脚本可在服务器或者存储设备任意一端执行。
具体地,针对现有的无损网络配置的方法,大部分都需要人工配置,在实际配置过程中,由于需要技术人员具备足够专业的技术储备,针对于服务器、交换机、存储设备三层网络设备专业的命令行及代码熟练使用。因此,对于该部分应用的新手不易实现。即便是让熟练的技术人员来配置三层网络设备的无损网络,照样会出现工作耗时冗长,效率极低的问题。而且,由于代码输入的步骤繁琐,所以在无损网络配置时,代码指令输入的精确性难以保证,自查相对麻烦。
因此,为了将上述服务器、交换机、存储设备三层RoCE网络内的设备进行无损配置,执行预先封装的脚本,执行脚本时,会先进行环境检测,确定该脚本的运行位置为服务器或者是存储设备。继续执行脚本,检测RoCE网络拓扑完整性。具体地,检测RoCE网络拓扑完整性即为检测上述服务器和存储设备是否有网卡,若有网卡,则视为RoCE网络拓扑完整。通过执行上述脚本的检测流程,确保脚本的运行环境和RoCE网络拓扑完整,提高了无损网络配置的可靠性。在脚本执行完上述检测流程后,依次对上述服务器、交换机、存储设备进行无损网络配置。
在无损网络配置流程中,执行脚本,先对服务器进行无损网络配置。具体地,先对服务器安装ofd驱动,然后进行以太网卡的ip配置,最后开启PFC功能,完成服务器的无损网络配置流程。继续执行脚本,对交换机进行无损网络配置,具体地,先配置多个VLAN,然后开启PFC和ECN的功能完成交换机的无损网络配置流程。上述VLAN即为虚拟局域网,用于将服务器和存储设备进行网络连接,上述交换机作为整个RoCE网络传输的桥梁。然后,继续执行脚本,对存储设备进行无损网络配置。具体地,在上述交换机完成无损网络配置后,上述存储设备接受来自服务器发送的端口接入指令,使得存储设备接入RoCE网络。然后,继续执行脚本,使得存储设备分别进行业务端口ip配置和集群端口ip配置,完成存储设备的无损网络配置流程。通过上述方法的步骤,在执行脚本对服务器进行无损网络配置的过程中,每一步的流程均由封装进脚本的代码依次执行,避免了大批量命令行的人工输入,实现无损网络配置流程的便捷化和自动化。此外,执行上述脚本还会进行全局动态异常流检测流程,用以对上述任一流程进行异常监测。若出现异常,则中断脚本执行,退出脚本,打印出错点,设备断点,通过上述全局动态异常流检测流程,实现了无损网络配置流程的精确化。
附图说明
图1为本申请一个或多个实施例中对RoCE网络内的设备进行无损网络配置的方法流程示意图;
图2为本申请一个或多个实施例中RoCE网络拓扑结构示意图;
图3为本申请一个或多个实施例中执行脚本来对RoCE网络内的设备进行无损网络配置的方法流程图;
图4为本申请一个或多个实施例中执行脚本来对服务器进行无损网络配置的流程图;
图5为本申请一个或多个实施例中执行脚本来对交换机进行无损网络配置的流程图;
图6为本申请一个或多个实施例中执行脚本来对存储设备进行无损网络配置的流程图;
图7为本申请一个或多个实施例中检测服务器和存储设备是否有网卡的流程图;
图8为本申请一个或多个实施例中全局动态异常流检测流程图;
图9为本申请一个或多个实施例中对RoCE网络内的设备进行无损网络配置的装置示意图。
图10为本申请一个或多个实施例中一种计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请根据第一方面提供了一种对RoCE网络内的设备进行无损网络配置的方法的流程图如图1所示,该方法通过将脚本上传至服务器或者存储设备的任一一端执行。先检测脚本的执行环境,该执行环境可以为服务器或者存储设备。然后检测上述服务器或者存储设备是否有网卡,即检测RoCE网络拓扑完整性。最后,依次将RoCE网络内的每个设备,包括服务器,交换机,存储设备进行无损网络配置。此外,还会执行脚本进行全局异常流检测,对上述的每一个步骤进行监测。
其中,RoCE网络的拓扑结构可以如图2所示,其中,存储设备的每个控制器的一个端口与存储设备的一个端口划分为业务VLAN(Virtual Local Area Network,虚拟局域网)。存储设备又分别两个端口,该两个端口均被划分为集群VLAN。综上,一个存储设备包括两个业务VLAN的端口与两个集群VLAN的端口,即一共四个端口全部与交换机连接。交换机作为存储设备与服务器的网络连接中介,仅与服务器的两个端口进行ip连接。通过上述的RoCE网络的拓扑结构,可以实现单个服务器通过交换机服务多个存储设备。
本申请根据第一方面提供了一种对RoCE网络内的设备进行无损网络配置的方法,在一些实施例中,如图3所示,包括:
S110:将预先整合的无损网络配置流程封装为脚本;
S120:将脚本上传至RoCE网络内的目标设备;
S130:执行脚本,以对RoCE网络内的每个设备进行无损网络配置。
示例性地,在本实施例中,先将预先整合的无损网络配置流程封装为脚本,该预先整合的无损网络配置流程可以为执行如图1所示流程的代码,将该代码封装为脚本。然后,将该脚本上传至RoCE网络内的目标设备,该目标设备可以为服务器或存储设备。最后执行该脚本,以对RoCE网络内的每个设备进行无损网络配置。其中,执行该脚本可以由上述服务器或存储设备来执行,RoCE网络内的每个设备包括服务器、交换机、存储设备。
本实施例可以实现在无需人工重复录入大批量的命令行的情况下,将脚本上传至服务器或存储设备中执行,自动对RoCE网络内的设备进行无损网络配置。实现无损网络配置流程的便捷化、自动化和精确化。
在一些实施例中,执行脚本,以对RoCE网络内的每个设备进行无损网络配置,包括:
执行脚本,以依次对RoCE网络内的服务器、存储设备和交换机进行无损网络配置。
示例性地,在本实施例中,可以由服务器或存储设备执行脚本,来依次对RoCE网络内的三层设备,即服务器、交换机和存储设备进行无损网络配置。
具体地,由于交换机作为RoCE网络拓扑中服务器与存储设备进行网络连接的中介,因此在本实施例中需要先对服务器进行无损网络配置,再对交换机进行无损网络配置,待服务器和交换机均完成无损网络配置后,服务器通过交换机向存储设备发送端口接入指令后,开始对存储设备进行无损网络配置。通过上述方法,可以实现对RoCE网络内的设备无损网络配置的自动化,精确化。
在一些实施例中,执行脚本,对RoCE网络内的服务器进行无损网络配置,包括:
S210:执行脚本,以将目标驱动文件加载至服务器的根目录;
S220:执行目标驱动文件,以为服务器安装ofd驱动;ofd为开放版式文档;
S230:为服务器的RoCE网络连接进行以太网卡的ip配置;ip为网络通信协议;
S240:开启服务器的PFC功能,完成无损网络配置;服务器的ECN默认处于开启状态;PFC为基于优先级的流量控制;ECN为显示拥塞通知。
示例性地,在本实施例中,可以由服务器或存储设备执行脚本,用于将目标驱动文件加载至服务器的根目录中,该目标驱动文件为脚本的附件中保存的驱动文件,然后执行上述目标驱动文件,以在服务器中安装ofd驱动,以及对服务器的RoCE网络连接进行以太网卡的ip配置,最后,继续执行脚本开启服务器的PFC功能,完成无损网络配置。
示例性地,在本实施例中,由服务器或存储设备执行脚本,先对服务器进行ofd驱动安装,安装过程可以为:
(1)执行脚本,将目标文件加载至服务器根目录,将ofd驱动解压,在根目录执行命令:./mlnxofedinstall–with-nvmf、/etc/init.d/openibd restart;
(2)使能原生的nvme多路径:创建或修改/etc/modprobe.d/nvme_core.conf文件,增加行options nvme_core multipath=N”;上述nvme是一中逻辑设备额接口规范;更新img文件、重启dracut-f/boot/initramfs-`uname-r`.img`uname-r`;reboot;上述img为一种文件压缩格式;上传nvme-cli最新版本压缩包至服务器根目录下,执行如下指令进行安装:make/make install。
在完成上述ofd驱动安装后,继续执行脚本,确定服务器的设备端口处于同一RoCE网络,然后进行以太网卡的ip配置。该脚本可以执行如下指令:cma_roce_tos-d mlx5_1-t104;vconfig add enp250s0f020;ifconfig enp250s0f0.20 192.168.2.51netmask255.255.255.0up;ip link set enp250s0f0.20 type vlan egress 2:3;cat/proc/net/vlan/enp250s0f0.20。通过执行上述指令来确定服务器的设备端口处于同一RoCE网络中,然后进行以太网卡的ip配置,且可以通过上述最后一条指令查看上述步骤是否成功执行。最后,继续执行脚本开启服务器的PFC功能。其中,服务器的ECN位于服务器的网卡上,默认开启,无需特意执行脚本来开启。通过上述方法,实现了对服务器进行自动化和精确化的无损网络配置。
在一些实施例中,执行脚本,对RoCE网络内的交换机进行无损网络配置,包括:
S310:配置多个VLAN,以搭建局域网用于向服务器和存储设备提供局域网连接环境;VLAN为虚拟局域网;
S320:开启交换机的PFC和ECN,完成无损网络配置。
示例性地,在本实施例中,可以由服务器或存储设备执行脚本,用于配置多个VLAN,以搭建局域网用于向服务器和存储设备提供局域网连接环境。然后将上述VLAN的端口设置为access模式后,开启交换机的PFC和ECN,完成无损网络配置。
示例性地,在本实施例中,根据RoCE网络的拓扑需求可以设置多个VLAN。按照标准原则,一般会划分为三个VLAN,包括一个业务VLAN和两个集群VLAN。其中,存储设备的控制器的一个端口与存储设备的主机端业务端口划分为业务VLAN。存储设备另外再分别设置两个端口,将该两个端口划分两个集群VLAN。相对应地,交换机也具有相应的业务VLAN端口和集群VLAN端口与上述存储设备的相应端口相连,下述讨论的是交换机的端口。
在本实施例中,每设置一个VLAN,以vlan1为例,执行如下指令:configureterminal;vlan datebace;vlan 1(举例vlan1)。若要设置多个VLAN,只需将vlan1改为vlanN,N为任一自然数,重复执行上述指令即可设置多个VLAN。
当上述多个VLAN设置完毕后,将上述VLAN的端口设置为access模式,以vlan1为例,执行如下指令:configure terminal;interface eth-0-1;switchport mode access(将交换机端口1设置为access模式);switchport access vlan 1(将交换机端口1加入vlan 1)。
当上述多个VLAN的端口均设置为access模式后,以vlan1为例,开启交换机的PFC和ECN的功能:
(1)执行下述指令开启交换机端口1的PFC的功能:
configure terminal;interface eth-0-1;priority-flow-control mode on(表示开启端口1的PFC的功能);
priority-flow-control enable priority 3(表示开启所有端口的PFC的功能,假设端口数量为3)。
(2)执行下述指令开启交换机的ECN的功能:
configure terminal;class-map type traffic-class ecn_pri3;matchtraffic-class 3;exit;policy-map type traffic-class ecn_pmap;class typetraffic-class ecn_pri3;random-detect maximum-threshold 400ecn。(表示开启所有端口的ECN的功能,假设端口数量为3)
(3)若需要指定开启交换机中端口3的ECN,则执行下述指令:
configure terminal;interface eth-0-3;service-policy type traffic-class ecn_pmap。
通过上述操作,依次开启交换机的所有端口的PFC和ECN的功能,完成交换机的无损网络配置,实现了对交换机进行自动化和精确化的无损网络配置。
在一些实施例中,在对服务器和交换机完成无损网络配置之后,服务器通过交换机向存储设备发送端口接入指令;执行脚本,对RoCE网络内的存储设备进行无损网络配置,包括:
S410:获取来自服务器发送的端口接入指令;存储设备的PFC和ECN默认处于开启状态;
S420:根据端口接入指令依次进行业务端口ip配置和集群端口ip配置,使得存储设备完成无损网络配置。
示例性地,在本实施例中,在对服务器和交换机完成无损网络配置之后,可以由服务器通过交换机向存储设备发送端口接入指令,用以开启存储设备的无损网络配置流程。上述存储设备先获取来自服务器发送的端口接入指令,然后根据端口接入指令依次进行业务端口ip配置和集群端口ip配置。
具体地,在本实施例中,可以执行下述指令,使得存储设备从交换机的端口中获取到来自服务器发送的端口接入指令。假设VLAN数量为3:
mtinq lsnodeip|grep active–delim,|cut–d,-f2|sed 1p,表示保存结果至port_id1;
mtinq lsnodeip|grep active–delim,|cut–d,-f2|sed 2p,表示保存结果至port_id2;
mtinq lsnodeip|grep active–delim,|cut–d,-f2|sed 3p,表示保存结果至port_id3。
通过上述指令,使得存储设备保存上述端口接入指令。
在上述存储设备保存端口接入指令后,分别对存储设备的业务端口和集群端口进行ip配置:
(1)执行下述指令,对存储设备的业务端口进行ip配置:
mcsop cfgportip-gw 192.168.2.1-ip 192.168.2.20-mask 255.255.255.0-node 1-vlan 1port_id1。
(2)执行下述指令,对存储设备的集群端口进行ip配置:
mtop chnodeip–ip 192.168.3.11–gw 192.168.3.1–mask 255.255.255.0–port_id port_id2–vlan 2;mtop chnodeip–ip 192.168.4.11–gw 192.168.4.1–mask255.255.255.0–port_id port_id2–vlan 3。
通过上述方法,在存储设备的PFC和ECN默认开启的条件下,依次将存储设备端口与交换机的对应端口进行ip连接,即可完成存储设备的无损网络配置,实现了对存储设备进行自动化和精确化的无损网络配置。
在一些实施例中,在对RoCE网络内的每个设备进行无损网络配置,还包括:检测服务器和存储设备是否有网卡;在检测到服务器和存储设备均有网卡时,对RoCE网络内的每个设备进行无损网络配置。
示例性地,在对RoCE网络内的每个设备进行无损网络配置之前,还需要通过执行脚本来检测服务器和存储设备是否有网卡,确保RoCE网络拓扑结构的完整性。在确认服务器和存储设备均有网卡后,再对RoCE网络内的每个设备进行无损网络配置。通过上述方法,可以提高无损网络配置的可靠性。
在一些实施例中,检测服务器和存储设备是否有网卡,包括:
S510:执行环境检测指令以确定脚本的运行位置;运行位置为服务器或存储设备;
S520:分别执行服务器查询指令和存储设备查询指令;
S530:根据服务器查询指令的执行结果检测服务器中是否有网卡,以及根据存储设备查询指令的执行结果检测存储设备是否有网卡。
示例性地,在对RoCE网络内的每个设备进行无损网络配置之前,还需要执行脚本检测服务器和存储设备是否有网卡。首先执行脚本进行环境检测,确定脚本的运行位置,该运行位置可以为服务器或存储设备。分别执行脚本中的下述指令:服务器查询指令(mtinqlshardware)和存储设备查询指令(lspci),借此来根据服务器查询指令的执行结果检测服务器中是否有网卡,以及根据存储设备查询指令的执行结果检测存储设备是否有网卡,最后判断RoCE网络拓扑结构的完整性。通过上述方法,在确保服务器和存储设备均有网卡后再执行无损网络配置,可以提高无损网络配置的可靠性。
在一些实施例中,方法还包括:
S610:监测脚本的全局动态;
S620:若全局动态出现异常,则中断脚本的执行过程,打印脚本的异常位置,根据异常位置设置断点;
S630:若全局动态没有出现异常,则继续执行脚本。
示例性地,监测脚本的全局动态主要包括监测以下5个处理流程的运行状态:
(1)监测脚本运行环境;
(2)检测RoCE网络拓扑完整性;
(3)服务器无损网络配置;
(4)交换机无损网络配置;
(5)存储设备无损网络配置。
若上述全局动态的任一流程出现异常报错,则中断脚本执行过程,退出脚本,打印出错位置,根据异常位置设置断点。用户根据报错信息,可以对脚本中的异常进行定位、检查、修改、重新执行。而且,由于全局动态中各个流程之间不存在必然联系,重复执行时,脚本从断点处继续执行。通过上述方法,在脚本运行过程中,再执行一个全局动态异常流检测,可以提高无损网络配置的可靠性。
本申请根据另一方面还提供了一种对RoCE网络内的设备进行无损网络配置的系统,包括:
配置流程封装模块110:用于将预先整合的无损网络配置流程封装为脚本;
脚本上传模块120:用于将脚本上传至RoCE网络内的目标设备;
无损网络配置模块130:用于执行脚本,以对RoCE网络内的每个设备进行无损网络配置。
在一些实施例中,配置流程封装模块110,具体用于将预先整合的无损网络配置流程封装为脚本,该预先整合的无损网络配置流程可以为执行如图1所示流程的代码,将该代码封装为脚本。
在一些实施例中,配置流程封装模块120,具体用于将脚本上传至RoCE网络内的目标设备,该目标设备可以为服务器或存储设备。
在一些实施例中,配置流程封装模块130,具体用于执行脚本,以对RoCE网络内的每个设备进行无损网络配置。其中,执行该脚本可以由上述服务器或存储设备来执行,RoCE网络内的每个设备包括服务器、交换机、存储设备。
本申请根据另一方面还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述对RoCE网络内的设备进行无损网络配置方法的步骤。
在本申请上述实施例中,将对RoCE网络内的设备的无损网络配置流程整合封装至一个脚本中,每当需要对RoCE网络内的设备进行无损网络配置时,执行该脚本即可自动执行无损网络配置。在本实施例中,脚本可在服务器或者存储设备任意一端执行。
具体地,针对现有的无损网络配置方法,大部分为人工配置,在实际配置过程中,由于需要技术人员具备足够专业的技术储备,针对于服务器、交换机、存储设备三层网络设备专业的命令行及代码熟练使用。因此,对于该部分应用的新手不易实现。即便是让熟练的技术人员来配置三层网络设备的无损网络,照样会出现工作耗时冗长,效率极低的问题。而且,由于代码输入的步骤繁琐,所以在无损网络配置时,代码指令输入的精确性难以保证,自查相对麻烦。
因此,为了解决上述问题,得以将上述服务器、交换机、存储设备三层RoCE网络内的设备进行全自动化的无损配置,执行上述脚本,先进行环境检测,确定该脚本的运行位置是服务器或者是存储设备。继续执行脚本,检测RoCE网络拓扑完整性。具体地,检测RoCE网络拓扑完整性即为检测上述服务器和存储设备是否有网卡,若有网卡,则视为RoCE网络拓扑完整。通过执行预先封装的脚本的检测流程,在执行脚本时,会先进行环境检测,确保脚本的运行环境和RoCE网络拓扑完整,提高了无损网络配置的可靠性。脚本在完成上述检测流程后,依次对上述服务器、交换机、存储设备进行无损网络配置。
在无损网络配置流程中,执行脚本,先对服务器进行无损网络配置。具体地,先对服务器安装ofd驱动,然后进行以太网卡的ip配置,最后开启PFC功能,完成服务器的无损网络配置流程。继续执行脚本,对交换机进行无损网络配置,具体地,先配置多个VLAN,然后开启PFC和ECN的功能完成交换机的无损网络配置流程。上述VLAN即为虚拟局域网,用于将服务器和存储设备进行网络连接,上述交换机作为整个RoCE网络传输的中介。然后,继续执行脚本,对存储设备进行无损网络配置。具体地,在上述交换机完成无损网络配置后,上述存储设备接受来自服务器发送的端口接入指令,使得存储设备接入RoCE网络。然后,继续执行脚本,使得存储设备分别进行业务端口ip配置和集群端口ip配置,完成存储设备的无损网络配置流程。通过上述方法的步骤,在执行脚本对服务器进行无损网络配置的过程中,每一步的流程均由封装进脚本的代码依次执行,避免了大批量命令行的人工输入,实现无损网络配置流程的便捷化和自动化。此外,执行上述脚本还会进行全局动态异常流检测流程,用以对上述任一流程进行异常监测。若出现异常,则中断脚本执行,退出脚本,打印出错点,设备断点,通过上述全局动态异常流检测流程,实现了无损网络配置流程的精确化。
本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)、直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种对RoCE网络内的设备进行无损网络配置的方法,其特征在于,包括:
将预先整合的无损网络配置流程封装为脚本;
将所述脚本上传至所述RoCE网络内的目标设备;
执行所述脚本,以对所述RoCE网络内的每个设备进行无损网络配置。
2.根据权利要求1所述的方法,其特征在于,执行所述脚本,以对所述RoCE网络内的每个设备进行无损网络配置,包括:
执行所述脚本,以依次对所述RoCE网络内的服务器、交换机和存储设备进行无损网络配置。
3.根据权利要求2所述的方法,其特征在于,执行所述脚本,对所述RoCE网络内的服务器进行无损网络配置,包括:
执行所述脚本,以将目标驱动文件加载至所述服务器的根目录;
执行所述目标驱动文件,以为所述服务器安装ofd驱动;所述ofd为开放版式文档;
为所述服务器的RoCE网络连接进行以太网卡的ip配置;所述ip为网络通信协议;
开启所述服务器的PFC功能,完成无损网络配置;所述服务器的ECN默认处于开启状态;所述PFC为基于优先级的流量控制;所述ECN为显示拥塞通知。
4.根据权利要求2所述的方法,其特征在于,执行所述脚本,对所述RoCE网络内的交换机进行无损网络配置,包括:
配置多个VLAN,以搭建局域网用于向所述服务器和存储设备提供局域网连接环境;所述VLAN为虚拟局域网,
开启所述交换机的PFC和ECN,完成无损网络配置。
5.根据权利要求2所述的方法,其特征在于,在对所述服务器和所述交换机完成无损网络配置之后,所述服务器通过所述交换机向所述存储设备发送端口接入指令;执行所述脚本,对所述RoCE网络内的交换机进行无损网络配置,包括:
获取来自所述服务器发送的端口接入指令;所述存储设备的PFC和ECN默认处于开启状态;
根据所述端口接入指令依次进行业务端口ip配置和集群端口ip配置,使得所述存储设备完成无损网络配置。
6.根据权利要求1所述的方法,其特征在于,在对所述RoCE网络内的每个设备进行无损网络配置之前,还包括:
检测所述服务器和所述存储设备是否有网卡;
在检测到所述服务器和所述存储设备均有网卡时,对所述RoCE网络内的每个设备进行无损网络配置。
7.根据权利要求6所述的方法,其特征在于,检测所述服务器和所述存储设备是否有网卡,包括:
执行环境检测指令以确定所述脚本的运行位置;所述运行位置为所述服务器或所述存储设备;
分别执行服务器查询指令和存储设备查询指令;
根据所述服务器查询指令的执行结果检测所述服务器中是否有网卡,以及根据所述存储设备查询指令的执行结果检测所述存储设备是否有网卡。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述方法包括:
监测所述脚本的全局动态;
若所述全局动态出现异常,则中断所述脚本的执行过程,打印所述脚本的异常位置,根据所述异常位置设置断点;
若所述全局动态没有出现异常,则继续执行所述脚本。
9.一种对RoCE网络内的设备进行无损网络配置的装置,其特征在于,包括:
配置流程封装模块:用于将预先整合的无损网络配置流程封装为脚本;
脚本上传模块:用于将所述脚本上传至所述RoCE网络内的目标设备;
无损网络配置模块:用于执行所述脚本,以对所述RoCE网络内的每个设备进行无损网络配置。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
CN202211076979.1A 2022-09-05 2022-09-05 无损网络配置方法、装置及计算机设备 Pending CN115529236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211076979.1A CN115529236A (zh) 2022-09-05 2022-09-05 无损网络配置方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211076979.1A CN115529236A (zh) 2022-09-05 2022-09-05 无损网络配置方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN115529236A true CN115529236A (zh) 2022-12-27

Family

ID=84697485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211076979.1A Pending CN115529236A (zh) 2022-09-05 2022-09-05 无损网络配置方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN115529236A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106899454A (zh) * 2017-03-06 2017-06-27 郑州云海信息技术有限公司 一种基于Linux系统下自动化测试RoCE性能的方法及系统
CN109495306A (zh) * 2018-11-27 2019-03-19 平安科技(深圳)有限公司 一种业务网络的扩容方法及设备
CN112348196A (zh) * 2019-08-08 2021-02-09 深圳致星科技有限公司 一种自适应rdma网络的分布式机器学习系统及方法
CN112532447A (zh) * 2020-11-27 2021-03-19 锐捷网络股份有限公司 一种rdma参数配置的方法、装置及存储介质
CN115391202A (zh) * 2022-08-26 2022-11-25 苏州浪潮智能科技有限公司 一种多控集群roce性能测试方法、装置、终端及存储介质
CN116962184A (zh) * 2023-07-07 2023-10-27 苏州浪潮智能科技有限公司 一种自动部署RoCE集群的方法、系统、终端及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106899454A (zh) * 2017-03-06 2017-06-27 郑州云海信息技术有限公司 一种基于Linux系统下自动化测试RoCE性能的方法及系统
CN109495306A (zh) * 2018-11-27 2019-03-19 平安科技(深圳)有限公司 一种业务网络的扩容方法及设备
CN112348196A (zh) * 2019-08-08 2021-02-09 深圳致星科技有限公司 一种自适应rdma网络的分布式机器学习系统及方法
CN112532447A (zh) * 2020-11-27 2021-03-19 锐捷网络股份有限公司 一种rdma参数配置的方法、装置及存储介质
CN115391202A (zh) * 2022-08-26 2022-11-25 苏州浪潮智能科技有限公司 一种多控集群roce性能测试方法、装置、终端及存储介质
CN116962184A (zh) * 2023-07-07 2023-10-27 苏州浪潮智能科技有限公司 一种自动部署RoCE集群的方法、系统、终端及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘军;韩骥;魏航;郭亮;: "数据中心RoCE和无损网络技术", 中国电信业, no. 07, 15 July 2020 (2020-07-15) *
范旭光;: "无损网络数据中心应用概述", 通信世界, no. 33, 5 December 2019 (2019-12-05), pages 1 - 2 *

Similar Documents

Publication Publication Date Title
EP3605323B1 (en) Method for generating network slice template and for applying network slice template, and apparatus
CN111756674B (zh) 网络通信方法、系统、设备及计算机可读存储介质
US11228480B2 (en) Gateway assisted diagnostics and repair
JP7345921B2 (ja) マスタースレーブアーキテクチャのota差分更新方法とシステム
CN113419812B (zh) 一种虚拟化环境下端口转发测试方法、装置、设备及介质
CN111752582A (zh) 局域网内的软件更新方法、装置及电子设备
WO2020100581A1 (ja) 評価装置、評価方法および評価プログラム
CN111490947A (zh) 数据包发送方法、数据包接收方法、系统、设备及介质
CN100375427C (zh) 一种集群设备批量传输文件的方法及文件传输设备
CN115422048A (zh) 链路稳定性测试方法、装置、计算机设备和存储介质
CN114268927A (zh) 一种车载通信方法、装置、设备及存储介质
CN115529236A (zh) 无损网络配置方法、装置及计算机设备
CN111522571A (zh) 设备升级方法、装置、终端设备及存储介质
CN115883360A (zh) 一种基于物联网多层分级的远程升级方法
JP4415391B2 (ja) データをネットワークに送信する方法及び装置並びにデータをネットワークから受信する方法及び装置
CN112436982B (zh) 一种网络流量自动混跑测试方法、系统、终端及存储介质
CN112448839B (zh) 一种网卡配置方法、装置及计算机存储介质
CN114285739A (zh) 一种节点信息批量配置方法、装置、终端及存储介质
CN111026667B (zh) 脚本执行方法、装置和电子设备
CN114338477A (zh) 一种通信链路监控方法、装置、设备及存储介质
CN112565398B (zh) Gfs数据下载方法、装置、电子设备以及存储介质
CN114610331A (zh) 软件安装方法和系统
CN117714360B (zh) 数据路由方法、装置、电子设备、存储介质及程序产品
CN117240659A (zh) 网关交互方法、系统及服务器
CN116938710A (zh) 一种终端固件升级方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination