CN115658236A - 一种堆叠式的七层网络数据交换系统 - Google Patents

一种堆叠式的七层网络数据交换系统 Download PDF

Info

Publication number
CN115658236A
CN115658236A CN202211387699.2A CN202211387699A CN115658236A CN 115658236 A CN115658236 A CN 115658236A CN 202211387699 A CN202211387699 A CN 202211387699A CN 115658236 A CN115658236 A CN 115658236A
Authority
CN
China
Prior art keywords
network
chip
exchange
processor
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211387699.2A
Other languages
English (en)
Inventor
邹昀辛
王晓光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Computer Technology and Applications
Original Assignee
Beijing Institute of Computer Technology and Applications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Computer Technology and Applications filed Critical Beijing Institute of Computer Technology and Applications
Priority to CN202211387699.2A priority Critical patent/CN115658236A/zh
Publication of CN115658236A publication Critical patent/CN115658236A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种堆叠式的七层网络数据交换系统,属于集群和云计算交换技术领域。本发明通过将一个交换主板和多个计算主板相连,在交换主板上采用等价路由的方式构建集群式的2‑7层数据交换网络。通过交换主板实现2‑3层的网络数据交换,通过多个计算主板完成4‑7层的应用数据交换,与现有负载均衡技术相比,该方案能同时提升2‑3层的网络数据交换性能和4‑7层应用数据交换性能,从而实现了2‑7层网络交换性能的整体提升。

Description

一种堆叠式的七层网络数据交换系统
技术领域
本发明属于集群和云计算技术领域,具体涉及一种堆叠式的七层网络数据交换系统。
背景技术
随着集群和云计算等互联网技术的蓬勃发展,应用交付负载均衡器已成为数据中心应用中的一种常见的网络交换设备。这种设备需要实现2-7层网络数据交换的功能,有两种常见的实现方式:
第一种是在计算主板上集成专用网卡或高速以太网卡,通过软件方式完成2-7层的数据交换。该方案的缺陷是:缺少交换芯片,数据处理完全依赖于软件实现,性能受限,满足不了高吞吐量网络的负载需求。
第二种是将计算主板和交换主板通过网络相连,计算主板通过计算芯片实现4-7层应用数据交换,交换主板通过交换芯片实现2-3层的网络数据交换,从而提升整体的数据处理能力。但这种方案也存在一定的缺陷:4-7层的数据交换性能受限于计算芯片的性能,提升空间有限。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何提供一种堆叠式的主板设计方案,同时提升2-3层的网络数据交换性能和4-7层应用数据交换性能。
(二)技术方案
为了解决上述技术问题,本发明提供了一种堆叠式的七层网络数据交换系统,包括多个计算主板和一个交换主板,每个计算主板由处理器、内存、硬盘和网络芯片组成;交换主板由交换芯片、处理器、内存、硬盘和若干EPL组成;
各计算主板上的处理器用于实现4-7层的网络数据转发;各计算主板上的内存和硬盘用于辅助实现处理器上操作系统的运行;各计算主板上的网络芯片用于与交换芯片间进行以太网络通信;交换主板中的交换芯片用于实现2-3层的网络数据的转发和处理;交换主板中的处理器用于对交换芯片进行初始化、配置、监控和管理;交换主板中的内存和硬盘用于辅助实现交换主板中处理器上操作系统的运行;EPL一方面用于与计算主板上的网络芯片连接,另一方面用于与外部以太网连接,完成网络数据的转发。
优选地,在各计算主板中,内存与处理器直连,硬盘与处理器直连,各网络芯片与处理器分别通过PCIe总线双向连接。
优选地,在交换主板中,处理器与交换芯片通过PCIe总线双向连接,内存与处理器直连,硬盘与处理器直连。
优选地,各计算主板上的网络芯片各连接交换芯片的一个EPL。
优选地,EPL通过外部以太网连接测试终端、测试服务器。
本发明还提供了一种所述系统的初始化方法,设各计算主板中均有两个网络芯片,包括以下步骤:
步骤一:对于各计算主板,分别执行以下动作:处理器启动,初始化内存并读取硬盘信息;
步骤二:对于各计算主板,分别执行以下动作:处理器进入操作系统,并驱动PCIe初始化网络芯片;
步骤三:对于交换主板,执行以下动作:处理器进入操作系统,并驱动PCIe控制交换芯片,完成交换芯片的配置文件导入和各EPL端口的初始化;
步骤四:各计算主板的网络芯片分别与交换芯片进行速率协商,完成握手,开始网络通信;
步骤五:对于各计算主板,分别执行以下动作:处理器通过其中一个网络芯片配置一个虚拟地址V-IP和一个虚拟网段V-NET,并通过对应网络将该虚拟网段通告给交换芯片;
步骤六:交换芯片从对应各网络分别得到关于虚拟网段V-NET的路由表,构建网段V-NET的等价路由表。
本发明还提供了一种所述系统的2-3层交换方法,其特征在于,包括以下步骤:
步骤一:测试终端通过对应网络发起一个请求数据包;
步骤二:交换芯片检测到所述对应网络接收的一个数据包;
步骤三:交换芯片对所述数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部;
步骤四:交换芯片对所述数据包进行2-3层头部解析,获取目的MAC和目的IP地址;
步骤五:若交换芯片对数据包的目的MAC和IP地址的解析结果,与测试服务器的MAC或IP对应,则将数据转发给测试服务器,否则结束;
步骤六:测试服务器对请求的数据响应,并将回复的数据包经过交换芯片发送给测试客户端,完成2-3层的数据响应。
本发明还提供了一种所述系统的4-7层交换方法,设各计算主板中均有两个网络芯片,包括以下步骤:
步骤一:测试终端通过相应网络起一个请求数据包;
步骤二:交换芯片检测到从所述相应网络接收的一个数据包;
步骤三:交换芯片对所述数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部;
步骤四:交换芯片对数据包进行2-3层头部解析,获取目的MAC和目的IP地址;
步骤五:若交换芯片对数据包目的IP地址的解析结果,与网段V-NET匹配,则采用等价路由的策略,将数据进行转发,否则结束;
步骤六:其中一个计算主板,即计算主板A上的处理器接收到该计算主板中第一网络芯片的数据,由于该数据的目的IP地址与虚拟V-IP匹配,则进行4-7层的网络报文解析,修改地址、端口或内容字段信息后,将数据通过该计算主板中第二网络芯片转发到第二网络芯片与交换芯片的连接网络;
步骤七:交换芯片接收其与第二网络芯片的连接网络的数据,并对数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部;
步骤八:交换芯片对数据包进行2-3层头部解析,获取目的MAC和目的IP地址;
步骤九:交换芯片对数据包目的MAC和IP地址的解析结果,与测试服务器的MAC或IP对应,则将数据转发给转发给测试服务器;
步骤十:测试服务器对请求的数据响应,并将回复的数据包依次经过交换芯片、第二网络芯片、计算主板A上的处理器、第一网络芯片、交换芯片,最后发送给测试客户端,完成4-7层的数据响应。
本发明还提供了一种所述系统在集群和云计算技术中的应用。
本发明还提供了一种所述方法在集群和云计算技术中的应用。
(三)有益效果
本发明通过将一个交换主板和多个计算主板相连,在交换主板上采用等价路由的方式构建集群式的2-7层数据交换网络。通过交换主板实现2-3层的网络数据交换,通过多个计算主板完成4-7层的应用数据交换,与现有负载均衡技术相比,该方案能同时提升2-3层的网络数据交换性能和4-7层应用数据交换性能(其中,能够成倍提升4-7层的应用数据交换性能),从而实现了2-7层网络交换性能的整体提升。
附图说明
图1为本发明的系统主板设计原理图。
具体实施方式
为使本发明的目的、内容和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
图1是本发明技术方案的系统主板设计原理图。如图1所示,本发明提供的一种堆叠式的七层网络数据交换系统主要包括多个计算主板(图中以四个主板为例)和一个交换主板。在计算主板A中,包括内存、硬盘、处理器和网络芯片,其中,内存A2与处理器A1直连,硬盘A3与处理器A1直连,网络芯片A4与处理器A1通过PCIe总线双向连接,网络芯片A5与处理器A1通过PCIe总线双向连接;计算主板B、计算主板C、计算主板D与计算主板A的连接类似;在交换主板E中,包括交换芯片、处理器、内存和硬盘,处理器E2与交换芯片E1通过PCIe总线双向连接,内存E3与处理器E2直连,硬盘E4与处理器E2直连;网络芯片A4、A5、B4、B5、C4、C5、D4、D5各连接交换芯片E1的一个EPL。
该系统的主板主要包括多个计算主板和一个交换主板两部分,计算主板A、计算主板B、计算主板C、计算主板D主要由处理器、内存、硬盘和网络芯片组成,交换主板E主要由交换芯片、处理器、内存、硬盘和若干EPL组成。各部件的功能如下:处理器A1、处理器B1、处理器C1、处理器D1用于实现4-7层的网络数据转发;各计算主板上内存和硬盘辅助实现处理器上操作系统的运行;各计算主板上的网络芯片用于与交换芯片E1间进行以太网络通信;交换主板E中的交换芯片E1是核心的网络处理模块,用于实现2-3层的网络数据的转发和处理;交换主板E中的处理器E2用于对交换芯片E1进行初始化、配置、监控和管理;交换主板E中的内存E3和硬盘E4用于辅助实现处理器E2上操作系统的运行;EPL即Ethernet PortLogic,一方面用于与计算主板上网络芯片连接,一方面用于与外部以太网连接,完成网络数据的转发。
系统初始化过程如下:
步骤一:处理器A1启动,初始化内存A2并读取硬盘A3信息;处理器B1启动,初始化内存B2并读取硬盘B3信息;处理器C1启动,初始化内存C2并读取硬盘C3信息;处理器D1启动,初始化内存D2并读取硬盘D3信息;处理器E2启动,初始化内存E3并读取硬盘E4信息;
步骤二:处理器A1进入操作系统,并驱动PCIe初始化网络芯片A4和A5;处理器B1进入操作系统,并驱动PCIe初始化网络芯片B4和B5;处理器C1进入操作系统,并驱动PCIe初始化网络芯片C4和C5;处理器D1进入操作系统,并驱动PCIe初始化网络芯片D4和D5;
步骤三:处理器E2进入操作系统,并驱动PCIe控制交换芯片E1,完成交换芯片E1的配置文件导入和各EPL端口的初始化;
步骤四:网络芯片A4、A5、B4、B5、C4、C5、D4、D5分别与交换芯片E1进行速率协商,完成握手,开始网络通信;
步骤五:处理器A1通过网络芯片A4配置一个虚拟地址V-IP和一个虚拟网段V-NET,并通过网络3将该虚拟网段通告给交换芯片E1;处理器B1通过网络芯片B4配置一个虚拟地址V-IP和一个虚拟网段V-NET,并通过网络4将该虚拟网段通告给交换芯片E1;处理器C1通过网络芯片C4配置一个虚拟地址V-IP和一个虚拟网段V-NET,并通过网络5将该虚拟网段通告给交换芯片E1;处理器D1通过网络芯片D4配置一个虚拟地址V-IP和一个虚拟网段V-NET,并通过网络6将该虚拟网段通告给交换芯片E1;
步骤六:交换芯片E1从网络3、网络4、网络5、网络6分别得到关于虚拟网段V-NET的路由表,构建网段V-NET的等价路由表。
系统2-3层交换过程如下:
步骤一:测试终端通过网络1发起一个请求数据包;
步骤二:交换芯片E1检测到从网络1接收的一个数据包;
步骤三:交换芯片E1对所述数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部等;
步骤四:交换芯片E1对所述数据包进行2-3层头部解析,获取目的MAC和目的IP地址等信息;
步骤五:若交换芯片E1对数据包的目的MAC和IP地址的解析结果,与测试服务器的MAC或IP对应,则将数据通过网络2转发给测试服务器;
步骤六:测试服务器对请求的数据响应,并将回复的数据包经过交换芯片E1发送给测试客户端,完成2-3层的数据响应。
系统4-7层交换过程如下:
步骤一:测试终端通过网络1发起一个请求数据包;
步骤二:交换芯片E1检测到从网络1接收的一个数据包;
步骤三:交换芯片E1对所述数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部等;
步骤四:交换芯片E1对数据包进行2-3层头部解析,获取目的MAC和目的IP地址等信息;
步骤五:若交换芯片E1对数据包目的IP地址的解析结果,与网段V-NET匹配,则采用等价路由的策略,将数据通过网络3、网络4、网络5、网络6中的一个网络进行转发(假设是通过网络3进行转发);
步骤六:处理器A1接收到网络芯片A4的数据,由于该数据的目的IP地址与虚拟V-IP匹配,则进行4-7层的网络报文解析,修改地址、端口或内容字段信息后,将数据通过网络芯片A5转发到网络7;
步骤七:交换芯片E1接收网络7的数据,并对数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部等;
步骤八:交换芯片E1对数据包进行2-3层头部解析,获取目的MAC和目的IP地址等信息;
步骤九:交换芯片E1对数据包目的MAC和IP地址的解析结果,与测试服务器的MAC或IP对应,则将数据通过网络2转发给转发给测试服务器;
步骤十:测试服务器对请求的数据响应,并将回复的数据包依次经过交换芯片E1、网络芯片A5、处理器A1、网络芯片A4、交换芯片E1,最后发送给测试客户端1,完成4-7层的数据响应。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种堆叠式的七层网络数据交换系统,其特征在于,包括多个计算主板和一个交换主板,每个计算主板由处理器、内存、硬盘和网络芯片组成;交换主板由交换芯片、处理器、内存、硬盘和若干EPL组成;
各计算主板上的处理器用于实现4-7层的网络数据转发;各计算主板上的内存和硬盘用于辅助实现处理器上操作系统的运行;各计算主板上的网络芯片用于与交换芯片间进行以太网络通信;交换主板中的交换芯片用于实现2-3层的网络数据的转发和处理;交换主板中的处理器用于对交换芯片进行初始化、配置、监控和管理;交换主板中的内存和硬盘用于辅助实现交换主板中处理器上操作系统的运行;EPL一方面用于与计算主板上的网络芯片连接,另一方面用于与外部以太网连接,完成网络数据的转发。
2.如权利要求1所述的系统,其特征在于,在各计算主板中,内存与处理器直连,硬盘与处理器直连,各网络芯片与处理器分别通过PCIe总线双向连接。
3.如权利要求1所述的系统,其特征在于,在交换主板中,处理器与交换芯片通过PCIe总线双向连接,内存与处理器直连,硬盘与处理器直连。
4.如权利要求1所述的系统,其特征在于,各计算主板上的网络芯片各连接交换芯片的一个EPL。
5.如权利要求1所述的系统,其特征在于,EPL通过外部以太网连接测试终端、测试服务器。
6.一种如权利要求1至5中任一项所述系统的初始化方法,其特征在于,设各计算主板中均有两个网络芯片,包括以下步骤:
步骤一:对于各计算主板,分别执行以下动作:处理器启动,初始化内存并读取硬盘信息;
步骤二:对于各计算主板,分别执行以下动作:处理器进入操作系统,并驱动PCIe初始化网络芯片;
步骤三:对于交换主板,执行以下动作:处理器进入操作系统,并驱动PCIe控制交换芯片,完成交换芯片的配置文件导入和各EPL端口的初始化;
步骤四:各计算主板的网络芯片分别与交换芯片进行速率协商,完成握手,开始网络通信;
步骤五:对于各计算主板,分别执行以下动作:处理器通过其中一个网络芯片配置一个虚拟地址V-IP和一个虚拟网段V-NET,并通过对应网络将该虚拟网段通告给交换芯片;
步骤六:交换芯片从对应各网络分别得到关于虚拟网段V-NET的路由表,构建网段V-NET的等价路由表。
7.一种如权利要求1至5中任一项所述系统的2-3层交换方法,其特征在于,包括以下步骤:
步骤一:测试终端通过对应网络发起一个请求数据包;
步骤二:交换芯片检测到所述对应网络接收的一个数据包;
步骤三:交换芯片对所述数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部;
步骤四:交换芯片对所述数据包进行2-3层头部解析,获取目的MAC和目的IP地址;
步骤五:若交换芯片对数据包的目的MAC和IP地址的解析结果,与测试服务器的MAC或IP对应,则将数据转发给测试服务器,否则结束;
步骤六:测试服务器对请求的数据响应,并将回复的数据包经过交换芯片发送给测试客户端,完成2-3层的数据响应。
8.一种如权利要求1至5中任一项所述系统的4-7层交换方法,其特征在于,设各计算主板中均有两个网络芯片,包括以下步骤:
步骤一:测试终端通过相应网络起一个请求数据包;
步骤二:交换芯片检测到从所述相应网络接收的一个数据包;
步骤三:交换芯片对所述数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部;
步骤四:交换芯片对数据包进行2-3层头部解析,获取目的MAC和目的IP地址;
步骤五:若交换芯片对数据包目的IP地址的解析结果,与网段V-NET匹配,则采用等价路由的策略,将数据进行转发,否则结束;
步骤六:其中一个计算主板,即计算主板A上的处理器接收到该计算主板中第一网络芯片的数据,由于该数据的目的IP地址与虚拟V-IP匹配,则进行4-7层的网络报文解析,修改地址、端口或内容字段信息后,将数据通过该计算主板中第二网络芯片转发到第二网络芯片与交换芯片的连接网络;
步骤七:交换芯片接收其与第二网络芯片的连接网络的数据,并对数据包进行校验,其中包括IPV4头部、TCP/UDP头部和VLAN头部;
步骤八:交换芯片对数据包进行2-3层头部解析,获取目的MAC和目的IP地址;
步骤九:交换芯片对数据包目的MAC和IP地址的解析结果,与测试服务器的MAC或IP对应,则将数据转发给转发给测试服务器;
步骤十:测试服务器对请求的数据响应,并将回复的数据包依次经过交换芯片、第二网络芯片、计算主板A上的处理器、第一网络芯片、交换芯片,最后发送给测试客户端,完成4-7层的数据响应。
9.一种如权利要求1至5中任一项所述系统在集群和云计算技术中的应用。
10.一种如权利要求6至8中任一项所述方法在集群和云计算技术中的应用。
CN202211387699.2A 2022-11-07 2022-11-07 一种堆叠式的七层网络数据交换系统 Pending CN115658236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211387699.2A CN115658236A (zh) 2022-11-07 2022-11-07 一种堆叠式的七层网络数据交换系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211387699.2A CN115658236A (zh) 2022-11-07 2022-11-07 一种堆叠式的七层网络数据交换系统

Publications (1)

Publication Number Publication Date
CN115658236A true CN115658236A (zh) 2023-01-31

Family

ID=85015366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211387699.2A Pending CN115658236A (zh) 2022-11-07 2022-11-07 一种堆叠式的七层网络数据交换系统

Country Status (1)

Country Link
CN (1) CN115658236A (zh)

Similar Documents

Publication Publication Date Title
US8316377B2 (en) Sharing legacy devices in a multi-host environment
US9137175B2 (en) High performance ethernet networking utilizing existing fibre channel fabric HBA technology
US7694047B1 (en) Method and system for sharing input/output devices
US7743178B2 (en) Method and apparatus for SATA tunneling over fibre channel
US7328284B2 (en) Dynamic configuration of network data flow using a shared I/O subsystem
US7404012B2 (en) System and method for dynamic link aggregation in a shared I/O subsystem
US7480303B1 (en) Pseudo-ethernet switch without ethernet media-access-controllers (MAC's) that copies ethernet context registers between PCI-express ports
US7197572B2 (en) System and method for implementing logical switches in a network system
EP1807753B1 (en) Method and system for transferring data directly between storage devices in a storage area network
US7356608B2 (en) System and method for implementing LAN within shared I/O subsystem
US7133929B1 (en) System and method for providing detailed path information to clients
US9304902B2 (en) Network storage system using flash storage
KR101101216B1 (ko) 네트워크 인터페이스장치
US20030208531A1 (en) System and method for a shared I/O subsystem
US20030217183A1 (en) System and method for span port configuration
US20040003140A1 (en) Network data flow optimization
CN1977254A (zh) 多协议网桥
US20030208645A1 (en) System and method for eventless detection of newly delivered variable length messages from a system area network
US11902184B2 (en) Methods and systems for providing a virtualized NVMe over fabric service
US11895027B2 (en) Methods and systems for service distribution using data path state replication and intermediate device mapping
US9331935B2 (en) Network device selection
US9098354B2 (en) Management of application to I/O device communication requests between data processing systems
CN111131093B (zh) 一种计算芯片和交换芯片三线互连的七层交换系统
US11593294B2 (en) Methods and systems for loosely coupled PCIe service proxy over an IP network
CN115658236A (zh) 一种堆叠式的七层网络数据交换系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination