CN106302252A - 数据交换系统架构、发送数据流量的方法以及交换装置 - Google Patents

数据交换系统架构、发送数据流量的方法以及交换装置 Download PDF

Info

Publication number
CN106302252A
CN106302252A CN201510249358.2A CN201510249358A CN106302252A CN 106302252 A CN106302252 A CN 106302252A CN 201510249358 A CN201510249358 A CN 201510249358A CN 106302252 A CN106302252 A CN 106302252A
Authority
CN
China
Prior art keywords
switch
port
group
data traffic
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510249358.2A
Other languages
English (en)
Other versions
CN106302252B (zh
Inventor
颜清华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510249358.2A priority Critical patent/CN106302252B/zh
Priority to ES16163082T priority patent/ES2735123T3/es
Priority to EP16163082.7A priority patent/EP3094056B1/en
Priority to US15/151,509 priority patent/US9883261B2/en
Priority to JP2016096985A priority patent/JP6325598B2/ja
Publication of CN106302252A publication Critical patent/CN106302252A/zh
Application granted granted Critical
Publication of CN106302252B publication Critical patent/CN106302252B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/0001Selecting arrangements for multiplex systems using optical switching
    • H04Q11/0003Details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/27Arrangements for networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/50Transmitters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/60Receivers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Optical Communication System (AREA)

Abstract

本发明提供了一种数据交换系统,包括K个子系统,所述K个子系统中的第一子系统包括M个交换装置,所述M个交换装置中的第一交换装置包括X个网络侧端口,所述X个网络侧端口包括M-1个组内端口和K-1个组间端口;所述M-1个组内端口分别连接所述第一子系统中除所述第一交换装置外的M-1个交换装置;所述K-1个组间端口分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置。这样的结构在不需要核心交换装置的情况下提升交换系统的容量。

Description

数据交换系统架构、发送数据流量的方法以及交换装置
技术领域
本发明涉及网络通信技术,尤其涉及一种带有交换装置的数据交换系统、在所述数据交换系统中发送数据流量的方法以及交换装置。
背景技术
云计算时代的网络数据流量模型发生了很大的变化,16%的数据流量在运营商网络,14%的数据流量在企业网络,而其余70%的数据流量将全部流向数据交换系统内部。数据交换系统数据流量和带宽的指数级增长,已经远超出了人们对传统网络的想象。大带宽,高扩展能力已成为数据交换系统客户的首要诉求。数据交换系统建设的瓶颈也越来越明显。
如图1所示,为现有的大规模数据交换系统的网络结构示意图。该数据交换系统中,需要通过接入层、汇聚层和核心层的交换装置才能实现所有服务器之间的互通,网络规模的扩展受限于核心交换装置的容量,难以满足未来业务发展的需要。
因此,有必要提供一种新型的,可扩展的数据交换系统,能够不受核心交换装置容量的限制,提升交换系统的容量。
发明内容
本发明的实施例提供了一种数据交换系统,在所述数据交换系统中发送数据流量的方法,以及交换装置。本发明的目的在于提高数据交换系统的容量。
本发明第一方面提供了一种数据交换系统,包括K个子系统,所述K个子系统中的第一子系统包括M个交换装置,所述M个交换装置中的第一交换装置包括X个网络侧端口,所述X个网络侧端口包括M-1个组内端口和K-1个组间 端口;所述M-1个组内端口分别连接所述第一子系统中除所述第一交换装置外的M-1个交换装置;所述K-1个组间端口分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置。
基于所述第一方面,在所述第一方面的第一种实施方式中,所述第一子系统还包括一个N*N组内光交织器;其中,每个网络侧端口包括一个发送光口和一个接收光口;
所述M-1个组内端口分别连接所述第一子系统中除所述第一交换装置外的M-1个交换装置包括:所述M-1个组内端口的所有发送光口连接所述N*N组内光交织器的一个输入端口,所述M-1个组内端口的所有接收光口连接所述N*N组内光交织器的一个输出端口,以通过所述N*N组内光交织器连接所述第一子系统中除所述第一交换装置外的M-1个交换装置;其中,M和N均为自然数,并且M≤N。
基于所述第一方面的第一种实施方式,在所述第一方面的第二种实施方式中,所述数据交换系统还包括多个N*N组间光交织器;
所述K-1个组间端口分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置包括:所述K-1个组间端口的所有发送光口连接第一N*N组间光交织器的一个输入端口,所述K-1个组间端口的所有接收光口连接所述第一N*N组间光交织器的一个输出端口,以通过所述第一N*N组间光交织器分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置;其中,所述第一交换装置在所述第一子系统中的编号与所述第一N*N组间光交织器在所述多个N*N组间光交织器中的编号相同。
基于所述第一方面或所述第一方面的第一种或第二种实施方式,在所述第一方面的第三种实施方式中,所述多个子系统具有相同的规模,且,对于每个子系统,M=N=K。
基于所述第一方面或所述第一方面的第一种或第二种实施方式,在所述第一方面的第四种实施方式中,所述多个子系统除所述第一子系统外还包括第二 子系统,所述第二子系统包括一个N’*N’组内光交织器以及Z个交换装置,其中,N’<N,Z<M。
基于所述第一方面或所述第一方面的第一种至第四种实施方式中的任意一个,在所述第一方面的第五种实施方式中,所述第一交换装置包括交换单元和接口单元;当所述交换单元为光口交换单元时,所述接口单元包括X个光模块,所述X个网络侧端口为所述X个光模块的端口;当所述交换单元为电口交换单元时,所述接口单元为电-光转换单元,所述X个网络侧端口为所述电-光转换单元的端口。
本发明第二方面提供一种交换装置,所述交换装置为数据交换系统的第一子系统中的M个交换装置中的任意一个,所述交换装置包括多个端口,每个端口既能作为用户侧端口,又能作为网络侧端口;
所述交换装置还包括:
接收组件,用于通过用户侧端口获取数据流量;
处理组件,用于根据所述数据流量的目的地址查找多路径转发表,得到包括所述目的地址的多路径转发表项;其中,所述多路径转发表项包括所述目的地址和多个网络侧端口的对应关系;
发送组件,用于根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量,以使所述数据流量中的每份数据流量通过不同路径到达与所述交换装置位于同一数据交换系统中的目的交换装置。
基于所述第二方面,在所述第二方面的第一种实施方式中,所述目的交换装置与所述交换装置位于所述数据交换系统的同一个子系统,所述多个网络侧端口包括M-1个组内端口,所述发送组件用于:将所述数据流量分为M-1份并通过所述M-1个组内端口将所述M-1份流量分别发送给所述子系统中除所述交换装置外的其他M-1个交换装置。
基于所述第二方面,在所述第二方面的第二种实施方式中,所述交换装置与所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组间端口和M-1个组内端口;
所述发送组件用于:将所述数据流量分为M份,将其中1份数据流量通过所述组间端口发送给所述目的交换装置所在的子系统中的所述交换装置的直达交换装置,将其余的M-1份数据流量通过所述M-1个组内端口分别发送给所述第一子系统中除所述交换装置外的其他M-1个交换装置。
基于所述第二方面,在所述第二方面的第三种实施方式中,所述交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组内端口和M-1个组间端口;
所述发送组件用于:将所述数据流量分为M份,将其中1份数据流量通过所述组内端口发送给所述目的交换装置在所述第一子系统中的直达交换装置,将其余的M-1份数据流量通过所述M-1个组间端口分别分别发送给除所述第一子系统外的M-1个子系统中的所述交换装置的直达交换装置。
基于所述第二方面,在所述第二方面的第四种实施方式中,所述交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到同一个组间光交织器,所述多个网络侧端口包括M-1个组间端口;
所述发送组件用于:将所述数据流量分为M-1份,并通过所述M-1个组间端口将所述M-1份数据流量分别发送分别给除所述第一子系统外的M-1个子系统中的所述交换装置的直达交换装置。
基于所述第二方面,在所述第二方面的第五种实施方式中,所述交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括M-1个组内端口和M-1个组间端口;
所述发送组件用于:将所述数据流量分为2*(M-1)份,将其中M-1份数据流量通过所述M-1个组内端口分别发送给所述第一子系统中除所述交换装置外的M-1个交换装置,以及将另外M-1份数据流量通过所述M-1个组间端口分别发送给除所述第一子系统外的M-1个子系统中的所述交换装置的直达交换装置。
基于所述第二方面,以及所述第二方面的第一种至第五种实施方式中的任意一个,在所述第二方面的第六种实施方式中,所述发送组件还用于:
在根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量之前,为所述数据流量封装转发标记,所述转发标记用于指示接收到所述数据流量的交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项,其中,所述最短路径转发表项包括目的地址和一个网络侧端口的对应关系。
基于所述第二方面,以及所述第二方面的第一种至第六种实施方式中的任意一个,在所述第二方面的第七种实施方式中,其特征在于,所述处理组件还用于生成所述多路径转发表;
在生成所述多路径转发表时,所述处理组件用于:
获取所述交换装置的每个网络侧端口的第一本地开销,其中,所述第一本地开销配置在所述交换装置上、仅供所述处理组件在计算所述多路径转发表时使用;
获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销;所述第一全局开销为所述直达交换装置发布的、供所述处理组件在计算所述多路径转发表时使用的开销;以及
根据所述交换装置的每个网络侧端口的第一本地开销以及每个所述网络侧端口的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销,生成所述多路径转发表。
基于所述第二方面的第七种实施方式,在所述第二方面的第八种实施方式中,所述网络侧端口仅包括组内端口,在获取所述交换装置的每个网络侧端口的第一本地开销时,所述处理组件用于:获取所述交换装置的每个组内端口的第一本地开销;在获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销时,所述处理组件用于:获取与所述交换装置位于同一子系统的每个交换装置的每个组内端口的第一全局开销。
基于所述第二方面的第七种实施方式,在所述第二方面的第九种实施方式中,所述网络侧端口包括组内端口和组间端口,当获取所述交换装置的每个 网络侧端口的第一本地开销时,所述处理组件用于:分别获取所述交换装置的每个组内端口的第一本地开销以及每个组间端口的第一本地开销;当获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销时,所述处理组件用于:获取与所述交换装置位于同一子系统的每个交换装置的组内端口的第一全局开销以及组间端口的第一全局开销,以及,获取与所述交换装置位于不同子系统的所述交换装置的每个直达交换装置的组内端口的第一全局开销以及组间端口的第一全局开销。
基于所述第二方面的第九种实施方式,在所述第二方面的第十种实施方式中,生成所述多路径转发表的规则包括:
组内端口的第一全局开销小于组内端口的第一本地开销;且
组间端口的第一本地开销和第一全局开销的设置满足下列条件:能够使从组内端口转发的一条路径为最优路径;使一个组间端口可以转发数据流量;使数据流量不能两次被组间端口转发;组内端口所连接的全部路径都属于最优路径或者次优路径,且组间次优路径的全程距离小于组间最优路径的全程距离的V倍,其中,V为可以设定的系数。
基于所述第二方面的第九种实施方式,在所述第二方面的第十一种实施方式中,所述组内端口的第一本地开销与所述组内端口的第一全局开销相同,所述组间端口的第一本地开销与所述组间端口的第一全局开销相同;
生成所述多路径转发表的规则包括:
不等价路径的次优路径FS的邻接距离AD小于最优路径的FD与设定增量e之和;以及,次优路径的全程距离小于最优路径的全程距离的V倍,V为可以设定的系数。
基于所述第二方面,以及所述第二方面的第一种至第五种实施方式中的任意一个,在所述第二方面的第十二种实施方式中,所述接收组件还用于通过网络侧端口接收其他交换装置发送的数据流量;所述处理组件还用于确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;所述发送组件还用于当所述网络侧端 口为组内端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组内端口发送给所述目的交换装置在所述第一子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组间端口分别发送给所述目的交换装置在另外M-1个子系统中的直达交换装置。
基于所述第二方面,以及所述第二方面的第一种至第五种实施方式中的任意一个,在所述第二方面的第十三种实施方式中,所述接收组件还用于通过网络侧端口接收其他交换装置发送的数据流量;所述处理组件还用于确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;所述发送组件还用于当所述网络侧端口为组间端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组间端口发送给所述目的交换装置所在子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组内端口分别发送给所述第一子系统中的其他M-1个交换装置。
本发明第三方面提供另一种交换装置,包括多个端口,每个端口既能作为用户侧端口,又能作为网络侧端口;
所述交换装置还包括:
接收组件,用于接收另一交换装置发送的数据流量,其中,所述另一交换装置为数据交换系统中除所述交换装置外的任意一个交换装置;
处理组件,用于确定所述数据流量是否封装了转发标记,所述转发标记用于指示所述交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项;其中,所述最短路径转发表项包括所述数据流量的目的地址和一个网络侧端口的对应关系;并在当所述数据流量封装了所述转发标记时,确定所述数据流量的目的交换装置是否为所述交换装置;
发送组件,用于根据所述处理组件确定的结果转发所述数据流量。
基于所述第三方面,在所述第三方面的第一种实施方式中,当所述数据 流量的目的交换装置不是所述交换装置时,所述发送组件用于根据所述最短路径转发表项转发所述数据流量,以使所述数据流量到达所述目的交换装置;当所述数据流量的目的交换装置是所述交换装置时,所述发送组件用于从所述数据流量中删除所述转发标记,并根据所述最短路径转发表中包括所述数据流量的目的地址的最短路径转发表项将删除了所述转发标记的数据流量发送给所述数据交换系统外的设备。
基于所述第三方面或所述第三方面的第一种实施方式,在所述第三方面的第二种实施方式中,所述最短路径转发表的生成规则包括:
组内端口所连接的路径为最优路径;以及,当所述数据流量的目的交换装置与所述交换装置位于不同的子系统时,只通过组间端口转发所述数据流量。
本发明第四方面提供一种发送数据流量的方法,应用于数据交换系统,包括:
所述数据交换系统中的源交换装置通过用户侧端口获取数据流量;其中,所述源交换装置为所述数据交换系统的第一子系统中的M个交换装置中的任意一个;
所述源交换装置根据所述数据流量的目的地址查找多路径转发表,得到包括所述目的地址的多路径转发表项;其中,所述多路径转发表项包括所述目的地址和多个网络侧端口的对应关系;
所述源交换装置根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量,以使所述数据流量中的每份数据流量通过不同路径到达所述数据交换系统中的目的交换装置。
基于所述第四方面,在所述第四方面的第一种实施方式中,当所述目的交换装置与所述源交换装置位于同一子系统中时,所述多个网络侧端口包括M-1个组内端口,所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M-1份并通过所述M-1个组内端口将所述M-1份数据流量分别发送给所述子系统中除所述源交换装置外的其他 M-1个交换装置。
基于所述第四方面,在所述第四方面的第二种实施方式中,所述源交换装置与所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组间端口和M-1个组内端口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M份,将其中1份数据流量通过所述组间端口发送给所述目的交换装置所在的子系统中的所述源交换装置的直达交换装置,将其余的M-1份数据流量通过所述M-1个组内端口分别发送给所述源交换装置所在的子系统中除所述源交换装置外的其他M-1个交换装置。
基于所述第四方面,在所述第四方面的第三种实施方式中,所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组内端口和M-1个组间端口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M份,将其中1份数据流量通过所述组内端口发送给所述目的交换装置在所述源交换装置所在的子系统中的直达交换装置,将其余的M-1份数据流量通过所述M-1个组间端口分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
基于所述第四方面,在所述第四方面的第四种实施方式中,所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到同一个组间光交织器,所述多个网络侧端口包括M-1个组间端口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M-1份,并通过所述M-1个组间端口将所述M-1份数据流量分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
基于所述第四方面,在所述第四方面的第五种实施方式中,所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括M-1个组内端口和M-1个组间端 口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为2*(M-1)份,将其中M-1份数据流量通过所述M-1个组内端口分别发送给所述源交换装置所在的子系统中除所述源交换装置外的M-1个交换装置,以及将另外M-1份数据流量通过所述M-1个组间端口分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
基于所述第四方面,以及所述第四方面的第一种至第五种实施方式中的任意一个,在所述第四方面的第六种实施方式中,所述方法还包括:
在根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量之前,为所述数据流量封装转发标记,所述转发标记用于指示接收到所述数据流量的交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项,其中,所述最短路径转发表项包括目的地址和一个网络侧端口的对应关系。
基于所述第四方面,以及所述第四方面的第一种至第六种实施方式中的任意一个,在所述第四方面的第七种实施方式中,所述方法还包括以下之一:
所述源交换装置从控制器获取所述多路径转发表;和
所述源交换装置生成所述多路径转发表;
其中,所述生成所述多路径转发表包括:
获取所述源交换装置的每个网络侧端口的第一本地开销,其中,所述第一本地开销配置在所述源交换装置上、仅供所述源交换装置在计算所述多路径转发表时使用;
获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销;所述第一全局开销为所述直达交换装置发布的、供所述源交换装置在计算所述多路径转发表时使用的开销;以及
根据所述源交换装置的每个网络侧端口的第一本地开销以及每个所述网络侧端口的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一 全局开销,生成所述多路径转发表。
基于所述第四方面的第七种实施方式,在所述第四方面的第八种实施方式中,所述网络侧端口仅包括组内端口,
所述获取所述源交换装置的每个网络侧端口的第一本地开销时包括:获取所述源交换装置的每个组内端口的第一本地开销;
所述获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销包括:获取与所述源交换装置位于同一子系统的每个交换装置的每个组内端口的第一全局开销。
基于所述第四方面的第七种实施方式,在所述第四方面的第九种实施方式中,所述网络侧端口包括组内端口和组间端口,
所述获取所述交换装置的每个网络侧端口的第一本地开销包括:分别获取所述源交换装置的每个组内端口的第一本地开销以及每个组间端口的第一本地开销;
所述获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销包括:获取与所述源交换装置位于同一子系统的每个交换装置的组内端口的第一全局开销以及组间端口的第一全局开销,以及,获取与所述源交换装置位于不同子系统的所述源交换装置的每个直达交换装置的组内端口的第一全局开销以及组间端口的第一全局开销。
基于所述第四方面的第九种实施方式,在所述第四方面的第十种实施方式中,生成所述多路径转发表的规则包括:
组内端口的第一全局开销小于组内端口的第一本地开销;且
组间端口的第一本地开销和第一全局开销的设置满足下列条件:能够使从组内端口转发的一条路径为最优路径;使一个组间端口可以转发数据流量;使数据流量不能两次被组间端口转发;组内端口所连接的全部路径都属于最优路径或者次优路径,且组间次优路径的全程距离小于组间最优路径的全程距离的V倍,其中,V为可以设定的系数。
基于所述第四方面的第九种实施方式,在所述第四方面的第十一种实施方式中,所述组内端口的第一本地开销与所述组内端口的第一全局开销相同,所述组间端口的第一本地开销与所述组间端口的第一全局开销相同;
生成所述多路径转发表的规则包括:
不等价路径的次优路径FS的邻接距离AD小于最优路径的FD与设定增量e之和;以及,次优路径的全程距离小于最优路径的全程距离的V倍,V为可以设定的系数。
基于所述第四方面,以及所述第四方面的第一种至第五种实施方式中的任意一个,在所述第四方面的第十二种实施方式中,其特征在于,所述方法还包括:
所述源交换装置通过网络侧端口接收其他交换装置发送的数据流量;
所述源交换装置确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;
当所述网络侧端口为组内端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,所述源交换装置将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组内端口发送给所述目的交换装置在所述第一子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组间端口分别发送给所述目的交换装置在另外M-1个子系统中的直达交换装置。
基于所述第四方面,以及所述第四方面的第一种至第五种实施方式中的任意一个,在所述第四方面的第十三种实施方式中,所述方法还包括:
所述源交换装置通过网络侧端口接收其他交换装置发送的数据流量;
所述源交换装置确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;
当所述网络侧端口为组间端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,所述源交换装置将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组间端口发送给 所述目的交换装置所在子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组内端口分别发送给所述第一子系统中的其他M-1个交换装置。
本发明第五方面提供了另一种发送数据流量的方法,应用于数据交换系统,其特征在于,
交换装置接收另一交换装置发送的数据流量,其中,所述另一交换装置为所述数据交换系统中除所述交换装置外的任意一个交换装置;
所述交换装置确定所述数据流量是否封装了转发标记,所述转发标记用于指示所述交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项;其中,所述最短路径转发表项包括所述数据流量的目的地址和一个网络侧端口的对应关系;
在当所述数据流量封装了所述转发标记时,所述交换装置确定所述数据流量的目的交换装置是否为所述交换装置,并根据确定的结果转发所述数据流量。
基于所述第五方面,在所述第五方面的第一种实施方式中,
当所述数据流量的目的交换装置不是所述交换装置时,所述根据确定的结果转发所述数据流量包括:根据所述最短路径转发表项转发所述数据流量,以使所述数据流量到达所述目的交换装置;
当所述数据流量的目的交换装置是所述交换装置时,所述根据确定的结果转发所述数据流量包括:从所述数据流量中删除所述转发标记,并根据所述最短路径转发表中包括所述数据流量的目的地址的最短路径转发表项将删除了所述转发标记的数据流量发送给所述数据交换系统外的设备。
基于所述第五方面或所述第五方面的第一种实施方式,在所述第五方面的第二种实施方式中,所述最短路径转发表的生成规则包括:
组内端口所连接的路径为最优路径;以及
当所述数据流量的目的交换装置与所述交换装置位于不同的子系统时,只通过组间端口转发所述数据流量。
本发明通过将交换装置的网络侧端口划分为组内端口和组间端口,并通过组内端口将M个交换装置组成一个子系统,然后通过组间端口将多个子系统互联形成一个数据交换系统。本发明只需要一种类型的交换装置就能够实现所有交换装置的全连接,解决了传统数据交换系统的规模受核心层交换装置的交换性能限制的问题,提高了数据交换系统的容量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为现有技术中数据交换系统的结构示意图;
图2为本发明实施例提供的一种数据交换系统的结构示意图;
图3为循环阵列波导光栅工作原理示意图;
图4为使用光交织器时所述数据交换系统的一个子系统的内部连接示意图;
图5为所述数据交换系统包括多个N*N组间光交织器时,所述第一交换装置的连接关系示意图;
图6a为本发明实施例提供的另一种子系统的结构示意图;
图6b为图6a所示子系统中各交换装置与组内光交织器的连接关系示意图;
图6c为图6a所示的子系统中各交换装置的逻辑连接示意图;
图7为本发明实施例提供的另一种数据交换系统的结构示意图;
图8为本发明实施例提供的再一种数据交换系统的结构示意图;
图9为本发明实施例提供的一种发送数据流量的方法的流程示意图;
图10为本发明实施例中源交换装置生成多路径转发表的过程示意图;
图11为本发明实施例提供的另一种发送数据流量的方法的流程示意图;
图12为在本发明实施例所述的数据交换系统中发送数据流量的第一种过程示意图;
图13为在本发明实施例所述的数据交换系统中发送数据流量的第二种过程示意图;
图14为在本发明实施例所述的数据交换系统中发送数据流量的第三种过程示意图;
图15为在本发明实施例所述的数据交换系统中发送数据流量的第四种过程示意图;
图16为在本发明实施例所述的数据交换系统中发送数据流量的第五种过程示意图;
图17为本发明实施例提供的一种交换装置的结构示意图;
图18为本发明实施例提供的另一种交换装置的结构示意图。
具体实施方式
下面将结合附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下可能获得其他的实现方式,而这些实现方式都应被认为属于本发明保护的范围。
数据交换系统概述
如图2所示,为本发明实施例提供的数据交换系统的结构示意图。所述数据交换机系统包括K个子系统,所述K个子系统中的第一子系统包括M个交换装置,所述M个交换装置中的第一交换装置包括多个网络侧端口,所述多个端口可以分为用户侧端口和网络侧端口。一般来说,连接服务器、客户端或者用户终端的端口为用户侧端口,连接其他交换装置的端口为网络侧端口。所述第一交换装置通过多个网络侧端口实现与其他交换装置的互连。所述多个网络侧端口,以下记为X个(图中示出了3个,用小方块表示),包括M-1个组内端口和K-1个组间端口;所述M-1个组内端口分别连接所述第一子系统中除所述第一交换装置外的M-1个交换装置;所述K-1个组间端口分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置。其中,所述第一子系统为所述K个子系统中的任意一个,所述第一交换装置为所述M个交换装置中的任意一个。
其中,组内端口为一个交换装置用于连接与所述交换装置位于同一子系统的其他交换装置的端口(图中位于下方的端口),组间端口为所述交换装置用于连接与所述交换装置位于不同子系统的直达交换装置的端口(图中位于上方的端口),任意一个网络侧端口都可以作为组内端口或者组间端口使用,因此,只有在网络连接之后,才可以知道哪些端口是组内端口,哪些端口是组间端口。直达交换装置是指与所述交换装置通信时不需要经过其他交换装置的交换装置。属于同一个子系统的交换装置互为直达交换装置。
本发明实施例中,通过将交换装置的网络侧端口划分为组内端口和组间端口,组内端口用于连接同一子系统内的交换装置,组间端口用于连接不同子系统内的交换装置,即可以构建出包括K*M个交换装置的数据交换系统。本发明不需要像传统数据交换系统一样,将网络划分为接入层、汇聚层和核心层,并在每层设置不同类型的交换装置。因此,本发明的数据交换系统只需要一种类型的交换装置,就能够实现所有交换装置的全连接,解决了传统数据交换系统的规模受核心层交换装置的交换性能限制的问题。
图2所示的数据交换系统在每对需要连接的交换装置之间都采用光纤直连,当网络规模较大时,需要数万对光纤,不仅对机房的物理空间带来了严峻的挑战,也为故障排除等运维带来了极大的困难。并且,由于数据交换系统中交换装置的网络侧端口数量多,导致所需要的光模块数量相应增多,采用多模多芯光纤连接光模块,多芯光纤的定制成本与接头成本也极为高昂,布线成本甚至达到了光模块成本的3-4倍。本发明进一步提供了一种数据交换系统,用于减少数据交换系统的光纤数量,简化数据交换系统的维护操作,节约构建数据交换系统的成本。
图3为循环阵列波导光栅(英文:cyclic arrayed waveguide grating,缩写:CAWG)的工作原理示意图。CAWG又被称为循环交织器(英文:cyclic interleaver),是基于波长的N*N循环复用器/解复用器(英文:cyclic multiplexer/demultiplexer)。CAWG能够以循环方式将不同波长的信号从不同的入口发送到不同的出口。如图2所示,该CAWG有N根输入光纤和N根输出 光纤,每根输入光纤上最多可以传输N个波长,因此,在满负荷的时候,输入侧可以输入N*N个波长,CAWG经过内部交换,将每根输入光纤上的N个波长分别分配到不同的N根输出光纤上。每个波长可以用λij来表示,其中,λ表示波长,i表示输入端口组,j表示该波长在该输入端口组中的编号,i和j均为小于等于N的正整数,N为CAWG每端口可支持的最大波长数。例如图2中,输入端口a1上输入的N个波长分别为λ11,λ12,…λ1N,在输出侧,该N个波长分别被分配到输出光纤b1到bN。因而,CAWG能够实现N*N个波长的无阻塞交换。
需要指出的是,在实现本发明时,还可以用能够实现上述功能的其他设备和光学器件来代替所述CAWG。因此,本发明中,将能够实现上述CAWG特性的设备或者光学器件统称为光交织器。本发明实施例将应用光交织器的上述特性,改善图2所示的数据交换系统。如图4所示,为本发明实施例中使用所述光交织器构建所述数据交换系统时,所述数据交换系统的一个子系统的内部连接示意图,所述子系统(可以为徒2所示的第一子系统)还包括一个N*N组内(“组内”的定义见下)光交织器,称为组内光交织器1,所述第一子系统中的M个交换装置在本实施例中记为S11,S12(图中未示出)到S1M。其中,N*N是指所述光交织器的规格,即所述光交织器包括的输入端口数和输出端口数均为N个。其中,所述M个交换装置中的任意一个交换装置,例如交换装置S11或S1M,均可以为所述第一交换装置。所述X个网络侧端口中的每个网络侧端口包括一个发送光口(英文:optical interface)和一个接收光口。其中,发送光口用竖线填充的小格子来表示,接收光口用没有填充的小格子来表示。在优选的实施方式中,每个交换装置的网络侧端口数相同。在其他的实施方式下,不同交换装置的网络侧端口数也可以不同。
所述M-1个组内端口分别连接所述第一子系统中除所述第一交换装置外的M-1个交换装置包括:所述M-1个组内端口的所有发送光口连接所述N*N组内光交织器的一个输入端口,所述M-1个组内端口的所有接收光口连接所述N*N组内光交织器的一个输出端口,以通过所述N*N组内光交织器连接所述第一子 系统中除所述第一交换装置外的M-1个交换装置。例如,交换装置S11的所有M-1个发送光口连接所述N*N组内光交织器的输入端口Pin11,交换装置S11的所有M-1个接收光口连接所述N*N组内光交织器的输出端口Pout11
需要说明的是,本发明实施例中交换装置的所有端口相同,即每一个端口都可以作为用户侧端口或网络侧端口,因此本发明实施例中交换装置的用户侧端口和网络侧端口并没有严格的区分,只有当一个交换装置被接入网络之后,才能区分哪些端口是用户侧端口,哪些端口是网络侧端口。并且,交换装置的端口可以被任意划分。例如,一个交换装置总共有48个端口,该48个端口可以根据需要被划分为32个用户侧端口和16个网络侧端口,也可以被划分为24个用户侧端口和24个网络侧端口。
本发明实施例中,由部分交换装置组成的系统称为子系统,全部交换装置组成所述数据交换系统。其中,连接子系统内的交换装置的光交织器称为组内光交织器,连接不同子系统的光交织器称为组间光交织器。
在本发明另一个实施例中,为了进一步减少光纤数量,所述数据交换系统还包括多个N*N组间光交织器。图5示出了当所述数据交换系统包括多个N*N组间光交织器时,所述第一交换装置的连接关系示意图。此时,所述第一交换装置(假设为S11)的M-1个组内端口根据图4所示的方式连接到组内光交织器1,所述第一交换装置的K-1个组间端口(即端口PM到PX)的所有发送光口连接第一N*N组间光交织器(组间光交织器1)的一个输入端口Pin11,所述K-1个组间端口的所有接收光口连接所述第一N*N组间光交织器的一个输出端口Pout11
由于所述数据交换系统中的交换装置数量较多,为了便于管理,需要对每个子系统中的交换装置编号,并且,也需要对所述多个N*N组间光交织器编号,所述第一交换装置在所述第一子系统中的编号与所述第一N*N组间光交织器在所述多个N*N组间光交织器中的编号相同,即所述第一N*N组间光交织器为所述第一交换装置对应的组间光交织器。一个交换装置仅连接一个组间光交织器,一个组间光交织器最多可连接N个交换装置。具体到图5中,交换装置S11连 接到组间光交织器1,交换装置S1M连接到组间光交织器M。
本发明上述各实施例中的所述第一交换装置为由合适的电路器件和/或光学器件组成的装置,它包括交换单元和接口单元。所述交换单元可以为交换机,交换网板,接口板以及线卡等具有交换功能的单元。所述交换单元可能是光口交换单元,也可能是电口(英文:electric interface)交换单元。当所述交换单元为光口交换单元时,所述接口单元包括X个光模块,所述X个网络侧端口为所述X个光模块的端口,此时,所述每个网络侧端口包括一个发送光口和一个接收光口,是指每个网络侧端口光模块的端口包括一个发送光口和一个接收光口。
当所述交换单元为电口交换单元时,所述接口单元为电-光转换单元,所述X个网络侧端口为所述电-光转换单元的端口,此时,所述每个网络侧端口包括一个发送光口和一个接收光口是指所述电-光转换单元的每个端口包括一个发送光口和一个接收光口。
在图4和图5中,为了实现“所述M-1个组内端口的所有发送光口连接所述N*N组内光交织器的一个输入端口,所述M-1个组内端口的所有接收光口连接所述N*N组内光交织器的一个输出端口”,S11的网络侧端口P1到PM-1的所有发送光口连接合波器11的M-1个接收端口(用没有填充的圆圈表示)。这样,组内端口P1到PM-1的所有发送光口发出的信号经过合波器11复用以后,通过合波器11的一个发送端口(用没有填充的小格子表示)被发送到组内光交织器1,即只需要一根光纤就能使S11的M-1个组内端口中每个发送光口发送的信号到达所述N*N组内光交织器;类似地,只需要一根光纤就就能使所述K1个组间端口中每个接收光口从所述N*N组内光交织器接收信号。
在图5中,为了实现“所述K-1个组间端口的所有发送光口连接第一N*N组间光交织器的一个输入端口,所述K-1个组间端口的所有接收光口连接所述第一N*N组间光交织器的一个输出端口”,S11的组间端口PM到PX中的所有发送光口连接合波器11的另外K-1个接收端口(用灰色填充的圆圈表示),组间端口PM到PX的发送光口发出的信号经合波器11复用后通过合波器11的另一个发送端口(用灰色填充的小格子表示)被发送到组间光交织器1。 分波器11通过一个接收端口(用没有填充的小格子表示)接收组内光交织器1发送的信号,并在对该信号解复用后将信号通过K-1个发送端口(用没有填充的小圆圈表示)分别发往S11的组内端口P1到PM-1中的接收光口。分波器11通过另一个接收端口(用灰色填充的小格子表示)接收组间光交织器1发送的信号,并在对该信号解复用后将解复用得到的信号通过另外K-1个端口(用灰色填充的小圆圈表示)分别发往S11的组间端口PM到PX中的接收光口。通过上述方式,S11仅仅需要两根光纤就能和数据交换系统中除不在所述第一子系统中的所有其他交换装置通信。
虽然本发明上述实施例使用了合波器和分波器,但是本领域技术人员应该清楚,任何能够实现光信号的复用和解复用的设备都可以用于实现本发明,因此,上述合波器和分波器并不构成对本发明的限制。
在一个实施例中,当所述多个子系统具有相同的规模时,对于每个子系统,M=N=K,即每个交换装置的一半网络侧端口连接组内光交织器,另一半网络侧端口连接组间光交织器,且每个组内光交织器的规格N与每个子系统内的交换装置的数量M相同。
在另一个实施例中,所述多个子系统除了第一子系统外还包括第二子系统,所述第二子系统包括一个N’*N’组内光交织器以及Z个交换装置,其中,N’<N,且Z<M。即,所述第二子系统与所述第一子系统具有不同的规模,第二子系统中交换装置的数量小于第一子系统中交换装置的数量。子系统的规模是指所述子系统包括的交换装置的数量以及每个交换装置的网络侧端口的数量。
数据交换系统示例
以下通过示例对本发明实施例中的数据交换系统做进一步详细说明。
如图6a所示,为本发明实施例提供的另一个子系统的结构示意图。所述子系统包括一个N*N光交织器,M个交换装置,以及M个合波器和M个分波器。每个交换装置对应一个合波器和一个分波器,所述合波器和分波器可以分开设置,也可以合并设置,如果合并设置的话,每个交换装置对应一个合波/分波器。 并且,与图4一样,每个交换装置包括X个网络侧端口,每个网络侧端口包括一个发送光口和一个接收光口。
在图6a所示的数据交换系统中,交换装置S1(第一交换装置)的M-1个发送光口(用方框表示)经过合波器1连接到所述N*N光交织器的输入端口Pin1,M-1个接收光口经过分波器1连接到所述N*N光交织器的输出端口Pout1。在一个实施例中,M=N。
从图6a可以看出,交换装置S1的M-1个组内端口生成的信号经过合波器1后,只需要一根光纤就能发送出去,并且,发送给交换装置S1的任意一个端口的信号,只需要通过一根光纤就能到达交换装置S1所对应的分波器1,进而到达S1的相应端口。
当M=8时,图6a所示的子系统中各交换装置与组内光交织器的连接关系,可以抽象成图6b。其中,每条实线代表一对光纤,交换装置及其对应的合波/分波器位于光纤的一端,而光交织器位于光纤的另一端。从图6b可以看出,本发明的数据交换系统中的所有交换装置只需要连接到光交织器,而不需要像传统数据交换系统一样,将网络划分为接入层、汇聚层和核心层,并在每层设置不同类型的交换装置。因此,本发明的数据交换系统只需要一种类型的交换装置,就能够实现所有交换装置的全连接,解决了传统数据交换系统的规模受核心层交换装置的交换性能限制的问题。
图6b所示的8个交换装置逻辑上形成了一个全连接的网络,称为mesh网络。如图6c所示,为图6b所示的子系统中各交换装置的逻辑连接示意图。如果全部采用光纤直连的方式建立图6b所示的网络,则需要的光纤数为28*2(一条连线代表了输入和输出两根光纤)=56根,如果交换装置之间还存在其他设备的话,则需要的光纤数增加到56*2=112根。但是采用图6a所示的组网方式,则仅仅需要8*2=16根光纤。即,采用本发明中的数据交换系统,所需要的光纤数仅仅为传统数据交换系统的16÷56=2/7或者16÷112=1/7。推广到其他规模的数据交换系统,采用本专利的组网方式建立的数据交换系统所需要的光纤数仅仅为传统数据交换系统的2/(M-1)或1/(M-1)。其中,所述M为数据交换系 统中交换装置的数量。
可见,采用本发明实施例的数据交换系统,可以极大地减少数据交换系统所需的光纤数量,进而节省了布线成本。并且,由于本发明实施例所需要的光纤数量极大地减少,降低了数据交换系统机房布线的难度,使交换装置的物理部署变得简单容易。
当需要组建较大规模的数据交换系统时,由于需要的交换装置数量较多,可以将交换装置分组,得到多个交换组,将每个交换组中的交换装置通过组内光交织器连接形成一个子系统,则多个交换组可以形成多个子系统,将所述多个子系统通过多个组间光交织器连接,就可以形成所有交换装置逻辑上全连接的数据交换系统。其中,所述组间光交织器的规格与所述组内光交织器的规格可以相同也可以不同,一个组内光交织器的规格可以和另一个组内光交织器的规格相同或不同,所有组间光交织器的规格相同。优选地,所述组间光交织器的规格与所述组内光交织器的规格相同。当多个组内光交织器的规格不同时,所述组间光交织器的规格大于等于所述多个组内光交织器中规格最大的组内光交织器的规格。
根据本发明一个实施例,在组建数据交换系统时,可以根据所使用的交换装置的网络侧端口数确定组间光交织器的规格,并根据组间光交织器的规格对交换装置进行分组,得到多个交换组。例如,当组间光交织器为N*N光交织器时,每个交换组包括多个相同规格(即网络侧端口数相同)的交换装置,每个交换组包括的交换装置的个数可以相同也可以不同,每个交换组中的交换装置最多不超过N个。每个交换组中的每个交换装置的部分网络侧端口通过所述交换组的组内光交织器连接形成图6a所示的一个子系统。所有子系统通过多个组间光交织器连接形成一个数据交换系统。当子系统连接组间光交织器时,交换装置在其所位于的子系统中的编号与所述交换装置对应的N*N组间光交织器在所述多个N*N组间光交织器中的编号相同,例如,每个子系统中的编号为1的交换装置连接到组间光交织器1,编号为2的交换装置连接到组间光交织器2,以此类推,直到每个子系统中的每个交换装置都连 接到相应的组间光交织器。交换装置的具体连接方式可以参考图5。
基于图5所示的连接方法,如图7所示,为本发明实施例提供的另一种数据交换系统的结构示意图。所述数据交换系统包括1024个交换装置,本实施例采用的组间光交织器为32*32光交织器,则每个交换组中包括1024÷32=32个交换装置。为了简化配置并提高光交织器的利用率,本实施例中的组内光交织器也选用32*32光交织器,这样需要每个交换装置提供2*(N-1)=62个网络侧端口。每个交换组中的每个交换装置的31个网络侧端口作为组内端口连接到一个组内光交织器形成一个子系统,另外31个网络侧端口作为组间端口连接到所述交换装置对应的组间光交织器。例如,交换组1中的交换装置1的31个组内端口中的发送光口和接收光口分别连接(图中用同一条线表示)到组内光交织器1,31个组间端口连接到组间光交织器1。为了便于管理,各个交换组中的相同编号的交换装置连接到同一个组间光交织器。通过图7所示的方式,只需要4096根跨机房光纤就能实现1024个交换装置的全连接,大大减少了数据交换系统所需要的光纤数量。
当交换装置的数量不是N的倍数时,本发明实施例提供的方法仍然可以应用。如图8所示,为本发明实施例提供的再一种数据交换系统的结构示意图。图8所示的数据交换系统共包括980个交换装置,根据该数据交换系统的规模仍然采用32*32光交织器作为组间光交织器,则本实施例中需要32个组间光交织器。980÷32=30……20,故将980个交换装置分为31个交换组,前面30组每个组包括32个交换装置,每个交换装置提供62个网络侧端口,最后一个组,即第31组包括20个交换装置,第31组的每个交换装置需要提供31(组间端口)+19(组内端口)=50个网络侧端口,第31组的20个交换装置组成的子系统可以看作是前面提到的第二子系统。这样,前面30个组对应的组内光交织器为32*32光交织器,最后一组对应的组内光交织器可以是规格大于等于20*20的任意光交织器。在本实施例中,仍然是每个交换装置的一半网络侧端口连接到对应的组内光交织器,另外一半网络侧端口连接到组间光交织器,所有交换组内相同编号的交换装置连接到同一个组间光交织器。 这样,由于交换组31中只包括20个交换装置,则组间光交织器21到32上只连接了30个交换装置,而组间光交织器1-20上分别连接了31个交换装置。通过以上组网,只需要980*4根光纤就能够实现980个交换装置之间的全连接。
传统的接入交换装置会区分用户侧端口和网络侧端口,并且,网络侧端口数远远少于用户侧端口数,当需要建立大规模数据交换系统时,需要采用将接入交换装置层层汇聚到核心交换装置的方式实现所有接入交换装置的全连接,这种传统方式受限于核心交换装置的端口规模,不利于网络扩容。本发明实施例在组建数据交换系统时,只需要使用光交织器和普通的接入交换装置,不需要使用核心交换装置,打破了传统组网方式中核心交换装置的限制。在本发明实施例中,数据交换系统的规模由光交织器的规格决定。目前,最大的光交织器为80*80光交织器,这种规格的光交织器可以组建超出现有数据交换系统50倍以上交换容量的数据交换系统。因此,采用本发明实施例的方案,不仅能够节约光纤数量,降低布纤和维护成本,而且能够极大地扩展数据交换系统的规模。
本发明上述数据交换系统的各实施方式中的交换装置,可以是独立的交换机,也可以是分布式部署的接口板,所述接口板同时支持交换功能和控制功能。当所述交换装置为分布式部署的接口板时,所述数据交换系统实际上相当于一个分布式部署的大型交换机,所述数据交换系统的一个子系统相当于接口板组,则所述交换机包括K个接口板组,所述K个接口板组中的第一接口板组包括M个接口板,所述M个接口板中的第一接口板包括X个网络侧端口,所述X个网络侧端口包括M-1个组内端口和K-1个组间端口;所述M-1个组内端口分别连接所述第一接口板组中除所述第一接口板外的M-1个接口板;所述K-1个组间端口分别连接所述K个接口板组中除所述第一接口板组外的K-1个接口板组中所述第一接口板的直达接口板组。
源交换装置对数据流量的处理
本发明上述各实施例中提供的数据交换系统中的任意一个交换装置都能够支持数据流量在所述数据交换系统中的传输。由于数据交换系统中存在大量数据流,每个交换装置在转发数据流量时,既可能是源交换装置,也可能是目的交换装置,还可能是中间交换装置。
其中,所述源交换装置从用户侧端口获取数据流量,并将所述数据流量通过所述数据交换系统发送到目的交换装置。中间交换装置为位于源交换装置和目的交换装置之间的路径上的交换装置;所述目的交换装置从所述源交换装置或所述中间交换装置接收所述数据流量,并将所述数据流量通过用户侧端口发送出去。
当作为源交换装置时,本发明实施例中的交换装置可以执行一种发送数据流量的方法。特别地,所述源交换装置包括多个端口,每个端口都能够作为用户侧端口或网络侧端口。所述源交换装置可以是,但不限于,图17所示的交换装置1700。
如图9所示,所述方法包括步骤S910,S920和S930。其中:
S910:数据交换系统中的源交换装置通过用户侧端口获取数据流量。
其中,所述源交换装置可以是上述各数据交换系统实施例中的任意一个子系统中的任意一个交换装置。所述获取数据流量可以是所述源交换装置从用户或者服务器接收所述数据流量,也可以是所述源交换装置主动从所述用户或者服务器请求所述数据流量,总之上述数据流量是从所述源交换装置的用户侧端口进入所述源交换装置的。
步骤S910可以由,例如,图17中的交换装置1700的接收组件1701来实现,所述接收组件1701可以是接收器,接收单元以及用户侧端口中的任意一个。
S920:所述源交换装置根据所述数据流量的目的地址查找多路径转发表,得到包括所述目的地址的多路径转发表项,所述多路径转发表项包括所述目的地址和多个网络侧端口的对应关系。
本发明实施例中,每个交换装置上存储了至少两张转发表,一张是最短 路径转发表,一张是多路径转发表。所述多路径转发表的每个表项包括目的地址和多个网络侧端口的对应关系,所述最短路径转发表的每个表项仅包括目的地址和一个网络侧端口的对应关系。
具体来说,所述多路径转发表的每个表项至少包括目的地址以及对应所述目的地址的多个网络侧端口。当所述目的交换装置与所述源交换装置位于同一子系统中,所述多个网络侧端口为M-1个。当所述目的交换装置与所述源交换装置位于不同子系统时,所述多个网络侧端口可以为M-1,M个或者2*(M-1)个。其中,M为所述源交换装置所在的子系统中的交换装置的数量。
本发明实施例中,所述数据流量的目的地址可以为目的因特网协议(英文:Internet Protocol,简称:IP)地址或目的媒体访问控制(英文:media access control,简称:MAC)地址。
所述最短路径转发表和所述多路径转发表可以存储在所述源交换装置的不同存储组件中,也可以存储在同一个存储组件中,所述存储组件可以是易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM),也可以是非易失性存储器(英文:non-volatile memory),例如只读存储器(英文:read-only memory,缩写:ROM),快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);所述存储组件还可以包括上述种类的存储器的组合。
步骤S620可以由图17中的交换装置1700的处理组件1702来实现,所述处理组件1702可以是处理器,中央处理单元(英文:central processing unit,缩写:CPU),专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),以及数据平面中的任意一个,也可以是其他类型的处理器,处理单元或处理电路。
S930:所述源交换装置根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量,以使所述数据流量中的每份数据流量通过不同路径到达与 所述交换装置位于同一数据交换系统中的目的交换装置,所述数据交换系统包括至少一个子系统。
其中,所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为多份,向所述多个网络侧端口中的每个网络侧端口分别发送一份数据流量。
在本发明一个实施例中,为了使所述数据交换系统除所述源交换装置外的其他交换装置接收到所述数据流量的其中一份时,不再对接收的那份数据流量采用负载均衡的方式发送,根据本发明一个实施方式,在根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量之前,所述方法还包括:所述源交换装置为所述数据流量封装转发标记,所述转发标记用于指示接收到所述数据流量的交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项。其中,所述最短路径转发表项包括目的地址以及一个网络侧端口。所述封装转发标记,可以在将所述数据流量分为多份之前,也可以在将所述数据流量分为多份之后。
在本发明另一个实施方式中,所述源交换装置不需要为所述流量封装转发标记,接收到流量的交换装置根据接收所述流量的端口的属性(是组内端口还是组间端口)以及所述流量的目的交换装置是否与所述交换装置位于同一个子系统确定所述流量的出端口。
所述源交换装置通过轮询或哈希(英文:hash)的方式,向多个网络侧端口分别发送一份数据流量以实现负载分担。
步骤S930可以由图17中的交换装置1700的发送组件1703来实现,所述发送组件1703可以是发射器,发送单元以及网络侧端口中的任意一个。
通过本发明实施例上述发送数据流量的方法,数据流量被源交换装置通过多条不等价路径发送给目的交换装置,有效提高了各交换装置的网络侧端口利用率,避免了数据交换系统的拥塞。
为了进一步提高各交换装置的网络侧端口的利用率,假设源交换装置位于第一子系统,当所述源交换装置通过网络侧端口接收到其他交换装置发送 的数据流量后(此时,所述源交换装置为其他交换装置发送的数据流量的中间交换装置),所述源交换装置确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置位于所述第一子系统。在一个实施例中,当所述网络侧端口为组内端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,所述源交换装置将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组内端口发送给所述目的交换装置在所述第一子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组间端口分别发送给所述目的交换装置在另外M-1个子系统中的直达交换装置;在另一个实施例中,当所述网络侧端口为组间端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,所述源交换装置将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组间端口发送给所述目的交换装置所在子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组内端口分别发送给所述第一子系统中的其他M-1个交换装置。
源交换装置中负载均衡的具体实现方式
本发明实施例将交换装置的网络侧端口分为两类,一类通过组内光交织器连接位于同一个子系统的交换装置,称为组内端口,另一类通过组间光交织器连接位于不同子系统的交换装置,称为组间端口。
在实施方式A中,所述源交换装置和所述目的交换装置位于同一个子系统,所述子系统中包括M个交换装置,所述多个网络侧端口包M-1个组内端口,所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M-1份并通过所述M-1个组内端口将所述M-1份数据流量分别发送给所述子系统中除所述源交换装置外的其他M-1个交换装置。
在实施方式B中,所述源交换装置和所述目的交换装置位于不同的子系统,所述多个网络侧端口为M个,所述M个网络侧端口包括1个组间端口 和M-1个组内端口,所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M份,将其中1份数据流量通过所述组间端口发送给所述目的交换装置所在的子系统中的所述源交换装置的直达交换装置,将其余的M-1份数据流量通过所述M-1个组内端口分别发送给所述源交换装置所在的子系统中除所述源交换装置外的其他M-1个交换装置。
在实施方式C中,所述源交换装置和所述目的交换装置位于数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口为M个,所述M个端口包括1个组内端口和M-1个组间端口,所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M份,将其中1份数据流量通过所述组内端口发送给所述目的交换装置在所述源交换装置所在的子系统中的直达交换装置,将其余的M-1份数据流量通过所述M-1个组间端口分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
在实施方式D中,所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到同一个组间光交织器,所述多个网络侧端口为M-1个组间端口,所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M-1份并通过所述M-1个组间端口将所述M-1份数据流量分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
在实施方式E中,所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括M-1个组内端口和M-1个组间端口,所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为2*(M-1)份,将其中M-1份数据流量通过所述M-1个组内端口发送给所述源交换装置所在的子系统中除所述源交换机外的M-1个交换装置,以及将另外M-1份数据流量通过所述M-1个组间端口发送给除所述源交换装置所在的子系统外的M-1 个子系统中的所述源交换装置的直达交换装置。
多路径转发表的生成过程
在一个实施例中,所述源交换装置(可以是所述数据交换系统中的任意一个交换装置)还需要获取所述多路径转发表。所述多路径转发表可以是由控制器(英文:controller)或者所述源交换装置生成的。当所述多路径转发表由所述控制器生成时,所述源交换装置获取所述多路径转发表包括所述源交换装置从所述控制器获取所述多路径转发表。所述控制器和所述源交换装置采用相同的算法来生成所述多路径转发表。
下面以图10,所述源交换装置生成以所述多路径转发表为例,说明所述多路径转发表的生成过程,具体来说,所述多路径转发表可以由上述图17中的交换装置1700的处理组件1703生成,所述过程包括:
S9001,所述源交换装置获取所述源交换装置的每个网络侧端口的第一本地开销。
其中,所述第一本地开销配置在所述源交换装置上、仅供所述源交换装置在计算所述多路径转发表时使用。
在一个实施方式中,所述源交换装置的所有网络侧端口具有相同的第一本地开销。
S9002,所述源交换装置获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销。
其中,所述第一全局开销为另一交换装置发布的、供所述源交换装置在计算所述多路径转发表时使用的开销。
在一个实施方式中,所有交换装置发布的所有网络侧端口的第一全局开销相同。
S9003,所述源交换装置根据所述源交换装置的每个网络侧端口的第一本地开销以及每个所述网络侧端口的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销,生成所述多路径转发表。
由于本发明实施例中数据交换系统中的所有交换装置都是全连通的,所述源交换装置收到所述源交换装置的每个所述网络侧端口的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销后,就可以计算出整个数据交换系统中的路径,生成所述多路径转发表。
本发明实施例中,需要预先为每个网络侧端口配置本地开销和全局开销。其中,网络侧端口的本地开销是所述网络侧端口所属的交换装置在计算与所述网络侧端口相关的路径时使用的开销,包括了用于计算所述多路径转发表的第一本地开销和用于计算最短路径转发表的第二本地开销。网络侧端口的全局开销,是由所述网络侧端口所属的交换装置发送给另一交换装置,以供所述另一交换装置计算与所述网络侧端口相关的路径时使用的开销。类似地,本发明实施例中网络侧端口的全局开销包括用于计算多路径转发表的第一全局开销和用于计算最短路径转发表的第二全局开销。
所述网络侧端口可以仅包括组内端口,也可以包括组内端口和组间端口。
在一个实施方式中,所述网络侧端口仅包括组内端口,所述源交换装置获取所述源交换装置的每个网络侧端口的第一本地开销包括:所述源交换装置获取所述源交换装置的每个组内端口的第一本地开销。例如,图12(后续有详细说明)中,源交换装置S1获取S1用于连接交换装置S2-S8的端口P2-P8的第一本地开销。
所述源交换装置获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销包括:所述源交换装置获取与所述源交换装置位于同一子系统的每个交换装置的每个组内端口的第一全局开销。例如,图12中,S2-S8和S1在同一个子系统中,则S2-S8都是S1的直达交换装置,则S1接收S2-S8分别发送的各自的每个组内端口的第一全局开销。
在另一个实施方式中,所述网络侧端口包括组内端口和组间端口,所述源交换装置获取所述源交换装置的每个网络侧端口的第一本地开销包括:所述源交换装置分别获取所述源交换装置的每个组内端口的第一本地开销以及 每个组间端口的第一本地开销。例如,图13(后续有详细说明)中,源交换装置S11的网络侧端口既连包括接组内光交织器1的组内端口,又包括连接组间光交织器1的组间端口,则源交换装置S11需要获取每个组内端口的第一本地开销和每个组间端口的第一本地开销。
所述源交换装置获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销包括:所述源交换装置获取与所述源交换装置位于同一子系统的每个交换装置的组内端口的第一全局开销以及组间端口的第一全局开销,以及,获取与所述源交换装置位于不同子系统的所述源交换装置的每个直达交换装置的组内端口的第一全局开销以及组间端口的第一全局开销。图13中,S1接收每个直达交换装置分别向S11发送所述直达交换装置的每个网络侧端口的第一全局开销。例如,子系统1中的交换装置S12发送的是连接到组内光交织器1的每个组内端口的第一全局开销k11以及连接到组间光交织器2的组间端口的第一全局开销k12,而子系统2中的交换装置S21发送的是连接组间光交织器2的每个组间端口的第一全局开销k12以及连接组内光交织器2的每个组内端口的第一全局开销k11。
多路径转发表的生成规则
本发明实施例中,所述多路径转发表的每个表项中包括多个端口,所述多个端口代表到达目的交换装置的多条路径不等价路径。
为了在所述多条路径间实现负载均衡,所述源交换装置在生成所述多路径转发表时,遵循以下基本规则:
(a)AD of FS〈FD of Successor,即
不等价路径的次优路径(英文:Feasible Successor,简称:FS)的邻接距离(英文:Advertised Distance)小于最优路径(英文:Successor)的全程距离(英文:Full Distance,简称:FD);
(b)FD of FS〈V*FD of Successor,即
次优路径的全程距离小于最优路径全程距离的V倍,其中V为变量。
其中,最优路径是指开销最小的路径;邻接距离是指到达目的交换装置的第一段路径的距离。例如图6c中,从交换装置S1到交换装置S5的路径S1-〉S2-〉S5中,S1-〉S2就是路径S1-〉S2-〉S5的邻接距离。
基于以上基本原则,在本发明一个实施例中,一个子系统中的所有交换装置的组内端口具有相同的第一本地开销和第一全局开销,所述组内端口的第一本地开销不同于所述组内端口的第一全局开销;一个数据交换系统中的所有交换装置的组间端口具有相同的第一本地开销和第一全局开销,所述组间端口的第一本地开销不同于所述组间端口的第一全局开销。组内端口的第一本地开销不同于一个组间端口的第一本地开销,组内端口的第一全局开销不同于组间端口的第一全局开销。例如,每个组内端口的第一全局开销可以为k11,第一本地开销可以为k11+△11;每个组间端口的第一全局开销可以为k12,第一本地开销可以为k12+△12。其中,△11和△12为根据需要设置的增量。
本发明实施例所述源交换装置在生成所述多路径转发表时的具体规则包括:
一、组内端口的第一全局开销(相当于组内次优路径的邻接距离)〈组内端口的第一本地开销(相当于组内最优路径的全程距离);
基于上述条件,将组内端口的第一全局开销设置为k11,则组内端口的第一本地开销为k11+△11,其中,△11为增量,则
k11〈k11+△11……公式 (1)。
二、组间端口的第一本地开销和第一全局开销的设置必须满足下列全部规则:
(B1)使从组内端口转发的一条路径为最优路径,
例如,源交换装置的组间端口的第一本地开销〉源交换装置的组间端口的最优路径的全程距离(源交换装置的组内端口的第一本地开销+目的交换装置的组间端口的第一全局开销+目的交换装置在源交换装置所在的子系统 内的直达交换机的组内端口的第一全局开销),
即:k12+△12>k11+△11+k11+k12……公式 (2)
(B2)使从组间端口转发的一条路径为次优路径,
该次优路径的全程距离,小于最优路径的全程距离的V倍,即
k12+△12+k11〈V*(k11+△11+k11+k12)……公式 (3)。
(B3)数据流量不能两次被组间端口转发,则规定如下:
k12+△12+k〉V*(k11+△11+k11+k12)……公式 (4)或
k12〉k11+△11+k11+k12……公式 (5)
上述公式(5)无解,并且,匹配到公式(4)的路径不会被选为次优路径。
(B4)组内端口所连接的全部路径都属于最优路径或者次优路径,组间次优路径的全程距离小于组间最优路径的全程距离的V倍,即
k11+△11+k11+k12〈V*(k11+△11+k12)……公式 (6),且
组间次优路径的邻接距离小于组间最优路径的全程距离,即
k11+k12〈k11+△11+k12……公式 (7)
此外,还可以进一步规定:
(B5)当组内光纤中断后,数据流量可以从所有组间端口转发,即规定组间转发路径为次优路径,则
k12+△12+k11+k12〈V*(K12+△12)……公式 (8)
k11+k12〈k12+△12……公式 (9)
需要说明的是,上述规则是必须满足的,但是实现规则的公式可以是各种各样的,本发明的上述公式只用来示例,不用来对本发明进行限制。通过采用上述规则,所述源交换装置可以生成所述多路径转发表。上述规则可以应用在所述数据交换系统包括一个子系统或者为多个子系统的场景下。当所述数据交换系统仅包括一个子系统时,只要将k12和△12均设为0即可,在这种情况下,公式(8)和(9)同样适用,只是无解,即不能生成转发路径。
基于以上基本原则,在本发明的另一个实施例中,一个子系统中的交换装 置的所有组内端口具有相同的第一本地开销和第一全局开销,并且,一个组内端口的第一本地开销与所述组内端口的第一全局开销相同。所述数据交换系统中的所有交换装置的组间端口具有相同的第一本地开销和第一全局开销,所述组间端口的第一本地开销与所述组间端口的第一全局开销相同,即△11和△12都可以为0,且k11=k12。为了在所述多条条路径间实现负载均衡,所述源交换装置在生成所述多路径转发表时,遵循以下具体规则:
C1)AD of FS〈FD of Successor+e,即
不等价路径的次优路径的邻接距离小于最优路径的全程距离与设定增量e之和;以及
C2)FD of FS〈V*FD of Successor,即
次优路径的全程距离小于最优路径的全程距离的V倍,V为可以设定的系数。
其他交换装置对数据流量的处理
如前所述,本发明实施例中当源交换装置将多份数据流量通过负载均衡的方式发送后,接收到数据流量的交换装置需要将自己接收的数据流量转发给其他交换装置(如中间交换装置等)或者用户侧端口。
由于所述数据交换系统中各交换装置是全连通的,因此,所述数据交换系统中的任意一个交换装置都可能执行上述操作。在一个实施例中,所述交换装置可以是图18所示的交换装置1800。
如图11所示,所述方法包括步骤S1110,S1120,S1130和S1140。其中:
S1110、交换装置接收另一交换装置发送的数据流量。
其中,所述交换装置和所述另一交换装置位于所述数据交换系统,所述交换装置可以和所述另一交换装置位于同一子系统,也可以位于不同的子系统,所述另一交换装置可以是源交换装置,也可以是中间交换装置,总之,所述另一交换装置为所述数据交换系统中除所述交换装置外的任意一个交换装置。
步骤S1110可以由图18中的交换装置1800的接收组件1801来实现,所述接收组件1801可以是接收器,接收单元以及用户侧端口中的任意一个。
S1120、所述交换装置确定所述数据流量是否封装了转发标记,所述转发标记用于指示所述交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项。如果所述数据流量封装了所述转发标记,执行步骤1130,如果所述数据流量没有封装所述转发标记,根据本领域常用技术手段转发所述数据流量。
其中,每个交换装置上都存储了两张转发表,一张是多路径转发表,一张是最短路径转发表。所述最短路径转发表的每个转发表项包括目的地址以及一个端口的对应关系,则所述数据流量的最短路径转发表项包括所述数据流量的目的地址和一个网络侧端口的对应关系。
S1130、当所述数据流量封装了转发标记时,所述交换装置确定所述数据流量的目的交换装置是否为所述交换装置。
所述交换装置确定所述数据流量的目的交换机是否为所述交换装置,具体为:所述交换装置根据所述数据流量的目的地址查找所述最短路径转发表,得到包括所述目的地址的最短路径转发表项,当所述最短路径转发表中的端口为用户侧端口时,确定所述交换装置为目的交换装置,当所述最短路径转发表中的端口为网络侧端口时,确定所述交换装置不为目的交换装置。
步骤S1120以及S1130可以由图18中交换装置1800的的处理组件1802来实现,所述处理组件1802可以是处理器,CPU,ASIC,以及数据平面中的任意一个。
S1140、所述交换装置根据确定的结果转发所述数据流量。
在本方法的一个实施方式中,所述根据确定的结果转发所述数据流量包括:
当所述数据流量的目的交换装置不是所述交换装置时,所述交换装置根据根据所述最短路径转发表项转发所述数据流量,以使所述数据流量到达所述目的交换装置。
其中,当所述目的交换装置和所述交换装置位于同一个子系统时,所述交换装置根据所述最短路径转发表项通过组内端口将所述数据流量发送给所述目的交换装置;当所述目的交换装置和所述交换装置位于不同的子系统时,所述交换装置根据所述最短路径转发表项通过组间端口将所述数据流量发送给所述交换装置在所述目的交换装置所在的子系统的直达交换装置,以使所述直达交换装置将所述数据流量发送给所述目的交换装置。
在本方法的另一个实施方式中,所述根据确定的结果转发所述数据流量包括:当所述数据流量的目的交换装置是所述交换装置时,从所述数据流量中删除所述转发标记,并根据所述最短路径转发表中包括所述数据流量的目的地址的最短路径转发表项将删除了所述转发标记的数据流量发送给所述数据交换系统外的设备。
步骤S1140可以由图18中交换装置1800的的发送组件1803来实现,所述发送组件1803可以是发射器,发送单元、网络侧端口、用户侧接口中的任意一个。
最短路径转发表的生成过程和规则
在本发明一个实施例中,数据交换系统中的任意一个交换装置还需要生成所述最短路径转发表,所述最短路径转发表的生成规则包括:(1)组内端口所连接的路径为最优路径;(2)当数据流量的目的交换装置与所述交换装置位于不同的子系统时,只通过组间端口转发所述数据流量。其中,上述规则可以通过设置组内端口的第二本地开销=组内端口的第二全局开销,组间端口的第二本地开销<组间端口的第二全局开销来实现。
具体来说,生成所述最短路径转发表的步骤可以包括:
所述交换装置获取所述交换装置的每个网络侧端口的第二本地开销,其中,所述第二本地开销配置在所述交换装置上、仅供所述交换装置在计算所述多路径转发表时使用;
所述交换装置获取每个所述网络侧端口连接的直达交换装置发送的所述 直达交换装置的每个网络侧端口的第二全局开销;所述第二全局开销为另一交换装置发布的、供所述交换装置在计算所述最短路径转发表时使用的开销;
所述交换装置根据所述交换装置的每个网络侧端口的第二本地开销以及每个所述网络侧端口的直达交换装置发送的所述直达交换装置的每个网络侧端口的第二全局开销,生成所述最短路径转发表。
在一个实施方式中,当所述网络侧端口仅包括组内端口时,所述交换装置获取所述交换装置的每个网络侧端口的第二本地开销包括:所述交换装置获取所述交换装置的每个组内端口的第二本地开销;所述交换装置获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第二全局开销包括:所述交换装置获取与所述交换装置位于同一子系统的每个交换装置的每个组内端口的第二全局开销。其中,所述组内端口的第二本地开销和所述组内端口的第二全局开销相同。
在另一个实施方式中,当所述网络侧端口包括组内端口和组间端口时,所述交换装置获取所述交换装置的每个网络侧端口的第二本地开销包括:所述交换装置分别获取所述交换装置的每个组内端口的第二本地开销以及每个组间端口的第二本地开销;所述交换装置获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第二全局开销包括:所述交换装置获取与所述交换装置位于同一子系统的每个交换装置的组内端口的第二全局开销以及组间端口的第二全局开销,以及,获取与所述交换装置位于不同子系统的所述交换装置的直达交换装置的组内端口的第二全局开销以及组间端口的第二全局开销。其中,所述组间端口的第二全局开销等于所述组内端口的第二全局开销,所述组间端口的第二本地开销小于所述组内端口的第二本地开销。
数据交换系统中的数据流量转发过程示例
本发明实施例所述数据交换系统中的源交换装置、中间交换装置和目的交换装置互相配合,能够实现数据流量在数据中心中的转发。以下结合附图 12-16,说明数据流量在所述数据交换系统中的转发过程。
对应于前述的实施方式A,图12为在本发明实施例所述的数据交换系统中发送数据流量的第一种过程示意图,。在图12中,源交换装置和目的交换装置位于同一个子系统。具体来说,所述子系统中M=8,即所述子系统包括8个交换装置,分别为S11,S12,……S18。其中,S11为源交换装置,S15为目的交换装置。S11在对数据流量经过负载均衡处理以及封装转发标记后,得到7份数据流量,所述7份数据流量分别被S11根据S11的多路径转发表发送到与S12-S18通信的网络侧端口P2-P8。所述7份数据流量对应的光信号经过合波器合波后,通过一条光纤被发送到光交织器的输入端口Pin1,在光交织器内部处理后,所述7份数据流量对应的光信号经过分波器后被分别发送给交换装置S12-S18。交换装置S12-S18中的中间交换装置即S12-S14和S16-S18收到自己的那份数据流量后,分别根据各自的最短路径转发表将接收的该份数据流量再通过所述子系统中的最优路径发送给S15,S15收到全部7份数据流量后,将全部7份数据流量汇聚得到总的数据流量。需要说明的是,图12中S12-S14和S16-S18发送数据流量到S15的过程分别用一条曲线代替,但是实际执行时,仍然需要通过所述N*N光交织器才能将数据流量发送到S15。其中,所述N≥8。
图12中的数据流量转发过程使数据流量能够通过多条不等价路径到达目的交换装置,提高了数据交换系统的利用率,避免了数据流量拥塞。
当所述数据流量的目的交换装置与源交换装置位于不同子系统时,如图13-18所示,为了便于描述,组内光交织器和组间光交织器均为N*N光交织器,每个子系统中包括的交换装置数M与光交织器的规格N相同,每个标数字的小方格代表一个交换装置,带箭头的曲线为数据流量发送方向。
对应于前述的实施方式B,图13为在本发明实施例所述的数据交换系统中发送数据流量的第二种过程示意图。如图13所示,源交换装置为S11,目的交换装置为S22。S11获取到数据流量后,对所述数据流量进行负载均衡处理以及封装转发标记后,得到N份数据流量,然后,S11根据S11的多路 径转发表将其中的N-1份数据流量通过子系统1中的组内光交织器1分别发送给所述子系统1中的另外N-1个交换装置,即交换装置S12-S1N,将最后1份数据流量通过组间光交织器1发送给子系统2中的直达交换装置即S21。每个收到1份数据流量的交换装置确定自身是否为目的交换装置,当确定自身不是目的交换装置时,根据自己的最短路径转发表转发该份数据流量。例如,S12在收到1份数据流量后,确定自身不是目的交换装置,根据S12的最短路径转发表通过组间光交织器2将该份数据流量发送给子系统2中S12的直达交换装置S22。交换装置S13-S1N执行与S12类似的操作,直到全部N份数据流量分别到达子系统2中的N个交换装置。子系统2中的中间交换装置,即除S22外的交换装置S21,以及S23-S2N,分别根据各自的最短路径转发表将自己接收的那份数据流量通过所述子系统2中的组内光交织器2发送给S22,S22在收到全部N份数据流量后,将所述N份数据流量汇聚得到所述数据流量。
图13中的数据流量转发过程只需要数据流量经过一次组间光交织器的转发,因此具有更高的转发性能。
对应于前述的实施方式C,图14为在本发明实施例所述的数据交换系统中发送数据流量的第三种过程示意图。如图14所示,源交换装置为S11,目的交换装置为S22。S11获取到所述数据流量后,对所述数据流量经过负载均衡处理以及封装转发标记后,得到N份数据流量,然后,S11根据S11的多路径转发表将其中N-1份数据流量通过组间光交织器1分别发送给另外N-1个子系统中S11的直达交换装置,即交换装置S21,S31,……SN1,将最后1份数据流量通过子系统1中的组内光交织器1发送给S22在所述子系统1中的直达交换装置S12。每个收到1份数据流量的交换装置分别确定自身是否为目的交换装置,并在自身不是目的交换装置时,根据最短路径转发表转发接收的那份数据流量。例如,S12和S21确定自身不是目的交换装置,根据各自的最短路径转发表将接收的那份数据流量分别直接发送给22,SN1也确定自身不是目的交换装置,但SN1的最短路径转发表中的到达S22的下 一跳为S22的直达交换装置SN2,SN1将接收的那份数据流量发送给SN2,然后SN2根据SN2的最短路径转发表将该份数据流量通过组间光交织器2发送给S22。S22在收到全部N份数据流量后,将所述N份数据流量汇聚得到所述数据流量。
图14所示的过程将数据流量分担到整个数据交换系统中,能够最大程度地减少数据流量拥塞,提高各交换装置的利用率。
对应于前述的实施方式D,图15为在本发明实施例所述的数据交换系统中发送数据流量的第四种过程示意图。如图15所示,源交换装置为S11,目的交换装置为S21,S11和S21位于不同的子系统但是连接到同一个组间光交织器,即组间光交织器1。S11获取到数据流量后,对所述数据流量经过负载均衡处理以及封装转发标记后,得到N-1份数据流量,将所述N-1份数据流量通过组间光交织器1分别发送给其他N-1个子系统中S11的直达交换机,即交换装置S21,S31,……SN1。每个收到1份数据流量的交换装置分别确定自身是否为目的交换装置,并在自身不是目的交换装置时,根据最短路径转发表转发接收的那份数据流量。在本实施方式中,由于S31,……SN1分别将各自接收的那份数据流量通过对应的组间光交织器发送给S21。S21在收到全部N-1份数据流量后,将所述N-1份数据流量汇聚得到所述数据流量。
图15所示的过程在目的交换装置和源交换装置位于不同子系统并连接到同一个组间光交织器时,能够使数据流量仅通过组间端口就可以发送到目的交换装置,在避免数据流量拥塞的同时提高了数据流量转发效率。
对应于前述的实施方式E,图16为在本发明实施例所述的数据交换系统中发送数据流量的第五种过程示意图。如图16所示,源交换装置为S11,目的交换装置为S22。S11获取到所述数据流量后,对所述数据流量经过负载均衡处理以及封装转发标记后,得到2*(N-1)份数据流量,然后,S11根据S11的多路径转发表将其中N-1份数据流量通过组间光交织器1分别发送给另外N-1个子系统中源交换装置S11的直达交换装置,即交换装置S21, S31,……SN1,将另外N-1份数据流量通过子系统1中的组内光交织器1分别发送给所述子系统1中除S11外的其他交换装置,即S12,……S1N。每个收到1份数据流量的交换装置分别确定自身是否为目的交换装置,并在自身不是目的交换装置时,根据最短路径转发表转发接收的那份数据流量。本实施方式中,带箭头的实线表示S11通过组间端口发送出去的N-1份数据流量的转发路径,带箭头的虚线表示S11通过组内端口发送出去的N-1份数据流量的转发路径。最终,全部2*(N-1)份数据流量到达S22。S22在收到全部N份数据流量后,将所述N份数据流量汇聚得到所述数据流量。
图16所示的过程将数据流量分为2*(N-1)份,使数据流量在所述数据交换系统中的分布更为均匀,网络利用率更高。
对应于前述的实施方式B,本发明实施例还提供了在所述的数据交换系统中发送数据流量的第六种过程(没有画图,涉及到的各交换装置可参考图13)。与上述第二种过程不同的是,第六种过程中的S11在转发所述N份数据流量时不需要封装转发标记。每个收到1份数据流量的交换装置确定接收所述1份数据流量的网络侧端口的属性,以及确定所述流量的目的交换装置是否位于自身所在的子系统,当确定自身不是目的交换装置,所述网络侧端口为组内端口且所述流量的目的交换装置位于不同的子系统时,将所述1份流量再分为N份子流量,将其中1份子流量通过组内端口发送给所述目的交换装置在自身所在子系统中的直达交换装置,将其余的N-1份子流量通过自身的N-1个组间端口分别发送给所述目的交换装置在另外N-1个子系统中的直达交换装置。例如,S12在收到1份数据流量后,确定自身不是目的交换装置,该份流量是通过组内端口接收的,并且目的交换装置不在子系统1,S12将收到的流量分为N份子流量,将其中1份子流量通过组间光交织器2发送给子系统2中S12的直达交换装置S22,将其余N-1份子流量通过组内端口分别发送给交换装置S11与S13-S1N。每个收到1份子流量的交换装置可以根据以上第一种到第五种过程中的一种将收到的那份子流量发送给目的交换装置。
上述第六种数据流量转发过程需要数据流量经过两次组间光交织器的转发,能够实现全网无阻塞。
对应于前述的实施方式C,本发明实施例还提供了所述的数据交换系统中发送数据流量的第七种过程(没有画图,涉及到的各交换装置可参考图14)。与上述第三种过程不同的是,第七种过程中的S11在转发所述N份数据流量时不需要封装转发标记。每个收到1份数据流量的交换装置确定接收所述1份数据流量的网络侧端口的属性,以及确定所述流量的目的交换装置是否位于自身所在的子系统,当确定自身不是目的交换装置,所述网络侧端口为组间端口且所述流量的目的交换装置位于不同的子系统时,将所述1份流量再分为N份子流量,将其中1份子流量通过组间端口发送给自身在所述目的交换装置所在子系统中的直达交换装置,将其余的N-1份子流量通过自身的N-1个组内端口分别发送给自身所在子系统中的其他N-1个交换装置。例如,SN1收到1份流量后,确定自身不是目的交换装置,且接收所述流量的网络侧端口为组间端口,且自身和目的交换装置位于不同的子系统,则SN1将所述1份流量分为N份子流量,将其中一份通过组间光交织器1发送给SN1在子系统2中的直达交换装置S21,将其余的N-1份流量通过N-1个组内端口分别发送给子系统N中的交换装置SN2-SNN。每个收到1份子流量的交换装置可以根据以上第一种到第五种过程中的一种将收到的那份子流量发送给目的交换装置。
上述第七种数据流量转发过程需要数据流量经过两次组间光交织器的转发,能够实现全网无阻塞。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,所述相关的硬件完成包括上述各实施例中描述的方法的步骤。而前述的存储介质包括:只读存储器(英文:read-only memory,简称:ROM)、随机存取存储器(英文:random access memory,简称: RAM)、磁碟或者光盘等各种可以存储程序代码的介质。相应地,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括用以执行上述方法实施例中的各种操作的指令。
相应地,本发明实施例还提供一种存储介质,所述存储介质用于存储上述计算机程序产品。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (40)

1.一种数据交换系统,其特征在于,包括K个子系统,所述K个子系统中的第一子系统包括M个交换装置,所述M个交换装置中的第一交换装置包括X个网络侧端口,所述X个网络侧端口包括M-1个组内端口和K-1个组间端口;
所述M-1个组内端口分别连接所述第一子系统中除所述第一交换装置外的M-1个交换装置;
所述K-1个组间端口分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置。
2.根据权利要求1所述的数据交换系统,其特征在于,所述第一子系统还包括一个N*N组内光交织器;
其中,每个网络侧端口包括一个发送光口和一个接收光口;
所述M-1个组内端口分别连接所述第一子系统中除所述第一交换装置外的M-1个交换装置包括:
所述M-1个组内端口的所有发送光口连接所述N*N组内光交织器的一个输入端口,所述M-1个组内端口的所有接收光口连接所述N*N组内光交织器的一个输出端口,以通过所述N*N组内光交织器连接所述第一子系统中除所述第一交换装置外的M-1个交换装置;
其中,M和N均为自然数,并且M≤N。
3.根据权利要求2所述的数据交换系统,其特征在于,所述数据交换系统还包括多个N*N组间光交织器;
所述K-1个组间端口分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置包括:
所述K-1个组间端口的所有发送光口连接第一N*N组间光交织器的一个输入端口,所述K-1个组间端口的所有接收光口连接所述第一N*N组间光交织器的一个输出端口,以通过所述第一N*N组间光交织器分别连接所述K个子系统中除所述第一子系统外的K-1个子系统中所述第一交换装置的直达交换装置;
其中,所述第一交换装置在所述第一子系统中的编号与所述第一N*N组间光交织器在所述多个N*N组间光交织器中的编号相同。
4.根据权利要求1-3中任意一项所述的数据交换系统,其特征在于,所述多个子系统具有相同的规模,且,对于每个子系统,M=N=K。
5.根据权利要求1-3中任意一项所述的数据交换系统,其特征在于,所述多个子系统除所述第一子系统外还包括第二子系统,所述第二子系统包括一个N’*N’组内光交织器以及Z个交换装置,其中,N’<N,Z<M。
6.根据权利要求1-5中任意一项所述的数据交换系统,其特征在于,所述第一交换装置包括交换单元和接口单元;
当所述交换单元为光口交换单元时,所述接口单元包括X个光模块,所述X个网络侧端口为所述X个光模块的端口;
当所述交换单元为电口交换单元时,所述接口单元为电-光转换单元,所述X个网络侧端口为所述电-光转换单元的端口。
7.一种交换装置,其特征在于,所述交换装置为数据交换系统的第一子系统中的M个交换装置中的任意一个,所述交换装置包括多个端口,每个端口既能作为用户侧端口,又能作为网络侧端口;
所述交换装置还包括:
接收组件,用于通过用户侧端口获取数据流量;
处理组件,用于根据所述数据流量的目的地址查找多路径转发表,得到包括所述目的地址的多路径转发表项;其中,所述多路径转发表项包括所述目的地址和多个网络侧端口的对应关系;
发送组件,用于根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量,以使所述数据流量中的每份数据流量通过不同路径到达与所述交换装置位于同一数据交换系统中的目的交换装置。
8.根据权利要求7所述的装置,其特征在于,所述目的交换装置与所述交换装置位于所述数据交换系统的同一个子系统,所述多个网络侧端口包括M-1个组内端口,所述发送组件用于:将所述数据流量分为M-1份并通过所述M-1个组内端口将所述M-1份流量分别发送给所述子系统中除所述交换装置外的其他M-1个交换装置。
9.根据权利要求7所述的装置,其特征在于,所述交换装置与所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组间端口和M-1个组内端口;
所述发送组件用于:将所述数据流量分为M份,将其中1份数据流量通过所述组间端口发送给所述目的交换装置所在的子系统中的所述交换装置的直达交换装置,将其余的M-1份数据流量通过所述M-1个组内端口分别发送给所述第一子系统中除所述交换装置外的其他M-1个交换装置。
10.根据权利要求7所述的装置,其特征在于,
所述交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组内端口和M-1个组间端口;
所述发送组件用于:将所述数据流量分为M份,将其中1份数据流量通过所述组内端口发送给所述目的交换装置在所述第一子系统中的直达交换装置,将其余的M-1份数据流量通过所述M-1个组间端口分别分别发送给除所述第一子系统外的M-1个子系统中的所述交换装置的直达交换装置。
11.根据权利要求7所述的装置,其特征在于,所述交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到同一个组间光交织器,所述多个网络侧端口包括M-1个组间端口;
所述发送组件用于:将所述数据流量分为M-1份,并通过所述M-1个组间端口将所述M-1份数据流量分别发送分别给除所述第一子系统外的M-1个子系统中的所述交换装置的直达交换装置。
12.根据权利要求7所述的装置,其特征在于,所述交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括M-1个组内端口和M-1个组间端口;
所述发送组件用于:将所述数据流量分为2*(M-1)份,将其中M-1份数据流量通过所述M-1个组内端口分别发送给所述第一子系统中除所述交换装置外的M-1个交换装置,以及将另外M-1份数据流量通过所述M-1个组间端口分别发送给除所述第一子系统外的M-1个子系统中的所述交换装置的直达交换装置。
13.根据权利要求7-12任意一项所述的装置,其特征在于,所述发送组件还用于:
在根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量之前,为所述数据流量封装转发标记,所述转发标记用于指示接收到所述数据流量的交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项,其中,所述最短路径转发表项包括目的地址和一个网络侧端口的对应关系。
14.根据权利要求7-13任意一项所述的装置,其特征在于,所述处理组件还用于生成所述多路径转发表;
在生成所述多路径转发表时,所述处理组件用于:
获取所述交换装置的每个网络侧端口的第一本地开销,其中,所述第一本地开销配置在所述交换装置上、仅供所述处理组件在计算所述多路径转发表时使用;
获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销;所述第一全局开销为所述直达交换装置发布的、供所述处理组件在计算所述多路径转发表时使用的开销;以及
根据所述交换装置的每个网络侧端口的第一本地开销以及每个所述网络侧端口的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销,生成所述多路径转发表。
15.根据权利要求14所述的装置,其特征在于,所述网络侧端口仅包括组内端口,
在获取所述交换装置的每个网络侧端口的第一本地开销时,所述处理组件用于:获取所述交换装置的每个组内端口的第一本地开销;
在获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销时,所述处理组件用于:获取与所述交换装置位于同一子系统的每个交换装置的每个组内端口的第一全局开销。
16.根据权利要求14所述的装置,其特征在于,所述网络侧端口包括组内端口和组间端口,
当获取所述交换装置的每个网络侧端口的第一本地开销时,所述处理组件用于:分别获取所述交换装置的每个组内端口的第一本地开销以及每个组间端口的第一本地开销;
当获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销时,所述处理组件用于:获取与所述交换装置位于同一子系统的每个交换装置的组内端口的第一全局开销以及组间端口的第一全局开销,以及,获取与所述交换装置位于不同子系统的所述交换装置的每个直达交换装置的组内端口的第一全局开销以及组间端口的第一全局开销。
17.根据权利要求16所述的装置,其特征在于,生成所述多路径转发表的规则包括:
组内端口的第一全局开销小于组内端口的第一本地开销;且
组间端口的第一本地开销和第一全局开销的设置满足下列条件:能够使从组内端口转发的一条路径为最优路径;使一个组间端口可以转发数据流量;使数据流量不能两次被组间端口转发;组内端口所连接的全部路径都属于最优路径或者次优路径,且组间次优路径的全程距离小于组间最优路径的全程距离的V倍,其中,V为可以设定的系数。
18.根据权利要求16所述的装置,其特征在于,所述组内端口的第一本地开销与所述组内端口的第一全局开销相同,所述组间端口的第一本地开销与所述组间端口的第一全局开销相同;
生成所述多路径转发表的规则包括:
不等价路径的次优路径FS的邻接距离AD小于最优路径的FD与设定增量e之和;以及,次优路径的全程距离小于最优路径的全程距离的V倍,V为可以设定的系数。
19.根据权利要求7-12任意一项所述的装置,其特征在于,
所述接收组件还用于通过网络侧端口接收其他交换装置发送的数据流量;
所述处理组件还用于确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;
所述发送组件还用于当所述网络侧端口为组内端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组内端口发送给所述目的交换装置在所述第一子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组间端口分别发送给所述目的交换装置在另外M-1个子系统中的直达交换装置。
20.根据权利要求7-12任意一项所述的装置,其特征在于,
所述接收组件还用于通过网络侧端口接收其他交换装置发送的数据流量;
所述处理组件还用于确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;
所述发送组件还用于当所述网络侧端口为组间端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组间端口发送给所述目的交换装置所在子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组内端口分别发送给所述第一子系统中的其他M-1个交换装置。
21.一种交换装置,其特征在于,包括多个端口,每个端口既能作为用户侧端口,又能作为网络侧端口;
所述交换装置还包括:
接收组件,用于接收另一交换装置发送的数据流量,其中,所述另一交换装置为数据交换系统中除所述交换装置外的任意一个交换装置;
处理组件,用于确定所述数据流量是否封装了转发标记,所述转发标记用于指示所述交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项;其中,所述最短路径转发表项包括所述数据流量的目的地址和一个网络侧端口的对应关系;并在当所述数据流量封装了所述转发标记时,确定所述数据流量的目的交换装置是否为所述交换装置;
发送组件,用于根据所述处理组件确定的结果转发所述数据流量。
22.根据权利要求21所述的装置,其特征在于,
当所述数据流量的目的交换装置不是所述交换装置时,所述发送组件用于根据所述最短路径转发表项转发所述数据流量,以使所述数据流量到达所述目的交换装置;
当所述数据流量的目的交换装置是所述交换装置时,所述发送组件用于从所述数据流量中删除所述转发标记,并根据所述最短路径转发表中包括所述数据流量的目的地址的最短路径转发表项将删除了所述转发标记的数据流量发送给所述数据交换系统外的设备。
23.根据权利要求21或22所述的装置,其特征在于,所述最短路径转发表的生成规则包括:
组内端口所连接的路径为最优路径;以及
当所述数据流量的目的交换装置与所述交换装置位于不同的子系统时,只通过组间端口转发所述数据流量。
24.一种发送数据流量的方法,应用于数据交换系统,其特征在于,包括:
所述数据交换系统中的源交换装置通过用户侧端口获取数据流量;其中,所述源交换装置为所述数据交换系统的第一子系统中的M个交换装置中的任意一个;
所述源交换装置根据所述数据流量的目的地址查找多路径转发表,得到包括所述目的地址的多路径转发表项;其中,所述多路径转发表项包括所述目的地址和多个网络侧端口的对应关系;
所述源交换装置根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量,以使所述数据流量中的每份数据流量通过不同路径到达所述数据交换系统中的目的交换装置。
25.根据权利要求24所述的方法,其特征在于,当所述目的交换装置与所述源交换装置位于同一子系统中时,所述多个网络侧端口包括M-1个组内端口,
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M-1份并通过所述M-1个组内端口将所述M-1份数据流量分别发送给所述子系统中除所述源交换装置外的其他M-1个交换装置。
26.根据权利要求24所述的方法,其特征在于,所述源交换装置与所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组间端口和M-1个组内端口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M份,将其中1份数据流量通过所述组间端口发送给所述目的交换装置所在的子系统中的所述源交换装置的直达交换装置,将其余的M-1份数据流量通过所述M-1个组内端口分别发送给所述源交换装置所在的子系统中除所述源交换装置外的其他M-1个交换装置。
27.根据权利要求24所述的方法,其特征在于,
所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括1个组内端口和M-1个组间端口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M份,将其中1份数据流量通过所述组内端口发送给所述目的交换装置在所述源交换装置所在的子系统中的直达交换装置,将其余的M-1份数据流量通过所述M-1个组间端口分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
28.根据权利要求24所述的方法,其特征在于,所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到同一个组间光交织器,所述多个网络侧端口包括M-1个组间端口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为M-1份,并通过所述M-1个组间端口将所述M-1份数据流量分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
29.根据权利要求24所述的方法,其特征在于,所述源交换装置和所述目的交换装置位于所述数据交换系统的不同子系统且连接到不同的组间光交织器,所述多个网络侧端口包括M-1个组内端口和M-1个组间端口;
所述根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量包括:将所述数据流量分为2*(M-1)份,将其中M-1份数据流量通过所述M-1个组内端口分别发送给所述源交换装置所在的子系统中除所述源交换装置外的M-1个交换装置,以及将另外M-1份数据流量通过所述M-1个组间端口分别发送给除所述源交换装置所在的子系统外的M-1个子系统中的所述源交换装置的直达交换装置。
30.根据权利要求24-29所述的方法,其特征在于,所述方法还包括:
在根据所述多个网络侧端口通过负载均衡的方式发送所述数据流量之前,为所述数据流量封装转发标记,所述转发标记用于指示接收到所述数据流量的交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项,其中,所述最短路径转发表项包括目的地址和一个网络侧端口的对应关系。
31.根据权利要求24-30任意一项所述的方法,其特征在于,所述方法还包括以下之一:
所述源交换装置从控制器获取所述多路径转发表;和
所述源交换装置生成所述多路径转发表;
其中,所述生成所述多路径转发表包括:
获取所述源交换装置的每个网络侧端口的第一本地开销,其中,所述第一本地开销配置在所述源交换装置上、仅供所述源交换装置在计算所述多路径转发表时使用;
获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销;所述第一全局开销为所述直达交换装置发布的、供所述源交换装置在计算所述多路径转发表时使用的开销;以及
根据所述源交换装置的每个网络侧端口的第一本地开销以及每个所述网络侧端口的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销,生成所述多路径转发表。
32.根据权利要求31所述的方法,其特征在于,所述网络侧端口仅包括组内端口,
所述获取所述源交换装置的每个网络侧端口的第一本地开销时包括:获取所述源交换装置的每个组内端口的第一本地开销;
所述获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销包括:获取与所述源交换装置位于同一子系统的每个交换装置的每个组内端口的第一全局开销。
33.根据权利要求31所述的方法,其特征在于,所述网络侧端口包括组内端口和组间端口,
所述获取所述交换装置的每个网络侧端口的第一本地开销包括:分别获取所述源交换装置的每个组内端口的第一本地开销以及每个组间端口的第一本地开销;
所述获取每个所述网络侧端口连接的直达交换装置发送的所述直达交换装置的每个网络侧端口的第一全局开销包括:获取与所述源交换装置位于同一子系统的每个交换装置的组内端口的第一全局开销以及组间端口的第一全局开销,以及,获取与所述源交换装置位于不同子系统的所述源交换装置的每个直达交换装置的组内端口的第一全局开销以及组间端口的第一全局开销。
34.根据权利要求32所述的方法,其特征在于,生成所述多路径转发表的规则包括:
组内端口的第一全局开销小于组内端口的第一本地开销;且
组间端口的第一本地开销和第一全局开销的设置满足下列条件:能够使从组内端口转发的一条路径为最优路径;使一个组间端口可以转发数据流量;使数据流量不能两次被组间端口转发;组内端口所连接的全部路径都属于最优路径或者次优路径,且组间次优路径的全程距离小于组间最优路径的全程距离的V倍,其中,V为可以设定的系数。
35.根据权利要求33所述的方法,其特征在于,所述组内端口的第一本地开销与所述组内端口的第一全局开销相同,所述组间端口的第一本地开销与所述组间端口的第一全局开销相同;
生成所述多路径转发表的规则包括:
不等价路径的次优路径FS的邻接距离AD小于最优路径的FD与设定增量e之和;以及,次优路径的全程距离小于最优路径的全程距离的V倍,V为可以设定的系数。
36.根据权利要求24-29中任意一项所述的方法,其特征在于,还包括:
所述源交换装置通过网络侧端口接收其他交换装置发送的数据流量;
所述源交换装置确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;
当所述网络侧端口为组内端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,所述源交换装置将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组内端口发送给所述目的交换装置在所述第一子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组间端口分别发送给所述目的交换装置在另外M-1个子系统中的直达交换装置。
37.根据权利要求24-29中任意一项所述的方法,其特征在于,还包括:
所述源交换装置通过网络侧端口接收其他交换装置发送的数据流量;
所述源交换装置确定所述网络侧端口的属性,以及确定所述通过网络侧端口接收的数据流量的目的交换装置是否位于所述第一子系统;
当所述网络侧端口为组间端口,且所述通过网络侧端口接收的数据流量的目的交换装置不位于所述第一子系统时,所述源交换装置将所述通过网络侧端口接收的数据流量分为M份,将其中1份数据流量通过组间端口发送给所述目的交换装置所在子系统中的直达交换装置,将其余的M-1份流量通过所述交换装置的M-1个组内端口分别发送给所述第一子系统中的其他M-1个交换装置。
38.一种发送数据流量的方法,应用于数据交换系统,其特征在于,
交换装置接收另一交换装置发送的数据流量,其中,所述另一交换装置为所述数据交换系统中除所述交换装置外的任意一个交换装置;
所述交换装置确定所述数据流量是否封装了转发标记,所述转发标记用于指示所述交换装置查找最短路径转发表以获取所述数据流量的最短路径转发表项;其中,所述最短路径转发表项包括所述数据流量的目的地址和一个网络侧端口的对应关系;
在当所述数据流量封装了所述转发标记时,所述交换装置确定所述数据流量的目的交换装置是否为所述交换装置,并根据确定的结果转发所述数据流量。
39.根据权利要求38所述的方法,其特征在于,
当所述数据流量的目的交换装置不是所述交换装置时,所述根据确定的结果转发所述数据流量包括:根据所述最短路径转发表项转发所述数据流量,以使所述数据流量到达所述目的交换装置;
当所述数据流量的目的交换装置是所述交换装置时,所述根据确定的结果转发所述数据流量包括:从所述数据流量中删除所述转发标记,并根据所述最短路径转发表中包括所述数据流量的目的地址的最短路径转发表项将删除了所述转发标记的数据流量发送给所述数据交换系统外的设备。
40.根据权利要求38或39所述的方法,其特征在于,所述最短路径转发表的生成规则包括:
组内端口所连接的路径为最优路径;以及
当所述数据流量的目的交换装置与所述交换装置位于不同的子系统时,只通过组间端口转发所述数据流量。
CN201510249358.2A 2015-05-15 2015-05-15 数据交换系统架构、发送数据流量的方法以及交换装置 Active CN106302252B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201510249358.2A CN106302252B (zh) 2015-05-15 2015-05-15 数据交换系统架构、发送数据流量的方法以及交换装置
ES16163082T ES2735123T3 (es) 2015-05-15 2016-03-31 Sistema de conmutación de datos, procedimiento para enviar tráfico de datos y aparato de conmutación
EP16163082.7A EP3094056B1 (en) 2015-05-15 2016-03-31 Data switching system, method for sending data traffic, and switching apparatus
US15/151,509 US9883261B2 (en) 2015-05-15 2016-05-11 Data switching system, method for sending data traffic, and switching apparatus
JP2016096985A JP6325598B2 (ja) 2015-05-15 2016-05-13 データ交換システム、データトラヒックを送出する方法及び交換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510249358.2A CN106302252B (zh) 2015-05-15 2015-05-15 数据交换系统架构、发送数据流量的方法以及交换装置

Publications (2)

Publication Number Publication Date
CN106302252A true CN106302252A (zh) 2017-01-04
CN106302252B CN106302252B (zh) 2019-11-26

Family

ID=55701730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510249358.2A Active CN106302252B (zh) 2015-05-15 2015-05-15 数据交换系统架构、发送数据流量的方法以及交换装置

Country Status (5)

Country Link
US (1) US9883261B2 (zh)
EP (1) EP3094056B1 (zh)
JP (1) JP6325598B2 (zh)
CN (1) CN106302252B (zh)
ES (1) ES2735123T3 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295430A (zh) * 2017-06-19 2017-10-24 西安空间无线电技术研究所 一种基于负载均衡的光电异构交换路径生成方法
WO2018161793A1 (zh) * 2017-03-08 2018-09-13 华为技术有限公司 一种网格系统及在该网格系统的路径确定方法和控制设备
CN109327409A (zh) * 2017-07-31 2019-02-12 华为技术有限公司 数据中心网络dcn、dcn中传输流量的方法和交换机
CN110324265A (zh) * 2018-03-29 2019-10-11 阿里巴巴集团控股有限公司 流量分发方法、路由方法、设备及网络系统
CN115643224A (zh) * 2022-12-23 2023-01-24 北京国科天迅科技有限公司 一种fc交换机及数据传输方法
WO2023065852A1 (zh) * 2021-10-19 2023-04-27 华为技术有限公司 一种业务部署方法及相关设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3449603B1 (en) * 2016-04-25 2020-08-26 Telefonaktiebolaget LM Ericsson (PUBL) Data center network
CN107786497B (zh) * 2016-08-25 2020-04-14 华为技术有限公司 生成acl表的方法和装置
CN108234320B (zh) * 2016-12-14 2021-07-09 华为技术有限公司 报文传输方法及交换机
GB2561974B (en) * 2017-03-23 2022-05-04 Rockley Photonics Ltd Leaf switch module and optoelectronic switch

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6606326B1 (en) * 1999-07-02 2003-08-12 International Business Machines Corporation Packet switch employing dynamic transfer of data packet from central shared queue path to cross-point switching matrix path
CN101009040A (zh) * 2006-12-30 2007-08-01 上海微电子装备有限公司 多维同步高速测量的集群控制系统及方法
CN101021566A (zh) * 2006-12-19 2007-08-22 中国矿业大学(北京) 本安便携式矿井地震记录仪
CN108886632A (zh) * 2015-09-18 2018-11-23 Lg电子株式会社 数字装置以及在所述数字装置中处理数据的方法
CN109075806A (zh) * 2016-05-13 2018-12-21 英特尔公司 极化码构造和编码

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7466703B1 (en) * 1998-05-01 2008-12-16 Alcatel-Lucent Usa Inc. Scalable high speed router apparatus
US7599620B2 (en) * 2001-06-01 2009-10-06 Nortel Networks Limited Communications network for a metropolitan area
US20030072052A1 (en) * 2001-10-10 2003-04-17 Graves Alan F. Optical wavelength plan for metropolitan photonic network
US7519054B2 (en) * 2005-01-27 2009-04-14 Intel Corporation Replication of multicast data packets in a multi-stage switching system
US8265070B2 (en) * 2008-12-15 2012-09-11 Oracle America, Inc. System and method for implementing a multistage network using a two-dimensional array of tiles
CN102714629B (zh) 2010-01-08 2015-07-29 日本电气株式会社 通信系统、转发节点、路径管理服务器以及通信方法
US9215517B2 (en) 2012-11-15 2015-12-15 Compass Electro Optical Systems Ltd. Switching Clos network universal element
US9191114B2 (en) 2012-12-14 2015-11-17 Infinera Corporation Quality of service application for different data flow types
JP5931019B2 (ja) 2013-07-24 2016-06-08 日本電信電話株式会社 通信装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6606326B1 (en) * 1999-07-02 2003-08-12 International Business Machines Corporation Packet switch employing dynamic transfer of data packet from central shared queue path to cross-point switching matrix path
CN101021566A (zh) * 2006-12-19 2007-08-22 中国矿业大学(北京) 本安便携式矿井地震记录仪
CN101009040A (zh) * 2006-12-30 2007-08-01 上海微电子装备有限公司 多维同步高速测量的集群控制系统及方法
CN108886632A (zh) * 2015-09-18 2018-11-23 Lg电子株式会社 数字装置以及在所述数字装置中处理数据的方法
CN109075806A (zh) * 2016-05-13 2018-12-21 英特尔公司 极化码构造和编码

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108574584B (zh) * 2017-03-08 2020-06-26 华为技术有限公司 一种网格系统及在该网格系统的路径确定方法和控制设备
WO2018161793A1 (zh) * 2017-03-08 2018-09-13 华为技术有限公司 一种网格系统及在该网格系统的路径确定方法和控制设备
CN108574584A (zh) * 2017-03-08 2018-09-25 华为技术有限公司 一种网格系统及在该网格系统的路径确定方法和控制设备
CN107295430A (zh) * 2017-06-19 2017-10-24 西安空间无线电技术研究所 一种基于负载均衡的光电异构交换路径生成方法
CN107295430B (zh) * 2017-06-19 2019-09-06 西安空间无线电技术研究所 一种基于负载均衡的光电异构交换路径生成方法
CN109327409A (zh) * 2017-07-31 2019-02-12 华为技术有限公司 数据中心网络dcn、dcn中传输流量的方法和交换机
CN109327409B (zh) * 2017-07-31 2020-09-18 华为技术有限公司 数据中心网络dcn、dcn中传输流量的方法和交换机
US11102110B2 (en) 2017-07-31 2021-08-24 Huawei Technologies Co., Ltd. Data center network (DCN) architecture and communication
CN110324265A (zh) * 2018-03-29 2019-10-11 阿里巴巴集团控股有限公司 流量分发方法、路由方法、设备及网络系统
CN110324265B (zh) * 2018-03-29 2021-09-07 阿里巴巴集团控股有限公司 流量分发方法、路由方法、设备及网络系统
WO2023065852A1 (zh) * 2021-10-19 2023-04-27 华为技术有限公司 一种业务部署方法及相关设备
CN115643224A (zh) * 2022-12-23 2023-01-24 北京国科天迅科技有限公司 一种fc交换机及数据传输方法
CN115643224B (zh) * 2022-12-23 2023-05-26 北京国科天迅科技有限公司 一种fc交换机及数据传输方法

Also Published As

Publication number Publication date
ES2735123T3 (es) 2019-12-16
US20160337726A1 (en) 2016-11-17
EP3094056A2 (en) 2016-11-16
CN106302252B (zh) 2019-11-26
EP3094056A3 (en) 2017-04-26
JP2016220202A (ja) 2016-12-22
US9883261B2 (en) 2018-01-30
EP3094056B1 (en) 2019-05-08
JP6325598B2 (ja) 2018-05-16

Similar Documents

Publication Publication Date Title
CN106302252A (zh) 数据交换系统架构、发送数据流量的方法以及交换装置
US10454585B2 (en) Data center network system and signal transmission system
US10637685B2 (en) Non-blocking any-to-any data center network having multiplexed packet spraying within access node groups
KR102123035B1 (ko) 802.1aq에 대한 3 스테이지 폴딩된 clos 최적화
CN103797737B (zh) 使用用于数据中心网络交换的多光纤配置的光学架构和信道计划
US8285789B2 (en) Flattened butterfly processor interconnect network
Liu et al. Quartz: a new design element for low-latency DCNs
WO2018183542A1 (en) Non-blocking any-to-any data center network with packet spraying over multiple alternate data paths
CN110300072A (zh) 网络互连交换
US20150181317A1 (en) Scalable hybrid packet/circuit switching network architecture
US7209659B2 (en) Modular high capacity network
CN106899503B (zh) 一种数据中心网络的路由选择方法及网络管理器
CN103891224A (zh) 具有集成的服务器件的分布式机箱架构
CN105917606A (zh) 用于光子网络的系统及方法
JP5936603B2 (ja) マルチステージ光バーストスイッチングシステム及び方法のための制御レイヤ
CN106851442A (zh) 一种超级计算机中的光互连网络系统及通信方法
US20150043911A1 (en) Network Depth Limited Network Followed by Compute Load Balancing Procedure for Embedding Cloud Services in Software-Defined Flexible-Grid Optical Transport Networks
US11102110B2 (en) Data center network (DCN) architecture and communication
CN106941633A (zh) 基于sdn的全光交换数据中心网络控制系统及其实现方法
CN103873367B (zh) 路由数据分组以及确定路由的方法和装置、胖树网络
US9166886B1 (en) Systems and methods for determining physical network topology
CN106789750B (zh) 一种高性能计算互连网络系统及通信方法
KR20090071986A (ko) 3차원 가상공간 기반의 모듈화 기법을 이용한 네트워크설계 방법 및 관리 방법
JP5419740B2 (ja) パス収容設計方法
Kos et al. Topological planning of communication networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant