CN102106125B - 一种多路径网络 - Google Patents

一种多路径网络 Download PDF

Info

Publication number
CN102106125B
CN102106125B CN200980128858.3A CN200980128858A CN102106125B CN 102106125 B CN102106125 B CN 102106125B CN 200980128858 A CN200980128858 A CN 200980128858A CN 102106125 B CN102106125 B CN 102106125B
Authority
CN
China
Prior art keywords
network
address
data
memory element
device address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980128858.3A
Other languages
English (en)
Other versions
CN102106125A (zh
Inventor
D·C·休森
乔恩·比克罗夫特
A·迈克尔·福特
E·J·图尔纳
M·O·霍梅伍德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Cray UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cray UK Ltd filed Critical Cray UK Ltd
Publication of CN102106125A publication Critical patent/CN102106125A/zh
Application granted granted Critical
Publication of CN102106125B publication Critical patent/CN102106125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4604LAN interconnection over a backbone network, e.g. Internet, Frame Relay
    • H04L12/462LAN interconnection over a bridge based backbone
    • H04L12/4625Single bridge functionality, e.g. connection of two networks over a single bridge
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/44Distributed routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/54Organization of routing tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/66Layer 2 routing, e.g. in Ethernet based MAN's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/745Address table lookup; Address filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种用于网桥、交换机、路由器、集线器或类似装置的多路径网络,包括大量适于连接一个或多个设备的网络端口,每个设备具有一个不同的识别地址数据;大量网络元件;和大量网络连接交互互联所述网络元件并连接所述网络元件至所述网络端口,其中所述多路径网络进一步包括分别可寻址存储元件适于存储设备地址数据并且所述多路径网络适于在大量存储元件中分布大量设备地址数据。

Description

一种多路径网络
技术领域
本发明涉及一种多路径网络和一种操作方法,并特别涉及一种具有可扩展网络地址查询表的多路径网络。所述多路径网络和方法适用于,但不限定于,多处理器网络例如存储网络、数据中心和高性能运算。特别的,本发明适用于网桥、交换机、路由器、集线器和类似包括适配于IEEE802标准的数据帧分布或符合未来以太网标准的数据帧的以太网设备。
背景技术
协议层
概念上,为了区分功能以太网络分为许多虚拟层。最常见和正式的标准化模型是开放系统互连(OSI)参考模型。详细描述该OSI参考模型的文章是HubertZimmermann撰写的《OSI参考模型-构建开放系统互联的ISO模型》(“OSIReferenceModel-TheISOModelofArchitectureforOpenSystems”),IEEE通讯汇刊com-28卷1980年第4期(IEEETransactionsonCommunications,Vol.COM-28,NO.4,April1980)。上述OSI参考模型包括以下网络系统功能不同的7层:
1、物理层,负责物理信道连接。由那些涉及发送和接收信号的元件,典型的线路驱动器和线路接收器,信号编码/解码器和时钟组成。
2、数据链路层,提供服务允许终端站设备之间通过底层的物理介质直接通讯。该层提供组帧,为物理层将设备信息分离成离散的传输或帧,封装更高层的包传输协议。它给识别源和目的装置提供寻址。它提供错误侦测以保证数据损坏不会传往更高层。
3、网络层,负责网际通信,通过网络在终端站之间发送信息包。它必须适应多重数据连接技术和拓扑使用各种协议,最常见的是网际协议(IP)。
4、传输层,负责端到端通信,防护传输时产生的问题影响上面各层,例如中断的数据、错误和由低层介质导致的乱序。该层为应用提供无错、有序的、可靠的信息传递服务,管理终端站之间的数据处理传递过程。传输控制协议(TCP)和用户数据报协议(UDP)是最常见的传输层协议。
5、会话层,负责建立应用之间的通信连接,处理认证和连接控制。
6、表示层,保证各不同的机器数据表示得到解析。
7、应用层,提供一般功能允许用户应用通过网络通信。
为本申请的目的我们并不需要考虑传输层以上各层根据此处描述的方法的操作,如果执行良好,就能屏蔽更高层由其辖域及下层出的问题。
网络互连
在数据链路层及其上执行网络服务的装置叫做站。物理层因为不能通过协议寻址而排除在该定义之外。通常有两种形式的站:
1、终端站,是穿过网络的网络数据通信的最终源或目的地。
2、中间站,转发由终端站产生的位于源和目的之间的网络数据。
位于数据链路层完成转发的中间站通常叫做网桥;位于网络层转发的站通常叫做路由器。
依赖于以太网络的网络工作站以短序列字节交换数据叫做数据包或协议数据单元(PDU)。PDU由描述PDU目的报头和包含有效载荷数据的报文组成。在OSI模型中每一协议层PDU具有不同的名称。物理层PDU叫数据位,数据链路层PDU叫数据帧,网络层PDU叫数据包,传输层PDU叫数据段或报文。
PDU在物理以太网硬件传输之前被封装。每一封装包含对一特定OSI层的信息,以太网数据流封装成帧,然后帧封装成数据包,数据包封装成报文等等。这些封装,包含了报头和有效载荷,最后传过网络结构并路由至目的地。
在传输层,一相关标准,传输控制协议(TCP),通过隐藏底层PDU结构为应用额外提供一简单界面,负责重排列乱序的PDU并且重传丢失的数据。TCP协议设计作为一种可靠的数据流传输服务;这样其优选的是准确的数据传递而不是性能。TCP协议在等待乱序PDU和数据重传的极端情况下经常遭遇相对的长时间延迟,降低整体应用性能和当需要考虑最大量协议数据单元传输延迟(信号不稳定)时TCP协议变得不适用,文件系统或媒体传输,例如。
此外,在TCP/IP层级的最低层,PDU通过网络传输的网络访问层,完全适合IEEE802.1D标准介质访问控制(MAC)网桥将分隔网络连在一起要求源和目的对的次序保留。
PDU副本是以太网络另一降低性能的因素。一目的路由还未被网桥认证的单播PDU会被该网桥的所有路由淹没并同时在多个出站端口缓冲。网络重构影响从网桥到目的地的最优路由可能导致一PDU副本已经从上一最优路由发出紧接着一PDU副本将从缓冲区发送,二者均达到目的地。再次,更高层的TCP协议处理这些而不会降低整体性能。
无序和副本不应该发生于通常的操作中。多路径以太网的这些特征受限于由IEEE802.1D标准定义的快速生成树协议(RSTP)。RSTP通过禁止交替路由维持一网桥间的优选路由,移除多路径和循环,保留单一路径以保证按顺序的数据帧传输。
在进入一中间站时,例如以太网桥或路由,目的地址信息,数据帧携带的,用于提取出站端口数据通过其中继发往目的地。至目的地址的端口选择存储在网络地址查询表中。该表常见于中间站一旦所述路由被发现并且由其它通信持续使用以识别至特定目的的路由。
存储在中间站的网络地址查询表中的信息类型可以变化依赖于支持的网络协议但是所述发现过程和所述表的后续使用对于以太网数据链路层网桥和网络层路由是共同的。以下描述使用一个数据链路层网桥作为场景示例说明原理但是该方法引申适用于网络层路由器和其它这些协议之外的使用查询表和地址映射。用在网桥的地址图式基于生产时嵌入每个以太网设备的唯一的媒体连接控制(MAC)识别码。源和目的终端站的MAC地址封装进数据链路层的数据帧中。
IEEE802标准MAC地址是一个48bit数。中间站的MAC地址查询表用于存储这些地址并允许翻译地址成物理路由。通常从一个内容可寻址存储器(CAM)或其它形式的存储机制构建而成。
当一个以太网数据帧抵达一个网桥输入端口,源MAC地址(即,源设备输出该以太网数据帧的MAC地址)保存进MAC地址查询表相对该数据帧进入所述交换机的链接。MAC地址查询表的条目识别所述链接为后续通信中以该源设备为目的地的数据帧将使用的连接。以太网数据帧在其报头包括目的地MAC地址和查询表使用所述目的地MAC地址以决定数据帧通过哪个链接从所述网桥发送出去。如果目的地MAC地址在表中则一个端口号将返回以在至其目的地的下一中继段路由所述数据帧。如果目的地MAC地址端口映射不可知并且在表中没有条目查表将失败。在查表失败的场合,数据帧将充斥网桥上其它端口选择,通常所有端口除了所述入站端口。假定该数据帧最终能找到另外一个认证从哪路由该数据帧至目的地MAC地址的以太网桥或最终抵达目的地终端站。最终抵达错误终端站的数据帧简单被丢弃但是泛滥数据帧抵达的所有中间站,这些中间站没有认证该数据帧特定目的MAC地址,将也,反过来,使该数据帧泛滥充斥一个端口外的所有端口。这种系统导致了过多的网络通信量,由于除了目的帧以外的所有传输至终端站的数据帧均被丢弃。
绝大多数通过以太网的通信使用站之间的全双工连接。这意味着数据帧通常通过其目的地返回至初始源,当源变成返回数据帧的目的地时并且反之亦然。一个数据帧的返回路径已经在以太网桥MAC地址查询表中具有其路由记录,替代其在原始数据帧的发送行程中的路径并且由此在数据帧的返回行程中网络泛滥就不常发生。随着时间的推移每个网桥的MAC地址查询表被所有通过一个或多个中间站可连接终端站的地址和端口号映射填充。逐渐地,同时,由于MAC地址查询表变得更完全填充网络的泛滥行为将平息。
以上描述的MAC地址填充机制使得以太网网络由于通过网络的路由自动高效配置而能简单安装。这种技术的缺点是具有不明确MAC地址的数据帧在该数据帧泛滥时导致大量网络通信量。对于小型网络这相对不重要但是对于大型的具有上千活动MAC地址的网络就是个严重问题。特别是,在初始阶段当MAC地址没有被识别时,泛滥风暴导致极大的附加通信量和网络负荷。
大型网络的一个限制因素是每个网桥的MAC地址查询表的尺寸。理想地每个MAC表应该能同时保存整个网络所有的活动MAC地址。如果MAC查询表不能保存所有的活动MAC地址,新的MAC地址将终止替换查询表中旧的仍活动的MAC地址。由上所指出,未知地址导致数据帧在网络上泛滥。因此,以太网桥的MAC地址查询表不能支持所有活动MAC地址的场合这种泛滥行为将持续通过通常网络初始阶段造成这种地址替换。随着网络尺度增加的泛滥数据帧将导致成比例的大量通信量和网络负荷,极大降低网络性能。
大型网络中有好几万的MAC地址。MAC表就硅实业而言是很昂贵的并且用于构建查询表的存储器更贵。此外大型存储器装置运行慢。尺寸和成本不允许非常大的MAC地址表,并且当前一个查询表容量8000-16000是典型的兼顾尺寸、成本和速度平衡。虽然,这对于预计网络尺寸增长管理还不够大。
已知的执行MAC地址表包括通过全相连CAM结构,表基础结构和一些以包括应对高速缓存冲突的附加机制。活动MAC地址分散进48位地址空间但是其分布很难预测。MAC地址是以太网终端点的特性并且MAC地址定位于以太网设备的制造。一单个大型以太网安装就可能具有许多连续段的MAC地址空间和许多独立的地址并且这些可能出现在所述48位空间的任何地方。直到使用一个全相联高速缓存或相似机制然后所述MAC表必须显著扩大为了确保所有活动MAC地址能同时保存。这对于之前陈述的执行方案尺寸和成本是不能接受的。
保持在网络中间站的信息可能依赖于支持的以太网协议而不同但是发现程序和查询表的随后的使用在以太网数据链路层网桥和网络层路由器中均是相同的。为了方便阐述这一原理此处的描述特定于数据链路层网桥。然而,该方法也能引申用于网络层路由器和其它这些协议和地址映射之外的查询表使用。
相关技术说明
在US2007/0047540中描述了一种以太网交换其中个别入站端口提供有本地查询表。只有端口将使用的转发信息存储进所述查询表。然而,所述以太网交换要求一个为本地表提供转发信息的主MAC地址表。相似的本地查询表和一个主表的集合也在EP0993156中有描述。
本发明寻求克服现有网络遇到的问题并且特别寻求克服网络地址表限制问题以提供一种能够支持好几万端口的以太网桥。
发明内容
本发明因此提供一种用于网桥、交换机、路由器、集线器或类似装置的多路径网络,包括大量适于连接一个或多个设备的网络端口,每个设备具有一个不同的识别地址数据;大量网络元件;和大量网络连接交互互联所述网络元件并连接所述网络元件至所述网络端口,其中所述多路径网络进一步包括分别可寻址存储元件适于存储设备地址数据并且所述多路径网络适于在大量存储元件中分布大量设备地址数据。
优选地,所述存储元件至少分成两级地有层次地组织,每一层级具有大量分别可寻址的存储元件并且所述多路径网络适于在最高层级的大量存储元件分布大量设备地址数据。
理想的,所述网络适于存储所有连接至所述网络的设备的地址数据至所述最高层级的存储元件。同时,一设备的所述地址数据优选存储在最高层级的一个存储元件内。
所述网络的单个存储元件的存储容量小于要存储的设备地址数据量并且每一个存储元件可以形成相应网络元件的一部分。
在具体实施例中所述网络适于基于所述设别地址数据产生一个散列值(hashvalue)。理想地,所述网络适于顺序使用为相同设备地址数据产生不同散列值的大量散列函数中的一个。
位于最低层级的每一个存储元件可以包括容纳与所述设备地址数据相关的地址信息的单个位阵列。在具体实施例中所述网络适于刷新位于最高层级的存储元件的内容通过在以预定时间间隔通信存储在单个位阵列内的地址信息至位于最高层级的存储元件。所述网络还可进一步适于用一个新的设备地址数据更新位于最高层级的至少一个存储元件当一个具有该新设备地址数据的数据包被通过网络传输的网络端口接收时并且存储在所述单个位阵列内的所述新设备地址数据的位被清除。所述网络还可适于用单个位阵列中的所述新设备地址数据集合存储的位当位于最高层级的一存储元件的更新产生时。
理想地,所述网络适于在数据包通过网络传输过程中仅一次读取被网络端口接收的一个数据包的所述设备地址数据并且所述网络适于在层级之间通信所述设备地址数据。
此外,所述网络元件还可适于在一个预定但不常见的时间间隔清除所述单个位阵列内的位。所述设备地址数据还可在一预定时间间隔之后从其相关存储元件中清除。如果所述设备地址数据存在于任一位于更高层级的存储元件中所述网络元件还可适于在所述设备地址数据清除之前延长所述预定时间间隔。同时,如果观测到一个或多个连接至最低层级的所述网络元件的网络端口设备的所述设备地址数据存在所述网络元件还可适于在所述设备地址数据清除之前延长所述预定时间间隔。更特别地,所述网络元件可适于从其各自存储元件清除设备地址数据当所述设备地址数据没存在于位于更高层级的任一存储元件内。因此,位于最底层级的所述存储元件适于指示位于最高层级存储元件内的地址数据存在或不存在。
另一方面本发明提供一种包括如上描述的多路径网络的以太网桥或路由器。
另一方面本发明还提供一种多路径网络中设备地址数据管理方法包括适于连接一个或更多设备的大量网络端口,每一个设备具有一个不同的识别地址数据;大量网络元件;大量网络链接交互互联所述网络元件并连接所述网络元件至所述网络端口;和大量存储元件适于储存设备地址数据,所述方法包括在所述为存储的大量存储元件中分布大量设备地址数据。
优选地所述方法进一步包括分层级地组织所述网络元件为至少两个层级且大量分别可寻址存储元件位于每一层级并且通过在一最高层级的大量存储元件分布所述设备地址数据的步骤。一特定设备的所述设备地址数据存储在位于最高层级的一个或多个但不是所有存储元件中。更优选地,一特定设备的所述设备地址数据仅存储在位于最高层级的一个存储元件中。
可选地,每个所述存储元件形成相应网络元件的一部分。
在一具体实施例中,一个散列值基于所述设备地址数据产生。理想地,轮流使用大量不同的散列函数为相同设备地址数据产生大量不同的散列值。位于最高层级所述存储元件的内容可以在一预定时间间隔通过通信存储在所述单个位阵列内的散列值至最高层级的所述存储元件更新。可理解地本发明内容此处所指的设备地址数据延伸包含地址数据诸如MAC地址和源自地址数据例如上面提及的散列值的数据。
理想地,位于最高层级的至少一个存储元件通过一个新设备地址数据更新当一个具有该新设备地址数据的数据包被通过网络传输的网络端口接收时并且存储在所述单个位阵列内的所述新设备地址数据的位被清除。同时,当位于最高层级的存储元件的更新产生所述新设备地址数据存储的位可以集合进所述单个位阵列。
理想地,网络端口接收的数据包的所述设备地址数据仅在数据包通过网络传输时读取一次并且设备地址数据散列值在层级之间通信。在一个具体实施例中目的设备地址数据转换为出站网络端口描述符并且数据包根据所述出站端口描述符路由分配穿过网络。
更理想地,所述单个位阵列的位数据在一第一预定时间间隔清除并且所述设备地址数据在一第二预定时间间隔之后从其存储元件清除其中所述第一和第二预定时间间隔可以不同。优选地,如果设备地址数据存在于位于更高层级的任一存储元件内设备地址数据清除之前的预定时间间隔延长。同时,如果连接至所述网络元件的网络端口的位于最低层级的一个或多个设备观测的设备地址数据存在设备地址数据清除之前的预定时间间隔可以延长。根据最佳实施例当设备地址数据不存在于位于更高层级的任一存储元件内设备地址数据从存储元件清除。因此,位于最底层级的所述存储元件可以用于指示位于最高层级存储元件内的设备地址数据存在或不存在。
根据本发明一最佳实施例所述大量存储元件的至少一些使用地址缓存并且在一多路径网中的所述设备地址数据管理方法包括一刷新步骤通过检查更高层级地址缓存的内容轮流验证地址缓存内的每一条目以保持所述地址缓存之间的相关性。
因此,根据本发明提供的多路径网络和设备地址数据管理方法确实可扩展由于所述设备地址数据,例如MAC地址,在多路径网络的每一网络元件的大量存储元件中分布。也就是说每一个MAC地址没有拷贝至网络内的所有存储元件。
附图说明
前述和其它目的和优点将接合附图通过以下本发明的一具体实施例的详细描述得到更好的理解,附图中:
图1示意性地示出了一以太网桥其包括一执行根据本发明的分布地地址查询表的多路径网络;
图2是用于图1的以太网桥的根据本发明的具有3个阶段的多路径网络的示意图;
图3示出了图2网络的Clos网络图;
图4是根据本发明用于图1的以太网桥的MAC地址查询表的副表一种布置的示意图;
图5是根据本发明的通过网络传输数据的一种方法的流程图;
图6是根据本发明拷贝条目至地址表的方法的流程图;并且
图7是根据本发明从地址表转换条目的流程图。
具体实施方式
下述以太网网桥或路由器引入一个附加的协议层,此处指的是“封装层”(EncapsulationLayer),其处于标准OSI模型的物理层和数据链路层之间,能够封装网络层和数据链路层的协议数据单元。由上所述中间站的定义延伸至包括转发类似此处所说的封装层的前述附加协议层封装的数据包。此处提到的这种类型的站是网桥构架或网络构架。一多端口网桥结构可通过一系列通过网桥结构交换链接(BFSLs)互联的网桥结构交换(BFSs)来实现。在一PDU中完成封装,也是英国专利申请号0807937.8共同的未决问题,此处引入该专利文献全文内容作为参考,并且该英国专利申请提及为“结构协议数据单元”(FPDU),避免了修改下层PDU数据帧报头或报尾的需求,从而移出了总体的循环冗余码校验(CRC)或其它基于数据帧内容的传递信息。一FPDU用来实现数据传输认证和流控制机制。一FPDU进一步用来提供许多其它吸引人的特性对于大型,高性能,可升级的以太网络,例如本发明的地址提取能力。
图1示出的以太网桥或路由器1可以连接至大量的分离的以太网站2并执行封装网络层和数据链路层的PDU进一FPDU。所述以太网桥1大体上包括连接有大量以太网端口3(图中为了清楚只示出了其中一个)的一多路径网络10,其中每一端口单独连接至一以太网站2。所述以太网端口3按通常设计并且每一个端口包括与以太网站建立数据连接的装置、一接收装置或输入装置4以实现以太网接收功能、一传输装置或输出装置5以实现以太网传输功能。
所述以太网端口3连接至提供传统功能例如数据包缓冲6的一网络界面7。然而,所述网络界面还包括一以太网PDU封装器8,该封装器连接上述网络界面7至网络10的入站端口(图中未示出)并且一以太网PDU解封装器9连接至网络10的出站端口(图中未示出)返回至上述以太网端口3。所述以太网PDU封装器8执行封装层协议从而产生上述FPDU。理想的所述以太网桥1的每一端口3均分别具有相应的网络界面7、以太网PDU封装器8和以太网PDU解封装器9。
上述网络10是一专有的多路径网络例如图2示出的那种,包括大量互联网络元件18此处为网桥结构交换(BFSs)通过网络链接17按网桥结构交换链接(BFSLs)形式互联。每一BFSL17为优选的双向(全双工)连接。沿每一方向传递的数据和认证以及沿一方向的数据流控制状态数据可以和网桥结构交换链接反向传递的数据多路复用。示出的例子是小型网络其中每个BFS18仅有6个端口和2级交换:第一和第三交换状态形成第一级交换并且第二交换状态形成第二级交换。图3中,相同的小型网络按Clos网络形式图释不同的交换阶段如何关联至不同的交换层级。一个BFS18通常具有至少16个端口并且对于大型网络需要更多的交换层级。典型地,对于一个具有512个端口的以太网桥构建有16个端口BFS18,64个交换可被用于第一交换层级和32个交换位于第二交换层级,同时对于一个具有大约48000个端口并使用更多数量交换的以太网桥,4700个BFS18可能被使用在4个交换层级中。图2示出的例子中第一和第三阶段BFS18指的是边缘BFS因为它们位于网络的边缘,即,网络10输入FPDU可见的第一交换就是所述网络的第一层级。处于边缘之后的BFS18就是叫做中间BFS并且在图2中包括第二状态也就是第二交换层级。虽然图2中示出的具有数据流方向的BFSL17,该方向仅为图示目的而提供。实际上当FPDU沿图释网络两个方向传输时任意和所有的端口A-Z在不同时候扮演入站或出站端口功能。
此处描述的多路径网络和MAC地址管理方法基于分布的网络地址查询表的原理。如之前提及,传统地所述MAC查询表是一个位于网络的每个边缘和每个中间站的单一完全个体。这可以作为具有接近所述以太网端口的本地MAC表缓存的单个主要MAC表执行。通过对比,此处描述的网络使用一个分布的MAC地址表,由此所述MAC地址表以各自可寻址副表形式拆分为大量个体存储在相应的大量存储元件中由此单个MAC地址分布在整个网络中任一存储元件仅存储所有活动MAC地址数的一个副组并且副组中的MAC地址集合与其它副组不同。由于没有单个点条目存入主MAC地址这种方法固有可扩展。
由于整个活动MAC地址数量分布在大量副表中的事实,每个MAC地址表的副表可以保持较小例如32000地址条目。这也就意味着每一个存储元件比较小,对比传统MAC地址存储,并且在其自身上一个存储元件不能容纳所述网络的所有活动MAC地址。然而当单个存储元件集合起来,就确实可以存储网络的所有活动MAC地址并且由此最小化数据包泛滥网络的需求。
理想地每个副表存储元件与网络10的相应的BFS18位于同一地点。如果大型网络10需要容纳更多端口,就需要使用更多BFS18以配合增加的交换需求。随着BFS10的数量增加副表存储元件也相应增加。由此该网络的所述分布MAC地址查询表也就确实扩展了。当然网络中副表存储元件替代布置和位置应设想为对每个多路径网络最方便。
在图4中BFS18其中一个的结构以放大,但是简化的,详细地示出。这样BFS18包括一个交叉开关22其输入经由履行FPDU缓冲20、MAC表处理器21和MAC地址副表存储元件23的手段,以下将非常详细地描述这些手段的运作。
如图3所示,MAC地址副表组织为两个层级以在多层级上执行缓冲。当然,副表可以组织为超过3个或更多缓冲级别依赖于可用的存储源、连接至网络的电子设备的数量以及活动MAC地址的数量。理想地,第一层级缓冲尺寸较小这样第一级缓存MAC地址查询表比较快(非常低的延迟)并且能够跟上小型网络中高速率带来的小尺寸但是频繁数据要求。理论上第二级缓存比第一级缓存尺寸大得多。第二级缓存具有更高的读取延迟但是计算相应的带宽减小更多数量的数据提供给第二级缓存存储器即使这些数量的数据分布于组织在相同层级的大量单独可寻址MAC副表中。从第一级缓存至第二级缓存的数据链接通常集合为一个MAC表条目的尺寸。当使用了第三或更高级缓存,这些可能再次跟随该趋势并且将会比第二级缓存更大。当然,可理解的,MAC地址管理方法学可以等同应用于与图3所示Clos网络不同的网络拓扑结构。
在图1的以太网桥中网络端口界面7包括一个MAC地址查询表以转译输入以太网数据帧的目的MAC地址为网络构架10的出站端口。不像传统网桥,其MAC表查询在通过网络的每一中继段均要执行,根据此处描述的以太网桥或路由器这种在目的MAC地址和网络出站端口之间的转译仅在输入网络时执行一次。这样每个网络端口的边缘本地MAC地址表当作一个第一级缓存。中间BFS的MAC查询表作为第二级、第三级等等缓存。
最好如图3所示,每个边缘BFS直接连接至大量中间BFS,图3中有三个中间BFS。为了制造中简化和可靠,理想地位于第二级缓存的每个MAC地址表尺寸与第一级缓存的MAC地址表相同。然而,由于每个第一级缓存连接至大量单独可寻址第二级缓存,在图3中三个缓存,第二级缓存可以组织这样它们看起来像一个单个的三倍于第一级缓存表大小的MAC表。无疑的当网络在第二层级使用更多MAC表例如8个表,则位于第二级缓存的MAC表8倍于第一级缓存大小。
由之前提及第一级MAC副表ST1.1,ST1.2,ST1.3,SST1.4,ST1.5和ST1.6中的每一个均关联于一个相应的边缘BFS18。这些边缘BFS18的每一个可以通过特定网络端口接收并传输数据包,例如MAC副表ST1.1形成与网络端口A、B和C通信的边缘BFS的一部分并且MAC副表ST1.2形成与网络端口D、E、F通信的边缘BFS的一部分,等等。也就是说,边缘BFS的每一个可以进一步以MAC副表ST2.1、ST2.2和ST2.3的形式与第二级缓存通信。对于本领域技术人员来说显然地副表的数量、缓存级别数量和BFS之间的链接数量不会被规定为限制。同时,可理解地所有中间BFS18需要提供有副表存储元件23或即使提供,不是BFS的所有存储元件需要使用作为MAC地址管理协议的一部分。然而,理想地要求位于网络最高级缓存的存储元件23的数量应当至少充足以存储网络所有的活动MAC地址。
当一个具有位置源MAC地址的以太网帧抵达一个网络端口MAC地址表23创建一个条目。总体上,网络端口的源MAC地址转译理想地存储在最高层级BFS18中这样当其它边缘BFS18作为目的地MAC地址查询表时就能找到它们。副表中最高层级BFS的MAC地址条目因此包括网络中所有的活动MAC地址这样,探索之后,端口的一个MAC地址转译对所有网络端口可用。为了减小与最高级缓存级别MAC地址副表的MAC地址转译通信量(所谓的相关通信量),一个本地源MAC地址学习率限制表(LRLT)也保持关联至每个边缘BFS。所述LRLT包含已经从边缘BFS至最高级缓存级BFS18通信的源MAC地址。本地源MAC地址优选的以单个位阵列(图中未示出)来实现阵列中设备的每个源MAC地址与边缘BFS以单位索引通信。当一个以太网帧抵达网络的入站端口所述以太网帧的源MAC地址输入一个散列函数以形成单位地址。该位地址随后用于索引源位阵列以检查所述数据帧的源MAC地址是否已经写入最高级BFS18中。
如果在源位阵列中连接位清除,也就是说源MAC地址没有写入最高级缓存,则所述位写入并集合进源位阵列并发送一个消息至最高级BFS以指示一个新源地址被接收。如果连接位已经集合进源位阵列则进一步的动作要求考虑MAC地址管理。由于位阵列,对于非常多源MAC地址数量一个相对小的RAM能够保持速率限制状态。源MAC地址数量能保持大体上与阵列中的位数量成比例。期望每个充满的MAC表条目要求大约80位状态由此该位地址模式取得源地址密度的一个80倍改进。一单个LRLT能支持许多本地端口。当前每个LRLT期望支持250000个源MAC地址。所述LRLT设计为减小整体MAC地址转译通信量其保持发生在最高级缓存的MAC地址转译。然而所述LRLT应当不会完全移除MAC地址转译通信量。更新速率应当接近10倍的发生于最高级缓存内MAC地址转译速率。
分布穿过网络10所有活动MAC地址的存储依赖于一个高效的MAC地址管理协议以提取并写入MAC地址至并从位于更高缓冲级的分布的副表。根据此处描述的网络所述MAC地址管理协议形成封装层协议的一部分,其运行将在以下描述。
一种穿过执行封装层协议网络构架10传输数据的方法在图5中示出。封装发生在以太网桥10的入口。通过以太网站2传输的一个以太网PDU步骤S5.1在所述以太网桥1的网络端口3被接收并经由接收设备4通信,其扮演传统以太网接收功能,至网络界面7和特别的所述以太网PDU封装器8。所述封装器8附加步骤S5.2一个FPDU报头至所述数据链路层数据帧。
所述封装器8还从以太网PDU内提取源和目的MAC地址信息并转译目的地MAC地址信息成目的地描述符步骤S5.3其标识网络出站端口为所述目的地MAC地址的请求和由此穿过网络构架10的路由。目的地MAC地址转译成目的地描述符的所述转译使用保持在分布的MAC地址副表内的数据执行。目的地描述符使用决定自MAC地址查询表的一个出站端口值决定,其中端口号与经由每个端口连接的MAC地址经相关连。从MAC地址查询表提取该数据并且使用分布的MAC地址表将在以下详细讨论。目的地址描述符使用分布MAC表获得然后加入FDPU的报头。
所述FPDU随后传输步骤S5.4从网络构架10的入站端口经由大量网络构架元件18穿过网络10至网络的一个出站端口。在网络10的出站端口所述FPDU信息通过以太网PDU解封装器9剥离步骤S5.5这样仅留下原始以太网PDU。随后未修饰的以太网PDU发送步骤S5.6至一个该PDU请求目的地的以太网站。因此,协议和机制允许数据通过网络10在网络内传输完成并且对于入口和出口的以太网站均不可见。
FPDU还可以通过其它几种不同的路由机制传过网络这些机制可能影响目的地描述符的细节内容。这些细节处于本发明范围之外。例如,所述FPDU可以动态路由穿过网络该例子中数据包次序被请求。该网络中数据包次序管理也是英国专利申请号0808862.7共同待决目标。然而,以最大化来自MAC地址管理系统由于一个通过网络传输的FPDU的目的地MAC地址不会在每一个BFS读取的便利。反而,通过网络界面7增加至以太网数据帧封装的目的地描述符可以用于决定向前通过网络传输所述FPDU。理想地,所述目的地描述符和,任意地,任何与FPDU相关的次序请求仅使用很小量的状态告知在每一个BFS上的下一BFSL选择。当所述多路径网络安排执行FPDU的动态路由就低延迟而言的便利和高带宽最大化。然而,MAC地址管理系统并不限于动态路由或此处图示的网络结构。
整个以太网PDU的FPDU封装能极大增加通过网络构架传输以太网数据帧的速度,并减小延迟,因为通过网络传输时以太网PDU内容不需要任何形式的检查或修饰。因此处于以太网络边缘的网桥可以当作一个单独实体。显得像一个单独实体意思是两个端点之间仅需要发生一次会话以使这些终端点的MAC地址对系统中其它所有端点可见。传统以太网可能需要上千个分隔的传统以太网桥以组件一个小尺寸网络并且在每个中继段必须许多会话从传统网桥至传统网桥,导致网络重复泛播。
更重要的,封装层协议允许附加的传输控制并且网络构架基础结构的使用以为网络地址查询表提供一个分布的存储解决方案。
封装层协议优选包括控制令牌的使用。这种令牌伴随FPDU在网络BFSL上多路复用。也就是说,控制令牌允许中断一个正在通过网络传输过程中的FPDU的报文。因此以太网PDU的封装还通过允许控制令牌插入封装的以太网PDU以改进控制令牌的传输延迟。一个大型PDU可以花费几微秒传输。允许令牌短暂地中断封装的以太网PDU仅对FPDU传输时间有很小的影响但是将令牌传输时间从许多毫秒减小至十来纳秒。
本发明的内容中控制令牌兴趣的特定功能是在获取地址转译中控制令牌的使用。当然,所述控制令牌还可以使用在其它网络管理中,例如拥塞管理和传输认证。更进一步,这种控制令牌可以从一个或两个字令牌至五个或更多个字令牌之间变化依赖于所述控制功能的需求。
在一个大型网络中一个FPDU将不得不穿过许多链接。每次所述FPDU抵达一个新BFS从所述BRS的出站端口必须很快从路由信息里决定。由之前提及,对于以太网协议所述路由信息保存在MAC地址的第二层或IP地址的第三次层中并且所述转译过程很复杂且能极大增加路由延迟。封装允许MAC地址或IP地址转译在较少的场合执行并且理想地仅在每个FPDU穿过网络时执行一次。
由之前提及,分布的MAC地址查询表需要填充以启用MAC地址转译成出站端口号。所述填充和刷新方法在图6中示出。由之前描述,一个数据帧通过以太网站2传输在以太网桥的网络端口3接收步骤S6.1。源MAC地址从数据帧读出并且一个散列函数产生步骤S6.2。所述散列函数对照边缘站18的LRLT的内容检查步骤S6.3以发现是否该源MAC地址存在与最高级BFS18的表内。如果存储的位集合存在则数据帧的封装继续同时一个目的地描述符附加进FPDU的报头步骤S6.4基于该目的地MAC地址,以下将对其做更详细的描述。
如果存储位被清除则该位写入LRLT的集合步骤S6.6并且一个信息发往最高级BFS18,以一个控制令牌的形式,具有新源MAC地址详细信息然后拷贝步骤S6.5至最高级缓存级的MAC副表中的一个其能被发现场合当其它边缘BFS18将作为目的地MAC地址查询表时。一旦该位存入LRLT中设为新源MAC地址,数据帧封装继续将一目的地描述符附加进FPDU报头部分步骤S6.4基于目的地MAC地址。
为了确保位于最高级缓存级的副表中的MAC地址代表活动地址使用一个传统的过时退出过程由此在一个给定时间段内没有连接的MAC地址从位于最高缓存级的副表中移除。所述时间段可以是几分钟或减小至几秒钟在使用管理代理管理网络的场合。类似的,位于边缘BFS的LRLT中的位信息也在一个常规但是不频繁的时间间隔清除。优选的,LRLT中所有的位信息在4至10倍于位于最高级缓存级的分布MAC表条目的通常过时时间段内清除。由于每次LRLT清除时最高级缓存级副表将接收更新活动源MAC地址并且一个活动源MAC地址重新被网络端口发现这一过程帮助进一步减小相关通信量。
偶尔散列函数为两个不同MAC地址产生的散列值会相同。这种情况下两个MAC地址将连接位阵列中相同的位。由于第一MAC地址已经将该位集合进所述阵列这将阻止学习位于最高级缓存的第二MAC地址。通过连续改变所述散列函数用于连接阵列中的位来避免这一问题。每次所述散列函数改变一个完全不同集合比热将连接每个MAC地址。两个特定MAC地址在一个单散列函数中连接相同位的可能性非常高。在散列函数改变之后两个相同MAC地址连接相同位的可能性极小。相继使用大量不同散列函数所有设备MAC地址将有规律在所述位阵列地找到一个唯一的位并且由此将具有一个学习信息发往最高级缓存。优选的,所述散列函数为每一个清除位阵列中所有位的完整循环改变。
拷贝源MAC地址至最高级缓存级副表使用另一个源MAC地址散列函数实现。这是一个与用于连接所述位阵列中位不同的哈希函数(散列函数)。该散列函数将源MAC地址关联至位于最高级缓存的BFS18的许多MAC副表其中的一个。所述散列函数选择为通过位于最高级缓存的BFS副表均匀分布地址数据。该散列值形成地址为传统穿过网络间隔路由将源MAC地址和源入站端口号或源MAC指向最高级缓存级的源MAC填充请求(SMFR)。路由值(在该例子中为散列值)与上层和低层边界相比较以选择MAC表源填充请求应当传来的输出端口。整个散列值均匀分布于最高级缓存BFS副表之间。在一个小型网络中具有较少数量的最高级缓存并且在该例子中每个将存储大量最高级缓存散列值以完全覆盖整个散列值的所有号码空间。在一个非常大的网络中将具有上千最高级缓存并且因此每个将仅需要接收几个散列值的源MAC地址转译。在所有场合每个散列值通常仅路由至一个定级BFS的MAC副表。很重要的是整个网络使用相同散列函数。这保证一个特定MAC地址一直在相同地方发现,不管最初请求传输在哪里发出。
使用传统间隔路由还使得地址转译过程容忍BFSL上的错误。如果网络具有一个如图3所示的Clos配置则一个替代路由可能对于最顶级BFS的MAC副表可用。当间隔路由机制开始试图发送SMFR至一个错误的或未连接的BFSL则简单发送所述SMFR至另一个不是SMFR抵达的BFSL将可能允许所述SMFR抵达需求的顶级BFS的MAC副表。
图7更详细地示出了目的地描述符图5的步骤S5.3如何从所述分布的MAC地址获取。当一个数据帧抵达入站端口步骤S7.1并且目的地MAC地址从所述数据帧读出步骤S7.2。一个MAC地址查询表由产生散列函数从该数据帧的目的地MAC地址导出来实现。MAC地址处理器21(图4)接收所述散列函数并且比较该值与那些存储在MAC副表存储元件23内的值以寻找匹配步骤S7.3。当匹配被发现时所述目的地MAC地址关联至传输至目的地MAC地址的该数据帧请求的网络的出站端口号并且通信至封装器8(图1)。所述封装器8随后产生一个包括出站端口号和任何附加信息的目的地描述符,例如优先级,与所述数据帧穿过网络的路由相关并且该目的地描述符添加至该数据帧的封装步骤S7.4。
如果没有匹配在边缘BFS18的副表存储元件23中被发现则新散列函数基于目的地MAC地址用于选择一个连接以寻求一个相关的出站端口号。边缘BFS18发送一个小的,地延迟信息至下一个更高级BFS请求查询步骤S7.5。下一更高级BFS18执行一个查询并且如果还没有发现匹配且有一个更高级BFS18的步骤S7.6该步骤重复执行的步骤S7.7和S7.8。如果最高级BFS没有返回一个匹配则通信经由逐渐降低层级BFS18返回入站端口的步骤S7.9直到抵达边缘BFS。所述FPDU则泛播至所有其它端口步骤S7.10。
如果在更高级别BFS18发现一个匹配则该条目返回抵达与BFS接收的请求相同的链接。所述条目写入每个BFS18的副表经过步骤S7.11和S7.12。通过这种方式最常使用的目的地MAC地址将对于常规接收试图发往这些目的地址的数据帧且能最快速连接至所述封装器8的单个边缘BFS查询可用。另一方面,最不常用的MAC地址将仍能发现但是更远离封装器8。应当注意,虽然,Mac地址管理系统防止目的地MAC在最低缓存级别过度写入源MAC地址。所述源MAC地址收到保护免于过渡写入但能过时退出,如之前描述。
消息形式的控制令牌包含以最高级BFS18为目的的新源MAC地址,并且消息包含查询许多通过网络传输的中断FPDU请求。刷新请求(以下将详细描述)也可能中断数据包但更优选单独BFSL在闲置时间发送。
通过加载具有其入站端口号的源MAC地址至位于最高级BFS的分布MAC表,网桥学习至在其它端口接收的其它以太网数据帧一个目的地MAC地址的路由连接。此处描述的网络固有的MAC副表将包含依赖于连接至单个网络端口的设备源MAC地址不同的MAC地址选择。对于作为更高级BFS一部分的副表每个副表的内容是所有活动MAC地址的一个副集合,联合所有最高级别BFS的副表形成所有没有过时退出的活动MAC地址的完整集合。
通常用电缆连接电子设备至网络从一个端口至另一个端口或网络。如果这发生了则之前学习的路由变得不可用。在一个传统以太网桥中这个问题可通过在一段时间内没有参考的过时退出MAC表条目寻址。当电缆移除具有该源地址的提供给就端口的以太网数据帧将不再能被接收。虽然,其它端口接收以具有目的地MAC地址与移除源相匹配的太网数据帧仍路由至旧源端口。这些数据帧将不能通过MAC地址抵达终端站地址。任一错误接收这一数据帧的终端站将被请求丢弃它。最终MAC表条目将变得过时退出和不可用。在这一点具有目的地MAC地址不在可用的以太网数据帧被接收将产生所述以太网数据帧泛播至网桥所有端口包括新定位端口。这将有所有终端站接收包括正确的新终端站。错误的终端站会丢弃该数据帧并且正确的终端站能使用接收到的泛播数据帧的源MAC地址产生一个响应以太数据帧。该响应帧将在所述新入站端口接收并且为所述源MAC地址和新入站端口地址一起新MAC表条目被创建。随后的以太网数据帧指向该终端站就能正确路由指向移除的电缆插入的所述新端口,因此根据传统以太网桥为特定电子设备识别端口连接改变仅能通过由网桥已接收的该电子设备的数据帧地址侦测。
根据此处描述的以太网桥MAC地址管理协议的所述分级缓存技术能够响应由于电缆移动或其它以太网桥设备重配置,掉电或通电,可能发生在MAC表条目的改变。当一个以太网桥所有MAC条目在一单个或主表中,像传统系统,则对于者中标的改变对于所有端口可见。根据MAC表条目分布于许多位于独立芯片的分开的MAC副表,和甚至分隔的金属包壳该改变传播穿过整个系统。
传统处理器缓存机制通常需要被缓存的内存的一个完全一致图像。根据此处描述的网络,虽然,MAC条目的缓存不具有完全一致于所有端口。当端口最终发现MAC表作出的改变所谓的“懒惰”一致性可接受虽然没有副表能可见所有MAC地址改变。改变需要多花费几分钟是可以接受的。即使当快速生成树协议(RSTP)已激活改变需要快速可见一个两秒钟的更新应当足够快。通常运行条件下20秒的更新是比较合理的。还有重要的是MAC地址表条目没有被调整,由于电缆或其它设备的一个简单重配置,一直保持可用和可连接以路由FPDU穿过网络到达正确目的地。
此处描述的缓存机制中的一致性通过从一个级别缓存向下一个更高级别的刷新进程来实现。在一个相对较低频率每个条目,轮流,位于单个BFS18的MAC副表内通过使用常规路由散列函数向位于BFS18设备层级的下一上级发送一个请求填充条目核实。该正在刷新的条目在该请求存续期间不可用。通常相同的MAC表条目值将作为已经定位的状态不改变返回。然而,如果在最高级别BFS一个源MAC条目改变,或者移除,新值将被加载。所述新值可能不可用并且在该情况下该条目将被删除。MAC副表中的每个定位轮流刷新但是该刷新率可能很低并且仅需比较源的存续时间。这极大防止了网络带宽被刷新进程占用。由于系统中BFS18的所有MAC副表都执行该操作,分布的MAC表的整体状态将最终变得完全与最高级别的任何改变一致。因为条目仅在其现值仍对路由操作可用时刷新不需要产生任何新泛播操作。
此处描述的网络的可扩展性通过两种方式获得。第一,网络通过非常多的指令允许更小、更快和更简单的临近网络边缘保持非常低延迟的第一级MAC表有效增加目的地地址的MAC表的尺寸。如果网络的单个MAC副表每个均具有32000个条目则一个具有50000端口的交换机将具有大约5千万个MAC表条目对所有端口可用。第二,由之前提及网络扮演单个实体这意味着两个终端点之间仅需要发生一次会话就能使这些终端点的MAC地址对所有网络中所有其它终端点可用。比较传统以太网桥,仅需要通过网络低的多的泛播数据帧就能获得所有活动MAC地址的MAC地址条目。
此处描述的多路径网络可扩展的提供从256个或稍微少些的端口至48000个端口或更多。一个使用此处描述方法的单独以太网桥或路由器与传统网桥相比能够提供极大增强的可连接性。例如,目前最大的10吉位(Gbe)以太网桥(结构模块化的)仅提供288个端口。根据本发明的以太网桥,能运行在10Gbe或更高,一个单独以太网桥能提供48000个端口。
可理解的对本领域技术人员来说对本发明具体实施例以及本发明的基本原则和此处描述的特征进行各种各样的修改是显而易见的。因此本发明并不限于示出的具体实施例并且上述修改和变体仍落入随附的权利要求的精神和范围之内。

Claims (45)

1.一种用于网桥、交换机、路由器或集线器的多路径网络,包括大量适于连接一个或多个设备的网络端口,每个设备具有一个不同的识别地址;
大量网络元件;
分布于网络元件中的大量分别寻址的存储元件,该存储元件适于存储识别地址,并且所述存储元件至少分成两级地有层次地组织,每一层级具有大量分别可寻址的存储元件;以及
和大量网络连接交互互联所述网络元件并连接所述网络元件至所述网络端口;
其中所述多路径网络具有如下操作:
用以为每一个识别地址产生相应的散列值;
由那些存储元件在最高层级的大量存储元件中分布大量识别地址以便于存储,该识别地址被存储于各自的位置,该位置由与涉及的识别地址相关的散列值确定;以及
路由一个数据包,其中包括与一设备的识别地址相关的目的地址。
2.如权利要求1所述的多路径网络,其中所述网络适于存储所有连接至所述网络的设备的地址数据至所述最高层级的存储元件内。
3.如权利要求1或2所述的多路径网络,其中所述网络适于存储一个连接至所述网络的设备的地址数据至所述最高层级的一个或多个但不是所有的存储元件内。
4.如权利要求3所述的多路径网络,其中所述网络适于仅存储一个连接至所述网络的设备的地址数据至所述最高层级的一个存储元件内。
5.如权利要1-2任一所述的多路径网络,其中单个存储元件的存储容量小于要存储的设备地址数据量。
6.如权利要求1-2任一所述的多路径网络,其中每一个存储元件形成相应网络元件的一部分。
7.如权利要求1-2任一所述的多路径网络,其中所述网络适于使用取自网络端口接收到的数据包的设备地址数据刷新位于最高层级存储元件的内容。
8.如权利要求7所述的多路径网络,其中至少最底层级的每个网络元件包括一个附加存储元件,该附加存储元件包含一个单个位阵列,该单个位阵列是通过使用从所述设备地址数据产生的散列值访问。
9.如权利要求8所述的多路径网络,其中当连接的位于单个位阵列内的与源设备地址数据相关的位已设置,所述网络适于不使用取自网络端口接收到的数据包的设备地址数据刷新位于最高层级存储元件的内容。
10.如权利要求9所述的多路径网络,其中当一个具有新设备地址数据的数据包在一个为通过网络传输的网络端口接收并且与所述网络端口相关的位于所述单个位阵列内的新设备地址数据的已访问位被清除时所述网络适于使用所述新设备地址数据更新位于最高层级内的至少一个存储元件。
11.如权利要求10所述的多路径网络,其中当位于最高层级的存储单元的一个更新产生时所述网络适于使用位于单个位阵列内的所述新设备地址数据设置所述已访问位。
12.如权利要求8-11任一所述的多路径网络,其中所述网络元件适于在以预定时间间隔清除单个位阵列内的数据位。
13.如权利要求12所述的多路径网络,其中所述网络适于在一预定时间间隔改变用于从所述设备地址数据产生散列值的散列函数。
14.如权利要求1-2任一项所述的多路径网络,其中所述网络适于仅在数据包通过网络传输的过程中读取一次由一个网络端口接收的数据包的设备地址数据。
15.如权利要求1-2任一所述的多路径网络,其中所述网络适于在层级之间通信所述设备地址数据。
16.如权利要求1-2任一项所述的多路径网络,其中所述网络适于将目的地设备地址数据转换为网络出站端口描述符并且其中所述网络适于在路由数据穿过网络中使用网络出站端口描述符。
17.权利要求1-2任一所述的多路径网络,其中所述网络元件适于在一个预定时间间隔之后从与其相关的存储元件清除设备地址数据。
18.如权利要求17所述的多路径网络,其中如果所述设备地址数据存在于位于最高层级的任一存储元件内所述网络元件适于在所述设备地址数据清除之前延长所述预定时间间隔。
19.如权利要求17所述的多路径网络,其中如果所述设备地址数据对一个或多个连接至位于最高层级的网络元件网络端口的设备观测存在则所述网络元件适于在所述设备地址数据清除之前延长所述预定时间间隔。
20.权利要求1-2任一所述的多路径网络,其中当所述设备地址数据不存在位于最高层级的任一存储元件内时所述网络元件适于从与其相关的存储元件清除设备地址数据。
21.权利要求1-2任一所述的多路径网络,其中位于最低层级的存储元件适于指示位于最高层级的存储元件内的地址数据存在或不存在。
22.如权利要求1-2任一项所述的多路径网络,其中所述设备地址数据是媒体连接控制数据或IP数据。
23.一种用于如权利要求1-22任一所述的多路径网络的以太网桥或路由器。
24.一种多路径网络中设备地址数据管理方法,包括适于连接一个或更多设备的大量网络端口,每个设备具有一个不同的识别地址;大量网络元件;分布于网络元件中的大量分别寻址的存储元件,该存储元件适于存储识别地址,并且所述存储元件至少分成两级地有层次地组织,每一层级具有大量分别可寻址的存储元件;以及大量网络连接交互互联所述网络元件并连接所述网络元件至所述网络端口;该方法包括:
为每一个识别地址产生一个相应的散列值;
为便于存储,在最高层级的大量存储元件中分布大量识别地址,该识别地址被存储于各自的位置,该位置由与涉及的识别地址相关的散列值确定;由此提供一数据包的路由,其中包括与一设备的识别地址相关的目的地址。
25.如权利要求24所述的方法,其中连接至所述网络的所有设备的地址数据存储在位于最高层级的存储元件中。
26.如权利要求24所述的方法,其中特定设备的所述设备地址数据存储在位于最高层级的一个或多个但不是所有存储元件中。
27.如权利要求26所述的方法,其中特定设备的所述设备地址数据仅存储在位于最高层级的一个存储元件中。
28.如权利要求24-27任一所述的方法,其中每个所述存储元件形成相应网络元件的一部分。
29.如权利要求24-27任意一项所述的方法,其中用于从设备地址数据产生散列值的散列函数在一个预定间隔改变。
30.如权利要求24-27任意一项所述的方法,其中至少位于最底层级的每个存储元件包括一个单个位阵列,该单个位阵列通过使用由所述设备地址数据产生的散列值访问。
31.如权利要求24-27任一所述的方法,其中位于最高层级的存储元件的内容基于取自网络端口接收的数据包的设备地址数据刷新。
32.如权利要求30所述的方法,其中位于最高层级的至少一个存储元件基于一个新设备地址数据更新当一个具有所述新设备地址数据的数据包被为通过网络传输的网络端口接收并且单个位阵列中与所述网络端口相关的所述新设备地址数据的已访问位被清除时。
33.如权利要求32所述的方法,其中当位于最高层级的一个存储元件的更新发生时在所述单个位阵列中的一个已访问位通过所述新设备地址数据设置。
34.如权利要求33所述的方法,其中当一个数据包在为通过网络传输的网络端口接收并且与所述网络端口相关的单个位阵列中的所述已访问位已设置时位于最高层级的存储元件的内容不刷新。
35.如权利要求32-34任一所述的方法,其中所述单个位阵列的数据位在一个预定时间间隔清除。
36.如权利要求24-27任一所述的方法,其中在一个网络端口接收的数据包的所述设备地址数据仅在所述数据包通过网络传输时读取一次。
37.如权利要求24-27任一所述的方法,其中设备地址数据散列值在层级之间通信。
38.如权利要求24-27任一所述的方法,其中目的地设备地址数据转换为网络出站端口描述符并且其中数据包基于所述出站端口描述符路由穿过网络。
39.如权利要求24-27任一所述的方法,其中设备地址数据在一个预定时间间隔之后从其存储元件清除。
40.如权利要求39所述的方法,其中如果设备地址数据存在于更高层级的任一存储元件则设备地址数据清除之前的预定时间间隔延长。
41.如权利要求40所述的方法,其中如果设备地址数据对于一个或多个连接至位于最低层级的网络元件的网络端口的设备观测存在则设备地址数据清除之前的预定时间间隔延长。
42.如权利要求24-27任一所述的方法,其中当设备地址数据不存在于位于最高层级的任一存储元件内时设备地址数据从存储元件清除。
43.如权利要求24-27任一所述的方法,其中位于最低层级的存储元件指示位于最高层级存储元件内设备地址数据存在或不存在。
44.如权利要求24-27任一所述的方法,其中所述地址数据是媒体连接控数据或IP数据。
45.如权利要求24-27任一所述的方法,其中大量存储元件的至少一些使用地址缓存,并且所述方法包括为了保持地址缓存之间一致性,通过检查更高层级地址缓存内容的一个轮流刷新地址缓存中每个条目的确认步骤。
CN200980128858.3A 2008-07-25 2009-07-23 一种多路径网络 Active CN102106125B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0813630A GB2461955A (en) 2008-07-25 2008-07-25 Ethernet bridge or router employing a distributed MAC address table
GB0813630.1 2008-07-25
PCT/GB2009/001825 WO2010010351A1 (en) 2008-07-25 2009-07-23 A multi-path network

Publications (2)

Publication Number Publication Date
CN102106125A CN102106125A (zh) 2011-06-22
CN102106125B true CN102106125B (zh) 2016-01-27

Family

ID=39746919

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980128858.3A Active CN102106125B (zh) 2008-07-25 2009-07-23 一种多路径网络

Country Status (5)

Country Link
US (1) US8898431B2 (zh)
EP (1) EP2359547A1 (zh)
CN (1) CN102106125B (zh)
GB (1) GB2461955A (zh)
WO (1) WO2010010351A1 (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9716672B2 (en) 2010-05-28 2017-07-25 Brocade Communications Systems, Inc. Distributed configuration management for virtual cluster switching
US9769016B2 (en) 2010-06-07 2017-09-19 Brocade Communications Systems, Inc. Advanced link tracking for virtual cluster switching
US8867552B2 (en) 2010-05-03 2014-10-21 Brocade Communications Systems, Inc. Virtual cluster switching
US9270486B2 (en) 2010-06-07 2016-02-23 Brocade Communications Systems, Inc. Name services for virtual cluster switching
US9807031B2 (en) 2010-07-16 2017-10-31 Brocade Communications Systems, Inc. System and method for network configuration
US8769148B1 (en) * 2010-07-30 2014-07-01 Google Inc. Traffic distribution over multiple paths in a network
CN103477593B (zh) * 2011-04-04 2017-03-29 日本电气株式会社 网络系统、交换机和连接终端检测方法
US8594096B2 (en) 2011-10-31 2013-11-26 Hewlett-Packard Development Company, L.P. Dynamic hardware address assignment to network devices in a switch mesh
US9450870B2 (en) 2011-11-10 2016-09-20 Brocade Communications Systems, Inc. System and method for flow management in software-defined networks
US9374301B2 (en) 2012-05-18 2016-06-21 Brocade Communications Systems, Inc. Network feedback in software-defined networks
US9537793B2 (en) * 2012-10-10 2017-01-03 Cisco Technology, Inc. Ensuring any-to-any reachability with opportunistic layer 3 forwarding in massive scale data center environments
US9401872B2 (en) 2012-11-16 2016-07-26 Brocade Communications Systems, Inc. Virtual link aggregations across multiple fabric switches
JP5935666B2 (ja) * 2012-11-22 2016-06-15 日立金属株式会社 通信システムおよびネットワーク中継装置
US9565099B2 (en) 2013-03-01 2017-02-07 Brocade Communications Systems, Inc. Spanning tree in fabric switches
CN103220665B (zh) * 2013-05-07 2018-09-28 上海斐讯数据通信技术有限公司 无线ssid的mac地址分配方法
US9888042B2 (en) * 2013-05-21 2018-02-06 Citrix Systems, Inc. Systems and methods for multipath transmission control protocol connection management
US20150055655A1 (en) * 2013-08-26 2015-02-26 Cisco Technology, Inc. System and method for forwarding of a packet
US9806949B2 (en) * 2013-09-06 2017-10-31 Brocade Communications Systems, Inc. Transparent interconnection of Ethernet fabric switches
CN104518967B (zh) * 2013-09-30 2017-12-12 华为技术有限公司 路由方法、设备和系统
US9912612B2 (en) * 2013-10-28 2018-03-06 Brocade Communications Systems LLC Extended ethernet fabric switches
US10212101B2 (en) * 2014-01-14 2019-02-19 Nant Holdings Ip, Llc Low level provisioning of network fabrics
US9917728B2 (en) 2014-01-14 2018-03-13 Nant Holdings Ip, Llc Software-based fabric enablement
US9548873B2 (en) 2014-02-10 2017-01-17 Brocade Communications Systems, Inc. Virtual extensible LAN tunnel keepalives
US10581758B2 (en) 2014-03-19 2020-03-03 Avago Technologies International Sales Pte. Limited Distributed hot standby links for vLAG
US10476698B2 (en) 2014-03-20 2019-11-12 Avago Technologies International Sales Pte. Limited Redundent virtual link aggregation group
US10063473B2 (en) 2014-04-30 2018-08-28 Brocade Communications Systems LLC Method and system for facilitating switch virtualization in a network of interconnected switches
US9800471B2 (en) 2014-05-13 2017-10-24 Brocade Communications Systems, Inc. Network extension groups of global VLANs in a fabric switch
US10616108B2 (en) 2014-07-29 2020-04-07 Avago Technologies International Sales Pte. Limited Scalable MAC address virtualization
US9807007B2 (en) 2014-08-11 2017-10-31 Brocade Communications Systems, Inc. Progressive MAC address learning
US9654483B1 (en) * 2014-12-23 2017-05-16 Amazon Technologies, Inc. Network communication rate limiter
US10003552B2 (en) 2015-01-05 2018-06-19 Brocade Communications Systems, Llc. Distributed bidirectional forwarding detection protocol (D-BFD) for cluster of interconnected switches
US9942097B2 (en) 2015-01-05 2018-04-10 Brocade Communications Systems LLC Power management in a network of interconnected switches
US10038592B2 (en) 2015-03-17 2018-07-31 Brocade Communications Systems LLC Identifier assignment to a new switch in a switch group
US10579406B2 (en) 2015-04-08 2020-03-03 Avago Technologies International Sales Pte. Limited Dynamic orchestration of overlay tunnels
US10439929B2 (en) 2015-07-31 2019-10-08 Avago Technologies International Sales Pte. Limited Graceful recovery of a multicast-enabled switch
US10171303B2 (en) 2015-09-16 2019-01-01 Avago Technologies International Sales Pte. Limited IP-based interconnection of switches with a logical chassis
US9912614B2 (en) 2015-12-07 2018-03-06 Brocade Communications Systems LLC Interconnection of switches based on hierarchical overlay tunneling
US10237090B2 (en) 2016-10-28 2019-03-19 Avago Technologies International Sales Pte. Limited Rule-based network identifier mapping
CN110401558B (zh) * 2019-04-28 2023-07-25 北京广利核系统工程有限公司 安全级多点通信网络设备、系统及安全级网络通信方法
GB2583962B (en) 2019-05-16 2022-08-31 Rockley Photonics Ltd Routing protocol and distributed router
CN110266763B (zh) * 2019-05-20 2022-04-12 深圳壹账通智能科技有限公司 跨网段互连的区块链网络实现方法、系统及存储介质
DE102019114309A1 (de) * 2019-05-28 2020-12-03 Beckhoff Automation Gmbh Verfahren zum Routen von Telegrammen in einem Automatisierungsnetzwerk, Datenstruktur, Automatisierungsnetzwerk und Netzwerkverteiler
US11477116B2 (en) * 2020-08-20 2022-10-18 Nokia Solutions And Networks Oy Loop detection in ethernet packets
CN112492588B (zh) * 2020-12-03 2022-07-12 桂林电子科技大学 一种基于动态令牌的多路径源节点位置隐私保护路由方法
US11223553B1 (en) * 2021-07-28 2022-01-11 Bandwidth, Inc. Techniques for routing messages through a message delivery network
US12093183B1 (en) * 2023-03-09 2024-09-17 Dell Products L.P. Caching techniques using a mapping cache and maintaining cache coherency using physical to logical address mapping

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6310874B1 (en) * 1998-03-19 2001-10-30 3Com Corporation Learn pending frame throttle
CN1567237A (zh) * 2003-06-09 2005-01-19 浪潮电子信息产业股份有限公司 构建高可用分布式存储系统的方法
WO2008052341A1 (en) * 2006-11-02 2008-05-08 Nortel Networks Limited Distributed storage of routing information in a link state protocol controlled network

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5524001A (en) * 1994-02-07 1996-06-04 Le Groupe Videotron Ltee Dynamic cable signal assembly
US6078963A (en) * 1998-01-16 2000-06-20 At&T Corp. Router with de-centralized processing using intelligent ports
US6141344A (en) * 1998-03-19 2000-10-31 3Com Corporation Coherence mechanism for distributed address cache in a network switch
DE69934644T2 (de) 1998-10-05 2007-11-15 Alcatel Lucent Netzwerkvermittlungseinrichtung mit auf der Basis von Benutzung verteilten Umleitungsdatenbanken
US6275919B1 (en) * 1998-10-15 2001-08-14 Creative Technology Ltd. Memory storage and retrieval with multiple hashing functions
US7310356B2 (en) * 2002-06-24 2007-12-18 Paradyne Corporation Automatic discovery of network core type
US20040139274A1 (en) * 2002-10-21 2004-07-15 Hui Ronald Chi-Chun Virtual content addressable memory with high speed key insertion and deletion and pipelined key search
US6862486B2 (en) * 2003-03-04 2005-03-01 Activplant Corporation System and method for processing data relating to conditions in a manufacturing process
US8923292B2 (en) * 2004-04-06 2014-12-30 Rockstar Consortium Us Lp Differential forwarding in address-based carrier networks
US7254678B2 (en) * 2005-03-17 2007-08-07 International Business Machines Corporation Enhanced STCX design to improve subsequent load efficiency
JP4556761B2 (ja) * 2005-05-06 2010-10-06 株式会社日立製作所 パケット転送装置
US20060268739A1 (en) * 2005-05-24 2006-11-30 Garcia Julio C Tracking of traffic engineering topology in an autonomous system
US8498297B2 (en) 2005-08-26 2013-07-30 Rockstar Consortium Us Lp Forwarding table minimisation in ethernet switches
US7697418B2 (en) * 2006-06-12 2010-04-13 Alcatel Lucent Method for estimating the fan-in and/or fan-out of a node
US7616468B2 (en) * 2006-08-04 2009-11-10 Qualcomm Incorporated Method and apparatus for reducing power consumption in a content addressable memory
US20080104333A1 (en) * 2006-10-31 2008-05-01 Veazey Judson E Tracking of higher-level cache contents in a lower-level cache
US7869349B2 (en) * 2008-10-14 2011-01-11 International Business Machines Corporation Method and system for deducing network routes by querying routers
US8468297B2 (en) * 2010-06-23 2013-06-18 International Business Machines Corporation Content addressable memory system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6310874B1 (en) * 1998-03-19 2001-10-30 3Com Corporation Learn pending frame throttle
CN1567237A (zh) * 2003-06-09 2005-01-19 浪潮电子信息产业股份有限公司 构建高可用分布式存储系统的方法
WO2008052341A1 (en) * 2006-11-02 2008-05-08 Nortel Networks Limited Distributed storage of routing information in a link state protocol controlled network

Also Published As

Publication number Publication date
EP2359547A1 (en) 2011-08-24
GB0813630D0 (en) 2008-09-03
WO2010010351A1 (en) 2010-01-28
GB2461955A (en) 2010-01-27
US8898431B2 (en) 2014-11-25
US20110134924A1 (en) 2011-06-09
CN102106125A (zh) 2011-06-22
WO2010010351A8 (en) 2011-03-17

Similar Documents

Publication Publication Date Title
CN102106125B (zh) 一种多路径网络
CN102084627B (zh) 通过网络传输数据的方法
CN101258719B (zh) 延长InfiniBand网络的实时到达的方法
CN102282810B (zh) 负载平衡
CN100473054C (zh) 一种处理分组的网络设备及方法
CN103490961B (zh) 一种网络设备
CN102769869B (zh) 无线接入点的控制和配置报文快速转发系统
CN101047714B (zh) 一种处理网络数据的方法及系统
CN101442493B (zh) Ip报文分发方法、集群系统和负载均衡器
CN100571202C (zh) 一种自带路由信息的数据的传送方法及传送系统
CN100435530C (zh) 一种多机服务器系统中双向负载均衡机制的实现方法
CN102027717A (zh) 一种通过网络的数据传输方法
CN103957156A (zh) 通过网络传输数据的方法
CN103618678A (zh) 自适应多链路聚合的方法、装置及系统
CN109861931B (zh) 一种高速以太网交换芯片的存储冗余系统
CN107846358A (zh) 一种数据传输方法、装置及网络系统
CN108683523B (zh) 一种基于网络虚拟化的sdn架构
CN100563215C (zh) 一种报文路由交换装置及其方法
GB2459838A (en) Encapsulating Ethernet frames for transit through a bridge or router
JP2004520725A5 (zh)
CN101616064B (zh) 数据管理方法、mesh网络系统及相关装置
CN106850440A (zh) 一种面向多地址共享数据路由包的路由器、路由方法及其芯片
EP1508225B1 (en) Method for data storage in external and on-chip memory in a packet switch
CN108365886B (zh) 一种时分复用星间网络数据存储转发方法
CN105704067A (zh) 交换装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: KELEI UK CO., LTD.

Free format text: FORMER OWNER: GNODAL LTD.

Effective date: 20140410

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140410

Address after: Redding

Applicant after: CRAY UK LIMITED

Address before: Bristol

Applicant before: Gnodal Ltd

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201201

Address after: American Texas

Patentee after: HEWLETT-PACKARD DEVELOPMENT Co.,L.P.

Address before: British lightning

Patentee before: GNODAL Ltd.

TR01 Transfer of patent right