CN115297065A - 处理设备通信互连方法、装置、计算机设备和存储介质 - Google Patents
处理设备通信互连方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN115297065A CN115297065A CN202210664937.3A CN202210664937A CN115297065A CN 115297065 A CN115297065 A CN 115297065A CN 202210664937 A CN202210664937 A CN 202210664937A CN 115297065 A CN115297065 A CN 115297065A
- Authority
- CN
- China
- Prior art keywords
- communication request
- communication
- link
- idle
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 274
- 238000012545 processing Methods 0.000 title claims abstract description 149
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 230000003287 optical effect Effects 0.000 claims abstract description 75
- 238000004590 computer program Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000013461 design Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/50—Queue scheduling
- H04L47/62—Queue scheduling characterised by scheduling criteria
- H04L47/625—Queue scheduling characterised by scheduling criteria for service slots or service orders
- H04L47/6275—Queue scheduling characterised by scheduling criteria for service slots or service orders based on priority
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/24—Multipath
- H04L45/245—Link aggregation, e.g. trunking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q2011/0086—Network resource allocation, dimensioning or optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Small-Scale Networks (AREA)
Abstract
本申请涉及一种处理设备通信互连方法、装置、计算机设备和存储介质。所述方法包括:获取单向环形链路中每个处理设备的通信请求;确定所述通信请求的优先级的高低;根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;处理设备通过空闲链路发送所述通讯请求对应的通信数据。采用本方法能够有效节约提高带宽的成本。
Description
技术领域
本申请涉及通信技术领域,特别是涉及一种处理设备通信互连方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,对计算机内部CPU之间的通信或者计算机与计算机之间的通信的效率和性能要求越来越高,当通信带宽指标不断提高时,基于电信号的单条链路的通信频率由于受到能耗、链路损耗等因素无法无限制地提升,因此不得不并发地使用数条乃至数百条链路进行并发通信以提高理论带宽。但这又造成了链路间的信号串扰问题,使得链路的布局布线成为一大难题,最终,物理链路的低利用率限制了整个互连系统的性能发挥。
使用光信号替代电信号可以解决电信号中的通信频率、串扰和功率问题,但光信号难以暂存的特性使其派生出新的问题而无法彻底解决物理链路成为系统瓶颈这一现状。在CPU到CPU的互连中,光信号的特性使得互连模式更多为点对点的物理连接,导致要么每两个CPU之间都拥有一条点对点物理链路,要么两个CPU不存在点对点的物理链路,其之间的通信要通过其它1个乃至数个 CPU的中转实现;对于每两颗CPU之间都拥有一条点对点物理链路,当CPU 数量大于8时,每颗CPU上互连接口的数量过多从而降低其应用价值;对于两个CPU需要通过其它CPU中转进行通信,由于采用光信号的中继实现,通常将光信号转换为电信号后再根据信号内容决定中继方向,再转换为光信号完成中继,大大增加了时延并引发了链路争用问题。在计算机主机到计算机主机的互连系统中,目前常使用交换机完成上述节点与节点之间的连接任务,保证交换速率的同时,降低了每个节点的接口需求,但同样受限于光信号极难暂存,目前的交换机内部仍然使用电信号完成交换,这意味着困扰电信号系统的功耗、串扰、布局布线等问题仍然困扰着交换机的设计制造,从而使交换机成为整个系统的瓶颈。
然而,传统计算机内部多颗CPU的互连,或多台计算机主机的互连,通常采用对称链路构建技术,即上行链路和下行链路在物理层面上完全对称。但在真实的业务场景中,无论是CPU到CPU的互连,还是计算机主机到计算机主机的互连,均很少存在双向物理链路均为满载的场景,通常的传输场景为单边满载,此时,对于互连的两个节点而言,上行链路的吞吐量往往不到下行链路带宽的1/10。这意味着对于传统互连系统,底层物理链路的利用率是很低的。
因此,目前对处理设备之间的通信效率有极高的要求情况下,在处理设备之间增加理论带宽的成本很高,并且具有链路间的信号串扰问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够降低提高带宽的成本的处理设备通信互连方法、装置、计算机设备和存储介质。
一种处理设备通信互连方法,所述方法包括:
获取单向环形链路中每个处理设备的通信请求;
确定所述通信请求的优先级的高低;
根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;
处理设备通过空闲链路发送所述通讯请求对应的通信数据。
在其中一个实施例中,所述通信请求包括源地址、目的地址、数据量;
所述根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路,包括:
获取优先级最高的通信请求,确定该通信请求的源地址、目的地址;
根据该通信请求的源地址、目的地址从单向环形链路中选取距离最近的节点的空闲状态的端口构建的空闲链路,并对空闲链路中各节点的相应端口进行锁定;其中,节点的端口状态包括空闲状态和锁定状态。
在其中一个实施例中,在处理设备通过空闲链路发送所述通讯请求对应的通信数据之后,包括:对空闲链路中各节点已经完成通信数据发送的端口进行释放;其中,释放后的节点的端口为空闲状态。
在其中一个实施例中,所述根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路包括:依次对未构建空闲链路的当前优先级最高的通信请求选取节点的空闲状态的端口,构建空闲链路;所述处理设备通过空闲链路发送所述通讯请求对应的通信数据包括:在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据。
在其中一个实施例中,在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据之后,包括:对未构建空闲链路的通信请求,提高优先级权重;其中,所述优先级权重大于1,所述通信请求的优先级为数据量与优先级权重之积。
在其中一个实施例中,所述确定所述通信请求的优先级的高低,包括:按照通信请求的数据量的大小确定通信请求的优先级的高低;或,按照通信请求的源地址或目标地址的等级确定通信请求的优先级的高低;或,按照通信请求的发送时间的先后确定通信请求的优先级的高低。
在其中一个实施例中,所述单向环形链路为,具有多组光输入输出端口的多个处理设备,和用于动态可配置地连接至少部分的所述多个处理设备的输入输出端口的BENES光交换装置,组成的环形互连网络拓扑结构。
一种处理设备通信互连装置,所述装置包括:
通信请求获取模块,用于获取单向环形链路中每个处理设备的通信请求;
优先级确定模块,用于确定所述通信请求的优先级的高低;
空闲链路构建模块,用于根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;
通信数据发送模块,用于处理设备通过空闲链路发送所述通讯请求对应的通信数据。
一种用于上述处理设备通信互连方法的处理设备通信互连系统,包括:
多个处理设备,具有多组光输入输出端口;
BENES光交换装置,用于动态可配置地连接至少部分的所述多个处理设备的输入输出端口;
控制电路,与所述处理设备和BENES光交换装置连接,用于获取单向环形链路中每个处理设备的通信请求,确定所述通信请求的优先级的高低,并根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;
其中,所述多个处理设备和所述BENES光交换装置组成环形互连网络拓扑结构。
在其中一个实施例中,所述BENES光交换装置的数量与每个处理设备所具有的输入输出端口数量相同。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取单向环形链路中每个处理设备的通信请求;
确定所述通信请求的优先级的高低;
根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;
处理设备通过空闲链路发送所述通讯请求对应的通信数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取单向环形链路中每个处理设备的通信请求;
确定所述通信请求的优先级的高低;
根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;
处理设备通过空闲链路发送所述通讯请求对应的通信数据。
上述处理设备通信互连方法、装置、计算机设备和存储介质,通过在单向环形链路连接多个处理设备,多个处理设备在需要通信时,根据通信请求构建空闲链路,能够根据优先级处理重要的通信请求,发送重要的通信数据,同时,通过处理设备和BENES光交换装置连接避免了处理设备间互连布局布线和功耗面临的技术挑战,与现有的光互连技术相比,本发明实现了一种性能优异的全光互连方案,降低了数据报文在现有光交换机(内部使用电信号完成交换)内的时延,并且与现有的全光互连技术相比,本发明提出的方法,在同样数量的输入输出接口条件下,可通过动态调节数据通路,提供更高的互连性能。
附图说明
图1为一个实施例中处理设备通信互连方法的流程示意图;
图2为一个实施例中8x8 BENES光交换装置内部构造示意图;
图3为一个实施例中单节点与4个BENES光交换装置连接示意图;
图4为一个实施例中8个节点与4个8x8 BENES光交换装置构建互连系统示意图;
图5为一个实施例中非对称链路物理实现示意图;
图6为一个实施例中非对称链路逻辑示意图;
图7为一个实施例中非对称链路结构示意图;
图8为一个实施例中处理设备通信互连装置的结构框图;
图9为一个实施例中计算机设备的内部结构图;
图10为一个实施例中光开关的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
现有技术中对称链路的设计本身导致了在单条链路传输频率达到一定高度时,想要实现更高速率,只能增加更多链路,通过并发传输实现速率提升。对于电信号,更多链路对设计本身提出了过高的要求使之不再经济;对于光信号,更多的物理链路意味着更多的接口、连接器、收发装置,加上光信号与电信号的反复转换,都会使该系统不够经济。同时注意到,对称链路往往也是固定链路,即每个节点新增了N个收发装置,也仅仅实现了对固定的N个其它节点的点对点通信。这带来一些问题:链路利用率低,在当前没有对应点对点通信需求时,链路被闲置;缺乏灵活性,这N条链路只能服务于固定的N个节点,而无法高效地服务其余的通信需求(可通过转发增加灵活性,但转发本身效率就比较低)。
现有非对称传输相关技术大多为数据链路层至应用层的设计,或是针对非对称节点进行的特化设计。如目前仍在广泛使用的家庭入户宽带设计,其接入的下行速率和上行速率就是不对称的,但这种不对称仅仅体现在应用层,其物理层和数据链路层本身的硬件结构是对称的。这种不对称的设计也是因为家庭宽带的使用场景下对下行速率的要求远高于上行速率所导致的,不具备迁移到对称节点互连网络的条件。本发明的目的为通过一些手段提高底层物理链路的利用率,则可以在不增加理论带宽的前提下,进一步提升系统吞吐量。
基于此,提供了一种处理设备通信互连方法,能够对下行链路进行充分利用,在提高通信带宽的同时,基于现有的物理层面的链路进行通信互连构建,节约了成本。本发明不仅能应用于对称连接的物理链路,对于非对称连接的物理链路也同样适用。
在一个实施例中,如图1所示,提供了一种处理设备通信互连方法,包括以下步骤:
S110,获取单向环形链路中每个处理设备的通信请求。
其中,处理设备可为计算机内部的CPU,或者处理设备也可为计算机,计算机内部CPU之间或者计算机与计算机之间在需要进行通信时,发送需要进行通信的通信请求至控制电路,控制电路统一对链路的通信资源进行调度。
S120,确定所述通信请求的优先级的高低。
其中,通信请求的优先级可根据数据量的大小、源地址或目标地址的等级或发送时间确定,例如,数据量越大的通信请求优先级越高,源地址或目标地址等级越高的通信请求优先级越高,发送时间越早的通信请求优先级越高。
S130,根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口。
其中,端口可为输入端口或输出端口。如图4所示,在单向环形链路中包括多个节点,此处节点为处理设备,每个节点具有一个输入输出端口,各个节点通过BENES光交换装置连接,节点的输出端口与BENES光交换装置的输入口连接,BENES光交换装置的输出口与节点的输入端口连接;在单向环形链路中,节点通过BENES光交换装置可与其他节点连接。其中,BENES光交换装置的内部结构如图2和图10所示,BENES光交换装置包括8个输入口和8个输出口,任一输入口可以与任一输出口互连,BENES光交换装置由多个2×2的光开关组成,2×2的光开关存在两种开关状态如附图2所示,8×8的BENES光交换装置由20个2×2的光开关连接而成。
S140,处理设备通过空闲链路发送所述通讯请求对应的通信数据。
其中,处理设备根据通信请求的目标地址发送通信数据。
上述处理设备通信互连方法中,通过在单向环形链路连接多个处理设备,多个处理设备在需要通信时,根据通信请求构建空闲链路,能够根据优先级处理重要的通信请求,发送重要的通信数据,同时,通过处理设备和BENES光交换装置连接避免了处理设备间互连布局布线和功耗面临的技术挑战,与现有的光互连技术相比,本发明实现了一种性能优异的全光互连方案,降低了数据报文在现有光交换机(内部使用电信号完成交换)内的时延,并且与现有的全光互连技术相比,本发明提出的方法,在同样数量的输入输出接口条件下,可通过动态调节数据通路,提供更高的互连性能。
在其中一个实施例中,所述通信请求包括源地址、目的地址、数据量。所述根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路,包括:获取优先级最高的通信请求,确定该通信请求的源地址、目的地址;根据该通信请求的源地址、目的地址从单向环形链路中选取距离最近的节点的空闲状态的端口构建的空闲链路,并对空闲链路中各节点相应的端口进行锁定;其中,节点的端口状态包括空闲状态和锁定状态。其中,端口包括输入端口和输出端口。
其中,通信请求以{源地址、目的地址、数据量}三元组的形式传递给控制电路。例如,如图7所示,8个节点组成单向环形链路,图中省略了BENES光交换装置,节点5的通信请求优先级最高,此时节点5需要向节点4发送通信数据,有多条路径可以选择:⑤-②-④、⑤-⑧-①-②-④、⑤-⑧-①-④、⑤- ③-⑥-⑦-⑧-①-②-④、⑤-③-⑥-⑦-⑧-①-④;其中,①表示节点1,②表示节点2,③表示节点3,依次类推,⑧表示节点8;此时,可以优先选择⑤-②- ④作为节点5到节点4的通信路径,根据节点5、节点2、节点4构建空闲链路,对节点5、节点2、节点4进行相应端口锁定,锁定的节点的端口不能用于另一空闲链路的构建。
可以理解的是,BENES光交换装置可以直接连接两个需要互相通信的处理设备,此时两个处理设备相当于点对点直接连接,点对点连接的空闲链路被优先选择。BENES光交换装置在数据链路上是无源的,它不会存储和转发通信节点的信号,其不参于通信链路的决策。
其中,处理设备可作为中继节点,连接两个相互需要进行通信的处理设备,在处理设备的端口已经被用于构建空闲链路时,此时,该处理设备的端口在本轮数据通信中不能再用于另一空闲链路的构建;其中,从通信请求的获取、到空闲链路、一直到通信数据为一轮数据通信。需要说明的是,无论是处理设备还是BENES光交换装置,只要其端口已经被用于构建空闲链路,则在本轮数据通信中不能再用于另一空闲链路的构建。
在其中一个可行的具体实施例中,控制电路对通信链路集中调控,具体过程为:处理设备向控制电路发送通信请求,控制电路根据各处理设备通信请求的优先级确定需要优先发送的通信数据,根据单向环形链路中的节点的空闲状态的端口构建空闲链路,控制电路向处理设备发送空闲链路的相关数据(经过的节点的端口和BENES光交换装置的端口,以及经过的顺序),控制电路根据新构建的空闲链路,调整各节点的端口的状态,然后确定下一优先级最高的处理设备并根据节点的空闲状态的端口构建空闲链路,然后向该优先级最高的处理设备发送空闲链路的相关数据,以此类推,直到节点的空闲状态的端口不能对优先级最高的处理设备构建空闲链路,则广播通信数据发送指令,处理设备根据已经构建的空闲链路发送通信数据。
在另一个可行的具体实施例中,处理设备自主选择空闲链路,具体过程为:处理设备向控制电路发送通信请求,控制电路根据各处理设备通信请求的优先级确定需要优先发送的通信数据,控制电路向优先级最高的处理设备发送节点的空闲状态的端口,处理设备根据节点的空闲状态的端口构建最佳的空闲链路,然后向控制电路上报空闲链路的相关数据(经过的节点和BENES光交换装置,以及经过的顺序),控制电路根据新构建的空闲链路,调整各节点的端口的状态,然后确定下一优先级最高的处理设备并向其发送节点的空闲状态的端口,依次类推,直到控制电路接收到不能构建空闲链路的消息,则广播通信数据发送指令,处理设备根据已经构建的空闲链路发送通信数据。
在其中一个实施例中,在处理设备通过空闲链路发送所述通讯请求对应的通信数据之后,包括:对空闲链路中各节点已经完成通信数据发送的端口进行释放;其中,释放后的节点的端口为空闲状态。
其中,在该处理设备的输入输出端口完成数据发送后,对该节点(处理设备)的输入输出端口进行释放,一个节点往往有数个输入输出端口,分别连接至数个BENES光交换装置上。此处,需要处理设备主动向控制电路汇报当前节点的端口处于空闲状态,控制电路只负责构建、回收链路,并不能主动探测当前链路是否空闲。特别注明的是,链路的回收过程是通过描述符实现的,因此已回收的链路实际上仍然可以传输数据,但无法保证该链路对应的发送端口和接收端口在未来是否拿去进行新的点对点链路构建,即无法保证通过已回收链路发送的数据的完整性。
在其中一个实施例中,所述根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路包括:依次对未构建空闲链路的当前优先级最高的通信请求选取节点的空闲状态的端口,构建空闲链路。所述处理设备通过空闲链路发送所述通讯请求对应的通信数据包括:在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据。其中,在空闲链路构建时,只能选取节点的空闲状态的端口,这样能够避免信号冲突。在单向环形链路中,根据通信请求,不能再构建空闲链路时,此时进行通信数据的发送。
在其中一个实施例中,在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据之后,包括:对未构建空闲链路的通信请求,提高优先级权重;其中,所述优先级权重大于1,所述通信请求的优先级为数据量与优先级权重之积。本实施例通过增加未构建空闲链路的通信请求的优先级权重,能够保证本轮未发送的通信请求,在下轮优先进行空闲链路构建,优先发送。
在其中一个实施例中,所述确定所述通信请求的优先级的高低,包括:按照通信请求的数据量的大小确定通信请求的优先级的高低;或,按照通信请求的源地址或目标地址的等级确定通信请求的优先级的高低;或,按照通信请求的发送时间的先后确定通信请求的优先级的高低。
在其中一个实施例中,所述单向环形链路为,具有多组光输入输出端口的多个处理设备,和用于动态可配置地连接至少部分的所述多个处理设备的输入输出端口的BENES光交换装置,组成的环形互连网络拓扑结构。其中,环形互连网络拓扑结构包括单相环形互连网络拓扑结构和双向环形互连网络拓扑结构。
具体的,如图3和图4所示,处理设备也为图中的节点,一个处理设备可包括四组光输入输出端口,当然,处理设备的输入输出端口组数根据调控粒度和通信带宽的构建成本确定,例如,4组25Gbps端口的组网和1组100Gbps端口的组网,带宽相同,但前者以其更加灵活的链路调配,要优于后者。BENES光交换装置输入口和输出口根据节点的数目确定,如果是一个节点,则BENES光交换装置设置1个输入口和1个输出口,如果是8个节点,如图4所示,则BENES光交换装置设置8个输入口和8个输出口。
在其中一个实施例中,接入单向环形链路中的处理设备的输入端口可为多个而输入端口为1个,此时节点与节点之间的连接为非对称链路,如图5和图6 所示,那么一个节点与另一个节点之间可能有多个相同的信号发送通信链路、而只有一个信号反馈通信链路,如图7所示,节点3与节点5之间存在3条相同的信号发送通信链路,只存在一条信号反馈通信链路。其中,对于已经构建完毕的非对称链路,以图7中的节点3到节点5举例,从节点3到节点5存在3 条点对点链路,从节点5到节点3存在1条点对点链路,使用数据链路层链路聚合的方式,以数据包为基本单元,平均分配待发送的数据包到三条点对点链路上,而应答数据包仅以Ethernet以太网帧格式举例,数据包通常为1500字节,通过1条点对点链路回传,注意到数据包长度远超应答包长度,而应答包仅占 64字节,因此尽管数据包和应答包数量相同,其带宽需求是不相同的,因此以上非对称链路的构建会提高应答包所在链路的利用率(即从节点5到节点3的点对点链路)。在以太网协议中,应答包的带宽需求仅为数据包的64/1500=4.2%,这意味着为应答包单独分配点对点连接并不划算,并且在超短距传输且在网节点数目固定的前提下,丢包和包损坏变成了小概率事件,且数据包乱序到达会被控制在非常小的限度内,这使得对应答包的时效性要求可以大幅放宽。因此,绝大多数场景下,只构建单向通信的点对点链路,令反馈通信链路复用当前已有的环形链路传输,是经济的。
在其中一个实施例中,BENES光交换装置需要独立的控制电路用于收集全局流量信息并进行重构决策,因此需要构建全部节点到控制电路的通路。这里,控制电路可以是定制的ASIC芯片、FPGA芯片或是某一个接入网络的计算节点,本发明不限定于此。本发明采用单向环形链路为基底,配合定制的链路层控制协议,可保证每个节点均可在有限时延内完成与控制电路的通信,获取当前全局路由信息并对下一次重构的时间及重构后的路由信息达成共识。由于与数据链路共享物理层通路,因此定制链路层控制协议并不会限定仅能运行在单向环形链路基底上,而是会根据当前路由信息,复用剩余M-1个BENES光交换装置中已经搭建好的点对点通路来减少数据报文转发,达到提升性能的目的。因此,在实际操作中,使用单向环形链路基底通常拥有更大的性能优化空间。
在其中一个实施例中,上述单向环形链路配合定制的链路层控制协议,可保证每个节点均可在有限时延内完成与控制电路的通信,获取当前全局路由信息并对下一次空闲链路的时间及构建后的空闲链路的路由信息达成共识。当链路负载逐渐提升,直到某一条链路需要承载的数据流量大于其物理承载量,或是存在两个节点需要跨越数个转发节点通信并存在持续的通信请求时,利用定制的链路层控制协议通知控制电路,汇报自身当前的通信请求。控制电路收到通信请求后,根据汇报的通信请求数据量的大小,为其划定优先级并将其送入优先队列。在当前空闲链路可通过一次重构满足通信请求时,优先满足高优先级的通信请求;未能在本轮满足的通信请求会对其增加优先级权重,使其在下一次重构时有更大可能被满足。如此,对于任意两个节点间产生的突发数据传输,剩余的M-1个BENES光交换装置根据需要临时建立节点与节点间的点对点连接,或与指定一个节点建立多路单向点对点连接提升带宽,从而实现非对称链路的构建。
上述处理设备通信互连方法,当整个系统的互连链路可重构时,可结合重构特性和链路聚合提高效率实现高利用率的互连系统,当重构足够及时,就能满足:当出现单边通信满载需求时,在两个节点间构建合适的非对称物理链路,如此,在提高链路利用率的同时,剩余未利用的物理链路可用于和其它节点构建连接,实现更好的互连性能;在大数据量通信需求结束后,可通过重构链路动态释放掉其占用的链路资源,并动态调配至其余缺口处,实现用更少的物理链路达成相近的互连性能,提高链路的利用率。本发明可在物理层构建出非对称的双向链路,使得全部接入节点达成与常规对称双向链路相似的互连性能和吞吐量的同时,降低对每个节点输入输出接口数量要求;或是在接口数量相同时,提升系统总吞吐量。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种处理设备通信互连装置,包括:
通信请求获取模块210,用于获取单向环形链路中每个处理设备的通信请求;
优先级确定模块220,用于确定所述通信请求的优先级的高低;
空闲链路构建模块230,用于根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;
通信数据发送模块240,用于处理设备通过空闲链路发送所述通讯请求对应的通信数据。
在其中一个实施例中,所述通信请求包括源地址、目的地址、数据量。所述空闲链路构建模块230,包括:地址获取单元,用于获取优先级最高的通信请求,确定该通信请求的源地址、目的地址;空闲链路构建单元,用于根据该通信请求的源地址、目的地址从单向环形链路中选取距离最近的节点的空闲状态的端口构建的空闲链路,并对空闲链路中各节点的相应端口进行锁定;其中,节点的端口状态包括空闲状态和锁定状态。
在其中一个实施例中,处理设备通信互连装置还包括:释放模块,用于对空闲链路中各节点已经完成通信数据发送的端口进行释放;其中,释放后的节点的端口为空闲状态。
在其中一个实施例中,所述空闲链路构建模块230,还用于依次对未构建空闲链路的当前优先级最高的通信请求选取节点的空闲状态的端口,构建空闲链路;通信数据发送模块240,还用于在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据。
在其中一个实施例中,处理设备通信互连装置还包括:优先级权重提高模块,在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据之后,对未构建空闲链路的通信请求,提高优先级权重;其中,所述优先级权重大于1,所述通信请求的优先级为数据量与优先级权重之积。
在其中一个实施例中,所述优先级确定模块220,还用于按照通信请求的数据量的大小确定通信请求的优先级的高低;或,还用于按照通信请求的源地址或目标地址的等级确定通信请求的优先级的高低;或,还用于按照通信请求的发送时间的先后确定通信请求的优先级的高低。
在其中一个实施例中,,所述单向环形链路为,具有多组光输入输出端口的多个处理设备,和用于动态可配置地连接至少部分的所述多个处理设备的输入输出端口的BENES光交换装置,组成的环形互连网络拓扑结构。
关于处理设备通信互连装置的具体限定可以参见上文中对于处理设备通信互连方法的限定,在此不再赘述。上述处理设备通信互连装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种用于上述实施例所述处理设备通信互连方法的处理设备通信互连系统,包括:多个处理设备,具有多组光输入输出端口; BENES光交换装置,用于动态可配置地连接至少部分的所述多个处理设备的输入输出端口;控制电路,与所述处理设备和BENES光交换装置连接,用于获取单向环形链路中每个处理设备的通信请求,确定所述通信请求的优先级的高低,并根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述多个处理设备和所述BENES光交换装置组成环形互连网络拓扑结构。
在其中一个实施例中,所述BENES光交换装置的数量与每个处理设备所具有的输入输出端口数量相同。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储空闲链路和节点的空闲状态的端口数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种处理设备通信互连方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory, SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种处理设备通信互连方法,其特征在于,所述方法包括:
获取单向环形链路中每个处理设备的通信请求;
确定所述通信请求的优先级的高低;
根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;
处理设备通过空闲链路发送所述通讯请求对应的通信数据。
2.根据权利要求1所述的处理设备通信互连方法,其特征在于,所述通信请求包括源地址、目的地址、数据量;
所述根据通信请求的优先级节点的空闲状态的端口,构建空闲链路,包括:
获取优先级最高的通信请求,确定该通信请求的源地址、目的地址;
根据该通信请求的源地址、目的地址从单向环形链路中选取距离最近的节点的空闲状态的端口构建的空闲链路,并对空闲链路中各节点的相应端口进行锁定;其中,节点的端口状态包括空闲状态和锁定状态。
3.根据权利要求2所述的处理设备通信互连方法,其特征在于,在处理设备通过空闲链路发送所述通讯请求对应的通信数据之后,包括:
对空闲链路中各节点已经完成通信数据发送的端口进行释放;其中,释放后的节点的端口为空闲状态。
4.根据权利要求1所述的处理设备通信互连方法,其特征在于,所述根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路包括:
依次对未构建空闲链路的当前优先级最高的通信请求选取节点的空闲状态的端口,构建空闲链路;
所述处理设备通过空闲链路发送所述通讯请求对应的通信数据包括:
在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据。
5.根据权利要求4所述的处理设备通信互连方法,其特征在于,在选取的节点的空闲状态的端口不能构建空闲链路时,对已经构建空闲链路的通信请求,处理设备通过空闲链路发送所述通讯请求对应的通信数据之后,包括:
对未构建空闲链路的通信请求,提高优先级权重;其中,所述优先级权重大于1,所述通信请求的优先级为数据量与优先级权重之积。
6.根据权利要求1所述的处理设备通信互连方法,其特征在于,所述确定所述通信请求的优先级的高低,包括:
按照通信请求的数据量的大小确定通信请求的优先级的高低;或,
按照通信请求的源地址或目标地址的等级确定通信请求的优先级的高低;或,
按照通信请求的发送时间的先后确定通信请求的优先级的高低。
7.根据权利要求1所述的处理设备通信互连方法,其特征在于,所述单向环形链路为,具有多组光输入输出端口的多个处理设备,和用于动态可配置地连接至少部分的所述多个处理设备的输入输出端口的BENES光交换装置,组成的环形互连网络拓扑结构。
8.一种处理设备通信互连装置,其特征在于,所述装置包括:
通信请求获取模块,用于获取单向环形链路中每个处理设备的通信请求;
优先级确定模块,用于确定所述通信请求的优先级的高低;
空闲链路构建模块,用于根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;其中,所述节点包括处理设备,处理设备具有多个光输入输出端口;
通信数据发送模块,用于处理设备通过空闲链路发送所述通讯请求对应的通信数据。
9.一种用于权利要求1-7任一项所述处理设备通信互连方法的处理设备通信互连系统,其特征在于,包括:
多个处理设备,具有多个光输入输出端口;
BENES光交换装置,用于动态可配置地连接至少部分的所述多个处理设备的输入输出端口;
控制电路,与所述处理设备和BENES光交换装置连接,用于获取单向环形链路中每个处理设备的通信请求,确定所述通信请求的优先级的高低,并根据通信请求的优先级选取节点的空闲状态的端口,构建空闲链路;
其中,所述多个处理设备和所述BENES光交换装置组成环形互连网络拓扑结构。
10.根据权利要求9所述的处理设备通信互连系统,其特征在于,所述BENES光交换装置的数量与每个处理设备所具有的输入输出端口数量相同。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210664937.3A CN115297065B (zh) | 2022-06-13 | 2022-06-13 | 处理设备通信互连方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210664937.3A CN115297065B (zh) | 2022-06-13 | 2022-06-13 | 处理设备通信互连方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115297065A true CN115297065A (zh) | 2022-11-04 |
CN115297065B CN115297065B (zh) | 2024-03-15 |
Family
ID=83821095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210664937.3A Active CN115297065B (zh) | 2022-06-13 | 2022-06-13 | 处理设备通信互连方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115297065B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2255298A1 (en) * | 1998-12-04 | 2000-06-04 | Pmc-Sierra Ltd. | Communication method for packet switching systems |
WO2000069106A1 (en) * | 1999-05-06 | 2000-11-16 | Net Insight Ab | Synchronization method and apparatus |
US6631134B1 (en) * | 1999-01-15 | 2003-10-07 | Cisco Technology, Inc. | Method for allocating bandwidth in an optical network |
US20100027998A1 (en) * | 2008-07-31 | 2010-02-04 | Nortel Networks Limited | Optical roundabout switch |
CN101778049A (zh) * | 2010-03-04 | 2010-07-14 | 南京大学 | 包-电路交换片上路由器及其传输方法 |
CN107742924A (zh) * | 2017-11-08 | 2018-02-27 | 江苏第二师范学院 | 智能电网接入分布式自适应节点及系统 |
CN114614898A (zh) * | 2022-03-28 | 2022-06-10 | 中国科学院计算技术研究所 | 一种环形拓扑网络及其构建方法、数据转发方法 |
-
2022
- 2022-06-13 CN CN202210664937.3A patent/CN115297065B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2255298A1 (en) * | 1998-12-04 | 2000-06-04 | Pmc-Sierra Ltd. | Communication method for packet switching systems |
US6631134B1 (en) * | 1999-01-15 | 2003-10-07 | Cisco Technology, Inc. | Method for allocating bandwidth in an optical network |
WO2000069106A1 (en) * | 1999-05-06 | 2000-11-16 | Net Insight Ab | Synchronization method and apparatus |
US20100027998A1 (en) * | 2008-07-31 | 2010-02-04 | Nortel Networks Limited | Optical roundabout switch |
CN101778049A (zh) * | 2010-03-04 | 2010-07-14 | 南京大学 | 包-电路交换片上路由器及其传输方法 |
CN107742924A (zh) * | 2017-11-08 | 2018-02-27 | 江苏第二师范学院 | 智能电网接入分布式自适应节点及系统 |
CN114614898A (zh) * | 2022-03-28 | 2022-06-10 | 中国科学院计算技术研究所 | 一种环形拓扑网络及其构建方法、数据转发方法 |
Non-Patent Citations (1)
Title |
---|
胡卫生: "自动交换光网络中的节点技术", 电信科学, no. 09 * |
Also Published As
Publication number | Publication date |
---|---|
CN115297065B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9332323B2 (en) | Method and apparatus for implementing a multi-dimensional optical circuit switching fabric | |
US7295519B2 (en) | Method of quality of service based flow control within a distributed switch fabric network | |
US9825844B2 (en) | Network topology of hierarchical ring with recursive shortcuts | |
US20200296043A1 (en) | Data transmission method, related apparatus, and network | |
CN106713177A (zh) | 一种多控制器的wmSDN组网方法 | |
CN104639437A (zh) | 堆叠系统中广播报文的转发方法及装置 | |
CN110932920B (zh) | 一种网络拓扑结构 | |
Cevher et al. | A fault tolerant software defined networking architecture for integrated modular avionics | |
CN110995607A (zh) | 一种传输流量的方法、装置、网络设备及存储介质 | |
Zhu et al. | Efficient hybrid multicast approach in wireless data center network | |
CN116886591B (zh) | 计算机网络系统及路由方法 | |
CN112217652B (zh) | 一种基于中心通信模式的网络拓扑装置及方法 | |
CN115514651B (zh) | 基于软件定义层叠网的云边数据传输路径规划方法及系统 | |
CN115297065A (zh) | 处理设备通信互连方法、装置、计算机设备和存储介质 | |
CN113179228B (zh) | 一种提高交换机堆叠可靠性的方法、装置、设备及介质 | |
CN110719183B (zh) | 实时软件定义工业网络传输优先级动态调整方法与系统 | |
Li et al. | Multicast scheduling algorithm in software defined fat-tree data center networks | |
CN115499271B (zh) | 一种混合网络拓扑结构及其路由方法 | |
Zhang et al. | Optical Interconnection Network Based on Distributed Switching for Data Center Application | |
US20040131065A1 (en) | Distributed switch fabric network and method | |
CN116055426B (zh) | 用于多绑定模式下流量卸载转发的方法、设备及介质 | |
US11765103B2 (en) | Large-scale network with high port utilization | |
Ghosal et al. | Routing in multicore nocs | |
Zhang et al. | Bandwidth scheduling with flexible multi-paths in high-performance networks | |
KR100903130B1 (ko) | 메쉬 타입 온 칩 네트워크의 스위치 및 스위칭 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |