CN103825845A - 基于矩阵分解的可重配置voq结构交换机分组调度算法 - Google Patents
基于矩阵分解的可重配置voq结构交换机分组调度算法 Download PDFInfo
- Publication number
- CN103825845A CN103825845A CN201410098050.8A CN201410098050A CN103825845A CN 103825845 A CN103825845 A CN 103825845A CN 201410098050 A CN201410098050 A CN 201410098050A CN 103825845 A CN103825845 A CN 103825845A
- Authority
- CN
- China
- Prior art keywords
- matrix
- row
- permutation
- column
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公布了一种基于矩阵分解的可重配置虚拟输出排队VOQ结构交换机分组调度算法。可重配置分组交换机由于重配置时延相对较大,从而引起了交换机中分组累积的现象。本发明首先将业务到达的双随机矩阵分解为有限数量的置换矩阵,提出了分解的充分且必要条件是不存在任意两个输入端口只有去往同一输出端口的分组,由此提出一种新的矩阵分解方法及置换矩阵元素提取方法。然后提出了选择占用最大的置换矩阵作为匹配矩阵的调度方法p-LQF。与典型的方法比较,本发明具有更好的时延特性及更小的复杂度。同时理论证明本发明算法对于符合强大数定理的可接入分组到达可得到100%的通过率。
Description
技术领域
本发明属于输入排队结构分组交换机分组调度技术领域。
背景技术
本发明中的可重配置VOQ交换机是指每一次交换时交换机的输入输出端口进行重新配置,而重配置过程带来了较大的时延。例如采用电存储光交换混合结构的微电子机械系统(MEMS,micro-electro-mechanicalsystems)实现的光电混合虚拟输出排队(VOQ,VirtualOutputQueuing)结构交换机,在VOQ缓存器与交换介质(switchingfabric)之间进行电/光转换,在交换介质与输出端口之间进行光/电转换。MEMS光交换机端口重配置(reconfiguration)时间比电交换长得多。出于传输效率的考虑,输入输出端口的匹配不可能像电交换机每个时隙更新一次,而要在多个时隙中重复使用,因此光交换机中的分组调度的基本特点是基于帧的。在帧开始的边界上确定端口匹配,进行光路配置,再传输分组。交换机的内部传输需要F/T的加速比(speedup),其中帧长F=C+T,C和T分别为重配置及传输时间。
目前已有的调度算法可分为固定帧长和可变帧长两类。在固定帧长的算法研究中,有研究根据一帧开始时各VOQ队列的长度,直接采用电交换机中的最长队列优先(LongestQueueFirst,LQF)算法。该算法可以获得较低的平均分组时延,但复杂度高达O(N3),不易实际实现。也有研究讨论了基于帧开始前m个时隙的最大、极大以及多重迭代等加权匹配算法。上述方法是一次确定一个帧中的匹配关系。还有研究讨论了一次确定多个帧的批量调度(batch-scheduling)极大匹配法。这种方法虽然可以提高通过率,但这些帧中到达的分组需要在调度前进行累积,导致较大的分组时延。
在可变帧长调度算法研究中,有研究讨论了改进的尽力服务双轮询匹配EDRRM(ExhaustiveServiceDualRoundRobinMatching)算法。当在帧边界更新匹配关系时,原来匹配的输入输出端口若没有找到新的匹配端口,则依然保持连接。也有研究提出了一种确保分组时延的可变帧长的批量调度算法DOUBLE。该算法首先对到达的分组进行累积,得到各端口的传输需求矩阵,将所得需求矩阵分解得到非完全匹配的疏、密矩阵及相应的权重。所得疏、密矩阵作为一帧中的匹配矩阵,且帧长正比于其权重。为确保时延,分组累积的时间必须足够长,因此该算法的平均分组时延很大。
由于干线交换机通常采用MPLS(multipleprotocollabelswitch)或者EF(expeditedforwarding)机制进行流量控制,能够预先获得传输需求。因此采用基于矩阵分解的调度方法是现实可行的。本发明提出了一种新的基于矩阵分解的p-LQF(permutationbasedlargestqueuefirst)算法,通过对业务矩阵的分解得到完全匹配的置换矩阵(permutationmatrix);根据置换矩阵对应的各VOQ队长之和,在线调度置换矩阵。
发明内容
本发明的目的是提供可重配置VOQ结构交换机中平均分组时延更低且复杂度较小的分组调度算法。
为实现上述目的,本发明采用的技术路线为:
第一步矩阵分解
本发明提供固定帧长的调度算法,每个输入端口一个时隙最多只有一个分组到达,输入输出端口之间在重配置期间不能传输分组,而在传输期间以F/T的加速比传输分组。到达的分组长度固定,且为可接入到达。即令λij为输入端口i往输出端口j的分组的平均到达速率,则以及则交换机各输入端口业务平均到达速率矩阵[λij]为“双随机”(doublystochastic)矩阵。
由Birkhoff定理(BirkhoffG.Tresobservacionessobreelalgebralineal[J].UnivNacTucumanRevSerA,1946(5):147-151)可知,任意双随机矩阵均可分解出最多N2-2N+2个置换矩阵。目前常采用基于最大流的分解方法,计算复杂度为O(N2.5)。本发明提供两种更简单的分解方法。
从端口匹配的角度来看,业务矩阵能分解为置换矩阵的充分且必要条件是,不存在任意两个输入端口只有去往同一输出端口的分组;反之亦然。对于所有元素均不为零的矩阵,显然可以任意选取不同行和列中的元素,构成一个置换矩阵。
由于双随机矩阵总能分解出置换矩阵,因此一种直观的方法就是,每次选取H+L最小的元素,其中H和L分别表示一般意义上矩阵中行和列中不为零的元素的个数,使得被删除的该元素所在的行和列包含的零元素最多。实际上,H+L最小的要求过于苛刻,可以有所放松以减少计算时间。本发明提供了两种双随机置换矩阵分解的方法。
第二步p-LQF调度算法
不同于已有的基于矩阵分解的算法,p-LQF算法不是根据矩阵的权重来在线调用矩阵,而是选择队长最大的置换矩阵作为匹配矩阵,以适应分组的动态到达。对于一个N×N端口的交换机,令Qi,j表示VOQi,j的队长,i,j=1,…,N;Bk表示置换矩阵Πk的队长,1≤k≤K,K为置换矩阵的数目;表示Πk中的元素,1表示输入端口i与输出端口j匹配,0表示未匹配。
本发明的有益效果:本发明提供了两种复杂度更低的双随机矩阵分解为置换矩阵的分解方法,并通过了新的最大占用优先的置换矩阵调度算法。通过与典型调度算法的比较显示,本发明算法的平均分组时延低于主流的i-LQF算法,接近甚至低于目前时延性能最好的LQF算法,但复杂度低于LQF算法。由于其在线实现过程无需迭代和排序,只需找到极大值,实际计算时间低于i-LQF算法。另外,p-LQF可以提供带宽的保证,这是i-LQF所不能的。同时理论证明本发明算法对于符合强大数定理的可接入分组到达可得到100%的通过率,以及对于对分组动态到达和业务矩阵量化具有良好的适应能力。
附图说明
图1是虚拟输出排队(VOQ)结构交换机原理图;
图2是基于MEMS结构说明的本发明算法的分组调度过程;
图3是均匀Bernoulli业务下分组平均时延对比;
图4是非均匀Bernoulli业务下分组平均时延对比;
图5是对角线Bernoulli业务下分组平均时延对比;
图6是均匀ON/OFF业务下分组平均时延对比;
图7是非均匀ON/OFF业务下分组平均时延对比;
图8是对角线ON/OFF业务下分组平均时延对比。
具体实施方式
图1给出了VOQ结构分组交换机的框图,图2给出了以MEMS结构交换机为例的本发明调度算法的实施过程。本发明采用基于帧的调度算法,交换结构重置对应于输入缓存中的分组不能离开输入端口,从而导致分组累积。在无线网络中对应多种原因等效于输出信道失效而引起的分组累积。
步骤1矩阵分解
对于一个N×N的双随机矩阵M,其中每一行和每一列之和均等于一个常数P。Hi和Lj分别表示矩阵中第i行和第j列中不为零的元素的个数,另外,H和L表示非特定的一般意义上的行和列中不为零的元素的个数。为叙述方便,约定文中所述某个元素的H或L的含义为该元素所在行或列中不为零的元素的个数。例如,式(1)给出了P为8的4×4双随机业务矩阵的例子。矩阵右边及下面的数字分别表示对应的行和列中不为零的元素的数目,即{Hi}={4,3,3,4},{Lj}={3,3,4,4},其中1≤i,j≤4。
则可以把M分解为以下8个置换矩阵:
显然,第7个矩阵与第8个矩阵相同,则业务矩阵可以表示为:
M=P1+P2+P3+P4+P5+P6+2P7 (2)
其中Pk表示分解出的第k个置换矩阵。调度时根据每个置换矩阵的权重选择使用的匹配矩阵。
对于一个N×N阶的双随机矩阵M,其中每一行和每一列之和均等于一个常数L。Hi和Lj分别表示矩阵中第i行和第j列中不为零的元素的个数,另外,H和L表示非特定的一般意义上的行和列中不为零的元素的个数。为叙述方便,约定文中所述某个元素的H或L的含义为该元素所在行或列中不为零的元素的个数。例如,式(3.5)给出了L为8的4×4双随机业务矩阵的例子。矩阵右边及下面的数字分别表示对应的行和列中不为零的元素的数目,即{Hi}={4,3,3,4},{Lj}={3,3,4,4},其中1≤i,j≤4。
矩阵分解法-1
第1步计算矩阵M的Hi和Lj,1≤i,j≤N。
第2步找到最小的H或最小的L,提取该行或该列中的其所在列或行的L或H值最小的元素Emin,删除其所在行和列。若有多个可选元素,任意选取一个。
第3步若矩阵中存在未被删除的行和列,转入第2步。
第5步若M中有不为零的元素,转入第1步;否则结束。
上述矩阵分解法中的第2步决定了整个算法的复杂度。对算法1中的第2步可以采用一种较为快捷的算法。
置换矩阵元素提取方法
第1步首先交换M中的行,依Hi(i=1,…,N)从大到小排列各行,即H1最大,且任意排列具有相同H的行。然后依照同样的方法排列各列,即L1最大,得到矩阵M。同时对于矩阵M,不失一般性,假设在第N行选取Emin,删除第N行及相应的第k列(1≤k≤N),得到一个(N-1)×(N-1)剩余矩阵Mˊ。
第2步
1)若HN=LN=N,N为当前矩阵的维数,则任意选取不同行和列上的元素,例如直接选取对角线上的元素,分解结束。
2)若min{Hi}=1和/或min{Lj}=1,其中i,j=1,…,N,直接选取H和/或L=1的元素。
3)若1)和2)中的情况均不出现,由min{H N ,L N }的值,第N行或第N列最右边或最下面第一个
不为零的元素即为Emin。实际上,由上面的证明可知,可以直接选取第N行或第N列,而无须比较H N 和L N 的大小。
第3步删除Emin所在行和列得到Mˊ。由于L值的变化只取0或1,则:
1)所有L=N的行的位置保持不动,且L减1。
2)Emin所在列元素为零的行位置不动,且L值不变。
3)Emin所在列不为零的元素所在行的L值减1,与其上面的相邻行的值比较排序。排序过程从上往下进行。采用具有N个寄存单元的寄存器记录具有相同L值的行的数目,则最多只需N-2-L次比较即可确定Mˊ中各行的位置关系,L表示寄存器中不为零的单元的数目。同样的方法确定各列的位置关系。
在置换矩阵元素提取算法中,若存在多种选择则可以采用随机选取的方式,也可以依照某种要求来选取。例如为减少所得置换矩阵的数量,尽量选取数值较大的元素,使得的值较大。采用这种方式对式(3)所示矩阵M进行分解,得到式(4)所示置换矩阵。式中每一行表示一个置换矩阵,行中第j个元素表示第j个输入端口与该元素表示的输出端口匹配。
矩阵分解法-2
本发明提供的第2种矩阵分解的方法具体如下:
第2步在中寻找一个不为0的元素,该元素所在的行和列中不为0的元素个数最少,然后将中该元素所在的行与列的所有元素置0。重复上面过程,直到寻找出所有N个元素为止。该N个元素构成一个N×N置换矩阵。例如在式(5)中找到的相应元素分别为 得到相应的置换矩阵为
用M减去所得置换矩阵,得到的矩阵再次构造观察矩阵,循环执行第一步和第二步的操作,直到最后得到的M所有元素都为0,跳出循环。
第3步所得置换矩阵中若有相同者,保留其中一个,其余的删除。
步骤2p-LQF调度算法
本发明的p-LQF算法选择队长最大的置换矩阵作为匹配矩阵,以适应分组的动态到达。对于一个N×N端口的交换机,令Qi,j表示VOQi,j的队长,i,j=1,…,N;Bk表示置换矩阵Πk的队长,1≤k≤K,K为置换矩阵的数目;表示Πk中的元素,1表示输入端口i与输出端口j匹配,0表示未匹配。
p-LQF在线调度算法
第1步采用算法1得到所有置换矩阵Πk。
第2步计算各
第3步选择Πm[Πm|Bm=max(Bk,1≤k≤K)]作为当前帧的匹配矩阵。
图3到图4分别说明了本发明算法与其它典型算法在Bernoulli业务下分组平均时延的对比,图5到图7给出了Bernoulli业务下分组平均时延的对比,其中图2给出了F,T和C之间的关系。
Claims (4)
2.根据权利要求1所述的置换矩阵元素提取方法,其特征是:
第1步首先交换M中的行,依Hi(i=1,…,N)从大到小排列各行,即H1最大,且任意排列具有相同H的行;然后依照同样的方法排列各列,即L1最大,得到矩阵M;同时对于矩阵M,不失一般性,假设在第N行选取Emin,删除第N行及相应的第k列(1≤k≤N),得到一个(N-1)×(N-1)剩余矩阵Mˊ;
第2步
1)若HN=LN=N,N为当前矩阵的维数,则任意选取不同行和列上的元素,例如直接选取对角线上的元素,分解结束;
2)若min{Hi}=1和/或min{Lj}=1,其中i,j=1,…,N,直接选取H和/或L=1的元素;
3)若1)和2)中的情况均不出现,由min{H N ,L N }的值,第N行或第N列最右边或最下面第一个不为零的元素即为Emin;实际上,由上面的证明可知,可以直接选取第N行或第N列,而无须比较H N 和L N 的大小;
第3步删除Emin所在行和列得到Mˊ;由于L值的变化只取0或1,则:
1)所有L=N的行的位置保持不动,且L减1;
2)Emin所在列元素为零的行位置不动,且L值不变;
3)Emin所在列不为零的元素所在行的L值减1,与其上面的相邻行的值比较排序;排序过程从上往下进行;采用具有N个寄存单元的寄存器记录具有相同L值的行的数目,则最多只需N-2-L次比较即可确定Mˊ中各行的位置关系,L表示寄存器中不为零的单元的数目;同样的方法确定各列的位置关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410098050.8A CN103825845A (zh) | 2014-03-17 | 2014-03-17 | 基于矩阵分解的可重配置voq结构交换机分组调度算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410098050.8A CN103825845A (zh) | 2014-03-17 | 2014-03-17 | 基于矩阵分解的可重配置voq结构交换机分组调度算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103825845A true CN103825845A (zh) | 2014-05-28 |
Family
ID=50760681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410098050.8A Pending CN103825845A (zh) | 2014-03-17 | 2014-03-17 | 基于矩阵分解的可重配置voq结构交换机分组调度算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103825845A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106357555A (zh) * | 2016-09-26 | 2017-01-25 | 北京航空航天大学 | 一种基于业务均衡的cicq结构分组调度算法 |
CN110011934A (zh) * | 2019-03-15 | 2019-07-12 | 浙江大学 | 一种用于输入队列交换机的混合队列架构与混合调度方法 |
CN111131064A (zh) * | 2019-12-31 | 2020-05-08 | 电子科技大学 | 数据中心网络中多播流调度方法 |
CN113556296A (zh) * | 2021-05-27 | 2021-10-26 | 阿里巴巴新加坡控股有限公司 | 调度方法、装置、电子设备和存储介质 |
CN116126548A (zh) * | 2023-04-20 | 2023-05-16 | 广东赛昉科技有限公司 | 一种在npu中减少资源占用的方法、系统、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040120337A1 (en) * | 2002-12-24 | 2004-06-24 | Jong-Arm Jun | Scalable crossbar matrix switch and arbitration method thereof |
CN103152281A (zh) * | 2013-03-05 | 2013-06-12 | 中国人民解放军国防科学技术大学 | 基于两级交换的负载均衡调度方法 |
-
2014
- 2014-03-17 CN CN201410098050.8A patent/CN103825845A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040120337A1 (en) * | 2002-12-24 | 2004-06-24 | Jong-Arm Jun | Scalable crossbar matrix switch and arbitration method thereof |
CN103152281A (zh) * | 2013-03-05 | 2013-06-12 | 中国人民解放军国防科学技术大学 | 基于两级交换的负载均衡调度方法 |
Non-Patent Citations (2)
Title |
---|
熊庆旭 等: "基于矩阵分解的光交换机分组调度算法", 《通信学报》 * |
熊庆旭 等: "基于累积效应的光交换机分组调度算法", 《北京航空航天大学学报》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106357555A (zh) * | 2016-09-26 | 2017-01-25 | 北京航空航天大学 | 一种基于业务均衡的cicq结构分组调度算法 |
CN110011934A (zh) * | 2019-03-15 | 2019-07-12 | 浙江大学 | 一种用于输入队列交换机的混合队列架构与混合调度方法 |
CN110011934B (zh) * | 2019-03-15 | 2020-09-15 | 浙江大学 | 一种用于输入队列交换机的混合队列架构的混合调度方法 |
CN111131064A (zh) * | 2019-12-31 | 2020-05-08 | 电子科技大学 | 数据中心网络中多播流调度方法 |
CN111131064B (zh) * | 2019-12-31 | 2021-12-28 | 电子科技大学 | 数据中心网络中多播流调度方法 |
CN113556296A (zh) * | 2021-05-27 | 2021-10-26 | 阿里巴巴新加坡控股有限公司 | 调度方法、装置、电子设备和存储介质 |
CN116126548A (zh) * | 2023-04-20 | 2023-05-16 | 广东赛昉科技有限公司 | 一种在npu中减少资源占用的方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103825845A (zh) | 基于矩阵分解的可重配置voq结构交换机分组调度算法 | |
CN105429909A (zh) | 一种基于复色的并行交换调度方法 | |
CN104202188A (zh) | 一种采用遗传算法进行afdx网络路径优化的方法 | |
CN115333956B (zh) | 一种多联盟非合作博弈的多智能体状态控制方法 | |
Navaridas et al. | Reducing complexity in tree-like computer interconnection networks | |
CN102946443B (zh) | 一种实现大规模数据传输的多任务调度方法 | |
Bedogne et al. | Complex growing networks with intrinsic vertex fitness | |
CN102184088A (zh) | 一种基于串并结合实现有限域乘法的方法及装置 | |
CN108880782A (zh) | 一种云计算平台下最小值的保密计算方法 | |
CN112395549A (zh) | 一种用于矩阵乘法密集型算法的可重构矩阵乘法加速系统 | |
WO2017185935A1 (zh) | 消息发送、接收方法及装置、基站 | |
Zhang et al. | Reco: Efficient regularization-based coflow scheduling in optical circuit switches | |
CN107770104A (zh) | 一种基于压缩感知的信道估计导频优化方法与装置 | |
CN103944748A (zh) | 基于遗传算法的网络关键节点的自相似流量生成简化方法 | |
CN103873120B (zh) | 一种基于宽度优先搜索的多天线系统并行检测方法 | |
CN105790808B (zh) | 一种面向mimo检测的可重构阵列架构及其检测方法 | |
CN100356726C (zh) | 用于设计数据网络的方法和设备 | |
CN105190599A (zh) | 云应用带宽建模 | |
CN103051586B (zh) | 16-QAM Golay互补序列集生成装置 | |
CN111626410A (zh) | 一种稀疏卷积神经网络加速器及计算方法 | |
CN113992535B (zh) | 一种网络可靠性评估方法、装置、电子设备 | |
CN110166372B (zh) | 在基于光电路交换机的数据中心中的在线调度协流的方法 | |
CN106230755A (zh) | 一种mimo系统信道估计方法和装置 | |
Zhu et al. | Optimization of convolutional neural network hardware structure based on FPGA | |
CN103888385A (zh) | 基于分组累积效应的voq交换机分组调度算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140528 |