CN103825845A

CN103825845A - 基于矩阵分解的可重配置voq结构交换机分组调度算法

Info

Publication number: CN103825845A
Application number: CN201410098050.8A
Authority: CN
Inventors: 熊庆旭; 冯金鑫
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2014-03-17
Filing date: 2014-03-17
Publication date: 2014-05-28

Abstract

本发明公布了一种基于矩阵分解的可重配置虚拟输出排队VOQ结构交换机分组调度算法。可重配置分组交换机由于重配置时延相对较大，从而引起了交换机中分组累积的现象。本发明首先将业务到达的双随机矩阵分解为有限数量的置换矩阵，提出了分解的充分且必要条件是不存在任意两个输入端口只有去往同一输出端口的分组，由此提出一种新的矩阵分解方法及置换矩阵元素提取方法。然后提出了选择占用最大的置换矩阵作为匹配矩阵的调度方法p-LQF。与典型的方法比较，本发明具有更好的时延特性及更小的复杂度。同时理论证明本发明算法对于符合强大数定理的可接入分组到达可得到100%的通过率。

Description

基于矩阵分解的可重配置VOQ结构交换机分组调度算法

技术领域

本发明属于输入排队结构分组交换机分组调度技术领域。

背景技术

本发明中的可重配置VOQ交换机是指每一次交换时交换机的输入输出端口进行重新配置，而重配置过程带来了较大的时延。例如采用电存储光交换混合结构的微电子机械系统(MEMS，micro-electro-mechanicalsystems)实现的光电混合虚拟输出排队(VOQ，VirtualOutputQueuing)结构交换机，在VOQ缓存器与交换介质(switchingfabric)之间进行电/光转换，在交换介质与输出端口之间进行光/电转换。MEMS光交换机端口重配置(reconfiguration)时间比电交换长得多。出于传输效率的考虑，输入输出端口的匹配不可能像电交换机每个时隙更新一次，而要在多个时隙中重复使用，因此光交换机中的分组调度的基本特点是基于帧的。在帧开始的边界上确定端口匹配，进行光路配置，再传输分组。交换机的内部传输需要F/T的加速比(speedup)，其中帧长F=C+T，C和T分别为重配置及传输时间。

目前已有的调度算法可分为固定帧长和可变帧长两类。在固定帧长的算法研究中，有研究根据一帧开始时各VOQ队列的长度，直接采用电交换机中的最长队列优先(LongestQueueFirst,LQF)算法。该算法可以获得较低的平均分组时延，但复杂度高达O(N³)，不易实际实现。也有研究讨论了基于帧开始前m个时隙的最大、极大以及多重迭代等加权匹配算法。上述方法是一次确定一个帧中的匹配关系。还有研究讨论了一次确定多个帧的批量调度(batch-scheduling)极大匹配法。这种方法虽然可以提高通过率，但这些帧中到达的分组需要在调度前进行累积，导致较大的分组时延。

在可变帧长调度算法研究中，有研究讨论了改进的尽力服务双轮询匹配EDRRM(ExhaustiveServiceDualRoundRobinMatching)算法。当在帧边界更新匹配关系时，原来匹配的输入输出端口若没有找到新的匹配端口，则依然保持连接。也有研究提出了一种确保分组时延的可变帧长的批量调度算法DOUBLE。该算法首先对到达的分组进行累积，得到各端口的传输需求矩阵，将所得需求矩阵分解得到非完全匹配的疏、密矩阵及相应的权重。所得疏、密矩阵作为一帧中的匹配矩阵，且帧长正比于其权重。为确保时延，分组累积的时间必须足够长，因此该算法的平均分组时延很大。

由于干线交换机通常采用MPLS(multipleprotocollabelswitch)或者EF(expeditedforwarding)机制进行流量控制，能够预先获得传输需求。因此采用基于矩阵分解的调度方法是现实可行的。本发明提出了一种新的基于矩阵分解的p-LQF(permutationbasedlargestqueuefirst)算法，通过对业务矩阵的分解得到完全匹配的置换矩阵(permutationmatrix)；根据置换矩阵对应的各VOQ队长之和，在线调度置换矩阵。

发明内容

本发明的目的是提供可重配置VOQ结构交换机中平均分组时延更低且复杂度较小的分组调度算法。

为实现上述目的，本发明采用的技术路线为：

第一步矩阵分解

本发明提供固定帧长的调度算法，每个输入端口一个时隙最多只有一个分组到达，输入输出端口之间在重配置期间不能传输分组，而在传输期间以F/T的加速比传输分组。到达的分组长度固定，且为可接入到达。即令λ_ij为输入端口i往输出端口j的分组的平均到达速率，则

以及

则交换机各输入端口业务平均到达速率矩阵[λ_ij]为“双随机”(doublystochastic)矩阵。

由Birkhoff定理(BirkhoffG.Tresobservacionessobreelalgebralineal[J].UnivNacTucumanRevSerA,1946(5):147-151)可知，任意双随机矩阵均可分解出最多N²-2N+2个置换矩阵。目前常采用基于最大流的分解方法，计算复杂度为O(N^2.5)。本发明提供两种更简单的分解方法。

从端口匹配的角度来看，业务矩阵能分解为置换矩阵的充分且必要条件是，不存在任意两个输入端口只有去往同一输出端口的分组；反之亦然。对于所有元素均不为零的矩阵，显然可以任意选取不同行和列中的元素，构成一个置换矩阵。

由于双随机矩阵总能分解出置换矩阵，因此一种直观的方法就是，每次选取H+L最小的元素，其中H和L分别表示一般意义上矩阵中行和列中不为零的元素的个数，使得被删除的该元素所在的行和列包含的零元素最多。实际上，H+L最小的要求过于苛刻，可以有所放松以减少计算时间。本发明提供了两种双随机置换矩阵分解的方法。

第二步p-LQF调度算法

不同于已有的基于矩阵分解的算法，p-LQF算法不是根据矩阵的权重来在线调用矩阵，而是选择队长最大的置换矩阵作为匹配矩阵，以适应分组的动态到达。对于一个N×N端口的交换机，令Q_i,j表示VOQ_i,j的队长,i,j=1,…,N；B_k表示置换矩阵Π_k的队长,1≤k≤K,K为置换矩阵的数目;

表示Π_k中的元素，1表示输入端口i与输出端口j匹配，0表示未匹配。

本发明的有益效果：本发明提供了两种复杂度更低的双随机矩阵分解为置换矩阵的分解方法，并通过了新的最大占用优先的置换矩阵调度算法。通过与典型调度算法的比较显示，本发明算法的平均分组时延低于主流的i-LQF算法，接近甚至低于目前时延性能最好的LQF算法，但复杂度低于LQF算法。由于其在线实现过程无需迭代和排序，只需找到极大值，实际计算时间低于i-LQF算法。另外，p-LQF可以提供带宽的保证，这是i-LQF所不能的。同时理论证明本发明算法对于符合强大数定理的可接入分组到达可得到100%的通过率，以及对于对分组动态到达和业务矩阵量化具有良好的适应能力。

附图说明

图1是虚拟输出排队(VOQ)结构交换机原理图；

图2是基于MEMS结构说明的本发明算法的分组调度过程；

图3是均匀Bernoulli业务下分组平均时延对比；

图4是非均匀Bernoulli业务下分组平均时延对比；

图5是对角线Bernoulli业务下分组平均时延对比；

图6是均匀ON/OFF业务下分组平均时延对比；

图7是非均匀ON/OFF业务下分组平均时延对比；

图8是对角线ON/OFF业务下分组平均时延对比。

具体实施方式

图1给出了VOQ结构分组交换机的框图，图2给出了以MEMS结构交换机为例的本发明调度算法的实施过程。本发明采用基于帧的调度算法，交换结构重置对应于输入缓存中的分组不能离开输入端口，从而导致分组累积。在无线网络中对应多种原因等效于输出信道失效而引起的分组累积。

步骤1矩阵分解

对于一个N×N的双随机矩阵M，其中每一行和每一列之和均等于一个常数P。H_i和L_j分别表示矩阵中第i行和第j列中不为零的元素的个数，另外，H和L表示非特定的一般意义上的行和列中不为零的元素的个数。为叙述方便，约定文中所述某个元素的H或L的含义为该元素所在行或列中不为零的元素的个数。例如，式(1)给出了P为8的4×4双随机业务矩阵的例子。矩阵右边及下面的数字分别表示对应的行和列中不为零的元素的数目，即{H_i}={4,3,3,4}，{L_j}={3,3,4,4}，其中1≤i,j≤4。

M = [\begin{matrix} 3 & 2 & 2 & 1 \\ 2 & 0 & 2 & 4 \\ 0 & 4 & 2 & 2 \\ 3 & 2 & 2 & 1 \end{matrix}] - - - (1)

则可以把M分解为以下8个置换矩阵：

[\begin{matrix} 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{matrix}] - - - (1)

[\begin{matrix} 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \end{matrix}] - - - (2)

[\begin{matrix} 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \end{matrix}] - - - (3)

[\begin{matrix} 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 \end{matrix}] - - - (4)

[\begin{matrix} 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 1 & 0 & 0 \end{matrix}] - - - (5)

[\begin{matrix} 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 \end{matrix}] - - - (6)

[\begin{matrix} 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{matrix}] - - - (7)

[\begin{matrix} 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{matrix}] - - - (8)

显然，第7个矩阵与第8个矩阵相同，则业务矩阵可以表示为：

M=P¹+P²+P³+P⁴+P⁵+P⁶+2P⁷ (2)

其中P^k表示分解出的第k个置换矩阵。调度时根据每个置换矩阵的权重选择使用的匹配矩阵。

对于一个N×N阶的双随机矩阵M，其中每一行和每一列之和均等于一个常数L。H_i和L_j分别表示矩阵中第i行和第j列中不为零的元素的个数，另外，H和L表示非特定的一般意义上的行和列中不为零的元素的个数。为叙述方便，约定文中所述某个元素的H或L的含义为该元素所在行或列中不为零的元素的个数。例如，式(3.5)给出了L为8的4×4双随机业务矩阵的例子。矩阵右边及下面的数字分别表示对应的行和列中不为零的元素的数目，即{H_i}={4,3,3,4}，{L_j}={3,3,4,4}，其中1≤i,j≤4。

矩阵分解法-1

第1步计算矩阵M的H_i和L_j，1≤i,j≤N。

第2步找到最小的H或最小的L，提取该行或该列中的其所在列或行的L或H值最小的元素E_min，删除其所在行和列。若有多个可选元素，任意选取一个。

第3步若矩阵中存在未被删除的行和列，转入第2步。

第4步令

其中Π_k为分解得到的置换矩阵,

为分解Π_k时选取的N个元素中的最小值；

第5步若M中有不为零的元素,转入第1步；否则结束。

上述矩阵分解法中的第2步决定了整个算法的复杂度。对算法1中的第2步可以采用一种较为快捷的算法。

置换矩阵元素提取方法

第1步首先交换M中的行，依H_i(i=1,…,N)从大到小排列各行，即H₁最大，且任意排列具有相同H的行。然后依照同样的方法排列各列，即L₁最大，得到矩阵M。同时对于矩阵M，不失一般性，假设在第N行选取E_min，删除第N行及相应的第k列(1≤k≤N)，得到一个(N-1)×(N-1)剩余矩阵Mˊ。

第2步

1)若H_N=L_N=N,N为当前矩阵的维数，则任意选取不同行和列上的元素，例如直接选取对角线上的元素，分解结束。

2)若min{H_i}=1和/或min{L_j}=1，其中i,j=1,…,N，直接选取H和/或L=1的元素。

3)若1)和2)中的情况均不出现，由min{H_N,L_N}的值，第N行或第N列最右边或最下面第一个

不为零的元素即为E_min。实际上，由上面的证明可知，可以直接选取第N行或第N列，而无须比较H_N和L_N的大小。

第3步删除E_min所在行和列得到Mˊ。由于L值的变化只取0或1，则：

1)所有L=N的行的位置保持不动，且L减1。

2)E_min所在列元素为零的行位置不动，且L值不变。

3)E_min所在列不为零的元素所在行的L值减1，与其上面的相邻行的值比较排序。排序过程从上往下进行。采用具有N个寄存单元的寄存器记录具有相同L值的行的数目，则最多只需N-2-L次比较即可确定Mˊ中各行的位置关系，L表示寄存器中不为零的单元的数目。同样的方法确定各列的位置关系。

在置换矩阵元素提取算法中，若存在多种选择则可以采用随机选取的方式，也可以依照某种要求来选取。例如为减少所得置换矩阵的数量，尽量选取数值较大的元素，使得

的值较大。采用这种方式对式(3)所示矩阵M进行分解，得到式(4)所示置换矩阵。式中每一行表示一个置换矩阵，行中第j个元素表示第j个输入端口与该元素表示的输出端口匹配。

[\begin{matrix} 1 & 4 & 3 & 2 \\ 3 & 4 & 2 & 1 \\ 2 & 1 & 4 & 3 \\ 1 & 3 & 2 & 4 \\ 4 & 3 & 2 & 1 \end{matrix}] - - - (4)

矩阵分解法-2

本发明提供的第2种矩阵分解的方法具体如下：

第1步针对矩阵M构造相应的观察矩阵方法为若M中的m(i,j)>0,则令M中的m(i,j)为1，否则为0。例如式(1)所示M，其观察矩阵

为

\tilde{M} = [\begin{matrix} 1 & 1 & 1 & 1 \\ 1 & 0 & 1 & 1 \\ 0 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 \end{matrix}] - - - (5)

第2步在

中寻找一个不为0的元素，该元素所在的行和列中不为0的元素个数最少，然后将

中该元素所在的行与列的所有元素置0。重复上面过程，直到寻找出所有N个元素为止。该N个元素构成一个N×N置换矩阵。例如在式(5)中找到的相应元素分别为

得到相应的置换矩阵为

P^{1} = [\begin{matrix} 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{matrix}] - - - (6)

用M减去所得置换矩阵，得到的矩阵再次构造观察矩阵，循环执行第一步和第二步的操作，直到最后得到的M所有元素都为0，跳出循环。

第3步所得置换矩阵中若有相同者，保留其中一个，其余的删除。

步骤2p-LQF调度算法

本发明的p-LQF算法选择队长最大的置换矩阵作为匹配矩阵，以适应分组的动态到达。对于一个N×N端口的交换机，令Q_i,j表示VOQ_i,j的队长,i,j=1,…,N；B_k表示置换矩阵Π_k的队长,1≤k≤K,K为置换矩阵的数目;

p-LQF在线调度算法

第1步采用算法1得到所有置换矩阵Π_k。

第2步计算各

B_{k} = \underset{i, j}{Σ} Q_{i, j} π_{i, j}^{k}, 1 \leq k \leq K .

第3步选择Π_m[Π_m|B_m=max(B_k,1≤k≤K)]作为当前帧的匹配矩阵。

图3到图4分别说明了本发明算法与其它典型算法在Bernoulli业务下分组平均时延的对比，图5到图7给出了Bernoulli业务下分组平均时延的对比，其中图2给出了F,T和C之间的关系。

Claims

1.一种双随机矩阵置换分解方法，其特征是：

对于一个N×N的双随机矩阵M，其中每一行和每一列之和均等于一个常数；H_i和L_j分别表示矩阵中第i行和第j列中不为零的元素的个数；

第1步计算矩阵M的H_i和L_j，1≤i,j≤N；

第2步找到最小的H或最小的L，提取该行或该列中的其所在列或行的L或H值最小的元素E_min，删除其所在行和列；若有多个可选元素，任意选取一个；

第3步若矩阵中存在未被删除的行和列，转入第2步；

第4步令

其中Π_k为分解得到的置换矩阵,为分解Π_k时选取的N个元素中的最小值；

第5步若M中有不为零的元素,转入第1步；否则结束。

2.根据权利要求1所述的置换矩阵元素提取方法，其特征是：

第1步首先交换M中的行，依H_i(i=1,…,N)从大到小排列各行，即H₁最大，且任意排列具有相同H的行；然后依照同样的方法排列各列，即L₁最大，得到矩阵M；同时对于矩阵M，不失一般性，假设在第N行选取E_min，删除第N行及相应的第k列(1≤k≤N)，得到一个(N-1)×(N-1)剩余矩阵Mˊ；

第2步

1)若H_N=L_N=N,N为当前矩阵的维数，则任意选取不同行和列上的元素，例如直接选取对角线上的元素，分解结束；

2)若min{H_i}=1和/或min{L_j}=1，其中i,j=1,…,N，直接选取H和/或L=1的元素；

3)若1)和2)中的情况均不出现，由min{H_N,L_N}的值，第N行或第N列最右边或最下面第一个不为零的元素即为E_min；实际上，由上面的证明可知，可以直接选取第N行或第N列，而无须比较H_N和L_N的大小；

第3步删除E_min所在行和列得到Mˊ；由于L值的变化只取0或1，则：

1)所有L=N的行的位置保持不动，且L减1；

2)E_min所在列元素为零的行位置不动，且L值不变；

3)E_min所在列不为零的元素所在行的L值减1，与其上面的相邻行的值比较排序；排序过程从上往下进行；采用具有N个寄存单元的寄存器记录具有相同L值的行的数目，则最多只需N-2-L次比较即可确定Mˊ中各行的位置关系，L表示寄存器中不为零的单元的数目；同样的方法确定各列的位置关系。

3.另一种双随机矩阵置换分解方法，其特征是：

第1步针对矩阵M构造相应的观察矩阵

方法为若M中的m(i,j)>0,则令M中的m(i,j)为1，否则为0。

第2步在

中该元素所在的行与列的所有元素置0。重复上面过程，直到寻找出所有N个元素为止。该N个元素构成一个N×N置换矩阵。

4.结合权利要求1、权利要求2和权利要求3的最大占用优先的置换矩阵调度方法p-LQF算法，其特征是：

第1步采用算法1得到所有置换矩阵Π_k；

第2步计算各

1≤k≤K；其中Q_i,j表示VOQ_i,j的队长,i,j=1,…,N；B_k表示置换矩阵Π_k的队长,1≤k≤K,K为置换矩阵的数目;表示Π_k中的元素，1表示输入端口i与输出端口j匹配，0表示未匹配；

第3步选择Π_m[Π_m|B_m=max(B_k,1≤k≤K)]作为当前帧的匹配矩阵。