CN104462021A

CN104462021A - 基于高速脉动阵列及Givens变换的基向量矩阵压缩装置

Info

Publication number: CN104462021A
Application number: CN201410629496.9A
Authority: CN
Inventors: 何世文; 吴波; 黄永明; 王海明; 张军; 洪伟; 江华
Original assignee: In Jiangsu Emerging Micro-Communication Ceases Science And Technology Ltd
Current assignee: Nanjing etaco Communication Technology Co.,Ltd.
Priority date: 2014-11-11
Filing date: 2014-11-11
Publication date: 2015-03-25
Anticipated expiration: 2034-11-11
Also published as: CN104462021B

Abstract

本发明公开了一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，用于维数为M×N(M≥N)的基向量矩阵V，包括预处理模块和压缩模块；预处理模块由第一类预处理单元和第二类预处理单元构成；压缩模块由实数化处理单元、Givens旋转处理单元和简化的Givens旋转处理单元构成；本发明可保证硬件实现的规律性及数据的并行化流水处理；通用性强，可以实现任意维度为M×N的基向量矩阵的压缩。

Description

基于高速脉动阵列及Givens变换的基向量矩阵压缩装置

技术领域

本发明涉及一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，属于信号处理、无线通信技术领域。

背景技术

IEEE 802.11n标准中提供了两种信道信息反馈方式，即隐式反馈和显式反馈，其中针对显式反馈定义了三种反馈的格式：CSI反馈、非压缩信道状态矩阵的奇异分解的右奇异矩阵反馈和信道状态矩阵的奇异分解的右奇异矩阵的压缩反馈。CSI反馈和非压缩信道状态矩阵的奇异分解的右奇异矩阵反馈为了必要的动态范围和量化精度需要大量的比特数。因此，IEEE 802.11ac标准只提供了压缩反馈方式，正在制定的毫米波无线局域网标准IEEE 802.11a也将支持压缩反馈方式。

标准IEEE 802.11n提供了信道矩阵奇异值分解后的右奇异矩阵压缩机制，即通过一系列的Givens旋转将波束成形权重矩阵V分解为极坐标值，通过角度值的量化减小反馈量。然而，一方面，由于无线信道的时变性，反馈的信道信息只在很短的相干时间内有效，另一方面，按照现有的标准，发送端发送探测信道的探测帧的短帧间距(SIFS:short inter-frame space)的时间之内，接收端必需计算需要反馈的角度信息。因此，对于一种低复杂度、高效并行的压缩装置非常有意义。

脉动阵列设计即多个相同的处理单元按一定的互联规则组成网络，具有如下的特性，首先，处理单元只与相连的处理单元通信，处理单元之间通信的局限性保证了硬件布局的规则性；其次，每个处理单元都有局部的存储器，这些存储器对应于逻辑上的延时，是脉动阵列流水运行的必要条件。

发明内容

发明目的：针对现有的Givens变换的基向量矩阵压缩方法硬件实现时序复杂，通用性不高，本发明所提供的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置具，保证硬件实现的规律性及数据的并行化流水处理；通用性强，可以实现任意维度为M×N的基向量矩阵的压缩。

技术方案：一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，用于维数为M×N(M≥N)的基向量矩阵V，包括预处理模块和压缩模块；

预处理模块主要由第一类预处理单元和第二类预处理单元构成；所述第一类预处理单元：该处理单元的输入参数是X_IN，Y_IN，输出参数是X_OUT，Y_OUT；所述第二类预处理单元：该处理单元的输入参数是X_IN，Y_IN，输出参数是X_OUT，Y_OUT；

压缩模块主要由实数化处理单元、Givens旋转处理单元和简化的Givens旋转处理单元构成；所述实数化处理单元：该处理单元的输入参数是Y_IN，输出参数是X_OUT，φ，该处理单元具有内部的寄存器D_r；所述Givens旋转处理单元：该处理单元的输入参数是X_IN，Y_IN，输出参数是X_OUT，Y_OUT，φ，ψ，该处理单元具有内部寄存器D_g，C_g和Z_g；所述简化的Givens旋转处理单元：该处理单元的输入参数是X_IN，Y_IN，输出参数是Y_OUT，ψ，该处理单元具有内部寄存器C_s和Z_s。

具体地，所述第一类预处理单元的处理步骤如下：

(1)计算中间变量D_p，计算公式如下：

D_{p} = X_{IN}^{*} / \sqrt{X_{IN} X_{IN}^{*}} - - - (1)

在公式(1)中，表示对复变量X_IN取共轭转置；

(2)计算输出参数X_OUT，Y_OUT，计算公式如下：

X_OUT＝D_p (2)

Y_OUT＝Y_IN×D_p (3)

在公式(2)表示输出中间变量D_p，公式(3)表示将输入变量Y_IN与中间变量D_p相乘之后输出。

具体地，：所述第二类预处理单元的处理步骤如下：

X_OUT＝X_IN (4)

Y_OUT＝Y_IN×X_IN (5)

在公式(4)表示输入的X_IN经过寄存器后输出，公式(5)表示将输入变量Y_IN与输出变量X_IN相乘之后输出。

具体地，所述实数化处理单元的处理步骤如下：

(1)判断输入参数Y_IN是否为对角元素，如果Y_IN是对角元素，则更新寄存器D_r，更新方法如下:

D_{r} = Y_{IN}^{*} / \sqrt{(Y_{IN} Y_{IN}^{*})} - - - (6)

如果Y_IN为非对角元素，保持寄存器D_r的值不变；

(2)计算X_OUT，X_OUT的计算公式如下:

X_OUT＝D_r×Y_IN (7)

(3)计算角度φ，计算公式如下：

φ＝-asin(real(D_r)) (8)

在公式(8)中，asin{·}表示对反正弦值，real{·}表示取实部。

具体地，所述Givens旋转处理单元的处理步骤如下：

(1)判断输入参数Y_IN是否为对角元素，如果是对角元素，则更新寄存器D_g，C_g和Z_g，其中，寄存器D_g的更新方法如下：

D_{g} = Y_{IN}^{*} / \sqrt{(Y_{IN} Y_{IN}^{*})} - - - (9)

基于公式(9)的结果，将Y_IN实数化处理，其处理方法如下：

{\overset{&OverBar;}{Y}}_{IN} = Y_{IN} \times D_{g} - - - (10)

公式(10)表示将输入参数Y_IN和寄存器D_g的值相乘得到更新寄存器C_g和Z_g，他们的计算公式如下：

C_{g} = \frac{X_{IN}}{\sqrt{X_{IN}^{2} + {\overset{&OverBar;}{Y}}_{IN}^{2}}} - - - (11)

Z_{g} = \frac{Y_{IN}}{\sqrt{X_{IN}^{2} + {\overset{&OverBar;}{Y}}_{IN}^{2}}} - - - (12)

如果Y_IN为非对角元素，则寄存器D_g，C_g，和Z_g的值不变，并对输入参数Y_IN执行公式(10)所示的运算得到

(2)计算角度φ和ψ

φ＝-asin(real(D_g)) (13)

ψ＝asin(Z) (14)

(3)计算输出参数，计算公式如下：

X_{OUT} = C_{g} \times X_{IN} + Z_{g} \times {\overset{&OverBar;}{Y}}_{IN} - - - (15)

Y_{OUT} = - Z_{g} \times X_{IN} + C_{g} \times {\overset{&OverBar;}{Y}}_{IN} - - - (16) .

具体地，所述简化的Givens旋转处理单元的处理步骤如下：

(1)判断输入参数Y_IN是否为对角元素，如果是对角元素，则更新寄存器C_s和Z_s，更新公式如下：

C_{s} = \frac{X_{IN}}{\sqrt{X_{IN}^{2} + Y_{IN}^{2}}} - - - (17)

Z_{s} = \frac{Y_{IN}}{\sqrt{X_{IN}^{2} + Y_{IN}^{2}}} - - - (18)

如果Y_IN为非对角元素，则存器C_s和Z_s的值不变。

(2)计算角度ψ，计算公式如下：

ψ＝asin(Z_s) (19)

(3)计算输出参数，计算公式如下：

Y_OUT＝-Z_s×X_IN+C_s×Y_IN (20)。

具体地，所述第一类预处理单元的数量是1；所述第二类预处理单元的数量是M-1。

具体地，所述实数化处理单元的数量是min{N,M-1}，其min{·}表示两数之间取较小的数。

具体地，所述简化的Givens旋转处理单元的数量min{N,M-1}。

具体地，所述Givens旋转处理单元的数量N_G，计算公式如下：

N_{G} = Σ_{i = 0}^{\min {N, M - 2}} (M - 2 - i) - - - (21) .

有益效果：本发明提出了一种基于高速脉动阵列的实现形式，并给出各个处理单元的实现方法，对数据的流水线处理简化了时序设计，具有通用性，可以实现任意维度为M×N的基向量矩阵的压缩。

附图说明

图1为本发明实施例中维度为4×4基向量矩阵的压缩装置；

图2为本发明实施例中维度为4×2基向量矩阵的输入时序；

图3为本发明实施例中维度为2×2基向量矩阵的压缩装置；

图4为本发明实施例中维度为2×2基向量矩阵的输入时序；

图5为本发明实施例中维度为4×2基向量矩阵的压缩装置；

图6为本发明实施例中维度为4×2基向量矩阵的输入时序。

具体实施方式

本发明公开了一种应用于无线局域网中信道状态信息反馈的基向量矩阵压缩的并行计算方法。为了减小反馈量，无线局域网标准IEEE 802.11n和IEEE802.11ac提供了信道矩阵奇异值分解后的右奇异矩阵压缩机制。本发明针对上述机制的实现提供了一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置。

下面分别以维数为4×4，维数为2×2和维数为4×2的基向量矩阵为例，结合附图对本发明基于高速脉动阵列及Givens变换的基向量矩阵的压缩装置进一步详细说明。

实施例1

基于高速脉动阵列及Givens变换的维数为4×4的基向量矩阵压缩装置在本实施例中，设输入的基向量矩阵V的维数是4×4，V定义为：

V = [\begin{matrix} V_{1,1} & V_{1,2} & V_{1,3} & V_{1,4} \\ V_{2,1} & V_{2,2} & V_{2,3} & V_{2,4} \\ V_{3,1} & V_{3,2} & V_{3,3} & V_{3,4} \\ V_{4,1} & V_{4,2} & V_{4,3} & V_{4,4} \end{matrix}] - - - (22)

压缩装置如图1所示，处理单元P11，P12，P13和P14构成预处理模块，其中P11是第一类预处理单元，P12，P13和P14是第二类预处理单元。本模块输入的配置方式是：P11的输出X_OUT和P12的X_IN相连，P12的输出X_OUT和P13的X_IN相连，P13的输出X_OUT和P14的X_IN相连。

处理单元P21，P22，P23和P24构成的模块的功能是完成对输入矩阵V的1列的Givens旋转，其中，P21是实数化处理单元，P22，P23是Givens旋转处理单元，P24是精简的Givens旋转处理单元。本模块输入的配置方式是：P21的Y_IN和P11的Y_OUT相连，P22的Y_IN和P12的Y_OUT相连，P23的Y_IN和P13的Y_OUT相连，P24的Y_IN和P14的Y_OUT相连，P21的输出X_OUT和P22的X_IN相连，P22的输出X_OUT和P23的X_IN相连，P23的输出X_OUT和P24的X_IN相连。

处理单元P31，P32和P33构成的模块的功能是完成对矩阵第2列的Givens旋转，其中，P31是实数化处理单元，P32是Givens旋转处理单元，P33是精简的Givens旋转处理单元。本模块输入的配置方式是：P31的Y_IN和P22的Y_OUT相连，P32的Y_IN和P23的Y_OUT相连，P33的Y_IN和P24的Y_OUT相连，P21的输出X_OUT和P22的X_IN相连，P22的输出X_OUT和P23的X_IN相连，P23的输出X_OUT和P24的X_IN相连。

处理单元P41和P42构成的模块的功能是完成对矩阵第3列的Givens旋转，其中，P41是实数化处理单元，P42是精简的Givens旋转处理单元。本模块输入的配置方式是：P41的Y_IN和P32的Y_OUT相连，P42的Y_IN和P33的Y_OUT相连，P41的输出X_OUT和P42的X_IN相连。

处理单元P11，P12，P13和P14输入端Y_IN的时序关系如图2左半部分所示。处理单元P11的输入端X_IN的时序如图2右半部分所示，图中z表示任意复数，z取值的不同不会影响系统的性能和运算结果。第一个时序，分别将元素V_1,1，z，z和z输入处理单元P11，P12，P13和P14的输入端Y_IN，同时将V_4,1输入处理单元P11的输入端X_IN，第二个时序，分别将元素V_1,2，V_2,1，z和z输入处理单元P11，P12，P13和P14的输入端Y_IN，同时将V_4,2输入处理单元P11的输入端X_IN，以此类推，在第7个时序，分别将元素z，z，z和V_4,4输入处理单元P11，P12，P13和P14的输入端Y_IN，同时将z输入处理单元P11的输入端X_IN。

等待3个时序之后即第11个时序之后，输出各个模块的φ和ψ。

实施例2

基于高速脉动阵列及Givens变换的维数为2×2的基向量矩阵压缩装置在本实施例中，设输入的基向量矩阵V的维数是2×2，V定义为：

V = [\begin{matrix} V_{1,1} & V_{1,2} \\ V_{2,1} & V_{2,2} \end{matrix}] - - - (23)

压缩装置如图3所示，本实施例与上一个实施例的区别是整个装置只有4个处理单元，处理单元P11和P12构成预处理模块，其中P11是第一类预处理单元，P12是第二类预处理单元。本模块输入的配置方式是：P11的输出X_OUT和P12的X_IN相连。

处理单元P21，P22构成的压缩模块的完成对输入矩阵V的1列的Givens旋转，其中，P21是实数化处理单元，P22是精简的Givens旋转处理单元。压缩模块输入的配置方式是：P21的Y_IN和P11的Y_OUT相连，P22的Y_IN和P12的Y_OUT相连，P21的输出X_OUT和P22的X_IN相连。

处理单元P11和P12输入端Y_IN的时序关系如图4左半部分所示。处理单元P11的输入端X_IN的时序如图4右半部分所示，图中z表示任意复数，z取值的不同不会影响系统的性能和运算结果。第一个时序，分别将元素V_1,1，z输入处理单元P11和P12的输入端Y_IN，同时将V_2,1输入处理单元P11的输入端X_IN，第二个时序，分别将元素V_1,2和V_2,1输入处理单元P11和P12的输入端Y_IN，同时将V_2,2输入处理单元P11的输入端X_IN，第3个时序，分别将元素z和V_2,2输入处理单元P11和P12的输入端Y_IN，同时将z输入处理单元P11的输入端X_IN。

等待5个时序之后即第10个时序之后，输出各个模块的φ和ψ。

实施例3

基于高速脉动阵列及Givens变换的维数为4×2的基向量矩阵压缩装置在本实施例中，设输入的基向量矩阵V的维数是4×2，V定义为：

V = [\begin{matrix} V_{1,1} & V_{1,2} \\ V_{2,1} & V_{2,2} \\ V_{3,1} & V_{3,2} \\ V_{4,1} & V_{4,2} \end{matrix}] - - - (24)

压缩装置如图5所示，处理单元P11，P12，P13和P14构成预处理模块，其中P11是第一类预处理单元，P12，P13和P14是第二类预处理单元。本模块输入的配置方式是：P11的输出X_OUT和P12的X_IN相连，P12的输出X_OUT和P13的X_IN相连，P13的输出X_OUT和P14的X_IN相连。

处理单元P11，P12，P13和P14输入端Y_IN的时序关系如图6左半部分所示。处理单元P11的输入端X_IN的时序如图2右半部分所示，图中z表示任意复数，z取值的不同不会影响系统的性能和运算结果。第一个时序，分别将元素V_1,1，z，z和z输入处理单元P11，P12，P13和P14的输入端Y_IN，同时将V_4,1输入处理单元P11的输入端X_IN，第二个时序，分别将元素V_1,2，V_2,1，z和z输入处理单元P11，P12，P13和P14的输入端Y_IN，同时将V_4,2输入处理单元P11的输入端X_IN，以此类推，在第5个时序，分别将元素z，z，z和V_4,2输入处理单元P11，P12，P13和P14的输入端Y_IN，同时将z输入处理单元P11的输入端X_IN。

等待3个时序之后即第8个时序之后，输出各个模块的φ和ψ。

Claims

1.一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：用于维数为M×N(M≥N)的基向量矩阵V，包括预处理模块和压缩模块；

2.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述第一类预处理单元的处理步骤如下：

(1)计算中间变量D_p，计算公式如下：

D_{p} = X_{IN}^{*} / \sqrt{X_{IN} X_{IN}^{*}} - - - (1)

在公式(1)中，表示对复变量X_IN取共轭转置；

(2)计算输出参数X_OUT，Y_OUT，计算公式如下：

X_OUT＝D_p (2)

Y_OUT＝Y_IN×D_p (3)

3.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述第二类预处理单元的处理步骤如下：

X_OUT＝X_IN (4)

Y_OUT＝Y_IN×X_IN (5)

4.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述实数化处理单元的处理步骤如下：

D_{r} = Y_{IN}^{*} / \sqrt{Y_{IN} Y_{IN}^{*}} - - - (6)

如果Y_IN为非对角元素，保持寄存器D_r的值不变；

(2)计算X_OUT，X_OUT的计算公式如下:

X_OUT＝D_r×Y_IN (7)

(3)计算角度φ，计算公式如下：

φ＝-asin(real(D_r)) (8)

在公式(8)中，asin{·}表示对反正弦值，real{·}表示取实部。

5.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述Givens旋转处理单元的处理步骤如下：

D_{g} = Y_{IN}^{*} / \sqrt{(Y_{IN} Y_{IN}^{*})} - - - (9)

基于公式(9)的结果，将Y_IN实数化处理，其处理方法如下：

{\overset{&OverBar;}{Y}}_{IN} = Y_{IN} \times D_{g} - - - (10)

C_{g} = \frac{X_{IN}}{\sqrt{X_{IN}^{2} + {\overset{&OverBar;}{Y}}_{IN}^{2}}} - - - (11)

Z_{g} = \frac{Y_{IN}}{\sqrt{X_{IN}^{2} + {\overset{&OverBar;}{Y}}_{IN}^{2}}} - - - (12)

(2)计算角度φ和ψ

φ＝-asin(real(D_g)) (13)

ψ＝asin(Z) (14)

(3)计算输出参数，计算公式如下：

X_{OUT} = C_{g} \times X_{IN} + Z_{g} \times {\overset{&OverBar;}{Y}}_{IN} - - - (15)

Y_{OUT} = {- Z}_{g} \times X_{IN} + C_{g} \times {\overset{&OverBar;}{Y}}_{IN} - - - (16) .

6.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述简化的Givens旋转处理单元的处理步骤如下：

C_{s} = \frac{X_{IN}}{\sqrt{X_{IN}^{2} + Y_{IN}^{2}}} - - - (17)

Z_{s} = \frac{Y_{IN}}{\sqrt{X_{IN}^{2} + Y_{IN}^{2}}} - - - (18)

如果Y_IN为非对角元素，则存器C_s和Z_s的值不变。

(2)计算角度ψ，计算公式如下：

ψ＝asin(Z_s) (19)

(3)计算输出参数，计算公式如下：

Y_OUT＝-Z_s×X_IN+C_s×Y_IN (20)。

7.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述第一类预处理单元的数量是1；所述第二类预处理单元的数量是M-1。

8.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述实数化处理单元的数量是min{N,M-1}，其中min{·}表示两数之间取较小的数。

9.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述简化的Givens旋转处理单元的数量min{N,M-1}。

10.根据权利要求1所述的一种基于高速脉动阵列及Givens变换的基向量矩阵压缩装置，其特征在于：所述Givens旋转处理单元的数量N_G，N_G的计算公式如下：

N_{G} = Σ_{i = 0}^{\min {N, M - 2}} (M - 2 - i) - - - (21) .