CN108228536B

CN108228536B - 使用FPGA实现Hermitian矩阵分解的方法

Info

Publication number: CN108228536B
Application number: CN201810120721.4A
Authority: CN
Inventors: 李洋; 庄杰; 张倩; 孟超; 余擎阳
Original assignee: Chengdu Aerospace Communication Equipment Co ltd
Current assignee: Chengdu Aerospace Communication Equipment Co ltd
Priority date: 2018-02-07
Filing date: 2018-02-07
Publication date: 2021-03-23
Anticipated expiration: 2038-02-07
Also published as: CN108228536A

Abstract

本发明公开了一种使用FPGA实现Hermitian矩阵分解的方法，提供了一种使用FPGA实现Jacobi算法的方法，对阵列天线接收到的复数Hermitian矩阵采用Jacobi算法进行分解，在硬件实现上使用FPGA实现Jacobi算法，对于Jacobi算法中复杂的乘法、除法运算全部使用CORDIC核按照一定规则代替，最终得到Hermitian矩阵的特征值和特征向量。本发明方法使用FPGA计算Hermitian矩阵的特征值和特征向量，有关矩阵运算几乎全部使用CORDIC核，并且对CORDIC核进行复用，省去了大量的乘法、除法运算，节约FPGA资源，处理时间快，并行性好，在阵列信号处理中应用前景广阔。

Description

使用FPGA实现Hermitian矩阵分解的方法

技术领域

本发明涉及一种使用FPGA实现Hermitian矩阵分解的方法。

背景技术

在阵列信号处理中，对多天线接收到的信号往往需要进行矩阵分解，求得矩阵的特征值和特征向量，以便对信源方向进行估计。传统的矩阵分解是用DSP(数字信号处理器)实现，耗时大，FPGA作为现场可编程门阵列，拥有并行计算的优势，处理时间快，逐渐的被用于实现复杂的阵列信号处理算法，但FPGA也有劣势，那就是进行非线性运算特别的复杂，所以为了充分利用FPGA优势，同时兼顾FPGA的劣势，FPGA进行矩阵分解就采用并行性好的Jacobi算法，而不用QR算法。

发明内容

为了克服现有技术的缺点，本发明提供了一种使用FPGA实现Hermitian矩阵分解的方法。

本发明所采用的技术方案是：一种使用FPGA实现Hermitian矩阵分解的方法，包括如下步骤：

步骤一、将n×n的复数矩阵T存入RAM中，同时构造n×n的单位对角阵V存于RAM中；

步骤二、选择一个(p,q)对，将T_p,p和T_q,q所在的两列的元素组成n×2的矩阵T_tmp，同时选取V对应的元素组成n×2的V_tmp矩阵；

步骤三、使用COEDIC核求解T_p,q的幅度Amp和相位θ；

步骤四、使用CORDIC核计算

和

然后将计算结果分别用于更新T_tmp和V_tmp；

步骤五、分别对T_tmp和V_tmp进行旋转变换，然后将计算结果分别用于更新T_tmp和V_tmp；

步骤六、用T_tmp和V_tmp更新T矩阵和V矩阵相应位置元素；

步骤七、另选一个(p,q)对，重复步骤二至六；直至T矩阵成为了对角阵，则T的主对角元素就是T的特征值，V的列向量就是T的特征向量。

与现有技术相比，本发明的积极效果是：

本发明提供了一种使用FPGA实现Jacobi算法的方法，对阵列天线接收到的复数Hermitian矩阵采用Jacobi算法进行分解，在硬件实现上使用FPGA实现Jacobi算法，对于Jacobi算法中复杂的乘法、除法运算全部使用CORDIC核按照一定规则代替，最终得到Hermitian矩阵的特征值和特征向量。

本发明方法使用FPGA计算Hermitian矩阵的特征值和特征向量，有关矩阵运算几乎全部使用CORDIC核，并且对CORDIC核进行复用，省去了大量的乘法、除法运算，节约FPGA资源，处理时间快，并行性好，在阵列信号处理中应用前景广阔。

附图说明

本发明将通过例子并参照附图的方式说明，其中：

图1是5×5矩阵并行排序规则演示图；

图2为并行排序规则演示图；

图3为8×8矩阵并行排序规则演示图；

图4为7×7矩阵并行排序规则演示图；

图5是本发明的FPGA模块框图。

具体实施方式

假定协方差矩阵T是5*5的复数矩阵，其特征分解过程如下：

算法描述：

设置矩阵T为5*5的矩阵，同时设置5*5的单位对角矩阵V，其并行排序规则演示如图1所示：

1.循环3次扫描(看实际情况，可能需要更多的扫描次数)；

2.每个扫描，串行执行5个steps；

3.每个step并行执行2个的(p,q)pair变化；

5个steps包含的(p,q)pair分别为：

Step1：(1,2)(3,4)

Step2：(1,4)(3,5)

Step3：(2,3)(4,5)

Step4：(1,5)(2,4)

Step5：(1,3)(2,5)

4.对T做扫描、变化和更新的同时对V执行相同操作。

循环完成后，T只有主对角线为非零，其余元素都为0，T的主对角元素就是T的特征值，V的列向量就是T的特征向量。

对p，q选择的说明：

对于n(n为偶数)阶矩阵图2给出了并行排序的规则，确定旋转执行时的步骤，按照图2所示的规则，将奇行列数1，3，5，…，n-3，n-1排在第一排，将偶行列数2，4，6，…，n-2，n排在第二排，第一行列始终保持顺序不变，其他的行列按照箭头所指的方向(即顺时针方向)和对应行列互换位置。每次排序结束后，将每一列的上下两个元素(如n-1和n)，按从小到大的顺序进行排序，并分别作为p和q的值，即p＝n-1，q＝n。这样，当n为偶数时，扫描一次需要n-1步。

为了更加清楚地说明并行排序规则，我们以n＝8来举例说明：

假设A是8×8的实矩阵，那么根据图2的并行排序规则，我们可以作图3来演示其Step1到Step7的生成过程：

根据图3的并行排序规则，很容易得到如下的扫描分解步骤：

Step1：(1,2)(3,4)(5,6)(7,8)

Step2：(1,4)(2,6)(3,8)(5,7)

Step3：(1,6)(4,8)(2,7)(3,5)

Step4：(1,8)(6,7)(4,5)(2,3)

Step5：(1,7)(5,8)(3,6)(2,4)

Step6：(1,5)(3,7)(2,8)(4,6)

Step7：(1,3)(2,5)(4,7)(6,8)

当n×n的矩阵在n为奇数条件下的情况：按照图2所示的规则，将奇行列数1，3，5，…，n-2，n排在第一排，将偶行列数2，4，6，…，n-1，n+1排在第二排，第一行列始终保持顺序不变，其他的行列按照箭头所指的方向(即顺时针方向)和对应行列互换位置。每次排序结束后，将每一列的上下两个元素(如n和n+1)，按从小到大的顺序进行排序，并分别作为p和q的值，即p＝n，q＝n+1。这样，当n为奇数时，扫描一次需要n步。

当n为奇数时，有两种方法来进行扫描，我们以n＝7为例：

方法一：

根据图2的并行排序规则来进行扫描，则其演示图如图4所示：

很明显，与n＝8时的演示图有所区别，由于没有第8行和列，所以以星号“*”代替，并且，与星号对应搭配的行和列(即图中没有画椭圆的部分)在那次Step中不参与Jacobi旋转处理。

根据图4，很容易得到如下的扫描分解步骤：

Step1：(1,2)(3,4)(5,6)

Step2：(1,4)(2,6)(5,7)

Step3：(1,6)(2,7)(3,5)

Step4：(6,7)(4,5)(2,3)

Step5：(1,7)(3,6)(2,4)

Step6：(1,5)(3,7)(4,6)

Step7：(1,3)(2,5)(4,7)

从图4和分解步骤中都可以明显地看出，当n为奇数时，按照此方法来进行扫描，得到的结果与根据图3的n＝8时的并行排序规则得到的扫描分解步骤相同，即以星号“*”代替“8”，并且，与星号对应搭配的行和列(即图中没有画椭圆的部分)在那次Step中不参与Jacobi旋转处理。

方法二：

对7×7矩阵补0成为8×8矩阵，然后按照8×8矩阵进行扫描。

FPGA实现流程如图5所示：

1.将5×5的复数矩阵T存入RAM中，构造5×5单位对角阵V存于RAM中；

2.根据上面提到的p、q选取方式，选T的10个元素(即T_p,p和T_q,q所在的两列)，组成5×2的

矩阵(即第一次p＝1、q＝2)，记为T_tmp，再从T_tmp中选取4个元素组成矩阵

同时选取V对应的10个元素组成5X2的V_tmp矩阵；

3.使用COEDIC核求解T_p,q幅度Amp和相位θ；

4.构造矩阵

并使用CORDIC核计算

将α存入寄存器；

5.使用CORDIC核计算

显然，这里只需要将第二列送入CORDIC计算，同时计算

计算结果分别用于更新T_tmp和V_tmp；

6.进行旋转变换，使用CORDIC核计算

同时计算

计算结果分别用于更新T_tmp和V_tmp；

下面是计算规则：

(2)先计算右边，将实部(a_1,1a_2,1a_3,1a_4,1a_5,1)^T送入CORDIC核的X输入端，实部(m_1, ₁m_2,1m_3,1m_4,1m_5,1)^T送入CORDIC核的Y端，CORDIC的相位脚输入α，输出端X更新(a_1,1a_2,1a_3,1a_4, ₁a_5,1)^T，输出端Y更新(m_1,1m_2,1m_3,1m_4,1m_5,1)^T；

(3)对虚部执行相同操作，这里可以同时使用两个CORDIC核与步骤(2)同时进行，也可以一个CORDIC核复用；

(4)使用CORDIC计算

实际上只需要计算

使用计算结果更新相应位置元素；

注意：以上只有(2)、(3)需要对V_tmp执行相同操作。

7.用T_tmp和V_tmp更新T矩阵和V矩阵相应位置元素；

8.选取另一对p,q,重复步骤2～7；

9.以上的步骤根据实际应用的需要，可以循环执行多次。

10.最后T矩阵成为了对角阵，对角线元素就是特征值，V矩阵的列向量就是特征向量。

Claims

1.一种使用FPGA实现Hermitian矩阵分解的方法，其特征在于：包括如下步骤：

步骤二、选择一个(p,q)对，将T_p,p和T_q,q所在的两列的元素组成n×2的矩阵T_tmp，同时选取V对应的元素组成n×2的V_tmp矩阵；对于n阶矩阵，所述(p,q)对按照如下并行排序规则确定：

(1)当n为偶数时，将奇行列数1，3，5，…，n-3，n-1排在第一排，将偶行列数2，4，6，…，n-2，n排在第二排，第一行列始终保持顺序不变，其他的行列按照顺时针方向和对应行列互换位置，每次排序结束后，将每一列的上下两个元素按从小到大的顺序进行排序，并分别作为p和q的值，排序次数共n-1次，每次排序得到n/2个(p,q)对；

(2)当n为奇数时，将奇行列数1，3，5，…，n-2，n排在第一排，将偶行列数2，4，6，…，n-1，n+1排在第二排，第一行列始终保持顺序不变，其他的行列按照顺时针方向和对应行列互换位置，每次排序结束后，去除与序号n+1搭配的一列后将其余每一列的上下两个元素按从小到大的顺序进行排序，并分别作为p和q的值，排序次数共n次，每次排序得到(n-1)/2个(p,q)对；

步骤三、使用CORDIC核求解T_p,q的幅度Amp和相位θ；

步骤四、使用CORDIC核计算

和

然后将计算结果分别用于更新T_tmp和V_tmp；其中：

(一)对T_tmp和V_tmp进行旋转变换的方法为：

(1)使用CORDIC核计算

并将α存入寄存器；

(2)使用CORDIC核计算

和

(二)将对T_tmp和V_tmp进行旋转变换的计算结果分别用于更新T_tmp和V_tmp的方法为：

(1)

(2)将实部(a_1,1a_2,1a_3,1......a_n,1)^T送入CORDIC核的X输入端，实部(m_1,1m_2,1m_3, ₁......m_n,1)^T送入CORDIC核的Y端，CORDIC的相位脚输入α，输出端X更新(a_1,1a_2,1a_3, ₁......a_n,1)^T，输出端Y更新(m_1,1m_2,1m_3,1......m_n,1)^T；

(3)对虚部执行与第(2)步相同的操作；对V_tmp执行与第(2)步和第(3)步相同操作；

(4)使用CORDIC计算

(5)计算

然后将计算结果更新相应位置元素；

步骤六、用T_tmp和V_tmp更新T矩阵和V矩阵相应位置元素；

2.根据权利要求1所述的使用FPGA实现Hermitian矩阵分解的方法，其特征在于：第(3)步所述对虚部执行与第(2)步相同的操作时，同时使用两个CORDIC核与第(2)步同时进行或者使用一个CORDIC核复用。