WO2015039452A1

WO2015039452A1 - 一种矢量运算核以及矢量处理器

Info

Publication number: WO2015039452A1
Application number: PCT/CN2014/077914
Authority: WO
Inventors: 李爱军; 林文琼
Original assignee: 中兴通讯股份有限公司
Priority date: 2013-09-22
Filing date: 2014-05-20
Publication date: 2015-03-26
Also published as: US20160210146A1; EP3048538B1; CN104462016A; EP3048538A4; US9910671B2; CN104462016B; EP3048538A1

Abstract

一种矢量运算核和矢量处理器，矢量运算核采用两个三输入加法器与四个数据取反器，使输入加法器的数据能够灵活地取反。矢量处理器中除了设有上述的矢量运算核外，还包括控制单元，控制矢量运算核中的选择器和取反器。矢量处理器可以实现同时支持基2，基3，基5快速傅里叶里种的蝴蝶运算。矢量运算核可以广泛应用于多模兼容的移动终端芯片中的可编程矢量处理器设计中。

Description

一种矢量运算核以及矢量处理器技术领域本发明属于芯片设计中的矢量处理器（vector processor)领域，具体涉及一种实现快速傅里叶（Fast-Fourier Transform) 中的蝴蝶运算的矢量运算器。背景技术目前通信协议有全球移动通信系统（GSM) 、通用移动通信系统（UMTS) 、无线局域网（WLAN) 、时分同步的码分多址接入（TD-SCDMA) 和长期演进（LTE) 等等多种模式，采用原有的专用集成电路（ASIC)设计方法来实现多模兼容的移动终端芯片必然面临面积大且缺乏灵活性等等缺点。当前的软件无线电（software-defined radio, 简称为 SDR) 技术是解决目前多模通信终端芯片设计问题的极具潜力的技术。可编程矢量处理器（programmable vector processor) 是 SDR技术的核心架构。为了支持多模基带的处理，矢量处理器必须能每秒执行数 G操作，并且作为移动终端需要满足功耗在几百 mW左右。其中的运算单元是矢量处理器的核心运算部分，其性能决定了整个处理器性能，其功耗也占到处理器近一半的功耗，其设计和实现非常关键。矢量运算器可以有很多结构，可以实现一般乘法、加法、乘加，还可以实现复数乘法、加法、乘加，以及特定快速傅里叶的蝴蝶运算，这些都取决于矢量运算器的结构。但是现有一般的方案都只能进行基 2快速傅里叶中的蝴蝶运算，无法直接完成基 3 快速傅里叶中的蝴蝶运算。或者可以通过多组复数加与复数累加的指令组合来完成基 3快速傅里叶中的蝴蝶运算，但是增加了指令的数量，运算效率较低，同时也提高了编程的难度，编程效率也大大降低。分析上述现有技术主要原因是在于传统的矢量运算器在进行复数的蝶形运算时，不能灵活地对乘法结果进行取反运算，使得每条蝶形支路只能进行固定的乘加或乘减，所以只能完成基 2快速傅里叶里的蝴蝶运算。发明内容本发明解决的技术问题之一是提出了一种矢量运算核，可以灵活的实现各种蝴蝶运算。本发明解决的技术问题之一是提出了一种矢量处理器，可以实现同时支持基 2，基 3，基 5快速傅里叶中的蝴蝶运算。

本发明提出的矢量运算核，包括：第一运算支路和第二运算支路；所述第一运算支路包括：输入端 1、 2、 3，乘法器 7，二选一选择器 9，取反器 11、 12，三输入加法器 15和输出端 17; 所述第二运算支路包括：输入端 4、 5、 6，乘法器 8，二选一选择器 10，取反器 13、 14，三输入加法器 16和输出端 18; 所述取反器 11、 12、 13、 14 设置为控制其输出数据的符号；输入端 1的数据输入到选择器 9的一个选择输入端上，输入端 2、 3的数据输入到乘法器 7的两个输入端上，乘法器 7的输出数据分成两个支路分别输入到取反器 11、 13的输入端上；输入端 6的数据输入到选择器 10的一个选择输入端上，输入端 4、 5的数据输入到乘法器 8的两个输入端上，乘法器 8的输出数据分成两个支路分别输入到取反器 12、 14的输入端上；选择器 9，取反器 11、 12的输出数据分别输入到加法器 15的三个输入端上；选择器 10，取反器 13、 14的输出数据分别输入到加法器 16的三个输入端上；加法器 15的输出数据分成两个支路分别输入到输出端 17上和选择器 9的另一个选择输入端上；加法器 16的输出数据分成两个支路分别输入到输出端 18上和选择器 10的另一个选择输入端上。进一步的，在输入端 1和选择器 9之间，输入端 6和选择器 10之间分别设有一个寄存器；在乘法器 7、 8的输出端，加法器 15、 16的输出端上分别设有一个寄存器。

本发明提出的本发明提出的矢量处理器，包括：控制单元以及上述的矢量运算核；所述控制单元设置为控制所述矢量运算核中的选择器 9、 10的输入有效端，还设置为控制所述矢量运算核中的取反器 11、 12、 13、 14的输出数据符号。采用本发明的矢量运算核与现有的矢量运算核相比，由于少用了一个两输入加法器，将两个两输入加法器用三输入加法器替换，使得芯片的面积与功耗方面均有所减少。采用本发明的矢量处理器可以同时支持基 2，基 3，基 5快速傅里叶中的蝴蝶运算；在同时计算基 2蝴蝶运算的两条支路时，由于将乘法运算的次数减少一半，大大降低了电路功耗。附图说明图 1 是现有技术中的一种矢量运算核的原理框图；图 2 是现有技术中的另一种矢量运算核的原理框图；

图 3是本发明提出的矢量运算核的原理框图；

图 4是本发明基 2快速傅里叶运算的实部运算图；

图 5是本发明基 2快速傅里叶运算的虚部运算图；

图 6a 是本发明基 3快速傅里叶运算的实部运算第一次运算图；图 6b是本发明基 3快速傅里叶运算的实部运算第二次运算图；图 7a 是本发明基 3快速傅里叶运算的虚部运算第一次运算图；图 7b是本发明基 3快速傅里叶运算的虚部运算第二次运算图；图 8a 是本发明基 5快速傅里叶运算的 X2,X3实部运算第一次运算图；图 8b是本发明基 5快速傅里叶运算的 X2,X3实部运算第二次运算图；图 8c是本发明基 5快速傅里叶运算的 X2,X3实部运算第三次运算图；图 8d是本发明基 5快速傅里叶运算的 X2,X3实部运算第四次运算图；图 9a是本发明基 5快速傅里叶运算的 X2,X3虚部运算第一次运算图；图 9b是本发明基 5快速傅里叶运算的 X2,X3虚部运算第二次运算图；图 9c是本发明基 5快速傅里叶运算的 X2,X3虚部运算第三次运算图；图 9d是本发明基 5快速傅里叶运算的 X2,X3虚部运算第四次运算图；图 10a是本发明基 5快速傅里叶运算的 X4,X5实部运算第一次运算图; 图 10b是本发明基 5快速傅里叶运算的 X4,X5实部运算第二次运算图; 图 10c是本发明基 5快速傅里叶运算的 X4,X5实部运算第三次运算图; 图 10d是本发明基 5快速傅里叶运算的 X4,X5实部运算第四次运算图; 图 11a是本发明基 5快速傅里叶运算的 X4,X5虚部运算第一次运算图; 图 l ib是本发明基 5快速傅里叶运算的 X4,X5虚部运算第二次运算图; 图 l ie是本发明基 5快速傅里叶运算的 X4,X5虚部运算第三次运算图；图 l id是本发明基 5快速傅里叶运算的 X4,X5虚部运算第四次运算图。具体实施方式下面结合附图，并通过具体实施例详细说明本发明技术方案的实现方式。图 1为现有技术中的一种矢量运算核的架构，该架构为传统的矢量运算核架构，由两个乘法器和两个加法器组成。图 2为现有技术中另一种矢量运算核的架构，该矢量运算核由两个乘法器和三个加法器组成。这两种现有的矢量运算核构建的矢量处理器都没有办法同时实现支持基 2，基 3，基 5快速傅里叶中的蝴蝶运算。图 3为本发明提出的矢量运算核架构，采用两个三输入加法器与四个数据取反器，使输入加法器的数据能够灵活地取反，用该矢量运算核构建的矢量处理器可以实现同时支持基 2，基 3，基 5快速傅里叶里种的蝴蝶运算。图 3 显示了矢量运算核的基本架构。为了简化描述，图中只显示该运算核用了两阶来实现，即分成 3级流水线实现。在实际的硬件实现时，该运算核可以采用不同的阶数来实现。其所需要的实现阶数取决于其最高操作频率和所采用的工艺，比如时钟频率要求 800M, 那么该运算核用三阶，即分成 4级流水线实现，而假如时钟频率要求 200M,那么该运算核就可以分成 1 级流水线实现。即根据时钟频率要求划分流水阶数，本申请只是以 3级流水线为例子进行说明。如图 3所示，矢量运算核中包括第一运算支路和第二运算支路。其中第一运算支路包括：输入端 1、 2、 3，乘法器 7，二选一选择器 9，取反器 1 1、 12，三输入加法器 15和输出端 17; 第二运算支路包括：输入端 4、 5、 6，乘法器 8，二选一选择器 10，取反器 13、 14，三输入加法器 16和输出端 18。取反器 1 1、 12、 13、 14可以根据运算的需要灵活的进行取反操作。输入端 1的数据输入到选择器 9的一个选择输入端上，输入端 2、 3的数据输入到乘法器 7的两个输入端上，乘法器 7的输出数据分成两个支路分别输入到取反器 1 1、 13的输入端上；输入端 6的数据输入到选择器 10的一个选择输入端上，输入端 4、 5 的数据输入到乘法器 8的两个输入端上，乘法器 8的输出数据分成两个支路分别输入到取反器 12、 14的输入端上；选择器 9，取反器 1 1、 12的输出数据分别输入到加法器 15的三个输入端上；选择器 10，取反器 13、 14的输出数据分别输入到加法器 16 的三个输入端上；加法器 15的输出数据分成两个支路分别输入到输出端 17上和选择器 9的另一个选择输入端上；加法器 16的输出数据分成两个支路分别输入到输出端 18上和选择器 10的另一个选择输入端上。在一种实施例中，在输入端 1和选择器 9之间，输入端 6和选择器 10之间分别设有一个寄存器；在乘法器 7、 8的输出端，加法器 15、 16的输出端上分别设有一个寄存器。如图 3所示，共设置了 6个寄存器。

上述的矢量运算核可以作为矢量处理器的核心运算部分，此时矢量处理器至少包括：控制单元以及权利要求 1或 2所述的矢量运算核；控制单元设置为控制矢量运算核中的选择器 9、 10的输入有效端，还设置为控制矢量运算核中的取反器 11、 12、 13、 14的输出数据符号。由于矢量运算核的功耗一般占到矢量处理器近一半，由于上述矢量运算核减少了运算次数和运算器件，所以采用了上述矢量运算核的矢量处理器的功耗将大大降低。以下分别以基 2，基 3，基 5快速傅里叶中的蝴蝶运算为例，具体说明本发明矢量处理器的运算处理过程：一、基 2快速傅里叶中的蝴蝶运算实现基 2 FFT蝴蝶运算可以描述如下：

XI = C + AB ( la)

X2 = C - AB ( lb ) 其中， A, B 和 C 都是复数矢量， B是旋转因子， X1,X2为基 2快速傅里叶蝴蝶运算输出矢量。设

A = Ar + j Ai B = Br + j Bi C = Cr + j Ci XI = Xlr + j Xli

X2 = X2r + j X2i 则公式（la) 、 ( lb) 可改写为:

Xlr = Cr + [Ar * Br-Ai * Bi]

Xli = Ci + [Ar * Bi + Ai * Br]

其中公式（2) 为 XI、 X2的实部运算式，公式（3 ) 为 XI、 X2的虚部运算式。如图 4 所示的实部运算图，图中实线标示数据流向，输入端 1、 2、 3、 4、 5、 6 分别输入 Cr、 Ar、 Br、 Ai、 Bi、 Cr数据，取反器 11、 14 控制其输出数据的符号为正，取反器 12、 13控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6的数据输入有效，输出端 17输出 XI的实部运算结果 Xlr，输出端 18输出 X2的实部运算结果 X2r。如图 5 所示的虚部运算图，图中实线标示数据流向，输入端 1、 2、 3、 4、 5、 6 分别输入 Ci、 Ar、 Bi、 Ai、 Br、 Ci数据，取反器 11、 12 控制其输出数据的符号为正，取反器 13、 14控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6的数据输入有效，输出端 17输出 XI的虚部运算结果 Xli，输出端 18输出 X2的虚部运算结果 X2i。二、基 3快速傅里叶中的蝴蝶运算实现基 3FFT蝴蝶运算可以描述如下:

XI = A+B+C (4a)

X2 = A+B*wl+C*w2 (4b)

X3 = A+B *conj(wl)+C*conj (w2) (4c) 其中， A， B 和 C 都是复数矢量， wl,w2是旋转因子， XI， X2， X3为基 3快速傅里叶蝴蝶运算输出矢量。设 A = Ar + j Ai B = Br + j Bi C = Cr + j Ci Wl = Wlr + j Wli

W2 = W2r +j W2i

XI = Xlr + j Xli

X2 = X2r + j X2i

X3 = X3r + j X3i 则（4a)、（4b)、 (4c) 可改写为：

Xlr = Ar + Br + Cr

Xli = Ai + Bi + Ci (5)

X2r = Ar + [Br * Wlr-Bi * Wli] + [Cr * W2r-Ci * W2i]

X3r = Ar + [Br * Wlr+Bi * Wli] + [Cr * W2r+Ci * W2i] (6) X2i = Ai + [Br * Wli+Bi * Wlr] + [Cr * W2i+Ci * W2r]

X3i = Ai + [-Br * Wli+Bi * Wlr] + [-Cr * W2i+Ci * W2r] (7) 式（5 ) 的实现可以通过加法和累加指令完成，本发明的优化主要针对式（6)，式 ( 7)。如图 6所示的实部运算中包括两次运算过程，图 6a为第一次运算图，图 6b为第二次运算图，图中实线标示数据流向。第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ar、 Br、 Wlr、 Bi、 Wli、 Ar数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6的数据输入有效，输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2r、 Ci、 W2i数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，选择器 10选择输出端 18第一次运算中输出的运算结果输入有效；输出端 17输出的第二次运算结果作为 X2的实部运算结果 X2r，输出端 18输出的第二次运算结果作为 X3的实部运算结果 X3r。如图 7所示的虚部运算中包括两次运算过程，图 7a为第一次运算图，图 7b为第二次运算图。第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ai、 Br、 Wli、 Bi、 Wlr、 Ai数据，取反器 11、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6 的数据输入有效，输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2i、 Ci、 W2r数据，取反器 11、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，选择器 10选择输出端 18第一次运算中输出的运算结果输入有效；输出端 17输出的第二次运算结果作为 X2的虚部运算结果 Χ2Ϊ, 输出端 18输出的第二次运算结果作为 X3的虚部运算结果 X3i。三、基 5快速傅里叶中的蝴蝶运算实现基 5 FFT蝴蝶运算可以描述如下：

XI = A+B+C+D+E ( 8a) X2= A+B*wl+C*w2+D*w3+E*w4 (8b) X3 = A+B * conj (w 1 )+C * conj (w2)+D * conj (w3 )+E*conj (w4)

(8c)

X4= A+B*w3+C*wl+D*w4+E*w2

(8d) X5 = A+B * conj (w3 )+C * conj (w 1 )+D * conj (w4)+E* conj (w2) 其中， A, B ,C ,D和 E都是复数矢量， wl,w2,w3,w4是旋转因子， X1,X2,X3,X4,X5 5快速傅里叶蝴蝶运算输出矢量。

A =Ar + j Ai

B =Br + jBi

C =Cr + jCi

D =Dr + jDi

E =Er + jEi

Wlr +j Wli

W2r +j W2i

W3r +j W3i

W4r +j W4i

XI =Xlr + j Xli

X2 = X2r + j X2i

X3 = X3r + j X3i

X4 = X4r + j X4i

X5 = X5r + j X5i 则公式（8a)、（8b)、（8c)、（8d)、 (8e) 可改写为:

Xlr = Ar + Br + Cr + Dr + Er Xli = Ai + Bi + Ci + Di + Ei

(9)

X2r = Ar + [Br * Wlr-Bi * Wli] + [Cr * W2r-Ci * W2i] + [Dr * W3r-Di * W3i]+ [Er * W4r-Ei * W4i]

X3r = Ar + [Br * Wlr+Bi * Wli] + [Cr * W2r+Ci * W2i] + [Dr * W3r+Di * W3i]+ [Er * W4r+Ei * W4i]

(10)

X2i = Ai + [Br * Wli+Bi * Wlr] + [Cr * W2i+Ci * W2r] + [Dr * W3i+Di * W3r] + [Er * W4i+Ei * W4r]

X3i = Ai + [-Br * Wli+Bi * Wlr] + [-Cr * W2i+Ci * W2r] + [-Dr * W3i+Di * W3r] + [-Er * W4i+Ei * W4r]

(11)

X4r = Ar + [Br * W3r-Bi * W3i]+ [Cr * Wlr-Ci * Wli] + [Dr * W4r-Di * W4i]+ [Er * W2r-Ei * W2i]

X5r = Ar + [Br * W3r+Bi * W3i]+ [Cr * Wlr+Ci * Wli] + [Dr * W4r+Di * W4i]+ [Er * W2r+Ei * W2i]

(12)

X4i = Ai + [Br * W3i+Bi * W3r] + [Cr * Wli+Ci * Wlr] + [Dr * W4i+Di * W4r] + [Er * W2i+Ei * W2r]

X5i = Ai + [-Br * W3i+Bi * W3r] + [-Cr * Wli+Ci * Wlr] + [-Dr * W4i+Di * W4r] + [-Er * W2i+Ei * W2r]

(13) 由式（9)，（10)，（11 )，（12)， ( 13 )可以看出，其处理的方式与式（5 )，（6)， (7) 类似。具体的处理过程：式（9) 采用加法和累加指令完成。式（10) 处理见图 8，包括四次运算，分别为运算图图 8a、图 8b、图 8c和图 8d，图中实线标示数据流向。第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ar、 Br、 Wlr、 Bi、 Wli、 Ar数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12 控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6的数据输入有效，输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入; 第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2r、 Ci、 W2i数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第三次运算中选择器 10的数据选择输入；第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W3r、 Di、 W3i数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第四次运算中选择器 10 的数据选择输入；第四次运算中输入端 2、 3、 4、 5 分别输入 Er、 W4r、 Ei、 W4i 数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输出端 17第三次运算中输出的运算结果输入有效，选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；输出端 17输出的第四次运算结果作为 X2的实部运算结果 X2r，输出端 18输出的第四次运算结果作为 X3的实部运算结果 X3r。式（11 ) 处理见图 9，包括四次运算，分别为运算图图 8a、图 8b、图 8c和图 8d，图中实线标示数据流向。第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ai、 Br、 Wli、 Bi、 Wlr、 Ai数据，取反器 11、 12、 14控制其输出数据的符号为正，取反器 13 控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6的数据输入有效，输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入; 第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2i、 Ci、 W2r数据，取反器 11、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第三次运算中选择器 10的数据选择输入；第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W3i、 Di、 W3r数据，取反器 11、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第四次运算中选择器 10 的数据选择输入；第四次运算中输入端 2、 3、 4、 5 分别输入 Er、 W4i、 Ei、 W4r 数据，取反器 11、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输出端 17第三次运算中输出的运算结果输入有效，选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；输出端 17输出的第四次运算结果作为 X2的虚部运算结果 X2i，输出端 18输出的第四次运算结果作为 X3的虚部运算结果 X3i。式（12)处理见图 10，包括四次运算，分别为运算图图 8a、图 8b、图 8c和图 8d，图中实线标示数据流向。第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ar、 Br、 W3r、 Bi、 W3i、 Ar数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12 控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6的数据输入有效，输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 Wlr、 Ci、 Wli数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第三次运算中选择器 10的数据选择输入；第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W4r、 Di、 W4i数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第四次运算中选择器 10 的数据选择输入；第四次运算中输入端 2、 3、 4、 5 分别输入 Er、 W2r、 Ei、 W2i 数据，取反器 11、 13、 14控制其输出数据的符号为正，取反器 12控制其输出数据的符号为负，选择器 9选择输出端 17第三次运算中输出的运算结果输入有效，选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；输出端 17输出的第四次运算结果作为 X4的实部运算结果 X4r，输出端 18输出的第四次运算结果作为 X5的实部运算结果 X5r。式（13 )处理见图 1 1，包括四次运算，分别为运算图图 8a、图 8b、图 8c和图 8d，图中实线标示数据流向。第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ai、 Br、 W3i、 Bi、 W3r、 Ai数据，取反器 1 1、 12、 14控制其输出数据的符号为正，取反器 13 控制其输出数据的符号为负，选择器 9选择输入端 1的数据输入有效，选择器 10选择输入端 6的数据输入有效，输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 Wli、 Ci、 Wlr数据，取反器 1 1、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第三次运算中选择器 10的数据选择输入；第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W4i、 Di、 W4r数据，取反器 1 1、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，输出端 18输出的运算结果作为第四次运算中选择器 10 的数据选择输入；第四次运算中输入端 2、 3、 4、 5 分别输入 Er、 W2i、 Ei、 W2r 数据，取反器 1 1、 12、 14控制其输出数据的符号为正，取反器 13控制其输出数据的符号为负，选择器 9选择输出端 17第三次运算中输出的运算结果输入有效，选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；输出端 17输出的第四次运算结果作为 X4的虚部运算结果 X4i，输出端 18输出的第四次运算结果作为 X5的虚部运算结果 X5i。以上所述实施例，仅为本发明的较佳实例而已，并非用于限定本发明的保护范围，凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等，均应包含在本发明的保护范围之内。工业实用性如上所述，本发明实施例提供的一种矢量运算核以及矢量处理器具有以下有益效果：由于少用了一个两输入加法器，将两个两输入加法器用三输入加法器替换，使得芯片的面积与功耗方面均有所减少。采用本发明的矢量处理器可以同时支持基 2，基 3，基 5快速傅里叶中的蝴蝶运算；在同时计算基 2蝴蝶运算的两条支路时，由于将乘法运算的次数减少一半，大大降低了电路功耗。

Claims

权利要求书一种矢量运算核，包括：第一运算支路和第二运算支路；所述第一运算支路包括：输入端 1、 2、 3，乘法器 7，二选一选择器 9，取反器 1 1、 12，三输入加法器 15和输出端 17; 所述第二运算支路包括：输入端 4、 5、 6 , 乘法器 8，二选一选择器 10 , 取反器 13、 14，三输入加法器 16和输出端 18 ; 所述取反器 11、 12、 13、 14设置为控制其输出数据的符号；

输入端 1的数据输入到选择器 9的一个选择输入端上，输入端 2、 3的数据输入到乘法器 7的两个输入端上，乘法器 7的输出数据分成两个支路分别输入到取反器 11、 13的输入端上；输入端 6的数据输入到选择器 10的一个选择输入端上，输入端 4、 5的数据输入到乘法器 8的两个输入端上，乘法器 8的输出数据分成两个支路分别输入到取反器 12、 14的输入端上；选择器 9，取反器 1 1、 12的输出数据分别输入到加法器 15的三个输入端上；选择器 10，取反器 13、 14的输出数据分别输入到加法器 16的三个输入端上；加法器 15的输出数据分成两个支路分别输入到输出端 17上和选择器 9的另一个选择输入端上;加法器 16的输出数据分成两个支路分别输入到输出端 18上和选择器 10的另一个选择输入端上。根据权利要求〗所述的矢量运算核，其中，在输入端 I和选择器 9之间，输入端 6和选择器 10之间分别设有一个寄存器；在乘法器 7、 8的输出端，加法器 15、 16的输出端上分别设有一个寄存器。 -种矢量处理器，包括：控制单元以及权利要求 1或 2所述的矢量运算核；所述控制单元设置为控制所述矢量运算核中的选择器 9、 10的输入有效端，还设置为控制所述矢量运算核中的取反器 11、 12、 13、 14的输出数据符号。根据权利要求 3所述的矢量处理器，当用于实现以下的基 2快速傅里叶蝴蝶运算的实部运算时：

X I = C + AB

X2 = C - AB

其中， A, B 和 C 都是复数矢量， B是旋转因子， X1，X2为基 2快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar + j Ai B =Br +j Bi

C =Cr +jCi

XI -Xlr+j Xli

X2 = X2r+j X2i

XI、 X2的实部运算结果为，

Xlr = Cr+[Ar*Br-Ai*Bi]

X2r = Cr - [Ar * Br-Ai * Bi] ,

其中，输入端 1、

2、

3、

4、

5、 6分别输入 Cr、 Ar、 Br、 Ai、 Bi、 Cr数据，所述取反器 11、 14控制其输出数据的符号为正，所述取反器 12、 13控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效，所述输出端 17输出 XI的实部运算结果 Xlr，所述输出端 18输出 X2的实部运算结果 X2r。根据权利要求 3或 4所述的矢量处理器，当用于实现以下的基 2快速傅里叶蝴蝶运算的虚部运算时-

XI = C+AB

X2 = C - AB

其中， A, B 和 C 都是复数矢量， B是旋转因子， X1,X2为基 2快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar + j Ai

B =Br +j Bi

C =Cr +j Ci

XI =Xlr+jXli

X2 = X2r+j X2i

XI、 X2的虚部运算结果为，

Xli = Ci + [Ar*Bi + Ai*Br]

X2i = Ci-[Ar*Bi+Ai *Br] ，

其中，输入端 1、 2、 3、 4、 S、 6分别输入 Ci、 Ar、 Bi、 Ai、 Br、 Ci数据，所述取反器】 1、 12 控制其输出数据的符号为正，所述取反器 13、 14控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效,所述输出端 17输出 XI的虚部运算结果 Xli，所述输出端 18输出 X2的虚部运算结果 X2i。

6. 根据权利要求 3所述的矢量处理器，当用于实现以下的基 3快速傅里叶蝴蝶运算的 X2、 X3实部运算时：

XI =A+B+C

X2=A+B*wl+C*w2

X3 = A+B*conj(wl)+C*conj(w2)

其中， A，B 和 C 都是复数矢量， vvl，w2是旋转因子， X1,X2，X3为基 3快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar + j Ai

B =Br +j Bi

C =Cr +j Ci

Wl = Wlr +j Wli

W2 = W2r +j W2i

XI =Xlr+jXli

X2 = X2r+jX2i

X3 = X3r+jX3i

XI、 X2、 X3的实部、虚部运算结果为，

Xlr = Ar + Br + Cr

Xli=Ai + Bi + Ci

X2r = Ar + [Br * Wlr-Bi * Wli] + [Cr * W2r-Ci * W2i]

X3r = Ar + [Br* Wlr+Bi * Wli] + [Cr * W2r+Ci * W2i]

X2i=Ai + [Br * Wli+Bi * Wlr]+ [Cr * W2i+Ci * W2r]

X3i=Ai + [-Br * Wli+Bi * Wlr] + [-Cr * W2i+Ci * W2r] ，其中，包括两次运算过程；第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ar、 Br、 Wlr、 Bi、 Wli. Ar数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效，所述输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2r、 Ci、 W2i数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第一次运算中输出的运算结果输入有效；所述输出端 17输出的第二次运算结果作为 X2的实部运算结果 X2r,所述输出端 18输出的第二次运算结果作为 X3的实部运算结果 X3r。

7. 根据权利要求 3或 6所述的矢量处理器，当用于实现以下的基 3快速傅里叶蝴蝶运算的 X2、 X3虚部运算时：

XI = A+B+C

X2 = A+B*wl+C*w2

X3 = A+B*conj(wl)+C*conj(w2)

其中， A，B 和 C 都是复数矢量， wl,w2是旋转因子，，X1,X2,X3为基 3快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar + j Ai

B = Br +j Bi

C = Cr +j Ci

W1 = Wlr +j Wli

W2 = W2r +j W2i

XI = Xlr +j Xli

X2 = X2r +j X2i

X3 = X3r +j X3i

XI、 X2、 X3的实部、虚部运算结果为，

Xlr = Ar + Br + Cr

Xli = Ai + Bi + Ci

X2r = Ar + [Br * Wlr-Bi * Wli] + [Cr * W2r-Ci * W2i] X3r = Ar + [Br * Wlr+Bi * Wl i] + [Cr * W2r+Ci * W2i] X2i = Ai + [Br * Wli+Bi * Wlr] + [Cr * W2i+Ci * W2r] X3i = Ai + [-Br * Wl i+Bi * Wlr] + [-Cr * W2i+Ci * W2r| ，其中，包括两次运算过程；第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ai、 Br、 Wli、 Bi、 Wlr、 Ai数据，所述取反器 11、 12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效，所述输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2i、 Ci、 W2r数据，所述取反器 11、 12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第一次运算中输出的运算结果输入有效；所述输出端 17输出的第二次运算结果作为 X2的虚部运算结果 X2i，所述输出端 18输出的第二次运算结果作为 X3的虚部运算结果 X3i。

8. 根据权利要求 3所述的矢量处理器，当用于实现以下的基 5快速傅里叶蝴蝶运算的 X2、 X3实部运算时：

XI =A+B+C+D+E

X2= A+B*w 1 +C*w2+D*w3+E*w4

X3 = A+B*conj(wl)+C*conj(w2)+D*conj(w3)+E*conj(w4)

X4= A+B*w3+C*w 1 +D*w4+E*w2

X5 = A+B*conj(w3)+C*conj(wl)+D*conj(w4)+E*conj(w2)

其中， A， B ，C ，D 和 E 都是复数矢量， wl，w2,w3，w4 是旋转因子, X1,X2,X3,X4,X5为基 5快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar + j Ai

B =Br +j Bi

C =Cr +j Ci

D =Dr +j Di

E = Er +j Ei

Wl = Wlr +j Wli

W2 = W2r +j W2i

W3 = W3r +j W3i

W4 = W4r +j W4i

XI =Xlr+jXli X2 = X2r +j X2i

X3 = X3r + j X3i

X4 = X4r +j X4i

X5 = X5r +j X5i

XI、 X2、 X3、 X4、 X5的实部、虚部运算结果为，

X 1 r = Ar + Br + Cr + Dr + Er

Xli =Ai + Bi + Ci + Di + Ei

X2r = Ar + [Br * Wlr-Bi * Wl i] + [Cr * W2r-Ci * W2i]

+ [Dr * W3r〜Di * W3i]+ [Er * W4r-Ei * W4i]

X3r = Ar + [Br * Wlr+Bi * Wl i] + [Cr * W2r+Ci * W2i]

+ [Dr * W3r+Di * W3i]+ [Er * W4r+Ei * W4i]

X2i = Ai + [Br * Wli+Bi * Wlr] + [Cr * W2i+Ci * W2r]

+ [Dr * W3i+Di * W3r] + [Er * W4i+Ei * W4r]

X3i = Ai + [-Br * Wl i+Bi * Wlr]+ [-Cr * W2i+Ci * W2r]

+ [-Dr * W3i+Di * W3r]+ [-Er * W4i+Ei * W4r]

X4r = Ar + [Br * W3r-Bi * W3i]+ [Cr * Wlr-Ci * Wli]

+ [Dr * W4r-Di * W4i]+ [Er * W2r-Ei * W2i]

X5r = Ar + [Br * W3r+Bi * W3i]+ [Cr * Wlr+Ci * Wl i]

+ [Dr * W4r+Di * W4i]+ [Er * W2r+Ei * W2i]

X4i = Ai + [Br * W3i+Bi * W3r] + [Cr * Wl i+Ci * Wlr]

+ [Dr * W4i+Di * W4r]+ [Er * W2i+Ei * W2r]

X5i = Ai + [-Br * W3i+Bi * W3r] + [-Cr * Wli+Ci * Wlr]

+ [-Dr * W4i+Di * W4r]+ [-Er * W2i+Ei * W2r] ，

其中，包括四次运算过程；第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ar、 Br、 Wlr、 Bi、 Wli, Ar数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效，所述输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2r、 Ci、 W2i数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入,所述输出端 18 输出的运算结果作为第三次运算中选择器 10的数据选择输入;第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W3r、 Di、 W3i数据，所述取反器 11、 13、 14 控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第四次运算中选择器 10的数据选择输入;第四次运算中输入端 2、 3、 4、 5分别输入 Er、 W4r、 Ei、 W4i数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9 选择输出端 17第三次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；所述输出端 17输出的第四次运算结果作为 X2的实部运算结果 X2r，所述输出端 18输出的第四次运算结果作为 X3的实部运算结果 X3r。

9. 根据权利要求 3所述的矢量处理器，当用于实现以下的基 5快速傅里叶蝴蝶运算的 X2、 X3虚部运算时：

XI - A+B+C+D+E

X2= A+B*wl+C*w2+D*w3+E*w4

X3 = A+B*conj(wl)+C*conj(w2)+D*conj(w3)+E*conj(w4)

X4= A+B*w3+C*wl+D*w4+E*w2

X5 = A+B*conj(w3)+C*conj(wl)+D*conj(w4)+E*conj(w2)

其中， A， B ,C ,D 和 E 都是复数矢量， wl,w2，w3，w4 是旋转因子， X1,X2,X3,X4,X5为基 5快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar + j Ai

B = Br +j Bi

C = Cr +j Ci

D = Dr +j Di

E = Er +j Ei [J I * !3+i I . * J3-] + [J£ * !8+!£M * ^-] + !V=!SX

[J2AV * !a+ϊΖ * ^J3] +[^Jfr * ]Q+} A * ^JCt] +

[JI * ! +!IM * ^J3] * !Η+!£Λ\. * ·>8] + !V-! X

* !a+JZAV *■¾] + [it' . * !a-+J†7 * · 3] +

[!I * D+JIM * J3] * ia+J£ * JQ] +JV = JSX

[ M * !3-->2 * JH] * !d- * +

[!IM * !CHIA *·Ό] * !H-J£ *·!9] + JV = JfrX

[ * !H+! AV * J3-] +[^J£ . * * ·>α·] +

Z^A * ! +!ZM * ^J3_] + [JI * !9+!l * J8-] + !V=!CX

[J^AV * !3+!tM * ¾] + [J£ . * <α+!£ * ·Ό] +

[JZM * * J3] + [JIA * !9+!l *』8] + !V= ! X

[!frM * !3+ * J3] * !0+J£ * ·»。] +

[}ΖΆ * !O+JZ . * ->D] +[!I * !H+J[ * ] + ^V = ^£X

[ /A * !H-J^ . * J3] * !CI— *■>(!] +

* !D-J^ * JDi * !8- J【M * ]+^V = ^ZX

!3 + !a + ! + !8 + !V=!IX

JH + ^ja + ^J3 + + JV = JIX

SX X 、O 、ZX MX

!S i + JSX = SX

!£Xf + J£X = £X

IZ

M6..0/M0ZN3/X3d ZS^6C0/S10Z OAV 其中，包括四次运算过程；第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ai、 Br、 Wl i、 Bi、 Wlr、 Ai数据，所述取反器 11、 12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效，所述输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 W2i、 Ci、 W2r数据，所述取反器 11、 12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入，所述输出端 18 输出的运算结果作为第三次运算中选择器 10的数据选择输入;第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W3i、 Di、 W3r数据，所述取反器 11、 12、 14 控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第四次运算中选择器 10的数据选择输入;第四次运算中输入端 2、 3、 4、 5分别输入 Er、 W4i、 Ei、 W4r数据，所述取反器 11、 12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9 选择输出端 17第三次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；所述输出端 17输出的第四次运算结果作为 X2的虚部运算结果 X2i，所述输出端 18输出的第四次运算结果作为 X3的虚部运算结果 X3i。

10. 根据权利要求 3所述的矢量处理器，当用于实现以下的基 5快速傅里叶蝴蝶运算的 X4、 X5实部运算时 -

XI = A+B+C+D+E

X2= A+B *w 1 +C*w2+D*w3+E*w4

X3 = A+B*conj(wl)+C*conj(w2)+D*conj(w3)+E*conj(w4)

X4= A+B*w3+C*wl+D* 4+E*w2

X5 = A+B*conj(w3)+C*conj(wl)+D*conj(w4)+E*conj(w2) 其中， A, B ,C ,D 和 E 都是复数矢量， wl,w2,w3，w4 是旋转因子， X1,X2,X3,X4,X5为基 5快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar + j Ai

B = Br +j Bi

C =Cr +jCi

D =Dr +j Di

E =Er +j Ei

W1 = Wlr +j Wli

W2 = W2r +j W2i

W3 = W3r +jW3i

W4 = W4r +j W4i

XI： -Xlr + jXli

X2- = X2r+jX2i

X3- = X3r+jX3i

X4 = X4r+jX4i

X5: = X5r+j 5i

XI、 X2、 X3、 X4、 X5的实部、虚部运算结果为，

X 1 r = Ar + Br + Cr + Dr + Er

Xli-Ai + Bi + Ci + Di + Ei

X2r = Ar + [Br * Wlr-Bi * Wli]+ [Cr * W2r-Ci * W2i]

+ [Dr * W3r-Di * W3i]+ [Er * W4r-Ei * W4i]

X3r = Ar+ [Br* Wlr+Bi * Wli] + [Cr * W2r+Ci * W2i]

+ [Dr * W3r+Di * W3i]+ [Er * W4r+Ei * W4i]

X2i =Ai + [Br * Wli+Bi * Wlr] + [Cr * W2i+Ci * W2r]

+ [Dr * W3i+Di * W3r]+ [Er * W4i+Ei * W4r]

X3i = Ai + [-Br * Wli+Bi * Wlr] + [-Cr * W2i+Ci * W2r]

+ [-Dr * W3i+Di * W3r] + [-Er * W4i+Ei * W4r]

X4r = Ar + [Br * W3r-Bi * W3i]+ [Cr * Wlr-Ci * Wli]

+ [Dr * W4r-Di * W4i]+ [Er * W2r-Ei * W2i] X5r = Ar + [Br * W3r+Bi * W3i]+ [Cr * Wlr+Ci * Wli]

+ [Dr * W4r+Di * W4i]+ [Er * W2r+Ei * W2i]

X4i = Ai + [Br * W3i+Bi * W3r] + [Cr * Wl i+Ci * Wlr]

+ [Dr * W4i+Di * W4r]+ [Er * W2i+Ei * W2r]

X5i = Ai + [-Br * W3i+Bi * W3r] + [-Cr * Wli+Ci * Wlr] + [-Dr * W4i+Di * W4r] + [-Er * W2i+Ei * W2r] ，

其中，包括四次运算过程；第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ar、 Br、 W3r、 Bi、 W3i、 Ar数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效，所述输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 Wlr, Ci、 Wli数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入,所述输出端 18 输出的运算结果作为第三次运算中选择器 10的数据选择输入;第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W4r、 Di、 W4i数据，所述取反器 11、 13、 14 控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第四次运算中选择器 10的数据选择输入;第四次运算中输入端 2、 3、 4、 5分别输入 Er、 W2r、 Ei、 W2i数据，所述取反器 11、 13、 14控制其输出数据的符号为正，所述取反器 12控制其输出数据的符号为负，所述选择器 9 选择输出端 17第三次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；所述输出端 17输出的第四次运算结果作为 X4的实部运算结果 X4r，所述输出端 18输出的第四次运算结果作为 X5的实部运算结果 X5r。

11. 根据权利要求 3或 8或 9或 10所述的矢量处理器，当用于实现以下的基 5快速傅里叶蝴蝶运算的 X4、 X5虚部运算时： XI =A+B+C+D+E

X2= A+B*wl+C*w2+D*w3+E*w4

X3 = A+B*conj(wl)+C*conj(w2)+D*conj(w3)+E*conj(w4)

X4= A+B*w3+C*wl+D*w4+E*w2

X5 = A+B*conj(w3)+C*conj(wl)+D*conj(w4)+E*conj(w2)

其中， A， B ，C ,D 和 E 都是复数矢量， wl，_W2，w3,w4 是旋转因子， X1,X2,X3,X4,X5为基 5快速傅里叶蝴蝶运算输出矢量；进行实部虚部分解后，

A = Ar +j Ai

B =Br +j Bi

C =Cr +j Ci

D =Dr +j Di

E =Er +j Ei

W1 = Wlr +j Wli

W2 = W2r +j W2i

W3 = W3r +j W3i

W4 = W4r +j W4i

XI = = Xlr+jXli

X2 = = X2r + jX2i

X3 = = X3r+jX3i

X4: = X4r+jX4i

X5 = = X5r+j X5i

XI、 X2、 X3、 X4、 X5的实部、虚部运算结果为，

Xlr = Ar + Br + Cr + Dr + Er

Xli=Ai + Bi + Ci + Di + Ei

X2r = Ar + [Br * Wlr-Bi * Wli] + [Cr * W2r-Ci * W2i]

+ [Dr * W3r-Di * W3i]+ [Er * W4r-Ei * W4i]

X3r = Ar + [Br * Wlr+Bi * Wli]+ [Cr * W2r+Ci * W2i]

+ [Dr * W3r+Di * W3i]+ [Er * W4r+Ei * W4i]

X3i = Ai + [-Br * Wl i+Bi * Wlr]+ [-Cr * W2i+Ci * W2r]

+ [-Dr * W3i+Di * W3r]+ [-Er * W4i+Ei * W4r]

X4r = Ar + [Br * W3r-Bi * W3i]+ [Cr * Wlr-Ci * Wli]

+ [Dr * W4r-Di * W4i]+ [Er * W2r-Ei * W2i]

X5r = Ar + [Br * W3r+Bi * W3i]+ [Cr * Wlr+Ci * Wli]

+ [Dr * W4r+Di * W4i]+ [Er * W2r+Ei * W2i]

X4i = Ai + [Br * W3i+Bi * W3r] + [Cr * Wli+Ci * Wlr]

+ [Dr * W4i+Di * W4r]+ [Er * W2i+Ei * W2r]

X5i = Ai + [-Br * W3i+Bi * W3r] + [-Cr * Wli+Ci * Wlr]

+ [-Dr * W4i+Di * W4r] + [-Er * W2i+Ei * W2r] ，

其中，包括四次运算过程；第一次运算中输入端 1、 2、 3、 4、 5、 6分别输入 Ai、 Br、 W3i、 Bi、 W3r Ai数据，所述取反器 11、

12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输入端 1的数据输入有效，所述选择器 10选择输入端 6的数据输入有效，所述输出端 17输出的运算结果作为第二次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第二次运算中选择器 10的数据选择输入；第二次运算中输入端 2、 3、 4、 5分别输入 Cr、 Wli, Ci、 Wlr数据，所述取反器 11、 12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输出端 17第一次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第一次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第三次运算中选择器 9的数据选择输入，所述输出端 18 输出的运算结果作为第三次运算中选择器 10的数据选择输入;第三次运算中输入端 2、 3、 4、 5分别输入 Dr、 W4i、 Di、 W4r数据，所述取反器 11、 12、 14 控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9选择输出端 17第二次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第二次运算中输出的运算结果输入有效，所述输出端 17输出的运算结果作为第四次运算中选择器 9的数据选择输入，所述输出端 18输出的运算结果作为第四次运算中选择器 10的数据选择输入;第四次运算中输入端 2、 3、 4、 5分别输入 Er、 W2i、 Ei、 W2r数据，所述取反器 11、 12、 14控制其输出数据的符号为正，所述取反器 13控制其输出数据的符号为负，所述选择器 9 选择输出端 17第三次运算中输出的运算结果输入有效，所述选择器 10选择输出端 18第三次运算中输出的运算结果输入有效；所述输出端 17输出的第四次运算结果作为 X4的虚部运算结果 X4i，所述输出端 18输出的第四次运算结果作为 X5的虚部运算结果 X5i。