CN2579091Y - 利用阵列处理进行数据检测的用户装置 - Google Patents

利用阵列处理进行数据检测的用户装置 Download PDF

Info

Publication number
CN2579091Y
CN2579091Y CN02285529U CN02285529U CN2579091Y CN 2579091 Y CN2579091 Y CN 2579091Y CN 02285529 U CN02285529 U CN 02285529U CN 02285529 U CN02285529 U CN 02285529U CN 2579091 Y CN2579091 Y CN 2579091Y
Authority
CN
China
Prior art keywords
matrix
subscriber equipment
array
processor
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN02285529U
Other languages
English (en)
Inventor
P·E·贝克尔
S·S·萨普利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital Technology Corp
Original Assignee
InterDigital Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital Technology Corp filed Critical InterDigital Technology Corp
Application granted granted Critical
Publication of CN2579091Y publication Critical patent/CN2579091Y/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/12Simultaneous equations, e.g. systems of linear equations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/69Spread spectrum techniques
    • H04B1/707Spread spectrum techniques using direct sequence modulation
    • H04B1/7097Interference-related aspects
    • H04B1/7103Interference-related aspects the interference being multiple access interference
    • H04B1/7105Joint detection techniques, e.g. linear detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/667Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/69Spread spectrum techniques
    • H04B1/707Spread spectrum techniques using direct sequence modulation
    • H04B1/7097Interference-related aspects
    • H04B1/7103Interference-related aspects the interference being multiple access interference
    • H04B1/7105Joint detection techniques, e.g. linear detectors
    • H04B1/71055Joint detection techniques, e.g. linear detectors using minimum mean squared error [MMSE] detector

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Multimedia (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

一种用于恢复来自作为接收向量接收的多个数据信号的数据的用户设备。在一种实施例中,该用户设备通过确定一个NxN矩阵的乔里斯基因数来确定接收向量的数据。该用户设备包括一个处理组件阵列。该阵列的每个处理组件接收NxN矩阵的对角线组件,并确定相应的乔里斯基因数的对角线组件。在另一实施例中,该用户设备通过确定一个NxN矩阵的乔里斯基因数来确定接收向量的数据,并将确定的乔里斯基因数用于前向和后向替换来确定接收到的数据信号的数据,该用户设备包括一个具有最多N个标量处理组件的阵列。该阵列具有一个输入端,用于接收来自NxN矩阵和接收向量的组件。每个标量处理组件用于确定乔里斯基因数,并执行前向和后向替换。阵列输出接收向量的数据。在另一实施例中,该用户设备通过确定一个NxN矩阵的乔里斯基因数来确定接收向量的数据。该用户设备包括一个标量处理组件阵列。每个处理组件与NxN矩阵的一个组件相对应,并确定相应的乔里斯基因数的组件。

Description

利用阵列处理进行数据检测的用户装置
技术领域
本实用新型涉及解决线性系统,尤其涉及利用阵列处理的解决线性系统。
背景技术
线性系统解决方案用于解决许多工程问题。问题之一是使用码分多址(CDMA)技术的时分双工(TDD)通信系统中的多用户信号的联合用户检测。在这些系统中,多用户按同样的固定持续时间间隔(时隙)同时发送多通信突发。利用不同的扩频码传输多突发。在传输过程中,每个突发均获得一个信道响应。一种从传输的突发中恢复数据的方法是联合检测,其中同时接收所有用户数据。图1显示了一个这样的系统。在用户设备或基站中可使用联合检测接收器。
多突发90在获得信道响应之后,由天线92或天线阵作为组合接收信号接收。接收信号在基站可由解调器94进行减弱,并且由一个模数转换器或多个模数转换器按一个码片率或多个码片率进行取样,以产生接受向量 r。信道估测装置98利用通信突发的训练序列部分来估测突发90的信道响应。联合检测装置100利用估测的或已知的用户突发扩频码以及估测的或已知的信道响应来将所有用户的原始传输数据估测为数据向量 d
联合检测问题的通常模式为公式1。
A d+ nr                                    公式1
d为传输数据向量; r为接收常量; n为附加白高斯噪声(AWGN);A为通过将信道响应与已知扩频码缠绕所形成的M×N矩阵。
解决公式1的两中方法是迫零准则(ZF)和最小均方误差(MMSE)方法。ZF解决方案按照公式2,其中n接近于零。
d=(AHA)-1AH r                              公式2
MMSE方法按照公式3和4。
d=R-1AHr                                     公式3
R=AHA+σ2I                                   公式4
σ2为噪声方差,n和I为单位矩阵。
借助扩频码,可估测或知道信道响应和平均噪声向量,接收向量为已知,唯一未知的变量是数据向量 d。对于两种方法的强力型解决方案,如:直接矩阵逆转极端复杂。一种降低复杂性的方法是乔里斯基分解。乔里斯基算法通过公式5将对称正定矩阵,如 或R化为下三角矩阵G和上三角矩阵GH因数。 A ~ orR = GG H 公式5
可按照公式6将A与其共轭转置(赫米特)AH相乘产生对称正定矩阵
Figure Y0228552900063
A ~ = A H A 公式6
为了简便,按照公式7定文
Figure Y0228552900065
r ~ = A H r ‾ 公式7
结果,公式1对于ZF写成公式8或对于MMSE写成公式9。 A ~ d ‾ = r ~ 公式8 R d ‾ = r ~ 公式9
为了解决公式8或9,按照公式10使用乔里斯基因数。 GG H d ‾ = r ~ 公式10
按照公式11定义变量y。
GHd=y                                          公式11
利用变量y,将公式10写成公式12。 Gy = r ~ 公式12
获得数据向量的体积复杂性可按三个步骤进行。第一步,根据公式13从衍生的对称正定矩阵,如
Figure Y02285529000611
或RR中生成G。 G = CHOLESKY ( A ~ orR ) 公式13
按照公式14,利用G,采用公式8中的G的前向替换解决y。 y = FORWARDSUB ( G , r ~ ) 公式14
按照公式15,利用G的共轭转置GH采用公式11中的反向替换解决 d
d=BACKWARDSUB(GH,y)                            公式15
按照公式13的一种决定乔里斯基因数G的方法为以下所显示的用于
Figure Y0228552900072
或R的算法,但是一种类似算法可用于R。
fori=1:N
 forj=max(1,i-P):i-1
   λ=min(j+P,N) a i : λ , i = a i : λ , i - a i , j * · a i : λ , j ;
 end for;
 λ=min(i+P,N)
 ai:λ,i=ai:λ,i/aii
end for; G = A ~ orR ;
ad,e表示矩阵
Figure Y0228552900075
或R的d行、e列的组件。“:”表示“到”算子,如:“从j到N”,(·)H表示共轭转置(赫米特)算子。
解决乔里斯基因数的另一方法使用N个基于平行向量的处理器。每个处理器映射到
Figure Y0228552900076
或R矩阵的一列。每个处理器的列由变量μ定义,其中μ=1:N。基于平行处理器的子程序可看作是以下μ=1:N的子程序。
j=1
whilej<μ
   recv(gj:N,left)
   ifμ<N
      send(gj:N,right)
   end a μ : N , μ = a μ : N , μ - g μ * g μ : N
   j=j+1
end a μ : N , μ = a μ : N , μ / a μμ
ifμ<N
   send(aμ:N,μ,right)
end
recv(·,left)是来自左处理器算子的接收值send(·,right)是来自右处理器算子的发送值;gK,L是来自邻近处理器的值。
该子程序如图2a-2h所示。图2a是显示向量处理器和相应的联合检测装置的存储单元的框图。从501到50N(50)的各处理器在矩阵的一列上运算。由于矩阵G为下三角矩阵,而
Figure Y0228552900083
或R由下三角部分定义,因此仅使用下三角组件ak,1
图2b和2c显示处理器实施于其下面的单元的两种可能的函数。在图2b中,下指三角函数52在μ处理器50下面的单元(aμμ到a)上实施公式16和17。 v ← a μ : N , μ / a μμ 公式16
aμ:N,μ:=v                                    公式17
″←″表示并发赋值;“:=”表示顺序附值;v是发送到右处理器的值。
在图2c中,右指三角函数52在μ处理器50下面的单元上实施公式18和19。
v←u                                               公式18
aμ:N,μ:=aμ:N,μ-vμvμ:N                 公式19
vk表示与第k个处理器50的正确值相关的值。
图2d-2g表示实施于一个4×4G矩阵的数据流和函数。如图2d-2g所示,对于1到4的每个处理阶段,最左处理器50回动(drop out),下指三角函数52从左移到右。为了实施图2d-2g,下指三角函数可物理替代右边的处理器或通过采取下指三角函数实质替代右边的处理器。
这些组件可以通过如图2h的第一阶段所示,在四处理器504的右边增加处理器50(数量为N-4),并且通过为每个处理器50增加矩阵底对角(数量为N-4)来扩展成一个N×N矩阵和N个处理器50。该装置的处理过程可分成N个阶段。
利用向量处理器或直接分解进标量处理器来实施这样的乔里斯基分解效率低下,因为大量处理资源在每个处理阶段之后即闲置。
实用新型内容
一种从作为接收向量接收到的数据信号中恢复数据的用户设备。在一种实施例中,接收向量的数据利用一个N×N矩阵的乔里斯基因数确定。用户设备包括一个处理组件阵列。每个阵列处理组件接收N×N矩阵的对角线的组件,并且决定乔里斯基因数相应的对角线组件。在另一实施例中,利用N×N阵列的乔里斯基因数以及实施前向和后向替换来决定接受向量的数据。用户设备包括一个具有最多N个标量处理组件的阵列。阵列具有输入端,用于接收来自N×N阵列的组件,以及接收向量。利用每个标量处理组件来决定乔里斯基因数和实施前向和后向替换。阵列输出接收向量的数据。在另一实施例中,利用N×N阵列的乔里斯基因数决定接收向量的数据。用户设备具有一个标量处理组件阵列。每个处理组件与N×N矩阵的组件相关,并决定乔里斯基因数的相应组件的组件。
附图说明
图1为一个联合检测接收器的简化示意图。
图2a-2h说明利用向量处理器决定乔里斯基因数。
图3a和3b为执行乔里斯基分解的N标量处理器的较佳实施例。
图4a-4e说明利用三维图表进行乔里斯基分解的实施例。
图5a-5e说明将执行乔里斯基分解的向量处理器映射到标量处理器上的实施例。
图6a-6d说明对于非带状矩阵的标量阵列的处理流程,图6e-6j说明对于带状矩阵的标量阵列的处理流程。
图7为使图4a的投射沿着N×N矩阵的K轴延伸的示意图。
图8a-8d说明在二维标量阵列内的标量处理器之间使用延迟的处理流程。
图8e为延迟组件及其相应公式的示意图。
图9a说明将图8a-8d的标量处理器阵列投射到四标量处理器的一维阵列上。
图9b说明将每隔一个处理器之间存在延迟的标量处理阵列投射到四标量处理器的一维阵列上。
图9c-9n说明每隔一个处理器之间存在延迟的带状矩阵的乔里斯基分解的处理流程。
图9o-9z说明处理一个带状矩阵的线性阵列的存储器存取。
图10a和10b为延伸到N标量处理器的图9a和9b所示的投射阵列。
图11a和11b说明将除/平方根函数从图10a和10b所示的阵列中区分出来。
图12a说明将每个处理器之间存在延迟的前向替换阵列投射到四标量处理器上。
图12b说明将每隔一个处理器之间存在延迟的前向替换阵列投射到四标量处理器上。
图12c和12d显示由前向替换的星形和钻形函数执行的公式。
图12e说明在每隔一个处理器之间存在并发附值的带状矩阵的前向替换的处理流程。
图12f-12j说明每个处理器之间存在并发附值的带状矩阵的前向替换的处理流程。
图12k-12p说明处理带状矩阵的前向替换线性阵列的存储器存取。
图13a和13b为延伸到N标量处理器的图12a和12b所示的投射阵列。
图14a-14d说明图12b所示的投射阵列的处理流程。
图15a说明将每个处理器之间存在延迟的反向替换阵列投射到四标量处理器上。
图15b说明将每隔一个处理器之间存在延迟的反向替换阵列投射到四标量处理器上。
图15c和15d显示由前向替换的星钻函数执行的公式。
图15e说明在每隔一个处理器之间存在并发附值的带状矩阵的后向替换的处理流程。
图15f-15j说明每个处理器之间存在并发附值的带状矩阵的后向替换的处理流程。
图15k-15p说明处理带状矩阵的后向替换线性阵列的存储器存取。
图16a和16b为延伸到N标量处理器的图15a和15b所示的投射阵列。
图17a-17d说明图15b所示的投射阵列的处理流程。
图18a和18b为除法函数区分后的图13a、13b、16a和16b所示的阵列。
图19a和19b为一个用于决定G的前向和后向替换的可重构阵列。
图20a和20b说明使除和平方根函数从可重构阵列中脱离。
图21a说明双向折叠。
图21b说明单向折叠。
图22a为利用N处理器执行双向折叠。
图22b为利用N处理器执行单向折叠。
图23为一个简单的可重构处理组件的较佳部分。
具体实施方式
图3a和3b为执行乔里斯基分解以便获得G的N个标量处理器541到54N(54)。为了简便,本文的说明和描述将以一个4×4G矩阵为例,但是该方法可延伸用于如图3a和3b所示的任何N×NG矩阵。
图4说明一个用于执行前述算法的三维计算依赖关系图。为了简便,图4a说明处理一个带宽为3的5×5矩阵。图4b-4e显示各节点所执行的函数。图4b的五角函数执行公式20和21。 y ← a in 公式20
aout←y                                                      公式21
←表示并发附值,ain为从较低层次到节点的输入,aout为向更高层次的输出。图4c为执行公式22和23的平方函数。
y←z*                                                        公式22
aout←ain-|z|2                                               公式23
图4d为执行公式24、25和26的八角函数。
y←w                                                         公式24
x←ain/w                                                    公式25
aout←x                                                 公式26
图4e为执行公式27、28和29的圆函数。
y←w                                                    公式27
x←z                                                    公式28
aout←ain-w*z                                           公式29
图5a显示将基于一个4×4G矩阵的乔里斯基分解的向量的第一阶段影射到一个基于二维标量的方法的第一阶段。如图5a所示,每个向量处理器52、54映射到至少一个标量处理器56、58、60、62上。每个标量处理器56、58、60、62相应于存储单元aij。图5b-5e显示由每个处理器56、58、60、62执行的函数。图5b显示的五角函数执行公式30和31。 y = a ij 公式30
aij:=y                                                公式31
:=表示顺序附值。y表示发送到下处理器的值。图5c说明的八角函数58执行公式32、33和34。
y←w                                                    公式32
x←aij/w                                               公式33
aij:=x                                               公式34
w表示发送自上处理器的值。图5d说明的平方函数60执行公式35和36。
y←z*                                                   公式35
aij:=aij-|z|2                                       公式36
x表示发送到右处理器的值。图5e说明的圆函数62执行公式37、38和39。
y←w                                                    公式37
x←z                                                    公式38
aij:=aij-w*z                                           公式39
图6a-6d说明在四个顺序的阶段(阶段1到4)内通过标量处理器56、58、60、62的数据流。如图6a-6d所示,处理器56、58的一列在每个阶段之后掉落。该过程通常需要4个处理圆或N。每个阶段用一个处理圆。如图5a所示,需要十(10)个标量处理器来决定一个4×4矩阵。对于一个N×N矩阵,其所需处理器数量按照公式40计算。 No . RequireScalarProcessors = Σ i = 1 N i = N ( N + 1 ) 2 = N 2 + N 2 公式40
图6e-6j说明一个带状5×5矩阵的处理流程。活动处理器未准备就绪。带状矩阵具有三个左下入口((a41,a51,a52,图6e-6j未显示)为零。如图6e所示,六个上处理器在第一阶段运行。如图6f所示,第一阶段的六个活动处理器已经决定了g11,g21和g31以三个中间结果a22,a32和a33供第二阶段使用。
在第二阶段中,六个处理器(a22,a32,a33
Figure Y0228552900134
)运行。如图6g(阶段3)所示,g22,g32和g42的值,以及β33,β43,β44的中间值已在阶段2中确定。在图6h(阶段4)中,g33,g43和g53的值,以及rγ44,γ54andγ55的中间值已经确定。在图6i(阶段5)中,g44和g54的值以及δ55的中间值已经确定。在图6j(最后阶段)中可得到剩余的g55值。如图所示,由于矩阵的带状性质,因此不必要采用无负载矩阵的左下处理器,附图中也没有显示。
图6a-6d的简化的说明可扩展为图7所示的N×N矩阵。如该图所示,最上处理器56执行一个五角函数。八角函数处理器58在第一列之下延伸,而双重用途的平方/五角处理器64沿着主对角线延伸,形成如图所示的两个组合形状。其他处理器66为双重用途的八角/圆处理器66,形成如图所示的两个组合形状。该配置决定仅使用标量处理器的N个处理循环内的N×N矩阵。
如果矩阵的带宽为固定宽度,如P,便可减少处理组件的数量。例如,如果P等于N-1,则aN1的左下处理器可省去。如果P等于N-2,则又可省去两个处理器(aN-11和aN2)。
现结合图8a-8e和9a和9b进一步说明减少标量处理组件的数量。图8a-8e描绘如图6a-6d所示的四(4)个标量处理器执行的一维执行平面。一个图8e所示的延迟组件68插入图8a所示的并发连接。图8e所示的延迟组件68按照公式41延迟输入y,使其成为顺序输出x。
y:=x                                                   公式41
对于每个开始于t1的处理循环而言,如图所示,处理器根据显示执行平面的对角线顺序处理。例如,在时间t1,仅有a11的处理器56运行。在t2仅有a21的处理器58运行,在t3,仅有a31和a22的处理器58,60运行,依次类推直至阶段4的t16,此时仅a44的处理器56运行。结果,整个处理过程需要N2个跨越N个阶段的时钟循环。
多个矩阵可通过二维标量处理阵列进行流水线操作。如图8a-8d所示,在特定的实施平面上,t1到t16为主动。对于特定阶段,可同时处理至多与实施平面数量相同的矩阵。例如,在阶段1,沿着对角线t1处理第一矩阵。在下一时钟循环,第一矩阵传递到平面t2,而平面t1用于第二矩阵。流水线操作可延续到任意数量的矩阵。流水线操作的一个缺点是,流水线操作要求存储所有矩阵的数据,除非矩阵数据的可用性时间表不会导致失速(stall)。
当一组矩阵经过阶段1的流水线操作后,对该组进行阶段2的流水线操作,并依次类推直至阶段N。利用流水线操作,阵列的吞吐量以及处理器的利用率可显著改善。
由于在仅处理一个矩阵时,处理器56,58,60,62在每个时钟循环周期内均未使用,因此可通过跨越实施平面对其进行共享来减少处理组件56,58,60,62的数量。图9a和9b说明减少处理组件的两种较佳实施例。如图9a所示,第一列的每个处理组件56,58均具有一条与实施平面(沿着矩阵对角线)垂直的线。由于沿着每条垂直线的处理器56,58,60,62均在不同的处理循环内运行,因此其函数56,58,60,62可由投射在下面的单一处理器66,64来执行。处理函数56和60由新组合的函数64执行。处理函数58和62由新组合的函数66执行。同样投射延迟组件68和处理器之间的连接。尽管如图所示,最左处理组件使用双重函数组件66,但是如果为了便于非带状矩阵,该组件可简化为仅执行八角函数58。
图10a为图9a的扩展,用于容纳一个N×NG矩阵。如图10a所示,N个处理器66,64用来处理N×NG矩阵。如图3a所示,图10a的处理函数可由N个标量处理器54执行。同样数量的带宽为P的标量处理器可用来处理在带状情形下的G矩阵。
在图3a的实施中,每个处理器用于每隔一个时钟循环中。偶数处理器在一个循环中运行,奇数处理器在下一个循环中运行。例如,图9a的处理器2(右边第2个)在时间t2,t4和t6运行,而处理器3在时间t3和t5运行。结果,通过将其间隔作为阵列的输入,处理阵列可同时决定两个G矩阵。该方法在图7所示的应用中可大大改善处理器的利用率。
为了减少单一阵列的处理时间,可使用图9b所示的实施方式。如图9b所示,将每隔一个处理器连接之间的延迟组件移去。在时间t1,仅有a11处理器56运行。然而,在时间t2,a21,a22和a31的处理器58,60全部运行。用样如图9a所示,将该阵列沿着垂直线(沿着原始矩阵的对角线)投射。如图所示,延迟组件68的数量减半。利用该阵列,处理一个N×NG矩阵的时间为单元(NP-(P2-P)/2)。因此,可大大减少处理一个单一G矩阵的时间,
图7、3a和3b所示的实施方式的另一优点为,每个处理阵列均可缩放为矩阵带宽。对低带宽(下对角线组件为零)矩阵而言,图7中这些组件的处理器58,66可省。对于图3a和3b,由于下对角线组件相应于图9a和9b的最左垂直线,因此可以省去通过这些垂直线投射的处理器。例如,利用图9a,矩阵带宽将a41,a31和a42的处理组件58,62设为零。结果,到处理器66(最左边的两个)的投射不必处理。结果,这些实施方式可缩放为矩阵带宽。
图9c-9n为带宽为3,并在每个连接之间存在延迟的一个带状5×5矩阵的每个处理循环的时序图。在每个时间阶段,显示与每个处理器相关的值。活动处理器未准备就绪。如图所示,处理通过阵列从图9c中的阶段1,时间0 的左上处理器扩展到图9n中的阶段5(δ55)的右下处理器。如图所示,由于矩阵的带状性质,非带状矩阵的左下处理器不必要进行处理,图中也没有显示。
图9o-9z显示一个线性阵列的每个处理循环的时序图和存储器存取,如按照图9b处理一个5×5带状矩阵。如图所示,由于5×5矩阵的带宽为3,因此仅需要三个处理器。附图说明了仅需要三个处理器来处理带状矩阵。同样如图所示,每个阶段均具有较高的处理器利用率,并随N/p的提高而提高。
为了降低处理组件的复杂性,除法和平方根函数不由这些组件执行(拉出)。除法和平方根函数在专用集成电路(ASIC)上执行的复杂程度要高于在加法器、减法器和乘法器上的执行。
仅有的两个执行除法或平方根的函数为五角和八角函数56,58。对于特定阶段,如图6a-6d所示,五角和八角函数56,58在一个阶段内均在单一列上执行。特别是,每一个这些列在顶部具有五角形56,底部具有八角形58。由于每个八角形58将其w输入值并发附值给其y输出值,因此五角形56的输出值沿整列流下,w值没有直接存储用于任何aij。八角形58也利用w输入值来产生x输出值,并反馈到aij。平方和圆函数60,62利用x输出值进行其aij计算。结果,仅需要确定每个八角形的x输出值。八角形的x输出值为每个八角形相同的八角形58除以w输入值的aij,以及五角形56的y输出值。因此,需要执行的唯一的除法/平方根函数是计算八角形58的x值。
利用公式34和30,每个八角形的x输出值是该八角形的aij除以五角形的aij的平方根。对于一个特定阶段,在每个八角形处理器内用乘法器代替除法器,仅需要确定五角形的aij的平方根的倒数来代替平方根,孤立除法函数,仅使用五角形处理器,并简化阵列的整体复杂性。然后将平方根倒数保存为与五角形相关的矩阵组件的aij来代替倒数。这也将方便后续的前向和后向替换,因为在这些算法中的除法函数成为该倒数值的倍数,于是进一步消除了对其他处理组件中的除法器,即:图12d和15d中的x输出值的需要。由于图9a和9b中所示的五角函数56由相同的处理器64执行,因此如图10a和10b所示,可利用具有来五角/平方处理器64的一个输入值和一个输出到该处理器64的输出值的单一倒数/平方根电路70来执行处理器66,64。平方根倒数的结果通过处理器66传递。图11a和11b相应于图10a和10b。分离倒数/平方根函数70简化了其他处理器66,64的复杂性。尽管可通过利用一个倒数和一个平方根电路执行除法/平方根电路70,但是,更适宜利用查阅表来实施,对于存储器成本效率高的现场可编程门阵列(FPGA)而言尤其如此。
在决定了乔里斯基因数G之后,利用如图12a和12b所示的前向替换确定y。前向替换的算法如下:
for j=1:N y i = 1 g ij ( r j - Σ i = 1 j - 1 g ji y i )
end
对于带状阵列,算法如下:
for j=1:N
   for i=j+1:min(j+p,N)
      ri=ri-Gijrj
   end for;
end for;
y=rj
gLK为乔里斯基矩阵G的L行,K列的相应组件。
图12a和12b为使用标量处理器的4×4G矩阵的前向替换的两个实施例。两个函数由处理器72,74以及图12c的星形函数72和图12d的钻形函数74执行。星形函数72执行公式42和43。
y←w                                                        公式42
x←z-w*gij                                                 公式43
钻形函数74执行公式44and45.
x←z/gij                                                   公式44
y←x                                                        公式45
如图12a所示,在处理组件的并发连接之间插入延迟元件,以及将阵列垂直线投射到实施平面(t1到t7)上允许阵列投射到一个线性阵列上,。将从
Figure Y0228552900172
,r1-r4接收到的向量值装载入阵列和阵列的y1-y4输出值。由于钻形函数74仅沿着主对角线,因此四(4)处理组件阵列可利用根据图13a的N个处理组件扩展处理一个N×N矩阵。该矩阵的处理时间为2N循环。
由于每个处理组件仅用在每隔一个处理循环中,因此可如图12b所示移去半数的延迟组件。该投射线性阵列可如图13b所示扩展到任意N×N矩阵。该矩阵的处理时间为N循环。
图14a-14d说明根据图13b所示的投射阵列的处理组件循环的运行。在图14a所示的第一循环t1中,将r1装载进左处理器1(74),并利用r1和g11来决定y1。在图14b所示的第二循环t2中,装载r2和r3,处理g31,g21和g22,并决定y2。在图14c所示的第三循环t3中,装载r4,装载g41,g42,g32,g33,并决定y3。在图14d所示的第四循环t4中,处理g431和g44,并决定y4
图12e-12j说明一个带状5×5矩阵的每个处理循环的时序图。图12e显示带状性质的矩阵在左下角具有三个零入口(带宽为3)。
为了显示同样的处理组件可同时用于前向和乔里斯基分解,图12f从阶段6开始。阶段6是图9c-9n的最后阶段之后的阶段。
同样,图12k-12p说明图9o-9z的处理器的延伸也执行前向替换。这些图从阶段6,即乔里斯基分解后的5个阶段开始。对从阶段6,时间0(图12k)到最终结果(图12p),阶段6之后,时间4(图12o)的每个处理循环执行处理。
当通过前向替换决定y变量后,可通过后向替换确定数据向量。后向替换按以下的子程序执行。
forj=N:1 d j = 1 g ij ( y j - Σ i = j + 1 N g ji * d i )
end
对于带状矩阵,则使用以下的子程序。
for j=N:1 y j = y j / G JJ H j ;
  for i=min(1,j-P):j-1 y i = y i - G ij H y j
  end for;
end for;
d=y;
(·)*表示一个复共轭函数。gLK *表示为乔里斯基因数G而确定的相应组件的复共轭。YLy的相应组件。如图15a和15b所示,对于4×4处理阵列,还可采用使用星形和钻形函数76,78的标量处理器来执行反向替换。然而,如图15a和15b所示,这些函数利用G矩阵值的复共轭来执行。因此,公式42-45分别成为了46-49。
y←w                                                     公式46 x ← z - w * g ij * 公式47 x ← z / g jj * 公式48
y←x                                                     公式49
在处理器76,78之间的并发附值具有延迟68,图15a的阵列跨越实施平面投射到一个线性阵列。如图16a所示,该阵列可扩展处理一个N×N矩阵。将 y向量值装载进图16a的阵列,并且数据向量 d为输出值。该阵列用2N时钟循环来决定 d。由于在每隔一个时钟循环中每隔一个处理器运行,因此可同时确定两个 d
由于16a中的每个处理器76,78在每隔一个时钟循环中运行,因此可如图15b所示移去每隔一个延迟。图15b的投射阵列可如图16b所示扩展处理一个N×N矩阵。该矩阵用N时钟循环决定 d
图17a-17d说明根据图16b所示的投射阵列的处理组件76,78循环的运行。在图17a所示的第一循环t1中,装载y4,处理g* 44并决定d4。在图17b所示的第二循环t2中,装载y2和y3,处理g* 43和g* 33,并决定d3。在图17c所示的第三循环t3中,装载y1,g* 41,处理g* 42,g* 32和g* 22,并决定d2。在图17d所示的第四循环t4中,处理g* 43和g* 44,并决定d4
图15e-15j说明图12e-12j的处理器的延伸执行一个带状矩阵上的反向替换。图15e显示带状性质的矩阵在左下角具有三个零入口5。
时序图从阶段7,即前向替换的6个阶段之后开始。开始于阶段7,时间0(图15f)的处理在阶段7,时间4(图15j)完成。
同样,图15k-15p说明图9o-9z的处理器的延伸也执行后向替换。这些图从阶段7,即前向替换后的6个阶段开始。对从阶段7,时间0(图15k)到最终结果(图15p)的每个处理循环执行处理。如图9c-9n,12e-12j和15e-15j所示,可减少一个二维阵列中的处理器数量来执行带状矩阵的乔里斯基分解,以及前向和后向替换。如图9o-9z,12k-12p所示,可从矩阵尺寸到带状矩阵的带宽减少线性阵列的处理器数量。
为了简化个别处理组件72,74,76,78以便于前向和后向替换,如图18a和18b所示,可从组件72,74,76,78中分离出除法函数80。图18a和18b分别对应图16a和16b。尽管与处理组件72,74,76,78对应,用于前向和后向替换的数据不同,但是组件72,74,76,78执行的函数相同。最右处理器74,78使用除法器80来执行处除法函数。除法器80可作为查阅表执行,以确定倒数值,供最右处理器74,78在乘法中使用。由于在前向和后向替换过程中,来自乔里斯基执行的倒数已经存在于存储器中,因此用于前向和后向替换的倒数乘法可使用已经保存在存储器中的倒数。
由于用于三种处理(确定G,前向和后向替换)的计算数据流相同,为N或带宽P,因此所有三个函数可在同一重构阵列上执行。如图19a和19b所示,重构阵列的每个处理组件84,82均能够运行函数来确定G和执行前向和后向替换。最右处理器82能够执行五角/平方和钻形函数66,72,76。当执行乔里斯基分解时,最右处理器82利用五角/平方函数64运行,其他处理器84利用圆/八角函数66运行。当执行前向和后向替换时,最右处理器82利用钻形函数74,78运行,其他处理器84利用星形函数72,76运行。处理器82,84最好可配置运行必需的函数。利用重构阵列,每个处理组件82,84执行两个用于前向和后向替换的算术函数和四个用于乔里斯基分解的函数,总共每个处理组件82,84六个函数。这些函数可以由一个算术逻辑单元(ALU)和适当的控制逻辑,或其他方法执行。
为了简化重构阵列中的个别处理组件82,84的复杂性,最好通过一个倒数和平方根装置86使除法和平方根函数86脱离阵列。如图20a和20b所示,倒数和平方根装置86最好在前向和后向替换中通过最右处理器82将倒数决定在一个乘法内,并且利用最右处理数据决定平方根的倒数用于乘法,并通过处理器84传递。决定倒数和倒数/平方根最好利用查阅表实施。另一选择为,除法和平方根函数块86可以是除法电路或平方根电路。
为了进一步减少处理器82,84的数量,可采用折叠。图21a和21b说明折叠。在折叠中,使用少量处理组件F代替用于线性系统解决方案的P处理组件82,84用于Q折叠。例如,如果P为九(9)处理器82,84,则三(3)处理器82,84在三(3)折叠上执行九(9)处理器的函数。折叠的一个缺点是,倍数Q增加了减少的阵列的处理时间。一个优点是,处理器利用率通常得以提高。对于三折叠而言,处理时间为三倍。因此,应根据最小的处理器数量和处理数据所允许的最长处理时间之间的折衷方案来选择折叠的数量。
图21a说明在11b的阵列的三折叠上执行十二个组件的函数的四个处理组件761,762,763,764/78的双向折叠。利用双端口存储器861,862,863,864(86)来代替处理组件761,762,763,764/78之间的延迟组件来保存每个折叠的数据。尽管延迟组件(双端口存储器86)可呈现于每个处理组件连接以实施图12a,但其也可用于其他任何连接以实施图12b。可以用两套单端口存储器来代替双端口存储器。
在第一折叠过程中,每个处理器的数据保存在其相应的双端口存储器86中,地址为折叠1。来自矩阵的数据也输入到处理器存储单元881-884(88)的处理器761-763,764/78。由于在折叠1处理器764/78和折叠3处理器761之间不存在数据交叠,因此在这些处理器之间不使用双端口存储器86。然而,由于在折叠1和折叠2处理器761之间,以及折叠2和折叠3处理器764/78之间不需要单一地址,因此双端口存储器86在图中显示为虚线。在第二折叠过程中,每个处理器的数据保存在折叠2的存储器地址中。来自矩阵的数据也输入到折叠2的处理器761-763,764/78中。折叠2处理器761的数据来自折叠1处理器761,两者为同样的物理处理器761,因此(尽管图中显示)该连接不必要。在第三折叠过程中,每个处理器的数据保存在其折叠3存储器地址中。来自矩阵的数据也输入到折叠2的处理器761-763,764/78中。折叠3处理器764/78的数据来自折叠2处理器764/78,因此该连接不必要。对于下一个处理阶段而言,重复折叠1的步骤。
图22a为图21a的双向折叠延伸到N个处理器761-76N-1,76N/78的实施例。处理器761-76N-1,76N/78用函数式布置到一个线性阵列中,存取双端口存储器86或两套单端口存储器。
图21b说明11b的阵列的单向折叠版本。在第一折叠过程中,每个处理器的数据保存在其相应的折叠1双端口存储器地址中。尽管折叠1处理器764/78和折叠3处理器761物理相连,但是在运行中,这些处理器之间没有数据传输。因此,存储器端口864之间保存有一个较小地址。折叠2处理器764/78通过处理器之间的环状连接与折叠1处理器761有效耦合。同样,折叠3处理器764/78与折叠2处理器761有效耦合。
图22b为图20b的单向折叠延伸到N个处理器的实施例。处理器761-76N-1,76N/78用函数式布置到一个围绕双存储器的环中。
为了在折叠处理器上实施乔里斯基分解,以及前向和后向替换,阵列中的处理器,如764/78处理器必须能够执行用于乔里斯基分解,前向和后向替换,以及每个折叠的函数。如图20a和20b所示的处理器764/78,根据本实施例,增加处理器能力可能会增加该实施例的复杂性。为了用算术逻辑单元执行折叠,一个处理器(如764/78处理器)执行十二个算术函数(四个用于前向和后向替换,八个用于乔里斯基分解),而其他处理器仅执行六个函数。
图23说明一种能够用于执行在乔里斯基分解,以及前向和后向替换中规定的全部六个函数的较佳的简单重构处理组件(PE)的部分。用于除法之后的该处理组件独立于处理组件之一(下文中称PE1)。最好使用两个部分,一个部分用于生成真实的x和y部件,另一部分用于生成其想象部件。注脚i和r分别表示真实和想象部件。
信号w,x,y,和z事先在PE函数定义中规定的信号相同。信号aq和ad分别代表在特定的处理循环中,PE的存储器位置被读和/或写的当前状态和随后状态。括弧中的名称表示用于第二部分的信号。
该较佳处理组件可用于任何PE,但是最好能够优化独立于其他PE执行除法函数的PE1。每个输入到乘法器941到948的输入值均标有“0”,表示其仅用于PE1,“-”表示其用于除PE1以外的每个PE,或“+”表示其用于所有PE。该输入值连接到零,但是在PE1的真实部分,其连接到生成aq r输入值的平方根的倒数的函数输出值。该函数可作为一个具有只读存储器的逻辑单元表执行于一个合理的固定点字长。
如图23所示,乘法器961将乘法器941和942的输出值相乘。乘法器962将乘法器943和944的输出值相乘。加法/减法电路98将乘法器941和942的输出值组合。减法器99将加法/减法电路98与乘法器943的输出值组合。减法器99的输出值为乘法器948的输入值。

Claims (21)

1.一种用于恢复来自作为接收向量接收的多个数据信号的数据的用户设备,该用户设备通过确定一个N×N矩阵的乔里斯基因数来确定接收向量的数据,其特征在于该用户设备包括:
一个处理组件阵列,该阵列的每个处理组件接收N×N矩阵的对角线组件,并确定相应的乔里斯基因数的对角线组件。
2.根据权利要求1所述的用户设备,其特征在于所述处理组件为标量处理组件。
3.根据权利要求1所述的用户设备,其特征在于所述N×N矩阵的带宽为P,并具有数量为P的处理组件,P小于N。
4.一种用于恢复来自作为接收向量接收的多个数据信号的数据的用户设备,该用户设备通过确定一个N×N矩阵的乔里斯基因数来确定接收向量的数据,并将确定的乔里斯基因数用于前向和后向替换来确定接收到的数据信号的数据,其特征在于该用户设备包括:
一个具有最多N个标量处理组件的阵列,该阵列具有一个输入端,用于接收来自N×N矩阵和接收向量的组件,每个标量处理组件用于确定乔里斯基因数,并执行前向和后向替换,阵列输出接收向量的数据。
5.根据权利要求4所述的用户设备,其特征在于所述每个标量处理器处理被阵列处理的矩阵的对角线,以确定乔里斯基因数,并执行前向和后向替换。
6.根据权利要求4所述的用户设备,其特征在于所述N×N矩阵的带宽为P,并具有数量最多为P的标量处理组件,P小于N。
7.根据权利要求4所述的用户设备,其特征在于所述用户设备进一步包括一个平方根和倒数装置,其中平方根和倒数装置仅与阵列的一个单一标量处理器耦合,并且阵列中没有标量处理器能够执行平方根和倒数函数。
8.根据权利要求7所述的用户设备,其特征在于所述平方根和倒数设备使用查阅表。
9.根据权利要求5所述的用户设备,其特征在于所述每个处理器执行N×N矩阵的多个对角线的处理。
10.根据权利要求9所述的用户设备,其特征在于对于每一多个折叠,每一标量处理器处理N×N矩阵的单一对角线的组件。
11.根据权利要求10所述的用户设备,其特征在于一定数量的折叠将标量处理器的数量减到最小,并允许N×N矩阵的处理时间短于所允许的最长时间。
12.根据权利要求10所述的用户设备,其特征在于所述标量处理器与经由阵列双向流动的数据线性布置。
13.根据权利要求5所述的用户设备,其特征在于一个延迟组件与每个标量处理器有效耦合,并且阵列能够并发处理两个N×N矩阵,
14.根据权利要求5所述的用户设备,其特征在于所有标量处理器均具有共同的可重构实施方式。
15.一种用于恢复来自作为接收向量接收的多个数据信号的数据的用户设备,该用户设备通过确定一个N×N矩阵的乔里斯基因数来确定接收向量的数据,其特征在于该用户设备包括:
一个标量处理组件阵列,每个处理组件与N×N矩阵的一个组件相对应,并确定相应的乔里斯基因数的组件。
16.根据权利要求15所述的用户设备,其特征在于每个标量处理组件与唯一的N×N矩阵的一个组件相对应。
17.根据权利要求15所述的用户设备,其特征在于所述用户设备进一步包括处理组件之间的延迟。
18.根据权利要求17所述的用户设备,其特征在于多个N×N矩阵在阵列中进行流水线处理。
19.根据权利要求18所述的用户设备,其特征在于所述阵列在多个阶段处理N×N矩阵,在每个阶段,处理组件不在超过一个处理周期中活动。
20.根据权利要求19所述的用户设备,其特征在于所有多个N×N矩阵在多个阶段中的一个阶段进行处理,然后再前进到下一个阶段。
21.根据权利要求20所述的用户设备,其特征在于对于多个N×N矩阵中的每个NXN矩阵,每个阶段的处理结果均在前进至下一阶段之前保存。
CN02285529U 2001-11-14 2002-11-14 利用阵列处理进行数据检测的用户装置 Expired - Lifetime CN2579091Y (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US33295001P 2001-11-14 2001-11-14
US60/332,950 2001-11-14
US8318902A 2002-02-26 2002-02-26
US10/083,189 2002-02-26
US10/172,113 2002-06-14
US10/172,113 US7218624B2 (en) 2001-11-14 2002-06-14 User equipment and base station performing data detection using a scalar array

Publications (1)

Publication Number Publication Date
CN2579091Y true CN2579091Y (zh) 2003-10-08

Family

ID=27374484

Family Applications (3)

Application Number Title Priority Date Filing Date
CNA028221311A Pending CN1582544A (zh) 2001-11-14 2002-11-13 用于线性系统方案数组处理
CN02285529U Expired - Lifetime CN2579091Y (zh) 2001-11-14 2002-11-14 利用阵列处理进行数据检测的用户装置
CNU022855300U Expired - Lifetime CN2686248Y (zh) 2001-11-14 2002-11-14 利用阵列处理进行数据检测的基站

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA028221311A Pending CN1582544A (zh) 2001-11-14 2002-11-13 用于线性系统方案数组处理

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNU022855300U Expired - Lifetime CN2686248Y (zh) 2001-11-14 2002-11-14 利用阵列处理进行数据检测的基站

Country Status (11)

Country Link
US (2) US7218624B2 (zh)
EP (1) EP1444798A4 (zh)
JP (3) JP2005509959A (zh)
KR (9) KR20070116287A (zh)
CN (3) CN1582544A (zh)
CA (1) CA2466684A1 (zh)
DE (2) DE20217637U1 (zh)
MX (1) MXPA04004486A (zh)
NO (1) NO20042407L (zh)
TW (6) TWI325240B (zh)
WO (1) WO2003043236A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7657846B2 (en) * 2004-04-23 2010-02-02 Microsoft Corporation System and method for displaying stack icons
US20060083291A1 (en) * 2004-10-15 2006-04-20 Zheng Hongming Receiver apparatus, and associated method, for operating upon data communicated in a MIMO, multi-code, MC-CDMA communication system
US7633913B2 (en) * 2004-11-05 2009-12-15 Nextel Communications Inc. Wireless communication system using joint detection to compensate for poor RF condition based on user priority
CN100383781C (zh) * 2004-11-26 2008-04-23 北京天碁科技有限公司 乔列斯基分解算法装置
US7924778B2 (en) * 2005-08-12 2011-04-12 Nextel Communications Inc. System and method of increasing the data throughput of the PDCH channel in a wireless communication system
JP4172807B2 (ja) * 2006-09-08 2008-10-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 障害発生の原因箇所の発見を支援する技術
EP2224347A1 (en) * 2007-11-22 2010-09-01 NEC Corporation Systolic array and calculation method
KR100986179B1 (ko) * 2008-06-16 2010-10-07 유택성 가로등용 파워엘이디 모듈
KR100986178B1 (ko) * 2008-06-16 2010-10-07 유택성 파워엘이디가 구비된 가로등
US8417758B1 (en) 2009-09-01 2013-04-09 Xilinx, Inc. Left and right matrix multiplication using a systolic array
US8473540B1 (en) 2009-09-01 2013-06-25 Xilinx, Inc. Decoder and process therefor
US8510364B1 (en) 2009-09-01 2013-08-13 Xilinx, Inc. Systolic array for matrix triangularization and back-substitution
US8473539B1 (en) 2009-09-01 2013-06-25 Xilinx, Inc. Modified givens rotation for matrices with complex numbers
US8416841B1 (en) 2009-11-23 2013-04-09 Xilinx, Inc. Multiple-input multiple-output (MIMO) decoding with subcarrier grouping
US8620984B2 (en) 2009-11-23 2013-12-31 Xilinx, Inc. Minimum mean square error processing
US8406334B1 (en) 2010-06-11 2013-03-26 Xilinx, Inc. Overflow resistant, fixed precision, bit optimized systolic array for QR decomposition and MIMO decoding
US8443031B1 (en) 2010-07-19 2013-05-14 Xilinx, Inc. Systolic array for cholesky decomposition
US9088521B2 (en) 2013-02-21 2015-07-21 Litepoint Corporation System and method for testing multiple data packet signal transceivers concurrently
CN111998854B (zh) * 2020-08-31 2022-04-15 郑州轻工业大学 基于Cholesky分解计算的精确扩展Stirling插值滤波方法
US20230297538A1 (en) * 2020-09-25 2023-09-21 Intel Corporation Programmable Spatial Array for Matrix Decomposition

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4964126A (en) * 1988-09-30 1990-10-16 Massachusetts Institute Of Technology Fault tolerant signal processing machine and method
JPH03141480A (ja) * 1989-10-27 1991-06-17 Mitsubishi Heavy Ind Ltd 帯行列演算用シストリックアレイ
JPH0752748B2 (ja) * 1989-12-14 1995-06-05 株式会社グラフィカ 三次元デバイスのシミュレーション装置
JPH0628324A (ja) * 1992-07-06 1994-02-04 Toshiba Corp 並列計算機及びコンパイラ
US5630154A (en) * 1994-10-11 1997-05-13 Hughes Aircraft Company Programmable systolic array system arranged in a found arrangement for passing data through programmable number of cells in a time interleaved manner
JPH103468A (ja) 1996-06-14 1998-01-06 Toyo Commun Equip Co Ltd 並列演算処理システム
US6061706A (en) * 1997-10-10 2000-05-09 United Microelectronics Corp. Systolic linear-array modular multiplier with pipeline processing elements
US6313786B1 (en) * 1998-07-02 2001-11-06 Snaptrack, Inc. Method and apparatus for measurement processing of satellite positioning system (SPS) signals
EP0971485A1 (en) * 1998-07-08 2000-01-12 Siemens Aktiengesellschaft Multiuser detection in CDMA using a correlation matrix
US6675187B1 (en) 1999-06-10 2004-01-06 Agere Systems Inc. Pipelined linear array of processor elements for performing matrix computations
US6714527B2 (en) * 1999-09-21 2004-03-30 Interdigital Techology Corporation Multiuser detector for variable spreading factors
US6870882B1 (en) * 1999-10-08 2005-03-22 At&T Corp. Finite-length equalization over multi-input multi-output channels
FR2800948B1 (fr) * 1999-11-08 2002-03-01 Mitsubishi Electric Inf Tech Procede de detection conjointe
EP1245100B1 (en) * 2000-01-07 2004-05-26 Interdigital Technology Corporation Channel estimation for time division duplex communication systems
US6707864B2 (en) * 2001-01-25 2004-03-16 Interdigital Technology Corporation Simplified block linear equalizer with block space time transmit diversity
US6625203B2 (en) * 2001-04-30 2003-09-23 Interdigital Technology Corporation Fast joint detection
FR2838582B1 (fr) * 2002-04-12 2004-05-21 Commissariat Energie Atomique Procede et dispositif de detection de donnees transmises par etalement de spectre
CN1723629A (zh) * 2003-01-10 2006-01-18 美商内数位科技公司 通用二阶段数据估测

Also Published As

Publication number Publication date
DE20217636U1 (de) 2003-04-03
TW200742284A (en) 2007-11-01
TWI325240B (en) 2010-05-21
CN1582544A (zh) 2005-02-16
TW200415862A (en) 2004-08-16
TWI314405B (en) 2009-09-01
JP2008077682A (ja) 2008-04-03
WO2003043236A1 (en) 2003-05-22
CA2466684A1 (en) 2003-05-22
US7606207B2 (en) 2009-10-20
KR20040053297A (ko) 2004-06-23
KR20040016941A (ko) 2004-02-25
KR20050090084A (ko) 2005-09-12
EP1444798A1 (en) 2004-08-11
US7218624B2 (en) 2007-05-15
NO20042407L (no) 2004-06-09
TW588890U (en) 2004-05-21
JP2012150827A (ja) 2012-08-09
KR200310933Y1 (ko) 2003-04-18
KR20040015312A (ko) 2004-02-18
KR100809993B1 (ko) 2008-03-07
CN2686248Y (zh) 2005-03-16
TWI268667B (en) 2006-12-11
US20070206543A1 (en) 2007-09-06
DE20217637U1 (de) 2003-03-20
KR200303640Y1 (ko) 2003-02-11
TW200302640A (en) 2003-08-01
KR20050096874A (ko) 2005-10-06
US20030091007A1 (en) 2003-05-15
KR100858466B1 (ko) 2008-09-16
TWI263417B (en) 2006-10-01
JP2005509959A (ja) 2005-04-14
KR20050090349A (ko) 2005-09-13
TW581368U (en) 2004-03-21
EP1444798A4 (en) 2007-12-12
KR20070116287A (ko) 2007-12-07
MXPA04004486A (es) 2004-08-11
TW200635264A (en) 2006-10-01

Similar Documents

Publication Publication Date Title
CN2579091Y (zh) 利用阵列处理进行数据检测的用户装置
CN1107905C (zh) 在分组数据上执行乘-加运算的装置
CN1292551C (zh) 一种流水线简易fft/ifft处理器
CN1009772B (zh) 一维余弦变换的计算装置以及包括该计算装置的图象编码装置和解码装置
CN1801082A (zh) 在分组数据上执行乘-加运算的装置
CN1728634A (zh) 伽罗瓦域中相乘的方法和设备与求逆设备及字节替换设备
CN1722130A (zh) 可重配置运算装置
CN1446409A (zh) 一族线性多用户检测器(muds)
CN1108865A (zh) 自适应视频信号运算处理装置
CN1630204A (zh) 具有矩阵转换技术的循环冗余码计算方法及系统
CN1656669A (zh) 并列中导码消除的方法与装置
CN1685369A (zh) 视频编码的低复杂性和统一标准的变换
CN1906861A (zh) 使用代码特定组合的ds-cdma干扰抑制方法和设备
CN1205133A (zh) 滤波协处理器
CN1283110C (zh) 干扰功率估计设备及其方法、及干扰功率检测系统
CN1675630A (zh) 高效联合侦测
CN1801940A (zh) 整型变换电路和整型变换方法
CN1845483A (zh) Td-scdma系统中接收机的联合检测系统及其数据处理方法
CN1738238A (zh) 高速可配置rsa加密算法及协处理器
CN1913390A (zh) 一种基于Cholesky分解实现干扰消除的方法
CN1700203A (zh) 基2单路深度延时反馈的流水线构成fft处理器的实现方法
CN1725667A (zh) 多天线阵列接收无线传输的方法
CN1399766A (zh) 用于数据压缩的三次样条插值的快速和有效计算
CN1071027C (zh) 简单矩阵型液晶显示装置的驱动装置和驱动方法
CN1313918C (zh) 在有限域中用于基转换的方法和设备

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20121114

Granted publication date: 20031008