CN1783060A - 乔列斯基分解算法装置 - Google Patents

乔列斯基分解算法装置 Download PDF

Info

Publication number
CN1783060A
CN1783060A CN 200510124176 CN200510124176A CN1783060A CN 1783060 A CN1783060 A CN 1783060A CN 200510124176 CN200510124176 CN 200510124176 CN 200510124176 A CN200510124176 A CN 200510124176A CN 1783060 A CN1783060 A CN 1783060A
Authority
CN
China
Prior art keywords
component
matrix
square root
decomposition algorithm
cholesky decomposition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510124176
Other languages
English (en)
Other versions
CN100383781C (zh
Inventor
冉静
刘昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing T3G Technology Co Ltd
Original Assignee
Beijing T3G Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing T3G Technology Co Ltd filed Critical Beijing T3G Technology Co Ltd
Priority to CNB2005101241769A priority Critical patent/CN100383781C/zh
Publication of CN1783060A publication Critical patent/CN1783060A/zh
Application granted granted Critical
Publication of CN100383781C publication Critical patent/CN100383781C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

一种乔列斯基分解算法装置,其包括:一存储器,用以存储由该乔列斯基分解算法装置计算出的特定列的矩阵数据,用于作为后续计算的输入;至少二分量计算单元,用以利用上述存储器存储的矩阵数据对外部输入的矩阵数据进行分量计算;一复用器,其选择输出分量计算单元的分量计算结果;一归一化单元,其将复用器输出的分量计算结果进行归一化处理;一倒数平方根单元,其将归一化处理的分量进行求平方根和求倒数处理,获得其平方根及倒数平方根,并锁定一特定的倒数平方根;一对角乘法器,其将归一化处理的分量与锁定的倒数平方根进行乘法运算,并将其计算结果输出至该存储器。由于乔列斯基分解算法装置可以并行处理矩阵数据,可以明显提高数字信号处理速度。

Description

乔列斯基分解算法装置
技术领域
本发明是关于一种分解算法装置,特别是关于一种矩阵乔列斯基(Cholesky)分解算法装置。
背景技术
在数字信号处理领域中,关于矩阵的运算非常多,特别是为了简化计算难度,对矩阵进行变型、简化和分解是很常规的处理方法。
乔列斯基分解算法就是很常见的一种矩阵分解方法,其基本原理是:对于一个n阶对称正定矩阵A,存在一个下三角矩阵L,使A=L·LH,L矩阵对角线上的数都是正实数,LH表示下三角矩阵L的共轭转置矩阵:
A = a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n . . . . . . . . . . . . a n 1 a n 2 . . . a nn = L · L H = l 11 0 . . . 0 l 21 l 22 . . . 0 . . . . . . . . . . . . l n 1 l n 2 . . . l nn · l 11 l 21 * . . . l n 1 * 0 l 22 . . . l n 2 * . . . . . . . . . . . . 0 . . . 0 l nn - - - ( 1 )
乔列斯基分解算法的基本计算公式是:
l jj = ( a jj - Σ p = 1 j - 1 l jp l jp * ) 1 / 2 - - - ( 2 )
l ij = ( a ij - Σ p = 1 j - 1 l ip l jp * ) / l jj - - - ( 3 )
其中j=1,2,…,n;i=j+1,...,n;ljj和lij的初值为: l 11 = a 11 1 / 2 和li1=ai1/l11(i=2,3,…,n)。
根据乔列斯基分解算法的基本原理,矩阵L的每一点都是递归求得,与其前几列和行的数据有关,一般的计算方法是针对L矩阵逐行逐列进行运算,这样消耗的运算时间比较大,特别是当n比较大时,运算时间更是大大增加。
同样,以上方法所对应的算法装置由于其需要对L矩阵逐行逐列进行运算,因此,该算法装置也需要较长的时间处理这样的矩阵运算。这会导致数字信号处理的速度减慢,从而不适合于高速率或者高信息量的通信中的数字信号处理。
发明内容
为克服现有乔列斯基分解算法装置数字信号处理速度慢的问题,本发明提供一种数字信号处理速度快的乔列斯基分解算法装置。
为了上述目的,本发明的乔列斯基分解算法装置包括:一存储器,用以存储由该乔列斯基分解算法装置计算出的特定列的矩阵数据,用于作为后续计算的输入;至少二分量计算单元,用以利用上述存储器存储的矩阵数据对外部输入的矩阵数据进行分量计算;一复用器,其选择输出分量计算单元的分量计算结果;一归一化单元,其将复用器输出的分量计算结果进行归一化处理;一倒数平方根单元,其将归一化处理的分量进行求平方根和求倒数处理,获得其平方根及倒数平方根,并锁定一特定的倒数平方根;一对角乘法器,其将归一化处理的分量与锁定的倒数平方根进行乘法运算,并将其计算结果输出至该存储器。
其有益效果是,由于乔列斯基分解算法装置可以并行处理矩阵数据,可以明显提高数字信号处理速度。
附图说明
为进一步理解本发明,请参考以下描述的附图:
图1所示为本发明乔列斯基分解算法装置的结构框图。
图2所示为采用u个分量计算单元进行分量计算的乔列斯基分解算法装置及其操作步骤。
具体实施方式
下面以在时分同步码分多址(TD-SCDMA)终端设备(UE)的联合检测算法中的应用为例,详细说明本发明的乔列斯基分解算法装置。
算法基础
对于终端设备实现联合检测的算法有很多种,但主要是基于“迫零—分块线性均衡器”这一均衡算法发展而来的,其原理就是通过利用系统矩阵A和噪声矩阵Rn来估计用户发送的数据符号矢量 该算法表示为:
d ^ = ( A H · R n - 1 · A ) - 1 · A H · R n - 1 · e - - - ( 4 )
其中,系统矩阵A由K个用户的扩频码以及信道冲激响应决定的;d为发送端K个用户发送的数据符号;e表示接收数据序列。实现该算法的困难在于如何对系统正定矩阵(AH·Rn -1·A)求逆。
在本发明中利用的正是对矩阵(AH·Rn -1·A)进行乔列斯基分解,公式(4)可表示为:
d ^ = L - 1 ( L H ) - 1 · A H · R n - 1 · e - - - ( 5 )
对于(1)式,首先设mij k为lij的第k次计算分量:
m ij k = m ij k - 1 - l ik l jk * ( k = 1,2 , . . . , j - 1 ) - - - ( 6 )
其中j=1,2,…,n;i=j+1,…,n。mij k的初值为: m ij 1 = a ij - l i 1 l j 1 * .
由(2),(3)和(6)式,矩阵L的元素ljj和lij可以由第j-1次计算分量mij j-1计算得到:
l jj = ( m jj j - 1 ) 1 / 2 - - - ( 7 )
l ij = ( m ij j - 1 ) / l jj - - - ( 8 )
其初值为: l 11 = a 11 1 / 2 l i 1 = a i 1 / l 11 ( i = 2,3 , . . . , n ) .
乔列斯基分解算法装置
请参考图1,是本发明所提供的一种乔列斯基分解算法装置,其应用在时分同步码分多址的终端设备的联合检测中。该乔列斯基分解算法装置可以对一个最大32×32的矩阵进行乔列斯基分解,即,该矩阵可以表示为(1)式的形式,也就是一个32阶对称正定矩阵A。对于该矩阵A,其存在一个下三角矩阵L,使A=L·LH,L矩阵对角线上的数都是正实数。矩阵L的元素ljj和lij可以由第j-1次计算分量mij j-1计算得到,如(7)和(8)式。
该乔列斯基分解算法装置10包括:一个存储器11、两个并行的分量计算单元12、一复用器13、一归一化单元14、一倒数平方根单元15以及一对角乘法器16。
在本实施例中,该存储器11的容量大小为64×32比特,存储器用来存储上一列的lik和本列刚刚计算得到的li,(k+1),以作为计算mij k的输入,其大小只需存储 2n个数,并可交替覆盖使用,对于每次分量可以复用在原输入aij的存储器中。其中,n表示正定矩阵的维数。当然,在进行行、列的数量均较大的矩阵运算时,可以采用更大存储容量的存储器。
每一个分量计算单元12由一复数乘法器121和一复数累加器122组成,用于完成分量的计算,该分量可以是列分量也可以是行分量。为了方便计算,本发明以列分量的计算为例进行说明。矩阵的列上的分量可以在这里先进行复数乘法运算,然后进行复数累加计算,得到(6)式所示的计算结果。
复用器13用于选择当前算好的分量来自于分量计算单元(1)还是(2)。为方便说明本发明,采用从32×32的第1列到第32列依次选择的方式进行选择,即首先选择第1列的分量计算结果,然后依次选择第2-第32列分量的计算结果。复用器用于选择分量mij j-1来自于某个分量计算单元,以提供输入去计算得到矩阵L当前列的元素ljj和lij
归一化单元14用于对分量计算单元12计算出来的分量进行归一化操作,以防止后续操作的溢出。
倒数平方根单元15包括一乘法器151和一数据处理器152,用来根据公式(5)和(6)对对角线的元素进行平方根并求导运算,获得该元素的平方根ljj及其倒数平方根1/ljj,并可以对该获得的倒数平方根1/ljj进行锁定。
对角线乘法单元16用于对同一列中的元素进行乘法运算,即利用每一列中对角线上的元素的倒数平方根,分别依次乘以该列中其他归一化的计算分量。对角线乘法单元16包括成对的乘法器161和移位器162,为了更快的处理数据,可以采用并行的多对乘法器和移位器。乘法器161用于乘法运算,移位器162将乘法器161的获得结果进行移位,获得该结果的小数形式并将其输出。
请参考图2,图中以u个并行的分量计算单元同时工作的情况为例来说明乔列斯基分解算法装置的实现步骤:
第一步,计算第1列的结果:
首先,u个并行的分量计算单元12,从外部存储器(图未示)按照一个时刻一个数据的方式获得矩阵A的数据。获得数据的第一种方式是:由第1个分量计算单元按照一个时刻一个数据的方式从上到下取得矩阵A的第1列的数据。当然,也可以采用第二种方式并行获得矩阵A的第1列的数据,即,第1个分量计算单元获得矩阵A的第1列的第1个数据,同时第2个分量计算单元获得矩阵A的第1列的第2个数据,第i个分量计算单元获得矩阵A的第1列的第i个数据(i=1,2,…n,正定矩阵的维数),第u个分量计算单元获得矩阵A的第1列的第u个数据,如果u<n,则重复上述操作,直至第1列上的数据获取完毕。这里,我们以第一种方式为例进行说明。
在第1个时刻,即获得矩阵A的第1列的第1个数据—矩阵A第1列对角线上的元素a11的时刻,第1个分量计算单元按照式(6)将其进行复数乘法和复数累加运算,获得其对应的计算分量,此时也为a11。根据公式(6),对于矩阵A的第1列的数据的运算结果均等于本身。由复用器13将该计算获得的分量传送到归一化单元14,由归一化单元14进行归一化处理,以防止后续操作的溢出。
同时,该运算获得的第1列分量的第一个元素由归一化单元14传送到倒数平方根单元15,进行平方根以及求倒数运算,根据式(7)获得矩阵L对角线上的第一个数l11及其倒数1/l11,l11输出到一外部的存储器(图未示),同时,倒数平方根单元15锁定1/l11。其中,该存储器可以是输入矩阵A的存储器,也可以是另外的存储器。如果是输入矩阵的存储器,则该l11可以替换原矩阵A中的元素a11。这里,为了简单描述,我们将获得矩阵L的数据输入到该另外的存储器,下同。
在随后的(n-1)个时刻,矩阵A的第1列的第2-第n个元素依次经第1个分量计算器进行复数乘法和复数累加运算后,经复用器、归一化单元14依次传送到对角乘法器16,同时,倒数平方根单元15锁定的1/l11在第2-第n个时刻分别依次同第2-第n个元素相乘,根据式(8),可获得矩阵L第1列的元素。并通过移位器162依次将这n-1个时刻获得结果同时传送到存储器11和该另外的存储器。
此时,在该另外的存储器中获得了矩阵L的第1列结果li1,在存储器11中得到矩阵L的第1列除了l11的结果li1
第二步、计算矩阵L的一次分量和第2列的结果:
从(n+1)时刻开始直到(2n-1)时刻,u个分量计算单元12并行从矩阵A的存储器中读取数据,其读取数据的方式为:第1个分量计算单元读取矩阵A第2列的数据,并利用获得的矩阵L第1列结果li1根据式(6)计算其一次分量;同时第2个分量计算单元获得矩阵A的第3列的第2个数据,并利用第1列结果li1根据式(6)计算其一次分量,第i个分量计算单元获得矩阵A的第(i+1)列的数据,并利用获得的矩阵L第1列结果li1根据式(6)计算其一次分量;第u个分量计算单元获得矩阵A的第u+1列的数据,如果u<n,则重复上述操作,直至矩阵A的数据的一次分量mij 1全部计算完毕。
在图2中,由于采用的分量计算单元12的数量u小于矩阵的维数n,因此在计算一次分量时需要重复利用同一分量计算单元12,即,分量计算单元u可能需要对u的整数倍的列进行分量计算。如果分量计算单元12的数量大于或者等于矩阵的维数,则在计算一次分量的时候,可以同时并行处理所有列的分量计算,或者同一列上所有元素的分量计算。此时与存储器11提供数据的方式有关,这是可以根据需要设定的。
对于矩阵L的第2列,与求矩阵L的第1列数据的过程类似,其第一个数(即矩阵L对角线上的第二个数)l22,可以在倒数平方根单元15由其一次分量m22 1通过求平方根计算得出,而第2列的其他数据结果li2可由l22和mi2 1根据公式(8)在对角乘法器16中计算得出。此时,该另外的存储器中获得了矩阵L的第1列结果li1和第2列结果li2在存储器11储存了矩阵L的第1列除了l11的结果li1和第2列除了l22的结果li2。其他各列一次分量mij 1的结果,都将被存储起来留待下一步使用,这些二次分量结果可以通过分量计算单元12存储到之前输入矩阵A的存储器,并覆盖矩阵A。
第三步、计算矩阵L的二次分量和第3列的结果:
从2n时刻开始直到(3n-2)时刻,利用第2列的结果li2和一次分量mij 1,从第3列开始,同时在u个分量计算单元中并行计算矩阵L的二次分量mij 2,直至矩阵L的所有列的二次分量计算完毕。对于矩阵L的第3列,与求矩阵L的第2列数据的过程类似,其第一个数(即矩阵L对角线上的第三个数)l33,可以在倒数平方根单元15由其二次分量m33 2通过求平方根计算得出,而第3列的其他数据结果li3可由l33和mi3 2根据公式(8)计算得出。此时,该另外的存储器中获得了矩阵L的第1列结果li1、第2列结果li2和第3列结果li3,在存储器11储存了矩阵L的第1列除了l11的结果li1、第2列除了l22的结果li2以及第3列除了l33的结果li3。如果在存储器11中采用交替覆盖使用,则可以由第3列除了l33的结果li3来覆盖第1列除了l11的结果li1,即由本次运算获得的列来覆盖最早存储的列。除第3列以外的各列二次分量结果,都将被存储起来留待下一步使用,这些二次分量结果可以通过分量计算单元12存储到之前输入矩阵A的存储器,并覆盖之前存储的一次分量。
第四步、重复上述的过程,计算矩阵L的k-1次分量和第k列结果。
第五步、计算矩阵L的第n-1次分量和第n列结果。
计算最后一列的第n-1次分量mnn n-1,并通过在倒数平方根单元15中求平方根计算得出矩阵L的最后一个数lnn,这样整个矩阵L也就得到了。
由于本实施例将联合检测算法的乔列斯基分解和矩阵求逆有效地结合在一起,对于矩阵L的对角线数据采用了直接计算和存储其倒数,并将倒数运算和平方根运算有效地结合在一起,利用一个倒数平方根单元(包括一个乘法器和一个数据处理器)采用实数乘法和查表法,实现倒数平方根功能,节省了一次重复的倒数运算。
乔列斯基分解算法装置的特征在于:将计算L矩阵每个数据的过程分成多个小部分,根据相邻几列数据计算的共性,运用并行的分量计算单元达到并行计算的目的。如果采用两个并行的分量计算单元,这样并行的流水操作可以节约近50%的运行时间。如果采用更多的分量计算单元对维数更大的矩阵进行乔列斯基分解,可以在运算时间上也会得到更大的节约。当运用u个分量计算单元对各列的分量mij k根据公式(6)进行并行运算时,可以节约将近u-1/u的运行时间。
本发明仅以TD-SCDMA系统中的应用为例,但此装置也可以用于其他数字信号处理系统中的乔列斯基分解的实现。

Claims (6)

1.一种乔列斯基分解算法装置,其包括:
一存储器,用以存储由该乔列斯基分解算法装置计算出的特定列的矩阵数据,用于作为后续计算的输入;
至少二分量计算单元,用以利用上述存储器存储的矩阵数据对外部输入的矩阵数据进行分量计算;
一复用器,其选择输出分量计算单元的分量计算结果;
一归一化单元,其将复用器输出的分量计算结果进行归一化处理;
一倒数平方根单元,其将归一化处理的分量进行求平方根和求倒数处理,获得其平方根及倒数平方根,并锁定一特定的倒数平方根;
一对角乘法器,其将归一化处理的分量与锁定的倒数平方根进行乘法运算,并将其计算结果输出至该存储器。
2.如权利要求1所述的乔列斯基分解算法装置,其特征在于,该分量计算单元包括一复数乘法器和一复数累加器。
3.如权利要求2所述的乔列斯基分解算法装置,其特征在于,该分量计算单元利用下式对矩阵数据进行分量计算:
m ij k = m ij k - 1 - l ik l jk * , ( k = 1,2 , . . . , j - 1 )
其中,j=1、2、...、n,
i=(j+1)、(j+2)、...、n,mij k的初值为: m ij 1 = a ij - l i 1 l j 1 * ,
aij为一n阶正定矩阵的元素,li1和lj1 *分别为该n阶正定矩阵A所对应的下三角矩阵及该下三角矩阵所对应的共轭转置矩阵的元素。
4.如权利要求1所述的乔列斯基分解算法装置,其特征在于,该倒数平方根单元锁定的是矩阵每一列中位于对角线的分量的倒数平方根。
5.如权利要求1所述的乔列斯基分解算法装置,其特征在于,该对角乘法器包括一乘法器。
6.如权利要求5所述的乔列斯基分解算法装置,其特征在于,该对角乘法器进一步包括一移位器。
CNB2005101241769A 2004-11-26 2005-11-21 乔列斯基分解算法装置 Expired - Fee Related CN100383781C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005101241769A CN100383781C (zh) 2004-11-26 2005-11-21 乔列斯基分解算法装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200420115810.3 2004-11-26
CN200420115810 2004-11-26
CNB2005101241769A CN100383781C (zh) 2004-11-26 2005-11-21 乔列斯基分解算法装置

Publications (2)

Publication Number Publication Date
CN1783060A true CN1783060A (zh) 2006-06-07
CN100383781C CN100383781C (zh) 2008-04-23

Family

ID=36773258

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101241769A Expired - Fee Related CN100383781C (zh) 2004-11-26 2005-11-21 乔列斯基分解算法装置

Country Status (1)

Country Link
CN (1) CN100383781C (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008092298A1 (fr) * 2007-01-25 2008-08-07 Zte Corporation Appareil et procédé de décomposition de matrice en traitement bande de base td-scdma
CN102662917A (zh) * 2012-04-28 2012-09-12 电子科技大学 正定Hermite矩阵Cholesky分解高速脉动阵列的设计方法
CN104216866A (zh) * 2013-05-31 2014-12-17 深圳市海思半导体有限公司 一种数据处理装置
CN106599989A (zh) * 2015-10-08 2017-04-26 上海兆芯集成电路有限公司 具有神经存储器的神经网络单元和集体将来自神经存储器的数据列移位的神经处理单元阵列
US10380064B2 (en) 2015-10-08 2019-08-13 Via Alliance Semiconductor Co., Ltd. Neural network unit employing user-supplied reciprocal for normalizing an accumulated value
CN112035795A (zh) * 2020-09-07 2020-12-04 哈尔滨工业大学 Cholesky分解算法运算级流水线硬件加速方法
WO2021036313A1 (zh) * 2019-08-28 2021-03-04 华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1398645A1 (en) * 2000-12-12 2004-03-17 Matsushita Electric Industrial Co., Ltd. Radio-wave arrival-direction estimating apparatus and directional variable transceiver
US7218624B2 (en) * 2001-11-14 2007-05-15 Interdigital Technology Corporation User equipment and base station performing data detection using a scalar array
CN1170389C (zh) * 2002-11-13 2004-10-06 大唐移动通信设备有限公司 在联合检测系统中应用长小区化码的方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008092298A1 (fr) * 2007-01-25 2008-08-07 Zte Corporation Appareil et procédé de décomposition de matrice en traitement bande de base td-scdma
CN102662917A (zh) * 2012-04-28 2012-09-12 电子科技大学 正定Hermite矩阵Cholesky分解高速脉动阵列的设计方法
CN102662917B (zh) * 2012-04-28 2015-02-18 电子科技大学 正定Hermite矩阵Cholesky分解高速脉动阵列的设计方法
CN104216866A (zh) * 2013-05-31 2014-12-17 深圳市海思半导体有限公司 一种数据处理装置
CN106599989A (zh) * 2015-10-08 2017-04-26 上海兆芯集成电路有限公司 具有神经存储器的神经网络单元和集体将来自神经存储器的数据列移位的神经处理单元阵列
CN106599989B (zh) * 2015-10-08 2019-04-09 上海兆芯集成电路有限公司 神经网络单元和神经处理单元阵列
US10380064B2 (en) 2015-10-08 2019-08-13 Via Alliance Semiconductor Co., Ltd. Neural network unit employing user-supplied reciprocal for normalizing an accumulated value
WO2021036313A1 (zh) * 2019-08-28 2021-03-04 华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置
CN112445752A (zh) * 2019-08-28 2021-03-05 上海华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置
CN112445752B (zh) * 2019-08-28 2024-01-05 上海华为技术有限公司 一种基于乔列斯基分解的矩阵求逆装置
CN112035795A (zh) * 2020-09-07 2020-12-04 哈尔滨工业大学 Cholesky分解算法运算级流水线硬件加速方法

Also Published As

Publication number Publication date
CN100383781C (zh) 2008-04-23

Similar Documents

Publication Publication Date Title
CN1783060A (zh) 乔列斯基分解算法装置
US20180046897A1 (en) Hardware accelerator for compressed rnn on fpga
CN111832719A (zh) 一种定点量化的卷积神经网络加速器计算电路
KR100253987B1 (ko) 고속 하다마르 변환을 실행하기 위한 방법 및 장치
CN111488133B (zh) 高基数近似布斯编码方法和混合基数布斯编码近似乘法器
JP2004511046A (ja) 線形変換を効率的に実行する方法および装置
CN1109990C (zh) 运算装置及运算方法
CN1381095A (zh) 推荐用于第三代码分多址的turbo码交错器的有效实现
CN100346336C (zh) 使用主要因素算法的最佳离散傅利叶转换方法及装置
CN1801630A (zh) 基于优化搜索矩阵lu分解的ldpc码编码方法
CN1009034B (zh) 离散余弦变换装置
CN112434801B (zh) 一种按照比特精度进行权重拆分的卷积运算加速方法
CN1909529A (zh) 3780点离散傅立叶变换处理器
CN109165006B (zh) Softmax函数的设计优化及硬件实现方法及系统
CN110019184B (zh) 一种压缩和解压缩有序整数数组的方法
CN1268231A (zh) 数据块规模可变的2维逆向离散余弦变换机
CN112799634B (zh) 一种基于基22mdc ntt结构的高性能环多项式乘法器
CN1833220A (zh) 用于求出整数余数的方法和装置
Storjohann Deterministic computation of the Frobenius form
Abdelhamid et al. Applying the residue number system to network inference
CN1592103A (zh) N阶半带插值滤波器
CN1717653A (zh) 带有查询表的乘法器
CN113283591B (zh) 基于Winograd算法和近似乘法器的高效卷积实现方法及装置
Liu et al. A high speed VLSI implementation of 256-bit scalar point multiplier for ECC over GF (p)
Geiselmann et al. A simpler sieving device: Combining ECM and TWIRL

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080423

Termination date: 20181121

CF01 Termination of patent right due to non-payment of annual fee