TW522316B - Method and apparatus for effectively performing linear transformations - Google Patents

Method and apparatus for effectively performing linear transformations Download PDF

Info

Publication number
TW522316B
TW522316B TW090124691A TW90124691A TW522316B TW 522316 B TW522316 B TW 522316B TW 090124691 A TW090124691 A TW 090124691A TW 90124691 A TW90124691 A TW 90124691A TW 522316 B TW522316 B TW 522316B
Authority
TW
Taiwan
Prior art keywords
matrix
vector
input
data
address
Prior art date
Application number
TW090124691A
Other languages
English (en)
Inventor
Danny Yellin
Doron Rainish
Avner Dor
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Application granted granted Critical
Publication of TW522316B publication Critical patent/TW522316B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms

Description

522316 五、發明説明( 技術範疇 —本發明係有關於數位信號處理的領域。它可提供用以執 行,性轉換之-改良方法及裝置,且具減少算術運算次數 、簡化電路、與低消耗功率。 發明背景 領 線性轉換普遍㈣信號或資料處理。-線性轉換可從認 為”輸入向量”的一n維矩陣向量、及認為,,輸出向量”的一r 維矩降向量產生。在許多應用中,輸人向量是由需要處理 的特A L號數位取樣組成。然而,線性轉換應用並未受 限於任何特殊領域,它們本質可用於科學與技術的每個 域,而且他們有效性能是高度想要。 從η維矩陣向量組(實數、複數、或任何欄位的數量)到 下 維矩陣向量組(相同領域的數量)的一般線性轉換可藉 列排列rxn提供: 9 *2/7
A arl 一般輸入η維矩陣欄向量可窝成下列形式·· 522316 A7 B7 五、發明説明 x2 該線性轉換可藉由下列公式提供的矩陣乘積而從輸入向 量X及Γ維矩陣的一輸出攔向量y產生: yi αιι αΐ2 · . · . · αΧη 少2 α2\ α22 * * · · · α2η χ2 尸 = 入 A 、 人 ailXl + a\2X2^ * · · . . ^ClXnXn α21Χ1 + α22Χ2+ * · * . . +α2ηΧη .ar\X\ ar2X2 + · . · · · + 心尤” 線性轉換的一簡單性能需要r · n乘積及r_(n-1)加法。 二進位矩陣在本發明的發展與應用方面是特別重要。二 進位相反矩陣是在他們的登錄中只包含±1值。此後,他們 稱為U矩陣。由一 U矩陣表示的線性轉換稱為u轉換。在上 述中,如果特定轉換是一 u轉換,那麼r-(n-i)加法/減算於 簡單性能是需要的。另一類型二進位矩陣在他們登錄中只 包含0、1值。他們稱為〇-1矩陣。由〇_丨矩陣所表示的一線 -5- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7 五、發明説明(3 ) 性轉換稱為一 0-1轉換。在上述中,一般而言,Γ-(η-1)/2加 法於一 0-1轉換的簡單性能是需要。 在本文中,術語”二進位轉換”是由上述兩類型轉換所組 成:U轉換及0-1轉換。為了要完成引用提及的技術,術語 U向量可視為在它的元件中具有土1值,同樣地,在它元件 中具有〇、1值的一向量將可稱為一 0-1向量。 二進位轉換處理是由輸入向量的加法與減算元件所組成 。他們能以需要例如加法器及減法器的元件之一電子應用 特殊積體電路(ASIC)硬體實施。這些元件的使用是昂貴且 消耗能量,而且他們結構會佔用一大區域。具一低資源消 耗的二進位轉換硬體實施在許多技術領域是逐漸增加需要。 在數位信號處理的各種不同觀點中有廣泛使用的U轉換 。它包括例如影像處理與無線通訊的多種通訊技術。 現階段,全世界持續熱衷於直接序列(DS)劃碼多工存取 (CDMA)展佈頻譜通訊。IS-95 [TIA/EIA/IS-95-A,"Mobile Station Base Station Compatibility Standard for Dual-Mode Wideband Spread spectrum Cellular System, Feb 27,1996] 是發展DS-CDMA系統的一範例。 在CDMA傳輸技術中,一多使用者資料可在一合成信號 中傳送,然後在傳輸之前乘以一假隨機雜訊(PN)碼,其是 一具有隨機雜訊性質(例如低相關係)之一 U序列。展佈性質 可產生抗雜訊的傳輸,包括多路徑雜訊、干擾或偵測。長 於信道碼的一捲積碼亦可使用。第二代(IS-95-B)與第三代 (3G)寬頻帶(WB)CDMA標準的傳輸方式需要接收器執行多 -6 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 ________ B7 五、發明説明(4 ) 碼偵測。此是同時將組合頻道解除展佈的一工作,其每個 頻道是先前展佈成一不同信道碼。此可藉由U轉換應用達 成,其中包含矩陣的展佈碼時常是一 Hadamard矩陣的列。 此許多範例之中的一者,其中有效U轉換技術於達成一低 資源消耗的計算工作是想要的。 有數種已知機構可改善線性轉換的特殊性能。從一非常 大範圍選取的一些相關範例將在此提及。執行捲積及於 DSP可當作濾波器使用的T〇pntz轉換可藉由使用傳統快速 傳利葉轉換(FFT)演算法而有效達成,該演算法需要 〇(n]og2(n))加法與乘法運算,其中n是領域空間的大小。對 照下,該標準簡單方法需要〇(n2)加法與乘法。有關更詳細 描述可參考:[James W· Cooley and John W. Tukey,,,An algorithm for the machine calculation of complex Fourier series",Mathematics of computation,19(90): 297-301,April 1965.] 在包括CDMA技術的數位信號處理中所使用的一特殊類 型U轉換疋由一 Hadamard矩陣表示的Walsh-Hadamard轉換 。一 Hadamard矩陣可依下列循環定義: 1 ]? \ 5 而且對於每個整數η而言,一 2的乘幕:付2 =「札 Ηη * lHn 用以執行的一低複數與能量保存演算法快速Waish-Hadamard變換(FWT),其可用以將ηχη 陣的加 本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公發了 522316
AT __ B7 五、發明説明(5 ) 法/減法次數減到η·log: (η)。此可在這些運算中提供一選擇 性節省。在此方法下的基本觀念是類似FFT。 ϋ轉換的觀點可藉由本發明的另一特性修改,以適於 top 1 itz U轉換性能的有效方法及裝置。這些轉換係表示一 特定U序列或一複數U序列的全部或部分捲積。丁〇1)出21;轉 換的無線通訊應用包括開始時間同步及使用具一實數或複 數假隨機(PN)或黃金U序列的搜尋器。一黃金序列是由兩 PN序列的Z2加算組成。 本發明的上述二進位觀點可由本發明的另一觀點歸納出 由一相當小數量不同登錄的rxil矩陣所表示一線性轉換性 能之有效方法及裝置。本發明的進階觀點的應用包括由{〇 ,1,_ 1}登錄的一矩陣所表示複數u轉換及線性轉換。本發 明的廣泛較佳具體實施稱為一般化去除法(GEM)。 寬頻帶CDMA及進階DSP未來技術的可能其他分枝將可 從不同展開因素的一輸入信號同時分析而獲得。此可將方 法提供一多碼頻道,以便允許同時接待例如傳真、正常電 話X淡及網際網路資料的不同類型資訊,而不致於使網路 過載本發明的另一觀點是這些類型列型運算的有效方法 及裝置。它包含具額外處理器的本發明U二進位觀點的修 改版本。此額外處理器係使用有關該U二進位方法所需的 加法次數,以發覺一結構而可在整個低速率加法中各種不 同部分中運用U二進位方法。 本發明的額外主要應用包括無列多媒體系統個人衛星行 動系統、GPS衛星定位系統等。在行動通訊及其他行動的 _ - 8 · 本紙張尺度適用巾關轉準(CNS) Μ規格(咖χ挪公董) ---- 522316 A7
本文中’在用於線性處理以 要的。在行動電話技術中的 減少電路、及縮短響應時間 減少電流消耗的計算系統是必 本發明應用可延長電池壽命、 本發明的這些及其他特性與 ^ , /、赏點可從下列砰細描述及附 圖而變仵更顯然。 圖1其係根據本發明的-較佳具體實施例而描述更新由 -裝置所採用一記憶體内容的操作圖,其中該裝置可使用 0-1二進位轉換矩陣執行轉換; 圖係根據本發明的一較佳具體實施例而描述更新由一 裝置所採用—記憶體内容的操作圖,纟中該裝置可使用U 轉換矩陣執行轉換; 圖3其係根據本發明的一較佳具體實施例而描述更新由 一裝置所採用一記憶體内容的操作圖,其中該裝置可使用 Toplitz轉換矩陣執行轉換;及 圖4係根據本發明的一較佳具體實施例的一裝置方塊圖 ,其中該裝置可用以執行減少加法次數的一線性轉換。 圖5係根據本發明的一具體實施例而描述一 Γχιι u矩陣A 與一 η維矩陣向量X乘積的一實施範例。 圖式之詳細說明 有兩新術語是描述本發明方法的基本原理。第一是等值 向量。如果他們之中每一是另一者的乘積,相同維矩陣的 兩非零向量在隨後的本文中稱為同等。此術語可運用於一 特定矩陣的兩列或兩欄。第二術語是在一特定矩陣中的一 -9 - 張尺度適用中國國家標準(CNS) Α4規格(210 X 297公楚) 522316 A7 B7 五、發明説明(7 搁先導元件。在本發明使用的定義是在加法矩陣各攔中的 取南索?1的非零元件。此定義是取決於在特定矩陣中一致 性的一預先定義的欄索引。新順序的一重新定義可產生新 先導7C件的一重新定義。例如,一特定矩陣的先導元件可 以疋各襴的最底部非零元件或頂端非零元件,其是因類似 於此目的所選取的順序而定。 0-1矩陣 本發明的較佳具體實施例可提供用以執行一0-1二進位 ,性轉換之有效方法。此後,t亦可稱4Π(Μ方法,,。下列 範例是描述0-1方法及其主要觀點的概述。 範例:提供一 0-1二進位4xi4矩陣A ··
1 1 0 0 0 1 1 1
OilOOlOOO!!-1 0 1 1 〇 0 0 1 1 ! 0 1 1 1 〇 〇 〇 0 1 0 1 ! 5 1 〇 1 1 〇 1 0 1 1 1 ! 及一丨4維矩陣輸入向量 工2 LXi4j 假設,它想要計算4維矩陣”輸出”向量: -10- 本紙張尺廇谪用中國國玄樓第Δ4损故0Qr7八咎、 522316 、發明説明(8 y 0 1 1 0 1 1 0 y2 1 0 0 1 0 1 1 少3 0 0 1 1 1 1 0 入 1 1 1 1 0 1 1 〇ι〇ο 〇 〇 ο 1 〇 〇 ο 1 〇 1 〇 ι ο χ2 Α · χ. Χ14 根據本發明的-較佳鍾實施例,矩陣α是先檢查相等 。既然沒有兩列是相等’戶斤以程序會進行下一步驟。炊 輸出向量y能以欄與係數相加的表示,其中該等係數是 相對輸入向量座標。因此: y-xx 0 1 1 '0^ Y T 1 0 + x2 0 0 + x3 0 1 + ^4 1 1 + x5 0 1 +尤6 1 1 +· Χη 丄 丄 1_ 丄 又 X "0 '1 + X8 Ί2 + x13 + x 14 + X9 0 裝 ^10 + X, 線 在此階段,連同他們係數的零欄將可被刪除。經由與輪 入向量有關的本發明之一較佳具體實施例達成的第一步驟 可將係數歸納及加算。如此,隨著6個加算,下列換算的向 1*方程式便可完成: 11 - 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) 522316 A" B7 五、發明説明(9 y = (xx +χΊ +χ12) • (Χ3 屮乂 14 ) + (^4+½) 十Χ5 十 06+½) 此表示可藉由下列定義而簡化·
Χ3 + Χ14、w4=x4 + A . w2:=:X2 + X9 " W3 y w6 = x6 + x ,其表示·· "0' 了 T 少2 1 0 0 0 + w2 0 1 少4 1 1 1 + w4 w5 w6 然而,現在此 向量方糕式可 此同等於最初問題,但是減少爛數量 減少類型可交換。為了要獲得進一步增益 分成下列同等組的兩向量方程式: "Ο" T Ύ Y 少2 1 4- 0 + w3 0 +怵4 1 0 0 T T A =wx 丄 + w2 1_ + w3 1_ + w4 _1_ + 冰5 〇 +W6 Γ % i 這兩方程式之中每一者將可如此較佳具體實施例的第 步驟個別處理。如此,相同非零欄的係數將可歸納及加鼻 。因此,在此階段上,該方法達成具6個加算二的兩向量方 程式組: 12 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297^57 522316 A7
— =+ w4) "Γ 又 + (w2 + w3 + w5) T 又 + w6 Ύ 丄 入 -(w{ +w2) "0* 丄 + 〇3 +W4 +W6) 了 丄 + w5 丫 現在,很顯然只有4個額外加法需要完成輪 I 词出向1y的計 ° Q此,想要的結果可使用整個丨6個 士 -^ ^ 外心成。執行此 4开處理的傳統先前技藝方法需要28個加算。當矩障的維 矩陣成長時,本發明較佳具體實施例的前述處理將可顯示 一成長相當有效方法。 大體上,本發明的〇_1二進位於一 η維矩陣向量X的rxn維 矩陣的二進位〇-1矩陣A乘積是一有效方法及裝置。該矩陣 如下示: an ^2.....aXn α21 α22.....α2η 其中 ,1而 ISiSr,1幻< n 〇 而且該輸入向量如下示:
V κ」 輸入向量的登錄可以是實數或複數或屬於任何欄位數量 -13- 本紙張尺度適用令國國家標準(CNS) Α4規格(210 X 297公爱) 522316 A7 B7 五、發明説明(11 ) (例如ZD。孩目標是要藉由向量χ而計算矩陣A乘積的結果 。此結果將可由下式表示; 少 XX 少2 — a2\ a22 a U2n x2 cirX n * am\ 3- 將描^的程序是可重覆,而且下列一連串步驟或其一部 分可於每個反複重複。根據本發明的一較佳具體實施例, 第-步驟是檢查相等列。當可能時,此步驟應該在任何輪 入向量處理開始之前完成,當作一預備。如果發現丨列等於 j列,那麼它可推測yi是等於yj。因此,兩相等列之中一者 將可省略。為了清楚緣故,具有較大索引的列將可始終被 省略。因此,如果j > i,那麼j列將可被省略。此初始運算 y在本發明執行最後步驟上修改,其中在此階段(既然它是 等於y;)已知的%可回到向量y的適當位置。相等列的省略將 可持績,直到他們在矩陣A沒有兩列相等為止。實際上, 在階段在許多場合可跳過。每當它執行時,於相等列有一 合理的可能性。既然此情況可確定相等列的存在,所以當 log: (r)>n時,它始終可被執行。 為了要避免麻煩的符號表示,當ΓΧη維矩陣的最初矩陣與 名稱亦要維持時,從此隔離處理產生的修改矩陣將具有相 同名稱Α。在下一階段,一加總處理可用來移除相等攔。 此程序可在最少加算的修改矩陣中減少攔數量。首先,向 -14 本紙張尺度適用中國國家標準(CNS) A4規格(21〇 χ 297公釐) 裝 訂 線 522316 A7 B7 五、發明説明(12 ) 量乘積y=A,x的矩陣可分解成A欄乘以相對χ元件的加算。 因此: ^21 α2\ y - Α·χλ + χ2
此加算的每個元件是由矩陣Α的一襴向量所組成,其中 該矩陣A是乘以向量X的對應數量係數。此加算可簡潔寫成 :y=A.x=xlVl+X2v2+.,.+XnVn a2j 其中(每j)Vj是A的j欄:V = · 根據本發明的一較佳具體實施例,零攔及其係數可在此 階段省略。其次,相同非零欄可組匯集及重配置,其中每 個獨特欄可變成一共同因素,其中該共同因素是乘以對應 數量係數的加總。因此,結果加總可藉著重複欄的省略而 包含從最初一連串非零欄擷取一連串的所有非零攔 Wl,·····,Wm。各欄Wj是乘以一係數tj,其中該係數、是等於此 搁的所有欄的對應最初係數之一加總。很清楚,m^n,而 且差異n-m是最初序列',、,……,vn中反複數目。上述處理 可由下列數學描述而形成公式··
522316 A7 B7 五、發明説明(13 y - Α*Χ - Π / <y < Λ XjVj
(口 目月’〕,對於所有lS|^m而言,定義:斤□厂以致於:Xj 到現在為止, 最初一些Χι,..... 計算工作是此新係數ti,·.·,·人的計算,如同 ,xn的加總。η-m加算是需要。乘積如 此可依下列提供·· y^A^x^nj<k<mikwk 用以決定需要加總元件的計算管理觀點可於輸入向量出 現之前可於每個矩陣一次達成,當作一預備。概括而言, 讓B是rxm矩陣,其中該矩陣的襴分別是Wi,· ····,Wm,而且讓: 然後γ=Α·χ=Β·1,如此,上述處理可將rxn矩陣a乘以n向 量X的最初問題可減少到rxm矩陣Β乘以m向量t的問題。當m 較小時,此允許的增益會較大。
下一步驟是將先從階段的矩陣B水平分成兩或多個子矩 陣,其中列是保持完整。每個子矩陣將具有減少的列數量 ,而且可於下一重複中提高上述攔歸納程序的增益。矩陣B 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐) 522316 A7 B7 五、發明説明(14 的列可由下列表示: 可依下列表示: ur。考慮下的乘積然後 裝 ux 't 中每列疋在數量乘積中乘以向量t。鑑於此表示,計 异y-Bn的工作是同等於計算^數量乘積的組合工作: U2·丈,.....,Ι1Γ·1:。
據本發月的一車父佳具體實施例,此可藉由計算向量乘 積的矩陣而達成:,其中矩陣Βι和之中每一者 。σ矩陣Β的-部分列,而且這兩部分是互相散開,而且他 們的聯集包含Β中所有列組。通常,除了第—重複之外,兩 子1陣將具有相同或幾乎相同數量的列。然而,在-些特 殊h此,可分成超過兩矩陣,其是因矩陣Α的性質而定。 ,情況是當矩沒有特殊内部順序時,它的登錄可認為 疋Ik機選取。然後’本發明的一較佳具體實施例將暗示第 一列=割將造成所有分開的子矩陣l〇g2(欄數量)> 列數量 的狀怨。然後’處理反複可將列分成量幾乎相等兩部分。 矩陣為為隨機的情況本質是最壞情況。 可取代上述水平分割插入或在其前的另一步驟是一垂直 分割。根據本發明的一較佳具體實施例,上述加總如下所 -17- 522316 A7 B7
五、發明説明(15 示·· 可分成兩部分: y^^l<k<p (kwk 其中P是在1與m-1之間選取。如此,對於&而言,矩陣的 欄組疋wi,.....,wp,而且對於I而言,矩陣的攔組是 WP+"…··,Wm,它可保持: y = Bjmtr + B 2%t,f 其中’對應向量是:t,= (t”.......,tp)和 tf’ = (tp + 1,·····,tm)。因 此,藉由本發明的較佳具體實施例,兩較低維矩陣乘積心十 和B’t"將可個別計算,而且最後,兩^向量的結果可一起加 總。B欄w" ·····,wm索引的一初步再配置可提高此步驟的效 力。 垂直分割將比其他程序較少使用。它的主要使用是在列 數量實質超過攔數量的情況,較少使用於DSP應用情況。 此步騾的基本缺點是需要將兩乘積Βι十與B^t ”的結果加總 ,其中該等乘積是由在上述水平分割中沒有平行的一額外 組r數量加算所組成。類似上述水平列分割,垂直分割可分 成超過兩矩陣,其是因矩陣性質而定。 最後’該等上述步驟之中每一者可應用在重複的反複, 如此可形成一循環機構。 然後,一範圍可提供上述方法所允許的節省。對於一 -18- 522316 A7 B7 五、發明説明(16 ) 〇-1矩陣A,以致於1^0^“11)而言’在最壞情況由s*(n,r)表 示的加算次數可以下式表示·· s ^ (n, r) n + s ^ (r). 下表可將範圍提供給具許多列的矩陣加算次數。 s^(2): =痛1 s* (η, n - 1 s^(3): =2 s^(nf V = n + 2 s^(4): =7 4)= n + 13 s^(5) = 22 s^(nf 5)= n + 49 下列 丨是最壞情沉的範圍: s^(r) < 2r π h 2r/2^2 ~ / 標準(先前技藝)方法需要u(A)-r加算, 其中 u(A)是在矩陣 A的數值l’ns。一般而言,(預期當A是隨機)u(A) = (n-2).r/2 。既然當η是無窮大時,所以s*(n,r)/n近似1,而且r是常數( 或r S cMogJn),其中l>c>0),此方法漸近是最理想(對於範 圍r及無範圍n)。 當Α是一 Γχη 0-1矩陣,且未假設矩陣a的Γχη時,那麼本 發明所需計算乘積Α·χ的加算次數可限制在(i+C])n.r/ 1〇g2(n),其中1>口>0,而且當j^n是無窮大時,□會是零。 在r>η的情況’ 一較小範圍(有關此情況)會存在,此情況是 從垂直分割的應用產生: (1+口)rfr/l〇g2(r),其中 1>〇>〇, 而且當r和η是無窮大時,□會是零。 -19- A7
為了要評估此處理效率, 及減f缺t 看出尽發明可提高管理運算 由使複雖度的一王要部分,而且經 叫疋用本發明可減少加篡分 力次M w加斤政果。而且,大部分管理運算可 在男科向量處理之前於每矩陳 暂枚h 4 、母矩陣A/人達成,該建議方法可實 貝=功率消耗與電路。當特定㈣具有—些稀疏程度時 杂、h 0 1 一進位觀點可特別有效。此時常會遇到當此具體 二施例的應用係結合在本發明的實數矩陣觀點中所述的一 般實數矩陣與一向量乘積計算的分配算術。 此外,本發明的觀點可適於代數碼(參考·· [shu Lh, Daniel J. Costello, Jr ^Error Control Coding Fundamentals and Applications ^Prentice«Hall5 Inc., Englewood Cliffs, N.J·,1983]),其中一乙矩陣的編碼及解碼是乘以一乙向量( 或Ζη向量)。此在任何情況是同樣的,其中一乙矩陣是乘以 一 Zh向量。最後,除了特性2的領域之外,上述ο]二進位 具體實施例及下一 U二進位具體實施例可在數量的每個領 域中容易互換。在每個特殊情況,更有效具體實施例可選 取0 U矩陣 本發明(此後亦稱為"U方法π)的U二進位較佳具體實施例 描述所需的初步觀念是向量類似觀念。如果一是另一者的 乘積,相同維矩陣的兩非零向量可稱視為同等。在此具體 實施例的本文中,注意,如果兩U向量是相同、或如果他 們之中一者是另一者的(-1)乘積,他們是同等。下列較佳具 體實施例是相當類似上述一者。主要不同在於下列本文移 -20- 522316 A7 B7 五、發明説明(18 ) 除的完成是同等於(列或欄)向量,而不是相等向量。此可 加速移除率,如此便可提高效率。此具體實施例是經由一 範例說明,說明觀念的本值: 範例··考慮下列5 X 1 3 U矩陣A與一 1 3維矩陣輸入向量X的 乘積。 矩陣可藉由下式提供:
而且輸入向量可由下式提供: X2
乘積的結果可藉由下式提供: yi y2 少3 y4 列。實際上,它是在輸入 —掃插可發覺特定矩陣的 處理的第一步驟是要檢查同等 向量達成之前每次完成一操作。 -21 - 522316
相等列發生’列2是與列4相等’事實上’列4是與(-1相同) 乘積列2相等。它遵守y4==-y2。因此它不必需計算y4*y2, 因此y 4的汁算將可省略。如此,列4可從矩陣A刪除。結 果的矩陣A,可依下列提供:
一 1 1 1 -1 一 1 1 一 1 一1 1 一 1
-1 -1 1 -1 1 1 -1 1 -1 一 1 一 1 1 1 -1 1 -1 1 -1 -1 -1 1 1 一 1 1 對應輸出可由下式提供:
而且它可保持:y’=A’*X 此是第一減少。在下面,乘積Α’·Χ可分解成A,攔乘以乂元 件之一笳總。因此:
- Γ 丫 二 Γ 一 1 1 1 二 Γ 少2 =Χ\ 1 -1 一 1 1 1 一 1 1 少3 1 一 1 + χ2 1 1 + χ3 -1 一 1 + χ4 1 一 1 + jc5 一 1 1 + x6 -1 1 + x7 一 1 一 1 然後,上述加總的該等攔向量之中每一者的正常化可备 施,以致於每個修改向量的上面元件是1。如此,如果向量 -22 522316 A7 B7 五、發明説明(2〇 、---- 然而,如 的上面元件是(-1),向量及其係數可皆乘以(-1) 果向里的上面元件是丨,便沒有修改。上述加 化形式可從下列取得: 下列正常 (一戈) Γ 丫 T _ Γ 1 ' ,1、 一 1 一1 + x2 一1 1 + (-x3) 1 1 + (-χ4) 一 1 -1 -l· x5 1 -1 + x6 〜1 〜1 _ 1 _ 1 _ 丄 _ 1 _ 1 _ _ 1 + (一 x8 一 1 x9 10. + ½ + (-½) + ½ >1' 少2 少3 丫 x7) 一 1 1 _ 1 + 在此正常化加總中,向量的上面元件是1,而且不同向量 的數量可減少。下一步驟將可歸納及加總一些欄係數。如 此’隨著8個加算,下列方程式便可獲得: 少2 = ((1) + (-χ4) + χ6+Χ9) 丫 一 1 一 1 + (x2 + (-X7 ) + x8 + (-½ ) + ) 丫 -1 1 入 η r 11 m 丄 1 _ + (( 一 X3) + X13) + x5 1 一1 + (-½) 一 1 新係數現將可定義如下·· -23- 522316 五 A7 B7 發明説明(21 )
Wi = (-Xi) + (-X4) + X6 + X9? w2 = x2 + (-x7) + x8 + (.X|〇) + x W3 = -X3+. x13, w4 = x5. w5 = -x12 因此,上述方程式能以下列形式提供:
係數:Wi、w2、w3、w4、w5在此階段是處理器已知的。 在下一階段中,此向量方程式將可水平分成下列一組兩方 程式: 1 1 1 1 了 人 =wx 一 1 + w2 一 1 + w3 1 + w4 1 4- w5 1 "V 一 1 1 1 •1 — 1 少5 = 1 + w2 1 + w3 1 + .w4 1 4* w5 一 1 現在,這些方程式之中每一者能以反複的相同方式個別 處理。既然它繼承先前方程式的正常狀態,所以上面方程 式不需要正常化,如此,正常化只需用於第二方程式。因 此,結果的組如下示: 1 1 1 =Wj + w2 -1_ + w3 丄 w4 少3 :(一冰1) w2 w3 w5 一 1 在下一步驟中,相同向量的係數可歸納及加總。如此, 隨著額外6個加算,結果是如下示: -24- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7 五、發明説明
Oi +冰2) + (w3 + w4 + νμ5) = -w4) 一1 + (W7 + W3 Η —W5 ) 很清楚’向量y,可使用4個加算找到。為了要獲得最初輸 出向1 y ’現只要回想y4= -y2。如此,整個i 8個加算於此處 理是需要的。可看出,傳統先前技藝方法需要6〇個加算來 計算輸出向量。 本發明的U二進位較佳具體實施例是一 rxm u矩陣A與一 η維矩陣輸入向量;^乘積的一有效方法。它通常可提供大於 〇-1較佳具體實施例的增益,而且具有更多應用。 矩陣Α可依下式提供: a\\ an.....a\n α21 α22.....α2η 其中 a;- ±1 而 lsisr,
而且輸入向量可依下式提供:
V x2 κ」 輸入向量的登錄可以是實數、或複數、或屬於大於2特性 -25- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐) A7
的任何攔位數量。目庐e — ^ 目‘疋要計算下列乘積的結果: y=A*x 〇
裝 σ第步驟疋一特定矩陣乘以相等列的移除,一步騾可以 :、部力勺預冑。如果發現i列是等於)列,那麼它可歸納% 等於一L因此,本發明的第一步驟的一較佳具體實施例可 决疋兩相等列之中的一者可省略。為了清楚緣故,策略會 是具有較大索引的列將始終是省略一者。因此,如果假設 j>l’那麼j列可省略。此最初操作在處理的最後步驟可相反 ,其中在此階段已知的Yj可放回到向量y的原始位置。此去 除處理可持續,直到修改的矩陣沒有相等兩列為止。
每當有相等列的一實際可能性時,此階段便可執行。此 時常是U方法的多乘積(本發明的另一觀點)應用的情況。既 然此情況可確保相等列的存在,所以當log2(r)^n時,此階 段可始終執行。然而,有其他情況可確保相等列的存在, 而且應該考慮。例如’此可以是Hadamard矩陣的子矩陣情 况。為了要避免不靈活的表示法,結果修改的矩陣將具有 與最初矩陣相同名稱A,而且維矩陣rxn的名稱亦可保留。 下一步驟是去除相等攔。此將可減少使用最少加算修改 的水平維矩陣(亦即攔數量)。與此步驟有關的所有管理可 如0-1觀點達成,每次每個矩陣通常可在資料向量出現之前 預備。首先,乘積y=A*x可表示成A欄乘以對應X元件之一 加總β -26- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐)
讓Vj(有關每個j)是A的j欄: Z2j 然後 A*X = X.V1 + X2V2+….…+ χην„ 被:;’*果它不是+1’矩睁A的各欄向量的上面元件可 常化二而且正常化成+1值°因此’當V卜那麼沒有正 :=…然而’如果—,那麼正常化會發生,而且 十應J搁向里是乘以-1、及並對虛〆玄 &木Λ Α夂具對應係數Xj。上述加總的一新 表不法如此便可獲得,其中每個向量的上面登錄是等於+ 1 。在此表示法中,相同襴是始終相等。 一相同欄然後可如上述…丨具體實施例而一起匯集,而且可 藉由採用g作一共同因素的各棚而重排列,其中該共同因 素是乘以它對應數量係數的加總。因此,產生的加總可藉 由隔離反復正常化欄而包含從一連串正常化襴向量擷取的 連_所有獨特正常化欄向量Wl、.....、wm(沒有重複)。每 alnv 1 η ν η 獨特正常化欄wj是乘以一係數tj,其中該係數tj是所有正常 化攔的對應正常化係數之一加總,而且該加總是等於此襴 。很清楚mSn,而且差n- m是在下列最初一連事正常化欄的 重複次數目·· 、a12v2、.... 鼻術處理如下示:
(XjaU)a^J I 丨 * -27 本紙張尺度適用中國國家標準(CNS) A4規格(210 x 297公釐) 522316 A7 _______ B7 五、發明説明(25 ) 對於所有kksm而言,可定義成:π□一μμ卜的 在本發明此部分中包括的主要計算工作是計算新係數 tl?···.·,tm ’當作正常化最初一些的加總。額外加算是n-m。 乘積Α·χ可依下列提供: 藉由欄去除處理的增益是因最初矩陣Α的結構而定,它 在無線電通訊的編碼及解碼信號向量中普遍使用的一些矩 陣中是重要的,例如在Hadamard或循環pn矩陣的一些類裂 子矩陣。它實質亦是當矩陣A的列數量r相較於列數量η是相 當小的情況。特別是d〇g(n),在此情況,。 這些看出對於〇-1矩陣亦是同樣的。 本發明的其餘較佳具體實施例,水平與垂直分割、重複 是相同於它0-1相對物。 為了爹看出使用本發明所允許的節省,首先注意加算是 複數的主要部分。對於一 rxn U矩陣A而言,以致於在最壞 情況由s(n,r)所表示的加算次數d〇g2(n)可界由下列提供: s(n, r)=:n-irs(r) 其中: s(l): :-1 s(n,1) = n 一 1 s(2)- =0 s(nf 2) =- n Φ)= =3 s(n} 3) = n + 3 s(4) ~- =8 s(n, 4) — n + 8 s(5)= =19 5) ^ n + 19 -28- 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐) 522316 五 發明説明(26 A7 B7
(η, 6)- η ^ 3 8 (η, η 7 5 (η, - η + 144 (η} η + 283 s(6) = 38 s(7) = 75 s⑻=144 s(9) = 283 下列範圍始終是有效: s(r)< 2^1 + 2γ/2 + 1 先前技藝傳統方法需要(η.υ·Γ加算。既然#η是無窮大, ‘是常數時,S(n,〇/n近似i,所以此方法是漸近最理想。 稍後所述本發明的更複數多乘積具體實施例對於最壞加算 而言需要-精確的範圍。&將可藉由下列迴料式取得:
對於偶數r而言: + ky/Q 對於奇數r而言: W㈣·1 + s((⑴)/2)+s(⑹)/2: 當一是rxnU矩陣,而且矩陣八的維矩陣Γχη沒有限制,} 麼在最壞情況計算乘積Α·χ的本發明所需加算次數始終7 在範圍:(l + Cl)nT/log2(n) ’其中1>α>〇,而且當_ η是無】
大時,□是零。在r>n情況,一較小範圍(有關此情況)會存 在,而且是從垂直分割的應用造成: (l+[])nT/log2(r),其中 1>G>〇, 而且,當r和η是無窮大時,□會是零。 然而,如果在矩陣Α有一特殊類型結構,那麼計算矩陣 Α·χ的本發明較佳具體實施例所需的加算次數可明顯降低 。它的最一般情況是超過目前本文範圍,但是一些範例將 提及。然而,在Α是ηχη Hadamard或循環假隨機(ΡΝ)矩陣的 情況,那麼只有n.log2(n)加算及η數量的記憶體將需要,其 -29- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐) 522316 A7 B7 五、發明説明(27 ) 在這一點上是最理想的。此說明亦適於〇 -1矩陣。 工業應用範例 有數種技術將可從上述本發明的較佳具體實施例實施獲 益。一此技術是包括數個程序的影像處理,該等程序包括 一 U矩陣與一向量乘積。在無列通訊CDMA與IS-95、及在 更進階第三代寬頻帶CDMA中,有數個處理是採用一 u矩陣 與一向量的乘積。這些處理將可使用無能量消耗電路完成 ’而且有時亦可藉著本發明的使用而消耗時間。 在IS_95-B的多碼的本文中,來自Hadamard-64的多碼本 文的8列包含一u矩陣乘以一向量,其中該向量的登錄是一 L號取樣。另一應用是藉由解展佈器的相鄰偵測。在此, 存在者由一些Hadamard列組成的一矩陣乘以一資料向量的 乘積。另一應用是搜尋器。它可藉由他們相互數量乘積計 #而搜尋序列的較南相關性。相關器序列可從u序列的假 隨機序列擷取,而且他們經由一資料向量的數量乘積是需 要計算。初始調查是一搜尋器的範例。 一般化去除方法 一本發明上述二進位觀點的特徵是重複下列處理:零列及 5 μ〗(/、表示疋另一者的數量乘積)可省略;零欄可連 同與他們有關的輸入向量數量元件省略;相等襴可匯集及 加计,❼且在ϋ兩特徵用完之後,余巨陣可水平 < 垂直分劃 。根據本發明的一較佳具體實施例’此步驟的反覆序列可 運用在任何欄位數量的矩陣與向量的任何乘積。本發明的 較寬廣較佳具體實施例將可稱為-般化去除方法(GEM)。 -30 297公釐) 522316 A7 ____ B7 五、發明説明(28 ) 相等欄的加總基本上是下列處理的一重複。讓〜、、、·… 、vn是轉換矩陣A的欄,而且x=(x1、X2、...........、xn)是 輸入向量,而且目標是要計算:Α·χ。假設在索引的一適當 重排列之後,它可保持,其中該等攔Vk+i、 ·.、^之中每 一者(對於一些2^k<n而言)是k欄的數量乘積,即是於]^』^ • vj = zjvic。然後,η維矩陣向量X可藉由減少k維矩陣向量而 取代: χ ==(χι5Χ25.....,Xk-i,x’k)其中 x’k= xk+xk+1.zk + 1 +.....+ Χη·ζη 而且rxn矩陣可藉由減少rxk矩陣A’取代,其中該矩陣Af 的攔是νι、ν2、···.·、vk。它然後可保持:Α’·χ,=α·χ。根據 本發明的一較佳具體實施例,如果需要索引變化,此處理 可重複,直到沒有兩欄是相等為止。的確,此處理只是在 本發明的U矩陣具體實施例中發生正常化處理的一般化。 實際上,所有上述相等欄減少可同時完成。當此階段完成 時,它便可認為是整個處理的一第一重複。然後,矩陣可 水平分割,而且在每個分割中,上面欄去除能以在上述具 體實施例達成的一循環方式重複。 當由U具體實施例及下一範例證明時,去除相等欄的一 有效方法是藉由先將最上面元件的每欄分割、及將對應係 數乘以一些最上面元件。結果,在每個修改欄的最上面元 件具有1。然而,有時在GEM的應用中,轉換矩陣一欄的最 上面元件是零,其是不可能使此分開。在此情況,簡單解 決是藉由它最上面非零元件而將每非零襴分開,因此可將 對應係數乘以相同最上面非零元件。結果在每個修改攔的 -31 - 太铋珞兄麿谪职由函國定揉舉(T.NS) A4规格(210X297公釐) 522316 A7 B7 五、發明説明(29 ) 取上面非零元件是1。如果且只有如果他們是相等,此具有 在修改矩陣中相等兩欄的想要結果。 為了要說明本發明的較佳具體實施例提高效率,可考慮 在一相當小有限組S中具有它登錄的一矩陣有。實際上,此 組可能是一有限欄位、一欄位乘算群的有限子集、或在乘 异下的一接近欄的一有限子集,而且非常普遍是一欄位的 任何有限子集。它包括上述的二進位情況,其中s = {〇i } 、或S = {1 ’ -1},及其他非常普遍情況,其中s = {〇,1,_1} 、或 S = {1,-1,j,_j}、或 s = {〇,i j,·』}。增益可使 用s大小降低,而且一般規則可保持gem可將加算次數減少 logs(n)的一因素,其中n是特定轉換矩陣的欄數量。當可適 用時’ GEM亦可與稍後討論的複數與一般具體實施例有效 比較。 為了要描述此方法工作方式,它將證明登錄是來自下列 組的一矩陣:U^def^i,-1,j , -j},此稱為K矩陣。此 類型矩陣時常實際出現。然而,它必須再次強調GEM並未 局限於任何特殊類型的矩陣。加算次數可於rxrl U1矩陣與 一向量的乘積而局限於^ + 4^ + 0(4^1)範圍。 範例:可考慮下列3x15 矩陣A與一 15維矩陣複數輸入向 量的乘積。此可依下式提供: Γ1 一 j j 1 - 7 -1 j -1 j -1 1 -1 厂 A" J 1 j 1 1 j -j -j -:i -j -\ -j J 1 -1 j j j 1 -1 1 -ι -ι -j 1 j -i, 而且輸入向量可依下式提供: -32- 本紙張尺度適用中國國家標準(CNsTI^i^(21〇 X 297公茇) 522316 A7
五、發明説明( x2 乘積的結果是:
y — y2 = Αφ X 人 在此範例達成的所有加算是複數加算。第一步驟是檢查 相等列。沒有相等列可找到。在下一步驟中,乘積Α·χ可分 解成Α欄乘以相對X元件之—加總。 >1 丫 — . - 7 j' •-Γ T 一 / -1 + %2 J + 〜1 j +尤5 1 + x6 J j + χ7 1 人 _ 1 —1 又 -Λ 1 _ 了 二 Γ _厂 r- -1 丫 - ί 丫 χ8 1 + χ9 j + χ10 + xu 一 j + x12 - j + ½ - j +尤14 一 1 一 1 1 一 1 一 1 ;j· 1 /· - 一 • J · 然後,在上述加總中的該等欄向量之中每一者的正常化 會發生。它可藉著將每個向量乘以它上面元件的倒數,及 每個係數乘以對應向量的(相同)上面元件而達成。因此, -33- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公董) 522316 A7 B7 五、發明説明(μ
每個修改向量的上面元件是1。如果向量的上面元件是j, 便不需要修改。下列的上述加總正常化形式可取得。 >1 ' 1 " "1 ' T 丫 r- **Ί 1 _ Γ 少2 一1 +y) ·尤2 一 1 + / ·气 J + (- 1)尤4 + x5 1 + (- 一 1 人 又 义 义 一 j j 厂1 L· 一 (一 l)x7
1 ' - j + ㈠)x9 丫 - j +,½ ~ Γ ~1 + (- 1)尤11 Τ j + ½ 1 一 - j +(-/)½ V 1 j Ί ^ 丄 rL 一 1 在此正常化加總中,每個向量的上面元件是1,而且當( 在一般設定)欄η數量是充份相當大於列r數量(需求是: n>4M)時,不同向量的數量如此可實質減少。下一步驟是 歸納及加總相同欄的係數。如此,隨著7個加算,下列換算 便可獲得: V 丫 V 丫 y2 人 = (χι +74½ +Χ14 -y*^i5) 一 1 • j · + y,x3 j + ((- l)x4 +x12) 一 j rJ + (义5 +( T '1 " 丫 丫 T y)xi3 1 + ((-加6 +(- 1)A 一 1 一 1 ) + 7-^8 - j + (- l)x9 - j - + (-1)½ j j 新係數現將定義: -34- —-- 本紙張尺度適用中國國家標準(CNS) A4規格(21〇x 297公釐)
522316 A7 B7 — .丨1·1— 1_ 五、發明説明(32 )
X/2? M/y= Xs^(i)^lh ^ H)^ (-l)x7i
w6^j'^St V?7-(-l)X9 t WB^ (-l)^U 因此,上述方程式能以下式寫成: = ' 1 -一1 + w2 丫 J + w3 -1 ' - y +w4 丫 1 + w5 ~ 1 一 一 1 +冰6 ' 1 ’ ,j + w7 丫 少3 ./ / 一 / ,/ 一 1 乂 厂1
/係數:W”.......,WS在此階段是處理器已知的。炊後, l\ …、 此 向量方程式可水平分成下列相等組的兩方程式: -Γ T 丫 Ί 一 -Γ -1 " V 少2 =w{ 一 1 + w2 j + w3 - j + w4 1 + w5 一 1 + w6 - j + w7 j 裝
[y3] = W1[j] + W2[j]H-W3[-j] + W4[j] + W5[.l] + W6[j]4-w7[<l] + W8|-1^ 大體上,兩者是向量方程式。然而,在目前小範例中, 第二方程式可退化成一數量方程式。規則目前是這些方程 式之中每一者能以與第一重複的相同方式個別處理。既然 上面方程式是繼承先前方程式的正常狀態,所以它不需要 正常化’如此’在任何非退化應用中,正常化只需用於第 二向量方程式。結果,上面向量方程式的結果換算如下示·· -35- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7 五、發明説明(33 ) 少丨’ 丫 V 丫 'Γ ^2 =(w1 +w5) 一 1 + (w2 +w8) J + 〇3 +W6 +W7) - j +冰4 1 此步驟需要4個更多加算量。計算目前能以兩方程式的一 簡單使用額外13個加算完成。如此,在此範例中,本發明 的較佳具體實施例係使用整個24個加算。布魯特斯力量計 异將需要42個加算。在一較大規模中,節省是遠超過實質。 TOPLITZ 矩陣 為了要證明本發明的較佳具體實施例,一範例將提出。 範例··假設長度8的一序列如下示:u=( 1,1,-1,-1,1,-1,1,-1),而且它需要檢查資料向量的3個連績假設: x==(xi,x2,.................. x1())。目的可以是搜尋最大相關性。 下列3個加總需要計算。 yfl-x^l.Xs + Ol^Xs + OlVxJl ·χ5 + (-1)·Χ6+1·χ7 + (-1)·χ8 Υ2=1·χ2+1·χ3 + (-1)·χ4 + (-1)·χ5+1·χ6 + (-1)·Χ7+1·χ8 + (-1)·Χ9 y3=l ·χ3+1·χ4+(-1)·χ5 + (-1)·χ6+1·χ7 + (-1)·Χ8+1 ·Χ9+(-1)·χι〇 此可藉由下列toplitz矩陣乘積表示: -36- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 AT B7 五、發明説明(34 ) Ί 1 -1 1 一 1 1 -1 0 0_ 少2 = 0 1 1 -1 -1 1 -1 1 -1 0 入 0 0 1 1 -1 一 1 i -1 1 一 1 文10 Ί' 1 一 j 一 1 1 一 1 1 0 十幻 1 十 X3 1 十:^ 一 1 十A 一 1 1 十x7 一 1 +抑 1 0 0 1 1 -1 -1 1 -1 '0' *〇" 工9 -1 0 下一步驟是要匯集向量補數,如此: >ι" 1 0 1 0 一 1 -1 丫 少2 =(^1 0 + χ9 一 1 )〇2 1 + χ10 0 ) + χ3 1 + χ4 -1 + χ5 一 1 ^3 0 1 0 一 1 1 1 ~1 二 Γ _ Γ 一-Γ 1 + χ7 一 1 + χ8 1 厂1 _ 1 _ 此時,可考慮該等角括弧之中每一者的内部項,及利用補 助定理如果X、y是數量,而且v、u是向量,那麼:xv+yu=去(x+y)(v + u)+去(x-y)(v-u)因此: -37- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7 五 、發明説明(35 0 + χ9 "0" 一 1 =~(Xj +x9)( T 0 + '0' 一 1 ) + ^·(Χ丨-Χ9)( Ί' 0 一 -1) _〇 一 一 1 0 1 0 1 -(々 +x9) 一 1 + 5(X1 - X9) 一 1 同樣地: Τ "ο" "1 " Ύ 1 + ½ 0 -1 1 = -(X2 +½) 1 •-1- 1 + -(χ2 -χ10) 1 _1_ 因此,隨著4個加算,結果如下示·· V 1 , \ 丫 1 / \ * 1 ' 1 丫 1 少2 .^3. = -(' 十;c9) 一 1 _ 1 + 2(Xl —x9) 1 + -(x2 +x10) 1 -1_ Η--(文2 2 2 1 -1 一 1 1 一 1 1 -1 χιο) 1 + χ3 1 + χ4 一 1 + χ5 -1 + χ6 1 + Χη 一 1 十χ8 1 1 1 1 一 1 一 1 1 一 1 但是,現在上述U二進位方法可應用。如此,下一步驟 是可使各欄的上面元件等於1的一正常化。 V 1 / \ 丫 1 -Γ 1 丫 1 y2 •少3_ = -(χ{ +χ9) 一 1 1 + -(χλ -χ9) 1 厂1 + 2(χ2 +Χ1〇) 1 二 1 + 2(Χ2 τ 丫 丫 丫 丫 丫 -1 - χι〇) 1 丄 + (-χ3) 一 1 -1 + (-χ4) 1 --1 + x5 一 1 -1_ + (-x6) 一 1 _ 1 _ Ί- Χη 一 1 1 + (-叉8) 一 1 1 -38- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316
五、發明説明(36 ^ 下一步騾是歸納及加總共同襴的係數。如此,隨著6個額外 加算’我們可達成下列等式: (Xl + ) + (、) + X7 +(-Χ8 )) + (i(Xl .x9 )4(气 + ^ι〇) + (~Χ4)) 一 1 + ((—Χ3) + Λ:5) 因此’如果我們為兩方便而定義下示:
Wl=i(Xl+x9) + (-x6) + x7 + (-x8),w2^(xrx9)+玉(χ2 + χ1()) + (·χ4) w3=吾 Un。), W^I(-X3)+X5 然後,相等可如下寫成, r· 1 一 1 - T * 1 " y2 人 =wx 一 1 1 + w2 1 -1^ + w3 1 丄 + w4 一 1 - 在下一階段中,此向量方程式可水平分成下列組的兩方 程式: Γ* —1 1 丫 Ύ 丫 一 1 L — + w7 1 + w3 1 + w4 一 1 一少2 y3=wI + (.w2)+w3 + (-w4) 藉由在第一方程式中歸納相同欄,我們可獲得兩額外加 算: -39 - 五、發明説明(37 少1 72 •1 + 〇2 + w3) 触輸出向量y目前可使用5個額外加算找到。如此,具 1貝訑本發明的方法需要17個額外加算以執行此計算。一 布魯:斯力量方法將需要21個加算。很清楚,此小:模範 例=的增益將不明顯,但是當我們看出在大規模應用的 增叙疋與上述”平方”(非toplitz)u方法的增益是相當。 、 本發明此觀點的一般設定描述。假設一 u序列是 依下列提供: ....................,un 而且’實數或複數數量的資料序列如下示: χΐ,χ2,................+ 資料序列的元件可以是實數或複數或屬於大於2特徵的 任何襴位特性數量。假設,它想要計算下列加總: yi = ui'Xi + u2.x2 +.................+ υη·χη y2==u1*x2 + u2*x3 +.................+ un*xn + 1 +.................+un-xn+m 如果m<l〇g2(n),那麼讓r= m,否則,如果mMogjn),那麼 本發明的一較佳具體實施例將可藉著將m個加總組分成以固 連續加總區塊而開始,其中r<l〇g2(n)。所有區塊能以相同 方式處理,所以該方法可在第一區塊證明。第一 加總能 以toplitz矩陣與一向量的乘積表示。然後,考慮Γχ(η +卜 l)toplitz矩陣: -40- 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐) 522316 A7 B7 五、發明説明(38 )
Id j ΙΑ 2 U 2 ti 4 0 ux ιαί u3 Ο 0 u{ u2 Ο Ο Ο % 〇*·.·〇〇 〇...... .0 * ·. . A 而且,(η + r-l)維矩陣向量如下示: Γ x2 X = 然後,第一 Γ個加總可由下示向量提供: 卜 少2 、 y=. 其中: y = A*x。 本發明較佳具體實施例的基本觀念是要重組特定問題, 以致於上述U方法將可適用。根據他們順序,讓 vl5v2,.......,νη + Η是矩陣A的欄。可看出,所有下列’’中間”欄 向量是U向量: -41 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7 五、發明説明(39 )
Ur νΓ = J - A- ?.......…·…· 同時注意下列”匹配”對"旁邊”欄向量的加總及減算亦是U 向量: V/ + ν„φ/ = V 0 ^1 0 = 又 J^n-r+2^ _W rt-r+l V/ - ν„+/ % l/Vr+2」 W1 ΛηΑ V2 + Vn+2 V 0 UX 0 U2 * 七 κ = Un _Un-r+3 . " vn^2 . V 0 0 U2 * m «η =S£ -W, 又 _^/t-r4-3 · 厂 _ -42- 本紙張尺度適用中國國家標準(CNS) A4規格(210 x 297公釐) 522316 A7 B7 五、發明説明(4〇
Vr_7 ^ ^n+r-/ - , w〜丨 fu,1 -μ 0 卜1 A _ 0 一 丁 0 Λ 一 uv
Vr·/ - w叫 0 0 W1 0 wt· _ 0 — ru^ 在工作必要初步準備之後,該方法便可彳丨用。可根據上述 而重新配置: n]sJ^rm] xfj xjyj 4- ^r<j<n xjvj 其/人,本發明可使用如果x、y是數量且v、U是向量的規則 ,然後: …Ρ必i 叫“^w+ □必奶_ 此處理是2r-2個加算,而且達成 違风的形式是一 rx(n + r-l)U矩陣 及一 η + ιΜ向量的乘積。此在上 4所有向量皆如此:
Vr,vr+i,…,vn,V! + vnq,....., Vr l 4- Y n,r七 V…,..·.·,Vr-1 _ Vn + w 是u向量。如此其餘計算可藉由 "……… 万法達成。除了實質加算
Xj±xn + i,其是在輸入 /減异 < 外,U形式修改的所有觀點是· 向量達成之前以一 ’’每次工作”達成 在最壞情況的加算次數可由下式表r
522316 A7 B7___ 五、發明説明(41 ) st(n,r)=:s(n+r-l,r) + 2r-2 = n+3r-3-f-s(r) 在加總m可被計算及m>log2(n)的一般設定上,在最壞情 況的加算次數範圍是(l+[])(n+31og2(n))*m/log2(n),其中 1>口>0,而且當m*n是無窮大時,□會是零。 根據本發明的另外一較佳具體實施例,GEM的上述方法 元件可整合。在此情況,一些”旁邊”欄可保持不由結合旁 邊欄的第一階段處理。 (0,1,-1)矩陣
Toplitz矩陣是一部分的更一般類型矩陣:這些矩陣的登 錄是0、1或-1。此矩陣在此稱為(〇,1,-1)矩陣。與上述1〇1)1以 方法有關觀念的一較大版本現將發展。假設A是維矩陣rxn 的(0,1,-1)矩陣,而且:^是11維矩陣輸入向量,而且它想要計 算乘積:Α·χ。此乘積能以a欄乘以對應X元件之一加總。 因此’可由vj(對於每個j而言)表示成A的欄j,然後: A-x=xlvl + x2v2 + ·.···+ χηνη 一些、或者或許Α的所有攔包含ο登錄,為了表示簡化的 緣故,可假設索引的配置可以是該等·····,Vk之中每 一者包含一零登錄,而且所有其餘n-k攔(如存在)Vk + i, Vk + 2?…··,、是U向量(即是,沒有〇登錄)。很清楚,該等,,混 a向量· Vl,V2,.....,vk之中每一者是2個U向量的平均。因 此,1對於每個1 SjA而言,存在著2個u向量ιι』,ν^,以致於: Vj=4(uj +wj)。本發明的較佳具體實施例可發現向量\,Wi …,.,Uk,%是初步每個矩陣一次的準備。因此,藉由上述: -44 - 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公爱〉 522316 A7 B7
五、發明説明 A.x=ixl(u1+wl)+I .................+i^+w^-v- ^vn 然而’隨著角括弧的開始,我們發現一 rx(n + k)u矩陣與〆 (n+10向量的一乘積。根據本發明的一較佳具體實施例^此 工作將可藉由本發明的上述!;觀面完成。本發明的上述 toplitz觀面是此廣泛觀念的一特殊情況。 個別應用範例 搜尋器通常是由一 Toplitz矩陣與一資料向量的乘積表系 。此在CDMA及寬帶CDMA皆如此。 實數矩陣 根據本發明的另一較佳具體實施例,計算運算的數量讦 藉由使用分配算術而於任何實數線性轉換減少。在本文中 ,它稱為,,實數矩陣方法,,。線性轉換是由登錄是實數的〆 ,阵所表示’而且具有-固定數量的二進位數字,其中該 等登錄不必,然是整數。矩p車可分解成I二進位矩睁血二進 位係數的加總。在下一階段中’本發明的二進位具體實施 例將可應用。A了要介紹此方法’可考慮下列範例。範例 :考慮下列3X8 U矩陣A,其具有(為了此範例的簡化緣故) 整數登錄,而且以十進位的基礎可寫成如下示: "2 1 5 4 3 0 4 5' 3= 5 0 4 1 4 7 1 2 2 7 3 1 4 5 0 3 8維矩陣向量的輸入是無下所示提供·· -45-
522316 A7 B7 五、發明説明(43 X2 x3 x= χ4 x5 X6 x73 它想要計算3維矩陣輸出向量 y=
y273 J =Α·χ. 既然處理器可在二進位基礎正常工作,所以矩陣Α將 在此基礎上表示’如此它可藉由下式提供: '010 001 101 100 011 〇〇〇 100 101- 101 000 100 001 100 111 001 010 ,010 111 011 001 100 101 〇〇〇 011 此表示建議使用分配算術來表3個 陣的可能性: 可
A 進位矩陣加總的矩 A - Q^AfOj + i Ώ°*Α[2] 其中: *01101001 4〇]= 10 0 10 110 ο 1 1 1 0 1 0 1 -46- ▲ “£!访/〇1八乂907公资) 522316 A7 B7 i 0 A[1卜 0 0 1 1 _0 0 A[2] = 1 0 0 1 五、發明説明(44 ) 0 0 1 0 0 0 0 0 0 1 0 1 1 0 0 0 0 1 110 0 11’ 10 110 0 0 0 110 0 如此由本發明的此具體實施例採用的第一步驟是二進位 矩陣A[0]、A[1]、A[2]的結構,其可根據他們的重要性而 包含A的登錄位元。在考慮下的較佳具體實施例將認為是 一連串相等: 、 • !
&Α[0]^Χ+ Ώι·Λ[1]-X ± Ώ°-Α[2]-X 下一步驟是組成由Α[0]、A[1 ]、Α[2]的水平鏈形成的24x3 二進位矩陣Α* : "0 1 1 0 1 0 0 Ι Ί 0 0 0 1 0 0 0" A* =: 1 0 0 1 0 1 1 Ο 0 0 0 0 0 1 0 1 0 1 1 1 0 1 0 1 •1 1 1 0 0 0 0 1_ 0 0 1 1 0 0 1 Γ 1 0 1 0 1 1 0 0 0 1 0 0 1 1 0 0 而且,亦形成24維矩陣襴向量X*,其包含向量\的3個複 製品’其每個具由從上述加總推論的對應二進位加權。此 可在輸入向量開始達成之前完成。 -47 - ® 士圖圃定標準(CNS) Α4規格(21〇Χ297公釐)
裝 訂
522316 A7 B7 五、發明説明(45 )
_2°V 2°x8 2丨七 2 22^ 注意,乘以21只需要索引運算。此具體實施例的關鍵是 推斷: γ=Α·χ=Α* ·χ* 如此,下列藉由0-1方法的Α*·χ*計算將會發生。因此, 下一工作是要歸納及加總共同非零欄係數,以建立新係數 ,而且藉此減少矩陣大小。 因此,它可保持下式: 1 0 1 0 1 0 0 + w2 1 A + w3 1 0_ + W4 0 丄 + w5 0 1_ + w6 1 丄 其中: wl = 22*x7 + 22*x8 + 21 ·χ4 + 2 1 *χ5 + 2°*χ5 w2 = 22*x1 + 2i*x6 + 2°*x1 + 2°-x7 w3 = 22*x3 -48- 上阳面公进進WNA A4規格(210X297公釐) 522316 A7 B7 五、發明説明(46 W4==22*X24"21*x2 + 2l-X3 w5==21*X5 + 20*x2 + 20*x1 + 20-X3^'2()*X8 νν6:=22·Χι + 21*χ64-2()·χ1 + 20*χ7 此可使用1 6個加算達成。其次,結果矩陣的一列分割將 會發生。因此: yi y2.
Wl w2 w3 w5 及: y3=W! + w3 + w 現在,加總第一方程式的共同欄係數將可產生下列: 和2 +W5) + (%+%) w3 此步驟使用2個加算。其餘是使用2個更多加算達成。在 此範例中,整個20個加法運算需要轉換計算。傳統方法的 使用將需要相等的29個加法運算,其中藉由”相等,,,我們 意謂额外包含乘積運算亦可考慮。 很顯然’此不是傑出節省的一範例。它是相當容易說明 本發明的此具體實施例觀念1而,當轉(對於每個登錄 的數字維矩陣與數量)的參數較大時,實質節省可藉由本發 大體上’在考慮下,本發明的 一 J孜住具隨貝犯例係有關於 實值、典限制線性轉換的一有效 矩陣A可如下示提供: ^録轉換的⑽
522316 A7 B7 五 發明説明(47 ) Λ\η hn a\\ a\2 ^21 a22
A 其中矩陣的登錄是實數。它是要計算A · 其中乂是實數或 複數數量登錄之一 η維矩陣向量,其窯小 ” 一 π屯如下示: Χ2 假設矩陣Α的登綠是以二進位基礎寫出,而且在點的前 後有固Λ數量的數字。本發明的兩較佳具體實施例可選擇 性解決提供,而且在他們之間的選擇是因轉換矩陣的結構 而定。第一稱為0-1分解,第二稱為U分解。 假設矩陣Α的登錄是範圍π,而且在適當正整數叫和叫 的點後具有Π12數字的精確性。既然由一處理器遇到的每個 數量在點的前後具有一有限數量的數字’所以此假設並未 限制本發明的範圍。讓m=:nil + m2+1 ^分配算術將可用來將 乘積Α·χ分成由上述範例所處理類型的㈤個二進位乘積之 一加總。 首先’本發明是在矩陣的登錄是非負數,且分解是〇·丨基 -50- 从w Μ用Φ國國家標準(CNS) &規格χ挪公董) A7 B7 五、發明説明(明) 礎的情況中描述。範圍2以的一實目t及具有超過點的叫數字 能以下列方式表示: 其中,每個%是〇或丨。此是標準二進位表示法。藉由一典型 分配算術引數,A能以下列方式分解成^ rxn 0-1二進位矩 陣之一加總: /4 = ^*A[k] 在此加總中,最高有效位元(MSB)的Ο]矩陣, A[-m2]是最低有效位元(LSB)的0-1矩陣。大體上,矩陣A[k] <中母一者是0-1矩陣’其登錄是由A登錄之k的有效位元所 組成’其中母個位元是放置在它對應登錄。藉由分配規則 ,它會如下所示: \Xm2±kSm 产A[k].x· 此是本發明的目前具體實施例的基礎。其次,讓A*是由 他們加總出現順序的上述加總的二進位矩陣水平極限所組 成的rx(m*n)0-l矩陣。然後, A^[Af,J,........................,A[0]t............•希 此可在輸入向量達成開始之前每次於任何特定矩陣達成 。此外,讓πι·η維矩陣欄X*可由下列提供·· -51 - 诎用Φ囫國家標準(CNS) A4規格(210X297公釐)
裝 訂 線
Tm2 X 2,,ιχ 2° x _ 2mi x 細 在考慮下’具體實施例強調主要可看出: Α·χ=Α* ·χ* ^者是rx(m*n)〇_l矩陣與一(m+1).n維矩陣向量的一乘積 該乘積是由最初向量的偏移m個複製品所組成。 、乘積Α*·χ*的計算可使用本發明的ο]二進位具體實施例 達成。既然每個乘以2的一整數乘冪可藉著將位元移位實施 ’所以非常小的加算複雜度便會增加。 本發明的此具體實施例可明顯減少乘積的複雜度。讓· 卜 l〇g2(m.n) = l〇g2(m) + i〇g2(n) 而且’讓C(A)是本發明所需的加算次數,以 。如果l^r,那麼: C(A)< m*n + 2Γ + 2Γ/2+1 - r 特別是在此情況中,我們可看出實際範圍是: C(A)< 2πι·π 當我們假設br,它保存: -52-
作cr办:;《田办涵团定德準(ONS) A4規格(210X 297公董) 522316 A7 B7
C(A)<(l+〇)*m.r-n/l 其中1>口>〇,而且當m.n與r是無窮大時,□便會是零。 大體上,計算乘積Α·χ的傳統(布魯特斯力量)先前技藝需 要相等的ηττη/2個加算,其中包含乘積運算的加算可考慮。 在一些情況中,特別是當r=:l、或當Γ是相當小時,上述具 體實施例的另一版本是較佳,以允許進一步節省注意,在 情況r=l ’問題可減少到兩向量的數量乘積。此本身在科學 與技術方面是一相當普遍的計算,而且它的有效性能可使 用。根據此變化,矩陣Α* *可藉著使在一垂直序列中的矩 陣 A[-m2],A[-m2]5........,A[0],.........ACmJ成連鎖狀形成 。如此,它可藉由下式提供的r.(m+1)Xn o-丨矩陣: *4^2 Γ
裝 玎 4〇]
線 ^ A[m{] _ 然後,Α"·χ的計算可藉由0-丨矩陣的本發明較佳具體實 施例達成。乘積Α**·χ包含所有乘積:Α[-ιη2]·χ,.....,Α[0] •x,··.··^[m^x。因此,使用二進位乘法的移位,想要的結 果便可藉由執行加總達成: -53-a ::* m七湖涵宏摄準⑴則)A4規格(21〇x 297公愛) A7
此可推論具負數登綠 爪W矩陣邵分。 當矩陣A是具有兩符號八 成具負數登錄的兩矩ΐ、Λ的實數_,那麼矩陣A可表示 二入ΊΓ Μ太麻EI日知机 · Α==Α1·Α2。遵循此表示,在討 瀹下的本發明覜點可藉 Δ , , + 由先y刀別計算該等乘積y^A^x和 y2=A2,x、或上述方法的— 处β α本峨θ 、、且合形式而實施y=A*x的計算。 然後’取後步驟疋減法實祐·一 ^ Q ^ 她· y=yi-y2。當分解二進位矩_
時,有關一實數的本發明的 β的一較佳的具體實施例的上述〇 1二進位選擇是牿 干疋符別有效:A[-m2]5 A[-m + 1]’..........’A[〇】,..........A[mi]是相當稀疏。此可以是各稽 不同大小的-連串A登錄,&且在點後面具有非一致㈣ 装 量的一進位數字。在此情況,上述一致性數位格式所需纪 零填補會造成一較高位準的稀疏。
根據u二進位分配算術,本發明的較佳具體實施例的另 一形式將在下文描述。本發明的此形式具有可更適於具有 兩符號尽根據較快U方法登錄矩陣的優點。實際上,當矩 陣登錄的大小相同及準確性時,它可比上述0 - 1版本更有效 。下列方法的主要特徵是類似0-丨方法。 下列觀察對於本發明的的處理描述是需要的。範圍2ml 及具有超過點m2數位的一實數t能以下列方法的U二進位加 總表示·· sk^ + sm^(2ml^ 2 2 t 其中對於而言,所有sk疋土1’而且當ί疋非 負數時,sml = l,且當t是負數時,Sm/-1 ° -54- 522316 A7 B7 五、發明説明(52 以下列方法分 因此’具兩符號登錄的一rxn實數矩陣A能 解成U矩陣的加總: 其中該等矩陣A[k]之中每—者是rxnu矩降 讓 A*是 ΓΧ((ΓΠ+Ι)·η)υ矩陣: A* = [α[-τπ2 - l]s ............... 此矩陣是在輸入資料到達 組成 ’’,'「”綱,............. 之酌,由每矩陣的一時間工作 此外,(ιη+1)·η維矩陣欄向量χ*是由下列定義 2° Λ: 2m> (2^ 裝 線 它保持; Α·χ= A*· x5 是一 rx((m+lVn)U矩陣乘以一 Α(ιη+1)·η維矩陣向量的 一乘積。此乘積的計算可由本發明的U矩陣具體實施例的 應用達成。 此 -55- l/〇\tq、λλ描格(210X297公釐) 522316 A7 _____ _B7 五、發明説明(53 ) 在屬於0-1二進位分解的上述方法中,亦存在Γ=;ι或小r的 垂直版本。它是完全類似先前的描述,而且沒有理由重複 細節。 讓卜logGm+lhnHogCm+u + iogCn)。它可保持 k,執行 上述方法的所需的加算次數的範圍如下: c(A)<(m+l).n + 2卜呌 2r/2+丨-r 如如述’ C(A)是定義成完成α·χ的上述u具體實施例所需 的加算次數。一般而言,它可保持, C(A)<( l+[])-(m+1 )·Γ·η/1 其中1>口>0,而且當(m+l)·!^ r是無窮大時,□會是零。 工業應用範例 線性轉換普遍使用在技術與科學的每個領域。在通訊技 術的本發明的實數矩陣觀點應用包括多使用者偵測器 (MUD)蟬陣(例如解除關聯器或最小均方誤差(MMSE)矩陣) 與一解展佈器的輸出向量乘積。它亦可使用在最小平方的 計算。有限衝動響應(FIR)濾波器,其中非連續傅利葉轉換 (DFT)可完全或部分計算。尤其是部分DFT的FIR濾波器及 FFT不是有效的小及中等大小的滤波器是範例,其中本發 明的此特徵是可適用。非連續餘弦轉換DCT是本發明改善 計算的另一類型線性轉換。當它只是部分計算、或當它的 大小不太大,以致於較大維矩陣的快速演算法不是很有效 時,此便非常特別有效。 在例如處理採用FIR的處理電路的一些數位信號處理應 -56- ~l胡涵古掩進A4规格(210X297公釐)、 " ' ' 522316五、發明説明(54 ) A7 B7
用中’兩相對長向量的關聯性是需要。該等向量之中 是表不可在一第二向量上運算的一 FIR濾波器接頭,其表二 一輸入應茲被過濾。由部分捲積組成的過濾操作可藉由I Toplits矩陣與一向量的乘積表示。此可藉由本發明的余 矩陣觀點而有效達成。 s 複數矩陣 範例:假設它想要計算下列加總: yi=(l 价 Xi’jh 外 Η)·Χ3 + (“+υ·Χ4+(1,Χ4 y 尸(-1Μ)·χ1 + (1Ν)·Χ2 + (1,Χ3•(小 υ·χ4 + (_Η)·¥^ 其中輸入數量Xl,x2,...................,〜是複數。傳統先前技 藝方法將需要66個宜1加算。此可看出當我們考慮時, (土 1 士j)的一因素與一複數的乘積需要2個實際加算,且2個複 數的一加异為要2個實際加算時。用以執行此計算的本發明 較佳具體實施例之兩主要選項可提供。本發明的第一較佳 具體實施例可稱為相位旋轉+GEM,它係使用下式: ~(l+j)#(l+j)=j 丄(l+j).(-l+j)=-l 丄(l+j”(-H)叫 2 因此,藉著將所有上述加總乘以1 +j),此動作在此稱 為相位旋轉,我們可從組{11 ,j,-j}取得下列係數: -57- 找p痊搞用中國國家標準(CNS) A4規格(210X297公爱) 522316 A7 B7 五 、發明説明(55 ~(l-fj)*yi=j#Xi4.1.X2 + ^j>)0X3 + (.l).X4+l*X5 + (.1^X6 1 了( 1 +j).y2=(,1 hxjj -x2+j .x3+(-j)*x4+(-j).x5 +1 ·χ6 x2 + (-j).x3+j.x4 + (-l).x5+j.x6 根據本發明的一較佳具體實施例,這些加總可藉由gem 計算。由於此範例的規模小,增益在與傳統方法相比較的 情況中是最低的,但是它實質是在較大維矩陣。當維矩睁 如同在此範例較小時,在相位旋轉步驟之後,計算的其他 更傳統方法亦可應用。最後,每個加總的結果是乘以(1士 ,以獲得想要的結果。注意,乘以j或(-1)是需要不太多的 時間量與能量的”組織”運算。 較佳具體實施例的第二選項稱為複數U方法。它可藉由 下列方法解開每個係數的角括弧而將加總分解成多項: yl=x1+(jx1)-fx2-(jx2)-x3-(jx3)-x44-(jx4)+x5.(jX5).X6+(jx^ y2=-Xi+(jx1)+x2+(jx2)+x3+(jx3)-x4-(jx4).x5«(jX5)4.x^(jx6)y2 y3==Xr(jXi)-X2-(jX2)-X3-(jX3) + X4 + (jX4)-X5 + (jX5) + X6 + (jX6) 其餘可藉由應用U方法達成。既然S(12,3);=12 + 3==15,所 以此藉著s(n,r)的上述表格而需要3 0個實際加算,其中此是 複數加算的次數。 在藉由上述範例 w 一 rj-4 4 W 攸供一 般情況的詳細描述。為了描述與複數矩陣有關的本發明較 佳具體實施例,可考慮當作係數使用的組·· U广丨丨_丨.乂 和1^{14,1+-14,-1-』}。一1;1向量或1;1矩陣具有在1^的2 -58- r-f fit
522316 A7 B7 五、發明説明(56 ) 錄。同樣地,U2向量或U2矩陣具有在u2的登錄。此矩陣與 向量是無線電應用是普遍的。它應該考慮一 u2數目與一向 量數目的乘積需要2個實際加算,而一 α數目與一複數的乘 積包括一相當小的複雜度。 第一計算問題的解決如下示:假設提供一 rxn U2矩陣Α及 一 η維矩陣複數攔輸入向量X,而且它想要計算乘積y==A*x 。數量乘積情況r= 1可包括。此計算的兩主要方法可提供。 當適當時,每個將會較佳。隨著略微修改,當資料向量是 只數時’相同處理便可適用。本發明的第一相位旋轉+GEM 較佳具體實施例可引用。讓 Β=|(1+」)·Α* z=i(i+j)y 2 2 然後,B是一 rxn κ矩陣及ζ= Β·χ。然後,乘積2=:;61可 藉由GEM计异。只要ζ被計算’輸出向量y便可由下列乘積 找到:y=(l-j>z。在從初始相位旋轉步驟產生傳統方法的 增益可節省2Γ·(η-1)加算。此增益可甚至存在Γ=1的情況, 即疋,數量乘積的情況
,— ^ ^ ^ & 本發明的弟一較佳具體實施例稱為U複數方法。第一 事物是要將A表示成加總:A=Ai+jA2 ,其中Αι和八2是^^ 。然後,考慮品質·· Α·χ=:Αι·χ+Μ2·χ。此等式表示 由rx2n U矩陣A* = [Al,AJ與2η複數維矩陣欄向量的乘希計算:X*—「X 1 ·" 一…^·,、I 一 J
•K 此是以下列等式表示: 乘積Α*·χ*將可藉由^方法計算。 在本發明的具體實施例中有另一選擇,當r很小時,此是 -59- 522316 A7 B7 五、發明説明(57 合理··讓A**=為,此是2rxn U矩陣。然後,將U方法用來 1Λ」 計算乘積:Α**·χ。此可計算兩乘積乂广八丨^和y2=:A2.x。該 處理可使下列加算完成:。
裝 上述問題的變化會在一些應用上發生,包括在CDMA中 代表PN相關器的toplitz矩陣表示。在此設定中,矩陣亦具 有零登錄。因此,讓:1;,1 = {0,1,-1丄-』}和1;,尸{〇,14,1-』, 。一U、向量或U'矩陣具有在的登錄。同樣地 ’ U、向量或U’2矩陣具有在U’2的登錄。一 rxn ΙΓ2矩陣Α可提 供及一 η維矩陣複數襴輸入向量X。該目標是要計算乘積 y=A*x。在數量乘積r=l的情況是包括在内。 本發明的相位旋轉+GEM較佳具體實施例將先討論。讓 士(l+j).A和 ζ=金(l+j)y 那麼B是一 rxn IV矩陣及ζ= Β·χ。其次,乘積ζ==Β·χ可藉 由GEM的應用計算,或許,當維矩陣較低時,可藉由傳統
線 方法計算。最後,只要z計算,輸出向量y可藉由下列乘積 找到:y = ( 1 - j)*z。 根據本發明的另外一較佳具體實施例,A是先表示一加 總:A=At+jA2 其中 A>A2W(〇,1,-1)矩陣,可能是7〇{)1以 。然後,藉由等式·· A.x=A,x+jA2*x,乘積α·χ可藉由Γχ2η(〇, 1,-1)矩陣Α* = [Α” Α2]與2η複數維矩陣欄向量:= 的乘 積計算。最後,乘積Α*·χ*將可藉由丁0?1以或藉由本發明的 一般(〇,ι-υ觀點計算。當r很小時,反映#Toplitzm似物的 本發明的另外一(選擇性)較佳具體實施例是有效:讓 -60- 田由囫固家標準(CNS) A4規格(210 X 297公爱) 522316
AA, 此是2rxn(0,l,-l)矩陣。然後應用本發明的 A硯點,以計算乘積:Α**·χ。此可計算乘積和 y^A,x。最後,該處理可使用下列加總完成:尸yi+j^。 複j現可推論一方法可用於計算一般複數ΓΧη矩陣 AeC與一實數或複數n維矩陣向量X的乘積。根據本發明 的议佳具體實施例,先將Α表示成一加總:A^Ai+jA:,其 中、和八2是實數矩陣。其次,透過等式: 。既然Α·χ=Α*·χ*,所以A*x可藉由Γχ2η實數矩陣 A -[Α^Α2]與2η維矩陣欄向量χ*=丄的乘積而計算。最後, 乘積Α*·χ*可藉由實數矩陣方法計算。 根,本發明的另外一(選擇性)較佳的具體實施例,讓 * 氺; 4 Αι 此是一 2rxn實數矩陣。然後,應用實數矩陣方 法,以計算乘積·· Α**·χ。此可計算乘積yi=Ai.x和 。最後,該處理可使用下列加總完成:y==yi+j,y2。 最後,具U2係數的一toplitz矩陣與一向量的乘積可藉由 上述toplitz技術的應用達成。
Toplitz矩陣、(〇,1,-1)矩陣、與複數矩陣技術的工業 應用範例 IS-95搜尋器:IS-95 CDMA系統在小地理位置中允許許 多不同基地台,以便同時使用可供將資料傳送給行動接收 器的相同頻譜區段。來自不同基地台的資料可不同的方式 是經由可用來展佈傳輸資料的PN序列。每個是根據pn序列 的一不同相位。在行動接收器中的搜尋器機構工作可藉著 -61 - 士从路好唐適用中國國家標準(CNS) A4規格(210X297公釐)
線 522316 A7 B7 五、發明説明(59 ) 將他們的P N相位排列而識別由壤境基地台所傳送的不同 導頻信號。它同時可應用於來自相同基地台的數個多重路 徑信號(表示回覆)之間的不同。一類似處理可應用在初始 的同步程序。 對於每個假設而言,一搜尋器可使用一區域產生的pN序 列而測武接收彳㊁號部分關聯性的許多假設。然後,序列可 於每個假設偏移,而且關聯性可於固定數量的信號元件( 晶片)執行。正常上,搜尋器需要在一特定視窗搜尋所有假 設,其中每次序列可移位1。一搜尋器可藉由構成一矩陣A 而在一 DS-CDMA系統中實施,其列是由上述移位pN子序列 所組成。搜尋結果然後能以向量γ=Α·χ提供,其中χ是代表 在單晶週期上取樣輸入信號的一向量。根據本發明的一較 佳具體貫施例,有效線性轉換的上述創作演算法可實施, 如此可獲得可減少資源消耗的向量y。本發明的許多應用在 I頻帶pDMA的建議標準搜尋器中亦很有用。 多重乘積 本發明的另一較佳具體實施例係有關U矩陣與向量乘積 部分加總需要的情況。當不同速率(展開因素)的數個碼同 時測試時,此便可能在CDMA通訊應用中發生。研究此具 體實施例對於達成本發明先前觀點控制的讀者是有助益的 此將藉由下列提供方法觀念範例而概略說明。然而,' 沒 有合理大小的範例可描述具體實施例的所有觀點。讀者^ 可參考本發明第6項的概述。 範例:考慮如下5x8 U矩陣: -62 -
522316
及一 8維矩陣輸入向量: X! x2 x3 x= X4 X1 Λ. 假設’(在多重乘積術語内)列i和2的展開 列3和4的展開因素是4 ,而且列5的展開因 、疋’而且 最初兩0中,每兩連續元件可加總, 不在 ^ 一及弟四歹ι| φ 每4個連續元件可加總,而且在第五列中,整個列可’ 慣例是展開因素不會減少,即是每列的展開因素是。 或大於先前列的展開因素此術語稍後將正確定義。;、 上述說明下列加總將可計算: 乂 / + Χί , 十〜, x5 - H > ^x7 m x8 -χί -叉4, x5 χ! 十又3 + A ,- x6 χ! + Χί -¾ · f r A · V 一 +勺 + x4 -^5 + Xd > -χ8 -63- 女祕接穴詹適用中國國家標準(CNS) Α4規格(210 X 297公釐) 522316 A7 B7 五、發明説明(61 首先,分成4個4x2 U矩陣,其中水平維矩陣係反映最低 展開因素。基本上,U方法然後可應用,以證明加算如何 經由此新觀點節省。因此,藉由應用去除相等列,只有2 個加算需用來計算各列的所有第一加總: χι + x2 -X 丨 + Χ2 χι - Χ2 Χι + Χ2 - X2 同樣地,只有2個加算需用於各列的第二加總: -x3 + x4 - x4 + X4 Ί +·χ4 x3 + X4 等。因此,整個8個加算需用於此部分。4個額外加算可 完成列3和4的必要加總,而且另外4個額外加算可用來計算 列5的必要加總。因此,整個16個加算可用於本發明較佳具 體實施例的應用。傳統brute力方法的先前技藝於相同工作 需要28個加算。本發明目前觀點的環境包括可能大維矩陣 的一U矩陣,其中在每列上,相等間隔的子加總在上述範 例是需要的。輸入向量是實數或複數。矩陣能以列而細分 成數個子矩陣,其中每個子矩陣可由在上述範例中所使用 -64 - ^洛田士圈國玄標準(CNS) A4規格(210 X 297公釐) 522316 A7 ______ B7 五、發明説明(62 ) 的方法個別單獨計异。在此具體實施例中,一方法可結合 ’以便從節省加算的觀點找出近似最好細分,因此可減少 衩雜度。k的工具是根據動態程式化的一額外處理器或裝 置,該動態程式化可藉由U方法的表格、範圍及複雜的迴 知公式s(n,r)使用來分析各種不同細分。非常精確的形成對 於此具體實施例的發展是需要的。數種新定義可視同預備 資料而需要。 讓v=(vi,V2,.......,vn)是一向量,而且p是除以n(簡而言之 ·· ρ|η)的一正整數。定義向量ν[ρ]是藉著將^^細分成長度ρ區 段而形成。如此: ” hv2 …,ν2ρ).,.....................+ 2,νη)), 區段可依下式表示: v[pfkj- (v^j^p t pv2..................iVkp) 其中/ 吟. 在本文的整數p是稱為展開因素。可看出,多重向量結構 是與一矩陣的結構有關。下一項的多重向量的多重數量乘 積是在矩陣乘積與平常數量乘積之間的一相交。採用2個n 維矩陣向量 ν = (νι,ν2,···,νη)和 W^WbW!,…·,,Wn),然後 v*w 的P多重數量乘積可依下列定義: v^fpj-(v[p,1 J^vfp, J/, v[p} 2]*w[p, 2J,................V[P冲]•吻,★]) 其中内部乘積:v[p,l;hw[p,l]、v[p,2]*w[p,2],............是平 常數量乘積。注意,此乘積的結果是一 n/p維矩陣向量。 讓A是具列A|,……,Ar的一 rxn矩陣且p = (Pi,p2,.....,?」是_ -65- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7 五、發明説明(63 ) 正整數向量。對於母個而s,如果Pi除以η,便可說是 ρ除以η。此表示:Ρ丨η。現假設Pin。採用一 η維矩陣向量χ 及定義A.x的Ρ多重乘積,Α·χ[ρ]可如下示表示向量中的向 量: Α*φ] ^ (Α1Λχ[Ρ^ Λ2λΦιΙ^............A.,x[Pr]) 本發明的目前具體實施例將可改善在一結構中的乘積計 算,此將於下面描述。 一多重乘積系統。一多重乘積系統(或簡稱MP系統)是一 結構,其包括整數η、Γ參數、及一正整數向量ρΚρ^ρ:,.....,p ) ,以致於:
Pj\p2> P2 | P3* P3 \ρφ.............,厂r-/ j ΡΓ ,及· pr\ η . 整數Ρι,Ρ2.....,Pr稱為系統的展開因素。ΜΡ系統的參數將 可依下列方法表示: p = (r,n,p) 現要增加一參數rxn U矩陣A及一 矩陣實數向量χ參數 。此目標是要有效計算乘積Α·Χ[ρ]。整個Μρ系統將能以下 式表示: S = (r,n,p,A,x) 當所有整數Pl,P2,.......,Pr,n亦是2的乘冪時,那麼系統便 稱為一進位多重乘積系統’或簡稱bmp系統。 M-1方法。本發明的此特徵是將π法直接應用到Mp系 統。它是由上述範例表示。事實上,它通常可在近似最佳 -66 - 本紙張尺度適用中國國豕標準(CNS) Α4規格(210X297公 522316 A7 ______ B7 五、發明説明(64 ) 細分之後運用到一MP系統的子系統,而且此將稍後描述。 才疋供MP系統S-(r,n,p,A,x)。該方法是基於將矩陣水平 分成與最小展開因素Pl有關的子矩陣,每個子矩陣是寬度A 。ύ是藉由計鼻向量X的第一 Ρι實數與矩陣A的U係數的加 總而開始。此可藉由U二進位方法而於所有列同時完成。 然後,它會到下一仏攔執行相同處理。它能以此方式持婧 ,直到所有η變數用完為止。其次,它會到該等列之中每一 者’其中ΡρΡι,並且能以一平常方式完成加算處理。 在每個子矩陣上的U方法的第一步驟可掃描線條,該等 線條是其他線條的一可靠或一無用副本。因此,例如,如 果Pf2,那麼充其量有2個加算在每個部分需要,而不管『 。大體上’僅有2pw列可在每個部分經由進位方法考虞 。而且’本文想要的一應用是當Α是Hadamard。在此情況 ’母個部分不超過p i個非相等列。如此,另一來源可插入 ’其包含有多少非相等列可在每個子矩陣中出現的範圍。 它將包含在由z(當作表格儲存)表示的一函數,而且是既有 的矩陣類型。它的參數是?1和r,而且它可寫成。例 如,當 A是 Hadamard時,那麼 z(4,6)=4、z(8,5) = 5,當 a是一 般u矩陣時,那麼z(4,40)=8。它始終保持z(pi,r)^min{2Piό ’而且在 A 是 Hadamard的情況:zCphrpminfphr}。 Μ-1方法的複雜計算將基於在上述^二進位方法描述上 出現之s(r)的表格及迴歸公式。對於每個正整數y而言,役 定s’(y) = s(y) + y。亦是:s,⑺+ ,而且此不平式是較 嚴格。此在下一公式可提供複數大小的一直覺範圍。如此 -67- 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) 522316 A7 ___ B7 _ 五、發明説明(65 ) ,藉由Μ-1方法達成的加算次數範圍可經由下列各項表示: C(n,r,ptz) = (n/Pl)(pj 4- s(z(pbr))) + (n/p^iPl/Pl ** j) + (^(P^Pl - ') +...................... ............+ (^PrJiP/Pi =n,( 1 +(φ(ρ】Ή 卜】〉/pi 一 (i/p2 + 1/p3+..............- l/pr))= nm( 1 ^ ^(z(pifr)) /pj ^ (j/pj + i/p2 ^ I/p3+..............十"Pr〇 注意,此公式有些瑣碎但是重要例證。首先是當矩陣具 有一列,即是,當r= 1時,那麼: C(n?r,p)=n-n/p1 其次是一致性展開因素的情況,即是當PfPf.....==pr,那 麼··
C(n,r,p,z)=n.(l+ s(z(p 丨,rD/pJ 明顯蜱’當r相對於p i是相當大時,μ- 1方法便不是很有 效。於此基礎上發展的一較聰明方法是一相當大的踏腳石 。此較強方法可藉由水平將矩陣細分及將Μ-1方法個別應 用到每個子矩陣達成。若要使用較少計算找到具有較少加 算總數的一細分結構,它對於具有上述公式的下列較短版 本是很有用的。如此可定義: C*(n,r,p?z)=l4-s,(z(p1,r))/pl 少重系統的細分及多重向量的一般觀念。其次,一組織 化可經由在水平列將一矩陣細分的支配上達成。此支配將 可藉由一細分向量r表示。結果可將最初問題分成相同寬度 -68- 本紙張尺度適用中國國家標準(CNiTA4規格(21〇x 297公釐) --- 522316 A7 B7 五、發明説明(66 -η的一政子問題,其每個子卩E| #、, 一 ^ 卞問嗵可經由上述M-1方法解決。 該細分稍後可用於創作涂嘗、土刀to佚 a F 斤去以使效力最大化。可採用展 開因素的r維矩陣整數向量p:=(n 2 ττ,.. p ^1^2,••…,pr)、及一 rxn U矩陣· ^21 a21 •〜• α2,
A 而 且採用整數k、m其中。首先定義向量一片 段: P(k,m)=(Pk,··,pj。 它只是採用索引k到m的元件。定義矩陣a的一片段 akl ak2 * * • · · 〜 ak+u aW,2 · · .· · % A{k,m) a m\ a„ 而且,它表示採用索引k到m的列。 其次,考慮一整數向量:r=(r(l),.....,r(t+l)),可滿足: k=r(l)<r(2)<····.<r(t)<r(t+l) = m+l, 其是將一引數分成數個片段。首先,r是一工具,其能以 下列方式將一細分的p建立成向量p[r]的一向量p : PM^((Pr(I)t.…"抑……,Ρ 科 l·〉.............,(Pr_........Pr(t^l)^l)) -69 用中國國家標準(CNS) A4規格(210 χ 297公爱) 522316 A7 ^__ —_B7^ 五、發明説明(67 ) 子向量能以下列表示,
PfM]=(Pr<l)............>Pr(2)^l)
Pi>,2Mpr(2),.............Pr(3)-1) P[r,t]一(Pr(i)>............,ΡΓ(κ }〉_】) 矩陣A的列細分同樣是依照下列方式的向量r細分: 對於所有整數而言,; Ai^qMaij : r(q)Si<r(q+l),l^^n) 一特定細分的Μ方法。此片段在一機構的構成中是主要 步驟,以找到此具體實施例核心的一低複雜細分機構。假 設’我們具有矩陣的一列細分,並且可個別在每個子矩陣 上執行Μ-1方法。目標是要評估總加算次數,所以一較少 加异細分將可在下一階段找到。固定Μρ系統 S = (r,n,p = (Pl,p2,.....,Pr),A,x,z)及一細 分向量 卜^⑴,……,Γ(0) ’ 其中 lSk=r(l)<r(2)<·····<r(t)<r(t+1 )= m + 1 < r+1 〇 對於lSqSt而言,SqMP子系統可依下式提供:
Sq=(r(q+l)-r(q),n,p[r,q],A[r,q],x,z) 所有子系統的總加算次數是: C(^friP)z) }^q^c(nt r(q^l) - r(q) , p[rq]z) ^ "^<9<t ^(Pr(qJ> (r(q^l) - r(q))) /pr(q) · (1/Pk ............七㈣ + t) 下一目標是要顯現一有效方法,以找到可將此項減少的 -70- 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐) 522316 A7 B7 五、發明説明(68 ) 細分。此將更有效執行這些計算,而無需在每個階段上計 算重複子項加算:1/pk +.....+ 1/pm & η因素。如此,我們可 定義:
Chrtr>P,z卜 U !s《z(p”(q> (r(qH卜 r(q)))/Pr(q) + t 一近似最佳的細分。在此階段,我們應該研究細分的性 質,以減少由上述項C(n,r,r,p,z)提供的加算次數。首先, 我們將一抽象公式提供給加算次數,其中細分在最初問題 的一特定分間隔上具有最小的最壞情況範圍。 然後,考慮MP系統......,?丄八,父,2)及整數1^ 、m其中lSkSmSn。定義: h(k,m) - min{C(n , ], r, ρ(Ιί,ηι),ζ) : for r=(r(l),........^(t+l)) h^(km) - min{c^(nt m - Jr rfp(k>m)tz) :f〇rr^(r(l)t........,(卜I〉) 其中灸 <r (t) <r (卜\,1)二?71+1 } 它可保持: h仇m)=n,(h*(km)今(I/Pk+............^ !/pj) 下列回歸的公式可保持: h(km) : m“kH,p(k,m〉j) , min{h(ktq-l) ± h(q,m): for all k < q ± m}} 其中min(空集合)=無窮大。 h^(kfm) - min{cM(r2, m-k^lt p(Km) ,z) mm{h^(k,q-l) + h^(qtm):for all k< q < m}} -71- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐)
裝 訂
線 522316 A7 B7 五、發明説明(69 ) " 其中min(空集合)=無窮大。 現在,這些表示可由下列動態碼使用,其中子構造是在k 與m之間的間隔。若要減少此碼複雜度,h*可取代在路徑 上的h,以發現最好的子構造。此對於最後結果不會有影響 。若要在最佳細分中找到第一步驟,我們將計算q,以減少 每個k和m的式子hdq-D+h^k),其中,其是可減 少式子11*(1^4-1) + 11*4,1〇的相同9。如此,可定義: q(k’m) —k 當 ^1*(匕,111)==(^*(11,]:,卩(]<:,111),2)及其它: q(k,m) =最小 q,其中 現在,最佳細分碼可形成。 可找到最佳細分的一動態程·式創作性程式碼。下列程式 2可接收當作資料的MP系統卜(Γ,η,ρ,ζ)的參數,並且產生 當作輸出的細分r,其中法可最佳執行。此外,它亦可 傳回最佳Μ方法的複雜項。 若要有效執行,我們需要預先計算及儲存s,(r)的表格。 此可藉由迴歸公式計算此表格的一快速程式碼達成: sf(r) = 2r-l + sf(r(l)) + s,(r(2)) 最佳細分表(n,r,p,z) f 〇 r b 是從 〇 到 Γ _ 1 d 〇 for k是從 1到 r-b do m : =k+b h*(k,m)〈….C*(n,m-k+1,P(k,m),z) q(k,m)<----k for q是從 k+ 1 到 m do 72- 5223l6 A7 -------B7_ i、發明説明(70 ) d <----h*(k,q-1)+ h*(q,m) if d < h*(k,m)then h*(k,m)<----d and q(k,m)<.....q 傳回表h *和q。 目前留下是可從此程序所構成q(k,m)獲得最佳細分向量 。此可藉由建立包含最佳向量r元件的組R的下列程式碼達 成。 最佳細分向量(n,r,p) 設定:R:=空集合及k: = l m:=r Find Vector(k,m) ·· if q(k5m)> k then 設定 q : =q(k,m) 將q加到組R Find Vector(q3m)
Find Vector(k,q-1) 傳回組R。 既然最佳細分r可找到,所以M方法將可在此細分上執行。 實施 本發明的下列較佳具體實施例可提供上述方法詳細實施 的善創作性演异法。他們允許額外減少記憶體 '及執行上 述万法所需的能量資源。他們具有可提高上述方法及提供 建構裝置所需指令的雙重目標。有關這些實施的一者是轉 換矩陣是一般的,而且認為是從具有_特定組登錄的矩陣
522316 A7 B7
五、發明説明(71 列數量要足 組隨機選取。另一者是當與欄數量相比時 夠小,以致於上述基本原範圍 列數量<log(襴數量) 例如相等列 可滿足。因此,一些步驟適合在其他情、、尸 是否在此冗餘的一檢查。 本文描述的映射是遵守從一位置到下 ^ 位置的資料流。 每個位置疋指定對應在一特定重複上— 工矩陣的欄。在U矩 陣情況,欄的一(-1)元件是對應到位址的 一 4以砒的1,而且同樣地, 搁的1元件疋對應到位址的〇。一類似斜虛 貝1以野應可於11丨矩陣定義。 將描述的實施包括-第-步驟’其中輸人xj信號可加到 他們對應襴決定的預設目的地,其中每個xj是乘以一符號 及/或2的乘冪。在處理重複中,每當一欄根據本發明分割 時,兩分割之中每一者的指定位址是少於或等於特定攔的 位址。此允許在一些記憶體位置中儲存的每個資訊在處理 及遺失S W傳送送它的目的地。此外,如果一特定攔的該 等分割成半之中一者是零,代表此攔的位址將可用於下一 重複。這些性質可藉由減少資料移動所設定的資料流映射 的新結構達成。在每個重複上,位址數量是保持未觸及的 ’包括提供的内容可由下一重複使用的所有位址。下列實 施的機構可從本發明的上述GEM較佳具體實施例的觀點而 更了解。包括數值1的一組有限數量可考慮,而且在本文中 ’如果一 r列的矩陣是由元件屬於組s的正常化J•維矩陣欄 向f的所有可能非零結構所組成,它便是一完整矩陣, 其中每個結構只出現一次,而且正常化慣例是最底部非零 -74 丨X 297公釐) 522316 A7 B7 五、發明説明(72 ) 元件是1。 觀察下列小維矩陣範例。 矩陣: Ί ο 1 0 11 是一完整{〇,1}-2矩陣; 矩陣: 是一完整U-2矩陣; 矩陣: 「1 -1 1 -厂 1 1 一1 一1 [1111· 是一完整U-3矩陣; 矩陣: 「1 0 1 0 1 0 Ιο 1 1 0 0 1 1 L〇 ο 0 1 1 1 1 是一完整{〇,1}-3矩陣; 矩陣: Π -ί ; [1 1 1 1 _ -75- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316
是一完整{1,-1丄七_2矩陣。 該等實施是基於列數量與欄數量相較 所以所有可能結構的較大比例 =、假設’ 此,在所有處理實施中達成的第2矩陣的搁出現。在 s Μ…一 重複可減少計算-完整 S-r矩陣與一修改向量的乘積。紝 〜果,所有更進階的重複可 “一較v,綠矩陣完整s矩陣與一相對修改向量的乘積。 欄在上述範例矩陣中出現的順序方式係反映這些實施位 址設定的另一特性。此是一位址根據將該等攔轉換成一基 於ISI位址的一致規則,其中MSB是在向量的底部元件,而 且LSB是在向量的頂端元件。 基本結果是在第一重複之後,具有獨具一致性完整轉換 矩陣,及一致(且相當明顯)位址編號。此一致性矩陣是因s 和r而足,而不是初始轉換矩陣。此可導致其餘處理的一致 性’因此允許資料流結構在第一階段之後建立,其中該等 資料流转構是與特殊轉換矩陣普遍使用或無關。此以硬體 實施及基於本發明的裝置結構是非常有用,此是本章的主 要目標。這些實施的額外及連續觀點是要減少所需的讀與 窝記憶體配置及適當轉換矩陣的加算次數。結果,處理性 能所需的能量及裝置的成本可減少。可看出當程式碼處理 具數個輸入X向量的相同初始轉換矩陣時,下列程式碼之中 每一者的效率可提高。 最後,若要具有一適當預期,下列實施應該閱讀了解, 其中他們是本發明的許多可能有效實施中的一些範例。 -76- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7 五、發明説明(74 範例1 : 0 - 1二進位矩陣 下列一連串步驟係描述本發明的〇 - 1矩陣觀點實施。資料 是由一 rxn 0-1矩陣·· 0 ]<]:,〇. j<n)及一輸入實數或複數 向量x=(x。,,.···,Χη·ι)所組成。矩陣A的欄是以v。,......Ay表示 。此一連串步驟可計算乘積y = (yQ,......。在每個 特定k重複上,每個位置包含一實數或複數,其是因向量χ 而定。配置的讀與寫記憶體包含從標示1到2〜1的1位址 ,其表示在每個反複處理中的欄。下列定義是本發明較佳 具體實施例的一部分描述。 定義 1) 對於所有 k>0、j>l而言,定義·· l(k,j)=「(j-i).(r/2k)·] 2) 對於所有0·ιη<]:而言’定義Ym = 2m。在處理結束,這些 位址包含處理輸出向量.......,yr-i)T的元件,其中γ〇是 y〇位址,的位址等。 3) 對衿k>0及j>l而言,可定義下列函數Fkj,GkJ,其可控 制從每個位置到下一位置的資料移運。首先設定:1=l(k,j} 、m=l(k+l,2j)、h=l(k,j + l)-l。 其次,對於每個整數v>0而言,定義:
Fkj(v) = 2m.Lv/2m」 [方程式 100]
GkJ(v)=v mod 2m [方程式 101] 4) 對於每個向量v=(vQ,............,vr_i)e{0,l}r而言,定義: □ (ν)-Σ〇^J<r /vy. 虚擬碼: •77- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐)
裝 η
線 522316 A7 ____B7 _ 五、發明説明(75 ) 1 ·初始化:將零置於從1到1的每個記憶體 2. 第一階段:for aj是從〇到n-i do if vj矣0 than將χ』加到位址□〇」) 3. 主要部分: for k是從 〇到「i〇g(r)"| -i do for j是從1到2k do if l(kj + l)-i > l(kj)then forp 是從 l 到 2Kk,j + 1H(k,j)-i do 設定 for(來源)位址v do if Fkj(v)弇0及 Fkj(v);^v then 將(來源)位址v的值加到(目的地)位址GkJ(v)的值 及亦將(來源位址)v的值加到(目的地位址)Fk』(ν)的值 4·獲得輸出: 在此障段,對於所有〇,i<r而言,每個位址Yi包含輸出元 件yi的值。 說明 本術語的一基本步驟是從稱為來源之一記憶體位置讀取 一數值,並且將它加入在稱為目的地的另一記憶體位置中 放置的數值。 基於上述虛擬碼的一裝置需要下列基本步驟,以計算上 述Α·χ計算的主要部分: C0,、© 2…_ 2r - 2 此數值只依賴Γ。 -78- 衣紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) 522316 A7 B7 五、發明説明(76 ) 如此,Α·χ的整個計算充其量需要下列整個: C〇,i n,r © n + c。,、 基本步驟。 圖1 . 0-1二進位矩陣 圖1係描述更新由一裝置所採用一記憶體内容的操作,該 裝置可執行上述虛擬碼的主要部分,如此能以一較佳方式 實本發明的0-1二進位觀點,而且0-1二進位矩陣包含4個列 ,在每個重複的每個矩陣欄是以一二進位方式而由一記憶 體位址表示。底部(〇或1)元件(一水平表示的極右元件)是最 南有政值(MSB),而且最高(〇或1)元件(一水平表示的極左 元件)是最低有效值(LSB)。在處理結束,位址Ym=2m, 〇.m〇 包含輸出向量y=(y。,.......,y3)T的元件,其中YQ是y。的位址, 位址等。箭號係表示採用一位址内容的動作,並 且將它傳送’以加入到另一位址的内容。此可如上面虛擬 碼的表示而根據重複順序及在每個重複的位址(逐漸增加) 順序達成。 範例2 : U矩陣 下列步驟序列係描述本發明的U矩陣觀點實施。資料是 由一 rxn U矩陣A=(aij : 0.i<r,〇.j<n)及一輸入實數向量 X==(XQ,··♦.·,χη“)所組成。矩陣A的欄可藉由W。,·····,Wn i表示。 此一連串步驟可計算乘積y = (y{),····.。在每個特定 重衩上,每個位置包含一或複數,其是因向量χ而定。分配 的讀及寫記憶體包含從〇到2Μ竹-2標示的+ 個位址。下 列走我及先前範例的定義於本發明的目前較佳具體實施例 -79- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 B7
五、發明説明 疋需要的。 定義: 1) 對於每m維矩陣u向量而言,u=(u。,·.〜)係定義:
Sign(u)^ur.i h(u) = (u〇.u 卜“..................,.,wur-!)、 2) 藉由下列定義在雙極二進位組υ={1,·1}與邏輯位元> 進位組Β = {〇,1}之間的一對應: (_1)丨=1 r-o 因此,對於一r維矩陣u向量而言,u=(Uq,·.·,Uri)係定義: π(η)^Σ〇^<r 2^Uj, 3) 定義YQ=0,而且對於所有卜卬•卜丨而言:+ 。 在處理結束,這些位址包含輸出向量y = (y❶,··…,yr 1)T的元件 ,其中Υ。是y〇的位址,YiSyi的位址等。 4) 對於所有k>0, 而言,陕射& Signk』係依下列定 義。讓丨=l(k,j),m=l(k+l,2j),hHj + i)」。對於每個整 數而言,v>0係定義:
Sig^k/v) = 1 - 2{(v mod 2m)/2m'1」 2miv/2mJ v mod 2m 2m^2l - (vmod2m) -80 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 x 297公釐) 若 Signk/v)二】 若 Signkxj(v卜-1 522316 A7 B7 五、發明説明(78 ) 虛擬碼: 1·初始化:將零置於從〇到2Μ+Γ·2的每個記憶體 2. 第一階段·· for j 是從do 將SignOjhXj加到位址 3. 主要部分: for k 是從 0 到「l〇g(r)] -1 d〇 for j是從1到2k do if l(kj+l)-l > l(k,j) then 1) 將(來源)位址YUk,D的值加到(目的地)位址y丨(kti 2j)的值 2) for p是從 1 到 2_ + 1)·_)-Μ d〇 設定u=2uk,j),p及for來源位址u do if Gkj(u) = u then 將來源位址U的值加到目的地位址的值Yqk+i⑶ else if Fkj(u)=u then 將(來源)位址u的值加到(目的地)位址Yi(k j)的值 else if Gkj(u) = 0將乘以(-1)的(來源)位址…勺值加到(目的 地)位址Υκ⑶的值及亦將(位址u)的值加到位址Fk j⑻的值。 將乘以Signkj(u)的來源位址u的值加到目的地位址\ 的值亦將(位址u)的值加到位址Fkj(u)的值 4·獲得輸出: 對於所有〇 — <!:而言,每個位址Yi目前包含…的值。 說明 〇在上述實施U設定中的基本步驟是從稱為來源之〜二己 憶體位置讀一數值,將它乘以1或-1的符號值,然後將妹果 81 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) ^22316
加到稱為目的地的另一記憶體位置中放置的數值。 “)複雜式可使用下列公式形成。對於0.]^「1()(^、1 fe(r)丨,1 及對 於l.j.2k而言,讓: ukj ^Jr2k 對於k=「l〇g(r)1及對於l*j*2k而言,讓 那麼:
Sj,2k 二 r、 iii)基於上述虛擬碼的一裝置需要下列基本步 Α·χ計算。 Μ來實施 (1) 對於第一階段η而言,基本步驟是需要的。 (2) 對於所有 〇.k*「l〇g(r)1 -1 及 l.j.2k而言 2'UkJ - Uk^rl.y - W^/,2;-/ + / 基本步驟可在步驟(k,j)完成。 (3) 因此’對於所有〇.k·「丨〇g⑴1 而言,主要部分的k重 複需要下列基本步驟·· 1 2k + 2-uk · Uk + 1 (4)如此,Α·χ的上述計算的主要部分需要下列基本步騾: -82- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐) A7 _B7 __ 五、發明説明(8〇 )
Cr © 2u{&U\^ U2^r........^Urt〇2(r) V 1 ^ 2 '卜! · 此數值只依r而定。 (5)如此,Α·χ的整個計算需要下列總數: dln,r© n^rCUr 基本步驟。 圖解2 : U矩陳 圖2係描述更新由一裝置所採用記憶體内容的操作,其中 該裝置可執行上述虛擬碼的主要部分,如此便能以一較佳 方式實施本發明的U二進位觀點及由4列組成的一 U二進位 矩陣。在每個反複上的每個矩陣能以記憶體中的二進位位 址表示’其中攔的(-1)元件是對應在位址的1,而且欄的一 1 元件是對應位址的0。二進位解譯可被應用,其中底端元件 (以一水平表示的極右端元件)是最高有效位元,而且 在頂端元件(以一水平表示的極左端元件)是最低有效位元 。在處理結束’特殊位址YG==〇、、γ2 = 9、Y3=10包含 輸出向量y = (yG,…,yjT的元件,其中γ。是y。的位址,I及其 他疋y!的位址。箭號係表示採用乘以i或_丨符號的一位址内 容的動作,並且將結果傳送而加入另一位址内容。一箭號 係表7F苻唬是1,而且雙箭號係表示符號是_丨。此可根據在 每個反複中的反複順序及位址(逐漸增加)順序完成。 範例3 : U,矩睐 —— _ 下列步驟序列係描述在轉換矩陣的登錄屬於組υ!©{ 1, __ -83- 本紙張尺度適用中國(⑽)A^i^i()x297公發) - 522316 A7 --——___—__Β7 五、發明説明(81 ) 情況中的GEM方法之—實施。GEM的一些情況之中 的一者是時常在應用出現。資料是由一rxn I矩陣Α = ; 〇 i<r,〇.j<n)及一輸入複數向量χ=(Χα,··.,χ^)所組成。矩陣 的搁是以w。,··…,w^表示。此一連串步驟可計算乘積 y 一(y。,··.·.,^·ι)Τ=Α·χ。在每個特定反複上,每個位置包含一 實數或複數,其是因向量X而定。配置的讀與寫記憶體包含 從標示0到+ 的位址4〃、]。此範例係使用在先前範 例中的定義組、及下列定義: 定義 1) 藉由下列定義在組U!與組{0,12,3}之間的一對應(及逆 向對應): 0*-1
1,= 0, (-1)^1 jf=2? (_j)丨=3, 因此,對於r維矩陣的A向量而言,u==(u。,.....,ur-1)係定義·
OfuJ-Σο^ 2) 對於每個r維矩陣的1^向量而言,u=(uQ,·····,ur_〇係定義:
Sign(u)^uM g(u) = (Uo^Ur^y1,....................,ur-!.iur-li;). 3) 定義YG = 0,及對於所有卜m<r而言:Ym= + 。這 些將是輸出向量元件的位址。
本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公釐) 522316 A7 B7 五、發明説明(82 ) 々義0 4)對於所有k>0,j > 1而言’映射F k i, Gk」係依下列疋 讓 1= l(k,j)、m= l(k+l,2j)、h l(kj + l)-l。採用下列基於4 表示的一整數 V〉G · V = Z〇Sj<r-2*4j*Vj 而且定義如下:
Sign^v) = (v^j) * = (i(v mod 4m)/4m^J) ^
Fkj(y)- r-lv/rj 虛擬碼· 1.初始化:將零置於從0到4w + r-2的每個記憶體 2·第一階段:for j是從0到η-1將Sign(Wj).Xj加到位址 □(g(w〇) 3.主要部分: for k是從 0到「log(r)1 -1 do for j是從1到2k do if l(kj + l)-l > l(kj) then : 1) 將位址Y i (k +1,2 j)的值加到位址Y【(^的值 2) for p是從 1到 4l(k’j + i)- Kk,j)'i-i do 設定u = 4Kk j)*p及for來源位址u do if Gk j(u)=u then 將(來源)位址u的值加到(目的地)位址Yi(k+1⑴的值 else if FkJ(u)=u then 將(來源)位址u的值加到(目的地)位址的值 •85- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公資) 522316 A7 B7 五 、發明説明(83 else if GJuhO將乘以Signkj(u)的(來源)位址以力值加到( 目的地)位址Y丨(k山的值及亦將(位址u)值加到位址h〗(u)的 值。 將乘以S i gnk」(u)的(來源)位址u的值加到(目的地)位址 GkJ(u)及亦將(位址u)的值加到位址FkJ(u)的值。 4.獲得輸出:
對於所有0.i<r而言,每個位址Yi目前包含义的值。 說明 1)在上述實施A設定中的一基本步騾係表示從稱為來源 的一記憶體位置讀取一複數,將它乘以1或-1或』或」的一複 裝 數符號,並且將結果加到稱為目的地的另一記憶體位置中 放置的一複數。 ii)複數可由下列各項形成。對於O.k.「l〇g(r)^ q及對於 卜j,2k而言,讓: ; 叫产W功-彻々 \-τ
線 對於k=「l〇g(r)1及對於I.j.2k而言,讓: ά严(j!姻〉·1 J Wk==^!r2k Wk^' " r' 基於上述虛擬碼的一裝置需要下列基本步 計算。 +貝她Α·Χ (1)對於第一階段而言,η個基本步驟是需要的。 -86- 522316 A7 B7 五、發明説明(84 ) (2) 對於所有〇*k.「l〇g(r)"l -1及1 而言,下列整個 2.wkJ-wk + 12j - w…,2j] + 1 基本步驟可在步騾(k,j)完成。 主要部分的k重 (3) 因此,對於所有〇.k.「log(r)1 -1而言 複需要下列基本步騾: 2k 4- 2*wk-wk+1 (4) 如此,Α·χ的上述計算的主要部分需要下列基本步驟·· c·”……”、•山 一數值只因r而定。 (5) 如此’整個計算a · X需要下列整個
Cu、r © n + C' 基本步驟。 範例4 : Topiltz U矩陣 下列一連串步驟係描述使用U係數之本發明的Toplitz矩 陣觀點的實施。資料是由一 U序列t。,.....,丨“及一輸入實數、 或複數向量x=(x。,.....,xn_r_2)所組成。從U序列,rx(n + r- l)T〇plitz 矩陣 Α©(&υ©ίΗ: 0·ί<Γ,0·』·η + Γ-2)可被形成,其中 tk©0對於整個而言,k<0或k-n。這些步驟可計算乘積 y==(y〇,.··.·,ynM)=A*x。只有第一階段是不同於U矩陣範例, 因此,需要只在此階段使用。在實施的先前範例列中列出 的所有定義在此可適用。 87- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 522316 A7 _ B7 五、發明説明(85 ) 虛擬碼 1·初始化··將零置於從〇到2^+1:-2的每個記憶體 2.第一階段: 1) f〇r j是從0到Γ-2將(1/2)·1η-β + 1·χ』加到位址 ........... (rt-I>^n-2^............. 及亦將加到位址 ............,-玄n.r今j十])) 2) far j是從卜1到n-1將ίρ+1·χ』加到位址 雄“…”……....…Jj^l)) 3) f〇r j是從η到n+r-2將(1/2)·ΐρ+4加到位址 ............tn-iJn-i...................'tj,r 七〇) 亦將(1/2)·tw+a到位址 雄Γ(/Ά,7.Λ........ytu-ht 'tn.irtn.2i.......,-(/、+/)) 3 ·主要部分:演算法目前可在實施一演算法的主要部分 的U矩陣中處理,而且輸出是儲存的在相同位址。 說明 i)上述Topiitz實施的基本步驟是與u實施相同,即是,從 稱為來源的一記憶體位置讀一數值,將它乘以1或_丨符號, 然後將結果加到稱為目的地的一另—記憶體放置的一數值。 -88- 二一一阳々掩谁…聊、A4規格(210X 297公奢] --- 522316
η)基於上述虛擬碼的一裝置需要下列基本步驟來實施 Α·χ計算。. (1)對於第一階段而言: 2·(γ-1) + π-γ+1+2·(γ-1) = π + 3γ.3 基本步驟是需要的。 (2) Α·χ的Toplitz計算的主要部分可藉由具Γ列的^碼的一 主要部分實施達成。如此,它需要C'基本步驟。 (3) 如此,Α·χ的整個T〇plitz計算需要下列整個 C\ T © n + 3r-3 + Cur 基本步驟。 圖解3 ·· Toplitz矩陣 圖3係描述將輸入資料傳送給由一裝置所採用的適當記 憶體位置,以執行上述虛擬碼的初始部分,,而且Toplitz矩 陣是由4列組成。除了此初始部分之外,每個其他觀點是與 U矩陣實施與裝置相同,而且描述可在此適用。在此,一 箭號係表示符號是1,而且雙箭號係表示符號是-1。 範例5 : Topiltz 矩陣 本發明的下列較佳具體實施例是具A係數之本發明的
Toplitz矩陣觀點實施。資料是由一 K序列t。,.......及一輸 入複數向量x=(x。,......,xn…2)所組成。從A序列,一 rx(n + r- l)Toplitz 矩陣 Α©(&,·,」©ν』: 0.i<r,0.j*n + r-2)可被形成,其中 tk©0於所有情況是k<0或k=n。下面列出的一連串步驟可計 算乘積yKy。,·.···,yn.i)=A*x。只有第一階段是不同於4矩陣 -89- 、一—上胡田食楗渔/rNS) A4規格(210X297公釐)
522316 A7 _B7 五、發明説明(87~^ ^ 範例’因此只有此階段需要描述。在先前範例列出的所有 定義在此可適用。 虛擬碼: 1_初始化:將零置於從〇到4n + r-2的每個記憶體 2.第一階段: 1) f〇r j是從0到r-2將(l/2)nn.r小到位址 ......................上-产+^/十 /刀 亦將-(1/2)、.叫+ 1%加到位址 11 ^tM...............................、4n;)) 2) f〇r j是從r-1到η-1將tw+1 ·χ〗加到位址 □沉㈣",........,tj-—!)) 3) for、j是從 n到 n+r-2將(l/2).tj_r+lXj加到位址 口⑽,“/,…….·",以 “.......七一!)) 亦將(1/2)·ΐρ+1\加到位址 ^ ^j-rx-h........,【1、4(^ …,+ΰ) 亦將-(l/2)njXj加到位址 .........山.......、r 十公) 3 .主要部分··可在u,矩陣演算法的主要部分中處理,而 -90- 淮」A4規格(210X297公釐) 發明説明(88 ) 且資料能以相同方式接收。 說明 i) 上述丁。_實施的-基本步驟是與仏實施相同,即是 ’從稱為來源的-記憶體位置讀取—複數,將它乘以士 1或J或-j的複數符號,然後將結果加到稱為目的地的另一記 憶體位置中放置的一複數。 ii) 基於上述虛擬碼的一裝置需要下列基本步驟實施Α·χ 計算。 (1) 對於第一階段而言 2·〇1)+η-Γ+1+2·(Γ])=:η+3Γ·3 基本步驟需要。 (2) Α·χ的Toplitz計算的主要部分是經由具^列的κ碼的 主要部分實施達成。如此,它需要C'基本步驟。 (3) 如此,Α·χ的整個Toplitz計算需要下列: €Τ/η^Φ n-h3r -i + CU\ 整個基本步驟。 範例6 :實數矩陣、二進位〇-1表示。 本發明的下列較佳具體實施例是使用矩陣登錄的二進位 〇-1轉換之本發明的實數矩陣觀點實施。資料是由具負登錄 的一 rxn實數矩陣A=(aM : (M<r,〇vj<n)及一輸入實數或複數 向量χ=(χ。,….·,χ^)所組成。演算法可計算y=(yQ,……yn. !)=Α·χ。假設,對於所有〇·ί<Γ,〇·』<η而言,矩陣的登錄是 由下列0-1二進位表示提供: -91 - ^ 士涵國定德簞(CNS) Μ規格(210X297公^7 522316
aij □ •m2 其中··對於所有Wk·!^而言, 只有第-階段是不同於(M矩陣實施,因此,只有此階段 而言,可定義下列r維 需要描述。在(Μ矩陣實施部分中列出的所有^義可在此適 用。此外,對於所有0.j<n, 矩陣{0,1}向量: (t ijkitzjk».....…….......... ^rjk) 1·初始化:將零置於從〇到y-丨的每個記憶體 2.第一階段: 、把 for—計數j是從〇到η-1 do for k是從叫 do 將2k*Xj加到位址[](Vjk)的值 3.主要部分:它可在具Γ列的{0,1}矩陣實施演算法的主要 部为中處理’而且在計算處理結束’㊣出可儲存在相同位 址。 . 說明 i)上述實施的基本步驟是與0-1二進位實施相同,即是, 從稱為來源的一記憶體位置讀取一數值,並且將它加到稱 為目的地的另一記憶體位置中放置的一數值。 U)基於上述虛擬碼的一裝置需要下列基本步驟,以實施 Α·χ計算。 (1)對於第一階段而言 (111^+ m2 + 1 )·η -92- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 x 297公嫠) 522316
基本步騾是需要的。 (2) 虛擬碼的主要部分可藉由具r列的上述實施(M二進位 碼的王要部分達成。如此,t需要人個基本步驟。 (3) 如此,Α·χ的整個計算需要下列整個:
. n I C © (ntj + + lyn C ' r 基本步驟。 蠤一例7 :實數矩喹、二進位u表电^ 本發明的下列較佳具體實施例是具矩陣登錄的二進位u 表示法之本發明的實數矩陣觀點實施。資料是由一實數 矩陣A=(aij:0.i<r,〇.i<r,〇.j<n)及一輸入實數或複數向量 X (X。’..............,Xn.l)所組成。演算法可計算y = (y。,.......,yn J - Α·χ。假設,對於所有〇.i<r,〇,j<n而言,矩陣的登錄可 藉由下列U表示法提供,
— CJ α" . 'm2^ <k<mnjt^2k ^ 2^2^j 其中:對於而言,tijk€u 此表示法已在本發明的實數矩陣觀點中提到。只有第一 1¾段疋不同於U矩陣實施。因此,只有此階段需要描述。 在U矩陣實施部分中列出的所有定義在此可適用。此外,對 於所有0.j<n,-nv^k·!^而言,可定義下列r維矩陣U向量: ujk (hk,t2jk,.......“rjk) 1·初始化··將零置於從〇到2>r-l的每個位址 2·第一階段: -93- 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公#) 522316 A7 B7
到位址7t(h(Ujk)) for j 是從 0到 n-1 do fork 是從-m2-l 到 d〇 將 2、Sign(Ujk)*x> for k=m1 do 將(2ml-2.m2-i).Sign( j加到位址Tc(h(ujk)) 3.主要部分:它可在U矩陣實祐 只她/貝异法的王要邵分Γ列中 處理,而且在計算處理結束,輪+ 呵出可儲存的相同的位址。 說明 1)上述實施的一基本步驟是與上述U實施相同,即是,從 稱f來源的一記憶體位置讀取—數值,及將它乘以丨或“的 一付號,然後將此結果加到位於稱為目的地另一記憶體位 置的一數值。 ii)根據上述碼的一裝置將需要下列基本步驟數量,以實 施A · X的計算。 (1) 對於第一階段 (mi + m2 + 2)·η而言, 基本步驟是需要的。 (2) 主要的碼部分是由上述實施具Γ列υ碼的主要部分達 成。如此,它需要Cur個基本步驟。 (3) Α·χ的整個計算如此需要下列整個步騾: CRz'u + 之基本步驟。 圖4係根據本發明的一較佳具體實施例而使用一減少加 -94- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐)
裝 訂
522316 A7 _57 五、發明説明(92 ) 算數量執行一線性轉換的裝置方塊圖。裝置5〇〇是由下列組 成:一乘法器10,其具有2個輸入及1個輸出;一多工器 (MUX)9,用以選取輸入,以便將該等輸入傳送給輸出;一 加法器1 1 ’其具有2個輸入及1個輸出;及一雙埠隨機存取 /己ί思體(DPRAM) 1 3,其具有2個位址匯流排線,,add a,,和 ’’add一bn、及 2個輸出”data一a"和 ’’data—b”。MUX動作會受到 一位址產生器501的控制,而可存取DPRAM 13的記憶體位 址。位址產生器動作可經由一計數器3控制。 乘法器10的輸出係連接到MUX 9的一輸入,,c”。Μυχ 9 的輸出係連接到加法器11的一輸入”Α”。加法器丨丨的輸出係 連接到DPRAM 13的輸入。DPRAM 13的一輸出,fdata—a”係 連接到加法器11的輸入"B^DPRAM 13的另一輸出”data b ” 係連接到一乘法器12的輸入”E”。乘法器12的另一輸入”p, 係連接到位址產生器501的輸出”符號"。乘法器12的輸出係 連接到MUX 9的另一輸入”D”。計數器3係連接到位址產生 器501的2個輸入。產生器501的輸出”H"係連接到乘法器12 的’’符號π輸入。產生器5 0 1的輸出”Gπ係連接到MUX 9的控 制輸入”S”。產生器501的輸出”J”係連接到dPram 13的第 一位址輸入add—a 。產生!§* 50 1的另一輸出”1"係連接到 DPRAM 13的第二位址信號輸入”add—b1,。轉換矩陣可儲存 在一選擇性RAM/ROM 1 ’其可將一連串碼(矩陣的一列位 元)Do’D^,···,,Ds供給址產生益50 1與乘法器1 〇,兑中最 冋有效位元疋Dq。輸入向里可儲存在另一選擇性RAM/ROM 2,其可將輸入信號的取樣提供給乘法器丨〇。或者,如果輸 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 發明説明(93 ) 入向量的元件及轉換矩陣的對應元件同步提供給裝置500 ’儲存記憶體1和2便可移除。例如,這些元件可由一 ADC 或一序列產生器提供。裝置的所有元件5〇0可經由”時脈輸 入π輸入而受到一共同時脈的控制。 藉由使用代表相同不同碼DwD!,·…,DS的相同U矩陣(包含 )的相同輸入組[x^x:,·.···,xn],裝置的操作是在下面說明 。裝置的操作500可分成2個階段。標示,,階段丨”的第一階段 ’在其輸入資料(亦即,取樣[Xl,x2, .····,χη])接收與每個元件 及轉換矩陣的對應元件計算及儲存在DPRAM 13期間;及標 不階段2的弟一階段’在接收資料處理而阻斷進入加法器 9的進一步輸入資料期間。計數器3可計算運算的累積次數 ’而且計數(計數器的輸出)可用來兩階段之間的區別。”階 段Γ’的運算次數是輸入向量的長度η。超過此數的運算是與 ”階段2”有關。 根據本發明的一較佳具體實施例,位址產生器501包含一 比較器4,該比較器係連結到計數器3的輸出。比較器可讀 取計數器3的目前輸出,將它與輸入向量的長度η比較,並 且提供一對應信號,以表示目前運算是否在”階段1 ”或π階 段2Π實施。此信號可用來控制MUX9的輸入"S”,如此可在 輸入’’C’’與’’D”之間切換。 位址產生器501亦包含可儲存經程式化值的一非同步記 憶體5(例如,一 ROM),並且可當作一查表(LUT)使用,其 可經由用以處理内容的輸入位址"add_a”和’’add一b"而決定 DPRAM 13的位址。LUT的大小是(C-n)x(l十2r),而且它的 -96- 托。办# m击圃囫定德^rc;NS) A4規格(210X297公釐) 522316 A7 _ B7 五、發明説明(94 ) 内容包含3個欄位,一”來源”欄位、一”符號”攔位及一 ”目的 地”欄位。對於每個運算(亦即,計數器3計算的每個時脈週 期)而言,有3個對應來源符號及目的地值。來源襴位包含 與轉換矩陣的分離(分開)每個欄位有關的資訊、及與特殊 欄的兩邵分正常化有關的一指示。來源欄位可決定Dpram 1 3的輸入"add—b”值。符號攔位係表示在每個分開欄或子欄 中的較低元件。目的地欄位可根據對應位址的内容的處理 選取而決定DPRAM 13的輸入"add_a,,值。 位址產生器亦包含一組S(S = r- 1)反相器6^62, ....,63,其每 個包含分別連接到一連串位元〇1,...,〇3的一輸入。每個反相 器的輸出是從一組s個多工器連接到一對應MUX 的一輸入。一連串位元D" ....,03亦從一組s個多工器 71,72,...,75提供給一對應]^111又的另一輸入。來自多工器組 AJw.Js的每個MUX輸出可由最高有效位元D。值控制,如 此,可將未改變組01,…,Ds或相反組(亦即,D\,…,D,s)傳送 給DPRAM 13的輸入"address_a”。未改變組Du.....,Ds(或
Df"...,Ds)可輸入s個多工器的一對應組l,82,···.·,8s的一輸 入;及一額外多工器8,並且將來自LUT的"add—a”的MSB( 第r位元)提供給一額外多工器8。比較器4的輸出允許 ’’add—a”的選擇,以便從多工器組s或從LUT到達。 輸入’’add—a"(亦即,目的地)可控制DPRAM 13的輸出 ndata—a”,該輸出”data—a”可提供給加法器η的輸入"B”。從 LUT(亦即,來源)取得的輸入”add一b,,可控制DPRAM 13的第 二輸出"data 一 b”,該輸出"data J),,可提供給乘法器12的輸入 -97- u ΰ办沐_圏圓定德準(CNS) A4規格(210X297公憂) 一一 --—-----— B7 五、發明説明(95 ) E將daU-b”的每個值乘以從LUT擷取的一對應,,符號,, ,並且將乘積提供給乘法器12的輸入"〇π。13的 寫操作可同步,亦即,每單元的内容可根據時脈率(例如 、士田時脈仏號上升時)而重寫。另一方面,dpram U的 項操作疋非同步,亦即,當位址輸入改變時,每個輸出 便改變’而不管時脈。 階段1的換作: 在此階段,計數器3可在階段丨執行期間計算第一符號時 間(η時脈週期)。在階段丨期間,Μυχ 9允許來自它輸入 的資料流,以便流入加法器丨丨的輸入”A”,而阻斷輸入"D,f 。輸入符號[Xi,x2, ••…,xn]可提供給乘法器10的一輸入。碼 的最高有效位元D。可提供給乘法器10的另一輸入。在此階 段’由輸入’’add一a,,決定的目的地(輸出”data—a”)可從 DPRAM 13擷取,並且加入乘以最高有效位元〇。的輸入向量 元件[Xl‘,X2,···.·,xn]。計數器3,計算目前符號時間的計數器 3可在目前符號時間結束時將一指示提供給位址產生器比 較器4及ROM 5,而且比較器4可將MUX 9的輸入選擇從輸 入1’C·’改變成另一輸入”D”。同樣地,比較器4可驅動多工器 H••…,8s,以便從LUT選取資料,而不是從RAM 1。 階段2的操作: 在此階段,計數器3可在階段2執行期間開始計算下一符 號時間。階段2期間,MUX 9允許資料從輸入"D"流入它的 輸出及加法器11的輸入”A”,而阻斷輸入"C”。在此階段, 於每個時脈週期,在DPR AM 1 3的一選取位址可經由表示來 -98- 如准/n\TQ、崧(210X297公釐) 522316 A7 ________ B7 五、發明説明(96 ) 源的”add一b’,而存取。來源資料可從DPRAM 13的第二輸出 "data—b"提供給乘法器12的輸入"E”,而乘以從LUT擷取的 對應”符號"值。此乘積可提供給MUX 9的輸入,,D”,藉使在 加法器11的輸入,,A”上出現。同時,目的地值的内容可在加 法器11的輸入” B ’’出現。2個值可經由加法器1丨相加,而且 結果可儲存在DPRAM 13 (其對應先前目的地值)的相同位 址。在此加總處理結束’對應r轉換點(yi,s)可儲存在位址#〇 及#2r 1至(2^+ r- 2)的DPRAM 13。此處理因此可持續,直 到所有轉換點(yi,S)已計算及儲存在不同dprAM 13的不同 位址之後,時脈提供階段2結束(根據一預定計數)的一指示 為止。此時,目前符號時間亦已結束,而且比較器4可將 MUX 9的輸入選擇從輸入”改變回到另一輸入,,c”,,並 且驅動多工态8!,,····,8s’以便從R Α Μ 1選取資料,而不是 從LUT,藉此驅動裝置500,以便在階段1重新操作。 用來實施上述方法的一裝置具體實施例可參考圖5。圖5 係描述一rxn U矩陣與一 η維矩陣向量X乘積的一實施。該矩 陣的表示包含0或1,其中〇是對應1,而且1是對應4。 在此範例中,向量是實數,而且ν位元是專屬於每個元件 。在隨後的結構中,矩陣Α是儲存在元件1(RAM*R〇M), 而且向量X是儲存在元件2(RAM或ROM)。矩陣與向量可從 例如1己憶體裝置或同步來源的任何内部或外部裝置產生, 例如ADC或一些序列產生器等。 控制模組1、2 ' 3、13的一時脈能與整個系統同步。模組 3是從0到C計算的一計數器,其中c的定義如下示· -99- 522316 A7 B7 五、發明説明(97 uFi〇g(r) 7-; '( C 35 /2 十 十 十.. —Σί:^ 2_剛·
Ukj) = Γ(] - l)'(r/2k) 1 h(Kj) ^Fy(r/2k) l-l 在階段1,來自元件1 &2的輸入信號可插入符合來自元件 3位址的元件13,其中每個位址包含l〇g2n個有效位元。 此外,計數器可當作(C-n)x(l+r+r)大小的一非同步R〇M 元件5的一位址產生器使用。計數器的所有位元可進入一比 較器的元件4,以檢查目前計數是否大於η。元件5包含三個 欄位:符號、來源、目的地。在ROM的線條順序應該是在η 個週期之後,階段2的第一操作可由計數器引起。 對於語法目的而言,我們將可定義s=r-1。資料匯流排可 分別元件1位元Dl-Ds與元件元件6—1-6—s(反相器)出發。元 件71-7s可根據DO的狀態而在Dl-Ds與61-6s的輸出之間選 取。 (00 = 0=^7-1- 7一s = Dl- Ds,D0 = 1=>7 l-7s = 61-6s)· 元件8一 1-8—s可根據元件4(階段1 一2n)的比較器輸出狀態 而在元件5(add一a=目地)的7 —1-7—s與log2(n)LSB的輸出之間 選取。階段 l-2n=0=>8 —1-8 一 s = add—a,階段 1—2n=l=>8 1-8—S-7一1-7一s 。 元件8 一 1:可在元件5的”0,,與r位元(add—a MSB)之間選取。 階段 1一2n = 0 = >8一r = add—a MSB,階段 1一2n =l =>8一r=〇。來 自8一 1-8一r的輸出可當作元件13的第一位址匯流排使用,其 -100- 522316 A7 __ B7 五、發明説明(98 ) 是在(2r ^r-UxW + ioge)大小上的_雙埠ram。此位址是定 義從元件13輸出的data—a匯流排’而且亦是在輸入元件^ 之data-in匯流排的目的地。
Add—b(其是元件5(來源領域)的輸出)是元件13(此位址可 控制從元件13輸出的data一b匯流排)的第二位址匯流排。 符號疋從元件13輸出的單一位元,而且在元件i2(—乘法 器)乘以data—b。 有關元件13的一輸入data—in匯流排是從元件π到達,其 中該元件11是一加法器,其以可將data_a與元件9的輸出加 總。data一in能以一同時方式到add—a目的地,而data—a和 data_b的讀操作是非同步。 在元件13動作之前,它可藉由插入零而開始。元件9可在 元件1 〇與元件12的輸出之間選取。元件1 〇可將來自元件2 的資料匯流排與元件1的最低有效位元相乘。在C週期之後 ,結果內量可儲存在元件13的位址〇及位址2“到(2M+r_2)。 本發明的許多變化與修改對於在技藝中熟諳此技者是顯 然的。因此,本發明能以其他特殊形式具體實施,而不致 於達背其精神或必要特性。詳細的具體實施例在各方面可 考慮,而並未只局限於在此描述及本發明的範圍。因此, 本發明的範圍如附錄申請專利所述,而不是先前的描$。 所有變更是在附錄申請專利的意義與範圍内。 -101 -
办δα规格(210X297公釐)

Claims (1)

  1. 一有限欄位的至少 示一線性轉換性能 一種用以提高藉由上述實數或複數或 一 η維矩陣輸入向量之一 rXn矩陣所表 效率之方法,其包含: 將在每個省略列與每個選取列之間的一比率儲存在記 憶體; ° 省略孩矩陣的零欄及該輸入向量的對應數量元件; 使各欄或該矩陣正常化; 從正常化矩陣中的相等欄群產生一修改的向量; 產生一修改的矩陣;及 獲得該輸出向量。 2.如申請專利範圍第丨項之方法,其進一步包含藉著使每個 子矩陣乘積的輸出向量相同,而將轉換矩陣分成數個子 矩陣及獲得該輸出向量。 3·如申請專利範圍第2項之方法,其中該修改的矩陣包含該 轉換矩陣的一部分列。 4.如申請專利範圍第3項之方法,其進一步包含將輸入向量 分成數個子向量,以致於每個子向量可對應一子矩陣, 而且其中該輸出向量可藉著增加由每個子矩陣乘積產生 的該等輸出向量而獲得。 5·如申請專利範圍第1項之方法,其進一步包含將一修改的 矩陣分成數個子矩陣,其中一輸出向量可藉由相對子向 量而透過增加每個子矩陣乘積產生的該等輸出向量獲得。 6.如申請專利範圍第丨項之方法,其進一步包含藉著將欄乘 上一先導元件的導數而使該矩陣的各欄正常化。 -102- 令掩mNim Α4規格(210X297公釐) 522316 A B c D 六、申請專利範園 7·如申請專利範圍第1項之方法,其中該輸出向量是該矩陣 與該輸入向量的一乘積。 8·如申請專利範圍第1項之方法,其進一步包含識別該正常 化矩陣的相等欄群及將唯一位置加入每個識別群。 9· 一種用以執行一線性轉換之裝置,其包含: 第一及第二輸入,其可接收輸入資料及預定資料; , 轉換電路,其可在該等輸入資料及預定資料動作; 控制及位址產生電路,其是連接到一第一記憶體,以 產生對應位址,用以存取該等記憶體單元的對應位址, 及用以控制在資料經由該第一輸入接收的一資料接收模 式及經由該第一輸入的輸入資料到達阻滯的一資料處理 模式之間的選擇;及 計數器電路,用以控制該裝置的運算時序。 10·如申請專利範圍第9項之裝置,其中該轉換電路可將該輸 入資料的每個元素乘以該轉換資料的一對應元件。 11·如申請專利範圍第10項之裝置,其中該轉換電路包含一 記憶體,用以儲存該乘法的結果。 12. 如申請專利範圍第9項之裝置,其中該轉換電路包含一加 法與累積電路。 13. 如申請專利範圍第9項之裝置,其進一步包含一多工器電 路’用以在該資料接收模式與該資料處理模式之間選擇。 14·如申請專利範圍第9項之裝置,其中該控制與位址產生電 路包含: 一第二記憶體,用以儲存預先程式化處理與控制資料 ____ -103- 士祕從谪用中國國家標準(CNS) A4規格(21〇x 297公董) 522316 A8 B8 C8 D8 六、申請專利範圍 及; 一比較器電路,用以在該資料接收模式與該資料處理 模式之間切換。 15.如申請專利範圍第14項之裝置,其中該控制與位址產生 電路進一步包含: 一第一組多工器,其每個多工器具有至少一直接輸入 ’用以接收轉換資料;及另一輸入,其中該轉換資料可 經由一對應的反相器提供,該第一組多工器可被控制, 而可經由該轉換資料提供之一預定值而將轉換資料或反 轉的轉換資料轉移; 一第二組多工器,每個多工器具有至少一輸入,該輸 入是連接到從該第一組多工器選取的一對應多工器輸出 ,和另一輸入,該第二組可被該比較器電路控制,以便 藉著將,來自該第一組的每個多工器輸出傳輸給來自該第 一組的對應多工器輸出而將一第一位址提供給第一記憶 體’及藉著傳輸在該第二記憶體中儲存的資料而將至少 一部分第二位址提供給該第一記憶體;及 一多工器,其可在該資料處理模式與該第二組多工器 結合操作,該多工器具有一未連接輸入及一輸入,其中 該輸入是連接到該第二記憶體,而且該多工器可被該比 較器電路控制’藉此提供該第二位址的其餘部分。 -104- 用由固國家標準(CNS) A4規格(210 X 297公釐)
TW090124691A 2000-10-06 2001-10-05 Method and apparatus for effectively performing linear transformations TW522316B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/680,665 US6895421B1 (en) 2000-10-06 2000-10-06 Method and apparatus for effectively performing linear transformations

Publications (1)

Publication Number Publication Date
TW522316B true TW522316B (en) 2003-03-01

Family

ID=24732004

Family Applications (1)

Application Number Title Priority Date Filing Date
TW090124691A TW522316B (en) 2000-10-06 2001-10-05 Method and apparatus for effectively performing linear transformations

Country Status (7)

Country Link
US (2) US6895421B1 (zh)
JP (2) JP3744896B2 (zh)
KR (1) KR100522262B1 (zh)
CN (1) CN1478234A (zh)
SG (1) SG149682A1 (zh)
TW (1) TW522316B (zh)
WO (1) WO2002029611A2 (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6968305B1 (en) * 2000-06-02 2005-11-22 Averant, Inc. Circuit-level memory and combinational block modeling
DE10054517B4 (de) * 2000-11-03 2006-01-12 Rohde & Schwarz Gmbh & Co. Kg Verfahren zur Synchronisation eines CDMA-Signals
US7447967B2 (en) * 2001-09-13 2008-11-04 Texas Instruments Incorporated MIMO hybrid-ARQ using basis hopping
US7450631B2 (en) * 2001-10-26 2008-11-11 Intel Corporation Metric correction for multi user detection, for long codes DS-CDMA
US7743139B1 (en) 2001-10-30 2010-06-22 At&T Intellectual Property Ii, L.P. Method of provisioning a packet network for handling incoming traffic demands
US7002960B1 (en) 2001-10-30 2006-02-21 At&T Corp. Traffic matrix computation for packet networks
US7756085B2 (en) * 2001-11-20 2010-07-13 Qualcomm Incorporated Steps one and three W-CDMA and multi-mode searching
US7043514B1 (en) * 2002-03-01 2006-05-09 Microsoft Corporation System and method adapted to facilitate dimensional transform
US7321915B2 (en) * 2002-10-29 2008-01-22 Broadcom Corporation Method and apparatus for efficient matrix multiplication in a direct sequence CDMA system
US7620674B2 (en) * 2003-03-07 2009-11-17 Sensys Medical, Inc. Method and apparatus for enhanced estimation of an analyte property through multiple region transformation
US7706461B2 (en) * 2003-11-06 2010-04-27 Yokohama Tlo Company, Ltd. Communication method, transmission signal forming method, and data structure of transmission signal
TWI276312B (en) * 2004-05-28 2007-03-11 Ind Tech Res Inst Apparatus for generating 2D spreading code and method for the same
US20060277041A1 (en) * 2005-06-06 2006-12-07 Stig Stuns Sparse convolution of multiple vectors in a digital signal processor
US7685219B2 (en) * 2006-03-31 2010-03-23 Intel Corporation Parallel systolic CORDIC algorithm with reduced latency for unitary transform of complex matrices and application to MIMO detection
US7596534B2 (en) * 2006-06-15 2009-09-29 Microsoft Corporation Computer implemented methods for solving difference and non-difference linear constraints
US7796058B2 (en) * 2007-02-12 2010-09-14 Xyratex Technology Limited Method and apparatus for data transform
JP5092897B2 (ja) * 2008-05-26 2012-12-05 富士通株式会社 データ移行処理プログラム、データ移行処理装置およびデータ移行処理方法
US8453116B2 (en) 2008-11-24 2013-05-28 Microsoft Corporation Efficient invariant inference for program verification
US8516027B2 (en) * 2010-04-30 2013-08-20 Src, Inc. Method and system for bit stacked fast Fourier transform
CN102521211B (zh) * 2011-11-17 2014-09-10 华南理工大学 一种求解有限域上线性方程组的并行装置
US9384168B2 (en) * 2013-06-11 2016-07-05 Analog Devices Global Vector matrix product accelerator for microprocessor integration
KR102098247B1 (ko) 2013-11-25 2020-04-08 삼성전자 주식회사 메모리 시스템에서 데이터를 인코딩 및 디코딩하기 위한 방법 및 장치
US20160188724A1 (en) * 2014-12-24 2016-06-30 Facebook, Inc. Tag prediction for content based on user metadata
US20160188592A1 (en) * 2014-12-24 2016-06-30 Facebook, Inc. Tag prediction for images or video content items
EP3246900B1 (en) * 2015-01-15 2019-07-31 Nippon Telegraph and Telephone Corporation Matrix and key generation device, matrix and key generation system, matrix coupling device, matrix and key generation method, and program
EP3336692B1 (en) 2016-12-13 2020-04-29 Arm Ltd Replicate partition instruction
EP3336691B1 (en) * 2016-12-13 2022-04-06 ARM Limited Replicate elements instruction
JP6928208B2 (ja) * 2017-07-24 2021-09-01 アイオワ、ステイト、ユニバーシティー、リサーチ、ファウンデーション、インコーポレイテッドIowa State University Research Foundation,Inc. O(nlog(n))時間及びびO(n)メモリでチャープZ変換を逆変換するためのシステム及び方法
CN108171221A (zh) * 2018-02-02 2018-06-15 师阳 一种基于像素值计算的并行化图像采集方法及装置
US11847106B2 (en) * 2020-05-12 2023-12-19 Hubspot, Inc. Multi-service business platform system having entity resolution systems and methods

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3920978A (en) * 1974-02-25 1975-11-18 Sanders Associates Inc Spectrum analyzer
US4055756A (en) * 1975-02-03 1977-10-25 Societe Anonyme De Telecommunications Image coder-decoder using a matrix transform with weighted contribution of several points of the image to the formation of one point of the transform
US4138730A (en) * 1977-11-07 1979-02-06 Communications Satellite Corporation High speed FFT processor
JPS60250473A (ja) 1984-05-25 1985-12-11 Hitachi Ltd ベクトルプロセツサ
IT1207346B (it) * 1987-01-20 1989-05-17 Cselt Centro Studi Lab Telecom Sformata coseno discreta a coeffi circuito per il calcolo della tra cienti quantizzati di campioni di segnale numerico
US4914615A (en) 1987-09-04 1990-04-03 At&T Bell Laboratories Calculator of matrix products
JP2690932B2 (ja) 1988-03-18 1997-12-17 株式会社日立製作所 ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム
JPH0748207B2 (ja) 1989-04-14 1995-05-24 シャープ株式会社 行列演算装置
US5267185A (en) 1989-04-14 1993-11-30 Sharp Kabushiki Kaisha Apparatus for calculating matrices
US5093801A (en) * 1990-07-06 1992-03-03 Rockwell International Corporation Arrayable modular FFT processor
US5357454A (en) 1991-07-25 1994-10-18 Ericsson Ge Mobile Communications Holding, Inc. Fast walsh transform processor
JP3323950B2 (ja) * 1992-03-17 2002-09-09 サン・マイクロシステムズ・インコーポレーテッド デジタル画像処理システムでidctを実施する方法及びそのためのidctプロセッサ
US5528528A (en) * 1993-03-29 1996-06-18 Intel Corporation Method, apparatus, and system for transforming signals
US5561618A (en) 1993-12-22 1996-10-01 Qualcomm Incorporated Method and apparatus for performing a fast Hadamard transform
US5481487A (en) * 1994-01-28 1996-01-02 Industrial Technology Research Institute Transpose memory for DCT/IDCT circuit
US5574675A (en) 1994-03-22 1996-11-12 Industrial Technology Research Laboratories State-controlled half-parallel array walsh transform
KR19990022657A (ko) * 1995-06-01 1999-03-25 나시모토 류조 이산코사인변환 연산회로
US5870378A (en) 1996-08-20 1999-02-09 Lucent Technologies Inc. Method and apparatus of a multi-code code division multiple access receiver having a shared accumulator circuits
DE69837299T2 (de) * 1997-01-22 2007-06-28 Matsushita Electric Industrial Co., Ltd., Kadoma System und Verfahren zur schnellen Fourier-Transformation
JPH10308672A (ja) 1997-05-07 1998-11-17 Nippon Samusun Kk 復号演算方法及び復号演算器
US5831883A (en) * 1997-05-27 1998-11-03 United States Of America As Represented By The Secretary Of The Air Force Low energy consumption, high performance fast fourier transform
US5841395A (en) * 1997-09-12 1998-11-24 Raytheon Corporation Localized interference nulling preprocessor
KR100275933B1 (ko) * 1998-07-14 2000-12-15 구자홍 엠펙디코더의 역이산여현변환장치
US6735610B1 (en) * 1999-04-29 2004-05-11 Walter E. Pelton Apparatus, methods, and computer program products for determining the coefficients of a function with decreased latency

Also Published As

Publication number Publication date
JP2004511046A (ja) 2004-04-08
JP3744896B2 (ja) 2006-02-15
US7337204B2 (en) 2008-02-26
SG149682A1 (en) 2009-02-27
KR20030094213A (ko) 2003-12-11
CN1478234A (zh) 2004-02-25
JP2005302033A (ja) 2005-10-27
WO2002029611A2 (en) 2002-04-11
KR100522262B1 (ko) 2005-10-19
WO2002029611A3 (en) 2003-04-17
US20050177607A1 (en) 2005-08-11
US6895421B1 (en) 2005-05-17
WO2002029611A9 (en) 2003-02-13

Similar Documents

Publication Publication Date Title
TW522316B (en) Method and apparatus for effectively performing linear transformations
US6178269B1 (en) Architecture for computing a two-dimensional discrete wavelet transform
Chiu et al. Real-time parallel and fully pipelined two-dimensional DCT lattice structures with application to HDTV systems
Meher Systolic designs for DCT using a low-complexity concurrent convolutional formulation
George et al. Householder reflections versus Givens rotations in sparse orthogonal decomposition
Meher Unified systolic-like architecture for DCT and DST using distributed arithmetic
Chang et al. A new fast DCT algorithm and its systolic VLSI implementation
Wigley et al. Large dynamic range computations over small finite rings
Wahid et al. VLSI architectures of Daubechies wavelet transforms using algebraic integers
García et al. Efficient filter for the generation/correlation of Golay binary sequence pairs
Bi et al. Pipelined hardware structure for sequency-ordered complex Hadamard transform
TW200811672A (en) Optimized multi-mode DFT implementation
Safari et al. Four tap Daubechies filter banks based on RNS
Fernández et al. A new implementation of the discrete cosine transform in the residue number system
Basu et al. A new algorithm to compute forward and inverse 2-D UMRT for N—A power of 2
TW453063B (en) Transverse correlator structure for a rake receiver
RU2346324C2 (ru) Устройство цифровой обработки полифазных ортогональных фазокодоманипулированных сигналов
Boussakta et al. Relationship between the Fermat number transform and the Walsh-Hadamard transform
Kleiner The roots of commutative algebra in algebraic number theory
Mohanty et al. New scan method and pipeline architecture for VLSI implementation of separable 2-D FIR filters without transposition
Koç et al. A Parallel Algorithm for Exact Solution of Linear Equations.
TW201616340A (zh) 可重組架構的有限場乘法裝置
Hsiao et al. New hardware-efficient algorithm and architecture for the computation of 2-D DCT on a linear systolic array
Nayak et al. Efficient systolic architecture for implementation of 2-D discrete cosine transform
Hsiao et al. New unified VLSI architectures for computing DFT and other transforms

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees