JPH0368070A - 行列データ乗算装置 - Google Patents
行列データ乗算装置Info
- Publication number
- JPH0368070A JPH0368070A JP1205223A JP20522389A JPH0368070A JP H0368070 A JPH0368070 A JP H0368070A JP 1205223 A JP1205223 A JP 1205223A JP 20522389 A JP20522389 A JP 20522389A JP H0368070 A JPH0368070 A JP H0368070A
- Authority
- JP
- Japan
- Prior art keywords
- data
- matrix
- inner product
- circuit
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 59
- 230000008707 rearrangement Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000021156 lunch Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
以下の順序で本発明を説明する。
A 産業上の利用分野
B 発明の概要
C従来の技術
D 発明が解決しようとする課題
E 課題を解決するための手段(第1図)F 作用
G 実施例
G1一実施例の構成(第1図)
Gz−実施例の動作(第1図〜第3図)H発明の効果
A 産業上の利用分野
この発明は、デジタル画像処理等に好適な行列データ乗
算装置に関する。
算装置に関する。
B 発明の概要
この発明は、係数行列とデータ行列との内積を演算する
内積演算回路と、この内積演算回路の出力データを並べ
替える並べ替え回路とを備える行列データ乗算装置にお
いて、FIR型トシトランスバーサルフィルタ構成積演
算回路を複数個に分割して、それぞれにデータ行列のデ
ータを分配することにより、並べ替え回路のメモリの容
量を低減して演算速度を向上させるようにしたものであ
る。
内積演算回路と、この内積演算回路の出力データを並べ
替える並べ替え回路とを備える行列データ乗算装置にお
いて、FIR型トシトランスバーサルフィルタ構成積演
算回路を複数個に分割して、それぞれにデータ行列のデ
ータを分配することにより、並べ替え回路のメモリの容
量を低減して演算速度を向上させるようにしたものであ
る。
C従来の技術
従来、デジタル画像処理に適した各種の離散的直交変換
が知られており、そのうち、離散的コサイン変換(口1
screte Co51ne Trai+5for+w
、DCT)はフィルタリングや帯域圧縮に用いて誤差が
小さく、処理方式が比較的簡単である。
が知られており、そのうち、離散的コサイン変換(口1
screte Co51ne Trai+5for+w
、DCT)はフィルタリングや帯域圧縮に用いて誤差が
小さく、処理方式が比較的簡単である。
このDCTは第1行のすべてが1、第2行以下は
(A’ cos (2x+l) lπ/2N)(x=
(Lit””N−1:に=0+L””N−1)の要素か
らなる行列を用いて、変換、逆変換が定義され、2次元
の場合、次のように表わされる。
(Lit””N−1:に=0+L””N−1)の要素か
らなる行列を用いて、変換、逆変換が定義され、2次元
の場合、次のように表わされる。
(Y) =(M) ・ (X) ・”(M)”
(la)(X)=”CM) ・ (Y) ・ (M
)・・・・ (lb)なお、行列の規模が2N行2N列
のとき、(1a〉式には1/2”’の係数が掛るが、N
+1ビツトのデータシフトと等価であるから、この係数
の記載は省略する。
(la)(X)=”CM) ・ (Y) ・ (M
)・・・・ (lb)なお、行列の規模が2N行2N列
のとき、(1a〉式には1/2”’の係数が掛るが、N
+1ビツトのデータシフトと等価であるから、この係数
の記載は省略する。
ところで、(la) 、 (lb)式のような行列デー
タの乗算には、第4図に示すような、内積演算回路と並
べ替え回路(コーナターナ)とからなる乗算装置が従来
用いられていた。
タの乗算には、第4図に示すような、内積演算回路と並
べ替え回路(コーナターナ)とからなる乗算装置が従来
用いられていた。
第4図において、(10) 、 (20)は内積演算回
路であって、簡単のために、いずれも4行4列の規模の
行列に対応する4次構成とされ、コーナターナ(30)
を介して接続される。
路であって、簡単のために、いずれも4行4列の規模の
行列に対応する4次構成とされ、コーナターナ(30)
を介して接続される。
即ち、端子INから次の(2)式のようなデータ行列〔
X〕が入力され、一方の内積演算回路(10)において
、(3)式のような係数行列(A)との内積演算が行な
われる。
X〕が入力され、一方の内積演算回路(10)において
、(3)式のような係数行列(A)との内積演算が行な
われる。
内積演算回路(10)は、3個の単位遅延器(111)
。
。
(11り 、 (113)が逆順に縦続接続されて、そ
の出力端1両接続中点及び入力端に4個のラッチ(12
1)。
の出力端1両接続中点及び入力端に4個のラッチ(12
1)。
(12□)、(123)及び(124)がそれぞれ接続
され、各ラッチ(121)〜(124)にそれぞれ縦続
する乗算器(13+)〜(13,)に係数ROM (1
41)〜(14,)がそれぞれ接続され、各乗算器(1
3,)〜(134)の出力が加算器(15)に接続され
て、有限インパルス応答(Finite Impuls
e Re5ponse、FIR)型のトランスバーサル
フィルタ構成とされる。
され、各ラッチ(121)〜(124)にそれぞれ縦続
する乗算器(13+)〜(13,)に係数ROM (1
41)〜(14,)がそれぞれ接続され、各乗算器(1
3,)〜(134)の出力が加算器(15)に接続され
て、有限インパルス応答(Finite Impuls
e Re5ponse、FIR)型のトランスバーサル
フィルタ構成とされる。
同様に、内積演算回路(20)もFIR型トランスバー
サルフィルタ構戒構成れ、対応する各要素の符号の「1
0」の位の数字を「2」に替えて重複説明を省略する。
サルフィルタ構戒構成れ、対応する各要素の符号の「1
0」の位の数字を「2」に替えて重複説明を省略する。
ただし、ROM (24+)〜(24a)に格納される
係数1)ijがROM (141)〜(14n)の係数
aijと異なる。
係数1)ijがROM (141)〜(14n)の係数
aijと異なる。
コーナターナ(30)はl対のRA M (31)及び
(32)と、入力側及び出力側の切換スイッチ(33)
及び(34)とで構成され、両スイッチ(33)及び(
34)は、1対のRA M (31)及び(32)の一
方にデータが書き込まれる期間に、他方からデータが読
み出されるように連動して切り換えられる。RA M
(31)及び(32)の容量は、前述のような4行4列
の規模の行列に対応して、それぞれ16ワードとされる
。
(32)と、入力側及び出力側の切換スイッチ(33)
及び(34)とで構成され、両スイッチ(33)及び(
34)は、1対のRA M (31)及び(32)の一
方にデータが書き込まれる期間に、他方からデータが読
み出されるように連動して切り換えられる。RA M
(31)及び(32)の容量は、前述のような4行4列
の規模の行列に対応して、それぞれ16ワードとされる
。
次に、第5図を参照しながら、第4図の従来例の行列デ
ータ乗算について説明する。
ータ乗算について説明する。
入力端子INから、第5図Aに示すような16ワ一ド単
位の入力行列(X)のデータ■が第1列(XII+
X!l+ X31+ X41) ”’第4列(X+
4゜Xtar X241 X44)の順序で供給さ
れる。
位の入力行列(X)のデータ■が第1列(XII+
X!l+ X31+ X41) ”’第4列(X+
4゜Xtar X241 X44)の順序で供給さ
れる。
単位データの入力開始時点toから3サイクル分の時間
3Tが経過した11時点では、単位遅延器(IL)、(
lig)及び(llりの各出力端に第1列のデータXI
l+X□及びX、が存在すると共に、4番目のデータX
。が遅延器(113)の入力端に存在する。
3Tが経過した11時点では、単位遅延器(IL)、(
lig)及び(llりの各出力端に第1列のデータXI
l+X□及びX、が存在すると共に、4番目のデータX
。が遅延器(113)の入力端に存在する。
この状態で、各ラッチに共通のイネイブルパルスが供給
されて、第1列の4個のデータシフト。
されて、第1列の4個のデータシフト。
X!l+ X31及びX41が4個のラッチ(12+
)、 (12り。
)、 (12り。
(123)及び(124)にそれぞれ取り込まれ、第5
図B、D、F及びHに示すように、入力開始時点t。
図B、D、F及びHに示すように、入力開始時点t。
から4T時間経過後の12時点から4T時間にわたって
保持される。
保持される。
ROM (141) 、 (14□)、 (143)及
び(144)には係数行列(Alの各列の係数ail+
aj!+ aj3及びa 14 (i =L2,
3+4)が格納されており、同図C1E、 G及びJに
示すように、12時点以後の1サイクルごとに、対応す
る乗算器(131)、 (x3g) 、 (13s)及
び(13,)に順次供給され、それぞれ対応するランチ
(12,)、 (12□)、(123)及び(12,)
に保持された第1列のデータX i+ (1−L2+3
+4)と乗算される。
び(144)には係数行列(Alの各列の係数ail+
aj!+ aj3及びa 14 (i =L2,
3+4)が格納されており、同図C1E、 G及びJに
示すように、12時点以後の1サイクルごとに、対応す
る乗算器(131)、 (x3g) 、 (13s)及
び(13,)に順次供給され、それぞれ対応するランチ
(12,)、 (12□)、(123)及び(12,)
に保持された第1列のデータX i+ (1−L2+3
+4)と乗算される。
即ち、t4時点以降の1.2.3及び4番目の各サイク
ルで、係数行列の1.2.3及び4行の係数alj+
a!j+ a3J及びa。(j =1.2.3.4
)が人力行列の第1列のデータX I I + X
! I + X 31及びχ41と乗算される。
ルで、係数行列の1.2.3及び4行の係数alj+
a!j+ a3J及びa。(j =1.2.3.4
)が人力行列の第1列のデータX I I + X
! I + X 31及びχ41と乗算される。
加算器(15)において、各乗算器(131)〜(13
4)の出力が加算されて、同図Kに示すように、12時
点以降の4サイクルで次の(4)式に示すような積の行
列(U)の第1列のデータulL+ ufl+ u3
1及びu41が得られる。
4)の出力が加算されて、同図Kに示すように、12時
点以降の4サイクルで次の(4)式に示すような積の行
列(U)の第1列のデータulL+ ufl+ u3
1及びu41が得られる。
(u)−CA) ・ 〔X〕・・・・・・ (4)一
方、同図Aに示すように、12時点で行列(X)の第2
列のデータX 12+ X2!+ X 32及びx
4□の入力が開始されて、前述と同様に、12時点から
4T時間後の時点t3では、第2列のデータX1g+x
2□、x、2及びx4□がそれぞれラッチ(121)、
(12□)、(12:l)及び(12,)にラッチされ
ている。また、13時点以降の1サイクルごとに、RO
M (141) 、 (14□)、(14,)及び(1
4a)から、前述と同様に、行列(A”lの各列の係数
aj l+ atZ+a=a及びa 、a (i =
1+2+3.4)が順次出力される。
方、同図Aに示すように、12時点で行列(X)の第2
列のデータX 12+ X2!+ X 32及びx
4□の入力が開始されて、前述と同様に、12時点から
4T時間後の時点t3では、第2列のデータX1g+x
2□、x、2及びx4□がそれぞれラッチ(121)、
(12□)、(12:l)及び(12,)にラッチされ
ている。また、13時点以降の1サイクルごとに、RO
M (141) 、 (14□)、(14,)及び(1
4a)から、前述と同様に、行列(A”lの各列の係数
aj l+ atZ+a=a及びa 、a (i =
1+2+3.4)が順次出力される。
以下前述と同様にして、13時点以降の4サイクルで前
出(4)弐に示すような積の行列(U)の第2列のデー
タu、□、 u2□+u3□及びu4□が得られる。
出(4)弐に示すような積の行列(U)の第2列のデー
タu、□、 u2□+u3□及びu4□が得られる。
以下同様にして、次のt1時点以降の4サイクルで、積
の行列(U)の第3列のデータu13〜uasが得られ
、その次のり3時点以降の4サイクルで、積の行列(U
)の第4列のデータLJz〜u44が得られる。
の行列(U)の第3列のデータu13〜uasが得られ
、その次のり3時点以降の4サイクルで、積の行列(U
)の第4列のデータLJz〜u44が得られる。
上述のようにして得られた行列(U)の16ワードの列
順のデータはコーナターナ(30)のRAM(31)及
び(32)に交互に書き込まれる。書き込み時のアドレ
スと読み出し時のアドレスとを変えることにより、RA
M (31)及び(32)から行順で交互に読出され
た行列(U)のデータが第2の内積演算回路(20〉に
供給され、上述と全く同様にして、第2の係数行列(B
)と乗算されて、次の(5)式で表わされる積の行列(
Y)のデータが端子0tJTに導出さたれる−0 (Y)= (U) ・ CB) (A) ・ (X) ・ 〔B〕・・・・ (5)
D 発明が解決しようとする課題 前述のように、従来の行列データ乗算装置では、処理す
べき行列の規模と等しい量のデータがコーナターナに供
給されるため、コーナターナの1対のRAMの容量が大
きくなり、演算速度が制約されるという問題があった。
順のデータはコーナターナ(30)のRAM(31)及
び(32)に交互に書き込まれる。書き込み時のアドレ
スと読み出し時のアドレスとを変えることにより、RA
M (31)及び(32)から行順で交互に読出され
た行列(U)のデータが第2の内積演算回路(20〉に
供給され、上述と全く同様にして、第2の係数行列(B
)と乗算されて、次の(5)式で表わされる積の行列(
Y)のデータが端子0tJTに導出さたれる−0 (Y)= (U) ・ CB) (A) ・ (X) ・ 〔B〕・・・・ (5)
D 発明が解決しようとする課題 前述のように、従来の行列データ乗算装置では、処理す
べき行列の規模と等しい量のデータがコーナターナに供
給されるため、コーナターナの1対のRAMの容量が大
きくなり、演算速度が制約されるという問題があった。
かかる点に鑑み、この発明の目的は、演算速度を向上さ
せた行列データ乗算装置を提供するところにある。
せた行列データ乗算装置を提供するところにある。
E 課題を解決するための手段
この発明は、第1の行列のデータ成分aijが格納され
たメモリを含み、有限インパルス応答型のトランスバー
サルフィルタ構成とされて第2の行列のデータXijが
入力される内積演算回路と、この内積演算回路から出力
される第3の行列のデータ成分の並べ替えを行なう並べ
替え回路(30)とを備える行列データ乗算装置におい
て、内積演算回路を複数個に分割すると共に、第2の行
列のデータを複数系統に分割して分割された内積演算回
路(40A) 、 (40B)にそれぞれ人力するよう
にした行列データ乗算装置である。
たメモリを含み、有限インパルス応答型のトランスバー
サルフィルタ構成とされて第2の行列のデータXijが
入力される内積演算回路と、この内積演算回路から出力
される第3の行列のデータ成分の並べ替えを行なう並べ
替え回路(30)とを備える行列データ乗算装置におい
て、内積演算回路を複数個に分割すると共に、第2の行
列のデータを複数系統に分割して分割された内積演算回
路(40A) 、 (40B)にそれぞれ人力するよう
にした行列データ乗算装置である。
F 作用
この発明によれば、並べ替え回路のメモリの容量が低減
されて演算速度が向上する。
されて演算速度が向上する。
G 実施例
以下、第1図〜第3図を参照しながら、この発明による
行列データ乗算装置の一実施例について説明する。
行列データ乗算装置の一実施例について説明する。
Gl−実施例の構成
この発明の一実施例の構成を第1図に示す。この第1図
において、前出第4図に対応する部分には同一の符号を
付ける。
において、前出第4図に対応する部分には同一の符号を
付ける。
第1図において、(40A)及び(40B)はいずれも
2次の内積演算回路であって、前出第4図の4次の内積
演算回路(10)から2番目の単位遅延器(1h)を除
去したように構成され、対応する各要素の符号のrlO
,の位の数字をr4Jに替えて重複説明を省略する。
2次の内積演算回路であって、前出第4図の4次の内積
演算回路(10)から2番目の単位遅延器(1h)を除
去したように構成され、対応する各要素の符号のrlO
,の位の数字をr4Jに替えて重複説明を省略する。
後述のように、両内積演算回路(40A) 、 (40
B)の各ラッチ(42+)〜(424)のデータX14
の保持期間と、各ROM −(441) 〜(444)
の係数aijの読み出しのタイミングとが第4図の内積
演算回路(lO)と異なる。
B)の各ラッチ(42+)〜(424)のデータX14
の保持期間と、各ROM −(441) 〜(444)
の係数aijの読み出しのタイミングとが第4図の内積
演算回路(lO)と異なる。
両演算回路(40^) 、 (40B)とデータ入力端
子INとの間に分配回路(50)が介挿される。この分
配回路(50)は4個のRA M (51)〜(54)
を備え、一連の入力データが所定のタイミングで各RA
M (51)〜(54)に振り分けられて書き込まれ
ると共に、各RAM(51)〜(54)から所定のタイ
ミングで読み出されて、演算回路(40A) 、 (4
0B)にそれぞれ供給される。説明の便宜上、分配回路
(50)には切換スイッチ(55)〜(59)が設けら
れ、それぞれ図示の周期で切り換えられる。
子INとの間に分配回路(50)が介挿される。この分
配回路(50)は4個のRA M (51)〜(54)
を備え、一連の入力データが所定のタイミングで各RA
M (51)〜(54)に振り分けられて書き込まれ
ると共に、各RAM(51)〜(54)から所定のタイ
ミングで読み出されて、演算回路(40A) 、 (4
0B)にそれぞれ供給される。説明の便宜上、分配回路
(50)には切換スイッチ(55)〜(59)が設けら
れ、それぞれ図示の周期で切り換えられる。
両演算回路(40A) 、 <408)の出力は、共通
の加算器(45)からコーナターナ(301()に供給
される。このコーナターナ(30H)のRA M (3
111) 、 (328)の容量は、行列の規模が4行
4列の場合、それぞれ従来例の半分の8ワードとされる
。
の加算器(45)からコーナターナ(301()に供給
される。このコーナターナ(30H)のRA M (3
111) 、 (328)の容量は、行列の規模が4行
4列の場合、それぞれ従来例の半分の8ワードとされる
。
G2一実施例の動作
次に、第2図及び第3図をも参照しながら、第1図の実
施例の動作について説明する。
施例の動作について説明する。
第2図Aに示すような(第5図Aと同様の)−連の入力
データ■が端子INからスイッチ(55)に供給されて
、16ワードごと比スイッチ(56)及び(57)に振
り分けられる。この16ワードの入力データ■が一方の
スイッチ(56)によって、同図B及びCに示すように
、2ワードごとに分割されて、RA M (51)及び
(52)にそれぞれ書き込まれる。同様に、次の16ワ
ードの入力データが他方のスイッチ(57)によって2
ワードごとに分割されて、RAM(53)及び(54〉
に書き込まれる。
データ■が端子INからスイッチ(55)に供給されて
、16ワードごと比スイッチ(56)及び(57)に振
り分けられる。この16ワードの入力データ■が一方の
スイッチ(56)によって、同図B及びCに示すように
、2ワードごとに分割されて、RA M (51)及び
(52)にそれぞれ書き込まれる。同様に、次の16ワ
ードの入力データが他方のスイッチ(57)によって2
ワードごとに分割されて、RAM(53)及び(54〉
に書き込まれる。
同図り及び已に示すように、RA M (51)〜(5
4)に書き込まれた分割データX31は時間的に連続し
て読み出される。
4)に書き込まれた分割データX31は時間的に連続し
て読み出される。
この実施例においては、第3図DD及びEEに示すよう
に、RA M (51)及び(52)のデータは2回繰
返して読み出され、それぞれスイッチ(58〉及び(5
9)を介して、2次内積演算回路(40A)及び(40
B)に供給される。同様に、RA M (53)及び(
54)から次の各8ワードの分割データも2回繰返して
読み出される。
に、RA M (51)及び(52)のデータは2回繰
返して読み出され、それぞれスイッチ(58〉及び(5
9)を介して、2次内積演算回路(40A)及び(40
B)に供給される。同様に、RA M (53)及び(
54)から次の各8ワードの分割データも2回繰返して
読み出される。
分配回路(50〉の分割データX31の読み出し開始時
点toから1サイクル分の時間ITが経過したt0時点
では、一方の演算回路(40A)の遅延器(41,)の
出力端及び入力端に第1列の前側のデータX、及びX、
が存在すると共に、他方の演算回路(40B)の遅延器
(41りの出力端及び入力端に第1列の後側のデータX
31及びX41が存在する。
点toから1サイクル分の時間ITが経過したt0時点
では、一方の演算回路(40A)の遅延器(41,)の
出力端及び入力端に第1列の前側のデータX、及びX、
が存在すると共に、他方の演算回路(40B)の遅延器
(41りの出力端及び入力端に第1列の後側のデータX
31及びX41が存在する。
この時点tllで、両演算回路(40A) 、 (40
B)に共通のイネイブルパルスが供給されて、これらの
データX31”’X41はラッチ(42,) 〜(42
4)にそれぞれ取り込まれ、第3図F、H,K及びMに
示すように、t0時点の17時間後のt+z時点からり
。
B)に共通のイネイブルパルスが供給されて、これらの
データX31”’X41はラッチ(42,) 〜(42
4)にそれぞれ取り込まれ、第3図F、H,K及びMに
示すように、t0時点の17時間後のt+z時点からり
。
時点までの2T時間にわたって保持される。
同図G、J、L及びNに示すように、t+z時点以後、
最初の1サイクルには、両演算回路(40A) 。
最初の1サイクルには、両演算回路(40A) 。
(40B)のROM (44+) 、(44り 、(4
43)及び(44,)から第1行の係数all+ a
lh a+3及びa14がそれぞれ読み出される。乗
算器(43,)、 (43□) 、 (43,)及び(
434)において、この第1行の係数a、〜a14と、
ラッチ(421)〜(424)に保持された第1列のデ
ータX、〜X41とがそれぞれ乗算され、加算器(45
)で加算されて、同図Pに示すように、積の行列(tJ
)の第1行第1列の(内積)データU、が得られる。
43)及び(44,)から第1行の係数all+ a
lh a+3及びa14がそれぞれ読み出される。乗
算器(43,)、 (43□) 、 (43,)及び(
434)において、この第1行の係数a、〜a14と、
ラッチ(421)〜(424)に保持された第1列のデ
ータX、〜X41とがそれぞれ乗算され、加算器(45
)で加算されて、同図Pに示すように、積の行列(tJ
)の第1行第1列の(内積)データU、が得られる。
次の1サイクルでは、両演算回路(40A) 、 (4
0B)のROM (441) 、 C442) 、 (
443)及び(44,)から第2行の係数a 21+
a 0.a @5及びa!4がそれぞれ読み出される
。乗算器(43,) 、 (43り 、 (433)及
び(434)において、この第2行の係数a□〜azn
と、う・ンチ(42,)〜(424)に保持された第1
列のデータX、〜X41とがそれぞれ乗算され、加算器
(45)で加算されて、同図Pに示すように、積の行列
(LJ)の第2行第1列の(内積)データuziが得ら
れる。
0B)のROM (441) 、 C442) 、 (
443)及び(44,)から第2行の係数a 21+
a 0.a @5及びa!4がそれぞれ読み出される
。乗算器(43,) 、 (43り 、 (433)及
び(434)において、この第2行の係数a□〜azn
と、う・ンチ(42,)〜(424)に保持された第1
列のデータX、〜X41とがそれぞれ乗算され、加算器
(45)で加算されて、同図Pに示すように、積の行列
(LJ)の第2行第1列の(内積)データuziが得ら
れる。
t13時点からt14時点までの2サイクルでは、第2
列の人力データχ目+ X!t、X3K及びX4tと
、t’s時点以前の2サイクルと同様の第1行及び第2
行の係数a、〜a、及びa、〜axnとがそれぞれ乗算
されて、行列(U)の第1行第2列、第2行第2列の内
積データu1□、u!2が得られる。以下、同様にして
、t14時点からt16時点までの4サイクルで、第3
列及び第4列の入力データχ、。
列の人力データχ目+ X!t、X3K及びX4tと
、t’s時点以前の2サイクルと同様の第1行及び第2
行の係数a、〜a、及びa、〜axnとがそれぞれ乗算
されて、行列(U)の第1行第2列、第2行第2列の内
積データu1□、u!2が得られる。以下、同様にして
、t14時点からt16時点までの4サイクルで、第3
列及び第4列の入力データχ、。
〜X43及びX、〜X44と第1行及び第2行の係数a
、〜a、及びaz+〜a24とがそれぞれ乗算されて、
第1行第3列及び第4列の内積データu+1及びuzと
、第2行第3列及び第4列の内積データu2ff及びu
24が得られる。
、〜a、及びaz+〜a24とがそれぞれ乗算されて、
第1行第3列及び第4列の内積データu+1及びuzと
、第2行第3列及び第4列の内積データu2ff及びu
24が得られる。
このようにして、j12時点からtl&時点までの8サ
イクルで、4行4列の入力データX、〜X44と、2行
4列の係数all〜ai14との内積演算が行なわれて
、行列[]の第1行及び第2行の内積データU、〜u2
4が得られる。
イクルで、4行4列の入力データX、〜X44と、2行
4列の係数all〜ai14との内積演算が行なわれて
、行列[]の第1行及び第2行の内積データU、〜u2
4が得られる。
t1時点以後の8サイクルでは、第3図F、H。
K、 Mに示ずように、両演算回路(40^)、(40
B)のラッチ(421)〜(4L)には、上述と同様に
、4行4列の入力データXll−X44がそれぞれ2サ
イクルずつ保持される。一方、ROM (44,)〜(
44,)からは、同図G、J、L、Nに示すように、第
3行及び第4行の係数331”a44がそれぞれ1サイ
クルずつ読み出される。
B)のラッチ(421)〜(4L)には、上述と同様に
、4行4列の入力データXll−X44がそれぞれ2サ
イクルずつ保持される。一方、ROM (44,)〜(
44,)からは、同図G、J、L、Nに示すように、第
3行及び第4行の係数331”a44がそれぞれ1サイ
クルずつ読み出される。
これにより、同図Pに示すように、tub時点以後の8
サイクルで行列[U)の第31テ及び第4行の内積デー
タu1〜u44が得られ、乞い時点以前の8サイクルと
合わせて、行列(tJ)の4行4列の全内積データU、
〜u44が揃うことになる。
サイクルで行列[U)の第31テ及び第4行の内積デー
タu1〜u44が得られ、乞い時点以前の8サイクルと
合わせて、行列(tJ)の4行4列の全内積データU、
〜u44が揃うことになる。
最初の8ワードの内積データU、〜uz、が並べ替え回
路(30H)の一方のRA M (31H)に書き込ま
れ、次の8ワードの内積データus l−u 44は並
べ替え回路(30H)の他方のRA M (32H)に
書き込まれる。
路(30H)の一方のRA M (31H)に書き込ま
れ、次の8ワードの内積データus l−u 44は並
べ替え回路(30H)の他方のRA M (32H)に
書き込まれる。
第3図Pから明らかなように、両RAM(31H)。
(32H)に書き込まれた内積データは、各列ごとに2
ワードのデータが連続している。前述のように書き込み
時と読み出し時のアドレスを変えて、両RA M (3
1)1) 、 (32+1)から行順の8ワードのデー
タが交互に読み出されて、4次の内積演算回路(20〉
に供給され、前出(5)式のような所要の行列(Y)の
データが端子OUTに導出される。
ワードのデータが連続している。前述のように書き込み
時と読み出し時のアドレスを変えて、両RA M (3
1)1) 、 (32+1)から行順の8ワードのデー
タが交互に読み出されて、4次の内積演算回路(20〉
に供給され、前出(5)式のような所要の行列(Y)の
データが端子OUTに導出される。
第1図の実施例では、2個の2次内積演算回路(40A
) 、 (40B)に4行4列のデータ行列のデータX
、〜Xaaを分配するようにしたので、コーナターす(
30H)のメモリ容量が半減すると共に、演算速度が向
上する。
) 、 (40B)に4行4列のデータ行列のデータX
、〜Xaaを分配するようにしたので、コーナターす(
30H)のメモリ容量が半減すると共に、演算速度が向
上する。
以上、簡単のために、4行4列の行列の場合について説
明したが、勿論、大規模の行列に対してもこの発明を適
用することができる。また、この場合は、内積演算回路
の分割数も行列の規模に対応して大きくすることができ
る。
明したが、勿論、大規模の行列に対してもこの発明を適
用することができる。また、この場合は、内積演算回路
の分割数も行列の規模に対応して大きくすることができ
る。
H発明の効果
以上詳述のように、この発明によれば、FIR型トシト
ランスバーサルフィルタ構成積演算回路を複数個に分割
して、それぞれにデータ行列のデータを分配するように
したので、並べ替え回路のメモリの容量を低減して演算
速度を向上させた行列データ演算装置が得られる。
ランスバーサルフィルタ構成積演算回路を複数個に分割
して、それぞれにデータ行列のデータを分配するように
したので、並べ替え回路のメモリの容量を低減して演算
速度を向上させた行列データ演算装置が得られる。
第1図はこの発明による行列データ乗算装置の一実施例
の構成を示すブロック図、第2図及び第3図はこの発明
の一実施例の動作を説明するためのタイムチャート、第
4図は従来の行列データ乗算装置の構成例を示すブロッ
ク図、第5図は従来例の動作を説明するためのタイムチ
ャートである。 (20) 、 (40A) 、 (40B)は内積演算
回路、(30H)は並べ替え回路、(44,)〜(44
4)はROMである。 代 理 人 松 隈 秀 盛 手続補正書 1.事件の表示 平底 1年 特 許 願 第205223号 2・a 明(’) 名;irj″’ i?3’l
□アーヶイ算装い3、7ili正をする者 事件との関係 特許出願人 住 所 東京部品用区北品用6丁目7番354j名称(
218)ソニー株式会社 代表取締役 大 賀 典 雄 4、代 理 人 6、 ?di正により坩加する請求項の数7、補正の対
象 り」綱害0発1!II (7) a’i’i細′″鋭1
9J17) f[及3図面”4”::、(])明細書中
、第3頁6〜7行に「フィルタ・・・・小さく、」とあ
るを「帝域圧縮に適しており、」に訂正する。 (2)同、同頁9〜12行に「この・・・・N−1)J
とあるを下記のとおりに訂正する。 「このDCTはN次の場合、第1行のすべてが1/杆、
第2行以下は cos ((2x+1)kz/2N) (X=0.1.・・・・N −1; k =1.・・・
・N−1)J(3)同、第9頁11行に「導出さたれる
。」とあるを「導出される。」に訂正する。 (4)同、第13頁11〜13行に「同図・・・・読み
出される。」とあるをr RA M (51)〜(54
)に書き込まれた分割データは時間的に連続して読み出
される。」に訂正する。 (5)同、第14頁1行に’O,(EIJとあるを削除
する。 (6)同、第17頁17行の「・・・・導出される。」
の後に改行して下記を加入する。 「第1図の実施例では、データがX+t、 Xz(。 χ:ll+ X4++ X12+ X22+
””+ X44という列順に入力されるが、任意の順
番でデータXijを入力する事も可能である。 この場合は、システム制御回路(図示せず)等により、
入力されるデータに応じて、スイッチ(56)を切り換
えて、例えばX11が入力された時はRA M (51
)に書き込まれるようにする。他のXjlについても、
スイッチ(56)によって、次の第1表のように、RA
M (51)又はRA M (52)のどちらかに書
き込まれる。 なお、この場合、スイッチ(56) 、 (57)の切
換周期は2Tとは限らない。 第 1 表 (7)同、第18頁14行に「演算装置」とあるを「乗
算装置」に訂正する。 (8)図面中、第2図及び第4図を別紙のとおり訂正す
る。 以 上」 第2図
の構成を示すブロック図、第2図及び第3図はこの発明
の一実施例の動作を説明するためのタイムチャート、第
4図は従来の行列データ乗算装置の構成例を示すブロッ
ク図、第5図は従来例の動作を説明するためのタイムチ
ャートである。 (20) 、 (40A) 、 (40B)は内積演算
回路、(30H)は並べ替え回路、(44,)〜(44
4)はROMである。 代 理 人 松 隈 秀 盛 手続補正書 1.事件の表示 平底 1年 特 許 願 第205223号 2・a 明(’) 名;irj″’ i?3’l
□アーヶイ算装い3、7ili正をする者 事件との関係 特許出願人 住 所 東京部品用区北品用6丁目7番354j名称(
218)ソニー株式会社 代表取締役 大 賀 典 雄 4、代 理 人 6、 ?di正により坩加する請求項の数7、補正の対
象 り」綱害0発1!II (7) a’i’i細′″鋭1
9J17) f[及3図面”4”::、(])明細書中
、第3頁6〜7行に「フィルタ・・・・小さく、」とあ
るを「帝域圧縮に適しており、」に訂正する。 (2)同、同頁9〜12行に「この・・・・N−1)J
とあるを下記のとおりに訂正する。 「このDCTはN次の場合、第1行のすべてが1/杆、
第2行以下は cos ((2x+1)kz/2N) (X=0.1.・・・・N −1; k =1.・・・
・N−1)J(3)同、第9頁11行に「導出さたれる
。」とあるを「導出される。」に訂正する。 (4)同、第13頁11〜13行に「同図・・・・読み
出される。」とあるをr RA M (51)〜(54
)に書き込まれた分割データは時間的に連続して読み出
される。」に訂正する。 (5)同、第14頁1行に’O,(EIJとあるを削除
する。 (6)同、第17頁17行の「・・・・導出される。」
の後に改行して下記を加入する。 「第1図の実施例では、データがX+t、 Xz(。 χ:ll+ X4++ X12+ X22+
””+ X44という列順に入力されるが、任意の順
番でデータXijを入力する事も可能である。 この場合は、システム制御回路(図示せず)等により、
入力されるデータに応じて、スイッチ(56)を切り換
えて、例えばX11が入力された時はRA M (51
)に書き込まれるようにする。他のXjlについても、
スイッチ(56)によって、次の第1表のように、RA
M (51)又はRA M (52)のどちらかに書
き込まれる。 なお、この場合、スイッチ(56) 、 (57)の切
換周期は2Tとは限らない。 第 1 表 (7)同、第18頁14行に「演算装置」とあるを「乗
算装置」に訂正する。 (8)図面中、第2図及び第4図を別紙のとおり訂正す
る。 以 上」 第2図
Claims (1)
- 【特許請求の範囲】 第1の行列のデータ成分が格納されたメモリを含み、有
限インパルス応答型のトランスバーサルフィルタ構成と
されて第2の行列のデータが入力される内積演算回路と
、この内積演算回路から出力される第3の行列のデータ
成分の並べ替えを行なう並べ替え回路とを備える行列デ
ータ乗算装置において、 上記内積演算回路を複数個に分割すると共に、上記第2
の行列のデータを複数系統に分割して上記分割された内
積演算回路にそれぞれ入力するようにしたことを特徴と
する行列データ乗算装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1205223A JPH0368070A (ja) | 1989-08-08 | 1989-08-08 | 行列データ乗算装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1205223A JPH0368070A (ja) | 1989-08-08 | 1989-08-08 | 行列データ乗算装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0368070A true JPH0368070A (ja) | 1991-03-25 |
Family
ID=16503451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1205223A Pending JPH0368070A (ja) | 1989-08-08 | 1989-08-08 | 行列データ乗算装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0368070A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008522697A (ja) * | 2004-12-09 | 2008-07-03 | ザ サイエンス アンド テクノロジー ファシリティーズ カウンシル | 表面下組織および流体のラマン分光解析 |
-
1989
- 1989-08-08 JP JP1205223A patent/JPH0368070A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008522697A (ja) * | 2004-12-09 | 2008-07-03 | ザ サイエンス アンド テクノロジー ファシリティーズ カウンシル | 表面下組織および流体のラマン分光解析 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0286183B1 (en) | Television transmission system using transform coding | |
US4791598A (en) | Two-dimensional discrete cosine transform processor | |
US4601006A (en) | Architecture for two dimensional fast fourier transform | |
JP2646778B2 (ja) | ディジタル信号処理装置 | |
US5815421A (en) | Method for transposing a two-dimensional array | |
US4719588A (en) | Matrix multiplication circuit for graphic display | |
US5757432A (en) | Manipulating video and audio signals using a processor which supports SIMD instructions | |
US10810281B2 (en) | Outer product multipler system and method | |
EP0286184B1 (en) | One-dimensional linear picture transformer | |
US5226002A (en) | Matrix multiplier circuit | |
JPH0368070A (ja) | 行列データ乗算装置 | |
JPH09259115A (ja) | ビット−シリアルマトリックス転置のための超大規模集積回路 | |
JP3185211B2 (ja) | 行列データ乗算装置 | |
US5673214A (en) | Discrete cosine transform processor | |
JPH0375868A (ja) | 行列データ乗算装置 | |
JPH07200539A (ja) | 二次元dct演算装置 | |
AU676928B2 (en) | Real time active addressing display device and method utilizing fast walsh transform circuit | |
JP3553376B2 (ja) | 並列画像処理プロセッサ | |
JP2822684B2 (ja) | 離散コサイン変換装置および逆離散コサイン変換装置 | |
JP3575991B2 (ja) | 直交変換回路 | |
JPS60119116A (ja) | 2次元積和演算装置 | |
Sudhakar et al. | Hardware Implementation of Dual-Tree Wavelet Transform Based Image Reconstruction | |
JP2001067338A (ja) | 高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器 | |
JPS63167968A (ja) | ディジタルデータからなるマトリックスの行と列の加算を行うための信号処理用集積回路 | |
JPS62105287A (ja) | 信号処理装置 |