JPH0375868A - 行列データ乗算装置 - Google Patents
行列データ乗算装置Info
- Publication number
- JPH0375868A JPH0375868A JP21163089A JP21163089A JPH0375868A JP H0375868 A JPH0375868 A JP H0375868A JP 21163089 A JP21163089 A JP 21163089A JP 21163089 A JP21163089 A JP 21163089A JP H0375868 A JPH0375868 A JP H0375868A
- Authority
- JP
- Japan
- Prior art keywords
- data
- matrix
- circuit
- input
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Complex Calculations (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
以下の順序で本発明を説明する。
A 産業上の利用分野
B 発明の概要
従来の技術
発明が解決しようとする課題
課題を解決するための手段(第1図)
作用
実施例
G1 一実施例の構成(第1図)
G2 一実施例の動作(第1図〜第3図)G3 他の実
施例 発明の効果 A 産業上の利用分野 この発明は、デジタル画像処理等に好適な行列データ乗
算装置に関する。
施例 発明の効果 A 産業上の利用分野 この発明は、デジタル画像処理等に好適な行列データ乗
算装置に関する。
B 発明のキ既要
この発明は、第1の行列と第2の行列との内積を演算す
る内債演算回路と、行列のデータを並べ替える並べ替え
回路とを備える行列データ乗算装置において、並列出力
型の並べ替え回路を介して並列入力型の内債演算回路に
第2の行列のデータを入力することにより、内積演算回
路の構成を簡単化すると共に、並べ替え回路の単位メモ
リの容量を低減して演算速度を向上させるようにしたも
のである。
る内債演算回路と、行列のデータを並べ替える並べ替え
回路とを備える行列データ乗算装置において、並列出力
型の並べ替え回路を介して並列入力型の内債演算回路に
第2の行列のデータを入力することにより、内積演算回
路の構成を簡単化すると共に、並べ替え回路の単位メモ
リの容量を低減して演算速度を向上させるようにしたも
のである。
C従来の技術
従来、デジタル画像処理に適した各種の離散的直交変換
が知られており、そのうち、離散的コサイン変換(Di
screte Co51ne Tramsform、0
CT)はフィルタリングや帯域圧縮に用いて誤差が小さ
く、処理方式が比較的簡単である。
が知られており、そのうち、離散的コサイン変換(Di
screte Co51ne Tramsform、0
CT)はフィルタリングや帯域圧縮に用いて誤差が小さ
く、処理方式が比較的簡単である。
この、D CTは第1行のすべてがl、第2行以下は
(& cos (2x+ 1 ) k π/2N
)(x =O,L −・ ・・ N −1; k
=O,L = −N −1)の要素からなる行列
を用いて、変換、逆変換が定義され、2次元の場合、次
のように表わされる。
)(x =O,L −・ ・・ N −1; k
=O,L = −N −1)の要素からなる行列
を用いて、変換、逆変換が定義され、2次元の場合、次
のように表わされる。
(Y) −CM) ・ [X:] ・’(M〕−=
(la)CX〕−’CM〕 ・ (Y:] ・
CM、] −(lb)なお、行列の規模が2N行2N列
のとき、(1a)式には1/2”’ の係数が掛るが、
N+1ビア)のデータソフトと等価であるから、この係
数の記載は省略する。
(la)CX〕−’CM〕 ・ (Y:] ・
CM、] −(lb)なお、行列の規模が2N行2N列
のとき、(1a)式には1/2”’ の係数が掛るが、
N+1ビア)のデータソフトと等価であるから、この係
数の記載は省略する。
ところで、(la)、 (lb) 式のような行列デ
ータの乗算には、第4図に示すような、内債演算回路と
並べ替え回路(コーナターナ)とからなる乗算装置が従
来用いられていた。
ータの乗算には、第4図に示すような、内債演算回路と
並べ替え回路(コーナターナ)とからなる乗算装置が従
来用いられていた。
第4図において、(10)、 (20) は内債演算
回路であって、簡単のために、いずれも4行4列の規模
の行列に対応する4次構成とされ、コーナターナ(30
)を介して接続される。
回路であって、簡単のために、いずれも4行4列の規模
の行列に対応する4次構成とされ、コーナターナ(30
)を介して接続される。
即ち、端子INから次の(2)式のようなデータ行列〔
x〕が入力され、一方の内債演算回路(10)において
、(3)式のような係数行列〔A〕との内債演算が行な
われる。
x〕が入力され、一方の内債演算回路(10)において
、(3)式のような係数行列〔A〕との内債演算が行な
われる。
[X3I X32 X33 X11 □X
41 X42 X43 X44 JCA:]=t
a”1 a、 a13 a14 ””(3)内債
演算回路(10)は、3個の単位遅延器(11゜)(1
12)、 (11,) が逆順に縦続接続されて、そ
の出力端1両接続中点及び入力端に4個のラッチ(12
、)(122)、 (1,23) 及び(124)
がそれぞれ接続され、各ラッチ(12,)〜(124
) にそれぞれ縦続する乗算器(13,)〜(13,
) に係数ROM(141)〜(144) がそれ
ぞれ接続され、各乗算器(13,)〜(1,3,)
の出力が加算器(15)に接続されて、有限インパルス
応答(Finite Impulse Re5pons
e、FIR)型のトランスバーサルフィルタ構成とされ
る。
41 X42 X43 X44 JCA:]=t
a”1 a、 a13 a14 ””(3)内債
演算回路(10)は、3個の単位遅延器(11゜)(1
12)、 (11,) が逆順に縦続接続されて、そ
の出力端1両接続中点及び入力端に4個のラッチ(12
、)(122)、 (1,23) 及び(124)
がそれぞれ接続され、各ラッチ(12,)〜(124
) にそれぞれ縦続する乗算器(13,)〜(13,
) に係数ROM(141)〜(144) がそれ
ぞれ接続され、各乗算器(13,)〜(1,3,)
の出力が加算器(15)に接続されて、有限インパルス
応答(Finite Impulse Re5pons
e、FIR)型のトランスバーサルフィルタ構成とされ
る。
同様に、内債演算回路(20)もFIR型トランスバー
サルフィルタ構成とされ、対応する各要素の符号の「1
0」め位の数字をr2jに替えて重複説明を省略する。
サルフィルタ構成とされ、対応する各要素の符号の「1
0」め位の数字をr2jに替えて重複説明を省略する。
ただし、ROM(2L)〜(244) に格納される
係数b□、がROM (141)〜(14,) の係
数a1jど異なる。
係数b□、がROM (141)〜(14,) の係
数a1jど異なる。
コーナターナ(30)は工対のRA M(31)及び(
32)と、入力端及び出力側の切換スイフチ(33)及
び(34)とて構成され、両スイッチ(33)及び(3
4)は、1対のRAM(31)及び(32)の一方にデ
ータが書き込まれる期間に、他方からデータが読み出さ
れるように連動して切り換えられる。RA M (31
)及び(32)の容量は、前述のような4行4列の規模
の行列に対応して、それぞれ16ワードとされる。
32)と、入力端及び出力側の切換スイフチ(33)及
び(34)とて構成され、両スイッチ(33)及び(3
4)は、1対のRAM(31)及び(32)の一方にデ
ータが書き込まれる期間に、他方からデータが読み出さ
れるように連動して切り換えられる。RA M (31
)及び(32)の容量は、前述のような4行4列の規模
の行列に対応して、それぞれ16ワードとされる。
次に、第5図を参照しながら、第4図の従来例の行列デ
ータ乗算について説明する。
ータ乗算について説明する。
入力端子INから、第5図Aに示すような16ワ一ド単
位の入力行列〔X〕のデータ■が第1列(X目+ x
21+ X3+、 X41) 〜第4列(Xl。
位の入力行列〔X〕のデータ■が第1列(X目+ x
21+ X3+、 X41) 〜第4列(Xl。
X24 + X34 + X44 )の順序で供給
される。
される。
単位データの入力開始時点t。から3サイクル分の時間
3Tが経過したtl 時点では、単位遅延器(11,)
、 (11゜)及び(113) の各出力端に第1列
のデータX1ll X2+及びX31が存在すると共
に、4番目のデータX4+が遅延器(113) の入
力端に存在する。
3Tが経過したtl 時点では、単位遅延器(11,)
、 (11゜)及び(113) の各出力端に第1列
のデータX1ll X2+及びX31が存在すると共
に、4番目のデータX4+が遅延器(113) の入
力端に存在する。
この状態で、各ラッチに共通のイネイブルパルスが供給
されて、第1列の4個のデータX。
されて、第1列の4個のデータX。
X21+ X31及びX4□が4個のラッチ(12,
)、 (122)(123)及び(124) にそれ
ぞれ取り込まれ、第5図B、D、F及びHに示すように
、入力開始時点t。
)、 (122)(123)及び(124) にそれ
ぞれ取り込まれ、第5図B、D、F及びHに示すように
、入力開始時点t。
から4T時間経過後のt2 時点から4T時間にわたっ
て保持される。
て保持される。
ROM(14,)、 (142)、 (143) 及
び(144) には係数行列〔Δ〕の各列の係数al
l + al 2 + al 3及びai4(i
=1.2.3.4)が格納されており、同図CE、G
及びJに示ずように、t2 時点以後の1サイクルごと
に、対応する乗算器(13,)、 (132)、 (1
33)及び(134) に順次供給され、それぞれ対
応するラッチ(12,)、 (122>、 (123)
及び(124) に保持された第1列のデータX
il (i =12.3.4)と乗算される。
び(144) には係数行列〔Δ〕の各列の係数al
l + al 2 + al 3及びai4(i
=1.2.3.4)が格納されており、同図CE、G
及びJに示ずように、t2 時点以後の1サイクルごと
に、対応する乗算器(13,)、 (132)、 (1
33)及び(134) に順次供給され、それぞれ対
応するラッチ(12,)、 (122>、 (123)
及び(124) に保持された第1列のデータX
il (i =12.3.4)と乗算される。
即ち、t2時点以降の1.2.3及び4番目の各ザイク
ルで、係数行列の1.2.3及び4行の係数al J
+ 24 、a3 j及びaB < j=L2,3.
4)が入力行列の第1列のデータX1l= 21+
X31及びX41と乗算される。
ルで、係数行列の1.2.3及び4行の係数al J
+ 24 、a3 j及びaB < j=L2,3.
4)が入力行列の第1列のデータX1l= 21+
X31及びX41と乗算される。
加算器(15)において、各乗算器(13,)〜(13
,)の出力が加算されて、同図Kに示すように、t2時
点以降の4サイクルで次の(4)式に示すような積の行
列〔U〕の第1列のデータu + + + +1211
u、 3及びu41が得られる。
,)の出力が加算されて、同図Kに示すように、t2時
点以降の4サイクルで次の(4)式に示すような積の行
列〔U〕の第1列のデータu + + + +1211
u、 3及びu41が得られる。
[:U〕= [A:] ・ 〔x〕 ・・・ (4)
方、同図Aに示すように、t2 時点で行列〔X〕の第
2列のデータX12+ 221 X32及びX42
の入力が開女合されて、前述と同様に、t2時点から4
T時間後の時点t3 ては、第2列のデータX12 +
X22 + X32及びX42がそれぞれランチ
(12,)、 (122)、 (123> 及び(1
24) にラッチされている。また、t3 時点以降
の1サイクルごとに、ROM(14゜)、 (14゜)
、 (143) 及び(14,) から、前述と同様
に、行列〔Δ〕の各列の係数al l + a i
2ai3及びa、4(i −L2.3.4)が順次出力
される。
方、同図Aに示すように、t2 時点で行列〔X〕の第
2列のデータX12+ 221 X32及びX42
の入力が開女合されて、前述と同様に、t2時点から4
T時間後の時点t3 ては、第2列のデータX12 +
X22 + X32及びX42がそれぞれランチ
(12,)、 (122)、 (123> 及び(1
24) にラッチされている。また、t3 時点以降
の1サイクルごとに、ROM(14゜)、 (14゜)
、 (143) 及び(14,) から、前述と同様
に、行列〔Δ〕の各列の係数al l + a i
2ai3及びa、4(i −L2.3.4)が順次出力
される。
以下前述と同様にして、t3 時点以降の4サイクルで
前出(4)式に示すような積の行列CUJの第2列のデ
ータul 2 + 2□、u3□及びu42が得られ
る。
前出(4)式に示すような積の行列CUJの第2列のデ
ータul 2 + 2□、u3□及びu42が得られ
る。
以下同様にして、次のt4 時点以降の4サイクルで、
積の行列〔U〕の第3列のデータu13〜u43が得ら
れ、その次のt5 時点以降の4サイクルで、積の行列
[’U〕の第4列のデータu14〜u44が得られる。
積の行列〔U〕の第3列のデータu13〜u43が得ら
れ、その次のt5 時点以降の4サイクルで、積の行列
[’U〕の第4列のデータu14〜u44が得られる。
上述のようにして得られた行列〔U〕の16ワードの列
順のデータはコーナターナ(30)のRAM(31)及
び(32)に交互に書き込まれる。書き込み時のアドレ
スと読み出し時のアドレスとを変えることにより、RA
M(31)及び(32)から桁順で交互に読出された
行列〔U〕のデータが第2の内債演算回路(20)に供
給され、上述と全く同様にして、第2の係数行列C[+
と乗算されて、次の(5)式で表わされる積の行列〔Y
〕のデータが端子OUTに導出される。
順のデータはコーナターナ(30)のRAM(31)及
び(32)に交互に書き込まれる。書き込み時のアドレ
スと読み出し時のアドレスとを変えることにより、RA
M(31)及び(32)から桁順で交互に読出された
行列〔U〕のデータが第2の内債演算回路(20)に供
給され、上述と全く同様にして、第2の係数行列C[+
と乗算されて、次の(5)式で表わされる積の行列〔Y
〕のデータが端子OUTに導出される。
CY:] −CU〕 ・ 〔B〕
〔A〕 ・ 〔X〕 ・ l:B〕−(5)D 発明が
解決しようとする課題 前述のように、従来の行列データ乗算装置では、内債演
算回路(10)が直列型であるため、FIR型トランス
バーサルフィルタ構成とされると共に、ラッチを用いて
データを保持する必要があり、構成が複雑になるという
問題があった。
解決しようとする課題 前述のように、従来の行列データ乗算装置では、内債演
算回路(10)が直列型であるため、FIR型トランス
バーサルフィルタ構成とされると共に、ラッチを用いて
データを保持する必要があり、構成が複雑になるという
問題があった。
また、処理すべき行列の規模と等しい量のデータがコー
ナターナに供給されるため、コーナタナの1対のRAM
の容量が大きくなり、演算速度が制約されるという問題
があった。
ナターナに供給されるため、コーナタナの1対のRAM
の容量が大きくなり、演算速度が制約されるという問題
があった。
かかる点に鑑み、この発明の目的は、構成を簡単化する
と共に、演算速度を向上させた行列データ乗算装置を提
供するところにある。
と共に、演算速度を向上させた行列データ乗算装置を提
供するところにある。
E 課題を解決するための手段
この発明は、第1の行列のデータ成分a、jが格納され
たメモリを含み、第2の行列のデータXi。
たメモリを含み、第2の行列のデータXi。
が入力される内債演算回路と、行列のデータ成分の並べ
替えを行なう並べ替え回路とを備える行列データ乗算装
置において、内債演算回路を並列入力型に構成すると共
に、並べ替え回路を並列出力型に構成し、この並列出力
型の並べ替え回路(50)0 を介して第2の行列のデータを並列入力型の内債演算回
路(40)に入力するようにした行列データ乗算装置で
ある。
替えを行なう並べ替え回路とを備える行列データ乗算装
置において、内債演算回路を並列入力型に構成すると共
に、並べ替え回路を並列出力型に構成し、この並列出力
型の並べ替え回路(50)0 を介して第2の行列のデータを並列入力型の内債演算回
路(40)に入力するようにした行列データ乗算装置で
ある。
F 作用
この発明によれば、内債演算回路の構成が簡単化される
と共に、並べ替え回路の単位メモリの容量が低減されて
演算速度が向上する。
と共に、並べ替え回路の単位メモリの容量が低減されて
演算速度が向上する。
G 実施例
以下、第1図〜第3図を参照しながら、この発明による
行列データ乗算装置の一実施例について説明する。
行列データ乗算装置の一実施例について説明する。
G1 一実施例の構成
この発明の一実施例の構成を第1図に示す。この第1図
において、前出第4図に対応する部分には同一の符号を
付ける。
において、前出第4図に対応する部分には同一の符号を
付ける。
第1図において、(40) it並列入力型の4次の内
債演算回路であって、前出第4図の直列入力型の4次の
内積演算回路(10)からすべての単位遅延器(↑1.
)〜(1,L) とラッチ(12,)〜(124)
を除去したような簡単な構成とされ、対応する各要素
の符号の「10」の位の数字を「4」に替えて重複説明
を省略する。
債演算回路であって、前出第4図の直列入力型の4次の
内積演算回路(10)からすべての単位遅延器(↑1.
)〜(1,L) とラッチ(12,)〜(124)
を除去したような簡単な構成とされ、対応する各要素
の符号の「10」の位の数字を「4」に替えて重複説明
を省略する。
後述のように、内債演算回路(40)の各ROM(44
,)〜(44,、) の係数a、jの読み出しのタイ
ミングが第4図の内債演算回路(↑0)と異なる。
,)〜(44,、) の係数a、jの読み出しのタイ
ミングが第4図の内債演算回路(↑0)と異なる。
演算回路(40)とデータ入力端子INとの間に並べ替
え回路(50)が介挿される。この並べ替え回路(50
)は各4個の2組のRAM (5L)〜(514)
及び(52,)〜(524) を備え、各RAMの容量
は、行列の規模が4行4列の場合、それぞれ4ワードと
される。一連の入力データが所定のタイミンクで各RA
M(51□)〜(524) に振り分けられて書き込
まれると共に、各RAM (5L)〜(524) か
ら所定のタイミングで読み出されて、演算回路(40)
にそれぞれ供給される。説明の便宜上、並べ替え回路(
50)には切換スイッチ(55)〜(58)が設けられ
、それぞれ図示の周期で切り換えられる。
え回路(50)が介挿される。この並べ替え回路(50
)は各4個の2組のRAM (5L)〜(514)
及び(52,)〜(524) を備え、各RAMの容量
は、行列の規模が4行4列の場合、それぞれ4ワードと
される。一連の入力データが所定のタイミンクで各RA
M(51□)〜(524) に振り分けられて書き込
まれると共に、各RAM (5L)〜(524) か
ら所定のタイミングで読み出されて、演算回路(40)
にそれぞれ供給される。説明の便宜上、並べ替え回路(
50)には切換スイッチ(55)〜(58)が設けられ
、それぞれ図示の周期で切り換えられる。
1
2
演算回路(40)の出力は、共通の加算器(45)から
内積演算回路(20)に供給される。
内積演算回路(20)に供給される。
G2 一実施例の動作
次に、第2図及び第3図をも参照しながら、第1図の実
施例の動作について説明する。
施例の動作について説明する。
第2図Aに示すような(第5図Δと同様の)連の入力デ
ータ■が端子INからスイッチ(55)に供給されて、
16ワードごとにスイッチ(56)及び(57)に振り
分けられる。この16ワードの入力デク■が一方のスイ
ッチ(56)によって、同図B−Eに示すように、1ワ
ードごとに分割されて、RAM (51,)〜(514
) に順次循環的に書き込まれる。
ータ■が端子INからスイッチ(55)に供給されて、
16ワードごとにスイッチ(56)及び(57)に振り
分けられる。この16ワードの入力デク■が一方のスイ
ッチ(56)によって、同図B−Eに示すように、1ワ
ードごとに分割されて、RAM (51,)〜(514
) に順次循環的に書き込まれる。
同様に、次の16ワードの入力データが他方のスイッチ
(57)によって1ワードごとに分割され−C1RAM
(52,)〜(52,) に書き込まれる。
(57)によって1ワードごとに分割され−C1RAM
(52,)〜(52,) に書き込まれる。
同図B−Eに示すように、RAM (511)〜(52
4)に書き込まれた各分割データ■〜■は時間的に連続
して読み出される。
4)に書き込まれた各分割データ■〜■は時間的に連続
して読み出される。
この実施例においては、第3図BB−EEに示すように
、RAM(51、)〜(5L) のテ°−夕は4回繰
返して読み出され、それぞれスイッチ(58,)〜(5
84) を介して、4次内積演算回路(40)に並列
に供給される。同様に、RAM (52,)〜(524
) から次の各4ワードの分割データも4回繰返して
読み出される。
、RAM(51、)〜(5L) のテ°−夕は4回繰
返して読み出され、それぞれスイッチ(58,)〜(5
84) を介して、4次内積演算回路(40)に並列
に供給される。同様に、RAM (52,)〜(524
) から次の各4ワードの分割データも4回繰返して
読み出される。
並べ替え回路(50)の分割データQ〜■の読み出し開
始時点t。から最初の1サイクルでは、演算回路(40
)の各乗算器(43,)、 (432)、 (433)
及び(434)に第1列の各データxl l +
21 + x31及びX41が存在する。
始時点t。から最初の1サイクルでは、演算回路(40
)の各乗算器(43,)、 (432)、 (433)
及び(434)に第1列の各データxl l +
21 + x31及びX41が存在する。
同図F、G、H及びJに示すように、to 時点から4
サイクルにわたって、演算回路(40)のROM(44
,)、 (442)、 (443)及び(444)
から第1行の係数az、 G121 a+3及びG
14がそれぞれ読み出される。乗算器(43,)、 (
4L)、 (433) 及び(43,) において、
この第1行の係数all〜a14と、to 時点でRA
M (511)〜(5L) から読み出された第1列
のデータXll〜X41とがそれぞれ乗算され、加算器
(45)で加算されて、同図Kに示すように、積の3 4 行列〔U〕の第1行第1列の内債データullが得られ
る。
サイクルにわたって、演算回路(40)のROM(44
,)、 (442)、 (443)及び(444)
から第1行の係数az、 G121 a+3及びG
14がそれぞれ読み出される。乗算器(43,)、 (
4L)、 (433) 及び(43,) において、
この第1行の係数all〜a14と、to 時点でRA
M (511)〜(5L) から読み出された第1列
のデータXll〜X41とがそれぞれ乗算され、加算器
(45)で加算されて、同図Kに示すように、積の3 4 行列〔U〕の第1行第1列の内債データullが得られ
る。
to 時点から2番目のサイクルでは、RAM(5L)
〜(5L) から第2列のデータX12〜X42が読み
出され、乗算器(430〜(434) において、第
1行の計数all〜a14とそれぞれ乗算され、加算器
(45)で加算されて、第1行第2列の内債データu1
2が得られる。
〜(5L) から第2列のデータX12〜X42が読み
出され、乗算器(430〜(434) において、第
1行の計数all〜a14とそれぞれ乗算され、加算器
(45)で加算されて、第1行第2列の内債データu1
2が得られる。
同様に、to 時点から3番目及び4番目の各サイクル
では、RAM (51,)〜(5L) から第3列及
び第4列のデータX13〜X43及びX14〜X44が
それぞれ読み出され、乗算器(43,)〜(43,)
において、第1行の計数all〜a14とそれぞれ乗
算され、加算器(45)で加算されて、第1行第3列及
び第4列の内積データu13及び第14がそれぞれ得ら
れる。
では、RAM (51,)〜(5L) から第3列及
び第4列のデータX13〜X43及びX14〜X44が
それぞれ読み出され、乗算器(43,)〜(43,)
において、第1行の計数all〜a14とそれぞれ乗
算され、加算器(45)で加算されて、第1行第3列及
び第4列の内積データu13及び第14がそれぞれ得ら
れる。
このようにして、to 時点から41時点までの4ザイ
クルで、4行4列の入力データXll〜X44と、(行
4列の係数all〜allとの内債演算が行なわれて、
行列〔U〕の第1行の内積データU〜ul(が得られる
。
クルで、4行4列の入力データXll〜X44と、(行
4列の係数all〜allとの内債演算が行なわれて、
行列〔U〕の第1行の内積データU〜ul(が得られる
。
t1□1□からの次の4サイクルでは、演算回路(40
)のROM (44,)、 (442)、 (443)
及び(44,)から第2行の係数a2+、 2□、a
23及びa24がそれぞれ読み出されろ。乗算器(43
,)、 (432)、 (433)及び(43,)
において、この第2行の係数221〜a24と、前述と
同様に、RA M (5L)〜(514)から1サイク
ルごとに1列ずつ読み出された4行4列のブタX1、〜
X44とがそれぞれ乗算され、加算器(45)で加算さ
れて、同1fflKに示すように、積の行列〔U〕の第
2行の内積データu21,22+ u23及びu 2
4が得られる。
)のROM (44,)、 (442)、 (443)
及び(44,)から第2行の係数a2+、 2□、a
23及びa24がそれぞれ読み出されろ。乗算器(43
,)、 (432)、 (433)及び(43,)
において、この第2行の係数221〜a24と、前述と
同様に、RA M (5L)〜(514)から1サイク
ルごとに1列ずつ読み出された4行4列のブタX1、〜
X44とがそれぞれ乗算され、加算器(45)で加算さ
れて、同1fflKに示すように、積の行列〔U〕の第
2行の内積データu21,22+ u23及びu 2
4が得られる。
t12時点以後の8サイクルでは、第3図BBCC,D
D、 E E l:示1−ヨウニ、演算回路(40
> )乗算器(43,)〜(434) には、上述と
同様に、RAM(511)〜(5L) から4行4列
の入力データX〜X44がそれぞれ1サイクルずつ供給
される。
D、 E E l:示1−ヨウニ、演算回路(40
> )乗算器(43,)〜(434) には、上述と
同様に、RAM(511)〜(5L) から4行4列
の入力データX〜X44がそれぞれ1サイクルずつ供給
される。
方、ROM (44,)〜(4,44) からは、同図
F、 GH,Jに示すように、第3行及び第4行の係数
a31〜a34及びa41〜a44がそれぞれ4サイク
ルずつ読み出される。
F、 GH,Jに示すように、第3行及び第4行の係数
a31〜a34及びa41〜a44がそれぞれ4サイク
ルずつ読み出される。
5
1に
れにより、同図Kに示すように、t12時点以後の8ザ
イクルで行列〔U〕の第3行及び第4行の内積データu
31〜u34及びu41〜u44が得られ、t12時点
以前の8サイクルと合わせて、行列〔U〕の4行4列の
全内積データu l l−u 44が揃うことになる。
イクルで行列〔U〕の第3行及び第4行の内積データu
31〜u34及びu41〜u44が得られ、t12時点
以前の8サイクルと合わせて、行列〔U〕の4行4列の
全内積データu l l−u 44が揃うことになる。
第4図の従来の内債演算回路(10ンの出力が第5図K
に示すような列順であるのに対して、第3図Kから明ら
かなように、この実施例の演算回路(40)の内債デー
タu l l−u 44は前歴であって、後段の4次の
内積演算回路(20)に直接に供給され、前出(5)式
のような所要の行列[’Y〕のデータが端子OUTに導
出される。
に示すような列順であるのに対して、第3図Kから明ら
かなように、この実施例の演算回路(40)の内債デー
タu l l−u 44は前歴であって、後段の4次の
内積演算回路(20)に直接に供給され、前出(5)式
のような所要の行列[’Y〕のデータが端子OUTに導
出される。
第1図の実施例では、並列入力型の4次内積演算回路(
40)に、並列出力型の並べ替え回路(50)を介して
4行4列のデータ行列のデータXll〜X44を入力す
るようにしたので、内債演算回路の構成が簡単化される
と共に、並べ替え回路(50)の単位メモリの容量が低
減されて、演算速度が向上する。
40)に、並列出力型の並べ替え回路(50)を介して
4行4列のデータ行列のデータXll〜X44を入力す
るようにしたので、内債演算回路の構成が簡単化される
と共に、並べ替え回路(50)の単位メモリの容量が低
減されて、演算速度が向上する。
以上、簡単のために、4行4列の正方行列の場合につい
て説明したが、勿論、大規模の正方行列及び矩形行列に
対してもこの発明を適用することができる。
て説明したが、勿論、大規模の正方行列及び矩形行列に
対してもこの発明を適用することができる。
G、他の実施例
第1図の実施例では、後段の内積演算回路(20)を直
列入力型のままとしたが、この内積演算回路(20)を
も並列入力型とすることができる。この場合、通常は演
算回路(20〉の出力側に設けられる直列出力型の並べ
替え回路(図示せず)に代えて、並列出力型の並べ替え
回路が前段及び後段の内債演算回路の間に介挿されて、
所要の順序でデータが出力される。
列入力型のままとしたが、この内積演算回路(20)を
も並列入力型とすることができる。この場合、通常は演
算回路(20〉の出力側に設けられる直列出力型の並べ
替え回路(図示せず)に代えて、並列出力型の並べ替え
回路が前段及び後段の内債演算回路の間に介挿されて、
所要の順序でデータが出力される。
また、第1図の実施例では、計数a、JはROM(44
,)〜(44,) に格納するようにしているが、こ
のROMに代えてRAMを用いてもよい。この場合、こ
のRAMに別の計数行列CK )の成分に1゜を書き込
むことによりl:V〕= CK:] ・ 〔X〕の乗
算を行うことができる。
,)〜(44,) に格納するようにしているが、こ
のROMに代えてRAMを用いてもよい。この場合、こ
のRAMに別の計数行列CK )の成分に1゜を書き込
むことによりl:V〕= CK:] ・ 〔X〕の乗
算を行うことができる。
更に、第1図のROM(44,)〜(44,) に代
えて、■7 8 並べ替え回路(50)と同一構成の別の並べ替え回路を
用いることもできる。この場合は、2つの直列入力X、
j及びyi jから 〔z〕−〔x〕 ・ 〔Y〕 を計算して、zi、1を任意の順序で出力することがで
きる。
えて、■7 8 並べ替え回路(50)と同一構成の別の並べ替え回路を
用いることもできる。この場合は、2つの直列入力X、
j及びyi jから 〔z〕−〔x〕 ・ 〔Y〕 を計算して、zi、1を任意の順序で出力することがで
きる。
のタイムチャート、第4図は従来の行列データ乗算装置
の構成例を示すブロック図、第5図は従来例の動作を説
明するだめのタイムチャートである。
の構成例を示すブロック図、第5図は従来例の動作を説
明するだめのタイムチャートである。
(20)、 (40)は内債演算回路、(44,)〜(
44,) はROM、(50)は並べ替え回路、(5
L)〜(5L)、 (521)〜(524) はRA
Mである。
44,) はROM、(50)は並べ替え回路、(5
L)〜(5L)、 (521)〜(524) はRA
Mである。
H発明の効果
以上詳述のように、この発明によれば、並列出力型の並
べ替え回路を介して並列入力型の内債演算回路にデータ
行列のデータを入力するようにしたので、内債演算回路
の構成が簡単化されると共に、並べ替え回路の単位メモ
リの容量が低減されて演算速度が向上した行列データ乗
算装置が得られる。
べ替え回路を介して並列入力型の内債演算回路にデータ
行列のデータを入力するようにしたので、内債演算回路
の構成が簡単化されると共に、並べ替え回路の単位メモ
リの容量が低減されて演算速度が向上した行列データ乗
算装置が得られる。
代 理 人
松 隈 秀 盛
第1図はこの発明による行列データ乗算装置の一実施例
の構成を示すブロック図、第2図及び第3図はこの発明
の一実施例の動作を説明するため9 0 特開平3 75868 (8) 特開平3 75868 (9) 特開平 3 75868 (10) 特開平3 75868(11) 二」三 統 ネdi 正 書 1.事件の表示 平底 1年 特 1/「j豹1 第2]1630号2、
発明の名称 行列データ乗算装置 3、補正をする者 事件との関係 特許出願人 住 所 東京部品用回能品用6丁目7番35号名称(2
18)ソニー株式会社 代表取締役 大 賀 JIQ Ait4、代理人 6、補正により増加する請求項の数 7、補正の対象 [] −〔A) ・ 〔χ] が計算され、uII+ u12+ u13+ u
14+ u2u2□・・・・u44という桁順に出力
されるが、任意の順番でデータXijを入力して、任意
の順番でデータLlijを出力する事も可能である。 この場合は、システム制御回路(図示せず)等により、
入力されるデータに応して、スイッチ(56)を切り換
えて、例えばX、が入力された時はRAM(51,)に
書き込まれ、X2□が入力された時はRA M (51
2)に書き込まれるようにする。他のX、についても、
スイッチ(56)によって、次の第1表のように、RA
M(51,)〜RA M (514)のいずれかに書き
込まれる。 なお、この場合、スイッチ(56) 、 (57)の切
換周期はTとは限らない。 (1)明細書中、第3頁8〜9行に「フィルタ・小さく
、」とあるを「帯域圧縮に適しており、」に訂正する。 (2)同、同頁11〜14行に「この・・・・N−1,
) Jとあるを下記のとおりに訂正する。 「このDCTはN次の場合、第1行のずべてが1/、/
N、第2行以下は cos ((2x+]、) kπ/2Nl(X=O,]
、、−=・N−1;に=1゜==N−1)J(3)
同、第13頁16〜18行に「同図・・・・読み出され
る。」とあるをrRAM (51,1)〜(524)に
書き込まれた各分割データは時間的に連続して読み出さ
れる。」に訂正する。 (4) 同、第14頁7行に「0〜0」とあるを削除
する。 (5) 同、第17頁13行の「・・・・導出される
。」の後に改行して下記を加入する。 「第1図の実施例では、データがXll x、。 X31+ X41. X+2. X221 ”
”、 X44という列順に入力されて 第 1 表 任意の順番でu、jを出力する場合、まずuiZ’ (
i’+J’はそれぞれ1〜4のいずれか)か出力される
とする。 RAM (5]、、)〜(51,1) から、XIJ
′〜χ4゜が読み出され、スイッチ(581)〜(58
,)を介して、乗算器(431)〜(43,)に入力さ
れる。 これと同時にROM (44,)〜(444)から、a
i’ l〜a、′4が読み出され、乗算器(/131
)〜(43,)に供給される。乗算器(431)〜(4
34)及び加算器(45)により、a、′、χ、 ;’
+a 4’ 2X2;’+a%3X33’+a%aX
4j’が、即ちu、+、+が計算され、出力される。 次に、u、′r 、n (、rr 、 、rrはそれぞ
れ1〜4のいずれか)が出力されるとする。 RAM (51,1)〜(514)及びROM(44,
)〜(44,)からX、j″〜X0″とa、、〜a、″
4がそれぞれ読み出され、a +″+ X + 3”
十a 、”z X zh−1−a i″3X 3 j″
+ a i” 4 X 4 j″が、即ちu、H、rJ
が計算され、出力される。 以下、同様にして任意の順番でuitを出力する事が可
能である。」 (6)同、第18頁3行の「できる。」の後に改行して
下記を加入する。 「一般に、入力行列(、X)がffiXm行列という矩
形行列で、計数行列〔A〕がkXN行列の時は、並べ替
え回路(50)を構成するRAMはmワードのものが2
×乏個必要である。そして内積演算回路(4c)を構成
するROMはにワドのものがi個、乗算器がL個必要で
ある。 (7)同、第18頁3行及び同頁1G行にそれぞれ「計
数」とあるをそれぞれ「係数」に訂正する。 」 (8)図面中、第2図及び第4図を別紙のとおり訂正す
る。 特開平3 75868 (14)
の構成を示すブロック図、第2図及び第3図はこの発明
の一実施例の動作を説明するため9 0 特開平3 75868 (8) 特開平3 75868 (9) 特開平 3 75868 (10) 特開平3 75868(11) 二」三 統 ネdi 正 書 1.事件の表示 平底 1年 特 1/「j豹1 第2]1630号2、
発明の名称 行列データ乗算装置 3、補正をする者 事件との関係 特許出願人 住 所 東京部品用回能品用6丁目7番35号名称(2
18)ソニー株式会社 代表取締役 大 賀 JIQ Ait4、代理人 6、補正により増加する請求項の数 7、補正の対象 [] −〔A) ・ 〔χ] が計算され、uII+ u12+ u13+ u
14+ u2u2□・・・・u44という桁順に出力
されるが、任意の順番でデータXijを入力して、任意
の順番でデータLlijを出力する事も可能である。 この場合は、システム制御回路(図示せず)等により、
入力されるデータに応して、スイッチ(56)を切り換
えて、例えばX、が入力された時はRAM(51,)に
書き込まれ、X2□が入力された時はRA M (51
2)に書き込まれるようにする。他のX、についても、
スイッチ(56)によって、次の第1表のように、RA
M(51,)〜RA M (514)のいずれかに書き
込まれる。 なお、この場合、スイッチ(56) 、 (57)の切
換周期はTとは限らない。 (1)明細書中、第3頁8〜9行に「フィルタ・小さく
、」とあるを「帯域圧縮に適しており、」に訂正する。 (2)同、同頁11〜14行に「この・・・・N−1,
) Jとあるを下記のとおりに訂正する。 「このDCTはN次の場合、第1行のずべてが1/、/
N、第2行以下は cos ((2x+]、) kπ/2Nl(X=O,]
、、−=・N−1;に=1゜==N−1)J(3)
同、第13頁16〜18行に「同図・・・・読み出され
る。」とあるをrRAM (51,1)〜(524)に
書き込まれた各分割データは時間的に連続して読み出さ
れる。」に訂正する。 (4) 同、第14頁7行に「0〜0」とあるを削除
する。 (5) 同、第17頁13行の「・・・・導出される
。」の後に改行して下記を加入する。 「第1図の実施例では、データがXll x、。 X31+ X41. X+2. X221 ”
”、 X44という列順に入力されて 第 1 表 任意の順番でu、jを出力する場合、まずuiZ’ (
i’+J’はそれぞれ1〜4のいずれか)か出力される
とする。 RAM (5]、、)〜(51,1) から、XIJ
′〜χ4゜が読み出され、スイッチ(581)〜(58
,)を介して、乗算器(431)〜(43,)に入力さ
れる。 これと同時にROM (44,)〜(444)から、a
i’ l〜a、′4が読み出され、乗算器(/131
)〜(43,)に供給される。乗算器(431)〜(4
34)及び加算器(45)により、a、′、χ、 ;’
+a 4’ 2X2;’+a%3X33’+a%aX
4j’が、即ちu、+、+が計算され、出力される。 次に、u、′r 、n (、rr 、 、rrはそれぞ
れ1〜4のいずれか)が出力されるとする。 RAM (51,1)〜(514)及びROM(44,
)〜(44,)からX、j″〜X0″とa、、〜a、″
4がそれぞれ読み出され、a +″+ X + 3”
十a 、”z X zh−1−a i″3X 3 j″
+ a i” 4 X 4 j″が、即ちu、H、rJ
が計算され、出力される。 以下、同様にして任意の順番でuitを出力する事が可
能である。」 (6)同、第18頁3行の「できる。」の後に改行して
下記を加入する。 「一般に、入力行列(、X)がffiXm行列という矩
形行列で、計数行列〔A〕がkXN行列の時は、並べ替
え回路(50)を構成するRAMはmワードのものが2
×乏個必要である。そして内積演算回路(4c)を構成
するROMはにワドのものがi個、乗算器がL個必要で
ある。 (7)同、第18頁3行及び同頁1G行にそれぞれ「計
数」とあるをそれぞれ「係数」に訂正する。 」 (8)図面中、第2図及び第4図を別紙のとおり訂正す
る。 特開平3 75868 (14)
Claims (1)
- 【特許請求の範囲】 第1の行列のデータ成分が格納されたメモリを含み、第
2の行列のデータが入力される内積演算回路と、行列の
データ成分の並べ替えを行なう並べ替え回路とを備える
行列データ乗算装置において、 上記内積演算回路を並列入力型に構成すると共に、 上記並べ替え回路を並列出力型に構成し、 この並列出力型の並べ替え回路を介して上記第2の行列
のデータを上記並列入力型の内積演算回路に入力するよ
うにしたことを特徴とする行列データ乗算装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP21163089A JPH0375868A (ja) | 1989-08-17 | 1989-08-17 | 行列データ乗算装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP21163089A JPH0375868A (ja) | 1989-08-17 | 1989-08-17 | 行列データ乗算装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0375868A true JPH0375868A (ja) | 1991-03-29 |
Family
ID=16608958
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP21163089A Pending JPH0375868A (ja) | 1989-08-17 | 1989-08-17 | 行列データ乗算装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0375868A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5309527A (en) * | 1991-01-18 | 1994-05-03 | Sony Corporation | Image data processing apparatus |
| US5410500A (en) * | 1992-02-21 | 1995-04-25 | Sony Corporation | Discrete cosine transform apparatus and inverse discrete cosine transform apparatus |
| US5420811A (en) * | 1992-08-26 | 1995-05-30 | Sony Corporation | Simple quick image processing apparatus for performing a discrete cosine transformation or an inverse discrete cosine transformation |
| US5629882A (en) * | 1992-09-17 | 1997-05-13 | Sony Corporation | Discrete cosine transformation system and inverse discrete cosine transformation system, having simple structure and operable at high speed |
| US5933361A (en) * | 1992-11-13 | 1999-08-03 | Sony Corporation | Method of and apparatus for multiplying matrix data |
| JP2010539593A (ja) * | 2007-09-13 | 2010-12-16 | フリースケール セミコンダクター インコーポレイテッド | 重複オペランドを使用したsimdの内積演算 |
-
1989
- 1989-08-17 JP JP21163089A patent/JPH0375868A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5309527A (en) * | 1991-01-18 | 1994-05-03 | Sony Corporation | Image data processing apparatus |
| US5410500A (en) * | 1992-02-21 | 1995-04-25 | Sony Corporation | Discrete cosine transform apparatus and inverse discrete cosine transform apparatus |
| US5420811A (en) * | 1992-08-26 | 1995-05-30 | Sony Corporation | Simple quick image processing apparatus for performing a discrete cosine transformation or an inverse discrete cosine transformation |
| US5629882A (en) * | 1992-09-17 | 1997-05-13 | Sony Corporation | Discrete cosine transformation system and inverse discrete cosine transformation system, having simple structure and operable at high speed |
| US5933361A (en) * | 1992-11-13 | 1999-08-03 | Sony Corporation | Method of and apparatus for multiplying matrix data |
| JP2010539593A (ja) * | 2007-09-13 | 2010-12-16 | フリースケール セミコンダクター インコーポレイテッド | 重複オペランドを使用したsimdの内積演算 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5053985A (en) | Recycling dct/idct integrated circuit apparatus using a single multiplier/accumulator and a single random access memory | |
| US5481487A (en) | Transpose memory for DCT/IDCT circuit | |
| US7471844B2 (en) | Method, apparatus and system for multi-feature programmable tap filter image processing | |
| US4791598A (en) | Two-dimensional discrete cosine transform processor | |
| AU2008202591A1 (en) | High speed and efficient matrix multiplication hardware module | |
| JPS63136167A (ja) | 直交変換プロセッサ | |
| CN212112470U (zh) | 一种矩阵乘法计算电路 | |
| JPH0375868A (ja) | 行列データ乗算装置 | |
| CN1122026A (zh) | 离散余弦转换/反离散余弦转换电路的转置存储器 | |
| GB2277012A (en) | Image data storage | |
| JP3185211B2 (ja) | 行列データ乗算装置 | |
| Venetsanopoulos et al. | High-speed architectures for digital image processing | |
| CN1053545C (zh) | 离散余弦转换及其逆转换的方法及集成电路处理器 | |
| Ramachandran et al. | Epld-based architecture of real time 2d-discrete cosine transform and quantization for image compression | |
| CN1064507C (zh) | 可巡回执行的离散余弦转换及其逆转换集成电路处理器 | |
| KR102864575B1 (ko) | Spram 기반 영상 데이터 패킹 장치 및 방법 | |
| JPH0368070A (ja) | 行列データ乗算装置 | |
| JPH04218847A (ja) | 多次元アドレス発生器およびその制御方式 | |
| KR100235537B1 (ko) | 디지털 필터의 가변탭 구조 및 그의 곱셈회로 | |
| SU1681309A1 (ru) | Устройство дл вычислени линейной свертки | |
| Manikandababu et al. | Integration of a Full Wavelet-Based Image Compression System on a Field-Programmable Gate Array | |
| JPH0741213Y2 (ja) | Firフィルタ | |
| JPH0535867A (ja) | 画像処理装置 | |
| SU1446627A1 (ru) | Устройство цифровой фильтрации | |
| SU1022156A2 (ru) | Устройство дл умножени |