JPH05300026A - Discrete cosine transformer device and inverse discrete cosine transformer device - Google Patents

Discrete cosine transformer device and inverse discrete cosine transformer device

Info

Publication number
JPH05300026A
JPH05300026A JP19111392A JP19111392A JPH05300026A JP H05300026 A JPH05300026 A JP H05300026A JP 19111392 A JP19111392 A JP 19111392A JP 19111392 A JP19111392 A JP 19111392A JP H05300026 A JPH05300026 A JP H05300026A
Authority
JP
Japan
Prior art keywords
inner product
circuit
product arithmetic
matrix
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP19111392A
Other languages
Japanese (ja)
Inventor
Mitsuharu Oki
光晴 大木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to US08/020,313 priority Critical patent/US5410500A/en
Priority to EP93400437A priority patent/EP0557204A3/en
Publication of JPH05300026A publication Critical patent/JPH05300026A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To simplify the configuration by decreasing the scale of an inner product arithmetic operation circuit and to attain high speed arithmetic operation by decreasing number of times of the arithmetic operation. CONSTITUTION:Data of 8-row 8-column are inputted from an input terminal IN in the order of columns and fed to a 1st 4-degree inner product arithmetic operation circuit 42 via a 1st rearrangement circuit 41. An output of the inner product arithmetic operation circuit 42 is fed to a 2nd octal inner product arithmetic operation circuit 44 via a 64-word 2nd rearrangement circuit 43. An output of the inner product arithmetic operation circuit 44 is fed to a 3rd 4-degree inner product arithmetic operation circuit 45, and an output of the inner product arithmetic operation circuit 45 is fed to an output terminal OUT via the 64-word 3rd rearrangemenent circuit 46.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、デジタル画像処理等に
好適な離散コサイン変換装置及び逆離散コサイン変換装
置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a discrete cosine transform device and an inverse discrete cosine transform device suitable for digital image processing and the like.

【0002】[0002]

【従来の技術】従来、デジタル画像処理に適した各種の
離散的直交変換が知られており、そのうち、離散的コサ
イン変換(Discrete Cosine Tram
sform: DCT)は帯域圧縮に適し、処理方式が
比較的簡単である。
2. Description of the Related Art Conventionally, various discrete orthogonal transforms suitable for digital image processing have been known, and among them, discrete cosine transform (discrete cosine transform) is known.
sform: DCT) is suitable for band compression and has a relatively simple processing method.

【0003】このDCTはN次の場合、第1行のすべて
が1/√2、第2行以下は cos{(2x+1)kπ/2N} (x=0、1・・・N−1;k=1・・・N−1)の要
素からなる行列〔N〕を用いて、変換及び逆変換(ID
CT)が定義され、2次元の場合、次のように表わされ
る。
In the DCT of the Nth order, 1 / √2 is all in the first row, and cos {(2x + 1) kπ / 2N} (x = 0, 1 ... N-1; k in the second row and below. = 1 ... N-1) using a matrix [N] consisting of elements
CT) is defined and is two-dimensional, it is expressed as follows.

【0004】[0004]

【数1】〔Y〕=〔N〕〔X〕 t〔N〕[Equation 1] [Y] = [N] [X] t [N]

【数2】〔X〕= t〔N〕〔Y〕〔N〕[Equation 2] [X] = t [N] [Y] [N]

【0005】なお、行列の規模が2N 行2N 列のとき、
数1式には1/2N+1 の係数が掛るが、N+1ビットの
データシフトと等価であるから、この係数の記載は省略
する。
When the matrix size is 2 N rows and 2 N columns,
A coefficient of 1/2 N + 1 is applied to the equation ( 1 ), but since it is equivalent to a data shift of N + 1 bits, the description of this coefficient is omitted.

【0006】ところで、数1、数2式のような行列デー
タの乗算には、図24に示すような、内積演算回路と並
べ替え回路とからなる乗算装置が従来用いられていた。
図24において、10、20は内積演算回路であって、
簡単のために、いずれも4行4列の規模の行列に対応す
る4次構成とされ、並べ替え回路30を介して接続され
る。
By the way, for the multiplication of the matrix data represented by the equations (1) and (2), a multiplication device including an inner product calculation circuit and a rearrangement circuit as shown in FIG. 24 has been conventionally used.
In FIG. 24, 10 and 20 are inner product arithmetic circuits,
For simplification, each has a quaternary configuration corresponding to a matrix of a size of 4 rows and 4 columns, and is connected via a rearrangement circuit 30.

【0007】即ち、端子INから次の数3式のようなデ
ータ行列〔X〕が入力され、一方の内積演算回路10に
おいて、数4式のような係数行列〔A〕との内積演算が
行なわれる。
That is, a data matrix [X] such as the following formula 3 is input from the terminal IN, and one inner product calculating circuit 10 performs an inner product calculation with the coefficient matrix [A] such as the formula 4. Be done.

【0008】[0008]

【数3】 [Equation 3]

【数4】 [Equation 4]

【0009】内積演算回路10は、3個の単位遅延器1
1 、112 、113 が逆順に縦続接続されて、その出
力端、両接続中点及び入力端に4個のラッチ121 、1
2、123 及び124 がそれぞれ接続され、各ラッチ
121 〜124 にそれぞれ縦続する乗算器131 〜13
4 に係数ROM141 〜144 がそれぞれ接続され、各
乗算器131 〜134 の出力が加算器15に接続され
て、有限インパルス応答(Finite Impuls
e Response: FIR)型のトランスバーサ
ルフィルタ構成とされる。
The inner product calculation circuit 10 includes three unit delay units 1
1 1 , 11 2 and 11 3 are cascade-connected in reverse order, and four latches 12 1 and 1 are provided at the output end, both connection midpoints and the input end.
Multipliers 13 1 to 13 to which 2 2 , 12 3 and 12 4 are respectively connected and cascaded to the respective latches 12 1 to 12 4
4 the coefficient ROM 14 1 to 14 4 are respectively connected, the outputs of the multipliers 131-134 are connected to an adder 15, a finite impulse response (Finite Impuls
e Response (FIR) type transversal filter configuration.

【0010】同様に、内積演算回路20もFIR型トラ
ンスバーサルフィルタ構成とされ、対応する各要素の符
号の十の位の数字を「2」に替えて重複説明を省略す
る。ただし、ROM241 〜244 に格納される係数b
ijがROM141 〜144 の係数aijと異なる。
Similarly, the inner product calculation circuit 20 also has a FIR type transversal filter configuration, and the tens digit of the code of each corresponding element is changed to "2" to omit duplicated description. However, the coefficient b stored in the ROMs 24 1 to 24 4
ij is different from the coefficients a ij of the ROMs 14 1 to 14 4 .

【0011】並べ替え回路30は1対のRAM31及び
32と、入力側及び出力側の切換スイッチ33及び34
とで構成され、両スイッチ33及び34は、1対のRA
M31及び32の一方にデータが書き込まれる期間に、
他方からデータが読み出されるように連動して切り換え
られる。RAM31及び32の容量は、前述のような4
行4列の規模の行列に対応して、それぞれ16ワードと
される。
The rearrangement circuit 30 includes a pair of RAMs 31 and 32, and input side and output side changeover switches 33 and 34.
And both switches 33 and 34 have a pair of RAs.
During the period when data is written to one of M31 and M32,
The data is read from the other side so that the data is read in conjunction with each other. The RAMs 31 and 32 have a capacity of 4 as described above.
There are 16 words each corresponding to a matrix having a size of 4 rows.

【0012】次に、図25を参照しながら、図24の従
来例の行列データ乗算について説明する。
Next, the conventional matrix data multiplication of FIG. 24 will be described with reference to FIG.

【0013】入力端子INから、図25のAに示すよう
な16ワード単位の入力行列〔X〕のデータaが第1列
(x11、x21、x31、x41)〜第4列(x14、x24、x
34、x 44)の順序で供給される。
From the input terminal IN, as shown in FIG.
Data a of the input matrix [X] in units of 16 words is the first column
(X11, Xtwenty one, X31, X41) -4th column (x14, Xtwenty four, X
34, X 44) In order.

【0014】単位データの入力開始時点t0 から3サイ
クル分の時間3Tが経過したt1 時点では、単位遅延器
111 、112 及び113 の各出力端に第1列のデータ
11、x21及びx31が存在すると共に、4番目のデータ
41が遅延器113 の入力端に存在する。
[0014] In t 1 when the time 3T for three cycles from the input start point t 0 has elapsed the unit data, the unit delay 11 1, 11 2 and 11 3 of the data x 11 of the first column to the output terminals, x 21 and x 31 are present, and the fourth data x 41 is present at the input of the delay device 11 3 .

【0015】この状態で、各ラッチに共通のイネイブル
パルスが供給されて、第1列の4個のデータx11
21、x31及びx41が4個のラッチ121 、122 、1
3 及び124 にそれぞれ取り込まれ、図25のB、
D、F及びHに示すように、入力開始時点t0 から4T
時間経過後のt2 時点から4T時間にわたって保持され
る。
In this state, a common enable pulse is supplied to each latch, and the four data x 11 in the first column,
x 21 , x 31 and x 41 have four latches 12 1 , 12 2 , 1
2 3 and 12 4 , respectively, and in FIG. 25B,
As shown in D, F, and H, 4T from the input start time t 0
It is held for 4T hours from time t 2 after the passage of time.

【0016】ROM141 、142 、143 及び144
には係数行列〔A〕の各列の係数a i1、ai2、ai3及び
i4(i=1、2、3、4)が格納されており、同図の
C、E、G及びJに示すように、t2 時点以後の1サイ
クルごとに、対応する乗算器131 、132 、133
び134 に順次供給され、それぞれ対応するラッチ12
1 、122 、123 及び124 に保持された第1列のデ
ータxi1(i=1、2、3、4)と乗算される。
ROM141, 142, 143And 14Four
Is the coefficient a of each column of the coefficient matrix [A]. i1, Ai2, Ai3as well as
ai4(I = 1, 2, 3, 4) is stored, and
As shown in C, E, G and J, t21 size after time
Corresponding multiplier 13 for each clou1, 132, 133Over
And 13FourAre sequentially supplied to the corresponding latches 12
1, 122, 123And 12FourThe first row of data held by
Data xi1It is multiplied by (i = 1, 2, 3, 4).

【0017】即ち、t2 時点以降の1、2、3及び4番
目の各サイクルで、係数行列の1、2、3及び4行の係
数a1j、a2j、a3j及びa4j(j=1、2、3、4)が
入力行列の第1列のデータx11、x21、x31及びx41
乗算される。
That is, in the 1st, 2nd , 3rd and 4th cycles after time t 2 , the coefficients a 1j , a 2j , a 3j and a 4j (j = 1, 2, 3, 4) is multiplied with the first column of data x 11 , x 21 , x 31 and x 41 of the input matrix.

【0018】加算器15において、各乗算器131 〜1
4 の出力が加算されて、同図のKに示すように、t2
時点以降の4サイクルで次の数5式に示すような積の行
列〔U〕の第1列のデータu11、u21、u31及びu41
得られる。
In the adder 15, each of the multipliers 13 1 to 1
3 4 output is addition of, as shown in the K in the figure, t 2
The data u 11 , u 21 , u 31 and u 41 in the first column of the product matrix [U] as shown in the following equation 5 are obtained in four cycles after the time point.

【0019】[0019]

【数5】〔U〕=〔A〕〔X〕[Equation 5] [U] = [A] [X]

【0020】一方、同図のAに示すように、t2 時点で
行列〔X〕の第2列のデータx12、x22、x32及びx42
の入力が開始されて、前述と同様に、t2 時点から4T
時間後の時点t3 では、第2列のデータx12、x22、x
32及びx42がそれぞれラッチ121 、122 、123
び124 にラッチされている。また、t3 時点以降の1
サイクルごとに、ROM141 、142 、143 及び1
4 から、前述と同様に、行列〔A〕の各列の係数
i1、ai2、ai3及びai4(i=1、2、3、4)が順
次出力される。
On the other hand, as shown in A of the figure, the data x 12 , x 22 , x 32 and x 42 of the second column of the matrix [X] at time t 2.
Is started, and 4T from the time point t 2 as described above.
At time t 3 after time, the data x 12 , x 22 , x in the second column
32 and x 42 are latched in latches 12 1 , 12 2 , 12 3 and 12 4 , respectively. Also, 1 after t 3
ROM 14 1 , 14 2 , 14 3 and 1 for each cycle
4 4 in the same manner as described above, the coefficient a i1 each column of the matrix [A], a i2, a i3 and a i4 (i = 1,2,3,4) are sequentially output.

【0021】以下前述と同様にして、t3 時点以降の4
サイクルで前出数5式に示すような積の行列〔U〕の第
2列のデータu12、u22、u32及びu42が得られる。
Thereafter, in the same manner as described above, 4 after time t 3
In the cycle, the data u 12 , u 22 , u 32, and u 42 in the second column of the product matrix [U] as shown in the above equation 5 are obtained.

【0022】以下同様にして、次のt4 時点以降の4サ
イクルで、積の行列〔U〕の第3列のデータu13〜 u
43が得られ、その次のt5 時点以降の4サイクルで、積
の行列〔U〕の第4列のデータu14〜u44が得られる。
In the same manner, the data u 13 to u in the third column of the product matrix [U] are obtained in four cycles after the next time t 4.
43 is obtained, and the data u 14 to u 44 in the fourth column of the product matrix [U] are obtained in the next 4 cycles after the time point t 5 .

【0023】上述のようにして得られた行列〔U〕の1
6ワードの列順のデータは並べ替え回路30のRAM3
1及び32に交互に書き込まれる。書き込み時のアドレ
スと読み出し時のアドレスとを変えることにより、RA
M31及び32から行順で交互に読出された行列〔U〕
のデータが第2の内積演算回路20に供給され、上述と
全く同様にして、第2の係数行列〔B〕と乗算されて、
次の数6式で表わされる積の行列〔Y〕のデータが端子
OUTに導出される。
1 of the matrix [U] obtained as described above
The 6-word column-order data is the RAM 3 of the rearrangement circuit 30.
Alternately written to 1 and 32. RA is changed by changing the write address and the read address.
Matrix alternately read from M31 and M32 in row order [U]
Is supplied to the second inner product arithmetic circuit 20 and is multiplied by the second coefficient matrix [B] in the same manner as described above.
The data of the product matrix [Y] represented by the following equation 6 is derived at the terminal OUT.

【0024】[0024]

【数6】〔Y〕=〔U〕〔B〕=〔A〕〔X〕〔B〕[Equation 6] [Y] = [U] [B] = [A] [X] [B]

【0025】[0025]

【発明が解決しようとする課題】ところで、行列の規模
が8行8列の場合、数1式の定数行列〔N〕は、次の数
7式のように表される。
By the way, when the scale of the matrix is 8 rows and 8 columns, the constant matrix [N] of the equation 1 is expressed by the following equation 7.

【0026】[0026]

【数7】 ここに、要素a〜nは、図26に示すように、角度π/
16を単位とする所定角の余弦である。
[Equation 7] Here, the elements a to n have an angle of π /, as shown in FIG.
It is a cosine with a specified angle in units of 16.

【0027】また、DCT及びIDCTを定義する数1
式から明らかなように、行列〔Y〕の要素yijは行列
〔X〕の要素xijの1次式で表現される。
Also, the number 1 that defines DCT and IDCT
As is clear from the equation, the element y ij of the matrix [Y] is expressed by a linear equation of the element x ij of the matrix [X].

【0028】従って、図27に示すように、8行8列の
要素x11〜x88が列順に入力されて64次のベクトルと
なる〔Xc 〕と、8行8列の要素y11〜y88が列順に出
力されて64次のベクトルとなる〔Yc 〕との間には、
次の数8式で表される関係が成立する。
Therefore, as shown in FIG. 27, elements x 11 to x 88 of 8 rows and 8 columns are input in column order to form a vector of 64th order [Xc], and elements y 11 to y of 8 rows and 8 columns. 88 is output in column order and becomes a 64th order vector [Yc]
The relationship expressed by the following equation 8 is established.

【0029】[0029]

【数8】〔Yc 〕=〔M〕〔Xc 〕 ここに〔M〕は64行64列の定数行列である。## EQU8 ## [Yc] = [M] [Xc] where [M] is a constant matrix of 64 rows and 64 columns.

【0030】ところが、前述のような従来の行列データ
乗算装置では、この数8式の演算を行う場合、例えば6
4次の内積演算回路を用いて一挙に計算するため、回路
規模が膨大になり、構成が複雑になると共に、演算回数
が多くなって演算速度が制約されるという問題があっ
た。
However, in the conventional matrix data multiplication device as described above, when the operation of the equation 8 is performed, for example, 6
Since the calculation is performed all at once using the fourth-order inner product arithmetic circuit, there are problems that the circuit scale becomes enormous, the configuration becomes complicated, the number of arithmetic operations increases, and the arithmetic speed is restricted.

【0031】かかる点に鑑み、この発明の目的は、回路
規模が小さく、構成が簡単であると共に、演算回数が減
少して高速演算が可能な行列データ乗算装置を提供する
ところにある。
In view of the above points, an object of the present invention is to provide a matrix data multiplication device which has a small circuit scale, a simple structure, and a reduced number of operations, which enables high-speed operations.

【0032】[0032]

【課題を解決するための手段】この発明の第1の手段
は、行列の内積を演算する内積演算回路と、行列のデー
タ成分を所定の順序に並べ替える並べ替え回路とを備え
る離散コサイン変換装置において、係数が+1及び−1
である4次の第1の内積演算回路42と、係数が0、+
1及び−1である8次の第2の内積演算回路44と、定
数行列のデータ成分が格納されたメモリを含む第3の内
積演算回路45とを設け、8行8列の入力データを第1
の並べ替え回路41を介して上記第1の内積演算回路に
供給し、上記第1の内積演算回路の出力を第2の並べ替
え回路43を介して上記第2の内積演算回路に供給し、
上記第2の内積演算回路の出力を直接に上記第3の内積
演算回路に供給すると共に、上記第3の内積演算回路の
出力を第3の並べ替え回路46を介して導出するように
したことを特徴とする離散コサイン変換装置である。
A first means of the present invention is a discrete cosine transform device including an inner product arithmetic circuit for calculating the inner product of a matrix and a rearrangement circuit for rearranging the data components of the matrix in a predetermined order. Where the coefficients are +1 and -1
And a coefficient of 0, +
An 8th-order second inner product arithmetic circuit 44 of 1 and -1 and a third inner product arithmetic circuit 45 including a memory in which the data components of the constant matrix are stored are provided, and the input data of 8 rows and 8 columns is 1
Is supplied to the first inner product arithmetic circuit via the rearrangement circuit 41, and the output of the first inner product arithmetic circuit is supplied to the second inner product arithmetic circuit via the second rearrangement circuit 43.
The output of the second inner product arithmetic circuit is directly supplied to the third inner product arithmetic circuit, and the output of the third inner product arithmetic circuit is derived via the third rearrangement circuit 46. Is a discrete cosine transform device.

【0033】この発明の第2の手段は、行列の内積を演
算する内積演算回路と、行列のデータ成分を所定の順序
に並べ替える並べ替え回路とを備える逆離散コサイン変
換装置において、定数行列のデータ成分が格納されたメ
モリを含む第4の内積演算回路72と、係数が0、+1
及び−1である8次の第5の内積演算回路73と、係数
が+1及び−1である4次の第6の内積演算回路75と
を設け、8行8列の入力データを第4の並べ替え回路7
1を介して上記第4の内積演算回路に供給し、上記第4
の内積演算回路の出力を直接に上記第5の内積演算回路
に供給し、上記第5の内積演算回路の出力を第5の並べ
替え回路74を介して上記第6の内積演算回路に供給す
ると共に、上記第6の内積演算回路の出力を第6の並べ
替え回路76を介して導出するようにしたことを特徴と
する逆離散コサイン変換装置である。
The second means of the present invention is an inverse discrete cosine transform device comprising an inner product calculating circuit for calculating the inner product of a matrix and a rearrangement circuit for rearranging the data components of the matrix in a predetermined order. A fourth inner product calculation circuit 72 including a memory in which data components are stored, and coefficients 0, +1
And an −1st fifth inner product arithmetic circuit 73 of −1 and a fourth sixth inner product arithmetic circuit 75 of coefficients +1 and −1 are provided, and input data of 8 rows and 8 columns is input to the fourth Rearrangement circuit 7
1 to the fourth inner product calculation circuit,
Of the inner product arithmetic circuit is directly supplied to the fifth inner product arithmetic circuit, and the output of the fifth inner product arithmetic circuit is supplied to the sixth inner product arithmetic circuit via the fifth rearrangement circuit 74. In addition, the inverse discrete cosine transform device is characterized in that the output of the sixth inner product calculating circuit is derived via the sixth rearrangement circuit 76.

【0034】この発明の第3の手段は、行列の内積を演
算する内積演算回路と、行列のデータ成分を所定の順序
に並べ替える並べ替え回路とを備える離散コサイン変換
装置において、シリアルに供給される行列データを所定
個毎に並列化する並列化回路81と、係数が+1及び−
1である4次の第1の内積演算回路と、係数が0、+1
及び−1である8次の第2の内積演算回路と、定数行列
のデータ成分が格納されたメモリを含む第3の内積演算
回路とを設け、上記第1、第2、第3の内積演算回路を
それぞれ上記所定個並列に配し、8行8列の入力データ
を第1の並べ替え回路41を介して上記並列化回路に供
給し、上記並列化回路から出力された並列データの各デ
ータを上記所定個のそれぞれの第1の内積演算回路(加
算回路42′1 〜42′4 )に供給し、上記各第1の内
積演算回路の出力を直接に上記所定個の内の対応する上
記第2の内積演算回路441 〜444 に供給し、上記各
第2の内積演算回路の出力を直接に上記所定個の内の対
応する上記第3の内積演算回路451 〜454 に供給す
ると共に、上記所定個の第3の内積演算回路の出力をシ
リアルデータに変換(回路82)した後第3の並べ替え
回路46を介して導出するようにしたことを特徴とする
離散コサイン変換装置である。
A third means of the present invention is serially supplied to a discrete cosine transform device provided with an inner product calculating circuit for calculating the inner product of a matrix and a rearrangement circuit for rearranging the data components of the matrix in a predetermined order. Parallelizing circuit 81 for parallelizing a predetermined number of matrix data, and coefficients of +1 and −
Quaternary first inner product arithmetic circuit with 1 and coefficients 0, +1
And an −1st second inner product arithmetic circuit that is −1 and a third inner product arithmetic circuit that includes a memory in which the data components of the constant matrix are stored, and the first, second, and third inner product arithmetic operations are performed. Each of the predetermined number of circuits is arranged in parallel, and input data of 8 rows and 8 columns is supplied to the parallelization circuit through the first rearrangement circuit 41, and each data of the parallel data output from the parallelization circuit. Is supplied to each of the predetermined first inner product arithmetic circuits (adding circuits 42 ' 1 to 42' 4 ), and the output of each of the first inner product arithmetic circuits directly corresponds to the above-mentioned corresponding one of the predetermined number. The second inner product arithmetic circuits 44 1 to 44 4 are supplied, and the outputs of the respective second inner product arithmetic circuits are directly supplied to the corresponding third inner product arithmetic circuits 45 1 to 45 4 of the predetermined number. At the same time, the outputs of the predetermined number of third inner product arithmetic circuits are converted into serial data. The discrete cosine transform device is characterized in that after (circuit 82), it is derived through a third rearrangement circuit 46.

【0035】この発明の第4の手段は、行列の内積を演
算する内積演算回路と、行列のデータ成分を所定の順序
に並べ替える並べ替え回路とを備える逆離散コサイン変
換装置において、シリアルに供給される行列データを所
定個毎に並列化する並列化回路91と、定数行列のデー
タ成分が格納されたメモリを含む第4の内積演算回路
と、係数が0、+1及び−1である8次の第5の内積演
算回路と、係数が+1及び−1である4次の第6の内積
演算回路とを設け、上記第4、第5、第6の内積演算回
路をそれぞれ上記所定個並列に配し、8行8列の入力デ
ータを第4の並べ替え回路71を介して上記並列化回路
に供給し、上記並列化回路から出力された並列データの
各データを上記所定個の内の対応する上記第4の内積演
算回路72 1 〜724 に供給し、上記各第4の内積演算
回路の出力を直接に上記所定個の内の対応する上記第5
の内積演算回路731 〜734 に供給し、上記各第5の
内積演算回路の出力を直接に上記所定個の内の対応する
上記第6の内積演算回路に供給すると共に、上記所定個
の第6の内積演算回路(加算回路75′1 〜75′4
の出力をシリアルデータに変換(回路92)した後第6
の並べ替え回路76を介して導出するようにしたことを
特徴とする逆離散コサイン変換装置である。
The fourth means of the present invention is to calculate the inner product of matrices.
The inner product calculation circuit that performs the calculation and the data components of the matrix in a predetermined order
Inverse discrete cosine transformation with a rearrangement circuit for rearranging
In the conversion device, the queue data serially supplied is stored.
A parallelization circuit 91 that parallelizes every fixed number and a constant matrix data
Fourth inner product arithmetic circuit including a memory storing data components
And an eighth-order fifth dot product with coefficients 0, +1 and -1
Arithmetic circuit and sixth inner product of order 4 with coefficients +1 and -1
An arithmetic circuit is provided, and the fourth, fifth, and sixth inner product arithmetic operations are performed.
Each of the above paths is arranged in parallel and the input data of 8 rows and 8 columns is arranged.
Data via the fourth rearrangement circuit 71.
Of the parallel data output from the parallel circuit
Each data is assigned to the corresponding fourth inner product of the predetermined number
Arithmetic circuit 72 1~ 72FourAnd the above fourth inner product calculation
The output of the circuit directly corresponds to the fifth of the predetermined ones.
Inner product arithmetic circuit 731~ 73FourTo each of the above 5th
The output of the dot product arithmetic circuit directly corresponds to the above predetermined number
In addition to supplying to the sixth inner product calculating circuit,
Sixth inner product calculating circuit (adding circuit 75 '1~ 75 'Four)
6th after converting the output of serial number into serial data (circuit 92)
The rearrangement circuit 76 of FIG.
It is a featured inverse discrete cosine transform device.

【0036】[0036]

【作用】この発明によれば、内積演算回路の規模を小さ
くし、構成を簡単にすると共に、演算回数を減少させて
高速演算を可能にすることができる。
According to the present invention, it is possible to reduce the scale of the inner product arithmetic circuit, simplify the configuration, and reduce the number of arithmetic operations to enable high-speed arithmetic.

【0037】[0037]

【実施例】以下、図1〜図19を参照しながら、この発
明による行列データ乗算装置の一実施例について説明す
る。すなわちこの発明の一実施例の構成を図1に示し、
その要部の構成を図2及び図3に示す。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the matrix data multiplication device according to the present invention will be described below with reference to FIGS. That is, the structure of one embodiment of the present invention is shown in FIG.
The structure of the main part is shown in FIGS.

【0038】図1において、入力端子INから8行8列
のデータが、前出図27のベクトル〔Xc 〕に示すよう
に、列順で入力され、64ワードの第1の並べ替え回路
41を介して、4次の第1の内積演算回路42に供給さ
れる。この内積演算回路42の出力は、64ワードの第
2の並べ替え回路43を介して、8次の第2の内積演算
回路44に供給される。内積演算回路44の出力が4次
の第3の内積演算回路45に供給され、内積演算回路4
5の出力は64ワードの第3の並べ替え回路46を介し
て、出力端子OUTに導出される。
In FIG. 1, data of 8 rows and 8 columns is input from the input terminal IN in column order as shown in the vector [Xc] of FIG. 27, and the first rearrangement circuit 41 of 64 words is input. It is supplied to the first-order inner product calculation circuit 42 of the fourth order via the. The output of the inner product arithmetic circuit 42 is supplied to the 8th-order second inner product arithmetic circuit 44 via the second rearrangement circuit 43 of 64 words. The output of the inner product calculating circuit 44 is supplied to the third inner product calculating circuit 45 of the fourth order,
The output of 5 is led to the output terminal OUT via the third rearrangement circuit 46 of 64 words.

【0039】後述のように、第1の内積演算回路42の
係数は、+1及び−1だけであり、第2の内積演算回路
44の係数は、0、+1及び−1だけである。また、第
3の内積演算回路45の係数はDCTに特有の値とな
る。
As will be described later, the coefficients of the first inner product calculating circuit 42 are only +1 and -1, and the coefficients of the second inner product calculating circuit 44 are only 0, +1 and -1. Further, the coefficient of the third inner product calculating circuit 45 has a value peculiar to DCT.

【0040】図2において、50は4次の内積演算回路
であって、図1の内積演算回路42に相当し、3個の単
位遅延器511 、512 、513 が逆順に縦続接続され
て、その出力端、両接続中点及び入力端に4個のラッチ
521 、522 、523 、524 がそれぞれ接続され
る。ラッチ521 〜524 の出力が、それぞれスイッチ
531 〜534 の+側接点に供給されると共に、2の補
数回路541 〜544 を介して、スイッチ531 〜53
4 の−側接点にそれぞれ供給される。スイッチ531
534 の各出力が加算器55に供給される。
In FIG. 2, a fourth-order inner product calculating circuit 50 corresponds to the inner product calculating circuit 42 of FIG. 1, and three unit delay devices 51 1 , 51 2 , 51 3 are cascaded in reverse order. Thus, four latches 52 1 , 52 2 , 52 3 , 52 4 are connected to the output terminal, both connection midpoints and the input terminal, respectively. The output of latch 52 1 to 52 4 is supplied to a + side contact of the switch 53 1 to 53 4 respectively, via the two's complement circuit 54 1 to 54 4, the switch 53 1 to 53
It is supplied to each of the 4 negative contacts. Switch 53 1 ~
Each output of 53 4 is supplied to the adder 55.

【0041】各スイッチ531 〜534 は、各補数回路
541 〜544 と共に係数が+1、−1だけの乗算器を
構成し、システム制御回路56により互いに独立に切り
換えられる。
Each of the switches 53 1 to 53 4 constitutes a multiplier having coefficients of +1 and −1 together with each of the complement circuits 54 1 to 54 4 , and they are independently switched by the system control circuit 56.

【0042】また、2の補数回路541 〜544 は、周
知のように、否定回路と加算回路とで構成される。
As is well known, the 2's complement circuits 54 1 to 54 4 are composed of a negation circuit and an addition circuit.

【0043】図3において、60は8次の内積演算回路
であって、図1の内積演算回路44に相当し、入力IN
が8個の切換スイッチ611 〜618 の各第1の接点に
供給されると共に、8個の補数回路621 〜628 を介
して、スイッチ611 〜61 8 の各第2の接点に供給さ
れる。スイッチ611 〜618 の第3の接点には係数0
がそれぞれ供給され、スイッチ611 〜618 の各出力
がそれぞれ加算器63 1 〜638 に供給される。
In FIG. 3, reference numeral 60 designates an eighth-order inner product arithmetic circuit.
Which corresponds to the inner product calculation circuit 44 of FIG.
There are eight changeover switches 611~ 618To each first contact of
8 complement circuits 62 as supplied1~ 628Through
Then switch 611~ 61 8Supplied to each second contact of
Be done. Switch 611~ 618The third contact of is a coefficient 0
Are supplied respectively, and the switch 611~ 618Each output of
Are adders 63 1~ 638Is supplied to.

【0044】これらの加算器631 〜638 の各出力が
それぞれスイッチ641 〜648 を通じて16個のラッ
チ650 、651 〜6515に供給される。これらの各1
対のラッチ650 、651 ;652 、653 ・・・65
14、6514の出力が8個の切換スイッチ661 、662
・・・668 の各1対の接点に供給される。スイッチ6
1 〜668 の各出力がそれぞれ加算器631 〜638
に供給される。
The outputs of the adders 63 1 to 63 8 are supplied to 16 latches 65 0 and 65 1 to 65 15 through switches 64 1 to 64 8, respectively. Each one of these
Pair of latches 65 0 , 65 1 ; 65 2 , 65 3 ... 65
The outputs of 14 and 65 14 are eight changeover switches 66 1 and 66 2
It is supplied to the contacts of each pair of ... 66 8. Switch 6
6 1-66 sum the outputs of 8 each 63 1-63 8
Is supplied to.

【0045】またラッチ650 〜6515の各出力がそれ
ぞれパラレル/シリアル変換器67に供給される。この
変換器67から出力端子OUTが導出される。
The outputs of the latches 65 0 to 65 15 are supplied to the parallel / serial converter 67, respectively. The output terminal OUT is derived from the converter 67.

【0046】ここで切換スイッチ611 〜618 は、補
数回路621 〜628 と共に、係数が0、+1、−1だ
けの乗算器をそれぞれ構成し、スイッチ641 〜6
8 、661 〜668 と共に、システム制御回路68に
より互いに独立に切り換えられる。
The change-over switch 61 1-61 8 where, together with the complement circuit 62 1 to 62 8, the coefficient is 0, + 1, -1 only multipliers constitute respectively, switch 64 1-6
4 8 and 66 1 to 66 8 are independently switched by the system control circuit 68.

【0047】次に、図4〜図11をも参照しながら、図
1の実施例の動作について説明する。
Next, the operation of the embodiment shown in FIG. 1 will be described with reference to FIGS.

【0048】図1の実施例においては、DCTのための
64行64列の定数行列〔M〕を次の数9式に示すよう
な6個の行列に分解している。
In the embodiment of FIG. 1, the constant matrix [M] of 64 rows and 64 columns for DCT is decomposed into 6 matrices as shown in the following equation (9).

【0049】[0049]

【数9】 〔M〕=〔W〕〔V〕〔TS〕〔R〕〔L〕〔Q〕/8[M] = [W] [V] [TS] [R] [L] [Q] / 8

【0050】行列〔Q〕、〔R〕及び〔W〕が第1、第
2及び第3の並べ替え回路41、43及び46にそれぞ
れ対応すると共に、行列〔L〕、〔TS〕及び〔V〕が
第1、第2及び第3の内積演算回路42、44及び45
にそれぞれ対応する。行列〔Q〕〜〔W〕は何れも64
行64列であり、図4〜図11に示されるように、それ
ぞれ多数の0要素を含む疎行列(Sparse Mat
rix)である。
The matrices [Q], [R] and [W] correspond to the first, second and third rearrangement circuits 41, 43 and 46, respectively, and the matrices [L], [TS] and [V]. ] Is the first, second and third inner product arithmetic circuits 42, 44 and 45
Respectively correspond to. The matrices [Q] to [W] are all 64
As shown in FIGS. 4 to 11, each row has 64 columns, and each sparse matrix (Sparse Mat) includes a large number of 0 elements.
rix).

【0051】なお、この図4〜図11において、+及び
−はそれぞれ+1及び−1を表しており、他の行列を示
す後出各図においても同様である。
In FIGS. 4 to 11, + and-represent +1 and -1, respectively, and the same applies to the subsequent figures showing other matrices.

【0052】並べ替え回路41では、図4に示されるよ
うに、行列〔Q〕の各行各列とも、1か所だけが+1
で、残りの63個の要素は全て0であるから、64ワー
ドの入力データ〔Xc〕の並べ替えが行われる。
In the rearrangement circuit 41, as shown in FIG. 4, only one place is +1 for each row and each column of the matrix [Q].
Since the remaining 63 elements are all 0, the 64 words of input data [Xc] are rearranged.

【0053】内積演算回路42において、この並べ替え
られたデータ〔Q〕〔Xc〕が、図5の行列〔L〕で表
されるような演算処理を受ける。同図に明らかなよう
に、この行列〔L〕は、+1及び−1の要素のみで、同
形の4行4列の小行列が対角線上に16個並び、他の部
分が全て0要素の疎行列であるから、図2に示したよう
な4次の内積演算回路50で演算処理することができ
る。
In the inner product calculation circuit 42, the rearranged data [Q] [Xc] is subjected to calculation processing as represented by the matrix [L] in FIG. As is clear from the figure, this matrix [L] has only +1 and -1 elements, and 16 small 4-matrix 4-matrixes of the same shape are lined up diagonally and all other parts are sparse with 0 elements. Since it is a matrix, it can be processed by the quadratic inner product calculating circuit 50 as shown in FIG.

【0054】図2において、入力端子INから、64ワ
ード単位のデータ〔Q〕〔Xc〕が供給され、それぞれ
4個のデータが4個のラッチ521 、522 、523
52 4 に取り込まれ、4T時間にわたって保持される。
In FIG. 2, from the input terminal IN, 64 words
Data [Q] [Xc] in units of code are supplied,
4 pieces of data 4 pieces of latch 521, 522, 523,
52 FourAnd held for 4T hours.

【0055】4個のスイッチ531 、532 、533
534 は、行列〔L〕の4行4列の小行列の要素が+1
であるか−1であるかにより、+側または−側に切り換
えられて、各ラッチ52〜524 に保持されたデータに
+1または−1の係数が乗算され、加算器55で加算さ
れて、端子OUTから出力される。
Four switches 53 1 , 53 2 , 53 3 ,
53 4, the elements of four rows and four columns of submatrix of the matrix [L] is +1
By either -1 or is, the + side or - is switched to the side, the coefficient of +1 or -1 to the data held in the respective latches 52 to 52 4 are multiplied and summed by the adder 55, It is output from the terminal OUT.

【0056】内積演算回路42から出力された64ワー
ドのデータ〔L〕〔Q〕〔Xc〕は、第2の並べ替え回
路43において、図6及び図7〜図10に示す行列
〔R〕で表されるように並べ替えられる。
The 64-word data [L] [Q] [Xc] output from the inner product calculating circuit 42 is converted into the matrix [R] shown in FIGS. 6 and 7 to 10 in the second rearrangement circuit 43. Sorted as represented.

【0057】この並べ替えられたデータ〔R〕〔L〕
〔Q〕〔Xc〕が、第2の内積演算回路44において、
図11、図12の行列〔TS〕で表されるような演算処
理を受ける。同図に明らかなように、この行列〔TS〕
は、それぞれ0、+1及び−1の要素のみであり、そし
て、各列の各奇数行の要素、又はその下隣りの偶数行の
要素の少なくともどちらか一方は0であるような、16
行16列の小行列が対角線上に4個並び、他の部分が全
て0要素の疎行列であるから、図3に示したような8次
の内積演算回路60で演算処理することができる。
This rearranged data [R] [L]
[Q] [Xc] is the second inner product calculation circuit 44
The arithmetic processing as represented by the matrix [TS] in FIGS. 11 and 12 is performed. As is clear from the figure, this matrix [TS]
Are 0, +1 and −1 respectively, and at least one of the elements in each odd row of each column or the elements in the even rows below it is 0, 16
Since four small matrixes each having 16 rows and 16 columns are arranged diagonally and all other parts are sparse matrices, the operation can be performed by the 8th-order inner product operation circuit 60 as shown in FIG.

【0058】行列[TS]は 16×16の対角線上の
小行列以外の部分は全て0であるから、16次の内積演
算回路で計算できる。しかも、その小行列の要素は全て
0、±1のみであるから、入力されてくるデータ、その
値に対して2の補数器を介した値、及び0の3個の値を
選択した値を加算すれば良い。さらに、行列[TS]の
各16×16小行列をよくみると、各列の第0行目と第
1行目のどちらかは必ず0である。そして、各列の第2
行目と第3行目のどちらかは必ず0である。同様に、各
列の第2k行目と第2k+1行目のどちらかは必ず0で
ある(k=2〜7)。従って実際には8個の加算器を使
用した図3の回路で構成できる。
Since the matrix [TS] is all 0 except for the small matrix on the 16 × 16 diagonal line, it can be calculated by a 16th-order inner product calculation circuit. Moreover, since all the elements of the sub-matrix are 0 and ± 1, only the input data, the value through the 2's complementer for that value, and the value selected from the three values of 0 are selected. All you have to do is add. Further, if each 16 × 16 submatrix of the matrix [TS] is examined carefully, it is always 0 in either the 0th row or the 1st row of each column. And the second of each row
Either line 3 or line 3 is always 0. Similarly, either the 2k-th row or the 2k + 1-th row of each column is always 0 (k = 2 to 7). Therefore, in practice, the circuit of FIG. 3 using eight adders can be used.

【0059】通常、16次の内積演算回路には16個の
加算器を必要とするが、上述のとおり、各列の第2k行
目と第2k+1行目のどちらかは必ず0である(k=0
〜7)から、図3に示すように8個の加算器で計算する
ことが出来る。即ち、図3の16個のラッチは、演算開
始時刻に図示省略したクリア信号により、0がセットさ
れる。
Normally, a 16th-order inner product arithmetic circuit requires 16 adders, but as described above, either the 2k-th row or the 2k + 1-th row of each column is always 0 (k = 0
.About.7), it can be calculated by eight adders as shown in FIG. That is, the 16 latches in FIG. 3 are set to 0 by a clear signal (not shown) at the calculation start time.

【0060】ラッチ650 には、[TSii](i=1〜
4)の第0行目と入力ベクトル(i=1のときは、
[R][L][Q][Xc]の0〜15番目の要素、i
=2のときは、[R][L][Q][Xc]の16〜3
1番目の要素、i=3のときは、[R][L][Q]
[Xc]の32〜47番目の要素、i=4のときは、
[R][L][Q][Xc]の48〜63番目の要素)
との計算途中結果、及び計算結果が格納される。
The latch 65 0 has [TS ii ] (i = 1 to 1).
4) line 0 and the input vector (when i = 1,
The 0th to 15th elements of [R] [L] [Q] [Xc], i
= 2, 16 to 3 of [R] [L] [Q] [Xc]
When the first element, i = 3, [R] [L] [Q]
The 32nd to 47th elements of [Xc], when i = 4,
(48th to 63rd elements of [R] [L] [Q] [Xc])
The intermediate calculation result and the calculation result are stored.

【0061】ラッチ651 には、[TSii](i=1〜
4)の第1行目と入力ベクトルとの計算途中結果、及び
計算結果が格納される。セレクト1は、[TSii](i
=1〜4)の第0行目または第1行目の0でないほうの
値が1のときは入力端子からの値を選択し、−1のとき
は入力端子からの値に対して2の補数器を介した値(−
1倍した値)を選択し、第0行目と第1行目がともに0
であるときには0を選択する。
The latch 65 1 has [TS ii ] (i = 1 to 1).
The intermediate calculation result of the first line of 4) and the input vector and the calculation result are stored. Select 1 is [TS ii ] (i
= 1 to 4), the value from the input terminal is selected when the non-zero value in the 0th row or the 1st row is 1, and when it is -1, the value from the input terminal is 2 The value (-
(Value multiplied by 1) is selected, and both the 0th line and the 1st line are 0
If 0, 0 is selected.

【0062】セレクト9は、第0行目が0でないときは
ラッチ650 側にし、第1行目が0でないときはラッチ
651 側にする。第0行目または第1行目のどちらか一
方は必ず0であるから、セレクト9は上記のように選択
することにより、ラッチ65 0 とラッチ651 の両方を
選択するという矛盾は起きない。また、第0行目と第1
行目が共に0であるときは、どちらを選択しても良い。
セレクト1、セレクト9の制御信号は、制御回路68に
より制御される。
Select 9 is selected when the 0th line is not 0.
Latch 650To the side and latch when the first row is not 0
651Turn it to the side. Either 0th line or 1st line
One is always 0, so select 9 is selected as above
The latch 65 0And latch 651Both of
There is no contradiction of choice. Also, the 0th line and the 1st line
If both lines are 0, either one may be selected.
Control signals for select 1 and select 9 are sent to the control circuit 68.
More controlled.

【0063】例えば、jサイクル目(j=0〜15)に
上述の入力ベクトルのj番目の要素が入力端子から入力
されてくる。この時刻において、図3においてどのよう
な計算が行われるかを以下で述べる。
For example, at the j-th cycle (j = 0 to 15), the j-th element of the above-mentioned input vector is input from the input terminal. What kind of calculation is performed in FIG. 3 at this time will be described below.

【0064】上述の[TSii](i=1〜4)の第0行
第j列目の要素が1である場合、ラッチ650 に格納さ
れている値(j−1サイクル目までに計算された、第0
行目と入力されてくるデータとの計算途中結果)はスイ
ッチ661 を介して加算器631 に入力され、そして入
力ベクトルのj番目の要素もスイッチ611 を介して加
算器631 に入力される。そして加算器631 で、j−
1サイクル目までに計算された、第0行目と入力されて
くるデータとの計算途中結果と、入力ベクトルのj番目
の要素の加算が行われ、この加算結果はスイッチ641
を介してラッチ650 に格納される。
When the element at the 0th row and the jth column of the above [TS ii ] (i = 1 to 4) is 1, the value stored in the latch 65 0 (calculated by the j-1th cycle) The 0th
The intermediate calculation result of the row and the input data) is input to the adder 63 1 via the switch 66 1 , and the j-th element of the input vector is also input to the adder 63 1 via the switch 61 1. To be done. Then, in the adder 63 1 , j−
The intermediate calculation result of the 0th row and the input data calculated up to the first cycle and the j-th element of the input vector are added, and the addition result is the switch 64 1
It is stored in the latch 65 0 via.

【0065】上述の[TSii](i=1〜4)の第0行
第j列目の要素が−1である場合、ラッチ650 に格納
されている値(j−1サイクル目までに計算された、第
0行目と入力されてくるデータとの計算途中結果)はス
イッチ661 を介して加算器631 に入力され、そして
入力ベクトルのj番目の要素に対して−1倍した値もス
イッチ611 を介して加算器631 に入力される。そし
て加算器631 で、j−1サイクル目までに計算され
た、第0行目と入力されてくるデータとの計算途中結果
と、入力ベクトルのj番目の要素に対して−1倍した値
の加算が行われ、この加算結果はスイッチ641 を介し
てラッチ650 に格納される。
When the element at the 0th row and the jth column of the above [TS ii ] (i = 1 to 4) is -1, the value stored in the latch 65 0 (by the j-1th cycle) The calculated intermediate calculation result of the 0th row and the input data) is input to the adder 63 1 via the switch 66 1 and multiplied by -1 with respect to the j-th element of the input vector. The value is also input to the adder 63 1 via the switch 61 1 . Then, in the adder 63 1 , the intermediate calculation result of the 0th row and the input data calculated up to the j−1th cycle, and the value obtained by multiplying the jth element of the input vector by −1. Is performed and the result of this addition is stored in the latch 65 0 via the switch 64 1 .

【0066】即ち、第0行第j列目の要素が±1のとき
は、第0行目と入力されてくるデータとの計算途中結果
の更新(入力ベクトルのj番目の要素に対して±1倍し
た値の加算)が行われる。
That is, when the element in the 0th row and the jth column is ± 1, the mid-calculation results of the 0th row and the input data are updated (± j for the jth element of the input vector). The addition of the value multiplied by 1) is performed.

【0067】上述の[TSii](i=1〜4)の第1行
第j列目の要素が1である場合、ラッチ651 に格納さ
れている値(j−1サイクル目までに計算された、第1
行目と入力されてくるデータとの計算途中結果)はスイ
ッチ661 を介して加算器631 に入力され、そして入
力ベクトルのj番目の要素もスイッチ611 を介して加
算器631 に入力される。そして加算器631 で、j−
1サイクル目までに計算された、第1行目と入力されて
くるデータとの計算途中結果と、入力ベクトルのj番目
の要素の加算が行われ、この加算結果はスイッチ641
を介してラッチ651 に格納される。
When the element in the 1st row and the jth column of the above-mentioned [TS ii ] (i = 1 to 4) is 1, the value stored in the latch 65 1 (calculated by the j-1th cycle) Was done, first
The intermediate calculation result of the row and the input data) is input to the adder 63 1 via the switch 66 1 , and the j-th element of the input vector is also input to the adder 63 1 via the switch 61 1. To be done. Then, in the adder 63 1 , j−
The intermediate calculation result of the first row and the input data calculated up to the first cycle and the j-th element of the input vector are added, and the addition result is the switch 64 1
It is stored in the latch 65 1 via.

【0068】上述の[TSii](i=1〜4)の第1行
第j列目の要素が−1である場合、ラッチ651 に格納
されている値(j−1サイクル目までに計算された、第
1行目と入力されてくるデータとの計算途中結果)はス
イッチ661 を介して加算器631 に入力され、そして
入力ベクトルのj番目の要素に対して−1倍した値もス
イッチ611 を介して加算器631 に入力される。そし
て加算器631 で、j−1サイクル目までに計算され
た、第1行目と入力されてくるデータとの計算途中結果
と、入力ベクトルのj番目の要素に対して−1倍した値
の加算が行われ、この加算結果はスイッチ641 を介し
てラッチ651 に格納される。
When the element in the 1st row and the jth column of the above-mentioned [TS ii ] (i = 1 to 4) is -1, the value stored in the latch 65 1 (by the j-1th cycle) The calculated intermediate result of the calculation of the first row and the input data) is input to the adder 63 1 via the switch 66 1 and multiplied by -1 with respect to the j-th element of the input vector. The value is also input to the adder 63 1 via the switch 61 1 . Then, in the adder 63 1 , intermediate calculation results of the first row and the input data calculated up to the j−1th cycle, and a value obtained by multiplying the jth element of the input vector by −1. Are added and the result of this addition is stored in the latch 65 1 via the switch 64 1 .

【0069】即ち、第1行第j列目の要素が±1のとき
は、第1行目と入力されてくるデータとの計算途中結果
の更新(入力ベクトルのj番目の要素に対して±1倍し
た値の加算)が行われる。
That is, when the element in the 1st row and the jth column is ± 1, the mid-calculation results of the 1st row and the input data are updated (± for the jth element of the input vector). The addition of the value multiplied by 1) is performed.

【0070】また、第0行第j列目と第1行第j列目の
要素が共に0であるときは、スイッチ661 でどちらか
のラッチが選択され、加算器631 を介してスイッチ6
1で選択されたラッチに再度格納されるが、このとき
スイッチ611 で0が選択され加算器631 に入力され
るので、加算器631 では実質、加算は行われない。つ
まり実質ラッチ650 、651 ともに、データの更新は
行われない。
When the elements in the 0th row and the jth column and the 1st row and the jth column are both 0, one of the latches is selected by the switch 66 1 and is switched via the adder 63 1. 6
4 1 but is again stored in the selected latched, so this time 0 the switch 61 1 is input to the selected adders 63 1, the adder 63 1, substantially, the addition is not performed. That is, the data is not updated in both the substantial latches 65 0 and 65 1 .

【0071】このようにして、16サイクル後には、ラ
ッチ650 には第0行目と入力されてくるデータとの計
算結果が格納され、ラッチ651 には第1行目と入力さ
れてくるデータとの計算結果が格納されていることにな
る。
In this manner, after 16 cycles, the latch 65 0 stores the calculation result of the 0th row and the input data, and the latch 65 1 receives the 1st row. It means that the calculation result with the data is stored.

【0072】同様に、ラッチ652 〜6515には、[T
ii](i=1〜4)の第2〜15行目と入力ベクトル
との計算途中結果が格納され、16サイクル後には、計
算結果(第2〜15行目と入力されてくるデータとの計
算結果)が格納されていることになる。
Similarly, the latches 65 2 to 65 15 have [T
S ii ] (i = 1 to 4), the intermediate calculation results of the 2nd to 15th lines and the input vector are stored, and after 16 cycles, the calculation result (the 2nd to 15th lines and the input data) (Calculation result of) is stored.

【0073】これら計算結果はパラレル/シリアル変換
器67に入力され、第0行目と入力されてくるデータと
の計算結果、第1行目と入力されてくるデータとの計算
結果、...第15行目と入力されてくるデータとの計
算結果の順にシリアル出力される。
These calculation results are input to the parallel / serial converter 67, the calculation result of the 0th row and the input data, the calculation result of the 1st row and the input data ,. . . It is serially output in the order of the calculation result of the 15th line and the input data.

【0074】かくして、16×16行列[TS11]との
計算、16×16行列[TS22]との計算、16×16
行列[TS33]との計算、16×16行列[TS44]と
の計算が、それぞれ16サイクルずつかけて行われる。
即ち、64サイクルかけて行列[TS]との計算が行わ
れる。
Thus, calculation with 16 × 16 matrix [TS 11 ], calculation with 16 × 16 matrix [TS 22 ], 16 × 16
The calculation with the matrix [TS 33 ] and the calculation with the 16 × 16 matrix [TS 44 ] are performed in 16 cycles each.
That is, the calculation with the matrix [TS] is performed over 64 cycles.

【0075】内積演算回路44から出力された64ワー
ドのデータ〔TS〕〔R〕〔L〕〔Q〕〔Xc〕は、更
に、第3の内積演算回路45において、図13、図14
の行列〔V〕で表されるような演算処理を受ける。同図
に明らかなように、この行列〔V〕は、それぞれ4行4
列の小行列が対角線上に4個並び、他の部分が全て0要
素の疎行列であるから、前出図24に示すような通常の
4次内積演算回路45で演算処理することができる。
The 64-word data [TS] [R] [L] [Q] [Xc] output from the inner product arithmetic circuit 44 is further processed by the third inner product arithmetic circuit 45 in FIGS.
[V] of the above matrix [V] is received. As is clear from the figure, this matrix [V] has 4 rows and 4 rows, respectively.
Since four sub-matrixes of columns are arranged diagonally and all other parts are sparse matrices with 0 elements, the arithmetic processing can be performed by the ordinary quadratic inner product arithmetic circuit 45 as shown in FIG.

【0076】内積演算回路45から出力された64ワー
ドのデータ〔V〕〔TS〕〔R〕〔L〕〔Q〕〔Xc〕
は、第3の並べ替え回路46において、図15及び図1
6〜図19に示す行列〔W〕で表されるように並べ替え
られて、所望の出力データ〔W〕〔V〕〔TS〕〔R〕
〔L〕〔Q〕〔Xc〕が得られる。
64-word data [V] [TS] [R] [L] [Q] [Xc] output from the inner product calculating circuit 45.
In the third rearrangement circuit 46 shown in FIG.
6 to 19 are rearranged as represented by the matrix [W], and desired output data [W] [V] [TS] [R]
[L] [Q] [Xc] is obtained.

【0077】なお、実際には、Actually,

【数10】 〔Yc〕=〔M〕〔Xc〕 =〔W〕〔V〕〔TS〕〔R〕〔L〕〔Q〕〔Xc〕/8 であるから、この出力結果を8で割らなくてはいけない
が、これは値を3ビットシフトすればよく、回路的には
何も要らないので、図中では省略してある。
[Equation 10] [Yc] = [M] [Xc] = [W] [V] [TS] [R] [L] [Q] [Xc] / 8 Since this output result is not divided by 8, However, this is not necessary in the figure, since it is sufficient to shift the value by 3 bits and no circuit is required.

【0078】図1の実施例においては、各内積演算回路
42、44及び45の演算処理を表す行列〔L〕、〔T
S〕及び〔V〕が何れも疎行列であるため、乗算回数を
少なくして、各内積演算回路を小規模にすることができ
る。
In the embodiment shown in FIG. 1, matrices [L] and [T] representing the arithmetic processing of the inner product arithmetic circuits 42, 44 and 45, respectively.
Since S] and [V] are both sparse matrices, it is possible to reduce the number of multiplications and reduce the size of each inner product calculation circuit.

【0079】また、内積演算回路42については、行列
〔L〕の係数が0と+1、−1だけであるため、また内
積演算回路44については、行列〔TS〕の係数が0と
+1、−1だけで各行に+1又は−1の要素が2個並ぶ
ことがないため、図2及び図3に示すように、各乗算器
の構成を簡単にすることができると共に、内積演算時に
丸め誤差が発生することがない。
Further, for the inner product arithmetic circuit 42, the coefficients of the matrix [L] are only 0, +1 and -1, and for the inner product arithmetic circuit 44, the coefficients of the matrix [TS] are 0, +1 and-. Since only one element does not form two +1 or -1 elements in each row, the configuration of each multiplier can be simplified as shown in FIGS. 2 and 3, and a rounding error occurs during inner product calculation. There is nothing to do.

【0080】ここでは図27に示すように、8行8列の
要素x11〜x88が列順に入力されて、8行8列の要素y
11〜y88が列順に出力される場合について述べたが、こ
れ以外の順番で入出力させる場合には、並べ替え回路4
1及び46を別の適切な順番にデータを並べ替える並べ
替え回路で置き替える事により対応することができる。
Here, as shown in FIG. 27, elements x 11 to x 88 of 8 rows and 8 columns are input in the column order, and an element y of 8 rows and 8 columns is input.
The case where 11 to y 88 are output in the column order has been described, but when inputting and outputting in the other order, the rearrangement circuit 4
This can be dealt with by replacing 1 and 46 with a rearrangement circuit that rearranges data in another appropriate order.

【0081】こうして上述の装置によれば、内積演算回
路の規模を小さくし、構成を簡単にすると共に、演算回
数を減少させて高速演算を可能にすることができるもの
である。
As described above, according to the above-mentioned device, the scale of the inner product calculating circuit can be reduced, the structure can be simplified, and the number of calculations can be reduced to enable high-speed calculation.

【0082】更に図20は、本発明による逆離散コサイ
ン変換装置の一例の構成図である。この図において、入
力端子INから8行8列のデータが64ワードの第4の
並べ替え回路71を介して、4次の第4の内積演算回路
72に供給される。この内積演算回路72の出力が8次
の第5の内積演算回路73に供給される。内積演算回路
73の出力は、64ワードの第5の並べ替え回路74を
介して、4次の第6の内積演算回路75に供給される。
内積演算回路75の出力は64ワードの第6の並べ替え
回路76を介して、出力端子OUTに導出される。
Further, FIG. 20 is a block diagram of an example of the inverse discrete cosine transform device according to the present invention. In this figure, data of 8 rows and 8 columns is supplied from an input terminal IN to a fourth inner product arithmetic circuit 72 of the fourth order via a fourth rearrangement circuit 71 of 64 words. The output of the inner product calculating circuit 72 is supplied to the eighth-order fifth inner product calculating circuit 73. The output of the inner product arithmetic circuit 73 is supplied to the fourth inner product arithmetic circuit 75 of the fourth order via the fifth rearrangement circuit 74 of 64 words.
The output of the inner product calculation circuit 75 is led to the output terminal OUT via the sixth rearrangement circuit 76 of 64 words.

【0083】すなわち図20の実施例においては、ID
CTのための64行64列の定数行列〔IM〕を次の数
10式に示すような6個の行列に分解している。
That is, in the embodiment of FIG. 20, ID
A constant matrix [IM] of 64 rows and 64 columns for CT is decomposed into 6 matrices as shown in the following Expression 10.

【0084】[0084]

【数11】 〔IM〕= t〔Q〕〔L〕 t〔R〕 t〔TS〕 t〔V〕 t〔W〕/8[IM] = t [Q] [L] t [R] t [TS] t [V] t [W] / 8

【0085】行列 t〔W〕、 t〔R〕及び t〔Q〕が第
4、第5及び第6の並べ替え回路71、74及び76に
それぞれ対応すると共に、行列 t〔V〕、 t〔TS〕及
び〔L〕が第4、第5及び第6の内積演算回路72、7
3及び75にそれぞれ対応する。ここで上述の行列
〔L〕、〔TS〕及び〔V〕は、それらを形成する小行
列が何れも対角線上に配列されており、各転置行列
t〔L〕、 t〔TS〕及び t〔V〕も同様の形になるた
め、逆変換の場合にも、図1の実施例と同様の構成で対
応することができる。ちなみに〔L〕= t〔L〕であ
る。
The matrices t [W], t [R] and t [Q] respectively correspond to the fourth, fifth and sixth rearrangement circuits 71, 74 and 76, and the matrices t [V], t [V], t [V]. TS] and [L] are the fourth, fifth and sixth inner product arithmetic circuits 72, 7
3 and 75, respectively. Here, in the above-mentioned matrices [L], [TS], and [V], the small matrices forming them are all arranged on a diagonal line, and each transposed matrix
Since t [L], t [TS], and t [V] have the same shape, the same structure as that of the embodiment of FIG. By the way, [L] = t [L].

【0086】ただし、 t〔TS〕の演算を行う内積演算
回路73は、 t〔TS〕が各行の奇数列とその右隣りの
偶数列の要素のどちらか一方は少なくとも0であるか
ら、例えば図21の構成で演算を行う。
[0086] However, the inner product computation circuit 73 for performing an operation of t [TS], since t [TS] is at least 0 either the even column elements of adjacent its right an odd column of each row, for example, FIG. Calculation is performed with the configuration of 21.

【0087】図21において、60′は8次の内積演算
回路であって、図20の内積演算回路73に相当し、1
5個の単位遅延器61′1 、61′2 〜61′15が逆順
に縦続接続されて、その出力端、各接続中点及び入力端
に16個のラッチ62′1 、62′2 〜62′16がそれ
ぞれ接続され、各1対のラッチ62′1 、62′2 ;6
2′3 、62′4 ・・・62′15、62′16の出力が8
個の切換スイッチ63′1 、63′2 ・・・63′8
各1対の接点に供給される。スイッチ63′1〜63′
8 の各出力が、8個の切換スイッチ64′1 〜64′8
の各+側接点に供給されると共に、8個の補数回路6
5′1 〜65′8 を介して、スイッチ64′1 〜64′
8 の各−側接点に供給される。スイッチ64′1 〜6
4′8 の第3の接点には係数0がそれぞれ供給され、ス
イッチ64′1 〜64′8 の各出力が加算器66′に供
給される。
In FIG. 21, reference numeral 60 'denotes an eighth-order inner product arithmetic circuit, which corresponds to the inner product arithmetic circuit 73 of FIG.
Five unit delay devices 61 ′ 1 , 61 ′ 2 to 61 ′ 15 are cascade-connected in reverse order, and 16 latches 62 ′ 1 , 62 ′ 2 to 62 are provided at the output end, each connection midpoint and the input end. ′ 16 are respectively connected to each pair of latches 62 ′ 1 , 62 ′ 2 ; 6
2 '3, 62' 4, ... 62 '15, 62' 16 output is 8
The changeover switches 63 ′ 1 , 63 ′ 2, ... 63 ′ 8 are supplied to each pair of contacts. Switch 63 ' 1 to 63'
Each output of the 8, 8 of the change-over switch 64 '1-64' 8
Is supplied to each + side contact of the
5 through '1-65' 8, the switch 64 '1-64'
It is supplied to each negative side contact of 8 . Switch 64 ' 1 to 6
4 'in the third contacts 8 are supplied coefficient 0, respectively, the switch 64' 1-64 'each output of 8 adder 66' is supplied to the.

【0088】切換スイッチ64′1 〜64′8 は、補数
回路65′1 〜65′8 と共に、係数が0、+1、−1
だけの乗算器をそれぞれ構成し、スイッチ63′1 〜6
3′ 8 と共に、システム制御回路67′により互いに独
立に切り換えられる。
Changeover switch 64 '1~ 64 '8Is the complement
Circuit 65 '1~ 65 '8With the coefficients 0, +1, -1
And a switch 63 '.1~ 6
3 ' 8Together with the system control circuit 67 ',
It can be switched to vertical.

【0089】従ってこの図21において、入力端子IN
から、64ワード単位のデータ〔TS〕〔R〕〔L〕
〔Q〕〔Xc〕が供給され、それぞれ16個のデータが
16個のラッチ62′1 〜62′16に取り込まれ、16
T時間にわたって保持される。
Therefore, in FIG. 21, the input terminal IN
From 64 words in units of data [TS] [R] [L]
[Q] [Xc] is supplied, and 16 pieces of data are taken into 16 latches 62 ′ 1 to 62 ′ 16 ,
Hold for T hours.

【0090】8個のスイッチ63′1 〜63′8 は、行
列〔TS〕の16行16列の小行列の各々隣り合う要素
のどちらかが0であるかにより、0でない側に切り換え
られて、各ラッチ62′1 〜62′16に保持されたデー
タのうち8個のデータが取り出される。ただし各々隣り
合う要素が両方とも0である場合、対応する各スイッチ
63′1 〜63′8 は、どちらの側に切り換えられても
良い。
The eight switches 63 ′ 1 to 63 ′ 8 are switched to the non-zero side depending on which one of the adjacent elements of the 16 × 16 submatrix of the matrix [TS] is 0. , 8 out of the data held in each of the latches 62 ' 1 to 62' 16 . However, when the elements adjacent to each other are both 0, the corresponding switches 63 ′ 1 to 63 ′ 8 may be switched to either side.

【0091】8個のスイッチ64′1 〜64′8 は、上
記取り出された8個のデータに対応する16行16列の
小行列の要素が0、+1または−1のいずれかであるか
により、0側、+側または−側に切り換えられて、上記
取り出された8個のデータに0、+1または−1の係数
が乗算され、加算器66′で加算されて、端子OUTか
ら出力される。
The eight switches 64 ' 1 to 64' 8 depend on whether the element of the 16-row by 16-column sub-matrix corresponding to the extracted eight data is 0, +1 or -1. , 0 side, + side or − side, and the eight data thus taken out are multiplied by the coefficient of 0, +1 or −1, added by the adder 66 ′ and output from the terminal OUT. ..

【0092】また図22は、本発明による離散コサイン
変換装置において、上述の第1、第2及び第3の内積演
算回路42、44及び45をそれぞれ並列化することに
よって動作速度の高速化を図ったものである。この図に
おいて、並べ替え回路41で〔Q〕の演算を行った後、
この出力〔Q〕〔Xc〕に対して、シリアルに出力され
てくる4つのデータを1組として変換回路81でパラレ
ル化して、4入力加算回路42′1 〜42′4 に入力す
る。
Further, FIG. 22 shows a discrete cosine transform device according to the present invention in which the above-mentioned first, second and third inner product arithmetic circuits 42, 44 and 45 are respectively arranged in parallel to increase the operating speed. It is a thing. In this figure, after performing the operation of [Q] in the rearrangement circuit 41,
With respect to this output [Q] [Xc], four sets of serially output data are parallelized by the conversion circuit 81 and input to the four-input addition circuits 42 ′ 1 to 42 ′ 4 .

【0093】この4入力加算回路42′1 では〔L〕の
第1行目、第5行目、第9行目・・・第61行目を演算
し、4入力加算回路42′2 では〔L〕の第2行目、第
6行目、第10行目・・・第62行目を演算し、4入力
加算回路42′3 では〔L〕の第3行目、第7行目、第
11行目・・・第63行目を演算し、4入力加算回路4
2′4 では〔L〕の第4行目、第8行目、第12行目・
・・第64行目を演算する。
[0093] 'first row of the 1 [L], the fifth row, the ninth row ... second line 61 is calculated, 4 input adder circuit 42' This four-input adder circuit 42, 2 [ The second line, the sixth line, the tenth line ... The 62nd line of L] are calculated, and in the 4-input addition circuit 42 ′ 3 , the 3rd line, the 7th line of [L], 11th line: 4th-input addition circuit 4 by calculating the 63rd line
The fourth row of the 2 '4 [L], line 8, line 12 -
.... Calculate the 64th line.

【0094】演算〔R〕は、単なる並べ替えであるが、
それは〔L〕〔Q〕〔Xc〕の第1行目、第5行目、第
9行目・・・第61行目の16個のデータと、第2行
目、第6行目、第10行目・・・第62行目の16個の
データと、第3行目、第7行目、第11行目・・・第6
3行目の16個のデータと、第4行目、第8行目、第1
2行目・・・第64行目の16個のデータとの4つの組
に分けて、続く演算〔TS〕の4つの小行列である〔T
11〕〔TS22〕〔TS33〕〔TS44〕の演算を可能と
させる為のものである。
The operation [R] is a simple rearrangement,
It is 16 data of the 1st line, the 5th line, the 9th line ... 61st line of [L] [Q] [Xc] and the 2nd line, 6th line, 16th data in 10th line ... 62nd line, 3rd line, 7th line, 11th line ... 6th line
16 pieces of data on the 3rd line, 4th line, 8th line, 1st line
2nd line ... 4 sub-matrices of the operation [TS] divided into 4 groups with 16 data in the 64th line [T
This is for enabling the calculation of S 11 ] [TS 22 ] [TS 33 ] [TS 44 ].

【0095】従って図22の回路の場合、4入力加算回
路42′1 から〔L〕〔Q〕〔Xc〕の第1行目の値、
第5行目の値、第9行目の値・・・第61行目の値が出
力され、4入力加算回路42′2 から〔L〕〔Q〕〔X
c〕の第2行目の値、第6行目の値、第10行目の値・
・・第62行目の値が出力され、4入力加算回路42′
3 から〔L〕〔Q〕〔Xc〕の第3行目の値、第7行目
の値、第11行目の値・・・第63行目の値が出力さ
れ、4入力加算回路42′4 から〔L〕〔Q〕〔Xc〕
の第4行目の値、第8行目の値、第12行目の値・・・
第64行目の値が出力されるので、演算〔R〕を行う回
路は必要なく、そのまま4入力加算回路42′1 〜4
2′4 の出力を、それぞれ内積演算回路441 〜444
に入力させればよい。
Therefore, in the case of the circuit of FIG. 22, the values of the first row of [L] [Q] [Xc] from the 4-input adding circuit 42 ' 1
The value of the fifth line, the value of the ninth line ... The value of the 61st line is output, and the 4-input adder circuit 42 ′ 2 outputs [L] [Q] [X.
c] second row value, sixth row value, tenth row value
..Values in the 62nd row are output and 4-input addition circuit 42 '
The values of 3 to [L] [Q] [Xc] on the third line, the value on the seventh line, the value on the eleventh line ... The value on the 63rd line are output, and the 4-input addition circuit 42 is output. ' 4 to [L] [Q] [Xc]
The value of the 4th line, the value of the 8th line, the value of the 12th line ...
Since the value on the 64th line is output, a circuit for performing the operation [R] is not necessary, and the 4-input addition circuits 42 ' 1 to 4'
The output of the 2 '4, respectively inner product computation circuits 44 1 to 44 4
You can input to.

【0096】すなわち内積演算回路441 では〔L〕
〔Q〕〔Xc〕の第1行目の値、第5行目の値、第9行
目の値・・・第61行目の値を使用して、〔TS11〕の
演算を行う。内積演算回路442 、443 、444 でも
同様にして、それぞれ〔TS22〕〔TS33〕〔TS44
の演算を行う。
That is, in the inner product calculation circuit 44 1 , [L]
The value of [Q] [Xc] on the first line, the value on the fifth line, the value on the ninth line ... The value on the 61st line is used to calculate [TS 11 ]. Similarly, the inner product arithmetic circuits 44 2 , 44 3 , and 44 4 respectively perform [TS 22 ] [TS 33 ] [TS 44 ].
Is calculated.

【0097】さらに内積演算回路441 の出力を内積演
算回路451 に入力する事で、内積演算回路451 では
〔V11〕の演算を行う。内積演算回路452 、453
45 4 でも同様にして、それぞれ〔V22〕〔V33〕〔V
44〕の演算を行う。
Further, the inner product calculating circuit 441Inner product output
Arithmetic circuit 451Input to the inner product arithmetic circuit 451Then
[V11] Is performed. Inner product calculation circuit 452, 453,
45 FourBut in the same way, [Vtwenty two] [V33] [V
44] Is performed.

【0098】かくして、内積演算回路451 〜454
出力からは〔V〕〔TS〕〔R〕〔L〕〔Q〕〔Xc〕
が出力されるので、これを変換回路82でシリアル化し
て、そして最後に〔W〕を並べ替え回路46で行えば、
出力〔Yc〕が求まる。
Thus, from the outputs of the inner product arithmetic circuits 45 1 to 45 4 , [V] [TS] [R] [L] [Q] [Xc].
Is output, so if this is serialized by the conversion circuit 82 and finally [W] is performed by the rearrangement circuit 46,
The output [Yc] is obtained.

【0099】さらに図23は、本発明による逆離散コサ
イン変換装置において、上述の第4、第5及び第6の内
積演算回路72、73及び75をそれぞれ並列化するこ
とによって動作速度の高速化を図ったものである。この
図において、並べ替え回路71で t〔W〕の演算を行っ
た後、この出力 t〔W〕〔Yc〕に対して、シリアルに
出力されてくる4つのデータを1組として変換回路91
でパラレル化して、内積演算回路721 〜724 に入力
する。
Further, FIG. 23 shows that in the inverse discrete cosine transform device according to the present invention, the fourth, fifth and sixth inner product arithmetic circuits 72, 73 and 75 are parallelized to increase the operating speed. It is intended. In this figure, after the calculation of t [W] is performed by the rearrangement circuit 71, four data that are serially output for this output t [W] [Yc] are set as one set and the conversion circuit 91 is set.
In and parallelized, and inputs to the inner product computation circuit 72 1 to 72 4.

【0100】この内積演算回路721 〜724 では
t〔V11〕〜 t〔V44〕の演算を行う。この内積演算回
路721 〜724 の出力を、それぞれ内積演算回路73
1 〜73 4 に入力する。この内積演算回路731 〜73
4 では t〔TS11〕〜 t〔TS44〕の演算を行う。
This inner product calculation circuit 721~ 72FourThen
t[V11] ~t[V44] Is performed. This inner product operation time
Road 721~ 72FourOutput of the inner product calculation circuit 73
1~ 73 FourTo enter. This inner product calculation circuit 731~ 73
FourThent[TS11] ~t[TS44] Is performed.

【0101】この内積演算回路731 〜734 の出力
を、そのまま4入力加算回路75′1〜75′4 に入力
させる。この4入力加算回路75′1 〜75′4 では
〔L11〕〜〔L44〕の演算を行う。かくして、4入力加
算回路75′1 〜75′4 の出力からは〔L〕 t〔R〕
t〔TS〕 t〔V〕 t〔W〕〔Yc〕が出力されるの
で、これを変換回路92でシリアル化して、そして最後
t〔Q〕を並べ替え回路76で行えば、出力〔Xc〕
が求まる。
The outputs of the inner product arithmetic circuits 73 1 to 73 4 are input to the 4-input adder circuits 75 ' 1 to 75' 4 as they are. In the 4-input adder circuit 75 '1-75' 4 performs calculation of [L 11] - [L 44]. Thus, from the output of 4-input adder circuit 75 '1-75' 4 [L] t [R]
Since t [TS] t [V] t [W] [Yc] is output, if this is serialized by the conversion circuit 92, and finally t [Q] is performed by the rearrangement circuit 76, the output [Xc ]
Is required.

【0102】[0102]

【発明の効果】以上詳述のように、この発明によれば、
所要の定数行列を複数の疎行列に分解して、一方の疎行
列の要素を0、+1及び−1とすると共に、他方の低次
の疎行列の要素を定数行列のデータ成分とするようにし
たので、内積演算回路の回路規模が小さく、構成が簡単
になると共に、演算回数が低減して演算速度が向上した
離散コサイン変換装置及び逆離散コサイン変換装置が得
られる。
As described above in detail, according to the present invention,
The required constant matrix is decomposed into a plurality of sparse matrices, and the elements of one sparse matrix are 0, +1 and -1, and the elements of the other low-order sparse matrix are the data components of the constant matrix. Therefore, the circuit scale of the inner product arithmetic circuit is small, the configuration is simple, and the discrete cosine transform device and the inverse discrete cosine transform device in which the number of calculations is reduced and the calculation speed is improved can be obtained.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明による離散コサイン変換装置の一例の構
成図である。
FIG. 1 is a configuration diagram of an example of a discrete cosine transform device according to the present invention.

【図2】その要部の構成を示すブロック図である。FIG. 2 is a block diagram showing a configuration of a main part thereof.

【図3】その要部の構成を示すブロック図である。FIG. 3 is a block diagram showing a configuration of a main part thereof.

【図4】その要部の動作を説明するための行列を示す図
である。
FIG. 4 is a diagram showing a matrix for explaining the operation of the main part thereof.

【図5】その要部の動作を説明するための行列を示す図
である。
FIG. 5 is a diagram showing a matrix for explaining the operation of the main part thereof.

【図6】その要部の動作を説明するための行列を示す図
である。
FIG. 6 is a diagram showing a matrix for explaining the operation of the main part.

【図7】その要部の動作を説明するための行列を示す図
である。
FIG. 7 is a diagram showing a matrix for explaining the operation of the main part.

【図8】その要部の動作を説明するための行列を示す図
である。
FIG. 8 is a diagram showing a matrix for explaining the operation of the main part thereof.

【図9】その要部の動作を説明するための行列を示す図
である。
FIG. 9 is a diagram showing a matrix for explaining the operation of the main part.

【図10】その要部の動作を説明するための行列を示す
図である。
FIG. 10 is a diagram showing a matrix for explaining the operation of the main part.

【図11】その要部の動作を説明するための行列を示す
図である。
FIG. 11 is a diagram showing a matrix for explaining the operation of the main part.

【図12】その要部の動作を説明するための行列を示す
図である。
FIG. 12 is a diagram showing a matrix for explaining the operation of the main part.

【図13】その要部の動作を説明するための行列を示す
図である。
FIG. 13 is a diagram showing a matrix for explaining the operation of the main part.

【図14】その要部の動作を説明するための行列を示す
図である。
FIG. 14 is a diagram showing a matrix for explaining the operation of the main part.

【図15】その要部の動作を説明するための行列を示す
図である。
FIG. 15 is a diagram showing a matrix for explaining the operation of the main part.

【図16】その要部の動作を説明するための行列を示す
図である。
FIG. 16 is a diagram showing a matrix for explaining the operation of the main part.

【図17】その要部の動作を説明するための行列を示す
図である。
FIG. 17 is a diagram showing a matrix for explaining the operation of the main part.

【図18】その要部の動作を説明するための行列を示す
図である。
FIG. 18 is a diagram showing a matrix for explaining the operation of the main part.

【図19】その要部の動作を説明するための行列を示す
図である。
FIG. 19 is a diagram showing a matrix for explaining the operation of the main part.

【図20】本発明による逆離散コサイン変換装置の一例
の構成図である。
FIG. 20 is a configuration diagram of an example of an inverse discrete cosine transform device according to the present invention.

【図21】その要部の構成を示すブロック図である。FIG. 21 is a block diagram showing a configuration of a main part thereof.

【図22】本発明による離散コサイン変換装置の他の例
の構成図である。
FIG. 22 is a configuration diagram of another example of the discrete cosine transform device according to the present invention.

【図23】本発明による逆離散コサイン変換装置の他の
例の構成図である。
FIG. 23 is a configuration diagram of another example of the inverse discrete cosine transform device according to the present invention.

【図24】従来の装置の構成を示すブロック図である。FIG. 24 is a block diagram showing a configuration of a conventional device.

【図25】従来例の装置の動作を説明するためのタイム
チャート図である。
FIG. 25 is a time chart diagram for explaining the operation of the conventional device.

【図26】この発明の説明のための図である。FIG. 26 is a diagram for explaining the present invention.

【図27】この発明の説明のための図である。FIG. 27 is a diagram for explaining the present invention.

【符号の説明】[Explanation of symbols]

41 第1の並べ替え回路 42 係数が+1及び−1である4次の第1の内積演算
回路 43 第2の並べ替え回路 44 係数が0、+1及び−1である8次の第2の内積
演算回路 45 定数行列のデータ成分が格納されたメモリを含む
第3の内積演算回路 46 第3の並べ替え回路
41 1st rearrangement circuit 42 4th order inner product arithmetic circuit whose coefficients are +1 and -1 43 2nd rearrangement circuit 44 8th order 2nd inner product whose coefficients are 0, +1 and -1 Arithmetic circuit 45 Third inner product arithmetic circuit including memory storing data components of constant matrix 46 Third rearrangement circuit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 行列の内積を演算する内積演算回路と、
行列のデータ成分を所定の順序に並べ替える並べ替え回
路とを備える離散コサイン変換装置において、 係数が+1及び−1である4次の第1の内積演算回路
と、 係数が0、+1及び−1である8次の第2の内積演算回
路と、 定数行列のデータ成分が格納されたメモリを含む第3の
内積演算回路とを設け、 8行8列の入力データを第1の並べ替え回路を介して上
記第1の内積演算回路に供給し、 上記第1の内積演算回路の出力を第2の並べ替え回路を
介して上記第2の内積演算回路に供給し、 上記第2の内積演算回路の出力を直接に上記第3の内積
演算回路に供給すると共に、 上記第3の内積演算回路の出力を第3の並べ替え回路を
介して導出するようにしたことを特徴とする離散コサイ
ン変換装置。
1. An inner product calculation circuit for calculating an inner product of a matrix,
In a discrete cosine transform device including a rearrangement circuit for rearranging data components of a matrix in a predetermined order, a fourth-order first inner product arithmetic circuit having coefficients of +1 and -1, and a coefficient of 0, +1 and -1 The second inner product arithmetic circuit of the 8th order and the third inner product arithmetic circuit including the memory in which the data components of the constant matrix are stored are provided, and the input data of 8 rows and 8 columns is converted into the first rearrangement circuit. To the first inner product arithmetic circuit, and to supply the output of the first inner product arithmetic circuit to the second inner product arithmetic circuit via the second rearrangement circuit. Is directly supplied to the third inner product arithmetic circuit and the output of the third inner product arithmetic circuit is derived via a third rearrangement circuit. ..
【請求項2】 行列の内積を演算する内積演算回路と、
行列のデータ成分を所定の順序に並べ替える並べ替え回
路とを備える逆離散コサイン変換装置において、 定数行列のデータ成分が格納されたメモリを含む第4の
内積演算回路と、 係数が0、+1及び−1である8次の第5の内積演算回
路と、 係数が+1及び−1である4次の第6の内積演算回路と
を設け、 8行8列の入力データを第4の並べ替え回路を介して上
記第4の内積演算回路に供給し、 上記第4の内積演算回路の出力を直接に上記第5の内積
演算回路に供給し、 上記第5の内積演算回路の出力を第5の並べ替え回路を
介して上記第6の内積演算回路に供給すると共に、 上記第6の内積演算回路の出力を第6の並べ替え回路を
介して導出するようにしたことを特徴とする逆離散コサ
イン変換装置。
2. An inner product calculating circuit for calculating an inner product of a matrix,
In an inverse discrete cosine transform device including a rearrangement circuit for rearranging data components of a matrix in a predetermined order, a fourth inner product arithmetic circuit including a memory in which data components of a constant matrix are stored, and coefficients of 0, +1 and An eighth-order fifth inner product arithmetic circuit which is −1 and a fourth-order sixth inner product arithmetic circuit whose coefficients are +1 and −1 are provided, and the input data of 8 rows and 8 columns is fourth sorted circuit. To the fourth inner product arithmetic circuit, the output of the fourth inner product arithmetic circuit is directly supplied to the fifth inner product arithmetic circuit, and the output of the fifth inner product arithmetic circuit is supplied to the fifth inner product arithmetic circuit. The inverse discrete cosine is characterized in that the sixth inner product arithmetic circuit is supplied through the rearrangement circuit and the output of the sixth inner product arithmetic circuit is derived through the sixth rearrangement circuit. Converter.
【請求項3】 行列の内積を演算する内積演算回路と、
行列のデータ成分を所定の順序に並べ替える並べ替え回
路とを備える離散コサイン変換装置において、 シリアルに供給される行列データを所定個毎に並列化す
る並列化回路と、 係数が+1及び−1である4次の第1の内積演算回路
と、 係数が0、+1及び−1である8次の第2の内積演算回
路と、 定数行列のデータ成分が格納されたメモリを含む第3の
内積演算回路とを設け、 上記第1、第2、第3の内積演算回路をそれぞれ上記所
定個並列に配し、 8行8列の入力データを第1の並べ替え回路を介して上
記並列化回路に供給し、 上記並列化回路から出力された並列データの各データを
上記所定個のそれぞれの第1の内積演算回路に供給し、 上記各第1の内積演算回路の出力を直接に上記所定個の
内の対応する上記第2の内積演算回路に供給し、 上記各第2の内積演算回路の出力を直接に上記所定個の
内の対応する上記第3の内積演算回路に供給すると共
に、 上記所定個の第3の内積演算回路の出力をシリアルデー
タに変換した後第3の並べ替え回路を介して導出するよ
うにしたことを特徴とする離散コサイン変換装置。
3. An inner product calculating circuit for calculating an inner product of a matrix,
In a discrete cosine transform device including a rearrangement circuit that rearranges the data components of a matrix in a predetermined order, a parallelization circuit that parallelizes matrix data that is serially supplied for each predetermined number, and a coefficient of +1 and -1 A certain fourth-order inner product arithmetic circuit, an eighth-order second inner product arithmetic circuit whose coefficients are 0, +1 and -1, and a third inner-product arithmetic operation including a memory in which data components of a constant matrix are stored. A circuit, and the predetermined number of the first, second, and third inner product arithmetic circuits are arranged in parallel, and input data of 8 rows and 8 columns is input to the parallelization circuit through the first rearrangement circuit. Each data of the parallel data supplied and output from the parallelization circuit is supplied to each of the predetermined number of the first inner product arithmetic circuits, and the output of each of the first inner product arithmetic circuits is directly input to the predetermined number of the predetermined inner product arithmetic circuits. Corresponding to the second inner product arithmetic circuit in The output of each of the second inner product arithmetic circuits is directly supplied to the corresponding third inner product arithmetic circuit of the predetermined number, and the output of the predetermined third inner product arithmetic circuits is serialized. A discrete cosine transform device characterized in that it is converted into data and then derived through a third rearrangement circuit.
【請求項4】 行列の内積を演算する内積演算回路と、
行列のデータ成分を所定の順序に並べ替える並べ替え回
路とを備える逆離散コサイン変換装置において、 シリアルに供給される行列データを所定個毎に並列化す
る並列化回路と、 定数行列のデータ成分が格納されたメモリを含む第4の
内積演算回路と、 係数が0、+1及び−1である8次の第5の内積演算回
路と、 係数が+1及び−1である4次の第6の内積演算回路と
を設け、 上記第4、第5、第6の内積演算回路をそれぞれ上記所
定個並列に配し、 8行8列の入力データを第4の並べ替え回路を介して上
記並列化回路に供給し、 上記並列化回路から出力された並列データの各データを
上記所定個の内の対応する上記第4の内積演算回路に供
給し、 上記各第4の内積演算回路の出力を直接に上記所定個の
内の対応する上記第5の内積演算回路に供給し、 上記各第5の内積演算回路の出力を直接に上記所定個の
内の対応する上記第6の内積演算回路に供給すると共
に、 上記所定個の第6の内積演算回路の出力をシリアルデー
タに変換した後第6の並べ替え回路を介して導出するよ
うにしたことを特徴とする逆離散コサイン変換装置。
4. An inner product calculating circuit for calculating an inner product of a matrix,
In an inverse discrete cosine transform device including a rearrangement circuit that rearranges the matrix data components in a predetermined order, a parallelization circuit that parallelizes the matrix data that is serially supplied for each predetermined number, and a constant matrix data component A fourth inner product arithmetic circuit including a stored memory; an eighth-order fifth inner product arithmetic circuit whose coefficients are 0, +1 and -1; and a fourth-order sixth inner product arithmetic coefficient whose coefficients are +1 and -1 An arithmetic circuit, the fourth, fifth, and sixth inner product arithmetic circuits are arranged in parallel, and the input data of 8 rows and 8 columns is input to the parallelizing circuit via a fourth rearrangement circuit. And each data of the parallel data output from the parallelization circuit is supplied to the corresponding fourth inner product calculation circuit in the predetermined number, and the output of each fourth inner product calculation circuit is directly output. The fifth inner product corresponding to the predetermined number To the corresponding sixth inner product arithmetic circuit among the predetermined number, and at the same time to supply the output of each of the fifth inner product arithmetic circuits to the corresponding sixth inner product arithmetic circuit. An inverse discrete cosine transform device characterized in that the output is converted into serial data and then derived through a sixth rearrangement circuit.
JP19111392A 1992-02-21 1992-07-17 Discrete cosine transformer device and inverse discrete cosine transformer device Pending JPH05300026A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US08/020,313 US5410500A (en) 1992-02-21 1993-02-19 Discrete cosine transform apparatus and inverse discrete cosine transform apparatus
EP93400437A EP0557204A3 (en) 1992-02-21 1993-02-19 Discrete cosine transform apparatus and inverse discrete cosine transform apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP4-35149 1992-02-21
JP3514992 1992-02-21

Publications (1)

Publication Number Publication Date
JPH05300026A true JPH05300026A (en) 1993-11-12

Family

ID=12433848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19111392A Pending JPH05300026A (en) 1992-02-21 1992-07-17 Discrete cosine transformer device and inverse discrete cosine transformer device

Country Status (1)

Country Link
JP (1) JPH05300026A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761464A (en) * 2021-08-25 2021-12-07 安谋科技(中国)有限公司 Data processing method, medium, and electronic device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761464A (en) * 2021-08-25 2021-12-07 安谋科技(中国)有限公司 Data processing method, medium, and electronic device

Similar Documents

Publication Publication Date Title
US4791598A (en) Two-dimensional discrete cosine transform processor
JP2646778B2 (en) Digital signal processor
US5361220A (en) Discrete cosine transformation with reduced components
KR100233555B1 (en) 2-d discrete cosine transform circuit with reduced number of multipliers
JP2962970B2 (en) Method and apparatus for converting frequency to time domain
TWI570573B (en) Circuit for matrix transpose
JPH08235159A (en) Inverse cosine transformation device
EP0286184B1 (en) One-dimensional linear picture transformer
AU9030298A (en) Variable block size 2-dimensional inverse discrete cosine transform engine
US5291429A (en) Circuit for matrix calculation of discrete cosine transformation
CN114007079A (en) Conversion circuit, method, device and encoder
JP3185211B2 (en) Matrix data multiplier
JPH05300026A (en) Discrete cosine transformer device and inverse discrete cosine transformer device
JPH07234864A (en) Orthogonal transformation device
JPH04330828A (en) Discrete cosine conversion circuit, and inverse conversion circuit for discrete cosine conversion
JPH0540776A (en) Two-dimensional dct matrix operation circuit
JP3046115B2 (en) Discrete cosine transformer
JP3547567B2 (en) Discrete cosine transformer
JP3575991B2 (en) Orthogonal transform circuit
JP3046116B2 (en) Discrete cosine transformer
KR100575285B1 (en) Low power, high speed DCT device and method thereof
KR100306745B1 (en) Half-Band Sub-Band DC / ID Circuits Using LACs and Methods
JP3697716B2 (en) Matrix data multiplier
JP2001256218A (en) Matrix data multiplying device
JP2001249799A (en) Matrix data multiplier