JPH0883264A - 1次元シストリックアレイ型演算器とそれを用いたdct/idct演算装置 - Google Patents
1次元シストリックアレイ型演算器とそれを用いたdct/idct演算装置Info
- Publication number
- JPH0883264A JPH0883264A JP6242385A JP24238594A JPH0883264A JP H0883264 A JPH0883264 A JP H0883264A JP 6242385 A JP6242385 A JP 6242385A JP 24238594 A JP24238594 A JP 24238594A JP H0883264 A JPH0883264 A JP H0883264A
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic
- dct
- signal
- arithmetic unit
- systolic array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Complex Calculations (AREA)
Abstract
(57)【要約】
【目的】 演算器の並び構造を規則的にし、レイウア
トを容易にする。 【構成】 乗数と被乗数を入力して桁上げ信号と和信
号を出す乗算器10、その乗算器10の両出力信号と前
段からの桁上げ信号と和信号とを加算して桁上げ信号と
和信号を出す加算器11、その加算器11の両出力信号
を1サイクルの間保持するレジスタ12からなる演算器
6〜9を、1次元のアレイ状に接続して、終段の演算器
9の両出力を加算する。
トを容易にする。 【構成】 乗数と被乗数を入力して桁上げ信号と和信
号を出す乗算器10、その乗算器10の両出力信号と前
段からの桁上げ信号と和信号とを加算して桁上げ信号と
和信号を出す加算器11、その加算器11の両出力信号
を1サイクルの間保持するレジスタ12からなる演算器
6〜9を、1次元のアレイ状に接続して、終段の演算器
9の両出力を加算する。
Description
【0001】
【産業上の利用分野】本発明は、1次元シストリックア
レイ型演算器、それを用いたDCT(Discrete Cosine
Transform )演算装置、およびその逆変換を行なうID
CT(Inverse Discrete Cosine Transform )演算装置
に関するものである。
レイ型演算器、それを用いたDCT(Discrete Cosine
Transform )演算装置、およびその逆変換を行なうID
CT(Inverse Discrete Cosine Transform )演算装置
に関するものである。
【0002】
【従来の技術】高速演算アルゴリズムを用いた8点DC
Tと8点IDCTの式をそれぞれ図6と図7に示す。こ
こで、Xi (i=0、1、2、・・・、7)は原信号、
Yj (j=0、1、2、・・・、7)はDCT係数、a
0 0〜a3 3、b0 0〜b3 3はDCT用の係数、c0 0〜c3 3、
d0 0〜d3 3はIDCT用の係数である。
Tと8点IDCTの式をそれぞれ図6と図7に示す。こ
こで、Xi (i=0、1、2、・・・、7)は原信号、
Yj (j=0、1、2、・・・、7)はDCT係数、a
0 0〜a3 3、b0 0〜b3 3はDCT用の係数、c0 0〜c3 3、
d0 0〜d3 3はIDCT用の係数である。
【0003】図8は図6、図7に示した演算を実行する
装置の従来例のブロック図である。この図8に示す装置
において、DCT係数Y0 を計算する場合を例として説
明する。図8に示した装置は、4個の乗算器1により4
個の信号X0 +X7 、X1 +X6 、X2 +X5 、X3 +
X4 と4個の係数a0 0、a0 1、a0 2、a0 3を同時に乗算
して計8個の桁上げ信号と和信号を出力し、その結果を
レジスタ2でラッチして1サイクル遅延させ後、Wallac
e トリー形桁上げ保存加算器3で加算し、桁上げ信号と
和信号とを出力する。その結果をレジスタ4でラッチし
て1サイクル遅延させた後、2入力1出力加算器5で加
算し、DCT係数Y0 を得る。
装置の従来例のブロック図である。この図8に示す装置
において、DCT係数Y0 を計算する場合を例として説
明する。図8に示した装置は、4個の乗算器1により4
個の信号X0 +X7 、X1 +X6 、X2 +X5 、X3 +
X4 と4個の係数a0 0、a0 1、a0 2、a0 3を同時に乗算
して計8個の桁上げ信号と和信号を出力し、その結果を
レジスタ2でラッチして1サイクル遅延させ後、Wallac
e トリー形桁上げ保存加算器3で加算し、桁上げ信号と
和信号とを出力する。その結果をレジスタ4でラッチし
て1サイクル遅延させた後、2入力1出力加算器5で加
算し、DCT係数Y0 を得る。
【0004】すなわち、図8に示した装置は、4個の信
号と4個の係数を同時に乗算する積和演算器であり、図
示したように、DCTを実行するときは1個のDCT係
数を計算するのに必要な4個の原信号と4個のDCT用
係数が同時に入力される。また、同様にIDCTを実行
するときは、X0 +X7 やX0 −X7 を計算するのに必
要な4個のDCT係数と4個のIDCT用係数が同時に
入力される。なお、図8中で破線の矢印は桁上げ信号、
実線の矢印は和信号の経路を示す。以下の説明する図に
おいても同じである。
号と4個の係数を同時に乗算する積和演算器であり、図
示したように、DCTを実行するときは1個のDCT係
数を計算するのに必要な4個の原信号と4個のDCT用
係数が同時に入力される。また、同様にIDCTを実行
するときは、X0 +X7 やX0 −X7 を計算するのに必
要な4個のDCT係数と4個のIDCT用係数が同時に
入力される。なお、図8中で破線の矢印は桁上げ信号、
実線の矢印は和信号の経路を示す。以下の説明する図に
おいても同じである。
【0005】上記したDCT/IDCT演算装置に関す
る技術については、たとえば、P.A.Ruetz, P.Tong, D.B
ailey, D.A.Luthi, P.H.Ang, "A High-Performance Ful
l-Motion Video Compression Chip Set", IEEE Trans.C
ircuits Syst.for Video Technol., vol.2, no.2, pp.1
11-122, June 1992.に記載されている。
る技術については、たとえば、P.A.Ruetz, P.Tong, D.B
ailey, D.A.Luthi, P.H.Ang, "A High-Performance Ful
l-Motion Video Compression Chip Set", IEEE Trans.C
ircuits Syst.for Video Technol., vol.2, no.2, pp.1
11-122, June 1992.に記載されている。
【0006】
【発明が解決しようとする課題】ところが、この図8に
示す従来の装置においては、4個の乗算器1の出力の加
算にWallace トリー形桁上げ保存加算器3を用いるた
め、構造が複雑となるという問題がある。このため、図
8に示した装置をLSIに集積する場合、レイアウトが
困難となり、面積が増加し易い。
示す従来の装置においては、4個の乗算器1の出力の加
算にWallace トリー形桁上げ保存加算器3を用いるた
め、構造が複雑となるという問題がある。このため、図
8に示した装置をLSIに集積する場合、レイアウトが
困難となり、面積が増加し易い。
【0007】本発明は上記した問題点に鑑みてなされた
ものであって、その目的は、演算器間の構造を規則的に
し、レイアウトを容易に行なえるようにすることであ
る。
ものであって、その目的は、演算器間の構造を規則的に
し、レイアウトを容易に行なえるようにすることであ
る。
【0008】
【課題を解決するための手段】第1の発明は、同一の演
算機能を有する複数の演算手段を1次元のアレイ状に接
続した1次元シストリックアレイ型演算器において、上
記各演算手段が、乗数と被乗数に対して桁上げ保存形の
乗算を行なう機能と、該乗算結果である桁上げ信号と和
信号と前段の演算手段から入力される桁上げ信号と和信
号との4つの信号に対して桁上げ保存形の加算を行なう
機能と、該加算結果である桁上げ信号と和信号を1サイ
クルの間保持して遅延させ次段に出力させる機能とを有
するよう構成した。
算機能を有する複数の演算手段を1次元のアレイ状に接
続した1次元シストリックアレイ型演算器において、上
記各演算手段が、乗数と被乗数に対して桁上げ保存形の
乗算を行なう機能と、該乗算結果である桁上げ信号と和
信号と前段の演算手段から入力される桁上げ信号と和信
号との4つの信号に対して桁上げ保存形の加算を行なう
機能と、該加算結果である桁上げ信号と和信号を1サイ
クルの間保持して遅延させ次段に出力させる機能とを有
するよう構成した。
【0009】第2の発明は、n点DCT演算を行なう装
置(nは2のべき乗)において、n点DCT演算の対象
となるn個の原信号X0 、X1 、X2 、・・・・、Xn-
2 、Xn- 1 からX0 +Xn- 1 、X0 −Xn- 1 、X1 +X
n- 2 、X1 −Xn- 2 、X2 +Xn- 3 、X2 −Xn- 3 、・
・・・・、Xn/2- 1 +Xn/ 2 、Xn/2- 1 −Xn/ 2 を計算
する手段と、前記手段により計算された結果をX0 +X
n- 1 とX0 −Xn- 1 、X1 +Xn- 2 とX1 −Xn- 2 、X
2 +Xn- 3 とX2 −Xn- 3 、・・・・・、Xn/ 2- 1 +X
n/ 2 とXn/2- 1 −Xn/ 2 の2個1組にして記憶する手段
と、該記憶された各組から並列に片方を読み出し、前記
第1の発明の1次元シストリックアレイ型演算器に送る
手段と、DCT演算用の係数を前記第1の発明の1次元
シストリックアレイ型演算器に与える手段とを有するよ
う構成した。
置(nは2のべき乗)において、n点DCT演算の対象
となるn個の原信号X0 、X1 、X2 、・・・・、Xn-
2 、Xn- 1 からX0 +Xn- 1 、X0 −Xn- 1 、X1 +X
n- 2 、X1 −Xn- 2 、X2 +Xn- 3 、X2 −Xn- 3 、・
・・・・、Xn/2- 1 +Xn/ 2 、Xn/2- 1 −Xn/ 2 を計算
する手段と、前記手段により計算された結果をX0 +X
n- 1 とX0 −Xn- 1 、X1 +Xn- 2 とX1 −Xn- 2 、X
2 +Xn- 3 とX2 −Xn- 3 、・・・・・、Xn/ 2- 1 +X
n/ 2 とXn/2- 1 −Xn/ 2 の2個1組にして記憶する手段
と、該記憶された各組から並列に片方を読み出し、前記
第1の発明の1次元シストリックアレイ型演算器に送る
手段と、DCT演算用の係数を前記第1の発明の1次元
シストリックアレイ型演算器に与える手段とを有するよ
う構成した。
【0010】第3の発明は、n点IDCT演算を行なう
装置(nは2のべき乗)において、n点IDCT演算の
対象となるn個のDCT係数Y0 、Y1 、Y3 、・・・
・、Yn- 2 、Yn- 1 をY0 とY1 、Y2 とY3 、Y4 と
Y5 、・・・・、Yn- 2 とYn- 1 の2個1組にして記憶
する手段と、該記憶された各組から並列に片方を読み出
し、前記第1の発明の1次元シストリックアレイ型演算
器に送る手段と、IDCT演算用の係数を前記第1の発
明の1次元シストリックアレイ型演算器に与える手段
と、前記第1の発明の1次元シストリックアレイ型演算
器から出力される桁上げ信号と和信号を加算する手段
と、その結果得られるX0 +Xn- 1 、X0 −Xn- 1 、X
1 +Xn- 2 、X1 −Xn- 2 、X2 +Xn- 3 、X2 −Xn-
3 、・・・・・・・、Xn/2- 1 +Xn/ 2 、Xn/2- 1 −X
n/ 2 から原信号X0 、Xn- 1 、X1 、Xn- 2 、X2 、X
n- 3 、・・・・・・、Xn/2- 1 、Xn/ 2 を計算する手段
とを有するよう構成した。
装置(nは2のべき乗)において、n点IDCT演算の
対象となるn個のDCT係数Y0 、Y1 、Y3 、・・・
・、Yn- 2 、Yn- 1 をY0 とY1 、Y2 とY3 、Y4 と
Y5 、・・・・、Yn- 2 とYn- 1 の2個1組にして記憶
する手段と、該記憶された各組から並列に片方を読み出
し、前記第1の発明の1次元シストリックアレイ型演算
器に送る手段と、IDCT演算用の係数を前記第1の発
明の1次元シストリックアレイ型演算器に与える手段
と、前記第1の発明の1次元シストリックアレイ型演算
器から出力される桁上げ信号と和信号を加算する手段
と、その結果得られるX0 +Xn- 1 、X0 −Xn- 1 、X
1 +Xn- 2 、X1 −Xn- 2 、X2 +Xn- 3 、X2 −Xn-
3 、・・・・・・・、Xn/2- 1 +Xn/ 2 、Xn/2- 1 −X
n/ 2 から原信号X0 、Xn- 1 、X1 、Xn- 2 、X2 、X
n- 3 、・・・・・・、Xn/2- 1 、Xn/ 2 を計算する手段
とを有するよう構成した。
【0011】
【作用】本発明によれば、乗算器から出力される桁上げ
信号と和信号を、1サイクルづつ遅延させながらパイプ
ラインで順次加算することができるため、演算器間の構
造が規則的になり、LSIに集積する場合、レイアウト
が容易となり、低面積化を図ることができる。
信号と和信号を、1サイクルづつ遅延させながらパイプ
ラインで順次加算することができるため、演算器間の構
造が規則的になり、LSIに集積する場合、レイアウト
が容易となり、低面積化を図ることができる。
【0012】
【実施例】以下、本発明の実施例について説明する。図
1は本発明の一実施例の1次元シストリックアレイ型演
算器の構成を示すブロック図である。この図1に示した
装置は、桁上げ保存形の乗算を行なう乗算器10と、こ
の乗算器10の出力である桁上げ信号と和信号と前段の
演算器から入力される桁上げ信号と和信号との4つの信
号に対して桁上げ保存形の加算を行なう加算器11と、
この加算器11の出力である桁上げ信号と和信号を1サ
イクルの間保持して遅延させ次段に出力するレジスタ1
2とを含む演算器6〜9を直列に接続し、終段の演算器
9の出力である桁上げ信号と和信号を2入力1出力の加
算器13で加算し、最終結果を得る構造である。ただ
し、図1に示したように最初の演算器6においては前段
の演算器からの入力がないので、加算器11は削除でき
る。
1は本発明の一実施例の1次元シストリックアレイ型演
算器の構成を示すブロック図である。この図1に示した
装置は、桁上げ保存形の乗算を行なう乗算器10と、こ
の乗算器10の出力である桁上げ信号と和信号と前段の
演算器から入力される桁上げ信号と和信号との4つの信
号に対して桁上げ保存形の加算を行なう加算器11と、
この加算器11の出力である桁上げ信号と和信号を1サ
イクルの間保持して遅延させ次段に出力するレジスタ1
2とを含む演算器6〜9を直列に接続し、終段の演算器
9の出力である桁上げ信号と和信号を2入力1出力の加
算器13で加算し、最終結果を得る構造である。ただ
し、図1に示したように最初の演算器6においては前段
の演算器からの入力がないので、加算器11は削除でき
る。
【0013】次に、この図1に示す1次元シストリック
アレイ型演算器14の動作をDCT係数Y0 を計算する
場合を例として説明する。最初の演算器6における乗算
器10で第1の信号X0 +X7 と第1の係数a0 0を乗算
して桁上げ信号と和信号を出力し、その結果をレジスタ
12で1サイクル遅延させてから、2番目の演算器7に
送る。
アレイ型演算器14の動作をDCT係数Y0 を計算する
場合を例として説明する。最初の演算器6における乗算
器10で第1の信号X0 +X7 と第1の係数a0 0を乗算
して桁上げ信号と和信号を出力し、その結果をレジスタ
12で1サイクル遅延させてから、2番目の演算器7に
送る。
【0014】この2番目の演算器7は、最初の演算器6
より1サイクル遅れて第2の信号X1 +X6 と第1の係
数a0 1を乗算器10で乗算してその結果と最初の演算器
6の出力を加算器11で加算し、桁上げ信号と和信号を
出力し、これをレジスタ12で1サイクル遅延させてか
ら3番目の演算器8に送る。
より1サイクル遅れて第2の信号X1 +X6 と第1の係
数a0 1を乗算器10で乗算してその結果と最初の演算器
6の出力を加算器11で加算し、桁上げ信号と和信号を
出力し、これをレジスタ12で1サイクル遅延させてか
ら3番目の演算器8に送る。
【0015】この3番目の演算器8は、2番目の演算器
7より1サイクル遅れて第3の信号X2 +X5 と第1の
係数a0 2を乗算器10で乗算してその結果と2番目の演
算器7の出力を加算器11で加算し、桁上げ信号と和信
号を出力し、これをレジスタ12で1サイクル遅延させ
てから4番目の演算器9に送る。
7より1サイクル遅れて第3の信号X2 +X5 と第1の
係数a0 2を乗算器10で乗算してその結果と2番目の演
算器7の出力を加算器11で加算し、桁上げ信号と和信
号を出力し、これをレジスタ12で1サイクル遅延させ
てから4番目の演算器9に送る。
【0016】4番目の演算器9も同様に動作し、桁上げ
信号と和信号を出力する。そして、この4番目の演算器
9の桁上げ信号と和信号を加算器13で加算し、DCT
係数Y0 が得られる。
信号と和信号を出力する。そして、この4番目の演算器
9の桁上げ信号と和信号を加算器13で加算し、DCT
係数Y0 が得られる。
【0017】すなわち、本発明は1次元シストリックア
レイ構造のパイプライ積和演算器であり、図1に示した
ように、DCTを実行するときは、演算結果がパイプラ
インを流れていくのに合わせて1個のDCT係数を計算
するのに必要てな個の原信号と4個のDCT用係数が1
サイクルづつ遅延して入力される。
レイ構造のパイプライ積和演算器であり、図1に示した
ように、DCTを実行するときは、演算結果がパイプラ
インを流れていくのに合わせて1個のDCT係数を計算
するのに必要てな個の原信号と4個のDCT用係数が1
サイクルづつ遅延して入力される。
【0018】また、同様にIDCTを実行するときは、
演算結果がパイプラインを流れていくのに合わせて、X
0 +X7 やX0 −X7 を計算するのに必要な4個のDC
T係数と4個のIDCT用係数が1サイクルづつ遅延し
て入力される。
演算結果がパイプラインを流れていくのに合わせて、X
0 +X7 やX0 −X7 を計算するのに必要な4個のDC
T係数と4個のIDCT用係数が1サイクルづつ遅延し
て入力される。
【0019】図2は図1に示した1次元シストリックア
レイ型演算器14に原信号とDCT用係数を与える機能
を付加したDCT演算装置の構成を示すブロック図であ
る。15〜17はレジスタ、18は加減算器、19〜3
1はレジスタ、32は記憶装置、33はレジスタ、34
〜37はセレクタ、38はレジスタである。
レイ型演算器14に原信号とDCT用係数を与える機能
を付加したDCT演算装置の構成を示すブロック図であ
る。15〜17はレジスタ、18は加減算器、19〜3
1はレジスタ、32は記憶装置、33はレジスタ、34
〜37はセレクタ、38はレジスタである。
【0020】また、図3は図2に示したDCT演算装置
において原信号とDCT用係数が転送され、乗算器10
に与えられる様子を示す図である。この図3において、
上側に表した数字(1〜14)はサイクルの順番を示
し、左横の数字(19〜23)、(27〜31)、(2
4〜26)は図2のレジスタ19〜31の出力を、(6
〜9)は図1の演算器6〜9のそれぞれの図2に適用し
たときの乗算器10の出力を示す。
において原信号とDCT用係数が転送され、乗算器10
に与えられる様子を示す図である。この図3において、
上側に表した数字(1〜14)はサイクルの順番を示
し、左横の数字(19〜23)、(27〜31)、(2
4〜26)は図2のレジスタ19〜31の出力を、(6
〜9)は図1の演算器6〜9のそれぞれの図2に適用し
たときの乗算器10の出力を示す。
【0021】さて、図2および図3において原信号は図
2のDCT装置にX0 、X7 、X1、X6 、X2 、X
5 、X3 、X4 の順番で連続して入力される。まず、信
号X0、X1 、X2 、X3 はレジスタ15により1サイ
クル遅延された後、レジスタ16にラッチされ、2サイ
クル保持される。また信号X7 、X6 、X5 、X4 はレ
ジスタ17に2サイク保持される。結局、レジスタ16
と17にそれぞれ、X0とX7 、X1 とX6 、X2 とX5
、X3 とX4 が2サイクルづつ保持されることにな
る。加減算器18はX0 +X7 、X0 −X7 、X1 +X
6 、X1 −X6 、X2 +X5 、X2 −X5 、X3 +X
4 、X3 −X4 を計算し、順次レジスタ19〜26に送
る。
2のDCT装置にX0 、X7 、X1、X6 、X2 、X
5 、X3 、X4 の順番で連続して入力される。まず、信
号X0、X1 、X2 、X3 はレジスタ15により1サイ
クル遅延された後、レジスタ16にラッチされ、2サイ
クル保持される。また信号X7 、X6 、X5 、X4 はレ
ジスタ17に2サイク保持される。結局、レジスタ16
と17にそれぞれ、X0とX7 、X1 とX6 、X2 とX5
、X3 とX4 が2サイクルづつ保持されることにな
る。加減算器18はX0 +X7 、X0 −X7 、X1 +X
6 、X1 −X6 、X2 +X5 、X2 −X5 、X3 +X
4 、X3 −X4 を計算し、順次レジスタ19〜26に送
る。
【0022】続いて、X0 +X7 、X0 −X7 は図3の
4サイクル目、X1 +X6 、X1 −X6 は5サイクル
目、X2 +X5 は6サイクル目に、それぞれレジスタ2
7〜31に転送される。セレクタ34は図3中の4サイ
クル目にレジスタ27を選択し、以後交互にレジスタ2
7、28を選択する。セレクタ35は5サイクル目にレ
ジスタ29を選択し、以後交互にレジスタ29、30を
選択する。セレクタ36、37も1サイクル遅れて同様
に動作する。DCT用係数はDCT演算の結果がパイプ
ライン積和演算器中を流れていくのに合わせて供給でき
るように、図2に示すように記憶手段32に格納されて
いる。
4サイクル目、X1 +X6 、X1 −X6 は5サイクル
目、X2 +X5 は6サイクル目に、それぞれレジスタ2
7〜31に転送される。セレクタ34は図3中の4サイ
クル目にレジスタ27を選択し、以後交互にレジスタ2
7、28を選択する。セレクタ35は5サイクル目にレ
ジスタ29を選択し、以後交互にレジスタ29、30を
選択する。セレクタ36、37も1サイクル遅れて同様
に動作する。DCT用係数はDCT演算の結果がパイプ
ライン積和演算器中を流れていくのに合わせて供給でき
るように、図2に示すように記憶手段32に格納されて
いる。
【0023】図4は図1に示した1次元シストリックア
レイ型演算器14にDCT係数とIDCT用係数を与え
る機能を付加したIDCT演算装置の構成を示すブロッ
ク図である。39〜41はレジスタ、42は2入力1出
力加減算器、43はレジスタである。また、図5は図4
に示したIDCT装置においてDCT係数とIDCT用
係数が転送され、乗算器10に与えられる様子を示す図
である。以上の図4、図5において、前述の図2、図3
におけるものと同一のものには同一の符号を付した。
レイ型演算器14にDCT係数とIDCT用係数を与え
る機能を付加したIDCT演算装置の構成を示すブロッ
ク図である。39〜41はレジスタ、42は2入力1出
力加減算器、43はレジスタである。また、図5は図4
に示したIDCT装置においてDCT係数とIDCT用
係数が転送され、乗算器10に与えられる様子を示す図
である。以上の図4、図5において、前述の図2、図3
におけるものと同一のものには同一の符号を付した。
【0024】DCT係数は図4の装置に、Y0 、Y1 、
Y2 、Y3 、Y4 、Y5 、Y6 、Y7 の順番で連続して
入力され、順次レジスタ19〜26にラッチされる。続
いてY0 とY1 は図5の4サイクル目、Y2 とY3 は5
サイクル目、Y4 は6サイクル目にそれぞれレジスタ2
7〜31に転送される。セレクタ34は図5の4サイク
ル目にレジスタ27を選択し、以後交互にレジスタ2
7、28を選択する。セレクタ35は5サイクル目にレ
ジスタ29を選択し、以後交互にレジスタ29、30を
選択する。セレクタ36、37も1サイクルづつ遅れて
同様に動作する。IDCT用係数はIDCT演算の中間
結果がパイプライン積和演算器中を流れていくのに合わ
せて供給できるように記憶手段32に格納されている。
Y2 、Y3 、Y4 、Y5 、Y6 、Y7 の順番で連続して
入力され、順次レジスタ19〜26にラッチされる。続
いてY0 とY1 は図5の4サイクル目、Y2 とY3 は5
サイクル目、Y4 は6サイクル目にそれぞれレジスタ2
7〜31に転送される。セレクタ34は図5の4サイク
ル目にレジスタ27を選択し、以後交互にレジスタ2
7、28を選択する。セレクタ35は5サイクル目にレ
ジスタ29を選択し、以後交互にレジスタ29、30を
選択する。セレクタ36、37も1サイクルづつ遅れて
同様に動作する。IDCT用係数はIDCT演算の中間
結果がパイプライン積和演算器中を流れていくのに合わ
せて供給できるように記憶手段32に格納されている。
【0025】IDCT演算の結果である原信号は、X0
+X7 、X0 −X7 、X1 +X6 、X1 −X6 、X2 +
X5 、X2 −X5 、X3 +X4 、X3 −X4 の順番で得
られる。X0 +X7 、X1 +X6 、X2 +X5 、X3 +
X4 はレジスタ39により1サイクル遅延された後、レ
ジスタ40にラッチされ、2サイクル保持される。ま
た、X0 −X7 、X1 −X6 、X2 −X5 、X3 −X4
はレジスタ41に2サイクル保持される。結局、レジス
タク40、41にそれぞれ、X0 +X7 とX0 −X7 、
X1 +X6 とX1 −X6 、X2 +X5 とX2 −X5 、X
3 +X4 とX3 −X4 が2サイクルづつ保持されること
になる。2入力1出力加減算器42は、加算と減算を交
互に行ない、原信号X0 、X7 、X1 、X6 、X2 、X
5 、X3 、X4 を順次計算する。
+X7 、X0 −X7 、X1 +X6 、X1 −X6 、X2 +
X5 、X2 −X5 、X3 +X4 、X3 −X4 の順番で得
られる。X0 +X7 、X1 +X6 、X2 +X5 、X3 +
X4 はレジスタ39により1サイクル遅延された後、レ
ジスタ40にラッチされ、2サイクル保持される。ま
た、X0 −X7 、X1 −X6 、X2 −X5 、X3 −X4
はレジスタ41に2サイクル保持される。結局、レジス
タク40、41にそれぞれ、X0 +X7 とX0 −X7 、
X1 +X6 とX1 −X6 、X2 +X5 とX2 −X5 、X
3 +X4 とX3 −X4 が2サイクルづつ保持されること
になる。2入力1出力加減算器42は、加算と減算を交
互に行ない、原信号X0 、X7 、X1 、X6 、X2 、X
5 、X3 、X4 を順次計算する。
【0026】なお、以上の実施例では8点DCT/ID
CTについてのみ説明したが、2n点DCT/IDCT
を行なう場合にも容易に拡張できる。
CTについてのみ説明したが、2n点DCT/IDCT
を行なう場合にも容易に拡張できる。
【0027】
【発明の効果】以上説明したように、本発明の1次元シ
ストリック形演算器によれば、乗算器から出力される桁
上げ信号と和信号を1サイクルづつ遅延させながらパイ
プラインで順次加算するので、演算器間の構造が規則的
になる効果がある。よってこれを利用したDCT装置、
IDCT装置をLSI化する場合、レイアウトが容易と
なり、低面積化が実現できる。
ストリック形演算器によれば、乗算器から出力される桁
上げ信号と和信号を1サイクルづつ遅延させながらパイ
プラインで順次加算するので、演算器間の構造が規則的
になる効果がある。よってこれを利用したDCT装置、
IDCT装置をLSI化する場合、レイアウトが容易と
なり、低面積化が実現できる。
【図1】 本発明の一実施例の1次元シストリックアレ
イ型演算器の構成を示すブロック図である。
イ型演算器の構成を示すブロック図である。
【図2】 図1に示す演算器に原信号とDCT演算用係
数を与える機能を付加したDCT演算装置の構成を示す
ブロック図である。
数を与える機能を付加したDCT演算装置の構成を示す
ブロック図である。
【図3】 図2に示す装置において原信号とDCT用係
数が転送され乗算器に与えられる様子を示す説明図であ
る。
数が転送され乗算器に与えられる様子を示す説明図であ
る。
【図4】 図1に示す演算器にDCT係数とIDCT用
係数を与える機能を付加したIDCT演算装置の構成を
示すブロック図である。
係数を与える機能を付加したIDCT演算装置の構成を
示すブロック図である。
【図5】 図4に示す装置においてDCT係数とIDC
T用係数が転送され乗算器に与えられる様子を示す説明
図である。
T用係数が転送され乗算器に与えられる様子を示す説明
図である。
【図6】 高速演算アルゴリズムを用いた8点DCTの
式を示す図である。
式を示す図である。
【図7】 高速演算アリゴリズムを用いた8点IDCT
の式を示す図である。
の式を示す図である。
【図8】 従来のDCT/IDCT演算装置の構成を示
すブロック図である。
すブロック図である。
1:乗算器、2:レジスタ、3:Wallaceツリー形桁上
げ保存加算器、4:レジスタ、5:2入力2出力加算
器、6〜9:演算器、10:乗算器、11:加算器、1
2:レジスタ、13:加算器、14:1次元シストリッ
クアレイ型演算器、15〜17:レジスタ、18:2入
力1出力加減算器、19〜31:レジスタ、32:記憶
装置、33:レジスタ、34〜37:セレクタ、38:
レジスタ、39〜41:レジスタ、42:2入力1出力
加減算器、43:レジスタ。
げ保存加算器、4:レジスタ、5:2入力2出力加算
器、6〜9:演算器、10:乗算器、11:加算器、1
2:レジスタ、13:加算器、14:1次元シストリッ
クアレイ型演算器、15〜17:レジスタ、18:2入
力1出力加減算器、19〜31:レジスタ、32:記憶
装置、33:レジスタ、34〜37:セレクタ、38:
レジスタ、39〜41:レジスタ、42:2入力1出力
加減算器、43:レジスタ。
Claims (3)
- 【請求項1】同一の演算機能を有する複数の演算手段を
1次元のアレイ状に接続した1次元シストリックアレイ
型演算器において、 上記各演算手段が、乗数と被乗数に対して桁上げ保存形
の乗算を行なう機能と、該乗算結果である桁上げ信号と
和信号と前段の演算手段から入力される桁上げ信号と和
信号との4つの信号に対して桁上げ保存形の加算を行な
う機能と、該加算結果である桁上げ信号と和信号を1サ
イクルの間保持して遅延させ次段に出力させる機能とを
有することを特徴とする1次元シストリックアレイ型演
算器。 - 【請求項2】n点DCT演算を行なう装置(nは2のべ
き乗)において、n点DCT演算の対象となるn個の原
信号X0 、X1 、X2 、・・・・、Xn- 2 、Xn- 1 から
X0+Xn- 1 、X0 −Xn- 1 、X1 +Xn- 2 、X1 −X
n- 2 、X2 +Xn- 3 、X2 −Xn- 3 、・・・・・、X
n/2- 1 +Xn/ 2 、Xn/2- 1 −Xn/ 2 を計算する手段と、
前記手段により計算された結果をX0 +Xn- 1 とX0 −
Xn- 1 、X1 +Xn- 2 とX1 −Xn- 2 、X2 +Xn- 3 と
X2 −Xn- 3 、・・・・・、Xn/2- 1 +Xn/ 2 とXn/2-
1 −Xn/ 2 の2個1組にして記憶する手段と、該記憶さ
れた各組から並列に片方を読み出し、前記請求項1記載
の1次元シストリックアレイ型演算器に送る手段と、D
CT演算用の係数を前記請求項1記載の1次元シストリ
ックアレイ型演算器に与える手段とを有することを特徴
とするn点DCT演算を行なうDCT演算装置。 - 【請求項3】n点IDCT演算を行なう装置(nは2の
べき乗)において、n点IDCT演算の対象となるn個
のDCT係数Y0 、Y1 、Y3 、・・・・、Yn- 2 、Y
n- 1をY0 とY1 、Y2 とY3 、Y4 とY5 、・・・
・、Yn- 2 とYn- 1 の2個1組にして記憶する手段と、
該記憶された各組から並列に片方を読み出し、前記請求
項1記載の1次元シストリックアレイ型演算器に送る手
段と、IDCT演算用の係数を前記請求項1記載の1次
元シストリックアレイ型演算器に与える手段と、前記請
求項1記載の1次元シストリックアレイ型演算器から出
力される桁上げ信号と和信号を加算する手段と、その結
果得られるX0 +Xn- 1 、X0 −Xn- 1 、X1 +X
n- 2 、X1 −Xn- 2 、X2 +Xn- 3 、X2 −Xn- 3 、・
・・・・・・、Xn/2- 1 +Xn/ 2 、Xn/2- 1 −Xn/ 2 か
ら原信号X0 、Xn- 1 、X1 、Xn- 2 、X2 、Xn- 3 、
・・・・・・、Xn/2- 1 、Xn/ 2 を計算する手段とを有
することを特徴とするn点IDCT演算を行なう装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6242385A JPH0883264A (ja) | 1994-09-12 | 1994-09-12 | 1次元シストリックアレイ型演算器とそれを用いたdct/idct演算装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6242385A JPH0883264A (ja) | 1994-09-12 | 1994-09-12 | 1次元シストリックアレイ型演算器とそれを用いたdct/idct演算装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0883264A true JPH0883264A (ja) | 1996-03-26 |
Family
ID=17088380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6242385A Withdrawn JPH0883264A (ja) | 1994-09-12 | 1994-09-12 | 1次元シストリックアレイ型演算器とそれを用いたdct/idct演算装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0883264A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009516238A (ja) * | 2005-10-05 | 2009-04-16 | クゥアルコム・インコーポレイテッド | Vliwアーキテクチャを有する他のdspのための高速dctアルゴリズム |
WO2010044242A1 (ja) | 2008-10-14 | 2010-04-22 | 国立大学法人奈良先端科学技術大学院大学 | データ処理装置 |
CN108259919A (zh) * | 2018-03-28 | 2018-07-06 | 福州大学 | 一种快速实现8x8DCT变换的硬件系统 |
JP2021519455A (ja) * | 2018-03-30 | 2021-08-10 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 大規模並列ニューラル推論コンピューティングのためのシステムおよび方法 |
-
1994
- 1994-09-12 JP JP6242385A patent/JPH0883264A/ja not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009516238A (ja) * | 2005-10-05 | 2009-04-16 | クゥアルコム・インコーポレイテッド | Vliwアーキテクチャを有する他のdspのための高速dctアルゴリズム |
US8396916B2 (en) | 2005-10-05 | 2013-03-12 | Qualcomm, Incorporated | Fast DCT algorithm for DSP with VLIW architecture |
WO2010044242A1 (ja) | 2008-10-14 | 2010-04-22 | 国立大学法人奈良先端科学技術大学院大学 | データ処理装置 |
KR20110084915A (ko) | 2008-10-14 | 2011-07-26 | 고쿠리츠다이가쿠호징 나라 센탄카가쿠기쥬츠 다이가쿠인 다이가쿠 | 데이터 처리 장치 |
CN108259919A (zh) * | 2018-03-28 | 2018-07-06 | 福州大学 | 一种快速实现8x8DCT变换的硬件系统 |
CN108259919B (zh) * | 2018-03-28 | 2020-08-07 | 福州大学 | 一种快速实现8x8DCT变换的硬件系统 |
JP2021519455A (ja) * | 2018-03-30 | 2021-08-10 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 大規模並列ニューラル推論コンピューティングのためのシステムおよび方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6366936B1 (en) | Pipelined fast fourier transform (FFT) processor having convergent block floating point (CBFP) algorithm | |
US4769779A (en) | Systolic complex multiplier | |
KR20060061796A (ko) | 리코드 radix-2 파이프라인 FFT 프로세서 | |
JPS6125188B2 (ja) | ||
JP2009516238A5 (ja) | ||
KR950009472A (ko) | 2차원 이산코사인 변환장치, 2차원 역이산코사인 변환장치 및 디지탈 신호처리 장치 | |
Corinthios | The design of a class of Fast Fourier Transform computers | |
Ali et al. | Study, implementation and comparison of different multipliers based on Array, KCM and Vedic Mathematics using EDA tools | |
US7653676B2 (en) | Efficient mapping of FFT to a reconfigurable parallel and pipeline data flow machine | |
US6122653A (en) | Block IIR processor utilizing divided ALU operation instructions | |
JPH0883264A (ja) | 1次元シストリックアレイ型演算器とそれを用いたdct/idct演算装置 | |
Nagpal et al. | Processor architectures for two-dimensional convolvers using a single multiplexed computational element with finite field arithmetic | |
JPH09212485A (ja) | 2次元idct回路 | |
Zhou et al. | Novel design of multiplier-less FFT processors | |
JPH06195369A (ja) | 高速アルゴリズム離散コサイン変換器/逆変換器 | |
JPS6156823B2 (ja) | ||
KR100575285B1 (ko) | 고속의 저전력 이산 코사인 변환 장치 및 방법 | |
JPS63133268A (ja) | パイプライン式のfftバタフライ計算装置 | |
Chien et al. | Design and realisation of a new hardware efficient IP core for the 1-d discrete Fourier transform | |
JP3865469B2 (ja) | バタフライ演算器 | |
JPH0540776A (ja) | 二次元dctマトリクス演算回路 | |
JP4012781B2 (ja) | リフト式離散ウェーブレット変換ハードウエア実現に使用されるフリップ式演算法及びそのハードウエア構造 | |
JPS6259828B2 (ja) | ||
JP2646844B2 (ja) | 離散コサイン変換装置 | |
Hassan et al. | Design architecture of generic DFT/DCT 1D and 2D engine controlled by SW instructions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20011120 |