JPH01237765A - ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム - Google Patents
ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステムInfo
- Publication number
- JPH01237765A JPH01237765A JP63063313A JP6331388A JPH01237765A JP H01237765 A JPH01237765 A JP H01237765A JP 63063313 A JP63063313 A JP 63063313A JP 6331388 A JP6331388 A JP 6331388A JP H01237765 A JPH01237765 A JP H01237765A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- memory
- signal processing
- output
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims abstract description 82
- 230000015654 memory Effects 0.000 claims abstract description 69
- 238000006243 chemical reaction Methods 0.000 claims abstract description 19
- 238000005070 sampling Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 239000000872 buffer Substances 0.000 claims abstract description 11
- 230000009466 transformation Effects 0.000 claims description 19
- 230000003111 delayed effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 17
- 238000009825 accumulation Methods 0.000 abstract description 3
- 230000007423 decrease Effects 0.000 abstract description 3
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 13
- 238000003070 Statistical process control Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000007792 addition Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- -1 ACCI Proteins 0.000 description 1
- 102100021334 Bcl-2-related protein A1 Human genes 0.000 description 1
- 101000677540 Homo sapiens Acetyl-CoA carboxylase 2 Proteins 0.000 description 1
- 101000894929 Homo sapiens Bcl-2-related protein A1 Proteins 0.000 description 1
- 101000822152 Petunia hybrida 1-aminocyclopropane-1-carboxylate oxidase 1 Proteins 0.000 description 1
- 229910001423 beryllium ion Inorganic materials 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 210000000554 iris Anatomy 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Complex Calculations (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は実時間処理を行なう高速ディジタル信号処理プ
ロセッサの回路構成に係わる。上記プロセッサの主な応
用は画像通信、高精細ディジタル・テレビ、画像信号処
理等である。
ロセッサの回路構成に係わる。上記プロセッサの主な応
用は画像通信、高精細ディジタル・テレビ、画像信号処
理等である。
デジタル信号処理プロセッサは、例えば昭和59年11
月30日発刊のrLSIハンドブック」頁567〜60
7(オーム社)により詳細に説明されている。
月30日発刊のrLSIハンドブック」頁567〜60
7(オーム社)により詳細に説明されている。
音声信号もしくは映像信号を量子化し、この量子化信号
をアナログ−ディジタル変′換して得たデジタル信号を
デジタル的な演算もしくは変換などの操作する装置をデ
ィジタル信号処理プロセッサと一般的に言われている。
をアナログ−ディジタル変′換して得たデジタル信号を
デジタル的な演算もしくは変換などの操作する装置をデ
ィジタル信号処理プロセッサと一般的に言われている。
ディジタル信号処理プロセッサによるディジタル操作に
は、ろ波9等化、雑音やエコーの低減。
は、ろ波9等化、雑音やエコーの低減。
変調、フーリエ変換、信号の特性パラメータの抽出、信
号の予測、映像信号の強調などがある。
号の予測、映像信号の強調などがある。
ディジタル信号処理プロセッサよりの出力信号はディジ
タル−アナログ変換によりアナログ信号に戻され、低域
フィルターを介して最終的な出力信号が得られる。
タル−アナログ変換によりアナログ信号に戻され、低域
フィルターを介して最終的な出力信号が得られる。
1970年代になり、LSI技術が発達してディジタル
演算処理の基本的構成要素である加算器。
演算処理の基本的構成要素である加算器。
乗算器、単位遅延素子を信号処理の流れに沿ってレイア
ウトした専用LSIが提案された。この専用LSIは回
路規模を最小化できるので、量産されれば最も経済的で
ある。
ウトした専用LSIが提案された。この専用LSIは回
路規模を最小化できるので、量産されれば最も経済的で
ある。
一方、1980年代になってストアドブログラム制御の
ディジタル信号処理プロセサ(以下DSPと言う)LS
Iが提案された。LSIは信号処理のアルゴリズムをマ
イクロ命令でフログラミングし、この命令をメモリーか
ら読みだして実行するので、プログラムによりいかなる
信号処理も実現できる汎用性を有する。
ディジタル信号処理プロセサ(以下DSPと言う)LS
Iが提案された。LSIは信号処理のアルゴリズムをマ
イクロ命令でフログラミングし、この命令をメモリーか
ら読みだして実行するので、プログラムによりいかなる
信号処理も実現できる汎用性を有する。
ところで1画像通信用の画像信号帯域圧縮には直交変換
、特にディスクリート・コサイン変換が1つの有力候補
となっている。その変換式は(1)式のとおりであり、
(Xk)が入力、(y、)が出方である。またNは変換
の対象となるブロック・サイズである。
、特にディスクリート・コサイン変換が1つの有力候補
となっている。その変換式は(1)式のとおりであり、
(Xk)が入力、(y、)が出方である。またNは変換
の対象となるブロック・サイズである。
これを8次の変換に対して行列演算で表記したものが(
2)式である。三角関数の周期性を考慮した場合、(3
)式のように、入力(Xk)に乗算すべき係数はCIよ
りC1Mの15種のみである。
2)式である。三角関数の周期性を考慮した場合、(3
)式のように、入力(Xk)に乗算すべき係数はCIよ
りC1Mの15種のみである。
・・・(2)
・・・(3)
1 に
れをそのまま回路に展開すると第2図に示したとおりの
回路となり、乗算回路が8X8=64個、加算器の数は
、2人力のみの加算を許すとして、8X7=56個とな
る。そこで、従来は電子通信学会技術報告、IE85−
4.1985年の第23から第30頁に示されているよ
うに、数学的に(3)式を変形させることにより、第3
図に示したような計算アルゴリズムが採用されていた。
回路となり、乗算回路が8X8=64個、加算器の数は
、2人力のみの加算を許すとして、8X7=56個とな
る。そこで、従来は電子通信学会技術報告、IE85−
4.1985年の第23から第30頁に示されているよ
うに、数学的に(3)式を変形させることにより、第3
図に示したような計算アルゴリズムが採用されていた。
これにより乗算器30の数は11個に低減され、加算器
31の数も29個に低減されていた。
31の数も29個に低減されていた。
ところで、近年のディジタル信号処理プロセッサの進歩
により、上記アルゴリズムが1組の加算器及び乗算器を
時間多重で用いることにより処理可能となった。
により、上記アルゴリズムが1組の加算器及び乗算器を
時間多重で用いることにより処理可能となった。
第4図は出願前に本発明者等により検討されたもので、
4ポート・メモリ12及び2本のデータ・バス15を用
いた比較的高速なりSP (ディジタル・信号処理プロ
セッサ)を示している。本プロセッサを用いて第3図の
アルゴリズムを処理するためのプログラムが表1に示し
たものであり、第4図のメモリ12に格納される。しか
し、このプログラムの処理が規則的でないため、パイプ
ライン等の処理が困難であり、データ処理のみで29ス
テツプを要する。これに、データ・メモリ12への入出
力を実行する処理を加えると、メモリ12の多ポート性
を活用したとしても8ステツプを要し、データが出力さ
れるまで29+8=37ステツプを要する。また処理中
、入出力はストップしているため、入出カレートをパイ
プライン的に合わせることは出来ない。つまり、37ス
テツプ分の処理時間が必要となる。ゲート長1μm程度
のプロセッサのマシン・サイクル(1ステップ処理時間
)は高々Ionsであるため、1サンプルに370ns
、周波数にして2.7MHzが上限となる。これではビ
デオ信号(14,3M Hz〜7.15MHz)の信号
処理は出来ない。
4ポート・メモリ12及び2本のデータ・バス15を用
いた比較的高速なりSP (ディジタル・信号処理プロ
セッサ)を示している。本プロセッサを用いて第3図の
アルゴリズムを処理するためのプログラムが表1に示し
たものであり、第4図のメモリ12に格納される。しか
し、このプログラムの処理が規則的でないため、パイプ
ライン等の処理が困難であり、データ処理のみで29ス
テツプを要する。これに、データ・メモリ12への入出
力を実行する処理を加えると、メモリ12の多ポート性
を活用したとしても8ステツプを要し、データが出力さ
れるまで29+8=37ステツプを要する。また処理中
、入出力はストップしているため、入出カレートをパイ
プライン的に合わせることは出来ない。つまり、37ス
テツプ分の処理時間が必要となる。ゲート長1μm程度
のプロセッサのマシン・サイクル(1ステップ処理時間
)は高々Ionsであるため、1サンプルに370ns
、周波数にして2.7MHzが上限となる。これではビ
デオ信号(14,3M Hz〜7.15MHz)の信号
処理は出来ない。
表1
表 1(続き)
表 1(続き)
表 1(続き)
上述した出願前の技術は、計算機アルゴリズムの目的を
単に加算・乗算回数の低減のみに置き、DSPを用いる
ことを考慮していなかった点に問題があった。上記アル
ゴリズムは不規則的であり、本質的に高速DSP処理に
適していない。
単に加算・乗算回数の低減のみに置き、DSPを用いる
ことを考慮していなかった点に問題があった。上記アル
ゴリズムは不規則的であり、本質的に高速DSP処理に
適していない。
本発明の目的は、ディスクリート・コサイン変換の本来
の定義に立帰り、DSPに適した高速処理方法を実現す
ることにある。
の定義に立帰り、DSPに適した高速処理方法を実現す
ることにある。
〔問題点を解決するための手段〕
上記問題は第2図に示した計算処理を第5図のような信
号処理アルゴリズムに変換することにより解決される。
号処理アルゴリズムに変換することにより解決される。
この信号処理アルゴリズムは(3)式と全く等価である
。ここでは、入力信号(X、)が同時にではなく、逐次
入力されて来るという実際的な構成を考慮している。上
記アルゴリズムでは、まず入力されたデータXφに対し
、同時に該当する係数(cl)と乗算を実行し、その結
果を加算回路11と遅延回路15からなる累積回路17
に渡す。次のデータXlに対しても同様に乗算を行ない
、その結果を累積回路17に渡す、以下データx7まで
の処理を行なった後で、累積回路17よりラッチ回路1
6へ結果を同時に転送する。
。ここでは、入力信号(X、)が同時にではなく、逐次
入力されて来るという実際的な構成を考慮している。上
記アルゴリズムでは、まず入力されたデータXφに対し
、同時に該当する係数(cl)と乗算を実行し、その結
果を加算回路11と遅延回路15からなる累積回路17
に渡す。次のデータXlに対しても同様に乗算を行ない
、その結果を累積回路17に渡す、以下データx7まで
の処理を行なった後で、累積回路17よりラッチ回路1
6へ結果を同時に転送する。
この後、累積器の内容をクリアし、次のデータ系列(x
k)(k=8〜15)の処理に移る。これと同時にラン
チ16より入力と同タイミングで出力データ(yh)(
k=o〜7)を順次読出す。本方式では乗算器が8個、
加算器が8個となり、第3図のアルゴリズムに対しても
大幅な回路数低減がなされている。
k)(k=8〜15)の処理に移る。これと同時にラン
チ16より入力と同タイミングで出力データ(yh)(
k=o〜7)を順次読出す。本方式では乗算器が8個、
加算器が8個となり、第3図のアルゴリズムに対しても
大幅な回路数低減がなされている。
第5図を最も効率良く処理する回路構成としては第1図
に示したものが考えられる。ここで、入力信号(x−)
はサンプリング時間Tの間隔で乗算回路10に入って来
る。これと同時に乗するべき係数(c)が時間Tの1/
Nの周期で係数メモリ4より読出され、T/Nの時間間
隔で乗算された結果は加算回路11に入力される。加算
回路11はアキュムレータ8とデータをやりとりしなが
ら。
に示したものが考えられる。ここで、入力信号(x−)
はサンプリング時間Tの間隔で乗算回路10に入って来
る。これと同時に乗するべき係数(c)が時間Tの1/
Nの周期で係数メモリ4より読出され、T/Nの時間間
隔で乗算された結果は加算回路11に入力される。加算
回路11はアキュムレータ8とデータをやりとりしなが
ら。
第5図の信号処理アルゴリズムにしたがって累積処理を
行なって行く。1ブロツク(N個)の入力データの処理
が終わると、その結果はバッファー回路9に引渡され、
入力時間間隔Tと同一の速度で出力される。
行なって行く。1ブロツク(N個)の入力データの処理
が終わると、その結果はバッファー回路9に引渡され、
入力時間間隔Tと同一の速度で出力される。
以下、本発明の一実施例を第6図で示す、第6図は第1
図の回路構成を具体的に展開したもので、表2はその処
理を実行させるプログラムである。
図の回路構成を具体的に展開したもので、表2はその処
理を実行させるプログラムである。
なお、処理を行なう入力データの1ブロツク中のサンプ
リング数N=8である。係数メモリ4は適応化変換にも
対応するため、入力と出力が分離された2ポート・メモ
リとしてあり、その書込み信号WCEは係数書換え制御
回路20により制御される。その機能は以下のとおりで
ある。外部より書込みを希望する場合、WRT端子に′
1′信号を入力する。これに応答して、メモリの入力、
出力アドレスが重ならないタイミングを見はからって書
込み信号WCEを発生し、その後、1)込み終了の信号
としてRDYに11′信号を出力する。
リング数N=8である。係数メモリ4は適応化変換にも
対応するため、入力と出力が分離された2ポート・メモ
リとしてあり、その書込み信号WCEは係数書換え制御
回路20により制御される。その機能は以下のとおりで
ある。外部より書込みを希望する場合、WRT端子に′
1′信号を入力する。これに応答して、メモリの入力、
出力アドレスが重ならないタイミングを見はからって書
込み信号WCEを発生し、その後、1)込み終了の信号
としてRDYに11′信号を出力する。
これを見てWRT信号を10′とすれば、R1)Yも′
0″に戻す。
0″に戻す。
表2
表 2(続き)
表 2(続き)
表 2(続き)
表 2(続き)
アキュームレータ8はマスタ・スレーブ・レジスタ8本
より構成されており、中のデータを破壊することなく同
時に読出し、書込みが可能である。
より構成されており、中のデータを破壊することなく同
時に読出し、書込みが可能である。
バッファー回路9もやはり8本のマスク・スレーブ・レ
ジスタで゛構成する。マルチプレクサ18はSTZ信号
(Set to Zevo )信号にしたがって10′
信号をラッチRDに入力するために用いられる。
ジスタで゛構成する。マルチプレクサ18はSTZ信号
(Set to Zevo )信号にしたがって10′
信号をラッチRDに入力するために用いられる。
以上の回路の制御を表2を用いて説明する。まず、第1
ステツプで入力データxOを入力ラッチR4Nに取込む
と同時に、乗するべき係数04を係数ラッチRCに取込
む。第2ステツプではその乗算結果を乗算結果ラッチR
Mに取込む、これと同時に次の係数01をRCに取込み
、データラッチRDには0′を取込む。第3ステツプで
は加算結果RM+RDがアキュムレータの最初のレジス
タACGOに取込まれる。これと同時に前持って処理さ
れている前ブロックのデータがバッファ回路9のレジス
タROより出力ラッチROに引渡される。以下1乗算器
、加算器、バッファー回路の並列、パイプライン処理に
より第9ステツプまで進む。第9ステツプでは次の入力
信号x1がRINにラッチされる。その後順次(C4,
C3゜C6・・・)との乗算が実行され、その結果がそ
、れぞれ(ACCO,ACCI、ACC2・・・)のデ
ータに累積される。以下同様に第57ステツプまで処理
を行なう。最後の第57ステツプ以下の累積結果はアキ
ュムレータ8には戻されず、直接バッファー9に書込ま
れる。バッファーの内容は次の64サイクルで8ステツ
プの間隔で読出される・このようにして、入力信号に対
し、実時間処理がほどこされる。また、第5図のアルゴ
リズムが1組の乗算回路、加算回路で実現されている。
ステツプで入力データxOを入力ラッチR4Nに取込む
と同時に、乗するべき係数04を係数ラッチRCに取込
む。第2ステツプではその乗算結果を乗算結果ラッチR
Mに取込む、これと同時に次の係数01をRCに取込み
、データラッチRDには0′を取込む。第3ステツプで
は加算結果RM+RDがアキュムレータの最初のレジス
タACGOに取込まれる。これと同時に前持って処理さ
れている前ブロックのデータがバッファ回路9のレジス
タROより出力ラッチROに引渡される。以下1乗算器
、加算器、バッファー回路の並列、パイプライン処理に
より第9ステツプまで進む。第9ステツプでは次の入力
信号x1がRINにラッチされる。その後順次(C4,
C3゜C6・・・)との乗算が実行され、その結果がそ
、れぞれ(ACCO,ACCI、ACC2・・・)のデ
ータに累積される。以下同様に第57ステツプまで処理
を行なう。最後の第57ステツプ以下の累積結果はアキ
ュムレータ8には戻されず、直接バッファー9に書込ま
れる。バッファーの内容は次の64サイクルで8ステツ
プの間隔で読出される・このようにして、入力信号に対
し、実時間処理がほどこされる。また、第5図のアルゴ
リズムが1組の乗算回路、加算回路で実現されている。
これらの回路の処理時間は入力サンプリング時間の1/
Nであるが、例えば0.8μmのゲート長をもつCMO
5論理回路を用いれば8X8bit乗算回路の処理時間
はIonsとなる。これに対し、入力サンプリング時間
は高々140nsであるので、N=14までの処理は可
能であり、十分実用に耐える。
Nであるが、例えば0.8μmのゲート長をもつCMO
5論理回路を用いれば8X8bit乗算回路の処理時間
はIonsとなる。これに対し、入力サンプリング時間
は高々140nsであるので、N=14までの処理は可
能であり、十分実用に耐える。
ここで、より改造すべき点は、プログラム冗長性である
。上記プログラムは8ステツプの周期性をもち、例外処
理は表2中斜線をほどこした部分のみである。これをよ
り明確に示すため、第7図にプログラムのビット・コー
ドを示す。ここで斜線で示した部分が8ステツプ周期の
処理にしたがわない例外処理を示す、この例外処理の内
容は。
。上記プログラムは8ステツプの周期性をもち、例外処
理は表2中斜線をほどこした部分のみである。これをよ
り明確に示すため、第7図にプログラムのビット・コー
ドを示す。ここで斜線で示した部分が8ステツプ周期の
処理にしたがわない例外処理を示す、この例外処理の内
容は。
ラッチRDを′OIにセットするSTZ信号、アキュム
レータにデータを書込むWAC信号、及びバッファー回
路にデータを書込むWRE信号である。そこで、これら
例外処理プログラムのみを第9図に示すマイクロ・コー
ドとして抽出し、残る8ステツプ周期の処理は第8図に
示すマイクロ・コードで制御する。なお、第9図のマイ
クロ・コードは5周期ごとにインクリメントする。
レータにデータを書込むWAC信号、及びバッファー回
路にデータを書込むWRE信号である。そこで、これら
例外処理プログラムのみを第9図に示すマイクロ・コー
ドとして抽出し、残る8ステツプ周期の処理は第8図に
示すマイクロ・コードで制御する。なお、第9図のマイ
クロ・コードは5周期ごとにインクリメントする。
これらのマイクロ・コードを収めた制御メモリの構成法
を第10図に示す。制御メモリ1はプログラム・カウン
タ5の下位ビットから3ビツトでアクセスすることによ
り、毎マシン・サイクルごとにインクリメントする。こ
れに対し、マクロ・ステップ・制御メモリ2はプログラ
ム・カウンタの63以後の上位側ビットでアクセスし、
制御メモリが8ステツプで一周するたびに1回インクリ
メントされる。このマクロ・ステップ制御メモリにより
STZ、WRE、WACE信号を発生するとともにバッ
ファ回路9から出力レジスタヘ受渡す信号のバッファ・
レジスタ上のアドレスRRを出力する。しかし、本プロ
セッサがパイプライン処理をしているため、マクロ・ス
テップ・制御メモリの出力は、1マシン・サイクル遅延
回路21により所定のステップ数遅延され、第7図に示
したシーケンスを満たすようにしである。
を第10図に示す。制御メモリ1はプログラム・カウン
タ5の下位ビットから3ビツトでアクセスすることによ
り、毎マシン・サイクルごとにインクリメントする。こ
れに対し、マクロ・ステップ・制御メモリ2はプログラ
ム・カウンタの63以後の上位側ビットでアクセスし、
制御メモリが8ステツプで一周するたびに1回インクリ
メントされる。このマクロ・ステップ制御メモリにより
STZ、WRE、WACE信号を発生するとともにバッ
ファ回路9から出力レジスタヘ受渡す信号のバッファ・
レジスタ上のアドレスRRを出力する。しかし、本プロ
セッサがパイプライン処理をしているため、マクロ・ス
テップ・制御メモリの出力は、1マシン・サイクル遅延
回路21により所定のステップ数遅延され、第7図に示
したシーケンスを満たすようにしである。
以上の制御メモリの他に、係数メモリにも冗長性がある
。第6図の光回路では係数メモリとして64ワード必要
となっている。しかし、そこに記録されている内容は、
係数の周期性により、たった16通りの値のみである。
。第6図の光回路では係数メモリとして64ワード必要
となっている。しかし、そこに記録されている内容は、
係数の周期性により、たった16通りの値のみである。
そこで、メモリ容量の低減をはかる目的で、第11図に
示す係数アドレス・メモリを導入する。ここでの係数メ
モリは16ワードのみであり、係数アドレス・メモリが
全シーケンス64ワードを記憶している。ところが、係
数が8〜32ビツト/ワードであるのに対し、そのアド
レス情報は3ビツトのみであるため、メモリ容量は大幅
に低減されたことになる。
示す係数アドレス・メモリを導入する。ここでの係数メ
モリは16ワードのみであり、係数アドレス・メモリが
全シーケンス64ワードを記憶している。ところが、係
数が8〜32ビツト/ワードであるのに対し、そのアド
レス情報は3ビツトのみであるため、メモリ容量は大幅
に低減されたことになる。
以上の処理手法、プロセッサ・アーキテクチャは、ディ
スクリート・コサイン変換のみでなく、より一般的な行
列と入力ベクトル積の高速乗算にも応用出来る。これに
より、ビデオ信号の色信号マトリクス計算、ロボットや
2次元、3次元グラフィックスの高速座標変換、高速フ
ーリエ変換等が実現出来る。
スクリート・コサイン変換のみでなく、より一般的な行
列と入力ベクトル積の高速乗算にも応用出来る。これに
より、ビデオ信号の色信号マトリクス計算、ロボットや
2次元、3次元グラフィックスの高速座標変換、高速フ
ーリエ変換等が実現出来る。
ところで、画像通信に用いる画信号帯域圧縮の主要技術
に2次元ディスクリート変換(以下DCTと略する)が
ある、これを第18図及び第19図を用いて簡単に説明
する。1次元DCTでは第18図(A)に示したように
、入力信号ブロック内の各信号(xk)に なる変換を施す、これを図示したものが第18(A)図
である。これを2次元に展開したものが第18図(B)
である、(00)次の出力yooは対象ブロック内の全
画素に定数を乗じる。(10)次の出力yxaはX方向
のみにcosの重みをかけるので1図のようなパターン
が入力ブロックに乗ぜられることになる。同様に(01
)次の出力y01はy方向のみにCOSの重みをかけ、
以下y11゜yzzは両方向に重みがかけられる。これ
らにより、画信号からその特定の相関を持つ信号成分を
それぞれの出力(y+J)に出力する。画信号の自己相
関は大きいため入力ブロック内で信号が急激に変化する
ケースは少ない。これにより、 ytx、 yzzのよ
うな急激に変化するパターンにマツチングする場合はま
れであり、その結果低次の出力(yoo。
に2次元ディスクリート変換(以下DCTと略する)が
ある、これを第18図及び第19図を用いて簡単に説明
する。1次元DCTでは第18図(A)に示したように
、入力信号ブロック内の各信号(xk)に なる変換を施す、これを図示したものが第18(A)図
である。これを2次元に展開したものが第18図(B)
である、(00)次の出力yooは対象ブロック内の全
画素に定数を乗じる。(10)次の出力yxaはX方向
のみにcosの重みをかけるので1図のようなパターン
が入力ブロックに乗ぜられることになる。同様に(01
)次の出力y01はy方向のみにCOSの重みをかけ、
以下y11゜yzzは両方向に重みがかけられる。これ
らにより、画信号からその特定の相関を持つ信号成分を
それぞれの出力(y+J)に出力する。画信号の自己相
関は大きいため入力ブロック内で信号が急激に変化する
ケースは少ない。これにより、 ytx、 yzzのよ
うな急激に変化するパターンにマツチングする場合はま
れであり、その結果低次の出力(yoo。
y01*y1G等)が大きく現われる。このため、低次
の変換出力の量子化により多くのビット数を割当て、高
次になるほどビット数を低減させることにより高効率の
量子化(帯域圧縮)を行なうことが出来る64×4次の
2次元DCTを具体的に示したものが第19図である。
の変換出力の量子化により多くのビット数を割当て、高
次になるほどビット数を低減させることにより高効率の
量子化(帯域圧縮)を行なうことが出来る64×4次の
2次元DCTを具体的に示したものが第19図である。
第19図(A)の2次元画像データの中より4×4画素
のブロックを切出し、これをDCT変換する。その計算
アルゴリズムは同図(B)に示したとおりのものである
。
のブロックを切出し、これをDCT変換する。その計算
アルゴリズムは同図(B)に示したとおりのものである
。
これにより(0,O)次から(3,3)次までの4×4
個の出力(yta)を得る。画像情報の相関性質を利用
して同図(C)のように各次数に量子化ビットをm当て
る。これにより原信号の8ビット/画素が2.25 ビ
ット/画素に圧縮される。
個の出力(yta)を得る。画像情報の相関性質を利用
して同図(C)のように各次数に量子化ビットをm当て
る。これにより原信号の8ビット/画素が2.25 ビ
ット/画素に圧縮される。
さらにDCTの次数を増やすことにより圧縮率を上げる
ことが出来る。
ことが出来る。
さて、2次元DCTでは、これまで説明した実施例を用
い、まず1次元のDCTを行なった後、複数行のDCT
結果をメモリに記憶してデータマトリクスを形成した後
、アドレス変換等によりこのデータマトリクスを転置し
た後、再び一次元DCTを行なって2次元DCTを実現
する。この方式では1次元DCTのメモリへの転送、そ
の後のアドレス変換等に時間を要し、パイプライン処理
等により高速処理が出来ない。
い、まず1次元のDCTを行なった後、複数行のDCT
結果をメモリに記憶してデータマトリクスを形成した後
、アドレス変換等によりこのデータマトリクスを転置し
た後、再び一次元DCTを行なって2次元DCTを実現
する。この方式では1次元DCTのメモリへの転送、そ
の後のアドレス変換等に時間を要し、パイプライン処理
等により高速処理が出来ない。
また、DCTの次数を増やす場合、上記特許において係
数メモリ、アキュムレータの数を増やす必要がある。し
かし、これでは−乗算回路、−加算回路からなる積和処
理部が処理すべきデータが増え、DCT速度が低下する
。
数メモリ、アキュムレータの数を増やす必要がある。し
かし、これでは−乗算回路、−加算回路からなる積和処
理部が処理すべきデータが増え、DCT速度が低下する
。
以下の実施例は、遅延回路を複数のDCT回路と組み合
わせることによってパイプライン処理を実現し、スルー
プット速度を落さずにDCTの次数増加及び2次元化を
行なうものである。なお。
わせることによってパイプライン処理を実現し、スルー
プット速度を落さずにDCTの次数増加及び2次元化を
行なうものである。なお。
本技術は高速フーリエ変換、座標変換等にも適用出来る
。
。
第12図はDCTの次数を増加させる場合の実施例を示
している。ここでS P C(SignalProce
ssing Cave)は第11図までの実施例に示し
たとおり、DCT (ディスクリート・コサイン変換)
処理を行なう信号処理プロセッサであり、第12図の例
ではその次数は8次である。これを2個用いることによ
りその次数を16次にまで拡張することを考える。16
次のDCT処理を数式で現わすと第20図のようになる
。そこで乗するべき行列を図に示したように4分割し、
それぞれを4個のSPCに分担させる。第12図はその
処理をパイプライン化し、次数の拡張により入出力のス
ルー・プツトが低下しない構成となっている。
している。ここでS P C(SignalProce
ssing Cave)は第11図までの実施例に示し
たとおり、DCT (ディスクリート・コサイン変換)
処理を行なう信号処理プロセッサであり、第12図の例
ではその次数は8次である。これを2個用いることによ
りその次数を16次にまで拡張することを考える。16
次のDCT処理を数式で現わすと第20図のようになる
。そこで乗するべき行列を図に示したように4分割し、
それぞれを4個のSPCに分担させる。第12図はその
処理をパイプライン化し、次数の拡張により入出力のス
ルー・プツトが低下しない構成となっている。
以下その動作を説明する。第12図(B)に示したよう
に、入力端子からは信号(xk)(k=o〜15)がシ
リアルに入力されて来る。時刻t1よりX O”’−X
7のデータが5PC−1及び5PC−2に入力され、
8次のDCT変換を施した結果yo′〜y7′及びy8
′〜y 121’が時刻tzより入力と同タイミングで
出力される。また時刻t2より入力データX8””XL
Bが5PC−3及び5PC−4に入力され、それぞれの
出力yO“〜y7′及びy8′ 〜y1B#は、先は
ど5PC−1及び5pc−2より出力されさらに8サン
プリング時間遅延された信号と加算され、出力yO〜y
16を得る・ここでそれぞれのSPCの係数アトレイメ
モリ容量は16ワード、係数アドレス・メモリは64ワ
ードであるが、係数メモリの容量を倍とし、係数アドレ
ス・メモリを256ワードとすることにより、上記回路
中のSPCの数を半減出来る。また、その時の回路は第
21図のようになる。
に、入力端子からは信号(xk)(k=o〜15)がシ
リアルに入力されて来る。時刻t1よりX O”’−X
7のデータが5PC−1及び5PC−2に入力され、
8次のDCT変換を施した結果yo′〜y7′及びy8
′〜y 121’が時刻tzより入力と同タイミングで
出力される。また時刻t2より入力データX8””XL
Bが5PC−3及び5PC−4に入力され、それぞれの
出力yO“〜y7′及びy8′ 〜y1B#は、先は
ど5PC−1及び5pc−2より出力されさらに8サン
プリング時間遅延された信号と加算され、出力yO〜y
16を得る・ここでそれぞれのSPCの係数アトレイメ
モリ容量は16ワード、係数アドレス・メモリは64ワ
ードであるが、係数メモリの容量を倍とし、係数アドレ
ス・メモリを256ワードとすることにより、上記回路
中のSPCの数を半減出来る。また、その時の回路は第
21図のようになる。
以上の手法は1次数の2倍拡張のみでなく一般的なN倍
拡張にも応用出来る。第22図は、第1図に相当するN
倍の次数拡張を示したものである。
拡張にも応用出来る。第22図は、第1図に相当するN
倍の次数拡張を示したものである。
この場合もパイプライン処理を行なっているため、デー
タ入出カスループツト速度の低下はない、ただしパイプ
ラインによる遅延は8 (N−1)サンプリング時間だ
けある。
タ入出カスループツト速度の低下はない、ただしパイプ
ラインによる遅延は8 (N−1)サンプリング時間だ
けある。
第2の実施例を第13図に示す、これは2次元のDCT
変換を高速に処理するマルチ・プロセッサ・システムを
示している。簡単のため、各SPCは4次のDCT処理
を行なうと仮定している0本システムにより4次×4次
の2次元DCT処理を実現している。まず、画信号Xi
−が入力端子よりXOO〜XOn、X 1ONXln@
・・””、XmO”’ Xmnの順で入力される。こ
こでnは2次元画像の垂直方向位置、mは水平方向位置
を示す、入力信号は直列接続された遅延回路2に入力さ
れる。ここで各遅延回路は(n’−1)サンプリング時
間だけの遅延を行なう。それぞれの遅延回路出力は第1
3図(B)ノヨうに第1群(7)SPCXON5PCX
34:入力される。その入力データ及びタイミングは第
13図(C)に示したとおりである。これらの第1群s
pcは第13図(A)の(1)式に相当する1次元DC
T処理を行なっている。その出力dpqは第13図(C
)のタイミングで1サンプリング時間ずつシフトされて
出力される。引続き、第13図(A)の(2)式に示し
たように行列dPqを転置して後半の1次元DCT変換
を行なうが、それは第13図(B)に示したマルチプレ
クサ4により行なう、ここで同図(C)のようなdpq
のタイミングをとることにより、次段の第2群5pcy
o〜5PCY3にたえまなくデータが供給され、パイプ
ライン処理が可能となっている。最終的な2次元DCT
変換出力QIJは第13図(C,)のタイミングで出力
される。これを量子化器に入れると画像信号帯域圧縮が
可能となる。
変換を高速に処理するマルチ・プロセッサ・システムを
示している。簡単のため、各SPCは4次のDCT処理
を行なうと仮定している0本システムにより4次×4次
の2次元DCT処理を実現している。まず、画信号Xi
−が入力端子よりXOO〜XOn、X 1ONXln@
・・””、XmO”’ Xmnの順で入力される。こ
こでnは2次元画像の垂直方向位置、mは水平方向位置
を示す、入力信号は直列接続された遅延回路2に入力さ
れる。ここで各遅延回路は(n’−1)サンプリング時
間だけの遅延を行なう。それぞれの遅延回路出力は第1
3図(B)ノヨうに第1群(7)SPCXON5PCX
34:入力される。その入力データ及びタイミングは第
13図(C)に示したとおりである。これらの第1群s
pcは第13図(A)の(1)式に相当する1次元DC
T処理を行なっている。その出力dpqは第13図(C
)のタイミングで1サンプリング時間ずつシフトされて
出力される。引続き、第13図(A)の(2)式に示し
たように行列dPqを転置して後半の1次元DCT変換
を行なうが、それは第13図(B)に示したマルチプレ
クサ4により行なう、ここで同図(C)のようなdpq
のタイミングをとることにより、次段の第2群5pcy
o〜5PCY3にたえまなくデータが供給され、パイプ
ライン処理が可能となっている。最終的な2次元DCT
変換出力QIJは第13図(C,)のタイミングで出力
される。これを量子化器に入れると画像信号帯域圧縮が
可能となる。
以上のシステムは容易に拡張可能である。また次数を上
げるために第12図の実施例と併用することも可能であ
る。
げるために第12図の実施例と併用することも可能であ
る。
さらに、第11図までの実施例で述べたようにSPCの
係数が書換え可能であるため、適応化DCT処理も可能
である。
係数が書換え可能であるため、適応化DCT処理も可能
である。
本方式では信号の流れが明確であるが、実際の応用に対
しては速度が早過ぎるという問題がある。
しては速度が早過ぎるという問題がある。
つまり、1走査処理時間で同時に4走査線分を処理する
ため、残りの3走査線ではプロセッサが休止してしまう
、そこでより効率的なマルチ・プロセッサの構成方法を
以下の実施例に示す。
ため、残りの3走査線ではプロセッサが休止してしまう
、そこでより効率的なマルチ・プロセッサの構成方法を
以下の実施例に示す。
次の実施例では第14図に示すように5pc−1が入力
信号Aを逐次−次元DCT変換して行く。
信号Aを逐次−次元DCT変換して行く。
その出力BはSPC内のパイプライン処理により4サイ
クルの遅延はあるものの、1サンプリング・クロックご
とに1変換出力(dla)を出力する。
クルの遅延はあるものの、1サンプリング・クロックご
とに1変換出力(dla)を出力する。
この出力は4本のF I F O(First in
First on)メモリ11に接続されており、第1
走査線の変換出力はFIFO−1に、第2走査線のもの
はFIFO−2に、以下同様に第4走査線のものはFI
FO−4に書込まれる。各FIFOの最大記憶容量は1
水平走査線分の画素である6次段ブロックの走査では再
びF I FO−1より書込まれる。各FIFOの書込
みは4水平走査に1回のみ行なわれ、残りの3水平走査
期間は書込み休止している。
First on)メモリ11に接続されており、第1
走査線の変換出力はFIFO−1に、第2走査線のもの
はFIFO−2に、以下同様に第4走査線のものはFI
FO−4に書込まれる。各FIFOの最大記憶容量は1
水平走査線分の画素である6次段ブロックの走査では再
びF I FO−1より書込まれる。各FIFOの書込
みは4水平走査に1回のみ行なわれ、残りの3水平走査
期間は書込み休止している。
上記各FIFOは4サンプリング・クロックに1データ
の割で読出される。この4サンプリング・ブロック期間
の内1クロック中にデータを出力し、残り3クロック区
間はハイインピーダンス状態とする。これらを第15図
(A)、(B)のC−1〜G−4のタイミングで読出す
ことにより。
の割で読出される。この4サンプリング・ブロック期間
の内1クロック中にデータを出力し、残り3クロック区
間はハイインピーダンス状態とする。これらを第15図
(A)、(B)のC−1〜G−4のタイミングで読出す
ことにより。
端子りには1ブロツク(4×4画素)の−次元DCT変
換結果が16クロツクにわたってシリアルに出力される
。これにより4×4ブロツクを1水平走査した結果が4
水平走査期間(4H)にわたり出力される。
換結果が16クロツクにわたってシリアルに出力される
。これにより4×4ブロツクを1水平走査した結果が4
水平走査期間(4H)にわたり出力される。
この1次DCT変換結果を後続の5PC−2で2次元D
CT変換する。その出力Eは第2のFIFOアレイに入
力され第15図(A)のF、−1〜F−4のタイミング
で書込まれる。
CT変換する。その出力Eは第2のFIFOアレイに入
力され第15図(A)のF、−1〜F−4のタイミング
で書込まれる。
第2のFIFOアレイからは第15図(B)のG−1〜
G−4のタイミングでデータが読み出される。これによ
り、同図(B)のHに示したように2次元DCT変換出
力のタイミングは入力Aと同一になる。
G−4のタイミングでデータが読み出される。これによ
り、同図(B)のHに示したように2次元DCT変換出
力のタイミングは入力Aと同一になる。
本方式では2個のSPC及び2H個のFIF○メモリを
用いることによりnXn次のリアル・タイムDCT変換
が可能となった。
用いることによりnXn次のリアル・タイムDCT変換
が可能となった。
SPC内の係数メモリは2nワード、係数アドレス・メ
モリとしてはnzワード必要である。
モリとしてはnzワード必要である。
次の実施例では第16図(A)、(B)に示すように第
1の5PC−1が入力信号Aを逐次−次元DCT変換し
て行く。その出力Bは4サイクルの遅延はあるものの、
パイプライン処理により1画素(xiJ)入力ごとに1
変換出力(d IJ)を出力した。この出力Bをマルチ
プレクサ4により4種のF I F O(First
In First 0ut)メモリにふりわける。それ
ぞれの最大容量は4H,3H。
1の5PC−1が入力信号Aを逐次−次元DCT変換し
て行く。その出力Bは4サイクルの遅延はあるものの、
パイプライン処理により1画素(xiJ)入力ごとに1
変換出力(d IJ)を出力した。この出力Bをマルチ
プレクサ4により4種のF I F O(First
In First 0ut)メモリにふりわける。それ
ぞれの最大容量は4H,3H。
2H,LHである。ここでIHは1水平線の画素数であ
る。第1走査線は4HFIFOに第2走査線は3HFI
FOに第3走査線は2HFIFOに第4走査線はIHF
IFOにそれぞれふりわける。つまり各FIFOは4走
査に1回だけ書込みを受ける。また、各FIF○はIH
のみであれば十分で、残りの遅延はライン・メモリで済
む。
る。第1走査線は4HFIFOに第2走査線は3HFI
FOに第3走査線は2HFIFOに第4走査線はIHF
IFOにそれぞれふりわける。つまり各FIFOは4走
査に1回だけ書込みを受ける。また、各FIF○はIH
のみであれば十分で、残りの遅延はライン・メモリで済
む。
例えば4HFIFOはIHのFIFOと3Hのラインメ
モリで実現出来る。FIFOは4クロツク・サイクルで
1画素信号を出力する。つまり4線走査で各FIFOか
ら一走査線の情報が出力される。そのタイミングはC−
1〜C−4に示したとおりである。これをマルチプレク
サ4によりDのようにそろえ、これにより、データを転
置したことになる。このデータを第2の5PC−2によ
り1次元DCT変換して2次元DCT変換を実現する6
木刀式では、nXn次の2次元DCT変換を2個のsp
c、(n−1) ・n/2 H分のライン・メモリ
及びn個のl4FOメモリのみで実現出来る。ただし、
係数メモリは2nワード、係数アドレス・メモリはn2
ワード必要である。
モリで実現出来る。FIFOは4クロツク・サイクルで
1画素信号を出力する。つまり4線走査で各FIFOか
ら一走査線の情報が出力される。そのタイミングはC−
1〜C−4に示したとおりである。これをマルチプレク
サ4によりDのようにそろえ、これにより、データを転
置したことになる。このデータを第2の5PC−2によ
り1次元DCT変換して2次元DCT変換を実現する6
木刀式では、nXn次の2次元DCT変換を2個のsp
c、(n−1) ・n/2 H分のライン・メモリ
及びn個のl4FOメモリのみで実現出来る。ただし、
係数メモリは2nワード、係数アドレス・メモリはn2
ワード必要である。
第17図は他の実施例を示したものである。ここでは(
3)式のように入力信号Y、I、Qに係数行列01Jを
乗じ、出力R,G、Bを得る。各入力信号、出力信号は
毎サンプリング時間ごとに更新される。さて、入力信号
Y、I、Qにはそれぞれ遅延なし、1サンプリング時間
遅延、2サンプリング時間遅延が施こされている。この
こと及びマルチプレクサ4により5PC1〜3には各サ
ンプリング時間iにおけるデータのセットYi* It
pQi を順次入力することが出来る。それぞれのS
PCはベクトル・ベクトル乗算を行ない、順次Rs +
G le B t データを出力する。それらの出力
をマルチプレクサにより処理してR,G、Bのみの信号
を選択し、適当な遅延を加えてタイミングのそろったR
、G、B信号を出力する。
3)式のように入力信号Y、I、Qに係数行列01Jを
乗じ、出力R,G、Bを得る。各入力信号、出力信号は
毎サンプリング時間ごとに更新される。さて、入力信号
Y、I、Qにはそれぞれ遅延なし、1サンプリング時間
遅延、2サンプリング時間遅延が施こされている。この
こと及びマルチプレクサ4により5PC1〜3には各サ
ンプリング時間iにおけるデータのセットYi* It
pQi を順次入力することが出来る。それぞれのS
PCはベクトル・ベクトル乗算を行ない、順次Rs +
G le B t データを出力する。それらの出力
をマルチプレクサにより処理してR,G、Bのみの信号
を選択し、適当な遅延を加えてタイミングのそろったR
、G、B信号を出力する。
以上の処理はより多入力の行列・ベクトル積にも適用可
能である。
能である。
さらに以上の実施例は第23図のように一般化され得る
。ここで、各SPC内のプログラム及び係数データは共
通データバス6及びアドレス・バス7により設定される
。また、820間の結線は固定もしくは図に示したクロ
スバ−スイッチ8によりプログラム可能とする。アレイ
の組方は、このクロスバ−の他に共通バス、ツリー、メ
ツシュ。
。ここで、各SPC内のプログラム及び係数データは共
通データバス6及びアドレス・バス7により設定される
。また、820間の結線は固定もしくは図に示したクロ
スバ−スイッチ8によりプログラム可能とする。アレイ
の組方は、このクロスバ−の他に共通バス、ツリー、メ
ツシュ。
シャツフルさらには超立方格子等が考えられる3これら
のSPC及びクロスバ−・スイッチはホスト・プロセッ
サ9により制御され、さらにそのホスト・プロセッサ9
は外部のホスト・マシーン10により制御されている。
のSPC及びクロスバ−・スイッチはホスト・プロセッ
サ9により制御され、さらにそのホスト・プロセッサ9
は外部のホスト・マシーン10により制御されている。
また、各SPC周辺に配置される遅延回路の遅延量、接
続もプログラマブルとする場合がある。
続もプログラマブルとする場合がある。
本発明によれば、ディスクリート・コサイン変換はじめ
行列・ベクトル積が少ない数の乗算器。
行列・ベクトル積が少ない数の乗算器。
加算器で高速に実現出来る。例えば8次の1次元ディス
クリート・コサイン変換を行なう場合、従来のアルゴリ
ズムでは1サンプルに37ステツプの処理時間を要して
いたものが、規則的にパイプライン処理を行なうことに
より1サンプル、1ステツプで処理可能となった。(遅
延は8ステツプ)また、制御メモリとマクロ・ステップ
制御命令を組み合わせることにより、メモリのワード数
を64ワードから8ワードに低減することが出来た。
クリート・コサイン変換を行なう場合、従来のアルゴリ
ズムでは1サンプルに37ステツプの処理時間を要して
いたものが、規則的にパイプライン処理を行なうことに
より1サンプル、1ステツプで処理可能となった。(遅
延は8ステツプ)また、制御メモリとマクロ・ステップ
制御命令を組み合わせることにより、メモリのワード数
を64ワードから8ワードに低減することが出来た。
さらに係数メモリを係数アドレス・メモリでアクセスす
ることにより、8ビツトのデータ幅で、メモリを8 X
64bit= 512bitから8X8+3X64=
256bitに低減することが可能となった。
ることにより、8ビツトのデータ幅で、メモリを8 X
64bit= 512bitから8X8+3X64=
256bitに低減することが可能となった。
さらに、本発明によれば、処理速度を低下させることな
く、DCT処理の次数拡張、2次元への展開等が可能と
なる。また処理は一般的な行列・ベクトル乗算処理にも
適用可能である。
く、DCT処理の次数拡張、2次元への展開等が可能と
なる。また処理は一般的な行列・ベクトル乗算処理にも
適用可能である。
第1図は本発明の一実施例によるプロセッサの回路ブロ
ック図、第2図および第3図は従来の信号処理アルゴリ
ズム、第4図は出願前に検討されたプロセッサの回路ブ
ロック図、第5図は本発明の信号処理アルゴリズム、第
6図は第1図の回路構成を具体的に展開した回路図、第
7図は本発明の一実施例に用いられる処理プログラム、
第8図および第9図は本発明の一実施例に用いられる制
御メモリおよびマクロ・ステップ制御メモリのマイクロ
・コード、第10図は本発明の一実施例に用いられる制
御回路の回路図、第11図は本発明の一実施例に用いら
れる係数アドレス・メモリ及び係数メモリの回路図、第
12図は本発明の他の実施例によるマルチ・プロセッサ
・システムのブロック図、第13図は本発明のDCT高
速変換に好適な実施例のシステムのブロック図、第14
図は本発明の他の実施例のシステムのブロック図、第1
5図はDCT変換に関係する動作説明図、第16図(A
)および(B)は本発明の他の実施例によるシステムの
ブロック図および動作説明図。 第17図は本発明の他の実施例によるシステムのブロッ
ク図および動作説明図、第18図乃至第20図はDCT
変換の説明図、第21図および第22図は第12図の実
施例で回路を半減した実施例、第23図は本発明を一般
化した実施例のプロZ j 図 4 イ弗斂メモリ 5 アa7六力匹7 6アΦエムL−タ ノ/ 30コf回y芦− 第 2 図 第 3 区 31 710薄回路、 寸閃 ”) −(N(Y”1大10噴−−\ 、へ
\−輌\ ミ 蔓 6 図 万υT 4 イ早婁Flf−ν 16 ラッチ回路/I
乃口$Im退tト 第7図 冨 8 図 第 9 図 b’F” bt bz、A4 ztJ延回路 z2 イシハ・−り 第11図 19 了#−Lズテ“コータ゛ 第1Z図 CB) 4711、−+ノ°I、7プ 菖74図 1 イ含うtス欠理7’[7t、/プII FI
Fνノモリ ′¥J/6図<A) ノ 45号ノ1えPフゝD仁シブ 4 マノLチフ゛ムクプ 箋、 7. 図 。 // FIFi
lfソ第 77 図 1マ1.+、7’L 7ヅ ■ 13 図 (A)
(B)纂 19 図 tEi’−’(−0−Km=JKmlc#(K+−!z
)疋N=/6 看 22 図 ! /i ZlL+7−7プ
ック図、第2図および第3図は従来の信号処理アルゴリ
ズム、第4図は出願前に検討されたプロセッサの回路ブ
ロック図、第5図は本発明の信号処理アルゴリズム、第
6図は第1図の回路構成を具体的に展開した回路図、第
7図は本発明の一実施例に用いられる処理プログラム、
第8図および第9図は本発明の一実施例に用いられる制
御メモリおよびマクロ・ステップ制御メモリのマイクロ
・コード、第10図は本発明の一実施例に用いられる制
御回路の回路図、第11図は本発明の一実施例に用いら
れる係数アドレス・メモリ及び係数メモリの回路図、第
12図は本発明の他の実施例によるマルチ・プロセッサ
・システムのブロック図、第13図は本発明のDCT高
速変換に好適な実施例のシステムのブロック図、第14
図は本発明の他の実施例のシステムのブロック図、第1
5図はDCT変換に関係する動作説明図、第16図(A
)および(B)は本発明の他の実施例によるシステムの
ブロック図および動作説明図。 第17図は本発明の他の実施例によるシステムのブロッ
ク図および動作説明図、第18図乃至第20図はDCT
変換の説明図、第21図および第22図は第12図の実
施例で回路を半減した実施例、第23図は本発明を一般
化した実施例のプロZ j 図 4 イ弗斂メモリ 5 アa7六力匹7 6アΦエムL−タ ノ/ 30コf回y芦− 第 2 図 第 3 区 31 710薄回路、 寸閃 ”) −(N(Y”1大10噴−−\ 、へ
\−輌\ ミ 蔓 6 図 万υT 4 イ早婁Flf−ν 16 ラッチ回路/I
乃口$Im退tト 第7図 冨 8 図 第 9 図 b’F” bt bz、A4 ztJ延回路 z2 イシハ・−り 第11図 19 了#−Lズテ“コータ゛ 第1Z図 CB) 4711、−+ノ°I、7プ 菖74図 1 イ含うtス欠理7’[7t、/プII FI
Fνノモリ ′¥J/6図<A) ノ 45号ノ1えPフゝD仁シブ 4 マノLチフ゛ムクプ 箋、 7. 図 。 // FIFi
lfソ第 77 図 1マ1.+、7’L 7ヅ ■ 13 図 (A)
(B)纂 19 図 tEi’−’(−0−Km=JKmlc#(K+−!z
)疋N=/6 看 22 図 ! /i ZlL+7−7プ
Claims (1)
- 【特許請求の範囲】 1、実時間処理の高速ディジタル信号処理プロセッサに
おいて、マシン・サイクル毎に読出される制御メモリに
加え、特定のマシン・サイクル周期で読出されるマクロ
・ステップ制御メモリを設けたことを特徴とする信号処
理プロセッサ。 2、実時間処理の高速ディジタル信号処理プロセッサに
おいて、演算に用いる係数メモリのアドレスを保持する
係数アドレス・メモリを設けたことを特徴とする信号処
理プロセッサ。 3、実時間処理の高速ディジタル信号処理プロセッサに
おいて、入力信号のサンプリング速度以上のマシン・サ
イクルで動作する高速信号処理部分と、処理された信号
を該サンプリング時間に同期させて装置外に出力するた
めのバッファー回路を設けたことを特徴とする信号処理
プロセッサ。 4、特許請求の範囲第3項記載の高速信号処理プロセッ
サにおいて、係数メモリに入力、出力が独立にアクセス
可能な2ポート・メモリを使用し、かつ入力、出力が同
時アクセスされない時に書込みを行ない、かつその書込
み終了信号を外部へ出力するメモリ書込み制御回路を設
けたことを特徴とする信号処理プロセッサ。 5、行列・ベクトル乗算を行なうプロセッサを複数個用
いた信号処理系において、該プロセッサの特定のプロセ
ッサ群の入力を共通とし、該群に属するプロセッサの各
々の出力に同一の遅延を施し、遅延された出力、他群の
遅延または遅延されていない出力と加算し、さらにその
加算出力に適当な遅延を施したことを特徴とする信号処
理マルチ・プロセッサ・システム。 6、行列・ベクトル乗算を行なうプロセッサを複数個用
いた信号処理系において、入力信号に適当な遅延を加え
る回路と、遅延された入力を適当な該プロセッサに割当
てるスイッチ群と、該プロセッサを適当な出力端子に割
当てるスイッチ群と、上記出力に適当な遅延を与える回
路を設けたことを特徴とする信号処理マルチ・プロセッ
サ・システム。 7、行列・ベクトル乗算を行なうプロセッサを複数個用
いた信号処理系において、入力に適当な遅延を施し、第
1のプロセッサ群に入力する回路と、第1群プロセッサ
の出力を第2群に属するプロセッサの適当なものの入力
に引渡すスイッチ群と、第2のプロセッサ群を設けたこ
とを特徴とする信号処理マルチ・プロセッサ・システム
。 8、第5項乃至第7項記載のマルチ・プロセッサ・シス
テムにおいて、該プロセッサを制御するホスト・プロセ
ッサ及び共通信号、制御信号バス・ラインを設けたこと
を特徴とする信号処理マルチ・プロセッサ・システム。 9、第1プロセッサの第1走査線DCT変換結果をnラ
イン長のFIFO(First in First o
ut)memorryに、第2走査線の変換出力をn−
1ライン長のFIFOメモリに、同様にして第i走査線
の変換出力をn−i+1ライン長のFIFOメモリに入
力し、各FIFO出力を第2プロセッサに順次入力する
ことにより2次元DCT変換を行なう信号処理マルチ・
プロセッサ・システム。 10、特許請求の第9項記載の信号処理マルチ・プロセ
ッサにおいてmライン長FIFOメモリをm−1ライン
長のメモリ及び1ライン長のFIFOで構成した信号処
理マルチ・プロセッサ・システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63063313A JP2690932B2 (ja) | 1988-03-18 | 1988-03-18 | ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム |
KR1019890003321A KR0130772B1 (ko) | 1988-03-18 | 1989-03-17 | 고속디지탈신호처리프로세서 |
US07/324,830 US4945506A (en) | 1988-03-18 | 1989-03-17 | High speed digital signal processor capable of achieving realtime operation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63063313A JP2690932B2 (ja) | 1988-03-18 | 1988-03-18 | ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01237765A true JPH01237765A (ja) | 1989-09-22 |
JP2690932B2 JP2690932B2 (ja) | 1997-12-17 |
Family
ID=13225666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63063313A Expired - Lifetime JP2690932B2 (ja) | 1988-03-18 | 1988-03-18 | ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US4945506A (ja) |
JP (1) | JP2690932B2 (ja) |
KR (1) | KR0130772B1 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5267185A (en) * | 1989-04-14 | 1993-11-30 | Sharp Kabushiki Kaisha | Apparatus for calculating matrices |
US5208770A (en) * | 1989-05-30 | 1993-05-04 | Fujitsu Limited | Accumulation circuit having a round-off function |
US5077677A (en) * | 1989-06-12 | 1991-12-31 | Westinghouse Electric Corp. | Probabilistic inference gate |
FR2656710A1 (fr) * | 1989-12-29 | 1991-07-05 | Radiotechnique Compelec | Microcontroleur pour l'execution rapide d'un grand nombre d'operations decomposable en sequence d'operations de meme nature. |
US5128888A (en) * | 1990-04-02 | 1992-07-07 | Advanced Micro Devices, Inc. | Arithmetic unit having multiple accumulators |
JPH05197741A (ja) * | 1991-06-06 | 1993-08-06 | Lsi Logic Corp | インターリーブド乗算器累算器 |
US5245562A (en) * | 1991-09-17 | 1993-09-14 | The Johns Hopkins University | Accumulating arithmetic memory integrated circuit |
US5206822A (en) * | 1991-11-15 | 1993-04-27 | Regents Of The University Of California | Method and apparatus for optimized processing of sparse matrices |
US5204830A (en) * | 1992-02-13 | 1993-04-20 | Industrial Technology Research Institute | Fast pipelined matrix multiplier |
US6965644B2 (en) * | 1992-02-19 | 2005-11-15 | 8×8, Inc. | Programmable architecture and methods for motion estimation |
US5524259A (en) * | 1992-04-28 | 1996-06-04 | Kabushiki Kaisha Toshiba | Processor system having an external arithmetic device for high speed execution of computation of data |
JPH06175821A (ja) * | 1992-12-10 | 1994-06-24 | Fujitsu Ltd | 演算装置 |
JP3693367B2 (ja) * | 1994-07-28 | 2005-09-07 | 富士通株式会社 | 積和演算器 |
KR100186918B1 (ko) * | 1994-10-21 | 1999-05-01 | 모리시다 요이치 | 신호처리장치 |
JPH08241301A (ja) * | 1995-03-07 | 1996-09-17 | Nec Corp | 直交変換処理装置 |
JP2636789B2 (ja) * | 1995-03-31 | 1997-07-30 | 日本電気株式会社 | マイクロプロセッサ |
FR2745647B3 (fr) * | 1996-03-01 | 1998-05-29 | Sgs Thomson Microelectronics | Coprocesseur d'arithmetique modulaire permettant de realiser des operations non modulaires rapidement |
JPH1055352A (ja) * | 1996-08-08 | 1998-02-24 | Fuji Xerox Co Ltd | 浮動小数点数累積加算装置 |
US6377619B1 (en) * | 1997-09-26 | 2002-04-23 | Agere Systems Guardian Corp. | Filter structure and method |
JP3524747B2 (ja) | 1998-01-30 | 2004-05-10 | 三洋電機株式会社 | 離散コサイン変換回路 |
JP3547971B2 (ja) | 1998-01-30 | 2004-07-28 | 三洋電機株式会社 | 離散コサイン変換回路及びその動作方法 |
JP3547972B2 (ja) * | 1998-01-30 | 2004-07-28 | 三洋電機株式会社 | 離散コサイン変換回路 |
AU2578001A (en) * | 1999-12-10 | 2001-06-18 | Broadcom Corporation | Apparatus and method for reducing precision of data |
US6895421B1 (en) | 2000-10-06 | 2005-05-17 | Intel Corporation | Method and apparatus for effectively performing linear transformations |
US10795678B2 (en) * | 2018-04-21 | 2020-10-06 | Microsoft Technology Licensing, Llc | Matrix vector multiplier with a vector register file comprising a multi-port memory |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61140213A (ja) * | 1984-12-12 | 1986-06-27 | Nec Corp | 2次元デイジタルフイルタ |
JPS61231639A (ja) * | 1985-04-05 | 1986-10-15 | レイセオン カンパニ− | アドレス・ジエネレータ |
JPS61296462A (ja) * | 1985-06-25 | 1986-12-27 | Yokogawa Medical Syst Ltd | 高速デ−タ処理装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8431925D0 (en) * | 1984-12-18 | 1985-01-30 | Secr Defence | Digital data processor |
DE3677051D1 (de) * | 1985-05-17 | 1991-02-28 | Nec Corp | Verarbeitungsschaltung, die es erlaubt den akkumulationsdurchsatz zu erhoehen. |
US4787057A (en) * | 1986-06-04 | 1988-11-22 | General Electric Company | Finite element analysis method using multiprocessor for matrix manipulations with special handling of diagonal elements |
US4760517A (en) * | 1986-10-17 | 1988-07-26 | Integrated Device Technology, Inc. | Thirty-two bit, bit slice processor |
-
1988
- 1988-03-18 JP JP63063313A patent/JP2690932B2/ja not_active Expired - Lifetime
-
1989
- 1989-03-17 US US07/324,830 patent/US4945506A/en not_active Expired - Fee Related
- 1989-03-17 KR KR1019890003321A patent/KR0130772B1/ko not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61140213A (ja) * | 1984-12-12 | 1986-06-27 | Nec Corp | 2次元デイジタルフイルタ |
JPS61231639A (ja) * | 1985-04-05 | 1986-10-15 | レイセオン カンパニ− | アドレス・ジエネレータ |
JPS61296462A (ja) * | 1985-06-25 | 1986-12-27 | Yokogawa Medical Syst Ltd | 高速デ−タ処理装置 |
Also Published As
Publication number | Publication date |
---|---|
KR0130772B1 (ko) | 1998-04-15 |
US4945506A (en) | 1990-07-31 |
JP2690932B2 (ja) | 1997-12-17 |
KR890015157A (ko) | 1989-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH01237765A (ja) | ディジタル信号処理プロセッサおよびディシタル信号処理プロセッサシステム | |
JP6977239B2 (ja) | 行列乗算器 | |
EP0353223B1 (en) | Two-dimensional discrete cosine transform processor | |
US5089982A (en) | Two dimensional fast Fourier transform converter | |
US4821224A (en) | Method and apparatus for processing multi-dimensional data to obtain a Fourier transform | |
JP6864224B2 (ja) | プロセッサ、情報処理装置及びプロセッサの動作方法 | |
US5278781A (en) | Digital signal processing system | |
JPH0622033B2 (ja) | サンプルベクトルの離散余弦変換を計算する回路 | |
JPH04232562A (ja) | コンピユータ装置 | |
CN111028136B (zh) | 一种人工智能处理器处理二维复数矩阵的方法和设备 | |
CN117973443B (zh) | 神经网络加速方法及装置、加速器、存储介质 | |
US5434808A (en) | Highly parallel discrete cosine transform engine | |
US5477469A (en) | Operation device and operation method for discrete cosine transform and inverse discrete cosine transform | |
CN111143766A (zh) | 人工智能处理器处理二维复数矩阵的方法和设备 | |
JPH03100771A (ja) | アレイ処理方法 | |
US5864515A (en) | Sonar data processing | |
Nielsen et al. | A scalable parallel 2D wavelet transform algorithm | |
Ramachandran et al. | EPLD-based architecture of real time 2D-discrete cosine transform and quantization for image compression | |
Kim et al. | 2-D discrete cosine transforms on a fine grain array processor | |
KR100248082B1 (ko) | 이차원이산여현변환장치 | |
KR0130441B1 (ko) | 2차원 이산 코사인 변환기 | |
Eki et al. | An on-sensor bit-serial column-parallel processing architecture for high-speed discrete Fourier transform | |
JP2023532573A (ja) | 計算装置、集積回路チップ、ボードカード、電子機器と計算方法 | |
JPH09128375A (ja) | 時系列データの周波数解析方法 | |
CN111124996A (zh) | 通过人工智能处理器处理一维复数数组的方法和设备 |