JPH06292178A

JPH06292178A - 適応形ビデオ信号演算処理装置

Info

Publication number: JPH06292178A
Application number: JP7476893A
Authority: JP
Inventors: Eiji Iwata; 英次岩田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1993-03-31
Filing date: 1993-03-31
Publication date: 1994-10-18
Anticipated expiration: 2019-07-28
Also published as: JP3546437B2; EP0644492B1; ATE228255T1; US5594679A; EP0644492A1; AU6292194A; CN1108865A; CN1149496C; EP0644492A4; WO1994023384A1; AU668298B2

Abstract

(57)【要約】【目的】離散コサイン変換／逆離散コサイン変換、量
子化／逆量子化、動きベクトル検出、動き補償、内積演
算、画像データ加算および画像データ差分処理などの画
像圧縮符号化／伸長復号化（コーデック）処理を、ｍｘ
ｎの大きさのブロックの画像データについて、適応的に
行う演算処理装置を提供する。【構成】それぞれが、加算、減算、各種論理演算、大
小比較、差分絶対値演算、バタフライ加算・減算処理を
行ない、乗算を行い、累積を行う複数の並列に設けられ
た演算ユニット１〜４、これら演算ユニットのうち、隣
接する演算ユニットを接続するように配設された相互接
続パイプラインメモリ５〜７、および、演算ユニット１
〜４に入力データを選択的に印加するデータセレクタ４
１〜４４を有し、相互接続パイプラインメモリを介して
隣接する演算ユニットを結合し、かつ、前記演算ユニッ
ト内の内部パイプラインメモリを選択して所定のデータ
流れ経路を構成し、所望のビデオ信号処理を行う。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、例えば、数値計算、画
像処理、グラフィックス処理等に用いられる計算機シス
テムにおける中央処理装置（プロセッサ）に関するもの
であり、特に画像圧縮符号化（コーデック）のようなビ
デオ信号処理に好適なディジタルシグナルプロセッサ
（ＤＳＰ）などの適応形ビデオ信号演算処理装置に関す
る。

【０００２】

【従来の技術】近年、ＣＣＩＴＴＨ．２６１勧告やＭ
ＰＥＧ等の画像圧縮符号化／伸長復号化標準に基づく画
像コーデック用ディジタルシグナルプロセッサ（ＤＳ
Ｐ）が多数提案されている。本発明は、これらのＤＳＰ
のうちで、文献、Ｙａｍａｕｃｈｉ，ｅｔａｌ，“Ａ
ｒｃｈｉｔｅｃｔｕｒｅａｎｄＩｍｐｌｅｍｅｎｔ
ａｔｉｏｎｏｆａＨｉｇｈｌｙＰａｒａｌｌｅｌ
Ｓｉｎｇｌｅ−ＣｈｉｐＶｉｄｅｏＤＳＰ“，ＩＥ
ＥＥＴＲＡＮＳＡＣＴＩＯＮＳＯＮＣＩＲＣＵＩ
ＴＳＡＮＤＳＹＳＴＥＭＳＦＯＲＶＩＤＥＯ
ＴＥＣＨＮＯＬＯＧＹ，ＶＯＬ．２，ＮＯ．２，ＪＵＮ
Ｅ１９９２，ｐｐ．２０７−２２０、に提案されてい
るように、算術論理演算ユニット、乗算器、累算器等か
らなる演算ユニットを複数有し、それらの演算ユニット
が単一の命令流により複数のデータを並列に処理する
「単一命令ストリーム・多重データストリーム：ＳＩＭ
Ｄ(Single Instruction stream Multiple Data strea
m)」制御方式のＤＳＰに関する。この文献に記載されて
いる構成については図１７を参照して後述する。このＤ
ＳＰの演算ユニットは、演算器をパイプライン接続可能
であり、演算パイプライン処理も行う。

【０００３】まず、演算パイプラインの原理について簡
単に説明する。図１８に、演算パイプラインの構成例を
示す。この演算パイプラインは、２入力Ｘ，Ｙを算術論
理演算ユニット（ＡＬＵ）Ａ１において加算した後に、
加算結果と係数メモリＡ３からの係数とを乗算器Ａ２に
おいて乗算し、さらにその乗算結果を累算器Ａ３におい
て累算する。このような演算の連鎖を複数のデータに対
して連続的に行うことを演算パイプライン処理と呼ぶ。

【０００４】図１９は図１８の演算パイプラインにおけ
る処理のタイムチャートを示すグラフである。簡単化の
ため、演算パイプラインの各演算器Ａ１，Ａ２，Ａ４は
１クロックサイクルで演算を完了するものとする。図１
９における処理単位は、２入力端子に入力されるデータ
の組（Ｘ，Ｙ）を意味する。図１９に示すように、例え
ばｉ番目の処理単位についてみると、（ｋ−１）番目の
クロックサイクルにおいてＡＬＵ（Ａ１）が加算処理を
行い、ｋ番目のクロックサイクルにおいて乗算器Ａ２が
乗算処理を行い、（ｋ＋１）番目のクロックサイクルに
おいて累算器Ａ４が累積処理を行う。また、ｋ番目のク
ロックサイクルについてみると、加算処理、乗算処理を
終えた（ｉ−１）番目の処理単位が累算器Ａ４において
累算され、加算を終えたｉ番目の処理単位が乗算器Ａ２
において乗算され、（ｉ＋１）番目の処理単位が加算器
Ａ１において加算されている。このような動作を複数の
処理単位に対して繰り返し行うことにより演算パイプラ
イン処理が実現できる。

【０００５】次に、従来の技術について説明する。ここ
では、４組の演算ユニットが単一の命令流により複数の
データを並列に処理する、上述した文献において提案さ
れている「単一命令ストリーム・多重データストリー
ム：ＳＩＭＤ」制御方式のＤＳＰを考える。前提とし
て、各演算ユニットは、加算、減算および論理演算を行
う算術論理演算ユニット（ＡＬＵ）、乗算器、累算器の
３種の演算器からなるとする。また、簡単化のため、各
演算器は1クロックサイクルで演算を完了するものとす
る。したがって、このＤＳＰは、１クロックサイクルで
最大１２演算（例えば、４加算、４乗算、４累算）を実
行することができる。さらに、このＤＳＰは、演算器へ
データを供給あるいは演算器からのデータを格納するた
めのデータメモリをチップ内あるいはチップ外に持つと
する。

【０００６】最初に、上記の前提の下で、最も自由度の
高い演算パイプラインを実現する構成について述べる。
図２０（Ａ）〜（Ｄ）に示したように、最も自由度の高
い演算パイプラインは、データメモリをパイプラインレ
ジスタとみなし、ソフトウェアにより演算パイプライン
処理（ソフトウェア・パイプライニングと呼ばれる）を
行うことにより実現できる。このとき、各々の演算器は
データメモリを介してのみ結合されている。なお、図２
０（Ａ）〜（Ｄ）はそれぞれ、４個の並列に設けられた
演算処理ユニットの動作形態を示す。したがって、デー
タメモリは、１クロックサイクル毎にすべての演算器の
入力に対して任意のデータを供給し、同時にすべての演
算器からの出力のデータを任意のアドレスに格納する必
要がある。データメモリのポート数は、図２０（Ａ）〜
（Ｄ）の図解から判るように、演算器への入力のために
１６ポート必要で、演算器からの出力のために１２ポー
ト必要である。したがって、合計２８ポートのマルチポ
ートメモリが必要である。このポート数は、現在の半導
体回路技術と考え合わせてみて、非現実的であり、事実
上実現困難である。

【０００７】そこで、データメモリをバンク分けして、
１バンク当たりのポート数を減らす手法が考えられる。
しかしながら、例えばデータメモリを４バンクに分割し
たとしても、上記の例では、なおも１バンク当たり７ポ
ートのマルチポートメモリを必要とする。したがって、
アプリケーション・プログラムに応じて演算パイプライ
ンの自由度をある程度限定し、データメモリのポート数
の減少を図るアプローチを採ることができる。

【０００８】例えば、上述した文献に提案されているよ
うに、ＡＬＵ、乗算器、累算器からなる演算パイプライ
ンを４本備え、演算パイプラインの入出力のみをデータ
メモリに接続する。この場合のデータメモリに要求され
るポート数は、演算パイプラインへの入力のために８ポ
ート、演算パイプラインからの出力のために４ポートと
なる。

【０００９】

【発明が解決しようとする課題】ところが、上述した従
来のＤＳＰの演算パイプラインの構成では、演算パイプ
ラインの自由度に制約がある。例えば、乗算した後に論
理演算を行う演算については、パイプライン演算ができ
ない。この場合、すべてのデータに対して、まず乗算器
を用いて乗算のパイプライン処理を行い、次に乗算後の
すべてのデータに対して、ＡＬＵを用いて論理演算のパ
イプライン処理を行う。したがって、乗算時はＡＬＵが
使用されず、論理演算時は乗算器が使用されていないた
め、演算器の使用効率が低下し、性能低下を招く。ま
た、演算パイプライン処理を２回に分けて行うため、演
算パイプラインの立ち上げ時の初期設定が２回必要とな
る。さらに、上述した従来のＤＳＰにおいては、１回目
の演算パイプライン処理が完了した時点で中間結果を格
納する必要があるので、データメモリ容量が増大する。

【００１０】画像コーデックの要素処理では、上記の例
のように乗算した後に論理演算を行う演算の他に、乗算
を連続して行う演算や、乗算した結果同士を加算する演
算等が必要となる。このような演算のそれぞれについ
て、上述した問題と同様の問題が発生する。

【００１１】また、上述した従来のＤＳＰの演算パイプ
ライン構成では、本出願人による、特許出願、特願平４
年３３８１８３号、「２次元８ｘ８離散コサイン変換回
路および２次元８ｘ８離散コサイン逆変換回路」におい
て提案するような高速演算アルゴリズムにおける、バタ
フライ演算（加算および減算）と乗加算の演算パイプラ
インの構成を実現できない。この先行する特許出願は、
２次元８ｘ８離散コサイン変換、または、２次元８ｘ８
離散コサイン変換を行うに際して、行列分解を適用して
演算処理するものであるが、その詳細は、図５および図
６を参照して後述する。

【００１２】上記のように、演算パイプライン構成がで
きない理由としては、データメモリのポート数の制約
上、バタフライ演算（従来例では２演算ユニットを使
用）を行っているときには乗加算を並列に行えないため
である。よって、バタフライ演算と乗加算は逐次的に実
行されるので、上記特許出願において提案したような理
想的な演算パイプライン構成と比較して、性能は著しく
低下する。

【００１３】

【課題を解決するための手段】上述した課題を解決する
ために、本発明では、ビデオ信号処理を行うディジタル
シグナルプロセッサ（ＤＳＰ）、つまり、適応形ビデオ
信号演算処理装置において、算術論理演算ユニット（Ａ
ＬＵ）、乗算器、累算器からなる演算ユニットを複数有
し、これらの演算ユニット内の演算器の接続形態および
演算ユニット間の接続形態を適宜切り替えることによ
り、画像コーデック処理における離散コサイン変換／逆離散コサイン変換（ＤＣＴ／ＩＤ
ＣＴ）量子化／逆量子化動きベクトル検出動き補償（仮想画素生成、予測画素生成）フィルタ（内積演算) 画像加算、画像差分等の要素処理の各々に適応した演算パイプラインを実現
する構造可変な演算パイプラインを設ける。

【００１４】したがって、本発明によれば、離散コサイ
ン変換／逆離散コサイン変換、量子化／逆量子化、動き
ベクトル検出、動き補償、内積演算、画像データ加算お
よび画像データ差分処理などの画像圧縮符号化／伸長復
号化処理を、ｍｘｎの大きさのブロックの画像データに
ついて、適応的に行う演算処理装置であって、それぞれ
が、加算、減算、各種論理演算、大小比較、差分絶対値
演算、バタフライ加算・減算処理を行う拡張算術論理演
算ユニット、該拡張算術論理演算ユニットの後段に設け
られた第１の内部パイプラインメモリ、該第１の内部パ
イプラインメモリの後段に設けられた乗算ユニット、該
乗算ユニットに係数を提供する係数メモリ、該乗算ユニ
ットに後段に設けられた第２の内部パイプラインメモ
リ、該第２の内部パイプラインメモリの後段に設けられ
た累積演算ユニット、該累積演算ユニットに後段に設け
られた第３の内部パイプラインメモリを有する、複数の
並列に設けられた演算ユニット、これら複数の並列に設
けられた演算ユニットのうち、隣接する演算ユニットを
接続するように配設された相互接続パイプラインメモ
リ、および、前記複数の演算ユニットに入力データを選
択的に印加するデータセレクタを有し、前記相互接続パ
イプラインメモリを介して隣接する演算ユニットを結合
し、かつ、前記演算ユニット内の内部パイプラインメモ
リを選択して所定のデータ流れ経路を構成し、所望のビ
デオ信号処理を行う、適応形ビデオ信号演算処理装置が
提供される。

【００１５】好適には、前記演算ユニット内において、
前記拡張算術論理演算ユニット、前記乗算ユニット、前
記累積演算ユニットが、パイプライン処理動作を行う。

【００１６】特定的には、前記拡張算術論理演算ユニッ
トは、第１の入力データの極性を反転する正負反転器、
該正負反転器の後段に設けられ、前記第１の入力データ
または前記極性反転された第１のデータを選択的に出力
する第１のデータセレクタ、該第１のデータセレクタの
選択出力データおよび第２の入力データとを加算する加
算器、前記第１の入力データから前記第２の入力データ
を減じる減算器、前記第１の入力データと前記第２のデ
ータとの、論理和、論理積、排他的論理和、否定などの
論理処理を行う論理演算器、前記加算器および前記減算
器の出力を入力して正負判定を行う正負判定器、前記加
算器、前記減算器、および、前記正負判定器の出力を入
力し、選択的に出力する第２のデータセレクタ、該第２
のデータセレクタに接続された第１の出力端子、およ
び、前記減算器に接続された第２の出力端子を有し、上
述した回路を組み合わせて、加算、減算、各種論理演
算、大小比較、差分絶対値演算、バタフライ加算・減算
処理のいずれかを行う。

【００１７】

【作用】上記の構成によれば、算術論理演算ユニット
（ＡＬＵ）、乗算器、累算器からなる演算ユニットを複
数有し、これらの演算ユニット内の演算器の接続形態お
よび演算ユニット間の接続形態を適宜切り替えることに
より、画像コーデックの各要素処理を並列にパイプライ
ン処理できる。

【００１８】好適には、前記適応形ビデオ信号演算処理
装置は、単一の命令ストリームで多重のデータストリー
ム処理を行う、「単一命令ストリーム・多重データスト
リーム：ＳＩＭＤ」制御方式で動作する。

【００１９】離散コサイン変換処理用および離散コサイ
ン逆変換処理用を行う場合には、前記複数の演算ユニッ
トの初段の演算ユニットに、離散コサイン変換処理用デ
ータを入力する端子が設けられ、前記複数の演算ユニッ
トの最終段の演算ユニットに、離散コサイン逆変換処理
用データを入力する端子が設けられる。ｍｘｎ画像デー
タをブロックとして、バタフライ演算およびパイプライ
ンメモリ処理を複数回数行って離散コサイン変換処理を
行う際には、前記離散コサイン変換処理用データを前記
最終段の演算ユニットを除く複数の演算ユニット内の拡
張算術論理演算ユニットに入力し、該拡張算術論理演算
ユニットにおける処理結果を隣接する前記相互接続パイ
プラインメモリに出力し、全ての演算ユニット内の乗算
ユニットに最終段の相互接続パイプラインメモリのデー
タを入力し、その乗算結果を前記累積ユニットにおいて
累積させる。

【００２０】また、ｍｘｎ画像データをブロックとし
て、パイプラインメモリ処理およびバタフライ演算を複
数回数行って離散コサイン逆変換処理を行う際には、前
記離散コサイン変換処理用データを前記初段の演算ユニ
ットを除く複数の演算ユニット内の拡張算術論理演算ユ
ニットに入力し、該拡張算術論理演算ユニットにおける
処理結果を隣接する前記相互接続パイプラインメモリに
出力し、全ての演算ユニット内の乗算ユニットに最終段
の相互接続パイプラインメモリのデータを入力し、その
乗算結果を前記累積ユニットにおいて累積させる。

【００２１】量子化処理を行う際には、隣接する演算ユ
ニット内の第１の演算ユニットの乗算ユニットの出力端
子を第２の演算ユニットの乗算ユニットの入力端子に接
続し、該第２の乗算ユニットの乗算結果をその後段の累
積ユニットに入力し、前記第１の乗算ユニットに量子化
対象のデータを入力する。

【００２２】逆量子化処理を行う際には、隣接する演算
ユニット内の第１の演算ユニットの乗算ユニットの出力
端子を第２の演算ユニットの乗算ユニットの入力端子に
接続し、該第２の乗算ユニットの乗算結果をその後段の
累積ユニットに入力し、第１の演算ユニットに逆量子化
対象のデータおよび定数を入力し、その演算結果を第１
の乗算ユニットに入力する。

【００２３】動きベクトル検出処理の際には、全ての演
算ユニット内の拡張算術論理演算ユニットを累積演算ユ
ニットに接続し、前記拡張算術論理演算ユニットに動き
ベクトル検出対象の２つのデータを入力する。

【００２４】動き補償における仮想画素生成処理の際に
は、全ての演算ユニット内の拡張算術論理演算ユニット
を累積演算ユニットに接続し、前記拡張算術論理演算ユ
ニットに動き補償における仮想画素生成対象の２つのデ
ータを入力する。

【００２５】動き補償における予測画素生成処理の際に
は、隣接する演算ユニットの一方の乗算ユニットの出力
を他方の拡張算術論理演算ユニットの一方の入力端子に
印加し、他方の乗算ユニットの出力を該他方の拡張算術
論理演算ユニットの他方の入力端子に印加し、該他方の
拡張算術論理演算ユニットの演算結果を他方の累積ユニ
ットにおいて累積させる。

【００２６】内積演算処理の際には、全ての演算ユニッ
ト内の乗算ユニットに内積対象のデータを入力し、該乗
算結果を対応する累積ユニットにおいて累積する。

【００２７】画像データ加算処理の際、または、画像デ
ータ減算処理の際には、全ての演算ユニット内の拡張算
術論理演算ユニットに処理対象のデータを入力し、該処
理結果を出力する。

【００２８】

【実施例】以下、図面を参照し、本発明の実施例の適応
形ビデオ信号演算処理装置について詳述する。本発明の
実施例においても、従来技術と同様に、４組の演算ユニ
ットが単一の命令流により並列動作する、上記文献にお
いて提案されている「単一命令ストリーム・多重データ
ストリーム：ＳＩＭＤ」制御方式のＤＳＰを考える。前
提として、各演算ユニットは、加算、減算および論理演
算を行うＡＬＵ、乗算器、累算器の３種の演算器からな
るとする。また、簡単のため、各演算器は１クロックサ
イクルで演算を完了するものとする。したがって、この
ＤＳＰは、１クロックサイクルで最大１２演算を実行す
ることができる。さらに、このＤＳＰは演算器にデータ
を供給し、また、演算器からのデータを格納するための
データメモリをチップ内あるいはチップ外に持つとす
る。

【００２９】以下、演算ユニットの構成を述べたあと、
画像コーデックの要素処理における演算ユニットの動作
を説明する。なお、ここで例示する画像コーデックの要
素処理は、主にＭＰＥＧで使用される要素処理である。（１）演算ユニットの構成図１に、４組の演算ユニット１〜４間の結合形態を示
す。図１では、データメモリは図示していない。実際に
は、データ入力端子（Ｘｉｎ０〜Ｘｉｎ３）１１〜１
４、および、データ入力端子（Ｙｉｎ０〜Ｙｉｎ３）２
１〜２４、および、データ出力端子（Ｏｕｔ１〜Ｏｕｔ
３）３１〜３４は、何らかの相互結合網を介してデータ
メモリ（図示せず）に接続されている。ここでは簡単の
ため、データメモリは、上記８個のデータ入力端子１１
〜１４、２１〜２４に１クロックサイクル毎にデータを
供給でき、同時に上記４個のデータ出力端子３１〜３４
からのデータを１クロックサイクル毎に書き込むことが
できるとする。すなわち、演算ユニット１〜４とデータ
メモリ（図示せず）とは、上記のデータ転送能力を備え
た相互結合網により結合されているとする。また、演算
ユニット１〜４間を結合するメモリ（以下、相互接続パ
イプラインメモリと呼ぶ）０（５）、１（６）、２
（７）や、パラレル−シリアル変換器９、シリアル−パ
ラレル変換器１０、データセレクタ８，４１〜４４は、
後述する離散コサイン変換／逆離散コサイン変換（また
は、離散コサイン逆変換）（ＤＣＴ／ＩＤＣＴ）の高速
演算アルゴリズムにおけるマクロな演算パイプライン構
成を実現する際に必要となる。なお、図１に示したＤＣ
Ｔ入力端子５１およびＩＤＣＴ入力端子５２について
も、相互結合網（図示せず）を介してデータメモリ（図
示せず）に接続されており、１クロックサイクル毎のデ
ータ入出力が可能となっている。

【００３０】図２および図３に演算ユニットの内部構成
を示す。図２は演算ユニット０（１）および演算ユニッ
ト２（３）の内部構成図であり、図３が演算ユニット１
（２）および演算ユニット３（４）の内部構成図であ
る。図２および図３に示すように、演算ユニット内で
は、加算、減算、論理演算および後述するバタフライ演
算等の演算を行う拡張算術論理演算ユニット（ＥＡＬ
Ｕ）６１、係数メモリ６３、乗算器６２、累算とシフト
演算を行うシフト機能付き累算器６４、さらには入力端
子（Ｘｉｎｋ）１ｋ（ｋはｋ番目を示す）および（Ｙｉ
ｎｋ）２ｋ、および、出力端子（Ｏｕｔｋ）３ｋが、デ
ータセレクタ７１〜７５を介して相互に結合されてい
る。簡単化のため、これらの演算器は、全て１クロック
サイクルで演算を完了するものとする。したがって、演
算器６１、６２、６４の後段に設けられている内部パイ
プライン・レジスタ（図示省略）が存在する。このよう
な演算器６１、６２、６３および内部パイプラインメモ
リの結合形態を採ることにより、データセレクタ７１〜
７５の設定に従って、内部パイプラインメモリを介し
て、演算器６１、６２、６４間のデータパスを変化させ
ることが可能となる。よって、この演算ユニットは、１
〜３段の構造可変な演算パイプライン構成を採りうる。

【００３１】図２に示した演算ユニットと図３に示した
演算ユニットとの相違は、図３に示した演算ユニットに
は、データセレクタ７１および７３に第３の入力データ
が印加される構成になっていることである。

【００３２】図４に拡張算術論理演算ユニット（ＥＡＬ
Ｕ）６１の構成を示す。ＥＡＬＵ６１は、正負反転器３
０１、データセレクタ３０６、加算器３０２、減算器３
０３、論理演算器３０４、正負判定器３０５、データセ
レクタ３０７を有する。このＥＡＬＵ６１は、通常のＡ
ＬＵの基本機能である加算、減算、論理演算（否定、論
理和、論理積、排他的論理和等）の他に、大小比較演算
ｍｉｎ（Ｘ，Ｙ）、ｍａｘ（Ｘ，Ｙ）、差分絶対値演算
｜Ｘ−Ｙ｜、バタフライ演算（２入力について加算と減
算を同時に行う）を拡張機能として備える。これらの基
本機能および拡張機能は、上述した各種演算器３０１、
３０２、３０３、３０４および３０５を適切に結合する
ことによって実現される。以下、上記の基本機能および
拡張機能をＥＡＬＵ６１が各種演算器を用いていかに実
現するかを述べる。

【００３３】加算入力端子３１１および３１２に印加された２入力データ
ＸおよびＹの加算は加算器３０２を用いて実現する。入
力データＸについては、正負反転器３０１を経由しない
データＸが加算器３０２に印加されるように、予めデー
タセレクタ３０６を設定する。これにより、加算器３０
２からは加算結果（Ｘ＋Ｙ）が出力される。データセレ
クタ３０７は、加算器３０２の加算出力をＥＡＬＵ６１
の出力として、Ａ側出力端子３１３から出力する。

【００３４】減算入力端子３１１および３１２に印加された２入力データ
（Ｘ−Ｙ）の演算は減算器３０３を用いて実現する。減
算器８３からは減算結果（Ｘ−Ｙ）が出力される。この
減算結果はＢ側出力端子３１４から出力される。

【００３５】論理演算入力端子３１１および３１２に印加された２入力データ
（Ｘ，Ｙ）の論理演算は論理演算器３０４を用いて実現
する。論理演算器３０４は、否定、論理和、論理積、排
他的論理和などの論理演算を行い、この演算結果が、デ
ータセレクタ３０７を介して、Ａ側出力端子３１３から
ＥＡＬＵ６１の結果として出力される。

【００３６】大小比較演算：ｍｉｎ（Ｘ，Ｙ），ｍａｘ
（Ｘ，Ｙ）入力端子３１１および３１２に印加された２入力データ
（Ｘ，Ｙ）の大小比較は、正負反転器３０１、加算器３
０２、減算器３０３および正負判定器３０５を用いて行
う。入力データＸは正負反転器３０１で反転され、反転
された（−Ｘ）がデータセレクタ３０６を介して加算器
３０２に印加される。これにより、加算器３０２から減
算結果（Ｙ−Ｘ）が出力される。一方、減算器３０３に
おいて減算（Ｘ−Ｙ）の演算が行われる。加算結果（Ｙ
−Ｘ）および減算結果（Ｘ−Ｙ）が正負判定器３０５に
印加されて、入力データＸとＹとの大小比較判定が行わ
れる。正負判定器３０５は下記の判定基準に従って、大
小判定を行う。１．最小値：ｍｉｎ（Ｘ，Ｙ）（Ｙ−Ｘ）≧０とき、最小値＝Ｘ（Ｙ−Ｘ）＜０とき、最小値＝Ｙ２．最大値：ｍａｘ（Ｘ，Ｙ）（Ｘ−Ｙ）≧０とき、最大値＝Ｙ（Ｘ−Ｙ）＜０とき、最大値＝Ｘただし、最小値と最大値とをを同時に出力はできない。
データセレクタ３０７は、正負反転器３０５の出力をＥ
ＡＬＵ６１の出力として、Ａ側出力端子３１３から出力
する。

【００３７】差分絶対値演算｜Ｘ−Ｙ｜入力端子３１１および３１２に印加された２入力データ
（Ｘ，Ｙ）の差分絶対値演算は、正負反転器３０１、加
算器３０２、減算器３０３および正負判定器３０５を用
いて行う。入力データＸについては正負反転器３０１で
極性反転された−Ｘがデータセレクタ３０６から加算器
３０２に選択出力されるように、予めデータセレクタ３
０６を設定しておく。加算器３０２は加算（Ｙ−Ｘ）を
行い、減算器３０３は減算（Ｘ−Ｙ）を行う。これらの
演算結果が正負判定器３０５に入力される。正負判定器
３０５は、下記の差分絶対値演算を行う。（Ｙ−Ｘ）≧０とき、差分絶対値＝Ｙ−Ｘ（Ｘ−Ｙ）＜０とき、差分絶対値＝Ｘ−Ｙデータセレクタ３０７は上記演算された差分絶対値をＡ
側出力端子３１３から出力する。

【００３８】バタフライ演算入力端子３１１および３１２に印加された２入力データ
（Ｘ，Ｙ）についてのバタフライ演算は、加算器３０１
２および減算器３０３を用いて実現する。入力データＸ
が正負反転器３０１を経由しないで加算器３０２に印加
されるように、予めデータセレクタ３０６を設定してお
く。加算器３０２は加算（Ｘ＋Ｙ）を行い、減算器３０
３は減算（Ｘ−Ｙ）を行う。データセレクタ３０７が加
算器３０２の出力をＥＡＬＵ６１の出力としてＡ側出力
端子３１３から出力すると同時に、減算器３０３の減算
結果がＢ側出力端子３１４から出力される。このバタフ
ライ演算の場合のみ、ＥＡＬＵ６１は２入力２出力の演
算器として動作する。上述した他の演算においては、Ｅ
ＡＬＵ６１は２入力１出力の演算器として動作する。

【００３９】以下、ＤＣＴ／ＩＤＣＴ、量子化などの画
像コーデックの各要素処理における演算ユニットの動作
を個別的に説明する。離散コサイン変換／逆離散コサイン変換（ＤＣＴ／ＩＤ
ＣＴ）離散コサイン変換／逆離散コサイン変換（ＤＣＴ／ＩＤ
ＣＴ）の要素処理において、本発明の実施例における演
算ユニットでは、本出願人が先に出願した、特願平４年
３３８１８３号の明細書及び図面で提案するような高速
演算アルゴリズムに適応するバタフライ演算（加算およ
び減算）と乗加算のマクロな演算パイプラインの構成を
以下のように実現する。

【００４０】図５は８ｘ８ＤＣＴの演算パイプライン構
成の概略図を示し、図６は８ｘ８ＩＤＣＴの演算パイプ
ライン構成の概略図を示す。これらの演算パイプライン
の処理単位は８ｘ８の画像ブロック（６４画素）であ
り、パイプラインメモリ１３１〜１３３を介した４段の
演算パイプライン構成となる。したがって、通常の画素
単位で１クロックサイクル毎にパイプライン処理を行う
演算パイプラインとは異なり、６４クロックサイクル毎
にパイプライン処理を行うことから、マクロな演算パイ
プラインと考えられる。

【００４１】以下、８ｘ８ＤＣＴを例にとって上記の演
算パイプラインの高速演算アルゴリズムを簡単に説明す
る。前述の特許出願、特願平４年３３８１８３号におい
て提案したような行列分解により、８ｘ８ＤＣＴは、８
×８の画像ブロック（６４画素）に対して１６５回のバ
タフライ演算（加算１６５回および減算１６５回）を行
い、さらに、２２０回の乗加算（乗算２２０回および累
算２２０回）を行うことにより実現できる。したがっ
て、図５に示すような４段の演算パイプラインの構成、
つまり、３個のバタフライ演算器１０１〜１０３と４個
の乗加算器１１１による回路構成を採ることにより、６
４クロックサイクル周期（理想的には５５クロックサイ
クル）で演算パイプライン処理を行い、８×８ＤＣＴを
計算することが可能となる。また、８×８ＩＤＣＴにつ
いても、乗加算とバタフライ演算の順序が入れ替わるだ
けで、演算量や演算パイプライン段数は変わらない。な
お、上述した出願では、乗加算器数を３個にするため
に、さらに乗加算回数を減らす工夫を行っているが、本
発明の実施例においては乗加算器数は４個であると仮定
しているため、この工夫は必要ない。

【００４２】図７（Ａ）〜（Ｄ）に、本発明の実施例に
おける演算ユニットを用いて、上述の８×８ＩＤＣＴの
演算パイプライン構成を実現した場合の演算器およびメ
モリの結合形態（データパス）を示す。図７（Ａ）〜
（Ｄ）はそれぞれ、４系統の演算ユニットの動作形態を
示す。図７（Ａ）〜（Ｄ）および図１に示すように、演
算ユニット０（１），１（２），２（３）内のＥＡＬＵ
６１をメモリ０（５），１（６），２（７）、つまり、
パイプラインメモリ５，６，７を介してパイプライン接
続する。さらに、演算ユニット２（３）のＥＡＬＵ６１
の出力を、シリアル−パラレル変換器１０、データセレ
クタ４１〜４４を介して、４個の乗算器６２に接続し、
各々の乗算器６２の出力をシフト機能付き累算器６４に
パイプライン接続する。なお、この時のＥＡＬＵ６１
は、前述したＥＡＬＵとしての拡張機能であるバタフラ
イ演算を行うため、２入力２出力となっている。このよ
うな演算器およびメモリの結合形態を採ることにより、
図５に示すようなマクロな演算パイプライン構成を実現
する。

【００４３】また、図８（Ａ）〜（Ｄ）に、本発明の実
施例における演算ユニットを用いて、上述の８×８ＩＤ
ＣＴの演算パイプライン構成を実現した場合の演算器お
よびメモリの結合形態（データパス）を示す。図８
（Ａ）〜（Ｄ）はそれぞれ、４系統の演算ユニットの動
作形態を示す。図８（Ａ）〜（Ｄ）および図９（Ａ）〜
（Ｄ）に示すように、各演算ユニットの４個の乗算器６
２を各々シフト機能付き累算器６４にパイプライン接続
する。さらに、すべてのシフト機能付き累算器６４の出
力を、パラレル−シリアル変換器９、データセレクタ８
を介して、メモリ０（５）に接続する。また、演算ユニ
ット１（２），２（３），３（４）のＥＡＬＵ６１をメ
モリ０（５），１（６），２（７）、つまり、パイプラ
インメモリ５，６，７を介してパイプライン接続する。
なお、この時のＥＡＬＵ６１は、前述したＥＡＬＵ６１
の拡張機能であるバタフライ演算を行うため、２入力２
出力となっている。このような演算器およびメモリの結
合形態を採ることにより、図６に示すようなマクロな演
算パイプライン構成を実現する。

【００４４】量子化／逆量子化処理（イ）量子化画像コーデックの量子化処理においては、下式１のよう
に乗算を連続して行い、さらにシフト演算を行う演算パ
ターンが存在する。これは、量子化処理において最も複
雑な演算パターンである。

【００４５】

【数１】

【００４６】ただし、Ｘは量子化前の画素値であり、Ｙ
は量子化後の画素値を表し、Ｗは量子化行列の係数を示
し、ＱＰは量子化スケールパラメータを表す。

【００４７】図９（Ａ）〜（Ｄ）に本発明の実施例にお
ける演算ユニットを用いて上式の演算を実現した場合の
演算器の結合形態（データパス）を示す。図９（Ａ）〜
（Ｄ）はそれぞれ４系統の演算ユニットの動作形態を示
す。図９（Ａ）〜（Ｄ）のように、２個の乗算器６２お
よびシフト機能付き累算器６４をパイプライン接続する
データパスを実現することにより、上式の演算パターン
を分割処理することなく１本の演算パイプラインで処理
できる。この量子化処理の演算パターンにおいて、本発
明の実施例における演算ユニットの構成では、図９
（Ａ）〜（Ｄ）に示すように３段の演算パイプラインを
２本実現できる。このような演算パイプライン構成を採
ることにより、画像ブロック内の全画素に対する量子化
を２並列にパイプライン処理できる。

【００４８】ロ）逆量子化画像コーデックの逆量子化処理においては、下式２のよ
うにシフトおよび加算を行ったあと、乗算を連続して行
い、さらに、シフト演算を行う演算パターンが存在す
る。これは、逆量子化処理において最も複雑な演算パタ
ーンである。

【００４９】

【数２】

【００５０】ただし、Ｘは量子化前の画素値であり、Ｙ
は量子化後の画素値を表し、Ｋは逆量子化時に必要とな
る定数を表し、（Ｋ＝ 0、１または−１）Ｗは量子化行
列の係数であり、ＱＰ量子化スケールパラメータを表
す。

【００５１】図１０（Ａ）〜（Ｄ）に本発明の一実施例
における演算ユニットを用いて、上式の演算を実現した
場合の演算器の結合形態（データパス）を示す。図１０
（Ａ）〜（Ｄ）はそれぞれ、４系統の演算ユニットの動
作形態を示す。図１０（Ａ）〜（Ｄ）に示すように、Ｅ
ＡＬＵ６１と２個の乗算器６２およびシフト機能付き累
算器６４をパイプライン接続するデータパスを構成する
ことにより、上式の演算パターンを分割することなく１
本の演算パイプラインで実現できる。なお、シフトおよ
び定数加算は、ＥＡＬＵ６１で１クロックサイクルで実
行可能とする。この逆量子化処理の演算パターンにおい
て、本発明の実施例における演算ユニットの構成では、
図１０（Ａ）〜（Ｄ）に示すように４段の演算パイプラ
インを２本実現できる。このような演算パイプライン構
成を採ることにより、画像ブロック内の全画素に対する
逆量子化を２並列にパイプライン処理できる。

【００５２】動きベクトル検出画像コーデックの動きベクトル検出処理においては、下
式のような差分絶対値和演算が動きベクトル候補の数だ
け必要となる（ただし、探索アルゴリズムにブロックマ
ッチングの全探索を採用した場合）。

【００５３】

【数３】

【００５４】ただし、Ｘは動きベクトル探索の基準とな
る画像ブロック（参照ブロックと呼ばれる）の画素値を
表し、Ｙは動きベクトル探索の対象となる画像ブロック
（候補ブロックと呼ばれる）の画素値を表す。

【００５５】図１１（Ａ）〜（Ｄ）に本発明の一実施例
における演算ユニットを用いて、上式の演算を実現した
場合の演算器の結合形態（データパス）を示す。図１１
（Ａ）〜（Ｄ）はそれぞれ４系統の演算ユニットの動作
形態を示す。図１１（Ａ）〜（Ｄ）のように、ＥＡＬＵ
６１およびシフト機能付き累算器６４をパイプライン接
続するデータパスを構成することにより、上式の差分絶
対値和演算を分割することなく１本の演算パイプライン
で実現できる。なお、差分絶対値演算には、前述したＥ
ＡＬＵ６１の拡張機能である差分絶対値演算機能を用い
る。この動きベクトル検出処理の差分絶対値和演算にお
いて、本発明の実施例における演算ユニットの構成で
は、図１１（Ａ）〜（Ｄ）に示すように２段の演算パイ
プラインを４本実現できる。このような演算パイプライ
ン構成を採ることにより、全候補ブロックに対する動き
ベクトル検出を４並列にパイプライン処理できる。

【００５６】動き補償（仮想画素生成、予測画素生成）画像コーデックにおける動き補償処理は、動きベクトル
の値やブロックのモードにより、様々な処理に場合分け
される。このうち、最も複雑な演算を行う場合について
考える。このとき、動き補償処理は、仮想画素生成およ
び予測画素生成の２つの処理に分けられる。以下、本発
明の実施例における演算ユニットにおいて、上記２つの
処理のそれぞれに適応する演算パイプラインの構成をど
のように実現するかを説明する。

【００５７】（イ）仮想画素生成仮想画素生成処理は、１／２画素精度の動きベクトルに
伴い、画素間の補間を行って仮想画素を生成する処理で
ある。図１２に仮想画素の生成規則を示す。図１２から
分かるように、最も複雑な仮想画素生成処理は、近傍４
画素から中央の１仮想画素を生成する場合である。

【００５８】

【数４】

【００５９】ただし、ａは仮想画素を表し、ｘ，ｙ，
ｚ，ｗは、近傍の４画素を表す。

【００６０】図１３（Ａ）〜（Ｄ）に本発明の実施例に
おける演算ユニットを用いて、上式の演算を実現した場
合の演算器の結合形態（データパス）を示す。図１３
（Ａ）〜（Ｄ）はそれぞれ、４系統の演算ユニットの動
作形態を示す。図１３（Ａ）〜（Ｄ）のように、ＥＡＬ
Ｕ６１およびシフト機能付き累算器６４をパイプライン
接続するデータパスを構成することにより、上式の演算
パターンを分割することなく１本の演算パイプラインで
処理できる。この仮想画素生成処理において、本発明の
一実施例における演算ユニットの構成では、図１３
（Ａ）〜（Ｄ）に示すように２段の演算パイプラインを
４本実現できる。このような演算パイプライン構成を採
ることにより、画像ブロック内の全画素に対する仮想画
素生成を４並列にパイプライン処理できる。

【００６１】（ロ）予測画素生成予測画素生成処理は、単方向（前向きあるいは後ろ向
き）動き補償予測か両方向動き補償予測かのモードによ
り異なる。単方向動き補償予測の場合は、単に動きベク
トルに従ってフレームメモリにアクセスし、当該画像ブ
ロックを得ればよい。ところが、両方向動き補償予測の
場合は、前向きおよび後ろ向きの２種の動きベクトルに
従って２つのフレームメモリからそれぞれ画像ブロック
を得、さらにそれらの画素を時間的距離によって平均化
して予測値を得る。

【００６２】

【数５】

【００６３】ただし、ａは両方向動き補償予測値を示
し、ｘ，ｙはそれぞれ前向きおよび後ろ向きの動き補償
予測値を示し、Ａは２つの画像ブロックの時間的距離に
よって決定するパラメータである。

【００６４】図１４（Ａ）〜（Ｄ）に本発明の一実施例
における演算ユニットを用いて、上式の演算を実現した
場合の演算器の結合形態（データパス）を示す。図１４
（Ａ）〜（Ｄ）はそれぞれ、４系統の演算ユニットの動
作形態を示す。図１４（Ａ）〜（Ｄ）に示すように、２
個の乗算器６２の出力をＥＡＬＵ６１の入力とし、さら
にシフト機能付き累算器６４をパイプライン接続するデ
ータパスを構成することにより、上式の演算パターンを
分割することなく１本の演算パイプラインで実現でき
る。この予測画素生成処理において、本発明の実施例に
おける演算ユニットの構成では、図１４（Ａ）〜（Ｄ）
に示すように３段の演算パイプラインを２本実現でき
る。このような演算パイプライン構成を採ることによ
り、画像ブロック内の全画素に対する予測画素生成を２
並列にパイプライン処理できる。

【００６５】フィルタ（内積演算）画像コーデックに限らず、フィルタ処理は画像処理の基
本的な要素処理である。ここでは、画像ブロック内の全
画素に対して１次元フィルタ処理を行う場合を考える。
フィルタ処理においては下式のような内積演算が必要と
なる。

【００６６】

【数６】

【００６７】ただし、ｃはフィルタ係数を示し、ｘは画
像ブロック内の画素を示す。

【００６８】図１５（Ａ）〜（Ｄ）に本発明の実施例の
演算ユニットを用いて上式の演算を実現した場合の演算
器の結合形態（データパス）を示す。図１５（Ａ）〜
（Ｄ）はそれぞれ、４系統の演算ユニットの動作形態を
示す。図１５（Ａ）〜（Ｄ）に示すように、乗算器６２
およびシフト機能付き累算器６４をパイプライン接続す
るデータパスを構成することにより、上式の内積演算を
分割することなく１本の演算パイプラインで実現でき
る。このフィルタ処理において、本発明の実施例におけ
る演算ユニットの構成では、図１５（Ａ）〜（Ｄ）に示
すように２段の演算パイプラインを４本実現できる。こ
のような演算パイプライン構成を採ることにより、画像
ブロック内の全画素に対するフィルタ処理を４並列にパ
イプライン処理できる。

【００６９】画像加算、画像差分画像加算および画像差分もまた、画像コーデックに限ら
ず、画像処理の基本的な要素処理である。ここでは、画
像ブロック間で画像加算あるいは画像差分を計算する場
合を考える。図１６（Ａ）〜（Ｄ）に本発明の一実施例
における演算ユニットを用いて、画像加算あるいは画像
差分を実現した場合の演算器の結合形態（データパス）
を示す。図１６（Ａ）〜（Ｄ）はそれぞれ、４系統の演
算ユニットの動作形態を示す。本発明の実施例における
演算ユニットの構成では、図１６（Ａ）〜（Ｄ）に示す
ようにＥＡＬＵ６１を用いた１段の演算パイプラインを
４本実現できる。このような演算パイプライン構成を採
ることにより、画像ブロック内の全画素に対する画像加
算あるいは画像差分を４並列にパイプライン処理でき
る。

【００７０】以上の実施例は、適応形ビデオ信号の代表
的な処理について述べたが、本発明き適応形ビデオ信号
演算処理装置においては、上述した信号処理例に限定さ
れず、上記同様の他の信号処理にも適用できる。

【００７１】

【発明の効果】本発明によれば、画像コーデックの要素
処理における、乗算した後に論理演算を行う演算、乗算
を連続して行う演算、あるいは、乗算した結果同士を加
算する種々の演算を適応的に１つの適応形ビデオ信号演
算処理装置で実現できる。また、本発明の適応形ビデオ
信号演算処理装置は、「単一命令ストリーム・多重デー
タストリーム：ＳＩＭＤ」制御方式に基づく、１本の演
算パイプラインを用いた１回のパイプライン処理で実現
できる。したがって、従来の構成と比較して、本発明の
適応形ビデオ信号演算処理装置は異なる演算器を用いる
演算を並列に実行できるため、演算器の使用効率は低下
しない。また、本発明の適応形ビデオ信号演算処理装置
は演算パイプラインの立ち上げ時の初期設定も１回でよ
い。さらには、本発明の適応形ビデオ信号演算処理装置
は中間結果を格納する必要はないので、データメモリ容
量は増大しない。

【００７２】また、本発明の適応形ビデオ信号演算処理
装置はバタフライ演算器3個と乗加算器をパイプライン
・メモリで接続したマクロな演算パイプライン構成を実
現可能としているため、前述の特願平４年３３８１８３
号出願（平成４年１１月２５日出願）にて提案したよう
な回路構成による、ＤＣＴ高速演算アルゴリズムにおけ
るバタフライ演算と乗加算の演算パイプラインの構成が
実現可能となる。これにより、本発明の適応形ビデオ信
号演算処理装置は、画像コーデックのＤＣＴ／ＩＤＣＴ
の要素処理における演算器使用効率が従来の構成と比較
して大幅に向上し、性能が向上する。

【図面の簡単な説明】

【図１】本発明の実施例による演算ユニットの結合形態
を示す適応形ビデオ信号演算処理装置の構成図である。

【図２】本発明の実施例による演算ユニット０，２の構
成を示す図である。

【図３】本発明の実施例による演算ユニット１，３の構
成を示す図である。

【図４】本発明の実施例による拡張論理演算ユニット
（ＥＡＬＵ）の構成を示す図である。

【図５】８×８ＤＣＴの演算パイプライン構成図であ
る。

【図６】８×８ＩＤＣＴの演算パイプライン構成図であ
る。

【図７】本発明の実施例によるＤＣＴ処理時の適応形ビ
デオ信号演算処理装置の演算パイプラインの構成を示す
図であり、（Ａ）〜（Ｄ）はそれぞれ４系統の演算ユニ
ットの動作形態を示す図である。

【図８】本発明の実施例によるＩＤＣＴ処理時の適応形
ビデオ信号演算処理装置の演算パイプラインの構成を示
す図であり、（Ａ）〜（Ｄ）はそれぞれ４系統の演算ユ
ニットの動作形態を示す図である。

【図９】本発明の実施例による量子化処理時の適応形ビ
デオ信号演算処理装置の演算パイプラインの構成を示す
図であり、（Ａ）〜（Ｄ）はそれぞれ４系統の演算ユニ
ットの動作形態を示す図である。

【図１０】本発明の実施例による逆量子化処理時の適応
形ビデオ信号演算処理装置の演算パイプラインの構成を
示す図であり、（Ａ）〜（Ｄ）はそれぞれ４系統の演算
ユニットの動作形態を示す図である。

【図１１】本発明の実施例による動きベクトル検出処理
時の適応形ビデオ信号演算処理装置の演算パイプライン
の構成を示す図であり、（Ａ）〜（Ｄ）はそれぞれ４系
統の演算ユニットの動作形態を示す図である。

【図１２】画像コーデックの動き補償処理の仮想画素生
成規則を示す図である。

【図１３】本発明の実施例による動き補償における仮想
画素生成処理時の演算パイプラインの構成を示す図であ
り、（Ａ）〜（Ｄ）はそれぞれ４系統の演算ユニットの
動作形態を示す図である。

【図１４】本発明の実施例による動き補償における予測
画素生成処理時の演算パイプラインの構成を示す図であ
り、（Ａ）〜（Ｄ）はそれぞれ４系統の演算ユニットの
動作形態を示す図である。

【図１５】本発明の実施例によるフィルタ処理時の演算
パイプラインの構成を示す図であり、（Ａ）〜（Ｄ）は
それぞれ４系統の演算ユニットの動作形態を示す図であ
る。

【図１６】本発明の実施例による画像加算あるいは画像
差分処理時の適応形ビデオ信号演算処理装置の演算パイ
プラインの構成を示す図であり、（Ａ）〜（Ｄ）はそれ
ぞれ４系統の演算ユニットの動作形態を示す図である。

【図１７】「単一命令ストリーム・多重データストリー
ム：ＳＩＭＤ」制御方式のプロセッサの構成図である。

【図１８】演算パイプラインの例を示す図である。

【図１９】図１８の演算パイプライン処理におけるタイ
ムチャートを示すグラフである。

【図２０】最も自由度の高い演算パイプラインの構成を
示す図であり、（Ａ）〜（Ｄ）はそれぞれ４系統の演算
ユニットの動作形態を示す図である。

【符号の説明】

Ａ１・・算術論理演算ユニット（ＡＬＵ）Ａ２・・乗算器Ａ３・・係数メモリＡ４・・累算器１〜４・・本発明の実施例における演算ユニット５〜７・・相互接続パイプラインメモリ８・・データセレクタ９・・パラレル−シリアル変換器１０・・シリアル−パラレル変換器１１〜１４，２１〜２４…演算ユニットの入力端子３１〜３４・・演算ユニットの出力端子４１〜４４・・データセレクタ５１・・８ｘ８ＤＣＴ用入力端子５２・・８ｘ８ＩＤＣＴ用出力端子６１・・拡張論理演算ユニット（ＥＡＬＵ）６２・・乗算器６３・・係数メモリ６４・・シフト機能付き累算器７１〜７５・・データセレクタ８１・・正負反転器８２・・加算器８３・・減算器８４・・論理演算器８５・・正負反転器８６，８７・・データセレクタ９１，９２・・ＥＡＬＵの入力端子９３，９４・・ＥＡＬＵの出力端子１０１〜１０３・・バタフライ演算器１１１・・乗加算器１２１・・シリアル−パラレル変換器１２２・・パラレル−シリアル変換器１３１〜１３３・・パイプラインメモリ１４１・・データメモリ

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成６年４月１１日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】請求項１

【補正方法】変更

【補正内容】

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】請求項５

【補正方法】変更

【補正内容】

【手続補正３】

【補正対象書類名】明細書

【補正対象項目名】請求項７

【補正方法】変更

【補正内容】

【手続補正４】

【補正対象書類名】明細書

【補正対象項目名】０００１

【補正方法】変更

【補正内容】

【０００１】

【産業上の利用分野】本発明は、例えば、数値計算、画
像処理、グラフィックス処理等に用いられる計算機シス
テムにおける中央処理装置（プロセッサ）に関するもの
であり、特に画像圧縮符号化（コーデック：ＣＯＤＥ
Ｃ）のようなビデオ信号処理に好適なディジタルシグナ
ルプロセッサ（ＤＳＰ）などの適応形ビデオ信号演算処
理装置に関する。

【手続補正５】

【補正対象書類名】明細書

【補正対象項目名】０００２

【補正方法】変更

【補正内容】

【０００２】

【従来の技術】近年、ＣＣＩＴＴＨ．２６１勧告やＭ
ＰＥＧ等の画像圧縮符号化／伸長復号化標準に基づく画
像コーデック用ディジタルシグナルプロセッサ（ＤＳ
Ｐ）が多数提案されている。本発明は、これらのＤＳＰ
のうちで、文献、Ｙａｍａｕｃｈｉ，ｅｔａｌ，“Ａ
ｒｃｈｉｔｅｃｔｕｒｅａｎｄＩｍｐｌｅｍｅｎｔ
ａｔｉｏｎｏｆａＨｉｇｈｌｙＰａｒａｌｌｅｌ
Ｓｉｎｇｌｅ−ＣｈｉｐＶｉｄｅｏＤＳＰ“，ＩＥ
ＥＥＴＲＡＮＳＡＣＴＩＯＮＳＯＮＣＩＲＣＵＩ
ＴＳＡＮＤＳＹＳＴＥＭＳＦＯＲＶＩＤＥＯ
ＴＥＣＨＮＯＬＯＧＹ，ＶＯＬ．２，ＮＯ．２，ＪＵＮ
Ｅ１９９２，ｐｐ．２０７−２２０、に提案されてい
るように、算術論理演算ユニット、乗算器、累算器等か
らなる演算ユニットを複数有し、それらの演算ユニット
が単一の命令流により複数のデータを並列に処理する
「単一命令ストリーム・多重データストリーム：ＳＩＭ
Ｄ(Single Instruction stream Multiple Data strea
m)」制御方式のＤＳＰに関する。この文献に記載されて
いる構成を図１７に示した。このＤＳＰの演算ユニット
は、演算器をパイプライン接続可能であり、演算パイプ
ライン処理も行う。

【手続補正６】

【補正対象書類名】明細書

【補正対象項目名】０００７

【補正方法】変更

【補正内容】

【０００７】そこで、データメモリをバンク分けして、
１バンク当たりのポート数を減らす手法が考えられる。
しかしながら、例えばデータメモリを４バンクに分割し
たとしても、上記の例では、なおも１バンク当たり７ポ
ートのマルチポートメモリを必要とする。したがって、
アプリケーション・プログラムに応じて演算パイプライ
ンの自由度をある程度限定し、データメモリのポート数
の減少を図るアプローチが採られる。

【手続補正７】

【補正対象書類名】明細書

【補正対象項目名】００１１

【補正方法】変更

【補正内容】

【００１１】また、上述した従来のＤＳＰの演算パイプ
ライン構成では、本出願人による、特許出願、特願平４
年３３８１８３号、「２次元８ｘ８離散コサイン変換回
路および２次元８ｘ８離散コサイン逆変換回路」におい
て提案するような高速演算アルゴリズムにおける、バタ
フライ演算（加算および減算）と乗加算の演算パイプラ
インの構成を実現できない。この先行する特許出願は、
２次元８ｘ８離散コサイン変換、または、２次元８ｘ８
離散コサイン逆変換を行うに際して、行列分解を適用し
て演算処理するものであるが、その詳細は、図５および
図６を参照して後述する。

【手続補正８】

【補正対象書類名】明細書

【補正対象項目名】００１３

【補正方法】変更

【補正内容】

【００１３】

【課題を解決するための手段】上述した課題を解決する
ために、本発明では、ビデオ信号処理を行うディジタル
シグナルプロセッサ（ＤＳＰ）、つまり、適応形ビデオ
信号演算処理装置において、算術論理演算ユニット（Ａ
ＬＵ）、乗算器、累算器からなる演算ユニットを複数有
し、これらの演算ユニット内の演算器の接続形態および
演算ユニット間の接続形態を適宜切り替えることによ
り、画像コーデック処理における離散コサイン変換／離散コサイン逆変換（ＤＣＴ／ＩＤ
ＣＴ）量子化／逆量子化動きベクトル検出動き補償（仮想画素生成、予測画素生成）フィルタ（内積演算) 画像加算、画像差分等の要素処理の各々に適応した演算パイプラインを実現
する構造可変な演算パイプラインを設ける。

【手続補正９】

【補正対象書類名】明細書

【補正対象項目名】００１４

【補正方法】変更

【補正内容】

【００１４】したがって、本発明によれば、離散コサイ
ン変換／離散コサイン逆変換、量子化／逆量子化、動き
ベクトル検出、動き補償、内積演算、画像データ加算お
よび画像データ差分処理などの画像圧縮符号化／伸長復
号化処理を、ｍｘｎの大きさのブロックの画像データに
ついて、適応的に行う演算処理装置であって、それぞれ
が、加算、減算、各種論理演算、大小比較、差分絶対値
演算、バタフライ加算・減算処理を行う拡張算術論理演
算ユニット、該拡張算術論理演算ユニットの後段に設け
られた第１の内部パイプラインメモリ、該第１の内部パ
イプラインメモリの後段に設けられた乗算ユニット、該
乗算ユニットに係数を提供する係数メモリ、該乗算ユニ
ットに後段に設けられた第２の内部パイプラインメモ
リ、該第２の内部パイプラインメモリの後段に設けられ
た累積演算ユニット、該累積演算ユニットに後段に設け
られた第３の内部パイプラインメモリを有する、複数の
並列に設けられた演算ユニット、これら複数の並列に設
けられた演算ユニットのうち、隣接する演算ユニットを
接続するように配設された相互接続パイプラインメモ
リ、および、前記複数の演算ユニットに入力データを選
択的に印加するデータセレクタを有し、前記相互接続パ
イプラインメモリを介して隣接する演算ユニットを結合
し、かつ、前記演算ユニット内の内部パイプラインメモ
リを選択して所定のデータ流れ経路を構成し、所望のビ
デオ信号処理を行う、適応形ビデオ信号演算処理装置が
提供される。

【手続補正１０】

【補正対象書類名】明細書

【補正対象項目名】００１９

【補正方法】変更

【補正内容】

【００１９】離散コサイン変換処理用および離散コサイ
ン逆変換処理用を行う場合には、前記複数の演算ユニッ
トの初段の演算ユニットに、離散コサイン変換処理用デ
ータを入力する端子が設けられ、前記複数の演算ユニッ
トの最終段の演算ユニットに、離散コサイン逆変換処理
用データを出力する端子が設けられる。ｍｘｎ画像デー
タをブロックとして、バタフライ演算およびパイプライ
ンメモリ処理を複数回数行って離散コサイン変換処理を
行う際には、前記離散コサイン変換処理用データを前記
最終段の演算ユニットを除く複数の演算ユニット内の拡
張算術論理演算ユニットに入力し、該拡張算術論理演算
ユニットにおける処理結果を隣接する前記相互接続パイ
プラインメモリに出力し、全ての演算ユニット内の乗算
ユニットに最終段の相互接続パイプラインメモリのデー
タを入力し、その乗算結果を前記累積ユニットにおいて
累積させる。

【手続補正１１】

【補正対象書類名】明細書

【補正対象項目名】００２０

【補正方法】変更

【補正内容】

【００２０】また、ｍｘｎ画像データをブロックとし
て、パイプラインメモリ処理およびバタフライ演算を複
数回数行って離散コサイン逆変換処理を行う際には、前
記離散コサイン逆変換用データを全ての演算ユニット内
の乗算ユニットに入力し、その乗算結果を前記累算ユニ
ットにおいて累積させ、その出力を前記初段の演算ユニ
ットを除く複数の演算ユニット内の拡張算術論理演算ユ
ニットに入力し、該拡張算術論理演算ユニットにおける
処理結果を隣接する相互接続パイプラインメモリに出力
する。

【手続補正１２】

【補正対象書類名】明細書

【補正対象項目名】００２９

【補正方法】変更

【補正内容】

【００２９】以下、演算ユニットの構成を述べたあと、
画像コーデックの要素処理における演算ユニットの動作
を説明する。なお、ここで例示する画像コーデックの要
素処理は、主にＭＰＥＧで使用される要素処理である。（１）演算ユニットの構成図１に、４組の演算ユニット１〜４間の結合形態を示
す。図１では、データメモリは図示していない。実際に
は、データ入力端子（Ｘｉｎ０〜Ｘｉｎ３）１１〜１
４、および、データ入力端子（Ｙｉｎ０〜Ｙｉｎ３）２
１〜２４、および、データ出力端子（Ｏｕｔ１〜Ｏｕｔ
３）３１〜３４は、何らかの相互結合網を介してデータ
メモリ（図示せず）に接続されている。ここでは簡単の
ため、データメモリは、上記８個のデータ入力端子１１
〜１４、２１〜２４に１クロックサイクル毎にデータを
供給でき、同時に上記４個のデータ出力端子３１〜３４
からのデータを１クロックサイクル毎に書き込むことが
できるとする。すなわち、演算ユニット１〜４とデータ
メモリ（図示せず）とは、上記のデータ転送能力を備え
た相互結合網により結合されているとする。また、演算
ユニット１〜４間を結合するメモリ（以下、相互接続パ
イプラインメモリと呼ぶ）０（５）、１（６）、２
（７）や、パラレル−シリアル変換器９、シリアル−パ
ラレル変換器１０、データセレクタ８，４１〜４４は、
後述する離散コサイン変換／離散コサイン逆変換（ＤＣ
Ｔ／ＩＤＣＴ）の高速演算アルゴリズムにおけるマクロ
な演算パイプライン構成を実現する際に必要となる。な
お、図１に示したＤＣＴ入力端子５１およびＩＤＣＴ出
力端子５２についても、相互結合網（図示せず）を介し
てデータメモリ（図示せず）に接続されており、１クロ
ックサイクル毎のデータ入出力が可能となっている。

【手続補正１３】

【補正対象書類名】明細書

【補正対象項目名】００３０

【補正方法】変更

【補正内容】

【００３０】図２および図３に演算ユニットの内部構成
を示す。図２は演算ユニット０（１）および演算ユニッ
ト２（３）の内部構成図であり、図３が演算ユニット１
（２）および演算ユニット３（４）の内部構成図であ
る。図２および図３に示すように、演算ユニット内で
は、加算、減算、論理演算および後述するバタフライ演
算等の演算を行う拡張算術論理演算ユニット（ＥＡＬ
Ｕ）６１、係数メモリ６３、乗算器６２、累算とシフト
演算を行うシフト機能付き累算器６４、さらには入力端
子（Ｘｉｎｋ）１ｋ（ｋはｋ番目を示す）および（Ｙｉ
ｎｋ）２ｋ、および、出力端子（Ｏｕｔｋ）３ｋが、デ
ータセレクタ７１〜７５を介して相互に結合されてい
る。簡単化のため、これらの演算器は、全て１クロック
サイクルで演算を完了するものとする。したがって、演
算器６１、６２、６４の後段に設けられている内部パイ
プラインメモリ（図示省略）が存在する。このような演
算器６１、６２、６３および内部パイプラインメモリの
結合形態を採ることにより、データセレクタ７１〜７５
の設定に従って、内部パイプラインメモリを介して、演
算器６１、６２、６４間のデータパスを変化させること
が可能となる。よって、この演算ユニットは、１〜３段
の構造可変な演算パイプライン構成を採りうる。

【手続補正１４】

【補正対象書類名】明細書

【補正対象項目名】００３６

【補正方法】変更

【補正内容】

【００３６】大小比較演算：ｍｉｎ（Ｘ，Ｙ），ｍａｘ
（Ｘ，Ｙ）入力端子３１１および３１２に印加された２入力データ
（Ｘ，Ｙ）の大小比較は、正負反転器３０１、加算器３
０２、減算器３０３および正負判定器３０５を用いて行
う。入力データＸは正負反転器３０１で反転され、反転
された（−Ｘ）がデータセレクタ３０６を介して加算器
３０２に印加される。これにより、加算器３０２から減
算結果（Ｙ−Ｘ）が出力される。一方、減算器３０３に
おいて減算（Ｘ−Ｙ）の演算が行われる。加算結果（Ｙ
−Ｘ）および減算結果（Ｘ−Ｙ）が正負判定器３０５に
印加されて、入力データＸとＹとの大小比較判定が行わ
れる。正負判定器３０５は下記の判定基準に従って、大
小判定を行う。１．最小値：ｍｉｎ（Ｘ，Ｙ）（Ｙ−Ｘ）≧０とき、最小値＝Ｘ（Ｙ−Ｘ）＜０とき、最小値＝Ｙ２．最大値：ｍａｘ（Ｘ，Ｙ）（Ｘ−Ｙ）≧０とき、最大値＝Ｙ（Ｘ−Ｙ）＜０とき、最大値＝Ｘただし、最小値と最大値とをを同時に出力はできない。
データセレクタ３０７は、正負判定器３０５の出力をＥ
ＡＬＵ６１の出力として、Ａ側出力端子３１３から出力
する。

【手続補正１５】

【補正対象書類名】明細書

【補正対象項目名】００３８

【補正方法】変更

【補正内容】

【００３８】バタフライ演算入力端子３１１および３１２に印加された２入力データ
（Ｘ，Ｙ）についてのバタフライ演算は、加算器３０２
および減算器３０３を用いて実現する。入力データＸが
正負反転器３０１を経由しないで加算器３０２に印加さ
れるように、予めデータセレクタ３０６を設定してお
く。加算器３０２は加算（Ｘ＋Ｙ）を行い、減算器３０
３は減算（Ｘ−Ｙ）を行う。データセレクタ３０７が加
算器３０２の出力をＥＡＬＵ６１の出力としてＡ側出力
端子３１３から出力すると同時に、減算器３０３の減算
結果がＢ側出力端子３１４から出力される。このバタフ
ライ演算の場合のみ、ＥＡＬＵ６１は２入力２出力の演
算器として動作する。上述した他の演算においては、Ｅ
ＡＬＵ６１は２入力１出力の演算器として動作する。

【手続補正１５】

【補正対象書類名】明細書

【補正対象項目名】００３９

【補正方法】変更

【補正内容】

【００３９】以下、ＤＣＴ／ＩＤＣＴ、量子化などの画
像コーデックの各要素処理における演算ユニットの動作
を個別的に説明する。離散コサイン変換／離散コサイン逆変換（ＤＣＴ／ＩＤ
ＣＴ）離散コサイン変換／離散コサイン逆変換（ＤＣＴ／ＩＤ
ＣＴ）の要素処理において、本発明の実施例における演
算ユニットでは、本出願人が先に出願した、特願平４年
３３８１８３号の明細書及び図面で提案するような高速
演算アルゴリズムに適応するバタフライ演算（加算およ
び減算）と乗加算のマクロな演算パイプラインの構成を
以下のように実現する。

【手続補正１６】

【補正対象書類名】明細書

【補正対象項目名】００４２

【補正方法】変更

【補正内容】

【００４２】図７（Ａ）〜（Ｄ）に、本発明の実施例に
おける演算ユニットを用いて、上述の８×８ＤＣＴの演
算パイプライン構成を実現した場合の演算器およびメモ
リの結合形態（データパス）を示す。図７（Ａ）〜
（Ｄ）はそれぞれ、４系統の演算ユニットの動作形態を
示す。図７（Ａ）〜（Ｄ）および図１に示すように、演
算ユニット０（１），１（２），２（３）内のＥＡＬＵ
６１をメモリ０（５），１（６），２（７）、つまり、
パイプラインメモリ５，６，７を介してパイプライン接
続する。さらに、演算ユニット２（３）のＥＡＬＵ６１
の出力を、シリアル−パラレル変換器１０、データセレ
クタ４１〜４４を介して、４個の乗算器６２に接続し、
各々の乗算器６２の出力をシフト機能付き累算器６４に
パイプライン接続する。なお、この時のＥＡＬＵ６１
は、前述したＥＡＬＵとしての拡張機能であるバタフラ
イ演算を行うため、２入力２出力となっている。このよ
うな演算器およびメモリの結合形態を採ることにより、
図５に示すようなマクロな演算パイプライン構成を実現
する。

【手続補正１７】

【補正対象書類名】明細書

【補正対象項目名】００４３

【補正方法】変更

【補正内容】

【００４３】また、図８（Ａ）〜（Ｄ）に、本発明の実
施例における演算ユニットを用いて、上述の８×８ＩＤ
ＣＴの演算パイプライン構成を実現した場合の演算器お
よびメモリの結合形態（データパス）を示す。図８
（Ａ）〜（Ｄ）はそれぞれ、４系統の演算ユニットの動
作形態を示す。図８（Ａ）〜（Ｄ）および図１に示すよ
うに、各演算ユニットの４個の乗算器６２を各々シフト
機能付き累算器６４にパイプライン接続する。さらに、
すべてのシフト機能付き累算器６４の出力を、パラレル
−シリアル変換器９、データセレクタ８を介して、メモ
リ０（５）に接続する。また、演算ユニット１（２），
２（３），３（４）のＥＡＬＵ６１をメモリ０（５），
１（６），２（７）、つまり、パイプラインメモリ５，
６，７を介してパイプライン接続する。なお、この時の
ＥＡＬＵ６１は、前述したＥＡＬＵ６１の拡張機能であ
るバタフライ演算を行うため、２入力２出力となってい
る。このような演算器およびメモリの結合形態を採るこ
とにより、図６に示すようなマクロな演算パイプライン
構成を実現する。

【手続補正１８】

【補正対象書類名】明細書

【補正対象項目名】００７１

【補正方法】変更

【補正内容】

【００７１】

【発明の効果】本発明によれば、画像コーデックの要素
処理における、乗算した後に論理演算を行う演算、乗算
を連続して行う演算、あるいは、乗算した結果同士を加
算する種々の演算を適応的に１つの適応形ビデオ信号演
算処理装置で実現できる。また、本発明の適応形ビデオ
信号演算処理装置は、「単一命令ストリーム・多重デー
タストリーム：ＳＩＭＤ」制御方式に基づく、１本の演
算パイプラインを用いた１回のパイプライン処理で実現
できる。したがって、従来の構成と比較して、本発明の
適応形ビデオ信号演算処理装置は異なる演算器を用いる
演算を並列に実行できるため、演算器の使用効率は低下
しない。また、本発明の適応形ビデオ信号演算処理装置
は演算パイプラインの立ち上げ時の初期設定も１回でよ
い。さらには、本発明の適応形ビデオ信号演算処理装置
は中間結果を格納する必要はないので、データメモリの
容量は増大しない。

【手続補正１９】

【補正対象書類名】明細書

【補正対象項目名】符号の説明

【補正方法】変更

【補正内容】

【符号の説明】Ａ１・・算術論理演算ユニット（ＡＬＵ）Ａ２・・乗算器Ａ３・・係数メモリＡ４・・累算器１〜４・・本発明の実施例における演算ユニット５〜７・・相互接続パイプラインメモリ８・・データセレクタ９・・パラレル−シリアル変換器１０・・シリアル−パラレル変換器１１〜１４，２１〜２４…演算ユニットの入力端子３１〜３４・・演算ユニットの出力端子４１〜４４・・データセレクタ５１・・８ｘ８ＤＣＴ用入力端子５２・・８ｘ８ＩＤＣＴ用出力端子６１・・拡張論理演算ユニット（ＥＡＬＵ）６２・・乗算器６３・・係数メモリ６４・・シフト機能付き累算器７１〜７５・・データセレクタ３０１・・正負反転器３０２・・加算器３０３・・減算器３０４・・論理演算器３０５・・正負判定器３０６，３０７・・データセレクタ３１１，３１２・・ＥＡＬＵの入力端子３１３，３１４・・ＥＡＬＵの出力端子１０１〜１０３・・バタフライ演算器１１１・・乗加算器１２１・・シリアル−パラレル変換器１２２・・パラレル−シリアル変換器１３１〜１３３・・パイプラインメモリ１４１・・データメモリ

【手続補正２０】

【補正対象書類名】図面

【補正対象項目名】図６

【補正方法】変更

【補正内容】

【図６】

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁵ 識別記号庁内整理番号ＦＩ技術表示箇所Ｇ０６Ｆ 15/80 9190−5Ｌ

Claims

【特許請求の範囲】

【請求項１】離散コサイン変換／逆離散コサイン変換、
量子化／逆量子化、動きベクトル検出、動き補償、内積
演算、画像データ加算および画像データ差分処理などの
画像圧縮符号化／伸長復号化処理を、ｍｘｎの大きさの
ブロックの画像データについて、適応的に行う演算処理
装置であって、それぞれが、加算、減算、各種論理演算、大小比較、差
分絶対値演算、バタフライ加算・減算処理を行う拡張算
術論理演算ユニット、該拡張算術論理演算ユニットの後
段に設けられた第１の内部パイプラインメモリ、該第１
の内部パイプラインメモリの後段に設けられた乗算ユニ
ット、該乗算ユニットに係数を提供する係数メモリ、該
乗算ユニットに後段に設けられた第２の内部パイプライ
ンメモリ、該第２の内部パイプラインメモリの後段に設
けられた累積演算ユニット、該累積演算ユニットに後段
に設けられた第３の内部パイプラインメモリを有する、
複数の並列に設けられた演算ユニット、これら複数の並列に設けられた演算ユニットのうち、隣
接する演算ユニットを接続するように配設された相互接
続パイプラインメモリ、および、前記複数の演算ユニットに入力データを選択的に印加す
るデータセレクタを有し、前記相互接続パイプラインメモリを介して隣接する演算
ユニットを結合し、かつ、前記演算ユニット内の内部パ
イプラインメモリを選択して所定のデータ流れ経路を構
成し、所望のビデオ信号処理を行う、適応形ビデオ信号演算処
理装置。
【請求項２】前記適応形ビデオ信号演算処理装置は、単
一の命令ストリームで多重のデータストリーム処理を行
う、「単一命令ストリーム・多重データストリーム：Ｓ
ＩＭＤ」制御方式で動作する、請求項１記載の適応形ビ
デオ信号演算処理装置。
【請求項３】前記演算ユニット内において、前記拡張算
術論理演算ユニット、前記乗算ユニット、前記累積演算
ユニットが、パイプライン処理動作を行う、請求項１ま
たは２記載の適応形ビデオ信号演算処理装置。
【請求項４】前記拡張算術論理演算ユニットは、第１の入力データの極性を反転する正負反転器、該正負反転器の後段に設けられ、前記第１の入力データ
または前記極性反転された第１のデータを選択的に出力
する第１のデータセレクタ、該第１のデータセレクタの選択出力データおよび第２の
入力データとを加算する加算器、前記第１の入力データから前記第２の入力データを減じ
る減算器、前記第１の入力データと前記第２のデータとの、論理
和、論理積、排他的論理和、否定などの論理処理を行う
論理演算器、前記加算器および前記減算器の出力を入力して正負判定
を行う正負判定器、前記加算器、前記減算器、および、前記正負判定器の出
力を入力し、選択的に出力する第２のデータセレクタ、該第２のデータセレクタに接続された第１の出力端子、
および、前記減算器に接続された第２の出力端子を有し、上述した回路を組み合わせて、加算、減算、各種論理演
算、大小比較、差分絶対値演算、バタフライ加算・減算
処理のいずれかを行う、請求項３記載の適応形ビデオ信
号演算処理装置。
【請求項５】前記複数の演算ユニットの初段の演算ユニ
ットに、離散コサイン変換処理用データを入力する端子
が設けられ、前記複数の演算ユニットの最終段の演算ユニットに、離
散コサイン逆変換処理用データを入力する端子が設けら
れた、請求項４記載の適応形ビデオ信号演算処理装置。
【請求項６】ｍｘｎ画像データをブロックとして、バタ
フライ演算およびパイプラインメモリ処理を複数回数行
って離散コサイン変換処理を行う際、前記離散コサイン変換処理用データを前記最終段の演算
ユニットを除く複数の演算ユニット内の拡張算術論理演
算ユニットに入力し、該拡張算術論理演算ユニットにお
ける処理結果を隣接する前記相互接続パイプラインメモ
リに出力し、全ての演算ユニット内の乗算ユニットに最終段の相互接
続パイプラインメモリのデータを入力し、その乗算結果
を前記累積ユニットにおいて累積させるように経路を確
立する、請求項５記載の適応形ビデオ信号演算処理装
置。
【請求項７】ｍｘｎ画像データをブロックとして、パイ
プラインメモリ処理およびバタフライ演算を複数回数行
って離散コサイン逆変換処理を行う際、前記離散コサイン変換処理用データを前記初段の演算ユ
ニットを除く複数の演算ユニット内の拡張算術論理演算
ユニットに入力し、該拡張算術論理演算ユニットにおけ
る処理結果を隣接する前記相互接続パイプラインメモリ
に出力し、全ての演算ユニット内の乗算ユニットに最終段の相互接
続パイプラインメモリのデータを入力し、その乗算結果
を前記累積ユニットにおいて累積させるように経路を確
立する、請求項５記載の適応形ビデオ信号演算処理装
置。
【請求項８】量子化処理を行う際、隣接する演算ユニット内の第１の演算ユニットの乗算ユ
ニットの出力端子を第２の演算ユニットの乗算ユニット
の入力端子に接続し、該第２の乗算ユニットの乗算結果をその後段の累積ユニ
ットに入力し、前記第１の乗算ユニットに量子化対象のデータを入力す
るように経路を確立する、請求項１〜４いずれか記載の
適応形ビデオ信号演算処理装置。
【請求項９】逆量子化処理を行う際、隣接する演算ユニット内の第１の演算ユニットの乗算ユ
ニットの出力端子を第２の演算ユニットの乗算ユニット
の入力端子に接続し、該第２の乗算ユニットの乗算結果をその後段の累積ユニ
ットに入力し、第１の演算ユニットに逆量子化対象のデータおよび定数
を入力し、その演算結果を第１の乗算ユニットに入力す
るように経路を確立する、請求項１〜４いずれか記載の
適応形ビデオ信号演算処理装置。
【請求項１０】動きベクトル検出処理の際、全ての演算ユニット内の拡張算術論理演算ユニットを累
積演算ユニットに接続し、前記拡張算術論理演算ユニットに動きベクトル検出対象
の２つのデータを入力するように経路を確立する、請求
項１〜４いずれか記載の適応形ビデオ信号演算処理装
置。
【請求項１１】動き補償における仮想画素生成処理の
際、全ての演算ユニット内の拡張算術論理演算ユニットを累
積演算ユニットに接続し、前記拡張算術論理演算ユニットに動き補償における仮想
画素生成対象の２つのデータを入力するように経路を確
立する、請求項１〜４いずれか記載の適応形ビデオ信号
演算処理装置。
【請求項１２】動き補償における予測画素生成処理の
際、隣接する演算ユニットの一方の乗算ユニットの出力を他
方の拡張算術論理演算ユニットの一方の入力端子に印加
し、他方の乗算ユニットの出力を該他方の拡張算術論理演算
ユニットの他方の入力端子に印加し、該他方の拡張算術論理演算ユニットの演算結果を他方の
累積ユニットにおいて累積させるように経路を確立す
る、請求項１〜４いずれか記載の適応形ビデオ信号演算
処理装置。
【請求項１３】内積演算処理の際、全ての演算ユニット内の乗算ユニットに内積対象のデー
タを入力し、該乗算結果を対応する累積ユニットにおいて累積するよ
うに経路を確立する、請求項１〜４いずれか記載の適応
形ビデオ信号演算処理装置。
【請求項１４】画像データ加算処理の際、または、画像
データ減算処理の際、全ての演算ユニット内の拡張算術論理演算ユニットに処
理対象のデータを入力し、該処理結果を出力するように
経路を確立する、請求項１〜４いずれか記載の適応形ビ
デオ信号演算処理装置。