JPH06292178A - 適応形ビデオ信号演算処理装置 - Google Patents

適応形ビデオ信号演算処理装置

Info

Publication number
JPH06292178A
JPH06292178A JP7476893A JP7476893A JPH06292178A JP H06292178 A JPH06292178 A JP H06292178A JP 7476893 A JP7476893 A JP 7476893A JP 7476893 A JP7476893 A JP 7476893A JP H06292178 A JPH06292178 A JP H06292178A
Authority
JP
Japan
Prior art keywords
arithmetic
unit
data
processing
units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7476893A
Other languages
English (en)
Other versions
JP3546437B2 (ja
Inventor
Eiji Iwata
英次 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP07476893A priority Critical patent/JP3546437B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to US08/343,537 priority patent/US5594679A/en
Priority to AU62921/94A priority patent/AU668298B2/en
Priority to CNB94190248XA priority patent/CN1149496C/zh
Priority to EP94910573A priority patent/EP0644492B1/en
Priority to AT94910573T priority patent/ATE228255T1/de
Priority to PCT/JP1994/000525 priority patent/WO1994023384A1/ja
Publication of JPH06292178A publication Critical patent/JPH06292178A/ja
Application granted granted Critical
Publication of JP3546437B2 publication Critical patent/JP3546437B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Discrete Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Complex Calculations (AREA)
  • Advance Control (AREA)
  • Picture Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 離散コサイン変換/逆離散コサイン変換、量
子化/逆量子化、動きベクトル検出、動き補償、内積演
算、画像データ加算および画像データ差分処理などの画
像圧縮符号化/伸長復号化(コーデック)処理を、mx
nの大きさのブロックの画像データについて、適応的に
行う演算処理装置を提供する。 【構成】 それぞれが、加算、減算、各種論理演算、大
小比較、差分絶対値演算、バタフライ加算・減算処理を
行ない、乗算を行い、累積を行う複数の並列に設けられ
た演算ユニット1〜4、これら演算ユニットのうち、隣
接する演算ユニットを接続するように配設された相互接
続パイプラインメモリ5〜7、および、演算ユニット1
〜4に入力データを選択的に印加するデータセレクタ4
1〜44を有し、相互接続パイプラインメモリを介して
隣接する演算ユニットを結合し、かつ、前記演算ユニッ
ト内の内部パイプラインメモリを選択して所定のデータ
流れ経路を構成し、所望のビデオ信号処理を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、数値計算、画
像処理、グラフィックス処理等に用いられる計算機シス
テムにおける中央処理装置(プロセッサ)に関するもの
であり、特に画像圧縮符号化(コーデック)のようなビ
デオ信号処理に好適なディジタルシグナルプロセッサ
(DSP)などの適応形ビデオ信号演算処理装置に関す
る。
【0002】
【従来の技術】近年、CCITT H.261勧告やM
PEG等の画像圧縮符号化/伸長復号化標準に基づく画
像コーデック用ディジタルシグナルプロセッサ(DS
P)が多数提案されている。本発明は、これらのDSP
のうちで、文献、Yamauchi,et al,“A
rchitecture and Implement
ation ofa Highly Parallel
Single−Chip VideoDSP“,IE
EE TRANSACTIONS ON CIRCUI
TS AND SYSTEMS FOR VIDEO
TECHNOLOGY,VOL.2,NO.2,JUN
E 1992,pp.207−220、に提案されてい
るように、算術論理演算ユニット、乗算器、累算器等か
らなる演算ユニットを複数有し、それらの演算ユニット
が単一の命令流により複数のデータを並列に処理する
「単一命令ストリーム・多重データストリーム:SIM
D(Single Instruction stream Multiple Data strea
m)」制御方式のDSPに関する。この文献に記載されて
いる構成については図17を参照して後述する。このD
SPの演算ユニットは、演算器をパイプライン接続可能
であり、演算パイプライン処理も行う。
【0003】まず、演算パイプラインの原理について簡
単に説明する。図18に、演算パイプラインの構成例を
示す。この演算パイプラインは、2入力X,Yを算術論
理演算ユニット(ALU)A1において加算した後に、
加算結果と係数メモリA3からの係数とを乗算器A2に
おいて乗算し、さらにその乗算結果を累算器A3におい
て累算する。このような演算の連鎖を複数のデータに対
して連続的に行うことを演算パイプライン処理と呼ぶ。
【0004】図19は図18の演算パイプラインにおけ
る処理のタイムチャートを示すグラフである。簡単化の
ため、演算パイプラインの各演算器A1,A2,A4は
1クロックサイクルで演算を完了するものとする。図1
9における処理単位は、2入力端子に入力されるデータ
の組(X,Y)を意味する。図19に示すように、例え
ばi番目の処理単位についてみると、(k−1)番目の
クロックサイクルにおいてALU(A1)が加算処理を
行い、k番目のクロックサイクルにおいて乗算器A2が
乗算処理を行い、(k+1)番目のクロックサイクルに
おいて累算器A4が累積処理を行う。また、k番目のク
ロックサイクルについてみると、加算処理、乗算処理を
終えた(i−1)番目の処理単位が累算器A4において
累算され、加算を終えたi番目の処理単位が乗算器A2
において乗算され、(i+1)番目の処理単位が加算器
A1において加算されている。このような動作を複数の
処理単位に対して繰り返し行うことにより演算パイプラ
イン処理が実現できる。
【0005】次に、従来の技術について説明する。ここ
では、4組の演算ユニットが単一の命令流により複数の
データを並列に処理する、上述した文献において提案さ
れている「単一命令ストリーム・多重データストリー
ム:SIMD」制御方式のDSPを考える。前提とし
て、各演算ユニットは、加算、減算および論理演算を行
う算術論理演算ユニット(ALU)、乗算器、累算器の
3種の演算器からなるとする。また、簡単化のため、各
演算器は1クロックサイクルで演算を完了するものとす
る。したがって、このDSPは、1クロックサイクルで
最大12演算(例えば、4加算、4乗算、4累算)を実
行することができる。さらに、このDSPは、演算器へ
データを供給あるいは演算器からのデータを格納するた
めのデータメモリをチップ内あるいはチップ外に持つと
する。
【0006】最初に、上記の前提の下で、最も自由度の
高い演算パイプラインを実現する構成について述べる。
図20(A)〜(D)に示したように、最も自由度の高
い演算パイプラインは、データメモリをパイプラインレ
ジスタとみなし、ソフトウェアにより演算パイプライン
処理(ソフトウェア・パイプライニングと呼ばれる)を
行うことにより実現できる。このとき、各々の演算器は
データメモリを介してのみ結合されている。なお、図2
0(A)〜(D)はそれぞれ、4個の並列に設けられた
演算処理ユニットの動作形態を示す。したがって、デー
タメモリは、1クロックサイクル毎にすべての演算器の
入力に対して任意のデータを供給し、同時にすべての演
算器からの出力のデータを任意のアドレスに格納する必
要がある。データメモリのポート数は、図20(A)〜
(D)の図解から判るように、演算器への入力のために
16ポート必要で、演算器からの出力のために12ポー
ト必要である。したがって、合計28ポートのマルチポ
ートメモリが必要である。このポート数は、現在の半導
体回路技術と考え合わせてみて、非現実的であり、事実
上実現困難である。
【0007】そこで、データメモリをバンク分けして、
1バンク当たりのポート数を減らす手法が考えられる。
しかしながら、例えばデータメモリを4バンクに分割し
たとしても、上記の例では、なおも1バンク当たり7ポ
ートのマルチポートメモリを必要とする。したがって、
アプリケーション・プログラムに応じて演算パイプライ
ンの自由度をある程度限定し、データメモリのポート数
の減少を図るアプローチを採ることができる。
【0008】例えば、上述した文献に提案されているよ
うに、ALU、乗算器、累算器からなる演算パイプライ
ンを4本備え、演算パイプラインの入出力のみをデータ
メモリに接続する。この場合のデータメモリに要求され
るポート数は、演算パイプラインへの入力のために8ポ
ート、演算パイプラインからの出力のために4ポートと
なる。
【0009】
【発明が解決しようとする課題】ところが、上述した従
来のDSPの演算パイプラインの構成では、演算パイプ
ラインの自由度に制約がある。例えば、乗算した後に論
理演算を行う演算については、パイプライン演算ができ
ない。この場合、すべてのデータに対して、まず乗算器
を用いて乗算のパイプライン処理を行い、次に乗算後の
すべてのデータに対して、ALUを用いて論理演算のパ
イプライン処理を行う。したがって、乗算時はALUが
使用されず、論理演算時は乗算器が使用されていないた
め、演算器の使用効率が低下し、性能低下を招く。ま
た、演算パイプライン処理を2回に分けて行うため、演
算パイプラインの立ち上げ時の初期設定が2回必要とな
る。さらに、上述した従来のDSPにおいては、1回目
の演算パイプライン処理が完了した時点で中間結果を格
納する必要があるので、データメモリ容量が増大する。
【0010】画像コーデックの要素処理では、上記の例
のように乗算した後に論理演算を行う演算の他に、乗算
を連続して行う演算や、乗算した結果同士を加算する演
算等が必要となる。このような演算のそれぞれについ
て、上述した問題と同様の問題が発生する。
【0011】また、上述した従来のDSPの演算パイプ
ライン構成では、本出願人による、特許出願、特願平4
年338183号、「2次元8x8離散コサイン変換回
路および2次元8x8離散コサイン逆変換回路」におい
て提案するような高速演算アルゴリズムにおける、バタ
フライ演算(加算および減算)と乗加算の演算パイプラ
インの構成を実現できない。この先行する特許出願は、
2次元8x8離散コサイン変換、または、2次元8x8
離散コサイン変換を行うに際して、行列分解を適用して
演算処理するものであるが、その詳細は、図5および図
6を参照して後述する。
【0012】上記のように、演算パイプライン構成がで
きない理由としては、データメモリのポート数の制約
上、バタフライ演算(従来例では2演算ユニットを使
用)を行っているときには乗加算を並列に行えないため
である。よって、バタフライ演算と乗加算は逐次的に実
行されるので、上記特許出願において提案したような理
想的な演算パイプライン構成と比較して、性能は著しく
低下する。
【0013】
【課題を解決するための手段】上述した課題を解決する
ために、本発明では、ビデオ信号処理を行うディジタル
シグナルプロセッサ(DSP)、つまり、適応形ビデオ
信号演算処理装置において、算術論理演算ユニット(A
LU)、乗算器、累算器からなる演算ユニットを複数有
し、これらの演算ユニット内の演算器の接続形態および
演算ユニット間の接続形態を適宜切り替えることによ
り、画像コーデック処理における 離散コサイン変換/逆離散コサイン変換(DCT/ID
CT) 量子化/逆量子化 動きベクトル検出 動き補償(仮想画素生成、予測画素生成) フィルタ(内積演算) 画像加算、画像差分 等の要素処理の各々に適応した演算パイプラインを実現
する構造可変な演算パイプラインを設ける。
【0014】したがって、本発明によれば、離散コサイ
ン変換/逆離散コサイン変換、量子化/逆量子化、動き
ベクトル検出、動き補償、内積演算、画像データ加算お
よび画像データ差分処理などの画像圧縮符号化/伸長復
号化処理を、mxnの大きさのブロックの画像データに
ついて、適応的に行う演算処理装置であって、それぞれ
が、加算、減算、各種論理演算、大小比較、差分絶対値
演算、バタフライ加算・減算処理を行う拡張算術論理演
算ユニット、該拡張算術論理演算ユニットの後段に設け
られた第1の内部パイプラインメモリ、該第1の内部パ
イプラインメモリの後段に設けられた乗算ユニット、該
乗算ユニットに係数を提供する係数メモリ、該乗算ユニ
ットに後段に設けられた第2の内部パイプラインメモ
リ、該第2の内部パイプラインメモリの後段に設けられ
た累積演算ユニット、該累積演算ユニットに後段に設け
られた第3の内部パイプラインメモリを有する、複数の
並列に設けられた演算ユニット、これら複数の並列に設
けられた演算ユニットのうち、隣接する演算ユニットを
接続するように配設された相互接続パイプラインメモ
リ、および、前記複数の演算ユニットに入力データを選
択的に印加するデータセレクタを有し、前記相互接続パ
イプラインメモリを介して隣接する演算ユニットを結合
し、かつ、前記演算ユニット内の内部パイプラインメモ
リを選択して所定のデータ流れ経路を構成し、所望のビ
デオ信号処理を行う、適応形ビデオ信号演算処理装置が
提供される。
【0015】好適には、前記演算ユニット内において、
前記拡張算術論理演算ユニット、前記乗算ユニット、前
記累積演算ユニットが、パイプライン処理動作を行う。
【0016】特定的には、前記拡張算術論理演算ユニッ
トは、第1の入力データの極性を反転する正負反転器、
該正負反転器の後段に設けられ、前記第1の入力データ
または前記極性反転された第1のデータを選択的に出力
する第1のデータセレクタ、該第1のデータセレクタの
選択出力データおよび第2の入力データとを加算する加
算器、前記第1の入力データから前記第2の入力データ
を減じる減算器、前記第1の入力データと前記第2のデ
ータとの、論理和、論理積、排他的論理和、否定などの
論理処理を行う論理演算器、前記加算器および前記減算
器の出力を入力して正負判定を行う正負判定器、前記加
算器、前記減算器、および、前記正負判定器の出力を入
力し、選択的に出力する第2のデータセレクタ、該第2
のデータセレクタに接続された第1の出力端子、およ
び、前記減算器に接続された第2の出力端子を有し、上
述した回路を組み合わせて、加算、減算、各種論理演
算、大小比較、差分絶対値演算、バタフライ加算・減算
処理のいずれかを行う。
【0017】
【作用】上記の構成によれば、算術論理演算ユニット
(ALU)、乗算器、累算器からなる演算ユニットを複
数有し、これらの演算ユニット内の演算器の接続形態お
よび演算ユニット間の接続形態を適宜切り替えることに
より、画像コーデックの各要素処理を並列にパイプライ
ン処理できる。
【0018】好適には、前記適応形ビデオ信号演算処理
装置は、単一の命令ストリームで多重のデータストリー
ム処理を行う、「単一命令ストリーム・多重データスト
リーム:SIMD」制御方式で動作する。
【0019】離散コサイン変換処理用および離散コサイ
ン逆変換処理用を行う場合には、前記複数の演算ユニッ
トの初段の演算ユニットに、離散コサイン変換処理用デ
ータを入力する端子が設けられ、前記複数の演算ユニッ
トの最終段の演算ユニットに、離散コサイン逆変換処理
用データを入力する端子が設けられる。mxn画像デー
タをブロックとして、バタフライ演算およびパイプライ
ンメモリ処理を複数回数行って離散コサイン変換処理を
行う際には、前記離散コサイン変換処理用データを前記
最終段の演算ユニットを除く複数の演算ユニット内の拡
張算術論理演算ユニットに入力し、該拡張算術論理演算
ユニットにおける処理結果を隣接する前記相互接続パイ
プラインメモリに出力し、全ての演算ユニット内の乗算
ユニットに最終段の相互接続パイプラインメモリのデー
タを入力し、その乗算結果を前記累積ユニットにおいて
累積させる。
【0020】また、mxn画像データをブロックとし
て、パイプラインメモリ処理およびバタフライ演算を複
数回数行って離散コサイン逆変換処理を行う際には、前
記離散コサイン変換処理用データを前記初段の演算ユニ
ットを除く複数の演算ユニット内の拡張算術論理演算ユ
ニットに入力し、該拡張算術論理演算ユニットにおける
処理結果を隣接する前記相互接続パイプラインメモリに
出力し、全ての演算ユニット内の乗算ユニットに最終段
の相互接続パイプラインメモリのデータを入力し、その
乗算結果を前記累積ユニットにおいて累積させる。
【0021】量子化処理を行う際には、隣接する演算ユ
ニット内の第1の演算ユニットの乗算ユニットの出力端
子を第2の演算ユニットの乗算ユニットの入力端子に接
続し、該第2の乗算ユニットの乗算結果をその後段の累
積ユニットに入力し、前記第1の乗算ユニットに量子化
対象のデータを入力する。
【0022】逆量子化処理を行う際には、隣接する演算
ユニット内の第1の演算ユニットの乗算ユニットの出力
端子を第2の演算ユニットの乗算ユニットの入力端子に
接続し、該第2の乗算ユニットの乗算結果をその後段の
累積ユニットに入力し、第1の演算ユニットに逆量子化
対象のデータおよび定数を入力し、その演算結果を第1
の乗算ユニットに入力する。
【0023】動きベクトル検出処理の際には、全ての演
算ユニット内の拡張算術論理演算ユニットを累積演算ユ
ニットに接続し、前記拡張算術論理演算ユニットに動き
ベクトル検出対象の2つのデータを入力する。
【0024】動き補償における仮想画素生成処理の際に
は、全ての演算ユニット内の拡張算術論理演算ユニット
を累積演算ユニットに接続し、前記拡張算術論理演算ユ
ニットに動き補償における仮想画素生成対象の2つのデ
ータを入力する。
【0025】動き補償における予測画素生成処理の際に
は、隣接する演算ユニットの一方の乗算ユニットの出力
を他方の拡張算術論理演算ユニットの一方の入力端子に
印加し、他方の乗算ユニットの出力を該他方の拡張算術
論理演算ユニットの他方の入力端子に印加し、該他方の
拡張算術論理演算ユニットの演算結果を他方の累積ユニ
ットにおいて累積させる。
【0026】内積演算処理の際には、全ての演算ユニッ
ト内の乗算ユニットに内積対象のデータを入力し、該乗
算結果を対応する累積ユニットにおいて累積する。
【0027】画像データ加算処理の際、または、画像デ
ータ減算処理の際には、全ての演算ユニット内の拡張算
術論理演算ユニットに処理対象のデータを入力し、該処
理結果を出力する。
【0028】
【実施例】以下、図面を参照し、本発明の実施例の適応
形ビデオ信号演算処理装置について詳述する。本発明の
実施例においても、従来技術と同様に、4組の演算ユニ
ットが単一の命令流により並列動作する、上記文献にお
いて提案されている「単一命令ストリーム・多重データ
ストリーム:SIMD」制御方式のDSPを考える。前
提として、各演算ユニットは、加算、減算および論理演
算を行うALU、乗算器、累算器の3種の演算器からな
るとする。また、簡単のため、各演算器は1クロックサ
イクルで演算を完了するものとする。したがって、この
DSPは、1クロックサイクルで最大12演算を実行す
ることができる。さらに、このDSPは演算器にデータ
を供給し、また、演算器からのデータを格納するための
データメモリをチップ内あるいはチップ外に持つとす
る。
【0029】以下、演算ユニットの構成を述べたあと、
画像コーデックの要素処理における演算ユニットの動作
を説明する。なお、ここで例示する画像コーデックの要
素処理は、主にMPEGで使用される要素処理である。 (1)演算ユニットの構成 図1に、4組の演算ユニット1〜4間の結合形態を示
す。図1では、データメモリは図示していない。実際に
は、データ入力端子(Xin0〜Xin3)11〜1
4、および、データ入力端子(Yin0〜Yin3)2
1〜24、および、データ出力端子(Out1〜Out
3)31〜34は、何らかの相互結合網を介してデータ
メモリ(図示せず)に接続されている。ここでは簡単の
ため、データメモリは、上記8個のデータ入力端子11
〜14、21〜24に1クロックサイクル毎にデータを
供給でき、同時に上記4個のデータ出力端子31〜34
からのデータを1クロックサイクル毎に書き込むことが
できるとする。すなわち、演算ユニット1〜4とデータ
メモリ(図示せず)とは、上記のデータ転送能力を備え
た相互結合網により結合されているとする。また、演算
ユニット1〜4間を結合するメモリ(以下、相互接続パ
イプラインメモリと呼ぶ)0(5)、1(6)、2
(7)や、パラレル−シリアル変換器9、シリアル−パ
ラレル変換器10、データセレクタ8,41〜44は、
後述する離散コサイン変換/逆離散コサイン変換(また
は、離散コサイン逆変換)(DCT/IDCT)の高速
演算アルゴリズムにおけるマクロな演算パイプライン構
成を実現する際に必要となる。なお、図1に示したDC
T入力端子51およびIDCT入力端子52について
も、相互結合網(図示せず)を介してデータメモリ(図
示せず)に接続されており、1クロックサイクル毎のデ
ータ入出力が可能となっている。
【0030】図2および図3に演算ユニットの内部構成
を示す。図2は演算ユニット0(1)および演算ユニッ
ト2(3)の内部構成図であり、図3が演算ユニット1
(2)および演算ユニット3(4)の内部構成図であ
る。図2および図3に示すように、演算ユニット内で
は、加算、減算、論理演算および後述するバタフライ演
算等の演算を行う拡張算術論理演算ユニット(EAL
U)61、係数メモリ63、乗算器62、累算とシフト
演算を行うシフト機能付き累算器64、さらには入力端
子(Xink)1k(kはk番目を示す)および(Yi
nk)2k、および、出力端子(Outk)3kが、デ
ータセレクタ71〜75を介して相互に結合されてい
る。簡単化のため、これらの演算器は、全て1クロック
サイクルで演算を完了するものとする。したがって、演
算器61、62、64の後段に設けられている内部パイ
プライン・レジスタ(図示省略)が存在する。このよう
な演算器61、62、63および内部パイプラインメモ
リの結合形態を採ることにより、データセレクタ71〜
75の設定に従って、内部パイプラインメモリを介し
て、演算器61、62、64間のデータパスを変化させ
ることが可能となる。よって、この演算ユニットは、1
〜3段の構造可変な演算パイプライン構成を採りうる。
【0031】図2に示した演算ユニットと図3に示した
演算ユニットとの相違は、図3に示した演算ユニットに
は、データセレクタ71および73に第3の入力データ
が印加される構成になっていることである。
【0032】図4に拡張算術論理演算ユニット(EAL
U)61の構成を示す。EALU61は、正負反転器3
01、データセレクタ306、加算器302、減算器3
03、論理演算器304、正負判定器305、データセ
レクタ307を有する。このEALU61は、通常のA
LUの基本機能である加算、減算、論理演算(否定、論
理和、論理積、排他的論理和等)の他に、大小比較演算
min(X,Y)、max(X,Y)、差分絶対値演算
|X−Y|、バタフライ演算(2入力について加算と減
算を同時に行う)を拡張機能として備える。これらの基
本機能および拡張機能は、上述した各種演算器301、
302、303、304および305を適切に結合する
ことによって実現される。以下、上記の基本機能および
拡張機能をEALU61が各種演算器を用いていかに実
現するかを述べる。
【0033】加算 入力端子311および312に印加された2入力データ
XおよびYの加算は加算器302を用いて実現する。入
力データXについては、正負反転器301を経由しない
データXが加算器302に印加されるように、予めデー
タセレクタ306を設定する。これにより、加算器30
2からは加算結果(X+Y)が出力される。データセレ
クタ307は、加算器302の加算出力をEALU61
の出力として、A側出力端子313から出力する。
【0034】減算 入力端子311および312に印加された2入力データ
(X−Y)の演算は減算器303を用いて実現する。減
算器83からは減算結果(X−Y)が出力される。この
減算結果はB側出力端子314から出力される。
【0035】論理演算 入力端子311および312に印加された2入力データ
(X,Y)の論理演算は論理演算器304を用いて実現
する。論理演算器304は、否定、論理和、論理積、排
他的論理和などの論理演算を行い、この演算結果が、デ
ータセレクタ307を介して、A側出力端子313から
EALU61の結果として出力される。
【0036】大小比較演算:min(X,Y),max
(X,Y) 入力端子311および312に印加された2入力データ
(X,Y)の大小比較は、正負反転器301、加算器3
02、減算器303および正負判定器305を用いて行
う。入力データXは正負反転器301で反転され、反転
された(−X)がデータセレクタ306を介して加算器
302に印加される。これにより、加算器302から減
算結果(Y−X)が出力される。一方、減算器303に
おいて減算(X−Y)の演算が行われる。加算結果(Y
−X)および減算結果(X−Y)が正負判定器305に
印加されて、入力データXとYとの大小比較判定が行わ
れる。正負判定器305は下記の判定基準に従って、大
小判定を行う。 1.最小値:min(X,Y) (Y−X)≧0とき、最小値=X (Y−X)<0とき、最小値=Y 2.最大値:max(X,Y) (X−Y)≧0とき、最大値=Y (X−Y)<0とき、最大値=X ただし、最小値と最大値とをを同時に出力はできない。
データセレクタ307は、正負反転器305の出力をE
ALU61の出力として、A側出力端子313から出力
する。
【0037】差分絶対値演算|X−Y| 入力端子311および312に印加された2入力データ
(X,Y)の差分絶対値演算は、正負反転器301、加
算器302、減算器303および正負判定器305を用
いて行う。入力データXについては正負反転器301で
極性反転された−Xがデータセレクタ306から加算器
302に選択出力されるように、予めデータセレクタ3
06を設定しておく。加算器302は加算(Y−X)を
行い、減算器303は減算(X−Y)を行う。これらの
演算結果が正負判定器305に入力される。正負判定器
305は、下記の差分絶対値演算を行う。 (Y−X)≧0とき、差分絶対値=Y−X (X−Y)<0とき、差分絶対値=X−Y データセレクタ307は上記演算された差分絶対値をA
側出力端子313から出力する。
【0038】バタフライ演算 入力端子311および312に印加された2入力データ
(X,Y)についてのバタフライ演算は、加算器301
2および減算器303を用いて実現する。入力データX
が正負反転器301を経由しないで加算器302に印加
されるように、予めデータセレクタ306を設定してお
く。加算器302は加算(X+Y)を行い、減算器30
3は減算(X−Y)を行う。データセレクタ307が加
算器302の出力をEALU61の出力としてA側出力
端子313から出力すると同時に、減算器303の減算
結果がB側出力端子314から出力される。このバタフ
ライ演算の場合のみ、EALU61は2入力2出力の演
算器として動作する。上述した他の演算においては、E
ALU61は2入力1出力の演算器として動作する。
【0039】以下、DCT/IDCT、量子化などの画
像コーデックの各要素処理における演算ユニットの動作
を個別的に説明する。離散コサイン変換/逆離散コサイン変換(DCT/ID
CT) 離散コサイン変換/逆離散コサイン変換(DCT/ID
CT)の要素処理において、本発明の実施例における演
算ユニットでは、本出願人が先に出願した、特願平4年
338183号の明細書及び図面で提案するような高速
演算アルゴリズムに適応するバタフライ演算(加算およ
び減算)と乗加算のマクロな演算パイプラインの構成を
以下のように実現する。
【0040】図5は8x8DCTの演算パイプライン構
成の概略図を示し、図6は8x8IDCTの演算パイプ
ライン構成の概略図を示す。これらの演算パイプライン
の処理単位は8x8の画像ブロック(64画素)であ
り、パイプラインメモリ131〜133を介した4段の
演算パイプライン構成となる。したがって、通常の画素
単位で1クロックサイクル毎にパイプライン処理を行う
演算パイプラインとは異なり、64クロックサイクル毎
にパイプライン処理を行うことから、マクロな演算パイ
プラインと考えられる。
【0041】以下、8x8DCTを例にとって上記の演
算パイプラインの高速演算アルゴリズムを簡単に説明す
る。前述の特許出願、特願平4年338183号におい
て提案したような行列分解により、8x8DCTは、8
×8の画像ブロック(64画素)に対して165回のバ
タフライ演算(加算165回および減算165回)を行
い、さらに、220回の乗加算(乗算220回および累
算220回)を行うことにより実現できる。したがっ
て、図5に示すような4段の演算パイプラインの構成、
つまり、3個のバタフライ演算器101〜103と4個
の乗加算器111による回路構成を採ることにより、6
4クロックサイクル周期(理想的には55クロックサイ
クル)で演算パイプライン処理を行い、8×8DCTを
計算することが可能となる。また、8×8IDCTにつ
いても、乗加算とバタフライ演算の順序が入れ替わるだ
けで、演算量や演算パイプライン段数は変わらない。な
お、上述した出願では、乗加算器数を3個にするため
に、さらに乗加算回数を減らす工夫を行っているが、本
発明の実施例においては乗加算器数は4個であると仮定
しているため、この工夫は必要ない。
【0042】図7(A)〜(D)に、本発明の実施例に
おける演算ユニットを用いて、上述の8×8IDCTの
演算パイプライン構成を実現した場合の演算器およびメ
モリの結合形態(データパス)を示す。図7(A)〜
(D)はそれぞれ、4系統の演算ユニットの動作形態を
示す。図7(A)〜(D)および図1に示すように、演
算ユニット0(1),1(2),2(3)内のEALU
61をメモリ0(5),1(6),2(7)、つまり、
パイプラインメモリ5,6,7を介してパイプライン接
続する。さらに、演算ユニット2(3)のEALU61
の出力を、シリアル−パラレル変換器10、データセレ
クタ41〜44を介して、4個の乗算器62に接続し、
各々の乗算器62の出力をシフト機能付き累算器64に
パイプライン接続する。なお、この時のEALU61
は、前述したEALUとしての拡張機能であるバタフラ
イ演算を行うため、2入力2出力となっている。このよ
うな演算器およびメモリの結合形態を採ることにより、
図5に示すようなマクロな演算パイプライン構成を実現
する。
【0043】また、図8(A)〜(D)に、本発明の実
施例における演算ユニットを用いて、上述の8×8ID
CTの演算パイプライン構成を実現した場合の演算器お
よびメモリの結合形態(データパス)を示す。図8
(A)〜(D)はそれぞれ、4系統の演算ユニットの動
作形態を示す。図8(A)〜(D)および図9(A)〜
(D)に示すように、各演算ユニットの4個の乗算器6
2を各々シフト機能付き累算器64にパイプライン接続
する。さらに、すべてのシフト機能付き累算器64の出
力を、パラレル−シリアル変換器9、データセレクタ8
を介して、メモリ0(5)に接続する。また、演算ユニ
ット1(2),2(3),3(4)のEALU61をメ
モリ0(5),1(6),2(7)、つまり、パイプラ
インメモリ5,6,7を介してパイプライン接続する。
なお、この時のEALU61は、前述したEALU61
の拡張機能であるバタフライ演算を行うため、2入力2
出力となっている。このような演算器およびメモリの結
合形態を採ることにより、図6に示すようなマクロな演
算パイプライン構成を実現する。
【0044】量子化/逆量子化処理 (イ)量子化 画像コーデックの量子化処理においては、下式1のよう
に乗算を連続して行い、さらにシフト演算を行う演算パ
ターンが存在する。これは、量子化処理において最も複
雑な演算パターンである。
【0045】
【数1】
【0046】ただし、Xは量子化前の画素値であり、Y
は量子化後の画素値を表し、Wは量子化行列の係数を示
し、QPは量子化スケールパラメータを表す。
【0047】図9(A)〜(D)に本発明の実施例にお
ける演算ユニットを用いて上式の演算を実現した場合の
演算器の結合形態(データパス)を示す。図9(A)〜
(D)はそれぞれ4系統の演算ユニットの動作形態を示
す。図9(A)〜(D)のように、2個の乗算器62お
よびシフト機能付き累算器64をパイプライン接続する
データパスを実現することにより、上式の演算パターン
を分割処理することなく1本の演算パイプラインで処理
できる。この量子化処理の演算パターンにおいて、本発
明の実施例における演算ユニットの構成では、図9
(A)〜(D)に示すように3段の演算パイプラインを
2本実現できる。このような演算パイプライン構成を採
ることにより、画像ブロック内の全画素に対する量子化
を2並列にパイプライン処理できる。
【0048】ロ)逆量子化 画像コーデックの逆量子化処理においては、下式2のよ
うにシフトおよび加算を行ったあと、乗算を連続して行
い、さらに、シフト演算を行う演算パターンが存在す
る。これは、逆量子化処理において最も複雑な演算パタ
ーンである。
【0049】
【数2】
【0050】ただし、Xは量子化前の画素値であり、Y
は量子化後の画素値を表し、Kは逆量子化時に必要とな
る定数を表し、(K= 0、1または−1)Wは量子化行
列の係数であり、QP量子化スケールパラメータを表
す。
【0051】図10(A)〜(D)に本発明の一実施例
における演算ユニットを用いて、上式の演算を実現した
場合の演算器の結合形態(データパス)を示す。図10
(A)〜(D)はそれぞれ、4系統の演算ユニットの動
作形態を示す。図10(A)〜(D)に示すように、E
ALU61と2個の乗算器62およびシフト機能付き累
算器64をパイプライン接続するデータパスを構成する
ことにより、上式の演算パターンを分割することなく1
本の演算パイプラインで実現できる。なお、シフトおよ
び定数加算は、EALU61で1クロックサイクルで実
行可能とする。この逆量子化処理の演算パターンにおい
て、本発明の実施例における演算ユニットの構成では、
図10(A)〜(D)に示すように4段の演算パイプラ
インを2本実現できる。このような演算パイプライン構
成を採ることにより、画像ブロック内の全画素に対する
逆量子化を2並列にパイプライン処理できる。
【0052】動きベクトル検出 画像コーデックの動きベクトル検出処理においては、下
式のような差分絶対値和演算が動きベクトル候補の数だ
け必要となる(ただし、探索アルゴリズムにブロックマ
ッチングの全探索を採用した場合)。
【0053】
【数3】
【0054】ただし、Xは動きベクトル探索の基準とな
る画像ブロック(参照ブロックと呼ばれる)の画素値を
表し、Yは動きベクトル探索の対象となる画像ブロック
(候補ブロックと呼ばれる)の画素値を表す。
【0055】図11(A)〜(D)に本発明の一実施例
における演算ユニットを用いて、上式の演算を実現した
場合の演算器の結合形態(データパス)を示す。図11
(A)〜(D)はそれぞれ4系統の演算ユニットの動作
形態を示す。図11(A)〜(D)のように、EALU
61およびシフト機能付き累算器64をパイプライン接
続するデータパスを構成することにより、上式の差分絶
対値和演算を分割することなく1本の演算パイプライン
で実現できる。なお、差分絶対値演算には、前述したE
ALU61の拡張機能である差分絶対値演算機能を用い
る。この動きベクトル検出処理の差分絶対値和演算にお
いて、本発明の実施例における演算ユニットの構成で
は、図11(A)〜(D)に示すように2段の演算パイ
プラインを4本実現できる。このような演算パイプライ
ン構成を採ることにより、全候補ブロックに対する動き
ベクトル検出を4並列にパイプライン処理できる。
【0056】動き補償(仮想画素生成、予測画素生成) 画像コーデックにおける動き補償処理は、動きベクトル
の値やブロックのモードにより、様々な処理に場合分け
される。このうち、最も複雑な演算を行う場合について
考える。このとき、動き補償処理は、仮想画素生成およ
び予測画素生成の2つの処理に分けられる。以下、本発
明の実施例における演算ユニットにおいて、上記2つの
処理のそれぞれに適応する演算パイプラインの構成をど
のように実現するかを説明する。
【0057】(イ)仮想画素生成 仮想画素生成処理は、1/2画素精度の動きベクトルに
伴い、画素間の補間を行って仮想画素を生成する処理で
ある。図12に仮想画素の生成規則を示す。図12から
分かるように、最も複雑な仮想画素生成処理は、近傍4
画素から中央の1仮想画素を生成する場合である。
【0058】
【数4】
【0059】ただし、aは仮想画素を表し、x,y,
z,wは、近傍の4画素を表す。
【0060】図13(A)〜(D)に本発明の実施例に
おける演算ユニットを用いて、上式の演算を実現した場
合の演算器の結合形態(データパス)を示す。図13
(A)〜(D)はそれぞれ、4系統の演算ユニットの動
作形態を示す。図13(A)〜(D)のように、EAL
U61およびシフト機能付き累算器64をパイプライン
接続するデータパスを構成することにより、上式の演算
パターンを分割することなく1本の演算パイプラインで
処理できる。この仮想画素生成処理において、本発明の
一実施例における演算ユニットの構成では、図13
(A)〜(D)に示すように2段の演算パイプラインを
4本実現できる。このような演算パイプライン構成を採
ることにより、画像ブロック内の全画素に対する仮想画
素生成を4並列にパイプライン処理できる。
【0061】(ロ)予測画素生成 予測画素生成処理は、単方向(前向きあるいは後ろ向
き)動き補償予測か両方向動き補償予測かのモードによ
り異なる。単方向動き補償予測の場合は、単に動きベク
トルに従ってフレームメモリにアクセスし、当該画像ブ
ロックを得ればよい。ところが、両方向動き補償予測の
場合は、前向きおよび後ろ向きの2種の動きベクトルに
従って2つのフレームメモリからそれぞれ画像ブロック
を得、さらにそれらの画素を時間的距離によって平均化
して予測値を得る。
【0062】
【数5】
【0063】ただし、aは両方向動き補償予測値を示
し、x,yはそれぞれ前向きおよび後ろ向きの動き補償
予測値を示し、Aは2つの画像ブロックの時間的距離に
よって決定するパラメータである。
【0064】図14(A)〜(D)に本発明の一実施例
における演算ユニットを用いて、上式の演算を実現した
場合の演算器の結合形態(データパス)を示す。図14
(A)〜(D)はそれぞれ、4系統の演算ユニットの動
作形態を示す。図14(A)〜(D)に示すように、2
個の乗算器62の出力をEALU61の入力とし、さら
にシフト機能付き累算器64をパイプライン接続するデ
ータパスを構成することにより、上式の演算パターンを
分割することなく1本の演算パイプラインで実現でき
る。この予測画素生成処理において、本発明の実施例に
おける演算ユニットの構成では、図14(A)〜(D)
に示すように3段の演算パイプラインを2本実現でき
る。このような演算パイプライン構成を採ることによ
り、画像ブロック内の全画素に対する予測画素生成を2
並列にパイプライン処理できる。
【0065】フィルタ(内積演算) 画像コーデックに限らず、フィルタ処理は画像処理の基
本的な要素処理である。ここでは、画像ブロック内の全
画素に対して1次元フィルタ処理を行う場合を考える。
フィルタ処理においては下式のような内積演算が必要と
なる。
【0066】
【数6】
【0067】ただし、cはフィルタ係数を示し、xは画
像ブロック内の画素を示す。
【0068】図15(A)〜(D)に本発明の実施例の
演算ユニットを用いて上式の演算を実現した場合の演算
器の結合形態(データパス)を示す。図15(A)〜
(D)はそれぞれ、4系統の演算ユニットの動作形態を
示す。図15(A)〜(D)に示すように、乗算器62
およびシフト機能付き累算器64をパイプライン接続す
るデータパスを構成することにより、上式の内積演算を
分割することなく1本の演算パイプラインで実現でき
る。このフィルタ処理において、本発明の実施例におけ
る演算ユニットの構成では、図15(A)〜(D)に示
すように2段の演算パイプラインを4本実現できる。こ
のような演算パイプライン構成を採ることにより、画像
ブロック内の全画素に対するフィルタ処理を4並列にパ
イプライン処理できる。
【0069】画像加算、画像差分 画像加算および画像差分もまた、画像コーデックに限ら
ず、画像処理の基本的な要素処理である。ここでは、画
像ブロック間で画像加算あるいは画像差分を計算する場
合を考える。図16(A)〜(D)に本発明の一実施例
における演算ユニットを用いて、画像加算あるいは画像
差分を実現した場合の演算器の結合形態(データパス)
を示す。図16(A)〜(D)はそれぞれ、4系統の演
算ユニットの動作形態を示す。本発明の実施例における
演算ユニットの構成では、図16(A)〜(D)に示す
ようにEALU61を用いた1段の演算パイプラインを
4本実現できる。このような演算パイプライン構成を採
ることにより、画像ブロック内の全画素に対する画像加
算あるいは画像差分を4並列にパイプライン処理でき
る。
【0070】以上の実施例は、適応形ビデオ信号の代表
的な処理について述べたが、本発明き適応形ビデオ信号
演算処理装置においては、上述した信号処理例に限定さ
れず、上記同様の他の信号処理にも適用できる。
【0071】
【発明の効果】本発明によれば、画像コーデックの要素
処理における、乗算した後に論理演算を行う演算、乗算
を連続して行う演算、あるいは、乗算した結果同士を加
算する種々の演算を適応的に1つの適応形ビデオ信号演
算処理装置で実現できる。また、本発明の適応形ビデオ
信号演算処理装置は、「単一命令ストリーム・多重デー
タストリーム:SIMD」制御方式に基づく、1本の演
算パイプラインを用いた1回のパイプライン処理で実現
できる。したがって、従来の構成と比較して、本発明の
適応形ビデオ信号演算処理装置は異なる演算器を用いる
演算を並列に実行できるため、演算器の使用効率は低下
しない。また、本発明の適応形ビデオ信号演算処理装置
は演算パイプラインの立ち上げ時の初期設定も1回でよ
い。さらには、本発明の適応形ビデオ信号演算処理装置
は中間結果を格納する必要はないので、データメモリ容
量は増大しない。
【0072】また、本発明の適応形ビデオ信号演算処理
装置はバタフライ演算器3個と乗加算器をパイプライン
・メモリで接続したマクロな演算パイプライン構成を実
現可能としているため、前述の特願平4年338183
号出願(平成4年11月25日出願)にて提案したよう
な回路構成による、DCT高速演算アルゴリズムにおけ
るバタフライ演算と乗加算の演算パイプラインの構成が
実現可能となる。これにより、本発明の適応形ビデオ信
号演算処理装置は、画像コーデックのDCT/IDCT
の要素処理における演算器使用効率が従来の構成と比較
して大幅に向上し、性能が向上する。
【図面の簡単な説明】
【図1】本発明の実施例による演算ユニットの結合形態
を示す適応形ビデオ信号演算処理装置の構成図である。
【図2】本発明の実施例による演算ユニット0,2の構
成を示す図である。
【図3】本発明の実施例による演算ユニット1,3の構
成を示す図である。
【図4】本発明の実施例による拡張論理演算ユニット
(EALU)の構成を示す図である。
【図5】8×8DCTの演算パイプライン構成図であ
る。
【図6】8×8IDCTの演算パイプライン構成図であ
る。
【図7】本発明の実施例によるDCT処理時の適応形ビ
デオ信号演算処理装置の演算パイプラインの構成を示す
図であり、(A)〜(D)はそれぞれ4系統の演算ユニ
ットの動作形態を示す図である。
【図8】本発明の実施例によるIDCT処理時の適応形
ビデオ信号演算処理装置の演算パイプラインの構成を示
す図であり、(A)〜(D)はそれぞれ4系統の演算ユ
ニットの動作形態を示す図である。
【図9】本発明の実施例による量子化処理時の適応形ビ
デオ信号演算処理装置の演算パイプラインの構成を示す
図であり、(A)〜(D)はそれぞれ4系統の演算ユニ
ットの動作形態を示す図である。
【図10】本発明の実施例による逆量子化処理時の適応
形ビデオ信号演算処理装置の演算パイプラインの構成を
示す図であり、(A)〜(D)はそれぞれ4系統の演算
ユニットの動作形態を示す図である。
【図11】本発明の実施例による動きベクトル検出処理
時の適応形ビデオ信号演算処理装置の演算パイプライン
の構成を示す図であり、(A)〜(D)はそれぞれ4系
統の演算ユニットの動作形態を示す図である。
【図12】画像コーデックの動き補償処理の仮想画素生
成規則を示す図である。
【図13】本発明の実施例による動き補償における仮想
画素生成処理時の演算パイプラインの構成を示す図であ
り、(A)〜(D)はそれぞれ4系統の演算ユニットの
動作形態を示す図である。
【図14】本発明の実施例による動き補償における予測
画素生成処理時の演算パイプラインの構成を示す図であ
り、(A)〜(D)はそれぞれ4系統の演算ユニットの
動作形態を示す図である。
【図15】本発明の実施例によるフィルタ処理時の演算
パイプラインの構成を示す図であり、(A)〜(D)は
それぞれ4系統の演算ユニットの動作形態を示す図であ
る。
【図16】本発明の実施例による画像加算あるいは画像
差分処理時の適応形ビデオ信号演算処理装置の演算パイ
プラインの構成を示す図であり、(A)〜(D)はそれ
ぞれ4系統の演算ユニットの動作形態を示す図である。
【図17】「単一命令ストリーム・多重データストリー
ム:SIMD」制御方式のプロセッサの構成図である。
【図18】演算パイプラインの例を示す図である。
【図19】図18の演算パイプライン処理におけるタイ
ムチャートを示すグラフである。
【図20】最も自由度の高い演算パイプラインの構成を
示す図であり、(A)〜(D)はそれぞれ4系統の演算
ユニットの動作形態を示す図である。
【符号の説明】
A1・・算術論理演算ユニット(ALU) A2・・乗算器 A3・・係数メモリ A4・・累算器 1〜4・・本発明の実施例における演算ユニット 5〜7・・相互接続パイプラインメモリ 8・・データセレクタ 9・・パラレル−シリアル変換器 10・・シリアル−パラレル変換器 11〜14,21〜24…演算ユニットの入力端子 31〜34・・演算ユニットの出力端子 41〜44・・データセレクタ 51・・8x8DCT用入力端子 52・・8x8IDCT用出力端子 61・・拡張論理演算ユニット(EALU) 62・・乗算器 63・・係数メモリ 64・・シフト機能付き累算器 71〜75・・データセレクタ 81・・正負反転器 82・・加算器 83・・減算器 84・・論理演算器 85・・正負反転器 86,87・・データセレクタ 91,92・・EALUの入力端子 93,94・・EALUの出力端子 101〜103・・バタフライ演算器 111・・乗加算器 121・・シリアル−パラレル変換器 122・・パラレル−シリアル変換器 131〜133・・パイプラインメモリ 141・・データメモリ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成6年4月11日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項1
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】請求項5
【補正方法】変更
【補正内容】
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】請求項7
【補正方法】変更
【補正内容】
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0001
【補正方法】変更
【補正内容】
【0001】
【産業上の利用分野】本発明は、例えば、数値計算、画
像処理、グラフィックス処理等に用いられる計算機シス
テムにおける中央処理装置(プロセッサ)に関するもの
であり、特に画像圧縮符号化(コーデック:CODE
)のようなビデオ信号処理に好適なディジタルシグナ
ルプロセッサ(DSP)などの適応形ビデオ信号演算処
理装置に関する。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0002
【補正方法】変更
【補正内容】
【0002】
【従来の技術】近年、CCITT H.261勧告やM
PEG等の画像圧縮符号化/伸長復号化標準に基づく画
像コーデック用ディジタルシグナルプロセッサ(DS
P)が多数提案されている。本発明は、これらのDSP
のうちで、文献、Yamauchi,et al,“A
rchitecture and Implement
ation ofa Highly Parallel
Single−Chip VideoDSP“,IE
EE TRANSACTIONS ON CIRCUI
TS AND SYSTEMS FOR VIDEO
TECHNOLOGY,VOL.2,NO.2,JUN
E 1992,pp.207−220、に提案されてい
るように、算術論理演算ユニット、乗算器、累算器等か
らなる演算ユニットを複数有し、それらの演算ユニット
が単一の命令流により複数のデータを並列に処理する
「単一命令ストリーム・多重データストリーム:SIM
D(Single Instruction stream Multiple Data strea
m)」制御方式のDSPに関する。この文献に記載されて
いる構成を図17に示した。このDSPの演算ユニット
は、演算器をパイプライン接続可能であり、演算パイプ
ライン処理も行う。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正内容】
【0007】そこで、データメモリをバンク分けして、
1バンク当たりのポート数を減らす手法が考えられる。
しかしながら、例えばデータメモリを4バンクに分割し
たとしても、上記の例では、なおも1バンク当たり7ポ
ートのマルチポートメモリを必要とする。したがって、
アプリケーション・プログラムに応じて演算パイプライ
ンの自由度をある程度限定し、データメモリのポート数
の減少を図るアプローチが採られる。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正内容】
【0011】また、上述した従来のDSPの演算パイプ
ライン構成では、本出願人による、特許出願、特願平4
年338183号、「2次元8x8離散コサイン変換回
路および2次元8x8離散コサイン逆変換回路」におい
て提案するような高速演算アルゴリズムにおける、バタ
フライ演算(加算および減算)と乗加算の演算パイプラ
インの構成を実現できない。この先行する特許出願は、
2次元8x8離散コサイン変換、または、2次元8x8
離散コサイン変換を行うに際して、行列分解を適用し
て演算処理するものであるが、その詳細は、図5および
図6を参照して後述する。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0013
【補正方法】変更
【補正内容】
【0013】
【課題を解決するための手段】上述した課題を解決する
ために、本発明では、ビデオ信号処理を行うディジタル
シグナルプロセッサ(DSP)、つまり、適応形ビデオ
信号演算処理装置において、算術論理演算ユニット(A
LU)、乗算器、累算器からなる演算ユニットを複数有
し、これらの演算ユニット内の演算器の接続形態および
演算ユニット間の接続形態を適宜切り替えることによ
り、画像コーデック処理における 離散コサイン変換/離散コサイン変換(DCT/ID
CT) 量子化/逆量子化 動きベクトル検出 動き補償(仮想画素生成、予測画素生成) フィルタ(内積演算) 画像加算、画像差分 等の要素処理の各々に適応した演算パイプラインを実現
する構造可変な演算パイプラインを設ける。
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0014
【補正方法】変更
【補正内容】
【0014】したがって、本発明によれば、離散コサイ
ン変換/離散コサイン変換、量子化/逆量子化、動き
ベクトル検出、動き補償、内積演算、画像データ加算お
よび画像データ差分処理などの画像圧縮符号化/伸長復
号化処理を、mxnの大きさのブロックの画像データに
ついて、適応的に行う演算処理装置であって、それぞれ
が、加算、減算、各種論理演算、大小比較、差分絶対値
演算、バタフライ加算・減算処理を行う拡張算術論理演
算ユニット、該拡張算術論理演算ユニットの後段に設け
られた第1の内部パイプラインメモリ、該第1の内部パ
イプラインメモリの後段に設けられた乗算ユニット、該
乗算ユニットに係数を提供する係数メモリ、該乗算ユニ
ットに後段に設けられた第2の内部パイプラインメモ
リ、該第2の内部パイプラインメモリの後段に設けられ
た累積演算ユニット、該累積演算ユニットに後段に設け
られた第3の内部パイプラインメモリを有する、複数の
並列に設けられた演算ユニット、これら複数の並列に設
けられた演算ユニットのうち、隣接する演算ユニットを
接続するように配設された相互接続パイプラインメモ
リ、および、前記複数の演算ユニットに入力データを選
択的に印加するデータセレクタを有し、前記相互接続パ
イプラインメモリを介して隣接する演算ユニットを結合
し、かつ、前記演算ユニット内の内部パイプラインメモ
リを選択して所定のデータ流れ経路を構成し、所望のビ
デオ信号処理を行う、適応形ビデオ信号演算処理装置が
提供される。
【手続補正10】
【補正対象書類名】明細書
【補正対象項目名】0019
【補正方法】変更
【補正内容】
【0019】離散コサイン変換処理用および離散コサイ
ン逆変換処理用を行う場合には、前記複数の演算ユニッ
トの初段の演算ユニットに、離散コサイン変換処理用デ
ータを入力する端子が設けられ、前記複数の演算ユニッ
トの最終段の演算ユニットに、離散コサイン逆変換処理
用データを出力する端子が設けられる。mxn画像デー
タをブロックとして、バタフライ演算およびパイプライ
ンメモリ処理を複数回数行って離散コサイン変換処理を
行う際には、前記離散コサイン変換処理用データを前記
最終段の演算ユニットを除く複数の演算ユニット内の拡
張算術論理演算ユニットに入力し、該拡張算術論理演算
ユニットにおける処理結果を隣接する前記相互接続パイ
プラインメモリに出力し、全ての演算ユニット内の乗算
ユニットに最終段の相互接続パイプラインメモリのデー
タを入力し、その乗算結果を前記累積ユニットにおいて
累積させる。
【手続補正11】
【補正対象書類名】明細書
【補正対象項目名】0020
【補正方法】変更
【補正内容】
【0020】また、mxn画像データをブロックとし
て、パイプラインメモリ処理およびバタフライ演算を複
数回数行って離散コサイン逆変換処理を行う際には、
記離散コサイン逆変換用データを全ての演算ユニット内
の乗算ユニットに入力し、その乗算結果を前記累算ユニ
ットにおいて累積させ、その出力を前記初段の演算ユニ
ットを除く複数の演算ユニット内の拡張算術論理演算ユ
ニットに入力し、該拡張算術論理演算ユニットにおける
処理結果を隣接する相互接続パイプラインメモリに出力
する。
【手続補正12】
【補正対象書類名】明細書
【補正対象項目名】0029
【補正方法】変更
【補正内容】
【0029】以下、演算ユニットの構成を述べたあと、
画像コーデックの要素処理における演算ユニットの動作
を説明する。なお、ここで例示する画像コーデックの要
素処理は、主にMPEGで使用される要素処理である。 (1)演算ユニットの構成 図1に、4組の演算ユニット1〜4間の結合形態を示
す。図1では、データメモリは図示していない。実際に
は、データ入力端子(Xin0〜Xin3)11〜1
4、および、データ入力端子(Yin0〜Yin3)2
1〜24、および、データ出力端子(Out1〜Out
3)31〜34は、何らかの相互結合網を介してデータ
メモリ(図示せず)に接続されている。ここでは簡単の
ため、データメモリは、上記8個のデータ入力端子11
〜14、21〜24に1クロックサイクル毎にデータを
供給でき、同時に上記4個のデータ出力端子31〜34
からのデータを1クロックサイクル毎に書き込むことが
できるとする。すなわち、演算ユニット1〜4とデータ
メモリ(図示せず)とは、上記のデータ転送能力を備え
た相互結合網により結合されているとする。また、演算
ユニット1〜4間を結合するメモリ(以下、相互接続パ
イプラインメモリと呼ぶ)0(5)、1(6)、2
(7)や、パラレル−シリアル変換器9、シリアル−パ
ラレル変換器10、データセレクタ8,41〜44は、
後述する離散コサイン変換/離散コサイン換(DC
T/IDCT)の高速演算アルゴリズムにおけるマクロ
な演算パイプライン構成を実現する際に必要となる。な
お、図1に示したDCT入力端子51およびIDCT
端子52についても、相互結合網(図示せず)を介し
てデータメモリ(図示せず)に接続されており、1クロ
ックサイクル毎のデータ入出力が可能となっている。
【手続補正13】
【補正対象書類名】明細書
【補正対象項目名】0030
【補正方法】変更
【補正内容】
【0030】図2および図3に演算ユニットの内部構成
を示す。図2は演算ユニット0(1)および演算ユニッ
ト2(3)の内部構成図であり、図3が演算ユニット1
(2)および演算ユニット3(4)の内部構成図であ
る。図2および図3に示すように、演算ユニット内で
は、加算、減算、論理演算および後述するバタフライ演
算等の演算を行う拡張算術論理演算ユニット(EAL
U)61、係数メモリ63、乗算器62、累算とシフト
演算を行うシフト機能付き累算器64、さらには入力端
子(Xink)1k(kはk番目を示す)および(Yi
nk)2k、および、出力端子(Outk)3kが、デ
ータセレクタ71〜75を介して相互に結合されてい
る。簡単化のため、これらの演算器は、全て1クロック
サイクルで演算を完了するものとする。したがって、演
算器61、62、64の後段に設けられている内部パイ
プラインメモリ(図示省略)が存在する。このような演
算器61、62、63および内部パイプラインメモリの
結合形態を採ることにより、データセレクタ71〜75
の設定に従って、内部パイプラインメモリを介して、演
算器61、62、64間のデータパスを変化させること
が可能となる。よって、この演算ユニットは、1〜3段
の構造可変な演算パイプライン構成を採りうる。
【手続補正14】
【補正対象書類名】明細書
【補正対象項目名】0036
【補正方法】変更
【補正内容】
【0036】大小比較演算:min(X,Y),max
(X,Y) 入力端子311および312に印加された2入力データ
(X,Y)の大小比較は、正負反転器301、加算器3
02、減算器303および正負判定器305を用いて行
う。入力データXは正負反転器301で反転され、反転
された(−X)がデータセレクタ306を介して加算器
302に印加される。これにより、加算器302から減
算結果(Y−X)が出力される。一方、減算器303に
おいて減算(X−Y)の演算が行われる。加算結果(Y
−X)および減算結果(X−Y)が正負判定器305に
印加されて、入力データXとYとの大小比較判定が行わ
れる。正負判定器305は下記の判定基準に従って、大
小判定を行う。 1.最小値:min(X,Y) (Y−X)≧0とき、最小値=X (Y−X)<0とき、最小値=Y 2.最大値:max(X,Y) (X−Y)≧0とき、最大値=Y (X−Y)<0とき、最大値=X ただし、最小値と最大値とをを同時に出力はできない。
データセレクタ307は、正負判定器305の出力をE
ALU61の出力として、A側出力端子313から出力
する。
【手続補正15】
【補正対象書類名】明細書
【補正対象項目名】0038
【補正方法】変更
【補正内容】
【0038】バタフライ演算 入力端子311および312に印加された2入力データ
(X,Y)についてのバタフライ演算は、加算器302
および減算器303を用いて実現する。入力データXが
正負反転器301を経由しないで加算器302に印加さ
れるように、予めデータセレクタ306を設定してお
く。加算器302は加算(X+Y)を行い、減算器30
3は減算(X−Y)を行う。データセレクタ307が加
算器302の出力をEALU61の出力としてA側出力
端子313から出力すると同時に、減算器303の減算
結果がB側出力端子314から出力される。このバタフ
ライ演算の場合のみ、EALU61は2入力2出力の演
算器として動作する。上述した他の演算においては、E
ALU61は2入力1出力の演算器として動作する。
【手続補正15】
【補正対象書類名】明細書
【補正対象項目名】0039
【補正方法】変更
【補正内容】
【0039】以下、DCT/IDCT、量子化などの画
像コーデックの各要素処理における演算ユニットの動作
を個別的に説明する。離散コサイン変換/離散コサイン逆変換(DCT/ID
CT) 離散コサイン変換/離散コサイン変換(DCT/ID
CT)の要素処理において、本発明の実施例における演
算ユニットでは、本出願人が先に出願した、特願平4年
338183号の明細書及び図面で提案するような高速
演算アルゴリズムに適応するバタフライ演算(加算およ
び減算)と乗加算のマクロな演算パイプラインの構成を
以下のように実現する。
【手続補正16】
【補正対象書類名】明細書
【補正対象項目名】0042
【補正方法】変更
【補正内容】
【0042】図7(A)〜(D)に、本発明の実施例に
おける演算ユニットを用いて、上述の8×8DCTの演
算パイプライン構成を実現した場合の演算器およびメモ
リの結合形態(データパス)を示す。図7(A)〜
(D)はそれぞれ、4系統の演算ユニットの動作形態を
示す。図7(A)〜(D)および図1に示すように、演
算ユニット0(1),1(2),2(3)内のEALU
61をメモリ0(5),1(6),2(7)、つまり、
パイプラインメモリ5,6,7を介してパイプライン接
続する。さらに、演算ユニット2(3)のEALU61
の出力を、シリアル−パラレル変換器10、データセレ
クタ41〜44を介して、4個の乗算器62に接続し、
各々の乗算器62の出力をシフト機能付き累算器64に
パイプライン接続する。なお、この時のEALU61
は、前述したEALUとしての拡張機能であるバタフラ
イ演算を行うため、2入力2出力となっている。このよ
うな演算器およびメモリの結合形態を採ることにより、
図5に示すようなマクロな演算パイプライン構成を実現
する。
【手続補正17】
【補正対象書類名】明細書
【補正対象項目名】0043
【補正方法】変更
【補正内容】
【0043】また、図8(A)〜(D)に、本発明の実
施例における演算ユニットを用いて、上述の8×8ID
CTの演算パイプライン構成を実現した場合の演算器お
よびメモリの結合形態(データパス)を示す。図8
(A)〜(D)はそれぞれ、4系統の演算ユニットの動
作形態を示す。図8(A)〜(D)および図に示すよ
うに、各演算ユニットの4個の乗算器62を各々シフト
機能付き累算器64にパイプライン接続する。さらに、
すべてのシフト機能付き累算器64の出力を、パラレル
−シリアル変換器9、データセレクタ8を介して、メモ
リ0(5)に接続する。また、演算ユニット1(2),
2(3),3(4)のEALU61をメモリ0(5),
1(6),2(7)、つまり、パイプラインメモリ5,
6,7を介してパイプライン接続する。なお、この時の
EALU61は、前述したEALU61の拡張機能であ
るバタフライ演算を行うため、2入力2出力となってい
る。このような演算器およびメモリの結合形態を採るこ
とにより、図6に示すようなマクロな演算パイプライン
構成を実現する。
【手続補正18】
【補正対象書類名】明細書
【補正対象項目名】0071
【補正方法】変更
【補正内容】
【0071】
【発明の効果】本発明によれば、画像コーデックの要素
処理における、乗算した後に論理演算を行う演算、乗算
を連続して行う演算、あるいは、乗算した結果同士を加
算する種々の演算を適応的に1つの適応形ビデオ信号演
算処理装置で実現できる。また、本発明の適応形ビデオ
信号演算処理装置は、「単一命令ストリーム・多重デー
タストリーム:SIMD」制御方式に基づく、1本の演
算パイプラインを用いた1回のパイプライン処理で実現
できる。したがって、従来の構成と比較して、本発明の
適応形ビデオ信号演算処理装置は異なる演算器を用いる
演算を並列に実行できるため、演算器の使用効率は低下
しない。また、本発明の適応形ビデオ信号演算処理装置
は演算パイプラインの立ち上げ時の初期設定も1回でよ
い。さらには、本発明の適応形ビデオ信号演算処理装置
は中間結果を格納する必要はないので、データメモリ
容量は増大しない。
【手続補正19】
【補正対象書類名】明細書
【補正対象項目名】符号の説明
【補正方法】変更
【補正内容】
【符号の説明】 A1・・算術論理演算ユニット(ALU) A2・・乗算器 A3・・係数メモリ A4・・累算器 1〜4・・本発明の実施例における演算ユニット 5〜7・・相互接続パイプラインメモリ 8・・データセレクタ 9・・パラレル−シリアル変換器 10・・シリアル−パラレル変換器 11〜14,21〜24…演算ユニットの入力端子 31〜34・・演算ユニットの出力端子 41〜44・・データセレクタ 51・・8x8DCT用入力端子 52・・8x8IDCT用出力端子 61・・拡張論理演算ユニット(EALU) 62・・乗算器 63・・係数メモリ 64・・シフト機能付き累算器 71〜75・・データセレクタ301 ・・正負反転器302 ・・加算器303 ・・減算器304 ・・論理演算器305 ・・正負判定306307・・データセレクタ311312・・EALUの入力端子313314・・EALUの出力端子 101〜103・・バタフライ演算器 111・・乗加算器 121・・シリアル−パラレル変換器 122・・パラレル−シリアル変換器 131〜133・・パイプラインメモリ 141・・データメモリ
【手続補正20】
【補正対象書類名】図面
【補正対象項目名】図6
【補正方法】変更
【補正内容】
【図6】
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/80 9190−5L

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】離散コサイン変換/逆離散コサイン変換、
    量子化/逆量子化、動きベクトル検出、動き補償、内積
    演算、画像データ加算および画像データ差分処理などの
    画像圧縮符号化/伸長復号化処理を、mxnの大きさの
    ブロックの画像データについて、適応的に行う演算処理
    装置であって、 それぞれが、加算、減算、各種論理演算、大小比較、差
    分絶対値演算、バタフライ加算・減算処理を行う拡張算
    術論理演算ユニット、該拡張算術論理演算ユニットの後
    段に設けられた第1の内部パイプラインメモリ、該第1
    の内部パイプラインメモリの後段に設けられた乗算ユニ
    ット、該乗算ユニットに係数を提供する係数メモリ、該
    乗算ユニットに後段に設けられた第2の内部パイプライ
    ンメモリ、該第2の内部パイプラインメモリの後段に設
    けられた累積演算ユニット、該累積演算ユニットに後段
    に設けられた第3の内部パイプラインメモリを有する、
    複数の並列に設けられた演算ユニット、 これら複数の並列に設けられた演算ユニットのうち、隣
    接する演算ユニットを接続するように配設された相互接
    続パイプラインメモリ、および、 前記複数の演算ユニットに入力データを選択的に印加す
    るデータセレクタを有し、 前記相互接続パイプラインメモリを介して隣接する演算
    ユニットを結合し、かつ、前記演算ユニット内の内部パ
    イプラインメモリを選択して所定のデータ流れ経路を構
    成し、 所望のビデオ信号処理を行う、適応形ビデオ信号演算処
    理装置。
  2. 【請求項2】前記適応形ビデオ信号演算処理装置は、単
    一の命令ストリームで多重のデータストリーム処理を行
    う、「単一命令ストリーム・多重データストリーム:S
    IMD」制御方式で動作する、請求項1記載の適応形ビ
    デオ信号演算処理装置。
  3. 【請求項3】前記演算ユニット内において、前記拡張算
    術論理演算ユニット、前記乗算ユニット、前記累積演算
    ユニットが、パイプライン処理動作を行う、請求項1ま
    たは2記載の適応形ビデオ信号演算処理装置。
  4. 【請求項4】前記拡張算術論理演算ユニットは、 第1の入力データの極性を反転する正負反転器、 該正負反転器の後段に設けられ、前記第1の入力データ
    または前記極性反転された第1のデータを選択的に出力
    する第1のデータセレクタ、 該第1のデータセレクタの選択出力データおよび第2の
    入力データとを加算する加算器、 前記第1の入力データから前記第2の入力データを減じ
    る減算器、 前記第1の入力データと前記第2のデータとの、論理
    和、論理積、排他的論理和、否定などの論理処理を行う
    論理演算器、 前記加算器および前記減算器の出力を入力して正負判定
    を行う正負判定器、 前記加算器、前記減算器、および、前記正負判定器の出
    力を入力し、選択的に出力する第2のデータセレクタ、 該第2のデータセレクタに接続された第1の出力端子、
    および、 前記減算器に接続された第2の出力端子を有し、 上述した回路を組み合わせて、加算、減算、各種論理演
    算、大小比較、差分絶対値演算、バタフライ加算・減算
    処理のいずれかを行う、請求項3記載の適応形ビデオ信
    号演算処理装置。
  5. 【請求項5】前記複数の演算ユニットの初段の演算ユニ
    ットに、離散コサイン変換処理用データを入力する端子
    が設けられ、 前記複数の演算ユニットの最終段の演算ユニットに、離
    散コサイン逆変換処理用データを入力する端子が設けら
    れた、請求項4記載の適応形ビデオ信号演算処理装置。
  6. 【請求項6】mxn画像データをブロックとして、バタ
    フライ演算およびパイプラインメモリ処理を複数回数行
    って離散コサイン変換処理を行う際、 前記離散コサイン変換処理用データを前記最終段の演算
    ユニットを除く複数の演算ユニット内の拡張算術論理演
    算ユニットに入力し、該拡張算術論理演算ユニットにお
    ける処理結果を隣接する前記相互接続パイプラインメモ
    リに出力し、 全ての演算ユニット内の乗算ユニットに最終段の相互接
    続パイプラインメモリのデータを入力し、その乗算結果
    を前記累積ユニットにおいて累積させるように経路を確
    立する、請求項5記載の適応形ビデオ信号演算処理装
    置。
  7. 【請求項7】mxn画像データをブロックとして、パイ
    プラインメモリ処理およびバタフライ演算を複数回数行
    って離散コサイン逆変換処理を行う際、 前記離散コサイン変換処理用データを前記初段の演算ユ
    ニットを除く複数の演算ユニット内の拡張算術論理演算
    ユニットに入力し、該拡張算術論理演算ユニットにおけ
    る処理結果を隣接する前記相互接続パイプラインメモリ
    に出力し、 全ての演算ユニット内の乗算ユニットに最終段の相互接
    続パイプラインメモリのデータを入力し、その乗算結果
    を前記累積ユニットにおいて累積させるように経路を確
    立する、請求項5記載の適応形ビデオ信号演算処理装
    置。
  8. 【請求項8】量子化処理を行う際、 隣接する演算ユニット内の第1の演算ユニットの乗算ユ
    ニットの出力端子を第2の演算ユニットの乗算ユニット
    の入力端子に接続し、 該第2の乗算ユニットの乗算結果をその後段の累積ユニ
    ットに入力し、 前記第1の乗算ユニットに量子化対象のデータを入力す
    るように経路を確立する、請求項1〜4いずれか記載の
    適応形ビデオ信号演算処理装置。
  9. 【請求項9】逆量子化処理を行う際、 隣接する演算ユニット内の第1の演算ユニットの乗算ユ
    ニットの出力端子を第2の演算ユニットの乗算ユニット
    の入力端子に接続し、 該第2の乗算ユニットの乗算結果をその後段の累積ユニ
    ットに入力し、 第1の演算ユニットに逆量子化対象のデータおよび定数
    を入力し、その演算結果を第1の乗算ユニットに入力す
    るように経路を確立する、請求項1〜4いずれか記載の
    適応形ビデオ信号演算処理装置。
  10. 【請求項10】動きベクトル検出処理の際、 全ての演算ユニット内の拡張算術論理演算ユニットを累
    積演算ユニットに接続し、 前記拡張算術論理演算ユニットに動きベクトル検出対象
    の2つのデータを入力するように経路を確立する、請求
    項1〜4いずれか記載の適応形ビデオ信号演算処理装
    置。
  11. 【請求項11】動き補償における仮想画素生成処理の
    際、 全ての演算ユニット内の拡張算術論理演算ユニットを累
    積演算ユニットに接続し、 前記拡張算術論理演算ユニットに動き補償における仮想
    画素生成対象の2つのデータを入力するように経路を確
    立する、請求項1〜4いずれか記載の適応形ビデオ信号
    演算処理装置。
  12. 【請求項12】動き補償における予測画素生成処理の
    際、 隣接する演算ユニットの一方の乗算ユニットの出力を他
    方の拡張算術論理演算ユニットの一方の入力端子に印加
    し、 他方の乗算ユニットの出力を該他方の拡張算術論理演算
    ユニットの他方の入力端子に印加し、 該他方の拡張算術論理演算ユニットの演算結果を他方の
    累積ユニットにおいて累積させるように経路を確立す
    る、請求項1〜4いずれか記載の適応形ビデオ信号演算
    処理装置。
  13. 【請求項13】内積演算処理の際、 全ての演算ユニット内の乗算ユニットに内積対象のデー
    タを入力し、 該乗算結果を対応する累積ユニットにおいて累積するよ
    うに経路を確立する、請求項1〜4いずれか記載の適応
    形ビデオ信号演算処理装置。
  14. 【請求項14】画像データ加算処理の際、または、画像
    データ減算処理の際、 全ての演算ユニット内の拡張算術論理演算ユニットに処
    理対象のデータを入力し、該処理結果を出力するように
    経路を確立する、請求項1〜4いずれか記載の適応形ビ
    デオ信号演算処理装置。
JP07476893A 1993-03-31 1993-03-31 適応形ビデオ信号演算処理装置 Expired - Fee Related JP3546437B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP07476893A JP3546437B2 (ja) 1993-03-31 1993-03-31 適応形ビデオ信号演算処理装置
AU62921/94A AU668298B2 (en) 1993-03-31 1994-03-30 Apparatus for adaptively processing video signals
CNB94190248XA CN1149496C (zh) 1993-03-31 1994-03-30 自适应视频信号运算处理装置
EP94910573A EP0644492B1 (en) 1993-03-31 1994-03-30 Apparatus for adaptively processing video signals
US08/343,537 US5594679A (en) 1993-03-31 1994-03-30 Adaptive video signal processing apparatus
AT94910573T ATE228255T1 (de) 1993-03-31 1994-03-30 Gerät zur adaptiven vidio-signalverarbeitung.
PCT/JP1994/000525 WO1994023384A1 (en) 1993-03-31 1994-03-30 Apparatus for adaptively processing video signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07476893A JP3546437B2 (ja) 1993-03-31 1993-03-31 適応形ビデオ信号演算処理装置

Publications (2)

Publication Number Publication Date
JPH06292178A true JPH06292178A (ja) 1994-10-18
JP3546437B2 JP3546437B2 (ja) 2004-07-28

Family

ID=13556799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07476893A Expired - Fee Related JP3546437B2 (ja) 1993-03-31 1993-03-31 適応形ビデオ信号演算処理装置

Country Status (7)

Country Link
US (1) US5594679A (ja)
EP (1) EP0644492B1 (ja)
JP (1) JP3546437B2 (ja)
CN (1) CN1149496C (ja)
AT (1) ATE228255T1 (ja)
AU (1) AU668298B2 (ja)
WO (1) WO1994023384A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161165A (ja) * 1994-11-29 1996-06-21 Kanya Go パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法
US5929939A (en) * 1995-04-18 1999-07-27 Matsushita Electric Industrial Co., Ltd. Correlation degree operation apparatus, parallel correlation degree operation apparatus and correlation degree operation method
JP2002008025A (ja) * 2000-04-21 2002-01-11 Matsushita Electric Ind Co Ltd 画素演算装置
WO2005025230A1 (ja) * 2003-08-28 2005-03-17 Hitachi Ulsi Systems Co., Ltd. 画像処理装置
JP2005092252A (ja) * 2003-09-11 2005-04-07 Matsushita Electric Ind Co Ltd 演算処理装置
JP2007531072A (ja) * 2003-12-19 2007-11-01 マイクロユニティ システムズ エンジニアリング インコーポレイテッド プログラム可能なプロセッサ及び拡張演算を伴う方法
US7558972B2 (en) 2005-01-25 2009-07-07 Panasonic Corporation Data processing apparatus
KR101160640B1 (ko) * 2003-12-30 2012-06-28 삼성전자주식회사 데이터 처리 시스템 및 데이터 처리 방법
USRE48845E1 (en) 2002-04-01 2021-12-07 Broadcom Corporation Video decoding system supporting multiple standards

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0714212A3 (en) * 1994-11-21 1999-03-31 SICAN, GESELLSCHAFT FÜR SILIZIUM-ANWENDUNGEN UND CAD/CAT NIEDERSACHSEN mbH Video decoder using concurrent processing and resource sharing
JPH096614A (ja) * 1995-06-21 1997-01-10 Sanyo Electric Co Ltd データ処理装置
US7395298B2 (en) * 1995-08-31 2008-07-01 Intel Corporation Method and apparatus for performing multiply-add operations on packed data
US6385634B1 (en) * 1995-08-31 2002-05-07 Intel Corporation Method for performing multiply-add operations on packed data
US5984515A (en) * 1995-12-15 1999-11-16 Intel Corporation Computer implemented method for providing a two dimensional rotation of packed data
WO1997024681A1 (en) * 1995-12-19 1997-07-10 Intel Corporation A computer system performing a two-dimensional rotation of packed data representing multimedia information
US5825680A (en) * 1996-06-21 1998-10-20 Digital Equipment Corporation Method and apparatus for performing fast division
JP3092526B2 (ja) * 1996-09-20 2000-09-25 日本電気株式会社 2次元逆離散コサイン変換回路
JPH10254839A (ja) * 1997-03-11 1998-09-25 Sony Corp Simd制御並列プロセッサおよび演算方法
KR100435257B1 (ko) * 1997-08-07 2004-07-16 삼성전자주식회사 영상신호 처리 시스템에서의 이미지 포맷 변환장치 및 방법
US5864703A (en) * 1997-10-09 1999-01-26 Mips Technologies, Inc. Method for providing extended precision in SIMD vector arithmetic operations
CN1216337C (zh) * 1997-11-17 2005-08-24 索尼电子有限公司 用于采用离散变换进行数字视频数据压缩的方法和系统
US6137916A (en) * 1997-11-17 2000-10-24 Sony Electronics, Inc. Method and system for improved digital video data processing using 8-point discrete cosine transforms
US6215909B1 (en) 1997-11-17 2001-04-10 Sony Electronics, Inc. Method and system for improved digital video data processing using 4-point discrete cosine transforms
US6367003B1 (en) 1998-03-04 2002-04-02 Micron Technology, Inc. Digital signal processor having enhanced utilization of multiply accumulate (MAC) stage and method
EP3073388A1 (en) * 1998-03-18 2016-09-28 Koninklijke Philips N.V. Data processing device and method of computing the cosine transform of a matrix
US6377970B1 (en) 1998-03-31 2002-04-23 Intel Corporation Method and apparatus for computing a sum of packed data elements using SIMD multiply circuitry
US6292814B1 (en) * 1998-06-26 2001-09-18 Hitachi America, Ltd. Methods and apparatus for implementing a sign function
US6571268B1 (en) * 1998-10-06 2003-05-27 Texas Instruments Incorporated Multiplier accumulator circuits
WO2000031658A1 (fr) * 1998-11-26 2000-06-02 Matsushita Electric Industrial Co., Ltd. Processeur et dispositif de traitement d'image
US6690728B1 (en) 1999-12-28 2004-02-10 Sony Corporation Methods and apparatus for motion estimation in compressed domain
US6483876B1 (en) 1999-12-28 2002-11-19 Sony Corporation Methods and apparatus for reduction of prediction modes in motion estimation
US6671319B1 (en) 1999-12-28 2003-12-30 Sony Corporation Methods and apparatus for motion estimation using neighboring macroblocks
US6850566B2 (en) 2000-02-22 2005-02-01 Intervideo, Inc. Implementation of quantization for SIMD architecture
JP2001309386A (ja) * 2000-04-19 2001-11-02 Mitsubishi Electric Corp 画像処理装置
US7039906B1 (en) 2000-09-29 2006-05-02 International Business Machines Corporation Compiler for enabling multiple signed independent data elements per register
US6834337B1 (en) 2000-09-29 2004-12-21 International Business Machines Corporation System and method for enabling multiple signed independent data elements per register
US7430578B2 (en) * 2001-10-29 2008-09-30 Intel Corporation Method and apparatus for performing multiply-add operations on packed byte data
US7127482B2 (en) * 2001-11-19 2006-10-24 Intel Corporation Performance optimized approach for efficient downsampling operations
JP4136432B2 (ja) * 2002-04-15 2008-08-20 松下電器産業株式会社 図形描画装置
FI118654B (fi) * 2002-11-06 2008-01-31 Nokia Corp Menetelmä ja järjestelmä laskuoperaatioiden suorittamiseksi ja laite
FI118612B (fi) * 2002-11-06 2008-01-15 Nokia Corp Menetelmä ja järjestelmä laskuoperaatioiden suorittamiseksi ja laite
DE60330834D1 (de) * 2002-11-18 2010-02-25 St Microelectronics Pvt Ltd Linear skalierbares Filter mit endlicher Impulsantwort
TWI227840B (en) * 2003-12-03 2005-02-11 Via Tech Inc Method and apparatus for multiplying based on Booth's algorithm
KR100782815B1 (ko) * 2005-08-09 2007-12-06 삼성전자주식회사 인텐서티 보상을 위한 영상 디코딩 방법 및 장치
US7760951B2 (en) * 2006-02-14 2010-07-20 Broadcom Corporation Method and system for pipelined processing in an integrated embedded image and video accelerator
CN101207818B (zh) * 2006-12-20 2010-08-11 普诚科技股份有限公司 数据转换装置
US8589469B2 (en) * 2007-01-10 2013-11-19 Analog Devices Technology Bandwidth efficient instruction-driven multiplication engine
CN101114020B (zh) * 2007-09-12 2011-04-13 电子科技大学 雷达信号处理中动态加载的asic实现方法
US8181003B2 (en) * 2008-05-29 2012-05-15 Axis Semiconductor, Inc. Instruction set design, control and communication in programmable microprocessor cores and the like
US8755515B1 (en) 2008-09-29 2014-06-17 Wai Wu Parallel signal processing system and method
CN101989254B (zh) * 2009-08-05 2012-03-14 鸿富锦精密工业(深圳)有限公司 离散余弦转换及其逆转换电路
JP5530198B2 (ja) * 2009-11-20 2014-06-25 パナソニック株式会社 画像符号化方法、復号化方法、装置
GB2501145A (en) * 2012-04-12 2013-10-16 Supercell Oy Rendering and modifying objects on a graphical user interface
CN103067718B (zh) * 2013-01-30 2015-10-14 上海交通大学 适用于数字视频编解码的一维离散余弦逆变换模块电路
CN105468335B (zh) * 2015-11-24 2017-04-12 中国科学院计算技术研究所 流水级运算装置、数据处理方法及片上网络芯片
US10565036B1 (en) 2019-02-14 2020-02-18 Axis Semiconductor, Inc. Method of synchronizing host and coprocessor operations via FIFO communication

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6491272A (en) * 1987-10-01 1989-04-10 Nec Corp Arithmetic circuit
US4996661A (en) * 1988-10-05 1991-02-26 United Technologies Corporation Single chip complex floating point numeric processor
JPH07122846B2 (ja) * 1990-04-04 1995-12-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 3―1alu装置
GB2243469B (en) * 1990-04-27 1993-10-20 Pioneer Electronic Corp Digital signal processor
JPH0679315B2 (ja) * 1990-04-27 1994-10-05 パイオニア株式会社 ディジタル信号プロセッサ
US5179531A (en) * 1990-04-27 1993-01-12 Pioneer Electronic Corporation Accelerated digital signal processor
JPH0484317A (ja) * 1990-07-27 1992-03-17 Nec Corp 算術論理演算ユニット
JP2959104B2 (ja) * 1990-10-31 1999-10-06 日本電気株式会社 信号処理プロセッサ
JPH04252372A (ja) * 1991-01-28 1992-09-08 Nippon Telegr & Teleph Corp <Ntt> 可変パイプライン構造

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161165A (ja) * 1994-11-29 1996-06-21 Kanya Go パイプライン式及び心収縮式の単命令多重データストリームのアレイプロセッサ及びその方法
US5929939A (en) * 1995-04-18 1999-07-27 Matsushita Electric Industrial Co., Ltd. Correlation degree operation apparatus, parallel correlation degree operation apparatus and correlation degree operation method
JP2002008025A (ja) * 2000-04-21 2002-01-11 Matsushita Electric Ind Co Ltd 画素演算装置
JP4686048B2 (ja) * 2000-04-21 2011-05-18 パナソニック株式会社 画素演算装置
USRE48845E1 (en) 2002-04-01 2021-12-07 Broadcom Corporation Video decoding system supporting multiple standards
WO2005025230A1 (ja) * 2003-08-28 2005-03-17 Hitachi Ulsi Systems Co., Ltd. 画像処理装置
JP2005092252A (ja) * 2003-09-11 2005-04-07 Matsushita Electric Ind Co Ltd 演算処理装置
JP4663223B2 (ja) * 2003-09-11 2011-04-06 パナソニック株式会社 演算処理装置
JP2007531072A (ja) * 2003-12-19 2007-11-01 マイクロユニティ システムズ エンジニアリング インコーポレイテッド プログラム可能なプロセッサ及び拡張演算を伴う方法
KR101160640B1 (ko) * 2003-12-30 2012-06-28 삼성전자주식회사 데이터 처리 시스템 및 데이터 처리 방법
US7558972B2 (en) 2005-01-25 2009-07-07 Panasonic Corporation Data processing apparatus

Also Published As

Publication number Publication date
JP3546437B2 (ja) 2004-07-28
EP0644492B1 (en) 2002-11-20
ATE228255T1 (de) 2002-12-15
US5594679A (en) 1997-01-14
EP0644492A1 (en) 1995-03-22
AU6292194A (en) 1994-10-24
CN1108865A (zh) 1995-09-20
CN1149496C (zh) 2004-05-12
EP0644492A4 (en) 1997-07-02
WO1994023384A1 (en) 1994-10-13
AU668298B2 (en) 1996-04-26

Similar Documents

Publication Publication Date Title
JPH06292178A (ja) 適応形ビデオ信号演算処理装置
KR100714358B1 (ko) 연산을 수행하기 위한 방법, 시스템 및 장치
KR100715770B1 (ko) 연산을 수행하는 방법 및 시스템 및 장치
CN100474235C (zh) 用于单指令/多数据指令的乘法积累单元
US6754805B1 (en) Method and apparatus for configurable multi-cell digital signal processing employing global parallel configuration
US6601077B1 (en) DSP unit for multi-level global accumulation
US5452466A (en) Method and apparatus for preforming DCT and IDCT transforms on data signals with a preprocessor, a post-processor, and a controllable shuffle-exchange unit connected between the pre-processor and post-processor
JPH04128982A (ja) プロセッサエレメント、プロセッシングユニット、プロセッサ、及びその演算処理方法
KR20010067275A (ko) 벡터화 데이터에 대한 연산 동작 방법 및 장치
JP2001147804A (ja) パッケージデータのシフト方法および処理コア
WO2020160608A1 (en) Highly parallel convolutional neural network
JP3401823B2 (ja) 画像コーデック用プロセッサ
US5652625A (en) Multi-stage pipeline architecture for motion estimation block matching
JP2001147799A (ja) データ移動方法および条件付転送論理ならびにデータの配列換え方法およびデータのコピー方法
JP3676237B2 (ja) データ処理装置及び演算器
US5838392A (en) Adaptive block-matching motion estimator with a compression array for use in a video coding system
JPH06149861A (ja) Dct及び逆dct演算装置並びにその演算方法
US5793658A (en) Method and apparatus for viedo compression and decompression using high speed discrete cosine transform
CN115713104A (zh) 用于神经网络的数据处理电路、神经网络电路和处理器
Maruyama et al. VLSI architecture and implementation of a multifunction, forward/inverse discrete cosine transform processor
JPH0879761A (ja) 動き予測装置および動きベクトルを計算する装置
Demassieux et al. Orthogonal transforms
CN1422402A (zh) 在通用处理器中有效多输入累加的最优化乘法器结构
US6374280B1 (en) Computationally efficient inverse discrete cosine transform method and apparatus
JP3620887B2 (ja) データ処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040323

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040405

LAPS Cancellation because of no payment of annual fees