WO2001082227A1

WO2001082227A1 - Pixel calculating device

Info

Publication number: WO2001082227A1
Application number: PCT/IB2001/000665
Authority: WO
Inventors: Hiroyuki Oka; Hideshi Nishida; Kosuke Yoshioka; Tokuzo Kiyohara; Makoto Hirai; Kozo Kimura; Ryuji Matsuura; Hiroyuki Morishita; Toshiaki Tsuji
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2000-04-21
Filing date: 2001-04-23
Publication date: 2001-11-01
Also published as: CN1269076C; CN1383529A; US6809777B2; KR20020025899A; US20020106136A1; EP1278157A1; KR100794098B1

Description

明細書

画素演算装置

技術分野

本発明は、画像をリサイズするためのフィルタリング回路を含む画素演算装置に関する。背景技術

近年、デジタル映像機器の技術進歩が著しく、動画の圧縮処理ノ伸張処理、リサイズ等を扱ういわゆるメディァプロセッサが実用化されている。

画像のリサイズには、 F I R ( f i n i t e i m p u l s e r e s p o n s e )フィル夕がよく用いられる。

図 1 は、従来技術における F I Rフィルタ処理を行う回路例を示すブロック図である。同図はタップ数 7 、係数が対称な F I R フィルタである。

同図において、データ入力端子 1 0 0 1 より時系列的に入力されたデータは、遅延器 1 0 0 2 、 1 0 0 3 、 1 0 0 4、 1 0 0 5、 1 0 0 6 、 1 0 0 7 とこの順に順次転送される。フィルタ係数が対称である場合、つまりデータ入力端子の入力及び各遅延器の出力（タップと呼ばれる）に対応する係数が、中央のタップ（遅延機 1 0 0 4 の出力）に対して対称である場合、各夕ップのデータにフィルタ係数を乗算するのではなく、同じ係数のタップのデータ同士の加算を行ってから係数を乗算する。

例えば、データ入力部 1 0 0 1 の入力データと遅延器 1 0 0 7 の出力データは、加算器 1 0 0 8 で加算され、さらに乗算器 1 0 0 8 にて加算結果と係数 hO とが乗算される。遅延器 1 0 0 2 の出力と遅延器 1 0 0 6 の出力は、加算器 1 0 0 9 で加算され、さらに、乗算器 1 0 0 9 にて加算結果と係数 hi とが乗算される。

乗算器 1 0 1 1 〜乗算器 1 0 1 4 の各出力データは、加算器 1 0 1 5 により加算される。加算器 1 0 1 5 の出力データはフィルタ処理結果としてデータ出力端子 1 0 1 6 から時系列的に出力される。係数 h0〜 h3 は画像の縮小率に応じて定められる。例えば縮小率が 1 / 2 であれば、時系列の出力データを 1 Z 2 に間弓 I くことにより縮小画像が得られる。

また、フィルタ係数が対称に選ばれるのは、直線位相（位相特性が周波数に対して直線になること）が得られることにより画像の視覚上好ましいからである。

しかしながら、上記従来の方法では、画像データに対してフィルタリング処理を行う場合、回路の構成上、画像を構成する画素データを端から順に入力していくので、 1 クロックで入力できる画素データは 1 つであるため、処理速度を高めるには動作周波数を高める必要がある。高い動作周波数での動作は、コスト及び消費電力大きくなるという問題がある。

また、従来の方法ではタップ数毎に回路が異なるため自由度がなく、タップ数毎別に回路を設けると莫大なコストがかかつてしまう。

さらに、

本発明の第 1 の目的は、タップ数を可変にすることができ、周波数を上げずに処理を高速化するフィルタリング処理を行う画素演算装置を提供することにある。

本発明の第 2 の目的は、さらにフィルタリング処理だけでなく M C (動き補償）処理にも利用可能で、回路規模の小型化を図った画素演算装置を提供することにある。

第 3 の目的は、さらにフィルタリング処理だけでなく M E (動き予測）処理にも利用可能であり、回路規模の小型化を図った画素演算装置を提供することにある。

第 4 の目的は、さらにフィルタリング処理だけでなく、デジタル映像機器における O S D ( O n S c r ee n D i s p l ay) 処理にも利用であり、回路規模の小型化を図った画素演算装置を提供することにある。発明の開示

上記第 1 の目的を達成する画素演算装置は、フィルタ処理を行う画素演算装置であって、 N個の画素処理手段と、 N個の画素データ及びフィルタ係数を供給する供給手段と、 N個の画素処理手段を並列に動作させる制御手段とを備える。

各画素処理手段は、供給手段に供給された画素データとフィルタ係数とを用いて演算した後、各画素処理手段に対して隣接する画素処理手段から画素データを取得し、取得した画素データを用いて演算して演算結果を累積する。前記制御手段は、隣接する画素処理手段からの画素データの取得と、取得した画素データを用いた演算及び累積とをタップ数に応じた回数繰り返すよう N個の画素処理手段を制御する。

ここで、前記 N個の画素処理手段は、 N個の画素データを右シフトする第 1 シフタと、 N個の画素データを左シフトする第 2 シフタを形成する。各画素処理手段は、隣接する 2 つの画素処理手段からシフトァゥトされる 2 つの画素データを用いて演算する。

この構成によれば、タップ数を可変にすることができ、周波数をあげずに処理を高速化するフィルタリング処理を行うことができるという効果がある。

上記第 2 の目的を達成する画素演算装置は、画素データとして差分画像の画素データと参照フレームの画素データとを供給手段から供給する。

この構成によれば、フィルタリング処理だけでなく M C (動き補償）処理にも利用可能で、フィルタ装置と M C 回路とを独立に設ける必要がないので、回路規模の小型化を図ることができるという効果がある。図面の簡単な説明

図 1 は、従来技術における F I R フィルタ処理を行う回路例を示すブロック図である。

図 2 は、画素演算ユニットを備えるメディアプロセッサの構成を示すプロック図である。

図 3 は、画素演算ユニット（ P O U A、 P O U B ) の構成を示すブロック図である。

図 4 は、画素並列処理部の左半分の構成を示すブロック図である。

図 5 は、画素並列処理部の右半分の構成を示すプロック図である。

図 6 ( a ) は、入力バッファ群 2 2 の詳細な構成を示すプロック図である。

図 6 ( b ) は、入力バッファ群 2 2 内の選択部の詳細な構成を示すブロック図である。

図 7 は、出力バッファ群 2 3 の構成を示すブロック図である。図 8 は、画素演算ユニットにてフィルタ処理を行う場合の画素データの初期入力値を示す図である。

図 9 は、画素処理部 1 に対する画素データの初期入力値を示す説明図である。図 1 0 は、画素処理部 1 でのフィルタ処理における演算過程を示す図である。図 1 1 は、画素処理部 1 でのフィルタ処理の演算内容を示す説明図である。図 1 2 は、画素演算ュニットにて M C (動き補償）処理（ P ピクチャ）を行う場合の入出力画素データを示す図である。

図 1 3 は、 M C処理における復号対象フレームと参照フレームとを示す説明図である。

図 1 4 は、画素演算ュニットにて M C処理（ B ピクチャ）を行う場合の入出力画素データを示す図である。

図 1 5 は、画素演算ュニットにて O S D (オンスクリーンデイスプレイ ) 処理を行う場合の入出力画素データを示す図である。

図 1 6 は、画素演算ュニットにおける O S D (オンスクリーンディスプレイ）処理の説明図である。

図 1 7 は、画素演算ュニットにて M E (動き予測）処理を行う場合の入出力画素データを示す図である。

図 1 8 は、画素演算ュニットにて M E (動き予測）の説明図である。

図 1 9 は、メディアプロセッザにおいて垂直フィルタ処理を行う場合のデータの流れを示した模式的なプロック図である。

図 2 0 は、垂直 1 2縮小を行う場合の説明図である。

図 2 1 は、従来技術において垂直 1 / 2 縮小を行う場合の説明図である

図 2 2 は、垂直 1 ノ 4 縮小を行う場合の説明図である。

図 2 3 は、従来技術において垂直 1 / 4 縮小を行う場合の説明図である

図 2 4 は、メディアプロセッザにおいて垂直フィルタ処理を行う場合のデータの流れを示した模式的な別のプロック図である。

図 2 5 は、デコード処理と垂直フィルタ処理とのタイミングを示す説明図である。図 2 6 は、垂直 1 ノ 2縮小を行う場合の説明図である。

図 2 7 は、垂直 1 / 4縮小を行う場合の説明図である。

図 2 8 は、画素並列処理部の左半分の第 1 の変形例を示す図である。

図 2 9 は、画素並列処理部の右半分の第 1 の変形例を示す図である。

図 3 0 は、画素並列処理部の左半分の第 2 の変形例を示す図である。

図 3 1 は、画素並列処理部の右半分の第 2 の変形例を示す図である。

図 3 2 は、画素並列処理部の左半分の第 3 の変形例を示す図である。

図 3 3 は、画素並列処理部の右半分の第 3 の変形例を示す図である。

図 3 4 は、画素処理ュニットの変形例を示す図である。発明を実施するための最良の形態

本発明の画素演算ユニットは、主に（ a ) 画像の拡大ノ縮小に用いられるフィルタ処理、（ b ) 動き補償（ Moving Compensation,以下 M E )処理、 ( c ) 0 S D ( On Screen Display) 処理、（ d ) 動き予測（Moving Estimation, 以下 M E ) 処理などを選択的に実行するように構成される。（ a )フィルタ処理については、画素演算ユニットは、でタップ数を固定することなく可変とし、水平方向又は垂直方向に連続する複数の画素（例えば 1 6画素）を並列に処理する。さらに、垂直方向のフィルタ処理は、圧縮動画データの伸長処理と同期して行う。

以下、本発明の実施の形態における画素演算ユニットについて次の順に説明する。 1 メディアプロセッサの構成

1 1 画素演算ュニットの構成

1 2 画素並列処理部の構成

2 1 フィルタ処理

2 2 M C (動き補償）処理

2 3 O S D (オンスクリーンディスプレイ）処理

2 4 M E (動き予測）処理

3 1 垂直フィルタ処理（その 1 )

3 1 . 1 1 Z 2縮小

3 1 . 2 1 4縮小

3 2 垂直フィルタ処理（その 2 )

3 2 . 1 1 / 2縮小

3 2 . 2 1 / 4縮小

4 変形例

< 1 メディァプロセッサの構成 >

本実施形態における画素演算ュニットがメディア処理（圧縮音声動画データの伸長処理、音声動画データの圧縮処理など）を行うメディァプロセッサに内臓されている場合について以下説明する。メディアプロセッサは、例え'ばデジタル T V放送を受信するセットトップボックス、テレビ受像機、 D V D録画再生装置などに実装される。

図 2は、画素演算ュニットを備えるメディァプロセッサの構成を示すブロック図である。同図においてメディァプロセッサ 2 0 0は、デュアルポートメモリ 1 0 0、ストリームユニット 2 0 1 、入出力バッファ（以下 I , z〇ノッファと略す） 2 0 2、セットアッププロセッサ 2 0 3、ビットストリーム F I F 0 2 0 4、可変長符号復号部（ V L D ) 2 0 5、可変長符号復号部 2 0 5、変換エンジン（ Transfer Engine, 以下 T E ) 2 0 6、画素演算ユニット A (以下 P 〇 U A) 2 0 7、画素演算ュニット B (以下 P〇 U B ) 2 0 8、 P O U C 2 0 9、オーディオュニット 2 1 0、 I 〇 P 2 1 1 、入出力プロセッサ (以下 I O P ) 2 1 1 、ビデオノッファメモリ 2 1 2、ビデオュニ：ッ卜 2 1 3、ホストユニット 2 1 4、 R E 2 1 5、フィルタ部 2 1 6 を備える。

デュアルポートメモリ 1 0 0は、外部メモリ 2 2 0 に対する入出力ポート（以下外部ポート）と、メディアプ πセッサ 2 0 0 内部に対する入出力（以下内部ポートと呼ぶ）と、キャッシュメモリとを備え、メディアプロセッサ 2 0 0 内の各構成要素のうち外部メモリ 2 2 0 にデータを読み書きする構成要素（以下マスターデバイス）からのアクセス要求を内部ポ一トから受け付け、受け付けたアクセス要求に従って外部メモリ 2 2 0 をアクセスする。その際、デュアルポートメモリ 1 0 0は、内部のキャッシュメモリに外部メモリ 2 2 0のデータの一部をキヤッシングする。また、外部メモリ 2 2 0 は S D R A Mや R D R AMなどのメモリであり、圧縮動画データ、圧縮音声デ ^ ~ ね復号後の音声データ、復号後の動画データなどを一時的に記憶する。

ストリームュニット 2 0 1 は、外部からストリ - -ムデータ（いわゆる M P E Gストリーム）を入力し、入力されたストリームデータをビデオエレメンタリーストリーム、ォーディォエレメンタリーストリームに分離し、それぞれを I Oバッファ 2 0 2 に書き込む。

I / 0ノッファ 2 0 2 は、ビデオエレメンタリー - ストリーム、オーディオエレメンタリーストリーム、オーディォデータ（伸長されたオーディオデータ）を一時的に保持するバッファメモリである。ビデオエレメンタリーストリーム、ォ一ディォエレメン夕リーストリームはそれぞれストリームュニット 2 0 1 から I . Z 0ノッファ 2 0 2 に格納され、さらに I 0 P 2 1 1 の制御によってデュアルポートメモリ 1 0 0 を介して外部メモリ 2 2 0 に格納される。オーディオデータは、 I O P 2 1 1 の制御によって外部メモリ 2 2 0からデュアルポートメモリ 1 0 0 を介して I /Oノッファ 2 0 2 に格納される。

セットアッププロセッサ 2 0 3 は、オーディオエレメンタリ一ストリームのデコード（伸長）と、ビデオエレメンタリーストリームのマクロプロックのヘッダ解析とを行う。オーディオエレメンタリーストリ一ム及ぴビデオエレメンタリーストリームは、 I O P 2 1 1 の制御によって、外部メモリ 2 2 0 からデユアルポ一トメモリ 1 0 0 を介してビットストリーム F I F 0 2 0 4 に転送される。セットアッププロセッサ 2 0 3 はビットストリーム F I F O 2 0 4からオーディオエレメンダリ一ストリームを読み出してデコードし、デコ一ド後のオーディォデータをセットアップメモリ 2 1 7 に格納する。セットアップメモリ 2 1 7 内のオーディオデータは、 I O P 2 1 1 によってデュアルポートメモリ 1 0 0 を介して外部メモリ 2 2 0 に転送される。また、セットアッププロセッサ 2 0 3 は、ビットストリーム F I F O 2 0 4からビデオエレメンタリーストリームを読み出してマクロブロックヘッダを解析し、解析結果を V L D 2 0 5 に通知する。

ビットストリ一ム F I F O 2 0 4は、ビデオエレメンタリーストリームを可変長符号復号部 2 0 5 に、オーディォエレメン夕リーストリームをセットアッププロセッサ 2 0 3 に供給するための F I F Oメモリである。ビデオエレメンタリーストリ一ム及びオーディオエレメンタリーストリームは、 I O P 2 1 1 の制御によって外部メモリ 2 2 0 からデュアルポ一トメモリ 1 0 0 を介してビットストリーム F I F O 2 0 4に転送される。

V L D 2 0 5 は、ビットストリーム F I F O 2 0 4から供給されるビデオエレメンタリーストリームに含まれる可変長符号を復号する。この復号結果はマクロブロック単位の D C T係数群である。

T E 2 0 6は、 V L D 2 0 5の復号結果に対してマクロプロック単位に I Q (逆量子化）処理及び I D C T (逆 D C T) 処理を行う。これらの処理結果はマクロブロックである。 1 マクロブロックは、 4つの輝度ブロック（Y 1 ~ Y 4 ) と 2つの色差ブロック（ C b、 C r ) からなる。 1 ブロックは 8 X 8画素である。但し、 P ピクチャ、 Bピクチャについては 1 ブロックは 8 x 8個の差分値として T E 2 0 6から出力され。 T E 2 0 6は復号結果をデュアルポートメモリ 1 0 0を介して外部メモリ 2 2 0 に格納する。

P O U A 2 0 7は、主に（ a ) フィルタ処理、（ b ) M C処理 ( c ) O S D処理、（ d ) 動き予測（Moving Estimation) 処理などを選択的に実行する。

( a ) のフィルタ処理では、 P O U A 2 0 7 は外部メモリ 2 2 0 に格納されたビデオデータ（フレームデータ）に含まれる 1 6個の画素データを並列にフィルタリングし、フィルタリング後の 1 6個の画素を間引く又は補間することにより縮小、拡大する。縮小語の後のデータは P O U C 2 0 9の制御によってデュアルポートメモリ 1 0 0 を介して外部メモリ 2 2 0 に格納される。 '

( b ) の M C処理では、 P O U A 2 0 7は、 T E 2 0 6 によつて外部メモリ 2 2 0 に格納された P ピクチャ及び Bピクチャについての I Q及び I D C T処理結果（つまり画素データの差分値）と、参照フレーム中の画素データとを 1 6並列に加算する。 1 6組の差分値と画素データは、セットアッププロセッサ 2 0 3 におけるマクロブロックヘッダ解析によって検出された動きベクトルに従って、 P O U C 2 0 9 によって P O U A 2 0 7 に入力される。

( c ) O S D処理では、 P O U A 2 0 7 は、外部メモリ 2 2 0等に格納された O S D画像（静止画）をデュアルポートメモリ 1 0 0 を介して入力し、外部メモリ 2 2 0 内の表示用フレームデータに上書きする。ここで O S D画像とは、ユーザのリモコン操作などに応じて表示されるメニュー画像や、時刻表示、チャネル番号表示などをいう。

( d ) の M E処理とは、未圧縮のフレームデータ内の符号化対象のマクロブロックに対して、参照フレーム中の相関性の高い矩形領域を探索し、符号化対象のマクロプロックから相関性の最も高い矩形領域を指す動きべクトルを求める処理である。 P O U A 2 0 7 は、符号化対象のマクロブロックの画素と、探索領域内の矩形領域の画素との差分を 1 6個並列で算出する。

P O U B 2 0 8 は、 P O U A 2 0 7 と同一構成であり、上記 ( a ) 〜（ d ) の処理を動的に分担する。

P O U C 2 0 9 は、 P O U A 2 0 7 及ぴ P O U B 2 0 8 に対する画素データ群の供給と、処理結果の外部メモリ 2 2 0 への転送とを制御する。

オーディオュニット 2 1 0 は、 I / 0ノッファ 2 0 2 に格納されたオーディォデータを出力する。

I O P 2 1 1 は、メディアプロセッサ 2 0 0 内のデータ入出力（データ転送）を制御する。データ転送には次の種類がある。第 1 は、 I ノ 0ノッファ 2 0 2 に格納されたストリームデータをデュアルポートメモリ 1 0 0 を介して外部メモリ 2 2 0 内のストリームノッファ領域に転送することである。第 2 は、外部メモリ 2 2 0 に格納されたビデオエレメンタリーストリーム及びオーディオエレメンタリーストリームをデュアルポ一トメモリ 1 0 0 を介してビットストリーム F I F O 2 0 4 に転送することである。第 3 は、外部メモリデバイス 2 に格納されたォーディォデータをデュアルポ一トメモリ 1 0 0 を介して I / 0パッファ 2 0 2 に転送することである。

ビデオュニット 2 1 3 は、外部メモリ 2 2 0のビデオデータ (画像フレーム）から 2， 3ライン分の画素データを読み出して、ビデオノッファメモリ 2 1 2 に格納し、その 2 , 3ライン分の画素データを映像信号に変換して外部に接続されたテレビ受像器等のディスプレイ装置に出力する。 ·

ホストユニット（HOST) 2 1 4は、外部のホストマイコンからの指示を受け取り、指示に応じて M P E Gデコ一ド、 M P E G エンコード、 O S D処理、縮小 ' 拡大処理など開始 ' 終了を制御する。

レンダリングエンジン（RE) 2 1 5 は、マスタ一デバイスであり、コンピュータ · グラフィックスにおけるレンダリング処理を行う。外部に専用 L S I 2 1 8 とが接続されている場合に間でデータ入出力を行う。

フィルタ 2 1 6 は、静止画データの拡大縮小処理を行う。外部に専用 L S I 2 1 8 とが接続されている場合に間でデータ入出力を行う。

上記ではメディアプロセッサが、ストリームユニット 2 0 1 からストリームデータを入力してデコード（伸長）する場合を中心に説明したが、圧縮されていないビデオデータ及びオーディォデータをエンコード（圧縮）する場合は、逆の流れとなる。その際、 P O U A 2 0 7 (又は P O U B 2 0 8 ) は M E処理を、

T E 2 0 6は D C T処理及び Q (量子化）処理を、 V L D 2 0 5 は可変長符号化を、行う。

< 1 . 1 画素演算ユニットの構成 >

図 3 は、画素演算ュニットの構成を示すブロック図である。 P O U A 2 0 7 と P O U B 2 0 8 は同じ構成であるため、ここでは P O U A 2 0 7 を説明する。

同図のように P O U A 2 0 7 は、画素並列処理部 2 1 、入力バッファ群 2 2

出カノッファ群 2 3 、命令メモリ 2 4、命令デコーダ 2 5 、指示回路 2 6、 D D A回路 2 7 を備える。

画素並列処理部 2 1 は、画素転送部 1 7 、 1 6個の画素処理部 1 〜画素処理部 1 6 、画素転送部 1 8 を備え、入力バッファ群 2 2 から入力される複数の画素を対象に上記（ a ) フィルタ処理、（ b ) M C処理、（ c ) O S D処理、（ d ) M E ) 処理を行い、出力バッファ群 2 3 に出力する。（ a ) 〜（ d ) の各処理はマクロブロック単位すなわち 1 6 画素を 1 6 回（ 1 6 ライン分）繰り返すことにより終了する。各処理の起動は、 P O U C 2 0 9 により制御される。また、画素転送部 1 7 は、フィルタ処理において 1 6個の画素のさらに左側（又は上側）の複数画素（ここでは 8画素）を保持し、クロック毎に右シフトする。画素転送部 1 8 は、フィルタ処理において 1 6個の画素のさらに右側 (又は下側）の複数画素（ここでは 8画素）を保持し、クロック毎に左シフトアウトする。

入カノッファ群 2 2 は、 P O U C 2 0 9 の制御により、デュァルポ一トメモリ 1 0 0 から転送される処理対象となる複数の画素を保持し、さらにフィルタ処理ではフィルタ係数も保持する。

出力バッファ群 2 3 は、画素並列処理部 2 1 による処理結果 ( 1 6 画素に対応する 1 6 の処理結果）の並びを任意に変更して一時的に保持する。フィルタ処理では画素の並びを変更して保持することにより画素の間引き（縮小時）又は補間（拡大時）とを行う。

命令メモリ 2 4 は、フィルタ処理用のマイクロプログラム（フィルタ P )、 M C処理用のマイクロプログラム（M C P；)、〇 S D処理用のマイクロプログラム（ O S D 〃 P：)、 M E処理用のマイクロプログラム（M E P ) を記憶している。これ以外にも命令メモリ 2 4 は、マクロプロックのフォーマツト変換用のマイクロプログラム、画素の数値表現を変換するためのマイクロプログラムなどを記憶している。ここで、マクロブロックのフォーマツトとは、 M P E G規格に定められている「 4 : 2 ： 0」、「 4 ： 2 ： 2」、「 4 ： 4 ： 4」などの Y、 C b、 C r プロックの画素のサンプリングレートの比率をいう。画素の数値表現には画素のとりうる値として 0 ~ 2 5 5 で表現される場合 (一般的な M P E Gデータ等）と一 1 2 8〜 1 2 7 で表現される場合（ D Vカメラ等）がある。

命令デコーダ 2 5 は、命令メモリ 2 4 からマイクロプログラム中のマイクロコードを逐次読み出して解読し、解読結果に従つて P O U A 2 0 7 内の各部を制御する。

指示回路 2 6 は、 P O U C 2 0 9 から命令メモリ 2 4 のどのマイク π プログラムを起動すべきかの指示（開始ァドレス等）を受付けて、指示されたマイクロプログラムを起動する。

D D A回路 2 7 は、フィルタ ^理において、入力バッファ群

2 2 に保持されたフィル夕係数群の選択制御を行う。

< 1 . 2 画素並列処理部の構成 >

図 4、図 5 は、画素並列処理部の左半分、右半分の詳細な構成を示すプロック図である。

図 4 において画素転送部 1 7 は、 8個の入力ポ一ト A 1 7 0 1 〜 H 1 7 0 8、画素データ保持し 1 クロック時間遅延する 8 個の遅延器 A 1 7 0 1 〜遅延器 H I 7 0 9、入力ポートの画素データと左の遅延器出力の内一方を選択する 7個の選択部 A 1 7 1 7 ~ G 1 7 2 3 から構成され、入力バッファ群 2 2 から並列入力される 8画素を 8つの遅延器に保持し、 8つの遅延器に保持した画素をクロック同期して右シフトする右シフタとして機能する。

図 5 において画素転送部 1 8は画素転送部 1 7 と比べシフトする方向が左である点で異なり、これ以外は同様の構成なので説明を省略する。

図 4、図 5 における 1 6個の画素処理部 1 〜画素処理部 1 6 は、いずれも同一構成であるので、画素処理部 2 を代表として説明する。

画素処理部 2 は、入力ポート A 2 0 1 〜入力ポート C 2 0 3 と、選択部 A 2 0 4、 B 2 0 5、遅延器 A 2 0 6〜 D 2 0 9、加算器 A 1 2 0、乗算器 A 2 1 1 、加算器 B 2 1 2、出力ポート D 2 1 3 とから構成される。

選択部 A 2 0 4は、入力ポート A 2 0 1 から入力される画素データと左隣の画素転送部 1 7から出力される画素データとのうち一方を選択する。

選択部 A 2 0 4 と遅延器 A 2 0 6は、右隣の画素処理部 3から入力される画素データを左隣の画素処理部 1 にシフト出力する機能も果たす。

選択部 B 2 0 5は、入力ポート B 2 0 2から入力される画素データと右隣外部メモリ 2 2 0からシフト出力される画素デ一夕とのうち一方を選択する。 .

選択部 B 2 0 5 と遅延器 B 2 0 7は、左隣の画素処理部 1 から入力される画素データを右隣の画素処理部 3 にシフト出力する機能も果たす。

遅延器 A 2 0 6、遅延器 B 2 0 7 はそれぞれ選択部 A 2 0 4、選択部 B 2 0 5 に選択された画素データを保持する。

遅延器 B 2 0 7 は、入力ポート C 2 0 3からの画素データを保持する

加算器 A 1 2 0 は遅延器 A 2 0 6 と遅延器 B 2 0 7から出力される画素データを加算する。

乗算器 A 2 1 1 は、加算器 A 1 2 0の加算結果と遅延器 C 2 0 8からの画素データとを乗算する。この乗算器 A 2 1 1 はフィルタ処理では画素データとフィルタ係数との乗算に利用される。

加算器 B 2 1 2は、乗算器 A 2 1 1 の乗算結果を遅延器 D 2 0 9 のデータとを加算する。

遅延器 D 1 0 9は、加算器 B 2 1 2の加算結果を累積する。画素処理部 2 は、これらの構成要素を選択的に組み合わせて動作させることにより上記（ a ) フィルタ処理、（ b ) M C処理 ( c ) O S D処理、（ d ) M E処理を実行する。これらの構成要素を選択的に組み合わせる動作は、命令メモリ 2 4及び命令デコーダ 2 5 によるマイクロプログラム制御によってなされる。

図 6 ( a ) は、入力バッファ群 2 2の詳細な構成を示すプロック図である。

同図のように入力バッファ群 2 2は、画素転送部 1 7 に画素データを供給する 8個のラッチ 2 2 1 と、画素処理部 1 〜 1 6 に画素データを供給する 1 6個のラッチ部 2 2 2 と、画素転送部 1 8 に画素データを供給する 8個のラッチ 2 2 3 とから構成される。これらは、 P O U C 2 0 9の制御により外部メモリ 2 2 0からデュアルポートメモリ 1 0 0 を介して画素データ群が転送される。各ラッチ部 2 2 2 は、画素処理部の入力ポート A、 B に画素データを供給する 2個のラッチと、画素処理部の入力ポート C に画素データ又はフィル夕係数を供給する選択部 2 2 4 からなる。

図 6 ( b ) は、選択部 2 2 4 の詳細な構成を示すブロック図である。

同図のように選択部 2 2 4 は、 8 つのラッチ 2 2 4 a〜 2 2 4 h と、 8 つのラッチからデータの何れか 1 つを選択するセレクタ 2 2 4 i とからなる。

ラッチ 2 2 4 a〜 2 2 4 h は、フィルタ処理においてフィルタ係数 a0〜a7 (又は a0/2、 al~ a7) を保持する。これらフィルタ係数は、 P O U C 2 0 9 により外部メモリ 2 2 0 からデュアルポートメモリ 1 0 0 を介してラッチ 2 2 4 a〜 2 2 4 h に転送される。

セレクタ 2 2 4 i は、 D D A回路 2 7 の制御によってクロックに同期してラッチ 2 2 4 a から 2 2 4 h に順次選択される。このようにフィルタ係数の画素処理部への供給は、マイクロコ一ドにより直接制御されるのではなく、 D D A回路 2 7 によりハードウヱァにより制御されるので高速化される。

図 7 は、出カノッファ群 2 3 の構成を示すプロック図である。同図のように出力バッファ群 2 3 は、 1 6個のセレクタ 2 4 a〜 2 4 p と、 1 6 個のラッチ 2 3 a〜 2 3 p とからなる。セレクタ 2 4 a ~ 2 4 p は、いずれも画素処理部 1 〜 1 6 の 1 6個の処理結果が入力され、そのうち 1 つを選択する。この選択制御は命令デコーダ 2 5 によってなされる。

ラッチ 2 3 a〜 2 3 p はそれぞれセレクタ 2 4 a〜 2 4 p の選択結果を保持する。

例えば、フィルタ処理の結果を 1 ノ 2 に縮小する場合には、 1 6個の画素に対する画素処理部 1 〜 1 6 の 1 6個の処理結果のうち、画素処理部 1、 3、 5、 · · · 1 5 の処理結果を 8個のセレクタ 2 4 a ~ 2 4 hが選択してラッチ 2 3 a〜 2 3 h に格納され、さらに、次の 1 6個の画素に対する画素処理部 1 ~ 1 6 の 1 6個の処理結果のうち、画素処理部 2、 4、 6、 · · · 1 6 の処理結果を 8個のセレクタ 2 4 i ~ 2 4 p が選択してラッチ 2 3 i ~ 2 3 p に格納される。このようにして画素が間引かれ、 1 ノ 2縮小された 1 6個の画素データが出力バッファ群 2 3 に保持され、さらに P O U C 2 0 9 の制御によりデュアルポ一トメモリ 1 0 0 を介して外部メモリ 2 2 0 に転送される。 < 2. 1 フィルタ処理 >

画素演算ュニットにおけるフィルタ処理の詳細について説明する。

P O U C 2 0 9 はフィルタ処理の対象となるマクロブロックを特定し、 P O U A 2 0 7 又は P O U B 2 0 8 に対して 3 2個の画素データ及びフィルタ係数 a0/2， al〜a7 を初期値として入力バッファ群 2 2 に転送し、さらに指示回路 2 6 にタップ数の通知とともにフィルタ処理の開始を指示する。

図 8 は、画素演算ユニット（ P O U A 2 0 7 ) にてフィル夕処理を行う場合の画素データの初期入力値を示す図である。同図において入力ポート欄は図 4、図 5 に示した各入力ポートを意味する。入力画素欄は、入力バッファ群 2 2 から各入力ポートに供給される画素データを意味する。出力ポート欄は図 4、図 5 に示した出力ポート D (加算器 B 出力）を、出力画素欄はその出力値を意味する。

入力ポートに画素データを供給する入力バッファ群 2 2 には図 9 に示すように水平方向に連続する 3 2 個の画素データ XI 〜X32 が、 P O U C 2 0 9 によって転送されて保持されている。ここでのフィルタ処理の対象は X9〜 X24の 16個の画素データである。図 8 のように画素処理部 1 〜 1 6 の入力ポート A及ぴ B には画素データ X9〜 X24が、入力ポート C には入力バッファ群 2 2 にて選択されたフィルタ係数 aO/2 が初期値として供給される。

さらに、入力バッファ群 2 2 から初期入力値が画素並列処理部 2 1 に供給された後、フィルタ処理として所望するタップ数に応じた数のク口ック入力によりフィルタ処理がなされる。

図 1 0 は、 16個の画素処理部のうち画素処理部 1 を代表として、その演算過程を示す説明図である。同図では、入力クロック数毎に、画素処理部 1 内の遅延器 A ~ Dの保持内容と、加算器 Bの出力値とを記している。また、図 1 1 は、画素処理部 1 のクロック入力毎の出力ポート D (加算器 B 出力）の出力値を示す図である

画素処理部 1 は最初のクロック入力（CLK1) によって初期入力値として遅延器 A及び Bは画素データ X9 を、遅延器 Dはフィルタ係数 aO/2 を保持し、遅延器 ]) は 0 クリアされる。このとき選択部 A及び B は何れも入力ポートを選択している。その結果加算器 Aは（X9 + X9)を、乗算器 Aは（X9 + X9)*a0/2 を、加算器 B は（X9*a0/2 + 0 (つまり aO*X9) を出力する（図 1 1 参照）。

2 回目のクロック入力（CLK2) 以降では、選択部 A及び Bは入力ポート A、 Bではなく隣接する画素処理部又は画素転送部からのシフト出力を選択する。

2 回目のクロック入力（ CLK2) によって、遅延器 A〜 D には、画素データ X10、 X8、フィルタ係数 al、 aO*X9 を保持する。その結果、加算器 Bは aO*X9 + al (X10 + X8)を出力する（図 1 1 参照）このように 2 回目は、フィルタ係数 al (遅延器 C ) と、両隣からシフト出力される画素データの和（加算器 A ) とを乗算器 A にて乗算している。加算器 Bは、この乗算結果と遅延器 Dの累積値とを加算している。

3 回目のクロック入力（CLK3) では、画素処理部 1 は 2 回目のクロック入力と同様に動作をすることにより、加算器 Bから aO*X9 + al (X 10 + x8) +a2 (X 11 +X7)を出力する。

4 回目〜 9 回目のクロック入力（ CLK4〜 CLK 9 ) でも同様に動作をすることにより、加算器 B は図 1 1 に示す出力値をそれぞれ出力することになる。

このようにして、画素処理部 1 のファイルタ処理結果（出力データ）は 9 クロックの場合、，

aO-X9 + al (XI 0 + X8) +a2 (XI 1 +X7) +a3 (XI 2 + X6)

+a4(X13+X5) +a5(X14+X4) +a6(X15+X3) +a7(X16+X2) +a8(X17+Xl) となる。

図 1 0 、図 1 1 では CLK 9 までの処理過程を示しているが、入力クロック数は P O U C 2 0 9 から通知されたタップ数に応じて命令デコーダ 2 5 の制御によって打ち切られる。すなわち、各画素処理部は、タップ数 3 の場合は CLK2 でフィルタ処理を終了し、タップ数 5 の場合は CLK3 で終了し、タップ数 7 の場合は CLK4でフィルタ処理を終了する。別言すると、タップ数（ 2 n — 1 ) のフィルタ処理では n回のクロック入力で終了する。命令デコーダ 2 5 は 1 6 画素の並列処理を 1 6 ライン分繰り返し、これにより 4 ブロックのフィル夕処理を終える。その際、 1 6個のフィルタ処理結果は、出カノッファ群 2 3 において間引き処理または補間処理されることによって縮小又は拡大される。出力バッファ群 2 3 の縮小又は拡大後の画素群は 1 6個保持される毎に P O U C 2 0 9 の制御に.よってデュアルポートメモリ 1 0 0 を介して外部メモリ 2 2 0 に転送される。また、命令デコーダ 2 5 は、 16 ライン目終了時に P O U C 2 0 9 に終了した旨を通知する。 P 0 U C 2 0 9 は、次のマクロブロックについて上記と同様に P O U A 2 0 7 を初期入力値とフィルタ係数の供給及びフィルタ処理の開始を指示する。

なお、画素処理部 2 のファイルタ処理結果は 9 クロックの場合次式となる。

aO-X10 + al ( 11 +X9) +a2 (X 12 + X8) +a3 (X 13 + X7)

+ a4(X14 + X6) +a5 ( 15 + X5) +a6 (X 16 + X4) +a7 (X 17 + X3) +a8(X18 + X2) 画素処理部 3 のフアイルタ処理結果は 9 ク口ックの場合次式となる。

aO-Xl 1+al (X12 + X10) +a2 (X 13 + X9) +a3 (X 14 + X8)

+a4(X15+X7) +a5(X16+X6) +a6(X17+X5) +a7(X18+X4) +a8(X19+X3) . 画素処理部 4 ~ 1 6 のファィルタ処理結果も画素位置が異なるのみで同様なので省略する。

このように画素並列処理部 2 1 は、 16個の入力画素に対して並列にフィルタ処理を実行し、しかも入力クロック数の制御によってタップ数を任意にすることができる。

なお、図 8 では、画素処理部 1 の入力ポート A、 B、 C の入力画素が（X9、 X9、 aO/2) としているが、（X9、 0、 aO) 又は（ 0. X9、 aO) としてもよい。画素処理部 2 ~ 1 6 も対象画素が異なるだけで同様にしてもよい。

< 2 . 2 M C (動き補償）処理 >

復号対象フレームが P ピクチャである場合の M C処理の詳細について説明する。

P 0 U C 2 0 9 は指示回路 2 6 に M C処理の開始を指示するとともに、 M C処理の対象となる復号処理中のフレーム内のマクロブロック（差分値）と、参照フレームにおける動きべクトルが指す矩形領域を特定し、 P O U A 2 0 7 又は P O U B 2 0

8 に対して 1 6 個の差分値 D1〜D16 及び矩形領域内の 1 6 個の画素データ P1〜P16を入力パッファ群 2 2 に設定する。

• 図 1 2は、画素演算ユニットにて M C処理（ P ピクチャ）を行う場合の入出力画素データを示す図である。同図において入力ポート欄は、図 4及び図 5 に示した画素転送部 1 7、画素処理部 1 〜 1 6、画素転送部 1 8の入力ポートを意味する。入力画素欄は、入力ポートに入力される画素データを意味する。 M C処理では画素転送部 1 7及び 1 8は使用されないので、入力画素は何であってもよい（ don ' t care)。出力ポート欄は図 4、図 5 に示した出力ポート D (加算器 B出力）を、出力画素欄はその出力値を意味する。

図 1 3 は M C処理における画素処理部 1 〜 1 6への入力画素の説明図である。同図に示すように D1~D16は復号対象フレームのマクロブロック（M B ) 中の 1 6個の差分値である。 Pl~ P16 は参照フレームにおいて動きべクトルが指す矩形領域中の 1 6個の画素データである。

M C処理では、画素処理部 1 〜 1 6 内の選択部 A、 Bはそれぞれ常に入力ポート A、 Bを選択する。これにより、入力ポート Aからの画素データ、入力ポート Bからの差分値は、選択部 A、 Bを介して遅延器 A、 Bに入力され保持され、さらに加算器 Aにて加算される。この加算結果は乗算器にて 1 倍され、加算器 Bにて 0 を加えられて出力ポート Dから出力される。つまり入力ポート Aからの画素データと入力ポート Bからの差分値と単純に加算され出力ポート Dから出力される。

さらに 1 6個の加算結果は出力バッファ群 2 3 に格納され、 P O U C 2 0 9 によりデュアルポートメモリ 1 0 0 を介して外部メモリ 2 2 0内の復号対象フレームに書き戻される。

以上の処理を復号対象フレームの 1 6画素単位に繰り返すことにより M C処理がなされる。なお、各画素処理部では単純加算しているだけであり 1 クロック毎に 1 6 画素の加算結果を得ることができる。

次に復号対象フレームが B ピクチャの場合の M C処理を説明する。

図 1 4 は、画素演算ユニットにて M C処理（ B ピクチャ）を行う場合の入出力画素データを示す図である。同図において入力ポート欄、入力画素欄、出力ポート欄、出力画素欄は、図 1 2 と同様である。ただし、入力画素欄は第 1 クロック（CLK1) と第 2 クロック（ CLK2) と 2 回に分けて入力される点が図 1 2 と異なっている。

Pl~ P16 と、 B1〜B16 は異なる 2 つの参照フレームにおいてそれぞれ動きべクトルが指す矩形領域中の 1 6個の画素データである。

M C処理では、画素処理部 1 〜 1 6 内の選択部 A、 B はそれぞれ常に入力ポート A、 B を選択する。第 1 クロック（ CLK 1 ) において入力ポート A、 Bから選択部 A、 B を介して遅延器 A、 B に Pl、 B1 が保持され、同時に入力ポート C から定数 1/2遅延器 C に保持される。これにより乗算器 Aから（P1+B /2 が得られる。第 2 クロック（CLK2)において、乗算結果（Ρ1+ΒΠ/2 が遅延器 Dに保持され、同時に入力ポート八、 B、 C からの（1, 0, D1) が遅延器 A、 B、 C に保持されるので、乗算器 Aからの D1 と遅延器 D からの（P1+BD/2 とが加算器 B により加算される。その結果出力ポートから（P1+BD/2 + D1 が出力される。

さらに 1 6個の加算結果は出力バッファ群 2 3 に格納され、 P O U C 2 0 9 によりデュアルポートメモリ 1 0 0 を介して外部メモリ 2 2 0 内の復号対象フレームに書き戻される。

以上の処理を復号対象フレームの 1 6 画素単位に繰り返すことにより B ピクチャに対する M C処理がなされる。 < 2. 3 O S D (オンスクリーンディスプレイ）処理〉

P O U C 2 0 9 は指示回路 2 6 に O S D処理の開始を指示するとともに、外部メモリ 2 2 0 に保持された O S D画像から順次 1 6個の画素データ XI〜 XI 6を読み出して入力バッファ群 2 2 に設定する。

図 1 5は、画素演算ユニットにて O S D (オンスクリーンデイスプレイ）処理を行う場合の入出力画素データを示す図である。

同図において画素転送部 1 7、 1 8は使用されない。画素処理部 1 〜 1 6 の入力ポート Aには入力バッファ群 2 2から画素データ X 1 ~ X 16が、入力ポート Bにはそれぞれ 0が、入力ポート C にはそれぞれ 1 が入力される。図 1 6 に O S D画像中の 1 6個の画素が順次入力バッファ群 2 2 に書き込まれる様子を示す。

画素処理部 1 〜 1 6 内の各選択部 A、 Bは、 O S D処理では入力ポートを常に選択する。例えば、画素処理部 1 では、入力ポート Aの画素データ XI、入力ポート Bの " 0 " は、それぞれ遅延器 A、 B に保持され、さらに加算器 Aにより加算される (X1+0= X1)。加算結果は乗算器 Aにて入力ポート Cから入力された " 1 " と乗算され加算器 Bにて " 0 " が加算される。その結果、入力ポート Aの画素データ XI はそのまま加算器 Bから出力されることになる。同様に画素処理部 2〜画素処理部 1 6からの入力ポート Aの画素データ X2〜X16がそのまま加算器 Bから出力される。

加算器 Bから出力された画素データ XI ~ XI 6は出力バッファ群 2 3 に格納され、さらに P O U C 2 0 9 によってデュアルポ一トメモリ 1 0 0 を介して外部メモリ 2 2 0 内の表示用フレームデータに上書きされる。上記処理を図 1 6 に示したように、 O S D画像全体に繰り返すことにより、外部メモリ 2 2 0 内の O S D画像を表示用フレームデータに上書きコピーすることになる。これは、 O S D処理のうち最も単純な処理であり、 P O U A 2 0 7 又は P O U B 2 0 8 は単に 0 S D画像を 1 6 画素単位に中継しているだけであ。

なお、 O S D処理の他の形態として、（ l ) O S D画像と表示用フレームデータとをプレンドしてもよい。ブレンド率が 0 . 5 の場合には、入力バッファ群 2 2 から画素処理部 1 〜画素処理部 1 6 の各入力ポート A に O S D画像の画素データ、各入力ポート B に表示用フレームデータの画素データを供給すればよい。

また、ブレンド率が α ( 1 - a ) の場合は、入カノッファ群 2 2 から第 1 ク口ックにおいて各画素処理部の入力ポート A、 B、 C に（ O S D画像の画素データ、 0 、を、第 2 クロックにおいて（ 0 、表示用フレームデータの画素データ、 1 — ）を供給すればよい。

また、 0 S D画像を縮小表示する場合には、入力バッファ群 2 2 から O S D画像に上記フィルタ処理を施し、出力バッファ群 2 3 から表示用フレームデータ内の縮小表示すべき位置に上書きコピーすればよい。

さらに、 O S D画像をフィルタ処理によって縮小した後上記ブレンドをするようにしてもよい。

< 2 . 4 M E (動き予測）処理 >

図 1 7 は、画素演算ュニットにて M E (動き予測）処理を行う場合の入出力画素データを示す図である。同図の入力画素欄において X1〜 X16 は符号化対象のフレーム中のマクロブ口ックの 16 画素.であり、 R1〜R16 は参照フレーム中の 1 6 x 1 6 画素の矩形領域中の 1 6画素である。図 1 8はこれらの画素の関係を示す説明図である。同図の参照フレーム中動きベクトル（M V) 探索範囲は、符号化対象のマクロブロックと同じ位置の周辺（例えば水平及び垂直方向に + 1 6 画素 1 6 画素）の動きべクトルを探索する対象となる範囲である。この MV探索範囲には、 1 6 画素 X I 6 画素の矩形領域が、画素単位の探索であれば 1 6 X I 6通りの位置に存在し、ハーフペル（ 1 / 2画素）単位の探索であれば 3 2 x 3 2通りの位置に存在する。図 1 3では M V探索範囲内の左上の矩形領域のみを図示している

M E処理は、 MV探索範囲内の個々の矩形領域と、符合化対象のマクロプロックとの間で、各画素同士の差分の総和を求め、さらに総和が最小の矩形領域（つまり相関性の最も高い矩形領域）と符号化対象マクロブ口ックとの相対的な位置の変位を動きベクトルと決定する。符号化対象ブロックは相関性の最も高い矩形領域と差分がとられる。

入カノッファ群 2 2 には、 P O U C 2 0 9の制御によって、符号化対象の画素データ X1〜X16 と、一の矩形領域の画素データ R1〜！ Π6 とが転送される。この矩形領域内の画素データ Rl~ R16 はクロック毎に矩形領域内の 1 ライン分が転送される。従つて一の矩形領域について 16ライン分の R1~R16が転送される図 1 7 によれば、図 4に示した例えば画素処理部 1 は、第 1 クロックで入力ポート Aの画素データ XI と、入力ポート Bの画素データ R 1 との減算及び絶対値化が加算器 Aにてなされ、乗算器 Aを素通りする（ 1 倍される）。加算器 Bは乗算器出力と遅延器 Dの保持データとの加算値が出力される。第 1 クロックでは加算器 Bは 1 ライン目の I XI- Rl I を出力することになる。

第 2 クロックでは、遅延器に 1 ライン目の I XI- R1 I が保持されるので、加算器 Bは、乗算器 Aからの 2 ライン目の I X卜 R1 I と遅延器 D に保持された 1 ライン目の I X卜 R1 I とを加算する。

第 3 クロックでは、遅延器に 1 及び 2 ライン目の I X1-R1 I が累積されるので、加算器 Bは、乗算器 Aからの 3 ライン目の I xi-Ri I と遅延器 ]) に保持された 1 ライン目の I XI -m I とを加算する。

同様の繰り返しにより第 1 6 クロックでは、加算器 Bは、 1 〜 1 6 ラインまでの I XI- R1 I の累積値（∑ I X1-R1 | )を出力する。

画素処理部 2 〜 1 6 についても各々累積値（∑ I Xl-Rl I ；)〜 (∑ I X16-R16 I )がを出力する。

これら 1 6個の累積値は第 1 7 クロックにおいて出力パッファ群 2 3 に保持され、 P O U C 2 0 9 によって取り出され、 1 6個の累積値の合計が算出された後外部メモリ 2 2 0 内のヮークエリァに保存される。

以上により一矩形領域と符号化対象マクロブ口ックとの画素データの差分の総和の計算が終了する。

この後さらに、 M V探索範囲内の他の矩形領域についても同様にして差分の総和が算出される。 M V探索範囲内の全て矩形領域（あるいは必要な矩形領域）について差分の総和が算出されると、そのうち最小の値をもつ矩形領域が最も相関性の高い矩形領域と判断され、動きベクトルが生成される。

なお、上記 M E処理では画素処理部からの 1 6個の累積値の合計を別途行っているが、 1 6個の累積値の合計を画素処理部 1 〜 1 6 において算出するようにしてもよい。この場合、一の矩形領域についての 1 6個の累積値は出力バッファ群 2 3 からそのまま外部メモリ 2 2 0 のワークエリアに保存しておき、このワークエリァにレ 6個以上の矩形領域について累積値群が保存されたときに、画素処理部 1 〜 1 6のそれぞれが 1 つの矩形領域を分担して 1 6個の累積値を順次累積することにより差分の総和を求めるようにすればよい。

また、上記 M E処理では画素単位で差分の算出を行っているが、ハーフペル単位で行うようにしてもよい。その場合、ハーフラインと実ラインのうち、実ラインに対しては上記のように 1 クロックで I XI- R1 I を算出し、ノヽーフラインに対しては、例えば 2 クロックのうち 1 クロックでノヽーフペルの画素値

( (R1+R1 ')/2) を算出し、次の 1 ク口ックで差分 I XI - (Rl+Rl *)/2 I を算出するようにしてもよい。あるいは、 5 クロックのうち 4 クロックでノヽーフペルの画素値

( (Rl+Rl '+R2 + R2')/4)を算出し、次の 1 クロックで差分を算出するようにしてもよい。

く 3. 1 垂直フィルタ処理（その 1 ) >

図 1 9 は、図 2 に示したメディアプロセッサにおいて垂直フィルタ処理する場合のデータの流れを示した、メディァプロセッサの模式的なプロック図である。

同図において、デコーダ部 3 0 1 は、図 2中のビデオエレメンタリーストリームをデコード（伸長する） V L D 2 0 5、 T E 2 0 6及ぴ P O U A 2 0 7 (M C処理）に相当し、ビデオェレメンタリーストリームをデコード（伸長）する。

フレームメモリ 3 0 2 は、外部メモリ 2 2 0 に相当し、デコード結果のビデオデータ（フレームデータ）を保持する

垂直フィルタ 3 0 3は、 P O U B 2 0 8 に相当し、垂直方向のフィルタ処理により垂直方向の縮小を行うする。

、ノッファメモリ 3 0 4は、外部メモリ 2 2 0 に相当し、縮小されたビデオデータ（表示用のフレームデータ）を保持する。画像出力部 3 0 5 は、ビデオノッファメモリ 2 1 2、ビデオュニット 2 1 3 に相当し、表示フレームデータを映像信号に変換して出力する。

なお、 P O U A 2 0 7 は M C処理を、 P O U B 2 0 8 は垂直フィルタ処理を分担する。また、水平フィルタ処理による水平方向の縮小は、フレームメモリ 3 0 2 のデコ一ドフレームデータに対して P O U A 2 0 7 、 P O U B 2 0 8 の一方が行うものとする。

< 3 . 1 . 1 1 / 2縮小〉

図 2 0 は、図 1 9 において 1 /2縮小処理を行う場合のフレームメモリ 3 0 2 、ノッファメモリ 3 0 4 のデータ供給状態の時間変化を示す図である。

図 2 0 において、グラフ 7 0 1 〜 7 0 3 の縦軸は、それぞれフィールドの垂直同期信号の周期 V を単位とする時間を示す。同図では 5 周期分を記してあり、グラフ 7 0〜 7 0 3 では時間軸が一致している。グラフ 7 0 1 の横軸は、フレームメモリ 3 0 2 データ量を示す。グラフ 7 7 0 2 の横軸は、ノッファメモリ 3 0 4 のデータ量を示す。グラフ 7 0 3 は画像出力部 3 0 5 において出力中のフレーム（フィールド）を示す。

グラフ 7 0 1 中の実線 7 0 4 はデコーダ部 3 0 1 からフレームメモリ 3 0 2 へのフレームデータの供給量を示している。破線 7 0 5 はフレームメモリ 3 0 2 から垂直フィルタ部 3 0 3 へのフレームデータの供給量を示している。

グラフ 7 0 2 中の破線 7 0 6 は垂直フィルタ部 3 0 3 からパッファメモリ 3 0 4への 1 st フィールド縮小画像の供給量を示している。一点鎖線 7 0 7 は垂直フィルタ部 3 0 3 からパッファメモリ 3 0 4 への 2 nd フィールド縮小画像の供給量を示している。

またグラフ 7 0 2 中の実線 7 0 8 はノッファメモリ 3 0 4 から画像出力部 3 0 5への 1 st フィールド縮小画像データの供給状態を示している。 1 ノ 2縮小の場合、縮小画像の表示位置はフレームの上半分の位置から下半分の位置までとりうるため同図の実線 7 0 9は表示位置に応じてタイミングが異なっている。同様に、実線 7 0 9 はバッファメモリ 3 0 4から画像出力部 3 0 5への 2 nd フィールド縮小画像データの供給状態を示している。

グラフ 7 0 1 で示すように、デコーダ部 3 0 1 からフレームメモリ 3 0 2への nフレームのフレームデータの供給は n- 1 フレームの 2 nd フィールドのフレームメモリ 3 0 2 から垂直フィルタ部 3 0 3への供給開始直後に開始し、フレームメモリ 3 0 2から垂直フィルタ部 3 0 3への n フレームのフレームデー夕の供給は nフレームの 1 stフィールドのフレームメモリ 3 0 2から垂直フィルタ部 3 0 3への供給完了直前までに終了するように制御を行う。

グラフ 7 0 2で示すように、垂直フィルタ部 3 0 3からノッファメモリ 3 0 4への nフレームの 1 stフィールドのフレームデータの供給は n- 1 フレームの 2 ndフィールド表示中に、 n フレームの 2 ndフィールドのフレームデータの供給は nフレームの 1 s t フィールド表示中にそれぞれ完了するように制御を行う。

このように装置を制御する事により、デコーダ部 3 0 1 からフレームメモリ 3 0 2間は、 2 V の期間に 1 フレームのフレームデータを転送する能力があれば十分である。フレームメモリ 3 0 2から垂直フィルタ部 3 0 3間は、 1 Vの期間に 1 / 2 フレームのフレームデータを転送する能力があれば十分である。デコーダ部 3 0 1 は 2 V の期間に 1 フレームのフレームデータを生成する演算能力、垂直フルタ部 3 0 3 は I Vの期間に 1 /2 フレームのフレームデータをフィルタ処理する演算能力があれば十分である。垂直フィルタ部 3 0 3かちノッファメモリ 3 0 4間は、 I Vの期間に 1 /4 フレームのフレームデータを転送する能力があれば十分である。ノッファメモリ 3 0 4から画像出力部 3 0 5間は、 1 Vの期間に 1 / 4 フレームのフレームデータを転送する能力があれば十分である。フレームメモリ 3 0 2は、フレームデータ 1 フレームを保持し、ノッファメモリ 3 0 4は、フレームデータ 1 /2 フレームを保持する容量があれば十分である。

次に、図 2 0 と対比するため、図 2 1 にノッファメモリ 3 0 4を備えていない場合のデータ供給状態の時間変化を示す。縮小処理を行わない場合、フレームメモリ 3 0 2への n フレームのデジタル画像データの供給は実線 5 0 6で示すように、破線 5 0 7で示す n- 1 フレームの 2 nd フィールドの垂直フィルタ部 3 0 3への供給が始まった時から開始し、破線 5 0 8で示す nフレームの 1 stフィールドの垂直フィルタ部 3 0 3への供給が完了する前に終了する。そのため、図 5のグラフ上で示す 2 V の期間の間に 1 フレームのデジタル画像データを一定の速度で供給する。

また、 n フレームの 1 st フィールドのフレームメモリ 3 0 2 から垂直フィルタ部 3 0 3へのデジタル画像データの供給は破線 5 0 8で示すように、実線 5 1 1 が示すフレームメモリ 3 0 2への n フレームのデジタル画像データの供給が終了する直後に完了し、続いて 2 nd フィールドの処理を開始する。そのためフレームメモリ 3 0 2から垂直フィルタ部 3 0 3へのデジタル画像データの供給は、図 2 1 のグラフ上で示す 1 V の期間の間に 1 フィールドのデジタル画像データを一定の速度で供給される。ところが、 1 /2縮小処理を行う場合、フレームメモリ 3 0 2 への nフレームのデジタル画像データの供給開始が可能となるタイミングは、 n- 1 フレームの 2 ndフィールドの表示位置によつて異なってくる。 n_ l フレームの 2 ndフィールドの表示位置によって、フレームメモリ 3 0 2から垂直フィルタ部 3 0 3へのデジタル画像データの供給は破線 5 0 9から 5 1 0の間のどこかで行われ、フレームメモリ 3 0 2への nフレームのデジタル画像データの供給開始が可能となるタイミングが時間的に最も遅れるのは、破線 5 1 0で示す表示位置の場合である。この場合、 1 /2縮小画像は画像出力部 5 0 1 の下半分に出力されるまた、フレームメモリ 3 0 2への n フレームのデジタル画像データの供給は、破線 5 1 1 で示す nフレームの 1 st フィールドの垂直フィルタ部 3 0 3への供給が完了する前にに終了していなければならない。そのため、図 2 1 のグラフ上で示す 1 V の期間の間に 1 フレームのデジタル画像データを一定の速度で供給する必要があり、縮小を行わない場合に比べ 2倍の供給能力が必要となる。

また、 n フレームの 1 st フィールドのフレームメモリ 3 0 2 から垂直フィルタ部 3 0 3へのデジタル画像データの供給は破線 5 1 1 で示すように、実線 5 1 2が示すフレームメモリ 3 0 2への nフレームのデジタル画像データの供給が終了する直後に完了し、続いて 2 ndフィールドの処理を開始する。そのため図 5 のグラフ上で示す 1 / 2 V の期間の間に 1 フィールドのデジタル画像データを一定の速度で供給する必要があり、縮小を行わない場合に比べ 2倍の供給能力が必要となる。垂直フィルタ部 3 0 3 も、供給されるデジタル画像データに見合った性能が要求されるため、縮小を行わない場合に比べ 2倍の演算能力が必要となる。また、図 2 3 は、図 2 0 と対比するため、ノ"？ッファメモリ 3 0 4 を備えていない場合であって 1 / 4縮小処理を行う場合のデータ供給状態の時間変化を示す。

1 /4縮小処理を行う場合のグラフを図 2 3 に示す。上記と同様の理由より、フレームメモリ 3 0 2 へのデジタル画像データの供給能力、フレームメモリ 3 0 2 から垂直フィルタ部 3 0 3 への供給能力、垂直フィルタ部の演算能力はそれぞれ縮小処理を行わない場合の 4倍が必要となる。このように、ノッファメモリ 3 0 4 を備えない場合は、縮小率が上がると必要なピーク性能も大きくなつてしまう。

< 3 . 1 . 2 1 / 4縮小 >

図 2 2 は、図 1 9示したメディアプロセッサにて 1 /4縮小を行う場合の各部のデータ供給状態とその時間変化を示す図である。

図 2 2 において、グラフの横軸、縦軸は図 2 0 と同様である。グラフ上の実線 8 0 4 はデコーダ部 3 0 1 からフレームメモリ 3 0 2 へのフレームデータの供給状態を示している。グラフ上の破線 8 0 5 はフレームメモリ 3 0 2 から垂直フィルタ部 3 0 3 へのフレームデータの供給状態を示している。グラフ上の破線 8 0 6 は垂直フィルタ部 3 0 3 からノッファメモリ 3 0 4 への 1 st フィールド縮小画像データの供給状態を示している。グラフ上の破線 8 0 7 は垂直フィルタ部 3 0 3 からノッファメモリ 3 0 4 への 2 nd フィールド縮小画像データの供給状態を示している。グラフ上の実線 8 0 8 はノッファメモリ 3 0 4 から画像出力部 3 0 5 への 1 st フィールド縮小画像データの供給状態を示している。グラフ上の実線 8 0 9 はノッファメモリ 3 0 4 から画像出力部 3 0 5 への 2 nd フィ一ルド縮小画像デ一夕の供給状態を示している。同図に示すように、デコーダ部 3 0 1 からフレームメモリ 3 0 2間は、 2 V の期間に 1 フレームのフレームデータを転送する能力があれば十分である。フレームメモリ 3 0 2から垂直フィルタ部 3 0 3間は、 1 Vの期間に 1 / 2 フレームのフレームデータ転送する能力があれば十分である。デコーダ部 3 0 1 は 2 V の期間に 1 フレームのフレームデータを生成する演算能力があれば十分である。垂直フィルタ部 3 0 3 は 1 Vの期間に 1 / 2 フレームのフレームデータをフィル夕処理する演算能力、垂直フィル夕部 3 0 3 からノッファメモリ 3 0 4間は、 I V の期間に 1 /8 フレームのフレームデータ転送能力、ノッファメモリ 3 0 4から画像出力部 3 0 5間は、 I Vの期間に 1 /8 フレームのフレームデータ転送能力があれば十分である。フレームデータ 1 フレームを保持できるフレームメモリ 3 0 2、フレームデータ 1 /4 フレームを保持できるノッファメモリ 3 0 4がそれぞれ必要となる。

これらの各必要性能は最短でも I V の期間での平均の能力であり、縮小率が大きくなつても短い期間に大きなピーク性能を要求される事がない。また、最も処理性能を必要とされるのが縮小なしの場合である。この場合、デコーダ部 3 0 1 からフレームメモリ 3 0 2間は、 2 V の期間に 1 フレームのフレームデ一夕転送能力で足りる。フレームメモリ 3 0 2から垂直フィルタ部 3 0 3 間は、 I Vの期間に 1 /2 フレームのフレームデータ転送能力で足りる。デコーダ部 3 0 1 は 2 V の期間に 1 フレームのフレームデータを生成する演算能力で足りる。垂直フィルタ部 3 0 3 は I V の期間に 1 /2 フレームのフレームデータをフィルタ処理する演算能力で足りる。垂直フィルタ部 3 0 3からノッファメモリ 3 0 4間は、 1 Vの期間に 1 / 2 フレームのフレームデータ転送能力で足りる。ノッファメモリ 3 0 4から画像出力部 3 0 5間は、 I Vの期間に 1 /2 フレームのフレームデ一夕転送能力で足りる。フレームメモリ 3 0 2 はフレームデータ 1 フレームを保持でき、ノッファメモリ 3 0 4は、フレームデータ 1 フレームを保持できればよい。この能力であらゆる垂直縮小処理を行う事ができる。これらにより回路規模を削減し、動作クロックを引き下げる事が出来る。

< 3. 2 垂直フィルタ処理（その 2 ) >

図 2 4は、メディァプロセッサにおいて垂直フィルタ処理を行う場合のデータの流れを示した模式的なプロック図である。

同図は、デコード部 4 0 1 、ノッファメモリ 4 0 2、垂直フィルタ部 4 0 3、ノッファメモリ 4 0 4、映像出力部 4 0 5、制御部 4 0 6からなる。同図は、図 1 9 と比べて、デコード部 4 0 1 、垂直フィルタ部 4 0 3、ノッファメモリ 4 0 4、映像出力部 4 0 5 は、同名の構成要素と同様である。従って同じ点は説明を省略し、異なる点を中心に説明する。

バッファメモリ 4 0 2 は、 1 フレーム分の記憶容量より少ない容量でよい点でフレームメモリ 3 0 2 とは異なる。

垂直フィルタ部 4 0 3 は、垂直方向の 6 4 ライン（処理前のフレーム中の 4 マクロブロックライン）のフィルタ処理を終える毎に制御部 4 0 6 にその旨（フィルタ状態）を通知する点で垂直フィルタ部 3 0 3 と異なる。なお、通知の単位はマクロブロックライン 2 ~ 3単位としてもよい。

デコード部 4 0 1 は、 6 4 ライン単位のデコードを終える毎に制御部 4 0 6 にその旨（デコード状態）を通知する点でデコード部 3 0 1 と異なる。なお、通知の単位は 1 6 ライン単位でもよい。

制御部 4 0 6は、図 2中の I O P 2 1 1 に相当し、デコード部 4 0 1 と垂直フィルタ部 4 0 3の動作状態を、それぞれからの通知に基づいて監視し、垂直フィルタ処理がデコード処理を越さないように、かつデコード処理が垂直フィルタ処理を追い越さないようにデコード部 4 0 1 及ぴ垂直フィルタ部 4 0 3 を制御する。つまり、制御部 4 0 6 の次の 2 つを制御する。 1 つは、フィルタ処理の対象となるマクロプロックラインの画素データ群をデコード部 4 0 1 がバッファメモリ 4 0 2 に書き込んでいないのに、垂直フィル夕部 4 0 3 が前のフレーム（又はフィールド）のマクロブロックラインの画素データ群を対象にフィルタ処理を行うことを防.止することである。もう 1 つは、垂直フィルタ部 4 0 3 が垂直フィルタ処理の対象だが未処理のマクロプロックラインに対して、デコード部 4 0 1 が次のフレームの画素データ群を上書きしてしまうことを防止することである。

図 2 5 は、制御部 4 0 6 における制御内容を示す説明図である。

同図の横軸は時間であり、制御部 4 0 6 、 VSYNC (垂直同期信号）、デコード部 4 0 1 、垂直フィルタ部 4 0 3 、映像出力部 4 0 5 の各動作を記してある。

同図のようにデコード部 4 0 1 は 6 4 ラインのデコードを終える毎にその旨を制御部 4 0 6 に通知し、垂直フィルタ部 4 0 3 は 6 4 ラインのフィルタしょりを終える毎にその旨を制御部 4 0 6·に通知する。制御部 4 0 6 は、これらの通知を下に、デコードが完了したライン番号 Nd と、フィルタ処理が完了したライン番号 Nf とを保持及び更新し、 Nd (現フレーム） > Nf (現フレーム）、 Nd (次のフレーム）く N f (現フレーム）を満たすよう、デコード部 4 0 1 、垂直フィルタ部 4 0 3 を制御する。具体的には、制御部 4 0 6 は、 Nd と Nf が接近した場合（その差がしきい値以下になった場合）にはデコード部 4 ◦ 1 、垂直フィルタ部 4 0 3 の一方を一時的に停止させる。なお、 Nd、 Nf はマクロブロックラインの番号であってもよい。

また、 Nd と Nf が接近した場合には、制御部 4 0 6 の制御によって、デコード部 4 0 1 、垂直フィルタ部 4 0 3 の一方は制御部 4 0 6 により一時的に停止されるが、 Nd と Nf が接近したか否かの判定及ぴデコ一ド部 4 0 1 又は垂直フィルダ部 4 0 3 を一時的に停止させる制御は、制御部 4 0 6 以外が担当するように構成してもよい。

たとえば、垂直フィルタ部 4 0 3 がデコード部 4 0 1 に上記フィルタ状態の通知を行うようにし、デコード部 4 0 1 は、フィルタ状態の通知と内部のデコード状態とに従って、 Nd と Nf とが接近したか否かを判定し、判定結果に応じてデコード動作を一時的に停止し又は垂直フィルタ部 4 0 3 を一時的に停止させる構成としてもよい。

あるいは、逆に、デコード部 4 0 1 が垂直フィルタ部 4 0 3 に上記デコード状態の通知を'行うようにし、垂直フィルタ部 4 0 3 は、デコード状態の通知と内部のフィルタ状態とに従って、 Nd と Nf とが接近したか否かを判定し、判定結果に応じてフィルタ処理を一時的に停止し又はデコード部 4 0 1 を一時的に停止させる構成としてもよい。

< 3 . 2 . 1 1 ノ 2 縮小 >

図 2 6 は図 2 4 において 1 / 2 縮小処理を行う場合の各部の供給データ量を示す図である。

グラフ 9 0 1 の横軸はノッファメモリ 4 0 2 上のフレームデ一夕量を示し、縦軸は時間を示して.いる。グラフ 9 0 2 の横軸はノッファメモリ 4 0 4上のフレームデータ量を示し、縦軸は時間を示している。グラフ 9 0 3 は画像出力部 4 0 5 の状態を時系列上に並べたものであり、時間軸はグラフ 9 0 1 、 9 0 2 の縦軸と合っている。

グラフ上の実線 9 0 4 はデコーダ部 4 0 1 からノッファメモリ 4 0 2 へのフレームデータの供給状態を示している。グラフ上の破線 9 0 5 はノッファメモリ 4 0 2 から垂直フィルタ部 4 0 3 へのフレームデータの供給状態を示している。グラフ上の破線 9 0 6 は垂直フィルタ部 4 0 3 からノッファメモリ 4 0 4 への 1 st フィールド縮小画像データの供給状態を示している。グラフ上の破線 9 0 7 は垂直フィルタ部 4 0 3 からノッファメモリ 4 0 4 への 2 nd フィールド縮小画像データの供給状態を示している。グラフ上の実線 9 0 8 はノッファメモリ 4 0 4 から画像出力部 4 0 5 への 1 st フィ一ルド縮小画像データの供給状態を示している。グラフ上の実線 9 0 9 はノッファメモリ 4 0 4 から画像出力部 4 0 5 への 2 nd フィ一ルド縮小画像データの供給状態を示している。

グラフ 9 0 1 で示すように、デコーダ部 4 0 1 からノッファメモリ 4 0 2 への n フレームのフレームデータの供給が開始された直後に、ノッファメモリ 4 0 2 から垂直フィルタ部 4 0 3 への n フレームのフレームデータの供給を開始し、デコーダ部 4 0 1 からノッファメモリ 4 0 2 への n フレームのフレームデ一夕の供給が終了する直後にノッファメモリ 4 0 2 から垂直フィルタ部 4 0 3 への n フレームのフレームデータの供給が終了するように制御を行う。グラフ 9 0 2 で示すように、垂直フィルタ部 4 0 3 からノッファメモリ 4 0 4 への n フレームのフレ —ムデータの供給は n_ l フレーム表示中に完了するように制御を行う。

このように装置を制御する事により、デコーダ部 4 0 1 からバッファメモリ 4 0 2 間は、 2 V の期間に 1 フレームのフレームデータ転送能力、ノッファメモリ 4 0 2 から垂直フィルタ部 4 0 3間は、 2 V の期間に 1 フレームのフレームデータ転送能力、デコーダ部 4 0 1 は 2 V の期間に 1 フレームのフレームデ一夕を生成する演算能力、垂直フィルタ部 4 0 3 は 2 V の期間に 1 フレームのフレームデータをフィルタ処理する演算能力、垂直フィルタ部 4 0 3からノッファメモリ 4 0 4間は、 2 V の期間に 1 /2 フレームのフレームデータ転送能力、バッファメモリ 4 0 4から画像出力部 4 0 5間は、 1 Vの期間に 1 / 4 フレームのフレームデータ転送能力、数ライン分のフレームデータを保持できるノッファメモリ 4 0 2、フレームデータ 1 フレームを保持できるノッファメモリ 4 0 4がそれぞれ必要となる。 < 3. 2. 2 1 Z 4縮小 >

図 2 7 は図 2 4 において 1 / 4縮小を行った場合の各部のデ一夕供給量を示す図である。

グラフ 1 0 0 1 の横軸はノッファメモリ 4 0 2上のフレームデータ量を示し、縦軸は時間を示している。グラフ 1 0 0 2の横軸はノッファメモリ 4 0 4上のフレームデータ量を示し、縦軸は時間を示している。グラフ 1 0 0 3 は画像出力部 4 0 5の状態を時系列上に並べたものであり、時間軸はグラフ 1 0 0 1 、 1 0 0 2 の縦軸と合っている。

グラフ上の実線 1 0 0 4はデコーダ部 4 0 1 からノッファメモリ 4 0 2へのフレームデータの供給状態を示している。グラフ上の破線 1 0 0 5 はノッファメモリ 4 0 2から垂直フィルタ部 4 0 3へのフレームデータの供給状態を示している。グラフ上の破線 1 0 0 6 は垂直フィルタ部 4. 0 3からノッファメモリ

4 0 4への 1 st フィールド縮小画像データの供給状態を示している。グラフ上の破線 1 0 0 7は垂直フィルタ部 4 0 3からバッファメモリ 4 0 4への 2 nd フィールド縮小画像データの供給状態を示している。グラフ上の実線 1 0 0 8 はバッファメモリ 4 0 4 から画像出力部 4 0 5への 1 st フィールド縮小画像データの供給状態を示している。グラフ上の実線 1 0 0 9 はノッファメモリ 4 0 4 から画像出力部 4 0 5への 2 nd フィールド縮小画像データの供給状態を示している。

このように装置を制御する事により、デコーダ部 4 0 1 からノッファメモリ 4 0 2間は、 2 V の期間に 1 フレームのフレームデータ転送能力で足り、

ノッファメモリ 4 0 2から垂直フィルタ部 4 0 3間は、 2 V の期間に 1 フレームのフレームデータ転送能力で足り、デコーダ部 4 0 1 は 2 V の期間に 1 フレームのフレームデータを生成する演算能力で足り、垂直フィルタ部 4 0 3 は 2 V の期間に 1 フレームのフレームデータをフィルタ処理する演算能力で足り、垂直フィルタ部 4 0 3からノッファメモリ 4 0 4間は、 2 V の期間に 1 /4 フレームのフレ一ムデータ転送能力で足り、バッファメモリ 4 0 4から画像出力部 4 0 5間は.、 1 Vの期間に 1 / 8 フレームのフレームデータ転送能力で足りる。ノッファメモリ 4 0 2 は、数ライン分のフレームデータを保持でき、バッファメモリ 4 0 4 はフレームデータ 1 /2 フレームを保持できれば足りる。

これらの各必要性能は最短でも I V の期間での平均の能力であり、縮小率が短い期間で大きなピーク性能を要求される事がない。

また、最も処理性能を必要とされるが縮小なしの場合であり、その場合に要求されるのがデコーダ部 4 0 1 からノッファメモリ 4 0 2間は、 2 V の期間に 1 フレームのフレームデータ転送能力、ノッファメモリ 4 0 2から垂直フィルタ部 4 0 3間は、 2 V の期間に 1 フレームのフレームデータ転送能力、デコーダ部 4 0 1 は 2 V の期間に 1 フレームのフレームデータを生成する演算能力、垂直フィルタ部 4 0 3 は 2 V の期間に 1 フレームのフレームデータをフィルタ処理する演算能力、垂直フィルタ部 4 0 3からノッファメモリ 4 0 4間は、 2 V の期間に 1 フレ一ムのフレームデータ転送能力、ノッファメモリ 4 0 4から画像出力部 4 0 5.間は、 1 Vの期間に 1 / 2 フレームのフレ一ムデ一夕転送能力、数ライン分のフレームデータを保持できるバッファメモリ 4 0 2、フレームデータ 2 フレームを保持できるバッファメモリ 4 0 4であり、この能力であらゆる垂直縮小処理を行う事ができる。これらにより回路規模を削減し、動作クロックを引き下げる事が出来る。

< 4. 変形例 >

図 2 8、 2 9 は、画素並列処理部の左半分、右半分の第 1 の変形例を示す図である。これらの図は、図 3、 4 に対して同じ構成要素には同じ符号を付しているので説明を省略し、異なる点を中心に説明する。

図 2 8、 2 9 は、図 3、 4の画素処理部 1 〜 1 6の代わりに画素処理部 l a〜： 1 6 a を、画素転送部 1 7、 1 8の代わりに画素転送部 1 7 a、 1 8 bを備える。画素処理部 l a〜： 1 6 a はいずれも同じ構成なので、画素処理部 1 a を代表して説明する。

画素処理部 l a は、画素処理部 1 における選択部 A 1 0 4、選択部 B 1 0 5 の代わりに選択部 A l 0 4 a、選択部 B 1 0 5 a を備える。

選択部 A l 0 4 a は、選択部 A 1 0 4 と比べると 2入力から

3入力になっている点が異なる。つまり、選択部 A l 0 4 a は、

2つ隣の画素転送部（又は画素処理部）の遅延器（遅延器 B ) から画素データ入力が増えている。

選択部 B 1 0 5 a は、同様に 2つ隣の画素転送部（又は画素処理部）の遅延器（遅延器 B ) の画素データ入力が増えている。また、画素転送部 1 7 a は、選択部 B 1 7 0 3〜選択部 G 1 7 0 8の代わりに選択部 B 1 7 0 3 a〜選択部 G l 7 0 8 a を備える。選択部 B l 7 0 3 a〜選択部 G l 7 0 8 aは、それぞれ 2入力ではなく 3入力になっている。増えている入力は、 2 つ左の遅延器からの画素データ入力である。

また、画素転送部 1 8 a は、選択部 B 1 8 0 3〜選択部 G 1 8 0 8の代わりに選択部 B l 8 0 3 a〜選択部 G l 8 0 8 a を備える。選択部 B l 8 0 3 a〜選択部 G l 8 0 8 aは、それぞれ 2入力ではなく 3入力になっている。増えている入力は、 2 つ右の遅延器からの画素データ入力である。

この構成によれば、処理対象の画素と、その画素から左右に 2つ隣の画素を順に用いたフィルタ処理を行うことができる。例えば、画素処理部 1 aでは次式などを演算することができる。

aO-X9 + al ( 11 +X7) +a2 ( 13 + X5) +a3 ( 15 + X3)

図 3 0、 3 1 は、画素並列処理部の左半分、右半分の第 2の変形例を示す図である。

図 3 0、 3 1 は、図 3、 4の画素処理部 1 と画素処理部 1 6 との代わりに画素処理部 1 b と画素処理部 1 6 b とを備える。

画素処理部 1 b は、画素処理部 1 における選択部 B 1 0 5の代わりに選択部 b 1 0 5 b を備える。選択部 B l 0 5 b は、遅延器 B 1 0 7からのフィ一ドバック入力を有している点で選択部 B 1 0 5 と異なっている。

画素処理部 1 6 b は、画素処理部 1 6 における選択部 A 1 6 0 4の代わりに選択部 A l 6 0 4 bを備える。選択部 A 1 6 0 4 bは、遅延器 A 1 6 0 6からのフィードノック入力を有している点で選択部 A 1 6 0 5 と異なっている。この構成によれば、画素処理部 1 b は例えば次の演算を行う。 a3*X6+a2*X7+al*X8+ a0*X9+al*X10+a2*Xll + a3*X12

このとき画素処理部 2の出力は、次のようになる。

a3*X20+a2*X21+ al*X22+a0*X23+ al*X24+ a2*X24+a3*X24 このとき、画素処理部 1 6 bの出力は次のようになる。

a3*X21 + a2*X22+ al*X23+ aO*X24+ al*X24+ a2*X24 + a3*X24 このように、図 3 0、 3 1 では、左端の画素処理部 l b にデ一夕列の左端の画素データが転送されてきた場合に、選択部 B 1 0 5 b は画素処理部 1 b内の遅延器 Bからのフィードノック入力を選択する。右端の画素処理部 1 6 b にデータ列の右端の画素データが転送されてきた場合、選択部 A 1 6 0 4 b は、遅延器 A 1 6 0 6からのフィードパック入力を選択する。

図 3 2、 3 3は、画素並列処理部の左半分、右半分の第 2の変形例を示す図である。

図 3 2、 3 3 は、図 3、 4の画素処理部 1 〜 1 6の代わりに画素処理部 1 c〜 l 6 c、画素転送部 1 7、 1 8の代わりに画素転送部 1 7 c、 1 8 c を備える。画素処理部 l c〜： I 6 c はいずれも同じ構成なので、画素処理部 1 aを代表して説明する。

画素処理部 1 c は、画素処理部 1 における選択部 A 1 0 4、選択部 B 1 0 5の代わりに選択部 A 1 0 4 c、選択部 B 1 0 5 c を備える。

選択部 A l 0 4 c は、選択部 A 1 0 4 と比べると 2入力から 3入力になっている点が異なる。つまり、選択部 A 1 0 4 c は、 2つ隣の画素転送部（又は画素処理部）の遅延器（遅延器 B ) の画素データ入力が増えている。

選択部 B l 0 5 c は、 2つ隣の画素転送部（又は画素処理部）の遅延器（遅延器 B ) の画素データ入力と、遅延器 B 1 0 7からのフィ一ドノック入力とが増えている。画素転送部 1 7 c 、 1 8 c は、図 2 8、図 2 9 に示した画素転送部 1 7 a 、 1 8 a と同様に 2 入力ではなく 3入力になっている。

この構成によれば、画素処理部 1 c は例えば次の演算を行う。 a3*X9+ a2*X9+ al*X9+ aO*X9+ al*Xl 1 + a2*X13+ a3*X15 このとき画素処理部 2 c の出力は、次のようになる。

a3*X10+ a2*X10 + al*X10+ aO*X10+ al*X12+ a2*X14 + a3*X16 このとき画素処理部 1 5 c の出力は、次のようになる。

a3*X17+ a2*X19+ al*X 1+ a0*X23+ al*X23+ a2*X23+ a3*X23 このとき画素処理部 1 6 c の出力は、次のようになる。

a3*X18+ a2*X20+ al*X22+ a0*X24+ al*X24+ a2*X24+ a3*X24 図 3 4 は、 P O U A 2 0 7 の変形例を示す図である。

同図の P O U A 2 0 7 は、図 2 と比べてアップサンプリング回路 2 2 a とダウンサンプリング回路 2 3 a とが追加されている。図 2 と同じ点は説明を省略し、異なる点を中心に説明する。

アップサンプリング回路 2 2 a は、入カノッファ群 2 2 から入力される画素データ群を垂直方向に拡大する。例えば、入力バッファ群 2 2 から入力される画素データ群を垂直方向に 2倍にするよう画素データを補間するため、入力バッファ群 2 2 からの画素データ群の入力 1 回に対して、同じ画素データ群を 2 回画素並列処理部 2 1 に出力する。

ダウンサンプリング回路 2 3 a は、画素並列処理部 2 1 から入力される画素データ群を垂直方向に縮小する。例えば、画素並列処理部 2 1 から入力される画素データ群を垂直方向に 1 2倍にするよう画素データを間引く。つまり、画素並列処理部 2 1 からの画素データ群の入力 2 回に対して、 1 回分を ^棄し 1 回分を出力する。

この構成によれば、画素並列処理部 2 1 の入力側で垂直方向に 2倍、出力側で垂直方向に 1 ノ 2倍するので、外部メモリ 2 2 0 における 1 フレームあたりのデータ量を垂直方向に 1 / 2 にすることができ、その結果、 P O U C 2 0 9 による P O U A 2 0 7へのデータ転送量を 1 ノ 2 にすることができる。これにより、デュアルポ一トメモリ 1 0 0の内部ポートへのアクセスが集中する場合にバスネックを解消することができる。産業上の利用可能性

本発明の画素演算装置は画像のをリサイズ等を行うのフィル夕リング処理を複数画素に対して並列に行うので、動画の圧縮処理ノ伸張処理、リサイズ等を扱うメディァプロセッサなどのデジタル映像機器に利用される。

Claims

請求の範囲

1 . フィルタ処理を行う画素演算装置であって、

N個の画素処理手段と、

N個の画素データ及びフィルタ係数を供給する供給手段と、 N個の画素処理手段を並列に動作させる制御手段とを備え、各画素処理手段は、供給手段に供給された画素データとフィルタ係数とを用いて演算した後、各画素処理手段に対して隣接する画素処理手段から画素データを取得し、取得した画素データを用いて演算して演算結果を累積し、

前記制御手段は、隣接する画素処理手段からの画素データの取得と、取得した画素データを用いた演算及び累積とを繰り返すよう N個の画素処理手段を制御することを特徴とする画素演算装置。

2 . 前記 N個の画素処理手段は、 N個の画素データを右シフトする第 1 シフタと、 N個の画素データを左シフトする第 2 シフタを形成し、

各画素処理手段は、隣接する 2 つの画素処理手段からシフトァゥトされる 2 つの画素データを用いて演算し、

ことを特徴とする請求の範囲第 1 項記載の画素処理装置。

3 . 連続する N個の画素に対応する N個の画素処理部と、

N個の画素データを N個の画素処理部に供給する第 1 供給手段と、

フィルタ係数を N個の画素処理部に供給する第 2 供給手段とを備え、

フィルタ処理のタップ数を指定する手段と、各画素処理部は、

他の画素処理部から画素データを取得する取得手段と、画素データと第 2 供給手段に供給されるフィルタ係数とを演算する演算手段と、

演算手段による演算結果を累積する累積手段と、

第 1 供給手段から供給される画素データと第 2 供給手段から供給されるフィルタ係数とを用いて演算手段に演算させた後、取得手段による取得と取得された画素データとフィルタ係数とを用いた演算と累積手段による累積とを指定されたタップ数に応じた回数実行させる制御手段とを備える

ことを特徴とする画素処理装置。

4 . 連続する複数画素に対応する複数の画素処理部と、

前記複数画素の画素データを複数の画素処理部に供給する第 1 供給手段と、

フィルタ係数を各画素処理部に供給する第 2 供給手段とを備え、

各画素処理部は、

演算手段による演算結果を累積する累積手段と、

取得手段、演算手段、累積手段にフィルタ処理を実行させる制御と、第 1 供給手段から m号対象フレームの複数の画素データとそれに対応する差分画素データとが供給された場合の演算手段に動き補償処理を実行させる制御とを切り替える制御手段と

を備えることを特徴とする画素処理装置。

5 . 複数の画素データに対応する複数の画素処理手段と、複数の画素データを画素演算回路に供給する供給手段とを備え、

前記画素処理手段の各々は、

供給手段からの画素データと、第 1 の画素処理手段出力される画素デ一夕とから画素データを選択する画素セレクタと、選択された画素データを保持し、第 2 の画素処理手段に出力する保持回路と

保持された画素データに対して演算を行う演算回路とを有することを特徴とする画素処理回路。