WO2007072644A1

WO2007072644A1 - ２次元フィルタ演算装置及び方法

Info

Publication number: WO2007072644A1
Application number: PCT/JP2006/323214
Authority: WO
Inventors: Akihiko Inoue; Tokuzo Kiyohara
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-12-19
Filing date: 2006-11-21
Publication date: 2007-06-28
Also published as: JP4824703B2; US20100046851A1; JPWO2007072644A1; US8260075B2

Abstract

　２次元フィルタ演算装置は、画像メモリ（３００）、ラインメモリ（４００）、並列に設置された９個の第１フィルタモジュールを有する垂直フィルタ処理部（１００）、タイミング調整用のバッファ（５００）、及び、４個の並列に設置された第２フィルタモジュールを有する水平フィルタ処理部（２００）を備え、ラインメモリ（４００）から、１ラインあたり９個の整数画素値を垂直フィルタ処理部（１００）に並列入力して、９個の垂直フィルタ済み１／２画素値の生成し、それらを水平フィルタ処理部（２００）へ入力して、４個の２次元フィルタ済み１／２画素値を生成する。

Description

明細書

2次元フィルタ演算装置及び方法

技術分野

[0001] 本発明は、画像圧縮伸張処理、ループ内フィルタ処理、走査線変換処理、あるいは、画像平滑ィ匕処理等に使用される 2次元フィルタ演算装置に関するものである。背景技術

[0002] 近年、音声や画像のデータ圧縮技術を基盤とした音声符号化技術や動画像符号化技術は、我々のオーディオ 'ビジュアルライフを豊かなものにする上で非常に重要な技術となっている。

[0003] 今日、動画像符号ィ匕技術として、様々な方式が提案されて!ヽる。動画像符号化技術の標準規格としては、 ITU-T (国際電気通信連合電気通信標準化部門）の H. 26 1、 H. 263、 ISO (国際標準化機構）の MPEG- 1、 MPEG- 2, MPEG-4などがある (MPEGは、 Moving Picture Experts Groupの略語）。また、 ITU— Tと ISOが共同で規格ィ匕した動画像符号ィ匕技術の新しい標準規格として、 H. 264 I MPEG— 4 AVC (Advanced Video Coding)がある。

[0004] さらに、 SMPTE (Society of Motion Picture and Television Engineer s：全米映画テレビジョン技術者協会）は、次世代の大容量光ディスク規格「HD DV D」と「Blue— Ray Disk」に、動画像符号化技術として「Video Codec 1 (VC1)」を採用した。

[0005] その他、インターネット上のコンテンツには、マイクロソフト社の WMVや、リアルネットワークス社の RealVideoなどの方式が使用されている。このように、現在、異なる動画像符号化技術に基づ!、て、多くの標準規格が乱立して!/、る。

[0006] これらの動画像符号化方式の標準規格は、応用分野ごとに異なる適用のされ方をしている。例えば、現在の DVDには MPEG— 2が採用されており、次世代の DVDには、前述したように、 H. 264 I MPEG -4 AVCや VC1が採用されている。すでにサービスが開始されている日本国内におけるディジタル放送には、 H. 264 I MPE G-4 AVCが採用されている。また、携帯電話のテレビ電話には、 H. 263、あるいは、 MPEG— 4 Simple Profileが採用されている。さらに、インターネット上のコンテンッには、 WMV方式や RealVideo方式が多く採用されている。

[0007] 一方、近年の動画像符号化技術は、動画像の圧縮率向上のために、複雑な圧縮伸張処理を行っている。このため、圧縮伸張処理対象の画像の画素数が多くなると、必要とする計算量が膨大となる。

[0008] ディジタルテレビ、 DVD,または、携帯電話等の映像機器に組み込まれてヽる CP Uは、パーソナルコンピュータに搭載される CPUより動作周波数が低い。これらの映像機器は、動作周波数が低い CPUによるソフトウェア処理では、上述した膨大な計算量を伴う動画像の伸張処理 (デコード処理）が間に合わないために、処理アルゴリズムをダイレクトに実行する、伸張処理専用のハードウェアを搭載していることが多い

[0009] 搭載後の変更が容易でない専用ハードウェアで、前述した複数の規格のストリームデータを効率よくデコードするためには、それぞれの規格での類似点と相違点を考慮することが重要となる。

[0010] 動画のストリームデータをデコードする処理は、可変長符号ィ匕されたストリームデータを復号する可変長復号、可変長復号後のデータを周波数領域のデータに変換する逆量子化、周波数領域のデータから画素領域のデータへ変換する逆直交変換、参照画像力動きベクトルに応じた補間画像を生成し、その値に逆直交変換の結果を足しこむ動き補償予測という手順で実行される。これらのうち、逆直交変換及び動き補償予測は、 2次元フィルタ処理という共通の処理を行っている。さらに、この 2次元フィルタ処理は、デコード処理の中で特に多くの計算量を要する部分である。また、H. 264 I MPEG -4 AVCでは、圧縮率を改善するために、参照画像に対して補間を行うフィルタ処理を施す。このフィルタ処理も 2次元フィルタ処理である。

[0011] このように、 2次元フィルタ処理技術は、現在の動画像処理において、広範囲に利用される重要な技術である。

[0012] 図 16は、特許文献 1が開示する従来の 2次元フィルタのブロック図である。図 16に示す従来の 2次元フィルタは、画像メモリ 1、ラインメモリ 2a〜ラインメモリ 2e、垂直フィルタ処理部 3、水平フィルタ処理部 4、シフトレジスタ 5、及び、シフトレジスタ 6を備える。このものは、画像メモリ 1に格納されている画素に対して、最初に、垂直フィルタ処理部 3が垂直方向に 5タップのフィルタ演算を実行し、次に、水平フィルタ処理部 4が、垂直方向フィルタ演算により更新された画素を用いて、水平方向に同じく 5タップのフィルタ演算を実行する。

[0013] 以下に、図 16に示す従来の 2次元フィルタについて、さらに詳しい動作を説明する。最初に、画像メモリ 1に格納されている入力画像のある 1ラインの画素の画素値が、ラインメモリ 2aに読み出される。次の 1ラインの画素の画素値がラインメモリ 2aに読み出されるとき、ラインメモリ 2aに最初に読み出された画素の画素値力ラインメモリ 2bに転送される。この処理を 5回繰り返すことで、最初に読み出された 1ラインの画素の画素値がラインメモリ 2eに格納され、ラインメモリ 2a〜2dにも、順次読み出されたラインの画素の画素値が格納されることになる。次に、各ラインメモリからそれぞれの最右の 1画素値が、垂直フィルタ処理部 3に同時に読み出され、垂直フィルタ処理部 3において、垂直方向フィルタ演算が実行される。

[0014] 垂直フィルタ処理部 3によりフィルタ処理された画素値は、レジスタ 5に蓄積される。

垂直フィルタ処理部 3によりフィルタ処理された 5つの画素値がレジスタ 5にそろった時点で、それらの 5つの画素値が水平フィルタ処理部 4に入力され、水平フィルタ処理部 4において水平方向フィルタ演算が実行される。

[0015] 上記の処理を繰り返すことにより、画像メモリ 1に格納されている画素の画素値に対して 2次元のフィルタ演算が実行される。

[0016] し力しながら、図 16に示す従来の 2次元フィルタでは、垂直方向フィルタ演算を実行するために、水平方向に読み出された画素の画素値を垂直方向に並べ替えるためのバッファ（ラインメモリ 2a〜2e)を必要としていた。さらに、そのバッファを制御するための制御回路のパス力フィルタ演算を実行するデータパスとは別に必要であり、回路面積を増大させているという問題があった。これは、従来技術のように、垂直方向フィルタ演算を実行するデータパスと水平方向フィルタ処理を実行するデータノスが同一のデータノス構造になっている場合に必ず生じる問題である。また、図 16に示す従来の 2次元フィルタでは、フィルタ処理方向の順序を容易に変更できなヽと、う問題があった。 [0017] また、特許文献 2は、水平方向フィルタと垂直方向フィルタを用いて、画素データ密度を変換し、縮小画面を生成する技術を開示している。特許文献 2が開示する技術では、水平方向フィルタ処理と垂直方向フィルタ処理の間に、画素データを並び替えるための、遅延回路 (バッファに相当する）を必要としていた。

[0018] さらに、特許文献 3は、水平方向フィルタと、構成を簡単にした垂直方向フィルタとを有する 2次元ディジタルフィルタ技術を開示して、る。特許文献 3が開示する技術においても、垂直方向にフィルタ処理ためには、水平方向にフィルタ処理された画素データを蓄積する遅延回路 (バッファに相当する）を必要としていた。

特許文献 1：特開 2002— 304624号公報

特許文献 2：米国特許第 5289292号公報

特許文献 3：米国特許第 5410362号公報

発明の開示

発明が解決しょうとする課題

[0019] そこで本発明は、画面上の画素の画素値に対して、 2次元フィルタ処理を行う場合、フィルタ処理方向の違いを吸収するためのバッファが不要で、フィルタ処理方向の順序を容易に変更できる、 2次元フィルタ演算装置を提供することを目的とする。課題を解決するための手段

[0020] 第 1の発明に係る 2次元フィルタ演算装置は、被フィルタ画像データを格納する記憶部と、記憶部に格納されている被フィルタ画像データに対して、第 1のフィルタ演算を実行する第 1フィルタ処理部と、第 1フィルタ処理部がフィルタ処理した画像データに対して、第 2のフィルタ演算を実行する第 2フィルタ処理部とを備え、第 1フィルタ処理部と第 2フィルタ処理部とは、垂直方向フィルタ演算と水平方向フィルタ演算の内の互いに異なるフィルタ演算を実行し、垂直方向フィルタ演算と水平方向フィルタ演算とは、互いに異なる並列処理によって実行される。

[0021] この構成によれば、被フィルタ画像データの 2次元フィルタ演算において、フィルタ処理方向の順序を任意に設定でき、さらに、フィルタ処理方向の違いを吸収するためのバッファを必要としない、 2次元フィルタ演算装置を提供できる。この 2次元フィルタ演算装置は、バッファが不要な分だけ回路面積を削減できる。 [0022] 第 2の発明に係る 2次元フィルタ演算装置では、並列処理は、被フィルタ画像データに対して、並列に実行される順次演算処理と並列に実行される並列演算処理とを含む。

[0023] この構成によれば、被フィルタ画像データの 2次元フィルタ演算は、フィルタ処理方向によって、順次演算処理と並列演算処理の内の、ずれかの演算処理を実行することができる。さらに、この構成によれば、演算処理の違いを吸収するためのバッファが不要であり、その分回路面積を削減した 2次元フィルタ演算装置を提供できる。

[0024] 第 3の発明に係る 2次元フィルタ演算装置では、第 1フィルタ処理部は、複数の第 1 フィルタモジュールを有し、第 2フィルタ処理部は、少なくとも 1つの第 2フィルタモジュールを有し、複数の第 1フィルタモジュールは、被フィルタ画像データに対して第 1のフィルタ演算を実行し、第 1フィルタ処理部は、複数の第 1フィルタ結果を出力し、少なくとも 1つの第 2フィルタモジュールは、複数の第 1フィルタ結果の内の少なくとも一部を入力して、第 2のフィルタ演算を実行し、第 2フィルタ処理部は、少なくとも 1つの第 2フィルタ結果を出力する。

[0025] この構成によれば、複数の画素の画素値に対して、複数の水平方向フィルタ処理（あるいは垂直方向フィルタ処理)を実行し、フィルタ処理された複数の画素値を得て、得られた複数の画素値に対して、少なくとも 1つの垂直方向フィルタ処理 (あるいは水平方向フィルタ処理)を引き続き実行し、 2次元フィルタ処理された複数の画素値を生成することができる。

[0026] 第 4の発明に係る 2次元フィルタ演算装置では、第 1フィルタ処理部は、複数の第 1 フィルタモジュールを用いて、第 1のフィルタ演算を並列に実行し、第 2フィルタ処理部が複数の第 2フィルタモジュールを有する場合は、第 2フィルタ処理部は、複数の第 2フィルタモジュールを用いて、第 2のフィルタ演算を並列に実行する。

[0027] この構成によれば、複数の水平方向フィルタ処理 (あるいは垂直方向フィルタ処理）と、それに続く複数の垂直方向フィルタ処理 (あるいは水平方向フィルタ処理）とを、それぞれ並列に実行することができる。したがって、より効率の良い 2次元フィルタ演算装置を実現できる。

[0028] 第 5の発明に係る 2次元フィルタ演算装置では、複数の第 1フィルタモジュールのそれぞれは、初段の累積加算部と少なくとも 1つの後段の累積加算部が縦続接続された複数の累積加算部と、複数の累積加算部のそれぞれの出力を順次選択して、出力する選択部とを有し、初段の累積加算部には、所定のフィルタ係数が、 1処理時間ごとに順次入力され、少なくとも 1つの後段の累積加算部には、それぞれの前段の累積加算部から、所定のフィルタ係数が、 1処理時間ごとに順次転送され、複数の累積加算部それぞれには、被フィルタ画像データの垂直または水平に並んだ画素の画素値が、記憶部から 1処理時間ごとに順次入力され、複数の累積加算部は、それぞれ、 1処理時間ごとに画素値と所定のフィルタ係数との積和演算を行って、複数の第 1フィルタ結果を出力する。

[0029] この構成によれば、フィルタ係数をシフト入力し、画素値を並列入力して、ループ内パイプライン処理によって、画素値とフィルタ係数との積和演算を高効率に行う第 1フィルタモジュールを実現できる。

[0030] 第 6の発明に係る 2次元フィルタ演算装置では、少なくとも 1つの第 2フィルタモジュールは、複数の加算部と、複数の積算部とを有し、複数の第 1フィルタ結果の内の少なくとも一部と、所定の複数のフィルタ係数との積和演算を行い、少なくとも 1つの第 2 フィルタ結果を出力する。

[0031] この構成によれば、第 1フィルタモジュールが出力した演算結果を入力して、ループ内並列処理によって、演算結果とフィルタ係数との積和演算を高効率に行う第 2フィルタモジュールを実現できる。この結果、 2次元フィルタ演算を完成させることができる。

[0032] 第 7の発明に係る 2次元フィルタ演算装置では、複数の第 1フィルタモジュールは、ループ内パイプライン処理方式とループ内並列処理方式の内の一方の処理方式に従って、第 1のフィルタ演算を実行し、少なくとも 1つの第 2フィルタモジュールは、ループ内パイプライン処理方式とループ内並列処理方式の内、複数の第 1フィルタモジュールが従って、な、方の処理方式に従って、第 2のフィルタ演算を実行する。

[0033] この構成によれば、ループ内パイプライン処理（または、ループ内並列処理）により、第 1のフィルタ処理を行う第 1フィルタ処理部と、ループ内並列処理 (または、ループ内パイプライン処理）により、第 2のフィルタ処理を行う第 2フィルタ処理部とを備える、 2次元フィルタ演算装置を実現できる。

[0034] 第 8の発明に係る 2次元フィルタ演算装置では、記憶部から 1ライン分の画素の画素値を取得して一時的に格納し、第 1フィルタ処理部に出力する、ラインメモリをさらに備える。

[0035] この構成によれば、記憶部力フィルタ演算部への画素値の転送をより効率よく行う 2次元フィルタ演算装置を実現できる。

[0036] 第 9の発明に係る 2次元フィルタ演算装置は、被フィルタ画像データを格納する記憶部と、垂直方向フィルタ演算を実行する垂直フィルタ処理部と、水平方向フィルタ演算を実行する水平フィルタ処理部と、記憶部の出力と水平フィルタ処理部の出力の内の一つを選択して、垂直フィルタ処理部へ出力する第 1選択部と、記憶部の出力と垂直フィルタ処理部の出力の内の一つを選択して、水平フィルタ処理部へ出力する第 2選択部と、垂直フィルタ処理部の出力と水平フィルタ処理部の出力の内の一つを選択して、 2次元フィルタ演算結果として出力する第 3選択部とを備える。垂直方向フィルタ演算と水平方向フィルタ演算とは、互いに異なる並列処理によって実行される。第 1動作モードが選択された場合は、第 1選択部は、記憶部の出力を選択し、第 2選択部は、垂直フィルタ処理部の出力を選択し、第 3選択部は、水平フィルタ処理部の出力を選択し、記憶部に格納されている被フィルタ画像データに対して、垂直方向フィルタ演算が実行された後に、水平方向フィルタ演算が実行される。第 2動作モードが選択された場合は、第 1選択部は、水平フィルタ処理部の出力を選択し、第 2選択部は、記憶部の出力を選択し、第 3選択部は、垂直フィルタ処理部の出力を選択し、記憶部に格納されている被フィルタ画像データに対して、水平方向フィルタ演算が実行された後に、垂直方向フィルタ演算が実行される。

[0037] この構成によれば、垂直方向フィルタ演算と水平方向フィルタ演算の順序を任意に変えることができる 2次元フィルタ演算装置を実現できる。

[0038] 第 10の発明に係る 2次元フィルタ演算装置では、互いに異なる並列処理は、被フィルタ画像データに対して、並列に実行される順次演算処理と並列に実行される並列演算処理とを含む。

[0039] この構成によれば、被フィルタ画像データの 2次元フィルタ演算は、フィルタ処理方向によって、順次演算処理と並列演算処理の内の、ずれかの演算処理を実行することができる。さらに、この構成によれば、演算処理の違いを吸収するためのバッファが不要であり、その分回路面積を削減した 2次元フィルタ演算装置を提供できる。

[0040] 第 11の発明に係る 2次元フィルタ演算装置では、第 1動作モードと第 2動作モードの選択は、被フィルタ画像データが準拠する動画像符号ィ匕規格に従って実行される

[0041] この構成によれば、被フィルタ画像データが準拠する動画像符号化規格に従って、垂直方向フィルタ演算と水平方向フィルタ演算の実行順序を任意に変えることができる。

発明の効果

[0042] 本発明によれば、画面上の画素の画素値に対して、 2次元フィルタ処理を行う場合、フィルタ処理方向の違いを吸収するためのバッファが不要で、フィルタ処理方向の順序を容易に変更できる、 2次元フィルタ演算装置を提供することができる。

図面の簡単な説明

[0043] [図 1]本発明の実施の形態 1における整数画素と 1Z2画素の配置図である。

[図 2]本発明の実施の形態 1における 1Z2画素の配置図である。

[図 3]本発明の実施の形態 1における 1Z2画素の別の配置図である。

[図 4]本発明の実施の形態 1における 2次元フィルタ演算装置のブロック図である。

[図 5]本発明の実施の形態 1における 2次元フィルタ演算方法のフローチャートである

[図 6]本発明の実施の形態 1における垂直フィルタ処理部のブロック図である。

[図 7]本発明の実施の形態 1におけるプロセッサエレメントのブロック図である。

[図 8]本発明の実施の形態 1における 2次元フィルタ演算装置のタイミング図である。

[図 9]本発明の実施の形態 1における水平フィルタ処理部のブロック図である。

[図 10]本発明の実施の形態 2における 2次元フィルタ演算装置のブロック図である。

[図 11]本発明の実施の形態 2における整数画素と 1Z2画素の配置図である。

[図 12]本発明の実施の形態 2における 2次元フィルタ演算装置 (第 2動作モード)のタイミング図である。 [図 13]本発明の実施の形態 3における半導体集積回路のブロック図である。

[図 14]本発明の実施の形態 4における半導体集積回路のブロック図である。

[図 15]本発明の実施の形態 5における電子機器のブロック図である。

[図 16]従来の 2次元フィルタのブロック図である。

符号の説明

1、 300 画像メモリ

2a、 2e、 400 ラインメモリ

3、 100、 711 垂直フィルタ処理部

4、 200、 712 水平フィルタ処理部

5、 6 レジスタ

10、 20、 30、 40 プロセッサエレメント

11、 214、 215、 216 乗算器

12、 211、 212、 213、 217、 218 カロ算器

13、 14、 219、 260、 270、 280 フリップフロップ

15、 91 係数入力端子

16 係数出力端子

17 画素データ入力端子

18 画素データ出力端子

50、 250 セレクタ

110 第 1フィルタモジュ -ル（# 0)

120 第 1フィルタモジュ -ル（# 1)

190 第 1フィルタモジュ -ル（# 8)

210 第 2フィルタモジュ -ル（#

220 第 2フィルタモジュ -ル（# )

230 第 2フィルタモジュ -ル（# c)

240 第 2フィルタモジュ -ル（# D)

500 ノッファ

610 第 1セレクタ 620 第 2セレクタ

630 第 3セレクタ

640 垂直フィルタ処理部

650 水平フィルタ処理部

700、 800 半導体集積回路

710、 810 2次元フィルタ演算部

720 CPU

730 符号化 Z復号部

740、 908、 911 メモリ

750 機能回路部

811 再構成フィルタ処理部

812 構成情報レジスタ

900 携帯電話システム

901 アンテナ

902 RF回路

903 スピーカ

904 マイク

905 ベースバンド LSI

906 キー

907 USB

909 カメラ

910 アプリケーション LSI

912 SDカード

913 LCDコントローラ

914 メイン LCD

915 サブ LCD

発明を実施するための最良の形態

以下図面を参照しながら、本発明の実施の形態を説明する。 [0046] (実施の形態 1)

本発明の実施の形態 1は、例として、 H. 264 I MPEG -4 AVCに準拠した動き補償予測演算における 2次元フィルタ処理を扱う。

[0047] なお、本発明は、一般的な 2次元フィルタ演算に適用できるものであり、本形態に限定されるものではない。

[0048] 本形態が例示する動き補償予測演算では、（4 X 4)個の整数画素精度の画素からなる画像領域を、動きベクトル（1Z2、 1/2)に従って平行移動して、新たな画像領域を求め、そこに含まれる 1Z2画素精度の画素の画素値を求める。この時、新たな画像領域に含まれる 1Z2画素精度の画素の画素値は、整数画素精度の画素の画素値に対して、 6タップの 2次元フィルタ演算を施すことにより算出する。（以下の記述では、整数画素精度の画素を「整数画素」、 1Z2画素精度の画素を「1Z2画素」と略称する。 )

図 1は、本発明の実施の形態 1における整数画素と 1Z2画素の配置図である。図 1 において、大きい白丸で示される整数画素は、水平方向に整数画素 FOO、 F01、 FO 2· · 'F08の順に並んでおり、垂直方向に整数画素 FOO、 F10、 F20- · 'F80の順に並んでいる。

[0049] 今、図 1の実線の矩形で示される画像領域 A ( (4 X 4)個の整数画素）が、動きべクトル（1Z2、 1/2)に従って破線の矩形で示される画像領域 Bに平行移動すると仮定する。画像領域 Bを規定する画素は、小さい黒丸で示される（4 X 4)個の 1Z2画素である。これらの黒丸で示される 1Z2画素は、ちょうど整数画素の対角線上に位置している。したがって、黒丸で示される 1Z2画素の画素値を水平方向フィルタにより補間するために、小さい白丸で示される 1Z2画素の画素値が必要である。（水平方向フィルタは、 6タップフィルタであり、補間する画素値の画素の左右に位置する 6 個の隣接画素の画素値を必要とする。）さらに、小さい白丸で示される 1Z2画素の画素値は、整数画素 F00〜F88の画素値を用いて、垂直方向フィルタにより補間される。（図 1において、 1Z2画素については、説明に必要なもののみが示されている。）図 2は、本発明の実施の形態 1における 1Z2画素の配置図である。図 2は、符号を見やすくするために、小さい白丸の 1Z2画素（1Z2画素 H20〜H58)とそれらの間にある整数画素の配置を示して、る。

[0050] 図 3は、本発明の実施の形態 1における 1Z2画素の別の配置図である。図 3は、符号を見やすくするために、画像領域 Bに位置する小さい黒丸の 1Z2画素 Ha、 Hb、 Hc、 Hd、 He、 Hf、 Hg、 Hh、 Hi、 Hj、 Hk、 Hm、 Hn、 Hp、 Hq、 Hr (以下、 1,2画素 Ha〜Hrと略記する）のみを示して!/、る。

[0051] 以下に、図 1〜3を参照して、 1Z2画素 Ha〜Hrの画素値を 6タップの 2次元フィルタにより求める過程を説明する。

[0052] 本形態の 2次元フィルタ演算の方法では、最初に、整数画素 F00〜F88に対して垂直方向フィルタ演算を行い、 1Z2画素 H20〜H58を求める。次に、垂直方向フィルタ演算で求めた 1Z2画素 H20〜H58に対して、水平方向フィルタ演算を行い、 1 Z2画素 Ha〜Hrを求める。

[0053] 垂直方向フィルタ演算は、図 1の整数画素 FOO、 F10、 F20 - - .F80を用いて、図 2 の 1Z2画素 H20、 H30、 H40、 H50の画素値の補間を行う。フィルタ演算の式は、

[0054] [数 1] ϋ 1 4 5

[0055] で表される。数式 1において、左辺「Y」は、補間される画素の画素値であり、右辺の変数「ΧΟ〜Χ5」は、補間される画素の上下 (垂直方向フィルタ演算の場合）、または左右 (水平方向フィルタ演算の場合）に隣接するそれぞれ 3個の画素の画素値である

[0056] Η264 | MPEG— 4 AVCの動き補償予測の場合、数式 1の右辺の各係数は、 a

= 1、 b=— 5、 c = 20、 d= 20、 e=— 5、 f= lである。した力 Sつて、数式 1は数式 2と表される。

[0057] [数 2]

Y= X_Q- δ X X ^ 2 0 X X ₂ + 2 0 X X ₃ - 5 X X ₄ + X ₅

[0058] 例えば、 1Z2画素 Η20の画素値「Υ」は、数式 2を用いて、

変数「ΧΟ」に整数画素 FOOの画素値を代入し、

変数「XI」に整数画素 F10の画素値を代入し、変数「X2」に整数画素 F20の画素値を代入し、

変数「X3」に整数画素 F30の画素値を代入し、

変数「X4」に整数画素 F40の画素値を代入し、

変数「X5」に整数画素 F50の画素値を代入して、生成される。

[0059] 同様に、変数「XO〜X5」に代入する画素値の整数画素を 1つずつ下方にずらして

、 1Z2画素 H30、 H40、 H50の画素値を生成することができる。

[0060] 上述した垂直方向フィルタ演算を、整数画素列「F00〜F80」、「F01〜F81」 · · ·「

F08〜F88」の画素の画素値に対して、実行することにより、図 2に示す 1Z2画素列

「Η20〜Η50」、「Η21〜Η51」 · · ·「H28〜H58」の画素の画素値が生成される。

[0061] 次に、上で生成された 1Z2画素 H20〜H58の画素値を用いて、水平方向フィルタ演算を行い、図 3の 1Z2画素 Ha〜Hrの画素値を生成する。フィルタ演算の式は、数式 1と同様であり、係数値も垂直方向フィルタ演算のものと同様である。

[0062] 例えば、 1Z2画素 Haの画素値「Y」は、数式 2を用いて、

変数「ΧΟ」に 1Z2画素 Η20の画素値を代入し、

変数「XI」に 1Z2画素 H21の画素値を代入し、

変数「Χ2」に 1Z2画素 Η22の画素値を代入し、

変数「Χ3」に 1Z2画素 Η23の画素値を代入し、

変数「Χ4」に 1Z2画素 Η24の画素値を代入し、

変数「Χ5」に 1Z2画素 Η25の画素値を代入して、生成される。

[0063] 同様に、変数「ΧΟ〜Χ5」に代入する画素値の 1Z2画素を 1つずつ右方にずらして

、 1Z2画素 Hb、 Hc、 Hdの画素値を生成することができる。

[0064] 上述した水平方向フィルタ演算を、 1Z2画素行「H20〜H28」、「H30〜H38」、「

H40〜H48」、「H50〜H58」の画素の画素値に対して、実行することにより、図 3に示す 1Z2画素 Ha〜Hrの画素値が生成される。

[0065] 次に、本発明の 2次元フィルタ演算装置について説明する。

[0066] 図 4は、本発明の実施の形態 1における 2次元フィルタ演算装置のブロック図である。図 4に示す本形態の 2次元フィルタ演算装置は、画像メモリ 300、ラインメモリ 400、垂直フィルタ処理部 100、ノッファ 500、及び、水平フィルタ処理部 200を備える。垂直フィルタ処理部 100は、第 1フィルタ処理部に相当し、水平フィルタ処理部 200は、第 2フィルタ処理部に相当する。

[0067] 本形態の 2次元フィルタ演算装置は、最初に垂直方向フィルタ演算を行い、次に、水平方向フィルタ演算を行う。勿論、この順序は、逆にしても良い。

[0068] 図 5は、本発明の実施の形態 1における 2次元フィルタ演算方法のフローチャートである。図 5に従って、図 4に示す本形態の 2次元フィルタ演算装置の動作の概要を以下に説明する。

[0069] 図 5のステップ SOで 2次元フィルタ演算処理が開始されると、ステップ S1において、画像メモリ 300からラインメモリ 400へ、画像データ（整数画素の画素値）を読み込む

[0070] ステップ S2において、垂直フィルタ処理部 100は、ラインメモリ 400から整数画素の画素値を読み込み、垂直方向フィルタ演算を行って、 1Z2画素の画素値を求める。この演算により、図 1に示す整数画素列「F00〜F80」、「F01〜F81」' ， '「F08〜F8

8」の画素の画素値から、図 2に示す 1Z2画素列「Η20〜Η50」、「Η21〜Η51」· · ·

「Η28〜Η58」の画素の画素値が生成される。

[0071] ステップ S3において、水平フィルタ処理部 200は、ステップ S2において生成された

1Z2画素 Η20〜Η58の画素値に対して水平方向フィルタ演算を実行して、 1Ζ2画素 Ha〜Hrの画素値を生成する。

[0072] ステップ S4において、水平フィルタ処理部 200は、生成した 1Z2画素 Ha〜Hrの画素値を、画像領域 Bを構成する 1Z2画素の画素データとして、画像メモリ 300に格納し、ステップ S5に移って、処理を終了する。

[0073] 上述した図 5のステップ S1〜ステップ S4までの処理では、ある部分は、互いに重なり合って並列に実行される。以下では、図 4に示す 2次元フィルタ演算装置の動作をさらに詳しく説明する。

[0074] 図 4において、画像メモリ 300は、整数画素の画素値を画像データとして格納している。

[0075] ラインメモリ 400は、画像メモリ 300力ら、水平方向 1ライン分の整数画素の画素値を取り込む。ラインメモリ 400は、この 1ライン分の画素値に含まれている、図 1に示す整数画素 F00〜F08の画素値を、垂直フィルタ処理部 100に順次送る。ラインメモリ 400は、整数画素 F00〜F08の画素値を送り終えると、次の水平方向 1ライン分の整数画素の画素値を取り込む。ラインメモリ 400が、この操作を繰り返すことにより、垂直フィルタ処理部 100には、図 1に示す、整数画素行「F00〜F08」、「F10〜F18」' ' ' 「F80〜F88」の画素の画素値が、順次送られることになる。

[0076] 垂直フィルタ処理部 100は、整数画素列「F00〜F80」、「F01〜F81」 · · ·「F08〜 F88」に対して、垂直方向フィルタ演算を並列に実行する。この処理により、図 2に示す 1Z2画素行「H20〜H28」の画素の画素値が最初に並列に生成され、バッファ 5 00に出力される。次に、 1 2画素行「1130〜1138」、 1Z2画素行「H40〜H48」、最後に、 1Z2画素行「H50〜H58」の各画素の画素値が並列に生成され、それぞれ、バッファ 500に出力される。

[0077] 水平フィルタ処理部 200は、バッファ 500から、 1Z2画素行「H20〜H28」の画素の画素値を取り込み、水平方向フィルタ演算により、 1Z2画素 Ha、 Hb、 Hc、 Hdの画素値を生成する。次に、水平フィルタ処理部 200は、 1Z2画素行「H30〜H38」の画素の画素値を取り込み、 1Z2画素 He、 Hf、 Hg、 Hhの画素値を生成し、 1/2 画素行「H40〜H48」の画素の画素値を取り込み、 1Z2画素 Hi、 Hj、 Hk、 Hmの画素値を生成し、最後に、 1Z2画素行「H50〜H58」の画素の画素値を取り込み、 1 Z2画素 Hn、 Hp、 Hq、 Hrの画素値を生成する。水平フィルタ処理部 200は、生成した 1Z2画素 Ha〜Hrの画素値を、順次、画像メモリ 300に出力する。

[0078] 以上の 2次元フィルタ演算により、図 1に示す画像領域 Bの 1Z2画素 Ha〜Hrの画素値が生成される。

[0079] 次に、本形態の 2次元フィルタ演算装置の垂直フィルタ処理部 100と水平フィルタ処理部 200の構成と動作につヽて述べる。

[0080] 図 6は、本発明の実施の形態 1における垂直フィルタ処理部 100のブロック図である。図 6において、図 4と同様な構成要素については、同一の符号を付すことにより、説明を省略する。

[0081] 図 6に示す本形態の垂直フィルタ処理部 100は、並列に設置された 9個の第 1フィルタモジュール（ # 0) 110〜（ # 8) 190を備える。 [0082] 第 1フィルタモジュール（# 0) 110は、図 1の整数画素列「F00〜F80」に対して、垂直方向フィルタ演算を行い、第 1フィルタモジュール（# 1) 120は、整数画素列「F 01〜F81」に対して、垂直方向フィルタ演算を行い、以下同様に、第 1フィルタモジュール（# 8) 190は、整数画素列「F08〜F88」に対して、垂直方向フィルタ演算を行

[0083] 図 6に示す 9個の第 1フィルタモジュール（# 0) 110〜（# 8) 190は、いずれも同じ構造を有しており、以下に、第 1フィルタモジュール（# 0) 110を例として、それらの構造を説明する。

[0084] 第 1フィルタモジュール（# 0) 110は、縦続接続されたプロセッサエレメント PE10、 PE20、 PE30、 PE40と、これらのプロセッサエレメントの出力を選択するセレクタ 50 とを有している。セレクタ 50は、選択部に相当する。 PE10〜PE40のそれぞれは、クロックに合わせて、それぞれの一方の入力端に、ラインメモリ 400から、画素値が入力される。初段のプロセッサエレメント PE10の他の入力端に係数入力端子 91からフィルタ係数が入力される。 PE10に入力されたフィルタ係数は、クロック〖こ合わせて、それぞれ後段のプロセッサエレメントに転送される。 PE10〜PE40は、クロックに合わせて、入力された画素値とフィルタ係数との積和演算を行い、それぞれの結果を、セレクタ 50に出力する。セレクタ 50は、 PE10〜PE40の出力を順次選択して、ノッファ 500に出力する。以上述べた積和演算の詳細は、タイミング図を参照して、後述する

[0085] 図 7は、本発明の実施の形態 1におけるプロセッサエレメント PE10のブロック図である。 PE20〜PE40も、図 7に示す PE10のブロック図と同じ構成を有する。 PE10〜P E40は、累積加算部に相当する。

[0086] 図 7において、本形態の PE10は、乗算器 11、加算器 12、フリップフロップ 13、及び、フリップフロップ 14を有している。係数入力端子 15には、フィルタ係数が入力され (PE10では係数入力端子 91から）、そのフィルタ係数は、フリップフロップ 13を経由して次のクロック時に係数出力端子 16から後段のプロセッサエレメントに (PE10では、 PE20に）出力される。画素データ入力端子 17には、ラインメモリ 400から、画素値が入力され、乗算器 11において、係数入力端子 15から入力されたフィルタ係数との積が求められる。乗算器 11の演算結果は、加算器 12において、すでに演算されてフリップフロップ 14に累積されている積和値と加算され、フリップフロップ 14の積和値を更新する。最終的な積和値、すなわち、 6個の画素値と 6個のフィルタ係数との積和演算を行った値力 1Z2画素の画素値としてセレクタ 50に出力される。

[0087] 図 8は、本発明の実施の形態 1における 2次元フィルタ演算装置のタイミング図である。図 8において、横軸は、クロック（elk)のサイクル数を示し、縦軸は、図 6に示す垂直フィルタ処理部 100へ入力される画素値とフィルタ係数、垂直フィルタ処理部 100 力出力される画素値、及び、後述の図 9に示す水平フィルタ処理部 200のへ入力される画素値と水平フィルタ処理部 200から出力される画素値を示している。

[0088] 以下に、図 8を参照して、垂直フィルタ処理部 100の垂直方向フィルタ演算を説明する。

[0089] クロック 0において、ラインメモリ 400から PE10の画素データ入力端子 inOに画素値「XO」が入力され、係数入力端子 91から PE10の係数入力端子 inAにフィルタ係数「 a」が入力され、 PE10において以下の演算が実行される。すなわち、乗算器 11において、乗算「a *XO」が実行され、加算器 12において、フリップフロップ 14に累積しておいた積和結果に乗算結果「a *XO」を足し、フリップフロップ 14の積和結果を更新する。この場合は、フリップフロップ 14にはまだ積和結果は累積されていないため、乗算結果「a *XO」そのもの力フリップフロップ 14に保持される。フィルタ係数「a」は、後段の PE20に転送するために、フリップフロップ 13に保持しておく。

[0090] ここで注意すべきことは、図 6の垂直フィルタ処理部 100では、上述のクロック 0における処理力第 1フィルタモジュール（# 0) 110〜（# 8) 190において、同時に実行されていることである。すなわち、図 6のラインメモリ 400からは、図示されていない接続により、第 1フィルタモジュール（ # 1) 120〜（ # 8) 190のそれぞれの PE10〜PE4 0にも並列して画素値が送られる。したがって、図 8の画素値「X0〜X8」は、第 1フィルタモジュール（# 0) 110では、図 1の整数画素 F00〜F80の画素値を表し、第 1フィルタモジュール（# 1) 120では、同じく整数画素 F01〜F81の画素値を表し、以下同様に、第 1フィルタモジュール（# 8) 190では、整数画素 F08〜F88の画素値を表す。その結果、クロック 0において、第 1フィルタモジュール（# 0) 110では、 PE10に乗算結果「a *整数画素 F00の画素値」が保持され、第 1フィルタモジュール（# 1) 1 20では、 PE10に乗算結果「a *整数画素 F01の画素値」が保持され、以下同様に、第 1フィルタモジュール（# 8) 190では、 PE10に乗算結果「a *整数画素 F08の画素値」が保持される。

[0091] この時点で、 1Z2画素行「H20〜H28」のそれぞれの画素の画素値を並列に算出するための 6タップフィルタの最初の 1タップ分の乗算「a *X0」（数式 1の右辺第 1項 )が終了する。

[0092] 次に、クロック 1にお!/、て、ラインメモリ 400から PE10の画素データ入力端子 inOに画素値「XI」が入力され、係数入力端子 91から PE10の係数入力端子 inAにフィルタ係数「b」が入力され、 PE10において以下の演算が実行される。すなわち、乗算器 11にお、て、乗算「b * XI」が実行され、続、て、加算器 12にお!/、て、フリップフロップ 14に累積しておいた積和結果「a *X0」に乗算結果「b * XI」（数式 1の右辺第 2 項）を足し、フリップフロップ 14の積和結果を「a *X0+b *Xl」に更新する。また、フィルタ係数「b」は、フリップフロップ 13に保持しておく。

[0093] 同時に、クロック 1にお!/、て、ラインメモリ 400から PE20の画素データ入力端子 inl に画素値「XI」が入力され、 PE10のフリップフロップ 13から PE20の係数入力端子 i nBにフィルタ係数「a」が入力され、 PE20において以下の演算が実行される。すなわち、乗算器 11において、乗算「a * XI」が実行され、続いて、加算器 12において、フリップフロップ 14に累積しておいた積和結果に乗算結果「a * XI」を足し、フリップフロップ 14の積和結果を更新する。この場合は、フリップフロップ 14にはまだ積和結果は累積されていないため、乗算結果「a * XI」そのもの力フリップフロップ 14に保持される。フィルタ係数「a」は、後段の PE30に転送するために、フリップフロップ 13に保持しておく。

[0094] クロック 1においても、図 6の垂直フィルタ処理部 100では、上述の処理が、第 1フィルタモジュール（# 0) 110〜（# 8) 190において、同時に実行される。すなわち、図 8の画素値「XI」は、第 1フィルタモジュール（# 0) 110では、図 1の整数画素 F10の画素値を表し、第 1フィルタモジュール（# 1) 120では、同じく整数画素 F11の画素値を表し、以下同様に、第 1フィルタモジュール（# 8) 190では、整数画素 F18の画素値を表す。

[0095] 次に、クロック 2において、ラインメモリ 400から PE10の画素データ入力端子 inOに画素値「X2」が入力され、係数入力端子 91から PE10の係数入力端子 inAにフィルタ係数「c」が入力され、 PE10において以下の演算が実行される。すなわち、乗算器 11において、乗算「c *X2」が実行され、続いて、加算器 12において、フリップフロップ 14に累積しておいた積和結果「a *XO + b *Xl」に乗算結果「c *X2」（数式 1の右辺第 3項）を足し、フリップフロップ 14の積和結果を「a * XO +b * XI + c * X2」に更新する。また、フィルタ係数「c」は、フリップフロップ 13に保持しておく。

[0096] 同時に、クロック 2において、ラインメモリ 400から PE20の画素データ入力端子 inl に画素値「X2」が入力され、 PE10のフリップフロップ 13から PE20の係数入力端子 i nBにフィルタ係数「b」が入力され、 PE20において以下の演算が実行される。すなわち、乗算器 11において、乗算「b *X2」が実行され、続いて、加算器 12において、フリップフロップ 14に累積してお、た積和結果「a * XI」に乗算結果「b * X2Jを足し、フリップフロップ 14の積和結果を「a * XI +b * X2Jに更新する。フィルタ係数「b」は、後段に転送するために、フリップフロップ 13に保持しておく。

[0097] さらに同時に、クロック 2において、ラインメモリ 400から PE30の画素データ入力端子 in2に画素値「X2」が入力され、 PE20から PE30の係数入力端子 inCにフィルタ係数「a」が入力され、 PE30において以下の演算が実行される。すなわち、乗算器 1 1において、乗算「a *X2」が実行され、続いて、加算器 12において、フリップフロップ 14に累積しておいた積和結果に乗算結果「a *X2」を足し、フリップフロップ 14の積和結果を更新する。この場合は、フリップフロップ 14にはまだ積和結果は累積されていないため、乗算結果「a *X2」そのもの力フリップフロップ 14に保持される。フィルタ係数「a」は、後段の PE40に転送するために、フリップフロップ 13に保持しておく

[0098] クロック 2においても、図 6の垂直フィルタ処理部 100では、上述の処理が、第 1フィルタモジュール（# 0) 110〜（# 8) 190において、同時に実行される。すなわち、図 8の画素値「X2」は、第 1フィルタモジュール（# 0) 110では、図 1の整数画素 F20の画素値を表し、第 1フィルタモジュール（# 1) 120では、同じく整数画素 F21の画素値を表し、以下同様に、第 1フィルタモジュール（# 8) 190では、整数画素 F28の画素値を表す。

[0099] 次に、クロック 3において、ラインメモリ 400から PE10の画素データ入力端子 inOに画素値「X3」が入力され、係数入力端子 91から PE10の係数入力端子 inAにフィルタ係数「d」が入力され、 PE10において以下の演算が実行される。すなわち、乗算器 11において、乗算「d *X3」が実行され、続いて、加算器 12において、フリップフロップ 14に累積してお!、た積和結果「a * XO + b * XI + c * X2」に乗算結果「d * X3」（数式 1の右辺第 4項）を足し、フリップフロップ 14の積和結果を「a *XO+b *Xl + c *X2 + d *X3」に更新する。また、フィルタ係数「d」は、フリップフロップ 13に保持しておく。

[0100] 同時に、クロック 3において、ラインメモリ 400から PE20の画素データ入力端子 inl に画素値「X3」が入力され、 PE10から PE20の係数入力端子 inBにフィルタ係数「c 」が入力され、 PE20において以下の演算が実行される。すなわち、乗算器 11において、乗算「c *X3」が実行され、続いて、加算器 12において、フリップフロップ 14に累積してぉ、た積和結果「a * XI +b * X2Jに乗算結果「c * X3Jを足し、フリップフロップ 14の積和結果を「a * XI +b * X2 + c * X3」に更新する。フィルタ係数「c」は、後段に転送するために、フリップフロップ 13に保持しておく。

[0101] さらに同時に、クロック 3において、ラインメモリ 400から PE30の画素データ入力端子 in2に画素値「X3」が入力され、 PE20から PE30の係数入力端子 inCにフィルタ係数「b」が入力され、 PE30において以下の演算が実行される。すなわち、乗算器 1 1において、乗算「b *X3」が実行され、続いて、加算器 12において、フリップフロップ 14に累積してお!、た積和結果「a * X2Jに乗算結果「b * X3Jを足し、フリップフロップ 14の積和結果を「a *X2+b *X3」更新する。フィルタ係数「b」は、後段に転送するために、フリップフロップ 13に保持しておく。

[0102] さらに同時に、クロック 3において、ラインメモリ 400から PE40の画素データ入力端子 in3に画素値「X3」が入力され、 PE30から PE40の係数入力端子 inDにフィルタ係数「a」が入力され、 PE30において以下の演算が実行される。すなわち、乗算器 1 1において、乗算「a *X3」が実行され、続いて、加算器 12において、フリップフロップ 14に累積しておいた積和結果に乗算結果「a*X3」を足し、フリップフロップ 14の積和結果を更新する。この場合は、フリップフロップ 14にはまだ積和結果は累積されていないため、乗算結果「a*X2」そのもの力フリップフロップ 14に保持される。

[0103] クロック 3においても、図 6の垂直フィルタ処理部 100では、上述の処理が、第 1フィルタモジュール（#0)110〜（# 8) 190において、同時に実行される。すなわち、図 8の画素値「X3」は、第 1フィルタモジュール（#0)110では、図 1の整数画素 F30の画素値を表し、第 1フィルタモジュール（# 1) 120では、同じく整数画素 F31の画素値を表し、以下同様に、第 1フィルタモジュール（#8) 190では、整数画素 F38の画素値を表す。

[0104] 以下同様な処理を繰り返すと、第 1フィルタモジュール（#0)110〜（# 8) 190の各々に対して、

クロック 4において、

PE10には、積和結果「a*X0+b*Xl + c*X2 + d*X3 + e*X4」が保持され、 PE20には、積和結果「a * XI + b * X2 + c * X3 + d * X4」が保持され、 PE30には、積和結果「a * X2 + b * X3 + c * X4」が保持され、

PE40には、積和結果「a * X3 + b * X4」が保持される。

[0105] クロック 5において、

PE10には、積和結果「a*X0 + b*Xl + c*X2 + d*X3 + e*X4 + f*X5」が保持され、

PE20には、積和結果「a*Xl+b*X2 + c*X3 + d*X4 + e*X5」が保持され、 PE30には、積和結果「a * X2 + b * X3 + c * X4 + d * X5」が保持され、 PE40には、積和結果「a * X3 + b * X4 + c * X5」が保持される。

[0106] クロック 5において、 PE10は、数式 1の右辺 6項の演算を終了する。

[0107] クロック 6において、セレクタ 50は、 PE10の出力を選択し、垂直フィルタ処理部 100 のフィルタ出力として画素値「Y0」をバッファ 500に送る。

[0108] クロック 6において、図 8の画素値「Υ0」は、第 1フィルタモジュール（#0) 110では、図 2の 1Z2画素 Η20の画素値を表し、第 1フィルタモジュール（# 1) 120では、 1/ 2画素 H21の画素値を表し、以下同様に、第 1フィルタモジュール（#8) 190では、 1 Z2画素 H28の画素値を表す。

[0109] このように、クロック 6において、第 1フィノレタモジユーノレ（#0)110〜（# 8) 190における最初の垂直方向フィルタ演算「a*X0 + b*Xl+c*X2 + d*X3 + e*X4 + f

*X5」が終了し、 1Z2画素行「H20〜H28」の各画素の画素値が垂直フィルタ処理咅力ら、ノッファ 500に送られる。

[0110] 続いて、クロック 7において、第 1フィルタモジュール（#0)110〜（# 8) 190における垂直方向フィルタ演算「a*Xl+b*X2 + c*X3 + d*X4 + e*X5 + f*X6」が終了し、 1Z2画素行「H30〜H38」の各画素の画素値が垂直フィルタ処理部 100から、バッファ 500に送られる。

[0111] さらに、クロック 8において、第 1フィルタモジュール（#0)110〜（# 8) 190における垂直方向フィルタ演算「a*X2+b*X3 + c*X4 + d*X5 + e*X6+f*X7」が終了し、 1Z2画素行「H40〜H48」の各画素の画素値が垂直フィルタ処理部 100から、バッファ 500に送られる。

[0112] 最後に、クロック 9において、第 1フィルタモジュール（#0)110〜（# 8) 190における垂直方向フィルタ演算「a*X3+b*X4 + c*X5 + d*X6 + e*X7+f*X8」が終了し、 1Z2画素行「H50〜H58」の各画素の画素値が垂直フィルタ処理部 100から、バッファ 500に送られる。

[0113] なお、クロック 7以降では、以下に述べる水平方向フィルタ演算が垂直方向フィルタ演算と並行して実行される。

[0114] 図 9は、本発明の実施の形態 1における水平フィルタ処理部のブロック図である。図

9において、図 4と同様な構成要素については、同一の符号を付すことにより、説明を省略する。

[0115] 図 9に示す本形態の水平フィルタ処理部 200は、セレクタ 250、第 2フィルタモジュ一ノレ（#A) 210、（#B)220、（#C)230、（#D)240、及び、フリップフロップ 260 〜280を備える。第2フィルタモジュール（#八）210〜（#0)240は、同じ構造を有している。以下に第 2フィルタモジュール（#A) 210の構造を説明する。

[0116] 図 9に示すように、第 2フィノレタモジユーノレ（#A) 210は、カロ算器 211、 212、 213、 217、 218、乗算器 214、 215、 216、及び、フリップフロップ 219を有する。第 2フィルタモジュール（# A) 210は、数式 3で示される、水平方向フィルタ演算を行う。

[0117] [数 3]

F= ( ₀+ ₅ ) - 5 X ( X , + , ) + 2 0 Xは 2 + J

[0118] 数式 3は、数式 2のように、フィルタ演算が左右対称の係数を有する場合、同じ係数の項をまとめて表現したものである。

[0119] 図 9において、セレクタ 250は、バッファ 500に出力された垂直方向フィルタ演算結果力画素値を選択し、加算器 211には画素値「XO」、「X5」を送り、加算器 212には、画素値「XI」、「X4」を送り、カロ算器 213には、画素値「X2」、「X3」を送る。

[0120] フリップフロップ 260には、フィルタ係数「1」が保持されており、乗算器 214は、フリップフロップ 260の出力「 1」と加算器 211の出力「XO +X5」を乗算して、乗算結果「

XO+X5Jを加算器 217に送る。

[0121] フリップフロップ 270には、フィルタ係数「― 5」が保持されており、乗算器 215は、フリップフロップ 270の出力「— 5」と加算器 212の出力「XI +X4」を乗算して、乗算結果「（ー5) * ( 1 + 4)」を加算器217に送る。

[0122] フリップフロップ 280には、フィルタ係数「20」が保持されており、乗算器 216は、フリップフロップ 280の出力「20」と加算器 213の出力「X2+X3」を乗算して、乗算結果「

20 * (X2+X3)」を加算器 217に送る。

[0123] 加算器 217は、乗算器 214の出力「XO+X5」と乗算器 215の出力「（— 5) * (XI

+X4)」の和を取り、和算結果「（XO+X5)—5 * (Xl +X4)」を出力する。

[0124] カロ算器 218は、加算器 217の出力「（XO+X5)—5 * (XI +X4)」と乗算器 216の出力「20 * (X2+X3)」の和を取り、和算結果「（XO+X5)— 5 * (Xl +X4) + 20 *

(X2+X3)」を、フリップフロップ 219に出力する。この和算結果は、数式 3の右辺に等しぐしたがって、水平方向フィルタ演算結果「Y」である。

[0125] フリップフロップ 219は、水平方向フィルタ演算結果「Υ」を出力する。

[0126] 水平フィルタ処理部 200では、第 2フィルタモジュール（ # Β) 220、第 2フィルタモジユール（ # C) 230、第 2フィルタモジュール（ # D) 240も、上述した第 2フィルタモジュール（#Α) 210と同様の動作を、同時に並列して実行する。 [0127] 次に、水平フィルタ処理部 200の動作を、図 8に示す本形態の 2次元フィルタ演算装置のタイミング図に従って説明する。

[0128] クロック 6において、垂直フィルタ出力として画素値「YO」、すなわち、 1Z2画素行「

Η20〜Η28」の各画素の画素値が垂直フィルタ処理部 100から、バッファ 500に送られている。

[0129] クロック 7において、セレクタ 250は、バッファ 500に格納されている 1Z2画素行「Η

20〜Η28」の各画素の画素値を次のように選択して、第 2フィルタモジュール（ # Α)

210〜（# D) 240に送る。

[0130] すなわち、セレクタ 250は、

画素値 X0〜X5として、 1Z2画素 H20〜H25の画素値を選択して第 2フィルタモジユール（#A) 210に送り、

画素値 X0〜X5として、 1Z2画素 H21〜H26の画素値を選択して第 2フィルタモジユール（# B) 220に送り、

画素値 X0〜X5として、 1Z2画素 H22〜H27の画素値を選択して第 2フィルタモジユール（# C) 230に送り、

画素値 X0〜X5として、 1Z2画素 H23〜H28の画素値を選択して第 2フィルタモジユール（# D) 240に送る。

[0131] 第 2フィルタモジュール（ #A) 210は、入力された画素値とフィルタ係数との積和演算を行い、画素値 Z0を求め、フリップフロップ 219〖こ送る。

[0132] 次のクロック 8において、第 2フィルタモジュール（#A) 210は、画素値「Z0」を 1/2 画素 Haの画素値として出力する。

[0133] 同様に、クロック 8において、第 2フィルタモジュール（# B) 220は、画素値「Z0」を 1

Z2画素 Hbの画素値として出力し、第 2フィルタモジュール（# C) 230は、画素値「Z

0」を 1Z2画素 Heの画素値として出力し、第 2フィルタモジュール（# D) 240は、画素値「Z0」を 1Z2画素 Hdの画素値として出力する。

[0134] このように、クロック 8において、水平フィルタ出力「Z0」が求まり、第 2フィルタモジュール（#八）210〜（# 0) 240から、 1Z2画素 Ha、 Hb、 Hc、 Hdの画素値がそれぞれ並列に出力される。 [0135] また、クロック 8において、セレクタ 250は、バッファ 500に格納されている 1Z2画素行「H30〜H38」の各画素の画素値を選択して、第 2フィルタモジュール（#A) 210 〜（# D) 240に送る。

[0136] クロック 9において、第2フィルタモジュール（#八）210〜（# 0) 240ぉぃて、水平フィルタ出力「Z1」が求まり、 1Z2画素 He、 Hf、 Hg、 Hhの画素値がそれぞれ並列に出力される。

[0137] また、クロック 9において、セレクタ 250は、バッファ 500に格納されている 1/2画素行「H40〜H48」の各画素の画素値を選択して、第 2フィルタモジュール（#A) 210 〜（# D) 240に送る。

[0138] クロック 10において、第2フィルタモジュール（#八）210〜（# 0) 240にぉぃて、水平フィルタ出力「Z2」が求まり、 1Z2画素 Hi、 Hj、 Hk、 Hmの画素値がそれぞれ並列に出力される。

[0139] また、クロック 10において、セレクタ 250は、バッファ 500に格納されている 1Z2画素行「H50〜H58」の各画素の画素値を選択して、第 2フィルタモジュール（#A) 21 0〜（# D) 240に送る。

[0140] クロック 11において、第2フィルタモジュール（#八）210〜（# 0) 240にぉぃて、水平フィルタ出力「Z3」が求まり、 1Z2画素 Hn、 Hp、 Hq、 Hrの画素値がそれぞれ並列に出力される。

[0141] 以上説明したように、本形態の 2次元フィルタ演算装置では、垂直フィルタ処理部 1 00と水平フィルタ処理部 200とが、異なる並列処理方式を採用して、図 8に示すタイミング図に従った 2次元フィルタ演算を実行する。その結果、本形態の 2次元フィルタ演算装置は、クロックの 13周期で、整数画素 F00〜F88を用いて、 1Z2画素 Ha〜 Hrを求めることができる。この処理サイクルは、従来の 2次元フィルタ演算装置のそれに比べ、約 10%以上改善されている。図 8に示す記号「*」のところでは、次の画像領域 Bに属する 1Z2画素 Ha〜Hrの画素値生成のためのフィルタ演算を実行できる。したがって、本形態の 2次元フィルタ演算装置は、実効的な処理サイクルをさらに改善できる。

[0142] 本形態の 2次元フィルタ演算装置では、垂直フィルタ処理部 100は、並列処理方式として、ループ内パイプライン処理 (すなわち、順次演算処理)を実行し（図 6)、水平フィルタ処理部 200は、並列処理方式として、ループ内並列処理（すなわち、並列演算処理)を実行している（図 9)。

[0143] なお、本形態の 2次元フィルタ演算装置は、左右対称の 6タップフィルタを用いたが、タップフィルタは、本例に限定されるものではない。

[0144] 例えば、水平フィルタ処理部 200が、非対称の 4タップフィルタを用いる場合は、水平フィルタ処理部 200は、図 9のブロック図において、類似の構成のまま、乗算器と加算器とフリップフロップをそれぞれ一つ追加すればよい。さらに、水平フィルタ処理部 200は、非対称なタップフィルタ、または、 6タップ以上のタップフィルタに対応するために、ループ内並列処理の並列度を増やすこともできる。また、垂直フィルタ処理部 100も同様に、採用するフィルタの構造に従って、 PE10〜PE40の構造を変えることができる。

[0145] なお、本形態の 2次元フィルタ演算装置において、処理対象の画像データが準拠する規格が決まっている場合、垂直フィルタ処理部 100と水平フィルタ処理部 200とが備える乗算器を、シフタと加算器に置き換えてもよい。

[0146] また、垂直方向フィルタ演算の後にクリップ処理が必要な場合は、垂直フィルタ処理部 100の第 1フィルタモジュール ( # 0) 110〜（ # 8) 190にお!/、て、 PE10〜PE4 0の各出力端子にクリップ演算回路を挿入すればよい。

[0147] さらに、本形態の 2次元フィルタ演算装置では、垂直フィルタ処理部 100が、第 1フィルタモジュール（# 0) 110〜第 1フィルタモジュール（# 8) 190を用いて 9重の並列処理を行ない、水平フィルタ処理部 200力第 2フィルタモジュール（# A) 210〜第 2 フィルタモジュール（# D) 240を用いて 4重の並列処理を行っている。し力し、垂直フィルタ処理部 100と水平フィルタ処理部 200が実行する並列処理の並列度は、使用目的に応じて、適宜変更して良い。たとえば、垂直フィルタ処理部 100は、複数の第 1フィルタモジュールを用い、水平フィルタ処理部 200は、 1つの第 2フィルタモジユールを用いる構造でも良い。この場合でも、フィルタ処理方向の違いを吸収するためのバッファが不要で、使用目的にあった 2次元フィルタ演算装置を実現できる。

[0148] 以上述べたように、本形態の 2次元フィルタ演算装置は、垂直方向フィルタ処理と水平方向フィルタ処理とを、互いに異なる並列処理方式 (順次演算処理と並列演算処理）によって実行している。したがって、本形態の 2次元フィルタ演算装置は、従来技術で必要とされたフィルタ処理方向の違いを吸収するためのバッファを用いることなぐ垂直 ·水平方向のフィルタ処理を連続的に実行できる（本形態のバッファ 500は、単にタイミング調整のために挿入されたものである)。その結果、本形態の 2次元フィルタ演算装置は、 2次元フィルタ演算を高速に実行することができ、さらに、その回路面積を縮小できる。

[0149] (実施の形態 2)

図 10は、本発明の実施の形態 2における 2次元フィルタ演算装置のブロック図である。本形態の 2次元フィルタ演算装置は、画像メモリ 300、ラインメモリ 400、垂直フィルタ処理部 640、水平フィルタ処理部 650、第 1セレクタ 610、第 2セレクタ 620、及び、第 3セレクタ 630を備える。

[0150] 本形態の 2次元フィルタ演算装置は、 2つの動作モードを有する。すなわち、第 1動作モードの場合は、垂直方向フィルタ演算を先に実行し、水平方向フィルタ演算を次に実行する。第 2動作モードの場合は、水平方向フィルタ演算を先に実行し、垂直方向フィルタ演算を次に実行する。すなわち、本形態の 2次元フィルタ演算装置は、動作モードの切替えにより、垂直方向フィルタ演算と水平方向フィルタ演算の順序を任意に変更できる。これは、 MPEG— 4 ASP (Advanced Simple Profile)などのように、必ず水平方向から先にフィルタをかけるという制約をもつ規格にも柔軟に対応するためである。

[0151] 先ず、第 1動作モードについて説明する。第 1動作モードでは、本形態の 2次元フィルタ演算装置は、先に垂直方向フィルタ演算を実行する。第 1セレクタ 610は、ラインメモリ 400の出力を選択し、第 2セレクタ 620は、垂直フィルタ処理部 640の出力を選択し、第 3セレクタ 630は、水平フィルタ処理部 650の出力を選択する。

[0152] 垂直フィルタ処理部 640と水平フィルタ処理部 650は、それぞれ、本発明の実施の形態 1で説明した、図 6に示す垂直フィルタ処理部 100と図 9に示す水平フィルタ処理部 200とを用いることができる。なお、ノッファ 500は、セレクタ 250の一部として、水平フィルタ処理部 650に含まれて!/ヽる。 [0153] この構成により、本形態の 2次元フィルタ演算装置は、先ず垂直方向フィルタ演算を行い、図 1に示した、 1Z2画素 H20〜H58の画素値を求め、次に、水平方向フィルタ演算を行い、図 3に示した 1Z2画素 Ha〜Hrの画素値を求めることができる。本形態の 2次元フィルタ演算装置の第 1モードでの処理過程は、本発明の実施の形態 1の 2次元フィルタ演算装置における処理過程と同様であり、クロックの 13周期で、整数画素 F00〜F88を用いて、 1/2画素 Ha〜Hrを求めることができる。

[0154] 次に、第 2動作モードについて説明する。第 2動作モードでは、本形態の 2次元フィルタ演算装置は、先に水平方向フィルタ演算を実行する。第 1セレクタ 610は、水平フィルタ処理部 650の出力を選択し、第 2セレクタ 620は、ラインメモリ 400の出力を選択し、第 3セレクタ 630は、垂直フィルタ処理部 640の出力を選択する。

[0155] 図 11は、本発明の実施の形態 2における整数画素と 1Z2画素の配置図である。図 11は、第 2動作モードにおける画素値生成の手順を示す説明図である。図 1に示す本発明の実施の形態 1と同様に、本形態の 2次元フィルタ演算装置は、実線の矩形で示される画像領域 Aから、動きベクトル（1/2、 1/2)に従って平行移動した、点線の矩形で示される画像領域 Bを構成する 1Z2画素 Ha〜Hr (符号は、図 3を参照のこと）の画素値を生成する。

[0156] 第 2動作モードの場合、図 11に示すように、水平方向フィルタ演算により、整数画素 F00〜F88の画素値を用いて、 1Z2画素 H02〜H85の画素値を生成し、次に、垂直方向フィルタ演算により、 1Z2画素 H02〜H85の画素値を用いて、 1Z2画素 Ha〜Hrの画素値を生成する。

[0157] 図 10の垂直フィルタ処理部 640と水平フィルタ処理部 650は、それぞれ、本発明の実施の形態 1で説明した、図 6に示す垂直フィルタ処理部 100と図 9に示す水平フィルタ処理部 200とを用いることができる。なお、ノッファ 500は、なくても良ぐセレクタ 250力ラインメモリ 400から画素値を並列に入力できれば良い。また、図 6のラインメモリ 400は、なくてもよく、第 1フィルタモジュール（# 0) 110〜（# 8) 190力第 1セレクタ 610を介して、水平フィルタ処理部 200が生成した画素値 Z0〜Z3を、並列に入力できれば良い。

[0158] 第 2動作モードにお!、て、水平フィルタ処理部 200は、ラインメモリ 400力ら、整数画素行「F00〜F08」の画素の画素値を読み出し、 1Z2画素 H02〜H05の画素の画素値を生成する。続いて、水平フィルタ処理部 200は、ラインメモリ 400力ら、整数画素行「F10〜F18」の画素の画素値を読み出し、 1Z2画素 H12〜H15の画素の画素値を生成する。以下同様に、水平フィルタ処理部 200は、 1Z2画素の内、図 11 の小さい白丸の 1Z2画素の画素値を、 1Z2画素 H82〜H85まで、各行ごとに 4個の 1Z2画素の画素値を並列に生成する。

[0159] 水平フィルタ処理部 200が並列に生成した、 1Z2画素行「H02〜H05」「H12〜H 15] · · ·「H82〜H85」の各行の 4個の画素の画素値は、垂直フィルタ処理部 100の第 1フィルタモジュール（ # 0) 110〜（ # 3) 130 (図示せず）のそれぞれの PE10〜P E40に、並列に入力される。

[0160] 垂直フィルタ処理部 100の第 1フィルタモジュール（# 0) 110は、図 11に示す、 1/ 2画素列「H02〜H82」の画素の画素値を用いて、 1Z2画素 Ha、 He、 Hi、 Hnの画素値を生成する。第 1フィルタモジュール（# 1) 120は、 1Z2画素列「H03〜H83」の画素の画素値を用いて、 1Z2画素 Hb、 Hf、 Hj、 Hpの画素値を生成する。第 1フィルタモジュール（ # 2) 130 (図示せず）は、 1Z2画素列「H04〜H84」の画素の画素値を用いて、 1Z2画素 Hc、 Hg、 Hk、 Hqの画素値を生成する。第 1フィルタモジユール（ # 3) 140 (図示せず）は、 1Z2画素列「H05〜H85」の画素の画素値を用いて、 1/2画素 Hd、 Hh、 Hm、 Hrの画素値を生成する。なお、第 1フィルタモジュール（# 4) (図示せず）〜第 1フィルタモジュール（# 8) 190は、使用しない。

[0161] 以上の処理により、画像領域 Bを規定する 1Z2画素 Ha〜Hrすべての画素値が求まる。

[0162] 本形態の 2次元フィルタ演算装置の第 2動作モードにおける、処理の流れをタイミング図に従って、さらに詳しく説明する。

[0163] 図 12は、本発明の実施の形態 2における 2次元フィルタ演算装置 (第 2動作モード）のタイミング図である。図 6、図 9、図 10、及び、図 11を参照して、図 12のタイミング図を説明する。

[0164] 第 2動作モードでは、ラインメモリ 400から水平フィルタ処理部 200のセレクタ 250に画像データが入力され、水平フィルタ処理部 200の出力が垂直フィルタ処理部 100 に入力される。

[0165] クロック 0において、ラインメモリ 400から水平フィルタ処理部 200に画素値「YO」（整数画素 F00〜F08の画素値）が入力される。すなわち、セレクタ 250を介して、第 2フィルタモジュール（# A) 210に整数画素 FOO〜F05の画素値が入力され、第 2フィルタモジュール（ # B) 220に整数画素 F01〜F06の画素値が入力され、第 2フィルタモジュール（ # C) 230に整数画素 F02〜F07の画素値が入力され、第 2フィルタモジュール（ # D) 240に整数画素 F03〜F08の画素値が入力される。各モジュール（ # A 〜# D)では、入力された画素値と、フリップフロップ 260、フリップフロップ 270、フリップフロップ 280が出力する各フィルタ係数との積和演算 (数式 3)が実行される。

[0166] クロック 1において、水平フィルタ処理部 200は、水平方向フィルタ処理を行った画素値「Z0」を出力する。すなわち、第 2フィルタモジュール（# A) 210は、整数画素 F 00〜F05の画素値から生成された 1Z2画素 H02の画素値を出力し、第 2フィルタモジュール（ # B) 220は、整数画素 F01〜F06の画素値から生成された 1Z2画素 H0 3の画素値を出力し、第 2フィルタモジュール（# C) 230は、整数画素 F02〜F07の画素値から生成された 1Z2画素 H04の画素値を出力し、第 2フィルタモジュール（ # D) 240は、整数画素 F03〜F08の画素値から生成された 1Z2画素 H05の画素値を出力する。

[0167] 同時にクロック 1において、ラインメモリ 400から水平フィルタ処理部 200に画素値「 Y1J (整数画素 F10〜F18の画素値）が入力される。すなわち、セレクタ 250を介して、第 2フィルタモジュール（# A) 210に整数画素 F10〜F15の画素値が入力され、第 2フィルタモジュール（# B) 220に整数画素 F11〜F16の画素値が入力され、第 2フィルタモジュール（# C) 230に整数画素 F12〜F17の画素値が入力され、第 2フィルタモジュール（ # D) 240に整数画素 Fl 3〜F 18の画素値が入力される。各モジユール（# A〜 D)では、入力された画素値と、フリップフロップ 260、フリップフロップ 27 0、フリップフロップ 280が出力する各フィルタ係数との積和演算 (数式 3)が実行される。

[0168] クロック 2において、水平フィルタ処理部 200は、水平方向フィルタ処理を行った画素値「Z1」を出力する。すなわち、第 2フィルタモジュール（# A) 210は、 1Z2画素 H 12の画素値を出力し、第 2フィルタモジュール（# B) 220は、 1Z2画素 H13の画素値を出力し、第 2フィルタモジュール（# C) 230は、 1Z2画素 H14の画素値を出力し、第 2フィルタモジュール（# D) 240は、 1Z2画素 H15の画素値を出力する。

[0169] 同時にクロック 2において、ラインメモリ 400から水平フィルタ処理部 200に画素値「 Y3J (整数画素 F20〜F28の画素値）が入力される。以下同様な処理が、クロック 9まで、順次実行される。

[0170] 一方、垂直フィルタ処理部 100においては、クロック 2において、垂直フィルタ処理部 100の PE10の画素データ入力端子 inOに、クロック 1において、水平フィルタ処理部 200から出力された画素値「Z0」が、画素値「X0」として入力され、係数入力端子 9 1から PE10の係数入力端子 inAに入力されたフィルタ係数「a」との積和演算が実行される。すなわち、第 1フィルタモジュール（# 0) 110の PE10の画素データ入力端子 inOに、 1Z2画素 H02の画素値が入力され、第 1フィルタモジュール（ # 1) 120の P E10の画素データ入力端子 inOに、 1Z2画素 H03の画素値が入力され、第 1フィルタモジュール（# 2) (図示せず）の PE10の画素データ入力端子 inOに、 1Z2画素 H 04の画素値が入力され、第 1フィルタモジュール（# 3) (図示せず）の PE10の画素データ入力端子 inOに、 1Z2画素 H05の画素値が入力される。なお、第 1フィルタモジュール（# 4) (図示せず）〜第 1フィルタモジュール（# 8) 190は、使用しない。

[0171] クロック 3において、水平フィルタ処理部 200から出力された画素値「Z1」力画素値「XI」として PE 10に入力され、係数入力端子 91から入力されたフィルタ係数「b」との積和演算が実行される。同時に、水平フィルタ処理部 200から出力された画素値「 Zl」が、画素値「XI」として PE20に入力され、 PE10から入力されたフィルタ係数「a」との積和演算が実行される。すなわち、第 1フィルタモジュール（# 0) 110の PE10の画素データ入力端子 inOと PE20の画素データ入力端子 inlに、 1/2画素 H12の画素値が入力され、第 1フィルタモジュール（# 1) 120の PE10の画素データ入力端子 i ηθと PE20の画素データ入力端子 inlに、 1Z2画素 H13の画素値が入力され、第 1 フィルタモジュール（ # 2) (図示せず）の PE10の画素データ入力端子 inOと PE20の画素データ入力端子 inlに、 1Z2画素 H14の画素値が入力され、第 1フィルタモジユール（ # 3) (図示せず）の PE10の画素データ入力端子 inOと PE20の画素データ入力端子 inlに、 1Z2画素 H15の画素値が入力され、それぞれの PEにおいて積和演算が実行される。

[0172] 以下、第 1フィルタモジュール（# 0) 110〜第 1フィルタモジュール（# 3) (図示せず )の PE10〜PE40において、同様な積和演算を実行し、クロック 8において、垂直フィルタ処理部 100は、画素値「Y0」を出力する。すなわち、第 1フィルタモジュール（ #0) 110は、 1Z2画素 Haの画素値を出力し、第 1フィルタモジュール（# 1) 120は、 1Z2画素 Hbの画素値を出力し、第 1フィルタモジュール（# 2) (図示せず）は、 1 Z2画素 Heの画素値を出力し、第 1フィルタモジュール（# 3) (図示せず）は、 1Z2 画素 Hdの画素値を出力する。

[0173] クロック 9において、垂直フィルタ処理部 100は、画素値「Y1」（1Ζ2画素 He〜： Hh の画素値)を出力する。

[0174] クロック 10において、垂直フィルタ処理部 100は、画素値「Y2」（1Ζ2画素 Hi〜H mの画素値)を出力する。

[0175] クロック 11において、垂直フィルタ処理部 100は、画素値「Y3」（1Ζ2画素 Ηη〜Η rの画素値)を出力する。

[0176] 以上説明したように、本形態の 2次元フィルタ演算装置は、先ず水平方向フィルタ処理、次に垂直方向フィルタ処理の順に、図 12に示すタイミング図に従った 2次元フィルタ演算を実行する。その結果、本形態の 2次元フィルタ演算装置は、第 2動作モードにおいても、クロックの 13周期で、整数画素 F00〜F88を用いて、 1Z2画素 Ha 〜Hrを求めることができる。この処理サイクルは、第 1動作モードにおける処理サイクルと等しい。したがって、本形態の 2次元フィルタ演算装置は、第 1動作モードにおいても、第 2動作モードにおいても、従来の 2次元フィルタ演算装置に比べ、約 10%以上改善された処理速度で、 2次元フィルタ処理を実行できる。

[0177] 本形態の 2次元フィルタ演算装置は、第 1動作モードでは、垂直方向フィルタ演算を先に実行し、水平方向フィルタ演算を次に実行して 2次元フィルタ演算を完遂し、第 2動作モードでは、水平方向フィルタ演算を先に実行し、垂直方向フィルタ演算を次に実行して 2次元フィルタ演算を完遂する。したがって、本形態の 2次元フィルタ演算装置によれば、処理する画像データが準拠する規格に従って動作モードを選択することにより、水平方向フィルタ演算と垂直方向フィルタ演算の順序を容易に変更できる。

[0178] (実施の形態 3)

図 13は、本発明の実施の形態 3における半導体集積回路のブロック図である。

[0179] 本形態の半導体集積回路 700は、 2次元フィルタ演算部 710、 CPU720、符号ィ匕 Z復号部 730、メモリ 740、及び、機能回路部 750を備え、 2次元フィルタ演算部 71 0は、垂直フィルタ処理部 711と水平フィルタ処理部 712を有する。

[0180] 本形態の 2次元フィルタ演算部 710は、本発明の実施の形態 1で説明した、図 4に示す 2次元フィルタ演算装置に相当する。すなわち、本形態の垂直フィルタ処理部 7 11は、図 4の垂直フィルタ処理部 100とラインメモリ 400を含んでいる。本形態の水平フィルタ処理部 712は、図 4の水平フィルタ処理部 200とバッファ 500を含んでいる。

[0181] 2次元フィルタ演算部 710は、被フィルタ画像データに対して、 2次元のフィルタ処理を行い、新しい画素の画素値を生成する。

[0182] 符号ィ匕 Z復号部 730は、動画像を可変長符号化し、符号化画像データを出力する。また、符号ィ匕 Z復号部 730は、符号ィ匕画像データを可変長復号し、復号画像を出力する。

[0183] 符号ィ匕 Z復号部 730は、動画像の符号化における、動き補償予測による予測画像の生成や、符号化画像データの復号における、動きベクトルに基づく動き補償画像の生成において、 2次元フィルタ演算部 710を用いて 2次元フィルタ処理を行い、予測画像や動き補償画像の画素を補間する。

[0184] メモリ 740は、画像メモリ 300に相当し、画像データを格納する。

[0185] 機能回路部 750は、 2次元フィルタ演算部 710と符号化 Z復号部 730の機能以外の機能を有するその他の回路部である。

[0186] 本形態の 2次元フィルタ演算部 710における 2次元フィルタ処理は、本発明の実施の形態 1の 2次元フィルタ演算装置による処理と同じであり、メモリ 740に格納されている被フィルタ画像データに対して、垂直方向フィルタ処理を行い、次に、水平方向フィルタ処理 (あるいは、その逆の順序のフィルタ処理)を行い、動き補償予測した画像データを生成する。 2次元フィルタ演算部 710の動作の詳細は、本発明の実施の形態 1の 2次元フィルタ演算装置と同じであるから、その説明を省略する。

[0187] CPU720は、符号ィ匕 Z復号部 730が行う符号ィ匕 Z復号処理と機能回路部 750が行う処理以外の処理を行う。同時に、 CPU720は、半導体集積回路 700全体の制御を行う。

[0188] 本形態の半導体集積回路 700は、 2次元フィルタ演算部 710が、 2次元フィルタ演算処理のフィルタ処理方向の違いを吸収するためのバッファを必要としないため、従来よりも小さい回路面積で実現でき、消費電力も低く抑えることができる。

[0189] なお、本形態の半導体集積回路 700では、符号化 Z復号部 730が符号化 Z復号処理を行うとした力 CPU720が、符号化 Z復号処理をソフトウェアによって処理しても良い。その場合には、符号ィ匕 Z復号部 730を半導体集積回路 700から割愛できる

[0190] なお、本形態の半導体集積回路 700は、メモリ 740を内部に備えている力半導体集積回路 700は、外部に別個に設けられたメモリを利用しても良い。その場合には、メモリ 740を半導体集積回路 700から割愛できる。

[0191] 本形態の半導体集積回路 700は、例えば、携帯電話、 DVDレコーダ、 HDDレコーダ、テレビ受像機など、動画像データを扱う電子機器に好適に応用できる。

[0192] (実施の形態 4)

図 14は、本発明の実施の形態 4における半導体集積回路のブロック図である。図 1

4において、図 13と同様な構成要素については、同一の符号を付すことにより、説明を省略する。

[0193] 図 14に示す本形態の半導体集積回路 800は、本発明の実施の形態 3の図 13に示す半導体集積回路 700と、大略同じ構成であるが、 2次元フィルタ演算部 810が異なる。すなわち、本形態の 2次元フィルタ演算部 810は、再構成フィルタ処理部 811と構成情報レジスタ 812を有する。

[0194] 再構成フィルタ処理部 811は、再構成ロジックで構成されていて、構成情報レジスタ 812に格納されている構成情報に従って、本発明の実施の形態 2の図 10に示す 2 次元フィルタ演算装置に相当する 2次元フィルタ回路を動的に再構成できる。

[0195] 構成情報レジスタ 812に格納されている構成情報は、少なくとも 2つの構成情報、すなわち、第 1構成情報と第 2構成情報を有する。

[0196] 2次元フィルタ演算部 810は、 2つの動作モード、すなわち、第 1動作モードと第 2動作モードを有する。

[0197] 第 1動作モードが選択された場合は、再構成フィルタ処理部 811は、構成情報レジスタ 812に格納されている第 1構成情報に従って再構成され、メモリ 740に格納されている被フィルタ画像データに対して、垂直方向フィルタ演算を先に実行し、水平方向フィルタ演算を次に実行するようになる。この結果、再構成フィルタ処理部 811は、第 1動作モードにおいては、本発明の実施の形態 2における 2次元フィルタ演算装置の第 1動作モードにおける機能と同じ機能を発揮できる。

[0198] 第 2動作モードが選択された場合は、再構成フィルタ処理部 811は、構成情報レジスタ 812に格納されている第 2構成情報に従って再構成され、メモリ 740に格納されている被フィルタ画像データに対して、水平方向フィルタ演算を先に実行し、垂直方向フィルタ演算を次に実行するようになる。この結果、再構成フィルタ処理部 811は、第 2動作モードにおいては、本発明の実施の形態 2における 2次元フィルタ演算装置の第 2動作モードにおける機能と同じ機能を発揮できる。

[0199] 符号ィ匕 Z復号部 730は、動画像の符号化における、動き補償予測による予測画像の生成や、符号化画像データの復号における、動きベクトルに基づく動き補償画像の生成において、 2次元フィルタ演算部 810を用いて 2次元フィルタ処理を行い、予測画像や動き補償画像の画素を補間する。

[0200] CPU720は、符号ィ匕 Z復号部 730が行う符号ィ匕 Z復号処理と機能回路部 750が行う処理以外の処理を行う。同時に、 CPU720は、半導体集積回路 800全体の制御を行う。

[0201] 本形態の半導体集積回路 800は、 2次元フィルタ演算部 810が、 2次元フィルタ演算処理のフィルタ処理方向の違いを吸収するためのバッファを必要としないため、従来よりも小さい回路面積で実現できる。また、本形態の半導体集積回路 800は、処理する画像データが準拠する規格に従って動作モードを選択することにより、水平方向フィルタ処理と垂直方向フィルタ処理の順序を動的に簡単に変更できる。

[0202] なお、構成情報レジスタ 812に格納されている構成情報は、第 1構成情報と第 2構成情報以外の構成情報を有していても良い。その場合には、 6タップ以外のタップ数を有するタップフィルタによる 2次元フィルタ演算、あるいは、非対称フィルタ係数を有するフィルタによる 2次元フィルタ演算などが実現できる。

[0203] なお、本形態の半導体集積回路 800では、符号化 Z復号部 730が符号化 Z復号処理を行うとした力 CPU720が、符号化 Z復号処理をソフトウェアによって処理しても良い。その場合には、符号ィ匕 Z復号部 730を半導体集積回路 800から割愛できる

[0204] なお、本形態の半導体集積回路 800は、メモリ 740を内部に備えていている力半導体集積回路 800は、外部に別個に設けられたメモリを利用しても良い。その場合には、メモリ 740を半導体集積回路 800から割愛できる。

[0205] 本形態の半導体集積回路 800は、例えば、携帯電話、 DVDレコーダ、 HDDレコーダ、テレビ受像機など、動画像データを扱う電子機器に好適に応用できる。

[0206] (実施の形態 5)

図 15は、本発明の実施の形態 5における携帯電話システム 900のブロック図である

[0207] 本形態の携帯電話システム 900は、主要な構成要素として、アンテナ 901、 RF回路 902、ベースノンド LSI905、カメラ 909、アプリケーション LSI910、メモリ 911、 L CDコントローラ 913、メイン LCD914、及び、サブ LCD915を備える。

[0208] 本形態の携帯電話システム 900の動作を以下に概説する。

[0209] RF回路 902は、外部の相手先携帯電話と通信を行!ヽ、画像データをビットストリームとして、送信したり、受信したりする。また、 RF回路 902は、インターネットから画像データを受信する。

[0210] ベースバンド LSI905は、主として通信処理を行う。

[0211] アプリケーション LSI910は、画像データの処理を行う。アプリケーション LSI910には、本発明の実施の形態 3の半導体集積回路 700、または、実施の形態 4の半導体集積回路 800を、好適に用いることができる。また、アプリケーション LSI910は、被フィルタ画像データを格納するメモリ 911を外部に備えているので、アプリケーション!^ 1910に用いる半導体集積回路 700、または、半導体集積回路 800は、被フィルタ画像データを格納するメモリをそれらの内部に備えて、な、ものでよ!、。

[0212] メイン LCD914は、 LCDコントローラ 913の制御の下、アプリケーション LSI910が処理した画像データと文字データなどを表示する。サブ LCD915は、 LCDコントローラ 913の制御の下、主として文字データを表示する。

[0213] 本形態の携帯電話システム 900では、アンテナ 901経由で RF回路 902が外部の相手先携帯電話から受信した画像データ、あるいは、インターネットから受信した画像データは、ベースバンド LSI905でー且処理された後、アプリケーション LSI910で復号され、復号された復号画像が、メイン LCD914に表示される。また、カメラ 909で撮影された画像は、アプリケーション LSI910で処理され、メイン LCD914に表示されるとともに、アプリケーション LSI910で符号化され、符号化画像データが生成される。この符号化画像データは、ベースバンド LSI905で通信処理された後、 RF回路 9 02から、アンテナ 901経由で相手先携帯電話に送信される。

[0214] 本形態のアプリケーション LSI910は、本発明の実施の形態 3の半導体集積回路 7 00、または、実施の形態 4の半導体集積回路 800を用いているので、受信画像データの復号処理における動き補償の 2次元フィルタ処理、あるいは、カメラで撮影した画像の符号ィ匕処理における動き予測の 2次元フィルタ処理を、効率よく実行できる。また、受信画像データの規格に従って、 2次元フィルタ処理のフィルタ処理方向の順序を簡単に切替えることができる。さらに、本形態のアプリケーション LSI910は、従来よりも小さい回路面積で実現できる。この結果、本形態の携帯電話システム 900は、小型で、柔軟な機能を有する装置として、好適に実現できる。

[0215] 以上、本発明の実施の形態 3の半導体集積回路 700、または、実施の形態 4の半導体集積回路 800を用いる電子機器の応用例として、携帯電話システム 900を取り上げたが、半導体集積回路 700または半導体集積回路 800を用いる電子機器には、携帯電話システム 900の他に、例えば、携帯情報端末 (PDA)、 DVDレコーダ、 H DDレコーダ、テレビ受像機、カーナビゲーシヨンシステム、動画像処理機能つきパソコンなどがある。これらの電子機器においても、本発明の 2次元フィルタ演算部を搭載した半導体集積回路 700または半導体集積回路 800を利用することにより、画像データ処理を効率的に実行できる。産業上の利用可能性

本発明に係わる 2次元フィルタ演算装置は、例えば、動画像処理装置等、画像圧縮伸張処理、ループ内フィルタ処理、走査線変換処理、あるいは、画像平滑化処理を必要とする分野とその応用分野において利用できる。

Claims

請求の範囲

[1] 被フィルタ画像データを格納する記憶部と、

前記記憶部に格納されてヽる被フィルタ画像データに対して、第 1のフィルタ演算を実行する第 1フィルタ処理部と、

前記第 1フィルタ処理部がフィルタ処理した画像データに対して、第 2のフィルタ演算を実行する第 2フィルタ処理部とを備え、

前記第 1フィルタ処理部と前記第 2フィルタ処理部とは、垂直方向フィルタ演算と水平方向フィルタ演算の内の互いに異なるフィルタ演算を実行し、

前記垂直方向フィルタ演算と前記水平方向フィルタ演算とは、互いに異なる並列処理によって実行される 2次元フィルタ演算装置。

[2] 前記並列処理は、被フィルタ画像データに対して、並列に実行される順次演算処理と並列に実行される並列演算処理とを含む、請求の範囲第 1項記載の 2次元フィルタ演算装置。

[3] 前記第 1フィルタ処理部は、複数の第 1フィルタモジュールを有し、

前記第 2フィルタ処理部は、少なくとも 1つの第 2フィルタモジュールを有し、前記複数の第 1フィルタモジュールは、前記被フィルタ画像データに対して前記第

1のフィルタ演算をそれぞれ実行し、前記第 1フィルタ処理部は、複数の第 1フィルタ結果を出力し、

前記少なくとも 1つの第 2フィルタモジュールは、前記複数の第 1フィルタ結果の内の少なくとも一部を入力して、前記第 2のフィルタ演算を実行し、前記第 2フィルタ処理部は、少なくとも 1つの第 2フィルタ結果を出力する、請求の範囲第 1項記載の 2次元フィルタ演算装置。

[4] 前記第 1フィルタ処理部は、前記複数の第 1フィルタモジュールを用いて、前記第 1のフィルタ演算を並列に実行し、

前記第 2フィルタ処理部が複数の第 2フィルタモジュールを有する場合は、前記第 2 フィルタ処理部は、前記複数の第 2フィルタモジュールを用いて、前記第 2のフィルタ演算を並列に実行する、請求の範囲第 3項記載の 2次元フィルタ演算装置。

[5] 前記複数の第 1フィルタモジュールのそれぞれは、初段の累積加算部と少なくとも 1つの後段の累積加算部が縦続接続された複数の累積加算部と、

前記複数の累積加算部のそれぞれの出力を順次選択して、出力する選択部とを有し、

前記初段の累積加算部には、所定のフィルタ係数が、 1処理時間ごとに順次入力され、

前記少なくとも 1つの後段の累積加算部には、それぞれの前段の累積加算部から、前記所定のフィルタ係数が、 1処理時間ごとに順次転送され、

前記複数の累積加算部のそれぞれには、前記被フィルタ画像データの垂直または水平に並んだ画素の画素値力前記記憶部から 1処理時間ごとに順次入力され、前記複数の累積加算部は、それぞれ、 1処理時間ごとに前記画素値と前記所定のフィルタ係数との積和演算を行って、前記複数の第 1フィルタ結果を出力する、請求の範囲第 3項記載の 2次元フィルタ演算装置。

[6] 前記少なくとも 1つの第 2フィルタモジュールは、

複数の加算部と、

複数の積算部とを有し、

前記複数の第 1フィルタ結果の内の少なくとも一部と、所定の複数のフィルタ係数との積和演算を行い、前記少なくとも 1つの第 2フィルタ結果を出力する、請求の範囲第 3項記載の 2次元フィルタ演算装置。

[7] 前記複数の第 1フィルタモジュールは、ループ内パイプライン処理方式とループ内並列処理方式の内の一方の処理方式に従って、前記第 1のフィルタ演算を実行し、前記少なくとも 1つの第 2フィルタモジュールは、前記ループ内パイプライン処理方式と前記ループ内並列処理方式の内、前記複数の第 1フィルタモジュールが従っていない方の処理方式に従って、前記第 2のフィルタ演算を実行する、請求の範囲第 3 項記載の 2次元フィルタ演算装置。

[8] 前記記憶部から 1ライン分の画素の画素値を取得して一時的に格納し、前記第 1フィルタ処理部に出力する、ラインメモリをさらに備える、請求の範囲第 1項記載の 2次元フィルタ演算装置。

[9] 被フィルタ画像データを格納する記憶部と、

垂直方向フィルタ演算を実行する垂直フィルタ処理部と、

水平方向フィルタ演算を実行する水平フィルタ処理部と、

前記記憶部の出力と前記水平フィルタ処理部の出力の内の一つを選択して、前記垂直フィルタ処理部へ出力する第 1選択部と、

前記記憶部の出力と前記垂直フィルタ処理部の出力の内の一つを選択して、前記水平フィルタ処理部へ出力する第 2選択部と、

前記垂直フィルタ処理部の出力と前記水平フィルタ処理部の出力の内の一つを選択して、 2次元フィルタ演算結果として出力する第 3選択部とを備え、

前記垂直方向フィルタ演算と前記水平方向フィルタ演算とは、互いに異なる並列処理によって実行され、

第 1動作モードが選択された場合は、前記第 1選択部は、前記記憶部の出力を選択し、前記第 2選択部は、前記垂直フィルタ処理部の出力を選択し、前記第 3選択部は、前記水平フィルタ処理部の出力を選択し、前記記憶部に格納されている前記被フィルタ画像データに対して、前記垂直方向フィルタ演算が実行された後に、前記水平方向フィルタ演算が実行され、

第 2動作モードが選択された場合は、前記第 1選択部は、前記水平フィルタ処理部の出力を選択し、前記第 2選択部は、前記記憶部の出力を選択し、前記第 3選択部は、前記垂直フィルタ処理部の出力を選択し、前記記憶部に格納されている前記被フィルタ画像データに対して、前記水平方向フィルタ演算が実行された後に、前記垂直方向フィルタ演算が実行される、 2次元フィルタ演算装置。

[10] 前記並列処理は、被フィルタ画像データに対して、並列に実行される順次演算処理と並列に実行される並列演算処理とを含む、請求の範囲第 9項記載の 2次元フィルタ演算装置。

[11] 前記第 1動作モードと前記第 2動作モードの選択は、前記被フィルタ画像データが準拠する動画像符号ィ匕規格に従って実行される、請求の範囲第 9項記載の 2次元フィルタ演算装置。

[12] 被フィルタ画像データを格納する格納ステップと、前記格納ステップにお、て格納されて、る被フィルタ画像データに対して、第 1のフィルタ演算を実行する第 1フィルタ処理ステップと、

前記第 1フィルタ処理ステップにお、てフィルタ処理した画像データに対して、第 2 のフィルタ演算を実行する第 2フィルタ処理ステップとを含み、

前記第 1フィルタ処理ステップと前記第 2フィルタ処理ステップとは、垂直方向フィルタ演算と水平方向フィルタ演算の内の互いに異なるフィルタ演算を実行し、

前記垂直方向フィルタ演算と前記水平方向フィルタ演算とは、互いに異なる並列処理によって実行される 2次元フィルタ演算方法。

[13] 前記並列処理は、被フィルタ画像データに対して、並列に実行される順次演算処理と並列に実行される並列演算処理とを含む、請求の範囲第 12項記載の 2次元フィルタ演算方法。

[14] 前記垂直方向フィルタ演算と前記水平方向フィルタ演算の処理順序を、前記被フィルタ画像データが準拠する動画像符号化規格に従って変更する、請求の範囲第 12 項記載の 2次元フィルタ演算方法。