WO2006103984A1

WO2006103984A1 - 動き検出装置

Info

Publication number: WO2006103984A1
Application number: PCT/JP2006/305672
Authority: WO
Inventors: Masayasu Iguchi; Toshiyasu Sugio; Kyoko Tanikawa
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2005-03-25
Filing date: 2006-03-22
Publication date: 2006-10-05

Abstract

　外部のフレームメモリから内部参照用ローカルメモリへのデータ転送の回数を削減し、かつ電力消費量を抑制することができる動き検出装置を提供する。ＭＢ毎に動き検出処理を１行分行っている間に、次のＭＢ行の動き検出処理で必要とされる参照画素をＭＢ行単位で、外部マルチフレームメモリ（１０３）から参照用ローカルメモリ（１０２）へ転送する参照メモリ制御部（１０１）を備える。

Description

明細書

動き検出装置

技術分野

[0001] 本発明は、ピクチャを構成するブロックの動き検出を行う動き検出装置に関するものである。

背景技術

[0002] 近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになつてきた。一般に、マルチメディアとは、文字だけでなぐ図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。

[0003] ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もつてみると、文字の場合 1文字当たりの情報量は 1〜2バイトであるのに対し、音声の場合 1 秒当たり 64Kbits (電話品質）、さらに動画については 1秒当たり lOOMbits (現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をデイジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、 64Kbit/s〜l .5Mbits/sの伝送速度を持つサービス総合ディジタル網（ISDN： Integrated Services Digital Network)によってすでに実用化されている力テレビ'カメラの映像をそのまま ISDNで送ることは不可能である。

[0004] そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、 I TU-T (国際電気通信連合電気通信標準化部門）で勧告された H. 261や H. 263 規格の動画圧縮技術が用いられている。また、 MPEG- 1規格の情報圧縮技術によると、通常の音楽用 CD (コンパクト 'ディスク）に音声情報とともに画像情報を入れることも可能となる。

[0005] ここで、 MPEG (Moving Picture Experts Group)とは、 ISOZlEC (国際標準化機構国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、 MPE G- 1は、動画像信号を 1. 5Mbpsまで、つまりテレビ信号の情報を約 100分の 1にまで圧縮する規格である。また、 MPEG- 1規格では対象とする品質を伝送速度が主として約 1. 5Mbpsで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化された MPEG-2では、動画像信号を 2〜15Mbpsで TV放送品質を実現する。さらに現状では、 MPEG- 1、 MPEG- 2と標準化を進めてきた作業グループ（ISO/IEC JTC1/SC29/WG11) によって、 MPEG- 1、 MPEG- 2を上回る圧縮率を達成し、更に物体単位で符号化'復号化'操作を可能とし、マルチメディァ時代に必要な新しい機能を実現する MPEG-4が規格ィ匕された。 MPEG-4では、当初、低ビットレートの符号ィ匕方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号ィ匕に拡張されている。

[0006] 更に、 2003年に、 ISOZIECと ITU-Tが共同でより高圧縮率の画像符号化方式として、 MPEG -4AVCおよび H. 264が標準化されている。 H. 264規格は、現在 H D (High Definition)画像などに適した High Profile対応の改正規格案を策定中である。 H. 264規格のアプリケーションとしては、 MPEG-2ゃMPEG-4と同様にディジタル放送、 DVD (Digital Versatile Disk)プレーヤ Zレコーダ、ハードディスクプレーヤ Zレコーダ、カムコーダ、テレビ電話などに広がることが予想されている。

[0007] 一般に動画像の符号ィ匕では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行ヽ、得られた予測画像と符号化対象ピクチヤとの差分値に対して符号化を行う。ここで、ピクチャとは 1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、 1つのフレームが時刻の異なる 2つのフィールドから構成される画像である。インタレース画像の符号ィ匕ゃ復号ィ匕処理においては、 1つのフレームをフレームのまま処理したり、 2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。

[0008] 参照画像を持たず画面内予測符号ィ匕を行うものを Iピクチャと呼ぶ。また、 1枚の参照画像のみを参照し画面間予測符号化を行うものを Pピクチヤと呼ぶ。また、同時に 2枚の参照画像を参照して画面間予測符号ィ匕を行うことのできるものを Bピクチヤと呼ぶ。 Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして 2枚のピクチヤを参照することが可能である。参照画像 (参照ピクチャ）は符号ィ匕の基本単位であるマクロブロックごとに指定することができる力符号ィ匕を行ったビットストリーム中に先に記述される方の参照ピクチャを第 1参照ピクチャ、後に記述される方を第 2参照ピクチャとして区別する。ただし、これらのピクチャを符号ィ匕する場合の条件として、参照するピクチャが既に符号ィ匕されている必要がある。

[0009] Pピクチャ又は Bピクチャの符号ィ匕には、動き補償画面間予測符号化が用いられている。動き補償画面間予測符号化とは、画面間予測符号ィ匕に動き補償を適用した符号ィ匕方式である。動き補償とは、単純に参照フレームの画素値力予測するのではなぐピクチャ内の各部の動き量 (以下、これを動きベクトルと呼ぶ）を検出し、当該動き量を考慮した予測を行うことにより予測精度を向上すると共に、データ量を減らす方式である。例えば、符号ィ匕対象ピクチヤの動きベクトルを検出し、その動きベクトルの分だけシフトした予測値と符号ィ匕対象ピクチヤとの予測残差を符号ィ匕することによりデータ量を減している。この方式の場合には、復号化の際に動きベクトルの情報が必要になるため、動きベクトルも符号ィ匕されて記録又は伝送される。

[0010] 動きベクトルはマクロブロック単位で検出されており、具体的には、符号化対象ピクチヤ側のマクロブロックを固定しておき、参照ピクチャ側のマクロブロックを探索範囲内で移動させ、基準ブロックと最も似通った参照ブロックの位置を見つけることにより、動きベクトルが検出される。

[0011] 図 1は従来の画面間予測符号ィ匕装置の構成を示すブロック図である。

[0012] この画面間予測符号ィ匕装置は、動き検出部 401、マルチフレームメモリ 402、減算部 403、減算部 404、動き補償部 405、符号化部 406、加算部 407、動きベクトルメモリ 408、および動きベクトル予測部 409を備えて!/、る。

[0013] 動き検出部 401は、マルチフレームメモリ 402から出力される動き検出参照画素 ME pelと画面信号 Vinとを比較し、動きベクトル MVと参照ピクチャ番号 RelNoを出力する。参照ピクチャ番号 RelNoは、複数の参照画像の中から選択された、対象画像で参照する参照画像を特定する識別信号である。動きベクトル MVは、動きベクトルメモリ 40 8に一時的に記憶されたのち近傍動きベクトル PrevMVとして動きベクトル予測部 409 へ出力される。動きベクトル予測部 409は、入力された近傍動きベクトル PrevMVを参照して予測動きベクトル PredMVを予測する。減算部 404は動きベクトル MVから予測動きベクトル PredMVを減算し、その差を動きベクトル予測差分 DilMVとして出力する

[0014] 一方、マルチフレームメモリ 402は、参照ピクチャ番号 RelNoおよび動きベクトル MV で示される画素を動き補償参照画素 MCpellとして出力する。動き補償部 405は、小数画素精度の参照画素を生成し、参照画面画素 MCpel2として出力する。減算部 40 3は、画面信号 Vin力参照画面画素 MCpel2を減算し、画面予測誤差 DilPelを出力する。

[0015] 符号ィ匕部 406は、画面予測誤差 DilPelと動きベクトル予測差分 DilMVと参照ピクチャ番号 RelNoを可変長符号ィ匕し、符号化信号 Strを出力する。なお、符号化時に画面予測誤差の復号ィ匕結果である復号画面予測誤差 RecDilPelも同時に出力する。復号画面予測誤差 RecDilPelは、画面予測誤差 DilPelに符号化誤差が重畳されたものであり、画面間予測復号ィ匕装置で符号ィ匕信号 Strを復号化して得られる画面間予測誤差と一致する。

[0016] 力!]算部 407は、参照画面画素 MCpel2に復号画面予測誤差 RecDilPelを加算し、復号画面 RecPelとしてマルチフレームメモリ 402に記憶される。但し、マルチフレームメモリ 402の容量を有効に利用するため、マルチフレームメモリ 402に記憶されている画面の領域は不要な場合は開放され、またマルチフレームメモリ 402に記憶する必要が無!、画面の復号画面 RecPelはマルチフレームメモリ 402に記憶されな!、。

[0017] 図 2は従来の画面間予測復号ィ匕装置の構成を示すブロック図である。なお、同図において、図 1に示す画面間予測符号ィ匕装置と同様の部分については同じ符号を付し、その説明を省略する。

[0018] 図 2に示す従来の画面間予測復号ィヒ装置は、図 1に示す従来の画面間予測符号化装置で符号化された符号化信号 Strを復号化して復号画面信号 Voutを出力する装置であり、マルチフレームメモリ 402、動き補償部 405、加算部 407、加算部 501、動きベクトルメモリ 408、動きベクトル予測部 409、および復号ィ匕部 502を備えている

[0019] 復号ィ匕部 502は、符号化信号 Strを復号化し、復号画面予測誤差 RecDilPel 動きベクトル予測差分 DilMV、および参照ピクチャ番号 RelNoを出力する。加算部 501は、動きベクトル予測部 409から出力される予測動きベクトル PredMVと動きベクトル予測差分 DilMVを加算し、動きベクトル MVを復号する。

[0020] マルチフレームメモリ 402は、参照ピクチャ番号 RelNoおよび動きベクトル MVで示される画素を動き補償参照画素 MCpellとして出力する。動き補償部 405は、小数画素精度の参照画素を生成し、参照画面画素 MCpel2として出力する。加算部 407は、参照画面画素 MCpel2に復号画面予測誤差 RecDilPelを加算し、復号画面 RecPelとしてマルチフレームメモリ 402へ記憶する。但し、マルチフレームメモリ 402の容量を有効に利用するため、マルチフレームメモリ 402に記憶されている画面の領域は不要な場合は開放され、またマルチフレームメモリ 402に記憶する必要が無、画面の復号画面 RecPelはマルチフレームメモリ 402に記憶されない。以上のようにして、復号画面信号 Vout、すなわち復号画面 RecPelを符号ィ匕信号 Strから正しく復号ィ匕することができる。

[0021] ところで、図 1で示した画面間予測符号ィ匕装置を実装するための構成は、一例として例えば特許文献 1などに示されて、る。この特許文献 1にお、て示されて、るように、画面間予測符号化装置を LSIなどで実装する場合には、図 1に示しているマルチフレームメモリ 402は、 LSI外に接続する外部フレームメモリと動き検出部 401でブロックマッチング探索時に直接アクセスする LSI内部のローカルメモリとに分割して実装される。

[0022] 図 3は、上記画面間予測符号ィ匕装置とフレームメモリの接続構成を説明するための概略図である。同図において、図 1と同一符号はと同一のものを示し、その説明を省略する。外部フレームメモリ 412は LSI外に接続する外部フレームメモリである。参照用ローカルメモリ 411は、動き検出部 401でブロックマッチング探索時に直接アクセスする LSI内部のメモリである。 LSI410は画面間予測符号ィ匕装置の LSIに実装される部分である。 [0023] 図 3において動き検出を行う場合、まず外部フレームメモリ 412から探索対象となる画像領域が外部接続バス 414を介して参照用ローカルメモリ 411に転送される。次に参照用ローカルメモリ 411から内部バス 413を介してデータが読み出され、動き検出部 401によって動き検出が行われる。このような構成をとることによって、 LSIの内部メモリ容量を削減している。

[0024] 図 4は、参照用ローカルメモリ 411のデータ構成を示す一例である。例えば、図 4 (a )では、従来の MPEG-2などでSD(Standard Definition)サイズ画像において、 16画素 X 16画素で構成される lMB(Macro Block)のブロックデータが、縦横 1MB分ずつ移動した画素範囲を探索することを想定している。一般的に、外部フレームメモリ 41 2から参照用ローカルメモリ 411への転送処理と、参照用ローカルメモリ 411と動き検出部 401を用いて行う動き検出処理とは、並列動作をさせるようにし全体的な動作速度の向上を図るため、図 4 (a)で斜線に示した更新領域 601も必要となる。なお、図 4 (b)、図 4 (c)及び図 4 (d)はそれぞれ、 H. 264の SDサイズ画像、 MPEG-2の HD サイズ画像及び H. 264の HDサイズ画像を想定した参照用ローカルメモリ 411の状態を表している。

[0025] また、図 5は、 1画面あたりで転送する参照画素の状態を示す模式図である。同図において、 1MB単位（ = 16画素 X 16画素）で動き検出処理を行う場合、 1MB行分の動き検出を行うためには、（探索範囲の縦の長さ） X (1画面の横幅)分のメモリ転送が必要となることを表しており、 1画面分の動き検出を行う時には、さらに 1画面の縦の MB数をかける分のメモリ転送量が必要であることを示している。つまり、図 4 (a) で示した、 MPEG- 2などの SDサイズ画像（720画素 X 480画素、 45MB X 30MB) で、縦横 1MB分ずつ移動した画素範囲を探索範囲とした場合、

(16 + 16 X 2) X 720 X 30= 1, 036, 800

の画素が 1画面あたりの動き検出で転送されることになる。

[0026] また、図 4 (b)は H. 264の SDサイズ画像を想定した参照用ローカルメモリの管理状態であるが、 H. 264では小数画素精度の動き補償には 6タップのフィルタを用いるため、従来の MPEG-2などより周辺画素が多く必要となる（例えば、非特許文献 1 参照。；)。つまり、 MPEG -2などでは小数精度画素位置を囲む 4つの整数画素から小数精度画素を作って、たが、 6タップフィルタの場合 36の整数画素力小数精度画素を作るため、同じ領域で探索を行う場合、 MPEG-2と比べ上 2行、下 2行、左 2 列、右 2列の画素が必要となる。従って、 H. 264などの SDサイズ画像で、縦横 1MB 分ずつ移動した画素範囲を探索範囲とした場合、

(16 + 16 X 2+4) X 720 X 30= 1, 123, 200

特許文献 1：特許第 2963269号公報

非特許文献 l : ISO/IEC 14496-10, International Standard: "Information technology - Coding of audio-visual objects - Part 10： Advanced video coding"(2003- 12- 01) 発明の開示

発明が解決しょうとする課題

[0027] しかしながら、 HDサイズ（1920画素 X 1088画素、 120MB X 68MB)の画像を扱う場合、特に H. 264による符号ィ匕を行う場合には、前述の 1画面あたりの画素転送量が大幅に増加してしま、、図 3に示す外部バス 414の転送能力を超えてしまう可能 '性がある。

[0028] 例えば、図 4 (c)は MPEG-2の HDサイズ画像を想定した参照用ローカルメモリの管理状態である力 HDサイズの画像は SDサイズの画像に対して約 6倍の画素数を持っため、ここでは簡単のため上下、左右それぞれ 2. 5倍の参照領域を探索するものとしている。従って、縦横の探索範囲は縦横 40画素分ずつ移動した画素範囲となり、同様に、

(16 +40 X 2) X I, 920 X 68 = 12, 533, 760

[0029] さらに、図 4 (d)は H. 264の HDサイズ画像を想定した参照用ローカルメモリの管理状態であるので、同様に、

(16 +40 X 2+4) X I, 920 X 68 = 13, 056, 000

[0030] このように、 HDサイズの画像を扱う場合には、 MPEG- 2の SDサイズとは桁違いに多い転送量となり、電力消費量も非常に大きくなつてしまうという課題がある。 [0031] そこで、本発明は上記の事情に鑑みてなされたものであり、外部のフレームメモリから内部参照用ローカルメモリへのデータ転送の回数を削減し、かつ電力消費量を抑制することができる動き検出装置を提供することを目的とする。

課題を解決するための手段

[0032] 上記目的を達成するため、本発明に係る動き検出装置は、ピクチャを構成するプロックの動き検出を行う動き検出装置であって、参照ピクチヤの参照画素データを記憶する第 1記憶手段と、前記第 1記憶手段から転送される前記参照画素データを記憶する第 2記憶手段と、複数の前記ブロックで構成される一ブロック行を少なくとも含むブロック行毎に、転送する参照画素データの範囲を動き検出済みブロックの動き検出

ヽて決定し、決定した範囲の前記参照画素データを複数の画素で構成される一画素行を少なくとも含む画素行単位で前記第 1記憶手段から前記第 2記憶手段へ転送する参照画素転送制御手段と、前記第 2記憶手段に記憶されている前記参照画素データを用いて対象ブロックの動き検出を行う動き検出手段とを備えることを特徴とする。

[0033] これによつて、第 1記憶手段から第 2記憶手段への参照画素データの転送回数を削減することができる。よって、バースト転送等を行うことも可能となり、さらに電力消費量も抑制することができる。また、ブロック行毎の対象ブロックに対する垂直方向の探索中心の相対位置にバラつきがある場合でも、ブロック行毎に第 2記憶手段へ転送する画素領域を変更できるので、第 2記憶手段の実装量を最小限に抑えることができる。

[0034] ここで、前記参照画素転送制御手段は、前記動き検出手段にぉ、て前記ブロック行に含まれる各対象ブロックの動き検出が行われている間に、次のブロック行の動き検出で必要とされる参照画素データの範囲を決定し、決定した範囲の前記参照画素データを前記第 1記憶手段から前記第 2記憶手段へ転送してもよい。これによつて、次のブロック行で必要とされる参照画素データを第 1記憶手段から第 2記憶手段へのデータ転送を、現在のブロック行に含まれる各対象ブロックの動き検出処理と並列に行うことができる。

[0035] また、前記参照画素転送制御手段は、前記動き検出手段において複数ピクチヤが参照される場合には、前記ブロック行に含まれる各対象ブロックの動き検出で必要とされる全ての複数ピクチヤの参照画素データの範囲をそれぞれ決定し、決定した範囲の前記参照画素データをそれぞれ前記第 1記憶手段から前記第 2記憶手段へ転送してもよい。これによつて、複数枚の参照ピクチャを用いた符号ィ匕処理においても、参照枚数分の転送量の増加が必要ではあるが、同様に参照画素データの転送回数を削減することができる。

[0036] また、前記参照画素転送制御手段は、前記対象ブロックと同画素位置である前記参照ピクチヤにおけるブロックを含むブロック行に含まれるブロックおよび前記ブロッタ行の直前のブロック行に含まれるブロックにおいて検出されている垂直方向の動き検出結果に基づ!/、て、転送する参照画素データの範囲を決定してもよ、。

[0037] 前記動き検出装置は、さらに、前記対象ブロックを含むピクチヤに対して簡易的に動き検出を行う簡易検出手段を備え、前記参照画素転送制御手段は、前記簡易検出手段によって検出された前記対象ブロックを含むブロック行に含まれるブロックおよび前記ブロック行の直前のブロック行に含まれるブロックに対応する垂直方向の動き検出結果に基づ!/、て、転送する参照画素データの範囲を決定してもよ、。

[0038] 前記参照画素転送制御手段は、前記対象ブロックを含むブロック行に含まれるプロックまたはブロック行の前のブロック行に含まれるブロックにおいて検出されている垂直方向の動き検出結果に基づいて、転送する参照画素データの範囲を決定してもよい。

[0039] また、前記参照画素転送制御手段は、前記ブロック行に含まれる各対象ブロックの動き検出で必要とされる参照画素データのうち、既に転送されている参照画素データに含まれない差分領域のみを、転送する参照画素データの範囲として決定してもよい。これによつて、参照画素データの重複した転送を無くし、参照画素データの転送量を最小限に抑えることができる。

[0040] なお、本発明は、このような動き検出装置として実現することができるだけでなぐこのような動き検出装置が備える特徴的な手段をステップとする動き検出方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、 CD—ROM等の記録媒体やインタ一ネット等の伝送媒体を介して配信することができるのは言うまでもない。発明の効果

[0041] 以上の説明から明らかなように、本発明に係る動き検出装置によれば、外部のフレームメモリ等の第 1記憶手段から内部参照用ローカルメモリ等の第 2記憶手段へのデータ転送の回数を削減し、かつ電力消費量を抑制することができる。また、外部のフレームメモリ等の第 1記憶手段から内部参照用ロー力ノレメモリ等の第 2記憶手段へのデータ転送のデータ量を最小限に抑えることができる。

図面の簡単な説明

[0042] [図 1]図 1は、従来の画面間予測符号ィ匕装置の構成を示すブロック図である。

[図 2]図 2は、従来の画面間予測復号ィ匕装置の構成を示すブロック図である。

[図 3]図 3は、画面間予測符号ィ匕装置とフレームメモリの接続構成を示すブロック図である。

[図 4]図 4は、参照用ローカルメモリのデータ構成の一例を示す模式図であり、（a)従来の MPEG -2の SDサイズ画像の場合、（b) H. 264の SDサイズ画像の場合、（c) MPEG -2の HDサイズ画像の場合、（d) H. 264の HDサイズ画像の場合である。

[図 5]図 5は、 1画面あたりで転送する参照画素を示す模式図である。

[図 6]図 6は、本発明の実施の形態 1に係る動き補償装置が用いられる画面間予測符号ィ匕装置の構成を示すブロック図である。

[図 7]図 7は、メモリ転送と動き補償予測の動作タイミングを示す概略図である。

[図 8]図 8は、参照用ローカルメモリにおける探索領域と更新領域を示す模式図である。

[図 9]図 9は、実施の形態 1における画面間予測符号化装置の動作の流れを示すフローチャートである。

[図 10]図 10は、参照用ローカルメモリの更新領域の状態を示す模式図である。

[図 11]図 11は、参照用ローカルメモリの更新動作による物理領域の状態を示す模式図であり、（a)参照用ローカルメモリの物理領域の構成、（b)〜（d)、参照用ローカルメモリのメモリ配置の移り変わりを示す一例である。

[図 12]図 12は、ピクチャを複数の領域に分割した場合の参照用ローカルメモリにおける探索領域と更新領域を示す模式図である。

[図 13]図 13は、実施の形態 2における MBAFF処理の動作の流れを示すフローチヤートである。

[図 14]図 14は、参照用ローカルメモリにおける MBAFF処理の探索領域と更新領域を示す模式図である。

[図 15]図 15は、複数ピクチャ参照時における参照用ローカルメモリの更新領域の状態を示す模式図である。

[図 16]図 16は、複数ピクチャ参照時の参照用ローカルメモリの更新動作による物理領域の状態を示す模式図であり、（a)参照用ローカルメモリの物理領域の構成、 (b) 〜（d)、参照用ローカルメモリのメモリ配置の移り変わりを示す一例である。

[図 17]図 17は、他ピクチャの動きベクトルの状況力参照用ローカルメモリの更新領域を決定するフローチャートである。

[図 18]図 18は、前処理による概略動きベクトル力参照用ローカルメモリの更新領域を決定するフローチャートである。

[図 19]図 19は、対象 MB行よりも前に処理した MB行の状況力参照用ローカルメモリの更新領域を決定するフローチャートである。

[図 20]図 20は、 H. 264レコーダを実現する AV処理部の構成を示すブロック図である。

符号の説明

101 参照メモリ制御部

102 参照用ローカルメモリ

103 外部マルチフレームメモリ

401 動き検出部

402 マルチフレームメモリ

403 減算部

404 減算部

405 動き補償部

406 符号化部 407 加算部

408 動きベクトルメモリ

409 動きベクトル予測部

発明を実施するための最良の形態

[0044] 以下、本発明の各実施の形態について、それぞれ図面を参照しながら説明する。

[0045] (実施の形態 1)

図 6は、本発明の実施の形態 1に係る動き補償装置が用いられる画面間予測符号化装置の構成を示すブロック図である。なお、図 1に示す従来の画面間予測符号ィ匕装置と同様の部分については同じ符号を付し、その説明を省略する。

[0046] 本実施の形態の画面間予測符号化装置と図 1に示す従来の画面間予測符号化装置との相違点は、マルチフレームメモリ 402を、半導体等への実装時に外部で接続する外部マルチフレームメモリ（第 1記憶手段） 103と、動き検出などに使用する内部メモリである参照用ローカルメモリ（第 2記憶手段） 102に分離して表現し、それを制御するための参照メモリ制御部 101を追加している点である。

[0047] 動作の流れは、図 1に示す従来の画面間予測符号化装置の動作とほぼ同じであり、加算器 407からの加算結果である復号画面 RecPelは外部マルチフレームメモリ 10 3に記憶される。次に、外部マルチフレームメモリ 103から動き補償予測で用いる領域を、参照用ローカルメモリ 102に出力する。また、参照メモリ制御部 101は、外部マルチフレームメモリ 103と参照用ローカルメモリ 102間のデータ転送を制御する。

[0048] 画像処理にかかわらず、高速に処理を行うためにはパイプライン構成を用いるのが一般的である。本実施の形態では、このパイプライン処理を動き検出のための参照用ローカルメモリ 102の更新方法に用いている。図 7は、メモリ転送と動き補償予測の動作タイミングを示す概略図である。図 7において、処理タイミング mtProcは、メモリ転送を行う処理タイミングを表しており、処理タイミング meProcは、動き検出を行う処理タイミングを表している。また、期間 T0、 Tl、 Τ2、及び Τ3はそれぞれ処理を行う期間を表している。

[0049] 参照メモリ制御部 101は、図 7に示すように T1の期間に、原画像の η行目の MBを処理するための画素データを、外部マルチフレームメモリ 103から参照用ローカルメモリ 102に転送している。また、 T2の期間には、参照メモリ制御部 101によって、原画像の n+ 1行目の MBを処理するための画素データ力外部マルチフレームメモリ 10 3から参照用ローカルメモリ 102に転送されて、ると同時に、参照用ローカルメモリ 10 2の画素データを参照し、原画像の n行目の MBにつ!/、て動き検出部 401にお!/、て動き検出が行われている。同様に、 T3の期間には、参照メモリ制御部 101によって、原画像の n+ 2行目の MBを処理するための画素データ力外部マルチフレームメモリ 103から参照用ローカルメモリ 102に転送されていると同時に、参照用ローカルメモリ 102の画素データを参照し、原画像の n+ 1行目の MBにつ!/、て動き検出部 401において動き検出が行われて、る。

[0050] 図 8は、参照用ローカルメモリにおける探索領域と更新領域を示す模式図である。

[0051] 符号ィ匕対象のストリームに含まれる 1ピクチャ Picがフレーム構造をとる場合、 SD画像サイズではピクチャの幅 picWidthと高さ picHeightはそれぞれ 45MB ( = 720画素）と 30MB (=480画素）となり、 HD画像サイズではそれぞれ 120MB ( = 1, 920画素 )と 68MB ( = 1, 088画素）となる。以降、ピクチャの幅 picWidthと高さ picHeightはそれぞれ M (MB)と N (MB)であるものとする。

[0052] 動き検出部 401にお、て原画像の n行目の MBにつ、て動き検出が行われて!/、る場合、参照用ローカルメモリ 102には、原画像の n行目の MBで参照されるピクチャの幅 picWidth X参照高さ分の画素データが格納されている。すなわち、 SD画像サイズでは、原画像の n行目に対応する行の MBに、上下 1MB分ずつ加えた参照高さ分の画素データが格納されている。また、 HD画像サイズでは、原画像の n行目に対応する行の MBに、上下 40画素分ずつ加えた参照高さ分の画素データが格納されている。なお、原画像における m列目の n行目の符号ィ匕対象 MBのための参照画像における探索中心 meCntは、原画像の対象 MBと同じ位置としても良いが、異なる位置にずらした所を探索中心 meCntとしても良、。

[0053] 本実施の形態では、参照メモリ制御部 101は、参照用ローカルメモリ 102の更新を MBの行単位で行う。つまり、 n行目の M個の動き検出処理を行っている間に、 n+ 1 行目の動き検出で用いる参照画像を転送する。以下、これらの動作の流れを説明する。図 9は、これらの動作の流れを示すフローチャートである。 [0054] S400は 1ピクチャ分の動き検出処理の開始を示している。まず、原画像における処理を行う MB行位置の初期化を行い、 nに 0を代入する（ステップ S401)。次に処理を行う MB行がピクチヤの高さ picHeightを超えて!/、な!/、かどうかを判定し (ステップ S40 2)、もし nが Nを超えて!/ヽれば (ステップ S402で No)、終了する（ステップ S403)。

[0055] ステップ S402にお!/、てピクチャの高さを超えて、な、場合 (ステップ S402で Yes) は、動き検出を行う縦の範囲を設定し (ステップ S404)、併せて原画像における処理を行う MB列位置の初期化を行い、 mに 0を代入する（ステップ S405)。

[0056] ステップ S405の処理の後は、 MB毎に動き検出を 1行分行う処理 (ステップ S406、ステップ S407、ステップ S408、及びステップ S409)と、次の MB行に必要な参照領域を転送する処理 (ステップ S410及びステップ S411)とを同時に実行する。

[0057] MB毎に動き検出を 1行分行う処理として、まず処理を行う MBの横の位置がピクチャの幅 picWidthを超えていないかどうかを判定し (ステップ S406)、もし mが Mを超えていれば (ステップ S406で No)、次の行の処理に移る。

[0058] ステップ S406にお!/ヽてピクチャの幅を超えて!/ヽな、場合 (ステップ S406で Yes)は、動き検出を行う横の範囲を設定し (ステップ S407)、 (m, n)の位置の MBの動き検出を行う（ステップ S408)。次に MBの横の位置を一つ右に設定 (m = m + 1 )し (ステップ S409)、ステップ S406に処理を戻す。

[0059] ステップ S405に続くもう一方の処理として、次の MB行に必要な参照領域を転送する処理として、まず n+ 1行目に必要になる転送領域を決定し (ステップ S410)、画素転送を動き検出の処理と並列に行う（ステップ S411)。 n行目と n+ 1行目の MBの探索中心が原画像における各 MBからの相対座標で同じであれば、更新領域は 16画素行（1MB行）となる。

[0060] 並列に動作している、 MB毎に動き検出を 1行分行う処理と、次の MB行に必要な参照領域を転送する処理とが終了すると、対象 MBの行を次の行に移し (n=n+ l) 、ステップ S402に処理を戻す (ステップ S412)。

[0061] 図 10は、参照用ローカルメモリの更新領域の状態を示す模式図である。

[0062] 参照メモリ制御部 101は、図 10に示すように動き検出部 401において n—1行目の MBmb n-1の探索が行われている間に領域 area nを転送する。同様に、 n行目の MBmb— nの探索が行われている間に領域 area— n+1を転送し、 n+ 1行目の MBmb —n+1の探索が行われている間に領域 area— n+2を転送し、 n+ 2行目の MBmb— n+ 2の探索が行われている間に領域 area— n+2の下の 1行の領域を転送する。

[0063] 図 11は、参照用ローカルメモリの更新動作による物理領域の状態を示す模式図である。参照用ローカルメモリ 102は、図 11 (a)に示すように領域 Omema0、領域 lmema 1、領域 2mema2及び領域 3mema3と 4分割にして管理されている。図 11 (b)〜図 11 ( d)、図 10に示した動作状態の時に参照用ローカルメモリ 102のメモリ配置の移り変わりを示す一例である。

[0064] まず、図 11 (b)〖こ示すように、 n— 1行目の MBmb— n- 1の探索に領域 Omema0、領域 lmemal、及び領域 2mema2を用いて、領域 area— nを転送するために領域 3mema 3を用いている。次に、図 11 (c)に示すように、 n行目の MBmb— nの探索に領域 lme mal、領域 2mema2、及び領域 3mema3を用いて、領域 area— n+1を転送するために領域 OmemaOを用いる。さらに、図 11 (d)に示すように、 n+ 1行目の MBmb_n+lの探索に領域 2mema2、領域 3mema3、及び領域 OmemaOを用いて、領域 area— n+2を転送するために領域 lmemalを用いる。

[0065] 従って、参照用ローカルメモリ 102は、少なくとも（ピクチャ幅） X (探索高さ） + (ピクチヤ幅） X (更新する参照領域の最大の高さ)分のメモリ量を実装する。

[0066] 上記動作で処理を行うことによって、 1ピクチャあたりに外部マルチフレームメモリ 10 3から参照用ローカルメモリ 102に転送する画素量は、 SDサイズ画像では MPEG -2 と H. 264のどちらに対しても、

720 X 480 = 345, 600画素

の転送量となり、 HDサイズ画像では同様に

1, 920 X 1, 088 = 2, 088, 960画素

の転送量となる。すなわち、上記課題の説明で用いた例と比較すると、 SDサイズ画像で 3分の 1以下、さらに HDサイズ画像では 6分の 1以下の画素転送量に削減することが可能となる。

[0067] なお、本実施の形態では、参照メモリ制御部 101は、参照用ローカルメモリ 102の更新をピクチャの幅 picWidth分の MBの行単位で行って!/、るが、これに限られるものではない。例えば、図 12に示すようにピクチャを複数（図 12の例では 2つ）の領域に分割し、分割した領域の幅分 (MZ2)の MBの行単位で行っても構わな、。

[0068] (実施の形態 2)

H. 264規格では、 MBAFF(Macroblock- Adaptive Frame-Field Coding)の符号化ツールが規格化されている。 MBAFFでは、縦 2MBをペアとしてフィールド予測またはフレーム予測の符号化を行う。縦 2MBがペアとなっている場合には、 1MB行ずつの処理が出来ないので、以下のような手順で処理することによって対応する。図 13は本実施の形態での動作の流れを示すフローチャートである。

[0069] S700は 1フレーム分の動き検出処理の開始を示している。まず、原画像における処理を行う MB行位置の初期化を行い、 nに 0を代入する（ステップ S701)。次に処理を行う MB行がピクチヤの高さ picHeightを超えて!/、な!/、かどうかを判定し (ステップ S702)、もし nが Nを超えていれば (ステップ S701で No)、終了する（ステップ S703)

[0070] ステップ S702にお!/、てピクチャの高さを超えて、な、場合 (ステップ S 701で Yes) は、動き検出を行う縦の範囲を設定し (ステップ S704)、併せて原画像における処理を行う MB列位置の初期化を行い、 mに 0を代入する（ステップ S705)。

[0071] ステップ S705の処理の後は、 MB毎に動き検出を 2行分行う処理 (ステップ S706、ステップ S707、ステップ S708、ステップ S709、及びステップ S713)と、次の 2MB行に必要な参照領域を転送する処理 (ステップ S710及びステップ S711)を同時に実行する。

[0072] MB毎に動き検出を 2行分行う処理として、まず処理を行う MBの横の位置がピクチャの幅 picWidthを超えていないかどうかを判定し (ステップ S706)、もし mが Mを超えて!ヽれば (ステップ S706で No)、次の行の処理に移る）。

[0073] ステップ S706にお!/ヽてピクチャの幅を超えて!/ヽな、場合 (ステップ S706で Yes)は、動き検出を行う横の範囲を設定し (ステップ S 707)、 (m, n)の位置の MBの動き検出を行い（ステップ S708)、さらに（m, n+ 1)の位置の MBの動き検出を行う（ステツプ S713)。次に MBの横の位置を一つ右に設定（m=m+ l)し (ステップ S 709)、ステツプ S 706に処理を戻す。 [0074] ステップ S705に続くもう一つの処理として、次の MB行に必要な参照領域を転送する処理として、まず n+ 2行目と n+ 3行目に必要になる転送領域を決定し (ステップ S 710)、画素転送を動き検出の処理と並列に行う（ステップ S 711)。

[0075] 並列に動作している、 MB毎に動き検出を 2行分行う処理と、次の MB2行の処理に必要な参照領域を転送する処理とが終了すると、対象 MBの 2行を次の 2行に移し (n = n + 3)、ステップ S 702に処理を戻す (ステップ S 712)。

[0076] 図 14は、参照用ローカルメモリにおける MBAFFの探索領域と更新領域を示す模式図である。

[0077] 参照メモリ制御部 101は、図 14に示すように動き検出部 401において対象 MBを（ m, n)、 (m, n+ l)、 (m+ 1, n)、 (m+ 1, n+ l)、 (m+ 2, n)、 (m+ 2, n+ l)、… と鋸歯状の順番で、 2MB行の動き検出処理が行われている間に、（n+ 2)行目と (n + 3)行目の動き検出で用いるための更新領域を転送する。ここで、 n、 n+ 1行目と n + 2、 n+ 3行目の MBの探索中心が原画像における各 MBからの相対座標で同じであれば、更新領域は 32画素行（2MB行）となる。

[0078] 上記の実装と制御を行うことにより、複数行の MBに関しても効率的なメモリ転送を行うことが可能となる。

[0079] (実施の形態 3)

H. 264規格では、複数のピクチャを参照することが規格化されている。本実施の形態では、複数枚の参照画像を用いる時の動作について説明する。

[0080] 図 15は、複数ピクチャ参照時におけるローカルメモリの更新領域の状態を示す模式図である。図 15において、符号化対象のフレーム currPicは、フレーム re!PicO、 re!P icl、 re!Pic2、及び re!Pic3を参照している。本実施の形態は、実施の形態 1の参照フレームを複数枚に拡張しており、参照メモリ制御部 101は、図 15に示すように動き検出部 401にお!/、て n— 1行目の MBmb— n-1の探索が行われて!/、る間に、領域 areaO — n、領域 areal— n、領域 area2— n、及び領域 area3— nを転送する。同様に、 n行目の MBmb— nの探索が行われている間に、領域 areaO— n+l、領域 areal— n+l、領域 a rea2— n+l、及び領域 area3— n+1を転送し、 n+ 1行目の MBmb— n+1の探索が行われている間に、領域 areaO n+2、領域 areal n+2、領域 area2 n+2、及び領域 area3 — n+2を転送する。

[0081] 図 16は、複数ピクチャ参照時のローカルメモリの更新動作による物理領域の状態を示す模式図である。参照用ローカルメモリ 102を、図 16 (a)に示すように領域 OOme ma00、領域 OlmemaOl、領域 O2mema02、領域 O3mema03、領域 10memalO、領域 1 lmemall、領域 12memal2、領域 13memal3、領域 2Omema20、領域 21mema21、領域 22mema22、領域 23mema23、領域 3Omema30、領域 31mema31、領域 32mema32 、及び領域 33mema33の 12の領域に分割している。図 16 (b)〜図 16 (d)、図 15に示した動作状態の時に参照用ローカルメモリ 102のメモリ配置の移り変わりを示す一例である。

[0082] まず、図 16 (b)〖こ示すように、 n— 1行目の MBmb— n- 1の探索に参照ピクチャ re!Pi c0には領域 OOmemaOOと領域 OlmemaOlと領域 O2mema02を用いて、参照ピクチャ ref Piclには領域 lOmemalOと領域 l lmemallと領域 12memal2を用いて、参照ピクチャ r e!Pic2には領域 2Omema20と領域 21mema21と領域 22mema22を用いて、及び参照ピクチャ re!Pic3には領域 3Omema30と領域 3 lmema31と領域 32mema32を用いると同時に、域 areaO一 n、領域 areal一 n、領域 area2一 n、及び領; ¾½'area3一 nを送する 7こめに領域 O3mema03、領域 13memal3、領域 23mema23、及び領域 33mema33を用いる。次に、図 16 (c)に示すように、 n行目の MBmb— nの探索に参照ピクチャ re!PicO には領域 OlmemaOlと領域 O2mema02と領域 O3mema03を用いて、参照ピクチャ re!Pi clには領域 l lmemallと領域 12memal2と領域 13memal3を用いて、参照ピクチャ ref Pic2には領域 21mema21と領域 22mema22と領域 23mema23を用いて、及び参照ピクチヤ re!Pic3には領域 3 lmema31と領域 32mema32と領域 33mema33を用いると同時に、領域 areaO— n+l、領域 areal— n+l、領域 area2— n+l、及び領域 area3— n+1を転送するために領域 OOmema00、領域 10memalO、領域 2Omema20、及び領域 3Omema30 を用いる。さらに、図 16 (d)に示すように、 n+ 1行目の MBmb— n+1の探索に参照ピクチャ re!PicOには領域 O2mema02と領域 O3mema03と領域 OOmemaOOを用いて、参照ピクチャ re!Piclには領域 12memal2と領域 13memal 3と領域 1 Omemal 0を用いて、参照ピクチャ re!Pic2には領域 22mema22と領域 23mema23と領域 2Omema20を用いて、及び参照ピクチャ re!Pic3には領域 32mema32と領域 33mema33と領域 3Omema30を用いると同時に、領域 areaO— n+2、領域 areal— n+2、領域 area2— n+2、及び領域 are a3— n+2を転送するために領域 Olmema01、領域 l lmemall、領域 21mema21、及び領域 31mema31を用いる。

[0083] 上記の実装と制御を行うことにより、複数枚のフレーム参照を行う場合でも、 MBの動き検出で用いるメモリ転送を効率的に行うことが可能となる。

[0084] (実施の形態 4)

参照メモリ制御部 101は、次の MB行の動き検出処理に必要な画素の転送ついて、実施の形態 1に示したように n行目と n+ 1行目の処理に必要な画素のうち、差分領域を転送している。探索領域の中心が n行目と n+ 1行目で相対位置が同じ場合、 1 MB行分だけ更新することとなるので、 16画素行（ = 1MB行)を更新して!/、る。ただし、 n+ 1行目のための更新行と n+ 2行目のための更新行は、必ずしも同じ数にする必要はない。そこで、本実施の形態では、更新領域を決定する方法を以下のように 3 通り説明する。

[0085] [更新領域決定方法 1]

図 17は、他ピクチャの動きベクトルの状況力参照用ローカルメモリの更新領域を決定するフローチャートである。実施の形態 1における図 9に示すステップ S410で行われる処理である。

[0086] ステップ S1100は、 n+ 1行目の MB処理用の転送領域に関する決定フローの開始を示している。まず、処理対象画像と時間距離もしくは処理順序が近い符号化済み画像を選択する (ステップ S1101)。次に、符号ィ匕済み画像の n行目の MBに関して垂直方向の平均動きベクトル mvRef— ηθを算出し (ステップ S1102)、符号化済み画像の n+ 1行目の MBに関して垂直方向の平均動きベクトル mvRef—nlを算出する (ステップ S1103)。さらに、ステップ S1102で求めた平均動きベクトル mvRef— ηθとステツプ S 1103で求めた平均動きベクトル mvRef— nlとの差を求め、整数精度に丸めて更新量の補正値 mvCompとする（ステップ S1104)。さらに、 n行目の MB処理範囲を（16+mvComp)画素だけ下にずらした領域を n+ 1行目 MBの参照範囲とし、 n行目 MBの参照範囲と n+ 1行目 MBの参照範囲との差分領域を転送範囲に決定する (ステップ S 1105)。 [0087] [更新領域決定方法 2]

図 18は、前処理による概略動きベクトル力参照用ローカルメモリの更新領域を決定するフローチャートである。更新領域決定方法 1と同様に、実施の形態 1における図 9に示すステップ S410で行われる処理である。

[0088] ステップ S1200は、 n+ 1行目の MB処理用の転送領域に関する決定フローの開始を示している。まず、ピクチャの符号化処理の前処理として、ピクチャの圧縮画像などを用 Vヽて符号ィ匕対象画像の MB行毎の動きベクトルを簡易的に算出する (ステップ S1201)。例えば、対象のピクチャの画素を所定の間隔で間引いた画像を作成し、この画像を用いて符号ィ匕対象画像の MB行に相当する動きベクトルを算出する。次に、符号化対象画像の n行目の MBに関して垂直方向の前処理動きベクトル mvRef—n 0を取得し (ステップ S 1202)、符号化対象画像の n+ 1行目の MBに関して垂直方向の前処理動きベクトル mvRef— nlを取得する（ステップ S1203)。さらに、ステップ S12 02で取得した前処理動きベクトル mvRef— ηθとステップ S 1203で取得した前処理動きベクトル mvRef— nlとの差を求め、整数精度に丸めて更新量の補正値 mvCompとする（ステップ S 1204)。さらに、 n行目の MB処理範囲を（16+mvComp)画素だけ下にずらした領域を n+ 1行目 MBの参照範囲とし、 n行目 MBの参照範囲と n+ 1行目 M Bの参照範囲との差分領域を転送範囲に決定する (ステップ S 1205)。

[0089] [更新領域決定方法 3]

図 19は、対象 MB行よりも前に処理した MB行の状況力参照用ローカルメモリの更新領域を決定するフローチャートである。更新領域決定方法 1及び 2と同様に、実施の形態 1における図 9に示すステップ S410で行われる処理である。

[0090] ステップ S1300は、 n+ 1行目の MB処理用の転送領域に関する決定フローの開始を示している。まず、符号ィ匕対象画像の n— 1行目の MBに関して垂直方向の平均動きベクトル mvRef— ηθを取得し (ステップ S1302)、符号化対象画像の n行目の MB に関して垂直方向の平均動きベクトル mvRef— nlを取得する（ステップ S1303)。さらに、ステップ S 1302で取得した平均動きベクトル mvRef— ηθとステップ S 1303で取得した平均動きベクトル mvRef—nlとの差を求め、整数精度に丸めて更新量の補正値 m 0^1 とする（ステップ31304)。さらに、 n行目の MB処理範囲を（16+mvComp)画素だけ下にずらした領域を n+ 1行目 MBの参照範囲とし、 n行目 MBの参照範囲と n + 1行目 MBの参照範囲との差分領域を転送範囲に決定する (ステップ S 1305)。

[0091] なお、ここでは n+ 1行目の MB処理用の転送領域を決定する際に、符号化対象画像の n— 1行目の MBおよび n行目の MBに関して垂直方向の平均動きベクトルを取得している力これに限られるものではない。例えば、パイプライン処理を用いる場合には、 n+ 1行目の MB処理用の転送領域を決定する際に、符号化対象画像の n— 2 行目の MBおよび n— 1行目の MBに関して垂直方向の平均動きベクトルを取得すればよい。また、 n+ 1行目の MB処理用の転送領域を決定する際に、符号化対象画像の n— 3行目の MBおよび n— 2行目の MBに関して垂直方向の平均動きベクトルを取得しても構わない。

[0092] 以上のように、更新領域決定方法 1、更新領域決定方法 2、もしくは更新領域決定方法 3を用いて、図 9に示すステップ S410の処理を行うことによって画素転送量を削減し、実装する参照用ローカルメモリ 102を過剰に増やすことなぐ最適な探索範囲を指定することが可能となる。

[0093] (実施の形態 5)

さらにここで、上記実施の形態で示した画面間予測符号ィ匕装置の応用例にっ、て説明する。図 20は、 H. 264レコーダを実現する AV処理部のブロック図である。

[0094] AV処理部 700は、 DVDレコーダやハードディスクレコーダなど用いられ、ディジタル圧縮された音声及び画像を再生する処理部であり、図 20に示すようにストリーム入出力部 701、メモリ入出力部 702、 AV制御部 703、画像符号化復号化部 704、音声符号化復号化部 705、画像処理部 706、画像入出力部 707、音声処理部 708、音声入出力部 709、およびバス 710を備えている。

[0095] ストリーム入出力部 701は、ノス 710に接続され、音声と画像のストリームデータ exS trを入出力する。画像符号化復号化部 704は、バス 710に接続され、画像の符号ィ匕及び復号化を行う。音声符号ィ匕復号ィ匕部 705は、バス 710に接続され、音声の符号化及び復号化を行う。入出力インターフェース 702は、メモリ 800のデータ信号の入出力インターフェースであり、バス 710に接続されている。ここで、メモリ 800は、ストリームデータや符号化データや復号化データなどのデータを格納し、図 6に示している外部マルチフレームメモリの領域を含むものである。

[0096] 画像処理部 706は、バス 710に接続され、画像信号に対してプレ処理及びポスト処理を行う。画像入出力部 707は、画像処理部 706で処理したもしくは画像処理部 70 6で処理をせずに通過だけさせた画像データ信号を外部に画像信号 exVSigとして出力する、または、外部からの画像信号 exVSigを取り込む。

[0097] 音声処理部 708は、バス 710に接続され、音声信号に対してプレ処理及びポスト処理を行う。音声入出力部 709は、音声処理部 708で処理したもしくは音声処理部 70 8で処理をせずに通過だけさせた音声データ信号を外部に音声信号 exASigとして出力する、または、外部からの音声信号 exASigを取り込む。

[0098] また、 AV制御部 703は AV処理部 700の全体制御を行う。バス 710はストリームデータゃ音声 ·画像の復号データなどのデータを転送する。

[0099] ここでは、図 20を用いて符号ィ匕動作のみを説明する。最初に、画像信号 exVSigが画像入出力部 707に入力され、音声信号 exASigが音声入出力部 709に入力される。次に、画像入出力部 707に入力された画像信号 exVSigを用いて、画像処理部 706 においてフィルタ処理や符号ィ匕のための特徴量抽出などを行い、メモリ入出力部 70 2を介してメモリ 800に原画像として格納する。次に、再びメモリ入出力部 702を介してメモリ 800から画像符号化復号化部 704には原画像データと参照画像データの転送を行い、逆に画像符号ィ匕復号ィ匕部 704からメモリ 800には画像符号ィ匕復号ィ匕部 7 04で符号化した画像ストリームデータと局所復元データの転送を行う。

[0100] ここで、画像符号ィ匕復号ィ匕部 704は図 6のほぼ全体に相当し、画像ストリームは同図の符号ィ匕信号 Strに相当し、さらにメモリ 800は同図の外部マルチフレームメモリ 10 3の領域が含まれる。

[0101] 一方、音声入出力部 709に入力された音声信号 exASigを用いて、音声処理部 708 においてフィルタ処理や符号ィ匕のための特徴量抽出などを行い、メモリ入出力部 70 2を介してメモリ 800に原音声データとして格納する。次に、再びメモリ入出力部 702 を介してメモリ 800から原音声データを取り出して符号ィ匕し、再度音声ストリームデータとしてメモリ 800に格納する。

[0102] 最後に、画像ストリームと音声ストリーム及びその他のストリーム情報を一つのストリームデータとして処理し、ストリーム入出力部 701を介してストリームデータ exStrを出力し、光ディスクゃノヽードディスクなどの蓄積メディアに書き込む処理を行う。

[0103] なお、実施の形態において 1ピクチャについての動作を示した力 1ピクチャを複数の領域に分割し、分割領域を 1ピクチャとして処理することによって、複数の画面間予測符号化装置を LSI内に実装し並列処理を行う、または LSIを複数実装して並列処理を行うなどの方法で実現しても良、。

[0104] また、ブロック図（図 6や図 20など）の各機能ブロックは典型的には集積回路である LSIとして実現される。これらは個別に 1チップィ匕されても良いし、一部又は全てを含むように 1チップィ匕されても良い（例えばメモリ以外の機能ブロックが 1チップィ匕されていても良い。 ) oここで、図 6の外部マルチフレームメモリ 103や図 20のメモリ 800は、大量のデータを保持する必要があるため、一般的には LSIに外付けする大容量の D RAMなどで実装する力技術の向上により 1パッケージィ匕ゃ 1チップィ匕されることも有り得る。

[0105] ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥルトラ LSIと呼称されることもある。また、集積回路化の手法は LSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。 LSI製造後に、プログラムすることが可能な FPGA (Field Programmable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギユラブル'プロセッサーを利用しても良い。さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行ってもよい。バイォ技術の適応等が可能性としてありえる。

産業上の利用可能性

[0106] 本発明の画面間予測符号化装置は、参照用ローカルメモリの実装増加量を抑えつつ、動き補償予測に用いる参照画素の転送量を大幅に削減できるので、例えば H.26 4規格を用いた大き、画像サイズを扱う DVDレコーダやハードディスクレコーダやカムコーダ等を実現するために有効である。

Claims

請求の範囲

[1] ピクチャを構成するブロックの動き検出を行う動き検出装置であって、

参照ピクチヤの参照画素データを記憶する第 1記憶手段と、

前記第 1記憶手段から転送される前記参照画素データを記憶する第 2記憶手段と、複数の前記ブロックで構成される一ブロック行を少なくとも含むブロック行毎に、転送する参照画素データの範囲を動き検出済みブロックの動き検出結果に基づいて決定し、決定した範囲の前記参照画素データを複数の画素で構成される一画素行を少なくとも含む画素行単位で前記第 1記憶手段から前記第 2記憶手段へ転送する参照画素転送制御手段と、

前記第 2記憶手段に記憶されて、る前記参照画素データを用いて対象ブロックの動き検出を行う動き検出手段と

を備えることを特徴とする動き検出装置。

[2] 前記参照画素転送制御手段は、前記動き検出手段において前記ブロック行に含まれる各対象ブロックの動き検出が行われている間に、次のブロック行の動き検出で必要とされる参照画素データの範囲を決定し、決定した範囲の前記参照画素データを前記第 1記憶手段から前記第 2記憶手段へ転送する

ことを特徴とする請求項 1記載の動き検出装置。

[3] 前記参照画素転送制御手段は、前記動き検出手段において複数ピクチヤが参照される場合には、前記ブロック行に含まれる各対象ブロックの動き検出で必要とされる全ての複数ピクチヤの参照画素データの範囲をそれぞれ決定し、決定した範囲の前記参照画素データをそれぞれ前記第 1記憶手段から前記第 2記憶手段へ転送することを特徴とする請求項 1記載の動き検出装置。

[4] 前記参照画素転送制御手段は、前記対象ブロックと同画素位置である前記参照ピクチャにおけるブロックを含むブロック行に含まれるブロックおよび前記ブロック行の直前のブロック行に含まれるブロックにおいて検出されている垂直方向の動き検出結果に基づ、て、転送する参照画素データの範囲を決定する

ことを特徴とする請求項 1記載の動き検出装置。

[5] 前記動き検出装置は、さらに、前記対象ブロックを含むピクチヤに対して簡易的に動き検出を行う簡易検出手段を備え、

前記参照画素転送制御手段は、前記簡易検出手段によって検出された前記対象ブロックを含むブロック行に含まれるブロックおよび前記ブロック行の直前のブロック行に含まれるブロックに対応する垂直方向の動き検出結果に基づいて、転送する参照画素データの範囲を決定する

ことを特徴とする請求項 1記載の動き検出装置。

[6] 前記参照画素転送制御手段は、前記対象ブロックを含むブロック行に含まれるプロックまたはブロック行の前のブロック行に含まれるブロックにおいて検出されている垂直方向の動き検出結果に基づいて、転送する参照画素データの範囲を決定することを特徴とする請求項 1記載の動き検出装置。

[7] 前記参照画素転送制御手段は、前記ブロック行に含まれる各対象ブロックの動き検出で必要とされる参照画素データのうち、既に転送されている参照画素データに含まれな！/、差分領域のみを、転送する参照画素データの範囲として決定することを特徴とする請求項 1記載の動き検出装置。

[8] 前記ブロック行は、前記ピクチヤの水平方向の一行である

ことを特徴とする請求項 1記載の動き検出装置。

[9] 前記ブロック行は、前記ピクチャを複数に分割した各領域における水平方向の一行である

ことを特徴とする請求項 1記載の動き検出装置。

[10] ピクチャを構成するブロックの動き検出を行う動き検出方法であって、

複数の前記ブロックで構成される一ブロック行を少なくとも含むブロック行毎に、転送する参照画素データの範囲を動き検出済みブロックの動き検出結果に基づいて決定し、決定した範囲の前記参照画素データを複数の画素で構成される一画素行を少なくとも含む画素行単位で、参照ピクチヤの参照画素データを記憶する第 1記憶手段から第 2記憶手段へ転送する参照画素転送制御ステップと、

前記第 2記憶手段に記憶されて、る前記参照画素データを用いて対象ブロックの動き検出を行う動き検出ステップとを含むことを特徴とする動き検出方法。

[11] ピクチャを構成するブロックの動き検出を行うための集積回路であって、

参照ピクチヤの参照画素データを記憶する外部メモリから転送される前記参照画素データを記憶する記憶手段と、

複数の前記ブロックで構成される一ブロック行を少なくとも含むブロック行毎に、転送する参照画素データの範囲を動き検出済みブロックの動き検出結果に基づいて決定し、決定した範囲の前記参照画素データを複数の画素で構成される一画素行を少なくとも含む画素行単位で前記外部メモリから前記記憶手段へ転送する参照画素転送制御手段と、

前記記憶手段に記憶されて!、る前記参照画素データを用いて対象ブロックの動き検出を行う動き検出手段と

を備えることを特徴とする集積回路。

[12] ピクチャを構成するブロックの動き検出を行うためのプログラムであって、

前記第 2記憶手段に記憶されて、る前記参照画素データを用いて対象ブロックの動き検出を行う動き検出ステップとをコンピュータに実行させる

ことを特徴とするプログラム。