JP4592656B2 - 動き予測処理装置、画像符号化装置および画像復号化装置 - Google Patents

動き予測処理装置、画像符号化装置および画像復号化装置 Download PDF

Info

Publication number
JP4592656B2
JP4592656B2 JP2006222394A JP2006222394A JP4592656B2 JP 4592656 B2 JP4592656 B2 JP 4592656B2 JP 2006222394 A JP2006222394 A JP 2006222394A JP 2006222394 A JP2006222394 A JP 2006222394A JP 4592656 B2 JP4592656 B2 JP 4592656B2
Authority
JP
Japan
Prior art keywords
block
image
motion
motion vector
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006222394A
Other languages
English (en)
Other versions
JP2008048199A (ja
Inventor
英典 仲石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Semiconductor Ltd
Original Assignee
Fujitsu Semiconductor Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Semiconductor Ltd filed Critical Fujitsu Semiconductor Ltd
Priority to JP2006222394A priority Critical patent/JP4592656B2/ja
Priority to US11/826,867 priority patent/US8189669B2/en
Priority to CN200710138021XA priority patent/CN101198057B/zh
Publication of JP2008048199A publication Critical patent/JP2008048199A/ja
Application granted granted Critical
Publication of JP4592656B2 publication Critical patent/JP4592656B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • H04N19/433Hardware specially adapted for motion estimation or compensation characterised by techniques for memory access
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、動画像を一定の領域に分割した基本ブロックを単位としてフレーム間の動き予測処理を行う動き予測処理装置、およびこの装置を備えた画像符号化装置、画像復号化装置に関し、特に、動き予測処理の現処理対象画像が参照する参照画像の動きベクトルから、現処理対象画像の動きベクトルを演算する動作モードに対応した動き予測処理装置、画像符号化装置および画像復号化装置に関する。
動画像信号の圧縮符号化方式として、MPEG(Moving Picture Expert Group)や、H.264などが知られている。このような圧縮符号化方式では、入力画像データをマクロブロック(以下、MBと呼ぶ)と呼ばれる基本処理単位に分割し、これを単位として符号化・復号化処理が行われる。符号化処理では、入力画像に対して直交変換、量子化などを施して画面内の冗長性を取り除くフレーム内予測と、過去に符号化した複数のフレームから動き補償した予測残差を抽出することでフレーム間の冗長性を取り除くフレーム間予測とが行われ、これらの手法で算出された値がエントロピー符号化されることで、データ圧縮がなされる。また、復号化処理では、その逆動作が行われる。
また、MPEG−2やH.264などでは、フレーム単位で符号化するモードとフィールド単位で符号化するモードとを適応的に選択可能になっている。これに加えて、上下に隣接する2つのMB(以下、MBペアと呼ぶ)単位で、フレーム間予測とフィールド間予測とを切り替えて用いることも可能となっており、このモードはMBAFF(Macro Block Adaptive Field/Frame)と呼ばれている。これらの3つのモードは符号化タイプ(Coding Type)としてピクチャ単位に設定でき、以下では各符号化タイプを「FRM」「FLD」「MBAFF」と表すことにする。
図33は、符号化タイプ別のMBの処理順について説明するための図である。
この図33の上側では、画像上での16画素×16画素のMBの処理順を示している。符号化タイプがFRMのときは、同図左上側に示すように、フレーム内の16画素×16画素のMBが水平方向の並列順に処理されるので、それらの各MB内では、同図左下側に示すように、奇数ラインのデータと偶数ラインのデータとが交互に処理されることになる。また、符号化タイプがFLDのときは、同図中央上側に示すように、トップ・フィールドのデータとボトム・フィールドのデータとが存在する。このため、同図中央下側に示すように、まずトップ・フィールドに対応する奇数ラインが順に処理された後、次のフィールド同期期間においてボトム・フィールドに対応する偶数MBラインが処理されることになる。
符号化タイプがMBAFFのときは、同図右上側に示すように、フレーム内のデータはMBペア単位で処理される。ただし、フレーム間予測を適用したMBペア(以下、フレーム・ペア(Frame Pair)と呼ぶ)とフィールド間予測を適用したMBペア(以下、フィールド・ペア(Field Pair)と呼ぶ)とでは処理順が異なり、同図右下側に示すように、フレーム・ペアでは奇数ラインと偶数ラインとが交互に処理される。一方、フィールド・ペアでは、2つのMBがそれぞれトップ・フィールド、ボトム・フィールドに対応するデータに対応しており、奇数ラインが処理された後、続いて偶数ラインが処理されることになる。
また、輪郭を多く含むMBなどでは、予測精度を向上させるために、MBをより小さな領域に分割し、分割したブロックを動きベクトルの検出単位として動き予測処理を行うことがある。基本的なMBのブロックサイズは16画素×16画素であるが、例えばH.264では、必要に応じて最小で4画素×4画素サイズのブロックを用いることができる。
図34は、H.264におけるMBのブロックサイズを説明するための図である。
図34(A)は、基本サイズである16画素×16画素のMBを示している。なお、ここでは、所定の画素サイズのMBを「MB(画素サイズ)」と表記する。例えば、同図(A)のMBをMB(16×16)と表す。
同図(B)は、MB(16×16)を横方向に2分割した形状のMB(16×8)を、同図(C)には、MB(16×16)を縦方向に2分割した形状のMB(8×16)を、同図(D)には、MB(16×16)を4等分した形状のMB(8×8)をそれぞれ示している。なお、図中の点線矢印はMB間の処理順を示しており、MB(16×8)では上から下、MB(8×16)では左から右、MB(8×8)では左上、右上、左下、右下の順にそれぞれ処理が行われる。
さらに、H.264では、MB(8×8)をさらに分割したサブMB分割を指定することもできる。以下、MBの場合と同様に、所定の画素サイズのサブMBをサブMB(画素サイズ)と表記すると、このサブMBとしては、同図(E)に示すように、サブMB(8×4)、サブMB(4×8)、サブMB(4×4)の各サイズがある。なお、MB(8×8)の内部での各サブMB間の処理順は、同図(A)〜(D)における同一形状のMBと同じになる。
ところで、上記の画像符号化方式におけるフレーム間予測では、現処理対象のフレームと過去に符号化したフレームとの間で、MB単位で動きベクトルが検出される。また、各フレームにおけるMBの画像データを基に検出した動きベクトルと、このMBの周辺領域の動きベクトルを基に予測した動きベクトル予測値との予測差分値が符号化対象とされ、これにより符号量をより削減できる。さらにH.264では、符号量削減の手法として、現処理対象のMBの動きベクトルを、過去に符号化したフレームの同位置に対応する動きベクトルのみから演算により直接的に算出可能なダイレクト・モードを選択することもできる。
図35は、ダイレクト・モードにおける動きベクトルの演算手法を概念的に示す図である。
ダイレクト・モードは、現処理対象のピクチャ(以下、CurrPic(Current Picture)と呼ぶ)として、双方向予測符号化が行われるBピクチャに対して設定可能である。ダイレクト・モードでは、CurrPic内の現処理対象のMB(以下、CurrMBと呼ぶ)の動きベクトルを算出するとき、CurrPicの予測に用いるピクチャ(以下、ColPic(Co-located Picture)と呼ぶ。)内の同じ空間位置のMB(以下、MBColと呼ぶ)の動きベクトルを利用して、演算によりCurrMBの動きベクトルを直接算出する。具体的には、表示順で直後のColPic内の対応するブロックの動きベクトルをピクチャ間の時間距離に応じて内分し、双方向の動きベクトルを得る。
ここで、ダイレクト・モードにより動きベクトルを演算するためには、ColPicの動きベクトルをメモリに保持し、現処理対象のブロックに対応するColPic内のブロックの動きベクトルをそのメモリから読み出す必要がある。しかし、上述したように、各ピクチャには任意の符号化タイプを設定することができ、さらに、MBの分割タイプが多数存在することから、予測に必要なブロックの動きベクトルを読み出すための読み出し制御が複雑になるという問題があった。特に、符号化タイプとしてFRMおよびFLDだけでなく、MBAFFにも対応可能とした場合には、CurrMBとMBColとの間のブロックのサイズや位置の組み合わせが非常に多岐にわたることになり、対応する動きベクトルの読み出し制御も極端に複雑になってしまう。
なお、MBAFFモードにおける動きベクトル予測値の演算を効率化した従来の技術としては、上側に隣接するMBの下側ブロックグループ、および左側に隣接するMBの右側ブロックグループの各動きベクトルを記憶するための上側メモリおよび左側メモリを備え、上側メモリには、MBAFFモードにおけるMBペアの上部および下部の各動きベクトルを格納するための個別のバンクを形成して、これらのメモリに格納された動きベクトルを参照して現在ブロックの動きベクトルを予測するようにしたものがあった(例えば、特許文献1参照)。
特開2006−166459号公報(段落番号〔0078〕〜〔0092〕、図10)
上述したように、FRM、FLD、MBAFFの全符号化タイプに対して、動きベクトル算出時におけるダイレクト・モードを適用できるようにするためには、予測に用いるColPicの動きベクトルを読み出すための制御が非常に複雑になるので、処理負荷が高くなり、また回路構成が複雑になることが問題となっていた。
これに対して、従来では、MBColの分割ブロックサイズをすべて最小サイズの4画素×4画素に変換し、変換したブロックごとに予測に用いる動きベクトルを格納しておくことで、読み出し制御を単純化していた。しかし、この手法を採った場合、元のColPicが最小サイズより大きいブロックに分割されていた場合でも、最小サイズで分割した分割数だけのメモリアドレス空間に動きベクトルをすべて格納し、符号化・復号化の際にこれらの空間から必要な動きベクトルを読み出す必要が生じる。このため、符号化・復号化の際の動きベクトルの演算量やメモリアクセス回数が増大して、処理負荷が過大になるという問題があった。また、符号化時においては、生成される符号量が増大してしまい、画像信号の圧縮率を高められないという問題もあった。
本発明はこのような点に鑑みてなされたものであり、ダイレクト・モードを用いた動き予測処理の適応範囲が拡張され、かつ、その処理負荷が軽減された動き予測処理装置、そのような装置を備えた画像符号化装置および画像復号化装置を提供することを目的とする。
本発明では上記課題を解決するために、図1に示すような動き予測処理装置1が提供される。この動き予測処理装置1は、動画像を一定の領域に分割した基本ブロックを単位としてフレーム間の動き予測処理を行うものであり、動き予測処理の現処理対象画像が参照する参照画像20の動きベクトルを、参照画像20上の水平方向に並列された1列分の基本ブロックに対応するブロックライン20−1……を単位として、ベクトル格納メモリ10を分割したメモリ領域10−1……のいずれかに書き込む書き込み制御手段2と、ベクトル格納メモリ10からFIFO方式の2つのバッファ11および12への、メモリ領域10−1……ごとの動きベクトルの読み出しを、参照画像20および現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段3と、各バッファ11および12から順次読み出した動きベクトルを用いて、現処理対象画像の所定の基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段4とを有する。
このような動き予測処理装置1では、動き予測処理に用いる参照画像20の動きベクトルを格納するために、複数のメモリ領域10−1……に分割されたベクトル格納メモリ10と、ともにFIFO方式の2つのバッファ11および12とが利用される。書き込み制御手段2は、動き予測処理の現処理対象画像が参照する参照画像20の動きベクトルを、その参照画像20上の水平方向に並列された1列分の基本ブロックに対応するブロックラインを単位として、メモリ領域10−1……のいずれかに書き込む。読み出し制御手段3は、ベクトル格納メモリ10から2つのバッファ11および12へのメモリ領域10−1……ごとの動きベクトルの読み出しを、参照画像20および現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する。ベクトル演算手段4は、各バッファ11および12から順次読み出した動きベクトルを用いて、現処理対象画像の所定の基本ブロックの動き予測処理に必要な動きベクトルを予測演算する。
本発明の動き予測処理装置によれば、参照画像についての動きベクトルが、その数が増加されることなく、ベクトル格納メモリに対して読み書きされ、かつ、ベクトル格納メモリに対する読み書きが、ブロックライン単位の動きベクトルを格納するメモリ領域ごとに行われるので、ベクトル格納メモリに対するアクセス回数が必要最小限に抑制される。また、参照画像および現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて、ベクトル格納メモリから2つのバッファへのメモリ領域ごとの動きベクトルの読み出しが制御されるので、これらの組み合わせに関係なく、ベクトル演算手段が各バッファから所望の基本ブロックに対応する動きベクトルを確実に取得できるようになる。従って、参照画像の動きベクトルに基づいて現処理対象画像の所定ブロックの動きベクトルを直接演算する処理の適応範囲を拡張できるとともに、その処理負荷を軽減できる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。まず、実施の形態に適用される発明の概念について説明し、その後、実施の形態の具体的な内容を説明する。なお、以下の説明では、画像を分割したブロックの画素サイズについて、例えば16画素×16画素を16×16と省略して表記する。
図1は、本発明の実施の形態に係る動き予測処理装置の概要を示すブロック図である。
図1に示す動き予測処理装置1は、例えば、動画像信号を圧縮符号化する符号化装置、および、符号化された動画像信号を復号化する復号化装置に設けられて、フレーム間の動き予測処理を行うものである。この動き予測処理は、動画像の各フレームを一定の領域に分割した基本ブロックを単位として行われる。基本ブロックは、例えば16×16のブロックサイズを有する。
本実施の形態に係る動き予測処理装置1は、特に、動き予測処理に用いる参照画像の動きベクトルに基づいて、現処理対象画像の所定ブロックの動きベクトルを直接演算する、いわゆる「ダイレクト・モード」の処理を実行するために設けられるものである。このダイレクト・モードの処理のために、動き予測処理装置1は、書き込み制御手段2と、読み出し制御手段3と、ベクトル演算手段4とを具備する。また、ダイレクト・モードの処理のために、ベクトル格納メモリ10と、2つのバッファ11および12とが利用される。ベクトル格納メモリ10は、複数のメモリ領域10−1,2,3,……に分割されており、領域ごとに連続的なアドレスで書き込みおよび読み出しを行うことが可能となっている。また、バッファ11および12は、それぞれFIFO方式でデータを記憶する。なお、ベクトル格納メモリ10、バッファ11および12の各機能は、どちらも動き予測処理装置1の外部に設けられていても、内部に設けられていてもよい。
書き込み制御手段2は、動き予測処理の現処理対象画像が参照する参照画像20の動きベクトルを、その参照画像20上の水平方向に並列された1列分の基本ブロックに対応するブロックライン20−1,2,3,……を単位として、メモリ領域10−1,2,3,……のいずれかに書き込む。
読み出し制御手段3は、ベクトル格納メモリ10から2つのバッファ11および12に対して、動きベクトルをメモリ領域10−1,2,3,……ごとに読み出す。このとき、参照画像20および現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モード(H.264のMBAFFモードに対応)であるか否かの組み合わせに応じて、メモリ領域10−1,2,3,……のデータをどのようにバッファ11および12に読み出すかを制御する。
ベクトル演算手段4は、各バッファ11および12から順次読み出した動きベクトルを用いて、現処理対象画像の所定の基本ブロックの動き予測処理に必要な動きベクトルを予測演算する。すなわち、ベクトル演算手段4は、ダイレクト・モードにおける動きベクトルの演算(ダイレクト演算)を実行するブロックである。
ここで、ダイレクト・モードおよびブロック適用型予測モードに対応する動き予測処理機能では、上記の読み出し制御手段3が判別している各画像の状態の組み合わせが非常に多岐にわたることから、制御を簡単にするために、参照画像20の内部で分割されたブロックを、最小サイズのブロック(例えば4×4)に変換し、各ブロックに動きベクトルを割り当ててメモリに記憶していた。このため、元の参照画像20に対して算出されていた数より多くの動きベクトルがメモリに記憶され、それらがダイレクト演算機能に対して読み出されることから、メモリに対するアクセス回数が増大していた。
これに対して、本実施の形態の動き予測処理装置1では、参照画像20についての動きベクトルは、最小サイズのブロックに展開されることなく、その数だけベクトル格納メモリ10に格納される。また、ベクトル格納メモリ10に対する読み書きは、ブロックライン20−1,2,3,……を単位として動きベクトルを格納するメモリ領域10−1,2,3,……ごとに行われるので、ブロックライン20−1,2,3,……に相当する必要最小限の動きベクトルが1回のアクセスで(すなわち連続したアドレス指定により)読み書きされる。従って、ベクトル格納メモリ10に対するアクセス回数が必要最小限に抑制されて、ダイレクト演算に伴う処理負荷が軽減されるので、処理速度を高速化し、その消費電力を低減することができる。
また、読み出し制御手段3の制御により、参照画像20および現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて、ベクトル格納メモリ10から2つのバッファ11および12へのメモリ領域10−1,2,3.……ごとの動きベクトルの読み出しが制御される。これにより、各画像の条件の組み合わせに応じて、ベクトル演算手段4が必要な動きベクトルをバッファ11および12の出力から確実に取り出せるように、動きベクトルの出力順を変換することができる。すなわち、ベクトル演算手段4は、バッファ11および12から順次動きベクトルを読み出すことで、所望の位置の基本ブロックの動きベクトルを確実に取得して、必要最小限の回数だけ動きベクトルを演算することができる。
なお、これらの各画像についての条件の組み合わせと、各メモリ領域10−1,2,3,……からバッファ11および12への読み出し手順とをあらかじめテーブルに記載しておき、このテーブルに従ってベクトル格納メモリ10から2つのバッファ11および12への読み出しを制御することで、読み出し制御手順を一層単純化することができる。
以上より、本実施の形態に係る動き予測処理装置1では、ダイレクト・モードを用いた動き予測処理の適応範囲を拡張することができ、なおかつ、その動き予測処理の負荷を軽減することができる。特に、参照画像20と現処理対象画像との間のフレーム/フィールド種別が異なる場合や、少なくとも一方がブロック適用型予測モードである場合でも、比較的簡単な処理でダイレクト演算を確実に実行できるようになる。
次に、H.264に基づく符号化および復号化処理を行う画像符号化装置および画像復号化装置を例に挙げて、本発明の実施の形態についてより具体的に説明する。H.264では、16×16のMB(以下、基本MBと呼ぶ)に加え、16×8、8×16、および8×8の4種類のMBが選択可能となっている。さらに、8×8サイズのMBについては、8×8、8×4、4×8、4×4の4種類のサブMB分割を指定することもできる。基本的なアルゴリズムは、符号化処理では、フレームまたはフィールドを基本MBに分割し、それらの基本MBごとに、フレーム内の空間的冗長性を利用したフレーム内予測と、フレーム間の時間的冗長性を利用したフレーム間予測とを適宜切り替えて、入力画像の符号化を行う。復号化処理では、その逆動作が行われる。
図2は、実施の形態に係る画像符号化装置の構成を示すブロック図である。
図2に示す画像符号化装置100は、MB分割部101、動きベクトル検出部102、過去のフレームバッファ103、フレーム間予測部104、フレーム内予測部105、現フレームバッファ106、予測モード選択部107、減算器108、直交変換量子化部109、エントロピー符号化部110、逆量子化逆直交変換部111、加算器112、デブロッキングフィルタ113、およびフレームバッファ管理部114を具備する。
このような画像符号化装置100では、入力画像は、MB分割部101によって所定の大きさのMBに分割される。動きベクトル検出部102は、入力されたMB単位の画像データと、過去のフレームバッファ103に格納される参照画像のデータとを用いて、対象MBの動きベクトルを検出する。動きベクトルは、通常、周辺領域との相関が高いので、フレーム間予測部104は、周辺領域の動きベクトルを基にして動きベクトル予測値を算出し、動きベクトル検出部102で検出された動きベクトルとの間の予測差分値(MVD)を算出する。一方、フレーム内予測部105は、現フレームバッファ106に格納された画像のフレーム内予測を行う。
予測モード選択部107は、フレーム間予測部104とフレーム内予測部105との予測誤差を比較するなどして、当該MBを最も効率よく符号化することができる符号化モードを選択し、符号化モード情報を生成する。この符号化モード情報は、符号化対象情報としてエントロピー符号化部110へ受け渡される。符号化モード情報には、MBを分割した分割MBのサイズと、分割MBをさらに分割したサブMBのサイズが含まれる。
予測モード選択部107によりフレーム内予測が選択される場合は、MB分割部101を経由したMBの画像データがそのまま直交変換量子化部109へ出力され、直交変換と量子化が施される。こうして生成された直交変数係数データは、エントロピー符号化部110へ受け渡される。また、この直交変換係数データは、逆量子化逆直交変換部111によってデコードされ、現フレームバッファ106に書き込まれる。
予測モード選択部107によりフレーム間予測が選択される場合は、フレーム間予測部104が算出した動きベクトルの予測差分値が符号化対象として選択され、エントロピー符号化部110へ受け渡される。また、フレーム間予測部104では、算出された動きベクトル予測値と過去のフレームバッファ103内の画像データとを基に予測画像が生成され、予測モード選択部107経由で減算器108へ出力される。減算器108では、MB単位の入力画像と、予測画像との差分が算出され、直交変換量子化部109へ出力される。この出力は、逆量子化逆直交変換部111によってデコードされ、加算器112によって予測モード選択部107からの予測画像が加算された後、現フレームバッファ106に書き込まれる。
エントロピー符号化部110は、符号化対象データのエントロピー符号化を行い、画像圧縮符号化信号として出力する。また、現フレームバッファ106に格納された参照画像は、デブロッキングフィルタ113によりMB境界が平滑化され、フレームバッファ管理部114を経由して、過去のフレームバッファ103に格納される。
図3は、実施の形態に係る画像復号化装置の構成を示すブロック図である。
図3に示す画像復号化装置200は、エントロピー復号化部201、逆量子化逆直交変換部202、加算器203、現フレームバッファ204、フレーム内予測部205、予測モード選択部206、デブロッキングフィルタ207、フレームバッファ管理部208、過去のフレームバッファ209、およびフレーム間予測部210を具備して、図2に示した画像符号化装置100が生成した画像圧縮符号化データを復号化する。
画像圧縮符号化データは、エントロピー復号化部201によってエントロピー復号化処理が施された後、逆量子化逆直交変換部202によって逆量子化と逆直交変換が施される。フレーム間予測によって符号化されている場合は、予測差分値(MVD)の形式で符号化されている動きベクトルデータを復号化する。予測モード選択部206は、復号化された符号化モード情報に基づき、フレーム内予測部205またはフレーム間予測部210を選択する。
予測モード選択部206によりフレーム内予測部205が選択される場合は、逆量子化逆直交変換部202によって復元された画像が現フレームバッファ204に書き込まれる。予測モード選択部206によりフレーム間予測部210が選択される場合は、フレーム間予測部210は、動きベクトルの予測差分値と、予測対象のブロックの周囲ブロックから算出した動きベクトル予測値とを加算して動きベクトルを復元する。そして、復元された動きベクトルと過去のフレームバッファ209内の参照画像のデータとを基にして、予測画像を復元し、予測モード選択部206経由で加算器203に入力する。この予測画像と、逆量子化逆直交変換部202により復号化された予測誤差とが加算器203で加算されることによって、画像が復号化されて現フレームバッファ204に格納される。
現フレームバッファ204に格納された画像データは、デブロッキングフィルタ207によりMB境界が平滑化された後、フレームバッファ管理部208を経由して過去のフレームバッファ209に格納され、復号化された画像データとして出力されるとともに、参照画像としてフレーム間予測部210に利用される。
ここで、本実施の形態では、特に、Bピクチャの符号化および復号化の際に、現処理対象ブロックの動きベクトルを、参照画像内の対応するブロックの動きベクトルから演算により直接求めるダイレクト・モードに対応している。画像符号化装置100において、ダイレクト・モードでは、フレーム間予測部104は、表示順で直後の参照画像内の同じ空間位置のブロックの動きベクトルを、ピクチャ間の時間距離に応じて内分し、双方向の動きベクトルを求める。そして、このように予測された動きベクトルが、動きベクトル検出部102で求められた動きベクトルと比較してある程度の精度を満たせば、ダイレクト・モードを示すモード情報のみを符号化対象とし、動きベクトルの予測差分値を符号化対象としない。これにより符号量が圧縮される。また、画像復号化装置200において、ダイレクト・モードが設定されたBピクチャを復号化する場合には、フレーム間予測部210の処理により、参照画像内の同じ空間位置のブロックの動きベクトルから、上記と同様の演算方法により現処理対象ブロックの動きベクトルが復元される。
このように、ダイレクト・モードにより動きベクトルを演算するためには、参照画像の動きベクトルをメモリに格納しておき、現処理対象ブロックの動きベクトル演算の際に、参照画像内の対応ブロックの動きベクトルをそのメモリから読み出す必要がある。すなわち、画像符号化装置100のフレーム間予測部104と、画像復号化装置200のフレーム間予測部210の双方に、このような動きベクトル格納用のメモリと、その書き込み・読み出しのための制御機能を設ける必要がある。
以下、このようなダイレクト・モード対応のためのメモリ制御機能の構成について、具体的に説明する。以下の実施の形態では、特に、ピクチャごとの符号化タイプとしてFRM、FLD、MBAFFのすべてに対応可能となっている。現処理対象のピクチャ(CurrPic)と、このCurrPicの予測に用いるピクチャ(ColPic)との間における上記の符号化モードの組み合わせ、およびブロック分割方式の組み合わせが多数存在するために、従来ではダイレクト・モードでのメモリに対する動きベクトルの書き込み・読み出しの制御が非常に複雑になり、メモリアクセス回数が膨大になっていた。これに対して、本実施の形態では、必要最小限の動きベクトルのみをメモリに格納するようにして、メモリアクセス回数を抑制するとともに、2つの内部バッファと、符号化モードおよびブロック分割方式の組み合わせに応じたテーブルとを用いて読み出しを制御することで、メモリアクセス制御を簡略化する。
図4は、ダイレクト・モード対応のためのメモリ制御機能の構成例を示すブロック図である。
なお、以下の説明では、例として、画像復号化装置200のフレーム間予測部210に設けられるメモリ制御機能を挙げるが、画像符号化装置100のフレーム間予測部104にも同様の構成のメモリ制御機能を設けることができる。
図4に示すように、フレーム間予測部210は、動きベクトルの演算を行うMV生成部310、ダイレクト・モードのために動きベクトルを一時的に保持する外部メモリ320、上記のメモリ制御機能としてのMV書き込み制御部330、2つの内部バッファ341および342、MV読み出し制御部350、および分割サイズ統合部360を具備している。なお、ここでは、外部メモリ320は、フレーム間予測部210(または画像復号化装置200)を構成する回路の外部に設けられているものとする。例えば、この外部メモリ320が他の機能ブロックとの間で共用されてもよい。
MV生成部310は、動き補償のための動きベクトルを生成するブロックであり、基本的には、入力された画像圧縮符号化データから復元された動きベクトルの予測差分値を基に、動きベクトルを復元する。また、このMV生成部310は、外部メモリ320から読み出されたColPicの動きベクトルを基にCurrPicの動きベクトルを演算するダイレクトMV(Direct MV)演算部311を備えている。フレーム間予測部210では、復号対象のブロックにダイレクト・モード以外の予測モードが設定されていた場合は、予測差分値を基に復元された動きベクトルを用いて動き補償が行われ、ダイレクト・モードが設定されていた場合には、ダイレクトMV演算部311で算出された動きベクトルを用いて動き補償が行われる。そして同時に、動き補償に用いられた動きベクトルが、MV書き込み制御部330を介して外部メモリ320に格納される。
なお、図4の構成を画像符号化装置100に適用する場合、MV生成部310では、ダイレクト・モード以外の予測モードが設定された場合には、動きベクトル検出部102で検出された動きベクトルがMV書き込み制御部330に出力され、ダイレクト・モードが設定されていた場合には、ダイレクトMV演算部311で演算された動きベクトルがMV書き込み制御部330に出力される。
外部メモリ320は、少なくとも1フレーム分のColPicの動きベクトルを格納できる記憶容量を備えたFIFO(First In/First Out)方式のメモリであり、例えばSDRAM(Synchronous Dynamic Random Access Memory)などからなる。外部メモリ320は、後述するように、少なくとも、16×16の基本MBが水平方向に並列されたライン(以下、MBラインと呼ぶ)のライン数N(Nは2以上の整数)だけのメモリ領域320−1〜320−Nに分割されている。メモリ領域320−1〜320−Nはそれぞれ同じ記憶容量を備えている。
MV書き込み制御部330は、MV生成部310からの動きベクトルを、ColPicの動きベクトルとして外部メモリ320に対して書き込むための書き込み動作を制御する。このとき、後述するように、このColPicとこれを参照するCurrPicの各符号化タイプがどのような組み合わせであっても対応し易くなるように、ColPicの動きベクトルを外部メモリ320の適切な記憶領域に書き込む。
このMV書き込み制御部330は、外部メモリ320に対する書き込みアドレスのオフセット値を出力するオフセット出力部331を備えている。オフセット出力部331は、入力されたCurrPicの符号化タイプがMBAFFか否かを示すフラグである「MBAFF」と、FLDであるか否かを示すフラグである「FIELDFLG」とを基に、CurrPicの符号化タイプを判別する。また、現処理対象のMB(CurrMB)がフィールド構造の場合は、「BOTTOMFLG」を基にフィールド種別(トップ・フィールドまたはボトム・フィールド)を判別する。さらに、「MBPOSY」を基にCurrMB(ここでは16×16の基本MBを指す)の垂直位置を判別する。そして、これらの判別結果を基にオフセット値を発生する。MV書き込み制御部330は、オフセット出力部331からのオフセット値を先頭にして外部メモリ320に対する書き込みアドレスWADを発生し、書き込みイネーブル信号WENの出力期間に書き込みデータWDTとして動きベクトルを出力する。
内部バッファ341および342は、それぞれFIFO方式のバッファメモリであり、MV読み出し制御部350からの制御の下で、外部メモリ320から読み出された動きベクトルを一時的に格納した後、MV読み出し制御部350に出力する。
MV読み出し制御部350および分割サイズ統合部360には、動きベクトルの演算対処とされているCurrPicに関する「MBPOSY」が変化するごとに、外部メモリ320のメモリ領域320−1〜320−Nの先頭を示すように読み出しアドレスをオフセットさせるオフセット出力部370が設けられている。また、MV読み出し制御部350および分割サイズ統合部360には、CurrPicとColPicの各符号化タイプの組み合わせに応じて外部メモリ320からの動きベクトルの読み出しモードを判定するための読み出しモード判定テーブル381と、この読み出しモードとMBColのブロック分割状態(以下、MBタイプと呼ぶ)とに応じてCurrMBのMBタイプを判定するためのMBタイプ判定テーブル382とが接続されている。
MV読み出し制御部350は、「MBAFF」「FIELDFLG」「BOTTOMFLG」の各フラグに基づくCurrPicの符号化タイプおよびフレーム構造/フィールド構造の種別(以下、フレーム/フィールド種別と呼ぶ)と、ColPicの符号化タイプおよびフレーム/フィールド種別とを基に、読み出しモード判定テーブル381に従って外部メモリ320から動きベクトルを読み出し、内部バッファ341および342を介してそれらの動きベクトルを分割サイズ統合部360に出力する。ここで、読み出しモード判定テーブル381に従い、必要に応じて外部メモリ320からの動きベクトルを2つの内部バッファ341および342に振り分けて読み出すことで、CurrMB内の各ブロックの動きベクトルをダイレクト演算するために必要な動きベクトルが適切な順番で確実に読み出される。
分割サイズ統合部360は、MBタイプ判定テーブル382に従い、MV読み出し制御部350が読み出した動きベクトルを適用すべきCurrMBのMBタイプを、ColPicのMB(MBCol)のMBタイプに応じて決定する。この処理により、CurrMB内で分割されたブロックが必要に応じて統合されてブロック数が減少し、ダイレクトMV演算部311に演算させる動きベクトルの数(符号化時には符号化対象となる動きベクトルの数)を減らすことができる。
以下、上記のメモリ制御機能について、より詳しく説明する。まず、外部メモリ320に対する動きベクトルの書き込み制御について説明する。
図5は、MV書き込み制御部の内部構成例を示すブロック図である。
図5に示すように、MV書き込み制御部330は、上述したオフセット出力部331と、ライトアドレス生成部332と、ライトデータ生成部333とを備えている。ライトアドレス生成部332は、オフセット出力部331からのオフセット値をMBラインごとの書き込みアドレスの先頭として、MV生成部310からの動きベクトルMVと、MBごとのヘッダ情報とを書き込むための書き込みアドレスWADを生成する。ライトデータ生成部333は、MV生成部310において動きベクトルMVが生成される際に識別されたMBの分割サイズの情報を基にヘッダ情報を生成し、そのヘッダ情報と動きベクトルMVとを書き込みデータWDTとして外部メモリ320に出力する。以上の構成により、MV書き込み制御部330は、次の図6に示すようなフォーマットで動きベクトルMVを外部メモリ320に格納する。
図6は、外部メモリにおけるColPic格納フォーマットを示す図である。
なお、この図6において、「MB_POS」は、16×16の基本MBのピクチャ内での水平方向、垂直方向の位置を示す。また、ラインサイズ(LINESIZE)は、外部メモリ320に割り当てられた1MBライン分の記憶領域の容量を示し、これらはメモリ領域320−1〜320−Nのそれぞれの容量に対応する。
符号化タイプ(Coding Type)がFRMの場合、動きベクトルは、外部メモリ320内のメモリ領域320−1〜320−Nに対して、MBラインごとに順次、格納されていく。
また、符号化タイプがFLDの場合、まず、トップ・フィールドのMBラインの動きベクトルが、メモリ領域320−1〜320−Nのうちの奇数番号領域に順次格納された後、続いてボトム・フィールドのMBラインの動きベクトルが偶数番号領域に順次格納される。これにより、トップ・フィールドのMBライン、およびボトム・フィールドのMBラインの各動きベクトルが、外部メモリ320内のメモリ領域320−1〜320−Nに対して交互に格納される。すなわち、フィールド構造の画像データがフレーム構造のデータ順に変換された状態となる。
符号化タイプがMBAFFの場合、ピクチャ内のMBは上下に隣接した基本MBのペア(MBペア)を単位として処理されることから、外部メモリ320においては、水平方向に並列されたMBペアの1列(MBペア・ラインと呼ぶ)分に対して、2ラインサイズ分の領域(すなわちメモリ領域320−1〜320−Nのうちの隣接する2領域)が割り当てられて、MBペアの処理順に外部メモリ320に格納される。
ここで、上記のいずれの符号化タイプの場合にも、MB内のブロック分割状態はMBごとに異なるので、メモリ領域320−1〜320−N(MBAFFの場合は2領域のそれぞれ)に格納される情報量はそれぞれ異なる。符号化タイプがFRMおよびFLDの場合には、各メモリ領域320−1〜320−Nでは、対応するMBラインの動きベクトルがすべて格納されたときに余剰スペースが存在する場合でも、次のMBラインの動きベクトルは次のメモリ領域の先頭から書き込まれる。同様にMBAFFの場合には、MBペア・ライン単位の各割り当て領域では、対応するMBペア・ラインの動きベクトルがすべて格納されたときに余剰スペースが存在する場合でも、次のMBペア・ラインの動きベクトルは次の割り当て領域の先頭から書き込まれる。
このような書き込みが行われることにより、従来のように、ColPic内のブロックをすべて最小単位の4×4のサブMBに変換し、このサブMBの数だけ動きベクトルをメモリ上に展開した場合と比較して、メモリ内に格納される動きベクトルの数が抑制される。従って、書き込み時のメモリアクセス回数、および、この後にMV読み出し制御部350によって動きベクトルが読み出される際のメモリアクセス回数の双方ともに抑制することができ、処理速度を高めることができる。
次に、外部メモリ320からのデータ読み出し制御について詳しく説明する。
まず、図7は、読み出しモード判定テーブルの内容を示す図である。
読み出しモード判定テーブル381には、図7に示すように、ColPicの符号化タイプおよびフレーム/フィールド種別と、CurrPicの符号化タイプおよびフレーム/フィールド種別とのすべての組み合わせに対して、「0」〜「6」までの7種類の読み出しモードのいずれかが設定されている。なお、図7以降の図では、MBのフレーム/フィールド種別について、フレーム構造のMBを「frm」、フィールド構造のMBを「fld」と表す。
MV読み出し制御部350は、読み出しモード判定テーブル381を参照し、ColPicの符号化タイプおよびフレーム/フィールド種別と、CurrPicの符号化タイプおよびフレーム/フィールド種別との組み合わせに対応する読み出しモードを選択し、そのモードに従って、外部メモリ320に格納された動きベクトルを内部バッファ341および342に読み出す。
また、図7では、各読み出しモードにおいて使用する内部バッファ341および342の数も参考のために記載しており、「1」の場合は内部バッファ341のみが使用され、「2」の場合は内部バッファ341および342の両方が使用されることを意味する。さらに、読み出しモード判定テーブル381には、CurrMBとMBColとの間のフレーム/フィールド種別の組み合わせに応じたモード情報である「MBColMode」も設定されている。
なお、CurrPicの符号化タイプがMBAFF、ColPicの符号化タイプがFRMとなる組み合わせは、H.264の規格上存在しないため、読み出しモード判定テーブル381には設定されていない。
ここで、図8および図9を用いて、MBColMode0〜4によって分類されるCurrMBとMBColとの間の関係について説明し、その後に、各読み出しモードでの読み出し手順について具体的に説明する。
図8および図9は、CurrMBとMBColとの間のフレーム/フィールド種別の代表的な組み合わせと、ブロック間の対応関係について説明するための図である。
MBColMode0では、CurrMBおよびMBColがともにフレーム構造(ただし、符号化タイプがともにFRM)になっており、この場合のCurrMBおよびMBColの最小のブロックは、図8(A)のように、ともに4×4のサイズとなる。従って、CurrMB内の各ブロックの動きベクトルは、MBCol内の同じ位置のブロックの動きベクトルからダイレクト演算することができるので、ダイレクト演算の際にはMBCol内のブロックをブロック処理順に取得できればよい。なお、図8および9では、ブロックの中に数字が付されているが、この数字は、CurrMB内のブロックの動きベクトルが、同じ数字が付されたMBCol内のブロックから演算できることを意味している。
MBColMode1では、CurrMBおよびMBColがともにフレーム構造(ただし、符号化タイプがともにMBAFF)、あるいは、CurrMBおよびMBColがともにフィールド構造(符号化タイプはそれぞれFRMまたはMBAFFのいずれか)になっている。これらの組み合わせでは、図8(B)のように、MBColの最小ブロックは4×4であるが、CurrMBの最小ブロックは8×8となる。このため、CurrMB内のMB501〜504の各動きベクトルは、それぞれMBCol内のサブMB505〜508のみからダイレクト演算される。
MBColMode2および3では、CurrMBがフレーム構造(符号化タイプはFRMまたはMBAFFのいずれか)、MBColがフィールド構造(符号化タイプはFLD)になっている。ただし、MBColMode2は、CurrMBの奇数ライン演算時に対応し、MBColMode3は、CurrMBの偶数ライン演算時に対応する。これらの組み合わせでは、図9(A)および(B)のように、MBColの最小ブロックは4×4であるが、CurrMBの最小ブロックは8×8となる。
MBColMode2では、図9(A)に示すように、CurrMB内のMB511〜514の各動きベクトルは、それぞれMBCol内のサブMB515〜518からダイレクト演算される。一方、MBColMode3では、図9(B)に示すように、CurrMB内のMB521〜524の各動きベクトルは、それぞれ図9(B)と同じMBCol内のサブMB525〜528からダイレクト演算される。従って、上記の符号化タイプの組み合わせでは、CurrMBの奇数ライン、偶数ラインの各ベクトル演算のために、それぞれ同じMBColのデータを個別に取得する必要がある。
MBColMode4は、上記各モード以外の場合に適用される。図9(C)ではこれらのうち、CurrMBがフィールド構造(符号化タイプはFLD)、MBColがフィールド構造(符号化タイプはFLD)の場合を示している。この場合、CurrMBの動き予測には、トップ・フィールド用およびボトム・フィールド用に上下に隣接する2つのMBColをそれぞれ参照する必要がある。図9(C)に示すように、CurrMB内のMB531および532の各動きベクトルは、それぞれMBCol内のサブMB535および536からダイレクト演算され、CurrMB内のMB533および534の動きベクトルは、1つ下側に隣接するMBCol内のサブMB537および538からそれぞれダイレクト演算される。
次に、図10〜図12は、各読み出しモードでの読み出し手順について説明するための図である。また、図13〜図19は、各読み出しモードでのMBColとMBColとの対応について説明するための図である。
なお、図10〜図12において、丸印の中の数字はデータ読み出しの順番を示している。また、図13〜図18において、上段は、外部メモリ320に対するMBColの書き込み順、中段は、読み出しモードを適用したときの外部メモリ320からのMBColの読み出し順、下段は、CurrMBのダイレクト演算時の処理順をそれぞれ示しており、点線矢印は、上段からそれぞれデータの書き込み順、読み出し順、演算処理順を示している。また、基本MB内のブロック分割状態についてはあくまで例であり、「MV0,MV1,……」は、各基本MBに含まれる動きベクトルを、基本MB内での処理順に従って記載したものである。
読み出しモード0は、CurrPic、ColPicの符号化タイプがともにFLDの場合に設定される。このような組み合わせの場合は、MBColとCurrMBの関係は図8(B)のようになるので、各フィールドのCurrMBの動きベクトルを演算するには、それぞれ対応するフィールドのMBColを外部メモリ320から順次読み込めばよい。
このことから、読み出しモード0では、図10(A)に示すように、トップ・フィールドのデータ読み出し時には、外部メモリ320内のトップ・フィールドのMBライン(Top_0,Top_1,……)のデータを、順次内部バッファ341に対して読み出す。すなわち、外部メモリ320上のメモリ領域320−1〜320−Nのうち、奇数番号の領域のデータが順次内部バッファ341に読み出される。また、ボトム・フィールドのデータ読み出し時には、同様に、ボトム・フィールドのMBライン(Bottom_0,Bottom_1,……)のデータ(すなわち、偶数番号のメモリ領域のデータ)が順次内部バッファ341に読み出される。
ここで、図13では、上記符号化タイプの組み合わせでのトップ・フィールドに対応するColPic601およびCurrPic602を示している。ColPic601のデータは、図13の上段に示すような順序で外部メモリ320に格納されているので、ColPic601のデータを外部メモリ320からフィールド別にメモリ領域順に読み出したときのMBColの出力順(図13の中段参照)は、同図下段に示すように、CurrPic602内のCurrMBをフィールド別に処理する際の処理順と一致する。従って、図10(A)の読み出し順でトップ・フィールド(またはボトム・フィールド)のMBColを順次内部バッファ341に転送し、この内部バッファ341からMBごとに順次データを取得することで、ダイレクト・モードが設定されたCurrMB(例えばMB603)の演算に必要なMBCol(例えばMB604)の動きベクトルを確実に取得できる。
読み出しモード1は、CurrPic、ColPicの符号化タイプがそれぞれFLD、FRMの場合に設定される。この符号化タイプの組み合わせでは、図9(C)で説明したように、CurrMBのトップ・フィールド用とボトム・フィールド用の各動きベクトルを演算するために、上下に隣接する2つのMBColのデータが必要となる。このため、読み出しモード1では、図10(B)に示すように、2つの内部バッファ341および342を使用し、外部メモリ320上の隣接する2つのMBライン(MBLine_0とMBLine_1など)のデータ(すなわち隣接するメモリ領域のデータ)をそれぞれ並列に内部バッファ341および342に読み出す。
ここで、ColPic611のデータは、図14の上段のような順序で外部メモリ320に格納されている。一方、CurrPic612内のCurrMBは、フィールドごとに図14の下段のような順で処理される。例えば、CurrPic612内のMB613に対応するCurrMBにダイレクト・モードが設定されていたとすると、このMB613の動きベクトルをダイレクト演算するためには、ColPic611内のMB614および615の両方のデータが必要となる。
そこで、読み出しモード1では、図14の中段に示すように、MB614のデータを含むMBラインと、MB615のデータを含むMBラインとがそれぞれ内部バッファ341および342に並列に供給される。従って、内部バッファ341および342のそれぞれからMBごとに順次データを取得することで、所望のMBCol(ここではMB614および615)のデータを確実に取得できる。
読み出しモード2は、CurrPic、ColPicの符号化タイプがそれぞれFRM、MBAFFの場合に設定される。図15の上段に示すように、符号化タイプがMBAFFであるColPic621のデータは、MBペア・ラインごとに外部メモリ320の各メモリ領域320−1〜320−Nに格納されている。一方、図15の下段では、トップ・フィールド(またはボトム・フィールド)に対応するCurrPic622を示しているが、このCurrPic622上の所望のCurrMBの動きベクトルをダイレクト演算したい場合には、ColPic621上のデータをMBペア単位で取得する必要がある。例えば、CurrPic622上のMB623のダイレクト演算のためには、ColPic621上のMB624および625のデータが必要となる。
従って、読み出しモード2では、図15の中段および図11(A)に示すように、外部メモリ320内のMBペア・ライン(図11(A)におけるMBLine0,1のペア、MBLine2,3のペア、……)のデータを、順次内部バッファ341に読み出せばよい。すなわち、実際の動作では、メモリ領域320−1〜320−Nのデータを順次内部バッファ341に転送し、内部バッファ341の出力からMBペア単位でデータを読み出すことで、所望のMBColの動きベクトルを確実に取得できる。
読み出しモード3は、CurrPic、ColPicの符号化タイプがそれぞれFRM、FLDの場合に設定される。このような組み合わせの場合は、図9(A)および(B)で説明したように、CurrPicの奇数ラインの動きベクトルを、ColPicの所定MBラインのデータから演算した後、その同じColPicのMBラインのデータから、CurrPicの偶数ラインの動きベクトルを演算する必要がある。このため、読み出しモード3では、図11(B)に示すように、外部メモリ320内のトップ・フィールドのMBライン(Top_0,Top_1,……)のデータ(すなわち奇数番号のメモリ領域のデータ)が2回ずつ、内部バッファ341に順次読み出される。
ここで、ColPic631のデータは、図16の上段に示すように、まずトップ・フィールドのMBラインのデータが外部メモリ320内の奇数番号のメモリ領域に書き込まれた後、ボトム・フィールドのMBラインのデータが偶数番号のメモリ領域に書き込まれる。そして、読み出しモード3では、図16の中段に示すように、奇数番号のメモリ領域からMBColのデータが2回、内部バッファ341に転送された後、次の奇数番号のメモリ領域からMBColのデータが同様に2回、内部バッファ341に転送される。
これにより、内部バッファ341からは、同じMBライン上のMBColのデータが2回連続して出力される。従って、図16の下段のように、CurrPic632内の例えばMB633の動きベクトルをダイレクト演算したいときは、まず、奇数ラインの演算のためにColPic631のMB634のデータを取得でき、続いて偶数ラインの演算のために同じMB634のデータを取得できるようになる。
読み出しモード4は、CurrPic、ColPicの符号化タイプがともにFRMの場合に設定される。このような組み合わせの場合は、MBColとCurrMBの関係は図8(A)のようになるので、CurrMBの動きベクトルをダイレクト演算するには、MBColのデータをブロック処理順に読み込めばよい。従って、読み出しモード4では、図12(A)のように、外部メモリ320内のMBライン(MBLine0,MBLine1,……)のデータ(すなわちメモリ領域320−1〜320−Nのデータ)を、内部バッファ341にMBライン順に読み出す。なお、図17では、ColPic641のデータを外部メモリ320からメモリ領域順に読み出したときのMBColの出力順が、CurrPic642内のCurrMBの処理順と一致することを示している。
読み出しモード5は、CurrPic、ColPicの符号化タイプがそれぞれMBAFF、FLDの場合に設定される。このような組み合わせの場合は、MBColとCurrMBとの関係は、図9(A)および(B)に示したCurrMBを、それぞれMBペアの上側、下側と考えたときと同じである。このため、CurrPicではMBペアを単位として動きベクトルが演算されるため、外部メモリ320のMBColのデータを上下の組み合わせで順次取得する必要がある。そこで、読み出しモード5では、図12(B)に示すように、隣接するMBラインのうちの上側のデータ(例えばTop_0のデータ)を内部バッファ341に対して、下側のデータ(例えばBottom_0のデータ)を内部バッファ342に対して、それぞれ並列に読み出す。すなわち、メモリ領域320−1〜320−Nのうち、奇数番号のメモリ領域を内部バッファ341に、偶数番号のメモリ領域を内部バッファ342に読み出す。
図18の上段では、ColPic651のデータの外部メモリ320への書き込み順を、トップ・フィールド、ボトム・フィールドの各データ(ColPic651aおよび651b)として示している。図6のフォーマットにより、各フィールドにおける同じMBラインのデータは、外部メモリ320上では隣接するメモリ領域に格納される。一方、図18の下段のように、CurrPic652のダイレクト演算はMBペア単位で実行される。
従って、図18の中段のように、隣接するMBラインのうちの上側および下側のデータをそれぞれ内部バッファ431および432に対して並列に転送することにより、各内部バッファ341および342からMBペア単位でデータを確実に取り出すことができるようになる。例えば、CurrPic652上のMBペア653にダイレクト・モードが設定されていたときには、ColPic651上のMB654および655のデータを連続して取得し、演算に適用できるようになる。
読み出しモード6は、CurrPic、ColPicの符号化タイプがともにMBAFFの場合に設定される。この場合には、図19の上段および下段に示すように、ColPic661のデータの外部メモリ320への書き込み順と、CurrPic662の処理順とが一致する。従って、読み出しモード6では、図12(C)および図19の中段に示すように、外部メモリ320内のMBペア・ライン(MBLine0,1のペア、MBLine2,3のペア、……)のデータが、順次内部バッファ341に読み出される。すなわち、メモリ領域320−1〜320−Nのデータが順次内部バッファ341に読み出されることになる。
ここで、図20は、MV読み出し制御部が備える内部バッファの読み出し制御機能の構成例を示すブロック図である。
MV読み出し制御部350は、上記機能として、リードアドレス生成部351および352と、ヘッダ情報解析部353および354と、ColMV格納部355および356と、セレクタ357とを具備している。
リードアドレス生成部351および352は、それぞれ内部バッファ341および342に対する読み出しアドレスを生成する。リードアドレス生成部351および352は、オフセット出力部370からのオフセット値の出力タイミングを基に、CurrPic内のMBラインごとの処理タイミングと同期する。セレクタ357は、リードアドレス生成部351および352からの出力アドレスを、それぞれ内部バッファ341および342に供給する。
ヘッダ情報解析部353および354は、それぞれ内部バッファ341および342に格納されたColPicのデータのうち、MBColごとに付加されているヘッダ情報を取得する。ヘッダ情報には、MBColの分割サイズの情報が格納されているので、ヘッダ情報解析部353および354は、そのヘッダ情報を解析してMBColのブロック分割数を判別し、それぞれリードアドレス生成部351および352に出力する。また、ヘッダ情報から抽出した分割サイズの情報は、分割サイズ統合部360に対しても出力される。
リードアドレス生成部351および352は、供給されたブロック分割数の分だけ、出力する読み出しアドレスをインクリメントする。これにより、内部バッファ341および342からは、MBColに含まれている動きベクトルが読み出される。内部バッファ341および342からの動きベクトルは、それぞれColMV格納部355および356に供給されて一旦格納された後、分割サイズ統合部360に出力される。
図21は、2つの内部バッファを用いた場合のデータ読み出しを模式的に説明するための図である。なお、この図21(次の図22も同様)では、基本MB内の各ブロックの動きベクトルを、基本MB内の処理順に従って「MV0,MV1,……」と示している。
図21では、例として読み出しモード1の場合について示している。この図において、ColPic701の動きベクトルは、外部メモリ320のメモリ領域320−1〜320−Nのそれぞれに対してMBラインごとに格納される。ColPic701では、基本MB(MBCol)ごとにブロックの分割サイズが異なるため、同図の中段に示すように、外部メモリ320のメモリ領域320−1〜3に格納される動きベクトルの数はそれぞれ異なる。すなわち、各MBラインの動きベクトルは可変長データとして外部メモリ320に格納される。
このような状態から、隣接するメモリ領域(ここではメモリ領域320−1および320−2)のデータが並列に読み出され、それぞれ内部バッファ341および342に対して転送される。このとき、1つのMBラインに対応する動きベクトルを、1つのメモリ領域から連続したアクセスにより(すなわち、連続した読み出しアドレスを指定することにより)読み出すことができる。
内部バッファ341および342でのデータ格納状態は、同図の下段のようになる。この状態から、ヘッダ情報解析部353および354が、内部バッファ341および342からヘッダ情報を並列に読み出して、ブロック分割数をリードアドレス生成部351および352に通知することで、その都度、ブロック分割数だけの動きベクトルが各内部バッファ341および342から出力される。このような制御により、例えばColPic701の基本MB702および703の動きベクトルを、内部バッファ341および342から同時に(あるいは連続的に)出力させ、ダイレクト演算に用いることが可能となる。
また、図22は、1つの内部バッファを用いた場合のデータ読み出しを模式的に説明するための図である。
図22では、例として読み出しモード6の場合について示している。この図において、ColPic711の動きベクトルは、MBペア・ライン単位で、外部メモリ320のメモリ領域320−1〜320−Nのうちの隣接する2つの領域に格納される。この場合も、各MBペア・ラインの動きベクトルは可変長データとして外部メモリ320に格納される。
このような状態から、隣接するメモリ領域(例えば、メモリ領域320−1,320−2)のデータが内部バッファ341に転送される。このとき、MBペア・ライン単位の動きベクトルを連続したアクセスで読み出すことができる。
内部バッファ341および342でのデータ格納状態は、同図の下段のようになるが、このように内部バッファ342にデータが格納されていない場合、ヘッダ情報解析部353のみが内部バッファ341からヘッダ情報を読み出し、ブロック分割数をリードアドレス生成部351に通知することで、そのブロック分割数だけの動きベクトルが内部バッファ341から出力される。これにより、例えばColPic711のMBペアである基本MB712および713の動きベクトルを、内部バッファ341から連続して取り出し、ダイレクト演算に用いることが可能となる。
ここでさらに、2つの内部バッファ341および342を用いた場合(読み出しモード1)のデータ読み出し手順の具体例を挙げて説明する。図23は、以下のデータ読み出し手順の説明に用いるMBラインのブロック構成例を示す図である。
ここでは、図23に示すようなブロック構造を持つMBライン721および722の各データが、外部メモリ320内の隣接するメモリ領域に記憶されているものとする。この図23に示すように、MBライン721および722は、MBCol731〜735、MBCol741〜745のそれぞれ5つの基本MBから構成されるが、MBライン721および722のそれぞれの先頭からの基本MBのブロック分割数や分割ブロックの大きさはまったく異なっている。
図24は、図23に示すような隣接するMBラインのデータを2つの内部バッファに格納する際のタイムチャートを示す図である。
なお、図24において、WEN_Buf1およびWEN_Buf2は、それぞれ内部バッファ341および342に対する書き込みイネーブル信号を示し、WAD_Buf1およびWAD_Buf2は、それぞれ内部バッファ341および342に対する書き込みアドレスを示し、WDT_Buf1およびWDT_Buf2は、それぞれ内部バッファ341および342に対する書き込みデータを示す。
ここでは、例として、図23に示したブロック構造を持つMBライン721および722のデータを、それぞれ内部バッファ341および342に並列に転送する際の動作例を示す。上述したMV書き込み制御部330の処理により、外部メモリ320には、各MBColのデータとして、ヘッダ情報に続いて動きベクトルのデータが格納されている。ヘッダ情報には、MBColの最小で8×8までのブロック分割サイズを示す「MB分割サイズ」と、8×8のMB内でのサブMBの分割サイズを示す「サブMB分割サイズ(0)〜(3)」が格納されている。なお、サブMB分割サイズ(0)〜(3)は、MB分割サイズが8×8のときだけ生成される。
スライスの先頭となるMBライン721および722の先頭データの読み出しは、タイミングT1において同時に開始される。期間P11〜P15では、それぞれMBライン721内のMBCol731〜735のヘッダ情報および動きベクトルの各データが内部バッファ341に転送される。また、期間P21〜P25では、それぞれMBライン722内のMBCol741〜745のヘッダ情報および動きベクトルの各データが内部バッファ342に転送される。
図25は、2つの内部バッファからデータを読み出す際のタイムチャートを示す図である。
なお、図25において、REN_Bufは、内部バッファ341および342に対して出力する読み出しイネーブル信号を示し、RAD_Bufは、内部バッファ341および342に対して出力する読み出しアドレスを示し、RDT_Bufは、内部バッファ341および342から読み出したデータを示す。
図25において、期間P31,P33,P35,P37は、内部バッファ341からデータが読み出される期間であり、期間P32,P34,P36,P38は、内部バッファ342からデータが読み出される期間である。各期間では、最初にヘッダ情報解析部353または354によってヘッダ情報が読み込まれた後、そのヘッダ情報から判別されたブロック分割数分の読み出しアドレスが発行されて、1つのMBColに対応する動きベクトルが読み出される。
この図25の例では、ヘッダ情報解析部353および354が、内部バッファ341および342から交互にヘッダ情報を読み込み、それに応じて動きベクトルの読み出しが直列に実行されている。これにより、上下に隣接するMBCol(例えば、図24のMBCol731および741、MBCol732および742など)の動きベクトルを、連続した期間に出力することができる。
なお、この他の動作例として、ヘッダ情報解析部353および354が、各内部バッファ341および342からヘッダ情報を同時に読み込み、動きベクトルを各内部バッファ341および342から並列に読み出させて、1つのMBColに対応するデータ読み出しが終了すると、次のヘッダ情報を読み込むようにしてもよい。
以上のように、本実施の形態では、ColPicとCurrPicとの間の符号化タイプ、フレーム/フィールド種別、およびブロック分割数の組み合わせに関係なく、CurrMBの動きベクトルのダイレクト演算に必要なMBColのデータを、外部メモリ320から確実に取り出すことができる。また、これらの組み合わせに応じた読み出し方法をテーブルにより選択するようにしたこと、ColPicのデータを格納する外部メモリ320を固定容量の領域に分割して、MBラインごと、またはMBペア・ラインごとにデータを格納したこと、外部メモリ320から2つの内部バッファ341および342を介して出力するようにしたことにより、比較的単純な回路構成によって上記効果を実現できる。特に、ColPicとCurrPicとの間でフレーム/フィールド種別が異なる場合や、符号化タイプとしてMBAFFが設定されていた場合でも、単純な回路構成によりダイレクト・モードに確実に対応できることの効果が大きい。
また、ColPicの動きベクトルを外部メモリ320に格納する際には、従来のように動きベクトルをすべて4×4の最小ブロック単位に展開することなく、元のMBColで生成された動きベクトルのみを格納するので、書き込みおよび読み出しの際の外部メモリ320へのアクセス回数およびアクセス時間を大幅に減少させることができる。特に、図22および図24で説明したように、MBライン単位またはMBペア・ライン単位の動きベクトルが可変長データとなるにもかかわらず、これらの単位のデータを連続したメモリアクセスにより読み出すことができるので、読み出しに要する時間や消費電力を大幅に抑制することができる。また、読み出される動きベクトルの数が減少したことで、符号化時においては発生する符号量が減少し、画質が低下することなく、画像データの圧縮率が高められる。
また、所望の位置のMBColを確実に取り出すことができることから、現処理対象のMBの位置が途中で戻った場合でも容易に対応できる。さらに、上記の構成を用いることにより、ピクチャの途中でスライス・タイプ(Slice Type)が変更された場合や、スライスの境界において参照するColPicが変更された場合などにも、容易に対応することができる。
図26は、スライス・タイプがピクチャの途中で変更する場合の動作を説明するための図である。
H.264では、ピクチャの途中でスライス・タイプを変更することが可能となっている。図26に示すCurrPic801では、CurrMB802とCurrMB803との間で、スライス・タイプがPからBに変更されている。このとき、CurrMB803にダイレクト・モードが設定されていた場合でも、上記のような構成を用いて、CurrMB803が参照するColPicのデータを外部メモリ320に格納しておくことで、CurrMB803に対応するMBColの動きベクトルを上述した簡単な処理で確実に取り出すことができる。すなわち、上記構成では、ColPicの動きベクトルをMBライン単位あるいはMBペア・ライン単位で外部メモリ320から読み出し、ラインの先頭から必要なMBColの位置を探索するので、必要なMBColの動きベクトルを簡単な処理で取得できる。
図27は、スライス境界において参照するColPicが変更された場合の動作を説明するための図である。
H.264では、さらに、スライスの境界において参照画像を変更することも可能となっている。図27(A)は、このような設定が行われたCurrPic811を示しており、CurrMB812とCurrMB813との間がスライス814および815の境界となっている。また、同図(B)は、CurrPic811と、スライス境界の前後で参照されるピクチャ816および817との関係を示している。すなわち、CurrMB812を含むスライス814はピクチャ816をColPicとして予測符号化され、CurrMB813を含むスライス815はピクチャ817をColPicとして予測符号化される。このような場合でも、ピクチャ816および817の動きベクトルを外部メモリ320に格納しておくことで、参照画像が変更された場合でも、必要なMBColの動きベクトルを簡単な処理で確実に取り出すことができる。
次に、分割サイズ統合部360の処理について説明する。まず、図28は、MBタイプ判定テーブルの内容を示す図である。
MBタイプ判定テーブル382には、図28に示すように、CurrMBおよびMBColのそれぞれのフレーム/フィールド種別の組み合わせに応じたMBColModeが記載され、各MBColModeについて、MBColのMBタイプ(MBCol_MBTYPE)に応じたCurrMBのMBタイプ(CurrMB_MBTYPE)が設定されている。
分割サイズ統合部360は、読み出しモード判定テーブル381を参照して、CurrPicとColPicとの間の符号化タイプおよびフレーム/フィールド種別の組み合わせに応じて、該当し得るMBColModeを判別した後、CurrMBの処理のたびに、このCurrMBと対応するMBColとの間のフレーム/フィールド種別および処理対象のライン種別の組み合わせに応じて、MBタイプ判定テーブル382から最終的に適用するMBColModeを判別する。そして、このときのMBColのMBタイプに応じて、MBタイプ判定テーブル382からCurrMBのMBタイプを決定し、MV読み出し制御部350から供給されたもののうち必要な動きベクトルを、ダイレクトMV演算部311に供給する。
なお、図28において、「統合」の項目は、CurrMB内のブロックの統合処理、すなわちCurrMBのブロック分割数をMBColより減少させる処理が行われる可能性があるか否かを、参考のために示している。以下で説明するように、CurrMB内のブロックが統合された場合には、ダイレクト演算される動きベクトルの数が減少する。このため、符号化の場合には、画質を低下させることなく、符号量を減少させて圧縮率を高くすることが可能になる。また、復号化の場合は、画像品質を落とすことなく、動きベクトルの演算および予測補償の処理負荷を軽減することが可能になる。
以下、図29〜図32を用いて、MBColのMBタイプに応じて設定されるCurrMBのMBタイプを、MBColModeごとに具体的に挙げて説明する。なお、図29〜図32では、矢印の右側にMBColのMBタイプを、左側にCurrMBのMBタイプをそれぞれ示している。また、各図の一番上に示したパターンでは、CurrMBおよびMBColとして設定可能な最小のブロックのMBタイプの組み合わせが示されているが、これらのパターンは図8および図9で示したものと同じである。そして、図8および図9と同様に、これらのパターンのブロックに付された数字については、CurrMB内のブロックの動きベクトルが、同じ数字が付されたMBCol内のブロックから演算できることを意味している。
図29は、MBColMode0で設定されるCurrMBのMBタイプの例を示す図である。
MBColMode0では、CurrMBおよびMBColがともにフレーム構造(ただし、符号化タイプがともにFRM)であり、CurrMB内の各ブロックの動きベクトルを、MBCol内の同じ位置のブロックの動きベクトルからダイレクト演算することができる。従って、MBColMode0では、図29のパターンPT1〜PT6のように、CurrMBに対して、MBColと同じMBタイプが設定される。
図30は、MBColMode1で設定されるCurrMBのMBタイプの例を示す図である。
MBColMode1では、図8(B)で説明したように、MBColの最小ブロックは4×4であるが、CurrMBの最小ブロックは規格上8×8となる。このため、パターンPT11に示すように、CurrMBのMB901〜904の各動きベクトルは、それぞれMBCol内のサブMB905〜908のみからダイレクト演算される。すなわち、パターンPT11においては、MBCol内の左上に存在する4つのサブMBを、1つのMB901に統合することができる。同様に、MBCol内の右上、左下、右下にそれぞれ存在する4つのサブMBの組を、MB902〜904にそれぞれ統合できる。
パターンPT11のようなブロックの対応関係を基本にして考えると、MBColの最小ブロックが8×8であるパターンPT12〜PT15では、CurrMBに対して、MBColと同じMBタイプを設定すればよく、ブロックの統合は行われない。一方、パターンPT16のように、MBColに8×8より小さいサブMBが存在する場合、それらのサブMBはCurrMBにおいて8×8のMBに統合される。
例えば、MBColのサブMB909および910をMB911に統合することができ、MB911の動きベクトルはサブMB910の動きベクトルからダイレクト演算される。すなわち、分割サイズ統合部360は、サブMB909および910に対応するCurrMBの位置のMBタイプを8×8と決定し、そのMBタイプの情報とともに、サブMB910の動きベクトルをダイレクトMV演算部311に出力する。
図31は、MBColMode2および3で設定されるCurrMBのMBタイプの例を示す図である。
MBColMode2および3では、パターンPT21のように、MBColの最小ブロックは4×4であるが、CurrMBの最小ブロックは8×8となる。なお、パターンPT21に示した左側のMBColはCurrMBの奇数ライン演算時に使用され(MBColMode2に対応)、右側のMBColはCurrMBの偶数ライン演算時に使用される(MBColMode3に対応)ものであって、どちらも同じMBColである。
図9(A)および(B)で説明したように、MBColMode2では、CurrMB内のMB911〜914の奇数ラインの動きベクトルは、それぞれMBCol内のサブMB915〜918からダイレクト演算される。また、MBColMode3では、CurrMB内のMB911〜914の偶数ラインの動きベクトルは、同じMBCol内のサブMB919〜922からそれぞれダイレクト演算される。従って、MBColにおける第1列および第3列の1番目および2番目の計4つのサブMBが、CurrMBではMB911に統合される。同様に、MBColにおける第1列および第3列の3番目および4番目のサブMBが、MB912に統合され、MBColにおける第2列および第4列の1番目および2番目のサブMBが、MB913に統合され、同列の3番目および4番目のサブMBが、MB914に統合される。
このパターンPT21のようなブロックの対応関係を基本にして考えると、MBColの上側の16×8のブロックおよび下側の16×8のブロックにおいて、ともに垂直方向に対するサブMB分割が行われていない場合には、CurrMBを垂直方向に分割する必要がなくなる。図31のパターンPT23〜PT25がこのような場合に相当し、これらのうちパターンPT23およびPT25では、垂直方向に対するブロックの統合が行われている。
逆に、パターンPT26においては、MBColの上側の16×8のブロックおよび下側の16×8のブロックの少なくとも一方において、垂直方向に対するサブMB分割が行われているので、CurrMBは最小サイズである8×8のMBに分割される。ここで、分割サイズ統合部360は、例えば、CurrMBのMB923および924の動きベクトルの演算のために、奇数ライン演算時にはMBColのサブMB925の動きベクトルを、偶数ライン演算時にはMBColのサブMB926および927を、それぞれダイレクトMV演算部311に出力する。
なお、パターンPT22では、MBColにおいてブロック分割が行われていないので、当然ながらブロックの統合も行われない。
図32は、MBColMode4で設定されるCurrMBのMBタイプの例を示す図である。
MBColMode4の場合でも、パターンPT31のように、MBColの最小ブロックは4×4であるが、CurrMBの最小ブロックは8×8となる。このパターンPT31では、図9(C)で説明したように、各フィールドに対応するCurrMBの動きベクトル演算のために、上下に隣接する2つのMBColの動きベクトルが必要となる。なお、図28のMBタイプ判定テーブル382においては、MBColMode4のときのMBColのMBタイプの条件を示す欄に記載された「上側MBCol」「下側MBCol」とは、このように上下に隣接した2つのMBColのうちの上側、下側をそれぞれ示している。
従って、分割サイズ統合部360は、CurrMB内のMB931および932のダイレクト演算のために、それぞれMBCol内のサブMB935および936の動きベクトルをダイレクトMV演算部311に出力し、CurrMB内のMB933および934のダイレクト演算のために、下側に隣接するMBCol内のサブMB937および938の動きベクトルをそれぞれ出力する。
このパターンPT31のようなブロックの対応関係を基本にして考えると、MBColMode4では、上下に隣接する2つのMBColの両方において、8×8以下のサイズでのブロック分割がない場合には、これらの2つのMBColは、パターンPT32のように、CurrMBにおいて16×8のMBにそれぞれ統合される。また、MBColがそれ以外の状態の場合には、パターンPT33のように、CurrMBには一律に8×8のMBが設定される。
以上説明したように、本実施の形態に係る分割サイズ統合部360では、MBColのMBタイプに応じて、CurrMBをできるだけ大きいサイズのブロックに分割するようにCurrMBのMBサイズが設定され、ダイレクト演算時のために必要なMBCol内の動きベクトルが適宜選択されて出力される。これにより、ダイレクト演算対象となる動きベクトルの数が減少し、動き補償処理時の参照画像データ取得のためのメモリアクセス回数や必要なメモリ帯域を抑制することができる。従って、動き補償処理の精度を低下させることなく、その処理負荷を軽減して、消費電力や回路の製造コストを抑制することができる。また、符号化時に適用した場合には、符号量を減少させ、画質を低下させることなく画像データの圧縮率を高めることができる。
特に、従来では、元のMBColのデータが外部メモリ320に格納される際に、一律に4×4の最小サイズのブロックに展開されていたので、このようなMBColのMBタイプを基にCurrMBのブロックを決定すると、最小でも8×8のMBに統合することしかできなかった(図29〜図32のパターンPT1,PT11,PT21,PT31に対応)。これに対して、本実施の形態では、分割サイズ統合部360に入力されるMBColが元のMBタイプを維持していることから、CurrMBを8×8よりさらに大きいサイズのブロックに分割することも可能であり、これによりダイレクト演算対象となる動きベクトルの数をさらに減少させることができる。また、分割サイズ統合部360に入力されるMBColの動きベクトル数が、4×4のサイズに展開された場合と比較して少ないことから、分割サイズ統合部360でのMBタイプ決定処理自体の負荷も軽減され、消費電力を抑制することもできる。
なお、上記の実施の形態では、ColPicの動きベクトルを格納するメモリを、フレーム間予測部210(または画像復号化装置200)の外部に設けた外部メモリ320としたが、このメモリを装置内部に設けてもよい。また、内部バッファ341および342の機能を、外部のメモリで実現してもよい。また、外部メモリ320と内部バッファ341および342の機能を、ともに同じメモリで実現してもよい。また、これらについては、上記のフレーム間予測部210のダイレクト・モード対応機能を、画像符号化装置100のフレーム間予測部104に設けた場合でも同様である。
さらに、上記の処理機能は、コンピュータによって実現することができる。その場合、上記の画像符号化装置や画像復号化装置が有すべき動き予測処理機能の処理内容を記述したプログラムが提供される。そして、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。
プログラムを流通させる場合には、例えば、そのプログラムが記録された光ディスクなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、そのプログラムを、サーバコンピュータからネットワークを介して他のコンピュータに転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
(付記1) 動画像を一定の領域に分割した基本ブロックを単位としてフレーム間の動き予測処理を行う動き予測処理装置において、
前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込む書き込み制御手段と、
前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段と、
前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段と、
を有することを特徴とする動き予測処理装置。
(付記2) 前記書き込み制御手段は、前記参照画像がフィールド画像であって前記ブロック適用型予測モードでない場合には、前記参照画像上の前記ブロックラインの動きベクトルをフィールド別にそれぞれ異なる前記メモリ領域に格納し、
前記読み出し制御手段は、
前記参照画像および前記現処理対象画像がともに前記ブロック適用型予測モードでなく、前記参照画像がフレーム画像で、前記現処理対象画像がフィールド画像である場合には、前記参照画像内での奇数番目の前記ブロックラインに割り当てられた前記メモリ領域と、偶数番目の前記ブロックラインに割り当てられた前記メモリ領域のそれぞれから、2つの前記バッファに動きベクトルを並列に読み出し、
前記参照画像がフィールド画像であって前記ブロック適用型予測モードでなく、前記現処理対象画像が前記ブロック適用型予測モードである場合には、トップ・フィールドに割り当てられた前記メモリ領域と、ボトム・フィールドに割り当てられた前記メモリ領域のそれぞれから、2つの前記バッファに動きベクトルを並列に読み出し、
前記参照画像および前記現処理対象画像の条件がそれ以外の場合には、前記メモリ領域ごとの動きベクトルを一方の前記バッファのみに読み出す、
ことを特徴とする付記1記載の動き予測処理装置。
(付記3) 前記書き込み制御手段は、前記参照画像が前記ブロック適用型予測モードである場合には、前記参照画像上で上下に隣接する2つの前記ブロックラインを、2つの前記メモリ領域に割り当てて動きベクトルを格納し、
前記読み出し制御手段は、前記参照画像が前記ブロック適用型予測モードである場合には、2つの前記ブロックラインに割り当てられた2つの前記メモリ領域ごとに、動きベクトルを一方の前記バッファに対して順次読み出す、
ことを特徴とする付記2記載の動き予測処理装置。
(付記4) 前記読み出し制御手段は、前記参照画像および前記現処理対象画像の双方がフィールド画像であって前記ブロック適用型予測モードでない場合には、トップ・フィールドに割り当てられた前記メモリ領域のみから一方の前記バッファのみに対して動きベクトルを読み出すことを特徴とする付記2記載の動き予測処理装置。
(付記5) 前記読み出し制御手段は、前記参照画像がフィールド画像であって前記ブロック適用型予測モードでなく、前記現処理対象画像がフレーム画像であって前記ブロック適用型予測モードでない場合には、トップ・フィールドに割り当てられた前記メモリ領域のみを読み出し元とし、同じ前記メモリ領域から2回ずつ連続して、一方の前記バッファのみに対して動きベクトルを読み出すことを特徴とする付記2記載の動き予測処理装置。
(付記6) 前記読み出し制御手段は、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記ブロック適用型予測モードであるか否かの組み合わせごとに、前記メモリ領域から2つの前記バッファに対する読み出し方法を記述したテーブルに従って、前記ベクトル格納メモリから前記各バッファへの動きベクトルの読み出しを制御することを特徴とする付記1記載の動き予測処理装置。
(付記7) 前記ベクトル演算手段は、前記現処理対象画像上の前記ブロックラインの動きベクトルを演算する際に、2つの前記バッファの双方に動きベクトルが格納されている場合は前記各バッファから交互に、一方の前記バッファにのみ動きベクトルが格納されている場合は当該バッファから、それぞれ動きベクトルを前記基本ブロック単位で順次読み出すことを特徴とする付記1記載の動き予測処理装置。
(付記8) 前記現処理対象画像上の動きベクトル算出対象の前記基本ブロック、および当該現処理対象ブロックに対応する前記参照画像上の前記基本ブロックである参照ブロックのそれぞれが、フレーム構造あるいはフィールド構造のいずれであるか、および、当該現処理対象画像および当該参照画像のそれぞれが前記ブロック適用型予測モードであるか否かの組み合わせに応じて、前記現処理対象ブロックのブロック分割サイズを、対応する前記参照ブロックのブロック分割サイズと同じにするか、あるいは当該参照ブロックで分割されたブロックの一部が1つのブロックに統合されるように設定して、前記ベクトル演算手段に通知するブロック分割設定手段をさらに有することを特徴とする付記1記載の動き予測処理装置。
(付記9) 前記現処理対象画像および前記参照画像がともに前記ブロック適用型予測モードでなく、前記現処理対象ブロックがフレーム構造で、前記参照ブロックがフィールド構造であるとき、当該参照ブロックの上側半分および下側半分の各ブロックにおいて、ともに垂直方向に対してさらなるブロック分割が行われていない場合には、対応する前記現処理対象ブロックを垂直方向にブロック分割しないことを特徴とする付記8記載の動き予測処理装置。
(付記10) 前記現処理対象画像および前記参照画像がともに前記ブロック適用型予測モードでなく、前記現処理対象ブロックがフィールド構造で、前記参照ブロックがフレーム構造であるとき、前記現処理対象ブロックに対応する前記参照画像上の上下に隣接する2つの前記参照ブロックの双方において、それぞれを4等分したサイズ以下のブロックが存在しない場合には、前記現処理対象ブロックを垂直方向に2等分し、水平方向にブロック分割しないことを特徴とする付記8記載の動き予測処理装置。
(付記11) 動画像を一定の領域に分割した基本ブロックを単位としたフレーム間の動き予測処理を利用して、動画像信号を符号化する画像符号化装置において、
前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込む書き込み制御手段と、
前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段と、
前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段と、
を有することを特徴とする画像符号化装置。
(付記12) 動画像を一定の領域に分割した基本ブロックを単位としたフレーム間の動き予測処理を利用して、符号化された動画像信号を復号化する画像復号化装置において、
前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込む書き込み制御手段と、
前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段と、
前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段と、
を有することを特徴とする画像復号化装置。
(付記13) 動画像を一定の領域に分割した基本ブロックを単位としてフレーム間の動き予測処理を行う動き予測処理方法において、
書き込み制御手段が、前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込み、
読み出し制御手段が、前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御し、
ベクトル演算手段が、前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算する、
ことを特徴とする動き予測処理方法。
(付記14) 動画像を一定の領域に分割した基本ブロックを単位としたフレーム間の動き予測処理をコンピュータに実行させる動き予測処理プログラムにおいて、
前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込む書き込み制御手段、
前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段、
前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段、
として前記コンピュータを機能させることを特徴とする動き予測処理プログラム。
本発明の実施の形態に係る動き予測処理装置の概要を示すブロック図である。 実施の形態に係る画像符号化装置の構成を示すブロック図である。 実施の形態に係る画像復号化装置の構成を示すブロック図である。 ダイレクト・モード対応のためのメモリ制御機能の構成例を示すブロック図である。 MV書き込み制御部の内部構成例を示すブロック図である。 外部メモリにおけるColPic格納フォーマットを示す図である。 読み出しモード判定テーブルの内容を示す図である。 CurrMBとMBColとの間のフレーム/フィールド種別の代表的な組み合わせと、ブロック間の対応関係について説明するための図(その1)である。 CurrMBとMBColとの間のフレーム/フィールド種別の代表的な組み合わせと、ブロック間の対応関係について説明するための図(その2)である。 各読み出しモードでの読み出し手順について説明するための図(その1)である。 各読み出しモードでの読み出し手順について説明するための図(その2)である。 各読み出しモードでの読み出し手順について説明するための図(その3)である。 読み出しモード0でのMBColとMBColとの対応について説明するための図である。 読み出しモード1でのMBColとMBColとの対応について説明するための図である。 読み出しモード2でのMBColとMBColとの対応について説明するための図である。 読み出しモード3でのMBColとMBColとの対応について説明するための図である。 読み出しモード4でのMBColとMBColとの対応について説明するための図である。 読み出しモード5でのMBColとMBColとの対応について説明するための図である。 読み出しモード6でのMBColとMBColとの対応について説明するための図である。 MV読み出し制御部が備える内部バッファの読み出し制御機能の構成例を示すブロック図である。 2つの内部バッファを用いた場合のデータ読み出しを模式的に説明するための図である。 1つの内部バッファを用いた場合のデータ読み出しを模式的に説明するための図である。 データ読み出し手順の説明に用いるMBラインのブロック構成例を示す図である。 隣接するMBラインのデータを2つの内部バッファに格納する際のタイムチャートを示す図である。 2つの内部バッファからデータを読み出す際のタイムチャートを示す図である。 スライス・タイプがピクチャの途中で変更する場合の動作を説明するための図である。 スライス境界において参照するColPicが変更された場合の動作を説明するための図である。 MBタイプ判定テーブルの内容を示す図である。 MBColMode0で設定されるCurrMBのMBタイプの例を示す図である。 MBColMode1で設定されるCurrMBのMBタイプの例を示す図である。 MBColMode2および3で設定されるCurrMBのMBタイプの例を示す図である。 MBColMode4で設定されるCurrMBのMBタイプの例を示す図である。 符号化タイプ別のMBの処理順について説明するための図である。 H.264におけるMBのブロックサイズを説明するための図である。 ダイレクト・モードにおける動きベクトルの演算手法を概念的に示す図である。
符号の説明
1 動き予測処理装置
2 書き込み制御手段
3 読み出し制御手段
4 ベクトル演算手段
10 ベクトル格納メモリ
10−1〜3 メモリ領域
11,12 バッファ
20 参照画像
20−1〜3 ブロックライン

Claims (10)

  1. 動画像を一定の領域に分割した基本ブロックを単位としてフレーム間の動き予測処理を行う動き予測処理装置において、
    前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込む書き込み制御手段と、
    前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段と、
    前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段と、
    を有することを特徴とする動き予測処理装置。
  2. 前記書き込み制御手段は、前記参照画像がフィールド画像であって前記ブロック適用型予測モードでない場合には、前記参照画像上の前記ブロックラインの動きベクトルをフィールド別にそれぞれ異なる前記メモリ領域に格納し、
    前記読み出し制御手段は、
    前記参照画像および前記現処理対象画像がともに前記ブロック適用型予測モードでなく、前記参照画像がフレーム画像で、前記現処理対象画像がフィールド画像である場合には、前記参照画像内での奇数番目の前記ブロックラインに割り当てられた前記メモリ領域と、偶数番目の前記ブロックラインに割り当てられた前記メモリ領域のそれぞれから、2つの前記バッファに動きベクトルを並列に読み出し、
    前記参照画像がフィールド画像であって前記ブロック適用型予測モードでなく、前記現処理対象画像が前記ブロック適用型予測モードである場合には、トップ・フィールドに割り当てられた前記メモリ領域と、ボトム・フィールドに割り当てられた前記メモリ領域のそれぞれから、2つの前記バッファに動きベクトルを並列に読み出し、
    前記参照画像および前記現処理対象画像の条件がそれ以外の場合には、前記メモリ領域ごとの動きベクトルを一方の前記バッファのみに読み出す、
    ことを特徴とする請求項1記載の動き予測処理装置。
  3. 前記書き込み制御手段は、前記参照画像が前記ブロック適用型予測モードである場合には、前記参照画像上で上下に隣接する2つの前記ブロックラインを、2つの前記メモリ領域に割り当てて動きベクトルを格納し、
    前記読み出し制御手段は、前記参照画像が前記ブロック適用型予測モードである場合には、2つの前記ブロックラインに割り当てられた2つの前記メモリ領域ごとに、動きベクトルを一方の前記バッファに対して順次読み出す、
    ことを特徴とする請求項2記載の動き予測処理装置。
  4. 前記読み出し制御手段は、前記参照画像および前記現処理対象画像の双方がフィールド画像であって前記ブロック適用型予測モードでない場合には、トップ・フィールドに割り当てられた前記メモリ領域のみから一方の前記バッファのみに対して動きベクトルを読み出すことを特徴とする請求項2記載の動き予測処理装置。
  5. 前記読み出し制御手段は、前記参照画像がフィールド画像であって前記ブロック適用型予測モードでなく、前記現処理対象画像がフレーム画像であって前記ブロック適用型予測モードでない場合には、トップ・フィールドに割り当てられた前記メモリ領域のみを読み出し元とし、同じ前記メモリ領域から2回ずつ連続して、一方の前記バッファのみに対して動きベクトルを読み出すことを特徴とする請求項2記載の動き予測処理装置。
  6. 前記現処理対象画像上の動きベクトル算出対象の前記基本ブロック、および当該現処理対象ブロックに対応する前記参照画像上の前記基本ブロックである参照ブロックのそれぞれが、フレーム構造あるいはフィールド構造のいずれであるか、および、当該現処理対象画像および当該参照画像のそれぞれが前記ブロック適用型予測モードであるか否かの組み合わせに応じて、前記現処理対象ブロックのブロック分割サイズを、対応する前記参照ブロックのブロック分割サイズと同じにするか、あるいは当該参照ブロックで分割されたブロックの一部が1つのブロックに統合されるように設定して、前記ベクトル演算手段に通知するブロック分割設定手段をさらに有することを特徴とする請求項1記載の動き予測処理装置。
  7. 前記現処理対象画像および前記参照画像がともに前記ブロック適用型予測モードでなく、前記現処理対象ブロックがフレーム構造で、前記参照ブロックがフィールド構造であるとき、当該参照ブロックの上側半分および下側半分の各ブロックにおいて、ともに垂直方向に対してさらなるブロック分割が行われていない場合には、対応する前記現処理対象ブロックを垂直方向にブロック分割しないことを特徴とする請求項6記載の動き予測処理装置。
  8. 前記現処理対象画像および前記参照画像がともに前記ブロック適用型予測モードでなく、前記現処理対象ブロックがフィールド構造で、前記参照ブロックがフレーム構造であるとき、前記現処理対象ブロックに対応する前記参照画像上の上下に隣接する2つの前記参照ブロックの双方において、それぞれを4等分したサイズ以下のブロックが存在しない場合には、前記現処理対象ブロックを垂直方向に2等分し、水平方向にブロック分割しないことを特徴とする請求項6記載の動き予測処理装置。
  9. 動画像を一定の領域に分割した基本ブロックを単位としたフレーム間の動き予測処理を利用して、動画像信号を符号化する画像符号化装置において、
    前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込む書き込み制御手段と、
    前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段と、
    前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段と、
    を有することを特徴とする画像符号化装置。
  10. 動画像を一定の領域に分割した基本ブロックを単位としたフレーム間の動き予測処理を利用して、符号化された動画像信号を復号化する画像復号化装置において、
    前記動き予測処理の現処理対象画像が参照する参照画像の動きベクトルを、前記参照画像上の水平方向に並列された1列分の前記基本ブロックに対応するブロックラインを単位として、ベクトル格納メモリを分割したメモリ領域のいずれかに書き込む書き込み制御手段と、
    前記ベクトル格納メモリからFIFO方式の2つのバッファへの、前記メモリ領域ごとの動きベクトルの読み出しを、前記参照画像および前記現処理対象画像のそれぞれが、フレーム画像あるいはフィールド画像のいずれであるか、および、前記基本ブロックごとにフレーム予測/フィールド予測を選択的に適用可能なブロック適用型予測モードであるか否かの組み合わせに応じて制御する読み出し制御手段と、
    前記各バッファから順次読み出した動きベクトルを用いて、前記現処理対象画像の所定の前記基本ブロックの動き予測処理に必要な動きベクトルを予測演算するベクトル演算手段と、
    を有することを特徴とする画像復号化装置。
JP2006222394A 2006-08-17 2006-08-17 動き予測処理装置、画像符号化装置および画像復号化装置 Expired - Fee Related JP4592656B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006222394A JP4592656B2 (ja) 2006-08-17 2006-08-17 動き予測処理装置、画像符号化装置および画像復号化装置
US11/826,867 US8189669B2 (en) 2006-08-17 2007-07-19 Motion prediction processor with read buffers providing reference motion vectors for direct mode coding
CN200710138021XA CN101198057B (zh) 2006-08-17 2007-08-02 具有提供参考运动向量的读取缓冲器的运动预测处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006222394A JP4592656B2 (ja) 2006-08-17 2006-08-17 動き予測処理装置、画像符号化装置および画像復号化装置

Publications (2)

Publication Number Publication Date
JP2008048199A JP2008048199A (ja) 2008-02-28
JP4592656B2 true JP4592656B2 (ja) 2010-12-01

Family

ID=39101366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006222394A Expired - Fee Related JP4592656B2 (ja) 2006-08-17 2006-08-17 動き予測処理装置、画像符号化装置および画像復号化装置

Country Status (3)

Country Link
US (1) US8189669B2 (ja)
JP (1) JP4592656B2 (ja)
CN (1) CN101198057B (ja)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US20040001546A1 (en) * 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US7154952B2 (en) 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
JP3993848B2 (ja) * 2003-10-24 2007-10-17 株式会社日立製作所 計算機装置及び計算機装置の制御方法
US8731064B2 (en) * 2006-09-11 2014-05-20 Apple Inc. Post-processing for decoder complexity scalability
WO2008153262A1 (en) 2007-06-15 2008-12-18 Sungkyunkwan University Foundation For Corporate Collaboration Bi-prediction coding method and apparatus, bi-prediction decoding method and apparatus, and recording midium
KR100955396B1 (ko) * 2007-06-15 2010-04-29 성균관대학교산학협력단 양-예측 부호화 방법 및 장치, 양-예측 복호화 방법 및장치 및 기록매체
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8165209B2 (en) * 2007-09-24 2012-04-24 General Instrument Corporation Method and apparatus for providing a fast motion estimation process
US8270471B2 (en) * 2007-11-08 2012-09-18 Mediatek, Inc. Encoders and scheduling methods for macroblock-based adaptive frame/filed coding
US8743972B2 (en) * 2007-12-20 2014-06-03 Vixs Systems, Inc. Coding adaptive deblocking filter and method for use therewith
JP5007259B2 (ja) * 2008-03-27 2012-08-22 ルネサスエレクトロニクス株式会社 画像符号化装置
WO2009148412A1 (en) * 2008-06-06 2009-12-10 Agency For Science, Technology And Research Methods and devices for estimating motion in a plurality of frames
US20100053181A1 (en) * 2008-08-31 2010-03-04 Raza Microelectronics, Inc. Method and device of processing video
US8189666B2 (en) * 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
US20100232511A1 (en) * 2009-03-12 2010-09-16 Himax Media Soltuions, Inc. Motion compensator, motion compensating method, and motion-compensated video decoder implementing the same
CN102090066A (zh) * 2009-05-13 2011-06-08 松下电器产业株式会社 图像解码装置、集成电路、图像解码方法及图像解码系统
CN102450016A (zh) * 2009-05-26 2012-05-09 松下电器产业株式会社 运动图像处理装置和运动图像处理方法
EA201691820A1 (ru) * 2009-10-20 2017-05-31 Шарп Кабусики Кайся Устройство кодирования движущихся изображений, устройство декодирования движущихся изображений, система кодирования/декодирования движущихся изображений, способ кодирования движущихся изображений и способ декодирования движущихся изображений
US20110261885A1 (en) * 2010-04-27 2011-10-27 De Rivaz Peter Francis Chevalley Method and system for bandwidth reduction through integration of motion estimation and macroblock encoding
JP2011259040A (ja) * 2010-06-04 2011-12-22 Sony Corp 画像処理装置および方法
US20120082228A1 (en) 2010-10-01 2012-04-05 Yeping Su Nested entropy encoding
US10104391B2 (en) 2010-10-01 2018-10-16 Dolby International Ab System for nested entropy encoding
CN107454419B (zh) 2010-12-13 2020-12-29 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
WO2012096157A1 (ja) * 2011-01-12 2012-07-19 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
JP6004271B2 (ja) * 2011-01-12 2016-10-05 サン パテント トラスト 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
WO2012114712A1 (ja) * 2011-02-25 2012-08-30 パナソニック株式会社 画像符号化方法および画像復号化方法
CN102685504B (zh) * 2011-03-10 2015-08-19 华为技术有限公司 视频图像的编解码方法、编码装置、解码装置及其系统
US9635385B2 (en) * 2011-04-14 2017-04-25 Texas Instruments Incorporated Methods and systems for estimating motion in multimedia pictures
WO2012174973A1 (en) * 2011-06-20 2012-12-27 Mediatek Inc. Method and apparatus for line buffers reduction
CN103797795B (zh) 2011-07-01 2017-07-28 谷歌技术控股有限责任公司 用于运动矢量预测的方法和设备
BR112014000368A2 (pt) * 2011-08-25 2017-02-14 Panasonic Corp métodos e aparelhos para codificação, extração e de-codificação de vídeo com o uso de esquemas de codificação de recorte
CN104041041B (zh) 2011-11-04 2017-09-01 谷歌技术控股有限责任公司 用于非均匀运动向量栅格的运动向量缩放
US9900615B2 (en) 2011-12-28 2018-02-20 Microsoft Technology Licensing, Llc Representative motion information for temporal motion prediction in video encoding and decoding
MX2014008485A (es) * 2012-01-19 2014-10-14 Sony Corp Aparato de procesamiento y metodo para procesamiento de imagen.
CN103220508B (zh) 2012-01-20 2014-06-11 华为技术有限公司 编解码方法和装置
US20130208795A1 (en) * 2012-02-09 2013-08-15 Google Inc. Encoding motion vectors for video compression
US8908767B1 (en) 2012-02-09 2014-12-09 Google Inc. Temporal motion vector prediction
US9172970B1 (en) 2012-05-29 2015-10-27 Google Inc. Inter frame candidate selection for a video encoder
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
KR20140051789A (ko) * 2012-10-22 2014-05-02 (주)휴맥스 3차원 비디오에서의 뷰간 움직임 예측 방법 및 뷰간 병합 후보 결정 방법
US9106793B2 (en) 2013-01-03 2015-08-11 Cisco Technology, Inc. Method and apparatus for motion based participant switching in multipoint video conferences
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation
US11025934B2 (en) * 2014-12-16 2021-06-01 Advanced Micro Devices, Inc. Methods and apparatus for decoding video using re-ordered motion vector buffer
WO2017156669A1 (en) * 2016-03-14 2017-09-21 Mediatek Singapore Pte. Ltd. Methods for motion vector storage in video coding
US10602180B2 (en) 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
CN114205618B (zh) * 2018-02-28 2023-07-25 三星电子株式会社 编码方法及其装置以及解码方法及其装置
TWI752331B (zh) 2018-06-29 2022-01-11 大陸商北京字節跳動網絡技術有限公司 當向Merge/AMVP添加HMVP候選時的部分/完全修剪
WO2020003278A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Update of look up table: fifo, constrained fifo
US10440378B1 (en) * 2018-07-17 2019-10-08 Tencent America LLC Method and apparatus for history-based motion vector prediction with parallel processing
CN111064961B (zh) 2018-09-12 2023-06-09 北京字节跳动网络技术有限公司 视频处理方法和装置
JP7275286B2 (ja) 2019-01-10 2023-05-17 北京字節跳動網絡技術有限公司 Lut更新の起動
CN113366844B (zh) * 2019-02-02 2023-10-03 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的缓冲区中的数据存储
WO2020156548A1 (en) 2019-02-02 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Buffer updating for intra block copy in video coding
JP7405861B2 (ja) 2019-03-01 2023-12-26 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーのための方向に基づく予測
WO2020177661A1 (en) 2019-03-01 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Order-based updating for intra block copy in video coding
JP7284284B2 (ja) 2019-03-04 2023-05-30 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーの実装形態の態様
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
PH12022550024A1 (en) 2019-07-06 2022-11-21 Beijing Bytedance Network Tech Co Ltd Virtual prediction buffer for intra block copy in video coding
CN114175633B (zh) 2019-07-10 2023-12-29 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的样点标识
JP7609842B2 (ja) 2019-07-11 2025-01-07 北京字節跳動網絡技術有限公司 映像符号化におけるイントラブロックコピーのためのビットストリーム適合性の制約
US12339902B2 (en) * 2021-10-05 2025-06-24 Mellanox Technologies, Ltd Hardware accelerated video encoding

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3778960B2 (ja) * 1994-06-29 2006-05-24 株式会社東芝 動画像符号化方法及び装置
CN100459715C (zh) * 1997-07-31 2009-02-04 日本胜利株式会社 数字视频信号块间预测编码/解码装置及编码/解码方法
CN1620817A (zh) * 2001-07-06 2005-05-25 皇家菲利浦电子有限公司 用受控向量统计特性进行运动估计和补偿
EP2268038A1 (en) * 2001-11-21 2010-12-29 General Instrument Corporation Picture level adaptive frame/field coding for digital video signal
JP4150742B2 (ja) * 2002-01-09 2008-09-17 松下電器産業株式会社 動きベクトル復号化方法
KR100491530B1 (ko) * 2002-05-03 2005-05-27 엘지전자 주식회사 모션 벡터 결정 방법
JP4724351B2 (ja) * 2002-07-15 2011-07-13 三菱電機株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置
JP4230289B2 (ja) * 2002-07-26 2009-02-25 パナソニック株式会社 動画像符号化方法および動画像復号化方法
JP2004179810A (ja) 2002-11-26 2004-06-24 Renesas Technology Corp 画像符号化装置
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
JP4577048B2 (ja) * 2004-03-11 2010-11-10 パナソニック株式会社 画像符号化方法、画像符号化装置および画像符号化プログラム
KR101104828B1 (ko) * 2004-12-09 2012-01-16 삼성전자주식회사 움직임 벡터 연산 장치 및 그 방법
JP2006352238A (ja) * 2005-06-13 2006-12-28 Sony Corp 画像処理装置、画像処理方法及びプログラム
CN1777289A (zh) * 2005-11-30 2006-05-24 天津大学 利用选择性预测加快运动估计的方法

Also Published As

Publication number Publication date
US20080043845A1 (en) 2008-02-21
CN101198057B (zh) 2010-09-29
US8189669B2 (en) 2012-05-29
JP2008048199A (ja) 2008-02-28
CN101198057A (zh) 2008-06-11

Similar Documents

Publication Publication Date Title
JP4592656B2 (ja) 動き予測処理装置、画像符号化装置および画像復号化装置
JP4763549B2 (ja) フレーム間予測処理装置、画像符号化装置、及び画像復号化装置
US8400460B2 (en) Image data processing method, program for image data processing method, recording medium with recorded program for image data processing method and image date processing device
US20060182181A1 (en) Apparatus and method for controlling data write/read in image processing system
US20070071099A1 (en) External memory device, method of storing image data for the same, and image processor using the method
JP4675383B2 (ja) 画像復号化装置および方法、画像符号化装置
KR100891116B1 (ko) 대역폭 인식 움직임 보상 장치 및 그 방법
JP5053774B2 (ja) 動画像符号化装置
JPH07298264A (ja) 画像データの処理方法およびそれに用いる記憶装置ならびに画像データの処理装置
JP4822940B2 (ja) 画像処理装置及び画像処理方法
JP4559785B2 (ja) 信号処理方法および信号処理装置
WO2012165428A1 (ja) 映像符号化装置
JP2008136177A (ja) 動き検出装置、MOS(metal−oxidesemiconductor)集積回路および映像システム
JP2007006381A (ja) 画像処理装置
KR100708183B1 (ko) 움직임 추정을 위한 영상 데이터 저장 장치 및 그 데이터저장 방법
JP2011097488A (ja) 映像圧縮符号化装置
JP4519723B2 (ja) 動きベクトルを利用する動画像データの符号化または復号化装置
JP2003018607A (ja) 画像復号方法、画像復号装置及び記録媒体
KR100269427B1 (ko) 프레임메모리에있어서어드레스발생방법
JP2016005014A (ja) 動画符号化装置及び動画符号化方法
KR100269426B1 (ko) 개선된프레임메모리를갖는움직임보상장치
KR100255795B1 (ko) 프레임 메모리에 있어서 반화소를 가진 예측 매크로블록에 대한어드레스 발생시 기준 포인트 보상방법
JP2002232892A (ja) 画像符号化装置
KR100226703B1 (ko) 프레임 메모리에 있어서 어드레스 거리 산출방법
KR100226704B1 (ko) 프레임 메모리에 있어서 어드레스 거리 산출방법

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080729

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090402

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4592656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees