JP2007053561A - 画像符号化装置および画像符号化方法 - Google Patents

画像符号化装置および画像符号化方法 Download PDF

Info

Publication number
JP2007053561A
JP2007053561A JP2005236914A JP2005236914A JP2007053561A JP 2007053561 A JP2007053561 A JP 2007053561A JP 2005236914 A JP2005236914 A JP 2005236914A JP 2005236914 A JP2005236914 A JP 2005236914A JP 2007053561 A JP2007053561 A JP 2007053561A
Authority
JP
Japan
Prior art keywords
prediction
mode
block size
intra
motion compensation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005236914A
Other languages
English (en)
Inventor
Kazuo Saigo
賀津雄 西郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005236914A priority Critical patent/JP2007053561A/ja
Publication of JP2007053561A publication Critical patent/JP2007053561A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 符号化処理の高速化および演算負荷を軽減することができる画像符号化装置および画像符号化方法を提供する。
【解決手段】 画像符号化装置は、まずイントラ16×16の予測を行い、イントラ4×4については第1のモード選択部33の判定結果に基づいてイントラ予測するイントラ推定部31と、まず16×16のブロックサイズの動き補償予測を行い、16×16のブロックサイズ以外については第1のモード選択部33の判定結果に基づいて動き補償予測する動き推定部32と、イントラ16×16の予測または16×16のサイズの動き補償予測の予測評価値が閾値を超えていなければ、イントラ4×4のイントラ予測および16×16のサイズ以外の動き補償予測を実行しないと判定する第1のモード選択部33と、予測された各予測モードの中から1つの予測モードを選択する第2のモード選択部34とを備える。
【選択図】 図1

Description

本発明は、画像を光ディスク、磁気ディスクあるいはフラッシュメモリ等の記憶メディア上に圧縮記録する画像圧縮符号化方式に関し、特に、H.264符号化方式の符号化装置および画像符号化方法に関する。
MPEG−2やMPEG−4といった従来の画像符号化方式に比べ、2倍近くの高い符号化効率を実現する方式としてH.264(MPEG−4 AVCとも呼ばれる)が規格化されている(例えば、非特許文献1参照)。H.264は、直交変換と動き補償をベースとしたハイブリッド画像符号化であるという点で、従来の方式と変わりない。しかしながら、符号化を構成する各要素の符号化ツールの自由度が高く、それらの累積効果で高い符号化効率を実現している。
図11は、H.264画像符号化を実現する画像符号化装置の構成の一例を示すブロック図である。この画像符号化装置は、図11に示すようにブロック分割部11、差分処理部12 、直交変換部13、量子化部14 、符号化部15 、蓄積バッファ16 、逆量子化部17 、逆直交変換部18、加算処理部19 、フレームメモリ20 、イントラ推定部21、動き推定部22、モード選択部23、モードスッチ24、イントラ予測部25、動き補償部26、およびレート制御部27を備えている。
連続するピクチャ(フレームおよびフィールドの両者を包含する1つの符号化の単位)からなる動画像の1ピクチャは、4:2:0フォーマット形式の場合、図12に示すように1個の輝度信号(Y信号31)と2個の色差信号(Cr信号32、Cb信号33)とで構成されており、色差信号の画像サイズは縦横とも輝度信号の1/2となる。
また、動画像の各ピクチャはブロックに分割され、ブロック単位で符号化される。このブロックは、マクロブロックと呼ばれ、図13に示すように16×16画素の1個のY 信号ブロック41と、それと空間的に一致する8×8画素のCr信号ブロック42およびCb信号ブロック43にて構成されている(例えば、非特許文献1参照)。
入力された各ピクチャは、ブロック分割部11にて入力マクロブロックに分割される。分割された入力マクロブロックは、差分処理部12に入力される。差分処理部12は、入力マクロブロックの各画素に対して、イントラ予測部25または動き補償部26で生成された予測マクロブロックの空間的に対応する各画素との間で差分処理を施し、差分マクロブロックを出力する。差分マクロブロックは、直交変換部13に入力され、複数の直交変換ブロックに周波数変換される。なお、直交変換ブロックのサイズは、従来のMPEG方式では8×8画素であるが、H.264では4×4画素が基本サイズである。
直交変換部13は、差分マクロブロックを、まず図14に示すような24個の4×4画素ブロック( 51−0から51−15、52−0から51−3 、52−0から52―3) に分割し、それぞれについて直交変換を行う。次に、各4×4直交変換ブロックの直流成分のみを集めた直交ブロック(51−16、52−4、53−4)を信号成分毎に構成し、さらに直交変換する。直交変換ブロック内の各変換係数は量子化部14に入力される。
量子化部14は、レート制御部27から入力された量子化パラメータに従って、各直交変換ブロック内の変換係数を量子化する。量子化された直交変換係数は、符号化部15に入力され、符号化(コード化)される。H.264では、符号化部15として、可変長符号化を用いたCAVLC(Context−based Adaptive Variable Length Coding)あるいはCABAC(Context−based Adaptive Binary Arithmetic Coding)が用意されている。
符号化部15は、量子化直交変換係数および後述するモード選択部23で選択された予測情報をコード化し、蓄積バッファ16に供給する。蓄積バッファ16は蓄積したコードをストリームとして出力する。
量子化された直交変換係数は、符号化部15へ供給されると同時に、逆量子化部17に入力される。逆量子化部17は、レート制御部27から入力される量子化パラメータに従って量子化された直交変換係数を逆量子化することで得た直交変換係数から直交変換ブロックを復元する。復元された直交変換ブロックは、逆直交変換部18にて差分マクロブロックに復元される。復元された差分マクロブロックは、予測マクロブロックと共に加算処理部19に入力される。
加算処理部19は、復元された差分マクロブロックと予測マクロブロックの各画素に加算処理を施し、再生マクロブロックを生成する。この再生マクロブロックは、さらに予測処理に用いるためフレームメモリ20に蓄積される。
上記の逆量子化部17、逆直交変換部18、加算処理部19で行われる一連の処理はローカル復号化と呼ばれる。このローカル復号化には、復号側と同様の再生マクロブロックを生成する能力をもつ必要がある。
次に、上記予測マクロブロックを生成するための予測方法、予測タイプについて説明する。
予測方法には、大きく分けて2種類あり、それぞれ、イントラ予測 、動き予測(フレーム間予測あるいはインタ予測)と呼ばれる。
イントラ予測は、フレーム内の符号化済み画素を用いて、マクロブロック内の画素を予測する方法である。H.264には、予測を行う単位として2種類のブロックサイズが用意されており、それぞれ、イントラ4×4予測とイントラ16×16予測と呼ばれている。
さらに、イントラ4×4予測には9種類、イントラ16×16予測には4種類の方向の異なる予測タイプが用意されており、マクロブロック毎(イントラ4×4予測では、4×4ブロック毎)に選択できる。
図15(a)は、イントラ4×4予測において予測する対象画素(aからpの16画素)と予測に用いる符号化済み隣接画素(AからLの12画素)の配置を示す図である。ここで、前記対象画素(aからp)はブロック分割部11から出力された符号化対象のマクロブロック内の画素であり、一方、符号化済み隣接画素(AからL)は復号化され再生されたマクロブロックあるいはブロックの画素でフレームメモリから読み出される。
図15(b)および(c)は、イントラ4×4予測の予測方向を示す図であり、符号化済み隣接画素の画素値をもとに、予測方向に沿って、規格(例えば、非特許文献1)で規定された演算式によって対象画素を算出する。ここで、このときの予測方向をモード番号(モード0からモード8)で示し、図15(c)における予測方向60のモード0は垂直、予測方向61のモード1は水平、予測方向62のモード2はDC(平均)、予測方向63のモード3は斜め左下方、予測方向64のモード4は斜め右下、予測方向65のモード5は垂直右方、予測方向66のモード6は水平下方、予測方向67のモード7は垂直左方、予測方向68のモード8は水平上方を示している。
上記イントラ4×4予測は輝度信号に適用される。例えば、モード0の場合,予測対象画素の4×4画素ブロックの上側に隣接する復号済みの画素データを用いて,垂直方向の予測を行い,予測画像を生成する。この予測モードは,予測対象の画像領域に垂直方向エッジや境界がある場合に有効な予測モードである。モード0以外の予測モードも同様にそれぞれが特定方向のエッジや境界に対して有効な予測モードとなっており,隣接ブロックの復号済み画素を基に予測対象画素を生成する。
また、輝度信号の場合は,図16(a)から(d)に示すように、イントラ16×16予測に対しても4通りの予測モード((a)モード0:垂直、(b)モード1:水平、(c)モード2:平均のDC、(d)モード3:plane)が規格(例えば、非特許文献1)で定義されており、イントラ4×4予測を含め合計13通りの予測モードの中から最適な予測モードを選択し符号化に用いる。
また、色差信号については,8×8画素ブロックに対し,4通りの予測モード(輝度信号のイントラ16×16予測と同様な予測方向からなる。但し、モード0:DC、モード1:水平、モード2:垂直:モード3:plane)が定義されており,輝度信号とは独立に予測モードを符号化することが可能である。
ところで、イントラ予測では、Fidelity Range Extensionとして、輝度信号についてイントラ8×8予測が追加された。これは、8×8の整数変換の符号化ツールの追加に合わせて、イントラ予測の上記イントラ4×4予測に対応させてイントラ予測8×8予測を追加したものである。イントラ8×8予測は、3タップのローパスフィルタ後、イントラ4×4予測と同様9つの予測モードが設定されている(非特許文献1、参照)。
なお、それぞれのモードで予測された各予測タイプについて、その予測ブロックとそのブロックに対応するブロック分割部11から出力された対象ブロックとを比較し、それらブロック間の差分絶対値和などの評価関数に基づいて各予測ブロックの評価値を算出する。
動き予測(フレーム間予測あるいはインター予測)には、符号化済みのピクチャ内の画素を用いてマクロブロック内の画素を予測する方法であり、PタイプとBタイプがある。なお、符号化済みのピクチャ内の画素はフレームメモリ20から読み出す。また、現在、符号化しようとしている対象のマクロブロックはブロック分割部11から出力されたマクロブロックである。
動き予測の基本となる動き推定と動き補償の概念について、図17を例に説明する。動き推定とは、符号化済みのピクチャ(参照ピクチャ)から対象マクロブロックの内容と似通った部分を検出する技術である。ここでは、動き推定の典型的な技術としてブロックマッチング法について説明する。図17(a)に破線で示す参照ピクチ83上の輝度成分ブロック84が図17(b)に示す太枠で囲んだ現在の対象ピクチャ81の輝度成分ブロック82と空間的に同位置に相当する。動き推定では、まず、輝度成分ブロック84を囲む探索範囲87を設定する。次に、この範囲内を1画素ずつ縦横に移動しながら探索し、評価値が最小となる位置をそのブロックの予測位置とする。評価値の算出には、例えば、ブロック内の予測誤差信号の絶対値和、又は2乗和に動きベクトルの符号量を加味した関数を用いる場合が多い。
動きベクトルとは、元のブロック位置から探索位置までの移動量をベクトルで示したものである。例えば、輝度ブロック84の探索位置をブロック85とすると、移動量86が動きベクトルとなる。なお、H.264では、動きベクトルの精度は1/4画素であり、整数精度で探索を行った後、その周囲の1/2画素と1/4画素を検索する必要がある。一方、動き補償は、動きベクトルと参照ピクチャから予測ブロックを生成する技術である。例えば、輝度成分ブロック82を予測対象ブロック、移動量86を動きベクトルすると、ブロック85が予測ブロックとなる。
図18はPタイプにおける動き補償のブロックサイズを示す図である。基本のマクロブロックタイプ(モード)は、図18(a)から(d)に示す4種類の分割ブロックのタイプがあり、マクロブロック毎に選択する。さらに、8×8ブロックを選択した場合には、各8×8のサブブロックタイプ(モード)について、図18(e)から(h)に示す4種類の分割ブロックのタイプから選択する。H.264では、参照ピクチャとして複数のピクチャを用意し、基本マクロブロックタイプ内の各分割ブロック( 90− 0 、91−0 〜 91−1 、92−0 〜 92−1 、93−0 〜 93−3 )毎にどの参照ピクチャを予測に用いるかを選択できる。
Bタイプおいても選択可能な動き補償のブロックサイズは、同様であるが、基本マクロブロックタイプ(モード)内の各分割ブロック毎に、予測の種類(参照ピクチャの数と方向) を選択できる。具体的には、複数の参照ピクチャを登録した2種類の参照ピクチャリスト(リスト1とリスト2)を用意し、リスト1(前方予測)、リスト2(後方予測)あるいはリスト1とリスト2の両方(双予測)の3通りから予測の種類を選択できる。予測に使用する参照ピクチャも、各リストについて、基本マクロブロックタイプ内の分割ブロック毎に選択できる。なお、双予測では、2つの予測候補ブロック内の各画素を内挿処理して、予測ブロックを生成する。
また、Bタイプでは、16×16マクロブロックと8×8サブブロックに対して、ダイレクト予測と呼ばれる予測モードが用意されている。この予測モードでは、符号化済みの情報からそのブロックの参照ピクチャ、予測の種類、動きベクトルが自動的に算出されるため、これらの情報を符号化する必要がない。
さらに、上記予測タイプのそれぞれについて、skipマクロブロックといわれるモードが存在する。このモードでは、動き補償後の予測マクロブロックと対象マクロブロックとの予測誤差がゼロのモードである。Pタイプのskipマクロブロックでは動きベクトルもゼロで、Bタイプのskipマクロブロックでは動きベクトルは上記ダイレクトモードと同じ方法で算出される。
なお、上記動き推定部22で予測した予測タイプ(モード)についてそれぞれ、予測タイプ(モード)から生成した予測マクロブロックと対象マクロブロックの差分絶対値和および動きベクトルの推定符号量などを考慮した評価関数によって評価値を算出する。
以上のようにして、イントラ推定部21および動き推定部22で選択された各予測タイプ(モード)とその評価値は、モード選択部23に出力される。モード選択部23は、イントラ推定部21と動き推定部22とから受け取った複数の評価値からその値が最小となる予測タイプ(モード)を選択する。
選択された予測タイプ(モード)はモードスッチ24へ送られる。モードスッチ24は、選択された予測タイプ(モード)に従って、予測情報(予測タイプ、動きベクトル、参照ピクチャ番号)をイントラ予測部25または動き補償部26に対して出力する。イントラ予測部25または動き補償部26は、選択された予測タイプと、フレームメモリ20 内の符号化済み周囲画素や参照ピクチャから予測マクロブロックを生成し、差分処理部12および加算処理部19に出力する。
ところで、上記多数の予測タイプ(モード)から効果的に予測タイプ(モード)を決定する方法が開示されている(例えば、非特許文献2参照)。この予測タイプの決定方法では、上記Pタイプおよび上記Bタイプにおいて、マクロブロックが上記skipモードであった場合、残余の予測モードの予測演算をせず省略することで、演算量を低減する。
図19は、上記開示された方法において、予測モードを決定する際の動作を示すフローチャートである。
ステップS401において、ピクチャタイプがPタイプ(図19ではP−Sliceに対応)またはBタイプ(図19ではB−Sliceに対応)を判別する。ピクチャタイプがPタイプの場合は、ステップS402へ進み、16×16の動き補償ブロックにおける評価値(RDコスト値:Rate−Distortionの略で、そのとき選択された予測モードを符号化したときのビット量であるRateとそのときの例えば予測誤差値を示す歪みDistortionとのバランスを最適化した所定の関数からなる値)を算出する。また、ピクチャタイプがBタイプの場合は、ステップS403へ進み、8×8の動き補償ブロックによるダイレクトモードの予測演算を行う。ステップS402とステップS403の予測結果はステップS404へ供給される。
ステップS404では、上記ステップS402と上記ステップS403の予測モードがskipモードであるか否かを判定する。すなわち、動き補償後の予測マクロブロックと対象マクロブロックとの予測誤差がゼロのモードであるか否かを判定する。Pタイプのskipマクロブロックでは動きベクトルもゼロである。また、Bタイプのskipマクロブロックでは動きベクトルはダイレクトモードと同じ方法で算出され、符号化済みの情報からそのブロックの参照ピクチャ、予測の種類、動きベクトルが算出される。
ステップS404でskipモードであると判定された場合は、ステップS405へ進み、最適予測モードはskipモードとして判定され、残余の予測モードの演算は省略される。
ステップS404でskipモードでないと判定された場合は、ステップS406からステップS412が実行される。ステップS406では、上記ステップS402またはステップS403を除くインタ予測モードの評価値(RDコスト値)が算出される。また、ステップS407では、上記ステップS406で最少のRDコスト値のインタ予測モードについて、AR(average rate)と呼ぶ動き補償後の残差データを符号化したときの平均ビットレートを算出する。また、ステップS408では、最適(最少RDコスト値)インタ予測モード条件下でのABE(average boundary error)と呼ぶブロック境界での対象マクロブロック画素と近接ブロック画素との相関値を算出する。
ステップS409では、上記ARとABEを比較し、ARがABEよりも小さければステップS410へ進み、予測モードとして上記最適インタ予測モードを選択する。逆に、ABEがARより小さければステップS411へ進み、最適イントラ予測モードを決定し、ステップS412へ進み、上記最適イントラ予測モードと上記最適インタ予測モードを比較し最適予測モードを決定する。
Draft of Version 4 of H.264/AVC(ITU−TRecommendation H.264 and ISO/IEC 14496−10 (MPEG−4 part 10) Advanced Video Coding), Joint Video Team (JVT) of ISO/IEC MPEG & ITU−T VCEG、Document:JVT−N050d1、2005−01−28 "EFFICIENT CODING MODE DECISION IN MPEG−4 PART−10 AVC/H.264 MAIN PROFILE"、Inchoon Choi、 Jeyun Lee、and Byeungwoo Jeon、[平成17年8月8日検索]、インターネット<URL: http://media.skku.ac.kr/publications/paper/IntC/cic_ICIP2004.pdf>
上記、H.264符号化方式にあっては、MPEG−2やMPEG−4といった従来の符号化方式に比べ、非常に多くの予測タイプ(モード)を持つことが特徴となっている。とりわけ、動き補償するピクチャでは、イントラ予測と同時に動き補償予測として、動きベクトル検出を行なうブロックサイズを複数の候補(16×16、16×8、8×16、8×8、8×4、4×8、4×4)から選択することができる。この場合、符号化に最適なブロックサイズを選択するには、候補となるすべてのブロックサイズで動きベクトル検出を行った上で決定する方法が一番好ましいが、この方法では演算量が非常に多くなってしまうという課題がある。また、同様に、イントラ予測においても、イントラ4×4予測では各ブロックについて9つの予測モードがあり、その予測演算の負荷は非常に大きくなる。
これに対して、上記非特許文献2では、動き補償するピクチャ(あるいはスライス)の動き補償のブロックがskipモードであるか否かを判定し、skipモードであった場合、残余の予測モードの予測演算を行わずに省略することで、演算量を低減させている。例えば、skipモードが選択されやすい静止ブロックあるいは一方向に等速で移動する対象を含む動画像の場合、予測モード選択の精度は高くなり、演算量を低減できる。
しかしながら、動き探索範囲を超えるような高速に移動する対象、あるいは等速で移動しない対象を含む動画像、更に、低速であっても回転、拡大・縮小あるいは変形を伴った対象を含む動画像では、ダイレクモードによる動き補償は外れ、skipモードは選択されない。このような動画像では、むしろ、イントラ予測モードで予測した方が予測精度は高くなる。
また、上記非特許文献2では、skipモードを初期の予測モード選択の判定基準としているが、skipモードは動き補償後の予測マクロブロックと対象マクロブロックとの予測誤差がゼロのモードであるため、優位に選択する予測モードの判定基準としてかなり限定的である。動き補償後あるいはイントラ予測後に、非常にわずかな予測誤差を含むマクロブロックの場合、それはskipモードと同様に優位に選択される予測モードの判定基準とみなせるため、更に、残余の予測モードの実行を省略することができ、演算量を大きく低減できる。
そこで、本発明は上記の事情に鑑みてなされたものであり、H.264のような符号化方式において、非常に多くの予測タイプ(モード)から精度良く効率的に予測タイプ(モード)を選択するため、イントラ予測モードとインタ予測モードの予測評価値を相互に参照することで、符号化処理の高速化および演算負荷を軽減することができる画像符号化装置および画像符号化方法を提供することを目的とする。
上記目的を達成するため、本発明に係る画像符号化装置は、連続するピクチャからなる動画像を圧縮符号化する画像符号化装置であって、イントラ予測ブロックサイズの最大サイズの予測モードによる予測評価値および動き補償ブロックサイズの最大サイズの予測モードによる予測評価値の少なくとも1つに基づいて、最大サイズを除く前記イントラ予測ブロックサイズの予測モードによる予測および最大サイズを除く前記動き補償ブロックサイズの予測モードによる予測の少なくとも1つを更に実行するか否かを判定する第1のモード選択手段と、前記イントラ予測ブロックサイズの最大サイズの予測モードでイントラ予測を行って前記予測評価値を算出するとともに、前記第1のモード選択手段の判定結果に基づいて、前記最大サイズを除くイントラ予測ブロックサイズの予測モードでイントラ予測を行って前記予測評価値を算出するイントラ予測手段と、前記動き補償ブロックサイズの最大サイズの予測モードで動き補償予測を行って前記予測評価値を算出するとともに、前記第1のモード選択手段の判定結果に基づいて、前記最大サイズを除く動き補償ブロックサイズの予測モードで動き補償予測を行って前記予測評価値を算出する動き補償予測手段と、前記イントラ予測手段によってイントラ予測された各予測モードの予測評価値および前記動き補償予測手段によって動き補償予測された各予測モードの予測評価値を用いて、1つの予測モードを選択する第2のモード選択手段とを備えることを特徴とする。
これによって、イントラ予測および動き補償予測において予測ブロックサイズの最大サイズによる予測を先に実行し、その予測による予測評価値の大きさによって、イントラ予測および動き補償予測における最大サイズ以外のブロックサイズによる予測を更に実行する必要があるか否か判定することで、余計な予測を省略して、符号化処理の高速化および演算負荷を軽減することができる。
ここで、前記第1のモード選択手段は、前記イントラ予測ブロックサイズの最大サイズの複数の予測モードによる予測評価値および前記動き補償ブロックサイズの最大サイズの予測モードによる予測評価値の中で、少なくとも1つが所定のしきい値を超えなかった場合、前記動き補償ブロックサイズの最大サイズを除く動き補償ブロックサイズによる予測、および前記イントラ予測ブロックサイズの最大サイズを除くイントラ予測ブロックサイズによる予測を実行しないと判定してもよい。
これによって、最大サイズ以外のブロックサイズによるイントラ予測および動き補償予測を省略するので、符号化処理の高速化および演算負荷を軽減することができる。
また、前記第1のモード選択手段は、前記イントラ予測ブロックサイズの最大サイズの複数の予測モードによる予測評価値の中で、少なくとも1つが所定のしきい値を超えなかった場合、前記動き補償ブロックサイズの最大サイズを除く動き補償ブロックサイズによる予測を実行しないと判定してもよい。
これによって、例えばイントラ予測ブロックサイズの最大ブロックサイズによる予測モードの予測評価値が非常に小さな場合、画面が一様な領域とみなすことができるため、最大サイズ以外のブロックサイズによる動き補償予測を省略することで、符号化処理の高速化および演算負荷を軽減することができる。
また、前記第1のモード選択手段は、前記動き補償ブロックサイズの最大サイズの予測モードによる予測評価値が所定のしきい値を超えなかった場合、前記イントラ予測ブロックサイズの最大サイズを除くイントラ予測ブロックサイズによる予測を実行しないと判定してもよい。
これによって、例えば動き補償ブロックサイズの最大ブロックサイズによる予測モードの予測誤差が非常に小さな場合、動き補償予測の予測モードが選択される可能性が高いため、イントラ予測を省略することで、符号化処理の高速化および演算負荷を軽減することができる。
また、前記第1のモード選択手段は、前記動き補償ブロックサイズの最大サイズの予測モードによる予測評価値が所定のしきい値を超え、かつ前記イントラ予測ブロックサイズの最大サイズの複数の予測モードによる予測評価値の中で、少なくとも1つが所定のしきい値を超えなかった場合、前記所定のしきい値を超えなかった前記イントラ予測ブロックサイズの最大サイズの予測モードに応じて、前記動き補償ブロックサイズの最大サイズを除く動き補償ブロックサイズの予測モード中から所定の動き補償ブロックサイズの予測モードを選択して動き補償予測すると判定してもよい。
これによって、所定のしきい値を超えなかったイントラ予測ブロックサイズの最大サイズの予測モードに応じて、所定の動き補償ブロックサイズの予測モードを選択して動き補償予測することができ、予測精度を向上することができる。
なお、本発明は、このような画像符号化装置として実現することができるだけでなく、このような画像符号化装置が備える特徴的な手段をステップとする画像符号化方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
本発明に係る画像符号化装置および画像符号化方法によれば、先に実行したイントラ予測および動き補償予測における予測ブロックサイズの最大サイズによる予測評価値に基づいて、イントラ予測および動き補償予測における最大サイズ以外のブロックサイズによる予測を更に実行する必要があるか否か判定することで、余計な予測を省略して、符号化処理の高速化および演算負荷を軽減することができる。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1は、本発明の実施の形態に係る画像符号化装置の構成を示すブロック図である。
画像符号化装置は、入力される動画像をブロック単位で符号化するための装置であり、図1に示すようにブロック分割部11、差分処理部12 、直交変換部13、量子化部14 、符号化部15 、蓄積バッファ16 、逆量子化部17 、逆直交変換部18、加算処理部19 、フレームメモリ20 、イントラ推定部31、動き推定部32、第1のモード選択部33、第2のモード選択部34、モードスッチ24、イントラ予測部25、動き補償部26、およびレート制御部27を備えている。
本実施の形態の構成は、上記背景技術で説明したH.264画像符号化装置の構成とほぼ同であるが、モード選択部が第1のモード選択部と第2のモード選択部の2段階に分かれている点で異なる。なお、本実施の形態の構成の符号は、背景技術で説明した図11に示す画像符号化装置の構成と同じ動作をするところは同じ符号を付してある。このため、以下、本実施の形態の説明では、構成の異なる第1のモード選択部33と第2のモード選択部34、イントラ推定部31、および動き推定部32を中心に述べる。
入力動画像の各ピクチャはブロック分割部11にてマクロブロック(入力マクロブロック)に分割され、差分処理部12に入力される。差分処理部12は、入力マクロブロックの各画素に対して、イントラ予測部25または動き補償部26で生成された予測マクロブロックとの間で差分処理を施し、差分マクロブロックを出力する。差分マクロブロックは、直交変換部13に入力され、複数の直交変換ブロックに周波数変換される。
周波数変換された各変換係数は、量子化部14でレート制御部27から入力された量子化パラメータに従って量子化され、符号化部15および逆量子化部17に出力される。符号化部15は、量子化直交変換係数および後述する第2のモード選択部34で選択された予測情報をコード化し、蓄積バッファ16に供給する。蓄積バッファ16は、蓄積したコードをストリームとして出力する。
逆量子化部17は、供給された量子化直交変換係数をレート制御部27から入力される量子化パラメータに従って逆量子化し、逆直交変換部18に供給して差分マクロブロックとして復元する。復元された差分マクロブロックは、予測マクロブロックと共に加算処理部19に入力される。
加算処理部19は、復元された差分マクロブロックと予測マクロブロックの各画素に加算処理を施し、再生マクロブロックを生成する。この再生マクロブロックは、フレームメモリ20に蓄積される。フレームメモリ20に蓄積された再生マクロブロックは、予測モード選択のためにイントラ推定部31と動き推定部32とに、そして予測マクロブロック生成のためにイントラ予測部26と動き補償部27とにそれぞれ供給される。
イントラ推定部31および動き推定部32は、それぞれ後述するように予測プロセスに従って各候補予測タイプ(モード)とその時の予測評価値を求める。この予測評価値として、例えば、イントラ予測では、各予測候補モードにおける予測ブロックと入力ブロックとの予測誤差信号の絶対値和又は2乗値和、あるいは予測誤差信号のアダマール変換後絶対値和などによるDistortionと、その予測候補モードを符号化したときのビット量であるRateとのバランスを最適化したRD(Rate−Distortion)関数によって算出した値などを使う。また、動き補償予測では、動き補償する対象ブロックと参照ブロックとの動き補償予測誤差信号の絶対値和または2乗和に動きベクトルの符号量を加味した関数等を用いる。
イントラ推定部31および動き推定部32で求められた予測候補タイプ(モード)とその予測評価値は、第1のモード選択部33と第2のモード選択部34に供給される。なお、このとき、すべての予測候補タイプ(モード)による予測が実行され、その予測候補タイプ(モード)と予測評価値が、第1のモード選択部33および第2のモード選択部34に供給されるわけではない。
参照ピクチャを持たない画面内予測符号化を行うIピクチャでは、イントラ予測しか使われないが、1枚のピクチャのみを参照し画面間予測符号化を行うPピクチャや同時に2枚以上のピクチャを参照して画面間予測符号化を行うBピクチャでイントラ予測と動き予測が使われる。
従って、Bピクチャでは、図2に示すように、マクロブロック(16×16)レベルで8つの符号化タイプ(動き予測では、skip、ダイレクト16×16、インタ16×16、インタ16×8、インタ8×16、そしてインタ8×8、イントラ予測では、イントラ16×16とイントラ4×4(あるいはイントラ8×8))、そしてインタ8×8が選択された場合、更に5つの符号化タイプ(ダイレクト8×8、インタ8×8、インタ4×8、インタ8×4、そしてインタ4×4)を選択することができる。
上記Bピクチャのように、選択可能な符号化タイプが非常に多くなると参照ピクチャ枚数も増えるため予測計算の負荷が非常に大きくなるが、実際には画像の内容によって、これ以上予測を実行する必要がない場合がある。
例えば、図3のような画面の中央の2人の人物がいて、それら人物はわずかに動いているがその背景は一様な画像でほとんど静止している場合、背景の画像領域はイントラ予測あるいは動き予測とも16×16の最も大きな予測ブロックで予測した方が符号化効率が高く、予測タイプとして選択される可能性が高い。とりわけ、周辺の画像領域と類似した背景や一定速度の一様な領域の画像領域では、16×16のskipマクロブロックや16×16のダイレクトモードが選択される可能性が高く、予測誤差信号の情報を送る必要がないため、符号化効率も高くなる。
一方、人物の動きは回転や変形を伴い、必ずしも一定方向に等速に動いているわけではない。このような場合は、動き補償よりも面内の近傍画素情報からイントラ予測した方が予測誤差は少ない場合がある。
また、人物や物などの対象が高速に動いた場合には、動き予測する動き検索範囲から対象が外れるため、イントラ予測が選択される可能性が高くなる。また、その場合、対象は高速に動いているためブレており一定方向(水平、垂直など)に流れるような平坦な画像となっているため、イントラ16×16予測が選択される可能性が高い。
従って、まず、16×16のブロックサイズでイントラ予測あるいは動き予測を行い、そのときの予測評価値が非常に小さければ16×16以外のブロックサイズによる予測タイプ(モード)を省略しても大きな符号化効率の損失はない。
なお、この場合、イントラ16×16予測の予測評価値が小さくなくとも、16×16の動き補償(インタ)予測の予測評価値が非常に小さければ、結果的に予測モードとしてイントラ予測よりも動き補償による予測モードが優位に選択される可能性が高いため、イントラ4×4(あるいはイントラ8×8)を省略しても大きな符号化効率の損失はない。また、同様に、16×16の動き補償(インタ)予測の予測評価値が小さくなくとも、イントラ16×16予測の予測評価値が非常に小さければ、そのブロックは一様に平坦な画像からなる領域と判断されるため、16×16以外の動き補償による予測モードを実行しても、符号化効率の大きな改善は望めない。
図4は、イントラ推定部31、動き推定部32、第1のモード選択部33および第2のモード選択部34における上記のような予測モードの実行と選択のプロセスを示すフローチャートである。
図4において、ステップS202およびステップS203で、16×16のブロックサイズによるイントラ16×16予測と動き(インタ)予測16×16が並列同時的に実行される。ステップS202で、イントラ推定部31は、イントラ予測16×16の4つの予測モード(モード0からモード3)についてその予測ブロックを生成し、入力ブロックとの誤差から予測評価値(総称としてイントラ16×16予測評価値と呼ぶ)を算出する。ステップS203で、動き推定部32は、動き(インタ)予測16×16の符号化タイプ(skip、インタ16×16,Bピクチャでは更にダイレクト16×16)についてその予測評価値(総称としてインタ16×16予測評価値と呼ぶ)を算出する。
上記予測(タイプ)モードにおける、イントラ16×16予測評価値とインタ16×16予測評価値は、第1のモード選択部33および第2のモード選択部34に供給される。ステップS204(ステップS204−1とステップS204−2は基本的に同一ステップ)で、第1のモード選択部33は、上記予測(タイプ)モードにおけるイントラ16×16予測評価値あるいはインタ16×16予測評価値のどちらかが、それぞれ所定の閾値(th1、th2)を超えているか否かを判定し、超えていなければ、これ以上予測モードの演算を実行しない(第1のモード選択)。結果的に、16×16のブロックサイズによるイントラ予測と動き(インタ)予測の各モードの予測評価値だけが第2のモード選択部34に供給される。
一方、ステップS204で、第1のモード選択部33が、前記各予測(タイプ)モードにおけるイントラ16×16予測評価値とインタ16×16予測評価値のいずれもが、それぞれ所定の閾値(th1、th2)を超えたと判定したならば、ステップS205でイントラ推定部31は、イントラ予測4×4(あるいは8×8)を実行し、あるいはおよびステップS206で、動き推定部32は、動き(インタ)予測16×16を除く動き(インタ)予測を実行する。結果的に、16×16のブロックサイズ以外のイントラ予測あるいはおよび動き予測の各予測(タイプ)モードとその予測評価値が第2のモード選択部34に供給される。
ステップS207で、第2のモード選択部34は、16×16のブロックサイズに予測(タイプ)モードの予測評価値を含めた供給されたすべての各予測(タイプ)モードの予測評価値を比較し、もっとも予測評価値が小さな予測(タイプ)モードを選択する(第2のモード選択)。そして選択された予測(タイプ)モードはモードスッチ24へ送られる。
次に、モードスッチ24は、選択された予測(タイプ)モードに従って、予測情報(予測タイプ、動きベクトル、参照ピクチャ番号)をイントラ予測部25または動き補償部26に対して出力する。イントラ予測部25または動き補償部26は、選択された予測タイプと、フレームメモリ20 内の符号化済み周囲画素や参照ピクチャから予測マクロブロックを生成し、差分処理部12および加算処理部19に出力する。
以上のように、本実施の形態では、第1のモード選択部33においてイントラ推定部31および動き推定部32で予測される予測候補タイプ(モード)のうち予測ブロックサイズの最も大きな予測(タイプ)モード、例えば、イントラ予測ではイントラ16×16予測、動き補償予測ではインタ16×16予測(skipあるいはダイレクトモードを含む)を先に実行し、それら予測タイプ(モード)の予測評価値が非常に小さい場合、これ以上余計な予測モードを実行しないことで、大幅に計算負荷を軽減することができる。
なお、図5は、図4に示すイントラ推定部31、動き推定部32、第1のモード選択部33および第2のモード選択部34における予測モードの実行と選択のプロセスを順次的に示すフローチャートであり、各動作は図4に示すフローチャートと同様であるので説明は省略する。
また、図6に示すように動き(インタ)予測のみ16×16ブロックサイズによる第1のモード選択を実行、あるいは図7に示すようにイントラ予測のみ16×16ブロックサイズによる第1のモード選択を実行し、予測(タイプ)モードの削減を行ってもよい。図6および図7の各ステップは図4のステップと同一であるため説明は省略する。
また、上記図4および図6におけるステップS204の第1のモード選択で、イントラ16×16予測評価値が所定の閾値th1を超えない場合、動き予測16×16を選択することになっているが、選択されたイントラ16×16予測の予測モードによっては、16×16以外の動き補償ブロックを選択した方がよい場合もあり得る。
例えば、図8に示すように、一様な背景を矩形の対象(黒い部分)が左方向へ移動している場合、矩形対象の左端境界領域と上下端境界領域のマクロブロックでは、それぞれ、図8(a)のイントラ16×16予測のモード0の垂直方向と図8(b)のイントラ16×16予測のモード1の水平方向が優位に選択される。この場合、これらのマクロブロックの動き補償ブロックサイズ候補は、それぞれ、イントラ16×16予測のモード0では図9(a)に示すように16×16あるいは8×16ブロックサイズが、イントラ16×16予測のモード1では図9(b)に示すように16×16あるいは8×16ブロックサイズが予想される。また、図8では説明できないが、イントラ16×16予測のモード3のplaneが優位に選択された場合、図9の(d)に示す16×16あるいは8×8が考えられる。
従って、インタ16×16予測評価値が所定の閾値th2を超え、かつ、イントラ16×16予測評価値が所定の閾値th1を超えない場合、イントラ16×16予測のモード0、モード1およびモード3に対しては、16×16の動き補償予測ブロックの予測に加え、それぞれ、8×16、16×8、および8×8のブロックサイズを追加選択してもよい。
上記、イントラ16×16予測の予測モードによる動き補償ブロックサイズの追加についてそのプロセスを図9のフローチャートで説明する。
図10のステップS204のサブステップであるステップS204−2−1で、第1のモード選択部33は、動き予測16×16のインタ16×16予測評価値が所定の閾値th1を超えているか否かを判定し、th2を超えない場合(ステップS204−2−1でYes)には動き予測16×16のみを選択する。一方、閾値th2を超えた場合(ステップS204−2−1でNo)にはステップS204−2−2へ進む。ステップS204−2−2で、第1のモード選択部33は、イントラ16×16予測の予測評価値が所定の閾値th1を超えているか否かを判定し、閾値th2を超えない場合(ステップS204−2−2でYes)にはステップS204−2−3で閾値th1を超えなかったイントラ16×16予測の予測モード番号を抽出する。なお、閾値th1を超えなかったイントラ16×16予測の予測モードが複数ある場合には、その予測モード番号をすべて抽出してもよいし、その中で予測評価値が最も小さい予測モード番号を抽出してもよい。一方、閾値th2を超えた場合(ステップS204−2−2でNo)にはステップS206で、動き推定部32は、16×16以外のブロックサイズの動き予測を実行する。
動き推定部32は、ステップS204−2−3で抽出されたイントラ16×16予測の予測モード番号について、そのモード番号に対応する動き予測を行う。すなわち、モード0ではステップS302のインタ予測8×16、モード1ではステップS303のインタ予測16×8、モード3ではステップS304のインタ予測8×8、そしてモード2ではステップS305の非実行NOPを実行する。
また、上記実施の形態では、イントラ16×16予測とインタ16×16予測の予測評価値のいずれかが所定の閾値を超えなければ、16×16以外のブロックサイズによる残余の予測(タイプ)モードを実行しなかったが、イントラ16×16予測とインタ16×16予測の予測評価値が共に所定の閾値を超えなかった場合16×16以外のブロックサイズによる残余の予測(タイプ)モードを実行しないといった設定を設けてもよい。この場合、予測を実行するマクロブロックの数が増え負荷は増大するものの、一様な平坦な画像領域でしかも動き補償による予測誤差が非常に小さいマクロブロックのみ、第1のモード選択で選択され、残余の予測(タイプ)モードについては予測を実行しないため、より正確で確実な予測モードの選択が可能になる。
また、図1に示したブロック図の各機能ブロックは典型的には集積回路であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い。(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、データを格納するユニットだけ1チップ化せずに、別構成としても良い。
本発明は、ピクチャをブロック単位に符号化する画像符号化装置に適しており、動画配信するウェブサーバー、それを受信するネットワーク端末、動画の記録再生可能なデジタルカメラ、カメラ付き携帯電話機、D V D 録画/ 再生機、P D A 、パーソナルコンピュータ等に適している。
本発明の実施の形態に係る画像符号化装置の構成を示すブロック図である。 H.264画像符号化におけるBタイプで使用される符号化モードについて説明するための図である。 本発明における予測モードの選択に関する一例として説明するための図である。 本発明における予測モードの選択に関するプロセスを説明するためのフローチャートである。 本発明における予測モードの選択に関するプロセスを説明するための他のフローチャートである。 本発明における予測モードの選択に関する他のプロセスを説明するためのフローチャートである。 本発明における予測モードの選択に関するさらに他のプロセスを説明するためのフローチャートである。 本発明における予測モードの選択に関するイントラ予測の予測モードと動き予測の関係について説明するための図である。 本発明における予測モードの選択に関するイントラ予測の予測モードと動き補償ブロックサイズの関係について説明するための図である。 本発明における予測モードの選択に関するさらに他のプロセスを説明するためのフローチャートである。 従来のH.264画像符号化装置の構成を示すブロック図である。 4:2:0フォーマット形式の1ピクチャの映像信号を説明するための図である。 4:2:0フォーマット形式の1マクロブロックの映像信号を説明するための図である。 4:2:0フォーマット形式の1マクロブロックの直交変換ブロックを説明するための図である。 H.264画像符号化での輝度信号におけるイントラ4×4予測を説明するための図である。 H.264画像符号化での輝度信号におけるイントラ16×16予測を説明するめの図である。 動き推定の典型的な技術としてブロックマッチング法について説明するための図である。 H.264画像符号化における動き補償ブロックタイプを説明するための図である。 H.264画像符号化における従来の予測モード選択の低減方法に関して説明するためのフローチャートである。
符号の説明
11 ブロック分割部
12 差分処理部
13 直交変換部
14 量子化部
15 符号化部
16 蓄積バッファ
17 逆量子化部
18 逆直交変換部
19 加算処理部
20 フレームメモリ
21、31 イントラ推定部
22、32 動き推定部
23 モード選択部
33 第1のモード選択部
34 第2のモード選択部
24 モードスッチ
25 イントラ予測部
26 動き補償部
27 レート制御部

Claims (10)

  1. 連続するピクチャからなる動画像を圧縮符号化する画像符号化装置であって、
    イントラ予測ブロックサイズの最大サイズの予測モードによる予測評価値および動き補償ブロックサイズの最大サイズの予測モードによる予測評価値の少なくとも1つに基づいて、最大サイズを除く前記イントラ予測ブロックサイズの予測モードによる予測および最大サイズを除く前記動き補償ブロックサイズの予測モードによる予測の少なくとも1つを更に実行するか否かを判定する第1のモード選択手段と、
    前記イントラ予測ブロックサイズの最大サイズの予測モードでイントラ予測を行って前記予測評価値を算出するとともに、前記第1のモード選択手段の判定結果に基づいて、前記最大サイズを除くイントラ予測ブロックサイズの予測モードでイントラ予測を行って前記予測評価値を算出するイントラ予測手段と、
    前記動き補償ブロックサイズの最大サイズの予測モードで動き補償予測を行って前記予測評価値を算出するとともに、前記第1のモード選択手段の判定結果に基づいて、前記最大サイズを除く動き補償ブロックサイズの予測モードで動き補償予測を行って前記予測評価値を算出する動き補償予測手段と、
    前記イントラ予測手段によってイントラ予測された各予測モードの予測評価値および前記動き補償予測手段によって動き補償予測された各予測モードの予測評価値を用いて、1つの予測モードを選択する第2のモード選択手段と
    を備えることを特徴とする画像符号化装置。
  2. 前記第1のモード選択手段は、前記イントラ予測ブロックサイズの最大サイズの複数の予測モードによる予測評価値および前記動き補償ブロックサイズの最大サイズの予測モードによる予測評価値の中で、少なくとも1つが所定のしきい値を超えなかった場合、前記動き補償ブロックサイズの最大サイズを除く動き補償ブロックサイズによる予測、および前記イントラ予測ブロックサイズの最大サイズを除くイントラ予測ブロックサイズによる予測を実行しないと判定する
    ことを特徴とする請求項1記載の画像符号化装置。
  3. 前記第1のモード選択手段は、前記イントラ予測ブロックサイズの最大サイズの複数の予測モードによる予測評価値の中で、少なくとも1つが所定のしきい値を超えなかった場合、前記動き補償ブロックサイズの最大サイズを除く動き補償ブロックサイズによる予測を実行しないと判定する
    ことを特徴とする請求項1記載の画像符号化装置。
  4. 前記第1のモード選択手段は、前記動き補償ブロックサイズの最大サイズの予測モードによる予測評価値が所定のしきい値を超えなかった場合、前記イントラ予測ブロックサイズの最大サイズを除くイントラ予測ブロックサイズによる予測を実行しないと判定する
    ことを特徴とする請求項1記載の画像符号化装置。
  5. 前記第1のモード選択手段は、前記動き補償ブロックサイズの最大サイズの予測モードによる予測評価値が所定のしきい値を超え、かつ前記イントラ予測ブロックサイズの最大サイズの複数の予測モードによる予測評価値の中で、少なくとも1つが所定のしきい値を超えなかった場合、前記所定のしきい値を超えなかった前記イントラ予測ブロックサイズの最大サイズの予測モードに応じて、前記動き補償ブロックサイズの最大サイズを除く動き補償ブロックサイズの予測モード中から所定の動き補償ブロックサイズの予測モードを選択して動き補償予測すると判定する
    ことを特徴とする請求項1記載の画像符号化装置。
  6. 前記動き補償ブロックサイズの最大サイズおよび前記イントラ予測ブロックサイズの最大サイズはそれぞれ16ライン×16画素からなるブロックサイズであり、
    前記第1のモード選択手段は、前記所定のしきい値を超えなかった前記イントラ予測における16ライン×16画素ブロックサイズによる予測で優位に選択された予測モードが前記16ライン×16画素ブロックに隣接する左側の画素情報に基づいて予測される水平モードである場合、前記動き補償ブロックサイズとして8ライン×16画素の動き補償ブロックサイズを選択すると判定する
    ことを特徴とする請求項5記載の画像符号化装置。
  7. 前記動き補償ブロックサイズの最大サイズおよび前記イントラ予測ブロックサイズの最大サイズはそれぞれ16ライン×16画素からなるブロックサイズであり、
    前記第1のモード選択手段は、前記所定のしきい値を超えなかった前記イントラ予測における16ライン×16画素ブロックサイズによる予測で優位に選択された予測モードが前記16ライン×16画素ブロックに隣接する上側の画素情報に基づいて予測される垂直モードである場合、前記動き補償ブロックサイズとして16ライン×8画素の動き補償ブロックサイズを選択すると判定する
    ことを特徴とする請求項5記載の画像符号化装置。
  8. 前記画像符号化装置は、H.264画像符号化を行う
    ことを特徴とする請求項1〜請求項7のいずれか1項に記載の画像符号化装置。
  9. 連続するピクチャからなる動画像を圧縮符号化する画像符号化方法であって、
    イントラ予測ブロックサイズの最大サイズの予測モードによる予測評価値および動き補償ブロックサイズの最大サイズの予測モードによる予測評価値の少なくとも1つに基づいて、最大サイズを除く前記イントラ予測ブロックサイズの予測モードによる予測および最大サイズを除く前記動き補償ブロックサイズの予測モードによる予測の少なくとも1つを更に実行するか否かを判定する第1のモード選択ステップと、
    前記イントラ予測ブロックサイズの最大サイズの予測モードでイントラ予測を行って前記予測評価値を算出するとともに、前記第1のモード選択ステップにおける判定結果に基づいて、前記最大サイズを除くイントラ予測ブロックサイズの予測モードでイントラ予測を行って前記予測評価値を算出するイントラ予測ステップと、
    前記動き補償ブロックサイズの最大サイズの予測モードで動き補償予測を行って前記予測評価値を算出するとともに、前記第1のモード選択ステップにおける判定結果に基づいて、前記最大サイズを除く動き補償ブロックサイズの予測モードで動き補償予測を行って前記予測評価値を算出する動き補償予測ステップと、
    前記イントラ予測ステップにおいてイントラ予測された各予測モードの予測評価値および前記動き補償予測ステップにおいて動き補償予測された各予測モードの予測評価値を用いて、1つの予測モードを選択する第2のモード選択ステップと
    を含むことを特徴とする画像符号化方法。
  10. 連続するピクチャからなる動画像を圧縮符号化するための集積回路であって、
    イントラ予測ブロックサイズの最大サイズの予測モードによる予測評価値および動き補償ブロックサイズの最大サイズの予測モードによる予測評価値の少なくとも1つに基づいて、最大サイズを除く前記イントラ予測ブロックサイズの予測モードによる予測および最大サイズを除く前記動き補償ブロックサイズの予測モードによる予測の少なくとも1つを更に実行するか否かを判定する第1のモード選択手段と、
    前記イントラ予測ブロックサイズの最大サイズの予測モードでイントラ予測を行って前記予測評価値を算出するとともに、前記第1のモード選択手段の判定結果に基づいて、前記最大サイズを除くイントラ予測ブロックサイズの予測モードでイントラ予測を行って前記予測評価値を算出するイントラ予測手段と、
    前記動き補償ブロックサイズの最大サイズの予測モードで動き補償予測を行って前記予測評価値を算出するとともに、前記第1のモード選択手段の判定結果に基づいて、前記最大サイズを除く動き補償ブロックサイズの予測モードで動き補償予測を行って前記予測評価値を算出する動き補償予測手段と、
    前記イントラ予測手段によってイントラ予測された各予測モードの予測評価値および前記動き補償予測手段によって動き補償予測された各予測モードの予測評価値を用いて、1つの予測モードを選択する第2のモード選択手段と
    を備えることを特徴とする集積回路。
JP2005236914A 2005-08-17 2005-08-17 画像符号化装置および画像符号化方法 Pending JP2007053561A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005236914A JP2007053561A (ja) 2005-08-17 2005-08-17 画像符号化装置および画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005236914A JP2007053561A (ja) 2005-08-17 2005-08-17 画像符号化装置および画像符号化方法

Publications (1)

Publication Number Publication Date
JP2007053561A true JP2007053561A (ja) 2007-03-01

Family

ID=37917706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005236914A Pending JP2007053561A (ja) 2005-08-17 2005-08-17 画像符号化装置および画像符号化方法

Country Status (1)

Country Link
JP (1) JP2007053561A (ja)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008228305A (ja) * 2007-03-12 2008-09-25 Vixs Systems Inc エンコーディング及びデコーディングモードを有するビデオ処理システム及び装置、並びに、これらと共に使用する方法
JP2009055519A (ja) * 2007-08-29 2009-03-12 Sony Corp 符号化処理装置、符号化処理方法、復号処理装置、及び、復号処理方法
WO2009037828A1 (ja) * 2007-09-21 2009-03-26 Panasonic Corporation 画像符号化装置および画像復号化装置
JP2010530184A (ja) * 2007-06-15 2010-09-02 クゥアルコム・インコーポレイテッド ビデオブロック予測モードの適応形符号化
JP2010263301A (ja) * 2009-04-30 2010-11-18 Mega Chips Corp 画像データの生成方法
JP2011205711A (ja) * 2011-07-14 2011-10-13 Canon Inc 画像処理装置およびその方法
US8571104B2 (en) 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
WO2015054813A1 (en) * 2013-10-14 2015-04-23 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
US9591325B2 (en) 2015-01-27 2017-03-07 Microsoft Technology Licensing, Llc Special case handling for merged chroma blocks in intra block copy prediction mode
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10368091B2 (en) 2014-03-04 2019-07-30 Microsoft Technology Licensing, Llc Block flipping and skip mode in intra block copy prediction
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US10506254B2 (en) 2013-10-14 2019-12-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
US10582213B2 (en) 2013-10-14 2020-03-03 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
US10659783B2 (en) 2015-06-09 2020-05-19 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US10785486B2 (en) 2014-06-19 2020-09-22 Microsoft Technology Licensing, Llc Unified intra block copy and inter prediction modes
US10812817B2 (en) 2014-09-30 2020-10-20 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008228305A (ja) * 2007-03-12 2008-09-25 Vixs Systems Inc エンコーディング及びデコーディングモードを有するビデオ処理システム及び装置、並びに、これらと共に使用する方法
US8488668B2 (en) 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US9578331B2 (en) 2007-06-15 2017-02-21 Qualcomm Incorporated Separable directional transforms
JP2010530184A (ja) * 2007-06-15 2010-09-02 クゥアルコム・インコーポレイテッド ビデオブロック予測モードの適応形符号化
US8619853B2 (en) 2007-06-15 2013-12-31 Qualcomm Incorporated Separable directional transforms
US8571104B2 (en) 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8520732B2 (en) 2007-06-15 2013-08-27 Qualcomm Incorporated Adaptive coding of video block prediction mode
US8428133B2 (en) 2007-06-15 2013-04-23 Qualcomm Incorporated Adaptive coding of video block prediction mode
US8379726B2 (en) 2007-08-29 2013-02-19 Sony Corporation Coding apparatus, coding method, decoding apparatus, and decoding method
JP2009055519A (ja) * 2007-08-29 2009-03-12 Sony Corp 符号化処理装置、符号化処理方法、復号処理装置、及び、復号処理方法
WO2009037828A1 (ja) * 2007-09-21 2009-03-26 Panasonic Corporation 画像符号化装置および画像復号化装置
JP5261376B2 (ja) * 2007-09-21 2013-08-14 パナソニック株式会社 画像符号化装置および画像復号化装置
JP2010263301A (ja) * 2009-04-30 2010-11-18 Mega Chips Corp 画像データの生成方法
US9516320B2 (en) 2009-04-30 2016-12-06 Megachips Corporation Method of generating image data
JP2011205711A (ja) * 2011-07-14 2011-10-13 Canon Inc 画像処理装置およびその方法
US10506254B2 (en) 2013-10-14 2019-12-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
WO2015054813A1 (en) * 2013-10-14 2015-04-23 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
US10582213B2 (en) 2013-10-14 2020-03-03 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
US11109036B2 (en) 2013-10-14 2021-08-31 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
US10368091B2 (en) 2014-03-04 2019-07-30 Microsoft Technology Licensing, Llc Block flipping and skip mode in intra block copy prediction
US10785486B2 (en) 2014-06-19 2020-09-22 Microsoft Technology Licensing, Llc Unified intra block copy and inter prediction modes
US10812817B2 (en) 2014-09-30 2020-10-20 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US9591325B2 (en) 2015-01-27 2017-03-07 Microsoft Technology Licensing, Llc Special case handling for merged chroma blocks in intra block copy prediction mode
US10659783B2 (en) 2015-06-09 2020-05-19 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding

Similar Documents

Publication Publication Date Title
JP2007053561A (ja) 画像符号化装置および画像符号化方法
KR101473278B1 (ko) 화상 예측 부호화 장치, 화상 예측 복호 장치, 화상 예측 부호화 방법, 화상 예측 복호 방법, 화상 예측 부호화 프로그램, 및 화상 예측 복호 프로그램
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
JP5289440B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP4542447B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
JP6164600B2 (ja) ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体
JP2007201558A (ja) 動画像符号化装置および動画像符号化方法
WO2014054267A1 (ja) 画像符号化装置及び画像符号化方法
CN106254870B (zh) 采用自适性色彩转换的视频编码方法、系统和计算机可读取记录介质
JP2007074725A (ja) 映像のイントラ予測符号化及び復号化方法、並びに装置
JP5037938B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
KR101614828B1 (ko) 화상 부호화 및 복호 방법, 장치, 프로그램
WO2017122604A1 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラムが記憶された記憶媒体
JP2010057166A (ja) 画像符号化装置、画像符号化方法、集積回路及びカメラ
CN102396231A (zh) 图像处理设备及方法
KR100727991B1 (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
JP7321345B2 (ja) ビデオ符号化及び復号
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP5322956B2 (ja) 画像符号化装置および画像符号化方法
JP2008141407A (ja) 符号化方式変換装置及び符号化方式変換方法
JP2008099175A (ja) 動画符号化装置および動画符号化方法
JP4561701B2 (ja) 動画像符号化装置
JP2023052553A (ja) ビデオ符号化及び復号
JP5868909B2 (ja) 復号化方法
JP5380594B2 (ja) 画像の復号化方法