JP2009516970A - ビデオ画像符号化方法及び装置 - Google Patents

ビデオ画像符号化方法及び装置 Download PDF

Info

Publication number
JP2009516970A
JP2009516970A JP2008541677A JP2008541677A JP2009516970A JP 2009516970 A JP2009516970 A JP 2009516970A JP 2008541677 A JP2008541677 A JP 2008541677A JP 2008541677 A JP2008541677 A JP 2008541677A JP 2009516970 A JP2009516970 A JP 2009516970A
Authority
JP
Japan
Prior art keywords
coding
encoding
sum
quantization step
coding mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008541677A
Other languages
English (en)
Other versions
JP5100658B2 (ja
Inventor
トロ,ドミニク
フランソワ,エドワール
ウゲネル,リラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2009516970A publication Critical patent/JP2009516970A/ja
Application granted granted Critical
Publication of JP5100658B2 publication Critical patent/JP5100658B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、前記ソースコードについて、前記符号化モードの選択は、符号化エラーの推定とテストされた相異なる符号化モードの前記ソースブロックの符号化コストの推定により行われ、符号化モードについて、符号化エラーを、この符号化モードに関する、及びこの符号化モードに対応する前記量子化係数の絶対値の和に関する、前記残差ブロックの周波数ドメインにおける数学的変換後に得られる係数の絶対値の和により行うことを特徴とする。アプリケーションはMPEG2またはMPEG4−AVC標準を用いたデータの符号化モードの決定である。

Description

本発明は、ビデオ画像の符号化方法及び装置に関し、具体的には、画像ブロックの符号化モード決定アルゴリズムに関する。
分野としては、MPEG2やMPEG4AVCなどの規格と互換性のある圧縮アルゴリズムを用いたビデオの送信及び格納の分野である。
符号化器における符号化決定の目的は、イントラピクチャモードとして知られる幾つかのモードから符号化する画像の情報を考慮して、またインターピクチャモードとして知られる幾つかのモードからそれまでに符号化した画像の情報を考慮して、一般的には16×16ピクセルの大きさの輝度ブロックを有するマクロブロックである画像の構成要素を最良の符号化モードを、所定の基準に従って選択することである。
符号化決定に使われるアルゴリズムには、実施形態の複雑さに応じて、次のものがある:
−アプリオリ型
−アポステリオリ型。
アプリオリ型のアルゴリズムは簡単だが、ビットレートとディストーションの点で適度な性能を示すが、アポステリオリ型のアルゴリズムはもっと複雑であり、よい性能を示す。
マクロブロックの符号化決定プロセスはいろいろな方法で行われ、多くの研究の対象になってきた。これらの研究は以下のように分類できる:
最初のアプローチでは、インタープレディクションモードのグループから最もよいインタープレディクションモードを求め、その後、イントラプレディクションモードがあればそのグループから最もよいイントラプレディクションモードを決定し、その後、最もよいインターモードまたは最もよいイントラモードを選択して、最終的にマクロブロック符号化を実施する。この種のアプローチは、概して参照モデルのアルゴリズムで提案されたものに対応する。このアルゴリズムのツールは、画像間差異測定とローカルアクティビティの計算に基づく。例えば、MPEG−4ビデオベリフィケーションモデル、バージョン18.0、セクション3.3.2.3(イントラ/インターモードデシジョン)を参照。
他の方法は完全にアポステリオリであり、各符号化モードについて、マクロブロック符号化のコストとリカバリ品質を仮定するものである。これは、psnr(ピークシグナル対ノイズ比)、sad(差異の絶対値の合計)、またはsatd(変換差異の絶対値の合計)、より具体的には、アダマール(Hadamard)変換、sse(二乗誤差の合計)、またはssd(二乗差異の合計)の計算により求められる。
この種のアルゴリズムは、各モードについて、ソースマクロブロックと再構成(された)ブロックまたはマクロブロックの差異を計算する。再構成(された)ブロックは、予測ブロック(これから残差ブロックが求められる)、残差ブロックのDCT(離散余弦変換)係数、DCT係数の量子化、逆量子化、逆DCTが分かっていなことを必要とする。これは、再構成(された)残差ブロックであり、予測ブロックに加えられ、再構成(された)ソースブロックを与える。純粋なイントラモードの場合、すなわち予測をしない場合、予測ブロックの値はゼロとされる。
かかるアルゴリズムは、例えば、欧州特許公開公報第EP0982951号(2000年3月1日公開、発明の名称「画像圧縮プロセス」)、またはH.Schwarz、T.Wiegand著「ラグランジュ符号化制御を用いた改良型MPEG4符号化器」(2001年3月)に記載されている。
いろいろなリカバリ品質の尺度であるsad、satd、sse、psnrは次の式で表される:
Figure 2009516970
ここで、i,j:マクロブロックMBに含まれるピクセルのラインとカラムのインデックスであり、
MBsrcはソースマクロブロックであり、
MBrecは再構成(された)マクロブロックである。
satdの値は、この場合、16×16ピクセルの大きさのブロックに含まれる際のアダマール変換係数の絶対値の合計に対応している。
参照アルゴリズムMPEG4−AVCで使用されるアポステリオリ決定基準は以下の通りである:
Jmode=ssemode+λmode.MBcost
ここで、
− Jmodeは最小の「コスト」を探し、最終的な符号化モードの選択をする範囲(entity)であり、
− sseはソースピクセルと、再構成後(すなわち逆量子化Q−1、逆変換DCT−1、及び予測ブロックの加算後)のピクセルとの間の誤差の二乗平均の値であり、
− λmodeは従来よりラグランジュ係数として知られ、量子化ステップQPによって決まる重み付け係数である。
− MBcostはマクロブロックの符号化の実効コストである。
アプリオリ符号化モードの選択アルゴリズムはアポステリオリアルゴリムより効率が低いが、後者は複雑な計算を要し処理時間がかかる。
本発明の目的の1つは上記の欠点を解消することである。
本発明の目的は画像シーケンスのビデオ画像の符号化方法であって、前記画像をブロックに分割し、前と後の画像からの情報を利用するインターピクチャタイプの予測符号化モードと、現在の画像からの情報を利用するイントラピクチャタイプの予測符号化モードのうち少なくとも一方の符号化モードによりソースブロックを符号化し、ソースブロックの予測符号化モードは余弦変換を実行し、前記ソースブロックと前記情報から計算した予測ブロックとの間の差異である残差ブロックを量子化し、量子化係数を求め、前記ソースコードについて、前記符号化モードの選択は、符号化エラーの推定とテストされた相異なる符号化モードの前記ソースブロックの符号化コストの推定により行われ、符号化モードについて、符号化エラーを、この符号化モードに関する、及びこの符号化モードに対応する前記量子化係数の絶対値の和に関する、前記残差ブロックの周波数ドメインにおける数学的変換後に得られる係数の絶対値の和により行うことを特徴とする。
具体的な実施形態では、前記符号化エラー推定は次式で与えられる:
SATDdec_est=SATDpred−f(QP)x.EnergyTQ、ここで、
−SATDpredはアダマール変換後に得られる残差ブロックの係数の絶対値の和であり、
−QPは量子化ステップであり、
−f(QP)は前記量子化ステップの所定の関数であり、
−Energyは前記量子化係数の和である。
具体的な実施形態では、関数f(QP)=δラ(QP)2であり、δは所定の定数である。
具体的な実施形態では、符号化モードの選択は次式のJmodeパラメータにより決まる:
Jmode=SATDdec_est+WQP(a.Headercost+g.EnergyTQ)、ここで
−WQPは量子化ステップQPに応じた値であり、
−Headerはデータストリーム中のマクロブロックの符号化のための符号化ヘッダのビット単位のコストであり、
−aとγは所定値のパラメータである、
具体的な実施形態では、WQPパラメータは量子化ステップQPに比例する。
具体的な実施形態では、δ=1/136から10%以内にあり、α=2、γ=4、WQP=QP/5である。
具体的な実施形態では、動き推定はアダマール変換から相関計算を行い、前記前の画像から前記情報を得る。
本発明は、前記の方法を実施するための符号化装置にも関する。該装置は、
前記相異なる符号化モードの前記符号化エラー推定を計算する処理回路とメモリ回路とを有し、前記処理回路は次式によりSATDdec_estの推定を計算し:
SATDdec_est=SATDpred−f(QP)x.EnergyTQ
前記メモリ回路は変化の範囲にわたって分布する量子化ステップQPの相異なる値の関数f(QP)の所定値を含む。
提案する方法はアプリオリの方法とアポステリオリの方法との間に位置し、すなわち、アポステリオリなメジャーメントにより求めたパラメータと、アプリオリなメジャーメントにより求めた予測とを使うものである。
本発明により、アルゴリズムの複雑性を低減したアポステリオリベースの決定に近いビットレート/歪み性能を得ることができ、マクロブロックの再構成は必要ない。
他の特徴や利点は、図1を参照して非限定的な実施例として与えられる以下の説明により明らかになるであろう。
例えば、MPEG4タイプパート10すなわちH.264等の符号化方法は、イントラモードまたはインターモードでソースマクロブロックMBsrcの符号化を行う。
インターモードでの符号化は、マクロブロックソースMBsrcと、前に符号化された基準画像から計算されローカルデコーダで再構成された予測(された)マクロブロックMBpredとの間の差異と、予測マクロブロックの計算で考慮される、ソースブロックに相関する再構成(された)ブロックを指定する動き情報に影響する。
イントラモード予測符号化は、例えば、平均輝度、または前に符号化された隣接するマクロブロックのピクセルの輝度値の情報等の、符号化するソースマクロブロックが含まれる画像中の情報を、計算時に考慮する。H.264標準にはイントラプレディクションモードが記載されている。
本発明は、上記のアポステリオリ決定基準(Jmode)に着想を得た符号化決定アルゴリズムを実施する符号化方法に関する。
符号化決定は次のパラメータに基づく:
−アプリオリなメジャーメント、すなわちSATDpred計算。すなわち、符号化されるピクセルに適用されるメジャーメント、または残差予測エラー、またはイントラ画像符号化モード及びインター画像符号化モードのピクセルドメイン中の残差ブロック、
−第1項EnergyTQと第2項Headercostを含む量子化計数に関するメジャーメント。
EnergyTQはピクセルドメインにおける残差ブロックのDCT変換後に得られる、量子化後の係数の合計である。このパラメータは、ある意味では、マクロブロックの再構成に必要な情報量に関する情報を与える。
Headercostはマクロブロックヘッダの符号化コストに対応する。符号化する係数の数等のマクロブロックに関するすべての情報が分かっているので、ヘッダの符号化コストは正確に計算できる。
この最後のメジャーメントは、量子化ステップに直接依存する重みファクタWQPにより、マクロブロック係数の量子化に使用する量子化ステップQPにより重み付けられる。
よって、符号化モード決定アルゴリズムは次の式で与えられる:
Jmode=SATDdec_est+WQP(a.Headercost+g.EnergyTQ)
−SATDdec_estはは以下で詳しく説明する予測され復号されたSATDである。その目的は、符号化後のSATDベースの再構成エラー予測または復号エラーを与えることである。
−WQPは量子化ステップQPに依存する重み付けファクタである。
−(a.Headercost+g.EnergyTQ)は、値がマクロブロックの符号化コストの変化(evolution)に最も近い情報を提供する式である。パラメータα、γによりHeadercostとEnergyTQが重み付けされる。言うまでもなく、Headercostはマクロブロックヘッダビットの符号化コストを表し、EnergyTQは量子化後の係数の合計に対応する。
Jmode値を利用可能な各符号化モードについて計算し、最小値となるモードを実際のマクロブロックの符号化のために保持する。
ソースと再構成画像との間のエラーSATDdec_estの予測は、最初に、アダマール変換されたピクセルドメイン中の残差ブロックの係数の合計に対応する予測エラーSATDpredを考慮することにより近似し、次に、この予測エラーSATDpredがDCT変換されたピクセルドメイン中の残差ブロックの係数の量子化値の重み付け合計を用いて求められる。
よって、SATDdec_est符号化に固有のエラーを、SATDpredから推定できる関係は以下の通りである:
SATDdec_est=SATDpred−f(QP).EnergyTQ
ここで、
−SATDpredは、アプリオリに計算されたソースマクロブロックと予測マクロブロック間のSATDであり、予測エラーに対応し、上記のsatdの式においてMBrecをMBpredで置き換えたものである、
Figure 2009516970
は、DCT変換と量子化の後の係数の絶対値の合計である、
−f(QP)は量子化ステップQPの値に応じた重み付けパラメータである。
使用する量子化ステップは、例えばビットレート制御アルゴリズムを用いて従来の方法で計算される。
SATDdec_estの値が負であるとき、その値はゼロとする。
SATDpred項はピクセルドメインにおける残差ブロックのアダマール(Hadamard)変換後に得られる残差ブロック係数の合計に対応する。ここでアダマール変換を提案したのは、アダマール変換は一般的に動き予測の際に前もって計算され、利用可能だからである。また、DCT変換よりも計算が簡単だということもある。しかし、これ以外の選択肢がないということではなく、残差ブロックのDCT変換の使用も本発明に含まれる。
EnergyTQ項は、ピクセルドメインにおいて残差ブロックのDCT変換と量子化後に得られる量子化係数の合計に対応し、f(QP)項は量子化ステップの関数として値を決定する。
SATDdec_est値により、再構成(された)ブロックすなわち復号(された)ソースブロックを計算する必要なしに、符号化エラーまたは再構成エラー、すなわちソースブロックと再構成(された)ブロックとの間のエラーを推定できる。
例えば、残差ブロックの輝度値が低く量子化係数がヌル(null)になる場合、Energy値はゼロであり、符号化エラーまたは再構成エラーはアダマール変換による変換された残差ブロックに対応するSATDpredで推定される。この情報は符号化の際に事実上「失われた」残差に関係している。
例えば、予測をしない純粋なイントラモードの場合のように、予測されたブロックがヌルであるとき、SATDpredは、符号化エラーの推定のために量子化後に、変換されたソースブロックを表す値を引く、変換(された)ソースブロックに対応する。
ソースブロックと予測ブロック間の差異のアダマール変換に関係するこのSATDpredは、最大符号化エラーまたは予測エラーの推定と考えることができる。符号化器と復号器で使用される予測ブロックは同じである。この最大エラーは、量子化された残差ブロックがヌルであり、予測(された)ブロックに等しい再構成ソースブロックを復号器に与える場合、推定(された)エラーになる。
しかし、予測エラーは量子化され符号化された残差ブロックの送信により最小化され、その時は、デコーダの再構成(された)ブロックは、復号された残差ブロックを加える予測ブロックになる。この場合、デコーダにおける再構成エラーは上記の初期予測エラーより小さく、再構成エラー推定は、変換され量子化された残差ブロックである量子化された係数ブロックと量子化ステップとに基づく、残差ブロックの復号値の推定値の最小化された予測エラーの推定に対応する。
この曲線は量子化ステップの2次関数で近似できる:
f(QP)=δx(QP)2
もっと正確には、経験的に決定されるδの値は1/136.314である。もちろん、この値はエネルギーパラメータの重みの効率に大きな影響を与えずに10%前後の幅で粗く選択することができる。
一実施形態では、WQP、α、γパラメータは次の値である:
a=2
g=4
WQP=QP/5
これらの値は、量子化ステップQPの値がどうであっても、アルゴリズムの振る舞いがアポステリオリ決定アルゴリズムの振る舞いにできるだけ近くなるように、いろいろなシーケンスにおいて多数のシミュレーションを行って決めたものである。
ここで、比較として、完全にアプリオリな符号化決定と完全にアポステリオリな符号化決定に対するこのアルゴリズムの性能の位置付けとなるシミュレーションの結果を示す。以下の表では、アポステリオリアルゴリズムで求めたビットレートを参照する。
Figure 2009516970
第1のカラムは画像処理の分野で周知の典型的なシーケンスである。第2のカラムは、各シーケンスについて、アポステリオリ決定アルゴリズに関するビットレートのパーセンテージとして、本発明によるアルゴリズムを適用したときのビットレートの増加を示し、カラム3はアプリオリアルゴリズムに関するビットレートの増加を示す。ビットレートの増加のパーセンテージは、G.Bjontegaarg著「RD曲線間の平均PSNR差異の計算」で推奨された方法によるビットレート/歪み曲線を比較して計算した。
本発明はビデオ画像シーケンスの符号化装置にも関する。この装置は、既知のように、例えば、MPEG4−AVC標準により符号化に使用される処理回路、動き予測回路、DCT変換回路、量子化器を含む。処理回路は、特に、上記のような符号化モード決定アルゴリズムを実施する。関数f(QP)が記憶され、処理回路は符号化するマクロブロックに対応する量子化ステップ値のこの関数の計算を実行する。
具体的な実施形態では、この計算は、変化範囲にわたって分布する、量子化ステップの相異なる値の曲線上の点を記憶することにより置き換えられる。処理回路は、このメモリ中の、使用する量子化ステップに対応するアドレスにあるf(QP)値を検索する。このメモリは、経験的計算の時に求めた値を直接含んでいて、f(QP)曲線を用いなくてもよい。
設計により、歪みの推定、及び量子化ステップQPに対する符号化コストの推定、決定アルゴリズムを、かかる推定をできるすべてのタイプの符号化器で、特に、マクロブロックを含むサブパーティションの選択に対して実施することができる。MPEG4−AVC符号化標準を考え、16×8ピクセルのサイズの2つのサブパーティションよりなるマクロブロックに対応する16×8インター符号化モードに関して、上記のアルゴリズムを用いて、動き推定器により求めた相異なる参照画像から最もよい予測を各サブパーティションに対して決定する。これらは予測サブパーティションである。
同じ精神において、計算負荷を考慮しなければ、このタイプのアルゴリズムを動き推定の計算の場合に実施することができる。よって、予測するブロックを動きベクトルを介して予測するカレントブロックに正しいマッピングを可能とする基準、sad、satd、さらにsseのメジャーメントに基づいた基準は、この明細書に説明したアルゴリズムで置き換えることができる。動き推定から、この基準の実施は、Jmodeタイプの符号化の「コスト」に対するインパクトのアイデアを与える。よって、動き推定の計算と動きベクトルの選択のときに、このコスト情報を考慮することができる。
この基準の実施に関して、相異なる変形が以下のパラメータについて可能である:
SATDdec_est=SATDpred−f(QP).EnergyTQ
Figure 2009516970
よって、例えば:
−パラメータは、符号化するマクロブロックのルミナンス(luminance)ピクセルとクロミナンス(chrominance)ピクセルで共に計算する、
−パラメータはルミナンス信号のみで計算する、
他の変形では、
−第1項SATDdec_estはルミナンス信号のみで計算する、
−第2項(a.Headercost+g.EnergyTQ)はルミナンスとクロミナンスで計算する。
よって、この変化形では、クロミナンスを損なってでもルミナンスの品質を優先する。クロミナンスは第2項のみで考慮されているからである。第2項はアポステリオリ(MBcost)決定基準の符号化コストである。モードはルミナンスに関してEnergyTQ_luminanceの値が同じであるJmodeの最小値により選択される。これは差が生じるのはクロミナンスに関するEnergyTQ_chrominanceの値である。
最後に、留意して欲しいこととして、次の式:
Jmode=SATDdec_est+WQP(a.Headercost+g.EnergyTQ)
において、WQPの項はありそうなリカバリとありそうな符号化コストの品質間の重み付けの役割を果たす。実際、リカバリ品質を優先する必要がある場合、WQP termを小さくし、一方、それとは反対に、リカバリ品質を損なっても符号化コストが最も小さいものを探す時には、WQPを大きくする。
0と51の間の量子化ステップについて、経験的に決定した関数f(QP)に対応する曲線の一例を示す図である。

Claims (8)

  1. 画像シーケンスのビデオ画像の符号化方法であって、
    前記画像をブロックに分割し、
    前と後の画像からの情報を利用するインターピクチャタイプの予測符号化モードと、現在の画像からの情報を利用するイントラピクチャタイプの予測符号化モードのうち少なくとも一方の符号化モードによりソースブロックを符号化し、
    ソースブロックの予測符号化モードは余弦変換を実行し、
    前記ソースブロックと前記情報から計算した予測ブロックとの間の差異である残差ブロックを量子化し、量子化係数を求め、
    前記ソースコードについて、前記符号化モードの選択は、符号化エラーの推定とテストされた相異なる符号化モードの前記ソースブロックの符号化コストの推定により行われ、
    符号化モードについて、符号化エラーを、この符号化モードに関する、及びこの符号化モードに対応する前記量子化係数の絶対値の和に関する、前記残差ブロックの周波数ドメインにおける数学的変換後に得られる係数の絶対値の和により行うことを特徴とする方法。
  2. 前記符号化エラー推定は次式であ耐えられることを特徴とする、請求項1に記載の方法:
    SATDdec_est=SATDpred−f(QP)x.EnergyTQ、ここで、
    −SATDpredはアダマール変換後に得られる残差ブロックの係数の絶対値の和であり、
    −QPは量子化ステップであり、
    −f(QP)は前記量子化ステップの所定の関数であり、
    −Energyは前記量子化係数の和である。
  3. 関数f(QP)=δ×(QP)2であり、δは所定の定数であることを特徴とする、請求項2に記載の方法。
  4. 符号化モードの選択は次式のパラメータJmodeの関数であることを特徴とする、請求項2に記載の方法:
    Jmode=SATDdec_est+WQP(a.Headercost+g.EnergyTQ)、ここで
    −WQPは量子化ステップQPに応じた値であり、
    −Headerはデータストリーム中のマクロブロックの符号化のための符号化ヘッダのビット単位のコストであり、
    −aとγは所定値のパラメータである、
  5. パラメータWQPは量子化ステップQPに比例することを特徴とする、請求項4に記載の方法。
  6. δ=1/136から10%以内にあり、α=2、γ=4、WQP=QP/5であることを特徴とする、請求項5に記載の方法。
  7. 動き推定はアダマール変換から相関計算を行い、前記前の画像から前記情報を得る、請求項2に記載の方法。
  8. 請求項1に記載の方法を実施する符号化装置であって、
    前記相異なる符号化モードの前記符号化エラー推定を計算する処理回路とメモリ回路とを有し、
    前記処理回路は次式により符号化エラーの推定を行い:
    SATDdec_est=SATDpred−f(QP)x.EnergyTQ、ここで、
    −SATDpredはアダマール変換後に得られる残差ブロックの係数の絶対値の和であり、
    −QPは量子化ステップであり、
    −f(QP)は前記量子化ステップの所定の関数であり、
    −Energyは前記量子化係数の和であり、
    前記メモリ回路は変化の範囲にわたって分布する量子化ステップQPの相異なる値の関数f(QP)の所定値を含む。
JP2008541677A 2005-11-22 2006-10-24 ビデオ画像符号化方法及び装置 Active JP5100658B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0553553A FR2893808A1 (fr) 2005-11-22 2005-11-22 Procede et dispositif de codage d'une image video
FR0553553 2005-11-22
PCT/EP2006/067698 WO2007060071A1 (fr) 2005-11-22 2006-10-24 Procede et dispositif de codage d'une image video

Publications (2)

Publication Number Publication Date
JP2009516970A true JP2009516970A (ja) 2009-04-23
JP5100658B2 JP5100658B2 (ja) 2012-12-19

Family

ID=36829682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008541677A Active JP5100658B2 (ja) 2005-11-22 2006-10-24 ビデオ画像符号化方法及び装置

Country Status (7)

Country Link
US (1) US8705618B2 (ja)
EP (1) EP1952637B1 (ja)
JP (1) JP5100658B2 (ja)
CN (1) CN101313581B (ja)
DE (1) DE602006011645D1 (ja)
FR (1) FR2893808A1 (ja)
WO (1) WO2007060071A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2948845A1 (fr) * 2009-07-30 2011-02-04 Thomson Licensing Procede de decodage d'un flux representatif d'une sequence d'images et procede de codage d'une sequence d'images
US9781447B1 (en) 2012-06-21 2017-10-03 Google Inc. Correlation based inter-plane prediction encoding and decoding
US9167268B1 (en) 2012-08-09 2015-10-20 Google Inc. Second-order orthogonal spatial intra prediction
US9344742B2 (en) * 2012-08-10 2016-05-17 Google Inc. Transform-domain intra prediction
CN104954787B (zh) * 2014-03-27 2018-03-23 浙江大华技术股份有限公司 Hevc帧间预测模式选择方法及装置
JP6558375B2 (ja) * 2014-10-24 2019-08-14 日本電気株式会社 説明変数表示優先順位決定システム、方法およびプログラム
KR102365685B1 (ko) * 2015-01-05 2022-02-21 삼성전자주식회사 인코더의 작동 방법과 상기 인코더를 포함하는 장치들
CN112752106B (zh) * 2019-10-29 2022-02-18 北京新唐思创教育科技有限公司 视频图像帧的编码控制方法、装置及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11112992A (ja) * 1997-10-02 1999-04-23 Kdd 動き補償画像符号化装置
JP2005086249A (ja) * 2003-09-04 2005-03-31 Toshiba Corp 動画像符号化方法および動画像符号化装置
JP2005244666A (ja) * 2004-02-26 2005-09-08 Sony Corp データ処理装置、符号化装置およびデータ処理方法
JP2005244503A (ja) * 2004-02-25 2005-09-08 Sony Corp 画像情報符号化装置および画像情報符号化方法
JP2006140758A (ja) * 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2782879B1 (fr) * 1998-08-28 2000-11-03 Thomson Multimedia Sa Procede de compression d'images
JP4050754B2 (ja) * 2005-03-23 2008-02-20 株式会社東芝 ビデオエンコーダ及び動画像信号の符号化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11112992A (ja) * 1997-10-02 1999-04-23 Kdd 動き補償画像符号化装置
JP2005086249A (ja) * 2003-09-04 2005-03-31 Toshiba Corp 動画像符号化方法および動画像符号化装置
JP2005244503A (ja) * 2004-02-25 2005-09-08 Sony Corp 画像情報符号化装置および画像情報符号化方法
JP2005244666A (ja) * 2004-02-26 2005-09-08 Sony Corp データ処理装置、符号化装置およびデータ処理方法
JP2006140758A (ja) * 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム

Also Published As

Publication number Publication date
CN101313581B (zh) 2010-12-15
JP5100658B2 (ja) 2012-12-19
CN101313581A (zh) 2008-11-26
EP1952637A1 (fr) 2008-08-06
DE602006011645D1 (de) 2010-02-25
WO2007060071A1 (fr) 2007-05-31
US20090041119A1 (en) 2009-02-12
EP1952637B1 (fr) 2010-01-06
US8705618B2 (en) 2014-04-22
FR2893808A1 (fr) 2007-05-25

Similar Documents

Publication Publication Date Title
KR102266576B1 (ko) 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
JP5100658B2 (ja) ビデオ画像符号化方法及び装置
KR101351730B1 (ko) 디코딩된 비디오 블록에서 예상 왜곡을 결정하기 위한 방법및 장치
US11240496B2 (en) Low complexity mixed domain collaborative in-loop filter for lossy video coding
JP5224459B2 (ja) 動き補償予測のための適応重み選択を行う方法および装置
CN1846446B (zh) 编码视频图像的方法和布置
US8121190B2 (en) Method for video coding a sequence of digitized images
JP4650173B2 (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
CN1949877B (zh) 自适应量化控制器及其方法
JP5474838B2 (ja) 改善された効率及び主観的な品質をサポートする予測フレームの選択方法及び装置
CN104320657B (zh) Hevc无损视频编码的预测模式选择方法及相应的编码方法
US8094716B1 (en) Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding
JP2006333444A (ja) ブロックベースのビデオエンコーダにおけるエンコーダ出力ビットレートを制御する方法、及び相応するビデオエンコーダ装置
JP2010508684A (ja) イントラ符号化選択によるビデオ符号化
TWI394462B (zh) 基於視覺感知的位元-失真最佳化位元分配的位元率控制方法
JP2006157881A (ja) 可変長符号化装置及びその方法
JP2006511113A (ja) 選択されたマクロブロックにおける動き推定のスキップを伴うビデオエンコーディング
CN108989818B (zh) 一种图像编码参数调整方法及装置
US20120207212A1 (en) Visually masked metric for pixel block similarity
JP2008125058A (ja) 画像データスキップを使用するビデオコード化方法
JP5670226B2 (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
Ropert et al. RD spatio-temporal adaptive quantization based on temporal distortion backpropagation in HEVC
JP4570098B2 (ja) ビデオデータストリームを符号化するための装置
US20060008004A1 (en) Video encoder
JP2009284058A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101015

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120925

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5100658

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250