JP2007174649A - 符号化モードと関連付けられた歪みレベルを推定する方法、符号化モードのレート歪みコストを計算するためのシステム、および符号化モードの推定空間ドメイン残余を変換ドメインで推定するためのモジュール - Google Patents

符号化モードと関連付けられた歪みレベルを推定する方法、符号化モードのレート歪みコストを計算するためのシステム、および符号化モードの推定空間ドメイン残余を変換ドメインで推定するためのモジュール Download PDF

Info

Publication number
JP2007174649A
JP2007174649A JP2006338041A JP2006338041A JP2007174649A JP 2007174649 A JP2007174649 A JP 2007174649A JP 2006338041 A JP2006338041 A JP 2006338041A JP 2006338041 A JP2006338041 A JP 2006338041A JP 2007174649 A JP2007174649 A JP 2007174649A
Authority
JP
Japan
Prior art keywords
mode
residual
distortion
encoding mode
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006338041A
Other languages
English (en)
Inventor
Vasudev Bhaskaran
バスカラン ヴァスデヴ
William Chen
チェン ウィリアム
Changick Kim
キム チャンギック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Publication of JP2007174649A publication Critical patent/JP2007174649A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】変換ドメインベースの歪みコスト推定。
【解決手段】マクロブロックを符号化するためのモードと関連付けられたレート歪みコストを計算するために使用できる変換ベースの歪みコスト推定を説明する。発明の一つの実施例において、ある特定のモードの歪み値を変換ドメイン内で推定し、そうすることによってこの計算から逆変換および逆動き関数をともになくすことができる。マクロブロックの動き補償後の予測残余とそれに対応する再構築後の信号との間の差を識別することによって変換ドメイン内で符号化モードの空間ドメイン残余を推定する。推定空間ドメイン残余を次に歪み行列計算に用いて符号化モードの歪みレベルを変換ドメイン内で推定することができる。
【選択図】図2

Description

A.技術分野
本発明は、一般的には通信リンクで送信するためのデータの符号化に関し、より具体的にはビデオ符号化モードのための変換ドメイン内での歪みコスト推定に関する。
B.発明の背景
ボイスやビデオなど、ネットワークにかかる高バンド幅アプリケーションの負担は増え続けている。こうしたバンド幅集約型アプリケーションを使い易くために、こうしたアプリケーションをもっと効果的にネットワークでクライアントに通信できるように圧縮テクノロジーおよび規格が進展している。ビデオ信号の符号化や復号化に関するそうした一つの規格が、MPEG-4/AVC(Advanced Video Coding Standard)と呼ばれるMPEG-4の最新のコーディング規格で、これは一般に H.264 という国際電気通信連合(International Telecommunication Union)の規格名で呼ばれている。コーディング効率を高めるために、MPEG-4/AVCはビデオマクロブロックを符号化するための可変ブロックサイズ動き補償予測のツールを提供する。
この規格はデータを符号化する方法を概して向上させるけれども、エンコーダ自体の処理リソースにかかるデマンドも増やす。ビデオデータの送受信にはタイムセンシティブな性質があるために、エンコーダはビデオフレームのしかるべき符号化方法を選び、そのビデオフレームを符号化してネットワークで送信する時間が限られる。エンコーダがビデオ信号を符号化して送信するのに必要となることのある符号化の計算を全て所要時間内に完了できないと、ビデオ信号の品質が危うくなることがある。
図1は、符号化されたビデオ信号を通信できる典型的な通信リンク120を示す図である。図に示すように、ビデオカメラ110がビデオ信号を生成し、それはエンコーダ115に送られる。このエンコーダ115は通信リンク120に接続されたコンピュータまたはサーバ上にあるソフトウェアで構わない。エンコーダ115はビデオフレームを受け取り、ビデオフレームは符号化のために普通マクロブロックに分割される。こうしたマクロブロックにおけるコンテントいかんによっては、符号化プロセスの精度を高めるためにさらに小さなブロックに分割されることがある。
こうしたマクロブロックの各々、および一つのマクロブロック内のサブブロックは、同じビデオフレーム内にあるもう一つのブロックに対して、あるいはビデオ信号内の前のまたはこれから先の基準フレームにおける一つのブロックに対して、符号化されることがある。この符号化は、通信リンク120で送信されるデータ冗長性の量を低減させることにある。
マクロブロックを符号化できるモードには、普通、インターモードおよびイントラモードという2つのタイプのモードがある。イントラモードとは、同じビデオフレーム内のブロックに対して符号化が発生することである。インターモードとは、現行のビデオフレーム以外の一つ以上の基準フレームに対して符号化が発生することである。マクロブロックは符号化された後、通信リンク120を介して受信側デコーダ125に送信される。デコーダ125は、対応するフレームコンテキストで表示デバイス130上に表示できるようにビデオ信号内のマクロブロックを再構築する。
米国特許出願公開第2004/0196903号明細書
上述のごとく、インターモードまたはイントラモードいずれかの符号化を行うときは、マクロブロック(例えば、あるビデオフレーム内の16x16の一ブロック)は自分自身のフレームまたは別の基準フレームのいずれかに入っている一マクロブロックに対して符号化される。エンコーダは、普通、複数の使用可能なモードから、その特定のマクロブロックを符号化するためのモードを一つ選択しなければならない。
モードの選択では、往々にして、使用可能な各モードのレートおよび歪みの特性を識別しなければならない。一般的に、レート歪みコストは、しかるべきモードを選択できるように、使用可能なモード毎に計算される。レート歪みコストの計算は、普通は、ビデオマクロブロックに対して変換および量子化の計算を行い、次に、ある特定の符号化モードの誤差または歪みレベルを識別できるように逆変換および逆量子化を行うことによって達成される。可変長符号化スキームの場合には、こうしたレートおよび歪みの解析は多数の計算を必要とし、そのことがエンコーダの処理リソースに負担となり、エンコーダの性能に負の影響を与えることがある。
マクロブロックを符号化するためのモードと関連付けられるレート歪みコストを計算するために使用できる変換ベースの歪みコスト推定を説明する。発明の一つの実施例においては、ある特定のモードの歪み値が変換ドメイン内で計算され、こうすることによってこの計算における逆変換および逆動き関数をともになくすことができる。したがって、歪み推定の計算数を有意に減少させる。符号化モードのレート歪みコストを識別するために、レート計算とともに、この歪み推定を用いる。
発明の一つの実施例において、動き補償後の予測残差(residual)とマクロブロックを符号化するためのモードと関連付けられたその再構築信号との間の差を変換ドメイン内で識別することによって空間ドメイン残差を推定する。この推定空間ドメイン残差値は逆変換計算を行わずに変換ドメインで判定される。
符号化モードのレート歪みコストを計算するのにさらに推定空間ドメイン残差を用いることができる。とりわけ、符号化モードの歪みレベルを変換ドメイン内で推定する歪み行列計算に推定空間ドメイン残差を用いる。歪み推定は次に、ある特定の符号化モードと関連付けられたレート歪みコストを識別するためにレート値を用いて処理されることがある。
以下、本発明の実施形態を図面に基づいて説明する。
符号化モードの歪みを変換ドメイン内で推定するためのシステム、装置および方法。発明の一つの実施例において、ある特定のモードの歪み値を変換ドメイン内で推定し、こうすることでこの計算における逆変換および逆動き関数をともになくすことができる。とりわけ、マクロブロックの動き補償後の予測残差とそれに対応する再構築された信号との間の差を変換ドメイン内において識別することによって符号化モードの空間ドメイン残差を推定する。推定した空間ドメイン残差を次に歪み行列計算に用いてある符号化モードの歪みレベルを変換ドメイン内で推定することができる。次に、ある特定の符号化モードと関連付けられるレート歪みを識別するためにレート値を用いて歪み推定を処理することができる。
説明のために、下記の明細書においては、発明を理解できるように具体的な詳細を述べている。しかし、当業者ならば、こうした詳細を知らなくても発明を実施できることは明白であろう。当業者ならば、以下に一部を説明している本発明の実施例は、パーソナルコンピュータおよびネットワークサーバなど多数の異なったデバイスの中に組み入れることができることを認識するだろう。本発明の実施例はソフトウェア、ハードウェア、またはファームウェアとしても実施できる。以下にブロック図に表示した構造およびデバイスは発明の模式的な実施例を示すもので、発明を曖昧にしないようにするためのものである。さらに、図の中のコンポーネントおよび/またはモジュール間の接続は直接接続に限定されるものではない。むしろ、こうしたコンポーネントおよびモジュール間のデータは中間コンポーネントおよびモジュールによって修正、リフォーマット、あるいはその他のやり方で変更が可能である。
明細書で「一つの実施例」または「実施例」と称しているのは、その実施例に関して説明したある特定の特徴、構造、特性、または機能が発明の少なくとも一つの実施例の中に含まれていることを意味する。明細書のいろいろな個所に「一つの実施例において」という表現が出てくるが、これは必ずしも全て同じ実施例を指しているとは限らない。
C.概要
本発明は、ある特定のマクロブロックの符号化モードと関連付けられた変換ドメインベースの歪みコスト推定を提供する。とりわけ、本発明は、ある特定のマクロブロックを符号化するためにしかるべきモードを選択できるように、使用可能な符号化モードの各々に対してRDコスト値を判定する際に行われる計算の数を減らすことができる。
インターモードを選択するかまたはイントラモードを選択するかは、モードのレート歪み(“RD”)効率いかんによって有意に変わることがある。選択したモードいかんによって、マクロブロックを様々なサブブロックに分割することができる。普通、符号化プロセスの複雑さおよび所要計算数はマクロブロックを分割したサブブロック数に比例して増える。従って、マクロブロックをサブブロックに分割した分割数が増えると、マクロブロックを符号化するモードの複雑さが増し、より多量の歪みを有効に補償することが一層可能になる。
しかるべきモードを選択する際に使用できる一つの計算は、モード毎に計算されるRDコストである。RDコスト値(J)は次のように定義される。
J(s, c, m | QP, λm) = D (s, c, m | QP) + λm * R(s, c, m | QP)
ここで、QPはマクロブロック量子化パラメータ、 λmはモード決定のためのラグランジュの乗数(Lagrange multiplier)、Dはオリジナルブロックと再構築ブロックとの間の二乗差(squared differences)の和で、Rはモードを符号化するためのビット数を表す。
レート歪み計算の複雑さおよび計算を行う回数は、マクロブロックの予測モードを識別するのに必要な時間およびリソースに直接影響を与える。エンコーダによっては、またエンコーダが動作するシステムによっては、こうした計算がエンコーダをオーバーロードし、その結果として符号化システム性能の劣化が生じる。
D.エンコーダ
図2は、複数の使用可能な符号化モードを用いてビデオフレームマクロブロックを符号化するエンコーダ200を示す。ビデオ信号205内のフレームは直接コサイン変換(direct cosine transformation)(‘DCT’)を用いて変換モジュール210により空間周波数係数の集合に変換される。このDCTは時間ドメイン信号から周波数ドメイン信号への変換に類似している。周波数係数は次に、周波数係数に対してスカラーを適用する量子化モジュール215によって量子化される。実際には、量子化プロセスは打ち切り信号(truncated signal)を結果として生じる整数のスケーリング因子で周波数係数を分割する。ビデオフレームを変換および量子化するこのプロセスはビデオ信号にデータ損失といったエラーをもたらす。
エンコーダ200は、フレームの中の各マクロブロックを符号化する単数または複数のモードを識別するモードセレクタ250を含んでいる。このモードセレクタ250は、逆量子化および逆変換(reverse quantization and transformation)モジュール235、イントラ予測モジュール220、動き補償モジュール225、デブロッキング・フィルタ240を含んでいる。モードセレクタ250は動き推定モジュール230および複数の動き基準フレームを格納しているメモリデバイスとインタフェースをとるまたは含むことができる。
逆量子化および逆変換モジュール235は、符号化処理でビデオ信号に生じた歪み量を識別できるように、前に変換および量子化されたマクロブロックを再構築する。再構築はビデオ信号を逆量子化することによって起き、その結果、リスケーリングされた信号が生じる。このリスケーリングされた信号は次に、逆離散コサイン変換によって逆に変換され、再構築されたフレームを生じる。この再構築されたフレームをオリジナルのビデオフレーム205と比較して、符号化プロセスによって生じた歪みまたはエラーを識別することができる。ビデオ信号205内の各マクロブロックを複数の異なったインター予測モードまたはイントラ予測モードのうちの一つで符号化することができる。予測モードは各々が関連付けられた歪みおよびレート値を有する。
イントラフレーム予測モジュール220は、あるマクロブロックに対して可能な(potential)予測イントラモードを識別する。上に述べたように、イントラモード符号化はあるイントラフレームにおけるある特定のフレームを予測するのに同じビデオフレーム内の他のブロックを用いる。
動き推定モジュール230は、基準ブロックを識別するとともに、基準ブロックとインターモードでこれから符号化するブロックとの間の空間変位を表す動きベクトルを識別する。基準ブロックは単一のビデオ基準フレーム内にあることもあるし、あるいは単数または複数の基準フレーム内の複数のブロックから生成されることもある。動きベクトルは、これからインター符号化するブロックの位置に関する2次元グリッド内での基準ブロックの移動を表す。
動き補償モジュール225は、インター符号化プロセスで使用できる前のフレームの中にある前に復号化された他のブロックからマクロブロックを予測する。この予測は、これからインター符号化する特定のブロックに関して基準ブロックおよび動きベクトルと関連付けられたエラーレベルまたは歪みレベルを識別することによって行われる。このエラーは特定のブロックを基準ブロックおよび動きベクトルデータから再構築できるように符号化され、受信側クライアントに供給される。上述のごとく、各インターモードは特定のブロックに対して関連付けられた歪みまたはエラー値を有する。このエラー値は各モードのレート歪み性能における有意なコンポーネントであり、特定のモードに対するインター符号化モードをただ一つ選択する際に重要な考慮事項となることがある。
デブロッキング・フィルタ240は動き補償ループ内にあり、画像の品質向上のためにマクロブロックまたはサブブロックのエッジに沿った水平および垂直方向のアーティファクトを減らす。
符号化モードを選択したら(インターモードかイントラモードかいずれか)、それに対応してマクロブロックが符号化されて通信リンクに送られる。この符号化されたデータを使ってマクロブロックを再構築して表示する。
E.予測モード選択
図3は、H.264 規格で定義された符号化モードの許容可能なマクロブロック分割の集合を示す。イントラ予測315かインター予測320かどちらかを用いてマクロブロック310を符号化することができる。イントラ予測315では、同じフレーム内の近傍のブロッックから前に復号化された画素を用いる4つのモードのうちの一つで16x16の各ブロック毎のルーマコンポーネント330を予測することができる。また、16x16のブロックを4x4のサブブロックに分割して、同じフレーム内の近傍のブロックから前に復号化された画素を用いる9つのモードのうちの一つでこうしたサブブロックを符号化することによってルーマコンポーネント330を予測することもできる。マクロブロック310のクロマコンポーネント340は8x8のサブブロックに分割されて4つの使用可能なモードのうちの一つで符号化される。
インター予測320では、マクロブロック310を様々なサイズのサブブロックに分割することができ、マクロブロック310またはその中にある分割されたサブブロックに対して動き補償後の予測が実行される。マクロブロックを分割して9つのインターモード350のうちの一つで符号化することができる。
a)予測イントラモード( H.264 規格)
図4Aは、 H.264 規格に基づく4x4のルーマビデオブロックのための3つの模式的な予測モード図である。この規格は、4x4のルーマブロックを符号化できるモード0からモード8までの合わせて9つの異なった予測モードを定義している。モード0(405)は、画素データがブロック内で上部サンプルから補外される垂直モードである。モード1(410)は、画素データがブロック内で左サンプルから補外される水平モードである。モード8(415)は、画素データがブロック内で左下サンプルから補外される横上(horizontal-up)モードである。モード2から7は表示されていないが、4x4のルーマブロックモード全てについて詳細な説明が H.264 規格にある。
図4Bは、 H.264 規格に基づく16x16のルーマビデオブロックまたは8x8のクロマビデオブロックのための3つの模式的なモード図である。この規格は、16x16のルーマブロックまたは8x8のクロマブロックどちらかを符号化できるモード0からモード3までの合わせて4つの異なった予測モードを定義している。モード0(430)は、画素データがブロック内で上部サンプルから補外される垂直モードである。モード1(435)は、画素データがブロック内で左サンプルから補外される水平モードである。モード3(440)は、一次平面関数(linear plane function)がブロック内で上と左側のサンプルにフィットする「平面」モードである。モード2は表示されていないが、16x16のルーマブロックおよび8x8のクロマブロックモード全てについて詳細な説明が H.264 規格にある。
b)予測インターモード( H.264 規格)
図5は、本発明の一つの実施例に従って使用することのできる模式的な予測インターモードを示す。これらのモードは H.264 仕様によって定義され、16x16のマクロブロックをサブブロックに分割できる7つの異なったインターモードを含んでいる。16x16のモード510はマクロブロックを分割せずに、マクロブロック全体が単一ブロックとして符号化される。16x8のモード520は、マクロブロックを2つの16x8のブロックに水平方向に分割し、各ブロックは個々に符号化される。8x16のモード530はマクロブロックを2つの8x16のブロックに垂直方向に分割し、各ブロックは個々に符号化される。8x8のモード540はマクロブロックを4つの8x8のブロックに分割し、各ブロックは個々に符号化される。8x4のモード550はマクロブロックを8つの8x4のブロックに分割し、各ブロックは個々に分割される。4x8のモード560は8つの4x8のブロックに分割し、各ブロックは個々に符号化される。4x4のブロック570はマクロブロックを16個の4x4のブロックに分割し、各ブロックは個々に符号化される。
概して、マクロブロックが分割および符号化されるブロック数に比例して複雑さおよび符号化の正確さのレベルが上がる。従って、マクロブロックが有意な量の歪み(つまり、基準ブロックに対したエラー)を含んでいると、4x4モード570など、分割ブロック数の多いモードを用いてマクロブロック内の歪みをより正確に伝えることができる。しかし、4x4モードで符号化するのに必要なプロセッサリソースおよびバンド幅の必要量は上に説明した他のモードに比べて比較的に大きくなる。従って、マクロブロック内にほとんど歪みがない場合には、他のマクロブロックを符号化するためのリソースを保存するために、16x16モード510などもっと負担の軽いモードを用いることができる。
F.レート歪み最適化
図6は、 H.264 規格で定義されたインター予測モードのためのレート歪み最適化フレームワークのブロック図である。あるビデオフレームにおける現行のマクロブロック(c)605と別のビデオフレームからの画素情報(p)607とが動き推定器610に供給される。動き推定器はマクロブロック605と画素情報607に関して実行された動き推定演算に基づいてマクロブロック605の動きベクトル(mv)を識別する。
動きベクトルおよび画素情報607は予測器615に供給され、予測器615はマクロブロック605の動き補償後の予測値(Pmv)を生成する。マクロブロックおよび動き補償後の予測値(Pmv)は比較され、空間ドメインにおける動き補償後の予測残差(e)が識別される。残差(e)は変換され625、その結果として変換ドメインにおける残差(E)が生じる。残差(E)は量子化され630、その結果として生じる変換および量子化後の残差がレート計算モジュール640に供給される。
変換および量子化後の残差は次に逆量子化および逆変換され、それにより動き補償後の予測残差に対応する空間ドメイン再構築信号(eQ)が生まれる。空間ドメイン再構築信号(eQ)は動き補償後の予測値(Pmv)との和がとられ、オリジナルマクロブロック(C)605の逆動き補償後の再構築版(cQ)が生じる。マクロブロックとオリジナルマクロブロック(c)650との逆動き補償後の再構築版(cQ)は歪み計算モジュール660に供給され、歪み計算モジュール660は解析中の特定のモードと関連付けられた歪みレベルを計算する。レート計算モジュール640は、モードのRDコストを計算できるようにその特定のモードと関連付けられたレートを計算する。解析された各モードには異なったレートおよび歪みのトレードオフがある。
イントラ予測モードを解析しようとする場合には、動き推定のタスクと逆動き補償の計算を除き、同じようなプロシジャが実行される。
a)変換ドメインベースの歪みコスト推定
図7は、本発明の一つの実施例による変換ドメインRDコストフレームワークを示す。動き推定器710および予測器715は図6に関して上に説明したと同じように動作し、空間ドメインにおける動き補償後の予測残差(e)を識別する。残差(e)は変換されたて720、その結果変換ドメインにおける残差(E)になり、量子化される725。結果として生じた変換および量子化された残差はレート計算モジュール740に供給される。
変換された残差(E)は逆量子化730されてその結果として再構築後の変換ドメイン残差(EQ)になり、推定空間ドメイン残差計算モジュール760に供給される。変換後の残差(E)も推定空間ドメイン残差計算モジュール760に供給される。推定空間ドメイン残差計算モジュール760は、変換ドメイン内で推定空間ドメイン残差を生成するために、変換残差(E)および再構築後の変換ドメイン残差(EQ)を処理する。推定空間ドメイン残差は動き補償後の予測残差とオリジナルマクロブロック(c)705を符号化するためのモードと関連付けられた空間ドメイン再構築後の信号との差である。
発明の一つの実施例によれば、推定空間ドメイン残差計算モジュール760は変換ドメイン内で計算された推定空間ドメイン残差を生成してそれを歪み計算モジュール770に供給する。変換ドメイン内で生成されたこの推定空間ドメイン残差を用いてマクロブロック705の符号化モードと関連付けられた歪みを計算することができる。このように、歪み計算およびRDコスト計算プロシジャ時に逆変換計算と逆動き計算が省かれる。
RDコスト計算プロセスは歪み計算を次のように表示する、
次のように書き換えることができる、
ここで、行列は4x4行列と定義される。
次のように記述することもできる
図6に関して表示したように、マクロブロック c はその動き補償後の予測値(Pmv)と動き補償後の予測残差(e)とを足したものである。また、マクロブロックの逆動き補償後の再構築版(cQ)は、動き補償後の予測値(Pmv)と補償後の予測残差に対応する空間ドメイン再構築信号(eQ)とを足したものである。したがって、歪みは次のように書くことができる、
この歪み方程式が示すように、図6の逆動き補償計算に関するRDコスト計算を省くことができる。逆変換計算を使わずに歪みを計算すれば、モードRDコスト計算における計算を有意に減らすことができる。さらに、マクロブロックの時間ドメイン動き補償後の再構築版の計算時に動き補償後の予測値(Pmv)をフェッチしなくていい。
(i)変換ドメイン内に基づいた空間ドメイン残差推定
推定空間ドメイン残差計算モジュール760は、マクロブロック705を符号化するためのモードと関連付けられた空間ドメイン残差を空間ドメイン内で推定する。
変換残差 E は e の変換出力だから、E = T e T-1、ここで T は H.264 符号化規格に用いられている4x4の直接コサイン変換(“DCT”)の4x4の整数変換近似値で、以下のように表示される。
上の方程式から、次式が示される、
そしてこの空間ドメイン残差は次のように表すことができる。
これは次のように書き換えることができる、
まだ変換ドメインにある空間ドメイン残差は歪み計算モジュール770に供給される。
(ii)変換ドメイン歪み計算
一つの実施例によれば、歪み計算モジュール770は、マクロブロック705を符号化するためのモードと関連付けられた歪みレベルを変換ドメイン内で識別する。この歪みレベルを識別するために、変換ドメインで計算された推定空間ドメイン残差が供給され使用される。
歪みは次のように書くことができる、
ここで AM2は次のように定義される、
そして、これにおいて aij は行列 A のij番目の要素である。行列とその転置(transpose)との積のトレースは行列の要素の平方和であるという性質を用いて、歪み方程式は次のように表すことができる、
したがって、 A の要素は変換ドメイン行列 E および EQ.から計算されているから、 RDコスト関数の歪み D を直接に変換ドメインで計算することができる。
変換ベースのRDコスト計算フレームワークの中から逆変換および逆動き補償の計算がなくなるから、RDコスト計算の総体的な複雑さが軽減される。変換ベースの歪み計算は空間ドメインフレームワークで計算した歪みとはかすかに異なることがあるが、この誤差は普通は無視できるし、逆変換および逆動き補償のステップを除外したことから生じる算術上の精度の誤差(arithmetic precision error)の結果である。
発明を特定の模式的実施例に関して説明してきたが、当業者ならば様々な修正が可能なことを認識するだろう。したがって、発明の範囲は下記の特許請求の範囲によってのみ限定されるものである。
符号化されたデータを通信できる通信リンク。 本発明の一つの実施例によるエンコーダの概略ブロック図。 本発明の一つの実施例によるインターモードおよびイントラモード符号化に使用可能なモードの図。 本発明の一つの実施例によるイントラモードに使用可能なモードのより詳細な図。 本発明の一つの実施例によるインターモードに使用可能なモードのより詳細な図。 本発明の一つの実施例による或る特定のインターモードまたはイントラモードのための H.264 レート歪み計算フレームワークのブロック図。 本発明の一つの実施例による或る特定のインターモードまたはイントラモードのための変換ベースのレート歪み計算のブロック図。
符号の説明
110 ビデオカメラ
115 エンコーダ
120 通信リンク
125 デコーダ
130 ディスプレイ
205 ビデオ信号
210 変換
215 量子化
220 イントラ(空間)予測
225 動き補償
230 動き推定
235 逆量子化および逆変換
240 デブロッキング・フィルタ
280 デコーダ
310 マクロブロック
315 イントラ予測
320 インター予測
330 ルーマ(イントラ)
340 クロマ(イントラ)
350 インター
405 モード0(垂直方向)
410 モード1(水平方向)
415 モード8(横上方向)
430 モード0(垂直方向)
435 モード1(水平方向)
440 モード3(平面)
610 動き推定器
615 予測器
640 レート計算モジュール
660 歪み計算モジュール
710 動き推定器
715 予測器
740 レート予測器
760 推定空間ドメイン残余計算モジュール
770 歪み計算モジュール

Claims (20)

  1. 符号化モードと関連付けられた歪みレベルを推定する方法であって、この方法は、
    符号化モードと関連付けられた動き補償後の予測残余を変換し、
    変換された動き補償後の予測残余を量子化し、
    量子化および変換された動き補償後の予測残余を逆量子化してその結果として再構築後の変換ドメイン残余を生じ、
    変換された動き補償後の予測残余および再構築された変換ドメイン残余の変換ドメインベースの解析を介して空間ドメイン残余を推定し、
    推定した空間ドメイン残余から歪みレベルを計算するステップを含む。
  2. 符号化モードは H.264 規格に準じて定義される、請求項1に記載の方法。
  3. 符号化モードはイントラモードである、請求項2に記載の方法。
  4. 計算された歪みレベルを用いて符号化モードのレート歪み値を計算するステップをさらに含む、請求項1に記載の方法。
  5. 歪みレベルはトレース((e - eQ)(e - eQ)T)と定義され、これにおいて e は動き補償後の予測残余を表し、 eQ は推定空間ドメイン残余を表す、請求項1に記載の方法。
  6. 請求項1の方法を実行するための命令を有するコンピュータ可読媒体。
  7. 符号化モードのレート歪みコストを計算するためのシステムであって、このシステムは、
    マクロブロックおよび基準画素を受け取るようにつながれた、符号化モードの動きベクトルを生成する動き推定器と、
    基準画素および動きベクトルを受け取るようにつながれた、符号化モードの動き補償後の予測を生成するための予測器と、
    変換された動き補償後の予測残余および再構築された変換ドメイン残余を受け取るようにつながれた推定空間ドメイン残余計算モジュールを含み、変換された動き補償後の予測残余および再構築された変換ドメイン残余はともにマクロブロックおよび動き補償後の予測から導出され、これにおいてモジュールは変換ドメインにおける推定空間ドメイン残余を生成し、さらに
    推定空間ドメイン残余を受け取るようにつながれた、レート歪みコストを生成する元となる歪み値を生成する歪み計算モジュールを含む。
  8. 変換および量子化された動き補償後の残余を受け取るようにつながれた、符号化モードのレートを計算するレート推定器をさらに含む、請求項8に記載のシステム。
  9. 符号化モードは H.264 規格によって定義される、請求項8に記載のシステム。
  10. 符号化モードはイントラモードである、請求項10に記載のシステム。
  11. 歪みレベルはトレース((e - eQ)(e - eQ)T)と定義され、これにおいて e は動き補償後の予測残余を表し、 eQ は推定空間ドメイン残余を表す、請求項8に記載のシステム。
  12. RDコストは、ラグランジュの乗数を掛けた符号化モードの算出レートに符号化モードの歪みレベルを足したものと定義される、請求項8に記載のシステム。
  13. 符号化モードの推定空間ドメイン残余を変換ドメインで推定するためのモジュールであって、このモジュールは、
    変換された動き補償後の予測残余を受け取る第1インタフェースと、
    再構築された変換ドメイン残余を受け取る第2インタフェースと、
    変換された動き補償後の予測残余および再構築された変換ドメイン残余から変換ドメインで推定空間ドメイン残余を生成するプロセッサとを含む。
  14. 符号化モードの歪みレベルを計算するのに推定空間ドメイン残余を用いる、請求項15に記載のモジュール。
  15. 歪みレベルはトレース ((e - eQ)(e - eQ)T) と定義される、請求項16に記載のモジュール。
  16. 符号化モードは H.264 規格によって定義される、請求項16に記載のモジュール。
  17. 符号化モードはイントラモードである、請求項18に記載のモジュール。
JP2006338041A 2005-12-19 2006-12-15 符号化モードと関連付けられた歪みレベルを推定する方法、符号化モードのレート歪みコストを計算するためのシステム、および符号化モードの推定空間ドメイン残余を変換ドメインで推定するためのモジュール Withdrawn JP2007174649A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/305,954 US7944965B2 (en) 2005-12-19 2005-12-19 Transform domain based distortion cost estimation

Publications (1)

Publication Number Publication Date
JP2007174649A true JP2007174649A (ja) 2007-07-05

Family

ID=38173430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006338041A Withdrawn JP2007174649A (ja) 2005-12-19 2006-12-15 符号化モードと関連付けられた歪みレベルを推定する方法、符号化モードのレート歪みコストを計算するためのシステム、および符号化モードの推定空間ドメイン残余を変換ドメインで推定するためのモジュール

Country Status (2)

Country Link
US (1) US7944965B2 (ja)
JP (1) JP2007174649A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011515940A (ja) * 2008-03-18 2011-05-19 サムスン エレクトロニクス カンパニー リミテッド 映像の符号化、復号化の方法及び装置
WO2013191436A1 (ko) * 2012-06-19 2013-12-27 엘지전자 주식회사 비디오 신호 처리 방법 및 장치

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100772391B1 (ko) * 2006-01-23 2007-11-01 삼성전자주식회사 직교 변환 및 벡터 양자화에 기반한 동영상 부호화 및복호화 방법과 이를 이용한 장치
KR101351730B1 (ko) * 2006-08-28 2014-01-16 톰슨 라이센싱 디코딩된 비디오 블록에서 예상 왜곡을 결정하기 위한 방법및 장치
KR100773761B1 (ko) * 2006-09-14 2007-11-09 한국전자통신연구원 동영상 부호화 장치 및 방법
US8737485B2 (en) * 2007-01-31 2014-05-27 Sony Corporation Video coding mode selection system
US8358699B2 (en) * 2007-04-09 2013-01-22 Cavium, Inc. Method and system for selection of reference picture and mode decision
US8238428B2 (en) * 2007-04-17 2012-08-07 Qualcomm Incorporated Pixel-by-pixel weighting for intra-frame coding
US8582652B2 (en) * 2007-10-30 2013-11-12 General Instrument Corporation Method and apparatus for selecting a coding mode
KR101377660B1 (ko) * 2008-09-30 2014-03-26 에스케이텔레콤 주식회사 복수 개의 움직임 벡터 추정을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US8654859B1 (en) * 2009-12-17 2014-02-18 Ambarella, Inc. Low cost rate-distortion computations for video compression
KR102185857B1 (ko) 2014-02-13 2020-12-02 삼성전자주식회사 영상 부호화, 복호화 방법 및 장치
WO2015200822A1 (en) * 2014-06-26 2015-12-30 Huawei Technologies Co., Ltd Method and device for reducing a computational load in high efficiency video coding
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
CN110199521B (zh) * 2016-12-23 2022-05-31 华为技术有限公司 用于有损视频编码的低复杂度混合域协同环内滤波器
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1157080A (zh) * 1995-04-25 1997-08-13 菲利浦电子有限公司 用于编码视频图像的装置和方法
ATE241887T1 (de) * 1999-08-11 2003-06-15 Nokia Corp Adaptive bewegungsvektorfeldkodierung
EP1152621A1 (en) * 2000-05-05 2001-11-07 STMicroelectronics S.r.l. Motion estimation process and system.
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
JP4193406B2 (ja) * 2002-04-16 2008-12-10 三菱電機株式会社 映像データ変換装置および映像データ変換方法
US7154952B2 (en) * 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7194035B2 (en) * 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
US7672523B2 (en) * 2003-03-03 2010-03-02 The Hong Kong University Of Science And Technology Efficient rate allocation for multi-resolution coding of data
US7403561B2 (en) * 2003-04-04 2008-07-22 Avid Technology, Inc. Fixed bit rate, intraframe compression and decompression of video
US7327786B2 (en) * 2003-06-02 2008-02-05 Lsi Logic Corporation Method for improving rate-distortion performance of a video compression system through parallel coefficient cancellation in the transform
US7471726B2 (en) * 2003-07-15 2008-12-30 Microsoft Corporation Spatial-domain lapped transform in digital media compression
KR101196429B1 (ko) * 2004-03-12 2012-11-01 삼성전자주식회사 동영상 트랜스코딩 방법 및 그 장치, 이에 사용되는움직임 벡터 보간방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011515940A (ja) * 2008-03-18 2011-05-19 サムスン エレクトロニクス カンパニー リミテッド 映像の符号化、復号化の方法及び装置
WO2013191436A1 (ko) * 2012-06-19 2013-12-27 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
RU2653258C2 (ru) * 2012-06-19 2018-05-07 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки видеосигнала
US10021417B2 (en) 2012-06-19 2018-07-10 Lg Electronics Inc. Method and device for processing video signal

Also Published As

Publication number Publication date
US7944965B2 (en) 2011-05-17
US20070140339A1 (en) 2007-06-21

Similar Documents

Publication Publication Date Title
JP2007174649A (ja) 符号化モードと関連付けられた歪みレベルを推定する方法、符号化モードのレート歪みコストを計算するためのシステム、および符号化モードの推定空間ドメイン残余を変換ドメインで推定するためのモジュール
US7751478B2 (en) Prediction intra-mode selection in an encoder
US8170102B2 (en) Macroblock homogeneity analysis and inter mode prediction
CN109644270B (zh) 视频编码方法和编码器、视频解码方法和解码器、存储介质
US7843995B2 (en) Temporal and spatial analysis of a video macroblock
US7830961B2 (en) Motion estimation and inter-mode prediction
KR101196429B1 (ko) 동영상 트랜스코딩 방법 및 그 장치, 이에 사용되는움직임 벡터 보간방법
AU2019240711B2 (en) Method and apparatus for motion compensation prediction
WO2018219357A1 (en) Intra prediction using unequal weight planar prediction
EP2036358A1 (en) Image encoding/decoding method and apparatus
US10158880B2 (en) Method and apparatus for encoding/decoding video using high-precision filter
US20090161757A1 (en) Method and Apparatus for Selecting a Coding Mode for a Block
KR20120034582A (ko) 영상/화상을 부호화하기 위한 장치 및 방법
JP2011229145A (ja) 符号化ユニットにおける動画符号化においてハイブリッド多仮説予測を行う方法、および関連装置
KR20100058201A (ko) 비디오 신호의 부호화/복호화 장치 및 방법
KR20070077955A (ko) 인트라 예측 모드 결정 방법 및 장치
KR20110126075A (ko) 확장 블록 필터링을 이용한 비디오 부호화, 복호화 방법 및 장치
CN113766233B (zh) 图像预测方法、编码器、解码器以及存储介质
JP2007266861A (ja) 画像符号化装置
CN113261279B (zh) 预测值的确定方法、编码器、解码器以及存储介质
KR20190052022A (ko) 인트라 기반의 로컬 인터-계층 예측을 위한 방법
Su et al. Encoder optimization for H. 264/AVC fidelity range extensions
CN109863751B (zh) 用于对图片进行编码和解码的方法和装置
JP2021118525A (ja) 符号化装置、復号装置、及びプログラム
WO2020181503A1 (zh) 帧内预测方法及装置、计算机可读存储介质

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070406

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100302