JP4979023B2 - ビデオ・データを符号化および復号するための方法および装置 - Google Patents

ビデオ・データを符号化および復号するための方法および装置 Download PDF

Info

Publication number
JP4979023B2
JP4979023B2 JP2008512794A JP2008512794A JP4979023B2 JP 4979023 B2 JP4979023 B2 JP 4979023B2 JP 2008512794 A JP2008512794 A JP 2008512794A JP 2008512794 A JP2008512794 A JP 2008512794A JP 4979023 B2 JP4979023 B2 JP 4979023B2
Authority
JP
Japan
Prior art keywords
frame
pass
prediction
encoding
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008512794A
Other languages
English (en)
Other versions
JP2008543138A (ja
JP2008543138A5 (ja
Inventor
チエン,イン
ツアイ,ジエフ
ガオ,クイ
シエ,カイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2008543138A publication Critical patent/JP2008543138A/ja
Publication of JP2008543138A5 publication Critical patent/JP2008543138A5/ja
Application granted granted Critical
Publication of JP4979023B2 publication Critical patent/JP4979023B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、ビデオ・データを符号化および復号するための方法および装置に関する。
H.264/AVC規格は、良好な符号化効率を提供するが、スケーラブル・ビデオ符号化(SVC)を考慮していない。スケーラブル・ビデオ符号化は、複数の異なるレイヤー、通常、ベース・レイヤー(BL)およびエンハンスメント・レイヤー(EL)を提供する。MPEG(Motion Picture Expert Group)は、ビデオ・コーデックの拡張機能に取り組んでいる。様々な技術が提案され、JVC(Joint Video Team)は、対応するリファレンス・ソフトウエア(JSVM)と共に、JSVCと呼ばれる規格を開始した。スケーラブル・ビデオ符号化は、アプリケーションのための時間的なSNRおよびスケーラビリティを提供する。JSVMのベース・レイヤーは、H.264と互換性があり、H.264の大部分のコンポーネントは、定められているように、JSVMにおいて使用されており、ごく限られたコンポーネントのみがサブバンド構造に従って調節される必要がある。全てのスケーラビリティのうち、空間スケーラビリティは、2つの空間スケーラブル・レイヤーの間のリダンダンシーを使用することが困難であるため、最も困難な課題が存在するが、興味深い。
スケーラブル・ビデオ符号化は、イントラ・ベース・レイヤー(IntraBL)モード、残差予測、または、ベース・レイヤー・スキップ・モードなど、空間スケーラビリティのための幾つかの技術を提供する。これらのモードは、マクロブロック(MB)・レベルで選択できる。
イントラ・ベース・レイヤー・モードは、アップサンプリングされた再構築済のベース・レイヤー・ピクチャを使用して、エンハンスメント・レイヤー内のマクロブロックを予測し、残差のみを符号化する。残差予測は、エンハンスメント・レイヤーの動き補償(MC)の残差のエネルギーを、ベース・レイヤーのアップサンプリングされた動き補償残差を差し引くことによって、低減することを試行する。ベース・レイヤー・スキップ・モードは、エンハンスメント・レイヤーにおけるマクロブロックのためにアップサンプリングされたベース・レイヤー動きベクトル(MV)を利用しており、マクロブロックがこのモードを選択した場合には、残差のみがビットストリームに書き込まれるようにするだけでよい。従って、ベース・レイヤー・スキップ・モードは、ベース・レイヤーおよびそのエンハンスメント・レイヤーのMVの間のリダンダンシーを空間スケーラビリティのケースに利用する。
スケーラブル・ビデオ符号化のPピクチャおよびBピクチャのみを含むインター符号化されたピクチャの場合には、残差エネルギーを減少させて符号化効率を向上するために残差予測が使用される。基本的なアイデアは、まず、対応するベース・レイヤー・ピクチャの残差信号をアップサンプリングすることによって、予測残差を得ることであり、2タップ双線形フィルタ(2−tap bilinear filter)が使用される。次に、エンハンスメント・レイヤーにおける動き推定から得られた実際の残差から予測残差が差し引かれ、差がDCT、エントロピー符号化などによって符号化される。
残差のアップサンプリングは、一般に、マクロブロック毎に行われ、動き補償の精度に基づいて、各マクロブロックについて、4×4、8×8、または16×16のサブブロックによって行われる。動き補償の精度が例えば16×16である場合には、16×16のマクロブロック全体が1つの動きベクトルのみを使用する。動き補償精度が8×8である場合には、4つの8×8のサブブロックの各々が異なる動きベクトルを有する。異なる8×8のサブブロックの残差は相関性が低いため、アップサンプリング処理が4つの異なるサブブロックについて行われる。スケーラブル・ビデオ符号化は、単純な2タップ双線形フィルタを利用し、まず水平方向に、次に、垂直方向にアップサンプリング処理を行う。各フィルタは、マクロブロック・レベルで動作するものであり、8×8ブロックの境界を渡ることはできない。
上述した処理のオプションは、特定のマクロブロックに残差予測を使用するかどうかである。モード決定プロセスは、複数の異なるモードを、全て、残差予測を使用する場合、残差予測を使用しない場合について試行する。これは、アダプティブ残差予測と呼ばれる。
H.264/SVCによって用いられる通常のフレーム構造には、瞬時復号リフレッシュ(IDR)のための受信機において使用される2つのイントラ符号化されたリファレンス・フレームと、さらに、幾つかのGOP(group‐of‐pictures)を作り出す多数のイントラ符号化またはインター符号化されたフレームを含む。インター符号化フレームは、補間することもでき、予測することもできる。ウエーブレット分解においては、GOPのエンハンスメント・レイヤーは、通常、幾つかのハイパス・フレームと、その後に続くローパス・フレームとからなる。ローパス・フレームは、前のハイパス・フレームおよび後のハイパス・フレームの両方、即ち、2つのGOPのために使用される。
(発明の概要)
残差予測を使用することは、符号器および復号器の両者にとって、非常に複雑な処理である。従って、より複雑でない符号器および/または復号器の使用を可能にする簡略化された処理が望ましい。残差予測を無効にすれば、復号器の演算量が約1/2に低減されるが、符号化効率が低下する。また、アダプティブ残差予測は、(PSNRに基づいて)同じ客観的品質で、約5〜10%の符号化効率を向上させることが可能な非常に有望な技術である。一般的に、符号化および復号の処理効率のレベルを概ね維持、または、向上させることが望ましい。従って、残差予測を有効にすることが提案されている。しかしながら、例えば、リアルタイム・アプリケーションでは、残差予測が各ピクチャに対して有効である場合には、公知の復号器では処理が遅すぎるため、例えば、デュアル・レイヤー(QCIF/CIF)空間スケーラブル・ビットストリームのリアルタイムな復号を行うことができない。
本発明は、空間スケーラブルエンハンスメント・レイヤーの符号化および/または復号の演算量を低減することに重点を置く一方、符号化効率の低下が若干であるか、または符号化効率を向上させるような簡略化された残差予測技術を提供する。
本発明の一態様によれば、ハイパス・フレームおよびローパス・フレームを含むビデオ・データを符号化する方法は、符号化が予測および更新の各ステップに基づいて行われ、この方法は、
残差予測を行うことを可能に、ローパス・フレームを符号化するステップと、
例えば、連番順により、即ち、固定されたラスターを用いて、例えば、ハイパス・フレームの各々を1つのグループに割り当てることにより、ハイパス・フレームを2つの(好ましくは、インターリービング)フレーム・グループに分割するステップと、
残差予測を行うことを可能に、フレーム・グループのうちの第1のフレーム・グループの各フレームを符号化するステップと、
残差予測を行わない符号化方法を使用して、即ち、各フレームに対する残差予測を禁止して、フレーム・グループのうちの第2のフレーム・グループの各フレームを符号化するステップと、を含む。
本発明のこの態様に係る好ましい実施の形態においては、フレーム・グループのうちの第1のフレーム・グループの各フレームを符号化するステップは、モード選択を行うステップを含み、可能な符号化モードのいずれもマクロブロック・レベルでの残差予測を使用しない。一実施の形態によれば、しかしながら、第1のフレーム・グループのための符号化モードの少なくとも1つは、フレーム・レベルでの残差予測を使用し、これは、本明細書においては、「簡略化された残差予測」と呼ぶ。簡略化された残差予測のため、エンハンスメント・レイヤー残差は、エンハンスメント・レイヤーの情報から好ましくは作成され、ベース・レイヤー残差は使用されない。
特に好ましい実施の形態においては、第1のフレーム・グループは偶数ハイパス・フレームを含み、第2のフレーム・グループは、奇数ハイパス・フレームを含む。
特に、本発明は、スケーラブル・ビデオ信号のエンハンスメント・レイヤーに属するハイパス・フレームおよびローパス・フレームのために有益である。従って、スケーラブル・ビデオ符号化のための残差予測スキームが向上し、簡略化される。
本発明の一実施の形態に係る符号器によって生成される、結果として得られるビデオ信号は、少なくとも2つの空間的にスケーラブルなレイヤー、ベース・レイヤーおよびエンハンスメント・レイヤーを含むビデオ信号であって、
エンハンスメント・レイヤーは、符号化されたローパス・フレーム・データおよび符号化されたパイパス・フレーム・データを含み、
符号化されたハイパス・フレーム・データは、符号化モード・インジケーションを含み、2つのタイプまたはグループに分割可能であり、これらのグループのうちの一方のハイパス・フレーム・データは、フレームが残差予測を用いて符号化されたかどうかを示すインジケーションを含み、フレームの少なくとも幾らかがマクロブロック・レベルでなくフレーム・レベルでの残差予測(簡略化された残差予測)を用いて復号され、これらのグループのうちの他方のハイパス・フレーム・データは、残差予測を用いないで符号化される。従って、これらのフレームは、このような残差予測のインジケーションを含む必要がない。第2のグループのフレーム・データは、残差予測を使用することのない完全に符号化された残差ピクチャを含む。
従って、ハイパス・フレームの第2のグループでは残差予測がスキップ可能であり、この残差予測は、ハイパス・フレームの第1のグループでは、マクロブロック・レベルの代わりにフレーム・レベルで実行することができる。残差予測により、符号化の間も復号の間もフレームがブロックに分割される必要がないため、符号器および復号器の演算量が低減する。
例えば、GOPのサイズが16であるとすると、その構造は(従前の瞬時復号リフレッシュ・フレームは図示されていないが、Pは予測されたフレームであり、Bxは、双線形予測されたフレームである)、P1 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12 B13 B14 B15 P2である。
本発明の好ましい実施の形態によれば、奇数フレームB1、B3、B7、B9、B11、B13、B15には、残差予測は行われない。
簡略化されたアダプティブ残差予測が偶数フレームB2、B4、B6、B8、B10、B12、B14に対して行われる。
オリジナルの従来のアダプティブ残差予測はP1およびP2である。
本発明の符号化方法のためには、フレームを複数のマクロブロックに分割する必要はないという利点が得られる。
ハイパス・フレームおよびローパス・フレームを含むビデオ・データを符号化する対応する装置は、符号化が予測および更新の各ステップに基づいて行われ、この装置は、
残差予測を行うことを可能に、ローパス・フレームを符号化する手段と、
例えば、連番順により、例えば、ハイパス・フレームの各々を1つのグループに割り当てることにより、ハイパス・フレームを2つの(好ましくはインターリービング)フレーム・グループに分割する手段と、
残差予測を行うことを可能に、フレーム・グループのうちの第1のフレーム・グループの各フレームを符号化する手段と、
残差予測を行わない符号化方法を使用してフレーム・グループのうちの第2のフレーム・グループの各フレームを符号化する手段と、を含む。さらに、装置は、第1のフレーム・グループのフレームに残差予測インジケーション・フラグを挿入するための手段を含んでいても良い。
発明の別の態様によれば、符号化されたハイパス・フレームおよびローパス・フレームを含むビデオ・データを復号する方法は、少なくともハイパス・フレームの復号が逆予測および逆更新の各ステップに基づいて行われ、この方法は、
例えば、符号化モード・フラグによって示されるように、ローパス・フレームの符号化モードに従ってローパス・フレームを復号するステップと、
ハイパス・フレームの連続順序(連番)から第1または第2の(Beven、Bodd)フレームのグループに属するかを判定するステップと、
ハイパス・フレームを復号するステップと、を含み、ハイパス・フレームが第1のフレームのグループ(Beven)に属する場合には、復号に、逆予測および逆更新ステップのために使用される残差の予測を使用し、ハイパス・フレームが第2のフレームのグループに属する場合には、逆予測および逆更新の各ステップに使用される残差は、予測無しに得られる。この予測には、対応するベース・レイヤー残差をアップサンプリングしたものを用いることができるが、原則的には、別の予測技術を用いることもできる。
符号化されたハイパス・フレームおよびローパス・フレームを含むビデオ・データを復号する対応する装置は、少なくともハイパス・フレームの復号が逆予測および逆更新の各ステップに基づいて行われ、この装置は、少なくとも、
ローパス・フレームの符号化モードに従ってローパス・フレームを復号する手段と、
ハイパス・フレームの連続順序から第1または第2の(Beven、Bodd)フレームのグループに属するかを判定する手段と、
ハイパス・フレームを復号する手段と、を含み、ハイパス・フレームが第1のフレームのグループ(Beven)に属する場合には、復号に、逆予測および逆更新ステップのために使用される残差のフレーム・レベルでの予測を使用し、ハイパス・フレームが第2のフレームのグループに属する場合には、逆予測および逆更新の各ステップに使用される残差は、予測無しに得られる。
本発明の有益な実施の形態は、従属請求項、以下の説明および図面に開示されている
本発明の例示的な実施の形態を添付図面を参照して説明する。
以下の文章は、フレームおよびピクチャについて言及している。フレームについて言及する際には、同様のことがピクチャにも当てはまり、ピクチャについて言及する際には、同様のことがフレームにも当てはまる。
図1は、4×4の動き補償の正確性を用いて、水平方向に残差アップサンプリングを行う原理を示している。スケーラブル・ビデオ符号化は、例えば、単純な2タップ双線形フィルタを利用して、まず、水平方向にアップサンプリング処理を実行し、次に、垂直方向にアップサンプリング処理を実行する。2つの近傍のオリジナルのピクセルを平均化することによってアップサンプリングされたピクセル値が生成され、アップサンプリングされたピクセルの位置は、ちょうど2つのオリジナルのピクセルの真ん中となり、係数は、[1/2、1/2]となる。2タップ・フィルタは、マクロブロック境界を渡ることはできない。左側の境界には問題は存在しないが、右側の境界でアップサンプリングされたピクセルは、単に最も近傍のピクセルのコピーである。これを「最近傍法(nearest neighboring method)」と呼ぶ。
従来のアップサンプリングでは、残差ピクチャ全体がまず複数のマクロブロックに分割され、次に、複数のサブブロックに分割される。これは、小さなブロックのために多数のメモリ・コピー動作およびアップサンプリングを行うステップが存在することを意味する。このことは、残差予測が有効である場合に復号器の演算量が大きい理由である。
本発明は、アダプティブに残差予測を用いることにより、残差予測を部分的スキップすることにより、さらに、残差予測方法を修正することにより、符号器の演算量および復号器の演算量を低減する方法を開示している。
通常、各GOPには、ローパス・フレームであるPフレームの1つが存在する。例えば、GOPサイズが16である場合には、ローパス・フレームに係るパラメータであるGOP内のピクチャIDは、16である。他のPフレームまたはBフレームである15個のフレームは、複数の異なる分解レベルを有する。最も高い分解レベルを有するフレームは、GOP内のピクチャIDが奇数の1、3、5、7、9、11、13、15のフレームである。これらのピクチャを奇数ピクチャと言及する。本発明において、我々は、従来の残差アップサンプリング処理に代替する2つの解決法を提案する。
1つの解決法は、従来のアップサンプリング方法を使用して残差予測を実行することである。しかしながら、この処理は各ブロックに対してではなく、フレーム全体に対して行われる。これは、2タップ・フィルタがフレーム全体の境界に達するまでフレーム内のどの境界も考慮しないことを意味する。従って、残差フレーム全体を複数のマクロブロックやサブブロックに分割する必要はない。
第2の解決法は、(符号化効率を向上するために)残差予測が使用されると、モード決定処理においてアダプティブ・タイプが選択されるため、幾つかのフレームに対しては、残差予測を全く使用しないことである。即ち、モード決定の間、動き補償に関する全てのモードは、2つの異なるサブモード、残差予測を用いるモード、または、残差予測を用いないモードを試行する。どのモードが選択されたかを示すフラグである残差予測フラグがピクチャの各マクロブロックに書き込まれる。
実験により、ローパス・ピクチャが残差予測を使用する可能性が高いことが示されている。通常、ローパス・ピクチャのマクロブロックの約30%で残差予測フラグが有効である。しかしながら、ハイパス・ピクチャの分解ステージが高ければ高いほど、残差予測を使用するマクロブロックが少なくなることが判明している。分解ステージが一番高いピクチャ(奇数ピクチャ)では、残差予測フラグが有効であるマクロブロックはほとんど存在しない。
本発明によれば、GOPのハイパス・フレームは、2つのインターリービング・グループに分割され、これらのグループのうちの一方のグループのフレームまたはピクチャでは、残差予測はフレーム・レベルで行われ、他方のグループの全てのフレームでは、残差予測が禁止され、従って、モード決定の間スキップされる。
本発明の一実施の形態においては、全ての奇数ピクチャに対する残差予測が禁止される。
残差予測が全く使用されない場合であっても、視聴者は、通常、歪み率性能の低下に気がつかないという利点がある。なぜならば、モードが変更されているマクロブロックが少ないからである。別の重要な理由は、ピクチャ全体におけるどのマクロブロックにも全く残差予測が使用されていない場合に、各マクロブロックは、残差予測フラグのために1つのビットを保存する。エントロピー符号化の後であっても、幾つかのビットが保存され、奇数ピクチャの符号化効率が向上する。
実際、演算量の観点からは、残差予測が無効である場合には、各マクロブロックに対するアップサンプリング処理がスキップされるため、復号処理の間の約半分の計算の負荷が低減される。これは、各リアルタイム復号器にとって有益である。
復号器の演算量を低減する別の方法は、他のハイパス・ピクチャ(即ち、偶数ハイパス・ピクチャ)のために、フレーム全体に基づいて残差アップサンプリングを実行することである。この利点は、動き推定(ME)ブロックの境界を実際に検出する必要はなく、フレームの境界に当たるまで、2タップ・フィルタが、フレーム全体を通して同様に実行されることである。従って、残差アップサンプリングの前に残差フレーム全体を複数のブロックに分割する必要はない。従って、小さなブロックのために分割する時間、メモリの移動時間が省かれる。
図2に示すように、高い符号化効率を維持するために、オリジナルのアダプティブ残差予測(ORP)がローパス・ピクチャのために利用される。最も高い分解ステージ、例えば、GOP内のピクチャIDが奇数値を有するフレームでは、残差予測が使用されず(NRP)、これらのフレームにおける各マクロブロックのために残差予測フラグが保存される。他のハイパス・フレーム(GOP内のピクチャID=2、4、6)では、例えば、上述した簡略化された残差予測(SRP)のような弱い残差予測スキームを選択することができる。
図3および図4は、残差予測および簡略化された残差予測との間の差を示している。現在のJSVM残差予測は、各ブロック内で行われる。図3においてフィルタがMEブロックの境界に当たった際には、フィルタは停止し、図1に示すように、最近傍法を使用してアップサンプリングされた残差の境界が予測される。しかしながら演算量を低減するために、幾らかのハイパス・ピクチャのために用いられる残差予測処理を簡略化することを選択する。残差予測が行われる場合には、もはや、マクロブロック・レベルに基づいて行われる必要はない。従って、残差フレーム全体が分割される必要はなく、多くのメモリ動作が必要とならない。2タップ・フィルタでは、図4に示すように、畳み込み処理がフレームの右側または底部の境界に到達するまでは差は存在しない。図3および図4における境界は、畳み込み処理のためのものである。
原則的に、上述した2つの技術は、少なくとも幾つかのフレームのために簡略化した残差予測を用いるもの、さらに、他の少なくとも幾らかのフレームのために残差予測をスキップするものであり、これらは、互いに独立して使用してもよく、他のモードと組み合わせて使用することもできる。例えば、ハイパス・フレームを3つのグループに分割し、第1のグループは従来の符号化を使用し、第2のグループに簡略化した残差予測を使用し、第3のグループに残差予測のスキップを使用することができる。
さらに、偶数ハイパス・フレームを1つのグループに割り当て、奇数ハイパス・フレームをその他のグループに割り当てるのではなく、他のインターリービング・スキームを用いることもできる。例えば、以下のスキームを使用することができる。
B1〜B3、B5〜B7、B9〜B11、B13〜B15には残差予測を使用しない。
B4、B8、B12には簡略化されたアダプティブ残差予測を使用する。
P1およびP2にはオリジナルのアダプティブ残差予測を使用する。
想定される別のスキームは、例えば、上述した「残差予測無し」のグループと「簡略化されたアダプティブ残差予測」のグループを入れ替えることである。
復号器が本発明の符号化方法から生じたビデオ信号を受信すると、特定のBフレームの連番から、残差予測がスキップされたかどうかを判定することができる。例えば、全ての奇数フレームでは、残差予測をスキップする。代替的には、フレームが残差予測が使用された可能性を示唆する上述した残差予測フラグを含むかどうかを評価することができる。このフラグが存在しない場合には、復号器は、符号化の間に残差予測がスキップされたと推定する。
アダプティブ残差予測は、他の想定可能なモード、例えば、インター4×4、インター16×16、インター8×8がテストされることを意味する。従って、アダプティブ残差予測と言った場合には、全てのモードについて、残差予測を用いる場合と、残差予測を用いない場合とでテストされる場合があることを意味する。従って、本発明の好ましい実施の形態においては、モード選択は、全てのハイパス・フレーム(B1、・・・B15)について行われる。
偶数フレームについては、符号器は、複数の異なるモードから選択することができ、それぞれ、残差予測を用いる場合もあれば、残差予測を用いない場合もある。残差予測が選択される場合には、フレーム・レベルで、即ち、簡略化された残差予測が行われる。
奇数フレームについては、符号器は、複数のモードから選択することができるが、残差予測は各モードのいずれにも許されていない、即ち、残差予測は無効である。
従って、ハイパス・フレームは、どのように符号化されたかを示すインジケーション(例えば、フラグ)を含む。
従って、符号化の間に2つの決定を行う必要がある。第1の決定は、フレームのために残差予測を使用するかどうかである。このオプションを示すフラグは、既にピクチャ・パラメータ・セット(PPS)の一部であるため、符号器の問題となる。第2の決定は、どのように残差予測を行うかである。簡略化されたタイプの残差予測を行うか、オリジナルのタイプの残差予測を行うかである。この決定の結果を示すための1つの想定される方法は、PPSにフラグを追加することであるが、これは、好ましくは、標準的な(normative)ものにすべきである。次に、復号器は、このフラグから対応する復号方法を検出することができる。
本発明においては、インター(ハイパス)・ピクチャの複数の異なる分解レベルで、残差予測の重要性が異なることに基づき、復号器の演算量を大幅に低減する簡略化された解決法が提案される。
本発明は、ビデオ符号化およびビデオ復号のため、特に、ビデオが2つ以上の空間スケーラブル・レイヤーを含み、例えば、動き推定から生ずる残差を使用する際に使用することができる。
水平方向の残差アップサンプリングの原理を示す図である。 GOPがGopSize=8である場合の本発明に係る残差予測スキームを示す図である。 従来の残差予測のブロック境界を示す図である。 簡略化された残差予測を示す図である。

Claims (10)

  1. 動き補償時間フィルタを用いた時間ウエーブレット分解によって得られるハイパス・フレームおよびローパス・フレームを含むビデオ・データを符号化する方法であって、前記符号化が予測および更新の各ステップに基づいて行われ、
    フレーム・レベルで残差予測を行うことを可能に、前記ローパス・フレームを符号化するステップと、
    前記ハイパス・フレームを該ハイパス・フレームの連番に基づいて2つのインターリービング・フレーム・グループに分割するステップと、
    前記フレーム・グループのうちの第1のフレーム・グループの各フレームを符号化するステップであって、フレーム・レベルで残差予測が使用される、該ステップと、
    残差予測を行わない符号化方法を使用して前記フレーム・グループのうちの第2のフレーム・グループの各フレームを符号化するステップと、
    を含む、前記方法。
  2. 前記フレーム・グループのうちの第1のフレーム・グループの各フレームを符号化するステップは、複数の符号化モードのうちの1つを選択するステップを含み、可能な符号化モードの少なくとも1つはフレーム・レベルでの残差予測を使用し、かつ、前記可能な符号化モードのいずれもマクロブロック・レベルでの残差予測を使用しない、請求項1記載の方法。
  3. 前記第1のフレーム・グループは、偶数ハイパス・フレームを含み、前記第2のフレーム・グループは、奇数ハイパス・フレームを含む、請求項1または2記載の方法。
  4. 前記フレーム・グループのうちの第2のフレーム・グループの各フレームを符号化するステップは、モード選択を行うことを含む、請求項1〜3のいずれか一項記載の方法。
  5. 符号化されたハイパス・フレームおよびローパス・フレームを含むビデオ・データを復号する方法であって、少なくとも前記ハイパス・フレームの復号が逆予測および逆更新の各ステップに基づいて行われ、
    前記ローパス・フレームの符号化モードに従って前記ローパス・フレームを復号するステップと、
    ハイパス・フレームの連番から第1または第2のフレームのグループに属するかを判定するステップと、
    前記ハイパス・フレームを復号するステップと、を含み、
    前記ハイパス・フレームが前記第1のフレームのグループに属する場合には、前記復号に、前記逆予測および逆更新ステップのために使用される残差のフレーム・レベルでの予測を使用し、前記ハイパス・フレームが前記第2のフレームのグループに属する場合には、前記逆予測および逆更新の各ステップに使用される残差は、予測無しに得られる、前記方法。
  6. 動き補償時間フィルタを用いた時間ウエーブレット分解によって得られるハイパス・フレームおよびローパス・フレームを含むビデオ・データを符号化する装置であって、前記符号化が予測および更新の各ステップに基づいて行われ、
    フレーム・レベルで残差予測を行うことを可能に、前記ローパス・フレームを符号化する手段と、
    前記ハイパス・フレームを該ハイパス・フレームの連番に基づいて2つのインターリービング・フレーム・グループに分割する手段と、
    前記フレーム・グループのうちの第1のフレーム・グループの各フレームを符号化する手段であって、フレーム・レベルで残差予測が使用される、該手段と、
    残差予測を行わない符号化方法を使用して前記フレーム・グループのうちの第2のフレーム・グループの各フレームを符号化する手段と、を含む、前記装置。
  7. 前記フレーム・グループのうちの第2のフレーム・グループの各フレームを符号化する手段は、モード選択を行う手段を含む、請求項6記載の装置。
  8. 符号化されたハイパス・フレームおよびローパス・フレームを含むビデオ・データを復号する装置であって、少なくとも前記ハイパス・フレームの復号が逆予測および逆更新の各ステップに基づいて行われ、
    前記ローパス・フレームの符号化モードに従って前記ローパス・フレームを復号する手段と、
    ハイパス・フレームの連番から第1または第2のフレームのグループに属するかを判定する手段と、
    前記ハイパス・フレームを復号する手段と、を含み、
    前記ハイパス・フレームが前記第1のフレームのグループに属する場合には、前記復号に、前記逆予測および逆更新ステップのために使用される残差のフレーム・レベルでの予測を使用し、前記ハイパス・フレームが前記第2のフレームのグループに属する場合には、前記逆予測および逆更新の各ステップに使用される残差は、予測無しに得られる、前記装置。
  9. 上位レイヤーのフレームのための残差予測が低位レイヤーの対応するフレームの残差をアップサンプリングすることを含む、請求項1〜5のいずれか一項記載の方法。
  10. 上位レイヤーのフレームのための残差予測が低位レイヤーの対応するフレームの残差をアップサンプリングすることを含む、請求項6〜8のいずれか一項記載の装置。
JP2008512794A 2005-05-27 2006-05-03 ビデオ・データを符号化および復号するための方法および装置 Active JP4979023B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP05300426.3 2005-05-27
EP05300426A EP1727372A1 (en) 2005-05-27 2005-05-27 Method and apparatus for encoding and decoding video data,
PCT/EP2006/061994 WO2006125713A2 (en) 2005-05-27 2006-05-03 Method and apparatus for encoding video data, and method and apparatus for decoding video data

Publications (3)

Publication Number Publication Date
JP2008543138A JP2008543138A (ja) 2008-11-27
JP2008543138A5 JP2008543138A5 (ja) 2009-06-18
JP4979023B2 true JP4979023B2 (ja) 2012-07-18

Family

ID=34981128

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008512794A Active JP4979023B2 (ja) 2005-05-27 2006-05-03 ビデオ・データを符号化および復号するための方法および装置

Country Status (6)

Country Link
US (1) US8385432B2 (ja)
EP (2) EP1727372A1 (ja)
JP (1) JP4979023B2 (ja)
CN (1) CN101180882B (ja)
DE (1) DE602006007838D1 (ja)
WO (1) WO2006125713A2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8442108B2 (en) 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US8340177B2 (en) 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
JP5232796B2 (ja) 2006-12-14 2013-07-10 トムソン ライセンシング 適応エンハンスメントレイヤ予測を使用したビット深度スケーラブルなビデオデータを符号化及び/又は復号化する方法及び装置
US8199812B2 (en) * 2007-01-09 2012-06-12 Qualcomm Incorporated Adaptive upsampling for scalable video coding
JP4620695B2 (ja) * 2007-02-21 2011-01-26 日本電信電話株式会社 スケーラブル動画像符号化方法,装置,そのプログラムおよびその記録媒体
US9031129B2 (en) * 2007-06-15 2015-05-12 Microsoft Technology Licensing, Llc Joint spatio-temporal prediction for video coding
CN101159875B (zh) 2007-10-15 2011-10-05 浙江大学 二重预测视频编解码方法和装置
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
WO2010010942A1 (ja) * 2008-07-25 2010-01-28 ソニー株式会社 画像処理装置および方法
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US9479786B2 (en) 2008-09-26 2016-10-25 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
KR101675118B1 (ko) 2010-01-14 2016-11-10 삼성전자 주식회사 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
WO2013025157A2 (en) * 2011-08-17 2013-02-21 Telefonaktiebolaget L M Ericsson (Publ) Auxiliary information map upsampling
CN103139560B (zh) * 2011-11-30 2016-05-18 北京大学 一种视频编码方法及系统
JP5938655B2 (ja) * 2012-01-11 2016-06-22 パナソニックIpマネジメント株式会社 再生装置、撮像装置およびプログラム
US20150071350A1 (en) * 2012-01-31 2015-03-12 Sony Corporation Image processing device and image processing method
CN103379340B (zh) * 2012-04-19 2017-09-01 乐金电子(中国)研究开发中心有限公司 一种残差预测方法及装置
CN103716628B (zh) * 2012-09-29 2017-08-18 华为技术有限公司 编解码处理方法、编码器和解码器
US9380305B2 (en) * 2013-04-05 2016-06-28 Qualcomm Incorporated Generalized residual prediction in high-level syntax only SHVC and signaling and management thereof

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2677836B1 (fr) * 1991-06-11 1997-08-29 Thomson Csf Codeur-decodeur sous bandes de signaux de television a niveaux compatibilite differents.
JP3633204B2 (ja) * 1997-05-14 2005-03-30 ソニー株式会社 信号符号化装置、信号符号化方法、信号記録媒体及び信号伝送方法
JP4186242B2 (ja) * 1997-12-26 2008-11-26 ソニー株式会社 画像信号処理装置及び画像信号処理方法
US8050329B2 (en) * 1998-06-26 2011-11-01 Mediatek Inc. Method and apparatus for generic scalable shape coding
US7412002B2 (en) * 2000-04-28 2008-08-12 Texas Instruments Incorporated Image preprocessing with selective lowpass filtering from motion compensation
EP1320831A2 (en) * 2000-09-12 2003-06-25 Koninklijke Philips Electronics N.V. Video coding method
AUPR222500A0 (en) * 2000-12-21 2001-01-25 Unisearch Limited Method for efficient scalable compression of video
US20060146937A1 (en) * 2003-02-25 2006-07-06 Koninklijke Philips Electronics N.V. Three-dimensional wavelet video coding using motion-compensated temporal filtering on overcomplete wavelet expansions
EP1455534A1 (en) * 2003-03-03 2004-09-08 Thomson Licensing S.A. Scalable encoding and decoding of interlaced digital video data
TWI231722B (en) * 2003-08-21 2005-04-21 Mediatek Inc Method and related apparatus for generating stereo output of vocal cancellation
EP1574995A1 (en) * 2004-03-12 2005-09-14 Thomson Licensing S.A. Method for encoding interlaced digital video data
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
DE102004059993B4 (de) * 2004-10-15 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Bewegungsdaten-Prädiktion sowie Computerprogramm und computerlesbares Medium

Also Published As

Publication number Publication date
DE602006007838D1 (de) 2009-08-27
EP1884118B9 (en) 2013-06-12
CN101180882A (zh) 2008-05-14
WO2006125713A3 (en) 2007-04-05
EP1727372A1 (en) 2006-11-29
US8385432B2 (en) 2013-02-26
WO2006125713A2 (en) 2006-11-30
JP2008543138A (ja) 2008-11-27
US20090041121A1 (en) 2009-02-12
CN101180882B (zh) 2010-05-19
EP1884118B1 (en) 2009-07-15
EP1884118A2 (en) 2008-02-06

Similar Documents

Publication Publication Date Title
JP4979023B2 (ja) ビデオ・データを符号化および復号するための方法および装置
US20180352246A1 (en) Video encoding and decoding
KR100679031B1 (ko) 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
KR100678958B1 (ko) 인트라 bl 모드를 고려한 디블록 필터링 방법, 및 상기방법을 이용하는 다 계층 비디오 인코더/디코더
JP4902642B2 (ja) 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法
RU2341034C1 (ru) Способ управления устранением блочности, учитывающий режим внутреннего bl, и кодировщик/декодер многослойного видео, его использующий
US8902976B2 (en) Hybrid encoding and decoding methods for single and multiple layered video coding systems
US20060153295A1 (en) Method and system for inter-layer prediction mode coding in scalable video coding
US20060093041A1 (en) Intra-frame prediction for high-pass temporal-filtered frames in wavelet video coding
US20070171970A1 (en) Method and apparatus for video encoding/decoding based on orthogonal transform and vector quantization
JP2013524669A (ja) 高効率な動画像符号化のためのスーパーブロック
EP1867176A1 (en) Method for decoding video signal encoded using inter-layer prediction
EP1817911A1 (en) Method and apparatus for multi-layered video encoding and decoding
Suzuki et al. Block-based reduced resolution inter frame coding with template matching prediction
AU2006289710B2 (en) Deblocking filtering method considering intra-BL mode and multilayer video encoder/decoder using the same
Liu et al. Improved intra prediction for H. 264/AVC scalable extension
KR101895389B1 (ko) 영상 부호화 방법 및 장치
Hao et al. Macroblock-level reduced resolution video coding allowing adaptive DCT coefficients selection
KR20140072941A (ko) 계층간 참조샘플을 이용하여 화면 내 예측을 수행하는 확장 비디오 부/복호화 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120321

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120411

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120412

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150427

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4979023

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250