JP2009543490A - 画像符号化及び復号化 - Google Patents

画像符号化及び復号化 Download PDF

Info

Publication number
JP2009543490A
JP2009543490A JP2009518877A JP2009518877A JP2009543490A JP 2009543490 A JP2009543490 A JP 2009543490A JP 2009518877 A JP2009518877 A JP 2009518877A JP 2009518877 A JP2009518877 A JP 2009518877A JP 2009543490 A JP2009543490 A JP 2009543490A
Authority
JP
Japan
Prior art keywords
data
difference
reference data
base layer
enhancement layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009518877A
Other languages
English (en)
Inventor
シープリンスキー、レセック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2009543490A publication Critical patent/JP2009543490A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

改善されたMPEG適応的参照細粒度スケーラビリティ符号器及び復号器が記載される。差分データ内の値の大きさに応じて、拡張レイヤ内の予測誤差信号の生成中に差分データを重み付けするために使用されるパラメータα及びβが変更される。

Description

本発明は画像符号化及び復号化の技術分野に関し、より詳細には、ビデオ圧縮符号化及び復号化の技術分野に関する。
スケーラブルビデオコーディングは、元のビットストリームとは異なるビットレート、フレームレート及びディスプレイ解像度における効率的な再構成が支援されるように、元のビデオコンテンツを圧縮することによって、ビデオ通信ネットワーク、及びエンドユーザの関心の多様性に対処することを目指す。ビットレートスケーラビリティ(Bit-rate scalability)は、ビットレートが徐々に細かく変化する場合でも、圧縮効率を損なうことなく、圧縮されたビデオを再構成する能力を指している。これによって、多数のユーザが、それぞれ自分の利用可能な帯域幅の全てを利用して、単一の圧縮されたビットストリームにアクセスすることができるようになる。レートスケーラビリティがない場合、そのネットワーク上で同じビデオデータのいくつかのバージョンを利用することができるようにせざるを得ないため、記憶装置及び伝送の負担が著しく重くなる。スケーラビリティの他の重要な形は、空間解像度スケーラビリティ及びフレームレート(時間解像度)スケーラビリティを含む。これらのスケーラビリティによれば、圧縮されたビデオを種々のディスプレイ解像度において効率的に再構成することができるようになり、それによって異なる能力の全ての種類のエンドユーザデバイスにサービスを提供することができる。
新たなスケーラブルビデオコーディング標準規格の現在の草案(それは後に、ISO/IEC14496−10/AMD2及びITU−T勧告H.264付録Fになる;現在の草案、ジョイント・ドラフト6は、ジョイントビデオチームドキュメントJVT−S201において見いだすことができる)は、細粒度スケーラビリティ(fine granularity scalability)(FGS)と呼ばれる、1つの特定の形のビットレートスケーラビリティに対応し、そのスケーラビリティによれば、ビットストリームを基本的に任意のビットレートにおいて切断することができるようになる。これは、1つの形のプログレッシブ・リファインメントを使用して、変換係数のコーディングを実行することによって達成される。この技法は、レート歪みを概ね最適化するように、係数ビットを複数のブロックにおいて配列し、リファインメントが伝送される順序の効率的なシグナリングを導入する。これは、いくつかのビットが捨てられるときに、残されたビットの数を考えて、残りのビットによってできる限り良好に元のブロックを再構成することができるようにすることを意味する。以前のMPEG標準規格において実施されるような細密度スケーラビリティの概念のさらに詳細な説明は、非特許文献1に記載されている。
単一の拡張レイヤの場合の、細粒度スケーラビリティ方式のための処理の流れが図1に示される。このコーディング過程は2つの部分において考えることができる。基本レイヤのコーディングは、たとえば、MPEG−4 AVCにおいて使用されるような非スケーラブルコーディングの場合によく知られているパターンに従う。ただし、MEは動き推定を表し、MCは動き補償を表し、Tは空間変換を表し、Qは量子化を表す。
拡張(FGS)レイヤの場合、元の差分フレームと再構成された基本レイヤの差分フレームとの間の差が、空間変換を使用して変換され、基本レイヤの符号化において使用される量子化ステップの半分に等しい量子化ステップで量子化される。その後、量子化された変換係数は、プログレッシブ・リファインメントと呼ばれる修正エントロピーコーディング技法を使用してコーディングされ、その技法によれば、拡張レイヤのビットストリームを任意の点で切断することができるようになる。MPEG−4 SVC標準規格の現在の草案において定義されるように、この打切りは数多くの方法で実行することができる。
1.完全なFGSレイヤに対応するプログレッシブ・リファインメントネットワークアダプテーションレイヤ(NAL)ユニット全体を捨てること。これは、多数のFGSレイヤが使用されるときにのみ適用される。
2.単純な打切り。ビットストリームにおいて最も高い時空レベルの場合の最後のプログレッシブ・リファインメントNALユニットが、ビットレート制約を満たすために必要とされるパーセンテージによって打ち切られる。
3.品質レイヤ。プログレッシブ・リファインメントNALユニットに品質レイヤ識別子が割り当てられ、その識別子が、NALユニットそのものにおいて、又は別個のメッセージにおいて送信される。この場合、最も高いNALユニットのみを打ち切る代わりに、最大可能な品質レイヤ識別子を有する全てのNALユニットが、同じパーセンテージによって打ち切られる。
上記の方式の重要な点は、基本レイヤ及び拡張レイヤの両方の動き補償のための参照(reference)が、再構成された基本レイヤのフレームであることである。これが図2に示される。ただし、F(t,n)は、レイヤn内の時刻tにおける変換係数値であり、重要な結果をもたらすため、以下で検討されるであろう。
適応的参照細粒度スケーラビリティ(adaptive-reference FGS)(AR−FGS)の目標は、低遅延の用途の場合のFGS性能を改善することである。ただし、P個の画像のみが使用される。この用途のシナリオにおいてFGSが抱える問題は、ビットレートを調整するためにFGSレイヤがビットストリームから除去されるときに、動き補償のための参照フレームとして、結果として生成された、再構成品質が劣化しているフレームを使用することに起因して、誤差が導入されることである。動き補償が繰り返されるのに応じて、1つの過程において誤差が累積し、その誤差は一般的に予測ドリフトと呼ばれる。上記で言及されたように、この問題は、MPEG−4 SVC標準規格の現在の草案におけるFGSコーディングの「正規」バージョンでは、動き補償の参照として基本レイヤ参照フレームのみを使用することによって解決される。この解決手段は、ドリフト問題を回避するが、結果として、圧縮効率を低下させる。
いわゆる漏れがある予測(leaky prediction)を導入することによって、この問題を克服するために、Han及びGirodによって非特許文献2が提案されている。これは、通常の動き補償方式に修正を加えたものであり、予測信号が、基本レイヤの参照画像及び拡張レイヤの参照画像の重み付け平均として形成される。同様の技法が、MPEG−4 SVC標準規格の現在の草案の場合にも採用されている(上記で参照されたジョイント・ドラフト バージョン6、及びジョイントビデオチームドキュメントJVT−S202のジョイント・スケーラブル・ビデオ・モデル バージョン6も参照されたい)。その方式の詳細は、後に説明されるように、その時点で処理されている基本レイヤブロック係数の特性によって異なる。
基本レイヤ内の現在ブロックのための全ての係数が0であるとき、その処理は、図3に示されるように、空間領域において実行される。最初に、拡張レイヤ及び基本レイヤ内の参照ブロック(すなわち、現在ブロックの動き補償のために使用される参照フレームからのブロック)間の差が計算される。
D(t−1、n)=R(t−1,n)−R(t−1,0)
ただし、D(t,n)は時刻tのフレームの場合の差を表し、R(t,n)はレイヤnの時刻tにおける再構成されたピクセル値である(空間インデックスは、明確にするために省略される)。結果として生成された差分参照ブロックは、その後、スケーリングされ、基本レイヤ再構成に加えられて、参照ブロックP(t,n)が生成される。
P(t,n)=R(t,0)+α×D(t−1,n)
この参照ブロックは、その後、現在ブロックのFGSレイヤのための参照として使用される。重みαは、予測のために使用される拡張レイヤの参照画像からの情報量を制御するパラメータである。一般的に、多数の参照フレームが使用される場合には、参照フレームは時刻t−1に対応する必要はない。これはPタイプのマクロブロックであり、基本レイヤ内の全ての係数は0であるため、現在ブロックのために再構成される基本レイヤは、(時刻t−1において)再構成された参照ブロックと全く同じであることに留意されたい。
基本レイヤブロック内に0でない係数があるとき、拡張レイヤ係数は、図4に示されるように、変換領域において処理される。基本レイヤにおいて0でなかった係数の場合、参照フレームからの拡張レイヤの寄与は加えられない。基本レイヤにおいて0値を有する係数の場合、ゼロブロックの場合と同じように重み付け平均が計算されるが、この時刻は変換領域内にある。こうして、付加的なステップが導入され、そのステップでは、参照差分ブロックD(t−1,n)において変換が実行され、結果として、変換係数FD(t−1,n)のブロックが生成される。これらの係数は、その後、現在ブロックFR(t,0)内の対応する位置にある基本レイヤ係数の値に応じてさらに調整される。対応する基本レイヤの現在ブロックの係数が0である係数も、0に設定されるのに対して、0でない基本レイヤの現在ブロックの係数に対応する係数は、重みβによってスケーリングされる。
FD’(t−1,n)=β×FD(t−1,n)
結果として生成された係数のブロックが、その後、逆変換されて、差分参照ブロックD’(t−1,n)が得られ、それが最終的には、基本レイヤ再構成に加えられて、参照ブロックP(t,n)が生成される。
P(t,n)=R(t,0)+D’(t−1,n)
このブロックは、その後、現在ブロックのFGSレイヤのための参照として使用される。
上記の設計は、拡張レイヤからさらに多くの情報を利用することによって改善される圧縮効率と、この過程によって悪化する予測ドリフトの制御との間のトレードオフに基づく。ピクセル/係数の場合にドリフトの影響はより小さく、基本レイヤが、参照フレームと現在フレームとの間で変化しないため、それらは、改善された参照を使用することができると論ぜられる。パラメータαは5ビットに量子化され、max_diff_ref_scale_for_zero_base_blockとしてスライスヘッダにおいて送信される。パラメータβも5ビットに量子化され、max_diff_ref_scale_for_zero_base_coeffとして同じ構造において送信される。それらの両方の存在は、adaptive_ref_fgs_flagによって制御される。
重み係数の使用に関するさらなる改良が定義される。全ての0のブロックをさらに分類するために、コンテクスト適応型2値算術符号器(CABAC)コーディングコンテクストが使用される。コンテクスト(context)が0でない場合には、それは、拡張レイヤ内でいくつかの隣接するブロックが0でない係数を有すること、それゆえ、現在ブロック内で係数が0でなくなる確率がより高いことを意味する。それゆえ、予測を形成するために使用される拡張レイヤ信号が少なくなるように、αの値が小さくされる。基本レイヤ内の0でない係数を有するブロックの場合、拡張レイヤ信号は、そのような係数が4つ以下であるときにのみ加えられ、βの値は、その数に応じて調整される。
Weipeng Li著「Overview of Fine Granularity Scalability in MPEG-4 Video Standard」(IEEE Transactions on Circuits and Systems for Video Technology, vol. 11, no. 3, March 2001) Han及びGirod著「Robust and Efficient Scalable Video Coding with Leaky Predicition」(IEEE International Conference on Image Processing 2002)
本発明は、既知の適応的参照細粒度スケーラビリティ符号器及び復号器を改善することを目指しており、一態様において、予測における成分の重み付けを調整するために入手可能なさらなる情報を利用することによって、これを果たす。
本発明によれば、画像シーケンス符号化/復号化の装置/方法が提供され、その装置/方法では、拡張レイヤ内の対応する参照ブロック係数が変化する確率を考慮に入れることによって、係数の分類が改善される。これは、参照スライスからビットを捨てることが予測不一致に与える影響が、拡張レイヤにおいて係数がほとんど又は全く変化しないエリア内よりも、多くの係数が変化するエリア内の方が大きいという観測結果に基づく。対応するプログレッシブ・リファインメントNALユニットがドロップされたか又は打ち切られたときに、参照ブロック拡張レイヤ係数が復号器で利用できないが、これは、ブロックが利用できるときのみに参照ブロック調整が実行されるため、問題を引き起こさない。したがって、提案される重み係数調整によって、付加的な予測不一致は導入されない。
品質スケーラブルビデオコーデックのブロック図である。 非適応的FGSにおける参照ブロック形成を示す図である。 全て0のブロックの場合の参照ブロック形成を示す図である。 0でないブロック内の0係数の場合の参照ブロック形成を示す図である。 一実施形態における判断プロセスのブロック図である。 一実施形態における16個の動きベクトルを有するマクロブロックを示す図である。
ここで、一例にすぎないが、添付の図面を参照しながら、本発明の実施形態が説明されることになる。
以下に述べられる実施形態は、説明される過程を実行するためのハードウエア、ソフトウエア、又はハードウエア及びソフトウエアの組み合わせを含むことができる。したがって、たとえば、データ記憶媒体(光学的なCD ROM、半導体ROM、磁気的な記録媒体等)に格納されているデータ、及び/又は、たとえば、遠隔データベースから、若しくはインターネットのような通信ネットワークによる伝送によって、若しくは空中を伝送することによって、プログラム可能な処理装置に入力される信号(たとえば、電気信号又は光信号)として、プログラム命令をプログラム可能な処理装置に供給することによって、実施形態を達成することができる。
符号器における参照ブロックの生成が以下に説明されるが、本発明の実施形態では、同じようにして復号器において参照フレームが生成される。
実施形態1
本発明の第1の実施形態は、パラメータα及びβの値を求めるための現在の技法を変更しない。代わりに、それらの値は、スライスのための初期値として取り扱われ、その実施形態は、参照ブロックの特性に応じて、ブロック毎に値を調整するためのさらなる処理を実行する。さらに厳密に言うと、参照ブロックが拡張レイヤにおいてほとんど(全く)変化しない係数を有するブロックの場合の拡張参照フレームの重み付けが大きくされる。逆に、この重み付けは、拡張レイヤにおいて多くの係数が変化するブロックの場合に、その初期値から小さくされる。
具体的な実施態様は以下のようになる。
基本レイヤにおいて全ての係数が0である場合、αの値は以下のように調整される。
1.参照ブロックの拡張レイヤ内の全ての係数が0である場合には、拡張レイヤ参照ブロックは基本レイヤの現在ブロックと同一であり、αの値は重要でない。これは、これらのブロックのための重み付け平均の計算を省略し、それによって複雑さを緩和することができるようにするため有用である。
2.同じことは、再構成されたピクセル値に与える係数変化の影響が0であるピクセルにも当てはまる。
3.参照ブロックの再構成されたサンプルの値が、拡張レイヤにおいて変化する。この場合、MPEG−4 SVCの現在の草案の場合と同じ公式が使用されるが、αの値は、再構成されたサンプルの大きさの変化に比例して変更される。
複雑さ(メモリ)要件(the complexity (memory) requirements)によっては、参照ブロック内のピクセルに与える係数拡張の影響を別個に考慮することは実用的でないことがある。その場合、事例2は、別個に取り扱われるのではなく、事例3の場合と同じようにして計算が実行される。同様に、事例3においてピクセル毎に重みを調整することは実用的でないことがある。その場合、再構成されたサンプル値の変化の平均的な大きさに基づいて、重みが調整される。
基本レイヤブロック内の全ての係数が0であるとは限らない場合、重みβは以下のように調整される。
1.上記の場合と同様に、参照ブロックの拡張レイヤ内の全ての係数が0である場合には、差分ブロックD(t−1,n)は0であり、基本レイヤ参照の調整は不要である。
2.参照ブロック拡張レイヤにおいて係数が変化する場合には、参照ブロックの重み付けが、差分ブロックFD(t−1,n)の対応する係数の値の変化に比例して小さくされる。
3.係数が変化しない場合には、参照ブロックの重み付けは変更されない。
上記の事例と同様に、計算の複雑さを抑える必要がある場合には、係数変化の平均的な大きさに基づいて、ブロック毎に重みβの調整を実行することができる。その処理は、いずれにしても係数毎に調整されるため、これは、上記の事例の場合ほど問題にはならないと予想される。
いずれの場合でも、重み係数に適切なクリッピングを適用して、それらの重み係数が確実に許容範囲内に入るようにする。特定の実施態様では、いずれの場合の調整も、適切な拡張レイヤ係数のピクセル値又は係数値の単位差当たり1/16のステップにおいて行なわれる。
上記の実施態様のための判断プロセスが、図5に示される。
上記の実施態様では、調整は参照ブロック拡張レイヤの変化の大きさに比例する。代替的な実施態様では、その関係は非線形であることがあり、所定のしきい値に達した場合に、適切な重み係数の値を0又は1に設定することを含む。
実施形態2
適応的参照FGS(adaptive-reference FGS)の別の態様は、第2の動き補償/予測ループの導入によって引き起こされる複雑さの増大である。代替的な実施態様では、重み付けされた予測の代わりに、基本レイヤと参照画像拡張レイヤとの間の選択のみが使用されるように、その設計は変更され、これは、所与のブロックの場合に、2つの動き補償過程のうちの一方しか呼び出す必要がないことを意味する。したがって、上記のように、差分参照ブロックD(t−1,n)及びD’(t−1,n)を計算する必要はない。代わりに、参照ブロックP(t,n)は、基本レイヤ参照ブロック内に0でない係数が存在するか否かに応じて、基本レイヤブロックR(t,0)又は拡張レイヤ参照ブロックR(t−1,n)のいずれかの単なるコピーである。より詳細には、参照ブロックP(t,n)は、基本レイヤ参照ブロック内の全ての係数が0である場合には、拡張レイヤ参照ブロックR(t−1,n)のコピーであり、基本レイヤ参照ブロック内の全ての係数が0であるとは限らない場合には、基本レイヤブロックR(t,0)のコピーである。
重みの量子化が粗くなることによって引き起こされる精度の損失を相殺するために、代替的な実施態様では、さらに細かく粒度が調整され、その重みは、スライス毎ではなくブロック毎に変更される。
一実施態様では、符号器及び復号器の両方でわかっている信号の特性に基づいて、重みが調整され、これは、マクロブロックレベルにおいて明示的なシグナリングが不要であることを意味する。
代替的な実施態様では、ビットストリームにおいてフラグが送信される。これは、必要とされる帯域幅において犠牲を払うが、効率的なエントロピーコーディングが利用される場合には、特にビットレートが高くなるほど、その犠牲はそれほど大きくなくなる。コーディング効率を改善するのを助けることに加えて、この変形形態によれば、「部分的な復号器リフレッシュ」も実施することができるようになる。すなわち、予測ドリフトの影響をマクロブロック毎に制御することができ、それによって、それがコーディング効率に与える影響を制限し、フレーム全体が低い圧縮効率で符号化されるときに感じられる視覚的な影響を特に低減する。
実施形態3
第3の実施形態では、その時点で処理されているブロックの近くにある動きフィールドの特性に基づいて、重みα及びβが適合される。具体的には、周囲ブロックの動きベクトルが、現在ブロックの動きベクトルと比較され、その間の差の指標(measure)に基づいて重みが調整される。一実施態様では、使用される指標は、現在ブロックの動きベクトルと周囲の動きベクトルとの差の大きさに基づく。この大きさは、現在の動きベクトルと周囲の動きベクトルとの差の二乗の平均として、すなわち以下の式に従って計算することができる。
Figure 2009543490
ただし、Nは考慮される周囲ブロックの数であり、vcは現在ブロックの動きベクトルであり、viはi番目の周囲ブロックの動きベクトルであり、x及びyは動きベクトルの成分を表す。差の他の指標を使用してもよい。一例は、上記のような公式に類似の公式であるが、総和において大きさの平方根が使用されている点が異なる。すなわち、以下の通りである。
Figure 2009543490
調整の量は、使用される差の指標の値に比例するように指定することができる。代替的に、差の指標の値に応じて調整の値のためのルップアップテーブルの指定を含む、非線形の依存性を指定することができる。ルックアップテーブルの具体的な例は以下のとおりである。
・M>64の場合には、6/32だけ重みを小さくする。
・そうではなく、M>32の場合には、重みを4/32だけ小さくする。
・そうではなく、M>16の場合には、重みを3/32だけ小さくする。
・そうではなく、M>8の場合には、重みを2/32だけ小さくする。
・そうではなく、M>0の場合には、重みを1/32だけ小さくする。
動きベクトルが送信されないとき(いわゆる、SKIPマクロブロックであり、動きベクトル又は変換係数が送信されず、前のフレームからのマクロブロックが単に繰り返しコピーされるとき)、上記で定義されたような差の指標を計算することはできない。これは、現在のマクロブロック位置において、前のフレームと現在のフレームとの間にほとんど変化がないことを示すため、この場合には、重みは変更しないでおくことができるか、又は大きくすることができる。
差の指標を計算する際に使用されることになる1組の周囲ブロックの選択は、複雑さの考慮、そのフレーム内の現在のマクロブロックの位置、及び現在のマクロブロック内の現在ブロックの位置による。
複雑さを制限するために、第1の実施態様は、差の指標を計算するための現在のマクロブロック内のブロックのみを使用する。マクロブロック内の動きベクトルの最大数は16個である(4×4ブロック毎に1つ)。その際、マクロブロック内のブロックの位置によって、マクロブロック内のブロックの位置によって、周囲ブロックの数は3個〜8個の間で変化する(上、左、右、下、左上、右上、左下及び右下)。これが図6に示されており、A、D、M及びPを付されたブロックは3個の利用可能な周囲ブロックを有し、B、C、E、H、I、L、N及びOは5個の利用可能な周囲ブロックを有し、F、G、J及びKはそれぞれ8個の利用可能な周囲ブロックを有する。16個よりも少ない動きベクトルが使用される事例も、動きベクトルが、対応する4×4ブロックの場合の対応する数(たとえば、4個)の動きベクトルであるかのように、さらに大きな(たとえば、8×8)ブロックに対応する動きベクトルをコピーし、取り扱うことによって、同じように取り扱うことができる。
第2の実施態様では、先行して処理されたマクロブロックのうちの全て又はいくつか(現在のマクロブロックの左上、上、右上及び左)からの情報も、差の指標を計算する際に使用される。これは、図6内のブロックA、B、C、D、E、I及びMのための差の指標を計算するために、付加的なブロックが利用することができるようになることを意味する。先行して処理された全てのマクロブロックが使用されると、ブロックA、B、C、E及びIは8個の利用可能な周囲ブロックを有し、ブロックDは6個の利用可能な周囲ブロックを有し、ブロックMは5個の利用可能な周囲ブロックを有する。
代替的な実施態様では、差の指標は、現在ブロックと、周囲ブロックのそれぞれとの間の距離を考慮するように調整される。たとえば、図6に示される1組のブロックを使用し、ブロックFを現在ブロックと見なすとき、ブロックB、E、G及びJは、ブロックA、C、I及びKよりも大きな重みで使用される。
簡単にした実施態様は、全マクロブロックに対して一度だけ距離の指標を計算し、その後、マクロブロック内の全てのブロックの場合に、この値を使用する。
変更形態
添付の特許請求の範囲内で、上記の実施形態に数多くの変更を加えることができる。
たとえば、代替的な実施形態では、重み付けパラメータの調整の値は、複数の要因の組み合わせに基づき、そのうちの1つが、上記の参照ブロック拡張レイヤ係数の値の変化である。これらの他の要因として、たとえば、マクロブロックタイプ及び予測モード、又は先行技術において記載されているような算術コーダコーディングコンテクスト(the arithmetic coder coding context)を使用することができる。より具体的には、それらの調整値を単に互いに加算して、全調整値を形成することができる。ただし、異なる要因からの調整値は異なる粒度を有することがある。
別の代替的な実施態様では、重み係数の変更の度合いはその初期値に依存する。より厳密には、重み係数の初期値が小さい場合には、その変化も小さく、初期値が大きくなるのに応じて、その変化も大きくすることができるようになる。これは、ドリフトをさらに良好に制御することができるようにするために行なわれる。ドリフトが問題である(たとえば、画像間の距離が長い)とき、変更の度合いを、さらに正確に制御することができるようにすることが、より重要である。より厳密には、そのような方式は、重みの初期値によって、その変化をスケーリングすることによって実施される。すなわち、重みα及びβを一定の量(たとえば、1/16)だけ変更する代わりに、それらの重みは、ビットストリーム要素max_diff_ref_scale_for_zero_base_block及びmax_diff_ref_scale_for_zero_base_coeffから得られる初期値に比例した量だけ変更され、たとえば、以下のとおりである。
α=(1+γ)α0
ただし、α0は重みの初期値であり、γは上記のような大きさの変化に基づく調整の度合いである。多数の要因からの調整値が組み合わせられる場合には、その公式は、たとえば、以下のように拡張することができる。
α=(1+γ)(1+δ)α0
ただし、γ及びδは、種々の要因、たとえば、拡張レイヤ係数の大きさ、算術コーダコーディングコンテクスト、又はマクロブロックタイプ及び予測モードに対応する寄与である。
これは、重み値の不均一な量子化の一例にすぎず、さらに一般的な方式も考えることができる。たとえば、ブロック変換係数の量子化において使用される量子化ステップが、ドリフト特性に大きな影響を与える。代替的な実施態様では、重みの調整の計算において、これが考慮に入れられる。
FGSレイヤの一部だけが復号器によって受信されるときに、FGSレイヤ内の全データ量の一部として入手可能であるデータの量がわかっているか又は推定される場合には、復号化の品質を改善することができる。その場合、最適な重み付けにさらに近づくように、重み値の調整の量をさらに調整することができる。

Claims (49)

  1. 改善された適応的参照細粒度スケーラビリティ符号化又は復号化方法であって、基本レイヤデータ及び差分データの重み付けされた組み合わせを使用して予測信号が形成され、重み付けの量が前記データの特性に依存する、改善された適応型参照細粒度スケーラビリティ符号化又は復号化方法。
  2. 前記重み付けは、前記拡張レイヤにおいて変化する係数の数に依存する、請求項1に記載の方法。
  3. 前記重み付けは、前記差分データ内の値の大きさに依存する、請求項1又は2に記載の方法。
  4. 前記差分データは、前記拡張レイヤ及び前記基本レイヤ内の参照ブロックデータ間の差を含む、請求項1〜3のいずれか一項に記載の方法。
  5. 前記差分データは、前記拡張レイヤ及び前記基本レイヤ内の参照ブロックデータ間の変換差を定義する変換係数を含む、請求項1〜3のいずれか一項に記載の方法。
  6. 適応的参照細粒度スケーラビリティ符号器又は復号器において拡張レイヤ予測データを生成する方法であって、
    スケーリングパラメータが前記拡張レイヤにおいて参照データ値が変化する確率に応じて設定されるように、前記スケーリングパラメータに従ってデータを合成することによって参照データを生成すること、及び
    前記生成された参照データに応じて前記予測データを生成すること、
    を含む、適応的参照細粒度スケーラビリティ符号器又は復号器において拡張レイヤ予測データを生成する方法。
  7. 適応的参照細粒度スケーラビリティ符号化又は復号化法であって、
    差分データと基本レイヤデータとを合成する場合に使用される重み係数を計算すること、
    前記差分データの大きさに応じて前記重み係数を調整すること、
    参照データを生成するために、前記調整された重み係数に応じて前記差分データ及び前記基本レイヤデータを合成すること、及び
    前記生成された参照データを使用して拡張レイヤ予測データを生成すること、
    を含む、適応的参照細粒度スケーラビリティ符号化又は復号化法。
  8. 前記重み係数は、前記差分データの大きさに線形に応じて調整される、請求項7に記載の方法。
  9. 前記重み係数は、該重み係数の調整されていない値と前記差分データの大きさとに応じた量だけ調整される、請求項7又は8に記載の方法。
  10. 前記重み係数は、前記差分データの大きさが増加するのに応じて増加する量だけ小さくされる、請求項7〜9のいずれか一項に記載の方法。
  11. 基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法であって、
    前記拡張レイヤデータは、参照データを前記基本レイヤデータと比較して予測誤差データを生成することによって生成され、
    前記参照データは、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    前記差分参照データ内の値の大きさを求めること、
    スケーリングされた差分参照データを生成するために、前記求められた大きさの値に応じて、前記差分参照データをスケーリングすること、及び
    前記スケーリングされた差分参照データを、基本レイヤの再構成されたデータと合成すること、
    によって生成される、基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法。
  12. 前記差分参照データをスケーリングするプロセスは、前記差分参照データ内の値の大きさに応じて設定される個々のスケーリングファクタによって各値をスケーリングすることを含む、請求項11に記載の方法。
  13. 前記差分参照データをスケーリングするプロセスは、前記差分参照データ内の複数の値の大きさの平均に応じて設定される1つのスケーリングファクタによって複数の値をスケーリングすることを含む、請求項11に記載の方法。
  14. 基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法であって、
    前記拡張レイヤデータは、参照データを前記基本レイヤデータと比較して予測誤差データを生成することによって生成され、
    前記参照データは、
    前記拡張レイヤ内の参照データの全ての値が0であるか否かを判断すること、
    前記値の全てが0ではない場合には、
    (i)差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    (ii)前記差分参照データをスケーリングすること、及び
    (iii)前記スケーリングされた差分参照データを基本レイヤの再構成されたデータと合成すること、
    前記値の全てが0である場合には、
    プロセス(i)、(ii)及び(iii)を省略し、前記基本レイヤからの参照データを使用すること、
    によって生成される、基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法。
  15. 基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法であって、
    前記拡張レイヤデータは、参照データを前記基本レイヤデータと比較して予測誤差データを生成することによって生成され、
    前記参照データは、
    0でない値と0である値とを識別するために、前記拡張レイヤ内の参照データの値を処理すること、
    0でない値のそれぞれの場合には、
    (i)差の値を生成するために、前記拡張レイヤ内の参照データ値と前記基本レイヤ内の参照データ内の対応する値との間の差を計算すること、
    (ii)前記差の値をスケーリングすること、及び
    (iii)前記スケーリングされた差の値を基本レイヤの再構成されたデータ内の対応する値と合成すること、
    0である値のそれぞれの場合には、
    プロセス(i)、(ii)及び(iii)を省略し、前記基本レイヤからの参照データを使用すること、
    によって生成される、基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法。
  16. 基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法であって、
    前記拡張レイヤデータは、参照データを前記基本レイヤデータと比較して予測誤差データを生成することによって生成され、
    前記参照データは、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    変換係数を生成するために、前記差分参照データを変換すること、
    前記変換係数の大きさを求めること、
    スケーリングされた変換係数を生成するために、前記求められた大きさの値に応じて前記変換係数をスケーリングすること、
    変更された差分参照データを得るために、前記スケーリングされた変換係数を逆変換すること、及び
    前記変更された差分参照データと、基本レイヤの再構成されたデータとを合成すること、
    によって生成される、基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法。
  17. 前記変換係数をスケーリングするプロセスは、前記変換係数の大きさに応じて設定される個々のスケーリングファクタによって各変換係数をスケーリングすることを含む、請求項16に記載の方法。
  18. 前記変換係数をスケーリングするプロセスは、複数の変換係数の大きさの平均に応じて設定される1つのスケーリングファクタによって複数の変換係数をスケーリングすることを含む、請求項16に記載の方法。
  19. 基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法であって、
    前記拡張レイヤデータは、参照データを前記基本レイヤデータと比較して予測誤差データを生成することによって生成され、
    前記参照データは、
    前記拡張レイヤ内の参照データの全ての値が0であるか否かを判断すること、
    前記値の全てが0ではない場合には、
    (i)差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    (ii)変換係数を生成するために、前記差分参照データを変換すること、
    (iii)前記変換係数をスケーリングすること、
    (iv)変更された差分参照データを得るために、前記スケーリングされた変換係数を逆変換すること、及び
    (v)前記変更された差分参照データを基本レイヤの再構成されたデータと合成すること、
    前記値の全てが0である場合には、
    プロセス(i)、(ii)、(iii)、(iv)及び(v)を省略し、前記基本レイヤからの参照データを使用すること、
    によって生成される、基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法。
  20. 適応的参照細粒度スケーラビリティ符号器又は復号器において拡張レイヤ予測データを生成する方法であって、
    基本レイヤの参照ブロック内に0でない係数が少しでも存在するか否かを判断すること、
    少なくとも1つの0でない係数が存在する場合には、前記拡張レイヤ予測データを生成するために、参照ブロックとして基本レイヤブロックを使用すること、
    0でない係数が存在しない場合には、前記拡張レイヤ予測データを生成するために、拡張レイヤ参照ブロックを使用すること、
    を含む、適応的参照細粒度スケーラビリティ符号器又は復号器において拡張レイヤ予測データを生成する方法。
  21. 改善された適応的参照細粒度スケーラビリティ符号化又は復号化法であって、
    予測信号が、基本レイヤデータ及び差分データの重み付けされた組み合わせを使用して生成され、重み付けの量は、その時点で処理されているブロックの近くにある動きフィールドの特性に依存する、改善された適応的参照細粒度スケーラビリティ符号化又は復号化法。
  22. 前記重み付けは前記動きフィールド内の差の大きさに依存する、請求項21に記載の方法。
  23. 前記差分データは、前記拡張レイヤ及び前記基本レイヤ内の参照ブロックデータ間の差を含む、請求項21又は22に記載の方法。
  24. 前記差分データは、前記拡張レイヤ及び前記基本レイヤ内の参照ブロックデータ間の変換差を定義する変換係数を含む、請求項21又は22に記載の方法。
  25. 適応的参照細粒度スケーラビリティ符号器又は復号器において拡張レイヤ予測データを生成する方法であって、
    現時点で処理されているブロックの動きベクトルと、少なくとも1つの周囲ブロックの動きベクトルとの間の差に応じてスケーリングパラメータが設定されるように、前記スケーリングパラメータに従ってデータを合成することによって参照データを生成すること、及び
    前記生成された参照データに応じて前記予測データを生成すること、
    を含む、適応的参照細粒度スケーラビリティ符号器又は復号器において拡張レイヤ予測データを生成する方法。
  26. 適応的参照細粒度スケーラビリティ符号化又は復号化法であって、
    差分データと基本レイヤデータとを合成する場合に使用される重み係数を計算すること、
    データのブロックの動きベクトルを複数の周囲ブロックの動きベクトルと比較することであって、その間の差を求める、比較すること、
    前記動きベクトル間の差に応じて前記重み係数を調整すること、
    参照データを生成するために、前記調整された重み係数に応じて前記差分データ及び前記基本レイヤデータを合成すること、並びに
    前記生成された参照データを使用して拡張レイヤ予測データを生成すること、
    によって、前記データのブロックを処理することを含む、適応的参照細粒度スケーラビリティ符号化又は復号化法。
  27. 前記重み係数は前記動きベクトル間の差に線形に応じて調整される、請求項26に記載の方法。
  28. 基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法であって、
    前記拡張レイヤデータは、参照データを前記基本レイヤデータと比較して予測誤差データを生成することによって生成され、
    前記参照データは、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    動きベクトルの差の指標を計算するために、現在ブロックの動きベクトルと、複数の周囲ブロックの動きベクトルとを比較すること、
    スケーリングされた差分参照データを生成するために、前記計算された動きベクトルの差の指標に応じて、前記差分参照データをスケーリングすること、及び
    前記スケーリングされた差分参照データを、前記基本レイヤの再構成されたデータと合成すること、
    によって生成される、基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法。
  29. 基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法であって、
    前記拡張レイヤデータは、参照データを前記基本レイヤデータと比較して予測誤差データを生成することによって生成され、
    前記参照データは、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    変換係数を生成するために、前記差分参照データを変換すること、
    動きベクトルの差の指標を計算するために、現在ブロックの動きベクトルと、複数の周囲ブロックの動きベクトルとを比較すること、
    スケーリングされた変換係数を生成するために、前記計算された動きベクトルの差の指標に応じて、前記変換係数をスケーリングすること、
    変更された差分参照データを得るために、前記スケーリングされた変換係数を逆変換すること、及び
    前記変更された差分参照データと、基本レイヤの再構成されたデータとを合成すること、
    によって生成される、基本レイヤデータ及び拡張レイヤデータに従って画像のシーケンスを符号化又は復号化する方法。
  30. 前記動きベクトルを比較するプロセスは、現時点で処理されているブロックの動きベクトルを、同じマクロブロック内の周囲ブロックの動きベクトルと比較することを含む、請求項28又は29に記載の方法。
  31. 前記動きベクトルを比較するプロセスは、現時点で処理されているブロックの動きベクトルを、同じマクロブロック内の周囲ブロックの動きベクトル、及びさらに先行して処理された少なくとも1つのマクロブロックの動きベクトルと比較することを含む、請求項30に記載の方法。
  32. 現時点で処理されているブロックと周囲ブロックとの間の距離の指標に応じて、該現時点で処理されているブロックの動きベクトルと、該周囲ブロックのそれぞれの動きベクトルとの間の差を重み付けすることをさらに含む、請求項28〜31のいずれか一項に記載の方法。
  33. 前記動きベクトル間の差は、その間の距離が小さいブロック間の動きベクトル差の方が、その間の距離が大きなブロックの動きベクトル間の差よりも、前記動きベクトルの差の指標に対してより寄与するように重み付けされる、請求項32に記載の方法。
  34. 請求項1〜33の少なくとも一項に記載されるような方法を実行するように動作することができるようになるように、プログラム可能な処理装置をプログラムするコンピュータプログラム命令を格納する、記憶媒体。
  35. 請求項1〜33の少なくとも一項に記載されるような方法を実行するように動作することができるようになるように、プログラム可能な処理装置をプログラムするコンピュータプログラム命令を搬送する、信号。
  36. 改善された適応的参照細粒度スケーラビリティ符号器又は復号器であって、基本レイヤデータと差分データとの重み付けされた組み合わせを使用して予測信号を生成する手段を備え、重み付けの量は前記データの特性に依存する、改善された適応的参照細粒度スケーラビリティ符号器又は復号器。
  37. 適応的参照細粒度スケーラビリティ符号器又は復号器であって、
    前記拡張レイヤにおいて参照データ値が変化する確率に応じてスケーリングパラメータが設定されるように、前記スケーリングパラメータに従ってデータを合成することによって参照データを生成する手段と、
    前記生成された参照データに応じて前記予測データを生成する手段と、
    を備える、拡張レイヤ予測データを生成する手段を有する、適応的参照細粒度スケーラビリティ符号器又は復号器。
  38. 適応的参照細粒度スケーラビリティ符号器又は復号器であって、
    差分データと基本レイヤデータとを合成する場合に使用される重み係数を計算する手段と、
    前記差分データの大きさに応じて前記重み係数を調整する手段と、
    参照データを生成するために、前記調整された重み係数に応じて前記差分データ及び前記基本レイヤデータを合成する手段と、
    前記生成された参照データを使用して拡張レイヤ予測データを生成する手段と、
    を備える、適応的参照細粒度スケーラビリティ符号器又は復号器。
  39. 基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器であって、
    参照データ生成手段であって、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算する手段と、
    前記差分参照データ内の値の大きさを求める手段と、
    スケーリングされた差分参照データを生成するために、前記求められた大きさの値に応じて前記差分参照データをスケーリングする手段と、
    前記スケーリングされた差分参照データを基本レイヤの再構成されたデータと合成する手段と、
    を備える、参照データ生成手段と、
    前記参照データ生成手段によって生成される参照データと前記基本レイヤデータとを比較して予測誤差データを生成することによって、前記拡張レイヤデータを生成する手段と、
    を備える、基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器。
  40. 基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器であって、
    前記拡張レイヤ内の参照データの値が全て0であるか否かを判断すること、
    前記値の全てが0ではない場合には、
    (i)差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    (ii)前記差分参照データをスケーリングすること、及び
    (iii)前記スケーリングされた差分参照データを基本レイヤの再構成されたデータと合成すること、
    前記値の全てが0である場合には、
    プロセス(i)、(ii)及び(iii)を省略し、前記基本レイヤからの参照データを使用すること、
    によって、参照データを生成するように動作することができる参照データ生成手段と、
    前記参照データ生成手段によって生成される参照データと前記基本レイヤデータとを比較して予測誤差データを生成することによって、前記拡張レイヤデータを生成する手段と、
    を備える、基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器。
  41. 基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器であって、
    0でない値と0である値とを識別するために、前記拡張レイヤ内の参照データの値を処理すること、
    0でない値のそれぞれの場合には、
    (i)差の値を生成するために、前記拡張レイヤ内の参照データ値と前記基本レイヤ内の参照データ内の対応する値との間の差を計算すること、
    (ii)前記差の値をスケーリングすること、及び
    (iii)前記スケーリングされた差の値を基本レイヤの再構成されたデータ内の対応する値と合成すること、
    0である値のそれぞれの場合には、
    プロセス(i)、(ii)及び(iii)を省略し、前記基本レイヤからの参照データを使用すること、
    によって、参照データを生成するように動作することができる参照データ生成手段と、
    前記参照データ生成手段によって生成される参照データと前記基本レイヤデータとを比較して予測誤差データを生成することによって、前記拡張レイヤデータを生成する手段と、
    を備える、基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器。
  42. 基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器であって、
    参照データ生成手段であって、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算する手段と、
    変換係数を生成するために、前記差分参照データを変換する手段と、
    前記変換係数の大きさを求める手段と、
    スケーリングされた変換係数を生成するために、前記求められた大きさの値に応じて前記変換係数をスケーリングする手段と、
    変更された差分参照データを得るために、前記スケーリングされた変換係数を逆変換する手段と、
    前記変更された差分参照データを基本レイヤの再構成されたデータと合成する手段と、
    を備える、参照データ生成手段と、
    前記参照データ生成手段によって生成される参照データと前記基本レイヤデータとを比較して予測誤差データを生成することによって、前記拡張レイヤデータを生成する手段と、
    を備える、基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器。
  43. 基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器であって、
    前記拡張レイヤ内の参照データの値が全て0であるか否かを判断すること、
    前記値の全てが0ではない場合には、
    (i)差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算すること、
    (ii)変換係数を生成するために、前記差分参照データを変換すること、
    (iii)前記変換係数をスケーリングすること、
    (iv)変更された差分参照データを得るために、前記スケーリングされた変換係数を逆変換すること、及び
    (v)前記変更された差分参照データを前記基本レイヤの再構成されたデータと合成すること、
    前記値の全てが0である場合には、
    プロセス(i)、(ii)、(iii)、(iv)及び(v)を省略し、前記基本レイヤからの参照データを使用すること、
    によって参照データを生成するように動作することができる参照データ生成手段と、
    前記参照データ生成手段によって生成される参照データと前記基本レイヤデータとを比較して予測誤差データを生成することによって、前記拡張レイヤデータを生成する手段と、
    を備える、基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器。
  44. 適応的参照細粒度スケーラビリティ符号器又は復号器であって、
    基本レイヤの参照ブロック内に0でない係数が少しでも存在するか否かを判断すること、
    少なくとも1つの0でない係数が存在する場合には、拡張レイヤ予測データを生成するために、参照ブロックとして基本レイヤブロックを使用すること、
    0でない係数が存在しない場合には、前記拡張レイヤ予測データを生成するために、拡張レイヤ参照ブロックを使用すること、
    によって、
    該拡張レイヤ予測データを生成するように動作することができる拡張レイヤ予測データ生成手段を有する、適応的参照細粒度スケーラビリティ符号器又は復号器。
  45. 改善された適応的参照細粒度スケーラビリティ符号器又は復号器であって、
    基本レイヤデータ及び差分データの重み付けされた組み合わせを使用して予測信号を生成する手段を備え、
    重み付けの量は、その時点で処理されているブロックの近くにある動きフィールドの特性に依存する、改善された適応的参照細粒度スケーラビリティ符号器又は復号器。
  46. 適応的参照細粒度スケーラビリティ符号器又は復号器であって、拡張レイヤ予測データを生成する手段を有し、該手段は、
    現時点で処理されているブロックの動きベクトルと少なくとも1つの周囲ブロックの動きベクトルとの間の差に応じてスケーリングパラメータが設定されるように、前記スケーリングパラメータに従ってデータを合成することによって参照データを生成する手段と、
    前記生成された参照データに応じて前記予測データを生成する手段と、
    を備える、適応的参照細粒度スケーラビリティ符号器又は復号器。
  47. 適応的参照細粒度スケーラビリティ符号器又は復号器であって、
    差分データと基本レイヤデータとを合成する場合に使用される重み係数を計算する手段と、
    1つのブロックの動きベクトルを複数の周囲ブロックの動きベクトルと比較する手段であって、その間の差を求める、比較する手段と、
    前記動きベクトル間の差に応じて前記重み係数を調整する手段と、
    参照データを生成するために、前記調整された重み係数に応じて前記差分データ及び前記基本レイヤデータを合成する手段と、
    前記生成された参照データを使用して拡張レイヤ予測データを生成する手段と、
    を備える、適応的参照細粒度スケーラビリティ符号器又は復号器。
  48. 基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器であって、
    参照データ生成手段であって、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算する手段と、
    動きベクトルの差の指標を計算するために、現在ブロックの動きベクトルと、複数の周囲ブロックの動きベクトルとを比較する手段と、
    スケーリングされた差分参照データを生成するために、前記計算された動きベクトルの差の指標に応じて、前記差分参照データをスケーリングする手段と、
    前記スケーリングされた差分参照データを基本レイヤの再構成されたデータと合成する手段と、
    を備える、参照データ生成手段と、
    前記参照データ生成手段によって生成される参照データと前記基本レイヤデータとを比較して予測誤差データを生成することによって、前記拡張レイヤデータを生成する手段と、
    を備える、基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器。
  49. 基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器であって、
    参照データ生成手段であって、
    差分参照データを生成するために、前記拡張レイヤ内の参照データと前記基本レイヤ内の参照データとの間の差を計算する手段と、
    変換係数を生成するために、前記差分参照データを変換する手段と、
    動きベクトルの差の指標を計算するために、現在ブロックの動きベクトルと、複数の周囲ブロックの動きベクトルとを比較する手段と、
    スケーリングされた変換係数を生成するために、前記計算された動きベクトルの差の指標に応じて前記変換係数をスケーリングする手段と、
    変更された差分参照データを得るために、前記スケーリングされた変換係数を逆変換する手段と、
    前記変更された差分参照データを基本レイヤの再構成されたデータと合成する手段と、
    を備える、参照データ生成手段と、
    前記参照データ生成手段によって生成される参照データと前記基本レイヤデータとを比較して予測誤差データを生成することによって、前記拡張レイヤデータを生成する手段と、
    を備える、基本レイヤデータ及び拡張レイヤデータに応じて画像のシーケンスを符号化又は復号化するための符号器又は復号器。
JP2009518877A 2006-07-10 2007-07-10 画像符号化及び復号化 Pending JP2009543490A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0613675A GB2440004A (en) 2006-07-10 2006-07-10 Fine granularity scalability encoding using a prediction signal formed using a weighted combination of the base layer and difference data
PCT/EP2007/057040 WO2008006829A2 (en) 2006-07-10 2007-07-10 Fine granular scalable image encoding and decoding

Publications (1)

Publication Number Publication Date
JP2009543490A true JP2009543490A (ja) 2009-12-03

Family

ID=36926762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009518877A Pending JP2009543490A (ja) 2006-07-10 2007-07-10 画像符号化及び復号化

Country Status (6)

Country Link
US (1) US20090252229A1 (ja)
EP (1) EP2047685A2 (ja)
JP (1) JP2009543490A (ja)
CN (1) CN101548549A (ja)
GB (1) GB2440004A (ja)
WO (1) WO2008006829A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014058177A1 (ko) * 2012-10-08 2014-04-17 삼성전자 주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
JP2015514362A (ja) * 2012-03-22 2015-05-18 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオ・コーディングのためのインタ・レイヤ・テクスチャ予測
JP2016501483A (ja) * 2012-11-21 2016-01-18 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオコーディングにおけるhevc拡張用の多重レイヤの低複雑度サポート

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080013624A1 (en) * 2006-07-14 2008-01-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding video signal of fgs layer by reordering transform coefficients
US20080013623A1 (en) * 2006-07-17 2008-01-17 Nokia Corporation Scalable video coding and decoding
EP2154893A1 (en) * 2008-08-13 2010-02-17 Thomson Licensing Method for modifying a reference block of a reference image, method for encoding or decoding a block of an image by help of a reference block and device therefor and storage medium or signal carrying a block encoded by help of a modified reference block
WO2010032636A1 (ja) * 2008-09-17 2010-03-25 シャープ株式会社 スケーラブルビデオストリーム復号装置およびスケーラブルビデオストリーム生成装置
JP5446198B2 (ja) * 2008-10-03 2014-03-19 富士通株式会社 画像予測装置及び方法、画像符号化装置、画像復号化装置
GB2486692B (en) * 2010-12-22 2014-04-16 Canon Kk Method for encoding a video sequence and associated encoding device
GB2492396A (en) * 2011-06-30 2013-01-02 Canon Kk Decoding a Scalable Video Bit-Stream
WO2013147495A1 (ko) * 2012-03-26 2013-10-03 엘지전자 주식회사 스케일러블 비디오 인코딩/디코딩 방법 및 장치
US9854259B2 (en) 2012-07-09 2017-12-26 Qualcomm Incorporated Smoothing of difference reference picture
CN104104957B (zh) * 2013-04-08 2018-03-16 华为技术有限公司 解码方法、编码方法、解码装置和编码装置
FR3029055B1 (fr) * 2014-11-24 2017-01-13 Ateme Procede d'encodage d'image et equipement pour la mise en oeuvre du procede
KR102379182B1 (ko) * 2015-11-20 2022-03-24 삼성전자주식회사 연속 데이터 압축 장치 및 방법
KR102331933B1 (ko) 2016-05-12 2021-11-29 엘지전자 주식회사 계수 유도 복원을 이용하여 비디오 신호를 처리하는 방법 및 장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6480547B1 (en) * 1999-10-15 2002-11-12 Koninklijke Philips Electronics N.V. System and method for encoding and decoding the residual signal for fine granular scalable video
US6904092B2 (en) * 2002-02-21 2005-06-07 Koninklijke Philips Electronics N.V. Minimizing drift in motion-compensation fine granular scalable structures
US20050201462A1 (en) * 2004-03-09 2005-09-15 Nokia Corporation Method and device for motion estimation in scalable video editing
RU2411686C2 (ru) * 2005-07-21 2011-02-10 Томсон Лайсенсинг Способ и устройство взвешенного прогнозирования для масштабируемого видеокодирования
CN101288311B (zh) * 2005-10-12 2011-05-11 汤姆森特许公司 用于可分级视频编码和解码中的加权预测的方法和装置
JP4565392B2 (ja) * 2005-12-22 2010-10-20 日本ビクター株式会社 映像信号階層復号化装置、映像信号階層復号化方法、及び映像信号階層復号化プログラム
CN101416513A (zh) * 2006-01-09 2009-04-22 诺基亚公司 具有运动补偿的用于低复杂性精细粒度可伸缩视频编码的系统和装置
KR20070077059A (ko) * 2006-01-19 2007-07-25 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015514362A (ja) * 2012-03-22 2015-05-18 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオ・コーディングのためのインタ・レイヤ・テクスチャ予測
WO2014058177A1 (ko) * 2012-10-08 2014-04-17 삼성전자 주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
JP2016501483A (ja) * 2012-11-21 2016-01-18 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオコーディングにおけるhevc拡張用の多重レイヤの低複雑度サポート
US10097825B2 (en) 2012-11-21 2018-10-09 Qualcomm Incorporated Restricting inter-layer prediction based on a maximum number of motion-compensated layers in high efficiency video coding (HEVC) extensions

Also Published As

Publication number Publication date
GB0613675D0 (en) 2006-08-16
EP2047685A2 (en) 2009-04-15
CN101548549A (zh) 2009-09-30
WO2008006829A3 (en) 2009-03-05
US20090252229A1 (en) 2009-10-08
GB2440004A (en) 2008-01-16
WO2008006829A2 (en) 2008-01-17

Similar Documents

Publication Publication Date Title
JP2009543490A (ja) 画像符号化及び復号化
KR101044934B1 (ko) 움직임 벡터 추정방법 및 부호화 모드 결정방법
EP0883299B1 (en) Apparatus and method for coding and decoding video images
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
JP5300921B2 (ja) 符号化および復号のための方法および装置
US20120219060A1 (en) System and method for scalable encoding and decoding of multimedia data using multiple layers
US20060280372A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
EP1715693A2 (en) Method and apparatus for adaptively selecting context model for entropy coding
EP2001242A9 (en) Error control system, method, encoder and decoder for video coding
KR20070038396A (ko) 영상 신호의 인코딩 및 디코딩 방법
KR20050091369A (ko) 동영상 트랜스코딩 방법 및 그 장치, 이에 사용되는움직임 벡터 보간방법
JP2004520770A (ja) Fgsエンハンスメント層に対しアクティビティをベースとする周波数重み付けをする方法及びシステム
KR20060122671A (ko) 영상 신호의 스케일러블 인코딩 및 디코딩 방법
GB2509998A (en) Providing a prediction mode for image encoding based on a first set of most probable modes (MPMs) and a selected second, restricted number of prediction modes
JP2007266749A (ja) 符号化方法
EP2051525A1 (en) Bandwidth and content dependent transmission of scalable video layers
JP2011519220A (ja) 符号化及び復号化方法、コーダ及びデコーダ
KR20050012782A (ko) 코딩 중에 이미지 선명도를 최적화하기 위한 방법과 시스템
EP2372922A1 (en) System and method for transcoding between scalable and non-scalable video codecs
US20060133483A1 (en) Method for encoding and decoding video signal
JP2007266748A (ja) 符号化方法
JP7274427B2 (ja) 少なくとも1つの画像を表すデータストリームを符号化及び復号する方法及びデバイス
JP4775132B2 (ja) 画像理装置および方法、プログラム、並びに記録媒体
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
Macnicol et al. Scalable video coding by stream morphing