JP2008541502A - 動き及び予測の重み付けパラメータを符号化する方法及び装置 - Google Patents
動き及び予測の重み付けパラメータを符号化する方法及び装置 Download PDFInfo
- Publication number
- JP2008541502A JP2008541502A JP2008508011A JP2008508011A JP2008541502A JP 2008541502 A JP2008541502 A JP 2008541502A JP 2008508011 A JP2008508011 A JP 2008508011A JP 2008508011 A JP2008508011 A JP 2008508011A JP 2008541502 A JP2008541502 A JP 2008541502A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- weighting
- weighting parameters
- parameters
- transformed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000005192 partition Methods 0.000 claims abstract description 49
- 239000013598 vector Substances 0.000 claims description 13
- 238000013139 quantization Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 60
- 230000008569 process Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 12
- 238000006073 displacement reaction Methods 0.000 description 11
- 230000002457 bidirectional effect Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000000844 transformation Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 208000018375 cerebral sinovenous thrombosis Diseases 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101150039623 Clip1 gene Proteins 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
符号化及び/又は復号のための方法及び装置を開示する。一実施形態においては、符号化方法は、複数仮説パーティションの重み付けパラメータを生成するステップと、重み付けパラメータを変換するステップと、変換された重み付けパラメータを符号化するステップと、を含んでいる。
【選択図】 図2
【選択図】 図2
Description
[0001]本特許出願は、「動き及び予測の重み付けパラメータを符号化する方法及び装置(Method And Apparatus For Coding Motion and Prediction Weighting Parameters)」と題して2005年5月26日に出願された対応の仮特許出願第60/685,261号の優先権を主張するものであり、当該仮特許出願を参照することによって本明細書に援用するものである。
[0002]本発明は、ビデオの符号化及び復号に関するものであり、より詳細には、本発明は、動き及び予測の重み付けパラメータの符号化に関するものである。
[0003]動き補償(フレーム間)予測は、符号化効率の面において相当な恩恵をもたらすことができるために、MPEG2−1/2やH.264(又はJVT或いはMPEG AVC)等のビデオ符号化方式及びビデオ符号化規格における極めて重要な要素となっている。しかしながら最近まで、これら規格の殆どにおいては、主として、それだけでは無い場合にも、時間的変位を考慮することによって動き補償を行っている。より具体的には、MPEG−1、2やMPEG−4等の規格では、フレーム間予測において2種類のピクチャタイプ、すなわち予測(P)ピクチャと双方向予測(B)ピクチャを考慮する。そのようなピクチャは、互いに重ならないブロックのセットに分割され、ブロックのそれぞれに動きパラメータのセットが関連付けられる。Pピクチャの場合、動きパラメータは、基準ブロックに対する現在のブロックI(x,y)の水平変位及び垂直変位に限られており、I(x,y)を予測するために使用する第2のブロックI(x’,y’)のポジションを示している。図1Aは、Pピクチャにおける動き補償の例を示している。しかしながら、Bピクチャの場合、基準からの変位の代わりに、又はこれに加えて、第2の基準からの水平変位及び垂直変位を考慮する。図1Bは、Bピクチャにおける動き補償の例を示している。Bピクチャの場合、基本的には、これら二つの基準からの予測の双方を、等しい重み付け係数(1/2,1/2)を使用して平均することによって、予測を生成する。
[0004]しかしながら、上記のモデルは、時間的な明度の変動(例:フェード、クロスフェード、フラッシュ、カメラ絞り調節等)が含まれるビデオシーンには十分ではない。すなわち、単純な並進のみのフレーム間手法では、時間的な明度の変化を伴うときに符号化効率を十分に高めることができない。この目的のために、動き補償時に輝度変動も考慮する幾つかの方法が過去に提案されている。Kamikura等による「ビデオ符号化におけるグローバルな明度変動補償(Global Brightness−Variation Compensation for Video Coding)」(IEEE Trans on CSVT、vol.8、p.988〜1000、1998年12月)、Rodrigues等による「空間変換及び輝度変換を用いた階層的な動き補償(Hierarchical Motion Compensation with Spatial and Luminance Transformations)」(ICIP、p.518〜521、2001年10月)、Rodrigues等による「空間変換及び輝度変換を用いた低ビットレートのビデオ符号化(Low−Bit Rate Video Coding with Spatial and Luminance Transformations)」(ConfTele2001、Figueira da Foz、2001年4月22〜24日)、J.Boyceによる「ビデオ符号化規格H.264/MPEG4 AVCにおける重み付け予測(Weighted Prediction in the H.264/MPEG4 AVC Video Coding Standard)」(ISCAS、p.789〜792、2004年5月)を参照されたい。
[0005]より具体的には、動き補償時に幾何学的変換のみを考慮するのではなく、予測された信号が、二つの新しいパラメータw及びoを使用して、スケーリング及び/又は調整される。時刻t、ポジション(x,y)における明度値I(x,y,t)をもつサンプルは、基本的にw*I(x+dx,y+dy,t’)+oとして構築される。ここで、dx及びdyは空間変位パラメータ(動きベクトル)である。しかしながら、これらの新しい重み付けパラメータによって、動き情報を表すために必要なオーバーヘッドビットが相当に増大することがあり、従って、そのような方式の恩恵が減少することがある。この目的のために、Kamikura等は、「ビデオ符号化におけるグローバルな明度変動補償(Global Brightness− Variation Compensation for Video Coding)」(IEEE Trans on CSVT、vol.8、p.988〜1000、1998年12月)の中で、殆どの輝度変化がグローバルに起こるものと仮定することによって、各フレームに対して1組のグローバルパラメータ(w,o)のみを使用することを提案している。これらパラメータの使用又は不使用についてもブロックレベルにて伝え、これによって、局所的な明度変動が存在するときに幾つかの更なる恩恵を提供している。
[0006]いくぶん類似する方式がH.264においても採用されている。しかしながら、H.264規格では、明度変動を更に深く利用することのできる幾つかの別の特徴もサポートしている。具体的には、コーデックは、複数の基準を考慮できるのみならず、複数の基準の再順序付けを行う(reordering)ことができ、これにより、基準のそれぞれに複数の重みを関連付けて局所的な明度変動を良好に扱うことができる。オプションとして、双方向予測パーティションの重みは、時間的距離、より正確には各ピクチャに関連付けられるピクチャ順序カウント距離(picture order count distance)を考慮することによって、暗黙的に導くこともできる。一方で、Rodrigues等による「空間変換及び輝度変換を用いた階層的な動き補償(Hierarchical Motion Compensation with Spatial and Luminance Transformations)」(ICIP、p.518〜521、2001年10月)及びRodrigues等による「空間変換及び輝度変換を用いた低ビットレートのビデオ符号化(Low−Bit Rate Video Coding with Spatial and Luminance Transformations)」(ConfTele2001、Figueira da Foz、2001年4月22−24日)においては、オプションとして、ビットのオーバーヘッドをいくらか制約するために、量子化の後、階層構造を使用して重みを伝える。しかしながら、この方法は、Pフレーム内で重み付け予測を考慮しているにすぎず、双方向予測については考慮されていない。
[0007]これらの手法では、重み付けパラメータがブロックレベルで考慮されており、これにより局所的な明度変動が良好に扱われるが、双方向予測の動き補償と、これらのパラメータを効率的に符号化する方法は、特に考慮されていない。これらの論文では、並進のみに基づく予測に対して、輝度変換を更に使用した場合に予測の平均二乗誤差が向上することによる恩恵を主眼としており、パラメータの符号化については深く考慮していない。
[0008]ビデオ圧縮規格ITU−H.264(又はJVT或いはISO MPEG4 AVC)では、時間的な明度変動を利用してパフォーマンスを向上させることのできる重み付け予測ツールを採用している。ビデオ符号化規格H.264は、動き補償予測に重み付け予測(WP)を採用した最初のビデオ圧縮規格である。
[0009]動き補償予測は、複数の基準ピクチャを考慮することができ、この場合に、複数の基準ピクチャのうち使用するピクチャを示す基準ピクチャインデックスが符号化される。Pピクチャ(又はPスライス)においては、片方向予測のみを使用し、使用可能な基準ピクチャをリスト0において管理する。Bピクチャ(又はBスライス)においては、二つの個別の基準ピクチャリスト(リスト0及びリスト1)が管理される。Bピクチャ(又はBスライス)においては、リスト0又はリスト1のいずれかを使用しての片方向予測、或いは、リスト0及びリスト1の双方を使用しての双方向予測を行うことができる。双方向予測を使用するときには、リスト0の予測情報(predictor)とリスト1の予測情報とを平均し、最終的な予測情報を形成する。H.264の重み付け予測ツールでは、Pピクチャ及びBピクチャの双方において、任意の乗算重み付け係数と加算オフセットとを基準ピクチャ予測に適用することができる。重み付け予測の使用は、Pスライス及びSPスライスに設定されるシーケンスパラメータにおいて示される。重み付け予測モードには、Pスライス、SPスライス、Bスライスにおいてサポートされる明示モードと、Bスライスのみにおいてサポートされる暗黙モードの2種類が存在する。
[0010]明示モードにおいては、重み付け予測パラメータが、スライスヘッダにおいて符号化される。色成分それぞれの乗算重み付け係数及び加算オフセットは、Pスライスのリスト0と、Bスライスのリスト0及びリスト1において、使用可能な基準ピクチャのそれぞれについて、符号化することができる。しかしながら、この構文では、同じ基準ピクチャストアから予測するときにも、同じピクチャ内の異なるブロックが異なる重み付け係数を使用することもできる。これは、再順序付けコマンドを使用して、複数の基準ピクチャインデックスを特定の基準ピクチャストアに関連付けることによって可能になる。
[0011]片方向予測に使用される重み付けパラメータと同じ重み付けパラメータが、双方向予測用に組み合わせて使用される。各マクロブロック、又は各マクロブロックパーティションのサンプル用の最終的なフレーム間予測(inter prediction)は、使用される予測タイプに基づいて生成される。リスト0からの片方向予測の場合、
であり、リスト1からの片方向予測の場合、
であり、双方向予測の場合は、
である。これらの式において、Clip1()は、サンプル値を範囲[0,1<<SampleBitDepth−1]内にクリッピングする演算子であり、SampleBitDepthは現在のサンプルに関連するビットの数であり、W0及びO0は、リスト0における現在の基準に関連する重み付け係数及びオフセットであり、W1及びO1は、リスト1における現在の基準に関連する重み付け係数及びオフセットであり、LWDは、対数重み分母丸め係数(log weight denominator rounding factor)であって本質的には重み付け係数量子化器の役割を果たすものである。SampleP0及びSampleP1は、リスト0及びリスト1の初期予測情報サンプルであり、SamplePは、重み付け予測された最終的なサンプルである。
であり、リスト1からの片方向予測の場合、
であり、双方向予測の場合は、
である。これらの式において、Clip1()は、サンプル値を範囲[0,1<<SampleBitDepth−1]内にクリッピングする演算子であり、SampleBitDepthは現在のサンプルに関連するビットの数であり、W0及びO0は、リスト0における現在の基準に関連する重み付け係数及びオフセットであり、W1及びO1は、リスト1における現在の基準に関連する重み付け係数及びオフセットであり、LWDは、対数重み分母丸め係数(log weight denominator rounding factor)であって本質的には重み付け係数量子化器の役割を果たすものである。SampleP0及びSampleP1は、リスト0及びリスト1の初期予測情報サンプルであり、SamplePは、重み付け予測された最終的なサンプルである。
[0012]暗黙的な重み付け予測モードにおいては、重み付け係数はスライスヘッダにおいて明示的に伝送されず、代わりに、現在のピクチャとその基準ピクチャとの間の相対距離に基づいて導出される。このモードは、Bスライス内のマクロブロック及びマクロブロックパーティションに対してのみ使用され、これらブロック及びパーティションには、直接モードを使用するものが含まれる。先の明示モードのセクションに示した双方向予測の式と同じ式を使用するが、相違点として、オフセット値O0及びO1がゼロであり、重み付け係数W0及びW1が、次式を用いて導かれる。
これは、
を、除算のない安全な16ビット演算としたものである。上式において、TDD及びTDBは、それぞれ、リスト0の基準ピクチャに対するリスト1の基準ピクチャの時間的距離と、リスト0の基準ピクチャに対する現在のピクチャの時間的距離(いずれも範囲[−128,127]内に限定されている)である。
これは、
を、除算のない安全な16ビット演算としたものである。上式において、TDD及びTDBは、それぞれ、リスト0の基準ピクチャに対するリスト1の基準ピクチャの時間的距離と、リスト0の基準ピクチャに対する現在のピクチャの時間的距離(いずれも範囲[−128,127]内に限定されている)である。
[0013]ビデオ符号化規格H.264では、動き補償において複数の重みを使用することができるが、この規格では、スライスレベルにおいて各リストについて伝えることのできる基準が最大16個であるため、複数の重みの使用は相当に制限される。このことは、考慮することのできる重み付け係数の数が限られることを意味する。この制限が課されなくても、ピクチャの符号化に必要となりうる全ての重み付けパラメータを伝えることは、困難ではないにせよ非効率的となる可能性がある。H.264においては、各基準の重み付けパラメータを、予測メカニズムを考慮せずに独立して符号化するが、基準のインデックスを伝えるための追加のオーバーヘッドも大きくなり得ることに留意されたい。従って、H.264と、Kamikura等による「ビデオ符号化におけるグローバルな明度変動補償(Global Brightness− Variation Compensation for Video Coding)」(IEEE Trans on CSVT、vol.8、p.988〜1000、1998年12月)に開示されている方法は、局所的な明度変動に対してよりも、グローバルな明度変動に対して、より適している。言い換えれば、これらのツールは、グローバルな明度変動の場合に良好に機能する傾向にあるが、特定の制限に起因して、大きな局所的明度変動が存在するときに達成できる利益は僅かである。
[0014]符号化及び/又は復号を行う方法及び装置を開示する。一実施形態においては、本符号化方法は、複数仮説(multi−hypothesis)パーティションの重み付けパラメータを生成するステップと、重み付けパラメータを変換するステップと、変換された重み付けパラメータを符号化するステップと、を含んでいる。
[0015]以下の詳細な説明と、本発明の様々な実施形態の添付の図面とから、本発明が更に完全に理解されるであろう。しかしながら、これらの実施形態は、本発明をそれら特定の実施形態に制限するものではなく、説明及び理解のみを目的としているものと解釈されたい。
[0030]ビデオ符号化アーキテクチャの双方向予測(又は複数仮説予測)パーティションにおける重み付けパラメータを符号化する効率的な符号化方式を開示する。この符号化方式は、ビデオ符号化システムのパフォーマンスを高めるものであり、この符号化方式を使用することにより、局所的な明度変動を扱うことができる。この符号化方式は、動き補償予測の対象である各ブロックに対する基準ブロックのそれぞれに関連付けられる重み付けパラメータの対の間の変換プロセスを含んでいる。この変換プロセスにより、重み付けパラメータに変換が適用される。一実施形態においては、変換後の重み付けパラメータが、予測方法を使用して各ブロック用に伝達され、ゼロツリー符号化構造(zero tree coding structure)を使用して符号化される。これにより、これらのパラメータを符号化するのに必要なオーバーヘッドが低減する。本明細書に記載した方法は、主として、双方向予測パーティションを対象としている。概念の一部は、片方向予測パーティションにも適用することができる。
[0031]一実施形態においては、片方向予測パーティションと双方向予測パーティションとの間の相互作用を利用して、効率を更に高める。また、特殊な考慮を、双方向予測ピクチャ又はスライス用に成し、異なるリスト又は双方のリストからブロックを予測することができる。
[0032]一実施形態においては、本符号化方式は、グローバルな重み付けパラメータと局所的な重み付けパラメータの双方を組み合わせて考慮することによって、更に拡張される。オプションとして、シーケンスレベル、ピクチャレベル、又はスライスレベルにおいて伝えられる更なる重み付けパラメータも考慮する。
[0033]別の実施形態においては、そのようなパラメータの粒度可変の動的範囲(variable granularity dynamic range)も考慮する。これらの重み付けパラメータは細かく調整可能であり、これにより、符号化効率の面で更なる恩恵が提供される。
[0034]以下の説明では、本発明をより完全に説明するため数多くの詳細部分を記載してある。しかしながら、当業者には、これらの特定の詳細部分を使用せずに本発明を実施できることが明らかであろう。周知の構造及び装置については、本発明が曖昧になることがないように、詳細に示すのではなくブロック図形式で示してある。
[0035]以下の詳細な説明の一部は、コンピュータメモリ内のデータビットに対する操作のアルゴリズム及び記号表現の形式で提示してある。このようなアルゴリズムによる説明及び表現は、データ処理の技術分野における当業者が、自身の開発内容の要旨を他の当業者に最も効果的に伝えるために使用する手段である。アルゴリズムは、本明細書において、及び一般的には、目的の結果に達する首尾一貫した一連のステップとして認識される。これらのステップは、物理量の物理的操作を必要とするステップである。通常、しかし必ずしもそうではないが、これらの数量は、格納、伝送、結合、比較、その他の操作を行うことのできる電気信号又は磁気信号の形式をとる。これらの信号を、例えばビット、値、要素、記号、文字、術語、数字として表現することは、主として、一般的に使用されているという理由から、場合によっては便利であることが実証されている。
[0036]しかしながら、上記及び同様の表現のいずれも、該当する物理量が関連付けられるものであり、物理量に付された便利なラベルにすぎないことを認識しておく必要がある。以下の説明から明らかであるように、特に明記しない限りは、説明全体を通じて、「処理する」、「計算する」、「決定する」、「表示する」等の用語を用いての説明は、コンピュータシステムのレジスタ及びメモリ内で物理的(電子的)数量として表されているデータを操作して、コンピュータシステムのメモリ又はレジスタ、或いはそれ以外の、そのような情報の記憶装置、伝送装置、又は表示装置において同様に物理量として表される他のデータに変換する、コンピュータシステム、又は類似する電子計算装置の動作及び処理を意味しているものと理解されたい。
[0037]本発明は、本明細書におけるオペレーションを実行する装置にも関する。この装置は、必要な目的を対象に専用に構築することができ、或いは、格納されているコンピュータプログラムによって選択的に起動又は再構成される汎用コンピュータを備えることができる。そのようなコンピュータプログラムは、コンピュータ可読記憶媒体、例えば、以下に限定されないが、任意のタイプのディスク(例:フロッピーディスク、光ディスク、CD−ROM、光磁気ディスク)、ROM(読取り専用メモリ)、RAM(ランダムアクセスメモリ)、EPROM、EEPROM、磁気カード又は光カード、或いは、電子的命令を格納するのに適しておりそれぞれがコンピュータシステムのバスに結合されている任意のタイプの媒体、に格納することができる。
[0038]本明細書に提示したアルゴリズム及び表記・表現(display)は、特定のコンピュータ或いはその他の装置に本質的に関連するものではない。本明細書における教示内容によるプログラムは、様々な汎用システムにおいて使用することができ、或いは、場合によっては、必要な方法ステップを実行するための専用の装置を構築することが都合よい。これらの様々なシステムの必要な構造は、以下の説明から明らかになるであろう。更に、本発明は、特定のプログラミング言語に関連して説明していない。本明細書に説明した本発明の教示内容は、様々なプログラミング言語を使用して実施できることが理解されるであろう。
[0039]機械可読媒体には、機械(例:コンピュータ)が読むことのできる形式で情報を格納又は伝送する任意のメカニズムが含まれる。例えば、機械可読媒体としては、読取り専用メモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイスのほか、電気、光、音響、又はその他の形式の伝搬信号(例:搬送波、赤外線信号、デジタル信号)等が挙げられる。
<概要>
[0040]本発明の実施形態は、重み付け予測を含む動き補償を使用する符号化方式を含んでいる。予測に関連する重み付けパラメータを変換し、次いで、予測に関連するオフセットと共に符号化する。復号プロセスは、符号化プロセスの逆である。
[0040]本発明の実施形態は、重み付け予測を含む動き補償を使用する符号化方式を含んでいる。予測に関連する重み付けパラメータを変換し、次いで、予測に関連するオフセットと共に符号化する。復号プロセスは、符号化プロセスの逆である。
[0041]図2は、符号化プロセスの一実施形態のフローチャートである。このプロセスは処理ロジックによって実行されるものであり、処理ロジックは、ハードウェア(回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるもの等)、又は双方の組合せを備えることができる。
[0042]以下、図2を参照する。このプロセスでは、最初に、処理ロジックが、動き推定を実行する一部として、複数仮説パーティション(例:双方向予測パーティション)の重み付けパラメータを生成する(処理ブロック201)。一実施形態においては、重み付けパラメータは、符号化するフレームの各パーティション(ブロック)について、少なくとも一対の重み付けパラメータのセットを含んでいる。一実施形態においては、複数対の変換された重み付けパラメータの重みは、その合計が一定である。一実施形態においては、フレームの少なくとも二つのパーティションに対して異なる重み付け係数を使用する。一実施形態においては、重み付けパラメータは、局所的な明度変動を補償する。
[0043]一実施形態においては、重み付け予測パラメータは、忠実度レベルが可変である。可変忠実度レベルは、予め定義されたものであるか、変換された重み付けパラメータを符号化した表現を含むビットストリームの一部として伝えられる。一実施形態においては、一つのグループの重み付けパラメータが、別のグループの重み付けパラメータよりも忠実度が高い。
[0044]次いで、処理ロジックは、重み付けパラメータに変換を適用し、変換された重み付けパラメータを生成する(処理ブロック202)。一実施形態においては、重み付けパラメータを変換するステップは、各基準に関連する少なくとも二つの重み付けパラメータに変換を適用することを含んでいる。一実施形態においては、重み付けパラメータを変換するステップは、次式を満たす変換を適用することを含んでいる。
これらの式において、wQ0及びwQ1は、量子化された重み付けパラメータであり、B_wQ0及びB_wQ1は、wQ0及びwQ1の変換後のバージョンである。
これらの式において、wQ0及びwQ1は、量子化された重み付けパラメータであり、B_wQ0及びB_wQ1は、wQ0及びwQ1の変換後のバージョンである。
[0045]重み付けパラメータに変換を適用した後、処理ロジックは、変換された重み付けパラメータとオフセットとを符号化する(処理ブロック203)。一実施形態においては、変換された重み付けパラメータを、可変長符号化を使用して、少なくとも一つのオフセットと共に符号化する。可変長符号化では、ゼロツリー符号化構造を使用することができる。可変長符号化は、ハフマン符号化又は算術符号化であってもよい。
[0046]一実施形態においては、変換された重み付けパラメータを符号化するステップは、隣接パーティションの変換された係数と所定の重み付けパラメータとから成る群のうちの一方に基づく予測を使用して、差分符号化を行なうことを含んでいる。予測のための隣接パーティションが存在しないときには、所定の重み付けパラメータを使用する。所定の重み付けパラメータは、デフォルトの重み付けパラメータか、又はグローバルに伝えられる重み付けパラメータとすることができる。
[0047]図3は、復号プロセスの一実施形態のフローチャートである。一実施形態においては、このような復号プロセスは、図2の符号化プロセスの一部として符号化された情報を復号する目的で使用する。このプロセスは処理ロジックによって実行され、処理ロジックは、ハードウェア(回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるもの等)、又は双方の組合せを備えることができる。
[0048]以下、図3を参照する。このプロセスでは、最初に、処理ロジックは、可変長復号を使用してビットストリームを復号し、複数仮説パーティション(例:双方向予測パーティション)の変換された重み付けパラメータを含む復号されたデータを得る(処理ブロック301)。可変長復号は、ハフマン符号化又は算術符号化であってもよい。
[0049]可変長復号の後、処理ロジックは、変換された重み付けパラメータに逆変換を適用する(処理ブロック302)。一実施形態においては、逆変換された重み付けパラメータは、基準に関連する少なくとも二つの重み付けパラメータを含んでいる。
[0050]次いで、処理ロジックは、逆変換された重み付けパラメータと共に動き補償を使用して、フレームデータを再構築する(処理ブロック303)。
<重み付け予測の具体例>
[0051]重み付け予測は、フェード、クロスフェード/ディゾルブ、単純な明度変動(例:フラッシュ、シェーディング変化)を含むビデオデータを符号化する場合に有用である。一方で、双方向予測(一般的には複数仮説予測)では、複数の予測を単純な重み付けメカニズムを使用して組み合わせることによって、信号に対するより良好な予測を生成することができるものと仮定する。従来の双方向予測では、全ての予測に対して等しい重み(すなわち1/2)を使用することが多い。一実施形態においては、例えば、時間的距離や量子化、又は各信号に発生する或いは存在するその他のノイズのために、ある信号が別の信号よりも高い相関を有する。時刻t、ポジション(x,y)におけるサンプルI(x,y,t)について重み付け方式の双方向予測を実行するために、次式を使用することができる。
この式において、weightk、dxk、dyk、tkは、リストkからの予測に対応する重み、水平変位、垂直変位、時刻であり、offsetはオフセットパラメータである。一実施形態においては、暗黙的な重み付け予測の場合、重みを、
であるように選択する。この式において、cは定数である。一実施形態においては、定数cは1である。これは、基本的には、全ての予測サンプルの間の加重平均の計算とみなすこともできる。
[0051]重み付け予測は、フェード、クロスフェード/ディゾルブ、単純な明度変動(例:フラッシュ、シェーディング変化)を含むビデオデータを符号化する場合に有用である。一方で、双方向予測(一般的には複数仮説予測)では、複数の予測を単純な重み付けメカニズムを使用して組み合わせることによって、信号に対するより良好な予測を生成することができるものと仮定する。従来の双方向予測では、全ての予測に対して等しい重み(すなわち1/2)を使用することが多い。一実施形態においては、例えば、時間的距離や量子化、又は各信号に発生する或いは存在するその他のノイズのために、ある信号が別の信号よりも高い相関を有する。時刻t、ポジション(x,y)におけるサンプルI(x,y,t)について重み付け方式の双方向予測を実行するために、次式を使用することができる。
この式において、weightk、dxk、dyk、tkは、リストkからの予測に対応する重み、水平変位、垂直変位、時刻であり、offsetはオフセットパラメータである。一実施形態においては、暗黙的な重み付け予測の場合、重みを、
であるように選択する。この式において、cは定数である。一実施形態においては、定数cは1である。これは、基本的には、全ての予測サンプルの間の加重平均の計算とみなすこともできる。
[0052]二つの双方向予測重みの間の上記の関係は、殆どの場合に、すなわち、明度変動或いはクロスフェードが存在しない従来のコンテンツに対して成り立つ。
[0053]一実施形態においては、パラメータweight0及びweight1を使用する代わりに、Nビットの量子化されたパラメータwQ0及びwQ1を使用する。一実施形態においては、Nは6ビットである。代入を行うと、上の式5は次式と等価になる。
この式において、<<は左ビットシフト演算子を表しており、>>は右ビットシフト演算子を表している。
この式において、<<は左ビットシフト演算子を表しており、>>は右ビットシフト演算子を表している。
[0055]式6の関係が殆どのブロック/パーティションに成り立つと考え、一実施形態においては、B_wQ0を、更に、
と変形することができ、最終的に以下の式となる。
代替の実施形態においては、差別化した符号化を使用し、B_wQ0のデフォルトの予測情報として1<<Nを使用する。
と変形することができ、最終的に以下の式となる。
代替の実施形態においては、差別化した符号化を使用し、B_wQ0のデフォルトの予測情報として1<<Nを使用する。
[0056]一実施形態においては、パラメータB_wQ0及びB_wQ1をそのまま符号化する。別の実施形態においては、パラメータB_wQ0及びB_wQ1を、隣接する双方向予測パーティションからのB_wQ0及びB_wQ1の値を考慮することによって、差分符号化する。そのようなパーティションが存在しない場合、これらのパラメータをデフォルト値dB_wQ0及びdB_wQ1を使用して予測することができる(例:双方の値を0に設定することができる)。
[0057]図10は、双方向予測を使用してフレームを符号化するための重み付けパラメータの変換プロセスを示している。以下、図10を参照する。変換器1001は、量子化された重み付けパラメータwQ0及びwQ1を受け取り、変換された重み付けパラメータB_wQ0及びB_wQ1をそれぞれ生成する。これらの変換された重み付けパラメータを、可変長符号化器1002を使用して、オフセットと共に可変長符号化する。その後、符号化された重み付けパラメータをビットストリームの一部として復号器に送る。可変長復号器1103は、このビットストリームを復号し、変換された重み付けパラメータB_wQ0及びB_wQ1とオフセットとを生成する。逆変換器1004は、変換された重み付けパラメータを逆変換し、量子化された重み付けパラメータwQ0及びwQ1を生成する。この重み付けパラメータwQ0に、動き補償されたサンプルx0を乗算器1006によって乗算して出力を生成し、その出力を加算器1007に入力する。また、重み付けパラメータwQ1に、動き補償されたサンプルx1を、乗算器1005を用いて乗算する。そして、乗算器1005の演算結果を、乗算器1006の出力と2N−1とに、加算器1007を用いて、加算する。さらに、加算器1007の出力を、除算器1008を用いて2Nで除する。この除算の結果に加算器1009を用いてオフセットを加算して、予測されたサンプルx’を生成する。
[0058]なお、本発明は、双方向予測の場合に限定されず、M個の異なる仮説を使用する複数仮説の場合にも同様に適用することができる。その場合にも、M個の仮説の重みの間の最も可能性の高い関係が、
という形であるものと仮定することによって、一実施形態においては、元の重み付けパラメータを次の形式に変形する。
一方で、最終的な重み付けパラメータを次のように生成することができる。
という形であるものと仮定することによって、一実施形態においては、元の重み付けパラメータを次の形式に変形する。
一方で、最終的な重み付けパラメータを次のように生成することができる。
[0059]図11は、複数仮説の場合における、重み付けパラメータのプロセスを示している。図11を参照すると、図10に示した構成と同じ構成を示してあるが、異なる点として、図11においては、変換器1101が二つ以上の重み付けパラメータのセットを変換し、可変長符号化器1102が、量子化された重み付けパラメータのセットと、各セットの一つのオフセットとを符号化する。復号においては、可変長復号器1103がビットストリームを復号し、変換された重み付けパラメータのセットを生成する。変換された重み付けパラメータの各セットを逆変換器1104によって逆変換し、図10における方式と同じように、その出力を組み合わせて、予測されたサンプルx’を生成する。加算器1107は、量子化された重み付けパラメータ全ての乗算の結果全てを加算する。
[0060]一般的には、一つのピクチャ又はスライスにおいて、双方向予測パーティションと片方向予測パーティションの双方を組み合わせることができる。具体的には、双方向予測パーティションが、リスト0予測又はリスト1予測のいずれかを使用する片方向予測隣接パーティションを持つことができ、或いは、リストX(Xは0又は1)を使用する片方向予測パーティションが、異なるリストを使用する隣接パーティションを持つことさえ可能である。双方向予測パーティション内の動きベクトルと、片方向予測パーティションの動きベクトルとが依然として相関していることがあるが、リストが異なり、且つ異なる数の仮説を使用する重み付けパラメータの動きベクトルについては、相関しない可能性が高い(すなわち、双方向予測パーティションからの重みと片方向予測パーティションからの重みとでは関係が少なく、リスト0を使用する片方向予測パーティションからの重み及び動きベクトルと、リスト1を使用する別のパーティションからのこれらのパラメータとでは関係が少ない)。一実施形態においては、ある予測モード(リスト0、リスト1、双方向予測)からの全ての重みは、同じモードにおける隣接するパーティションからのみ予測するように制限する。一実施形態においては、現在のパーティションが双方向予測パーティションであり、R個の隣接パーティション(Neigh0,Neigh1,...,NeighR)全ても双方向予測であるならば、重み付けパラメータB_wQkを次のように予測する。
この式において、f()は、k番目の重み付けパラメータの予測を求めるための関係に対応する。一実施形態においては、例えば、fに使用する関数は、全ての予測情報の中央値である。
この式において、f()は、k番目の重み付けパラメータの予測を求めるための関係に対応する。一実施形態においては、例えば、fに使用する関数は、全ての予測情報の中央値である。
[0061]代替の実施形態においては、平均等の関数を使用し、使用する基準フレーム若しくは所定のコスト、又はその双方に基づく上又は左の隣接パーティションのみを考慮する。しかしながら、NeighJにおいて異なる予測タイプを使用する場合、その予測プロセスからNeighJを除外することができる。一実施形態においては、予測が得られない場合、前述したデフォルト値を予測情報として使用することができる。
[0062]一実施形態においては、予測後、重み付けパラメータと、一般的にはブロックの動きパラメータとを、ゼロツリー符号化を使用して更に効率的に符号化する。図4及び図5は、符号化することのできるノード情報を有する二つの想定可能なツリーを表している。図4を参照すると、双方向予測の動き情報を符号化するための親子関係の例を示している。この例においては、ノードがリストに基づいて分割されており、リスト0の水平及び垂直動きベクトルの変位差の親ノードが共通であり、リスト1の水平及び垂直動きベクトルの変位差の親ノードが共通である。図5においては、動きは動きベクトル成分に基づいて分割されている。この場合には、リスト0及びリスト1の双方の水平動きベクトルの変位差の親ノードが共通であるのに対し、リスト0及びリスト1の双方の垂直動きベクトルの変位差の親ノードが共通である。
[0063]図4及び図5に記載した、ノードタイプデータとリーフインデックスデータの双方を含んでいるツリーは、「係数のポジションを符号化する方法及び装置(Method and Apparatus for Coding Positions of Coefficients)」と題して2005年6月29日に出願された米国特許出願第11/172,052号に記載されているツリー符号化(例:ゼロツリー符号化)を使用して符号化する(及びその後に復号する)ことができる。
[0064]しかしながら、特定の予測タイプのデフォルト値を一定にする必要はない。一実施形態においては、グローバルパラメータ/デフォルトパラメータのセットを、H.264の明示モードにおいて使用されるパラメータセットのように使用して符号化し、或いはこれに代えて、H.264の暗黙モード方式に類似するメカニズムを使用して導出する。導出方法又はパラメータは、ピクチャレベル又はスライスレベルにおいて伝えることができる。
[0065]図9は、グローバルな重み付けと局所的な重み付けとを組み合わせて使用するプロセスの一実施形態のフローチャートを示している。このプロセスは処理ロジックによって実行され、処理ロジックは、ハードウェア(回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるもの等)、又は双方の組合せを備えことができる。
[0066]以下、図9を参照する。このプロセスでは、最初に、デフォルトの重み付けパラメータを設定する(処理ブロック901)。そのような場合、リスト0、リスト1、及び双方向予測のデフォルトのスケーリングパラメータ及びオフセットパラメータが存在する。リスト0の場合、デフォルトの重み付けパラメータは{DScaleL0,DOffsetL0}である。リスト1の場合、重み付けパラメータは{DScaleL1,DOffsetL1}である。双方向予測の場合、デフォルトの重み付けパラメータは{DScaleBi_L0,DScaleBi_L1,DOffset}である。
[0067]次いで、プロセスは、フレーム内の各ブロックについて続行し、処理ロジックは、ブロックが双方向予測ブロックであるかを調べる(処理ブロック903)。双方向予測ブロックである場合、処理ロジックは処理ブロック904に移行し、双方向予測の利用可能な予測情報が存在するかを調べる。存在する場合、処理ロジックは、隣接パーティションを使用し、関数fbipred(Neigh0,...,Neigh1)を用いて重み付けパラメータ予測情報を計算し(処理ブロック905)、処理は処理ブロック914に移行する。双方向予測の利用可能な予測子が存在しない場合、処理ロジックは、重み付けパラメータをデフォルト{DScaleBi_L0,DScaleBi_L1,DOffset}に設定し(処理ブロック906)、処理は処理ブロック914に移行する。
[0068]フレーム内のブロックを双方向予測しない場合、処理は処理ブロック907に移行し、処理ロジックは、ブロックリストがリスト0であるかを調べる。リスト0である場合、処理は処理ブロック908に移行し、処理ロジックは、リスト0予測の利用可能な予測情報が存在するかを調べる。存在する場合、処理ロジックは、隣接パーティションfL0(Neigh0,...,Neigh1)を使用して重み付けパラメータ予測情報を計算し(処理ブロック909)、処理は処理ブロック914に移行する。リスト0の利用可能な予測情報が存在しない場合、処理ロジックは、重み付けパラメータをデフォルト値{DScaleL0,DOffsetL0}に設定し(処理ブロック910)、処理は処理ブロック914に移行する。
[0069]リスト0を使用してブロックを予測しない場合、処理は処理ブロック911に移行し、処理ロジックは、リスト1予測の利用可能な予測情報が存在するかを調べる。存在する場合、処理ロジックは、隣接パーティションfL0)(Neigh0,...,Neigh1)を使用して重み付けパラメータ予測情報を計算し(処理ブロック912)、処理は処理ブロック914に移行する。リスト1の利用可能な予測情報が存在しない場合、処理ロジックは、重み付けパラメータをデフォルト値{DScaleL1,DOffsetL1}に設定し(処理ブロック913)、処理は処理ブロック914に移行する。
[0070]処理ブロック914において、処理ロジックは、重み付けパラメータを復号する。その後、重み付けパラメータ予測情報を重み付けパラメータに加算する(処理ブロック915)。次いで、フレーム内の各ブロックについてこのプロセスを繰り返し、フレーム内の各ブロックを処理した時点で、プロセスが終了する。
[0071]上の説明に基づいて、双方向予測パーティションと片方向予測パーティションとに対して個別のデフォルトの重みを使用することができるが、そのようなパラメータは、Kamikura等による「ビデオ符号化におけるグローバルな明度変動補償(Global Brightness− Variation Compensation for Video Coding)」(IEEE Trans on CSVT、vol.8、p.988〜1000、1998年12月)と、J.Boyceによる「ビデオ符号化規格H.264/MPEG4 AVCにおける重み付け予測(Weighted prediction in the H.264/MPEG4 AVC video coding standard)」(ISCAS、p.789〜792、2004年5月)に提示されているものと類似する方法を使用して、推定することができる。表1は、この目的に使用することのできる予測重みテーブルの構文(prediction weight table syntax)の例を示している。このテーブルでは、片方向予測領域と双方向予測領域のためのグローバル重みを個別に伝え得ることがわかる。
[0072]更には、双方向予測重みは異なるダイナミックレンジを持つことができ、パラメータluma_bipred_weight_type及びchroma_bipred_weight_typeを使用して重みの導出方法を制御する。より具体的には、明度(luma)については、luma_bipred_weight_typeを0に設定する場合、デフォルトの重み1/2が使用される。1に設定する場合、暗黙モードが使用され、2に設定する場合、現在のH.264の明示モードにおいて行われているように片方向重みが使用される。3に設定する場合、重み付けパラメータがヘッダにおいて明示的に伝えられる。
[0073]重み付けパラメータ及びオフセットパラメータの忠実度(fidelity)を一定にする、すなわち、重み付けパラメータをNビットに均一に量子化することができるが、フレーム内の様々な変動を良好に扱うためには、不均一な量子化の方が効率的且つ適切であることがある。一実施形態においては、小さい重み付けパラメータ又はオフセットパラメータに対しては細かい忠実度を使用し、大きいパラメータに対しては忠実度を増大させる。
[0074]一般的に、重み付けパラメータB_wQk、wQk、或いは場合によっては差分値dB_wQkへのマッピングを提供するパラメータqwkの符号化として、次式を使用したものが想定される。
使用することのできる関数は以下のとおりである。
使用することのできる関数は以下のとおりである。
[0075]式(17)(又はより一般的な式(18))によって表される関数は、重み付けパラメータの忠実度の表現において柔軟性を高めることができる。なお、演算a・xは、乗算のみならず、整数又は浮動小数点数の除算も示すことがある(すなわちaは1より小さいと想定する)。図8は、重み付けパラメータの表現と真の値との間の関係の例である。
[0076]一実施形態においては、パラメータの決定は、フレーム又はシーケンスの事前分析を実行し、重み付けパラメータの分布(distribution)を生成し、その分布をg(x)によって近似することによって(すなわち多項式近似を使用して)行う。
[0077]図12は、忠実度が制御される、双方向予測における重み付けパラメータの変換プロセスを示している。図12を参照すると、このプロセスは図10におけるプロセスと同じであるが、相違点として、変換器1001から出力される変換された重み付けパラメータのそれぞれとオフセットとを、可変長符号化器1002に直接的には入力しない。代わりに、これらを関数に入力し、その出力を可変長符号化器1002に入力する。より具体的には、変換された重み付けパラメータB_wQ0を関数g0(x)に入力し、x0を生成する。更には、変換された重み付けパラメータB_wQ1を関数g1(x)に入力し、x1を生成する(1202)。オフセットも関数g0(x)に入力し、x2を生成する(1203)。
[0078]同様に、復号器1003の出力(x0,x1,x2)を関数g0 −1(x)(1204)、g1 −1(x)(1205)、g0 −1(x)(1206)に入力する。これらの関数は、オフセットにおける変換された重み付けパラメータを生成する。その後、図10に示した方法と同じ方法で、これらを処理する。
<符号化器及び復号器の例>
[0079]図6は、符号化器の一実施形態のブロック図である。一実施形態においては、符号化器は、最初に、入力されるビットストリームを矩形の配列(マクロブロックと称する)に分割する。次いで、符号化器は、各マクロブロックについて、フレーム内符号化を使用するかフレーム間符号化を使用するかを選択する。フレーム内符号化は、現在のビデオフレームに含まれている情報のみを使用して、圧縮結果(Iフレームと称する)を生成する。フレーム内符号化では、現在のフレームの前又は後ろに存在する一つ以上の別のフレームの情報を使用することができる。前のフレームからのデータのみを使用する圧縮結果をPフレームと称するのに対し、現在のフレームの前後双方のフレームからのデータを使用する圧縮結果をBフレームと称する。
[0079]図6は、符号化器の一実施形態のブロック図である。一実施形態においては、符号化器は、最初に、入力されるビットストリームを矩形の配列(マクロブロックと称する)に分割する。次いで、符号化器は、各マクロブロックについて、フレーム内符号化を使用するかフレーム間符号化を使用するかを選択する。フレーム内符号化は、現在のビデオフレームに含まれている情報のみを使用して、圧縮結果(Iフレームと称する)を生成する。フレーム内符号化では、現在のフレームの前又は後ろに存在する一つ以上の別のフレームの情報を使用することができる。前のフレームからのデータのみを使用する圧縮結果をPフレームと称するのに対し、現在のフレームの前後双方のフレームからのデータを使用する圧縮結果をBフレームと称する。
[0080]以下、図6を参照する。まず、ビデオ601を符号化器に入力する。動き補償なしにフレームを符号化する場合、ビデオのフレームをDCT603に入力する。DCT603は、2次元離散コサイン変換(DCT)を実行してDCT係数を生成する。これらの係数を量子化器604によって量子化する。一実施形態においては、量子化器604によって実行される量子化は、スケーリング器によって重み付けされる。一実施形態においては、量子化器のスケーリング器パラメータQPは、1〜31の値をとる。QP値は、ピクチャレベル及びマクロブロックレベルの双方において変更することができる。
[0081]その後、量子化された係数に、VLC605において可変長符号化を行う。一実施形態においては、VLC605は、ハフマン符号化又は算術符号化を使用することによってエントロピ符号化を実行する。
[0082]なお、一実施形態においては、VLC605の前に再順序付けを実行することができ、この処理では、2次元配列の係数が1次元配列の係数に変換されるように、量子化されたDCT係数に対して、この技術分野において周知の方法においてジグザグ走査を行う。この後、ランレングス符号化を行うことができ、この処理では、0の係数が良好に表現されるように、各ブロックに対応する再順序付け後の量子化された係数の配列を符号化する。この場合、ゼロでない係数のそれぞれをトリプレット(最後、ラン、レベル)として符号化し、この場合、「最後」は、その係数がブロック内のゼロでない最後の係数であるかを示し、「ラン」は、先行するゼロの係数を伝え、「レベル」は、係数の符号及び大きさを示す。
[0083]フレームのコピーを、基準フレームとして使用するために、保存しておくことができる。これは、特に、Iフレーム又はPフレームの場合である。この目的のために、量子化器604から出力される量子化された係数を、逆量子化器606によって逆量子化する。逆量子化された係数に、IDCT607を使用して逆DCT変換を適用する。Pフレームの場合には、その結果としてのフレームデータを、動き補償(MC)ユニット609からの動き補償された予測に加算し、結果のフレームをループフィルタ612を使用してフィルタリングし、基準フレームとして使用できるようにフレームバッファ611に格納する。Iフレームの場合には、IDCT607から出力されるデータを、動き補償(MC)ユニット609からの動き補償された予測に加算せずに、ループフィルタ612を使用してフィルタリングし、フレームバッファ611に格納する。
[0084]Pフレームの場合、前のIフレーム又はPフレーム(この技術分野においては一般に基準フレームと称する)とのフレーム間予測(interprediction)を用いて、Pフレームを符号化する。この場合、フレーム間予測は、動き推定(ME)ブロック610及び動き補償ユニット609によって実行する。この場合、動き推定ユニット610は、フレームストア611からの基準フレームと、入力されるビデオ601とを使用して、現在のフレーム内の現在のマクロブロックに最良に一致する基準フレーム内の領域の位置を探索する。上述したように、このステップでは、変位を求めるのみならず、重み付けパラメータ(WP)及びオフセットも求める。現在のマクロブロックと、基準フレーム内の補償領域との間の変位と、重み付けパラメータ及びオフセットとを、動きベクトルと称する。この動き推定ユニット610の動きベクトルは動き補償ユニット609に送られる。動き補償ユニット609は、減算器602を使用して現在のマクロブロックから予測を減算し、残差マクロブロックを生成する。次いで、この残差マクロブロックを、DCT603と、量子化器604と、VLC605とを使用して、上述したように符号化する。
[0085]動き推定ユニット610は、重み付けパラメータを可変長復号用のVLC605に出力する。VLC605の出力は、ビットストリーム620である。
[0086]図7は、復号器の一実施形態のブロック図である。以下、図7を参照する。まず、可変長復号器702がビットストリーム701を受け取り、可変長復号を実行する。可変長復号の出力は逆量子化器703に送られ、逆量子化器703が、量子化器604によって実行される量子化の逆演算である逆量子化演算を実行する。次いで、逆量子化器703の出力に含まれる係数をIDCT704が逆DCT変換し、画像データを生成する。Iフレームの場合、IDCT704の出力をループフィルタ721によって単純にフィルタリングし、フレームバッファ722に格納し、最終的に出力760として出力する。Pフレームの場合には、IDCT704から出力される画像データを、加算器705を使用して、動き補償ユニット710からの予測に加算する。動き補償ユニット710は、可変長復号器722からの出力(上述した重み付けパラメータを含んでいる)と、フレームバッファ722からの基準フレームとを使用する。加算器705から出力される結果の画像データを、ループフィルタ721を使用してフィルタリングし、フレームバッファ722に格納し、最終的に出力760の一部として出力する。
[0087]ここまで説明したように、本発明の実施形態では、明度変動及び/又はクロスフェードが存在する場合に、双方向予測パーティションの重み付けパラメータをより良好に表現して、符号化効率を高める(すなわち、あるビットレートにおけるピーク信号対雑音比(PSNR)が高まる)ことができる。
<コンピュータシステムの例>
[0088]図13は、本明細書に説明した一つ以上のオペレーションを実行することのできる例示的なコンピュータシステムのブロック図である。以下、図13を参照する。コンピュータシステム1300は、例示的なクライアントコンピュータシステム又はサーバコンピュータシステムを備えることができる。コンピュータシステム1300は、情報を伝えるための通信メカニズム又はバス1311と、バス1311に結合されて情報を処理するプロセッサ1312と、を備えている。プロセッサ1312はマイクロプロセッサを含んでいるが、マイクロプロセッサ(例:PentiumTM、PowerPCTM、AlphaTM)に限定されない。
[0088]図13は、本明細書に説明した一つ以上のオペレーションを実行することのできる例示的なコンピュータシステムのブロック図である。以下、図13を参照する。コンピュータシステム1300は、例示的なクライアントコンピュータシステム又はサーバコンピュータシステムを備えることができる。コンピュータシステム1300は、情報を伝えるための通信メカニズム又はバス1311と、バス1311に結合されて情報を処理するプロセッサ1312と、を備えている。プロセッサ1312はマイクロプロセッサを含んでいるが、マイクロプロセッサ(例:PentiumTM、PowerPCTM、AlphaTM)に限定されない。
[0089]システム1300は、バス1311に結合されたRAM(ランダムアクセスメモリ)又はその他の動的記憶装置1304(メインメモリと称する)を、情報と、プロセッサ1312によって実行される命令とを格納するために備えている。メインメモリ1304は、プロセッサ1312による命令の実行時に一時変数又はその他の中間情報を格納する目的にも使用することができる。
[0090]更に、コンピュータシステム1300は、バス1311に結合されたROM(読取り専用メモリ)及び/又はその他の静的記憶装置1306を、静的な情報と、プロセッサ1312への命令とを格納するために備えており、また、データ記憶装置1307(例:磁気ディスク又は光ディスクと、それに対応するディスクドライブ)を備えている。データ記憶装置1307は、バス1311に結合されており、情報及び命令を格納する。
[0091]更に、コンピュータシステム1300には、コンピュータの使用者に情報を表示するために、バス1311に結合されたディスプレイ装置1321(例:CRT(陰極線管)、液晶ディスプレイ(LCD))を結合することができる。英数字キー及びその他のキーを含んでいる英数字入力装置1322も、情報及びコマンド選択をプロセッサ1312に伝えるために、バス1311に結合することができる。更なるユーザ入力装置は、バス1311に結合されたカーソル制御装置1323(例:マウス、トラックボール、トラックパッド、スタイラス、カーソル方向キー)であり、当該カーソル制御装置は、方向情報及びコマンド選択をプロセッサ1312に伝え、ディスプレイ1321上のカーソルの動きを制御する。
[0092]バス1311に結合することのできる別の装置は、ハードコピー装置1324であり、当該ハードコピー装置は、媒体(例:紙、フィルム、又は類似するタイプの媒体)上に情報を記録するために使用することができる。バス1311に結合することのできる別の装置は、電話又はハンドヘルド型パームデバイス(handheld palm device)と通信するための有線/無線通信機能1325である。
[0093]なお、本発明においては、システム1300及び関連するハードウェアのコンポーネントの一部又は全てを使用することができる。しかしながら、コンピュータシステムの別の構成では、これらのコンポーネントの一部又は全てを含めることができることを理解されたい。
[0094]この技術分野における当業者には、上記の説明を読み終えた後、本発明の数多くの変更及び修正が明らかになるであろうが、説明を目的として図示及び記載した実施形態はいずれも、本発明を制限することを意図したものではないことを理解されたい。従って、様々な実施形態の細部を示したが、それらは、本発明の本質的な特徴のみを記載している特許請求の範囲を制限することを意図したものではない。
Claims (5)
- 複数仮説パーティションの重み付けパラメータを生成するステップと、
前記重み付けパラメータを変換するステップと、
変換された重み付けパラメータを符号化するステップと、
を含む符号化方法。 - 複数仮説パーティションの重み付けパラメータを、動き補償予測を実行する一部として、生成する動き推定ユニットと、
前記重み付けパラメータを、変換された重み付けパラメータに変換する変換器と、
変換された重み付けパラメータを符号化する符号化器と、
を備える符号化器。 - 命令を格納する一つ以上の記録可能媒体を有する製品であって、該命令は、システムによる実行時に、前記システムに、
複数仮説パーティションの重み付けパラメータを生成するステップと、
前記重み付けパラメータを変換するステップと、
変換された重み付けパラメータを符号化するステップと、
を含む符号化方法を実行させる製品。 - 可変長復号を使用してビットストリームを復号して、複数仮説パーティションの変換された重み付けパラメータを含む復号されたデータを得るステップと、
前記変換された重み付けパラメータに逆変換を適用するステップと、
逆変換された重み付けパラメータと共に動き補償を使用して、フレームデータを再構築するステップと、
を含む復号方法。 - 可変長復号を使用してビットストリームを復号し、複数仮説パーティションの変換された重み付けパラメータを含む復号されたデータを得る可変長復号器と、
前記復号されたデータの一部に逆量子化演算を実行して係数を生成する逆量子化器と、
前記係数に第1の逆変換を適用して画像データを生成する第1の逆変換器と、
前記変換された重み付けパラメータに第2の逆変換を適用して重み付けパラメータを生成する第2の逆変換器と、
少なくとも一つの動きベクトルと前記重み付けパラメータとを使用して予測を生成する動き補償ユニットと、
前記予測を前記画像データに加算してフレームデータを再構築する加算器と、
を備える復号器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US68526105P | 2005-05-26 | 2005-05-26 | |
US11/440,604 US8457203B2 (en) | 2005-05-26 | 2006-05-24 | Method and apparatus for coding motion and prediction weighting parameters |
PCT/US2006/020633 WO2006128072A2 (en) | 2005-05-26 | 2006-05-25 | Method and apparatus for coding motion and prediction weighting parameters |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010271444A Division JP5086422B2 (ja) | 2005-05-26 | 2010-12-06 | 動き及び予測の重み付けパラメータを符号化する方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008541502A true JP2008541502A (ja) | 2008-11-20 |
JP2008541502A5 JP2008541502A5 (ja) | 2009-04-23 |
Family
ID=37462886
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008508011A Pending JP2008541502A (ja) | 2005-05-26 | 2006-05-25 | 動き及び予測の重み付けパラメータを符号化する方法及び装置 |
JP2010271444A Active JP5086422B2 (ja) | 2005-05-26 | 2010-12-06 | 動き及び予測の重み付けパラメータを符号化する方法及び装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010271444A Active JP5086422B2 (ja) | 2005-05-26 | 2010-12-06 | 動き及び予測の重み付けパラメータを符号化する方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8457203B2 (ja) |
EP (1) | EP1891810B1 (ja) |
JP (2) | JP2008541502A (ja) |
CN (1) | CN101176350B (ja) |
WO (1) | WO2006128072A2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011223340A (ja) * | 2010-04-09 | 2011-11-04 | Ntt Docomo Inc | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、及び、動画像復号プログラム |
WO2012096104A1 (ja) * | 2011-01-12 | 2012-07-19 | 株式会社エヌ・ティ・ティ・ドコモ | 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法、及び画像予測復号プログラム |
JP2012533212A (ja) * | 2009-07-09 | 2012-12-20 | クゥアルコム・インコーポレイテッド | ビデオコーディングにおける単方向予測および双方向予測のための異なる重み付け |
WO2012172668A1 (ja) * | 2011-06-15 | 2012-12-20 | 株式会社 東芝 | 動画像符号化方法及び装置並びに動画復号化方法及び装置 |
JP2013505615A (ja) * | 2009-09-17 | 2013-02-14 | ミツビシ・エレクトリック・アールアンドディー・センター・ヨーロッパ・ビーヴィ | 動画像の重み付き動き補償 |
JPWO2012172668A1 (ja) * | 2011-06-15 | 2015-02-23 | 株式会社東芝 | 動画像符号化方法及び装置並びに動画復号化方法及び装置 |
US9161057B2 (en) | 2009-07-09 | 2015-10-13 | Qualcomm Incorporated | Non-zero rounding and prediction mode selection techniques in video encoding |
JP2019519148A (ja) * | 2016-05-13 | 2019-07-04 | ヴィド スケール インコーポレイテッド | ビデオ符号化のための一般化された多重仮説予測(Generalized Multi−Hypothesis Prediction)のためのシステムおよび方法 |
JP2020520174A (ja) * | 2017-05-10 | 2020-07-02 | 華為技術有限公司Huawei Technologies Co.,Ltd. | ビデオ圧縮における双方向予測 |
JP2020129848A (ja) * | 2020-05-29 | 2020-08-27 | 株式会社東芝 | 符号化データのデータ構造、記憶装置、送信装置および符号化方法 |
Families Citing this family (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007094792A1 (en) * | 2006-02-17 | 2007-08-23 | Thomson Licensing | Localized weighted prediction handling video data brightness variations |
KR100856411B1 (ko) * | 2006-12-01 | 2008-09-04 | 삼성전자주식회사 | 조도 보상 방법 및 그 장치와 그 방법을 기록한 컴퓨터로 읽을 수 있는 기록매체 |
GB2444992A (en) * | 2006-12-21 | 2008-06-25 | Tandberg Television Asa | Video encoding using picture division and weighting by luminance difference data |
JP2008219100A (ja) * | 2007-02-28 | 2008-09-18 | Oki Electric Ind Co Ltd | 予測画像生成装置、方法及びプログラム、並びに、画像符号化装置、方法及びプログラム |
KR101408698B1 (ko) * | 2007-07-31 | 2014-06-18 | 삼성전자주식회사 | 가중치 예측을 이용한 영상 부호화, 복호화 방법 및 장치 |
CN101911705B (zh) * | 2007-12-28 | 2012-08-29 | 夏普株式会社 | 运动图像编码装置及运动图像解码装置 |
US8254469B2 (en) * | 2008-05-07 | 2012-08-28 | Kiu Sha Management Liability Company | Error concealment for frame loss in multiple description coding |
US9538176B2 (en) | 2008-08-08 | 2017-01-03 | Dolby Laboratories Licensing Corporation | Pre-processing for bitdepth and color format scalable video coding |
TWI498003B (zh) | 2009-02-02 | 2015-08-21 | Thomson Licensing | 代表一序列圖像的碼式資料連流之解碼方法和一序列圖像之寫碼方法及碼式圖像資料結構 |
US8711930B2 (en) * | 2009-07-09 | 2014-04-29 | Qualcomm Incorporated | Non-zero rounding and prediction mode selection techniques in video encoding |
FR2948845A1 (fr) | 2009-07-30 | 2011-02-04 | Thomson Licensing | Procede de decodage d'un flux representatif d'une sequence d'images et procede de codage d'une sequence d'images |
US20110075724A1 (en) * | 2009-09-29 | 2011-03-31 | Qualcomm Incorporated | Encoding parameters with unit sum |
US9161058B2 (en) * | 2010-03-27 | 2015-10-13 | Texas Instruments Incorporated | Method and system for detecting global brightness change for weighted prediction in video encoding |
JP5393573B2 (ja) * | 2010-04-08 | 2014-01-22 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測復号装置、動画像予測符号化方法、動画像予測復号方法、動画像予測符号化プログラム、及び動画像予測復号プログラム |
US9118929B2 (en) | 2010-04-14 | 2015-08-25 | Mediatek Inc. | Method for performing hybrid multihypothesis prediction during video coding of a coding unit, and associated apparatus |
US8971400B2 (en) * | 2010-04-14 | 2015-03-03 | Mediatek Inc. | Method for performing hybrid multihypothesis prediction during video coding of a coding unit, and associated apparatus |
US8908755B2 (en) * | 2010-07-16 | 2014-12-09 | Sony Corporation | Multi-parameter motion for efficient prediction in video compression |
US20140003527A1 (en) * | 2011-03-10 | 2014-01-02 | Dolby Laboratories Licensing Corporation | Bitdepth and Color Scalable Video Coding |
WO2012122426A1 (en) * | 2011-03-10 | 2012-09-13 | Dolby Laboratories Licensing Corporation | Reference processing for bitdepth and color format scalable video coding |
WO2012177052A2 (ko) | 2011-06-21 | 2012-12-27 | 한국전자통신연구원 | 인터 예측 방법 및 그 장치 |
KR20120140592A (ko) | 2011-06-21 | 2012-12-31 | 한국전자통신연구원 | 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치 |
WO2013006386A1 (en) * | 2011-07-01 | 2013-01-10 | General Instrument Corporation | Motion vector prediction design simplification |
DK2763414T3 (da) | 2011-09-29 | 2020-11-30 | Sharp Kk | Billedafkodningsindretning og fremgangsmåde til billedafkodning til udførelse af konvertering af bi-forudsigelse til uni-forudsigelse |
WO2013047805A1 (ja) | 2011-09-29 | 2013-04-04 | シャープ株式会社 | 画像復号装置、画像復号方法および画像符号化装置 |
KR102003180B1 (ko) | 2011-10-17 | 2019-07-23 | 가부시끼가이샤 도시바 | 암호화 방법 및 복호 방법 |
JPWO2013057783A1 (ja) * | 2011-10-17 | 2015-04-02 | 株式会社東芝 | 符号化方法及び復号方法 |
WO2013067440A1 (en) | 2011-11-04 | 2013-05-10 | General Instrument Corporation | Motion vector scaling for non-uniform motion vector grid |
JP5485969B2 (ja) * | 2011-11-07 | 2014-05-07 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム |
WO2013106190A1 (en) | 2012-01-09 | 2013-07-18 | Dolby Laboratories Licensing Corporation | Hybrid reference picture reconstruction method for single and multiple layered video coding systems |
US9420302B2 (en) | 2012-01-24 | 2016-08-16 | Dolby Laboratories Licensing Corporation | Weighted multi-band cross color channel predictor |
US9172970B1 (en) | 2012-05-29 | 2015-10-27 | Google Inc. | Inter frame candidate selection for a video encoder |
US11317101B2 (en) | 2012-06-12 | 2022-04-26 | Google Inc. | Inter frame candidate selection for a video encoder |
EP3700215B1 (en) | 2012-06-27 | 2021-10-27 | Kabushiki Kaisha Toshiba | Encoding method, decoding method, storage apparatus and transfer apparatus |
US9635369B2 (en) | 2012-07-02 | 2017-04-25 | Qualcomm Incorporated | Video parameter set including HRD parameters |
CN102828045B (zh) * | 2012-09-07 | 2013-08-21 | 白银有色集团股份有限公司 | 白银铜熔池熔炼炉专用的粉煤燃烧器 |
US9906786B2 (en) * | 2012-09-07 | 2018-02-27 | Qualcomm Incorporated | Weighted prediction mode for scalable video coding |
US9503746B2 (en) | 2012-10-08 | 2016-11-22 | Google Inc. | Determine reference motion vectors |
US9485515B2 (en) | 2013-08-23 | 2016-11-01 | Google Inc. | Video coding using reference motion vectors |
US9473771B2 (en) | 2013-04-08 | 2016-10-18 | Qualcomm Incorporated | Coding video data for an output layer set |
CN104488271B (zh) * | 2013-07-26 | 2019-05-07 | 北京大学深圳研究生院 | 一种基于p帧的多假设运动补偿方法 |
JP5702011B2 (ja) * | 2014-04-07 | 2015-04-15 | 株式会社東芝 | 符号化方法、符号化装置及びプログラム |
JP5869160B2 (ja) * | 2015-02-16 | 2016-02-24 | 株式会社東芝 | 復号方法、復号装置及びプログラム |
JP6088036B2 (ja) * | 2015-12-22 | 2017-03-01 | 株式会社東芝 | 復号方法、復号装置及びプログラム |
RU2638756C2 (ru) * | 2016-05-13 | 2017-12-15 | Кабусики Кайся Тосиба | Устройство кодирования, устройство декодирования, способ кодирования и способ декодирования |
CN106358041B (zh) | 2016-08-30 | 2019-05-10 | 北京奇艺世纪科技有限公司 | 一种帧间预测编码方法及装置 |
CN106230578B (zh) * | 2016-09-08 | 2019-09-27 | 哈尔滨工程大学 | 一种基于加权处理的三维Lorenz映射控制的二进制安全算术编码方法 |
JP6235742B2 (ja) * | 2017-01-30 | 2017-11-22 | 株式会社東芝 | 電子機器、復号方法及びプログラム |
JP6235745B2 (ja) * | 2017-02-23 | 2017-11-22 | 株式会社東芝 | 電子機器、復号方法及びプログラム |
CN106851389A (zh) * | 2017-02-24 | 2017-06-13 | 深圳市安拓浦科技有限公司 | 一种使用wifi传输tv信号的设备 |
US10778978B2 (en) * | 2017-08-21 | 2020-09-15 | Qualcomm Incorporated | System and method of cross-component dynamic range adjustment (CC-DRA) in video coding |
JP6396566B2 (ja) * | 2017-10-20 | 2018-09-26 | 株式会社東芝 | 電子機器、符号化方法及びプログラム |
EP3744102A1 (en) * | 2018-01-24 | 2020-12-02 | Vid Scale, Inc. | Generalized bi-prediction for video coding with reduced coding complexity |
US20190246114A1 (en) * | 2018-02-02 | 2019-08-08 | Apple Inc. | Techniques of multi-hypothesis motion compensation |
US11924440B2 (en) * | 2018-02-05 | 2024-03-05 | Apple Inc. | Techniques of multi-hypothesis motion compensation |
WO2019174157A1 (zh) * | 2018-03-16 | 2019-09-19 | 青岛海信激光显示股份有限公司 | 激光投影装置 |
WO2019229683A1 (en) * | 2018-05-31 | 2019-12-05 | Beijing Bytedance Network Technology Co., Ltd. | Concept of interweaved prediction |
JP2019009792A (ja) * | 2018-08-22 | 2019-01-17 | 株式会社東芝 | 符号化方法、復号方法及び符号化データ |
TWI831837B (zh) | 2018-09-23 | 2024-02-11 | 大陸商北京字節跳動網絡技術有限公司 | 仿射模型的多個假設 |
WO2020084472A1 (en) | 2018-10-22 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Affine mode parameter inheritance or prediction |
US11134246B2 (en) * | 2019-01-02 | 2021-09-28 | Shumaker & Sieffert, P.A. | Weighted prediction for video coding |
CN113597760A (zh) | 2019-01-02 | 2021-11-02 | 北京字节跳动网络技术有限公司 | 视频处理的方法 |
CN117376552A (zh) * | 2019-09-16 | 2024-01-09 | Lg电子株式会社 | 解码设备、编码设备和发送设备 |
JP6744507B2 (ja) * | 2020-01-07 | 2020-08-19 | 株式会社東芝 | 符号化方法および復号方法 |
FR3120174A1 (fr) * | 2021-02-19 | 2022-08-26 | Orange | Prédiction pondérée d’image, codage et décodage d’image utilisant une telle prédiction pondérée |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004007379A (ja) * | 2002-04-10 | 2004-01-08 | Toshiba Corp | 動画像符号化方法及び動画像復号化方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
JP2004519167A (ja) * | 2001-02-13 | 2004-06-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 動き情報の符号化及び復号化方法 |
HK1037462A2 (en) * | 2001-07-20 | 2002-01-04 | Univ City Hong Kong | Image compression |
EP1833262A1 (en) * | 2002-01-18 | 2007-09-12 | Kabushiki Kaisha Toshiba | Video encoding method and apparatus and video decoding method and apparatus |
US7003035B2 (en) * | 2002-01-25 | 2006-02-21 | Microsoft Corporation | Video coding methods and apparatuses |
ES2535957T3 (es) | 2002-10-01 | 2015-05-19 | Panasonic Intellectual Property Corporation Of America | Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos |
EP1582063B1 (en) * | 2003-01-07 | 2018-03-07 | Thomson Licensing DTV | Mixed inter/intra video coding of macroblock partitions |
US7809059B2 (en) * | 2003-06-25 | 2010-10-05 | Thomson Licensing | Method and apparatus for weighted prediction estimation using a displaced frame differential |
US8731054B2 (en) | 2004-05-04 | 2014-05-20 | Qualcomm Incorporated | Method and apparatus for weighted prediction in predictive frames |
KR100654436B1 (ko) * | 2004-07-07 | 2006-12-06 | 삼성전자주식회사 | 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더 |
JP5062833B2 (ja) * | 2004-09-16 | 2012-10-31 | トムソン ライセンシング | 局在的な輝度変動を利用した重み付き予測ビデオ・コーデックのための方法および装置 |
US8228994B2 (en) * | 2005-05-20 | 2012-07-24 | Microsoft Corporation | Multi-view video coding based on temporal and view decomposition |
-
2006
- 2006-05-24 US US11/440,604 patent/US8457203B2/en active Active
- 2006-05-25 EP EP06771414.7A patent/EP1891810B1/en active Active
- 2006-05-25 JP JP2008508011A patent/JP2008541502A/ja active Pending
- 2006-05-25 CN CN200680016666XA patent/CN101176350B/zh active Active
- 2006-05-25 WO PCT/US2006/020633 patent/WO2006128072A2/en active Application Filing
-
2010
- 2010-12-06 JP JP2010271444A patent/JP5086422B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004007379A (ja) * | 2002-04-10 | 2004-01-08 | Toshiba Corp | 動画像符号化方法及び動画像復号化方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9161057B2 (en) | 2009-07-09 | 2015-10-13 | Qualcomm Incorporated | Non-zero rounding and prediction mode selection techniques in video encoding |
JP2012533212A (ja) * | 2009-07-09 | 2012-12-20 | クゥアルコム・インコーポレイテッド | ビデオコーディングにおける単方向予測および双方向予測のための異なる重み付け |
US9609357B2 (en) | 2009-07-09 | 2017-03-28 | Qualcomm Incorporated | Non-zero rounding and prediction mode selection techniques in video encoding |
US8995526B2 (en) | 2009-07-09 | 2015-03-31 | Qualcomm Incorporated | Different weights for uni-directional prediction and bi-directional prediction in video coding |
JP2013505615A (ja) * | 2009-09-17 | 2013-02-14 | ミツビシ・エレクトリック・アールアンドディー・センター・ヨーロッパ・ビーヴィ | 動画像の重み付き動き補償 |
JP2011223340A (ja) * | 2010-04-09 | 2011-11-04 | Ntt Docomo Inc | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、及び、動画像復号プログラム |
WO2012096104A1 (ja) * | 2011-01-12 | 2012-07-19 | 株式会社エヌ・ティ・ティ・ドコモ | 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法、及び画像予測復号プログラム |
JP2012147273A (ja) * | 2011-01-12 | 2012-08-02 | Ntt Docomo Inc | 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法、及び画像予測復号プログラム |
WO2012172668A1 (ja) * | 2011-06-15 | 2012-12-20 | 株式会社 東芝 | 動画像符号化方法及び装置並びに動画復号化方法及び装置 |
JPWO2012172668A1 (ja) * | 2011-06-15 | 2015-02-23 | 株式会社東芝 | 動画像符号化方法及び装置並びに動画復号化方法及び装置 |
JP2019519148A (ja) * | 2016-05-13 | 2019-07-04 | ヴィド スケール インコーポレイテッド | ビデオ符号化のための一般化された多重仮説予測(Generalized Multi−Hypothesis Prediction)のためのシステムおよび方法 |
US11363253B2 (en) | 2016-05-13 | 2022-06-14 | Vid Scale, Inc. | Systems and methods for generalized multi-hypothesis prediction for video coding |
JP7469439B2 (ja) | 2016-05-13 | 2024-04-16 | ヴィド スケール インコーポレイテッド | ビデオ符号化のための一般化された多重仮説予測(Generalized Multi-Hypothesis Prediction)のためのシステムおよび方法 |
JP2020520174A (ja) * | 2017-05-10 | 2020-07-02 | 華為技術有限公司Huawei Technologies Co.,Ltd. | ビデオ圧縮における双方向予測 |
JP2020129848A (ja) * | 2020-05-29 | 2020-08-27 | 株式会社東芝 | 符号化データのデータ構造、記憶装置、送信装置および符号化方法 |
JP7000498B2 (ja) | 2020-05-29 | 2022-01-19 | 株式会社東芝 | 記憶装置、送信装置および符号化方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1891810B1 (en) | 2020-03-18 |
CN101176350B (zh) | 2011-02-23 |
CN101176350A (zh) | 2008-05-07 |
US8457203B2 (en) | 2013-06-04 |
JP5086422B2 (ja) | 2012-11-28 |
EP1891810A2 (en) | 2008-02-27 |
WO2006128072A3 (en) | 2007-03-01 |
JP2011091840A (ja) | 2011-05-06 |
US20060268166A1 (en) | 2006-11-30 |
WO2006128072A2 (en) | 2006-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5086422B2 (ja) | 動き及び予測の重み付けパラメータを符号化する方法及び装置 | |
JP5378791B2 (ja) | 適応補間を使用する映像符号化及び復号化の方法と装置 | |
AU2020294315B2 (en) | Method and apparatus for motion compensation prediction | |
TWI231711B (en) | Improved interpolation of video compression frames | |
JP2005354686A (ja) | ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法およびシステム | |
CA2621423A1 (en) | Efficient integrated digital video transcoding | |
JP2007503776A (ja) | インター符号化に使われる参照画像数を最小化するための方法および装置 | |
JP2008547324A (ja) | ハイブリッド映像圧縮のための非線形予測フィルタ | |
TW201216716A (en) | Motion compensation using vector quantized interpolation filters | |
US7068850B2 (en) | Decoding of predicted DC coefficient without division | |
Uchihara et al. | Quantization parameter control and fast code modification for fast stream joiner | |
JP2006511164A (ja) | 弾性記憶 | |
JP4169767B2 (ja) | 符号化方法 | |
Xu et al. | Intra-predictive transforms for block-based image coding | |
JP4243286B2 (ja) | 符号化方法 | |
JPH10126794A (ja) | 動き予測フレーム間画像信号圧縮装置 | |
EP4268460A1 (en) | Temporal filter | |
JP2022070176A (ja) | 符号化装置及びプログラム | |
Muzaffar et al. | Video data reduction with error resilience based on macroblock reorder | |
Ismaeil | Computation-distortion optimized DCT-based video coding | |
PO et al. | Data Compression Techniques in Image Processing Systems | |
JP2007529921A (ja) | 画像エンコード・システムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110308 |