JP5566529B2 - 辞書を用いてビデオをコード化する方法 - Google Patents

辞書を用いてビデオをコード化する方法 Download PDF

Info

Publication number
JP5566529B2
JP5566529B2 JP2013508709A JP2013508709A JP5566529B2 JP 5566529 B2 JP5566529 B2 JP 5566529B2 JP 2013508709 A JP2013508709 A JP 2013508709A JP 2013508709 A JP2013508709 A JP 2013508709A JP 5566529 B2 JP5566529 B2 JP 5566529B2
Authority
JP
Japan
Prior art keywords
dictionary
video
macroblock
decoded
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013508709A
Other languages
English (en)
Other versions
JP2013538471A (ja
Inventor
コーエン、ロバート・エイ
カン、ジェウォン
ヴェトロ、アンソニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2013538471A publication Critical patent/JP2013538471A/ja
Application granted granted Critical
Publication of JP5566529B2 publication Critical patent/JP5566529B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/97Matching pursuit coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Description

この発明は、包括的には、ビデオの符号化及び復号化に関し、より詳細には、辞書を用いてビデオをコード化する方法に関する。
高効率ビデオコーディング(HEVC)と呼ばれるビデオコーディング標準規格プロジェクトが、ビデオコーディング共同研究部会(JCT−VC)によって開始された。この標準規格の1つの目標は、より広い用途において、かつより広いビット範囲において、旧来のH.264/AVC標準規格を上回るようにコーディング性能を改善することである。HEVCビデオコーディング標準規格の初期の枠組みは、ブロックに基づく予測技法、2D離散コサイン変換(DCT)による変換、及びコンテキストに基づくエントロピーコーディング等における従来のビデオコーディング標準規格とあまり大きく異なるものではない。新たなコーディングツールはより進化し柔軟性があるが、計算複雑度が増大している。従来のコーディング技法と同様に、符号化器及び復号化器は一連のビデオフレームに対し動作する。ビデオ内のフレームはピクセルのマクロブロックに分割される。マクロブロックは、フレーム内で空間的に隣接することができ(インターモードコーディングの場合)、連続したフレームにおいて時間的に隣接することができる(イントラモードコーディングの場合)。
画像コーディング及びビデオコーディングにおいて主要な変換領域を表現するのに、DCT又はウェーブレット等の直交及び双直交の完全な辞書が用いられてきた。過完全辞書にわたる信号のスパースで冗長な表現は、画像の雑音除去等の様々な用途への適用に成功してきた。
過完全ビデオコーディング技法は、従来のビデオコーディング標準規格と比較して非常に低いビットレートで、競合可能なコーディング利得を達成することができる。基本的に、ブロックに基づく2D−DCT変換は、過完全ビデオコーディングにおいて、より大きく、より適した基底関数の展開と置き換えられる。低ビットレートのビデオコーディングにおいて、残差信号は、量子化パラメーター(QP)がより大きいことに起因して、より少ない非ゼロDCT係数で表され、このため、低周波数成分のみがマクロブロック内に現れる。このシナリオでは、過完全辞書の集合によって、完全な辞書集合よりも多岐にわたる忠実な残差信号表現を提供することができる。このため、残差信号は、より少ない係数を用いてより良好に近似することができる。
従来の過完全ビデオコーディングは、変調されたガボール関数を用いて辞書集合を構成する。マッチング追跡(MP)を用いて、表現内の最も適した辞書要素が選択される。MPによって、スパース信号表現の準最適解が決まる。辞書集合は、ウェーブレット、カーブレット、及び離散フーリエ変換(DFT)等の幾つかの解析関数によって生成された辞書を連結することによって様々な形をとることができる。カーブレットは、ウェーブレットの概念を拡張したものである。カーブレットは、マルチスケールのオブジェクト表現のために非適応技法を用いる。ウェーブレットは、ロケーション及び空間周波数の双方を表す基底を用いることによってフーリエ変換を一般化する。2D信号又は3D信号の場合、方向ウェーブレット変換は、向きも局所化した基底関数を用いる。カーブレット変換は、向きの局所化の度合いがスケールとともに変動するという点で、他の方向ウェーブレット変換と異なる。
しかしながら、これらのモデルは、その単純性にもかかわらず欠点を有する。自然な画像又はビデオは多くの場合に、これらのモデルによって良好に表現されない特徴を含む。これらの場合、再構成不良、又はリンギング等のアーティファクトが、復号化された画像又はビデオ内に生じる可能性がある。
残差信号は、予測後に方向性のある向きを有する傾向にあるので、辞書トレーニングを用いることができる。したがって、残差信号の特性を反映することによって、辞書集合を良好に設計することができる。イントラコーディングのために、モードに依拠した方向変換を用いることができる。方向予測に対応するイントラ予測残差を用いて完全な辞書を構成することができる。辞書トレーニングは、画像コーディング用途におけるイントラ予測にも適合させることができる。
この発明の実施の形態は、辞書集合を用いてビデオを符号化及び復号化するための方法を提供する。辞書集合は、サンプルを用いてトレーニングされ、サンプルはインター予測又はイントラ予測された残差信号である。辞書要素の集合は、隣接するマクロブロックにも用いることができる。最適な辞書要素数は、レート歪み最適化を用いて求められる。
この発明は、コンテキスト適応過完全辞書に基づいた、辞書に基づくビデオ符号化技法を提供する。辞書集合を、インター予測及び/又はイントラ予測された残差サンプルを用いてトレーニングし、これらの辞書をスパース信号表現に適用した。辞書要素は、後続のサンプルをコード化するのに再利用することができる。
従来技術の符号化器のブロック図である。 この発明の実施の形態による符号化器のブロック図である。 この発明の実施の形態による、過完全辞書を構成するプロセスの概略図である。 従来技術の復号化器のブロック図である。 この発明の実施の形態による復号化器のブロック図である。 この発明の実施の形態によるコピーモード評価器のブロック図である。
信号
Figure 0005566529
は、過完全辞書
Figure 0005566529
内のm個の要素のスパース線形結合として表すことができる。ここで、mは実質的にnより大きく、Dは最大階数行列である。
非ゼロ要素数が、基底内の非ゼロ要素数よりも多数であるとき、辞書は過完全であると定義される。過完全性は、より安定したコンパクトな表現を達成する。
信号yを、最小数の辞書要素で近似する。スパース表現が以下に従って求められ、
Figure 0005566529
ここで、
Figure 0005566529
は信号yを表す係数のベクトルであり、|・|は信号のlpでノルムを表し、δは小さな所定のしきい値である。
辞書は、サンプルデータにより良好に適合するようにトレーニングされる。このため、式(1)における最小化問題は、以下のように、信号yの表現のための所与のスパース性制約Cについて最良の辞書を得るように変換することができる。
Figure 0005566529
辞書は、非ゼロ係数の数がC以下であるとき、実際の信号のより良好な表現を提供するようにトレーニングされる。
図3に示すように、従来の画像コーディングと異なり、この発明では、イントラ予測又はインター予測のいずれかを実行し、次に、ビデオ信号の残差データサンプル451を符号化する。分類器210は、コンテキストI211及びコンテキストK212を、コンテキストI及びコンテキストKの対応するトレーニング221及び222のために生成する。図3に示すように、コンテキストKの辞書231は、コンテキストIの辞書232のよりランダムな要素よりも多くの対角要素を含む。対角要素は、インターコーディングにおけるエッジ表現に有用である。
このため、この発明の1つの実施の形態では、辞書は、現在のビデオシーケンスの符号化前に、予測残差信号451を用いてトレーニングされる。そのようなトレーニングは、通常、トレーニングビデオの別個の集合を用いてオフラインで行われる。符号化器及び復号化器の双方が同じ辞書集合を有し、これらは通常、ビデオシーケンスのコーディングについて固定である。
この発明の別の実施の形態では、辞書は、現在のビデオシーケンスの符号化及び復号化中に、予測残差信号451を用いてトレーニングされる。この実施の形態では、トレーニングに用いられるデータは、符号化器及び復号化器の双方において利用可能な、現在のビデオの以前に復号化されたサンプルと関連付けられた予測残差信号を含む。符号化器及び復号化器の双方が同じ辞書集合を維持するが、辞書は動的であり、ビデオシーケンスの符号化プロセス及び復号化プロセス中に周期的に更新される。
辞書トレーニングは、残差信号特性の局所分散を無視する可能性があり、非常に大きなトレーニングデータ集合から比較的小さな辞書要素集合が生成される。このため、残差サンプルの幾つかの顕著な特徴が辞書集合から削除される可能性がある。この問題を解決するために、辞書をトレーニングする(221及び222)ときに、残差サンプルのコンテキスト211及び212を適用する。
分類器210は、残差サンプルのタイプとともに変化することができる。例えば、イントラコード化された残差において、この発明では、残差サンプルが、H.264/AVC標準規格による符号化器/復号化器(codec)における方向イントラ予測について或る特定の特性を有するという仮定に依拠する。したがって、複数の辞書集合が、予測方向にそれぞれ対応するサンプル451から構成される。
所与のマクロブロックのイントラ予測モードが決定された後、分類器210を用いて、いずれのコンテキスト211及び212を用いるかが示され、次に、符号化中に、対応する辞書が適用される。このため、復号化器において更なる副情報は必要とされない。インターコード化された残差信号において、分類器は、サンプルのエネルギーを検査し、このエネルギーを対応するトレーニングモジュールに転送して、本発明者らによるコンテキスト適応辞書を生成する。このため、コンテキストは、復号化器において既に利用可能なデータによって求められる。
辞書の要素に基づくビデオコーディング
汎用データサンプルから辞書集合がトレーニングされた後、辞書は、符号化中に入力残差信号のスパース表現のために用いられる。
図1は従来の符号化器を示している。入力は、マクロブロック301であり、出力はビットストリーム309である。マクロブロックは変換され(310)、量子化信号に量子化される(320)。量子化信号はエントロピーコード化され(330)、ビットストリーム309が生成される。また、エントロピーコーダー出力は、入力マクロブロック301と結合されるとき、逆量子化され(340)、逆変換され(350)、イントラ予測360に用いられる。
従来の復号化器
図4は、従来の復号化器を示している。入力はビットストリーム1451であり、出力はマクロブロック1457である。ビットストリームはエントロピー復号化され(1452)、逆量子化される(1453)。復号化された変換係数は、逆変換される(1454)。イントラ予測又はインター予測の残差1455が結合され(1456)、復号化されたマクロブロックが生成される。このマクロブロックは出力され、バッファ1456内に格納され、今後の復号化されたマクロブロックの再構成のために用いられる。
辞書に基づく符号化器
図2は、この発明の実施の形態による符号化器を示している。符号化器のステップは、当該技術分野において既知のメモリ及び入出力インターフェースに接続されたプロセッサにおいて実行することができる。
符号化器への入力は現在のマクロブロック301である。ビデオの特定のセグメントのための辞書が、ビデオの特定のセグメントの符号化が進む前に、予測残差信号451を用いてトレーニングされる(401)。量子化320の前に、辞書要素(アトム)の中で最も適合した基底が選択される(402)。要素選択402のために、マッチング追跡(MP)等のプロセスを用いることができる。
コピーモード評価器450は、以前のブロック452のために用いられていた辞書インデックスと、予測残差信号451と、辞書ポインターと、辞書要素インデックスと、独自の辞書要素、すなわち、コピーモード評価器を用いることなく選択される要素を用いてコード化されるときの現在のブロックの歪みと、を入力としてとる。評価器はコピーモード信号453を生成する。この生成は、以前に計算された辞書インデックスの集合を用いることが、新たに計算された辞書インデックスを用いることよりも良好に機能するか否かを評価する、レート歪み最適化判定プロセスの結果に依拠する。コピーモード評価器(CME)は図6に示されている。
簡単に図6を参照すると、CMEへの入力は、以前にコード化されたブロック452のために用いられていた辞書インデックスと、現在のブロック301の予測残差とである。現在のブロックのために特定の辞書(A〜D)を用いて、スケーリング係数が求められ(402)、次に再構成され復号化された予測残差451が求められ、これらはR−Dコスト最適化プロセス600に入力されて、コピーモード信号453が生成される。
図2について続けると、選択された辞書要素は逆量子化された信号を生成するために逆量子化され(340)、この信号はエントロピー符号化され(330)、ビットストリーム309が生成される。ビデオは、逆量子化された(340)信号から再構成される(403)。再構成されたビデオは、次にイントラ予測360のために用いられる。
MPは、スパース信号表現における準最適で追跡可能な解として知られている。この発明の好ましい実施の形態では、MPを用いて辞書内の適切な要素を選択する(402)。各反復中、MPは、再構成されたビデオの残差信号を最小にすることによって、辞書要素の線形結合を形成する。このため、係数値と、復号化器において信号を再構成するのにいずれの辞書要素が用いられるかを示す1つ又は複数のインデックスの集合とを含めることが必要とされる。反復は、式(2)のスパース性制約Cを超えず、レート歪み(R−D)コストが最小になると終了し、それによって信号は、スパース性制約以下の複数の非ゼロ係数を用いて最適に表現することができる。
辞書要素の選択402後、係数は、量子化320及びエントロピーコーディング330に渡される。この発明による方法によって用いられる辞書集合の係数分布をプロットするために、ラプラシアン分布をあてはめることができる。このため、一様量子化器が本方法に効率的に適合される。
エントロピーコーダー330において、スケーリング係数の統計に基づいて、スケーリング係数値がハフマンテーブルにより二値化される。辞書インデックスの出現はインデックスにわたってほぼ一様であり、このため、いかなる適応的な又は固定の走査順序でも、非ゼロ係数を効率的に集めることはできない。このため、インデックスは、サイズが
Figure 0005566529
の固定長コードで符号化され、ここで、mは辞書要素数である。
再構成403も復号化器によって実行され、この再構成403中、辞書要素の線形結合における重みのために、量子化されたスケーリング係数が用いられる。用いられる辞書要素集合は、インデックス集合によって表される。
上述した処理に加えて、符号化器はコピーモード評価器(CME)450も組み込む。CMEへの入力は、コード化される現在の予測残差信号と、以前に符号化されたブロックを符号化するのに用いられた辞書ポインター及び要素インデックスの集合である。辞書ポインターは、以前にコード化されたブロックを符号化するのにいずれの辞書が用いられたかを示し、要素インデックスは、以前にコード化されたブロックを符号化するのに、その辞書内のいずれの要素が用いられたかを示す。
次に、CMEは、以前にコード化されたブロックを符号化するのに用いられたのと同じ要素を用いて現在の予測残差を再符号化する。このプロセスは、幾つかの他の以前にコード化されたブロックについて繰り返される。通常、現在のブロックに隣接したブロック、例えば左のブロック、上のブロック、左上のブロック、及び右上のブロックが検査される。
上述した辞書要素選択を用いて生成された歪みとともに、全ての場合について生成された歪み値が比較される。辞書要素によって最も少ない歪みが得られる場合、辞書要素インデックス及び対応するスケーリング係数が出力ビットストリーム内に含められる。
コピーモードのうちの1つによって最も少ない歪みが得られる場合、コピーモード信号、及びいずれのコピーモードが最良であったかをシグナリングするインジケーターがビットストリーム内に含められる。コピーモードが用いられる場合、この時点において辞書要素インデックスをシグナリングする必要がない。なぜなら、このインデックスは、前のブロックがコード化されたときに既に送信されたためである。
辞書に基づく復号化器
図5は、この発明の実施の形態による復号化器を示している。入力は符号化されたビデオビットストリーム501であり、出力は復号化されたマクロブロック509である。ビットストリーム内の各現在のマクロブロックは、エントロピー復号化され(510)、逆量子化されて(520)、復号化された係数521が生成される。この係数はスケーラー及び結合器530に入力される。この係数は、1つ又は複数の辞書要素をスケーリングするのに用いられる。スケーリングされた要素は、通常、線形結合され、復号化されたマクロブロック予測残差信号が再構成される。この残差は、バッファ540内に記憶されている以前に復号化されたマクロブロックと結合され、出力マクロブロック509が生成される。
ビットストリーム501から復号化されたインデックス502は、インデックスバッファ505内に記憶される。インデックスを用いて、現在の予測残差を再構成するのに用いられる辞書要素551が選択される(550)。インデックスがビットストリームを介して受信されない場合、コピーモード信号503を用いて、以前に用いられた辞書要素のいずれの集合が現在のブロックを復号化するのに用いられるかが示される。例えば、コピーモード値は、現在のブロックの左のブロックを生成するのに用いられた要素が、現在のブロックを再構成するのに用いられることを示すことができる。別の例では、現在のブロックの上のブロックを生成するのに用いられた要素を用いることができる。このコピーモード信号を有することの主な目的は、コピーモード信号が、インデックスと比較してはるかに少ないビットしか必要としないことである。
個々の記憶された辞書570は、符号化器において用いられる予測モードに依拠して利用可能とすることができるので、予測モード信号504を用いて、符号化器において記憶された辞書のうちのいずれを用いるかが選択される(560)。予測モード504は、従来の復号化器において予測モードが用いられるのと同様にして、復号化器におけるイントラ/インター予測モジュール580によっても用いられる。
R−D最適辞書要素選択
MPによって辞書要素が選択され(550)、反復中に係数が求められる。ほとんどのビデオコーディング標準規格の重要な特徴はR−D最適化である。R−D最適化は、550において実行され、以下で式(3)によって説明される、反復MPプロセスをいつ終了するか等の幾つかの判定プロセス、及び図6のコピーモード評価器のモジュール600における幾つかの判定プロセスに用いられる。符号化器は、固定数の係数の代わりに、D(N)+λR(N)によって定義されたR−Dコストを最小にすることによって、最良のスパース近似を提供することができる。ここで、R(N)は推定ビット数であり、D(N)は、元の信号と再構成された信号との間の最小二乗誤差(MSE)であり、λはラグランジュ乗数である。
R−D歪みは、符号化器がMPにおける反復をいつ終了するかも示す。Nをドロップすることによって、非ゼロ係数の最適数は以下によって求めることができる。
Figure 0005566529
ここで、Cは所与のスパース性制約であり、Rはヘッダに必要なビットを示し、RはMPスケーリング係数に必要なビットを示し、Rはインデックス表現に必要なビットを示す。
ヘッダ情報は、非ゼロ係数の数、すなわち反復数を含み、それによって、復号化器は再構成中の正しい要素数を求める。符号化器は、最適値によって、或る特定のビットバジェットの制約における最良のスパース近似を提供する。このプロセスは、復号化器、例えば図5の辞書要素選択器550における使用にも利用可能である。
辞書インデックスコピー法を用いた進化型コーディング技法
MPを用いた辞書インデックス選択プロセスに加えて、この発明では、インデックスコピー法も提供する。一般に、隣接するブロックは空間領域において類似したコンテキストを有すると仮定することができる。そして、辞書要素は再構成中、基底関数としてふるまう。このため、隣接する残差信号において類似したパターンが現れるとき、同じ辞書要素集合を隣接するブロック間で再利用することができる。現在の信号の係数は、以前の辞書要素を適用することによって求められる。したがって、符号化器は、インデックスコーディングに必要なビット量を低減することができる。候補間でR−Dコストを検査することによって選択された(600)インデックス集合のソースを示すフラグがシグナリングされる。
インデックスコピー法は、信号特性が隣接するブロックにおいて実質的に安定しているときに効率的とすることができる。したがって、この方法は、ビデオの同種のエリアにおける隣接ブロックに適合させることができる。
産業上の利用可能性
この発明の方法は、多種の分野の多くのビデオ符号化及び復号化に適用可能である。

Claims (12)

  1. ビデオ復号化器においてビットストリームとして符号化されたビデオを復号化する方法であって、
    復号化された予測残差信号から生成された辞書集合を維持するステップであって、該辞書集合の要素は関連付けられたインデックスを有し、各辞書が複数の要素を有するものと、
    前記ビットストリームの現在のマクロブロックをエントロピー復号化及び逆量子化して、復号化された係数を生成するステップと、
    前記現在のマクロブロックについて、前記ビットストリームにおいてシグナリングされる予測モードに従って前記辞書集合の特定の辞書を、前記特定の辞書の1つまたは複数の要素が前記現在のマクロブロックのスパースな表現を形成するように、選択するステップと、
    前記インデックスを前記ビットストリームを介して受けた時に、前記インデックスに従って前記特定の辞書の各特定の要素を選択し、その他の時に、前記現在のマクロブロックの再構成のために、前記特定の辞書の以前に使用された要素を表すコピーモード信号に従って前記特定の辞書の特定の要素を選択するステップと、
    前記復号化された係数を用いて、前記特定の要素をスケーリング及び結合して、現在の復号化されたマクロブロック予測残差信号を再構成するステップと、
    前記現在の復号化されたマクロブロック予測残差信号を、以前に復号化されたマクロブロックと結合して、再構成されたビデオの出力マクロブロックを生成するステップと、
    を含み、
    前記ステップは復号化器において実行される、ビデオ復号化器においてビットストリームとして符号化されたビデオを復号化する方法。
  2. 前記辞書集合は過完全である、請求項1に記載の方法。
  3. 前記予測モードは、前記現在のマクロブロックを復号化するのに用いられる前記辞書を選択する、請求項1に記載の方法。
  4. 前記要素は、符号化時にマッチング追跡(MP)プロセスを用いて選択されたものである、請求項1に記載の方法。
  5. 前記MPプロセスは、前記再構成されたビデオの残差を最小にすることによって、辞書要素の線形結合を形成するものである、請求項4に記載の方法。
  6. 前記MPプロセスは、レート歪みコストが最小にされるまで反復するものである、請求項4に記載の方法。
  7. 前記係数は、該係数の統計に基づいてハフマンテーブルにより二値化される、請求項1に記載の方法。
  8. 前記復号化された予測残差信号は、前記ビデオの以前に復号化されたマクロブロックから得られる、請求項1に記載の方法。
  9. 前記復号化された予測残差信号は、トレーニングビデオの集合の復号化されたマクロブロックから得られる、請求項1に記載の方法。
  10. 復号化されたマクロブロックを再構成するのに用いられたのと同じ辞書要素が、前記現在のマクロブロックを再構成するのに用いられる、請求項1に記載の方法。
  11. 前記インデックスは、後の使用のためにバッファ内に記憶される、請求項1に記載の方法。
  12. 前記ビデオは、該ビデオのサンプルから符号化辞書の集合を構成することによって符号化され、前記サンプルは予測残差であり、
    前記符号化辞書の集合を前記ビデオに適用して、該辞書集合から選択された要素を用いて前記ビデオのスパース表現を生成するステップと、
    前記スパース表現を量子化して、量子化された信号を生成するステップと、
    前記量子化された信号をエントロピーコード化して、ビットストリームを生成するステップと、
    を更に含む、請求項1に記載の方法。
JP2013508709A 2010-12-28 2011-12-20 辞書を用いてビデオをコード化する方法 Active JP5566529B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/979,414 2010-12-28
US12/979,414 US8767835B2 (en) 2010-12-28 2010-12-28 Method for coding videos using dictionaries
PCT/JP2011/080144 WO2012090975A1 (en) 2010-12-28 2011-12-20 Method for coding videos using dictionaries

Publications (2)

Publication Number Publication Date
JP2013538471A JP2013538471A (ja) 2013-10-10
JP5566529B2 true JP5566529B2 (ja) 2014-08-06

Family

ID=45524910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013508709A Active JP5566529B2 (ja) 2010-12-28 2011-12-20 辞書を用いてビデオをコード化する方法

Country Status (6)

Country Link
US (1) US8767835B2 (ja)
JP (1) JP5566529B2 (ja)
CN (1) CN103329522B (ja)
DE (1) DE112011104625T5 (ja)
TW (1) TWI469644B (ja)
WO (1) WO2012090975A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8767835B2 (en) * 2010-12-28 2014-07-01 Mitsubishi Electric Research Laboratories, Inc. Method for coding videos using dictionaries
US9167274B1 (en) * 2012-03-21 2015-10-20 Google Inc. Generating synchronized dictionaries for sparse coding
US9137528B1 (en) 2012-09-28 2015-09-15 Google Inc. Synchronizing sparse coding dictionaries for use in communication sessions
CN103176946A (zh) * 2013-04-02 2013-06-26 哈尔滨工业大学 一种面向块稀疏信号的稀疏分解去噪方法
RU2666635C2 (ru) 2013-10-14 2018-09-11 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Характеристики режима индексной карты основных цветов для кодирования и декодирования видео и изображения
US11109036B2 (en) 2013-10-14 2021-08-31 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
MX2016004705A (es) 2013-10-14 2016-07-18 Microsoft Technology Licensing Llc Caracteristicas del modo de prediccion copia de bloque interno para codificacion y decodificacion de imagen y video.
CN103561276B (zh) * 2013-11-07 2017-01-04 北京大学 一种图像视频编解码方法
CN103559718B (zh) * 2013-11-19 2016-08-17 福建师范大学 基于稀疏表示的过完备字典训练的视频篡改检测方法
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
WO2015100726A1 (en) 2014-01-03 2015-07-09 Microsoft Corporation Block vector prediction in video and image coding/decoding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
WO2015180052A1 (zh) * 2014-05-28 2015-12-03 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN104053012B (zh) * 2014-05-28 2017-08-29 北京大学深圳研究生院 一种基于字典库的视频编解码方法及装置
CN105493505B (zh) 2014-06-19 2019-08-06 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
FR3024933A1 (fr) * 2014-08-12 2016-02-19 Orange Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants
EP3202150B1 (en) 2014-09-30 2021-07-21 Microsoft Technology Licensing, LLC Rules for intra-picture prediction modes when wavefront parallel processing is enabled
KR101627069B1 (ko) * 2015-04-01 2016-06-02 이화여자대학교 산학협력단 동영상 인코딩에서 잔차 신호에 대한 희소 변환 방법, 희소 변환을 이용한 동영상 인코딩 방법 및 희소 변환을 이용하여 부호화된 신호에 대한 디코딩 방법
CN106664405B (zh) 2015-06-09 2020-06-09 微软技术许可有限责任公司 用调色板模式对经逸出编码的像素的稳健编码/解码
CN105872549B (zh) * 2016-05-16 2018-08-03 中国科学技术大学 基于块搜索和正交匹配追踪的视频变换编码方法
US11172221B2 (en) * 2017-06-26 2021-11-09 Interdigital Madison Patent Holdings, Sas Method and apparatus for intra prediction with multiple weighted references
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
WO2021108788A1 (en) * 2019-11-30 2021-06-03 Bytedance Inc. Palette coding mode
CN114501010B (zh) * 2020-10-28 2023-06-06 Oppo广东移动通信有限公司 图像编码方法、图像解码方法及相关装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6883035B2 (en) * 2000-11-16 2005-04-19 Telefonaktiebolaget Lm Ericsson (Publ) System and method for communicating with temporary compression tables
US6925126B2 (en) * 2001-04-18 2005-08-02 Koninklijke Philips Electronics N.V. Dynamic complexity prediction and regulation of MPEG2 decoding in a media processor
US7003039B2 (en) * 2001-07-18 2006-02-21 Avideh Zakhor Dictionary generation method for video and image compression
AU2004223358B2 (en) * 2003-03-28 2010-04-01 Etiip Holdings Inc Overcomplete basis transform-based motion residual frame coding method and apparatus for video compression
US7769088B2 (en) * 2003-05-28 2010-08-03 Broadcom Corporation Context adaptive binary arithmetic code decoding engine
EP1656644B1 (en) * 2003-08-12 2009-12-02 Nxp B.V. Video encoding and decoding methods and corresponding devices
WO2009088976A1 (en) * 2008-01-07 2009-07-16 Thomson Licensing Methods and apparatus for video encoding and decoding using parametric filtering
WO2010087808A1 (en) 2009-01-27 2010-08-05 Thomson Licensing Methods and apparatus for transform selection in video encoding and decoding
US8391370B1 (en) * 2009-03-11 2013-03-05 Hewlett-Packard Development Company, L.P. Decoding video data
US8767835B2 (en) * 2010-12-28 2014-07-01 Mitsubishi Electric Research Laboratories, Inc. Method for coding videos using dictionaries

Also Published As

Publication number Publication date
US20120163451A1 (en) 2012-06-28
JP2013538471A (ja) 2013-10-10
WO2012090975A1 (en) 2012-07-05
DE112011104625T5 (de) 2013-10-02
CN103329522B (zh) 2016-08-10
US8767835B2 (en) 2014-07-01
CN103329522A (zh) 2013-09-25
TW201234864A (en) 2012-08-16
TWI469644B (zh) 2015-01-11

Similar Documents

Publication Publication Date Title
JP5566529B2 (ja) 辞書を用いてビデオをコード化する方法
US11438601B2 (en) Method for encoding/decoding image and device using same
KR101984826B1 (ko) 변환 계수의 엔트로피 부호화/복호화 방법 및 장치
US9888249B2 (en) Devices and methods for sample adaptive offset coding and/or selection of edge offset parameters
Bankoski et al. Technical overview of VP8, an open source video codec for the web
KR101523452B1 (ko) 비디오 코딩에서 블록에 대한 스캐닝 순서에 기초하여 비디오 블록 내의 마지막 유효 계수의 포지션을 코딩
RU2543519C2 (ru) Способ и устройство для кодирования и декодирования изображения с использованием крупной единицы преобразования
CN108235023B (zh) 用于编码和解码图像的方法、编码和解码设备
CN107396103B (zh) 图像解码方法和设备、数据项编码方法和设备、装置及存储设备
US9591322B2 (en) Coding using a redundant dictionary, such as video coding using a self-adaptive redundant dictionary including spatial and/or temporal prediction candidate atoms
JP2014523186A (ja) エントロピー符号化/復号化方法及びその装置
KR20090097013A (ko) 영상 부호화장치 및 영상 복호화장치
CN115514978A (zh) 用于在视频压缩中的熵代码化的概率的混合
KR20110017302A (ko) 움직임 벡터의 정확도 조절을 이용한 영상 부호화, 복호화 방법 및 장치
KR20120009693A (ko) 다중 예측 필터를 이용하는 경쟁기반 인트라 예측 부호화/복호화 장치 및 방법
CN114679917A (zh) 视频数据的变换跳过残差编码
Zhan et al. Remote sensing image compression based on double-sparsity dictionary learning and universal trellis coded quantization
Blasi et al. Enhanced inter-prediction using merge prediction transformation in the HEVC codec
Cai et al. Improved HEVC lossless compression using two-stage coding with sub-frame level optimal quantization values
JP6402520B2 (ja) 符号化装置、方法、プログラム及び機器
Blasi et al. Masking of transformed intra-predicted blocks for high quality image and video coding
JP6497100B2 (ja) 映像符号化装置、方法及びプログラム
JP2023117786A (ja) 符号化装置、プログラム、及びモデル生成方法
CN116998151A (zh) 一种编码方法、解码方法、编码器、解码器以及存储介质
CN113132734A (zh) 一种编码、解码方法、装置及其设备

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140617

R150 Certificate of patent or registration of utility model

Ref document number: 5566529

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250