JP2013150322A - コンテキストセット選択のための方法およびデバイス - Google Patents

コンテキストセット選択のための方法およびデバイス Download PDF

Info

Publication number
JP2013150322A
JP2013150322A JP2013006050A JP2013006050A JP2013150322A JP 2013150322 A JP2013150322 A JP 2013150322A JP 2013006050 A JP2013006050 A JP 2013006050A JP 2013006050 A JP2013006050 A JP 2013006050A JP 2013150322 A JP2013150322 A JP 2013150322A
Authority
JP
Japan
Prior art keywords
significant coefficient
context
block
flag
flags
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013006050A
Other languages
English (en)
Other versions
JP5526246B2 (ja
Inventor
Neuen Neuen
ノイイェン ノイイェン
Tianying Ji
ティアンイン ジ
Dake He
デイク ヒー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BlackBerry Ltd
Original Assignee
Research in Motion Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research in Motion Ltd filed Critical Research in Motion Ltd
Publication of JP2013150322A publication Critical patent/JP2013150322A/ja
Application granted granted Critical
Publication of JP5526246B2 publication Critical patent/JP5526246B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】コンテキストセット選択のための方法およびデバイスを提供すること。
【解決手段】変換ユニットに対する有意係数フラグを再構成することによってエンコードされたビデオのビットストリームをデコードする方法であって、変換ユニットは、ブロックのシーケンスを含み、ビットストリームは、有意係数フラグのセットをエンコードし、各セットは、それぞれのブロックに対応しており、方法は、第1ブロックに対応する有意係数フラグのセットに対し、第1ブロックの右のブロックに関連付けられた有意係数グループフラグと、第1ブロックの下のブロックに関連付けられた有意係数グループフラグとに基づいて、セットの有意係数フラグをデコードすることに用いるための複数のコンテキストセットからコンテキストセットを選択することと、選択されたコンテキストセットを用いてセットの有意係数フラグをデコードすることとを含む、方法。
【選択図】図7

Description

(著作権情報)
本文書および付随する題材の開示の一部分は、著作権の主張がなされる題材を含んでいる。著作権所有者は、特許文書または特許開示は特許商標庁のファイルまたは記録に現れているので、該特許文書または特許開示の何人による複製に対しても異議を有してはいないが、その他のすべての著作権については、どのようなものであっても留保している。
(分野)
本願は、概して、データ圧縮に関し、特に、有意マップを用いてビデオをエンコードおよびデコードするための方法およびデバイスに関している。
(背景)
データ圧縮は、多くのコンテキストにおいて行われる。データ圧縮は、情報を効率的に格納、伝送、再生するために、通信およびコンピュータネットワーキングにおいて、非常に一般的に用いられている。データ圧縮は、イメージ、オーディオ、ビデオのエンコーディングにおいて、特定の用途を見出している。ビデオは、各ビデオフレームに対して必要な大量のデータと、エンコーディングおよびデコーディングを行うためにしばしば必要とされるスピードとを理由として、データ圧縮に対する重大な挑戦を提示している。ビデオエンコーディングに対する現在の技術水準は、ITU−T H.264/AVCビデオコーディング規格である。該規格は、メインプロファイル、ベースラインプロファイル等を含む、異なる用途に対する多くの異なるプロファイルを定義している。次世代のビデオエンコーディング規格は、High Efficienfy Video Coding(HEVC)といわれるMPEG−ITUの合同研究を通して現在開発中である。該研究は、最終的には、MPEG−Hと一般的に称されるビデオコーディング規格をもたらし得るものである。
ブロックベースのコーディングプロセスを用いるH.264を含む、イメージおよびビデオをエンコード/デコードするための多くの規格が存在する。これらのプロセスにおいて、イメージまたはフレームは、典型的には4×4または8×8であるブロックに分割され、該ブロックは、係数へとスペクトル的に変換され、量子化され、エントロピーエンコードされる。多くの場合においては、変換されるデータは、実際のピクセルデータではなく、予測オペレーションの後の残余データである。予測は、イントラフレーム、すなわちフレーム/イメージ内のブロックごとであり得、あるいはインターフレーム、すなわちフレームの間であり得る(動き予測とも称される)。MPEG−Hもまた、これらの特徴を有し得ることが期待されている。
残余データをスペクトル的に変換するときに、これらの規格のうちの多くは、離散コサイン変換(DCT)またはそれに対するなんらかの変形の使用を記述する。結果としてのDCT係数は、その後、量子化器を用いて量子化され、量子化された変換ドメイン係数または指標を生成する。
量子化された変換ドメイン係数のブロックまたは行列(「変換ユニット」と称される場合がある)は、その後、特定のコンテキストモデルを用いて、エントロピーエンコードされる。H.264/AVCにおいて、そして、MPEG−Hに対する現在開発中の仕事において、量子化された変換係数は、(a)変換ユニットにおける最終非ゼロ係数の位置を示す最終有意係数位置をエンコードすることと、(b)非ゼロ係数を含む変換ユニットにおける位置(最終有意係数位置以外)を示す有意マップをエンコードすることと、(c)非ゼロ係数の大きさをエンコードすることと、(d)非ゼロ係数のサイン(sign)をエンコードすることとにより、エンコードされる。量子化された変換係数のこのエンコーディングは、しばしば、ビットストリーム内のエンコードされたデータの30〜80%を占める。
変換ユニットは、典型的には、N×Nである。一般的なサイズは、4×4、8×8、16×16、32×32を含むが、その他のサイズも可能であり、いくつかの実施形態においては、例えば16×4、4×16、8×32、または32×8等の非正方サイズを含む。有意マップにおけるシンボルのエントロピーエンコーディングは、コンテキストモデルに基づいている。4×4または8×8の輝度または彩度のブロックまたは変換ユニット(TU)の場合においては、別個のコンテキストが、TU内の各係数位置に関連付けられる。エンコーダおよびデコーダは、有意マップのエンコーディングおよびでコーディングの間に、多数の異なるコンテキストを追跡し、かつ調べる必要がある。より大きなTUの場合においては、有意フラグをエンコードするためのコンテキストは、隣接する有意フラグの値に依存し得る。例えば、フラグは、隣接するフラグの値に依存する4つまたは5つのコンテキストから選択するコンテキストを有し得る。いくつかの場合においては、TU内の特定のフラグまたはTUのサブブロックは、例えば左上(DC)位置等の位置に基づくコンテキストを有し得る。
(概要)
本願は、コンテキスト適応エンコーディングまたはデコーディングを用いて有意マップをエンコードおよびデコードするための方法およびエンコーダ/デコーダを記載する。エンコーダおよびデコーダは、マルチレベル有意マップを用いる。少なくとも1つの場合において、マルチレベルマップは、例えば16×16および32×32のTUのような、より大きな変換ユニットとともに用いられる。
一局面においては、本願は、変換ユニットに対する有意係数フラグを再構成することによってエンコードされたビデオのビットストリームをデコードするための方法を記載しており、変換ユニットは、ブロックのシーケンスを含み、ビットストリームは、有意係数フラグのセットをエンコードし、各セットは、それぞれのブロックに対応している。方法は、有意係数フラグのセットのうちの1つに対して、有意係数フラグの当該セットに対応するブロックの変換ユニット内の位置に基づいて、当該セットの有意係数フラグをデコードすることにおいて用いるためのコンテキストセットを選択することと、選択されたコンテキストセットを用いて当該セットの有意係数フラグをデコードすることとを含む。
別の局面において、本願は、変換ユニットに対する有意係数フラグを再構成することによって、エンコードされたビデオのビットストリームをデコードするための方法を記載し、変換ユニットは、ブロックのシーケンスを含み、ビットストリームは、有意係数フラグのセットをエンコードし、各セットは、それぞれのブロックに対応している。方法は、有意係数フラグのセットのうちの1つに対して、当該セットに対する有意係数グループフラグを決定することと、有意係数グループフラグがビットストリームからデコードされた場合には、第1コンテキストセットを選択することによって、当該セットの有意係数フラグをデコードすることにおいて用いるためのコンテキストを選択することと、有意係数グループフラグが、有意係数フラグの少なくとも2つの隣接するセットの有意係数グループフラグに基づいて決定された場合には、異なるコンテキストセットを選択することと、選択されたコンテキストセットを用いて、当該セットの有意係数フラグをデコードすることを含む。
一実施形態において、決定することは、有意係数グループフラグが1に等しいことを決定することを含む。
さらなる実施形態において、決定することは、1に等しい有意係数グループフラグを有する有意係数フラグの右の隣接するセットと、1に等しい有意係数フラグの下の隣接するセットとに基づいて、有意係数グループフラグが1に等しいことを推論することを含む。いくつかの実装において、この方法は、デコーディングの後に、セットがすべてのゼロ係数を含むかどうかを決定し、そうである場合には、有意係数フラグの隣接するセットのうちの有意係数グループフラグを推論するかどうかを後で決定することにおいて用いるために、0に等しく設定するために有意係数グループフラグを改訂することを含む。
なおも別の実施形態において、決定することは、有意係数フラグの右の隣接するセットが0に等しい有意係数グループフラグを有しているか、または有意係数フラグの下の隣接するセットが0に等しいので、ビットストリームから有意係数グループフラグをデコードすることを含む。
さらなる実施形態において、第1コンテキストセットは、多くのコンテキストを含み、第1コンテキストセットを選択することは、コンテキストインデックス変数を所定値に設定することを含み、第2コンテキストセットを選択することは、コンテキストインデックス変数を所定値プラスコンテキストの数に設定することを含む。
別の局面においては、本願は、変換ユニットに対する有意係数フラグをエンコードすることによってビデオをエンコードして、有意係数フラグのエンコードされたセットのビットストリームを形成するための方法を記載しており、変換ユニットは、ブロックのシーケンスを含み、有意係数フラグの各セットは、それぞれのブロックに対応している。方法は、有意係数フラグのセットのうちの1つに対して、当該セットに対する有意係数フラグを決定することと、有意係数グループフラグが、ビットストリームの中への挿入のためにエンコードされた場合には、第1コンテキストセットを選択することによって当該セットの有意係数フラグをエンコードすることにおいて用いるためのコンテキストセットを選択し、有意係数グループフラグが、有意係数フラグの少なくとも2つの隣接するセットの有意係数グループフラグに基づいて決定された場合には、異なるコンテキストセットを選択することと、選択されたコンテキストセットを用いて、当該セットの有意係数フラグをエンコードすることとを含む。
さらなる局面において、本願は、エンコードおよびデコードするためのこのような方法を実装するように構成されたエンコーダおよびデコーダを記載している。
なおもさらなる局面において、本願は、実行されたときに、エンコードおよび/またはデコードするための記載された方法を実行するようにプロセッサを構成するコンピュータ実行可能なプログラム命令を格納している持続性のコンピュータ読み取り可能な媒体を記載している。
別の局面において、本願は、変換ユニットに対する有意係数フラグを再構成することによってエンコードされたビデオのビットストリームをデコードするための方法を記載しており、変換ユニットは、ブロックのシーケンスを含み、ビットストリームは、有意係数フラグのセットをエンコードし、各セットは、それぞれのブロックに対応している。方法は第1ブロックに対応する有意係数フラグのセットに対して、第1ブロックの右のブロックに関連付けられた有意係数グループフラグと、第1ブロックの下のブロックに関連付けられた有意係数グループフラグとに基づいて、当該セットの有意係数フラグをデコードすることにおいて用いるための複数のコンテキストからコンテキストセットを選択することと、選択されたコンテキストセットを用いて当該セットの有意係数フラグをデコードすることとを含む。
なおも別の局面において、本願は、変換ユニットに対する有意係数フラグをエンコードすることによってビデオをエンコードして、有意係数フラグのエンコードされたセットのビットストリームをエンコードするための方法を記載しており、変換ユニットは、ブロックのシーケンスを含み、有意係数フラグの各セットは、それぞれのブロックに対応している。方法は、第1ブロックに対応する有意係数フラグのセットに対して、第1ブロックの右のブロックに関連付けられた有意係数グループフラグと、第1ブロックの下のブロックに関連付けられた有意係数グループフラグとに基づいて、当該セットの有意係数フラグをエンコードすることにおいて用いるための複数のコンテキストセットからコンテキストセットを選択することと、選択されたコンテキストセットを用いて当該セットの有意係数フラグをエンコードすることとを含む。
本願のその他の局面および特徴は、当業者によって、添付図面と関連して以下の例の記載を参照することから、理解され得る。
本発明は、例えば、以下を提供する。
(項目1)
変換ユニットに対する有意係数フラグを再構成することによってエンコードされたビデオのビットストリームをデコードするための方法であって、該変換ユニットは、ブロックのシーケンスを含み、該ビットストリームは、有意係数フラグのセットをエンコードし、各セットは、それぞれのブロックに対応しており、該方法は、
第1ブロックに対応する有意係数フラグのセットに対して、該第1ブロックの右のブロックに関連付けられた有意係数グループフラグと、該第1ブロックの下のブロックに関連付けられた有意係数グループフラグとに基づいて、当該セットの有意係数フラグをデコードすることにおいて用いるための複数のコンテキストセットからコンテキストセットを選択することと、
該選択されたコンテキストセットを用いて当該セットの該有意係数フラグをデコードすることと
を含む、方法。
(項目2)
各有意係数グループフラグは、その関連付けられたブロックが、少なくとも1つの非ゼロ有意係数フラグを含むことが想定されるかどうかを示す、上記項目に記載の方法。
(項目3)
コンテキストセットを選択することは、上記有意係数グループフラグの両方が非ゼロである場合に、第1コンテキストセットを選択し、そうでない場合に、別のコンテキストセットを選択することを含む、上記項目のいずれか一項に記載の方法。
(項目4)
デコードすることは、コンテキスト適応デコーディングを含み、上記コンテキストセットは、上記有意係数フラグの当該セットの該有意係数フラグをコンテキスト適応デコードする際に用いられるコンテキストを識別する、上記項目のいずれか一項に記載の方法。
(項目5)
コンテキストセットを選択することは、上記第1ブロックが上記変換ユニットにおける上記左上ブロックである場合に、該第1ブロックのDC位置における上記有意係数フラグをデコードするための特定のコンテキストを選択することをさらに含む、上記項目のいずれか一項に記載の方法。
(項目6)
コンテキストセットを選択することは、上記第1ブロックが上記変換ユニットの上記左上コーナーに存在するかどうかにさらに基づいている、上記項目のいずれか一項に記載の方法。
(項目7)
コンテキストセットを選択することは、上記変換ユニットのサイズにさらに基づいている、上記項目のいずれか一項に記載の方法。
(項目8)
コンテキストセットを選択することは、上記変換ユニットのコンポーネントが、輝度コンポーネントであるか彩度コンポーネントであるかどうかにさらに基づいている、上記項目のいずれか一項に記載の方法。
(項目9)
変換ユニットに対する有意係数フラグを再構成するためにエンコードされたデータのビットストリームをデコードするためのデコーダであって、該デコーダは、
プロセッサと、
メモリと、
メモリ内に格納され、かつ上記項目のいずれか一項に記載の方法を実行するように該プロセッサを構成するための命令を含むデコーディングアプリケーションと
を含む、デコーダ。
(項目10)
変換ユニットに対する有意係数フラグをエンコードすることによってビデオをエンコードして、有意係数フラグのエンコードされたセットのビットストリームを形成するための方法であって、該変換ユニットは、ブロックのシーケンスを含み、有意係数フラグの各セットは、それぞれのブロックに対応しており、該方法は、
第1ブロックに対応する有意係数フラグのセットに対して、該第1ブロックの右のブロックに関連付けられた有意係数グループフラグと、該第1ブロックの下のブロックに関連付けられた有意係数グループフラグとに基づいて、当該セットの有意係数フラグをエンコードすることにおいて用いるための複数のコンテキストからコンテキストセットを選択することと、
該選択されたコンテキストセットを用いて当該セットの該有意係数フラグをエンコードすることと
を含む、方法。
(項目11)
各有意係数グループフラグは、その関連付けられたブロックが、少なくとも1つの非ゼロ有意係数フラグを含むことが想定されるかどうかを示す、上記項目に記載の方法。
(項目12)
コンテキストセットを選択することは、上記有意係数グループフラグの両方が非ゼロである場合に、第1コンテキストセットを選択し、そうでない場合に、別のコンテキストセットを選択することを含む、上記項目のいずれか一項に記載の方法。
(項目13)
エンコードすることは、コンテキスト適応エンコーディングを含み、上記コンテキストセットは、当該セットの上記有意係数フラグをコンテキスト適応エンコードする際に用いされるコンテキストセットを識別する、上記項目のいずれか一項に記載の方法。
(項目14)
変換ユニットに対する有意係数フラグをエンコードして、エンコードされたデータのビットストリームを生成するためのエンコーダであって、該エンコーダは、
プロセッサと、
メモリと、
メモリ内に格納され、かつ上記項目のいずれか一項に記載の方法を実行するように上記プロセッサを構成するための命令を含むエンコーディングアプリケーションと
を含む、エンコーダ。
(項目15)
プロセッサ実行可能な命令を格納している持続性プロセッサ読み取り可能な媒体であって、該命令は、実行されたときに、上記項目のいずれか一項に記載の方法を実行するように1つ以上のプロセッサを構成する、媒体。
(摘要)
ビデオデータをエンコードおよびデコードするための方法が、マルチレベル有意マップをエンコードまたはデコードするために記載される。異なるコンテキストセットが、変換ユニットの異なる領域内の有意係数フラグをエンコードするために用いられ得る。固定された場合においては、領域は、係数グループボーダーによって定義される。一例においては、左上係数グループが、第1領域であり、その他の係数グループが、第2領域である。動的な場合においては、領域は、係数グループボーダーによって定義されるが、エンコーダおよびデコーダは、この領域に属している各係数グループを動的に決定する。係数グループは、1つの領域または別のものに対して、例えばこれらのそれぞれの有意係数グループフラグが推論されるかどうかに基づいて、割り当てられ得る。
ここで、例として、本願の例示的な実施形態を示す添付図面に対する参照がなされ得る。
図1は、ブロック図形式において、ビデオをエンコードするためのエンコーダを示している。 図2は、ブロック図形式において、ビデオをデコードするためのデコーダを示している。 図3は、16×16変換ユニットに対するマルチレベルスキャン順序の例を示している。 図4は、定義された対角線を用いる2つの固定された領域への16×16変換ユニットの分割を例示している。 図5は、定義された対角線を用いる2つの固定された領域への32×32変換ユニットの分割を例示している。 図6は、コンテキストセットを選択するための領域への16×16変換ユニットの係数グループベースの分割を例示している。 図7は、連続係数グループへと分割された例示的な変換ユニットと、これらの係数グループに対する例示的なそれぞれの有意係数グループフラグとを示している。 図8は、図7の例に基づく領域への16×16変換ユニットの動的に決定された分割の例を示している。 図9は、推論補正を有する図7の例を示している。 図10は、図9の例に基づく領域への変換ユニットの動的な分割を示している。 図11は、フローチャート形式において、有意マップをエンコードするための例示的な方法を示している。 図12は、フローチャート形式において、エンコードされたデータのビットストリームから有意マップを再構成するための例示的な方法を示している。 図13は、エンコーダの例示的な実施形態の簡略化されたブロック図を示している。 図14は、デコーダの例示的な実施形態の簡略化されたブロック図を示している。
異なる図面において用いられ得る類似した参照番号は、類似した構成要素を示している。
(例示的な実施形態の記載)
以下の記載においては、ビデオコーディングのためのH.264規格および/または開発中のMPEG−H規格に関連して、いくつかの実施形態が記載されている。当業者であれば、本願は、H.264/AVC規格および/またはMPEG−Hに限定されず、可能性のある将来の規格、マルチビューコーディング規格、スケーラブルビデオコーディング規格、および再構成可能ビデオコーディング規格を含む、その他のビデオコーディング/デコーディング規格に対して適用可能であり得ることを理解し得る。
以下の記載において、ビデオまたはイメージに言及するとき、フレーム、ピクチャ、スライス、タイル、および矩形スライスグループという用語は、いくぶん互換的に用いられ得る。当業者であれば、H.264規格の場合において、フレームは、1つ以上のスライスを含み得ることを理解し得る。また、適用可能なイメージまたはビデオコーディング規格の特定の要件または術語に依存して、特定のエンコーディング/デコーディングオペレーションが、フレームごとに実行されること、いくつかがスライスごとに実行されること、いくつかがピクチャごとに実行されること、いくつかがタイルごとに実行されること、およびいくつかが矩形スライスグループによることも、理解され得る。任意の特定の実施形態において、適用可能なイメージまたはビデオコーディング規格は、以下に記載されるオペレーションが、場合によって、フレームおよび/またはスライスおよび/またはピクチャおよび/またはタイルおよび/または矩形スライスグループに関連して実行されるかどうかを決定し得る。したがって、当業者であれば、本開示に照らして、本明細書中に記載されている特定のオペレーションまたはプロセス、ならびにフレーム、スライス、ピクチャ、タイル、矩形スライスグループに対する特定の言及が、所与の実施形態に対して、フレーム、スライス、ピクチャ、タイル、矩形スライスグループ、またはこれらのうちのいくつかまたはすべてに対して適用可能であるかどうかを理解し得る。また、これは、以下の記載に照らして明らかになり得るように、変換ユニット、コーディングユニット、コーディングユニットのグループ等に対しても当てはまる。
本願は、有意マップをエンコードおよびデコードするための例示的プロセスおよびデバイスを記載している。有意マップは、変換ユニットまたは係数の定義されたユニット(例えば、いくつかの変換ユニット、変換ユニットの一部分、またはコーディングユニット)にマップする、または該変換ユニットまたは係数の定義されたユニットに対応する、フラグのブロック、行列、またはグループである。各フラグは、変換ユニットまたは特定のユニットにおける対応する位置が、非ゼロ係数を含むかどうかを示す。既存の規格においては、これらのフラグは、有意係数フラグと称され得る。既存の規格においては、係数ごとに1つのフラグが存在し、該フラグは、対応する係数がゼロである場合には、ゼロであるビットであり、対応する係数が非ゼロである場合には、1に設定される。本明細書中で用いられる際の用語「有意マップ」は、以下の記載から理解され得るような、変換ユニットに対する有意係数フラグの行列または順序付けられたセット、あるいは本願のコンテキストから明確であり得る、係数の定義されたユニットを意味することが意図されている。
以下の記載に照らして、マルチレベルエンコーディングおよびデコーディング構造が、特定の状況に対して適用可能であり得、これらの状況が、ビデオコンテンツタイプ等のサイド情報(シーケンス、ピクチャ、またはスライスヘッダ内で識別されるような自然なビデオまたはグラフィクス)から決定され得ることが、理解され得る。例えば、2つのレベルが自然なビデオに対して用いられ得、3つのレベルがグラフィクスに対して用いられ得る(これは、典型的には、遥かに希少である)。さらに別の可能性は、シーケンス、ピクチャ、またはスライスヘッダのうちの1つにおいてフラグを提供して、構造が1つ、2つ、または3つのレベルを有しているかどうかを示し、これにより、エンコーダに、現在のコンテンツに対する最も適切な構造を選択するフレキシビリティを可能にすることである。別の実施形態においては、フラグは、コンテンツタイプを表し得、これは、レベルの数に関連付けられ得る。例えば、コンテンツタイプ「グラフィック」は、3つのレベルを特徴とし得る。
本願は、用語「係数グループ」および「有意係数フラグのセット」を互換的に用い得ることに留意されたい。これらは、同じ意味を有することが意図されている。
ここで図1に対する参照がなされ、該図面は、ブロック図形式において、ビデオをエンコードするためのエンコーダ10を示している。また、図2に対する参照もなされ、該図面は、ビデオをデコードするためのデコーダ50のブロック図を示している。本明細書中に記載されているエンコーダ10およびデコーダ50が、それぞれ、1つ以上の処理要素およびメモリを含む、特定用途向けまたは汎用コンピューティングデバイス上に実装され得ることが理解され得る。エンコーダ10またはデコーダ50によって実行されるオペレーションは、場合によって、例えば、特定用途向け集積回路によって実装され得るか、あるいは汎用プロセッサによって実行可能な格納されたプログラム命令によって実装され得る。デバイスは、例えば、基本デバイス機能を制御するためのオペレーティングシステムを含む、付加的ソフトウェアを含み得る。その内部でエンコーダ10またはデコーダ50が実装され得るデバイスまたはプラットフォームの範囲は、以下の記載に接した当業者によって理解され得る。
エンコーダ10は、ビデオソース12を受信し、かつエンコードされたビットストリーム14を生成する。デコーダ50は、エンコードされたビットストリーム14を受信し、かつデコードされたビデオフレーム16を出力する。エンコーダ10およびデコーダ50は、多くのビデオ圧縮規格に準拠して動作するように構成され得る。例えば、エンコーダ10およびデコーダ50は、H.264/AVC準拠であり得る。その他の実施形態においては、デコーダ10およびエンコーダ50は、MPEG−H等のH.264/AVCの規格の進化型を含む、その他のビデオ圧縮規格に準拠し得る。
エンコーダ10は、空間予測器21、コーディングモード選択器20、変換プロセッサ22、量子化器24、およびエントロピーエンコーダ26を含む。当業者によって理解され得るように、コーディングモード選択器20は、例えば、対象フレーム/スライスがIタイプ、PタイプまたはOタイプであるかどうか、ならびにフレーム/スライス内の特定のコーディングユニット(例えば、マクロブロック、コーディングユニット等)が、インターコードまたはイントラコードされるかどうか等、ビデオソースに対する適切なコーディングモードを決定する。変換プロセッサ22は、空間ドメインデータに基づいて、変換を実行する。特に、変換プロセッサ22は、ブロックベースの変換を適用して、空間ドメインデータを空間成分に変換する。例えば、多くの実施形態においては、離散コサイン変換(DCT)が用いられる。例えば離散サイン変換等のその他の変換が、いくつかの場合においては、用いられ得る。ブロックベースの変換は、コーディングユニット上で、マクロブロックまたはサブブロックベースで、マクロブロックまたはコーディングユニットのサイズに依存して、実行される。H.264規格においては、例えば、典型的な16×16マクロブロックは、16個の4×4変換ブロックを含み、DCTプロセスが該4×4ブロックに対して実行される。いくつかの場合においては、変換ブロックは、8×8であり得、これは、マクロブロックごとに4つの変換ブロックが存在することを意味している。なおも他の場合においては、変換ブロックは、その他のサイズであり得る。いくつかの場合においては、16×16マクロブロックは、4×4および8×8マクロブロックの非重複組み合わせを含み得る。
ブロックベースの変換をピクセルデータのブロックに適用することは、変換ドメイン係数のセットをもたらす。このコンテキストにおける「セット」とは、係数が係数位置を有する順序付けられたセットのことである。いくつかの場合においては、変換ドメイン係数のセットは、係数の「ブロック」または行列として考慮され得る。本明細書中の記載において、フレーズ「変換ドメイン係数のセット」または「変換ドメイン係数のブロック」は、互換的に用いられており、かつ変換ドメイン係数の順序付けられたセットを示すことが意図されている。
変換ドメイン係数のセットは、量子化器24によって量子化される。量子化された係数および関連付けられた情報は、その後、エントロピーエンコーダ26によってエンコードされる。
量子化された変換ドメイン係数のブロックまたは行列は、本明細書中では、「変換ユニット」(TU)と称され得る。いくつかの場合においては、TUは、非正方であり得、例えば、non−squre quadrature transform(NSQT)であり得る。
イントラコードされたフレーム/スライス(すなわち、タイプI)は、その他のフレーム/スライスを参照せずに、エンコードされる。換言すると、これらは、時間的予測を採用していない。しかしながら、イントラコードされたフレームは、空間予測器21によって図1内に例示されているような、フレーム/スライス内の空間予測に依拠していない。すなわち、特定のブロックをエンコードするときに、ブロック内のデータは、そのフレーム/スライスに対して既にエンコードされているブロック内の近隣のピクセルのデータと比較され得る。予測アルゴリズムを用いることにより、ブロックのソースデータは、残余データに変換され得る。変換プロセッサ22は、その後、残余データをエンコードする。例えば、H.264は、4×4変換ブロックに対して9つの空間予測モードを記述する。いくつかの実施形態においては、9つのモードのそれぞれは、ブロックを独立的に処理するために用いられ得、レート歪み最適化が、その後、最良モードを選択するために用いられる。
また、H.264規格は、時間予測を活用するために、動き予測/補償の使用を記述している。したがって、エンコーダ10は、逆量子化器28、逆変換プロセッサ30、およびデブロッキングプロセッサ32を含むフィードバックループを有する。デブロッキングプロセッサ32は、デブロッキングプロセッサおよびフィルタリングプロセッサを含み得る。これらの要素は、フレーム/スライスを再生するために、デコーダ50によって実装されるデコーディングプロセスを反映している。フレーム格納34が、再生されたフレームを格納するために用いられる。このように、動き予測は、何がデコーダ50において再構成されるフレームであり得るかに基づいており、エンコーディング/デコーディング内に含まれる損失性のある圧縮に起因して再構成されたフレームとは異なり得るオリジナルフレームに基づいてはいない。動き予測器36は、類似したブロックを識別するという目的のために、現在のフレームに対する比較のためのソースフレーム/スライスとして、フレーム格納34に格納されるフレーム/スライスを用いる。したがって、それに対して動き予測が適用されるマクロブロックまたはコーディングユニットに対して、変換プロセッサ22がエンコードする「ソースデータ」は、動き予測プロセスに由来する残余データである。例えば、これは、基準フレーム、空間変位または「動きベクトル」、および基準ブロックと現在のブロックとの間の(もしあれば)相違を表す残余ピクセルデータに関する情報を含み得る。基準フレームおよび/または動きベクトルに関する情報は、変換プロセッサ22および/または量子化器24によって処理されないことがあり得るが、その代りに、量子化された係数とともに、ビットストリームの一部分としてエンコードするために、エントロピーエンコーダ26に供給され得る。
当業者であれば、ビデオエンコーダを実装するための詳細および可能性のある変形を理解し得る。
デコーダ50は、エントロピーデコーダ52、逆量子化器54、逆変換プロセッサ56、空間補償器57、およびデブロッキングプロセッサ60を含む。デブロッキングプロセッサ60は、デブロッキングおよびフィルタリングプロセッサを含み得る。フレームバッファ58は、動き補償を適用する際における、動き補償器62による使用のために、再構成されたフレームを供給する。空間補償器57は、既にデコードされたブロックから特定のイントラコードされたブロックに対するビデオデータを復元するオペレーションを表す。
ビットストリーム14は、エントロピーデコーダ52によって受信され、かつデコードされて、量子化された係数を復元する。また、サイド情報が、エントロピーデコーディングプロセスの間に復元され得、そのうちの一部は、(もしあれば)動き補償における使用のために、動き補償ループに供給され得る。例えば、エントロピーデコーダ52は、イントラコードされたマクロブロックに対して、動きベクトルおよび/または基準フレーム情報を復元し得る。
量子化された係数は、その後、逆量子化器54によって逆量子化されて、変換ドメイン係数を生成し、該係数は、その後、逆変換プロセッサ56による逆変換の対象となり、「ビデオデータ」を再形成する。理解され得るように、例えばイントラコードされたマクロブロックまたはコーディングユニットの場合等のいくつかの場合においては、再形成された「ビデオデータ」は、フレーム内の既にデコードされたブロックに対する空間補償における使用のための残余データである。空間補償器57は、既にデコードされたブロックからの残余データおよびピクセルデータからビデオデータを生成する。例えばイントラコードされたマクロブロックまたはコーディングユニット等のその他の場合においては、逆変換プロセッサ56からの再形成された「ビデオデータ」は、異なるフレームからの基準ブロックに対する動き補償における使用のための残余データデある。空間補償および動き補償の両方は、本明細書中では、「予測オペレーション」として称され得る。
動き補償器62は、特定のインターコードされたマクロブロックまたはコーディングユニットに対して特定されたフレームバッファ58内に基準ブロックを配置する。該補償器は、インターコードされたマクロブロックまたはコーディングユニットに対して特定された基準フレーム情報および動きベクトルに基づいて、これを行う。該補償器は、その後、残余データとの組み合わせのために、基準ブロックピクセルデータを供給して、コーディングユニット/マクロブロックに対する再構成されたビデオデータに到達する。
デブロッキングプロセッサ60によって示されているように、ブロッキング/フィルタリングプロセスが、その後、再構成されたフレーム/スライスに対して適用され得る。デブロッキング/フィルタリングの後、フレーム/スライスは、例えば、ディスプレイデバイス上の表示のために、デコードされたビデオフレーム16として出力される。例えばコンピュータ、セットトップボックス、DVDまたはブルーレイプレーヤー、および/またはモバイルハンドヘルドデバイス等のビデオ再生機は、出力デバイス上の表示の前にメモリ内にデコードされたフレームをバッファし得るということが理解され得る。
MPEG−H準拠エンコーダおよびデコーダは、これらと同じまたは類似した特徴の多くを有し得ることが期待されている。
(有意マップエンコーディング)
上述したように、量子化された変換ドメイン係数のブロックまたはセットのエントロピーコーディングは、量子化された変換ドメイン係数のブロックまたはセットに対する有意マップ(例えば、有意係数フラグのセット)をエンコードすることを含む。有意マップは、どの位置(最終位置以外)に非ゼロ係数が現れるかを示すブロックのバイナリマッピングである。有意マップは、スキャン順序(該順序は、垂直、水平、対角線、ジグザグ、またはその他の任意の順序であり得る)にしたがって、ベクトルに変換され得る。スキャンは、典型的には、「逆」順序で行われ、すなわち、最終有意係数から出発し、[0,0]における左上コーナーにおけるフラグに到達するまで、逆方向に、有意マップを通って、逆行して機能する。本記載においては、用語「スキャン順序」は、(場合によって)フラグ、係数、またはグループが処理される順序を意味することが意図されており、口語的に「逆スキャン順序」として称される順序を含み得る。
各有意係数フラグは、その後、適用可能なコンテキスト適応コーディングスキームを用いてエントロピーエンコードされる。例えば、多くの用途においては、context−adaptive binary arithmetic coding(CABAC)スキームが用いられ得る。
16×16および32×32有意マップの場合、有意に対するコンテキストは、隣接する有意係数フラグ値に(最も)基づいている。16×16および32×32有意マップに対して用いられるコンテキストの中で,[0,0]におけるビット位置に対して専用である、そして(いくつかの例示的な実装においては)隣接するビット位置に対して専用である、特定のコンテキストが存在するが、有意係数フラグのうちのほとんどは、隣接する有意係数フラグの累積値に依存する4つまたは5つのコンテキストのうちの1つをとる。これらの場合においては、有意係数フラグに対する正確なコンテキストの決定は、隣接する位置(典型的には5つの位置であるが、いくつかの場合においては、より多くまたはより少ないことがあり得る)における有意係数フラグの値を決定し、かつ加算することに依存している。
以前の仕事において、本出願人は、変換ユニットの有意マップが係数グループへと区画化され、かつ各係数グループが、所定の順序またはシーケンスにおいてエンコードされる、マルチレベル有意マップの使用を記載した。(ブロック/サブブロックであり得る)各係数グループ内では、有意係数フラグは、スキャン順序において処理される。各係数グループは、係数グループが非ゼロ有意係数フラグを含むと考慮され得るかどうかを示す、有意係数グループフラグに関連付けられる。2011年11月1日に出願され、“Multi−level Significance Maps for Encoding and Decoding”と題された、米国特許出願第13/286,336号、および2011年11月19日に出願され、“Multi−level Significance Map Scanning”と題された、米国特許出願第61/561,872号に対する参照がなされ得る。両出願の内容は、参照により本明細書中に援用される。
上記の出願において記載されている技術のうちの1つは、1パススキャニングプロセス(すなわち、グループベースまたはマルチレベルスキャニング順序)の実装である。ここで図3に対する参照がなされ、該図面は、例示されているマルチレベル対角線スキャン順序を用いる16×16変換ユニット100を示している。変換ユニット100は、16個の連続4×4係数グループまたは「有意係数フラグのセット」へと区画化される。各係数グループ内では、変換ユニット100の全体にわたってというよりもむしろ、対角線スキャン順序が該グループ内に適用される。セットまたは係数グループ自体は、スキャン順序において処理され、該順序もまた、この例示的な実装においては、対角線スキャン順序である。この例におけるスキャン順序は、「逆」スキャン順序において例示されているということ、すなわち、スキャン順序は、右下係数グループから、左下向き対角線方向に、左上対角線グループに向けて進行して示されているということに留意されたい。いくつかの実装においては、同じスキャン順序が、その他の方向において定義され得、すなわち、エンコーディングの間に適用されるときに、右上向き対角線方向に進行し、あるいはデコーディングが「逆」スキャン順序において適用され得る。
マルチレベル有意マップの使用は、どの係数グループが非ゼロ有意係数フラグを含むと期待され得、かつどの係数グループがすべてのゼロ有意係数フラグを含むかを示す、L1またはより高レベルの有意マップのエンコーディングを含む。非ゼロ有意係数フラグを含むことが期待され得る係数グループは、それらの有意係数フラグをエンコードさせるが、その一方ですべてのゼロ有意係数フラグを含む係数グループは、(それらが少なくとも1つの非ゼロ有意係数フラグを含むと想定されることによる特別な場合の例外を理由としてエンコードされるグループであるときを除いて)エンコードされない。各係数グループは、(例えば最終有意係数を含むグループ、左上グループ等の、係数グループが想定値のフラグを有する特別な場合に該当するときを除いて)有意係数グループフラグを有する。
係数グループフラグは、係数グループのコンテンツに基づいて、すなわち係数グループ内になんらかの非ゼロ係数が存在するかどうかに基づいて、あるいは係数グループフラグが推論されるかどうかに基づいてのいずれかで、決定される。例えば、少なくとも1つの実施形態においては、係数グループフラグは、係数グループ内に非ゼロ係数が存在しない場合には、ゼロに設定され、係数グループ内に少なくとも1つの非ゼロ係数が存在する場合には、1に設定される。しかしながら、一部の場合においては、ビットを節約するために、係数グループフラグは、エンコードおよびデコードされず、むしろ、隣接する係数グループフラグの値に基づいて推論される。例えば、1つの実施形態においては、係数グループフラグは、より低い隣接する係数グループフラグおよび右の隣接する係数グループフラグが、両方とも1に等しい場合には、1であると推論される。
(有意係数フラグのコンテキストベースの処理)
有意係数フラグのエンコーディングおよびデコーディングは、コンテキストベースであることに基づいている。換言すると、エンコーディングおよびデコーディングは、エンコードされているビンが最も確からしいシンボル(MPS)である推定確率を決定することに依存する。そして、この推定確率の決定は、現在のシンボルに対するコンテキストを決定することに依存する。典型的には、コンテキストベースのエンコーダおよびデコーダは、特定のタイプのデータに対してコンテキストがどのように決定されるかを特定し、かつコンテキストのセットを定義する、コンテキストモデルにしたがって機能する。
有意係数フラグの場合においては、コンテキストモデルは、コンテキスト決定を、([0,0]におけるDC値等の特定の例外を除いて)隣接する有意係数フラグの値に基づくものとしている。例えば、サイズ16×16または32×32の変換ユニットの場合、有意係数フラグ「x」のコンテキストは、以下に示すように、5つの隣接するフラグに依存している。
Figure 2013150322
5つの隣接するフラグの値の累積和は、位置xにおける有意係数フラグに対するコンテキストを示すために用いられ得る。したがって、6つまでのコンテキストが存在し得る。いくつかの場合においては、コンテキストの数は、例えば4において、キャップされ得る。例示的なコンテキスト決定モデルは、以下のようなものである。
Figure 2013150322
上記のcontext_xは、有意係数フラグをエンコードするための「コンテキストセット」に対するコンテキストインデックスである。すなわち、特定の有意係数フラグをエンコードするためのコンテキストを決定するときに、コンテキストは、コンテキストセット内に定義されるコンテキストのうちの1つから選択される。
いくつかの例示的な実装においては、1つよりも多くのコンテキストセットが、有意係数フラグをエンコードするためのモデルによって定義され得る。例えば、エンコーダおよびデコーダは、変換ユニットの第1領域に入る有意係数フラグをエンコードするための1つのコンテキストセットと、変換ユニットの第2領域(または第3領域等)に入る有意係数フラグをエンコードするための第2の別個のコンテキストセットとを用い得る。
上述した例を用いて議論すると、第2セットからのコンテキストは、コンテキスト4、5、6および7を含み得、第2領域内の特定の有意係数フラグに対する適切なコンテキストの選択は、以下に示すコンテキスト決定モデルに基づき得る。
Figure 2013150322
いくつかの現在の実装においては、変換ユニットは、固定された対角線定義を用いて、コンテキスト決定の目的のために、第1領域および第2領域へと分割される。例えば、16×16変換ユニットの場合、対角線は、x+y=4によって定義される。これは、例示的な16×16変換ユニット110を例示している、図4に示されているような領域をもたらす。例示的な変換ユニット110は、x+y<4の対角線定義にしたがって分割された、第1領域112および第2領域114を含んでいる。すなわち、それに対してx+y<4であるすべての有意係数フラグは、第1領域112内に存在する。この場合においては、[0,0]におけるDC値は、それ自体のコンテキストを有する。いくつかの意味において、DC位置は、コンテキストセット内の単一のコンテキストが存在する「第3領域」を考慮され得る。
ここで図5に対する参照がなされ、該図面は、32×32変換ユニット120の例を示している。変換ユニット120は、x+y<8の対角線定義にしたがって、第1領域122および第2領域124へと分割または区画化される。すなわち、DC有意係数フラグ126を除いて、それに対してx+y<8であるすべての有意係数フラグは、第1領域122内に存在し、これらの有意係数フラグは、第1コンテキストセットを用いてエンコードされる。それに対してx+y≧8であるその他のすべての有意係数フラグは、第2セット内に存在し、第2コンテキストセットを用いてエンコードされる。DC有意係数フラグ126は、それ自体のコンテキストを用いてエンコードされる。この意味において、DC位置は、第3領域それだけを考慮され得る。
本願は、変換ユニットの有意係数フラグをエンコードするためのコンテキストセットを選択するためのその他のアプローチを提供する。
第1実施形態においては、上記で与えた対角線定義の例の場合のように、コンテキストセット選択は固定されているが、しかしながら、この第1実施形態においては、第1領域は、対角線によって定義されていない。その代りに、第1領域は、係数グループ定義に対応するように定義される。このように、コンテキストセット選択は、係数グループベースであり、これは、マルチレベル有意マップの実施形態において、有意係数エンコーディングのモジュラリティを改善する。複数の領域が定義され得、これらのうちのそれぞれは、係数グループ境界によって区切られている。DC位置は、領域として考慮され得る。
図6は、係数グループ定義に基づくコンテキスト領域へと分割または区画化された16×16変換ユニット200の例を示している。この例においては、第1領域202は、DC有意係数フラグ206を除き、第1係数グループ内のすべての有意係数フラグを含む(逆スキャン順序における最終係数グループも考慮され得る)。すなわち、第1領域202は、[0,0]を除き、それに対してx+y<4かつy<4であるすべての有意係数フラグを含む。変換ユニット200のその他の係数グループ内のすべての有意係数フラグは、第2領域204内に存在する。第1領域202内の有意係数フラグは、第1コンテキストセットを用いてエンコードされ、その一方で第2領域204内の有意係数フラグは、第2コンテキストセットを用いてエンコードされる。1つの例示的な実装においては、エンコーダおよび/またはデコーダは、フラグのx座標およびy座標がそれぞれ変換ユニットの左上コーナーの4つの位置内に存在するかどうかを決定することにより、有意係数フラグが第1領域内に存在するかどうか、すなわち、左上係数グループ内に存在するかどうかを決定する。
その他の変形においては、第1領域は、1つよりも多くの係数グループを含み得る。例えば、32×32変換ユニットにおいては、係数グループが4×4である場合には、第1領域は、変換ユニットの左上コーナーにおいて、3つまたは4つの係数グループを含み得る。あるいは、別の例においては、16×16変換ユニット200は、第1領域202において、3つ以上の係数グループを含み得る。その他の変形は、本記載を踏まえて理解され得る。
この第1実施形態においては、エンコーダおよびデコーダは、有意係数フラグが属している係数グループに基づいて選択されたコンテキストセットを用いて、それらのコンテキストを決定することにより、有意係数フラグを処理する。変換ユニット内の係数グループの位置は、選択されたコンテキストセットを決定する。すなわち、変換ユニット内の各係数グループは、特定のコンテキストセットに関連付けられる。すなわち、各係数グループは、定義された領域のうちの1つのメンバーであり、各領域は、関連付けられたコンテキストセットを有している。
第2実施形態において、領域は、依然として係数グループベースであるが、第1領域と第2領域との間の境界は、動的に決定される。この第2実施形態の一例においては、分割は、特定の係数グループの係数グループフラグが、1に推論されているかどうかに基づいている。すなわち、係数グループは、その右のおよび下の隣接する係数グループの係数グループフラグに基づいて、領域に割り当てられる。
図7に対する参照がなされ、該図面は、有意係数フラグの4×4連続セット、すなわち係数グループへと分割された16×16変換ユニット220を図式的に示している。係数グループは、(x=0,…,3;y=0,…3)として示されているx−y座標を用いてインデックス付けされ得る。係数グループのそれぞれに対して決定された有意係数グループフラグ(SCGフラグ)は、それぞれの係数グループの内部のダイヤグラムに示されている。
上述の議論から理解され得るように、変換ユニット220は、係数グループのうちの1つにおいて最終有意係数(LSC)を含む。この例の目的に対して、LSCは、係数グループ[2,2]に存在すると想定される。スキャン順序における係数グループ[2,2]の以前のすべてのグループは、必然的にすべてのゼロを含む。
係数グループ[2,2]に対する有意係数グループフラグは、それがLSCを含むことから、このことは、それが少なくとも1つの非ゼロ係数を含むことを意味しているので、必然的に1である。
示されている例においては、逆スキャン順序における次の係数グループは、係数グループ[1,3]であり、これはすべてのゼロ係数を含む。したがって、その有意係数グループフラグは、0である。
次の係数グループは、逆スキャン順序であり、グループ[3,0]、[2,1]、および[1,2]は、すべて少なくとも1つの非ゼロ係数を含むことがわかる。したがって、これらのそれぞれは、1の有意係数グループフラグを有する。係数グループ[0,3]は、すべてのゼロ係数を含むことがわかるので、その有意係数グループフラグは、0であるとして決定される。
逆スキャン順序における次のグループは、係数グループ[2,0]である。その右の隣接する係数グループおよびそのより低い隣接する係数グループの両方は、SCGflag=1を有し、係数グループ[2,0]に対する有意係数グループフラグは、係数グループ[2,0]においてなんらかの非ゼロ係数が存在するかどうかに関わらず、1として推論されるか、または想定される。同じ推論が、係数グループ[1,1]を用いてなされる。係数グループ[0,2]は、ゼロの有意係数グループフラグを有するより低い隣接する係数グループを有するので、推論はなされない。係数グループ[0,2]の場合においては、非ゼロ係数を含むので、それは、1に設定された有意係数グループフラグであることがわかる。逆スキャン順序におけるすべての残りの係数グループは、1として推論された有意係数グループフラグを有する。
推論された有意係数グループフラグのうちの任意のものは、必ずしも、ビットストリームにおいてエンコードされないか、またはデコーダにおいてデコードされない。これらは、1に等しいと想定され、エンコーダおよびデコーダは、これらのうちの1つがすべてのゼロ係数を含む場合でさえも、これらの係数グループの有意係数フラグを自動的にエンコードする。
ここで図8に対する参照がなされ、該図面は、図7に示されている変換ユニットに基づく第2実施形態の例示的な例証に対する動的領域分割を示している。この第2実施形態においては、有意係数フラグをエンコードするための第1領域(第1領域に属している係数グループにおいてシンボル「1」によって示されている)は、それに対して有意係数フラグが1として推論されている係数グループを含むとして定義されている。第2領域(第2領域に属している係数グループにおいてシンボル「2」によって示されている)は、推論されていない有意係数グループを有する係数グループを含む。それに対する有意係数グループフラグがゼロである係数グループは、これらのグループの有意係数フラグは、エンコードされないので、必ずしも、領域内に含まれないことが理解され得る。DC位置226は、依然としてそれ固有のコンテキストを有し得るので、必ずしも、第1領域の一部分としては考慮されない。
上述した記載から、第1領域および第2領域は、係数グループボーダーに沿った境界を有するが、その変換ユニットから変換ユニットへの動的変化の位置は、問題となっている変換ユニットのコンテンツに依存する。係数グループ境界に沿った領域の分離を維持することにより、モジュラー処理及びコード簡略化におけるなんらかの効率性が、達成可能であり得る。境界の動的移動は、2つの領域に関連付けられたそれぞれのコンテキストセットが、実際の統計的データを反映する確率分布へと収束するスピードを改善し得、これにより、コーディング効率性が改善される速度を改善し得る。
上述した領域決定プロセスを実装するための1つの機構は、その右のおよびより低い隣接する係数グループの有意係数グループフラグに基づいて、各係数グループを領域に割り当てるものであり得ることが理解され得る。すなわち、右のおよびより低い隣接する係数グループの有意係数グループフラグのいずれかが0に等しい場合には、係数グループは、領域2に属し、そうでない場合には、係数グループは、領域1に属する。いくつかの実施形態においては、左上コーナー係数グループは、常に、領域1に分類され得る。
ここで、第3実施形態が記載され、該第3実施形態は、第2実施形態の変形または改良であると考えられ得る。第3実施形態において、領域間の境界は、依然として、有意係数グループが1として推論され、境界が係数グループ境界に沿って位置し続けるかどうかに基づいて、動的に決定されるが、第3実施形態は、推論が正確であったかどうかを評価することと、不正確な推論の再分類に基づいて、後の係数グループの分類に対する調整を行うこととを含む。
ここで図9に対する参照がなされ、該図面は、例示的な変換ユニット250を示している。この例において、様々な係数グループに対する有意係数グループフラグの決定は、図7に関連して上述したように行われる。しかしながら、この場合においては、エンコーダおよびデコーダは、推論が正確であったかどうかを評価する。例えば、係数グループ[1,1]は、実際には、すべてのゼロ係数を含み得る。これらの係数は、実際には、有意係数グループフラグが1に設定されているので、ビットストリームにおいてエンコードされ、デコーダによってデコードされるが、不正確な推論または想定による。図9において、これは、「不正確に推論された」として示されている。
係数グループ[1,1]に対する有意係数フラグをデコードする時点において、デコーダは、推論が不正確であることに気付かないことがあり得、したがって、この係数グループが、それが推論された有意係数グループフラグを有しているので、第1領域の一部分であることを理解し得る。したがって、エンコーダおよびデコーダの両方は、係数グループ[1,1]の有意係数フラグをエンコードおよびデコードするときに、第1領域に関連付けられたコンテキストセットを用いる。しかしながら、後続の係数グループを処理するときが来ると、エンコーダおよびデコーダは、不正確な推論のこの知識を考慮に入れ得る。例えば、係数グループ[1,0]および[0,1]に対する有意係数グループフラグを決定するときに、これらは、それらが実際には1に等しいと推論されたフラグを用い、その有意係数フラグがエンコードされている場合でさえも、0に等しい有意係数グループフラグを有しているとして、[1,1]におけるそれらの隣接する係数を考慮し得る。図9に示されているように、係数グループ[1,0]および[0,1]は、それらが実際には少なくとも1つの非ゼロ係数を含むという事実に基づいて、1に設定されたそれらの有意係数グループフラグを有する。
後の係数グループを処理するための不正確な推論のこの「補正」は、領域に対して係数グループを割り当てるという目的のためだけに推論を補正することに限定され得るか、あるいはそれはまた、別の推論を行う際に不正確な推論に依存し得る後の係数グループに対する有意係数フラグを実際に決定するという目的のために補正され得るということが理解され得る。
結果として、それに対して推論が有意係数グループフラグを決定するために用いられる係数グループの数は、丁度3に変化する。これは、有意係数フラグをエンコードするためにコンテキストセットを選択するために用いられる領域の形状に対する影響を有する。図10は、そこに示されている第1領域および第2領域を用いて変換ユニット250を示している。この場合において、領域を構成している係数グループは、必ずしも連続的または隣接的ではないということが理解され得る。
ここで図11に対する参照がなされ、該図面は、有意係数フラグをエンコードするためにコンテキストセットを選択するためのプロセスの第2実施形態を採用するビデオをエンコードする例示的な方法300を示している。
方法300は、係数グループ、すなわち有意係数フラグのセットに対して、有意係数グループフラグがオペレーション302において推論されるべきであるかどうかを決定する。上述したように、この例におけるコンテキストモデルは、右の隣接する係数グループおよびより低い隣接する係数グループの有意係数グループフラグの両方が1に等しい場合に、有意係数グループフラグが1に推論されていることを前提としている。それに該当する場合には、オペレーション304において、現在の係数グループの有意係数グループフラグは、1に設定される。それに該当しない場合には、エンコーダは、実際には、オペレーション06によって示されているように、係数グループにおけるデータを見て、なんらかの非ゼロ係数が存在するかどうかを決定する。現在の係数グループのすべての有意係数フラグがゼロである場合には、オペレーション308において、有意係数グループフラグは、ゼロに設定される。オペレーション308は、有意係数グループフラグをエンコードすることを含み得る。その後、オペレーション310において、エンコーダは、スキャン順序において次の係数グループに移動し、処理をやり直すためにオペレーション302に戻る。
係数グループが少なくとも1つの非ゼロ有意係数フラグを含むことがわかった場合には、オペレーション307において、有意係数グループフラグは、1に設定される。また、オペレーション307は、有意係数グループフラグをエンコードすることを含む。
オペレーション304において、有意係数グループフラグが推論された場合には、オペレーション314において、第1コンテキストセットが選択される。より多くの定義されたコンテキストが存在し、そして第1コンテキストセットが所定数のこれらの定義されたコンテキストを含む実施形態においては、第1コンテキストセットを選択することは、第1コンテキストセット内のこれらの定義されたコンテキストのうちの所定の1つを指すように、コンテキストインデックスを設定することによって実装され得る。
有意係数グループフラグが、オペレーション307において、係数グループ内に非ゼロ係数が存在するかどうかに基づいて決定された場合には、オペレーション316において、第2コンテキストセットが選択される。いくつかの実装においては、第2コンテキストセットの選択は、第2コンテキストセット内の定義されたコンテキストのうちの1つを指すように、コンテキストインデックス変数を設定することを含む。
第1コンテキストセットまたは第2コンテキストセットを用いるかどうかに関わらず、オペレーション318において、選択されたコンテキストセットは、現在の係数グループの有意係数グループフラグをエンコードするために用いられる。最終係数グループに対して、これは、それ固有の割り当てられたコンテキストを用いてDC有意係数フラグをエンコードすることを含み得、そしてその他の任意のこのようなフラグは、変換ユニット内のそれらの位置に基づくそれら固有のコンテキストを有し得る。オペレーション320は、それが変換ユニット内の最終係数グループであるかどうかを決定する。そうである場合には、エンコーダは、変換ユニットに関して次のエンコーディングステップに進み得る(これは、係数レベルおよび/またはサインをエンコードすることを含み得る)。そうでない場合には、エンコーダは、逆スキャン順序において次の係数グループに移動し、プロセスを繰り返す。
ここで図12に対する参照がなされ、該図面は、変換ユニットに対する有意マップを再構成するためにエンコードされたビデオデータのビットストリームをデコードするための例示的な方法400を示している。有意マップは、有意係数フラグの連続セット、すなわち係数グループに区画化される。
オペレーション402において、デコーダは、現在の係数グループに対する有意係数グループフラグが推論されるべきであるかどうかを決定する。そうである場合には、オペレーション412において、これは1に設定される。そうでない場合には、オペレーション404において、有意係数グループフラグは、ビットストリームからデコードされる。上述したように、この例において、有意係数グループフラグは、右の隣接する有意係数グループおよびより低い隣接する有意係数グループに対する有意係数グループフラグの両方が
1に等しい場合に、推論される。
オペレーション408において、デコードされた有意係数グループフラグが0に等しい場合には、オペレーション408において、その係数グループのすべての有意係数フラグは、0に設定される。その後、デコーダは、オペレーション410によって示されているように、逆スキャン順序において次の係数グループに移動し、その後、オペレーション402からのプロセスを繰り返す。
デコードされた有意係数グループフラグがゼロではない場合には、オペレーション414において、第2コンテキストが選択される。有意係数グループフラグが1として推論された場合には、オペレーション416において、第1コンテキストセットが選択される。いずれの場合においても、オペレーション418において、選択されたコンテキストセットは、係数グループの有意係数フラグをデコードするために用いられる。オペレーション420は、それが最終係数グループであるかどうかを決定し、そうである場合には、デコーディングの次のフェーズに移動することを含む。そうでない場合には、デコーダは、逆スキャン順序において次の係数グループに移動し、オペレーション402に戻り、有意係数フラグに対するデコーディングプロセスを継続する。
以下に、疑似コードを用いたデコーディングプロセスの第1実施形態の一例を例示する。デコーディングプロセスの第1実施形態は、領域が係数グループ境界に沿って固定されるもののうちの1つである。この例の疑似コードは、領域への変換ユニットの1つの可能性のある分割の1つの可能性のある実装にすぎない。
以下の疑似コードにおいて例示されるシンタックスにおいて、変換ユニットのサイズが16×16または32×32(例えば、log2TrafoSize>3)である場合には、例示的なプロセスが実行される。インデックス変数sigCtxに対して以下において用いられる特定の整数値は、多くの定義されたコンテキストに対する所定のインデックスの例に過ぎないことに留意されたい。
このプロセスに対する入力は、色成分インデックスcIdx、現在の係数スキャン位置(xC,yC)、変換ブロック幅log2TrafoWidth、および変換ブロック高さlog2TrafoHeightである。このプロセスの出力は、ctxIdxIncである。
変数sigCtxは、現在の位置(xC,yC)、変換ブロックサイズ、およびシンタックス要素significant_coeff_flagおよびsignificant_coeffgroup_flagの既にデコードされたビンに依存する。sigCtxの導出に対して、以下が当てはまる。
log2TrafoWidthがlog2TrafoHeightに等しく、log2TrafoWidthが2に等しい場合には、sigCtxは、ctxIdxMap4×4[]を用いて以下のように導かれる。
Figure 2013150322
そうでなければ、log2TrafoWidthがlog2TrafoHeightに等しく、log2TrafoWidthが3に等しい場合には、sigCtxは、ctxIdxMap8×8[]を用いて以下のように導かれる。
Figure 2013150322
そうでなければ、xC+yCが0に等しい場合には、sigCtxは、以下のように導かれる。
Figure 2013150322
そうでなければ、(xC+yCが0よりも大きい)場合には、sigCtxは、以下のように、シンタックス要素significant_coeff_flagの既にデコードされたビンを用いて、導かれる。
変数sigCtxは、0に初期化される。
xCが(1<<log2TrafoWidth)−1未満のときには、以下が当てはまる。
Figure 2013150322
xCが(1<<log2TrafoWidth)−1未満かつyCが(1<<log2TrafoHeight)−1のときには、以下が当てはまる。
Figure 2013150322
xCが(1<<log2Width)−2未満の場合には、以下が当てはまる。
Figure 2013150322
以下の条件
・yCは、(1<<log2TrafoHeight)−1未満である、
・xC%4は0に等しくない、あるいはyC%4は0に等しくない、
・xC%4は3に等しくない、あるいはyC%4は2に等しくない、
のすべてが正しい場合には、以下が当てはまる。
Figure 2013150322
yCが(1<<log2TrafoHeight)−2かつsigCtxが4未満の場合には、以下が当てはまる。
Figure 2013150322
変数sigCtxは、以下のように改変される。
cIdxが0に等しく、かつxCおよびyCの両方が1<<(max(log2TrafoWidth,log2TrafoHeight)−2)以上である場合には、以下が当てはまる。
Figure 2013150322
そうでなければ、以下が当てはまる。
Figure 2013150322
コンテキストインデックスのインクリメントctxIdxIncは、色成分インデックスcIdxおよびsigCtxを用いて、以下のように導かれる。
cIdxが0に等しい場合には、ctxIdxIncは、以下のように導かれる。
Figure 2013150322
そうでなければ、(cIdxが0よりも大きい)の場合には、ctxIdxIncは、以下のように導かれる。
Figure 2013150322
デコーディングプロセスの第2実施形態を実装するための例示的なシンタックスもまた、例示される。第2実施形態は、領域が、係数グループフラグが取得された方法、すなわちデコーディングを介するかどうか、または推論によるかどうかに基づいて、動的に決定されるもののうちの1つである。
第2実施形態に対する例示的なシンタックスは、ctxIdxIncの導出の直前に示されているsigCtxに対する改変が以下によって置換されることを除き、第1実施形態に対して上述されたシンタックスに対するものと実質的に同じであり得る。
cIdxが0に等しく、かつ以下の条件
・(xC>>2)+(yC>>2)が0に等しい、
・(xC<<2)が(1<<log2TrafoWidth−2)−1未満であり、(yC>>2)が(1<<log2TraoHeight−2)−1未満であり、significant_coeffgroup_flag[(xC>>2)+1][yC>>2]+significant_coeffgroup_flag[xC>>2][(yC>>2)+1]が2に等しい
のうちの少なくとも1つが正しい場合には、以下が当てはまる。
Figure 2013150322
そうでなければ、以下が当てはまる。
Figure 2013150322
ここで図13に対する参照がなされ、該図面は、エンコーダ900の例示的な実施形態の簡略化されたブロック図を示している。エンコーダ900は、プロセッサ902、メモリ904、およびエンコーディングアプリケーション906を含んでいる。エンコーディングアプリケーション906は、メモリ904内に格納され、本明細書中に記載されているようなオペレーションを実行するようにプロセッサ902を構成するための命令を含んでいる、コンピュータプログラムまたはアプリケーションを含み得る。例えば、エンコーディングアプリケーション906は、本明細書中に記載されているプロセスにしたがって、エンコードし、エンコードされたビットストリームを出力し得る。エンコーディングアプリケーション906は、例えばコンパクトディスク、フラッシュメモリデバイス、ランダムアクセスメモリ、ハードドライブ等のコンピュータ読み取り可能な媒体上に格納され得ることが理解され得る。
ここで図14に対する参照がなされ、該図面は、デコーダ1000の例示的な実施形態の簡略化されたブロック図を示している。デコーダ1000は、プロセッサ1002、メモリ1004、およびデコーディングアプリケーション1006を含む。デコーディングアプリケーション1006は、メモリ1004に格納され、本明細書中に記載されているようなオペレーションを実行するようにプロセッサ1002を構成するための命令を含んでいる、コンピュータプログラムまたはアプリケーションを含み得る。デコーディングアプリケーション1006は、少なくとも部分的に、本明細書中に記載されているように、有意係数フラグを再構成することに基づいて、残余を再構成するように構成されたエントロピーデコーダを含み得る。デコーディングアプリケーション1006は、例えばコンパクトディスク、フラッシュメモリデバイス、ランダムアクセスメモリ、ハードドライブ等のコンピュータ読み取り可能媒体上に格納され得るということが理解され得る。
本願にしたがうデコーダおよび/またはエンコーダは、サーバ、適切にプログラムされた汎用コンピュータ、オーディオ/ビデオエンコーディングおよび再生デバイス、セットトップテレビジョンボックス、テレビジョンブロードキャスト機器、およびモバイルデバイスを含むがこれらに限定されない、多くのコンピューティングデバイスにおいて実装され得るということが理解され得る。デコーダまたはエンコーダは、本明細書中に記載されている機能を実行するようにプロセッサを構成するための命令を含むソフトウェアによって実装され得る。ソフトウェア命令は、CD、RAM、ROM、フラッシュメモリ等を含む、任意の適切な持続性コンピュータ読み取り可能メモリ上に格納され得る。
本明細書中に記載されているエンコーダ、およびエンコーダを構成するための記載された方法/プロセスを実装するモジュール、ルーチン、プロセス、スレッド、またはその他のソフトウェアコンポーネントは、標準的なコンピュータプログラミング技術および言語を用いて実現され得る。本願は、特定のプロセッサ、コンピュータ言語、コンピュータプログラミング規約、データ構造、その他のこのような実装の詳細に限定されない。当業者は、記載されているプロセスが、特定用途向け集積チップ(ASIC)等の一部分として揮発性または不揮発性メモリに格納されたコンピュータ実行可能コードの一部分として実装され得ることを認識し得る。
記載された実施形態の特定の適応および改変がなされ得る。したがって、上述した実施形態は、例示的なものであり、限定的なものではないと考慮されるべきである。
100、110、120、200、220、250 変換ユニット
112、122、202 第1領域
114、124、204 第2領域
126、206 DC有意係数フラグ
226 DC位置

Claims (15)

  1. 変換ユニットに対する有意係数フラグを再構成することによってエンコードされたビデオのビットストリームをデコードするための方法であって、該変換ユニットは、ブロックのシーケンスを含み、該ビットストリームは、有意係数フラグのセットをエンコードし、各セットは、それぞれのブロックに対応しており、該方法は、
    第1ブロックに対応する有意係数フラグのセットに対して、該第1ブロックの右のブロックに関連付けられた有意係数グループフラグと、該第1ブロックの下のブロックに関連付けられた有意係数グループフラグとに基づいて、当該セットの有意係数フラグをデコードすることにおいて用いるための複数のコンテキストセットからコンテキストセットを選択することと、
    該選択されたコンテキストセットを用いて当該セットの該有意係数フラグをデコードすることと
    を含む、方法。
  2. 各有意係数グループフラグは、その関連付けられたブロックが、少なくとも1つの非ゼロ有意係数フラグを含むことが想定されるかどうかを示す、請求項1に記載の方法。
  3. コンテキストセットを選択することは、前記有意係数グループフラグの両方が非ゼロである場合に、第1コンテキストセットを選択し、そうでない場合に、別のコンテキストセットを選択することを含む、請求項1または請求項2に記載の方法。
  4. デコードすることは、コンテキスト適応デコーディングを含み、前記コンテキストセットは、前記有意係数フラグの当該セットの該有意係数フラグをコンテキスト適応デコードする際に用いられるコンテキストを識別する、請求項1〜3のいずれか一項に記載の方法。
  5. コンテキストセットを選択することは、前記第1ブロックが前記変換ユニットにおける前記左上ブロックである場合に、該第1ブロックのDC位置における前記有意係数フラグをデコードするための特定のコンテキストを選択することをさらに含む、請求項1〜4のいずれか一項に記載の方法。
  6. コンテキストセットを選択することは、前記第1ブロックが前記変換ユニットの前記左上コーナーに存在するかどうかにさらに基づいている、請求項1〜5のいずれか一項に記載の方法。
  7. コンテキストセットを選択することは、前記変換ユニットのサイズにさらに基づいている、請求項1〜6のいずれか一項に記載の方法。
  8. コンテキストセットを選択することは、前記変換ユニットのコンポーネントが、輝度コンポーネントであるか彩度コンポーネントであるかどうかにさらに基づいている、請求項1〜7のいずれか一項に記載の方法。
  9. 変換ユニットに対する有意係数フラグを再構成するためにエンコードされたデータのビットストリームをデコードするためのデコーダであって、該デコーダは、
    プロセッサと、
    メモリと、
    メモリ内に格納され、かつ請求項1〜8のいずれか一項に記載の方法を実行するように該プロセッサを構成するための命令を含むデコーディングアプリケーションと
    を含む、デコーダ。
  10. 変換ユニットに対する有意係数フラグをエンコードすることによってビデオをエンコードして、有意係数フラグのエンコードされたセットのビットストリームを形成するための方法であって、該変換ユニットは、ブロックのシーケンスを含み、有意係数フラグの各セットは、それぞれのブロックに対応しており、該方法は、
    第1ブロックに対応する有意係数フラグのセットに対して、該第1ブロックの右のブロックに関連付けられた有意係数グループフラグと、該第1ブロックの下のブロックに関連付けられた有意係数グループフラグとに基づいて、当該セットの有意係数フラグをエンコードすることにおいて用いるための複数のコンテキストからコンテキストセットを選択することと、
    該選択されたコンテキストセットを用いて当該セットの該有意係数フラグをエンコードすることと
    を含む、方法。
  11. 各有意係数グループフラグは、その関連付けられたブロックが、少なくとも1つの非ゼロ有意係数フラグを含むことが想定されるかどうかを示す、請求項10に記載の方法。
  12. コンテキストセットを選択することは、前記有意係数グループフラグの両方が非ゼロである場合に、第1コンテキストセットを選択し、そうでない場合に、別のコンテキストセットを選択することを含む、請求項10または11に記載の方法。
  13. エンコードすることは、コンテキスト適応エンコーディングを含み、前記コンテキストセットは、当該セットの前記有意係数フラグをコンテキスト適応エンコードする際に用いされるコンテキストセットを識別する、請求項10〜12のいずれか一項に記載の方法。
  14. 変換ユニットに対する有意係数フラグをエンコードして、エンコードされたデータのビットストリームを生成するためのエンコーダであって、該エンコーダは、
    プロセッサと、
    メモリと、
    メモリ内に格納され、かつ請求項10〜13のいずれかに記載の方法を実行するように前記プロセッサを構成するための命令を含むエンコーディングアプリケーションと
    を含む、エンコーダ。
  15. プロセッサ実行可能な命令を格納している持続性プロセッサ読み取り可能な媒体であって、該命令は、実行されたときに、請求項1〜8、10〜13のいずれか一項に記載の方法を実行するように1つ以上のプロセッサを構成する、媒体。
JP2013006050A 2012-01-20 2013-01-17 コンテキストセット選択のための方法およびデバイス Active JP5526246B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP12151965.6 2012-01-20
EP12151965.6A EP2618570B1 (en) 2012-01-20 2012-01-20 Method and devices for context set selection

Publications (2)

Publication Number Publication Date
JP2013150322A true JP2013150322A (ja) 2013-08-01
JP5526246B2 JP5526246B2 (ja) 2014-06-18

Family

ID=45491485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013006050A Active JP5526246B2 (ja) 2012-01-20 2013-01-17 コンテキストセット選択のための方法およびデバイス

Country Status (10)

Country Link
EP (2) EP2618570B1 (ja)
JP (1) JP5526246B2 (ja)
KR (1) KR101455501B1 (ja)
CN (1) CN103220516B (ja)
AU (1) AU2013200291B2 (ja)
BR (1) BR102013001517B1 (ja)
CA (1) CA2802285C (ja)
MX (1) MX2013000712A (ja)
SG (1) SG192352A1 (ja)
TW (1) TWI533705B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111683255B (zh) 2012-01-20 2022-08-02 索尼公司 有效度图编码的复杂度降低
CN114222137A (zh) * 2016-05-28 2022-03-22 世宗大学校产学协力团 构成预测运动矢量列表的方法
KR102257829B1 (ko) 2017-04-13 2021-05-28 엘지전자 주식회사 영상의 부호화/복호화 방법 및 이를 위한 장치
CN112911288B (zh) * 2019-12-03 2022-05-27 杭州海康威视数字技术股份有限公司 解码方法、编码方法、装置及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011128303A2 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding of significance maps and transform coefficient blocks

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356733B1 (ko) * 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
CN102231830B (zh) * 2010-11-23 2013-04-17 浙江大学 用于上下文算术编解码的运算单元
CN102088603B (zh) * 2010-12-31 2013-12-04 北京大学深圳研究生院 用于视频编码器的熵编码器及其实现方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011128303A2 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding of significance maps and transform coefficient blocks

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
""Multi-level significance maps for Large Transform Units (Document: JCTVC-G644)"", [ONLINE], JPN6014010639, November 2011 (2011-11-01), ISSN: 0002770183 *
"INDEX OF /JCT/DOC_END_USER/DOCUMENTS/7_GENEVA/WG11", JPN6014010642, ISSN: 0002770184 *

Also Published As

Publication number Publication date
KR20130086169A (ko) 2013-07-31
MX2013000712A (es) 2014-01-09
CA2802285A1 (en) 2013-07-20
AU2013200291B2 (en) 2015-07-16
BR102013001517B1 (pt) 2020-12-15
JP5526246B2 (ja) 2014-06-18
SG192352A1 (en) 2013-08-30
TW201347546A (zh) 2013-11-16
BR102013001517A2 (pt) 2015-01-13
EP2618570A1 (en) 2013-07-24
EP2618578B1 (en) 2015-07-15
CN103220516A (zh) 2013-07-24
EP2618570B1 (en) 2017-12-13
TWI533705B (zh) 2016-05-11
EP2618578A1 (en) 2013-07-24
CA2802285C (en) 2017-08-22
KR101455501B1 (ko) 2014-10-30
CN103220516B (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
JP5537681B2 (ja) 変換ユニット内の複数サインビット秘匿
US11778191B2 (en) Methods and devices for context set selection
EP2712201B1 (en) Methods and devices for entropy coding in scalable video compression
US20130195200A1 (en) Methods and devices for context modeling to enable modular processing
US9008189B2 (en) Methods and devices for context modeling to enable modular processing
KR101407755B1 (ko) 인코딩 및 디코딩을 위한 멀티레벨 유의성 맵
TWI493945B (zh) 使用分割區選擇之重要地圖編碼及解碼
JP5526246B2 (ja) コンテキストセット選択のための方法およびデバイス
US20130272384A1 (en) Modified contexts for level coding of video data
CA2801095C (en) Methods and devices for context modeling to enable modular processing

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140414

R150 Certificate of patent or registration of utility model

Ref document number: 5526246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250