JP2024512503A

JP2024512503A - ビデオコーディングのための符号予測のためのコンテキストモデル化

Info

Publication number: JP2024512503A
Application number: JP2023557415A
Authority: JP
Inventors: セレジン、バディム; ケロフスキー、ルイス・ジョセフ; カルチェビチ、マルタ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2021-03-29
Filing date: 2022-03-25
Publication date: 2024-03-19
Also published as: CL2023002816A1; KR20230157988A; EP4315855A1; AU2022246722A1; BR112023018889A2; IL304267A; CO2023012260A2; CA3208104A1; TW202241131A; MX2023011286A; AU2022246722A9; WO2022213042A1

Abstract

ビデオコーダが、変換係数について符号予測仮説が正しいかどうかを示す符号予測シンタックス要素をコーディングし得る。ビデオコーダは、コンテキストベースコーディングプロセスを使用して符号予測シンタックス要素をコーディングし得る。ビデオコーダは、ビデオデータのブロック中の変換係数の位置に基づいて、符号予測シンタックス要素をコーディングするためのコンテキストを決定し得る。コンテキストは、ブロックをコーディングするために使用されるコーディングモードにさらに基づき得る。【選択図】図１０

Description

優先権の主張

[0001]本出願は、その各々の内容全体が参照により本明細書に組み込まれる、２０２２年３月２４日に出願された米国特許出願第１７／６５６，３１９号と、２０２１年３月２９日に出願された米国仮特許出願第６３／１６７，５０７号との優先権を主張する。２０２２年３月２４日に出願された米国特許出願第１７／６５６，３１９号は、２０２１年３月２９日に出願された米国仮出願第６３／１６７，５０７号の利益を主張する。

[0002]本開示は、ビデオ符号化およびビデオ復号に関する。

[0003]デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲーミングデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ－２、ＭＰＥＧ－４、ＩＴＵ－ＴＨ．２６３、ＩＴＵ－ＴＨ．２６４／ＭＰＥＧ－４，Ｐａｒｔ１０，アドバンストビデオコーディング（ＡＶＣ）、ＩＴＵ－ＴＨ．２６５／高効率ビデオコーディング（ＨＥＶＣ）、ＩＴＵ－ＴＨ．２６６／汎用ビデオコーディング（ＶＶＣ）によって定義された規格、およびそのような規格の拡張、ならびにＡｌｌｉａｎｃｅｆｏｒＯｐｅｎＭｅｄｉａによって開発されたＡＯＭｅｄｉａＶｉｄｅｏ１（ＡＶ１）などのプロプライエタリビデオコーデック／フォーマットに記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004]ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間（イントラピクチャ）予測および／または時間（インターピクチャ）予測を含む。ブロックベースビデオコーディングでは、ビデオスライス（たとえば、ビデオピクチャまたはビデオピクチャの一部分）が、コーディングツリーユニット（ＣＴＵ）、コーディングユニット（ＣＵ）および／またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコーディングされた（Ｉ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測を使用して符号化される。ピクチャのインターコーディングされた（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間予測、または他の参照ピクチャ中の参照サンプルに対する時間予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005]概して、本開示は、ビデオコーディングにおける符号（sign）予測のための技法について説明する。特に、本開示は、コンテキストベースコーディングを使用して符号予測シンタックス要素をコーディングするためのコンテキストを決定するための技法について説明する。符号予測シンタックス要素は、変換係数についての符号予測仮説が変換係数の実際の符号値に一致するかどうかを示すシンタックス要素である。符号予測仮説は、特定の変換係数の符号が正の値を有するのか負の値を有するのかに関する予測である。ビデオコーダが、コンテキストベースコーディングを使用して符号予測をコーディングするためのコンテキスト（たとえば、確率モデル）を決定し得る。

[0006]特に、本開示は、ビデオコーダが、ブロック中の変換係数の位置および／またはそのブロックをコーディングするために使用されるコーディングモード（たとえば、インターコーディングまたはイントラコーディング）のうちの１つまたは複数に基づいてコンテキストを決定するように構成された、技法について説明する。変換係数の特性（たとえば、大きさおよび符号）が、ブロック内の位置および／または変換係数を生成するために使用されるコーディングモードに基づいて異なり得るので、符号予測をコーディングするためのコンテキストを決定するために変換係数の位置および／またはコーディングモードを使用することは、コーディング効率を改善し得る。

[0007]一例では、本開示は、ビデオデータを復号する方法であって、本方法は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す；コンテキストを使用して符号予測シンタックス要素を復号することと、を備える、方法について説明する。

[0008]別の例では、本開示は、ビデオデータを復号するように構成された装置であって、本装置が、ビデオデータのブロックを記憶するように構成されたメモリと、回路中に実装され、メモリと通信している１つまたは複数のプロセッサとを備え、１つまたは複数のプロセッサは、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す；コンテキストを使用して符号予測シンタックス要素を復号することと、を行うように構成された、装置について説明する。

[0009]別の例では、本開示は、ビデオデータを復号するように構成された装置であって、本装置は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段と、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す；コンテキストを使用して符号予測シンタックス要素を復号するための手段と、を備える、装置について説明する。

[0010]別の例では、本開示は、実行されたとき、ビデオデータを復号するように構成された１つまたは複数のプロセッサに、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す；コンテキストを使用して符号予測シンタックス要素を復号することと、を行わせる命令を記憶する非一時的コンピュータ可読記憶媒体について説明する。

[0011]別の例では、本開示は、ビデオデータを符号化するように構成された装置であって、本装置が、ビデオデータのブロックを記憶するように構成されたメモリと、回路中に実装され、メモリと通信している１つまたは複数のプロセッサとを備え、１つまたは複数のプロセッサは、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す；コンテキストを使用して符号予測シンタックス要素を符号化することと、を行うように構成された、装置について説明する。

[0012]１つまたは複数の例の詳細が、添付の図面および以下の説明に記載される。他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになろう。

[0013]本開示の技法を実施し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0014]本開示の技法による、例示的な変換ブロック分解を示す概念図。 [0015]本開示の技法による、符号予測における例示的な不連続性測度（discontinuity measure）を示す概念図。 [0016]本開示の技法による、変換係数の例示的な位置を示す概念図。 [0017]本開示の技法を実施し得る例示的なビデオエンコーダを示すブロック図。 [0018]本開示の技法を実施し得る例示的なビデオデコーダを示すブロック図。 [0019]本開示の技法による、現在ブロックを符号化するための例示的な方法を示すフローチャート。 [0020]本開示の技法による、現在ブロックを復号するための例示的な方法を示すフローチャート。 [0021]本開示の技法による、現在ブロックを符号化するための別の例示的な方法を示すフローチャート。 [0022]本開示の技法による、現在ブロックを復号するための別の例示的な方法を示すフローチャート。

[0023]ビデオエンコーダが、インター予測またはイントラ予測など、コーディングモードを使用してビデオデータのブロックをコーディングし得る。いくつかの例では、ビデオエンコーダは、コーディングされているブロックと予測ブロックとの間の差を表すビデオデータの残差ブロックを形成し得る。残差ブロックは、次いで、変換係数のブロックを作成するために周波数領域に変換され得る。変換係数は、整数値に量子化され得る。各変換係数は、大きさ（たとえば、絶対値）および符号（たとえば、正または負）によって表される。

[0024]いくつかの例では、ビデオエンコーダは、ある数の変換係数について符号予測を実施するように構成され得る。たとえば、２つの符号が予測される場合、４つの可能な組合せ、または符号予測仮説、すなわち、（＋，＋）、（＋，－）、（－，＋）、（－，－）があり得る。すべての４つの組合せについて、コスト関数が計算され、最小コストをもつ組合せ（たとえば、符号予測仮説）が符号予測子組合せとして選択される。ビデオデコーダが、逆のプロセスを実施し得る。

[0025]符号予測が実施される変換係数について、バイパスシグナリングの代わりに、ビデオエンコーダは、実際の変換係数符号が仮説に等しいか否かを示すために、コンテキストコーディングされたビン（たとえば、符号予測シンタックス要素）を符号化およびシグナリングし得る。前の技法では、符号予測シンタックス要素をコーディングするために使用されるコンテキストは、変換係数大きさに依存していた。本開示は、符号予測シンタックス要素をコーディングするためのコンテキストを決定する異なる技法について説明する。特に、ビデオコーダは、ブロック中の変換係数の位置および／またはそのブロックをコーディングするために使用されるコーディングモードのうちの１つまたは複数に基づいてコンテキストを決定し得る。変換係数の特性（たとえば、大きさおよび符号）が、ブロック内の位置および変換係数を生成するために使用されるコーディングモードに基づいて異なり得るので、符号予測をコーディングするためのコンテキストを決定するために変換係数の位置および／またはコーディングモードを使用することは、コーディング効率を改善し得る。

[0026]図１は、本開示の技法を実施し得る例示的なビデオ符号化および復号システム１００を示すブロック図である。本開示の技法は、概して、ビデオデータをコーディング（符号化および／または復号）することを対象とする。概して、ビデオデータは、ビデオを処理するための何らかのデータを含む。したがって、ビデオデータは、生の符号化されていないビデオ、符号化されたビデオ、復号された（たとえば、再構築された）ビデオ、およびシグナリングデータなどのビデオメタデータを含み得る。

[0027]図１に示されているように、システム１００は、この例では、宛先デバイス１１６によって復号および表示されるべき符号化されたビデオデータを提供するソースデバイス１０２を含む。特に、ソースデバイス１０２は、コンピュータ可読媒体１１０を介して宛先デバイス１１６にビデオデータを提供する。ソースデバイス１０２と宛先デバイス１１６とは、デスクトップコンピュータ、ノートブック（すなわち、ラップトップ）コンピュータ、モバイルデバイス、タブレットコンピュータ、セットトップボックス、スマートフォンなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲーミングコンソール、ビデオストリーミングデバイス、ブロードキャスト受信機デバイスなどを含む、広範囲のデバイスのいずれかを備え得る。いくつかの場合には、ソースデバイス１０２および宛先デバイス１１６は、ワイヤレス通信のために装備され得、したがって、ワイヤレス通信デバイスと呼ばれることがある。

[0028]図１の例では、ソースデバイス１０２は、ビデオソース１０４と、メモリ１０６と、ビデオエンコーダ２００と、出力インターフェース１０８とを含む。宛先デバイス１１６は、入力インターフェース１２２と、ビデオデコーダ３００と、メモリ１２０と、ディスプレイデバイス１１８とを含む。本開示によれば、ソースデバイス１０２のビデオエンコーダ２００および宛先デバイス１１６のビデオデコーダ３００は、ビデオコーディングにおける符号予測のためのコンテキストモデル化のための技法を適用するように構成され得る。したがって、ソースデバイス１０２はビデオ符号化デバイスの一例を表し、宛先デバイス１１６はビデオ復号デバイスの一例を表す。他の例では、ソースデバイスおよび宛先デバイスは、他の構成要素または配置を含み得る。たとえば、ソースデバイス１０２は、外部カメラなど、外部ビデオソースからビデオデータを受信し得る。同様に、宛先デバイス１１６は、一体型ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

[0029]図１に示されているシステム１００は一例にすぎない。概して、どんなデジタルビデオ符号化および／または復号デバイスも、ビデオコーディングにおける符号予測のためのコンテキストモデル化のための技法を実施し得る。ソースデバイス１０２および宛先デバイス１１６は、ソースデバイス１０２が宛先デバイス１１６への送信のためにコーディングされたビデオデータを生成するようなコーディングデバイスの例にすぎない。本開示は、データのコーディング（符号化および／または復号）を実施するデバイスとして「コーディング」デバイスに言及する。したがって、ビデオエンコーダ２００およびビデオデコーダ３００は、コーディングデバイス、特に、それぞれビデオエンコーダおよびビデオデコーダの例を表す。いくつかの例では、ソースデバイス１０２および宛先デバイス１１６は、ソースデバイス１０２および宛先デバイス１１６の各々がビデオ符号化構成要素およびビデオ復号構成要素を含むように、実質的に対称的に動作し得る。したがって、システム１００は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、またはビデオテレフォニーのために、ソースデバイス１０２と宛先デバイス１１６との間の一方向または二方向ビデオ送信をサポートし得る。

[0030]概して、ビデオソース１０４は、ビデオデータ（すなわち、生の符号化されていないビデオデータ）のソースを表し、ビデオデータの連続的な一連のピクチャ（「フレーム」とも呼ばれる）をビデオエンコーダ２００に提供し、ビデオエンコーダ２００は、ピクチャのためにデータを符号化する。ソースデバイス１０２のビデオソース１０４は、ビデオカメラ、前にキャプチャされた生のビデオを含んでいるビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースなど、ビデオキャプチャデバイスを含み得る。さらなる代替として、ビデオソース１０４は、ソースビデオとしてのコンピュータグラフィックスベースデータ、またはライブビデオとアーカイブされたビデオとコンピュータ生成されたビデオとの組合せを生成し得る。各場合において、ビデオエンコーダ２００は、キャプチャされたビデオデータ、プリキャプチャされたビデオデータ、またはコンピュータ生成されたビデオデータを符号化する。ビデオエンコーダ２００は、ピクチャを、（「表示順序」と呼ばれることがある）受信順序から、コーディングのためのコーディング順序に再配置し得る。ビデオエンコーダ２００は、符号化されたビデオデータを含むビットストリームを生成し得る。ソースデバイス１０２は、次いで、たとえば、宛先デバイス１１６の入力インターフェース１２２による受信および／または取出しのために、出力インターフェース１０８を介して、符号化されたビデオデータをコンピュータ可読媒体１１０上に出力し得る。

[0031]ソースデバイス１０２のメモリ１０６と、宛先デバイス１１６のメモリ１２０とは、汎用メモリを表す。いくつかの例では、メモリ１０６、１２０は、生のビデオデータ、たとえば、ビデオソース１０４からの生のビデオ、およびビデオデコーダ３００からの生の復号されたビデオデータを記憶し得る。追加または代替として、メモリ１０６、１２０は、たとえば、それぞれ、ビデオエンコーダ２００およびビデオデコーダ３００によって実行可能なソフトウェア命令を記憶し得る。メモリ１０６およびメモリ１２０は、この例ではビデオエンコーダ２００とビデオデコーダ３００とは別個に示されているが、ビデオエンコーダ２００およびビデオデコーダ３００は、機能的に同様のまたは等価な目的で内部メモリをも含み得ることを理解されたい。さらに、メモリ１０６、１２０は、符号化されたビデオデータ、たとえば、ビデオエンコーダ２００からの出力、およびビデオデコーダ３００への入力を記憶し得る。いくつかの例では、メモリ１０６、１２０の部分は、たとえば、生の復号および／または符号化されたビデオデータを記憶するために、１つまたは複数のビデオバッファとして割り振られ得る。

[0032]コンピュータ可読媒体１１０は、ソースデバイス１０２から宛先デバイス１１６に符号化されたビデオデータを移送することが可能な任意のタイプの媒体またはデバイスを表し得る。一例では、コンピュータ可読媒体１１０は、ソースデバイス１０２が、たとえば、無線周波数ネットワークまたはコンピュータベースネットワークを介して、符号化されたビデオデータを宛先デバイス１１６にリアルタイムで直接送信することを可能にするための通信媒体を表す。出力インターフェース１０８は、符号化されたビデオデータを含む送信信号を変調し得、入力インターフェース１２２は、ワイヤレス通信プロトコルなどの通信規格に従って、受信された送信信号を復調し得る。通信媒体は、無線周波数（ＲＦ）スペクトルまたは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス１０２から宛先デバイス１１６への通信を容易にするのに有用であり得る任意の他の機器を含み得る。

[0033]いくつかの例では、ソースデバイス１０２は、出力インターフェース１０８からストレージデバイス１１２に符号化されたデータを出力し得る。同様に、宛先デバイス１１６は、入力インターフェース１２２を介してストレージデバイス１１２からの符号化されたデータにアクセスし得る。ストレージデバイス１１２は、ハードドライブ、Ｂｌｕ－ｒａｙ（登録商標）ディスク、ＤＶＤ、ＣＤ－ＲＯＭ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化されたビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。

[0034]いくつかの例では、ソースデバイス１０２は、ソースデバイス１０２によって生成された符号化されたビデオデータを記憶し得るファイルサーバ１１４または別の中間ストレージデバイスに符号化されたビデオデータを出力し得る。宛先デバイス１１６は、ストリーミングまたはダウンロードを介してファイルサーバ１１４からの記憶されたビデオデータにアクセスし得る。

[0035]ファイルサーバ１１４は、符号化されたビデオデータを記憶し、その符号化されたビデオデータを宛先デバイス１１６に送信することが可能な任意のタイプのサーバデバイスであり得る。ファイルサーバ１１４は、（たとえば、ウェブサイトのための）ウェブサーバ、（ファイル転送プロトコル（ＦＴＰ）またはファイル配信オーバー単方向トランスポート（ＦＬＵＴＥ：File Delivery over Unidirectional Transport）プロトコルなどの）ファイル転送プロトコルサービスを提供するように構成されたサーバ、コンテンツ配信ネットワーク（ＣＤＮ）デバイス、ハイパーテキスト転送プロトコル（ＨＴＴＰ）サーバ、マルチメディアブロードキャストマルチキャストサービス（ＭＢＭＳ）または拡張ＭＢＭＳ（ｅＭＢＭＳ）サーバ、および／あるいはネットワーク接続ストレージ（ＮＡＳ）デバイスを表し得る。ファイルサーバ１１４は、追加または代替として、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ）、ＨＴＴＰライブストリーミング（ＨＬＳ）、リアルタイムストリーミングプロトコル（ＲＴＳＰ）、ＨＴＴＰ動的ストリーミングなど、１つまたは複数のＨＴＴＰストリーミングプロトコルを実装し得る。

[0036]宛先デバイス１１６は、インターネット接続を含む任意の標準的なデータ接続を通してファイルサーバ１１４からの符号化されたビデオデータにアクセスし得る。これは、ファイルサーバ１１４に記憶された符号化されたビデオデータにアクセスするのに好適であるワイヤレスチャネル（たとえば、Ｗｉ－Ｆｉ（登録商標）接続）、ワイヤード接続（たとえば、デジタル加入者回線（ＤＳＬ）、ケーブルモデムなど）、またはその両方の組合せを含み得る。入力インターフェース１２２は、ファイルサーバ１１４からメディアデータを取り出すまたは受信するための上記で説明された様々なプロトコル、あるいはメディアデータを取り出すための他のそのようなプロトコルのうちのいずれか１つまたは複数に従って動作するように構成され得る。

[0037]出力インターフェース１０８および入力インターフェース１２２は、ワイヤレス送信機／受信機、モデム、ワイヤードネットワーキング構成要素（たとえば、イーサネット（登録商標）カード）、様々なＩＥＥＥ８０２．１１規格のいずれかに従って動作するワイヤレス通信構成要素、または他の物理的構成要素を表し得る。出力インターフェース１０８および入力インターフェース１２２がワイヤレス構成要素を備える例では、出力インターフェース１０８および入力インターフェース１２２は、４Ｇ、４Ｇ－ＬＴＥ（登録商標）（ロングタームエボリューション）、ＬＴＥアドバンスト、５Ｇなど、セルラー通信規格に従って、符号化されたビデオデータなどのデータを転送するように構成され得る。出力インターフェース１０８がワイヤレス送信機を備えるいくつかの例では、出力インターフェース１０８および入力インターフェース１２２は、ＩＥＥＥ８０２．１１仕様、ＩＥＥＥ８０２．１５仕様（たとえば、ＺｉｇＢｅｅ（登録商標））、Ｂｌｕｅｔｏｏｔｈ（登録商標）規格など、他のワイヤレス規格に従って、符号化されたビデオデータなどのデータを転送するように構成され得る。いくつかの例では、ソースデバイス１０２および／または宛先デバイス１１６は、それぞれのシステムオンチップ（ＳｏＣ）デバイスを含み得る。たとえば、ソースデバイス１０２は、ビデオエンコーダ２００および／または出力インターフェース１０８に帰属する機能を実施するためのＳｏＣデバイスを含み得、宛先デバイス１１６は、ビデオデコーダ３００および／または入力インターフェース１２２に帰属する機能を実施するためのＳｏＣデバイスを含み得る。

[0038]本開示の技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーＨＴＴＰ（ＤＡＳＨ）などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。

[0039]宛先デバイス１１６の入力インターフェース１２２は、コンピュータ可読媒体１１０（たとえば、通信媒体、ストレージデバイス１１２、ファイルサーバ１１４など）から符号化されたビデオビットストリームを受信する。符号化されたビデオビットストリームは、ビデオブロックまたは他のコーディングされたユニット（たとえば、スライス、ピクチャ、ピクチャグループ、シーケンスなど）の特性および／または処理を記述する値を有するシンタックス要素など、ビデオデコーダ３００によっても使用される、ビデオエンコーダ２００によって定義されるシグナリング情報を含み得る。ディスプレイデバイス１１８は、復号されたビデオデータの復号されたピクチャをユーザに表示する。ディスプレイデバイス１１８は、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを表し得る。

[0040]図１には示されていないが、いくつかの例では、ビデオエンコーダ２００およびビデオデコーダ３００は各々、オーディオエンコーダおよび／またはオーディオデコーダと統合され得、共通のデータストリーム中にオーディオとビデオの両方を含む多重化ストリームをハンドリングするために、適切なＭＵＸ－ＤＥＭＵＸユニット、あるいは他のハードウェアおよび／またはソフトウェアを含み得る。

[0041]ビデオエンコーダ２００およびビデオデコーダ３００は各々、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダおよび／またはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアのための命令を記憶し、本開示の技法を実施するために１つまたは複数のプロセッサを使用してその命令をハードウェアで実行し得る。ビデオエンコーダ２００およびビデオデコーダ３００の各々は、１つまたは複数のエンコーダまたはデコーダに含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合され得る。ビデオエンコーダ２００および／またはビデオデコーダ３００を含むデバイスは、集積回路、マイクロプロセッサ、および／またはセルラー電話などのワイヤレス通信デバイスを備え得る。

[0042]ビデオエンコーダ２００およびビデオデコーダ３００は、高効率ビデオコーディング（ＨＥＶＣ）とも呼ばれるＩＴＵ－ＴＨ．２６５、あるいはマルチビューおよび／またはスケーラブルビデオコーディング拡張などのそれらの拡張など、ビデオコーディング規格に従って動作し得る。代替的に、ビデオエンコーダ２００およびビデオデコーダ３００は、汎用ビデオコーディング（ＶＶＣ）とも呼ばれるＩＴＵ－ＴＨ．２６６など、他のプロプライエタリ規格または業界規格に従って動作し得る。他の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、ＡＯＭｅｄｉａＶｉｄｅｏ１（ＡＶ１）、ＡＶ１の拡張、および／またはＡＶ１の後継バージョン（たとえば、ＡＶ２）など、プロプライエタリビデオコーデック／フォーマットに従って動作し得る。他の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、他のプロプライエタリフォーマットまたは業界規格に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格またはフォーマットにも限定されない。概して、ビデオエンコーダ２００およびビデオデコーダ３００は、符号予測を使用し、および／または（たとえば、コンテキストによって示されるような）確率モデルを使用して符号予測に関係する１つまたは複数のシンタックス要素をコーディングする、任意のビデオコーディング技法とともに本開示の技法を実施するように構成され得る。

[0043]概して、ビデオエンコーダ２００およびビデオデコーダ３００は、ピクチャのブロックベースコーディングを実施し得る。「ブロック」という用語は、概して、処理されるべき（たとえば、符号化されるべき、復号されるべき、あるいは、符号化および／または復号プロセスにおいて他の方法で使用されるべき）データを含む構造を指す。たとえば、ブロックは、ルミナンスおよび／またはクロミナンスデータのサンプルの２次元行列を含み得る。概して、ビデオエンコーダ２００およびビデオデコーダ３００は、ＹＵＶ（たとえば、Ｙ、Ｃｂ、Ｃｒ）フォーマットで表されるビデオデータをコーディングし得る。すなわち、ピクチャのサンプルのために赤色、緑色、および青色（ＲＧＢ）データをコーディングするのではなく、ビデオエンコーダ２００およびビデオデコーダ３００は、ルミナンス成分とクロミナンス成分とをコーディングし得、ここで、クロミナンス成分は、赤色相と青色相の両方のクロミナンス成分を含み得る。いくつかの例では、ビデオエンコーダ２００は、符号化より前に、受信されたＲＧＢフォーマットのデータをＹＵＶ表現にコンバートし、ビデオデコーダ３００は、ＹＵＶ表現をＲＧＢフォーマットにコンバートする。代替的に、前処理および後処理ユニット（図示せず）が、これらのコンバージョンを実施し得る。

[0044]本開示は、概して、ピクチャのデータを符号化または復号するプロセスを含むように、ピクチャのコーディング（たとえば、符号化および復号）に言及することがある。同様に、本開示は、ブロックについてのデータを符号化または復号するプロセス、たとえば、予測および／または残差コーディングを含むように、ピクチャのブロックのコーディングに言及することがある。符号化されたビデオビットストリームは、概して、コーディング決定（たとえば、コーディングモード）とブロックへのピクチャの区分とを表すシンタックス要素についての一連の値を含む。したがって、ピクチャまたはブロックをコーディングすることへの言及は、概して、ピクチャまたはブロックを形成するシンタックス要素についての値をコーディングすることとして理解されるべきである。

[0045]ＨＥＶＣは、コーディングユニット（ＣＵ）、予測ユニット（ＰＵ）、および変換ユニット（ＴＵ）を含む、様々なブロックを定義する。ＨＥＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダは、クワッドツリー構造に従ってコーディングツリーユニット（ＣＴＵ）をＣＵに区分する。すなわち、ビデオコーダは、ＣＴＵとＣＵとを４つの等しい重複しない正方形に区分し、クワッドツリーの各ノードは、０個または４つのいずれかの子ノードを有する。子ノードなしのノードは、「リーフノード」と呼ばれることがあり、そのようなリーフノードのＣＵは、１つまたは複数のＰＵおよび／または１つまたは複数のＴＵを含み得る。ビデオコーダは、ＰＵとＴＵとをさらに区分し得る。たとえば、ＨＥＶＣでは、残差クワッドツリー（ＲＱＴ）は、ＴＵの区分を表す。ＨＥＶＣでは、ＰＵはインター予測データを表し、ＴＵは残差データを表す。イントラ予測されるＣＵは、イントラモード指示などのイントラ予測情報を含む。

[0046]別の例として、ビデオエンコーダ２００およびビデオデコーダ３００は、ＶＶＣに従って動作するように構成され得る。ＶＶＣに従って、（ビデオエンコーダ２００などの）ビデオコーダは、ピクチャを複数のコーディングツリーユニット（ＣＴＵ）に区分する。ビデオエンコーダ２００は、クワッドツリーバイナリツリー（ＱＴＢＴ）構造またはマルチタイプツリー（ＭＴＴ）構造など、ツリー構造に従ってＣＴＵを区分し得る。ＱＴＢＴ構造は、ＨＥＶＣのＣＵとＰＵとＴＵとの間の分離など、複数の区分タイプの概念を除去する。ＱＴＢＴ構造は、２つのレベル、すなわち、クワッドツリー区分に従って区分される第１のレベルと、バイナリツリー区分に従って区分される第２のレベルとを含む。ＱＴＢＴ構造のルートノードは、ＣＴＵに対応する。バイナリツリーのリーフノードは、コーディングユニット（ＣＵ）に対応する。

[0047]ＭＴＴ区分構造では、ブロックは、クワッドツリー（ＱＴ）区分と、バイナリツリー（ＢＴ）区分と、１つまたは複数のタイプのトリプルツリー（ＴＴ）（ターナリツリー（ＴＴ）とも呼ばれる）区分とを使用して区分され得る。トリプルツリーまたはターナリツリー区分は、ブロックが３つのサブブロックにスプリットされる区分である。いくつかの例では、トリプルツリーまたはターナリツリー区分は、中心を通して元のブロックを分割することなしにブロックを３つのサブブロックに分割する。ＭＴＴにおける区分タイプ（たとえば、ＱＴ、ＢＴ、およびＴＴ）は、対称または非対称であり得る。

[0048]ＡＶ１コーデックに従って動作するとき、ビデオエンコーダ２００およびビデオデコーダ３００は、ブロック中のビデオデータをコーディングするように構成され得る。ＡＶ１では、処理され得る最大コーディングブロックは、スーパーブロックと呼ばれる。ＡＶ１では、スーパーブロックは、１２８×１２８ルーマサンプルまたは６４×６４ルーマサンプルのいずれかであり得る。しかしながら、後継ビデオコーディングフォーマット（たとえば、ＡＶ２）では、スーパーブロックは、異なる（たとえば、より大きい）ルーマサンプルサイズによって定義され得る。いくつかの例では、スーパーブロックは、ブロッククワッドツリーのトップレベルである。ビデオエンコーダ２００は、さらに、スーパーブロックをより小さいコーディングブロックに区分し得る。ビデオエンコーダ２００は、正方形または非正方形区分を使用してスーパーブロックおよび他のコーディングブロックをより小さいブロックに区分し得る。非正方形ブロックは、Ｎ／２×Ｎ、Ｎ×Ｎ／２、Ｎ／４×Ｎ、およびＮ×Ｎ／４ブロックを含み得る。ビデオエンコーダ２００およびビデオデコーダ３００は、コーディングブロックの各々に対して別個の予測および変換プロセスを実施し得る。

[0049]ＡＶ１はまた、ビデオデータのタイルを定義する。タイルは、他のタイルから独立してコーディングされ得るスーパーブロックの矩形アレイである。すなわち、ビデオエンコーダ２００およびビデオデコーダ３００は、他のタイルからのビデオデータを使用せずにタイル内のコーディングブロックを、それぞれ、符号化および復号し得る。ただし、ビデオエンコーダ２００およびビデオデコーダ３００は、タイル境界にわたってフィルタ処理を実施し得る。タイルは、サイズが均一または非均一であり得る。タイルベースコーディングは、エンコーダおよびデコーダ実装形態のための並列処理および／またはマルチスレッディングを可能にし得る。

[0050]いくつかの例では、ビデオエンコーダ２００およびビデオデコーダ３００は、ルミナンス成分とクロミナンス成分との各々を表すために単一のＱＴＢＴまたはＭＴＴ構造を使用し得、他の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、ルミナンス成分のための１つのＱＴＢＴ／ＭＴＴ構造、および両方のクロミナンス成分のための別のＱＴＢＴ／ＭＴＴ構造（またはそれぞれのクロミナンス成分のための２つのＱＴＢＴ／ＭＴＴ構造）など、２つまたはそれ以上のＱＴＢＴまたはＭＴＴ構造を使用し得る。

[0051]ビデオエンコーダ２００およびビデオデコーダ３００は、クワッドツリー区分、ＱＴＢＴ区分、ＭＴＴ区分、スーパーブロック区分、または他の区分構造を使用するように構成され得る。

[0052]いくつかの例では、ＣＴＵは、ルーマサンプルのコーディングツリーブロック（ＣＴＢ）、３つのサンプルアレイを有するピクチャのクロマサンプルの２つの対応するＣＴＢ、あるいはモノクロームピクチャ、またはサンプルをコーディングするために使用される３つの別個の色プレーンとシンタックス構造とを使用してコーディングされるピクチャのサンプルのＣＴＢを含む。ＣＴＢは、ＣＴＢへの成分の分割が区分になるような何らかの値のＮについて、サンプルのＮ×Ｎブロックであり得る。成分は、ピクチャを４：２：０、４：２：２、または４：４：４色フォーマットに構成する３つのアレイ（ルーマおよび２つのクロマ）のうちの１つからのアレイまたは単一のサンプル、あるいはピクチャをモノクロームフォーマットに構成するアレイまたはアレイの単一のサンプルである。いくつかの例では、コーディングブロックは、コーディングブロックへのＣＴＢの分割が区分になるような何らかの値のＭとＮとについて、サンプルのＭ×Ｎブロックである。

[0053]ブロック（たとえば、ＣＴＵまたはＣＵ）は、ピクチャ中で様々な方法でグループ化され得る。一例として、ブリックは、ピクチャ中の特定のタイル内のＣＴＵ行の矩形領域を指し得る。タイルは、ピクチャ中の特定のタイル列および特定のタイル行内のＣＴＵの矩形領域であり得る。タイル列は、ピクチャの高さに等しい高さと、（たとえば、ピクチャパラメータセット中などの）シンタックス要素によって指定された幅とを有するＣＴＵの矩形領域を指す。タイル行は、（たとえば、ピクチャパラメータセット中などの）シンタックス要素によって指定された高さと、ピクチャの幅に等しい幅とを有するＣＴＵの矩形領域を指す。

[0054]いくつかの例では、タイルは複数のブリックに区分され得、それらの各々は、タイル内に１つまたは複数のＣＴＵ行を含み得る。複数のブリックに区分されないタイルもブリックと呼ばれることがある。しかしながら、タイルの真のサブセットであるブリックは、タイルと呼ばれないことがある。ピクチャ中のブリックはまた、スライス中に配置され得る。スライスは、もっぱら単一のネットワークアブストラクションレイヤ（ＮＡＬ）ユニット中に含まれていることがあるピクチャの整数個のブリックであり得る。いくつかの例では、スライスは、いくつかの完全なタイル、または１つのタイルの完全なブリックの連続シーケンスのみのいずれかを含む。

[0055]本開示は、垂直寸法と水平寸法とに関して（ＣＵまたは他のビデオブロックなどの）ブロックのサンプル寸法を指すために、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」、たとえば、１６×１６サンプル（16x16 samples）または１６×１６サンプル（16 by 16 samples）を互換的に使用し得る。概して、１６×１６のＣＵは、垂直方向に１６個のサンプルを有し（ｙ＝１６）、水平方向に１６個のサンプルを有する（ｘ＝１６）。同様に、Ｎ×ＮのＣＵは、概して、垂直方向にＮ個のサンプルを有し、水平方向にＮ個のサンプルを有し、ここで、Ｎは非負整数値を表す。ＣＵ中のサンプルは、行と列とに配置され得る。その上、ＣＵは、必ずしも、水平方向において垂直方向と同じ数のサンプルを有する必要があるとは限らない。たとえば、ＣＵはＮ×Ｍサンプルを備え得、ここで、Ｍは必ずしもＮに等しいとは限らない。

[0056]ビデオエンコーダ２００は、予測および／または残差情報、ならびに他の情報を表す、ＣＵのためのビデオデータを符号化する。予測情報は、ＣＵについて予測ブロックを形成するためにＣＵがどのように予測されるべきかを示す。残差情報は、概して、符号化より前のＣＵのサンプルと予測ブロックとの間のサンプルごとの差分を表す。

[0057]ＣＵを予測するために、ビデオエンコーダ２００は、概して、インター予測またはイントラ予測を通してＣＵについて予測ブロックを形成し得る。インター予測は、概して、前にコーディングされたピクチャのデータからＣＵを予測することを指すが、イントラ予測は、概して、同じピクチャの前にコーディングされたデータからＣＵを予測することを指す。インター予測を実施するために、ビデオエンコーダ２００は、１つまたは複数の動きベクトルを使用して予測ブロックを生成し得る。ビデオエンコーダ２００は、概して、たとえば、ＣＵと参照ブロックとの間の差分に関して、ＣＵにぴったり一致する参照ブロックを識別するために動き探索を実施し得る。ビデオエンコーダ２００は、参照ブロックが現在ＣＵにぴったり一致するかどうかを決定するために、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、平均絶対差（ＭＡＤ）、平均２乗差（ＭＳＤ）、または他のそのような差分計算を使用して差分メトリックを計算し得る。いくつかの例では、ビデオエンコーダ２００は、単方向予測または双方向予測を使用して現在ＣＵを予測し得る。

[0058]ＶＶＣのいくつかの例はまた、インター予測モードと見なされ得るアフィン動き補償モードを提供する。アフィン動き補償モードでは、ビデオエンコーダ２００は、ズームインまたはアウト、回転、パースペクティブの動き、あるいは他の変則の動きタイプなど、非並進の動きを表す２つまたはそれ以上の動きベクトルを決定し得る。

[0059]イントラ予測を実施するために、ビデオエンコーダ２００は、予測ブロックを生成するようにイントラ予測モードを選択し得る。ＶＶＣのいくつかの例は、様々な方向性モード、ならびに平面モードおよびＤＣモードを含む、６７個のイントラ予測モードを提供する。概して、ビデオエンコーダ２００は、現在ブロック（たとえば、ＣＵのブロック）のサンプルをそれから予測すべき、現在ブロックに対する隣接サンプルを記述するイントラ予測モードを選択する。そのようなサンプルは、ビデオエンコーダ２００がラスタ走査順序で（左から右に、上から下に）ＣＴＵとＣＵとをコーディングすると仮定すると、概して、現在ブロックと同じピクチャ中の現在ブロックの上、左上、または左にあり得る。

[0060]ビデオエンコーダ２００は、現在ブロックについて予測モードを表すデータを符号化する。たとえば、インター予測モードでは、ビデオエンコーダ２００は、様々な利用可能なインター予測モードのうちのどれが使用されるか、ならびに対応するモードのための動き情報を表すデータを符号化し得る。単方向または双方向インター予測の場合、たとえば、ビデオエンコーダ２００は、高度動きベクトル予測（ＡＭＶＰ）またはマージモードを使用して動きベクトルを符号化し得る。ビデオエンコーダ２００は、アフィン動き補償モードのための動きベクトルを符号化するために、同様のモードを使用し得る。

[0061]ＡＶ１は、ビデオデータのコーディングブロックを符号化および復号するための２つの一般的な技法を含む。２つの一般的な技法は、イントラ予測（たとえば、イントラフレーム予測または空間予測）およびインター予測（たとえば、インターフレーム予測または時間予測）である。ＡＶ１のコンテキストでは、イントラ予測コーディングモードを使用するビデオデータの現在フレームのブロックを予測するとき、ビデオエンコーダ２００およびビデオデコーダ３００は、ビデオデータの他のフレームからのビデオデータを使用しない。たいていのイントラ予測コーディングモードでは、ビデオエンコーダ２００は、現在ブロック中のサンプル値と、同じフレーム中の参照サンプルから生成される予測される値との間の差分に基づいて、現在フレームのブロックを符号化する。ビデオエンコーダ２００は、イントラ予測コーディングモードに基づいて参照サンプルから生成される予測される値を決定する。

[0062]ブロックのイントラ予測またはインター予測などの予測に続いて、ビデオエンコーダ２００は、ブロックについて残差データを計算し得る。残差ブロックなどの残差データは、ブロックと、対応する予測モードを使用して形成された、ブロックについての予測ブロックとの間の、サンプルごとの差分を表す。ビデオエンコーダ２００は、サンプル領域ではなく変換領域中に変換されたデータを作り出すために、残差ブロックに１つまたは複数の変換を適用し得る。たとえば、ビデオエンコーダ２００は、離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換を残差ビデオデータに適用し得る。さらに、ビデオエンコーダ２００は、第１の変換に続いて、モード依存非分離可能２次変換（ＭＤＮＳＳＴ：mode-dependent non-separable secondary transform）、信号依存変換、カルーネンレーベ変換（ＫＬＴ）などの２次変換を適用し得る。ビデオエンコーダ２００は、１つまたは複数の変換の適用に続いて変換係数を作り出す。

[0063]上述のように、変換係数を作り出すための任意の変換に続いて、ビデオエンコーダ２００は変換係数の量子化を実施し得る。量子化は、概して、変換係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスを実施することによって、ビデオエンコーダ２００は、変換係数の一部または全部に関連付けられたビット深度を低減し得る。たとえば、ビデオエンコーダ２００は、量子化中にｎビット値をｍビット値に丸めることがあり、ここで、ｎはｍよりも大きい。いくつかの例では、量子化を実施するために、ビデオエンコーダ２００は、量子化されるべき値のビット単位右シフトを実施し得る。

[0064]量子化に続いて、ビデオエンコーダ２００は、変換係数を走査して、量子化された変換係数を含む２次元行列から１次元ベクトルを作り出し得る。走査は、より高いエネルギー（したがって、より低い頻度）の変換係数をベクトルの前方に配置し、より低いエネルギー（したがって、より高い頻度）の変換係数をベクトルの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ２００は、シリアル化されたベクトルを作り出すために、量子化された変換係数を走査するために、あらかじめ定義された走査順序を利用し、次いで、ベクトルの量子化された変換係数をエントロピー符号化し得る。他の例では、ビデオエンコーダ２００は適応型走査を実施し得る。１次元ベクトルを形成するために、量子化された変換係数を走査した後に、ビデオエンコーダ２００は、たとえば、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）に従って、１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２００はまた、ビデオデータを復号する際のビデオデコーダ３００による使用のために、符号化されたビデオデータに関連付けられたメタデータを記述するシンタックス要素についての値をエントロピー符号化し得る。

[0065]ＣＡＢＡＣを実施するために、ビデオエンコーダ２００は、コンテキストモデル内のコンテキストを、送信されるべきシンボルに割り当て得る。コンテキストは、たとえば、シンボルの隣接値が０値であるか否かに関係し得る。確率決定は、シンボルに割り当てられたコンテキストに基づき得る。

[0066]ビデオエンコーダ２００は、さらに、ブロックベースシンタックスデータ、ピクチャベースシンタックスデータ、およびシーケンスベースシンタックスデータなどのシンタックスデータを、たとえば、ピクチャヘッダ、ブロックヘッダ、スライスヘッダ、あるいはシーケンスパラメータセット（ＳＰＳ）、ピクチャパラメータセット（ＰＰＳ）、またはビデオパラメータセット（ＶＰＳ）などの他のシンタックスデータ中で、ビデオデコーダ３００に対して生成し得る。ビデオデコーダ３００は、対応するビデオデータをどのように復号すべきかを決定するために、そのようなシンタックスデータを同様に復号し得る。

[0067]このようにして、ビデオエンコーダ２００は、符号化されたビデオデータ、たとえば、ブロック（たとえば、ＣＵ）へのピクチャの区分ならびにブロックについての予測および／または残差情報を記述するシンタックス要素を含むビットストリームを生成し得る。最終的に、ビデオデコーダ３００は、ビットストリームを受信し、符号化されたビデオデータを復号し得る。

[0068]概して、ビデオデコーダ３００は、ビットストリームの符号化されたビデオデータを復号するために、ビデオエンコーダ２００によって実施されたものの逆のプロセスを実施する。たとえば、ビデオデコーダ３００は、ビデオエンコーダ２００のＣＡＢＡＣ符号化プロセスと逆ではあるが、それと実質的に同様の様式でＣＡＢＡＣを使用してビットストリームのシンタックス要素についての値を復号し得る。シンタックス要素は、ＣＴＵのＣＵを定義するために、ピクチャをＣＴＵに区分するための区分情報と、ＱＴＢＴ構造などの対応する区分構造に従う、各ＣＴＵの区分とを定義し得る。シンタックス要素は、ビデオデータのブロック（たとえば、ＣＵ）についての予測および残差情報をさらに定義し得る。

[0069]残差情報は、たとえば、量子化された変換係数によって表され得る。ビデオデコーダ３００は、ブロックのための残差ブロックを再生するために、ブロックの量子化された変換係数を逆量子化し、逆変換し得る。ビデオデコーダ３００は、ブロックのための予測ブロックを形成するために、シグナリングされた予測モード（イントラまたはインター予測）と、関連する予測情報（たとえば、インター予測のための動き情報）とを使用する。ビデオデコーダ３００は、次いで、元のブロックを再生するために（サンプルごとに）予測ブロックと残差ブロックとを組み合わせ得る。ビデオデコーダ３００は、ブロックの境界に沿って視覚的アーティファクトを低減するためにデブロッキングプロセスを実施することなど、追加の処理を実施し得る。

[0070]本開示は、概して、シンタックス要素など、ある情報を「シグナリング」することに言及することがある。「シグナリング」という用語は、概して、符号化されたビデオデータを復号するために使用されるシンタックス要素および／または他のデータについての値の通信を指し得る。すなわち、ビデオエンコーダ２００は、ビットストリーム中でシンタックス要素についての値をシグナリングし得る。概して、シグナリングは、ビットストリーム中で値を生成することを指す。上述のように、ソースデバイス１０２は、実質的にリアルタイムでビットストリームを宛先デバイス１１６に移送するか、または、宛先デバイス１１６による後の取出しのためにシンタックス要素をストレージデバイス１１２に記憶するときに行われ得るように、非リアルタイムでビットストリームを宛先デバイス１１６に移送し得る。

[0071]上記で手短に説明されたように、ビデオエンコーダ２００は、ある数の変換係数について符号予測を実施するように構成され得る。たとえば、２つの符号が予測される場合、４つの可能な組合せ、または符号予測仮説、すなわち、（＋，＋）、（＋，－）、（－，＋）、（－，－）があり得る。すべての４つの組合せについて、コスト関数が計算され、最小コストをもつ組合せ（たとえば、符号予測仮説）が符号予測子組合せとして選択される。ビデオデコーダ３００は、逆のプロセスを実施し得る。

[0072]符号予測が実施される変換係数について、バイパスシグナリングの代わりに、ビデオエンコーダ２００は、実際の変換係数符号が仮説に等しいか否かを示すために、コンテキストコーディングされたビン（たとえば、符号予測シンタックス要素）を符号化およびシグナリングし得る。前の技法では、符号予測シンタックス要素をコーディングするために使用されるコンテキストは、変換係数大きさに依存していた。本開示は、符号予測シンタックス要素をコーディングするためのコンテキストを決定する異なる技法について説明する。特に、ビデオエンコーダ２００およびビデオデコーダ３００は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素をコーディングするためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素をコーディングすることとを行うように構成され得る。

[0073]Ｙａｏ－ＪｅｎＣｈａｎｇら著、「Compression efficiency methods beyond VVC」、ＩＴＵ－ＴＳＧ１６ＷＰ３とＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９とのジョイントビデオエキスパートチーム（ＪＶＥＴ）、遠隔会議による第２１回会合、２０２１年１月６日～１５日（以下、「ＪＶＥＴ－Ｕ０１００」）が、変換係数符号予測と呼ばれるコーディングツールについて説明している。例示的な変換係数符号予測方法の１つの基本概念は、適用可能な変換係数について、負の符号と正の符号の両方の組合せのための再構築された残差を計算し、コスト関数を最小化する仮説を選択することである。

[0074]たとえば、ビデオエンコーダ２００およびビデオデコーダ３００が、２つの変換係数について２つの符号値を予測するように構成された場合、４つの可能な組合せ、すなわち、２つの正の符号（＋，＋）、正の符号とそれに続く負の符号（＋，－）、負の符号とそれに続く正の符号（－，＋）、および２つの負の符号（－，－）があり得る。すべての４つの組合せについて、ビデオエンコーダ２００およびビデオデコーダ３００は、コスト関数を計算し、最小コストをもつ符号の組合せを符号予測子組合せ（たとえば、符号予測仮説）として選択するように構成され得る。より多くの符号が予測され、より多くの組合せが試みられることになる場合に、同じプロセスが適用される。分析すべき組合せの数は、実装複雑さと圧縮効率との間のトレードオフである。すなわち、より多くの符号組合せはより良いコーディング効率を生じるが、実装複雑さという犠牲を払うものであり得る。

[0075]符号予測が適用され得る変換係数について、符号自体を示すシンタックス要素をバイパスコーディングする（たとえば、固定確率コーディングする）代わりに、ビデオエンコーダ２００は、変換係数の符号が符号予測仮説に等しいか否かを示すために、コンテキストコーディングされたビン（たとえば、シンタックス要素）を符号化し、シグナリングするように構成され得る。同様に、ビデオデコーダ３００は、現在復号される変換係数の符号が符号予測仮説に等しいか否かを決定するために、コンテキストコーディングされたビン（たとえば、シンタックス要素）を受信し、復号するように構成され得る。一例では、ビデオエンコーダ２００およびビデオデコーダ３００によって使用されるコンテキスト（たとえば、確率モデル）は、変換係数大きさに依存する。すなわち、ビデオエンコーダ２００およびビデオデコーダ３００は、変換係数の大きさを決定し、次いで、どのコンテキストを使用すべきかを決定するために、その大きさを使用する。一例では、ビデオエンコーダ２００およびビデオデコーダ３００は、別々に、ルーマ成分およびクロマ成分ごとに２つのコンテキスト（たとえば、ルーマのために２つ、およびクロマのために２つ）を使用するように構成され得る。本開示は、符号予測のためのコンテキストモデル化（modeling）（たとえば、コンテキストの決定）のための他の例示的な技法について説明する。本開示の技法は、増加されたコーディング効率を提供するコンテキスト選択を生じ得る。

[0076]符号予測コーディングのいくつかの例では、ビデオエンコーダ２００およびビデオデコーダ３００は、残差ブロックを再構築するために逆変換を実施しない。代わりに、ビデオエンコーダ２００およびビデオデコーダ３００は、符号値が予測されるすべての係数について累積された、係数大きさを乗算された事前記憶された要素残差（elemental residual）に基づいて、再構築された残差ブロックを導出し得る。

[0077]より詳細には、変換係数ブロックは、１つの変換係数のみが非０であるブロックの和として表され得る。その上、その１つの非０変換係数値は、１の値に設定され得る。最終の再構築された残差ブロックを取得するために、ビデオエンコーダ２００およびビデオデコーダ３００は、１に等しい係数大きさに対応する再構築された残差に、符号付き係数大きさを乗算し得る。図２は、例示的な変換ブロック分解を示す概念図である。

[0078]図２に示されているように、変換係数ブロック４００は、２つの非０係数を含む。左上の係数は５の値を有し、２つ右の位置の係数は－２の値を有する。変換係数ブロック４００は、変換係数ブロック４０２と変換係数ブロック４０４との和として分解され得る。変換係数ブロック４０２は、左上隅に、１の値をもつ単一の非０変換係数を有し、５（たとえば、変換係数ブロック４００中の元の変換係数の大きさおよび符号）を乗算される。変換係数ブロック４０４は、左上隅の２つ右の位置に、１の値をもつ単一の非０変換係数を有し、－２（たとえば、変換係数ブロック４００中の元の変換係数の大きさおよび符号）を乗算される。

[0079]図２の例からわかるように、逆変換は、１に等しい大きさをもつあらゆる単一の非０係数について１回のみ計算され得る。ビデオデコーダ３００は、最終再構築を、再構築された要素残差のスケーリングされた和として導出するように構成され得る。再構築された要素残差（またはテンプレート）は、ルックアップテーブルの各要素について所定の（たとえば、８ビットの）精度で事前計算され、そのテーブルに記憶される。不連続性は、後で説明されるように、変換ブロックの第１の行および第１の列のみを考慮して測定されるので、ルックアップテーブルサイズは、変換基底関数（transform basis function）ごとに、ブロックの幅＋高さの長さに低減され得る。テンプレートを計算するために使用される変換基底関数は、１次変換（primary transform）（たとえば、拡張複数変換（ＥＭＴ：enhanced multiple transform））基底に対応する。しかしながら、精度が８ビットに低減されるので、得られたテンプレートは、同じまたは同様であり得る。そのような場合、テンプレートは、ストレージメモリを低減するためにマージされる。

[0080]いくつかの例では、符号予測の精度は、係数大きさに依存する。概して、大きさが小さいほど、不連続性測度差は目立たなくなる。したがって、所与の数の予測される符号について、変換係数ブロックの左上周波数エリアにおける非０係数は、係数大きさしきい値に従って選択される。係数大きさしきい値は、係数を、符号が高い確率または低い確率で予測される（たとえば、高確率コンテキストまたは低確率コンテキスト）、２つのグループに分類する。係数は、ラスタ走査順序において走査され、しきい値を上回る大きさをもつ係数は、高予測確率グループ中にあるように分類される。そうではない場合、係数は、低確率予測グループ中にあるように分類される。高い予測される確率グループ中の係数の数が、予測されるべき係数符号の総数よりも小さい場合、低い予測される確率グループからの係数が加算される。

[0081]すべての可能な組合せのうちの最良の符号予測仮説を導出するために、コスト関数が定義され、使用され得る。コスト関数は、ブロック境界にわたる不連続性測度として定義される。ビデオエンコーダ２００およびビデオデコーダ３００は、すべての仮説について不連続性測度を計算し得、最小コストをもつ仮説が、変換係数符号のための予測子として選択される。図３は、符号予測における例示的な不連続性測度を示す概念図である。図３は、再構築された符号候補４３０からのブロック境界を越えて再構築されたネイバー（neighbor）４２０をもつ、ブロック４１０を示す。不連続性測度コスト関数が以下で説明される。

[0082]一例では、コスト関数は、以下のように、上の行および左の列についての残差領域における絶対２次導関数の和として定義される。

ここで、Ｒは再構築されたネイバーであり、Ｐは現在ブロックの予測であり、ｒは残差仮説である。項（－Ｒ_-1＋２Ｒ₀－Ｐ₁）はブロックごとに１回のみ計算され得、残差仮説のみが減算される。

[0083]符号予測のための前の技法では、符号予測が正しい（たとえば、符号予測仮説が実際の符号に一致する）かどうかを示すシンタックス要素は、変換係数の大きさに依存するコンテキストを使用してコンテキストコーディングされる。そのようなシンタックス要素は、符号予測シンタックス要素と呼ばれることがある。符号予測コンテキストを決定するために変換係数の大きさを使用することは、符号予測コンテキストが選択され得、符号予測シンタックス要素がコーディングされ得る前に、大きさが決定されることを必要とする。さらに、符号予測のための前の技法では、コンテキスト選択は、ブロック内の係数位置に依存せず、ブロックがイントラコーディングされるのかインターコーディングされるのかに依存しない。一般に、イントラ予測されたブロックは、より高い大きさをもつより多くの非０係数を有する傾向がある。インターコーディングされたブロックとイントラコーディングされたブロックとについて同じコンテキストを使用することは、準最適な圧縮効率を作成し得る。

[0084]本開示の技法は、上述の問題に対処し得る。特に、本開示の技法は、ブロック中の変換係数の位置および／またはそのブロックをコーディングするために使用されるコーディングモードのうちの１つまたは複数に基づいて、符号予測シンタックス要素をコーディングするためのコンテキストを決定することを含み得る。変換係数の特性（たとえば、大きさおよび符号）が、ブロック内の位置および変換係数を生成するために使用されるコーディングモードに基づいて異なり得るので、符号予測をコーディングするためのコンテキストを決定するために変換係数の位置および／またはコーディングモードを使用することは、コーディング効率を改善し得る。本開示の技法は、符号予測シンタックス要素自体の値を決定するために使用される技法にかかわらず、符号予測シンタックス要素についてのコンテキストを決定するために使用され得る。

[0085]以下で説明される技法は、任意の組合せで使用され得る。たとえば、係数大きさに基づいてコンテキストを決定することに加えて、またはその代わりに、以下で説明される、コンテキストを決定するための技法の任意の組合せが使用され得る。いくつかの例では、係数大きさの使用は随意であり得る。

[0086]変換係数位置依存コンテキスト
[0087]一例では、符号予測シンタックス要素をコーディングするために、ビデオエンコーダ２００およびビデオデコーダ３００は、１つのコーディングまたは予測ユニット内に複数の変換ブロックがある場合、ブロック内の変換係数位置または変換ブロック自体の位置に基づいてコンテキストを決定するように構成され得る。符号予測シンタックス要素をコーディングすることは、変換係数の符号が符号予測仮説に等しいか否かを示すコンテキストコーディングされたビンを符号化および／または復号することを含む。すなわち、ビデオエンコーダ２００およびビデオデコーダ３００は、決定されたコンテキストを使用して、変換係数の符号が符号予測仮説に等しいか否かを示すシンタックス要素をコーディングするように構成され得る。ブロック内の変換係数に基づいてコンテキストを決定することは、概して、ブロック中の変換係数の位置（たとえば、ロケーション）が、使用すべきコンテキストを決定する関数への入力であることを意味する。

[0088]本開示の一般的な例では、ビデオエンコーダ２００は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素を符号化することとを行うように構成され得る。逆の様式では、ビデオデコーダ３００は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素を復号することとを行うように構成され得る。変換係数の位置と、それらの位置がコンテキスト決定にどのように影響を及ぼすかとの例が、以下でより詳細に説明される。

[0089]一例では、ビデオエンコーダ２００およびビデオデコーダ３００は、ＤＣ係数（たとえば、ブロックの左上隅の最初の係数）の符号予測をコーディングするための専用コンテキスト（たとえば、コンテキスト０）を割り当てるように構成され得、非ＤＣ係数の符号予測をコーディングするための別のコンテキスト（たとえば、コンテキスト１）を割り当て得る。すなわち、概して、ビデオエンコーダ２００およびビデオデコーダ３００は、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素をコーディングするためのコンテキストを決定し得る。より詳細には、別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を復号するための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を復号するための第２のコンテキストを決定することとを行うように構成され得る。

[0090]図４は、変換係数の例示的な位置を示す概念図である。図４は、変換係数の４×４ブロックの例を示す。個々の小さいブロックは、符号予測シンタックス要素がコーディングされ得る変換係数の位置を表す。上記の例では、図４は、ＤＣ係数４４２を有するブロック４４０を示す。概して、ＤＣ係数は、ブロックまたはサブブロック中の左上変換係数である。ブロック４４０の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、ＤＣ係数４４２についての符号予測シンタックス要素をコーディングするために第１のコンテキストを使用することを決定し得、ブロック４４０の他の変換係数についての符号予測シンタックス要素をコーディングするために第２の異なるコンテキストを使用することを決定し得る。

[0091]別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、ブロックを複数の部分または領域に分割し得、ここで、ブロックの部分または領域は、ある変換係数周波数に関連付けられる。ビデオエンコーダ２００およびビデオデコーダ３００は、ブロックの各部分において符号予測シンタックス要素をコーディングするための別個のコンテキストを決定し得る。一例として、ビデオエンコーダ２００およびビデオデコーダ３００は、ブロックを４つの象限に分割し得、ビデオエンコーダ２００およびビデオデコーダ３００は、各象限において符号予測シンタックス要素をコーディングするための別個のコンテキストを決定し得る。ただし、ブロックは、より多いまたはより少ない領域に分割され得る。また、領域は、サイズが均一であり得るか、または異なるサイズを有し得る。

[0092]図４では、変換ブロック４５０は、４つの領域（たとえば、象限）、すなわち、第１の領域４５２、第２の領域４５４、第３の領域４５６、および第４の領域４５８に分割される。ビデオエンコーダ２００およびビデオデコーダ３００は、第１の領域４５２、第２の領域４５４、第３の領域４５６、および第４の領域４５８の各々において符号予測シンタックス要素をコーディングするための別個のコンテキストを決定し得る。

[0093]ビデオエンコーダ２００およびビデオデコーダ３００はまた、符号予測シンタックス要素のためのコンテキスト決定において位置対称性を使用するように構成され得る。たとえば、ビデオエンコーダ２００およびビデオデコーダ３００は、（ｘ，ｙ）および（ｙ，ｘ）の位置をもつ変換係数についての符号予測シンタックス要素をコーディングするために同じコンテキストを使用し得る。たとえば、図４に示されているように、ブロック４６０が４つの象限に分割される場合、ビデオエンコーダ２００およびビデオデコーダ３００は、第２象限と第３象限とが対角線に沿って対称であるように、第２象限４６２および第３象限４６４において符号予測をコーディングする（非対角線）ために同じコンテキストを使用し得る。

[0094]別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、符号予測順序に基づいて符号予測シンタックス要素コンテキストを決定し得る。符号予測順序は、ブロック内の走査順序によって定義され得る。走査順序は、ラスタ走査順序、垂直走査順序、水平走査順序、ジグザグ走査順序、または変換係数がコーディングされる任意の他の順序のうちの１つであり得る。たとえば、符号予測順序における第１の変換係数についての符号予測シンタックス要素があるコンテキストを使用し、符号予測順序における第２の符号予測シンタックス要素が第２のコンテキストを使用する、などである。ある数の符号予測シンタックス要素の後に、ビデオエンコーダ２００およびビデオデコーダ３００は、符号予測順序における残りの符号予測シンタックス予測シンタックス要素について同じコンテキストを使用し得る。

[0095]たとえば、ビデオエンコーダ２００およびビデオデコーダ３００は、符号予測順序における最初の符号予測シンタックス要素または最初の２つの符号予測シンタックス要素について別個のコンテキストを使用し得る。いくつかの例では、ＤＣ係数は、符号予測順序において走査される第１の係数である。第２または第３の符号予測シンタックス要素から開始して、ビデオエンコーダ２００およびビデオデコーダ３００は、残りの符号予測シンタックス要素について同じコンテキストを使用し得る。図４を参照すると、ブロック４７０は、水平符号予測順序で走査される。変換係数の各々について示されている数は、符号予測シンタックス要素がコーディングされる順序を示す。一例では、変換係数１および２についての符号予測シンタックス要素が同じコンテキストを共有し、変換係数３～１６についての任意の符号予測シンタックス要素が同じコンテキストを共有する。この技法の背後のアイデアは、より高い周波数係数（たとえば、ブロックの右下部分に向かう変換係数）が、コスト関数のあまり明確でない差を有し得、符号予測検出が、符号予測順序に沿ったブロック中の第１の係数と比較してあまり正確でないことがあることである。

[0096]コーディングモード依存コンテキスト
[0097]本開示の別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、変換係数を有するブロックをコーディングするために使用されるコーディングモードに基づいて、符号予測シンタックス要素についてのコンテキストを決定し得る。異なる予測モードは、異なる残差および変換係数特性を有し得る。前述のように、イントラ予測されたブロックとインター予測されたブロックとは、異なる残差エネルギーを有し得る（たとえば、残差値の絶対大きさは、概して、イントラコーディングされたブロックについてより高くなり得る）。

[0098]異なる予測モードを使用して生成された変換係数の符号予測シンタックス要素について別個のコンテキストを使用することは、有益であり得る。いくつかの例では、ビデオエンコーダ２００およびビデオデコーダ３００は、他の方法と組み合わせて、たとえば、上記で説明された位置依存コンテキスト割当て技法のうちの１つまたは複数と組み合わせて、予測モードに基づいて符号予測をコーディングするためのコンテキストを決定し得る。たとえば、コンテキストの第１のサブセットが、インター予測されたブロックのために使用され得、コンテキストの第２のサブセットが、イントラ予測されたブロックのために使用され得る。その場合、第１および第２のサブセットの各々から決定された特定のコンテキストは、符号予測シンタックス要素がコーディングされるべきであるブロック中の変換係数の位置に基づき得る。

[0099]一例では、ビデオエンコーダ２００およびビデオデコーダ３００は、イントラモードおよびインターモードでコーディングされたブロックからの変換係数についての符号予測シンタックス要素をコーディングするために、別個のコンテキストおよび／またはコンテキストの別個のセットを使用するように構成され得る。

[0100]別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、ブロックをコーディングするときにどのタイプの１次変換カーネルおよび／または２次変換カーネルが使用されるかに基づいて、符号予測シンタックス要素をコーディングするためのコンテキストを決定するように構成され得る。一例では、ビデオエンコーダ２００およびビデオデコーダ３００は、１次変換インデックスおよび／または２次変換インデックスに基づいて、符号予測シンタックス要素をコーディングするためのコンテキストを決定するように構成され得る。別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、１次変換がＤＣＴ２であるか否かに基づいて、符号予測シンタックス要素をコーディングするためのコンテキストを決定するように構成され得る。別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、２次変換が適用されるか否かに基づいて、符号予測シンタックス要素をコーディングするためのコンテキストを決定するように構成され得る。

[0101]別の例では、ビデオエンコーダ２００およびビデオデコーダ３００は、イントラ予測コーディングモード（たとえば、イントラ予測方向）に基づいて、符号予測シンタックス要素をコーディングするためのコンテキストを決定するように構成され得る。概して、ビデオエンコーダ２００およびビデオデコーダ３００は、ブロックをコーディングするために適用され得るコーディングツールに応じて、符号予測シンタックス要素をコーディングするためのコンテキストを決定するように構成され得る。たとえば、ビデオエンコーダ２００およびビデオデコーダ３００は、ブロックに適用され得る各コーディングツールについて、変換係数の符号予測シンタックス要素をコーディングするための別個のコンテキストを決定するように構成され得る。

[0102]効率的な計算
[0103]符号を予測すること（たとえば、符号予測仮説を生成すること）は、異なる符号予測仮説についてのコスト関数を計算することと、最小コストをもつ符号予測仮説を決定することとを伴う。コスト関数への入力Ｒは、再構築されたネイバー、現在ブロックの予測Ｐ、知られている係数のセットＣ、およびその絶対値が知られているが符号が予測されるべきである係数のセットＡである。残差（ｒ）は、２つの成分、すなわち、知られている係数に対応する成分と、その符号が予測されるべきである係数に対応する成分とを有し、ｒ＝ｒ^k＋ｒ^uである。値ｒ^k＝ＩＴ（Ｃ）は、逆変換ＩＴを使用して、知られている係数から算出され、ｒ^uは、その符号が知られていないが大きさが知られている係数（以下のＡ）に基づく。

[0104]ビデオエンコーダ２００およびビデオデコーダ３００は、再構築された基底関数のテンプレート（ｔｅｍｐｌａｔｅ_i）を使用して符号予測仮説の効率的な計算を実施するように構成され得る。係数絶対値のセットおよび符号予測仮説のセットを仮定すれば、残差仮説（ｒ^hypothesis）は、テンプレートを介して以下として定義される。

[0105]数Ｆは、修正されたコスト関数を形成するためにテンプレート値を組み合わせるために使用される。コスト関数は、以下のように、値Ｆと、知られている残差と、符号予測仮説およびテンプレート値に基づく項とを含むように修正される。

[0106]ビデオエンコーダ２００およびビデオデコーダ３００は、この修正されたコスト関数を最小化する仮説を符号値の予測として使用するように構成される。

[0107]図５は、本開示の技法を実施し得る例示的なビデオエンコーダ２００を示すブロック図である。図５は、説明の目的で提供されており、本開示において広く例示され、説明される技法を限定するものと見なされるべきではない。説明の目的で、本開示は、ＶＶＣ（開発中のＩＴＵ－ＴＨ．２６６）、およびＨＥＶＣ（ＩＴＵ－ＴＨ．２６５）の技法に従って、ビデオエンコーダ２００について説明する。しかしながら、本開示の技法は、他のビデオコーディング規格、ならびに、ＡＶ１およびＡＶ１ビデオコーディングフォーマットの後継などのビデオコーディングフォーマットに構成された、ビデオ符号化デバイスによって実施され得る。

[0108]図５の例では、ビデオエンコーダ２００は、ビデオデータメモリ２３０と、モード選択ユニット２０２と、残差生成ユニット２０４と、変換処理ユニット２０６と、量子化ユニット２０８と、逆量子化ユニット２１０と、逆変換処理ユニット２１２と、再構築ユニット２１４と、フィルタユニット２１６と、復号ピクチャバッファ（ＤＰＢ）２１８と、エントロピー符号化ユニット２２０とを含む。ビデオデータメモリ２３０、モード選択ユニット２０２、残差生成ユニット２０４、変換処理ユニット２０６、量子化ユニット２０８、逆量子化ユニット２１０、逆変換処理ユニット２１２、再構築ユニット２１４、フィルタユニット２１６、ＤＰＢ２１８、およびエントロピー符号化ユニット２２０のいずれかまたはすべては、１つまたは複数のプロセッサまたは処理回路において実装され得る。たとえば、ビデオエンコーダ２００のユニットは、１つまたは複数の回路または論理要素として、ハードウェア回路の一部として、あるいはプロセッサ、ＡＳＩＣ、またはＦＰＧＡの一部として実装され得る。その上、ビデオエンコーダ２００は、これらおよび他の機能を実施するための追加または代替のプロセッサまたは処理回路を含み得る。

[0109]ビデオデータメモリ２３０は、ビデオエンコーダ２００の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオエンコーダ２００は、たとえば、ビデオソース１０４（図１）から、ビデオデータメモリ２３０に記憶されるビデオデータを受信し得る。ＤＰＢ２１８は、ビデオエンコーダ２００による後続のビデオデータの予測において使用するための参照ビデオデータを記憶する参照ピクチャメモリとして働き得る。ビデオデータメモリ２３０およびＤＰＢ２１８は、同期ダイナミックランダムアクセスメモリ（ＤＲＡＭ）（ＳＤＲＡＭ）を含むＤＲＡＭ、磁気抵抗ＲＡＭ（ＭＲＡＭ）、抵抗性ＲＡＭ（ＲＲＡＭ（登録商標））、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ２３０とＤＰＢ２１８とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ２３０は、図示のように、ビデオエンコーダ２００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0110]本開示では、ビデオデータメモリ２３０への言及は、特にそのように説明されない限り、ビデオエンコーダ２００の内部のメモリに限定されるものとして解釈されるべきではなく、または特にそのように説明されない限り、ビデオエンコーダ２００の外部のメモリに限定されるものとして解釈されるべきではない。そうではなく、ビデオデータメモリ２３０への言及は、ビデオエンコーダ２００が符号化のために受信するビデオデータ（たとえば、符号化されるべきである現在ブロックのためのビデオデータ）を記憶する参照メモリとして理解されるべきである。図１のメモリ１０６はまた、ビデオエンコーダ２００の様々なユニットからの出力の一時的なストレージを提供し得る。

[0111]図５の様々なユニットは、ビデオエンコーダ２００によって実施される動作を理解するのを支援するために示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。固定機能回路は、特定の機能を提供する回路を指し、実施され得る動作に関してプリセットされる。プログラマブル回路は、様々なタスクを実施するように、および実施され得る動作においてフレキシブルな機能を提供するようにプログラムされ得る回路を指す。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義された様式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（たとえば、パラメータを受信するかまたはパラメータを出力するために）ソフトウェア命令を実行し得るが、固定機能回路が実施する動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、ユニットのうちの１つまたは複数は、集積回路であり得る。

[0112]ビデオエンコーダ２００は、算術論理ユニット（ＡＬＵ）、基本機能ユニット（ＥＦＵ）、デジタル回路、アナログ回路、および／またはプログラマブル回路から形成されるプログラマブルコアを含み得る。ビデオエンコーダ２００の動作が、プログラマブル回路によって実行されるソフトウェアを使用して実施される例では、メモリ１０６（図１）は、ビデオエンコーダ２００が受信し、実行するソフトウェアの命令（たとえば、オブジェクトコード）を記憶し得るか、またはビデオエンコーダ２００内の別のメモリ（図示せず）が、そのような命令を記憶し得る。

[0113]ビデオデータメモリ２３０は、受信されたビデオデータを記憶するように構成される。ビデオエンコーダ２００は、ビデオデータメモリ２３０からビデオデータのピクチャを取り出し、ビデオデータを残差生成ユニット２０４とモード選択ユニット２０２とに提供し得る。ビデオデータメモリ２３０中のビデオデータは、符号化されるべきである生のビデオデータであり得る。

[0114]モード選択ユニット２０２は、動き推定ユニット２２２と、動き補償ユニット２２４と、イントラ予測ユニット２２６とを含む。モード選択ユニット２０２は、他の予測モードに従ってビデオ予測を実施するための追加の機能ユニットを含み得る。例として、モード選択ユニット２０２は、パレットユニット、（動き推定ユニット２２２および／または動き補償ユニット２２４の一部であり得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。

[0115]モード選択ユニット２０２は、概して、符号化パラメータの組合せと、そのような組合せについての得られたレートひずみ値とをテストするために、複数の符号化パスを協調させる。符号化パラメータは、ＣＵへのＣＴＵの区分、ＣＵのための予測モード、ＣＵの残差データのための変換タイプ、ＣＵの残差データのための量子化パラメータなどを含み得る。モード選択ユニット２０２は、他のテストされた組合せよりも良好であるレートひずみ値を有する符号化パラメータの組合せを最終的に選択し得る。

[0116]ビデオエンコーダ２００は、ビデオデータメモリ２３０から取り出されたピクチャを一連のＣＴＵに区分し、スライス内の１つまたは複数のＣＴＵをカプセル化し得る。モード選択ユニット２０２は、ＭＴＴ構造、ＱＴＢＴ構造、スーパーブロック構造、または上記で説明されたクワッドツリー構造など、ツリー構造に従ってピクチャのＣＴＵを区分し得る。上記で説明されたように、ビデオエンコーダ２００は、ツリー構造に従ってＣＴＵを区分することから１つまたは複数のＣＵを形成し得る。そのようなＣＵは、概して「ビデオブロック」または「ブロック」と呼ばれることもある。

[0117]概して、モード選択ユニット２０２はまた、現在ブロック（たとえば、現在ＣＵ、またはＨＥＶＣでは、ＰＵとＴＵとの重複する部分）についての予測ブロックを生成するように、それの構成要素（たとえば、動き推定ユニット２２２、動き補償ユニット２２４、およびイントラ予測ユニット２２６）を制御する。現在ブロックのインター予測のために、動き推定ユニット２２２は、１つまたは複数の参照ピクチャ（たとえば、ＤＰＢ２１８に記憶された１つまたは複数の前にコーディングされたピクチャ）中で１つまたは複数のぴったり一致する参照ブロックを識別するために動き探索を実施し得る。特に、動き推定ユニット２２２は、たとえば、絶対差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、平均絶対差（ＭＡＤ）、平均２乗差（ＭＳＤ）などに従って、現在ブロックに対して潜在的参照ブロックがどのくらい類似しているかを表す値を計算し得る。動き推定ユニット２２２は、概して、現在ブロックと考慮されている参照ブロックとの間のサンプルごとの差分を使用してこれらの計算を実施し得る。動き推定ユニット２２２は、現在ブロックに最もぴったり一致する参照ブロックを示す、これらの計算から得られた最も低い値を有する参照ブロックを識別し得る。

[0118]動き推定ユニット２２２は、現在ピクチャ中の現在ブロックの位置に対して参照ピクチャ中の参照ブロックの位置を定義する１つまたは複数の動きベクトル（ＭＶ）を形成し得る。動き推定ユニット２２２は、次いで、動きベクトルを動き補償ユニット２２４に提供し得る。たとえば、単方向インター予測では、動き推定ユニット２２２は、単一の動きベクトルを提供し得るが、双方向インター予測では、動き推定ユニット２２２は、２つの動きベクトルを提供し得る。動き補償ユニット２２４は、次いで、動きベクトルを使用して予測ブロックを生成し得る。たとえば、動き補償ユニット２２４は、動きベクトルを使用して参照ブロックのデータを取り出し得る。別の例として、動きベクトルが部分サンプル精度を有する場合、動き補償ユニット２２４は、１つまたは複数の補間フィルタに従って予測ブロックについての値を補間し得る。その上、双方向インター予測では、動き補償ユニット２２４は、それぞれの動きベクトルによって識別された２つの参照ブロックについてデータを取り出し、たとえば、サンプルごとの平均化または重み付き平均化を通して、取り出されたデータを組み合わせ得る。

[0119]ＡＶ１ビデオコーディングフォーマットに従って動作するとき、動き推定ユニット２２２および動き補償ユニット２２４は、並進動き補償、アフィン動き補償、重複ブロック動き補償（ＯＢＭＣ）、および／または合成インター－イントラ予測を使用して、ビデオデータのコーディングブロック（たとえば、ルーマコーディングブロックとクロマコーディングブロックの両方）を符号化するように構成され得る。

[0120]別の例として、イントラ予測、またはイントラ予測コーディングのために、イントラ予測ユニット２２６は、現在ブロックに隣接しているサンプルから予測ブロックを生成し得る。たとえば、方向性モードでは、イントラ予測ユニット２２６は、概して、予測ブロックを作り出すために、隣接サンプルの値を数学的に組み合わせ、現在ブロックにわたって定義された方向にこれらの計算された値をポピュレートし得る。別の例として、ＤＣモードでは、イントラ予測ユニット２２６は、現在ブロックに対する隣接サンプルの平均を計算し、予測ブロックの各サンプルについてこの得られた平均を含むように予測ブロックを生成し得る。

[0121]ＡＶ１ビデオコーディングフォーマットに従って動作するとき、イントラ予測ユニット２２６は、方向性イントラ予測、非方向性イントラ予測、再帰的フィルタイントラ予測、ルーマからクロマ（ＣＦＬ：chroma-from-luma）予測、イントラブロックコピー（ＩＢＣ）、および／またはカラーパレットモードを使用して、ビデオデータのコーディングブロック（たとえば、ルーマコーディングブロックとクロマコーディングブロックの両方）を符号化するように構成され得る。モード選択ユニット２０２は、他の予測モードに従ってビデオ予測を実施するための追加の機能ユニットを含み得る。

[0122]モード選択ユニット２０２は、予測ブロックを残差生成ユニット２０４に提供する。残差生成ユニット２０４は、ビデオデータメモリ２３０から現在ブロックの生の、符号化されていないバージョンを受信し、モード選択ユニット２０２から予測ブロックを受信する。残差生成ユニット２０４は、現在ブロックと予測ブロックとの間のサンプルごとの差分を計算する。得られたサンプルごとの差分は、現在ブロックについての残差ブロックを定義する。いくつかの例では、残差生成ユニット２０４はまた、残差差分パルスコード変調（ＲＤＰＣＭ）を使用して残差ブロックを生成するために、残差ブロック中のサンプル値間の差分を決定し得る。いくつかの例では、残差生成ユニット２０４は、バイナリ減算を実施する１つまたは複数の減算器回路を使用して形成され得る。

[0123]モード選択ユニット２０２がＣＵをＰＵに区分する例では、各ＰＵは、ルーマ予測ユニットと、対応するクロマ予測ユニットとに関連付けられ得る。ビデオエンコーダ２００およびビデオデコーダ３００は、様々なサイズを有するＰＵをサポートし得る。上記で示されたように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指し得、ＰＵのサイズは、ＰＵのルーマ予測ユニットのサイズを指し得る。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ビデオエンコーダ２００は、イントラ予測のための２Ｎ×２ＮまたはＮ×ＮのＰＵサイズと、インター予測のための２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎ、または同様のものの対称ＰＵサイズとをサポートし得る。ビデオエンコーダ２００およびビデオデコーダ３００はまた、インター予測のための２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズについて非対称区分をサポートし得る。

[0124]モード選択ユニット２０２がＣＵをＰＵにさらに区分しない例では、各ＣＵは、ルーマコーディングブロックと、対応するクロマコーディングブロックとに関連付けられ得る。上記のように、ＣＵのサイズは、ＣＵのルーマコーディングブロックのサイズを指し得る。ビデオエンコーダ２００およびビデオデコーダ３００は、２Ｎ×２Ｎ、２Ｎ×Ｎ、またはＮ×２ＮのＣＵサイズをサポートし得る。

[0125]いくつかの例として、イントラブロックコピーモードコーディング、アフィンモードコーディング、および線形モデル（ＬＭ）モードコーディングなどの他のビデオコーディング技法では、モード選択ユニット２０２は、コーディング技法に関連付けられたそれぞれのユニットを介して、符号化されている現在ブロックについての予測ブロックを生成する。パレットモードコーディングなど、いくつかの例では、モード選択ユニット２０２は、予測ブロックを生成せず、代わりに、選択されたパレットに基づいてブロックを再構築すべき様式を示すシンタックス要素を生成し得る。そのようなモードでは、モード選択ユニット２０２は、符号化されるべきこれらのシンタックス要素をエントロピー符号化ユニット２２０に提供し得る。

[0126]上記で説明されたように、残差生成ユニット２０４は、現在ブロックのためのビデオデータと、対応する予測ブロックとを受信する。残差生成ユニット２０４は、次いで、現在ブロックについての残差ブロックを生成する。残差ブロックを生成するために、残差生成ユニット２０４は、予測ブロックと現在ブロックとの間のサンプルごとの差分を計算する。

[0127]変換処理ユニット２０６は、（本明細書では「変換係数ブロック」と呼ばれる）変換係数のブロックを生成するために、残差ブロックに１つまたは複数の変換を適用する。変換処理ユニット２０６は、変換係数ブロックを形成するために、残差ブロックに様々な変換を適用し得る。たとえば、変換処理ユニット２０６は、離散コサイン変換（ＤＣＴ）、方向性変換、カルーネンレーベ変換（ＫＬＴ）、または概念的に同様の変換を残差ブロックに適用し得る。いくつかの例では、変換処理ユニット２０６は、残差ブロックに複数の変換、たとえば、回転変換など、１次変換および２次変換を実施し得る。いくつかの例では、変換処理ユニット２０６は、残差ブロックに変換を適用しない。

[0128]ＡＶ１に従って動作するとき、変換処理ユニット２０６は、（本明細書では「変換係数ブロック」と呼ばれる）変換係数のブロックを生成するために、残差ブロックに１つまたは複数の変換を適用し得る。変換処理ユニット２０６は、変換係数ブロックを形成するために、残差ブロックに様々な変換を適用し得る。たとえば、変換処理ユニット２０６は、離散コサイン変換（ＤＣＴ）と、非対称離散サイン変換（ＡＤＳＴ）と、反転ＡＤＳＴ（たとえば、逆順におけるＡＤＳＴ）と、恒等変換（ＩＤＴＸ）とを含み得る水平／垂直変換組合せを適用し得る。恒等変換を使用するとき、変換は、垂直方向または水平方向のうちの１つにおいてスキップされる。いくつかの例では、変換処理はスキップされ得る。

[0129]量子化ユニット２０８は、量子化された変換係数ブロックを作り出すために、変換係数ブロック中の変換係数を量子化し得る。量子化ユニット２０８は、現在ブロックに関連付けられた量子化パラメータ（ＱＰ）値に従って変換係数ブロックの変換係数を量子化し得る。ビデオエンコーダ２００は（たとえば、モード選択ユニット２０２を介して）、ＣＵに関連付けられたＱＰ値を調整することによって、現在ブロックに関連付けられた変換係数ブロックに適用される量子化の程度を調整し得る。量子化は、情報の損失をもたらし得、したがって、量子化された変換係数は、変換処理ユニット２０６によって作り出された元の変換係数よりも低い精度を有し得る。

[0130]逆量子化ユニット２１０および逆変換処理ユニット２１２は、変換係数ブロックから残差ブロックを再構築するために、それぞれ、量子化された変換係数ブロックに逆量子化および逆変換を適用し得る。再構築ユニット２１４は、再構築された残差ブロックと、モード選択ユニット２０２によって生成された予測ブロックとに基づいて、（潜在的にある程度のひずみを伴うが）現在ブロックに対応する再構築されたブロックを作り出し得る。たとえば、再構築ユニット２１４は、再構築されたブロックを作り出すために、モード選択ユニット２０２によって生成された予測ブロックからの対応するサンプルに、再構築された残差ブロックのサンプルを加算し得る。

[0131]フィルタユニット２１６は、再構築されたブロックに対して１つまたは複数のフィルタ動作を実施し得る。たとえば、フィルタユニット２１６は、ＣＵのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を実施し得る。いくつかの例では、フィルタユニット２１６の動作はスキップされ得る。

[0132]ＡＶ１に従って動作するとき、フィルタユニット２１６は、再構築されたブロックに対して１つまたは複数のフィルタ動作を実施し得る。たとえば、フィルタユニット２１６は、ＣＵのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を実施し得る。他の例では、フィルタユニット２１６は、制約付き方向性強調フィルタ（ＣＤＥＦ：constrained directional enhancement filter）を適用し得、これは、デブロッキングの後に適用され得、推定されたエッジ方向に基づく、非分離可能、非線形、ローパス方向性フィルタの適用を含み得る。フィルタユニット２１６は、ループ復元フィルタをも含み得、これは、ＣＤＥＦの後に適用され、分離可能対称正規化ウィーナーフィルタまたはデュアル自己誘導フィルタを含み得る。

[0133]ビデオエンコーダ２００は、再構築されたブロックをＤＰＢ２１８に記憶する。たとえば、フィルタユニット２１６の動作が実施されない例では、再構築ユニット２１４は、再構築されたブロックをＤＰＢ２１８に記憶し得る。フィルタユニット２１６の動作が実施される例では、フィルタユニット２１６は、フィルタ処理された再構築されたブロックをＤＰＢ２１８に記憶し得る。動き推定ユニット２２２および動き補償ユニット２２４は、後で符号化されるピクチャのブロックをインター予測するために、再構築（および潜在的にフィルタ処理）されたブロックから形成された参照ピクチャをＤＰＢ２１８から取り出し得る。さらに、イントラ予測ユニット２２６は、現在ピクチャ中の他のブロックをイントラ予測するために、現在ピクチャのＤＰＢ２１８中の再構築されたブロックを使用し得る。

[0134]概して、エントロピー符号化ユニット２２０は、ビデオエンコーダ２００の他の機能構成要素から受信されたシンタックス要素をエントロピー符号化し得る。たとえば、エントロピー符号化ユニット２２０は、量子化ユニット２０８からの量子化された変換係数ブロックをエントロピー符号化し得る。別の例として、エントロピー符号化ユニット２２０は、モード選択ユニット２０２からの予測シンタックス要素（たとえば、インター予測のための動き情報、またはイントラ予測のためのイントラモード情報）をエントロピー符号化し得る。エントロピー符号化ユニット２２０は、エントロピー符号化されたデータを生成するために、ビデオデータの別の例であるシンタックス要素に対して１つまたは複数のエントロピー符号化動作を実施し得る。たとえば、エントロピー符号化ユニット２２０は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）動作、ＣＡＢＡＣ動作、可変対可変（Ｖ２Ｖ）長コーディング動作、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）動作、確率間隔区分エントロピー（ＰＩＰＥ）コーディング動作、指数ゴロム符号化動作、または別のタイプのエントロピー符号化動作をデータに対して実施し得る。いくつかの例では、エントロピー符号化ユニット２２０は、シンタックス要素がエントロピー符号化されないバイパスモードで動作し得る。

[0135]上記で説明されたように、符号予測仮説を実施するとき、エントロピー符号化ユニット２２０は、変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素をコーディングするためのコンテキストを決定することと、決定されたコンテキストを使用して符号予測シンタックス要素をコーディングすることとを行うように構成され得る。

[0136]ビデオエンコーダ２００は、スライスまたはピクチャのブロックを再構築するために必要とされるエントロピー符号化されたシンタックス要素を含むビットストリームを出力し得る。特に、エントロピー符号化ユニット２２０がビットストリームを出力し得る。

[0137]ＡＶ１に従って、エントロピー符号化ユニット２２０は、シンボル対シンボル適応マルチシンボル算術コーダ（symbol-to-symbol adaptive multi-symbol arithmetic coder）として構成され得る。ＡＶ１におけるシンタックス要素はＮ個の要素のアルファベットを含み、コンテキスト（たとえば、確率モデル）はＮ個の確率のセットを含む。エントロピー符号化ユニット２２０は、確率をｎビット（たとえば、１５ビット）累積分布関数（ＣＤＦ）として記憶し得る。エントロピー符号化ユニット２２は、コンテキストを更新するために、アルファベットサイズに基づく更新ファクタを用いて、再帰的スケーリングを実施し得る。

[0138]上記で説明された動作は、ブロックに関して説明されている。そのような説明は、ルーマコーディングブロックおよび／またはクロマコーディングブロックのための動作であるものとして理解されるべきである。上記で説明されたように、いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、ＣＵのルーマ成分およびクロマ成分である。いくつかの例では、ルーマコーディングブロックおよびクロマコーディングブロックは、ＰＵのルーマ成分およびクロマ成分である。

[0139]いくつかの例では、ルーマコーディングブロックに関して実施される動作は、クロマコーディングブロックのために繰り返される必要はない。一例として、ルーマコーディングブロックのための動きベクトル（ＭＶ）と参照ピクチャとを識別するための動作は、クロマブロックのためのＭＶと参照ピクチャとを識別するために繰り返される必要はない。むしろ、ルーマコーディングブロックのためのＭＶは、クロマブロックのためのＭＶを決定するためにスケーリングされ得、参照ピクチャは同じであり得る。別の例として、イントラ予測プロセスは、ルーマコーディングブロックとクロマコーディングブロックとについて同じであり得る。

[0140]ビデオエンコーダ２００は、ビデオデータを記憶するように構成されたメモリと、回路において実装された１つまたは複数の処理ユニットとを含む、ビデオデータを符号化するように構成されたデバイスの一例を表し、１つまたは複数の処理ユニットは、変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素をコーディングするためのコンテキストを決定することと、決定されたコンテキストを使用して符号予測シンタックス要素をコーディングすることとを行うように構成される。

[0141]図６は、本開示の技法を実施し得る例示的なビデオデコーダ３００を示すブロック図である。図６は、説明の目的で提供されており、本開示において広く例示され、説明される技法を限定するものではない。説明の目的で、本開示は、ＶＶＣ（開発中のＩＴＵ－ＴＨ．２６６）、およびＨＥＶＣ（ＩＴＵ－ＴＨ．２６５）の技法に従って、ビデオデコーダ３００について説明する。しかしながら、本開示の技法は、他のビデオコーディング規格に構成されたビデオコーディングデバイスによって実施され得る。

[0142]図６の例では、ビデオデコーダ３００は、コード化ピクチャバッファ（ＣＰＢ）メモリ３２０と、エントロピー復号ユニット３０２と、予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２と、復号ピクチャバッファ（ＤＰＢ）３１４とを含む。ＣＰＢメモリ３２０と、エントロピー復号ユニット３０２と、予測処理ユニット３０４と、逆量子化ユニット３０６と、逆変換処理ユニット３０８と、再構築ユニット３１０と、フィルタユニット３１２と、ＤＰＢ３１４とのいずれかまたはすべては、１つまたは複数のプロセッサにおいてまたは処理回路において実装され得る。たとえば、ビデオデコーダ３００のユニットは、１つまたは複数の回路または論理要素として、ハードウェア回路の一部として、あるいはプロセッサ、ＡＳＩＣ、またはＦＰＧＡの一部として実装され得る。その上、ビデオデコーダ３００は、これらおよび他の機能を実施するための追加または代替のプロセッサまたは処理回路を含み得る。

[0143]予測処理ユニット３０４は、動き補償ユニット３１６と、イントラ予測ユニット３１８とを含む。予測処理ユニット３０４は、他の予測モードに従って予測を実施するための追加のユニットを含み得る。例として、予測処理ユニット３０４は、パレットユニット、（動き補償ユニット３１６の一部を形成し得る）イントラブロックコピーユニット、アフィンユニット、線形モデル（ＬＭ）ユニットなどを含み得る。他の例では、ビデオデコーダ３００は、より多数の、より少数の、または異なる機能の構成要素を含み得る。

[0144]ＡＶ１に従って動作するとき、補償ユニット３１６は、上記で説明されたように、並進動き補償、アフィン動き補償、ＯＢＭＣ、および／または合成インター－イントラ予測を使用して、ビデオデータのコーディングブロック（たとえば、ルーマコーディングブロックとクロマコーディングブロックの両方）を復号するように構成され得る。イントラ予測ユニット３１８は、上記で説明されたように、方向性イントラ予測、非方向性イントラ予測、再帰的フィルタイントラ予測、ＣＦＬ、イントラブロックコピー（ＩＢＣ）、および／またはカラーパレットモードを使用して、ビデオデータのコーディングブロック（たとえば、ルーマコーディングブロックとクロマコーディングブロックの両方）を復号するように構成され得る。

[0145]ＣＰＢメモリ３２０は、ビデオデコーダ３００の構成要素によって復号されるべき、符号化されたビデオビットストリームなどのビデオデータを記憶し得る。ＣＰＢメモリ３２０に記憶されるビデオデータは、たとえば、コンピュータ可読媒体１１０（図１）から取得され得る。ＣＰＢメモリ３２０は、符号化されたビデオビットストリームからの符号化されたビデオデータ（たとえば、シンタックス要素）を記憶するＣＰＢを含み得る。また、ＣＰＢメモリ３２０は、ビデオデコーダ３００の様々なユニットからの出力を表す一時データなど、コーディングされたピクチャのシンタックス要素以外のビデオデータを記憶し得る。ＤＰＢ３１４は、概して、符号化されたビデオビットストリームの後続のデータまたはピクチャを復号するときにビデオデコーダ３００が参照ビデオデータとして出力および／または使用し得る、復号されたピクチャを記憶する。ＣＰＢメモリ３２０とＤＰＢ３１４とは、ＳＤＲＡＭを含むＤＲＡＭ、ＭＲＡＭ、ＲＲＡＭ、または他のタイプのメモリデバイスなど、様々なメモリデバイスのいずれかによって形成され得る。ＣＰＢメモリ３２０とＤＰＢ３１４とは、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ＣＰＢメモリ３２０は、ビデオデコーダ３００の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。

[0146]追加または代替として、いくつかの例では、ビデオデコーダ３００は、メモリ１２０（図１）からコーディングされたビデオデータを取り出し得る。すなわち、メモリ１２０は、ＣＰＢメモリ３２０とともに上記で説明されたようにデータを記憶し得る。同様に、メモリ１２０は、ビデオデコーダ３００の機能の一部または全部が、ビデオデコーダ３００の処理回路によって実行されるべきソフトウェアにおいて実装されたとき、ビデオデコーダ３００によって実行されるべき命令を記憶し得る。

[0147]図６に示されている様々なユニットは、ビデオデコーダ３００によって実施される動作を理解するのを支援するために示されている。ユニットは、固定機能回路、プログラマブル回路、またはそれらの組合せとして実装され得る。図５と同様に、固定機能回路は、特定の機能を提供する回路を指し、実施され得る動作に関してプリセットされる。プログラマブル回路は、様々なタスクを実施するように、および実施され得る動作においてフレキシブルな機能を提供するようにプログラムされ得る回路を指す。たとえば、プログラマブル回路は、ソフトウェアまたはファームウェアの命令によって定義された様式でプログラマブル回路を動作させるソフトウェアまたはファームウェアを実行し得る。固定機能回路は、（たとえば、パラメータを受信するかまたはパラメータを出力するために）ソフトウェア命令を実行し得るが、固定機能回路が実施する動作のタイプは、概して不変である。いくつかの例では、ユニットのうちの１つまたは複数は、別個の回路ブロック（固定機能またはプログラマブル）であり得、いくつかの例では、ユニットのうちの１つまたは複数は、集積回路であり得る。

[0148]ビデオデコーダ３００は、ＡＬＵ、ＥＦＵ、デジタル回路、アナログ回路、および／またはプログラマブル回路から形成されるプログラマブルコアを含み得る。ビデオデコーダ３００の動作が、プログラマブル回路上で実行するソフトウェアによって実施される例では、オンチップまたはオフチップメモリは、ビデオデコーダ３００が受信し、実行するソフトウェアの命令（たとえば、オブジェクトコード）を記憶し得る。

[0149]エントロピー復号ユニット３０２は、ＣＰＢから、符号化されたビデオデータを受信し、シンタックス要素を再生するためにビデオデータをエントロピー復号し得る。予測処理ユニット３０４、逆量子化ユニット３０６、逆変換処理ユニット３０８、再構築ユニット３１０、およびフィルタユニット３１２は、ビットストリームから抽出されたシンタックス要素に基づいて、復号されたビデオデータを生成し得る。

[0150]概して、ビデオデコーダ３００は、ブロックごとにピクチャを再構築する。ビデオデコーダ３００は、各ブロックに対して個々に再構築動作を実施し得る（ここで、現在再構築されている、すなわち、復号されているブロックは、「現在ブロック」と呼ばれることがある）。

[0151]エントロピー復号ユニット３０２は、量子化された変換係数ブロックの量子化された変換係数を定義するシンタックス要素、ならびに量子化パラメータ（ＱＰ）および／または（１つまたは複数の）変換モード指示などの変換情報をエントロピー復号し得る。上記で説明されたように、符号予測仮説を実施するとき、エントロピー復号ユニット３０２は、変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素をコーディングするためのコンテキストを決定することと、決定されたコンテキストを使用して符号予測シンタックス要素をコーディングすることとを行うように構成され得る。

[0152]逆量子化ユニット３０６は、量子化の程度と、同様に、逆量子化ユニット３０６が適用すべき逆量子化の程度とを決定するために、量子化された変換係数ブロックに関連付けられたＱＰを使用し得る。逆量子化ユニット３０６は、量子化された変換係数を逆量子化するために、たとえば、ビット単位左シフト動作を実施し得る。逆量子化ユニット３０６は、それにより、変換係数を含む変換係数ブロックを形成し得る。

[0153]逆量子化ユニット３０６が変換係数ブロックを形成した後に、逆変換処理ユニット３０８は、現在ブロックに関連付けられた残差ブロックを生成するために、変換係数ブロックに１つまたは複数の逆変換を適用し得る。たとえば、逆変換処理ユニット３０８は、逆ＤＣＴ、逆整数変換、逆カルーネンレーベ変換（ＫＬＴ）、逆回転変換、逆方向変換、または別の逆変換を変換係数ブロックに適用し得る。

[0154]さらに、予測処理ユニット３０４は、エントロピー復号ユニット３０２によってエントロピー復号された予測情報シンタックス要素に従って予測ブロックを生成する。たとえば、予測情報シンタックス要素が、現在ブロックがインター予測されることを示す場合、動き補償ユニット３１６は予測ブロックを生成し得る。この場合、予測情報シンタックス要素は、参照ブロックをそれから取り出すべきＤＰＢ３１４中の参照ピクチャ、ならびに現在ピクチャ中の現在ブロックのロケーションに対する参照ピクチャ中の参照ブロックのロケーションを識別する動きベクトルを示し得る。動き補償ユニット３１６は、概して、動き補償ユニット２２４（図５）に関して説明されたものと実質的に同様である様式で、インター予測プロセスを実施し得る。

[0155]別の例として、予測情報シンタックス要素が、現在ブロックがイントラ予測されることを示す場合、イントラ予測ユニット３１８は、予測情報シンタックス要素によって示されるイントラ予測モードに従って予測ブロックを生成し得る。この場合も、イントラ予測ユニット３１８は、概して、イントラ予測ユニット２２６（図５）に関して説明されたものと実質的に同様である様式で、イントラ予測プロセスを実施し得る。イントラ予測ユニット３１８は、ＤＰＢ３１４から、現在ブロックに対する隣接サンプルのデータを取り出し得る。

[0156]再構築ユニット３１０は、予測ブロックと残差ブロックとを使用して現在ブロックを再構築し得る。たとえば、再構築ユニット３１０は、現在ブロックを再構築するために、予測ブロックの対応するサンプルに残差ブロックのサンプルを加算し得る。

[0157]フィルタユニット３１２は、再構築されたブロックに対して１つまたは複数のフィルタ動作を実施し得る。たとえば、フィルタユニット３１２は、再構築されたブロックのエッジに沿ってブロッキネスアーティファクトを低減するためのデブロッキング動作を実施し得る。フィルタユニット３１２の動作は、必ずしもすべての例において実施されるとは限らない。

[0158]ビデオデコーダ３００は、再構築されたブロックをＤＰＢ３１４に記憶し得る。たとえば、フィルタユニット３１２の動作が実施されない例では、再構築ユニット３１０は、再構築されたブロックをＤＰＢ３１４に記憶し得る。フィルタユニット３１２の動作が実施される例では、フィルタユニット３１２は、フィルタ処理された再構築されたブロックをＤＰＢ３１４に記憶し得る。上記で説明されたように、ＤＰＢ３１４は、イントラ予測のための現在ピクチャのサンプル、および後続の動き補償のための前に復号されたピクチャなど、参照情報を、予測処理ユニット３０４に提供し得る。その上、ビデオデコーダ３００は、ＤＰＢ３１４からの復号されたピクチャ（たとえば、復号されたビデオ）を、図１のディスプレイデバイス１１８などのディスプレイデバイス上での後続の提示のために、出力し得る。

[0159]このようにして、ビデオデコーダ３００は、ビデオデータを記憶するように構成されたメモリと、回路において実装された１つまたは複数の処理ユニットとを含むビデオ復号デバイスの一例を表し、１つまたは複数の処理ユニットは、変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素をコーディングするためのコンテキストを決定することと、決定されたコンテキストを使用して符号予測シンタックス要素をコーディングすることとを行うように構成される。

[0160]図７は、本開示の技法による、現在ブロックを符号化するための例示的な方法を示すフローチャートである。現在ブロックは現在ＣＵを備え得る。ビデオエンコーダ２００（図１および図５）に関して説明されるが、他のデバイスが図７の方法と同様の方法を実施するように構成され得ることを理解されたい。

[0161]この例では、ビデオエンコーダ２００は、最初に、現在ブロックを予測する（３５０）。たとえば、ビデオエンコーダ２００は、現在ブロックのための予測ブロックを形成し得る。ビデオエンコーダ２００は、次いで、現在ブロックのための残差ブロックを計算し得る（３５２）。残差ブロックを計算するために、ビデオエンコーダ２００は、元の符号化されていないブロックと、現在ブロックのための予測ブロックとの間の差分を計算し得る。ビデオエンコーダ２００は、次いで、残差ブロックを変換し、残差ブロックの変換係数を量子化し得る（３５４）。次に、ビデオエンコーダ２００は、残差ブロックの量子化された変換係数を走査し得る（３５６）。走査中に、または走査に続いて、ビデオエンコーダ２００は、変換係数をエントロピー符号化し得る（３５８）。たとえば、ビデオエンコーダ２００は、ＣＡＶＬＣまたはＣＡＢＡＣを使用して変換係数を符号化し得る。ビデオエンコーダ２００は、次いで、ブロックのエントロピー符号化されたデータを出力し得る（３６０）。

[0162]図８は、本開示の技法による、ビデオデータの現在ブロックを復号するための例示的な方法を示すフローチャートである。現在ブロックは現在ＣＵを備え得る。ビデオデコーダ３００（図１および図６）に関して説明されるが、他のデバイスが図８の方法と同様の方法を実施するように構成され得ることを理解されたい。

[0163]ビデオデコーダ３００は、エントロピー符号化された予測情報、および現在ブロックに対応する残差ブロックの変換係数についてのエントロピー符号化されたデータなど、現在ブロックについてのエントロピー符号化されたデータを受信し得る（３７０）。ビデオデコーダ３００は、現在ブロックのための予測情報を決定するために、および残差ブロックの変換係数を再生するために、エントロピー符号化されたデータをエントロピー復号し得る（３７２）。ビデオデコーダ３００は、現在ブロックのための予測ブロックを計算するために、たとえば、現在ブロックのための予測情報によって示されるイントラ予測またはインター予測モードを使用して、現在ブロックを予測し得る（３７４）。ビデオデコーダ３００は、次いで、量子化された変換係数のブロックを作成するために、再生された変換係数を逆走査し得る（３７６）。ビデオデコーダ３００は、次いで、残差ブロックを作り出すために、変換係数を逆量子化し、変換係数に逆変換を適用し得る（３７８）。ビデオデコーダ３００は、予測ブロックと残差ブロックとを組み合わせることによって、最終的に現在ブロックを復号し得る（３８０）。

[0164]図９は、本開示の技法による、現在ブロックを符号化するための別の例示的な方法を示すフローチャートである。図９の技法は、エントロピー符号化ユニット２２０を含む、ビデオエンコーダ２００の１つまたは複数の構造ユニットによって実施され得る。

[0165]本開示の一例では、ビデオエンコーダ２００は、変換係数の符号（sign）を決定する（５００）ように構成され得る。ビデオエンコーダ２００は、変換係数についての符号予測仮説を決定する（５０２）ようにさらに構成され得る。一例では、ビデオエンコーダ２００は、組み合わせられたテンプレート値を含むコスト関数を最小化することによって符号予測仮説を決定し得る。

[0166]ビデオエンコーダ２００は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストをさらに決定し得、ここにおいて、符号予測シンタックス要素は、変換係数について符号予測仮説が正しいかどうかを示す（５０４）。ビデオエンコーダ２００は、コンテキストを使用して符号予測シンタックス要素をさらに符号化し得る（５０６）。

[0167]一例では、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、ビデオエンコーダ２００は、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するようにさらに構成される。

[0168]別の例では、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、ビデオエンコーダ２００は、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を符号化するための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を符号化するための第２のコンテキストを決定することとを行うようにさらに構成される。

[0169]別の例では、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、ビデオエンコーダ２００は、ビデオデータのブロック中の符号予測順序に基づいて、符号予測シンタックス要素を符号化するためのコンテキストを決定するようにさらに構成され、ここにおいて、ビデオデータのブロック中の変換係数の位置は、符号予測順序に基づく。

[0170]別の例では、ビデオエンコーダ２００は、ブロックを符号化するために使用されるコーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するようにさらに構成される。すなわち、ビデオエンコーダ２００は、変換係数の位置とコーディングモードの両方に基づいて、符号予測シンタックス要素についてのコンテキストを決定するように構成される。

[0171]別の例では、コーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、ビデオエンコーダ２００は、ビデオデータのブロックをコーディングするために使用されるコーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、符号予測シンタックス要素を符号化するためのコンテキストを決定するようにさらに構成される。

[0172]別の例では、ビデオエンコーダ２００は、イントラ予測方向にさらに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するようにさらに構成される。

[0173]図１０は、本開示の技法による、現在ブロックを復号するための別の例示的な方法を示すフローチャートである。図１０の技法は、エントロピー復号ユニット３０２を含む、ビデオデコーダ３００の１つまたは複数の構造ユニットによって実施され得る。

[0174]本開示の一例では、ビデオデコーダ３００は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号（sign）予測シンタックス要素を復号するためのコンテキストを決定するように構成され、ここにおいて、符号予測シンタックス要素は、変換係数について符号予測仮説が正しいかどうかを示す（５２０）。ビデオデコーダ３００は、次いで、コンテキストを使用して符号予測シンタックス要素を復号し得る（５２２）。

[0175]ビデオデコーダ３００は、変換係数についての符号予測仮説を決定する（５２４）ようにさらに構成され得る。たとえば、ビデオデコーダ３００は、組み合わせられたテンプレート値を含むコスト関数を最小化することによって符号予測仮説を決定し得る。ビデオデコーダ３００は、次いで、符号予測仮説と符号予測シンタックス要素とに基づいて変換係数の符号を決定すること（５２６）と、変換係数の符号に基づいてビデオデータのブロックを復号すること（５２８）とを行い得る。

[0176]一例では、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、ビデオデコーダ３００は、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するようにさらに構成される。

[0177]別の例では、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、ビデオデコーダ３００は、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を復号するための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を復号するための第２のコンテキストを決定することとを行うようにさらに構成される。

[0178]別の例では、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、ビデオデコーダ３００は、ビデオデータのブロック中の符号予測順序に基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定するようにさらに構成され、ここにおいて、ビデオデータのブロック中の変換係数の位置は、符号予測順序に基づく。

[0179]別の例では、ビデオデコーダ３００は、ブロックを符号化するために使用されるコーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するようにさらに構成される。

[0180]別の例では、コーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、ビデオデコーダ３００は、ビデオデータのブロックをコーディングするために使用されるコーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定するようにさらに構成される。

[0181]別の例では、ビデオデコーダ３００は、イントラ予測方向にさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するようにさらに構成される。

[0182]本開示の技法およびデバイスの他の例示的な態様が以下で説明される。

[0183]態様１－ビデオデータを復号する方法であって、方法は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素を復号することとを備える、方法。

[0184]態様２－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することは、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することを備える、態様１に記載の方法。

[0185]態様３－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することは、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を復号するための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を復号するための第２のコンテキストを決定することとを備える、態様１に記載の方法。

[0186]態様４－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することが、ビデオデータのブロック中の符号予測順序に基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定することを備え、ここにおいて、ビデオデータのブロック中の変換係数の位置が符号予測順序に基づく、態様１に記載の方法。

[0187]態様５－ビデオデータのブロックをコーディングするために使用されるコーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することをさらに備える、態様１に記載の方法。

[0188]態様６－コーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することは、ビデオデータのブロックをコーディングするために使用されるコーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定することを備える、態様５に記載の方法。

[0189]態様７－イントラ予測方向にさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することをさらに備える、態様１に記載の方法。

[0190]態様８－変換係数についての符号予測仮説を決定することと、符号予測仮説と符号予測シンタックス要素とに基づいて変換係数の符号を決定することと、変換係数の符号に基づいてビデオデータのブロックを復号することとをさらに備える、態様１から７のいずれかに記載の方法。

[0191]態様９－変換係数についての符号予測仮説を決定することが、組み合わせられたテンプレート値を含むコスト関数を最小化することを備える、態様８に記載の方法。

[0192]態様１０－ビデオデータのブロックを含むピクチャを表示することをさらに備える、態様８に記載の方法。

[0193]態様１１－ビデオデータを復号するように構成された装置であって、装置が、ビデオデータのブロックを記憶するように構成されたメモリと、回路中に実装され、メモリと通信している１つまたは複数のプロセッサとを備え、１つまたは複数のプロセッサは、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素を復号することとを行うように構成された、装置。

[0194]態様１２－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、１つまたは複数のプロセッサは、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することを行うようにさらに構成された、態様１１に記載の装置。

[0195]態様１３－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、１つまたは複数のプロセッサは、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を復号するための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を復号するための第２のコンテキストを決定することとを行うようにさらに構成された、態様１１に記載の装置。

[0196]態様１４－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、１つまたは複数のプロセッサが、ビデオデータのブロック中の符号予測順序に基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定することを行うようにさらに構成され、ここにおいて、ビデオデータのブロック中の変換係数の位置が符号予測順序に基づく、態様１１に記載の装置。

[0197]態様１５－１つまたは複数のプロセッサが、ビデオデータのブロックをコーディングするために使用されるコーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することを行うようにさらに構成された、態様１１に記載の装置。

[0198]態様１６－コーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、１つまたは複数のプロセッサは、ビデオデータのブロックをコーディングするために使用されるコーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定することを行うようにさらに構成された、態様１５に記載の装置。

[0199]態様１７－１つまたは複数のプロセッサが、イントラ予測方向にさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することを行うようにさらに構成された、態様１１に記載の装置。

[0200]態様１８－１つまたは複数のプロセッサが、変換係数についての符号予測仮説を決定することと、符号予測仮説と符号予測シンタックス要素とに基づいて変換係数の符号を決定することと、変換係数の符号に基づいてビデオデータのブロックを復号することとを行うようにさらに構成された、態様１１から１７のいずれかに記載の装置。

[0201]態様１９－変換係数についての符号予測仮説を決定するために、１つまたは複数のプロセッサが、組み合わせられたテンプレート値を含むコスト関数を最小化することを行うようにさらに構成された、態様１８に記載の装置。

[0202]態様２０－ビデオデータのブロックを含むピクチャを表示するように構成されたディスプレイをさらに備える、態様１８に記載の装置。

[0203]態様２１－ビデオデータを復号するように構成された装置であって、装置は、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段と、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素を復号するための手段とを備える、装置。

[0204]態様２２－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段は、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段を備える、態様２１に記載の装置。

[0205]態様２３－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段は、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を復号するための第１のコンテキストを決定するための手段と、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を復号するための第２のコンテキストを決定するための手段とを備える、態様２１に記載の装置。

[0206]態様２４－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段が、ビデオデータのブロック中の符号予測順序に基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定するための手段を備え、ここにおいて、ビデオデータのブロック中の変換係数の位置が符号予測順序に基づく、態様２１に記載の装置。

[0207]態様２５－ビデオデータのブロックをコーディングするために使用されるコーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段をさらに備える、態様２１に記載の装置。

[0208]態様２６－コーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段は、ビデオデータのブロックをコーディングするために使用されるコーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定するための手段を備える、態様２５に記載の装置。

[0209]態様２７－イントラ予測方向にさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するための手段をさらに備える、態様２１に記載の装置。

[0210]態様２８－変換係数についての符号予測仮説を決定するための手段と、符号予測仮説と符号予測シンタックス要素とに基づいて変換係数の符号を決定するための手段と、変換係数の符号に基づいてビデオデータのブロックを復号するための手段とをさらに備える、態様２１から２７のいずれかに記載の装置。

[0211]態様２９－変換係数についての符号予測仮説を決定するための手段が、組み合わせられたテンプレート値を含むコスト関数を最小化するための手段を備える、態様２８に記載の装置。

[0212]態様３０－ビデオデータのブロックを含むピクチャを表示するための手段をさらに備える、態様２８に記載の装置。

[0213]態様３１－実行されたとき、ビデオデータを復号するように構成された１つまたは複数のプロセッサに、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素を復号することとを行わせる命令を記憶する非一時的コンピュータ可読記憶媒体。

[0214]態様３２－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、命令は、１つまたは複数のプロセッサに、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することをさらに行わせる、態様３１に記載の非一時的コンピュータ可読記憶媒体。

[0215]態様３３－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、命令は、１つまたは複数のプロセッサに、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を復号するための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を復号するための第２のコンテキストを決定することとをさらに行わせる、態様３１に記載の非一時的コンピュータ可読記憶媒体。

[0216]態様３４－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、命令が、１つまたは複数のプロセッサに、ビデオデータのブロック中の符号予測順序に基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定することをさらに行わせ、ここにおいて、ビデオデータのブロック中の変換係数の位置が符号予測順序に基づく、態様３１に記載の非一時的コンピュータ可読記憶媒体。

[0217]態様３５－命令が、１つまたは複数のプロセッサに、ビデオデータのブロックをコーディングするために使用されるコーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することをさらに行わせる、態様３１に記載の非一時的コンピュータ可読記憶媒体。

[0218]態様３６－コーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定するために、命令は、１つまたは複数のプロセッサに、ビデオデータのブロックをコーディングするために使用されるコーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、符号予測シンタックス要素を復号するためのコンテキストを決定することをさらに行わせる、態様３５に記載の非一時的コンピュータ可読記憶媒体。

[0219]態様３７－命令が、１つまたは複数のプロセッサに、イントラ予測方向にさらに基づいて、変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することをさらに行わせる、態様３１に記載の非一時的コンピュータ可読記憶媒体。

[0220]態様３８－命令が、１つまたは複数のプロセッサに、変換係数についての符号予測仮説を決定することと、符号予測仮説と符号予測シンタックス要素とに基づいて変換係数の符号を決定することと、変換係数の符号に基づいてビデオデータのブロックを復号することとをさらに行わせる、態様３１から３７のいずれかに記載の非一時的コンピュータ可読記憶媒体。

[0221]態様３９－変換係数についての符号予測仮説を決定するために、命令が、１つまたは複数のプロセッサに、組み合わせられたテンプレート値を含むコスト関数を最小化することをさらに行わせる、態様３８に記載の非一時的コンピュータ可読記憶媒体。

[0222]態様４０－命令が、１つまたは複数のプロセッサに、ビデオデータのブロックを含むピクチャを表示することをさらに行わせる、態様３８に記載の非一時的コンピュータ可読記憶媒体。

[0223]態様４１－ビデオデータを符号化するように構成された装置であって、装置が、ビデオデータのブロックを記憶するように構成されたメモリと、回路中に実装され、メモリと通信している１つまたは複数のプロセッサとを備え、１つまたは複数のプロセッサは、ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定することと、ここにおいて、符号予測シンタックス要素が、変換係数について符号予測仮説が正しいかどうかを示す、コンテキストを使用して符号予測シンタックス要素を符号化することとを行うように構成された、装置。

[0224]態様４２－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、１つまたは複数のプロセッサは、変換係数がＤＣ係数であるかどうかに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定することを行うようにさらに構成された、態様４１に記載の装置。

[0225]態様４３－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、１つまたは複数のプロセッサは、変換係数がＤＣ係数であることに基づいて、符号予測シンタックス要素を符号化するための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測シンタックス要素を符号化するための第２のコンテキストを決定することとを行うようにさらに構成された、態様４１に記載の装置。

[0226]態様４４－ビデオデータのブロック中の変換係数の位置に基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、１つまたは複数のプロセッサが、ビデオデータのブロック中の符号予測順序に基づいて、符号予測シンタックス要素を符号化するためのコンテキストを決定することを行うようにさらに構成され、ここにおいて、ビデオデータのブロック中の変換係数の位置が符号予測順序に基づく、態様４１に記載の装置。

[0227]態様４５－１つまたは複数のプロセッサが、ビデオデータのブロックをコーディングするために使用されるコーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定することを行うようにさらに構成された、態様４１に記載の装置。

[0228]態様４６－コーディングモードにさらに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定するために、１つまたは複数のプロセッサは、ビデオデータのブロックをコーディングするために使用されるコーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、符号予測シンタックス要素を符号化するためのコンテキストを決定することを行うようにさらに構成された、態様４５に記載の装置。

[0229]態様４７－１つまたは複数のプロセッサが、イントラ予測方向にさらに基づいて、変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定することを行うようにさらに構成された、態様４１に記載の装置。

[0230]態様４８－１つまたは複数のプロセッサが、変換係数の符号を決定することと、変換係数についての符号予測仮説を決定することとを行うようにさらに構成され、ここにおいて、符号予測シンタックス要素を符号化するために、１つまたは複数のプロセッサが、変換係数の符号と符号予測仮説とに基づいて、コンテキストを使用して符号予測を符号化することを行うように構成された、態様４１から４７のいずれかに記載の装置。

[0231]態様４９－変換係数についての符号予測仮説を決定するために、１つまたは複数のプロセッサが、組み合わせられたテンプレート値を含むコスト関数を最小化することを行うようにさらに構成された、態様４８に記載の装置。

[0232]態様５０－ビデオデータのブロックを含むピクチャをキャプチャするように構成されたカメラをさらに備える、態様４８に記載の装置。

[0233]態様５１－ビデオデータをコーディングする方法であって、方法が、変換係数の位置に基づいて、変換係数についての符号予測をコーディングするためのコンテキストを決定することと、決定されたコンテキストを使用して符号予測をコーディングすることとを備える、方法。

[0234]態様５２－符号予測は、変換係数について符号予測仮説が正しいかどうかを示すビンである、態様５１に記載の方法。

[0235]態様５３－変換係数の位置に基づいて、変換係数についての符号予測をコーディングするためのコンテキストを決定することは、変換係数がＤＣ係数であることに基づいて、符号予測をコーディングするための第１のコンテキストを決定することと、変換係数がＤＣ係数でないことに基づいて、符号予測をコーディングするための第２のコンテキストを決定することとを備える、態様５１から５２のいずれかに記載の方法。

[0236]態様５４－変換係数の位置に基づいて、変換係数についての符号予測をコーディングするためのコンテキストを決定することが、変換係数を含むブロックの象限に基づいて、符号予測をコーディングするためのコンテキストを決定することを備える、態様５１から５２のいずれかに記載の方法。

[0237]態様５５－変換係数の位置に基づいて、変換係数についての符号予測をコーディングするためのコンテキストを決定することが、位置対称性を有する２つの変換係数について同じコンテキストを使用することを決定することを備える、態様５１から５２のいずれかに記載の方法。

[0238]態様５６－変換係数の位置に基づいて、変換係数についての符号予測をコーディングするためのコンテキストを決定することが、符号予測順序に基づいて、符号予測をコーディングするためのコンテキストを決定することを備える、態様５１から５２のいずれかに記載の方法。

[0239]態様５７－ビデオデータをコーディングする方法であって、方法が、コーディングモードに基づいて、変換係数についての符号予測をコーディングするためのコンテキストを決定することと、決定されたコンテキストを使用して符号予測をコーディングすることとを備える、方法。

[0240]態様５８－符号予測は、変換係数について符号予測仮説が正しいかどうかを示すビンである、態様５７に記載の方法。

[0241]態様５９－符号予測をコーディングするためのコンテキストを決定することが、変換係数を含むブロックをコーディングするためのインター予測またはイントラ予測の使用に基づいて、符号予測をコーディングするためのコンテキストを決定することを備える、態様５７から５８のいずれかに記載の方法。

[0242]態様６０－符号予測をコーディングするためのコンテキストを決定することが、イントラ予測方向に基づいて、符号予測をコーディングするためのコンテキストを決定することを備える、態様５７から５８のいずれかに記載の方法。

[0243]態様６１－符号予測をコーディングするためのコンテキストを決定することが、１次変換に基づいて、符号予測をコーディングするためのコンテキストを決定することを備える、態様５７から５８のいずれかに記載の方法。

[0244]態様６２－符号予測をコーディングするためのコンテキストを決定することが、２次変換に基づいて、符号予測をコーディングするためのコンテキストを決定することを備える、態様５７から５８のいずれかに記載の方法。

[0245]態様６３－コーディングすることが復号することを備え、ここにおいて、方法が、変換係数についての符号予測仮説を決定することと、符号予測仮説と復号された符号予測とに基づいて変換係数の符号を決定することと、決定された符号に基づいてビデオデータのブロックを復号することとをさらに備える、態様５１から６２のいずれかに記載の方法。

[0246]態様６４－コーディングすることが符号化することを備え、ここにおいて、方法が、変換係数の符号を決定することと、変換係数についての符号予測仮説を決定することとをさらに備え、ここにおいて、符号予測を符号化することが、変換係数の符号と符号予測仮説とに基づいて、決定されたコンテキストを使用して符号予測を符号化することを備える、態様５１から６２のいずれかに記載の方法。

[0247]態様６５－変換係数についての符号予測仮説を決定することが、組み合わせられたテンプレート値を含むコスト関数を最小化することによって符号予測仮説を決定することを備える、態様６３から６４のいずれかに記載の方法。

[0248]態様６６－態様５１から６５の任意の組合せの方法。

[0249]態様６７－ビデオデータをコーディングするためのデバイスであって、デバイスが、態様５１から６６のいずれかに記載の方法を実施するための１つまたは複数の手段を備える、デバイス。

[0250]態様６８－１つまたは複数の手段が、回路中に実装された１つまたは複数のプロセッサを備える、態様６７に記載のデバイス。

[0251]態様６９－ビデオデータを記憶するためのメモリをさらに備える、態様６７および６８のいずれかに記載のデバイス。

[0252]態様７０－復号されたビデオデータを表示するように構成されたディスプレイをさらに備える、態様６７から６９のいずれかに記載のデバイス。

[0253]態様７１－デバイスが、カメラ、コンピュータ、モバイルデバイス、ブロードキャスト受信機デバイス、またはセットトップボックスのうちの１つまたは複数を備える、態様６７から７０のいずれかに記載のデバイス。

[0254]態様７２－デバイスがビデオデコーダを備える、態様６７から７１のいずれかに記載のデバイス。

[0255]態様７３－デバイスがビデオエンコーダを備える、態様６７から７２のいずれかに記載のデバイス。

[0256]態様７４－命令を記憶したコンピュータ可読記憶媒体であって、命令が、実行されたとき、１つまたは複数のプロセッサに、態様５１から６６のいずれかに記載の方法を実施させる、コンピュータ可読記憶媒体。

[0257]上記例に応じて、本明細書で説明された技法のいずれかのいくつかの行為またはイベントは、異なるシーケンスで実施され得、追加、マージ、または完全に除外され得る（たとえば、すべての説明された行為またはイベントが本技法の実践のために必要であるとは限らない）ことを認識されたい。その上、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して同時に実施され得る。

[0258]１つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベース処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的である有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法の実装のための命令、コードおよび／またはデータ構造を取り出すために、１つまたは複数のコンピュータまたは１つまたは複数のプロセッサによってアクセスされ得る、任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。

[0259]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ－ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体が、接続、搬送波、信号、または他の一時的媒体を含むのではなく、代わりに非一時的な有形の記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびＢｌｕ－ｒａｙディスク（disc）を含み、ここで、ディスク（disk）は通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲に含まれるべきである。

[0260]命令は、１つまたは複数のＤＳＰ、汎用マイクロプロセッサ、ＡＳＩＣ、ＦＰＧＡ、あるいは他の等価な集積回路またはディスクリート論理回路など、１つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用される「プロセッサ」および「処理回路」という用語は、上記の構造、または本明細書で説明された技法の実装に好適な任意の他の構造のいずれかを指し得る。さらに、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用ハードウェアおよび／またはソフトウェアモジュール内に提供されるか、あるいは複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素において十分に実装され得る。

[0261]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示される技法を実施するように構成されたデバイスの機能的態様を強調するために、様々な構成要素、モジュール、またはユニットが説明されたが、それらの構成要素、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上記で説明されたように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明された１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作可能なハードウェアユニットの集合によって提供され得る。

[0262]様々な例が説明された。これらおよび他の例は以下の特許請求の範囲内に入る。

Claims

ビデオデータを復号する方法であって、
ビデオデータのブロック中の変換係数の位置に基づいて、前記変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、前記符号予測シンタックス要素は、前記変換係数について符号予測仮説が正しいかどうかを示す、
前記コンテキストを使用して前記符号予測シンタックス要素を復号することと、
を備える、方法。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定することは、
前記変換係数がＤＣ係数であるかどうかに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
を備える、請求項１に記載の方法。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定することは、
前記変換係数がＤＣ係数であることに基づいて、前記符号予測シンタックス要素を復号するための第１のコンテキストを決定することと、
前記変換係数が前記ＤＣ係数でないことに基づいて、前記符号予測シンタックス要素を復号するための第２のコンテキストを決定することと、
を備える、請求項１に記載の方法。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定することは、
ビデオデータの前記ブロック中の符号予測順序に基づいて、前記符号予測シンタックス要素を復号するための前記コンテキストを決定することを備え、
ビデオデータの前記ブロック中の前記変換係数の前記位置は、前記符号予測順序に基づき、
前記符号予測順序は、前記ブロック内の走査順序である、
請求項１に記載の方法。
前記ブロックを符号化するために使用されるコーディングモードにさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
をさらに備える、請求項１に記載の方法。
前記コーディングモードにさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定することは、
ビデオデータの前記ブロックをコーディングするために使用される前記コーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
を備える、請求項５に記載の方法。
イントラ予測方向にさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
をさらに備える、請求項１に記載の方法。
前記変換係数についての前記符号予測仮説を決定することと、
前記符号予測仮説と前記符号予測シンタックス要素とに基づいて前記変換係数の符号を決定することと、
前記変換係数の前記符号に基づいてビデオデータの前記ブロックを復号することと、
をさらに備える、請求項１に記載の方法。
前記変換係数についての前記符号予測仮説を決定することは、
組み合わせられたテンプレート値を含むコスト関数を最小化すること、
を備える、請求項８に記載の方法。
ビデオデータの前記ブロックを含むピクチャを表示すること、
をさらに備える、請求項８に記載の方法。
ビデオデータを復号するように構成された装置であって、
ビデオデータのブロックを記憶するように構成されたメモリと、
回路中に実装され、前記メモリと通信している１つまたは複数のプロセッサと、
を備え、前記１つまたは複数のプロセッサは、
ビデオデータの前記ブロック中の変換係数の位置に基づいて、前記変換係数についての符号予測シンタックス要素を復号するためのコンテキストを決定することと、ここにおいて、前記符号予測シンタックス要素は、前記変換係数について符号予測仮説が正しいかどうかを示す、
前記コンテキストを使用して前記符号予測シンタックス要素を復号することと、
を行うように構成された、装置。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
前記変換係数がＤＣ係数であるかどうかに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項１１に記載の装置。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
前記変換係数がＤＣ係数であることに基づいて、前記符号予測シンタックス要素を復号するための第１のコンテキストを決定することと、
前記変換係数が前記ＤＣ係数でないことに基づいて、前記符号予測シンタックス要素を復号するための第２のコンテキストを決定することと、
を行うようにさらに構成された、請求項１１に記載の装置。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
ビデオデータの前記ブロック中の符号予測順序に基づいて、前記符号予測シンタックス要素を復号するための前記コンテキストを決定することを行うようにさらに構成され、
ビデオデータの前記ブロック中の前記変換係数の前記位置は、前記符号予測順序に基づき、
前記符号予測順序は、前記ブロック内の走査順序である、
請求項１１に記載の装置。
前記１つまたは複数のプロセッサは、
前記ブロックを符号化するために使用されるコーディングモードにさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項１１に記載の装置。
前記コーディングモードにさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
ビデオデータの前記ブロックをコーディングするために使用される前記コーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項１５に記載の装置。
前記１つまたは複数のプロセッサは、
イントラ予測方向にさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を復号するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項１１に記載の装置。
前記１つまたは複数のプロセッサは、
前記変換係数についての前記符号予測仮説を決定することと、
前記符号予測仮説と前記符号予測シンタックス要素とに基づいて前記変換係数の符号を決定することと、
前記変換係数の前記符号に基づいてビデオデータの前記ブロックを復号することと、
を行うようにさらに構成された、請求項１１に記載の装置。
前記変換係数についての前記符号予測仮説を決定するために、前記１つまたは複数のプロセッサは、
組み合わせられたテンプレート値を含むコスト関数を最小化すること、
を行うようにさらに構成された、請求項１８に記載の装置。
ビデオデータの前記ブロックを含むピクチャを表示するように構成されたディスプレイ、
をさらに備える、請求項１８に記載の装置。
前記装置はワイヤレス通信デバイスである、請求項１１に記載の装置。
ビデオデータを符号化するように構成された装置であって、
ビデオデータのブロックを記憶するように構成されたメモリと、
回路中に実装され、前記メモリと通信している１つまたは複数のプロセッサと、
を備え、前記１つまたは複数のプロセッサは、
ビデオデータの前記ブロック中の変換係数の位置に基づいて、前記変換係数についての符号予測シンタックス要素を符号化するためのコンテキストを決定することと、ここにおいて、前記符号予測シンタックス要素は、前記変換係数について符号予測仮説が正しいかどうかを示す、
前記コンテキストを使用して前記符号予測シンタックス要素を符号化することと、
を行うように構成された、装置。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を符号化するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
前記変換係数がＤＣ係数であるかどうかに基づいて、前記変換係数についての前記符号予測シンタックス要素を符号化するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項２２に記載の装置。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を符号化するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
前記変換係数がＤＣ係数であることに基づいて、前記符号予測シンタックス要素を符号化するための第１のコンテキストを決定することと、
前記変換係数が前記ＤＣ係数でないことに基づいて、前記符号予測シンタックス要素を符号化するための第２のコンテキストを決定することと、
を行うようにさらに構成された、請求項２２に記載の装置。
ビデオデータの前記ブロック中の前記変換係数の前記位置に基づいて、前記変換係数についての前記符号予測シンタックス要素を符号化するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
ビデオデータの前記ブロック中の符号予測順序に基づいて、前記符号予測シンタックス要素を符号化するための前記コンテキストを決定することを行うようにさらに構成され、
ビデオデータの前記ブロック中の前記変換係数の前記位置は、前記符号予測順序に基づき、
前記符号予測順序は、前記ブロック内の走査順序である、
請求項２２に記載の装置。
前記１つまたは複数のプロセッサは、
前記ブロックを符号化するために使用されるコーディングモードにさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を符号化するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項２２に記載の装置。
前記コーディングモードにさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を符号化するための前記コンテキストを決定するために、前記１つまたは複数のプロセッサは、
ビデオデータの前記ブロックをコーディングするために使用される前記コーディングモードがインター予測コーディングモードであるのかイントラ予測コーディングモードであるのかにさらに基づいて、前記符号予測シンタックス要素を符号化するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項２６に記載の装置。
前記１つまたは複数のプロセッサは、
イントラ予測方向にさらに基づいて、前記変換係数についての前記符号予測シンタックス要素を符号化するための前記コンテキストを決定すること、
を行うようにさらに構成された、請求項２２に記載の装置。
前記１つまたは複数のプロセッサは、
前記変換係数の符号を決定することと、
前記変換係数についての前記符号予測仮説を決定することと、
を行うようにさらに構成され、
前記符号予測シンタックス要素を符号化するために、前記１つまたは複数のプロセッサは、前記変換係数の前記符号と前記符号予測仮説とに基づいて、前記コンテキストを使用して前記符号予測シンタックス要素を符号化することを行うように構成された、
請求項２２に記載の装置。
前記変換係数についての前記符号予測仮説を決定するために、前記１つまたは複数のプロセッサは、
組み合わせられたテンプレート値を含むコスト関数を最小化すること、
を行うようにさらに構成された、請求項２９に記載の装置。
ビデオデータの前記ブロックを含むピクチャをキャプチャするように構成されたカメラ、
をさらに備える、請求項２９に記載の装置。
前記装置はワイヤレス通信デバイスである、請求項２２に記載の装置。