JP7451655B2

JP7451655B2 - ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Info

Publication number: JP7451655B2
Application number: JP2022184990A
Authority: JP
Inventors: ステゲマン・ヤン; キルヒホッファー・ハイナー; マルペ・デトレフ; シュワルツ・ハイコー; ヴィーガンド・トーマス
Original assignee: フラウンホーファー－ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2018-03-29
Filing date: 2022-11-18
Publication date: 2024-03-18
Anticipated expiration: 2039-03-29
Also published as: KR20200128754A; EP3777197A1; TW201943274A; JP2023018041A; KR102617187B1; KR102523750B1; KR20240005114A; JP7181941B2; US12058352B2; US20210014512A1; CN112313960B; US20240348805A1; TWI799785B; TWI721396B; KR20230057474A; JP2024063203A; CN112313960A; TW202143728A; JP2021518716A; CN118678105A

Description

本発明による実施形態は、ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリームに関する。

本発明による一実施形態は、バイナリ算術符号化の確率推定方法に関し、これはたとえば、ビデオエンコーダ、ビデオデコーダ、さらに画像エンコーダ、画像デコーダ、オーディオエンコーダ、オーディオデコーダなどでも使用され得る。

算術符号化および復号化は、オーディオおよびビデオコンテンツの符号化および復号化における貴重なツールであることが証明されている。たとえば、符号化効率を高めるために、ビデオまたはオーディオコンテンツを表すバイナリシーケンス内のバイナリ値の既知の発生確率を利用することが可能である。特に、算術符号化は、「０」および「１」の様々な確率を効率的に処理することができ、確率の変化に正確に適応することができる。

しかしながら、算術符号化および復号化を最適な符号化効率で実現するためには、実際の発生確率をよく反映する「０」および「１」の確率に関する適切な情報を入手することが重要である。「０」および「１」の確率に関する（または一般に、符号化すべきシンボルの確率に関する）知識は通常、（たとえば、全範囲の値が、異なるバイナリ値またはバイナリ値のグループに関連付けられた間隔に細分化されるように）間隔サブディビジョンを取得するために、値の全範囲内の間隔の境界を調整するために使用される。

したがって、計算効率と信頼性との間の適切なトレードオフを提供する、ソース統計値、または間隔サブディビジョンの範囲値を決定するための概念が必要とされている。

本発明による一実施形態はビデオデコーダを作成し、ビデオデコーダは、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を復号化するように構成されている。

ビデオデコーダは、１つ以上のスライスのセット（複数のスライスが好ましい）に細分化されたビデオフレームを復号化するように構成されており、ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に復号化されたフレーム）の１ブロック（たとえば、１つのみのブロック）のピクセルに基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に復号化されたフレーム）の２つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（たとえば「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を評価するように構成されている。ビデオデコーダは、バイナリシーケンスの符号化表現に基づいて（たとえば、画像コンテンツの変換係数を記述する）復号化バイナリシーケンスを提供するための算術デコーダを含む。算術デコーダは、前に復号化されたバイナリシーケンスに基づいて、（たとえばウィンドウサイズ変数で表され得る）第１ウィンドウサイズ（たとえばｗ_ａ）を使用して、（たとえば、前に復号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づく）（そしてたとえば、「カウンタ変数」または「カウンタ」としても指定される）第１ソース統計値（たとえばａ_ｔ）を決定するように、そしてたとえば前に復号化されたバイナリシーケンスに基づいて、第２ウィンドウサイズ（たとえばｗ_ｂ）を使用して、（前に復号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づく）第２ソース統計値（たとえばｂ_ｔ）を決定するように、構成されている。算術デコーダは、たとえば、第１ソース統計値（たとえばａ_ｔ）に基づいて、および第２ソース統計値（たとえばｂ_ｔ）に基づいて、結合ソース統計値（たとえば

またはｐ_ｔ）を決定するように構成されている。算術デコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するように構成されている。

ビデオデコーダの好適な実施形態では、算術デコーダは、スライスタイプ情報に応じて、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている（たとえば、異なる値を取るようになっており、第１ウィンドウサイズおよび第２ウィンドウサイズはたとえば、１および１１を含む、１から１１までの範囲内にあってもよい）。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、ビットストリームに含まれる初期化パラメータまたはフラグ（たとえば、「ｃａｂａｃｉｎｉｔｆｌａｇ」）にも応じて（たとえばスライスあたり１つの初期化フラグ）、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されており、初期化フラグは、任意選択的に、第１ソース統計値および／または第２ソース統計値の初期化値も定義し得る。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、コンテキストモデルにも応じて（たとえばどのタイプの情報が復号化されるか、たとえば変換係数の１つ以上の最上位ビットまたは変換係数の１つ以上の下位ビットのどちらが復号化されるかに応じて）、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている。たとえば、第１ウィンドウサイズおよび第２ウィンドウサイズを定義するウィンドウサイズ値のペアは、スライスタイプ、初期化フラグ、およびコンテキストモデルの組み合わせごとに事前定義され得る。

好適な実施形態では、ビデオデコーダは、第１ソース統計値の更新バージョン（ａ_ｔ＋１）を取得するために、前に復号化されたバイナリ値（たとえばｘ_ｔ））に応じて第１ソース統計値のあらかじめ計算されたインスタンス（たとえばａ_ｔ）に所定の値（たとえば

）を選択的に加算し、第１ソース統計値（たとえば

）のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。あるいは、または追加で、ビデオデコーダは、第２ソース統計値の更新バージョン（たとえばｂ_ｔ＋１）を取得するために、前に復号化されたバイナリ値（たとえばｘ_ｔ））に応じて第２ソース統計値のあらかじめ計算されたインスタンス（たとえばｂ_ｔ）に所定の値（たとえば

）を選択的に加算し、第２ソース統計値（たとえば

）のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。

好適な実施形態では、ビデオデコーダは、以下にしたがって第１ソース統計値の更新バージョンａ_ｔ＋１を取得するように構成されており、

ここで、ａ_ｔは第１ソース統計値のあらかじめ計算されたバージョン、ｘ_ｔは前に復号化されたバイナリ値（たとえば０または１の値を取るバイナリシンボル）、ｎ_ａはウィンドウサイズ情報（たとえば整数を有する）であり、

ここで、ＢＩＴＳａは第１ソース統計値を表すために使用されるビット数、ｋ_ａは所定の数（たとえば整数、たとえば０または１）である。

あるいは、または追加で、ビデオデコーダは、以下にしたがって第２ソース統計値の更新バージョンｂ_ｔ＋１を取得するように構成されており、

ここで、ｂ_ｔは第２ソース統計値のあらかじめ計算されたバージョン、ｘ_ｔは前に復号化されたシンボル（たとえば０または１の値を取るバイナリシンボル）、ｎ_ｂはウィンドウサイズ情報（たとえば整数を有する）であり、ここで

ここで、ＢＩＴＳ_ｂは第２ソース統計値を表すために使用されるビット数、ｋ_ｂは所定の数（たとえば整数、たとえば０または１）である。

好適な実施形態では、ｋ_ａ＝１および／またはｋ_ｂ＝１である。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第１ソース統計値ａ_ｔ＋１を決定するように構成されており、

および

ここで、ａ_ｔはあらかじめ計算されたソース統計値、ｘ_ｔは前に復号化されたバイナリ値、ＢＩＴＳ_ａは第１ソース統計値に割り当てられたビット数であり、ｎ_ａは第１ウィンドウサイズｗ_ａを表し、

であり、そして「＞＞」は右シフト演算子であり、および／またはビデオデコーダは、以下にしたがって第２ソース統計値ｂ_ｔ＋１を決定するように構成されており、

および

ここで、ｂ_ｔはあらかじめ計算されたソース統計値、ｘ_ｔは前に復号化されたバイナリ値、ＢＩＴＳ_ｂは第１ソース統計値に割り当てられたビット数であり、ｎ_ｂは第２ウィンドウサイズｗ_ｂを表し、

である。

なお、第１および第２ソース統計値の更新は、パラメータＢＩＴＳ_ａ／ｂおよびｎ_ａ／ｂのみが異なることに留意されたい。この好適な実施形態の終わりまで、ａ_ｔおよびｂ_ｔの両方の更新手順について論じるために、ａおよびａ_ｔが使用される。ｂ_ｔの更新手順を生み出すには、以下の式で、すべての出現箇所を単純にｂに置き換える必要がある。

更新手順は、以下のように記述し直すことができる。

および

これは、上記の元の更新式とまったく同じ結果を生じる。上記２つの更新式の最初の式は、以下のように記述し直すことができる。

ここで、

なお、ＯＮＥ_ａは、１に等しい確率値を表すことに留意されたい。効率的な実装のために、ＯＮＥ_ａを量子化またはわずかに変更することが合理的であろう（たとえば、少量を加算または減算することによる）。これは、ソース統計値の挙動に対して実質的に影響を与えない。たとえば、

を使用すると、ＯＮＥ_ａのバイナリ表現は、元のバージョンよりも１ビット少なくなければならない。しかしながら、ソース統計値の更新の挙動は実質的に変更されない。

好適な実施形態では、ビデオデコーダは、以下にしたがって第１ソース統計値ａ_ｔ＋１を決定するように構成されており、

、そして＞＞は右シフト演算子である。

あるいは、または追加で、ビデオデコーダは、以下にしたがって第２ソース統計値ｂ_ｔ＋１を決定するように構成されており、

である。

、そして「＞＞」は右シフト演算子である。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、結合ソース統計値を取得するために、第１ソース統計値および第２ソース統計値を組み合わせるように構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって結合ソース統計値

を取得するように構成されており、

ここで、ａ_ｔは第１ソース統計値、ｂ_ｔは第２ソース統計値である。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、結合ソース統計値を取得するために、第１ソース統計値および第２ソース統計値を組み合わせるように構成されており、異なる重みが第１ソース統計値および第２ソース統計値に関連付けられる（任意選択的に、ビデオデコーダは、復号化プロセス中に重みを変更するように構成される）。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、第１ソース統計値（たとえばａ_ｔ）および第２ソース統計値（たとえばｂ_ｔ）の表現のために異なるビット数（たとえばＢＩＴＳ_ａ、ＢＩＴＳ_ｂ）を使用するように構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、第１ソース統計値（たとえばａ_ｔ）および第２ソース統計値（たとえばｂ_ｔ）のために異なるウィンドウサイズを使用するように構成されており、ビデオデコーダは、比較的大きいウィンドウサイズを有するソース統計値の表現には比較的大きいビット数を使用し、比較的小さいウィンドウサイズを有するソース統計値の表現には比較的小さいビット数を使用するように構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第１ソース統計値ａ_ｔおよび／または第２ソース統計値ｂ_ｔの数表現を修正するように構成されており、

および／または

その後結合ソース統計値を決定し、ここで

ここでＢＩＴＳ_ａは第１ソース統計値の表現に割り当てられたビット数、ＢＩＴＳ_ｂは第２ソース統計値の表現に割り当てられたビット数である。

を決定するように構成されており、

そしてビデオデコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値ｐＳｔａｔｅＩｄｘを導出するように構成されており、

ここで、最確（たとえばバイナリ）値の値は以下にしたがって決定され、

ここで、ＢＩＴＳ_{ｔａｂＲｅｓ}は、表のエントリ数（または表のエントリ間の、バイナリ値の頻度に関する間隔）を記述する。表は、たとえば、０から０．５までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。

を決定するように構成されており、

ここで、ＢＩＴＳ_{ｔａｂＲｅｓ}は、表のエントリ数（または表のエントリ間の、バイナリ値の頻度に関する間隔）を記述する。表は、たとえば、０から１までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、第１ウィンドウサイズに応じて、および第２ウィンドウサイズに応じて、第１ソース統計値（たとえばａ_ｔ）および第２ソース統計値の表現のビット数（たとえばＢＩＴＳ_ａ、ＢＩＴＳ_ｂ）を選択するように構成されている（たとえば、

にしたがって、ここで

またはｎ_ａ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ａ）、ｒｏｕｎｄ（）は切り上げまたは切り捨て演算子、および／または

にしたがって、ここで

またはｎ_ｂ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ｂ）、ＴｈｒＨｄは所定の好ましい固定値）。

ビデオデコーダの好適な実施形態では、第１ソース統計値（ａ_ｔ）および第２ソース統計値（ｂ_ｔ）の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である（または第１ソース統計値の表現に使用されるビット数の変形例の場合は独立している）。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、ビットストリームに含まれる（たとえば専用の）初期化フラグ（たとえば、「ｗｓ＿ｆｌａｇ」）にも応じて、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されており、ビデオデコーダは、ビットストリームに含まれる別の初期化フラグ（たとえば、「ｃａｂａｃｉｎｉｔｆｌａｇ」）に応じて、第１ソース統計値および／または第２ソース統計値の初期化値を設定するように構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダまたは算術デコーダは、現在のスライスの時間レベルにも応じて、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている。あるいは、または追加で、ビデオデコーダまたは算術デコーダは、現在のスライスの量子化パラメータにも応じて、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、位置に応じて第１ウィンドウサイズおよび／または第２ウィンドウサイズを調整するように構成されている（たとえば、いくつのバイナリ値が現在のスライス内で既に復号化されたかに応じて、またはコンテキストの初期化以降、第１ウィンドウサイズおよび／または第２ウィンドウサイズが関連付けられているコンテキストモデルを使用して、または復号化されるバイナリ値が関連付けられているフレーム内のピクセルまたはピクセルのブロックの位置に応じて）。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、開始位置（たとえばピクセルのブロックの最初の行、またはピクセルのブロックの最初の列）に関連付けられたバイナリ値を復号化するときに第１ウィンドウサイズおよび／または第２ウィンドウサイズを開始値（好ましくは通常値よりも小さい）に設定し、少なくとも所定の位置（または距離）だけ開始位置から離れた位置に関連付けられたバイナリ値を復号化するときに第１ウィンドウサイズおよび／または第２ウィンドウサイズを通常値（好ましくは開始値よりも大きい）に設定するように、構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、ウィンドウサイズを変更すべきであることを通知する信号フラグ（たとえば「ｃｔｕ＿ｗｓ＿ｆｌａｇ」フラグ）に応答して、スライス内の第１ウィンドウサイズおよび／または第２ウィンドウサイズを変更するように構成されている（たとえば、スライスを復号化するとき）。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、複数の符号化ツリーユニット（またはすべての符号化ツリーユニットでもよい）について、ウィンドウサイズを変更すべきかどうかを示す信号フラグを評価し、信号フラグに応じてウィンドウサイズの少なくとも１つを拡大または縮小するように（たとえば、ウィンドウサイズの最大範囲を超えないように気をつけながら、信号フラグに応じて１つだけ、異なるコンテキストモデルであってもすべてのウィンドウサイズをまとめて拡大または縮小するように）、構成されている。代替例として、いくつかのコンテキストモデルのウィンドウサイズのみを拡大または縮小することも可能である。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、たとえば式（８）または式（１２）または式（１４）にしたがって、結合ソース統計値（たとえば

またはｐ_ｔ）から状態インデックス（たとえばｐＳｔａｔｅＩｄｘ）を導出するように構成されている。あるいは、または追加で、ビデオデコーダは、たとえば式（９）または式（１３にしたがって、最確バイナリ値または最低確率バイナリ値を表す値（たとえばｖａｌＭＰＳ）を導出するように構成されている。また、ビデオデコーダは、間隔サブディビジョンの１つ以上の範囲値に状態インデックスをマッピングするテーブルを評価するように構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、第２ソース統計値を一定の置換値で一時的に（たとえば、初期化の直後のみならず、バイナリシーケンスの複数のバイナリ値の復号化のために）置き換え、結合ソース統計値を取得するために第１ソース統計値（たとえばａ_ｔ）を固定の非ゼロ置換値と組み合わせるように、構成されている。

ビデオデコーダの好適な実施形態では、ビデオデコーダは、第１ウィンドウサイズｗ_ａおよび第２ウィンドウサイズｗ_ｂを以下のように選択するように構成される。

ｎ_ａ＝ｎ_ｂまたは
｜ｎ_ａ－ｎ_ｂ｜≧３
ここで、

またはｎ_ａ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ａ）、ｒｏｕｎｄ（）は切り上げまたは切り捨て演算子、

またはｎ_ｂ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ｂ）である。

好適な実施形態では、ビデオデコーダは、第１ウィンドウサイズｗ_ａおよび第２ウィンドウサイズｗ_ｂを以下のように選択するように構成される。

｜ｎ_ａ－ｎ_ｂ｜≧３
ここで、

またはｎ_ｂ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ｂ）である。

本発明による別の実施形態はビデオデコーダを作成し、ビデオデコーダは、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を復号化するように構成されており、ビデオデコーダは、１つ以上のスライスのセット（複数のスライスが好ましい）に細分化されたビデオフレームを復号化するように構成されている。ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に復号化されたフレーム）の１ブロックのピクセル（たとえば、１つのみのブロックのピクセル）に基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に復号化されたフレーム）の２つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を評価するように構成されている。ビデオデコーダは、バイナリシーケンスの符号化表現に基づいて（たとえば、画像コンテンツの変換係数を記述する）復号化バイナリシーケンスを提供するための算術デコーダを含む。算術デコーダは、たとえば、ウィンドウサイズ変数で表され得る、第１ウィンドウサイズ（たとえばｗ_ａ）を使用して、第１ソース統計値（たとえば、ａ_ｔ）（前に復号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよく、「カウンタ変数」または「カウンタ」としても指定され得る）を決定するように構成されている。算術デコーダは、たとえば、前に復号化されたバイナリシーケンスに基づいて第１ソース統計値を決定してもよい。算術デコーダは、結合ソース統計値（たとえば、

またはｐ_ｔ）を決定するように構成されており、算術デコーダは、結合ソース統計値を取得するために、第１ソース統計値（たとえば、ａ_ｔ）を固定の非ゼロ値と組み合わせるように構成されており、算術デコーダは、間隔サブディビジョンの１つ以上の範囲値を決定するように構成されており、算術デコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するように構成されている。

この実施形態は、個別におよび組み合わせて、先に論じられた実施形態に関して述べられた特徴、機能、および詳細のいずれかによって補足され得る。

本発明による一実施形態はビデオエンコーダを作成し、ビデオエンコーダは、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を符号化するように構成されており、
ビデオエンコーダは、１つ以上のスライスのセット（好ましくは複数のスライス）に細分化されたビデオフレームを符号化するように構成されている。ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に符号化されたフレーム）の１ブロックのピクセル（たとえば、１つのみのブロックのピクセル）に基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に符号化されたフレーム）の２つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（たとえば「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を提供するように構成されている。ビデオエンコーダは、バイナリシーケンスに基づいて（たとえば、画像コンテンツの変換係数を記述する）バイナリシーケンスの符号化表現を提供するための算術エンコーダを含む（バイナリシーケンスは、変換係数またはスペクトル係数、またはパラメータ、またはその他いずれかの情報、たとえば符号化されるビデオコンテンツのフレームのコンテンツを表す情報を表し得る）。算術エンコーダは、たとえばウィンドウサイズ変数で表され得る第１ウィンドウサイズ（たとえば、ｗ_ａ）を使用して、第１ソース統計値（ａ_ｔ）を決定するように構成されており、これはたとえば、前に符号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」としても指定され得る。ビデオエンコーダは、たとえば、前に符号化されたバイナリシーケンスに基づいて第１ソース統計値を決定し得る。算術エンコーダまたはビデオエンコーダは、第２ウィンドウサイズ（たとえば、ｗ_ｂ）を使用して、たとえば前に符号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよい、第２ソース統計値（たとえば、ｂ_ｔ）を決定するように構成され得る。算術エンコーダまたはビデオエンコーダは、たとえば前に符号化されたバイナリシーケンスに基づいて、第２ソース統計値を決定するように構成され得る。算術エンコーダは、第１ソース統計値（たとえば、ａ_ｔ）に基づいて、および第２ソース統計値（たとえば、ｂ_）に基づいて、結合ソース統計値（たとえば、

またはｐ_ｔ）を決定するように構成されており、算術エンコーダは、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するように構成されている。

好適な実施形態では、ビデオエンコーダ（または同等に、算術エンコーダ）は、スライスタイプ情報に応じて、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている（たとえば、第１ウィンドウサイズおよび第２ウィンドウサイズはたとえば、１および１１を含む、１から１１までの範囲内にあってもよい、２つの異なる値）。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、初期化パラメータまたはフラグ（たとえば、「ｃａｂａｃｉｎｉｔｆｌａｇ」フラグ）を提供するように構成されており、ビデオエンコーダは、ビデオエンコーダによってビットストリーム（たとえば、ビデオフレームを表すビットストリーム）に含まれる初期化パラメータまたはフラグ（たとえば、「ｃａｂａｃｉｎｉｔｆｌａｇ」）にも応じて第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている。たとえば、ビデオエンコーダは、スライスあたり１つの初期化フラグを提供し、初期化フラグは、任意選択的に、第１ソース統計値および／または第２ソース統計値の初期化値も定義し得る。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、コンテキストモデルにも応じて（たとえばどのタイプの情報が符号化されるか、たとえば変換係数の１つ以上の最上位ビットまたは変換係数の１つ以上の下位ビットのどちらが符号化されるかに応じて）、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている。たとえば、第１ウィンドウサイズおよび第２ウィンドウサイズを定義するウィンドウサイズ値のペアは、スライスタイプ、初期化フラグ、およびコンテキストモデルの組み合わせごとに事前定義され得る。

好適な実施形態では、ビデオエンコーダは、第１ソース統計値の更新バージョン（ａ_ｔ＋１）を取得するために、前に符号化されたバイナリ値（たとえばｘ_ｔ））に応じて第１ソース統計値のあらかじめ計算されたインスタンス（たとえばａ_ｔ）に所定の値（たとえば

）を選択的に加算し、第１ソース統計値（たとえば

）のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。あるいは、または追加で、ビデオエンコーダは、第２ソース統計値の更新バージョン（たとえばｂ_ｔ＋１）を取得するために、前に符号化されたバイナリ値（たとえばｘ_ｔ））に応じて第２ソース統計値のあらかじめ計算されたインスタンス（たとえばｂ_ｔ）に所定の値（たとえば

）を選択的に加算し、第２ソース統計値（たとえば

好適な実施形態では、ビデオエンコーダは、以下にしたがって第１ソース統計値の更新バージョンａ_ｔ＋１を取得するように構成されており、

ここで、ａ_ｔは第１ソース統計値のあらかじめ計算されたソース統計値バージョン、ｘ_ｔは前に符号化されたバイナリ値（たとえば０または１の値を取るバイナリシンボル）、ｎ_ａはウィンドウサイズ情報（たとえば整数を有する）であり、

あるいは、または追加で、ビデオエンコーダは、以下にしたがって第２ソース統計値の更新バージョンｂ_ｔ＋１を取得するように構成されており、

ここで、ｂ_ｔは第２ソース統計値のあらかじめ計算されたバージョン、ｘ_ｔは前に符号化されたシンボル（たとえば０または１の値を取るバイナリシンボル）、ｎ_ｂはウィンドウサイズ情報（たとえば整数を有する）であり、ここで

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、（たとえば、値ｘ_ｔ＋１の符号化のため）以下にしたがって第１ソース統計値ａ_ｔ＋１を決定するように構成されており、

および

ここで、ａ_ｔはあらかじめ計算されたソース統計値、ｘ_ｔは前に符号化されたバイナリ値、ＢＩＴＳ_ａは第１ソース統計値に割り当てられたビット数であり、ｎ_ａは第１ウィンドウサイズｗ_ａを表し、

、そして「＞＞」は右シフト演算子である。

あるいは、または追加で、ビデオエンコーダは、以下にしたがって第２ソース統計値ｂ_ｔ＋１を決定するように構成されてもよく、

および

ここで、ｂ_ｔはあらかじめ計算されたソース統計値、ｘ_ｔは前に符号化されたバイナリ値、ＢＩＴＳ_ｂは第１ソース統計値に割り当てられたビット数であり、ｎ_ｂは第２ウィンドウサイズｗ_ｂを表し、

である。

好適な実施形態では、ビデオエンコーダは、以下にしたがって第１ソース統計値ａ_ｔ＋１を決定するように構成されており、

、そして＞＞は右シフト演算子である。

あるいは、または追加で、ビデオエンコーダは、以下にしたがって第２ソース統計値ｂ_ｔ＋１を決定するように構成されており、

である。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって第１ソース統計値ａ_ｔ＋１を決定するように構成されており、

、そして「＞＞」は右シフト演算子である。

ここで、_ｂｔはあらかじめ計算されたソース統計値、ｘ_ｔは前に符号化されたバイナリ値、ＢＩＴＳ_ｂは第１ソース統計値に割り当てられたビット数であり、ｎ_ｂは第２ウィンドウサイズｗ_ｂを表し、

、そして「＞＞」は右シフト演算子である。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、結合ソース統計値を取得するために、第１ソース統計値および第２ソース統計値を組み合わせるように構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって結合ソース統計値

を取得するように構成されており、

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、結合ソース統計値を取得するために、第１ソース統計値および第２ソース統計値を組み合わせるように構成されており、異なる重みが第１ソース統計値および第２ソース統計値に関連付けられる。任意選択的に、ビデオエンコーダは、符号化プロセス中に重みを変更するように構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第１ソース統計値（たとえばａ_ｔ）および第２ソース統計値（たとえばｂ_ｔ）の表現のために異なるビット数（たとえばＢＩＴＳ_ａ、ＢＩＴＳ_ｂ）を使用するように構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第１ソース統計値（たとえばａ_ｔ）および第２ソース統計値（たとえばｂ_ｔ）のために異なるウィンドウサイズを使用するように構成されており、ビデオエンコーダは、比較的大きいウィンドウサイズを有するソース統計値の表現には比較的大きいビット数を使用し、比較的小さいウィンドウサイズを有するソース統計値の表現には比較的小さいビット数を使用するように構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって第１ソース統計値ａ_ｔおよび／または第２ソース統計値ｂ_ｔの数表現を修正するように構成されており、

および／または

その後結合ソース統計値を決定し、ここで

、そして
ここでＢＩＴＳａは第１ソース統計値の表現に割り当てられたビット数、ＢＩＴＳｂは第２ソース統計値の表現に割り当てられたビット数である。

を決定するように構成されており、

そしてビデオエンコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値ｐＳｔａｔｅＩｄｘを導出するように構成されており、

を決定するように構成されており、

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第１ウィンドウサイズに応じて、および第２ウィンドウサイズに応じて、第１ソース統計値（たとえばａ_ｔ）および第２ソース統計値の表現のビット数（たとえばＢＩＴＳ_ａ、ＢＩＴＳ_ｂ）を選択するように構成されている（たとえば、

にしたがって、ここで

またはｎ_ａ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ａ）、ｒｏｕｎｄ（）は切り上げまたは切り捨て演算子、または

にしたがって、ここで

ビデオエンコーダの好適な実施形態では、第１ソース統計値（たとえば、ａ_ｔ）および第２ソース統計値（たとえば、ｂ_ｔ）の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である（または第１ソース統計値の表現に使用されるビット数の変形例の場合は独立している）。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、（スライスタイプのように、可能であれば他の構成情報に加えて）第１ウィンドウサイズおよび第２ウィンドウサイズを決定する初期化フラグ（たとえば、「ｗｓ＿ｆｌａｇ」またはウィンドウサイズフラグ）をビットストリームに含めるように構成されており、ビデオエンコーダは、第１ソース統計値および／または第２ソース統計値を決定する他の初期化パラメータまたはフラグ（たとえば、「ｃａｂａｃｉｎｉｔｆｌａｇ」）をビットストリームに含めるように構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、現在のスライスの時間レベルにも応じて、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている。あるいは、または追加で、ビデオエンコーダは、現在のスライスの量子化パラメータにも応じて、第１ウィンドウサイズおよび第２ウィンドウサイズを決定するように構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、位置に応じて第１ウィンドウサイズおよび／または第２ウィンドウサイズを調整するように構成されている（たとえば、いくつのバイナリ値が現在のスライス内で既に符号化されたかに応じて、またはコンテキストの初期化以降、第１ウィンドウサイズおよび／または第２ウィンドウサイズが関連付けられているコンテキストモデルを使用して、または符号化されるバイナリ値が関連付けられているフレーム内のピクセルまたはピクセルのブロックの位置に応じて）。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、開始位置（たとえばピクセルのブロックの最初の行、またはピクセルのブロックの最初の列）に関連付けられたバイナリ値を復号化するときに第１ウィンドウサイズおよび／または第２ウィンドウサイズを開始値（好ましくは通常値よりも小さい）に設定し、少なくとも所定の位置だけ開始位置から離れた位置に関連付けられたバイナリ値を符号化するときに第１ウィンドウサイズおよび／または第２ウィンドウサイズを通常値（好ましくは開始値よりも大きい）に設定するように、構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、スライス内でウィンドウサイズを変更すべきであることを通知する信号フラグ（たとえば「ｃｔｕ＿ｗｓ＿ｆｌａｇ」またはウィンドウサイズ変更信号フラグ）をビットストリームに含めるように構成されている。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、ビットストリームに、複数の符号化ツリーユニット（またはすべての符号化ツリーユニットでもよい）について、ウィンドウサイズを変更すべきかどうかを示す信号フラグを含めるように構成されており、信号フラグは、ウィンドウサイズの少なくとも１つを拡大すべきか縮小すべきかを示す（たとえば、ウィンドウサイズの最大範囲を超えないように気をつけながら、信号フラグに応じて１つだけ、異なるコンテキストモデルであってもすべてのウィンドウサイズをまとめて拡大または縮小する）。代替例として、ビデオエンコーダは、いくつかのコンテキストモデルのウィンドウサイズのみを拡大または縮小してもよい。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、たとえば式（８）または式（１２）または式（１４）にしたがって、結合ソース統計値（たとえば

またはｐ_ｔ）から状態インデックス（たとえばｐＳｔａｔｅＩｄｘ）を導出するように構成されている。あるいは、または追加で、ビデオエンコーダは、たとえば式（９）または式（１３）にしたがって、最確バイナリ値または最低確率バイナリ値を表す値（たとえばｖａｌＭＰＳ）を導出するように構成されてもよい。ビデオエンコーダはまた、間隔サブディビジョンの１つ以上の範囲値に状態インデックスをマッピングするテーブルを評価するように構成されてもよい。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第２ソース統計値を一定の置換値で一時的に（たとえば、初期化の直後のみならず、バイナリシーケンスの複数のバイナリ値の符号化のために）置き換え、結合ソース統計値を取得するために第１ソース統計値（たとえばａ_ｔ）を固定の非ゼロ置換値と組み合わせるように、構成されてもよい。

ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第１ウィンドウサイズｗ_ａおよび第２ウィンドウサイズｗ_ｂを以下のように選択するように構成される。

ｎ_ａ＝ｎ_ｂまたは
｜ｎ_ａ－ｎ_ｂ｜≧３
ここで、

またはｎ_ｂ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ｂ）である。

好適な実施形態では、ビデオエンコーダは、第１ウィンドウサイズｗ_ａおよび第２ウィンドウサイズｗ_ｂを以下のように選択するように構成される。

｜ｎ_ａ－ｎ_ｂ｜≧３
ここで、

またはｎ_ｂ＝ｒｏｕｎｄ（ｌｏｇ_２ｗ_ｂ）である。

本発明による一実施形態はビデオエンコーダを作成し、ビデオエンコーダは、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を符号化するように構成されており、
ビデオエンコーダは、１つ以上のスライスのセット（複数のスライスが好ましい）に細分化されたビデオフレームを符号化するように構成されている。ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に符号化されたフレーム）の１ブロックのピクセル（たとえば、１つのみのブロックのピクセル）に基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に符号化されたフレーム）の２つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（たとえば「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を提供するように構成されている。ビデオエンコーダは、バイナリシーケンスに基づいて、（たとえば、画像コンテンツの変換係数を記述する）バイナリシーケンスの符号化表現を提供するための算術エンコーダを含む（バイナリシーケンスは、スペクトル係数、パラメータ、またはその他いずれかの情報の変換係数を表す）。算術エンコーダは、たとえば、ウィンドウサイズ変数で表され得る、第１ウィンドウサイズ（たとえばｗ_ａ）を使用して、たとえば前に符号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよく、「カウンタ変数」またはカウンタとしても指定され得る、第１ソース統計値（たとえば、ａ_ｔ）を決定するように構成されている。算術エンコーダは、たとえば前に符号化されたバイナリシーケンスに基づいて、第１ソース統計値を決定するように構成され得る。算術エンコーダは、結合ソース統計値（たとえば、

またはｐ_ｔ）を決定するように構成されており、算術エンコーダは、結合ソース統計値を取得するために、第１ソース統計値（たとえば、ａｔ）を固定の非ゼロ値と組み合わせるように構成されており、算術エンコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現にバイナリシーケンスをマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するように構成されている。

実施形態は、任意選択的に、個別におよび組み合わせて、先に記載された実施形態の特徴、機能、および詳細のいずれかによって補足することができる。

本発明による一実施形態は、ビデオコンテンツを復号化する方法を作成し、方法は、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を復号化するステップを含み、方法は、１つ以上のスライスのセット（複数のスライスが好ましい）に細分化されたビデオフレームを復号化するステップを含む。方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に復号化されたフレーム）の１ブロック（または１つのみのブロック）のピクセルに基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に復号化されたフレーム）の２つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（たとえば「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を評価するステップを含む。方法は、バイナリシーケンスの符号化表現に基づいて［たとえば、画像コンテンツの変換係数を記述する］復号化バイナリシーケンスを提供するステップを含み、方法は、たとえば、ウィンドウサイズ変数で表され得る第１ウィンドウサイズ（たとえば、ｗ_ａ）を使用して、たとえば前に復号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」としても指定され得る、第１ソース統計値（たとえば、ａ_ｔ）を決定するステップを含む。第１ソース統計値は、たとえば、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第２ウィンドウサイズ（たとえば、ｗ_ｂ）を使用して、たとえば復号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよい、第２ソース統計値（たとえば、ｂ_ｔ）を決定するステップも含む。第２ソース統計値は、たとえば、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第１ソース統計値（たとえば、ａ_ｔ）に基づいて、および第２ソース統計値（たとえば、ｂ_ｔ）に基づいて、結合ソース統計値（たとえば

またはｐ_ｔ）を決定するステップも含む。方法はまた、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するステップも含む。

本発明による一実施形態は、ビデオコンテンツを復号化する方法を作成し、方法は、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を復号化するステップを含み、方法は、１つ以上のスライスのセット（複数のスライスが好ましい）に細分化されたビデオフレームを復号化するステップを含む。方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に復号化されたフレーム）の１ブロック（または１つのみのブロック）のピクセルに基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に復号化されたフレーム）の２つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（たとえば「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を評価するステップを含む。方法は、バイナリシーケンスの符号化表現に基づいて（たとえば、画像コンテンツの変換係数を記述する）復号化バイナリシーケンスを提供するステップを含む。方法は、たとえば、ウィンドウサイズ変数で表され得る第１ウィンドウサイズ（たとえば、ｗ_ａ）を使用して、たとえば前に復号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよく、「カウンタ変数」、「カウンタ」としても指定され得る、第１ソース統計値（たとえば、ａ_ｔ）を決定するステップを含む。たとえば、第１ソース統計値は、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法は、結合ソース統計値（たとえば、

またはｐ_ｔ）を決定するステップを含み、第１ソース統計値（たとえばａ_ｔ）は、結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられる。方法は、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するステップを、さらに含む。

一実施形態は、ビデオコンテンツを符号化する方法を作成し、方法は、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を符号化するステップを含み、方法は、１つ以上のスライスのセット（複数のスライスが好ましい）に細分化されたビデオフレームを符号化するステップを含む。方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に符号化されたフレーム）の１ブロックのピクセル（たとえば、１つのみのブロックのピクセル）に基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に符号化されたフレーム）の２つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（たとえば「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を提供するように構成されている。方法は、バイナリシーケンスに基づいて（たとえば、画像コンテンツの変換係数を記述する）バイナリシーケンスの符号化表現を提供するステップを含む（バイナリシーケンスは、変換係数またはスペクトル係数、パラメータ、またはその他いずれかの情報を表し得る）。

方法は、たとえば、ウィンドウサイズ変数で表され得る第１ウィンドウサイズ（たとえば、ｗ_ａ）を使用して、たとえば前に符号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」として指定され得る、第１ソース統計値（たとえば、ａ_ｔ）を決定するステップを含む。第１ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第２ウィンドウサイズ（たとえば、ｗ_ｂ）を使用して、たとえば符号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよい、第２ソース統計値（たとえば、ｂ_ｔ）を決定するステップも含む。第２ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法は、第１ソース統計値（たとえば、ａ_ｔ）に基づいて、および第２ソース統計値（たとえば、ｂ_ｔ）に基づいて、結合ソース統計値（たとえば、

またはｐ_ｔ）を決定するステップも含む。方法は、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するステップを含む。

一実施形態は、ビデオコンテンツを符号化する方法を作成し、方法は、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を符号化するステップを含み、方法は、１つ以上のスライスのセット（複数のスライスが好ましい）に細分化されたビデオフレームを符号化するステップを含む。方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード（たとえば「Ｉｎｔｒａ」）を使用して、または前のフレーム（たとえば前に符号化されたフレーム）の１ブロックのピクセル（たとえば、１つのみのブロックのピクセル）に基づくピクセルのブロックの予測がある、単一予測モード（たとえば「Ｐ」）を使用して、または１つ以上の前のフレーム（たとえば前に符号化されたフレーム）の２つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード（たとえば「Ｂ」）を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報（たとえば「ＳｌｉｃｅＴｙｐｅ」）を提供するように構成されている。方法は、バイナリシーケンスに基づいて（たとえば、画像コンテンツの変換係数を記述する）バイナリシーケンスの符号化表現を提供するステップを含む（バイナリシーケンスは、変換係数またはスペクトル係数、パラメータ、またはその他いずれかの情報を表し得る）。方法は、ウィンドウサイズ変数で表され得る第１ウィンドウサイズ（たとえば、ｗ_ａ）を使用して、たとえば前に符号化されたバイナリ値ｘ_ｔ－１，ｘ_ｔ－２，．．．の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」として指定され得る、第１ソース統計値（たとえば、ａ_ｔ）を決定するステップを含む。第１ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法は、結合ソース統計値（たとえば、

またはｐ_ｔ）を決定するステップを含み、第１ソース統計値（たとえばａ_ｔ）は、結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられる。方法は、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するステップを含む。

なお、本明細書に記載されるすべての方法は、個別におよび組み合わせて、対応する装置（たとえばビデオエンコーダおよびビデオデコーダ）に関して記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。また、装置は、方法と並行して適応され得る。言い換えると、装置、または機能ボックの説明は、方法または方法ステップの説明にも対応する。

本発明による別の実施形態は、コンピュータプログラムがコンピュータ上で実行されたときに本明細書に記載される方法の少なくとも１つを実行するための、コンピュータプログラムを作成する。

本発明による一実施形態は、ビデオコンテンツを表す、バイナリシーケンスの符号化表現と、バイナリシーケンスの符号化表現に基づいてビデオコンテンツを再構築するために使用されるビデオデコーダの構成を記述する構成情報とを含む、ビデオビットストリームを作成する。構成情報は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの１つ以上の範囲値を決定するために使用される、第１ソース統計値（たとえば、ａ_ｔ）を決定するためにビデオデコーダによって使用されるウィンドウサイズを記述する、ウィンドウサイズ情報（たとえば、「ｗｓ＿ｆｌａｇ」）を含み、１つ以上の範囲値は、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される。構成情報は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの１つ以上の範囲値を決定するために使用される、第２ソース統計値（たとえば、ｂ_ｔ）を決定するためにビデオデコーダによって使用されるウィンドウサイズを記述する、ウィンドウサイズ情報（たとえば、「ｗｓ＿ｆｌａｇ」）を含む。

ビデオストリームの好適な実施形態では、ビデオビットストリームはまた、第１ソース統計値および／または第２ソース統計値の初期化値を記述する、初期化値情報も含む。

ビデオストリームの好適な実施形態では、ビデオビットストリームは、ウィンドウサイズを（たとえば、スライス内で）増加または減少させるべきであることを示すウィンドウサイズ変更フラグ（たとえば、ｃｔｕ＿ｗｓ＿ｆｌａｇ）をさらに含む。

ビデオストリームは、個別におよび組み合わせて、本明細書に記載される特徴または詳細のいずれかによって補足することができる。

なお、「ウィンドウサイズ」、「第１ウィンドウサイズ」、および「第２ウィンドウサイズ」という用語は、本説明全体を通して使用されることに留意すべきである。しかしながら、ウィンドウサイズの代わりに、実施形態のいずれかにおいて、推定パラメータが任意選択的に使用され得ることに留意すべきである。第１ウィンドウサイズの代わりに、実施形態のいずれかにおいて、第１推定パラメータを任意選択的に使用することができる。第２ウィンドウサイズの代わりに、実施形態のいずれかにおいて、第２推定パラメータを任意選択的に使用することができる。

言い換えると、第１推定パラメータは第１ウィンドウサイズであり得、第２推定パラメータは第２ウィンドウサイズであり得る。

あるいは、第１推定パラメータは、第１ソース統計値が復号化バイナリシーケンス（またはエンコーダの場合、前に符号化されたバイナリ値）の復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第１慣性パラメータであってもよく、第２推定パラメータは代わりに、第２ソース統計値が復号化バイナリシーケンス（またはエンコーダの場合、前に符号化されたバイナリ値）の復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第２慣性パラメータであってもよい。

また、実施形態のいずれかにおいて、ソース統計値の異なる概念を任意選択的に使用することができる。

たとえば、ビデオデコーダは、テーブルルックアップを使用して第１ソース統計値を決定するように構成されてもよく、テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および第１推定パラメータに応じて選択される。あるいは、または追加で、ビデオデコーダは、テーブルルックアップを使用して第２ソース統計値を決定するように構成され、テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および第２推定パラメータに応じて選択される。

類似の概念はビデオエンコーダでも任意選択的に使用することができ、前に符号化されたバイナリ値は、前に復号化されたバイナリ値の役割を取り得る。

本発明による実施形態は、以下の添付図面を参照して、引き続き説明される。

本発明の一実施形態による、ビデオデコーダのブロック概略図である。本発明の別の実施形態による、ビデオデコーダのブロック概略図である。本発明の別の実施形態による、ビデオデコーダのブロック概略図である。本発明の一実施形態による、ビデオエンコーダのブロック概略図である。〔表１〕は、８ビット変数ｗｓ_ｐａｉｒのビットマスクの表現を示す。〔表２〕は、ｗｓ_ｐａｉｒ値の割り当てのグラフィック表現である。〔表３〕は、ｗｓ＿ｆｌａｇに依存するｗｓ_ｐａｉｒ値の割り当てのグラフィック表現である。本発明の一実施形態による、ビデオ復号化の方法のフローチャートである。本発明の一実施形態による、ビデオ符号化の方法のフローチャートである。本発明の一実施形態による、ビットストリームのグラフィック表現である。

１）図１による実施形態
図１は、本発明の一実施形態による、ビデオデコーダ１００のブロック概略図を示す。

ビデオデコーダ１００は、符号化ビデオ情報を受信し、これに基づいて、復号化ビデオ情報（または復号化ビデオコンテンツ）を提供するように構成されている。

符号化ビデオ情報１１０（ビデオビットストリームと見なされ得る）は、たとえば、スライスタイプ情報を含み得、バイナリシーケンスの符号化表現も含み得る。任意選択的に、符号化ビデオ情報１１０は、追加情報を含み得るが、これは本発明には必須ではない。

一般的に言えば、ビデオデコーダは、複数のビデオフレーム（たとえば、ビデオフレームのシーケンス）を復号化するように構成されており、ビデオデコーダは、特に、１つ以上のスライスのセット（好ましくは、複数のスライス）に細分化されたビデオフレームを復号化するように構成されている。ビデオデコーダはまた、スライスタイプ情報を評価するように構成されており、スライスタイプ情報は、符号化ビデオ情報１１０に含まれてもよく、スライスが、（たとえば、「ビデオ再構築」ブロック１８０によって実行され得る）スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの１ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または１つ以上の前のフレームの２つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、符号化されたかどうかを示す。

ビデオデコーダ１００は、たとえば、符号化ビデオ情報１１０に含まれる、バイナリシーケンスの符号化表現に基づいて（「ビデオ再構築」ブロックで使用するための）復号化バイナリシーケンス１２２を提供するように構成されている、算術デコーダ１２０を含む。算術デコーダは、好ましくは、第１ソース統計値決定１３０および第２ソース統計値決定１４０を含む。したがって、算術デコーダ１２０は、第１ウィンドウサイズを使用して第１ソース統計値１３２を決定し、第２ウィンドウサイズを使用して第２ソース統計値１４２を決定するように構成されている。算術デコーダは、好ましくは、コンバイナ１５０も含む。したがって、算術デコーダは、第１ソース固定値および第２ソース統計値に基づいて結合ソース統計値１５２を決定するように構成されている。また、算術デコーダ１２０は、好ましくは、範囲値決定１６０を含む。したがって、算術デコーダは、結合ソース統計値１５２に基づいて、（符号化ビデオ情報１１０に含まれる）バイナリシーケンスの符号化表現を（ビデオ再構築ブロック１８０で使用される）復号化バイナリシーケンス１２２にマッピングするために使用される、間隔サブディビジョンの１つ以上の範囲値を決定するように構成され得る。

好ましくは、算術デコーダ１２０は、（たとえばブロックまたはユニットであってもよい）算術復号化コア１７０も含み、これは、範囲値決定１６０から１つ以上の範囲値１６２を受信し、符号化ビデオ情報１１０に含まれる符号化バイナリシーケンスから復号化バイナリシーケンス１２２を導出するために範囲値を使用する。

また、ビデオデコーダは、たとえば、ビデオ再構築ブロック（またはユニット）１８０を含んでもよく、これは、復号化バイナリシーケンス１２２を受信し、復号化バイナリシーケンス１２２に基づいて（可能であれば、スライスタイプ情報などの、追加の制御情報を考慮して）復号化ビデオコンテンツ１１２を提供する。

結論として、算術デコーダ１００は、復号化バイナリシーケンス１２２を導出するために、符号化ビデオ情報１１０を受信し、バイナリシーケンスの符号化表現の算術復号化を実行する。算術復号化は、復号化バイナリシーケンス１２２のバイナリ値の確率に関する知識を利用する。復号化バイナリシーケンス１２２内のバイナリ値の確率（または推定確率）に関するこの知識は、間隔サブディビジョンを定義する範囲値１６２に依存することにより、算術復号化コア１７０によって考慮される。簡潔に言えば、算術復号化コアは、異なる間隔（たとえば、０と１の間、または整数値の範囲にわたる）を定義するために、範囲値１６２を使用することができる。算術復号化コアは、たとえば、バイナリシーケンスの符号化表現を、範囲値を使用して定義された間隔のうちの１つにある数の表現として解釈することができる。バイナリシーケンスの符号化表現によって表される数がどの間隔にあるかを認識することによって、算術復号化コア１７０は、どのビットまたはどのビットシーケンスがバイナリシーケンスの符号化表現を使用して符号化されたかを結論付けることができる。

しかしながら、算術復号化コア１７０の説明は、非常に簡潔で一般的な説明としか見なされないことに、留意すべきである。算術復号化コアに関する詳細は、たとえば、規格Ｈ．２６４およびＨ．２６５で確認することができる。しかしながら、異なる概念（算術復号化コアの動作について）も文献中に見られ、算術復号化コアの詳細は、本発明には特に関連性がない。

しかしながら、（高いビットレート効率を可能にする）適切な範囲値を取得するために、算術デコーダ１２０（または、一般的に言えば、ビデオデコーダ）は、異なるウィンドウサイズを使用して、２つのソース統計値１３２、１４２を決定する（「ウィンドウサイズ」は、復号化バイナリシーケンス１２２の複数の復号化されたバイナリ値にわたって平滑化の度合いを定義する）。また、算術復号化コア１７０に提供される範囲値に信頼性を高めるために、第１ソース統計値１３２および第２ソース統計値１４２は組み合わせられて結合ソース統計値１５２になる。

したがって、算術復号化コア１７０によって使用される範囲値は、ビット値（たとえば、復号化バイナリシーケンス１２２内のビット値「０」および「１」）の実際の確率によく適応しているので、ビデオデコーダ１００は高い効率を提供すると言うことができる。

付言として、ビデオデコーダ１００を修正することもできることに留意すべきである。代替実装では、第２ソース統計値決定１４０は、（復号化バイナリシーケンスから独立していてもよいが、１つ以上のパラメータに依存し得る）固定値の提供に置き換えられることが可能である。この場合、算術デコーダは、結合ソース統計値１５２を取得するために、第１ソース統計値１３２を固定の非ゼロ値と組み合わせるように構成されている。このような簡略化は、場合によっては良好な結果をもたらし、たとえば、結合ソース統計値の不適切に大きい変動を回避し得ることが、見いだされている。言い換えると、結合ソース統計値の決定に固定的な寄与を導入することにより、結合ソース統計値がこの固定値からあまり大きく逸脱できなくなることが、達成され得る。したがって、偶然に、復号化バイナリシーケンス１２２内に同一のビット値のより長いシーケンスがあった場合に、符号化効率の大幅な低下を回避するために、復号化バイナリシーケンスの統計への何らかの「後知恵」が使用され得る。

付言として、算術デコーダ（および算術デコーダの個々のブロック）の機能は一般に、その全体においてビデオデコーダの機能とも見なされ得ることに、留意すべきである。言い換えると、算術デコーダの機能として本明細書に記載される機能は、ビデオデコーダの別のブロックによっても実行され得る。

また、図１によるビデオデコーダ１００は、個別におよび組み合わせて、本明細書に記載される特徴、機能、および詳細のいずれかによって補足され得ることに、留意すべきである。

２）図２によるビデオデコーダ
図２は、本発明の一実施形態による、ビデオデコーダ２００のブロック概略図を示す。

ビデオデコーダ２００は、符号化ビデオ情報２１０（たとえば、ビデオビットストリーム）を受信し、これに基づいて、復号化ビデオコンテンツ２１２（たとえば、ビデオフレームのシーケンス）を提供するように構成されている。符号化ビデオ情報２１０は、たとえば、本明細書に記載されるような、スライスタイプ情報を含み得る。符号化ビデオ情報２１０は構成情報をさらに含んでもよく、これは制御情報とも見なされ得る。また、符号化ビデオ情報２１０は、バイナリシーケンスの符号化表現を含み得る。

図２には、ビデオデコーダ２００の２つの主要なブロック、すなわち算術デコーダ２２０およびビデオ再構築２８０が示されている。しかしながら、ビデオデコーダの機能の分布は固定ブロック構造に拘束されず、広い範囲にわたって修正され得ることに、留意すべきである。また、ビデオデコーダの実際の実装は、当業者にとって周知の、追加のブロックおよび／または機能を有し得ることに、留意すべきである。

算術デコーダ２２０は、バイナリシーケンスの符号化表現２１１を受信する。しかしながら、算術デコーダ（または算術デコーダの外部にあってもよい制御ブロック）は、スライスタイプ情報および構成情報（または制御情報）も受信する。特に、算術デコーダ２２０は、バイナリシーケンスの符号化表現２１１に基づいて、スライスタイプ情報および構成情報または制御情報の一部またはすべてを考慮して、復号化バイナリシーケンス２２２をビデオ再構築２８０に提供する。

以下、算術デコーダ２２０の機能が、より詳細に記載される。算術復号化は算術復号化コア２７０を含み、これは、バイナリシーケンスの符号化表現２１１を受信し、復号化バイナリシーケンス２２２を提供する。算術復号化コアは、復号化バイナリシーケンス２２２のどのビット値がバイナリシーケンスの符号化表現２１１によって表されるかを決定する。この目的のために、算術復号化コア２７０は、バイナリシーケンスの符号化表現２１１によって表される数が、数の範囲のどの間隔にあるかをチェックする。バイナリシーケンスの符号化表現２１１によって表される数が、複数の（または２つの）間隔のうちのどの間隔にあるかの決定に応じて、復号化バイナリシーケンス２２２の特定のビット値、またはビット値のグループが認識される。

復号化バイナリシーケンス２２２を導出する目的のために、算術復号化コアは、間隔に関する情報を受信し、これは通常、ビット値の確率にある程度対応する。この場合、算術復号化コア２７０は、間隔サブディビジョンに使用される「範囲値」２６２（すなわち、算術復号化コア２７０によって使用される数範囲の間隔を定義するのに役立つ範囲値１６２）を受信する。特に、算術復号化コア２７０は、たとえば、規格Ｈ．２６４によるビデオエンコーダ／デコーダまたは規格Ｈ．２６５によるビデオエンコーダ／デコーダで使用される算術復号化コアと類似または同一であり得ることに留意すべきである。しかしながら、算術復号化コア２７０を実現するための異なるアプローチもまた使用され得ることに、留意すべきである。

上記の議論を考慮して、算術復号化コア２７０の間隔サブディビジョンを定義する範囲値２６２を提供することは、算術デコーダ２２０の重要な機能であることが明らかとなる。一般的に言えば、算術デコーダ２２０は、たとえば初期化値、「ウィンドウサイズ」、「ウィンドウサイズ適応」などのパラメータを定義する何らかの制御情報を考慮して、復号化バイナリシーケンス２２２の前に復号化されたバイナリ値からこれらの範囲値２６２を導出する。

算術デコーダ２００では、２つのソース統計値決定ブロック（またはユニット）２３０、２４０が使用される。たとえば、第１ソース統計値決定ブロック２３０は、復号化バイナリシーケンス２２２の１つ以上の前に復号化されたバイナリ値（やはりｘ_ｔで指定される）を受信し、これに基づいて、第１ソース統計値２３２を提供する。第１ソース統計値決定ブロックは、たとえば、ソース統計値２３２を表すために使用されるビット数を定義する定数または変数ＢＩＴＳ_ａ、およびソース統計値決定ブロック２３０によって使用される「ウィンドウサイズ」を定義する定数または変数ｎ_ａなど、何らかの制御情報を受信し得る。たとえば、第１ソース統計値決定ブロック２３０は、第１ソース統計値２３２を再帰的に決定でき、ウィンドウサイズｎ_ａは、第１ソース統計値２３２の決定において復号化バイナリシーケンス２２２の最後に復号化されたバイナリ値の重み付けを決定する。

第１ソース統計値決定ブロック２３０の機能は、たとえば、何らかの「無限インパルス応答」特性を導入する再帰的アルゴリズムが使用されるという事実を除いて、特定のウィンドウサイズを有するスライディング平均の形成に類似している。このため、第１ソース統計値１３２は、スライディングウィンドウ加算演算またはスライディングウィンドウ平均演算の結果を正確に表すものではなく、結果が非常に似ているため、むしろ「仮想スライディングウィンドウ」演算と見なされるべきである。

また、第２ソース固定値決定ブロック２４０は、第１ソース統計値決定ブロック２３０と比較すると、類似の動作を実行する。しかしながら、第２ソース統計値決定ブロック２４０は、通常、異なるパラメータ（たとえば、異なるウィンドウ長ｎ_ｂおよび／または異なるビット数パラメータＢＩＴＳ_ｂ）を使用し、その結果、通常は第１ソース統計値２３２と異なる第２ソース統計値２４２を提供する。たとえば、ソース統計値２３２、２４２の１つは短期（またはより短期の）平均ソース統計値であってもよく、ソース統計値２３２、２４２の１つは長期（またはより長期の）平均ソース統計値であってもよい。

なお、ソース統計値決定ブロック２３０、２４０は、たとえば、以下で詳細に論じられる式（３）および（４）によって定義されるような機能を実行し得ることに留意すべきである。あるいは、ソース統計値決定ブロック２３０、２４０はまた、以下で論じられる式（５）によって定義されるような機能を実行し得る。また、いくつかの実施形態では、ソース統計値決定ブロック２３０、２４０においても異なる計算規則が使用され得ることに留意すべきである。

算術デコーダ２２０は、結合ソース統計値決定ブロック（またはユニット）２５０をさらに含み、これは第１ソース統計値２３２および第２ソース統計値２４２を受信するように構成されている。ソース統計値組み合わせブロック２５０は、これに基づいて結合ソース統計値２５２を提供する。たとえば、ソース統計値組み合わせブロック２５０は、それによって結合ソース統計値２５２を取得するために、第１ソース統計値２３２および第２ソース統計値２４２の合計または平均を形成し得る。

しかしながら、ソース統計値組み合わせブロック２５０はまた、結合ソース統計値２５２を導出するときに、第１ソース統計値２３２および第２ソース統計値２４２に異なる重み付けを適用することもでき、異なる重み付けは、スライス内で、または異なるスライス間でさえ変化し得る。

たとえば、ソース統計値組み合わせブロック２５０は、下記の式（６）によって定義されるか、または下記の式（１０）および（１１）によって定義されるか、または下記の式（１６）によって定義されるような機能を実行し得る。しかしながら、この機能の変形例もまた可能である。

たとえば、１つの（代替）実施形態では、ソース統計値組み合わせブロック２５０は、それによって結合ソース統計値２５２を取得するために、第１統計値の１つのみを固定値と組み合わせる。このような概念は、結合ソース統計値２５２が復号化バイナリシーケンス２２２内のバイナリ値の予想される確率から大きく逸脱しすぎることを回避するために、有利であり得る。

算術デコーダ２２０は、結合ソース統計値２５２に基づいて、（算術復号化コア２７０に提供される）間隔サブディビジョンの範囲値２６２を導出するように構成されている。この処理ステップは、たとえば、「範囲値決定」と見なされ得る。たとえば、範囲値決定は、任意選択的な値処理２６６を含んでもよく、これは、結合ソース統計値２５２を受信し、これに基づいて、確率値または状態インデックス値を提供する。値処理２６６は、たとえば、結合ソース統計値２５２の値の範囲を、０から１の間の範囲に、または０から０．５の間の範囲に、または整数インデックス値にマッピングし得る。たとえば、値処理２６６は、下記の式（７）にしたがって、または下記の式（８）、（９）にしたがって、または下記の式（１２）、（１３）にしたがって、または下記の式（１４）にしたがって実行され得る。

任意選択的に、値処理２６６は情報２６７を提供してもよく、これは、次に復号化される値（たとえば、復号化バイナリシーケンス２２２の）が「１」の値を取る可能性が高いか値「０」を取る可能性が高いかを示すバイナリ情報であってもよい。任意選択的に、算術デコーダ（または範囲値決定）は、マッピングテーブル２６９を含み得る。マッピングテーブル２６９は、たとえば、テーブルエントリを指定するインデックス値（たとえば、ｐＳｔａｔｅＩｄｘ）を受信し得る。したがって、マッピングテーブル２６９は、インデックス値（たとえば、ｐＳｔａｔｅＩｄｘ）によって指定された前記テーブルエントリに対応する１つ以上の範囲値２６２を提供し得る。したがって、「状態インデックス値」（たとえばｐＳｔａｔｅＩｄｘ）を導出し、状態インデックス値に基づいてマッピングテーブルを評価することにより、結合ソース固定値２５２に基づいて、間隔サブディビジョンの１つ以上の範囲値が提供され得る。

マッピングテーブル２６９は、たとえば、規格Ｈ．２６４または規格Ｈ．２６５に記載されているマッピングテーブルと同じ構造を有してもよい。しかしながら、マッピングテーブルの内容は、ビデオデコーダの特定の詳細に適応し得る。特に、マッピングテーブルのエントリは、特定のビデオデコーダで予想される統計的性質に適応することができる。

算術デコーダ（または一般的に言えば、ビデオデコーダ）はまた、制御情報または構成情報を受信し得、それに基づいて範囲値の提供に使用されるパラメータ（および可能であれば他のパラメータも、たとえば算術復号化コア２７０によって使用される追加のパラメータ）を調整し得る、制御ブロック２９０も含む。たとえば、制御ブロック２９０は、符号化ビデオ情報２１０に含まれ得る、スライスタイプ情報、「ｃａｂａｃｉｎｉｔｆｌａｇ」、「ｗｓ＿ｆｌａｇ」、および「ｃｔｕ＿ｗｓ＿ｆｌａｇ」のうちの１つ以上を受信し得る。

また、制御２９０は、たとえば、制御情報に応じて、ウィンドウサイズパラメータｎ_ａ、ｎ_ｂおよびビットサイズパラメータＢＩＴＳａ、ＢＩＴＳｂを調整し得る。特に、制御ブロック２９０は、現在のコンテキストモデルも考慮し得る。この問題に関して、復号化される復号化バイナリシーケンス２２２のビット（またはビットのグループ）ごとに、どのコンテキストモデルが使用されるかが決定され得ることに留意すべきである。たとえば、どのコンテキストモデルが使用されるかの決定は、どのタイプの情報（復号化パラメータ、変換係数など）がそれぞれのビット（またはビットのグループ）によって表されるかという事実に基づき得る。たとえば、制御ブロック２９０は、それによってどの構文要素（または構文要素のどの部分、たとえば最上位ビットか最下位ビットか、など）が次に復号化されるかを認識するために、復号化バイナリシーケンス２２２のシンタックスを認識するように構成されてもよい。したがって、異なるコンテキストモデル間の選択がなされ得る。また、ウィンドウサイズパラメータおよび／またはビットサイズパラメータおよび／またはその他のパラメータが、コンテキストモデルに応じて選択され得ることに留意すべきである。さらに、異なるソース統計値または結合ソース統計値が異なるコンテキストモデルで利用可能となり得るように、ソース統計値２３２、２４２または結合ソース統計値２５２が特定のコンテキストモデルに関連付けられ得ることにも留意すべきである。たとえば、特定のコンテキストモデルに関連付けられたソース統計値は、それぞれのコンテキストモデルを使用して復号化された復号化バイナリシーケンス２２２の復号化されたバイナリ値に基づいて、選択的に提供され得る。言い換えると、パラメータｎ_ａ、ｎ_ｂ、ＢＩＴＳ_ａ、ＢＩＴＳ_ｂなどに関する別個の独立した処理、および別個の（おそらく独立した）決定が、異なるコンテキストモデルについて行われ得る。

制御ユニット２９０の機能に関して制御ユニットは、たとえば、下記のメカニズムに従って、パラメータｎ_ａ、ｎ_ｂ、ＢＩＴＳ_ａ、ＢＩＴＳ_ｂを決定し得ることに、留意すべきである。たとえば、ウィンドウサイズパラメータｎ_ａ、ｎ_ｂは、スライスタイプ情報に応じて、および／またはｃａｂａｃｉｎｉｔｆｌａｇに応じて、および／またはｗｓ＿ｆｌａｇに応じて、および／またはｃｔｕ＿ｗｓ＿ｆｌａｇに応じて、選択され得る。また、ビットサイズパラメータＢＩＴＳａ、ＢＩＴＳｂは、いくつかの実施形態では、何らかの構成情報に応じて選択される。しかしながら、他の実施形態では、ビットサイズパラメータは固定されていてもよい。パラメータの調整に関しては、たとえば、以下の議論を参照されたい。

ここでビデオ再構築ブロック２８０を参照すると、ビデオ再構築ブロック２８０は通常、復号化バイナリシーケンス２２２、および構成情報の少なくともいくつかの要素も受信する。たとえば、ビデオ再構築２８０は、復号化バイナリシーケンス２２２に基づいて、整数パラメータおよび／または浮動小数点パラメータおよび／または画像データを再構築してもよい。たとえば、復号化バイナリシーケンスの特定のビットまたは部分がどのようにして整数パラメータまたは浮動小数点パラメータまたは画像データ（たとえば、変換係数など）にマッピングされるべきかを定義するマッピング規則があってもよい。したがって、ビデオ再構築ブロック２８０は、復号化バイナリシーケンス２２２からビデオフレームを再構築するために使用される情報を再構築する。次いで、ビデオ再構築ブロックは、再構築された情報（復号化バイナリシーケンス２２２から導出された）に基づいて、画像情報を生成し得る。

たとえば、ビデオ再構築２８０は、規格Ｈ．２６４または規格Ｈ．２６５に記載されているのと同じ機能を含んでもよい。しかしながら、復号化バイナリシーケンス（および、可能であれば、追加の構成情報または制御情報）に基づいて復号化ビデオコンテンツを提供するように適応された他のアプローチも、ビデオ再構築に使用され得る。したがって、ビデオ再構築２８０は、ビデオフレームのシーケンスの形態を取り得る、復号化ビデオコンテンツ２１２を提供する。

結論として、本発明の一実施形態によるビデオデコーダの概要が提供された。しかしながら、機能ブロック（たとえば、ソース統計値決定ブロック２３０、２４０、ソース統計値組み合わせブロック２５０、値処理ブロック２６６、マッピングテーブル２６９、および算術復号化コア２７０のための異なる実装があることに、留意すべきである。また、ビデオ再構築ブロック２８０および制御ブロック２９０には異なる実装が可能である。

しかしながら、本明細書に記載された機能ブロックは、その全体が本出願において開示された特徴、機能、および詳細のいずれかによって補足され得ることにも留意すべきである。また、本出願において開示された特徴、機能、および詳細は、それによってビデオデコーダ２００の機能を拡張するために、個別にまたは組み合わせて導入され得ることに、留意すべきである。

３）図３によるビデオエンコーダ
図３は、本発明の一実施形態による、ビデオエンコーダ３００のブロック概略図を示す。ビデオエンコーダ３００は、ビデオコンテンツ３１０を受信し、これに基づいて、符号化ビデオ情報（たとえば、ビデオビットストリーム）３１２を提供するように構成されている。

ビデオエンコーダ３００は、ビデオバイナリシーケンス提供ブロック３８０を含み、これは、ビデオコンテンツ３１０に基づいてビデオコンテンツ３１０を表すバイナリシーケンス３２２を提供するために、ビデオコンテンツ３１０を受信するように構成されている。たとえば、ビデオバイナリシーケンス提供３８０は、規格Ｈ．２６４によるビデオエンコーダのように、または規格Ｈ．２６５によるビデオエンコーダのように、実行され得る。しかしながら、ビデオバイナリシーケンスの提供のための異なるアプローチもまた使用され得る。また、ビデオバイナリシーケンス提供３８０は、たとえば、バイナリ値のシーケンスへの整数値または浮動小数点パラメータまたは画像データ（たとえば、変換係数など）のマッピングも含み得ることに、留意すべきである。

さらに、算術エンコーダ３２０は、バイナリシーケンス３２２を受信し、これに基づいて、バイナリシーケンス３２２の符号化表現３１１を提供し得る。一般的に言えば、算術エンコーダ３２０は、バイナリシーケンス３２２の効率的に圧縮された表現（すなわち、バイナリシーケンスの符号化表現３１１）を提供するために、バイナリシーケンス３２２内のバイナリ値の確率に関する知識（または情報）を利用するように構成されている。

算術エンコーダ３２０は、たとえば、算術符号化コア３７０を含んでもよく、これは、バイナリシーケンス３２２を受信し、これに基づいて、バイナリシーケンスの符号化表現３１１を提供する。算術符号化コア３７０は、たとえば、ビットまたはビットのグループを表す適切な符号語（符号化表現３１１に含まれる）を見つけられるようにするために、バイナリシーケンス３２２内のビット（またはビットのグループ）の確率に関する何らかの情報を必要とし得る。好ましくは、算術符号化コア３７０は、間隔のサブディビジョンを記述する範囲値３６２を受信する。範囲値３６２は、ビデオデコーダ２００によって（またはその算術復号化コア２７０によって）使用される間隔のサブディビジョンを記述してもよく、算術符号化コア３７０は対応するビデオデコーダによって復号化可能なバイナリシーケンスの符号化表現３１１を提供するので、この情報は当然ながら算術符号化コア３７０にとっても有用であり得る。

このため、算術エンコーダ３２０は、ビデオコンテンツを表すバイナリシーケンス３２２に基づいて、およびウィンドウサイズ情報ｎ_ａ、ｎ_ｂまたはビットサイズ情報ＢＩＴＳ_ａ、ＢＩＴＳ_ｂなどのいくつかのパラメータに基づいて、間隔サブディビジョンの範囲値３６２を導出するように構成され得る。なお、範囲値３６２の導出は、復号化バイナリシーケンス２２２の代わりにバイナリシーケンス３２２が評価されるという事実を除いて、範囲値１６２、２６２の導出と実質的に同一であることに留意すべきである。言い換えると、バイナリシーケンス３２２に基づいて範囲値３６２を導出するときに、前に復号化されたバイナリ値の代わりに前に符号化されたバイナリ値が使用される。

見てわかるように、ビデオエンコーダの算術エンコーダ３２０はソース統計値決定ブロック３３０、３４０を含み、これらは、（前に復号化されたバイナリ値に基づくのではなく）前に符号化されたバイナリ値に基づいて第１ソース統計値３３２および第２ソース統計値３４２を提供するという事実を除いて、ソース統計値決定ブロック１３０、１４０、２３０、２４０と実質的に同じである。ソース統計値決定子３３０、３４０は、たとえば、パラメータｎ_ａ、ｎ_ｂ、ＢＩＴＳ_ａ、およびＢＩＴＳ_ｂを使用し得る。また、ソース統計決定子３３０、３４０の機能は、たとえば、下記の式（３）および（４）によって、または下記の式（５）によって定義され得る。

また、算術エンコーダ３２０はソース統計値組み合わせブロック３５０も含み、これはソース統計値組み合わせブロック１５０またはソース統計値組み合わせブロック２５０に対応し得る。したがって、結合ソース統計値３５２が提供され、ソース統計値組み合わせブロック３５０の機能は、たとえば、式（６）または式（１０）および（１１）または式（１６）に従い得る。

算術エンコーダ３２０は任意選択的な値処理３６６も含み、これは、図２に示される値処理２６６に対応し得る。値処理３６６は、結合ソース統計値３５２を受信し得、たとえば、最確バイナリ値に関する情報３６７および／または確率情報または状態インデックス情報３６８を提供し得る。算術エンコーダ３２０はマッピングテーブル３６９も含み、これは、図２を参照して記載されたマッピングテーブル２６９に対応し得る。したがって、間隔サブディビジョンの１つ以上の範囲値３６２は、状態インデックス３６８の確率値を使用するマッピングテーブル３６９の評価によって提供され得る。

結論として、算術エンコーダ３２０は、算術デコーダ２２０が復号化バイナリシーケンス２２２に基づいて範囲値２６２を選択するのと同じ方法で、バイナリシーケンス３２２に基づいて範囲値３６２を選択し得る。したがって、復号化エラーがなく、ビデオエンコーダ側およびビデオデコーダ側で同じパラメータが使用されるという条件で、ビデオエンコーダ３００の算術エンコーダ３２０とビデオデコーダ２００の算術デコーダ２２０との間の同期性が実現され得る。

また、算術エンコーダ３２０、または一般的に言えば、ビデオエンコーダ３００は制御ブロック３９０を含み、これは、パラメータｎ_ａ、ｎ_ｂ、ＢＩＴＳ_ａ、ＢＩＴＳ_ｂ、および必要であり得るその他いずれかのパラメータを決定し得ることに、留意すべきである。たとえば、制御ブロック３９０は、パラメータについて決定するために、いくつかの経験的メカニズムを使用し得る。あるいは（または追加で）、制御ブロック３９０はまた、どのパラメータの組み合わせが可能な限り最も低いビットレートをもたらすか（またはその他いずれかの最適な基準を満たすか）を分析し得る。

また、ビデオエンコーダ３００は、たとえば、符号化ビデオ情報３１２内で、ビデオデコーダ２００の動作を制御する何らかの制御情報を提供し得ることに留意すべきである。たとえば、この制御情報（または構成情報）は、以下のうちの１つ以上を含み得る：スライスタイプ情報、ｃａｂａｃｉｎｉｔｆｌａｇ、ｗｓ＿ｆｌａｇ、およびｃｔｕ＿ｗｓ＿ｆｌａｇ。これらの構成情報項目の機能、ならびにその可能な符号化および復号化が、以下に記載される。スライスタイプ情報は、（たとえば、ビデオバイナリシーケンス提供３８０によって）規格Ｈ．２６４またはＨ．２６５にしたがってビデオエンコーダと同様に提供されてもよく、規格Ｈ．２６４またはＨ．２６５にしたがってビデオデコーダと同様にビデオ再構築１８０、２８０によって使用されてもよい。加えて、スライスタイプ情報は、本明細書で概説されるように、ウィンドウサイズに関する決定で使用され得る。

また、機能ブロックの分布が修正され得ることに留意すべきである。図３の実施形態では、算術符号化コア３７０、ソース統計値決定子ブロック３３０、３４０、ソース統計値組み合わせブロック３５０、値処理ブロック３６６およびマッピングテーブル３６９および制御３９０は、算術エンコーダの一部として記載されてきた。しかしながら、前記ブロックはまた、一般に、ビデオエンコーダのブロック（または機能）でもあり得る。

また、図３を参照して記載された機能ブロックのいずれも、その全体が本出願に記載された特徴、機能、および詳細のいずれかによって補足され得ることに留意すべきである。

４）さらなる実施形態および詳細
以下では、個別にまたは組み合わせて、本明細書で開示される実施形態のいずれかに、個別にまたは組み合わせて導入され得るさらなる実施形態および詳細が記載される。本明細書に記載される詳細は、たとえば、個別におよび組み合わせて、図１、図２、および図３を参照して記載された実施形態に導入され得る。

特に、このセクションで開示される特徴、機能、または詳細のうちの１つの使用は通常、２つ以上の特徴、機能、または詳細を使用した方がさらによい実施形態を作成し得るとしても、既に改善をもたらしていることに留意すべきである。

一般的に言えば、本発明の態様または実施形態は、バイナリ算術符号化の確率推定方法（または確率推定概念）を作成する。

序論
以下に序論が提供される。

コンテキストモデル更新は、コーダの内部状態を基礎となるソース統計に適応させる可能性を提供することによる、効率的なバイナリ算術エントロピーコーダの重要な特徴である。たとえば、各コンテキストモデルは、このコンテキストモデルに割り当てられた次のバイナリシンボル（ｂｉｎ）を復号化または符号化する確率を提供する、独立した確率推定段を備えている。

従来のビデオコーデックＨ．２６５／ＨＥＶＣの確率段実装は有限状態マシン（（０，０．５］の範囲に６４の確率状態がある）に基づいているが、この文献に記載される推定器は、ｂｉｎの割り当てられたシーケンスのソース統計を追跡する２つのカウンタ変数に基づいている。

各カウンタ（たとえば、ソース統計値決定子１３０、１４０、２３０、２４０、３３０、３４０を実装し得る）は、過去のバイナリシンボルの数（たとえば、ソース統計値が決定されたコンテキストモデルを使用して符号化または復号化された、前に符号化された、または前に復号化されたバイナリ値）がカウント（または一般的に言えば、ソース統計値の値）にどの程度影響するかを決定する、

を備えている。更新は、たとえば、いわゆる仮想スライディングウィンドウアプローチによって導出される。

を有するｂｉｎ（またはバイナリ値）が復号化または符号化された後、

（ソース統計値と見なされ得る）の更新は、以下に記載されるように実施され得る。

式（１）の更新が浮動小数点演算を使用している場合、カウントは常に、すべてのｂｉｎシーケンスで

の範囲内になる。確率推定器の

は、以下のように定義される。

算術符号化エンジンに応じて、確率推定器の出力は、直接（たとえば、算術符号化／復号化コアの範囲値を決定するために）使用されてもよく、または量子化された確率値のセットの最も近い確率に（または算術符号化／復号化コアの１つ以上の範囲値に）値をマッピングするなどのさらなる処理を必要としてもよい。

実装の詳細
以下に、いくつかの実装の詳細が記載される。

（たとえば、ソース統計値決定ブロックの）実装は、定義された精度

での整数演算の使用を必要とする（または優先する）可能性が高い。したがって、式（１）の実装の代わりに、たとえば式（３）および（５）による、または式（５）による整数の実装が使用され得る。

さらに、可能なウィンドウサイズのセットは、算術演算の簡略化を可能にするために、

によって導出され得る値に限定される必要があるだろう。

この場合（

に等しくないときも）、

の更新は、以下のように計算される（式（１）と同等）。

この更新規則では、カウントが有効な範囲

内にとどまることを保証するクリッピング操作が実行される必要がある。（４）

値ｎ_ｑは適切に（たとえば丸めによって）選択され得る。また、ｘ_ｔは、前に符号化されたバイナリ値（たとえば、値０または１を有する）または前に復号化されたバイナリ値を表し得ることに留意すべきである。

代替例として、式（３）および（４）は、バイナリシンボルの値を区別する更新計算に置き換えられてもよい。

（式（５）の２行に示されるような）異なるシンボル値に異なる更新規則を使用することで、式４のクリッピング操作を廃止する。

なお、式（３）および（４）または式（５）で仮想スライディングウィンドウアプローチを実装する２つの方法では、右シフト演算のため、同一のビットストリームを導出しないことに留意されたい。

また、式（３）および（４）による、または式（５）による演算は、本明細書に記載されるソース統計値決定子によって実行され得ることに留意すべきである。しかしながら、いくつかの実施形態では、ソース統計値決定子は異なる機能（たとえば式（１）による）も実行し得る。

確率推定器の出力（たとえば、結合ソース統計値）は、式（４）または式（５）のいずれかからの更新方法（またはその他の方法）から生じるカウンタ（たとえば、ソース統計値）を重み付けすることによって、計算される。

（結合ソース統計値と見なされ得る）式（６）からの重み付け結果

は、（たとえば、値処理によって）確率

を導出するために、（任意選択的に）使用され得る。

または算術符号化エンジンの設計に依存するアドレスインデックス（たとえばｐＳｔａｔｅＩｄｘ）。

カウンタベースの確率推定器は、たとえば、範囲（０，１）内のバイナリシーケンスの値

で次のシンボルの確率を提供し得る。値

を有する次のシンボルの確率推定が必要とされる場合、出力が変換される必要がある：

しかしながら、確率値ｐ_ｔ（またはｐ（０）またはＰ（１））の計算は、すべての実施形態で必要とされるわけではないことに留意すべきである。

カウンタベースの確率推定器とは異なり、Ｈ．２６５／ＨＥＶＣの有限状態マシンの確率推定は、２つの変数の組み合わせを使用して実行される。第１の変数

は、範囲（０，０．５］内の最低確率シンボル（ＬＰＳ）の確率を表す状態インデックスを格納する。第２の変数

は、最確シンボル（ＭＰＳ）の値を包含する。同様に、バイナリ算術コーダの間隔サブディビジョンのあらかじめ計算された範囲値を有する表は、範囲（０，０．５］のみをカバーする。

このため、たとえば従来のマッピングテーブル、または従来の構造（Ｈ．２６４またはＨ．２６５のビデオエンコーダまたはデコーダなど）を有するマッピングテーブルが使用される場合には、（従来の）有限状態マシンがカウンタベースの確率推定器に置き換えられる場合にマッピングを使用することが推奨できる［３］。言い換えると、結合ソース統計値が本明細書に記載されるように決定される場合（たとえば、式（３）から（６）を使用して、または以下で延べられる類似の式を使用して）、（たとえば、任意選択的な値処理において）マッピングテーブルのインデックス値（たとえばｐＳｔａｔｅＩｄｘ）に結合ソース統計値をマッピングすることが推奨できる（しかし必須ではない）。これにより、従来のマッピングテーブルを使用することができる。一方、マッピングテーブル（間隔サブディビジョンの範囲値を提供する）は適切に適応され、このようなマッピングは必要ない場合がある。

状態インデックス

値への（たとえば、結合ソース統計値の）式（６）からの結果

のマッピングは、たとえば、以下によって計算され得る（これはたとえば、マッピングテーブルの分解能までの量子化を含み得る）。

ここで、

はあらかじめ計算された値を含むテーブルのＬＰＳ確率状態を表すために使用されるビット数を定義し、

は以下によって導出される。

式（８）および（９）からの（または式（８）および（９）を使用した）カウンタベースの確率推定器の結果の、ＬＰＳ状態インデックスの表現への（たとえば、低確率状態の状態インデックスまたは最低確率状態の状態インデックスの表現、たとえばｐＳｔａｔｅＩｄｘ）へのマッピング、およびＭＰＳの値（たとえば、高確率バイナリ値の値、たとえばｖａｌＭＰＳ）の代わりに、算術符号化エンジンは２つのオプションによって交互に修正され得る。

（たとえば、結合ソース統計値を使用して、または確率値ｐ_ｔ（またはｐ（０）またはｐ（１））を使用して、マッピングテーブルのテーブルエントリが直接選択され得るように）全体の確率間隔（０，１）をカバーするために間隔サブディビジョンのあらかじめ計算された範囲値を包含するテーブルが拡張され得るか、もしくはテーブルが省略され、算術を使用して（たとえば、結合ソース統計値に基づいて、または確率値ｐｔまたはｐ（０）またはｐ（１）に基づいて）範囲値がオンザフライで計算される。

言い換えると、結合ソース統計値に基づいて算術復号化コアの間隔のサブディビジョンの範囲値を導出するための、多くの異なる方法がある。従来のマッピングテーブルが使用される場合は、式（８）および（９）による計算が推奨される。あるいは、修正されたマッピングテーブルが使用される場合、または範囲値が何らかの計算規則を使用して結合ソース統計値から導出される場合には、式（８）および（９）による計算は省略され得る。

発明の態様－カウンタ変数の可変分解能
以下では、本発明によるいずれの実施形態でも任意選択的に使用され得る、本発明の一態様が記載される。

カウンタベースの確率推定器の従来の整数実装は、カウンタの精度

を表すために同じビット数を使用する。

メモリ消費と符号化効率とのトレードオフを最適化するために、

変数は、ウィンドウサイズに応じてサイズ決定され得ること（または現在使用されているウィンドウサイズに応じて動的に適応され得ること）がわかっている。

したがって、カウンタ変数（たとえば、ソース統計値）は、たとえば、式（６）からの重み付け演算（たとえば、ソース統計値結合）が適用される前に修正されてもよい。

ここで、

を使用すると、重み付け演算（たとえば、ソース統計値結合）は、以下の表に修正される。

式（８）および（９）からの状態インデックス

値への結果

のマッピング（任意選択的な値処理によって実行され得る）は、以下のように修正されてもよく、

は以下によって導出される。

全体の確率間隔（０，１）をカバーするために間隔サブディビジョンのあらかじめ計算された範囲値を包含するテーブルが拡張される場合、状態インデックスは、（たとえば、式（１２）および（１３）の計算の代わりに）以下のように導出され得る（たとえば、任意選択的な値処理によって）。

発明の態様：スライスタイプ、ｃａｂａｃｉｎｉｔｆｌａｇ、およびコンテキストモデル依存のウィンドウサイズ
以下では、ウィンドウサイズの調整の可能性が記載されるが、これは本発明の実施形態のいずれかにおいて任意選択的に使用され得る。

式（１）、（３）、および（５）のカウンタ変数

の更新はすべて、確率推定器の（たとえばソース統計値決定子の）出力に影響を及ぼす過去のｂｉｎの数を制御するために、

（たとえばｗ_ａまたはｗ_ｂ）、または

として定義される

（たとえばｎ_ａまたはｎ_ｂ）を包含する。

以前の刊行物［１］では、ウィンドウサイズは、ビデオコーデックのその他いずれのパラメータとも無関係に、すべてのコンテキストモデルで同じ２つの値、たとえば

に設定されていた。

本発明の一態様によれば、各コンテキストモデルのウィンドウサイズペアは、コンテキストモデル、ｃａｂａｃｉｎｉｔｆｌａｇ、およびスライスタイプに応じて、包括的に、範囲［１，１１］内で
のカスタム値（たとえば、ｎ_ａおよび／またはｎ_ｂ）に設定される。

ｃａｂａｃｉｎｉｔｆｌａｇは、Ｈ．２６５／ＨＥＶＣの一部であり、「ｃａｂａｃ＿ｉｎｉｔ＿ｆｌａｇ」と呼ばれる［２］。

３つのスライスタイプが定義されており、これらは通常、Ｂ、Ｐ、またはＩｎｔｒａ予測スライスと呼ばれる。たとえば、初期確率状態を導出するために使用される、［２］の「ｉｎｉｔＶａｌｕｅ」と同じ方法で、（たとえば事前定義されたテーブル内の）各コンテキストモデルのスライスタイプおよび「ｃａｂａｃ＿ｉｎｉｔ＿ｆｌａｇ」のすべての組み合わせに対して、１対の
（たとえば、ｗ_ａおよびｗ_ｂまたはｎ_ａおよびｎ_ｂを定義する）が定義される。

整数演算を使用する実装では、１つのコンテキストモデルのウィンドウサイズ値（たとえば、ｎ_ａおよびｎ_ｂ）は、たとえば８ビット変数として読み取り専用メモリに格納されてもよく、
の結果的な構造は、表１に示されている。

なお、表１に示されるような
の構造は、ソフトウェア実装の寛大なレイアウトの一例であり、メモリ要件は重要ではないことに留意されたい。
を格納するために使用されるビット数は、必要とされるより多くの組み合わせを格納することができる。

（制御ブロックによって実行され得る）１つのコンテキストモデルの正確な
の導出プロセスの一例は、表２に示されている。

たとえば、ｗｓ_{ｐａｉｒ０}、ｗｓ_{ｐａｉｒ１}、およびｗｓ_{ｐａｉｒ２}によって指定された、３つの事前定義された値ｗｓ_ｐａｉｒがあることがわかる。

「ＳｌｉｃｅＴｙｐｅ」情報に基づいて、およびいわゆる「ｃａｂａｃｉｎｉｔｆｌａｇ」に基づいて、これらの事前定義された値ｗｓｐａｉｒの１つが（たとえば制御ブロックによって）選択される（これは任意選択的に、ビデオエンコーダまたはビデオデコーダのソース統計値および／またはその他の変数の初期化値も決定し得る）。たとえば、スライスタイプが両方向予測（「Ｂ」）である場合、「ｃａｂａｃｉｎｉｔｆｌａｇ」は、ｎ_ａおよびｎ_ｂ（またはｗ_ａおよびｗ_ｂ）を決定するために２つの事前定義された値ｗｓ_{ｐａｉｒ０}およびｗｓ_{ｐａｉｒ１}のうちのどちらが実際に使用されるかを決定し得る。同様に、スライスタイプが単一予測（「Ｐ」）である場合、「ｃａｂａｃｉｎｉｔｆｌａｇ」は、ｎ_ａおよびｎ_ｂ（またはｗ_ａおよびｗ_ｂ）を決定するために２つの事前定義された値ｗｓ_{ｐａｉｒ０}およびｗｓ_{ｐａｉｒ１}のうちのどちらが実際に使用されるかを決定し得る（両方向予測スライスタイプの場合と比較して、ｃａｂａｃｉｎｉｔｆｌａｇの値と事前定義された値ｗｓ_{ｐａｉｒ０}およびｗｓ_{ｐａｉｒ１}との間で逆の割り当てが使用され得る。独立した符号化モード（「Ｉｎｔｒａ」）を使用してスライスが符号化される場合、ｃａｂａｃｉｎｉｔｆｌａｇはアクティブであり、事前定義された値ｗｓ_{ｐａｉｒ２}が常に使用され得る。

なお、表２はコンテキストモデルのみを表し、異なるコンテキストモデルには異なるテーブルが利用可能であることに、留意すべきである（たとえば、範囲値決定のプロセス全体が、異なるコンテキストモデルに対して独立して機能し得る）。

コンテキストモデルは、最初のｂｉｎを復号化または符号化する前に、意図されるウィンドウサイズで初期化されるべきである。初期化プロセスは、各コンテキストモデルの初期確率状態／カウントが設定されるのと同時に実行される。

実施形態
以下に、実施形態およびさらなる態様が記載される。このセクションで言及される実施形態は、個別に使用することができ、任意選択的に、本明細書に記載される特徴、機能、および詳細のいずれかによって補足され得る。

また、本明細書に開示されるすべてのビデオデコーダおよびビデオエンコーダは、任意選択的に、個別にまたは組み合わせて、以下に記載される特徴、機能、および詳細のいずれかによって補足され得ることに、留意すべきである。また、明細書に記載されるビデオデコーダおよびビデオエンコーダの特徴は、任意選択的に、以下に記載される特徴、機能、および詳細のいずれかに置き換えることができる。

（ａ）本発明の好適な実施形態では、各コンテキストモデルは２つの
を備えている。スライス（たとえば、ビデオフレームの一部の）の初期化中、
は、たとえば表２で概説されたように、たとえば、現在のスライスタイプおよびｃａｂａｃｉｎｉｔｆｌａｇの値に応じた特定の値に設定され、カウンタの分解能変数（またはソース統計値の分解能変数）は、たとえば、同じ値
に設定される（任意選択）。このコンテキストモデルに割り当てられたｂｉｎ（たとえば、バイナリ値）を符号化または復号化するために、カウントは、たとえば式（１１）のように重み付けされ、たとえば式（１２）および（１３）によって定義されるように、状態インデックスを導出するために使用される。ｂｉｎ（たとえばバイナリ値）が符号化または復号化された後、カウンタ変数（またはソース統計値）は、各カウンタについて（または各ソース統計値について）指定されたカスタムウィンドウサイズ（たとえば、ｎ_ａおよびｎ_ｂで定義される）を使用する式（５）で指定されるように、更新される。

（ｂ）本発明の別の好適な実施形態では、確率推定方法（または概念）は、実施形態（ａ）と同一に構成されるが、カウンタ変数（またはソース統計値）の更新は、式（３）および（４）を使用して実行される。

（ｃ）本発明の別の好適な実施形態では、確率推定方法（または概念）は、実施形態（ａ）と同一に構成されるが、状態インデックスを導出するために式（１４）が使用される。状態インデックスは、全体の確率間隔（０，１）をカバーするあらかじめ計算された範囲値でテーブル（たとえば、範囲値を提供するためのマッピングテーブル）をアドレス指定する。

（ｄ）本発明の別の好適な実施形態では、確率推定器（たとえば、ソース統計値決定ブロック）は、実施形態（ａ）で指定された通りに構成されるが、コンテキストモデルの個々のカウンタ（またはそれぞれのコンテキストモデルの２つのソース統計値）は、式（１１）のように均等に重み付けされない。代わりに、重み付け演算は、個々のカウンタの重み
を含み、
たとえば、
。この実施形態では、式（１１）の演算は、式（１６）または代替整数重み付け実装に置き換えられる。

（ｅ）本発明の別の好適な実施形態では、確率推定方法（たとえば、ソース統計値決定ブロック）は、実施形態（ｄ）のように構成されるが、個々のカウンタの（たとえば、２つのソース統計値の）重み付けは、符号化または復号化プロセス中に変更される。

（ｆ）別の好適な実施形態では、確率推定器（またはソース統計値決定ブロック）は、実施形態（ａ）と同一に構成されるが、利用可能なウィンドウサイズのセットは、
を格納するために使用されるメモリ要件を減らすために、より小さいサブセットに限定される（たとえば、制御ブロックを適応させることによる）。ここで、
より小さくなくてはならず、これは、許容範囲［１，１１］では、６６の有効な組み合わせをもたらす。その結果、
によって使用されるビット数は、表１で概説されたように、よりコンパクトなレイアウト－８ビット変数ｗｓ_ｐａｉｒのビットマスクに減らすことができる。

（ｇ）別の好適な実施形態では、確率推定器（またはソース統計値決定ブロック）は、実施形態（ｆ）で指定された通りに構成されるが、有効な組み合わせの数は、手動で選択された
を省略することによって減少する（たとえば、制御ブロックを適応させることによる）。

（ｈ）別の好適な実施形態では、確率推定器（またはソース統計値決定ブロック）は、実施形態（ｆ）で指定された通りに構成されるが、有効な組み合わせの数は、
まで減少し、
は少なくとも３である
（たとえば、制御ブロックを適応させることによる）。

（ｉ）別の好適な実施形態では、確率推定器（またはソース統計値決定ブロック）は、実施形態（ｈ）で指定された通りに構成されるが、有効なウィンドウサイズ組み合わせのセットは、
で拡張され、ここで
（たとえば、制御ブロックを適応させることによる）。

（ｊ）本発明の別の好適な実施形態では、確率推定方法または概念（またはソース統計値決定ブロック）は、実施形態（ａ）のように構成されるが、カウンタの分解の（またはソース統計値の分解能）は等しくない。たとえば、
（たとえば、制御ブロックを適応させること、またはソース統計値決定ブロックを適応させることによる）。特に、より小さいウィンドウサイズ、たとえば
を使用するカウンタ（またはソース統計値）では、メモリ消費を削減するために、個々のカウンタ（またはソース統計値）の分解能を減少させることができる。

（ｋ）本発明の別の好適な実施形態では、確率推定方法または概念は、実施形態（ｊ）のように構成されるが、カウンタ（またはソース統計値）の分解能
は、そのウィンドウサイズによって（たとえば、ソース統計値を計算または更新するために使用されるウィンドウサイズによって）導出される。たとえば、
、ここで
は閾値（たとえば、固定値）であり、たとえば８に等しくてもよい。

（ｌ）本発明の別の好適な実施形態では、確率推定方法または概念は、実施形態（ｊ）のように構成されるが、１つのコンテキストモデルの
変数の合計は、すべてのコンテキストモデルで等しい（これはたとえば、制御ブロックの適応によって実現され得る）。このため、各コンテキストモデルは同じビット数を必要とし、特定のコンテキストモデルのアドレス指定は、単純なオフセット計算によって実行することができる（たとえば、異なるコンテキストモデルに関連付けられたソース統計値が、アレイまたは連続するメモリ領域に格納される場合）。

（ｍ）別の好適な実施形態では、確率推定器（たとえば、ソース統計値決定ブロック）は、実施形態（ｌ）に記載された通りに構成されるが、
変数の合計がすべてのコンテキストモデルで等しいという制約のため、有効なウィンドウサイズ組み合わせの数は減少する（たとえば、制御ブロックの適応による）。この実施形態では、
は減少から除外される（たとえば、ｎ_ａおよびｎ_ｂが等しい場合も依然として選択され得る）。

（ｎ）別の好適な実施形態では、確率推定器（たとえば、ソース統計値決定ブロック）は、実施形態（ａ）に記載された通りに構成されるが、１つのカウンタのウィンドウサイズは無限に設定される。このため、カウントは更新されず、算術演算およびメモリ消費に関して複雑さを軽減することができる。たとえば、ソース統計値の１つは、固定値に置き換えることができる。したがって、結合ソース統計値は、ソース統計値の１つと前記固定値との組み合わせによって取得することができる。

（ｏ）別の好適な実施形態では、確率推定器（たとえば、ソース統計値決定ブロック）は、実施形態（ａ）に記載された通りに構成されるが、コンテキストモデルは、スライスごとに送信される別個のフラグに応じて初期化される（たとえば、ビデオエンコーダによって提供され、ビデオデコーダによって評価される）。スライスタイプおよびｃａｂａｃｉｎｉｔｆｌａｇに応じてウィンドウサイズを初期化する代わりに、使用されるセット（たとえば、使用されるｎ_ａおよびｎ_ｂの値）を指定する別個のフラグ「ｗｓ＿ｆｌａｇ」が導入される。結果として、表２の割り当ては、表３に示されるように拡張される。

たとえば、スライスごとに、（たとえば制御情報または構成情報として）ビデオビットストリームに含まれる「ｗｓ＿ｆｌａｇ」またはパラメータに応じて、２セットのウィンドウサイズの間で選択することが可能である。

このため、制御ブロック（または一般に、ビデオエンコーダまたはビデオデコーダ）は、たとえば、ｗｓフラグを評価し、ｗｓフラグに応じて（通常はスライスタイプにも応じて。これは通常、スライスごとに、または選択されたスライスに対して、制御情報または構成情報としてビデオビットストリームにも含まれる）ウィンドウサイズを調整する。

（ｐ）別の好適な実施形態では、確率推定器（たとえば、ソース統計値決定ブロック）は、実施形態（ａ）に記載された通りに構成されるが、ウィンドウサイズの初期化は、現在のスライスの時間レベルにさらに依存する。結果として、
の総数が増加する。このため、制御ブロック（またはビデオエンコーダまたはデコーダ）は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの時間レベルを考慮するように構成され得る。

（ｑ）別の好適な実施形態では、確率推定器（たとえば、ソース統計値決定ブロック）は、実施形態（ａ）に記載された通りに構成されるが、ウィンドウサイズの初期化は、現在のスライスの量子化パラメータにさらに依存する。このため、制御ブロック（またはビデオエンコーダまたはデコーダ）は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの量子化パラメータを考慮するように構成され得る。

（ｒ）別の好適な実施形態では、確率推定器（たとえば、ソース統計値決定ブロック）は、実施形態（ｐ）に記載された通りに構成されるが、初期化は、量子化パラメータにさらに依存する。結果として、
は、時間レベル、量子化パラメータ、スライスタイプ、およびｃａｂａｃｉｎｉｔｆｌａｇの積空間の項目ごとに指定される。このため、制御ブロック（またはビデオエンコーダまたはデコーダ）は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの時間レベルおよび量子化パラメータを考慮するように構成され得る。

（ｓ）本発明の別の好適な実施形態では、確率推定方法または概念（たとえば、ソース統計値決定ブロック）は、実施形態（ａ）と同一に構成されるが、ウィンドウサイズ変数は、位置に応じて、復号化または符号化プロセス中に変更される（たとえば、スライス内および／または異なるスライス間および／または異なるフレーム間で）。

たとえば、現在のｂｉｎが、スライスの最初の列または最初の行の一部であるＣＴＵ（符号化ツリーユニット）から生じる場合、両方のカウンタ（またはソース統計値決定子）のウィンドウサイズ（たとえば、ｎ_ａおよびｎ_ｂ）は以下のように設定される。
たとえば、これは、現在のｂｉｎがスライスの最初の列または最初の行の一部であるＣＴＵＩから生じる場合のウィンドウサイズの選択的な減少を意味し得る。

ＣＴＵの最初の行またはＣＴＵの最初の列の符号化処理が終了した場合、ウィンドウサイズはそのデフォルト値に設定される（たとえば、表２および表３の１つにしたがって、たとえば考慮され得るスライスタイプおよびその他いずれかのパラメータまたはフラグに基づいて定義される通り）。

ウィンドウサイズを変更することにより、確率推定器は、スライスまたはＣＴＵの行の始めのソースｂｉｎシーケンスの基礎となる統計に、より速くまたはより遅く適応し得る。

（ｔ）本発明の別の好適な実施形態では、確率推定方法または概念（たとえば、ソース統計値決定ブロック）は、実施形態（ａ）と同一に構成されるが、スライスの復号化または符号化中にウィンドウサイズを変更するために、追加のフラグが使用される（たとえば、ビデオエンコーダによって提供され、ビデオデコーダによって評価される）。この実施形態では、たとえば、すべてのコンテキストモデルまたはサブセット（たとえば、コンテキストモデルの）の
を増加または減少させるために使用されるすべてのＣＴＵに、フラグ「ｃｔｕ＿ｗｓ＿ｆｌａｇ」がある。符号化中、たとえばすべてのＣＴＵの前に、「ｃｔｕ＿ｗｓ＿ｆｌａｇ」が通知され、復号化中、たとえばすべてのＣＴＵの前に、「ｃｔｕ＿ｗｓ＿ｆｌａｇ」が読み取られる。「ｃｔｕ＿ｗｓ＿ｆｌａｇ」の値に応じて、結果が依然として有効な範囲［１，１１］内にある場合、すべてのコンテキストモデルの
の変数は、増加または減少する。

（ｕ）本発明の別の好適な実施形態では、確率推定方法または概念（たとえば、ソース統計値決定ブロック）は、実施形態（ｔ）と同一に構成されるが、ｃｔｕ＿ｗｓ＿ｆｌａｇに応じて、すべてのコンテキストモデルのサブセットのウィンドウサイズのみが変更される。

５）図４による方法
図４は、本発明の一実施形態による、方法４００のフローチャートを示す。

なお、方法４００は、個別におよび組み合わせて、対応する装置に関して本明細書に記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。

また、第１ソース統計値を固定の非ゼロ値と組み合わせることによって結合ソース統計値が得られる場合、第２ソース統計値を計算する必要がないことにも、留意すべきである。

６）図５による方法
図５は、本発明の一実施形態による、方法５００のフローチャートを示す。

なお、方法５００は、個別におよび組み合わせて、対応する装置に関して本明細書に記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。

７）図６によるビデオストリーム
図６は、本発明の一実施形態による、ビデオストリーム（ビットストリーム）の概略（簡略化）表現を示す。

なお、ビデオストリーム６００は、個別におよび組み合わせて、本明細書に記載される特徴および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。

８）結論
結論として、たとえば、ビデオエンコーダ、ビデオデコーダ、ならびに画像エンコーダ、画像デコーダ、オーディオエンコーダ、オーディオデコーダなどでも使用され得る、バイナリ算術符号化の確率推定方法および装置について記載されてきた。

これらの方法および装置は、従来のソリューションよりも優れている。

たとえば、［４］の文献は、コンテキストモデルごとに定義されたカスタムウィンドウサイズについて記載している。しかしながら、ウィンドウサイズは、スライスタイプまたはｃａｂａｃｉｎｉｔｆｌａｇに依存して導出されるものではない。コンテキストモデルごとに２つのペアのウィンドウサイズが定義され、１つのペアを選択するために量子化パラメータが使用される。さらに、異なる範囲のウィンドウサイズが提供される。

［５］の文献は、請求項に記載される高速攻撃モードの代替例として比較できる方法について記載している。文献は、コンテキストモデルに割り当てられた最初の６４個のｂｉｎに対して追加のペアのウィンドウサイズが定義されることを記載している。最初の６４個のｂｉｎが復号化または符号化された後、ウィンドウサイズはそのデフォルト値に設定される。このアプローチは、コンテキストモデルごとに符号化されたｂｉｎの数を追跡する、別個のカウンタ変数を必要とする。

９）実装代替例
いくつかの態様は装置の文脈で説明されてきたが、これらの態様が対応する方法の説明も表すことは明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。方法ステップの一部または全ては、たとえば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって（またはこれを使用して）実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちの１つ以上が、このような装置によって実行されてもよい。

本発明の符号化されたビデオ信号（またはデータストリームまたはビデオビットストリーム）は、デジタル記憶媒体上に記憶されることが可能であり、またはインターネットなどの無線送信媒体または有線送信媒体のような送信媒体で送信されることが可能である。

特定の実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装され得る。本実装は、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する（または協働可能な）、電子可読制御信号が記憶された、フロッピーディスク、ＤＶＤ、Ｂｌｕ－Ｒａｙ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、またはフラッシュメモリなどのデジタル記憶媒体を使用して、実行され得る。したがって、デジタル記憶媒体はコンピュータ可読であり得る。

本発明によるいくつかの実施形態は、本明細書に記載される方法の１つが実行されるように、プログラム可能なコンピュータシステムと協働することが可能な、電子可読制御信号を有するデータキャリアを備える。

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装されることが可能であり、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されたときに方法の１つを実行するように動作する。プログラムコードは、たとえば、機械可読キャリア上に記憶されてもよい。

別の実施形態は、機械可読キャリア上に記憶された、本明細書に記載される方法の１つを実行するためのコンピュータプログラムを備える。

したがって、言い換えると、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されたときに、本明細書に記載される方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法の１つを実行するためのコンピュータプログラムを備え、それが記録された、データキャリア（またはデジタル記憶媒体またはコンピュータ可読媒体）である。データキャリア、デジタル記憶媒体、または記録媒体は、典型的には有形および／または非一時的である。

したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは一連の信号はたとえば、データ通信接続を介して、たとえばインターネットを介して転送されるように構成されてもよい。

さらなる実施形態は、本明細書に記載される方法の１つを実行するように構成または適合された、たとえばコンピュータまたはプログラマブル論理デバイスなどの処理手段を備える。

さらなる実施形態は、本明細書に記載される方法の１つを実行するためのコンピュータプログラムがインストールされたコンピュータを備える。

本発明によるさらなる実施形態は、本明細書に記載される方法の１つを実行するためのコンピュータプログラムを受信機に（たとえば、電子的または光学的に）送信するように構成された、装置またはシステムを備える。受信機は、たとえば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、たとえば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えてもよい。

いくつかの実施形態では、プログラマブル論理デバイス（たとえばフィールドプログラマブルゲートアレイ）は、明細書に記載される方法の機能の一部または全てを実行するために使用され得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載される方法の１つを実行するためにマイクロプロセッサと協働し得る。一般に、方法は、好ましくはいずれかのハードウェア装置によって実行される。

本明細書に記載される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置およびコンピュータの組み合わせを使用して、実装され得る。

本明細書に記載される装置、または本明細書に記載される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび／またはソフトウェアで実装され得る。

本明細書に記載される方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置およびコンピュータの組み合わせを使用して、実行され得る。

本明細書に記載される方法、または本明細書に記載される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび／またはソフトウェアによって実行され得る。

上記の実施形態は、本発明の原理を単に例示するものである。本明細書に記載される配置および詳細の修正および変形は、当業者にとって明らかとなることが理解される。したがって、喫緊の請求項の範囲によってのみ限定され、本明細書の実施形態の記載および説明によって提示される具体的詳細によっては限定されないことが意図される。

参考文
［１］Ａ．Ａｌｓｈｉｎ，Ｅ．Ａｌｓｈｉｎａ， “Ｍｕｌｔｉ－ｐａｒａｍｅｔｅｒｐｒｏｂａｂｉｌｉｔｙｕｐｄａｔｅｆｏｒＣＡＢＡＣ”，ＪＣＴＶＣ－Ｆ２５４，Ｔｏｒｉｎｏ，Ｊｕｌｙ，２０１１，ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ－ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／６＿Ｔｏｒｉｎｏ／ｗｇ１１／ＪＣＴＶＣ－Ｆ２５４－ｖ５．ｚｉｐ

［２］ＩＴＵ－Ｔ，ＲｅｃｏｍｍｏｎｄａｔｉｏｎＨ．２６５（１２／１６），ｈｔｔｐｓ：／／ｗｗｗ．ｉｔｕ．ｉｎｔ／ｒｅｃ／ｄｏｌｏｇｉｎ＿ｐｕｂ．ａｓｐ？ｌａｎｇ＝ｅ＆ｉｄ＝Ｔ－ＲＥＣ－Ｈ．２６５－２０１６１２－Ｉ！！ＰＤＦ－Ｅ＆ｔｙｐｅ＝ｉｔｅｍｓ

［３］Ｊ．Ｓｔｅｇｅｍａｎｎ，Ｈ．Ｋｉｒｃｈｈｏｆｆｅｒ，Ｄ．Ｍａｒｐｅ，Ｔ．Ｗｉｅｇａｎｄ， “Ｎｏｎ－ＣＥ１：Ｃｏｕｎｔｅｒ－ｂａｓｅｄｐｒｏｂａｂｉｌｉｔｙｍｏｄｅｌｕｐｄａｔｅｗｉｔｈａｄａｐｔｅｄａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇｅｎｇｉｎｅ“ ，ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ－ｓｕｄｐａｒｉｓ．ｅｕ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／７＿Ｇｅｎｅｖａ／ｗｇ１１／ＪＣＴＶＣ－Ｇ５４７－ｖ４．ｚｉｐ

［４］Ａ．Ｓａｉｄ，Ｍ．Ｋａｒｃｚｅｗｉｃｚ，Ｖ．Ｓｅｒｅｇｉｎ，Ｈ．Ｅｇｉｌｍｅｚ，Ｌ．Ｚｈａｎｇ，Ｘ．Ｚｈａｏ， “ＥＥ２：Ａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇｗｉｔｈｃｏｎｔｅｘｔ－ｄｅｐｅｎｄｅｎｔｄｏｕｂｌｅ－ｗｉｎｄｏｗａｄａｐｔａｔｉｏｎｒｅｓｐｏｎｓｅ”，ＪＶＥＴ－Ｈ００６１，ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ－ｓｕｄｐａｒｉｓ．ｅｕ／ｊｖｅｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／８＿Ｍａｃａｕ／ｗｇ１１／ＪＶＥＴ－Ｈ００６１－ｖ１．ｚｉｐ
Ａ．Ｓａｉｄ，Ｍ．Ｋａｒｃｚｅｗｉｃｚ，Ｖ．Ｓｅｒｅｇｉｎ，Ｈ．Ｅｇｉｌｍｅｚ，Ｌ．Ｚｈａｎｇ，Ｘ．Ｚｈａｏ， “ＥＥ２ｒｅｌａｔｅｄ：Ａｒｉｔｈｍｅｔｉｃｃｏｄｉｎｇｗｉｔｈｐｒｏｇｒｅｓｓｉｖｅｃｏｎｔｅｘｔ－ｄｅｐｅｎｄｅｎｔｄｏｕｂｌｅ－ｗｉｎｄｏｗａｄａｐｔａｔｉｏｎｒｅｓｐｏｎｓｅ”，ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｔ－ｓｕｄｐａｒｉｓ．ｅｕ／ｊｖｅｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／８＿Ｍａｃａｕ／ｗｇ１１／ＪＶＥＴ－Ｈ００６７－ｖ２．ｚｉｐ

Claims

少なくとも１つのプロセッサとメモリを含むビデオデコーダであって、前記メモリは、前記少なくとも１つのプロセッサによって実行されたときに、前記ビデオデコーダに、
バイナリシーケンスの符号化表現を算術的デコードに基づいてビデオコンテンツを復号化させ、
以下にしたがって第１ソース統計値ａｔ＋１を取得させ、

ここで、ｘｔは復号化されたバイナリ値であり、
ａｔは前記第１ソース統計値の前のバージョンであり、
ｎａは第１ウィンドウサイズパラメータであり、

ＢＩＴＳａは前記第１ソース統計値を表すために使用されるビット数であり、
以下にしたがって第２ソース統計値ｂｔ＋１を取得させ、

ここで、ｘｔは復号化されたバイナリ値であり、
ｂｔは前記第２ソース統計値の前のバージョンであり、
ｎｂは第２ウィンドウサイズパラメータであり、

ＢＩＴＳｂは前記第２ソース統計値を表すために使用されるビット数であり、
ここでｎｂ＞ｎａで、ＢＩＳＴＳｂ＞ＢＩＴＳａであり、
前記第１ソース統計値及び前記第２ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第１ソース統計値及び前記第２ソース統計値に適用される、決定させ、
前記結合ソース統計値に基づいて間隔サブディビジョンの１つ以上の範囲値を決定させ、
前記１つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現を前記バイナリシーケンスにマッピングさせる、
命令を含む、ビデオデコーダ。
前記ビデオデコーダは、前記プロセッサによって実行されると、前記ビデオデコーダに、
スライスがタイプＩ、Ｐ、又はＢであるかどうかを示すスライスタイプ情報を評価させ、
前記スライスタイプ情報に基づいて前記第１ウィンドウサイズパラメータ及び前記第２ウィンドウサイズパラメータを決定させる、
命令をさらに含む、請求項１に記載のビデオデコーダ。
前記ビデオデコーダは、前記プロセッサによって実行されると、前記ビデオデコーダに、
前記結合ソース統計値に基づいて状態インデックスを決定させ、
前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定させ、
前記状態インデックスに基づいて間隔サブディビジョンの１つ以上の範囲値を決定させる、
命令をさらに含む、請求項１に記載のビデオデコーダ。
前記メモリは前記プロセッサによって実行されたときに、前記ビデオデコーダに、

となるように、前記第１ウィンドウサイズパラメータ、ｎａ、及び前記第２ウィンドウサイズパラメータ、ｎｂを選択させる、
命令をさらに含む、請求項１に記載のビデオデコーダ。
前記メモリは前記プロセッサによって実行されたときに、前記ビデオデコーダに、
コンテキストモデルに基づいて、第１ウィンドウサイズパラメータ、及び第２ウィンドウサイズパラメータを決定させる、
命令をさらに含む、請求項１に記載のビデオデコーダ。
ビデオを復号化する方法であって、
バイナリシーケンスの符号化表現を算術的デコードに基づいてビデオコンテンツを復号化することと、
以下にしたがって第１ソース統計値ａｔ＋１を取得することと、

ここで、ｘｔは復号化されたバイナリ値であり、
ａｔは前記第１ソース統計値の前のバージョンであり、
ｎａは第１ウィンドウサイズパラメータであり、

ＢＩＴＳａは前記第１ソース統計値を表すために使用されるビット数であり、
以下にしたがって第２ソース統計値ｂｔ＋１を取得することと、

ここで、ｘｔは復号化されたバイナリ値であり、
ｂｔは前記第２ソース統計値の前のバージョンであり、
ｎｂは第２ウィンドウサイズパラメータであり、

ＢＩＴＳｂは前記第２ソース統計値を表すために使用されるビット数であり、
ここでｎｂ＞ｎａで、ＢＩＳＴＳｂ＞ＢＩＴＳａであり、
前記第１ソース統計値及び前記第２ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第１ソース統計値及び前記第２ソース統計値に適用される、決定することと、
前記結合ソース統計値に基づいて間隔サブディビジョンの１つ以上の範囲値を決定することと、
前記１つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現を前記バイナリシーケンスにマッピングすることと、
を含む、方法。
前記方法は、
スライスがタイプＩ、Ｐ、又はＢであるかどうかを示すスライスタイプ情報を評価することと、
前記スライスタイプ情報に基づいて前記第１ウィンドウサイズパラメータ及び前記第２ウィンドウサイズパラメータを決定することと、
をさらに含む、請求項６に記載の方法。
前記方法は、
前記結合ソース統計値に基づいて状態インデックスを決定することと、
前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定することと、
前記状態インデックスに基づいて間隔サブディビジョンの１つ以上の範囲値を決定することと、
をさらに含む、請求項６に記載の方法。
前記方法は、

となるように、前記第１ウィンドウサイズパラメータ、ｎａ、及び前記第２ウィンドウサイズパラメータ、ｎｂを選択することと、
をさらに含む、請求項６に記載の方法。
前記方法は、
コンテキストモデルに基づいて、第１ウィンドウサイズパラメータ、及び第２ウィンドウサイズパラメータを決定させることと、
をさらに含む、請求項６に記載の方法。
コンピュータプログラムがコンピュータによって実行されたときに、ビデオを復号化する方法を実行する、その上に記憶した前記コンピュータプログラムを有する非一時的デジタル記憶媒体であって、前記方法は、
バイナリシーケンスの符号化表現を算術的デコードに基づいてビデオコンテンツを復号化させることと、
以下にしたがって第１ソース統計値ａｔ＋１を取得させ、

ここで、ｘｔは復号化されたバイナリ値であり、
ａｔは前記第１ソース統計値の前のバージョンであり、
ｎａは第１ウィンドウサイズパラメータであり、

ＢＩＴＳａは前記第１ソース統計値を表すために使用されるビット数であり、
以下にしたがって第２ソース統計値ｂｔ＋１を取得し、

ここで、ｘｔは復号化されたバイナリ値であり、
ｂｔは前記第２ソース統計値の前のバージョンであり、
ｎｂは第２ウィンドウサイズパラメータであり、

ＢＩＴＳｂは前記第２ソース統計値を表すために使用されるビット数であり、
ここでｎｂ＞ｎａで、ＢＩＳＴＳｂ＞ＢＩＴＳａであり、
前記第１ソース統計値及び前記第２ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第１ソース統計値及び前記第２ソース統計値に適用される、決定させ、
前記結合ソース統計値に基づいて間隔サブディビジョンの１つ以上の範囲値を決定させ、
前記１つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現を前記バイナリシーケンスにマッピングさせる、
命令を含む、非一時的デジタル記憶媒体。
少なくとも１つのプロセッサとメモリを含むビデオエンコーダであって、前記メモリは、前記少なくとも１つのプロセッサによって実行されたときに、前記ビデオエンコーダに、
バイナリシーケンスの符号化表現を算術的エンコードに基づいてビデオコンテンツを符号化させ、
以下にしたがって第１ソース統計値ａｔ＋１を取得させ、

ここで、ｘｔは符号化されたバイナリ値であり、
ａｔは前記第１ソース統計値の前のバージョンであり、
ｎａは第１ウィンドウサイズパラメータであり、

ＢＩＴＳａは前記第１ソース統計値を表すために使用されるビット数であり、
以下にしたがって第２ソース統計値ｂｔ＋１を取得させ、

ここで、ｘｔは符号化されたバイナリ値であり、
ｂｔは前記第２ソース統計値の前のバージョンであり、
ｎｂは第２ウィンドウサイズパラメータであり、

ＢＩＴＳｂは前記第２ソース統計値を表すために使用されるビット数であり、
ここでｎｂ＞ｎａで、ＢＩＳＴＳｂ＞ＢＩＴＳａであり、
前記第１ソース統計値及び前記第２ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第１ソース統計値及び前記第２ソース統計値に適用する、決定させ、
前記結合ソース統計値に基づいて間隔サブディビジョンの１つ以上の範囲値を決定させ、
前記１つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現に前記バイナリシーケンスをマッピングさせる、
命令を含む、ビデオエンコーダ。
前記ビデオエンコーダは、前記プロセッサによって実行されると、前記ビデオエンコーダに、
スライスがタイプＩ、Ｐ、又はＢであるかどうかを示すスライスタイプ情報を符号化させ、
前記スライスタイプ情報に基づいて前記第１ウィンドウサイズパラメータ及び前記第２ウィンドウサイズパラメータを決定させる、
命令をさらに含む、請求項１２に記載のビデオエンコーダ。
前記ビデオエンコーダは、前記プロセッサによって実行されると、前記ビデオエンコーダに、
前記結合ソース統計値に基づいて状態インデックスを決定させ、
前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定させ、
前記状態インデックスに基づいて間隔サブディビジョンの１つ以上の範囲値を決定させる、
命令をさらに含む、請求項１２に記載のビデオエンコーダ。
前記メモリは前記プロセッサによって実行されたときに、前記ビデオエンコーダに、

となるように、前記第１ウィンドウサイズパラメータ、ｎａ、及び前記第２ウィンドウサイズパラメータ、ｎｂを選択させる、
命令をさらに含む、請求項１２に記載のビデオエンコーダ。
前記メモリは前記プロセッサによって実行されたときに、前記ビデオエンコーダに、
コンテキストモデルに基づいて、第１ウィンドウサイズパラメータ、及び第２ウィンドウサイズパラメータを決定させる、
命令をさらに含む、請求項１２に記載のビデオエンコーダ。
ビデオを符号化する方法であって、
バイナリシーケンスの符号化表現を算術的エンコードに基づいてビデオコンテンツを符号化することと、
以下にしたがって第１ソース統計値ａｔ＋１を取得することと、

ここで、ｘｔは符号化されたバイナリ値であり、
ａｔは前記第１ソース統計値の前のバージョンであり、
ｎａは第１ウィンドウサイズパラメータであり、

ＢＩＴＳａは前記第１ソース統計値を表すために使用されるビット数であり、
以下にしたがって第２ソース統計値ｂｔ＋１を取得することと、

ここで、ｘｔは符号化されたバイナリ値であり、
ｂｔは前記第２ソース統計値の前のバージョンであり、
ｎｂは第２ウィンドウサイズパラメータであり、

ＢＩＴＳｂは前記第２ソース統計値を表すために使用されるビット数であり、
ここでｎｂ＞ｎａで、ＢＩＳＴＳｂ＞ＢＩＴＳａであり、
前記第１ソース統計値及び前記第２ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第１ソース統計値及び前記第２ソース統計値に適用される、決定することと、
前記結合ソース統計値に基づいて間隔サブディビジョンの１つ以上の範囲値を決定することと、
前記１つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現に前記バイナリシーケンスをマッピングすることと、
を含む、方法。
前記方法は、
スライスがタイプＩ、Ｐ、又はＢであるかどうかを示すスライスタイプ情報を評価することと、
前記スライスタイプ情報に基づいて前記第１ウィンドウサイズパラメータ及び前記第２ウィンドウサイズパラメータを決定することと、
をさらに含む、請求項１７に記載の方法。
前記方法は、
前記結合ソース統計値に基づいて状態インデックスを決定することと、
前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定することと、
前記状態インデックスに基づいて間隔サブディビジョンの１つ以上の範囲値を決定することと、
をさらに含む、請求項１７に記載の方法。
前記方法は、

となるように、前記第１ウィンドウサイズパラメータ、ｎａ、及び前記第２ウィンドウサイズパラメータ、ｎｂを選択することと、
をさらに含む、請求項１７に記載の方法。
前記方法は、
コンテキストモデルに基づいて、第１ウィンドウサイズパラメータ、及び第２ウィンドウサイズパラメータを決定することと、
をさらに含む、請求項１７に記載の方法。
コンピュータプログラムがコンピュータによって実行されたときに、ビデオを符号化する方法を実行する、その上に記憶した前記コンピュータプログラムを有する非一時的デジタル記憶媒体であって、前記方法は、
バイナリシーケンスの符号化表現を算術的エンコードに基づいてビデオコンテンツを符号化させることと、
以下にしたがって第１ソース統計値ａｔ＋１を取得させ、

ここで、ｘｔは符号化されたバイナリ値であり、
ａｔは前記第１ソース統計値の前のバージョンであり、
ｎａは第１ウィンドウサイズパラメータであり、

ＢＩＴＳａは前記第１ソース統計値を表すために使用されるビット数であり、
以下にしたがって第２ソース統計値ｂｔ＋１を取得し、

ここで、ｘｔは符号化されたバイナリ値であり、
ｂｔは前記第２ソース統計値の前のバージョンであり、
ｎｂは第２ウィンドウサイズパラメータであり、

ＢＩＴＳｂは前記第２ソース統計値を表すために使用されるビット数であり、
ここでｎｂ＞ｎａで、ＢＩＳＴＳｂ＞ＢＩＴＳａであり、
前記第１ソース統計値及び前記第２ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第１ソース統計値及び前記第２ソース統計値に適用される、決定させ、
前記結合ソース統計値に基づいて間隔サブディビジョンの１つ以上の範囲値を決定させ、
前記１つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現に前記バイナリシーケンスをマッピングさせる、
命令を含む、非一時的デジタル記憶媒体。