JP2023018041A - ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム - Google Patents

ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム Download PDF

Info

Publication number
JP2023018041A
JP2023018041A JP2022184990A JP2022184990A JP2023018041A JP 2023018041 A JP2023018041 A JP 2023018041A JP 2022184990 A JP2022184990 A JP 2022184990A JP 2022184990 A JP2022184990 A JP 2022184990A JP 2023018041 A JP2023018041 A JP 2023018041A
Authority
JP
Japan
Prior art keywords
video
source statistic
source
statistic
video decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022184990A
Other languages
English (en)
Other versions
JP7451655B2 (ja
Inventor
ステゲマン・ヤン
Stegemann Jan
キルヒホッファー・ハイナー
Kirchhoffer Heiner
マルペ・デトレフ
Marpe Detlev
シュワルツ・ハイコー
Schwarz Heiko
ヴィーガンド・トーマス
Wiegand Thomas
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of JP2023018041A publication Critical patent/JP2023018041A/ja
Priority to JP2024034116A priority Critical patent/JP2024063203A/ja
Application granted granted Critical
Publication of JP7451655B2 publication Critical patent/JP7451655B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】算術符号化と復号化を最適な符号化効率で実現するために、計算効率と信頼性との間の適切なトレードオフを実現するビデオデコーダ及びエンコーダ並びに復号及び符号化方法を提供する。【解決手段】ビデオデコーダ100は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない独立した符号化モードか、前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある単一予測モードか又は1つ以上の前のフレームの2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある両方向予測モードを使用して、スライスが符号化されたか示すスライスタイプ情報を評価する。算術デコーダは、第1、第2ソース統計値を決定し、復号化バイナリシーケンスにマッピングするために使用する間隔サブディビジョンの1つ以上の範囲値を決定する。【選択図】図1

Description

本発明による実施形態は、ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリームに関する。
本発明による一実施形態は、バイナリ算術符号化の確率推定方法に関し、これはたとえば、ビデオエンコーダ、ビデオデコーダ、さらに画像エンコーダ、画像デコーダ、オーディオエンコーダ、オーディオデコーダなどでも使用され得る。
算術符号化および復号化は、オーディオおよびビデオコンテンツの符号化および復号化における貴重なツールであることが証明されている。たとえば、符号化効率を高めるために、ビデオまたはオーディオコンテンツを表すバイナリシーケンス内のバイナリ値の既知の発生確率を利用することが可能である。特に、算術符号化は、「0」および「1」の様々な確率を効率的に処理することができ、確率の変化に正確に適応することができる。
しかしながら、算術符号化および復号化を最適な符号化効率で実現するためには、実際の発生確率をよく反映する「0」および「1」の確率に関する適切な情報を入手することが重要である。「0」および「1」の確率に関する(または一般に、符号化すべきシンボルの確率に関する)知識は通常、(たとえば、全範囲の値が、異なるバイナリ値またはバイナリ値のグループに関連付けられた間隔に細分化されるように)間隔サブディビジョンを取得するために、値の全範囲内の間隔の境界を調整するために使用される。
したがって、計算効率と信頼性との間の適切なトレードオフを提供する、ソース統計値、または間隔サブディビジョンの範囲値を決定するための概念が必要とされている。
本発明による一実施形態はビデオデコーダを作成し、ビデオデコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するように構成されている。
ビデオデコーダは、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するように構成されており、ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロック(たとえば、1つのみのブロック)のピクセルに基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するように構成されている。ビデオデコーダは、バイナリシーケンスの符号化表現に基づいて(たとえば、画像コンテンツの変換係数を記述する)復号化バイナリシーケンスを提供するための算術デコーダを含む。算術デコーダは、前に復号化されたバイナリシーケンスに基づいて、(たとえばウィンドウサイズ変数で表され得る)第1ウィンドウサイズ(たとえばw)を使用して、(たとえば、前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づく)(そしてたとえば、「カウンタ変数」または「カウンタ」としても指定される)第1ソース統計値(たとえばa)を決定するように、そしてたとえば前に復号化されたバイナリシーケンスに基づいて、第2ウィンドウサイズ(たとえばw)を使用して、(前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づく)第2ソース統計値(たとえばb)を決定するように、構成されている。算術デコーダは、たとえば、第1ソース統計値(たとえばa)に基づいて、および第2ソース統計値(たとえばb)に基づいて、結合ソース統計値(たとえば
Figure 2023018041000002
またはp)を決定するように構成されている。算術デコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
ビデオデコーダの好適な実施形態では、算術デコーダは、スライスタイプ情報に応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている(たとえば、異なる値を取るようになっており、第1ウィンドウサイズおよび第2ウィンドウサイズはたとえば、1および11を含む、1から11までの範囲内にあってもよい)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、ビットストリームに含まれる初期化パラメータまたはフラグ(たとえば、「cabac init flag」)にも応じて(たとえばスライスあたり1つの初期化フラグ)、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されており、初期化フラグは、任意選択的に、第1ソース統計値および/または第2ソース統計値の初期化値も定義し得る。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、コンテキストモデルにも応じて(たとえばどのタイプの情報が復号化されるか、たとえば変換係数の1つ以上の最上位ビットまたは変換係数の1つ以上の下位ビットのどちらが復号化されるかに応じて)、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。たとえば、第1ウィンドウサイズおよび第2ウィンドウサイズを定義するウィンドウサイズ値のペアは、スライスタイプ、初期化フラグ、およびコンテキストモデルの組み合わせごとに事前定義され得る。
好適な実施形態では、ビデオデコーダは、第1ソース統計値の更新バージョン(at+1)を取得するために、前に復号化されたバイナリ値(たとえばx))に応じて第1ソース統計値のあらかじめ計算されたインスタンス(たとえばa)に所定の値(たとえば
Figure 2023018041000003
)を選択的に加算し、第1ソース統計値(たとえば
Figure 2023018041000004
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。あるいは、または追加で、ビデオデコーダは、第2ソース統計値の更新バージョン(たとえばbt+1)を取得するために、前に復号化されたバイナリ値(たとえばx))に応じて第2ソース統計値のあらかじめ計算されたインスタンス(たとえばb)に所定の値(たとえば
Figure 2023018041000005
)を選択的に加算し、第2ソース統計値(たとえば
Figure 2023018041000006
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。
好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値の更新バージョンat+1を取得するように構成されており、
Figure 2023018041000007
ここで、aは第1ソース統計値のあらかじめ計算されたバージョン、xは前に復号化されたバイナリ値(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、
Figure 2023018041000008
ここで、BITSaは第1ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
あるいは、または追加で、ビデオデコーダは、以下にしたがって第2ソース統計値の更新バージョンbt+1を取得するように構成されており、
Figure 2023018041000009
ここで、bは第2ソース統計値のあらかじめ計算されたバージョン、xは前に復号化されたシンボル(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、ここで
Figure 2023018041000010
ここで、BITSは第2ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
好適な実施形態では、k=1および/またはk=1である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 2023018041000011
および
Figure 2023018041000012
ここで、aはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 2023018041000013
であり、そして「>>」は右シフト演算子であり、および/またはビデオデコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 2023018041000014
および
Figure 2023018041000015
ここで、bはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 2023018041000016
である。
なお、第1および第2ソース統計値の更新は、パラメータBITSa/bおよびna/bのみが異なることに留意されたい。この好適な実施形態の終わりまで、aおよびbの両方の更新手順について論じるために、aおよびaが使用される。bの更新手順を生み出すには、以下の式で、すべての出現箇所を単純にbに置き換える必要がある。
更新手順は、以下のように記述し直すことができる。
Figure 2023018041000017
および
Figure 2023018041000018
これは、上記の元の更新式とまったく同じ結果を生じる。上記2つの更新式の最初の式は、以下のように記述し直すことができる。
Figure 2023018041000019
ここで、
Figure 2023018041000020
なお、ONEは、1に等しい確率値を表すことに留意されたい。効率的な実装のために、ONEを量子化またはわずかに変更することが合理的であろう(たとえば、少量を加算または減算することによる)。これは、ソース統計値の挙動に対して実質的に影響を与えない。たとえば、
Figure 2023018041000021
を使用すると、ONEのバイナリ表現は、元のバージョンよりも1ビット少なくなければならない。しかしながら、ソース統計値の更新の挙動は実質的に変更されない。
好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 2023018041000022
ここで、aはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 2023018041000023
、そして>>は右シフト演算子である。
あるいは、または追加で、ビデオデコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 2023018041000024
ここで、bはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 2023018041000025
である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 2023018041000026
ここで、aはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 2023018041000027
であり、そして「>>」は右シフト演算子であり、および/またはビデオデコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 2023018041000028
ここで、bはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 2023018041000029
、そして「>>」は右シフト演算子である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって結合ソース統計値
Figure 2023018041000030
を取得するように構成されており、
Figure 2023018041000031
ここで、aは第1ソース統計値、bは第2ソース統計値である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されており、異なる重みが第1ソース統計値および第2ソース統計値に関連付けられる(任意選択的に、ビデオデコーダは、復号化プロセス中に重みを変更するように構成される)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)の表現のために異なるビット数(たとえばBITS、BITS)を使用するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)のために異なるウィンドウサイズを使用するように構成されており、ビデオデコーダは、比較的大きいウィンドウサイズを有するソース統計値の表現には比較的大きいビット数を使用し、比較的小さいウィンドウサイズを有するソース統計値の表現には比較的小さいビット数を使用するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値aおよび/または第2ソース統計値bの数表現を修正するように構成されており、
Figure 2023018041000032
および/または
Figure 2023018041000033
その後結合ソース統計値を決定し、ここで
Figure 2023018041000034
ここでBITSは第1ソース統計値の表現に割り当てられたビット数、BITSは第2ソース統計値の表現に割り当てられたビット数である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって結合ソース統計値
Figure 2023018041000035
を決定するように構成されており、
Figure 2023018041000036
そしてビデオデコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 2023018041000037
ここで、最確(たとえばバイナリ)値の値は以下にしたがって決定され、
Figure 2023018041000038
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から0.5までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって結合ソース統計値
Figure 2023018041000039
を決定するように構成されており、
Figure 2023018041000040
そしてビデオデコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 2023018041000041
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から1までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ウィンドウサイズに応じて、および第2ウィンドウサイズに応じて、第1ソース統計値(たとえばa)および第2ソース統計値の表現のビット数(たとえばBITS、BITS)を選択するように構成されている(たとえば、
Figure 2023018041000042
にしたがって、ここで
Figure 2023018041000043
またはn=round(log)、round()は切り上げまたは切り捨て演算子、および/または
Figure 2023018041000044
にしたがって、ここで
Figure 2023018041000045
またはn=round(log)、ThrHdは所定の好ましい固定値)。
ビデオデコーダの好適な実施形態では、第1ソース統計値(a)および第2ソース統計値(b)の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である(または第1ソース統計値の表現に使用されるビット数の変形例の場合は独立している)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、ビットストリームに含まれる(たとえば専用の)初期化フラグ(たとえば、「ws_flag」)にも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されており、ビデオデコーダは、ビットストリームに含まれる別の初期化フラグ(たとえば、「cabac init flag」)に応じて、第1ソース統計値および/または第2ソース統計値の初期化値を設定するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダまたは算術デコーダは、現在のスライスの時間レベルにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。あるいは、または追加で、ビデオデコーダまたは算術デコーダは、現在のスライスの量子化パラメータにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、位置に応じて第1ウィンドウサイズおよび/または第2ウィンドウサイズを調整するように構成されている(たとえば、いくつのバイナリ値が現在のスライス内で既に復号化されたかに応じて、またはコンテキストの初期化以降、第1ウィンドウサイズおよび/または第2ウィンドウサイズが関連付けられているコンテキストモデルを使用して、または復号化されるバイナリ値が関連付けられているフレーム内のピクセルまたはピクセルのブロックの位置に応じて)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、開始位置(たとえばピクセルのブロックの最初の行、またはピクセルのブロックの最初の列)に関連付けられたバイナリ値を復号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを開始値(好ましくは通常値よりも小さい)に設定し、少なくとも所定の位置(または距離)だけ開始位置から離れた位置に関連付けられたバイナリ値を復号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを通常値(好ましくは開始値よりも大きい)に設定するように、構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、ウィンドウサイズを変更すべきであることを通知する信号フラグ(たとえば「ctu_ws_flag」フラグ)に応答して、スライス内の第1ウィンドウサイズおよび/または第2ウィンドウサイズを変更するように構成されている(たとえば、スライスを復号化するとき)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、複数の符号化ツリーユニット(またはすべての符号化ツリーユニットでもよい)について、ウィンドウサイズを変更すべきかどうかを示す信号フラグを評価し、信号フラグに応じてウィンドウサイズの少なくとも1つを拡大または縮小するように(たとえば、ウィンドウサイズの最大範囲を超えないように気をつけながら、信号フラグに応じて1つだけ、異なるコンテキストモデルであってもすべてのウィンドウサイズをまとめて拡大または縮小するように)、構成されている。代替例として、いくつかのコンテキストモデルのウィンドウサイズのみを拡大または縮小することも可能である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、たとえば式(8)または式(12)または式(14)にしたがって、結合ソース統計値(たとえば
Figure 2023018041000046
またはp)から状態インデックス(たとえばpStateIdx)を導出するように構成されている。あるいは、または追加で、ビデオデコーダは、たとえば式(9)または式(13にしたがって、最確バイナリ値または最低確率バイナリ値を表す値(たとえばvalMPS)を導出するように構成されている。また、ビデオデコーダは、間隔サブディビジョンの1つ以上の範囲値に状態インデックスをマッピングするテーブルを評価するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第2ソース統計値を一定の置換値で一時的に(たとえば、初期化の直後のみならず、バイナリシーケンスの複数のバイナリ値の復号化のために)置き換え、結合ソース統計値を取得するために第1ソース統計値(たとえばa)を固定の非ゼロ置換値と組み合わせるように、構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
=nまたは
|n-n|≧3
ここで、
Figure 2023018041000047
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 2023018041000048
またはn=round(log)である。
好適な実施形態では、ビデオデコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
|n-n|≧3
ここで、
Figure 2023018041000049
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 2023018041000050
またはn=round(log)である。
本発明による別の実施形態はビデオデコーダを作成し、ビデオデコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するように構成されており、ビデオデコーダは、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するように構成されている。ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するように構成されている。ビデオデコーダは、バイナリシーケンスの符号化表現に基づいて(たとえば、画像コンテンツの変換係数を記述する)復号化バイナリシーケンスを提供するための算術デコーダを含む。算術デコーダは、たとえば、ウィンドウサイズ変数で表され得る、第1ウィンドウサイズ(たとえばw)を使用して、第1ソース統計値(たとえば、a)(前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、「カウンタ変数」または「カウンタ」としても指定され得る)を決定するように構成されている。算術デコーダは、たとえば、前に復号化されたバイナリシーケンスに基づいて第1ソース統計値を決定してもよい。算術デコーダは、結合ソース統計値(たとえば、
Figure 2023018041000051
またはp)を決定するように構成されており、算術デコーダは、結合ソース統計値を取得するために、第1ソース統計値(たとえば、a)を固定の非ゼロ値と組み合わせるように構成されており、算術デコーダは、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されており、算術デコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
この実施形態は、個別におよび組み合わせて、先に論じられた実施形態に関して述べられた特徴、機能、および詳細のいずれかによって補足され得る。
本発明による一実施形態はビデオエンコーダを作成し、ビデオエンコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するように構成されており、
ビデオエンコーダは、1つ以上のスライスのセット(好ましくは複数のスライス)に細分化されたビデオフレームを符号化するように構成されている。ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。ビデオエンコーダは、バイナリシーケンスに基づいて(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するための算術エンコーダを含む(バイナリシーケンスは、変換係数またはスペクトル係数、またはパラメータ、またはその他いずれかの情報、たとえば符号化されるビデオコンテンツのフレームのコンテンツを表す情報を表し得る)。算術エンコーダは、たとえばウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、第1ソース統計値(a)を決定するように構成されており、これはたとえば、前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」としても指定され得る。ビデオエンコーダは、たとえば、前に符号化されたバイナリシーケンスに基づいて第1ソース統計値を決定し得る。算術エンコーダまたはビデオエンコーダは、第2ウィンドウサイズ(たとえば、w)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよい、第2ソース統計値(たとえば、b)を決定するように構成され得る。算術エンコーダまたはビデオエンコーダは、たとえば前に符号化されたバイナリシーケンスに基づいて、第2ソース統計値を決定するように構成され得る。算術エンコーダは、第1ソース統計値(たとえば、a)に基づいて、および第2ソース統計値(たとえば、bに基づいて、結合ソース統計値(たとえば、
Figure 2023018041000052
またはp)を決定するように構成されており、算術エンコーダは、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
好適な実施形態では、ビデオエンコーダ(または同等に、算術エンコーダ)は、スライスタイプ情報に応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている(たとえば、第1ウィンドウサイズおよび第2ウィンドウサイズはたとえば、1および11を含む、1から11までの範囲内にあってもよい、2つの異なる値)。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、初期化パラメータまたはフラグ(たとえば、「cabac init flag」フラグ)を提供するように構成されており、ビデオエンコーダは、ビデオエンコーダによってビットストリーム(たとえば、ビデオフレームを表すビットストリーム)に含まれる初期化パラメータまたはフラグ(たとえば、「cabac init flag」)にも応じて第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。たとえば、ビデオエンコーダは、スライスあたり1つの初期化フラグを提供し、初期化フラグは、任意選択的に、第1ソース統計値および/または第2ソース統計値の初期化値も定義し得る。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、コンテキストモデルにも応じて(たとえばどのタイプの情報が符号化されるか、たとえば変換係数の1つ以上の最上位ビットまたは変換係数の1つ以上の下位ビットのどちらが符号化されるかに応じて)、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。たとえば、第1ウィンドウサイズおよび第2ウィンドウサイズを定義するウィンドウサイズ値のペアは、スライスタイプ、初期化フラグ、およびコンテキストモデルの組み合わせごとに事前定義され得る。
好適な実施形態では、ビデオエンコーダは、第1ソース統計値の更新バージョン(at+1)を取得するために、前に符号化されたバイナリ値(たとえばx))に応じて第1ソース統計値のあらかじめ計算されたインスタンス(たとえばa)に所定の値(たとえば
Figure 2023018041000053
)を選択的に加算し、第1ソース統計値(たとえば
Figure 2023018041000054
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。あるいは、または追加で、ビデオエンコーダは、第2ソース統計値の更新バージョン(たとえばbt+1)を取得するために、前に符号化されたバイナリ値(たとえばx))に応じて第2ソース統計値のあらかじめ計算されたインスタンス(たとえばb)に所定の値(たとえば
Figure 2023018041000055
)を選択的に加算し、第2ソース統計値(たとえば
Figure 2023018041000056
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。
好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値の更新バージョンat+1を取得するように構成されており、
Figure 2023018041000057
ここで、aは第1ソース統計値のあらかじめ計算されたソース統計値バージョン、xは前に符号化されたバイナリ値(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、
Figure 2023018041000058
ここで、BITSaは第1ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値の更新バージョンbt+1を取得するように構成されており、
Figure 2023018041000059
ここで、bは第2ソース統計値のあらかじめ計算されたバージョン、xは前に符号化されたシンボル(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、ここで
Figure 2023018041000060
ここで、BITSは第2ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
好適な実施形態では、k=1および/またはk=1である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、(たとえば、値xt+1の符号化のため)以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 2023018041000061
および
Figure 2023018041000062
ここで、aはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 2023018041000063
、そして「>>」は右シフト演算子である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されてもよく、
Figure 2023018041000064
および
Figure 2023018041000065
ここで、bはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 2023018041000066
である。
好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 2023018041000067
ここで、aはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 2023018041000068
、そして>>は右シフト演算子である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 2023018041000069
ここで、bはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 2023018041000070
である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 2023018041000071
ここで、aはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 2023018041000072
、そして「>>」は右シフト演算子である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されてもよく、
Figure 2023018041000073
ここで、btはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 2023018041000074
、そして「>>」は右シフト演算子である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって結合ソース統計値
Figure 2023018041000075
を取得するように構成されており、
Figure 2023018041000076
ここで、aは第1ソース統計値、bは第2ソース統計値である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されており、異なる重みが第1ソース統計値および第2ソース統計値に関連付けられる。任意選択的に、ビデオエンコーダは、符号化プロセス中に重みを変更するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)の表現のために異なるビット数(たとえばBITS、BITS)を使用するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)のために異なるウィンドウサイズを使用するように構成されており、ビデオエンコーダは、比較的大きいウィンドウサイズを有するソース統計値の表現には比較的大きいビット数を使用し、比較的小さいウィンドウサイズを有するソース統計値の表現には比較的小さいビット数を使用するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値aおよび/または第2ソース統計値bの数表現を修正するように構成されており、
Figure 2023018041000077
および/または
Figure 2023018041000078
その後結合ソース統計値を決定し、ここで
Figure 2023018041000079
、そして
ここでBITSaは第1ソース統計値の表現に割り当てられたビット数、BITSbは第2ソース統計値の表現に割り当てられたビット数である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって結合ソース統計値
Figure 2023018041000080
を決定するように構成されており、
Figure 2023018041000081
そしてビデオエンコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 2023018041000082
ここで、最確(たとえばバイナリ)値の値は以下にしたがって決定され、
Figure 2023018041000083
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から0.5までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって結合ソース統計値
Figure 2023018041000084
を決定するように構成されており、
Figure 2023018041000085
そしてビデオエンコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 2023018041000086
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から1までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ウィンドウサイズに応じて、および第2ウィンドウサイズに応じて、第1ソース統計値(たとえばa)および第2ソース統計値の表現のビット数(たとえばBITS、BITS)を選択するように構成されている(たとえば、
Figure 2023018041000087
にしたがって、ここで
Figure 2023018041000088
またはn=round(log)、round()は切り上げまたは切り捨て演算子、または
Figure 2023018041000089
にしたがって、ここで
Figure 2023018041000090
またはn=round(log)、ThrHdは所定の好ましい固定値)。
ビデオエンコーダの好適な実施形態では、第1ソース統計値(たとえば、a)および第2ソース統計値(たとえば、b)の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である(または第1ソース統計値の表現に使用されるビット数の変形例の場合は独立している)。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、(スライスタイプのように、可能であれば他の構成情報に加えて)第1ウィンドウサイズおよび第2ウィンドウサイズを決定する初期化フラグ(たとえば、「ws_flag」またはウィンドウサイズフラグ)をビットストリームに含めるように構成されており、ビデオエンコーダは、第1ソース統計値および/または第2ソース統計値を決定する他の初期化パラメータまたはフラグ(たとえば、「cabac init flag」)をビットストリームに含めるように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、現在のスライスの時間レベルにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。あるいは、または追加で、ビデオエンコーダは、現在のスライスの量子化パラメータにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、位置に応じて第1ウィンドウサイズおよび/または第2ウィンドウサイズを調整するように構成されている(たとえば、いくつのバイナリ値が現在のスライス内で既に符号化されたかに応じて、またはコンテキストの初期化以降、第1ウィンドウサイズおよび/または第2ウィンドウサイズが関連付けられているコンテキストモデルを使用して、または符号化されるバイナリ値が関連付けられているフレーム内のピクセルまたはピクセルのブロックの位置に応じて)。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、開始位置(たとえばピクセルのブロックの最初の行、またはピクセルのブロックの最初の列)に関連付けられたバイナリ値を復号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを開始値(好ましくは通常値よりも小さい)に設定し、少なくとも所定の位置だけ開始位置から離れた位置に関連付けられたバイナリ値を符号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを通常値(好ましくは開始値よりも大きい)に設定するように、構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、スライス内でウィンドウサイズを変更すべきであることを通知する信号フラグ(たとえば「ctu_ws_flag」またはウィンドウサイズ変更信号フラグ)をビットストリームに含めるように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、ビットストリームに、複数の符号化ツリーユニット(またはすべての符号化ツリーユニットでもよい)について、ウィンドウサイズを変更すべきかどうかを示す信号フラグを含めるように構成されており、信号フラグは、ウィンドウサイズの少なくとも1つを拡大すべきか縮小すべきかを示す(たとえば、ウィンドウサイズの最大範囲を超えないように気をつけながら、信号フラグに応じて1つだけ、異なるコンテキストモデルであってもすべてのウィンドウサイズをまとめて拡大または縮小する)。代替例として、ビデオエンコーダは、いくつかのコンテキストモデルのウィンドウサイズのみを拡大または縮小してもよい。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、たとえば式(8)または式(12)または式(14)にしたがって、結合ソース統計値(たとえば
Figure 2023018041000091
またはp)から状態インデックス(たとえばpStateIdx)を導出するように構成されている。あるいは、または追加で、ビデオエンコーダは、たとえば式(9)または式(13)にしたがって、最確バイナリ値または最低確率バイナリ値を表す値(たとえばvalMPS)を導出するように構成されてもよい。ビデオエンコーダはまた、間隔サブディビジョンの1つ以上の範囲値に状態インデックスをマッピングするテーブルを評価するように構成されてもよい。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第2ソース統計値を一定の置換値で一時的に(たとえば、初期化の直後のみならず、バイナリシーケンスの複数のバイナリ値の符号化のために)置き換え、結合ソース統計値を取得するために第1ソース統計値(たとえばa)を固定の非ゼロ置換値と組み合わせるように、構成されてもよい。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
=nまたは
|n-n|≧3
ここで、
Figure 2023018041000092
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 2023018041000093
またはn=round(log)である。
好適な実施形態では、ビデオエンコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
|n-n|≧3
ここで、
Figure 2023018041000094
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 2023018041000095
またはn=round(log)である。
本発明による一実施形態はビデオエンコーダを作成し、ビデオエンコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するように構成されており、
ビデオエンコーダは、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを符号化するように構成されている。ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。ビデオエンコーダは、バイナリシーケンスに基づいて、(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するための算術エンコーダを含む(バイナリシーケンスは、スペクトル係数、パラメータ、またはその他いずれかの情報の変換係数を表す)。算術エンコーダは、たとえば、ウィンドウサイズ変数で表され得る、第1ウィンドウサイズ(たとえばw)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、「カウンタ変数」またはカウンタとしても指定され得る、第1ソース統計値(たとえば、a)を決定するように構成されている。算術エンコーダは、たとえば前に符号化されたバイナリシーケンスに基づいて、第1ソース統計値を決定するように構成され得る。算術エンコーダは、結合ソース統計値(たとえば、
Figure 2023018041000096
またはp)を決定するように構成されており、算術エンコーダは、結合ソース統計値を取得するために、第1ソース統計値(たとえば、at)を固定の非ゼロ値と組み合わせるように構成されており、算術エンコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現にバイナリシーケンスをマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
実施形態は、任意選択的に、個別におよび組み合わせて、先に記載された実施形態の特徴、機能、および詳細のいずれかによって補足することができる。
本発明による一実施形態は、ビデオコンテンツを復号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するステップを含む。方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロック(または1つのみのブロック)のピクセルに基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するステップを含む。方法は、バイナリシーケンスの符号化表現に基づいて[たとえば、画像コンテンツの変換係数を記述する]復号化バイナリシーケンスを提供するステップを含み、方法は、たとえば、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」としても指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。第1ソース統計値は、たとえば、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第2ウィンドウサイズ(たとえば、w)を使用して、たとえば復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよい、第2ソース統計値(たとえば、b)を決定するステップも含む。第2ソース統計値は、たとえば、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第1ソース統計値(たとえば、a)に基づいて、および第2ソース統計値(たとえば、b)に基づいて、結合ソース統計値(たとえば
Figure 2023018041000097
またはp)を決定するステップも含む。方法はまた、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップも含む。
本発明による一実施形態は、ビデオコンテンツを復号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するステップを含む。方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロック(または1つのみのブロック)のピクセルに基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するステップを含む。方法は、バイナリシーケンスの符号化表現に基づいて(たとえば、画像コンテンツの変換係数を記述する)復号化バイナリシーケンスを提供するステップを含む。方法は、たとえば、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、「カウンタ変数」、「カウンタ」としても指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。たとえば、第1ソース統計値は、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法は、結合ソース統計値(たとえば、
Figure 2023018041000098
またはp)を決定するステップを含み、第1ソース統計値(たとえばa)は、結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられる。方法は、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを、さらに含む。
一実施形態は、ビデオコンテンツを符号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを符号化するステップを含む。方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。方法は、バイナリシーケンスに基づいて(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するステップを含む(バイナリシーケンスは、変換係数またはスペクトル係数、パラメータ、またはその他いずれかの情報を表し得る)。
方法は、たとえば、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」として指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。第1ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第2ウィンドウサイズ(たとえば、w)を使用して、たとえば符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよい、第2ソース統計値(たとえば、b)を決定するステップも含む。第2ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法は、第1ソース統計値(たとえば、a)に基づいて、および第2ソース統計値(たとえば、b)に基づいて、結合ソース統計値(たとえば、
Figure 2023018041000099
またはp)を決定するステップも含む。方法は、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む。
一実施形態は、ビデオコンテンツを符号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを符号化するステップを含む。方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。方法は、バイナリシーケンスに基づいて(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するステップを含む(バイナリシーケンスは、変換係数またはスペクトル係数、パラメータ、またはその他いずれかの情報を表し得る)。方法は、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」として指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。第1ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法は、結合ソース統計値(たとえば、
Figure 2023018041000100
またはp)を決定するステップを含み、第1ソース統計値(たとえばa)は、結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられる。方法は、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む。
なお、本明細書に記載されるすべての方法は、個別におよび組み合わせて、対応する装置(たとえばビデオエンコーダおよびビデオデコーダ)に関して記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。また、装置は、方法と並行して適応され得る。言い換えると、装置、または機能ボックの説明は、方法または方法ステップの説明にも対応する。
本発明による別の実施形態は、コンピュータプログラムがコンピュータ上で実行されたときに本明細書に記載される方法の少なくとも1つを実行するための、コンピュータプログラムを作成する。
本発明による一実施形態は、ビデオコンテンツを表す、バイナリシーケンスの符号化表現と、バイナリシーケンスの符号化表現に基づいてビデオコンテンツを再構築するために使用されるビデオデコーダの構成を記述する構成情報とを含む、ビデオビットストリームを作成する。構成情報は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの1つ以上の範囲値を決定するために使用される、第1ソース統計値(たとえば、a)を決定するためにビデオデコーダによって使用されるウィンドウサイズを記述する、ウィンドウサイズ情報(たとえば、「ws_flag」)を含み、1つ以上の範囲値は、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される。構成情報は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの1つ以上の範囲値を決定するために使用される、第2ソース統計値(たとえば、b)を決定するためにビデオデコーダによって使用されるウィンドウサイズを記述する、ウィンドウサイズ情報(たとえば、「ws_flag」)を含む。
ビデオストリームの好適な実施形態では、ビデオビットストリームはまた、第1ソース統計値および/または第2ソース統計値の初期化値を記述する、初期化値情報も含む。
ビデオストリームの好適な実施形態では、ビデオビットストリームは、ウィンドウサイズを(たとえば、スライス内で)増加または減少させるべきであることを示すウィンドウサイズ変更フラグ(たとえば、ctu_ws_flag)をさらに含む。
ビデオストリームは、個別におよび組み合わせて、本明細書に記載される特徴または詳細のいずれかによって補足することができる。
なお、「ウィンドウサイズ」、「第1ウィンドウサイズ」、および「第2ウィンドウサイズ」という用語は、本説明全体を通して使用されることに留意すべきである。しかしながら、ウィンドウサイズの代わりに、実施形態のいずれかにおいて、推定パラメータが任意選択的に使用され得ることに留意すべきである。第1ウィンドウサイズの代わりに、実施形態のいずれかにおいて、第1推定パラメータを任意選択的に使用することができる。第2ウィンドウサイズの代わりに、実施形態のいずれかにおいて、第2推定パラメータを任意選択的に使用することができる。
言い換えると、第1推定パラメータは第1ウィンドウサイズであり得、第2推定パラメータは第2ウィンドウサイズであり得る。
あるいは、第1推定パラメータは、第1ソース統計値が復号化バイナリシーケンス(またはエンコーダの場合、前に符号化されたバイナリ値)の復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第1慣性パラメータであってもよく、第2推定パラメータは代わりに、第2ソース統計値が復号化バイナリシーケンス(またはエンコーダの場合、前に符号化されたバイナリ値)の復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第2慣性パラメータであってもよい。
また、実施形態のいずれかにおいて、ソース統計値の異なる概念を任意選択的に使用することができる。
たとえば、ビデオデコーダは、テーブルルックアップを使用して第1ソース統計値を決定するように構成されてもよく、テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および第1推定パラメータに応じて選択される。あるいは、または追加で、ビデオデコーダは、テーブルルックアップを使用して第2ソース統計値を決定するように構成され、テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および第2推定パラメータに応じて選択される。
類似の概念はビデオエンコーダでも任意選択的に使用することができ、前に符号化されたバイナリ値は、前に復号化されたバイナリ値の役割を取り得る。
本発明による実施形態は、以下の添付図面を参照して、引き続き説明される。
本発明の一実施形態による、ビデオデコーダのブロック概略図である。 本発明の別の実施形態による、ビデオデコーダのブロック概略図である。 本発明の別の実施形態による、ビデオデコーダのブロック概略図である。 本発明の一実施形態による、ビデオエンコーダのブロック概略図である。 〔表1〕は、8ビット変数wspairのビットマスクの表現を示す。 〔表2〕は、wspair値の割り当てのグラフィック表現である。 〔表3〕は、ws_flagに依存するwspair値の割り当てのグラフィック表現である。 本発明の一実施形態による、ビデオ復号化の方法のフローチャートである。 本発明の一実施形態による、ビデオ符号化の方法のフローチャートである。 本発明の一実施形態による、ビットストリームのグラフィック表現である。
1)図1による実施形態
図1は、本発明の一実施形態による、ビデオデコーダ100のブロック概略図を示す。
ビデオデコーダ100は、符号化ビデオ情報を受信し、これに基づいて、復号化ビデオ情報(または復号化ビデオコンテンツ)を提供するように構成されている。
符号化ビデオ情報110(ビデオビットストリームと見なされ得る)は、たとえば、スライスタイプ情報を含み得、バイナリシーケンスの符号化表現も含み得る。任意選択的に、符号化ビデオ情報110は、追加情報を含み得るが、これは本発明には必須ではない。
一般的に言えば、ビデオデコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するように構成されており、ビデオデコーダは、特に、1つ以上のスライスのセット(好ましくは、複数のスライス)に細分化されたビデオフレームを復号化するように構成されている。ビデオデコーダはまた、スライスタイプ情報を評価するように構成されており、スライスタイプ情報は、符号化ビデオ情報110に含まれてもよく、スライスが、(たとえば、「ビデオ再構築」ブロック180によって実行され得る)スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、符号化されたかどうかを示す。
ビデオデコーダ100は、たとえば、符号化ビデオ情報110に含まれる、バイナリシーケンスの符号化表現に基づいて(「ビデオ再構築」ブロックで使用するための)復号化バイナリシーケンス122を提供するように構成されている、算術デコーダ120を含む。算術デコーダは、好ましくは、第1ソース統計値決定130および第2ソース統計値決定140を含む。したがって、算術デコーダ120は、第1ウィンドウサイズを使用して第1ソース統計値132を決定し、第2ウィンドウサイズを使用して第2ソース統計値142を決定するように構成されている。算術デコーダは、好ましくは、コンバイナ150も含む。したがって、算術デコーダは、第1ソース固定値および第2ソース統計値に基づいて結合ソース統計値152を決定するように構成されている。また、算術デコーダ120は、好ましくは、範囲値決定160を含む。したがって、算術デコーダは、結合ソース統計値152に基づいて、(符号化ビデオ情報110に含まれる)バイナリシーケンスの符号化表現を(ビデオ再構築ブロック180で使用される)復号化バイナリシーケンス122にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成され得る。
好ましくは、算術デコーダ120は、(たとえばブロックまたはユニットであってもよい)算術復号化コア170も含み、これは、範囲値決定160から1つ以上の範囲値162を受信し、符号化ビデオ情報110に含まれる符号化バイナリシーケンスから復号化バイナリシーケンス122を導出するために範囲値を使用する。
また、ビデオデコーダは、たとえば、ビデオ再構築ブロック(またはユニット)180を含んでもよく、これは、復号化バイナリシーケンス122を受信し、復号化バイナリシーケンス122に基づいて(可能であれば、スライスタイプ情報などの、追加の制御情報を考慮して)復号化ビデオコンテンツ112を提供する。
結論として、算術デコーダ100は、復号化バイナリシーケンス122を導出するために、符号化ビデオ情報110を受信し、バイナリシーケンスの符号化表現の算術復号化を実行する。算術復号化は、復号化バイナリシーケンス122のバイナリ値の確率に関する知識を利用する。復号化バイナリシーケンス122内のバイナリ値の確率(または推定確率)に関するこの知識は、間隔サブディビジョンを定義する範囲値162に依存することにより、算術復号化コア170によって考慮される。簡潔に言えば、算術復号化コアは、異なる間隔(たとえば、0と1の間、または整数値の範囲にわたる)を定義するために、範囲値162を使用することができる。算術復号化コアは、たとえば、バイナリシーケンスの符号化表現を、範囲値を使用して定義された間隔のうちの1つにある数の表現として解釈することができる。バイナリシーケンスの符号化表現によって表される数がどの間隔にあるかを認識することによって、算術復号化コア170は、どのビットまたはどのビットシーケンスがバイナリシーケンスの符号化表現を使用して符号化されたかを結論付けることができる。
しかしながら、算術復号化コア170の説明は、非常に簡潔で一般的な説明としか見なされないことに、留意すべきである。算術復号化コアに関する詳細は、たとえば、規格H.264およびH.265で確認することができる。しかしながら、異なる概念(算術復号化コアの動作について)も文献中に見られ、算術復号化コアの詳細は、本発明には特に関連性がない。
しかしながら、(高いビットレート効率を可能にする)適切な範囲値を取得するために、算術デコーダ120(または、一般的に言えば、ビデオデコーダ)は、異なるウィンドウサイズを使用して、2つのソース統計値132、142を決定する(「ウィンドウサイズ」は、復号化バイナリシーケンス122の複数の復号化されたバイナリ値にわたって平滑化の度合いを定義する)。また、算術復号化コア170に提供される範囲値に信頼性を高めるために、第1ソース統計値132および第2ソース統計値142は組み合わせられて結合ソース統計値152になる。
したがって、算術復号化コア170によって使用される範囲値は、ビット値(たとえば、復号化バイナリシーケンス122内のビット値「0」および「1」)の実際の確率によく適応しているので、ビデオデコーダ100は高い効率を提供すると言うことができる。
付言として、ビデオデコーダ100を修正することもできることに留意すべきである。代替実装では、第2ソース統計値決定140は、(復号化バイナリシーケンスから独立していてもよいが、1つ以上のパラメータに依存し得る)固定値の提供に置き換えられることが可能である。この場合、算術デコーダは、結合ソース統計値152を取得するために、第1ソース統計値132を固定の非ゼロ値と組み合わせるように構成されている。このような簡略化は、場合によっては良好な結果をもたらし、たとえば、結合ソース統計値の不適切に大きい変動を回避し得ることが、見いだされている。言い換えると、結合ソース統計値の決定に固定的な寄与を導入することにより、結合ソース統計値がこの固定値からあまり大きく逸脱できなくなることが、達成され得る。したがって、偶然に、復号化バイナリシーケンス122内に同一のビット値のより長いシーケンスがあった場合に、符号化効率の大幅な低下を回避するために、復号化バイナリシーケンスの統計への何らかの「後知恵」が使用され得る。
付言として、算術デコーダ(および算術デコーダの個々のブロック)の機能は一般に、その全体においてビデオデコーダの機能とも見なされ得ることに、留意すべきである。言い換えると、算術デコーダの機能として本明細書に記載される機能は、ビデオデコーダの別のブロックによっても実行され得る。
また、図1によるビデオデコーダ100は、個別におよび組み合わせて、本明細書に記載される特徴、機能、および詳細のいずれかによって補足され得ることに、留意すべきである。
2)図2によるビデオデコーダ
図2は、本発明の一実施形態による、ビデオデコーダ200のブロック概略図を示す。
ビデオデコーダ200は、符号化ビデオ情報210(たとえば、ビデオビットストリーム)を受信し、これに基づいて、復号化ビデオコンテンツ212(たとえば、ビデオフレームのシーケンス)を提供するように構成されている。符号化ビデオ情報210は、たとえば、本明細書に記載されるような、スライスタイプ情報を含み得る。符号化ビデオ情報210は構成情報をさらに含んでもよく、これは制御情報とも見なされ得る。また、符号化ビデオ情報210は、バイナリシーケンスの符号化表現を含み得る。
図2には、ビデオデコーダ200の2つの主要なブロック、すなわち算術デコーダ220およびビデオ再構築280が示されている。しかしながら、ビデオデコーダの機能の分布は固定ブロック構造に拘束されず、広い範囲にわたって修正され得ることに、留意すべきである。また、ビデオデコーダの実際の実装は、当業者にとって周知の、追加のブロックおよび/または機能を有し得ることに、留意すべきである。
算術デコーダ220は、バイナリシーケンスの符号化表現211を受信する。しかしながら、算術デコーダ(または算術デコーダの外部にあってもよい制御ブロック)は、スライスタイプ情報および構成情報(または制御情報)も受信する。特に、算術デコーダ220は、バイナリシーケンスの符号化表現211に基づいて、スライスタイプ情報および構成情報または制御情報の一部またはすべてを考慮して、復号化バイナリシーケンス222をビデオ再構築280に提供する。
以下、算術デコーダ220の機能が、より詳細に記載される。算術復号化は算術復号化コア270を含み、これは、バイナリシーケンスの符号化表現211を受信し、復号化バイナリシーケンス222を提供する。算術復号化コアは、復号化バイナリシーケンス222のどのビット値がバイナリシーケンスの符号化表現211によって表されるかを決定する。この目的のために、算術復号化コア270は、バイナリシーケンスの符号化表現211によって表される数が、数の範囲のどの間隔にあるかをチェックする。バイナリシーケンスの符号化表現211によって表される数が、複数の(または2つの)間隔のうちのどの間隔にあるかの決定に応じて、復号化バイナリシーケンス222の特定のビット値、またはビット値のグループが認識される。
復号化バイナリシーケンス222を導出する目的のために、算術復号化コアは、間隔に関する情報を受信し、これは通常、ビット値の確率にある程度対応する。この場合、算術復号化コア270は、間隔サブディビジョンに使用される「範囲値」262(すなわち、算術復号化コア270によって使用される数範囲の間隔を定義するのに役立つ範囲値162)を受信する。特に、算術復号化コア270は、たとえば、規格H.264によるビデオエンコーダ/デコーダまたは規格H.265によるビデオエンコーダ/デコーダで使用される算術復号化コアと類似または同一であり得ることに留意すべきである。しかしながら、算術復号化コア270を実現するための異なるアプローチもまた使用され得ることに、留意すべきである。
上記の議論を考慮して、算術復号化コア270の間隔サブディビジョンを定義する範囲値262を提供することは、算術デコーダ220の重要な機能であることが明らかとなる。一般的に言えば、算術デコーダ220は、たとえば初期化値、「ウィンドウサイズ」、「ウィンドウサイズ適応」などのパラメータを定義する何らかの制御情報を考慮して、復号化バイナリシーケンス222の前に復号化されたバイナリ値からこれらの範囲値262を導出する。
算術デコーダ200では、2つのソース統計値決定ブロック(またはユニット)230、240が使用される。たとえば、第1ソース統計値決定ブロック230は、復号化バイナリシーケンス222の1つ以上の前に復号化されたバイナリ値(やはりxで指定される)を受信し、これに基づいて、第1ソース統計値232を提供する。第1ソース統計値決定ブロックは、たとえば、ソース統計値232を表すために使用されるビット数を定義する定数または変数BITS、およびソース統計値決定ブロック230によって使用される「ウィンドウサイズ」を定義する定数または変数nなど、何らかの制御情報を受信し得る。たとえば、第1ソース統計値決定ブロック230は、第1ソース統計値232を再帰的に決定でき、ウィンドウサイズnは、第1ソース統計値232の決定において復号化バイナリシーケンス222の最後に復号化されたバイナリ値の重み付けを決定する。
第1ソース統計値決定ブロック230の機能は、たとえば、何らかの「無限インパルス応答」特性を導入する再帰的アルゴリズムが使用されるという事実を除いて、特定のウィンドウサイズを有するスライディング平均の形成に類似している。このため、第1ソース統計値132は、スライディングウィンドウ加算演算またはスライディングウィンドウ平均演算の結果を正確に表すものではなく、結果が非常に似ているため、むしろ「仮想スライディングウィンドウ」演算と見なされるべきである。
また、第2ソース固定値決定ブロック240は、第1ソース統計値決定ブロック230と比較すると、類似の動作を実行する。しかしながら、第2ソース統計値決定ブロック240は、通常、異なるパラメータ(たとえば、異なるウィンドウ長nおよび/または異なるビット数パラメータBITS)を使用し、その結果、通常は第1ソース統計値232と異なる第2ソース統計値242を提供する。たとえば、ソース統計値232、242の1つは短期(またはより短期の)平均ソース統計値であってもよく、ソース統計値232、242の1つは長期(またはより長期の)平均ソース統計値であってもよい。
なお、ソース統計値決定ブロック230、240は、たとえば、以下で詳細に論じられる式(3)および(4)によって定義されるような機能を実行し得ることに留意すべきである。あるいは、ソース統計値決定ブロック230、240はまた、以下で論じられる式(5)によって定義されるような機能を実行し得る。また、いくつかの実施形態では、ソース統計値決定ブロック230、240においても異なる計算規則が使用され得ることに留意すべきである。
算術デコーダ220は、結合ソース統計値決定ブロック(またはユニット)250をさらに含み、これは第1ソース統計値232および第2ソース統計値242を受信するように構成されている。ソース統計値組み合わせブロック250は、これに基づいて結合ソース統計値252を提供する。たとえば、ソース統計値組み合わせブロック250は、それによって結合ソース統計値252を取得するために、第1ソース統計値232および第2ソース統計値242の合計または平均を形成し得る。
しかしながら、ソース統計値組み合わせブロック250はまた、結合ソース統計値252を導出するときに、第1ソース統計値232および第2ソース統計値242に異なる重み付けを適用することもでき、異なる重み付けは、スライス内で、または異なるスライス間でさえ変化し得る。
たとえば、ソース統計値組み合わせブロック250は、下記の式(6)によって定義されるか、または下記の式(10)および(11)によって定義されるか、または下記の式(16)によって定義されるような機能を実行し得る。しかしながら、この機能の変形例もまた可能である。
たとえば、1つの(代替)実施形態では、ソース統計値組み合わせブロック250は、それによって結合ソース統計値252を取得するために、第1統計値の1つのみを固定値と組み合わせる。このような概念は、結合ソース統計値252が復号化バイナリシーケンス222内のバイナリ値の予想される確率から大きく逸脱しすぎることを回避するために、有利であり得る。
算術デコーダ220は、結合ソース統計値252に基づいて、(算術復号化コア270に提供される)間隔サブディビジョンの範囲値262を導出するように構成されている。この処理ステップは、たとえば、「範囲値決定」と見なされ得る。たとえば、範囲値決定は、任意選択的な値処理266を含んでもよく、これは、結合ソース統計値252を受信し、これに基づいて、確率値または状態インデックス値を提供する。値処理266は、たとえば、結合ソース統計値252の値の範囲を、0から1の間の範囲に、または0から0.5の間の範囲に、または整数インデックス値にマッピングし得る。たとえば、値処理266は、下記の式(7)にしたがって、または下記の式(8)、(9)にしたがって、または下記の式(12)、(13)にしたがって、または下記の式(14)にしたがって実行され得る。
任意選択的に、値処理266は情報267を提供してもよく、これは、次に復号化される値(たとえば、復号化バイナリシーケンス222の)が「1」の値を取る可能性が高いか値「0」を取る可能性が高いかを示すバイナリ情報であってもよい。任意選択的に、算術デコーダ(または範囲値決定)は、マッピングテーブル269を含み得る。マッピングテーブル269は、たとえば、テーブルエントリを指定するインデックス値(たとえば、pStateIdx)を受信し得る。したがって、マッピングテーブル269は、インデックス値(たとえば、pStateIdx)によって指定された前記テーブルエントリに対応する1つ以上の範囲値262を提供し得る。したがって、「状態インデックス値」(たとえばpStateIdx)を導出し、状態インデックス値に基づいてマッピングテーブルを評価することにより、結合ソース固定値252に基づいて、間隔サブディビジョンの1つ以上の範囲値が提供され得る。
マッピングテーブル269は、たとえば、規格H.264または規格H.265に記載されているマッピングテーブルと同じ構造を有してもよい。しかしながら、マッピングテーブルの内容は、ビデオデコーダの特定の詳細に適応し得る。特に、マッピングテーブルのエントリは、特定のビデオデコーダで予想される統計的性質に適応することができる。
算術デコーダ(または一般的に言えば、ビデオデコーダ)はまた、制御情報または構成情報を受信し得、それに基づいて範囲値の提供に使用されるパラメータ(および可能であれば他のパラメータも、たとえば算術復号化コア270によって使用される追加のパラメータ)を調整し得る、制御ブロック290も含む。たとえば、制御ブロック290は、符号化ビデオ情報210に含まれ得る、スライスタイプ情報、「cabac init flag」、「ws_flag」、および「ctu_ws_flag」のうちの1つ以上を受信し得る。
また、制御290は、たとえば、制御情報に応じて、ウィンドウサイズパラメータn、nおよびビットサイズパラメータBITSa、BITSbを調整し得る。特に、制御ブロック290は、現在のコンテキストモデルも考慮し得る。この問題に関して、復号化される復号化バイナリシーケンス222のビット(またはビットのグループ)ごとに、どのコンテキストモデルが使用されるかが決定され得ることに留意すべきである。たとえば、どのコンテキストモデルが使用されるかの決定は、どのタイプの情報(復号化パラメータ、変換係数など)がそれぞれのビット(またはビットのグループ)によって表されるかという事実に基づき得る。たとえば、制御ブロック290は、それによってどの構文要素(または構文要素のどの部分、たとえば最上位ビットか最下位ビットか、など)が次に復号化されるかを認識するために、復号化バイナリシーケンス222のシンタックスを認識するように構成されてもよい。したがって、異なるコンテキストモデル間の選択がなされ得る。また、ウィンドウサイズパラメータおよび/またはビットサイズパラメータおよび/またはその他のパラメータが、コンテキストモデルに応じて選択され得ることに留意すべきである。さらに、異なるソース統計値または結合ソース統計値が異なるコンテキストモデルで利用可能となり得るように、ソース統計値232、242または結合ソース統計値252が特定のコンテキストモデルに関連付けられ得ることにも留意すべきである。たとえば、特定のコンテキストモデルに関連付けられたソース統計値は、それぞれのコンテキストモデルを使用して復号化された復号化バイナリシーケンス222の復号化されたバイナリ値に基づいて、選択的に提供され得る。言い換えると、パラメータn、n、BITS、BITSなどに関する別個の独立した処理、および別個の(おそらく独立した)決定が、異なるコンテキストモデルについて行われ得る。
制御ユニット290の機能に関して制御ユニットは、たとえば、下記のメカニズムに従って、パラメータn、n、BITS、BITSを決定し得ることに、留意すべきである。たとえば、ウィンドウサイズパラメータn、nは、スライスタイプ情報に応じて、および/またはcabac init flagに応じて、および/またはws_flagに応じて、および/またはctu_ws_flagに応じて、選択され得る。また、ビットサイズパラメータBITSa、BITSbは、いくつかの実施形態では、何らかの構成情報に応じて選択される。しかしながら、他の実施形態では、ビットサイズパラメータは固定されていてもよい。パラメータの調整に関しては、たとえば、以下の議論を参照されたい。
ここでビデオ再構築ブロック280を参照すると、ビデオ再構築ブロック280は通常、復号化バイナリシーケンス222、および構成情報の少なくともいくつかの要素も受信する。たとえば、ビデオ再構築280は、復号化バイナリシーケンス222に基づいて、整数パラメータおよび/または浮動小数点パラメータおよび/または画像データを再構築してもよい。たとえば、復号化バイナリシーケンスの特定のビットまたは部分がどのようにして整数パラメータまたは浮動小数点パラメータまたは画像データ(たとえば、変換係数など)にマッピングされるべきかを定義するマッピング規則があってもよい。したがって、ビデオ再構築ブロック280は、復号化バイナリシーケンス222からビデオフレームを再構築するために使用される情報を再構築する。次いで、ビデオ再構築ブロックは、再構築された情報(復号化バイナリシーケンス222から導出された)に基づいて、画像情報を生成し得る。
たとえば、ビデオ再構築280は、規格H.264または規格H.265に記載されているのと同じ機能を含んでもよい。しかしながら、復号化バイナリシーケンス(および、可能であれば、追加の構成情報または制御情報)に基づいて復号化ビデオコンテンツを提供するように適応された他のアプローチも、ビデオ再構築に使用され得る。したがって、ビデオ再構築280は、ビデオフレームのシーケンスの形態を取り得る、復号化ビデオコンテンツ212を提供する。
結論として、本発明の一実施形態によるビデオデコーダの概要が提供された。しかしながら、機能ブロック(たとえば、ソース統計値決定ブロック230、240、ソース統計値組み合わせブロック250、値処理ブロック266、マッピングテーブル269、および算術復号化コア270のための異なる実装があることに、留意すべきである。また、ビデオ再構築ブロック280および制御ブロック290には異なる実装が可能である。
しかしながら、本明細書に記載された機能ブロックは、その全体が本出願において開示された特徴、機能、および詳細のいずれかによって補足され得ることにも留意すべきである。また、本出願において開示された特徴、機能、および詳細は、それによってビデオデコーダ200の機能を拡張するために、個別にまたは組み合わせて導入され得ることに、留意すべきである。
3)図3によるビデオエンコーダ
図3は、本発明の一実施形態による、ビデオエンコーダ300のブロック概略図を示す。ビデオエンコーダ300は、ビデオコンテンツ310を受信し、これに基づいて、符号化ビデオ情報(たとえば、ビデオビットストリーム)312を提供するように構成されている。
ビデオエンコーダ300は、ビデオバイナリシーケンス提供ブロック380を含み、これは、ビデオコンテンツ310に基づいてビデオコンテンツ310を表すバイナリシーケンス322を提供するために、ビデオコンテンツ310を受信するように構成されている。たとえば、ビデオバイナリシーケンス提供380は、規格H.264によるビデオエンコーダのように、または規格H.265によるビデオエンコーダのように、実行され得る。しかしながら、ビデオバイナリシーケンスの提供のための異なるアプローチもまた使用され得る。また、ビデオバイナリシーケンス提供380は、たとえば、バイナリ値のシーケンスへの整数値または浮動小数点パラメータまたは画像データ(たとえば、変換係数など)のマッピングも含み得ることに、留意すべきである。
さらに、算術エンコーダ320は、バイナリシーケンス322を受信し、これに基づいて、バイナリシーケンス322の符号化表現311を提供し得る。一般的に言えば、算術エンコーダ320は、バイナリシーケンス322の効率的に圧縮された表現(すなわち、バイナリシーケンスの符号化表現311)を提供するために、バイナリシーケンス322内のバイナリ値の確率に関する知識(または情報)を利用するように構成されている。
算術エンコーダ320は、たとえば、算術符号化コア370を含んでもよく、これは、バイナリシーケンス322を受信し、これに基づいて、バイナリシーケンスの符号化表現311を提供する。算術符号化コア370は、たとえば、ビットまたはビットのグループを表す適切な符号語(符号化表現311に含まれる)を見つけられるようにするために、バイナリシーケンス322内のビット(またはビットのグループ)の確率に関する何らかの情報を必要とし得る。好ましくは、算術符号化コア370は、間隔のサブディビジョンを記述する範囲値362を受信する。範囲値362は、ビデオデコーダ200によって(またはその算術復号化コア270によって)使用される間隔のサブディビジョンを記述してもよく、算術符号化コア370は対応するビデオデコーダによって復号化可能なバイナリシーケンスの符号化表現311を提供するので、この情報は当然ながら算術符号化コア370にとっても有用であり得る。
このため、算術エンコーダ320は、ビデオコンテンツを表すバイナリシーケンス322に基づいて、およびウィンドウサイズ情報n、nまたはビットサイズ情報BITS、BITSなどのいくつかのパラメータに基づいて、間隔サブディビジョンの範囲値362を導出するように構成され得る。なお、範囲値362の導出は、復号化バイナリシーケンス222の代わりにバイナリシーケンス322が評価されるという事実を除いて、範囲値162、262の導出と実質的に同一であることに留意すべきである。言い換えると、バイナリシーケンス322に基づいて範囲値362を導出するときに、前に復号化されたバイナリ値の代わりに前に符号化されたバイナリ値が使用される。
見てわかるように、ビデオエンコーダの算術エンコーダ320はソース統計値決定ブロック330、340を含み、これらは、(前に復号化されたバイナリ値に基づくのではなく)前に符号化されたバイナリ値に基づいて第1ソース統計値332および第2ソース統計値342を提供するという事実を除いて、ソース統計値決定ブロック130、140、230、240と実質的に同じである。ソース統計値決定子330、340は、たとえば、パラメータn、n、BITS、およびBITSを使用し得る。また、ソース統計決定子330、340の機能は、たとえば、下記の式(3)および(4)によって、または下記の式(5)によって定義され得る。
また、算術エンコーダ320はソース統計値組み合わせブロック350も含み、これはソース統計値組み合わせブロック150またはソース統計値組み合わせブロック250に対応し得る。したがって、結合ソース統計値352が提供され、ソース統計値組み合わせブロック350の機能は、たとえば、式(6)または式(10)および(11)または式(16)に従い得る。
算術エンコーダ320は任意選択的な値処理366も含み、これは、図2に示される値処理266に対応し得る。値処理366は、結合ソース統計値352を受信し得、たとえば、最確バイナリ値に関する情報367および/または確率情報または状態インデックス情報368を提供し得る。算術エンコーダ320はマッピングテーブル369も含み、これは、図2を参照して記載されたマッピングテーブル269に対応し得る。したがって、間隔サブディビジョンの1つ以上の範囲値362は、状態インデックス368の確率値を使用するマッピングテーブル369の評価によって提供され得る。
結論として、算術エンコーダ320は、算術デコーダ220が復号化バイナリシーケンス222に基づいて範囲値262を選択するのと同じ方法で、バイナリシーケンス322に基づいて範囲値362を選択し得る。したがって、復号化エラーがなく、ビデオエンコーダ側およびビデオデコーダ側で同じパラメータが使用されるという条件で、ビデオエンコーダ300の算術エンコーダ320とビデオデコーダ200の算術デコーダ220との間の同期性が実現され得る。
また、算術エンコーダ320、または一般的に言えば、ビデオエンコーダ300は制御ブロック390を含み、これは、パラメータn、n、BITS、BITS、および必要であり得るその他いずれかのパラメータを決定し得ることに、留意すべきである。たとえば、制御ブロック390は、パラメータについて決定するために、いくつかの経験的メカニズムを使用し得る。あるいは(または追加で)、制御ブロック390はまた、どのパラメータの組み合わせが可能な限り最も低いビットレートをもたらすか(またはその他いずれかの最適な基準を満たすか)を分析し得る。
また、ビデオエンコーダ300は、たとえば、符号化ビデオ情報312内で、ビデオデコーダ200の動作を制御する何らかの制御情報を提供し得ることに留意すべきである。たとえば、この制御情報(または構成情報)は、以下のうちの1つ以上を含み得る:スライスタイプ情報、cabac init flag、ws_flag、およびctu_ws_flag。これらの構成情報項目の機能、ならびにその可能な符号化および復号化が、以下に記載される。スライスタイプ情報は、(たとえば、ビデオバイナリシーケンス提供380によって)規格H.264またはH.265にしたがってビデオエンコーダと同様に提供されてもよく、規格H.264またはH.265にしたがってビデオデコーダと同様にビデオ再構築180、280によって使用されてもよい。加えて、スライスタイプ情報は、本明細書で概説されるように、ウィンドウサイズに関する決定で使用され得る。
また、機能ブロックの分布が修正され得ることに留意すべきである。図3の実施形態では、算術符号化コア370、ソース統計値決定子ブロック330、340、ソース統計値組み合わせブロック350、値処理ブロック366およびマッピングテーブル369および制御390は、算術エンコーダの一部として記載されてきた。しかしながら、前記ブロックはまた、一般に、ビデオエンコーダのブロック(または機能)でもあり得る。
また、図3を参照して記載された機能ブロックのいずれも、その全体が本出願に記載された特徴、機能、および詳細のいずれかによって補足され得ることに留意すべきである。
4)さらなる実施形態および詳細
以下では、個別にまたは組み合わせて、本明細書で開示される実施形態のいずれかに、個別にまたは組み合わせて導入され得るさらなる実施形態および詳細が記載される。本明細書に記載される詳細は、たとえば、個別におよび組み合わせて、図1、図2、および図3を参照して記載された実施形態に導入され得る。
特に、このセクションで開示される特徴、機能、または詳細のうちの1つの使用は通常、2つ以上の特徴、機能、または詳細を使用した方がさらによい実施形態を作成し得るとしても、既に改善をもたらしていることに留意すべきである。
一般的に言えば、本発明の態様または実施形態は、バイナリ算術符号化の確率推定方法(または確率推定概念)を作成する。
序論
以下に序論が提供される。
コンテキストモデル更新は、コーダの内部状態を基礎となるソース統計に適応させる可能性を提供することによる、効率的なバイナリ算術エントロピーコーダの重要な特徴である。たとえば、各コンテキストモデルは、このコンテキストモデルに割り当てられた次のバイナリシンボル(bin)を復号化または符号化する確率を提供する、独立した確率推定段を備えている。
従来のビデオコーデックH.265/HEVCの確率段実装は有限状態マシン((0,0.5]の範囲に64の確率状態がある)に基づいているが、この文献に記載される推定器は、binの割り当てられたシーケンスのソース統計を追跡する2つのカウンタ変数に基づいている。
各カウンタ(たとえば、ソース統計値決定子130、140、230、240、330、340を実装し得る)は、過去のバイナリシンボルの数(たとえば、ソース統計値が決定されたコンテキストモデルを使用して符号化または復号化された、前に符号化された、または前に復号化されたバイナリ値)がカウント(または一般的に言えば、ソース統計値の値)にどの程度影響するかを決定する、
Figure 2023018041000101
を備えている。更新は、たとえば、いわゆる仮想スライディングウィンドウアプローチによって導出される。
Figure 2023018041000102
を有するbin(またはバイナリ値)が復号化または符号化された後、
Figure 2023018041000103
(ソース統計値と見なされ得る)の更新は、以下に記載されるように実施され得る。
Figure 2023018041000104
式(1)の更新が浮動小数点演算を使用している場合、カウントは常に、すべてのbinシーケンスで
Figure 2023018041000105
の範囲内になる。確率推定器の
Figure 2023018041000106
は、以下のように定義される。
Figure 2023018041000107
算術符号化エンジンに応じて、確率推定器の出力は、直接(たとえば、算術符号化/復号化コアの範囲値を決定するために)使用されてもよく、または量子化された確率値のセットの最も近い確率に(または算術符号化/復号化コアの1つ以上の範囲値に)値をマッピングするなどのさらなる処理を必要としてもよい。
実装の詳細
以下に、いくつかの実装の詳細が記載される。
(たとえば、ソース統計値決定ブロックの)実装は、定義された精度
Figure 2023018041000108
での整数演算の使用を必要とする(または優先する)可能性が高い。したがって、式(1)の実装の代わりに、たとえば式(3)および(5)による、または式(5)による整数の実装が使用され得る。
さらに、可能なウィンドウサイズのセットは、算術演算の簡略化を可能にするために、
Figure 2023018041000109
によって導出され得る値に限定される必要があるだろう。
この場合(
Figure 2023018041000110
に等しくないときも)、
Figure 2023018041000111
の更新は、以下のように計算される(式(1)と同等)。
Figure 2023018041000112
この更新規則では、カウントが有効な範囲
Figure 2023018041000113
内にとどまることを保証するクリッピング操作が実行される必要がある。(4)
Figure 2023018041000114
値nは適切に(たとえば丸めによって)選択され得る。また、xは、前に符号化されたバイナリ値(たとえば、値0または1を有する)または前に復号化されたバイナリ値を表し得ることに留意すべきである。
代替例として、式(3)および(4)は、バイナリシンボルの値を区別する更新計算に置き換えられてもよい。
Figure 2023018041000115
(式(5)の2行に示されるような)異なるシンボル値に異なる更新規則を使用することで、式4のクリッピング操作を廃止する。
なお、式(3)および(4)または式(5)で仮想スライディングウィンドウアプローチを実装する2つの方法では、右シフト演算のため、同一のビットストリームを導出しないことに留意されたい。
また、式(3)および(4)による、または式(5)による演算は、本明細書に記載されるソース統計値決定子によって実行され得ることに留意すべきである。しかしながら、いくつかの実施形態では、ソース統計値決定子は異なる機能(たとえば式(1)による)も実行し得る。
確率推定器の出力(たとえば、結合ソース統計値)は、式(4)または式(5)のいずれかからの更新方法(またはその他の方法)から生じるカウンタ(たとえば、ソース統計値)を重み付けすることによって、計算される。
Figure 2023018041000116
(結合ソース統計値と見なされ得る)式(6)からの重み付け結果
Figure 2023018041000117
は、(たとえば、値処理によって)確率
Figure 2023018041000118
を導出するために、(任意選択的に)使用され得る。
Figure 2023018041000119
または算術符号化エンジンの設計に依存するアドレスインデックス(たとえばpStateIdx)。
カウンタベースの確率推定器は、たとえば、範囲(0,1)内のバイナリシーケンスの値
Figure 2023018041000120
で次のシンボルの確率を提供し得る。値
Figure 2023018041000121
を有する次のシンボルの確率推定が必要とされる場合、出力が変換される必要がある:
Figure 2023018041000122
しかしながら、確率値p(またはp(0)またはP(1))の計算は、すべての実施形態で必要とされるわけではないことに留意すべきである。
カウンタベースの確率推定器とは異なり、H.265/HEVCの有限状態マシンの確率推定は、2つの変数の組み合わせを使用して実行される。第1の変数
Figure 2023018041000123
は、範囲(0,0.5]内の最低確率シンボル(LPS)の確率を表す状態インデックスを格納する。第2の変数
Figure 2023018041000124
は、最確シンボル(MPS)の値を包含する。同様に、バイナリ算術コーダの間隔サブディビジョンのあらかじめ計算された範囲値を有する表は、範囲(0,0.5]のみをカバーする。
このため、たとえば従来のマッピングテーブル、または従来の構造(H.264またはH.265のビデオエンコーダまたはデコーダなど)を有するマッピングテーブルが使用される場合には、(従来の)有限状態マシンがカウンタベースの確率推定器に置き換えられる場合にマッピングを使用することが推奨できる[3]。言い換えると、結合ソース統計値が本明細書に記載されるように決定される場合(たとえば、式(3)から(6)を使用して、または以下で延べられる類似の式を使用して)、(たとえば、任意選択的な値処理において)マッピングテーブルのインデックス値(たとえばpStateIdx)に結合ソース統計値をマッピングすることが推奨できる(しかし必須ではない)。これにより、従来のマッピングテーブルを使用することができる。一方、マッピングテーブル(間隔サブディビジョンの範囲値を提供する)は適切に適応され、このようなマッピングは必要ない場合がある。
状態インデックス
Figure 2023018041000125
値への(たとえば、結合ソース統計値の)式(6)からの結果
Figure 2023018041000126
のマッピングは、たとえば、以下によって計算され得る(これはたとえば、マッピングテーブルの分解能までの量子化を含み得る)。
Figure 2023018041000127
ここで、
Figure 2023018041000128
はあらかじめ計算された値を含むテーブルのLPS確率状態を表すために使用されるビット数を定義し、
Figure 2023018041000129
は以下によって導出される。
Figure 2023018041000130
式(8)および(9)からの(または式(8)および(9)を使用した)カウンタベースの確率推定器の結果の、LPS状態インデックスの表現への(たとえば、低確率状態の状態インデックスまたは最低確率状態の状態インデックスの表現、たとえばpStateIdx)へのマッピング、およびMPSの値(たとえば、高確率バイナリ値の値、たとえばvalMPS)の代わりに、算術符号化エンジンは2つのオプションによって交互に修正され得る。
(たとえば、結合ソース統計値を使用して、または確率値p(またはp(0)またはp(1))を使用して、マッピングテーブルのテーブルエントリが直接選択され得るように)全体の確率間隔(0,1)をカバーするために間隔サブディビジョンのあらかじめ計算された範囲値を包含するテーブルが拡張され得るか、もしくはテーブルが省略され、算術を使用して(たとえば、結合ソース統計値に基づいて、または確率値ptまたはp(0)またはp(1)に基づいて)範囲値がオンザフライで計算される。
言い換えると、結合ソース統計値に基づいて算術復号化コアの間隔のサブディビジョンの範囲値を導出するための、多くの異なる方法がある。従来のマッピングテーブルが使用される場合は、式(8)および(9)による計算が推奨される。あるいは、修正されたマッピングテーブルが使用される場合、または範囲値が何らかの計算規則を使用して結合ソース統計値から導出される場合には、式(8)および(9)による計算は省略され得る。
発明の態様-カウンタ変数の可変分解能
以下では、本発明によるいずれの実施形態でも任意選択的に使用され得る、本発明の一態様が記載される。
カウンタベースの確率推定器の従来の整数実装は、カウンタの精度
Figure 2023018041000131
を表すために同じビット数を使用する。
メモリ消費と符号化効率とのトレードオフを最適化するために、
Figure 2023018041000132
変数は、ウィンドウサイズに応じてサイズ決定され得ること(または現在使用されているウィンドウサイズに応じて動的に適応され得ること)がわかっている。
したがって、カウンタ変数(たとえば、ソース統計値)は、たとえば、式(6)からの重み付け演算(たとえば、ソース統計値結合)が適用される前に修正されてもよい。
Figure 2023018041000133
ここで、
Figure 2023018041000134
Figure 2023018041000135
を使用すると、重み付け演算(たとえば、ソース統計値結合)は、以下の表に修正される。
Figure 2023018041000136
式(8)および(9)からの状態インデックス
Figure 2023018041000137
値への結果
Figure 2023018041000138
のマッピング(任意選択的な値処理によって実行され得る)は、以下のように修正されてもよく、
Figure 2023018041000139
Figure 2023018041000140
は以下によって導出される。
Figure 2023018041000141
全体の確率間隔(0,1)をカバーするために間隔サブディビジョンのあらかじめ計算された範囲値を包含するテーブルが拡張される場合、状態インデックスは、(たとえば、式(12)および(13)の計算の代わりに)以下のように導出され得る(たとえば、任意選択的な値処理によって)。
Figure 2023018041000142
発明の態様:スライスタイプ、cabac init flag、およびコンテキストモデル依存のウィンドウサイズ
以下では、ウィンドウサイズの調整の可能性が記載されるが、これは本発明の実施形態のいずれかにおいて任意選択的に使用され得る。
式(1)、(3)、および(5)のカウンタ変数
Figure 2023018041000143
の更新はすべて、確率推定器の(たとえばソース統計値決定子の)出力に影響を及ぼす過去のbinの数を制御するために、
Figure 2023018041000144
(たとえばwまたはw)、または
Figure 2023018041000145
として定義される
Figure 2023018041000146
(たとえばnまたはn)を包含する。
以前の刊行物[1]では、ウィンドウサイズは、ビデオコーデックのその他いずれのパラメータとも無関係に、すべてのコンテキストモデルで同じ2つの値、たとえば
Figure 2023018041000147
に設定されていた。
本発明の一態様によれば、各コンテキストモデルのウィンドウサイズペアは、コンテキストモデル、cabac init flag、およびスライスタイプに応じて、包括的に、範囲[1,11]内で
のカスタム値(たとえば、nおよび/またはn)に設定される。
cabac init flagは、H.265/HEVCの一部であり、「cabac_init_flag」と呼ばれる[2]。
3つのスライスタイプが定義されており、これらは通常、B、P、またはIntra予測スライスと呼ばれる。たとえば、初期確率状態を導出するために使用される、[2]の「initValue」と同じ方法で、(たとえば事前定義されたテーブル内の)各コンテキストモデルのスライスタイプおよび「cabac_init_flag」のすべての組み合わせに対して、1対の
Figure 2023018041000148
(たとえば、wおよびwまたはnおよびnを定義する)が定義される。
整数演算を使用する実装では、1つのコンテキストモデルのウィンドウサイズ値(たとえば、nおよびn)は、たとえば8ビット変数として読み取り専用メモリに格納されてもよく、
Figure 2023018041000149
Figure 2023018041000150
Figure 2023018041000151
の結果的な構造は、表1に示されている。
Figure 2023018041000152
なお、表1に示されるような
Figure 2023018041000153
の構造は、ソフトウェア実装の寛大なレイアウトの一例であり、メモリ要件は重要ではないことに留意されたい。
Figure 2023018041000154
を格納するために使用されるビット数は、必要とされるより多くの組み合わせを格納することができる。
(制御ブロックによって実行され得る)1つのコンテキストモデルの正確な
Figure 2023018041000155
の導出プロセスの一例は、表2に示されている。
Figure 2023018041000156
たとえば、wspair0、wspair1、およびwspair2によって指定された、3つの事前定義された値wspairがあることがわかる。
「Slice Type」情報に基づいて、およびいわゆる「cabac init flag」に基づいて、これらの事前定義された値wspairの1つが(たとえば制御ブロックによって)選択される(これは任意選択的に、ビデオエンコーダまたはビデオデコーダのソース統計値および/またはその他の変数の初期化値も決定し得る)。たとえば、スライスタイプが両方向予測(「B」)である場合、「cabac init flag」は、nおよびn(またはwおよびw)を決定するために2つの事前定義された値wspair0およびwspair1のうちのどちらが実際に使用されるかを決定し得る。同様に、スライスタイプが単一予測(「P」)である場合、「cabac init flag」は、nおよびn(またはwおよびw)を決定するために2つの事前定義された値wspair0およびwspair1のうちのどちらが実際に使用されるかを決定し得る(両方向予測スライスタイプの場合と比較して、cabac init flagの値と事前定義された値wspair0およびwspair1との間で逆の割り当てが使用され得る。独立した符号化モード(「Intra」)を使用してスライスが符号化される場合、cabac init flagはアクティブであり、事前定義された値wspair2が常に使用され得る。
なお、表2はコンテキストモデルのみを表し、異なるコンテキストモデルには異なるテーブルが利用可能であることに、留意すべきである(たとえば、範囲値決定のプロセス全体が、異なるコンテキストモデルに対して独立して機能し得る)。
コンテキストモデルは、最初のbinを復号化または符号化する前に、意図されるウィンドウサイズで初期化されるべきである。初期化プロセスは、各コンテキストモデルの初期確率状態/カウントが設定されるのと同時に実行される。
実施形態
以下に、実施形態およびさらなる態様が記載される。このセクションで言及される実施形態は、個別に使用することができ、任意選択的に、本明細書に記載される特徴、機能、および詳細のいずれかによって補足され得る。
また、本明細書に開示されるすべてのビデオデコーダおよびビデオエンコーダは、任意選択的に、個別にまたは組み合わせて、以下に記載される特徴、機能、および詳細のいずれかによって補足され得ることに、留意すべきである。また、明細書に記載されるビデオデコーダおよびビデオエンコーダの特徴は、任意選択的に、以下に記載される特徴、機能、および詳細のいずれかに置き換えることができる。
(a)本発明の好適な実施形態では、各コンテキストモデルは2つの
Figure 2023018041000157
を備えている。スライス(たとえば、ビデオフレームの一部の)の初期化中、
Figure 2023018041000158
は、たとえば表2で概説されたように、たとえば、現在のスライスタイプおよびcabac init flagの値に応じた特定の値に設定され、カウンタの分解能変数(またはソース統計値の分解能変数)は、たとえば、同じ値
Figure 2023018041000159
に設定される(任意選択)。このコンテキストモデルに割り当てられたbin(たとえば、バイナリ値)を符号化または復号化するために、カウントは、たとえば式(11)のように重み付けされ、たとえば式(12)および(13)によって定義されるように、状態インデックスを導出するために使用される。bin(たとえばバイナリ値)が符号化または復号化された後、カウンタ変数(またはソース統計値)は、各カウンタについて(または各ソース統計値について)指定されたカスタムウィンドウサイズ(たとえば、nおよびnで定義される)を使用する式(5)で指定されるように、更新される。
(b)本発明の別の好適な実施形態では、確率推定方法(または概念)は、実施形態(a)と同一に構成されるが、カウンタ変数(またはソース統計値)の更新は、式(3)および(4)を使用して実行される。
(c)本発明の別の好適な実施形態では、確率推定方法(または概念)は、実施形態(a)と同一に構成されるが、状態インデックスを導出するために式(14)が使用される。状態インデックスは、全体の確率間隔(0,1)をカバーするあらかじめ計算された範囲値でテーブル(たとえば、範囲値を提供するためのマッピングテーブル)をアドレス指定する。
(d)本発明の別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)で指定された通りに構成されるが、コンテキストモデルの個々のカウンタ(またはそれぞれのコンテキストモデルの2つのソース統計値)は、式(11)のように均等に重み付けされない。代わりに、重み付け演算は、個々のカウンタの重み
Figure 2023018041000160
を含み、
Figure 2023018041000161
たとえば、
Figure 2023018041000162
。この実施形態では、式(11)の演算は、式(16)または代替整数重み付け実装に置き換えられる。
(e)本発明の別の好適な実施形態では、確率推定方法(たとえば、ソース統計値決定ブロック)は、実施形態(d)のように構成されるが、個々のカウンタの(たとえば、2つのソース統計値の)重み付けは、符号化または復号化プロセス中に変更される。
(f)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(a)と同一に構成されるが、利用可能なウィンドウサイズのセットは、
Figure 2023018041000163
を格納するために使用されるメモリ要件を減らすために、より小さいサブセットに限定される(たとえば、制御ブロックを適応させることによる)。ここで、
Figure 2023018041000164
より小さくなくてはならず、これは、許容範囲[1,11]では、66の有効な組み合わせをもたらす。その結果、
Figure 2023018041000165
によって使用されるビット数は、表1で概説されたように、よりコンパクトなレイアウト-8ビット変数wspairのビットマスクに減らすことができる。
(g)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(f)で指定された通りに構成されるが、有効な組み合わせの数は、手動で選択された
Figure 2023018041000166
を省略することによって減少する(たとえば、制御ブロックを適応させることによる)。
(h)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(f)で指定された通りに構成されるが、有効な組み合わせの数は、
Figure 2023018041000167
まで減少し、
Figure 2023018041000168
は少なくとも3である
Figure 2023018041000169
(たとえば、制御ブロックを適応させることによる)。
(i)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(h)で指定された通りに構成されるが、有効なウィンドウサイズ組み合わせのセットは、
Figure 2023018041000170
で拡張され、ここで
Figure 2023018041000171
(たとえば、制御ブロックを適応させることによる)。
(j)本発明の別の好適な実施形態では、確率推定方法または概念(またはソース統計値決定ブロック)は、実施形態(a)のように構成されるが、カウンタの分解の(またはソース統計値の分解能)は等しくない。たとえば、
Figure 2023018041000172
(たとえば、制御ブロックを適応させること、またはソース統計値決定ブロックを適応させることによる)。特に、より小さいウィンドウサイズ、たとえば
Figure 2023018041000173
を使用するカウンタ(またはソース統計値)では、メモリ消費を削減するために、個々のカウンタ(またはソース統計値)の分解能を減少させることができる。
(k)本発明の別の好適な実施形態では、確率推定方法または概念は、実施形態(j)のように構成されるが、カウンタ(またはソース統計値)の分解能
Figure 2023018041000174
は、そのウィンドウサイズによって(たとえば、ソース統計値を計算または更新するために使用されるウィンドウサイズによって)導出される。たとえば、
Figure 2023018041000175
、ここで
Figure 2023018041000176
は閾値(たとえば、固定値)であり、たとえば8に等しくてもよい。
(l)本発明の別の好適な実施形態では、確率推定方法または概念は、実施形態(j)のように構成されるが、1つのコンテキストモデルの
Figure 2023018041000177
変数の合計は、すべてのコンテキストモデルで等しい(これはたとえば、制御ブロックの適応によって実現され得る)。このため、各コンテキストモデルは同じビット数を必要とし、特定のコンテキストモデルのアドレス指定は、単純なオフセット計算によって実行することができる(たとえば、異なるコンテキストモデルに関連付けられたソース統計値が、アレイまたは連続するメモリ領域に格納される場合)。
(m)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(l)に記載された通りに構成されるが、
Figure 2023018041000178
変数の合計がすべてのコンテキストモデルで等しいという制約のため、有効なウィンドウサイズ組み合わせの数は減少する(たとえば、制御ブロックの適応による)。この実施形態では、
Figure 2023018041000179
は減少から除外される(たとえば、nおよびnが等しい場合も依然として選択され得る)。
(n)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、1つのカウンタのウィンドウサイズは無限に設定される。このため、カウントは更新されず、算術演算およびメモリ消費に関して複雑さを軽減することができる。たとえば、ソース統計値の1つは、固定値に置き換えることができる。したがって、結合ソース統計値は、ソース統計値の1つと前記固定値との組み合わせによって取得することができる。
(o)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、コンテキストモデルは、スライスごとに送信される別個のフラグに応じて初期化される(たとえば、ビデオエンコーダによって提供され、ビデオデコーダによって評価される)。スライスタイプおよびcabac init flagに応じてウィンドウサイズを初期化する代わりに、使用されるセット(たとえば、使用されるnおよびnの値)を指定する別個のフラグ「ws_flag」が導入される。結果として、表2の割り当ては、表3に示されるように拡張される。
Figure 2023018041000180
たとえば、スライスごとに、(たとえば制御情報または構成情報として)ビデオビットストリームに含まれる「ws_flag」またはパラメータに応じて、2セットのウィンドウサイズの間で選択することが可能である。
このため、制御ブロック(または一般に、ビデオエンコーダまたはビデオデコーダ)は、たとえば、wsフラグを評価し、wsフラグに応じて(通常はスライスタイプにも応じて。これは通常、スライスごとに、または選択されたスライスに対して、制御情報または構成情報としてビデオビットストリームにも含まれる)ウィンドウサイズを調整する。
(p)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、ウィンドウサイズの初期化は、現在のスライスの時間レベルにさらに依存する。結果として、
Figure 2023018041000181
の総数が増加する。このため、制御ブロック(またはビデオエンコーダまたはデコーダ)は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの時間レベルを考慮するように構成され得る。
(q)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、ウィンドウサイズの初期化は、現在のスライスの量子化パラメータにさらに依存する。このため、制御ブロック(またはビデオエンコーダまたはデコーダ)は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの量子化パラメータを考慮するように構成され得る。
(r)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(p)に記載された通りに構成されるが、初期化は、量子化パラメータにさらに依存する。結果として、
Figure 2023018041000182
は、時間レベル、量子化パラメータ、スライスタイプ、およびcabac init flagの積空間の項目ごとに指定される。このため、制御ブロック(またはビデオエンコーダまたはデコーダ)は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの時間レベルおよび量子化パラメータを考慮するように構成され得る。
(s)本発明の別の好適な実施形態では、確率推定方法または概念(たとえば、ソース統計値決定ブロック)は、実施形態(a)と同一に構成されるが、ウィンドウサイズ変数は、位置に応じて、復号化または符号化プロセス中に変更される(たとえば、スライス内および/または異なるスライス間および/または異なるフレーム間で)。
たとえば、現在のbinが、スライスの最初の列または最初の行の一部であるCTU(符号化ツリーユニット)から生じる場合、両方のカウンタ(またはソース統計値決定子)のウィンドウサイズ(たとえば、nおよびn)は以下のように設定される。
Figure 2023018041000183
たとえば、これは、現在のbinがスライスの最初の列または最初の行の一部であるCTUIから生じる場合のウィンドウサイズの選択的な減少を意味し得る。
CTUの最初の行またはCTUの最初の列の符号化処理が終了した場合、ウィンドウサイズはそのデフォルト値に設定される(たとえば、表2および表3の1つにしたがって、たとえば考慮され得るスライスタイプおよびその他いずれかのパラメータまたはフラグに基づいて定義される通り)。
ウィンドウサイズを変更することにより、確率推定器は、スライスまたはCTUの行の始めのソースbinシーケンスの基礎となる統計に、より速くまたはより遅く適応し得る。
(t)本発明の別の好適な実施形態では、確率推定方法または概念(たとえば、ソース統計値決定ブロック)は、実施形態(a)と同一に構成されるが、スライスの復号化または符号化中にウィンドウサイズを変更するために、追加のフラグが使用される(たとえば、ビデオエンコーダによって提供され、ビデオデコーダによって評価される)。この実施形態では、たとえば、すべてのコンテキストモデルまたはサブセット(たとえば、コンテキストモデルの)の
Figure 2023018041000184
を増加または減少させるために使用されるすべてのCTUに、フラグ「ctu_ws_flag」がある。符号化中、たとえばすべてのCTUの前に、「ctu_ws_flag」が通知され、復号化中、たとえばすべてのCTUの前に、「ctu_ws_flag」が読み取られる。「ctu_ws_flag」の値に応じて、結果が依然として有効な範囲[1,11]内にある場合、すべてのコンテキストモデルの
Figure 2023018041000185
の変数は、増加または減少する。
(u)本発明の別の好適な実施形態では、確率推定方法または概念(たとえば、ソース統計値決定ブロック)は、実施形態(t)と同一に構成されるが、ctu_ws_flagに応じて、すべてのコンテキストモデルのサブセットのウィンドウサイズのみが変更される。
5)図4による方法
図4は、本発明の一実施形態による、方法400のフローチャートを示す。
なお、方法400は、個別におよび組み合わせて、対応する装置に関して本明細書に記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。
また、第1ソース統計値を固定の非ゼロ値と組み合わせることによって結合ソース統計値が得られる場合、第2ソース統計値を計算する必要がないことにも、留意すべきである。
6)図5による方法
図5は、本発明の一実施形態による、方法500のフローチャートを示す。
なお、方法500は、個別におよび組み合わせて、対応する装置に関して本明細書に記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。
また、第1ソース統計値を固定の非ゼロ値と組み合わせることによって結合ソース統計値が得られる場合、第2ソース統計値を計算する必要がないことにも、留意すべきである。
7)図6によるビデオストリーム
図6は、本発明の一実施形態による、ビデオストリーム(ビットストリーム)の概略(簡略化)表現を示す。
なお、ビデオストリーム600は、個別におよび組み合わせて、本明細書に記載される特徴および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。
8)結論
結論として、たとえば、ビデオエンコーダ、ビデオデコーダ、ならびに画像エンコーダ、画像デコーダ、オーディオエンコーダ、オーディオデコーダなどでも使用され得る、バイナリ算術符号化の確率推定方法および装置について記載されてきた。
これらの方法および装置は、従来のソリューションよりも優れている。
たとえば、[4]の文献は、コンテキストモデルごとに定義されたカスタムウィンドウサイズについて記載している。しかしながら、ウィンドウサイズは、スライスタイプまたはcabac init flagに依存して導出されるものではない。コンテキストモデルごとに2つのペアのウィンドウサイズが定義され、1つのペアを選択するために量子化パラメータが使用される。さらに、異なる範囲のウィンドウサイズが提供される。
[5]の文献は、請求項に記載される高速攻撃モードの代替例として比較できる方法について記載している。文献は、コンテキストモデルに割り当てられた最初の64個のbinに対して追加のペアのウィンドウサイズが定義されることを記載している。最初の64個のbinが復号化または符号化された後、ウィンドウサイズはそのデフォルト値に設定される。このアプローチは、コンテキストモデルごとに符号化されたbinの数を追跡する、別個のカウンタ変数を必要とする。
9)実装代替例
いくつかの態様は装置の文脈で説明されてきたが、これらの態様が対応する方法の説明も表すことは明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。方法ステップの一部または全ては、たとえば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって(またはこれを使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちの1つ以上が、このような装置によって実行されてもよい。
本発明の符号化されたビデオ信号(またはデータストリームまたはビデオビットストリーム)は、デジタル記憶媒体上に記憶されることが可能であり、またはインターネットなどの無線送信媒体または有線送信媒体のような送信媒体で送信されることが可能である。
特定の実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装され得る。本実装は、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働可能な)、電子可読制御信号が記憶された、フロッピーディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリなどのデジタル記憶媒体を使用して、実行され得る。したがって、デジタル記憶媒体はコンピュータ可読であり得る。
本発明によるいくつかの実施形態は、本明細書に記載される方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することが可能な、電子可読制御信号を有するデータキャリアを備える。
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装されることが可能であり、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されたときに方法の1つを実行するように動作する。プログラムコードは、たとえば、機械可読キャリア上に記憶されてもよい。
別の実施形態は、機械可読キャリア上に記憶された、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを備える。
したがって、言い換えると、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されたときに、本明細書に記載される方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを備え、それが記録された、データキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録媒体は、典型的には有形および/または非一時的である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは一連の信号はたとえば、データ通信接続を介して、たとえばインターネットを介して転送されるように構成されてもよい。
さらなる実施形態は、本明細書に記載される方法の1つを実行するように構成または適合された、たとえばコンピュータまたはプログラマブル論理デバイスなどの処理手段を備える。
さらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを備える。
本発明によるさらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを受信機に(たとえば、電子的または光学的に)送信するように構成された、装置またはシステムを備える。受信機は、たとえば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、たとえば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えてもよい。
いくつかの実施形態では、プログラマブル論理デバイス(たとえばフィールドプログラマブルゲートアレイ)は、明細書に記載される方法の機能の一部または全てを実行するために使用され得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載される方法の1つを実行するためにマイクロプロセッサと協働し得る。一般に、方法は、好ましくはいずれかのハードウェア装置によって実行される。
本明細書に記載される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置およびコンピュータの組み合わせを使用して、実装され得る。
本明細書に記載される装置、または本明細書に記載される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび/またはソフトウェアで実装され得る。
本明細書に記載される方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置およびコンピュータの組み合わせを使用して、実行され得る。
本明細書に記載される方法、または本明細書に記載される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび/またはソフトウェアによって実行され得る。
上記の実施形態は、本発明の原理を単に例示するものである。本明細書に記載される配置および詳細の修正および変形は、当業者にとって明らかとなることが理解される。したがって、喫緊の請求項の範囲によってのみ限定され、本明細書の実施形態の記載および説明によって提示される具体的詳細によっては限定されないことが意図される。
参考文
[1] A. Alshin, E. Alshina, “Multi-parameter probability update for CABAC”, JCTVC-F254, Torino, July, 2011, http://phenix.it-sudparis.eu/jct/doc_end_user/documents/6_Torino/wg11/JCTVC-F254-v5.zip

[2] ITU-T, Recommondation H.265(12/16), https://www.itu.int/rec/dologin_pub.asp?lang=e&id=T-REC-H.265-201612-I!!PDF-E&type=items
[3] J.Stegemann, H.Kirchhoffer, D. Marpe, T. Wiegand, “Non-CE1: Counter-based probability model update with adapted arithmetic coding engine“ , http://phenix.it-sudparis.eu/jct/doc_end_user/documents/7_Geneva/wg11/JCTVC-G547-v4.zip
[4] A.Said, M. Karczewicz, V. Seregin, H. Egilmez, L. Zhang, X. Zhao, “EE2: Arithmetic coding with context-dependent double-window adaptation response”, JVET-H0061, http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/8_Macau/wg11/JVET-H0061-v1.zip
A.Said, M. Karczewicz, V. Seregin, H. Egilmez, L. Zhang, X. Zhao, “EE2 related: Arithmetic coding with progressive context-dependent double-window adaptation response”, http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/8_Macau/wg11/JVET-H0067-v2.zip

Claims (75)

  1. ビデオデコーダ(100;200)であって、
    前記ビデオデコーダは、複数のビデオフレームを復号化するように構成されており、
    前記ビデオデコーダは、1つ以上のスライスのセットに細分化されたビデオフレームを復号化するように構成されており、
    前記ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を評価するように構成されており、
    前記ビデオデコーダは、復号化バイナリシーケンス(122;222)の符号化表現(211)に基づいて前記バイナリシーケンスを提供するための算術デコーダ(120;220)を含み、
    前記算術デコーダは、第1推定パラメータ(w)を使用して第1ソース統計値(a、132、232)を決定し、第2推定パラメータ(w)を使用して第2ソース統計値(b、142、242)を決定するように構成されており、
    前記算術デコーダは、前記第1ソース統計値(a)に基づいて、および前記第2ソース統計値(b)に基づいて、結合ソース統計値
    Figure 2023018041000186
    を決定するように構成されており、
    前記算術デコーダは、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現を前記復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値(162、262)を決定するように構成されている、
    ビデオデコーダ。
  2. 前記第1推定パラメータは第1ウィンドウサイズであり、前記第2推定パラメータは第2ウィンドウサイズであるか、または
    前記第1推定パラメータは、前記第1ソース統計値が前記復号化バイナリシーケンスの復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第1慣性パラメータであり、
    前記第2推定パラメータは、前記第2ソース統計値が前記復号化バイナリシーケンスの復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第2慣性パラメータである、
    請求項1に記載のビデオデコーダ。
  3. 前記算術デコーダは、前記スライスタイプ情報に応じて前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項1または2に記載のビデオデコーダ。
  4. 前記ビデオデコーダは、前記ビットストリームに含まれる初期化パラメータまたはフラグにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項1から3のいずれか一項に記載のビデオデコーダ。
  5. 前記ビデオデコーダは、コンテキストモデルにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項1から4のいずれか一項に記載のビデオデコーダ。
  6. 前記ビデオデコーダは、前記第1ソース統計値の更新バージョンを取得するために、前に復号化されたバイナリ値に応じて前記第1ソース統計値のあらかじめ計算されたインスタンスに所定の値を選択的に加算し、前記第1ソース統計値の前記あらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されており、および/または
    前記ビデオデコーダは、前記第2ソース統計値の更新バージョンを取得するために、前に復号化されたバイナリ値に応じて前記第2ソース統計値のあらかじめ計算されたインスタンスに所定の値を選択的に加算し、前記第2ソース統計値の前記あらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている、
    請求項1から5のいずれか一項に記載のビデオデコーダ。
  7. 前記ビデオデコーダは、以下にしたがって前記第1ソース統計値の更新バージョンat+1を取得するように構成されており、
    Figure 2023018041000187
    ここで、aは前記第1ソース統計値のあらかじめ計算されたソース統計値バージョンであり、
    は前に復号化されたバイナリ値であり、
    はウィンドウサイズ情報であり、
    ここで
    Figure 2023018041000188
    ここで、BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    は所定の数であり、および/または
    前記ビデオデコーダは、以下にしたがって前記第2ソース統計値の更新バージョンbt+1を取得するように構成されており、
    Figure 2023018041000189
    ここで、bは前記第2ソース統計値のあらかじめ計算されたバージョンであり、
    は前に復号化されたシンボルであり、
    はウィンドウサイズ情報であり、
    ここで
    Figure 2023018041000190
    ここで、BITSは前記第2ソース統計値を表すために使用されるビット数であり、
    は所定の数である、
    請求項1から6のいずれか一項に記載のビデオデコーダ。
  8. =1および/またはk=1である、
    請求項7に記載のビデオデコーダ。
  9. 前記ビデオデコーダは、以下にしたがって前記第1ソース統計値at+1を決定するように構成されており、
    Figure 2023018041000191
    および
    Figure 2023018041000192
    ここで、aはあらかじめ計算されたソース統計値であり、
    は前に復号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第1ウィンドウサイズwを表し、
    Figure 2023018041000193
    であり、
    >>は右シフト演算子であり、および/または
    前記ビデオデコーダは、以下にしたがって前記第2ソース統計値bt+1を決定するように構成されており、
    Figure 2023018041000194
    および
    Figure 2023018041000195
    ここで、bはあらかじめ計算されたソース統計値であり、
    は前に復号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第2ウィンドウサイズwを表し、
    Figure 2023018041000196
    である、
    請求項1から8のいずれか一項に記載のビデオデコーダ。
  10. 前記ビデオデコーダは、以下にしたがって前記第1ソース統計値at+1を決定するように構成されており、
    Figure 2023018041000197
    ここで、aはあらかじめ計算されたソース統計値であり、
    は前に復号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第1ウィンドウサイズwを表し、
    Figure 2023018041000198
    であり、
    >>は右シフト演算子であり、および/または
    前記ビデオデコーダは、以下にしたがって前記第2ソース統計値bt+1を決定するように構成されており、
    Figure 2023018041000199
    ここで、bはあらかじめ計算されたソース統計値であり、
    は前に復号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第2ウィンドウサイズwを表し、
    Figure 2023018041000200
    である、
    請求項1から8のいずれか一項に記載のビデオデコーダ。
  11. 前記ビデオデコーダは、以下にしたがって前記第1ソース統計値at+1を決定するように構成されており、
    Figure 2023018041000201
    ここで、aはあらかじめ計算されたソース統計値であり、
    は前に復号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第1ウィンドウサイズwを表し、
    Figure 2023018041000202
    であり、
    >>は右シフト演算子であり、および/または
    前記ビデオデコーダは、以下にしたがって前記第2ソース統計値bt+1を決定するように構成されており、
    Figure 2023018041000203
    ここで、bはあらかじめ計算されたソース統計値であり、
    は前に復号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第2ウィンドウサイズwを表し、
    Figure 2023018041000204
    であり、
    >>は右シフト演算子である、
    請求項1から10のいずれか一項に記載のビデオデコーダ。
  12. 前記ビデオデコーダは、テーブルルックアップを使用して第1ソース統計値を決定するように構成されており、
    テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および前記第1推定パラメータに応じて選択され、および/または
    前記ビデオデコーダは、テーブルルックアップを使用して第2ソース統計値を決定するように構成されており、
    テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および前記に応じて選択される、
    請求項1から5のいずれか一項に記載のビデオデコーダ。
  13. 前記ビデオデコーダは、前記結合ソース統計値を取得するために、前記第1ソース統計値および前記第2ソース統計値を組み合わせるように構成されている、
    請求項1から12のいずれか一項に記載のビデオデコーダ。
  14. 前記ビデオデコーダは、以下にしたがって前記結合ソース統計値
    Figure 2023018041000205
    を取得するように構成されており、
    Figure 2023018041000206
    ここで、atは前記第1ソース統計値であり、
    btは前記第2ソース統計値である、
    請求項1から13のいずれか一項に記載のビデオデコーダ。
  15. 前記ビデオデコーダは、前記結合ソース統計値を取得するために、前記第1ソース統計値および前記第2ソース統計値を組み合わせるように構成されており、異なる重みが前記第1ソース統計値および前記第2ソース統計値に関連付けられる、
    請求項1から14のいずれか一項に記載のビデオデコーダ。
  16. 前記ビデオデコーダは、前記第1ソース統計値(たとえばat)および前記第2ソース統計値(たとえばbt)の表現のために異なるビット数(BITS、BITS)を使用するように構成されている、
    請求項1から15のいずれか一項に記載のビデオデコーダ。
  17. 前記ビデオデコーダは、前記第1ソース統計値(a)および前記第2ソース統計値(b)のために異なるウィンドウサイズを使用するように構成されており、前記ビデオデコーダは、比較的大きい推定パラメータを有する前記ソース統計値の表現には比較的大きいビット数を使用し、比較的小さい推定パラメータを有する前記ソース統計値の表現には比較的小さいビット数を使用するように構成されている、
    請求項16に記載のビデオデコーダ。
  18. 前記ビデオデコーダは、以下にしたがって前記第1ソース統計値aおよび/または前記第2ソース統計値bの数表現を修正するように構成されており、
    Figure 2023018041000207
    および/または
    Figure 2023018041000208
    その後前記結合ソース統計値を決定し、ここで
    Figure 2023018041000209
    ここで、BITSは前記第1ソース統計値の表現に割り当てられたビット数であり、BITSは前記第2ソース統計値の表現に割り当てられたビット数である、
    請求項16または17に記載のビデオデコーダ。
  19. 前記ビデオデコーダは、以下にしたがって前記結合ソース統計値
    Figure 2023018041000210
    を決定するように構成されており、
    Figure 2023018041000211
    そして前記ビデオデコーダは、以下にしたがって前記間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
    Figure 2023018041000212
    ここで、最確値の値は以下にしたがって決定され、
    Figure 2023018041000213
    ここで、BITStabResは、表のエントリ数を記述する、
    請求項18に記載のビデオデコーダ。
  20. 前記ビデオデコーダは、以下にしたがって前記結合ソース統計値
    Figure 2023018041000214
    を決定するように構成されており、
    Figure 2023018041000215
    そして前記ビデオデコーダは、以下にしたがって前記間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
    Figure 2023018041000216
    ここで、BITStabResは、表のエントリ数を記述する、
    請求項18に記載のビデオデコーダ。
  21. 前記ビデオデコーダは、前記第1推定パラメータに応じて、および前記第2推定パラメータに応じて、前記第1ソース統計値(a)および前記第2ソース統計値の表現の前記ビット数(BITS、BITS)を選択するように構成されている、
    請求項16から20のいずれか一項に記載のビデオデコーダ。
  22. 前記第1ソース統計値(a)および前記第2ソース統計値(b)の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である、
    請求項16から21のいずれか一項に記載のビデオデコーダ。
  23. 前記ビデオデコーダは、前記ビットストリームに含まれる初期化フラグ(ws_flag)にも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されており、
    前記ビデオデコーダは、前記ビットストリームに含まれる別の初期化パラメータまたはフラグに応じて、前記第1ソース統計値および/または前記第2ソース統計値の初期化値を設定するように構成されている、
    請求項1から22のいずれか一項に記載のビデオデコーダ。
  24. 前記算術デコーダは、現在のスライスの時間レベルにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されており、
    前記算術デコーダは、現在のスライスの量子化パラメータにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項1から23のいずれか一項に記載のビデオデコーダ。
  25. 前記ビデオデコーダは、位置に応じて前記第1推定パラメータおよび/または前記第2推定パラメータを調整するように構成されている、
    請求項1から24のいずれか一項に記載のビデオデコーダ。
  26. 前記ビデオデコーダは、開始位置に関連付けられたバイナリ値を復号化するときに前記第1推定パラメータおよび/または前記第2推定パラメータを開始値に設定し、少なくとも所定の位置だけ前記開始位置から離れた位置に関連付けられたバイナリ値を復号化するときに前記第1推定パラメータおよび/または前記第2推定パラメータを通常値に設定するように構成されている、
    請求項25に記載のビデオデコーダ。
  27. 前記ビデオデコーダは、前記推定パラメータを変更すべきであることを通知する信号フラグ(ctu_ws_flag)に応答して、スライス内の前記第1推定パラメータおよび/または前記第2推定パラメータを変更するように構成されている、
    請求項1から26のいずれか一項に記載のビデオデコーダ。
  28. 前記ビデオデコーダは、複数の符号化ツリーユニットについて、前記推定パラメータを変更すべきかどうかを示す信号フラグを評価し、前記信号フラグに応じて前記推定パラメータの少なくとも1つを増加または減少させるように構成されている、
    請求項27に記載のビデオデコーダ。
  29. 前記ビデオデコーダは、前記結合ソース統計値
    Figure 2023018041000217
    から状態インデックス(pStateIdx)を導出するように構成されており、および/または
    前記ビデオデコーダは、最確バイナリ値または最低確率バイナリ値を表す値(valMPS)を導出するように構成されており、
    前記ビデオデコーダは、前記間隔サブディビジョンの前記1つ以上の範囲値に前記状態インデックスをマッピングするテーブルを評価するように構成されている、
    請求項1から28のいずれか一項に記載のビデオデコーダ。
  30. 前記ビデオデコーダは、前記第2ソース統計値を一定の置換値で一時的に置き換え、前記結合ソース統計値を取得するために前記第1ソース統計値(a)を固定の非ゼロ置換値と組み合わせるように、構成されている、
    請求項1から29のいずれか一項に記載のビデオデコーダ。
  31. 前記ビデオデコーダは、前記第1ウィンドウサイズwおよび前記第2ウィンドウサイズwを以下のように選択するように構成されており、
    =nまたは
    |n-n|≧3
    ここで、
    Figure 2023018041000218
    またはn=round(log)であり、
    round()は切り上げまたは切り捨て演算子であり、
    Figure 2023018041000219
    またはn=round(log)である、
    請求項1から30のいずれか一項に記載のビデオデコーダ。
  32. 前記ビデオデコーダは、前記第1ウィンドウサイズwおよび前記第2ウィンドウサイズwを以下のように選択するように構成されており、
    |n-n|≧3
    ここで、
    Figure 2023018041000220
    またはn=round(log)であり、
    round()は切り上げまたは切り捨て演算子であり、
    Figure 2023018041000221
    またはn=round(log)である、
    請求項1から31のいずれか一項に記載のビデオデコーダ。
  33. ビデオデコーダ(100;200)であって、
    前記ビデオデコーダは、複数のビデオフレームを復号化するように構成されており、
    前記ビデオデコーダは、1つ以上のスライスのセットに細分化されたビデオフレームを復号化するように構成されており、
    前記ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を評価するように構成されており、
    前記ビデオデコーダは、復号化バイナリシーケンス(122;222)の符号化表現(211)に基づいて前記バイナリシーケンスを提供するための算術デコーダ(120;220)を含み、
    前記算術デコーダは、第1推定パラメータ(w)を使用して第1ソース統計値(a、132、232)を決定するように構成されており、
    前記算術デコーダは、結合ソース統計値
    Figure 2023018041000222
    を決定するように構成されており、前記算術デコーダは、前記結合ソース統計値を取得するために前記第1ソース統計値(a)を固定の非ゼロ値と組み合わせるように構成されており、
    前記算術デコーダは、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現を前記復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値(162、262)を決定するように構成されている、
    ビデオデコーダ。
  34. ビデオエンコーダ(300)であって、
    前記ビデオエンコーダは、複数のビデオフレームを符号化するように構成されており、
    前記ビデオエンコーダは、1つ以上のスライスのセットに細分化されたビデオフレームを符号化するように構成されており、
    前記ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を提供するように構成されており、
    前記ビデオエンコーダは、バイナリシーケンス(322)に基づいて前記バイナリシーケンスの符号化表現(311)を提供するための算術エンコーダ(320)を含み、
    前記算術エンコーダは、第1推定パラメータ(w)を使用して第1ソース統計値(a、332)を決定し、第2推定パラメータ(w)を使用して第2ソース統計値(b、342)を決定するように構成されており、
    前記算術エンコーダは、前記第1ソース統計値(a)に基づいて、および前記第2ソース統計値(b)に基づいて、結合ソース統計値
    Figure 2023018041000223
    を決定するように構成されており、
    前記算術エンコーダは、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現に前記バイナリシーケンスをマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値(362)を決定するように構成されている、
    ビデオエンコーダ。
  35. 前記第1推定パラメータは第1ウィンドウサイズであり、前記第2推定パラメータは第2ウィンドウサイズであるか、または
    前記第1推定パラメータは、前記第1ソース統計値が前記バイナリシーケンスのバイナリシンボルの頻度の変更に続く速度を決定する第1慣性パラメータであり、
    前記第2推定パラメータは、前記第2ソース統計値が前記バイナリシーケンスのバイナリシンボルの頻度の変更に続く速度を決定する第2慣性パラメータである、
    請求項34に記載のビデオエンコーダ。
  36. 前記ビデオエンコーダは、前記スライスタイプ情報に応じて前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項34または35に記載のビデオエンコーダ。
  37. 前記ビデオエンコーダは、初期化フラグを提供するように構成されており、前記ビデオエンコーダは、前記ビデオエンコーダによってビットストリームに含まれる、前記初期化パラメータまたはフラグにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項34または35または36に記載のビデオエンコーダ。
  38. 前記ビデオエンコーダは、コンテキストモデルにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項34から37のいずれか一項に記載のビデオエンコーダ。
  39. 前記ビデオエンコーダは、前記第1ソース統計値の更新バージョンを取得するために、前に符号化されたバイナリ値に応じて前記第1ソース統計値のあらかじめ計算されたインスタンスに所定の値を選択的に加算し、前記第1ソース統計値の前記あらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されており、および/または
    前記ビデオエンコーダは、前記第2ソース統計値の更新バージョンを取得するために、前に符号化されたバイナリ値に応じて前記第2ソース統計値のあらかじめ計算されたインスタンスに所定の値を選択的に加算し、前記第2ソース統計値の前記あらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている、
    請求項34から38のいずれか一項に記載のビデオエンコーダ。
  40. 前記ビデオエンコーダは、以下にしたがって前記第1ソース統計値の更新バージョンat+1を取得するように構成されており、
    Figure 2023018041000224
    ここで、aは前記第1ソース統計値のあらかじめ計算されたソース統計値バージョンであり、
    は前に復号化されたバイナリ値であり、
    はウィンドウサイズ情報であり、
    ここで
    Figure 2023018041000225
    ここで、BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    は所定の数であり、および/または
    前記ビデオエンコーダは、以下にしたがって前記第2ソース統計値の更新バージョンbt+1を取得するように構成されており、
    Figure 2023018041000226
    ここで、bは前記第2ソース統計値のあらかじめ計算されたバージョンであり、
    は前に符号化されたシンボルであり、
    はウィンドウサイズ情報であり、
    ここで
    Figure 2023018041000227
    ここで、BITSは前記第2ソース統計値を表すために使用されるビット数であり、
    は所定の数である、
    請求項34から39のいずれか一項に記載のビデオエンコーダ。
  41. =1および/またはk=1である、
    請求項40に記載のビデオエンコーダ。
  42. 前記ビデオエンコーダは、以下にしたがって前記第1ソース統計値at+1を決定するように構成されており、
    Figure 2023018041000228
    および
    Figure 2023018041000229
    ここで、aはあらかじめ計算されたソース統計値であり、
    は前に符号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第1ウィンドウサイズwを表し、
    Figure 2023018041000230
    であり、
    >>は右シフト演算子であり、および/または
    前記ビデオエンコーダは、以下にしたがって前記第2ソース統計値bt+1を決定するように構成されており、
    Figure 2023018041000231
    および
    Figure 2023018041000232
    ここで、bはあらかじめ計算されたソース統計値であり、
    は前に符号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第2ウィンドウサイズwを表し、
    Figure 2023018041000233
    である、
    請求項34から41のいずれか一項に記載のビデオエンコーダ。
  43. 前記ビデオエンコーダは、以下にしたがって前記第1ソース統計値at+1を決定するように構成されており、
    Figure 2023018041000234
    ここで、aはあらかじめ計算されたソース統計値であり、
    は前に符号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第1ウィンドウサイズwを表し、
    Figure 2023018041000235
    であり、
    >>は右シフト演算子であり、および/または
    前記ビデオエンコーダは、以下にしたがって前記第2ソース統計値bt+1を決定するように構成されており、
    Figure 2023018041000236
    ここで、bはあらかじめ計算されたソース統計値であり、
    は前に符号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第2ウィンドウサイズwを表し、
    Figure 2023018041000237
    である、
    請求項34から41のいずれか一項に記載のビデオエンコーダ。
  44. 前記ビデオエンコーダは、以下にしたがって前記第1ソース統計値at+1を決定するように構成されており、
    Figure 2023018041000238
    ここで、aはあらかじめ計算されたソース統計値であり、
    は前に符号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第1ウィンドウサイズwを表し、
    Figure 2023018041000239
    であり、
    >>は右シフト演算子であり、および/または
    前記ビデオエンコーダは、以下にしたがって前記第2ソース統計値bt+1を決定するように構成されており、
    Figure 2023018041000240
    ここで、btはあらかじめ計算されたソース統計値であり、
    は前に符号化されたバイナリ値であり、
    BITSは前記第1ソース統計値に割り当てられたビット数であり、
    は前記第2ウィンドウサイズwを表し、
    Figure 2023018041000241
    であり、
    >>は右シフト演算子である、
    請求項34から42のいずれか一項に記載のビデオエンコーダ。
  45. 前記ビデオエンコーダは、テーブルルックアップを使用して第1ソース統計値を決定するように構成されており、
    テーブルエントリは、前に決定されたソース統計値、前に符号化されたバイナリ値、および前記第1推定パラメータに応じて選択され、および/または
    前記ビデオデコーダは、テーブルルックアップを使用して第2ソース統計値を決定するように構成されており、
    テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および前記に応じて選択される、
    請求項34から42のいずれか一項に記載のビデオエンコーダ。
  46. 前記ビデオエンコーダは、前記結合ソース統計値を取得するために、前記第1ソース統計値および前記第2ソース統計値を組み合わせるように構成されている、
    請求項34から45のいずれか一項に記載のビデオエンコーダ。
  47. 前記ビデオエンコーダは、以下にしたがって前記結合ソース統計値
    Figure 2023018041000242
    を取得するように構成されており、
    Figure 2023018041000243
    ここで、aは前記第1ソース統計値であり、
    は前記第2ソース統計値である、
    請求項34から46のいずれか一項に記載のビデオエンコーダ。
  48. 前記ビデオエンコーダは、前記結合ソース統計値を取得するために、前記第1ソース統計値および前記第2ソース統計値を組み合わせるように構成されており、異なる重みが前記第1ソース統計値および前記第2ソース統計値に関連付けられる、
    請求項34から47のいずれか一項に記載のビデオエンコーダ。
  49. 前記ビデオエンコーダは、前記第1ソース統計値(a)および前記第2ソース統計値(b)の表現のために異なるビット数(BITS、BITS)を使用するように構成されている、
    請求項34から48のいずれか一項に記載のビデオエンコーダ。
  50. 前記ビデオエンコーダは、前記第1ソース統計値(a)および前記第2ソース統計値(b)のために異なるウィンドウサイズを使用するように構成されており、前記ビデオエンコーダは、比較的大きい推定パラメータを有する前記ソース統計値の表現には比較的大きいビット数を使用し、比較的小さい推定パラメータを有する前記ソース統計値の表現には比較的小さいビット数を使用するように構成されている、
    請求項49に記載のビデオエンコーダ。
  51. 前記ビデオエンコーダは、以下にしたがって前記第1ソース統計値aおよび/または前記第2ソース統計値bの数表現を修正するように構成されており、
    Figure 2023018041000244
    および/または
    Figure 2023018041000245
    その後前記結合ソース統計値を決定し、ここで
    Figure 2023018041000246
    ここでBITSは前記第1ソース統計値の表現に割り当てられたビット数であり、BITSは前記第2ソース統計値の表現に割り当てられたビット数である、
    請求項49または50に記載のビデオエンコーダ。
  52. 前記ビデオエンコーダは、以下にしたがって前記結合ソース統計値
    Figure 2023018041000247
    を決定するように構成されており、
    Figure 2023018041000248
    そして前記ビデオエンコーダは、以下にしたがって前記間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
    Figure 2023018041000249
    ここで、最確値の値は以下にしたがって決定され、
    Figure 2023018041000250
    ここで、BITStabResは、表のエントリ数を記述する、
    請求項51に記載のビデオエンコーダ。
  53. 前記ビデオエンコーダは、以下にしたがって前記結合ソース統計値
    Figure 2023018041000251
    を決定するように構成されており、
    Figure 2023018041000252
    そして前記ビデオエンコーダは、以下にしたがって前記間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
    Figure 2023018041000253
    ここで、BITStabResは、表のエントリ数を記述する、
    請求項51に記載のビデオエンコーダ。
  54. 前記ビデオエンコーダは、前記第1推定パラメータに応じて、および前記第2推定パラメータに応じて、前記第1ソース統計値(a)および前記第2ソース統計値の表現の前記ビット数(BITS、BITS)を選択するように構成されている、
    請求項49から53のいずれか一項に記載のビデオエンコーダ。
  55. 前記第1ソース統計値(a)および前記第2ソース統計値(b)の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である、
    請求項49から54のいずれか一項に記載のビデオエンコーダ。
  56. 前記ビデオエンコーダは、前記第1推定パラメータおよび前記第2推定パラメータを決定する初期化フラグ(ws_flag)を前記ビットストリームに含めるように構成されており、
    前記ビデオエンコーダは、前記第1ソース統計値および/または前記第2ソース統計の初期化値を決定する別の初期化フラグを前記ビットストリームに含めるように構成されている、
    請求項34から55のいずれか一項に記載のビデオエンコーダ。
  57. 前記ビデオエンコーダは、現在のスライスの時間レベルにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されており、
    前記ビデオエンコーダは、現在のスライスの量子化パラメータにも応じて、前記第1推定パラメータおよび前記第2推定パラメータを決定するように構成されている、
    請求項34から56のいずれか一項に記載のビデオエンコーダ。
  58. 前記ビデオエンコーダは、位置に応じて前記第1推定パラメータおよび/または前記第2推定パラメータを調整するように構成されている、
    請求項34から57のいずれか一項に記載のビデオエンコーダ。
  59. 前記ビデオエンコーダは、開始位置に関連付けられたバイナリ値を符号化するときに前記第1推定パラメータおよび/または前記第2推定パラメータを開始値に設定し、少なくとも所定の位置だけ前記開始位置から離れた位置に関連付けられたバイナリ値を符号化するときに前記第1推定パラメータおよび/または前記第2推定パラメータを通常値に設定するように構成されている、
    請求項58に記載のビデオエンコーダ。
  60. 前記ビデオエンコーダは、スライス内で前記推定パラメータを変更すべきであることを通知する信号フラグ(ctu_ws_flag)を前記ビットストリームに含めるように構成されている、
    請求項34から59のいずれか一項に記載のビデオエンコーダ。
  61. 前記ビデオエンコーダは、前記ビットストリームに、複数の符号化ツリーユニットについて、前記推定パラメータを変更すべきかどうかを示す前記信号フラグを含めるように構成されており、前記信号フラグは、前記推定パラメータの少なくとも1つを増加させるべきか減少させるべきかを示す、
    請求項60に記載のビデオエンコーダ。
  62. 前記ビデオエンコーダは、前記結合ソース統計値
    Figure 2023018041000254
    から状態インデックス(pStateIdx)を導出するように構成されており、および/または
    前記ビデオエンコーダは、最確バイナリ値または最低確率バイナリ値(valMPS)を表す値を導出するように構成されており、
    前記ビデオエンコーダは、前記間隔サブディビジョンの前記1つ以上の範囲値に前記状態インデックスをマッピングするテーブルを評価するように構成されている、
    請求項34から61のいずれか一項に記載のビデオエンコーダ。
  63. 前記ビデオエンコーダは、前記第2ソース統計値を一定の置換値で一時的に置き換え、前記結合ソース統計値を取得するために前記第1ソース統計値(a)を前記固定の非ゼロ置換値と組み合わせるように、構成されている、
    請求項34から62のいずれか一項に記載のビデオエンコーダ。
  64. 前記ビデオエンコーダは、前記第1ウィンドウサイズwおよび前記第2ウィンドウサイズwを以下のように選択するように構成されており、
    =nまたは
    |n-n|≧3
    ここで、
    Figure 2023018041000255
    またはn=round(log)であり、
    round()は切り上げまたは切り捨て演算子であり、
    Figure 2023018041000256
    またはn=round(log)である、
    請求項34から63のいずれか一項に記載のビデオエンコーダ。
  65. 前記ビデオエンコーダは、前記第1ウィンドウサイズwおよび前記第2ウィンドウサイズwを以下のように選択するように構成されており、
    |n-n|≧3
    ここで、
    Figure 2023018041000257
    またはn=round(log)であり、
    round()は切り上げまたは切り捨て演算子であり、
    Figure 2023018041000258
    またはn=round(log)である、
    請求項34から64のいずれか一項に記載のビデオエンコーダ。
  66. ビデオエンコーダ(300)であって、
    前記ビデオエンコーダは、複数のビデオフレームを符号化するように構成されており、
    前記ビデオエンコーダは、1つ以上のスライスのセットに細分化されたビデオフレームを符号化するように構成されており、
    前記ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を提供するように構成されており、
    前記ビデオエンコーダは、バイナリシーケンスに基づいて前記バイナリシーケンスの符号化表現を提供するための算術エンコーダ(320)を含み、
    前記算術エンコーダは、第1推定パラメータ(w)を使用して第1ソース統計値(a、332)を決定するように構成されており、
    前記算術エンコーダは、結合ソース統計値
    Figure 2023018041000259
    を決定するように構成されており、前記算術エンコーダは、前記結合ソース統計値を取得するために、前記第1ソース統計値(a)を固定の非ゼロ値と組み合わせるように構成されており、
    前記算術エンコーダは、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現に前記バイナリシーケンスをマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値(362)を決定するように構成されている、
    ビデオエンコーダ。
  67. ビデオコンテンツを復号化する方法であって、
    前記方法は、複数のビデオフレームを復号化するステップを含み、
    前記方法は、1つ以上のスライスのセットに細分化されたビデオフレームを復号化するステップを含み、
    前記方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を評価するステップを含み、
    前記方法は、復号化バイナリシーケンスの符号化表現に基づいて前記バイナリシーケンスを提供するステップを含み、
    前記方法は、第1推定パラメータ(w)を使用して第1ソース統計値(a)を決定し、第2推定パラメータ(w)を使用して第2ソース統計値(b)を決定するステップを含み、
    前記方法は、前記第1ソース統計値(a)に基づいて、および前記第2ソース統計値(b)に基づいて、結合ソース統計値
    Figure 2023018041000260
    を決定するステップを含み、
    前記方法は、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現を前記復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む、
    方法。
  68. ビデオコンテンツを復号化する方法であって、
    前記方法は、複数のビデオフレームを復号化するステップを含み、
    前記方法は、1つ以上のスライスのセットに細分化されたビデオフレームを復号化するステップを含み、
    前記方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を評価するステップを含み、
    前記方法は、復号化バイナリシーケンスの符号化表現に基づいて前記バイナリシーケンスを提供するステップを含み、
    前記方法は、第1推定パラメータ(w)を使用して第1ソース統計値(a)を決定するステップを含み、
    前記方法は、結合ソース統計値
    Figure 2023018041000261
    を決定するステップを含み、前記第1ソース統計値(a)は、前記結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられ、
    前記方法は、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現を前記復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む、
    方法。
  69. ビデオコンテンツを符号化する方法であって、
    前記方法は、複数のビデオフレームを符号化するステップを含み、
    前記方法は、1つ以上のスライスのセットに細分化されたビデオフレームを符号化するステップを含み、
    前記ビデオ方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を提供するステップを含み、
    前記ビデオ方法は、バイナリシーケンスに基づいて前記バイナリシーケンスの符号化表現を提供するステップを含み、
    前記方法は、第1推定パラメータ(w)を使用して第1ソース統計値(a)を決定し、第2推定パラメータ(w)を使用して第2ソース統計値(b)を決定するステップを含み、
    前記方法は、前記第1ソース統計値(a)に基づいて、および前記第2ソース統計値(b)に基づいて、結合ソース統計値
    Figure 2023018041000262
    を決定するステップを含み、
    前記方法は、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現に前記バイナリシーケンスをマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む、
    方法。
  70. ビデオコンテンツを符号化する方法であって、
    前記方法は、複数のビデオフレームを符号化するステップを含み、
    前記方法は、1つ以上のスライスのセットに細分化されたビデオフレームを符号化するステップを含み、
    前記方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報を提供するステップを含み、
    前記ビデオ方法は、バイナリシーケンスに基づいて前記バイナリシーケンスの符号化表現を提供するステップを含み、
    前記方法は、第1推定パラメータ(w)を使用して第1ソース統計値(a)を決定するステップを含み、
    前記方法は、結合ソース統計値
    Figure 2023018041000263
    を決定するステップを含み、前記第1ソース統計値(a)は、前記結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられ、
    前記方法は、前記結合ソース統計値に基づいて、前記バイナリシーケンスの前記符号化表現に前記バイナリシーケンスをマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む、
    方法。
  71. コンピュータプログラムがコンピュータ上で実行されたときに、請求項67から70のいずれか一項に記載の方法を実行する、コンピュータプログラム。
  72. 前記ビデオコンテンツを表す前記バイナリシーケンスの符号化表現と、
    前記バイナリシーケンスの前記符号化表現に基づいて前記ビデオコンテンツを再構築するために使用されるビデオデコーダの構成を記述する、構成情報と
    を含み、
    前記構成情報は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの1つ以上の範囲値を決定するために使用される、第1ソース統計値(a)を決定するためにビデオデコーダによって使用される推定パラメータを記述する、推定パラメータ情報(ws_flag)を含み、前記1つ以上の範囲値は、前記バイナリシーケンスの前記符号化表現を前記復号化バイナリシーケンスにマッピングするために使用され、および/または
    前記推定パラメータ情報(ws_flag)は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの1つ以上の範囲値を決定するために使用される、第2ソース統計値(b)を決定するためにビデオデコーダによって使用される推定パラメータを記述する、
    ビデオビットストリーム。
  73. 前記ビデオビットストリームはまた、前記第1ソース統計値および/または前記第2ソース統計値の初期化値を記述する、初期化値情報も含む、請求項72に記載のビデオビットストリーム。
  74. 前記ビデオビットストリームは、前記推定パラメータを増加または減少させるべきであることを示す推定パラメータ変更フラグ(ctu_ws_flag)をさらに含む、請求項72または73に記載のビデオビットストリーム。
  75. 前記推定パラメータ情報は、第1ソース統計値を決定するためにビデオデコーダによって使用される第1ウィンドウサイズを記述し、前記推定パラメータ情報は、第2ソース統計値を決定するためにビデオデコーダによって使用される第2ウィンドウサイズを記述するか、または
    前記推定パラメータ情報は、前記第1ソース統計値が前記バイナリシーケンスの復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第1慣性パラメータを記述し、
    前記推定パラメータ情報は、前記第2ソース統計値が前記バイナリシーケンスの復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第2慣性パラメータを記述する、
    請求項72から74のいずれか一項に記載のビデオビットストリーム。
JP2022184990A 2018-03-29 2022-11-18 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム Active JP7451655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024034116A JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP18165250 2018-03-29
EP18165250.4 2018-03-29
PCT/EP2019/058057 WO2019185893A1 (en) 2018-03-29 2019-03-29 Video decoder, video encoder, method for decoding a video content, method for encoding a video content, computer program and video bitstream
JP2020552198A JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020552198A Division JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024034116A Division JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Publications (2)

Publication Number Publication Date
JP2023018041A true JP2023018041A (ja) 2023-02-07
JP7451655B2 JP7451655B2 (ja) 2024-03-18

Family

ID=61868360

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2020552198A Active JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム
JP2022184990A Active JP7451655B2 (ja) 2018-03-29 2022-11-18 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム
JP2024034116A Pending JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020552198A Active JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024034116A Pending JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Country Status (7)

Country Link
US (2) US11457230B2 (ja)
EP (1) EP3777197A1 (ja)
JP (3) JP7181941B2 (ja)
KR (3) KR102617187B1 (ja)
CN (1) CN112313960B (ja)
TW (2) TWI799785B (ja)
WO (1) WO2019185893A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11113846B2 (en) 2018-08-31 2021-09-07 Hulu, LLC Coefficient context modeling in video coding
EP4140126A4 (en) 2020-05-22 2023-06-21 Beijing Bytedance Network Technology Co., Ltd. SCALING WINDOW IN A SUB-PICTURE SUB-BITSTREAM EXTRACTION PROCESS
WO2023194108A2 (en) * 2022-04-08 2023-10-12 Interdigital Ce Patent Holdings, Sas Systems and methods associated with entropy coding
CN114640695B (zh) * 2022-04-24 2023-04-07 上海交通大学 一种智能工厂基于长序列双预测和informer的高频时序数据有效传输方法
US11977779B2 (en) * 2022-05-11 2024-05-07 Bank Of America Corporation Smart queue for distributing user requests to automated response generating systems
WO2024050099A1 (en) * 2022-09-02 2024-03-07 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for intra block copy

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016196307A1 (en) * 2015-05-29 2016-12-08 Qualcomm Incorporated Advanced arithmetic coder

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL290229B2 (en) * 2011-06-16 2023-04-01 Ge Video Compression Llc Entropy coding of motion vector differences
US10701390B2 (en) * 2017-03-14 2020-06-30 Qualcomm Incorporated Affine motion information derivation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016196307A1 (en) * 2015-05-29 2016-12-08 Qualcomm Incorporated Advanced arithmetic coder

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A.ALSHIN AND E.ALSHINA: "Multi-parameter probability up-date for CABAC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-F254, JPN6021044947, July 2011 (2011-07-01), pages 1 - 5, ISSN: 0005159423 *
ALEXANDER ALSHIN, ELENA ALSHINA, AND JEONGHOON PARK: "CE1 (subset B): Multi-parameter probability up-date for CABAC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-G764, JPN6021044943, November 2011 (2011-11-01), pages 1 - 4, ISSN: 0005159424 *
AMIR SAID, ET AL.: "Arithmetic coding with context-dependent double-window adaptation response", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-G0112, JPN6021044946, July 2017 (2017-07-01), pages 1 - 4, ISSN: 0005159425 *
AMIR SAID, ET AL.: "EE2 related: Arithmetic coding with progressive context-dependent double-window adaptation response", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-H0067, JPN6021044945, October 2017 (2017-10-01), pages 1 - 9, ISSN: 0005159426 *
M. ALBRECHT, ET AL.: "Description of SDR, HDR, and 360° video coding technology proposal by Fraunhofer HHI", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11, vol. JVET-J0014-v4, JPN6021044944, April 2018 (2018-04-01), pages 18 - 20, ISSN: 0005159427 *

Also Published As

Publication number Publication date
KR20230057474A (ko) 2023-04-28
TW201943274A (zh) 2019-11-01
WO2019185893A1 (en) 2019-10-03
CN112313960B (zh) 2023-05-09
TWI721396B (zh) 2021-03-11
JP7451655B2 (ja) 2024-03-18
TW202143728A (zh) 2021-11-16
KR102523750B1 (ko) 2023-04-20
US20220417538A1 (en) 2022-12-29
CN112313960A (zh) 2021-02-02
US11457230B2 (en) 2022-09-27
US20210014512A1 (en) 2021-01-14
KR20200128754A (ko) 2020-11-16
JP2024063203A (ja) 2024-05-10
KR20240005114A (ko) 2024-01-11
KR102617187B1 (ko) 2023-12-27
JP7181941B2 (ja) 2022-12-01
JP2021518716A (ja) 2021-08-02
TWI799785B (zh) 2023-04-21
EP3777197A1 (en) 2021-02-17

Similar Documents

Publication Publication Date Title
JP7181941B2 (ja) ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム
JP6560393B2 (ja) エントロピー符号化におけるコンテキスト初期化
JP7164692B2 (ja) 低遅延のためのサンプルアレイ符号化
US10097834B2 (en) Selection of the maximum dynamic range of transformed data and the data precision of transform matrices according to the bit depth of input data
KR102393305B1 (ko) 엔트로피 인코딩 및 디코딩 방식
CN113170132A (zh) 使用或适用于与依赖标量量化的组合的变换系数的有效编码
TWI827010B (zh) 算術編碼器、算術解碼器、視訊編碼器、視訊解碼器、編碼方法、解碼方法及電腦程式
EP3603062B1 (en) Binary arithmetic coding with parameterized probability estimation finite state machines
KR102361206B1 (ko) Gcli 엔트로피 코딩을 위한 부대역 의존 예측 적응을 사용하여 인코딩 또는 디코딩하기 위한 방법 및 장치
CN112534815A (zh) 使用阈值用于系数译码的常规译码二进制数缩减
JP2015515812A (ja) ビデオ符号化のための量子化係数を提供するための機器および方法
Sharabayko et al. Entropy-based intra-coding RDO estimation for HEVC
US11979584B2 (en) Arithmetic encoders and decoders, video encoders and decoders, methods for encoding or decoding symbols, and methods for encoding or decoding video content
Belyaev et al. An efficient multiplication-free and look-up table-free adaptive binary arithmetic coder
JP6495834B2 (ja) 映像符号化方法、映像符号化装置及び映像符号化プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240306

R150 Certificate of patent or registration of utility model

Ref document number: 7451655

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150