JP7451655B2 - ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム - Google Patents

ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム Download PDF

Info

Publication number
JP7451655B2
JP7451655B2 JP2022184990A JP2022184990A JP7451655B2 JP 7451655 B2 JP7451655 B2 JP 7451655B2 JP 2022184990 A JP2022184990 A JP 2022184990A JP 2022184990 A JP2022184990 A JP 2022184990A JP 7451655 B2 JP7451655 B2 JP 7451655B2
Authority
JP
Japan
Prior art keywords
source
window size
video
statistic
source statistic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022184990A
Other languages
English (en)
Other versions
JP2023018041A (ja
Inventor
ステゲマン・ヤン
キルヒホッファー・ハイナー
マルペ・デトレフ
シュワルツ・ハイコー
ヴィーガンド・トーマス
Original Assignee
フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2023018041A publication Critical patent/JP2023018041A/ja
Priority to JP2024034116A priority Critical patent/JP2024063203A/ja
Application granted granted Critical
Publication of JP7451655B2 publication Critical patent/JP7451655B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明による実施形態は、ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリームに関する。
本発明による一実施形態は、バイナリ算術符号化の確率推定方法に関し、これはたとえば、ビデオエンコーダ、ビデオデコーダ、さらに画像エンコーダ、画像デコーダ、オーディオエンコーダ、オーディオデコーダなどでも使用され得る。
算術符号化および復号化は、オーディオおよびビデオコンテンツの符号化および復号化における貴重なツールであることが証明されている。たとえば、符号化効率を高めるために、ビデオまたはオーディオコンテンツを表すバイナリシーケンス内のバイナリ値の既知の発生確率を利用することが可能である。特に、算術符号化は、「0」および「1」の様々な確率を効率的に処理することができ、確率の変化に正確に適応することができる。
しかしながら、算術符号化および復号化を最適な符号化効率で実現するためには、実際の発生確率をよく反映する「0」および「1」の確率に関する適切な情報を入手することが重要である。「0」および「1」の確率に関する(または一般に、符号化すべきシンボルの確率に関する)知識は通常、(たとえば、全範囲の値が、異なるバイナリ値またはバイナリ値のグループに関連付けられた間隔に細分化されるように)間隔サブディビジョンを取得するために、値の全範囲内の間隔の境界を調整するために使用される。
したがって、計算効率と信頼性との間の適切なトレードオフを提供する、ソース統計値、または間隔サブディビジョンの範囲値を決定するための概念が必要とされている。
本発明による一実施形態はビデオデコーダを作成し、ビデオデコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するように構成されている。
ビデオデコーダは、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するように構成されており、ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロック(たとえば、1つのみのブロック)のピクセルに基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するように構成されている。ビデオデコーダは、バイナリシーケンスの符号化表現に基づいて(たとえば、画像コンテンツの変換係数を記述する)復号化バイナリシーケンスを提供するための算術デコーダを含む。算術デコーダは、前に復号化されたバイナリシーケンスに基づいて、(たとえばウィンドウサイズ変数で表され得る)第1ウィンドウサイズ(たとえばw)を使用して、(たとえば、前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づく)(そしてたとえば、「カウンタ変数」または「カウンタ」としても指定される)第1ソース統計値(たとえばa)を決定するように、そしてたとえば前に復号化されたバイナリシーケンスに基づいて、第2ウィンドウサイズ(たとえばw)を使用して、(前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づく)第2ソース統計値(たとえばb)を決定するように、構成されている。算術デコーダは、たとえば、第1ソース統計値(たとえばa)に基づいて、および第2ソース統計値(たとえばb)に基づいて、結合ソース統計値(たとえば
Figure 0007451655000001
またはp)を決定するように構成されている。算術デコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
ビデオデコーダの好適な実施形態では、算術デコーダは、スライスタイプ情報に応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている(たとえば、異なる値を取るようになっており、第1ウィンドウサイズおよび第2ウィンドウサイズはたとえば、1および11を含む、1から11までの範囲内にあってもよい)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、ビットストリームに含まれる初期化パラメータまたはフラグ(たとえば、「cabac init flag」)にも応じて(たとえばスライスあたり1つの初期化フラグ)、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されており、初期化フラグは、任意選択的に、第1ソース統計値および/または第2ソース統計値の初期化値も定義し得る。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、コンテキストモデルにも応じて(たとえばどのタイプの情報が復号化されるか、たとえば変換係数の1つ以上の最上位ビットまたは変換係数の1つ以上の下位ビットのどちらが復号化されるかに応じて)、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。たとえば、第1ウィンドウサイズおよび第2ウィンドウサイズを定義するウィンドウサイズ値のペアは、スライスタイプ、初期化フラグ、およびコンテキストモデルの組み合わせごとに事前定義され得る。
好適な実施形態では、ビデオデコーダは、第1ソース統計値の更新バージョン(at+1)を取得するために、前に復号化されたバイナリ値(たとえばx))に応じて第1ソース統計値のあらかじめ計算されたインスタンス(たとえばa)に所定の値(たとえば
Figure 0007451655000002
)を選択的に加算し、第1ソース統計値(たとえば
Figure 0007451655000003
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。あるいは、または追加で、ビデオデコーダは、第2ソース統計値の更新バージョン(たとえばbt+1)を取得するために、前に復号化されたバイナリ値(たとえばx))に応じて第2ソース統計値のあらかじめ計算されたインスタンス(たとえばb)に所定の値(たとえば
Figure 0007451655000004
)を選択的に加算し、第2ソース統計値(たとえば
Figure 0007451655000005
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。
好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値の更新バージョンat+1を取得するように構成されており、
Figure 0007451655000006
ここで、aは第1ソース統計値のあらかじめ計算されたバージョン、xは前に復号化されたバイナリ値(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、
Figure 0007451655000007
ここで、BITSaは第1ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
あるいは、または追加で、ビデオデコーダは、以下にしたがって第2ソース統計値の更新バージョンbt+1を取得するように構成されており、
Figure 0007451655000008
ここで、bは第2ソース統計値のあらかじめ計算されたバージョン、xは前に復号化されたシンボル(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、ここで
Figure 0007451655000009
ここで、BITSは第2ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
好適な実施形態では、k=1および/またはk=1である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 0007451655000010
および
Figure 0007451655000011
ここで、aはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 0007451655000012
であり、そして「>>」は右シフト演算子であり、および/またはビデオデコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 0007451655000013
および
Figure 0007451655000014
ここで、bはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 0007451655000015
である。
なお、第1および第2ソース統計値の更新は、パラメータBITSa/bおよびna/bのみが異なることに留意されたい。この好適な実施形態の終わりまで、aおよびbの両方の更新手順について論じるために、aおよびaが使用される。bの更新手順を生み出すには、以下の式で、すべての出現箇所を単純にbに置き換える必要がある。
更新手順は、以下のように記述し直すことができる。
Figure 0007451655000016
および
Figure 0007451655000017
これは、上記の元の更新式とまったく同じ結果を生じる。上記2つの更新式の最初の式は、以下のように記述し直すことができる。
Figure 0007451655000018
ここで、
Figure 0007451655000019
なお、ONEは、1に等しい確率値を表すことに留意されたい。効率的な実装のために、ONEを量子化またはわずかに変更することが合理的であろう(たとえば、少量を加算または減算することによる)。これは、ソース統計値の挙動に対して実質的に影響を与えない。たとえば、
Figure 0007451655000020
を使用すると、ONEのバイナリ表現は、元のバージョンよりも1ビット少なくなければならない。しかしながら、ソース統計値の更新の挙動は実質的に変更されない。
好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 0007451655000021
ここで、aはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 0007451655000022
、そして>>は右シフト演算子である。
あるいは、または追加で、ビデオデコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 0007451655000023
ここで、bはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 0007451655000024
である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 0007451655000025
ここで、aはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 0007451655000026
であり、そして「>>」は右シフト演算子であり、および/またはビデオデコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 0007451655000027
ここで、bはあらかじめ計算されたソース統計値、xは前に復号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 0007451655000028
、そして「>>」は右シフト演算子である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって結合ソース統計値
Figure 0007451655000029
を取得するように構成されており、
Figure 0007451655000030
ここで、aは第1ソース統計値、bは第2ソース統計値である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されており、異なる重みが第1ソース統計値および第2ソース統計値に関連付けられる(任意選択的に、ビデオデコーダは、復号化プロセス中に重みを変更するように構成される)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)の表現のために異なるビット数(たとえばBITS、BITS)を使用するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)のために異なるウィンドウサイズを使用するように構成されており、ビデオデコーダは、比較的大きいウィンドウサイズを有するソース統計値の表現には比較的大きいビット数を使用し、比較的小さいウィンドウサイズを有するソース統計値の表現には比較的小さいビット数を使用するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって第1ソース統計値aおよび/または第2ソース統計値bの数表現を修正するように構成されており、
Figure 0007451655000031
および/または
Figure 0007451655000032
その後結合ソース統計値を決定し、ここで
Figure 0007451655000033
ここでBITSは第1ソース統計値の表現に割り当てられたビット数、BITSは第2ソース統計値の表現に割り当てられたビット数である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって結合ソース統計値
Figure 0007451655000034
を決定するように構成されており、
Figure 0007451655000035
そしてビデオデコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 0007451655000036
ここで、最確(たとえばバイナリ)値の値は以下にしたがって決定され、
Figure 0007451655000037
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から0.5までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、以下にしたがって結合ソース統計値
Figure 0007451655000038
を決定するように構成されており、
Figure 0007451655000039
そしてビデオデコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 0007451655000040
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から1までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ウィンドウサイズに応じて、および第2ウィンドウサイズに応じて、第1ソース統計値(たとえばa)および第2ソース統計値の表現のビット数(たとえばBITS、BITS)を選択するように構成されている(たとえば、
Figure 0007451655000041
にしたがって、ここで
Figure 0007451655000042
またはn=round(log)、round()は切り上げまたは切り捨て演算子、および/または
Figure 0007451655000043
にしたがって、ここで
Figure 0007451655000044
またはn=round(log)、ThrHdは所定の好ましい固定値)。
ビデオデコーダの好適な実施形態では、第1ソース統計値(a)および第2ソース統計値(b)の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である(または第1ソース統計値の表現に使用されるビット数の変形例の場合は独立している)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、ビットストリームに含まれる(たとえば専用の)初期化フラグ(たとえば、「ws_flag」)にも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されており、ビデオデコーダは、ビットストリームに含まれる別の初期化フラグ(たとえば、「cabac init flag」)に応じて、第1ソース統計値および/または第2ソース統計値の初期化値を設定するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダまたは算術デコーダは、現在のスライスの時間レベルにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。あるいは、または追加で、ビデオデコーダまたは算術デコーダは、現在のスライスの量子化パラメータにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、位置に応じて第1ウィンドウサイズおよび/または第2ウィンドウサイズを調整するように構成されている(たとえば、いくつのバイナリ値が現在のスライス内で既に復号化されたかに応じて、またはコンテキストの初期化以降、第1ウィンドウサイズおよび/または第2ウィンドウサイズが関連付けられているコンテキストモデルを使用して、または復号化されるバイナリ値が関連付けられているフレーム内のピクセルまたはピクセルのブロックの位置に応じて)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、開始位置(たとえばピクセルのブロックの最初の行、またはピクセルのブロックの最初の列)に関連付けられたバイナリ値を復号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを開始値(好ましくは通常値よりも小さい)に設定し、少なくとも所定の位置(または距離)だけ開始位置から離れた位置に関連付けられたバイナリ値を復号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを通常値(好ましくは開始値よりも大きい)に設定するように、構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、ウィンドウサイズを変更すべきであることを通知する信号フラグ(たとえば「ctu_ws_flag」フラグ)に応答して、スライス内の第1ウィンドウサイズおよび/または第2ウィンドウサイズを変更するように構成されている(たとえば、スライスを復号化するとき)。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、複数の符号化ツリーユニット(またはすべての符号化ツリーユニットでもよい)について、ウィンドウサイズを変更すべきかどうかを示す信号フラグを評価し、信号フラグに応じてウィンドウサイズの少なくとも1つを拡大または縮小するように(たとえば、ウィンドウサイズの最大範囲を超えないように気をつけながら、信号フラグに応じて1つだけ、異なるコンテキストモデルであってもすべてのウィンドウサイズをまとめて拡大または縮小するように)、構成されている。代替例として、いくつかのコンテキストモデルのウィンドウサイズのみを拡大または縮小することも可能である。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、たとえば式(8)または式(12)または式(14)にしたがって、結合ソース統計値(たとえば
Figure 0007451655000045
またはp)から状態インデックス(たとえばpStateIdx)を導出するように構成されている。あるいは、または追加で、ビデオデコーダは、たとえば式(9)または式(13にしたがって、最確バイナリ値または最低確率バイナリ値を表す値(たとえばvalMPS)を導出するように構成されている。また、ビデオデコーダは、間隔サブディビジョンの1つ以上の範囲値に状態インデックスをマッピングするテーブルを評価するように構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第2ソース統計値を一定の置換値で一時的に(たとえば、初期化の直後のみならず、バイナリシーケンスの複数のバイナリ値の復号化のために)置き換え、結合ソース統計値を取得するために第1ソース統計値(たとえばa)を固定の非ゼロ置換値と組み合わせるように、構成されている。
ビデオデコーダの好適な実施形態では、ビデオデコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
=nまたは
|n-n|≧3
ここで、
Figure 0007451655000046
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 0007451655000047
またはn=round(log)である。
好適な実施形態では、ビデオデコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
|n-n|≧3
ここで、
Figure 0007451655000048
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 0007451655000049
またはn=round(log)である。
本発明による別の実施形態はビデオデコーダを作成し、ビデオデコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するように構成されており、ビデオデコーダは、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するように構成されている。ビデオデコーダは、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するように構成されている。ビデオデコーダは、バイナリシーケンスの符号化表現に基づいて(たとえば、画像コンテンツの変換係数を記述する)復号化バイナリシーケンスを提供するための算術デコーダを含む。算術デコーダは、たとえば、ウィンドウサイズ変数で表され得る、第1ウィンドウサイズ(たとえばw)を使用して、第1ソース統計値(たとえば、a)(前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、「カウンタ変数」または「カウンタ」としても指定され得る)を決定するように構成されている。算術デコーダは、たとえば、前に復号化されたバイナリシーケンスに基づいて第1ソース統計値を決定してもよい。算術デコーダは、結合ソース統計値(たとえば、
Figure 0007451655000050
またはp)を決定するように構成されており、算術デコーダは、結合ソース統計値を取得するために、第1ソース統計値(たとえば、a)を固定の非ゼロ値と組み合わせるように構成されており、算術デコーダは、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されており、算術デコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
この実施形態は、個別におよび組み合わせて、先に論じられた実施形態に関して述べられた特徴、機能、および詳細のいずれかによって補足され得る。
本発明による一実施形態はビデオエンコーダを作成し、ビデオエンコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するように構成されており、
ビデオエンコーダは、1つ以上のスライスのセット(好ましくは複数のスライス)に細分化されたビデオフレームを符号化するように構成されている。ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。ビデオエンコーダは、バイナリシーケンスに基づいて(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するための算術エンコーダを含む(バイナリシーケンスは、変換係数またはスペクトル係数、またはパラメータ、またはその他いずれかの情報、たとえば符号化されるビデオコンテンツのフレームのコンテンツを表す情報を表し得る)。算術エンコーダは、たとえばウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、第1ソース統計値(a)を決定するように構成されており、これはたとえば、前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」としても指定され得る。ビデオエンコーダは、たとえば、前に符号化されたバイナリシーケンスに基づいて第1ソース統計値を決定し得る。算術エンコーダまたはビデオエンコーダは、第2ウィンドウサイズ(たとえば、w)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよい、第2ソース統計値(たとえば、b)を決定するように構成され得る。算術エンコーダまたはビデオエンコーダは、たとえば前に符号化されたバイナリシーケンスに基づいて、第2ソース統計値を決定するように構成され得る。算術エンコーダは、第1ソース統計値(たとえば、a)に基づいて、および第2ソース統計値(たとえば、bに基づいて、結合ソース統計値(たとえば、
Figure 0007451655000051
またはp)を決定するように構成されており、算術エンコーダは、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
好適な実施形態では、ビデオエンコーダ(または同等に、算術エンコーダ)は、スライスタイプ情報に応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている(たとえば、第1ウィンドウサイズおよび第2ウィンドウサイズはたとえば、1および11を含む、1から11までの範囲内にあってもよい、2つの異なる値)。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、初期化パラメータまたはフラグ(たとえば、「cabac init flag」フラグ)を提供するように構成されており、ビデオエンコーダは、ビデオエンコーダによってビットストリーム(たとえば、ビデオフレームを表すビットストリーム)に含まれる初期化パラメータまたはフラグ(たとえば、「cabac init flag」)にも応じて第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。たとえば、ビデオエンコーダは、スライスあたり1つの初期化フラグを提供し、初期化フラグは、任意選択的に、第1ソース統計値および/または第2ソース統計値の初期化値も定義し得る。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、コンテキストモデルにも応じて(たとえばどのタイプの情報が符号化されるか、たとえば変換係数の1つ以上の最上位ビットまたは変換係数の1つ以上の下位ビットのどちらが符号化されるかに応じて)、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。たとえば、第1ウィンドウサイズおよび第2ウィンドウサイズを定義するウィンドウサイズ値のペアは、スライスタイプ、初期化フラグ、およびコンテキストモデルの組み合わせごとに事前定義され得る。
好適な実施形態では、ビデオエンコーダは、第1ソース統計値の更新バージョン(at+1)を取得するために、前に符号化されたバイナリ値(たとえばx))に応じて第1ソース統計値のあらかじめ計算されたインスタンス(たとえばa)に所定の値(たとえば
Figure 0007451655000052
)を選択的に加算し、第1ソース統計値(たとえば
Figure 0007451655000053
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。あるいは、または追加で、ビデオエンコーダは、第2ソース統計値の更新バージョン(たとえばbt+1)を取得するために、前に符号化されたバイナリ値(たとえばx))に応じて第2ソース統計値のあらかじめ計算されたインスタンス(たとえばb)に所定の値(たとえば
Figure 0007451655000054
)を選択的に加算し、第2ソース統計値(たとえば
Figure 0007451655000055
)のあらかじめ計算されたインスタンスのスケーリングバージョンを減算するように、構成されている。
好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値の更新バージョンat+1を取得するように構成されており、
Figure 0007451655000056
ここで、aは第1ソース統計値のあらかじめ計算されたソース統計値バージョン、xは前に符号化されたバイナリ値(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、
Figure 0007451655000057
ここで、BITSaは第1ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値の更新バージョンbt+1を取得するように構成されており、
Figure 0007451655000058
ここで、bは第2ソース統計値のあらかじめ計算されたバージョン、xは前に符号化されたシンボル(たとえば0または1の値を取るバイナリシンボル)、nはウィンドウサイズ情報(たとえば整数を有する)であり、ここで
Figure 0007451655000059
ここで、BITSは第2ソース統計値を表すために使用されるビット数、kは所定の数(たとえば整数、たとえば0または1)である。
好適な実施形態では、k=1および/またはk=1である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、(たとえば、値xt+1の符号化のため)以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 0007451655000060
および
Figure 0007451655000061
ここで、aはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 0007451655000062
、そして「>>」は右シフト演算子である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されてもよく、
Figure 0007451655000063
および
Figure 0007451655000064
ここで、bはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 0007451655000065
である。
好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 0007451655000066
ここで、aはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 0007451655000067
、そして>>は右シフト演算子である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されており、
Figure 0007451655000068
ここで、bはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 0007451655000069
である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値at+1を決定するように構成されており、
Figure 0007451655000070
ここで、aはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第1ウィンドウサイズwを表し、
Figure 0007451655000071
、そして「>>」は右シフト演算子である。
あるいは、または追加で、ビデオエンコーダは、以下にしたがって第2ソース統計値bt+1を決定するように構成されてもよく、
Figure 0007451655000072
ここで、btはあらかじめ計算されたソース統計値、xは前に符号化されたバイナリ値、BITSは第1ソース統計値に割り当てられたビット数であり、nは第2ウィンドウサイズwを表し、
Figure 0007451655000073
、そして「>>」は右シフト演算子である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって結合ソース統計値
Figure 0007451655000074
を取得するように構成されており、
Figure 0007451655000075
ここで、aは第1ソース統計値、bは第2ソース統計値である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、結合ソース統計値を取得するために、第1ソース統計値および第2ソース統計値を組み合わせるように構成されており、異なる重みが第1ソース統計値および第2ソース統計値に関連付けられる。任意選択的に、ビデオエンコーダは、符号化プロセス中に重みを変更するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)の表現のために異なるビット数(たとえばBITS、BITS)を使用するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ソース統計値(たとえばa)および第2ソース統計値(たとえばb)のために異なるウィンドウサイズを使用するように構成されており、ビデオエンコーダは、比較的大きいウィンドウサイズを有するソース統計値の表現には比較的大きいビット数を使用し、比較的小さいウィンドウサイズを有するソース統計値の表現には比較的小さいビット数を使用するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって第1ソース統計値aおよび/または第2ソース統計値bの数表現を修正するように構成されており、
Figure 0007451655000076
および/または
Figure 0007451655000077
その後結合ソース統計値を決定し、ここで
Figure 0007451655000078
、そして
ここでBITSaは第1ソース統計値の表現に割り当てられたビット数、BITSbは第2ソース統計値の表現に割り当てられたビット数である。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって結合ソース統計値
Figure 0007451655000079
を決定するように構成されており、
Figure 0007451655000080
そしてビデオエンコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 0007451655000081
ここで、最確(たとえばバイナリ)値の値は以下にしたがって決定され、
Figure 0007451655000082
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から0.5までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、以下にしたがって結合ソース統計値
Figure 0007451655000083
を決定するように構成されており、
Figure 0007451655000084
そしてビデオエンコーダは、以下にしたがって間隔サブディビジョンのあらかじめ計算された範囲値を含む表のテーブルエントリを指定するインデックス値pStateIdxを導出するように構成されており、
Figure 0007451655000085
ここで、BITStabResは、表のエントリ数(または表のエントリ間の、バイナリ値の頻度に関する間隔)を記述する。表は、たとえば、0から1までの範囲内の確率値のあらかじめ計算された範囲値へのマッピングを記載している。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ウィンドウサイズに応じて、および第2ウィンドウサイズに応じて、第1ソース統計値(たとえばa)および第2ソース統計値の表現のビット数(たとえばBITS、BITS)を選択するように構成されている(たとえば、
Figure 0007451655000086
にしたがって、ここで
Figure 0007451655000087
またはn=round(log)、round()は切り上げまたは切り捨て演算子、または
Figure 0007451655000088
にしたがって、ここで
Figure 0007451655000089
またはn=round(log)、ThrHdは所定の好ましい固定値)。
ビデオエンコーダの好適な実施形態では、第1ソース統計値(たとえば、a)および第2ソース統計値(たとえば、b)の表現に使用されるビット総数の合計は、異なるコンテキストモデルにわたって一定である(または第1ソース統計値の表現に使用されるビット数の変形例の場合は独立している)。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、(スライスタイプのように、可能であれば他の構成情報に加えて)第1ウィンドウサイズおよび第2ウィンドウサイズを決定する初期化フラグ(たとえば、「ws_flag」またはウィンドウサイズフラグ)をビットストリームに含めるように構成されており、ビデオエンコーダは、第1ソース統計値および/または第2ソース統計値を決定する他の初期化パラメータまたはフラグ(たとえば、「cabac init flag」)をビットストリームに含めるように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、現在のスライスの時間レベルにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。あるいは、または追加で、ビデオエンコーダは、現在のスライスの量子化パラメータにも応じて、第1ウィンドウサイズおよび第2ウィンドウサイズを決定するように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、位置に応じて第1ウィンドウサイズおよび/または第2ウィンドウサイズを調整するように構成されている(たとえば、いくつのバイナリ値が現在のスライス内で既に符号化されたかに応じて、またはコンテキストの初期化以降、第1ウィンドウサイズおよび/または第2ウィンドウサイズが関連付けられているコンテキストモデルを使用して、または符号化されるバイナリ値が関連付けられているフレーム内のピクセルまたはピクセルのブロックの位置に応じて)。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、開始位置(たとえばピクセルのブロックの最初の行、またはピクセルのブロックの最初の列)に関連付けられたバイナリ値を復号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを開始値(好ましくは通常値よりも小さい)に設定し、少なくとも所定の位置だけ開始位置から離れた位置に関連付けられたバイナリ値を符号化するときに第1ウィンドウサイズおよび/または第2ウィンドウサイズを通常値(好ましくは開始値よりも大きい)に設定するように、構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、スライス内でウィンドウサイズを変更すべきであることを通知する信号フラグ(たとえば「ctu_ws_flag」またはウィンドウサイズ変更信号フラグ)をビットストリームに含めるように構成されている。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、ビットストリームに、複数の符号化ツリーユニット(またはすべての符号化ツリーユニットでもよい)について、ウィンドウサイズを変更すべきかどうかを示す信号フラグを含めるように構成されており、信号フラグは、ウィンドウサイズの少なくとも1つを拡大すべきか縮小すべきかを示す(たとえば、ウィンドウサイズの最大範囲を超えないように気をつけながら、信号フラグに応じて1つだけ、異なるコンテキストモデルであってもすべてのウィンドウサイズをまとめて拡大または縮小する)。代替例として、ビデオエンコーダは、いくつかのコンテキストモデルのウィンドウサイズのみを拡大または縮小してもよい。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、たとえば式(8)または式(12)または式(14)にしたがって、結合ソース統計値(たとえば
Figure 0007451655000090
またはp)から状態インデックス(たとえばpStateIdx)を導出するように構成されている。あるいは、または追加で、ビデオエンコーダは、たとえば式(9)または式(13)にしたがって、最確バイナリ値または最低確率バイナリ値を表す値(たとえばvalMPS)を導出するように構成されてもよい。ビデオエンコーダはまた、間隔サブディビジョンの1つ以上の範囲値に状態インデックスをマッピングするテーブルを評価するように構成されてもよい。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第2ソース統計値を一定の置換値で一時的に(たとえば、初期化の直後のみならず、バイナリシーケンスの複数のバイナリ値の符号化のために)置き換え、結合ソース統計値を取得するために第1ソース統計値(たとえばa)を固定の非ゼロ置換値と組み合わせるように、構成されてもよい。
ビデオエンコーダの好適な実施形態では、ビデオエンコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
=nまたは
|n-n|≧3
ここで、
Figure 0007451655000091
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 0007451655000092
またはn=round(log)である。
好適な実施形態では、ビデオエンコーダは、第1ウィンドウサイズwおよび第2ウィンドウサイズwを以下のように選択するように構成される。
|n-n|≧3
ここで、
Figure 0007451655000093
またはn=round(log)、round()は切り上げまたは切り捨て演算子、
Figure 0007451655000094
またはn=round(log)である。
本発明による一実施形態はビデオエンコーダを作成し、ビデオエンコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するように構成されており、
ビデオエンコーダは、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを符号化するように構成されている。ビデオエンコーダは、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。ビデオエンコーダは、バイナリシーケンスに基づいて、(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するための算術エンコーダを含む(バイナリシーケンスは、スペクトル係数、パラメータ、またはその他いずれかの情報の変換係数を表す)。算術エンコーダは、たとえば、ウィンドウサイズ変数で表され得る、第1ウィンドウサイズ(たとえばw)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、「カウンタ変数」またはカウンタとしても指定され得る、第1ソース統計値(たとえば、a)を決定するように構成されている。算術エンコーダは、たとえば前に符号化されたバイナリシーケンスに基づいて、第1ソース統計値を決定するように構成され得る。算術エンコーダは、結合ソース統計値(たとえば、
Figure 0007451655000095
またはp)を決定するように構成されており、算術エンコーダは、結合ソース統計値を取得するために、第1ソース統計値(たとえば、at)を固定の非ゼロ値と組み合わせるように構成されており、算術エンコーダは、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現にバイナリシーケンスをマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成されている。
実施形態は、任意選択的に、個別におよび組み合わせて、先に記載された実施形態の特徴、機能、および詳細のいずれかによって補足することができる。
本発明による一実施形態は、ビデオコンテンツを復号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するステップを含む。方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロック(または1つのみのブロック)のピクセルに基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するステップを含む。方法は、バイナリシーケンスの符号化表現に基づいて[たとえば、画像コンテンツの変換係数を記述する]復号化バイナリシーケンスを提供するステップを含み、方法は、たとえば、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」としても指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。第1ソース統計値は、たとえば、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第2ウィンドウサイズ(たとえば、w)を使用して、たとえば復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよい、第2ソース統計値(たとえば、b)を決定するステップも含む。第2ソース統計値は、たとえば、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第1ソース統計値(たとえば、a)に基づいて、および第2ソース統計値(たとえば、b)に基づいて、結合ソース統計値(たとえば
Figure 0007451655000096
またはp)を決定するステップも含む。方法はまた、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップも含む。
本発明による一実施形態は、ビデオコンテンツを復号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを復号化するステップを含む。方法は、スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に復号化されたフレーム)の1ブロック(または1つのみのブロック)のピクセルに基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に復号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を評価するステップを含む。方法は、バイナリシーケンスの符号化表現に基づいて(たとえば、画像コンテンツの変換係数を記述する)復号化バイナリシーケンスを提供するステップを含む。方法は、たとえば、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に復号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、「カウンタ変数」、「カウンタ」としても指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。たとえば、第1ソース統計値は、前に復号化されたバイナリシーケンスに基づいて決定され得る。方法は、結合ソース統計値(たとえば、
Figure 0007451655000097
またはp)を決定するステップを含み、第1ソース統計値(たとえばa)は、結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられる。方法は、結合ソース統計値に基づいて、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを、さらに含む。
一実施形態は、ビデオコンテンツを符号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを符号化するステップを含む。方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つのブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。方法は、バイナリシーケンスに基づいて(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するステップを含む(バイナリシーケンスは、変換係数またはスペクトル係数、パラメータ、またはその他いずれかの情報を表し得る)。
方法は、たとえば、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」として指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。第1ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法はまた、第2ウィンドウサイズ(たとえば、w)を使用して、たとえば符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよい、第2ソース統計値(たとえば、b)を決定するステップも含む。第2ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法は、第1ソース統計値(たとえば、a)に基づいて、および第2ソース統計値(たとえば、b)に基づいて、結合ソース統計値(たとえば、
Figure 0007451655000098
またはp)を決定するステップも含む。方法は、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む。
一実施形態は、ビデオコンテンツを符号化する方法を作成し、方法は、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を符号化するステップを含み、方法は、1つ以上のスライスのセット(複数のスライスが好ましい)に細分化されたビデオフレームを符号化するステップを含む。方法は、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モード(たとえば「Intra」)を使用して、または前のフレーム(たとえば前に符号化されたフレーム)の1ブロックのピクセル(たとえば、1つのみのブロックのピクセル)に基づくピクセルのブロックの予測がある、単一予測モード(たとえば「P」)を使用して、または1つ以上の前のフレーム(たとえば前に符号化されたフレーム)の2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モード(たとえば「B」)を使用して、スライスが符号化されたかどうかを示す、スライスタイプ情報(たとえば「SliceType」)を提供するように構成されている。方法は、バイナリシーケンスに基づいて(たとえば、画像コンテンツの変換係数を記述する)バイナリシーケンスの符号化表現を提供するステップを含む(バイナリシーケンスは、変換係数またはスペクトル係数、パラメータ、またはその他いずれかの情報を表し得る)。方法は、ウィンドウサイズ変数で表され得る第1ウィンドウサイズ(たとえば、w)を使用して、たとえば前に符号化されたバイナリ値xt-1,xt-2,...の頻度に基づいてもよく、たとえば「カウンタ変数」または「カウンタ」として指定され得る、第1ソース統計値(たとえば、a)を決定するステップを含む。第1ソース統計値は、たとえば、前に符号化されたバイナリシーケンスに基づいて決定され得る。方法は、結合ソース統計値(たとえば、
Figure 0007451655000099
またはp)を決定するステップを含み、第1ソース統計値(たとえばa)は、結合ソース統計値を取得するために、固定の非ゼロ値と組み合わせられる。方法は、結合ソース統計値に基づいて、バイナリシーケンスをバイナリシーケンスの符号化表現にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するステップを含む。
なお、本明細書に記載されるすべての方法は、個別におよび組み合わせて、対応する装置(たとえばビデオエンコーダおよびビデオデコーダ)に関して記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。また、装置は、方法と並行して適応され得る。言い換えると、装置、または機能ボックの説明は、方法または方法ステップの説明にも対応する。
本発明による別の実施形態は、コンピュータプログラムがコンピュータ上で実行されたときに本明細書に記載される方法の少なくとも1つを実行するための、コンピュータプログラムを作成する。
本発明による一実施形態は、ビデオコンテンツを表す、バイナリシーケンスの符号化表現と、バイナリシーケンスの符号化表現に基づいてビデオコンテンツを再構築するために使用されるビデオデコーダの構成を記述する構成情報とを含む、ビデオビットストリームを作成する。構成情報は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの1つ以上の範囲値を決定するために使用される、第1ソース統計値(たとえば、a)を決定するためにビデオデコーダによって使用されるウィンドウサイズを記述する、ウィンドウサイズ情報(たとえば、「ws_flag」)を含み、1つ以上の範囲値は、バイナリシーケンスの符号化表現を復号化バイナリシーケンスにマッピングするために使用される。構成情報は、前に復号化されたバイナリ値の頻度に基づいており、間隔サブディビジョンの1つ以上の範囲値を決定するために使用される、第2ソース統計値(たとえば、b)を決定するためにビデオデコーダによって使用されるウィンドウサイズを記述する、ウィンドウサイズ情報(たとえば、「ws_flag」)を含む。
ビデオストリームの好適な実施形態では、ビデオビットストリームはまた、第1ソース統計値および/または第2ソース統計値の初期化値を記述する、初期化値情報も含む。
ビデオストリームの好適な実施形態では、ビデオビットストリームは、ウィンドウサイズを(たとえば、スライス内で)増加または減少させるべきであることを示すウィンドウサイズ変更フラグ(たとえば、ctu_ws_flag)をさらに含む。
ビデオストリームは、個別におよび組み合わせて、本明細書に記載される特徴または詳細のいずれかによって補足することができる。
なお、「ウィンドウサイズ」、「第1ウィンドウサイズ」、および「第2ウィンドウサイズ」という用語は、本説明全体を通して使用されることに留意すべきである。しかしながら、ウィンドウサイズの代わりに、実施形態のいずれかにおいて、推定パラメータが任意選択的に使用され得ることに留意すべきである。第1ウィンドウサイズの代わりに、実施形態のいずれかにおいて、第1推定パラメータを任意選択的に使用することができる。第2ウィンドウサイズの代わりに、実施形態のいずれかにおいて、第2推定パラメータを任意選択的に使用することができる。
言い換えると、第1推定パラメータは第1ウィンドウサイズであり得、第2推定パラメータは第2ウィンドウサイズであり得る。
あるいは、第1推定パラメータは、第1ソース統計値が復号化バイナリシーケンス(またはエンコーダの場合、前に符号化されたバイナリ値)の復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第1慣性パラメータであってもよく、第2推定パラメータは代わりに、第2ソース統計値が復号化バイナリシーケンス(またはエンコーダの場合、前に符号化されたバイナリ値)の復号化されたバイナリシンボルの頻度の変更に続く速度を決定する第2慣性パラメータであってもよい。
また、実施形態のいずれかにおいて、ソース統計値の異なる概念を任意選択的に使用することができる。
たとえば、ビデオデコーダは、テーブルルックアップを使用して第1ソース統計値を決定するように構成されてもよく、テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および第1推定パラメータに応じて選択される。あるいは、または追加で、ビデオデコーダは、テーブルルックアップを使用して第2ソース統計値を決定するように構成され、テーブルエントリは、前に決定されたソース統計値、前に復号化されたバイナリ値、および第2推定パラメータに応じて選択される。
類似の概念はビデオエンコーダでも任意選択的に使用することができ、前に符号化されたバイナリ値は、前に復号化されたバイナリ値の役割を取り得る。
本発明による実施形態は、以下の添付図面を参照して、引き続き説明される。
本発明の一実施形態による、ビデオデコーダのブロック概略図である。 本発明の別の実施形態による、ビデオデコーダのブロック概略図である。 本発明の別の実施形態による、ビデオデコーダのブロック概略図である。 本発明の一実施形態による、ビデオエンコーダのブロック概略図である。 〔表1〕は、8ビット変数wspairのビットマスクの表現を示す。 〔表2〕は、wspair値の割り当てのグラフィック表現である。 〔表3〕は、ws_flagに依存するwspair値の割り当てのグラフィック表現である。 本発明の一実施形態による、ビデオ復号化の方法のフローチャートである。 本発明の一実施形態による、ビデオ符号化の方法のフローチャートである。 本発明の一実施形態による、ビットストリームのグラフィック表現である。
1)図1による実施形態
図1は、本発明の一実施形態による、ビデオデコーダ100のブロック概略図を示す。
ビデオデコーダ100は、符号化ビデオ情報を受信し、これに基づいて、復号化ビデオ情報(または復号化ビデオコンテンツ)を提供するように構成されている。
符号化ビデオ情報110(ビデオビットストリームと見なされ得る)は、たとえば、スライスタイプ情報を含み得、バイナリシーケンスの符号化表現も含み得る。任意選択的に、符号化ビデオ情報110は、追加情報を含み得るが、これは本発明には必須ではない。
一般的に言えば、ビデオデコーダは、複数のビデオフレーム(たとえば、ビデオフレームのシーケンス)を復号化するように構成されており、ビデオデコーダは、特に、1つ以上のスライスのセット(好ましくは、複数のスライス)に細分化されたビデオフレームを復号化するように構成されている。ビデオデコーダはまた、スライスタイプ情報を評価するように構成されており、スライスタイプ情報は、符号化ビデオ情報110に含まれてもよく、スライスが、(たとえば、「ビデオ再構築」ブロック180によって実行され得る)スライスの復号化のための動作モードを選択するために、前のフレームのビデオコンテンツに基づく現在のフレームのビデオコンテンツの予測がない、独立した符号化モードを使用して、または前のフレームの1ブロックのピクセルに基づくピクセルのブロックの予測がある、単一予測モードを使用して、または1つ以上の前のフレームの2つ以上のブロックのピクセルに基づくピクセルのブロックの予測がある、両方向予測モードを使用して、符号化されたかどうかを示す。
ビデオデコーダ100は、たとえば、符号化ビデオ情報110に含まれる、バイナリシーケンスの符号化表現に基づいて(「ビデオ再構築」ブロックで使用するための)復号化バイナリシーケンス122を提供するように構成されている、算術デコーダ120を含む。算術デコーダは、好ましくは、第1ソース統計値決定130および第2ソース統計値決定140を含む。したがって、算術デコーダ120は、第1ウィンドウサイズを使用して第1ソース統計値132を決定し、第2ウィンドウサイズを使用して第2ソース統計値142を決定するように構成されている。算術デコーダは、好ましくは、コンバイナ150も含む。したがって、算術デコーダは、第1ソース固定値および第2ソース統計値に基づいて結合ソース統計値152を決定するように構成されている。また、算術デコーダ120は、好ましくは、範囲値決定160を含む。したがって、算術デコーダは、結合ソース統計値152に基づいて、(符号化ビデオ情報110に含まれる)バイナリシーケンスの符号化表現を(ビデオ再構築ブロック180で使用される)復号化バイナリシーケンス122にマッピングするために使用される、間隔サブディビジョンの1つ以上の範囲値を決定するように構成され得る。
好ましくは、算術デコーダ120は、(たとえばブロックまたはユニットであってもよい)算術復号化コア170も含み、これは、範囲値決定160から1つ以上の範囲値162を受信し、符号化ビデオ情報110に含まれる符号化バイナリシーケンスから復号化バイナリシーケンス122を導出するために範囲値を使用する。
また、ビデオデコーダは、たとえば、ビデオ再構築ブロック(またはユニット)180を含んでもよく、これは、復号化バイナリシーケンス122を受信し、復号化バイナリシーケンス122に基づいて(可能であれば、スライスタイプ情報などの、追加の制御情報を考慮して)復号化ビデオコンテンツ112を提供する。
結論として、算術デコーダ100は、復号化バイナリシーケンス122を導出するために、符号化ビデオ情報110を受信し、バイナリシーケンスの符号化表現の算術復号化を実行する。算術復号化は、復号化バイナリシーケンス122のバイナリ値の確率に関する知識を利用する。復号化バイナリシーケンス122内のバイナリ値の確率(または推定確率)に関するこの知識は、間隔サブディビジョンを定義する範囲値162に依存することにより、算術復号化コア170によって考慮される。簡潔に言えば、算術復号化コアは、異なる間隔(たとえば、0と1の間、または整数値の範囲にわたる)を定義するために、範囲値162を使用することができる。算術復号化コアは、たとえば、バイナリシーケンスの符号化表現を、範囲値を使用して定義された間隔のうちの1つにある数の表現として解釈することができる。バイナリシーケンスの符号化表現によって表される数がどの間隔にあるかを認識することによって、算術復号化コア170は、どのビットまたはどのビットシーケンスがバイナリシーケンスの符号化表現を使用して符号化されたかを結論付けることができる。
しかしながら、算術復号化コア170の説明は、非常に簡潔で一般的な説明としか見なされないことに、留意すべきである。算術復号化コアに関する詳細は、たとえば、規格H.264およびH.265で確認することができる。しかしながら、異なる概念(算術復号化コアの動作について)も文献中に見られ、算術復号化コアの詳細は、本発明には特に関連性がない。
しかしながら、(高いビットレート効率を可能にする)適切な範囲値を取得するために、算術デコーダ120(または、一般的に言えば、ビデオデコーダ)は、異なるウィンドウサイズを使用して、2つのソース統計値132、142を決定する(「ウィンドウサイズ」は、復号化バイナリシーケンス122の複数の復号化されたバイナリ値にわたって平滑化の度合いを定義する)。また、算術復号化コア170に提供される範囲値に信頼性を高めるために、第1ソース統計値132および第2ソース統計値142は組み合わせられて結合ソース統計値152になる。
したがって、算術復号化コア170によって使用される範囲値は、ビット値(たとえば、復号化バイナリシーケンス122内のビット値「0」および「1」)の実際の確率によく適応しているので、ビデオデコーダ100は高い効率を提供すると言うことができる。
付言として、ビデオデコーダ100を修正することもできることに留意すべきである。代替実装では、第2ソース統計値決定140は、(復号化バイナリシーケンスから独立していてもよいが、1つ以上のパラメータに依存し得る)固定値の提供に置き換えられることが可能である。この場合、算術デコーダは、結合ソース統計値152を取得するために、第1ソース統計値132を固定の非ゼロ値と組み合わせるように構成されている。このような簡略化は、場合によっては良好な結果をもたらし、たとえば、結合ソース統計値の不適切に大きい変動を回避し得ることが、見いだされている。言い換えると、結合ソース統計値の決定に固定的な寄与を導入することにより、結合ソース統計値がこの固定値からあまり大きく逸脱できなくなることが、達成され得る。したがって、偶然に、復号化バイナリシーケンス122内に同一のビット値のより長いシーケンスがあった場合に、符号化効率の大幅な低下を回避するために、復号化バイナリシーケンスの統計への何らかの「後知恵」が使用され得る。
付言として、算術デコーダ(および算術デコーダの個々のブロック)の機能は一般に、その全体においてビデオデコーダの機能とも見なされ得ることに、留意すべきである。言い換えると、算術デコーダの機能として本明細書に記載される機能は、ビデオデコーダの別のブロックによっても実行され得る。
また、図1によるビデオデコーダ100は、個別におよび組み合わせて、本明細書に記載される特徴、機能、および詳細のいずれかによって補足され得ることに、留意すべきである。
2)図2によるビデオデコーダ
図2は、本発明の一実施形態による、ビデオデコーダ200のブロック概略図を示す。
ビデオデコーダ200は、符号化ビデオ情報210(たとえば、ビデオビットストリーム)を受信し、これに基づいて、復号化ビデオコンテンツ212(たとえば、ビデオフレームのシーケンス)を提供するように構成されている。符号化ビデオ情報210は、たとえば、本明細書に記載されるような、スライスタイプ情報を含み得る。符号化ビデオ情報210は構成情報をさらに含んでもよく、これは制御情報とも見なされ得る。また、符号化ビデオ情報210は、バイナリシーケンスの符号化表現を含み得る。
図2には、ビデオデコーダ200の2つの主要なブロック、すなわち算術デコーダ220およびビデオ再構築280が示されている。しかしながら、ビデオデコーダの機能の分布は固定ブロック構造に拘束されず、広い範囲にわたって修正され得ることに、留意すべきである。また、ビデオデコーダの実際の実装は、当業者にとって周知の、追加のブロックおよび/または機能を有し得ることに、留意すべきである。
算術デコーダ220は、バイナリシーケンスの符号化表現211を受信する。しかしながら、算術デコーダ(または算術デコーダの外部にあってもよい制御ブロック)は、スライスタイプ情報および構成情報(または制御情報)も受信する。特に、算術デコーダ220は、バイナリシーケンスの符号化表現211に基づいて、スライスタイプ情報および構成情報または制御情報の一部またはすべてを考慮して、復号化バイナリシーケンス222をビデオ再構築280に提供する。
以下、算術デコーダ220の機能が、より詳細に記載される。算術復号化は算術復号化コア270を含み、これは、バイナリシーケンスの符号化表現211を受信し、復号化バイナリシーケンス222を提供する。算術復号化コアは、復号化バイナリシーケンス222のどのビット値がバイナリシーケンスの符号化表現211によって表されるかを決定する。この目的のために、算術復号化コア270は、バイナリシーケンスの符号化表現211によって表される数が、数の範囲のどの間隔にあるかをチェックする。バイナリシーケンスの符号化表現211によって表される数が、複数の(または2つの)間隔のうちのどの間隔にあるかの決定に応じて、復号化バイナリシーケンス222の特定のビット値、またはビット値のグループが認識される。
復号化バイナリシーケンス222を導出する目的のために、算術復号化コアは、間隔に関する情報を受信し、これは通常、ビット値の確率にある程度対応する。この場合、算術復号化コア270は、間隔サブディビジョンに使用される「範囲値」262(すなわち、算術復号化コア270によって使用される数範囲の間隔を定義するのに役立つ範囲値162)を受信する。特に、算術復号化コア270は、たとえば、規格H.264によるビデオエンコーダ/デコーダまたは規格H.265によるビデオエンコーダ/デコーダで使用される算術復号化コアと類似または同一であり得ることに留意すべきである。しかしながら、算術復号化コア270を実現するための異なるアプローチもまた使用され得ることに、留意すべきである。
上記の議論を考慮して、算術復号化コア270の間隔サブディビジョンを定義する範囲値262を提供することは、算術デコーダ220の重要な機能であることが明らかとなる。一般的に言えば、算術デコーダ220は、たとえば初期化値、「ウィンドウサイズ」、「ウィンドウサイズ適応」などのパラメータを定義する何らかの制御情報を考慮して、復号化バイナリシーケンス222の前に復号化されたバイナリ値からこれらの範囲値262を導出する。
算術デコーダ200では、2つのソース統計値決定ブロック(またはユニット)230、240が使用される。たとえば、第1ソース統計値決定ブロック230は、復号化バイナリシーケンス222の1つ以上の前に復号化されたバイナリ値(やはりxで指定される)を受信し、これに基づいて、第1ソース統計値232を提供する。第1ソース統計値決定ブロックは、たとえば、ソース統計値232を表すために使用されるビット数を定義する定数または変数BITS、およびソース統計値決定ブロック230によって使用される「ウィンドウサイズ」を定義する定数または変数nなど、何らかの制御情報を受信し得る。たとえば、第1ソース統計値決定ブロック230は、第1ソース統計値232を再帰的に決定でき、ウィンドウサイズnは、第1ソース統計値232の決定において復号化バイナリシーケンス222の最後に復号化されたバイナリ値の重み付けを決定する。
第1ソース統計値決定ブロック230の機能は、たとえば、何らかの「無限インパルス応答」特性を導入する再帰的アルゴリズムが使用されるという事実を除いて、特定のウィンドウサイズを有するスライディング平均の形成に類似している。このため、第1ソース統計値132は、スライディングウィンドウ加算演算またはスライディングウィンドウ平均演算の結果を正確に表すものではなく、結果が非常に似ているため、むしろ「仮想スライディングウィンドウ」演算と見なされるべきである。
また、第2ソース固定値決定ブロック240は、第1ソース統計値決定ブロック230と比較すると、類似の動作を実行する。しかしながら、第2ソース統計値決定ブロック240は、通常、異なるパラメータ(たとえば、異なるウィンドウ長nおよび/または異なるビット数パラメータBITS)を使用し、その結果、通常は第1ソース統計値232と異なる第2ソース統計値242を提供する。たとえば、ソース統計値232、242の1つは短期(またはより短期の)平均ソース統計値であってもよく、ソース統計値232、242の1つは長期(またはより長期の)平均ソース統計値であってもよい。
なお、ソース統計値決定ブロック230、240は、たとえば、以下で詳細に論じられる式(3)および(4)によって定義されるような機能を実行し得ることに留意すべきである。あるいは、ソース統計値決定ブロック230、240はまた、以下で論じられる式(5)によって定義されるような機能を実行し得る。また、いくつかの実施形態では、ソース統計値決定ブロック230、240においても異なる計算規則が使用され得ることに留意すべきである。
算術デコーダ220は、結合ソース統計値決定ブロック(またはユニット)250をさらに含み、これは第1ソース統計値232および第2ソース統計値242を受信するように構成されている。ソース統計値組み合わせブロック250は、これに基づいて結合ソース統計値252を提供する。たとえば、ソース統計値組み合わせブロック250は、それによって結合ソース統計値252を取得するために、第1ソース統計値232および第2ソース統計値242の合計または平均を形成し得る。
しかしながら、ソース統計値組み合わせブロック250はまた、結合ソース統計値252を導出するときに、第1ソース統計値232および第2ソース統計値242に異なる重み付けを適用することもでき、異なる重み付けは、スライス内で、または異なるスライス間でさえ変化し得る。
たとえば、ソース統計値組み合わせブロック250は、下記の式(6)によって定義されるか、または下記の式(10)および(11)によって定義されるか、または下記の式(16)によって定義されるような機能を実行し得る。しかしながら、この機能の変形例もまた可能である。
たとえば、1つの(代替)実施形態では、ソース統計値組み合わせブロック250は、それによって結合ソース統計値252を取得するために、第1統計値の1つのみを固定値と組み合わせる。このような概念は、結合ソース統計値252が復号化バイナリシーケンス222内のバイナリ値の予想される確率から大きく逸脱しすぎることを回避するために、有利であり得る。
算術デコーダ220は、結合ソース統計値252に基づいて、(算術復号化コア270に提供される)間隔サブディビジョンの範囲値262を導出するように構成されている。この処理ステップは、たとえば、「範囲値決定」と見なされ得る。たとえば、範囲値決定は、任意選択的な値処理266を含んでもよく、これは、結合ソース統計値252を受信し、これに基づいて、確率値または状態インデックス値を提供する。値処理266は、たとえば、結合ソース統計値252の値の範囲を、0から1の間の範囲に、または0から0.5の間の範囲に、または整数インデックス値にマッピングし得る。たとえば、値処理266は、下記の式(7)にしたがって、または下記の式(8)、(9)にしたがって、または下記の式(12)、(13)にしたがって、または下記の式(14)にしたがって実行され得る。
任意選択的に、値処理266は情報267を提供してもよく、これは、次に復号化される値(たとえば、復号化バイナリシーケンス222の)が「1」の値を取る可能性が高いか値「0」を取る可能性が高いかを示すバイナリ情報であってもよい。任意選択的に、算術デコーダ(または範囲値決定)は、マッピングテーブル269を含み得る。マッピングテーブル269は、たとえば、テーブルエントリを指定するインデックス値(たとえば、pStateIdx)を受信し得る。したがって、マッピングテーブル269は、インデックス値(たとえば、pStateIdx)によって指定された前記テーブルエントリに対応する1つ以上の範囲値262を提供し得る。したがって、「状態インデックス値」(たとえばpStateIdx)を導出し、状態インデックス値に基づいてマッピングテーブルを評価することにより、結合ソース固定値252に基づいて、間隔サブディビジョンの1つ以上の範囲値が提供され得る。
マッピングテーブル269は、たとえば、規格H.264または規格H.265に記載されているマッピングテーブルと同じ構造を有してもよい。しかしながら、マッピングテーブルの内容は、ビデオデコーダの特定の詳細に適応し得る。特に、マッピングテーブルのエントリは、特定のビデオデコーダで予想される統計的性質に適応することができる。
算術デコーダ(または一般的に言えば、ビデオデコーダ)はまた、制御情報または構成情報を受信し得、それに基づいて範囲値の提供に使用されるパラメータ(および可能であれば他のパラメータも、たとえば算術復号化コア270によって使用される追加のパラメータ)を調整し得る、制御ブロック290も含む。たとえば、制御ブロック290は、符号化ビデオ情報210に含まれ得る、スライスタイプ情報、「cabac init flag」、「ws_flag」、および「ctu_ws_flag」のうちの1つ以上を受信し得る。
また、制御290は、たとえば、制御情報に応じて、ウィンドウサイズパラメータn、nおよびビットサイズパラメータBITSa、BITSbを調整し得る。特に、制御ブロック290は、現在のコンテキストモデルも考慮し得る。この問題に関して、復号化される復号化バイナリシーケンス222のビット(またはビットのグループ)ごとに、どのコンテキストモデルが使用されるかが決定され得ることに留意すべきである。たとえば、どのコンテキストモデルが使用されるかの決定は、どのタイプの情報(復号化パラメータ、変換係数など)がそれぞれのビット(またはビットのグループ)によって表されるかという事実に基づき得る。たとえば、制御ブロック290は、それによってどの構文要素(または構文要素のどの部分、たとえば最上位ビットか最下位ビットか、など)が次に復号化されるかを認識するために、復号化バイナリシーケンス222のシンタックスを認識するように構成されてもよい。したがって、異なるコンテキストモデル間の選択がなされ得る。また、ウィンドウサイズパラメータおよび/またはビットサイズパラメータおよび/またはその他のパラメータが、コンテキストモデルに応じて選択され得ることに留意すべきである。さらに、異なるソース統計値または結合ソース統計値が異なるコンテキストモデルで利用可能となり得るように、ソース統計値232、242または結合ソース統計値252が特定のコンテキストモデルに関連付けられ得ることにも留意すべきである。たとえば、特定のコンテキストモデルに関連付けられたソース統計値は、それぞれのコンテキストモデルを使用して復号化された復号化バイナリシーケンス222の復号化されたバイナリ値に基づいて、選択的に提供され得る。言い換えると、パラメータn、n、BITS、BITSなどに関する別個の独立した処理、および別個の(おそらく独立した)決定が、異なるコンテキストモデルについて行われ得る。
制御ユニット290の機能に関して制御ユニットは、たとえば、下記のメカニズムに従って、パラメータn、n、BITS、BITSを決定し得ることに、留意すべきである。たとえば、ウィンドウサイズパラメータn、nは、スライスタイプ情報に応じて、および/またはcabac init flagに応じて、および/またはws_flagに応じて、および/またはctu_ws_flagに応じて、選択され得る。また、ビットサイズパラメータBITSa、BITSbは、いくつかの実施形態では、何らかの構成情報に応じて選択される。しかしながら、他の実施形態では、ビットサイズパラメータは固定されていてもよい。パラメータの調整に関しては、たとえば、以下の議論を参照されたい。
ここでビデオ再構築ブロック280を参照すると、ビデオ再構築ブロック280は通常、復号化バイナリシーケンス222、および構成情報の少なくともいくつかの要素も受信する。たとえば、ビデオ再構築280は、復号化バイナリシーケンス222に基づいて、整数パラメータおよび/または浮動小数点パラメータおよび/または画像データを再構築してもよい。たとえば、復号化バイナリシーケンスの特定のビットまたは部分がどのようにして整数パラメータまたは浮動小数点パラメータまたは画像データ(たとえば、変換係数など)にマッピングされるべきかを定義するマッピング規則があってもよい。したがって、ビデオ再構築ブロック280は、復号化バイナリシーケンス222からビデオフレームを再構築するために使用される情報を再構築する。次いで、ビデオ再構築ブロックは、再構築された情報(復号化バイナリシーケンス222から導出された)に基づいて、画像情報を生成し得る。
たとえば、ビデオ再構築280は、規格H.264または規格H.265に記載されているのと同じ機能を含んでもよい。しかしながら、復号化バイナリシーケンス(および、可能であれば、追加の構成情報または制御情報)に基づいて復号化ビデオコンテンツを提供するように適応された他のアプローチも、ビデオ再構築に使用され得る。したがって、ビデオ再構築280は、ビデオフレームのシーケンスの形態を取り得る、復号化ビデオコンテンツ212を提供する。
結論として、本発明の一実施形態によるビデオデコーダの概要が提供された。しかしながら、機能ブロック(たとえば、ソース統計値決定ブロック230、240、ソース統計値組み合わせブロック250、値処理ブロック266、マッピングテーブル269、および算術復号化コア270のための異なる実装があることに、留意すべきである。また、ビデオ再構築ブロック280および制御ブロック290には異なる実装が可能である。
しかしながら、本明細書に記載された機能ブロックは、その全体が本出願において開示された特徴、機能、および詳細のいずれかによって補足され得ることにも留意すべきである。また、本出願において開示された特徴、機能、および詳細は、それによってビデオデコーダ200の機能を拡張するために、個別にまたは組み合わせて導入され得ることに、留意すべきである。
3)図3によるビデオエンコーダ
図3は、本発明の一実施形態による、ビデオエンコーダ300のブロック概略図を示す。ビデオエンコーダ300は、ビデオコンテンツ310を受信し、これに基づいて、符号化ビデオ情報(たとえば、ビデオビットストリーム)312を提供するように構成されている。
ビデオエンコーダ300は、ビデオバイナリシーケンス提供ブロック380を含み、これは、ビデオコンテンツ310に基づいてビデオコンテンツ310を表すバイナリシーケンス322を提供するために、ビデオコンテンツ310を受信するように構成されている。たとえば、ビデオバイナリシーケンス提供380は、規格H.264によるビデオエンコーダのように、または規格H.265によるビデオエンコーダのように、実行され得る。しかしながら、ビデオバイナリシーケンスの提供のための異なるアプローチもまた使用され得る。また、ビデオバイナリシーケンス提供380は、たとえば、バイナリ値のシーケンスへの整数値または浮動小数点パラメータまたは画像データ(たとえば、変換係数など)のマッピングも含み得ることに、留意すべきである。
さらに、算術エンコーダ320は、バイナリシーケンス322を受信し、これに基づいて、バイナリシーケンス322の符号化表現311を提供し得る。一般的に言えば、算術エンコーダ320は、バイナリシーケンス322の効率的に圧縮された表現(すなわち、バイナリシーケンスの符号化表現311)を提供するために、バイナリシーケンス322内のバイナリ値の確率に関する知識(または情報)を利用するように構成されている。
算術エンコーダ320は、たとえば、算術符号化コア370を含んでもよく、これは、バイナリシーケンス322を受信し、これに基づいて、バイナリシーケンスの符号化表現311を提供する。算術符号化コア370は、たとえば、ビットまたはビットのグループを表す適切な符号語(符号化表現311に含まれる)を見つけられるようにするために、バイナリシーケンス322内のビット(またはビットのグループ)の確率に関する何らかの情報を必要とし得る。好ましくは、算術符号化コア370は、間隔のサブディビジョンを記述する範囲値362を受信する。範囲値362は、ビデオデコーダ200によって(またはその算術復号化コア270によって)使用される間隔のサブディビジョンを記述してもよく、算術符号化コア370は対応するビデオデコーダによって復号化可能なバイナリシーケンスの符号化表現311を提供するので、この情報は当然ながら算術符号化コア370にとっても有用であり得る。
このため、算術エンコーダ320は、ビデオコンテンツを表すバイナリシーケンス322に基づいて、およびウィンドウサイズ情報n、nまたはビットサイズ情報BITS、BITSなどのいくつかのパラメータに基づいて、間隔サブディビジョンの範囲値362を導出するように構成され得る。なお、範囲値362の導出は、復号化バイナリシーケンス222の代わりにバイナリシーケンス322が評価されるという事実を除いて、範囲値162、262の導出と実質的に同一であることに留意すべきである。言い換えると、バイナリシーケンス322に基づいて範囲値362を導出するときに、前に復号化されたバイナリ値の代わりに前に符号化されたバイナリ値が使用される。
見てわかるように、ビデオエンコーダの算術エンコーダ320はソース統計値決定ブロック330、340を含み、これらは、(前に復号化されたバイナリ値に基づくのではなく)前に符号化されたバイナリ値に基づいて第1ソース統計値332および第2ソース統計値342を提供するという事実を除いて、ソース統計値決定ブロック130、140、230、240と実質的に同じである。ソース統計値決定子330、340は、たとえば、パラメータn、n、BITS、およびBITSを使用し得る。また、ソース統計決定子330、340の機能は、たとえば、下記の式(3)および(4)によって、または下記の式(5)によって定義され得る。
また、算術エンコーダ320はソース統計値組み合わせブロック350も含み、これはソース統計値組み合わせブロック150またはソース統計値組み合わせブロック250に対応し得る。したがって、結合ソース統計値352が提供され、ソース統計値組み合わせブロック350の機能は、たとえば、式(6)または式(10)および(11)または式(16)に従い得る。
算術エンコーダ320は任意選択的な値処理366も含み、これは、図2に示される値処理266に対応し得る。値処理366は、結合ソース統計値352を受信し得、たとえば、最確バイナリ値に関する情報367および/または確率情報または状態インデックス情報368を提供し得る。算術エンコーダ320はマッピングテーブル369も含み、これは、図2を参照して記載されたマッピングテーブル269に対応し得る。したがって、間隔サブディビジョンの1つ以上の範囲値362は、状態インデックス368の確率値を使用するマッピングテーブル369の評価によって提供され得る。
結論として、算術エンコーダ320は、算術デコーダ220が復号化バイナリシーケンス222に基づいて範囲値262を選択するのと同じ方法で、バイナリシーケンス322に基づいて範囲値362を選択し得る。したがって、復号化エラーがなく、ビデオエンコーダ側およびビデオデコーダ側で同じパラメータが使用されるという条件で、ビデオエンコーダ300の算術エンコーダ320とビデオデコーダ200の算術デコーダ220との間の同期性が実現され得る。
また、算術エンコーダ320、または一般的に言えば、ビデオエンコーダ300は制御ブロック390を含み、これは、パラメータn、n、BITS、BITS、および必要であり得るその他いずれかのパラメータを決定し得ることに、留意すべきである。たとえば、制御ブロック390は、パラメータについて決定するために、いくつかの経験的メカニズムを使用し得る。あるいは(または追加で)、制御ブロック390はまた、どのパラメータの組み合わせが可能な限り最も低いビットレートをもたらすか(またはその他いずれかの最適な基準を満たすか)を分析し得る。
また、ビデオエンコーダ300は、たとえば、符号化ビデオ情報312内で、ビデオデコーダ200の動作を制御する何らかの制御情報を提供し得ることに留意すべきである。たとえば、この制御情報(または構成情報)は、以下のうちの1つ以上を含み得る:スライスタイプ情報、cabac init flag、ws_flag、およびctu_ws_flag。これらの構成情報項目の機能、ならびにその可能な符号化および復号化が、以下に記載される。スライスタイプ情報は、(たとえば、ビデオバイナリシーケンス提供380によって)規格H.264またはH.265にしたがってビデオエンコーダと同様に提供されてもよく、規格H.264またはH.265にしたがってビデオデコーダと同様にビデオ再構築180、280によって使用されてもよい。加えて、スライスタイプ情報は、本明細書で概説されるように、ウィンドウサイズに関する決定で使用され得る。
また、機能ブロックの分布が修正され得ることに留意すべきである。図3の実施形態では、算術符号化コア370、ソース統計値決定子ブロック330、340、ソース統計値組み合わせブロック350、値処理ブロック366およびマッピングテーブル369および制御390は、算術エンコーダの一部として記載されてきた。しかしながら、前記ブロックはまた、一般に、ビデオエンコーダのブロック(または機能)でもあり得る。
また、図3を参照して記載された機能ブロックのいずれも、その全体が本出願に記載された特徴、機能、および詳細のいずれかによって補足され得ることに留意すべきである。
4)さらなる実施形態および詳細
以下では、個別にまたは組み合わせて、本明細書で開示される実施形態のいずれかに、個別にまたは組み合わせて導入され得るさらなる実施形態および詳細が記載される。本明細書に記載される詳細は、たとえば、個別におよび組み合わせて、図1、図2、および図3を参照して記載された実施形態に導入され得る。
特に、このセクションで開示される特徴、機能、または詳細のうちの1つの使用は通常、2つ以上の特徴、機能、または詳細を使用した方がさらによい実施形態を作成し得るとしても、既に改善をもたらしていることに留意すべきである。
一般的に言えば、本発明の態様または実施形態は、バイナリ算術符号化の確率推定方法(または確率推定概念)を作成する。
序論
以下に序論が提供される。
コンテキストモデル更新は、コーダの内部状態を基礎となるソース統計に適応させる可能性を提供することによる、効率的なバイナリ算術エントロピーコーダの重要な特徴である。たとえば、各コンテキストモデルは、このコンテキストモデルに割り当てられた次のバイナリシンボル(bin)を復号化または符号化する確率を提供する、独立した確率推定段を備えている。
従来のビデオコーデックH.265/HEVCの確率段実装は有限状態マシン((0,0.5]の範囲に64の確率状態がある)に基づいているが、この文献に記載される推定器は、binの割り当てられたシーケンスのソース統計を追跡する2つのカウンタ変数に基づいている。
各カウンタ(たとえば、ソース統計値決定子130、140、230、240、330、340を実装し得る)は、過去のバイナリシンボルの数(たとえば、ソース統計値が決定されたコンテキストモデルを使用して符号化または復号化された、前に符号化された、または前に復号化されたバイナリ値)がカウント(または一般的に言えば、ソース統計値の値)にどの程度影響するかを決定する、
Figure 0007451655000100
を備えている。更新は、たとえば、いわゆる仮想スライディングウィンドウアプローチによって導出される。
Figure 0007451655000101
を有するbin(またはバイナリ値)が復号化または符号化された後、
Figure 0007451655000102
(ソース統計値と見なされ得る)の更新は、以下に記載されるように実施され得る。
Figure 0007451655000103
式(1)の更新が浮動小数点演算を使用している場合、カウントは常に、すべてのbinシーケンスで
Figure 0007451655000104
の範囲内になる。確率推定器の
Figure 0007451655000105
は、以下のように定義される。
Figure 0007451655000106
算術符号化エンジンに応じて、確率推定器の出力は、直接(たとえば、算術符号化/復号化コアの範囲値を決定するために)使用されてもよく、または量子化された確率値のセットの最も近い確率に(または算術符号化/復号化コアの1つ以上の範囲値に)値をマッピングするなどのさらなる処理を必要としてもよい。
実装の詳細
以下に、いくつかの実装の詳細が記載される。
(たとえば、ソース統計値決定ブロックの)実装は、定義された精度
Figure 0007451655000107
での整数演算の使用を必要とする(または優先する)可能性が高い。したがって、式(1)の実装の代わりに、たとえば式(3)および(5)による、または式(5)による整数の実装が使用され得る。
さらに、可能なウィンドウサイズのセットは、算術演算の簡略化を可能にするために、
Figure 0007451655000108
によって導出され得る値に限定される必要があるだろう。
この場合(
Figure 0007451655000109
に等しくないときも)、
Figure 0007451655000110
の更新は、以下のように計算される(式(1)と同等)。
Figure 0007451655000111
この更新規則では、カウントが有効な範囲
Figure 0007451655000112
内にとどまることを保証するクリッピング操作が実行される必要がある。(4)
Figure 0007451655000113
値nは適切に(たとえば丸めによって)選択され得る。また、xは、前に符号化されたバイナリ値(たとえば、値0または1を有する)または前に復号化されたバイナリ値を表し得ることに留意すべきである。
代替例として、式(3)および(4)は、バイナリシンボルの値を区別する更新計算に置き換えられてもよい。
Figure 0007451655000114
(式(5)の2行に示されるような)異なるシンボル値に異なる更新規則を使用することで、式4のクリッピング操作を廃止する。
なお、式(3)および(4)または式(5)で仮想スライディングウィンドウアプローチを実装する2つの方法では、右シフト演算のため、同一のビットストリームを導出しないことに留意されたい。
また、式(3)および(4)による、または式(5)による演算は、本明細書に記載されるソース統計値決定子によって実行され得ることに留意すべきである。しかしながら、いくつかの実施形態では、ソース統計値決定子は異なる機能(たとえば式(1)による)も実行し得る。
確率推定器の出力(たとえば、結合ソース統計値)は、式(4)または式(5)のいずれかからの更新方法(またはその他の方法)から生じるカウンタ(たとえば、ソース統計値)を重み付けすることによって、計算される。
Figure 0007451655000115
(結合ソース統計値と見なされ得る)式(6)からの重み付け結果
Figure 0007451655000116
は、(たとえば、値処理によって)確率
Figure 0007451655000117
を導出するために、(任意選択的に)使用され得る。
Figure 0007451655000118
または算術符号化エンジンの設計に依存するアドレスインデックス(たとえばpStateIdx)。
カウンタベースの確率推定器は、たとえば、範囲(0,1)内のバイナリシーケンスの値
Figure 0007451655000119
で次のシンボルの確率を提供し得る。値
Figure 0007451655000120
を有する次のシンボルの確率推定が必要とされる場合、出力が変換される必要がある:
Figure 0007451655000121
しかしながら、確率値p(またはp(0)またはP(1))の計算は、すべての実施形態で必要とされるわけではないことに留意すべきである。
カウンタベースの確率推定器とは異なり、H.265/HEVCの有限状態マシンの確率推定は、2つの変数の組み合わせを使用して実行される。第1の変数
Figure 0007451655000122
は、範囲(0,0.5]内の最低確率シンボル(LPS)の確率を表す状態インデックスを格納する。第2の変数
Figure 0007451655000123
は、最確シンボル(MPS)の値を包含する。同様に、バイナリ算術コーダの間隔サブディビジョンのあらかじめ計算された範囲値を有する表は、範囲(0,0.5]のみをカバーする。
このため、たとえば従来のマッピングテーブル、または従来の構造(H.264またはH.265のビデオエンコーダまたはデコーダなど)を有するマッピングテーブルが使用される場合には、(従来の)有限状態マシンがカウンタベースの確率推定器に置き換えられる場合にマッピングを使用することが推奨できる[3]。言い換えると、結合ソース統計値が本明細書に記載されるように決定される場合(たとえば、式(3)から(6)を使用して、または以下で延べられる類似の式を使用して)、(たとえば、任意選択的な値処理において)マッピングテーブルのインデックス値(たとえばpStateIdx)に結合ソース統計値をマッピングすることが推奨できる(しかし必須ではない)。これにより、従来のマッピングテーブルを使用することができる。一方、マッピングテーブル(間隔サブディビジョンの範囲値を提供する)は適切に適応され、このようなマッピングは必要ない場合がある。
状態インデックス
Figure 0007451655000124
値への(たとえば、結合ソース統計値の)式(6)からの結果
Figure 0007451655000125
のマッピングは、たとえば、以下によって計算され得る(これはたとえば、マッピングテーブルの分解能までの量子化を含み得る)。
Figure 0007451655000126
ここで、
Figure 0007451655000127
はあらかじめ計算された値を含むテーブルのLPS確率状態を表すために使用されるビット数を定義し、
Figure 0007451655000128
は以下によって導出される。
Figure 0007451655000129
式(8)および(9)からの(または式(8)および(9)を使用した)カウンタベースの確率推定器の結果の、LPS状態インデックスの表現への(たとえば、低確率状態の状態インデックスまたは最低確率状態の状態インデックスの表現、たとえばpStateIdx)へのマッピング、およびMPSの値(たとえば、高確率バイナリ値の値、たとえばvalMPS)の代わりに、算術符号化エンジンは2つのオプションによって交互に修正され得る。
(たとえば、結合ソース統計値を使用して、または確率値p(またはp(0)またはp(1))を使用して、マッピングテーブルのテーブルエントリが直接選択され得るように)全体の確率間隔(0,1)をカバーするために間隔サブディビジョンのあらかじめ計算された範囲値を包含するテーブルが拡張され得るか、もしくはテーブルが省略され、算術を使用して(たとえば、結合ソース統計値に基づいて、または確率値ptまたはp(0)またはp(1)に基づいて)範囲値がオンザフライで計算される。
言い換えると、結合ソース統計値に基づいて算術復号化コアの間隔のサブディビジョンの範囲値を導出するための、多くの異なる方法がある。従来のマッピングテーブルが使用される場合は、式(8)および(9)による計算が推奨される。あるいは、修正されたマッピングテーブルが使用される場合、または範囲値が何らかの計算規則を使用して結合ソース統計値から導出される場合には、式(8)および(9)による計算は省略され得る。
発明の態様-カウンタ変数の可変分解能
以下では、本発明によるいずれの実施形態でも任意選択的に使用され得る、本発明の一態様が記載される。
カウンタベースの確率推定器の従来の整数実装は、カウンタの精度
Figure 0007451655000130
を表すために同じビット数を使用する。
メモリ消費と符号化効率とのトレードオフを最適化するために、
Figure 0007451655000131
変数は、ウィンドウサイズに応じてサイズ決定され得ること(または現在使用されているウィンドウサイズに応じて動的に適応され得ること)がわかっている。
したがって、カウンタ変数(たとえば、ソース統計値)は、たとえば、式(6)からの重み付け演算(たとえば、ソース統計値結合)が適用される前に修正されてもよい。
Figure 0007451655000132
ここで、
Figure 0007451655000133
Figure 0007451655000134
を使用すると、重み付け演算(たとえば、ソース統計値結合)は、以下の表に修正される。
Figure 0007451655000135
式(8)および(9)からの状態インデックス
Figure 0007451655000136
値への結果
Figure 0007451655000137
のマッピング(任意選択的な値処理によって実行され得る)は、以下のように修正されてもよく、
Figure 0007451655000138
Figure 0007451655000139
は以下によって導出される。
Figure 0007451655000140
全体の確率間隔(0,1)をカバーするために間隔サブディビジョンのあらかじめ計算された範囲値を包含するテーブルが拡張される場合、状態インデックスは、(たとえば、式(12)および(13)の計算の代わりに)以下のように導出され得る(たとえば、任意選択的な値処理によって)。
Figure 0007451655000141
発明の態様:スライスタイプ、cabac init flag、およびコンテキストモデル依存のウィンドウサイズ
以下では、ウィンドウサイズの調整の可能性が記載されるが、これは本発明の実施形態のいずれかにおいて任意選択的に使用され得る。
式(1)、(3)、および(5)のカウンタ変数
Figure 0007451655000142
の更新はすべて、確率推定器の(たとえばソース統計値決定子の)出力に影響を及ぼす過去のbinの数を制御するために、
Figure 0007451655000143
(たとえばwまたはw)、または
Figure 0007451655000144
として定義される
Figure 0007451655000145
(たとえばnまたはn)を包含する。
以前の刊行物[1]では、ウィンドウサイズは、ビデオコーデックのその他いずれのパラメータとも無関係に、すべてのコンテキストモデルで同じ2つの値、たとえば
Figure 0007451655000146
に設定されていた。
本発明の一態様によれば、各コンテキストモデルのウィンドウサイズペアは、コンテキストモデル、cabac init flag、およびスライスタイプに応じて、包括的に、範囲[1,11]内で
のカスタム値(たとえば、nおよび/またはn)に設定される。
cabac init flagは、H.265/HEVCの一部であり、「cabac_init_flag」と呼ばれる[2]。
3つのスライスタイプが定義されており、これらは通常、B、P、またはIntra予測スライスと呼ばれる。たとえば、初期確率状態を導出するために使用される、[2]の「initValue」と同じ方法で、(たとえば事前定義されたテーブル内の)各コンテキストモデルのスライスタイプおよび「cabac_init_flag」のすべての組み合わせに対して、1対の
(たとえば、wおよびwまたはnおよびnを定義する)が定義される。
整数演算を使用する実装では、1つのコンテキストモデルのウィンドウサイズ値(たとえば、nおよびn)は、たとえば8ビット変数として読み取り専用メモリに格納されてもよく、
の結果的な構造は、表1に示されている。
なお、表1に示されるような
の構造は、ソフトウェア実装の寛大なレイアウトの一例であり、メモリ要件は重要ではないことに留意されたい。
を格納するために使用されるビット数は、必要とされるより多くの組み合わせを格納することができる。
(制御ブロックによって実行され得る)1つのコンテキストモデルの正確な
の導出プロセスの一例は、表2に示されている。
たとえば、wspair0、wspair1、およびwspair2によって指定された、3つの事前定義された値wspairがあることがわかる。
「Slice Type」情報に基づいて、およびいわゆる「cabac init flag」に基づいて、これらの事前定義された値wspairの1つが(たとえば制御ブロックによって)選択される(これは任意選択的に、ビデオエンコーダまたはビデオデコーダのソース統計値および/またはその他の変数の初期化値も決定し得る)。たとえば、スライスタイプが両方向予測(「B」)である場合、「cabac init flag」は、nおよびn(またはwおよびw)を決定するために2つの事前定義された値wspair0およびwspair1のうちのどちらが実際に使用されるかを決定し得る。同様に、スライスタイプが単一予測(「P」)である場合、「cabac init flag」は、nおよびn(またはwおよびw)を決定するために2つの事前定義された値wspair0およびwspair1のうちのどちらが実際に使用されるかを決定し得る(両方向予測スライスタイプの場合と比較して、cabac init flagの値と事前定義された値wspair0およびwspair1との間で逆の割り当てが使用され得る。独立した符号化モード(「Intra」)を使用してスライスが符号化される場合、cabac init flagはアクティブであり、事前定義された値wspair2が常に使用され得る。
なお、表2はコンテキストモデルのみを表し、異なるコンテキストモデルには異なるテーブルが利用可能であることに、留意すべきである(たとえば、範囲値決定のプロセス全体が、異なるコンテキストモデルに対して独立して機能し得る)。
コンテキストモデルは、最初のbinを復号化または符号化する前に、意図されるウィンドウサイズで初期化されるべきである。初期化プロセスは、各コンテキストモデルの初期確率状態/カウントが設定されるのと同時に実行される。
実施形態
以下に、実施形態およびさらなる態様が記載される。このセクションで言及される実施形態は、個別に使用することができ、任意選択的に、本明細書に記載される特徴、機能、および詳細のいずれかによって補足され得る。
また、本明細書に開示されるすべてのビデオデコーダおよびビデオエンコーダは、任意選択的に、個別にまたは組み合わせて、以下に記載される特徴、機能、および詳細のいずれかによって補足され得ることに、留意すべきである。また、明細書に記載されるビデオデコーダおよびビデオエンコーダの特徴は、任意選択的に、以下に記載される特徴、機能、および詳細のいずれかに置き換えることができる。
(a)本発明の好適な実施形態では、各コンテキストモデルは2つの
を備えている。スライス(たとえば、ビデオフレームの一部の)の初期化中、
は、たとえば表2で概説されたように、たとえば、現在のスライスタイプおよびcabac init flagの値に応じた特定の値に設定され、カウンタの分解能変数(またはソース統計値の分解能変数)は、たとえば、同じ値
に設定される(任意選択)。このコンテキストモデルに割り当てられたbin(たとえば、バイナリ値)を符号化または復号化するために、カウントは、たとえば式(11)のように重み付けされ、たとえば式(12)および(13)によって定義されるように、状態インデックスを導出するために使用される。bin(たとえばバイナリ値)が符号化または復号化された後、カウンタ変数(またはソース統計値)は、各カウンタについて(または各ソース統計値について)指定されたカスタムウィンドウサイズ(たとえば、nおよびnで定義される)を使用する式(5)で指定されるように、更新される。
(b)本発明の別の好適な実施形態では、確率推定方法(または概念)は、実施形態(a)と同一に構成されるが、カウンタ変数(またはソース統計値)の更新は、式(3)および(4)を使用して実行される。
(c)本発明の別の好適な実施形態では、確率推定方法(または概念)は、実施形態(a)と同一に構成されるが、状態インデックスを導出するために式(14)が使用される。状態インデックスは、全体の確率間隔(0,1)をカバーするあらかじめ計算された範囲値でテーブル(たとえば、範囲値を提供するためのマッピングテーブル)をアドレス指定する。
(d)本発明の別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)で指定された通りに構成されるが、コンテキストモデルの個々のカウンタ(またはそれぞれのコンテキストモデルの2つのソース統計値)は、式(11)のように均等に重み付けされない。代わりに、重み付け演算は、個々のカウンタの重み
を含み、
たとえば、
。この実施形態では、式(11)の演算は、式(16)または代替整数重み付け実装に置き換えられる。
(e)本発明の別の好適な実施形態では、確率推定方法(たとえば、ソース統計値決定ブロック)は、実施形態(d)のように構成されるが、個々のカウンタの(たとえば、2つのソース統計値の)重み付けは、符号化または復号化プロセス中に変更される。
(f)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(a)と同一に構成されるが、利用可能なウィンドウサイズのセットは、
を格納するために使用されるメモリ要件を減らすために、より小さいサブセットに限定される(たとえば、制御ブロックを適応させることによる)。ここで、
より小さくなくてはならず、これは、許容範囲[1,11]では、66の有効な組み合わせをもたらす。その結果、
によって使用されるビット数は、表1で概説されたように、よりコンパクトなレイアウト-8ビット変数wspairのビットマスクに減らすことができる。
(g)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(f)で指定された通りに構成されるが、有効な組み合わせの数は、手動で選択された
を省略することによって減少する(たとえば、制御ブロックを適応させることによる)。
(h)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(f)で指定された通りに構成されるが、有効な組み合わせの数は、
まで減少し、
は少なくとも3である
(たとえば、制御ブロックを適応させることによる)。
(i)別の好適な実施形態では、確率推定器(またはソース統計値決定ブロック)は、実施形態(h)で指定された通りに構成されるが、有効なウィンドウサイズ組み合わせのセットは、
で拡張され、ここで
(たとえば、制御ブロックを適応させることによる)。
(j)本発明の別の好適な実施形態では、確率推定方法または概念(またはソース統計値決定ブロック)は、実施形態(a)のように構成されるが、カウンタの分解の(またはソース統計値の分解能)は等しくない。たとえば、
(たとえば、制御ブロックを適応させること、またはソース統計値決定ブロックを適応させることによる)。特に、より小さいウィンドウサイズ、たとえば
を使用するカウンタ(またはソース統計値)では、メモリ消費を削減するために、個々のカウンタ(またはソース統計値)の分解能を減少させることができる。
(k)本発明の別の好適な実施形態では、確率推定方法または概念は、実施形態(j)のように構成されるが、カウンタ(またはソース統計値)の分解能
は、そのウィンドウサイズによって(たとえば、ソース統計値を計算または更新するために使用されるウィンドウサイズによって)導出される。たとえば、
、ここで
は閾値(たとえば、固定値)であり、たとえば8に等しくてもよい。
(l)本発明の別の好適な実施形態では、確率推定方法または概念は、実施形態(j)のように構成されるが、1つのコンテキストモデルの
変数の合計は、すべてのコンテキストモデルで等しい(これはたとえば、制御ブロックの適応によって実現され得る)。このため、各コンテキストモデルは同じビット数を必要とし、特定のコンテキストモデルのアドレス指定は、単純なオフセット計算によって実行することができる(たとえば、異なるコンテキストモデルに関連付けられたソース統計値が、アレイまたは連続するメモリ領域に格納される場合)。
(m)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(l)に記載された通りに構成されるが、
変数の合計がすべてのコンテキストモデルで等しいという制約のため、有効なウィンドウサイズ組み合わせの数は減少する(たとえば、制御ブロックの適応による)。この実施形態では、
は減少から除外される(たとえば、nおよびnが等しい場合も依然として選択され得る)。
(n)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、1つのカウンタのウィンドウサイズは無限に設定される。このため、カウントは更新されず、算術演算およびメモリ消費に関して複雑さを軽減することができる。たとえば、ソース統計値の1つは、固定値に置き換えることができる。したがって、結合ソース統計値は、ソース統計値の1つと前記固定値との組み合わせによって取得することができる。
(o)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、コンテキストモデルは、スライスごとに送信される別個のフラグに応じて初期化される(たとえば、ビデオエンコーダによって提供され、ビデオデコーダによって評価される)。スライスタイプおよびcabac init flagに応じてウィンドウサイズを初期化する代わりに、使用されるセット(たとえば、使用されるnおよびnの値)を指定する別個のフラグ「ws_flag」が導入される。結果として、表2の割り当ては、表3に示されるように拡張される。
たとえば、スライスごとに、(たとえば制御情報または構成情報として)ビデオビットストリームに含まれる「ws_flag」またはパラメータに応じて、2セットのウィンドウサイズの間で選択することが可能である。
このため、制御ブロック(または一般に、ビデオエンコーダまたはビデオデコーダ)は、たとえば、wsフラグを評価し、wsフラグに応じて(通常はスライスタイプにも応じて。これは通常、スライスごとに、または選択されたスライスに対して、制御情報または構成情報としてビデオビットストリームにも含まれる)ウィンドウサイズを調整する。
(p)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、ウィンドウサイズの初期化は、現在のスライスの時間レベルにさらに依存する。結果として、
の総数が増加する。このため、制御ブロック(またはビデオエンコーダまたはデコーダ)は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの時間レベルを考慮するように構成され得る。
(q)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(a)に記載された通りに構成されるが、ウィンドウサイズの初期化は、現在のスライスの量子化パラメータにさらに依存する。このため、制御ブロック(またはビデオエンコーダまたはデコーダ)は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの量子化パラメータを考慮するように構成され得る。
(r)別の好適な実施形態では、確率推定器(たとえば、ソース統計値決定ブロック)は、実施形態(p)に記載された通りに構成されるが、初期化は、量子化パラメータにさらに依存する。結果として、
は、時間レベル、量子化パラメータ、スライスタイプ、およびcabac init flagの積空間の項目ごとに指定される。このため、制御ブロック(またはビデオエンコーダまたはデコーダ)は、たとえば、ウィンドウサイズを決定するときに、現在のスライスの時間レベルおよび量子化パラメータを考慮するように構成され得る。
(s)本発明の別の好適な実施形態では、確率推定方法または概念(たとえば、ソース統計値決定ブロック)は、実施形態(a)と同一に構成されるが、ウィンドウサイズ変数は、位置に応じて、復号化または符号化プロセス中に変更される(たとえば、スライス内および/または異なるスライス間および/または異なるフレーム間で)。
たとえば、現在のbinが、スライスの最初の列または最初の行の一部であるCTU(符号化ツリーユニット)から生じる場合、両方のカウンタ(またはソース統計値決定子)のウィンドウサイズ(たとえば、nおよびn)は以下のように設定される。
たとえば、これは、現在のbinがスライスの最初の列または最初の行の一部であるCTUIから生じる場合のウィンドウサイズの選択的な減少を意味し得る。
CTUの最初の行またはCTUの最初の列の符号化処理が終了した場合、ウィンドウサイズはそのデフォルト値に設定される(たとえば、表2および表3の1つにしたがって、たとえば考慮され得るスライスタイプおよびその他いずれかのパラメータまたはフラグに基づいて定義される通り)。
ウィンドウサイズを変更することにより、確率推定器は、スライスまたはCTUの行の始めのソースbinシーケンスの基礎となる統計に、より速くまたはより遅く適応し得る。
(t)本発明の別の好適な実施形態では、確率推定方法または概念(たとえば、ソース統計値決定ブロック)は、実施形態(a)と同一に構成されるが、スライスの復号化または符号化中にウィンドウサイズを変更するために、追加のフラグが使用される(たとえば、ビデオエンコーダによって提供され、ビデオデコーダによって評価される)。この実施形態では、たとえば、すべてのコンテキストモデルまたはサブセット(たとえば、コンテキストモデルの)の
を増加または減少させるために使用されるすべてのCTUに、フラグ「ctu_ws_flag」がある。符号化中、たとえばすべてのCTUの前に、「ctu_ws_flag」が通知され、復号化中、たとえばすべてのCTUの前に、「ctu_ws_flag」が読み取られる。「ctu_ws_flag」の値に応じて、結果が依然として有効な範囲[1,11]内にある場合、すべてのコンテキストモデルの
の変数は、増加または減少する。
(u)本発明の別の好適な実施形態では、確率推定方法または概念(たとえば、ソース統計値決定ブロック)は、実施形態(t)と同一に構成されるが、ctu_ws_flagに応じて、すべてのコンテキストモデルのサブセットのウィンドウサイズのみが変更される。
5)図4による方法
図4は、本発明の一実施形態による、方法400のフローチャートを示す。
なお、方法400は、個別におよび組み合わせて、対応する装置に関して本明細書に記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。
また、第1ソース統計値を固定の非ゼロ値と組み合わせることによって結合ソース統計値が得られる場合、第2ソース統計値を計算する必要がないことにも、留意すべきである。
6)図5による方法
図5は、本発明の一実施形態による、方法500のフローチャートを示す。
なお、方法500は、個別におよび組み合わせて、対応する装置に関して本明細書に記載された特徴、機能、および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。
また、第1ソース統計値を固定の非ゼロ値と組み合わせることによって結合ソース統計値が得られる場合、第2ソース統計値を計算する必要がないことにも、留意すべきである。
7)図6によるビデオストリーム
図6は、本発明の一実施形態による、ビデオストリーム(ビットストリーム)の概略(簡略化)表現を示す。
なお、ビデオストリーム600は、個別におよび組み合わせて、本明細書に記載される特徴および詳細のいずれかによって任意選択的に補足され得ることに、留意すべきである。
8)結論
結論として、たとえば、ビデオエンコーダ、ビデオデコーダ、ならびに画像エンコーダ、画像デコーダ、オーディオエンコーダ、オーディオデコーダなどでも使用され得る、バイナリ算術符号化の確率推定方法および装置について記載されてきた。
これらの方法および装置は、従来のソリューションよりも優れている。
たとえば、[4]の文献は、コンテキストモデルごとに定義されたカスタムウィンドウサイズについて記載している。しかしながら、ウィンドウサイズは、スライスタイプまたはcabac init flagに依存して導出されるものではない。コンテキストモデルごとに2つのペアのウィンドウサイズが定義され、1つのペアを選択するために量子化パラメータが使用される。さらに、異なる範囲のウィンドウサイズが提供される。
[5]の文献は、請求項に記載される高速攻撃モードの代替例として比較できる方法について記載している。文献は、コンテキストモデルに割り当てられた最初の64個のbinに対して追加のペアのウィンドウサイズが定義されることを記載している。最初の64個のbinが復号化または符号化された後、ウィンドウサイズはそのデフォルト値に設定される。このアプローチは、コンテキストモデルごとに符号化されたbinの数を追跡する、別個のカウンタ変数を必要とする。
9)実装代替例
いくつかの態様は装置の文脈で説明されてきたが、これらの態様が対応する方法の説明も表すことは明らかであり、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の説明も表す。方法ステップの一部または全ては、たとえば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって(またはこれを使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちの1つ以上が、このような装置によって実行されてもよい。
本発明の符号化されたビデオ信号(またはデータストリームまたはビデオビットストリーム)は、デジタル記憶媒体上に記憶されることが可能であり、またはインターネットなどの無線送信媒体または有線送信媒体のような送信媒体で送信されることが可能である。
特定の実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実装され得る。本実装は、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働可能な)、電子可読制御信号が記憶された、フロッピーディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリなどのデジタル記憶媒体を使用して、実行され得る。したがって、デジタル記憶媒体はコンピュータ可読であり得る。
本発明によるいくつかの実施形態は、本明細書に記載される方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することが可能な、電子可読制御信号を有するデータキャリアを備える。
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装されることが可能であり、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されたときに方法の1つを実行するように動作する。プログラムコードは、たとえば、機械可読キャリア上に記憶されてもよい。
別の実施形態は、機械可読キャリア上に記憶された、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを備える。
したがって、言い換えると、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されたときに、本明細書に記載される方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを備え、それが記録された、データキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録媒体は、典型的には有形および/または非一時的である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは一連の信号はたとえば、データ通信接続を介して、たとえばインターネットを介して転送されるように構成されてもよい。
さらなる実施形態は、本明細書に記載される方法の1つを実行するように構成または適合された、たとえばコンピュータまたはプログラマブル論理デバイスなどの処理手段を備える。
さらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを備える。
本発明によるさらなる実施形態は、本明細書に記載される方法の1つを実行するためのコンピュータプログラムを受信機に(たとえば、電子的または光学的に)送信するように構成された、装置またはシステムを備える。受信機は、たとえば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、たとえば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えてもよい。
いくつかの実施形態では、プログラマブル論理デバイス(たとえばフィールドプログラマブルゲートアレイ)は、明細書に記載される方法の機能の一部または全てを実行するために使用され得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載される方法の1つを実行するためにマイクロプロセッサと協働し得る。一般に、方法は、好ましくはいずれかのハードウェア装置によって実行される。
本明細書に記載される装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置およびコンピュータの組み合わせを使用して、実装され得る。
本明細書に記載される装置、または本明細書に記載される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび/またはソフトウェアで実装され得る。
本明細書に記載される方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置およびコンピュータの組み合わせを使用して、実行され得る。
本明細書に記載される方法、または本明細書に記載される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび/またはソフトウェアによって実行され得る。
上記の実施形態は、本発明の原理を単に例示するものである。本明細書に記載される配置および詳細の修正および変形は、当業者にとって明らかとなることが理解される。したがって、喫緊の請求項の範囲によってのみ限定され、本明細書の実施形態の記載および説明によって提示される具体的詳細によっては限定されないことが意図される。
参考文
[1] A. Alshin, E. Alshina, “Multi-parameter probability update for CABAC”, JCTVC-F254, Torino, July, 2011, http://phenix.it-sudparis.eu/jct/doc_end_user/documents/6_Torino/wg11/JCTVC-F254-v5.zip

[2] ITU-T, Recommondation H.265(12/16), https://www.itu.int/rec/dologin_pub.asp?lang=e&id=T-REC-H.265-201612-I!!PDF-E&type=items
[3] J.Stegemann, H.Kirchhoffer, D. Marpe, T. Wiegand, “Non-CE1: Counter-based probability model update with adapted arithmetic coding engine“ , http://phenix.it-sudparis.eu/jct/doc_end_user/documents/7_Geneva/wg11/JCTVC-G547-v4.zip
[4] A.Said, M. Karczewicz, V. Seregin, H. Egilmez, L. Zhang, X. Zhao, “EE2: Arithmetic coding with context-dependent double-window adaptation response”, JVET-H0061, http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/8_Macau/wg11/JVET-H0061-v1.zip
A.Said, M. Karczewicz, V. Seregin, H. Egilmez, L. Zhang, X. Zhao, “EE2 related: Arithmetic coding with progressive context-dependent double-window adaptation response”, http://phenix.it-sudparis.eu/jvet/doc_end_user/documents/8_Macau/wg11/JVET-H0067-v2.zip

Claims (22)

  1. 少なくとも1つのプロセッサとメモリを含むビデオデコーダであって、前記メモリは、前記少なくとも1つのプロセッサによって実行されたときに、前記ビデオデコーダに、
    バイナリシーケンスの符号化表現を算術的デコードに基づいてビデオコンテンツを復号化させ、
    以下にしたがって第1ソース統計値at+1を取得させ、
    Figure 0007451655000185
    ここで、xtは復号化されたバイナリ値であり、
    atは前記第1ソース統計値の前のバージョンであり、
    naは第1ウィンドウサイズパラメータであり、
    Figure 0007451655000186
    BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    以下にしたがって第2ソース統計値bt+1を取得させ、
    Figure 0007451655000187
    ここで、xtは復号化されたバイナリ値であり、
    btは前記第2ソース統計値の前のバージョンであり、
    nbは第2ウィンドウサイズパラメータであり、
    Figure 0007451655000188
    BITSbは前記第2ソース統計値を表すために使用されるビット数であり、
    ここでnb>naで、BISTSb>BITSaであり、
    前記第1ソース統計値及び前記第2ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第1ソース統計値及び前記第2ソース統計値に適用される、決定させ、
    前記結合ソース統計値に基づいて間隔サブディビジョンの1つ以上の範囲値を決定させ、
    前記1つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現を前記バイナリシーケンスにマッピングさせる、
    命令を含む、ビデオデコーダ。
  2. 前記ビデオデコーダは、前記プロセッサによって実行されると、前記ビデオデコーダに、
    スライスがタイプI、P、又はBであるかどうかを示すスライスタイプ情報を評価させ、
    前記スライスタイプ情報に基づいて前記第1ウィンドウサイズパラメータ及び前記第2ウィンドウサイズパラメータを決定させる、
    命令をさらに含む、請求項1に記載のビデオデコーダ。
  3. 前記ビデオデコーダは、前記プロセッサによって実行されると、前記ビデオデコーダに、
    前記結合ソース統計値に基づいて状態インデックスを決定させ、
    前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定させ、
    前記状態インデックスに基づいて間隔サブディビジョンの1つ以上の範囲値を決定させる、
    命令をさらに含む、請求項1に記載のビデオデコーダ。
  4. 前記メモリは前記プロセッサによって実行されたときに、前記ビデオデコーダに、
    Figure 0007451655000189
    となるように、前記第1ウィンドウサイズパラメータ、na、及び前記第2ウィンドウサイズパラメータ、nbを選択させる、
    命令をさらに含む、請求項1に記載のビデオデコーダ。
  5. 前記メモリは前記プロセッサによって実行されたときに、前記ビデオデコーダに、
    コンテキストモデルに基づいて、第1ウィンドウサイズパラメータ、及び第2ウィンドウサイズパラメータを決定させる、
    命令をさらに含む、請求項1に記載のビデオデコーダ。
  6. ビデオを復号化する方法であって、
    バイナリシーケンスの符号化表現を算術的デコードに基づいてビデオコンテンツを復号化することと、
    以下にしたがって第1ソース統計値at+1を取得することと、
    Figure 0007451655000190
    ここで、xtは復号化されたバイナリ値であり、
    atは前記第1ソース統計値の前のバージョンであり、
    naは第1ウィンドウサイズパラメータであり、
    Figure 0007451655000191
    BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    以下にしたがって第2ソース統計値bt+1を取得することと、
    Figure 0007451655000192
    ここで、xtは復号化されたバイナリ値であり、
    btは前記第2ソース統計値の前のバージョンであり、
    nbは第2ウィンドウサイズパラメータであり、
    Figure 0007451655000193
    BITSbは前記第2ソース統計値を表すために使用されるビット数であり、
    ここでnb>naで、BISTSb>BITSaであり、
    前記第1ソース統計値及び前記第2ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第1ソース統計値及び前記第2ソース統計値に適用される、決定することと、
    前記結合ソース統計値に基づいて間隔サブディビジョンの1つ以上の範囲値を決定することと、
    前記1つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現を前記バイナリシーケンスにマッピングすることと、
    を含む、方法。
  7. 前記方法は、
    スライスがタイプI、P、又はBであるかどうかを示すスライスタイプ情報を評価することと、
    前記スライスタイプ情報に基づいて前記第1ウィンドウサイズパラメータ及び前記第2ウィンドウサイズパラメータを決定することと、
    をさらに含む、請求項6に記載の方法。
  8. 前記方法は、
    前記結合ソース統計値に基づいて状態インデックスを決定することと、
    前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定することと、
    前記状態インデックスに基づいて間隔サブディビジョンの1つ以上の範囲値を決定することと、
    をさらに含む、請求項6に記載の方法。
  9. 前記方法は、
    Figure 0007451655000194
    となるように、前記第1ウィンドウサイズパラメータ、na、及び前記第2ウィンドウサイズパラメータ、nbを選択することと、
    をさらに含む、請求項6に記載の方法。
  10. 前記方法は、
    コンテキストモデルに基づいて、第1ウィンドウサイズパラメータ、及び第2ウィンドウサイズパラメータを決定させることと、
    をさらに含む、請求項6に記載の方法。
  11. コンピュータプログラムがコンピュータによって実行されたときに、ビデオを復号化する方法を実行する、その上に記憶した前記コンピュータプログラムを有する非一時的デジタル記憶媒体であって、前記方法は、
    バイナリシーケンスの符号化表現を算術的デコードに基づいてビデオコンテンツを復号化させることと、
    以下にしたがって第1ソース統計値at+1を取得させ、
    Figure 0007451655000195
    ここで、xtは復号化されたバイナリ値であり、
    atは前記第1ソース統計値の前のバージョンであり、
    naは第1ウィンドウサイズパラメータであり、
    Figure 0007451655000196
    BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    以下にしたがって第2ソース統計値bt+1を取得し、
    Figure 0007451655000197
    ここで、xtは復号化されたバイナリ値であり、
    btは前記第2ソース統計値の前のバージョンであり、
    nbは第2ウィンドウサイズパラメータであり、
    Figure 0007451655000198
    BITSbは前記第2ソース統計値を表すために使用されるビット数であり、
    ここでnb>naで、BISTSb>BITSaであり、
    前記第1ソース統計値及び前記第2ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第1ソース統計値及び前記第2ソース統計値に適用される、決定させ、
    前記結合ソース統計値に基づいて間隔サブディビジョンの1つ以上の範囲値を決定させ、
    前記1つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現を前記バイナリシーケンスにマッピングさせる、
    命令を含む、非一時的デジタル記憶媒体。
  12. 少なくとも1つのプロセッサとメモリを含むビデオエンコーダであって、前記メモリは、前記少なくとも1つのプロセッサによって実行されたときに、前記ビデオエンコーダに、
    バイナリシーケンスの符号化表現を算術的エンコードに基づいてビデオコンテンツを符号化させ、
    以下にしたがって第1ソース統計値at+1を取得させ、
    Figure 0007451655000199
    ここで、xtは符号化されたバイナリ値であり、
    atは前記第1ソース統計値の前のバージョンであり、
    naは第1ウィンドウサイズパラメータであり、
    Figure 0007451655000200
    BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    以下にしたがって第2ソース統計値bt+1を取得させ、
    Figure 0007451655000201
    ここで、xtは符号化されたバイナリ値であり、
    btは前記第2ソース統計値の前のバージョンであり、
    nbは第2ウィンドウサイズパラメータであり、
    Figure 0007451655000202
    BITSbは前記第2ソース統計値を表すために使用されるビット数であり、
    ここでnb>naで、BISTSb>BITSaであり、
    前記第1ソース統計値及び前記第2ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第1ソース統計値及び前記第2ソース統計値に適用する、決定させ、
    前記結合ソース統計値に基づいて間隔サブディビジョンの1つ以上の範囲値を決定させ、
    前記1つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現前記バイナリシーケンスマッピングさせる、
    命令を含む、ビデオエンコーダ。
  13. 前記ビデオエンコーダは、前記プロセッサによって実行されると、前記ビデオエンコーダに、
    スライスがタイプI、P、又はBであるかどうかを示すスライスタイプ情報を符号化させ、
    前記スライスタイプ情報に基づいて前記第1ウィンドウサイズパラメータ及び前記第2ウィンドウサイズパラメータを決定させる、
    命令をさらに含む、請求項12に記載のビデオエンコーダ。
  14. 前記ビデオエンコーダは、前記プロセッサによって実行されると、前記ビデオエンコーダに、
    前記結合ソース統計値に基づいて状態インデックスを決定させ、
    前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定させ、
    前記状態インデックスに基づいて間隔サブディビジョンの1つ以上の範囲値を決定させる、
    命令をさらに含む、請求項12に記載のビデオエンコーダ。
  15. 前記メモリは前記プロセッサによって実行されたときに、前記ビデオエンコーダに、
    Figure 0007451655000203
    となるように、前記第1ウィンドウサイズパラメータ、na、及び前記第2ウィンドウサイズパラメータ、nbを選択させる、
    命令をさらに含む、請求項12に記載のビデオエンコーダ。
  16. 前記メモリは前記プロセッサによって実行されたときに、前記ビデオエンコーダに、
    コンテキストモデルに基づいて、第1ウィンドウサイズパラメータ、及び第2ウィンドウサイズパラメータを決定させる、
    命令をさらに含む、請求項12に記載のビデオエンコーダ。
  17. ビデオを符号化する方法であって、
    バイナリシーケンスの符号化表現を算術的エンコードに基づいてビデオコンテンツを符号化することと、
    以下にしたがって第1ソース統計値at+1を取得することと、
    Figure 0007451655000204
    ここで、xtは符号化されたバイナリ値であり、
    atは前記第1ソース統計値の前のバージョンであり、
    naは第1ウィンドウサイズパラメータであり、
    Figure 0007451655000205
    BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    以下にしたがって第2ソース統計値bt+1を取得することと、
    Figure 0007451655000206
    ここで、xtは符号化されたバイナリ値であり、
    btは前記第2ソース統計値の前のバージョンであり、
    nbは第2ウィンドウサイズパラメータであり、
    Figure 0007451655000207
    BITSbは前記第2ソース統計値を表すために使用されるビット数であり、
    ここでnb>naで、BISTSb>BITSaであり、
    前記第1ソース統計値及び前記第2ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第1ソース統計値及び前記第2ソース統計値に適用される、決定することと、
    前記結合ソース統計値に基づいて間隔サブディビジョンの1つ以上の範囲値を決定することと、
    前記1つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現前記バイナリシーケンスマッピングすることと、
    を含む、方法。
  18. 前記方法は、
    スライスがタイプI、P、又はBであるかどうかを示すスライスタイプ情報を評価することと、
    前記スライスタイプ情報に基づいて前記第1ウィンドウサイズパラメータ及び前記第2ウィンドウサイズパラメータを決定することと、
    をさらに含む、請求項17に記載の方法。
  19. 前記方法は、
    前記結合ソース統計値に基づいて状態インデックスを決定することと、
    前記状態インデックスに基づいて、最も確からしいバイナリ値を表す値を決定することと、
    前記状態インデックスに基づいて間隔サブディビジョンの1つ以上の範囲値を決定することと、
    をさらに含む、請求項17に記載の方法。
  20. 前記方法は、
    Figure 0007451655000208
    となるように、前記第1ウィンドウサイズパラメータ、na、及び前記第2ウィンドウサイズパラメータ、nbを選択することと、
    をさらに含む、請求項17に記載の方法。
  21. 前記方法は、
    コンテキストモデルに基づいて、第1ウィンドウサイズパラメータ、及び第2ウィンドウサイズパラメータを決定することと、
    をさらに含む、請求項17に記載の方法。
  22. コンピュータプログラムがコンピュータによって実行されたときに、ビデオを符号化する方法を実行する、その上に記憶した前記コンピュータプログラムを有する非一時的デジタル記憶媒体であって、前記方法は、
    バイナリシーケンスの符号化表現を算術的エンコードに基づいてビデオコンテンツを符号化させることと、
    以下にしたがって第1ソース統計値at+1を取得させ、
    Figure 0007451655000209
    ここで、xtは符号化されたバイナリ値であり、
    atは前記第1ソース統計値の前のバージョンであり、
    naは第1ウィンドウサイズパラメータであり、
    Figure 0007451655000210
    BITSaは前記第1ソース統計値を表すために使用されるビット数であり、
    以下にしたがって第2ソース統計値bt+1を取得し、
    Figure 0007451655000211
    ここで、xtは符号化されたバイナリ値であり、
    btは前記第2ソース統計値の前のバージョンであり、
    nbは第2ウィンドウサイズパラメータであり、
    Figure 0007451655000212
    BITSbは前記第2ソース統計値を表すために使用されるビット数であり、
    ここでnb>naで、BISTSb>BITSaであり、
    前記第1ソース統計値及び前記第2ソース統計値に基づいて結合ソース統計値を決定させることであって、前記結合ソース統計値を決定するときに、異なる重み付けが前記第1ソース統計値及び前記第2ソース統計値に適用される、決定させ、
    前記結合ソース統計値に基づいて間隔サブディビジョンの1つ以上の範囲値を決定させ、
    前記1つ以上の範囲値を使用して、前記バイナリシーケンスの符号化表現前記バイナリシーケンスマッピングさせる、
    命令を含む、非一時的デジタル記憶媒体。
JP2022184990A 2018-03-29 2022-11-18 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム Active JP7451655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024034116A JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP18165250.4 2018-03-29
EP18165250 2018-03-29
PCT/EP2019/058057 WO2019185893A1 (en) 2018-03-29 2019-03-29 Video decoder, video encoder, method for decoding a video content, method for encoding a video content, computer program and video bitstream
JP2020552198A JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020552198A Division JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024034116A Division JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Publications (2)

Publication Number Publication Date
JP2023018041A JP2023018041A (ja) 2023-02-07
JP7451655B2 true JP7451655B2 (ja) 2024-03-18

Family

ID=61868360

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2020552198A Active JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム
JP2022184990A Active JP7451655B2 (ja) 2018-03-29 2022-11-18 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム
JP2024034116A Pending JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020552198A Active JP7181941B2 (ja) 2018-03-29 2019-03-29 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024034116A Pending JP2024063203A (ja) 2018-03-29 2024-03-06 ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム

Country Status (7)

Country Link
US (3) US11457230B2 (ja)
EP (1) EP3777197A1 (ja)
JP (3) JP7181941B2 (ja)
KR (3) KR102523750B1 (ja)
CN (2) CN112313960B (ja)
TW (2) TWI799785B (ja)
WO (1) WO2019185893A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI799785B (zh) 2018-03-29 2023-04-21 弗勞恩霍夫爾協會 視訊解碼器、視訊編碼器、用以解碼視訊內容之方法、用以編碼視訊內容之方法、電腦程式及視訊位元串流
US11113846B2 (en) * 2018-08-31 2021-09-07 Hulu, LLC Coefficient context modeling in video coding
CN115715466A (zh) 2020-05-22 2023-02-24 抖音视界有限公司 子比特流提取处理中的填充符有效载荷
WO2023194108A2 (en) * 2022-04-08 2023-10-12 Interdigital Ce Patent Holdings, Sas Systems and methods associated with entropy coding
CN114640695B (zh) * 2022-04-24 2023-04-07 上海交通大学 一种智能工厂基于长序列双预测和informer的高频时序数据有效传输方法
US11977779B2 (en) * 2022-05-11 2024-05-07 Bank Of America Corporation Smart queue for distributing user requests to automated response generating systems
WO2024050099A1 (en) * 2022-09-02 2024-03-07 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for intra block copy

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016196307A1 (en) 2015-05-29 2016-12-08 Qualcomm Incorporated Advanced arithmetic coder

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107529708B (zh) * 2011-06-16 2019-05-07 Ge视频压缩有限责任公司 解码器、编码器、解码和编码视频的方法及存储介质
US10701390B2 (en) * 2017-03-14 2020-06-30 Qualcomm Incorporated Affine motion information derivation
TWI799785B (zh) 2018-03-29 2023-04-21 弗勞恩霍夫爾協會 視訊解碼器、視訊編碼器、用以解碼視訊內容之方法、用以編碼視訊內容之方法、電腦程式及視訊位元串流

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016196307A1 (en) 2015-05-29 2016-12-08 Qualcomm Incorporated Advanced arithmetic coder

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A.Alshin and E.Alshina,Multi-parameter probability up-date for CABAC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,JCTVC-F254,6th Meeting: Torino, IT,2011年07月,pp.1-5
Alexander Alshin, Elena Alshina, and JeongHoon Park,CE1 (subset B): Multi-parameter probability up-date for CABAC,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,JCTVC-G764,7th Meeting: Geneva, CH,2011年11月,pp.1-4
Amir Said, et al.,Arithmetic coding with context-dependent double-window adaptation response,Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-G0112,7th Meeting: Torino, IT,2017年07月,pp.1-4
Amir Said, et al.,EE2 related: Arithmetic coding with progressive context-dependent double-window adaptation response,Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-H0067,8th Meeting: Macao, CN,2017年10月,pp.1-9
M. Albrecht, et al.,Description of SDR, HDR, and 360° video coding technology proposal by Fraunhofer HHI,Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-J0014-v4,10th Meeting: San Diego, US,2018年04月,pp.18-20

Also Published As

Publication number Publication date
KR20200128754A (ko) 2020-11-16
EP3777197A1 (en) 2021-02-17
TW201943274A (zh) 2019-11-01
JP2023018041A (ja) 2023-02-07
KR102617187B1 (ko) 2023-12-27
KR102523750B1 (ko) 2023-04-20
KR20240005114A (ko) 2024-01-11
JP7181941B2 (ja) 2022-12-01
US12058352B2 (en) 2024-08-06
US20210014512A1 (en) 2021-01-14
CN112313960B (zh) 2023-05-09
US20240348805A1 (en) 2024-10-17
TWI799785B (zh) 2023-04-21
TWI721396B (zh) 2021-03-11
KR20230057474A (ko) 2023-04-28
JP2024063203A (ja) 2024-05-10
CN112313960A (zh) 2021-02-02
TW202143728A (zh) 2021-11-16
JP2021518716A (ja) 2021-08-02
CN118678105A (zh) 2024-09-20
US11457230B2 (en) 2022-09-27
US20220417538A1 (en) 2022-12-29
WO2019185893A1 (en) 2019-10-03

Similar Documents

Publication Publication Date Title
JP7451655B2 (ja) ビデオデコーダ、ビデオエンコーダ、ビデオコンテンツを復号化する方法、ビデオコンテンツを符号化する方法、コンピュータプログラム、およびビデオビットストリーム
JP6560393B2 (ja) エントロピー符号化におけるコンテキスト初期化
KR101648688B1 (ko) 엔트로피 인코딩 및 디코딩 방식
US8736467B2 (en) Adaptive binarization for arithmetic coding
CN110419216B (zh) 通过参数化概率估计有限状态机进行二进制算术译码
CN113170132A (zh) 使用或适用于与依赖标量量化的组合的变换系数的有效编码
KR102361206B1 (ko) Gcli 엔트로피 코딩을 위한 부대역 의존 예측 적응을 사용하여 인코딩 또는 디코딩하기 위한 방법 및 장치
US11234023B2 (en) Features of range asymmetric number system encoding and decoding
US11979584B2 (en) Arithmetic encoders and decoders, video encoders and decoders, methods for encoding or decoding symbols, and methods for encoding or decoding video content
WO2012126037A1 (en) Method, apparatus and system for encoding video data
TW202435611A (zh) 算術編碼器、算術解碼器、視訊編碼器、視訊解碼器、編碼方法、解碼方法及電腦程式

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240306

R150 Certificate of patent or registration of utility model

Ref document number: 7451655

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150