JP2018538742A - ディスプレイストリーム圧縮(dsc)における固定小数点近似のためのシステムおよび方法 - Google Patents

ディスプレイストリーム圧縮(dsc)における固定小数点近似のためのシステムおよび方法 Download PDF

Info

Publication number
JP2018538742A
JP2018538742A JP2018525779A JP2018525779A JP2018538742A JP 2018538742 A JP2018538742 A JP 2018538742A JP 2018525779 A JP2018525779 A JP 2018525779A JP 2018525779 A JP2018525779 A JP 2018525779A JP 2018538742 A JP2018538742 A JP 2018538742A
Authority
JP
Japan
Prior art keywords
slice
video data
value
block
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018525779A
Other languages
English (en)
Other versions
JP6772266B2 (ja
JP2018538742A5 (ja
Inventor
ヤコブソン、ナタン・ハイム
ティルマライ、ビジャヤラガバン
イキジアン、アイク
ジョーシー、ラジャン・ラクスマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2018538742A publication Critical patent/JP2018538742A/ja
Publication of JP2018538742A5 publication Critical patent/JP2018538742A5/ja
Application granted granted Critical
Publication of JP6772266B2 publication Critical patent/JP6772266B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ターゲットレート、QP調整、バッファフルネス、ビットレートについてのラグランジュパラメータ、および/またはバッファのフルネスについてのラグランジュパラメータを含む、ビデオデータをコーディングするための様々なパラメータを計算するための、浮動小数点技法の代わりに使用される固定小数点技法のためのシステムおよび方法が提供される。固定小数点を使用してパラメータのうちの1つまたは複数を決定することによって、ハードウェア実装コストが減少される。

Description

[0001] 本開示は、ビデオコーディングおよび圧縮の分野に関し、詳細には、ディスプレイストリーム圧縮(DSC:display stream compression)など、ディスプレイリンク(display link)を介した送信のためのビデオ圧縮(video compression)に関する。
[0002] デジタルビデオ機能は、デジタルテレビジョン、携帯情報端末(PDA)、ラップトップコンピュータ、デスクトップモニタ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、ビデオ遠隔会議デバイスなどを含む、広範囲にわたるディスプレイに組み込まれ得る。適切なソースデバイスにディスプレイを接続するために、ディスプレイリンクが使用される。ディスプレイリンクの帯域幅要件(bandwidth requirement)はディスプレイの解像度(resolution)に比例し、したがって、高解像度ディスプレイは、大きい帯域幅のディスプレイリンクを必要とする。いくつかのディスプレイリンクは、高解像度ディスプレイをサポートするための帯域幅を有しない。高解像度ディスプレイにデジタルビデオを与えるためにより低い帯域幅のディスプレイリンクが使用され得るように帯域幅要件を低減するために、ビデオ圧縮が使用され得る。
[0003] 他のものが、ピクセルデータ(pixel data)に対して画像圧縮を利用することを試みた。しかしながら、そのような方式は、時々視覚的ロスレスでないか、または従来のディスプレイデバイスにおいて実装することが困難で費用がかかることがある。
[0004] ビデオエレクトロニクス規格協会(VESA:Video Electronics Standards Association)は、ディスプレイリンクビデオ圧縮のための規格として、ディスプレイストリーム圧縮(DSC)を開発した。DSCなど、ディスプレイリンクビデオ圧縮技法は、特に、視覚的ロスレス(visually lossless)であるピクチャ品質(すなわち、圧縮がアクティブであることをユーザがわからないような品質のレベルを有するピクチャ)を与えるべきである。ディスプレイリンクビデオ圧縮技法はまた、従来のハードウェアを用いてリアルタイム(real-time)に実装することが容易で費用がかからない方式を与えるべきである。
[0005] 本開示のシステム、方法およびデバイスは、それぞれいくつかの発明的態様を有し、それらのうちの単一の態様が、本明細書で開示される望ましい属性を単独で担当するとは限らない。
[0006] 一態様では、ビデオデータ(video data)をコーディングするための装置(apparatus)が提供される。本装置は、ビデオデータを記憶するためのメモリ(memory)を含むことができ、メモリはバッファ(buffer)を含む。本装置は、メモリに動作可能に結合されたハードウェアプロセッサ(hardware processor)をも含むことができる。プロセッサは、コーディングされるべきビデオデータを受信するように構成され得る。プロセッサは、コーディングされるべきブロック(block)について、ターゲットレート(target rate)、平坦度(flatness)量子化パラメータ(QP:quantization parameter)、バッファのフルネス(fullness)、ビットレート(bitrate)についてのラグランジュパラメータ(Lagrangian parameter)、またはバッファのフルネスについてのラグランジュパラメータのうちの1つまたは複数を決定するようにさらに構成され得、決定は、1つまたは複数の固定小数点近似演算(fixed-point approximation operation)に少なくとも部分的に基づく。
[0007] 別の態様では、ビデオデータをコーディングする方法が提供される。本方法は、ビデオデータをメモリに記憶することを含むことができ、メモリはバッファを含む。本方法は、コーディングされるべきビデオデータを受信することをも含み得る。本方法は、コーディングされるべきブロックについて、ターゲットレート、平坦度量子化パラメータ(QP)、バッファのフルネス、ビットレートについてのラグランジュパラメータ、またはバッファのフルネスについてのラグランジュパラメータのうちの1つまたは複数を決定することをさらに含むことができ、前記決定することは、1つまたは複数の固定小数点近似演算に少なくとも部分的に基づく。
[0008] 別の態様では、ビデオデータをコーディングするための装置が提供される。本装置は、ビデオデータを記憶するためのメモリを備え、メモリはバッファを含む。本装置は、メモリに動作可能に結合され、ビデオデータのスライス(slice)内のピクセルの合計数(total number)に基づいてスケーリングパラメータ(scaling parameter)を決定および記憶するように構成された、ハードウェアプロセッサをさらに備える。ハードウェアプロセッサは、複数の入力値(input value)をそれらの逆数値(reciprocal value)に関連付けるデータ構造(data structure)を決定および記憶するようにさらに構成される。ハードウェアプロセッサは、コーディングされるべきビデオデータを受信するようにさらに構成され、ビデオデータは、複数のブロックに分割された少なくとも1つのスライスを備える。ハードウェアプロセッサは、記憶されたスケーリングパラメータに基づいてしきい値(threshold value)を決定するようにさらに構成される。ハードウェアプロセッサは、コーディングされるべきスライスのブロックについて、スライス中の残りのピクセルの数がしきい値よりも小さいという決定に応答して、スケーリングパラメータを更新し、スケーリングファクタ(scaling factor)に基づいて、更新されたしきい値を決定するようにさらに構成される。ハードウェアプロセッサは、スケーリングファクタに基づいてスケーリングされた残りのピクセルの数に関連付けられた逆数値に基づいて、ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施するようにさらに構成され、ここにおいて、逆数値は、記憶されたデータ構造を使用して決定される。
[0009] 別の態様では、ビデオデータのブロックをコーディングするためのターゲットレートを決定するためのコンピュータ実装方法が提供される。本方法は、ビデオデータのスライス内のピクセルの合計数に基づいてスケーリングパラメータを決定および記憶することを備える。本方法は、複数の入力値をそれらの逆数値に関連付けるデータ構造を決定および記憶することをさらに備える。本方法は、コーディングされるべきビデオデータを受信することをさらに備え、ビデオデータは、複数のブロックに分割された少なくとも1つのスライスを備える。本方法は、記憶されたスケーリングパラメータに基づいてしきい値を決定することをさらに備える。本方法は、コーディングされるべきスライスのブロックについて、スライス中の残りのピクセルの数がしきい値よりも小さいという決定に応答して、スケーリングパラメータを更新し、スケーリングファクタに基づいて、更新されたしきい値を決定することをさらに備える。本方法は、スケーリングファクタに基づいてスケーリングされた残りのピクセルの数に関連付けられた逆数値に基づいて、ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施することをさらに備え、ここにおいて、逆数値は、記憶されたデータ構造を使用して決定される。
[0010] 別の態様では、ビデオデータのスライス内のピクセルの合計数に基づいてスケーリングパラメータを決定および記憶するための手段を備える、装置が提供される。本装置は、複数の入力値をそれらの逆数値に関連付けるデータ構造を決定および記憶するための手段をさらに備える。本装置は、コーディングされるべきビデオデータを受信するための手段をさらに備え、ビデオデータは、複数のブロックに分割された少なくとも1つのスライスを備える。本装置は、記憶されたスケーリングパラメータに基づいてしきい値を決定するための手段をさらに備える。本装置は、コーディングされるべきスライスのブロックについて、スライス中の残りのピクセルの数がしきい値よりも小さいという決定に応答して、スケーリングパラメータを更新し、スケーリングファクタに基づいて、更新されたしきい値を決定するための手段をさらに備える。本装置は、スケーリングファクタに基づいてスケーリングされた残りのピクセルの数に関連付けられた逆数値に基づいて、ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施するための手段をさらに備え、ここにおいて、逆数値は、記憶されたデータ構造を使用して決定される。
[0011] 別の態様では、非一時的コンピュータ可読記憶媒体が提供される。本記憶媒体は、画像のスライスに関係するビデオデータを記憶しており、スライスは1つまたは複数のブロックを備える。本記憶媒体は、実行されたとき、デバイスのプロセッサに、ビデオデータのスライス内のピクセルの合計数に基づいてスケーリングパラメータを決定および記憶させる命令をさらに記憶している。本記憶媒体は、プロセッサに、複数の入力値をそれらの逆数値に関連付けるデータ構造を決定および記憶させる命令をさらに記憶している。本記憶媒体は、プロセッサに、コーディングされるべきビデオデータを受信させる命令をさらに記憶しており、ビデオデータは少なくとも1つのスライスを備える。本記憶媒体は、プロセッサに、記憶されたスケーリングパラメータに基づいてしきい値を決定させる命令をさらに記憶している。本記憶媒体は、プロセッサに、コーディングされるべきスライスのブロックについて、スライス中の残りのピクセルの数がしきい値よりも小さいという決定に応答して、スケーリングパラメータを更新し、スケーリングファクタに基づいて、更新されたしきい値を決定させる命令をさらに記憶している。本記憶媒体は、プロセッサに、スケーリングファクタに基づいてスケーリングされた残りのピクセルの数に関連付けられた逆数値に基づいて、ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施させる命令をさらに記憶しており、ここにおいて、逆数値は、記憶されたデータ構造を使用して決定される。
[0012] 別の態様では、ビデオデータをコーディングするための装置が提供される。本装置は、ビデオデータを記憶するためのメモリを備え、メモリはバッファを含む。本装置は、メモリに動作可能に結合されたハードウェアプロセッサをさらに備える。ハードウェアプロセスは、最大バッファサイズの逆数(reciprocal)に基づいて第1のパラメータ値を決定および記憶するように構成される。ハードウェアプロセッサは、コーディングされるべきビデオデータを受信するようにさらに構成され、ビデオデータは、複数のブロックに分割された少なくとも1つのスライスを備える。ハードウェアプロセッサは、コーディングされるべきスライスのブロックについて、バッファフルネス(buffer fullness)を表すために使用されるビット数を示す第1の値と、バッファフルネスを計算するための精度を示す第2の値とに基づいて、第1のパラメータをスケーリングするようにさらに構成される。ハードウェアプロセッサは、スケーリングされた第1のパラメータに基づいて、ブロックについてのバッファフルネス値を決定するために1つまたは複数の固定小数点近似演算を実施するようにさらに構成される。
[0013] 別の態様では、ビデオデータをコーディングするための装置が提供される。本装置は、ビデオデータを記憶するためのメモリを備え、メモリはバッファを含む。本装置は、メモリに動作可能に結合されたハードウェアプロセッサをさらに備える。ハードウェアプロセスは、バッファフルネス値を量子化パラメータ(QP)調整値に関連付けるデータ構造を決定および記憶するように構成される。ハードウェアプロセッサは、コーディングされるべきビデオデータを受信するようにさらに構成され、ビデオデータは、複数のブロックに分割された少なくとも1つのスライスを備える。ハードウェアプロセッサは、コーディングされるべきスライスのブロックについて、ブロックが複雑な領域と平坦な領域との間の遷移を含んでいるかどうかを決定するようにさらに構成され、ここにおいて、複雑な領域は、平坦な領域と比較してより高い複雑さを有する。ハードウェアプロセッサは、ブロックが遷移を含んでいるという決定に応答して、バッファフルネス値を、バッファフルネス値をコーディングするために使用されるビット数と、QP調整値をコーディングするために使用されるべきビット数とに基づいてシフトするようにさらに構成される。ハードウェアプロセッサは、記憶されたデータ構造とシフトされたバッファフルネス値とに基づいて、ブロックについてのQP調整値を決定するために1つまたは複数の固定小数点近似演算を実施するようにさらに構成される。ハードウェアプロセッサは、ブロックのQPを決定されたQP調整値に設定するようにさらに構成される。
[0014] 別の態様では、ビデオデータをコーディングするための装置が提供される。本装置は、ビデオデータを記憶するためのメモリを備える。本装置は、メモリに動作可能に結合されたハードウェアプロセッサをさらに備える。ハードウェアプロセスは、ビデオデータのブロックをコーディングするために使用され得る最大ビット数(maximum number of bits)に基づいて第1のスケーリングパラメータを決定および記憶するように構成される。ハードウェアプロセッサは、ビデオデータのブロックをコーディングするために使用されるビット数をビットレートについてのラグランジュパラメータに関連付けるデータ構造を決定および記憶するようにさらに構成される。ハードウェアプロセッサは、コーディングされるべきビデオデータを受信するようにさらに構成され、ビデオデータは、複数のブロックに分割された少なくとも1つのスライスを備える。ハードウェアプロセッサは、コーディングされるべきスライスのブロックについて、第1のスケーリングパラメータによって調整されたブロックをコーディングするためのビット数に基づいて、データ構造を使用してブロックのビットレートについてのラグランジアン(Lagrangian)を決定する1つまたは複数の固定小数点近似演算を実施するようにさらに構成される。
[0015] 別の態様では、ビデオデータをコーディングするための装置が提供される。本装置は、ビデオデータを記憶するためのメモリを備え、メモリはバッファを含む。本装置は、メモリに動作可能に結合されたハードウェアプロセッサをさらに備える。ハードウェアプロセスは、バッファフルネス値をバッファフルネス値についてのラグランジュ値(Lagrangian value)に関連付けるデータ構造を決定および記憶するように構成される。ハードウェアプロセッサは、コーディングされるべきビデオデータを受信するようにさらに構成され、ビデオデータは、複数のブロックに分割された少なくとも1つのスライスを備える。ハードウェアプロセッサは、コーディングされるべきスライスのブロックについて、ブロックの計算されたバッファフルネス値を、バッファフルネス値をコーディングするために使用されるビット数を示す第1のパラメータと、データ構造のインデックス(index)をコーディングするために使用されるビット数を示す第2のパラメータとに基づいてスケーリングするようにさらに構成される。ハードウェアプロセッサは、記憶されたデータ構造とスケーリングされたバッファフルネス値とを使用して、バッファフルネス値についてのラグランジュ値を決定するために1つまたは複数の固定小数点近似演算を実施するようにさらに構成される。
[0016] 本開示で説明される態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0017] 本開示で説明される態様による技法を実施し得る別の例示的なビデオ符号化および復号システムを示すブロック図。 [0018] 本開示で説明される態様による技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0019] 本開示で説明される態様による技法を実装し得るビデオデコーダの一例を示すブロック図。 [0020] n1が6の値を有する(1<<n1が64である)、逆関数を示すグラフを示す図。 [0021] いくつかの実施形態による、固定小数点近似(fixed point approximation)を使用してブロックについてのターゲットレートを決定するための例示的な方法のフローチャート。 [0022] いくつかの実施形態による、固定小数点近似を使用してブロックについての平坦度QPを決定するための例示的な方法のフローチャート。 [0023] スライスのブロックがコーディングされるとき、bufAdjSizeがどのように変化し得るかを示す図。 [0024] いくつかの実施形態による、バッファフルネスを決定するための例示的なプロセスのフローチャート。 [0025] いくつかの実施形態による、ビットレートについてのラグランジュパラメータを決定するための例示的なプロセスのフローチャート。 [0026] いくつかの実施形態による、バッファフルネスについてのラグランジュパラメータを決定するためのプロセスのフローチャート。
[0027] 概して、本開示は、たとえば、ディスプレイストリーム圧縮(DSC)など、ビデオ圧縮技法を改善する方法に関する。より詳細には、本開示は、レート制御パラメータ(rate control parameter)の固定小数点近似のためのシステムおよび方法に関する。
[0028] いくつかの実施形態は、DSC規格のコンテキストにおいて本明細書で説明されるが、本明細書で開示されるシステムおよび方法が任意の好適なビデオコーディング規格に適用可能であり得ることを、当業者は諒解されよう。たとえば、本明細書で開示される実施形態は、以下の規格、すなわち、国際電気通信連合(ITU)電気通信標準化部門(ITU−T)H.261、国際標準化機構/国際電気標準会議(ISO/IEC)ムービングピクチャエキスパートグループ1(MPEG−1)Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264、高効率ビデオコーディング(HEVC)のうちの1つまたは複数、およびそのような規格に対する任意の拡張に適用可能であり得る。また、本開示で説明される技法は、将来開発される規格の一部になり得る。言い換えれば、本開示で説明される技法は、前に開発されたビデオコーディング規格、現在開発中のビデオコーディング規格、および次のビデオコーディング規格に適用可能であり得る。
[0029] DSCでは、バッファフルネス、およびバッファフルネスに基づくラムダ値(lambda value)など、いくつかのレート制御パラメータが、1つまたは複数の除算または除算演算(division operation)を使用して決定され得る。除算または除算演算は、除算演算子(たとえば、「/」)を伴う演算を指すことがある。しかしながら、除算演算の使用は、ハードウェア実装における複雑さおよび困難をもたらし得る。
[0030] これらおよび他の課題に対処するために、本開示で説明される技法は、固定小数点近似を使用して様々なレート制御パラメータを決定または計算することができる。レート制御パラメータの例としては、限定はしないが、ターゲットレート、平坦度QP、バッファフルネス、ビットレートについてのラムダ値、バッファフルネスについてのラムダ値などがあり得る。ラムダ値は、ラグランジュ(Lagrangian)パラメータまたはラグランジュ(lagrangrian)パラメータと呼ばれることもある。固定小数点近似を使用することによって、本技法は、レート制御パラメータを計算する際の除算演算の使用を低減するかまたはなくすことができ、これは、ハードウェア実装の複雑さおよびコストを低減することができる。
ビデオコーディング規格(Video Coding Standards)
[0031] ビデオ画像、TV画像、静止画像、あるいはビデオレコーダまたはコンピュータによって生成された画像など、デジタル画像は、水平ライン(horizontal line)および垂直ライン(vertical line)で構成されたピクセルまたはサンプルを含み得る。単一の画像中のピクセルの数は一般に数万個である。各ピクセルは、一般に、ルミナンス情報とクロミナンス情報とを含んでいる。圧縮がなければ、画像エンコーダから画像デコーダに搬送されるべき情報の膨大な量(sheer quantity)は、リアルタイム画像送信(real-time image transmission)を実行不可能にするであろう。送信されるべき情報の量を低減するために、JPEG、MPEGおよびH.263規格など、いくつかの異なる圧縮方法が開発された。
[0032] ビデオコーディング規格は、ITU−T H.261と、ISO/IEC MPEG−1 Visualと、ITU−T H.262またはISO/IEC MPEG−2 Visualと、ITU−T H.263と、ISO/IEC MPEG−4 Visualと、(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264と、そのような規格の拡張を含むHEVCとを含む。
[0033] さらに、VESAによって、あるビデオコーディング規格、すなわち、DSCが開発された。DSC規格は、ディスプレイリンクを介した送信のためにビデオを圧縮することができるビデオ圧縮規格である。ディスプレイの解像度が増加するにつれて、ディスプレイを駆動するために必要とされるビデオデータの帯域幅は、対応して増加する。いくつかのディスプレイリンクは、そのような解像度についてディスプレイにビデオデータのすべてを送信するための帯域幅を有しないことがある。したがって、DSC規格は、ディスプレイリンクを介した相互運用可能な、視覚的ロスレス圧縮のための圧縮規格を規定する。
[0034] DSC規格は、H.264およびHEVCなど、他のビデオコーディング規格とは異なる。DSCは、フレーム内圧縮(intra-frame compression)を含むが、フレーム間圧縮(inter-frame compression)を含まず、これは、ビデオデータをコーディングする際にDSC規格によって時間的情報(temporal information)が使用されないことがあることを意味する。対照的に、他のビデオコーディング規格は、それらのビデオコーディング技法においてフレーム間圧縮を採用し得る。4:1のまたはより高い圧縮比を与えるために、たとえば、アドバンストDSCが開発されている。4:1のまたはより高い圧縮比は、モバイルデバイスのために、たとえば、4Kなどの高解像度ディスプレイのために使用され得る。
ビデオコーディングシステム(Video Coding System)
[0035] 添付の図面を参照しながら、新規のシステム、装置、および方法の様々な態様が以下でより十分に説明される。ただし、本開示は、多くの異なる形態で実施され得、本開示全体にわたって提示される任意の特定の構造または機能に限定されるものと解釈されるべきではない。むしろ、これらの態様は、本開示が周到で完全になり、本開示の範囲を当業者に十分に伝えるように与えられる。本明細書の教示に基づいて、本開示の範囲は、本開示の他の態様とは無関係に実装されるにせよ、本開示の他の態様と組み合わせられるにせよ、本明細書で開示される新規のシステム、装置、および方法のいかなる態様をもカバーするものであることを、当業者は諒解されたい。たとえば、本明細書に記載される態様をいくつ使用しても、装置は実装され得、または方法は実施され得る。さらに、本開示の範囲は、本明細書に記載される本開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置または方法をカバーするものとする。本明細書で開示されるどの態様も請求項の1つまたは複数の要素によって実施され得ることを理解されたい。
[0036] 本明細書では特定の態様が説明されるが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好適な態様のいくつかの利益および利点が説明されるが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、異なるワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに広く適用可能であるものとし、それらのうちのいくつかが、例として、図において、および好適な態様の以下の説明において示される。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。
[0037] 添付の図面は例を示す。添付の図面中の参照番号によって示される要素は、以下の説明における同様の参照番号によって示される要素に対応する。本開示では、序数語(たとえば、「第1の」、「第2の」、「第3の」など)で始まる名前を有する要素は、必ずしもそれらの要素が特定の順序を有することを暗示するとは限らない。むしろ、そのような序数語は、同じまたは同様のタイプの異なる要素を指すために使用されるにすぎない。
[0038] 図1Aは、本開示で説明される態様による技法を利用し得る例示的なビデオコーディングシステム10を示すブロック図である。本明細書で使用され説明される「ビデオコーダ(video coder)」または「コーダ(coder)」という用語は、ビデオエンコーダ(video encoder)とビデオデコーダ(video decoder)の両方を総称的に指す。本開示では、「ビデオコーディング(video coding)」または「コーディング(coding)」という用語は、ビデオ符号化(video encoding)とビデオ復号(video decoding)とを総称的に指すことがある。ビデオエンコーダおよびビデオデコーダに加えて、本出願で説明される態様は、トランスコーダ(たとえば、ビットストリームを復号し、別のビットストリームを再符号化することができるデバイス)およびミドルボックス(たとえば、ビットストリームを変更、変換、および/または場合によっては操作することができるデバイス)など、他の関係するデバイスに拡張され得る。
[0039] 図1Aに示されているように、ビデオコーディングシステム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを生成するソースデバイス12を含む。図1Aの例では、ソースデバイス12および宛先デバイス14は、別個のデバイスを構成する。ただし、ソースデバイス12および宛先デバイス14は、図1Bの例に示されているように、同じデバイス上にあるかまたはそれの一部であり得ることに留意されたい。
[0040] もう一度図1Aを参照すると、ソースデバイス12および宛先デバイス14は、それぞれ、デスクトップコンピュータ、ノートブック(たとえば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、車内コンピュータ、ビデオストリーミングデバイス、アイウェアおよび/またはウェアラブルコンピュータなど、エンティティ(たとえば、人間、動物、および/または別の被制御デバイス)によって(に)装着可能な(または着脱自在に取付け可能な)デバイス、エンティティ内で消費、摂取、または配置され得るデバイスまたは装置などを含む、広範囲にわたるデバイスのいずれかを備え得る。様々な実施形態では、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のために装備され得る。
[0041] 宛先デバイス14は、復号されるべき符号化ビデオデータをリンク(link)16を介して受信し得る。リンク16は、ソースデバイス12から宛先デバイス14に符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。図1Aの例では、リンク16は、ソースデバイス12が符号化ビデオデータをリアルタイムで宛先デバイス14に送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルまたは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス12から宛先デバイス14への通信を可能にするために有用であり得る任意の他の機器を含み得る。
[0042] 図1Aの例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。いくつかの場合には、出力インターフェース22は、変調器/復調器(モデム)および/または送信機を含み得る。ソースデバイス12において、ビデオソース18は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、図1Bの例に示されているように、いわゆる「カメラフォン」または「ビデオフォン」を形成し得る。ただし、本開示で説明される技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。
[0043] キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオデータは、ソースデバイス12の出力インターフェース22を介して宛先デバイス14に送信され得る。符号化ビデオデータは、さらに(または代替として)、復号および/または再生のための宛先デバイス14または他のデバイスによる後のアクセスのためにストレージデバイス31上に記憶され得る。図1Aおよび図1Bに示されているビデオエンコーダ20は、図2A示されているビデオエンコーダ20、または本明細書で説明される他のビデオエンコーダを備え得る。
[0044] 図1Aの例では、宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。いくつかの場合には、入力インターフェース28は受信機および/またはモデムを含み得る。宛先デバイス14の入力インターフェース28は、リンク16を介しておよび/またはストレージデバイス31から符号化ビデオデータを受信し得る。リンク16を介して通信された、またはストレージデバイス31上に与えられた符号化ビデオデータは、ビデオデータを復号する際に、ビデオデコーダ30などのビデオデコーダが使用するための、ビデオエンコーダ20によって生成された様々なシンタックス要素(syntax element)を含み得る。そのようなシンタックス要素は、通信媒体上で送信された、記憶媒体上に記憶された、またはファイルサーバ記憶された符号化ビデオデータに含まれ得る。図1Aおよび図1Bに示されているビデオデコーダ30は、図2Bに示されているビデオデコーダ30、または本明細書で説明される他のビデオデコーダを備え得る。
[0045] ディスプレイデバイス32は、宛先デバイス14と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先デバイス14は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス14はディスプレイデバイスであり得る。概して、ディスプレイデバイス32は、復号ビデオデータをユーザに表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
[0046] 関係する態様では、図1Bは例示的なビデオコーディングシステム10’を示し、ここにおいて、ソースデバイス12および宛先デバイス14はデバイス11上にあるかまたはそれの一部である。デバイス11は、「スマート」フォンなどの電話ハンドセットであり得る。デバイス11は、ソースデバイス12および宛先デバイス14と動作可能に通信している(随意に存在する)プロセッサ/コントローラデバイス13を含み得る。図1Bのビデオコーディングシステム10’およびそれの構成要素は、場合によっては図1Aのビデオコーディングシステム10およびそれの構成要素と同様である。
[0047] ビデオエンコーダ20およびビデオデコーダ30は、DSCなど、ビデオ圧縮規格に従って動作し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4,Part10,AVCと呼ばれるITU−T H.264規格、HEVCなど、他のプロプライエタリ(proprietary)規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例としては、MPEG−2およびITU−T H.263がある。
[0048] 図1Aおよび図1Bの例には示されていないが、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびデコーダと統合され得、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、いくつかの例では、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP:user datagram protocol)などの他のプロトコルに準拠し得る。
[0049] ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、ソフトウェアのための命令を好適な非一時的コンピュータ可読媒体に記憶し、本開示の技法を実施するために1つまたは複数のプロセッサを使用してハードウェアでその命令を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダの一部として統合され得る。
ビデオコーディングプロセス(Video Coding Process)
[0050] 上記で手短に述べられたように、ビデオエンコーダ20はビデオデータを符号化する。ビデオデータは1つまたは複数のピクチャを備え得る。ピクチャの各々は、ビデオの一部を形成する静止画像である。いくつかの事例では、ピクチャはビデオ「フレーム(frame)」と呼ばれることがある。ビデオエンコーダ20がビデオデータを符号化するとき、ビデオエンコーダ20はビットストリームを生成し得る。ビットストリームは、ビデオデータのコード化表現を形成するビットのシーケンスを含み得る。ビットストリームは、コード化ピクチャと関連データとを含み得る。コード化ピクチャはピクチャのコード化表現である。
[0051] ビットストリームを生成するために、ビデオエンコーダ20は、ビデオデータ中の各ピクチャに対して符号化演算を実施し得る。ビデオエンコーダ20がピクチャに対して符号化演算を実施するとき、ビデオエンコーダ20は、一連のコード化ピクチャと関連データとを生成し得る。関連データは、量子化パラメータ(QP)などのコーディングパラメータのセットを含み得る。コード化ピクチャを生成するために、ビデオエンコーダ20は、ピクチャを等しいサイズのビデオブロックに区分し得る。ビデオブロックはサンプルの2次元アレイであり得る。コーディングパラメータは、ビデオデータのあらゆるブロックについてコーディングオプション(たとえば、コーディングモード)を定義し得る。コーディングオプションは、所望のレートひずみ性能を達成するために選択され得る。
[0052] いくつかの例では、ビデオエンコーダ20はピクチャを複数のスライスに区分し得る。スライスの各々は、画像またはフレーム中の領域の残りからの情報なしに独立して復号され得る、画像(たとえば、フレーム)中の空間的に別個の領域を含み得る。各画像またはビデオフレームは単一のスライス中で符号化され得るか、あるいは各画像またはビデオフレームはいくつかのスライス中で符号化され得る。DSCでは、各スライスを符号化するために割り振られるターゲットビットは、実質的に一定であり得る。ピクチャに対して符号化演算を実施することの一部として、ビデオエンコーダ20は、ピクチャの各スライスに対して符号化演算を実施し得る。ビデオエンコーダ20がスライスに対して符号化演算を実施するとき、ビデオエンコーダ20は、スライスに関連付けられた符号化データを生成し得る。スライスに関連付けられた符号化データは「コード化スライス(coded slice)」と呼ばれることがある。
DSCビデオエンコーダ(DSC Video Encoder)
[0053] 図2Aは、本開示で説明される態様による技法を実装し得るビデオエンコーダ20の一例を示すブロック図である。ビデオエンコーダ20は、本開示の技法の一部または全部を実施するように構成され得る。いくつかの例では、本開示で説明される技法は、ビデオエンコーダ20の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ(図示せず)が、本開示で説明される技法の一部または全部を実施するように構成され得る。
[0054] 説明の目的で、本開示では、DSCコーディングのコンテキストにおいてビデオエンコーダ20について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。
[0055] 図2Aの例では、ビデオエンコーダ20は複数の機能構成要素を含む。ビデオエンコーダ20の機能構成要素は、色空間変換器(color-space converter)105と、バッファ110と、平坦度検出器(flatness detector)115と、レートコントローラ(rate controller)120と、予測器、量子化器、および再構成器構成要素(predictor, quantizer, and reconstructor component)125と、ラインバッファ130と、インデックスカラー履歴(indexed color history )135と、エントロピーエンコーダ(entropy encoder)140と、サブストリームマルチプレクサ(substream multiplexor)145と、レートバッファ(rate buffer)150とを含む。他の例では、ビデオエンコーダ20は、より多数の、より少数の、または異なる機能構成要素を含み得る。
[0056] 色空間変換器105は、入力色空間をコーディング実装形態において使用される色空間に変換し得る。たとえば、例示的な一実施形態では、入力ビデオデータの色空間は、赤、緑、および青(RGB)色空間中にあり、コーディングは、ルミナンスY、クロミナンスグリーンCg、およびクロミナンスオレンジCo(YCgCo)色空間において実装される。色空間変換は、ビデオデータへのシフトおよび追加を含む(1つまたは複数の)方法によって実施され得る。他の色空間中の入力ビデオデータが処理され得、他の色空間への変換も実施され得ることに留意されたい。
[0057] 関係する態様では、ビデオエンコーダ20は、バッファ110、ラインバッファ130、および/またはレートバッファ150を含み得る。たとえば、バッファ110は、色空間変換されたビデオデータを、ビデオエンコーダ20の他の部分によるそれの使用に先立って保持し得る。別の例では、色空間変換されたデータはより多くのビットを必要とし得るので、ビデオデータはRGB色空間中で記憶され得、色空間変換が必要に応じて実施され得る。
[0058] レートバッファ150はビデオエンコーダ20においてレート制御機構の一部として機能し得、このことは、レートコントローラ120に関して以下でより詳細に説明される。各ブロックを符号化することに費やされるビットは、大いに、実質的に、ブロックの性質に基づいて変動することがある。レートバッファ150は、圧縮されたビデオにおけるレート変動を平滑化することができる。いくつかの実施形態では、ビットが固定ビットレート(CBR:constant bit rate)でバッファから取り出されるCBRバッファモデルが採用される。CBRバッファモデルでは、ビデオエンコーダ20がビットストリームにあまりに多くのビットを加えた場合、レートバッファ150はオーバーフローし得る。一方、ビデオエンコーダ20は、レートバッファ150のアンダーフローを防ぐために、十分なビットを加えなければならない。
[0059] ビデオデコーダ側では、ビットは、固定ビットレートでビデオデコーダ30のレートバッファ155(以下でさらに詳細に説明される図2Bを参照)に加えられ得、ビデオデコーダ30は、各ブロックについて可変数のビットを削除し得る。適切な復号を保証するために、ビデオデコーダ30のレートバッファ155は、圧縮されたビットストリームの復号中に「アンダーフロー(underflow)」または「オーバーフロー(overflow)」すべきでない。
[0060] いくつかの実施形態では、バッファフルネス(BF:buffer fullness)は、バッファに現在あるビットの数を表す値BufferCurrentSizeと、レートバッファ150のサイズ、すなわち、任意の時点においてレートバッファ150に記憶され得るビットの最大数を表すBufferMaxSizeとに基づいて定義され得る。BFは次のように計算され得る。
[0061] 平坦度検出器115は、ビデオデータ中の複雑な(すなわち、平坦でない)エリアからビデオデータ中の平坦な(すなわち、単純なまたは均一な)エリアへの変化を検出することができる。「複雑な(complex)」および「平坦な(flat)」という用語は、本明細書では、概して、ビデオエンコーダ20がビデオデータのそれぞれの領域を符号化することの困難さを指すために使用される。したがって、本明細書で使用される複雑なという用語は、概して、ビデオデータの領域が、ビデオエンコーダ20が符号化することが複雑であることを表し、たとえば、テクスチャードビデオデータ、高い空間周波数、および/または符号化することが複雑である他の特徴を含み得る。本明細書で使用される平坦なという用語は、概して、ビデオデータの領域が、ビデオエンコーダ20がエンコーダすることが単純であることを表し、たとえば、ビデオデータ中の滑らかな勾配、低い空間周波数、および/または符号化することが単純である他の特徴を含み得る。複雑な領域と平坦な領域との間の遷移が、符号化ビデオデータ中の量子化アーティファクト(quantization artifact)を低減するために、ビデオエンコーダ20によって使用され得る。詳細には、レートコントローラ120、ならびに予測器、量子化器、および再構成器構成要素125は、複雑な領域から平坦な領域への遷移が識別されたとき、そのような量子化アーティファクトを低減することができる。
[0062] レートコントローラ120は、コーディングパラメータのセット、たとえば、QPを決定する。QPは、レートバッファ150がオーバーフローまたはアンダーフローしないことを保証するターゲットビットレート(target bitrate)についてピクチャ品質を最大にするために、レートバッファ150のバッファフルネスとビデオデータの画像アクティビティとに基づいて、レートコントローラ120によって調整され得る。レートコントローラ120はまた、最適レートひずみ性能(optimal rate-distortion performance)を達成するために、ビデオデータの各ブロックについて特定のコーディングオプション(たとえば、特定のモード)を選択する。レートコントローラ120は、再構成された画像のひずみ(distortion)を、それがビットレート制約を満たすように、すなわち、全体的実コーディングレートがターゲットビットレート内に収まるように最小限に抑える。
[0063] 予測器、量子化器、および再構成器構成要素125は、ビデオエンコーダ20の少なくとも3つの符号化演算を実施し得る。予測器、量子化器、および再構成器構成要素125は、いくつかの異なるモードで予測を実施し得る。1つの例示的なプレディケーションモード(predication mode)は、メディアン適応予測(median-adaptive prediction)の変更バージョンである。メディアン適応予測はロスレスJPEG規格(JPEG−LS)によって実装され得る。予測器、量子化器、および再構成器構成要素125によって実施され得るメディアン適応予測の変更バージョンは、3つの連続するサンプル値の並列予測を可能にし得る。別の例示的な予測モードはブロック予測(block prediction)である。ブロック予測では、サンプルは、上のライン中の、または同じライン中の左側の前に再構成されたピクセルから予測される。いくつかの実施形態では、ビデオエンコーダ20およびビデオデコーダ30は、両方とも、ブロック予測使用を決定するために、再構成されたピクセルに対して同じ探索を実施し得、したがって、ビットはブロック予測モードで送られる必要がない。他の実施形態では、ビデオエンコーダ20は、探索を実施し、ビットストリーム中でブロック予測ベクトルをシグナリングし得、したがって、ビデオデコーダ30は、別個の探索を実施する必要がない。成分範囲の中点を使用してサンプルが予測される中点予測モード(midpoint prediction mode)も実装され得る。中点予測モードは、ワーストケースサンプルにおいてさえも、圧縮されたビデオに必要なビットの数の制限を可能にし得る。予測器、量子化器、および再構成器構成要素125は、本開示の方法および技法を実施することによってビデオデータのブロック(または予測の他のユニット)を予測(たとえば、符号化または復号)するように構成され得る。
[0064] 予測器、量子化器、および再構成器構成要素125はまた、量子化を実施する。たとえば、量子化は、シフタを使用して実装され得る2のべき乗量子化器(power-of-2 quantizer)を介して実施され得る。2のべき乗量子化器の代わりに他の量子化技法が実装され得ることに留意されたい。予測器、量子化器、および再構成器構成要素125によって実施される量子化は、レートコントローラ120によって決定されたQPに基づき得る。最終的に、予測器、量子化器、および再構成器構成要素125はまた、予測値に逆量子化残差(inverse quantized residual)を加算することと、結果がサンプル値の有効範囲の外側にないことを保証することとを含む再構成を実施する。
[0065] 予測器、量子化器、および再構成器構成要素125によって実施される予測、量子化、および再構成に対する上記で説明された例示的な手法は、例示的なものにすぎず、他の手法が実装され得ることに留意されたい。また、予測器、量子化器、および再構成器構成要素125は、予測、量子化、および/または再構成を実施するための(1つまたは複数の)副構成要素を含み得ることに留意されたい。さらに、予測、量子化、および/または再構成は、予測器、量子化器、および再構成器構成要素125の代わりにいくつかの別個のエンコーダ構成要素によって実施され得ることに留意されたい。
[0066] ラインバッファ130は、予測器、量子化器、および再構成器構成要素125ならびにインデックスカラー履歴135が、バッファされたビデオデータを使用することができるように、予測器、量子化器、および再構成器構成要素125からの出力を保持する。インデックスカラー履歴135は、最近使用されたピクセル値を記憶する。これらの最近使用されたピクセル値は、専用シンタックスを介してビデオエンコーダ20によって直接参照され得る。
[0067] エントロピーエンコーダ140は、インデックスカラー履歴135と、平坦度検出器115によって識別された平坦度遷移とに基づいて、予測器、量子化器、および再構成器構成要素125から受信された予測残差および他のデータ(たとえば、予測器、量子化器、および再構成器構成要素125によって識別されたインデックス)を符号化する。いくつかの例では、エントロピーエンコーダ140は、サブストリームエンコーダ(substream encoder)ごとにクロックごとに3つのサンプルを符号化し得る。サブストリームマルチプレクサ145は、ヘッダレスパケット多重化方式(headerless packet multiplexing scheme)に基づいてビットストリームを多重化し得る。これは、ビデオデコーダ30が並列に3つのエントロピーデコーダ(entropy decoder)を動作させることを可能にし、クロックごとの3つのピクセルの復号を可能にする。サブストリームマルチプレクサ145は、パケットがビデオデコーダ30によって効率的に復号され得るようにパケット順序を最適化し得る。クロックごとの2のべき乗個のピクセル(たとえば、2ピクセル/クロックまたは4ピクセル/クロック)の復号を可能にし得る、エントロピーコーディングに対する異なる手法が実装され得ることに留意されたい。
DSCビデオデコーダ(DSC Video Decoder)
[0068] 図2Bは、本開示で説明される態様による技法を実装し得るビデオデコーダ30の一例を示すブロック図である。ビデオデコーダ30は、本開示の技法の一部または全部を実施するように構成され得る。いくつかの例では、本開示で説明される技法は、ビデオデコーダ30の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ(図示せず)が、本開示で説明される技法の一部または全部を実施するように構成され得る。
[0069] 説明の目的で、本開示では、DSCコーディングのコンテキストにおいてビデオデコーダ30について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。
[0070] 図2Bの例では、ビデオデコーダ30は複数の機能構成要素を含む。ビデオデコーダ30の機能構成要素は、レートバッファ155と、サブストリームデマルチプレクサ(substream demultiplexor)160と、エントロピーデコーダ(entropy decoder)165と、レートコントローラ170と、予測器、量子化器、および再構成器構成要素175と、インデックスカラー履歴180と、ラインバッファ185と、色空間変換器190とを含む。ビデオデコーダ30の図示された構成要素は、図2A中のビデオエンコーダ20に関して上記で説明された対応する構成要素に類似する。したがって、ビデオデコーダ30の構成要素の各々は、上記で説明されたビデオエンコーダ20の対応する構成要素と同様の様式で動作し得る。
量子化パラメータ(QP:Quantization Parameter)
[0071] 上記で説明されたように、ビデオコーディングは、たとえば、予測器、量子化器、および再構成器構成要素125を介した、ビデオデータの量子化を含み得る。量子化は信号にロス(loss)をもたらし得、ロスの量は、レートコントローラ120によって決定されたQPによって制御され得る。各QPについての量子化ステップサイズ(quantization step size)を記憶するのではなく、スケーリング行列(scaling matrix)がQPの関数として指定され得る。各QPについての量子化ステップサイズはスケーリング行列から導出され得、導出された値は必ずしも2のべき乗であるとは限らず、すなわち、導出された値は2のべき乗でないこともある。
DSCにおけるスライス(Slices in DSC)
[0072] 上述のように、スライスは、概して、画像またはフレーム中の領域の残りからの情報を使用することなしに独立して復号され得る、画像またはフレーム中の空間的に別個の領域を指す。各画像またはビデオフレームは単一のスライス中で符号化され得るか、あるいは各画像またはビデオフレームはいくつかのスライス中で符号化され得る。DSCでは、各スライスを符号化するために割り振られるターゲットビットは、実質的に一定であり得る。これは部分スライスについて異なり得、これは、画像高さがスライス高さで割り切れない場合に起こることがある。たとえば、108のスライス高さをもつサイズ1280×720の画像は、高さ108の6つのスライスと高さ72(=720−(6*108))の1つの部分スライスとを有する。
[0073] アドバンストDSCスライス寸法は、変数またはパラメータスライス幅×スライス高さを使用して指定され得、ここで、スライス幅およびスライス高さは構成可能である。スライス高さは所望の値、たとえば、16、32、108などに構成され得る。スライス幅は、ライン中のスライスの数を決定する、パラメータNを使用して構成され得、各スライス中のラインごとのピクセルの数が等しい、たとえば、スライス幅=画像幅/Nであると仮定される。画像幅は画像の幅を表す変数またはパラメータであり得る。
レート制御パラメータのための固定小数点近似(Fixed-Point Approximation for Rate Control Parameters)
[0074] ディスプレイストリーム圧縮v1.x規格は、3:1の平均圧縮比をサポートし、VESAによって最近確定され、批准された。しかしながら、ディスプレイ解像度が、物理伝送プロトコルがそれらをサポートすることができるよりも速く増加しているので、DSC v1.xは、多くのタイプのコンテンツ(たとえば、10bppにおける4Kビデオ、120Hzにおける4Kビデオ、および任意のビット深度またはリフレッシュレートにおける8Kビデオ)に不適当であり得る。そのような使用事例をサポートするために、少なくとも4:1の平均圧縮レートをもつ視覚的ロスレスコーデックが提供され得る。いくつかの実施形態では、コーデックは、アドバンストDSCコーデック(「ADSC」)と呼ばれることがある。
[0075] いくつかの態様によれば、提案されるDSCコーデックはブロックベースであり、各々が異なるタイプのコンテンツを圧縮することを目的とされる、多数のコーディングモードを含む。モード選択は、モードのレートとひずみの両方を考慮することによって各ブロックのための最良のモードを選択することを目的とするレート制御機構によって扱われ得る。レート制御機構はHRDバッファモデルによってサポートされ得、前記バッファがアンダーフロー(たとえば、バッファ中で0ビットよりも少ない)またはオーバーフロー(たとえば、バッファサイズが、設定された最大サイズを超えて増加した)の状態に決してならないことが、コーデックの設計要件であり得る。
[0076] DSCでは、バッファフルネス、およびバッファフルネスに基づくラムダ値など、いくつかのレート制御パラメータが、1つまたは複数の除算または除算演算を使用して決定され得る。除算または除算演算は、除算演算子(たとえば、「/」)を伴う演算を指すことがある。しかしながら、除算演算の使用は、ハードウェア実装における複雑さおよび困難(たとえば、任意の数による除算を伴う除算演算など)をもたらし得る。また、込み入った関数または算出の使用は、ハードウェア実装における複雑さおよび困難をもたらすことがある。
[0077] これらおよび他の課題に対処するために、本開示で説明される技法は、様々なレート制御パラメータを決定または計算する際の除算演算および他の複雑な算出の使用をなくすかまたは低減することができる。たとえば、本技法は、固定小数点近似を使用して様々なレート制御パラメータを決定または計算することができる。レート制御パラメータの例としては、限定はしないが、ターゲットレート、平坦度QP、バッファフルネス、ビットレートについてのラムダ値、バッファフルネスについてのラムダ値などがあり得る。ラムダ値は、ラグランジュ(Lagrangian)パラメータまたはラグランジュ(lagrangrian)パラメータと呼ばれることもある。固定小数点近似を使用することによって、本技法は、レート制御パラメータを計算する際の除算演算および/または他の複雑な演算の使用を低減するかまたはなくすことができ、これは、ハードウェア実装の複雑さおよびコストを低減することができる。たとえば、多くの値が事前算出(precompute)され得、演算を簡略化するために乗算、加算、およびビットシフティング(bit shifting)のみが使用され得る。また、演算を簡略化するためにルックアップテーブル(LUT:lookup table)が使用され得る。本明細書で使用されるLUTという用語は、事前算出された値を記憶するために使用され得る任意のタイプのデータ構造を指すために使用され得る。いくつかの態様に関係する詳細が以下で与えられる。
[0078] 関係する態様では、低コスト、固定レート視覚的ロスレス圧縮を与えるDSCコーダが本明細書で開示される。コーダは、(たとえば、ブロックサイズP×Qを用いた)ブロックベースの手法に基づいて設計され、多数のコーディングモードのうちの1つまたは複数を用いて実装され得る。たとえば、各ブロックのための利用可能なコーディングオプションは、変換モード(たとえば、DCT、アダマール)、ブロック予測モード、差分パルスコード変調(DPCM:differential pulse-code modulation)モード、パターンモード、中点予測(MPP:mid-point prediction)モード、および/または中点プレディケーションフォールバック(MPPF:mid-point predication fall back)モードを含む。いくつかのコーディングモードが、異なるタイプのコンテンツまたは画像を圧縮するためにコーダにおいて使用され得る。たとえば、テキスト画像はパターンモードを介して圧縮され得、自然画像は変換モードを介してキャプチャされ得る。
[0079] さらなる関係する態様では、コーディングモードは、候補モードのレートとひずみの両方を考慮することによって、各ブロックのための(1つまたは複数の)最適なモードを選択するためのレート制御技法に基づいて、複数の候補コーディングモードの中から各ブロックのために選択され、利用され得る。レート制御技法は、バッファモデルを利用することを伴い得、コーデックの設計考慮事項は、バッファがアンダーフロー(たとえば、バッファ中で0ビットよりも少ない)またはオーバーフロー(たとえば、バッファサイズが、設定/定義された最大サイズを超えて増加した)の状態にないことを確実にすることを含み得る。
バッファフルネス計算(Buffer Fullness Calculation)
[0080] その全体が参照により本明細書に組み込まれる、2015年8月6日に出願された米国特許出願第14/820,404号(代理人整理番号:QVID.260A/146525)では、バッファフルネス(BF)を計算するための方法が開示された。特に、いくつかの態様によれば、BufferCurrentSize=maxBufferBitsAtSliceEndである場合、スライスの終わりに、BFが100%になるように、BFは、スライス中のある固定数のブロックをコーディングした後に一定のレートにおいて線形的に減少され、ここで、maxBufferBitsAtSliceEndは、スライスの終わりにレートバッファ中に含まれていることがある最大ビット数(maximum number of bits)を示す。より正確に、BFは次のように計算される。
ここで、
ここで、numBlocksCodedはスライス中のここまでコーディングされたブロックの数を表し、numBlocksThは構成可能であるしきい値パラメータである。バッファがブロックごとに線形的に調整されるレートは、次のように計算される。
バッファフルネスに基づくラムダ(Lambda Based on Buffer Fullness)
[0081] レートとひずみ(rate and distortion)とを組み合わせるコスト関数(cost function)を算出するために(ラムダまたはラムダ値とも呼ばれる)ラグランジュパラメータが使用され得る。たとえば、
[0082] ラグランジュパラメータの値は、ひずみとレートとの間のトレードオフが、異なる領域について異なり得るので、コーデックの状態(たとえば、バッファフルネス値)に基づいて調整され得る。たとえば、レートバッファがよりフルである(高いバッファフルネス)ほど、バッファが、コーディングするのにより費用がかかるブロックを収容することが可能でないことがあるので、固有モードのレートはよりペナルティを課され得る。いくつかの実施形態では、ラグランジアンはまた、ブロックのビットレートの関数(たとえば、ブロックのビットレートの関数として増加するペナルティ)であり得る。
[0083] その全体が参照により本明細書に組み込まれる、2015年4月13日に出願された米国特許出願第14/685,453号(代理人整理番号:QVID.222A/144569)では、バッファフルネスに基づくラムダまたはラグランジュ値が、以下の式に基づいて計算され得る。
ここで、{Λ,a1,b1,c1,d1}は同調可能なパラメータ(tunable parameter)である。x∈[0,1]であり、xは
として計算され、ここで、BFはここでは割合、たとえば、バッファ中で占有されるビットの割合として表される。しかしながら、この式は、それが除算を必要とするので、ハードウェアで容易に実装可能でない。
固定小数点近似(Fixed-Point Approximation)
[0084] 上記の項(たとえば、バッファフルネスBF、ラムダなど)を高精度に計算するために使用されるソフトウェアアルゴリズムが浮動小数点演算(floating point arithmetic)を使用するが、そのようなタイプの計算は、ハードウェアおよびASICベースの設計上で実装することがより困難であり得る。いくつかの態様によれば、本開示の技法は、ADSCコーデックのハードウェア実装コストを減少させるものである。上記で説明されたように、形式a/bの任意の除算、または
のような込み入った関数を算出することは、困難であり、概して浮動小数点演算を必要とする。これらおよび他の課題に対処するために、本技法は、そのような算出を、除算関数、ルート関数、および/または他の潜在的に込み入った浮動小数点関数の算出を必要とすることなしに、ハードウェアで容易に算出され得る固定小数点近似と入れ替えることができる。
[0085] 一例では、本技法は、以下のように、ADSCコーデックにおける5つの固定小数点アルゴリズム変更を与えることができる。
・ターゲットレート:この量が計算される方法への変更
・平坦度QP:この量が計算される方法への変更
・バッファフルネス:この量が計算される方法への変更
・λbitrate:λ値を事前算出し、ルックアップテーブル(LUT)に記憶する
・λBF:固定小数点近似を使用してλを算出する
[0086] 別の例では、2つのλ関数を算出する方法は切り替えられ得る。たとえば、λBFを取得するためにはLUTが使用され得、λbitrateのためには固定小数点近似が使用され得る。第1の例では、λBFはブロックごとに1回のみ算出され得るが、λbitrateは、各モードについてブロックごとに1回(たとえば、ADSCにおいて現在サポートされているモードを使用して、ブロックごとに6回)算出され得るので、LUTが使用されるλbitrateである。したがって、より多くのストレージと引き換えにわずかにより少ない合計算術(たとえば、より少ない演算)を必要とすることができるLUT手法は、より適切であり得る。一方、λBFはより低い頻度で算出されるので、λBFのためにより多くの演算が与えられるかまたは使用され得る。
ターゲットレート(Target Rate)
[0087] いくつかの実施形態では、ターゲットレートは、以下で説明されるように固定小数点近似を使用して決定され得る。以前は、ターゲットレートは、以下で示される浮動小数点比を使用して計算され、ここで#bitsはスライス中に残っているビット数であり、#pxはスライス中に残っているピクセルの数である。計算された浮動小数点比を使用すると、スライス中に残っているビットは、スライス中に残っているブロック/ピクセルにわたって一様に分散され得る。ターゲットレートがピクセルごとではなくブロックごと(たとえば、16ピクセル/ブロック)に算出されるので、16のファクタが使用されるが、他の実施形態では、各ブロックが16以外のピクセルの数を有し得ることを理解されたい。
[0088] しかしながら、これは2つの大きい整数間の浮動小数点計算(floating point calculation)を伴う。さらに、スライス内のピクセルが処理されるにつれてスライス中に残っているピクセルの数を示す#pxが変化するので、計算を事前算出することは実行不可能であり得る。
[0089] そのような浮動小数点計算を回避するために、計算は固定小数点除算器実装形態を使用し得、それはTR0として示され得る。さらに、固定小数点ターゲットレート近似TR0が決定された後に、バッファフルネスの現在状態に基づいてターゲットレート近似TR0を調整するために2次LUTが使用され得る。
[0090] 固定小数点近似は、「Integer Division Using Reciprocals」、Robert Alverson、コンピュータ算術に関する第10回シンポジウムの議事録、186〜190ページ、1991年に記載されているのと同様の方法でTR0について算出され得る。以下のパラメータが与えられる。
・B0:スライスに割り振られた合計ビット
・P0:スライス中の合計ピクセル
・n0:LUTのグラニュラリティ(granularity)を定義するために使用されるビット
・n1:LUTエントリが追加の精度のn1ビットを用いて記憶される
[0091] いくつかの実施形態では、TR0を計算するためのアルゴリズムは以下の通りであり得る。
1.スケーリングファクタNを事前算出し、パラメータのコーデックのリストに記憶する。以下で示されるように、スケーリングファクタNは、スライスP0中のピクセルの合計数に基づき得る。
スライス(P0)中のピクセルの合計数が、知られている一定値であるので、スケーリングファクタNはまた、ランタイムより前に事前算出され、記憶され得る一定値である。
2.
=1<<(n0−1)個のエントリを使用して逆関数
についてのLUT(LUTreciprocal)を事前算出し、ここにおいて、pは、スライスP中に残っているビット数のスケーリングされたバージョンに対応し得る。このLUTは精度のn1ビットを使用して記憶され、したがって、各エントリは比
を実際に与えている。いくつかの実施形態では、LUTreciprocalは、p値の特定の範囲(たとえば、1/2から1の間のp値)についてのpの逆数値を備え得る。たとえば、n1は、LUTreciprocalへの入力が常に1/2から1の間にあるように構成され得る。図3は、n1およびn0が両方とも6の値を有する(1<<n1が64である)、逆関数のグラフを示す。
3.TR0を算出するとき、スライスのピクセルがコーディングされるにつれて、スケーリングファクタNの値は、あるしきい値間隔において減分され得る。Nが減分されることになる次のしきい値は、次のように算出され得る。
4.各ブロック時間において、コーデックの現在状態(Bはスライス中に残っているビット数であり、Pはスライス中に残っているピクセルの数である)が与えられればターゲットレートは、以下のように算出され得る。
a.第1に、スケーリングファクタを更新する。
上記のように、スライス中のビットが処理されるにつれて、残りのビットの数Pがしきい値τを下回り下がるとき、スケーリングファクタNは減分される。さらに、しきい値τは、減分されたスケーリングファクタNに基づいて新しい、より低い値に更新され得る。その後、残りのビットの数Pが再びしきい値τに到達したとき、スケーリングファクタNおよびしきい値τは再び更新され得る。
b.以下のようにターゲットレートを計算する。
[0092] たとえば、特定の実施形態では、スライス中に残っている合計ビットはB=1244160であり得、スライス中に残っているピクセルの数はP=207360である。したがって、事前算出されたスケーリングファクタNは、
として計算され得る。
[0093] 逆LUTのグラニュラリティを記述するために使用されるビット数(n0)と、LUTエントリが(n1)として記憶される追加の精度のビット数とは、両方とも6であり得る。したがって、LUTは、(シフトの後に0〜31になり得る)範囲32〜63の値について定義され得る。たとえば、以下で示されているように、pシフトは19の値を有し、それは、LUTに入力されたとき、LUT[19]=80の値をもたらす。これは
に対応する。したがって、LUTは、6ビット精度を用いて1/x(ここでx=0.8)についてのスケーリングされた値を決定することが可能である。
[0094] したがって、ターゲットレートは、次のように計算され得る。
[0095] 初期ターゲットレートTR0が近似されると、各ブロックについてのターゲットレートは、バッファフルネスの現在状態に基づく調整ファクタを加算することによって計算される。たとえば、バッファがほぼ空である場合、ターゲットレートは増加されるべきであり、バッファがほぼフルである場合、ターゲットレートは減少されるべきである。
[0096] バッファフルネス値BFを調整値(adjustment value)δ(BF)に関連付けた調整LUT(δ(BF))が事前算出され、記憶され得る。調整LUTは、多くのコーデックパラメータ、たとえば、ビットレート、スライスサイズ、色空間、クロマフォーマットなどに基づいて同調または調整され得る。概して、m0の精度を使用する、および
個のエントリを有する調整LUTを記憶することが好ましい。(以下でさらに説明される)m1ビットを使用してバッファフルネスが記憶され得るので、正しい調整LUTエントリは、(たとえば、丸めを用いて)必要とされるビット数だけバッファフルネスを下にシフトすることによって取得され得る。たとえば、
[0097] これらの2つの項(初期ターゲットレートTR0および調整値δ(BF))は、ターゲットレートに固定小数点近似を与えるために組み合わせられ得る。
[0098] 上記で説明されたように、固定小数点ターゲットレートは、ハードウェアで効率的に実装され得る完全に固定小数点算術(fixed point arithmetic)を使用して計算され得る。たとえば、ターゲットレートを決定するために必要とされる計算は、除算または指数関数なしに、加算と、減算と、ビットシフティングと、LUTルックアップとを含み得る。
[0099] いくつかの場合には、場合によってはコーディングするのにコストがかかるかまたは費用がかかり得るブロックに追加のレートを割り振ることが望ましい。たとえば、スライス中の第1のライン内のブロックは、予測のために使用され得る利用可能な垂直ネイバー(vertical neighbor)を有しないことにより、コーディングするのにより費用がかかり得る。したがって、これらのブロックについてのコーディング効率が低減され、より高い予想されるレート要件(rate requirement)を生じ得る。この場合、各ブロックについてのレートは、調整値δを上方に固定することによって調整され得る。一例として、公称ターゲットレートが96ビット/ブロックであると仮定する。FLS(スライスの第1のライン(First Line of Slice))内のブロックを192ビット/ブロックに増加させるために、δ=96のオフセットがFLSのみのために使用され得る。このオフセットの後に、NFLS(スライスの非第1のライン(Non-First Line of Slice))内のブロックについて、ターゲットレートは、TR0+δ(BF)として算出されることに戻り得る。
[0100] 別の実施形態では、ターゲットレートは、FLSとバッファフルネスの両方を考慮に入れ得る。たとえば、
[0101] 図4は、いくつかの実施形態による、固定小数点近似を使用してブロックについてのターゲットレートを決定するための方法のフローチャートを示す。ブロック302において、スケーリングファクタが事前算出され、記憶される。スケーリングファクタは定数Nに対応し得る。いくつかの実施形態では、スケーリングファクタは、スケーリングファクタが減分され得る、スライス中に残っているピクセルの数に対応するしきい値を決定するために使用され得る。
[0102] ブロック404において、逆数を計算するためのLUTが事前算出され、記憶され得る。いくつかの実施形態では、LUTは、予想される値の範囲にわたって(たとえば、1/2から1の間で)精度のn1ビットを使用して記憶され得る。いくつかの実施形態では、ブロック402およびブロック404は、ビデオデータをコーディングするより前に実施され得る事前算出ステップに対応し得る。たとえば、スケーリングファクタNおよび逆LUTは、パラメータのビデオコーデック(video codec)のリストに記憶され得る。
[0103] コーディング中に、スライスの各ブロックについてターゲット値が計算され得る。ブロック406において、コーディングされるべきスライス中に残っているピクセルの数がしきい値よりも小さいかどうかに関する決定が行われ得る。しきい値は、スケーリングファクタN(たとえば、Nに基づくビットシフト)に基づいて決定され得る。
[0104] スライス中の残りのピクセルがしきい値よりも小さい場合、ブロック408において、スケーリングファクタNは更新され得る。いくつかの実施形態では、スケーリングファクタは減分され得る。さらに、更新されたスケーリングファクタに基づいて新しいしきい値が決定され得る。
[0105] ブロック410において、スケーリングファクタNおよび逆LUTを使用して、固定小数点近似を使用してブロックについてのターゲットレートが推定される。いくつかの実施形態では、推定されたターゲットレートはさらに、バッファフルネスのレベルに基づく調整値δ(BF)に基づいて変更され得る。たとえば、バッファフルネスが高い場合、ターゲットレートは低減され得る。一方、バッファフルネスが低い場合、ターゲットレートは増加され得る。いくつかの実施形態では、ターゲット値はさらに、現在ブロックがスライスのブロックの第1のラインの一部であるかどうかに基づいて調整され得る。いくつかの実施形態では、ブロック406〜ブロック410は、スライスの各ブロックについて繰り返され得る。
[0106] したがって、1つまたは複数の定数(たとえば、スケーリングファクタN)および/またはLUTを使用する1つまたは複数の関数(たとえば、逆LUT)を事前算出し、記憶することによって、ターゲットレートなどのパラメータは、除算および指数関数などの複雑な計算を回避することによってそのような計算がハードウェアでより容易に実施されることを可能にする固定小数点近似を使用して計算され得る。
バッファフルネスの関数としての平坦度QP(Flatness QP as a function of buffer fullness)
[0107] 前のセクションにおいて上記で説明されたように、ターゲットレート(δ(BF))についての調整LUTは、バッファフルネスの関数としてコーデックのブロックごとターゲットレートの調整に対応する。この技法を使用すると、ターゲットレートは、レートバッファがほぼフルであるときにより低くなり得、レートバッファがほぼ空であるときにより高くなり得る。
[0108] 同じまたは同様の様式では、本技法は、バッファフルネスの関数としての平坦度QPを調整することができる。いくつかの実施形態では、平坦度QPは、たとえば、様々な複雑さの領域間の(たとえば、複雑な領域から平坦な領域への遷移、平坦な領域から複雑な領域への遷移など)、平坦度検出に基づいてエンフォース(enforce)されるQP値を指し得る。たとえば、平坦度QPは、その全体が参照により本明細書に組み込まれる、2015年4月13日に出願された米国特許出願第14/685,479号(代理人整理番号:QVID.221A/144568)に記載されているQPまたは平坦度QPと同様または同じであり得、概略的なQP調整方式は、その全体が参照により本明細書に組み込まれる、2015年4月13日に出願された米国仮出願第62/146,898号(代理人整理番号:QVID.270PR1/153027P1)において説明されたQP調整方式と同様または同じであり得る。
[0109] 特に、平坦な領域から複雑な領域へまたは複雑な領域から平坦な領域へ遷移するとき、QPは、視覚的アーティファクト(visual artifact)がそのような境界において見えないように調整され得る。しかしながら、コーデックがそれに変更されるQPはバッファフルネスに依存し得る。たとえば、極めて困難なまたは複雑な領域では、レートバッファがより負担を課された状態にあるので、適度のQP値が使用される必要があり得る。いくつかの態様によれば、平坦から複雑へのまたはその逆の遷移において(1つまたは複数の)視覚的アーティファクトがもたらされないように、適度のQP値が選択され得ることに留意することが重要である。一方、レートバッファがほぼ空である場合、より高いレートという犠牲を払ってひずみを最小限に抑えるために極めて低いQPが使用され得る。バッファフルネス値をQP調整値に関連付けるLUTflatnessQPが事前算出され、記憶され得る。
[0110] 上記のδ(BF)と同様の様式で、バッファフルネスは、(m1−m0)ビットだけ下にシフトされ得、ここで、m1はバッファフルネスのためのビット数であり、m0は、平坦度QP調整LUTを定義するために使用されるビット数である。LUT m0のビット数およびLUT中に含まれている値は、コーデックの構成に応じて同調または調整され得る。たとえば、それらは、圧縮ビットレート、RGB/YCbCr入力、クロマサブサンプリングなど、ファクタに応じて変更され得る。この様式で、平坦度QPは、固定小数点近似を使用して決定され得る。
[0111] 図5は、いくつかの実施形態による、固定小数点近似を使用してブロックについての平坦度QPを決定するための方法のフローチャートを示す。ブロック502において、バッファフルネス値をQP調整値に関連付けたLUTまたは他のデータ構造が事前算出され、記憶される。ブロック504において、スライスの特定のブロックのためのコーディング時間中に、ブロックが平坦な領域と複雑な領域との間の遷移を含んでいるかどうかに関する決定が行われる。いくつかの実施形態では、決定は、ブロックに関連付けられた複雑さ値を決定し、決定された複雑さ値を1つまたは複数のしきい値と比較することによって行われ得る。いくつかの実施形態では、1つまたは複数の隣接ブロックの複雑さ値も考慮され得る。遷移がブロック内に存在しないと決定された場合、ブロックのQP値は、平坦度QP調整値に設定される代わりに、通常に設定され得る。プロセスは次いで、コーディングされるべきビデオデータの後続のブロックのためにブロック504に戻り得る。
[0112] 一方、遷移がブロック内に存在すると決定された場合、平坦度QP調整が決定される必要があり得る。ブロック506において、現在のバッファフルネス値は、バッファフルネスのために使用されるビット数とQP調整値を定義するために使用されるビット数とに基づいてシフトされる。ブロック506において、QP調整値は、事前算出されたLUTとシフトされたバッファフルネス値とを使用して決定される。さらに、QP調整値は、0から、QP調整値を定義するために使用されるビット数の最大値の間でクリッピングされ得る。
[0113] ブロック510において、ブロックに関連付けられたQP値は、決定されたQP調整値に設定され得る。プロセスは次いで、コーディングされるべきビデオデータの後続のブロックのためにブロック504に戻り得る。
[0114] 図5は、平坦度QP調整値を決定する前にブロックが遷移を含んでいるかどうかを決定することを示すが、他の実施形態では、平坦度QP調整値は、ブロックの複雑さを分析する前に決定され得ることを理解されたい。
バッファフルネス(Buffer Fullness)
[0115] 上記の式(1)に基づいて計算されるバッファフルネスは、それが除算演算を必要とするので、ハードウェアで容易に実装可能でない。特に、式(1)における分母値、bufAdjSizeは、スライス中のブロックの位置に応じて値が変化する。したがって、バッファフルネスを算出するために除算値を事前算出することは、実行不可能であり得る。たとえば、図6は、スライスのブロックがコーディングされるとき、bufAdjSizeがどのように変化し得るかを示す。たとえば、numBlocksThしきい値までのブロックの数について、bufAdjSizeは、BufferMaxSizeと同じであり得る(たとえば、オフセット=0)。しかしながら、しきい値数のブロックがコーディングされた後に、bufAdjSizeは、追加のブロックがコーディングされるにつれて、減少し得る。
[0116] ハードウェアでバッファフルネスを容易に計算するために、オフセット値は、分母から分子に移動され得、したがって、分母bufferAdjSizeが、スライス全体にわたって一定であるBufferMaxSizeになる。たとえば、式(1)は、次のように変更される。
[0117] 式(3)におけるオフセット値は、式(1)に関して上記で説明されたのと同じ方法で計算される。一代替形態では、式(3)の分子における(BufferMaxSize>>1)は省略され得る。式(3)に基づいてバッファフルネスを計算するための変更された方法は、スライスの終わりにBufferCurrentSize=maxBufferBitsAtSliceEndであるとき、100%のバッファフルネスを生じる。
[0118] 式(3)は式(1)と等価でないが、式(3)を用いて計算されたBFの一般的な挙動が、スライス内の異なるブロックについての式(1)の挙動とほとんど同様であることを理解されたい。
[0119] 式(3)における分母がスライス全体にわたって一定値であり得るので、バッファフルネスBFは固定小数点近似を使用して計算され得る。[0107]
たとえば、式(3)についての固定小数点近似が、以下の式(4)の場合のように決定され得る。一定値BufferMaxSizeに基づくファクタaが事前算出され、たとえば、コーデックのピクチャパラメータセット(PPS:picture parameter set)に記憶され得る。
[0120] 以下のパラメータのセットが与えられる。
・BfRangeBits:バッファフルネスを表すために使用されるビット数
・BfScaleBits:バッファフルネスを計算するための精度
[0121] 0〜(2^BfRangeBits)−1にわたる(BFiとして示される)バッファフルネスの整数値が、次のように計算され得る。
ここで、
であり、それは、コーデックのパラメータセットに記憶され得る。
[0122] 式(4)の一代替形態では、右シフト前に、最も近い整数に丸めるために分子において(BfScaleBits>>1)の値が加算され得る。いくつかの実施形態では、パラメータBfRangeBitsおよび/またはBfScaleBitsは、バッファフルネスを計算するためのビット数および精度が調整され得るように、スケーラブルであり得る。たとえば、aは
として事前計算、次いで、BfRangeBitsおよびBfScaleBitsの値に基づいてビットシフト得る。
[0123] 図7は、いくつかの実施形態による、バッファフルネスを決定するためのプロセスのフローチャートを示す。ブロック702において、最大バッファサイズの逆数が事前算出され、記憶され得る。たとえば、逆数は、ビデオコーデックのパラメータセットの一部として記憶され得る。
[0124] ブロック704において、最大バッファサイズの逆数は、バッファフルネスを表すためのビット数および/またはバッファフルネスを計算するための精度値に基づいてスケーリングされ得る。いくつかの実施形態では、ビット数および精度は定数であり得、ブロック702における最大バッファサイズの逆数用いて事前算出され得る。
[0125] ブロック706において、バッファフルネスが、現在のバッファサイズと最大バッファサイズのスケーリングされた逆数とに基づいて決定され得る。バッファフルネス測定を、(式(1)の場合のように)調整されたバッファサイズの代わりに、最大バッファサイズに基づかせることによって、バッファフルネスは、浮動小数点の代わりに、固定小数点近似を使用して計算され、ハードウェアでのより容易な実装を可能にし得る。
ビットレートのためのラグランジュパラメータ−λ(ビットレート)(Lagrangian Parameter for Bitrate - λ(bitrate))
[0126] 上記で説明されたように、ラムダまたはラグランジュパラメータは、所与のブロックのビットレート(たとえば、あるモードでブロックをコーディングするために必要とされるビット数)の関数として調整され得る。一実施形態では、ビットレートについてのラグランジュパラメータは、以下で説明されるように固定小数点近似を使用して決定され得る。以前は、ラグランジュパラメータは、次のように計算され得る。
ここで、{a,b,c,d}は同調可能または調整可能なパラメータであり、
であり、ここで、bitsは、(ブロックについてのビットレートとも呼ばれ、ターゲットレート、QP値、および/または他のパラメータに基づき得る)ブロックをコーディングするために使用されるビット数であり、maxBitsはワーストケースビット/ブロックである。この計算は、ハードウェア実装に好適でない、浮動小数点演算を使用して行われ得る。
[0127] 固定小数点演算(fixed point arithmetic)を使用してビットレートの関数としてラグランジュパラメータを算出するために、LUT(LUTλ)が使用され得る。さらに、スケーリングファクタcが事前算出され、コーデックのパラメータセットに記憶され得る。スケーリングファクタは、除算ではなくビットシフティングが使用され得るように、分母maxBits(たとえば、ブロックごとの最大ビット)を2のべき乗に変換するために使用され得る。
[0128] 以下のパラメータが与えられる。
・n3:ラムダ計算のための合計精度
・n4:LUTλがサイズ(1<<n4)のものである
[0129] λ(ビットレート)を計算するためのアルゴリズムは、以下の通りである。
1.上記で説明された指数関数を使用してLUTλを事前算出する。
a.一実施形態では、関数は、LUTを生成するために均一にサンプリングされ得る。
b.別の実施形態では、関数は、より高いダイナミックレンジをもつ関数のエリアはより密にサンプリングされ、より少ないレンジをもつエリアはより疎にサンプリングされるように、不均一にサンプリングされ得る。
2.次のようにスケーリングファクタcを事前算出する。
3.最後に、LUTにおいてラムダ値をルックアップする。
[0130] 上記の代替手法では、LUTは、低減された数のエントリ(たとえば、64の代わりに16)を用いて記憶され得、次いで、値に近似するために双一次補間(bilinear interpolation)が使用され得る。これは、λ値を決定するためにわずかにより多くの論理を必要とするが、固定小数点補間が使用され得、これはワーストケース複雑さを制限する。トレードオフは、LUTテーブルの低減されたストレージと引き換えに追加された論理である。
[0131] 図8は、いくつかの実施形態による、ビットレートについてのラグランジュパラメータを決定するためのプロセスのフローチャートを示す。ブロック802において、スケーリングファクタcが事前算出される。スケーリングファクタcは、cによってスケーリングされた定数maxBitsが2のべき乗になり、これにより、maxBitsで除算することが、ビットシフト演算(bit shift operation)を使用して実施することを可能にする、に構成され得る。
[0132] ブロック804において、ブロックをコーディングするために使用されるビット数をビットレートラグランジアンに関連付けるLUTまたは他のデータ構造。いくつかの実施形態では、ビット数は、スケーリングファクタcと、精度ファクタと、LUTまたはデータ構造のサイズの指示とに基づいてスケーリングされ得る。
[0133] コーディング時間中に、ブロック806において、ブロックについてのビットレートラグランジアンは、ブロックをコーディングするために使用されるビット数と、事前算出されたLUTおよびスケーリングファクタcとに基づいて決定され得る。
バッファフルネスについてのラグランジュパラメータ−λ(BF)(Lagrangian Parameter for Buffer Fullness - λ (BF))
[0134] 上記で説明されたように、ブロックについてのラグランジュパラメータは、バッファフルネスの測度(measure)に基づいて調整され得る。いくつかの態様によれば、バッファフルネス(BFi)のための範囲は、BFi∈[0,(2BfRangeBits)−1]である。したがって、式(2)において
のように計算されるxは、次のように書き直され得る。
[0135] 上記を使用して、式2は、以下のように変更され得る。
[0136] 精度を増加させるために、上式は、一定のスケーリングファクタ2ScaleBitsによって乗算され得、ここで、ScaleBitsは正の整数である。いくつかの実施形態では、バッファフルネスについてのラムダ値またはラグランジュパラメータは、以下で説明されるように固定小数点近似を使用して決定され得る。
[0137] 一実施形態では、固定小数点演算を使用してバッファフルネスに基づいてラムダ(lambda)を計算するために、ルックアップテーブル(LUT)方法が使用され得る。たとえば、式(5)におけるd1が2のべき乗でない場合、LUTが使用され得る。一例では、LUTは、2^(lb)のサイズをもつLUTを作成するためにlbビットを使用してBFiを線形的にサンプリングすることによって式(5)を使用して構築され得る。LUTが構築されると、バッファフルネスラムダ(buffer fullness lambda)は、インデックス=(BFi+オフセット)>>スケールとして計算されたインデックスを使用してLUTから推論され得、ここで、スケール=BfRangeBits−lbであり、オフセット=1<<(スケール−1)である。いくつかの実施形態では、インデックスは、インデックス=(BFi)>>スケールとして計算され得る。最後に、いくつかの実施形態では、必要な場合、計算されたインデックス値は、LUTにおける有効なエントリを保証するために、それぞれの最大値
および最小値0にクリッピングされ得る。
[0138] 別の例では、LUTは、非線形サンプリングに基づいて構築され得、ここで、BFiは、不均一なステップサイズを用いてサンプリングされ得る。一例では、LUTは、より低い範囲においてより粗く、より高い範囲においてより密にサンプリングされ得、たとえば、ステップサイズは0から遠ざかるときに増加する。また別の例では、より密なサンプリングは(1つまたは複数の)より低い範囲にあり得、粗いサンプリングは(1つまたは複数の)より高い範囲にあり得る。
[0139] 別の代替形態では、式(5)は、ラムダ(lambda)がオンザフライ(on the fly)で計算され得るように、ラムダがより少ない演算を使用して容易に算出され得るように変更され得る。たとえば、式は、それが、整数を用いた乗算と、シフト演算(右シフトと左シフトの両方)と、加算とのみを伴うように変更され得る。言い換えれば、変更された式は除算演算を含んでいない。この方法の利点は、それがLUTストレージを低減し、LUTを用いたメモリアクセス演算をなくすことができることである。一例では、d1が2のべき乗である場合、関数λ(x)は、固定小数点演算を使用して容易に算出され得る。
[0140] このようにして、本技法は、たとえば、固定小数点近似を使用することによって、ハードウェア実装における複雑さ、困難、および/または増加されたコストをもたらす演算の使用を低減するかまたはなくすことができる。そのような演算は、除算、込み入ったまたは複雑な関数または算出、浮動小数点演算などを伴うことがある。提案されるADSCコーデックまたはモデルのハードウェア複雑さは、上記の固定小数点近似を使用して大幅に低減され得る。
[0141] 本開示で説明されるすべての例および実施形態は、実施形態に応じて、別々にまたは組合せで実装され得る。実施形態に応じて、例および実施形態のいくつかの特徴が省略または変更され得、他の特徴が例および実施形態に追加され得る。
[0142] 図9は、いくつかの実施形態による、バッファフルネスについてのラグランジュパラメータを決定するためのプロセスのフローチャートを示す示す。ブロック902において、LUTまたは他のデータ構造が事前算出され、記憶される。LUTまたは他のデータ構造は、バッファフルネス(BFi)をバッファフルネスについてのラグランジュパラメータに関連付け得る。
[0143] ブロック904において、コーディング時間中に、(たとえば図7に示されているプロセスを使用して)計算されたバッファフルネス値は、バッファフルネス値を表すために使用されるピクセルの数および/あるいはLUTまたはデータ構造のサイズ(たとえば、LUTインデックスのピクセルの数)の指示に基づいてスケーリングされ得る。ブロック906において、スケーリングされたバッファフルネス値は、バッファフルネスについてのラグランジュパラメータを決定するために、LUTまたはデータ構造(たとえば、LUTインデックス)への入力として使用される。
他の考慮事項(Other Considerations)
[0144] 本開示の態様は、図2A中のビデオエンコーダ20など、エンコーダの観点から説明されたことに留意されたい。しかしながら、上記で説明された動作の逆の動作が、たとえば、図2B中のビデオデコーダ30によって、生成されたビットストリームを復号するために適用され得ることを、当業者は諒解されよう。
[0145] 本明細書で開示される情報および信号は、多種多様な技術および技法のいずれかを使用して表され得る。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。
[0146] 本明細書で開示される実施形態に関して説明された様々な例示的な論理ブロック、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得る。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、およびステップが、概してそれらの機能に関して上記で説明された。そのような機能がハードウェアとして実装されるか、ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明された機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[0147] 本明細書で説明された技法は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、またはワイヤレス通信デバイスハンドセット、自動車、アプライアンス、ウェアラブル、および/または他のデバイスにおける適用例を含む複数の用途を有する集積回路デバイスなど、様々なデバイスのいずれかにおいて実装され得る。デバイスまたは構成要素として説明された特徴は、集積論理デバイスに一緒に、または個別であるが相互運用可能な論理デバイスとして別々に実装され得る。ソフトウェアで実装された場合、本技法は、実行されたとき、上記で説明された方法のうちの1つまたは複数を実施する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって、少なくとも部分的に実現され得る。コンピュータ可読データ記憶媒体は、パッケージング材料を含むことがあるコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、同期型ダイナミックランダムアクセスメモリ(SDRAM)などのランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気消去可能プログラマブル読取り専用メモリ(EEPROM(登録商標))、フラッシュメモリ、磁気または光学データ記憶媒体など、メモリまたはデータ記憶媒体を備え得る。本技法は、追加または代替として、伝搬信号または電波など、命令またはデータ構造の形態でプログラムコードを搬送または伝達し、コンピュータによってアクセスされ、読み取られ、および/または実行され得るコンピュータ可読通信媒体によって、少なくとも部分的に実現され得る。
[0148] プログラムコードは、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、または他の等価の集積回路またはディスクリート論理回路など、1つまたは複数のプロセッサを含み得るプロセッサによって実行され得る。そのようなプロセッサは、本開示で説明された技法のいずれかを実施するように構成され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つまたは複数のマイクロプロセッサ、または任意の他のそのような構成として実装され得る。したがって、本明細書で使用される「プロセッサ」という用語は、上記の構造、上記の構造の任意の組合せ、または本明細書で説明された技法の実装に好適な他の構造または装置のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用のソフトウェアまたはハードウェア内に提供され得、あるいは複合ビデオエンコーダ/デコーダ(コーデック)に組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素で十分に実装され得る。
[0149] 本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置で実装され得る。本開示では、開示される技法を実施するように構成されたデバイスの機能的態様を強調するために、様々な構成要素またはユニットが説明されたが、それらの構成要素またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上記で説明されたように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明された1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作可能なハードウェアユニットの集合によって与えられ得る。
[0150] 上記のことは、様々な異なる実施形態に関して説明されたが、一実施形態からの特徴または要素は、本開示の教示から逸脱することなく他の実施形態と組み合わせられ得る。ただし、それぞれの実施形態間の特徴の組合せは、必ずしもそれに限定されるとは限らない。本開示の様々な実施形態が説明された。これらおよび他の実施形態は以下の特許請求の範囲内に入る。

Claims (29)

  1. ビデオデータをコーディングするための装置であって、
    前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
    前記メモリに動作可能に結合されたハードウェアプロセッサとを備え、前記ハードウェアプロセッサは、
    ビデオデータのスライス内のピクセルの合計数に基づいてスケーリングパラメータを決定および記憶することと、
    複数の入力値をそれらの逆数値に関連付けるデータ構造を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    前記記憶されたスケーリングパラメータに基づいてしきい値を決定することと、
    コーディングされるべき前記スライスのブロックについて、前記スライス中の残りのピクセルの数が前記しきい値よりも小さいという決定に応答して、前記スケーリングパラメータを更新し、スケーリングファクタに基づいて、更新されたしきい値を決定することと、
    スケーリングファクタに基づいてスケーリングされた残りのピクセルの前記数に関連付けられた逆数値に基づいて、前記ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施することと、ここにおいて、前記逆数値が、前記記憶されたデータ構造を使用して決定される、
    を行うように構成された、
    装置。
  2. 前記データ構造がルックアップテーブル(LUT)を備える、請求項1に記載の装置。
  3. 前記ハードウェアプロセッサが、バッファフルネスの測度に基づく量によって、前記決定されたターゲットレートを調整するようにさらに構成された、請求項1に記載の装置。
  4. 前記調整量が、ルックアップテーブル(LUT)を使用すること基づいて決定される、請求項3に記載の装置。
  5. 前記ハードウェアプロセッサは、前記ブロックが前記スライスの第1のライン上に配置されたかどうかに基づいて、前記決定されたターゲットレートを調整するようにさらに構成された、請求項1に記載の装置。
  6. 前記ハードウェアプロセッサが、前記スライス中に残っているビット数に基づいて前記逆数値をスケーリングするようにさらに構成された、請求項1に記載の装置。
  7. ビデオデータのブロックをコーディングするためのターゲットレートを決定するためのコンピュータ実装方法であって、
    ビデオデータのスライス内のピクセルの合計数に基づいてスケーリングパラメータを決定および記憶することと、
    複数の入力値をそれらの逆数値に関連付けるデータ構造を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    前記記憶されたスケーリングパラメータに基づいてしきい値を決定することと、
    コーディングされるべき前記スライスのブロックについて、前記スライス中の残りのピクセルの数が前記しきい値よりも小さいという決定に応答して、前記スケーリングパラメータを更新し、スケーリングファクタに基づいて、更新されたしきい値を決定することと、
    スケーリングファクタに基づいてスケーリングされた残りのピクセルの前記数に関連付けられた逆数値に基づいて、前記ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施することと、ここにおいて、前記逆数値が、前記記憶されたデータ構造を使用して決定される、
    を備える、コンピュータ実装方法。
  8. 前記データ構造がルックアップテーブル(LUT)を備える、請求項7に記載のコンピュータ実装方法。
  9. バッファフルネスの測度に基づく量によって、前記決定されたターゲットレートを調整することをさらに備える、請求項7に記載のコンピュータ実装方法。
  10. 前記調整量が、ルックアップテーブル(LUT)を使用すること基づいて決定される、請求項9に記載のコンピュータ実装方法。
  11. 前記ブロックが前記スライスの第1のライン上に配置されたかどうかに基づいて、前記決定されたターゲットレートを調整することをさらに備える、請求項7に記載のコンピュータ実装方法。
  12. 前記スライス中に残っているビット数に基づいて前記逆数値をスケーリングすることをさらに備える、請求項7に記載のコンピュータ実装方法。
  13. 装置であって、
    ビデオデータのスライス内のピクセルの合計数に基づいてスケーリングパラメータを決定および記憶するための手段と、
    複数の入力値をそれらの逆数値に関連付けるデータ構造を決定および記憶するための手段と、
    コーディングされるべき前記ビデオデータを受信するための手段と、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    前記記憶されたスケーリングパラメータに基づいてしきい値を決定するための手段と、
    コーディングされるべき前記スライスのブロックについて、前記スライス中の残りのピクセルの数が前記しきい値よりも小さいという決定に応答して、前記スケーリングパラメータを更新し、スケーリングファクタに基づいて、更新されたしきい値を決定するための手段と、
    スケーリングファクタに基づいてスケーリングされた残りのピクセルの前記数に関連付けられた逆数値に基づいて、前記ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施するための手段と、ここにおいて、前記逆数値が、前記記憶されたデータ構造を使用して決定される、
    を備える装置。
  14. 前記データ構造がルックアップテーブル(LUT)を備える、請求項13に記載の装置。
  15. バッファフルネスの測度に基づく量によって、前記決定されたターゲットレートを調整するための手段をさらに備える、請求項13に記載の装置。
  16. 前記調整量が、ルックアップテーブル(LUT)を使用すること基づいて決定される、請求項15に記載の装置。
  17. 前記ブロックが前記スライスの第1のライン上に配置されたかどうかに基づいて、前記決定されたターゲットレートを調整するための手段をさらに備える、請求項13に記載の装置。
  18. 前記スライス中に残っているビット数に基づいて前記逆数値をスケーリングするための手段をさらに備える、請求項13に記載の装置。
  19. 画像のスライスに関係するビデオデータを記憶した非一時的コンピュータ可読記憶媒体であって、前記スライスが1つまたは複数のブロックを備え、ここにおいて、前記記憶媒体は、実行されたとき、デバイスのプロセッサに、
    ビデオデータのスライス内のピクセルの合計数に基づいてスケーリングパラメータを決定および記憶することと、
    複数の入力値をそれらの逆数値に関連付けるデータ構造を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが少なくとも1つのスライスを備える、
    前記記憶されたスケーリングパラメータに基づいてしきい値を決定することと、
    コーディングされるべき前記スライスのブロックについて、前記スライス中の残りのピクセルの数が前記しきい値よりも小さいという決定に応答して、前記スケーリングパラメータを更新し、スケーリングファクタに基づいて、更新されたしきい値を決定することと、
    スケーリングファクタに基づいてスケーリングされた残りのピクセルの前記数に関連付けられた逆数値に基づいて、前記ブロックについてのターゲットレートを決定するために1つまたは複数の固定小数点近似演算を実施することと、ここにおいて、前記逆数値が、前記記憶されたデータ構造を使用して決定される、
    を行わせる命令をさらに記憶している、非一時的コンピュータ可読記憶媒体。
  20. 前記データ構造がルックアップテーブル(LUT)を備える、請求項19に記載の非一時的コンピュータ可読記憶媒体。
  21. 前記記憶媒体が、実行されたとき、前記プロセッサに、バッファフルネスの測度に基づく量によって、前記決定されたターゲットレートを調整させる命令をさらに記憶している、請求項19に記載の非一時的コンピュータ可読記憶媒体。
  22. 前記調整量が、ルックアップテーブル(LUT)を使用すること基づいて決定される、請求項21に記載の非一時的コンピュータ可読記憶媒体。
  23. 前記記憶媒体は、実行されたとき、前記プロセッサに、前記ブロックが前記スライスの第1のライン上に配置されたかどうかに基づいて、前記決定されたターゲットレートを調整させる命令をさらに記憶している、請求項19に記載の非一時的コンピュータ可読記憶媒体。
  24. 前記記憶媒体が、実行されたとき、前記プロセッサに、前記スライス中に残っているビット数に基づいて前記逆数値をスケーリングさせる命令をさらに記憶している、請求項19に記載の非一時的コンピュータ可読記憶媒体。
  25. ビデオデータをコーディングするための装置であって、
    前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
    前記メモリに動作可能に結合されたハードウェアプロセッサとを備え、前記ハードウェアプロセッサは、
    最大バッファサイズの逆数に基づいて第1のパラメータ値を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    コーディングされるべき前記スライスのブロックについて、バッファフルネスを表すために使用されるビット数を示す第1の値と、バッファフルネスを計算するための精度を示す第2の値とに基づいて、前記第1のパラメータをスケーリングすることと、
    前記スケーリングされた第1のパラメータと、前記バッファの現在のサイズと、前記スライス内の前記ブロックの位置に基づくバッファオフセット値と、バッファフルネスを計算するための精度を示す前記第2の値とに基づいて、前記ブロックについてのバッファフルネス値を決定するために1つまたは複数の固定小数点近似演算を実施することと
    を行うように構成された、装置。
  26. 前記ハードウェアプロセッサは、
    バッファフルネス値をバッファフルネス値についてのラグランジュ値に関連付けるデータ構造を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    コーディングされるべき前記スライスのブロックについて、前記ブロックの計算されたバッファフルネス値を、前記バッファフルネス値をコーディングするために使用されるビット数を示す第1のパラメータと、前記データ構造のインデックスをコーディングするために使用されるビット数を示す第2のパラメータとに基づいてスケーリングすることと、
    前記記憶されたデータ構造と前記スケーリングされたバッファフルネス値とを使用して、前記バッファフルネス値についてのラグランジュ値を決定するために1つまたは複数の固定小数点近似演算を実施することと
    を行うようにさらに構成された、請求項25に記載の装置。
  27. ビデオデータをコーディングするための装置であって、
    前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
    前記メモリに動作可能に結合されたハードウェアプロセッサとを備え、前記ハードウェアプロセッサは、
    バッファフルネス値を量子化パラメータ(QP)調整値に関連付けるデータ構造を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    コーディングされるべき前記スライスのブロックについて、前記ブロックが複雑な領域と平坦な領域との間の遷移を含んでいるかどうかを決定することと、ここにおいて、複雑な領域が、平坦な領域と比較してより高い複雑さを有する、
    前記ブロックが遷移を含んでいるという決定に応答して、バッファフルネス値を、前記バッファフルネス値をコーディングするために使用されるビット数と、QP調整値をコーディングするために使用されるべきビット数とに基づいてシフトすることと、
    前記記憶されたデータ構造と前記シフトされたバッファフルネス値とに基づいて、前記ブロックについてのQP調整値を決定するために1つまたは複数の固定小数点近似演算を実施することと、
    前記ブロックのQPを前記決定されたQP調整値に設定することと
    を行うように構成された、装置。
  28. ビデオデータをコーディングするための装置であって、
    前記ビデオデータを記憶するためのメモリと、
    前記メモリに動作可能に結合されたハードウェアプロセッサとを備え、前記ハードウェアプロセッサは、
    ビデオデータのブロックをコーディングするために使用され得る最大ビット数に基づいて第1のスケーリングパラメータを決定および記憶することと、
    ビデオデータのブロックをコーディングするために使用されるビット数をビットレートについてのラグランジュパラメータに関連付けるデータ構造を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    コーディングされるべき前記スライスのブロックについて、前記第1のスケーリングパラメータによって調整された前記ブロックをコーディングするためのビット数に基づいて、前記データ構造を使用して前記ブロックのビットレートについてのラグランジアンを決定する1つまたは複数の固定小数点近似演算を実施することと
    を行うように構成された、装置。
  29. ビデオデータをコーディングするための装置であって、
    前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
    前記メモリに動作可能に結合されたハードウェアプロセッサとを備え、前記ハードウェアプロセッサは、
    バッファフルネス値をバッファフルネス値についてのラグランジュ値に関連付けるデータ構造を決定および記憶することと、
    コーディングされるべき前記ビデオデータを受信することと、前記ビデオデータが、複数のブロックに分割された少なくとも1つのスライスを備える、
    コーディングされるべき前記スライスのブロックについて、前記ブロックの計算されたバッファフルネス値を、前記バッファフルネス値をコーディングするために使用されるビット数を示す第1のパラメータと、前記データ構造のインデックスをコーディングするために使用されるビット数を示す第2のパラメータとに基づいてスケーリングすることと、
    前記記憶されたデータ構造と前記スケーリングされたバッファフルネス値とを使用して、前記バッファフルネス値についてのラグランジュ値を決定するために1つまたは複数の固定小数点近似演算を実施することと
    を行うように構成された、装置。
JP2018525779A 2015-11-19 2016-11-17 ディスプレイストリーム圧縮(dsc)における固定小数点近似のためのシステムおよび方法 Active JP6772266B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201562257604P 2015-11-19 2015-11-19
US62/257,604 2015-11-19
US201562264067P 2015-12-07 2015-12-07
US62/264,067 2015-12-07
US201662305314P 2016-03-08 2016-03-08
US62/305,314 2016-03-08
US15/353,468 2016-11-16
US15/353,468 US10432952B2 (en) 2015-11-19 2016-11-16 System and methods for fixed-point approximations in display stream compression (DSC)
PCT/US2016/062455 WO2017087626A1 (en) 2015-11-19 2016-11-17 System and methods for fixed-point approximations in display stream compression (dsc)

Publications (3)

Publication Number Publication Date
JP2018538742A true JP2018538742A (ja) 2018-12-27
JP2018538742A5 JP2018538742A5 (ja) 2019-12-26
JP6772266B2 JP6772266B2 (ja) 2020-10-21

Family

ID=57485923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018525779A Active JP6772266B2 (ja) 2015-11-19 2016-11-17 ディスプレイストリーム圧縮(dsc)における固定小数点近似のためのシステムおよび方法

Country Status (9)

Country Link
US (1) US10432952B2 (ja)
EP (1) EP3378230B1 (ja)
JP (1) JP6772266B2 (ja)
KR (1) KR102101107B1 (ja)
CN (2) CN111726628B (ja)
AU (1) AU2016355664B2 (ja)
BR (1) BR112018010137A8 (ja)
TW (1) TWI721042B (ja)
WO (1) WO2017087626A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11546611B2 (en) 2018-08-01 2023-01-03 Samsung Display Co., Ltd. Rate control for fixed rate foveated display compression
CN109246443B (zh) * 2018-11-28 2021-03-23 湖南快乐阳光互动娱乐传媒有限公司 一种直播流切片同步方法及系统
CN113812159B (zh) * 2019-05-14 2024-06-21 北京字节跳动网络技术有限公司 视频编解码中的缩放方法
US20220044386A1 (en) * 2020-08-05 2022-02-10 Facebook, Inc. Hardware friendly fixed-point approximations of video quality metrics
CN112437300B (zh) * 2020-11-23 2022-04-15 武汉理工大学 一种基于自适应区间重叠因子的分布式视频编码方法
EP4406223A1 (en) * 2021-09-22 2024-07-31 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation
KR102611423B1 (ko) * 2022-07-01 2023-12-07 주식회사 네패스 이미지 스케일링 장치 및 이미지 스케일링 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1513350A1 (en) * 2003-09-03 2005-03-09 Thomson Licensing S.A. Process and arrangement for encoding video pictures
US7697608B2 (en) * 2004-02-03 2010-04-13 Sony Corporation Scalable MPEG video/macro block rate control
WO2008005757A2 (en) * 2006-06-26 2008-01-10 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
JP5400876B2 (ja) * 2008-06-16 2014-01-29 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化
WO2009157159A1 (ja) * 2008-06-24 2009-12-30 パナソニック株式会社 記録媒体、再生装置、集積回路、再生方法、プログラム
US8897365B2 (en) 2008-11-19 2014-11-25 Nvidia Corporation Video rate control processor for a video encoding process
CA2839345A1 (en) * 2011-06-14 2012-12-20 Zhou Wang Method and system for structural similarity based rate-distortion optimization for perceptual video coding
US10812829B2 (en) * 2012-10-03 2020-10-20 Avago Technologies International Sales Pte. Limited 2D block image encoding
US20140192266A1 (en) * 2013-01-04 2014-07-10 Qualcomm Incorporated Method and apparatus of reducing compression noise in digital video streams
US9936200B2 (en) * 2013-04-12 2018-04-03 Qualcomm Incorporated Rice parameter update for coefficient level coding in video coding process
US9930346B2 (en) 2014-04-15 2018-03-27 Qualcomm Incorporated System and method for flatness detection for display stream compression (DSC)
US9866853B2 (en) 2014-04-15 2018-01-09 Qualcomm Incorporated System and method for lagrangian parameter calculation for display stream compression (DSC)
US9848193B2 (en) * 2014-04-15 2017-12-19 Qualcomm Incorporated System and method for selecting quantization parameter (QP) in display stream compression (DSC)
US10356428B2 (en) 2015-04-13 2019-07-16 Qualcomm Incorporated Quantization parameter (QP) update classification for display stream compression (DSC)

Also Published As

Publication number Publication date
BR112018010137A8 (pt) 2019-02-26
KR102101107B1 (ko) 2020-04-14
EP3378230A1 (en) 2018-09-26
WO2017087626A1 (en) 2017-05-26
CN108353170B (zh) 2020-07-07
US10432952B2 (en) 2019-10-01
AU2016355664B2 (en) 2020-05-28
EP3378230B1 (en) 2020-12-16
CN108353170A (zh) 2018-07-31
KR20180083861A (ko) 2018-07-23
JP6772266B2 (ja) 2020-10-21
TW201722155A (zh) 2017-06-16
CN111726628A (zh) 2020-09-29
TWI721042B (zh) 2021-03-11
CN111726628B (zh) 2022-03-22
AU2016355664A1 (en) 2018-04-26
US20170150158A1 (en) 2017-05-25
BR112018010137A2 (pt) 2018-11-13

Similar Documents

Publication Publication Date Title
JP6772266B2 (ja) ディスプレイストリーム圧縮(dsc)における固定小数点近似のためのシステムおよび方法
JP6921873B2 (ja) ディスプレイストリーム圧縮のためのサブストリーム多重化
JP6453360B2 (ja) ディスプレイストリーム圧縮(dsc)のためのラグランジュパラメータ計算のためのシステムおよび方法
CN108702513B (zh) 用于在显示流压缩中量化参数的适应性计算的设备及方法
KR102185027B1 (ko) 디스플레이 스트림 압축을 위한 벡터 기반 엔트로피 코딩을 위한 장치 및 방법
JP2018515016A (ja) 表示ストリーム圧縮のための複雑領域検出
KR102175662B1 (ko) 디스플레이 스트림 압축 (dsc) 에서의 왜곡을 계산하기 위한 시스템 및 방법들
JP2018515015A (ja) ディスプレイストリーム圧縮(dsc)のための量子化パラメータ(qp)更新分類
KR102112942B1 (ko) 디스플레이 스트림 압축에 대한 지각적 양자화 파라미터 (qp) 가중을 위한 장치 및 방법들
US10123045B2 (en) Modification to block size for transform mode in display stream compression

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191018

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191118

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20191118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200309

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200930

R150 Certificate of patent or registration of utility model

Ref document number: 6772266

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250