JP2018509067A - ほぼ視覚的無損失なビデオ再圧縮 - Google Patents

ほぼ視覚的無損失なビデオ再圧縮 Download PDF

Info

Publication number
JP2018509067A
JP2018509067A JP2017541605A JP2017541605A JP2018509067A JP 2018509067 A JP2018509067 A JP 2018509067A JP 2017541605 A JP2017541605 A JP 2017541605A JP 2017541605 A JP2017541605 A JP 2017541605A JP 2018509067 A JP2018509067 A JP 2018509067A
Authority
JP
Japan
Prior art keywords
video frame
video
bit rate
value
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017541605A
Other languages
English (en)
Inventor
パンダ、プラサンジット
マラヤト、ナレンドラナト
ムーシー、アヌシュ・クリシュナ
ティワリ、マヤンク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2018509067A publication Critical patent/JP2018509067A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • H04N19/428Recompression, e.g. by spatial or temporal decimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ほぼ視覚的無損失なビデオ再圧縮を実施するための技法について記載する。開示される技法は、最初に記録されたビデオフレームとほぼ同じレベルの視覚的に知覚可能なビデオ品質を保持しながら、比較的小さいビットレートと比較的小さいファイルサイズとを有するビデオフレームを生成する。概して、ビデオフレームの再圧縮は、入力ビデオフレームを必要とし(takes)、同じか、またはより低いビットレートを有する、ビデオフレームの第2のコピーを生じる。提案される技法は、ビデオフレームの当初の記録と比較して、視覚的品質における知覚可能損失なしでビデオフレームを再圧縮する(すなわち、視覚的無損失再圧縮)という問題に対処する。さらに、開示される技法は、各ビデオフレームの一度の(single)復号と符号化とを含む、ビデオフレームのワンステップ再圧縮を提供する。

Description

[0001]本出願は、その内容全体が参照によって本明細書に組み込まれている、2015年2月9日に出願した米国特許仮出願第62/113,971号の利益を主張する。
[0002]本開示は、ビデオ圧縮のための技法に関する。
[0003]デジタルビデオ能力は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲のデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part 10、アドバンストビデオコーディング(AVC)、ITU−T H.265、高効率ビデオコーディング(HEVC)によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化(encode)、復号、および/または記憶することができる。
[0004]ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的(ピクチャ内)予測および/または時間的(ピクチャ間)予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス(たとえば、ビデオフレームまたはビデオフレームの一部分)は、ツリーブロック、コーディングユニット(CU)および/またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライスにおけるビデオブロックは、同じピクチャ内の隣接ブロックにおける参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライスにおけるビデオブロックは、同じピクチャ中の隣接ブロックにおける参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれる場合があり、参照ピクチャは参照フレームと呼ばれる場合がある。
[0005]空間的予測または時間的予測は、コーディングされるべきブロックのための予測ブロックをもたらす。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックをポイントする動きベクトル、およびコード化ブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロックは、イントラコーディングモードおよび残差データに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて残差変換係数をもたらすことができ、それに次いで、量子化され得る。最初に2次元アレイで構成される量子化変換係数は、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。
[0006]概して、本開示は、ほぼ視覚的無損失なビデオ再圧縮を実施するための技法について記載する。開示される技法は、最初に記録されたビデオフレームとほぼ同じレベルの視覚的に知覚可能なビデオ品質を保持しながら、比較的小さいビットレートと比較的小さいファイルサイズとを有するビデオフレームを生成する。概して、ビデオフレームの再圧縮は、入力ビデオフレームを必要とし、同じか、またはより低いビットレートを有する、ビデオフレームの第2のコピーを生じる。本明細書では「VZIP」と呼ばれる、提案される技法は、ビデオフレームの当初の記録と比較して、視覚的品質における知覚可能損失なしでビデオフレームを再圧縮する(すなわち、視覚的無損失再圧縮)という問題に対処する。さらに、開示される技法は、各ビデオフレームの一度の復号と符号化とを含む、ビデオフレームのワンステップ再圧縮を提供する。
[0007]一例では、本開示は、ビデオデータを処理する方法を対象とする。この方法は、複数の事前計算された量子化パラメータ(QP)値を記憶することと、ここにおいて、複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、第1のビットレートでビデオフレームを取得することと、ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、ビデオフレームについての複雑度値を決定することと、ビデオフレームについての複雑度値に基づいて、複数の事前計算されたQP値から、QP値を選択することと、ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、選択されたQP値に従って、第1のビットレートから第2のビットレートに再圧縮することと、第2のビットレートは第1のビットレートよりも低い、を備える。
[0008]別の例では、本開示はビデオ処理デバイスを対象とし、デバイスは、メモリと、メモリと通信している1つまたは複数のプロセッサとを備える。メモリは、複数の事前計算されたQP値を記憶するように構成され、複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される。1つまたは複数のプロセッサ、ならびに第1のビットレートでビデオフレームを取得することと、ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、ビデオフレームについての複雑度値を決定することと、ビデオフレームについての複雑度値に基づいて、複数の事前計算されたQP値から、QP値を選択することと、ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、選択されたQP値に従って、第1のビットレートから第2のビットレートに再圧縮することと、第2のビットレートは第1のビットレートよりも低い、を行うように構成される。
[0009]さらなる例では、本開示は、ビデオ処理デバイスを対象とし、デバイスは、複数の事前計算されたQP値を記憶するための手段と、ここにおいて、複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、第1のビットレートでビデオフレームを取得するための手段と、ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、ビデオフレームについての複雑度値を決定するための手段と、ビデオフレームについての複雑度値に基づいて、複数の事前計算されたQP値から、QP値を選択するための手段と、ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、選択されたQP値に従って、第1のビットレートから第2のビットレートに再圧縮するための手段と、第2のビットレートは第1のビットレートよりも低い、を備える。
[0010]追加の例では、本開示は、命令を記憶する非一時的コンピュータ可読媒体を対象とし、命令は、実行されると、1つまたは複数のプロセッサに、複数の事前計算されたQP値を記憶することと、ここにおいて、複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、第1のビットレートでビデオフレームを取得することと、ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、ビデオフレームについての複雑度値を決定することと、ビデオフレームについての複雑度値に基づいて、複数の事前計算されたQP値からQP値を選択することと、ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、選択されたQP値に従って、第1のビットレートから第2のビットレートに再圧縮することと、第2のビットレートは第1のビットレートよりも低い、を行わせる。
[0011]本開示の1つまたは複数の例の詳細が添付の図面および以下の説明に記載されている。本開示の他の特徴、目的、および利点は、説明および図面、ならびに特許請求の範囲から明らかになろう。
[0012]ビデオデータを再圧縮、符号化、および/またはトランスコードするための本開示の技法を実装するのに使われ得る、例示的なコンピューティングデバイスを示すブロック図。 [0013]本開示に記載される技法を実装し得る例示的なビデオ再圧縮ユニットを示すブロック図。 [0014]本開示に記載される技法による、再符号化複雑度(REC)モデルを生成するのに使われ得る、例示的なルックアップテーブル(LUT)生成システムを示すブロック図。 [0015]ストレージ短縮(compaction)のためのビデオ再圧縮の例示的な使用ケースを示すブロック図。 [0016]ビデオ共有のためのビデオ再圧縮の例示的な使用ケースを示すブロック図。 [0017]ライブビデオ記録のためのビデオ再圧縮の例示的な使用ケースを示すブロック図。 [0018]所与の(given)ビットレートにおける異なる品質レベルを有する異なるビデオクリップについての例示的なレート歪み曲線を示すグラフ。 [0019]本開示に記載されるビデオ再圧縮技法の例示的な性能レベルを示すグラフ。 [0020]本開示に記載されるビデオ再圧縮技法の例示的な動作を示すフローチャート。
[0021]本開示は、ほぼ視覚的無損失なビデオ再圧縮を実施するための技法について記載する。開示される技法は、最初に記録されたビデオフレームとほぼ同じレベルのビデオ品質を保持しながら、比較的小さいビットレートと比較的小さいファイルサイズとを有するビデオフレームを生成する。概して、ビデオフレームの再圧縮は、入力ビデオフレームを必要とし、同じか、またはより低いビットレートを有する、ビデオフレームの第2のコピーを生じる。「VZIP」とも呼ばれる、提案される技法は、ビデオフレームの当初の記録と比較して、視覚的品質における知覚可能損失なしでビデオフレームを再圧縮する(すなわち、視覚的無損失再圧縮)という問題に対処する。
[0022]より高い解像度、フレームレートおよびビットレートでのビデオ記録は、大きいビデオクリップを生成する。たとえば、4K30(4K、30フレーム毎秒)ビデオが常に(every minute)50mbpsで記録されると、375MBのデータが追加され、これは、デバイス上のメモリをすぐに満杯にし得る。さらに、大きいビデオクリップは、ウェブサイトおよびサーバにアップロードするのが困難である。これは、メモリおよびワイヤレスチャネル帯域幅が異常に高額である(at a premium)モバイルデバイスにおいて特に当てはまる。
[0023]簡易な(Simple)トランスコーディングが、ビデオフレームのビットレートを低減するのに使われ得るが、開示される技法によって対処される追加制約は、ビデオコンテンツの視覚的忠実性(fidelity)を維持することである。さらに、開示される技法は、各ビデオフレームの一度の復号と符号化とを含む、ビデオフレームのワンステップ再圧縮を提供する。このように、ビデオフレームの復号または符号化における複数回の繰返しは必要ない。他の例では、ビデオビットレートを変更するのではなく、解像度、フレームレート、コーディング規格、または他のビデオコーデック特徴が、視覚的忠実性を維持したまま変更され得る。
[0024]図1は、ビデオデータを再圧縮、符号化、および/またはトランスコードするための本開示の技法を実装するのに使われ得る、例示的なコンピューティングデバイス2を示すブロック図である。コンピューティングデバイス2は、たとえば、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、コンピュータワークステーション、ビデオゲームプラットフォームもしくはコンソール、ワイヤレス通信デバイス、たとえば、セルラー電話もしくは衛星電話などの携帯電話、固定電話、インターネット電話、デジタルカメラ、インターネット接続カメラ、ポータブルビデオゲームデバイスもしくは携帯情報端末(PDA)などのハンドヘルドデバイス、パーソナルミュージックプレーヤ、ビデオプレーヤ、ディスプレイデバイス、テレビジョン、テレビジョンセットトップボックス、サーバ、中間ネットワークデバイス、メインフレームコンピュータ、任意のモバイルデバイス、またはビデオおよび/もしくは画像データを処理および/もしくは表示する任意の他のタイプのデバイスを備え得る。
[0025]図1の例に示されているように、コンピューティングデバイス2は、ユーザ入力インターフェース4と、中央処理ユニット(CPU)6と、メモリコントローラ8と、システムメモリ10と、ビデオ再圧縮ユニット12と、ディスプレイ18と、バス20および22と、カメラ21と、ビデオプロセッサ23とを含み得る。いくつかのケースでは、図1に示されているCPU6、メモリコントローラ8、ビデオ再圧縮ユニット12、およびビデオプロセッサ23は、たとえば、システムオンチップ(SoC)設計におけるオンチップであり得る。ユーザ入力インターフェース4、CPU6、メモリコントローラ8、およびビデオ再圧縮ユニット12は、バス20を使用して互いに通信し得る。メモリコントローラ8およびシステムメモリ10はまた、バス22を使用して互いと通信し得る。コンピューティングデバイス2がワイヤレス通信デバイスを備える例では、コンピューティングデバイス2は、ワイヤレス通信インターフェース(図示せず)も含み得る。
[0026]バス20、22は、第3世代バス(たとえば、HyperTransportバスまたはInfiniBandバス)、第2世代バス(たとえばアドバンストグラフィックスポートバス、周辺構成要素相互接続(PCI)エクスプレスバス、またはアドバンストエクステンシブルインターフェース(AXI)バス)、または別のタイプのバスもしくはデバイスの相互接続など、様々なバス構造のいずれかであり得る。図1に示す異なる構成要素同士の間のバスおよび通信インターフェースの特定の構成は単なる例示であり、本開示の本技法を実装するために、同じまたは異なる構成要素を備えたコンピューティングデバイスおよび/または他のグラフィックス処理システムの他の構成が使用され得ることに留意されたい。
[0027]CPU6は、コンピューティングデバイス2の動作を制御する汎用プロセッサまたは専用プロセッサを備えることができる。ユーザは、CPU6に1つまたは複数のソフトウェアアプリケーションを実行させるためにコンピューティングデバイス2に入力を与え得る。CPU6上で実行するソフトウェアアプリケーションは、たとえば、オペレーティングシステム、ワードプロセッサアプリケーション、電子メールアプリケーション、スプレッドシートアプリケーション、メディアプレーヤアプリケーション、ビデオゲームアプリケーション、グラフィカルユーザインターフェースアプリケーション、または別のプログラムを含み得る。ユーザは、ユーザインターフェース4を介してコンピューティングデバイス2に結合されたキーボード、マウス、マイクロフォン、タッチパッド、または別の入力デバイスなど、1つまたは複数の入力デバイス(図示せず)を介して、コンピューティングデバイス2に入力を与え得る。
[0028]メモリコントローラ8は、システムメモリ10への、およびシステムメモリ10からのデータの転送を促進する。たとえば、メモリコントローラ8は、コンピューティングデバイス2中の構成要素にメモリサービスを提供するために、メモリ読取りおよび書込みコマンドを受信し、システムメモリ10に関するそのようなコマンドをサービスし得る。メモリコントローラ8は、メモリバス22を介してシステムメモリ10に通信可能に結合される。メモリコントローラ8は、CPU6とシステムメモリ10の両方とは別個である処理モジュールであるものとして図1に示されているが、他の例では、メモリコントローラ8の機能性の一部または全部は、CPU6とシステムメモリ10の一方または両方の上で実装され得る。
[0029]システムメモリ10は、CPU6が実行するためにアクセス可能であるプログラムモジュールおよび/もしくは命令、ならびに/またはCPU6上で実行しているプログラムによる使用のためのデータを記憶し得る。さらに、システムメモリ10は、ビデオプロセッサ23によって符号化されたビデオデータを記憶し得る。さらに、システムメモリ10は、本開示の技法に従ってビデオ再圧縮ユニット12によって再圧縮されているビデオデータを記憶するように構成され得る。システムメモリ10は、ディスプレイ18上にグラフィカルユーザインターフェース(GUI)を提示するためにCPU6によって使用されるウィンドウマネージャアプリケーションを記憶し得る。さらに、システムメモリ10は、ユーザアプリケーションと、アプリケーションに関連するアプリケーション表面データとを記憶し得る。システムメモリ10は、コンピューティングデバイス2の他の構成要素による使用のための情報、および/または他の構成要素によって生成される情報をさらに記憶し得る。システムメモリ10は、たとえば、ランダムアクセスメモリ(RAM)、スタティックRAM(SRAM)、ダイナミックRAM(DRAM)、読取り専用メモリ(ROM)、消去可能プログラマブルROM(EPROM)、電気的消去可能プログラマブルROM(EEPROM(登録商標))、フラッシュメモリ、磁気データ媒体または光記憶媒体など、1つまたは複数の揮発性または不揮発性メモリまたは記憶デバイスを含み得る。
[0030]概して、ビデオプロセッサ23は、ビデオデータを符号化し、復号するように構成され得る。たとえば、ビデオプロセッサ23は、システムメモリ10中に記憶されたビデオを符号化するように構成され得る。さらに、ビデオプロセッサ23は、カメラ21、CPU6、および/または別のビデオデータソース(たとえば、グラフィックス処理ユニット(GPU))によって生じられた(produced)ピクセル値から、ビデオデータを符号化するように構成され得る。以下でより詳しく説明するように、ビデオプロセッサ23は、本開示の技法に従ってビデオデータを符号化および/またはトランスコードするように構成され得る。
[0031]ビデオプロセッサ23は、ITU−T H.265、高効率ビデオコーディング(HEVC)、規格などのビデオ圧縮規格に従ってビデオデータを符号化し、復号するように構成され得る。HEVC規格文書は、ITU−T H.265,Series H:Audiovisual and Multimedia Systems,Infrastructure of audiovisual services−Coding of moving video,High efficiency video coding、国際電気通信連合(ITU)の電気通信標準化部門、2015年4月として公開されている。本開示で説明する技法はまた、HEVC規格の拡張に従って動作し得る。代替または追加として、ビデオプロセッサ23は、代替的にMPEG−4、Part 10、アドバンストビデオコーディング(AVC)と呼ばれるITU−T H.264規格など、他のプロプライエタリ規格もしくは業界規格、またはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例は、ITU−T H.261、ISO/IEC MPEG−1 Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、および、スケーラブルビデオコーディング(SVC)拡張とマルチビュービデオコーディング(MVC)拡張とを含む(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264を含む。
[0032]概して、HEVC規格は、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含むツリーブロックまたは最大コーディングユニット(LCU)のシーケンスに分割され得ることを記載している。ビットストリーム内のシンタックスデータは、LCUのサイズを定義することができ、LCUは、ピクセルの数に関して最大コーディングユニットである。スライスは、コーディング順序で、いくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分され得る。各ツリーブロックは、4分木に従って、コーディングユニット(CU)にスプリットされ得る。概して、4分木データ構造はCUごとに1つのノードを含み、ルートノードがツリーブロックに対応する。CUが4つのサブCUにスプリットされる場合、CUに対応するノードは、4つのリーフノードを含み、その各々は、サブCUの1つに対応する。
[0033]4分木データ構造の各ノードは、対応するCUのためのシンタックスデータを与え得る。たとえば、4分木のノードは、そのノードに対応するCUがサブCUにスプリットされるかどうかを示すスプリットフラグを含み得る。CUのシンタックス要素は、再帰的に定義されてよく、CUがサブCUにスプリットされるかどうかに依存し得る。CUがさらに分割されない場合、そのCUはリーフCUと呼ばれる。本開示では、元のリーフCUの明示的スプリッティングが存在しない場合でも、リーフCUの4つのサブCUはリーフCUとも呼ばれる。たとえば、16×16サイズのCUがさらにスプリットされない場合、その16×16CUが決してスプリットされなくても、4つの8×8サブCUもリーフCUと呼ばれるようになる。
[0034]CUは、CUがサイズ差異を有しないことを除いて、H.264規格のマクロブロックと同様の目的を有する。たとえば、ツリーブロックは、(サブCUとも呼ばれる)4つの子ノードにスプリットされ得、各子ノードは、今度は親ノードとなり、別の4つの子ノードにスプリットされ得る。4分木のリーフノードと呼ばれる、最後のスプリットされていない子ノードは、リーフCUとも呼ばれるコーディングノードを備える。コード化ビットストリームに関連するシンタックスデータは、最大CU深度と呼ばれる、ツリーブロックがスプリットされ得る最大回数を定義し得、コーディングノードの最小サイズも定義し得る。それに応じて、ビットストリームはまた、最小コーディングユニット(SCU)を定義し得る。本開示は、「ブロック」という用語を、HEVCのコンテキストにおいて、CU、PU、もしくはTUのうちのいずれか、または他の規格のコンテキストにおいて、同様のデータ構造(たとえば、H.264/AVCのマクロブロックおよびそのサブブロック)を指すために使用する。
[0035]CUは、コーディングノードと、コーディングノードに関連付けられた予測ユニット(PU)および変換ユニット(TU)とを含む。CUのサイズは、コーディングノードのサイズに対応し、形状が正方形でなければならない。CUのサイズは、8×8ピクセルから最大64×64ピクセル以上をもつツリーブロックのサイズにまでわたり得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。CUに関連付けられたシンタックスデータは、たとえば、1つまたは複数のPUへのCUの区分を記述し得る。区分モードは、CUが、スキップモード符号化もしくはダイレクトモード符号化されるのか、イントラ予測モード符号化されるのか、またはインター予測モード符号化されるのかによって異なり得る。PUは、形状が非正方形になるように区分され得る。CUに関連付けられたシンタックスデータは、たとえば、4分木に従って、CUを1つまたは複数のTUに区分することも記述し得る。TUは、形状において正方形または非正方形(たとえば、長方形)であってもよい。
[0036]HEVC規格は、異なるCUに対しては異なり得る、TUに従う変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、これは常にそうであるとは限らない。TUは、一般に、PUと同じサイズであるか、またはそれよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT)として知られる4分木構造を使用して、より小さいユニットに再分割され得る。RQTのリーフノードは変換ユニット(TU)と呼ばれ得る。TUに関連するピクセル差分値は、変換係数を生成するために変換され得、その変換係数は量子化され得る。
[0037]リーフCUは、1つまたは複数の予測ユニット(PU)を含み得る。概して、PUは、対応するCUの全部または一部分に対応する空間エリアを表し、そのPUのための参照サンプルを取り出すためのデータを含み得る。さらに、PUは、予測に関するデータを含む。たとえば、PUがイントラモード符号化されるとき、PUのデータは、PUに対応するTUについてのイントラ予測モードを記述するデータを含み得る残差4分木(RQT)中に含まれ得る。別の例として、PUがインターモード符号化されるとき、PUは、PU用の1つまたは複数の動きベクトルを定義するデータを含む場合がある。PUの動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(たとえば、1/4ピクセル精度または1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトルの参照ピクチャリストを記述し得る。
[0038]1つまたは複数のPUを有するリーフCUは、1つまたは複数の変換ユニット(TU)も含み得る。変換ユニットは、上述されたように、(TU4分木構造とも呼ばれる)RQTを使用して指定され得る。たとえば、スプリットフラグは、リーフCUが4つの変換ユニットにスプリットされるかどうかを示し得る。次いで、各変換ユニットは、さらなるサブTUにさらにスプリットされ得る。TUは、さらにはスプリットされないとき、リーフTUと呼ばれ得る。概して、イントラコーディングの場合、リーフCUに属するすべてのリーフTUは、同じイントラ予測モードを共有する。すなわち、リーフCUのすべてのTUの予測値を算出するために、同じイントラ予測モードが概して適用される。イントラコーディングの場合、ビデオエンコーダは、イントラ予測モードを使用して、各リーフTUに対する残差値を、TUに対応するCUの一部と元のブロックとの間の差分として算出することができる。TUは、必ずしも、PUのサイズに限定されるとは限らない。したがって、TUはPUよりも大きくても、または小さくてもよい。イントラコーディングの場合、PUは、同じCUの対応するリーフTUとコロケートされ得る。いくつかの例では、リーフTUの最大サイズは、対応するリーフCUのサイズに対応し得る。
[0039]その上、リーフCUのTUは、残差4分木(RQT)と呼ばれる、それぞれの4分木データ構造にも関連付けられ得る。すなわち、リーフCUは、リーフCUがどのようにTUに区分されるかを示す4分木を含むことができる。TU4分木のルートノードは一般に、リーフCUに対応し、一方、CU4分木のルートノードは一般に、ツリーブロック(またはLCU)に対応する。スプリットされないRQTのTUは、リーフTUと呼ばれる。概して、本開示では、別段に明記されていない限り、リーフCUおよびリーフTUに言及するためにそれぞれCUおよびTUという用語を使用する。
[0040]ビデオシーケンスは、通常、一連のビデオフレームまたはピクチャを含む。ピクチャのグループ(GOP)は、概して、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOP中に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャの1つもしくは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオプロセッサ23は、一般に、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して作用する。ビデオブロックはCU内のコーディングノードに対応し得る。ビデオブロックは、固定サイズまたは変動サイズを有し得、指定されたコーディング規格に応じてサイズが異なり得る。
[0041]一例として、HEVC規格は、様々なPUサイズでの予測をサポートする。CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングに続いて、ビデオプロセッサ23は、CUのTUについての残差データを算出し得る。PUは、(ピクセル領域とも呼ばれる)空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備え得、TUは、変換、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後の、変換領域における係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオプロセッサ23は、CUのための残差データを含むTUを形成し、次いで、CUのための変換係数を生成するためにTUを変換し得る。
[0042]変換係数を生成するためのいずれかの変換に続いて、ビデオプロセッサ23は、変換係数の量子化を実施し得る。量子化は、概して、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化される、さらなる圧縮をもたらすプロセスを指す。量子化プロセスは、係数の一部または全部に関連付けられたビット深度を低減し得る。たとえば、nビット値は、量子化中にmビット値に切り捨てられ得、ここで、nはmよりも大きい。
[0043]量子化の後に、ビデオプロセッサ23は、変換係数を走査して、量子化変換係数を含む2次元行列から1次元ベクトルを生成し得る。走査は、アレイの前部により高いエネルギー(したがって、より低い周波数)係数を配置し、アレイの後部により低いエネルギー(したがって、より高い周波数)係数を配置するように設計され得る。いくつかの例では、ビデオプロセッサ23は、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためのあらかじめ定義された走査順序を利用し得る。他の例では、ビデオプロセッサ23は適応型走査を実施し得る。
[0044]量子化変換係数を走査して1次元ベクトルを形成した後に、ビデオプロセッサ23は、たとえば、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピー符号化方法に従って、1次元ベクトルをエントロピー符号化し得る。ビデオプロセッサ23はまた、ビデオデータを復号する際にビデオデコーダが使用するための、符号化ビデオデータに関連付けられたシンタックス要素をエントロピー符号化し得る。
[0045]カメラ21は、レンズと、光を検出し、カラーピクセル値(たとえば、RGB値)を生成するように構成されたカメラセンサーとを含み得る。カメラ21は、画像信号プロセッサをさらに含み得る。いくつかの例では、画像信号プロセッサは、レンズおよびカメラセンサーと同じパッケージ中に一緒に含まれる。他の例では、画像信号プロセッサは、レンズおよびカメラセンサーとは別個にパッケージングされ得る。画像信号プロセッサは、未加工(raw)センサーデータを受信し、未加工センサーデータを圧縮データフォーマット(たとえば、JPEGファイル)にコンバートし、得られた(resultant)圧縮データをピクチャファイルに記憶するように構成され得る。他の例では、画像信号プロセッサは、未加工センサーデータを保持し、未加工センサーデータを別個のファイルに保存するように構成され得る。
[0046]他の例では、カメラ21は、ビデオをキャプチャするように構成され得る。この例では、カメラ21は、画像センサーによってキャプチャされたビデオデータをビデオプロセッサ23に与え得る。ビデオプロセッサ23は、キャプチャされたビデオデータを、上で言及したビデオ圧縮規格などのビデオ圧縮規格に従って圧縮/符号化するように構成され得る。
[0047]本開示の別の例では、カメラ21は、コンピューティングデバイス2の1つまたは複数の他の構成要素とともに、接続カメラ(またはインターネット接続カメラ)の一部を形成し得る。接続カメラとして構成されるとき、コンピューティングデバイス2(カメラ21を含む)は、ビデオデータのキャプチャならびにキャプチャされたビデオデータの、1つまたは複数の他のネットワーク接続デバイスへの(ワイヤードまたはワイヤレス接続を用いる)ストリーミングの両方を行うように構成され得る。
[0048]CPU6、カメラ21、および/またはビデオプロセッサ23は、ビデオデータをフレームバッファ15に記憶することができる。フレームバッファ15は、独立したメモリであり得るか、またはシステムメモリ10内に割り振られ得る。ディスプレイインターフェースは、フレームバッファ15からデータを取り出し、ビデオデータによって表される画像を表示するようにディスプレイ18を構成し得る。いくつかの例では、ディスプレイインターフェースは、フレームバッファから取り出されたデジタル値を、ディスプレイ18によって消費可能なアナログ信号にコンバートするように構成されたデジタルアナログコンバータ(DAC)を含み得る。他の例では、ディスプレイインターフェースは、処理のために、デジタル値をディスプレイ18に直接渡し得る。ディスプレイ18は、モニタ、テレビジョン、投影デバイス、液晶ディスプレイ(LCD)、プラズマディスプレイパネル、有機LED(OLED)ディスプレイなどの発光ダイオード(LED)アレイ、陰極線管(CRT)ディスプレイ、電子ペーパー、表面伝導電子放出ディスプレイ(SED)、レーザーテレビジョンディスプレイ、ナノ結晶ディスプレイ、または別のタイプのディスプレイユニットを含み得る。ディスプレイ18は、コンピューティングデバイス2内に組み込まれ得る。たとえば、ディスプレイ18は携帯電話のスクリーンであり得る。代替的に、ディスプレイ18は、ワイヤードまたはワイヤレス通信リンクを介してコンピューティングデバイス2に結合されたスタンドアロンデバイスであり得る。たとえば、ディスプレイ18は、ケーブルまたはワイヤレスリンクを介してパーソナルコンピュータに接続されたコンピュータモニタまたはフラットパネルディスプレイであり得る。
[0049]ビデオ再圧縮ユニット12は、ビデオデータの再圧縮、符号化、および/またはトランスコーディングを命じ(direct)、引き起こすように構成される。本開示の技法によると、ビデオ再圧縮ユニット12は、再圧縮、符号化、および/またはトランスコードされたビデオデータの最終ビットレートが、元のビデオデータよりも低いビットレートでのように、ビデオデータを再圧縮、符号化および/またはトランスコードするためのビットレートを決定するように構成され得る。本開示の一例では、ビデオ再圧縮ユニット12は、得られたビデオが、元のビデオデータと比較して無損失であるように見えるか、またはそうであるのに非常に近く見えるように、ビデオデータを再圧縮/符号化/トランスコードするための最終ビットレートを決定するように構成され得る。ビデオ再圧縮ユニット12は、ビットレートと他の符号化パラメータとを決定し、決定されたパラメータに従ってビデオデータをトランスコードおよび/または符号化するよう、ビデオプロセッサ23に命令するように構成され得る。ビデオ再圧縮ユニット12は、プロセッサ(たとえば、CPU6、グラフィックス処理ユニット、デジタル信号プロセッサなど)上で実行するソフトウェアとして、プロセッサ上で実行するファームウェアとして、専用のハードウェアとして、または上記の任意の組合せとして構成され得る。
[0050]後でより詳しく論じるように、本開示のトランスコーディングおよび符号化技法の結果、高い視覚的品質を依然として維持したまま、元のビデオデータよりもサイズが(すなわち、ビットの数において)小さいトランスコード化ビデオデータが生じ得る。したがって、より長い尺の高解像度ビデオ(たとえば、HDビデオ、1080P、1080i、4kなど)が、記憶制限のあるモバイルデバイス(たとえば、スマートフォン、タブレットコンピュータ、ラップトップコンピュータ、接続カメラなど)上で記憶され得る。さらに、帯域幅制限のあるモバイルデバイス(たとえば、スマートフォン、タブレットコンピュータ、ラップトップコンピュータ、接続カメラなど)上で高解像度ビデオをアップロードおよび/または送信するのにかかる時間が減少され得る。
[0051]モバイルデバイスを使ってビデオファイルを記録し、記憶し、送信することに関連したいくつかの問題について、ここで記載する。いわゆる4Kビデオデータを含む高精細ビデオデータはしばしば、非常に大きいファイルサイズを生じる。ビデオが長いほど、ビデオを記憶するのに必要とされる記憶量が大きくなる。同様に、4k60(4k、60フレーム毎秒)のデータを生じる接続カメラは、非常に大きいサイズのビデオファイルを生じ得る。たとえば、H.264ビデオ圧縮規格に従って生じた4kビデオは通常(typically)、48mbps(メガビット毎秒)のビットレートを使う。48mbpsでの、1秒間のH.264 4Kビデオは、6MBの記憶空間(storage space)を使う。48mpbsでの、1分間のH.264 4Kビデオは、360MBの記憶空間を使う。48mpbsでの、1時間のH.264 4Kビデオは、21.6GBの記憶空間を使う。多くのモバイルデバイスは、16GBのストレージまたはそれ未満を有するだけである。したがって、長い尺での4Kビデオの記憶は、多くのデバイスにおいて困難であるか、または不可能でさえあり得る。
[0052]同様に、そのような大きいビデオファイルをモバイルデバイスから転送することも困難であり得る。そのような大きいファイルサイズの結果、従来のワイヤレスサービス(たとえば、4GまたはLTE(登録商標))を使うとき、非常に長いアップロード時間が生じる。さらに、モバイルデバイス向けのワイヤレスサービスはしばしば、ユーザにとってひと月に利用可能な帯域幅の量が制限される。したがって、大きいビデオファイルのアップロードは、実現可能性が低くなる。
[0053]これらの欠点を鑑みて、本開示は、記憶およびアップロード使用ケースを容易にするために、視覚的品質の損失を最小限にして、比較的小さいビデオファイルの作成を可能にするビデオ再圧縮、符号化およびトランスコーディング技法を提案する。
[0054]以下のテーブル1は、本開示の技法向けの様々な使用ケースを概説する。テーブル1に含まれる使用ケースは、それぞれ、図4〜図6に関してより詳しく記載される。
Figure 2018509067
[0055]一例として、モバイルデバイス上で利用可能な限られたメモリの結果、ストレージ短縮問題が生じ得る。すなわち、モバイルデバイスは、4Kまたは他のHDビデオを記憶しようと試みるとき、すぐに(quickly)メモリを使い果たす。現在、モバイルデバイスのユーザは、比較的少ない、比較的短いビデオの記録に制限されている。これは、モバイルデバイスのプレミアム特徴(すなわち、HDおよび4Kビデオを符号化し、復号することができる)の使用を制限する。本開示の再圧縮技法(「VZIP」とも呼ばれる)は、より小さいファイルサイズをもたらすために、ビデオデータを符号化、再圧縮および/またはトランスコードするために使われ得る。
[0056]別の使用ケースとして、本開示の技法は、ビデオデータの共有およびアップロードのために使われ得る。現在、大きいビデオファイルは、アップロードするのに長い時間がかかる。さらに、しばしば、大きいファイルをアップロードするのに関連した高いデータ使用コストが存在する。現在、ビデオは、ビデオアップロードに関連した問題を緩和するために、より低い解像度、フレームレート(すなわち、フレーム毎秒(fps))、およびビットレートにトランスコードされる。ただし、現在のソリューションの結果、乏しい品質のビデオが生じる。本開示の技法は、ビデオ品質の損失を最小限にして、比較的低いビットレートでのビデオファイルの符号化/トランスコーディング/再圧縮を可能にする。
[0057]別の使用ケースとして、本開示の技法は、(たとえば、接続カメラを用いる)ビデオストリーミングのために使われ得る。現在のビデオストリーミングデバイスは、HDおよび/または4kで記録するとき、ストレージをすぐに満杯にする。さらに、ストリーミングされるビデオは通常、低ビットレートに加え、低い視覚的品質で符号化されているので、ストリーミングされるビデオの品質は乏しい。やはり、本開示の技法は、ビデオ品質の損失を最小限にして、比較的低いビットレートでのビデオファイルのトランスコーディング/再圧縮を可能にする。
[0058]概して、本開示の技法は、ビデオの再圧縮、さらなるトランスコーディングのためのビデオの再圧縮、ライブストリーミングのためのビデオの1パス圧縮(符号化)、ならびに/または記録(たとえば、記憶)およびストリーミングのためのビデオの1パス圧縮(符号化)のうちの1つまたは複数を伴う。
[0059]ビデオ再圧縮ユニット12は、比較的低いビットレートでビデオデータを再圧縮、符号化、および/またはトランスコードするようにビデオプロセッサ23を制御するように構成され得る。このコンテキストにおいて、比較的低いビットレートとは、元のビデオデータよりも低いビットレートまたはHDおよび/または4Kビデオに通常使われるはずのもの(たとえば、ビデオ圧縮規格の技法によって規定されたビットレート)よりも低いビットレートである。特に、ビデオ再圧縮ユニット12は、視覚的品質の最小限の損失のみを生じるように、比較的低いビットレートでビデオデータを再圧縮/符号化/トランスコードするように構成され得る。ビデオコーディングのための例示的なレート制御プロセスの考察について、以下で説明する。
[0060]一例では、元のビデオシーケンスのフレームは、イントラモード(Iモード)またはインターモード(PモードまたはBモード)で符号化され得る長方形の領域またはブロックに区分される。ブロックは、DCTコーディングなど、何らかの種類の変換コーディングを使用してコーディングされる。ただし、純粋な変換ベースのコーディングは、単に、ピクセルのブロック間相関を考慮することなしに、特定のブロック内のピクセル間相関を低減するにすぎない。変換ベースのコーディングは、依然として、送信に対する高いビットレートを生じる。HEVCなど、現在のデジタル画像コーディング規格はまた、ブロック間のピクセル値の相関を低減するいくつかの方法も活用する。
[0061]概して、Pモードで符号化されたブロックは、前にコーディングされ、送信されたフレームのうちの1つから予測される。ブロックの予測情報は、2次元(2D)動きベクトルによって表される。Iモードで符号化されたブロックの場合、予測ブロックは、同じフレーム内のすでに符号化された隣接ブロックからの空間予測を使用して形成される。予測誤差E(x,y)、すなわち、符号化されるブロックI(x,y)と予測されるブロックP(x,y)との間の差分は、変換基底関数fij(i,j)の加重和
Figure 2018509067
として表される。
[0062]変換は、一般に8×8(N=8)または4×4(N=4)のブロックベースで実施される。予測誤差係数と呼ばれる重みcijがその後、次のように量子化され、
Figure 2018509067
上式で、lijは、量子化された係数またはレベルと呼ばれる。量子化の演算は情報の損失をもたらす。一方、量子化された係数は、より少ないビット数を用いて表され得る。圧縮(情報の損失)のレベルは、量子化パラメータ(QP)の値を調整することによって制御される。より低いQP値は、一般的に、より少ない歪みをもたらすが、より多くのビット、したがってより高いビットレートを必要とすることがある。より高いQP値は、一般的に、より多くの歪みをもたらすが、より少ないビット、したがってより低いビットレートを必要とすることがある。そのように、QPの選択は、歪みとビットレートとの間のトレードオフがなされ得る1つの技法である。
[0063]量子化変換係数は、動きベクトルおよび何らかの制御情報とともに、完全なコード化シーケンス表現を形成し、シンタックス要素と呼ばれる。ビデオエンコーダからビデオデコーダへの送信の前に、シンタックス要素は、それらの表現に必要なビット数をさらに低減するようにエントロピーコーディングされ得る。
[0064]ビデオデコーダにおいて、現在のフレーム中の再構築ブロックは、ビデオエンコーダによって実施されるのと同様の方法でその予測を最初に構築し、圧縮された予測誤差を予測に追加することによって得られる。圧縮された予測誤差は、逆変換を実施することによる量子化解除された係数を使用することによって、次のように見出される。
Figure 2018509067
[0065]量子化解除された係数(再構築された係数とも呼ばれる)γijは、次のように逆量子化によって算出される。
Figure 2018509067
再構築フレームR(x,y)と元のフレームI(x,y)との間の差分は、再構築誤差と呼ばれる。
[0066]HEVC規格は、量子化、動きベクトルの選択、およびどのフレームが予測に使用されるべきかに関する決定を、ビデオエンコーダの実装者にゆだねる。レート歪み理論は、損失性圧縮の目標を、データをコーディングするためのレートにおける制約に従って、元のデータと選択されたメトリックに従う圧縮されたデータとの間の距離の測度であるコーディング歪みを最小化することの目標に形式化する。したがって、いくつかの例では、ビデオエンコーダの1つの目標は、各フレームに対して、予測誤差E(x,y)と予測誤差の再構築バージョン
Figure 2018509067
との間の平均2乗誤差(MSE)歪みDが、シンタックス要素をコーディングするためのレートRにおける制約に従って最小化されるようなシンタックス要素の値を見つけることである。
Figure 2018509067
[0067]他の付加的な歪みメトリックは、MSEの代わりに、たとえばアクティビティ加重MSEなどを使用することができる。式(5)におけるレート制約問題は、ラグランジュ乗数λを使用して、レートと歪みとを「マージする」ことによって等価な制約なし問題にコンバートされることによって解決され得る。本開示では、ラグランジュ乗数λは、レート制御パラメータと呼ばれることになる。制約なし問題は、シンタックス要素の値の(固定されたλに対する)決定になり、次のように定義される最小総ラグランジュコストを生じる。
Figure 2018509067
[0068]レート制御パラメータλは、レートと歪みとの間のトレードオフを決定するために使用されるパラメータと見なされ得る。低い値のλは、レートよりも歪みを最小化することを選好し、高い値のλは、歪みよりもレートを最小化することを選好する。極限では、λ=0、すなわち歪みが最小化され、λ→∞、すなわちレートが最小化される。
[0069]上記考察からわかるように、ある程度の損失もとり込みながら、ビデオシーケンスのビットレートを低下するための一技法は、QPの値を増大することである。本開示の技法によると、ビデオ再圧縮ユニット12は、HDおよび/または4kビデオを最初に符号化するのに使われているか、または使われていたはずのものよりも高いQP値を使ってビデオデータを符号化/トランスコードするよう、ビデオプロセッサ23に命令するように構成され得る。本開示の一例では、ビデオ再圧縮ユニット12は、コンピューティングデバイス2上にあらかじめ記憶されているルックアップテーブルを使って、ビデオデータを符号化/トランスコードするために使うためのQP値を決定するように構成され得る。ルックアップテーブルは、複数の異なるQP値について、ビデオデータに対する視覚的品質における損失の量を示し得る。ルックアップテーブル中の視覚的品質メトリックにおける損失は、ビデオデータのフレームレート、解像度、および複雑度を含む、ビデオデータの他の特性に基づき得る。
[0070]ビデオ再圧縮ユニット12は、ビデオ品質における得られた損失が、ある程度の閾(threshold)を下回るように、符号化/トランスコーディングに使うためのQP値を決定するように構成され得る。一例では、閾は、知覚される視覚的無損失閾と呼ばれる場合があり、知覚される視覚的品質メトリックに基づき得る。知覚される視覚的無損失閾および知覚される視覚的品質メトリックは、人間の眼には検出不可能および/またはほぼ(barely)検出不可能である、視覚的品質の損失の量を表すように、あらかじめ決定されてよい。他の例では、知覚される視覚的無損失閾および知覚される視覚的品質メトリックは、HDおよび/または4Kビデオという予想(expectations)が与えられたとき、平均的ユーザにとって受容可能な、視覚的品質の損失の量を表すように、あらかじめ決定されてよい。ビデオ再圧縮ユニット12は、視覚的品質における、得られた損失が、知覚される視覚的無損失閾を依然として下回るように、QP値と、したがって量子化の程度(degree)とを選択するように構成され得る。
[0071]図2は、本開示に記載される技法を実装し得る、図1からのビデオ再圧縮ユニット12の例を示すブロック図である。概して、ビデオ再圧縮ユニット12は、単一ステップで、視覚的品質における知覚可能損失なしで、ビデオクリップを再圧縮するように構成される。さらに、ビデオ再圧縮ユニット12は、フレームの復号または符号化が反復されないように、ビデオクリップの各フレームの一度の復号と符号化とを含む、ビデオクリップのワンステップ再圧縮を提供するように構成される。ほぼ視覚的無損失な再圧縮は、正常な再生速度では人間の眼には同じに見えるビデオクリップを結果として生じる再圧縮として定義され得る。より詳細には、ほぼ視覚的無損失な再圧縮は、対応するビデオ品質メトリックについて定義された視覚的無損失閾に基づいて測定され得る。
[0072]開示される再圧縮技法は結果として、同じか、またはより低いビットレートを有するビデオフレームを生じる。いくつかの例では、解像度、フレームレート、コーディング規格および他のビデオコーデック特徴など、他のビデオクリップパラメータが、ほぼ視覚的無損失な圧縮を達成するように変更され得る。ビデオクリップは、量子化パラメータ/ステップ/インデックス/値(HEVC、H.264、MPEG−4、MPEG−2、H.263、VC−1を含むが、それらに限定されない)または固有コーデック(VP9、VP8を含むが、それらに限定されない)を使う、どのビデオ規格において符号化されてもよい。
[0073]図2の図示される例では、ビデオ再圧縮ユニット12は、デコーダ30と、QP選択ユニット32と、エンコーダ34と、再符号化複雑度(REC)モデル36とを含む。概して、開示される再圧縮技法は、オンライン段階とオフライン段階とを含む。たとえば、ビデオ再圧縮ユニット12は、オフラインで生成されるRECモデル36に基づく、ビデオフレームのオンライン再圧縮を実施し得る。RECモデル36のオフライン生成については、図3に関して以下でより詳しく説明する。
[0074]本開示に記載される再圧縮技法に従って、デコーダ30は、第1のビットレート(たとえば、4Kビデオの場合は48mbps)で符号化されたビデオフレームをシステムメモリ10から取り出し、ビデオフレームを復号する。デコーダ30は、復号ビデオフレームのQP値を記録し、シーンを特徴づけるシーン統計を抽出するYUV統計計算ライブラリに、復号ビデオフレームを渡せばよい。デコーダ30は次いで、復号ビデオフレームに関連付けられたシーン統計(たとえば、YUV統計)と、復号ビデオフレーム用のQP値とを、QP選択ユニット32に送る。QP選択ユニット32は、ビデオ品質における視覚的に知覚可能な損失なしで、より低い第2のビットレートでビデオフレームを再圧縮するのに使われる新たなQP値を選択する。ビデオエンコーダ34は次いで、第2のビットレートで、選択されたQP値に従ってビデオフレームを符号化すればよい。
[0075]本明細書に記載される視覚的無損失圧縮は、2つの統計セット、すなわち(1)YUVバッファ中の復号ビデオフレームからのYUVまたはシーン統計および(2)エンコーダマクロブロック情報(MBI)からのビットストリーム統計(ビーナス統計と呼ばれることもある)に基づいて可能にされる。ビットストリーム統計は、符号化統計であり、フレームレート(たとえば、fps)、複雑度、QP、ビットレート、コーディングモードなどのようなビデオ特性を含み得る。QP選択ユニット32は、復号ビデオフレーム用のQP値に基づく視覚的無損失QP値を選択するために、ビットストリーム統計をシーン統計と組み合わせる。ビデオフレームは次いで、この推定QPを用いて再圧縮される。再符号化ビデオフレームは、そのMBIが解析されて(parsed for)よく、符号化ビットストリーム統計が計算され、QP選択ユニット32にフィードバックされる。ビデオ再圧縮ユニット12は、開示される技法がフレーム単位で新たなQP値を選択するので、レート制御がオフにされて動作する。
[0076]QP選択ユニット32は、RECモデル36として記憶されている、事前計算されたQP値から、ビデオフレームの再圧縮のための新たなQP値を選択してよい。たとえば、ビデオ再圧縮ユニット12のQP選択ユニット32は、ビデオデコーダ30からのビデオフレームに関連付けられたシーン統計(たとえば、YUV統計)と、ビデオエンコーダ34からの、前に符号化されたビデオフレームに関連付けられたビットストリーム統計とに基づいて、ビデオフレーム用のREC値または再圧縮統計を決定することができる。
[0077]このようにして、REC値は、未加工ピクチャ情報から生成された空間的、時間的、およびコーディング統計(たとえば、YUVまたはシーン統計)ならびにビデオクリップの前のフレームの符号化中に集められた情報(たとえば、ビットストリーム統計)を使って生成され得る。一例では、未加工ピクチャ情報は、3つの知覚的特徴、すなわちテクスチャマスキング、輝度マスキング、および時間的マスキングに対応するテクスチャ測度と、輝度測度と、時間的測度とを含み得る。この例では、コーディング複雑度統計は、符号化プロセス中に集められた情報から導出される空間的および動き複雑度測度を含み得る。再圧縮統計は次いで、個々の測度、プーリング、またはスカラーベクトルマシン(SVM)の積をとることによる合成を含むが、それに限定されない方法を使うことによって、個々の空間的、時間的、およびコーディング統計の組合せとして導出され得る。
[0078]QP選択ユニット32は、ビデオフレーム用に決定されたREC値に基づいて、RECモデル36からQP値を選択する。RECモデル36は、REC値または再圧縮統計を、ほぼ視覚的無損失な再圧縮のための最大QP値にマッピングし(map)得る。RECモデル36は、ルックアップテーブル(LUT)または関数を使うことを含む、いくつかのやり方で実装され得る。一例では、RECモデル36は、所与のQP値でのビデオフレーム用のREC値によってインデックス付けされたデルタ(delta)QP LUTを備え得る。別の例では、RECモデル36は、所与のQP値でのビデオフレーム用のREC値に基づくデルタQP値を戻す関数を備え得る。QP選択ユニット32は次いで、ビデオフレーム用のデルタQP値および前のQP値に基づいて、ビデオフレームを再圧縮するための新たなQP値を算出する。
[0079]図2に示される例では、本開示のほぼ視覚的無損失なビデオ再圧縮技法は、ビデオクリップを復号することと、再圧縮統計(たとえば、REC値)を生成することと、視覚的無損失である再圧縮ビデオクリップを生成する最も高いQP値を見つけるために、再圧縮統計からQP値(たとえば、RECモデル36)へのマッピングを使うことと、ビデオクリップを再符号化することとを実施する。他の例では、本開示のほぼ視覚的無損失なビデオ再圧縮技法は、ビデオクリップを復号する必要をなくし、代わりに、ビデオ再圧縮技法を未加工ビデオに直接適用すること、異なる解像度、フレームレートおよびビットレートで複数の再圧縮ビデオクリップを生成すること、またはクリップ全体に対してではなく、フレームごとに圧縮を実施することのうちの1つまたは複数を実施し得る。
[0080]図3は、本開示に記載される技法に従って、RECモデル36を生成するのに使われ得る例示的なLUT生成システム40を示すブロック図である。概して、RECモデル36は、ビデオクリップ用のREC値を、ビデオ品質における視覚的に知覚可能な損失なしでビデオクリップを再符号化するのに使われ得る最も高いデルタQP値にマッピングするように生成され得る。LUT生成システム40は、ビデオ再圧縮ユニット12およびコンピューティングデバイス2にとって外部であり、それらとは別個であってよい。RECモデル36は、LUT生成システム40によってオフラインで生成され得る。図3の例では、RECモデル36は、LUTとして実装されるものとして記載される。他の例では、RECモデル36は、数学関数として実装されてよい。
[0081]図3に示される例では、LUT生成システム40は、ビデオデータベース42と、エンコーダ44と、品質メトリックユニット46と、REC計算ユニット48とを含む。RECモデル36は、複数のビデオクリップを含むビデオデータベース42に基づくトレーニング方法に従って生成され得る。一例では、ビデオデータベース42中の各ビデオクリップは、エンコーダ44によって、特定の(certain)元のQP値(たとえば、H.264の場合は0〜51)で符号化され得る。品質メトリックユニット46は次いで、ビデオクリップを、一定の範囲のQP値で再圧縮し、再圧縮ビデオクリップの品質メトリックを、QP値の各々で測定する。通常、ビデオクリップ用の元のQP値よりも大きいQP値のみ(すなわち、ゼロでないデルタQP値)が、トレーニング方法において使われる。このようにして、品質メトリックユニット46は、ビデオクリップが、ビデオクリップの所与の内容と元のQP値とに対するビデオ品質における視覚的知覚可能損失なしで再符号化され得る最も高いQP値を決定することができる。
[0082]品質メトリックユニット46は、客観的ビデオ品質メトリックのようなビデオ品質メトリック(VQM)、視覚的情報忠実度(VIF)、構造的類似性(SSIM)およびその変形体、量子化パラメータステップサイズ(QSTEP)、ならびにピーク信号対ノイズ比(PSNR)/平均2乗誤差(MSE)を含むが、それに限定されない、多くの異なるビデオ品質メトリックを使って、各QP値で再圧縮されたビデオクリップの視覚的品質を測定し得る。品質メトリックユニット46は次いで、品質メトリックを、品質メトリック用に定義された視覚的無損失閾(VLT)と比較すればよい。ビデオ品質が増すのに従って(as)ビデオ品質メトリックが増すと仮定すると、再圧縮ビデオクリップは、再圧縮ビデオクリップの品質メトリックがVLTよりも大きいか、または等しい場合、視覚的に無損失であると決定され得る。一例では、VLTは、二重刺激連続品質尺度(DSCQS)方法を使う主観的検査(testing)を使って決定され得る。
[0083]REC計算ユニット48は、決定された最も高いQP値でのビデオクリップ用のREC値を生成するために、ビデオクリップについて導出された空間的、時間的、およびコーディング統計を使うことができる。これらのステップによって生成されたデータすべてから、REC値の平均および分散またはQP値の範囲についての再圧縮統計を含むすべてのQP値について、RECモデル36が生成される。このように、RECモデル36は、ビデオ品質における視覚的に知覚可能な損失なしでビデオフレームを再圧縮するための最大QP値を決定するためにビデオ再圧縮ユニット12によって使われ得る、複数の事前計算されたQP値を含む。
[0084]図4は、図1からのコンピューティングデバイス2のビデオ再圧縮ユニット12によって実施されるストレージ短縮のためのビデオ再圧縮の例示的な使用ケースを示すブロック図である。図4に示されるストレージ短縮使用ケースにおいて、コンピューティングデバイス2のビデオ再圧縮ユニット12は、より高い第1のビットレートで最初に符号化されるとともに第1のファイルサイズで記憶されたビデオフレームを、第1のファイルサイズよりも小さい第2のファイルサイズで記憶するために、より低い第2のビットレート(すなわち、第1のビットレートよりも低い)に再圧縮するように構成され得る。いくつかの例では、第2のビットレートは、第1のビットレートよりも30〜70%低くてよく、第2のファイルサイズは、第1のファイルサイズよりも30〜70%小さくてよい。
[0085]図4に示される例では、ビデオエンコーダ52は、ビデオソース50から未加工ビデオフレームを受信し、ビデオフレームをより高い第1のビットレート(たとえば、48mbps)で符号化し、ビデオフレームをシステムメモリ10に記憶する。ビデオエンコーダ52は、符号化ビデオフレームに関連付けられたビットストリーム統計をシステムメモリ10に記憶することもできる。いくつかの例では、ビデオエンコーダ52は、コンピューティングデバイス2のビデオプロセッサ23のエンコーダ部分を備え得る。ビデオソース50は、コンピューティングデバイス2のカメラ21または外部カメラを備え得る。
[0086]開示される技法によると、ビデオフレームの再圧縮は、ビデオ再圧縮ユニット12によって識別されたトリガ条件によってトリガされ得る。たとえば、トリガ条件は、プリセットされた、または周期タイマの満了、低い使用回数(たとえば、夜間)の検出、またはコンピューティングデバイス2がプラグインされたという検出など、コンピューティングデバイス2の特性を備え得る。トリガ条件は、再圧縮をいつ実施するかをユーザが明示的に選択すること、またはコンピューティングデバイス2上で実行される特定のアプリケーション、すなわち「アプリ」を使ってビデオフレームを共有し、アップロードし、またはストリーミングすることをユーザが要求することなど、コンピューティングデバイス2へのユーザ入力も備え得る。いくつかの例では、記憶されたビデオフレームの再圧縮は、ユーザエクスペリエンスに対して最小限の影響を課すように、バックグラウンドにおけるすべてのビデオファイルについて自動的に実施され得る。たとえば、すべての新たに記録されたビデオファイルが、コンピューティングデバイス2がプラグインされ、充電中のとき、毎晩再圧縮され得る。
[0087]トリガ条件を識別すると、ビデオ再圧縮ユニット12は、再圧縮されるべきビデオフレームを取得する。上述したように、ビデオ再圧縮ユニット12は、第1のビットレートで符号化されたビデオフレームを復号し、再圧縮ビデオフレームが、元のビデオフレームと比較してほぼ視覚的に無損失となるように、ビデオフレームを再圧縮するための新たなQP値を選択し、より低い第2のビットレートで、選択されたQP値に従ってビデオフレームを再符号化するように構成され得る。ビデオ再圧縮ユニット12は次いで、第2のビットレートで再圧縮されたビデオフレームをシステムメモリ10に記憶する。
[0088]図5は、図1からのコンピューティングデバイス2のビデオ再圧縮ユニット12によって実施されるビデオ共有のためのビデオ再圧縮の例示的な使用ケースを示すブロック図である。図5に示されるビデオ共有使用ケースにおいて、本開示のビデオ再圧縮技法は、コンピューティングデバイス2上で実行されるビデオ共有アプリケーション用のトランスコード設定(settings)に基づくビデオトランスコーディングとともに作用する(work in conjunction with)。コンピューティングデバイス2のビデオ再圧縮ユニット12は、より高い第1のビットレートで最初に符号化されたビデオフレームを、記憶するとともに、ビデオ共有アプリケーションを介して後で共有し、アップロードし、またはストリーミングするために、より低い第2のビットレートにトランスコードし、再圧縮するように構成され得る。
[0089]図5に示される例では、ビデオエンコーダ52は、ビデオソース50から未加工ビデオフレームを受信し、ビデオフレームをより高い第1のビットレートで符号化し、ビデオフレームをシステムメモリ10に記憶する。ビデオエンコーダ52は、符号化ビデオフレームに関連付けられたビットストリーム統計をシステムメモリ10に記憶することもできる。いくつかの例では、ビデオエンコーダ52は、コンピューティングデバイス2のビデオプロセッサ23のエンコーダ部分を備え得る。ビデオソース50は、コンピューティングデバイス2のカメラ21または外部カメラを備え得る。
[0090]開示される技法によると、ビデオフレームのトランスコードおよび再圧縮が、コンピューティングデバイス2上で実行されるビデオ共有アプリケーション(「ビデオアプリ」)54を使って、記憶されたビデオファイルを共有し、アップロードし、またはストリーミングすることをユーザが要求することによってトリガされ得る。ビデオアプリ54は、ビデオアプリ54を介して共有され、アップロードされ、またはストリーミングされるべきビデオクリップについての解像度、フレームレート(たとえば、fps)、または目標ビットレート(target bitrate)のうちの1つまたは複数を指示する、トランスコード設定を、ビデオ再圧縮ユニット12に与えればよい。トリガ条件を識別し、トランスコード設定を受信すると、ビデオ再圧縮ユニット12は、トランスコードされ、再圧縮されるべきビデオフレームを取得する。
[0091]ビデオ再圧縮ユニット12は、第1のビットレートで符号化されたビデオフレームを復号し、ビデオアプリ54から受信されたトランスコード設定に従ってビデオフレームの設定を修正し、ビデオフレームのトランスコードされた内容と比較して、再圧縮ビデオフレームがほぼ視覚的に無損失になるようにビデオフレームを再圧縮するための新たなQP値を選択し、より低い第2のビットレートで、選択されたQP値に従ってビデオフレームを修正された設定で再符号化するように構成され得る。ビデオ再圧縮ユニット12は次いで、第2のビットレートで再圧縮されたトランスコード化ビデオフレームをシステムメモリ10に記憶する。
[0092]いくつかの例では、第2のビットレートは、第1のビットレートの両方よりも低く、ビデオ共有アプリケーション用のトランスコード設定によって指定された目標ビットレートよりも低いか、または等しくてよい。さらに、トランスコードおよび再圧縮されたビデオフレームは、目標ビットレートによって(depending on)は、ビデオフレームのトランスコードされた内容(content)と比較して、ほぼ視覚的に無損失であり得る。この場合、トランスコードされた内容は、ビデオフレームが復号され、ビデオ共有アプリケーション用のトランスコード設定によって指定された解像度およびフレームレートにトランスコードされた後に生成された未加工の内容である。
[0093]図6は、図1からのコンピューティングデバイス2のビデオ再圧縮ユニット12によって実施されるライブビデオ録音のためのビデオ再圧縮の例示的な使用ケースを示すブロック図である。図6に示されるライブ記録使用ケースにおいて、コンピューティングデバイス2のビデオ再圧縮ユニット12は、第1のビットレートでのライブ記録のビデオフレームを、記憶および/または送信用に、より低い第2のビットレートに圧縮するように構成され得る。いくつかのケースでは、ビデオ再圧縮ユニット12は、ビデオフレームの2つの圧縮バージョンを生成することができ、1つは、記憶用により低い第2のビットレートにおけるものであり、もう1つは、送信用により一層低い第3のビットレートにおけるものである。
[0094]図6に示される例では、ビデオ再圧縮ユニット12は、より高い第1のビットレートでの未加工ビデオフレームを、ビデオソース50から直接受信する。開示される技法によると、ビデオ再圧縮ユニット12は、システムメモリ10への記憶またはコンピューティングデバイス2の送信機(「TX」)56による送信のいずれかに先立って、未加工ビデオフレームの圧縮を実施することができる。ビデオ再圧縮ユニット12は、符号化ビデオフレームに関連付けられたビットストリーム統計をシステムメモリ10に記憶することもできる。ビデオソース50は、コンピューティングデバイス2のカメラ21または外部カメラを備え得る。
[0095]上述したように、ビデオ再圧縮ユニット12は、元のビデオフレームと比較して圧縮ビデオフレームがほぼ視覚的に無損失になるように、ライブ記録のビデオフレームを圧縮するためのQP値を選択し、より低い第2のビットレートで、選択されたQP値に従ってビデオフレームを符号化するように構成され得る。一例では、ビデオ再圧縮ユニット12は次いで、第2のビットレートで圧縮されたビデオフレームをシステムメモリ10に記憶する。第2のビットレートは、第1のビットレートよりも30〜70%低くてよい。別の例では、ビデオ再圧縮ユニット12は、第2のビットレートで圧縮されたビデオフレームを、送信、たとえば、ビデオ共有、アップロード、またはストリーミングのためにTX56に送る。
[0096]さらなる例では、本開示の再圧縮技法は、ライブ記録のビデオフレームを、記憶用により低い第2のビットレートで圧縮するために、および同じビデオフレームを、より一層低い第3のビットレートで送信用に圧縮するために適用され得る。ビデオフレームを送信用に生成するために、ビデオ再圧縮ユニット12は、元のビデオフレームの設定を、ビデオ共有、アップロード、またはストリーミングのためのトランスコード設定に従って修正してよい。たとえば、ビデオ再圧縮ユニット12は、ビデオフレームの解像度、フレームレート(たとえば、fps)、または目標ビットレートのうちの1つまたは複数を修正してよい。ビデオ再圧縮ユニット12は、圧縮ビデオフレームが、ビデオフレームの修正された内容と比較してほぼ視覚的に無損失になるように、ビデオフレームを圧縮するためのQP値を選択し、より低い第3のビットレートで、選択されたQP値に従って、ビデオフレームを修正された設定で符号化するように構成され得る。ビデオ再圧縮ユニット12は次いで、第3のビットレートで圧縮されたビデオフレームを、送信、たとえば、ビデオ共有、アップロード、またはストリーミングのためにTX56に送る。いくつかの例では、第3のビットレートは、第1のビットレートおよび第2のビットレートよりも低く、トランスコード設定によって指定された目標ビットレートよりも低いか、または等しくてよい。
[0097]図7は、所与のビットレートにおける異なる品質レベルを有する異なるビデオクリップについての例示的なレート歪み曲線を示すグラフである。図7において、1080pで記録されたビデオクリップ60、62、64および66についてRD曲線が示されている。見るとわかるように、ビデオクリップ66は、他のビデオクリップよりも低いビットレートにおいて、より高い品質(すなわち、ピーク信号対ノイズ比(PSNR)を有する。たとえば、楕円68によって示されるように、ビデオクリップ60、62、64および66は、20mbpsのビットレートにおいて38dBから43dBにまでわたる(ranging)それぞれの品質レベルを有する。
[0098]通常、エンコーダビットレートは、最も複雑なビデオクリップが良好なビデオ品質を達成することを保証するように設定される。図7によって示される例では、良好なビデオ品質が38dBであると想定される場合、エンコーダビットレートは、ビデオクリップ60、62、64および66のすべてが良好なビデオ品質レベルを達成することを保証するために、20mbpsに設定され得る。ただし、見るとわかるように、ビデオクリップ60、62、64および66は、38dBという良好なビデオ品質レベルを依然として達成したまま、より低いビットレートで符号化され得る。
[0099]本開示の技法は、視覚的無損失閾を使って、各ビデオクリップ用に可能なビットレート低減の量を決定する。ビットレート低減の量は、所与のビデオクリップの内容に依存する。たとえば、38dBのビデオ品質を達成するために、ビデオクリップ60は、10%のビットレート低減のために18mbpsのビットレートで再圧縮されてよく、ビデオクリップ62は、50%のビットレート低減のために10mbpsのビットレートで再圧縮されてよく、ビデオクリップ64は、65%のビットレート低減のために7mbpsのビットレートで再圧縮されてよく、ビデオクリップ66は、85%のビットレート低減のために3mbpsのビットレートで再圧縮されてよい。
[0100]図8は、本開示に記載されるビデオ再圧縮技法の例示的な性能レベルを示すグラフである。図8において、元のビデオクリップ1〜5用の圧縮ビットレートは対角線ストリップボックス(diagonal stripped boxes)として示され、開示される技法に従って再圧縮されたビデオクリップ1〜5用の再圧縮ビットレートは白いボックスとして示される。さらに、開示される技法によって達成されるファイルサイズ低減パーセンテージ70が、ビデオクリップ1〜5の各々について描かれる。見るとわかるように、開示される技法のファイルサイズ低減パーセンテージ70は、ビデオクリップ1〜5の内容によって、30%から70%超にまでわたる。ビデオクリップ1〜5は、半速度(half-speed)では4K30、またはリアルタイムでは1080p30で記録され得る。
[0101]図9は、本開示で説明するビデオ再圧縮技法の例示的な動作を示すフローチャートである。図9の例示的な動作が、図2からのビデオ再圧縮ユニット12に関して説明される。
[0102]概して、ビデオ再圧縮ユニット12は、コンピューティングデバイス2のシステムメモリ10中での記憶またはコンピューティングデバイス2による送信(たとえば、ビデオ共有、アップロード、またはストリーミング)のうちの1つまたは複数のために、ビデオフレームを再圧縮し得る。一例では、ビデオ再圧縮ユニット12は、メモリ消費を削減するように、ビデオフレームを、記憶のために再圧縮し得る。たとえば、第1のビットレートで符号化されたビデオフレームは、第1のファイルサイズを有するシステムメモリ10中に記憶されてよく、第2のビットレートで再圧縮されたビデオフレームは、第1のファイルサイズよりも小さい第2のファイルサイズを有するシステムメモリ10中に記憶されてよい。別の例では、ビデオ再圧縮ユニット12は、ビデオ共有、アップロード、またはストリーミング中の電力消費を削減するように、ビデオフレームを送信用に再圧縮し得る。
[0103]本開示の技法によると、ビデオ再圧縮ユニット12は最初に、複数の事前計算されたQP値を記憶する(80)。事前計算されたQP値は、RECモデル36として記憶され得る。いくつかの例では、RECモデル36は、所与のQP値でのビデオフレームについての複雑度値によってインデックス付けされたデルタQPルックアップテーブル(LUT)を備え得る。他の例では、RECモデル36は、所与のQP値でのビデオフレームについての複雑度値、たとえば、REC値に基づくデルタQP値を戻す関数を備え得る。いずれのフォーマットでも、事前計算されたQP値は、コンピューティングデバイス2のシステムメモリ10中に記憶され得る。図3に関して上述したように、複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算され得る。
[0104]動作中、ビデオ再圧縮ユニット12は、第1のビットレートでビデオフレームを取得する(82)。一例では、ビデオ再圧縮ユニット12は、第1のビットレートで符号化されたビデオフレームをシステムメモリ10から取り出すことができる。たとえば、コンピューティングデバイス2は、第1のビットレートで符号化されたビデオフレームをシステムメモリ10へ記憶してよい。ビデオ再圧縮ユニット12は、ビデオフレームの再圧縮のためのトリガ条件を識別し、トリガ条件を識別したこと(identifying)に応答して、第1のビットレートで符号化されたビデオフレームを、ビデオフレームの再圧縮のためにシステムメモリ10から取り出すことができる。
[0105]トリガ条件は、低い使用回数(たとえば、夜間)を検出したとき、またはコンピューティングデバイス2がプラグインされたことを検出したときの、プリセットされた、または周期タイマの満了など、コンピューティングデバイス2の特性を備え得る。トリガ条件は、再圧縮をいつ実施するかをユーザが明示的に選択すること、またはコンピューティングデバイス2上で実行される特定のアプリケーション、すなわち「アプリ」を使ってビデオフレームを共有し、アップロードし、またはストリーミングすることをユーザが要求することなど、デバイスへのユーザ入力も備え得る。
[0106]別の例では、ビデオ再圧縮ユニット12は、ビデオフレームを、ライブビデオ記録から直接取得し得る。たとえば、コンピューティングデバイス2は、未加工ビデオフレームのシーケンスを、コンピューティングデバイス2のカメラ21から、または外部カメラから受信し得る。コンピューティングデバイス2のビデオプロセッサ23は次いで、未加工ビデオフレームのシーケンスを、ビデオフレームの圧縮のために、第1のビットレートでビデオ再圧縮ユニット12に直接送ればよい。
[0107]第1のビットレートでビデオフレームを取得すると、ビデオ再圧縮ユニット12は、ビデオフレームについての複雑度値、たとえば、REC値を、ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて決定する(84)。たとえば、ビデオ再圧縮ユニット12のQP選択ユニット32は、ビデオフレームに関連付けられたシーン統計(たとえば、YUV統計)と、前に符号化されたビデオフレームに関連付けられたビットストリーム統計とに基づいて、ビデオフレーム用のREC値を決定することができる。
[0108]ビデオ再圧縮ユニット12は次いで、ビデオフレームについての複雑度値(たとえば、REC値)に基づいて、複数の事前計算されたQP値からQP値を選択する(86)。たとえば、QP選択ユニット32は、ビデオフレーム用の前のQP値でのビデオフレームについての複雑度値によってインデックス付けされたルックアップテーブルとしてフォーマットされたRECモデル36から、デルタQP値を選択すればよい。QP選択ユニット32は次いで、デルタQP値および前のQP値に基づいて、ビデオフレーム用の新たなQP値を算出する。
[0109]複数の事前計算されたQP値は、QP選択ユニット32が、ビデオフレーム用のQP値をワンステップで選択することを可能にする。このようにして、QP選択ユニット32は、ビデオフレーム用の新たなQP値の選択の複数回の繰返しを実施する(performing)のを避ける。QP選択と、したがってビデオフレーム再圧縮とを、ワンステップで実施することによって、本開示の技法は、コンピューティングデバイス2におけるビデオ再圧縮ユニット12の計算的負担および/または電力消費量を低減することができる。
[0110]ビデオ再圧縮ユニット12は次いで、選択されたQP値に従って、ビデオ品質における視覚的に知覚可能な損失なしで、ビデオフレームを第1のビットレートから第2のビットレートに再圧縮し、第2のビットレートは第1のビットレートよりも低い(88)。一例では、ビデオ再圧縮ユニット12のデコーダ30が、第1のビットレートで符号化されたビデオフレームを最初に復号し、ビデオ再圧縮ユニット12のエンコーダ34が、第2のビットレートで、選択されたQP値に従ってビデオフレームを再符号化する。この例では、QP選択ユニット32は、デコーダ30から受信された復号ビデオフレームのシーン統計と、エンコーダ34から受信された、前に符号化されたビデオフレームのビットストリーム統計とに基づいて、複雑度値(たとえば、REC値)を決定し得る。QP選択ユニット32は次いで、決定された複雑度値に基づいて、ビデオフレーム用のQP値を選択する。
[0111]別の例では、ビデオ再圧縮ユニット12のデコーダ30が最初に、第1のビットレートで符号化されたビデオフレームを復号し、QP選択ユニット32がビデオフレームの設定を修正し、ビデオ再圧縮ユニット12のエンコーダ34が、第2のビットレートで、選択されたQP値に従って、修正された設定でビデオフレームを再符号化する。
[0112]この例では、QP選択ユニット32はやはり、デコーダ30から受信された復号ビデオフレームのシーン統計と、エンコーダ34から受信された、前に符号化されたビデオフレームのビットストリーム統計とに基づいて、複雑度値(たとえば、REC値)を決定し、次いで、決定された複雑度値に基づいてビデオフレーム用のQP値を選択し得る。さらに、QP選択ユニット32は、復号ビデオフレームをトランスコードするために、ビデオフレームの解像度、フレームレート、または目標ビットレートのうちの1つまたは複数を修正してよい。ビデオフレームをトランスコードすることとの組合せで再圧縮を実施することは、コンピューティングデバイス2上で実行される特定のアプリケーション、すなわち「アプリ」を使って、ビデオフレームを共有、アップロード、またはストリーミングのために準備するとき、特に有用であり得る。
[0113]さらなる例では、ビデオ再圧縮ユニット12は、ビデオフレームをシステムメモリ10中に記憶するために、第1のビットレートから第2のビットレートへの、ビデオフレームの第1の圧縮を実施し、ビデオフレームを送信するために、第1のビットレートから第3のビットレートへの、ビデオフレームの第2の圧縮も実施し、第3のビットレートは第1のビットレートよりも低い。いくつかのケースでは、第3のビットレートは、第2のビットレートよりも低くてもよい。この場合、ビデオフレームは、第1のビットレートでの元のビデオフレームと比較して、ビデオ品質における視覚的に知覚可能な損失なしで、第2のビットレートで記憶され得る。さらに、ビデオフレームは、共有、アップロード、またはストリーミングのために、修正またはトランスコード化ビデオフレームと比較して、ビデオ品質における視覚的に知覚可能な損失なしで、第3のビットレートで送信され得る。
[0114]例に応じて、本明細書で説明される技法のうちのいずれかのいくつかの行為またはイベントは、異なるシーケンスで実施され得、追加、マージ、または完全に除外され得る(たとえば、すべての説明される行為またはイベントが本技法の実践のために必要であるとは限らない)ことを認識されたい。その上、いくつかの例では、行為またはイベントは、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを用いて、連続的にではなく同時に実施され得る。
[0115]1つまたは複数の例では、説明される機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとして、コンピュータ可読媒体上に記憶されるか、またはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応する、コンピュータ可読記憶媒体を含み得るか、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む通信媒体を含み得る。
[0116]このように、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、または(2)信号もしくは搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法の実装のために命令、コード、および/またはデータ構造を取り出すために、1つもしくは複数のコンピュータまたは1つもしくは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含むことできる。
[0117]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM、CD−ROMもしくは他の光ディスクストレージ、磁気ディスクストレージ、もしくは他の磁気ストレージデバイス、フラッシュメモリ、または、命令もしくはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る任意の他の媒体を備え得る。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびBlu−ray(登録商標)ディスク(disc)を含み、ここで、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲に含まれるべきである。
[0118]命令は、1つまたは複数のデジタルシグナルプロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他の同等の集積された論理回路もしくは個別の論理回路構成など、1つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用される「プロセッサ」という用語は、上記の構造、または本明細書で説明された技法の実装に好適な他の構造のいずれかを指すことがある。加えて、いくつかの態様では、本明細書に記載された機能は、符号化および復号のために構成された専用ハードウェアおよび/もしくはソフトウェアモジュール内に設けられるか、または複合コーデックに組み込まれる場合がある。また、本技法は、1つまたは複数の回路または論理要素で十分に実装され得る。
[0119]本開示の技法は、ワイヤレス通信デバイス、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置に実装される場合がある。本開示では、開示する技法を実施するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。
[0120]本開示の様々な例について説明した。説明されたシステム、動作、または機能の任意の組合せが企図される。これらおよび他の例は以下の特許請求の範囲内にある。
[0120]本開示の様々な例について説明した。説明されたシステム、動作、または機能の任意の組合せが企図される。これらおよび他の例は以下の特許請求の範囲内にある。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータを処理する方法であって、
複数の事前計算された量子化パラメータ(QP)値を記憶することと、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、
第1のビットレートでビデオフレームを取得することと、
前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定することと、
前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択することと、
前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮することと、前記第2のビットレートは前記第1のビットレートよりも低い、を備える方法。
[C2]
前記第1のビットレートで符号化された前記ビデオフレームをデバイスのメモリへ記憶することをさらに備え、前記ビデオフレームを取得することは、
前記ビデオフレームの再圧縮のためのトリガ条件を識別することと、ここにおいて、前記トリガ条件は、前記デバイスの特性または前記デバイスへのユーザ入力のうちの少なくとも1つを備える、
前記トリガ条件を識別したことに応答して、前記ビデオフレームを、前記ビデオフレームの再圧縮のために前記メモリから前記第1のビットレートで取り出すこととを備える、C1に記載の方法。
[C3]
前記ビデオフレームを取得することは、未加工ビデオフレームのシーケンスをカメラから前記第1のビットレートで受信することを備える、C1に記載の方法。
[C4]
前記ビデオフレームを取得することは、前記第1のビットレートで符号化された前記ビデオフレームをメモリから取り出すことを備え、前記符号化ビデオフレームは第1のファイルサイズを有し、前記方法は、
前記第2のビットレートで再圧縮された前記ビデオフレームを前記メモリへ記憶すること、前記再圧縮ビデオフレームは、前記第1のファイルサイズよりも小さい第2のファイルサイズを有する、をさらに備える、C1に記載の方法。
[C5]
前記ビデオフレームを前記第1のビットレートから前記第2のビットレートに再圧縮することは、前記ビデオフレームの記憶のために、前記ビデオフレームの第1の再圧縮を実施することを備え、前記方法は、
前記ビデオフレームの送信のために、前記第1のビットレートから第3のビットレートへの、前記ビデオフレームの第2の再圧縮を実施すること、前記第3のビットレートは前記第1のビットレートよりも低い、をさらに備える、C1に記載の方法。
[C6]
前記ビデオフレームを再圧縮することは、
前記第1のビットレートで符号化された前記ビデオフレームを復号することと、
前記第2のビットレートで、前記選択されたQP値に従って、前記ビデオフレームを再符号化することとを備える、C1に記載の方法。
[C7]
前記ビデオフレームを再圧縮することは、
前記第1のビットレートで符号化された前記ビデオフレームを復号することと、
前記ビデオフレームの設定を修正することと、前記設定は、前記ビデオフレームの解像度、フレームレート、または目標ビットレートのうちの1つまたは複数を含む、
前記ビデオフレームを、前記第2のビットレートで、前記選択されたQP値に従って、前記修正された設定で再符号化することとを備える、C1に記載の方法。
[C8]
前記QP値を、前記複数の事前計算されたQP値から選択することは、
前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択することと、
前記デルタQP値、および前記第1のビットレートで符号化された前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出することとを備える、C1に記載の方法。
[C9]
前記ビデオフレームについての前記複雑度値を決定することは、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定することを備える、C1に記載の方法。
[C10]
前記QP値を選択することは、ワンステップで前記QP値を選択することを備える、C1に記載の方法。
[C11]
ビデオ処理デバイスであって、
複数の事前計算された量子化パラメータ(QP)値を記憶するように構成されたメモリと、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、
前記メモリと通信している1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサは、
第1のビットレートでビデオフレームを取得することと、
前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定することと、
前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択することと、
前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮することと、前記第2のビットレートは前記第1のビットレートよりも低い、を行うように構成される、デバイス。
[C12]
前記1つまたは複数のプロセッサは、
前記第1のビットレートで符号化された前記ビデオフレームを前記メモリへ記憶することと、
前記ビデオフレームの再圧縮のためのトリガ条件を識別することと、ここにおいて、前記トリガ条件は、前記デバイスの特性または前記デバイスへのユーザ入力のうちの少なくとも1つを備える、
前記トリガ条件を識別したことに応答して、前記第1のビットレートで符号化された前記ビデオフレームを、前記ビデオフレームの再圧縮のために前記メモリから取り出すこととを行うように構成される、C11に記載のデバイス。
[C13]
前記1つまたは複数のプロセッサは、未加工ビデオフレームのシーケンスをカメラから前記第1のビットレートで受信するように構成される、C11に記載のデバイス。
[C14]
前記1つまたは複数のプロセッサは、
前記第1のビットレートで符号化された前記ビデオフレームを前記メモリから取り出すことと、前記符号化ビデオフレームは第1のファイルサイズを有する、
前記第2のビットレートで再圧縮された前記ビデオフレームを前記メモリへ記憶することと、前記再圧縮ビデオフレームは、前記第1のファイルサイズよりも小さい第2のファイルサイズを有する、を行うように構成される、C11に記載のデバイス。
[C15]
前記1つまたは複数のプロセッサは、
前記ビデオフレームの記憶のために、前記第1のビットレートから前記第2のビットレートへの、前記ビデオフレームの第1の再圧縮を実施することと、
前記ビデオフレームの送信のために、前記第1のビットレートから第3のビットレートへの、前記ビデオフレームの第2の再圧縮を実施することと、前記第3のビットレートは前記第1のビットレートよりも低い、を行うように構成される、C11に記載のデバイス。
[C16]
前記ビデオフレームを再圧縮するために、前記1つまたは複数のプロセッサは、
前記第1のビットレートで符号化された前記ビデオフレームを復号し、
前記第2のビットレートで、前記選択されたQP値に従って前記ビデオフレームを再符号化するように構成される、C11に記載のデバイス。
[C17]
前記ビデオフレームを再圧縮するために、前記1つまたは複数のプロセッサは、
前記第1のビットレートで符号化された前記ビデオフレームを復号することと、
前記ビデオフレームの設定を修正することと、前記設定は、前記ビデオフレームの解像度、フレームレート、または目標ビットレートのうちの1つまたは複数を含む、
前記ビデオフレームを、前記第2のビットレートで、前記選択されたQP値に従って、前記修正された設定で再符号化することとを行うように構成される、C11に記載のデバイス。
[C18]
前記QP値を、前記複数の事前計算されたQP値から選択するために、前記1つまたは複数のプロセッサは、
前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択し、
前記デルタQP値、および前記第1のビットレートでの前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出するように構成される、C11に記載のデバイス。
[C19]
前記ビデオフレームについての前記複雑度値を決定するために、前記1つまたは複数のプロセッサは、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定するように構成される、C11に記載のデバイス。
[C20]
前記1つまたは複数のプロセッサは、前記QP値をワンステップで選択するように構成される、C11に記載のデバイス。
[C21]
前記デバイスが、
集積回路、
マイクロプロセッサ、または
ワイヤレス通信デバイスのうちの少なくとも1つを備える、C11に記載のデバイス。
[C22]
前記デバイスは、未加工ビデオフレームのシーケンスをキャプチャするように構成されたカメラを備える、C11に記載のデバイス。
[C23]
ビデオ処理デバイスであって、
複数の事前計算された量子化パラメータ(QP)値を記憶するための手段と、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、
第1のビットレートでビデオフレームを取得するための手段と、
前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定するための手段と、
前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択するための手段と、
前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮するための手段と、前記第2のビットレートは前記第1のビットレートよりも低い、を備えるデバイス。
[C24]
前記ビデオフレームを再圧縮するための前記手段は、
前記第1のビットレートで符号化された前記ビデオフレームを復号するための手段と、
前記第2のビットレートで、前記選択されたQP値に従って、前記ビデオフレームを再符号化するための手段とを備える、C23に記載のデバイス。
[C25]
前記QP値を、前記複数の事前計算されたQP値から選択するための前記手段は、
前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択するための手段と、
前記デルタQP値、および前記第1のビットレートでの前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出するための手段とを備える、C23に記載のデバイス。
[C26]
前記ビデオフレームについての前記複雑度値を決定するための前記手段は、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定するための手段を備える、C23に記載のデバイス。
[C27]
命令を記憶する非一時的コンピュータ可読媒体であって、前記命令は、実行されると、1つまたは複数のプロセッサに、
複数の事前計算された量子化パラメータ(QP)値を記憶することと、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベース、およびビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックに基づいて事前計算される、
第1のビットレートでビデオフレームを取得することと、
前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定することと、
前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択することと、
前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮することと、前記第2のビットレートは前記第1のビットレートよりも低い、を行わせる、非一時的コンピュータ可読媒体。
[C28]
前記1つまたは複数のプロセッサに、前記ビデオフレームを再圧縮させる前記命令は、前記1つまたは複数のプロセッサにさらに、
前記第1のビットレートで符号化された前記ビデオフレームを復号させ、
前記第2のビットレートで、前記選択されたQP値に従って、前記ビデオフレームを再符号化させる、C27に記載の非一時的コンピュータ可読媒体。
[C29]
前記1つまたは複数のプロセッサに、前記QP値を、前記複数の事前計算されたQP値から選択させる前記命令は、前記1つまたは複数のプロセッサにさらに、
前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択させ、
前記デルタQP値、および前記第1のビットレートでの前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出させる、C27に記載の非一時的コンピュータ可読媒体。
[C30]
前記1つまたは複数のプロセッサに、前記ビデオフレームについての前記複雑度値を決定させる前記命令は、前記1つまたは複数のプロセッサにさらに、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定させる、C27に記載の非一時的コンピュータ可読媒体。

Claims (30)

  1. ビデオデータを処理する方法であって、
    複数の事前計算された量子化パラメータ(QP)値を記憶することと、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、
    第1のビットレートでビデオフレームを取得することと、
    前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定することと、
    前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択することと、
    前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮することと、前記第2のビットレートは前記第1のビットレートよりも低い、を備える方法。
  2. 前記第1のビットレートで符号化された前記ビデオフレームをデバイスのメモリへ記憶することをさらに備え、前記ビデオフレームを取得することは、
    前記ビデオフレームの再圧縮のためのトリガ条件を識別することと、ここにおいて、前記トリガ条件は、前記デバイスの特性または前記デバイスへのユーザ入力のうちの少なくとも1つを備える、
    前記トリガ条件を識別したことに応答して、前記ビデオフレームを、前記ビデオフレームの再圧縮のために前記メモリから前記第1のビットレートで取り出すこととを備える、請求項1に記載の方法。
  3. 前記ビデオフレームを取得することは、未加工ビデオフレームのシーケンスをカメラから前記第1のビットレートで受信することを備える、請求項1に記載の方法。
  4. 前記ビデオフレームを取得することは、前記第1のビットレートで符号化された前記ビデオフレームをメモリから取り出すことを備え、前記符号化ビデオフレームは第1のファイルサイズを有し、前記方法は、
    前記第2のビットレートで再圧縮された前記ビデオフレームを前記メモリへ記憶すること、前記再圧縮ビデオフレームは、前記第1のファイルサイズよりも小さい第2のファイルサイズを有する、をさらに備える、請求項1に記載の方法。
  5. 前記ビデオフレームを前記第1のビットレートから前記第2のビットレートに再圧縮することは、前記ビデオフレームの記憶のために、前記ビデオフレームの第1の再圧縮を実施することを備え、前記方法は、
    前記ビデオフレームの送信のために、前記第1のビットレートから第3のビットレートへの、前記ビデオフレームの第2の再圧縮を実施すること、前記第3のビットレートは前記第1のビットレートよりも低い、をさらに備える、請求項1に記載の方法。
  6. 前記ビデオフレームを再圧縮することは、
    前記第1のビットレートで符号化された前記ビデオフレームを復号することと、
    前記第2のビットレートで、前記選択されたQP値に従って、前記ビデオフレームを再符号化することとを備える、請求項1に記載の方法。
  7. 前記ビデオフレームを再圧縮することは、
    前記第1のビットレートで符号化された前記ビデオフレームを復号することと、
    前記ビデオフレームの設定を修正することと、前記設定は、前記ビデオフレームの解像度、フレームレート、または目標ビットレートのうちの1つまたは複数を含む、
    前記ビデオフレームを、前記第2のビットレートで、前記選択されたQP値に従って、前記修正された設定で再符号化することとを備える、請求項1に記載の方法。
  8. 前記QP値を、前記複数の事前計算されたQP値から選択することは、
    前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択することと、
    前記デルタQP値、および前記第1のビットレートで符号化された前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出することとを備える、請求項1に記載の方法。
  9. 前記ビデオフレームについての前記複雑度値を決定することは、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定することを備える、請求項1に記載の方法。
  10. 前記QP値を選択することは、ワンステップで前記QP値を選択することを備える、請求項1に記載の方法。
  11. ビデオ処理デバイスであって、
    複数の事前計算された量子化パラメータ(QP)値を記憶するように構成されたメモリと、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、
    前記メモリと通信している1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサは、
    第1のビットレートでビデオフレームを取得することと、
    前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定することと、
    前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択することと、
    前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮することと、前記第2のビットレートは前記第1のビットレートよりも低い、を行うように構成される、デバイス。
  12. 前記1つまたは複数のプロセッサは、
    前記第1のビットレートで符号化された前記ビデオフレームを前記メモリへ記憶することと、
    前記ビデオフレームの再圧縮のためのトリガ条件を識別することと、ここにおいて、前記トリガ条件は、前記デバイスの特性または前記デバイスへのユーザ入力のうちの少なくとも1つを備える、
    前記トリガ条件を識別したことに応答して、前記第1のビットレートで符号化された前記ビデオフレームを、前記ビデオフレームの再圧縮のために前記メモリから取り出すこととを行うように構成される、請求項11に記載のデバイス。
  13. 前記1つまたは複数のプロセッサは、未加工ビデオフレームのシーケンスをカメラから前記第1のビットレートで受信するように構成される、請求項11に記載のデバイス。
  14. 前記1つまたは複数のプロセッサは、
    前記第1のビットレートで符号化された前記ビデオフレームを前記メモリから取り出すことと、前記符号化ビデオフレームは第1のファイルサイズを有する、
    前記第2のビットレートで再圧縮された前記ビデオフレームを前記メモリへ記憶することと、前記再圧縮ビデオフレームは、前記第1のファイルサイズよりも小さい第2のファイルサイズを有する、を行うように構成される、請求項11に記載のデバイス。
  15. 前記1つまたは複数のプロセッサは、
    前記ビデオフレームの記憶のために、前記第1のビットレートから前記第2のビットレートへの、前記ビデオフレームの第1の再圧縮を実施することと、
    前記ビデオフレームの送信のために、前記第1のビットレートから第3のビットレートへの、前記ビデオフレームの第2の再圧縮を実施することと、前記第3のビットレートは前記第1のビットレートよりも低い、を行うように構成される、請求項11に記載のデバイス。
  16. 前記ビデオフレームを再圧縮するために、前記1つまたは複数のプロセッサは、
    前記第1のビットレートで符号化された前記ビデオフレームを復号し、
    前記第2のビットレートで、前記選択されたQP値に従って前記ビデオフレームを再符号化するように構成される、請求項11に記載のデバイス。
  17. 前記ビデオフレームを再圧縮するために、前記1つまたは複数のプロセッサは、
    前記第1のビットレートで符号化された前記ビデオフレームを復号することと、
    前記ビデオフレームの設定を修正することと、前記設定は、前記ビデオフレームの解像度、フレームレート、または目標ビットレートのうちの1つまたは複数を含む、
    前記ビデオフレームを、前記第2のビットレートで、前記選択されたQP値に従って、前記修正された設定で再符号化することとを行うように構成される、請求項11に記載のデバイス。
  18. 前記QP値を、前記複数の事前計算されたQP値から選択するために、前記1つまたは複数のプロセッサは、
    前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択し、
    前記デルタQP値、および前記第1のビットレートでの前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出するように構成される、請求項11に記載のデバイス。
  19. 前記ビデオフレームについての前記複雑度値を決定するために、前記1つまたは複数のプロセッサは、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定するように構成される、請求項11に記載のデバイス。
  20. 前記1つまたは複数のプロセッサは、前記QP値をワンステップで選択するように構成される、請求項11に記載のデバイス。
  21. 前記デバイスが、
    集積回路、
    マイクロプロセッサ、または
    ワイヤレス通信デバイスのうちの少なくとも1つを備える、請求項11に記載のデバイス。
  22. 前記デバイスは、未加工ビデオフレームのシーケンスをキャプチャするように構成されたカメラを備える、請求項11に記載のデバイス。
  23. ビデオ処理デバイスであって、
    複数の事前計算された量子化パラメータ(QP)値を記憶するための手段と、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベースと、ビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックとに基づいて事前計算される、
    第1のビットレートでビデオフレームを取得するための手段と、
    前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定するための手段と、
    前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択するための手段と、
    前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮するための手段と、前記第2のビットレートは前記第1のビットレートよりも低い、を備えるデバイス。
  24. 前記ビデオフレームを再圧縮するための前記手段は、
    前記第1のビットレートで符号化された前記ビデオフレームを復号するための手段と、
    前記第2のビットレートで、前記選択されたQP値に従って、前記ビデオフレームを再符号化するための手段とを備える、請求項23に記載のデバイス。
  25. 前記QP値を、前記複数の事前計算されたQP値から選択するための前記手段は、
    前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択するための手段と、
    前記デルタQP値、および前記第1のビットレートでの前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出するための手段とを備える、請求項23に記載のデバイス。
  26. 前記ビデオフレームについての前記複雑度値を決定するための前記手段は、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定するための手段を備える、請求項23に記載のデバイス。
  27. 命令を記憶する非一時的コンピュータ可読媒体であって、前記命令は、実行されると、1つまたは複数のプロセッサに、
    複数の事前計算された量子化パラメータ(QP)値を記憶することと、ここにおいて、前記複数の事前計算されたQP値は、ビデオクリップのデータベース、およびビデオ品質における視覚的に知覚可能な損失を結果として生じない、前記ビデオクリップの各々を再圧縮するのに使われる最大QP値を決定するための品質メトリックに基づいて事前計算される、
    第1のビットレートでビデオフレームを取得することと、
    前記ビデオフレームに関連付けられた空間的、時間的、およびコーディング統計に基づいて、前記ビデオフレームについての複雑度値を決定することと、
    前記ビデオフレームについての前記複雑度値に基づいて、前記複数の事前計算されたQP値から、QP値を選択することと、
    前記ビデオフレームを、ビデオ品質における視覚的に知覚可能な損失なしで、前記選択されたQP値に従って、前記第1のビットレートから第2のビットレートに再圧縮することと、前記第2のビットレートは前記第1のビットレートよりも低い、を行わせる、非一時的コンピュータ可読媒体。
  28. 前記1つまたは複数のプロセッサに、前記ビデオフレームを再圧縮させる前記命令は、前記1つまたは複数のプロセッサにさらに、
    前記第1のビットレートで符号化された前記ビデオフレームを復号させ、
    前記第2のビットレートで、前記選択されたQP値に従って、前記ビデオフレームを再符号化させる、請求項27に記載の非一時的コンピュータ可読媒体。
  29. 前記1つまたは複数のプロセッサに、前記QP値を、前記複数の事前計算されたQP値から選択させる前記命令は、前記1つまたは複数のプロセッサにさらに、
    前記ビデオフレームについての前記複雑度値によってインデックス付けされたルックアップテーブルから、デルタQP値を選択させ、
    前記デルタQP値、および前記第1のビットレートでの前記ビデオフレーム用の前のQP値に基づいて、前記QP値を算出させる、請求項27に記載の非一時的コンピュータ可読媒体。
  30. 前記1つまたは複数のプロセッサに、前記ビデオフレームについての前記複雑度値を決定させる前記命令は、前記1つまたは複数のプロセッサにさらに、前記ビデオフレームに関連付けられたシーン統計および前に符号化されたビデオフレームに関連付けられたビットストリーム統計に基づいて、再符号化複雑度(REC)値を決定させる、請求項27に記載の非一時的コンピュータ可読媒体。
JP2017541605A 2015-02-09 2016-01-26 ほぼ視覚的無損失なビデオ再圧縮 Pending JP2018509067A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562113971P 2015-02-09 2015-02-09
US62/113,971 2015-02-09
US14/864,527 US20160234496A1 (en) 2015-02-09 2015-09-24 Near visually lossless video recompression
US14/864,527 2015-09-24
PCT/US2016/014953 WO2016130318A1 (en) 2015-02-09 2016-01-26 Near visually lossless video recompression

Publications (1)

Publication Number Publication Date
JP2018509067A true JP2018509067A (ja) 2018-03-29

Family

ID=56567243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017541605A Pending JP2018509067A (ja) 2015-02-09 2016-01-26 ほぼ視覚的無損失なビデオ再圧縮

Country Status (5)

Country Link
US (1) US20160234496A1 (ja)
EP (1) EP3257245A1 (ja)
JP (1) JP2018509067A (ja)
CN (1) CN107211145A (ja)
WO (1) WO2016130318A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7372013B2 (ja) 2019-03-17 2023-10-31 インターナショナル・ビジネス・マシーンズ・コーポレーション ライブ・ストリーミング・ビデオの低遅延のコンテンツの無害化および再構築(cdr)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10404986B2 (en) 2015-03-30 2019-09-03 Netflix, Inc. Techniques for optimizing bitrates and resolutions during encoding
US9716875B2 (en) * 2015-09-18 2017-07-25 Intel Corporation Facilitating quantization and compression of three-dimensional graphics data using screen space metrics at computing devices
US11019349B2 (en) 2017-01-20 2021-05-25 Snap Inc. Content-based client side video transcoding
CN110012292B (zh) 2018-01-05 2022-02-08 澜至电子科技(成都)有限公司 用于压缩视频数据的方法和装置
EP3732881A1 (en) * 2018-02-17 2020-11-04 Google LLC Image compression and decompression using controlled quality loss
CN108769736B (zh) * 2018-05-24 2019-09-17 重庆瑞景信息科技有限公司 面向显示的视频转码码率决策模型的建立及参数确定方法
US11997275B2 (en) * 2018-08-27 2024-05-28 AT Technologies ULC Benefit-based bitrate distribution for video encoding
US10924739B2 (en) * 2018-10-31 2021-02-16 Ati Technologies Ulc Efficient quantization parameter prediction method for low latency video coding
CN111901600B (zh) * 2020-08-06 2021-06-11 中标慧安信息技术股份有限公司 一种损失较低的视频压缩方法
US11726949B2 (en) * 2021-05-28 2023-08-15 Samsung Electronics Co., Ltd. System and method for selectively reprocessing video streams based on system resources and stream status
US11871003B2 (en) 2021-09-13 2024-01-09 Apple Inc. Systems and methods of rate control for multiple pass video encoding

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8761248B2 (en) * 2006-11-28 2014-06-24 Motorola Mobility Llc Method and system for intelligent video adaptation
US8270739B2 (en) * 2007-12-03 2012-09-18 Ecole De Technologie Superieure System and method for quality-aware selection of parameters in transcoding of digital images
US8879623B2 (en) * 2009-09-02 2014-11-04 Sony Computer Entertainment Inc. Picture-level rate control for video encoding a scene-change I picture
WO2011042898A1 (en) * 2009-10-05 2011-04-14 I.C.V.T Ltd. Apparatus and methods for recompression of digital images
EP2579593A1 (en) * 2011-10-04 2013-04-10 Thomson Licensing Adaptive quantisation for intra-encoded image blocks

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7372013B2 (ja) 2019-03-17 2023-10-31 インターナショナル・ビジネス・マシーンズ・コーポレーション ライブ・ストリーミング・ビデオの低遅延のコンテンツの無害化および再構築(cdr)

Also Published As

Publication number Publication date
WO2016130318A1 (en) 2016-08-18
US20160234496A1 (en) 2016-08-11
CN107211145A (zh) 2017-09-26
EP3257245A1 (en) 2017-12-20

Similar Documents

Publication Publication Date Title
JP2018509067A (ja) ほぼ視覚的無損失なビデオ再圧縮
US10123015B2 (en) Macroblock-level adaptive quantization in quality-aware video optimization
JP6800896B2 (ja) ビデオコーディングのためにハイダイナミックレンジおよび広色域ビデオデータを処理すること
JP6054552B2 (ja) 縮小された記憶域を伴うイントラ予測モード決定
JP2022153598A (ja) 画像処理装置および方法
TW201841503A (zh) 視頻寫碼中之內濾波旗標
TWI527436B (zh) 視訊解碼方法
JP2018533867A (ja) Qp値の決定
US10205763B2 (en) Method and apparatus for the single input multiple output (SIMO) media adaptation
US11064211B2 (en) Advanced video coding method, system, apparatus, and storage medium
JP2018534875A (ja) ディスプレイストリーム圧縮(dsc)におけるスライス境界視覚アーティファクトを減らすためのシステムおよび方法
KR20130135659A (ko) 다계층 비디오 코딩을 위한 레이트 제어 방법, 이를 이용한 비디오 인코딩 장치 및 비디오 신호 처리 시스템
JP2011130410A (ja) 符号化方法、復号化方法及び装置
KR20140034149A (ko) 장면에 기초한 적응적 비트 레이트 제어
US11909963B2 (en) Image encoding method, decoding method, encoder, and decoder
US20220295071A1 (en) Video encoding method, video decoding method, and corresponding apparatus
US20220329818A1 (en) Encoding method and encoder
US20220337820A1 (en) Encoding method and encoder
JP2015533461A (ja) レート歪みオプティマイザ及び複数の色成分の同時最適化を含む最適化技法
KR20220162739A (ko) Hls를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
KR20210075201A (ko) 인트라 예측을 위한 방법 및 장치
JP2019528017A (ja) インループサンプル処理のためのビデオコーディングツール
TW201921938A (zh) 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構
KR102438149B1 (ko) 비디오 코딩을 위한 위치 종속 공간 가변 변환
JP2019514290A (ja) ディスプレイストリーム圧縮用の知覚的量子化パラメータ(qp)重み付けのための装置および方法