JP6151434B2 - 絶対値変換差分和に基づくビデオ符号化のためのイントラレート制御 - Google Patents

絶対値変換差分和に基づくビデオ符号化のためのイントラレート制御 Download PDF

Info

Publication number
JP6151434B2
JP6151434B2 JP2016506679A JP2016506679A JP6151434B2 JP 6151434 B2 JP6151434 B2 JP 6151434B2 JP 2016506679 A JP2016506679 A JP 2016506679A JP 2016506679 A JP2016506679 A JP 2016506679A JP 6151434 B2 JP6151434 B2 JP 6151434B2
Authority
JP
Japan
Prior art keywords
intra
block
rate control
video
transform coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016506679A
Other languages
English (en)
Other versions
JP2016518777A (ja
JP2016518777A5 (ja
Inventor
カークゼウィックズ、マルタ
ワン、シャンリン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016518777A publication Critical patent/JP2016518777A/ja
Publication of JP2016518777A5 publication Critical patent/JP2016518777A5/ja
Application granted granted Critical
Publication of JP6151434B2 publication Critical patent/JP6151434B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

[0001]本出願は、その内容全体が参照により本明細書に組み込まれる、2013年4月8日に出願された米国仮出願第61/809,846号の利益を主張する。
[0002]本開示は、ビデオ符号化に関する。
[0003]デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップコンピュータまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、携帯電話または衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4、Part 10、アドバンストビデオコーディング(AVC:Advanced Video Coding)、現在開発中の高効率ビデオコーディング(HEVC:High Efficiency Video Coding)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオ圧縮技法など、ビデオ圧縮技法を実装する。ビデオデバイスは、そのようなビデオ圧縮技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0004]ビデオ圧縮技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的(イントラピクチャ)予測(spatial (intra-picture) prediction)および/または時間的(インターピクチャ)予測(temporal (inter-picture) prediction)を実行する。ブロックベースのビデオコーディングの場合、ビデオスライス(すなわち、ビデオフレームまたはビデオフレームの一部分)が、CTU、コーディングユニット(CU)および/またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコーディングされた(I)スライス内のビデオブロックは、同じピクチャにおける隣接ブロック内の参照サンプル(reference samples)に対する空間的予測を使用して符号化される。ピクチャのインターコード化された(PまたはB)スライス内のビデオブロックは、同じピクチャの中の隣接ブロック内の参照サンプルに対する空間的予測、または他の参照ピクチャの中の参照サンプルに対する時間的予測を使用することができる。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレーム(a reference frames)と呼ばれることがある。
[0005]空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データ(residual data)は、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコーディングされたブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングされたブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコード化ブロック(intra-coded block)は、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて残差変換係数(residual transform coefficients)をもたらすことができ、その残差変換係数が、次いで量子化され得る。最初に2次元アレイで構成される量子化された変換係数(quantized transform coefficients)は、変換係数の1次元ベクトルを生成するために走査されてよく、なお一層の圧縮を達成するためにエントロピーコーディングが適用されてよい。
[0006]本開示は、ビデオデータのイントラ予測されたフレームを符号化するためのビットレート制御(bit rate contro)に対する技法を説明する。本開示の一例では、ビットレート制御パラメータは、ターゲットビットレートと複雑性測度(a complexity measure)とを使用して計算され得る。一例では、複雑性測度は、イントラコード化フレーム(an intra-coded frame)の絶対値変換差分和(a sum of absolute transformed differences)(SATD)計算を用いて計算される。
[0007]本開示の一例では、ビデオ符号化におけるレート制御のための方法は、ビデオデータのフレーム内の各ブロックに対するSATD計算に基づいてビデオデータのフレームの複雑性測度を決定することと、ここにおいて、ビデオデータのフレームはイントラ予測(intra prediction)を使用して符号化されるべきである、複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定することと、決定されたレート制御パラメータに基づいてイントラ予測モードを決定することと、決定されたイントラ予測モードを使用してビデオデータのフレームを符号化することと、を備える。
[0008]本開示の別の例では、ビデオ符号化プロセスにおけるレート制御を実行するように構成された装置は、ビデオデータのフレームを記憶するように構成されたメモリと、ビデオデータのフレーム内の各ブロックに対するSATD計算に基づいてビデオデータのフレームの複雑性測度を決定すること、ここにおいて、ビデオデータのフレームはイントラ予測を使用して符号化されるべきである、複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定すること、決定されたレート制御パラメータに基づいてイントラ予測モードを決定すること、および決定されたイントラ予測モードを使用してビデオデータのフレームを符号化することと、を行うように構成されたビデオエンコーダとを備える。
[0009]本開示の別の例では、ビデオ符号化プロセスにおけるレート制御を実行するように構成された装置は、ビデオデータのフレーム内の各ブロックに対するSATD計算に基づいてビデオデータのフレームの複雑性測度を決定するための手段と、ここにおいて、ビデオデータのフレームはイントラ予測を使用して符号化されるべきである、複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定するための手段と、決定されたレート制御パラメータに基づいてイントラ予測モードを決定するための手段と、決定されたイントラ予測モードを使用してビデオデータのフレームを符号化するための手段と、を備える。
[0010]別の例では、本開示は、命令を記憶するコンピュータ可読記憶媒体を説明し、命令は、実行されたとき、ビデオデータを符号化するように構成されたデバイスの1つまたは複数のプロセッサに、ビデオデータのフレーム内の各ブロックに対するSATD計算に基づいてビデオデータのフレームの複雑性測度を決定することと、ここにおいて、ビデオデータのフレームはイントラ予測を使用して符号化されるべきである、複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定することと、決定されたレート制御パラメータに基づいてイントラ予測モードを決定することと、決定されたイントラ予測モードを使用してビデオデータのフレームを符号化することと、を行わせる。
[0011]本開示の1つまたは複数の例の詳細が、添付の図面および以下の説明に記載されている。本開示の他の特徴、目的、および利点は、その説明および図面から、ならびに特許請求の範囲から明らかになろう。
[0012]本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0013]本開示で説明する技法を実装し得る例示的なビデオエンコーダを示すブロック図。 [0014]本開示で説明する技法を実装し得る例示的なレート制御ユニットを示すブロック図。 [0015]例示的なビデオデコーダを示すブロック図。 [0016]本開示の例示的な方法を示すフローチャート。
詳細な説明
[0017]本開示は、ビデオ符号化プロセスにおけるビットレート制御に対する技法を説明する。イントラコード化フレームに対するレート制御のためのいくつかの以前の解決策は、レート制御パラメータを決定するためにターゲットビットレートだけに依存した。しかしながら、そのような技法は、異なる複雑性のイントラフレームをコーディングするとき、ターゲットビットレートを維持することにおいて正確性を欠いていた。本開示は、レート制御パラメータがイントラフレームの複雑性測度を使用して決定される、イントラフレームに対するレート制御技法を提案する。一例では、複雑性測度は、イントラフレームに対する絶対値変換差分和(SATD)計算を使用して決定される。
[0018]図1は、本開示で説明するイントラレート制御技法を利用し得る例示的なビデオ符号化および復号システム10を示すブロック図である。図1に示すように、システム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを生成するソースデバイス12を含む。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のために装備され得る。
[0019]宛先デバイス14は、リンク16を介して復号されるべき符号化ビデオデータを受信し得る。リンク16は、符号化されたビデオデータをソースデバイス12から宛先デバイス14に移動することが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、リンク16は、ソースデバイス12が、符号化されたビデオデータをリアルタイムで宛先デバイス14に直接送信することを可能にするための通信媒体を備え得る。符号化されたビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、任意のワイヤレスまたは有線通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス12から宛先デバイス14への通信を可能にするために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。
[0020]代替として、符号化されたデータは、出力インターフェース22からストレージデバイス32に出力され得る。同様に、符号化されたデータは、入力インターフェースによってストレージデバイス32からアクセスされ得る。ストレージデバイス32は、ハードドライブ、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性または不揮発性のメモリ、あるいは符号化されたビデオデータを記憶するための任意の他の好適なデジタル記憶媒体のような、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス32は、ソースデバイス12によって生成された符号化されたビデオを保持し得る、ファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス14は、ストリーミングまたはダウンロードを介して、ストレージデバイス32から記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化されたビデオデータを記憶し、その符号化されたビデオデータを宛先デバイス14に送信することができる任意のタイプのサーバであり得る。例示的なファイルサーバとしては、(たとえば、ウェブサイト用の)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカルディスクドライブがある。宛先デバイス14は、インターネット接続を含むいずれかの標準データ接続を通して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化されたビデオデータにアクセスするのに適しているワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含むことができる。ストレージデバイス32からの符号化されたビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。
[0021]イントラレート制御に対する本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。イントラレート制御に対する本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、たとえばインターネットを介したストリーミングビデオ送信、データ記憶媒体に記憶するためのデジタルビデオの符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例のような、種々のマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの用途をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。
[0022]図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。場合によっては、出力インターフェース22は、変調器/復調器(モデム)および/または送信機を含んでよい。ソースデバイス12において、ビデオソース18は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/もしくはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムのようなソース、またはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、本開示で説明される技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。
[0023]キャプチャされたビデオ、プリキャプチャされたビデオ、またはコンピュータにより生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化されたビデオデータは、ソースデバイス12の出力インターフェース22を介して宛先デバイス14に直接送信され得る。符号化されたビデオデータは、さらに(または代替的に)、復号および/または再生のための宛先デバイス14または他のデバイスによる後のアクセスのためにストレージデバイス32上に記憶され得る。
[0024]宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス31とを含む。場合によっては、入力インターフェース28は、受信機および/またはモデムを含み得る。宛先デバイス14の入力インターフェース28は、リンク16を介して符号化ビデオデータを受信する。リンク16を介して通信され、またはストレージデバイス32上に提供された符号化されたビデオデータは、ビデオデータを復号する際にビデオデコーダ30などのビデオデコーダが使用するための、ビデオエンコーダ20によって生成された様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信され、記憶媒体上に記憶され、あるいは、ファイルサーバに記憶される、符号化されたビデオデータに含まれ得る。
[0025]ディスプレイデバイス31は、宛先デバイス14と一体であってよく、またはその外部にあり得る。いくつかの例では、宛先デバイス14は、集積ディスプレイデバイスを含むことができ、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス14はディスプレイデバイスであり得る。一般に、ディスプレイデバイス31は、復号されたビデオデータをユーザに対して表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、種々のディスプレイデバイスのいずれかを備え得る。
[0026]ビデオエンコーダ20およびビデオデコーダ30は、高効率ビデオコーディング(HEVC)規格などのビデオ圧縮規格に従って動作し得、HEVCテストモデル(HM:HEVC Test Model)に準拠し得る。代替として、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4、Part 10、アドバンストビデオコーディング(AVC)と呼ばれるITU−T H.264規格などの、他のプロプライエタリ規格もしくは業界規格、またはそのような規格の拡張に従って動作することができる。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例には、MPEG−2およびITU−T H.263がある。
[0027]図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびオーディオデコーダと統合されてよく、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含んでもよい。適用可能な場合、いくつかの例では、MUX−DEMUXユニットはITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠することができる。
[0028]ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組合せなどの様々な適切なエンコーダ回路のいずれかとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、本開示の技法を実行するために1つまたは複数のプロセッサを使用してハードウェアでその命令を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれてよく、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合されてよい。
[0029]以下でより詳細に説明するように、図1のビデオエンコーダ20は、ビデオデータのフレーム内の各ブロックに対するSATD計算に基づいてビデオデータのフレームの複雑性測度を決定することと、ここにおいて、ビデオデータのフレームはイントラ予測を使用して符号化されるべきである、複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定することと、決定されたレート制御パラメータに基づいてイントラ予測モードを決定することと、決定されたイントラ予測モードを使用してビデオデータのフレームを符号化することと、を行うように構成され得る。ビデオエンコーダ20は、さらに、決定されたレート制御パラメータに基づいて量子化パラメータを決定し得、決定された量子化パラメータを使用してビデオデータのフレームを符号化し得る。
[0030]JCT−VCは、HEVCテストモデル(HM)と呼ばれるビデオコーディングデバイスの発展的モデルに基づいて、HEVC規格を開発した。HMは、たとえば、ITU−T H.264/AVCに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、H.264は9つのイントラ予測符号化モードを提供するが、HMは33個ものイントラ予測符号化モードを提供し得る。「HEVC Working Draft 10」または「WD10」と呼ばれるHEVC規格の1つのドラフトは、文書JCTVC−L1003v34、Brossら、「High efficiency video coding (HEVC) text specification draft 10」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのビデオコーディング共同研究部会(JCT−VC)、第12回会合:スイス、ジュネーブ、2013年1月14〜23日に記載されおり、この文書は、2013年4月8日現在、http://phenix.int−evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC−L1003−v34.zipからダウンロード可能である。HEVC WD10の内容全体は参照により本明細書に組み込まれる。
[0031]一般に、HMの作業モデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含むコーディングツリーユニット(CTU)または最大コーディングユニット(LCU)のシーケンスに分割され得ることを記載している。CTUは、H.264規格のマクロブロックと同様の目的を有する。スライスは、コーディング順序でいくつかの連続するCTUを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分化される場合がある。各CTUは、4分木に従って、コーディングユニット(CU)に分割され得る。たとえば、4分木のルートノードとしてのCTUは、4つの子ノードに分割される場合があり、各子ノードは、次に親ノードとなる場合があり、別の4つの子ノードに分割される場合がある。4分木のリーフノードとしての、最終的な、分割されていない子ノードは、コーディングノード(a coding node)、すなわち、コード化ビデオブロック(a coded video block)を備える。コード化ビットストリームに関連付けられるシンタックスデータは、CTUが分割され得る最大回数を定義し得、コーディングノードの最小サイズをも定義し得る。
[0032]CUは、コーディングノード、ならびにコーディングノードに関連する予測ユニット(PU)および変換ユニット(TU)を含む。CUのサイズは、コーディングノードのサイズに対応し、形状が正方形でよい。CUのサイズは、8×8ピクセルから最大64×64以上のピクセルをもつCTUのサイズまでに及び得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。CUに関連するシンタックスデータは、たとえば、CUを1つまたは複数のPUに区分することを記述し得る。区分モードは、CUが、スキップモード符号化もしくはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、またはインター予測モード符号化されるかによって異なり得る。PUは、形状が非正方形になるように区分され得る。CUに関連するシンタックスデータは、たとえば、4分木に従って、CUを1つまたは複数のTUに区分することも記述し得る。TUは、形状が正方形または非正方形であり得る。
[0033]HEVC規格は、CUごとに異なり得るTUに従った変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。TUは、通常、PUと同じサイズであるか、またはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT:residual quad tree)として知られる4分木構造を使用して、より小さいユニットに再分割され(subdivided)得る。RQTのリーフノードはTUと呼ばれることがある。TUに関連するピクセル差分値は、変換されて変換係数が生成され得、その変換係数は量子化され得る。
[0034]概して、PUは、予測プロセスに関係するデータを含む。たとえば、PUがイントラモード符号化されるとき、PUは、PUについてのイントラ予測モードを記述するデータを含み得る。別の例として、PUがインターモード符号化されるとき、PUは、PUのための動きベクトルを定義するデータを含み得る。PUのための動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルについての解像度(a resolution)(たとえば、1/4ピクセル精度もしくは1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトル用の参照ピクチャリスト(たとえば、リスト0、リスト1、もしくはリストC)を記述することができる。
[0035]概して、TUは、変換プロセスと量子化プロセスとのために使用される。1つまたは複数のPUを有する所与のCUは、1つまたは複数のTUを含む場合もある。予測の後に、ビデオエンコーダ20は、PUに対応する残差値(residual values)を計算し得る。残差値は、エントロピーコーディングのための直列化された変換係数(serialized transform coefficient)を生成するために、TUを使用して変換係数に変換され、量子化され、走査され得るピクセル差分値(pixel difference values)を備える。本開示では、一般に、CUのコーディングノードを指すために「ビデオブロック」という用語を使用する。いくつかの特定の場合において、本開示はまた、コーディングノードならびにPUおよびTUを含む、CTU、すなわち、LCUまたはCUを指す「ビデオブロック」という用語を使用し得る。
[0036]ビデオシーケンスは、通常、一連のビデオフレームまたはピクチャを含む。ピクチャグループ(GOP:a group of pictures)は、一般に、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOP中に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャのうちの1つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスのための符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、通常、ビデオデータを符号化するために、個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックはCU内のコーディングノードに対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し得、指定のコーディング規格に応じてサイズが異なり得る。
[0037]一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると仮定すると、HMは、2N×2NまたはN×NのPUサイズでのイントラ予測をサポートし、2N×2N、2N×N、N×2N、またはN×Nの対称的なPUサイズでのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための非対称区分をサポートする。非対称区分では、CUの一方向は区分されないが、他の方向は25%と75%とに区分される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、または「Right」という表示とによって示される。したがって、たとえば、「2N×nU」は、上部の2N×0.5NのPUおよび下部の2N×1.5NのPUで水平方向に区分された2N×2NのCUを指す。
[0038]本開示では、たとえば16×16ピクセルまたは16かける16ピクセル(16 by 16 pixels)など、「N×N」および「NかけるN(N by N)」は、垂直および水平の寸法に関して、ビデオブロックのピクセルの大きさ(pixel dimensions)を示すために区別なく使用され得る。一般的に、16×16ブロックは、垂直方向に16個のピクセルを有し(y=16)、水平方向に16個のピクセルを有する(x=16)。同様に、N×Nブロックは、一般に、垂直方向にN個のピクセルを有し、水平方向にN個のピクセルを有し、Nは非負整数値を表す。ブロック内のピクセルは行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要はない。たとえば、ブロックはN×M個のピクセルを備えてよく、この場合に、Mは必ずしもNに等しいとは限らない。
[0039]CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングの後に、ビデオエンコーダ20は、CUのTUのための残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域においてピクセルデータを備え得、TUは、変換、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CUのための残差データを含むTUを形成し、次いで、CU用の変換係数を生成するために、TUを変換することができる。
[0040]変換係数を生成するための任意の変換の後に、ビデオエンコーダ20は、変換係数の量子化を実施し得る。量子化は、概して、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度(bit depth)を低減し得る。たとえば、量子化中にnビット値がmビット値に切り捨てられ(rounded down to)てよく、ただし、nはmよりも大きい。以下でより詳細に説明するように、量子化パラメータは、本開示の技法に従って決定されたレート制御パラメータに基づいて設定され得る。
[0041]いくつかの例では、ビデオエンコーダ20は、あらかじめ定義された走査順序を利用して、量子化された変換係数を走査し、エントロピー符号化され得る直列化されたベクトル(a serialized vector)を生成し得る。他の例では、ビデオエンコーダ20は適応走査を実施し得る。量子化された変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、たとえば、コンテキスト適応可変長コーディング(CAVLC:context adaptive variable length coding)、コンテキスト適応バイナリ算術コーディング(CABAC:context adaptive binary arithmetic coding)、シンタックスベースコンテキスト適応バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率インターバル区分エントロピー(PIPE:Probability Interval Partitioning Entropy)コーディング、または別のエントロピー符号化方法に従って、1次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。
[0042]CABACを実行するために、ビデオエンコーダ20は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が0ではないかどうかに関係し得る。
[0043]図2は、本開示で説明するイントラレート制御技法を実装し得る例示的なビデオエンコーダ20を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行するように構成され得る。イントラコーディングは、空間的予測に依存して、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去する。インターコーディングは、時間的予測に依存して、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去する。イントラモード(Iモード)は、いくつかの空間ベースの圧縮モードのいずれかを指す場合がある。単方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースの圧縮モードのいずれかを指す場合がある。
[0044]図2の例では、ビデオエンコーダ20は、ビデオデータメモリ40と、予測処理ユニット41と、参照ピクチャメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、レート制御ユニット51と、エントロピー符号化ユニット56とを含む。予測処理ユニット41は、動き推定ユニット42と、動き補償ユニット44と、イントラ予測処理ユニット46とを含む。ビデオブロック再構成(video block reconstruction)のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換処理ユニット60と、加算器62とを含む。ブロック境界をフィルタ処理して再構成されたビデオ(reconstructed video)からブロッキネスアーティファクト(blockiness artifacts)を除去するために、デブロッキングフィルタ(図2に示されず)が含まれる場合もある。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタリングすることになる。追加のループフィルタ(ループ内またはループ後)もデブロッキングフィルタに加えて使用され得る。
[0045]ビデオデータメモリ40は、ビデオエンコーダ20の構成要素によって符号化されるべきビデオデータを記憶し得る。ビデオデータメモリ40に記憶されたビデオデータは、たとえば、ビデオソース18から取得され得る。参照ピクチャメモリ64は、(たとえば、イントラ予測コーディングモードまたはインター予測コーディングモードとも呼ばれる、イントラコーディングモードまたはインターコーディングモードで)ビデオエンコーダ20によってビデオデータを符号化する際に使用するための、参照ビデオデータを記憶する復号化ピクチャバッファ(DPB:a decoded picture buffer)の一例である。ビデオデータメモリ40および参照ピクチャメモリ64は、同期DRAM(SDRAM)、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM(登録商標))、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ(DRAM)など、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ40および参照ピクチャメモリ64は、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ40は、ビデオエンコーダ20の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。
[0046]ビデオエンコーダ20は、ビデオデータを受信し、区分ユニット(図示せず)は、データをビデオブロックに区分する。この区分はまた、たとえば、LCUおよびCUの4分木構造に従って、スライス、タイル、または他のより大きいユニットへの区分、ならびにビデオブロック区分をも含み得る。ビデオエンコーダ20は、概して、符号化されるべきビデオスライス内のビデオブロックを符号化する構成要素を示している。スライスは、複数のビデオブロックに(および、場合によっては、タイルと呼ばれるビデオブロックのセットに)分割され得る。予測処理ユニット41は、現在のビデオブロックに関して、誤差結果(error results)(たとえば、コーディングレートおよびひずみレベル)に基づいて、複数のイントラコーディングモードのうちの1つまたは複数のインターコーディングモードのうちの1つなど、複数の可能なコーディングモードのうちの1つを選択してよい。以下でより詳細に論じるように、本開示の技法によれば、予測処理ユニット41は、レート制御ユニット51によって決定されて、供給されるレート制御パラメータに基づいて予測モードを選択するように構成され得る。予測処理ユニット41は、得られたイントラコード化ブロックまたはインターコード化ブロックを、残差ブロックデータを生成するために加算器50に提供し得、参照ピクチャとして使用するための符号化ブロックを再構成するために加算器62に提供し得る。
[0047]予測処理ユニット41内のイントラ予測処理ユニット46は、コーディングすべき現在のブロックと同じフレームまたはスライス内の1つまたは複数の隣接ブロックに対して現在のビデオブロックのイントラ予測コーディングを実行して空間的圧縮を提供してよい。予測処理ユニット41内の動き推定ユニット42および動き補償ユニット44は、時間圧縮を行うために、1つまたは複数の参照ピクチャ中の1つまたは複数の予測ブロックに対する現在のビデオブロックのインター予測コーディングを実行する。
[0048]動き推定ユニット42は、ビデオシーケンスの所定のパターンに従ってビデオスライスのためのインター予測モードを決定するように構成され得る。所定のパターンは、シーケンス中のビデオスライスをPスライスまたはBスライスに指定し得る。動き推定ユニット42と動き補償ユニット44とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット42によって実施される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、参照ピクチャ内の予測ブロックに対する現在ビデオフレームまたはピクチャ内のビデオブロックのPUの変位(displacement)を示し得る。
[0049]予測ブロック(predictive block)は、絶対値差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、または他の差分メトリックによって決定され得るピクセル差分に関して、コーディングされるべきビデオブロックのPUにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ20は、参照ピクチャメモリ64に記憶された参照ピクチャのサブ整数ピクセル位置(sub-integer pixel positions)の値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置(fractional pixel positions)の値を補間し得る。したがって、動き推定ユニット42は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実施し、分数ピクセル精度(fractional pixel precision)で動きベクトルを出力し得る。
[0050]動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスにおけるビデオブロックのPUのための動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択されてよく、それらの参照ピクチャリストの各々は、参照ピクチャメモリ64に記憶された1つまたは複数の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
[0051]動き補償ユニット44によって実行される動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックをフェッチまたは生成すること、場合によってはサブピクセル精度への補間を実行することを伴い得る。現在のビデオブロックのPUについての動きベクトルを受信すると、動き補償ユニット44は、動きベクトルが参照ピクチャリストのうちの1つにおいてポイントする予測ブロックの位置を特定し(locate)得る。ビデオエンコーダ20は、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。ピクセル差分値は、ブロックの残差データを形成し、ルーマ差分構成要素とクロマ差分構成要素(luma and chroma difference components)の両方を含んでよい。加算器50は、この減算演算を実行する1つまたは複数の構成要素を表す。動き補償ユニット44はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。
[0052]イントラ予測処理ユニット46は、前述のように、動き推定ユニット42と動き補償ユニット44とによって実行されるインター予測の代替として、現在のブロックに対するイントラ予測を実行し得る。特に、イントラ予測処理ユニット46は、現在のブロックを符号化するために使用するためのイントラ予測モードを決定することができる。いくつかの例では、イントラ予測処理ユニット46は、たとえば、別個の符号化パスの間に、様々なイントラ予測モードを使用して現在のブロックを符号化することができ、イントラ予測処理ユニット46は、テストされたモードから使用するのに適切なイントラ予測モードを選択することができる。たとえば、イントラ予測処理ユニット46は、様々なテストされたイントラ予測モードのためのレートひずみ分析(a rate-distortion analysis)を使用してレートひずみ値を計算し、テストされたモードの中から最良のレートひずみ特性を有するイントラ予測モードを選択し得る。以下でより詳細に論じるように、イントラ予測処理ユニット46は、レート制御ユニット51によって供給されるレート制御パラメータに基づくレートひずみ分析を用いてイントラ予測モードを決定するように構成され得る。レートひずみ分析は、概して、符号化されたブロックと、符号化されたブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ(または誤差)の量、ならびに符号化されたブロックを生成するために使用されるビットレート(すなわち、ビット数)を決定する。イントラ予測処理ユニット46は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈する(exhibit)かを決定するために、様々な符号化されたブロックのひずみおよびレートから比率(ratios)を計算し得る。
[0053]いずれにせよ、ブロックのためのイントラ予測モードを選択した後に、イントラ予測処理ユニット46は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット56に提供し得る。エントロピー符号化ユニット56は、本開示の技法に従って、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、送信されるビットストリーム中に、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックのためのコンテキストの符号化の定義と、コンテキストの各々について使用すべき、最も確からしいイントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示と、を含み得る、構成データを含め得る。
[0054]予測処理ユニット41が、インター予測またはイントラ予測のいずれかを介して、現在のビデオブロックのための予測ブロックを生成した後、ビデオエンコーダ20は、現在のビデオブロックから予測ブロックを減算することによって残差ビデオブロックを形成する。残差ブロック中の残差ビデオデータは、1つまたは複数のTU中に含まれ、変換処理ユニット52に適用され得る。変換処理ユニット52は、離散コサイン変換(DCT)または概念的に同様の変換などの変換を使用して、残差ビデオデータを残差変換係数(residual transform coefficients)に変換する。変換処理ユニット52は、残差ビデオデータをピクセル領域から周波数領域などの変換領域に変換し得る。
[0055]変換処理ユニット52は、得られた変換係数を量子化ユニット54に送ることができる。量子化ユニット54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって修正され得る。いくつかの例では、量子化ユニット54は、次いで、量子化された変換係数を含む行列の走査を実行することができる。代替的に、エントロピー符号化ユニット56が走査を実行してよい。
[0056]量子化の後、エントロピー符号化ユニット56は、量子化された変換係数をエントロピー符号化する。たとえば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率インターバル区分エントロピー(PIPE)コーディングまたは別のエントロピー符号化方法または技法を実行し得る。エントロピー符号化ユニット56によるエントロピー符号化の後に、符号化されたビットストリームは、ビデオデコーダ30に送信されるか、または、後で送信するためにまたはビデオデコーダ30によって取り出すためにアーカイブされ得る。エントロピー符号化ユニット56はまた、コーディングされている現在のビデオスライスのための動きベクトルと他のシンタックス要素とをエントロピー符号化することができる。
[0057]逆量子化ユニット58および逆変換処理ユニット60は、それぞれ逆量子化および逆変換を適用して、参照ピクチャの参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構築する。動き補償ユニット44は、参照ピクチャリストの1つの中の参照ピクチャの1つの予測ブロックに残差ブロックを加算することによって、参照ブロックを計算し得る。動き補償ユニット44はまた、動き推定において使用するためのサブ整数ピクセル値を計算するために、参照フレームに1つまたは複数の補間フィルタを適用し得る。加算器62は、再構築された残差ブロックを、動き補償ユニット44によって生成された動き補償予測ブロック(motion compensated prediction block)に加算して、参照ピクチャメモリ64に記憶するための参照ブロックを生成する。参照ブロックは、後続のビデオフレームまたはピクチャ中のブロックをインター予測するために動き推定ユニット42および動き補償ユニット44によって参照ブロックとして使用され得る。
[0058]ビデオエンコーダ20は、ビデオ符号化のレート(すなわち、符号化されたビデオを表すために使用されるビット数)を制御するように構成されたレート制御ユニット51をさらに含み得る。レート制御ユニット51は、レート制御パラメータを決定することによってビデオ符号化のレートを制御し得る。レート制御ユニット51によって生成されるレート制御パラメータは、ビデオ符号化のレートを制御するために予測処理ユニット41と量子化ユニット54の両方によって使用され得る。以下でより詳細に説明するように、予測処理ユニット41は、予測モード(すなわち、最良のインター予測モードまたはイントラ予測モード)を選択するために使用されるレートひずみ分析においてレート制御パラメータを使用し得る。加えて、量子化ユニット54は、量子化パラメータを決定するためにレート制御パラメータを使用し得る。決定された予測モードと量子化パラメータの両方が、ビデオエンコーダの符号化レートに影響を及ぼす。
[0059]本開示の技法によれば、以下でより詳細に説明するように、ビデオエンコーダ20(レート制御ユニット51を含む)は、ビデオデータのフレーム内の1つまたは複数のブロックに対する絶対値変換差分和(SATD)計算に基づいて、ビデオデータのフレームの複雑性測度を決定するように構成され得、ここにおいて、ビデオデータのフレームはイントラ予測を使用して符号化されるべきである。ビデオエンコーダ20は、複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定することと、決定されたレート制御パラメータに基づいてイントラ予測モードを決定することとを行うようにさらに構成され得る。次いで、ビデオエンコーダ20は、決定されたイントラ予測モードを使用してビデオデータのフレームを符号化し得る。以下の記述は本開示の技法による、概略的なレート制御技法、ならびにイントラフレームに対するレート制御を論じる。
[0060]典型的なビデオエンコーダ(たとえば、ビデオエンコーダ20)では、元のビデオシーケンスのフレームは、イントラモード(Iモード)またはインターモード(PモードまたはBモード)で符号化され得る矩形の(rectangular)領域またはブロックに区分される。ブロックは、DCTコーディングなど、ある種類の変換コーディングを使用してコーディングされる。ただし、純粋な変換ベースのコーディング(pure transform-based coding)は、単に、複数のピクセルのブロック間相関(inter-block correlation)を考慮することなしに、特定のブロック内のピクセル間相関(inter-pixel correlation)を低減するにすぎない。変換ベースのコーディングは、依然として、送信に対する高いビットレートを作成する。HEVCなど、現在のデジタル画像コーディング規格はまた、ブロック間のピクセル値の相関を低減するいくつかの方法も活用する。
[0061]概して、Pモードで符号化されたブロックは、前にコーディングされて、送信されたフレームのうちの1つから予測される。ブロックの予測情報は、2次元(2D)動きベクトルによって表される。Iモードで符号化されたブロックの場合、予測ブロック(predicted block)は、同じフレーム内のすでに符号化された隣接ブロックからの空間予測を使用して形成される。予測誤差E(x,y)、すなわち、符号化されるブロックI(x,y)と予測されるブロックP(x,y)との間の差分は、変換基底関数(a transform basis functions)fij(i,j)の加重和(weighted sum)
Figure 0006151434
として表される。
[0062]変換は、一般に8×8(N=8)または4×4(N=4)のブロックベースで実行される。予測誤差係数(prediction error coefficients)と呼ばれる重みcijは、その後で量子化される。
Figure 0006151434
上式で、lijは、量子化された係数またはレベルと呼ばれる。量子化の演算は情報の損失をもたらす。一方、量子化された係数は、より少ないビット数を用いて表され得る。圧縮(情報の損失)のレベルは、量子化パラメータ(QP)の値を調整することによって制御される。より低いQP値は、一般的に、より少ないひずみをもたらすが、より多くのビット、したがってより高いビットレートを必要とすることがある。より高いQP値は、一般的に、より多くのひずみをもたらすが、より少ないビット、したがってより低いビットレートを必要とすることがある。そのようにして、QPの選択は、ひずみとビットレートとの間のトレードオフがなされ得る1つの技法である。
[0063]量子化された変換係数は、動きベクトルおよび何らかの制御情報とともに、完全なコーディングされたシーケンス表現を形成し、シンタックス要素と呼ばれる。ビデオエンコーダ20からビデオデコーダ30への送信の前に、シンタックス要素は、それらの表現に必要なビット数をさらに低減するようにエントロピーコーディングされ得る。
[0064]ビデオデコーダ30では、現在のフレーム中の再構成ブロック(reconstructed block)は、ビデオエンコーダ20によって実行されるのと同様の方法でそれの予測を最初に構成し、圧縮された予測誤差をその予測に追加することによって得られる。圧縮された予測誤差は、逆変換を実行することによる量子化解除された係数(de-quantized coefficients)を使用することによって見出される。
Figure 0006151434
[0065]量子化解除された係数(再構成係数(reconstructed coefficients)とも呼ばれる)γijは、逆量子化によって計算される。
Figure 0006151434
再構成フレーム(reconstructed frame)R(x,y)と元のフレームI(x,y)との間の差分は、再構成誤差と呼ばれる。
[0066]HEVC規格は、量子化、動きベクトルの選択、およびどのフレームが予測に使用されるべきかに関する決定を、ビデオエンコーダ20の実装者にゆだねる。レートひずみ理論は、不可逆圧縮の目標(lossy compression goal)を、データをコーディングするためのレートにおける制約に従って、元のデータと選択されたメトリックに従う圧縮されたデータとの間の距離の測度であるコーディングひずみを最小化することの目標に形式化する(formalize)。したがって、ビデオエンコーダ20の1つの目標は、各フレームに対して、予測誤差E(x,y)と予測誤差の再構成バージョン(reconstructed version)
Figure 0006151434
との間の平均2乗誤差(mean-squared-error)(MSE)ひずみDが、シンタックス要素をコーディングするためのレートRにおける制約に従って最小化されるようなシンタックス要素の値を見出すことである。
Figure 0006151434
[0067]他の付加的なひずみメトリックは、MSEの代わりに、たとえばアクティビティ重み付けMSE(activity-weighted MSE)を使用することができる。式(5)におけるレート制約問題(rate-constrained problem)は、ラグランジュ乗数λ(Lagrange multiplier λ)を使用して、レートおよびひずみを「マージする」ことによって等価な制約なし問題に変換されることによって解決され得る。本開示では、ラグランジュ乗数λは、レート制御パラメータと呼ばれることになる。制約なし問題は、シンタックス要素の値の(固定されたλに対する)決定になり、次のように定義される最小総ラグランジュコスト(minimum total Lagrangian Cost)を生じる。
Figure 0006151434
[0068]レート制御パラメータλは、レートとひずみとの間のトレードオフを決定するために使用されるパラメータとして観測され得る。λの低い値は、レートよりもひずみを最小化することを助け、λの高い値は、ひずみよりもレートを最小化することを助ける。λがゼロとなる限界においてひずみが最小化され、λが無限大(infinity)に向かう場合にレートが最小化される。
[0069]ビデオエンコーダ20およびビデオデコーダ30には、符号化されたビットを一時的に記憶するためのバッファ(たとえば、図2のビデオデータメモリ40)があり、そのことが、いわゆるエンドツーエンド遅延(end-to-end delay)を引き起こす。しばしば、ビデオ符号化におけるレート制御の難題は、バッファサイズの制約内で最良のビデオ品質を達成するためにλの適切な値を決定することである。
[0070]HMでは、各CTUの複雑性は、フレーム間に対するCTUビットバジェット(CTUs bit budget)を割り振るために使用される。インターフレームに対する複雑性は、前のフレーム内の同じロケーションにおけるCTUの平均絶対値差分(MAD:Mean Absolute Difference)によって測定される。しかしながら、イントラフレームの場合、実際的な使用事例の大多数において、連続したイントラフレームは互いからのより大きい時間的距離において発生するので、連続したイントラコード化フレーム間の相関は、インターコード化フレーム間の相関より小さくなることが予測され得る。
[0071]HMでは、イントラフレームに対するレート制御パラメータλは、現在のフレーム(またはCTU)のターゲットレートRtだけを使用して計算される。ターゲットレートだけを使用するレート制御に対する技法は、JCTVC−K0103、B.Liらによる「HEVCに対するR−ラムダモデルによるレート制御(Rate control by R-lambda model for HEVC)」、ITU−T SG 16 WP 3とISO/IEC JTC 1/SC 29/WG 11とのビデオコーディング共同研究部会(JCT−VC)、中国、上海、2012年10月10〜19日において記載されている。JCTVC−K0103は、参照により本明細書に組み込まれる。レート制御パラメータλを計算するためにターゲットレートだけを使用することは、すべての条件において正確でないことがある。Iフレームに対するイントラ予測コーディングを実行することにおける複雑性は、一般的に、そのフレームのビデオコンテンツの複雑性に応じてフレームによって変化する。すなわち、いくつかのイントラフレームは、同じレベルのひずみを維持するために、符号化するためのビットを他よりも多く必要とすることがある。JCTVC−K0103のレート制御技法は、このことを考慮に入れていない。
[0072]これらの欠点に鑑みて、本開示は、そのフレーム/CTUの複雑性測度Cを追加することによって、イントラフレーム(またはイントラフレームのCTU)に対するレート制御パラメータλを決定するために使用されるHMモデルを変更することを提案する。
Figure 0006151434
[0073]2次レート制御パラメータαおよびβに対する初期値は、式(7)におけるモデルをいくつもの自然画像の統計データに適合させることによって決定される。たとえば、αおよびβは、それぞれ、6.7542および1.7860の初期値を取ることができる。式(6)において上記で示したように、レート制御パラメータλは、適切な予測モードを決定するため(たとえば、IフレームのCUに対する特定のイントラ予測モードを決定するため)にレートひずみ分析において使用され得る。加えて、QP値はまた、JCTVC−I0426、B Liらによる「QP determination by lamda value」、ITU−T SG 16 WP 3とISO/IEC JTC 1/SC 29/WG 11とのビデオコーディング共同研究部会(JCT−VC)、スイス、ジュネーブ、2012年4月27日〜5月7日において提案された、レート制御パラメータλを使用して計算され得る。
Figure 0006151434
JCTVC−I0426は、参照により本明細書に組み込まれる。
[0074]本開示の一例では、複雑性測度は、絶対値変換差分和(SATD)計算に基づく。SATDは、変換(たとえば、アダマール変換)をピクセルのブロック(たとえば、ルーマピクセルの8×8ブロック)に適用した後に得られる係数hijの絶対値の合計である。一例として、
Figure 0006151434
上式で、Nはピクセル内の正方形ブロックの高さ/幅であり、iは変換係数の行であり、jは変換係数の列である。式(9)を使用して計算されたSATD値は、イントラフレームの1つのブロックのSATD値となる。CTUまたは全フレームのSATD値を計算するために、各ブロック(たとえば、各8×8ブロック)のSATD値が、CTUまたは全フレームに対して単に一緒に加算される。他の例では、SATD計算は、CTU内の全ブロックより少ないブロックに対して行われてよい。たとえば、SATD計算は、CTU内の単一のブロックに対して行われてよい。別の例では、SATD計算は、CTU行内の1つおきの8×8ブロックに対して行われてよい。アダマール変換(または、他のタイプの変換)は、ビデオ符号化プロセスにおいてなされるように、予測残差に適用されるのではなく、ピクセル値自体に適用されることに留意されたい。ピクセル自体を変換するときの変換係数の値は、複雑性の正確な測定値を表す。
[0075]イントラ予測の特定の特性を考慮に入れるために、SATD計算のいくつかの修正された測定は、一定の低周波数の係数が、複雑性の計算において除外され得るかまたはより低い程度に考慮され得るように使用され得る。たとえば、第1のSATD値(SATD0)および第2のSATD値(SATD1)が、下式
Figure 0006151434
を使用して計算され得る。
[0076]第1のSATD値(SATD0)は、全ブロックに対するSATDを決定して、次いでブロック内の位置(0、0)における変換係数(すなわち、DC係数)を減算することによって計算される。あらゆるブロックがDC係数位置においていくつかの非ゼロ値を有することになり、そのようなDC成分はイントラ予測を介して十分に予測され得るので、DC係数値をSATD計算から取り除くことが、複雑性のより正確な決定をもたらす。すなわち、DC係数位置以外のロケーションにおける係数値は、DC係数における値よりも、ブロックの複雑性をより多く示す。CTUまたは全フレームに対する第1のSATD値(SATD0)を計算するために、第1のSATD値(SATD0)は、CTUまたはフレーム内の各ブロックに対して計算され、結果として得られた第1のSATD値のすべてが、一緒に合計される。
[0077]第2のSATD値(SATD1)は、ブロックの第1の行および第1の列内の変換係数の値を一切使用せずに、ブロックに対するSATD値を計算することによって計算される。DC係数位置における変換値と同様に、変換されたブロックの第1の行および第1の列が、イントラ予測を介して十分に予測され得るいくつかの非ゼロ値を有することになる可能性が高い。そのようにして、変換されたブロック内の他のロケーションにおける変換係数値は、複雑性をより多く示し得る。CTUまたは全フレームに対する第2のSATD値(SATD1)を計算するために、第2のSATD値(SATD1)は、CTUまたはフレーム内の各ブロックに対して計算され、結果として得られた第2のSATD値のすべてが、一緒に合計される。
[0078]いくつかの例では、上記で説明した第1のSATD値(SATD0)または第2のSATD値(SATD1)は、イントラフレームのレート制御の複雑性測度として使用される唯一のSATD値として使用され得る。しかしながら、SATD値の任意の計算が、式(9)を使用して計算されるSATD値を含めて、複雑性測度として使用され得る。他の例では、以下で説明するように、第1のSATD値(SATD0)と第2のSATD値(SATD1)の両方が計算され得、SATD値の一方が、いくつかの所定の基準に基づいて複雑性測度として使用されるために選択され得る。
[0079]たとえば、第1のSATD値(SATD0)と第2のSATD値(SATD1)の両方が計算されて、第1または第2のSATD値の一方が複雑性測度C用に使用されるために選択されるときに、良い結果を得ることができることが観測されている。一例では、第1のSATD値(SATD0)は、その値が所定のしきい値より大きくない場合に使用される。そのようなしきい値は、固定されてよく、またはGOPもしくはフレームごとに適応されてもよい。第1のSATD値(SATD0)が所定のしきい値より大きい場合、第2のSATD値(SATD1)が使用される。
[0080]本開示の別の例では、720p以上の解像度を有するビデオデータに対して第2のSATD値(SATD1)が使用され、そうでない場合に第1のSATD値(SATD0)が使用される。
[0081]図3は、この開示の技法を実装するように構成された例示的なレート制御ユニットを示すブロック図である。レート制御ユニット51は、アダマール変換処理ユニット102と、SATD計算ユニット104と、複雑性測度選択ユニット106と、レート制御パラメータ計算ユニット108とを含み得る。
[0082]アダマール変換処理ユニット102は、イントラフレームからビデオブロック(たとえば、CTU)を受信するように構成され得る。アダマール変換処理ユニット102は、アダマール変換をビデオブロックの各々に(たとえば、CTUの各ルーマブロック内のルーマ値に)適用するように構成され得る。ブロック内の得られた変換係数は、SATD計算ユニット104に提供され得る。
[0083]SATD計算ユニット104は、たとえば、式(9)に示す技法を使用して、CTUの各ブロックに対するSATD値を計算し得る。SATD計算ユニット104は、フレーム内の各ブロックに対するSATD値を一緒に合計することによって、全フレームに対するSATD値を計算し得る。本開示の一例では、SATD計算ユニット104は、式(10)および式(11)に示す技法を使用して、イントラフレームの各ブロックに対する第1のSATD値(SATD0)と第2のSATD値(SATD1)とを計算するように構成され得る。次いで、結果として得られるSATD値(第1および第2のSATD値)は、複雑性測度選択ユニット106に対して利用可能にされる。
[0084]受信されたSATD値に基づいて、複雑性測度選択ユニット106は、CTUまたはフレームに対する複雑性測度として使用されるべきSATD値を選択し得る。上記で説明したように、複雑性測度選択ユニット106は、所定のしきい値に基づいて、またはビデオの解像度に基づいてSATD値を選択し得る。次いで、選択された複雑性測度は、レート制御パラメータλを計算するために、レート制御パラメータ計算ユニット108に提供される。たとえば、レート制御パラメータ計算ユニット108は、上記の式(7)に示すように、複雑性測度とターゲットビットレートとを使用してレート制御パラメータλを計算し得る。ターゲットビットレートは、ビデオシーケンスに対するビットバジェットに基づいてビデオエンコーダによって設定され得る。ビットバジェットは、使用される特定のビデオ符号化アプリケーションに基づき得る。以下でより詳細に説明するように、レート制御パラメータ計算ユニット108は、フレームレベルまたはブロックレベルのいずれかで、レート制御パラメータλならびに2次レート制御パラメータαおよびβを更新するように構成され得る。
[0085]本開示は、上記で説明した複雑性測度を使用してイントラフレームに対するレート制御に対して3つの異なるモードの動作を提案する。たとえば、次のモードが使用され得る。
1) 全フレームに対して一定のレート制御パラメータλを使用する。2次レート制御パラメータαおよびβは、各フレームが符号化された後で更新される。
2) 2次レート制御パラメータαおよびβは、全フレームに対して一定のままである。しかしながら、このフレームに割り振られた残存ビットの数に応じて、CTUごとにビットが割り振られる。レート制御パラメータλの値は、式(7)を使用して各CTUに対して計算される。
3) 2次レート制御パラメータαおよびβは、各CTUを符号化した後で更新される。上記のモード2におけるように、このフレームに割り振られた、残存ビット(remaining bits)の数に応じて、CTUごとにビットが割り振られる。レート制御パラメータλの値は、式(7)を使用して各CTUに対して計算される。
[0086]本開示の次のセクションは、レート制御パラメータλならびに2次レート制御パラメータαおよびβに対するパラメータ適応を論ずる。ピクチャを符号化した後、すべてのモードにおいて、得られた(実際の)ビットRactual(すなわち、実際に符号化されたビットの数)の値が、αおよびβの値を更新するために使用される。
Figure 0006151434
δはλの変化の速さを減じるスケーリングパラメータである。一例では、δは0.25に設定され得る。モード3では、αおよびβの値もまた、各CTUの符号化の後で更新される。Rtargetは、符号化されるフレームに対してすでに符号化されたCTUに割り振られたターゲットビットの合計であり、Ractualは、それらのCTUを符号化するときに得られたビットの総数である。
[0087]本開示の次のセクションは、ビット割り振りについて論ずる。モード3(すなわち、レート制御パラメータと2次レート制御パラメータとをブロックレベルで更新する)において、i番目のCTUに割り振られたターゲットビットの数
Figure 0006151434
が、次のように導出される。
Figure 0006151434
用語Rleftは、フレームをコーディングするために利用可能な総残存ビットを示す。重みω(i)は、i番目のCTUの複雑性CCTU(i)と、依然としてコーディングされるべきすべての残存CTUの複雑性との比である。
Figure 0006151434
上式で、Mは、コード化フレーム内のCTUの数である。
[0088]モード2(すなわち、レート制御パラメータλだけをブロックレベルで更新する)において、パラメータαおよびβは適応されていないので、それらの初期値がフレームの統計データに一致しない場合、割り振られたビット数と符号化の間に得られた実際のビット数との間に不一致が存在することになることが予測され得る。それを補償するために、修正された残存ビット
Figure 0006151434
が、i番目のCTUをコーディングするために割り振られるビット数を得るために使用される。
Figure 0006151434
[0089]修正された残存ビット
Figure 0006151434
は、次のように計算される。
Figure 0006151434
上式で、
Figure 0006151434
は、次のように各CTUに割り振られる初期ビットターゲットであり、
Figure 0006151434
Wは、ビットレート変更をより円滑にするために使用されるウィンドウのサイズである。我々のシミュレーションで使用されるWは、4である。用語Rtargetは、フレームをコーディングするために割り振られるビット数を示す。
[0090]図4は、例示的なビデオデコーダ30を示すブロック図である。図4の例では、ビデオデコーダ30は、ビデオデータメモリ83と、エントロピー復号ユニット80と、予測処理ユニット81と、逆量子化ユニット86と、逆変換処理ユニット88と、加算器90と、参照ピクチャメモリ92とを含む。予測処理ユニット81は、動き補償ユニット82と、イントラ予測処理ユニット84とを含む。ビデオデコーダ30は、いくつかの例では、図2からのビデオエンコーダ20に関して説明した符号化パスとは概して逆の復号パスを実行し得る。
[0091]ビデオデータメモリ83は、ビデオデコーダ30の構成要素によって復号されるべきビデオデータを記憶し得る。ビデオデータメモリ83に記憶されたビデオデータは、たとえば、ビデオエンコーダ20から取得され得る。参照ピクチャメモリ92は、(たとえば、イントラ予測コーディングモードまたはインター予測コーディングモードとも呼ばれる、イントラコーディングモードまたはインターコーディングモードで)ビデオデコーダ30によってビデオデータを復号する際に使用するための、参照ビデオデータを記憶する復号化ピクチャバッファ(DPB)の一例である。ビデオデータメモリ83および参照ピクチャメモリ92は、同期DRAM(SDRAM)、磁気抵抗RAM(MRAM)、抵抗RAM(RRAM)、または他のタイプのメモリデバイスを含む、ダイナミックランダムアクセスメモリ(DRAM)など、様々なメモリデバイスのいずれかによって形成され得る。ビデオデータメモリ83および参照ピクチャメモリ92は、同じメモリデバイスまたは別個のメモリデバイスによって提供され得る。様々な例では、ビデオデータメモリ83は、ビデオデコーダ30の他の構成要素とともにオンチップであるか、またはそれらの構成要素に対してオフチップであり得る。
[0092]復号プロセスの間に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化されたビデオスライスのビデオブロックと、関連付けられるシンタックス要素と、を表す符号化されたビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット80は、量子化された係数、動きベクトル、および他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット80は、動きベクトルと他のシンタックス要素とを予測処理ユニット81に転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
[0093]ビデオスライスがイントラコード化(I)スライスとしてコーディングされるとき、予測処理ユニット81のイントラ予測処理ユニット84は、シグナリングされたイントラ予測モードと、現在のフレームまたはピクチャの、前に復号されたブロックからのデータと、に基づいて、現在のビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(すなわち、B、またはP)スライスとしてコーディングされるとき、予測処理ユニット81の動き補償ユニット82は、エントロピー復号ユニット80から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロック用の予測ブロックを生成する。予測ブロックは、参照ピクチャリストの1つの中の参照ピクチャのうち1つから生成され得る。ビデオデコーダ30は、参照ピクチャメモリ92に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト0とリスト1とを構成し得る。
[0094]動き補償ユニット82は、動きベクトルと他のシンタックス要素とを解析することによって現在のビデオスライスのビデオブロックについての予測情報を決定し、復号されている現在のビデオブロックのための予測ブロックを生成するために予測情報を使用する。たとえば、動き補償ユニット82は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラまたはインター予測)と、インター予測スライスタイプ(たとえば、Bスライス、Pスライス、またはGPBスライス)と、スライスの参照ピクチャリストのうちの1つまたは複数のための構成情報と、スライスの各インター符号化ビデオブロックのための動きベクトルと、スライスの各インターコード化ビデオブロックのためのインター予測ステータスと、現在のビデオスライス中のビデオブロックを復号するための他の情報と、を決定するために、受信されたシンタックス要素のいくつかを使用する。
[0095]動き補償ユニット82はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット82は、参照ブロックのサブ整数ピクセルのための補間された値を計算するために、ビデオブロックの符号化の間にビデオエンコーダ20によって使用された補間フィルタを使用し得る。この場合、動き補償ユニット82は、受信されたシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。
[0096]逆量子化ユニット86は、ビットストリーム中で提供されて、エントロピー復号ユニット80によって復号された量子化された変換係数を逆量子化(inverse quantize)、すなわち、量子化解除(de-quantize)する。逆量子化プロセスは、量子化の程度を決定し、同様に、適用されるべき逆量子化の程度を決定するための、ビデオスライス中のビデオブロックごとにエンコーダ20によって計算される量子化パラメータの使用を含み得る。逆変換処理ユニット88は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば逆DCT、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。
[0097]動き補償ユニット82が、動きベクトルと他のシンタックス要素とに基づいて現在のビデオブロックのための予測ブロックを生成した後、ビデオデコーダ30は、逆変換処理ユニット88からの残差ブロックを、動き補償ユニット82によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器90は、この加算演算を実行する1つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために復号されたブロックをフィルタ処理するデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するために、または場合によってはビデオ品質を改善するために、(コーディングループ内またはコーディングループ後のいずれかの)他のループフィルタも使用され得る。所与のフレームまたはピクチャ中の復号されたビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照ピクチャメモリ92に記憶される。参照ピクチャメモリ92はまた、図1のディスプレイデバイス31などのディスプレイデバイス上での後の提示のために、復号されたビデオを記憶する。
[0098]図5は、本開示の例示的な方法を示すフローチャートである。図5の技法は、レート制御ユニット51を含む、ビデオエンコーダ20の1つまたは複数の構成要素によって実装され得る。
[0099]本開示の一例では、レート制御ユニット51は、ビデオデータのフレーム内の、各ブロックに対するSATD計算に基づいてビデオデータのフレームの複雑性測度を決定するように構成され得、ここにおいて、ビデオデータのフレームはイントラ予測を使用して符号化されるべきである(152)。レート制御ユニット51は、複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定するようにさらに構成され得る(154)。ビデオエンコーダ20は、決定されたレート制御パラメータに基づいてイントラ予測モードを決定し(156)、決定されたイントラ予測モードを使用してビデオデータのフレームを符号化する(158)ように構成され得る。本開示のさらなる例では、ビデオエンコーダ20は、決定されたレート制御パラメータに基づいて量子化パラメータを決定し、決定された量子化パラメータを使用してビデオデータのフレームを符号化するようにさらに構成され得る。
[0100]本開示の一例では、ビデオエンコーダ20は、ビデオデータのフレームの各ブロックに対する複雑性測度とレート制御パラメータとを決定するように構成される。一例では、レート制御ユニット51を含むビデオエンコーダ20は、変換係数のブロックを作成するブロックに対する周波数ドメイン変換を実行することと、変換係数のすべてを合計することおよび変換係数のブロック内のDC係数位置における変換係数の値を減算することによって第1のSATD値を計算することと、複雑性測度として第1のSATD値を割り当てることと、によって複雑性測度を決定するようにさらに構成される。本開示の別の例では、レート制御ユニット51を含むビデオエンコーダ20は、変換係数のブロックを作成するブロックに対する周波数ドメイン変換を実行することと、ブロック変換係数の最上行および最左列における変換係数以外の変換係数のブロック内の変換係数のすべてを合計することによって第2のSATD値を計算することと、複雑性測度として第2のSATD値を割り当てることと、によって複雑性測度を決定するようにさらに構成される。別の例では、レート制御ユニット51は、第1および第2の両方のSATD値を計算することと、所定の基準に基づいて複雑性測度として第1のSATD値または第2のSATD値のいずれかを選択することとを行うようにさらに構成され得る。
[0101]一例では、レート制御ユニット51は、第1のSATD値が所定のしきい値より小さい場合に複雑性測度として第1のSATD値を選択することと、第1のSATD値が所定のしきい値より大きい場合に複雑性測度として第2のSATD値を選択することとを行うように構成される。別の例では、レート制御ユニット51は、ビデオデータのフレームが720pより小さい解像度を有する場合に複雑性測度として第1のSATD値を選択することと、ビデオデータのフレームが720p以上の解像度を有する場合に複雑性測度として第2のSATD値を選択することとを行うように構成される。
[0102]本開示の別の例では、ビデオエンコーダ20は、ビデオデータの全フレームに対する複雑性測度とレート制御パラメータとを決定するように構成される。この例では、レート制御ユニット51を含むビデオエンコーダ20は、変換係数のブロックを作成するビデオデータのフレームの各ブロックに対する周波数ドメイン変換を実行することと、それぞれのブロックの変換係数のすべてを合計することおよびDC係数位置における変換係数の値を減算することによって各ブロックに対する第1のSATD値を計算することと、第1のフレームSATD値を作成するために各ブロックに対する第1のSATD値を合計することと、ブロック変換係数の最上行および最左列における変換係数以外のそれぞれのブロックの変換係数のブロック内の変換係数のすべてを合計することによって各々のブロックに対する第2のSATD値を計算することと、第2のフレームSATD値を作成するために各ブロックに対する第2のSATD値を合計することと、複雑性測度として第1のフレームSATD値または第2のフレームSATD値のいずれかを選択することと、によってビデオデータのフレームの複雑性測度を決定するように構成される。
[0103]本開示の一例では、レート制御ユニット51は、第1のフレームSATD値が所定のしきい値より小さい場合に複雑性測度として第1のフレームSATD値を選択することと、第1のフレームSATD値が所定のしきい値より大きい場合に複雑性測度として第2のフレームSATD値を選択することとを行うように構成される。本開示の別の例では、レート制御ユニット51は、ビデオデータのフレームが720pより小さい解像度を有する場合に複雑性測度として第1のフレームSATD値を選択することと、ビデオデータのフレームが720p以上の解像度を有する場合に複雑性測度として第2のフレームSATD値を選択することとを行うように構成される。
[0104]本開示の一例では、レート制御ユニット51は、式
Figure 0006151434
を計算することによってレート制御パラメータを決定するように構成され、
ここで、λはレート制御パラメータであり、Cは複雑性測度であり、Rtargetはターゲットビットレートであり、αおよびβは2次レート制御パラメータである。
[0105]本開示の一例では、レート制御ユニット51は、2次レート制御パラメータをフレームレベルで更新するように構成される。本開示の別の例では、レート制御ユニット51は、2次レート制御パラメータをブロックレベルで更新するように構成される。
[0106]1つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実現され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されてよく、あるいは、コンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行されてよい。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を支援する任意の媒体を含む通信媒体、またはデータ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、一般に、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法を実装するための命令、コードおよび/またはデータ構造を取り出すために、1つもしくは複数のコンピュータ、または1つもしくは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含む場合がある。
[0107]限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備え得る。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。しかしながら、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的な媒体を含まないが、代わりに非一時的な有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびBlu−rayディスク(disc)を含み、この場合、ディスク(disk)は、通常、データを磁気的に再生し、一方、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
[0108]命令は、1つもしくは複数のデジタルシグナルプロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、または他の等価な集積回路もしくはディスクリート論理回路などの1つもしくは複数のプロセッサによって実行され得る。したがって、本明細書で使用される「プロセッサ」という用語は、前述の構造、または本明細書で説明された技法の実施に適した任意の他の構造のいずれかを指し得る。加えて、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用のハードウェアおよび/またはソフトウェアモジュール内に設けられる場合があるか、または複合コーデックに組み込まれる場合がある。また、本技法は、1つまたは複数の回路または論理要素に完全に実装され得る。
[0109]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)、またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置の中に実装される場合がある。本開示では、開示される技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットが説明されたが、それらの構成要素、モジュール、またはユニットは、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、前述のように、適切なソフトウェアおよび/またはファームウェアとともに、様々なユニットがコーデックハードウェアユニットにおいて組み合わせられ得るか、または前述のような1つもしくは複数のプロセッサを含む、相互動作可能なハードウェアユニットの集合体によって設けられ得る。
[0110]種々の例が記載された。これらおよび他の例は、以下の特許請求の範囲内である。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1] ビデオ符号化におけるレート制御のための方法であって、
ビデオデータのフレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記フレームの複雑性測度を決定することと、ここにおいて、ビデオデータの前記フレームはイントラ予測を使用して符号化されるべきである、
前記複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定することと、
前記決定されたレート制御パラメータに基づいてイントラ予測モードを決定することと、
前記決定されたイントラ予測モードを使用してビデオデータの前記フレームを符号化することと
を備える、方法。
[C2] 前記決定されたレート制御パラメータに基づいて量子化パラメータを決定することと、
前記決定された量子化パラメータを使用してビデオデータの前記フレームを符号化することと
をさらに備える、C1に記載の方法。
[C3] 前記複雑性測度および前記レート制御パラメータが、ビデオデータの前記フレームの各コーディングツリーユニット(CTU)に対して決定される、C1に記載の方法。
[C4] 前記ビデオデータの1つのCTUの前記複雑性測度を決定することが、
変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって、第1のSATD値を計算することと、
前記複雑性測度として前記第1のSATD値を割り当てることと
を備える、C3に記載の方法。
[C5] 前記CTUに対する前記周波数ドメイン変換を実行することが、前記CTUのあらゆるブロックに対する前記周波数ドメイン変換を実行することを備え、前記第1のSATD値を計算することが、各ブロックの前記変換係数のすべてを合計することおよび変換係数の前記ブロック内の前記DC係数位置における前記変換係数の前記値を減算することによって、前記第1のSATD値を計算することを備える、C4に記載の方法。
[C6] 前記ビデオデータの1つのCTUの前記複雑性測度を決定することが、
変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
前記複雑性測度として前記第2のSATD値を割り当てることと
を備える、C3に記載の方法。
[C7] ビデオデータの前記フレームの1つのCTUの前記複雑性測度を決定することが、
変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって第1のSATD値を計算することと、
前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
1つまたは複数の所定の基準に基づいて前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することと
を備える、C3に記載の方法。
[C8] 前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することが、
前記第1のSATD値が所定のしきい値より小さい場合、前記複雑性測度として前記第1のSATD値を選択することと、
前記第1のSATD値が所定のしきい値より大きい場合、前記複雑性測度として前記第2のSATD値を選択することと
を備える、C7に記載の方法。
[C9] 前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することが、
ビデオデータの前記フレームが720pより小さい解像度を有する場合、前記複雑性測度として前記第1のSATD値を選択することと、
ビデオデータの前記フレームが720p以上の解像度を有する場合、前記複雑性測度として前記第2のSATD値を選択することと
を備える、C7に記載の方法。
[C10] ビデオデータの前記フレーム全体に対して前記複雑性測度と前記レート制御パラメータとを決定することをさらに備える、C1に記載の方法。
[C11] 前記レート制御パラメータを決定することが、
式 λ=α(C/R target β を計算することを備え、
ここにおいて、λが前記レート制御パラメータであり、Cが前記複雑性測度であり、R target が前記ターゲットビットレートであり、αおよびβが2次レート制御パラメータである、C1に記載の方法。
[C12] 前記2次レート制御パラメータをフレームレベルで更新することをさらに備える、C11に記載の方法。
[C13] 前記2次レート制御パラメータをコーディングツリーユニット(CTU)レベルで更新することをさらに備える、C11に記載の方法。
[C14] ビデオ符号化プロセスにおいてレート制御を実行するように構成された装置であって、
ビデオデータのフレームを記憶するように構成されたメモリと、
ビデオデータの前記フレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記フレームの複雑性測度を決定すること、ここにおいて、ビデオデータの前記フレームはイントラ予測を使用して符号化されるべきである、
前記複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定すること、
前記決定されたレート制御パラメータに基づいてイントラ予測モードを決定すること、および
前記決定されたイントラ予測モードを使用してビデオデータの前記フレームを符号化することを行うように構成されたビデオエンコーダと
を備える、装置。
[C15] 前記ビデオエンコーダが、
前記決定されたレート制御パラメータに基づいて量子化パラメータを決定することと、
前記決定された量子化パラメータを使用してビデオデータの前記フレームを符号化することと
を行うようにさらに構成される、C14に記載の装置。
[C16] ビデオエンコーダが、ビデオデータの前記フレームの各コーディングツリーユニット(CTU)に対する、前記複雑性測度と前記レート制御パラメータとを決定するように構成される、C15に記載の装置。
[C17] 前記ビデオエンコーダが、
変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって、第1のSATD値を計算することと、
前記複雑性測度として前記第1のSATD値を割り当てることと
によって前記複雑性測度を決定するようにさらに構成される、C16に記載の装置。
[C18] 前記CTUに対する前記周波数ドメイン変換を実行することが、前記CTUのあらゆるブロックに対する前記周波数ドメイン変換を実行することを備え、前記第1のSATD値を計算することが、前記変換係数の前記変換係数すべてのすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって、前記第1のSATD値を計算することとを備える、C17に記載の装置。
[C19] 前記ビデオエンコーダが、
変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
前記複雑性測度として前記第2のSATD値を割り当てることと
によって前記複雑性測度を決定するようにさらに構成される、C16に記載の装置。
[C20] 前記ビデオエンコーダが、
変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって第1のSATD値を計算することと、
前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
1つまたは複数の所定の基準に基づいて前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することと
によって前記複雑性測度を決定するようにさらに構成される、C16に記載の装置。
[C21] 前記ビデオエンコーダが、
前記第1のSATD値が所定のしきい値より小さい場合、前記複雑性測度として前記第1のSATD値を選択することと、
前記第1のSATD値が所定のしきい値より大きい場合、前記複雑性測度として前記第2のSATD値を選択することと
を行うようにさらに構成される、C20に記載の装置。
[C22] 前記ビデオエンコーダが、
ビデオデータの前記フレームが720pより小さい解像度を有する場合、前記複雑性測度として前記第1のSATD値を選択することと、
ビデオデータの前記フレームが720p以上の解像度を有する場合、前記複雑性測度として前記第2のSATD値を選択することと
を行うようにさらに構成される、C20に記載の装置。
[C23] 前記ビデオエンコーダが、ビデオデータの前記フレーム全体に対する前記複雑性測度と前記レート制御パラメータとを決定するように構成される、C14に記載の装置。
[C24] 前記ビデオエンコーダが、式 λ=α(C/R target β を計算することによって前記レート制御パラメータを決定するように構成され、
ここにおいて、λが前記レート制御パラメータであり、Cが前記複雑性測度であり、R target が前記ターゲットビットレートであり、αおよびβが2次レート制御パラメータである、C14に記載の装置。
[C25] 前記ビデオエンコーダが、
前記2次レート制御パラメータをフレームレベルで更新するようにさらに構成される、C24に記載の装置。
[C26] 前記ビデオエンコーダが、
前記2次レート制御パラメータをコーディングツリーユニット(CTU)レベルで更新するようにさらに構成される、C24に記載の装置。
[C27] ビデオ符号化プロセスにおいてレート制御を実行するように構成された装置であって、
ビデオデータのフレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記フレームの複雑性測度を決定するための手段と、ここにおいて、ビデオデータの前記フレームはイントラ予測を使用して符号化されるべきである、
前記複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定するための手段と、
前記決定されたレート制御パラメータに基づいてイントラ予測モードを決定するための手段と、
前記決定されたイントラ予測モードを使用してビデオデータの前記フレームを符号化するための手段と
を備える、装置。
[C28] 前記決定されたレート制御パラメータに基づいて量子化パラメータを決定するための手段と、
前記決定された量子化パラメータを使用してビデオデータの前記フレームを符号化するための手段と
をさらに備える、C27に記載の装置。
[C29] 命令を記憶するコンピュータ可読記憶媒体であって、前記命令が、実行されたとき、ビデオデータを符号化するように構成されたデバイスの1つまたは複数のプロセッサに、
ビデオデータのフレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記フレームの複雑性測度を決定することと、ここにおいて、ビデオデータの前記フレームはイントラ予測を使用して符号化されるべきである、
前記複雑性測度およびターゲットビットレートに基づいてレート制御パラメータを決定することと、
前記決定されたレート制御パラメータに基づいてイントラ予測モードを決定することと、
前記決定されたイントラ予測モードを使用してビデオデータの前記フレームを符号化することと
を行わせる、コンピュータ可読記憶媒体。
[C30] 前記命令が、さらに、前記1つまたは複数のプロセッサに、
前記決定されたレート制御パラメータに基づいて量子化パラメータを決定することと、
前記決定された量子化パラメータを使用してビデオデータの前記フレームを符号化することと
をさらに行わせる、C29に記載のコンピュータ可読記憶媒体。

Claims (26)

  1. ビデオ符号化におけるレート制御のための方法であって、
    ビデオデータのイントラフレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記イントラフレームの複雑性測度を決定することと、ここにおいて、ビデオデータの前記イントラフレームはイントラ予測を使用して符号化されるべきである、
    前記複雑性測度およびターゲットビットレートに基づいて、前記イントラフレームに対するレート制御パラメータを決定することと、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて、前記イントラフレームに対するイントラ予測モードを決定することと、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて量子化パラメータを決定することと、
    前記決定されたイントラ予測モードおよび前記決定された量子化パラメータを使用してビデオデータの前記イントラフレームを符号化することと
    を備える、方法。
  2. 前記複雑性測度および前記レート制御パラメータが、ビデオデータの前記イントラフレームの各コーディングツリーユニット(CTU)に対して決定される、請求項1に記載の方法。
  3. デオデータの前記イントラフレームの1つのCTUの前記複雑性測度を決定することが、
    変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
    前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって、第1のSATD値を計算することと、
    前記複雑性測度として前記第1のSATD値を割り当てることと
    を備える、請求項に記載の方法。
  4. 前記CTUに対する前記周波数ドメイン変換を実行することが、前記CTUのあらゆるブロックに対する前記周波数ドメイン変換を実行することを備え、前記第1のSATD値を計算することが、各ブロックの前記変換係数のすべてを合計することおよび変換係数の前記ブロック内の前記DC係数位置における前記変換係数の前記値を減算することによって、前記第1のSATD値を計算することを備える、請求項に記載の方法。
  5. 前記ビデオデータの前記イントラフレームの1つのCTUの前記複雑性測度を決定することが、
    変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
    前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
    前記複雑性測度として前記第2のSATD値を割り当てることと
    を備える、請求項に記載の方法。
  6. ビデオデータの前記イントラフレームの1つのCTUの前記複雑性測度を決定することが、
    変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
    前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって第1のSATD値を計算することと、
    前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
    1つまたは複数の所定の基準に基づいて前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することと
    を備える、請求項に記載の方法。
  7. 前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することが、
    前記第1のSATD値が所定のしきい値より小さい場合、前記複雑性測度として前記第1のSATD値を選択することと、
    前記第1のSATD値が所定のしきい値より大きい場合、前記複雑性測度として前記第2のSATD値を選択することと
    を備える、請求項に記載の方法。
  8. 前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することが、
    ビデオデータの前記イントラフレームが720pより小さい解像度を有する場合、前記複雑性測度として前記第1のSATD値を選択することと、
    ビデオデータの前記イントラフレームが720p以上の解像度を有する場合、前記複雑性測度として前記第2のSATD値を選択することと
    を備える、請求項に記載の方法。
  9. ビデオデータの前記イントラフレーム全体に対して前記複雑性測度と前記レート制御パラメータとを決定することをさらに備える、請求項1に記載の方法。
  10. 前記レート制御パラメータを決定することが、
    式 λ=α(C/Rtargetβを計算することを備え、
    ここにおいて、λが前記レート制御パラメータであり、Cが前記複雑性測度であり、Rtargetが前記ターゲットビットレートであり、αおよびβが2次レート制御パラメータである、請求項1に記載の方法。
  11. 前記2次レート制御パラメータをフレームレベルで更新することをさらに備える、請求項10に記載の方法。
  12. 前記2次レート制御パラメータをコーディングツリーユニット(CTU)レベルで更新することをさらに備える、請求項10に記載の方法。
  13. ビデオ符号化プロセスにおいてレート制御を実行するように構成された装置であって、
    ビデオデータのイントラフレームを記憶するように構成されたメモリと、
    ビデオデータの前記イントラフレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記イントラフレームの複雑性測度を決定すること、ここにおいて、ビデオデータの前記イントラフレームはイントラ予測を使用して符号化されるべきである、
    前記複雑性測度およびターゲットビットレートに基づいて、前記イントラフレームに対するレート制御パラメータを決定すること、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて、前記イントラフレームに対するイントラ予測モードを決定すること、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて量子化パラメータを決定すること、および
    前記決定されたイントラ予測モードおよび前記決定された量子化パラメータを使用してビデオデータの前記イントラフレームを符号化すること
    を行うように構成されたビデオエンコーダと
    を備える、装置。
  14. ビデオエンコーダが、ビデオデータの前記イントラフレームの各コーディングツリーユニット(CTU)に対する、前記複雑性測度と前記レート制御パラメータとを決定するように構成される、請求項13に記載の装置。
  15. 前記ビデオエンコーダが、
    変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
    前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって、第1のSATD値を計算することと、
    前記複雑性測度として前記第1のSATD値を割り当てることと
    によって前記複雑性測度を決定するようにさらに構成される、請求項14に記載の装置。
  16. 前記CTUに対する前記周波数ドメイン変換を実行することが、前記CTUのあらゆるブロックに対する前記周波数ドメイン変換を実行することを備え、前記第1のSATD値を計算することが、前記変換係数の前記変換係数すべてのすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって、前記第1のSATD値を計算することを備える、請求項15に記載の装置。
  17. 前記ビデオエンコーダが、
    変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
    前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
    前記複雑性測度として前記第2のSATD値を割り当てることと
    によって前記複雑性測度を決定するようにさらに構成される、請求項14に記載の装置。
  18. 前記ビデオエンコーダが、
    変換係数のブロックを作成する前記CTUに対する周波数ドメイン変換を実行することと、
    前記変換係数のすべてを合計することおよび変換係数の前記ブロック内のDC係数位置における変換係数の値を減算することによって第1のSATD値を計算することと、
    前記ブロック変換係数の最上行および最左列における変換係数以外の変換係数の前記ブロック内の前記変換係数のすべてを合計することによって第2のSATD値を計算することと、
    1つまたは複数の所定の基準に基づいて前記複雑性測度として前記第1のSATD値または前記第2のSATD値のいずれかを選択することと
    によって前記複雑性測度を決定するようにさらに構成される、請求項14に記載の装置。
  19. 前記ビデオエンコーダが、
    前記第1のSATD値が所定のしきい値より小さい場合、前記複雑性測度として前記第1のSATD値を選択することと、
    前記第1のSATD値が所定のしきい値より大きい場合、前記複雑性測度として前記第2のSATD値を選択することと
    を行うようにさらに構成される、請求項18に記載の装置。
  20. 前記ビデオエンコーダが、
    ビデオデータの前記イントラフレームが720pより小さい解像度を有する場合、前記複雑性測度として前記第1のSATD値を選択することと、
    ビデオデータの前記イントラフレームが720p以上の解像度を有する場合、前記複雑性測度として前記第2のSATD値を選択することと
    を行うようにさらに構成される、請求項18に記載の装置。
  21. 前記ビデオエンコーダが、ビデオデータの前記イントラフレーム全体に対して前記複雑性測度と前記レート制御パラメータとを決定するように構成される、請求項13に記載の装置。
  22. 前記ビデオエンコーダが、
    式 λ=α(C/Rtargetβを計算することによって前記レート制御パラメータを決定するように構成され、
    ここにおいて、λが前記レート制御パラメータであり、Cが前記複雑性測度であり、Rtargetが前記ターゲットビットレートであり、αおよびβが2次レート制御パラメータである、請求項13に記載の装置。
  23. 前記ビデオエンコーダが、
    前記2次レート制御パラメータをフレームレベルで更新するようにさらに構成される、請求項22に記載の装置。
  24. 前記ビデオエンコーダが、
    前記2次レート制御パラメータをコーディングツリーユニット(CTU)レベルで更新するようにさらに構成される、請求項22に記載の装置。
  25. ビデオ符号化プロセスにおいてレート制御を実行するように構成された装置であって、
    ビデオデータのイントラフレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記イントラフレームの複雑性測度を決定するための手段と、ここにおいて、ビデオデータの前記イントラフレームはイントラ予測を使用して符号化されるべきである、
    前記複雑性測度およびターゲットビットレートに基づいて、前記イントラフレームに対するレート制御パラメータを決定するための手段と、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて、前記イントラフレームに対するイントラ予測モードを決定するための手段と、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて量子化パラメータを決定するための手段と、
    前記決定されたイントラ予測モードおよび前記決定された量子化パラメータを使用してビデオデータの前記イントラフレームを符号化するための手段と
    を備える、装置。
  26. 命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令が、実行されたとき、ビデオデータを符号化するように構成されたデバイスの1つまたは複数のプロセッサに、
    ビデオデータのイントラフレーム内の各ブロックに対する絶対値変換差分和(SATD)計算に基づいてビデオデータの前記イントラフレームの複雑性測度を決定することと、ここにおいて、ビデオデータの前記イントラフレームはイントラ予測を使用して符号化されるべきである、
    前記複雑性測度およびターゲットビットレートに基づいて、前記イントラフレームに対するレート制御パラメータを決定することと、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて、前記イントラフレームに対するイントラ予測モードを決定することと、
    前記イントラフレームに対する前記決定されたレート制御パラメータに基づいて量子化パラメータを決定することと、
    前記決定されたイントラ予測モードおよび前記決定された量子化パラメータを使用してビデオデータの前記イントラフレームを符号化することと
    を行わせる、非一時的コンピュータ可読記憶媒体。
JP2016506679A 2013-04-08 2014-04-07 絶対値変換差分和に基づくビデオ符号化のためのイントラレート制御 Expired - Fee Related JP6151434B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361809846P 2013-04-08 2013-04-08
US61/809,846 2013-04-08
US14/245,864 2014-04-04
US14/245,864 US9538190B2 (en) 2013-04-08 2014-04-04 Intra rate control for video encoding based on sum of absolute transformed difference
PCT/US2014/033192 WO2014168877A1 (en) 2013-04-08 2014-04-07 Intra rate control for video encoding based on sum of absolute transformed difference

Publications (3)

Publication Number Publication Date
JP2016518777A JP2016518777A (ja) 2016-06-23
JP2016518777A5 JP2016518777A5 (ja) 2017-03-23
JP6151434B2 true JP6151434B2 (ja) 2017-06-21

Family

ID=51654445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016506679A Expired - Fee Related JP6151434B2 (ja) 2013-04-08 2014-04-07 絶対値変換差分和に基づくビデオ符号化のためのイントラレート制御

Country Status (6)

Country Link
US (1) US9538190B2 (ja)
EP (1) EP2984832B1 (ja)
JP (1) JP6151434B2 (ja)
KR (1) KR20150139910A (ja)
CN (1) CN105103550B (ja)
WO (1) WO2014168877A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8379727B2 (en) * 2008-09-26 2013-02-19 General Instrument Corporation Method and apparatus for scalable motion estimation
US10244255B2 (en) 2015-04-13 2019-03-26 Qualcomm Incorporated Rate-constrained fallback mode for display stream compression
US10284849B2 (en) 2015-04-13 2019-05-07 Qualcomm Incorporated Quantization parameter (QP) calculation for display stream compression (DSC) based on complexity measure
US9936203B2 (en) 2015-04-13 2018-04-03 Qualcomm Incorporated Complex region detection for display stream compression
US10356428B2 (en) 2015-04-13 2019-07-16 Qualcomm Incorporated Quantization parameter (QP) update classification for display stream compression (DSC)
CN106470341B (zh) * 2015-08-17 2020-10-02 恩智浦美国有限公司 媒体显示系统
CN106488229B (zh) 2015-09-01 2022-01-21 恩智浦美国有限公司 具有可调整帧内刷新率的视频编码器
CN107613292B (zh) * 2016-07-11 2020-04-07 合肥君正科技有限公司 一种图像复杂度评估方法及装置
US10542262B2 (en) 2016-11-15 2020-01-21 City University Of Hong Kong Systems and methods for rate control in video coding using joint machine learning and game theory
CN106961604B (zh) 2017-03-07 2018-06-15 腾讯科技(深圳)有限公司 视频编码的码率分配、编码单元码率分配方法及装置
CN109561310B (zh) * 2017-09-26 2022-09-16 腾讯科技(深圳)有限公司 视频编码处理方法、装置、设备和存储介质
CN109168030B (zh) * 2018-10-12 2021-03-26 中南大学 一种视频转码方法、设备及其存储介质
CN109547795B (zh) * 2018-10-26 2021-02-12 上海九吾尊易信息科技有限公司 视频编码方法及装置
CN111193927B (zh) 2018-11-14 2022-09-23 腾讯科技(深圳)有限公司 编码数据处理方法、装置、计算机设备和存储介质
WO2021248135A1 (en) * 2020-06-05 2021-12-09 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatuses for video coding using satd based cost calculation
US11532077B2 (en) 2020-08-17 2022-12-20 Netflix, Inc. Techniques for computing perceptual video quality based on brightness and color components
US11557025B2 (en) * 2020-08-17 2023-01-17 Netflix, Inc. Techniques for training a perceptual quality model to account for brightness and color distortions in reconstructed videos

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090225829A2 (en) 2005-07-06 2009-09-10 Do-Kyoung Kwon Method and apparatus for operational frame-layerrate control in video encoder
US8094716B1 (en) 2005-08-25 2012-01-10 Maxim Integrated Products, Inc. Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding
JP2007089035A (ja) * 2005-09-26 2007-04-05 Toshiba Corp 動画像符号化方法、装置及びプログラム
US7929608B2 (en) * 2006-03-28 2011-04-19 Sony Corporation Method of reducing computations in intra-prediction and mode decision processes in a digital video encoder
WO2008154742A1 (en) * 2007-06-19 2008-12-24 Vantrix Corporation A buffer-based rate control exploiting frame complexity, buffer level and position of intra frames in video coding
CN100562118C (zh) * 2007-07-03 2009-11-18 上海富瀚微电子有限公司 一种视频编码的码率控制方法
CN101632307B (zh) * 2007-09-12 2012-12-05 索尼株式会社 图像处理装置和图像处理方法
JP2009141815A (ja) * 2007-12-07 2009-06-25 Toshiba Corp 画像符号化方法、装置及びプログラム
CN102316313B (zh) * 2010-06-29 2013-08-28 凌阳科技股份有限公司 嵌入式实时视频压缩系统中的低复杂度的比特率控制方法
US9215470B2 (en) * 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
US8804820B2 (en) * 2011-04-21 2014-08-12 Dialogic Corporation Rate control with look-ahead for video transcoding
US9591302B2 (en) * 2012-07-02 2017-03-07 Microsoft Technology Licensing, Llc Use of chroma quantization parameter offsets in deblocking

Also Published As

Publication number Publication date
JP2016518777A (ja) 2016-06-23
EP2984832B1 (en) 2022-04-27
WO2014168877A1 (en) 2014-10-16
CN105103550B (zh) 2019-01-11
CN105103550A (zh) 2015-11-25
KR20150139910A (ko) 2015-12-14
US20140301460A1 (en) 2014-10-09
EP2984832A1 (en) 2016-02-17
US9538190B2 (en) 2017-01-03

Similar Documents

Publication Publication Date Title
JP6151434B2 (ja) 絶対値変換差分和に基づくビデオ符号化のためのイントラレート制御
JP6636564B2 (ja) ビデオコーディングにおける4:2:2サンプルフォーマットのためのコード化ブロックフラグ(cbf)コーディング
TWI766844B (zh) 針對視訊寫碼使用與位置相關之預測組合之改良視訊幀內預測
JP7233218B2 (ja) ビデオコーディングのためにブロックの複数のクラスのためのフィルタをマージすること
JP6284954B2 (ja) イントラ予測のためのモード決定の簡略化
JP5833249B2 (ja) ビデオコーディングのための適応的な中心帯域オフセットフィルタ
JP5922244B2 (ja) ビデオコーディングにおいて適応ループフィルタとマージされたサンプル適応オフセット
JP5788517B2 (ja) ジョイントコンテキストモデルを使用した係数のエントロピーコード化
JP5866453B2 (ja) イントラモードコーディングにおける参照モード選択
JP5955955B2 (ja) リーフレベルコード化単位のサブセットについての変換係数のシンタックス要素の信号伝達
JP6301449B2 (ja) ビット深度に基づいたサンプル適応オフセットスケーリング
US10638127B2 (en) Adaptive anchor frame and quantization parameter decision in video coding
JP2018509035A (ja) 適応型成分間残差予測
JP6199371B2 (ja) ビデオ・コーディングのためのインタ・レイヤ・テクスチャ予測
JP2016526857A (ja) ビデオコーディングにおける適応フィルタリング
JP2015516768A (ja) 変換係数コーディング
JP2017513311A (ja) 残差差分パルス符号変調のための量子化プロセス
JP2014535225A (ja) イントラモードビデオコーディング
TWI558174B (zh) 用於寫碼視訊資訊之裝置、方法及非暫時性電腦可讀媒體
JP2013543317A5 (ja)
TW201444350A (zh) 方形區塊預測
JP2018511232A (ja) 非正方形区分を使用してビデオデータを符号化するための最適化
JP2017512025A (ja) ビデオコーディングにおけるフリッカー検出および軽減
TW201921938A (zh) 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構
WO2020042758A1 (zh) 一种帧间预测的方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170216

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170411

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170524

R150 Certificate of patent or registration of utility model

Ref document number: 6151434

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees