JP2018511237A

JP2018511237A - コンテンツ適応型ｂピクチャパターンビデオエンコーディング

Info

Publication number: JP2018511237A
Application number: JP2017546602A
Authority: JP
Inventors: マンモーカーレド; エム．エイ．アメールイハブ; オー．ボブロブニクオレクサンドル; エス．ザハルチェンコブラディスラフ
Original assignee: ATI Technologies ULC; Advanced Micro Devices Inc
Current assignee: ATI Technologies ULC; Advanced Micro Devices Inc
Priority date: 2015-03-04
Filing date: 2016-02-26
Publication date: 2018-04-19
Also published as: WO2016140883A1; CN107431807A; KR20170126934A; EP3266203A4; EP3266203A1; US20160261869A1

Abstract

コンテンツ適応型のビデオエンコーディングの方法が開示される。エンコーディング方法は、エンコーディングを最適化するように自動的に調整され、エンコーディングされるピクチャのコンテンツに応じて調整される。方法を実行するシステム、及び、方法の命令を記憶したコンピュータ可読記憶媒体も開示される。【選択図】図３Ａ

Description

（関連出願の相互参照）
本願は、２０１５年３月４日に出願された米国仮特許出願第１４／６３８，５０３号の利益を主張し、その内容が参考として本明細書に組み込まれる。

本発明は、概してビデオに関し、特にデジタルビデオ処理に関する。

ビデオエンコーダは、空間的及び時間的な冗長性を低減することによって、ビデオピクチャ又はフレームのシーケンスを圧縮する。これは、空間的及び／又は時間的な領域で予測処理を実行することによって行われる。予測処理がカレントピクチャの情報のみを使用する場合には、イントラ予測と呼ばれ、符号化（エンコーディング）されるピクチャはＩピクチャと呼ばれる。一方、予測処理が、異なるピクチャ間の相関を使用する場合には、インター予測と呼ばれる。殆どのエンコーダは、Ｐ（predicted）予測及びＢ（bidirectional）予測という２種類のインター予測をサポートしている。主な違いは、Ｐ予測が、１つの予測ブロックのみに基づいてカレントブロックの値を予測し、Ｂ予測は、以前に符号化された２つのブロックに基づいてカレントブロックの補間ベースの予測を可能にすることである。

マクロブロック（ＭＢ）は、１６×１６ピクセルのブロックである。Ｉピクチャ内の全てのマクロブロックはイントラ予測されるが、Ｐピクチャ内のＭＢは、Ｐインター又はイントラ予測の何れか（より効率的な何れか）であり得る。最後に、ＢピクチャのＭＢは、Ｂインター、Ｐインター又はイントラ予測の何れかにすることができる。

ビデオ圧縮では、ピクチャグループ（ＧＯＰ）は、イントラピクチャ及びインターピクチャが配置される順序を指定する。ＧＯＰは、符号化されたビデオストリーム内で連続するピクチャのグループである。符号化されたビデオストリームの各々は、連続するＧＯＰで構成されている。

ピクチャは、予測構造（prediction structure）に基づいて符号化される。予測構造は、ＧＯＰ内の所定のピクチャを符号化するためにＧＯＰ内の何れのピクチャが使用されるか、及び、Ｉ、Ｐ又はＢの各予測タイプを記述する。既存の符号化方法は、ピクチャコンテンツの性質を考慮することなく、既定の予測構造を使用する。これは、最適ではない符号化に繋がることがある。

コンテンツ適応型のビデオエンコーディングの方法が開示される。すなわち、エンコーディングの方法は、エンコーディングを最適化するために、エンコーディング処理の１つ以上の態様を自動的に調整する。この調整は、エンコーディングされるピクチャのコンテンツに依存する。一実施形態では、調整される態様は、ピクチャグループのサイズ及び予測構造であってもよい。方法を実行するためのシステム、及び、当該方法の命令を記憶するための非一時的（non-transitory）なコンピュータ可読記憶媒体も開示される。

添付図面と併せて例として与えられる以下の説明から、より詳細な理解を得ることができる。

ピクチャグループの分解例を示す図である。予測構造の２つの例を示す図である。ビデオエンコーディング方法の一例を示す図である。ビデオエンコーディング方法の一例を示す図である。１つ以上の開示された実施形態を実装することができる例示的なデバイス又はシステムのブロック図である。

コンテンツ適応型ビデオエンコーディングの方法及びシステムを、ここで詳細に説明する。この方法は、ピクチャグループ（ＧＯＰ）及び予測構造を選択して、動画像を構成するピクチャ又はフレームのエンコーディングを最適化することを含む。エンコーディングを最適化するために使用される最適化メトリックは、レート歪み（ＲＤ）コストである。これらの用語は以下で説明される。

レート歪みコストは、ピクチャ又はピクチャグループをエンコーディングするために必要なビットレート又はビット数と、エンコーディングによって導入される画像歪みとの組み合わせを指す。一般に、ピクチャをエンコーディングするために使用されるビットの数を減らすことは、より多くの歪みをもたらす傾向があり、エンコーディングされたピクチャ内の情報がより少なくなる。したがって、レート及び歪みの組み合わせは、エンコーディング最適化の合理的なメトリックに関して必要となる。歪みを決定する方法は、本明細書において後述する。

図１は、限定的に考えらえるものではないが、ＧＯＰ及びＧＯＰ分解の例を示す図である。ビデオシーケンス内で連続する１２のピクチャが示されている。連続する１２のピクチャは、２つの別個のＧＯＰ分解１１０，１２０に分解されて示される。分解１１０において、１２のピクチャは、２つのピクチャ、３つのピクチャ、３つのピクチャ、及び、４つのピクチャの各々のサイズを有する４つのＧＯＰ１１５ａ〜１１５ｄに分解されて示される。分解１２０において、同じ１２のピクチャは、４つのピクチャ、３つのピクチャ、及び、５つのピクチャの各々のサイズを有する３つのＧＯＰ１２５ａ〜１２５ｃに分解されている。ＧＯＰの数、及び、各ＧＯＰ内のピクチャの数は固定されていない。

図２は、限定的に考えられるものではないが、９つのピクチャを含む例示的なＧＯＰに適用されている、２つの異なる予測構造２０５Ａ，２０５Ｂの例を示す図である。２０５Ａでは、最初のピクチャのみがＩピクチャとしてエンコーディングされ、他の全てのピクチャがＰピクチャとしてエンコーディングされており、各ピクチャは１つ前のピクチャを参照する。予測構造２０５Ａは、例えばエンコーディングされているピクチャが急速に動くオブジェクトを含む場合、ほぼ最適なエンコーディングを提供することができるが、ピクチャがゆっくり動くオブジェクトを含む場合には、準最適符号化（suboptimal encoding）を提供することができる。

一方、ピクチャが、例えば、ゆっくり動くオブジェクトを含むことにより、高い時間的相関性を示す場合には、予測構造２０５Ｂは、２０５Ａよりも最適により近いエンコーディングを提供することができる。予測構造２０５Ｂは、Ｂフレームを使用しており、階層Ｂ構造（ＨＢＳ）と呼ばれる。したがって、ＲＤコストによって測定される、最適なエンコーディングをもたらす予測構造は、エンコーディングされるピクチャの内容に依存する。

したがって、その予測構造をピクチャのコンテンツに適応させるエンコーディング方法は、固定された予測構造を有するエンコーディング方法よりも優れたエンコーディング最適化を提供することができる。また、ＨＢＳを使用するコンテンツ適応型ビデオエンコーディング方法は、より良いエンコーディングを提供することができる。

図３Ａ及び図３Ｂは、コンテンツ適応型ビデオエンコーディング方法３００の実施形態を示す図である。図３Ａは、方法３００の概要を示す図であり、図３Ｂは、図３Ａの３１５においてＧＯＰ分解のＲＤコストを決定する方法についての実施形態の詳細を示す図である。全体的な方法は、以下のように説明することができる。所定数の連続するピクチャのＧＯＰ分解のセットが選択される。セット内のＧＯＰ分解ごとに、そのＧＯＰ分解におけるＧＯＰごとのＧＯＰＲＤコストを決定することによって、ＧＯＰ分解ＲＤコストが決定される。連続するピクチャのエンコーディングに使用するために、最小のＧＯＰ分解ＲＤコストを有するセットからＧＯＰ分解が選択される。

図３Ａを参照すると、方法３００は、所定数の連続するピクチャについての全ての可能なＧＯＰ合成からＧＯＰ分解のセットを選択することによって、初期化される（３０５）。セットは、例えば、うまく動作することが既に分かっている少数のＧＯＰ分解を選択することによって選択されてもよい。或いは、定義されたサイズ範囲内のＧＯＰ分解のみが選択されてもよい。別の代替案では、ＧＯＰサイズの選択をガイドするために、既知のシーン変更（scene change）アルゴリズムを使用してもよい。

さらに、方法３００は、記憶されたＧＯＰ分解ＲＤコストの初期値と、記憶されたＧＯＰＲＤコストの初期値とを記憶することによって、初期化される（３０５）。また、方法３００は、量ＴＯＴＡＬをゼロに設定することによって初期化される（３０５）。量ＴＯＴＡＬは、ＧＯＰＲＤコストを合計してＧＯＰ分解ＲＤコストを得るために使用される。

さらに、方法３００は、ＧＯＰの可能な予測構造から予測構造のセットを定義することによって、初期化される（３０５）。予測構造のセットは、少なくとも１つの階層Ｂ構造を含んでもよい。予測構造のセットを定義することは、以前に復号されたピクチャを記憶するのに使用される復号ピクチャバッファ（ＤＦＢ）の制約を満たす予測構造を選択することを含んでもよい。デコーダは、メモリ及び処理能力の点で制約を受ける可能性があるので、ＤＦＢのサイズに限界がある可能性がある。或いは、既知のシーン変更アルゴリズムを用いて、予測構造のセットに対して予測構造の選択をガイドしてもよい。

初期化に続いて、ＧＯＰ分解のセットからＧＯＰ分解が選択される（３１０）。選択されたＧＯＰ分解についてＧＯＰ分解ＲＤコストが決定される（３１５）。このＧＯＰ分解ＲＤコストは、記憶されたＧＯＰ分解ＲＤコストと比較される（３２０）。ＧＯＰ分解ＲＤコストが記憶された値以上である場合、方法は３１０に戻り、新たなＧＯＰ分解が選択される。一方、ＧＯＰ分解ＲＤコストが記憶された値未満である場合、この新たなＧＯＰ分解ＲＤコストが記憶されて（３２５）、現在の記憶された値が置き換えられる。

次に、方法は、セットに残っているＧＯＰ分解が存在するか否かをチェックする（３３０）。存在する場合、方法は３１０に戻り、セットから新たなＧＯＰ分解を選択する。存在しない場合、記憶されたＧＯＰ分解ＲＤコストが最小値であり、その最小値を有するＧＯＰ分解が、連続するピクチャをエンコーディングするために使用される（３３５）。

図３Ｂは、図３Ａの３１５においてＧＯＰ分解ＲＤコストを決定する場合の詳細を示す図である。全体として、この方法の実施形態においてＧＯＰ分解ＲＤコストを決定することは、以下のように要約されてもよい。上述したように、初期化（３０５）において予測構造のセットが定義される。ＧＯＰ分解のＧＯＰごとに、予測構造ＲＤコストがセット内の予測構造ごとに決定される。これらの決定された予測構造ＲＤコストの全てのうち最小の予測構造ＲＤコストが、ＧＯＰのＧＯＰＲＤコストとして選択される。ＧＯＰ分解ＲＤコストは、ＧＯＰ分解における全てのＧＯＰのＧＯＰＲＤコストを合計することによって決定される。

図３Ｂを参照すると、ＧＯＰ分解ＲＤコストを決定する場合の詳細は以下の通りである。現在のＧＯＰ分解におけるＧＯＰが選択される（３４５）（現在のＧＯＰ分解は、図３Ａの３１０において選択されている）。予測構造は、事前に初期化された予測構造のセットから選択される（３５０）。ＲＤコストは、選択された予測構造に対するＧＯＰ内のピクチャごとに決定される（３５５）。

一実施形態では、ピクチャごとのＲＤコストは、以下の式（１）を用いて歪み及びビットレートを決定することによって、決定されてもよい。
ＲＤコスト＝歪み＋Ｌ×ビットレート・・・（１）
ここで、Ｌは、ピクチャタイプに依存するパラメータであって、量子化パラメータ等の符号化パラメータである。歪みは、現在のＧＯＰ及び現在のカレント予測構造に対して動き推定処理を適用することによって決定されてもよい。適用される動き推定処理は、基準ピクチャと呼ばれる、以前にエンコーディングされたピクチャのセットを使用することによって、ＧＯＰ内の各ピクチャのコンテンツを予測することを可能にする。この予測処理は、通常、元のピクチャに近いがそれとは異なる予測ピクチャを生成する。予測ピクチャと元のピクチャとの間の差は、予測誤差又は予測歪みと呼ばれる。通常、予測歪みが高いほど、元のピクチャを表すためにエンコーディングする必要のある情報の量が多くなる。歪みは、絶対差の和（ＳＡＤ：sum of absolute differences）、絶対変換差の和（ＳＡＴＤ：sum of absolute transformed differences）又は絶対平均差（ＭＡＤ：mean absolute difference）等のように本発明の技術分野で知られている測定基準を使用することによって測定されてもよい。また、ビットレートは、既知の方法を用いて決定してもよい。ＧＯＰ内のピクチャごとのＲＤコストの決定は、二次レート歪みモデル等のレート歪みモデルを使用して、歪みからビットレートを推定することを含んでもよい。ＲＤコストを決定することは、再構成されたピクチャではなく元の入力ピクチャ、又は、ダウンサンプリングされたバージョンのビデオに適用されてもよい。

図３Ｂに戻ると、ＧＯＰ内の全てのピクチャのＲＤコストを合計して、ＧＯＰＲＤコストを決定する（３６０）。このＧＯＰＲＤコストは、記憶されたＧＯＰＲＤコストと比較される（３６５）（記憶されたＧＯＰＲＤコストは、図３Ａの３０５において初期化される）。ＧＯＰＲＤコストが、記憶されたＧＯＰＲＤコスト以上である場合には、方法は３５０に戻って、新たな予測構造が選択される。一方、ＧＯＰＲＤコストが、記憶されたＧＯＰＲＤコスト未満である場合には、この新たなＧＯＰＲＤコストが記憶され、現在の記憶された値が置き換えられる（３７０）。

次に、方法は、残りの予測構造が存在するか否かをチェックする（３７５）。存在する場合には、方法は３５０に戻り、新たな予測構造を選択する。存在しない場合には、記憶されたＧＯＰＲＤコストは、予測構造を通じて最小のＲＤコストを含む。次に、記憶されたＧＯＰＲＤコストは、量ＴＯＴＡＬに加算される（３８０）。

次いで、方法は、現在のＧＯＰ分解に残りのＧＯＰが存在するか否かを判定する（３８５）。存在する場合には、方法は３４５に戻り、新たなＧＯＰが選択される。残りのＧＯＰが存在しない場合には、ＴＯＴＡＬの合計がＧＯＰ分解ＲＤコストとなる。このＧＯＰ分解ＲＤコストは、図３Ａの３２０に渡され、図３Ａに示される方法が続く。

計算の複雑さを低減するために、ピクチャごと又はＧＯＰごとの最大ＲＤコストに基づく早期終了戦略（early termination strategy）が本方法の一実施形態において実行されてもよい。

今説明した方法は、以下の疑似コードによって説明することができる。
GOP decomposition and initialize its RD cost to a big value
RD_Optimal_Decomposition=MAX_RD_COST(for initialization)
Optimal_Decomposition=one GOP IPPPPP(for initialization)
// Find the decomposition into a set of GOPs, which leads to the minimal RD cost
For any possible decomposition D of the next
MAX_NUM_LOOKAHEAD_PICTURES pictures into a set of GOPs(i.e., (GOP_i))
// Compute the RD cost of decomposition D by accumulating the RD cost of its GOPs
RD_D=0
For every GOP_i
// Find the prediction structure for GOP_i, which leads to the minimal RD cost
Optimal_Prediction_Strcture=IPPPPP GOP structure(for initialization)
RD_Optimal_Prediction_Structure=MAX_RD_COST
For every prediction structure PS of GOP_i meeting the DBP constraints
RD_PS=RD cost of PS
If(RD_PS<RD_Optimal_Prediction_Structure)
Optimal_Prediction_Structure=PS
RD_Optimal_Prediction_Structure=RD_PS
End
End
RD_D=RD_D+RD_Optimal_Prediction_Structure
End
// Select D as optimal decomposition if its RD cost is lower than the best RD cost so far
If(RD_D<RD_Optimal_Deptimal_Decomposition=D
End
End

図４は、１つ以上の開示された実施形態を実装することができる例示的なデバイス又はシステム４００のブロック図である。システム４００は、例えば、コンピュータ、ゲーム装置、ハンドヘルド装置、セットトップボックス、テレビ、携帯電話又はタブレットコンピュータを含んでもよい。システム４００は、プロセッサ４０２と、メモリ４０４と、記憶装置４０６と、１つ以上の入力装置４０８と、１つ以上の出力装置４１０と、を含む。システム４００は、オプションとして、入力ドライバ４１２及び出力ドライバ４１４を含んでもよい。システム４００は、図４に示されていない追加の構成要素を含んでもよいことを理解されたい。

プロセッサ４０２は、中央処理装置（ＣＰＵ）、グラフィックプロセシングユニット（ＧＰＵ）、同一ダイ上に配置されたＣＰＵ及びＧＰＵ、又は、１つ以上のプロセッサコアを含んでもよく、各プロセッサコアは、ＣＰＵ又はＧＰＵであってもよい。メモリ４０４は、プロセッサ４０２と同一ダイ上に配置されてもよいし、プロセッサ４０２とは別個に配置されてもよい。メモリ４０４は、揮発性又は不揮発性メモリ（例えば、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックＲＡＭ又はキャッシュ）を含んでもよい。メモリ４０４は、以前に復号されたピクチャを記憶するように構成された復号ピクチャバッファ（ＤＦＢ）を含んでもよい。これらの記憶されたピクチャは、後続のピクチャの予測子（predictors）を形成するために、エンコーディング用のプロセッサ４０２によって使用されてもよい。

記憶装置４０６は、例えばハードディスクドライブ、ソリッドステートドライブ、光ディスク又はフラッシュドライブ等の固定又は着脱可能な記憶装置を含んでもよい。入力装置４０８は、キーボード、キーパッド、タッチスクリーン、タッチパッド、検出器、マイクロフォン、加速度計、ジャイロスコープ、生体スキャナ又はネットワーク接続（例えば、無線ＩＥＥＥ８０２信号の送信及び／若しくは受信のための無線ローカルエリアネットワークカード）を含んでもよい。また、入力装置は、ビデオカメラ等（これに限定されない）のビデオ情報のソース、又は、ブルーレイ（登録商標）プレイヤ等（これに限定されない）のビデオ再生装置を含んでもよい。出力装置４１０は、ディスプレイ、スピーカ、プリンタ、触覚フィードバックデバイス、１つ以上のライト、アンテナ、ネットワーク接続（例えば、無線ＩＥＥＥ８０２信号の送信及び／若しくは受信のための無線ローカルエリアネットワークカード）、又は、ビデオディスプレイを含んでもよい。

入力ドライバ４１２は、プロセッサ４０２及び入力装置４０８と通信し、プロセッサ４０２が入力装置４０８から入力を受信することを可能にする。出力ドライバ４１４は、プロセッサ４０２及び出力装置４１０と通信し、プロセッサ４０２が出力装置４１０に出力を送信することを可能にする。入力ドライバ４１２及び出力ドライバ４１４は、オプションとしての構成要素であって、入力ドライバ４１２及び出力ドライバ４１４が存在しない場合、システム４００は同じ方法で動作することに留意されたい。

システム４００は、上述したコンテンツ適応型ビデオエンコーディングの方法を以下のように実行するように構成されてもよい。プロセッサ４０２は、この方法を実行するように構成されてもよい。入力装置４０８は、連続するピクチャ等のビデオ情報をプロセッサ４０２に供給するように構成されてもよい。メモリ４０４は、プロセッサ４０２とビデオ情報を交換し、ビデオ情報を記憶するように構成されてもよい。

プロセッサ４０２は、入力装置４０８によって供給された所定数の連続するピクチャを取得してもよい。プロセッサ４０２は、メモリ４０４から連続するピクチャのＧＯＰ分解のセットを取り出してもよい。次に、プロセッサ４０２は、セット内のＧＯＰ分解ごとに、ＲＤコストをＧＯＰ分解内のＧＯＰごとに決定することによって、ＲＤコストを決定する処理を進めてもよい。プロセッサ４０２は、連続するピクチャをエンコーディングするときに使用するために、ＧＯＰ分解のセットから最小のＲＤコストを有するＧＯＰ分解を選択してもよい。プロセッサ４０２は、本明細書で説明するコンテンツ適応型ビデオエンコーディング方法の各実施形態の全てのステップを実行するように構成されてもよい。

本明細書の開示に基づいて多くの変形が可能であることを理解されたい。特徴及び要素は、特定の組み合わせで上記のように説明されているが、各特徴又は要素は、他の特徴及び要素なしに単独で、他の特徴及び要素との組み合わせで、又は、他の特徴及び要素なしの様々な組み合せで使用されてもよい。

提供される方法は、汎用コンピュータ、プロセッサ又はプロセッサコアで実行されてもよい。適切なプロセッサには、例として、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、複数のマイクロプロセッサ、ＤＳＰコアに関連する１つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）回路、他のタイプの集積回路（ＩＣ）、及び／又は、状態機械が含まれる。かかるプロセッサは、処理されたハードウェア記述言語（ＨＤＬ）命令の結果と、ネットリスト（コンピュータ可読媒体に記憶可能な命令）を含む中間データと、を使用して製造プロセスを構成することによって、製造されてもよい。かかるプロセスの結果は、本発明の態様を実行するプロセッサを製造するために、半導体製造プロセスで使用されるマスクワークであってもよい。

本明細書で提供される方法又はフローチャートは、汎用コンピュータ又はプロセッサによる実行のためにコンピュータ可読記憶媒体に組み込まれたコンピュータプログラム、ソフトウェア又はファームウェアで実行されてもよい。コンピュータ可読記憶媒体の例には、リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、レジスタ、キャッシュメモリ、半導体メモリ装置、例えば内蔵ハードディスク及びリムーバブルディスク等の磁気媒体、光磁気媒体、例えばＣＤ−ＲＯＭディスク及びデジタル多用途ディスク（ＤＶＤ）等の光学媒体が含まれる。

Claims

コンテンツ適応型のビデオエンコーディングの方法であって、
連続するピクチャのセットを選択することと、
前記連続するピクチャのセットを１つ以上のピクチャグループ（ＧＯＰ）に分解して、前記連続するピクチャのセットの第１のＧＯＰ分解を形成することと、
前記分解することを繰り返して、前記連続するピクチャのセットの複数の別個のＧＯＰ分解を形成することであって、前記複数の別個のＧＯＰ分解は前記第１のＧＯＰ分解を含む、ことと、
前記複数の別個のＧＯＰ分解のＧＯＰ分解ごとに、ＧＯＰレート歪み（ＲＤ）コストをＧＯＰ分解内のＧＯＰごとに決定することによって、ＧＯＰ分解ＲＤコストを決定することと、
前記連続するピクチャのセット内の前記連続するピクチャをエンコーディングするときに使用するために、最小のＧＯＰ分解ＲＤコストを有するＧＯＰ分解を前記複数の別個のＧＯＰ分解から選択することと、を含む、
方法。
前記ＧＯＰ分解ごとにＧＯＰ分解ＲＤコストを決定することは、各ＧＯＰ分解内の全てのＧＯＰのＧＯＰＲＤコストを合計することを含む、請求項１の方法。
前記ＧＯＰＲＤコストを決定することは、各ＧＯＰ分解のＧＯＰごとに、
予測構造のセットを定義することと、
前記セット内の予測構造ごとに予測構造ＲＤコストを決定することと、
前記予測構造ＲＤコストの最小値を前記ＧＯＰのＲＤコストとして選択することと、を含む、
請求項１の方法。
前記予測構造のセットは、少なくとも１つの階層Ｂ構造を含む、請求項３の方法。
前記予測構造のセットを定義することは、復号ピクチャバッファの制約を満たす予測構造を選択することを含む、請求項３の方法。
前記ＧＯＰごとにＲＤコストを決定することは、予測構造ごとに、各ＧＯＰ内の各ピクチャのＲＤコストを合計することを含む、請求項３の方法。
前記各ピクチャのＲＤコストは、以下の式
ＲＤコスト＝歪み＋Ｌ×ビットレート
から決定され、Ｌは、ピクチャタイプに依存するパラメータであって、符号化パラメータである、請求項６の方法。
前記歪みは、現在のＧＯＰ及び現在の予測構造に対する動き推定処理を適用することによって決定される、請求項３の方法。
前記歪みは、絶対差の和（ＳＡＤ）、絶対変換差の和（ＳＡＴＤ）又は絶対平均差（ＭＡＤ）のうち少なくとも１つを使用して決定される、請求項８の方法。
前記ＲＤコストを決定することは、レート歪みモデルを使用して、歪みからビットレートを推定することを含む、請求項１の方法。
元の入力ピクチャ、又は、ダウンサンプリングされたバージョンのビデオに適用される、請求項１の方法。
コンテンツ適応型のビデオコーディングのシステムであって、
プロセッサと、
前記プロセッサにビデオ情報を供給するように構成された入力装置と、
前記プロセッサとビデオ情報を交換するように構成されたメモリ装置と、を備え、
前記プロセッサは、コンテンツ適応型のビデオコーディングの方法を実行するように構成されており、前記方法は、
前記入力装置によって供給される、連続するピクチャのセットを選択することと、
前記連続するピクチャのセットを１つ以上のピクチャグループ（ＧＯＰ）に分解して、前記連続するピクチャのセットの第１のＧＯＰ分解を形成することであって、前記第１のＧＯＰ分解に対する命令は前記メモリ装置から取り出される、ことと、
前記分解することを繰り返して、前記連続するピクチャのセットの複数の別個のＧＯＰ分解を形成することであって、前記複数の別個のＧＯＰ分解は前記第１のＧＯＰ分解を含み、前記複数の別個のＧＯＰ分解内のＧＯＰ分解ごとの命令は前記メモリ装置から取り出される、ことと、
前記複数の別個のＧＯＰ分解のＧＯＰ分解ごとに、レート歪み（ＲＤ）コストをＧＯＰ分解内のＧＯＰごとに決定することによって、ＲＤコストを決定することと、
前記連続するピクチャのセット内の前記連続するピクチャをエンコーディングするときに使用するために、最小のＲＤコストを有するＧＯＰ分解を前記複数の別個のＧＯＰ分解から選択することと、を含む、
システム。
前記プロセッサは、
前記メモリ装置から予測構造のセットを取り出すことと、
前記セット内の予測構造ごとに予測構造ＲＤコストを決定することと、
前記予測構造ＲＤコストの最小値を前記ＧＯＰのＲＤコストとして選択することと、
をさらに含む前記方法によって、各ＧＯＰ分解内のＧＯＰごとにＲＤコストを決定するように構成されている、請求項１２のシステム。
前記プロセッサは、予測構造ごとに、各ＧＯＰ内の各ピクチャのＲＤコストを合計することを含む前記方法によって、前記ＧＯＰごとにＲＤコストを決定するように構成されている、請求項１３のシステム。
前記プロセッサは、以下の式
ＲＤコスト＝歪み＋Ｌ×ビットレート
を使用することを含む前記方法によって、前記各ピクチャのＲＤコストを決定するように構成されており、Ｌは、ピクチャタイプに依存するパラメータであって、符号化パラメータである、請求項１４のシステム。
前記プロセッサは、現在のＧＯＰ及び現在の予測構造に対する動き推定処理を適用することを含む前記方法によって、歪みを決定するように構成されている、請求項１３のシステム。
前記プロセッサは、絶対差の和（ＳＡＤ）、絶対変換差の和（ＳＡＴＤ）又は絶対平均差（ＭＡＤ）のうち少なくとも１つを使用して歪みを決定するように構成されている、請求項１６のシステム。
前記プロセッサは、レート歪みモデルを使用して歪みからビットレートを推定することを含む前記方法によって、前記ＲＤコストを決定するように構成されている、請求項１２のシステム。
前記プロセッサは、元の入力ピクチャ、又は、ダウンサンプリングされたバージョンのビデオに前記方法を適用するように構成されている、請求項１２のシステム。
処理システムにおいて実行されると、コンテンツ適応型のビデオエンコーディングの方法を前記処理システムに実行させる命令を含むコンピュータ可読記憶媒体であって、
前記方法は、
連続するピクチャのセットを選択することと、
前記連続するピクチャのセットを１つ以上のピクチャグループ（ＧＯＰ）に分解して、前記連続するピクチャのセットの第１のＧＯＰ分解を形成することと、
前記分解することを繰り返して、前記連続するピクチャのセットの複数の別個のＧＯＰ分解を形成することであって、前記複数の別個のＧＯＰ分解は前記第１のＧＯＰ分解を含む、ことと、
前記複数の別個のＧＯＰ分解のＧＯＰ分解ごとに、ＧＯＰレート歪み（ＲＤ）コストをＧＯＰ分解内のＧＯＰごとに決定することによって、ＧＯＰ分解ＲＤコストを決定することと、
前記連続するピクチャのセット内の前記連続するピクチャをエンコーディングするときに使用するために、最小のＧＯＰ分解ＲＤコストを有するＧＯＰ分解を前記複数の別個のＧＯＰ分解から選択することと、を含む、
コンピュータ可読記憶媒体。