JP2006518158A

JP2006518158A - 知覚モデルに基づく映像圧縮の方法及び装置

Info

Publication number: JP2006518158A
Application number: JP2006503586A
Authority: JP
Inventors: モロゾヴ，アンドレイ; アスニス，イルヤ
Original assignee: エックスヴイディーコーポレイション
Priority date: 2003-02-14
Filing date: 2004-02-13
Publication date: 2006-08-03
Also published as: WO2004075532A2; WO2004075532A3; EP1602232A2; US20040161034A1

Abstract

知覚モデルに基づく映像圧縮の方法及び装置は、前フレームの実際のビットレートの後に安定化遅延を伴って続くビットレート値を計算する。現在の量子化係数は計算されたビットレート及び知覚モデルを用いて決定される。現在の量子化係数の変化率は前の量子化係数に基づいて制限される。現在の量子化係数が計算され、制限された後、現在フレームは制限された現在の量子化係数で符号化される。

Description

発明の分野

[0001]本発明は映像圧縮の分野に関する。より詳細には、本発明は知覚モデルに基づく静止画像及び／又は映像データ圧縮に関する。

発明の背景

[0002]デジタル映像は大量の情報を非圧縮フォーマットで収容する。この大量の情報の操作及び／又は蓄積は時間と資源の両方を消費する。これに対して、情報の量が多くなるほど、より優れた視覚的な品質が得られる。圧縮技術の目標は、典型的に、視覚的な品質の維持と、映像を表示するため必要な情報の量の削減との間で最適バランスを見つけることである。

[0003]映像を表示するために必要な情報の量を削減するため、圧縮技術は人間の視覚系を巧みに利用する。人間の視覚によって知覚され得ない情報は典型的に除去される。その上、情報は映像シーケンス内の複数のフレームに亘って繰り返されることがよくある。情報の量を削減するため、冗長な情報は同様に映像シーケンスから除去される。映像圧縮技術は、ＩＳＯ／ＩＥＣ１３８１８−２、“Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ−ｇｅｎｅｒｉｃｃｏｄｉｎｇｏｆｍｏｖｉｎｇｐｉｃｔｕｒｅａｎｄａｓｓｏｃｉａｔｅｄａｕｄｉｏｉｎｆｏｒｍａｔｉｏｎ：Ｖｉｄｅｏ，１９９６”に記載された動画像専門家グループ−２（ＭＰＥＧ−２）規格に詳細に記載されている。

[0004]典型的には、ＭＰＥＧ−２エンコーダは、映像ストリームの平均レートが始めから終わりまで殆ど同一である固定ビットレート（ＣＢＲ）モードで機能するように開発された。映像ストリームは、ＭＰＥＧ−２規格によって定義されるように、Ｉピクチャタイプ、Ｂピクチャタイプ及びＰピクチャタイプのような種々のタイプからなる複数のピクチャ又はフレームを含む。ピクチャは、そのタイプに応じて、映像ストリームの設定された目標レートよりも増減するビットを消費する。ＣＢＲレート制御戦略は、所望の平均ビットレートが充たされ、高品質の映像シーケンスが表示されるように、ストリームの種々のピクチャタイプの間でビットレートを維持する責任がある。

[0005]他のＭＰＥＧ−２エンコーダを含むその他のエンコーダは、可変ビットレート（ＶＢＲ）モードで機能する。可変ビットレート符号化は、圧縮されたピクチャのそれぞれが、ピクチャ内及びピクチャ間の特性の複雑度に基づいて異なる量のビットを有することを可能にさせる。例えば、単純なピクチャ内容を含むシーンの符号化は、複雑なピクチャ内容を含むシーンよりも、同程度に知覚されるピクチャ品質を実現するために、著しく少ないビットを消費する。

[0006]従来のＶＢＲ符号化は、符号化プロセスを効果的に高めるため、映像を特徴化するのに必要な情報の量と情報を解釈するのに必要なアルゴリズムの複雑度の理由から、２つ以上のパスを使用して非リアルタイムで達成される。第１のパスにおいて、符号化が実行され、統計値が収集され解析される。第２のパスにおいて、解析の結果が符号化プロセスを制御するため使用される。これは高品質圧縮映像ストリームを生成するが、リアルタイム動作が可能でなく、単一パス符号化も可能としない。

発明の概要

[0007]知覚モデルに基づく映像圧縮の方法及び装置が記載される。本発明の一態様によれば、前フレームの実際のビットレートの後に安定化遅延を伴って続くビットレート値が計算される。現在の量子化係数は計算されたビットレート及び知覚モデルを用いて決定される。現在の量子化係数の変化率は前の量子化係数に基づいて制限される。現在の量子化係数が計算され、制限された後、現在フレームは制限された現在の量子化係数で符号化される。

[0008]本発明の上記及びその他の態様は、詳細な説明及び添付図面を参照してよりよく説明される。

[0009]本発明は、本発明の実施形態を明らかにするため使用される以下の説明及び添付図面を参照することによって最もよく理解される。

発明の詳細説明

[0022]以下の説明中、多数の具体的な細部は本発明の完全な理解を与えるため示される。しかし、本発明はこれらの具体的な細部を用いることなく実施できることを理解されたい。他の例では、周知の回路、構造、規格及び技術は、本発明を曖昧にすることがないように詳細には示されない。

［概略］
[0023]知覚モデルに基づく映像圧縮の方法及び装置について説明される。本発明の種々の実施形態によれば、圧縮（符号化とも称される）のため使用される符号化複雑度制御スカラー（例えば、量子化係数）は、知覚モデルに基づいて決定される。前に符号化されたフレームに基づく１個以上のパラメータのセットは、現在フレームを符号化する符号化複雑度制御スカラーを決定するため使用される知覚モデルを定義する。

[0024]本発明の一実施形態によれば、符号化複雑度制御スカラーを決定するため使用される知覚モデルは、安定化された前の符号化に基づくビットレートを含むパラメータのセットによって定義される。安定化された前の符号化に基づくビットレートは、変化フレームビットレートを補正することにより安定化された、過去の不変フレームビットレートの時間加重平均から計算される。知覚モデルに基づく符号化を用いて圧縮された映像シーケンスは、典型的に映像シーケンスの視覚的な品質に顕著な変化を生じさせるフレーム間の差にもかかわらず、不変性の視覚的な品質を有するものとして、人間の視覚によって知覚される。現在フレームを符号化する符号化複雑度制御スカラーを生成するために前の符号化からの情報を使用することは、リアルタイムの単一パスのＶＢＲ符号化を可能にさせる。

[0025]本発明の別の実施形態によれば、符号化複雑度制御スカラーを決定するため使用される知覚モデルは、シーケンスビット割当量内の残りの利用可能な符号化ビットから計算された知覚モデル定義用符号化複雑度制御スカラーと、知覚モデル修正パラメータと、によって定義される。現在及び／又は未来のビット利用率をある範囲内に保つために過去のビット利用率を考慮して知覚モデルを再定義又は調整することにより、滑らかなビット利用率と知覚的な完全性が得られる。

[0026]本発明の別の実施形態では、知覚モデルは、安定化され時間加重された前の符号化に基づくビットレートと、知覚モデル定義用符号化複雑度制御スカラーとに応じて、定義又は調整される。知覚モデル定義用符号化複雑度制御スカラーは、知覚的な完全性を維持する一様なビット利用率を与えるために、ビット利用率に応じて知覚モデルをシフトする。シフトする知覚モデルから決定された符号化複雑度制御スカラーと、安定化され時間加重された前の符号化に基づくビットレートは、不変性の視覚的な品質をもつものとして知覚される映像シーケンスの現在フレームを符号化する符号化複雑度制御スカラーを与える。

［前のビットレートに基づく符号化複雑度制御スカラーの生成］
[0027]上述のように、映像シーケンス内のフレームを符号化するため使用される符号化複雑度制御スカラーは知覚モデルに基づいて決定される。知覚モデルは、座標がビットレートと符号化複雑度制御スカラーとによって定められたグラフに描くことができる。ビットレートは前の符号化ビットレートに基づいて計算される。前の符号化に基づくビットレートが計算された後、知覚モデルに応じて計算された前の符号化に基づくビットレートに対応する符号化複雑度制御スカラーが決定される。

[0028]図１は本発明の一実施形態による知覚モデルを説明するグラフである。図１において、ｘ軸はビットレート（Ｒ）によって定められ、ｙ軸は符号化複雑度制御スカラー（Ｑ）によって定められる。グラフは、ソフトフレームテーラード（ｔａｉｌｏｒｅｄ）知覚モデル、ノンテーラード（ｎｏｎ−ｔａｉｌｏｒｅｄ）知覚モデル、及びハードフレームテーラード知覚モデルを含む。本発明の一実施形態によれば、知覚モデルのそれぞれは、次式：
Ｑ_ＣＡＬＣ＝Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される。知覚モデルを定義する式は次の形：
Ｑ_ＣＡＬＣ＝（Ｑ_ＰＭ／Ｒ_ＰＭ ^Ｐ）＊Ｒ_ＣＡＬＣ ^Ｐ
で表現することも可能である。知覚モデルパラメータＱ_ＣＡＬＣは、ｙ軸に沿って位置する計算された符号化複雑度制御スカラーである。知覚モデルパラメータＱ_ＰＭは、一実施形態において予め定義され、本発明の別の実施形態では映像シーケンスの符号化中に動的に調整される知覚モデル定義用符号化複雑度制御スカラーである。知覚モデルパラメータＲ_ＣＡＬＣは、前のビットレートから計算されたビットレートである。知覚モデルパラメータＲ_ＰＭは予め定義された知覚モデル定義用ビットレートである。本発明の別の実施形態では、知覚モデルパラメータＲ_ＰＭは、映像シーケンスが符号化されるときに動的に修正される。知覚モデルパラメータＰは、知覚モデルの曲線を定義する予め定められた値である。例えば、Ｐが１．０であるならば、知覚モデルはノンテーラード知覚モデルである。Ｐが１．０よりも大きい（例えば、２．０である）ならば、知覚モデルはソフトフレームテーラード知覚モデルである。Ｐが１．０未満である（例えば、０．５である）ならば、知覚モデルはハードフレームテーラード知覚モデルである。

[0029]本発明の別の実施形態によれば、知覚モデルパラメータＱ_ＰＭ及びＲ_ＰＭは、次式：
Ｑ_ＣＡＬＣ＝（ＰＭ^Ｐ）＊Ｒ_ＣＡＬＣ ^Ｐ（ここで、ＰＭは単一知覚モデル定義用パラメータである）
のように、単一知覚モデル定義用パラメータによって表現される。本発明の一実施形態では、単一知覚モデル定義用パラメータは静的であり、一方、本発明の別の実施形態では、単一知覚モデル定義用パラメータは動的である。

[0030]ソフトフレームは、そのソフトフレームを符号化するため必要なビット数が少ない低複雑度の映像シーケンス内のフレームである。ハードフレームは、そのハードフレームを符号化するためより多数のビットを必要とする高複雑度の映像シーケンス内のフレームである。図１に示されたグラフは、対照として固定ビットレート（ＣＢＲ）モデル及び従来の可変ビットレート（ＶＢＲ）モデルをさらに含む。

[0031]ＣＢＲモデルはｙ軸と平行に通る直線であり、同じビット数で複雑度とは無関係に様々なフレームの符号化を示す。従来のＶＢＲモデルはｘ軸と平行に通る直線であり、映像シーケンス内の様々なフレームを符号化するための同じ符号化複雑度制御スカラーの使用を示す。ノンテーラード知覚モデルは、ｙ軸とｘ軸の両方から等距離にある点により構成された直線である。ノンテーラード知覚モデルは、適当に均衡のとれた個数のハードフレームとソフトフレームとにより構成された映像シーケンスの滑らかで、かつ、不変性の知覚を与える、ビットレートと符号化複雑度制御スカラー値との組み合わせを示す。ソフトフレームテーラード知覚モデルは、最初に、ノンテーラード知覚モデルの上方で平行に通り、次に、ビットレートが増加すると共にｙ軸の方へ曲がり始める。ソフトフレームテーラード知覚モデルは、かなり多数のソフトフレームを含む映像シーケンスの滑らかで、かつ、不変性の知覚を与える、ビットレートと符号化複雑度制御スカラーとの組み合わせを示す。ハードフレームテーラード知覚モデルは、最初に、ノンテーラード知覚モデルの下方を通り、符号化複雑度制御スカラーが増加すると共にｘ軸の方へ曲がる。ハードフレームテーラード知覚モデルは、かなり多数のハードフレームを含み映像シーケンスの滑らかで、かつ、不変性の知覚を与える、ビットレートと符号化複雑度制御スカラーとの組み合わせを示す。

[0032]図２は、本発明の一実施形態によるノンテーラード知覚モデルに基づく符号化複雑度制御スカラーの決定を説明する図である。図２において、３点がビットレートを表現するｘ軸上に示される。ｘ軸上の最も左側の点（Ｒ_Ｎ−２として表される）は、フレームＮ−２のビットレートを示し、ここで、Ｎは符号化されるべき現在フレームを表し、Ｎ−２は現在フレームよりも２フレーム前の符号化されたフレームを表す。ｘ軸上の最も右側の点（Ｒ_Ｎ−１として表される）は、現在フレームの直前に符号化されたフレームであるフレームＮ−１のビットレートを示す。

[0033]図２に示された実施例では、ビットレート（Ｒ_Ｑとして表される）は、Ｒ_Ｎ−２とＲ_Ｎ−１との間でｘ軸上に位置する。点Ｒ_Ｑは、図３に説明される安定化された前の符号化に基づくビットレートである。Ｒ_Ｑを計算した後、ノンテーラード知覚モデルに従って計算されたＲ_Ｑに対応する符号化複雑度制御スカラーが決定される。本発明の一実施形態では、この対応する符号化複雑度制御スカラーは現在フレームを符号化するため与えられる。本発明の別の実施形態では、符号化複雑度制御スカラーは拘束される。例えば、決定された符号化複雑度制御スカラーは、次式：
０．５＊Ｑ_Ｎ−１＜＝Ｑ_ＣＡＬＣ＜＝２＊Ｑ_Ｎ−１（Ｑ_Ｎ−１は前フレームに対して決定されたＱ）
の通り拘束される。

[0034]図３は、本発明の一実施形態による安定化された前の符号化に基づくビットレートを決定する典型的なフローチャートである。ブロック３０１において、前フレーム（すなわち、符号化されるべき現在フレームよりも先行する既に符号化されたフレーム）のビットレート及びフレームタイプが受信される。ステップ３０５において、前フレームが変化フレーム（例えば、シーン変化フレーム）であるかどうかが決定される。前フレームが変化フレームではないならば、制御はブロック３０７へ進む。前フレームが変化フレームであるならば、制御はブロック３０９へ進む。

[0035]ブロック３０７で、不変フレームビットレート平均は受信されたビットレートで更新される。ブロック３０７から、制御はブロック３１１へ進む。不変フレームビットレート平均は、前に符号化された時間的にフィルタ処理されたフレームのビットレートを平均化することにより計算される。例えば、前の符号化された不変フレームは、符号化されるべき現在フレームに時間的に接近するほど、現在フレームに時間的にあまり接近していないフレームよりも大きい加重（例えば、それらの値の１００％）が与えられる。時間加重は、連続時間フィルタ、離散時間フィルタなどである。本発明の一実施形態によれば、時間加重された前の不変フレームビットレート平均は、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２
によって計算され、式中、Ｋ１及びＫ２は、システムが突然の映像難易度変化にどれだけ高速に反応するかを決める係数である。ＲＮ_Ｎは直前に符号化された不変フレームビットレートに等しい。

[0036]ブロック３０９において、変化フレーム補正ビットレートが受信されたビットレートで更新される。変化フレーム補正ビットレートは、映像シーケンスのある期間に亘って変化フレームのビットレートを平均化し、時間加重された前の不変フレームビットレート平均に加算されるべき補正値を決定することにより計算される。一実施形態の発明によれば、前の変化フレーム補正ビットレートは、次式：
ＲＬ_Ｎ−ＲＮＴＬ_Ｎ．ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４
によって計算され、式中、Ｒ_Ｎは前に符号化されたフレームビットレートであり、Ｋ３及びＫ４は、反応が遅い無限応答フィルタを定義する係数である。
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４
であり、式中、Ｒ_Nは前に符号化された不変フレームビットレートであり、Ｋ３及びＫ４は、反応が遅い無限応答フィルタを定義する上記の係数と同じ係数である。

[0037]ブロック３１１において、安定化された前の符号化に基づくビットレートは、前の符号化された変化フレームに基づく補正ビットレート及び前の符号化された不変フレームに基づくビットレート平均を用いて決定される。前の符号化された変化フレーム補正ビットレートの加算は、決定された値を安定化する（すなわち、安定化された前の符号化に基づくビットレートは、異なるフレームタイプの間の変動を補正するため、遅延及び安定化を含むビットレート平均に続く。）。ブロック３１３において、安定化された時間加重された前の符号化に基づくビットレートは符号化複雑度制御スカラーを計算するため準備する。

[0038]図４は、本発明の一実施形態による符号化複雑度制御スカラー発生ユニット及びエンコーダの典型的な図である。映像シーケンスのフレームは圧縮ユニット４０７によって符号化される。図４では、符号化されたフレームＮ−１４１１及び符号化されたフレームＮ−２４１３は、圧縮ユニット４０７によって符号化されている。圧縮ユニット４０７が符号化されたフレームＮ−１４１１を符号化した後、圧縮ユニット４０７は、符号化されたフレームＮ−１４１１のビットレート、及び符号化されたフレームＮ−１４１１のフレームタイプを、符号化複雑度制御スカラー発生ユニット４０５へ送信する。符号化複雑度制御スカラー発生ユニット４０５は、図３において説明されたように、安定化された時間加重された前の符号化に基づくビットレートを計算するため圧縮ユニット４０７から受信されたビットレートを使用する。符号化複雑度制御スカラー発生ユニット４０５は、次に、図２において説明されたような知覚モデルの式と、安定化された時間加重された前の符号化に基づくビットレートとを用いて、符号化複雑度制御スカラーを決定する。符号化複雑度制御スカラー発生ユニット４０５は、次に、符号化複雑度制御スカラーを圧縮ユニット４０７へ送信する。圧縮ユニット４０７は、次に、符号化されていないフレームＮ４０３を符号化するため受信された符号化複雑度制御スカラーを使用し、符号化されたフレームＮ４０９を発生する。

[0039]図５は本発明の一実施形態による符号化複雑度制御スカラー発生ユニットの典型的な図である。符号化複雑度制御スカラー発生ユニット５０１は、マルチプレクサ５１３、前の符号化された不変フレーム平均ビットレート計算モジュール５０３、及び前の符号化された変化ビットレート補正計算モジュール５０５を含む。前の符号化された不変フレーム平均ビットレート計算モジュール５０３及び前の符号化された変化ビットレート補正計算モジュール５０５は共にマルチプレクサ５１３と接続される。符号化複雑度制御スカラー発生ユニット５０１は、知覚モデルパラメータモジュール５０９及び符号化複雑度制御スカラー計算モジュール５０７をさらに含む。前の符号化された不変フレーム平均ビットレート計算モジュール５０３、前の符号化された変化ビットレート補正計算モジュール５０５、及び知覚モデルパラメータモジュール５０９は、すべてが符号化複雑度制御スカラー計算モジュール５０７と接続される。

[0040]符号化複雑度制御スカラー発生ユニット５０１は、前の符号化されたフレームのビットレート及び前の符号化されたフレームのフレームタイプを受信する。本発明の別の実施形態では、フレームタイプは受信されない。その代わりに、符号化複雑度制御スカラー（Ｑ）発生ユニット５０１は受信されたビットレートからフレームタイプを決定する。マルチプレクサ５１３はビットレートを受信し、フレームが不変フレームであるならば、そのビットレートを前の符号化された不変フレーム平均ビットレート計算モジュール５０３へ送信し、フレームが変化フレームであるならば、そのビットレートを前の符号化された変化フレームビットレート補正計算モジュール５０５へ送信する。前の符号化された不変フレーム平均ビットレート計算モジュール５０３及び前の符号化された変化フレームビットレート補正計算モジュール５０５の出力は加えられ、Ｑ計算モジュール５０７へ送信される。本発明の代替の実施形態では、前の符号化された不変フレーム平均ビットレート計算モジュール５０３及び前の符号化された変化フレームビットレート補正計算モジュール５０５の出力は修正なくＱ計算モジュール５０７へ送信される。

[0041]知覚モデルパラメータモジュール５０９は、符号化複雑度制御スカラーを計算するため使用される知覚モデルを定義するパラメータを出力する。Ｑ計算モジュール５０７は、次に、現在フレームを符号化するため安定化された前の符号化に基づくビットレートを用いて計算された符号化複雑度制御スカラーを、符号化複雑度制御スカラー発生ユニット５０１の出力として生ずる。

［滑らかなビット利用率を得るための知覚モデルのシフト］
[0042]映像シーケンスの不変性の視覚的な品質を得るための別の技術はビット利用率を制御することである。目標ビット利用率レンジは映像シーケンスの特性（例えば、映像シーケンスを符号化する総ビット数（「ビット割当量」）、映像シーケンス期間、映像シーケンスの複雑度など）に基づいて定められる。定められた目標ビット利用率レンジに基づいて、Ｑ_PMのような、少なくとも１個の知覚モデル定義用パラメータを修正するため変数が計算される。知覚モデル定義用パラメータは、目標ビット利用率レンジの範囲内で多数のビットを用いて現在フレームを符号化するため使用される符号化複雑度制御スカラーを生じる位置へ知覚モデルをシフトするため修正される。

[0043]図６は、本発明の一実施形態による映像シーケンスに亘る目標ビット利用率レンジを説明するグラフである。図６において、ｙ軸はビット（Ｂ）として定義され、ｘ軸は時間（Ｔ）に関して定義される。ｘ軸と平行に通る破線６０１は映像シーケンスに対するビット割当量を示す。ｙ軸と平行に通る破線６０３は映像シーケンス期間を示す。ｘ軸から４５度で通る斜め実線６０７は呼知恵ビットレート（ＣＢＲ）ビット利用率を示す。ＣＢＲビット利用率線６０７に従って符号化された映像シーケンスは、映像シーケンスの各フレームを同じビット数で符号化する。破線６０５及び破線６０９はそれぞれ、映像シーケンスに対する目標ビット利用率レンジの目標ビット利用率最大値及び目標ビット利用率最小値を示す。目標ビット利用率最大値線６０５はＣＢＲビット利用率線６０７の上方で平行に通る。目標ビット利用率最小値線６０９はＣＢＲビット利用率線６０７の下方で平行に通る。図６において、目標ビット利用率最大値６０５及び目標ビット利用率最小値６０９によって定められる目標ビット利用率レンジは映像シーケンスの全体に亘って一定である。図６に示された本発明の別の実施形態は、先が細くなる目標ビット利用率レンジを表す。映像シーケンスの最初の部分で、目標ビット利用率レンジは増加する。映像シーケンスの最後の部分で、目標ビット利用率レンジは減少する。映像シーケンスを符号化するビット利用率を目標ビット利用率の範囲に制限すると、符号化複雑度制御スカラーは徐々に変化し、同時に、予め決められたビットレート拘束条件を満たし、ＣＢＲビット利用から生じる視覚的な品質における知覚できる変動とは対照的に視覚的な品質を不変に保つ。

[0044]図７は、本発明の一実施形態によるビット利用率グラフと知覚モデルとの間の概念的な相互作用を説明する図である。図７には、映像シーケンスのためのビット利用率グラフ７０１が示されている。ビット利用率グラフ７０１は一定の目標ビット利用率レンジを有する。その上、映像シーケンスのための実際のビット利用率は、線７０２としてビット利用率グラフ７０１に示されている。時間的な３点（Ｔ１，Ｔ２，Ｔ３）は時間軸に沿ってビット利用率グラフ７０１内で確認される。

[0045]図７は時間的に変化する知覚モデルグラフをさらに含む。ビット利用率グラフ７０１上の時点Ｔ１に対応する知覚モデルグラフ７０３は、時点Ｔ１より前の開始位置からこの知覚モデルの開始点の左上の位置までの知覚モデルの斜めシフトを表す。知覚モデルグラフ７０３は、知覚モデルのシフトに起因する単一ビットレート値に対する種々の対応する符号化複雑度制御スカラーをさらに示す。知覚モデルグラフ７０５は知覚モデルの別のシフトを示す。知覚モデルグラフ７０５に示された知覚モデルのシフトは時点Ｔ２に対応する。ビット利用率グラフ７０１上の時点Ｔ２において、ビット利用率は減少するが、線の勾配は増加する。時点Ｔ２におけるビット利用率線７０２は減少し、ＣＢＲビット利用率線よりも下がるが、知覚モデルグラフ７０５の知覚モデルは、ビット利用率線７０２内での勾配の変化のために右下へシフトする。この知覚モデルのシフトは映像シーケンスに亘るビット利用率の大幅な変化を回避し、滑らかなビット利用率線７０２を与える。知覚モデルグラフ７０３及び７０５に示されたこの知覚モデルのシフトは典型的に小さいシフトであり、符号化複雑度制御スカラーに小さい変化を生じさせる。

[0046]図８は、本発明の一実施形態による知覚モデル定義用パラメータを計算する典型的なフローチャートである。図８では、知覚モデル定義用パラメータは、本発明の説明を助けるための一例として、知覚モデル定義用符号化複雑度制御スカラーであると仮定される。ブロック８０１で、映像シーケンスの初期フレームは、初期化符号化複雑度制御スカラーと、残りの利用可能な映像シーケンスビット割当量とを用いて符号化される。ブロック８０３で、目標ビット利用率レンジのローカルビット利用率レンジによるモデル反応パラメータ（すなわち、所与の時点の目標ビット利用率レンジ内の領域）は残りの利用可能な映像シーケンスビット割当量に基づいて計算される。

［モデル反応パラメータ＝１フレーム当たりのバイト数／ローカルビット利用率レンジ］
[0047]ブロック８０５で、知覚モデル訂正パラメータ（すなわち、振動知覚モデル訂正パラメータ、又は、対数知覚モデル訂正パラメータ）は現在ビットレートのための現在フレーム割当及び残りの利用可能な映像シーケンスビット割当量に基づいて計算される。
Ｄ_Ｒ＝モデル反応パラメータ／１フレーム当たりのバイト数（Ｄ_Ｒはビットレート振動減衰変数）
Ｄ_Ｂ＝（モデル反応パラメータ）^２／１フレーム当たりのバイト数（Ｄ_Ｂはビット割当量制御変数）

[0048]ブロック８０７で、知覚モデル定義用符号化複雑度制御スカラー修正子が、知覚モデル訂正パラメータ、前フレームのビットレート、及び残りの利用可能な映像シーケンスビット割当量を用いて計算される。
Ｑ_ｍｏｄ＝Ｒ_Ｎ−１＊Ｄ_Ｒ＋Ｂ＊Ｄ_Ｂ（Ｂは現在ビット割当使用量と理想ビット割当使用量との間の差である）

[0049]ブロック８０９で、新しい知覚モデル定義用符号化複雑度制御スカラーは、現在知覚モデル定義用符号化複雑度制御スカラー及び知覚モデル定義用符号化複雑度制御スカラー修正子を用いて計算される。
Ｑ_ＰＭ＝Ｑ_ｍｏｄ＊Ｑ_ＰＭ＋Ｑ_ＰＭ

[0050]図８に記載されたビット利用制御技術は単一パスのＶＢＲ環境を仮定する。ビット利用制御技術は、或いは、マルチパスのＶＢＲ環境にも適用される。例えば、２つのパスのうちの１番目のパスで、知覚モデル定義用符号化複雑度制御スカラーは、映像シーケンスに関して知られた情報（例えば、ビット割当量、分解能など）に基づく所定の値である。２番目のパスで、知覚モデル定義用符号化複雑度制御スカラーは、１番目のパスの知覚モデル定義用符号化複雑度制御スカラーと、１番目のパスに基づく最終的な前の符号化とを用いて決定され、以下の式：
Ｑ_{ｐａｓｓ２}＝Ｑ_{ｐａｓｓ１}＊（Ｒ_Ｑ１／Ｒ_ＰＭ）^Ｐ＋１（Ｒ_Ｑ１は１番目のパスからの安定化された時間加重ビットレートであり、Ｒ_ＰＭは知覚モデル定義用ビットレートパラメータである）
で示される。

［滑らかなビット利用のための動的知覚モデルに基づく符号化複雑度制御スカラーの生成］
[0051]図９Ａは、本発明の一実施形態によるビット利用率制御適応知覚モデルに基づいて符号化複雑度制御スカラーを計算するフローチャートである。ブロック９０１で、初期符号化複雑度制御スカラーはフレームを符号化するエンコーダへ送信される。ブロック９０３で、フレームを符号化するため使用されるビット数及びフレームのタイプが受信される。ブロック９０５で、前の符号化に基づく時間加重不変フレームビットレート又は前の符号化に基づく時間加重変化フレーム補正ビットレートが計算される。ブロック９０７で、主要フレームが符号化されたかどうかを判定する。本発明の種々の実施形態は、それとは別に主要フレームを定義可能である（例えば、ある特定のフレーム数、ある時間の経過など）。すべての主要フレームが符号化されたならば、制御はブロック９０９へ進む。主要フレームの全部はまだ符号化されていないならば、制御はブロック９０３へ戻る。

[0052]ブロック９０９で、安定化された時間加重された前の符号化に基づくビットレートが計算される。ブロック９１１で、新しい知覚モデル定義用符号化複雑度制御スカラーは、図８の説明と同様に、現在の知覚モデル定義用符号化複雑度制御スカラー及び知覚モデル符号化複雑度制御スカラー修正子を用いて計算される。ブロック９１３で、新しい知覚モデル定義用符号化複雑度制御スカラーを用いて調整された知覚モデルと、安定化された時間加重された前の符号化に基づくビットレートと、に基づく符号化複雑度制御スカラーが計算される。ブロック９１５で、調整された知覚モデル及び安定化された時間加重された前の符号化に基づくビットレートに基づいて計算された符号化複雑度制御スカラーは、現在フレームを符号化するエンコーダへ供給される。ブロック９１５から図９Ｂのブロック９１７へ進む。

[0053]図９Ｂは、本発明の一実施形態による図９Ａのフローチャートから続くフローチャートである。ブロック９１７で、映像シーケンスが終了したかどうかが判定される。映像シーケンスが終了していないならば、制御はブロック９０９へ戻る。映像シーケンスが終了しているならば、制御はブロック９１９へ進み、そこで処理が終了する。

[0054]図１０は、本発明の一実施形態による知覚モデル定義用パラメータモジュールを備えた符号化複雑度制御スカラー発生ユニットの典型的な図である。符号化複雑度制御スカラー発生ユニット１００１は、マルチプレクサ１０１３、前の符号化された不変フレーム平均ビットレート計算モジュール１００３、及び前の符号化された変化ビットレート補正計算モジュール１００５を含む。前の符号化された不変フレーム平均ビットレート計算モジュール１００３及び前の符号化された変化フレームビットレート補正計算モジュール１００５はマルチプレクサ１０１３と接続される。符号化複雑度制御スカラー発生ユニット１００１は、知覚モデル定義用パラメータモジュール１００９及び符号化複雑度制御スカラー計算モジュール１００７をさらに含む。知覚モデル定義用パラメータモジュール１００９は同様にマルチプレクサ１０１３と接続される。前の符号化された不変フレーム平均ビットレート計算モジュール１００３、前の符号化された変化フレームビットレート補正計算モジュール１００５、及び知覚モデルパラメータモジュール１００９はすべて符号化複雑度制御スカラー計算モジュール１００７と接続される。

[0055]符号化複雑度制御スカラー発生ユニット１００１は、前の符号化フレームのビットレート及び前の符号化されたフレームのフレームタイプを受信する。本発明の代替の実施形態では、フレームタイプは受信されない。その代わりに、符号化複雑度制御スカラー（Ｑ）発生ユニット１００１は受信されたビットレートからフレームタイプを決定する。マルチプレクサ１０１３はビットレートを受信し、フレームが不変フレームであるならば、そのビットレートを前の符号化された不変フレーム平均ビットレート計算モジュール１００３へ送信し、フレームが変化フレームであるならば、そのビットレートを前の符号化された変化フレームビットレート補正計算モジュール１００５へ送信する。前のフレームを符号化するため使用されたビット数は同様に知覚モジュール定義パラメータモジュール１００９へ送信される。前の符号化された不変フレーム平均ビットレート計算モジュール１００３及び前の符号化された変化フレームビットレート補正計算モジュール１００５の出力は加えられ、Ｑ計算モジュール１００７へ送信される。本発明の代替の実施形態では、前の符号化された不変フレーム平均ビットレート計算モジュール１００３及び前の符号化された変化フレームビットレート補正計算モジュール１００５の出力は修正なくＱ計算モジュール１００７へ送信される。

[0056]知覚モデル定義用パラメータモジュール１００９は、マルチプレクサ１０１３から受信されたビット数を用いて計算された知覚モデル定義用パラメータを出力する。知覚モデル定義用パラメータモジュール１００９によって実行される動作は、図８に記載されたそれらの動作と類似している。Ｑ計算モジュール１００７は、符号化複雑度制御スカラー発生ユニット１００１からの出力として、現在フレームを符号化するための安定化された前の時間加重符号化に基づくビットレートを用いて計算された符号化複雑度制御スカラーを供給する。

[0057]図１１は、本発明の一実施形態による符号化複雑度制御スカラー発生ユニットを備えたシステムの典型的な図である。図１１において、システム１１００は、映像入力データ装置１１０１、１台又は複数台のバッファ１１０３、圧縮ユニット１１０５、及び符号化複雑度制御スカラー発生ユニット１１０７を含む。映像入力データ装置１１０１は入力ビットストリームを受信する。映像入力データ装置１１０１は入力ビットストリームをバッファ１１０３へ渡し、バッファはビットストリーム内のフレームを一時記憶する。フレームは圧縮ユニット１１０５へ流れ、圧縮ユニットは、符号化複雑度制御スカラー発生ユニット１１０７からの入力を用いてフレームを圧縮する。圧縮ユニット１１０５は、圧縮ユニット１１０５へ供給された符号化複雑度制御スカラーを計算するため、データを符号化複雑度発生ユニット１１０７へさらに供給する。圧縮ユニット１１０５は圧縮された映像データを出力する。

[0058]上記のシステムは、メモリ、プロセッサ、及び／又は、ＡＳＩＣを含む。このようなメモリは、本明細書に記載された方法のいずれか１つ又は全部を具体化する命令のセット（すなわち、ソフトウェア）が格納された機械読み取り可能な媒体を含む。ソフトウェアは、完全に、又は、少なくとも部分的に、このメモリの内部、及び／又は、プロセッサとＡＳＩＣの両方若しくは一方の内部に存在する。この明細書の目的のため、用語「機械読み取り可能な媒体」は、機械（例えば、コンピュータ）によって読み取り可能な形式で情報を供給（すなわち、蓄積及び／又は送信）する任意のメカニズムを包含するものと解釈されるべきである。例えば、機械読み取り可能な媒体は、読み出し専用メモリ（「ＲＯＭ」）と、ランダムアクセスメモリ（「ＲＡＭ」）と、磁気ディスク記憶媒体と、光記憶媒体と、フラッシュメモリ装置と、電気、光、音響若しくはその他の形式の伝搬信号（例えば、搬送波、赤外線信号、デジタル信号など）などを含む。

［代替の実施形態］
[0059]本発明は複数の実施形態に関して記載されているが、当業者は本発明が記載された実施形態に限定されないことがわかる。例えば、フローチャートは、本発明のある実施形態によって実行される特別な動作順序を表すが、このような順序は典型例であることが理解されるべきである（例えば、代替の実施形態は、異なる順序で動作を実行する、一部の動作を組み合わせる、一部の動作を重ね合わせるなどである。）。例えば、図９を参照すると、ブロック９１１は本発明の他の実施形態ではブロック９０９の前に実行される。本発明の別の実施形態において、ブロック９０９及び９１１は並列に実行される。

[0060]さらに、図面は変化フレーム及び不変フレームに関して記載されているが、本発明の別の実施形態は、様々なフレームタイプ（例えば、Ｉフレーム、Ｐフレーム及びＢフレーム）を含む映像シーケンスを圧縮する。本発明の一実施形態では、あるスレッショルドの範囲内のビットレートは前の符号化に基づくビットレート平均を計算する際に利用され、一方、スレッショルドを上回るビットレートは補正ビットレートを計算する際に利用される。

[0061]このように、本発明の方法及び装置は、請求項に記載された事項の精神及び範囲に含まれる変形と変更を加えて実施することが可能である。したがって、明細書の記述は本発明の限定ではなく例示であると考えられるべきである。

本発明の一実施形態による知覚モデルを説明するグラフである。本発明の一実施形態によるノンテーラード知覚モデルに基づく符号化複雑度制御スカラーの決定を説明する図である。本発明の一実施形態による安定化された前の符号化に基づくビットレートを決定する典型的なフローチャートである。本発明の一実施形態による符号化複雑度制御スカラー発生ユニット及びエンコーダの典型的な図である。本発明の一実施形態による符号化複雑度制御スカラー発生ユニットの典型的な図である。本発明の一実施形態による映像シーケンスに対する目標ビット利用率レンジを説明するグラフである。本発明の一実施形態によるビット利用率と知覚モデルとの間の概念的な相互作用を説明する図である。本発明の一実施形態による任意の知覚モデル定義用パラメータを計算する典型的なフローチャートである。本発明の一実施形態によるビット利用率制御適応知覚モデルに基づいて符号化複雑度制御スカラーを計算するフローチャートである。本発明の一実施形態による図９Ａのフローチャートから続くフローチャートである。本発明の一実施形態による知覚モデル定義用パラメータモジュールを備えた符号化複雑度制御スカラー発生ユニットの典型的な図である。本発明の一実施形態による符号化複雑度制御スカラー発生ユニットを備えたシステムの典型的な図である。

Claims

前フレームの実際のビットレートの後に安定化遅延を伴って続くビットレート値を計算するステップと、
前記計算されたビットレート値及び知覚モデルを用いて現在の量子化係数を決定するステップと、
前の量子化係数に基づいて前記現在の量子化係数の変化率を制限するステップと、
前記制限された現在の量子化係数を用いてフレームを符号化するステップと、
を含む、コンピュータで実施される方法。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項１記載のコンピュータで実施される方法。
前記現在の量子化係数の変化率が、Ｑ_Ｎ−１が前フレームに対して決定されたＱであるとして、
０．５＊Ｑ_Ｎ−１＜＝Ｑ_ＣＡＬＣ＜＝２＊Ｑ_Ｎ−１
の範囲内に制限される、請求項１記載のコンピュータで実施される方法。
前記ビットレート値＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項１記載のコンピュータで実施される方法。
安定化された時間加重された前の符号化に基づくビットレートを用いて知覚モデルに基づいて符号化複雑度制御スカラーを決定するステップと、
１個以上の前フレームのセットを符号化するため使用された１個以上の前の符号化複雑度制御スカラーのセットに基づいて前記決定された符号化複雑度制御スカラーを拘束するステップと、
前記拘束された符号化複雑度制御スカラーを使用して現在フレームを符号化するステップと、
を含む、コンピュータで実施される方法。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項５記載のコンピュータで実施される方法。
前記符号化複雑度制御スカラーが、Ｑ_Ｎ−１が前フレームに対して決定されたＱであるとして、
０．５＊Ｑ_Ｎ−１＜＝Ｑ_ＣＡＬＣ＜＝２＊Ｑ_Ｎ−１
によって拘束される、請求項５記載のコンピュータで実施される方法。
前記安定化された時間加重された前の符号化に基づくビットレート＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が、反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項５記載のコンピュータで実施される方法。
複数の映像フレームの期間のための目標ビット利用率レンジを前記複数の映像フレームに関して知られている情報に基づいて設定するステップと、
前記複数の映像フレームの残りの利用可能なビットに基づいて前記目標ビット利用率レンジの範囲内でモデル反応パラメータを計算するステップと、
計算された現在フレームの割当量及び前記複数の映像フレームの前記残りの利用可能なビットを用いて知覚モデル訂正パラメータを計算するステップと、
前記計算された知覚モデル訂正パラメータ、前フレームのビットレート、及び前記複数の映像フレームの前記残りの利用可能なビットに応じて、現在の知覚モデル定義用パラメータを修正するステップと、
を含む、コンピュータで実施される方法。
前記モデル反応パラメータが１フレーム当たりのビット数のローカルビット利用率レンジによる量である、請求項９記載のコンピュータで実施される方法。
前記知覚モデル訂正パラメータが次式：
Ｄ_Ｒ＝モデル反応パラメータ／１フレーム当たりのバイト数（Ｄ_Ｒがビットレート振動減衰変数）、及び
Ｄ_Ｂ＝（モデル反応パラメータ）^２／１フレーム当たりのバイト数（Ｄ_Ｂがビット割当量制御変数）
に従って計算されるビットレート振動減衰変数（Ｄ_Ｒ）及びビット割当量制御変数（Ｄ_Ｂ）を含む、請求項９記載のコンピュータで実施される方法。
映像内の１個以上のフレームのセットを符号化するため知覚モデル及び前の符号化に基づくビットレートを用いて符号化複雑度制御スカラーを決定するステップと、
前記映像内の前記フレームのセットの各フレームを符号化した後に前記前の符号化に基づくビットレートを更新するステップと、
前記映像の期間に亘るビット利用率の制御に応じて前記知覚モデルをシフトするステップと、
を含む、コンピュータで実施される方法。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項１２記載のコンピュータで実施される方法。
前記安定化された時間加重された前の符号化に基づくビットレート＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項１２記載のコンピュータで実施される方法。
映像の視覚的な品質が変わらずに知覚されるように、知覚モデルに応じて計算され、１個以上の前の符号化されたフレームの、あるスレッショルドを上回るビットレートを含む前の符号化されたフレームを補正するため調整された平均ビットレートに応じて前記複数のフレームのそれぞれに対して調整された、符号化複雑度制御スカラーを用いて、映像の複数のフレームを符号化するステップと、
前記映像を符号化するビット利用率を制御するため前記知覚モデルを修正するステップと、
を含む、コンピュータで実施される方法。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項１５記載のコンピュータで実施される方法。
前記平均ビットビットレートが＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項１５記載のコンピュータで実施される方法。
知覚モデルパラメータを提供する知覚モデルパラメータユニット、
前に符号化されたフレームのビットレートに基づいて入力ビットレートを計算する入力ビットレート計算ユニット、及び
前記知覚モデルパラメータユニットと前記入力ビットレート計算ユニットとに接続され、前記知覚モデルパラメータユニットからの知覚モデルパラメータと前記入力ビットレート計算ユニットからの入力ビットレートとを用いて符号化複雑度制御スカラーを計算する符号化複雑度制御スカラー計算ユニット
を備えた符号化複雑度制御スカラー発生ユニットと、
前記符号化複雑度発生ユニットに接続され、符号化複雑度制御スカラーを受信し、映像を圧縮し、
量子化ユニット、
動き補償ユニット、及び
符号化ユニット
を備えた映像圧縮ユニットと、
を備える装置。
前記量子化ユニットがＤＣＴユニットである、請求項１８記載の装置。
前記映像圧縮ユニットに接続されたえ光媒体読み取りモジュールをさらに備える、請求項１８記載の装置。
前フレームの実際のビットレートの後に安定化遅延を伴って続くビットレート値を計算することと、
前記計算されたビットレート値及び知覚モデルを用いて現在の量子化係数を決定することと、
前の量子化係数に基づいて前記現在の量子化係数の変化率を制限することと、
前記制限された現在の量子化係数を用いてフレームを符号化することと、
を装置に実行させる命令のセットを有する機械読み取り可能な媒体。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項２１記載の機械読み取り可能な媒体。
前記現在の量子化係数の変化率が、Ｑ_Ｎ−１が前フレームに対して決定されたＱであるとして、
０．５＊Ｑ_Ｎ−１＜＝Ｑ_ＣＡＬＣ＜＝２＊Ｑ_Ｎ−１
の範囲内に制限される、請求項２１記載の機械読み取り可能な媒体。
前記ビットレート値＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項２１記載の機械読み取り可能な媒体。
安定化された時間加重された前の符号化に基づくビットレートを用いて知覚モデルに基づいて符号化複雑度制御スカラーを決定することと、
１個以上の前フレームのセットを符号化するため使用された１個以上の前の符号化複雑度制御スカラーのセットに基づいて前記決定された符号化複雑度制御スカラーを拘束することと、
前記拘束された符号化複雑度制御スカラーを使用して現在フレームを符号化することと、
を装置に実行させる命令のセットを有する機械読み取り可能な媒体。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項２５記載の機械読み取り可能な媒体。
前記符号化複雑度制御スカラーが、Ｑ_Ｎ−１が前フレームに対して決定されたＱであるとして、
０．５＊Ｑ_Ｎ−１＜＝Ｑ_ＣＡＬＣ＜＝２＊Ｑ_Ｎ−１
によって拘束される、請求項２５記載の機械読み取り可能な媒体。
前記安定化された時間加重された前の符号化に基づくビットレート＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項２５記載の機械読み取り可能な媒体。
複数の映像フレームの期間のための目標ビット利用率レンジを前記複数の映像フレームに関して知られている情報に基づいて設定することと、
前記複数の映像フレームの残りの利用可能なビットに基づいて前記目標ビット利用率レンジの範囲内でモデル反応パラメータを計算することと、
計算された現在フレームの割当量及び前記複数の映像フレームの前記残りの利用可能なビットを用いて知覚モデル訂正パラメータを計算することと、
前記計算された知覚モデル訂正パラメータ、前フレームのビットレート、及び前記複数の映像フレームの前記残りの利用可能なビットに応じて、現在の知覚モデル定義用パラメータを修正することと、
を装置に実行させる命令のセットを有する機械読み取り可能な媒体。
前記モデル反応パラメータが１フレーム当たりのビット数のローカルビット利用率レンジによる量である、請求項２９記載の機械読み取り可能な媒体。
前記知覚モデル訂正パラメータが次式：
Ｄ_Ｒ＝モデル反応パラメータ／１フレーム当たりのバイト数（Ｄ_Ｒがビットレート振動減衰変数）、及び
Ｄ_Ｂ＝（モデル反応パラメータ）^２／１フレーム当たりのバイト数（Ｄ_Ｂがビット割当量制御変数）
に従って計算されるビットレート振動減衰変数（Ｄ_Ｒ）及びビット割当量制御変数（Ｄ_Ｂ）を含む、請求項２９記載の機械読み取り可能な媒体。
映像内の１個以上のフレームのセットを符号化するため知覚モデル及び前の符号化に基づくビットレートを用いて符号化複雑度制御スカラーを決定することと、
前記映像内の前記フレームのセットの各フレームを符号化した後に前記前の符号化に基づくビットレートを更新することと、
前記映像の期間に亘るビット利用率の制御に応じて前記知覚モデルをシフトすることと、
を装置に実行させる命令のセットを有する機械読み取り可能な媒体。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項３２記載の機械読み取り可能な媒体。
前記安定化された時間加重された前の符号化に基づくビットレート＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項３２記載の機械読み取り可能な媒体。
映像の視覚的な品質が変わらずに知覚されるように、知覚モデルに応じて計算され、１個以上の前の符号化されたフレームの、あるスレッショルドを上回るビットレートを含む前の符号化されたフレームを補正するため調整された平均ビットレートに応じて前記複数のフレームのそれぞれに対して調整された、符号化複雑度制御スカラーを用いて、映像の複数のフレームを符号化することと、
前記映像を符号化するビット利用率を制御するため前記知覚モデルを修正することと、
を装置に実行させる命令のセットを有する機械読み取り可能な媒体。
前記知覚モデルが次式：
Ｑ_ＰＭ＊（Ｒ_ＣＡＬＣ／Ｒ_ＰＭ）^Ｐ
によって定義される、請求項３５記載の機械読み取り可能な媒体。
前記平均ビットビットレートが＝ＲＮＴ_Ｎ＋ＲＬ_Ｎ−ＲＮＴＬ_Ｎであり、
ＲＮＴ_Ｎ＝ＲＮＴ_Ｎ−１＊Ｋ１＋ＲＮ_Ｎ＊Ｋ２であり、
Ｋ１及びＫ２が、システムがフレーム間の突然の難易度変化にどれだけ高速に反応するかを決める係数であり、
ＲＮ_Ｎが直前に符号化された不変フレームビットレートに一致し、
ＲＬ_Ｎ＝ＲＬ_Ｎ−１＊Ｋ３＋Ｒ_Ｎ＊Ｋ４であり、
Ｒ_Ｎが前に符号化されたフレームビットレートであり、
Ｋ３及びＫ４が反応が遅い無限応答フィルタを定義する係数であり、
ＲＮＴＬ_Ｎ＝ＲＮＴＬ_Ｎ−１＊Ｋ３＋ＲＮ_Ｎ＊Ｋ４である、
請求項３５記載の機械読み取り可能な媒体。