JP5006327B2 - レート−歪特性を使用するビデオ・コーディングのための2回パス・レート制御技術 - Google Patents

レート−歪特性を使用するビデオ・コーディングのための2回パス・レート制御技術 Download PDF

Info

Publication number
JP5006327B2
JP5006327B2 JP2008532399A JP2008532399A JP5006327B2 JP 5006327 B2 JP5006327 B2 JP 5006327B2 JP 2008532399 A JP2008532399 A JP 2008532399A JP 2008532399 A JP2008532399 A JP 2008532399A JP 5006327 B2 JP5006327 B2 JP 5006327B2
Authority
JP
Japan
Prior art keywords
rate
distortion
video sequence
frame
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008532399A
Other languages
English (en)
Other versions
JP2009509476A (ja
Inventor
ワン、ハオホン
マラヤス、ナレンドラナス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009509476A publication Critical patent/JP2009509476A/ja
Application granted granted Critical
Publication of JP5006327B2 publication Critical patent/JP5006327B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ディジタル・ビデオ処理に係り、そして特に、ビデオ系列のレート制御されたコーディングに関する。
ディジタル・ビデオ能力は、広範囲のデバイスへと組み込まれることが可能であり、それはディジタル・テレビ、ディジタル直接放送システム、無線通信デバイス、個人ディジタル補助装置(PDA:personal digital assistants)、ラップトップ・コンピュータ、デスクトップ・コンピュータ、ディジタル・カメラ、ディジタル記録デバイス、セルラ電話機又は衛星無線通信電話機、及びその他を含む。ディジタル・ビデオ・デバイスは、フル動画ビデオ系列を製作し、修正し、伝送し、記憶し、記録し、そして再生する際に、従来のアナログ・ビデオ・システムに対して著しい改善を提供することが可能である。
複数の異なるビデオ符号化規格が、ディジタル・ビデオ系列をコーディングするために制定されてきている。動画エキスパート・グループ(MPEG:Moving Picture Expert Group)は、例えば、MPEG−1,MPEG−2及びMPEG−4を含む複数の規格を開発している。その他の規格は、国際電気通信連合(ITU:International Telecommunication Union)H.263規格、カルフォルニア州キューパーティーノ市のアップル・コンピュータにより開発されたクイックタイム(QuickTime(登録商標))技術、ワシントン州レドモンド市のマイクロソフト株式会社により開発されたウィンドウズ(登録商標)のためのビデオ、インテル株式会社により開発されたインディオ(Indeo(登録商標))、ワシントン州シアトル市リアルネットワーク株式会社からのリアルビデオ(RealVideo(登録商標))、スーパーマック株式会社により開発されたシネパック(Cinepak(登録商標))を含む。さらに、ITU H.264規格及び複数の専有規格を含む新たな規格が、出現し続けそして発展し続けている。
複数のビデオ・コーディング規格は、圧縮された方式でデータをコーディングすることによりビデオ系列の伝送レートの改善を可能にする。圧縮は、ビデオ・フレームの効率的な伝送のために伝送される必要があるデータの全体量を削減することができる。大部分のビデオ・コーディング規格は、例えば、圧縮なしで実現されることが可能なものよりも狭い帯域幅を通してビデオ及び画像の伝送を容易にするために設計されたグラフィックス圧縮及びビデオ圧縮技術を利用する。MPEG規格及びITU H.263とITU H.264規格は、例えば、フレーム間圧縮を提供するために、時間的な相関又はフレーム間相関と呼ばれる連続する複数のビデオ・フレーム間の類似性を利用するビデオ・コーディング技術をサポートする。そのようなフレーム間圧縮は、動き推定及び動き補償コーディング技術を介して一般的に実現される。それに加えて、あるビデオ・コーディング技術は、ビデオ・フレームを圧縮するために、空間相関又はフレーム内相関と呼ばれるフレーム内部の類似性を利用することができる。
複数のレート制御技術が、ビデオ・コーディングのために開発されてきている。レート制御技術は、ビデオ系列のリアル・タイム伝送を容易にするために特に重要であるが、非リアル・タイム・コーディング設定においても同様に使用されることができる。レート制御に関して、コーディング技術は、フレーム当りのコード化されるビット数を絶えず調節することができる。特にレート制御は、ビデオ系列が所定のレートで効率的にコード化されることが可能であり、それゆえ割り当てられた帯域幅を経由して伝送されることを確実するために、フレーム当りのコード化されるビット数を制限することができる。コーディング技術がビデオ系列の場面の変化に敏感でない場合には、ビデオ系列のリアル・タイム伝送のためのビット・レートは、場面の変化につれて著しく変動することがある。同様に、(無線ビデオ電話のような)ある種のアプリケーションに関して、帯域幅の利用可能性は、あるビデオ系列がコード化されようとしている間に変化することがある。これらの理由又はその他の理由のために、レート制御技術は、コーディングの期間にフレーム当りに使用されるビット数を絶えず調節するために使用されることができる。
サマリー
本明細書は、ビデオ・コーディングを改善することが可能なレート制御技術を記載する。特に、本明細書は、“2回パス”コーディングに基づいた複数のレート制御技術を記載するが、追加のパスが同様に使用されることができる。第1パスは、その第1パスの統計値に基づいてビデオ系列のレート−歪特性を推定する目的のために第1の量子化パラメータ(QP)のセットを使用してビデオ系列をコード化する。第2のQPのセットは、次に第2コーディング・パスのために定められることができる。第1コーディング・パスがビデオ系列のレート−歪特性の推定値を提供するので、第2パスのためのQPの選択は、フレーム間の依存性を考慮することによって改善されることができる。
様々な実施形態及び変形が本明細書中で説明される。しかしながら、この開示に整合する2つの基本的な選択肢が、一般的に提案される。第1のケースでは、第1パスの推定されるレート−歪特性は、ビデオ系列のフレームの歪を最小にする方法で第2パスのためのQPを選択するために使用される。第2のケースでは、第1パスの推定レート−歪特性は、ビデオ系列の複数のフレーム間の品質変動を最小にする方法で第2パスのためのQPを選択するために使用され、そしてしかも、低い平均フレーム歪を実現するために最小化された品質変動において品質を最高にすることができる。
1つの実施形態では、本開示は、ビデオ・コーディング・デバイスを提供し、それは第1コーディング・パスにおいて第1の量子化パラメータ(QP)のセットを使用してビデオ系列のフレームをコード化するための手段、該第1コーディング・パスの該コード化されたビデオ系列に関するレート−歪統計値を求めるための手段、該レート−歪統計値に基づいて該ビデオ系列のレート−歪特性を推定するための手段、及び該推定したレート−歪特性に基づいて該ビデオ系列中の該フレームの第2コーディング・パスのために第2のQPのセットを選択するための手段、を具備する。
別の1つの実施形態では、本開示は、ビデオ・コーディング・デバイスを提供し、それは、第1コーディング・パスにおいて第1の量子化パラメータ(QP)のセットを使用してビデオ系列のフレームをコード化するための手段、該コード化されたビデオ系列に関するレート−歪統計値を求めるための手段、該レート−歪統計値に基づいて該ビデオ系列のレート−歪特性を推定するための手段、及び該ビデオ系列中の該フレームの第2コーディング・パスのために第2のQPのセットを選択するために該推定したレート−歪特性を使用して第2コーディング・パスにおいて該ビデオ系列の複数の該フレーム間の品質変動を実質的に最小にするための手段、を具備する。
本明細書中に記述されるレート制御コーディング技術は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合わせでビデオ・コーディング・デバイスにおいて実装されることができる。ソフトウェアにおいて実装される場合には、ソフトウェアは、ビデオ・コーディングのために使用するプログラム可能なプロセッサのような、プロセッサにおいて実行されることができる。本技術を実行するソフトウェアは、コンピュータ読み取り可能な媒体中に最初は記憶されることができ、そしてそのようなレート制御されたビデオ・コーディングを実行するためにプロセッサにロードされ、そして実行されることができる。
様々な実施形態のさらなる詳細は、添付された図面及び以下の説明に記述される。その他の特徴、目的及び利点は、詳細な説明及び図面から、そして特許請求の範囲から明らかにされるであろう。
詳細な説明
本明細書は、ビデオ・コーディングのためのレート制御技術を説明する。説明される技術は、“2回パス”アプローチに基づき、そこでは第1コーディング・パスが、ビデオ系列の特性を推定するために使用され、そしてその推定された特性は、次に第2パスのための量子化パラメータ(QP:quantization parameter)の選択の際に改善するために使用される。本発明は、ビデオ系列のレート−歪特性のフレーム依存性のある種の特性を利用することができる。特に、本発明は、多くのケースでは(特に、本明細書で検討されるケースでは)、現在のフレームのレートと歪は、直前のフレームにおいて使用されるQPに大きく依存することを認めるが、直前のフレームの前のフレームに対して使用されるQPは、現在のフレームのレートと歪にほとんど影響しないことを認める。これらの認識を使用して、計算量の著しい削減が、近似へとレート・モデル及び歪モデルを本質的に単純化することによってコーディング・デバイスにおいて実現されることができる。
第1コーディング・パスは、第1パスの統計値に基づいてビデオ系列のレート−歪特性を推定する目的のために第1のQPのセットを使用してビデオ系列をコード化する。第1のQPのセットは、任意の方式で、例えば、各フレームに同じQPを割り当てることにより、又はいわゆる“グリーディ(greedy)”アルゴリズムを使用することにより、選択されることができ、そのグリーディ・アルゴリズムは、QPを決定するためにレート・バジェットを使用し、そして次に、それぞれのその後のQPを規定するために残りのフレーム全体にわたりそのレート・バジェットを再割り当てする。第1のQPのセットが第1コーディング・パスに対してどのように選択されるか又は決定されるかに拘らず、ビデオ系列に関するレート−歪統計値は、第1コーディング・パスにより求められることができる。
第1コーディング・パスの後で、ビデオ系列のレート−歪特性は、そのレート−歪統計値に基づいて推定されることができる。レート−歪特性が推定される方法は、異なる実施形態では変わることがあるが、一般に第1コーディング・パスにおいて求められたレート−歪統計値に対するレート・モデル及び歪モデルの適用を含む。レート−歪特性が推定された後で、これらの特性は、ビデオ系列中のフレームの第2コーディング・パスのための第2のQPのセットを選択するために使用される。第2コーディング・パスは、次に、ビデオ系列を最終的にコード化するために使用されることができ、そして第2コーディング・パスのために選択されたQPは、そのようなコーディングの際にビデオ品質の向上を実現することができる。
様々な実施形態及び変形が、本明細書中に記載される。しかしながら、本明細書に整合する2つの基本的な選択肢が、一般的に提案される。第1のケースでは、第1パスの推定されるレート−歪特性は、ビデオ系列のフレームの歪を最小にする方法で第2パスのためのQPを選択するために使用されることができる。第2のケースでは、第1パスの推定レート−歪特性は、ビデオ系列の複数のフレーム間の品質変動を最小にする方法で第2パスのためのQPを選択するために使用される。歪の最小化が平均してより良い総合コーディングを結果としてもたらすことができるが、品質変動の最小化は、急激な品質変化に起因する望ましくないフリッカリング問題を低減する又は除去することができる。これらの2つのケースの組み合わせは、この開示により同様に予想される。
図1は、具体例のビデオ・コーディング・デバイス10を例示するブロック図である。ビデオ・コーディング・デバイス10は、ビデオ・データをコード化することが可能でありそして送信することが可能であるディジタル・ビデオ・デバイスの一部を形成することができる。ビデオ・データは、ビデオ・カメラから取り込まれることができるか、ビデオ・アーカイブから検索されることができるか、又は別の方法で求められることができる。コーディング・デバイス10は、例えは、ディジタル・テレビ、ディジタル直接放送システム、無線通信デバイス、個人ディジタル補助装置(PDA:personal digital assistants)、ラップトップ・コンピュータ、デスクトップ・コンピュータ、ディジタル・カメラ、ディジタル記録デバイス、セルラ電話機又は衛星無線通信電話機、又はビデオ電話方式(VT:video telephony)能力を有するいずれかの電気通信デバイスのような、デバイスに搭載されることができる。コーディング・デバイス10は、例えば、MPEG−4、ITU−T H.263、ITU−T H.264、又は量子化されたビデオ・コーディングのためにQP選択を必要とするいずれかのビデオ・コーディング規格、に準拠することができる。コーディング・デバイス10は、動き推定及び動き補償のようなフレーム間コーディングをサポートすることができ、そして同様に、空間推定及びフレーム内コーディングのために使用する内部予測コーディング技術のような、別の技術をサポートすることができる。
図1に示されるように、コーディング・デバイス10は、ビデオ系列をコード化するためのビデオ・コーディング装置12、及びそのようなコーディングの前と後のビデオ系列を記憶するためのビデオ・メモリ20を含む。デバイス10は、しかも、コード化された系列を別のデバイスに送信するための送信機22、及びおそらく、ビデオ系列を取り込みそしてメモリ20中にその取り込まれた系列を記憶するための、ビデオ・カメラのようなビデオ取込みデバイス18’を含むことができる。コーディング・デバイス10の様々な素子は、通信バス15を介して通信的に接続されることができる。種々のフィルタのような様々な他の素子、又は別の素子は、同様にコーディング・デバイス10中に含まれることができるが、単純化のために具体的に図示されていない。図1に示された構造は、単に具体例であり、それは本明細書中で説明される技術が様々な別の構造を用いて与えられることができるためである。
ビデオ・メモリ20は、一般的に比較的大きなメモリ空間を備える。ビデオ・メモリ20は、例えば、ダイナミック・ランダム・アクセス・メモリ(DRAM:dynamic random access memory)、又はFLASHメモリを備えることができる。その他の例では、ビデオ・メモリ20は、不揮発性メモリ又はいずれかの他のデータ記憶デバイスを備えることができる。
ビデオ・コーディング装置12は、移動無線電話機のためのいわゆる“チップ・セット”を備えることができ、ハードウェア、ソフトウェア、ファームウェアの任意の組み合わせを、及び/又は1又はそれより多くのマイクロプロセッサ、ディジタル信号プロセッサ(DSP:digital signal processor)、用途特定集積回路(ASIC:application specific integrated circuit)、フィールド・プログラマブル・ゲート・アレイ(FPGA:field programmable gate array)、又はこれらの様々な組み合わせを含むことができる。ビデオ・コーディング装置12は、一般にローカル・メモリ18に接続されたビデオ・コーダ14を含む。ビデオ・コーダ14は、ディジタル・ビデオ・データをエンコードしそしてデコードするためのエンコーダ/デコーダ(CODEC)を備えることができる。ローカル・メモリ18は、ビデオ・メモリ20と比較して小さくそしてより早いメモリ空間を備えることができる。一例として、ローカル・メモリ18は、シンクロナス・ダイナミック・ランダム・アクセス・メモリ(SDRAM:synchronous dynamic random access memory)を備えることができる。ローカル・メモリ18は、ビデオ・コーディング装置12の別のコンポーネントに集積された“オン−チップ”メモリを備えることができ、プロセッサに集中するコーディング・プロセスの期間にデータへの非常に高速なアクセスを提供する。しかしながら、メモリ20と18は、同じメモリ・パーツへと統合されることができる、又は複数の別の構成で与えられることができる。
本明細書中に説明されるように、ビデオ・コーダ14は、“2回パス”コーディング・アプローチを実行し、そこでは第1コーディング・パスは、ビデオ系列の特性を推定するために使用され、そして第2コーディング・パスは、その推定された特性を使用して、コーディングの品質を向上させるために第2パスにおいて使用するQPの選択に改良を与える。レート制御ユニット30は、QP選択プロセスを取り扱い、それは第1コーディング・パスにおいて推定された特性を使用する。レート制御ユニット30により実行される技術は、レート・モデル及び歪モデルを近似へと本質的に単純化することによって計算量の著しい削減を実現するために、ビデオ系列のレート−歪特性を推定することによってフレーム依存性の利点を利用することが可能である。
レート制御ユニット30は、第1パスの統計値に基づいてビデオ系列のレート−歪特性を推定する目的のために第1コーディング・パスにおいて第1のQPのセットを適用する。第1コーディング・パスの後で、レート制御ユニット30は、レート−歪統計値に基づいてビデオ系列のレート−歪特性を推定する。レート制御ユニット30は、これらの推定したレート−歪特性を使用して、ビデオ系列中のフレームの第2コーディング・パスのための第2のQPのセットを選択する。第2コーディング・パスは、次に、そのビデオ系列を最終的にコード化するために使用されることができ、そして第2コーディング・パスのために選択されたQPは、そのようなコーディングにおいてビデオ品質の改善を実現することができる。本明細書にしたがって、推定された特性は、第2パスにおいてQP選択を改善することを可能にする方法でフレーム依存性を定量化することができる。
各コーディング・パスに関して、所定のビデオ・フレームのコーディングの期間に、コード化されようとしている現在のビデオ・ブロックは、ビデオ・メモリ20からローカル・メモリ18へロードされることができる。予測ビデオ・ブロックの位置を決めるために使用する検索空間は、同様にビデオ・メモリ20からローカル・メモリ18にロードされることができる。検索空間は、1又はそれより多くの前のビデオ・フレーム(又は引き続くフレーム)のピクセルのサブセットを備えることができる。選ばれたサブセットは、コード化されようとしている現在のビデオ・ブロックにぴったりと符合する予測ビデオ・ブロックの識別のために有望な位置として事前に同定されることができる。
ローカル・メモリ18は、コード化されようとしている現在のビデオ・ブロック及び検索空間をロードされる。動き推定器/空間推定器24は、予測ビデオ・ブロックを同定するために現在のビデオ・ブロックを検索空間中の様々なビデオ・ブロックと比較する。動き推定器/空間推定器24は、一般に、フレーム間コーディングのために動き推定を実行する動き推定器、フレーム内コーディングのために空間推定を実行する空間推定器、又は動き推定と空間推定とを実行することが可能な複合ユニット、を表す。一般に、予測ビデオ・ブロックは、フレーム間相関(又はフレーム内相関)の目的のために現在のビデオ・ブロックと適切な符合を与えるために見つけられる候補ビデオ・ブロックであり、それは最もぴったりと符合する候補ビデオ・ブロックであり得る。予測ビデオ・ブロックは、現在のビデオ・ブロックと比較して最小の差異値を有するビデオ・ブロックを同定するために、動き推定プロセスの期間に評価される複数の候補ビデオ・ブロックのうちの1つである。
コード化されようとしている現在のビデオ・ブロックとメモリ18の検索空間中の候補ビデオ・ブロックとの間の比較を実行するために、動き推定器/空間推定器24は、絶対差の総和(SAD:sum of absolute difference)技術、二乗差の総和(SSD:sum of squared difference)技術、又は他の比較技術を実行することができる。このようにして、動き推定器/空間推定器24は、異なる候補ビデオ・ブロックに対する差異値を決定することができる。より小さな差異値は、一般に候補ビデオ・ブロックが良く符合すること、そしてそれゆえより大きな差異値を生じる他の候補ビデオ・ブロックよりも動き推定コーディングの際に使用するためのさらに良い候補であることを示す。予測ビデオ・ブロックは、適切な符合が一旦見つけられると、同定されることができる。
一旦、コード化されようとしているビデオ・ブロックに対して、予測ビデオ・ブロックが動き推定器/空間推定器24によって同定されると、動き補償器/内部予測ユニット26は、残差(residual)を生成する。残差は、コード化されようとしている現在のブロックと動き推定又は空間推定によって同定される予測ビデオ・ブロックとの間の差を示すデータのブロックである。動き補償器/内部予測ユニット26は、一般に動き補償器、内部予測ユニット、又は複合ユニットを表し、動き補償器はフレーム間コーディングのために動き補償を実行し、内部予測ユニットはフレーム内コーディングのために空間補償を実行し、そして複合ユニットはフレーム間コーディング又はフレーム内コーディングが使用されようとしているかどうかに応じて動き補償と内部予測とのいずれかを実行することができる。動き補償器/内部予測ユニット26は、動きベクトルを使用して予測ブロックをフェッチすることができ、そして次に、その予測ブロックを入力ブロックから引き算して残差を生成する。残差は、一般的に、元々のビデオ・ブロックよりも実質的に少ないデータを含み、それは差異ブロックにより表される。
動き補償器/内部予測ユニット26が残差を生成した後で、残差コーダ28は、1又はそれより多くの残差コーディング・ステップを実行することができ、例えば、離散余弦変換(DCT:discrete cosine transform)ジグ−ザグ・スキャニング、ラン長コーディング、可変長(ハフマン)コーディング、又は所定のコーディング規格において使用されるいずれかの他のプロセス、である。非常に多くの他の残差コーディング・ステップが、同様に実行されることができる。
レート制御ユニット30は、本明細書と矛盾のない2つの選択肢のうちの1つを実行することができる。第1のケースでは、レート制御ユニット30は、第1パスの推定レート−歪特性を使用して、ビデオ系列の全てのフレームにわたり歪を最小にする方法で第2パスのためのQPを選択する。第2のケースでは、レート制御ユニット30は、第1パスの推定レート−歪特性を使用して、その系列のフレームの品質変動を最小にする方法で第2パスのためにQPを選択する。歪の最小化が平均としてより良い総合コーディングという結果をもたらすとはいえ、品質変動の最小化は、急激な品質変化に起因するフリッカリング問題を減少させるため又は除去するために望まれることがある。これらの2つの選択肢のそれぞれの詳細は、以下にさらに詳細に述べられる。
図2−15の検討は、一般に第1のアプローチの概要を示し、そこでのゴールは、コード化されたビデオ系列の歪を実質的に最小にすることであり、一方で、図16−26は、一般に第2のアプローチの概要を示し、そこでのゴールは、コード化されたビデオ系列の品質変動を実質的に最小にすることである。しかしながら、図2−26のいずれかに関して検討されるいずれの詳細も、各アプローチの1又はそれより多くの態様が本明細書にしたがった組み合わせで同様に使用されることができるので、いずれかのアプローチに限定されるように解釈されるべきでない。本明細書中で議論されるテスト系列の種々の実験グラフでは、テスト系列は、一般にコーディング品質を試験するためそして比較するために一般的に使用されるクォーター共通画像フォーマット(QCIF:Quarter Common Image Format)系列である。
図2は、本明細書にしたがったレート制御されたビデオ・コーディングのための技術を説明するフロー図である。図2に示されるように、ビデオ・コーダ14は、第1のQPのセットを使用してビデオ系列のフレームをコード化する(40)。レート制御ユニット30は、次に、第1コーディング・パスのコード化されたビデオ系列に関するレート−歪統計値を求める(41)。ビデオ・コーダ14の様々な他のユニット24,26と28は、レート制御ユニット30によって同定された第1のQPのセットを使用して第1コーディング・パスにおいて提供されることができる。第1のQPのセットは、様々な異なる方法で、又はいずれかのレート制御アルゴリズムにしたがって選択されることができる。一例では、第1のQPのセットは、いわゆる“グリーディ(greedy)”アルゴリズムに基づいてレート制御ユニット30によってダイナミックに選択され、そのグリーディ・アルゴリズムは、系列中のフレームの数に関係するレート・バジェット(rate budget)に基づいてフレームに対するQPを選択するが、その後、残りのレート・バジェットを残りのフレーム全体にわたり再割り当てする。別の例では、同じQPが、事前に選択されることができ、そして第1パスにおいて全てのフレームに対して使用されることができ、そのケースでは、第1のQPのセット中のQPは、互いに同じである。
第1コーディング・パスの後で、レート制御ユニット30は、第1コーディング・パスによって求められたレート−歪統計値に基づいてビデオ系列のレート−歪特性を推定する(42)。一般に、レート−歪特性を推定するプロセスは、レート−歪統計値にレート・モデルと歪モデルとを適用することを含む。具体例の数学モデルが、下記に非常に詳細に説明され、それは近似のために計算の複雑さを低減することができ、しかも非常に良い推定値と良いコーディング結果を与える。再び、推定される特性は、第2パスにおいて改善されたQP選択を可能にする方法でフレーム依存性を定量化することが可能である。
レート制御ユニット30は、次に、レート−歪特性に基づいて第2コーディング・パスのための第2のQPのセットを選択する(43)。第2のQPのセットは、第1のQPのセットとは異なり、そしてコーディングの品質を向上させるために選択される。第1コーディング・パスは、低い方の品質のコーディング・パスであり得るが、正確なモデル化に適用するために必要な情報を提供し、そしてビデオ系列をコーディングする際のフレーム間依存性を説明することができる。一例では、レート制御ユニット30は、下記にさらに詳細に論じられるように、推定レート−歪特性にラグランジュ緩和演算を実行することによって第2のQPのセットを選択する。このケースでは又は類似のケースでは、第2のQPのセットの選択は、ビデオ系列中のフレームの歪を実質的に最小にすることを含むことができる。いずれにせよ、一旦、レート制御ユニット30が第2のQPのセットを選択すると、ビデオ・コーダ14は、第2のQPのセットを使用してビデオ系列をコード化する(44)。
ビデオ・コーディングにおいて、基本的な問題は、ビデオ系列の最良の総合品質を実現するために、複数のフレームの間でビットを効率的に割り当てること、又は各フレームのためのQPを効率的に選択することである。この問題の困難さは、フレームのコーディング依存性に、そして指数関数的な数のノードを含んでいる候補空間を検索するために結果としてのコストに、主に起因する。本明細書の1つの実施形態では、第2パスのコーディングにおける実際的なレートと歪状態を近似するために推定モデルの集合を使用する解が、提案される。そのモデルは、多くのケースでは現在のフレームのレートと歪は、その前のフレームの量子化レベルに大きく依存すること、そして最後のフレームよりも早い前のフレームのQP選択は現在のフレームの性能にほとんど影響しないこと、の観測に基づいている。モデルと観測は、問題の候補空間の著しい削減を可能にする。さらに、ラグランジュ緩和とダイナミックなプログラミングを使用することによって、拘束された問題は、非拘束問題へと変換されることが可能であり、そして最短パス検索アルゴリズムを使用することにより解かれることができる。実験結果は、ある従来のCODECにおいて使用される“グリーディ”フレーム−レベル・レート制御アルゴリズムと比較して1.7dBまでの著しい向上を示している。
多くの従来のレート制御方式は、リアル・タイム・コーディング・アプリケーションのために設計されており、そしてグリーディ・フレーム−レベル・ビット割当て方針に適合する。そのグリーディ・フレーム−レベル・ビット割当て方針は、今後のフレームが一様に分散されたテクスチャの複雑さを有するはずであると仮定する。それゆえ、グリーディ・フレーム−レベル・ビット割当て方針は、残りのビットを今後の複数のフレームの間で等しく割り当てる。
不幸にして、良いフレーム・ビット割当てを得ることは、平凡な課題ではない、その理由は、フレームのレート−歪(R−D:rate-distortion)関数が前のコード化されたフレームについての量子化パラメータ(QP)選択に依存するためである。言い換えると、全体のビデオ系列に関するグローバル・レート−歪関数の生成は、フレーム依存性のために非常に困難である。
本明細書は、正確なレート及び歪推定モデルに基づくフレーム−レベル・レート制御アルゴリズムを提案する。それは、フレーム歪が前のフレームの量子化のレベルに大きく依存することを観測している。それに加えて、2回目のパス・コーディングの間の歪は、統計によって近似されることができ、その統計は、例えば、(同じレベルの量子化を使用する)第1パスにおける歪の関数、第1パスにおける動き補償された残差のエネルギー、及び第1パスにおける前のフレーム歪である。直前のフレームより前のフレームの量子化選択が現在のフレームのフレーム歪にほとんど影響を与えないことが、同様に観測される。上記の観測及び各フレームに対する推定されたρ−QPとD−QPの表(それはメモリ18中に記憶されることができる)を用いて、ラグランジュ緩和技術は、各フレームに対して望ましいQP選択を見つけるために使用されることができる。値ρは、フレーム中の非ゼロ量子化DCT係数の数を表し、QPは、量子化パラメータを表し、そしてDは歪を表す。
1つの実施形態にしたがって、問題は、1回目のパス・コーディングの期間に集められた統計量に基づいて、ビデオ系列の最良総合品質を実現するための取り組みの際に各フレームに対してQPを選択することとして規定されることができる。1回目のパス・コーディングをどのように行うかの問題は実際的に意味があるけれども、問題を単純化するために、“グリーディ”フレーム−レベル・ビット割当てアルゴリズムが第1パスにおいてフレームをコード化するために使用されることを仮定することができる。当然ながら、他の1回目のパス・コーディング技術が、同様に、本開示の2回パス技術にしたがって使用されることができる。下記では、フレーム・ビット・レートは、ρの関数としてモデル化され、そのρはフレーム中の非ゼロ量子化DCT係数の数である。そのようなわけで、ビット・レートは、次式により表されることができる:
R=Aρ+B (式1)
ここで、AとBは、定数のモデル化パラメータである。Aは、非ゼロ量子化DCT係数をコード化するために必要な平均ビット数を表すことができ、そしてBは、非テクスチャ情報、例えば、予測モード及び動きベクトル、のために使用するビットを表すことができる。
Nが処理されるビデオ系列中の全フレーム数を表すとする。{Q^}はQPを表す。{A^}は、非ゼロ量子化DCT係数当りの平均ビット数を表す。{B^}は、非テクスチャ情報をコーディングするためのビット数を表す。{ρ^}は、非ゼロ量子化DCT係数の数を表す。{σ^ }は、動き補償された残差のエネルギーを表す。{D^}1回目のパス・コーディングの結果のi番目のフレームの歪を表し、そして(i=1,2,...,N)は、系列のフレームを同定する。“^”によって同定される変数は、第1コーディング・パスによって推定される変数である。識別子“^”のない変数は、同じように名前を付けられた第2パス変数であり、例えば、近似値又は解かれようとしている第2パス変数である。
budgetがビデオ系列に関する全ビット・バジェットを表すとし、そして{Q},{R}と{D}が2回パス・コーディングの際のi番目のフレームのQP、ビット・レート、及び歪を表すとする。それゆえ、問題は、次式によって表されることができる
Figure 0005006327
とDの両者は、予測コーディングが使用されるという事実のためにQ,Q,...,Qの関数である。それに加えて、R(Q^,Q^,...,Q^)=A^ρ^+B^,そしてD(Q^,Q^,...,Q^)=D^(i=1,...,N)である。
フレーム依存性は、前のフレームのQP選択が現在のフレームのレート−歪性能への主な影響を有するという観測に基づいて著しく単純化されることができる。言い換えると、i−テュープル(i-tuple:i個の要素からなる)関数R(Q,Q,...,Q)とD(Q,Q,...,Q)は、2−テュープル関数R(Qi−1,Q)とD(Qi−1,Q)とに約されることができ、その理由は、Q,Q,...,Qi−2の選択が、i番目のフレームに関するレート及び歪についての著しい変化を生じさせないためである。この観測は、図3−6に示されるように、“フットボールQCIFビデオ系列”と呼ばれる系列について検証されてきている。
特に、図3は、45と表示された(QP=10、QP=10)、46と表示された(QP=10、QP=20)、47と表示された(QP=20、QP=10)、及び48と表示された(QP=20、QP=20)を使用する系列の4番目のフレームに対するレート−歪曲線の実験結果をプロットする。図4は、51と表示された(QP=10、QP=10)、52と表示された(QP=10、QP=20)、53と表示された(QP=20、QP=10)、及び54と表示された(QP=20、QP=20)を使用する系列の4番目のフレームに対するレート−QP曲線の実験結果をプロットする。図5は、56と表示された(QP=10、QP=10)、57と表示された(QP=10、QP=20)、58と表示された(QP=20、QP=10)、及び59と表示された(QP=20、QP=20)を使用する系列の4番目のフレームに対するロー−QP曲線の実験結果をプロットする。図6は、61と表示された(QP=10、QP=10)、62と表示された(QP=10、QP=20)、63と表示された(QP=20、QP=10)、及び64と表示された(QP=20、QP=20)を使用する系列の4番目のフレームの歪−QP曲線の実験結果をプロットする。
図3−6の結果により例示される実験に関して、1番目のフレーム(I−フレーム)のQPは5に設定され、そしてQP組み合わせ(10,10)、(10,20)、(20,10)及び(20,20)は、2番目及び3番目のフレームのために使用される。図3−6から、QP(2番目のフレームのためのQP)の選択が4番目のフレームのレート及び歪についてほとんど影響を与えないが、QP(3番目のフレームのためのQP)の選択が4番目のフレームの性能に直接影響することが示される。それゆえ、いかなる重要な品質も犠牲にすることなく、連続するフレームの依存性だけを考慮することによって問題を単純化することができる。
それゆえ、Qi−1とQの候補の全ての組み合わせに対するR(Qi−1,Q)とD(Qi−1,Q)の表を手に入れる場合には、式2の問題は、さらに易しく解かれることができる。以下の議論では、正確な推定モデルは、1回目のパス・コーディングにおいて求められた情報を使用することにより、レート及び歪関数を近似するために提案される。次に、式2の問題は、ラグランジュ緩和を使用して解かれることが可能であり、問題を非拘束問題に変換する。ラグランジュ緩和を使用して問題を変換した後で、非拘束問題は、グラフ理論問題へとマッピングされることができ、そして最短パス検索アルゴリズムを使用して解かれることができる。
歪推定モデルに関して、第1コーディング・パスにおいて、i番目のフレームについて、q=1,2,...,31に対してD(Q^i−1,q)の全ての値を求めることが可能であることが、注目される。それに加えて、σ^ (Q^i−1)の値も、同様に求めることができる。Z.He,Y.Kim及びS.K.Mitraにより提案された歪モデル、“ρ−ドメイン・ソース・モデリングを介したDCTビデオ・コーディングのための低遅延レート制御(Low-Delay Rate Control for DCT Video Coding viaρ-Domain Source Modeling)”、IEEE学会報、ビデオ技術のための回路及びシステム、928−940ページ、2001年8月、に基づいて、次式を得る:
Figure 0005006327
そして
Figure 0005006327
ここで、αはモデル・パラメータである。
図5から、ロー−QP曲線が、現在のフレームのQPによって主に導かれることを観測することができる。言い換えると、ρ(Q^i−1,Q)≒ρ(Qi−1,Q)は、Qが(例えば、15より大きい)大きな数を割り当てられる場合に対して特に成り立つ。用語ローは、本明細書中で定義されるように用語ρを呼ぶ。式3と4から、次式を得ることができる:
Figure 0005006327
式5は、“フットボールQCIFビデオ系列”と呼ばれる系列の初めから3つのフレームをコーディングすることにより実験的に検証される。この実験の結果は、図7と図8に図示される。系列の1番目のフレーム(I−フレーム)は、QP=5を使用してコード化された、そして2番目のフレーム(P−フレーム)は、それぞれQP=5,10,15,20と30を使用してコード化された。図7は、各設定に対する3番目のフレームのD−QP曲線を示す。図7において、設定(I−フレーム、P−フレーム)に対する結果は、次のように番号を付けられる:(5,5)は71と番号を付けられ、(5,10)は72と番号を付けられ、(5,15)は73と番号を付けられ、(5,20)は74と番号を付けられ、そして(5,30)は75と番号を付けられる。
図8において、2番目のフレーム(P−フレーム)に対してQP=10を設定することにより生成される3番目のフレームの実際のD−QP曲線は、2番目のフレームに対するQP=5,15,20と30を使用するケースにより、そして式5を使用することにより生成されるデータから推定されるD−QP曲線と比較される。図8では、設定(I−フレーム、P−フレーム)に対する結果は、次のように番号を付けられる:実際の(5,10)は81と番号を付けられ、予測された(5,5)は82と番号を付けられ、予測された(5,15)は83と番号を付けられ、予測された(5,20)は84と番号を付けられ、そして予測された(5,30)は85と番号を付けられる。この結果は、式5が非常に正確であることを示す。
式5のσ (Qi−1)を推定するために、Mはフレーム中の全ピクセルを表すために使用され、y(k=1,...,M)はフレーム中のk番目のオリジナル・ピクセルを、xは前のフレーム中のk番目のオリジナル・ピクセルを、x^
Figure 0005006327
は1回目のパス・コーディングと2回目のパス・コーディングにおける前のフレームからの対応する動き補償されたピクセルを表す。ここで、特別なケースが考察され、そこでは、全てのビデオ・ブロック(例えば、マクロブロック)がゼロ動きベクトルを使用する、それはx^
Figure 0005006327
が1回目のパス・コーディングと2回目のパス・コーディングにおける前のフレームの対応する再構成されたピクセルであることを意味する。このケースでは、
Figure 0005006327
同様に、
Figure 0005006327
式6と式7は、次式をもたらす:
Figure 0005006327
それは、画像データの分布が、ガウス分布又はラプラス分布になると仮定される場合に
Figure 0005006327
という理由のためである。
それゆえ、
Figure 0005006327
そして、したがって:
Figure 0005006327
式6から、レート関数のフレーム間依存性が適度に低く、そして線形関係が動き補償された残差の偏差と参照フレームのコーディング・エラーとの間に存在することは、観測されることができる。しかしながら、現在のフレームのレートがその前のフレームのQP選択にある依存性を有することが、観測されることができる。
{A},{B},{ρ}を非ゼロ量子化DCT係数当りの平均ビット数、非テクスチャ情報をコーディングするためのビット数、及び2回目のパス・コーディングの結果として非ゼロ量子化DCT係数の数として表す。明らかに、R=Aρ+Bである。下記の本文では、これらのパラメータは、次のように経験的にモデル化される:
Figure 0005006327
式11では、ρの値は、動き補償された残差のエネルギー(それは前のフレームのQPに依存する)及び現在のフレームQPに依存する。(図3−6の結果により例示される同じ実験のように)“フットボールQCIF”系列をコーディングすることにより、そして2番目のフレームと3番目のフレームの両者をQP=10に設定しそして式11を使用して生成された1回パス・データから(2番目のフレームに対してQP=10、3番目のフレームに対してQP=20を用いて)4番目のフレームのロー−QP曲線を推定することにより、式11の精度は、検証されることができる。図9に示されたように、推定されたロー−QP曲線91は、実際のロー−QP曲線92に非常に近い。同様に、非テクスチャ・ビットの数(B)は、式12によってモデル化されるので、残差のエネルギー及び現在のフレームのQPに同様に依存する。式13を使用して、ρ^の値に基づいてAの値を制御することができる。Aの値は、高ビット・レートのケースでは非常に安定である。しかしながら、ρ^が非常に小さいときに、A^は、過度に大きくなるはずである。
ここまでは、本明細書は、Qi−1とQの候補の全ての組み合わせに対してR(Qi−1,Q)とD(Qi−1,Q)とを推定するためのモデルを展開してきた。このモデルが正確であると仮定すると、式2の問題に対する所望の解を展開することが可能である。特に、ラグランジュ緩和アプローチ使用することが可能であり、そしてそれは制約された問題の凸包近似に導く。
次式としてラグランジュ・コスト関数を定義する:
Figure 0005006327
ここで、λはラグランジュ乗数である。λが存在し、その結果
Figure 0005006327
がR({Q)=Rbudgetに導く場合には、{Qが式2に対する所望の解である。それゆえ、式2を解くタスクは、コスト関数Jλ({Q})を最小にする非制約問題に対する所望の解を見出し、そしてその制約を満足する近似のラグランジュ乗数を選択する簡単なタスクと等価である。
問題を解くためのアルゴリズムを実行するために、コスト関数G(Qk−1,Q)を定義することができ、それはQk−1とQが(k−1)番目とk番目のフレームに対する判断ベクトルであることが与えられと、k番目のフレームを含むそこまでの最小全ビット・レートと歪とを表す。このケースでは、k=N、G(QN−1,Q)は、全てのフレーム対する最小全ビット・レートと歪とを表し、そしてそれゆえ、
Figure 0005006327
である。
効率的なアルゴリズムを導くための1つの鍵となる観測は、(k−2)番目と(k−1)番目のフレームに対する判断ベクトルQk−2とQk−1及びコスト関数Gk−1(Qk−2,Qk−1)が与えられると、次の判断ベクトルQの選択は、前の判断ベクトルQ,Q,...,Qk−3の選択とは無関係である、という事実である。これは、コスト関数が次式として帰納的に表されることができることを意味する:
Figure 0005006327
上記のコスト関数の帰納的な表示は、過去のステップに従属するプロセスの今後のステップを作り、それはダイナミック・プログラミングの基礎である。
問題は、方向性非循環グラフ(DAG:directed acyclic graph)において最短経路を見出すグラフ理論問題へと変換されることができる。そのようなアルゴリズムは、指数関数的な演算上の複雑さを有する網羅的な検索アルゴリズムよりもはるかに効率的である。
実験は、複数のビデオ・チップについて行われた、そしてそのような実験の結果は、下記の文書において検討される。最初に、実験は、推定された歪、A、Bとρを2回目のパス・コーディングにおけるそれらの実際の値とを比較することにより提案されたレート及び歪モデルの精度を検証した。図10−13に示されるように、80kbpsにおける“親子(Mother and Daughter)”系列として呼ばれる系列をコーディングする際の結果は、提案された推定モデルが極めて正確であることを立証する。
図10は、コード化された“親子”系列の推定された歪101と実際の歪102のグラフである。図11は、コード化された“親子”系列に関するAの推定された値(111と番号を付けられる)をAの実際の値(112と番号を付けられる)と比較する。図12は、コード化された“親子”系列に関するρの推定された値(121と番号を付けられる)をρの実際の値(122と番号を付けられる)と比較する。図13は、コード化された“親子”系列に関するBの推定された値(131と番号を付けられる)をBの実際の値(132と番号を付けられる)と比較する。実際の値に対して相対的な推定された値の精度は、図10−13から明白である。
第2の実験では、“親子”QCIF系列は、40kbpsから120kbpsのビット・レートの範囲でコード化された、そしてその結果は、2つの別のアプローチと比較された:(1)フレーム−レベル・グリーディ・レート制御、それはこれから来るフレームが一様に分布するテクスチャの複雑さを有し、そしてそれゆえ、それは残りのフレームを今後の複数のフレームの間に等しく割り当てる、と仮定する;(2)第1パスからのモデル・パラメータを使用する2回パス・レート制御。図14に示される結果は、本明細書中のアプローチが全てのビット・レート範囲で他の2つのアプローチに対して0.5−0.7dBの利益を得ることを示す。図14では、フレーム−レベル・グリーディ・レート制御アプローチは、141と番号を付けられ、1回パス・モデル・パラメータを再使用するアプローチは、142と番号を付けられ、そして本明細書中で規定される正確なモデルを用いる提案されたアプローチは、143と番号を付けられる。提案されたアプローチの結果の改善は、図14において明らかである。
第3の実験では、3つのビデオ場面:高いアクティビティ(早い動作)を含んでいる“ステファン”と呼ばれる標準QCIFテスト系列の最初の100フレーム、低いアクティビティ(遅い動作)を含んでいる“コンテナ” と呼ばれる標準QCIFテスト系列の最初の100フレーム、及び中間のアクティビティ(局部的な顔の動き)を含んでいる“カーフォーン” と呼ばれる標準QCIFテスト系列の最初の100フレーム、をシミュレーションすることによって構成することにより、ビデオ・クリップは、異なるコンテントの複雑性を有する様々なセグメントを含む。提案されたアプローチは、前の実験で使用した2つの別のアルゴリズムと比較して利益をもたらした。その結果は、図15に示され、そして提案されたアルゴリズムが他のアプローチに対して最大1.7dBの有意なゲインを有することを示す。この改善は、ビット・レートが増加するときに減少する。提案されたアルゴリズムが全体のビデオ・クリップに対してもっと最適のビット割当て解を見出すために候補空間の端から端まで検索することの利点を有するという理由で、改善が期待される。図15では、フレーム−レベル・グリーディ・レート制御アプローチは、151と番号を付けられ、1回パス・モデル・パラメータを再使用するアプローチは、152と番号を付けられ、そして本明細書中で規定される正確なモデルを有する提案されたアプローチは、153と番号を付けられる。提案されたアプローチの結果の改善は、図15において明らかである。
上記に概要を示された技術と図3−15に例示された結果は、本明細書にしたがったモデル−ベースの2回パス・レート制御アルゴリズムの1つの実施形態を示す。再び、前のフレームの量子化パラメータ選択が現在のフレームのレート−歪性能への主な影響を有することを観測することによって、フレーム依存性問題は、上手く単純化され、そしてサイズ候補空間は、指数関数から多項式へと大きく削減された。その後で、1組の正確なモデルが実際のコーディングの間のレート及び歪状態を近似するために展開された。これらのモデルは、候補空間を生成するため、そして問題をグラフ理論問題へとマッピングするための能力を直接的に利用可能にする。ラグランジュ緩和とダイナミック・プログラミングを用いて、元々の制約問題は、非制約問題へと変換され、そして最短経路検索アルゴリズムにより解かれた。実験結果は、他の既存のレート制御アルゴリズムと比較して最大1.7dBの有意なゲインを示す。
図16は、品質変動がビデオ系列のフレームに対して最小にされる本明細書の別の1実施形態にしたがった2回パス・レート制御されたビデオ・コーディング技術を説明するフロー図である。図2と同様に、図16は、図1のビデオ・コーディング・デバイス10の関係で説明される。図16に示されるように、ビデオ・コーダ14は、第1のQPのセットを使用してビデオ系列のフレームをコード化する(160)。レート制御ユニット30は、次に第1コーディング・パスのコード化されたビデオ系列に関するレート−歪統計値を求める(161)。ビデオ・コーダ14の様々な他のユニット24,26と28は、レート制御ユニット30によって同定された第1のQPのセットを使用して第1コーディング・パスにおいて与えられることができる。第1のQPのセットは、様々な異なる方法で選択される、又は任意のレート制御アルゴリズムにしたがって選択されることができる。1つの例では、第1のQPのセットは、いわゆる“グリーディ”アルゴリズムに基づいてレート制御ユニット30によってダイナミックに選択され、そのアルゴリズムは系列内のフレーム数に関係するレート・バジェットに基づいてフレームのためのQPを選択するが、次に残りのレート・バジェットを残りの複数のフレームにわたり再割り当てする。他の1つの例では、同じQPが、第1パスにおいて全てのフレームに対して事前に選択されることができ、そして使用されることができ、そのケースでは、第1のQPのセット中のQPは、互いに同じである。しかしながら、別の技術が、第1コーディング・パスのための第1のQPのセットを規定するために使用されることができる。
第1コーディング・パスの後で、レート制御ユニット30は、第1コーディング・パスによって求められたレート−歪統計値に基づいてビデオ系列のレート−歪特性を推定する。一般に、レート−歪特性を推定するプロセスは、レート−歪統計値にレート・モデルと歪モデルとを適用することを含む。レート制御ユニット30は、次に、そのレート−歪特性を使用して品質変動を実質的に最小にすることにより第2コーディング・パスのための第2のQPのセットを選択する(163)。第2のQPのセットを選択する際に、レート制御ユニット30は、最小化した品質変動を有する低い平均フレーム歪を実現するために、実質的に最小化した品質変動でフレームの品質を同様に実質的に最高にすることができる。
第2のQPのセットは、第1のQPのセットとは異なり、そしてコーディングの品質を向上するために選択される。このケースでは、第2のQPのセットは、全系列にわたり歪を最小にしないことがあるが、ビデオ品質を劣化させることがある別の問題を扱う。具体的に、図16の技術は、異なるフレームのコーディング品質における変動を最小にする、例えば、本技術はレート−歪変動を最小にする。このようにして、フリッカリング問題は、低減される又は除去されることができる。そうでなければ、フリッカリングは、コーディング品質が2つの連続するフレーム間で急激に変化するときに生じることがある。一旦、レート制御ユニット30が品質変動を実質的に最小にすることにより(そしてその最小化した品質変動で品質をおそらく最高にすることにより)第2のQPのセットを選択してしまうと、ビデオ・コーダ14は、第2のQPのセットを使用してビデオ系列をコード化する(164)。
図2の技術のように、図16の技術では、第1コーディング・パスは、低い方の品質のコーディング・パスであり得るが、正確なモデリングを適用するために必要な情報を提供し、そしてビデオ系列のコーディングの際にフレーム間依存性を考慮することができる。レート−歪の最小化は、多種多様な方法で実行されることができる。1つの例では、品質変動を実質的に最小化することは、ビデオ系列に関するレート・バジェットにおける歪変動を実質的に最小化することを含む。他の1つの例では、品質変動を実質的に最小化することは、ビデオ系列に関するレート・バジェットにおける第2のQPのセット中のQP変動を実質的に最小化することを含む。しかも他の1つの例では、品質変動を実質的に最小化することは、ビデオ系列に関するレート・バジェットにおける歪変動及びレート変動を実質的に最小化することを含む。さらに他の1つの例では、品質変動を実質的に最小化することは、ビデオ系列のフレームに関係する最大歪値を最小化することを含む。さらに他の1つの例では、品質変動を実質的に最小化することは、ビデオ系列のフレームに関係する歪値をプログラム可能な歪しきい値よりも下に減少させることを含む。この実施形態のさらなる詳細は、下記の文章において説明される。
上記に概要を示された技術のように、下記の文章において概要を示される技術は、2回パス・フレーム−レベル・レート制御方式を指向した一定−ビデオ−品質を提供する。しかしながら、下記の文章では、本技術は、最小最大(MINMAX)歪基準に基づく。この枠組みで、ビデオ系列に関するビット・バジェットが与えられると、コーダは、各フレームに対するコーディング・パラメータをダイナミックに調節して、ピークの最大フレーム歪を最小にする、それは再構成されるビデオ系列の一定品質を間接的に保証する。この枠組みは、指定される変動制約でコード化された系列内のフレーム−レベル・ビット・レート変動の制御を同様に可能にする。しきい値の繰り返し調節に基づいて、コーダは、ビット・レート制約を満足するコーディング・パラメータのセットを見出すことができる。ダイナミック・プログラミングは、コーディング効率を改善するために適用される。この提案される枠組みは、ビット・バジェットで制約されるビデオ通信アプリケーションに対する良い選択を提供することができ、そのゴールは、許容可能なフレーム毎のビデオ品質(すなわち、良い平均PSNR)を維持しつつ、最低の可能な歪であるがほとんど一定の歪を実現することである。しかしながら、上記したように、品質変動を実質的に最小にするプロセスは、同様に複数の別の方法で行われることができる。
下記は、正確なレート・モデル及び歪推定モデルを展開して、2回目のパス・コーディングにおける実際的なレート及び歪ステータスを近似する。モデルは、再び、現在のフレームのレート及び歪がその前のフレームのQPに大きく依存すること、そして直前のフレームよりも早い時期の前のフレームのQP選択が現在のフレームの性能にほとんど影響しないことの観測に基づく。そのモデル及び観測は、2回パス・アプローチにおけるQP選択のプロセスの計算上の複雑さの著しい減少を可能にする。その問題をグラフ理論問題へとマッピングすることによって、最短経路アルゴリズムが、最適な解を効率的に見出すために適用される。提案される技術は、シミュレーションされそして試験されてきている。実験結果は、グリーディ・フレーム−レベル・レート制御アルゴリズムに比較してピーク信号対ノイズ比(PSNR:peak signal to noise ratio)変動の最大70%までの著しい減少を示している。
“総合ビデオ品質”に関して複数の代わりの意味があり、2、3だけの名前をあげると、例えば、フレーム当りの良い平均品質、一定のフレーム品質、そして優れた認識できるビデオ品質である。しかしながら、一般に、全ての態様を考慮に入れるために利用可能な標準化され統一されたビデオ品質測定はない。一般に、最小平均歪(MINAVE)基準が、ビデオ歪を測定するために多くの場合使用される。フレーム−レベル・レート制御アルゴリズムは、デコードされたビデオ系列の最良の平均PSNRを実現するための試みにおいて提案されてきている。しかしながら、MINAVE基準を用いる従来の解は、時々、フレーム全体にわたり一様でない歪に導き、それは複数のフレーム間の急激な品質の変化に起因する“フリッカリング”問題を引き起こす。ある最近の研究は、許容できるフレーム当りのPSNRを維持しつつ、系列全体にわたる歪変化をどのように減少させるかについて焦点を当てている。しかしながら、これらのアプローチは、厳しい遅延制約を有するリアル・タイム・アプリケーションのために主に設計されており、そしてそれゆえ、その性能は多くの場合良くない。
MINAVEアプローチに対する代わりのアプローチとして、最小最大(MINMAX)歪アプローチは、そのゴールがほぼ一定の歪を実現することであるアプリケーションに対して良い選択であり得る。このアプローチの背後にある原理は、最大ソース歪を最小にすることによって、1つのソース歪も極端に大きくなることがなく、そしてそれゆえ、全体の品質は、極めて一定である。本発明は、MINMAX基準に基づく2回パス一定品質レート制御アルゴリズムを提案する。正確なレート及び歪推定モデルは、フレーム−レベルQP選択のために設定される。そのモデルは、再び、フレーム歪がその前のフレームの量子化レベルに大きく依存する、ところが前のフレームよりも早いフレームの量子化選択が現在のフレームのフレーム歪にほとんど影響しないことの観測に基づく。本明細書で説明されるモデルでは、2回目のパス・コーディングの間の実際の歪は、(同じQPを使用する)第1パスにおける歪の関数と、第1パスにおける動き補償された残差のエネルギーと、そして第1パスにおける前のフレームの歪とにより近似されることができる。それに加えて、本明細書は、提案したレート制御方式のレート変動を減少させることの影響を検討し、そして両方のタスクを達成するための解を提案する。
提案した技術は、ハイブリッドの枠組みを表現することができ、その枠組みは、最小最大歪基準を使用してコーディング・パラメータをダイナミックに選択することによりPSNRとビット・レートの両者において低い変動を達成することが可能である。しかも、その枠組みは、フレーム・レート及び歪についての正確な推定モデルのセットとともに働くことができる。計算における近似は、サンプリングと空間を指数関数から多項式へと減少させることによって、コーディング性能を効率的に高速化することができる。
この実施形態における問題は、1回パス・コーディングの間に集められた統計値に基づいて、許容可能な総合平均PSNRを維持しつつそしてあるレート変動制約を満足しつつ、最小の品質変動を有するデコードされたビデオ系列を実現するために、各フレームに対する量子化パラメータを選択することである。1回パス・コーディングをどのようにして行うかの問題が直接関係するとはいえ、問題を単純化するために、グリーディ・フレーム−レベル・ビット割当てアルゴリズムが第1パスにおいてフレームをコード化するために使用されることを仮定することができる。しかしながら、別のQP選択技術が、第1パスにおいて代わりに使用されることができる。
フレーム内の非ゼロ量子化DCT係数の数である、ρの関数としてのフレーム・ビット・レートに関するモデルは、次式により表されることができる:
R=Aρ+B,
ここで、AとBは一定のモデリング・パラメータであり、そしてAは非ゼロ量子化DCT係数をコード化するために必要な平均ビット数を表し、そしてBは非テクスチャ情報、例えば、予測モード及び動きベクトル、によるビットを表す。
Nが処理されたビデオ系列内の全フレーム数を表すとし、そして{Q^},{A^},{B^},{ρ^},{σ^ },及び{D^}(i=1,2,...,N)がそれぞれ量子化パラメータQP、非ゼロ量子化DCT係数当りの平均ビット数、非テクスチャ情報をコーディングするためのビット数、非ゼロ量子化DCT係数の数、動き補償された残差のエネルギー、及び1回目のパス・コーディングの結果としてi番目のフレームの歪、を表すとする。上記で使用されたように、“^”によって識別される変数は、第1コーディング・パスによって推定される変数である。識別子“^”のない変数は、一般に第2パス変数であり、例えば、近似値又は解かれようとしている第2パス変数である。
budgetがビデオ系列に関する全ビット・バジェットを表すとし、Rdev_thresholdが実際のフレーム・ビット・レートの平均ビット・レートからの最大の許容可能な偏差を表すとし、そして{Q},{R}と{D}が2回パス・コーディングの際のi番目のフレームのQP、ビット・レート、及び歪を表すとする。それゆえ、問題に対する表示は:
Figure 0005006327
ここで、RとDの両者は、予測コーディングの性質のためにQ,Q,...,Qの関数である。それに加えて、R(Q^,Q^,...,Q^)=A^ρ^+B^,そしてD(Q^,Q^,...,Q^)=D^(i=1,...,N)である。
式17では、歪の平均と偏差の両者は、系列に関する所与のビット・バジェットにおいて最小にされる。しかしながら、式17は、解を保証しない、その理由は、平均歪を最小にするQP選択が歪の偏差を最小にできないことがあるため、そしてその逆も同様である。重み付けアプローチは、式17の問題を次式の形式へと変形するために使用されることができる:
Figure 0005006327
ここで、α∈[0,1]は、重み付けされた因子であり、それは歪の平均と偏差の相対的な重要性を規定する。予想されるように、αを増加させることは、増加した平均歪のコストにおける歪偏差を減少させる。しかしながら、αの決定は、ユーザの情報交換なしでは極めて困難である。
この開示にしたがって、問題は、次式により形式化されることができる:
Figure 0005006327
そのうえ、問題は、次式のようにさらに単純化されることができる:
Figure 0005006327
それは、目標の結果が一定のビデオ品質を実現することであるという仮定に基づき、そして第1パスと第2パスとの間の平均歪に大きな違いを予想しないという仮定に基づく。
再び、前のフレームのQP選択が現在のフレームのレート−歪性能に重大な影響を持たないという観測に基づいて、フレーム依存性は単純化されることが可能である。言い換えると、本開示にしたがったフレーム依存性の観測が与えられると、i−テュープル関数R(Q,Q,...,Q)とD(Q,Q,...,Q)は、2−テュープル関数R(Qi−1,Q)とD(Qi−1,Q)とに約すことができ、その理由は、Q,Q,...,Qi−2の選択が、i番目のフレームに関するレート及び歪についての著しい変化を生じさせないはずであるためである。それゆえ、R(Qi−1,Q)とD(Qi−1,Q)の表が、Qi−1とQの候補の全ての組み合わせに対して得られる場合には、式20の問題は、問題を次式へと直接単純化して解くことができる:
Figure 0005006327
式21の問題は、最初に別の問題を解くことにより解かれることが可能であり、すなわち:
Figure 0005006327
これは、歪がCODECに関してビット・レートの非増加関数であることを仮定することによって行われることができる。言い換えると、利用可能なビット数を増加させることによって、CODECの性能は、同じままで留まるか改善するかのどちらかである。それゆえ、Dmaxがゼロから無限大、R(Dmax)、まで変化するとき、式22に対する解は、図17に示された階段状曲線175の跡をたどる。それゆえ、二分割は、R(D max)≦Rbudgetを満足するD maxを見つけるために使用されることができ、そしてそれによって、式21の問題を解く。
式22を解くためのアルゴリズムを与えるために、コスト関数C(Qk−1,Q)を作ることができ、それは、Qk−1とQが(k−1)番目とk番目のフレームに対するQPであることが与えられると、式22の歪制約を有するk番目のフレームを含むk番目のフレームまでの最小全レートを表す。そのように、
Figure 0005006327
に対する解は、同様に、式22に対する所望の解である。
効率的なアルゴリズムを導き出すための1つの鍵となる観測は、(k−1)番目とk番目のフレームに対する判断ベクトルQk−2とQk−1、及びコスト関数Ck−1(Qk−2,Qk−1)を与えられると、次の判断ベクトルQの選択は、前の判断ベクトルQ,Q,...,Qk−3の選択とは無関係である、という事実である。これは、コスト関数が次式として帰納的に表されることができるために真実である:
Figure 0005006327
上記のコスト関数の帰納的表示は、ダイナミック・プログラミングの基礎である前のステップとは無関係に最適化プロセスの任意の今後のステップを行う。
式23によって定義されるコスト関数を用いて、この問題は、方向性非循環グラフ(DAG)において最短経路を見出すグラフ理論問題へと変換されることができる。この解は、網羅的な検索アルゴリズムの指数関数的な計算上の複雑さよりもはるかに有効である。
推定モデルは、レート及び歪に対して使用されることができる。すなわち:
Figure 0005006327
式25−29において推定されるレート及び歪を式22−24に置き換えることにより、問題又は式5は、効率的に解かれることが可能である。
実験は、ビット・レート範囲が60kbpsから120kbpsである、“テーブル・テニス”、“フォアマン”、及び“ダンサー”として識別されるビデオ系列を含む複数の標準ビデオ・テスト系列に実施された。結果は、下記の文章で報告される。
実験の第1セットは、ビット・レート変動制約を緩めることにより図16に概要を示されたアルゴリズムの一定品質の特徴に注目した。上記に概要を示された提案のMINMAXアプローチは、他の2つのアプローチと比較された、それらは(1)フレーム−レベル・グリーディ・レート制御、それは今後現れるフレームが一様に分布されたテクスチャの複雑さを有し、それゆえ残りのビットを今後の複数のフレームの間に一様に割り当てることを仮定する、及び(2)より高いPSNR期待値を有するMINMAXアプローチ、すなわち、同様に一定品質を求めるが、第2パスにおいて実現されるべき平均PSNRが第1パスのそれと同じレベルであることを要求するMINMAXアプローチ、である。問題の定式化は、式30に示され、次式の通りである;
Figure 0005006327
ここで、εは非常に小さな数である。式30は、平均PSNRについての追加の制約を除いて、式21に極めて類似する。
図18−20では、“フォアマン”系列についてのテスト結果が示される。この例では、全ての3つのアプローチは、類似のレート−歪性能を有するが、MINMAXアプローチはフレームPSNRの標準偏差を50%だけ削減した。詳細なPSNR分布は、図20に示され、MINMAXアプローチを使用することによるPSNR変動の低減を立証する。図18では、グリーディ・フレーム−レベル・レート制御アルゴリズムは、181と番号を付けられ、提案されたMINMAXアプローチは、182と番号を付けられ、そしてより高いPSNR期待値を有する変形MINMAXアプローチは、183と番号を付けられている。図19では、グリーディ・フレーム−レベル・レート制御アルゴリズムは、191と番号を付けられ、提案されたMINMAXアプローチは、192と番号を付けられ、そしてより高いPSNR期待値を有する変形MINMAXアプローチは、193と番号を付けられている。図20では、グリーディ・フレーム−レベル・レート制御アルゴリズムは、201と番号を付けられ、提案されたMINMAXアプローチは、202と番号を付けられている。
“テーブル・テニス”系列についてのテスト結果が、図21−23に示される。予想されるように、提案されたMINMAXアプローチは、より低い平均フレームPSNRを有するが、PSNR変動をグリーディ・アルゴリズムから60−70%だけ削減する。より高いPSNR期待値を有するMINMAXアプローチは、PSNR変動の20−30%の削減を有するグリーディ・アルゴリズムのそれと同様のPSNRを得た。図21では、グリーディ・フレーム−レベル・レート制御アプローチは、211と番号を付けられ、提案されたMINMAXアプローチは、212と番号を付けられ、そしてより高いPSNR期待値を有する変形MINMAXアプローチは、213と番号を付けられている。図22では、グリーディ・フレーム−レベル・レート制御アプローチは、221と番号を付けられ、提案されたMINMAXアプローチは、222と番号を付けられ、そしてより高いPSNR期待値を有する変形MINMAXアプローチは、223と番号を付けられている。
図23は、ビット・レートが120kbpsに等しいときに、“テーブル・テニス”系列における詳細なPSNR分布を示しているグラフである。図24は、ビット・レートが120kbpsに等しいときに、“テーブル・テニス”系列における詳細なQP分布を示しているグラフである。図23では、グリーディ・フレーム−レベル・レート制御アプローチは、231と番号を付けられ、提案されたMINMAXアプローチは、232と番号を付けられている。図24では、グリーディ・フレーム−レベル・レート制御アプローチは、241と番号を付けられ、提案されたMINMAXアプローチは、242と番号を付けられている。
図25と図26は、5000から25000の範囲内のビット・レート変動しきい値の様々な設定を用いて120kbpsにおいて“テーブル・テニス”系列をコーディングすることによってシステム性能へのビット・レート変動制約の影響を例示する。図25は、特に、ビット・レート変動しきい値の関数としてPSNRの標準偏差の曲線251を図示する。予想されるように、しきい値が図25に示されたように増加するとPSNR変動は減少する。
詳細なレート変動は、同様に図26で比較される。具体的に、曲線261は、10000であるレート変動しきい値に対応し、そして曲線262は、25000であるレート変動しきい値に対応する。明らかに、より狭いしきい値を用いると、系列に関する結果のビット・レートは、より平滑になる。このしきい値を使用することによって、本技術が、仮想バッファを使用するようにビット・レート変動をダイナミックに制御することができ、バッファのオーバーフローとアンダーフローを回避することができ、同様にコード化されたビデオ系列の一定ビデオ品質特性を維持することができることに気付くことは、重要である。
記載されたMINMAXフレーム−レベル・レート制御アルゴリズムは、ピーク最大フレーム歪を最小にするために使用されることができ、それは間接的に再構成されるビデオ系列の一定品質を保証する。ビデオ系列のレート変動は、ビデオ・コーディング・デバイス中のプログラム可能なしきい値によって制御されることが可能である。前のフレームの量子化パラメータ選択が現在のフレームのレート−歪性能に重大な影響を有するという観測に基づいて、ビデオ・コーディング・デバイスは、正確なレート及び歪モデルの集合を用いて開発されることが可能である。その観測は、フレーム依存性問題を単純化し、そしてそれとともに候補空間のサイズを指数関数から多項式へと削減する。図17−26のグラフに説明された実験結果は、従来のグリーディ・アルゴリズム・アプローチと比較してビデオ系列全体にわたりPSNR標準偏差の最大70%までの著しい削減を示す。
複数の実施形態が説明されてきている。特に、“2回パス”アプローチを使用する、様々なレート制御技術が、提案されてきており、そこでは、第1コーディング・パスがビデオ系列の特性を推定するために使用され、そしてその推定された特性が第2パスのための量子化パラメータ(QP)の選択を改善するために次に使用される。より詳しくは、本明細書と矛盾のない2つの基本的な選択肢が、提案されてきている。第1のケースでは、第1パスの推定されたレート−歪特性は、ビデオ系列のフレームの歪を最小にする方法で第2パスのためのQPを選択するために使用される。第2のケースでは、第1パスの推定されたレート−歪特性は、ビデオ系列の複数のフレーム間の品質変動を最小にする方法で第2パスのためのQPを選択するために使用される。
本明細書中に記載された技術は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの組み合わせとして与えられることができる。ソフトウェアにおいて与えられる場合、本技術は、プログラム・コードを備えるコンピュータ読み取り可能な媒体に向けられることができ、そのプログラムは、ビデオ系列をコード化するデバイスにおいて実行されるときに、本明細書中に記載された1又はそれより多くの技術を実行する。そのケースでは、コンピュータ読み取り可能な媒体は、(RAM:random access memory)を含むことができ、例えば、シンクロナス・ランダム・アクセス・メモリ(SDRAM:synchronous random access memory)、読み出し専用メモリ(ROM:read only memory)、不揮発性ランダム・アクセス・メモリ(NVRAM:non-volatile random access memory)、電気的消去可能ROM(EEPROM:electrically erasable ROM)、フラッシュ・メモリ、及びその他である。
プログラム・コードは、コンピュータ読み取り可能な命令の形式でメモリに記憶されることができる。そのケースでは、DSPのようなプロセッサは、本明細書中に記載された1又はそれより多くの技術を実行するためにメモリ中に記憶された命令を実行することができる。あるケースでは、本技術は、DSPによって実行されることができ、そのDSPはコーディング・プロセスを加速するために様々なハードウェア・コンポーネントを呼び出す。別のケースでは、ビデオ・コーダは、マイクロプロセッサ、1又はそれより多くの用途特定集積回路(ASIC:application specific integrated circuit)、1又はそれより多くのフィールド・プログラマブル・ゲート・アレイ(FPGAs:field programmable gate arrays)、又はある別のハードウェア−ソフトウェアの組み合わせとして搭載されることができる。
2つのアプローチが別々に記載されているが、その2つのアプローチの様々な態様は、同様に組み合わせで使用されることができる。したがって、異なる技術の様々な態様は、本発明により予想されるさらに別の実施形態に統合されることができる。同様に、2回パス・アプローチが記載されてきているが、より多くのパスでさえも、しかも本明細書にしたがって実行されることができる。言い換えると、本明細書は、2回パス・アプローチに限定されず、少なくとも2つのコーディング・パスがそこで使用されるいずれかの複数回パス・アプローチにさらに広範に適用可能である。これらの実施形態及び他の実施形態は、特許請求の範囲の範囲内である。
図1は、本明細書にしたがった具体例のビデオ・コーディング・デバイスを例示するブロック図である。 図2は、レート−歪特性があるビデオ系列に関する量子化パラメータを規定するために推定されそして使用される本明細書の1実施形態にしたがった2回パス・レート制御されるビデオ・コーディング技術を説明するフロー図である。 図3は、本明細書の技術の一態様を説明するデータのグラフである。 図4は、本明細書の技術の一態様を説明するデータのグラフである。 図5は、本明細書の技術の一態様を説明するデータのグラフである。 図6は、本明細書の技術の一態様を説明するデータのグラフである。 図7は、本明細書の技術の一態様を説明するデータのグラフである。 図8は、本明細書の技術の一態様を説明するデータのグラフである。 図9は、本明細書の技術の一態様を説明するデータのグラフである。 図10は、本明細書の技術の一態様を説明するデータのグラフである。 図11は、本明細書の技術の一態様を説明するデータのグラフである。 図12は、本明細書の技術の一態様を説明するデータのグラフである。 図13は、本明細書の技術の一態様を説明するデータのグラフである。 図14は、本明細書の技術の一態様を説明するデータのグラフである。 図15は、本明細書の技術の一態様を説明するデータのグラフである。 図16は、品質変動がビデオ系列のフレームに対して最小にされる本明細書の1実施形態にしたがった2回パス・レート制御ビデオ・コーディング技術を説明するフロー図である。 図17は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図18は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図19は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図20は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図21は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図22は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図23は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図24は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図25は、本明細書の技術の一態様を説明するデータのさらなるグラフである。 図26は、本明細書の技術の一態様を説明するデータのさらなるグラフである。

Claims (26)

  1. 第1コーディング・パスにおいて第1の量子化パラメータ(QP)のセットを使用してビデオ系列のフレームをコード化するための手段と、
    該第1コーディング・パスの該コード化されたビデオ系列に関するレート−歪統計値を求めるための手段と、
    該レート−歪統計値に基づいて該ビデオ系列のレート−歪特性を推定するための手段と、及び
    該推定したレート−歪特性に基づいて該ビデオ系列中の該フレームの第2コーディング・パスのために第2のQPのセットを選択するための手段と、
    を具備し、
    前記推定するための手段は、該レート−歪特性を推定するために該レート−歪統計値にレート・モデルと歪モデルとを適用し、
    前記レート・モデルは、次式により与えられるモデルに対応する:
    =(A)(ρ)+B
    ここにおいて、該歪モデルは、次式により与えられるモデルに対応する:
    Figure 0005006327
    そしてここにおいて、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、そして添字“i−2”は該ビデオ系列のi−2番目のフレームに関するパラメータを識別する、ここにおいて、“^”表記は第1パスの変数であるとしてそれぞれの変数を規定し、そして“^”のない表記は第2パスの変数であるとしてそれぞれの変数を規定する、ここにおいて、“Q”変数はQPであり、“D”変数は歪モデルであり、“R”変数はレートモデルであり、“σ ”は動き補償された残差のエネルギーを表し、“ρ”変数は非ゼロ量子化DCT係数の数を規定し、“A”変数は非ゼロの量子化離散余弦変換(DCT)係数当りの平均ビット数を表し、“B”変数はテクスチャ情報をコード化するために使用するビット数を表し、そして“M”は該ビデオ系列の該フレーム中のピクセルの数である、
    ビデオ・コーディング・デバイス。
  2. 該第2コーディング・パスにおいて該第2のQPのセットを使用して該ビデオ系列をコード化するための手段をさらに具備する、請求項1のコーディング・デバイス。
  3. 該選択するための手段は、該推定されるレート−歪特性にラグランジュ緩和演算を実行することによって該第2のQPのセットを選択する、請求項1のコーディング・デバイス。
  4. 該選択するための手段は、次式の結果を求めることにより該ラグランジュ緩和演算を実行する:
    Figure 0005006327
    ここにおいて、λはラグランジュ乗数であり、Jはコスト関数であり、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、“Q”変数はQPであり、Dは歪モデルであり、Rはレート・モデルであり、そしてNは整数である、請求項3のコーディング・デバイス。
  5. 該選択するための手段は、該ビデオ系列中の該フレームの歪を最小にすることにより該第2のQPのセットを選択する、請求項1のコーディング・デバイス。
  6. 前記QPを決定するためにレート・バジェットを使用し、そして次に、それぞれのその後のQPを規定するために残りのフレーム全体にわたりその残りのレート・バジェットを再割り当てすることにより、該第1のQPのセットを選択するための該手段をさらに具備する、請求項1のコーディング・デバイス。
  7. 該第1のQPのセット中の複数の該QPは、互いに同じである、請求項1のコーディング・デバイス。
  8. 第1コーディング・パスにおいて第1の量子化パラメータ(QP)のセットを使用してビデオ系列のフレームをコード化すること;
    該コード化されたビデオ系列に関するレート−歪統計値を求めること;
    該レート−歪統計値に基づいて該ビデオ系列のレート−歪特性を推定すること;及び 該推定したレート−歪特性に基づいて該ビデオ系列中の該フレームの第2コーディング・パスのために第2のQPのセットを選択すること、
    を具備し、
    前記レート−歪特性を推定することは、該レート−歪統計値にレート・モデルと歪モデルとを適用し、
    前記レート・モデルは、次式により与えられるモデルに対応する:
    =(A)(ρ)+B
    ここにおいて、該歪モデルは、次式により与えられるモデルに対応する:
    Figure 0005006327
    そしてここにおいて、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、そして添字“i−2”は該ビデオ系列のi−2番目のフレームに関するパラメータを識別する、ここにおいて、“^”表記は第1パスの変数であるとしてそれぞれの変数を規定し、そして“^”のない表記は第2パスの変数であるとしてそれぞれの変数を規定する、ここにおいて、“Q”変数はQPであり、“D”変数は歪モデルであり、“R”変数はレートモデルであり、“σ ”は動き補償された残差のエネルギーを表し、“ρ”変数は非ゼロ量子化DCT係数の数を規定し、“A”変数は非ゼロの量子化離散余弦変換(DCT)係数当りの平均ビット数を表し、“B”変数はテクスチャ情報をコード化するために使用するビット数を表し、そして“M”は該ビデオ系列の該フレーム中のピクセルの数である、方法。
  9. 該第2コーディング・パスにおいて該第2のQPのセットを使用して該ビデオ系列をコード化することをさらに具備する、請求項8の方法。
  10. 該第2のQPのセットを選択することは、該推定されるレート−歪特性にラグランジュ緩和演算を実行することを備える、請求項8の方法。
  11. 該ラグランジュ緩和演算を実行することは、次式の結果を求めることを備える:
    Figure 0005006327
    ここにおいて、λはラグランジュ乗数であり、Jはコスト関数であり、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、“Q”変数はQPであり、Dは歪モデルであり、Rはレート・モデルであり、そしてNは整数である、請求項10の方法。
  12. 該第2のQPのセットを選択することは、該ビデオ系列中の該フレームの歪を最小にすることを備える、請求項8の方法。
  13. 前記QPを決定するためにレート・バジェットを使用し、そして次に、それぞれのその後のQPを規定するために残りのフレーム全体にわたりその残りのレート・バジェットを再割り当てすることにより、該第1のQPのセットをダイナミックに選択することをさらに具備する、請求項8の方法。
  14. 該第1のQPのセット中の複数の該QPは、互いに同じである、請求項8の方法。
  15. ビデオ・コーディング・デバイス中で実行されるときに下記を行うプログラム・コードを具備するコンピュータ読み取り可能な媒体であって、該プログラム・コードは:
    第1コーディング・パスにおいて第1の量子化パラメータ(QP)のセットを使用してビデオ系列のフレームをコード化する;
    該第1コーディング・パスにおいて該コード化されたビデオ系列に関するレート−歪統計値を求める;
    該レート−歪統計値に基づいて該ビデオ系列のレート−歪特性を推定する;そして
    該推定したレート−歪特性に基づいて該ビデオ系列中の該フレームの第2コーディング・パスのために第2のQPのセットを選択する、
    プログラム・コードであり、
    前記プログラム・コードは、該レート−歪特性を推定するために該レート−歪統計値にレート・モデルと歪モデルとを適用し、
    前記レート・モデルは、次式により与えられるモデルに対応する:
    =(A)(ρ)+B
    ここにおいて、該歪モデルは、次式により与えられるモデルに対応する:
    Figure 0005006327
    そしてここにおいて、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、そして添字“i−2”は該ビデオ系列のi−2番目のフレームに関するパラメータを識別する、ここにおいて、“^”表記は第1パスの変数であるとしてそれぞれの変数を規定し、そして“^”のない表記は第2パスの変数であるとしてそれぞれの変数を規定する、ここにおいて、“Q”変数はQPであり、“D”変数は歪モデルであり、“R”変数はレートモデルであり、“σ ”は動き補償された残差のエネルギーを表し、“ρ”変数は非ゼロ量子化DCT係数の数を規定し、“A”変数は非ゼロの量子化離散余弦変換(DCT)係数当りの平均ビット数を表し、“B”変数はテクスチャ情報をコード化するために使用するビット数を表し、そして“M”は該ビデオ系列の該フレーム中のピクセルの数である、コンピュータ読み取り可能な媒体。
  16. 該ビデオ・コーディング・デバイスにおける実行で、該第2コーディング・パスにおいて該第2のQPのセットを使用して該ビデオ系列をコード化するプログラム・コードをさらに具備する、請求項15のコンピュータ読み取り可能な媒体。
  17. 該プログラム・コードは、該推定されるレート−歪特性にラグランジュ緩和演算を実行することによって該第2のQPのセットを選択する、請求項15のコンピュータ読み取り可能な媒体。
  18. 該プログラム・コードは、次式の結果を求めることにより該ラグランジュ緩和演算を実行する:
    Figure 0005006327
    ここにおいて、λはラグランジュ乗数であり、Jはコスト関数であり、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、“Q”変数はQPであり、Dは歪モデルであり、Rはレート・モデルであり、そしてNは整数である、請求項17のコンピュータ読み取り可能な媒体。
  19. 該プログラム・コードは、該ビデオ系列中の該フレームの歪を最小にすることにより該第2のQPのセットを選択する、請求項15のコンピュータ読み取り可能な媒体。
  20. 前記QPを決定するためにレート・バジェットを使用し、そして次に、それぞれのその後のQPを規定するために残りのフレーム全体にわたりその残りのレート・バジェットを再割り当てすることにより、該第1のQPのセットをダイナミックに選択する、請求項15のコンピュータ読み取り可能な媒体。
  21. 該第1のQPのセット中の複数の該QPは、互いに同じである、請求項15のコンピュータ読み取り可能な媒体。
  22. ビデオ系列を記憶するビデオ・メモリ;
    ビデオ・コーディングの期間に該ビデオ系列の少なくとも一部を記憶するローカル・メモリ;及び
    ビデオ・コーダ、
    を具備し、該ビデオ・コーダは、
    第1コーディング・パスにおいて第1の量子化パラメータ(QP)のセットを使用して該ビデオ系列のフレームをコード化すること、
    該第1コーディング・パスの該コード化されたビデオ系列に関するレート−歪統計値を求めること、
    該レート−歪統計値に基づいて該ビデオ系列のレート−歪特性を推定すること、
    該推定したレート−歪特性に基づいて該ビデオ系列中の該フレームの第2コーディング・パスのために第2のQPのセットを選択すること、そして
    該第2コーディング・パスにおいて該第2のQPのセットを使用して該ビデオ系列をコード化すること、
    により該ビデオ系列をコード化するビデオ・コーダであり、
    前記レート−歪特性を推定することは、該レート−歪統計値にレート・モデルと歪モデルとを適用し、
    前記レート・モデルは、次式により与えられるモデルに対応する:
    =(A)(ρ)+B
    ここにおいて、該歪モデルは、次式により与えられるモデルに対応する:
    Figure 0005006327
    そしてここにおいて、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、そして添字“i−2”は該ビデオ系列のi−2番目のフレームに関するパラメータを識別する、ここにおいて、“^”表記は第1パスの変数であるとしてそれぞれの変数を規定し、そして“^”のない表記は第2パスの変数であるとしてそれぞれの変数を規定する、ここにおいて、“Q”変数はQPであり、“D”変数は歪モデルであり、“R”変数はレートモデルであり、“σ ”は動き補償された残差のエネルギーを表し、“ρ”変数は非ゼロ量子化DCT係数の数を規定し、“A”変数は非ゼロの量子化離散余弦変換(DCT)係数当りの平均ビット数を表し、“B”変数はテクスチャ情報をコード化するために使用するビット数を表し、そして“M”は該ビデオ系列の該フレーム中のピクセルの数である、
    ビデオ・コーディング・デバイス。
  23. 該ビデオ・コーダは、動き推定器、動き補償器、残差コーダ、及びレート制御ユニットを含む、ここにおいて、該動き推定器、該動き補償器、及び該残差コーダは、該第1コーディング・パスにおいて該第1のQPのセットを使用して該ビデオ系列をコード化し、そして該第2コーディング・パスにおいて該第2のQPのセットを使用して該ビデオ系列をコード化する、そしてここにおいて、該レート制御ユニットは、レート−歪統計値を求め、レート−歪特性を推定し、そして該第2のQPのセットを選択する、請求項22のビデオ・コーディング・デバイス。
  24. 該ビデオ系列を取り込むためのビデオ取込みデバイス、及び該第2コーディング・パスの該コード化されたビデオ系列を送信するための送信機、をさらに具備する、請求項23のビデオ・コーディング・デバイス。
  25. 該ビデオ・コーダは、空間推定器、フレーム内予測ユニット、残差コーダ、及びレート制御ユニットを含む、ここにおいて、該空間推定器、該フレーム内予測ユニット、及び該残差コーダは、該第1コーディング・パスにおいて該第1のQPのセットを使用して該ビデオ系列をコード化し、そして該第2コーディング・パスにおいて該第2のQPのセットを使用して該ビデオ系列をコード化する、そしてここにおいて、該レート制御ユニットは、レート−歪統計値を求め、レート−歪特性を推定し、そして該第2のQPのセットを選択する、請求項22のビデオ・コーディング・デバイス。
  26. 第1コーディング・パスにおいて第1の量子化パラメータ(QP)のセットを使用してビデオ系列のフレームをコード化すること;
    該第1コーディング・パスの該コード化されたビデオ系列に関するレート−歪統計値を求めること;
    該レート−歪統計値に基づいて該ビデオ系列のレート−歪特性を推定すること;
    該推定したレート−歪特性に基づいて該ビデオ系列中の該フレームの第2コーディング・パスのために第2のQPのセットを選択すること;及び
    該第2コーディング・パスにおいて該第2のQPのセットを使用して該ビデオ系列をコード化すること、
    によって該ビデオ系列をコード化し、
    前記レート−歪特性を推定することは、該レート−歪統計値にレート・モデルと歪モデルとを適用し、
    前記レート・モデルは、次式により与えられるモデルに対応する:
    =(A)(ρ)+B
    ここにおいて、該歪モデルは、次式により与えられるモデルに対応する:
    Figure 0005006327
    そしてここにおいて、添字“i”は該ビデオ系列のi番目のフレームに関するパラメータを識別する整数であり、添字“i−1”は該ビデオ系列のi−1番目のフレームに関するパラメータを識別し、そして添字“i−2”は該ビデオ系列のi−2番目のフレームに関するパラメータを識別する、ここにおいて、“^”表記は第1パスの変数であるとしてそれぞれの変数を規定し、そして“^”のない表記は第2パスの変数であるとしてそれぞれの変数を規定する、ここにおいて、“Q”変数はQPであり、“D”変数は歪モデルであり、“R”変数はレートモデルであり、“σ ”は動き補償された残差のエネルギーを表し、“ρ”変数は非ゼロ量子化DCT係数の数を規定し、“A”変数は非ゼロの量子化離散余弦変換(DCT)係数当りの平均ビット数を表し、“B”変数はテクスチャ情報をコード化するために使用するビット数を表し、そして“M”は該ビデオ系列の該フレーム中のピクセルの数である、
    ビデオ・コーダ。
JP2008532399A 2005-09-22 2006-09-21 レート−歪特性を使用するビデオ・コーディングのための2回パス・レート制御技術 Expired - Fee Related JP5006327B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US71977505P 2005-09-22 2005-09-22
US60/719,775 2005-09-22
US11/303,617 2005-12-15
US11/303,617 US7876819B2 (en) 2005-09-22 2005-12-15 Two pass rate control techniques for video coding using rate-distortion characteristics
PCT/US2006/036905 WO2007038230A1 (en) 2005-09-22 2006-09-21 Two pass rate control techniques for video coding using rate-distortion characteristics

Publications (2)

Publication Number Publication Date
JP2009509476A JP2009509476A (ja) 2009-03-05
JP5006327B2 true JP5006327B2 (ja) 2012-08-22

Family

ID=37654729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008532399A Expired - Fee Related JP5006327B2 (ja) 2005-09-22 2006-09-21 レート−歪特性を使用するビデオ・コーディングのための2回パス・レート制御技術

Country Status (6)

Country Link
US (1) US7876819B2 (ja)
EP (2) EP1949699B1 (ja)
JP (1) JP5006327B2 (ja)
KR (1) KR100974025B1 (ja)
AT (1) ATE525858T1 (ja)
WO (1) WO2007038230A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8379721B2 (en) 2005-09-22 2013-02-19 Qualcomm Incorported Two pass rate control techniques for video coding using a min-max approach
JP5087627B2 (ja) * 2006-09-28 2012-12-05 トムソン ライセンシング 効果的なレート制御および拡張したビデオ符号化品質のためのρ領域フレームレベルビット割り当てのための方法
FR2907989B1 (fr) * 2006-10-27 2009-01-16 Actimagine Sarl Procede et dispositif d'optimisation de la compression d'un flux video
JP4979355B2 (ja) * 2006-11-30 2012-07-18 パナソニック株式会社 画像符号化装置および画像符号化方法
US8711926B2 (en) * 2007-02-08 2014-04-29 Qualcomm Incorporated Distortion estimation for quantized data
CN102067610B (zh) * 2008-06-16 2013-07-10 杜比实验室特许公司 基于视频编码的切片依赖性的码率控制模型适配
EP2200320A1 (en) * 2008-12-18 2010-06-23 Thomson Licensing Method and apparatus for two-pass video signal encoding using a sliding window of pictures
US8218644B1 (en) 2009-05-12 2012-07-10 Accumulus Technologies Inc. System for compressing and de-compressing data used in video processing
US8811485B1 (en) 2009-05-12 2014-08-19 Accumulus Technologies Inc. System for generating difference measurements in a video processor
US8238444B2 (en) * 2009-12-15 2012-08-07 National Taiwan University Perceptual-based video coding method
US8681858B2 (en) * 2009-12-23 2014-03-25 General Instrument Corporation Rate control for two-pass encoder
US8856846B2 (en) * 2010-11-29 2014-10-07 At&T Intellectual Property I, L.P. Content placement
EP2751990A4 (en) 2011-08-29 2015-04-22 Icvt Ltd CONTROL OF A VIDEO CONTENT SYSTEM
US9338463B2 (en) 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9197888B2 (en) 2012-03-13 2015-11-24 Dolby Laboratories Licensing Corporation Overlapped rate control for video splicing applications
GB2501493B (en) * 2012-04-24 2015-05-13 Canon Kk Methods for encoding and decoding an image, and corresponding devices
CN104717500B (zh) * 2013-12-12 2018-04-06 中国电信股份有限公司 一种视频编码码率控制方法和系统
CN104320667B (zh) * 2014-11-03 2017-11-03 浙江泰立媒科技有限公司 多过程最优化编转码系统及方法
US9875443B2 (en) * 2015-06-18 2018-01-23 TCL Research America Inc. Unified attractiveness prediction framework based on content impact factor
US10110931B2 (en) * 2016-04-27 2018-10-23 Aspeed Technology Inc. Variable length coding and decoding methods and devices for grouped pixels
US10574999B2 (en) * 2016-05-05 2020-02-25 Intel Corporation Method and system of video coding with a multi-pass prediction mode decision pipeline
US10542262B2 (en) 2016-11-15 2020-01-21 City University Of Hong Kong Systems and methods for rate control in video coding using joint machine learning and game theory
US11153585B2 (en) 2017-02-23 2021-10-19 Netflix, Inc. Optimizing encoding operations when generating encoded versions of a media title
US11166034B2 (en) 2017-02-23 2021-11-02 Netflix, Inc. Comparing video encoders/decoders using shot-based encoding and a perceptual visual quality metric
US10742708B2 (en) 2017-02-23 2020-08-11 Netflix, Inc. Iterative techniques for generating multiple encoded versions of a media title
US10917644B2 (en) 2017-02-23 2021-02-09 Netflix, Inc. Iterative techniques for encoding video content
US10666992B2 (en) 2017-07-18 2020-05-26 Netflix, Inc. Encoding techniques for optimizing distortion and bitrate
CN107749993B (zh) * 2017-11-02 2019-12-03 广西大学 基于mmse重构的分布式视频编码信源失真估算方法
CN109561306B (zh) * 2018-10-26 2021-08-06 上海九吾尊易信息科技有限公司 一种带宽压缩量化方法
CN109510984B (zh) * 2018-10-26 2021-02-05 和宇健康科技股份有限公司 一种压缩编码量化方法
CN111726618B (zh) * 2020-06-29 2022-11-18 上海富瀚微电子股份有限公司 Rdoq的最优量化值的计算方法
CN112165620B (zh) * 2020-09-24 2024-09-13 北京金山云网络技术有限公司 视频的编码方法及装置、存储介质、电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978544A (en) 1993-06-28 1999-11-02 Kabushiki Kaisha Toshiba Video compression coding apparatus and video compression recording/playback apparatus
US6256423B1 (en) * 1998-09-18 2001-07-03 Sarnoff Corporation Intra-frame quantizer selection for video compression
JP3915272B2 (ja) 1998-10-06 2007-05-16 株式会社ニコン 量子化方法,および量子化プログラムを記録した記録媒体
JP3902948B2 (ja) * 2001-12-04 2007-04-11 株式会社Kddi研究所 動画像符号化装置
CN1206864C (zh) 2002-07-22 2005-06-15 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US20050169369A1 (en) 2004-02-03 2005-08-04 Sony Corporation Scalable MPEG video/macro block rate control

Also Published As

Publication number Publication date
EP2339851A3 (en) 2012-04-25
US7876819B2 (en) 2011-01-25
EP1949699B1 (en) 2011-09-21
ATE525858T1 (de) 2011-10-15
EP2339851A2 (en) 2011-06-29
JP2009509476A (ja) 2009-03-05
KR100974025B1 (ko) 2010-08-05
KR20080066684A (ko) 2008-07-16
US20070064793A1 (en) 2007-03-22
WO2007038230A1 (en) 2007-04-05
EP1949699A1 (en) 2008-07-30

Similar Documents

Publication Publication Date Title
JP5006327B2 (ja) レート−歪特性を使用するビデオ・コーディングのための2回パス・レート制御技術
JP5096342B2 (ja) 最小−最大アプローチを使用するビデオ・コーディングのための2回パス・レート制御技術
CN104885455B (zh) 一种用于视频编码的计算机实现的方法及装置
KR100957316B1 (ko) 멀티미디어 코딩을 위한 모드 선택 기술
JP5203554B2 (ja) ビデオ符号化のための効率的なレート制御技術
US7023914B2 (en) Video encoding apparatus and method
CN101523915B (zh) 使用min-max方法的用于视频编码的两遍速率控制技术
KR20050119422A (ko) 움직임 보상에 기반한 입력 영상의 노이즈 예측 및 그장치와, 이를 사용한 노이즈 제거 및 동영상 부호화 방법,이를 수행하기 위한 프로그램이 기록된 기록 매체
US20100111180A1 (en) Scene change detection
US20070133690A1 (en) Adaptive complexity control for motion estimation during video encoding
JP2005525027A (ja) 動き情報を用いてmpegトランスコーディングを行うシステム及び方法
US8275034B2 (en) Moving image encoding apparatus and control method, and computer program
US20160277767A1 (en) Methods, systems and apparatus for determining prediction adjustment factors
CN115428451A (zh) 视频编码方法、编码器、系统以及计算机存储介质
US8194740B2 (en) Apparatus and method for compression-encoding moving picture
CN113286145B (zh) 视频编码方法、装置和电子设备
KR101197094B1 (ko) H.264/avc를 위한 통계 모델 기반의 비트율 제어 방법 및 장치
Kumar et al. Efficiency enhancement of K-multi constraints paths in hybrid video coder using information based quantization method
Lou et al. Rate-distortion optimized rate-allocation for motion-compensated predictive video codecs using PixelRank
KR100480698B1 (ko) 엠펙 인코딩 방법
Nguyen et al. Artificial Intelligence Based Adaptive GOP Size Selection for Effective Wyner-Ziv Video Coding
JP2005217499A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110307

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110314

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110407

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120524

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150601

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5006327

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees