JP5253571B2 - 複数の歪抑制下のビデオ圧縮 - Google Patents

複数の歪抑制下のビデオ圧縮 Download PDF

Info

Publication number
JP5253571B2
JP5253571B2 JP2011514800A JP2011514800A JP5253571B2 JP 5253571 B2 JP5253571 B2 JP 5253571B2 JP 2011514800 A JP2011514800 A JP 2011514800A JP 2011514800 A JP2011514800 A JP 2011514800A JP 5253571 B2 JP5253571 B2 JP 5253571B2
Authority
JP
Japan
Prior art keywords
video
distortion
lagrangian cost
modes
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011514800A
Other languages
English (en)
Other versions
JP2011525332A (ja
Inventor
リー、ツェン
トゥラピス、アレクサンドロス
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2011525332A publication Critical patent/JP2011525332A/ja
Application granted granted Critical
Publication of JP5253571B2 publication Critical patent/JP5253571B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願の相互参照
この出願は、Zhen Li及びAlexanders Tourapisによる米国仮特許出願第61/074,439号(出願日2008年6月20日、発明の名称「複数の歪抑制下のビデオ圧縮(Video Compression under Multiple Distortion Constraints)」)に関して、優先権を含めて利益を主張しており、その仮特許出願は本願の譲受人に(ドルビー・ラボラトリー参照番号D07014 US01として)譲渡されている。
技術
本開示事項は一般にビデオ技術に関する。更に詳しくは、本発明の実施形態は、複数の歪抑制下のビデオ圧縮に関する。
背景
本明細書で用いられるように、用語「画像特徴」は視野内の一つ以上の画素(例えば、一つ以上のピクセル)を称することもある。本明細書で用いられるように、用語「ソース・フィールド」は画像特徴に関する情報を決定又は導出し得るフィールドを称することもある。本明細書で用いられるように、「中間フィールド」は、ビデオ・シーケンスにおけるソース・フィールドに時間的に続くか或いは先行するフィールドであって、画像特徴に関する情報をソース・フィールドを参照して記述し得るフィールドを称することもある。本明細書に用いられるように、用語「視差推定」は、運動ベクトル、又は他のパラメトリック値(例えばビデオ・シーケンスの二つ以上のフィールドの間の運動を有する)を効レート的に予測、モデル化、又は記述するように計算する技法を称することもある。視差推定の例は、動き検出である。本明細書に用いられるように、用語「視差予想」は運動ベクトル又は他の予想されたパラメトリック動き関連値を称することもある。本明細書に用いられるように、用語「視差補償」は、ビデオ・シーケンスの一つ以上の中間フィールドにおける画像特徴の動き又は或るパラメータを記述するために、ソース・フィールド内の画像特徴の位置の空間的変動を計算し得る動き検出又は他のパラメータによる技法を称することもある。視差補償の例は、動き補償である。上述の用語は、他のビデオ・コーディング概念(例えば、内部予測及び照明補償)に関連して用いられることもある。
図1はビデオ・エンコーダーの一例の模式図である。
図2はビデオ・デコーダー一例の模式図である。
図3はラグランジアン・コスト最適化関数の一例の図表である。
図4はブロック境界に沿う勾配の平均二乗差(MSDS)の一例を示す。
図5は複数のレート抑制下のビデオ圧縮計画の例の模式図である。
図6は複数の歪抑制下のビデオ圧縮計画の例の模式図である。
図7Aは平行最適化の一例の模式図である。
図7Bは平行最適化を実行する方法の一例を示す流れ図である。
図8は連続最適化の一例を例示する模式図である。
図9は連続最適化の下における閾値決定の例を例示する模式図である。
図10Aは複数の歪抑制下でハイブリッド最適化を用いるビデオ・コーディング最適化計画の一例を示す模式図である。
図10Bはハイブリッド最適化技法の一例を例示する流れ図である。
図11Aは複数の歪抑制下のカスケード型最適化を用いるビデオ・コーディング計画の一を示す模式図である。
図11Bはカスケード型最適化を実行する方法の一例を示す流れ図である。
図12複数の歪抑制下におけるビデオ圧縮の開示された技術によるシステムの模式図を示す。
様々な図における同様な参照番号及び符号は同様な構成要素を示す。
例示的な実施形態の説明
複数の歪抑制下のビデオ圧縮に関する実施形態を以下に説明する。以下の説明では、説明の便宜のために、多数の特定の詳細が本発明の完全な理解を与えるために記載されている。しかしながら、本発明の実施形態がこれらの特定の詳細を伴うことなく実施し得ることは明らかである。他の例では、本発明を不必要に不明瞭にすることのないように、公知の構造及びデバイスがブロック図形式で示されている。
概要
開示された技術の態様は、複数の歪抑制下でビデオ・コーディング最適化に関連する。本開示事項に提示される最適化方法は、ビデオ圧縮システムにおける様々なモード決定を最適化するために用いることができ、そのモードは、とりわけ量子化パラメータ、運動ベクトル、内部予測モード、コーディング・ブロック(例えばマクロブロック)サイズ、変換、エントロピー・コーディングなどである。これら及びその他の実施形態は、以下の特徴の一つ以上を含むことができる。
或る態様においては、幾つかの実施形態がビデオ・コーディングのための方法を特徴付け、その方法は、第1の歪測定基準値を用いて、ラグランジアン・コスト値の第1のセットを決定すると共に、第2の歪測定基準値を用いて、ラグランジアン・コスト値の第2のセットを決定することに関する。この方法は、ラグランジアン・コスト値の第1のセットとラグランジアン・コスト値の第2のセットとに基づいて、コーディング・モードのうちの一つを選択し、選択したコーディング・モードを用いて1ピクセル・ブロックをコード化することに関する。
これら及び他の実施形態は、以下の特徴の一つ以上を任意に含むことができる。第1及び第2のラグランジアン・コスト値は、異なるビット目標レートを含むことができる。歪測定基準はビデオ・ディスプレイの特性に関連した情報を含むことができ、そのビデオ・ディスプレイの特性としては、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイのビデオ処理性能の測定値、表示に歪特性、ビデオ・ディスプレイの時間的特性、又はビデオ・ディスプレイの空間特性があげられる。歪測定基準は、複数のビデオ・ディスプレイの特性に関連した情報も有することができ、その複数のビデオ・ディスプレイの特性としては、ビデオ・ディスプレイの使用量のパラメータ、ビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計形式のパラメータ、ビデオ・ディスプレイの表示技術形式のパラメータ、これらの特性の任意の組み合わせを用いるビデオ・ディスプレイのランク付けのパラメータがあげられる。モードの選択は、ビデオ・ディスプレイの類似した特性によるビデオ・ディスプレイの特性についての歪測定基準の情報の関連付けに基づく歪測定基準の第1のサブセットを選択することに関係する。モードの選択は、複数のコーディング・モードのランク付けに関連する。この方法は、第3の歪み測定基準値を用いたコーディング・モードのためのラグランジアン・コスト値の第3のセットを決定すると共に、第4の歪測定基準値を用いたコーディング・モードのためのラグランジアン・コスト値の第4のセットを決定することにも関する。この方法はラグランジアン・コスト値のセットに基づいてコーディング・モードを選択し、この選択されたコーディング・モードを用いて第2のピクセル・ブロックをエンコーディングすることを含むこともできる。
或る態様においては、幾つかの実施形態はビデオ・コーディングのための方法を特徴付け、その方法は、ビデオ・エンコーダーから複数のチャンネルへ圧縮ビット・ストリームを送り、そのチャンネルは目標ビット・レート及び複数の歪測定基準値を含む。この方法は、チャンネルのうちの一つからの歪測定基準のうちの一つを第1のビデオ・ディスプレイの特性へ整合させて、その第1のビデオ・ディスプレイの特性に整合する歪測定基準と共に第1のビデオ・ディスプレイへビデオ・データを送ることを含む。
これらと他の実施形態は選択的に以下の特徴の一つ以上を含むことができる。歪測定基準値はビデオ・ディスプレイの特性に関連した情報を含み、その特性は,スクリーン・ディスプレイ・サイズ、ビデオ/ディスプレイのビデオ処理性能の計測、ディスプレイの歪特性、ビデオ・ディスプレイの時間的特性、又はビデオ・ディスプレイの空間的特性を含む。歪測定基準値は複数のビデオ・ディスプレイの特性に関連した情報を含むことができ、そのビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式についてのパラメータ、ビデオ・ディスプレイについてのディスプレイ技術の形式についてのパラメータ、及びこれらの特性の任意の組み合わせを用いるビデオ・ディスプレイをランク付けするためのパラメータを含むことができる。
この方法は、圧縮ビット・ストリームを送る以前に、ラグランジアン・コスト関数を用いてピクセル・ブロックをエンコーディングすることにも関し、そのラグランジアン・コスト関数は、対応するビット目標レートを有する歪基準値による複数のモードを含むエンコーディングからの歪情報を含むことができる。この方法は、第1のビデオ・ディスプレイの同様な特性によるビデオ・ディスプレイの特性についての歪測定基準値情報に基づく各チャンネルにおいて歪測定基準値をランク付けすることを含み、その一つのチャンネルからの歪測定基準値の整合は、最高位の歪測定基準値を選択することを含む。この方法は整合しない歪測定基準値を削除することにも関連し得る。
他の態様においては、幾つかの実施形態は、複数の歪抑制下のビデオ・コーディングを特徴付け、その方法は、歪測定基準値を複数の候補モードに関連付けることを含む。歪測定基準値の各々は、候補モードの一つのグループに関連している。この方法は、複数の候補モードをそれぞれのラグランジアン・コスト関数により並行処理し、各々歪測定基準値について、ラグランジアン・コスト関数に関して各グループ内の候補モードをランク付けすることに関する。この方法は、候補モードの各グループのうちで、候補モードのランク付けを比較し、最高位を有する候補モードのグループを選択し、候補モードの選択されたグループ内の最高位の候補モードの選択に基づいてビデオ・ディスプレイについての目標モードを選択することを含む。
これらと他の実施形態は、以下の特徴のうちの一つ以上を選択的に含むことができる。ランク付けは、歪測定基準値特性によるビデオ・ディスプレイの特徴の関連付けに基づくことができる。歪測定基準値はビデオ・ディスプレイ特性に関連する情報を含むことができ、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ/ディスプレイのビデオ処理性能の計測、歪特性、時間的特性、又は空間的特性を含む。歪測定基準値は、複数のビデオ・ディスプレイの特性に関連した情報を含んでもよく、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式についてのパラメータ、ビデオ・ディスプレイについてのディスプレイ技術の形式についてのパラメータ、及びこれらの特性の任意の組み合わせを用いるビデオ・ディスプレイをランク付けするためのパラメータを含むことができる。
他の態様においては、幾つかの実施形態は、複数の歪抑制下のビデオ・コーディングを特徴付け、その方法は、ビデオ情報のビット・ストリームを処理して、第1の歪測定基準値を有する第1のモードについての第1のラグランジアン・コスト関数を決定することに関する。この方法は、第1のラグランジアン・コスト関数を閾値と比較して、第1のラグランジアン・コスト関数がその閾値よりも大きいならば、第1の歪測定基準値を有するモードを削除することを含む。第1のラグランジアン・コスト関数がその閾値よりも小さいならば、この方法は、第2の歪測定基準値を有する第1のモードについての第2のラグランジアン・コスト関数を決定することに関連する。
これらと他の実施形態は、以下の特徴の一つ以上を選択的に含むことができる。この方法は、第2のラグランジアン・コスト関数を閾値と比較することを含む。第2のラグランジアン・コスト関数がその閾値よりも大きいならば、この方法は第2の歪測定基準値を有するモードを削除することに関係することができる。第2のラグランジアン・コスト関数がその閾値よりも小さいならば、この方法は、ビデオ情報を処理することにより第3の歪測定基準値を有する第1のモードについての第3のラグランジアン・コスト関数を決定することに関することができる。
他の態様においては、幾つかの実施形態は複数の歪抑制下のビデオ・コーディングの方法を特徴付けることを含み、その方法は、各々のモードについての複数の歪測定基準値を有する多数のモードについて、ビデオ情報のビットストリームを処理して、各々のモードについての歪測定基準値を有するラグランジアン・コスト関数を決定することに関する。この方法は、各ラグランジアン・コスト関数を閾値と比較して、各ラグランジアン・コスト関数がその閾値よりも大きいならば、この方法は、各歪測定基準値を有する各モードを削除することに関連する。各ラグランジアン・コスト関数が閾値よりも小さければ、この方法は、二次歪測定基準値を有する各モードについての二次ラグランジアン・コスト関数を決定することに関連する。各ラグランジアン・コスト関数は連続的に決定されて、全てのモードについての全ての歪測定基準値が比較及び/又は削除されるまで閾値と比較される。
これらと他の実施形態は、以下の特徴の一つ以上を選択的に含むことができる。歪測定基準値はビデオ・ディスプレイ特性に関連する情報を含むことができ、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ/ディスプレイのビデオ処理性能の計測、歪特性、時間的特性、及び/又は空間的特性を含む。歪測定基準値は、複数のビデオ・ディスプレイの特性に関連した情報を含むこともでき、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式についてのパラメータ、ビデオ・ディスプレイについてのディスプレイ技術の形式についてのパラメータ、及びこれらの特性の任意の組み合わせを用いるビデオ・ディスプレイをランク付けするためのパラメータを含む。保持されている歪測定基準値を有するモードについては、この方法は、保持されている歪測定基準値を有するモードのサブセットを選択し、ビデオ・ディスプレイ上にビデオ情報を表すことに関連した構成要素へ出力することに関連することができる。この方法は、一つ以上のモードについて、又は一つ以上の歪測定基準値についての閾値の値を調整することを含むこともできる。この閾値は、マクロブロックに関連する歪みの関数とすることができ、この閾値関数は当該マクロブロックに隣接する複数のマクロブロックについての歪みの相関関係を含むことができる。
他の態様においては、幾つかの実施形態は、並行最適化コーディングについて、統計学的にみて、選択されそうもない一つ以上のコーディング・モードを特定するために統計を用いることを含むビデオ・コーディング方法を特徴付けることができる。統計学的にみて、選択されそうな一つ以上のコーディング・モードについては、この方法は並行最適化コーディングにより一つ以上のコーディング・モードを処理することに関係する。統計学的にみて、選択されそうもない一つ以上のモードについては、この方法は連続した最適化コーディングを採用すると共に、性能基準値を用いて、平行最適化コーディング及び連続最適化コーディングからモードのサブセットを選択することに関連する。
これらと他の実施形態は以下の特徴の一つ以上を選択的に含んでもよい。連続最適化コーディングは、一つ以上のコーディング・モードについての多数の歪測定基準値について、ビデオ情報を処理して、コーディング・モードの各々について歪測定基準値を有するラグランジアン・コスト関数を決定することを含むことができる。この方法は、各々のラグランジアン・コスト関数を閾値と比較して、それぞれのラグランジアン・コスト関数が閾値よりも大きいならば、この方法は、各歪測定基準値を有する各コーディング・モードを削除することに関連する。それぞれのラグランジアン・コスト関数が閾値よりも小さいならば、この方法は、二次歪測定基準値を有する各コーディング・モードについて二次ラグランジアン・コスト関数を決定することに関連する。各ラグランジアン・コスト関数は連続的に決定されて、全てのコーディング・モードについての全ての歪測定基準値が比較又は削除されるまで、閾値と比較される。
これらと他の実施形態は以下の特徴の一つ以上を選択的に含むことができる。並行最適化コーディングは、複数の歪測定基準値を有する一つ以上のモードに同時にアクセスし、複数の歪測定基準値を多数の候補モードに関連付けることを含むことができる。複数の歪測定基準値の各々は候補モードのグループに関連付けることができる。この方法は、候補モードをそれぞれのラグランジアン・コスト関数により同時処理することを含む。各々の歪測定基準値について、この方法は、ラグランジアン・コスト関数による各グループ内の候補モードをランク付けし、候補モードの各グループの中から候補モードのランク付けを比較し、高位を有する候補モードのグループを選択し、及び、候補モードの選択されたグループ内の高位候補モードの選択に基づいてビデオ・ディスプレイについての目標モードを選択することを含むことができる。歪測定基準値は、ビデオ・ディスプレイ特性に関連した情報を含むことができ、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の計測、歪特性、時間的特性、又は空間的特性を含む。歪測定基準値は、複数のビデオ・ディスプレイの特性に関連した情報を含むこともでき、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式についてのパラメータ、ビデオ・ディスプレイについてのディスプレイ技術の形式についてのパラメータ、及びこれらの特性の任意の組み合わせを用いるビデオ・ディスプレイをランク付けするためのパラメータを含む。
他の態様においては、幾つかの実施形態はビデオ・コーディング方法を特徴付け、この方法は、第1の歪測定基準値を含めて、ビットストリームへアクセスし、第1の歪測定基準値に関連するモードの第1のセットについてのラグランジアン・コスト関数を同時に処理し、モードの第1のセットのラグランジアン・コスト関数を比較し、この比較は、モードの第1のセットのラグランジアン・コスト関数のランク付けに関連する。この方法は、比較に基づいて第1セットモードからモードの第1のサブセットを選択し、先行モードランク付けからのデータに基づいてモードの第1のサブセットの順位を配列することを含む。この方法は、第2の歪測定基準値を用いるモードの第1のサブセットについてのラグランジアン・コスト関数を同時に処理すると共に、モードの第1のサブセットのラグランジアン・コスト関数を比較することにも関係する。この比較は、モードの第1のサブセットのラグランジアン・コスト関数のランク付けにも関係する。この方法は、モードの第1のサブセットのラグランジアン・コスト関数のランク付けに基づく第1セットモードからのモードの第2のサブセットを選択し、先行モードランク付けからのデータに基づいてモードの第2のサブセットの順位を配列することに関係する。
これらと他の実施形態は以下の特徴の一つ以上を選択的に含むことができる。歪測定基準値は、ビデオ・ディスプレイ特性に関連した情報を含むことができ、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の計測、歪特性、時間的特性、及び/又は空間的特性を含む。歪測定基準値は、複数のビデオ・ディスプレイの特性に関連した情報を含むこともでき、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用についてのパラメータ、任意のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式についてのパラメータ、ビデオ・ディスプレイについてのディスプレイ技術の形式についてのパラメータ、及びこれらの特性の任意の組み合わせを用いるビデオ・ディスプレイをランク付けするためのパラメータを含む。
幾つかの実施形態においては、開示された技術は、異なるビッド・レート量についての、及び異なるエンド・ディスプレイ(その各々は固有のディスプレイ特性を有するので、好ましい表示品位を与えることができる)についての、ビット・ストリームを最適化することができる。以下に示す幾つかの実施形態においては、各チャンネルは、特定のエンド・ディスプレイの歪条件、処理特性、スクリーン・サイズ、及び表示特性に適合する歪測定基準値を有することができる。例えば第1チャンネルについての歪測定基準値は、特定の中間サイズのディスプレイ・モニタの特性に適する第1の歪測定基準値、ハンドヘルド・デバイス用ディスプレイの特性に適する第2の歪測定基準値、及び大型薄型テレビジョンに適する第3の歪測定基準値を有することができる。
本明細書に説明した任意の方法及び技術は、システム、装置又はデバイス、機械、コンピュータ・プログラム製品、ソフトウェア、ハードウェア、或いはそれらの任意の組み合わせに実装することもできる。例えばコンピュータ・プログラム製品はコンピュータ読み取り可能記憶媒体に明白にエンコードすることができ、データ処理装置(例えば、データ・プロセッサ)に本明細書に説明した任意の方法についての一つ以上の操作を実行させる指令を含むことができる。
これらの開示した技術をどのように実施できるかを示すために、幾つかの例示的な実施形態を示して説明する。例えば、本明細書に示して説明した例示的ビデオ・コーディング最適化技術の幾つかは、並行最適化技術、連続化最適化技術、ハイブリッド最適化技術、及びカスケード化最適化技術を含む。
最適化システム及び技術
ビデオ圧縮システム及び規格(例えば、ISO MPEG−1,MPEG−2,MPEG―4 AVC/ITU―T、H.264,H.261,H.263,及びVC−1)は拡張性(例えば、SVC)及びマルチ・ビュー・コーディング・システム(例えば、MVC)を含めて、ビデオ・コンテンツを合理的なコストで記憶及び配信する試みを与える。ビデオ・コーディング最適化はビデオ圧縮システムの構成要素とすることができる。ビデオ・コーディング最適化は、品位視覚的経験による高コーディング効レートを与えることができる。
図1はビデオ・エンコーダー100の例の模式図を示す。エンコーダー100は、例えば、アドバンスド・ビデオ・コーディング規格(AVC)、さもなければ、MPEG−4 AVC又はITU−T H.264と称されるもののためのエンコーダーとしてもよい。図1において、入力ビデオ102は加算器116へ送られ、これは入力ビデオ・フレーム102を視野補償(例えば、動き/輝度変化補償及び/又は内部予測)構成要素160の出力と共に加算する。加算器116からの出力はトランスフォーム構成要素104へ結合し、これには量子化構成要素106が続く。量子化構成要素の106の出力は、可変長コーディング(VLC)構成要素108及び逆量子化構成要素110へ接続される。ビット又・ストリーム120はVLC構成要素108からもたされる。エンコーディング処理に関する情報、例えば、ブロック、領域、又は画像をエンコードするのに要求されるビットの数、そのような決定により導入された歪は、ループ・フィルタ166及び他の構成要素へ送られる。
視差補償構成要素160は、視野推定構成要素162からの情報/決定を与える予測信号を生成することができる。視野推定構成要素162はタスクを実行し、そのタスクは、とりわけ以下を含み得る:(a)適宜な予測パラメータ、例えば動きベクトル、輝度変化パラメータ、及び/又は内部予測モード、(b)動き補償ブロック・サイズの選択的有効化及び無効化;(c)動き補償参照としての特定のピクチュアを用い;(d)動き予測検索レンジ、改善パターン、及び/又は動き評価基準値を調整し、及び(e)とりわけ、画像について予め定められた状態又は情報を与えるテストすべきコーディイング・モードの数を制限することを含む。ループ・フィルタ構成要素166はタスクを実行でき、このタスクは、とりわけ以下を含み得る。すなわち、(a)内部ループ・デブロッピング・フィルタのパラメータを調整し、(b)デブロッキング・フィルタをスイッチング・オフにすることである。
レート歪最適化構成要素180は、入力ビデオ102と、視差補償構成要素160からの出力とを受け取って、レート歪最適化情報を視差推定構成要素162へ送る。視差推定は、動き補償(若しくは予想)誤差の最小化することと、その一方で、動き視野のコヒーレンスを最大化することとの間の平衡により特徴付けることができる。動き視野のコヒーレンスは、動き視野の平滑化の項で記述することができる。コヒーレント対象の動きは、各々の対象について平滑であるので、動き視野は、対象の境界のみで非連続的になると予想される。これらの対象境界は、輪郭縁又はシルエット縁と称されることがある。
逆変換較正要素112は、逆量子化構成要素110からの入力を受け取って、加算器126へ出力を送る。加算器126は、逆変換構成要素112及び視差補償構成要素160から信号を受け取って、加算された信号をループ・フィルタ166へ送る。ピクチュア参照記憶器164は、ループ・フィルタ166から入力を受け取って、出力を視差補償構成要素160及び視差評価構成要素162へ送る。視差推定構成要素162も、レート制御構成要素(図示せず)から、入力を受け取る。ループ・フィルタ166も、このレート制御構成要素から入力を受け取る。入力ビデオ102もまた視差補償構成要素160及び視差推定構成要素262の入力を送る。
図2は、ビデオ・デコーダー200の一例の模式図を示す。或る実施形態において、デコーダー200はH.264/AVC規格に実質的に準拠して機能してもよい。デコーダー200は、ビット・ストリーム120を受け取って、エントロピー(可変的長)デコーダー205、一つ以上の逆量子化器230、一つ以上の逆変換較正要素235、及び視差補償構成要素210を用いて、このビット・ストリーム120をデコードする。エントロピー・デコーダー205は、ヘッダー情報(視差情報、例えば、とりわけ、モード、動きベクトル、輝度変化パラメータ、内部予測モードを含む)と、量子化且つ変換された残りのデータとの両方を抽出する。視差補償、及びより具体的には信号の予測は、ヘッダー情報を用いて、視差補償構成要素210内で実行され、一方、残りのデータは、逆量子化器230を用いて第1の逆量子化をされて、次いで逆変換構成要素235を用いて逆変換される。加算器255は逆変換器255と視差補償器210との出力を加算して、その加算結果をループ・フィルタ225へ送る。ループ・フィルタ225の出力は、参照ピクチャ・バッファ220へ接続され、これは参照のためにピクチュアを記憶させて、出力250を配信するために用いることができる。
ラグランジアン最適化が、ビデオ・コーディング最適化技術として用いることができる。ラグランジアン最適化は、ビデオ・コーディング最適化問題をラグランジアン・コスト関数の最小化として定式化する。
図3はラグランジアン最適化関数の一例を示す図表300である。特に、ラグランジアン・コスト関数は次式のように表現される。
Figure 0005253571
従って、
Figure 0005253571
レート目標の条件は次式でる。
Figure 0005253571
添字iはNブロックのうちの一つ又は最適化すべきブロックのグループのうちの一つである。π は異なるコーディング・モードであり、例えば異なる量子化又は推定モードである。d(i,π )はモードπ を有するブロックを対応するレートとしてのr(i,π )によりエンコーディングする歪である。λはラグランジアン乗数であって、非負の実数である。Πは最適化モードを表し、ここでは全てのラグランジアン・コスト関数が最小化される。
図表300は、歪D315対レートR320のプロットを表し、ここではラグランジアン・コスト関数325の最小化は、ラグランジアン乗数330の勾配を表す平面波として示されている。特に、図3は、ラグランジアン・コスト関数が特定のラグランジアン乗数λを与えられて最小化するときの最適解を示すことができる。この例では、ラグランジアン・コスト関数325の最小点は、対応するレートとしてのr(i,π )により、モードπ を有するブロックのエンコーディングの歪についてのd(i,π )340であり、ここでλ×r(i,π )335は平面波の一つの上部歪範囲である。λ=0を有するラグランジアン・コスト関数の最小化は、レートの何らかの考慮をすることなく、歪を最小化することに等しい。逆に、任意の大きなλを有するラグランジアン・コスト関数の最小化は、歪を考慮することなく、レートを最小化することに等しい。特定の最小化相殺の間のλ値の選択は、レート及び歪条件の平衡に到達することができる。ビデオ圧縮システムにおいて、動きベクトルとコーディング・モードとの両方はラグランジアン最適化により決定することができる。
ラグランジアン最適化をビデオ・エンコーダー内で実行する際は、レートは一般にビットにより計数される。しかしながら、歪の計算には様々な手法がある。
例えば、一つの広く用いられている測定基準値は、M×Nブロックについての絶対差の和(SAD:Sum of Absolute Diffrences)であり、これは次式により計算される。
Figure 0005253571
ここでsは原ビデオ・ブロックを示し、
Figure 0005253571
は、参照された(例えば予測サンプル)又は再構成されたブロック(例えば、予測+エンコード化された残りの情報)を表す。他の例においては、平方差の合計(SSD:Sum of the Squared Diference)測定基準値は、M×Nブロックについて次式のように計算することができる。
Figure 0005253571
ここでsは原ビデオ・ブロックを示し、
Figure 0005253571
は、参照された又は再構成されたブロックを表す。
ラグランジアン最適化における主観的な視覚品位を測定できる他の基準値も存在する。それらの基準値の一つの例は、丁度可知差異(JND:Just Noticeable Difference)であり、これはコンテンツに基づいて人為的視感度を測定する。他の例は、勾配の平均平方差異(MSDS:Mean Square Difference of Slope)であり、これは、シーン内に現れ得る人工物を遮る重要度を測定するために用いることができる。
図4は、ブロック境界に沿う勾配の平均平方差異(MSDS)測定基準値400の一例を示す図表400である。MSDSは、二つの隣接するブロックに跨がる勾配の間の差異の二乗であって、互いの境界に隣接する二つのブロックの間の平均である。図表400は、垂直位置410対水平位置430についてのブロック境界415を示し、ここでブロック境界415は、上部ブロック(例えば、ブロック0,1,2,3など)を下部ブロック(例えば、N−1,N−2,N−3,N−4など)から区画する。更に詳しくは、(i,j)−thブロック425及び(I,j-1)−thブロック420の垂直ブロック境界415に沿うMSDSは、次式のように表わされる。
Figure 0005253571
更なる測定基準値(例えば、表示及び/又は歪測定基準値など)をラグランジアン・コスト関数に考慮することができ、これには例えばラグランジアン・コストを次式のように表す。
Figure 0005253571
この関数は、歪測定基準値Dについての重みであるμにより最小化することができる。式7はk+1の自由度を有するラグランジアン関数を表すことができ、ここでμは、対応するラグランジアン乗数λの逆数とすることができる。
組み合わされた歪測定基準値をラグランジアン・コスト関数へ考慮するとき、ラグランジアン乗数についての同調条件(例えば、精巧な処理及び計算についての必要条件)が存在する。というのは、異なる歪測定基準値は共通のユニットにおける歪の大きさを表し得ないためである。この共通ユニットは、異なる測定基準値を、異なる測定基準値へ相互関連させるか又は正規化して、異なる測定基準値を互いに同様な基準又は方式へ関連させることができる。
本開示事項の態様は、複数のラグランジアン・コスト関数による異なる歪抑制を考慮する標準化手法を提示する。例えば、ラグランジアン・コスト関数の二つの形式は式8及び9で表現される。
更に詳しくは、ラグランジアン・コスト関数の第1の形式、
(λ)=D(R)+λ・R,k=1,2,..,K (8)
は最小化され、ここでRは、歪測定基準値Dに対応する目標である。
ラグランジアン・コスト関数の他の幾つかの形式は、異なるレート目標に関して同一の歪測定基準値を最適化するために用いることができる。これらの形式のラグランジアン・コスト関数は、以下の式(9)におけるように表わすことができる。特に、第2の形式のラグランジアン・コスト関数の最小化とすることができる。
(λ)=D(R)+λ・R,k=1,2,..,L (9)
図5は、単独の歪抑制を用いる複数のレート制約を用いるビデオ圧縮計画500の一例の模式図を示す。或る実施形態において、レート歪最適化構成要素510は、情報をビデオ・エンコーダー505へ送り、これは圧縮ビット・ストリーム515を複数のチャンネル520−530へ送る。各々のチャンネル520,525,530は、一つの歪測定基準535,540,545をそれぞれ有する。式9と同様に、歪は、同一の歪測定基準値D(R)で測定することができ、歪値における差異は、異なる目標レートR1,R2,...,RLに起因する場合がある。式9における異なるレートは、同一の共通測定単位を共有してもよい。
図6は、所定のレート制約のために複数の歪制約を使っているビデオ圧縮計画600の例の模式図を示す。特に、計画600においては、ビット・ストリームが異なるビット・レート割り当て量について最適化されるのみならず、異なる目標デバイス、例えば、異なるサイズ、解像度、又はディスプレイ型式(これは、LED、プラズマ、OLED、及び/又はDLPディスプレイを含み、その各々がそれに固有の表示特性を有するので、固有の歪測定基準値を有する)についても最適化される。レート歪最適化構成要素510からの情報はビデオ・エンコーダー505へ送られて、これは圧縮ビット・ストリーム515を複数のチャンネル620−630へ送り、その各チャンネルはそれ自体のレート抑制及び様々なエンド・ディスプレイ歪測定基準値635―670を有する。図示された実施形態において、各チャンネルは歪測定基準値を有することができ、これは特定のエンド・ディスプレイの歪条件、特性処理、ディスプレイ・スクリーン・サイズ、及び表示特性に適合する。例えば、目標ビット・レートRを有するチャンネル635についての歪測定基準値は、特定の中間サイズ・ディスプレイ・モニターの特性に適合する第1の歪測定基準値D(R)645と、ハンドヘルド・デバイス用のディスプレイの特性に適合する第2の歪測定基準値D(R)650と、大画面薄型テレビジョンの特性に適合する第3のD(R)655とを有することができる。
他の実施形態においては、所定のレート抑制についての複数の歪測定基準値を様々な用途状況に採用することができる。一つのこのような用途は、ビデオ・エンコーダーであり、これは連携してビット・ストリームを最適化し、そのビット・ストリームは続いて、小スクリーンを有するモバイル・デバイスやホーム・エンターテインメント・デバイスへ流れ、後者は非常に大きなディスプレイ・スクリーンを有してもよい。とりわけ輝度及び表示技術のみならず、このようなディスプレイ・スクリーン・サイズにおける大な差異は、非常に大きく異なる視覚的評価基準値を導く。例えば、エンコードされたイメージ内の人工物の特定のコーディングは、小スクリーン(例えば、携帯電話スクリーン又はハンドヘルド・デバイス・ディスプレイ・スクリーン)上では視認できないか若しくは小さく現れるようにして、しかし同一のコンテンツが大型ディスプレイ・スクリーン(例えば、大型LCDモニター、プラズマ、又はDLPディスプレイ)上に表示されるときには視認できるようにすることが可能である。更に、ディスプレイ・スクリーンの異なる特性、及び視聴に先だって実行されるデジタル信号処理(DSP:digital signal processing)も表示品位に影響する。ディスプレイ・スクリーン・サイズ、ディスプレイ・スクリーンの特性、及びDSPにおける差異は、ビット・ストリームを最適化し、同時に、異なる歪測定基準値及び/又は異なる表示及び処理特性についても最適化することにより対処できる。
この開示事項の或る態様は、ラグランジアン・コスト定式化の一つの形式を与え、これは拡張可能で、且つ広範囲に及ぶ(式8)とすることができ、これは、少なくとも、この形式の定式(式8)が様々な歪測定基準値Dへ考慮に入れることができるためである。この定式化(式8)は図6に示される例に対応してもよく、また、ディスプレイ特性(例えば、ディスプレイ・スクリーン・サイズ、解像度)、処理特性(例えばDSP)及び歪特性(例えば、マクロブロック又は他の特徴からの歪)へ考慮に入れることができる。式8における異なる歪値は、異なる目標レート及び/又は異なる歪測定基準値に起因するであろう。式8における異なる歪は、異なる歪測定基準値により測定することができ、必ずしも共通の測定単位を共有する必要はない。
或る実施形態においては、選択された歪測定基準値は、様々なエンド・ディスプレイについて特定の歪特質に適合することができる。例えば、一つの歪測定基準値は、第1の型式のディスプレイの時間的品位を向上させることができ、第2の歪測定基準値は第2の型式のディスプレイの空間的品位に対応することができ、又は第3の歪測定基準値は、第3の型式のディスプレイの色品質又は画質の形式へ向かって指向させることができる。歪測定基準値は、複数のビット・レート目標に適することができ、しかも様々な形式の表示特性及び歪条件へ考慮に入れることができる。
複数の歪抑制を用いるビデオ・コーディング最適化は、多数の方式で実行することができる。例示のために、少なくとも四つの例を示し、以下に説明する。ビデオ・コーディング最適化例は、並行最適化技術、連続最適化技術、複合型最適化技術、及びカスケード型最適化技術を含む。これらの方法の各々は、異なる形態と、複数の最適化レベルの組合せによって特徴付けることができ、異なる性能と複雑さとの相殺を可能とする。これらの四つの例が主に式8のラグランジアン・コスト関数の形式に関係するが、これらは式8と式9とで表現されるラグランジアン・コスト関数の形式の両方の組み合わせを含んでもよい。即ち、任意の最適化ステップにて、複数の歪コストは、単独のもののみに代えて考慮することができる。他の実施形態において、コストは同じであるが、異なる歪測定基準値の組合せ(例えば、レベル1のためにD1及びD2、レベル2のためにD3を有するD1)を考慮することもできる。式8を用いる或る実施形態は、各歪測定基準値及びそれに対応するラグランジアン・コスト関数の決定とは、分離することができる場合がある。
複数の歪制約下の並行最適化
図7Aは、複数の歪制約下の並行最適化を採用するビデオ・コーディング最適化計画700の一例の模式図を示す。計画700においては、最適モードはM個の候補モードから選択されて、K個の歪測定基準値がある。計画700は、歪測定基準値の各々についてラグランジアン最適化を同時に実行できる。
特に、入力ブロック705は、歪測定基準値710,715,720を各候補モード(1,2,...M)へ送る。各々の歪測定基準値Dについて、ラグランジアン・コスト関数J (j)は、候補モードjについて次式のように処理される。
Figure 0005253571
歪測定基準値D710については、例えば、ラグランジアン・コスト関数725,730,735がモード1,2,M,についてそれぞれ処理される。所定の歪測定基準値における各モードについて計算され、結果的なラグランジアン・コスト関数は比較されてランク付けされる。ラグランジアン・コスト関数ランク付けモジュール770,7775,780は、各々の所定の歪測定基準値710,715,720の各々について操作される。このようなモードランク付けの一例は、それらのラグランジアン・コスト関数に基づいて所定の歪測定基準値についての各モードにスコアを付けることに関係する。最小のラグランジアン・コスト関数を有するモードはスコア1を持つことができ、二番目に小さなラグランジアン・コスト関数を有するモードはスコア2を持つことができ、以下同様である。
ラグランジアン・コストが各モード毎及び各歪測定基準値毎について処理されてランク付けされた後、最終モード選択モジュール785が最良の性能を有するモードを選ぶ。操作においては、モデル選択モジュール785は、全てのスコアを各モードについて計算し、最低のスコアを有するモジュールを選ぶか、或いはそれを更に複雑な重み付けシステムで最良のモードを決定するために使用できる。
図7Bは、並行最適化を実行するための処理714の一例を示す流れ図を示す。図7Bにおける手法は、入力ブロック(702)からの一つ以上の歪測定基準値を受け取るか又はそれにアクセスして、一つ以上の歪測定基準値を各候補モード(1,2,...M)(704)へ関連付けるか又は送り、各候補(706)についてのラグランジアン・コスト関数を決定する。ラグランジアン・コスト関数が所定のモードにおける各モードについて決定された後、処理700は、結果的なラグランジアン・コスト関数を所定の歪測定基準値(708)において比較してランク付けすることを含む。ラグランジアン・コスト関数が各モード毎に及び各歪測定基準値について処理されてランク付けされた後、この手法は最良の性能(712)を有するモードを選択することを含む。或る場合においては、最良の性能は、最適処理の所定の特定の抑制の全体的な最高ランキングと称することができる。例えば、モード選択785はランク付けされたモード770,775,780の出力を採ることができ、これは、或る実施形態においては、ラグランジアン・コストに代えてランク付けされた結果(又はスコア)となることがあり得る。或る場合には、ラグランジアン・コスト関数は、異なる歪測定基準に関して加算可能ではない場合があり、ランク付け結果が全体的な性能を比較するための他の手法を提供することもある。選択されたモードは、選択的にランク付けするか、或いは幾つかの他のパラメータ又はランク付け計画により更にランク付けすることができる。
複数の歪抑制下の連続最適化
図8は複数の歪抑制下で連続的最適化を採用する一例の最適化処理800を表している図を示す。ビデオ・コーディング処理800では、入力ブロック805は歪測定基準値を候補モード(810)の連続した(例えば、一回に一つの候補モード)ループへ送り、そこにはM個のモード、即ちモード(j),j=1...Mがある。歪測定基準値はk=1...K(815)についての連続的なループもなす。M個の候補の各々について、ラグランジアン・コスト関数は各歪測定基準値について連続的に次式により決定する(820)。
Figure 0005253571
各々のラグランジアン・コストが決定(820)した後、それは対応する閾値T(825)と比較される。ラグランジアン・コスト関数コストが閾値(825)以上であるならば、このモードは放棄されて、もはや候補モード(830)としては考慮されない。この放棄された候補モードは、「早期終結」を受ける候補モードと称されることもある。ラグランジアン・コスト関数が閾値(825)よりも小さいならば、次の歪測定基準値に対応するラグランジアン・コスト関数を決定(835)することができる。このような手順は、モードが早期に終結(830)するか、或いは全ての歪測定基準値についてのラグランジアン・コスト関数が計算(835)されるまで続けられる。
全ての歪測定基準値についてのラグランジアン・コストが決定(835)されたなら、モード(j)が保持されて、kループは歪測定基準値(845)について終了し、jループはモード(850)について終了する。残りのモードの数がゼロより大きくなければ、モード決定はバック・アップする(860)。残りのモードの数がゼロより大きいならば、モード選択は実行され(865)、選択されたモードは、他のシステム構成要素へ出力するために利用可能とすることができる(870)。
閾値Tはユーザーにより予め定めることができるか、或いはエンコーディングの間に適応的に推定及び/又は調節することができる。閾値は、一般に大域的な又は局所的な特性の関数として次式のように導かれる。
Figure 0005253571
ここでIglobalは大域的特性,例えばフレーム・レート、動き強度、及び/又は他のメタデータ情報を表し、Ilocalは局所的特性、例えば輝度成分、時間促成分、テクスチュア情報及び/又はエッジ情報の差異、平均を表す。
残りのモード、即ちそれらの閾値検査の全てを通過したモードについては、最終モード決定モジュールが、このブロック(865,870)についての一つのモード又はモードのセットを選択するために用いられる。このような最終モード決定モジュールの一例は、先行するステップについて既に計算された一つ以上の歪測定基準値に関して残りのモードをランク付けすることができる。
全ての閾値検査を通過したモードが一つもなければ、バック・アップ・モード決定モジュールが用いられる(860)。このようなバック・アップ・モード決定の一例は、予め設定されたデフォルト・モードを単に選択することに関する。バックアップ・モード決定モジュールの他の例は、閾値を減少させて、少なくとも一つのモードが全ての閾値検査を通過するまで、ラグランジアン・コスト関数を新たな閾値と再び比較することに関係する。バックアップ・モード決定モジュールの他の例においては、モジュールは、一つのみの予め設定された歪測定基準値に関してラグランジアン・コスト関数を最小にする一つの最適モードを選ぶことができる。
或る実施形態では、閾値は特定のモード及び/又は歪測定基準値を削除するために用いることができ、また、最適モード及び/又は歪測定基準値を見つけるために用いることができる。或る実施形態で、第1の閾値は、第1の歪測定基準値と比較して、その結果の歪が予め定められた許容可能範囲よりも大きい(最小定式化とみなす)か、或いは、予め定められた許容可能範囲より小さい(最大化形成とみなす)に満たないならば、歪測定基準値は外れ値であると考えられるので、削除することができる。次いで、第2の歪測定基準値を閾値と比較することができる。第2の歪測定基準値が、予め定められた許容可能範囲よりも大きくない(最小化定式化とみなす)か、或いは、予め定められた許容可能範囲より小さい(最大化形成とみなす)ならば、第2の歪測定基準値を保持することができ、後続の選択において使用すべきか否かを判定するために更に処理される。他の実施形態においては、複数の歪測定基準からなるグループが同時に閾値と比較され、閾値から大きく離れている歪測定基準値を破棄することができる。非最適歪測定基準値の量を減らすことによって、システム処理は、より速い性能を持つように改善することができる。
図9は連続的最適化の下の閾値決定の一例を表す図表900を示す。この例では、閾値Tは先行してエンコード化された近接するブロックについての知見を用いて決定することができる。各々のブロック(k,l)がコード化された後、そのブロックの真の歪みD(k,l)を歪測定基準値Dに関して計算することができる。従って、境界条件がないとみなすと、ブロック(m,n)950についての閾値Tを次式のように決定することができる。即ち、
(m,n)=a×max(D(m−1,n−1),D(m,n−1),D(m+1,n−1),(D(m−1,n))+b (13)
ここでa及びbは、重みであり、可変に固定できるか、或いはブロックの特性に依存させることができる。隣接ブロックは、D(m−1,n−1)910,D(m,n−1)920,D(m+1,n−1)930,及び(D(m−1−n)940であり、ここで、近接するブロックの歪は、現在のブロック(m,n)950について、歪相互関係を発見するために用いることもできる相互関係情報を有することもできる。
他の実施形態においては、閾値は、歪計算を直ちに終了せねばならないかを指定するか、或いは、どのくらいの且つ何れの付加的な歪測定基準値を考慮せねばならないを指定することもできる。例えば、現在のブロック(m,n)の歪950が、その隣接ブロックの歪とは大きく異なるならば、現在のブロック(m,n)の歪950は外れ値である考えることができるので、最適化方法から削除して、処理資源を節約してシステム計算の速度向上を図ることができる。
或る実施形態では、複数の閾値を歪測定基準値ごとに用いることができ、ここでは対応するラグランジアン・コスト関数は多段方法で各々の閾値と比較することができる。他の実施形態では、歪測定基準値のシーケンスを検査して、それについて、他の先行して検査された閾値からの値に依存して閾値を用いることができる。
或る実施形態では、閾値は局所的な及び/又は大局的な特徴に基づくことができ、或いは、閾値は最適化処理の間に新しい閾値の値を適応的に調節することができる。例えば、複数の閾値が使われるならば、様々な閾値を処理中に調節又は再度順序付けして、最適化処理に選択されそうもない歪測定基準値の削除を支援することができる。選択の傾向は、選択処理以前に作成された統計に基づいてもよい。この実施形態は、処理資源を節約することもできる。或る実施形態においては、重さa及びbは、ディスプレイのリフレッシュ・レート、又は最適化アルゴリズムの処理の間に用いられるサイクルの回数に基づいて調節することができる。
或る歪測定基準値は、歪測定基準値の重要性に基づいて選択することができる。例えば、第2の歪測定基準値が大画面テレビ・ディスプレイに適しており、第2の歪測定基準値がハンドヘルド・デバイスのディスプレイに適しているならば、第2の歪測定基準値は、基準値の使用の特定の割合(例えば、50%を越える)がハンドヘルド・デバイスのディスプレイに相応しいならば、より重要な歪測定基準値として選択することができる。
複数の歪制約下のハイブリット最適化
並行及び連続的計画は「ハイブリッド最適化」計画に統合することができる。
図10Aは、複数の歪制約下のハイブリッド最適化を用いる例示的なビデオ・コーディング計画1000の図を示す。計画1000では、連続的最適化モード・サブセット1065は、連続的最適化1070に選択及び使用されそうにないモードを有する。入力ブロック1001からの歪測定基準値D1003,D1006,D1009が、図7A−7Bで上述したように、様々なモード1...M、ラグランジアン・コスト関数1005−1060、及びモードランク付け1075に用いられる。モードランク付け1075−1085からのモードと、連続的最適化とは、選択されたモード1095のためのモード選択1090中に考慮に入れられる。
或る実施形態では、モード選択1090は、第1に、並行最適化からのモードを考慮して、次いで第2に、連続最適化からのモード(それが存在するならば)を考慮する。他の実施形態においては、並行最適化からのモードは、連続的最適化からのモードよりも常に高位にランク付け且つ選択される。
図10Bはハイブリッド最適化技法の一例を表す流れ図を示す。並行最適化システムにおいて、例えば、一つ又は複数のモードが、概ね選択されそうにないものとして同定することができる(1002)。これらのモードは、より見込みが高いモードと比較して、個別の連続的最適化モードへ割り当てることができる(1004)。選択される見込みが低いモードについては、各々の歪測定基準値についてのラグランジアン・コスト関数を予め設定された閾値と比較することができる(1007)。コストが、対応する閾値よりも大きいならば、このモードは破棄して、もはやこのブロックの最適化には考慮しないものとする(1008)。他の全てのモードが、図7A−Bにて上述したような並行最適化システムを用いて検査される(1012)。次いで並行及び連続的最適化から最良のモードが選択される(1014)。
複数の歪抑制下のカスケード型最適化
図11Aは複数の歪抑制下のカスケード型最適化を用いる例示的なビデオ・コーディング計画1100の模式図を示す。特に、計画1100は並行最適化と連続最適化とをカスケード形式に組み合わせる。例えば、最適化すべきブロックについては、入力ブロック1105からの全てのM個のモードについてのラグランジアン・コスト関数1110―1120は、歪測定基準値Dに関して計算されて、比較される。D1に関して最低のラグランジアン・コストを有するM個のモードは、M≧1で保持される。これらのM個のモードはランク付け及び/又は除外1145して、先行ラウンドの結果1160(仮に存在するのであれば)に基づいて再度順位が付けられるようにしてもよい。
これらのM個のモードは次いで歪測定基準値Dを通り、ここでは、同様な手順がその基準値についてのサブセット1125について実行される。歪測定基準値Dについてのそのサブセット1125において、並行最適化1130が実行され、全てのモードについてのラグランジアン・コスト関数が計算されて比較される。歪測定基準値に対する最低ラグランジアン・コストを有するモードが保持されて(例えば、Dに対する最低ラグランジアン・コストを有するM個のモードが保持されて)、ランク付け及び/又は除外1150されて、任意の先行ラウンド、例えば歪測定基準値Dを有する従前のラウンドに基づいて再度順位が付けられる。
この処理は、M≧1,k=1,2,..,Kについて、全てのk歪測定基準値が検査されるまで続けることができる。歪測定基準値Dについてのサブセット1135が最適化されたとき、最適化はハイブリット最適化1140によることができる。これに代えて、最適化は他の並行又は連続型最適化とすることもできる。最適化1140が実行された後は、歪測定基準値に対して最低ラグランジアン・コスト関数を有するモードが保持されて、選択1155されて、この選択されたモード1170が利用可能である。或る実施形態においては、全てのK歪測定基準値が検査されるまで処理を続けるのに代えて、各ステップが、一つのモードを残すのみとなるまで、特定の数のモードを除外することにより、処理を早期に終了させることができる。本開示事項に提示された最適化方法の幾つかは、ビデオ圧縮システムにおける様々なモード決定を最適化するために用いることができ、これは、とりわけに、量子化パラメータ、動きベクトル、内部予測モード、ブロック・サイズのコーディング、変換、エントロピー・コーディング、色空間の選択などである。
図11Bはカスケード型最適化を実行するための例示的な処理1112の流れ図を示す。処理1112は、入力ブロック(1102)からの歪測定基準値の受信又はアクセスを起動し、歪測定基準値(1103)に基づいて並行(又はハイブリッド)最適化を実行する。歪測定基準値に対してラグランジアン・コストを有するモードが保持される(1104)。次いでモードはランク付け(1106)されて、(仮に存在するならば)先行ラウンドからの結果に基づいて再度順位付け(1107)される。処理に対して更に歪測定基準値が存在する(1108)ならば、次いで並行(又はハイブリッド)最適化が他の歪測定基準値で実行される。もはや処理すべき歪測定基準値が存在しない(1108)ならば、歪測定基準値に対して最低のラグランジアン・コスト関数を有するモードが保持されて選択される(1109)。或いは、このステップ1109は、最高性能を有するモードを選択するものとして表現することもできる。モードは残りの歪測定基準値のモードの性能に基づいて選択することができる。例示的システム
図12は複数の歪制約下のビデオ圧縮の開示された技術の何れ(及び任意の組合せ)も採用できるシステム図を表す。開示された技術は、一つ以上のコンピュータ1205A,1205Bに使用することができる。本明細書における一つ以上の方法及び/又はアルゴリズム及び/又は処理は、コンピュータ及び/又はビデオ・ディスプレイ1220、送信、処理、及び再生システムに実装することができる。本明細書に記載したコンピュータは、任意の種類のコンピュータとしてもよく、汎用目的と、例えばワークステーションとしての或る特定目的との何れのコンピュータでもよい。コンピュータ1250Bは、例えばIntel又はAMDベースのコンピュータであって、Window XP,Vista又はリナックスが実行されるもの、或いは、マッキントッシュ・コンピュータとしてもよい。或る実施形態において、コンピュータは、例えば、ハンドヘルド・コンピュータ、例えばPDA 1215、携帯電話1215、又はラップトップ1205Aとすることができる。コンピュータとは、特定のビデオ・データでイメージを記録又は受信1225,1230,1235,処理、記憶1240及びデータの配信のための複数の機械、或いは一台のの機械の部分を称してもよい。
コンピュータ及び/又はグラフィック・プログラムC又はパイソン又はJava、Brew又は他のプログラミング言語で記述してもよい。プログラムは記憶媒体、例えば、磁気又は光学記憶媒体、例えばコンピュータ・ハード・ドライブ、リムーバブル・ディスク、又は媒体例えばメモリー・スティック又はSDメディア、有線又は無線ネットワークに基づくもの、又はブルートゥースに基づくネットワーク・アタッチド・ストレージ(NAS)、又は他の取り外し可能な媒体に常駐させてもよい。プログラムはネットワーク1250上で実行してもよく、例えば、サーバー又は他の機械により通信を局所的マシンへ通信を送信し、これは局所的マシンに本明細書に説明された操作を実行させる。
幾つかの実施例を開示して上記に詳述したが、他の実施形態も可能であり、発明者は、それらも本明細書に包含されるように意図している。本明細書は、他の方式で達成可能なより一般的な目標を達成する特定の例を説明する。この開示事項は例示を意図しており、請求項は任意の変更例を又は代替例を包含することを意図している。
本発明に説明された主題件及び機能的操作は、本明細書に開示した構造体、及びそれらの構造的均等物を含めて、又はそれらの一つ以上の組み合わせを含めて、デジタル電子回路、コンピュータ・ソフト、ファームウェア、又はハードウェアで実行することができる。この明細書に記載される主題の実施形態は一つ以上のコンピュータ・プログラム製品、例えば、データ処理装置の操作を実行又は制御するコンピュータ読み取り可能記憶媒体は、機械読み取り可能な記憶デバイス1240、機械読み取り可能な記憶基板、メモリー・デバイス、機械読み取り可能な伝搬処理されている交信に影響する物質の組成、又はそれらの一つ以上の組合せとしてもよい。用語「データ処理装置」は、データを処理する全ての装置、デバイス及び機械を包含し、例としてプログマバブル・プロセッサ、コンピュータ、又は多重プロセッサ又は複数のコンピュータを含む。この装置は、ハードウェアに加えて、問題のコンピュータ・プログラムのための実行環境を形成するコード、例えば、プロセッサ・ファームウェア、プロトコル・スタック、グラフィック・システム、データベース管理システム、オペレーティング・システム又はそれらの一つ以上の組合せを構成するコードを含めることができる。
コンピュータ・プログラム(プログラム、ソフトウェア、ソフトウェア・アプリケーション、スクリプト又はコードとも称される)は、コンパイル言語又はインタープリテッド言語を含む任意の形式のプログラム言語で記述することができ、独立型プログラム、又はモジュール、コンポーネント、サブ・ルーティン、又は、コンピュータ環境における使用に適する他のユニットを含めて、任意の形式に展開できる。コンピュータ・プログラムは、ファイルシステムにおけるファイルと必ずしも一致するというわけではない。プログラムは、他のプログラムは、他のプログラム又はデータ(例えば、マークアップ言語ドキュメントに保管された一つ以上のスクリプト)を、問題のプログラムに専用の単独のファイル、又は多数の調整ファイル(例えば、一つ以上のモジュール、サブプログラム、又はコードの部分を記憶する)に記憶できる。コンピュータ・プログラムは、一つのコンピュータ又は複数のコンピュータで実行するように展開することができ、これらは一箇所の一つのサイトに位置するか又は多数のサイトに亘って分配されて、コミニュケーション・ネットワークによって相互接続される。
本明細書に説明及び図示されたプロセス及び論理フロー並びに図は、一つ以上のプログラマブル・プロセッサにより実行でき、それは一つ以上のコンピュータ・プログラムを実行し、入力データに操作して出力を生成する機能を実行する。このプロセッサ及び論理フローはまた以下により実行することができ、装置もまた以下として実装できる。即ち、特定目的論理回路、例えばFPGA(フィールド・プログマブル・ゲート・アレイ)又は他のプログマブル論理デバイス(PLD)、例えばマイクロプロセッサ、又はASIC(アプリケーション特定集積回路)である。
コンピュータ・プログラムの実行に適するプロセッサの例は、例えば、汎用と特定目的とのマイクロプロセッサの両方と、デジタル・コンピュータの任意の形式の任意の一つ以上のプロセッサである。一般に、プロセッサは、リード・オンリー・メモリ又はランダム・アクセス・メモリ又はその両方からの指令及びデータを受け取ることができる。コンピュータの基本的要素は、指令を実行するプロセッサと、指令及びデータを記憶する一つ以上のメモリ・デバイスである。一般に、コンピュータは、データを受信又は送信するように、一つ以上の大容量記憶装置(例えば、磁気、磁気光ディス、又は光ディスク)を包含するか、或いはこの大容量記憶装置に操作可能に接続されている。しかしながら、コンピュータは、このようなデバイスを備える必要はない、更に、コンピュータは、他のデバイス、幾つかの例をあげると、例えば携帯電話、パーソナル・デジタル・アシスタンツ(PDA)、携帯オーディオ・プレーヤー、全地球測位システム(GPS)レシーバーに埋設することもできる。コンピュータ読み取り媒体は、コンピュータ・プログラム指令及びデータを記憶するのに適しており、不揮発性メモリ、媒体及びメモリー・デバイスの全ての形態を含み、これは例えば半導体メモリー・デバイス(例えば、PROM、EPROM、及びフラッシュ・メモリ・デバイス)、磁気ディスク(例えば、内蔵ハードディスク又はリムーバブル・ディスク)、光磁気ディスク、及びCD―ROM及びDVD―ROMディスクを含む。プロセッサ及びメモリは、特殊用途論理回路により補うことができるか、それに組み込むことができる。
ユーザーとの相互対話を与えるために、本明細書で説明された主題の或る実施形態は、コンピュータに実装でき、このコンピュータは、ユーザーへ情報を表示するディスプレイ・デバイス、例えば、例えば、CRT(陰極線管)、LED(液晶ディスプレイ)、又はプラズマ・ディスプレイ・モニタ1220と、ユーザーがコンピュータへ入力を与えられるキーボード及びセレクター(例えばポインティング・デバイス、マウス、又はトラックボール)とを備える。他の種類のデバイスがユーザーへ相互対話を与えるために同様に用いることができ、例えば、ユーザーへ与るフィードバックは任意の感覚的フィードバックの形態とすることができ、例えば視覚のフィードバック(例えば、視覚のフィードバック、聴覚フィードバック、又は触覚型のフィードバック)であり、ユーザーからの入力は任意の形式で受け取ることができ、これは音声、発話、触覚型の入力を含む。
本明細書で記述される主題の或る実施形態は、コンピュータ・システムに実装することができ、これは、バックエンド成要素(例えばデータサーバ)を含み、又はミドルウェア構成要素(例えば、アプリケーション・サーバ)を含み、或いはフロントエンド構成要素(例えば、グラフィカル・ユーザ・インタフェースを有するクライアント・コンピュータを含むコンピュータ・システム)で実行することができ、又はウェブ・ブラウザ(これを通じてユーザーが本明細書で説明される主題の実施形態と対話できる)、又は一つ以上のそのようなバックエンド、ミドルウェア又はフロントエンド構成要素の任意の組合せである。このシステムの構成要素は、デジタル・データ通信(例えば、通信ネットワーク)の任意の形式、又は媒体で相互接続してもよい。通信ネットワークの例は、ローカル・エリア・ネットワーク(LAN)及びワイド・エリア・ネットワーク(WAN)、例えば、インターネットを含む。
コンピューティング・システムは、複数のクライアント及び複数のサーバーを含む。クランアントとサーバーとは、通常は、互い離隔しており、一般的には通信ネットワークで対話する。クライアントとサーバーとの関係は、それぞれのコンピュータで作動しているコンピュータ・プログラムによって起こり、互いにクライアント−サーバー関係を有する。
この開示事項は多くの特徴を含むが、これは請求されるものの限定又は何が請求されるかとして解釈すべきではなく、本発明の特定の実施形態に対する特徴の詳細の説明として解釈すべきものである。個別の実施形態の文脈で本明細書に説明された特定の特徴は、単独の実施形態に組合せて実行することもできる。逆に言えば、単独の実施形態の文脈で説明された様々な特徴は、個別の様々な実施形態、或いは任意の適時なサブ・コンビネーションで実行することもできる。更に、特定の組み合わせに働くものとして特徴を上述のように説明し、そのように初めに請求されさえするかもしれないが、請求された組合せからの一つ以上の特徴は、組合せから場合によって削除することができ、請求された組合せは、サブ・コンビーネーション或いはサブ・コンビーネーションの変形例も指向し得る。
同様に、特定の順序で図中に示された操作は、望ましい結果を成し遂げるために、そのような操作が図示された特定の順序で実行されるか、連続した順序で実行される操作が必要とされるものと理解すべきではない。特定の環境においては、マルチタスキング及び並列処理が有利なこともある。更に、上述に説明された実施形態の様々なシステム構成要素の分離は、全ての実施形態においてそのような分離を必要するものと理解すべきではなく、説明されたプログラム構成要素とシステムとは、通常は一つのソフトウェア又はハードウェア製品に一緒に集積することができるか、複数のソフトウェア又はハードウェア製品にパッケージできることに留意されたい。
用語「アルゴリズム」とは、本明細書に記述される結果を成し遂げるために、ステップ、方法、処理、計画、手順、操作、プログラム、ガイドライン、技術、シーケンス、及び/又は一組の規則又は指令を称することができる。例えば、アルゴリズムは、ハードウェア及び/又はソフトウェア・ビデオプロセッサのためのビデオ処理指令の一組のセットであり得る。ビデオ・データについては、開示されたアルゴリズムは、ビデオに関連することでき、以下に生成して、実行して、関連させ、又は採用することができる。即ち、ビデオ関連システム及び/又は任意のデバイス、機械、ハードウェア及び/又は処理、圧縮、記憶、送信、受信、検査、較正、表示のための製品、及び/又はビデオ・データについての任意の組み合わせの改良である。
本明細書に説明された技術及びシステムは、他のマルチメディア用途、例えば音声圧縮と処理での最適化にさらに拡張することができる。本開示事項において提示される様々なラグランジアン・コスト関数コストの様々な形式の一つ以上の実施形態は、様々な表示、処理及び/又は歪特性を考慮することができる。
本発明の実施例は、以下に列挙された例示的実施形態の一つ以上に関してもよい。
1.ビデオ・コーディングのための方法であって、
第1の歪測定基準値を用いて、複数のコーディング・モードについて、ラグランジアン・コスト値関数の第1のセットを決定し、
第2の歪測定基準値を用いて、複数のコーディング・モードについて、ラグランジアン・コスト関数の第2セットを決定し、
ラグランジアン・コスト値の第1のセット及びラグランジアン・コスト値の第2のセットに基づいて複数のコーディング・モード一つを選択し、及び、
第2の選択されたコーディング・モードを用いてピクセル・ブロックをエンコーディングすることを含む方法。
2. 列挙された例示的実施形態の方法であって、第1及び第2のラグランジアン・コスト値が異なるビット目標レートを含む方法。
3. 列挙された例示的実施形態の方法であって、歪測定基準値は、ビデオ・ディスプレイの特性に関連した情報を含み、ビデオ・ディスプレイの特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイの特性、ビデオ・ディスプレイのビデオ処理性能の測定値、ディスプレイの歪特性、ビデオ・ディスプレイの時間的特性又はビデオ・ディスプレイの空間特性を含む方法。
4. 列挙された例示的実施形態の方法であって、歪測定基準値が、更に複数のビデオ・ディスプレイの特性に関連した情報を含み、その複数のビデオ・ディスプレイの特性が、複数のビデオ・ディスプレイの使用についてのパラメータ、ビデオ・ディスプレイの一つ以上の重要性を示すパラメータ、ビデオ・ディスプレイの設計型式についてのパラメータ、複数のビデオ・ディスプレイについての表示技術の型式のパラメータ、及び特性の任意の組合を用いる複数のビデオ・ディスプレイをランク付けするパラメータ。
5.列挙された例示的実施形態の方法であって、モードの選択は、ビデオ・ディスプレイの同様の特性を有するビデオ・ディスプレイの特性についての歪測定基準値情報値に関連付けに基づいた歪測定基準値の第1のサブセットを選択することする方法。
6. 列挙された例示的実施形態の方法であって、モードの選択は、複数のコーディング・モードのランキングからなる方法。
7. 列挙された例示的実施形態の方法であって、
第3の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第3のセットを決定し、
第4の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第4のセットを決定し、
ラグランジアン・コスト値の複数の前記セットに基づいて複数のコーディング・モードのうちの一つを選択し、
前記選択されたコーディング・モードを用いて第2のピクセル・ブロックをエンコーディングすることを更に含む方法。
8. ビデオ・コーディングのための方法であって、
ビデオ・エンコーダーから複数のチャンネルへ圧縮ビット・ストリームを送り、そのチャンネルは目標ビット・レート及び複数の歪測定基準値を含み、
前記チャンネルの一つからの歪測定基準値の一つを第1のビデオ・ディスプレイの特性へ整合させ、及び
第1のビデオ・ディスプレイの特性に整合する前記歪測定基準値を有する第1のビデオ・ディスプレイへビデオ・データを送ることを含む方法。
9. 列挙された例示的実施形態0の方法であって 複数の歪測定基準値がビデオ・ディスプレイの特性に関連付けられた情報を含み、その特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイのビデオ処理性能の測定値、ディスプレイの歪特性、ビデオ・ディスプレイの時間的特性又はビデオ・ディスプレイの空間特性に関連した情報を含む方法。
10. 列挙された例示的実施形態の方法であって、前記歪測定基準値が、複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量のパラメータ、複数のビデオ・ディスプレイの特性、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイのための表示技術形式パラメータ、前記特性の任意の組合せを用いる複数のビデオ・ディスプレイをランキングクするパラメータとを含む方法。
11. 列挙された例示的実施形態の方法であって、圧縮したビット・ストリームを送る前に、ラグランジアン・コスト関数を用いて一つのピクセルのブロックをエンコーディングし、そのラグランジアン・コスト関数は、対応するビット目標レートを有する複数の歪測定基準値を有する複数のモードを含むエンコーディングからの歪情報を含む方法。
12. 列挙された例示的実施形態の方法であって、各チャンネルにおける複数の歪測定基準値を、第1のビデオ・ディスプレイの同様な特性を有するビデオ・ディスプレイの特性についての歪測定基準値の情報の関連付けに基づいて、ランキングし、一つのチャンネルからの一つの歪基準値の整合は最高位にランク付けされた歪測定基準値を選択することを更に含む方法。
13.列挙された例示的実施形態の方法であって、整合しない歪測定基準値を除外することを更に含む方法。
14. 複数の歪制約下のビデオ・コーディングの方法であって、
歪測定基準値を複数の候補モードへ関連付け、その歪測定基準の各々は候補モードの一つのグループに関係しており、
前記複数の候補モードを各々のラグランジアン・コスト関数で同時に処理し、
各々の歪測定基準値ごとに、各グループ内の前記候補モードをラグランジアン・コスト関数によってランクキング付けし、
候補モードの各々のグループの間の前記候補モードのランキングを比較し、
最高ランキングを有する候補モードの前記グループを選択し、
候補モード内の選択されたグループ内で最高ランキングの候補モードを選択することに基づいてビデオ・ディスプレイについての目標モードを選択することを含む方法。
15. 列挙された例示的実施形態0の方法であって、前記ランキングが、ビデオ・ディスプレイの特性を歪基準値特性に関連付けることに基づく方法。
16. 列挙された例示的実施形態0の方法であって、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連付けられた情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイ特性、ビデオ処理性能の測定値、歪特性、時間的特性又は空間的特性を含む方法。
17. 列挙された例示的実施形態の方法であって、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、そのビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量のパラメータ、一つ以上のビデオ・ディスプレイの一つ以上の重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイについての表示技術形式のパラメータ、特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含む方法。
18. 複数の歪制約下のビデオ・コーディングの方法であって、
ビデオ情報のビットストリームを処理し、第1の歪測定基準値を有する第1のモードについての第1のラグランジアン・コスト関数を決定し、
第1のラグランジアン・コスト関数を閾値と比較し、
第1のラグランジアン・コスト関数が前記閾値よりも大きければ、第1の歪測定基準値を有するモードを除外し、
第1のラグランジアン・コスト関数が前記閾値よりも小さければ、第2の歪測定基準値を有する第1のモードについての第2のラグランジアン・コストを決定することを含む方法。
19. 列挙された例示的実施形態の方法であって、
第2のラグランジアン・コスト関数を閾値と比較し、
第2のラグランジアン・コスト関数が前記閾値よりも大きければ、第2の歪測定基準値を有するモードを除外し、
第2のラグランジアン・コスト関数が前記閾値よりも小さければ、前記ビデオ情報の処理により、第3の歪測定基準値を有する第1のモードについての第3のラグランジアン・コストを決定することを含む方法。
20. 複数の歪制約下のビデオ・コーディングの方法であって、
複数のモードの各々についての複数の歪測定基準値を有する複数のモードについて
ビデオ情報のビットストリームを処理し、各モードについて歪測定基準値によりラグランジアン・コスト関数を決定し、
各々のラグランジアン・コスト関数を閾値と比較し、
各々のラグランジアン・コスト関数が前記閾値よりも大きければ、前記歪基準値を有する各モードを除外し、
各々のラグランジアン・コスト関数が閾値よりも小さいならば、後続の歪測定基準値を有する各モードについての後続のラグランジアン・コストを決定し、
全てのモードについての全ての歪測定基準が比較されるか除外されるまで、各々のラグランジアン・コスト関数が連続的に決定されて、閾値と比較される方法。
21.列挙された例示的実施形態の方法であって、前記歪測定基準値がビデオ・ディスプレイ特性に関連した情報を含み、前記ビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の測定値、歪特性、時間的特性又は空間的特性を含む方法。
22. 列挙された例示的実施形態の方法であって、前記歪測定基準が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量のパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイの表示技術形式プのパラメータと、これらの特性の任意の組合を用いる複数のビデオ・ディスプレイのランキングのためのパラメータを含む方法。
23. 列挙された例示的実施形態の方法であって、保持された前記歪測定基準値を有するモードについて、この方法は、保持された前記歪測定基準値を有するモードを有する前記モードのサブセットを選択して、ビデオ・ディスプレイに関するビデオ情報を表すことに関連した構成要素を出力する方法。
24. 列挙された例示的実施形態の方法であって、一つ以上のモード又は一つ以上の歪測定基準値モードについての閾値の値を調節することを更に含む方法。25.列挙された例示的実施形態の方法であって、前記閾値がマクロブロックに関連する歪の関数であり、前記閾値関数が、マクロブロックに隣接するマクロブロックについての歪の相関関係の測定値を含む方法。
26. ビデオ・コーディング方法であって、
統計を用いて、並行最適化コーディングのために統計的に選択されそうにない一つ以上のコーディング・モードを特定し、
統計的に選択されそうである一つ以上のコーディング・モードについては、並行最適化コーディングによって一つ以上のコーディング・モードを処理し、
統計的に選択されそうにない一つ以上のモードについては、連続的最適化コーディングを採用し、及び
性能基準値を用いて、前記並行最適化コーディング及び前記連続的最適化コーディングからモードのサブセットを選択する方法。
27.列挙された例示的実施形態の方法であって、 連続的最適化コーディングが、
一つ以上のコーディング・モードについての複数の歪測定基準値について、
ビデオ情報を処理して、前記コーディング・モードの各々についてラグランジアン・コスト関数を決定し、
各々のラグランジアン・コスト関数を閾値と比較し、
各々のラグランジアン・コスト関数が前記閾値よりも大きければ、各歪測定基準値を有す各コーディング・モードを除外し、
各々のラグランジアン・コスト関数が閾値より小さければ、後続の歪測定基準値を有する各コーディング・モードについての後続のラグランジアン・コスト関数を決定し、
全てのコーディング・モードについての全ての歪測定基準値が比較されて除外されるまで、各々のラグランジアン・コスト関数が連続的に決定されて前記閾値と比較される方法。
28.列挙された例示的実施形態の方法であって、並行最適化コーディングが、
複数の歪測定基準値を有する一つ以上のモードに同時にアクセスし、
前記複数の歪測定基準値を複数の候補モードへ関連付け、その複数の歪測定基準値の各々は候補モードの一つのグループへ関連付けられており、
前記複数の候補モードを各々のラグランジアン・コストで同時に処理し、
各々の歪測定基準値について、各グループ内の前記複数の候補モードを前記ラグランジアン・コスト関数によりランキングし、
候補モードの各グループの中の前記候補モードのランキングを比較し、
最高ランキングを有する候補モードの前記グループを選択し、
候補モードの前記選択されたグループ内の最高ランキング候補モードの選択に基づいてビデオ・ディスプレイについての目標モードを選択することを含む方法。
29. 列挙された例示的実施形態の方法であって、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連した情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の測定値、歪特性、時間的特性、又は空間的特性を含む方法。
30. 列挙された例示的実施形態の方法であって、前記歪測定基準値は、
複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数の数のビデオ・ディスプレイの特性は、前記複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイをランキングするパラメータを含む方法。
31. ビデオ・コーディング方法であって、
第1の歪測定基準値を有するビットストリームにアクセスし、
第1の歪測定基準値に関連する第1の複数のモードについてのラグランジアン・コスト関数を同時に処理し、
第1の複数のモードの前記ラグランジアン・コスト関数を比較し、この比較は、第1の複数のモードの前記ラグランジアン・コスト関数のランキングに関係しており、
この比較に基づいて、第1の複数のモードからモードの第1のサブセットを選択し、
先行するモード・ランキングからのデータに基づいて、第1のサブセットの順位を配列し、
第1の歪測定基準値を用いてモードの第1のサブセットについてのラグランジアン・コスト関数を同時に処理し、
モードの第1のサブセットのラグランジアン・コスト関数を比較し、この比較はモードの第1のサブセットのラグランジアン・コスト関数のランキングに関係し、
モードの第1のサブセットの前記ラグランジアン・コスト関数の前記ランキングに基づいて第1の複数のモードからモードの第2のサブセットを選択し、及び、
先行するモード・ランキングからのデータに基づいてモードの第2のサブセットの順位を配列することを含む方法。
32.列挙された例示的実施形態の方法であって、歪測定基準値がビデオ・ディスプレイ特性に関連した情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の測定値、歪特性、時間的特性、又は空間的特性を含む方法。
33. 列挙された例示的実施形態の方法であって、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスププレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含む方法。
34. コンピュータ・プログラム製品であって、コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置にビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
第1の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第1のセットを決定し、
第2の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第2のセットを決定し、
前記ラグランジアン・コスト値の第1のセット及び前記ラグランジアン・コスト値の第2のセットに基づいて前記複数のコーディング・モードの一つを選択し、及び、
前記選択されたコーディング・モードを用いて一つのピクセル・ブロックをエンコーディングすることを含むコンピュータ・プログラム製品。
35. 列挙された例示的実施形態のコンピュータ・プログラム製品であって、第1及び第2のラグランジアン・コスト値は異なるビット目標レートを含むコンピュータ・プログラム製品。
36.列挙された例示的実施形態のコンピュータ・プログラム製品であって、歪測定基準値がビデオ・ディスプレイの特性に関連した情報を含み、そのビデオ・ディスプレイの特性は、スクリーン・ディスプレイ・サイズ、前記ビデオ・ディスプレイのビデオ処理性能の測定値、表示の歪特性、前記ビデオ・ディスプレイの時間的特性、又は前記ビデオ・ディスプレイの空間特性を含むコンピュータ・プログラム製品。
37.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記歪測定基準値は複数のビデオ・ディスプレイの特性に関連した情報を更に含み、この複数のビデオ・ディスプレイの特性は、前記複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上の前記ビデオ・ディスプレイの重要性を示すパラメータ、前記複数のビデオ・ディスプレイの設計型式についてのパラメータ、前記複数のビデオ・ディスププレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むコンピュータ・プログラム製品。
38.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記モードの選択は、ビデオ・ディスプレイの特性についての歪測定基準値の情報を、ビデオ・ディスプレイの類似した特性に関連付けることに基づいて、歪測定基準値の第1のサブセットを選択する操作を含むコンピュータ・プログラム製品。
39.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記モードの選択は、前記複数のコーディング・モードをランキングする操作を含むコンピュータ・プログラム製品。
40.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記操作は更に、
第3の歪測定基準値を用いて前記複数のコーディング・モードについてのラグランアン・コスト値の第3のセットを決定し、
第4の歪測定基準値を用いて前記複数のコーディング・モードについてのラグランアン・コスト値の第4のセットを決定し、
ラグランアン・コスト値の前記セットに基づいて前記複数のコーディング・モードのうちの一つを選択し、及び、
前記選択されたコーディング・モードを用いて第2のピクセル・ブロックをエンコーディングすることを更に含むコンピュータ・プログラム製品。
41.コンピュータ・プログラム製品であって、コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置にビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
ビデオ・エンコーダーから複数のチャンネルへ圧縮ビット・ストリームを送り、そのチャンネルは目標ビット・レート及び複数の歪測定基準値を含み、
前記チャンネルのうちの一つから第1のビデオ・ディスプレイの特性へ前記歪測定基準値のうちの一つを整合させ、及び、
第1のビデオ・ディスプレイの特性に整合する前記歪測定基準値で第1のビデオ・ディスプレイへビデオ・データを送ることを含むコンピュータ・プログラム製品。
42.列挙された例示的実施形態のコンピュータ・プログラム製品であって、複数の歪測定基準値がビデオ・ディスプレイの特性に関連した情報を含み、た例実施形態のコンピュータ・プログラム製品、スクリーン・ディスプレイ・サイズから成っている特徴、ビデオ・ディスプレイのビデオ処理性能の測定値、表示に特有の歪、ビデオ・ディスプレイの時間的特性、又はビデオ・ディスプレイの空間特性をコンピュータ・プログラム製品。
43.列挙された例示的実施形態のコンピュータ・プログラム製品であって、
前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むコンピュータ・プログラム製品。
44.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記操作が更に、
圧縮ビット・ストリームを送る前に、ラグランジアン・コスト関数を用いて1ピクセルのブロックをエンコーディングし、そのラグランジアン・コスト関数は、対応するビット目標レートを有する複数の歪測定基準値を有する複数のモードを含むエンコーディングからの歪情報を含むコンピュータ・プログラム製品。
45.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記操作が更に、各チャンネルにおける複数の歪測定基準値を、第1のビデオ・ディスプレイの同様な特性を有するビデオ・ディスプレイの特性についての歪測定基準値の情報の関連付けに基づいて、ランキングし、一つのチャンネルからの一つの歪基準値の整合は最高位にランク付けされた歪測定基準値を選択することを更に含むコンピュータ・プログラム製品。
46.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記操作が更に、整合しない歪測定基準値を除外することを更に含むコンピュータ・プログラム製品。
47.コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置に複数の歪制約下でビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
歪測定基準値を複数の候補モードへ関連付け、その歪測定基準の各々は候補モードの一つのグループに関係しており、
前記複数の候補モードを各々のラグランジアン・コスト関数で同時に処理し、
各々の歪測定基準値ごとに、各グループ内の前記候補モードをラグランジアン・コスト関数によってランクキング付けし、
候補モードの各々のグループの間の前記候補モードのランキングを比較し、
最高ランキングを有する候補モードの前記グループを選択し、
候補モード内の選択されたグループ内で最高ランキングの候補モードを選択することに基づいてビデオ・ディスプレイについての目標モードを選択することを含むコンピュータ読取り可能な媒体。
48.列挙された例示的実施形態のコンピュータ読取り可能な媒体であって、前記ランキングが、ビデオ・ディスプレイの特性を歪基準値特性に関連付けることに基づくコンピュータ読取り可能な媒体。
49.列挙された例示的実施形態のコンピュータ読取り可能な媒体であって、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連付けられた情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイ特性、ビデオ処理性能の測定値、歪特性、時間的特性又は空間的特性を含むコンピュータ読取り可能な媒体。
50.列挙された例示的実施形態のコンピュータ読取り可能な媒体であって、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、そのビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量のパラメータ、一つ以上のビデオ・ディスプレイの一つ以上の重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイについての表示技術形式のパラメータ、特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むコンピュータ読取り可能な媒体。
51.コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置に複数の歪制約下でビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
ビデオ情報のビット・ストリームを処理し、第1の歪測定基準値を有する第1のモードについての第1のラグランジアン・コスト関数を決定し、
第1のラグランジアン・コスト関数を閾値と比較し、
第1のラグランジアン・コスト関数が前記閾値よりも大きければ、第1の歪測定基準値を有するモードを除外し、
第1のラグランジアン・コスト関数が前記閾値よりも小さければ、第2の歪測定基準値を有する第1のモードについての第2のラグランジアン・コストを決定することを含むコンピュータ読取り可能な媒体。
52.列挙された例示的実施形態のコンピュータ読取り可能な媒体であって、
第2のラグランジアン・コスト関数を閾値と比較し、
第2のラグランジアン・コスト関数が前記閾値よりも大きければ、第2の歪測定基準値を有するモードを除外し、
第2のラグランジアン・コスト関数が前記閾値よりも小さければ、前記ビデオ情報の処理により、第3の歪測定基準値を有する第1のモードについての第3のラグランジアン・コストを決定することを含む方法。
53.コンピュータ・プログラム製品であって、コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置に複数の歪制約下でビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
前記複数のモードについての複数の歪測定基準値を有する複数のモードについて、
ビデオ情報のビット・ストリームを処理し、各モードについての歪測定基準値を有するラグランジアン・コスト関数を決定し、
各々のラグランジアン・コスト関数を閾値と比較し、
各々のラグランジアン・コスト関数が前記閾値よりも大きければ、前記歪基準値を有する各モードを除外し、
各々のラグランジアン・コスト関数が閾値よりも小さいならば、後続の歪測定基準値を有する各モードについての後続のラグランジアン・コストを決定し、
全てのモードについての全ての歪測定基準が比較されるか除外されるまで、各々のラグランジアン・コスト関数を連続的に決定して、閾値と比較するコンピュータ・プログラム。
54.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連付けられた情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイ特性、ビデオ処理性能の測定値、歪特性、時間的特性又は空間的特性を含むコンピュータ・プログラム製品。
55.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、そのビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量のパラメータ、一つ以上のビデオ・ディスプレイの一つ以上の重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイについての表示技術形式のパラメータ、特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むコンピュータ・プログラム製品。
56.列挙された例示的実施形態のコンピュータ・プログラム製品において、保持された前記歪測定基準値を有するモードについて、前記操作は、保持された前記歪測定基準値を有するモードを有する前記モードのサブセットを選択して、ビデオ・ディスプレイに関するビデオ情報を表すことに関連した成分を出力するコンピュータ・プログラム製品。
57.列挙された例示的実施形態のコンピュータ・プログラム製品において、一つ以上のモード又は一つ以上の歪測定基準値モードについての閾値の値を調節することを更に含むコンピュータ・プログラム製品。
58.列挙された例示的実施形態のコンピュータ・プログラム製品において、前記閾値がマクロブロックに関連する歪の関数であり、前記閾値関数が、マクロブロックに隣接するマクロブロックについての歪の相関関係の測定値を含むコンピュータ・プログラム製品。
59.ビデオ・コーディング・コンピュータ・プログラム製品であって、コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置に複数の歪制約下でビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
統計を用いて、並行最適化コーディングのために統計的に選択されそうにない一つ以上のコーディング・モードを特定し、
統計的に選択されそうである一つ以上のコーディング・モードについては、並行最適化コーディングによって一つ以上のコーディング・モードを処理し、
統計的に選択されそうにない一つ以上のモードについては、連続的最適化コーディングを採用し、及び
性能基準値を用いて、前記並行最適化コーディング及び前記連続的最適化コーディングからモードのサブセットを選択するビデオ・コーディング・コンピュータ・プログラム製品。
60.列挙された例示的実施形態のコンピュータ・プログラム製品において、 連続的最適化コーディングが、
一つ以上のコーディング・モードについての複数の歪測定基準値について、
ビデオ情報を処理して、前記コーディング・モードの各々についてラグランジアン・コスト関数を決定し、
各々のラグランジアン・コスト関数を閾値と比較し、
各々のラグランジアン・コスト関数が前記閾値よりも大きければ、各歪測定基準値を有す各コーディング・モードを除外し、
各々のラグランジアン・コスト関数が閾値より小さければ、後続の歪測定基準値を有する各コーディング・モードについての後続のラグランジアン・コスト関数を決定し、
全てのコーディング・モードについての全ての歪測定基準値が比較されて除外されるまで、各々のラグランジアン・コスト関数が連続的に決定されて前記閾値と比較されるコンピュータ・プログラム製品。
61.列挙された例示的実施形態のコンピュータ・プログラム製品であって、前記並行最適化コーディングが、
複数の歪測定基準値を有する一つ以上のモードに同時にアクセスし、
前記複数の歪測定基準値を複数の候補モードへ関連付け、その複数の歪測定基準値の各々は候補モードの一つのグループへ関連付けられており、
前記複数の候補モードを各々のラグランジアン・コストで同時に処理し、
各々の歪測定基準値について、各グループ内の前記複数の候補モードを前記ラグランジアン・コスト関数によりランキングし、
候補モードの各グループの中の前記候補モードのランキングを比較し、
最高ランキングを有する候補モードの前記グループを選択し、
候補モードの前記選択されたグループ内の最高ランキング候補モードの選択に基づいてビデオ・ディスプレイについての目標モードを選択することを含むコンピュータ・プログラム製品。
62. 列挙された例示的実施形態のコンピュータ・プログラム製品において、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連した情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の測定値、歪特性、時間的特性、又は空間的特性を含むコンピュータ・プログラム製品。
63.列挙された例示的実施形態のコンピュータ・プログラム製品において、
前記歪測定基準値は、
複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数の数のビデオ・ディスプレイの特性は、前記複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイをランキングするパラメータを含むコンピュータ・プログラム製品。
64.ビデオ・コーディング・コンピュータ・プログラム製品であって、
コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置に複数の歪制約下でビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
第1の歪測定基準値を有するビットストリームにアクセスし、
第1の歪測定基準値に関連する第1の複数のモードについてのラグランジアン・コスト関数を同時に処理し、
第1の複数のモードの前記ラグランジアン・コスト関数を比較し、この比較は、第1の複数のモードの前記ラグランジアン・コスト関数のランキングに関係しており、
この比較に基づいて、第1の複数のモードからモードの第1のサブセットを選択し、
先行するモード・ランキングからのデータに基づいて、第1のサブセットの順位を配列し、
第1の歪測定基準値を用いてモードの第1のサブセットについてのラグランジアン・コスト関数を同時に処理し、
モードの第1のサブセットのラグランジアン・コスト関数を比較し、この比較はモードの第1のサブセットのラグランジアン・コスト関数のランキングに関係し、
モードの第1のサブセットの前記ラグランジアン・コスト関数の前記ランキングに基づいて第1の複数のモードからモードの第2のサブセットを選択し、及び、
先行するモード・ランキングからのデータに基づいてモードの第2のサブセットの順位を配列することを含むビデオ・コーディング・コンピュータ・プログラム製品。
65.列挙された例示的実施形態のコンピュータ・プログラムにおいて、前記歪測定基準値がビデオ・ディスプレイ特性に関連した情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の測定値、歪特性、時間的特性、又は空間的特性を含むコンピュータ・プログラム製品。
66.列挙された例示的実施形態のコンピュータ・プログラム製品において、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスププレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むコンピュータ・プログラム製品。
67.ビデオ・コーディングのためのシステムであって、ビデオ・コーディングのための指令を扱う一つ以上の構成要素を備え、この一つ以上の構成要素は指令を処理し、その指令は、
第1の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第1のセットを決定し、
第2の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第2のセットを決定し、
前記ラグランジアン・コスト値の第1のセット及び前記ラグランジアン・コスト値の第2のセットに基づいて前記複数のコーディング・モードの一つを選択し、及び、
前記選択されたコーディング・モードを用いて一つのピクセル・ブロックをエンコーディングすることを含むシステム。
68.列挙された例示的実施形態のシステムであって、第1及び第2のラグランジアン・コスト値は異なるビット目標レートを含むシステム。
69.列挙された例示的実施形態のシステムにおいて、前記歪測定基準値がビデオ・ディスプレイの特性に関連した情報を含み、そのビデオ・ディスプレイの特性は、スクリーン・ディスプレイ・サイズ、前記ビデオ・ディスプレイのビデオ処理性能の測定値、表示の歪特性、前記ビデオ・ディスプレイの時間的特性、又は前記ビデオ・ディスプレイの空間特性を含むシステム。
70.列挙された例示的実施形態のシステムにおいて、前記歪測定基準値は複数のビデオ・ディスプレイの特性に関連した情報を更に含み、この複数のビデオ・ディスプレイの特性は、前記複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上の前記ビデオ・ディスプレイの重要性を示すパラメータ、前記複数のビデオ・ディスプレイの設計型式についてのパラメータ、前記複数のビデオ・ディスプレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むシステム。
71.列挙された例示的実施形態のシステムにおいて、前記モードの選択のための指令は、ビデオ・ディスプレイの特性についての歪測定基準値の情報を、ビデオ・ディスプレイの類似した特性に関連付けることに基づいて、歪測定基準値の第1のサブセットを選択する指令を含むシステム。
72.列挙された実施形態のコンピュータ・プログラム製品であって、前記モードの選択は、前記複数のコーディング・モードをランキングする操作を含むシステム。
73.列挙された例示的実施形態のシステムであって、前記指令は更に、
第3の歪測定基準値を用いて前記複数のコーディング・モードについてのラグランアン・コスト値の第3のセットを決定し、
第4の歪測定基準値を用いて前記複数のコーディング・モードについてのラグランアン・コスト値の第4のセットを決定し、
ラグランアン・コスト値の前記セットに基づいて前記複数のコーディング・モードのうちの一つを選択し、及び、
前記選択されたコーディング・モードを用いて第2のピクセル・ブロックをエンコーディングすることを更に含むシステム。
74.ビデオ・コーディングのためのシステムであって、ビデオ・コーディングのための指令を扱う一つ以上の構成要素を備え、この一つ以上の構成要素は指令を処理し、その指令は、
コンピュータ・プログラム製品であって、コンピュータ読取り可能な媒体に明らかにエンコードされており、データ処理装置にビデオ・コーディングのための操作を実行させる指令を含み、その操作は、
ビデオ・エンコーダーから複数のチャンネルへ圧縮ビット・ストリームを送り、そのチャンネルは目標ビット・レート及び複数の歪測定基準値を含み、
前記チャンネルのうちの一つから第1のビデオ・ディスプレイの特性へ前記歪測定基準値のうちの一つを整合させ、及び、
第1のビデオ・ディスプレイの特性に整合する前記歪測定基準値で第1のビデオ・ディスプレイへビデオ・データを送ることを含むシステム。
75.列挙された例示的実施形態のシステムであって、複数の歪測定基準値がビデオ・ディスプレイの特性に関連した情報を含み、このビデオ・ディスプレイの特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイのビデオ処理性能の測定値、表示の歪特性、ビデオ・ディスプレイの時間的特性、又はビデオ・ディスプレイの空間特性を含むシステム。
76.列挙された例示的実施形態のシステムであって、
前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むシステム。
77. 列挙された例示的実施形態のシステムであって、前記指令が更に、
圧縮ビット・ストリームを送る前に、ラグランジアン・コスト関数を用いて1ピクセルのブロックをエンコーディングし、そのラグランジアン・コスト関数は、対応するビット目標レートを有する複数の歪測定基準値を有する複数のモードを含むエンコーディングからの歪情報を含むシステム。
78.列挙された例示的実施形態のシステムであって、前記操作が更に、各チャンネルにおける複数の歪測定基準値を、第1のビデオ・ディスプレイの同様な特性を有するビデオ・ディスプレイの特性についての歪測定基準値の情報の関連付けに基づいて、ランキングし、一つのチャンネルからの一つの歪基準値の整合は最高位にランク付けされた歪測定基準値を選択することを更に含むシステム。
79.列挙された例示的実施形態のシステムにおいて、前記指令が更に、整合しない歪測定基準値を除外することを更に含むシステム。
80.ビデオ・コーディングのためのシステムであって、ビデオ・コーディングのための指令を扱う一つ以上の構成要素を備え、この一つ以上の構成要素は指令を処理し、その指令は、
歪測定基準値を複数の候補モードへ関連付け、その歪測定基準の各々は候補モードの一つのグループに関係しており、
前記複数の候補モードを各々のラグランジアン・コスト関数で同時に処理し、
各々の歪測定基準値ごとに、各グループ内の前記候補モードをラグランジアン・コスト関数によってランクキング付けし、
候補モードの各々のグループの間の前記候補モードのランキングを比較し、
最高ランキングを有する候補モードの前記グループを選択し、
候補モード内の選択されたグループ内で最高ランキングの候補モードを選択することに基づいてビデオ・ディスプレイについての目標モードを選択することを含むシステム。
81.列挙された例示的実施形態のシステムにおいて、前記ランキングが、ビデオ・ディスプレイの特性を歪基準値特性に関連付けることに基づくシステム。
82.列挙された例示的実施形態のシステムにおいて、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連付けられた情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイ特性、ビデオ処理性能の測定値、歪特性、時間的特性又は空間的特性を含むシステム。
83.列挙された例示的実施形態のシステムにおいて、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、そのビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量のパラメータ、一つ以上のビデオ・ディスプレイの一つ以上の重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイについての表示技術形式のパラメータ、特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むシステム。
84.ビデオ・コーディングのためのシステムであって、ビデオ・コーディングのための指令を扱う一つ以上の構成要素を備え、この一つ以上の構成要素は指令を処理し、その指令は、
ビデオ情報のビット・ストリームを処理し、第1の歪測定基準値を有する第1のモードについての第1のラグランジアン・コスト関数を決定し、
第1のラグランジアン・コスト関数を閾値と比較し、
第1のラグランジアン・コスト関数が前記閾値よりも大きければ、第1の歪測定基準値を有するモードを除外し、
第1のラグランジアン・コスト関数が前記閾値よりも小さければ、第2の歪測定基準値を有する第1のモードについての第2のラグランジアン・コストを決定することを含むシステム。
85.列挙されたシステムの例示的実施形態においては、
第2のラグランジアン・コスト関数を閾値と比較し、
第2のラグランジアン・コスト関数が前記閾値よりも大きければ、第2の歪測定基準値を有するモードを除外し、
第2のラグランジアン・コスト関数が前記閾値よりも小さければ、前記ビデオ情報の処理により、第3の歪測定基準値を有する第1のモードについての第3のラグランジアン・コストを決定することを含むシステム。
86.複数の歪抑制下でビデオ・コーディングのためのシステムであって、ビデオ・コーディングのための指令を扱う一つ以上の構成要素を備え、この一つ以上の構成要素は指令を処理し、その指令は、
前記複数のモードの各々についての複数の歪測定基準値を有する複数のモードについて、
ビデオ情報のビット・ストリームを処理し、各モードについての歪測定基準値を有するラグランジアン・コスト関数を決定し、
各々のラグランジアン・コスト関数を閾値と比較し、記歪基準値を有する各モードを除外し、
各々のラグランジアン・コスト関数が閾値よりも小さいならば、後続の歪測定基準値を有する各モードについての後続のラグランジアン・コストを決定し、
全てのモードについての全ての歪測定基準が比較されるか除外されるまで、各々のラグランジアン・コスト関数を連続的に決定して、閾値と比較するシステム。
87.列挙された例示的実施形態のシステムにおいて、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連付けられた情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ・ディスプレイ特性、ビデオ処理性能の測定値、歪特性、時間的特性又は空間的特性を含むシステム。
88.列挙された例示的実施形態のシステムにおいて、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、そのビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量のパラメータ、一つ以上のビデオ・ディスプレイの一つ以上の重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイについての表示技術形式のパラメータ、特性の任意の組合せを用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むコンピュータ読取り可能な媒体。
89.列挙された例示的実施形態のシステムであって、保持された前記歪測定基準値を有するモードについて、このシステムは、保持された前記歪測定基準値を有するモードを有する前記モードのサブセットを選択して、ビデオ・ディスプレイに関するビデオ情報を表すことに関連した構成要素を出力するシステム。
90. 列挙された例示的実施形態のシステムにおいて、一つ以上のモード又は一つ以上の歪測定基準値モードについての閾値の値を調節することを更に含むシステム。
91.列挙された例示的実施形態のシステムにおいて、前記閾値がマクロブロックに関連する歪の関数であり、前記閾値関数が、マクロブロックに隣接するマクロブロックについての歪の相関関係の測定値を含むシステム。
92.複数の歪抑制下でビデオ・コーディングをするビデオ・コーディング・システムにおいて、ビデオ・コーディングのための指令を扱う一つ以上の構成要素を備え、この一つ以上の構成要素は指令を処理し、その指令は、
統計を用いて、並行最適化コーディングのために統計的に選択されそうにない一つ以上のコーディング・モードを特定し、
統計的に選択されそうである一つ以上のコーディング・モードについては、並行最適化コーディングによって一つ以上のコーディング・モードを処理し、
統計的に選択されそうにない一つ以上のモードについては、連続的最適化コーディングを採用し、及び
性能基準値を用いて、前記並行最適化コーディング及び前記連続的最適化コーディングからモードのサブセットを選択するシステム。
93.列挙された例示的実施形態のシステムであって、前記連続的最適化コーディングのための指令が、
一つ以上のコーディング・モードについての複数の歪測定基準値について、
ビデオ情報を処理して、前記コーディング・モードの各々についてラグランジアン・コスト関数を決定し、
各々のラグランジアン・コスト関数を閾値と比較し、
各々のラグランジアン・コスト関数が前記閾値よりも大きければ、各歪測定基準値を有する各コーディング・モードを除外し、
各々のラグランジアン・コスト関数が閾値より小さければ、後続の歪測定基準値を有する各コーディング・モードについての後続のラグランジアン・コスト関数を決定し、
全てのコーディング・モードについての全ての歪測定基準値が比較されて除外されるまで、各々のラグランジアン・コスト関数が連続的に決定されて前記閾値と比較されるシステム。
94.列挙された例示的実施形態のシステムであって、前記連続的最適化コーディングのための指令が、
複数の歪測定基準値を有する一つ以上のモードに同時にアクセスし、
前記複数の歪測定基準値を複数の候補モードへ関連付け、その複数の歪測定基準値の各々は候補モードの一つのグループへ関連付けられており、
前記複数の候補モードを各々のラグランジアン・コストで同時に処理し、
各々の歪測定基準値について、各グループ内の前記複数の候補モードを前記ラグランジアン・コスト関数によりランキングし、
候補モードの各グループの中の前記候補モードのランキングを比較し、
最高ランキングを有する候補モードの前記グループを選択し、
候補モードの前記選択されたグループ内の最高ランキング候補モードの選択に基づいてビデオ・ディスプレイについての目標モードを選択することを含むシステム。
95. 列挙された例示的実施形態のシステムであって、前記歪測定基準値が、ビデオ・ディスプレイ特性に関連した情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の測定値、歪特性、時間的特性、又は空間的特性を含むシステム。
96.列挙された例示的実施形態のシステムであって、前記歪測定基準値は、
複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数の数のビデオ・ディスプレイの特性は、前記複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスプレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せを用いる複数のビデオ・ディスプレイをランキングするパラメータを含むシステム。
97.ビデオ・コーディング・システムであって、ビデオ・コーディングのための指令を連続的最適化コーディングのための指令が、
指令を取り扱う一つ以上の構成要素を有し、その一つ以上の構成要素は前記指令を処理し、
第1の歪測定基準値を有するビットストリームにアクセスし、
第1の歪測定基準値に関連する第1の複数のモードについてのラグランジアン・コスト関数を同時に処理し、
第1の複数のモードの前記ラグランジアン・コスト関数を比較し、この比較は、第1の複数のモードの前記ラグランジアン・コスト関数のランキングに関係しており、
この比較に基づいて、第1の複数のモードからモードの第1のサブセットを選択し、
先行するモード・ランキングからのデータに基づいて、第1のサブセットの順位を配列し、
第1の歪測定基準値を用いてモードの第1のサブセットについてのラグランジアン・コスト関数を同時に処理し、
モードの第1のサブセットのラグランジアン・コスト関数を比較し、この比較はモードの第1のサブセットのラグランジアン・コスト関数のランキングに関係し、
モードの第1のサブセットの前記ラグランジアン・コスト関数の前記ランキングに基づいて第1の複数のモードからモードの第2のサブセットを選択し、及び、
先行するモード・ランキングからのデータに基づいてモードの第2のサブセットの順位を配列することを含むシステム。
98.列挙された例示的実施形態のシステムであって、歪測定基準値がビデオ・ディスプレイ特性に関連した情報を含み、そのビデオ・ディスプレイ特性は、スクリーン・ディスプレイ・サイズ、ビデオ処理性能の測定値、歪特性、時間的特性、又は空間的特性を含むシステム。
99.列挙された例示的実施形態のシステムであって、前記歪測定基準値が複数のビデオ・ディスプレイの特性に関連した情報を更に含み、その複数のビデオ・ディスプレイの特性は、複数のビデオ・ディスプレイの使用量についてのパラメータ、一つ以上のビデオ・ディスプレイの重要性を示すパラメータ、ビデオ・ディスプレイの設計型式のパラメータ、複数のビデオ・ディスププレイの表示技術形式についてのパラメータ、及び前記特性の任意の組合せ用いる複数のビデオ・ディスプレイのランキングについてのパラメータを含むシステム。
100. 方法であって、
複数のビデオ・コーディング・モードの各々について、又は
ビデオ・エンコーダからエンコードされたビットストリームを受け取るように構成された複数のチャンネルの各々についてのうちの一つから少なくとも一つの歪測定基準値に関するイメージのセットを決定する段階と、
ビデオ・コーディング・モードに関連したコスト評価または、
前記チャンネルからビデオ・ビットストリームを受け取るビデオ・ディスプレイの一つ以上の特性に対応する一つ以上のチャンネルに関連する目標ビットレートの少なくとも一方に基づいて前記歪測定基準値のセットの中から歪測定基準値基準値を選択する段階と、
ピクセル・ブロック又はイメージ部分に基づく以外のブロックを前記選択された歪測定基準値に基づいてエンコーディングする段階とを含む方法。
101.列挙された例示的実施形態100に記載された方法であって、
第1の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第1のセットを決定し、
第2の歪測定基準値を用いて、複数のコーディング・モードについてのラグランジアン・コスト値の第2のセットを決定し、
前記ラグランジアン・コスト値の第1のセット及び前記ラグランジアン・コスト値の第2のセットに基づいて前記複数のコーディング・モードの一つを選択し、及び、
前記選択されたコーディング・モードを用いて一つのピクセル・ブロックをエンコーディングすることを含む方法。
102.列挙された例示的実施形態100に記載された方法において、更に、
ビデオ・エンコーダから複数のチャンネルへ圧縮ビットストリームを送り、そのチャンネルは目標ビット・レート及び複数の歪測定基準値を含み、
前記チャンネルの一つからの歪測定基準値の一つを第1のビデオ・ディスプレイの特性へ整合させ、及び
第1のビデオ・ディスプレイの特性に整合する前記歪測定基準値を有する第1のビデオ・ディスプレイへビデオ・データを送ることを含む方法。
103.列挙された例示的実施形態100に記載された方法であって、ビデオ・コーディングを複数の歪測定基準値下で実行し、セットの決定は、
歪測定基準値を複数の候補モードへ関連付け、その歪測定基準の各々は候補モードの一つのグループに関係している段階を含み、この方法は更に、
前記複数の候補モードを各々のラグランジアン・コスト関数で同時に処理する段階と、
各々の歪測定基準値ごとに、各グループ内の前記候補モードをラグランジアン・コスト関数によってランクキング付けする段階と、
候補モードの各々のグループの間の前記候補モードのランキングを比較する段階と、
最高ランキングを有する候補モードの前記グループを選択する段階と、
候補モード内の選択されたグループ内で最高ランキングの候補モードを選択することに基づいてビデオ・ディスプレイについての目標モードを選択することを含む方法。
104. 列挙された例示的実施形態100に記載された方法であって、セットを決定する前記段階は、
ビデオ情報のビットストリームを処理し、第1の歪測定基準値を有する第1のモードについての第1のラグランジアン・コスト関数を決定する段階と、
第1のラグランジアン・コスト関数を閾値と比較する段階と、
第1のラグランジアン・コスト関数が前記閾値よりも大きければ、第1の歪測定基準値を有するモードを除外する段階と、
第1のラグランジアン・コスト関数が前記閾値よりも小さければ、第2の歪測定基準値を有する第1のモードについての第2のラグランジアン・コストを決定する段階とを含む方法。
105. 列挙された例示的実施形態100に記載された方法であって、セットを決定する段階が、
各々のモードが複数の歪測定基準値を有する複数のモードについて、ビデオ情報のビットストリームを処理し、各モードについて歪測定基準値によりラグランジアン・コスト関数を決定する段階を含み、
歪測定基準値を選択する段階が、
各々のラグランジアン・コスト関数を閾値と比較する段階と、
各々のラグランジアン・コスト関数が前記閾値よりも大きければ、前記歪基準値を有する各モードを除外する段階と、
各々のラグランジアン・コスト関数が閾値よりも小さいならば、後続の歪測定基準値を有する各モードについての後続のラグランジアン・コストを決定する段階とを含み、
全てのモードについての全ての歪測定基準が比較されるか除外されるまで、各々のラグランジアン・コスト関数が連続的に決定されて、閾値と比較される方法。
106.システムであって、
複数のビデオ・コーディング・モードの各々について、若しくは、ビデオ・エンコーダからエンコードされたビットストリームを受け取るように構成された複数のチャンネルの各々についてのうちの少なくとも一方から歪測定基準値に関するイメージのセットを決定する手段と、
ビデオ・コーディング・モードに関連したコスト評価又は前記チャンネルからビデオ・ビットストリームを受け取るビデオ・ディスプレイの一つ以上の特性に対応する一つ以上のチャンネルに関連する目標ビットレートの少なくとも一方に基づいて前記歪測定基準値のセットの中から歪測定基準値基準値を選択する手段と、
ピクセル・ブロック又はイメージ部分に基づく以外のブロックを前記選択された歪測定基準値に基づいてエンコーディングする手段、又は、
列挙された例示的実施形態100−105の一つ以上に記載された一つ以上の段階を実行する手段とを備えるシステム。
107.ビデオ・エンコーダであって、
少なくとも一つのプロセッサと、
コンピュータ読み取り可能記憶媒体とを備え、そのコンピュータ読み取り可能記憶媒体は、前記少なくとも一つのプロセッサに実行させて、前記エンコーダに処理を実行させるエンコード化された指令を含み、その処理は、
複数のビデオ・コーディング・モードの各々について、又は
ビデオ・エンコーダからエンコードされたビットストリームを受け取るように構成された複数のチャンネルの各々についてのうちの一つから少なくとも一つの歪測定基準値に関するイメージのセットを決定する段階と、
ビデオ・コーディング・モードに関連したコスト評価又は、
前記チャンネルからビデオ・ビットストリームを受け取るビデオ・ディスプレイの一つ以上の特性に対応する一つ以上のチャンネルに関連する目標ビットレートとのうちの一つ以上に基づいて前記歪測定基準値のセットの中から歪測定基準値を選択する段階と、
ピクセル・ブロック又はイメージ部分に基づく以外のブロックを前記選択された歪測定基準値に基づいてエンコーディングする段階又は、
列挙された例示的実施形態100−105の一つ以上に記載された一つ以上の段階とを含むビデオ・エンコーダ。
108.コンピュータ読み取り可能記憶媒体製品であり、そのコンピュータ読み取り可能記憶媒体製品は、少なくとも一つのプロセッサに実行されて、ビデオ・エンコーダに処理を実行させるエンコード化された指令を含み、その処理は、
複数のビデオ・コーディング・モードの各々について、又は
ビデオ・エンコーダからエンコードされたビットストリームを受け取るように構成された複数のチャンネルの各々についてのうちの一つから少なくとも一つの歪測定基準値に関するイメージのセットを決定する段階と、
ビデオ・コーディング・モードに関連したコスト評価又は、
前記チャンネルからビデオ・ビットストリームを受け取るビデオ・ディスプレイの一つ以上の特性に対応する一つ以上のチャンネルに関連する目標ビットレートとのうちの一つ以上に基づいて前記歪測定基準値のセットの中から歪測定基準値を選択する段階と、
ピクセル・ブロック又はイメージ部分に基づく以外のブロックを前記選択された歪測定基準値に基づいてエンコーディングする段階又は、
列挙された例示的実施形態100−105の一つ以上に記載された一つ以上の段階とを含むコンピュータ読み取り可能記憶媒体製品。
109.ビデオ・エンコーディング又はコンピューティング装置であって、
処理構成要素と、
処理構成要素可能記憶媒体とを備え、その処理構成要素読み取り可能記憶媒体は、前記処理構成要素により実行されて、前記装置に処理を実行させるエンコード化された指令を含み、その処理は、
複数のビデオ・コーディング・モードの各々について、又は
ビデオ・エンコーダからエンコードされたビットストリームを受け取るように構成された複数のチャンネルの各々についてのうちの一つから少なくとも一つの歪測定基準値に関するイメージのセットを決定する段階と、
ビデオ・コーディング・モードに関連したコスト評価又は、
前記チャンネルからビデオ・ビットストリームを受け取るビデオ・ディスプレイの一つ以上の特性に対応する一つ以上のチャンネルに関連する目標ビットレートとのうちの一つ以上に基づいて前記歪測定基準値のセットの中から歪測定基準値基準値を選択する段階と、
ピクセル・ブロック又はイメージ部分に基づく以外のブロックを前記選択された歪測定基準値に基づいてエンコーディングする段階又は、
列挙された例示的実施形態100−105の一つ以上に記載された一つ以上の段階とを含むビデオ・エンコーディング又はコンピューティング装置。

拡張例、代替例及び混合例
複数の歪制約下のビデオ圧縮に関する例示的実施形態に上述のように説明した。上述の仕様において、本発明の例示的実施形態は、実施例から実施例へと変化し得る多数の特定の詳細に関して説明した。従って、本発明の唯一且つ排他的な指標であって、出願人により発明であると意図されているものは、後の如何なる補正も含めて、その請求項の結果である特定の形態における本願に由来する特許請求の範囲である。そのような請求項に含まれる用語について、本明細書に明確に記載される如何なる定義も請求項にて用いられている用語の意味を規定する。従って、請求項において明確に記載されていない制限、要素、特性、特徴、利点又はそれに寄与するものは、如何なる方式でもそのような請求項張の趣旨を限定するものではない。従って、明細書及び図面は、限定的な意味ではなく、例示的なものである。

Claims (7)

  1. 入力ビデオからビデオ・エンコーダにおいて圧縮ビットストリームを生成する方法であり、前記圧縮ビットストリームは目標ビット・レートに関連したチャンネルへ送られ、前記方法は、
    第1の歪測定基準値及び前記目標ビット・レートを用いて、複数のコーディング・モードについて、ラグランジアン・コスト値の第1のセットを決定し、前記複数のコーディング・モードのコーディング・モードは、前記ビデオ・エンコーダの量子化パラメータ又は予測モードであり、第1の歪測定基準値は、第1のビデオ・ディスプレイの特性に関連した情報を含み、この第1のビデオ・ディスプレイの特性は、スクリーン・ディスプレイ・サイズ、第1のビデオ・ディスプレイのビデオ処理性能の測定値、第1のビデオ・ディスプレイの歪特性、第1のビデオ・ディスプレイの時間的特性、又は第1のビデオ・ディスプレイの空間特性を含み、
    第2の歪測定基準値及び前記目標ビット・レートを用いて、複数のコーディング・モードについて、ラグランジアン・コスト値の第2のセットを決定し、第2の歪測定基準値は、第2のビデオ・ディスプレイの特性に関連した情報を含み、この第2のビデオ・ディスプレイの特性は、スクリーン・ディスプレイ・サイズ、第2のビデオ・ディスプレイのビデオ処理性能の測定値、第2のビデオ・ディスプレイの歪特性、第2のビデオ・ディスプレイの時間的特性、又は第2のビデオ・ディスプレイの空間特性を含み、
    ラグランジアン・コスト値の第1のセット及びラグランジアン・コスト値の第2のセットに基づいて複数のコーディング・モードのうちの一つを選択し、
    前記選択されたコーディング・モードを用いて入力ビデオのピクセル・ブロックをエンコーディングすることを含む方法。
  2. 請求項1の方法であって、第1のラグランジアン・コスト値の決定は、
    第1の歪測定基準値の和となる第1のラグランジアン・コスト関数及び目標ビット・レートを第1のラグランジアン乗数により重み付けすることにより決定し、
    複数のコーディング・モードの各々について第1のラグランジアン・コスト関数の値を
    計算し、
    第2のラグランジアン・コスト値の決定は、複数のコーディング・モードの各々について第1のラグランジアン・コスト関数の値を計算し、
    第2の歪測定基準値の和となる第2のラグランジアン・コスト関数及び目標ビット・レートを第2のラグランジアン乗数により重み付けすることにより決定し、
    複数のコーディング・モードの各々について第2のラグランジアン・コスト関数の値を
    計算することを含む方法。
  3. 請求項1又は2の方法において、第1の歪測定基準値及び第2の歪測定基準値は一つ以上の歪測定基準値の重み付けの和である方法。
  4. 請求項3の方法において、前記歪測定基準値は、ピクセル・ブロックとエンコード化ピクセル・ブロックとの絶対差の和と、ピクセル・ブロック及びエンコード化ピクセル・ブロックの二乗差の和と、ジャスト・ノティカブル・ディフェレンス(Just Noticable Difference)と、複数のエンコード化ピクセル・ブロックの境界に沿った勾配の平均二乗差とのうちの一つである方法。
  5. 請求項1乃至4の方法において、複数のコーディング・モードのうちの一つを選択し、
    第1のラグランジアン・コスト値の第1のセット値を対応する複数のコーディング・モードと比較及びランキングし、
    第2のラグランジアン・コスト値の第2のセット値を対応する複数のコーディング・モードと比較及びランキングすることを含む方法。
  6. コンピュータ読み取り可能記憶媒体であって、少なくとも一つのプロセッサにより実行されるときに、ビデオ・エンコーダに請求項1乃至の一つ以上の方法を実行させる命令を記憶したコンピュータ読み取り可能記憶媒体。
  7. 少なくとも一つのプロセッサとビデオ・エンコーダとを含むシステムであって、前記システムが前記少なくとも一つのプロセッサ及び前記ビデオ・エンコーダで命令を実行させ、
    請求項1乃至の一つ以上の操作を実行するように構成されているシステム。
JP2011514800A 2008-06-20 2009-06-18 複数の歪抑制下のビデオ圧縮 Expired - Fee Related JP5253571B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7443008P 2008-06-20 2008-06-20
US61/074,430 2008-06-20
PCT/US2009/047755 WO2009155398A1 (en) 2008-06-20 2009-06-18 Video compression under multiple distortion constraints

Publications (2)

Publication Number Publication Date
JP2011525332A JP2011525332A (ja) 2011-09-15
JP5253571B2 true JP5253571B2 (ja) 2013-07-31

Family

ID=41011911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011514800A Expired - Fee Related JP5253571B2 (ja) 2008-06-20 2009-06-18 複数の歪抑制下のビデオ圧縮

Country Status (6)

Country Link
US (1) US8594178B2 (ja)
EP (3) EP2439952A3 (ja)
JP (1) JP5253571B2 (ja)
CN (2) CN102905131A (ja)
AT (1) ATE536048T1 (ja)
WO (1) WO2009155398A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2229786B1 (en) * 2008-01-18 2012-07-25 Thomson Licensing Method for assessing perceptual quality
WO2012122423A1 (en) 2011-03-10 2012-09-13 Dolby Laboratories Licensing Corporation Pre-processing for bitdepth and color format scalable video coding
US20100149301A1 (en) * 2008-12-15 2010-06-17 Microsoft Corporation Video Conferencing Subscription Using Multiple Bit Rate Streams
CN101778275B (zh) * 2009-01-09 2012-05-02 深圳市融创天下科技股份有限公司 一种自适应时间域和空间域分辨率框架的图像处理方法
KR101418104B1 (ko) * 2010-03-08 2014-07-16 에스케이 텔레콤주식회사 움직임 벡터 해상도 조합을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US8947492B2 (en) * 2010-06-18 2015-02-03 Microsoft Corporation Combining multiple bit rate and scalable video coding
KR101531240B1 (ko) * 2010-07-27 2015-06-25 한국전자통신연구원 디지털 방송 시스템에서 다시점 프로그램을 송수신하는 방법 및 장치
US20130194386A1 (en) * 2010-10-12 2013-08-01 Dolby Laboratories Licensing Corporation Joint Layer Optimization for a Frame-Compatible Video Delivery
WO2012122421A1 (en) * 2011-03-10 2012-09-13 Dolby Laboratories Licensing Corporation Joint rate distortion optimization for bitdepth color format scalable video coding
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9338463B2 (en) 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
US8923388B2 (en) * 2011-11-21 2014-12-30 Texas Instruments Incorporated Early stage slice cap decision in video coding
EP2803190B1 (en) 2012-01-09 2017-10-25 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for multiple layered video coding systems
EP2828822B1 (en) 2012-03-21 2018-07-11 Dolby Laboratories Licensing Corporation Systems and methods for power reduction for displays
US9491475B2 (en) * 2012-03-29 2016-11-08 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
US9392286B2 (en) 2013-03-15 2016-07-12 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
WO2015079395A2 (en) * 2013-11-26 2015-06-04 Telefonaktiebolaget L M Ericsson (Publ) Distributed routing in wireless networks
US9794575B2 (en) 2013-12-18 2017-10-17 Magnum Semiconductor, Inc. Apparatuses and methods for optimizing rate-distortion costs in video encoding
US9866853B2 (en) * 2014-04-15 2018-01-09 Qualcomm Incorporated System and method for lagrangian parameter calculation for display stream compression (DSC)
US9924175B2 (en) 2014-06-11 2018-03-20 Qualcomm Incorporated Determining application of deblocking filtering to palette coded blocks in video coding
US10136141B2 (en) 2014-06-11 2018-11-20 Qualcomm Incorporated Determining quantization parameter (QP) values and delta QP values for palette coded blocks in video coding
US10264269B2 (en) 2014-10-13 2019-04-16 Apple Inc. Metadata hints to support best effort decoding for green MPEG applications
FR3029055B1 (fr) * 2014-11-24 2017-01-13 Ateme Procede d'encodage d'image et equipement pour la mise en oeuvre du procede
WO2020171046A1 (en) * 2019-02-20 2020-08-27 Panasonic Intellectual Property Corporation Of America Image encoder and image decoder
US11272192B2 (en) * 2019-03-04 2022-03-08 Comcast Cable Communications, Llc Scene classification and learning for video compression
US11363306B2 (en) * 2019-04-05 2022-06-14 Comcast Cable Communications, Llc Methods, systems, and apparatuses for processing video by adaptive rate distortion optimization
US11856205B2 (en) * 2019-11-22 2023-12-26 Intel Corporation Subjective visual quality enhancement for high spatial and temporal complexity video encode

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5550590A (en) * 1994-03-04 1996-08-27 Kokusai Denshin Denwa Kabushiki Kaisha Bit rate controller for multiplexer of encoded video
US5506686A (en) * 1994-11-23 1996-04-09 Motorola, Inc. Method and device for determining bit allocation in a video compression system
US6614845B1 (en) * 1996-12-24 2003-09-02 Verizon Laboratories Inc. Method and apparatus for differential macroblock coding for intra-frame data in video conferencing systems
US5841413A (en) * 1997-06-13 1998-11-24 Matsushita Electric Industrial Co., Ltd. Method and apparatus for moving pixel distortion removal for a plasma display panel using minimum MPD distance code
US6754241B1 (en) * 1999-01-06 2004-06-22 Sarnoff Corporation Computer system for statistical multiplexing of bitstreams
US6925120B2 (en) * 2001-09-24 2005-08-02 Mitsubishi Electric Research Labs, Inc. Transcoder for scalable multi-layer constant quality video bitstreams
US6973128B2 (en) * 2003-02-21 2005-12-06 Mitsubishi Electric Research Labs, Inc. Multi-path transmission of fine-granular scalability video streams
US20040258147A1 (en) * 2003-06-23 2004-12-23 Tsu-Chang Lee Memory and array processor structure for multiple-dimensional signal processing
KR100556340B1 (ko) * 2004-01-13 2006-03-03 (주)씨앤에스 테크놀로지 영상 부호화 장치
EP1578131A1 (en) * 2004-03-18 2005-09-21 STMicroelectronics S.r.l. Encoding/decoding methods and systems, computer program products therefor
WO2005099276A2 (en) * 2004-04-02 2005-10-20 Thomson Licensing Complexity scalable video encoding
KR100586882B1 (ko) * 2004-04-13 2006-06-08 삼성전자주식회사 모션 스케일러빌리티를 지원하는 코딩 방법 및 장치
US7643553B2 (en) 2004-10-27 2010-01-05 Arris Group, Inc. Optimal rate allocation for a group of channels
US8300693B2 (en) * 2005-01-18 2012-10-30 Ecole Polytechnique Federale De Lausanne Image transform for video coding
US7751478B2 (en) * 2005-01-21 2010-07-06 Seiko Epson Corporation Prediction intra-mode selection in an encoder
JP2007081474A (ja) * 2005-09-09 2007-03-29 Toshiba Corp 画像符号化装置及び方法
US8155195B2 (en) * 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
US8861597B2 (en) * 2006-09-18 2014-10-14 Sharp Laboratories Of America, Inc. Distributed channel time allocation for video streaming over wireless networks
US8467448B2 (en) * 2006-11-15 2013-06-18 Motorola Mobility Llc Apparatus and method for fast intra/inter macro-block mode decision for video encoding
US7813564B2 (en) * 2007-03-30 2010-10-12 Eastman Kodak Company Method for controlling the amount of compressed data
US8160150B2 (en) * 2007-04-10 2012-04-17 Texas Instruments Incorporated Method and system for rate distortion optimization
KR101394151B1 (ko) * 2007-10-04 2014-05-14 삼성전자주식회사 시감 특성을 이용한 영상 부호화 장치 및 방법

Also Published As

Publication number Publication date
EP2439952A2 (en) 2012-04-11
EP2439951A2 (en) 2012-04-11
JP2011525332A (ja) 2011-09-15
CN102905131A (zh) 2013-01-30
EP2439952A3 (en) 2013-11-27
ATE536048T1 (de) 2011-12-15
EP2297963B1 (en) 2011-11-30
US20110103473A1 (en) 2011-05-05
CN102067603A (zh) 2011-05-18
CN102067603B (zh) 2012-11-14
EP2439951A3 (en) 2013-11-27
WO2009155398A1 (en) 2009-12-23
EP2297963A1 (en) 2011-03-23
US8594178B2 (en) 2013-11-26

Similar Documents

Publication Publication Date Title
JP5253571B2 (ja) 複数の歪抑制下のビデオ圧縮
JP5159955B2 (ja) 適応的ビデオ・エンコーダ制御
US9479786B2 (en) Complexity allocation for video and image coding applications
JP5400876B2 (ja) ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化
US8804836B2 (en) Video coding
US8165204B2 (en) Resource allocation for frame-based controller
US9426494B2 (en) Systems and methods with early variance measure used to optimize video encoding
US9307241B2 (en) Video encoding method and a video encoding apparatus using the same
US9936223B2 (en) Method and device for encoding video to improve intra prediction processing speed, and method and device for decoding video
US9036699B2 (en) Video coding
JP2010541386A (ja) ビデオ圧縮技法及びビデオ伝達技法
US10440384B2 (en) Encoding method and equipment for implementing the method
US20170302930A1 (en) Method of transcoding video data with fusion of coding units, computer program, transcoding module and telecommunications equipment associated therewith
JP5956316B2 (ja) 主観画質推定装置、主観画質推定方法及びプログラム
US10715819B2 (en) Method and apparatus for reducing flicker
JP5637010B2 (ja) 動きベクトル検出装置、動きベクトル検出方法及び動きベクトル検出プログラム
JP2014179918A (ja) 動画像符号化装置、その制御方法、及び撮像装置
KR101491864B1 (ko) 엔트로피 부호화를 위한 하이브리드 예측 장치 및 그 방법
KR20150052049A (ko) 비디오 품질 평가를 위해 모션 균일성을 추정하기 위한 방법 및 장치

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130416

R150 Certificate of patent or registration of utility model

Ref document number: 5253571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees