JP2010525739A - 品質管理された符号化のための方法及びシステム - Google Patents

品質管理された符号化のための方法及びシステム Download PDF

Info

Publication number
JP2010525739A
JP2010525739A JP2010506169A JP2010506169A JP2010525739A JP 2010525739 A JP2010525739 A JP 2010525739A JP 2010506169 A JP2010506169 A JP 2010506169A JP 2010506169 A JP2010506169 A JP 2010506169A JP 2010525739 A JP2010525739 A JP 2010525739A
Authority
JP
Japan
Prior art keywords
quality
data segment
quality metric
encoding
metric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010506169A
Other languages
English (en)
Other versions
JP5113244B2 (ja
Inventor
シャー、デバーシ
バミディパティ、ファニクマー
コーシク、ビノド
ルーカス、セラフィム・エス.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2010525739A publication Critical patent/JP2010525739A/ja
Application granted granted Critical
Publication of JP5113244B2 publication Critical patent/JP5113244B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

この開示は、マルチメディアシーケンスの知覚品質を管理して前記シーケンスのコンテンツにかかわらず希望される一定の知覚上の品質を達成することを試みるための技法を説明する。特に、符号化デバイスは、シーケンスセグメントを前記セグメントのコンテンツに基づいてコンテンツ“クラス”と関連づけ、前記シーケンスセグメントの知覚上の品質メトリックを決定し、及び、前記シーケンスセグメントの前記知覚上の品質が希望される品質に収斂するように符号化されるように、前記セグメントを符号化するために用いられる少なくとも1つの符号化パラメータを調整するための品質管理技法を実装することができる。
【選択図】図1

Description

この開示は、マルチメディアの符号化及び復号に関するものである。この開示は、より具体的には、符号化されたマルチメディアシーケンスの品質を管理することに関するものである。
デジタル映像(及びより一般的にはマルチメディアシーケンス、すなわち、音声、映像、及びピクチャ、又はその他の非可逆圧縮データ)能力は、デジタルテレビ、デジタル直接放送システム、無線通信デバイス、パーソナルデジタルアシスタント(PDA)、ラップトップコンピュータ、デスクトップコンピュータ、ビデオゲームコンソール、デジタルカメラ、デジタル記録デバイス、携帯電話、衛星無線電話、等を含む広範なデバイスに組み入れることができる。デジタル映像デバイスは、映像シーケンスを処理及び送信する際に従来のアナログ映像システムの重要な改良を提供することができる。
デジタル映像シーケンスを符号化するために異なる映像符号化基準が確立されている。例えば、ムービング・ピクチャ・エキスパーツ・グループ(MPEG)は、MPEG−1、MPEG−2及びMPEG−4を含む幾つかの基準を開発している。その他の例は、国際電気通信連合(ITU)−T H.263基準と、ITU−T H.264基準及びその同等基準であるISO/IEC MPEG−4、Part−10、すなわちアドバンストビデオコーディング(AVC)とを含む。これらの映像符号化基準は、データを圧縮された形で符号化することによって映像シーケンスの向上された送信効率をサポートする。
多くの現在の技法は、ブロックに基づくコーディングを利用する。ブロックに基づくコーディングにおいては、マルチメディアシーケンスのフレームが個別の画素ブロックに分割され、これらの画素ブロックが、その他のブロックとの差分に基づいてコーディングされる。幾つかの画素ブロックは、“マクロブロック”としばしば呼ばれ、画素のサブブロックから成るグループを備える。一例として、16×16マクロブロックは、4つの8×8サブブロックを備えることができる。サブブロックは、別々に符号化することができる。例えば、H.264基準は、様々な異なるサイズ、例えば、16×16、16×8、8×16、8×8、4×4、8×4、及び4×8を有するブロックの符号化を可能にする。さらに、拡張として、あらゆるサイズのサブブロックをマクロブロック内に含めることができ、例えば2×16、16×2、2×2、4×16、8×2、等である。
この開示は、符号化されたデータシーケンスの品質を管理するための符号化技法を説明する。一般的には、この開示の一定の実施形態の一定の側面は、あらゆるマルチメディアストリーム(すなわち、不可逆圧縮を用いる音声、映像、ピクチャ、又はその他のデータ)に適用することができる。しかしながら、説明を簡潔にすることを目的として及び制限することなしに、この開示の前記一定の実施形態は、映像、マルチメディアデータを用いて説明及び例示される。
一定の側面においては、デジタル映像データシーケンスを処理するための方法は、前記デジタル映像データと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化すること、前記符号化されたデータセグメントの1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけること、前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整すること、及び前記調整された符号化パラメータを用いて前記データセグメントを再符号化することのうちの1つ又はその組み合わせを備える。
一定の側面においては、デジタル映像データを処理するための装置は、前記デジタル映像データと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化する符号化モジュール、前記符号化されたデータセグメントの1つ以上のパラメータを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけるコンテンツ分類モジュール、及び前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整する品質管理モジュールのうちの1つ又はその組み合わせを備え、前記符号化モジュールは、前記調整された符号化パラメータを用いて前記データセグメントを再符号化する。
一定の側面においては、デジタル映像データを処理するための装置は、デジタル映像データと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化するための手段、前記符号化されたデータセグメントの1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけるための手段、前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整するための手段、及び前記調整された符号化パラメータを用いて前記データセグメントを再符号化するための手段のうちの1つ又はその組み合わせを備える。
一定の側面においては、命令が格納された機械によって読み取り可能な媒体であって、前記格納された命令は、符号の1つ以上のセグメントを含み、及び1つ以上の機械において実行可能であり、符号の前記1つ以上のセグメントは、前記デジタル映像データと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化するための符号、前記符号化されたデータセグメントの1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけるための符号、前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整するための符号、及び前記調整された符号化パラメータを用いて前記データセグメントを再符号化するための符号のうちの1つ又はその組み合わせを備える。
一定の側面においては、マルチメディアデータを処理するための方法は、デジタル映像データと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算すること、及び前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータ及び前記符号化されたデータセグメントの結果的に得られた(resultant)ビットレートのうちの1つに基づいて複数のコンテンツクラスのうちの1つを選択することのうちの1つ又はその組み合わせを備え、少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離することは、可能な差分メトリックをグループに分離すること、前記グループの各々と関連づけられた品質メトリックを予め計算すること、及び前記グループの各々に関する重みを予め計算することのうちの1つ又はその組み合わせを含むことができ、前記グループの少なくとも一部分は、2つ以上の差分メトリックを含み、前記グループに関する前記品質メトリックは、前記グループと関連づけられた前記差分メトリックの各々に対応する品質メトリックの平均に等しく、前記グループの各々に関する重みは、ビンと関連づけられた前記差分メトリックの少なくとも一部分に基づいて計算される。
一定の側面においては、マルチメディアデータを処理するための装置は、デジタル映像データと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算する品質測定モジュール、及び前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータ及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの少なくとも1つに基づいて複数のコンテンツクラスのうちの1つを選択するクラス選択モジュールのうちの1つ又はその組み合わせを備え、前記品質測定モジュールは、可能な差分メトリックをグループに分離すること、前記グループの各々と関連づけられた品質メトリックを予め計算すること、及び前記グループの各々に関する重みを予め計算することのうちの1つ又はその組み合わせをさらに実行し、前記グループの少なくとも一部分は、2つ以上の差分メトリックを含み、前記グループに関する前記品質メトリックは、前記グループと関連づけられた前記差分メトリックの各々に対応する品質メトリックの平均に等しく、前記グループの各々に関する前記重みは、前記ビンと関連づけられた前記差分メトリックの少なくとも一部分に基づいて計算される。
一定の側面においては、マルチメディアデータを処理するための装置は、デジタル映像データと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算するための手段、前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つのパラメータ及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて複数のコンテンツクラスのうちの1つを選択するための手段のうちの1つ又はその組み合わせを備え、少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離するための前記手段は、可能な差分メトリックをグループに分離するための手段であって、前記グループの少なくとも一部分は、2つ以上の差分メトリックを含む手段、前記グループの各々と関連づけられた品質メトリックを予め計算するための手段であって、前記グループに関する前記品質メトリックは、前記グループと関連づけられた前記差分メトリックの各々に対応する品質メトリックの平均に等しい手段、及び前記グループの各々に関する重みを予め計算するための手段であって、前記グループの各々に関する前記重みは、前記ビンと関連づけられた前記差分メトリックの少なくとも一部分に基づいて計算される手段、のうちの1つ又はその組み合わせを含む。
一定の側面においては、命令が格納された機械によって読み取り可能な媒体であって、前記格納された命令は、符号の1つ以上の部分を含み、及び1つ以上の機械において実行可能であり、符号の前記1つ以上の部分は、デジタル映像データと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算するための符号、及び前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータ及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて複数のコンテンツクラスのうちの1つを選択するための符号のうちの1つ又はその組み合わせを備え、前記知覚品質メトリックを計算するための前記符号は、前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいて前記セグメントと関連づけられたデータフレームの画素ブロックをグループに分離するための符号、品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけるための符号、及び前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算するための符号、のうちの1つ又はその組み合わせをさら含む。
(及び、より一般的には、マルチメディア、音声、映像、及びピクチャ、又はその他の非可逆圧縮)
1つ以上の例の詳細が添付図及び以下の説明において示される。その他の特徴、目的、及び利点も前記説明及び図面、及び請求項から明らかであろう。
この開示の品質管理技法を採用する映像符号化及び復号システムを示したブロック図である。 データセグメントを複数のコンテンツクラスのうちの1つと関連づける典型的コンテンツ分類モジュールを示したブロック図である。 コンテンツクラスを表す典型的品質−レート曲線を表すグラフである。 データセグメントを符号化するために用いられる1つ以上の符号化パラメータを動的に調整する典型的品質管理モジュールを示すブロック図である。 この開示の技法によりデータセグメントを符号化するための典型的符号化技法を示した図である。 この開示の技法により符号化されたデータセグメントの品質を管理する符号化デバイスの典型的動作を示した流れ図である。 重み付き品質メトリックを計算する品質測定モジュールの典型的動作を示す流れ図である。 データセグメントを複数のコンテンツクラスのうちの1つと関連づけるコンテンツ分類モジュールの典型的動作を示した流れ図である。
この開示は、符号化されたデータシーケンスの品質を管理するための符号化技法を説明する。一般的には、この開示の一定の実施形態の一定の側面は、あらゆるマルチメディアストリーム(すなわち、不可逆圧縮を用いる音声、映像、ピクチャ、又はあらゆるデータ)に適用することができる。しかしながら、説明を簡潔にするため及び制限することなしに、この開示の一定の実施形態は、映像、マルチメディアデータを用いて説明及び例示される。特に、この開示の技法は、観る人によって経験される知覚品質を管理することを試みる。観る人によって経験される知覚品質は、データシーケンスのコンテンツ、又はプロパティに基づいて異なることがある。換言すると、同じ符号化パラメータを用いて符号化されたシーケンスが、シーケンスのコンテンツに基づいて異なる知覚品質を有することがある。例えば、36の量子化パラメータ(QP)において符号化された動きの激しいスポーツシーケンスは、同じQPにおいて符号化された動きの少ないシーケンスよりもはるかに良く見える。これは、主に、スポーツシーケンスにおける動きはより大きいQPのほうが知覚される視覚上の品質を向上させる傾向があることに起因する。他方、動きの少ないシーケンスが良く見えるより小さいQPにおいてスポーツシーケンスが符号化された場合は、知覚上の品質は向上するが、上昇したビットレートのコストが知覚上の品質の増分的向上を上回ることになる。一定の実施形態がその他のマルチメディアストリーム(すなわち、音声ストリーム)に適用されるときには、知覚上の品質は、映像ストリームにおけるような視覚ではなく聴覚上の品質になる可能性があることに注意すること。
この開示は、シーケンスの知覚品質を管理してシーケンスのコンテンツ、又はプロパティにかかわらず希望される一定の知覚上の品質を達成させるのを試みる技法を提供する。ここにおいて詳細に説明されるように、符号化デバイスは、シーケンスセグメントをそのシーケンスセグメントのコンテンツに基づいてコンテンツ“クラス”と関連づけ、シーケンスセグメントの観測された知覚上の品質を決定し、及び観測された知覚上の品質及びデータセグメントと関連づけられたコンテンツクラスに基づいて1つ以上の符号化パラメータを調整する。時間が許す場合は、調整された符号化パラメータを用いてデータセグメントを再符号化することができる。代替として、後続するデータセグメントは、最初に、調整された符号化パラメータを用いて符号化することができる。この方法により、データシーケンスは、シーケンスセグメントの観測された知覚上の品質が希望される知覚上の品質に収斂するように符号化される。
図1は、ここにおいて説明される品質管理技法を採用する映像符号化及び復号システム10を示すブロック図である。符号化及び復号システム10は、送信チャネル16によって接続された符号化デバイス12と復号デバイス14とを含む。符号化デバイス12は、1つ以上のデジタル映像データシーケンスを符号化し、符号化されたシーケンスを復号及び復号デバイス14のユーザーへの提示を目的として送信チャネル16を通じて復号デバイス14に送信する。送信チャネル16は、有線又は無線の媒体、又はその組み合わせを備えることができる。
符号化デバイス12は、1つ以上の映像データチャネルをブロードキャストするために用いられるブロードキャストネットワーク構成要素の一部を成すことができる。一例として、符号化デバイス12は、符号化された映像データの1つ以上のチャネルを無線デバイスにブロードキャストするために用いられる無線基地局、サーバー、又はいずれかのインフラストラクチャノードの一部を成すことができる。この場合は、符号化デバイス12は、符号化されたデータを複数の無線デバイス、例えば復号デバイス14、に送信することができる。しかしながら、図1では単純化することを目的として単一の復号デバイス14のみが示される。
復号デバイス14は、符号化デバイス12によって送信された符号化された映像データを受信し及びその映像データをユーザーに提示するために復号するユーザー−デバイスを備えることができる。一例として、復号デバイス14は、デジタルテレビ、無線通信デバイス、ゲームプレイ装置、ポータブルデジタルアシスタント(PDA)、ラップトップコンピュータ又はデスクトップコンピュータ、デジタル音楽及び映像デバイス、例えば商標“iPod”の名前で販売されるデバイス、又は無線電話、例えばセル方式、衛星又は地上方式の無線電話、又は映像ストリーミング、映像テレフォニー、又は両方用に装備されたその他の無線移動端末の一部として実装することができる。
幾つかの側面においては、双方向通信に関して、符号化及び復号システム10は、セッション開始プロトコル(SIP)、国際電気通信連合標準化セクター(ITU−T)H.323基準、ITU−T H.324基準、又はその他の基準に準じた映像テレフォニー又は映像ストリーミングをサポートすることができる。符号化デバイス12は、映像圧縮基準、例えば、ムービング・ピクチャ・エキスパーツ・グループ(MPEG)−2、MPEG−4、ITU−T H.263、又はITU−T H.264、等に準じて符号化された映像データを生成することができる。図1には示されていないが、符号化デバイス12及び復号デバイス14は、音声符号器及び復号器とそれぞれ一体化することができ、共通のデータシーケンス又は別個のデータシーケンス内の音声及び映像の両方の符号化を処理するための適切なマルチプレクサ−デマルチプレクサ(MUX−DEMUX)モジュール、又はその他のハードウェア、ファームウェア、又はソフトウェアを含むことができる。該当する場合は、MUX−DEMUXモジュールは、ITU H.223マルチプレクサプロトコル、又はユーザーデータグラムプロトコル(UDP)等のその他のプロトコルに準拠することができる。幾つかの側面においては、この開示は、Technical Standard TIA-1099, Aug.2006(技術基準TIA−1099、2006年8月)として発行された順方向リンク専用(FLO)エアインタフェース仕様“Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast”(地上移動マルチメディアマルチキャストに関する順方向リンク専用インタフェース仕様)(“FLO仕様”)を用いる地上移動マルチメディアマルチキャスト(TM3)システムにおいてリアルタイム映像サービスを配送するためのエンハンストH.264映像コーディングへの適用を企図する。しかしながら、この開示において説明される品質管理技法は、どのような特定のタイプのブロードキャスト、マルチキャスト、又はポイント・ツー・ポイントシステムにも限定されない。
図1に示されるように、符号化デバイス12は、符号化モジュール18と、メモリ20と、コンテンツ分類モジュール22と、品質管理モジュール24と、送信機26とを含む。符号化モジュール18は、1つ以上の入力映像シーケンス28A−28N(総称して“映像シーケン28”)を1つ以上のソースから受信し、映像シーケンス28を選択的に符号化する。符号化モジュール18は、例えば、符号化デバイス12内に組み入れられるか又は符号化デバイス12に結合された画像キャプチャデバイス(示されていない)から映像シーケンス28を受け取ることができる。代替として、符号化モジュール18は、映像シーケンス28をメモリ20から受け取ることができる。映像シーケンス28は、ブロードキャストとして又はオンデマンドでコーディングされて送信されるべきライブのリアルタイム映像シーケンス、音声シーケンス、又は映像と音声のシーケンスを備えることができ、又はブロードキャストとして又はオンデマンドでコーディングされて送信されるべき予め録画して格納されている映像、音声、又は映像と音声の流れを備えることができる。この開示の技法は、リアルタイムサービスに関して説明されるが、ほぼリアルタイムのサービス、非リアルタイムのサービス、又はリアルタイムサービス、ほぼリアルタイムのサービス及び非リアルタイムのサービスの組み合わせに対しても適用することができる。しかしながら、例示する目的上、この開示は、リアルタイムサービスにおける品質管理技法の使用を説明する。
幾つかの側面においては、符号化モジュール18は、符号化されたデータシーケンスを送信機26を介する送信のために1つの送信フレームに結合することもできる。特に、符号化モジュール18は、ある期間にわたって受信された映像シーケンス28の一部分を符号化、結合、及び送信することができる。一例として、符号化モジュール18は、1秒ごとに映像シーケンス28に関して動作することができる。換言すると、符号化モジュール18は、複数の映像シーケンス28の1秒のデータセグメントを符号化し、符号化された1秒のデータセグメントを結合してデータスーパーフレームを形成し、送信機26を介して送信チャネル16を通じてスーパーフレームを送信する。ここにおいて用いられる用語“スーパーフレーム”は、時間的期間又は窓、例えば、1秒の期間又は窓、にわたって収集されたデータセグメントのグループを意味する。データセグメントは、1つ以上のデータフレームを含むことができる。この開示の技法は、1秒のデータセグメントに関して説明されるが、これらの技法は、例えば固定された期間である場合とない場合がある異なる期間にわたって受信されたデータセグメントに関して、又は個々のデータフレーム又はデータフレームの組に関して、その他のデータセグメントを符号化、結合及び送信するために利用することも可能である。換言すると、スーパーフレームは、1秒の期間よりも長い又は短い時間間隔、さらには可変の時間間隔を網羅するように定義することが可能である。
この開示全体を通じて、(例えば、スーパーフレームの概念に類似する)マルチメディアデータの特定の部分は、マルチメディアデータの特定のサイズ及び/又は継続時間を有するあらゆる部分を意味し、その特定のサイズ及び/又は継続時間は、物理層及び/又はMAC層の特徴及び/又はマルチメディアデータを渡すために用いられるシステムのパラメータに少なくとも部分的に基づくことに注目すること。特定のサイズ及び/又は継続時間は、静的に及び/又は動的に割り当て可能であることに注目すること。
符号化モジュール18は、映像シーケンス28の各々を一定の品質レベルで出力するように試みることができる。例えば、符号化モジュール18は、映像シーケンス28のコンテンツ、又はプロパティにかかわらず映像シーケンス28に関する一定の知覚品質を維持するように試みることができる。換言すると、符号化モジュール18は、映像シーケンス28の各々をターゲット品質レベルで出力するように試みることができる。ターゲット品質レベルは、予め選択すること、ユーザーによって選択すること、自動プロセス又はユーザー又は他のプロセスからの入力を要求する半自動プロセスを通じて選択すること、又は予め決められた基準に基づいて符号化デバイス12又はシステム10によって動的に選択することができる。ターゲット品質レベルは、例えば、符号化用途の種類、又は符号化された映像データが送信される先であるクライアントデバイスの型に基づいて選択することができる。
一定の知覚品質レベルを維持するために、符号化モジュール18は、知覚品質メトリック及び映像シーケンスのコンテンツに基づいて1つ以上の符号化パラメータを選択又は調整することができる。この目的のために、コンテンツ分類モジュール22は、複数のクラスのうちの1つを用いて映像シーケンスのデータセグメントを分類する。幾つかの場合においては、コンテンツ分類モジュール22は、データセグメントが最初に符号化された後にデータセグメントを分類する。このような場合は、符号化モジュール18は、最初の一組の符号化パラメータを用いてデータセグメントを符号化することができる。符号化モジュール18は、最初に、例えば前データセグメントが符号化されたときのQPを用いてデータセグメントを符号化することができる。従って、符号化モジュール18は、映像シーケンスの2つの連続するデータセグメントは類似するコンテンツを有する、すなわち、現在のデータセグメントのコンテンツクラスは前データセグメントのコンテンツクラスに類似するとする発見的方法に基づいて動作することができる。代替として、符号化モジュール18は、最初にすべてのデータセグメントを特定のQPにおいて符号化するように構成することができる。例えば、符号化モジュール18は、最初に33のQPにおいてすべてのデータセグメントを符号化するように構成することができる。
データセグメントを分類するのを援助するために、コンテンツ分類モジュール22は、符号化されたデータセグメントと関連づけられた知覚品質メトリックを計算することができる。一定の側面においては、コンテンツ分類モジュール22は、符号化されたデータセグメントと関連づけられた重み付き品質メトリックを計算することができる。重み付き品質メトリックは、観る人によって経験される主観的品質により近い客観的映像品質メトリックを提供することができる。コンテンツ分類モジュール22は、セグメントと関連づけられた1つ以上のデータフレームの画素ブロックをこれらの画素ブロックの各々と関連づけられた差分メトリックに基づいてグループに分類し、品質メトリック及び重みを画素ブロックグループの各々と関連づけ、及び各々のグループ内の画素ブロック数及びこれらのグループと関連づけられた品質メトリックと重みに基づいて重み付き品質メトリックを計算することによって重み付き品質メトリックを計算することができる。上述されるように、画素ブロックは、あらゆるサイズ、例えばH.264基準において規定されるサイズ、であることができる。
さらに、コンテンツ分類モジュール22は、符号化されたデータセグメントのコンテンツを解析してデータセグメントを複数のコンテンツクラスのうちの1つと関連づけることができる。一定の側面においては、コンテンツクラスは、品質メトリック、例えばピーク信号対雑音比(PSNR)をビットレートの関数としてモデル化する1つ以上の曲線を備えることができる。コンテンツ分類モジュール22は、知覚品質メトリック及びデータセグメントを符号化するために用いられる符号化パラメータ(例えば、ビットレート、QP、等)のうちの少なくとも1つに基づいて、これらの曲線のうちで符号化されたデータセグメントに最も密接に対応する曲線を選択することができる。符号化パラメータがコンテンツクラスを生成するために用いられたパラメータと一致しない場合においては、コンテンツ分類モジュール22は、データセグメントを符号化するために用いられる符号化パラメータを正規化すること及び正規化された符号化パラメータのうちの少なくとも1つ及び知覚品質メトリックを用いて全曲線の中で符号化されたセグメントに最も密接に対応する曲線を選択することができる。代替として、コンテンツ分類モジュール22は、知覚品質メトリック及び符号化されたデータセグメントの結果的に得られたビットレート(すなわち、特定の組の符号化パラメータを用いて達成されたビットレート)に基づいて全曲線の中で符号化されたデータセグメントに最も密接に対応する曲線を選択することができる。
他の側面においては、コンテンツクラスは、セグメントのデータの複雑さ(例えば、空間的複雑さ及び/又は時間的複雑さ)に基づくクラスを備えることができる。コンテンツ分類モジュール22は、テクスチャ情報、例えばコントラスト比値、を(x軸上において)“高”、“中”、及び“低”のカテゴリに分類し、動き情報、例えば動きベクトル、を(y軸上において)“高”、“中”、及び“低”のカテゴリに分類し、動きカテゴリとテクスチャカテゴリとの間の交点に基づいてクラスのうちの1つを用いてデータセグメントを分類することができる。データセグメントが関連づけられるクラスは、特定の品質−レート曲線と対応することができる。代替として、データセグメントが関連づけられるクラスは、1つ以上の符号化パラメータに対応することができる。1つの該コンテンツ分類方法は、参照されることによってその全体がここにおいて組み入れられている、同時係属中で共通して譲渡された米国特許出願番号11/373,577“CONTENT CLASSIFICATION FOR MULTIMEDIA PROCESSING”(マルチメディア処理に関するコンテンツ分類)において説明されている。
品質管理モジュール24は、データセグメントが属するコンテンツクラスと関連づけられたターゲット品質を決定する。幾つかの場合においては、従来の品質メトリック、例えばPSNR、は、観る人によって経験される知覚上の視覚映像品質を常に正確に測定できるわけではない。これらの場合は、コンテンツクラスの各々と関連づけられたターゲット品質メトリックは異なる場合がある。特に、品質管理モジュール24は、異なるコンテンツクラスのシーケンスは同じPSNRにおいても知覚的に異なるように見えるという事実を考慮するためにコンテンツクラスの各々と関連づけられたターゲット品質メトリックを調整することができる。
品質管理モジュール24は、知覚品質メトリック(例えば、重み付き品質メトリック)をターゲット品質メトリックと比較する。知覚品質メトリックとターゲット品質メトリックとの間の差分がしきい値を超える場合は、品質管理モジュール24は、符号化パラメータのうちの少なくとも1つを調整する。例えば、知覚品質メトリックがターゲット品質メトリックよりもしきい値分だけ大きい場合は、品質管理モジュール24は、データセグメントを符号化するために用いられるQPを大きくする。同様に、知覚品質メトリックがターゲット品質メトリックよりもしきい値分だけ小さい場合は、品質管理モジュール24は、データセグメントを符号化するために用いられるQPを小さくする。品質管理モジュール24は、QP以外の符号化パラメータ、例えばフレームレート、符号化モード、デブロッキング、係数トリミング、動きベクトルリファィンメント、等を調整することができる。
品質管理モジュール24が符号化パラメータを調整後は、符号化モジュール18は、調整された符号化パラメータを用いてデータセグメントに関する第2のパス符号化を行うことができる。例えば、符号化モジュー18は、調整されたQPにおいてデータセグメントを再符号化することができる。第2のパス符号化は、知覚品質メトリックを有効に高精度化して希望されるターゲットにより近づける。さらに、第2のパス符号化は、映像シーケンスのコンテンツクラスを再確立することができる。一定の側面においては、符号化モジュール18は、計算処理時間が許すときだけしか第2のパス符号化を実行することができない。他の側面においては、符号化モジュール18は、観測された品質を向上させるのを試みて3つ以上の符号化パスを実行することができる。
符号化モジュール18が、例えば第2の符号化バス後に又は符号化モジュール18が再符号化を必要としない場合は第1の符号化パス後に最後の符号化パスを実行後は、符号化デバイス12は、符号化されたデータセグメントを送信機26を介して送信する。送信機26は、符号化された映像を送信チャネル16において送信するための適切なモデム及びドライバ回路を含むことができる。無線用途においては、送信機26は、符号化された映像データを搬送する無線データを送信するためのRF回路を含む。
復号デバイス14は、符号化されたデータを受信機30を介して受信する。受信機30は、送信機26と同様に、符号化された映像を送信チャネル16において受信するための適切なモデム及びドライバ回路を含むことができ、及び無線用途において符号化された映像データを搬送する無線データを受信するためのRF回路を含むことができる。幾つかの例においては、符号化デバイス12及び復号デバイス14は、各々が送信チャネル16において送信された符号化映像及びその他の情報に関するソースデバイス及び受信デバイスの両方として働くことができるように可逆(reciprocal)送信及び受信回路を各々含むことができる。この場合は、符号化デバイス12及び復号デバイス14の両方が映像シーケンスを送信及び受信することができ、従って双方向通信に参加することができる。換言すると、マルチメディア符号化デバイス10の例示される構成要素は、符号器/復号器(CODEC)の一部として組み入れることができる。
復号モジュール32は、符号化されたデータセグメントをユーザーに提示するために復号する。復号デバイス14は、復号デバイス14内に組み入れるか又は有線又は無線接続を介して復号デバイス14に結合された個別デバイスとして提供することができるディスプレス(示されていない)を介して復号されたデータセグメントをユーザーにさらに提示することができる。
符号化デバイス12及び復号デバイス14内の構成要素は、ここにおいて説明される技法を実装するために適用可能な構成要素の典型例である。しかしながら、符号化デバイス12及び復号デバイス14は、希望される場合は、その他の数多くの構成要素を含むことができる。例えば、符号化デバイス12は、各々が1つ以上の映像データシーケンスを受け取ってここにおける技法に従って各々の映像データシーケンスを符号化する複数の符号化モジュールを含むことができる。この場合は、符号化デバイス12は、データセグメントを送信のために結合するための少なくとも1つのマルチプレクサをさらに含むことができる。さらに、符号化デバイス12及び復号デバイス14は、符号化された映像の送信及び受信のための適切な変調、復調、周波数変換、フィルタリング、及び増幅器の各構成要素を含むことができ、無線周波数(RF)無線構成要素とアンテナとを適宜含む。しかしながら、例示を容易にするために、該構成要素は図1に示されていない。
符号化デバイス12及び復号デバイス14内の構成要素は、1つ以上のプロセッサ、デジタル信号プロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェア、又はその組み合わせとして実装することができる。異なる特徴をモジュールとして描くことは、符号化デバイス12及び復号デバイス14の異なる機能上の側面を強調することが意図され、該モジュールを別個のハードウェア又はソフトウェア構成要素によって実現させなければならないということは必ずしも意味しない。むしろ、1つ以上のモジュールと関連づけられた機能は、共通の又は別個のハードウェア又はソフトウェア構成要素内に組み入れることができる。従って、この開示は、符号化デバイス12及び復号デバイス14の例に限定されるべきでない。
図2は、ここにおいて説明される技法によりデータセグメントを複数のコンテンツクラスのうちの1つと関連づける典型的コンテンツ分類モジュール40を示すブロック図である。コンテンツ分類モジュール40は、例えば、符号化デバイス12のコンテンツ分類モジュール22(図1)を代表することができる。コンテンツ分類モジュール40は、品質測定モジュール42と、符号化パラメータ正規化モジュール44と、クラス選択モジュール46と、を含む。
上述されるように、符号化モジュール18(図1)は、受信されたデータセグメントの第1のパス符号化を行う。データセグメントの第1のパス符号化は、前データセグメントの符号化のために用いられた符号化パラメータを用いて行うことができる。代替として、データセグメントの第1のパス符号化は、前データセグメントが調整された符号化パラメータを用いて再符号化されなかった場合でも、前データセグメントの調整された符号化パラメータを用いて行うことができる。他の例として、データセグメントの第1のパス符号化は、構成された一組の符号化パラメータを用いて行うことができる。第1のパス符号化後は、コンテンツ分類モジュール40は、データセグメントを複数のコンテンツクラスのうちの1つと関連づける。そうするために、コンテンツ分類モジュール40は、符号化されたデータセグメント及びクラスを生成するために用いられたパラメータに対応する1つ以上の符号化パラメータ又は符号化されたデータセグメントの結果的に得られたビットレートのうちのいずれかに基づいてデータセグメントをコンテンツクラスのうちの1つと関連づけることができる。後述されるように、幾つかの側面においては、1つ以上の符号化パラメータを、コンテンツクラスを生成するために用いられる符号化パラメータに対応するように正規化することができる。
品質測定モジュール42は、符号化されたデータセグメントに関する知覚品質メトリックを計算する。知覚品質メトリックは、例えば、観測されたPSNR、重み付きPSNR、平均オピニオン評点(MOS)、又はその他の品質メトリックであることができる。知覚品質メトリックを計算する際には、品質測定モジュール42は、従来の品質メトリック、例えばPSNR、は、観る人によって経験される知覚映像品質の必ずしも正確な尺度ではないという事実を考慮することができる。これは、低強度シーケンス又はフレームに特に当てはまり、小さい平均二乗誤差を有する低強度エリアによって平均フレームPSNRに偏りが生じる。これらのエリアは、典型的には、人間の視覚系がこれらのエリアを関心エリアとして知覚しないため知覚上の全体的な映像品質に対しては影響がない。
この問題に取り組むために、品質測定モジュール42は、重み付き品質メトリック(例えば、重み付きPSNR)を計算する。重み付き品質メトリックは、従来のPSNRよりも観る人によって知覚される主観的品質により近似する客観的な映像品質を提供する。重み付き品質メトリックを計算するために、品質測定モジュール42は、セグメントの1つ以上のデータフレームの画素ブロックを画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離する。品質測定モジュール42は、例えば、差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、又は画素ブロックの各々と関連づけられた同様の差分メトリックに基づいて1つ以上のデータフレームの画素ブロックをグループに分けることができる。その他の例は、変換された差分の絶対値の和(SATD)、又は変換された差分の二乗の和(SSTD)を用いることができる。例示目的のため、この開示は、1つ以上のデータフレームの画素ブロックを画素ブロックの各々と関連づけられたSPP値に基づいてグループに分類することができる。しかしながら、品質測定モジュール42は、その他の差分メトリックに基づいて画素ブロックをグループに分離できることが明らかなはずである。
品質測定モジュール42は、ブロックモード決定に少なくとも基づいて画素ブロックに関するSPP値を計算する。品質測定モジュール42は、例えば、以下の方程式に従って画素ブロックに関するSPP値を計算することができる。
Figure 2010525739
ここで、SPPは、画素ブロックに関して計算されるSPP値であり、SADiは、画素ブロックのi番目の画素に関するSAD値であり、nは、画素ブロック内の画素数である。画素ブロックの各々と関連づけられたSPP値は、ゼロ乃至nの範囲である。16×16画素ブロックの場合は、nは256に等しく、画素ブロックと関連づけられたSPP値は、0乃至255の範囲である。ゼロのSPP値は、予測される画素ブロック及び原画素ブロックがまったく同じであることを示す。他方、255のSPP値は、正反対であること、すなわち、予測される画素ブロック及び原画素ブロックが極端に異なることを示す。
品質測定モジュール42は、各SPP値と関連づけられた品質メトリックを予め計算することができる。例示目的で、この開示の技法は、PSNR品質メトリックに関して説明される。しかしながら、これらの技法は、あらゆる品質メトリックを用いて利用できることが理解されるべきである。品質測定モジュール42は、SPP値の各々と関連づけられたPSNR 値を予め計算することができる。一例においては、品質測定モジュール42は、以下の方程式に従ってSPP値の各々と関連づけられたPSNR値を予め計算することができる。
Figure 2010525739
ここで、PSNRは、i番目のSPP値と関連づけられたPSNR値であり、SPPは、i番目のSPP値である。
品質測定モジュール42は、SPP値範囲全体を複数のグループに分離し、各々のグループは、1つ以上のSPP値に対応する。一例においては、品質測定モジュール42は、SPP値範囲全体(0...255)を64グループに分離することができ、各々のグループは、4つの連続するSPP値を表す。代替として、品質測定モジュール42は、連続しないSPP値を複数のグループに分けることができる。品質測定モジュール42は、品質メトリック、例えばPSNR値、を各々のグループと関連づける。例えば、品質測定モジュール42は、各々のグループに関する平均PSNR値を入手するためにこれらのグループに属するSPP値の各々と関連づけられたPSNR値の平均を求める。
品質測定モジュール42は、重みを各々のグループとさらに関連づけることができる。一定の側面においては、品質測定モジュール42は、対数重み関数を用いて計算された重みを各々のグループと関連づけることができる。対数重み関数は、これらのグループに対応するSPP値の関数であることができる。品質測定モジュール42は、以下の方程式に従って各々のグループと関連づけるための重みを決定することができる。
Figure 2010525739
ここで、Wtは、i番目のグループと関連づけられた重みであり、SPPは、j番目の画素のSPP値であり、64の別々のグループの場合はk=0,1,...,64であり、jは、i番目のグループと関連づけられた最高のSPP値である。64のグループを有する16×16画素ブロックの場合は、j=3,7,11,...,255である。各々のグループと関連づけられた重みは、各グループに関するブロックカウントを調整するのに役立つ。換言すると、重みは、データセグメントの計算されたPSNRに向かってカウントすべきである各々のグループ内のブロック数を示す。重み関数は、より高いSPP値を有するグループにより高い重みを割り当てる。
上述されるように、データセグメントは、1つ以上の画素ブロックを含む1つ以上のデータフレームを含むことができる。品質測定モジュール42は、データセグメントのフレームの画素ブロックを画素ブロックと関連づけられたSPP値に基づいてグループのうちの1つに分離する。データセグメントのすべての画素ブロックがグループに分けられた後に、品質測定モジュール42は、1つのグループ当たりの画素ブロックの割合を計算する。一定の側面においては、スキップされることが決定された画素ブロックは、1つのグループ当たりの画素ブロックの割合の計算から除外される。品質測定モジュール42は、1つのグループ当たりの画素ブロックの割合、グループと関連づけられた品質メトリック及びグループと関連づけられた重みに基づいてデータセグメントに関する重み付き品質メトリックを計算する。一例においては、品質測定モジュールは、以下の方程式に従って重み付き品質メトリックを計算する。
Figure 2010525739
ここで、Wt_Qは、重み付き品質メトリックであり、i=0,1,...n,であり、nは、グループ数に等しく、Wt[i]は、i番目のグループと関連づけられた重みであり、MBPerc[i]は、i番目のグループに含まれるセグメントの総ブロック数の割合であり、Group_Q[i]は、i番目のグループと関連づけられた品質メトリックであり、TotalMBCntは、データセグメント内の総画素ブロック数である。TotalMBCntは、すべてのiのグループに関して以下の方程式を用いて計算される。
Figure 2010525739
データセグメントに関する品質メトリックを上述されるように計算することによって、客観的映像品質メトリックを、従来の品質メトリックと比較して観る人によって経験される主観的品質により近づけることができる。
データセグメントを符号化するため用いられる符号化パラメータがコンテンツクラスを生成するために用いられる符号化パラメータと合致しない場合は、コンテンツ分類モジュール40は、コンテンツクラスを生成するために用いられる符号化パラメータと対応するように符号化パラメータのうちの1つ以上を正規化することができる。一定の側面においては、符号化パラメータ正規化モジュール44は、コンテンツクラスを生成するために用いられるパラメータに対応するためにデータセグメントを符号化するために用いられるビットレートを正規化する。ビットレートを正規化することは、データセグメントの実際のフレームシーケンスの型とフレームレート、及びデータセグメントの符号化中に用いられたQPがビットレートに対して及ぼす影響を低減させることができる。
一定の側面においては、コンテンツクラスは、品質メトリック、例えばPSNR、をビットレートの関数としてモデル化する品質−レート曲線を備えることができる。この場合は、符号化パラメータは、品質−レート曲線を生成するために用いられるパラメータに合わせて正規化される。例えば、符号化パラメータ正規化モジュール44は、以下の方程式及表に従い、データセグメントを符号化するために用いられるビットレートを、品質−レート曲線を生成するために用いられるビットレートに合わせて正規化することができる。
Figure 2010525739
ここで、Rは、正規化されたビットレートであり、γFPSは、ビットレートを30フレーム/秒(fps)相当(equivalent)までスケーリングするために用いられるスケーリング係数であり、φは、Iフレームのビットレートを設定値QP相当までスケーリングするために用いられるスケーリング係数であり、Rateは、データセグメントのIフレームの観測されたビットレートであり、φは、Pフレームのビットレートを設定値QO相当までスケーリングするために用いられるスケーリング係数であり、Rateは、データセグメントのPフレームの観測されたビットレートであり、φは、Bフレームのビットレートを設定値QP相当までスケーリングするために用いられるスケーリング係数であり、Rateは、データセグメントのBフレームの観測されたビットレートである。換言すると、データセグメントのIフレームの観測されたビットレート(Rate)、データセグメントのPフレームの観測されたビットレート(Rate)、及びデータセグメントのBフレームの観測されたビットレート(Rate)は、データセグメントのIフレームを符号化するために用いられる総ビット数、データセグメントのPフレームを符号化するため用いられるビット数、及びデータセグメントのBフレームを符号化するため用いられるビット数にそれぞれ対応する。テーブル1は、これらのレートをQP33相当までスケーリングするために用いられる幾つかの典型的スケーリング係数(例えば、φ及びφ)を示す。テーブル2は、ビットレートを30fsp相当までスケーリングするために用いられる幾つかの典型的スケーリング係数を示す。
Figure 2010525739
Figure 2010525739
クラス選択モジュール46は、知覚品質メトリック(この場合は重み付き品質メトリック)及びクラスを生成するために用いられるパラメータに対応する1つ以上の符号化パラメータ又は符号化されたデータセグメントの結果的に得られたビットレートのいずれかに基づいてデータセグメントを複数のコンテンツクラスのうちの1つと関連づける。上述されるように、コンテンツクラスは、データセグメントを各々の品質及びレート情報と関連づけることができる。例えば、クラス選択モジュール46は、品質メトリックをビットレートの関数としてモデル化する複数の品質−レート曲線を用いて構成することができる。従って、品質−レート曲線は、コンテンツクラスを備えることができる。品質−レート曲線は、
異なるQPにおける異なるタイプのコンテンツに関するビットレート及び品質メトリックを測定し、その結果をクラスタリングし及び曲線当てはめを行うことによってオフラインで計算することができる。例えば、品質−レート曲線は、以下の形の対数関数を用いてモデル化することができる。
Figure 2010525739
ここで、Qは、品質メトリックであり、rは、ビットレートであり、α及びβは、幾つかのサンプルデータポイントを用いて計算される定数である。一例として、品質−レート曲線は、データセグメントのコンテンツ内の様々な動きレベル及びテクスチャレベルと関連づけられた8つの異なるクラスに対応することができる。以下のテーブル3は、図3に示される品質−レート曲線に関する幾つかの定数例α及びβを示す。曲線ID値0乃至7は、曲線48A乃至48H(“曲線48”)にそれぞれ対応する。
Figure 2010525739
データセグメントを対応する品質−レート曲線(例えば、コンテンツクラス)と関連づけるために、クラス選択モジュール46は、知覚品質メトリック、例えば重み付き品質メトリック、及びクラスを生成するために用いられるパラメータに対応する1つ以上の符号化パラメータ又は符号化されたデータセグメントの結果的に得られたビットレートのいずれかに基づいて品質−レート曲線のうちの1つを選択する。正規化されたビットレートを一例として用いると、クラス選択モジュール46は、正規化されたビットレートに対応する各々の品質レート曲線に関する品質メトリックを計算することができる。例えば、クラス選択モジュール46は、符号化パラメータ正規化モジュール44によって計算された正規化されたビットレート及びテーブル3において規定される品質−レート定数を用いて、方程式(7)に従って品質−レート曲線の各々に関する品質メトリックを計算することができる。換言すると、クラス選択モジュール46は、正規化されたビットレートにおける品質−レート曲線の各々に関する品質メトリックを計算する。
クラス選択モジュール46は、データセグメントに最も密接に対応する品質−レート曲線(すなわち、クラス)を選択する。例えば、クラス選択モジュール46は、正規化された符号化パラメータ、例えばビットレート、を用いて計算された品質メトリックのうちのいずれが品質測定モジュール42によって計算された重み付き品質メトリックに最も近いかを決定する。クラス選択モジュール46は、複数の品質−レート曲線の各々に関して、知覚品質メトリックと正規化されたビットレートにおける各々の品質−レート曲線上の品質メトリックとの間の差を計算し、これらの品質−レート曲線のうちで最小の差に対応する品質−レート曲線を選択することができる。このように、クラス選択モジュール46は、abs(Wt_Q−Q)を最小にする品質−レート曲線を選択し、ここで、Wt_Qは、重み付き品質メトリックであり、Qは、i番目のクラス又は曲線と関連づけられた品質メトリックである。
図3は、コンテンツクラスを表す典型的品質−レート曲線48を示すグラフである。図3に示される品質−レート曲線48は、対数関数(6)及びテーブル3に示される品質レート定数を用いてモデル化される。上述されるように、品質−レート曲線48は、異なるQPにおいて符号化された異なるタイプのコンテンツに関するビットレート及び品質メトリックを測定し、その結果をクラスタリングし、及び曲線当てはめを行うことによってオフラインで計算することができる。
品質−レート曲線48の各々は、データセグメントのコンテンツ内の様々な動きレベル及びテクスチャレベルと関連づけられた異なるコンテンツクラスに対応する。特に、品質−レート曲線48Aは、動きが少なくテクスチャの低いコンテンツに対応する。品質−レート曲線48Hは、動きが多くテクスチャが高いコンテンツに対応する。図3に示される品質−レート曲線48は、典型的曲線であるにすぎない。その他の品質−レート定数又はその他のモデル化方程式に基づいて同様の曲線を生成することができる。
図4は、データセグメントを符号化するために用いられる1つ以上の符号化パラメータを動的に調整する典型的品質管理モジュール50を示すブロック図である。品質管理モジュール50は、例えば、符号化デバイス12の品質管理モジュール24(図1)を表すことができる。品質管理モジュール50は、ターゲット品質決定モジュール52と、品質比較モジュール54と、符号化パラメータ調整モジュール56と、を含む。
ターゲット品質決定モジュール52は、コンテンツ分類に基づいてデータセグメントのターゲット品質メトリックを決定する。換言すると、ターゲット品質決定モジュール52は、符号化モジュール18(図1)がデータセグメントを符号化すべきであるターゲット品質レベルを決定する。ターゲット品質メトリックは、例えば、データセグメントを符号化すべきターゲットPSNRを備えることができる。上述されるように、従来のPSNRは、観る人によって経験される知覚上の映像品質の常に正確な測定値であるわけではない。従って、ターゲット品質決定モジュール52は、異なるコンテンツクラスのシーケンスは異なるPSNRにおいて知覚的には同様にみえるという事実を考慮するためにコンテンツ分類に基づいてターゲット品質メトリックを動的に調整することができる。ターゲット品質決定モジュール52は、以下の方程式を用いて希望されるターゲット品質メトリックを計算することができる。
Figure 2010525739
ここで、Target_Qは、希望されるターゲット品質メトリックであり、Setpoint(設定値)は、最初のターゲット品質メトリックであり、ΔQiは、i番目のコンテンツクラスに対応する品質調整デルタである。以下のテーブル4は、複数の曲線に関する典型的品質調整デルタ及び希望されるターゲット品質メトリック(この場合は、PSNR)を示す。テーブル4において計算された値は、33のSetPointPSNRを用いて計算される。上記のテーブル3において示される曲線ID値0乃至7は、図3の曲線48A乃至48H(“曲線48”)に対応することができる。
Figure 2010525739
テーブル4において示されるように、動きが少なくテクスチャが低いコンテンツに対応する曲線に関する希望されるターゲットPSNRは、最初のターゲット品質(すなわち、SetPoint)よりも高くなるように調整され、他方、動きが多くテクスチャが高いコンテンツに対応する曲線に関する希望されるターゲットPSNRは、最初のターゲット品質よりも低くなるように調整される。一定の側面においては、最初のターゲット品質(すなわち、Setpoint)は、動きが中度でテクスチャが中程度であるデータセグメントと関連づけられた品質メトリックに対応することができる。
品質比較モジュール54は、計算されたターゲット品質メトリックを、データセグメントが符号化される実際の品質レベルである知覚品質メトリックと比較する。一定の側面においては、知覚品質メトリックは、品質測定モジュール42(図2)によって計算された重み付き品質メトリックを備えることができる。品質比較モジュール54は、例えば、重み付き品質メトリックを品質測定モジュール42から受け取ることができる。代替として、品質比較モジュール54は、上記において図2に関して詳細に説明されるように重み付き品質メトリックを計算することができる。
知覚品質メトリック、例えば重み付き品質メトリック、とターゲット品質メトリックとの間の差がしきい値を超える場合は、品質比較モジュール54は、符号化パラメータ調整モジュール56に警告する。符号化パラメータ調整モジュール56は、データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータを調整する。例えば、知覚品質メトリックが希望されるターゲット品質メトリックよりもしきい値分だけ大きい場合は、符号化パラメータ調整モジュール56は、データセグメントが符号化されるQPを大きくすることができる。同様に、知覚品質メトリックが希望されるターゲット品質メトリックよりもしきい値分だけ小さい場合は、符号化パラメータ調整モジュール56は、データセグメントが符号化されるQPを小さくすることができる。QP符号化パラメータ調整モジュール56は、データセグメントが符号化されるQPを、知覚品質メトリックとターゲット品質メトリックとの間の差分だけ調整する(大きくするか又は小さくする)ことができる。代替として、QP符号化パラメータ調整モジュール56は、計算処理時間が許すときにはデータセグメントが符号化されるQPをさらに細かい増分値で調整することができる。ここにおいてはデータセグメントを符号化するために用いられるQPを調整することに関して説明されるが、符号化パラメータ調整モジュール56は、その他の符号化パラメータ、例えば、フレームレート、符号化モード、デブロッキング、係数トリミング、動きベクトル高精度化、等、を調整することができる。
符号化パラメータ調整モジュール56は、調整された符号化パラメータを符号化パラメータの許容範囲(以後“許容符号化パラメータ範囲”とする)と比較する。許容符号化パラメータ範囲は、データセグメントと関連づけられたコンテンツクラスに基づいて異なることができる。テーブル5は、図3に示される品質−レート曲線と関連づけられたコンテンツクラスに関するQP値に関する典型的な許容符号化パラメータ範囲を示す。
Figure 2010525739
テーブル5に示されるように、許容符号化パラメータ範囲は、データセグメントと関連づけられたコンテンツクラス(例えば、品質−レート曲線)に基づいて変動する。特に、動きが小さくテクスチャが低いコンテンツ(例えば、曲線ID0)に対応するコンテンツクラス及び動きが多くテクスチャが高いコンテンツ(例えば、曲線ID7)に対応するコンテンツクラスに対応する許容QP範囲は、中度のテクスチャ及び中度の動きを含むコンテンツクラス(例えば、曲線ID2乃至4)よりも小さい規模の範囲の許容可能QP値を有する。動き及びテクスチャがより極端であるコンテンツと関連づけられたコンテンツクラスは、4つの許容可能QP値のみから成る範囲を有しており、他方、より中度の動き及びテクスチャと関連づけられたコンテンツクラスは、最高9つの許容可能QP値を有する。
さらに、テーブル5は、QPとコンテンツとの間の追加の関係も示す。動きが多くテクスチャが高いコンテンツを含むデータセグメントのコンテンツの許容QP範囲は、動きが少なくテクスチャが低いコンテンツを含むデータセグメントのコンテンツの許容QP範囲よりも大きい。テーブル5において示されるように、動きが多くテクスチャが高いコンテンツと動きが少なくテクスチャが低いコンテンツとの間には5つのQP値の差が存在する。
調整された符号化パラメータが許容符号化パラメータ範囲の外側にあることを符号化パラメータ調整モジュール56が決定した場合は、符号化パラメータ調整モジュール56は、その符号化パラメータが許容符号化パラメータ範囲内になるように再調整する。曲線ID0に対応するデータセグメントに関する調整されたQP値が例えば28である場合は、符号化パラメータ調整モジュール56は、データセグメントに関するQP値を、品質−レート曲線ID0に対応するコンテンツクラスに関する許容QP範囲内にある30に再調整することができる。
品質管理モジュール50は、調整された符号化パラメータを符号化モジュール18(図1)に提供する。符号化モジュール18は、十分な処理時間が許す場合は調整された符号化パラメータを用いてデータセグメントに関する第2パス符号化を行うことができる。この方法により、品質管理モジュール50は、一定の品質を維持することを試みてデータセグメントが符号化されるときの知覚品質を動的に調整する。さらに、符号化モジュール18は、後続するデータセグメントを符号化するために調整された符号化パラメータを用いることができる。これは、符号化モジュール18が前データセグメントを再符号化しない場合でも当てはまる。
図5は、この開示の技法による典型的データセグメント符号化技法を示す図である。図5に示される符号化技法は、例えば、符号化デバイス12(図12)によって実行することができる。図5に示される例は、データセグメント60A及び60Bの符号化を示す。しかしながら、これらの技法は、あらゆる数のデータセグメントに拡大することができる。
最初に、符号化デバイス12は、最初の一組の符号化パラメータを用いてデータセグメント60Aを符号化するための第1のパスを行うことができる。符号化デバイス12は、例えば、最初に、構成されたQP又はデータセグメント60Aのコンテンツ、又はプロパティ、に基づいて決定されたQPを用いてデータセグメント60Aを符号化することができる。上記において詳細に説明されるように、符号化デバイス12は、符号化されたデータセグメントのコンテンツを解析してデータセグメント60Aを複数のコンテンツクラスのうちの1つと関連づけ及び符号化されたデータセグメントの知覚品質メトリック及び関連づけられたコンテンツクラスに対応するターゲット品質メトリックに基づいて1つ以上の符号化パラメータを調整すべきかどうかを決定する。符号化デバイス12は、例えば、知覚品質メトリックとターゲット品質メトリックとの間の差分がしきい値を超えるときに調整が望まれると決定することができる。
調整が望まれるときには、符号化デバイス12は、データセグメント60Aに関する少なくとも1つの符号化パラメータを調整し、調整された符号化パラメータを用いてデータセグメント60Aの第2のパス符号化を行う。第2のパス符号化は、知覚品質メトリックを有効に高精度化して希望されるターゲット品質メトリックに近づけ、及び映像シーケンスのコンテンツクラスを再確立することができる。図5に示される例においては2つの符号化パスのみが行われるが、符号化デバイス12は、計算プロセス時間が許すときには3つ以上の符号化パスを行うことができる。さらに、処理時間が許さない場合は、符号化デバイス12は、調整された符号化パラメータを用いてデータセグメントを再符号化することができないが、その代わりに、調整された符号化パラメータを用いて後続するデータセグメント、すなわち、データセグメント60B、を符号化することができる。符号化デバイス12は、符号化されたデータセグメント60Aを送信する。
符号化デバイス12は、第2のパス符号化中にデータセグメント60Aを符号化するために用いられた符号化パラメータを用いてデータセグメント60Bの第1のパス符号化を行うことができる。データセグメント60Aに関して第2のコーディングパスが行われなかった場合は、符号化デバイス12は、データセグメント60Aの第1のパス符号化中に用いられた符号化パラメータを用いてデータセグメント60Bの第1のパス符号化を行うことができる。代替として、符号化デバイス12は、データセグメント60Aの再符号化が行われなかった場合でもデータセグメント60Bに関して計算された調整された符号化パラメータを用いてデータセグメント60Bを符号化することができる。この方法により、符号化デバイス12は、コンテンツは2つの連続するデータセグメント間では類似するという発見的方法に基づいて動作する。
符号化デバイス12は、符号化されたデータセグメントのコンテンツを解析してデータセグメント60Bを複数のコンテンツクラスのうちの1つと関連づけ、符号化されたデータセグメントの知覚品質メトリック及び関連づけられたコンテンツクラスに対応するターゲット品質メトリックに基づいて符号化パラメータを調整すべきかどうかを決定し、及び調整が希望されるときにはデータセグメント60Bに関する少なくとも1つの符号化パラメータを調整する。符号化デバイス12は、調整された符号化パラメータを用いてデータセグメント60Bの第2のパス符号化を行い、これは、知覚品質メトリックを再度高精度化して希望されるターゲット品質メトリックにより近づける。
図6は、この開示の技術により符号化されたデータセグメントの品質を管理する符号化デバイス12の典型的動作を示した流れ図である。最初に、符号化モジュール18は、最初の一組の符号化パラメータを用いてデータセグメンを符号化する(70)。符号化モジュール18は、例えば、前データセグメントに関して計算された調整された符号化パラメータを用いてデータセグメントを符号化することができる。これらの調整された符号化パラメータは、前データセグメントを符号化するために用いられる符号化パラメータであること又はないことができる。例えば、処理時間が許さなかった場合は、前データセグメントは、異なる符号化パラメータを用いて符号化することができる。この方法により、符号化モジュール18は、コンテンツクラスは2つの連続するデータセグメント間では類似するという発見的方法に基づいて動作することができる。代替として、符号化モジュール18は、構成された符号化パラメータを用いて全データセグメントを最初に符号化するように構成することができる。他の例においては、符号化モジュール18は、データセグメントのコンテンツ、又はプロパティに基づいてデータセグメントを符号化するための最初の符号化パラメータを選択することができる。
符号化デバイス12は、符号化されたデータセグメントの知覚品質メトリックを計算する(72)。一定の側面においては、符号化デバイス12は、従来の品質メトリックと比較して観る人によって経験される主観的品質により近い客観的映像品質メトリックを提供する符号化データセグメントと関連づけられた重み付き品質メトリックを計算することができる。上記において詳細に説明されるように、符号化デバイス12は、セグメントと関連づけられた1つ以上のデータフレームの画素ブロックをこれらの画素ブロックの各々と関連づけられた1つ以上の差分メトリックに基づいてグループに分離し、品質メトリック及び重みを画素ブロックの各々のグループと関連づけ、及び各々のグループ内の画素ブロック数及びこれらのグループと関連づけられた品質メトリックと重みに基づいて重み付き品質メトリックを計算することによって重み付き品質メトリックを計算することができる。
コンテンツ分類モジュール22は、データセグメントを複数のコンテンツクラスのうちの1つと関連づける(74)。一定の側面においては、コンテンツクラスは、品質メトリック、例えばピーク信号対雑音比(PSNR)をビットレートの関数としてモデル化する1つ以上の曲線を備えることができる。コンテンツ分類モジュール22は、知覚品質メトリック及びデータセグメントを符号化するために用いられる符号化パラメータ(例えば、ビットレート、QP、等)のうちの少なくとも1つに基づいて、これらの曲線のうちで符号化されたデータセグメントに最も密接に対応する曲線を選択することができる。データセグメントとコンテンツクラスのうちの1つとの関連づけを補助するため、コンテンツ分類モジュール22は、データセグメントを符号化するために用いられる符号化パラメータが複数の品質−レート曲線を生成するために用いられる符号化パラメータと異なるときに品質−レート曲線を生成するために用いられるパラメータに対応するためにデータセグメントが符号化されたときの1つ以上の正規化された符号化パラメータを計算することができる。これで、コンテンツ分類モジュール22は、知覚品質メトリック及び正規化された符号化パラメータに基づいてデータセグメントをコンテンツクラスのうちの1つと関連づけることができる。例えば、コンテンツ分類モジュール22は、計算された重み付き品質メトリックに最も近い正規化されたビットレートにおける品質メトリックを有する品質−レート曲線を選択することができる。代替として、コンテンツ分類モジュール22は、知覚品質メトリック及び符号化されたデータセグメントの結果的に得られたビットレート(例えば、特定の組の符号化パラメータを用いて達成されたビットレート)に基づいて曲線のうちで符号化されたデータセグメントに最も近い曲線を選択することができる。
品質管理モジュール24は、データセグメントが属するコンテンツクラスと関連づけられたターゲット品質メトリックを決定する(76)。品質管理モジュール24は、例えば、方程式(8)及び33のPSNR値の設定値に関するテーブル4のパラメータを用いてターゲット品質メトリックを計算することができる。品質管理モジュール24は、重み付き品質メトリックとターゲット品質メトリックとの間の差分を計算し(78)、その差分の絶対値をしきい値と比較する(80)。換言すると、品質管理モジュール24は、観測された品質が十分であるかどうかを決定する。この差分の絶対値がしきい値よりも小さい場合は、符号化デバイス12は、再符号化のための第2のパスを行う必要がなく、代わりにデータセグメントを単に送信する(82)。
重み付き品質メトリックとターゲット品質メトリックとの間の差分の絶対値がしきい値を超える場合は、品質管理モジュール24は、データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータを調整する(84)。例えば、知覚品質メトリックがターゲット品質メトリックよりもしきい値分だけ大きい場合は、品質管理モジュール24は、符号化に関して用いられるQPを大きくすることができる。同様に、知覚品質メトリックがターゲット品質メトリックよりもしきい値分だけ小さい場合は、品質管理モジュール24は、符号化に関して用いられるQPを小さくすることができる。
符号化パラメータ調整モジュール56は、調整された符号化パラメータが許容パラメータ範囲内にあるかどうかを決定する(86)。符号化パラメータ調整モジュール56は、調整された符号化パラメータを、データセグメントと関連づけられ許容符号化パラメータ範囲、例えばテーブル5において規定されるQP範囲、と比較することができる。上述されるように、許容符号化パラメータ範囲は、データセグメントと関連づけられたコンテンツクラスに基づいて異なることができる。調整された符号化パラメータが許容符号化パラメータ範囲外にある場合は、符号化パラメータ調整モジュール56は、符号化パラメータが許容符号化パラメータ範囲内に入るように再調整する(87)。
品質管理モジュール24は、データセグメントを再符号化するための十分な時間が存在するかどうかを決定する(88)。一側面においては、品質管理モジュール24は、データセグメントを再符号化するため十分なコンピュータ処理時間が残されているかどうかを決定することができる。他の側面においては、品質管理モジュール24は、現在のデータセグメントが再符号化されている回数を決定することができ、データセグメントがしきい回数よりも多く再符号化された後は符号化パラメータを調整することができない。一例においては、データセグメントを再符号化できるしきい回数は、1回である。
データセグメントを再符号化するための十分な時間が存在する場合は、符号化モジュール18は、調整された符号化パラメータ、例えば調整されたQP、を用いてデータを再符号化するための第2のパスを行う(89)。第2の符号化パスは、知覚品質メトリックを有効に高精度化して希望されるターゲット品質メトリックにより近づけ、映像シーケンスのコンテンツクラスを再確立することができる。幾つかの側面においては、符号化モジュール24は、観測された品質を向上させるのを試みて3回以上の符号化パスを行うことができる。第2のパス再符号化後は、符号化デバイス12は、再符号化されたデータセグメントの知覚品質メトリックを計算する(72)。データセグメントを再符号化するための十分な時間が存在しない場合は、符号化デバイス12は、再符号化のための第2のパスを行う必要がなく、代わりに単にデータセグメントを送信する(82)。
図7は、この開示の一定の側面の技法により重み付き品質メトリックを計算する品質測定モジュール42の典型的動作を示す流れ図である。上記において詳細に説明されるように、重み付き品質メトリックは、従来の品質メトリックと比較して観る人によって知覚される主観的品質により近似する客観的映像品質メトリックを提供することができる。
品質測定モジュール42は、複数のグループを生成する(90)。上記において詳細に説明されるように、これらのグループは、1つ以上の差分メトリック、例えば、SPP、SAD、SSD、SATD、SSTD、等、に対応することができる。一例においては、品質測定モジュール42は、各々が4つの差分メトリックに対応する64のグループを生成することができる。品質測定モジュール42は、各々のグループと関連づけられた1つ以上の特徴を予め計算する(92)。品質測定モジュールは、各々のグループと関連づけられた品質メトリック、例えばPSNR値、を予め計算することができる。例えば、品質測定モジュール42は、これらのグループに属する差分メトリックの各々と関連づけられたPSNR値の平均を求めることによって品質メトリックを予め計算することができる。さらに、品質測定モジュール42は、各々のグループと関連づけられた重みを予め計算することができる。例えば、品質測定モジュール42は、より高い差分メトリック、例えばより高いSPP値、を有するグループにより高い重みを割り当てる対数重み関数を用いて重みを予め計算することができる。
品質測定モジュール42は、データセグメントの画素ブロックに関する差分メトリックを計算する(94)。品質測定モジュール42は、グループを形成するために用いられたのと同じ差分メトリックを計算する。例えば、グループがSPP値に基づいて生成される場合は、品質測定モジュール42は、上記の方程式1を用いて画素ブロックに関するSPP値を計算することができる。品質測定モジュール42は、計算された差分メトリックに基づいて画素ブロックをこれらのグループのうちの1つと関連づける(96)。品質測定モジュール42は、画素ブロックの品質メトリックをグループの品質メトリックと比較し、同じ品質メトリック値に対応するグループと画素ブロックを関連づけることができる。品質測定モジュール42は、データセグメント内にその他の画素ブロックが存在するかどうかを決定する(98)。品質測定モジュール42は、すべての画素ブロックがグループに分けられるまで画素ブロックの各々をグループと関連づけるのを続ける。この方法により、品質測定モジュール42は、データセグメントの画素ブロックを画素ブロックと関連づけられた品質メトリックに基づいてグループのうちの1つに分離する。
品質測定モジュール42がデータセグメントの全画素ブロックを全グループのうちの1つに関連づけた時点で、品質測定モジュール42は、全グループのうちの1つに含まれている画素ブロックの割合を計算する(100)。品質測定モジュール42は、そのグループと関連づけられた画素ブロック数をデータセグメントの総画素ブロック数で割ることによってその割合を計算することができる。一定の側面においては、品質測定モジュール42は、スキップ画素ブロックを含めずに割合を計算することができる。品質測定モジュール42は、グループ内における画素ブロックの割合にグループと関連づけられた予め計算された重みを乗じることによってグループに関する調整されたブロックカウントを計算する(102)。品質測定モジュール42は、さらなるグループが存在するかどうかを決定し(104)、各々のグループに関する画素ブロックの割合及び調整されたブロックカウントを計算する。
各々のグループに関する調整されたブロックカウントを計算後は、品質測定モジュール42は、データセグメントに関する重み付き品質メトリックを計算する(106)。例えば、品質測定モジュール42は、グループと関連づけられた調整されたブロックカウント及び品質メトリックに基づいてデータセグメントに関する重み付き品質メトリックを計算することができる。一例においては、品質測定モジュールは、以下の方程式に従って重み付き品質メトリックを計算する。
Figure 2010525739
ここで、Wt_Qは、重み付き品質メトリックであり、i=0、1、...、n、であり、nは、データセグメントと関連づけられたフレームの各々における画素数に等しく、Adjusted_block_cnt[i]は、i番目のグループと関連づけられた調整されたブロックカウントであり、Group_Q[i]は、i番目のグループと関連づけられた品質メトリックであり、TotalMBCntは、データセグメント内の総画素ブロック数である。データセグメントに関する品質メトリックを上述される方法で計算することによって、従来の技法と比較して観る人によって経験される主観的品質により近い客観的映像品質メトリックを定義することができる。
図8は、この開示の一定の側面の技法によりデータセグメントを複数のコンテンツクラスのうちの1つと関連づけるコンテンツ分類モジュール40の典型的動作を示した流れ図である。最初に、コンテンツ分類モジュール40は、コンテンツクラスを生成するために用いられるパラメータと対応するためにデータセグメントを符号化するために用いられる1つ以上の符号化パラメータを正規化する(110)。例えば、コンテンツ分類モジュール40は、方程式(6)及びテーブル1と2に含まれるスケーリング係数に従ってビットレートを正規化することができる。
コンテンツ分類モジュール40は、正規化された符号化パラメータを用いて各々の品質−レート曲線に関する品質メトリックを計算する(112)。例えば、コンテンツ分類モジュール40は、方程式(7)の対数関数及びテーブル3の定数を正規化されたビットレートとともに用いて各々の品質−レート曲線に関する品質メトリックを計算することができる。
コンテンツ分類モジュール40は、データセグメントを品質−レート曲線のうちの1つと関連づける(114)。コンテンツ分類モジュール40は、正規化さけたビットレートにおける品質−レート曲線の品質メトリック及び符号化されたデータセグメントの重み付き品質メトリックに基づいてデータセグメントを品質−レート曲線のうちの1つと関連づけることができる。特に、コンテンツ分類モジュール40は、正規化されたビットレートにおいて計算された品質−レート曲線の品質メトリックを重み付き品質メトリックと比較し、重み付き品質メトリックに最も近い品質メトリックに対応する品質−レート曲線を選択する。この方法により、コンテンツ分類モジュール40は、abs(Wt_Q−Q)を最小にする品質−レート曲線にデータセグメントを関連づけ、ここで、Wt_Qは、重み付き品質メトリックであり、Qは、i番目のクラス又は曲線と関連づけられた品質メトリックである。
ここにおいて説明される教示に基づき、ここにおいて開示される側面はその他側面とは無関係に実装できること及びこれらの側面のうちの2つ以上を様々な方法で組み合わせることができることを当業者は明確に理解すべきである。ここにおいて説明される技法は、ハードウェア、ソフトウェア、ファームウェア、又はそのいずれかの組み合わせにおいて実装することができる。ハードウェアにおいて実装される場合は、これらの技法は、デジタルハードウェア、アナログハードウェア又はその組み合わせを用いて実現することができる。ソフトウェア内に実装される場合は、これらの技法は、少なくとも部分的には、1つ以上の命令又は符号が格納されるコンピュータによって読み取り可能な媒体を含むコンピュータプログラム製品によって実現することができる。
一例として、及び限定することなしに、該コンピュータによって読み取り可能な媒体は、RAM、例えば同期ダイナミックランダムアクセスメモリ(SDRAM)、読み取り専用メモリ(ROM)、非揮発性ランダムアクセスメモリ(NVRAM)、ROM、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM)、EEPROM、FLASHメモリ、CD−ROM又はその他の光学ディスク記憶装置、磁気ディスク記憶装置又はその他の磁気記憶装置、又は希望されるプログラムコードを命令又はデータ構造の形態で搬送又は格納するために用いることができ及びコンピュータによってアクセス可能なその他の有形の媒体を備えることができる。
コンピュータプログラム製品のコンピュータによって読み取り可能な媒体と関連づけられた命令及び符号は、コンピュータによって、例えば1つ以上のプロセッサ、例えば1つ以上のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブロジックアレイ(FPGA)、又はその他の同等の集積回路又は個別論理回路によって実行することができる。
幾つかの側面及び例が説明されている。しかしながら、これらの例の様々な修正が可能であり、さらにここにおいて示される原理は、その他の側面に対しても同様に適用可能である。これらの及びその他の側面は、以下の請求項の適用範囲内にある。

Claims (88)

  1. デジタルマルチメディアデータを処理するための方法であって、
    前記デジタルマルチメディアデータと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化することと、
    前記符号化されたデータセグメントの1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけることと、
    前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整することと、
    前記調整された符号化パラメータを用いて前記データセグメントを再符号化すること、とを備える、方法。
  2. 前記符号化パラメータのうちの前記少なくとも1つを調整することは、
    前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分がしきい値を超えるときに前記符号化パラメータのうちの少なくとも1つを調整することを備える請求項1に記載の方法。
  3. 前記符号化パラメータのうちの前記少なくとも1つを調整することは、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ大きいときに量子化パラメータを大きくすることを備える請求項1に記載の方法。
  4. 前記量子化パラメータを大きくすることは、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを大きくすることを備える請求項3に記載の方法。
  5. 前記符号化パラメータのうちの前記少なくとも1つを調整することは、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ小さいときに量子化パラメータを小さくすることを備える請求項1に記載の方法。
  6. 前記量子化パラメータを小さくすることは、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを小さくすることを備える請求項5に記載の方法。
  7. 前記符号化パラメータのうちの前記調整された少なくとも1つを、前記データセグメントと関連づけられた前記コンテンツクラスに関する前記符号化パラメータのうちの前記少なくとも1つに関する許容範囲と比較することと、
    前記調整された符号化パラメータが前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲外にあるときに前記符号化パラメータのうちの前記少なくとも1つを前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲内の値になるように再調整すること、とをさらに備える請求項1に記載の方法。
  8. 最初のターゲット品質設定値を識別することと、
    前記データセグメントに関する前記ターゲット品質メトリックを計算するために前記データセグメントと関連づけられた前記コンテンツクラスに基づいて前記最初のターゲット品質設定値を調整すること、とをさらに備える請求項1に記載の方法。
  9. 前記データセグメントを符号化することは、前データセグメントに関して計算された前の一組の調整された符号化パラメータを用いて前記データセグメントを符号化することを備える請求項1に記載の方法。
  10. 前記符号化されたデータセグメントの前記1つ以上のプロパティを解析することは、
    前記データセグメントを符号化するために用いられる前記符号化パラメータが複数の品質−レート曲線を生成するために用いられる符号化パラメータと異なるときに前記複数の品質−レート曲線を生成するために用いられる前記符号化パラメータに対応するために前記符号化されたデータセグメントの前記1つ以上のプロパティのうちの少なくとも1つを正規化することと、
    前記符号化されたデータセグメントの前記知覚品質メトリックを計算することと、
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの前記少なくとも1つ、前記少なくとも1つの正規化されたプロパティ、及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて前記複数の品質−レート曲線のうちの1つを選択すること、とを備える請求項1に記載の方法。
  11. 前記複数の品質−レート曲線のうちの1つを選択することは、
    前記複数の品質−レート曲線の各々に関して、前記知覚品質メトリックと前記少なくとも1つの正規化されたプロパティに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算することと、
    前記品質−レート曲線のうちで前記計算された差分のうちの最小の差分に対応する品質−レート曲線を選択すること、とを備える請求項10に記載の方法。
  12. 前記知覚品質メトリックを計算することは、
    前記セグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離することと、
    品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけることと、
    前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算すること、とをさらに備える請求項10に記載の方法。
  13. 少なくとも1つの差分メトリックに基づいて画素ブロックをグループに分離することは、差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて画素ブロックをグループに分離することを備える請求項12に記載の方法。
  14. 前記符号化されたデータセグメントの前記1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけることは、前記符号化されたデータセグメントの前記1つ以上のプロパティを解析して前記データセグメントを複数の品質−レート曲線のうちの一定の1つと関連づけることを備える請求項1に記載の方法。
  15. デジタルマルチメディアデータを処理するための装置であって、
    前記デジタルマルチメディアデータと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化する符号化モジュールと、
    前記符号化されたデータセグメントの1つ以上のパラメータを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけるコンテンツ分類モジュールと、
    前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整する品質管理モジュールと、を備え、
    前記符号化モジュールは、前記調整された符号化パラメータを用いて前記データセグメントを再符号化する、装置。
  16. 前記品質管理モジュールは、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分がしきい値を超えるときに前記符号化パラメータのうちの前記少なくとも1つを調整する請求項15に記載の装置。
  17. 前記品質管理モジュールは、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ大きいときに量子化パラメータを大きくする請求項15に記載の装置。
  18. 前記品質管理モジュールは、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを大きくする請求項17に記載の装置。
  19. 前記品質管理モジュールは、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ小さいときに量子化パラメータを小さくする請求項15に記載の装置。
  20. 前記品質管理モジュールは、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを小さくする請求項19に記載の装置。
  21. 前記品質管理モジュールは、
    前記符号化パラメータのうちの前記調整された少なくとも1つを、前記データセグメントと関連づけられた前記コンテンツクラスに関する前記符号化パラメータのうちの前記少なくとも1つに関する許容範囲と比較し、及び
    前記調整された符号化パラメータが前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲外にあるときに前記符号化パラメータのうちの前記少なくとも1つを前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲内の値になるように再調整する請求項15に記載の装置。
  22. 前記品質管理モジュールは、
    最初のターゲット品質設定値を識別し、及び
    前記データセグメントに関する前記ターゲット品質メトリックを計算するために前記データセグメントと関連づけられた前記コンテンツクラスに基づいて前記最初のターゲット品質設定値を調整する請求項15に記載の装置。
  23. 前記符号化モジュールは、前データセグメントに関して計算された前の一組の調整された符号化パラメータを用いて前記データセグメントを符号化する請求項15に記載の装置。
  24. 前記コンテンツ分類モジュールは、
    前記データセグメントを符号化するために用いられる前記符号化パラメータが複数の品質−レート曲線を生成するために用いられる符号化パラメータと異なるときに前記複数の品質−レート曲線を生成するために用いられる前記符号化パラメータに対応するために前記符号化されたデータセグメントの前記1つ以上のプロパティのうちの少なくとも1つを正規化し、
    前記符号化されたデータセグメントの前記知覚品質メトリックを計算し、及び
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの前記少なくとも1つ、前記少なくとも1つの正規化されたプロパティ、及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて前記複数の品質−レート曲線のうちの1つを選択する請求項15に記載の装置。
  25. 前記コンテンツ分類モジュールは、
    前記複数の品質−レート曲線の各々に関して、前記知覚品質メトリックと前記少なくとも1つの正規化されたプロパティに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算し、及び
    前記品質−レート曲線のうちで前記計算された差分のうちの最小の差分に対応する品質−レート曲線を選択する請求項24に記載の装置。
  26. 前記コンテンツ分類モジュールは、
    前記セグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離し、
    品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけ、及び
    前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算する請求項24に記載の装置。
  27. 前記コンテンツ分類モジュールは、
    差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて前記画素ブロックをグループに分離する請求項26に記載の装置。
  28. 前記コンテンツ分類モジュールは、
    前記符号化されたデータセグメントの前記1つ以上のプロパティを解析して前記データセグメントを複数の品質−レート曲線のうちの一定の1つと関連づける請求項15に記載の装置。
  29. デジタルマルチメディアデータを処理するための装置であって、
    前記デジタルマルチメディアデータと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化するための手段と、
    前記符号化されたデータセグメントの1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけるための手段と、
    前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整するための手段と、
    前記調整された符号化パラメータを用いて前記データセグメントを再符号化するための手段と、を備える、装置。
  30. 前記符号化パラメータのうちの前記少なくとも1つを調整するための前記手段は、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分がしきい値を超えるときに前記符号化パラメータのうちの少なくとも1つを調整するための手段を備える請求項29に記載の装置。
  31. 前記符号化パラメータのうちの前記少なくとも1つを調整するための前記手段は、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ大きいときに量子化パラメータを大きくするための手段を備える請求項29に記載の装置。
  32. 大きくするための前記手段は、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを大きくするための手段を含む請求項31に記載の装置。
  33. 前記符号化パラメータのうちの前記少なくとも1つを調整するための前記手段は、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ小さいときに量子化パラメータを小さくするための手段を備える請求項29に記載の装置。
  34. 小さくするための前記手段は、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを小さくするための手段を含む請求項33に記載の装置。
  35. 前記符号化パラメータのうちの前記調整された少なくとも1つを、前記データセグメントと関連づけられた前記コンテンツクラスに関する前記符号化パラメータのうちの前記少なくとも1つに関する許容範囲と比較するための手段と、
    前記調整された符号化パラメータが前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲外にあるときに前記符号化パラメータのうちの前記少なくとも1つを前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲内の値になるように再調整するための手段と、をさらに備える請求項29に記載の装置。
  36. 最初のターゲット品質設定値を識別するための手段と、
    前記データセグメントに関する前記ターゲット品質メトリックを計算するために前記データセグメントと関連づけられた前記コンテンツクラスに基づいて前記最初のターゲット品質設定値を調整するための手段と、をさらに備える請求項29に記載の装置。
  37. 前記データセグメントを符号化するための前記手段は、前データセグメントに関して計算された前の一組の調整された符号化パラメータを用いて前記データセグメントを符号化するための手段を備える請求項29に記載の装置。
  38. 前記解析する手段は、
    前記データセグメントを符号化するために用いられる符号化パラメータが複数の品質−レート曲線を生成するために用いられる符号化パラメータと異なるときに前記複数の品質−レート曲線を生成するために用いられる前記符号化パラメータに対応するために前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを正規化するための手段と、
    前記符号化されたデータセグメントの前記知覚品質メトリックを計算するための手段と、
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つ、前記正規化された符号化パラメータ、及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて前記複数の品質−レート曲線のうちの1つを選択するための手段と、をさらに備える請求項29に記載の装置。
  39. 前記選択する手段は、前記複数の品質−レート曲線の各々に関して、前記知覚品質メトリックと前記正規化された符号化パラメータに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算し、及び前記品質−レート曲線のうちで前記最小の差分に対応する品質−レート曲線を選択する請求項38に記載の装置。
  40. 前記計算する手段は、
    前記セグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離し、品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけ、及び前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算する請求項38に記載の装置。
  41. 前記計算する手段は、差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗差の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて画素ブロックをグループに分離する請求項40に記載の装置。
  42. 前記解析する手段は、前記符号化されたデータセグメントのコンテンツを解析して前記データセグメントを複数の品質−レート曲線のうちの1つと関連づける請求項29に記載の装置。
  43. 命令が格納されている機械によって読み取り可能な媒体であって、前記格納された命令は、符号の1つ以上のセグメントを含み、及び1つ以上の機械において実行可能であり、符号の前記1つ以上のセグメントは、
    前記デジタルマルチメディアデータと関連づけられたデータセグメントを一組の符号化パラメータを用いて符号化するための符号と、
    前記符号化されたデータセグメントの1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけるための符号と、
    前記符号化されたデータセグメントの知覚品質メトリック及び前記関連づけられたコンテンツクラスに対応するターゲット品質メトリックに少なくとも基づいて前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを調整するための符号と、
    前記調整された符号化パラメータを用いて前記データセグメントを再符号化するための符号と、を備える、コンピュータによって読み取り可能な媒体。
  44. 前記少なくとも1つの符号化パラメータを調整するための前記符号は、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分がしきい値を超えるときに前記符号化パラメータのうちの少なくとも1つを調整するための符号を備える請求項43に記載の機械によって読み取り可能な媒体。
  45. 前記符号化パラメータのうちの前記少なくとも1つを調整するための前記符号は、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ大きいときに量子化パラメータを大きくするための符号を備える請求項43に記載の機械によって読み取り可能な媒体。
  46. 前記量子化パラメータを大きくするための前記符号は、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを大きくするための符号を備える請求項45に記載の機械によって読み取り可能な媒体。
  47. 前記符号化パラメータのうちの前記少なくとも1つを調整するための前記符号は、前記知覚品質メトリックが前記ターゲット品質メトリックよりもしきい値分だけ小さいときに量子化パラメータを小さくするための符号を備える請求項43に記載の機械によって読み取り可能な媒体。
  48. 前記量子化パラメータを小さくするための前記符号は、前記知覚品質メトリックと前記ターゲット品質メトリックとの間の差分の絶対値分だけ前記量子化パラメータを小さくするための符号を備える請求項47に記載の機械によって読み取り可能な媒体。
  49. 前記符号化パラメータのうちの前記調整された少なくとも1つを、前記データセグメントと関連づけられた前記コンテンツクラスに関する前記符号化パラメータのうちの前記少なくとも1つに関する許容範囲と比較するための符号と、
    前記調整された符号化パラメータが前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲外にあるときに前記符号化パラメータのうちの前記少なくとも1つを前記符号化パラメータのうちの前記少なくとも1つに関する前記許容範囲内の値になるように再調整するための符号と、をさらに備える請求項43に記載の機械によって読み取り可能な媒体。
  50. 最初のターゲット品質設定値を識別するための符号と、
    前記データセグメントに関する前記ターゲット品質メトリックを計算するために前記データセグメントと関連づけられた前記コンテンツクラスに基づいて前記最初のターゲット品質設定値を調整するための符号と、をさらに備える請求項43に記載の機械によって読み取り可能な媒体。
  51. 前記データセグメントを符号化するための前記符号は、前データセグメントに関して計算された前の一組の調整された符号化パラメータを用いて前記データセグメントを符号化するための符号を備える請求項43に記載の機械によって読み取り可能な媒体。
  52. 前記符号化されたデータセグメントの前記1つ以上のプロパティを解析するための前記符号は、
    前記データセグメントを符号化するために用いられる前記符号化パラメータが複数の品質−レート曲線を生成するために用いられる符号化パラメータと異なるときに前記複数の品質−レート曲線を生成するために用いられる前記符号化パラメータに対応するために前記データセグメントを符号化するために用いられる前記符号化パラメータの1つ以上のプロパティのうちの少なくとも1つを正規化するための符号と、
    前記符号化されたデータセグメントの前記知覚品質メトリックを計算するための符号と、
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの前記少なくとも1つ、前記少なくとも1つの正規化されたプロパティ、及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて前記複数の品質−レート曲線のうちの1つを選択するための符号と、を備える請求項43に記載の機械によって読み取り可能な媒体。
  53. 前記複数の品質−レート曲線のうちの1つを選択するための前記符号は、
    前記複数の品質−レート曲線の各々に関して、前記知覚品質メトリックと前記少なくとも1つの正規化されたプロパティに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算するための符号と、
    前記品質−レート曲線のうちで前記計算された差分のうちの最小の差分に対応する品質−レート曲線を選択するための符号と、を備える請求項52に記載の機械によって読み取り可能な媒体。
  54. 前記知覚品質メトリックを計算するための前記符号は、
    前記セグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離するための符号と、
    品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけるための符号と、
    前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算するための符号と、をさらに備える請求項52に記載の機械によって読み取り可能な媒体。
  55. 少なくとも1つの差分メトリックに基づいて画素ブロックをグループに分離するための前記符号は、差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて画素ブロックをグループに分離するための符号を備える請求項54に記載の機械によって読み取り可能な媒体。
  56. 前記符号化されたデータセグメントの前記1つ以上のプロパティを解析して前記データセグメントを複数のコンテンツクラスのうちの1つと関連づけるための前記符号は、前記符号化されたデータセグメントの前記1つ以上のプロパティを解析して前記データセグメントを複数の品質−レート曲線のうちの1つと関連づけるための符号を備える請求項43に記載の機械によって読み取り可能な媒体。
  57. マルチメディアデータを処理するための方法であって、
    デジタルマルチメディアデータと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算することと、
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータ及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて複数のコンテンツクラスのうちの1つを選択すること、とを備える、方法。
  58. 前記複数のコンテンツクラスを生成するために用いられる符号化パラメータに対応するために前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを正規化することをさらに備える請求項57に記載の方法。
  59. 前記コンテンツクラスは、品質−レート曲線を備え、
    前記品質−レート曲線の各々に関して、前記知覚品質メトリックと前記正規化された符号化パラメータに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算することと、
    前記複数の品質−レート曲線のうちで前記計算された差分のうちの最小の差分と関連づけられた一定の品質−レート曲線を選択すること、とをさらに備える請求項58に記載の方法。
  60. 前記複数のコンテンツクラスは、複数の品質−レート曲線を備え、前記複数のコンテンツクラスのうちの前記1つを選択することは、前記複数の品質−レート曲線のうちの一定の品質−レート曲線を選択することを含む請求項57に記載の方法。
  61. 前記知覚品質メトリックを計算することは、
    前記符号化されたセグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離することと、
    品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけることと、
    前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記符号化されたデータセグメントに関する重み付き品質メトリックを計算すること、とをさらに含む請求項57に記載の方法。
  62. 少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離することは、差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて画素ブロックをグループに分離することを含む請求項61に記載の方法。
  63. 少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離することは、
    可能な差分メトリックをグループに分離することであって、前記グループの少なくとも一部分は、2つ以上の差分メトリックを含むことと、
    前記グループの各々と関連づけられた品質メトリックを予め計算することであって、前記グループに関する前記品質メトリックは、前記グループと関連づけられた前記差分メトリックの各々に対応する品質メトリックの平均に等しいことと、
    前記グループの各々に関する重みを予め計算することであって、前記グループの各々に関する前記重みは、前記ビンと関連づけられた前記差分メトリックの少なくとも一部分に基づいて計算される請求項61に記載の方法。
  64. 前記符号化されたデータセグメントの前記知覚品質メトリックを計算することは、前記符号化されたデータセグメントの観測されたピーク信号対雑音比(PSNR)を計算することを含む請求項57に記載の方法。
  65. マルチメディアデータを処理するための装置であって、
    デジタルマルチメディアデータと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算する品質測定モジュールと、
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータ及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて複数のコンテンツクラスのうちの1つを選択するクラス選択モジュールと、を備える、装置。
  66. 前記複数のコンテンツクラスを生成するために用いられる符号化パラメータに対応するために前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを正規化する符号化パラメータ正規化モジュールをさらに備える請求項65に記載の装置。
  67. 前記複数のコンテンツクラスは、複数の品質−レート曲線を備え、前記クラス選択モジュールは、同じく、
    前記品質−レート曲線の各々に関して、前記知覚品質メトリックと前記正規化された符号化パラメータに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算し、及び
    前記複数の品質−レート曲線のうちで前記計算された差分のうちの最小の差分と関連する品質−レート曲線を選択する請求項66に記載の装置。
  68. 前記複数のコンテンツクラスは、複数の品質−レート曲線を備え、前記クラス選択モジュールは、前記複数の品質−レート曲線のうちの一定の1つを選択する請求項65に記載の装置。
  69. 前記品質測定モジュールは、さらに、
    前記セグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離し、
    品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけ、及び
    前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算する請求項65に記載の装置。
  70. 前記品質測定モジュールは、さらに、
    差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて画素ブロックをグループに分離する請求項69に記載の装置。
  71. 前記品質測定モジュールは、さらに、
    可能な差分メトリックをグループに分離し、
    前記グループの各々と関連づけられた品質メトリックを予め計算し、及び
    前記グループの各々に関する重みを予め計算し、
    前記グループの少なくとも一部分は、2つ以上の差分メトリックを含み、
    前記グループに関する前記品質メトリックは、前記グループと関連づけられた前記差分メトリックの各々に対応する品質メトリックの平均に等しく、
    前記グループの各々に関する前記重みは、前記ビンと関連づけられた前記差分メトリックの少なくとも一部分に基づいて計算される請求項69に記載の装置。
  72. 前記品質測定モジュールは、前記符号化されたデータセグメントの観測されたピーク信号対雑音比(PSNR)も計算する請求項65に記載の装置。
  73. マルチメディアデータを処理するための装置であって、
    デジタルマルチメディアデータと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算するための手段と、
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータ及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて複数のコンテンツクラスのうちの1つを選択するための手段と、を備える、装置。
  74. 前記複数のコンテンツクラスを生成するために用いられる符号化パラメータに対応するために前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つを正規化するための手段をさらに備える請求項73に記載の装置。
  75. 前記複数のコンテンツクラスは、複数の品質−レート曲線を備え、
    前記品質−レート曲線の各々に関して、前記知覚品質メトリックと前記正規化された符号化パラメータに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算するための手段と、
    前記複数の品質−レート曲線のうちで前記計算された差分のうちの最小の差分に対応する一定の品質−レート曲線を選択するための手段と、をさらに備える請求項74に記載の装置。
  76. 前記複数のコンテンツクラスは、複数の品質−レート曲線を備え、前記複数のコンテンツクラスのうちの前記1つを選択するための前記手段は、前記複数の品質−レート曲線のうちの一定の品質−レート曲線を選択するための手段を含む請求項73に記載の装置。
  77. 前記知覚品質メトリックを計算するための前記手段は、
    前記セグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離するための手段と、
    品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけるための手段と、
    前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算するための手段と、をさらに含む請求項73に記載の装置。
  78. 少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離するための前記手段は、差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて前記画素ブロックをグループに分離するための手段を含む請求項77に記載の装置。
  79. 少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離するための前記手段は、
    可能な差分メトリックをグループに分離するための手段であって、前記グループの少なくとも一部分は、2つ以上の差分メトリックを含む手段と、
    前記グループの各々と関連づけられた品質メトリックを予め計算するための手段であって、前記グループに関する前記品質メトリックは、前記グループと関連づけられた前記差分メトリックの各々に対応する品質メトリックの平均に等しい手段と、
    前記グループの各々に関する重みを予め計算するための手段であって、前記グループの各々に関する前記重みは、前記ビンと関連づけられた前記差分メトリックの少なくとも一部分に基づいて計算される手段と、を含む請求項77に記載の装置。
  80. 前記符号化されたデータセグメントに関する前記知覚品質メトリックを計算するための前記手段は、
    前記符号化されたデータセグメントの観測されたピーク信号対雑音比(PSNR)を計算するための手段を含む請求項73に記載の装置。
  81. 命令が格納されている機械によって読み取り可能な媒体であって、前記格納された命令は、符号の1つ以上の部分を含み、及び1つ以上の機械において実行可能であり、符号の前記1つ以上の部分は、
    デジタルマルチメディアデータと関連づけられた符号化されたデータセグメントに関する知覚品質メトリックを計算するための符号と、
    前記知覚品質メトリック及び前記データセグメントを符号化するために用いられる少なくとも1つの符号化パラメータ及び前記符号化されたデータセグメントの結果的に得られたビットレートのうちの1つに基づいて複数のコンテンツクラスのうちの1つを選択するための符号と、を備える、機械によって読み取り可能な媒体。
  82. 前記複数のコンテンツクラスを生成するために用いられる符号化パラメータに対応するために前記データセグメントを符号化するために用いられる前記符号化パラメータのうちの少なくとも1つ正規化するための符号をさらに備える請求項81に記載の機械によって読み取り可能な媒体。
  83. 前記複数のコンテンツクラスは、複数の品質−レート曲線を備え、
    前記品質−レート曲線の各々に関して、前記知覚品質メトリックと前記正規化された符号化パラメータに対応する前記各々の品質−レート曲線上の品質メトリックとの間の差分を計算するための符号と、
    前記複数の品質−レート曲線のうちで前記計算された差分のうちの最小の差分に関連する一定の品質−レート曲線を選択するための符号と、をさらに備える請求項82に記載の機械によって読み取り可能な媒体。
  84. 前記複数のコンテンツクラスは、複数の品質−レート曲線を備え、前記複数のコンテンツクラスのうちの前記1つを選択するための前記符号は、前記複数のビットレート曲線のうち一定の品質−レート曲線を選択するための符号を含む請求項81に記載の機械によって読み取り可能な媒体。
  85. 前記知覚品質メトリックを計算するための前記符号は、
    前記セグメントと関連づけられたデータフレームの画素ブロックを前記画素ブロックの各々と関連づけられた少なくとも1つの差分メトリックに基づいてグループに分離するための符号と、
    品質メトリック値及び重み値を前記画素ブロックグループの各々と関連づけるための符号と、
    前記グループと関連づけられた前記品質メトリック値及び重み値に基づいて前記データセグメントに関する重み付き品質メトリックを計算するための符号と、をさらに含む請求項81に記載の機械によって読み取り可能な媒体。
  86. 少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離するための前記符号は、差分の絶対値の和(SAD)、画素当たりのSAD(SPP)、差分の二乗の和(SSD)、変換された差分の絶対値の和(SATD)、及び変換された差分の二乗の和(SSTD)のうちの少なくとも1つに基づいて前記画素ブロックをグループに分離するための符号を含む請求項85に記載の機械によって読み取り可能な媒体。
  87. 少なくとも1つの差分メトリックに基づいて前記画素ブロックをグループに分離するための前記符号は、
    可能な差分メトリックをグループに分離するための符号であって、前記グループの少なくとも一部分は、2つ以上の差分メトリックを含む符号と、
    前記グループの各々と関連づけられた品質メトリックを予め計算するための符号であって、前記グループに関する前記品質メトリックは、前記グループと関連づけられた前記差分メトリックの各々に対応する品質メトリックの平均に等しい符号と、
    前記グループの各々に関する重みを予め計算するための符号であって、前記グループの各々に関する前記重みは、前記ビンと関連づけられた前記差分メトリックの少なくとも一部分に基づいて計算される符号と、を含む請求項85に記載の機械によって読み取り可能な媒体。
  88. 前記符号化されたデータセグメントに関する前記知覚品質メトリックを計算するための前記符号は、前記符号化されたデータセグメントの観測されたピーク信号対雑音比(PSNR)を計算するための符号を含む請求項81に記載の機械によって読み取り可能な媒体。
JP2010506169A 2007-04-23 2007-04-24 品質管理された符号化のための方法及びシステム Active JP5113244B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/739,075 2007-04-23
US11/739,075 US8582647B2 (en) 2007-04-23 2007-04-23 Methods and systems for quality controlled encoding
PCT/US2007/067346 WO2008133677A1 (en) 2007-04-23 2007-04-24 Methods and systems for quality controlled encoding

Publications (2)

Publication Number Publication Date
JP2010525739A true JP2010525739A (ja) 2010-07-22
JP5113244B2 JP5113244B2 (ja) 2013-01-09

Family

ID=39495327

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010506169A Active JP5113244B2 (ja) 2007-04-23 2007-04-24 品質管理された符号化のための方法及びシステム

Country Status (6)

Country Link
US (2) US8582647B2 (ja)
EP (1) EP2153657B1 (ja)
JP (1) JP5113244B2 (ja)
KR (1) KR101104654B1 (ja)
CN (1) CN101658035B (ja)
WO (1) WO2008133677A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015177356A (ja) * 2014-03-14 2015-10-05 ソフトバンク株式会社 動画配信装置、動画符号化装置及びプログラム
JP2020205580A (ja) * 2019-05-24 2020-12-24 アクシス アーベー ビデオエンコーダの出力ビットレートを制御する方法及びビットレートコントローラ

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090010341A1 (en) * 2007-07-02 2009-01-08 Feng Pan Peak signal to noise ratio weighting module, video encoding system and method for use therewith
US8743954B1 (en) * 2008-02-01 2014-06-03 Zenverge, Inc. Architecture for adjusting bit rate based on measured quality
CN101686383B (zh) * 2008-09-23 2013-05-01 Utc消防和保安美国有限公司 通过网络传输媒体的方法及系统
US8270476B2 (en) * 2008-12-31 2012-09-18 Advanced Micro Devices, Inc. Face detection system for video encoders
US20100309987A1 (en) * 2009-06-05 2010-12-09 Apple Inc. Image acquisition and encoding system
JP5484083B2 (ja) * 2010-01-14 2014-05-07 株式会社メガチップス 画像処理装置
US8638863B1 (en) 2010-05-18 2014-01-28 Google Inc. Apparatus and method for filtering video using extended edge-detection
EP2472868A1 (en) * 2010-12-29 2012-07-04 British Telecommunications Public Limited Company Video coding
US8813144B2 (en) * 2011-01-10 2014-08-19 Time Warner Cable Enterprises Llc Quality feedback mechanism for bandwidth allocation in a switched digital video system
US8838680B1 (en) 2011-02-08 2014-09-16 Google Inc. Buffer objects for web-based configurable pipeline media processing
KR20140119200A (ko) * 2011-02-11 2014-10-08 인터디지탈 패튼 홀딩스, 인크 콘텐츠 배포 및 수신 방법 및 장치
US8767817B1 (en) 2011-04-07 2014-07-01 Google Inc. Apparatus and method for coding using parameterized equation
US8804819B1 (en) 2011-04-19 2014-08-12 Google Inc. Method and apparatus for encoding video using data frequency
US8681866B1 (en) 2011-04-28 2014-03-25 Google Inc. Method and apparatus for encoding video by downsampling frame resolution
US9749638B1 (en) * 2011-04-28 2017-08-29 Google Inc. Method and apparatus for encoding video with dynamic quality improvement
US8705620B1 (en) 2011-04-28 2014-04-22 Google Inc. Method and apparatus for encoding anchor frame by encoding features using layers
US20120275511A1 (en) * 2011-04-29 2012-11-01 Google Inc. System and method for providing content aware video adaptation
US9106787B1 (en) 2011-05-09 2015-08-11 Google Inc. Apparatus and method for media transmission bandwidth control using bandwidth estimation
EP2536144A1 (en) * 2011-06-17 2012-12-19 Thomson Licensing Method and device of lossy compress-encoding an image
EP2541935A1 (en) * 2011-06-29 2013-01-02 British Telecommunications Public Limited Company Video coding with quality control and rate control
EP2547062B1 (en) * 2011-07-14 2016-03-16 Nxp B.V. Media streaming with adaptation
US8924580B2 (en) 2011-08-12 2014-12-30 Cisco Technology, Inc. Constant-quality rate-adaptive streaming
JP2014532377A (ja) 2011-10-14 2014-12-04 アドバンスト・マイクロ・ディバイシズ・インコーポレイテッドAdvanced Micro Devices Incorporated 領域ベースの画像圧縮
US20150163271A1 (en) * 2011-12-22 2015-06-11 Telefonaktiebolaget L M Ericsson (Publ) Apparatus and method for monitoring performance in a communications network
CN104205713B (zh) 2012-03-28 2018-08-17 华为技术有限公司 发射器噪声注入
US9185429B1 (en) 2012-04-30 2015-11-10 Google Inc. Video encoding and decoding using un-equal error protection
US9781447B1 (en) 2012-06-21 2017-10-03 Google Inc. Correlation based inter-plane prediction encoding and decoding
US9167268B1 (en) 2012-08-09 2015-10-20 Google Inc. Second-order orthogonal spatial intra prediction
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9344742B2 (en) 2012-08-10 2016-05-17 Google Inc. Transform-domain intra prediction
US9247448B2 (en) 2012-08-27 2016-01-26 Qualcomm Incorporated Device and method for adaptive rate multimedia communications on a wireless network
US9456383B2 (en) 2012-08-27 2016-09-27 Qualcomm Incorporated Device and method for adaptive rate multimedia communications on a wireless network
US9369732B2 (en) 2012-10-08 2016-06-14 Google Inc. Lossless intra-prediction video coding
US9699463B2 (en) * 2012-12-26 2017-07-04 Intel Corporation Constant quality video encoding
US9628790B1 (en) 2013-01-03 2017-04-18 Google Inc. Adaptive composite intra prediction for image and video compression
US11553211B2 (en) * 2013-01-03 2023-01-10 Disney Enterprises, Inc. Heuristic detection of potential digital media artifacts and defects in digital media assets
US9172740B1 (en) 2013-01-15 2015-10-27 Google Inc. Adjustable buffer remote access
US9311692B1 (en) 2013-01-25 2016-04-12 Google Inc. Scalable buffer remote access
US9225979B1 (en) 2013-01-30 2015-12-29 Google Inc. Remote access encoding
DE102013205542A1 (de) * 2013-03-28 2014-10-02 Robert Bosch Gmbh Vorrichtung und Verfahren zur Verarbeitung von Daten
US9247251B1 (en) 2013-07-26 2016-01-26 Google Inc. Right-edge extension for quad-tree intra-prediction
CN103400584B (zh) * 2013-07-31 2015-10-28 成都华迈通信技术有限公司 音频压缩性能最大化和流量低消耗的智能处理方法及装置
US20150095450A1 (en) * 2013-09-30 2015-04-02 Qualcomm Incorporated Utilizing multiple switchable adaptation sets for streaming media data
US10356405B2 (en) 2013-11-04 2019-07-16 Integrated Device Technology, Inc. Methods and apparatuses for multi-pass adaptive quantization
US20150181208A1 (en) * 2013-12-20 2015-06-25 Qualcomm Incorporated Thermal and power management with video coding
US20150208069A1 (en) * 2014-01-23 2015-07-23 Magnum Semiconductor, Inc. Methods and apparatuses for content-adaptive quantization parameter modulation to improve video quality in lossy video coding
US9591316B2 (en) * 2014-03-27 2017-03-07 Intel IP Corporation Scalable video encoding rate adaptation based on perceived quality
DE102014104364A1 (de) 2014-03-28 2015-10-01 Intel IP Corporation Eine Vorrichtung und ein Verfahren zum Bereitstellen eines Versorgungssteuerungssignals für eine Versorgungseinheit
US10419760B2 (en) * 2014-09-29 2019-09-17 Sony Interactive Entertainment Inc. Picture quality oriented rate control for low-latency streaming applications
JP6274067B2 (ja) * 2014-10-03 2018-02-07 ソニー株式会社 情報処理装置および情報処理方法
KR101637741B1 (ko) * 2014-11-21 2016-07-08 인하대학교 산학협력단 계층적 비디오 코딩의 품질 확장성을 활용한 전력 관리 방법 및 시스템
US20160353107A1 (en) * 2015-05-26 2016-12-01 Apple Inc. Adaptive quantization parameter modulation for eye sensitive areas
US10827185B2 (en) * 2016-04-07 2020-11-03 Netflix, Inc. Techniques for robustly predicting perceptual video quality
EP3328083A1 (en) * 2016-11-23 2018-05-30 Thomson Licensing Method and apparatus for encoding a video applying adaptive quantisation
US10834406B2 (en) * 2016-12-12 2020-11-10 Netflix, Inc. Device-consistent techniques for predicting absolute perceptual video quality
EP3560207A1 (en) 2016-12-21 2019-10-30 British Telecommunications Public Limited Company Managing congestion response during content delivery
CN110115042B (zh) * 2016-12-29 2023-02-21 英国电讯有限公司 在网络中输送视频序列的方法、数据发送器
US10355998B2 (en) * 2017-02-27 2019-07-16 Cisco Technology, Inc. Adaptive video over multicast
CN108574841B (zh) * 2017-03-07 2020-10-30 北京金山云网络技术有限公司 一种基于自适应量化参数的编码方法及装置
US11997275B2 (en) * 2018-08-27 2024-05-28 AT Technologies ULC Benefit-based bitrate distribution for video encoding
US10778938B2 (en) * 2018-12-20 2020-09-15 Hulu, LLC Video chunk combination optimization
US11263103B2 (en) * 2020-07-31 2022-03-01 International Business Machines Corporation Efficient real-time data quality analysis
US11204851B1 (en) * 2020-07-31 2021-12-21 International Business Machines Corporation Real-time data quality analysis
CN112601074B (zh) * 2020-11-30 2022-10-11 北京金山云网络技术有限公司 评价编码器的方法、装置、计算机设备和存储介质
US11622116B2 (en) * 2021-03-31 2023-04-04 Hulu, LLC Cross-validation of video encoding
US12003564B1 (en) 2021-12-10 2024-06-04 Amazon Technologies, Inc. Predicted presented quality metrics
CN116800967A (zh) * 2022-03-15 2023-09-22 华为技术有限公司 一种图像编码方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001245303A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 動画像符号化装置および動画像符号化方法
WO2006064098A1 (fr) * 2004-12-15 2006-06-22 Tdf Procede de transmission a debit binaire variable a travers un canal de transmission
WO2006099082A2 (en) * 2005-03-10 2006-09-21 Qualcomm Incorporated Content adaptive multimedia processing
WO2007038701A1 (en) * 2005-09-27 2007-04-05 Qualcomm Incorporated Scalability techniques based on content information

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5506844A (en) 1994-05-20 1996-04-09 Compression Labs, Inc. Method for configuring a statistical multiplexer to dynamically allocate communication channel bandwidth
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
US6542546B1 (en) 2000-02-02 2003-04-01 Mitsubishi Electric Research Laboratories, Inc. Adaptable compressed bitstream transcoder
AU2003280512A1 (en) 2002-07-01 2004-01-19 E G Technology Inc. Efficient compression and transport of video over a network
US20040028139A1 (en) * 2002-08-06 2004-02-12 Andre Zaccarin Video encoding
CN100445988C (zh) * 2002-11-20 2008-12-24 皇家飞利浦电子股份有限公司 向用户呈现信息载体内容的用户界面系统
US7352809B2 (en) 2003-02-21 2008-04-01 Polycom, Inc. System and method for optimal transmission of a multitude of video pictures to one or more destinations
US6895410B2 (en) 2003-05-02 2005-05-17 Nokia Corporation Method and apparatus for providing a multimedia data stream
FR2857198B1 (fr) * 2003-07-03 2005-08-26 Canon Kk Optimisation de qualite de service dans la distribution de flux de donnees numeriques
US7974193B2 (en) 2005-04-08 2011-07-05 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
US8265141B2 (en) 2005-05-17 2012-09-11 Broadcom Corporation System and method for open loop spatial prediction in a video encoder
US7555715B2 (en) * 2005-10-25 2009-06-30 Sonic Solutions Methods and systems for use in maintaining media data quality upon conversion to a different data format
US20070201388A1 (en) 2006-01-31 2007-08-30 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
EP1982530A2 (en) * 2006-02-06 2008-10-22 Thomson Licensing Method and apparatus for reusing available motion information as a motion estimation predictor for videoencoding
EP2067356A1 (en) * 2006-09-28 2009-06-10 THOMSON Licensing Flexible redundancy coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001245303A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 動画像符号化装置および動画像符号化方法
WO2006064098A1 (fr) * 2004-12-15 2006-06-22 Tdf Procede de transmission a debit binaire variable a travers un canal de transmission
WO2006099082A2 (en) * 2005-03-10 2006-09-21 Qualcomm Incorporated Content adaptive multimedia processing
WO2007038701A1 (en) * 2005-09-27 2007-04-05 Qualcomm Incorporated Scalability techniques based on content information

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015177356A (ja) * 2014-03-14 2015-10-05 ソフトバンク株式会社 動画配信装置、動画符号化装置及びプログラム
JP2020205580A (ja) * 2019-05-24 2020-12-24 アクシス アーベー ビデオエンコーダの出力ビットレートを制御する方法及びビットレートコントローラ
JP7419152B2 (ja) 2019-05-24 2024-01-22 アクシス アーベー ビデオエンコーダの出力ビットレートを制御する方法及びビットレートコントローラ

Also Published As

Publication number Publication date
US20140177703A1 (en) 2014-06-26
CN101658035B (zh) 2012-05-30
US8582647B2 (en) 2013-11-12
JP5113244B2 (ja) 2013-01-09
KR101104654B1 (ko) 2012-01-13
US20080260042A1 (en) 2008-10-23
KR20100005224A (ko) 2010-01-14
EP2153657A1 (en) 2010-02-17
CN101658035A (zh) 2010-02-24
EP2153657B1 (en) 2019-06-19
WO2008133677A1 (en) 2008-11-06

Similar Documents

Publication Publication Date Title
JP5113244B2 (ja) 品質管理された符号化のための方法及びシステム
Chen et al. Recent advances in rate control for video coding
US10334289B2 (en) Efficient approach to dynamic frame size and frame rate adaptation
US8588296B2 (en) Bitrate control algorithm for video transcoding systems
US6925120B2 (en) Transcoder for scalable multi-layer constant quality video bitstreams
CN101164342B (zh) 使用ρ域位分配的视频电话中的关注区编码方法及装置
KR101643790B1 (ko) 적응적 비디오 스트리밍용의 가변 비트 레이트 및 동적 해상도를 이용한 다중 비트 레이트 비디오 인코딩
US9071841B2 (en) Video transcoding with dynamically modifiable spatial resolution
US8792555B2 (en) Methods and systems for resizing multimedia content
US7620107B2 (en) Video transcoding method and apparatus and motion vector interpolation method
CN108574841B (zh) 一种基于自适应量化参数的编码方法及装置
US20160373762A1 (en) Methods of and arrangements for processing an encoded bit stream
US20130251031A1 (en) Method for bit rate control within a scalable video coding system and system therefor
Zupancic et al. Two-pass rate control for improved quality of experience in UHDTV delivery
Uhl et al. Comparison study of H. 264/AVC, H. 265/HEVC and VP9-coded video streams for the service IPTV
JP6357542B2 (ja) マルチパス適応量子化のための方法及び装置
Sofke et al. Dynamic quality control for transform domain Wyner-Ziv video coding
Han et al. VBR rate control for perceptually consistent video quality
Makar et al. Compression of VQM features for low bit-rate video quality monitoring
Lu et al. Efficient and low-cost video transcoding
KR20080077537A (ko) 저지연 영상 통신 시스템 및 방법
Kang et al. SNR-based bit allocation in video quality smoothing
Yuan et al. A mixed scheme to improve subjective quality in low bitrate video
CN114745590A (zh) 视频帧编码方法、装置、电子设备及介质
Liu et al. Spatial complexity based optimal initial quantization parameter determination

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120229

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120307

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120329

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120405

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120501

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121011

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5113244

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250