JP2014517556A - ビデオ符号化及び復号化 - Google Patents

ビデオ符号化及び復号化 Download PDF

Info

Publication number
JP2014517556A
JP2014517556A JP2014503247A JP2014503247A JP2014517556A JP 2014517556 A JP2014517556 A JP 2014517556A JP 2014503247 A JP2014503247 A JP 2014503247A JP 2014503247 A JP2014503247 A JP 2014503247A JP 2014517556 A JP2014517556 A JP 2014517556A
Authority
JP
Japan
Prior art keywords
image
luminance
quantization
brightness
light curtain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2014503247A
Other languages
English (en)
Other versions
JP2014517556A5 (ja
Inventor
クリス ダムカト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2014517556A publication Critical patent/JP2014517556A/ja
Publication of JP2014517556A5 publication Critical patent/JP2014517556A5/ja
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

符号器は、少なくとも1つの画像を有するビデオ信号を受信するための受信機101を含む。推定器107は、1つ以上の画像の画像コンテンツに応じて、前記少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値を決定する。光幕輝度推定値は、レンダリングされるときに画像によって眼の中で生じるアイグレアの量を反映する。量子化アダプタ109は、光幕輝度推定値に応じて第1画像の少なくとも一部のための量子化方式を決定し、符号化ユニット103, 105は、第1画像の少なくとも一部のための量子化方式を用いてビデオ信号を符号化する。光幕輝度推定値は、人間の輝度順応を模倣するためにローパス・フィルタリングされることができる。対応する復号器が提供される。特に高ダイナミックレンジ(High Dynamic Range)画像のための改善された符号化が達成される。

Description

本発明は、ビデオの符号化及び/又は復号化に関し、特に、排他的にではなく、高ダイナミックレンジ(High Dynamic Range)画像の符号化及び復号化に関する。
さまざまなソース信号のデジタル符号化は、デジタル信号表現及び通信がアナログ表現及び通信をますます置き換えるにつれて、最近の十年にわたってますます重要になっている。許容できるレベルにデータ・レートを保ちつつ、符号化された画像及びビデオ・シーケンスから達成されることができる品質を改善する方法について、継続的な研究及び開発が進行中である。
知覚される画質のための重要な要因は、画像が表示されるときに再生されることができるダイナミックレンジである。しかしながら、従来は、再生される画像のダイナミックレンジは、正常視に関して大幅に低減される傾向あった。実際、現実の世界において遭遇する輝度レベルは、月が出ていない夜から直接太陽をのぞきこむことまで変化する、14桁もの大きさのダイナミックレンジに及ぶ。
しかしながら、伝統的に、ディスプレイ(特にテレビ・セット) のダイナミックレンジは、現実の生活環境と比べて制限されてきた。一般的に、ディスプレイのダイナミックレンジは、大体2〜3桁に限られてきた。例えば、大部分のスタジオ基準モニタは、80-120cd/m2のピーク輝度及び1:250のコントラスト比を有する。これらのディスプレイのために、輝度レベル、コントラスト比及び色域が規格化された(例えば、NTSC、PAL、より最近ではデジタルTVのためのRec.601及びRec.709)。伝統的に、従来のレンダリング装置上で知覚的に目立つアーチファクトを導入することなく8ビットでガンマ符号化されたフォーマットで画像を記憶して送信することが可能だった。
しかしながら、最近では、ディスプレイは、非常に高いピーク輝度(例えば4000cd/m2)及びより深い黒いレベルとともに導入されており、かなり広いダイナミックレンジ(5〜6桁)をもたらす。これらのディスプレイは、一般的にHigh Dynamic Range(HDR)ディスプレイと呼ばれ、従来のディスプレイはLow Dynamic Range (LDR)ディスプレイと呼ばれる。これらのHDRディスプレイは、我々が日々の生活において見るコントラスト及び輝度レベルに近づく。そして、将来のディスプレイは、より高いダイナミックレンジ、特により高いピーク輝度及びコントラスト比を提供することが可能であることが予想される。
ビデオ生産チェーンの反対側では、フィルム又は電子センサを用いるカメラが多くの場合用いられる。
アナログ・フィルムカメラは、過去に用いられており、依然として広く用いられている。アナログ・フィルムのダイナミックレンジ(許容範囲)は非常に良好で(5-6桁)、したがって、高いダイナミックレンジを有するコンテンツを生成する。最近までは、電子回路を用いるデジタル・ビデオ・カメラは、アナログ・フィルムと比べて大幅に減少したダイナミックレンジを有する傾向があった。しかしながら、6桁を超えるダイナミックレンジを記録することが可能なダイナミックレンジが増加した画像センサが開発され、これは将来においてさらに増加することが予想される。そのうえ、最も特別な効果、コンピュータ・グラフィックス拡張及び他の撮影後の作業は、より高いビット深さで、そしてより高いダイナミックレンジによって、すでに日常的に実行される。さらに、ビデオ・コンテンツは、ますます人工的に生成される。例えば、コンピュータ・グラフィックは、例えばビデオゲームにおける、そして次第に映画などとしてのビデオ・コンテンツを生成するために用いられる。したがって、ビデオ・コンテンツは、次第に高いダイナミックレンジによって取り込まれる。
伝統的に符号化された8ビット信号がそのような増加したダイナミックレンジ画像を表すために用いられるときに、目に見える量子化及びクリッピング・アーチファクトが多くの場合導入される。さらに、従来のビデオ・フォーマットは、新たなHDRイメージに含まれるリッチな情報を伝達するためには不十分なヘッドルーム及び精度を提供する。
その結果、最高水準の(及び将来の)センサ及び表示システムの機能から消費者が十分に利益を得ることを可能にする新たなアプローチの必要性が高まっている。一般的に、改善された符号化及び/又は復号化を提供し、特に、データ・レート比に対して改善された知覚品質を達成したいという願望が常に存在する。
したがって、画像、特に、増加したダイナミックレンジの画像を符号化及び/又は復号化するための改善されたアプローチが有益である。
したがって、本発明は、単独で又は任意の組み合わせにおいて1つ以上の上述の短所を好ましくは軽減し、緩和し又は除去することを試みる。
本発明の一態様によれば、ビデオ信号を符号化するための符号器が提供され、当該符号器は、少なくとも1つの画像を有するビデオ信号を受信するための受信機、前記少なくとも1つの画像のうちの少なくとも1つの画像輝度測度に応じて前記少なくとも1つの画像のうちの第1画像の少なくとも一部のための、アイグレア(eye glare)推定値である光幕輝度(veiling luminance)推定値を決定するための推定器、光幕輝度推定値に応じて第1画像の前記少なくとも一部のための量子化方式を決定するための量子化アダプタ、第1画像の前記少なくとも一部のための前記量子化方式を用いてビデオ信号を符号化するための符号化ユニットを有する。
本発明は、改善された符号化を提供することができ、特に、データ速度と知覚される品質との間の改善されたトレードオフを提供することができる。特に、それによって、知覚される量子化の影響により密接に合致した量子化を符号化が用いることができることができる。
本発明は、特に、ダイナミックレンジが増加した画像(例えばHDR画像)の改善された符号化を提供することができる。このアプローチは、視覚的影響に対する量子化の改善された適応を可能にし、特に、量子化の適応がより認識されやすい輝度区間に集中することを可能にすることができる。本発明者は、従来の符号化方式とは対照的に、符号化のための量子化方式を決定する際にアイグレア及び光幕輝度の知覚的な影響を考慮することによって、大幅に改善された性能が多くのシナリオにおいて達成されることができることを認識した。本発明者は、特に新たなHDRコンテンツに対して、アイグレア及び光幕輝度の影響が、知覚的に重要になる場合があり、量子化の適応において考慮されると、有意な改善につながる可能性があることを認識した。
アイグレアは、眼球中の光の散乱に起因して発生し、例えば、視野中の比較的暗い領域をマスクするベイリンググレア(veiling glare)を生じさせる輝線源を引き起こす。従来は、そのような影響は観察環境光源の影響によって支配されて(例えば明るい日光下での観察)、信号を符号化するときには考慮されなかった。しかし、本発明者は、特に新たなディスプレイに対して、ディスプレイ自体によって引き起こされるアイグレアに対する影響は、信号を量子化するときに都合よく考慮されることができることを認識した。したがって、このアプローチは、画像を符号化するときに、画像自体の表示によって引き起こされるアイグレアの影響を考慮することができる。
本発明者はさらに、そのようなアプローチは、複雑度及びリソース要求を容認できないほど増加させることなく成し遂げられることができることを認識した。実際、光幕輝度を推定するためのさらに複雑度が低いモデルに応じて量子化を適応させることが、大幅に改善された符号化効率を提供することができることが分かっている。
光幕輝度が決定される第1画像の一部は、ピクセル、ピクセルのグループ、画像領域又は第1画像全体であることができる。同様に、画像輝度測度は、ピクセルのグループ、画像領域又は1つ以上の画像全体に対して決定されることができる。画像輝度測度は、一般的に、第1画像自体から決定されることができる。
量子化方式は、特に輝度量子化方式であることができる。量子化方式は、特に、連続的な(輝度)範囲を離散的な値に変換する量子化関数に対応することができる。
いくつかの実施の形態では、ビデオ信号は、1つの画像のみを有することができ、すなわち、前記少なくとも1つの画像は、単一の画像である。いくつかの実施の形態では、ビデオ信号は、(単一の画像を有する)画像信号であることができる。
光幕輝度推定値及び/又は量子化方式の決定は、名目上の又は標準的なディスプレイに基づくことができる。例えば、(例えば、黒レベル、ピーク・レベル又は名目上の輝度レベルによって表される)名目上の輝度出力を有する名目上の(例えばHDR)ディスプレイは、例えば光幕輝度推定値を決定するための基準として考慮されて用いられることができる。いくつかの実施の形態において、光幕輝度推定値の決定は、例えば最大の輝度、サイズなどのような、レンダリングのために用いられる特定のディスプレイの特性に基づくことができる。いくつかの実施の形態において、推定器は、名目上のディスプレイに基づいて光幕輝度推定値を決定し、そして画像のレンダリングのためのディスプレイの特性に応じて光幕輝度推定値を適応させるように用意されることができる。
本発明のオプションの特徴によれば、量子化方式は、光幕輝度推定値のための均一知覚輝度量子化方式に対応する。
これは、特に効率的な符号化を提供することができ、特に、画像を観察するときの観察者の知覚に量子化が密接に適合することを可能にすることができる。
均一知覚輝度量子化は、各々の量子化ステップが、(特定の実施の形態における人間の視覚システムのために使用される特定のモデルで測定される)同じ知覚される明度の増加をもたらす量子化を表す知覚輝度ドメインにおける量子化であることができる。したがって、均一知覚輝度量子化は、知覚される輝度における知覚的に均一なステップを表す。均一知覚輝度量子化は、したがって、知覚輝度ドメインにおける輝度値の等距離のサンプリングに対応することができる。
均一知覚輝度量子化方式は、所与の人間の知覚モデルに対する等しい知覚有意性を有する量子化ステップを有することができる。特に、均一知覚輝度量子化方式の各々の量子化間隔は、同数(おそらく分数)の丁度可知差異(Just Noticeable Difference:JND)に対応することができる。したがって、均一知覚輝度量子化方式は、各々の量子化間隔が(おそらく1より小さい値をもつ)所与のスケーリングファクタで乗算されたJNDのサイズを有する複数の量子化間隔として生成されることができ、スケーリングファクタは全ての量子化間隔に対して同じである。
本発明のオプションの特徴によれば、量子化アダプタは、知覚輝度ドメインにおける均一量子化方式を決定し、光幕輝度推定値に応じて知覚輝度値を表示値に関連付けるマッピング関数を決定し、知覚輝度ドメイン及びマッピング関数における均一量子化方式に応じた表示値のための不均一量子化方式を決定するように用意される。
これは、量子化の特に効率的な適応を提供することができる。効率的な実施態様を可能にしつつ、データ速度と知覚される品質との間の有利なトレードオフが達成されることができる。このアプローチによって、リソース要求が比較的低く保たれることができることができる。
特に、このアプローチは、各々の量子化ステップが実質的に等しい知覚有意性を有するような、表示値の量子化方式を決定するための低複雑度のアプローチを可能にすることができる。
知覚的な輝度ドメインにおける均一な量子化方式を決定するステップは、暗黙の演算であることができ、単にマッピング関数の固有値を考慮することによって実行されることができる。同様に、マッピング関数を決定するステップは、暗黙である場合があり、例えば、入力値又は出力値が光幕輝度推定値に応じて補正される予め定められたマッピング関数を用いることにより達成されることができる。均一量子化及びマッピング関数を決定するステップは、適切なモデルを適用することによって実行されることができる。
表示値のための量子化方式は、特に不均一量子化方式であることができる。
表示値は、ディスプレイから出力される輝度を表す任意の値であることができる。よって、それらは、カメラから受信される値、ディスプレイに提供される値又は任意の中間的な表現に関することができる。表示値は、表示される画像を表す任意の値を表すことができ、特に、画像キャプチャから画像レンダリングまでの経路のどこかの値を表すことができる。
表示値は、線形輝度値であるか、又は、非線形輝度値であることができる。例えば、表示値は、ガンマ補正された(又は変換された)値であることができる。ガンマ補正(又は他の変換)は、特定のマッピング関数に含まれることができ、並びに/又は、前処理及び/若しくは後処理として含まれることができる。
知覚輝度ドメインは、所与の人間の知覚モデルによる知覚される明度差を反映する。知覚輝度ドメインにおける均一量子化方式は、人間の知覚モデルによる等しい知覚有意性を有する量子化ステップを含む均一知覚輝度量子化方式であることができる。特に、均一知覚輝度量子化方式の各々の量子化間隔は、同数(おそらく分数)のJNDに対応することができる。したがって、均一量子化方式は、各々の量子化間隔が所与のスケーリングファクタによって乗算されたJNDのサイズを有する複数の量子化間隔として生成されることができ、ここで、スケーリングファクタは、全ての量子化間隔に対して同じである。
表示値は、一般的にピクセル値に対応する。ピクセル値は、例えば、YUV若しくはYCrCb値のような、(線形)輝度ドメインであることができるか、又は、例えば、Y'UV若しくはY'CrCb値のような、表示駆動輝度ドメイン(例えばガンマ補正されたドメイン)であることができる('はガンマ補正を示す)。
表示値のための不均一量子化方式は、特に表示輝度値のための不均一量子化方式であることができる。例えば、不均一量子化方式は、YUV又はYCrCb色方式のY成分のサンプルのような、色表現方式の輝度成分に適用されることができる。他の例として、輝度ドメインにおける不均一量子化方式は、表示駆動輝度カラー方式(例えばガンマ補正された方式)における量子化方式として用いられることができる。例えば、決定された量子化方式は、Y'UV又はY'CbCrカラー方式のY'成分に適用されることができる。したがって、表示値のための不均一量子化方式は、表示駆動輝度値のための量子化方式であることができる。
表示値は、特に表示輝度値であることができる。例えば、表示輝度値は、YUV又はYCbCrカラー方式のY成分のサンプルのような、カラー表現方式の輝度成分のサンプルであることができる。
表示値は、特に表示駆動輝度値であることができる。例えば、表示輝度値は、Y'UV又はY'CbCrカラー方式のY'コンポーネントからのサンプルのように、カラー表現方式の表示駆動輝度成分から、導き出されることができる。
例えば、RGB、YUV又はYCbCr信号は、Y'UV又はY'CbCr信号に変換されることができ、その逆も同様である。
マッピング関数は、一般的に知覚される輝度値と表示(輝度)値との間の1対1写像を提供することができ、しかるべく、例えば、表示輝度値から知覚される輝度値を計算する関数として、又は同等に、知覚される輝度値から表示輝度値を計算する関数として(すなわちそれは同等に逆関数でありえる)、提供されることができる。
このアプローチは、したがって、特に、知覚される輝度値と表示値との間のおそらくは低複雑度のマッピング関数によって表されるアイグレアの知覚的影響のためのモデルを用いることができ、マッピング関数は光幕輝度推定値に依存的である。
マッピング関数は、仮定された名目上の又は標準的なディスプレイを表すことができ、例えば、マッピング関数は、知覚輝度ドメインと標準的な又は名目上のディスプレイに示されるときの表示値との間の関係を表すことができる。名目上のディスプレイは、サンプル値とディスプレイから生じる輝度出力との間の対応関係を提供すると考えられることができる。例えば、マッピング関数は、知覚される輝度値と例えば0.05から2000cd/m2のダイナミックレンジで標準的なHDRディスプレイによってレンダリングされるときの表示値との間の関係を表すことができる。いくつかの実施の形態において、マッピング関数は、レンダリングのためのディスプレイの特性に応じて変更又は決定されることができる。例えば、名目上のディスプレイに対する特定のディスプレイの偏差が、マッピング関数によって表されることができる。
本発明のオプションの特徴によれば、表示値のための不均一量子化方式の量子化間隔は、知覚輝度ドメインにおける均一な量子化方式より少ない量子化レベルを含む。
これは、所与の知覚品質に対して減少したデータ速度を可能にすることができる。特に、それは、表示を表すために使用されるビットの数が、望ましい知覚を提供するために必要とされるビットの数のみに低減されることを可能にする。例えば、知覚的に区別できる値をもたらすビットの数のみが用いられる必要がある。
特に、いくつかの光幕輝度推定値のために、不均一知覚輝度量子化方式のいくつかの量子化間隔は、ディスプレイによって表される(又は特定のフォーマットによって表される)ことができる範囲の外にある表示輝度に対応する場合がある。
本発明のオプションの特徴によれば、表示値のための不均一量子化方式の量子化間隔遷移は、マッピング関数による知覚輝度ドメインにおける均一量子化方式の量子化間隔遷移に対応する。
これは、特に、有利な動作、実施態様及び/又は性能を提供する。
本発明のオプションの特徴によれば、推定器は、第1の画像の少なくともある画像領域のための平均輝度に応じた光幕輝度推定値を生成するように用意される。
これは、特に、有利な動作、実施態様及び/又は性能を提供する。特に、光幕輝度推定値のための非常に低い複雑度モデルに対してさえ、改善された性能が達成されることができることが分かっている。
画像領域は、第1画像の一部であるか、又は、第1画像の全体であることができる。画像領域は、光幕輝度推定値が決定された第1画像の部分と同一でありえる。
本発明のオプションの特徴によれば、推定器は、実質的に平均輝度のスケーリングとして光幕輝度推定値を決定するように用意される。
これは、特に、有利な動作、実施態様及び/又は性能を提供する。特に、光幕輝度推定値のための非常に低い複雑度モデルに対してさえ、改善された性能が達成されることができることが分かっている。
光幕輝度推定値は、多くの実施の形態において、有利には、平均輝度の5%から25%の間として決定されることができる。
本発明のオプションの特徴によれば、推定器は、連続する画像の一部の輝度の重み付き平均として光幕輝度推定値を決定するように用意される。これは、特に、有利な動作、実施態様及び/又は性能を提供する。特に、これは、複雑度を低く維持しつつ、量子化が眼の輝度順応を考慮することを可能にすることができる。
輝度順応は、人の視覚が、大体14桁の輝度範囲をカバーすることが可能である一方、その時々では大体3-5桁のダイナミックレンジのみが可能であるという作用である。しかしながら、眼は、この限られた瞬間的なダイナミックレンジを入力される現在の光に順応させることをできる。本発明者は、そのような眼の輝度順応の効果が、光幕輝度推定値の適切なローパス・フィルタリングによって推定されることができることを認識した。したがって、このアプローチは、輝度順応及びアイグレア効果の両方の複合モデリングを可能にする。
連続する画像の(少なくとも)一部の重み付き平均としての光幕輝度推定値の決定は、画像のシーケンス中で、所与の画像領域(おそらく画像全体を含む)のための光幕輝度推定値を時間的にローパス・フィルタリングすることができる。
本発明のオプションの特徴によれば、重み付き平均は、2Hz以下の3dBカットオフ周波数を有するフィルタに対応する。
これは、特に有利な性能を提供することができる。特に、非常に遅い適応は、人間の眼の輝度順応の挙動のより正確なエミュレーションを提供することができる。実際、多くの実施の形態において、重み付き平均を生成するローパス・フィルタのための3dBカットオフ周波数は、特に有利には、1Hz、0.5Hz又は0.1Hz以下である。
本発明のオプションの特徴によれば、重みつき平均は非対称であり、光幕輝度推定値の増加に対して、光幕輝度推定値の減少に対してより高速な適応を有する。
これは、特に有利な性能を提供することができる。特に、非対称の適応は、人間の眼の輝度順応の挙動のより正確な模倣を提供することができる。
実際、多くの実施の形態において、重み付き平均のための3dBカットオフ周波数は、光幕輝度推定値の減少に対して、特に有利には、2Hz、1Hz、0.5Hz又は0.1Hz以下であることができ、一方、光幕輝度推定値の増加に対する重み付き平均の3dBカットオフの周波数は、特に有利には、3Hz、10Hz又は20Hz以上あることができる。いくつかの実施の形態において、フィルタリングされた光幕輝度推定値は、増加に対しては瞬間的な光幕輝度推定値に直接追随することができ、そして減少に対してはローパス・フィルタリングされることができる。多くの実施の形態において、光幕輝度推定値の増加に対するローパス・フィルタの3dBカットオフ周波数は、光幕輝度推定値の減少に対するローパス・フィルタの3dBカットオフ周波数の10倍以上であることもできる。
本発明のオプションの特徴によれば、符号器ユニットは、符号化された出力信号中に光幕輝度推定値の指標を含めるように用意される。
これは、特に、有利な動作、実施態様及び/又は性能を提供する。
本発明のオプションの特徴によれば、量子化方式は第1画像領域に対して決定され、光幕輝度推定値は第2画像領域に対して決定される。
これは、多くのシナリオにおいて改善された性能を提供することができ、そして特に、詳細を区別する観察者の能力に対する量子化の改善された適応を可能にすることができる。
第1及び第2画像領域は、異なることができる。
本発明のオプションの特徴によれば、第1画像領域は、平均より高い輝度を持つ画像領域であり、第2画像領域は、平均より低い輝度を持つ画像領域である。
これは、多くのシナリオにおいて改善された性能を提供することができ、そして特に、詳細を区別する観察者の能力に対する量子化の改善された適応を可能にすることができる。第1画像領域は、画像の平均輝度より高い輝度を持つことができ、特に、画像の平均輝度より50%以上高い平均輝度を持つことができる。第2画像領域は、画像の平均輝度より低い輝度を持つことができ、特に、画像の平均輝度の25%以下の平均輝度を持つことができる。
本発明の一態様によれば、少なくとも1つの画像を有する符号化されたビデオ信号を復号するための復号器が提供され、当該復号器は、符号化されたビデオ信号を受信するための受信機であって、前記符号化されたビデオ信号は、少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値の指標を含み、前記光幕輝度推定値は、アイグレア推定値である受信機、光幕輝度推定値に応じて第1画像の少なくとも一部のための逆量子化方式を決定するための逆量子化アダプタ、及び、第1画像の少なくとも一部のための逆量子化方式を用いて符号化されたビデオ信号を復号するための復号化ユニットを有する。
本発明の一態様によれば、ビデオ信号を符号化する方法が提供され、当該方法は、少なくとも1つの画像を有するビデオ信号を受信し、前記少なくとも1つの画像のうちの少なくとも1つのための画像輝度測度に応じて前記少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値を決定し、光幕輝度推定値はアイグレア推定値であり、光幕輝度推定値に応じて第1画像の少なくとも一部のための量子化方式を決定し、第1画像の少なくとも一部のための量子化方式を用いてビデオ信号を符号化する。
本発明の一態様によれば、少なくとも1つの画像を有する符号化されたビデオ信号を復号する方法が提供され、当該方法は、符号化されたビデオ信号を受信し、符号化されたビデオ信号は、少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値の指標を含み、光幕輝度推定値は、アイグレア推定値であり、光幕輝度推定値に応じて第1画像の少なくとも一部のための逆量子化方式を決定し、第1画像の少なくとも一部のための逆量子化方式を用いて符号化されたビデオ信号を復号する。
本発明のこれらの及び他の態様、特徴及び利点は、以下に記載される実施の形態から明らかであり、それらを参照して説明される。
本発明の実施の形態は、単なる一例として、図面を参照して説明される。
本発明のいくつかの実施の形態によるビデオ信号符号器の要素の例の図。 アイグレアの効果を説明する図。 知覚輝度及び表示輝度に関する関数の例を説明する図。 人間の目の光順応の例の図。 本発明のいくつかの実施の形態によるビデオ信号復号器の要素の例の図。 本発明のいくつかの実施の形態によるビデオ信号符号器の要素の例の図。
以下の記述は、高ダイナミックレンジ(High Dynamic Range:HDR)画像のシーケンスのための符号化及び復号化システムに適用可能な本発明の実施の形態に焦点を合わせる。しかしながら、いうまでもなく、本発明は、このアプリケーションに限定されず、個々の単一の画像(例えばデジタル写真)と同様に多くの他のタイプの画像に適用されることができる。
以下の例は、物理的ビデオ信号及びカラー表示法が、表示駆動補正を含まない、特にガンマ補正を含まない輝度表現を用いるシナリオに焦点を合わせる。例えば、ピクセルは、例えばコンピュータで生成され、配信され、そしてレンダリングされるビデオ・コンテンツにおいて広く用いられるRGB、YUV又はYCbCrカラー表現方式を用いることができる。しかしながら、いうまでもなく、説明される原理は、表示駆動補正方式へと、特に、ビデオシステムにおいて広く用いられるR'G'B'、Y'UV又はY'CbCrのようなガンマ補正方式へと適用されるか又は変換されることができる。
図1は、本発明のいくつかの実施の形態によるビデオ信号符号器の要素の例を説明する。符号器は、符号化されるべきビデオ信号を受信する受信機101を含む。ビデオ信号は、例えば、カメラ、コンピュータ・グラフィックス・ソースから、あるいは、他の任意の適切な外部又は内部ソースからも受信されることができる。例において、ビデオ信号は、画像のシーケンスのための非圧縮のピクセル・サンプル・データを含むデジタルビデオ信号である。ビデオ信号は、特に、適切な色表現に従って提供されるサンプル・データを有する色信号である。特定の実施例において、色表現は、1つの輝度成分及び2つの彩度成分を用いる。例えば、サンプルは、YUV又はYCrCb色表現フォーマットに従って提供されることができる。実施例において、輝度表現は、線形輝度表現である(すなわち、輝度の値が倍になると、対応するディスプレイから出力される光も倍になる)。
他の実施例において、サンプルは、表示駆動補正カラー方式(例えばR'G'B'、Y'UV又はY'CbCr)に従って提供されることができる。例えば、サンプルは、規格Rec.709によるビデオカメラから提供されることができる。そのような例において、(例えばY'UVとRGBとの間のような)色空間変換が、輝度表現に変換するために例えば適用されることができる。
一例として、従来のビデオカメラに対して、記録されたビデオ信号は、取り込まれた光の線形表現が適切なガンマ補正を用いた非線形表現に変換されるガンマ補正された表現であることができる。そのような実施例において、入力信号は、ガンマ補正された表現で提供されることができる。同様に、従来のビデオ・ディスプレイに対して、駆動信号は一般的に、(例えば、従来のカメラから提供される信号に対応する)非線形ガンマ補正された表現に従って提供されることができる。いくつかの実施の形態において、符号化されたデータ出力も、それに応じて、ガンマ補正されたフォーマットに従って提供されることができる。或はまた、いくつかの実施の形態において、例えば、入力画像がコンピュータ・グラフィックス・ソースによって提供される場合、入力信号は、線形表現フォーマットで提供されることができる。いくつかの実施の形態において、例えば、符号化されたデータが更なる処理のためにコンピュータへと提供される場合、符号化されたデータも同様に、線形表現で提供されることができる。いうまでもなく、以下に説明される原理は、例えば、入力信号がガンマ補正され、出力がガンマ補正されていない(又はその逆の)実施の形態を含む、任意の適切な線形又は非線形表現に従って、信号に同様に適用されることができる。
ビデオ信号は、適切な量子化方式に従って画像サンプルの量子化を実行する知覚量子化器103に転送される。そして、量子化された画像サンプルは、画像サンプルの適切な符号化を実行しだす符号器ユニット105に供給される。
いうまでもなく、符号化及び量子化機能が図1の実施例において時系列的な動作として説明されるが、この機能は、任意の順序で実施されることができ、一般的に一体化されることができる。例えば、量子化は、符号化された信号の一部に適用されることができる。例えば、符号化は、それに対して適用されるDCTに基づいて符号化されるマクロブロックへのセグメント化を含むことができる。知覚量子化は、いくつかの実施の形態では、対応する周波数ドメインにおいて適用されることができる。
しかしながら、以下で説明される特定の実施の形態において、知覚量子化は、符号化ユニット105による符号化の前にビデオ信号の画像の輝度サンプルに適用される。
図1のシステムにおいて、量子化は、静的な量子化ではなく、表示される画像によって眼において生じる光幕輝度又はアイグレアの推定値に基づいて、動的に適応される。
特に、図1の符号器は、受信機101から入力画像を受信してビデオ・シーケンスの画像の少なくとも一部のための光幕輝度推定値を決定する推定器107を含む。光幕輝度推定値は、ビデオ信号の画像の1つ以上の少なくとも一部のための画像輝度測度に基づいて決定される。一般的に、光幕輝度推定値は、画像自体から決定される輝度測度に基づいて決定される。光幕輝度推定値は、同様に(又は代わりに)前の画像の輝度測度に基づいて、決定されることができる。
一例として、画像の全体又は一部の輝度が計算されることができ、光幕輝度推定値は、適切な係数とその輝度との乗算によって決定されることができる。
図1の符号器は、推定器107に接続されてそこから光幕輝度推定値を受信する量子化アダプタ109を更に備える。そして、量子化アダプタ109は、光幕輝度推定値が決定された画像の一部によって用いられるべき量子化方式を決定し始める。量子化方式は、光幕輝度推定値に基づいて決定される。
量子化方式は、連続的な(輝度)範囲を離散的な値に変換する量子化関数に、特に対応することができる。
したがって、所与の画像領域のために用いられる量子化方式は、その画像領域のために生成される光幕輝度推定値に依存する。多くの実施の形態において、1つの光幕輝度推定値が画像全体に対して生成されることができ、この光幕輝度推定値が、全ての画像領域のための量子化方式を決定するために用いられることができる。実際、量子化方式は、画像全体に対して同じであることができる。しかしながら、他の実施の形態では、各々の光幕輝度推定値は、より小さい画像領域にのみ適用されることができ、例えば、複数の光幕輝度推定値が各々の画像のために決定されることができる。結果的に、異なる量子化方式は、画像の異なる領域に対して用いられることができ、それによって、システムが量子化方式を局所的な条件に適応させることを可能にし、そして例えば、画像の低い及び高いコントラスト領域のために異なる量子化方式が用いられることを可能にする。
どれくらいのアイグレアが観察者の眼において生じるかという推定値に基づく量子化の適応が、有意に改善されたデータ速度対知覚品質比を提供することができる。システムは、画像の表示の態様及び結果として生成される画像を考慮するのみではなく、知覚的な予測を考慮して、システムの動作を適応させるために、これを用いる。
このアプローチは、したがって、視覚的に余分なビデオ・データを量子化するために、アイグレア・レベルの推定値を用いることができる。これは特に、結果として比較的暗い領域における増加した量子化につながる場合があり、それによって、減少したデータ速度を可能にする。
光幕輝度推定値を決定するために使用される知覚モデルは複雑である必要はなく、有意な性能改善は、非常に低い複雑度のモデルに対してさえ達成されることできることがさらに見出された。実際、多くの実施の形態において、全体としての画像のための大域的な光幕輝度推定値が用いられることができる。したがって、量子化方式は、画像ごとに(フレームごとに)、画像のために包括的に選択されることができる。
使用される量子化方式を示すために必要な更なるデータのための符号化オーバーヘッドは非常に限られ、改善された量子化に起因するデータの低減によって容易に上回られる。例えば、1つの値である光幕輝度推定値が、各々の画像のために復号器に通信されることができる。
特に、HDR画像のような増加したダイナミックレンジ画像に対して、アイグレアはますます重大になる場合があり、説明されたアプローチは、観察者に対して表示されるときにHDR画像自体によって導入されるアイグレアに適応することができる。実際、眼の中で光の散乱に起因して発生するアイグレア又は光幕輝度の影響は、高いコントラストの刺激にとってよりいっそう重要である。画像自体中の光源を含む明るい光源は、結果として視界中の比較的暗い領域を遮蔽する光幕グレア又は光幕輝度となる可能性がある。この影響は、明るい光源(例えば太陽又は空)の存在下でシーンのより暗い領域中の詳細を見るための観察者の能力を制限する。
図2は、アイグレア/光幕輝度の知覚的な概念を説明する眼のモデルの例を説明する。図は、現実のシーン201から放射される光の、知覚される画像203への変換を説明する。最初に、光は、網膜207上の画像(網膜像209)形成するように、レンズ205及び眼本体を通過する。眼を通過する間、光は散乱される。これは、網膜像209の形成に影響を及ぼし、すなわちそれは、光幕グレア/輝度を追加する。そして網膜像は、光受容体によって神経反応に変換され、そしてそれは最終的に知覚につながる。これらの光受容体は限られたダイナミックレンジを有し、時間的に輝度が変化する場合、それらは順応に時間を必要とする。このマッピング・プロセスにおいて、有意な量の画像の詳細がマスクされる場合がある。マスクされる詳細の量は、現実のシーンのダイナミックレンジ及び現在の刺激輝度に対する現在の適応状態に依存する。
アイグレア又は光幕輝度の影響は、人間の視覚系による輝度差の知覚の考察によって説明されることができる。実際、人間の視覚系の研究は、輝度の時間的又は空間的変化の視認性は、主として、絶対輝度差よりはむしろ、輝度比(コントラスト)に依存することを証明した。結果的に、輝度知覚は非線形であり、実際には輝度の対数関数に近い。この非線形知覚は複雑なモデルを用いてモデル化されることができるが、アイグレアによって引き起こされるマスキング効果は、知覚されるコントラストの測度の考察によって説明されることができる。例えば、ウェーバー・コントラストが、知覚の計測として用いられることができる。ウェーバー・コントラストは、
Figure 2014517556
によって与えられる。ここで、Yは、背景から突出しているオブジェクトの輝度又は強度を示し、Ybは、局所的な背景輝度である。
グレアの影響は詳細に調査され、モデルが、Vos, J.J., van de Berg, T.J.T.P., "Report on disability glare", CIE Collection on Colour and Vision 135(1), 1999, p. 1 -9に記述される。このモデルから、点像分布関数が、局所的に光幕グレアを計算するために生成されることができる。この光幕グレアは、局所的な背景輝度に追加される光幕輝度によってモデル化される。これは、局所的な知覚されるコントラストを変更する。事実上、暗い領域における詳細のコントラストは、著しく低減される。このように、散乱が網膜像の形成に影響を及ぼす。
散乱が引き起こす光幕輝度によるコントラストは、
Figure 2014517556
として計算されることができる。ここで、Yveilは、眼の中の散乱によって引き起こされる光幕輝度、すなわちグレアである。この式は、常にコントラスト低下が存在することを示す(すなわち、Cglare<C)。
グレアに起因するコントラスト低下の量は、
Figure 2014517556
によって計算されることができる。
かくして、この式で示すように、光幕輝度の存在は、知覚されるコントラストを低下させて、更には、相対的な知覚される輝度変化に非線形な態様で影響を及ぼす。図1のシステムにおいて、画像データをどのように量子化するかを決定するときに、これらの知覚要因が考慮される。
いうまでもなく、光幕輝度を推定するための多くの異なるアプローチ又は手段が用いられることができる。一般に、人間の眼のための光幕輝度モデルは、画像自体及び/又は1つ以上の以前の画像の画像コンテンツに基づいて光幕輝度推定値を生成するために用いられることができる。
いくつかの実施の形態において、光幕輝度推定値は、画像領域のための平均輝度に応じて生成されることができる。平均輝度が決定される画像領域は、光幕輝度推定値が決定される画像領域に対応することができる。例えば、画像領域は画像全体に対応することができ、ひいては、画像のための1つの光幕輝度推定値が、画像の平均輝度(及び/又は1つ以上の以前の画像の平均輝度)に基づいて決定されることができる。
光幕輝度推定値は、図1のシステムにおいて、画像のための画像サンプルに基づいて決定される。しかしながら、これらの値は、ディスプレイからの絶対的な物理輝度ではなく、相対的な輝度を示す。実際、所与のピクセル・サンプルに対応する実際の輝度は、信号をレンダリングする特定のディスプレイに、そして実際には(例えば現在の輝度設定のような)ディスプレイの設定に、依存する。このように、実際のレンダリングされる輝度は、一般に、符号器によって及び符号化段階では知られず、したがって、符号化は、一般的に、名目上の又は標準的なディスプレイの特性に基づくことができる。特には、画像サンプルは、標準的な設定を有する所与の標準的なディスプレイを仮定した表示出力輝度に関連することができる。例えば、画像サンプルと輝度出力との間の相関は、0.05〜2000cd/m2の出力ダイナミック輝度レンジを有する名目上のHDRディスプレイ上の画像のレンダリングから生じる相関であると仮定されることができる。
他の実施の形態において、画像のレンダリングのために用いられるべき特定のディスプレイの特性が用いられることができる。例えば、0.05〜4000cd/m2の出力ダイナミック輝度レンジを有するHDRディスプレイが用いられることが分っている場合、システムは、しかるべく適応されることができる。
(例えば、複数の光幕輝度推定値がある画像のために決定されるときのような)光幕輝度推定値が相対的に小さい領域に対して決定されるシナリオにおいて、平均輝度は、より大きい領域に基づくことができる。例えば、光幕輝度推定値は、おそらく、個々のマクロブロックごとに、例えばそのマクロブロックを中央とした5×5のマクロブロックの画像領域の平均輝度に基づいて、決定されることができる。
いくつかの実施の形態において、有利な性能は、第1画像の領域の10%以下の平均輝度に応じて光幕輝度推定値を決定することによって達成されることができる。いくつかの実施の形態において、より有利な性能が、さらにより小さい領域に対して達成されることができ、特に、いくつかの実施の形態において、平均輝度は、個々のマクロブロックに対して決定されることができる。領域は、1つの連続した領域である必要はない。平均輝度は、適切なパターンに従う画像全体又は一部のサブサンプリングに基づいて例えば決定されることができる。
いくつかの実施の形態において、光幕輝度推定値は、平均輝度のスケーリングとして決定されることができる。実際、多くのシナリオでは、光幕輝度は、単に、示された画像の平均輝度の割合として推定されることができる。多くの典型的なアプリケーションにおいて、光幕輝度が平均輝度の5%から25%の間に対応すると推定されることができる。
実際、アイグレアの影響は空間的に低頻度である傾向があり、したがって、空間変動は多くの実施の形態において無視されることができることが分かっている。そのような実施の形態において、知覚量子化における光幕輝度の影響は、全体的な一定の効果として近似されることができる。全体的な光幕輝度のための信頼性が高く効率的な近似は、レンダリングされる画像の平均輝度と光幕輝度とが比例すると考えることによって達成されることがさらに分かった。
したがって、特に、光幕輝度推定値は、
Figure 2014517556
として与えられる。ここでαは眼の中で拡散する光の量と関連する調整パラメータである。10%のオーダーの値が、多くのアプリケーションに対して特に適切である。したがって、散乱光の量は、人によって変化し、年齢とともに増加する傾向があるが、多くの場合、10%のオーダーである。
多くの実施の形態において、量子化アダプタ109は、知覚輝度ドメインにおいて望ましい特性を有する画像サンプルの輝度のための輝度量子化方式を決定するように用意される。特に、量子化アダプタ109は、均一知覚輝度量子化方式に対応するように輝度量子化方式を決定することができる。したがって、輝度量子化方式は、等しい知覚輝度変化に対応する量子化ステップを有するように設計されることができる。
均一知覚輝度量子化方式は、各々の量子化ステップが所与の量の丁度可知差異(Just Noticeable Difference:JND)に対応する例に特に対応することができる。JNDは、ちょうど知覚されることができる輝度変化の量である。したがって、知覚輝度量子化が1つのJNDのステップを用いるシナリオにおいて、各々の量子化ステップは、観察者によってちょうど気が付かれる。さらに、(前述のような)人の視覚の特性のために、知覚ドメインにおける均一な量子化ステップは、実際の輝度(及び光幕輝度)に依存する現実の世界の異なる輝度ステップに対応し、すなわち、表示パネルの輝度に対する異なる輝度ステップに対応する。言い換えると、暗いピクセル/画像領域のための知覚輝度JND量子化ステップは、(例えばcd/m2で測定される)所与の表示輝度間隔に対応することができる。しかしながら、明るいピクセル/画像領域に対しては、知覚輝度JND量子化ステップは、(例えばcd/m2で測定される)大幅に高い表示輝度間隔に対応することができる。
したがって、知覚的に均一な輝度量子化を達成するために、表示輝度量子化(及び結果的に画像データ輝度量子化)は、均一ではない必要がある。さらに、知覚輝度ドメインにおける均一な量子化ステップと表示輝度ドメインにおける不均一な量子化ステップとの間の対応関係は、アイグレアに依存し、これは、図1のシステムおいて、光幕輝度推定値に依存して決定された量子化方式によって考慮される。
なお、誤解を避けるため、知覚輝度は、特定の実施例において使用される人の視覚のモデルによって決定される人の視覚系によるモデルの知覚された明度変動を指す。これは、時々この分野において利用される表示補正動作のための用語「輝度」の使用と区別される。例えば、従来の陰極光線管における非線形性を補正するガンマべき乗則(又は他の同様の非線形表示駆動動作)は、時には、「輝度」という用語を参照される。しかしながら、本説明におけるこの用語の使用は、知覚輝度(すなわち知覚される明度変化)を示すことを意図する。したがって、用語「知覚輝度」は、表示特性補正ではなく心理視覚差異に指す。「表示駆動輝度」という用語は、表示駆動補正(例えば物理的にガンマ補正された信号)を含む値を指すために用いられる。したがって、表示駆動輝度との用語は、表示駆動輝度値の倍増が対応するディスプレイの輝度出力の倍増に直接対応しないように非線形関数が適用された、非線形輝度ドメインを指す。多くの現在のシナリオにおいて、信号は、(同時的に)人の視覚の非線形性質に近い非線形表示駆動輝度フォーマットで提供される。
図1のシステムにおいて、量子化アダプタ109は、知覚輝度ドメインにおける均一量子化方式を最初に決定するように特に用意される。そのような均一知覚輝度量子化方式は、例えば、JNDに関して線形である知覚輝度範囲を生成することによって、決定されることができる。そして、知覚輝度量子化ステップは、各々の輝度値のために利用可能な最大のビット数に対応する複数の等しい間隔にその範囲を分割することによって生成されることができる。例えば、10ビットが利用可能である場合、線形知覚輝度範囲は、1024個の等しい間隔に分割され、各々が輝度/明るさの同じ知覚差に対応する1024個の量子化ステップをもたらす。
そして量子化アダプタ109は、これらの均一な量子化ステップを、表示輝度ドメインの不均一量子化ステップに、すなわちビデオ信号の輝度サンプル値の非線形量子化に変換することへ進む。
この変換は、知覚輝度値を表示値に関連付ける、特定の例では表示輝度値に直接関連付ける、マッピング関数に基づく。したがって、マッピング関数は、所与の知覚輝度値に対応する(一般的に表示輝度に対する所与の相関を仮定する対応する輝度サンプル値によって表される)表示輝度値を直接定める。そのようなマッピング関数は、実験に基づいて決定されることができ、さまざまな研究が、知覚される輝度ステップと対応する表示輝度ステップとの間の関係を特定するために取り組まれた。任意の適切なマッピング関数が用いられることができることはいうまでもない。
しかしながら、単に知覚ドメイン及び表示ドメインに関する一定のマッピング関数を用いるだけではなく、図1の量子化アダプタ109は、光幕輝度推定値を考慮するようにマッピング関数を適応させるように用意される。したがって、マッピング関数は光幕輝度推定値にさらに依存し、そしてこれを反映するために動的に適応される。
再び、いうまでもなく、画像サンプル値と実際の表示出力との間の関係は、標準的な又は名目上のディスプレイの仮定に基づくことができる。例えば、符号化は、0.05〜2000cd/m2の輝度範囲を有する標準的なHDRディスプレイによるレンダリングを仮定することができる。
そして、量子化アダプタ109は、知覚輝度ドメインにおける均一な量子化ステップから表示輝度のための不均一量子化ステップを決定するために、光幕輝度推定値依存のマッピング関数を用いる。特には、マッピング関数は、表示輝度ドメイにおける対応する量子化間隔遷移値を提供するために、知覚輝度ドメインにおける各々の量子化間隔遷移値に適用されることができる。これは、結果として量子化間隔の不均一なセットをもたらす。
任意の知覚関連関数がマッピング関数として用いられることができることはいうまでもない。
さらに詳細には、輝度値を知覚的に均一な輝度値に変換するマッピング関数は、いかなるアイグレア又は光幕輝度をも仮定せずに、
Figure 2014517556
として定められることができる。ここで、lは知覚的に均一な輝度空間であり、Yは表示輝度である。
一例の関数が図3に実線として表される。水平軸は対数輝度であり、曲線は最も低い輝度レベルを除いて明らかに人間の光受容体のおおよその対数応答を示すことが留意されるべきである。いうまでもなく、異なる実施の形態において、人間の視覚的知覚の異なるモデル、ひいては異なる対応するマッピング関数が用いられることができる。
マッピング関数は1対1写像であるので、等価な対応する逆関数が同様に定められることができる。
Figure 2014517556
定義された関数は、アイグレアの影響を考慮しないので、保守的で不正確である。したがって、量子化アダプタ109は、光幕輝度推定値依存関数の基準として、グレア無しマッピング関数を用いる。
特には、量子化アダプタ109は、以下の調整によって基本的な関数を変更する。
Figure 2014517556
ここで、lglareは、グレアの影響を含む知覚的に均一な輝度値であり、Yveilは、推定された光幕輝度レベルである。
要するに、量子化アダプタ109は、眼における散乱をモデル化するために、画像輝度に推定された全体的な光幕輝度を追加する。図3の基本的な関数のこの水平線形シフトは、所与の光幕輝度に対する表示輝度と知覚輝度との間の関係の適切な推定値を提供する。しかしながら、それは結果としてオフセットになる(すなわち、無表示輝度(例えば明るい画像中の黒ピクセル)に対してさえ、知覚される輝度値は、ゼロではない)。しかしながら、適切な量子化方式を提供することが意図されているので、データ・サンプルのためのゼロのデータ値から出発することが、好ましい。したがって、知覚輝度オフセットは、光幕輝度の輝度マッピングの減算によって除去される。効果として、知覚輝度スケールは、JNDの累算を表す。
光幕輝度依存マッピングは、以下のように反転することができる。
Figure 2014517556
したがって、この関数は、不均一表示輝度量子化に均一な知覚輝度量子化の光幕輝度依存マッピングを提供するために用いられることができる。
輝度から異なる量のグレアのための輝度へのいくつかの例のマッピングを説明する図3から分かるように、光幕輝度を増加させるために必要な量子化レベルはより少ない。さらに、示されるように、より低い(より暗い)レベルは、光幕輝度が増加するについて、より粗く(ゼロにさえ)量子化される。
輝度値が知覚的に均一であるので、それらは均一に量子化されることができる。
Figure 2014517556
ここで、Qは、符号化のために信号を可能な又は必要な精度に量子化する均一量子化器である。例えば、10ビットが用いられる場合、1024個のレベルが利用可能である。しかしながら、必要な数のレベルはグレアによって可変であるので、時には、より少ないビットが必要とされる。したがって、定量化は、コンテンツに適応されることができる。さらに、特定の領域のより粗い量子化が、エントロピー符号化において活用されることができる。
例えば、図3の例において、知覚的な輝度レンジは、各々のデータ・サンプルの符号化に利用可能な10ビットに対応する1024個の量子化間隔/レベルに分割される。表示輝度範囲は、0.05cd/m2〜2000cd/m2である。分かるように、アイグレアが存在しないとき(基本関数)、全1024個のレベルが、0.05cd/m2から2000cd/m2までの範囲を量子化するために必要である。基本曲線は、したがって、各々の知覚輝度量子化レベルから対応する表示輝度値への変換を提供する。例えば、レベル100はだいたい1cd/m2に対応し、レベル500はおおよそ25cd/m2に対応する。
しかしながら、1cd/m2の光幕輝度に対して、より均一なマッピング関数が生じ、結果的に、最初のいくつかの知覚輝度量子化ステップは、(暗い領域がアイグレアに起因して区別されることができないことを反映する)かなり大きい表示輝度ステップに対応する。この光幕輝度推定値に対して、レベル100はおおよそ2cd/m2に対応し、レベル500はだいたい80cd/m2に対応する。さらに、いかなるアイグレアも存在しないときに、0.05cd/m2から2000cd/m2までの表示輝度範囲をカバーするために1024のレベルが必要だった一方、光幕輝度が増加するときのより大きい量子化ステップは、完全な表示輝度範囲をカバーするために必要である大体920個のステップのみをもたらす。
影響は、より高い光幕輝度に対してより顕著である。例えば、100cd/m2の光幕輝度に対して、最初のいくつかの知覚量子化レベルは、表示輝度の大きい範囲をカバーする。実際、この光幕輝度推定値に対して、レベル100はおおよそ150cd/m2に対応し、そしてレベル500は2000cd/m2をかなり上回る表示輝度に対応し、従って用いられない。実際、このシナリオにおいて、0.05cd/m2から2000cd/m2までの表示輝度範囲全体は、約400個の量子化レベルのみを必要とする。したがって、この例において、画像の各々の輝度サンプルに対して9ビットで十分であり、いかなる有意な知覚される劣化をも伴わずに、有意な符号化改善が達成されることができる。さらに、より粗い量子化は、結果としてサンプル値のバリエーションの減少をもたらす可能性があり(例えば、暗い画像に対して、より多くのピクセルがゼロに量子化される可能性がある)、結果として生じる量子化された画像を、(例えばエントロピー符号化を用いた)より効率的な符号化に適したものにする。
(表示輝度の関数としての知覚輝度として表現されるのであれ又はその逆であれ)マッピング関数は、例えば数学的アルゴリズムとして又はルックアップ・テーブルとして実施されることができる。例えば、グレア無しのための基本マッピング関数がルックアップ・テーブルに記憶されることができ、そして、光幕輝度に起因するオフセットが、上記の式によって示されるようにルックアップ入力値及び/又はルックアップ出力値をシフトするために用いられることができる。
先に述べられたように、表示値と実際の輝度すなわちディスプレイ出力との間の相関は、名目上の又は標準的なディスプレイに基づくことができる。所与のシナリオにおいて使用される特定のディスプレイがこの名目上の又は標準的なディスプレイから逸脱する可能性があるが、このアプローチは、一般的に、実際のディスプレイが名目上の又は標準的なディスプレイと異なる関係を有する場合でさえ、有意に改善された性能を提供する。
システムは、例えば各々の画像に対して調節されることができる適応量子化を用いることができる。符号化効率は、改善されることができる。符号器は、出力データストリーム中に使用される量子化方式の指標をさらに含むことができる。特には、それは、出力ストリーム中に光幕輝度推定値の指標を含むことができる。これは、復号器が、使用される量子化方式を決定し、それによって対応する逆量子化方式を適用することを可能にする。
いくつかの実施の形態において、1つの画像領域の量子化は、他の画像領域に対して決定されて他の画像領域を表す光幕輝度推定値に基づいて決定されることができる。一般的に、光幕輝度推定値は、そのようなシナリオにおいて明るい領域のために決定されることができ、量子化は暗い領域に適用されることができる。したがって、一般的に、光幕輝度推定値は、画像の平均輝度より高い輝度を有する(そしてより明るく見える)領域に対して決定される。結果として生じる量子化は、画像の平均輝度より低い輝度を有する(そしてより暗く見える)画像領域に適用されることができる。
例えば、太陽が例えば右上の隅に示される画像をレンダリングするために、HDRディスプレイが用いられる場合がある。物体は、左下の隅に影を落とす場合がある。太陽に対応する非常に明るい画像領域は、そのようなシナリオにおいて、一般的に、ユーザの眼における光幕輝度を誘発し、影の部分における任意の詳細をユーザが知覚することを妨げる。これは、太陽の存在に起因して暗い領域においてより粗くてされることができる量子化に反映されることができる。太陽がその後(例えばカメラ・パンのために)画像から出る場合、光幕輝度は低下し、それによって、影の領域における詳細をユーザが見ることが可能になる。これは、量子化が暗い領域におけるより細かい量子化を提供するために自動的に適応されることができるので、システムによって反映される。
いくつかの実施の形態において、量子化方式はさらに、眼の輝度順応の推定値に依存することができる。この効果は、網膜中の光受容体神経細胞が、それらが受容する平均的な光強度に依存してそれらの感度を順応させることを反映する。この順応によって、人間は、約14桁の輝度範囲を見ることが可能である。しかしながら、固定された順応状態において、これらの神経細胞は、限られたダイナミックレンジ(すなわち3〜5桁)を有する。したがって、「明るい順応状態」の場合に、非常に低い光レベルに対する神経細胞の応答は無視できる。したがって、光幕グレアの次に、光受容体の限られたダイナミックレンジが、人間が実際に知覚することができるもののダイナミックレンジをさらに制限する。さらに、順応は、即時ではなく、その結果として時間的マスキングを伴う比較的遅い応答を有する。例えば、明るい爆発の後、神経細胞は爆発に続く比較的低い光レベルに応答しないので、人は一時的に目が見えなくなる。この時間的マスキング効果は、LDRディスプレイでは無視できたが、HDRディスプレイでは非常に重要である場合がある。したがって、HDRフレーム中の特定の領域が、そのフレームの他の場所における明るい領域のためにマスクされるか知覚的にあまり重要でない場合があるだけでなく、先行するフレームの明るい領域に起因して、マスクされるか知覚的にあまり重要でない場合もある。
この効果は、コーン中の入力光の関数として検出された神経細胞信号出力(すなわち神経細胞の出力)を示す曲線401, 403を示す図4において説明される。眼が比較的暗い環境に順応されたサンプル401として、そして眼が比較的明るい環境に順応されたサンプル403として、相関が示される。分るように、眼は所与のダイナミックレンジに及ぶ神経細胞信号出力を生成することが可能である。しかしながら、ダイナミックレンジによってカバーされる輝度は、眼の順応に依存する。
例えば、人は、明るい太陽が照る日に外に立っている場合がある。眼は明るい環境に順応され、環境中の多くの微妙な違いを知覚することが可能である。これは、図4で曲線403によって表される眼の順応に特に対応することができる。そして人が暗い洞穴に入る場合、環境から入力される光は大幅に低減される。この場合には、人は、弱い光に順応していない神経細胞のために、最初は暗闇中の詳細を見ることができない。図4に示されるように、曲線403は、この順応状態において神経細胞出力信号が弱い光に対してほぼ一定であることを示す。
しかしながら、徐々に神経細胞は暗さに順応し、その関係は曲線403の関係から曲線401の関係に切り替わることができる。したがって、人は、関係が曲線403へと移行するにつれて、暗がりで徐々にますます多くの詳細を見ることが可能になる。
そしてその人が後ずさりして洞穴から日光の中へと出てくると、曲線401によって表される暗がりに対する順応は、ユーザが明るい詳細を見ることを妨げる。そして人の眼が徐々に曲線403へともとに順応するにつれて、ますます多くの明るい詳細を見ることが次第に可能になる。
この効果は光幕輝度とは完全に異なる物理的効果であることが留意されるべきである。実際、光幕輝度は眼の内部の網膜に向けた光の散乱を表す一方、順応効果は、網膜の化学的挙動を反映する。
アイグレアによって引き起こされる制限に反して、瞬間的なダイナミックレンジの制限はさらに、非常に明るい画像の詳細に対する感度を低下させる可能性があり、最も重要なことに、眼が順応するために時間を要するので、輝度順応は時間的影響をもたらす。図1のシステムにおいて、順応状態におけるダイナミックレンジの制限は主に自然な画像を観察するときのアイグレアによって引き起こされることが多くの場合正確に仮定されることができるので、順応の時間的効果に重点を置く。実際には、極端な条件では、眼の散乱は、知覚される画像の可視ダイナミックレンジを約1:30に制限する可能性がある。
さらに、非順応状態に起因するマスキングは、主に画像の暗い領域を考慮する。これは、明順応(ほんの数秒以下)が、暗順応(10秒から数分のオーダ)より大幅に速いからであり、そして、人々は多くの場合画像の明るい領域に順応するからである。したがって、ハイライトの詳細視認性の低下は無視できる。したがって、システムは、(適応状態と組み合わせて)限られた瞬間的なダイナミックレンジに起因する暗い詳細の損失に重点を置き、その効果は、暗い領域の量子化に対してグレア・モデルを適応させることによって、考慮される。特に、輝度順応は、先述されるグレアに基づく量子化モデルを拡張することによってモデル化される。これは特に、非順応状態をモデル化する仮想的なグレアをグレア・モデルに導入することによって実行される。これは、図1のシステムにおいて、光幕輝度推定値を時間的にローパス・フィルタリングすることによって実行される。
特に、再帰的時間(IIR)フィルタが、生成された光幕輝度推定値に適用されることができる。例えば、以下のフィルタが導入されることができる。
Figure 2014517556
ここで、Yvirtual vail(t)は時刻tにおける生成された光幕輝度値を表し、βはフィルタ・パラメータである。
したがって、ローパス・フィルタリングは、量子化が、明るい画像(すなわち高い光幕輝度推定値)の後に、より暗い画像にゆっくりとのみ適応し、それによって暗い領域のもたついた量子化をもたらすことを保証する。
ローパス・フィルタリングは、有利には、2Hz以下の、あるいはさらに有利には、いくつかの実施の形態において、1Hz、0.5Hz又は0.1Hzの、3dBカットオフ周波数を有することができる。これは、モデルの適応が人間の眼の遅い輝度順応に追随することを保証する。
多くの実施の形態において、ローパス・フィルタは、有利には、光幕輝度推定値の減少に対してよりも、光幕輝度推定値の増加に対して、高速な適応を持つ非対称フィルタである。したがって、ローパス・フィルタは、暗適応及び明適応の時間応答における差異を反映するために非対称でありえる。そのうえ、明るい領域における感度損失を無視し、明適応が速いので、多くの実施の形態において、暗適応のための時定数のみを含み、明適応は瞬間的であると仮定することが有利である。例えば、再帰フィルタのための設計パラメータαは、
Figure 2014517556
のように与えられる。ここで、τdark(暗適応時定数)は例えば4秒のオーダーである。したがって、25フレームのフレームレートに対して、この時定数は、画像が暗くなるときにβ = 0.01に対応する100フレーム周辺にある。
図4は、本発明のいくつかの実施の形態による復号器の要素の実施例を説明する。復号器は、図1の符号器から符号化されたビデオ信号を受信する受信機501を含む。したがって、受信機501は、光幕輝度推定値に依存的である所与の量子化方式に従って量子化される複数の符号化された画像を有する符号化されたビデオ信号を受信する。受信信号は、さらに、符号器によって生成されて量子化において用いられた光幕輝度推定値の指標を含む。指標は、光幕輝度推定値の直接的な指標(例えばその値)であるか、又は、間接的な指標(例えば適切な符号化方式の指標)であることができる。
例では、受信信号は、光幕輝度推定値の指標を直接含む。光幕輝度推定値は、光幕輝度推定値に基づいて適切な逆量子化方式を選択する復号量子化アダプタ503にしかるべく供給される。特には、復号量子化アダプタ503は、符号器の量子化アダプタ109によって用いられたのとまったく同じ、光幕輝度推定値に基づく選択アルゴリズムを適用するように用意されることができる。したがって、復号量子化アダプタ503は、符号器において使用された量子化方式に対応する/相補的な逆量子化方式を決定する。
復号器は、符号化された画像を受信する復号器ユニット505を含む。復号化ユニット505は、符号器の符号化ユニット105に対して相補的な演算を実行することによって、符号化された画像を復号する。
復号器は、復号器ユニット505及び復号量子化アダプタ503に接続される逆量子化器507を更に備える。逆量子化器507は、(おおよそ)元のビデオ信号を再生するために、選択された逆量子化方式を復号化された画像データに適用する。
このように、図1の符号器及び図4の復号器の符号化及び復号化システムは、光幕輝度に依存した量子化を用いてビデオ信号の効率的な配信を提供する。人間の知覚系により近い符号化プロセスの適応が達成されることができ、改善された知覚品質対データ速度比を可能にする。
いうまでもなく、量子化アダプタ503は、いくつかの実施の形態において、(図4の破線によって示されるように)復号器505への制御入力を提供することができる。例えば、量子化アダプタ503は、現在の画像が10ビットの輝度サンプル表現で符号化されているのか又は9ビットの輝度サンプル表現で符号化されているのかを、復号器に示すことができる。さらに、いうまでもなく、復号器ユニット505及び逆量子化器409の機能ブロックが別々の逐次的なブロックとして図示されているが、それらは実際には一体化されることができ、組み合わされた機能が、任意の適切な順序で分散され実行されることができる。
このアプローチは、特に、有意に高いダイナミックレンジを提供し、したがってかなり強いアイグレア及び輝度順応効果をもたらすHDR信号に適応されることができる。
いくつかの実施の形態において、HDR画像は、対応するLDR画像に対する差分画像として表されることができる。しかしながら、説明されたアプローチが依然として適用されることができる。そのような符号器の実施例が、本発明のいくつかの実施の形態によるビデオ信号符号器の要素の実施例を説明する図5に提供される。
この例は、LDR符号化経路及び差分HDR画像を生成するための機能の追加を伴う図1の符号器に対応する。例において、(例えばカラー・グレーディング/トーン・マッピングによって生成される)HDR画像に対応するLDR画像は、符号化されたLDR画像を含む符号化されたLDR出力ストリームを生成するLDR符号器601に供給される。符号化されたLDRデータは、遠隔の復号器において実行されるであろう復号化と同じLDRデータの復号化を実行するLDR復号器603にさらに接続される。
結果として生じる復号化されたLDR画像は、復号化されたLDR画像から予測されるHDR画像を生成するHDR予測器605に供給される。いうまでもなく、さまざまなHDR予測アルゴリズムが当業者に知られており、任意の適切なアプローチが用いられることができる。複雑度が低い例として、入力ダイナミック輝度レンジは、予め定められたルックアップ・テーブルを用いてより大きい輝度範囲に単にマップピングされることができる。HDR予測器605は、遠隔の復号器において実行される可能性があるHDR予測を再現し、予測されたHDR画像は、したがって、復号器がLDRデータのみに基づいて生成する可能性があるHDR画像に対応する。この画像は、HDR画像の符号化のための基準画像として用いられる。
図5のシステムにおいて、量子化器103によって生成される量子化されたHDR画像は、したがって、減算器607において予測されたHDR画像によって減じられる。そして、結果として生じる差分(誤差)画像は、(差分)HDR出力データを提供するためにそれを符号化する符号器105に供給される。
いうまでもなく、いくつかの実施の形態において、知覚適応量子化は差分画像に関して実行されることができ、すなわち、それは減算器607の出力に関して実行されることができる(言い換えると、図5の知覚量子化器103及び減算器607の位置は交換されることができる)。しかしながら、そのような実施の形態において、知覚量子化が絶対輝度値に依存し、相対的又は差分輝度値にのみ依存するのではないので、知覚量子化は、符号化された差分HDR画像にのみ依存するのではなく、さらに(又は追加的に)、予測されたHDR画像(又は元のHDR画像)にも依存することができる。実際、いくつかの実施の形態において、光幕輝度推定値及び差分画像のための対応する量子化は、もっぱらHDR予測画像に基づいて決定されることができる。例えば、光幕輝度推定値は、各々のHDR予測画像のために決定されることができる。HDR予測画像の各々のピクセルに対して、予測されたHDR輝度に対応する量子化ステップサイズが決定されることができる。そしてこの量子化ステップサイズは、誤差(そのピクセルのための差分)に適用されることができる。量子化を決定するために元のHDR画像ではなく予測されたHDR画像を使用することは、予測されたHDR画像が復号器においても利用可能であるので、演算を容易にすることができる。
図5の実施例は、LDR画像からの予測によって生成されるHDR画像に対する残余データによるHDR画像のスケーラブルな符号化を表す。しかしながら、いうまでもなく、他の実施の形態において、HDR画像は、LDR画像又は推定されたHDR画像に対してではなく独立の画像として符号化されることができる。例えば、図5のシステムは、LDR復号器603、HDR予測器605及び減算器607の削除によって、HDR画像及びLDR画像の独立した符号化を生成することができる。
先の説明は、画像サンプルが輝度サンプルを直接含む実施例に重点を置いた。実施例において、決定された量子化方式は、輝度サンプルに直接適用される。彩度サンプルの量子化は、均一な又は任意の適切な量子化に例えば従うことができる。
しかしながら、いうまでもなく、このアプローチは、直接輝度サンプルを含む表現に限られず、例えばRGB表現のような他の表現に適用されることもできる。例えば、RGB信号がYUV表現に変換されることができ、その後、YUV信号に対して、説明された量子化が続く。そして、結果として生じる量子化されたYUV信号は、RGB信号へと変換されることができる。他の例として、量子化方式は、光幕輝度推定値が量子化立方体の三次元セットに直接変換される三次元サンプリング方式であることができる。したがって、そのような例において、例えばRGBサンプルの複合量子化が実行される(例えば、Rサンプルの量子化がG及びB値にも依存することができ、それによってRGBサンプルの対応する輝度を反映する)。
先の記述は、ビデオ信号が輝度カラー表現による、特に線形輝度カラー表現によるサンプルを含むシナリオに重点を置いた。しかしながら、いうまでもなく、説明されたアプローチは、多くの異なる表現に適用可能である。特に、このアプローチは、ディスプレイ補正された表現のためにも用いられることができる(例えば特にガンマ補正された表現)。
例えば、入力ビデオ信号は、Rec.709に従う信号を提供する、すなわちガンマ補正されたサンプルを有する信号を提供するビデオカメラから受信されることができる。そのような実施例において、受信機101は、ガンマ補正された入力サンプルを輝度ドメインのサンプルに変換することができる。例えば、それは、Y'CrCb入力信号をYCrCbに変換することができ、そしてYCrCbは先に説明されたように処理されることができる。
同様に、実施例において、符号器の出力は、表示駆動輝度空間ではなく(線形)輝度ドメインで提供される。しかしながら、他の実施の形態では、符号器の出力は、Y'CrCbのような表示駆動輝度方式に従って提供されることができる。そのような実施例において、図1の符号器によって生成される線形輝度サンプルは、特にガンマ補正されたサンプルのような、表示駆動輝度サンプルに変換されることができ、例えば、出力YCrCbサンプルが、Y'CrCbサンプルに変換されることができる(あるいは、RGBサンプルが、R'G'B'サンプルに変換されることができる)。
さらに、出力サンプルが表示駆動輝度表現で提供される実施の形態において、輝度ドメインにおける量子化は、表示駆動輝度ドメインに変換されることができ、このドメインで提供される信号を補正するために直接用いられることができる。したがって、図1の符号器は、表示駆動補正されたサンプル(特に例えばRec. 709に従うガンマ補正された方式によるサンプル)によって動作することができる。これは、輝度ドメインにおける決定された量子化レベルを表示駆動輝度ドメインにおける対応するレベルに変換することによって達成されることができる。これは、(ガンマ)補正が後に続く輝度ドメインへのマッピング関数を用いて実行されることができるか、又は、ガンマ補正された値(あるいはより一般的にいえば表示駆動輝度値)を知覚される輝度値へと関連づけるためのマッピング関数を直接決定することによって実行されることができる。例えば、図3の水平軸は、ガンマ補正された値にマップされることができる。マッピングは、仮定された名目上の又は一般的なディスプレイ(特に仮定された特性を有するHDRディスプレイ)に基づくことができる。
したがって、線形輝度から表示駆動輝度へのマッピングは、決定されたサンプル又は量子化方式(特にレベル)に関して実行されることができる。
サンプルが表示駆動輝度表現のままであるシナリオにおいて、推定器107は、光幕輝度推定値を決定するときに(例えば平均輝度を決定するときに)、駆動(例えばガンマ)補正を考慮すべきである。
同様に、復号器は、表示駆動輝度値によって又は線形輝度値によって動作するように用意されることができる。例えば、復号器は、図4の例で説明されたように動作することができ、結果として生じる出力輝度値は、ガンマ補正された入力を期待しているディスプレイ(例えば、多くのCRT又は古い表示規格に従って動作する新たなディスプレイ)への適切な出力を提供するようにガンマ補正されている。
いうまでもなく、明確性のための前記説明は、異なる機能回路、ユニット及びプロセッサを参照して本発明の実施の形態を記述した。しかしながら、異なる機能回路、ユニット又はプロセッサの間での機能の任意の適切な分散が、本発明を損なわずに用いられることができることは明らかである。例えば、別々のプロセッサ又はコントローラによって実行されると説明された機能は、同じプロセッサ又はコントローラによって実行されることができる。したがって、特定の機能ユニットに対する参照は、単に説明される機能を提供するための適切な手段に対する参照として見なされるべきであり、厳密な論理的又は物理的構造又は機構を示すわけではない。
本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらの任意の組み合わせを含む任意の適切な形態でも実施されることができる。本発明は、オプションとして、1つ以上のデータプロセッサ及び/又はデジタルシグナルプロセッサ上で動作するコンピュータソフトウェアとして少なくとも部分的に実施されることができる。本発明の実施の形態の要素及びコンポーネントは、任意の適切な態様で、物理的に、機能的に及び論理的に実施されることができる。実際、機能は、1つのユニットとして、複数のユニットとして、又は、他の機能ユニットの一部として、実施されることができる。このように、本発明は、単一のユニットにおいて実施されることができ、又は異なるユニット、回路及びプロセッサ間で物理的に及び機能的に分散されることができる。
本発明がいくつかの実施の形態に関して説明されたが、それは、本願明細書において述べられる特定の形態に限定されることを意図しない。むしろ、本発明の範囲は、添付の請求の範囲によってのみ制限される。さらに、ある特徴が特定の実施の形態に関連して説明されたように思われるかもしれない、説明された実施の形態のさまざまな特徴が本発明に従って組み合わせられることができることを当業者は認識する。請求の範囲において、「有する」「含む」などの用語は、他の要素又はステップの存在を除外しない。
さらに、複数の手段、要素又は方法ステップは、個別にリストされるが、例えば1つのユニット又はプロセッサによって実施されることができる。さらに、個々の特徴が異なる請求項中に含まれる場合があるが、これらはおそらく都合よく組み合わせられることができ、異なる請求項中に包まれることは、特徴の組み合わせが可能でなく及び/又は有利ではないことを意味しない。さらに、ある特徴が請求項の1つのカテゴリに含まれることは、このカテゴリに限定されることを意味せず、その特徴が、適切に他の請求項カテゴリに同様に適用可能であることを示す。さらに、請求項中の特徴の順序は、何らかの特定の順序で特徴が動作する必要があることを意味せず、特に、方法の請求項中の個々のステップの順序は、ステップがこの順序で実行される必要があることを意味しない。むしろ、ステップは、任意の適切な順序で実行されることができる。更に、単数の参照は複数を除外しない。"a", "an", "第1", "第2" などへの言及は複数を除外しない。請求項中の参照符号は、単に明確な例として提供されており、いかなる態様によっても、請求の範囲を制限するものとして解釈されてはならない。

Claims (18)

  1. ビデオ信号を符号化する符号器であって、
    少なくとも1つの画像を有するビデオ信号を受信するための受信機、
    前記少なくとも1つの画像のうちの少なくとも1つの画像輝度測度に応じて前記少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値を決定するための推定器、
    前記光幕輝度推定値に応じて前記第1画像の前記少なくとも一部のための量子化方式を決定するための量子化アダプタ、
    前記第1画像の前記少なくとも一部のための前記量子化方式を用いて前記ビデオ信号を符号化するための符号化ユニット、
    を有する符号器。
  2. 前記量子化方式が、前記光幕輝度推定値のための均一知覚輝度量子化方式を表す、請求項1に記載の符号器。
  3. 前記量子化アダプタが、
    知覚輝度ドメインにおける均一量子化方式を決定し、
    前記光幕輝度推定値に応じて知覚輝度値を表示値に関連付けるマッピング関数を決定し、
    前記知覚輝度ドメインにおける前記均一量子化方式及び前記マッピング関数に応じて表示値のための量子化方式を決定する、請求項1又は請求項2に記載の符号器。
  4. 表示値のための不均一量子化方式の量子化間隔が、前記知覚輝度ドメインにおける前記均一量子化方式より少ない量子化レベルを有する、請求項3に記載の符号器。
  5. 表示値のための不均一量子化方式の量子化間隔遷移が、前記マッピング関数による前記知覚輝度ドメインにおける前記均一量子化方式の量子化間隔遷移に対応する、請求項3に記載の符号器。
  6. 前記推定器が、前記第1画像の少なくともある画像領域のための平均輝度に応じて前記光幕輝度推定値を生成するように用意される、請求項1から請求項3のいずれか一項に記載の符号器。
  7. 前記推定器が、前記平均輝度のスケーリングとして前記光幕輝度推定値を決定するように用意される、請求項6に記載の符号器。
  8. 前記推定器が、連続する画像の一部における輝度の重み付き平均として前記光幕輝度推定値を決定するように用意される、請求項1から請求項3のいずれか一項に記載の符号器。
  9. 前記重み付き平均が、2Hz以下の3dBカットオフ周波数を持つ時間フィルタを実行する、請求項8に記載の符号器。
  10. 前記重み付き平均が、前記光幕輝度推定値の減少に対してよりも、前記光幕輝度推定値の増加に対して速い適応によって、非対称である、請求項8又は請求項9に記載の符号器。
  11. 前記符号化ユニットが、符号化された出力信号に前記光幕輝度推定値の指標を含めるように用意される、請求項1に記載の符号器。
  12. 前記量子化方式が第1画像領域に対して決定され、前記光幕輝度推定値が第2画像領域に対して決定される、請求項1に記載の符号器。
  13. 前記第1画像領域が平均より高い輝度を持つ画像領域であり、前記第2画像領域が平均より低い輝度を持つ画像領域である、請求項12に記載の符号器。
  14. 少なくとも1つの画像を有する符号化されたビデオ信号を復号するための復号器であって、
    前記符号化されたビデオ信号を受信するための受信機であって、前記符号化されたビデオ信号は、前記少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値の指標を有する受信機、
    前記光幕輝度推定値に応じて第1画像の前記少なくとも一部のための逆量子化方式を決定するための逆量子化アダプタ、及び
    前記第1画像の前記少なくとも一部のための前記逆量子化方式を用いて前記符号化されたビデオ信号を復号するための復号ユニット、
    を有する復号器。
  15. ビデオ信号を符号化する方法であって、
    少なくとも1つの画像を有するビデオ信号を受信し、
    前記少なくとも1つの画像のうちの少なくとも1つの画像輝度測度に応じて前記少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値を決定し、
    前記光幕輝度推定値に応じて前記第1画像の前記少なくとも一部のための量子化方式を決定し、
    前記第1画像の前記少なくとも一部のための前記量子化方式を用いて前記ビデオ信号を符号化する、方法。
  16. 少なくとも1つの画像を有する符号化されたビデオ信号を復号する方法であって、
    前記少なくとも1つの画像のうちの第1画像の少なくとも一部のための光幕輝度推定値の指標を有する前記符号化されたビデオ信号を受信し、
    前記光幕輝度推定値に応じて前記第1画像の前記少なくとも一部のための逆量子化方式を決定し、及び
    前記第1画像の前記少なくとも一部のための前記逆量子化方式を用いて前記符号化されたビデオ信号を復号する、方法。
  17. コンピュータで実行されたときに当該コンピュータに請求項15又は請求項16に記載の方法を実行させるコンピュータプログラム。
  18. コンピュータ可読媒体に記録された請求項17に記載のコンピュータプログラム。
JP2014503247A 2011-04-08 2012-03-30 ビデオ符号化及び復号化 Ceased JP2014517556A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11161702 2011-04-08
EP11161702.3 2011-04-08
PCT/IB2012/051538 WO2012137114A1 (en) 2011-04-08 2012-03-30 Video encoding and decoding

Publications (2)

Publication Number Publication Date
JP2014517556A true JP2014517556A (ja) 2014-07-17
JP2014517556A5 JP2014517556A5 (ja) 2015-04-23

Family

ID=45937506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014503247A Ceased JP2014517556A (ja) 2011-04-08 2012-03-30 ビデオ符号化及び復号化

Country Status (6)

Country Link
US (1) US20140029665A1 (ja)
EP (1) EP2695382A1 (ja)
JP (1) JP2014517556A (ja)
CN (1) CN103563376A (ja)
RU (1) RU2013149856A (ja)
WO (1) WO2012137114A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019159266A1 (ja) * 2018-02-14 2019-08-22 Eizo株式会社 表示システム及びプログラム

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2887664A1 (en) * 2013-12-19 2015-06-24 Thomson Licensing Method and device for encoding a high-dynamic range image
US10136133B2 (en) 2014-11-11 2018-11-20 Dolby Laboratories Licensing Corporation Rate control adaptation for high-dynamic range images
CN107211076B (zh) 2015-01-19 2018-10-30 杜比实验室特许公司 用于高动态范围视频的显示管理的方法、装置和存储介质
JP6463179B2 (ja) * 2015-03-17 2019-01-30 キヤノン株式会社 信号処理装置、信号処理方法および撮像装置
US10257526B2 (en) 2015-05-01 2019-04-09 Disney Enterprises, Inc. Perceptual color transformations for wide color gamut video coding
CN107925785B (zh) * 2015-08-24 2020-07-07 夏普株式会社 接收装置、广播系统、接收方法以及记录介质
TWI727968B (zh) * 2015-09-02 2021-05-21 美商內數位Vc控股公司 用於視訊編碼及解碼中量化之方法及設備
EP3364654B1 (en) * 2015-12-15 2021-03-03 Huawei Technologies Co., Ltd. High dynamic range image processing method and apparatus
CN106612436A (zh) * 2016-01-28 2017-05-03 四川用联信息技术有限公司 一种基于dct变换下的视觉感知修正图像压缩方法
CN106713907B (zh) * 2017-02-21 2018-08-03 京东方科技集团股份有限公司 一种显示器的hdr图像显示性能评测方法及装置
EP3566203B1 (en) 2017-03-20 2021-06-16 Dolby Laboratories Licensing Corporation Perceptually preserving scene-referred contrasts and chromaticities
CN107197235B (zh) * 2017-06-26 2018-10-12 杭州当虹科技股份有限公司 一种hdr视频预处理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5629780A (en) * 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040247030A1 (en) * 2003-06-09 2004-12-09 Andre Wiethoff Method for transcoding an MPEG-2 video stream to a new bitrate

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5629780A (en) * 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN6016010517; Larson, G.W., et.al.: '"A Visibility Matching Tone Reproduction Operator for High Dynamic Range Scenes"' IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS Vol.3, No.4, 1997, p.291-306 *
JPN6016010518; Krawczyk, G., et.al.: '"Perceptual Effects in Real-time Tone Mapping"' Proc. of the 21st Spring Conf. on Computer Graphics (SCCG '05) , 20050514, p.195-202 *
JPN6016030236; 富永昌治: '「講座 次世代ディジタルカメラ/ディジタルムービーを予測する 第10回 トーンマネジメント 人間の視' 映像情報メディア学会誌 Vol.62, No.10, 20081001, 第1534〜1541頁, (社)映像情報メディア学会 *
JPN6016030238; John Crane Mollis: '"REAL-TIME HARDWARE BASED TONE REPRODUCTION"' [online] , 200405, Chapter 1 and Chapter 5, Cornell University *
JPN6016030241; N2Factory: 「DirextXゲームグラフィックスプログラミング Ver.2.0」 第2版, 20041115, 第214〜226頁, ソフトバンククリエイティブ株式会社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019159266A1 (ja) * 2018-02-14 2019-08-22 Eizo株式会社 表示システム及びプログラム
JPWO2019159266A1 (ja) * 2018-02-14 2021-01-28 Eizo株式会社 表示システム及びプログラム
US11056079B2 (en) 2018-02-14 2021-07-06 Eizo Corporation Display system and program

Also Published As

Publication number Publication date
US20140029665A1 (en) 2014-01-30
RU2013149856A (ru) 2015-05-20
WO2012137114A1 (en) 2012-10-11
CN103563376A (zh) 2014-02-05
EP2695382A1 (en) 2014-02-12

Similar Documents

Publication Publication Date Title
JP2014517556A (ja) ビデオ符号化及び復号化
JP7422832B2 (ja) 様々なレベルのメタデータを含む色管理を制御するスケーラブルシステム
US11710465B2 (en) Apparatus and methods for analyzing image gradings
JP6700322B2 (ja) 改善されたhdrイメージ符号化及び復号化方法、装置
EP3669542A1 (en) Bit-depth efficient image processing
CN107197266B (zh) 一种hdr视频编码方法
WO2019036522A1 (en) EFFICIENT IMAGE PROCESSING IN BIT DEPTH
JP5568084B2 (ja) 異なる規格を使用して符号化された画像の変換
JP7503655B2 (ja) トーンマッピング曲線のためのパラメータセットの決定
US20240161706A1 (en) Display management with position-varying adaptivity to ambient light and/or non-display-originating surface light
WO2022245624A1 (en) Display management with position-varying adaptivity to ambient light and/or non-display-originating surface light
CN118318243A (zh) 优化hdr图像的显示

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160617

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20161215