JP6526776B2 - Hdr画像符号化及び復号のための輝度領域ベース装置及び方法 - Google Patents

Hdr画像符号化及び復号のための輝度領域ベース装置及び方法 Download PDF

Info

Publication number
JP6526776B2
JP6526776B2 JP2017238361A JP2017238361A JP6526776B2 JP 6526776 B2 JP6526776 B2 JP 6526776B2 JP 2017238361 A JP2017238361 A JP 2017238361A JP 2017238361 A JP2017238361 A JP 2017238361A JP 6526776 B2 JP6526776 B2 JP 6526776B2
Authority
JP
Japan
Prior art keywords
image
luma
display
hdr
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017238361A
Other languages
English (en)
Other versions
JP2018061288A (ja
Inventor
マーク ジョゼフ ウィレム メルテンス
マーク ジョゼフ ウィレム メルテンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2018061288A publication Critical patent/JP2018061288A/ja
Application granted granted Critical
Publication of JP6526776B2 publication Critical patent/JP6526776B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Description

本発明は、少なくとも1つの画像又はビデオの改良された符号化、特に、レガシー画像と比べて拡大されたダイナミックレンジを用いる画像のコーディング(ハイダイナミックレンジHDR画像と呼ばれ、レガシー画像はローダイナミックレンジLDRと呼ばれる)、及び増加された量の照度情報(ハイダイナミックレンジとも知られる)を用いる画像情報の様々な画像表現への又は様々な画像情報からの符号化のための装置及び方法、並びにデータ記憶製品又は符号化された信号等の結果物に関連する。
近年、(取り込み(キャプチャ)シーン又はコンピュータグラフィックスの)画像/ビデオ(動画)の符号化に関して新たな発展が起こり、すなわち、自然界に現れる対象(物体)の輝度及び色の全範囲を、例えば25000ニット(例えば、陽に照らされた雲)等の高い輝度値からしばしば0.01ニット等の低い値まで、より好適に取り込むことが望ましく、これはHDR(high dynamic range)符号化とも呼ばれる。従来、古典的な画像取り込みシステムは(すなわち、カメラ(場合によっては型的には比較的均一である適切なシーン照明)から始まり、次いで例えば画像の記憶又は伝送のための符号化、画像のディスプレイまでのチェーン)、ハイダイナミックレンジシーンを著しく歪ませる方法で扱ってきた(すなわち、重要な物体を含む低輝度の重要な暗領域と高輝度の明領域とが同時に存在するシーン、特に中間輝度(様々なグレイ)の様々な重要な領域も存在する場合、特にこれらのシーン輝度のいくつかがチェーン内の構成要素によって使用可能なものに容易にマッピングされ得ない場合、例えば線型マッピングに基づくディスプレイレンダリング等)。例えば、アクションが第1の光レベル(照度)の閉じられた空間、例えば車又は部屋の中で起こっていた場合、より明るい照明の領域、例えば窓を通して見られる環境等は、非常に低い品質で取り込まれた、又は少なくとも信号内で表現された可能性がある(すなわち、淡色、あせた色、又はクリッピングされた色)。これは、例えばセルロイドフィルムのより寛大な挙動と比べて、安価なCMOSベースカメラで特に顕著である。特に、これらの明領域内の物体にほとんど表現されないコード値が少ししか関連付けられていなかった可能性があり、これは物体のテクスチャーの粗悪な表現、又は符号化に使用される色空間の最大値への無遠慮なクリッピングさえもたらし得る。取り込み画像の輝度軸のこれらの領域内に余りに少ないデータを有することは、例えば表示画像コントラストを最適化等する処理関数が良質な最終的なピクセルデータを生成する上で問題が生じ得ることを意味する。現在及び将来において、かつてない高性能のディスプレイ(例えば数千ニットのピーク輝度)又は少なくともよりスマートな画像処理技術が利用可能であることに照らして、その状況を改善して、より品質の高いレンダリング画像の作成を可能にすることが望まれ得る。
いくつかの理由から、少なくともその後の数年間、何らかの形式の後方互換性が望まれ得る、つまり、例えば新規のアップグレードされたビデオ処理ボックスがLDR信号をより低いダイナミックレンジのディスプレイ(例えば、モバイルディスプレイ)に送ることができるよう、いわゆるローダイナミックレンジ(LDR:low dynamic range)符号化のデータが利用可能、又は少なくとも利用可能な符号から容易に決定可能でなければならない。また、記憶の観点から見ると、画像を可能な限り汎用性の高い態様で、つまり、単にそのシーンに関する有用なデータの最大量だけでなく、このデータが多くの潜在的な将来のアプリケーションに対応する態様で記憶すると、特に単純な方法の場合、非常に有益であり得る。通常、映画の撮影は例えば大変な労力を要するため、原信号は非常に貴重であり、技術が許容する最適な方法で符号化することが好ましい。番組のマスター符号化さえも、データが異なる態様で符号化されていれば達成可能であったものを下回る、より品質の高い表示システムの後世代用のものであるという事態に陥らないようすべきである。これは、高価なスタントを全て繰り返さなければならないことを回避するだけでなく、王室のカップルの結婚式、又は一般のカップルのウェディングビデオ等の一部の記録されるイベントは繰り返されないことを読者は想像できる。そして、かかるビデオを新世代の表示技術用にリマスターしようとすることは非常に難しい、又は少なくとも面倒である。符号化が、まずシーンを最適に取り込むことを許容し、更にその符号化構造そのものにより後段の改良を容易に可能にすることが好ましい。特定のディスプレイ及び視聴環境において如何にレンダリングされるかとは独立に、JPEG等の現在のLDR符号化内に存在する情報は(特に具体的な取り込みシーン及び使用されるカメラシステムに応じて)、現在約11リニアビット又はストップ(に限られる)と見られている。当然ながら、符号化がレンダリング(例えば、ディスプレイ基準)に直接使用される場合、情報ビットの一部は視えない可能性がある。一方で、例えばディスプレイが画像処理により可視ガマット(色域)を変更する場合に関連することになり得る、オリジナルのシーン又はグラフィックス組成(シーン基準)からの情報をコーデックが保持し得る。したがって、コーディングされた画像において少なくとも重要な画像物体が良好に表現されることが重要である。
HDR取り込みチェーンは、最も暗い物体と最も明るい物体との輝度コントラスト比が大きいシーンに単にカメラを向けて、シーン内に存在するものをリニア記録するだけのものではない。全ての物体の中間グレイ値が、例えば映画の雰囲気を運ぶので、全ての物体の中間グレイ値が正確にいくつであるかに関係しなければならない(シーン内の物体の一部を既に暗くすると、暗い雰囲気が運ばれ得る)。そして、これは複雑な心理的プロセスである。例えば、明るい照明が、レンダリングされるグレイ値の残りの部分に対して、その照明のシーン輝度のシーン物体輝度の残りの部分に対する比率で厳密にディスプレイ上にレンダリングされることは、心理的にそれほど重要でないと想像するかもしれない。むしろ、ピクセルが「いくらか」高いディスプレイ出力輝度でレンダリングされ、それが画像の残りの部分より十分に高い場合、実際の照明の忠実な印象が得られるであろう。しかし、(シーンの多様な照度領域における)自発光物体と反射物体との間のその分配も、ディスプレイのガマット及び典型的な視聴環境に依存するタスクである。また、暗領域の符号化が、暗い画像コンテンツに対して異なる可視性レベルを有する異なる平均周囲照明レベル等の異なるレンダリングシナリオにおいて容易に使用できるよう実行されることが好ましいことが想像され得る。一般的にこれは難しい心理的なタスクであるため、最適な画像の作成にアーティストが関与し、これはカラーグレーディングと呼ばれる。特に、カラーグレーディングが「純粋なHDR符号化戦略」で実行される場合においてもアーティストが別個のLDRグレーディングを作成すると、非常に都合が良い。言い換えれば、完全なHDRカメラのRAW信号を符号化するようなシナリオにおいて、依然としてLDR画像も生成し、これは必ずしも将来のビデオ消費市場を占める大きなLDR部分のために使用されるものではなく、そのシーンに関する重要な情報を運ぶからである。すなわち、シーン内にはより重要な領域及び物体が常に存在し、これらをLDRサブ構造に入れることで(完全な取り込みの後で、その範囲外の取り込み輝度に関連するが、概念的に自動露光アルゴリズムの美術的な対応物とみなすことができる)、中間レンジ表現(MDR)へのあらゆる変換が容易になり、特定のレンダリング及び視聴特徴を有するディスプレイを駆動するのに適する。このような技術的フレームワークを用いることにより、単一の符号化画像によってさえ、同時に、例えばピーク輝度が50ニット(室内、又はより高い輝度であるが高い屋外の照度と競合する)のモバイルディスプレイ等のLDRディスプレイ、例えば1200ニットの中間レンジピーク輝度MDRディスプレイ、及び例えば8000ニットのピーク輝度のHDRディスプレイ等に適合できる。特にこのLDR部分を、例えば標準基準LDRディスプレイ上で高品質でレンダリングされるよう(カラーが可能な限りHDRディスプレイ上でのカラーと同様に見える)、又は、全取り込み情報のある割合を運ぶ(例えば、画像のある量が視える)等するよう、いくつかの基準に従って調整してもよい。下記の提案されるコーデックにおいて、かかる受信ディスプレイがその単一の全てを包含するシーン符号化(又はグレーディング)から、何が例えば暗領域であるかを容易に識別し、表示システムの既知の特徴に基づいて、それらの暗領域の組み込まれた可視性を最適に調整し得ることを実現する。
HDR信号を符号化する方法はそれほど多くない。従来技術では通常、HDR信号は単にそのままコーディングされる、すなわち、ピクセルが例えば16ビットフロートワードに(線型)マッピングされ、最大取り込み輝度値は、LDR符号化と同様な原理でHDR白色となる(但し、心理視覚的には通常これはシーン内のある反射性白色ではなく、照明の明るい色である)。これは、カメラによって取り込まれたオリジナルのシーン物体輝度のネイティブなシーン基準符号化である。また、何らかの「最適」ルマ(輝度)変換関数(典型的にはガンマ関数等)により、フルレンジHDR信号を8ビットのLDRレンジにマッピングすることもできる。これは、カラー精度の低下及び対応するレンダリング品質に係る問題を伴い得り(かかる符号化のレンジと精度との間のトレードオフの観点から)、特に受信側において局所的ブライトニング等の画像処理が予測される場合顕著であるが、画像物体の支配的(主要)なグレイ値グレーディング(例えば、ある物体の平均値)は大まかに保存される(すなわち、それらの相対的/比率的なルマ関係)。
従来技術は更に、典型的には一種のスケーラブル・コーディング概念に基づく、HDR画像毎に2つの画像データセットを使用するHDR符号化技術をいくつか教示しており、何らかの予測関数により、「LDR」符号化された局所的テクスチャーの精度が改良される、より正確に言えば、典型的にはLDR輝度をスケーリングすることによりそのテクスチャーのHDRバージョンに投射される(これらの技術におけるLDRは通常、典型的な(基準)LDRディスプレイ上での最適なレンダリングのために既に適切な見栄えの良いLDRグレードではなく、典型的にはHDR入力への単純な処理である)。第2の画像は、予測されるHDR画像を符号化されるべきオリジナルのHDR画像に近づけるための補正画像である。一種のレンジ/精度定義基準として機能する予測関数を通して、単一HDR画像符号化との間にいくらかの類似性があるが、これらの技術では符号化が2つの画像を用いて実行される。
ベースバンド画像の輝度のスケーリングは変換の適用を伴い、符号化されるデータの量を減らすため、この予測変換はしばしばブロック毎に定められる。多くのブロックが同じ物体を含むことになり、よって同じ変換を必要とするため、これは既にデータ浪費的であり得る。
前述したように、オリジナルのHDR画像と予測との違いは、強化画像として所望の程度に、強化画像のレンジ及び定義に基づいて可能な限り共符号化され得る。例えば、HDRグレイ値1168が8で割られた値146により表され得る。このHDR値は再び8を掛けることにより再形成できるが、値1169は同じベース層値146に量子化するため、高品質HDR信号を再形成するには、強化値=1が必要とされる。かかる技術は特許文献EP2009921[Liu Shan et al. Mitsubishi Electric: Method for inverse tone mapping (by scaling and offset)]で説明されている。このような方法に関する興味深い問題は、常に、強化方法が視覚的情報改良として実際に何をもたらすかである。これは通常盲目的に適用され、例えばテクスチャリングされた領域に対して、特に素早く変化する動画において、適切な追加情報を与えない場合がある。
現在はまだ公開されていない出願US61/557461には他の2画像符号化が説明されており、その全ての教示が参照により本開示に組み込まれる。
現在、既存のHDR符号化の全てに問題が存在する。単に全体的(グローバル)な変換を適用するだけでは、例えば映画(特殊効果)に多くを投資したコンテンツクリエーターが望むものによれば、粗すぎる可能性がある。テレビ番組作成等の他の用途はそれほど重大ではない可能性があるが、最終的な見栄えに関する良好な制御は依然として望まれる。これは少なくとも、多くの符号化されたデータビットを必要とするという代償を伴う。一方、ピクセル毎に複雑な変換を指定することも、大容量の符号化されるデータを伴う。これは例えば、第1の画像内に符号化されている物体のテクスチャー反射のために、照度ブーストマップである第2の画像を符号化しなければならないことに該当する。更に、画像内に何が実際に含まれているのかをそれ程知らず、ブースト画像内に大量の冗長性が存在し得ることさえ認識せず、入力上に現れ得るあらゆるものが盲目的に符号化される(すなわち、汎用的使用を許容しない)。ディスプレイ側での例えば画像改良又は最適化アルゴリズム等のスマートなアルゴリズムにとってこの盲目的なデータが使用しやすいことは言うまでもない。
ブロック毎の取り扱いはデータの量を減らすが、依然として最適ではない。特に、このブロック構造は実際の画像コンテンツに対してやや盲目的でもあり、より厄介なことには、基礎となる画像と全く関係のないブロックグリッドである新たな幾何学的構造を押し付け、よって画像特徴(特に画像のジオメトリ)といくらか便宜的にマッチングし得り、これはブロックコーディングに関連するアーティファクトがいくらか生じ得ることを意味する。実際には、ブロックは単なる大きなピクセル程度のものであり、真にスマートなコンテンツ関連構造ではない(その物体又は領域の色−幾何学的構造、及び、セマンティックな意味(例えば、暗部の中で最も隠されるべき物体)のいずれに関しても)。
下記の実施形態は、かかるアーティファクトの少なくとも一部を軽減するための簡単な技術的手段を提供することを目的とする。
ハイダイナミックレンジシーンの画像を符号化するための画像エンコーダ(549)であって、
−画像のピクセルカラーをNビットのコードワードを含む画像表現(Im_1)によって符号化するピクセルテクスチャー符号化ユニット(552)と、
−領域識別グレイ値(gTS)を決定して出力する画像解析ユニット(550)であって、ルマ値である領域識別グレイ値は、領域識別グレイ値未満において、画像の少なくとも1つのブロック内の第1の物体の全てのピクセルのルマを画定し、領域識別グレイ値より上において、画像の少なくとも1つのブロック内の第2の物体の全てのピクセルのルマを画定する、画像解析ユニットと、
−画像表現(Im_1)及び領域識別グレイ値(gTS)を出力画像信号(S(Im_1,MET(gTS)))内に共符号化するフォーマッタ(554)とを含む、画像エンコーダに関連する原理に従う本明細書で提案される実施形態の概念により、HDR画像の単純且つ容易に利用可能な符号化が実現され得る。
1つ又は複数のかかる領域識別グレイ値を用いるだけで、画像内に「白色以上(above-white)」又は「明るい以上(overbright)」が存在すること等のHDRシーンの不可欠な特徴を運ぶことができる。白色以上は、普通に照らされた領域内の白色、例えば、(例えば、セット照明デザイナーに従って)普通に照らされた、シーンの主要部の白色の紙から記録される白色以上のシーン輝度を意味する。識別値はシーンのセマンティックなコンテンツ(内容)を共符号化する好適な方法である。例えば、古典的な画像符号化が仮定するように、現実のシーン内には1つの白色しか存在しないわけではない。古典的なLDR画像符号化では、実際にはアクションがほぼ均一に起こるシーンが照明され、典型的には最も白色な(主要な画像領域の最も明るい照明の)白色物体が画像符号化の白色点を決定する。例えば、屋外の物体をクリッピングする代わりに、例えばカメラマンが再現ガンマ曲線に特定の屈曲点を指定することにより、何らかの白色以上の物体を含めてもよいが、これは依然としてメインの白色に関連付けられる(例えば、その白色の6x)。
実際のシーンでは、例えば非常に明るい晴れた屋外が存在し得る。これらの2つの領域をより少量のビットの符号化に押し込む場合(例えば、8ビットの古典的な画像として表現する)であっても、これらの2つの領域/レンジをルマ軸上で互いから分離することが望まれ得る。これは、後に(又は、例えばトランスコーディング又は自動再グレーディング等の間に)これらの領域がよりスマートに処理され得ることを意味する。照明物体について、既に上記で述べた。レンダリングディスプレイは、「可能な限り明るく」及び「しかし視聴者にとって過度に眩しくないよう」の1つ以上を定める基準に従ってそれらをレンダリングしたいと望み得る。しかし、これを実行するためには、2つの画像領域(照明対シーンの残りの部分)を異なる方法で、更に非連続に処理しなければならず、したがってレンダリングディスプレイは画像内の何がその照明物体であるかを知る必要が生じ得る。古典的なガンマ関数ベースの符号化は、典型的には後処理中に、照明を、使用されるガンマに応じてあるレンダリング輝度位置に移動するが、シーンのセマンティックス及びレンダリングシステムの比色的詳細(ディスプレイの能力、周囲光等)には依存しない。暗いレンジの組成を輝度領域的に知っている場合、つまり、例えばいくつかの暗さのレンジ、例えば「明るい暗さ」、「平均暗さ」、及び「非常に暗い」を知っている場合、暗い領域に関しても同様に推測され得る。かかるコード(すなわち、グレイ値識別値)は数値的な何かを意味し得るが、我々の方法は、例えばBlu-ray(登録商標)ディスク上に記憶するための最終的なマスターHDRを作成しているカラーグレーダーが、それらをセマンティック的に有意な領域と結び付けることを可能にする。例えば、ホラー映画の暗い地下において、平均の暗さは壁が(ディスプレイ最適性のための最終的な最適トーンマッピングに従って、最終的にレンダリングディスプレイ上に)レンダリングされる色であり得るが、一方、明るい暗さ(すなわち、平均暗さと明るい暗さとの間のレンダリングされる輝度レンジ)は(レンダリング側の比色的詳細に基づいて)それらを視え易くするために壁上のナイフ及び拷問器具等の道具であり得り、非常に暗いのは例えば犯罪者が隠れているかもしれない暗い角部であり得る。晴れた屋外が第2の物体で、屋内が第1の/主要な物体であり得る屋内/屋外のシーンと同様に、非常に暗い角部の領域が我々の第1の物体であり、平均暗さの主要領域が第2の物体である。
また、これらの2つの部分領域(例えば、平均照度主要アクション及び照明又は晴れた屋外)は、間のルマコードを無駄にしないために、符号化された画像表現において実際に触れるほどに互いに近い場合があり、このため受信側で盲目的に分離するのは非常に難しい。しかし、両者の間の境界を示す特定のルマ値が存在し、受信側での容易な(且つ単純な)シーンの理解のために領域識別グレイ値(gTS)として共符号化される。また、これはHDR符号化、受信側における8ビット画像からの容易な再構築、カラー再マッピング等の画像処理等、様々な応用を許容する。
好適には、画像エンコーダ(549)は、画像表現(Im_1)内に符号化されたピクセルルマと、第2の画像表現(IM_RC_HDR)内のピクセルのルマとの間のマッピングを定める、第1及び第2の物体のうちの少なくとも1つの物体のためのルママッピング(TOM)を決定して、ルママッピング(TOM)を、ルママッピング(TOM)を出力画像信号(S(Im_1,MET(gTS),TOM)内に符号化するフォーマッタ(554)に供給するルママッピング決定ユニット(553)を含む。かかるルママッピングは、一方で画像内の情報(例えば、木目等の特定の複雑さのテクスチャーを比較的忠実に符号化するのに必要なコードの量)の最適な指定、他方で例えば見かけ等の原理を考慮して、多様な方法で、典型的には基準ディスプレイ上の輝度位置を定めることにより決定され得る。
コンテンツクリエーターは、処理(例えば最終的なディスプレイレンダリング)を行うことについて、受信側に任せることができる。たった1つのgTSを有すれば、受信側システムは何がgTS以上のルマを有する明るい物体であるかをはっきりと知ることができるので、多くの状況において十分である。しかし、領域識別値を共符号化するこのシステムは、はるかに汎用的なHDRシーン(更にそれらの組成又はセマンティックな意味についての知識をメタデータとして)の使用、及び、結果としてそのデータの多様な使用を可能にする。例えば、コンテンツクリエーターは、Im_1内に符号化されたピクセルカラー/ルマを、様々な他の色空間(例えば、他のディスプレイ上にレンダリングするための等)に如何にマッピングするかに関して、1つ以上のシナリオを提供できる。コンテンツクリエーターは、例えば(約)1種類のディスプレイのために複数の値を符号化して(例えば4000ニット付近のピーク輝度を有し、すなわち実際のピーク輝度が3000〜5000ニットのLCD又はOLEDを対象とする)、ディスプレイが、全ての符号化された変換知識(コンテンツクリエーターが自身の画像が最終的に如何に見えることを望むかを成文化(codify)する)から、最終的なレンダリング戦略をそのディスプレイが最終的に選択できるようにしてもよい。例えば、表示可能なダイナミックレンジが少ないディスプレイは、明領域をレンダリングする能力があまり高くないので、明領域のための単一な識別値だけで十分であり得る。しかし、8500ニットディスプレイは、異なる種類の明領域を示すより多くのgTS値を有する場合、物理的にレンダリング可能な明るい輝度のサブガマットを知っていれば、例えば屋外の眩しい物体、例えば第1の種類の照明物体に異なる輝度サブレンジを割り当てることができ、更に、より明るい種類の照明物体にはピーク輝度に近いより更に明るい領域を割り当てることができるので、コンテンツをはるかに有効に使用し得る。
グレーディングに多くの時間を費やすことにそれほど関心のないコンテンツクリエーターは、例えば2つのグレーディングだけを指定してもよく、例えばコンテンツクリエーターはIm_1、又はLDRレンダリングのために「十分良好な」その何らかの自動変更から始めて、少しの時間でマッピングを微調整し、改良されたHDR画像を得てもよい(例えば、明るさが増された屋外領域、照明、又は窓)。よって、コンテンツクリエーターは例えば8ビットLDR画像(LDRコンテナと呼ぶ)、そしていくつかの関数、第1に(例えば、ネイティブのフロート16ビット符号化で)LDRコンテナからオリジナルのマスターHDR画像を大まかに復元するための第1のマッピング関数、及び第2に、そのHDR画像の1つ以上の調整を可能にするいくらかの関数を指定してもよい。例えば、コンテンツクリエーターは、14000ニットの第2の基準ディスプレイ上での表示のために、例えば90%以上の明領域のマッピングを指定してもよい(第1の基準ディスプレイは、ダウンマッピングによってLDRコンテナによりコーディングする前にオリジナルのマスターHDRグレードが対象としてグレーディングされたディスプレイであり得る(例えば5000ニットディスプレイ))。同様に、例えばマッピング挙動を逆転させることにより、これらの関数を2000ニットあたりのMDRディスプレイへのダウンチューニングのために使用することもできる。最も単純な変形例では、少ない時間を費やすグレーダーは、映画内の少なくとも一部のシーンに対して単に1つ以上のgTS値を指定して、ディスプレイ又はレンダラー(例えばプリンタ)に、そのレンダリング特性にとって良好な変換は何であるかを突き止めるのを任せてもよい。
この場合、受信側画像処理装置は、例えば2つ以上の情報のセット(Im_1内の符号化されたLDRコンテナ画像、少なくとも1つの識別グレイ値gTS、及び利用可能な場合はグレーダーの所望の指定マッピング関数情報)から最終的なグレードを決定し得る。例えば、図2bを参照して、コンテンツクリエーターは、非常に暗い物体のHDRレンダリングのためには部分的マッピングPD_BLCK(i+2,j)が使用されるべきであり(下記で詳細に説明)、LDRレンダリングのためにはより明るいマッピングPD_BLCK(i,j)が使用され得る又はべきである(すなわち、非常に暗い物体が階段として処理される)ことを信号内に規定し得る。ここで、例えば1500ニットのピーク輝度の受信ディスプレイは、これら2つの戦略のうちのいずれかを使用すると判断してもよく(例えば、ピーク輝度に最も近い方;LDRグレーディング/マッピングは最大で750ニット用(よって、おそらくはどちらかと言えば400ニット用)、HDRは最小で例えば2000ニット用)、又は両者の間を何らかの態様で補完してもよく、上記2つの線型関数に関しては、例えば中間の線型関数を適用することを意味する。システムは、例えば、魔法使いの手から放たれたプラズマボールのように明るい照明をブーストして、コンテンツクリエーターがHDRを「HDR効果」として見ることを可能にする。
我々の方法は、Im_1符号化が、オリジナル画像(マスターHDR)より少ないビット(より少ないダイナミックレンジと同義ではない)の符号化である場合、例えば、古典的な8又は10ビットルマ符号化による符号化である場合に使用できる。この場合、画像Im_1は、より低いダイナミックレンジ(及び典型的にはピーク輝度(例えば500ニット))の基準ディスプレイ用に定められ得り、より高いディスプレイダイナミックレンジ用の(例えば、2000ニットのピーク輝度を有するディスプレイ用の)グレーディングを自動的に決定するために識別値gTSが有用であり得る。しかし同様に、当然ながら、単一の符号化された画像Im_1は、例えばその2000ニット基準ディスプレイ用に指定されていてもよく(すなわち、そのディスプレイを駆動するために直接使用可能であるか、又は少なくともレンダリングの前にマイナーな比色的変更を要する)、かかるシナリオにおいては、gTS値(及び変換関数の詳細等の他のデータ)は、特に、例えば携帯型のディスプレイ等のより低いダイナミックレンジディスプレイ用の駆動画像をダウンマッピングにより取得するために有用であり得る。
すなわち、好適には、画像エンコーダ(549)は、第1及び第2の画像表現のうちの1つがハイダイナミックレンジ表現であり、ピーク輝度が750ニットより上の基準ディスプレイ用に符号化されるような使用シナリオ及び技術的構成において動作する。つまり、更なる大きな変更を要することなく、画像表現が、アーティストがほぼ意図した通りに画像をレンダリングするようHDRディスプレイを駆動するために使用可能なのである。かかるHDR表現は、例えば3x32ビット整数又は3x16ビットフロート表現(RGB又はYC1C2等)であり得る。この符号化戦略は、様々な色空間表現の間で様々なシナリオにおいて使用できるが(例えば、第1の白色を有する第1の16ビットHDR表現と第2の例えば12ビットHDR表現との間でガンマ関数がルマコードを割り当てる)、画像(入力又は出力)の少なくとも1つ又は画像の少なくとも一部がハイダイナミックレンジである場合に特に有用であり(すなわち、そのようにコーディングされた、又はHDRレンダリングディスプレイを高い比色的品質で駆動するために使用できるよう取得された等)、HDRが少ないビット(すなわち、例えば14又は20ではなく例えば8又は10)のルマワードによって符号化される場合に特に有用であり、この場合、レガシー能力又はそれに近い能力のシステムにおいて使用され得る。説明の完全さのために、近年良く知られているハイダイナミックレンジという用語は、典型的には古典的な減税のLDR撮像シナリオよりオリジナルのシーンにおける輝度が高い、又はより高い輝度でレンダリングすることを意味し、更に正確には、より大きな照度見かけのレンジと表現することもできる(例えば、視聴者の人間視覚系に基づく(当然ながらルマ等の技術的コードで具現化されるが)。適度に遠い未来の予測可能な技術の最大である最終的なディスプレイの能力を基準にして、かかる信号をディスプレイ基準で定めてもよいが、理想的にはHDR画像は少なくとも部分的にシーン基準で定められ(未来のディスプレイが符号化されたコンテンツを利用するために何をするのかは知ることができないので)、また、若い愛好家は、潜在的に非常に高品質なカメラ又はグラフィックスプログラムが取り込む又は生成できるものを画像が少なくとも記憶しなければならないと言うだろうが、依然として、基準カメラモデルを使用する代わりに、非常に高品質のディスプレイによって近似されたシーンとしてこれが符号化され得る。実際に、任意のコード割り当て関数を有する0〜Lmaxの任意の符号化は、Lmaxのピーク輝度を有するかかる理論的ディスプレイ上でレンダリング可能であると見ることができ、そして人間の視覚の固定された限界に基づき、遠い未来においても、大きな壁を覆うディスプレイ、及び特に全ての画像コンテンツが小さい立体角内で見られる小さいディスプレイにおいて太陽の輝度を忠実にレンダリングする必要は、実際には決してないだろう。よって、グレーダーは、500000ニットピーク輝度の究極的な理論的なディスプレイであろうと、10000ニット等のより実践的なディスプレイであろうと、コーデック定義の中に比色定義メタデータを共指定する限り、画像を所望の任意の基準ディスプレイで符号化することを選択できる。
好適には、画像エンコーダ(549)は、画像表現(Im_1)からのピクセルカラーを符号化するNビットのコードワードのいくつかを含む空間的画像セクション間に、いくつかの領域識別グレイ値(gTS_D_Loc_1,gTS_D_Loc_2)を符号化する。これは、クリエーター(又は場合によっては自動処理ソフトウェア)が例えば画像の異なる部分に例えば「最も暗い影の部分」の異なる値を割り当てることを可能にし、よってクリエーターに画像の調整性に関してより高い制御を与える。例えば、画像内の中央幾何学的領域において、例えばコード値10未満と定義される暗い物体を隠す(隠さない)ことができ、そして角部において最も暗い物体はコード値5未満である。これは、局所的gTSの再定義の後に続く複数のブロックにかけて暗い物体のピクセルと最も暗い物体のピクセルとの間の関係が複数回変化し得る幾何学的に変化する照度等、様々な物理的状況に対応し得る。画像テクスチャーデータ(Im_1)と(例えば、持ち運び可能メモリ上で)物理的に関連付けての領域識別グレイ値の実際の符号化は、様々な方法で実行され得るが、要求されるメタデータが、適用可能な位置に正確に、すなわち、典型的には(典型的には後続のブロックのセグメント化又は処理のために使用される)gTS未満及び以上のグレイ値の二元関係を有する画像内の最初のブロックの前に、ピクセルカラーデータにちりばめられて符号化される場合、好適である。
好適には、画像エンコーダ(549)は、一連の複数の連続する画像の前に、当該連続する画像全てのための領域識別グレイ値を符号化する。当然ながら、より重要な領域識別グレイ値は、例えばショット又はシーン全体に適用され得るため、より狭い一定間隔で符号化されてもよい。例えば、映画の暗い恐ろしいホラー部分のために、暗い領域を符号化するための戦略を、異なるレンダリング環境のためにいくつか符号化してもよい。映画の後半の屋外の日中のシーンにおいて、そのシーンの最初の画像の前に、空のために使用される支配的なブライトニング戦略を別個に符号化してもよい。これは、ショット又はシーン毎に処理を指定することを可能にし、例えば、地下の最も暗い部分を定めて、2つの暗い地下のショットの間の例えば屋外の間欠的なショットの後にかかる定義が再び現れ得る。
好適には、画像エンコーダ(549)は、少なくとも1つのグレイ値のそれぞれを画像表現(Im_1)の該当する幾何学的領域に関連付けることを可能にする幾何学的関連付けコードとともに、画像表現(Im_1)を記憶するメモリに物理的に隣接しないメモリ内に当該少なくとも1つの領域識別グレイ値を符号化し、幾何学的関連付けコードは、典型的には画像表現(Im_1)のブロックの座標を少なくとも含む。これは、例えばリマスタリング又は視聴体験サービスを可能にする。企業が例えばレガシー映画(又は、場合によっては既に現在の原理に従って処理された番組又はゲーム等)を選択して、グレーダーに画像の新たな解析を行わせてもよい。この場合、グレーダーは、領域識別グレイ値及び新しいマッピング関数等を例えばインターネット上のサーバ上に保存してもよい。視聴者はその後、例えば、そのサーバからメタデータをダウンロードすることにより、"Artist_X new grade"でその映画を視聴することを選択できる(場合によってはあらゆる既存の境界及び/又はグレーディングメタデータをオーバーライドして)。このオプションは例えば映画の開始時にユーザインターフェイスを介して提供され得る。様々なグレイ識別値gTSは様々な意図された処理機能をともに指定することを可能にし、この構造は、例えば最終的なレンダリングデバイス比色的マッピング、又はデータの再グレーディング等の容易な再指定のためにパラメータ的に取り扱われ得る(Im_1コードを変更する必要がない)。例えば、gTS1とgTS3との間の全ての輝度にかけての単なる線型又は非線型ストレッチであり得る第1の処理戦略のためには、暗い輝度サブレンジにおいて3つのgTSコードは必要ないかもしれないが、より複雑なマッピング戦略では中間領域の第2のgTS指定が使用され得る。例えば、レンダリング側ディスプレイはgTS2とgTS3との間の輝度を良い視覚的コントラストを与えて処理するが、gTS2未満の値をほぼクリッピングすることを選ぶことができる。トランスコーダ又は同様の中間装置は、例えば、gTS1とgTS2との間の輝度は、オリジナルのキャプチャリングの情報を依然としていくらか保持するが、どのみちほとんどのディスプレイ上で視えづらい(すなわち、低いコーディング品質を要する)暗領域であるため、ソフトクリッピングを低い精度で適用してもよい。クリエーターはこのようにして撮像されたシーンに関する追加セマンティック情報、すなわち、画像のどの暗い部分の関連性が低いかを指定するためにgTS2を使用した。分離された構造は、ピクセルデータブロックにインターリーブされたメタデータより複雑であり得り、より自由に取り扱うことができる。
好適には、画像エンコーダ(549)は、領域識別グレイ値の第1のリザーブ値を出力画像信号(S(Im_1,MET(gTS))内に符号化し、第1のリザーブ値は、第1のリザーブ値によって識別可能な位置から画像の走査方向に沿って広がる、画像表現(Im_1)の少なくとも1つの幾何学領域に関して、所定のアルゴリズムに従って、画像表現(Im_1)内に符号化されたピクセル値から第2の画像表現(IM_RC_HDR)内のピクセル値への変換が実行されることを示す。
領域識別グレイ値の特別な値、例えば「0」又は「−1」等(明らかに[0,255]レンジ上の有効なルマではない)は、シーンの後続の領域が異なるやり方で処理されることを示す可能性がある。例えば、符号化において、デコーダは、画像信号内の大きく異なる部分(例えば、接続されたリムーバブルメモリの異なるセクター)を参照して、最終的な出力信号を得るためにその部分と相談してもよい(例えば、一部の画像は例えば異なる信号特性又は起源等の何らかの理由から何らかの2層技術に従って符号化されてもよい)。その場合、エンコーダは例えばその第2のメモリセクターのかかるブロックをローカルな位置に、例えばIm_1内に、場合によっては更なる変換を実行する前に、あるいは最終的なルマ値として、コピーしてもよい。画像を処理する場合、出力ルマは、部分的に、コンピュータグラフィックスレンダリングアルゴリズムを適用することにより取得されてもよい。又は、かかるコードは、局所的ピクセルルマ又はテクスチャー見かけを変更するために更なる画像変換を適用しなければならないことを示してもよい。(アルゴリズムを画像内の何らかの開始位置(x,y)すなわち識別可能な位置に連れて行く)走査経路に領域を指定する何らかの更なるメタデータが付加されていれば、領域は任意であり、例えば(x,y)からオフセットした位置から始まる又はそれを中心とする楕円でもよい。しかし、典型的には実施形態は好適にはブロックベースシステムで使用され、この場合、例えば連続的な16x16ピクセルブロック(の一部)が幾何学的領域である。
好適には、画像エンコーダ(549)は、領域識別グレイ値の第2のリザーブ値を出力画像信号内に符号化し、第2のリザーブ値は、少なくとも1つの連続する画像に関して、ディスプレイが、所定の値未満の最大出力輝度でレンダリングすべきことを示す。例えば、値255又は260が、画像の一部、又は複数の連続的な画像が電力を節約するために低減された輝度でレンダリングされるべきであることを示してもよい。
好適には、画像エンコーダ(549)は、ルママッピング決定ユニットを有し、ルママッピング決定ユニット(553)は、変換リンク規則を介して、第1及び第2の物体のうちの少なくとも1つのためにいくつかの異なるルママッピング(TOM)を決定するか、又は、処理指標(PROC_IND)を用いて、第1及び第2の物体のうちの少なくとも1つの物体のピクセルカラーを、第2の画像表現(IM_RC_HDR)の新しいカラー表現に変換するために、いくつかの異なるルママッピングが使用され得ることを示す。ここで、任意の画像表現として符号化されたシーンにおいて様々な関連する(異なる輝度の)物体を容易に識別できるので、それらを任意の望ましい方法で変換することも容易である。例えば、複数の異なる対象レンダリングディスプレイ、視聴環境の周囲照明、又はユーザ好み設定等に関して、例えば非常に明るい物体に複数の異なるカラー変換戦略を適用できる。例えば、高いピーク輝度を有する、すなわち、画像の明るいサブ領域をレンダリングするハイレベルの能力を有する一部のディスプレイは、第1のマッピング戦略によって規定される明領域に関して高コントラストの見かけを有する第1の戦略に近い又はによって呼び起される最終的なマッピングを使用する一方、より品質の低い低ピーク輝度ディスプレイは、かかる明領域のピクセルの少なくとも一部の輝度間距離に対して減衰効果を有する第2のマッピング戦略に厳密に又は大まかに従ってもよい。そして、これらの変換は(部分的に)画像信号とともに又は画像信号内に共符号化されてもよく、又は(部分的に)任意の(最終の又は中間の)受信側に任されてもよく、後者の場合、画像信号がどの種類の変換が望ましい又は逆に望ましくないか等を示す何らかの大まかな指標を含むとき、有用であり得る。後の利用に応じて、マッピングの1つ以上は、厳密に従われるべき変換、対照的な最終的なレンダリングディスプレイが何をすべきかの大まかな指標である変換を指定してもよい。前者のケースは、典型的には例えばマッピングが実際に何らかの正確なグレーディング(例えば、8ビットLDRコンテナ符号化からのマスターグレード等)を符号化する場合に発生し、後者のケースは、変換が、複数の種類のディスプレイのためにそのマスターピクセルデータが如何に更に最適化され得るかを示す更なる変換である場合に適用され得る。例えば、低ピーク輝度ディスプレイは(複数の重要なセマンティックgTS値間に指定され得る)ソフトクリッピング戦略の関数曲線を分析し、その後定められた視覚的見かけをほぼ維持する最終的なトーンマッピングを使用してもよい。
受信側において、エンコーダ側の大部分がミラーされた技術を構築してもよく、ハイダイナミックレンジシーンの符号化された画像表現(Im_1,MET)を復号するための画像デコーダ(605)であって、
−符号化された画像表現(Im_1)から、復号された画像(IM_INTRM)のピクセルのピクセルカラーを取得するピクセルテクスチャー復号ユニット(608)と、
−符号化された画像表現(Im_1,MET)から、領域識別グレイ値(gTS)を抽出するデフォーマッタ(607)と
を含む、画像デコーダ(605)であり得る。
この少なくとも1つの領域識別グレイ値gTSは、例えば所与のレンダリングディスプレイ及び環境のための最終的な最適カラーマッピングの決定等の更なる画像処理のために使用され得る。したがって、我々の方法は、例えばオリジナルのシーンにおいて人間の視聴者によって見えたであろう通りにディスプレイ視聴環境においてカラーをレンダリングすべきであることを目的とし得る、オリジナルのディスプレイ独立カラー符号化と最終的なディスプレイ依存カラー符号化との結びつけの好適な方法である。実際の画像符号化はそれとは大きく異なり得るが(我々は通常、それを何らかの現実的基準ディスプレイを基準として事前に符号化するが、これは依然として実際のレンダリング状況から大きく異なり得る;例えば、マスターHDR画像が比較的周囲が暗いホーム始業条件のために符号化され、そのホームテレビがその後最終的ないくらか明るい条件のために微調整する;しかし、複雑性のほとんどは既にマスターグレードにおいて1つ以上の現実的基準視聴ディスプレイを対象に実行されており、ディスプレイにはより単純な最終的カラー変換戦略しか残されていない)、通常はピクセル輝度の順序の逆転はないので、撮像された画像を更に特徴付け、容易なディスプレイ状況維持性を実現する好適な方法は、それをセマンティック的に輝度/ルマサブ部分に、特に、例えば画像の最も暗い又は最も明るい領域等、典型的には複数のディスプレイシナリオ上での見かけに関して重要且つ高度に可変であるサブ部分に分割することによる。かかるルマは、(場合によっては非連続な)ガンマ2.2等のガンママッピングの一般化である何らかの符号化マッピング戦略を介して実際の輝度(例えば、画像が基準ディスプレイ上に出力されるときの)に関連するため、ルマという単語は、例えばセグメント化等のあらゆる数学的演算を指定するために使用され得ることに留意されたい。
好適には、画像デコーダ(605)は、領域識別グレイ値(gTS)を使用して、復号された画像(IM_INTRM)において、低いルマのセグメントと高いルマのセグメントとを取得する、すなわち、領域識別グレイ値に基づいて画像理解分離を行い、後段の処理(例えば、最適化されたノイズ処理等)が、最終的に異なる態様でレンダリングされる(例えば、暗い部分でノイズがあまり視えないように)領域に対して異なる方法で実行されることを可能にする画像セグメント化ユニット(606)を含む。
好適には、画像デコーダ(605)は、ピクセルカラーの少なくともルマ値を変換する第1のカラー変換(PD_BLCK(i,j))を、低いルマのセグメント内のピクセルに適用し、ピクセルカラーの少なくともルマ値を変換する第2のカラー変換(PD_BLCK(i,j))を、高いルマのセグメント内のピクセルに適用する、ピクセルカラー変換ユニット(609)を含む。したがって、例えばより高いダイナミックレンジ(低い及び高い、並びにより低い及びより高いは、当業者によって互いを基準とすると理解されるであろう、例えば、画像ピクセルのカラー符号化が350ニットの基準ディスプレイ用である場合、それを2000ニットの基準ディスプレイを対象とする表現に変換することは、この第2の画像はオリジナルの画像より高い輝度用、又は言い換えればより高いダイナミックレンジ用であることを意味する)のディスプレイ上でレンダリングされる最適な駆動画像を決定することができる。かかる分離は、はるかに高い品質であると同時に単純な符号化を意味する。全画像を単一の戦略で符号化しなければならない場合、あらゆる種類の誤りを平均することにより、近似的な見かけに到達し得る(例えば、顔は明るくなければならないが、すると暗い地下の輝度が高くなりすぎてしまうので、顔を理想からいくらか暗くして、地下はほんのわずかに明るすぎる)。しかし、ここで、例えば地下を所望の通りに暗くして、顔を閾値及びアップデート戦略によって定義することにより顔を局所的に補正することができる。また、この部分的定義はマッピングの一部だけを変更することを容易にする。例えば、地下のシーンのショットの複数の画像を通して、光の変化及び/又はカメラの動きのため、そのシーン全体に関してPM_BLCK(i,j)は適切であり続け得るが、ショットの後続する画像に進むにつれ暗い部分のキャプチャリング(又は必要な見かけ)が変化し得る。この場合、例えばショットの5つ目の画像の後、その暗い角部がそこからいくらか明るくなり、適切に対抗する暗化マッピング戦略を必要とすることに応じて、異なるPD_BLCK(i,j)関数をロードしてもよい(当然ながら、テクスチャー的可視性等も操作するために適切なPD_BLCK(i,j)の関数形状を使用して)。
好適には、画像デコーダ(605)は、デフォーマッタ(607)が、例えば0又は255の値等のリザーブ値の領域識別グレイ値(gTS)を抽出する場合、第1及び第2の物体の少なくとも1つの物体のピクセルカラーに特定のカラー変換戦略を適用する。上記と同様に、入力信号内のどこかで検出された場合、これらのリザーブ値は任意のフォールバック処理戦略に直ちに戻るために使用され得る。典型的には、適用するフォールバックが何であるかに関する更なる詳細が入手可能になる(受信側は例えば画像解析に基づいて単に自身で何でも実行できるので、必須ではない)。例えば、画像信号がメモリ上に記憶されて来る場合、一連のフォールバック戦略(例えば、画像処理方法を定めるアルゴリズムコード及び要求されるデータ)のセクターが存在し得り、この場合、特別なフォールバックリザーブコードが検出される度に、受信画像処理装置は次のフォールバック方法にジャンプしてそれを適用する。又は、コードは適用すべきフォールバックを指してもよく(場合よっては何回も)、例えば260は第1の記憶されたアルゴリズムが使用されるべきことを示し、261が第2の記憶されたアルゴリズム等である。
好適には、画像デコーダ(605)は、符号化された画像表現(Im_1,METのデータのいずれとも関連付けられていないメモリソースからピクセルカラー変換戦略を選択する変換決定ユニット(610)を含む。このような態様において、受信側デコーダはピクセルルマを変換するために何を使用するかを判断するために更なる汎用性を有する。例えば、自身のメモリから関数を取り出して、例えば識別された物体の特性、例えば平均ルマ等に応じて決断し得る。又は、ネットワーク接続を介して関数を取り出してもよく、場合によってはサーバによりランタイムで決定される。信号が、例えば(任意の)暗くするマッピング(すなわち、視覚的結果として物体が何らかの方法でより暗く見えるようになるという結果を有する変換、例えば、コントラスト変調に結び付けられた平均輝度、及び/又は、非常に暗い物体内の例えば黒色ピクセルにクリッピングされる領域の拡大等)を適用することが望ましいことを指定することにより、依然としてこれを部分的にガイドしてもよく、この場合、レンダリング側は好ましくは非常に暗い物体を明るくするマッピングを適用すべきではない(当然ではあるが、周囲照明等による可視性を考慮して)。最終的には受信側が、視聴者の特定の制御下で又はそうでなく、この所望の共符号化ガイドラインに(部分的に)従うか、又はそれらを無視して反対するか当然に判断し得る。しかし、典型的には、画像符号化(例えば、それが符号化されたディスク)は例えば変換がそのように無視又は緩和さえされず、厳密に従うべきことを、又は反対に従ってはならないことを定め得る。
典型的には、画像デコーダ(605)において、変換決定ユニット(610)は、ディスプレイの特徴、周囲照明のレベル、カメラが見るディスプレイの画面前面で反射するカラーパターン等のレンダリング環境の少なくとも1つのパラメータに基づいてピクセルカラー変換戦略を決定する。したがって、上記と同様に、受信側装置は受信側でのみ明確に入手可能である重要な情報に基づいて少なくとも部分的にマッピングを最適化できる。コンテンツクリエーターは、マッピングが仮定のあるディスプレイ及び視聴環境下(例えば、ほとんどのリビングルームの照明が消灯され、現実では例えば視聴者が床上に又は視聴者のそばにリビングカラー照明を有することにより近似的に実際に実現され得るいくらかの周囲光のみしかない)で使用されるべきことを指定してもよいが、最終的にはレンダリング側が、微調整であるとしても(理想的なケース)、それらを変更し得る。それほどの精度は通常必要ないが、コンテンツクリエーターは例えばPD_BLCK(i+2,j)がディスプレイのまわりに例えば1ニットの輝度が存在するケースを対象としたことを信号内に指定し得り、この場合、レンダリングディスプレイが2ニットを測定するとき、PD_BLCK(i+2,j)の傾きをわずかに変更するよう決定してもよい。いずれにせよ、これは受信側における処理アルゴリズムにとって有用な情報であり得る。
説明される実施形態は多様な態様で実現され得り、例えば、ハイダイナミックレンジシーンの画像を符号化するための画像符号化方法であって、
−Nビットのコードワードを含む画像表現(Im_1)によって画像のピクセルカラーを符号化するステップと、
−領域識別グレイ値(gTS)を決定及び出力するステップであって、ルマ値である領域識別グレイ値(gTS)は、領域識別グレイ値未満において、画像の少なくとも1つのブロック内の第1の物体の全てのピクセルのルマを画定し、領域識別グレイ値より上において、画像の少なくとも1つのブロック内の第2の物体の全てのピクセルのルマを画定する、ステップと、
−画像表現(Im_1)及び領域識別グレイ値(gTS)を出力画像信号(S(Im_1,MET(gTS))内に共符号化するステップと
を含む、方法によって実現され得る。
又は、ハイダイナミックレンジシーンの符号化された画像表現(Im_1,MET)を復号するための画像復号方法であって、
−符号化された画像表現(Im_1)から、復号された画像(IM_INTRM)のピクセルのピクセルカラーを取得するステップと、
−符号化された画像表現(Im_1,MET)から、領域識別グレイ値(gTS)を抽出するステップと
を含む、方法によって実現され得る。
又は、教示される実施形態に対応する方法のいずれかを実行するための処理を実現可能にするソフトウェアコードを含むコンピュータプログラムにより実現され得り、かかるソフトウェアは、例えば、ディスク等の有体の製品上で購入されてもよいし、ネットワーク等を介してダウンロードされてもよい。
典型的には、撮像されたシーンに関する符号化された知識は1つの位置/装置から他の位置/装置に移動する(それらが同じ消費者装置内のユニットであろうと、例えばHDMI(登録商標)を介して接続された画像受信若しくは処理ボックス及びテレビ又はディスプレイ等の同じ場所におけるシステムの接続された複数の装置、又は異なる国にある装置上で動作するサービスであろうと)、つまり、領域の色の輝度を少なくとも符号化するN−ビットのコードワード、及び領域識別グレイ値(gTS)を含むハイダイナミックレンジシーンの領域のカラーを符号化する画像信号により(領域識別グレイ値(gTS)は、領域のカラーの輝度を少なくとも符号化するNビットのコードワードを符号化するためにコードシステムで、ハイダイナミックレンジシーンにおける高輝度のピクセルの少なくとも1つの幾何学的領域、又はそれらを符号化するN−ビットコードのより高い値と、ハイダイナミックレンジシーンにおける低輝度のピクセルの少なくとも1つの幾何学的領域、又はそれらを符号化するN−ビットコードワードのより低い値との間の境界で示す)。コードシステムは、典型的にはある軸上で定められるルマと呼ばれる物理量を通じて、そして典型的には軸の範囲をカバーするデジタルコードワード(例えば、00000000〜11111111)又は0.0〜1.0の小数、及び輝度を非線型でルマにマッピングする割り当て関数(典型的にはガンマ関数)を用いて、(カメラ取り込みによる)シーン輝度からの派生物及び最終的にレンダリングされるべき輝度を定める技術的−数学的表現である。典型的には、コードシステムに関連付けられた更なる情報が存在してもよく、例えば、最大コード値が対応するレンダリングされるべきピーク輝度等である。この信号について論じるとき、指定される特性が信号内に何らかの態様で含まれることを意味するが、如何なる変換された態様で含まれてもよい。例えば、一部のデータはマージ又は分割されてもよいし、任意の態様で構造化されてもよい。他のコードへの変換、例えば変調、又は潜在的なビットエラーダメージを補償するための冗長符号化等が存在してもよい。
HDR画像は、例えばかかる信号を記憶するBlu−ray(登録商標)ディスク等のリムーバルメモリ等のメモリ上に符号化されてもよい(例えば、LDRコンテナと呼ばれるLDR8ビットテクスチャー画像Im_1、及び、少なくとも1つの全体的トーンマッピングによりそれをマスターHDRグレードの再構築にマッピングするためのメタデータとして)。
実際には、本発明の実施形態は多くの技術的具現化、シナリオ、又は使用において利用され得り、例えば、開示の任意の実施形態の任意の画像エンコーダ、画像デコーダ、方法、画像信号、又は他の生産物若しくは実装形態を使用する任意のネットワーク技術を介するビデオ配信システム、又はそのビデオ配信システムの任意の使用等において利用され得る。
下記で説明される実施形態の多くの更なる変形例が当然ながら可能であり、当業者は、それらが例えば世界の異なる装置において異なる幾何学的領域で、それらの部分的機能性を異なる時点で、又は互いに数回適用して、様々なビジネス使用シナリオ等において実現され得ることを理解する。
本発明に係る方法及び装置の上記及び他の側面が、下記で説明される実装形態及び実施形態、及び添付の図面と関連して説明され、明らかになるであろう。図面は、単により一般的な概念を例示する非限定的な具体例であり、点線はオプションの構成要素を示すために用いられるが、実線の構成要素は必ずしも不可欠ではない。また、点線は、不可欠であると説明されるが、物体の内側に隠されている要素、又は例えば物体/領域の選択肢等の無体物(及びそれらが如何にディスプレイ上に示され得るか)を示すためにも使用され得る。
図1は、ハイダイナミックレンジのオリジナルシーンを、それらが異なるシナリオでレンダリングされる場合の、様々な表現を概略的に示し、図1aは、現在のハイダイナミックレンジディスプレイ、映画館表示、ローダイナミックレンジディスプレイ、及び屋外で使用される携帯型ディスプレイのそれぞれと比較される絶対的レンダリング出力輝度を示している。 図1は、ハイダイナミックレンジのオリジナルシーンを、それらが異なるシナリオでレンダリングされる場合の、様々な表現を概略的に示し、図1bは、共通の見かけ軸上でレンダリングを示し、この絶対基準システムは標準的な人間の視聴者によって定められる。 図2aは、シーン上の同じ画像ビューを定める2つのカラー表現間の変換のための様々なサブカラー変換が如何に、画像表現のブロック分解の複数のブロック内に含まれる大きく異なる輝度(又は照度)の様々な物体のピクセルの少なくともルマに適用されるかを概略的に示す。 図2bは、シーン上の同じ画像ビューを定める2つのカラー表現間の変換のための様々なサブカラー変換が如何に、画像表現のブロック分解の複数のブロック内に含まれる大きく異なる輝度(又は照度)の様々な物体のピクセルの少なくともルマに適用されるかを概略的に示す。 図3は、一部の実施形態に係る何らかの追加メタデータを特定の画像信号定義に符号化する方法を、特に、領域識別グレイ値をそれらが適用可能なピクセルカラーブロックの前に如何に符号化するかを概略的に示す。 図4は、受信側が領域識別グレイ値に基づいて、大きく異なる輝度又は照度の区画を如何に取得し得るかを概略的に示す。 図5は、本発明の教示に対応するエンコーダの例示的な具現化としての、カラーグレーダーによって操作され得る符号化側システムを概略的に示す。 図6は、例えば、メインテレビ及び携帯型画像ビューア等の装置、並びに、異なるディスプレイのための全てのビデオの配信及び最適な処理を管理する中央コンピュータ等の画像処理装置を含む消費者ホームディスプレイシステムであり得る復号側システムを概略的に示す。 図7は、輝度(又はルマ)レンジがマッピングされる領域の設計が如何にして圧縮エラー等の問題を緩和するために好適に選択され得るかを概略的に示す。 図8は、ピクセル又は物体カラーが、大きく異なる技術的特徴を有する複数のディスプレイのために最適な色にマッピングされなければならないシナリオにおいて我々のシステムが如何に使用され得るかを概略的に示す。
図1(すなわち、図1a及び図1b)は、4つの種類のディスプレイ(3つの典型的なディスプレイ及び要点をより良く説明するための仮想ディスプレイ、すなわち狭いレンジの再現可能出力輝度R_ERDR_OUTSしか有さない、陽により良く照らされる低コントラストの電子ブックリーダー)上にオリジナルのHDRシーン(Orig_SCN)が如何に最適に表され得るか、及び画像コーティング技術がそのために如何に適合すべきかを概略的に示す。シーンの最終的なレンダリングに関する概念(すなわち、特定のディスプレイによって物理的に出力される輝度)を画像物体ルマのコーディングの概念から概念的に分ける必要があることを強調する。これは、上記2つの対応する色空間を常に同等視し、よって例えばガンマ2.2符号化信号を(標準)ディスプレイに直接適用することができ、(ほぼ)正しい(較正的な態様でスタジオ側で決定された)レンダリング出力を与え得るMPEG2等の古典的なテレビ撮像技術とは異なる技術的哲学である。これは閉じたチェーンを有する場合、すなわち、特定のシナリオのために較正される場合にのみ有用であり、他のコンテンツ、特にハイダイナミックレンジ(HDR)画像等並びに/又は信号をレンダリングするために本質的に異なる特徴を有する多様なディスプレイ及び/若しくは視聴環境を望む場合は成立しない。しかし、各シナリオ用の異なる符号化画像(再パッケージング(例えばトランスコード、更なるカラー変換等)されて異なる技術的チャネルを介して伝送され得るが)、1つ(又は少なくとも少数)の画像コーディング信号のみを有する単純性がやはり同様に好まれ得り、さもなければハリウッド又は他のグレーダーは以前のように1つ又は2つのグレーディング(例えば、マスター映画グレード及びDVDグレード)の代わりに例えば20のグレーディングを行わなければならないことを意味する。
HDR画像又はHDR撮像技術の定義は議論を呼び得る。例えば、ある白色(例えば500ニット)のために最大ワード長(例えば2^8対2^10)が使用される場合、違いはほとんど又は部分的に精度の1つでしかないので、当然ながら基準は単純にビット数ではない(実際には、公称コントラスト比が1,000,000:1のディスプレイはこれらのコードの最も低い部分を識別可能にレンダリングさえしない可能性があり、ディスプレイが黒色に何らかの印象的な黒色処理変換を行わない限り、ガンマ2.2信号符号化内にかかる深い黒色を符号化することもできない)。
ハイダイナミックレンジシーンの一般的な定義は最大輝度割る最小輝度である。これはハードウェアの観点から、例えばレンダリングディスプレイにとって良い定義であり得る。
例えば、オリジナルのシーンにおいて、この定義はカメラ撮像センサの能力が何であるべきかを、例えばセンサが複数の露光技術によって動作する場合にも決定する。忠実に記録できないものは全て白色又は黒色にクリッピングされるからである(当然ながら丸め及びノイズも存在する)。また、ディスプレイ生成光のガラスフロントプレート上での散乱及び環境からの反射(例えば、テレビの前の視聴者の白いTシャツ)を含め、レンダリングが適正に行われることを当然に前提とするが、ディスプレイが物理的に何をレンダリングできるかを示す良い方法でもある。あらゆる種類の光散乱及び反射が、実際に取り込まれた又は視聴されるダイナミックレンジがしばしば公称の数値より低い原因であり、シーンの明るいスポットから暗いスポットにあらゆる種類の経路を通り光が漏れるため(シーンの照明中、シーンを注意深く構築して影の領域を管理しない限り)、カメラ内の偽の経路(例えば、レンズの曇り又は内部反射(body reflections))、又は視聴者自身の目に至るまでの視聴環境の問題(例えば、ディスプレイのフロントプレートにおける表示又は周囲光散乱、又は光ホモジナイザーに入るディスプレイ内の反射等)(しかし、視聴者の視野内に強い光源が、特に暗領域の近くにあるとき視聴者は暗部の識別精度を失うおそれがあるが、ディスプレイは理想的には視聴者より優れている必要がある可能性があり、そして受信側が如何に画像符号化を処理して画像領域の可視性に影響を与えるかは事前に知ることはできないので、少なくとも画像符号化はより優れているべきであり、よってこの要素は無視できる)のため等である。よって、かかるコントラスト比の定義を使用する場合、最小レベルとして(ノイズ等を前提として)最終的に実際に目が識別可能なレベルを使用すべきであり、光がゼロであるという状況は決してないので、例えばオフのLEDが与える(ほぼ)ゼロ出力輝度の理論値を使用すべきではない(このため、規格はより適正なコントラスト比を測定するために例えばチェッカーボードパターンを課す)。
しかし、輝度比はHDR画像のコーディングにとってあまり良いダイナミックレンジ基準ではない。何がコーディングされる必要があるのかということは何がレンダリング可能かにとってあまり重要ではなく、重要なのはシーン内に何が存在して、何が少なくとも理論的に知覚できるかである。すなわち、所望の見かけを、画像をレンダリングすることが予測される全ての表示環境において、場合によっては遠い未来のより優れた(例えば、目に直接光を差し込む)ディスプレイ上でさえ再現可能にするために正に又は大体必要なデータを画像信号が含まなければならない。
例えば、単にコントラスト比を指定する場合、映画館のような暗い環境において視覚系が画像内に現れる同じシーンを見るのにより多くのコントラストを必要とすることは考慮されない(一方、最小値及び最大値への純粋な乗算スケーリングは同じコントラスト比を生じるだけである)。比較的明るい物体は、より明るい物体によって囲まれた場合はるかに暗く認識され得るので、コントラストは実際には局所的な現象でもある(空間コントラスト)。実際には、視聴者は心理的に画像の分析を始め、自身が黒色、白色、白色以上等と考える色を識別する。そして、より暗い黒色又はより明るい白色を認識するまで、視聴者は何かが黒色又は白色であると考え得る。したがって、画像が如何に「ダイナミック」に見えるかということは、シーン内の「黒色」及び「白色」にのみ関するものでなく、グレイ値の割り当てに基づいて定めることができる他のより局所的なコントラスト尺度にも関する(例えば、テクスチャー内の異なるグレイの輝度差を増加することによって異なる見かけを作成したり(例えば岩肌のテクスチャーをよりゴツゴツさせる)、影を暗くしたり、又は鮮明度とコントラストとの間の相関関係を利用することさえできる)。よって、例えば顔に異なる様相(より滑らか、より明暗がくっきりした、よりしわが多い等)を与えたい場合、顔のテクスチャーを定めるコードがかかる作業を許容しなければならないことが想像され得るであろう。すなわち、例えば顔のテクスチャーを定めるグレイ値が2つしかない場合、顔のコントラストを変更するのは非常に難しい作業であろう。このような顔のカラーの斑さは、いくつかの現在の画像符号化技術の問題の1つであり得る。
問題をより明確にするために例を示すと、コーディングの観点から、ダイナミックレンジは単に最も暗い黒色及び最も明るい白色についてだけでなく、撮像されたシーン内に何が実際に含まれるかに関し、黒色及び白色の描画(すなわち、2つの異なるグレイ値のみを有する)が5000ニット白色及び0.5ニット黒色によって(すなわち、高輝度ダイナミックレンジで)HDRディスプレイ上にレンダリングされ得るが、本当にこれをHDR画像と呼ぶべきであろうか。そもそも、ディスプレイの最大白色(ピーク白色)、黒色特徴を用いてそのように簡単な信号の表示をすることが望ましいのか等、更なる問題を投げかけることもできる。それらの値をそのように(例えば、単に例えばコード0及び2ではなく0及び10000を用いて)直接符号化する必要があるのかは言うまでもなく、それは不自然又は少なくとも不必要ではないだろうか。実際に、例えば白色領域をグレーディングする場合、一般的に生じ得る1つの見かけ上のアーティファクトは、テクスチャリングされた白色領域が、領域が有するべき実際の物理的テクスチャーとは異なるチョーク状に(チョークを使用して描かれたかのように)見え始めることである。我々は再び、「黒色」及び「白色」とは何かという問題にぶつかる。実際に、例えば黒色及び白色の描画を仮定すると、白色は陽が良く射す照光下では5000ニットの実際のシーン輝度を有し得るが、異なる照光下ではわずか50ニットでもあり得る。そして、黒色をシーン照光から厳しく遮蔽しない限り、黒色領域は通常白色の約1%程度であり、1/10000ではない。したがって、より高いコントラストでレンダリングされる画像がいくらか好ましい見かけを有し得ることを無視して、例えばその陽によって照らされた描画の見かけを作成するためには、HDRディスプレイの高輝度サブレンジ上で、高輝度ではあるが約100:1の輝度レンジを使用してその黒色及び白色を示すことがおそらく望ましいであろう。いずれにせよ、そうでなければレンダリングされる画像に違和感がなくても、目がレンダリング輝度のいくらかの違いを考慮するおそれがあるので、画像にコンテンツとして何が含まれるかに基づいて、一時的な効果、前及び後続の画像さえ考慮して、グレーダーが利用可能なディスプレイダイナミックレンジを最適に使用することが常に望ましい。また、霧がかった画像は慣習的にローダイナミックレンジとして考えられてきたが、更に明るい光線を含むそのような画像は、少なくとも、ディスプレイのレンダリング可能カラーの輝度軸の高い部分領域にマッピングされる必要があろうことも述べる。
我々のコーディングの哲学は、符号化が上記の要素両方を考慮に含めなければならないというものであり、すなわち、一方では画像が典型的には最終的に如何にダイナミックにレンダリングされるか、他方では、撮像されたシーンがどんな種類の大なり小なり明るい物体を含んでいたかということを考慮しなければならない。よって、発明者の目的(特に画像表現又はコーディング)のためには、HDR画像は照度見かけ軸に沿う十分に遠く離れた複数のレンジに沿う十分な量のグレイ値を含む画像であると言うのがより正確であろう(照度は心理物理的な量であり、輝度又はコーディングされたルマと混同されるべきではない)。よって、図1とともに説明されるように、「入れ子にされた見かけレンジ」を用いることにより、HDR画像の物理と要求される技術的具現化をより良く説明できる。
図1には、多数の暗及び明輝度を同時に有する取り込まれるべきシーン(Orig_SCN)、すなわち、暗く及び明るく照らされる領域の両方の輝度レンジにかけての重要なテクスチャー詳細が示されている。明るい領域/物体(BR_obj)に関しては、正確に符号化及びレンダリングされるべききれいな色を多く有するステンドグラスがある。建物の暗い内部には、暗い木造の階段(DRK_obj)、及び更に暗い物体(VDRK_obj)がある。つまり、このオリジナルのシーンに立つ人間は、ステンドグラス窓内に多数の明輝度(及び実際には色)を見て、階段上の様々な影の領域内に多様な暗輝度を見る。顔を違う方向に向けると、観察者の網膜及び脳処理はステンドグラス窓の見かけに適合するか、又は反対に暗領域内の暗く見える物体を識別しようとする。あらゆるものが如何に暗く見えるかは、当然ながらシーン構築者が如何に適切に明領域から暗領域を隔離したかに依存するが、例えば、非常に日差しが強い日に舗道上の小さなマンホールの中を見ようとする例が想像され得る。つまり、「暗」領域は暗い灰色の見かけから、識別不能な究極の黒色(又は夜間の識別不能なより灰色がかった黒色)までばらつき得る。我々はレンダリングディスプレイ上で、所与の能力を条件に、少なくとも幾分か類似する体験(例えば、少なくとも適度に黒色がかって見えるよう十分に低い輝度を有する識別不能な暗い色)を作成しようとする、すなわち、輝度サブレンジ毎の多数の出力輝度が全物体の物体テクスチャを良好な可視品質で明るく及び暗くレンダリングする一方、ステンドグラス窓が平均より著しく明るく見え(ディスプレイの具体的なダイナミックレンジに基づいて、高輝度ディスプレイにおける実際の測定光度の大きな差に対して、これはどちらかと言えば心理視覚的な「錯覚的」効果を用いる擬態(シミュレーション)であり得る)、階段が平均より暗く見えるべきである(平均は、例えば照らされた部屋周囲の18%グレイレベル)という両方のバランスを取ることが望ましい。ディスプレイが如何にこれを最適に行うかとは無関係に、画像符号化は少なくとも全ての情報を、好ましくは容易に管理可能な態様で保持すべきである。
ここで、ある者がこのシーンを単一のデータ信号によって取り込み符号化し得る(例えば、0〜1023及び入力又は出力輝度をコードにマッピングするための固定ガンマ関数;すなわち、例えばガンマ関数が出力輝度を定める場合、基準ディスプレイ上では正確な再現がなされ、例えば2000ニットディスプレイがその見かけを近似するよう、まず取り込まれた画像を基準Nニットの、例えば16ビットディスプレイに変換して(線型等、例えばピーク輝度4000ニットの)、その後これらの「新しいシーン値」を例えば10ビット表現に符号化してもよい)。又は、異なるシナリオのために様々な符号化された信号を最適化してもよく、例えば、人間の視覚系の暗環境挙動を補償するよう、映画館の信号に異なるガンマ関数を適用してもよい。しかし、理想的には、(人間の視野の高度に局所的且つ非線形な挙動に照らして非常に複雑であり得る)主要な処理の大部分が符号化された1つ以上のグレーディングされた画像内に既に存在すべきである((マスターHDRグレーディングからそれを形成するのに使用されたカラーマッピングを符号化する共符号化メタデータを使用して、そのマッピング戦略を逆転することにより、LDR符号化グレーディング(例えば、古典的に符号化されたMPEG−AVC画像)からマスターHDR画像を再取得することを可能にする原理を有する)LDRコンテナ概念を使用することにより、単純なHDR画像符号化において、HDRマスターグレーディング内にLDRグレーディングが同時に符号化されている;しかし当然ながら、画像符号化は、複数のマッピング関数又は少なくとも一部の更なるピクセル画像とともに複数のグレーディングを含み得る)、すなわち、複数の典型的な表示シナリオのために見かけが既におおよそ正確に決定されている。その場合、実際の表示最適化は比較的単純な作業によりおおよそ適正な最終的な見かけを形成し、例えば暗い周囲における視聴のためにコントラストを上げる最終の単純なガンマ関数等である。
いずれにせよ、最終的な見かけは図1bに示されるようになり、光度測定により測定可能な出力輝度は図1aに示されるようになる。第1のシナリオは、信号がHDRディスプレイ上に示される場合である(上述したように、多くとも最小限の処理(例えば、LCDバルブ物理のための追加の補償によるCRT状の挙動の模倣等の何らかの真にハードウェア的な詳細)を伴う、そのHDRディスプレイを駆動するために直接使用可能な独自の最適化されたHDRグレード、又は単一の符号化HDR画像/ビデオ信号から導出される駆動信号によって)。このディスプレイの能力は、ピーク輝度(白色)が5000ニットであり、最小出力輝度が0.5ニットである。下限値はいくつかの周囲パラメータによって大きく変動するため、平均近似値であることに留意されたい。管理された環境下にあってさえ、映画館の保安灯からスクリーンに光が漏れ、また人々が携帯電話の電源を入れるという予測不能な要因も同様である(概して影響は限られるが、特に最も暗い輝度においては、レンダリングに影響を及ぼし得る)。通常の家の中では、照光状況は非常に多様であり得る。
依然として問題となるのは、人が如何にかかる輝度を知覚するかであり、なぜなら、これは視覚系の依存し、彼が時に窓の外側を見ることができるか等、特に室内照明によって決定される。視聴者は、自身のリモコン上で画像設定を変更することによりこの側面を制御し得る。いずれにせよ、HDRディスプレイはステンドグラス窓をレンダリングするために利用可能な比較的大きな輝度値のサブレンジを有する(つまり、それはレンジR_D_HDRの上部をカバーするよう比較的大きく示されている)。同時に、階段は十分に暗く、すなわち50ニットから十分に低く示され得る。我々の例において、これらの階段はともに平均照度(例えば、18%グレイ)の視覚的推定に対して暗く見えるが、同時に、ディスプレイのフロントガラスの周囲照明反射を介してテクスチャーの詳細が依然として非常に容易に見えるという心理視覚的な効果を有すると仮定される(例えば、視聴者が映画視聴レベルまで周囲照明レベルを減光し、平均グレイがほとんどテレビ及びその画像コンテンツ自体によって決定されるシナリオ)。このHDRディスプレイ(+視聴環境)は、非常に暗い物体をなお暗いディスプレイ出力輝度及び対応する心理視覚的照度で表すことさえできる程に優れている。
今、映画館において同じ信号をデジタルシネマプロジェクタ上に表示する場合(上述と同様に、最適にガンマ補正済みであろうとなかろうと)、この映画館レンダリングが約50ニットを超える白色を表示せず、一方で暗い環境であるため、少なくとも暗い場面は例えば0.05ニット程度、すなわち、家の部屋のHDRディスプレイのレンダリングよりはるかに暗い輝度を表示できることを知っている。つまり、シネマ出力輝度レンジR_CINは0.05〜50ニットの範囲内である。視聴者が暗いシネマルームに適合し、より低い出力輝度を(近)白色として見るため、R_CIN内の高輝度のより小さいサブレンジを割り当てられるステンドグラス窓が、ほぼ同じ出力輝度を有するHDRディスプレイ上の階段と等しく暗く見えるとは言えない。つまり、映画館においても、少なくとも画像内に比較的大きいダイナミックレンジを有することができる(ポジフィルム又はデジタル信号上に符号化されない場合、マスターネガ上に符号化され得る)。特に、養殖的に確立される昼間風又は夜間風の色を利用する等の心理視覚的擬態の一部に関して、シネマ視聴者は、暗い地下のシーンの後に人が陽のもとに踏み入るという解決策を依然として有する(HDRディスプレイ上でより印象的でないにせよ)。
人間の視覚系が適合することは、照度見かけ軸(Appear_SCAL)上に様々なレンダリング出力画像が配置された図1bの心理的見かけ表現においてより良く見ることができる。これは実際には脳が(その全ての複雑な処理によって)見るものであるが、網膜錐体が如何に挙動するか(又は少なくとも神経節細胞接続と共に)に概ね対応付けることができる。いずれにせよ、我々の技術的哲学では、その複雑性は人間のグレーダーによって処理でき、コンテンツクリエーターは自身のコンテンツの見かけを管理したがるものなので、常にかくあるべきである。実際に、家の部屋のHDRディスプレイ(DISPL_HDR)上でのレンダリングと映画館レンダリング(MOV_THTR)はかなり類似に見える(少なくとも比較的暗い環境及び明るい外部は模擬できる)。しかし、映画館レンダリングは非常に明るい領域を、少なくとも一切の色変形なく正確に示すことはできない(見かけ軸の非常に明るい領域から明るい領域に移動するステンドグラスのいくらかより暗いピクトグラムによって示される)。この効果は、映画館対家のHDRディスプレイでの別々のレンダリングにもよることを強調する。映画館においてHDR上で同時にレンダリングすると、比較は再び異なるものになる(今度は比較的薄暗い投影スクリーン上の明領域がHDRディスプレイ上の明領域と直接比較できるので)。しかし、比較的深い暗がりにあるため、映画館レンダリングは非常に暗いシーン、例えば太陽が水平線に向かって徐々に昇り始める夜のシーン等を模擬できる。眩しい陽が射すリビングルームに座っている者はこの見かけを決して得ることができない。明るい領域も存在する環境(例えば、共に配置された明るく輝くHDRディスプレイ)では、完全に暗い夜のシーンの視覚的「イリュージョン」が多かれ少なかれ破壊される。ディスプレイ上でレンダリングされる暗色がフロントガラスの反射輝度を下回ることを無視したとしても、環境から広角で目に入るあらゆる光の色がイリュージョンを破壊する(電子ブックリーダーの例によってより良く説明される)。当然ながら、原理的に、家では安全性は問題ではないので、人は自身のリビングルームを映画館よりはるかに暗くでき、つまりHDRディスプレイも深い黒色に関して高い能力を有するが、家に居る人は通常いくらかのレベルの心地よい周囲照明を欲するものである(いずれにせよ、あらゆるレンダリング状況に対応する符号化画像は、真っ暗のリビングルームにおいて最も怖い態様でホラー映画を見ることを好む人によって容易に最適化されることも可能であり、つまり、画像の最も暗い領域は、十分な精度及び比色的最適化処理のための容易利用性の両方を有するよう符号化されなければならない)。また、非常に暗い環境では、人の視覚系によって見られるシーンコントラストは著しく損なわれ得り(すなわち、人がオリジナルのシーンを見るように)、よって、最も暗い物体を真っ暗から数ストップ上の暗灰色によって、白色の物体を白色基準ゾーンの照度の数ストップ下の明るい灰色によってレンダリングすることによりそれらを模擬しなければならない場合がある(例えば、その効果がそれほど強くない映画館において)。
したがって、可能性がある各ディスプレイ上で正確にレンダリングされ得ない領域が存在するが、それらをレンダリング可能なディスプレイが存在し得る又は存在するので(例えば、ブライトニング後であっても)、依然としてかかる領域の符号化が望まれ、この例はシネマの非常に暗い領域、及び一部のHDRディスプレイの非常に明るい領域を与える。人間の視覚系の極めて暗い領域は、人間の高レベルの視覚適応により、低域のどこかで終わり得り、例えば、遠方の亀裂からいくらかの光が漏れる非常に薄暗く照らされる洞穴を符号化する場合等である。しかし、画像/ビデオコンテンツの明るい部分は視覚系が最適に適応することを許さないので、(理論上)最も暗い映画館においてでさえかかるレベルは表示に無関係である(洞穴で洞穴の映画を観る者はいない)。しかし、目がノイズ又はぼやけを見始めるレベル、例えば日向に居た後に暗い部屋に入る場合等のレベルと等しくされてもよい。明るい側の正に目もくらむばかりの光のように、新たなレベルの視覚的品質を伝えるため、かかる視覚的体験はレンダリング望まれ得るものである。つまり、これは(ただ)視えるものと視えないものとのバランスを取るレジームである。しかし要点は、暗環境レンダリングは、極めて暗い領域が開始する見かけ軸の暗い領域以下で非常に暗い物体をレンダリングできるため、暗環境レンダリングは非常に暗い物体をより良好に示すことができるということである。
第3のディスプレイはLDRホームディスプレイ(DISPL_LDR rendering)、例えば当時のピーク輝度300ニットを有する「クラシックな」テレビである(説明のために、例えばピーク輝度100ニットのより古いディスプレイと比較的同様な挙動をするとみなす)。かかるディスプレイがいくらか浅い黒色を示すことができると仮定する(当然ながら、黒色においてはHDRディスプレイと同様であり得るが、説明を目的として、例えば2DのLED調光ではなく全体的調光を有するとする)。また、低いピーク輝度に照らして、明輝度及び中間輝度のためにLDRレンジR_D_LDRのより大きなサブレンジを確保しなければならないため、より少ない暗色をレンダリングする可能性があり、よって階段及び非常に暗い物体の両方を少なくとも視覚的にほぼ同じ暗灰色でレンダリングし得る。実際に、階段のためにはわずかな輝度レベルしか確保せず、より曖昧にテクスチャリングすることになり、非常に暗い物体は典型的には黒色にクリッピングされる(場合によっては階段の黒色にクリッピングされた部分と識別できない可能性さえある)。LDRディスプレイの他の典型的な特性は、非常に明るい物体を忠実にレンダリングできず、典型的にはそれらを非常に小さな(近)白色レンジに(ソフト)クリッピングすることであり、かかる全ては特に中間グレイ付近の中間レンジに如何なるコントラストを欲するかに依存する。クリッピング及び近似戦略は、脳が何か特別なことが起こっていると認識するため、強い心理視覚的効果を有する可能性がある。
したがって、我々はレンダリングは実際にはシーンの(人間の視覚適応により調整された)輝度(すなわち、実際には人間の視覚系の対応する照度及び輝度)の、対応するディスプレイレンダリング可能輝度レンジの様々なサブレンジへの割り当てであると考える。一部のディスプレイは全レンジ内で(少なくとも一方の側から)入れ子にされた全レンジのサブ部分しかレンダリングできず、一部のディスプレイはほぼ全ての見かけを比較的忠実にレンダリングできる。つまり、出力輝度又は実際のディスプレイ駆動画像値(すなわち、例えばLCDバルブ駆動及びいくらかのバックライト駆動のための)にマッピングする際、何らかの近似を行わなければならず、シーン物体又は領域の正確な見かけをわずかに変化させ、依然として適度に類似する、納得又は少なくとも許容できる見かけにする。屋外の日向における電子ブックリーダーの例は、歪みに関して強調するために選択した。ここで、大きなレンジのシーン輝度を単一のレンダリング可能輝度値(電子ブックリーダーの輝度レンジE_ERDR_OUTSは非常に小さい)上にほぼ押し込まなければならず、また画像の領域を見かけ軸のかなりの距離移動させなければならない(いずれにせよ黒色のほとんどが眩しい反射により照らされるため、少なくとも見かけレンジは小さくなり、ディスプレイはこれを対応する小さい出力輝度レンジ内の物理的な駆動値を単に使用することにより補償し得る)。これは、例えば暗領域が全くレンダリングできず、極めて歪んだ選択肢を取らなければならないという結果を生じる。50%が最も低い可視値の場合、例えば10%黒色を示す代わりに、単にそれらの値の全てを50%付近でレンダリングするか、又は更に好適には、それ以上の値にトーンマッピングし得る。例えば、暗い物体の輝度をより明るい輝度にかけて広げる代替案は、それらをステンドグラス窓ピクセルの一部より明るくし得るためオプションではないので、全暗領域がこのディスプレイが自身の「黒色」(すなわち、自身の最低レンダリング可能値)として有する、かかる小さい輝度レンジでは黒色にさえ見えない可能性がある値にクリッピングされ得る。同様に、いくらかのシーンが印刷物に忠実にレンダリングされ得るという望みを捨てなければならない。少なくとも良好な均等物を得るために、マッピング及び心理視覚的原理を用いて最善を尽くすことしかできない(しかし、蛍光インク等を組み込んでUV源で強く照射しない限り輝く窓は得られない)。簡潔さのために、単純化された一次元照度軸に関してのみ原理を論じた。(主にレンダリングデバイスの)実際のガマットの3次元的性質も、色の色彩的処理に興味深い影響を及ぼし、例えば色の飽和は一部の状況では輝度と視覚上部分的に混同/平衡(バランス)さえし得る。
例えば照明又は太陽の近くを見るとき、自然のシーンにおいて生じるため、完全さのために飽和見かけも示したことに留意されたい。これは、錐体オプシンレベルが短時間著しく歪み(ブリーチング)、斑点(スポット)を見る場合である。例えば、冬のシーンにおいて低い太陽を見るとき、その周りの空気は非常に明るい可能性があり、太陽のまわりの雲の粒子に反射する太陽光は更に明るい可能性がある。当然ながら、如何なるHDRディスプレイ上でもこれらの領域を視色素飽和明色によってレンダリングすることは望ましくないが、非常に明るい領域において2つの異なるサブレンジを割り当て得る、すなわち、例えばこれらの領域を少なくとも少しは刺激的な明るさで示し得る。一方で、これらの色はそもそも最早それほど重要ではないと考え(そもそも白熱電球フィラメントの実際の輝度又は色について誰が気にするであろうか(とはいえ、明るく照らされた有色の家、又は場合によっては鏡反射、有色TLチューブ商用標識等のコーディングは依然として重要であり得る))、それらを、単に非常に明るいと呼ばれ得る領域、又は最大コード(例えば、ちょうど1023の値)に近い領域の、クリッピングと同様な値で符号化し得る。この場合、ディスプレイはそれらを刺激的に明るくレンダリングしたいか、又は少し低い出力輝度でレンダリングしたいかを選択し、後者の場合、脳はクリッピングから輝度を推定し得る。また、これはコンテンツクリエーターが、正確に符号化する必要があるもの、駆動のためにほぼ直接使用した場合にそれらの全領域に関して良い品質(例えば、コントラスト)をもたらす例えばHDRディスプレイ(例えば、暗い室内及び更に暗い部屋、並びに明るい屋外)、及び、妥当性が低く、HDRディスプレイ上でさえ常にクリッピング(場合によってはピーク輝度未満の出力輝度で、例えば省電力モードで)され得ると自身が考える非常に明るい領域に集中することを可能にする。省電力機能が複数の増加省電力モードのために、それらの値を上回る画像を歪ませるために使用し得る複数のgTS値を典型的には使用して、複数のかかる「重要でない明るさ」の領域をグレーダーが既定する場合、かかる省電力モードはディスプレイによってより良く実現され得る。実際には、撮像された通りのシーンから重要なコンテンツを落とすために1つ以上の「飽和」コードを芸術的にクリエーターが使用さえしてもよく、例えば高度に飽和した見かけを実現してもよい。
次に、第1の比色法のシーンの表現、具体的には、第1の割り当て規則(ピクセルルマとして符号化される局所的なシーン物体のパッチ輝度を定める(ルマの代わりにピクセルを例えばXYZ系の輝度によって符号化することもできるが、単純さのためにコーディングされたグレイ値をルマと呼ぶ))に従ってルマ若しくは輝度又は同様なグレイ値に関連する軸(単純さのために、両表現において2つの有彩色座標は固定されているものとする(例えば、色相及び飽和度))に沿う第1の座標を有するシーンの物体を定める色空間を、第2の比色法の表現に変換したいとする。本発明の下記のいくつかの概念及び実施形態を容易に説明するための単なる一例として、輝度比が例えば2097152:1、線型符号化された場合は21ビットのオリジナルシーンを有すると仮定する。当然ながら、これに更に2^21値が対応する最輝点の正確な輝度値が追加されてもよい(これは、晴れた屋外のシーンと暗い夕方の室内のシーンでは異なり得る)。実際には、太陽を符号化できるディスプレイは存在しないため、単純さのために、これらのオリジナルのHDRシーンを16ビットのマスターHDR符号化によって比較的忠実に(すなわち、ディスプレイレンダリングバージョンにおいて太陽の輝度を下げる等、心理視覚的にそれほど重要でない歪みで)符号化できるとみなす(少なくともルマYに関して、浮動小数(フロート)であろうが整数であろうが構わない)。それは、マスターガンマを使用してシーンの物体輝度をHDR色空間コードにマッピングすることにより、そのコーディングがルマ軸に沿って非線型であると定められ得るからである。
他の例は、例えば標準2.2ガンマにより、その16ビット符号化を新たな比色法/色空間、すなわち8ビットコードに符号化すなわちマッピングすることである。このためには複数のガマットマッピングが存在し、例えば、単に線型にルマレンジを圧縮してもよいが、これは好ましくない結果を与えるため、通常はより緩やかな例えばシグモイド曲線が使用され、また、例えば画像のローパスフィルタされたバージョンに圧縮を適用し、その後ハイパス詳細にそれをより強く与える等、より複雑なモデルが使用されてもよい。又は、マッピングは、例えばはるかに低いダイナミックレンジ(すなわち、LDRディスプレイ)の新たなフレームワークで見られた場合に人間の視覚系がオリジナルのシーンを近似的に(当然ながら、制限されたハードウェア上ではある種類のレンダリングは行い得ない)見る態様を模してもよい。人間の視覚系は非線型的にふるまい、重要でない視覚的側面を減衰させ、例えば、オリジナルのシーン(少なくとも一部のカメラがそれを如何に見るか)の厳しい影は、比較的明るい灰色に見える可能性がある。影の大半がディスプレイの最小の黒色に近づくようLDRガマットにマッピングするという誤りを犯すべきではない。なぜなら、その場合、視覚系は当然ながら影を過度に暗いと判断するからである。オリジナルのシーンでのようにそれほど深く見えないよう、(局所的)コントラストをいくらか下げることにより緩和すべきである。一般的に、LDRガマットへのガマットマッピングは局所的最適化等を適用するあらゆる種類の計算を使用し得る。
したがって、結論として、8ビット表現を得るために、16ビット表現のピクセルに変換関数が適用される。例えば、最初に全体的変換が行われ、その後何らかの空間的に局所的な更なる変換が行われる。また反対に、他のカラー/ルママッピングにより、8ビット符号化からHDR(よって、例えば16ビット表現)を変換(例えば予測)できる。このようなシステムの例は、WO2012004709(generation of high dynamic range images from low dynamic range images)において公開された。
8ビットLDR符号から、例えば5000ニットのピーク白色を有するHDRディスプレイを駆動するために使用可能であり、よってオリジナルのシーンの芸術的に好ましい(すなわち、高品質の)レンダリングを与える(例えば、影が依然として不吉に暗く見える等の点で適度に同様に見える;特に、オリジナルの16ビットマスター符号化が、例えば影の領域を更に陰気又は不吉に暗くする等のディレクター及び/又はDOPの支持に従ってコンピュータアーティストによって最適に調整されたグレーディングであった場合、品質の意向は、最終的なレンダリングHDRディスプレイが可能な限り良好に、すなわち意図された通りにその不吉な見かけを伝えることであり得る)、16ビットHDR表現へのマッピングの焦点を当てることにより、説明を再び簡略化する。
ピクセルを8ビットコード値から新たな異なる16ビットコード値を有する(同じ空間位置の)ピクセルにマッピングする異なる方法が存在してもよい。例えば、HDRディスプレイはかかる明領域をレンダリングできるので、このマッピングはステンドグラス窓のレンダリング輝度を上げてもよく、これはHDR画像のピクセルルマを得るための対応する変換と対応し(単純さのために、これがHDRディスプレイを直接駆動すると仮定する)、HDRディスプレイの挙動及びHDRコードの規定に基づく。撮像された物体の輝度挙動を説明するとき、及び例えばブースティングについて論じるとき、単純さのために出力輝度を比較するが(例えば、LDRディスプレイ上にレンダリングされる輝度=(500中の)400に対して、HDRディスプレイ上=3000)、実際の符号化されたルマ空間では、例えば暗領域を減光し(比較的同じ結果を与える)、HDR及びLDR符号化の両方においてステンドグラス窓を高く保つことにより同じことが実現され得る。
変換は全体的であり得る、すなわち、ピクセルが画像内のどこに位置しようと、変換の関数形式はLDR/8ビット画像ピクセル値、Y_16b=f(Y_8b) のみに依存し、ここでY_16bは16ビットルマであり、例えば2進コードワード又は0〜1の浮動小数値等として表され得り、8ビットルマY_8bについても同様である。かかる関数の一例は全体的なガンマY_16b= g* Y_8b^gammaであり、ここでgはゲイン係数であり、ガンマはべき関数の係数である。
かかる全体的関数の利点は、小量のデータしか符号化する必要がないことであり、例えば、各画像の前に、又は場合によっては同じ画像特徴を有する同じシーンの画像のショットの前にガンマ及びゲインを伝送してもよい。
デメリットは、HDR/16ビットからLDR/8ビット(すなわち、例えば200ニットピーク白色のLDRディスプレイ上で良好に映ると想定される信号)に変換するために使用する場合、見かけを概略的に正しくするが(高輝度領域を有するHDR画像を線形圧縮する場合の主な挙動は、暗部を過度に圧縮することであり、LDRディスプレイ上で画像を平均的に過度に暗く見えるようにするが、ガンマ関数は既に概略的に2つの領域、暗領域対明領域をバランスを取って処理できる)、画像の暗部における圧縮の補正を、適切なガンマ形状により圧縮を抑えて実行するからである。しかし、それは単一の単純な関数形状である。背景内のいくつかの色を大きく調整する場合、前景の物体内の同様の色が、その物体にとってあまり望ましくなく変化し得る。また、8ビットから16ビットに移動する場合、例えばHDRディスプレイの正しい出力輝度位置(すなわち、正しいY_16b)に明るい照明を配置し得るが、ガンマ関数を調整/伸長することによりそれを実行することにより、例えば暗領域が所望より明るくなり得る。又は、最適に選択された制御点を有するスプライン等のより複雑なマッピング関数を使用してもよいが、一部の中間グレイが望ましくないルマにずれるおそれが依然として存在し、これが画像のカラー見かけを制御する最も容易な方法ではない可能性があることは言うまでもない。
例えば暗い階段及び非常に暗い物体に関して起こり得る、例えばオリジナルのHDRシーンから8ビットのLDR画像への不可逆(損失)マッピングを実行した可能性があるため、問題は更に悪化する。取り込まれるシーンにおいて、元々は非常に暗い物体が階段よりはるかに暗かったとしても、8ビット画像では、階段のピクセルの少なくとも一部の値に一致するルマ値を有し得る。つまり、(大きく)異なるルマ値を有すべきピクセルが同じ値(又は少なくとも、重複すべきでないピクセルのセットのヒストグラムが重複し得る)を有することになるが、好材料としては、両者が画像の異なる空間的領域に存在し得ることである。符号化されたグレイ値を演算する単一の関数は、もはやこれらの2つの場合を判別できない。つまり、非常に暗い物体を非常に低いY_16bルマに変換したい場合、階段の一部で同じことが誤って起こり得り(例えば、階段の一部の過度にコントラストが高い暗化をもたらす)、その逆も起こり得る。つまり、アーティスト又はカラー変換装置は、これらの2つの物体に異なる変換を適用できることを望むであろう。
もう一方の変換のクラスは、ピクセル毎に異なる関数を適用する局所的なルマ(又は一般的にカラー)変換である。例えばピクセルの周りのマスク領域を見て、周囲の値が何であるかに応じて、例えばそれらがほぼ同じではあるがいくらか異なる場合、わずかにルマをブーストし得る。これの一例は、物体の縁部のあたりのピーキングであり、かかる領域では、物体の縁部の付近におけるステッププロフィール値よりいくらか高い/低い局所的なピクセルルマをブーストさせることが望まれるであろう。HDR画像の変換/コーディングの一例は、テクスチャーに通常のJPEG画像が使用され、そして各ピクセル対してブースト係数を有するブースト画像が共符号化されるJPEG−HDR原理である。利点は、かかる画像における最終的な結果として実現されることを局所的変換アルゴリズムが望むあらゆるものを共符号化できることであるが(例えば、テクスチャーコントラストを第1の方法で上昇させ、グレーディングアーティストが所望の通りに最適化できる他の方法で準全体的な輝度勾配を増加させる)、各HDR画像に対して2つのLDR画像が符号化されることが必要になるため、符号化データ量の増加という厳しい代償を伴う(例えば、上述の単一のLDRコンテナ画像に対して)。8bit_texture*8bit_boostを符号化する場合、単にそのまま16bit_HDRを符号化する方が良いのではないかと自身に問うことさえできる。
ここで、あるブーストが望まれる場合、通常は物体全体、例えばステンドグラスに対してそのブーストが望まれるので、中間の方法が存在する。つまり、ブースト画像内のピクセルルマ/ブースト値は完全に空間的に相関を失わず、スマートに処理/符号化した場合はなおさらであり、はるかに単純に表現され得る程度に相関され得る。つまり、関数的な方法でそれらをパラメータによって指定し得り、場合によっては共符号化メタデータ内に記憶され得る単一のブースト数値ほどに単純であり得る。
これは物体、又はより一般的には幾何学的画像領域の符号化を要する。
この部分へのセグメント化の簡単な一例は、ブロックからなるグリッドを定め、矩形の部分領域の各々に対して最適な変換を定めることである。例えば、EP2009921[Liu Shan et al. Mitsubishi Electric: Method for inverse tone mapping]のようにこれらのブロックのそれぞれにゲイン乗数及びオフセットを定めてもよく、又はそれぞれのブロックに対して局所的ガンマを共符号化してもよい。かかる方法は通常、早くにブロックアーティファクトに悩まされる。例えば、ブロックBLCK(i+1,j-1)(図2a参照)、及び場合によってはBLCK(i+1,j)等の他のブロックにまで適用される最適なゲイン又はガンマはブロックBLCK(i+2,j)に対するものでは異なり得る。これは、前者のブロックについては、階段の最適な見かけを高く評価することにより変換が最適化され得るが、一方で後者のブロックに関しては、例えば非常に暗い物体の可視性の基準に重点を置くことにより最適化され得るからである。(何らかの利用可能なピクセルルマY_8bのための)曲線の一部における小さなずれでさえ、これらの2つのブロック内の背景部分/物体のルマY_16bの統計の違いの可視性をもたらす可能性があり、すなわち、脳はかかる統計的違いに気が付くよう訓練されているため、視覚的境界が認識されることになり、黄色がかった草に隠れている虎を発見することを意味し得る。何らかのアルゴリズムを適用すると、粗いグリッドが見える場合があり、その可視性は、Y_16bへの変換後の基礎領域のカラー統計の一時的変調により増加され得る。
ここで、この問題にも実現可能な解決策が存在し、つまり、全ての物体を正確に符号化でき、よって暗い前景の物体の全てのピクセルが最適な局所的変換を受けること、及びその領域内の全てのブロックの背景領域ピクセルが最適なレンダリングを与える同じ変換を受けることを保証し、よって視覚的ブロック縁部は含まれない。
しかし、これを実行するすべての希望はコーディング効率に照らして消失する、つまり、必要とされるビットの量が再び2つの画像符号化、又は場合によっては生のY_16b符号化さえ(この場合、後方互換性のために別のY_8b符号化が更に必要とされ得る)を受け入れることを強要させる。更に、例えば階段の実際の境界を正確に符号化することは例えばスプライン関数のための多量の符号化されるべきデータを伴うだけでなく、特に映画において100又は1000のショットを必要とする場合、グレーダーはしばしば物体選択の精度を落とすことを好む。
従来、かかる物体指向符号化がMPEG4−2フレームワークにおいて試行されてきたが、いくつかの理由のため成功していない。空間的に変化するテクスチャーパターンの定義が何であるかを知ることができないため、単純に物体を抽出することはできず、よって物体の境界を符号化することになる。しかし、一方で、これは例えばスプライン又はスネーク等の複雑な符号化構造をもたらし(ブロックベースの符号化技術の普遍的な単純さと比較して)、第2に、それらのスネークを最適に配置するために人的な介入がおそらく必要であり(境界の不整合は多くのアルゴリズムの悩みであるため、例えば物体の角の断片の欠損)、第3に、これらの境界曲線を符号化するための大量の追加のコード値がもたらされる。これらの複雑な要因の全てが、実際のビデオ又は静止画像符号化規格における容易な採用に好ましくないように考えられる。
しかし、発明者は、特定のHDR符号化状況において(すなわち、シーンの第1の例えば低いダイナミックルマレンジ表現と第2の例えば高いダイナミックルマレンジ表現との間で変換を実行する場合)、正確なセグメント化のあらゆる利点を有しながら、わずか数ビットの追加データしか要さないという利点も有する符号化を可能にする画像の特定の特性がほぼ常に存在することを認識した。図1のレンダリング(又は基礎画像コーディング)の全てにおいて、常に(異なる輝度又はルマレンジにわたる)領域輝度の階層が存在し、例えば窓は常に最も明るい物体になる。そして、空間的に左側に暗い物体があり、中央に明るい物体があり、そして再び右側に暗い物体がある場合があるが、通常それぞれの局所的領域において、画像の暗い部分と明るい部分が存在する(中間の暗さの物体等、実際にはいくつかのクラスが存在する可能性があるが、少なくとも一部のピクセルは最も明るく一部は最も暗く、これらは通常、ガラス窓の中実凸構造(convex solid filled structure)のような比較的単純な幾何学的構造さえ有する)。しかし、ブロック内に明るい空に対する鉄格子のパターンがあったとしてもそれは問題ではなく、なぜなら、全ての鉄格子がブロック内において容易に暗いピクセルを有する判別されるからである。また、走査の経路の途中で時にブロック間でいくつかのgTS値をリセットする必要があるとしても、複数のブロックにわたっての分配は通常容易に管理可能である。偶発的により困難である稀なケースに関しては、当然ながら補助的な方法又は戦略に頼ってもよい。
この原理は図2a及び図2bとともに説明される。
図2aにおいて、ステンドグラスにより照らされる暗い木製の階段を含む画像が、ブロックのサブ分割が重畳されて示されている。これらのブロックにおいて、例えば自動画像解析アルゴリズムが局所的な画像統計、例えば局所的なルマヒストグラム(又はこれから導出される、例えばディスプレイレンダリングの基準比色法におけるシーン表現の輝度ヒストグラム)等を解析し、Y_8bLDR画像を変換することによりY_16bHDRを作成する提案に至る。例えば、典型的な画像が如何に見えるかについての統計的原理及び知識を使用し(階段が既に比較的暗い場合、特定の第1のマッピングはLDRディスプレイ上でそれを通常は過度に暗くする可能性があり、又はグレーダーはそれを確認することによりかかるシナリオを単に試験してもよい)、例えば4.3のマッピングガンマを選択してもよい。かかる望ましい変換の一例が図2bに示されている。上述したように、ピクセル毎に完全な変換関数又はアルゴリズムが存在する必要はなく(ガンマ関数の代わりに、プログラミングされた規則のセットを有してもよく、例えば局所的なテクスチャー尺度、局所的なルマの変動等を計算して、1つ以上の局所的なピクセルの最終的なルマ値に至る)、準全体的な最適化された変換、すなわち典型的には物体又はクラスごとの変換が望まれる。ブロックBLCK(i-1,j-4)によって覆われる画像領域において、2つの物体、すなわちステンドグラス窓の一部、及び、ブロックのステンドグラス窓ではないピクセルを占める周囲の壁(例えば、同様に高品質でレンダリングされなければならないテクスチャーである煉瓦又は壁紙を有し得るが、単純さのために図示されていない)を含むこのブロックによって選択されたエリア内の局所的なサブシーンが示されている。これらの物体は大きく異なるため(明るい屋外に対する暗いピクセルの逆光撮像、ステンドグラス窓の輝く飽和色が特別な処理を要求し得ることの説明は始めない)、少なくともその信号が典型的に対象とする又は少なくとも有用ないくつかのディスプレイのカテゴリに関しては、例えばY_16b等の画像の新しい符号化を得るために非常に異なる変換を適用することが望まれ得る。窓と壁とは非常にことなる物体であり、特に両者は非常に異なる照らし方をされる。壁は(BDRF、アルベド等の自身の物理的特性が何であれ)、室内に存在するあらゆる光によって照らされるだけでなく、通常、周囲特に主要照明源からの光を反射することにより自身の色/輝度を作成する。一方で、窓は屋外からの光を吸収により直接変調するので、透明色を有する。いかなるディスプレイレンダリングにおいても少なくとも窓が明るく見えることが望まれるが、この異なる色発生メカニズムの観点から、追加のレンダリング品質基準が存在し得る。ある者は、LDRが表示するであろうもの、又はディスプレイ及び視聴者の暗い視聴環境において実際の壁が反射するであろうものから大きく相違することなく、HDR上に壁を比較的薄暗いディスプレイ出力輝度で表示したいと望み得る。一方、ある者は、例えばLDR画像において壁のルマ値からそれほど高くない値で符号化されたガラス窓を(そうでなければそもそもLDRディスプレイは(比較的忠実に)それらを表示することができないので)、高ルマY_16b座標を有するHDRディスプレイの実現可能ガマットの上限付近のルマにブーストしたいと望み得る。つまり、適切なHDR画像は暗い壁と非常に明るい窓によって構築されなければならない。
図2bにおいて、窓に対して何をすべきかを示す他の例が示され、また、望ましい結果のための全挙動ルママッピング関数TM_BLCK(i,j)が示されており、ブロック内のピクセルに可能な入力ルマLuma_inが存在する場合、結果はHDRY_16b画像の変換された出力ルマLuma_outである。当然ながら、色の一部は実際には存在しないので(このブロックにはステンドグラス窓は存在しない)、それらは破線で示されている。関連するのは、存在するLuma_inのレンジのための変換関数である。したがって、これが特に、望まれる汎用性又は複雑なコーディングに基づく複数の実施形態具現化を可能にすることを当業者は理解するであろう。関数TM_BLCK(i,j)全体が破線部に何らかの値が与えられて記憶されていてもよいし(ガンマ関数等の関数形式によって変換を符号化するだけでなく、変換がルックアップテーブルとしても符号化され、中間値がそれらが存在する画像の部分において手軽に得られ得る場合、これが容易に達成できるので)、レンジRNG_COD_DRKのルマにかけて定められる階段のために必要な部分的変換PD_BLCK(i,j)等のサブ変換のみを別々の位置で記憶されてもよい。このような部分的変換を縫合することは多数の利点を有する。部分的変換は任意の場所に任意の理由で記憶され得る。部分的変換PD_BLCK(i,j)は、例えば近傍にある局所的な照明によって照らされるためはるかに明るい場所にも存在する壁紙のマッピング挙動を符号化するはるかに大きい変換としてどこかに(例えば、複数の画像のショットの開始時、又は場合によっては映画の開始時)記憶されてもよい。しかし、その場合レンジRNG_COD_DRKの部分だけがそこから取られる(そして例えばブロックTM_BLCK(i,j)の全ピクセルにルママッピングアルゴリズムを適用するときに一時メモリに記憶される)。このような部分的変換は、場合によっては、例えばインターネット若しくは他のネットワークサービスとして、例えば著作権保護サービス若しくは一部の物体のより美しいレンダリングを提供するただの別個のサービスにおいて、又はゲーム等のオンザフライシナリオにおいて伝送され得る。
よって、この例のTM_BLCK(i,j)は2つの関連する部分的ルママッピングを示す。すなわち、1つ目は階段をその暗いLDR画像符号化(すなわち、Luma_in)からいくらか明るくし、コントラストを上げて木目をより見やすくする、オフセットを有する線型ストレッチである階段用のPD_BLCK(i,j)部分である。2つ目は、そこの部屋の背景(この場合は壁紙ではなく何らかの床であり得る)用の部分的変換PM_BLCK(i,j)であり、この例では変化する(曲線)ストレッチである。同じマッピングが典型的にはブロックBLCK(i+1,j-1)の両部分にも適用できる。
しかし、ここでブロックBLCK(i+2,j)に到達すると、このマッピング戦略は依然として背景部分に関しては非常に良好に機能し得るが、レンジRNG_COD_DRK内のluma_insを有するピクセルに関しては、非常に暗い物体を符号化するので、そうはいかない。この物体はHDRディスプレイ上ではるかに暗く表示されなければならない、すなわち、LDR画像からマッピングされたHDR画像においてより低いluma_outs Y_16bを有さなければならない。これは、このブロック、すなわちブロック内の異なる新たな物体のための新たな部分的変換戦略PD_BLCK(i+2,j)を示す太線によって表される。この部分的変換は全ての非常に暗い物体の色を非常に暗く、ほぼ識別不能に保ちたいので、はるかに緩やかなストレッチ係数を有する。
よって、実際には異なる最適レンダリング又はグレーディングを要求する現実の物体に対応する様々なブロックの部分にかけてこのような部分的マッピング戦略を素早く変更することを可能にする新規な技術的メカニズムが必要である。
ここで、HDR撮像の世界(すなわち、同じ画像の異なるカラー表現間のマッピング、例えばY_8bベース色空間からY_16bベース色空間へのマッピングを典型的には伴う)において、このようなブロック内の部分的領域又は物体間にほぼ常に特別な関係が存在すること、すなわち、それらの代表的ルマ(又は輝度等の同様の表現)が異なることを発明者は認識した。代表的ルマは平均ルマであり得るが、典型的にはよりきつい特性は、第1の物体(ブロックBLCK(i+2,j)の例では背景(床))の最も暗いルマが、より暗い部分領域(この例では非常に暗い物体)内のピクセルの最も明るいルマより明るい又は高いことである。つまり、少なくともそのブロックに関して、そして典型的にはそれ以外の複数のブロックに関して(ある走査方向、例えば左から右にジグザグを仮定して)、単に「領域識別グレイ値」を符号化することによって両者の境界を定め得る。よって、領域識別グレイ値は、それ未満では第1の物体が符号化され、それ以上では第2の物体が符号化されるルマ(又はカラー表現の類似の照度座標;同じ画像テクスチャーデータのマッピング戦略を例えば[0,255]から[0.0,1.0]に再定義できるように、実際に、画像の輝度レンジの異なる定義のために常に再定義をすることができる)境界である。そして、階段はLDR画像において非常に暗い物体よりいくらか明るい値を含むので、ブロックBLCK(i+1,j-1)内の階段は別の領域識別グレイ値を必要とし得るが、原理は同じである。ステンドグラス窓を含むブロックに関しては、順序が逆転して、これらのブロックでは今度は背景が最も暗い部分領域であるが、原理は変わらない。このように単純な領域識別グレイ値により、受信側装置は必要な物体を完全に、ピクセルレベルで正確に再構築することができる。これは、一般的物体指向符号化では不可能であろう。なぜなら、例えば魚はその内部にその周囲の海でも生じている例えば青色を含み得るからである。しかし、HDR画像表現問題は、はるかに明るい領域のうちの1つが必ず画像内のどこかでより暗い領域と共に位置することである。これは、典型的には例えばそれらの領域が異なる照らされ方をするから、又は照明等のように自発光するために生じ得る。そして他の特性は、かかる(大きく)異なる輝度領域が画像内でいくらか幾何学的に分離されていること、すなわちしばしば異なるブロック内に存在することであり、これは更なる最適化を可能にする。これは非常に暗い物体の例であり、非常に暗い物体は確かに階段のように暗く、LDR画像においては同じルマコード(の一部)を使用さえし得る。しかし、異なるブロックにおいて現れるので、この例では例えばRNG_COD_DRKの上限値であり得る単一の領域識別グレイ値程に単純であり得る表現セマンティックスメタデータを最適化するだけでよい。つまり、受信側の物体セグメント化モジュール(実際には送信側の装置と同種の装置でもよく、又は実際に送信側に存在してもよいが、典型的にはLDR画像+様々な必要な1つ以上の領域識別グレイ値を含むメタデータを取得するモジュールである)は、階段を含む最初のブロックが始まる前に受信した領域識別グレイ値の値に基づいて、全ての関連する物体を正確にセグメント化することができ、また全ての後続のブロックに関しても同様である。この符号化は少なくとも全ての階段を含むブロックに関して使用される、すなわち、非常に暗い物体が存在するBLCK(i+2,j)において、初めて全く新しい状況が生じるまで使用される。そのブロックが始まる前に、領域識別グレイ値の新たな値を伝送することにより新しい状況が伝達される。ここで、セグメント化を再び正しく実行するために、受信側においても、送信側での記憶のファイナライズの前に検証されたであろうようにデコーダが新たな適切な値によってリセット及び命令される。典型的には、エンコーダは、例えばグレーダーが関連するgTs値を規定することを容易に可能にするソフトウェアと接続され得る。例えば、グレーダーは値を設定するためのスライダーを有し、(選択されたブロックに関して局所的であり得る)シーンのどの部分がgTS未満又は以上であると判定されるかを疑似カラー(例えば、赤対緑)で見てもよい。又は、グレーダーが大まかに領域を選択して、装置がすぐにグレーダーを半自動的に補助し、統計を解析して、例えば輝度が大きく変化する密着領域の推定に基づいてgTsの第1の値を提案してもよい。又は、グレーダーが領域、例えばステンドグラス窓内を素早くスクリブル(走り書き)し、それによりgTSの少なくとも開始値をすぐに選択し、その後様々なユーザインターフェイスコントローラのうちの任意のものを介して微調整を行ってもよい。
そして一度これらのセグメントを得れば、それらを要求される変換と関連付けることは簡単なタスクである。デコーダは、例えば画像の開始前に、符号化に従って、全ての背景ピクセルを「物体=0」とラベル付けして、全体的カラー又はルママッピング戦略を適用してもよい(又は、ある種の基準HDRディスプレイに関してはデフォルト、例えばガンマ4.0等)。又は、デコーダ(及び最初にデコーディング能力をエミュレートするエンコーダ)は特定のブロックの前に背景/物体=0の物体に適用されるべきマッピングを更新してもよい。階段は「物体=1」とラベル付けされてもよく、何らかのリンク規則がそれらの(セグメント化された)ピクセルにマッピングを関連付けてもよい。例えば、デフォルトの規則は、ブロックの前に新しいマッピングが符号化された場合、そのマッピング関数(又はアルゴリズム)が現在の「領域識別グレイ値」未満のピクセルルマに対して適用されるべきであるというものでもよい。又は、マッピング関数は、例えば、2つ(又はそれ以上)の領域のうちのより明るい物体に対して使用されることが明らかようなルマレンジにかけて(ほとんど又は完全にそれのみに)適用可能であるように符号化されてもよい。
したがって、物体を符号化するのにわずかな追加データしか必要でない、すなわち、画像の複雑さに応じて、1又は2回の画像識別グレイ値。例えば、屋外への窓しかない最も単純な画像に関しては、単一のgTsで十分であり得る。2つの部分領域間に明確なルマ非連続性が無い場合にマッピングを微調整するためにもこの戦略を使用することができ、例えば、背景の壁紙に沿う照明の勾配に対して、例えば可視性を改変するために、例えばより暗く照らされる部分に対していくらか異なるマッピングを適用する変化する領域識別グレイ値と共にこのメカニズムを使用してもよい。
複数のシナリオが考えられる。ほとんどのHDRシーンにおいて、ブロック毎に2つの異なる照度領域しか存在せず、2、3の、例えば2つの異なる照度領域しか存在しない場合さえあり得る(画像の残りの部分に関して充足すると判断された全体的マッピングに対して、ステンドグラス窓のみが異なるマッピングを必要とする場合)。この場合、ブロックのピクセルカラーコード(又は、ブロックの走査と共にトラッキング可能なデータ構造の同様なコーディング、例えばピクセルデータ外のコーディング等)間で領域識別グレイ値を伝送するのは2、3回だけでよい。実際に、ステンドグラス窓の単純なシナリオにおいては、単一な領域識別グレイ値で十分であり得る、すなわち、そのシーンを含む映画内の画像のショットの前にそれを共符号化してもよい。この場合、セグメント化モジュールは、領域識別グレイ値以上の全てのルマが明るい窓として処理/マッピングされるべきであると理解する。場合によっては、単一のブロック位置に3つ以上の物体が重なることがあり得り、この場合、暗い物体、中間の輝度の物体、及び明るい物体を有することになる。この場合、例えばそのブロックの前に2つの領域識別グレイ値を伝達することにより同じ原理によってセグメント化できる。現在のブロック内に暗い物体しか存在せず、明るい物体がわずか数ブロック先に現れる場合にも同じことができる、すなわち、これらの2つの領域識別グレイ値を共符号化し、例えば10の連続ブロックをランしてもよい。同じブロック内に同様な輝度/ルマの2つの物体が現れる、すなわち、両者が同じルマのピクセルを複数有し、いずれかの物体に明確に割り当てられない、又は両者が含むレンジが(かなり(そうでなければ多くの場合それほど問題ではない))重複するということもできる、あまり発生しないシナリオが1つだけ存在する。これは、暗い物体が、1)実際に2重に割り当てられたコードによって符号化され(すなわち、非常に暗い物体のために、階段内に存在しない、例えばたった3つのコード、ルマ0、1、及び2をリザーブしない)、且つ、2)本例のように2つの物体が分けられず、同じブロック内に、例えば典型的には重なって共に配置された場合に該当する。このシナリオにおいて、及びいずれにせよコンテンツクリエーターが依然としてこれらの暗い領域のかかる高品質な符号化を有することにこだわる場合、エンコーダは、例えばHDR画像符号化戦略においてフォールバックシナリオを使用しなければならず、ここで教示したメタデータガイド・セグメント化に基づくセグメント局所的マッピングによって画像全体を予測するのではなく、異なる符号化が必要であり、例えば、要求されるY_16b値を直接含むちょうどそのブロックのサイズの小さな画像を更に共符号化して、それらをHDR画像においてそのブロックのピクセル位置に重ねてもよい。そして、特定のリザーブされた閾値を使用することにより、このためにも領域識別グレイ値メカニズムを使用することができる。例えば、0又は−1の領域識別グレイ値は、それ未満のルマは存在しないため「意味をなさない」ように思える、すなわち、フォールバック(例えば重畳)符号化戦略を示し得る。置換HDR(又は他の画像)符号化戦略、例えばハイダイナミックレンジ画像を生成するときに画像の小さな部分をY_8bLDRとしてのビデオからではなく、RAWの部分的な例えばY_16b画像から符号化し、それにより画像のその領域を(典型的には同様に適切な変換の後に)置き換える等を知らせる以外に、他の理由のためにリザーブ値を使用してもよい。例えば、領域識別グレイ値260は、後続のブロックのセグメント化が難しく、符号化ルマレンジ内の1つ以上の領域識別グレイ値(例えば、16、200、及び240)に基づいては不可能であり、別のセグメント化戦略が必要とされることを示してもよい。例えば、この留保された値260を検出したとき、受信側は、少なくとも現在の又はそれ以上のセグメント化されたブロックに予めセグメント化されたマップを使用してもよい。つまり、この場合、少なくともそれらの連続ブロックに関する、3つの種類の物体が存在する場合「0」、「1」、又は「5」とラベル付けされる、小さな共符号化されたセグメント画像を受信側が見る。このフォールバックセグメント化がもはや必要なくなった後、例えば通常のセグメント化が先の非リザーブ値(例えば、16、200、及び240)を再び適用する最初のブロックの前に再コーディングすることにより通常の「領域識別グレイ値」ベースアルゴリズムが再開されてもよく、又は、通常のセグメント化メタデータ符号化が再開し、以前の(典型的には受信側のワーキングメモリに記憶される)gTS値が再び適用可能であることを示すために270等の別のリザーブgTSコードが使用されてもよい。
しかし、稀な非常に複雑な状況のために別のフォールバック戦略が時に必要であるにせよ、非常に稀にしかより多くのビットを消費する代替的なフォールバックコーディングを必要としないので、我々は非常にデータ効率的な符号化を有する(なぜなら、大体において必要なのはマッピング、及びマッピングが適用されなければならないピクセルの境界を定める領域識別グレイ値、並びに通常はそのリンクを正確に指定する何らかの更なるメタデータ(例えば、変換リンク規則:物体=3→マッピング=5を使用)だけだからである)。しかし更に、例えば異なるディスプレイ上でのレンダリングのための調整等、処理用途において非常に汎用的でもある。我々の方法により、異なるディスプレイへの調整に必要なシーンのHDRセマンティックが簡単に定められるからである。また、リンク規則は動的であり得り、例えば複数の規則が記憶されてもよい。例えば、マッピング=5には、例えばマッピング後の結果となる出力HDR画像色表現(例えばY_16b対Y_10b)に応じて、又はそれがどのディスプレイ用(例えば、5000ニットHDRディスプレイ、50000ニットHDRディスプレイ、又は1500ニットHDRディスプレイ)か等に応じて異なるマッピングが更に書き込まれてもよい。
そして、当業者はこの符号化が様々な方法で、例えば、初期化においてリンク規則を「物体=3→マッピング=5を使用」を「物体=3→マッピング=7を使用」に変更する等、異なる規則によって、又は出力HDR画像の詳細に応じて異なるセグメントコードをセグメント化モジュールに生成させることによって、又は例えば更なる詳細(異なるアルゴリズム、LUT、又は様々な式のリスト内のエントリ等の開始の様々な指標等)を参照することによってマッピングを動的に変更させることによって具現化され得ることを理解するであろう。また、これは、例えば簡単なユーザインターフェイスコマンドハンドリング、例えば全ての物体/グレイ値が特定のマッピング関係で照度変更される(例えば、ステンドグラス窓は既に明るいのであまり変更されず、画像の残りの部分とのルマ比によりHDR見かけをあまり失わないために画像の残りの部分と比べてわずかに明るくされてもよいが、周囲の室内は画像の輝度見かけに最も影響を及ぼす平均照度部分であるので、明るくされてもよく、例えばユーザが不快なほどに明るいと知覚するためディスプレイを減光するときは逆であり得る)、シーンの異なる物体に様々な新しいマッピング関数を再割り当てすることにより実行され得るシーンの「全体の輝度見かけ」のユーザ制御変更等も可能にする。この場合、上書きされた部分だけを異なる方法で処理すればよいが、それが難しく重大である場合、いずれにせよ複雑なレンダリング処理が必要になるであろう。したがって、例えばブライトニングが単純なオフセット又は掛け算である必要はなく、部分領域の輝度のバランスを取る複雑な戦略(例えば、ある割合のピクセルを白色にクリッピングする)であり得るので、コンテンツクリエーターは例えば何がブライトニングされるか及び如何にされるかについてはるかに強い決定権を持ち、典型的には、現在のアルゴリズムがアーティファクトをもたらし得る、ガマット制約ディスプレイシナリオにおいてスマートである。
リザーブされたセグメント境界決定閾値の他の非常に便利な使用が、図6の受信側ホームシステムにおいて示されている。ここで、テレビ602は例えばエアウェイを介してテレビ局から信号SBを受信する。信号SBは多様な方法で(しかし、典型的には一連の画像の開始時にメタデータとして)共に伝送され得るメタデータMETB、HDR設定指定コードSET_HDRを含み、その後ディスプレイが如何に挙動すべきかを指定する。HDRとLDRレンダリングとを切り替えるための興味深いSET_HDRコード、例えば電力を節約するためのフォールバックが、例えばHDR映画的効果の最大量を必要としないスタジオニュース番組を現在流しているために使用されてもよい。よって、例えば直前のコマーシャル又は映画とニュースとの間で、そこからHDRディスプレイが例えば(5000ニットのピーク輝度能力を有するとしても)わずか500ニットの最大白色輝度でレンダリングすることを意味する「render_LDR」のSET_HDRコードを伝送(又は、例えばホームハードディスクレコーダ又はインターネット接続ビデオ記憶サーバ上に記憶されるビデオ番組内に共符号化)してもよい。ここで、本開示の発明の実施形態として、それ未満の全てのルマ(つまり、8ビット画像内に存在し得る全てのルマ)が同じマッピングによって処理されなければならないことを示す255に領域識別グレイ値gTRを設定することによりこれを容易に実行してもよく、このマッピングは、例えば画像とともに共符号化されてもよいし、全てを最大500ニットにレンダリングするディスプレイガンマ関数内に予め記憶されてもよい。例えば、減光されてレンダリングされ得るグレイの境界を定めるgTS値が使用されてもよく、それ以上の全てのグレイが比較的暗く減光された白色にクリッピングされてもよい。
ここで、ルマ(又は同様の照度関連コーディング)に適用されるマッピング/変換は2種類存在することを理解することが重要である。
1つ目は、単に特定の視聴ディスプレイ及び環境のために補正を行う単純な数学的「ハードウェア関連」マッピングである。例えば、画像がガンマ2.2CRT(基準ディスプレイ)のために符号化されたにも関わらず、シグモイダル電気−光変換関数を有するLCD上で表示される場合、ディスプレイ自身がこれを補正するために基本的な比色的計算を使用し、LCDに自身が基準CRTであるかのように画像をレンダリングさせることができる。同様に、単純な計算によって視聴環境特徴に関して大きく最適化することができる。まず、当然ながら、より暗いレンダリングにスケーリングする場合、画像コーディングに関連付けられた基準輝度を引き下げなければならない。これは最大コード値(例えば255)をレンダリングディスプレイのピーク輝度にマッピングすることにより既に大部分が実現される。しかし、より複雑に実行することもでき、例えば画像の特定のルマサブレンジをディスプレイの特定のレンダリング輝度レンジに割り当ててもよい。しかし、レンダリングされる画像の輝度及びその周囲に応じてコントラストの変化等も考慮しなければならないため、通常はガンマ補正も適用しなければならない。これは、2つの系における照度レンジ情報内容が比較的同様な場合、適度に許容可能な結果を与えるが、見かけレンジが大きく異なる場合は難しい。はるかに狭いダイナミックレンジに移行するためには、依然としてどのサブレンジが如何なる品質で、すなわち、典型的には如何なる物体間コントラスト及び物体内コントラストで表示されなければならないかを決定しなくてはならず、多くの場合マッピングアルゴリズムによって重複するレンジが発生する。逆は一層困難である。圧縮された物体レンジが数個しかない場合、新たなルマ/見かけ値を作成することはもちろんのこと、出力HDR見かけレンジ内のどこにそれらを配置するかを判断するのが難しい。シーン輝度が非類似の物体の8ビットレンジが互いに重なって不適切に符号化された(非常に均質な照明を模倣して、オリジナルのシーンの照明の全ての又は十分な情報を破壊する場合等)LDRマッピングされた画像からは、良好で自然なHDR画像を生成するのが一層難しくなる。
物体のピクセルのグレイ値(又は概して色)の全ての他の変換は、アーティストによって典型的に実行される全体的ではなく局所的であり得る一般的な変換と見ることができる(上記の異なる視聴シナリオのための単純な数学的較正が十分に正確でない場合、アーティストは補正さえ行ってもよい)。アーティストは、例えば嵐をより不吉に見せるために画像内の雲内に存在する異なるルマを変更する等の非常に複雑な芸術的グレーディングを実行し得る。又は、所望のピクセル輝度/カラーによって表現された場合にロボットの目から出てくる光線ビームを得るためにコンピュータグラフィクスレンダリングエフェクトさえ使用してもよい。我々の議論のために、2つの典型的なシナリオによって例示することができる。どちらにおいても、物体のピクセルグレイ値の輝度レンジの重要な配置(カラーグレーディング)は全てマスターHDR画像上(IM_MSTR_HDR、図4参照、例えば特定の定義ガンマを有する16ビット画像であり得る)で行われ、LDR画像(Im_1)は純粋にそのHDRマスターに対する単純な数学的変換、例えばHDR画像のヒストグラム等の特徴に基づいてガンマ係数が調整されたガンマ関数等によって取得される、つまりHDR-to-LDR変換は単にグレイ値の単純な適切なシフト(典型的にはあまり大きなずれではない)であり、異なるコーディング戦略であるにせよ、全ての情報が比較的正確に保持される。この場合、この逆の数学的マッピング戦略を適用することによりLDR画像からHDRディスプレイにレンダリングされるべき最終的なHDR画像を導出することができる。又は、人間のグレーダー520が代わりにマスターHDR画像IM_MSTR_HDR内に符号化されたマスターグレーディングから始めて更に最適に調整されたグレーディングに基づいてLDR画像を導出してもよい(すなわち、例えば、画像がLDRであったかのように[0,1.0]画像から始め、自身の好みに応じてそれを比色的に自由に変換し始める)。つまり、このシナリオでは、HDR画像IM_MSTR_HDR内のHDRレンダリングシステムのための最適な見かけの符号化と、グレーディングされたLDR画像(例えば、好適には8ビット)Im_1内に符号化されるLDRシステムのための別の最適な見かけとの両方が存在する。我々の方法はピクセルカラーの第1及び第2の色空間定義(典型的には様々なビット深度及び/又は対象ディスプレイピーク輝度の)間での物体のあらゆるカラー又はルマ変換に適用可能であるが(必要なのは、カラー表現/画像符号化の少なくとも1つにおける明及び暗領域間の良好な程度の関係だけである)、第2の種類の例に例示の焦点を当てる。つまり、グレーダーは大量の微調整されたカラーマッピング、すなわち、画像の様々なサブ物体又は領域のための一般的なluma_in to luma_out関数形状を(例えばLUTとして)指定した可能性があり、これらは我々の戦略では一連の(1つ以上の)領域識別グレイ値(gTS)、複数の変換関数又はアルゴリズム、及び典型的には更に、取得され得るセグメントを適用されるべき変換とリンクする1つ以上のリンク規則に変換され、例えば、3つの連続する領域識別グレイ値が存在する場合、第1のgTS1未満の物体は「0」とセグメント化され、以上は「1」とセグメント化され、そして第2のgTS2が同じ物体の(すなわち、同じルマレンジの)セットに対して適用可能なより高い値である場合、このgTS2以上はセグメント「2」になるが、未満のルマは既に「1」に属する。非常に暗い物体の例のように、gTS2が単により暗い及び明るい物体の最定義である場合、閾値ルマ以上はいずれの場合でもセグメント「1」の背景になるが、低いルマはそれぞれセグメント「0」及びセグメント「2」になる。関係が明確である場合、更なるデータが共符号化される必要はないが、通常、領域識別グレイ値の意味を説明する何らかの更なるメタデータが存在し得る。例えば、これは単純に領域識別グレイ値の種類を「further_demarcation_in_same_luma_range(同じルマレンジで更に境界決定)」又は「modified_demarcation(変更された境界決定)」等と定めれば十分であり得る。しかし、より複雑なケースのために、及び、実際にそれほど多くの追加データが必要でないため、エンコーダは常に、例えばセグメント値割り当て規則により各状況に対して実行しなければならないことを共符号化する選択してもよい。例えば、"ifルマ<gTS1→物体/セグメント=0"、"ifルマ>gTS2→セグメント=2"等である。このようにすることで、あらゆる潜在的な誤った解釈(判断)及びそれによる不正確な変換に対して保証することができる。
図3は、例えばAVC等の例えばMPEGビデオ符号化規格等の現在の画像符号化技術のフレームワークに適合する、上記実施形態を如何に符号化するかの1つの可能な好適な例を説明する。
(例えば、画像毎に、又は画像のショットの最初の画像において)グローバルヘッダーGen_Im_HDR内に典型的には主要な変換に有用なメタデータの一部を入れることから始めてもよい。例えば、単純なショットに関しては、ここに画像のほとんどに適用される第1のマッピングGlob_TM1と、例えばはるかに明るい一部の領域に適用される第2のグローバルマッピングGlob_TM2を符号化すれば十分であり得る。第1のマッピングは図1の部屋に(つまり、背景、階段、及び非常に暗い物体である全てに対して)適用され得り、第2のマッピングはステンドグラス窓をブライトニング/ブーストするために適用され得る。そして、これらの2つの物体間の違いは受信側で、符号化された領域識別グレイ値gTS_globにより素早く発見される(典型的には、Y-8bLDR画像においてこの窓は残りの物体より(はるかに)高いルマを有するが、このメタデータが無い場合、自動で判定するのは非常に難しい可能性がある)。室内でカメラを回転すると、例えば日光がより多く差し込むためにステンドグラスがより明るくなり始める可能性がある。これは、ショット内の連続画像のための徐々に変化するGlob_TM2及びおそらくはgTS_globによって符号化され得る。変化するマッピングGlob_TM2によって窓の輝度をブーストできるので、これは例えば、一連の画像にかけてY_8b画像内のステンドグラス窓の符号化を同じに保つことを可能にする(例えば、ステンドグラス上の絵の細部の最大量を維持するために可能な限り最適なコード割り当てを使用して)(つまり、照度変化はピクセル化されたテクスチャーカラー符号化内ではなく関数変換内に存在する)。この場合、複数のピクセルデータブロックが例えばDCTによって符号化される。グローバル符号化が画像全体に対して十分である場合、全てのピクセルデータがショットの終わりまで、又は場合によっては映画クリップの終わりまでそのグローバルヘッダーに従う。しかし、この例において、特定のブロック(i-1,j-2)の前に始まる画像内のある地点において、局所的変換を実行し始めなければならない、より複雑なシナリオを有すると仮定する。つまり、典型的には、例えば背景の壁紙のピクセルを変換するために、Glob_TM1等内に既に符号化された全体的変換知識の一部を依然として使用できるが、少なくとも1つの局所的な新たな物体に関しては新たな変換を実行しなければならない。つまり、変換戦略の一部が局所的に再定義、例えば上書きされる。この例では、例えば照明等の更に明るい物体が存在するため、局所的メタデータLoc_MET_1はgTS_L_loc_1以上の明るい部分の境界を定めるための新たな戦略を含む。また、1つ以上の暗い物体を判定するための領域識別グレイ値gTS_D_loc_1も共符号化される。この例では、依然として照明物体は現在利用可能且つ適用可能な明領域用の変換によって十分に変換され得るが、暗い物体を変換するために新たなマッピングLoc_TM_DKが符号化される(例えば、ここで初めて階段が現れ、我々は窓及び壁紙を如何に変換するかは既に知っているが、暗い階段についてはまだである)。変換リンク規則の一例であるLnkRL_1もともに符号化され、これは暗い物体領域識別グレイ値gTS_D_loc_1未満のルマは階段用の変換Loc_TM_DKによってマッピングされることを規定する。
この情報もやはり背景又は窓を含む複数の連続ブロック(又は概して一般的な所定の形状)にわたって、ブロック(i+2,j)の前で止まるまで十分であるが、ブロック(i+2,j)において、非常に暗い物体の区別化を可能にする領域識別グレイ値gTS_D_loc_2及びそのマッピング戦略Loc_TM_DK_2を符号化しなければならない。DAT_TMは、画像コーディングから周知である走査経路に沿うブロックの例えば空間的(又は伝送における時間的)順番等のデータの順番を与える。
データを組み入れる(ちりばめる)例のみを説明してきたが、メタデータがピクセルブロックデータから物理的に分離されているが、特定のブロック位置と関連付けられるシステムを範囲に含めることも意図する。一部のビデオ符号化構造は、既に専用の又は自由に使用できる汎用のメタデータメモリプレースホルダーを適所に有しているため、上記例を完全に含み得るが、いくらかのデータが組み入れられる場合、他のビデオ符号化構造は全てを記憶するのに十分なメタデータメモリを有さない可能性があり、又は古いシステムを混乱させることにより後方互換性を失い得る。したがって、他の等価の具現化は、全てのメタデータ(gTS等)を信号の別の部分(例えば、ディスク上の映画の始まりに、又は放送中に定期的な間隔で等)に符号化し、そのデータを幾何学的な関連付けコードにより特定のブロック又は他の領域と関連付けられるようにしてもよい。これを実行する最も単純な方法は、例えば"gTS1= 230 / ImageNr/TimeCode = 2541, Block_loc= (X=20, Y=12)"等、データの後にブロック番号(及び場合によっては画像番号、映画/コンテンツ番号等も)を記すことである。その別個のメタデータ部分は例えば異なる信号内に存在し、異なる手段を介して供給されてもよく、例えば映画はプレイヤー内のBlu-ray(登録商標)上に置かれているが、領域識別グレイ値等のそれを「説明する」メタデータは例えばインターネットを介してネットワーク上の記憶領域(例えば、改良されたHDRレンダリングを可能にする専用サービス)から引き出される。
図4は、セグメント化が典型的には如何に見えるかを示し、この例では、例えばステンドグラス窓が如何に部分領域に部分分割され得るかも説明されており、これは、例えば屋外の部分が光の一部を遮ることにより例えば下部がより弱く照らされる場合に有用であろう。この場合、新しいセグメント型SEGM_TYP_2が例えばセグメント=「5」をもたらす。我々は今、最適に決定された領域識別グレイ値との単純な比較によりセグメント化規則が如何に正確にセグメント化され得る異なる照度の(典型的にはHDRシーンにおける異なる照度の)物体を、ブロックとの関係とは無関係に容易に生成し得るかを理解する。したがって、現在使用されるマッピング等の全ての他の有用なデータをブロック毎に符号化できる一方、結果は依然として物体レベルで正確に適用される、すなわちハローイング又はブロックアーティファクト等が存在しない。
gTS値についてもう少し論じたい。gTS値が使用される技術的ルマ符号化が何であろうかに無関係に定められることは既に述べており、例えば、ガンマ2.2YCrCb色空間においてルマgTS値を使用することができ、又は画像カラーのXYZ符号化において輝度Y識別値を使用することができる。gTS値が第1の又は第2の画像、例えば最初の又は最終的な画像の基準色空間で定義されるのかという興味深い問題が残る。HDRマスターグレードを符号化するためにマッピングされたLDR表現を使用する場合、そのLDR画像から輝度アップスケーリングマッピングによりそのHDR画像を再現するであろう。よって、gTS値をLDR画像コーディングルマ軸に沿って定めることは理にかなうが、ただし、HDR再現マッピング関数の逆転により、HDRベースgTS値は等価なLDRベースgTS値に変換され得るため、原則的には通常の状況ではそれらをHDRルマ軸に沿っても指定し得る。通常、メタデータはビデオ符号化の始まりにおいてどちらの定義が適用可能であるかを指定する。ここで、いくつかのシナリオにおいてLDRベースgTS値に関して起こり得ることをもう少し詳しく述べる。原則的に、ある者はマスターHDRから第2のLDR画像への、オリジナルのHDR画像では分離していた領域のルマヒストグラムを(わずかに)重ねさせるマッピングを有し得る(例えば、階段の暗領域はLDRにおいて非常に暗い物体内にも現れ得るルマを取得し得る)。この場合、gTS識別値を重複しているヒストグラムの尾の中間、又はより好ましいルマ位置に指定してもよい。アップスケーリングの際原則的に問題が生じ得るが、これはいくつかのマッピング戦略に関しては必ずしも問題とはならず、特に戦略が重複の周辺で比較的平坦な挙動を有する場合そうである(すなわち、ピクセル間コントラストをブーストしない)。しかし、以下では、通常はLDR及びHDR画像の両方において分離したヒストグラムを有するべきであるシステムに限定する。多様な装置実施形態は、例えばグレーダーが選択できるHDR-to-LDRマッピングの選択肢を限定する等により、この制約を考慮に入れるよう制約され得る。これは、非圧縮(ルマサブレンジの圧縮ではなく、DCT等の周波数技術のような心理視覚的な空間的圧縮を意味する)符号化に関しては容易である。圧縮符号化に関しては、例えば不完全なDCT符号化からのチェス盤構造等の問題に関してもう少し注意を払わなければならない。このようなものは実践において必ずしも問題とはならないが、時にアーティファクトは視覚的により深刻になり得り、例えばよりノイズが顕著な領域に見える。特に、オリジナルの非圧縮のLDRでは階段及び背景のヒストグラムは分かれていたが(ことによると触れていた、又は間にいくつかの未使用のコードを挟んでいた)、DCTに基づく分解の結果、復元された信号が暗い階段に割り当てられたサブレンジに含まれる明るい周囲からのいくらかの暗いチェス盤スポットを有する場合に起こり得る。更に、その階段と背景との間のgTS値に沿って大きくストレッチするトーンマッピング曲線を有する場合(例えば、2つのトーンマッピング部分の間に大きなオフセットを有する非連続な関数)、少なくとも階段の近くにおいて、背景内のそれらのスポットは著しく暗くなり得る。様々な装置(又は方法)実施形態がかかる問題に複数の方法で対処することができ、特にユーザインターフェイスがグレーダーに対話のための様々な方法を提供して、この符号化挙動を指定し得る。第1に、グレーダーがトーンマッピング曲線をより緩やかにしてもよく、そして装置は単により緩やかなマッピングの選択肢を提供してもよいし、又はグレーダーがアーティファクトが余りにひどいと判断する領域に関してのみマッピングを再指定することをグレーダーに提案することにより、これらを繰り返し(少なくとも1回繰り返して)補正してもよい。また、マッピングはいくつかのスペアコードが存在するようなものでもよい。特に、かかる挙動は2つのgTS値により容易に定めることができる。図7は、このようなシナリオを概略的に示す。このグラフでは、Luma_inがHDR画像のルマであり、luma_outがレガシーMPEGエンコーダ等を通じて送られる対応するLDR符号化である。HDR画像では、明領域は暗領域から遠く離れたルマ/輝度を有し、これはluma_in軸に沿った両者の分離から示される。論理的には両者がLuma_out(LDR)軸に沿って触れるマッピングを設計することができるが、ここでは両者の間に空のコードからなるいくらかのレンジProtRngを残すマッピングを設計する。これらのコードはLDR符号化内に存在すべきではないが、DCT分解後、チェス盤の暗部の一部がこのProtRng内に含まれ得る。しかし、HDR画像を復元するための輝度アップスケーリングを行う前に、デコーダがこれを認識して、例えば明レンジの最も低いLuma_out値にクリッピングすることにより、それらを信号から除去してもよい。この原理によれば、DCT分解後の一部のコードがLDR画像の暗レンジ内に含まれ、それらのピクセルの正しいマッピングではなく暗マッピングMapDrkの逆関数、すなわち明マッピングMpBrghtにより(場合によってはHDR画像における明レンジから遠く離れて)マッピングされ得る程度まで、保護レンジProtRngを縮小することさえできる。しかし、かかるDCTアーティファクトはチェス盤の最も暗いスポットまで数個の中間値をまたぐ構造を通常有する。よって、デコーダは、ピクセルが実際に暗い物体からのピクセルであったとしても、安全を期して、ブロック内のそれらのいくらかの誤った値から潜在的に問題が存在し得ることを検出し、DCT分解後且つ輝度アップスケーリングの前に、かかる値をLDR画像の明レンジ内の値に変更してもよい(わずかに不正確なHDR効果があるが、強い潜在的なアーティファクトも生じない)。エンコーダはブロックにこれが起こるべきか、又は放置されて単にアップスケーリングされるべきかを示すために、この"clip-to-range"のためにリザーブコード(0又は1)を使用してもよく、グレーダーは例えば問題のあるブロックをマウスによりクリックすることにより、又は結合された問題のあるブロックのセットを通してスクリブルすることにより指示してもよい。デコーダは違いを知らないかもしれないが、オリジナルの信号及び全ての情報を有するエンコーダはかかる問題が起こり得るか否かを判定できるので、HDR画像の(不正確な)再構築の後、グレーダーが例えば明るい飽和赤色として示された不正確なピクセルとそれらの実際の色との間でトグルし得る疑似カラーモードが存在してもよい。更に、いくつかの他の(対話又は相互作用的)オプションも利用可能であり、例えばグレーダーによって問題があると選択されたブロックに関して、エラーの頻度が更に低くなるようエンコーダがより多くのDCTコードワードを使用してもよいし、反対により少ないDCTブロックを使用してもよく、かかるオプションがより優れた最終的な見かけを与える場合、険しいチェスパターンは除去される。又は、例えばオリジナルのデータ又はDCT係数に小さな変更が加えられてもよく、例えば、DCT符号化の前にLDRブロックにカウンターパターンを適用することにより、最も低いチェス盤値が暗いLDRレンジに含まれることを防止してもよい。
図5は、グレーダー520によって制御されるコンテンツ作成側における可能なグレーディング装置510の一例を示す(当業者は、本発明の同じ実施形態の具現化が、例えば数学的な比色法ベース自動トランスコーディング装置又は任意の他の具現化に如何に適用されるかを理解するであろう)。
グレーディング装置510の内部には、ハイダイナミックレンジシーンの画像を符号化するための画像エンコーダ549が存在し、画像は先に例えばセルロイドフィルム又は電子デジタルカメラシステムにより取り込まれたものであり得り、特殊効果が追加されていてもよく、またビデオの場合、最終的な時間的組成シーケンス内の画像であり得る。画像エンコーダ(ここでは単純さのためにIC等のユニットであると仮定するが、いくつかの構成用語が遠隔サーバ上で動作さえし得るソフトウェアスイート等であってもよい)は典型的には様々なサブコンポーネント(典型的にはソフトウェアの制御化のもと、グレーダーがパラメータを選択することを可能にする)を含み得り、典型的には、例えば8、10、又は12ビットコードワード等のNビットコードワードのルマ、及びY_Cr及びY_Cb等の色度符号化によって定められる特定の画像表現(Im_1)に基づいて画像のピクセルカラーを符号化するよう構成されたピクセルテクスチャー符号化ユニット552の何らかの変形体を備える。VC1、VP8、及び同様のMPEGと類似の符号化からより有名でないフラクタルエンコーダまで、複数の符号化変形体が既に幅広く存在しているので、この側面を更に説明する必要はない。
より単純又は複雑な画像解析を適用できる画像解析ユニット550が任意の態様で更に含まれる。本例において示されるような専門的なグレーディング装置では、通常は多くのソフトウェアにより具現化されるアルゴリズムが利用可能であり、画像の特性及び組成を分析したい場合、並びにそれを任意に変更したい場合の両方に関して、グレーダーに画像のほぼ完全な制御を与える。グレーダーは、例えば特定の色を採取するためにピペットを使用してもよく(そして、その採取されたピクセルカラーから、例えば採取されたカラーに関して適切な比色的境界を選択することにより典型的な「物体カラー」を定めてもよい)、又は信号波形、ヒストグラム、又は領域の他の表現を見てもよい(例えば、システムは例えば疑似カラーにより領域上にルマのサブレンジをマッピングしてもよい)。グレーダーは、1つ以上の参照ディスプレイ530上でテクスチャーをより明瞭に視覚的に調査するために、例えば(一時的に)特定の領域を明るくしてもよい。グレーダーは、典型的には領域を鮮明化する、又は照明効果若しくは他の効果を適用する等の複数の画像処理を適用してもよい。グレーダーは、なげなわ等により物体の周囲に境界を描くことにより物体の境界を定めてもよい。
ここで、典型的には画像解析ユニットは少なくとも物体を領域識別グレイ値(gTS)に変換する、言い換えれば、少なくとも1つを所定の関連するgTSに物体を関連付ける。画像解析ユニットは例えば、選択された物体領域のヒストグラムを決定し、それが含む最小ルマ値が周囲領域、例えば画像全体より高いことを決定する。相互作用的処理が含まれてもよく、例えばグレーダーが最初に領域をブライトニングして、新しい最小値を画像の残りの部分、又は物体に幾何学的に関連する(例えば、物体に接する)部分の最高値より高くしてもよい。
この領域識別グレイ値gTSはフォーマッタ554に出力され、フォーマッタ554は、画像表現(Im_1)及び領域識別値(gTs)を出力画像信号(S(Im_1,MET(gTS)))内に(やはり(レガシー又は新規の)何らかの画像符号化規格の規則に従って)共符号化し得り、後者は典型的には事前に合意されたテキストのメタ―データフォーマットを有する。例えば、画像信号はBlu-ray(登録商標)ディスク511上に焼かれてもよく、又はネットワークサーバディスク又は固体メモリ等の何らかの他のメモリ上に保存されてもよく、又は画像信号を信号伝送接続等のリアルタイムで伝送してもよい。この機能をこの物理的構成において説明してきたが、他の具現化が可能であることは当業者にとって明らかであろう。
通常、グレーディング装置上でグレーディングするとき、グレーダーは少なくとも一部の物体に関してルママッピング(TOM)を決定するために、そのルママッピング決定ユニット553を同時に使用する(他の物体も当然ながら変換、ことによると恒等変換を受け得るが、その変換は例えば所定等デフォルトでもよく、又はレンダリングディスプレイ等によって選択されてもよい)。グレーダーは、第1の画像表現(例えば、入力Y_16bHDR画像)に符号化されたピクセルルマと第2の画像表現(例えば、LDR画像Im_1)のピクセルのルマとの間の、又はその逆のマッピングを定める。ルママッピング決定ユニット553は、例えばHDR画像の領域の様々な視覚的特性、及び如何にそれらがLDRコーディング内でも適切に表現され得るかを見ることによりマッピング関数を自身で数学的に決定してもよく、例えばそれを最初の提案としてグレーダーに提案してもよい。これは、例えば全体のヒストグラムの特定のサブローブ(lobe)を分離することにより、又は顔検出等の画像理解等により決定される屈曲点及び肩の曲線を有する例えばシグモイダル又は複数セグメントマッピング適用することになり得る。グレーダーはその後、例えばシグモイドの肩をシフト又は曲げることによりこの関数を微調整してもよい。我々の方法では、グレーダーはgTS値に関連してこれを実行してもよい。例えば、グレーディング装置は例えば複数セグメントマッピング曲線の一部分のための制御点であり得る重要なグレイ値(例えば999)を既に定めるかもしれないが、グレーダーはこの点を改善し得り、例えば、階段等の物体のより適切な部分が部分的ルマ(/トーン)マッピングにより変換されるよう点をシフトする。図8の例とともに、いくつかの側面を更に説明する。前述したように、本方法は、例えばHDR画像が符号化されたレガシー使用可能LDR画像(LDRコンテナ)を介して符号化されなければならない単なる符号化方法において使用することができる。その状況では、2つの画像間のマッピングのために典型的にはいくつかの固定関数しか存在しない。図8を参照して、一方で、異なるディスプレイ用に更なるグレードを決定するディスプレイ適合性の更なるシナリオにおいて、我々のシステムがgTS値とともに如何に使用され得るかを説明する。この情報は、事前にグレーディングされ(すなわち、グレーダーが少なくともかかる変換がHDR、小さなダイナミックレンジを有するサブLDR等の数個の大きく異なる参照ディスプレイ上で如何に見えるかを確認した)、典型的には1つ以上のテクスチャー画像(Im_1)に適用される様々な関数として全て画像信号内に符号化されていてもよいし、又は、良好な見かけのHDRグレード及び場合よっては良好なLDRグレードの符号化データのみが存在しており、レンダリング側において表示システム(例えば、ディスプレイ又はコンピュータ)が、そのデータ及び我々のgTS値に基づいて、例えば中間ダイナミックレンジディスプレイMDR用等の少なくとも1つの更なるグレードを決定してもよい。このグラフでは、絶対的である最終的な輝度表現を使用する。Luminance_inは、例えばある基準ディスプレイ上で見えるであろうように定められた入力信号であり得り、luminance_outは異なる輝度能力を備える様々な実際のディスプレイ上の出力レンダリング照度であり得る。低輝度物体は大部分が正しく符号化よって正しくレンダリングされ、よって両ディスプレイ(Dis1,Dis2)が恒等変換又はいくらかのコントラストストレッチであり得る同じトーンマッピングTM_FDrkを使用すると仮定する。ここで、gTSh1以上で画像内の明領域が始まり、2つの明領域が存在する(例えば、gTSh2までは沈む太陽によって照らされ、gTSh2以上ではサッカースタジアムの強い照明によって照らされる)。ディスプレイ1は非常に高いピーク輝度を有し得るので、明サブレンジを様々な視覚的照明クラスに割り当てるために大きな余裕がある。この高輝度ディスプレイのために、その領域が良好に明るく且つ高コントラストに見えるよう、第1の明領域処理トーンマッピングTM_TBri1_Dis1がオリジナルデータを大きく伸長してもよい。第2の明領域処理トーンマッピングTM_TBri2_Dis1は、その領域が太陽によって照らされる部分から大きく違って見え得るよう、その領域を非常に高いレンダリング輝度に更にオフセットしてもよく、例えば実際にスタジアム照明は非常にきつく見える。この識別はgTS値により容易に実行できる(例えば、この線型マッピングの例では、gTS値によりマッピング関数をパラメータ化さえしてもよい)。より低いピーク輝度を有するディスプレイに関しては、例えば最終的なマッピングを決定するコンピュータがgTS値によって決定される様々な領域に対して何か別のことを実行してもよい。例えば、コンピュータは低い明領域をより低コントラストのマッピング関数TM_Bri1_Dis2で処理して、スタジアム照明によって照らされる領域のためにまだいくらかのレンジを残してもよい。但し、この領域は関数TM-Bri2_Dis2によってソフトクリッピングされなければならない。
ルママッピング(TOM)は合意された画像信号規定仕様に従って、最後にフォーマッタ554により出力画像信号(S(Im_1,MET(gTS),TOM))内に共符号化される。前述と同様に、かかるマッピングは原則的に、明確に指定され、受信側と合意がなされている限り、(特に任意の出力輝度ダイナミックレンジを有する)任意の第1の基準ディスプレイ用の任意のカラー符号化仕様により決定される任意の第1の画像から、同様に任意の(特により高い又は低いピーク輝度、より小さい又は大きいダイナミックレンジ等の)第2の画像符号化にマッピングし得る。
通常、実施形態の概念に従って賢明に選択された領域識別グレイ値(gTS)を共符号化するよう構成された画像エンコーダ549は、平均輝度の領域を高い輝度の領域から、すなわち、例えばあるパーセンタイル未満のルマヒストグラムの部分と最も高いレベルのあるパーセントとの間の境界を定めるのに、特に未使用のコード(又はレンダリング輝度に基づく類似の定義)によって分離される場合、有用である。したがって、これは少なくとも1つのバーションにおいて画像が最終的に符号化されるフォーマット/色空間が何であれ(例えば、Y_8b、Y_10b、又はY_16b対象白色輝度、黒色、ガンマ曲線等の他の定義)、HDRシーン符号化において非常に有用である。なぜなら、HDRシーンは典型的には、LDR製作の場合のように、同様なシーン物体輝度、よって照度デザイナーにより使用される均一な照明を考慮したカメラ取り込み後画像ルマを有さず、逆に大きく異なる照明領域を有するからである。そして、gTS値はそれらを適切に特徴付けることができる。
したがって、基本的にグレーダーは、物体選択、物体の異なる部分(典型的にはルマサブレンジ)に対して最適なマッピング曲線を定める等の古典的な作業を画像に施すだけであり、エンコーダ549がそれを本発明の実施形態のパラメータ、例えば領域識別グレイ値gTS等に変換する。
図5において、例えば映画又は番組の製作時に、最終的な基準グレーディングとして作成された映画又はテレビ番組のマスターHDRグレーディングIM_MSTR_HDR等のビデオファイルを保持するビデオサーバ580に接続581を介してアクセスできるホームエンターテイメントコンテンツ作成システムを用いて本発明を説明した。これはその後、ホームバージョン公開用のホームシネマグレーディングに変換され、例えば8ビットMPEG-AVC画像Im_1、及び任意の提示の実施形態に係るメタデータとして符号化される。当然ながら、エンコーダは他のシステム、装置、又は使用シナリオ、例えばカメラ501からの生のカメラ信号から(例えば無線)画像ビデオ接続505を介して直接1つ以上のマスターグレードを決定するシナリオ、又はリマスタリングシナリオ等に組み込まれてもよい。
図6は、受信側システム、すなわちホームコンシューマ画像又はビデオレンダリングシステムの1つの可能な実施形態を示す。テレビ602は、例えばエアウェイを介して第1のビデオ(又は画像)信号SB(Im_1,MET)を直接受信してもよい。この例示的ビデオフィードは上記で既に説明されており、高い輝度及びHDR精度(すなわち、画像の見かけを決定する、いくつかの物体の出力輝度軸上の正確な割り当てに関しても)で映画的にレンダリングされるべきか、又は低い輝度(及び電力)で(LDRに近く)レンダリングされるべき複数の一連の画像の間(典型的には1つのコンテンツから他のコンテンツに移行、又はニュース番組内の中継等の番組内の部分)で領域識別グレイ値を使用する。更に、インターネット(I_net)への1つ以上の接続を介してビデオを取得できるビデオ処理装置601(例えばセットトップボックス又はPC等)が存在してもよい。例えば、YouTube(登録商標)サーバ等が、好ましくは単純に、且つ、多様な可能性があるレンダリングディスプレイのために汎用的に使用可能な態様で(いわゆる「ディスプレイ適合性」基準)符号化されたHDR信号を供給してもよい。例えば、HDR信号のY_8b符号化Im_1の他に、1つ以上の上記実施形態のメタデータ、及びこの画像Im_1が如何に処理され得るか(例えば、HDR画像バージョンを得るために)を指定する処理指標PROC_INDが含まれる。例えば、信号は、"receiver_determines_optimal_mapping(受信機が最適マッピングを決定)"のような指標により、受信側が複数のカラー/ルマ変換戦略を使用し得ることを指定してもよい。その場合、セットトップボックス又はテレビ等の受信装置は、例えば視聴者が視聴する室内の照明を点けている場合は第1のマッピングを、照明が消されている場合は第2のマッピングを適用するよう自身で決定してもよい。実際には、許容範囲、又はパーセントに関する変化に関連して実行可能な処理が指定されてもよく、例えば、ディスプレイが基準ディスプレイのピーク輝度のある範囲内のピーク輝度を有する場合、例えば、レンダリング側装置はグレードに1.2以下のガンマ関数であれば適用してもよい(例えば、グレードが700ニット基準ディスプレイ用に決定され、実際のディスプレイがその50%の範囲内にある場合、すなわちピーク輝度が350〜1050ニットの間にある場合、わずかに変更されてもよい)。また、処理指標は例えば具体的に決定された単一の変換、又はいくつかのかかる変換のうちの1つのみが使用可能であると指定してもよい。指標は変更可能な定義を有してもよく、これは複雑になり得る。例えば、指標がユーザインターフェイスのための詳細なガイドラインを含み、コンテンツ作成者が望む映画の最適な見かけを得るために、選択肢を介して視聴者をガイドしてもよい(例えば、暗い部分を改良する(例えば、よりカラフルにする一方でいくらか画像の雰囲気を減ずる等)数個の方法等、クリエーター承認の最適化オプションを視聴者にいくつか与える)(例えば、画像のサブセットの選択による手動較正)。通常、視聴者が最終的な制御を有するため、フォールバックシナリオが存在し、これらのガイドラインは無視又は無効化され得るが、とはいえ本実施形態は、例えばコンテンツが最終レンダリング環境(家、シネマ、屋外、(例えばサッカースタジアムにある)専門的ディスプレイ等)において如何にレンダリングされるかについてのコンテンツクリエーターのより近くでの意見等、高度な汎用性を実現可能にする。
画像デコーダ605は典型的には以下のユニットのうちの複数を備え得る。ピクセルテクスチャー復号ユニット608は、多様な基準に従って符号化され得る入力画像信号を復号するために必要なあらゆる計算を実行できるよう構成されなければならないので、例えば、新たなウェーブレットエンコーダがリリースされた場合にアップグレード可能なソフトウェアが実行されてもよい。当然ながら、信号解凍及び場合によっては分解等が実行されるが(典型的には、領域識別グレイ値等のメタデータの抽出及び場合によっては復号とともにデフォーマッタ607によって実行される)、ピクセルテクスチャー復号ユニット608は、MPEG視覚的規格等の全てのコンポーネントと同様に、例えば算術復号、逆DCTデコーディング等を実行できる。画像セグメント化ユニット606はセグメント化を行い、前述したように、これはgTS値から閾値を使用することにより容易に実行できるが、より複雑なセグメント化戦略がサポートされてもよい。その後、ピクセルカラー変換ユニット609が少なくともピクセルルマのマッピングを実行し、これは、例えば特定のIm_1ピクセルのピクセルルマ値に付属する関数PD_BLCK(i+2,j)の出力値を入力値(Luma_in)に再コーディングするほどに単純であり得る。この出力値は、HDR出力画像IM_RC_HDR内のそのピクセル位置に書き込まれる。この画像が接続688を介してテレビに送信される画像であり得る(例えば、同じくカラー変換を実行できるテレビ又は一般的なディスプレイ内の画像処理ユニット620による直接の駆動又は更なる処理のための画像)。
中間画像IM_INTRMを伴ってもよく、これは任意の基準表現であり得るが、説明を簡単にするために、ここでは8ビットルマ画像(2カラーチャネル表現のために更に8ビットワードを有する)であると仮定する。入力画像表現Im_1が(例えばDCT)圧縮されていない場合、これはIm_1の単純なコピーであり得り、そうでなければ、典型的には展開により得られた画像である。
システムは更に、携帯型ディスプレイ630(例えば、視聴者がベッドで又は寝室でテレビの視聴を続けるために使用するIPAD)へのアンテナ699等のネットワーク通信リンク手段を介したホームネットワークビデオ配信を示す。装置601は、LDR(ピーク輝度750ニットのいくらか上で終わると定められ得る)と、例えば2500ニット以上から開始する高品質HDRとの間の中間ダイナミックレンジしか有さないかもしれないこのデバイスのために別の画像信号IM_RC_MDRを最適に事前調整し得るので、実施形態の汎用性を好適に説明する。MDR画像は、場合によっては、ピクセルテクスチャーに関しては同じIm_1を、及び同じ領域識別グレイ値を使用して、しかしディスプレイレンダリング出力輝度の異なるレンジへのマッピングのために変更されたマッピング関数を使用して、IM_RC_MDRに符号化されてもよい。
また、本実施形態は、視聴者が例えばパラメータ的にマッピング関数を調整できるので、レンダリング側における改良されたユーザインターフェイス相互作用性を実現する。例えば、非常に暗い物体のブライトニングは、関数PD_BLCK(i+2,j)の傾きを制御するほどに簡単でもよい。(例えば、スマートな輝度関数を実現する)単一のボタンに触れるだけで、スマートなアルゴリズムが、美的に同調する態様で画像内の全ての物体に対して調和されたルマ変更を適用してもよいが、より複雑なユーザインターフェイスを提供することで様々な物体の制御を可能にすることもできる。例えば、テレビを見ているとき、ユーザは自身の携帯型ディスプレイ630をリモコンとして使用して、テレビの画像のコピーを、領域識別グレイ値方法によって予め選択された様々な重要な物体とともに、そのリモコンのディスプレイ上に取得し得る。その後、視聴者は、いくつかの変更により(例えば、物体の上にポップアップするいくつかのスライダー)、1つ又はいくつかの画像に関する自身の好みのレンダリングを素早く示すことができる(例えば、映画の開始時、何らかの重要な特徴的なシーン、又は一時停止コマンド時の再生されようとしているシーンの現在の画像において)。例えば、やり直しボタンが状況を回復してもよい。場合によっては、異なる日にち等、大きく異なる再生時期における無関係の番組に関する詳細を記憶することにより、人工知能を使用して、視聴者のアクションから視聴者の好みを推測してもよい。これにより、システムは視聴者が黒が真っ黒であること又は逆に明るくされることを好むことを推測し、この知識を他の画像に適用し得る。
本文書において開示されるアルゴリズム要素は、実践では(完全に又は部分的に)ハードウェア(例えば、特定用途向けICの部分)として、又は特別なデジタル信号プロセッサ又は汎用プロセッサ等の上で動作するソフトウェアとして具現化され得る。これらは、少なくともいくらかのユーザユニットが存在し得る/した(例えば、工場で、又は消費者又は他者による入力)という意味で、半自動的であり得る。
当業者は、我々の提案から、どの要素がオプションの(選択任意の)改良であり得り、他の要素と組み合わせて実現され得るか、及び、方法の(オプションの)ステップが如何に装置の各手段に対応するか(及びその逆)を理解できるであろう。本発明において、いくつかの要素が特定の関係で(例えば、ある構造において単一の形態で)開示されるからといって、本明細書において特許のために開示された同じ発明的思考に基づく実施形態として他の構成が不可能であるとは限らない。また、実践的な理由から限られた範囲の例しか説明されていないことは、他の変形例が特許請求の範囲に含まれ得ないことを意味しない。実際には、本発明の構成要素は、任意のユースチェーン(use chain)に沿って、様々な変形形態で実現可能であり、例えば、作成側のあらゆる変形例(例えばエンコーダ)は、分解されたシステムの消費側における対応する装置(例えばデコーダ)と同様又は同一であり得り、その逆も成立する。実施形態のいくつかの要素は、エンコーダとデコーダとの間の任意の伝送技術において、伝送用、又は協調等の他の用途の信号内に特定の信号データとして符号化され得る。本願において、用語「装置」はその最も広い意味、すなわち、特定の目的の実現を可能にする手段のグループを意味し、よって例えばIC(の小さい一部)、専用器具(ディスプレイを有する器具等)、又はネットワークシステムの一部等であり得る。「構成」又は「システム」も最も広い意味で使用されるよう意図され、よって特に単一の物質的な購入可能な装置、装置の一部、連携する装置の(部分の)集合等を含み得る。
コンピュータプログラム製品という表記は、プロセッサにコマンドを入力するための一連のロードステップ(中間言語、及び最終的なプロセッサ言語への変換等の中間変換ステップを含み得る)の後、汎用又は特定用途向けプロセッサが、発明の特徴的機能のいずれかを実行することを可能にするコマンドの集合のあらゆる物質的具現化を含むと理解されたい。特に、コンピュータプログラム製品は、例えばディスク又はテープ等のキャリア上のデータ、メモリ内に存在するデータ、有線又は無線ネットワーク接続を介して伝送されるデータ、又は紙上のプログラムコードとして実現され得る。プログラムコードの他に、プログラムに必要な特徴的データもコンピュータプログラム製品として具現化されてもよい。かかるデータは(部分的に)任意の方法で供給され得る。
本発明、又はビデオデータ等の本実施形態の任意の哲学に基づいて使用可能なあらゆるデータは、光学ディスク、フラッシュメモリ、リムーバブルハードディスク、無線手段を介して書き込み可能な携帯型デバイス等のリムーバブルメモリであり得るデータキャリア上の信号として具現化されてもよい。
データ入出力ステップ、及び標準的なディスプレイ駆動等の周知の通常組み込まれる処理ステップ等、任意の提案される方法の動作に必要なステップの一部は、(本発明の実施形態の詳細とともに)本明細書で説明されるコンピュータプログラム製品若しくは任意のユニット、装置又は方法において説明される代わりに、本発明のプロセッサ又は任意の装置の実施形態の機能内に既に存在してもよい。また、例えば方法の任意のステップに又は装置の任意のサブ部分に含まれる(関与する)特定の新規の信号、及びかかる信号の新規な使用又は任意の関連する方法等の結果物及び同様の結果に関しても、保護を求める。
上記実施形態は本発明を限定ではなく説明することに留意されたい。当業者は、提案された例の特許請求の範囲の他の分野への転用を容易に認識することができるが、簡潔さのために、それらのオプションの全ては詳細に述べていない。特許請求の範囲において組み合わせられる本発明の要素の組み合わせの他に、要素の他の組み合わせも可能である。任意の要素の組み合わせが、単一の専用要素において実現され得る。
請求項における括弧間のあらゆる参照符号は請求項を限定することを意図せず、図面内の特定の参照符号も同様である。用語「含む(又は有する若しくは備える等)」は請求項内に列挙されていない要素又は特徴の存在を除外しない。要素は複数を除外しない。
以上の各実施例に関し、さらに以下の付記を開示する。
〔付記〕
(付記1)ハイダイナミックレンジシーンの画像を符号化するための画像エンコーダであって、
−前記画像のピクセルカラーをNビットのコードワードを含む画像表現によって符号化するピクセルテクスチャー符号化ユニットと、
−領域識別グレイ値を決定して出力する画像解析ユニットであって、ルマ値である前記領域識別グレイ値は、前記領域識別グレイ値未満において、前記画像の少なくとも1つのブロック内の第1の物体の全てのピクセルのルマを画定し、前記領域識別グレイ値より上において、前記画像の前記少なくとも1つのブロック内の第2の物体の全てのピクセルのルマを画定する、画像解析ユニットと、
−前記画像表現及び前記領域識別グレイ値を出力画像信号内に共符号化するフォーマッタと
を含む、画像エンコーダ。
(付記2)
前記画像表現内に符号化されたピクセルのルマと、第2の画像表現内のピクセルのルマとの間のマッピングを定める、前記第1及び第2の物体のうちの少なくとも1つの物体のためのルママッピングを決定して、前記ルママッピングを前記出力画像信号内に共符号化する前記フォーマッタに前記ルママッピングを供給するルママッピング決定ユニットを含む、付記1に記載の画像エンコーダ。
(付記3)
前記第1及び第2の画像表現のうちの1つがハイダイナミックレンジ表現であり、ピーク輝度が750ニットより上の基準ディスプレイ用に符号化される、付記1又は2に記載の画像エンコーダ。
(付記4)
前記画像表現からの前記ピクセルカラーを符号化する前記Nビットのコードワードのいくつかを含む空間的画像セクション間に、いくつかの領域識別グレイ値を符号化する、付記1に記載の画像エンコーダ。
(付記5)
一連の複数の連続する画像の前に、当該連続する画像全てのための領域識別グレイ値を符号化する、付記1に記載の画像エンコーダ。
(付記6)
少なくとも1つの領域識別グレイ値のそれぞれを前記画像表現の適用可能な幾何学的領域に関連付けることを可能にする幾何学的関連付けコードとともに、前記画像表現を記憶するメモリに物理的に隣接しないメモリ内に当該少なくとも1つの領域識別グレイ値を符号化し、前記幾何学的関連付けコードは、典型的には前記画像表現のブロックの座標を少なくとも含む、付記1に記載の画像エンコーダ。
(付記7)
領域識別グレイ値の第1のリザーブ値を前記出力画像信号内に符号化し、前記第1のリザーブ値は、前記第1のリザーブ値によって識別可能な位置から前記画像の走査方向に沿って広がる、前記画像表現の少なくとも1つの幾何学領域に関して、所定のアルゴリズムに従って、前記画像表現内に符号化されたピクセル値から第2の画像表現内のピクセル値への変換が実行されることを示す、付記1乃至6のいずれか一項に記載の画像エンコーダ。
(付記8)
領域識別グレイ値の第2のリザーブ値を前記出力画像信号内に符号化し、前記第2のリザーブ値は、少なくとも1つの連続画像に関して、ディスプレイが、所定の値未満の最大出力輝度でレンダリングすべきことを示す、付記1乃至7のいずれか一項に記載の画像エンコーダ。
(付記9)
前記ルママッピング決定ユニットは、変換リンク規則を介して、前記第1及び第2の物体のうちの少なくとも1つのためにいくつかの異なるルママッピングを決定するか、又は、処理指標を用いて、前記第1及び第2の物体のうちの少なくとも1つの物体のピクセルカラーを前記第2の画像表現の新しいカラー表現に変換するために、いくつかの異なるルママッピングが使用され得ることを示す、付記2に記載の画像エンコーダ。
(付記10)
ハイダイナミックレンジシーンの符号化された画像表現を復号するための画像デコーダであって、
−前記符号化された画像表現から、復号された画像のピクセルのピクセルカラーを取得するピクセルテクスチャー復号ユニットと、
−前記符号化された画像表現から、領域識別グレイ値を抽出するデフォーマッタと
を含む、画像デコーダ。
(付記11)
前記領域識別グレイ値を使用して、前記復号された画像において、低いルマのセグメントと高いルマのセグメントとを取得する画像セグメント化ユニットを含む、付記10に記載の画像デコーダ。
(付記12)
前記ピクセルカラーの少なくともルマ値を変換する第1のカラー変換を、前記低いルマのセグメント内のピクセルに適用し、前記ピクセルカラーの少なくともルマ値を変換する第2のカラー変換を、前記高いルマのセグメント内のピクセルに適用するピクセルカラー変換ユニットを含む、付記11に記載の画像デコーダ。
(付記13)
前記デフォーマッタが、例えば0又は255の値等のリザーブ値の領域識別グレイ値を抽出する場合、前記第1及び第2の物体の少なくとも1つの物体の前記ピクセルカラーに特定のカラー変換戦略を適用する、付記10に記載の画像デコーダ。
(付記14)
前記符号化された画像表現のデータのいずれとも関連付けられていないメモリソースからピクセルカラー変換戦略を選択する変換決定ユニットを含む、付記10乃至13のいずれか一項に記載の画像デコーダ。
(付記15)
前記変換決定ユニットは、前記ディスプレイの特徴、又は周囲照明のレベル等のレンダリング環境の少なくとも1つのパラメータに基づいて前記ピクセルカラー変換戦略を決定する、付記14に記載の画像デコーダ。
(付記16)
前記符号化された画像表現及び前記領域識別グレイ値を、物理的に別々のメモリから取得し、前記領域識別グレイ値を、前記符号化された画像表現の幾何学的部分と関連付ける、付記10乃至15のいずれか一項に記載の画像デコーダ。
(付記17)
ハイダイナミックレンジシーンの画像を符号化するための画像符号化方法であって、
−Nビットのコードワードを含む画像表現によって前記画像のピクセルカラーを符号化するステップと、
−領域識別グレイ値を決定及び出力するステップであって、ルマ値である領域識別グレイ値は、前記領域識別グレイ値未満において、前記画像の少なくとも1つのブロック内の第1の物体の全てのピクセルのルマを画定し、前記領域識別グレイ値より上において、前記画像の前記少なくとも1つのブロック内の第2の物体の全てのピクセルのルマを画定する、ステップと、
−前記画像表現及び前記領域識別グレイ値を出力画像信号内に共符号化するステップと
を含む、方法。
(付記18)
ハイダイナミックレンジシーンの符号化された画像表現を復号するための画像復号方法であって、−前記符号化された画像表現から、復号された画像のピクセルのピクセルカラーを取得するステップと、
−前記符号化された画像表現から、領域識別グレイ値を抽出するステップと
を含む、方法。
(付記19)
付記17又は18に記載の方法を実行するための処理を実現可能にするソフトウェアコードを含むコンピュータプログラム。
(付記20)
ハイダイナミックレンジシーンの領域のカラーを符号化する画像信号であって、前記画像信号は、前記領域のカラーの少なくとも輝度を符号化するNビットのコードワード、及び領域識別グレイ値を含み、前記領域識別グレイ値は、前記領域のカラーの少なくとも輝度を符号化する前記Nビットのコードワードを符号化するために使用されるコードシステムで、前記ハイダイナミックレンジシーン内のより高い輝度を有するピクセルの少なくとも1つの第1の幾何学的領域、又は当該領域を符号化するNビットのコードワードのより高い値と、前記ハイダイナミックレンジシーン内のより低い輝度を有するピクセルの少なくとも1つの第2の幾何学的領域、又は当該領域を符号化するNビットのコードワードのより低い値との間の境界を示す、画像信号。
(付記21)
付記20に記載の信号を記憶する例えばBlu-ray(登録商標)ディスク等のリムーバブルメモリ等のメモリ。
(付記22)
付記1乃至21に記載の任意の画像エンコーダ、画像デコーダ、方法、画像信号を使用する、任意のネットワーク技術を介するビデオ配信システム。

Claims (10)

  1. 画像デコーダであって、
    ハイダイナミックレンジシーンの符号化された画像表現から復号された画像のピクセルのピクセルカラーを取得するピクセルテクスチャー復号ユニットと、
    前記符号化された画像表現からのメタデータから領域識別グレイ値を抽出するデフォーマッタと、
    を有し、
    ルマ値である前記領域識別グレイ値は、前記領域識別グレイ値未満において、前記画像の少なくとも1つのブロック内の第1のオブジェクトの全てのピクセルのルマを画定し、前記領域識別グレイ値より上において、前記画像の前記少なくとも1つのブロック内の第2のオブジェクトの全てのピクセルのルマを画定する、画像デコーダ。
  2. 第2の画像表現を取得するために、前記領域識別グレイ値未満又は前記領域識別グレイ値より上のルマのピクセルに対して前記ピクセルカラーの少なくともルマ値を変換するカラー変換を適用するピクセルカラー変換ユニットを更に有する、請求項1記載の画像デコーダ。
  3. 前記デフォーマッタは、前記符号化された画像表現から前記ピクセルカラー変換ユニットによって使用されるルママッピングを抽出する、請求項1又は2に記載の画像デコーダ。
  4. 前記符号化された画像表現のデータのいずれとも関連付けられていないメモリソースからピクセルカラー変換戦略を選択する変換決定ユニットを有する、請求項1乃至3のいずれか1項に記載の画像デコーダ。
  5. 前記変換決定ユニットは、レンダリング環境の少なくとも1つのパラメータに基づいて前記ピクセルカラー変換戦略を決定する、請求項1乃至4のいずれか1項に記載の画像デコーダ。
  6. ハイダイナミックレンジシーンの符号化された画像表現を復号するための画像復号方法であって、
    前記符号化された画像表現から復号された画像のピクセルのピクセルカラーを取得するステップと、
    前記符号化された画像表現からのメタデータから領域識別グレイ値を抽出するステップと、
    を有し、
    ルマ値である前記領域識別グレイ値は、前記領域識別グレイ値未満において、前記画像の少なくとも1つのブロック内の第1のオブジェクトの全てのピクセルのルマを画定し、前記領域識別グレイ値より上において、前記画像の前記少なくとも1つのブロック内の第2のオブジェクトの全てのピクセルのルマを画定する、方法。
  7. 第2の画像表現を取得するために、前記領域識別グレイ値未満又は前記領域識別グレイ値より上のルマのピクセルに対して前記ピクセルカラーの少なくともルマ値を変換するカラー変換を適用するステップを更に有する、請求項6記載の方法。
  8. 前記抽出するステップは、前記符号化された画像表現から前記適用するステップによって使用されるルママッピングを抽出する、請求項6又は7に記載の方法。
  9. 前記符号化された画像表現のデータのいずれとも関連付けられていないメモリソースからピクセルカラー変換戦略を選択するステップを有する、請求項6乃至8のいずれか1項に記載の方法。
  10. 前記選択するステップは、レンダリング環境の少なくとも1つのパラメータに基づいて前記ピクセルカラー変換戦略を決定する、請求項6乃至9のいずれか1項に記載の方法。
JP2017238361A 2012-03-26 2017-12-13 Hdr画像符号化及び復号のための輝度領域ベース装置及び方法 Active JP6526776B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261615409P 2012-03-26 2012-03-26
US61/615,409 2012-03-26

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015502508A Division JP6262198B2 (ja) 2012-03-26 2013-03-25 Hdr画像符号化及び復号のための輝度領域ベース装置及び方法

Publications (2)

Publication Number Publication Date
JP2018061288A JP2018061288A (ja) 2018-04-12
JP6526776B2 true JP6526776B2 (ja) 2019-06-05

Family

ID=48325815

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015502508A Active JP6262198B2 (ja) 2012-03-26 2013-03-25 Hdr画像符号化及び復号のための輝度領域ベース装置及び方法
JP2017238361A Active JP6526776B2 (ja) 2012-03-26 2017-12-13 Hdr画像符号化及び復号のための輝度領域ベース装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015502508A Active JP6262198B2 (ja) 2012-03-26 2013-03-25 Hdr画像符号化及び復号のための輝度領域ベース装置及び方法

Country Status (14)

Country Link
US (2) US9420288B2 (ja)
EP (1) EP2880624B1 (ja)
JP (2) JP6262198B2 (ja)
KR (1) KR102014127B1 (ja)
CN (1) CN104541301B (ja)
BR (1) BR112014023535B1 (ja)
ES (1) ES2737993T3 (ja)
HU (1) HUE044859T2 (ja)
MX (1) MX337444B (ja)
PL (1) PL2880624T3 (ja)
PT (1) PT2880624T (ja)
RU (1) RU2643663C2 (ja)
TR (1) TR201911093T4 (ja)
WO (1) WO2013144809A2 (ja)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2873237B1 (en) 2012-07-13 2022-03-30 Koninklijke Philips N.V. Improved hdr image decoding methods and devices
JP2015008361A (ja) * 2013-06-24 2015-01-15 ソニー株式会社 再生装置、再生方法、および記録媒体
CN105379263B (zh) * 2013-11-13 2017-09-22 杜比实验室特许公司 用于指导图像的显示管理的方法和设备
KR20150083429A (ko) * 2014-01-08 2015-07-17 한국전자통신연구원 Dash를 사용하는 비디오 재생을 위한 비트 깊이 표현 방법
US9854176B2 (en) * 2014-01-24 2017-12-26 Lucasfilm Entertainment Company Ltd. Dynamic lighting capture and reconstruction
KR102077435B1 (ko) * 2014-02-07 2020-02-13 소니 주식회사 송신 장치, 송신 방법, 수신 장치, 수신 방법, 표시 장치 및 표시 방법
CN110177276B (zh) * 2014-02-26 2021-08-24 杜比实验室特许公司 处理视频图像的空间区域的方法、存储介质及计算装置
WO2015174108A1 (ja) * 2014-05-15 2015-11-19 ソニー株式会社 通信装置及び通信方法、並びにコンピューター・プログラム
CN110489073B (zh) * 2014-06-10 2023-09-01 松下知识产权经营株式会社 变换方法及变换装置
WO2015198553A1 (ja) * 2014-06-26 2015-12-30 パナソニックIpマネジメント株式会社 データ出力装置、データ出力方法及びデータ生成方法
CN111901599A (zh) 2014-06-27 2020-11-06 松下知识产权经营株式会社 再现装置
KR101809967B1 (ko) * 2014-08-08 2017-12-18 엘지전자 주식회사 디스플레이 적응적 영상 재생을 위한 비디오 데이터 처리 방법 및 장치
JP6331882B2 (ja) 2014-08-28 2018-05-30 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
JP6619813B2 (ja) * 2014-12-11 2019-12-11 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 特定のディスプレイに対する高ダイナミックレンジ画像の最適化
JP6862830B2 (ja) * 2014-12-29 2021-04-21 ソニーグループ株式会社 送信装置、送信方法、受信装置および受信方法
WO2016120085A1 (en) * 2015-01-29 2016-08-04 Koninklijke Philips N.V. Local dynamic range adjustment color processing
US9552531B2 (en) 2015-01-30 2017-01-24 Sony Corporation Fast color-brightness-based methods for image segmentation
WO2016119979A1 (en) 2015-01-30 2016-08-04 Koninklijke Philips N.V. Simple but versatile dynamic range coding
RU2678483C1 (ru) 2015-03-02 2019-01-29 Долби Лэборетериз Лайсенсинг Корпорейшн Контент-адаптивный перцепционный квантизатор для изображений с высоким динамическим диапазоном
US20180167597A1 (en) * 2015-05-29 2018-06-14 Thomson Licensing Methods, apparatus, and systems for hdr tone mapping operator
US10165198B2 (en) 2015-06-02 2018-12-25 Samsung Electronics Co., Ltd. Dual band adaptive tone mapping
KR102403360B1 (ko) * 2015-06-16 2022-05-30 광운대학교 산학협력단 하위 호환성을 고려한 hdr 영상 복호화 장치에서 다이나믹 레인지 매핑 정보를 이용하는 방법 및 장치
US10007412B2 (en) * 2015-06-24 2018-06-26 Samsung Electronics Co., Ltd. Tone mastering system with creative intent metadata
US10043487B2 (en) 2015-06-24 2018-08-07 Samsung Electronics Co., Ltd. Apparatus and method for split screen display on mobile device
EP3131284A1 (en) * 2015-08-13 2017-02-15 Thomson Licensing Methods, systems and aparatus for hdr to hdr inverse tone mapping
EP3329673A1 (en) * 2015-08-28 2018-06-06 ARRIS Enterprises LLC Color volume transforms in coding of high dynamic range and wide color gamut sequences
CN108027978B (zh) * 2015-09-18 2023-09-22 交互数字Vc控股公司 用于hdr编码/解码的颜色分量采样的同位置亮度采样的确定
KR101985880B1 (ko) * 2015-09-30 2019-09-03 삼성전자주식회사 디스플레이 장치 및 이의 제어 방법
JP6624877B2 (ja) * 2015-10-15 2019-12-25 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP6611576B2 (ja) * 2015-11-30 2019-11-27 キヤノン株式会社 画像処理装置および画像処理方法
JP6495552B2 (ja) 2015-12-17 2019-04-03 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 画像及びビデオのためのダイナミックレンジ符号化
CN108431886B (zh) * 2015-12-21 2021-07-20 皇家飞利浦有限公司 针对特定显示器优化高动态范围图像
CN105744157A (zh) * 2016-02-02 2016-07-06 西安电子科技大学 一种图像像素采样值转换、采样值处理方法及装置
JP6451669B2 (ja) * 2016-03-04 2019-01-16 ソニー株式会社 評価装置、評価方法およびカメラシステム
JP6460014B2 (ja) * 2016-03-04 2019-01-30 ソニー株式会社 信号処理装置、信号処理方法およびカメラシステム
EP3430795A1 (en) * 2016-03-14 2019-01-23 Koninklijke Philips N.V. Saturation processing specification for dynamic range mappings
EP3432065B1 (en) * 2016-03-17 2022-05-18 Panasonic Intellectual Property Management Co., Ltd. Comparison device
MX2018011332A (es) 2016-03-18 2019-01-31 Koninklijke Philips Nv Codificacion y decodificacion de videos de alto intervalo dinamico (hdr).
DE102016003681A1 (de) * 2016-03-24 2017-09-28 Universität Stuttgart Datenkompression mittels adaptiven Unterabtastens
GB2549521A (en) * 2016-04-21 2017-10-25 British Broadcasting Corp Method and apparatus for conversion of dynamic range of video signals
US10699391B2 (en) 2016-04-29 2020-06-30 Disney Enterprises, Inc. Dynamic range expansion highlight information restoration
TWI612334B (zh) * 2016-08-10 2018-01-21 國立臺灣大學 透視裝置的光度補償方法與系統
WO2018070822A1 (ko) * 2016-10-14 2018-04-19 엘지전자 주식회사 적응적 영상 재생을 위한 데이터 처리 방법 및 장치
CN107995497B (zh) * 2016-10-26 2021-05-28 杜比实验室特许公司 高动态范围视频的屏幕自适应解码
US10192295B2 (en) * 2016-11-09 2019-01-29 AI Analysis, Inc. Methods and systems for normalizing images
US10218952B2 (en) 2016-11-28 2019-02-26 Microsoft Technology Licensing, Llc Architecture for rendering high dynamic range video on enhanced dynamic range display devices
US10104334B2 (en) 2017-01-27 2018-10-16 Microsoft Technology Licensing, Llc Content-adaptive adjustment of display device brightness levels when rendering high dynamic range content
US10176561B2 (en) 2017-01-27 2019-01-08 Microsoft Technology Licensing, Llc Content-adaptive adjustments to tone mapping operations for high dynamic range content
US10638144B2 (en) 2017-03-15 2020-04-28 Facebook, Inc. Content-based transcoder
US10453221B2 (en) 2017-04-10 2019-10-22 Intel Corporation Region based processing
CN111033521A (zh) * 2017-05-16 2020-04-17 雅腾帝卡(私人)有限公司 用于文化制品的分析的数字数据细节处理
US10728559B2 (en) * 2017-07-07 2020-07-28 Qualcomm Incorporated Precision of computation and signaling of dynamic range adjustment and color remapping information
US11252401B2 (en) 2017-08-07 2022-02-15 Dolby Laboratories Licensing Corporation Optically communicating display metadata
EP3676762B1 (en) * 2017-08-31 2022-05-18 HP Indigo B.V. Generating rasterized modified images from a rasterized seed image
EP3451677A1 (en) * 2017-09-05 2019-03-06 Koninklijke Philips N.V. Graphics-safe hdr image luminance re-grading
CN108063947B (zh) * 2017-12-14 2021-07-13 西北工业大学 一种基于像素纹理的无损参考帧压缩方法
US10546554B2 (en) 2018-03-26 2020-01-28 Dell Products, Lp System and method for adaptive tone mapping for high dynamic ratio digital images
GB2572571B (en) * 2018-04-03 2021-09-01 Apical Ltd Image processing
JP6652153B2 (ja) * 2018-04-26 2020-02-19 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10863157B2 (en) 2018-07-06 2020-12-08 Samsung Electronics Co., Ltd. Guided tone mapping of high dynamic range video based on a Bezier curve for presentation on a display device
US10957024B2 (en) 2018-10-30 2021-03-23 Microsoft Technology Licensing, Llc Real time tone mapping of high dynamic range image data at time of playback on a lower dynamic range display
WO2020091766A1 (en) * 2018-10-31 2020-05-07 Hewlett-Packard Development Company, L.P. Luminance-biased sharpening for thermal media printing
US10885612B2 (en) 2018-10-31 2021-01-05 Hewlett-Packard Development Company, L.P. Luminance-biased sharpening for thermal media printing
US10880354B2 (en) 2018-11-28 2020-12-29 Netflix, Inc. Techniques for encoding a media title while constraining quality variations
US10841356B2 (en) * 2018-11-28 2020-11-17 Netflix, Inc. Techniques for encoding a media title while constraining bitrate variations
CN110390664A (zh) * 2018-11-30 2019-10-29 武汉滨湖电子有限责任公司 一种基于孔洞填充路面裂缝识别方法
CN110163816B (zh) * 2019-04-24 2021-08-31 Oppo广东移动通信有限公司 图像信息的处理方法、装置、存储介质及电子设备
US11093671B2 (en) 2019-09-06 2021-08-17 Beamup Ltd. Structural design systems and methods to define areas of interest for modeling and simulation-based space planning
CN110691254B (zh) * 2019-09-20 2022-01-18 中山大学 一种多功能视频编码的快速判决方法、系统及存储介质
US11473971B2 (en) * 2019-09-27 2022-10-18 Apple Inc. Ambient headroom adaptation
CN113703881A (zh) * 2020-05-22 2021-11-26 北京小米移动软件有限公司 显示方法、装置及存储介质
CN111784598B (zh) * 2020-06-18 2023-06-02 Oppo(重庆)智能科技有限公司 色调映射模型的训练方法、色调映射方法及电子设备
US11330196B2 (en) 2020-10-12 2022-05-10 Microsoft Technology Licensing, Llc Estimating illumination in an environment based on an image of a reference object
CN114519683A (zh) * 2020-11-20 2022-05-20 北京晶视智能科技有限公司 图像处理方法及应用其的图像处理装置
CN112435201B (zh) * 2020-12-07 2022-08-02 中国人民解放军国防科技大学 一种编码模板标定方法、装置、计算机设备和存储介质
US11601665B2 (en) * 2021-06-23 2023-03-07 Microsoft Technology Licensing, Llc Embedding frame masks in a video stream
CN115601267B (zh) * 2022-10-31 2023-04-07 哈尔滨理工大学 一种具有局部细节补偿能力的全局色阶映射方法
CN116193242B (zh) * 2023-04-24 2023-07-14 北京城建智控科技股份有限公司 一种摄像装置图像解析与传输方法
CN117395380B (zh) * 2023-12-12 2024-02-23 上海伯镭智能科技有限公司 一种大型矿区无人驾驶矿车调度数据智能管理方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2670979A1 (fr) * 1990-12-21 1992-06-26 Philips Electronique Lab Procede de segmentation binaire locale d'images numerisees, par seuillage d'histogramme.
JP3427820B2 (ja) * 1999-06-14 2003-07-22 株式会社ニコン 圧縮符号化方法,圧縮符号化プログラムを記録した記録媒体,および圧縮符号化方法を実施する電子カメラ
CN1314053A (zh) 1999-06-14 2001-09-19 株式会社尼康 压缩编码方法,记录压缩编码程序的记录媒体,以及照相装置
US7349574B1 (en) * 2002-10-11 2008-03-25 Sensata Technologies, Inc. System and method for processing non-linear image data from a digital imager
TWI235706B (en) * 2003-04-07 2005-07-11 Sumitomo Heavy Industries Method of controlling injection molding machine
CN100481117C (zh) * 2004-03-15 2009-04-22 武汉矽感科技有限公司 一种二维条码编解码方法
US7480421B2 (en) * 2005-05-23 2009-01-20 Canon Kabushiki Kaisha Rendering of high dynamic range images
US7557817B2 (en) * 2005-08-23 2009-07-07 Seiko Epson Corporation Method and apparatus for overlaying reduced color resolution images
WO2007082562A2 (en) * 2006-01-23 2007-07-26 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. High dynamic range codecs
JP5317955B2 (ja) * 2006-03-31 2013-10-16 コーニンクレッカ フィリップス エヌ ヴェ 複数の視野の効率的な符号化
JP4637812B2 (ja) 2006-11-09 2011-02-23 オリンパス株式会社 画像信号処理装置、画像信号処理プログラム、画像信号処理方法
MX2009005564A (es) * 2006-11-27 2009-08-13 Dolby Lab Licensing Corp Aparato y metodos para incrementar intervalo dinamico en imagenes digitales.
CN101682758A (zh) * 2006-12-19 2010-03-24 皇家飞利浦电子股份有限公司 用于对图像信号进行编码的方法和系统、经编码的图像信号、用于对图像信号进行解码的方法和系统
EP2116044A2 (en) * 2007-01-30 2009-11-11 Fergason Patent Properties, LLC Image acquistion and display system and method using information derived from an area of interest in a video image implementing system synchronized brightness control and use of metadata
US8085852B2 (en) 2007-06-26 2011-12-27 Mitsubishi Electric Research Laboratories, Inc. Inverse tone mapping for bit-depth scalable image coding
US8165393B2 (en) * 2008-06-05 2012-04-24 Microsoft Corp. High dynamic range texture compression
ES2389458T3 (es) * 2008-07-10 2012-10-26 The University Of Warwick Métodos y dispositivos para la compresión de datos de vídeo HDR
RU2504011C2 (ru) * 2009-03-13 2014-01-10 Долби Лабораторис Лайсэнзин Корпорейшн Многоуровневое сжатие видеоизображения с расширенным динамическим диапазоном, визуальным динамическим диапазоном и широкой цветовой гаммой
US8885977B2 (en) * 2009-04-30 2014-11-11 Apple Inc. Automatically extending a boundary for an image to fully divide the image
CN102422322B (zh) * 2009-05-11 2015-01-21 杜比实验室特许公司 用于在目标环境下在装置处再现来自源环境的图像的色貌的方法和设备
WO2011002505A1 (en) * 2009-06-29 2011-01-06 Thomson Licensing Zone-based tone mapping
WO2011000392A1 (en) * 2009-07-02 2011-01-06 Hi-Key Limited Method and camera system for improving the contrast of a camera image
CN101991568B (zh) 2009-08-12 2012-02-08 上海张江中药现代制剂技术工程研究中心 洋川芎内酯i在制备抗抑郁症药物、偏头痛药物及其他5-羟色胺能系统相关疾病药物中的应用
JP5899120B2 (ja) * 2010-03-03 2016-04-06 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. カラーレジームを定義する装置及び方法
WO2012004709A1 (en) 2010-07-06 2012-01-12 Koninklijke Philips Electronics N.V. Generation of high dynamic range images from low dynamic range images
CN103891294B (zh) 2011-04-28 2017-09-01 皇家飞利浦有限公司 用于hdr图像编码和解码的装置与方法

Also Published As

Publication number Publication date
US9420288B2 (en) 2016-08-16
PT2880624T (pt) 2019-08-26
CN104541301A (zh) 2015-04-22
BR112014023535A2 (ja) 2017-06-20
PL2880624T3 (pl) 2019-12-31
RU2014142986A (ru) 2016-05-20
US10057600B2 (en) 2018-08-21
MX337444B (es) 2016-03-07
JP2018061288A (ja) 2018-04-12
WO2013144809A2 (en) 2013-10-03
BR112014023535B1 (pt) 2022-06-14
EP2880624A2 (en) 2015-06-10
TR201911093T4 (tr) 2019-08-21
KR20140146628A (ko) 2014-12-26
JP2015517250A (ja) 2015-06-18
EP2880624B1 (en) 2019-05-08
CN104541301B (zh) 2017-11-03
RU2643663C2 (ru) 2018-02-02
US20170208344A1 (en) 2017-07-20
MX2014011418A (es) 2014-12-04
KR102014127B1 (ko) 2019-08-26
ES2737993T3 (es) 2020-01-17
HUE044859T2 (hu) 2019-11-28
JP6262198B2 (ja) 2018-01-17
WO2013144809A3 (en) 2015-02-19
US20150117791A1 (en) 2015-04-30

Similar Documents

Publication Publication Date Title
JP6526776B2 (ja) Hdr画像符号化及び復号のための輝度領域ベース装置及び方法
JP6700322B2 (ja) 改善されたhdrイメージ符号化及び復号化方法、装置
JP6009538B2 (ja) Hdr画像を符号化及び復号するための装置及び方法
JP6368385B2 (ja) イメージ・グレーディングを分析するための装置及び方法
JP6495552B2 (ja) 画像及びビデオのためのダイナミックレンジ符号化
JP6382805B2 (ja) 改良されたhdr画像符号化及び復号方法並びに装置
JP2022058724A (ja) Hdr画像をエンコードする方法及び装置
KR20180119684A (ko) Hdr 비디오의 인코딩 및 디코딩
CN108886623B (zh) 用于高对比度剧场显示的信号编码和解码

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181227

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190508

R150 Certificate of patent or registration of utility model

Ref document number: 6526776

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250