JP2023130222A - 画像処理装置、制御方法及びプログラム - Google Patents
画像処理装置、制御方法及びプログラム Download PDFInfo
- Publication number
- JP2023130222A JP2023130222A JP2022034770A JP2022034770A JP2023130222A JP 2023130222 A JP2023130222 A JP 2023130222A JP 2022034770 A JP2022034770 A JP 2022034770A JP 2022034770 A JP2022034770 A JP 2022034770A JP 2023130222 A JP2023130222 A JP 2023130222A
- Authority
- JP
- Japan
- Prior art keywords
- image
- value
- range
- brightness
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims description 40
- 239000002131 composite material Substances 0.000 claims abstract description 42
- 238000006243 chemical reaction Methods 0.000 claims description 35
- 230000015572 biosynthetic process Effects 0.000 claims description 31
- 238000003786 synthesis reaction Methods 0.000 claims description 31
- 210000003127 knee Anatomy 0.000 claims description 10
- 238000013139 quantization Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 abstract 6
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000003384 imaging method Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000001308 synthesis method Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000011946 reduction process Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/741—Circuitry for compensating brightness variation in the scene by increasing the dynamic range of the image compared to the dynamic range of the electronic image sensors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/60—Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/20—Circuitry for controlling amplitude response
- H04N5/202—Gamma control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20208—High dynamic range [HDR] image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3871—Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/407—Control or modification of tonal gradation or of extreme levels, e.g. background level
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Image Processing (AREA)
- Studio Devices (AREA)
- Studio Circuits (AREA)
Abstract
【課題】ダイナミックレンジの異なる画像を好適に合成した合成画像を生成する。【解決手段】画像処理装置は、第1の画像と、当該第1の画像よりもダイナミックレンジの広い第2の画像と、を取得する第1の取得手段と、第1の画像のダイナミックレンジを変換することで変換画像を生成する変換手段と、変換手段により生成された変換画像と第2の画像とを合成して合成画像を生成する生成手段と、を有し、変換手段は、第2の画像に基づいて合成レンジを決定し、第1の画像のダイナミックレンジを当該合成レンジに変換する。【選択図】図3
Description
本発明は、画像処理装置、制御方法及びプログラムに関し、特に、ダイナミックレンジの異なる画像を合成する技術に関する。
複数の撮像画像を合成することで、各撮像画像に表れる像が重ね合わせられた多重露出表現の合成画像を生成する技術がある。多重露出表現に係る合成手法には、合成する複数の画像の同位置の画素値を加算する加算合成や、輝度の高い方の画素値を合成後の画像値とする比較明合成、輝度の低い方の画素値を合成後の画素値とする比較暗合成等がある。
JPEG等の一般的なsRGB8Bitの画像は、標準ダイナミックレンジ(SDR:Standard Dynamic Range)の画像であり、撮像シーンの輝度(シーン輝度)が0~255の範囲の画素値で表現されている。このようなSDR画像同士を合成して多重露出表現の合成画像を得る場合、出力される合成画像も、各画素値が0~255の範囲で表現したSDR画像となる。
また、近年ではLED等の発光素子の性能が向上し、従来よりも表示輝度のダイナミックレンジが広いHDRディスプレイと呼ばれる表示装置が登場しており、SDR画像より広いダイナミックレンジに対応した階調表現の画像を表示することができる。従って、撮像装置の中には、このような表示装置において各輝度域の色やディテールの表現が確認可能なよう、高ダイナミックレンジ(HDR:High Dynamic Range)の画像を記録可能なものも存在する。このようなHDR画像は、シーン輝度を一般に10Bit、即ち、0~1023の範囲の表示輝度に変換して画素値として有している。
ところで、HDR画像とSDR画像とはこのように画素値の分解能が異なるため、多重露出表現のような合成画像を生成する場合に、単純に合成することができない。特許文献1には、SDR画像とHDR画像を表示可能な表示装置において、これらを合成した画像を好適な状態で表示可能にすべく、SDR画像の輝度レンジをHDR画像の輝度レンジにマッピングしたHDRの合成画像を生成して出力する技術が開示されている。具体的には特許文献1では、画像処理装置は、表示装置固有の最大輝度等の輝度範囲を示す情報を取得し、SDR画像をHDRの輝度レンジの階調に変換し、HDR画像と合成する手法を採用している。
ところで、HDR画像における映像信号レベルと表示輝度との関係を表す信号特性は、EOTF(Electro-Optical Transfer Function:電気光伝達関数)で規定されており、以下の2種類の方式が採用されている。1つは、ARIB STD-B67で規格化されているHLG(Hybrid Log Gamma)方式であり、映像信号レベルを表示輝度の相対値に変換するため、表示装置が出力可能な最大輝度に応じた表示輝度になる。もう1つは、SMPTE ST 2084またはITU-R BT.2100で規格化されているPQ(Perceptual Quantization)方式であり、映像信号レベルを最大10000nit(またはcd/m2)の範囲で表示輝度の絶対値に変換する。従って、シーンを撮像して得られたHDR画像を表示する場合、前者の方式では、表示装置が出力可能な最大輝度に応じた表示輝度にシーン輝度が変換され、後者の方式では、表示装置によらず絶対的に定まる表示輝度にシーン輝度が変換される。故に、PQ方式が採用された表示装置での表示を想定する場合、例えば撮像装置でのエンコードにおいて、絶対的な輝度値を示すようにシーン輝度の画像信号を変換し、HDR画像を生成する必要がある。
このため、シーン輝度を絶対的に表現するPQ方式のエンコードでは、同一のシーンを撮像したとしても、露出量の違いによりHDR画像に含まれるピーク輝度(表示輝度の最大値、出力ダイナミックレンジの最大値)が変化し得る。これは、センサ出力が飽和するシーン輝度が露出量に応じて変化するため、同一のシーン輝度に絶対的な表示輝度を割り当てるべく、変換に用いられるガンマカーブが異なることに依る。例えば、図1に示されるように、露出量の異なる2種類の撮像モードについての入出力特性(入力段数と出力輝度の関係)は、ピーク輝度(出力輝度の最大値)が異なる。ここで、露出量の高い撮像モードにおける入出力特性11が実線で表され、露出量の低い撮像モードにおける入出力特性12が一点鎖線で示されている。図示されるように、2つの撮像モードでは、高輝度域以外は共通の入出力特性を示し、露出量によらず同一の表示輝度に変換されるのに対し、高輝度域では飽和する輝度の違いに応じ、ピーク輝度が値13と14で異なる。なお、値15は、10bitにおける最大値(1023)を示しており、PQ方式における最大表示輝度の10000nitに対応している。
即ち、PQ方式のHDR画像は、その撮像に採用された撮像モードによってピーク輝度が変化し得るものであるため、その飽和レベルは、必ずしもPQ方式の最大表示輝度や表示装置の最大輝度と一致しない。従って、特許文献1の方式でSDR画像とHDR画像とを合成したとしても、例えばSDR画像の高輝度側の表現が不自然に明るく表れる等、好適な態様の合成画像が生成されない可能性があった。
上記で例示したように、採用された撮像モードによってピーク輝度が変化し得る画像を用いて合成処理を行う場合、好適に合成された画像が生成されない可能性があるという問題点がある。
本発明は、上述の問題点に鑑みてなされたものであり、ダイナミックレンジの異なる画像を好適に合成した合成画像を生成する画像処理装置、制御方法及びプログラムを提供することを目的とする。
前述の目的を達成するために、本発明の画像処理装置は、第1の画像と、当該第1の画像よりもダイナミックレンジの広い第2の画像と、を取得する第1の取得手段と、第1の画像のダイナミックレンジを変換することで変換画像を生成する変換手段と、変換手段により生成された変換画像と第2の画像とを合成して合成画像を生成する生成手段と、を有し、変換手段は、第2の画像に基づいて合成レンジを決定し、第1の画像のダイナミックレンジを当該合成レンジに変換することを特徴とする。
このような構成により本発明によれば、ダイナミックレンジの異なる画像を好適に合成した合成画像を生成することが可能となる。
[実施形態]
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
以下に説明する一実施形態は、画像処理装置の一例としての、PQ方式でエンコードされた1つのHDR画像と1つのSDR画像とを合成して多重露出表現の合成画像を生成可能な画像処理装置に、本発明を適用した例を説明する。しかし、本発明は、ダイナミックレンジの異なる画像を合成して合成画像を生成することが可能な任意の機器に適用可能である。
また、本明細書において、「HDR画像」とは、特に断りのない限り、ITU-R BT.2100で規格化されているPQ(Perceptual Quantization)方式のエンコードが適用され、デコードにより絶対表示輝度を取得可能に構成された画像(PQ信号)であるものとして説明する。対して、「SDR画像」とは、ITU-R BT.709規格でエンコードされた画像であるものとして説明する。本実施形態では、合成画像の生成に用いられるHDR画像とSDR画像とは、いずれも撮像シーンを撮像することにより得られた、実写の撮像画像であるものとして説明する。また、以下の説明において、合成画像はHDR画像と同様にPQ信号であるものとする。
ここで、HDR特性をPQ信号で表すには最低限10bitの深度が必要となり、HDR画像や合成画像は、JPEGフォーマットのような8bitの画像を格納するファイルではないものとする。例えば、HDR画像や合成画像は、Moving Picture Experts Group(MPEG)によって開発されMPEG-H Part 12(ISO/IEC 23008-12)で定義された画像ファイルフォーマットであるHigh Efficiency Image File Format(以降、HEIFと称す)のコンテナを用いて格納されたHEIFファイルであってよい。HEIFは、本画像だけでなく、サムネイルや複数の時間的に関連ある画像やEXIF、XMPといったメタデータも1つのファイルの中に格納することができる。また、HEIFは、HEVCでエンコードされた10bitのイメージシーケンスも格納できるため本発明におけるHDR画像や合成画像の格納に適しているといえる。
《画像処理装置のハードウェア構成》
図2は、本実施形態に係る画像処理装置100のハードウェア構成を示したブロック図である。図示されるように、本実施形態の画像処理装置100は、CPU101、ROM102、RAM103、記録装置104、操作I/F105、表示装置106及びシステムバス107を有する。
図2は、本実施形態に係る画像処理装置100のハードウェア構成を示したブロック図である。図示されるように、本実施形態の画像処理装置100は、CPU101、ROM102、RAM103、記録装置104、操作I/F105、表示装置106及びシステムバス107を有する。
CPU101は、画像処理装置100の全体的な制御を行う。ROM102は、画像処理装置100の起動に必要なBIOS等の制御プログラムや、変更を必要としないプログラム、パラメータ及びデータを格納する記憶装置である。RAM103は、CPU101のワーク領域、各種データを一時的に記憶する一次記憶領域、各種プログラムのロード領域等を有する記憶装置である。
記録装置104は、OSプログラム、各種の制御プログラム、OSプログラム上で実行可能な各種ソフトウェアのプログラム、後述の合成処理に使用するHDR画像及び合成処理の結果に得られた合成画像等の各種データを格納する記録装置である。記録装置104は、例えば、画像処理装置100に内蔵または着脱可能に接続されたハードディスクやフラッシュメモリ、着脱可能に接続されたフレキシブルディスクや光学ディスク、光磁気ディスク、ICカード、メモリーカード等を含む。従って、CPU101は、ROM102または記録装置104に格納された各種プログラムをRAM103に展開して実行することにより画像処理装置100の制御を行うことができる。
操作I/F105は、例えば、キーボードやマウス、タッチパネル等の画像処理装置100が備えるユーザインタフェースである。操作I/F105は、ユーザによる操作入力がなされたことを検出すると、該当の操作に係る制御信号をCPU101に送出する。表示装置106は、例えば液晶ディスプレイであり、画像処理装置100上で動作しているOSやソフトウェアに係るグラフィカルユーザインタフェースをはじめとして、各種の情報を表示する。システムバス107は、画像処理装置100を構成する各ブロックを通信可能に接続する。
画像処理装置100は、撮像済みのRAW画像を現像及び編集する専用装置であってもよく、その場合、ROM102に合成処理のプログラムを格納することができる。また、汎用のパーソナルコンピュータ(PC)は、CPU101が記録装置104に格納された合成処理のプログラムをRAM103に展開することによって、画像処理装置100として機能することができる。さらに、撮像によりRAW画像を取得可能な撮像装置は、その制御ユニットが合成処理のプログラムを実行することによって、あるいは合成処理を行う画像処理ユニットが規定の動作を行うことで、画像処理装置100としても機能することができる。
《合成処理》
次に、本実施形態に係る画像処理装置100において実行される、1つのHDR画像と1つのSDR画像とを合成して多重露出表現の合成画像を生成する合成処理について、図を参照して詳細を説明する。本合成処理は、CPU101が、ROM102または記録装置104から合成処理のプログラムを読み出し、RAM103に展開して実行することにより実現される。図3(a)は、本実施形態の合成処理の実行中にCPU101により実現される各種機能のモジュール構成を例示し、図4は、当該合成処理の流れを説明するためのフローチャートを例示した図である。
次に、本実施形態に係る画像処理装置100において実行される、1つのHDR画像と1つのSDR画像とを合成して多重露出表現の合成画像を生成する合成処理について、図を参照して詳細を説明する。本合成処理は、CPU101が、ROM102または記録装置104から合成処理のプログラムを読み出し、RAM103に展開して実行することにより実現される。図3(a)は、本実施形態の合成処理の実行中にCPU101により実現される各種機能のモジュール構成を例示し、図4は、当該合成処理の流れを説明するためのフローチャートを例示した図である。
上述したように、合成処理の入力として用いられるSDR画像とHDR画像とは、撮像装置を用いて撮像された撮像画像であり、後者の方がシーン輝度の階調表現をより詳細に表現できるよう、ダイナミックレンジが広い。各画像は、撮像された撮像装置においてOETF(Opt-Electronic Transfer Function:光電伝達関数)を用いて、被写体の明るさが非線形の信号にエンコードされて現像される。またHDR画像は、PQ方式でエンコードされたPQ画像(以下、HDRPQ画像として言及する場合がある)であるものとして説明する。従って、本実施形態では、合成処理の入力は、図3(a)に示されるようにSDR画像301とHDRPQ画像302になる。ここで、OETFは、撮像装置において現像用に定められるものであり、SDR用とHDR用が個別に設けられるものであってよい。
S401で、CPU101は、記録装置104からSDR画像301及びHDRPQ画像302を読み出し、RAM103に展開する。本ステップの処理により合成対象となる画像の入力が実現される。
SDR画像301とHDRPQ画像302とは、上述したように異なるダイナミックレンジでシーン輝度を表現した画像であるため、画像の合成にあたってはダイナミックレンジを合わせることが好ましい。換言すると、SDR画像301とHDRPQ画像302とはとり得る信号レベルの値範囲が異なり単純に合成に用いることができないため、両者のダイナミックレンジを合わせる必要がある。より詳しくは、SDR画像301とHDRPQ画像302とは、生成にあたり、それぞれSDR用のOETFまたはHDR用のOETFを用いて被写体の明るさを非線形の信号に変換する態様が異なる画像である。
本実施形態の合成処理では、SDR画像301を、より広いHDRPQ画像302のダイナミックレンジで表現した画像(変換画像)に変換し、当該変換画像とHDRPQ画像302とを用いて合成が行われる。このため、以下に続くS402~S406の処理において、SDR画像301をHDRPQ画像302と共通のダイナミックレンジの画像(PQ形式の画像(HDRPQ画像))への変換が行われる。
S402で、SDRデガンマモジュール303は、合成対象のSDR画像301を線形化する。上述したように、SDR画像301は、SDR用のOETFが適用されて得られた非線形の信号である。このため、SDRデガンマモジュール303は、例えば図5(a)に示されるようなSDR用のEOTFを適用することで、SDR画像301の各画素の信号レベルをディスプレイライトな線形の輝度値に変換する。即ち、SDRデガンマモジュール303は、SDR画像301を変換し、各画素が表示輝度を示す第1の中間画像を生成する。
ここで、SDR用のEOTFは、ITU-R BT.709で定義されているリファレンスのEOTFを用いてもよい。あるいは、SDR画像301を撮像した撮像装置において用いられたSDR用のOETFの逆関数を用いてもよい。なお、OETFは、各露出設定について予め設定された、あるいはユーザ設定による出力画像の制作意図に基づいたOOTF(Opt-Optical Transfer Function:光光伝達関数)と、リファレンスのEOTFの逆関数の積である。線形化に用いられるSDR用のEOTFは、例えば画像処理装置100の記録装置104に記録されていてもよいし、SDR画像301に関連して撮像装置から取得されるものであってもよい。
S403で、色空間変換モジュール304は、必要に応じて、SDRデガンマモジュール303により第1の中間画像の色空間を変換する。本実施形態では、HDRPQ画像302がPQ形式のHDR画像であるため、色空間変換モジュール304は、BT.709からBT.2020への色空間変換を行う。色空間変換の詳細は、ITU-R BT.2087に記載されている。
S404で、CPU101は、SDR画像301を変換するダイナミックレンジの最大値を決定する。本実施形態の合成処理では、SDR画像301をHDRPQ画像302と共通のダイナミックレンジに変換するため、本ステップにおいて変換後のダイナミックレンジ(以下、合成レンジとして言及)の最大値を決定する。図1について上述したように、PQ形式のHDR画像のピーク輝度値は、露出量の違いによって異なり得るものであるため、本ステップでCPU101は、HDRPQ画像302のピーク輝度値を取得し、これを合成レンジの最大値として決定する。即ち、CPU101は、HDRPQ画像302の最大信号レベルを上回る信号レベルの画像が合成されることによって合成画像が不自然な表現とならないよう、HDRPQ画像302の最大信号レベルを、合成レンジの最大値に対応する信号レベルに採用する。
ここで、HDRPQ画像302のピーク輝度は、HDRPQ画像302に係る画像ファイル(HEIFファイル等)に含められる、あるいはHDRPQ画像302に別ファイルとして関連付けられるものであってよい。本実施形態ではHDRPQ画像302に係る画像ファイルには、特開2020-039118号公報に記載のMaxDRL(Maximum Dynamic Range Level)がメタデータとして付されており、CPU101は、これをピーク輝度値として取得するものとする。MaxDRLは、撮像された画像信号の現像及びエンコードにおいて、対応するOETFを適用した後のPQ信号出力値の最大値であり、HDRPQ画像302で表現可能なダイナミックレンジのピーク輝度値(上限値)を示す。従って、本実施形態ではピーク輝度値であるものとして説明するが、MaxDRLは、ピーク輝度値に対応するnit値を示す値であってもよい。
S405で、レンジ変換モジュール305は、第1の中間画像のダイナミックレンジを、S404で決定された最大値の合成レンジに変換した第2の中間画像を生成する。本実施形態では、レンジ変換モジュール305は、第2の中間画像の生成にあたり、図6(a)に示される入出力特性の輝度値の変換を行うことで、ダイナミックレンジを合成レンジに変換する。図6(a)の例では、横軸に入力(第1の中間画像)の輝度値を、縦軸に出力(第2の中間画像)の輝度値が設定されており、その入出力関係が示されている。図示されるように、レンジ変換モジュール305における入出力特性は、第1の中間画像の輝度値の値範囲を、最大値がHDRPQ画像302のMaxDRL(ピーク輝度値)とする範囲に線形的にスケーリングする。ここで、第1の中間画像の輝度値の値範囲は、SDR画像301における白を示す画素の情報に基づき、第1の中間画像の同位置の画素の輝度値を最大値、即ち、ピーク輝度値として規定される。つまり、レンジ変換モジュール305は、第1の中間画像の輝度値のピーク輝度値がHDRPQ画像302のMaxDRLになるように線形変換することで、第2の中間画像の各画素の輝度値を導出し、ダイナミックレンジを変換した第2の中間画像を生成する。より詳しくは、レンジ変換モジュール305は、第1の中間画像のピーク輝度値とHDRPQ画像302のMaxDRLとに基づいて、ダイナミックレンジの変換に係る変換係数を導出する。そして、レンジ変換モジュール305は、第1の中間画像の各画素の輝度値に当該変換係数を乗じて得られた輝度値を第2の中間画像の各画素として格納することで、第2の中間画像を生成する。
S406で、HDRPQガンマモジュール306は、第2の中間画像にガンマを適用することで輝度値を非線形の信号に変換(エンコード)し、変換画像を生成する。本実施形態では、変換画像と合成されるHDRPQ画像302がPQ形式の画像であるため、HDRPQガンマモジュール306において適用されるガンマは、図5(b)に示されるようなPQ形式に対応したHDR用のOETFである。ここで、HDR用のOETFは、例えばHDRPQ画像302に係る画像ファイルのメタデータに含められた、HDRPQ画像302のエンコードに用いられたOETFを取得して用いることができる。あるいは、HDR用のOETFは、例えばHDRPQ画像302の撮像に係る露出設定について定められたOOTFにITU-R BT.2100で定義されるリファレンスのEOTFの逆関数を乗じることで導出されるものであってもよい。
S407で、合成モジュール307は、S406において生成された変換画像とHDRPQ画像302とを合成することで、多重露出表現の合成画像309を生成し、本合成処理を完了する。多重露出の合成方式には、加算、比較明、比較暗等の複数の方式があるため、本実施形態の合成処理では、SDR画像301及びHDRPQ画像302の他の入力として合成手法を一意に特定する合成手法308を受け付ける。入力される合成手法308は、操作I/F105を介してなされたユーザ操作入力に基づいて指定されるものであってもよいし、予め設定された情報を読み出すことで指定されるものであってもよい。従って、合成モジュール307は、入力された合成手法308に基づく処理を実行して合成画像309を生成する。
なお、生成された合成画像309は、例えば新たなPQ画像としてHEIF形式の画像ファイルとして記録装置104に格納されてもよい。HEIF形式の画像ファイルは、図7(a)に示されるようなファイル構造を有する。即ち、HEIF形式のファイルは、ファイル形式を示すftypボックス701と、サムネイル画像711を含むメタデータを格納するmetaボックス702と、符号化データ(本画像712)を格納するmdatボックス703とで構成される。従って、合成モジュール307は、生成した合成画像309のデータをmdatボックス703に格納し、合成画像309のサムネイル画像及び合成画像309に係るMaxDRLをmetaボックス702に格納し、ファイルを生成する。
ここで、メタデータに含められる合成画像309に係るMaxDRLは、例えば入力画像であったHDRPQ画像302のMaxDRLを流用してもよい。あるいは、合成画像309に係るMaxDRLは、例えば図8の表に示されるような、HDRPQ画像302の撮像時に設定されていた撮像モードに対応した最大信号PQコード値を記録装置104から読み出し、MaxDRLとしてメタデータに含めてもよい。この他、メタデータには、合成画像309の線形化に用いられるOETFやその他の情報が含められてもよい。
また、合成処理を行って出力される合成画像309のファイル形式は、少なくとも当該合成画像309に係るMaxDRLを共に格納可能であればよく、例えば図7(b)のようなMP4形式を採用してもよい。この場合、mdatボックス721中のmetaデータ722にMaxDRLが格納されればよい。
また、本実施形態では合成処理の出力である合成画像が、PQ形式のHDR画像であるものとして説明したが、本発明の実施はこれに限られるものではなく、さらにSDR画像に変換された画像が出力されるものであってもよい。
以上説明したように、本実施形態の画像処理装置によれば、ダイナミックレンジの異なる画像を好適に合成した合成画像を生成することができる。より詳しくは、SDR画像とHDRPQ画像とを合成する際に、HDRPQ画像のピーク輝度に基づいたダイナミックレンジにSDR画像を変換するため、絶対輝度が規定されないSDR画像であってもHDRPQ画像に適合した態様で合成することができる。
[変形例1]
上述した実施形態では、レンジ変換モジュール305における入出力特性を、図6(a)に示されるような、単に第1の中間画像のピーク輝度値を、HDRPQ画像302のMaxDRLまでの値範囲に線形的に割り当てる態様を説明した。しかしながら、本発明の実施はこれに限られるものではなく、入出力特性は、例えば図6(b)に示されるように、第1の中間画像の輝度値について所定のニーポイントを基準に設け、その前後の輝度値の値範囲で異なる特性としてもよい。
上述した実施形態では、レンジ変換モジュール305における入出力特性を、図6(a)に示されるような、単に第1の中間画像のピーク輝度値を、HDRPQ画像302のMaxDRLまでの値範囲に線形的に割り当てる態様を説明した。しかしながら、本発明の実施はこれに限られるものではなく、入出力特性は、例えば図6(b)に示されるように、第1の中間画像の輝度値について所定のニーポイントを基準に設け、その前後の輝度値の値範囲で異なる特性としてもよい。
図6(b)の例では、ニーポイントを、SDR画像301に含まれる適正露出の被写体に係る輝度値に設定している。より詳しくは、図6(b)の入出力特性は、輝度値の下限値である0から適正露出に対応する輝度値(適正輝度値)までの値範囲(第1の値範囲)に係る輝度値の入力に対しては、傾き1の直線で示される特性を示す。即ち、第1の値範囲の輝度値が入力されると、同一の値が出力される。また入出力特性は、適正輝度値から第1の中間画像のピーク輝度値までの値範囲(第2の値範囲)に係る輝度値の入力に対しては、適正輝度値からHDRPQ画像302のMaxDRLまでの値範囲に線形的に割り当てた値を出力する。即ち、第2の値範囲に係る入出力特性に係る傾きは、SDR画像301に係る適正輝度値に応じて適応的に変更される。レンジ変換モジュール305がこのような入出力特性を採用することで、第1の中間画像における適正露出までの階調表現を維持した態様で、第2の中間画像を生成することができる。
従って、本変形例に係る合成処理に係るモジュール構成は、図3(b)に示されるように、SDR画像301に関連付けて取得される適正輝度値の情報が、レンジ変換モジュール305に入力される。
ところで、図6(b)のようなニーポイントにおいて入出力特性が変化するような変換を行うと、ニーポイントの輝度値によってはコントラストが強くなる値範囲があり、変換前は視認されにくかった低振幅のノイズが、変換後に強調されることがある。このようにして得られた第2の中間画像に基づく変換画像を合成して得られる多重露出表現の合成画像は、変換画像とHDRPQ画像302とでノイズ感や解像感が異なるため、好適な表現とならない場合がある。
故に、本変形例の合成処理では図3(b)に示されるように、HDRPQガンマモジュール306によるガンマが適用された第2の中間画像に対して、ニーポイントの輝度値に応じた画質調整処理を画質調整モジュール310が適用した上で変換画像を生成する。画質調整処理は、例えばノイズリダクション処理であってよく、その強度がニーポイントの輝度値に応じて制御される。例えば、ニーポイントの輝度値が、第1の中間画像のピーク輝度値に近い場合、即ち、第2の値範囲に係る入出力特性の傾きが急峻である場合には、ノイズリダクションの強度は高められる。反対に、第2の値範囲に係る入出力特性の傾きが緩やかである場合には、ノイズリダクションの強度は弱められる。
このようにすることで、ダイナミックレンジの変換に係り発生し得る画質劣化の影響を低減させることができるため、変換画像とHDRPQ画像302のノイズ感や解像感を合わせ、好適な表現の合成画像を生成することができる。
なお、画質調整モジュール310により適用される画質調整処理は、ノイズリダクション処理入力に限られるものではない。例えば、SDR画像301がコンピュータグラフィックス等の所謂ノイズレスな画像である場合、画質調整処理は、ノイズリダクション処理ではなく、HDRPQ画像302のノイズレベルに合わせるためにランダムノイズを付加する処理であってよい。
また、本変形例ではレンジ変換モジュール305における入出力特性が、図6(b)に示されるような折れ線の態様を示すものとして説明したが、本発明の実施はこれに限られるものでなく、曲線の態様を示すものであってもよい。この場合、画質調整モジュール310により行われる画質調整処理も、入出力特性に応じて調整されるよう構成されればよい。
[変形例2]
上述した実施形態及び変形例では、1つのHDRPQ画像と1つのSDR画像とを合成して多重露出表現の合成画像を生成する態様について説明したが、合成処理の入力に用いられる各ダイナミックレンジの画像は複数であってもよい。このとき、複数のHDRPQ画像が合成対象として入力される場合には、合成レンジの最大値に設定されるピーク輝度値は、当該複数のHDRPQ画像のMaxDRLのうちの最大の値を用いればよい。
上述した実施形態及び変形例では、1つのHDRPQ画像と1つのSDR画像とを合成して多重露出表現の合成画像を生成する態様について説明したが、合成処理の入力に用いられる各ダイナミックレンジの画像は複数であってもよい。このとき、複数のHDRPQ画像が合成対象として入力される場合には、合成レンジの最大値に設定されるピーク輝度値は、当該複数のHDRPQ画像のMaxDRLのうちの最大の値を用いればよい。
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
101:CPU、102:ROM、103:RAM、104:記録装置、303:SDRデガンマモジュール、304:色空間変換モジュール、305:レンジ変換モジュール、306:HDRPQガンマモジュール、307:合成モジュール、310:画質調整モジュール
Claims (15)
- 第1の画像と、当該第1の画像よりもダイナミックレンジの広い第2の画像と、を取得する第1の取得手段と、
前記第1の画像のダイナミックレンジを変換することで変換画像を生成する変換手段と、
前記変換手段により生成された前記変換画像と前記第2の画像とを合成して合成画像を生成する生成手段と、
を有し、
前記変換手段は、前記第2の画像に基づいて合成レンジを決定し、前記第1の画像のダイナミックレンジを当該合成レンジに変換する
ことを特徴とする画像処理装置。 - 前記変換手段は、前記第2の画像の最大信号レベルに基づいて前記合成レンジを決定することを特徴とする請求項1に記載の画像処理装置。
- 前記第2の画像は、ITU-R BT.2100で規格化されたPQ(Perceptual Quantization)方式でエンコードされたHDR(High Dynamic Range)画像であり、
前記変換手段は、前記合成レンジの最大値を前記第2の画像のダイナミックレンジのピーク輝度値に決定する
ことを特徴とする請求項1または2に記載の画像処理装置。 - 前記変換手段は、前記変換画像の最大信号レベルが前記合成レンジの最大値に対応する信号レベルとなるように、前記第1の画像のダイナミックレンジを変換する
ことを特徴とする請求項3に記載の画像処理装置。 - 前記第1の画像及び前記第2の画像は、それぞれのダイナミックレンジに対応するガンマが適用されることで、被写体の明るさを非線形の信号に変換した画像であり、
前記変換手段は、
前記第1の画像のダイナミックレンジに対応するデガンマを適用して、前記第1の画像の信号を線形の輝度値に変換した第1の中間画像を生成し、
前記第1の中間画像の輝度値を、最大値が前記第2の画像のピーク輝度値である値範囲に割り当てた第2の中間画像を生成し、
前記第2の画像のダイナミックレンジに対応するガンマを適用して前記第2の中間画像の輝度値を非線形の信号に変換することで、前記変換画像を生成する
ことを特徴とする請求項4に記載の画像処理装置。 - 前記第2の中間画像の生成に係る入出力特性は、前記第1の中間画像の輝度値の範囲を、最大値が前記第2の画像のピーク輝度値である範囲にスケーリングするものであることを特徴とする請求項5に記載の画像処理装置。
- 前記第2の中間画像の生成に係る入出力特性は、前記第1の中間画像の輝度値について所定のニーポイントを基準に定まる第1の値範囲と第2の値範囲それぞれの入力に対して、異なる特性を示すことを特徴とする請求項5に記載の画像処理装置。
- 前記第1の画像に係る適正露出に対応する輝度値を取得する第2の取得手段をさらに有し、
前記所定のニーポイントは、前記第2の取得手段により取得された前記適正露出に対応する輝度値であり、
前記第1の値範囲は、輝度値の下限値から前記適正露出に対応する輝度値までの値範囲であり、
前記第2の値範囲は、前記適正露出に対応する輝度値から前記第1の中間画像のピーク輝度値までの値範囲である
ことを特徴とする請求項7に記載の画像処理装置。 - 前記第2の中間画像の生成に係る入出力特性は、前記第1の値範囲の輝度値の入力に対して同一の値を出力し、前記第2の値範囲の輝度値の入力に対して、前記適正露出に対応する輝度値から前記第2の画像のピーク輝度値までの値範囲にスケーリングした値を出力することを特徴とする請求項8に記載の画像処理装置。
- 前記変換手段は、前記第2の中間画像の輝度値を非線形の信号に変換した後に、前記所定のニーポイントの輝度値に応じた画質調整処理を実行して前記変換画像を生成することを特徴とする請求項7乃至9のいずれか1項に記載の画像処理装置。
- 前記変換手段は、前記第2の画像に関連付けられたメタデータから前記第2の画像のピーク輝度値を取得することを特徴とする請求項3乃至10のいずれか1項に記載の画像処理装置。
- 前記合成画像の生成に用いられる前記第2の画像は複数であり、
前記変換手段は、前記合成レンジの最大値を、複数の前記第2の画像のピーク輝度値のうちの最大の値に決定する
ことを特徴とする請求項3乃至11のいずれか1項に記載の画像処理装置。 - 前記第1の画像は、ITU-R BT.709規格でエンコードされたSDR(Standard Dynamic Range)画像であることを特徴とする請求項1乃至12のいずれか1項に記載の画像処理装置。
- 画像処理装置の制御方法であって、
第1の画像と、当該第1の画像よりもダイナミックレンジの広い第2の画像と、を取得する工程と、
前記第1の画像のダイナミックレンジを変換することで変換画像を生成する変換工程と、
前記変換工程において生成された前記変換画像と前記第2の画像とを合成して合成画像を生成する工程と、
を有し、
前記変換工程において、前記第2の画像に基づいて合成レンジが決定され、前記第1の画像のダイナミックレンジが当該合成レンジに変換される
ことを特徴とする制御方法。 - コンピュータを、請求項1乃至13のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022034770A JP2023130222A (ja) | 2022-03-07 | 2022-03-07 | 画像処理装置、制御方法及びプログラム |
US18/177,587 US20230283911A1 (en) | 2022-03-07 | 2023-03-02 | Image processing apparatus to generate composite image, control method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022034770A JP2023130222A (ja) | 2022-03-07 | 2022-03-07 | 画像処理装置、制御方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023130222A true JP2023130222A (ja) | 2023-09-20 |
Family
ID=87850225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022034770A Pending JP2023130222A (ja) | 2022-03-07 | 2022-03-07 | 画像処理装置、制御方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230283911A1 (ja) |
JP (1) | JP2023130222A (ja) |
-
2022
- 2022-03-07 JP JP2022034770A patent/JP2023130222A/ja active Pending
-
2023
- 2023-03-02 US US18/177,587 patent/US20230283911A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230283911A1 (en) | 2023-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110278345B (zh) | 变换方法、变换装置以及图像显示装置 | |
KR102377807B1 (ko) | 높은 동적 범위 및 넓은 컬러 영역 시퀀스들의 코딩에서의 컬러 볼륨 변환들 | |
CN111491148B (zh) | 显示方法 | |
RU2713869C1 (ru) | Преобразование тоновой кривой для изображений с расширенным динамическим диапазоном | |
CN111447425B (zh) | 显示方法和显示装置 | |
JP5180344B2 (ja) | 高ダイナミックレンジ画像データを復号化するための装置及び方法、表示用画像を処理可能なビューア、ならびに表示装置 | |
EP3022902B1 (en) | Method and apparatus to create an eotf function for a universal code mapping for an hdr image | |
JP5965025B2 (ja) | Hdr画像のための画像処理 | |
Ward et al. | Subband encoding of high dynamic range imagery | |
KR101051604B1 (ko) | 화상 처리 장치 및 방법 | |
JP2018525905A (ja) | 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム | |
KR102475139B1 (ko) | 이미지를 타겟 디스플레이 디바이스의 타겟 피크 휘도 lt에 톤 적응시키기 위한 방법 | |
CN110770787B (zh) | 高效端到端单层逆向显示管理编码 | |
WO2016181584A1 (ja) | 表示方法および表示装置 | |
JP6739257B2 (ja) | 画像処理装置とその制御方法及びプログラム | |
US20230077931A1 (en) | Image processing apparatus, image capturing apparatus, control method, and storage medium | |
JP2023130222A (ja) | 画像処理装置、制御方法及びプログラム | |
JP7431595B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2023136246A (ja) | 画像処理装置、制御方法及びプログラム | |
US20240013356A1 (en) | Method for generating high dynamic range image, and image processing system | |
JP6751901B2 (ja) | 輝度変換方法、輝度変換装置および映像表示装置 | |
JP2023168073A (ja) | 画像処理装置および画像処理方法 | |
JP2020177297A (ja) | 画像処理装置、撮像装置、画像処理方法、及びプログラム | |
JP2023545130A (ja) | コーディング効率制約を伴うhdrビデオのための色変換 | |
JP2007005903A (ja) | 画像処理装置および画像処理方法 |