JP2022076239A - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP2022076239A JP2022076239A JP2020186562A JP2020186562A JP2022076239A JP 2022076239 A JP2022076239 A JP 2022076239A JP 2020186562 A JP2020186562 A JP 2020186562A JP 2020186562 A JP2020186562 A JP 2020186562A JP 2022076239 A JP2022076239 A JP 2022076239A
- Authority
- JP
- Japan
- Prior art keywords
- image
- development
- image data
- raw
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 71
- 238000003672 processing method Methods 0.000 title claims 2
- 238000011161 development Methods 0.000 claims abstract description 185
- 230000006870 function Effects 0.000 claims description 11
- 239000003086 colorant Substances 0.000 abstract description 10
- 238000003384 imaging method Methods 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 46
- 230000033458 reproduction Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 210000003127 knee Anatomy 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0007—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Color Television Image Signal Generators (AREA)
- Studio Devices (AREA)
Abstract
【課題】 撮像画像間の色を効率よく合わせることを目的とする。
【解決手段】 上記課題を解決するために、本発明に係る画像処理装置は、RAW画像データと、前記RAW画像データを撮像した第一の撮像装置とは異なる第二の撮像装置で撮像された目標画像の目標画像データとを取得する第一取得手段と、RAW画像データを現像するために用いる現像パラメータと、前記現像パラメータを用いて現像した画像との対応関係を学習した学習モデルを用いて、前記RAW画像データの現像後の画像が前記目標画像の画像特性に近似するよう、前記第一の撮像装置の現像パラメータを推定する推定手段と、前記推定手段により推定した現像パラメータを用いて、前記RAW画像データを現像する現像手段とを有することを特徴とする。
【選択図】 図2
【解決手段】 上記課題を解決するために、本発明に係る画像処理装置は、RAW画像データと、前記RAW画像データを撮像した第一の撮像装置とは異なる第二の撮像装置で撮像された目標画像の目標画像データとを取得する第一取得手段と、RAW画像データを現像するために用いる現像パラメータと、前記現像パラメータを用いて現像した画像との対応関係を学習した学習モデルを用いて、前記RAW画像データの現像後の画像が前記目標画像の画像特性に近似するよう、前記第一の撮像装置の現像パラメータを推定する推定手段と、前記推定手段により推定した現像パラメータを用いて、前記RAW画像データを現像する現像手段とを有することを特徴とする。
【選択図】 図2
Description
本発明は、撮像した画像を現像する画像処理技術に関する。
撮像時にデジタルカメラやデジタルシネマカメラの画像センサから得られるRAWデータは、画像センサの出力値をA/D変換した値そのものを保持する。RAWデータに対して現像処理を行うことによって、撮像画像を表す画像データ(以降、現像後画像とも呼ぶ)が生成される。ここで現像処理とは、例えばベイヤー配列の画素データをRGB3チャンネルのピクセル値に変換するデモザイキング処理や、露出補正、ホワイトバランス補正、ノイズ除去処理などの単独または複数の画像処理から構成されている。現像処理に使用するパラメータは現像パラメータとも呼ばれ、撮像者はRAWデータを保持しておけば撮像後に現像パラメータを調整することで好みの現像後画像を生成することができる。特許文献1には、RAWデータを現像するために用いる現像パラメータを画像の好ましさを表す審美性に基づいて取得することが記載されている。
ここで、異なる機種のカメラで撮像された画像間の色を合わせたい場合、同一の現像パラメータを適用しようとしても、カメラメーカーによって現像パラメータの項目が異なる、たとえ同一メーカーのカメラ間であってもセンサ出力値や現像処理が異なっている、ことなどにより適用できない場合がある。
この場合、撮像者は色を合わせたいカメラで撮像された画像を参照しながら、所望の画像となるように調整可能な範囲の中で現像パラメータを手動調整する必要があり労力と時間を要する。また、カメラには色を合わせるために、3DLUTによる色変換機能を有するカメラもあるが、3DLUTを作成するためには専用の測定器や作成のための専門知識が必要となる。
本発明は、上記課題を鑑みてなされたものであり、撮像画像間の色を効率よく合わせることを目的とする。
上記課題を解決するために、本発明に係る画像処理装置は、RAW画像データと、前記RAW画像データを撮像した第一の撮像装置とは異なる第二の撮像装置で撮像された目標画像の目標画像データとを取得する第一取得手段と、RAW画像データを現像するために用いる現像パラメータと、前記現像パラメータを用いて現像した画像との対応関係を学習した学習モデルを用いて、前記RAW画像データの現像後の画像が前記目標画像の画像特性に近似するよう、前記第一の撮像装置の現像パラメータを推定する推定手段と、前記推定手段により推定した現像パラメータを用いて、前記RAW画像データを現像する現像手段とを有することを特徴とする。
本発明によれば、現像パラメータと現像後画像の組み合わせを学習した結果から所望の画像と近い画像を現像する現像パラメータを推定することにより、撮像画像間の色を効率よく合わせることができる。
以下、本実施形態について、図面を参照して説明する。尚、以下の実施形態は本発明を必ずしも限定するものではない。また、本実施形態において説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
<画像処理装置1のハードウェア構成>
図1は、画像処理装置1のハードウェア構成の一例を示す図である。画像処理装置1は、CPU101と、ROM102と、RAM103と、VC(ビデオカード)111と、汎用I/F114と、SATA(シリアルATA)I/F118と、を有する。CPU101は、RAM103をワークメモリとして、ROM102、外部記憶装置110などに格納されたOSや各種プログラムを実行する。また、CPU101は、システムバス108を介して各構成を制御する。汎用I/F114には、シリアルバス115を介して、マウスやキーボードなどの入力デバイス116や撮像装置117が接続される。SATAI/F118には、シリアルバス119を介して、外部記憶装置110が接続される。VC111には、シリアルバス112を介して、ディスプレイ113が接続される。CPU101は、プログラムによって提供されるUI(ユーザインタフェース)をディスプレイ113に表示し、入力デバイス116を介して得られたユーザの指示を表す入力情報を入力する。図1に示す画像処理装置1は、例えば、デスクトップ型のPCによって実現される。
図1は、画像処理装置1のハードウェア構成の一例を示す図である。画像処理装置1は、CPU101と、ROM102と、RAM103と、VC(ビデオカード)111と、汎用I/F114と、SATA(シリアルATA)I/F118と、を有する。CPU101は、RAM103をワークメモリとして、ROM102、外部記憶装置110などに格納されたOSや各種プログラムを実行する。また、CPU101は、システムバス108を介して各構成を制御する。汎用I/F114には、シリアルバス115を介して、マウスやキーボードなどの入力デバイス116や撮像装置117が接続される。SATAI/F118には、シリアルバス119を介して、外部記憶装置110が接続される。VC111には、シリアルバス112を介して、ディスプレイ113が接続される。CPU101は、プログラムによって提供されるUI(ユーザインタフェース)をディスプレイ113に表示し、入力デバイス116を介して得られたユーザの指示を表す入力情報を入力する。図1に示す画像処理装置1は、例えば、デスクトップ型のPCによって実現される。
また、外部記憶装置110はHDDであったが、これに限られない。例えば、SSD(ソリッドステートドライブ)であってもよい。また、外部記憶装置110は、メディア(記録媒体)と、当該メディアへのアクセスを行うための外部記憶ドライブとによっても実現される。メディアには、フレキシブルディスク(FD)、CD-ROM、DVD、USBメモリ、MO、フラッシュメモリなどを用いることができる。
<画像処理装置1の構成>
図2は、画像処理装置1の構成を示すブロック図である。画像処理装置1は、CPU101がROM102に格納されたプログラムをRAM103をワークメモリとして実行することによって、図2に示す構成として機能する。尚、以下に示す処理の全てが必ずしもCPU101によって実行される必要はなく、処理の一部または全てがCPU101以外の一つまたは複数の処理回路によって行われるように情報処理装置1が構成されていてもよい。
図2は、画像処理装置1の構成を示すブロック図である。画像処理装置1は、CPU101がROM102に格納されたプログラムをRAM103をワークメモリとして実行することによって、図2に示す構成として機能する。尚、以下に示す処理の全てが必ずしもCPU101によって実行される必要はなく、処理の一部または全てがCPU101以外の一つまたは複数の処理回路によって行われるように情報処理装置1が構成されていてもよい。
画像処理装置1は、画像取得部201と、現像項目取得部202と、学習用データ生成部203と、現像パラメータ推定部204と、現像処理部205と、表示制御部206を有する。画像取得部201は、色合わせの対象となる目標画像や補正対象のRAWデータ、学習に使用するRAWデータなどの画像データを撮像装置117やROM102あるいは外部記憶装置110などから取得する。以降、RAWデータも画像データと呼ぶ場合がある。現像項目取得部202は、RAWデータに対してホワイトバランスやガンマカーブなど、現像処理を行う際の処理項目を取得する。以降、取得した処理項目を、現像項目または項目と呼ぶ場合がある。学習用データ生成部203は、現像項目取得部202で取得した項目について学習モデル生成に使用する学習用の画像データを生成する。現像パラメータ推定部204は、学習用データ生成部203で生成したデータに基づいて学習モデルを生成し、学習モデルに基づいて現像パラメータを推定する。現像処理部205は、画像取得部201で取得した補正元のRAWデータを現像パラメータ推定部204で推定した現像パラメータに基づいて現像処理を行う。表示制御部206は、処理に必要な情報をユーザに入力してもらうためのユーザインタフェースや処理した画像の表示を制御する。
<画像処理装置1が実行する処理>
図3は、画像処理装置1が実行する処理の流れを示すフローチャートである。以下、各ステップ(工程)は符号の前にSをつけて表す。
図3は、画像処理装置1が実行する処理の流れを示すフローチャートである。以下、各ステップ(工程)は符号の前にSをつけて表す。
S11において表示制御部206は、処理に必要な情報をユーザに入力してもらうためのグラフィカルユーザインタフェース(以下、GUI)を、ディスプレイ113に表示させる。また表示制御部206は、GUIを介してユーザからの指示を入力する。ここで図4にGUIの例を示す。表示制御部206はまず、現像処理を行うためのGUIをディスプレイ113に表示する。
図4において、目標画像データ選択ボタン1001はユーザから色合わせの対象となる目標画像の選択を入力するためのボタンである。RAW画像データ選択ボタン1002はユーザからRAW画像データの選択を入力するためのボタンである。現像後画像保存ボタン1003はユーザから現像後画像の保存先の選択を入力するためのボタンである。画像表示領域1004は画像を表示する領域であり、目標画像データ選択ボタン1001で選択された画像データを左側に、現像処理後の画像データを右側に表示する。
現像パラメータ推定ボタン1005が押下されると現像パラメータを推定する処理が実行され、推定されたパラメータが後述の1007から1015の各現像パラメータ設定部に設定される。現像処理実行ボタン1006が押下すると設定された現像パラメータに基づいてRAW画像データ選択ボタン1002で選択された画像の現像処理を行う。
黒レベル設定部1007は画像の暗部の明るさレベルに影響する現像パラメータを設定する。黒ガンマ設定部1008は画像の暗部のトーンカーブに影響する現像パラメータを設定する。黒色かぶり設定部1009は画像の暗部の色みに影響する現像パラメータを設定する。ニーポイント設定部1010は高輝度領域の圧縮における圧縮の開始点に影響する現像パラメータを設定する。傾き設定部1011は高輝度領域の圧縮における圧縮カーブの傾きに影響する現像パラメータを設定する。ガンマカーブ設定部1012は画像全体の明るさの階調に影響する現像パラメータを設定する。ホワイトバランス設定部1013は画像全体の色みに影響する現像パラメータを設定する。カラーマトリクス設定部1014は画像全体の色みに影響する現像パラメータを設定する。カラーコレクション設定部1015は特定色相の色みに影響する現像パラメータを設定する。
ガンマカーブ表示領域1016は現像後画像の画素値の輝度ヒストグラムと、設定されたガンマカーブを表示する。
S12において画像取得部201は、色合わせの対象となる目標画像を示す画像データ(以降、目標画像データとも呼ぶ)を入力画像として取得する。具体的には、画像取得部201は、ユーザ指示により目標画像として指定された画像を特定する情報を表示制御部206から入力すると、目標画像データが格納された場所を特定し、ROM102から読み出す。目標画像データは、所定の現像処理によって既に現像されており、R(レッド)、G(グリーン)、B(ブルー)各色の画像データからなるものとする。なお、S11とS12とは、処理の順番が逆であってもよい。
S13において現像項目取得部202は、現像処理に使用する現像パラメータの項目(以降、現像項目とも呼ぶ)を取得する。例えば、図4のGUIの各項目においてユーザからの指示が入力された項目を取得する。なお、項目はユーザからの入力に限らず、予め定めた少なくとも一つの所定の項目を用いてもよい。取得する現像パラメータの項目については後述する。
S14において学習用データ生成部203は、現像項目別に学習モデルを生成するための学習用のデータセットを生成する。尚、学習用データ生成部203における処理の詳細は後述する。
S15において現像パラメータ推定部204は、S13で取得した現像項目別に学習モデルを生成し、現像パラメータを推定する。尚、現像パラメータ推定部204における処理の詳細は後述する。
S16において画像取得部201は、目標画像に対して画像特性を合わせる補正対象のRAWデータを取得する。
S17において画像処理装置1は、S15で推定した現像パラメータを用いてRAWデータの現像処理を行い、現像後画像データを保存して処理を終了する。
<S14における学習用データ生成部203の動作>
図5はS14において学習用データ生成部203が実行する処理の流れを示すフローチャートである。
図5はS14において学習用データ生成部203が実行する処理の流れを示すフローチャートである。
S141において学習用データ生成部203は、S13で取得した現像パラメータの現像項目を取得する。尚、本実施例では画像特性に影響する現像項目として、「黒レベル」、「黒ガンマ」、「黒色かぶり」、「ニーポイント」、「傾き」、「ガンマカーブ」、「ホワイトバランス」、「カラーマトリクス」、「カラーコレクション」、の9項目を扱う。しかしながら、これらに限らず、他の項目を用いてもよいし、これらの一部のみを用いてもよい。各項目における現像処理を説明する。
「ニーポイント」、「傾き」は白飛びを防ぐため、図6のように被写体の高輝度部分の入力信号値がカメラのダイナミックレンジに収まるよう、カメラ信号を圧縮するためのポイントとそのポイントにおける傾きを設定する。「傾き」をマイナス側に設定すると傾きは緩やかになり、表現できるダイナミックレンジは広がる一方で階調の表現力が低下する。一方で、「傾き」をプラス側に設定すると傾きは急になり、表現できるダイナミックレンジは狭くなる一方で階調の表現力が高まる。
「黒レベル」、「黒ガンマ」は黒の表現力を調整するパラメータであり、図6のように「黒レベル」は調整値をプラス側に設定すると黒が浮き上がり、調整値をマイナス側に設定すると黒がつぶれコントラストが強い画像となる。「黒ガンマ」は黒のガンマが効く明るさの範囲とレベルを設定し、レベルをプラス側に設定すると明るくなり、マイナス側に設定すると暗い画像になる。
「黒色かぶり」は黒に色みがついてしまう場合にR,G,Bの各信号値についてゲイン量を調整項目として設け、R,G,Bのゲイン比を調整することで画像の暗部の色かぶりを緩和する。
「ガンマカーブ」については入力信号値とカメラ出力信号値間の階調特性を設定し、画像の全体的な明るさを設定するパラメータである。
「ホワイトバランス」は画像のR,G,Bのゲイン比を調整することで画像全体の色みを設定するパラメータである。
「カラーマトリクス」は画像の特定色を目標色に変換させるための変換行列が目標色の数に合わせて複数格納されており、例えばsRGBやAdobeRGBといった目標色に合わせて変換行列を用いて色変換を行う。「カラーコレクション」は特定色相の色みを調整するパラメータであり、色相角を色相環に従ってR/G,R/B,G/R,G/B,B/R,B/Gの6つに分けて明るさ、彩度、色相の値を調整する。
本実施例で説明した現像項目は一例であり、使用するカメラの現像処理アプリケーションで公開されている現像項目に合わせて項目を変更してもよい。
S142において学習用データ生成部203は、学習モデル生成に使用するための学習用の画像データとして予め準備したRAW画像データ群を取得する。尚、本実施例では人物や風景画像、スポーツや趣味、食品など多様なカテゴリのRAWデータを1000枚予め準備し保持させるが、ユーザの趣向に応じて特定のカテゴリの画像を保持させてもよいし、準備する画像の枚数もこれに限られない。
S143において学習用データ生成部203は、S142で取得したRAWデータについて、S141で取得した項目に基づいて現像処理を行う。以下に現像設定の一例を示すが、設定値の範囲や刻み幅、数値はこれに限定されず、使用するカメラの現像処理アプリケーションで公開されている範囲の中で自由に設定してもよい。
まず、高輝度部の圧縮については「ニーポイント」を入力信号値の75%~100%の範囲で5%刻み、「傾き」を±側に5段階変化させた125通りの設定を使用して現像処理を行い、高輝度部の再現が異なる125の現像後画像を生成する。黒については「黒レベル」をRGBカウント2刻みで±10まで10段階、「黒ガンマ」は明るさの範囲L*=0~10、0~15、0~20の3つでガンマの強度が異なるカーブをプラス側に3段階、マイナス側に3段階設定する。また、「黒色かぶり」はRGB比率の異なる係数を7セット設定し、黒については「黒レベル」「黒ガンマ」「黒色かぶり」の3つの組み合わせで1470通りの設定で現像処理を行い、黒の再現が異なる1470の現像後画像を生成する。「ガンマカーブ」については明るさの階調特性の異なるカーブを10通り設定し現像処理を行い、階調特性の異なる10通りの現像後画像を生成する。「ホワイトバランス」についてはRGB比率の異なる係数を50セット設定し現像処理を行い、白色色度の異なる50通りの現像後画像を生成する。「カラーマトリクス」については所望の目標値となるように係数が予め演算された3x3の行列式が10通り準備され、それぞれ現像処理を行い、色再現の異なる10通りの現像後画像を生成する。「カラーコレクション」は6つの色相角についてそれぞれ明るさの明暗を±2段階、彩度を±2段階、色相を±2段階変化させた計750通りの設定を使用して現像処理を行い、特定色相毎に色再現の異なる750の現像後画像を生成する。
S144において学習用データ生成部203は、S143で現像処理した現像後画像とその現像処理に使用した現像パラメータを対とするデータを学習用データとして保存する。
図7は学習用データを模式的に表した図であり、本実施例では現像パラメータとその現像パラメータで現像された現像後画像の対応関係を1対1でラベル付けする。これらのラベル付けを1000枚のRAWデータに対して現像項目毎に行う。
S145において学習用データ生成部203は、全ての現像項目について学習用データを生成したかどうかを判定し、生成していなければS143の処理へ戻り、生成していれば処理を終了する。
<S15における現像パラメータ推定部204の動作>
図8は、S15において現像パラメータ推定部204が実行する処理の流れを示すフローチャートである。
図8は、S15において現像パラメータ推定部204が実行する処理の流れを示すフローチャートである。
S151において現像パラメータ推定部204は、S14で生成した学習モデル生成用の学習用のデータセットを取得する。
S152において現像パラメータ推定部204は、学習処理を行う。尚、本実施例で使用する学習処理は畳み込みニューラルネットワーク(convolution neural network:CNN)を使用し、その処理概要を図9に示す。本処理で使用する畳み込み層及びプーリング層の構成は16層からなるVGG16を使用する。畳み込み層では入力画像のフィルタ処理(3x3)と活性化関数を用いた非線形処理、プーリング層では畳み込み層で処理された特徴マップの縮小処理を行う。活性化関数は本実施例ではシグモイド関数を用いるが、ReLU関数など他の非線形処理を用いてもよい。分類器は畳み込み層とプーリング層で処理された特徴量マップをもとに現像パラメータのカテゴリの分類を行う。損失関数はクロスエントロピーを使用し、分類器の予測カテゴリと真のカテゴリを比較し、勾配法を用いて損失関数が最小となる重みパラメータを最適化する。入力画像にはS14で生成した現像後画像を、正解データにはラベル付けした現像パラメータを設定し、設定した画像データとラベルとに基づいて入力画像の現像パラメータを類別する学習モデルを生成する。
S153において現像パラメータ推定部204は、全ての現像項目について学習モデルを生成したかどうかを判定し、生成していなければS152の処理へ戻り、生成していればS154の処理へ進む。
S154において現像パラメータ推定部204は、色を合わせる対象の目標画像を取得する。
S155において現像パラメータ推定部204は、S153で生成した学習モデルを用いて現像後の画像が目標画像の画像特性に近似するような現像パラメータを推定する。現像パラメータは現像項目別に生成した学習モデルを使用して現像項目別に推定される。推定された現像パラメータは1007~1015の各現像パラメータの設定部に設定されて現像処理を行う際に現像パラメータが適用される。
S156において現像パラメータ推定部204は、S155で推定した現像パラメータを保存し、処理を終了する。
以上説明したように、本実施例によれば、現像パラメータと現像後画像の組み合わせを学習させ、その学習結果を用いることで、所望の画像と近い画像を現像する現像パラメータを推定する。これにより、所望の画像を撮像したカメラとその他のカメラとの色を効率よく自動で合わせることができる。
実施例1においては、現像項目の現像パラメータ毎に一つの学習モデルを生成し、これを現像パラメータの推定に適用する方法について説明した。
実施例1の方法では、個別に最適な現像パラメータを複数組み合わせたときに最適解とはならない可能性があるため、2実施例2では複数の現像パラメータを用いて学習モデルを生成する方法について説明する。
具体的には、現像パラメータの設定において実施例1においては、明度再現を調整する項目として、全体的な階調を調整する「ガンマカーブ」、暗部の階調を調整する「黒レベル」「黒ガンマ」、ハイライト部の階調を調整する「ニーポイント」、「傾き」がある。これらは画像の明るさの階調を決定し相互に作用するため、実施例2では個別での最適化は行わず、まず大まかな階調を「ガンマカーブ」の項目で調整し、その後、暗部とハイライト部について詳細な階調を決定させる処理を行う。
このため、実施例1で使用した16層のネットワークの内、13層までを「ガンマカーブ」のデータセットを用いて学習させ、残り3層を暗部とハイライト部の局所的な現像項目に対応するデータセットを用いて学習させる。
尚、本実施例における画像処理装置1のハードウェア構成は実施例1のものと同等であるため、説明を省略する。以下において、現像パラメータ推定部204の処理を、実施例1のS15に代わり、実施例2では新たにS25として説明する。また、第1実施形態と同一の構成については、同一の符号を付して説明する。
<S25における現像パラメータ推定部204の動作>
図10は、S25において現像パラメータ推定部204が実行する処理の流れを示すフローチャートである。
図10は、S25において現像パラメータ推定部204が実行する処理の流れを示すフローチャートである。
S251において現像パラメータ推定部204は、S14で生成した学習モデル生成用の学習用のデータセットの中から「ガンマカーブ」に対応する学習データを取得する。
S252において現像パラメータ推定部204は、学習処理を行う。CNNを使用しネットワークの構成は16層からなるVGG16を使用する。処理の詳細は実施例1で説明した方法と同様である。
S253において現像パラメータ推定部204は、ネットワークの第1層から第13層までをS252で学習させたパラメータで固定し、第14層から第16層までの3層をまだパラメータが最適化されていない新規層に置き換える。
S254において現像パラメータ推定部204は、S14で生成した学習モデル生成用の学習用のデータセットの中から黒の階調再現に関する「黒レベル」と「黒ガンマ」に対応する学習データを取得する。
S255において現像パラメータ推定部204は、S14で生成した学習モデル生成用の学習用のデータセットの中から高輝度部の圧縮に関する「ニーポイント」と「傾き」に対応する学習データを取得する。
S256において現像パラメータ推定部204は、S254とS255で取得した学習データを用いて第14層から第16層までの3層を学習させる。
S257において現像パラメータ推定部204は、色を合わせる対象の目標画像を取得する。
S258において現像パラメータ推定部204は、S252及びS256で生成した学習モデルを用いて目標画像から現像パラメータを推定する。尚、本実施例では13層までを固定し、14層から16層までをより詳細な階調再現を決定させるために新規層に置き換えて学習させたが、層の構成はこれに限定せず、例えば12層から16層までを置き換えて学習させてもよい。また、学習に使用するデータセットについてもこれに限定せず、例えば「カラーマトリクス」の項目が明るさの階調に寄与する場合は、これを新規層に置き換えて学習させてもよい。
S259において現像パラメータ推定部204は、S258で推定した現像パラメータを保存し、処理を終了する。
以上説明したように、実施例2では、相互に作用する現像パラメータについて複数の現像パラメータを用いて学習モデルを生成し、現像パラメータを推定する方法について説明した。複数の現像パラメータを用いることで、より現像後に近い画像を推定することが可能となり、カメラ間の色を効率よく合わせることができる。
実施例3においては、目標画像に対して色再現特性をより効率的に合わせる方法として、目標画像と現像後画像との差分値に基づいて学習用データセットを学習モデルに設定し、より最適な現像パラメータを導出する方法について説明する。尚、本実施例における画像処理装置1のハードウェア構成は実施例1のものと同等であるため、説明を省略する。以下において、現像パラメータ推定部204の処理を実施例1のS15に代わり、実施例3では新たにS35として説明する。また、実施例1と同一の構成については、同一の符号を付して説明する。
<S35における現像パラメータ推定部204の動作>
図11は、S35において現像パラメータ推定部204が実行する処理の流れを示すフローチャートである。
図11は、S35において現像パラメータ推定部204が実行する処理の流れを示すフローチャートである。
S351において現像パラメータ推定部204は、S13で取得した現像項目を取得する。
S352において現像パラメータ推定部204は、S12で取得した目標画像に対応する現像処理前のRAWデータを取得し、現像項目毎に現像パラメータを複数変化させて現像処理を行う。
S353において現像パラメータ推定部204は、目標画像とS352で現像した複数の現像後画像との画素値の差分値を算出する。尚、本実施例では画素値の差分値として座標位置毎にR,G,Bの各画素の差分値を算出し平均化した値を用いるが、中央値や最頻値など他の統計値を用いてもよい。また、画素値の差分値ではなく、画素値からsRGBやAdobeRGBなどの所定の変換式で輝度値や、さらにCIE-Lab変換式などを用いて色値を算出し、その差分値である輝度差や色差の値を用いてもよい。
S354において現像パラメータ推定部204は、S353で算出した目標画像との差分を表す統計値に基づいて、S352で現像パラメータを複数変えた枚数間の分散値を算出する。尚、本実施例では分散値を用いるが標準偏差など他の統計値を用いてもよい。分散が大きいほどその現像項目の現像パラメータは目標画像に対して寄与率が高く、分散が小さいほど寄与率が低いと見なし、学習モデルによる分類が寄与率の高い現像項目について重みが大きくなるように学習を行う。
S355において現像パラメータ推定部204は、全ての現像項目について現像項目毎に現像枚数間の分散を算出したかどうかを判定し、算出していればS356の処理へ進み、算出していなければS351の処理へ戻る。
S356において現像パラメータ推定部204は、学習処理を行う。CNNを使用しネットワークの構成は16層からなるVGG16を使用する。処理の詳細は実施例1で説明した方法と同様である。学習に使用するデータセットの設定方法として、現像パラメータの寄与度が小さい項目については学習モデルの下位層に、現像パラメータの寄与度が大きい項目についてはより学習の重みを強くするために上位層へ設定し学習を行う。
S357において現像パラメータ推定部204は、色を合わせる対象の目標画像を取得する。
S358において現像パラメータ推定部204は、S356で生成した学習モデルを用いて目標画像から現像パラメータを推定する。
S359において現像パラメータ推定部204は、S358で推定した現像パラメータを保存し、処理を終了する。
以上説明したように、実施例3によれば、目標画像に対して補正対象画像の寄与率が大きい現像項目の順にネットワークの重みが大きくなるように学習モデルを生成し、現像パラメータを推定する方法について説明した。現像項目の中で色再現への影響が大きい項目について最適化の重みを大きくすることで、カメラ間の色を効率よく合わせることができる。
〔その他の実施例〕
実施例1及び2においては、カメラ間の色を効率よく合わせる方法について色再現に関わる現像パラメータの推定方法について説明した。カメラの特性として色再現のほかにも鮮鋭度やノイズ感などあり、これらの特性を合わせるために例えば図12に示すようにシャープネスやNRの現像項目に関する学習用のデータセットを生成し、これらの現像パラメータを推定させてもよい。シャープネスではシャープネスの強度を複数変えて現像した画像とそのシャープネスの設定値の対応関係を、NRではNRの強度を複数変えて現像した画像とそのNRの現像パラメータをデータセットに保持させる。これらのデータセットを用いて上述の学習処理を行うことで色再現に限定せず、鮮鋭度やノイズに関する現像パラメータの推定を行うことができる。
実施例1及び2においては、カメラ間の色を効率よく合わせる方法について色再現に関わる現像パラメータの推定方法について説明した。カメラの特性として色再現のほかにも鮮鋭度やノイズ感などあり、これらの特性を合わせるために例えば図12に示すようにシャープネスやNRの現像項目に関する学習用のデータセットを生成し、これらの現像パラメータを推定させてもよい。シャープネスではシャープネスの強度を複数変えて現像した画像とそのシャープネスの設定値の対応関係を、NRではNRの強度を複数変えて現像した画像とそのNRの現像パラメータをデータセットに保持させる。これらのデータセットを用いて上述の学習処理を行うことで色再現に限定せず、鮮鋭度やノイズに関する現像パラメータの推定を行うことができる。
また本実施例は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (8)
- RAW画像データと、前記RAW画像データを撮像した第一の撮像装置とは異なる第二の撮像装置で撮像された目標画像の目標画像データとを取得する第一取得手段と、
RAW画像データを現像するために用いる現像パラメータと、前記現像パラメータを用いて現像した画像との対応関係を学習した学習モデルを用いて、前記RAW画像データの現像後の画像が前記目標画像の画像特性に近似するよう、前記第一の撮像装置の現像パラメータを推定する推定手段と、
前記推定手段により推定した現像パラメータを用いて、前記RAW画像データを現像する現像手段と、
を有することを特徴とする画像処理装置。 - 前記学習モデルは、前記推定手段で用いられる現像パラメータの項目ごとに生成されたモデルであることを特徴とする請求項1に記載の画像処理装置。
- 前記項目は、画像の色再現特性に関する現像項目であることを特徴とする請求項2に記載の画像処理装置。
- さらに、前記項目を取得する第二取得手段と、
前記第二取得手段により取得した項目について、前記現像パラメータ複数を用いて前記第一取得手段で取得されたRAW画像データを現像し、前記対応関係を生成する生成手段と
を有することを特徴とする請求項2または請求項3に記載の画像処理装置。 - 前記学習モデルは、画像全体の明度再現に関わる前記項目については学習モデルの下位層に設定して学習を行い、画像の局所的な明度再現に関わる前記項目については学習モデルの上位層に設定して学習を行ったモデルであることを特徴とする請求項2乃至請求項4の何れか一項に記載の画像処理装置。
- 前記学習モデルは、前記項目毎に前記目標画像に対する色再現の寄与率を算出し、寄与率が高い項目の順番に学習モデルの上位層のネットワークの重みが大きくなるように学習用データを設定して学習されたモデルであることを特徴とする請求項2乃至請求項5の何れか一項に記載の画像処理装置。
- コンピュータを、請求項1乃至請求項6の何れか一項に記載された画像処理装置の各手段として機能させるためのプログラム。
- RAW画像データと、前記RAW画像データを撮像した第一の撮像装置とは異なる第二の撮像装置で撮像された目標画像の目標画像データとを取得する第一取得工程と、
RAW画像データを現像するために用いる現像パラメータと、前記現像パラメータを用いて現像した画像との対応関係を学習した学習モデルを用いて、前記RAW画像データの現像後の画像が前記目標画像の画像特性に近似するよう、前記第一の撮像装置の現像パラメータを推定する推定工程と、
前記推定工程により推定した現像パラメータを用いて、前記RAW画像データを現像する現像工程と、
を有することを特徴とする画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020186562A JP2022076239A (ja) | 2020-11-09 | 2020-11-09 | 画像処理装置および画像処理方法 |
US17/506,189 US11941853B2 (en) | 2020-11-09 | 2021-10-20 | Apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020186562A JP2022076239A (ja) | 2020-11-09 | 2020-11-09 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022076239A true JP2022076239A (ja) | 2022-05-19 |
JP2022076239A5 JP2022076239A5 (ja) | 2023-11-16 |
Family
ID=81453560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020186562A Pending JP2022076239A (ja) | 2020-11-09 | 2020-11-09 | 画像処理装置および画像処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11941853B2 (ja) |
JP (1) | JP2022076239A (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016162421A (ja) | 2015-03-05 | 2016-09-05 | キヤノン株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US11381737B2 (en) * | 2018-03-28 | 2022-07-05 | Sony Corporation | Arithmetic device and arithmetic method |
US11468269B2 (en) * | 2018-03-28 | 2022-10-11 | Sony Corporation | Arithmetic device, arithmetic method, and discrimination system |
-
2020
- 2020-11-09 JP JP2020186562A patent/JP2022076239A/ja active Pending
-
2021
- 2021-10-20 US US17/506,189 patent/US11941853B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20220148228A1 (en) | 2022-05-12 |
US11941853B2 (en) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3880553B2 (ja) | 画像処理方法および装置 | |
JP3668014B2 (ja) | 画像処理方法及び装置 | |
US7136073B2 (en) | Automatic tone mapping for images | |
US6822762B2 (en) | Local color correction | |
JP7117915B2 (ja) | 画像処理装置、制御方法、及びプログラム | |
JP4687673B2 (ja) | カラー画像のモノトーン化処理 | |
US10764469B2 (en) | Image processing apparatus, image processing method, and storage medium that convert an input luminance signal included in image data into an output signal for printing by using a conversion parameter | |
JP2001313844A (ja) | 局所的な色補正を実行する方法および装置 | |
US11880963B2 (en) | Apparatus and method for image processing | |
JP2020004268A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP4001079B2 (ja) | カラー画像のモノトーン化処理 | |
JP5975213B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR100735551B1 (ko) | 칼라 영역별 적응적 필터링 방법 및 장치 | |
JP2022076239A (ja) | 画像処理装置および画像処理方法 | |
JP7199849B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2003230052A (ja) | 電子カメラ、画像処理プログラムおよび画像処理方法 | |
JP7005215B2 (ja) | 画像処理装置、及び、画像処理方法、コンピュータプログラム | |
JP2006114006A (ja) | 階調変換装置、プログラム、電子カメラ、およびその方法 | |
JP2020145553A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2020123138A (ja) | 画像処理装置および画像処理方法、プログラム、記憶媒体 | |
JP2006031682A (ja) | ルックアップテーブル作成装置および方法,ならびにルックアップテーブル作成プログラム | |
KR101241263B1 (ko) | 카탈로그 화상 생성 장치, 방법, 및 프로그램 | |
JP2003209707A (ja) | 画像処理方法および画像処理装置並びに画像形成装置、プログラム、記録媒体 | |
JP2023044689A (ja) | 画像処理装置 | |
JP2623029B2 (ja) | カラー画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20201209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231108 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |