WO2021199366A1

WO2021199366A1 - 情報処理装置、方法、プログラム、およびモデル

Info

Publication number: WO2021199366A1
Application number: PCT/JP2020/014970
Authority: WO
Inventors: 荻原　康樹
Original assignee: ソニーグループ株式会社
Priority date: 2020-03-31
Filing date: 2020-03-31
Publication date: 2021-10-07

Abstract

被写体が撮影された撮影画像を取得する取得部と、撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う学習部とを備えた、情報処理装置が提供される。このような情報処理装置により、様々な撮影画像のホワイトバランスをより容易に調整することができる。

Description

情報処理装置、方法、プログラム、およびモデル

　本開示は、情報処理装置、方法、プログラム、およびモデルに関する。

　カメラやビデオカメラなどにおいて、光源の影響により発生する被写体の色かぶり（特定の色に偏ること）を補正し、適切なホワイトバランスに調整するオートホワイトバランス（ＡＷＢ：Ａｕｔｏ　Ｗｈｉｔｅ　Ｂａｌａｎｃｅ）機能がある。ＡＷＢ機能は、携帯電話やスマートフォンなどカメラ機能を搭載した端末にも備わっている場合が多い。

特開２０１７－０５５２３１号公報

　しかしながら、ＡＷＢ機能は、物理現象と開発者のノウハウに基づいて構築されたアルゴリズムによって実現される。このようなアルゴリズムは、様々な撮影画像に対応するために複雑化する一方で、開発者への依存度が高く、より多くの撮影画像（例えば、茶色い被写体を引き込み過ぎて全体的に青味がかってしまうなどの特定色の引き込み画像）に対応することが実質的に困難になっている。

　そこで、本開示では、様々な撮影画像のホワイトバランスをより容易に調整することができる情報処理装置、方法、プログラム、およびモデルを提案する。

　本開示によれば、被写体が撮影された撮影画像を取得する取得部と、撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う学習部とを備えた、情報処理装置が提供される。

　また、本開示によれば、第１の被写体が撮影された第１の画像を取得する取得部と、被写体が撮影された撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルに、第１の画像を入力することにより、第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する推定部とを備えた、情報処理装置が提供される。

　また、本開示によれば、情報処理装置が、被写体が撮影された撮影画像を取得し、撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う処理を実行する、方法が提供される。

　また、本開示によれば、情報処理装置が、第１の被写体が撮影された第１の画像を取得し、被写体が撮影された撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルに、第１の画像を入力することにより、第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する処理を実行する、方法が提供される。

　また、本開示によれば、情報処理装置に、被写体が撮影された撮影画像を取得し、撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う処理を実行させる、プログラムが提供される。

　また、本開示によれば、情報処理装置に、第１の被写体が撮影された第１の画像を取得し、被写体が撮影された撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルに、第１の画像を入力することにより、第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する処理を実行させる、プログラムが提供される。

　また、本開示によれば、被写体が撮影された撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルであって、第１の画像が入力される入力層と、第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを出力する出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第１要素と、第１要素と第１要素の重みとに基づいて値が算出される第２要素とを含み、入力層に入力された第１の画像に応じて、出力層以外の各層に属する各要素を第１要素として、第１要素と第１要素の重みとに基づく演算を行うことにより、第１の画像補正パラメータを出力層から出力するように情報処理装置を機能させるためのモデルが提供される。

ホワイトバランス調整の従来法と本実施形態に係る方法との違いを示す図である。本実施形態に係る情報処理装置１００の機能構成例を示すブロック図である。本実施形態に係る情報処理端末２００の機能構成例を示すブロック図である。一般的なＡＷＢ処理の一例を示す図である。本実施形態に係るＷＢゲイン出力モデルの学習フェーズの一例を示す図である。同実施形態に係る主要被写体オブジェクトの抽出の一例を示す図である。同実施形態に係る主要被写体ＭＡＰの生成の一例を示す図である。同実施形態に係るＷＢゲイン出力モデルの推定フェーズの一例を示す図である。同実施形態に係るＷＢゲイン出力モデルの転移学習の一例を示す図である。同実施形態に係る情報処理装置１００のハードウェア構成例を示すブロック図である。

　以下に、本実施形態について図面に基づいて詳細に説明する。なお、本明細書および図面において、実質的に同一の部位には、同一の符号を付することにより重複する説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．実施形態
　　１．１．機能構成例
　　１．２．機能の詳細
　　１．３．変形例
　２．ハードウェア構成例
　３．まとめ

＜１．実施形態＞
　まず、本実施形態は、スマートフォンやカメラなどの情報処理端末２００によって撮影される様々な撮影画像のホワイトバランスをより容易に調整することを目的としている。図１は、ホワイトバランス調整の従来法と本実施形態に係る方法との違いを示す図である。図１の左側は、ホワイトバランス調整の従来法のイメージを示している。図１の左側に示されるように、従来法は、撮影画像に対する光源推定から始まり、様々な撮影画像のホワイトバランス調整に対応するために多数の判定処理が付け加えられ、複雑化している。例えば、屋外、屋内、暗所で撮影された画像、太陽の光が強い等、高輝度の下で撮影された画像、色温度が高いところで撮影された画像、色温度が低いところで撮影された画像、各種光源（蛍光灯、ＬＥＤ、電球など）の下で撮影された画像、特殊光源（水銀灯など）の下で撮影された画像、人物を撮影した画像、料理を撮影した画像など、様々なシーンで部類可能な撮影画像には、それぞれ最適なホワイトバランスの調整処理が存在する。

　そこで、従来法に置き換わる本実施形態では、図１の右側に示すように、撮影画像を入力すると画像補正パラメータであるＷＢゲインを出力するような学習モデルを構築する。これにより、様々な撮影画像に対応するために、既存アルゴリズムを変更するのではなく、既存モデルに対する学習および再学習を行えば済むようになり、開発者の負担を減らすことができる。

＜＜１．１．機能構成例＞＞
　次に、本実施形態に係る情報処理装置１００の機能構成例について説明する。情報処理装置１００は、情報処理端末２００のメーカーによって管理されるサーバ装置であってもよいし、据え置き端末やノートＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）であってもよい。なお、情報処理装置１００は、クラウドコンピューティングサービスを提供する企業によって管理されるクラウドサーバ装置であってもよい。また、情報処理装置１００は１台のコンピュータで構成される必要はなく、複数台のコンピュータで構成される分散型コンピューティングシステムであってもよい。

　図２は、本実施形態に係る情報処理装置１００の機能構成例を示すブロック図である。図２に示すように、本実施形態に係る情報処理装置１００は、記憶部１１０、取得部１２０、変換部１３０、学習部１４０、制御部１５０を備える。

（記憶部１１０）
　本実施形態に係る記憶部１１０は、各種プログラムやデータを一時的または恒常的に記憶するための記憶領域である。記憶部１１０には、情報処理装置１００が各種機能を実行するためのプログラムやデータが記憶されてよい。具体的な一例として、記憶部１１０には、撮影画像を変換し、低解像度画像を得るためのプログラムやパラメータ、撮影画像からＷＢゲインを出力するための学習モデルや学習のための正解データ、各種設定などを管理するための管理データなどが記憶されてよい。もちろん、上記はあくまで一例であり、記憶部１１０に記憶されるデータの種別は特に限定されない。

（取得部１２０）
　本実施形態に係る取得部１２０は、ＷＢゲイン出力モデルの学習を行うため、記憶部１１０、または情報処理装置１００とは別の装置に、予め準備され記憶されたホワイトバランス調整前の原画像および当該原画像に対して最適なＷＢゲインを取得する。特に、ＷＢゲイン出力モデルの教師データが偏らないようにするため、上述したような屋外、屋内、暗所など様々なシーンで撮影された撮影画像の原画像およびＷＢゲインを取得する。また、本実施形態では、教師データの準備負担を軽減させること、および従来法の精度を維持することなどのため、図１で説明したような従来法のアルゴリズムによって調整された撮影画像の調整前の原画像およびＷＢゲインを取得する。

（変換部１３０）
　本実施形態に係る変換部１３０は、取得部１２０によって取得された撮影画像を、所定の度数まで解像度を落とした低解像度画像に変換する。所定の度数とは、例えば、３２×３２の解像度であるが、３２×３２より多くても少なくてもよい。撮影画像の解像度をある程度落としても、ＷＢゲイン出力モデルの学習および推定の精度に影響がないことがわかっており、これにより、学習時や推定時の処理負荷を軽減させることができる。しかしながら、情報処理装置１００や、ＷＢゲイン出力モデルを用いてＷＢゲインの推定を行うスマートフォンやカメラなど情報処理端末２００の性能によっては、撮影画像を高解像度のままで学習することにより、学習および推定の精度を向上させることができる。

（学習部１４０）
　本実施形態に係る学習部１４０は、撮影画像を入力、ＷＢゲインを正解とする教師データを学習して学習モデルを構築する。上述したように、低解像度画像を用いる場合、教師データとして入力される撮影画像は、変換部１３０によって変換された低解像度画像である。なお、正解データであるＷＢゲインは、撮影画像中の基準となる白（厳密には、例えば、１８％グレー）の画素を指定することにより生成される。また、正解データであるＷＢゲインは、撮影画像の光源およびシーンごとに選択されたホワイトバランスアルゴリズムを用いて算出してもよい。

　なお、本実施形態の学習モデルは、被写体が撮影された撮影画像が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第１要素と、第１要素と第１要素の重みとに基づいて値が算出される第２要素と、を含み、入力層に入力された撮影画像に応じて、出力層以外の各層に属する各要素を第１要素として、第１要素と前記第１要素の重みとに基づく演算を行うことにより、撮影画像のホワイトバランスを調整するための画像補正パラメータを出力層から出力するよう、情報処理装置１００を機能させる。なお、当該画像補正パラメータとは、例えば、ＷＢゲインである。

　なお、本実施形態の学習モデルを生成する生成装置（例えば、サーバ装置などの情報処理装置１００）は、いかなる学習アルゴリズムを用いて上述の学習モデルを生成してもよい。例えば、生成装置は、ニューラルネットワーク（ＮＮ：Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）、サポートベクターマシン（ＳＶＭ：Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ）、強化学習などの学習アルゴリズムを用いて本実施形態の学習モデルを生成してもよい。一例として、生成装置がＮＮを用いて本実施形態の学習モデルを生成するとする。この場合、学習モデルは、１つ以上のニューロンを含む入力層と、１つ以上のニューロンを含む中間層と、１つ以上のニューロンを含む出力層とを有していてもよい。

　ここで、本実施形態に係る学習モデルが「ｙ＝ａ_１＊ｘ_１＋ａ_２＊ｘ_２＋・・・＋ａ_ｉ＊ｘ_ｉ」で示す回帰モデルで実現されるとする。この場合、学習モデルが含む第１要素は、ｘ_１やｘ_２などといった入力データ（ｘ_ｉ）に対応する。また、第１要素の重みは、ｘ_ｉに対応する係数ａ_ｉに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンとみなすことができる。各モデルを単純パーセプトロンとみなした場合、第１要素は、入力層が有するいずれかのノードに対応し、第２要素は、出力層が有するノードとみなすことができる。

　また、本実施形態に係る学習モデルがＤＮＮ（Ｄｅｅｐ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）など、１つまたは複数の中間層を有するＮＮで実現されるとする。この場合、学習モデルが含む第１要素は、入力層または中間層が有するいずれかのノードに対応する。また、第２要素は、第１要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第１要素の重みは、第１要素と対応するノードから第２要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。

　上述した回帰モデルやＮＮなど、任意の構造を有する学習モデルを用いて、任意の撮影画像のホワイトバランスを調整するための画像補正パラメータを算出する。より具体的には、学習モデルは、任意の撮影画像が入力された場合に、当該撮影画像のホワイトバランスを調整するための画像補正パラメータを出力するように係数が設定される。本実施形態に係る学習モデルは、データの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。

　なお、上記例では、本実施形態に係る学習モデルが、任意の撮影画像が入力された場合に、当該撮影画像のホワイトバランスを調整するための画像補正パラメータを出力するモデル（モデルＡとする）である例を示した。しかしながら、本実施形態に係る学習モデルは、モデルＡに対しデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、本実施形態に係る学習モデルは、任意の撮影画像を入力とし、モデルＡが出力する当該撮影画像のホワイトバランスを調整するための画像補正パラメータを出力とする学習モデル（モデルＢとする）であってもよい。または、本実施形態に係る学習モデルは、任意の撮影画像を入力とし、モデルＢが出力する当該撮影画像のホワイトバランスを調整するための画像補正パラメータを出力とする学習モデルであってもよい。

（制御部１５０）
　本実施形態に係る制御部１５０は、情報処理装置１００全体を司る処理部であり、情報処理装置１００が備える各構成を制御する。制御部１５０が有する機能の詳細については後述される。

　以上、本実施形態に係る情報処理装置１００の機能構成例について説明した。なお、図２を用いて説明した上記の機能構成はあくまで一例であり、本実施形態に係る情報処理装置１００の機能構成は係る例に限定されない。例えば、情報処理装置１００は、必ずしも図２に示す構成のすべてを備えなくてもよい。本実施形態に係る情報処理装置１００の機能構成は、仕様や運用に応じて柔軟に変形可能である。

　また、各構成要素の機能を、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｃｅｓｓｉｎｇ　Ｕｎｉｔ）などの演算装置がこれらの機能を実現する処理手順を記述した制御プログラムを記憶したＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）やＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などの記憶媒体から制御プログラムを読み出し、そのプログラムを解釈して実行することにより行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜利用する構成を変更することが可能である。また、情報処理装置１００のハードウェア構成の一例については後述される。

　次に、本実施形態に係る情報処理端末２００の機能構成例について説明する。情報処理端末２００は、カメラ装置や、カメラ機能を搭載したスマートフォンやタブレットＰＣなどである。

　図３は、本実施形態に係る情報処理端末２００の機能構成例を示すブロック図である。図３に示すように、本実施形態に係る情報処理端末２００は、記憶部２１０、取得部２２０、撮影部２３０、推定部２４０、調整部２５０、制御部２６０を備える。

（記憶部２１０）
　本実施形態に係る記憶部２１０は、情報処理装置１００の記憶部１１０と同様の記憶領域であり、情報処理端末２００が各種機能を実行するためのプログラムやデータが記憶されてよい。具体的な一例として、記憶部２１０には、撮影画像やそのＲＡＷデータ、情報処理装置１００によって構築された学習モデル、各種設定などを管理するための管理データなどが記憶されてよい。もちろん、上記はあくまで一例であり、記憶部２１０に記憶されるデータの種別は特に限定されない。

（取得部２２０）
　本実施形態に係る取得部２２０は、情報処理装置１００によって構築された学習モデルを取得する。なお、情報処理端末２００で学習モデルを持たず、情報処理装置１００によって、ホワイトバランスを調整するための画像補正パラメータを推定する場合は、学習モデルを取得する必要はない。

（撮影部２３０）
　本実施形態に係る撮影部２３０は、制御部２６０による制御に基づいて動画や写真の撮影を行う。撮影部２３０は、撮像素子、フォーカスリングやズームレンズなどを備える。撮影部２３０によって撮影された動画や写真はデジタルデータに変換され、記憶部２１０に記憶される。

（推定部２４０）
　本実施形態に係る推定部２４０は、情報処理装置１００によって構築された学習モデルを用いて、撮影部２３０によって撮影された撮影画像のホワイトバランスを調整するための画像補正パラメータを推定する。

（調整部２５０）
　本実施形態に係る調整部２５０は、推定部２４０によって推定された画像補正パラメータを用いて、対応する撮影画像のホワイトバランスを調整する。上述したように、画像補正パラメータは、例えば、ＷＢゲインである。調整部２５０は、ＷＢゲインを用いて、撮影画像において基準となる白（厳密には、例えば、１８％グレー）が本来の色となるよう撮影画像のホワイトバランスを調整する。

　なお、以下のような場合、情報処理端末２００は、推定部２４０や調整部２５０を有さなくてもよい。このようなパターンは、例えば、以下のような２パターンがある。

　１パターン目は、画像補正パラメータの推定を情報処理装置１００によって行う場合である。この場合、情報処理端末２００は、推定部２４０を有さなくてよい。この場合の具体的な処理は、情報処理端末２００が撮影した画像のＲＡＷデータを情報処理装置１００に送信する。そして、情報処理装置１００は推定部２４０と同様の処理部を持ち、当該処理部が、受信したＲＡＷデータを学習モデルに入力し画像補正パラメータを推定する。さらに、情報処理装置１００は、推定した画像補正パラメータを情報処理端末２００に送信し、情報処理端末２００が、受信した画像補正パラメータを用いてホワイトバランス調整を行う。なお、情報処理端末２００から送信されるＲＡＷデータは、画像補正パラメータの推定まで性能の高い情報処理装置１００で行うため、必ずしも低解像度化されたものである必要はない。

　２パターン目は、画像補正パラメータの推定、および画像補正パラメータを用いたホワイトバランス調整を含む現像処理全般を情報処理装置１００によって行う場合である。この場合、情報処理端末２００は、推定部２４０および調整部２５０を有さなくてよい。この場合の具体的な処理は、情報処理端末２００が撮影した画像のＲＡＷデータを情報処理装置１００に送信する。そして、情報処理装置１００は推定部２４０および調整部２５０と同様の処理部を持ち、当該処理部が、受信したＲＡＷデータを学習モデルに入力し画像補正パラメータを推定し、推定した画像補正パラメータを用いてホワイトバランス調整を含む各種補正（現像処理）を実行し、補正後の撮影画像を情報処理端末２００に送信する。こちらのパターンの場合も、情報処理端末２００から送信されるＲＡＷデータは、低解像度化されたものである必要はない。

＜＜１．２．機能の詳細＞＞
　次に、本実施形態に係る情報処理装置１００および情報処理端末２００が有する機能について詳細に説明する。まず、本実施形態は、スマートフォンやカメラなどの情報処理端末２００によって撮影された撮影画像のホワイトバランスを調整するために行われる。本実施形態では、情報処理装置１００が、ホワイトバランスを調整するＷＢゲインを推定するための学習モデルを構築する。そして、情報処理端末２００が、構築された学習モデルを用いて、ＷＢゲインを推定し、撮影画像のホワイトバランスを調整する。そのため、本実施形態に係る主な処理は情報処理装置１００による学習フェーズと、情報処理端末２００による認識（推定）フェーズに分かれる。

　まず、本実施形態について説明する前に、一般的なＡＷＢ処理について説明する。図４は、一般的なＡＷＢ処理の一例を示す図である。スマートフォンやカメラなどの情報処理端末２００は、カメラレンズを通して入射した被写体の光をイメージセンサによってＲＡＷデータに変換する。ＲＡＷデータは、例えば、べイヤー（Ｂａｙｅｒ）フィルタによってべイヤ配列に並べられた信号である。

　ＲＡＷデータは、低解像度（例えば、３２×３２）画像信号に変換され、ＡＷＢアルゴリズムに入力される。この際、撮影パラメータである、ＡＥ（Ａｕｔｏ　Ｅｘｐｏｓｕｒｅ：自動露出）値（ＥＶ）、ＡＦ（Ａｕｔｏ　Ｆｏｃｕｓ：自動フォーカス）値、ＩＲ（Ｉｎｆｒａｒｅｄ：赤外線）値、シャッタースピード、ＡＧＣ（Ａｕｔｏ　Ｇａｉｎ、Ｃｏｎｔｒｏｌ）、ＩＳＯ感度、シーン情報、屋内／屋外、ストロボＯｎ／Ｏｆｆ、顔認証、認識情報など各種外部センシング情報がＡＷＢアルゴリズムに併せて入力されてもよい。

　次に、入力された信号に対し、明度や彩度の調整やカメラ装置の機種依存を排除する正規化が行われる。次に、太陽光やライトなどの光源が推定され、ＲＧＢの成分ごとに画像中の基準となる白（厳密にはグレー）を白とするよう色味補正が行われる。そして、特定の色味を残したり、ストロボ使用時の青味を緩和したりするなどその他の補正処理が行われ、各色の調整値であるＷＢゲイン（Ｒゲイン、Ｇゲイン、Ｂゲイン）に変換され、出力される。

　本実施形態では、ＡＷＢアルゴリズムの光源推定および色味補正の処理を、学習モデルであるＷＢゲイン出力モデルを用いて実現する。ＷＢゲイン出力モデルに対する処理は、主に、学習フェーズと推定フェーズとに分かれる。学習フェーズでは、撮影画像のＲＡＷデータまたはＲＡＷデータを低解像度に変換した画像（信号）を入力、当該画像に対しホワイトバランス調整を行った際の調整値（すなわち、ＷＢゲイン）を正解とする教師データを用いてＷＢゲイン出力モデルの学習を行う。また、推定フェーズでは、撮影画像のＷＢゲイン出力モデルに、撮影した画像のＲＡＷデータまたはＲＡＷデータを低解像度に変換した画像（信号）を入力し、当該画像に対するＷＢゲインを推定する。

　図５は、本実施形態に係るＷＢゲイン出力モデルの学習フェーズの一例を示す図である。図５に示すように、まず、スマートフォンやカメラなどの情報処理端末２００によって撮影された撮影画像を、例えば、３２×３２の低解像度画像に変換する。なお、３２×３２の各領域に含まれる画素数は一定であっても異なってもよい。例えば、各領域に含まれる画素数が一定になるように分割し、端数の画素数分の画素は撮影画像外縁の領域に含めるようにしてもよい。

　次に、低解像度に変換された撮影画像と、その正解データとをＷＢゲイン出力モデルに学習させる。なお、正解データはＷＢゲインであるが、カメラセンサーによって認識され撮影された撮影画像のＲＧＢ値はＧ値が強くなる傾向になるため、厳密には、撮影画像のＲ値およびＢ値に乗算する値、すなわち、ＲゲインおよびＢゲインである。また、ＷＢゲイン出力モデルの学習には、従来法のアルゴリズムによってホワイトバランス調整された撮影画像（第２の撮影画像に相当）の調整前の原画像（ＲＡＷデータ）を撮影画像として、および、その際の調整値（例えば、ＷＢゲイン。第２の画像補正パラメータに相当）を正解データとして用いることができる。

　また、ＷＢゲイン出力モデルにはより推定精度を高めるために、撮影画像のメタデータをさらに学習させることができる。これにより、以下のようなメタデータを考慮した学習モデルを生成することができる。当該メタデータは、例えば、撮影画像のＡＥ値、ＡＦ値、ＩＲ値、シャッタースピード、ＡＧＣ、ＩＳＯ感度、シーン情報、屋内／屋外、ストロボＯｎ／Ｏｆｆ、顔認証、認識情報などであってよい。認識情報は、例えば、被写体に人物が含まれる場合に人物を顔認識などした認証結果や顔の位置である。さらに、当該メタデータは、特定の被写体までの距離であるＴｏＦ（Ｔｉｍｅ　ｏｆ　Ｆｌｉｇｈｔ）や、被写体中の主要被写体を含んでもよい。なお、主要被写体とは、ユーザが撮影したいと考えている被写体（例えば、人物や花）である。なお、メタデータの学習は、ＷＢゲイン出力モデルの学習の際の入力データである撮影画像とセットで入力されることになる。

　主要被写体は、撮影画像を入力、主要被写体データを正解とする教師データを学習した学習モデルを用いて推定することができる。このような主要被写体検出モデルに学習させる主要被写体データは、例えば、撮影画像から抽出された主要被写体となるオブジェクトである。

　図６は、本実施形態に係る主要被写体オブジェクトの抽出の一例を示す図である。図６の左側は、外の景色が見える窓のあるリビングにいる猫の撮影画像である。これに対し、図６の右側は、主要被写体である猫を抽出した画像である。このように、様々な撮影画像から、主要被写体になり得る、人、動植物、建築物、車や飛行機などの移動体、文字や看板、玩具、電化製品、料理、衣類、アクセサリ、天体、・・・などのオブジェクトを抽出し、主要被写体になり得るオブジェクトが写った画像と主要被写体部分をマスクしたマスク画像とを学習させることで学習モデルを生成する。このような学習モデルにより、撮影画像から適切な主要被写体を決定することができる。また、学習モデルの教師データとして、被写体の深度を用いてもよい。これにより、被写体までの距離を考慮した学習モデルを生成することができる。また、撮影動画の過去のフレームの撮影画像を含めた時系列データを入力とするＲＮＮ（Ｒｅｃｕｒｒｅｎｔ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）による深層学習を行うこともできる。

　次に、図７を用いて、撮影画像から主要被写体を決定するための主要被写体ＭＡＰの生成方法について説明する。図７は、本実施形態に係る主要被写体ＭＡＰの生成の一例を示す図である。本実施形態では、撮影画像の所定領域ごとに主要被写体度（主要被写体である確率。例えば、０～１の値。）を算出し、各所定領域と主要被写体度とをマッピングした主要被写体ＭＡＰを生成することで、主要被写体領域が決定される。図７の左側に示すように、各所定領域は、例えば、撮影画像を縦９×横１１に分割することで決定される。なお、分割する領域数は縦９×横１１に限定されず、各領域に含まれる画素数は一定であっても異なってもよい。例えば、各領域に含まれる画素数が一定になるように分割し、端数の画素数分の画素は撮影画像外縁の領域に含めるようにしてもよい。

　図７の左側において分割した撮影画像の各領域に対して、図６での説明のように生成された学習モデルを用いて主要被写体度が算出され、主要被写体ＭＡＰが生成される。図７の右側が生成された主要被写体ＭＡＰの一例である。図７の右側に示すように、主要被写体ＭＡＰには、領域ごとに算出された主要被写体度が示されている。図７の例では、撮影画像における“花”を含んだ領域が高い主要被写体度を示している。なお、図７の例では、主要被写体度の高い領域が一箇所に集まっているが、撮影画像によっては主要被写体度の高い領域が分散したり、無かったりする場合もあり得る。

　次に、図５に示すように撮影画像およびＷＢゲイン（場合によってはさらに撮影画像のメタデータ）を用いて学習させたＷＢゲイン出力モデルの推定フェーズについて説明する。図８は、本実施形態に係るＷＢゲイン出力モデルの推定フェーズの一例を示す図である。図８に示すように、学習済みのＷＢゲイン出力モデルに、スマートフォンやカメラなどの情報処理端末２００によって撮影された撮影画像のＲＡＷデータまたはＲＡＷデータを低解像度に変換した画像（場合によってはさらに撮影画像のメタデータ）を入力すると、推定結果として、撮影画像のホワイトバランスを調整するための画像補正パラメータであるＲゲインおよびＢゲインが出力される。

　次に、ＷＢゲイン出力モデルの再学習について説明する。ＷＢゲイン出力モデルの再学習は、例えば、撮影画像を入力、ＷＢゲインを正解とする教師データを学習して構築されたＷＢゲイン出力モデルを用いて、上述したような屋外、屋内、暗所など様々なシーンを撮影する。そして、様々なシーンの撮影画像の中からホワイトバランスが適切ではないシーンを人間が判断し、当該シーンの撮影画像と、当該撮影画像に対して最適なＷＢゲインを準備して、これらを教師データとしてＷＢゲイン出力モデルの再学習を行う。

　また、別の例として、ユーザからのフィードバックを利用した再学習がある。これは、情報処理端末２００で撮影された画像を、ユーザが自ら、画像加工アプリケーションなどを用いてホワイトバランス調整した場合に、情報処理端末２００は、この際のＷＢゲインを情報処理装置１００に送信し、情報処理端末２００は、撮影画像と当該ＷＢゲインと教師データとしてＷＢゲイン出力モデルの再学習を行う。なお、撮影画像は予め情報処理装置１００に送信されている場合は、例えば、情報処理端末２００が、撮影画像の識別番号をＷＢゲインと併せて送信することで情報処理装置１００において撮影画像の取得を行う。これにより、ＷＢゲイン出力モデルは、特定ユーザの好みに合わせた学習が行われることになるが、特定ユーザのみならず他のユーザからのフィードバックを利用して、共通のＷＢゲイン出力モデルとして再学習を行ってもよい。

　また、ＷＢゲイン出力モデルから出力された推定結果と、正解データとの誤差を用いて、ＷＢゲイン出力モデルを再学習することもできる。なお、ＷＢゲイン出力モデルの再学習は、当該誤差が所定の閾値以上の場合に実行するようにしてもよい。また、ＷＢゲイン出力モデルの再学習は、転移学習によって行われてもよい。

　図９は、本実施形態に係るＷＢゲイン出力モデルの転移学習の一例を示す図である。ＷＢゲイン出力モデルは、画像の学習に特化した畳み込みニューラルネットワーク（ＣＮＮ：Ｃｏｎｖｏｌｕｔｉｏｎａｌ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）を用いることができる。図９に示すように、撮影画像をＷＢゲイン出力モデルに入力すると、特徴量抽出層（畳み込み層）２００－１～２００－５を経て、画像の視覚的特徴から意味的特徴に構造化される。なお、図９の特徴量抽出層２００－１～２００－５は一例であり、層の深さは５層に限られない。次に、特徴量抽出層２００－５から出力された特徴量が、全結合層３００に入力され、推定結果であるＲゲインおよびＢゲインが出力される。そして、推定結果と正解データとの誤差を転移学習により全結合層３００に再学習させる。なお、転移学習は、全結合層３００全体に限られず、全結合層３００の後半部分のみや、特徴量抽出層２００－１～２００－５の一部も含んで再学習させることもできる。

＜＜１．３．変形例＞＞
　上述したように、ＷＢゲイン出力モデルに学習させる正解データは、例えば、撮影画像中の基準となるグレーを本来の色に調整するためのＷＢゲインとした。本実施形態の変形例として、この基準を変更することにより、ＷＢゲイン出力モデルから、様々な色合いに調整するためのＷＢゲインを出力させ、当該ＷＢゲインを用いて、撮影画像を、例えば、レトロなカメラで撮影されたような色合いや、セピア調など特殊な色合いに調整することができる。

＜２．ハードウェア構成例＞
　次に、本実施形態に係る情報処理装置１００のハードウェア構成例について説明する。なお、情報処理端末２００も同様の構成を有することができる。図１０は、本実施形態に係る情報処理装置１００のハードウェア構成例を示すブロック図である。図１０を参照すると、情報処理装置１００は、例えば、プロセッサ８０１と、ＲＯＭ８０２と、ＲＡＭ８０３と、ホストバス８０４と、ブリッジ８０５と、外部バス８０６と、インターフェース８０７と、入力装置８０８と、出力装置８０９と、ストレージ８１０と、ドライブ８１１と、接続ポート８１２と、通信装置８１３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

（プロセッサ８０１）
　プロセッサ８０１は、例えば、演算処理装置または制御装置として機能し、ＲＯＭ８０２、ＲＡＭ８０３、ストレージ８１０、またはリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般またはその一部を制御する。

（ＲＯＭ８０２、ＲＡＭ８０３）
　ＲＯＭ８０２は、プロセッサ８０１に読み込まれるプログラムや演算に用いるデータなどを格納する手段である。ＲＡＭ８０３には、例えば、プロセッサ８０１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータなどが一時的または永続的に格納される。

（ホストバス８０４、ブリッジ８０５、外部バス８０６、インターフェース８０７）
　プロセッサ８０１、ＲＯＭ８０２、ＲＡＭ８０３は、例えば、高速なデータ伝送が可能なホストバス８０４を介して相互に接続される。一方、ホストバス８０４は、例えば、ブリッジ８０５を介して比較的データ伝送速度が低速な外部バス８０６に接続される。また、外部バス８０６は、インターフェース８０７を介して種々の構成要素と接続される。

（入力装置８０８）
　入力装置８０８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、およびレバーなどが用いられる。さらに、入力装置８０８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８０８には、マイクロフォンなどの音声入力装置が含まれる。

（出力装置８０９）
　出力装置８０９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＬＣＤ、または有機ＥＬなどのディスプレイ装置、スピーカ、ヘッドホンなどのオーディオ出力装置、プリンタ、携帯電話、またはファクシミリなど、取得した情報を利用者に対して視覚的または聴覚的に通知することが可能な装置である。また、本実施形態に係る出力装置８０９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

（ストレージ８１０）
　ストレージ８１０は、各種のデータを格納するための装置である。ストレージ８１０としては、例えば、ハードディスクドライブ（ＨＤＤ）などの磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどが用いられる。

（ドライブ８１１）
　ドライブ８１１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体９０１に記録された情報を読み出し、またはリムーバブル記録媒体９０１に情報を書き込む装置である。

（接続ポート８１２）
　接続ポート８１２は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、または光オーディオ端子などのような外部接続機器９０２を接続するためのポートである。

（通信装置８１３）
　通信装置８１３は、ネットワークに接続するための通信デバイスであり、例えば、有線または無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、または各種通信用のモデムなどである。

（リムーバブル記録媒体９０１）
　リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディアなどである。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、または電子機器などであってもよい。

（外部接続機器９０２）
　外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、またはＩＣレコーダなどである。

　なお、本実施形態に係る記憶部１１０は、ＲＯＭ８０２やＲＡＭ８０３、ストレージ８１０によって実現される。また、プロセッサ８０１によって実現される本実施形態に係る制御部１５０が、取得部１２０、変換部１３０、学習部１４０、推定部２４０、調整部２５０を実現する各制御プログラムを、ＲＯＭ８０２やＲＡＭ８０３などから読み出し実行する。

＜３．まとめ＞
　以上説明したように、被写体が撮影された撮影画像を取得する取得部と、撮影画像を入力、撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う学習部とを備えた、情報処理装置が提供される。

　これにより、様々な撮影画像のホワイトバランスをより容易に調整することができる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、本技術は以下のような構成も取ることができる。
（１）被写体が撮影された撮影画像を取得する取得部と、
　前記撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う学習部と
　を備えた、情報処理装置。
（２）前記画像補正パラメータ、および前記第１の画像補正パラメータはホワイトバランスゲインである、前記（１）に記載の情報処理装置。
（３）前記学習部はさらに、前記第１の画像補正パラメータと、前記画像補正パラメータとの誤差を用いて前記モデルの再学習を行う、前記（１）または（２）に記載の情報処理装置。
（４）前記再学習は、前記誤差が所定の閾値以上である場合に実行される、前記（３）に記載の情報処理装置。
（５）前記画像補正パラメータは、前記撮影画像中の基準となるグレーの画素を指定することにより生成される、前記（１）～（４）のいずれか１つに記載の情報処理装置。
（６）前記画像補正パラメータは、前記撮影画像の光源およびシーンごとに選択されたホワイトバランスアルゴリズムを用いて算出される、前記（１）～（５）のいずれか１つに記載の情報処理装置。
（７）前記モデルの前記入力は、前記撮影画像のメタデータをさらに含む、前記（１）～（６）のいずれか１つに記載の情報処理装置。
（８）前記メタデータは、ＥＶ値、ＩＲ値、前記被写体に対する認識情報、前記被写体までの距離、前記被写体中の主要被写体の少なくとも１つである、前記（７）に記載の情報処理装置。
（９）前記撮影画像は、所定の度数まで解像度を落とした低解像度画像である、前記（１）～（８）のいずれか１つに記載の情報処理装置。
（１０）第１の被写体が撮影された第１の画像を取得する取得部と、
　被写体が撮影された撮影画像を入力データ、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解データとして学習したモデルに、前記第１の画像を入力することにより、前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する推定部と
　を備えた、情報処理装置。
（１１）前記画像補正パラメータ、および前記第１の画像補正パラメータはホワイトバランスゲインである、前記（１０）に記載の情報処理装置。
（１２）前記モデルの前記入力は、前記撮影画像のメタデータをさらに含み、
　前記推定部は、前記モデルに前記第１の画像の第１のメタデータをさらに入力することで、前記第１の画像補正パラメータを推定する、前記（１０）または（１１）に記載の情報処理装置。
（１３）前記メタデータは、前記撮影画像のＥＶ値およびＩＲ値、前記被写体に対する認識情報、前記被写体までの距離、ならびに前記被写体中の主要被写体の少なくとも１つであり、前記メタデータは、前記第１の画像のＥＶ値およびＩＲ値、前記第１の被写体に対する認識情報、前記第１の被写体までの距離、ならびに前記第１の被写体中の第１の主要被写体の少なくとも１つである、前記（１２）に記載の情報処理装置。
（１４）前記撮影画像および前記第１の画像は、所定の度数まで解像度を落とした低解像度画像である、前記（１０）～（１３）のいずれか１つに記載の情報処理装置。
（１５）情報処理装置が、
　被写体が撮影された撮影画像を取得し、
　前記撮影画像を入力データ、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解データとして、第１の画像から前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う
　処理を実行する、方法。
（１６）情報処理装置が、
　第１の被写体が撮影された第１の画像を取得し、
　被写体が撮影された撮影画像を入力データ、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解データとして学習したモデルに、前記第１の画像を入力することにより、前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する
　処理を実行する、方法。
（１７）情報処理装置に、
　被写体が撮影された撮影画像を取得し、
　前記撮影画像を入力データ、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解データとして、第１の画像から前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う
　処理を実行させる、プログラム。
（１８）情報処理装置に、
　第１の被写体が撮影された第１の画像を取得し、
　被写体が撮影された撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルに、前記第１の画像を入力することにより、前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する
　処理を実行させる、プログラム。
（１９）被写体が撮影された撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルであって、
　第１の画像が入力される入力層と、
　前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを出力する出力層と、
　前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第１要素と、
　前記第１要素と前記第１要素の重みとに基づいて値が算出される第２要素と
　を含み、
　前記入力層に入力された前記第１の画像に応じて、前記出力層以外の各層に属する各要素を前記第１要素として、前記第１要素と前記第１要素の重みとに基づく演算を行うことにより、前記第１の画像補正パラメータを前記出力層から出力する
　ように情報処理装置を機能させるためのモデル。

　１００　情報処理装置
　１１０　記憶部
　１２０　取得部
　１３０　変換部
　１４０　学習部
　１５０　制御部
　２００　情報処理端末
　２１０　記憶部
　２２０　取得部
　２３０　撮影部
　２４０　推定部
　２５０　調整部
　２６０　制御部

Claims

　被写体が撮影された撮影画像を取得する取得部と、
　前記撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う学習部と
　を備えた、情報処理装置。
　前記画像補正パラメータ、および前記第１の画像補正パラメータはホワイトバランスゲインである、請求項１に記載の情報処理装置。
　前記学習部はさらに、前記第１の画像補正パラメータと、前記画像補正パラメータとの誤差を用いて前記モデルの再学習を行う、請求項１に記載の情報処理装置。
　前記再学習は、前記誤差が所定の閾値以上である場合に実行される、請求項３に記載の情報処理装置。
　前記画像補正パラメータは、前記撮影画像中の基準となるグレーの画素を指定することにより生成される、請求項１に記載の情報処理装置。
　前記画像補正パラメータは、前記撮影画像の光源およびシーンごとに選択されたホワイトバランスアルゴリズムを用いて算出される、請求項１に記載の情報処理装置。
　前記モデルの前記入力は、前記撮影画像のメタデータをさらに含む、請求項１に記載の情報処理装置。
　前記メタデータは、ＥＶ値、ＩＲ値、前記被写体に対する認識情報、前記被写体までの距離、前記被写体中の主要被写体の少なくとも１つである、請求項７に記載の情報処理装置。
　前記撮影画像は、所定の度数まで解像度を落とした低解像度画像である、請求項１に記載の情報処理装置。
　第１の被写体が撮影された第１の画像を取得する取得部と、
　被写体が撮影された撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルに、前記第１の画像を入力することにより、前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する推定部と
　を備えた、情報処理装置。
　前記画像補正パラメータ、および前記第１の画像補正パラメータはホワイトバランスゲインである、請求項１０に記載の情報処理装置。
　前記モデルの前記入力は、前記撮影画像のメタデータをさらに含み、
　前記推定部は、前記モデルに前記第１の画像の第１のメタデータをさらに入力することで、前記第１の画像補正パラメータを推定する、請求項１０に記載の情報処理装置。
　前記メタデータは、前記撮影画像のＥＶ値およびＩＲ値、前記被写体に対する認識情報、前記被写体までの距離、ならびに前記被写体中の主要被写体の少なくとも１つであり、前記メタデータは、前記第１の画像のＥＶ値およびＩＲ値、前記第１の被写体に対する認識情報、前記第１の被写体までの距離、ならびに前記第１の被写体中の第１の主要被写体の少なくとも１つである、請求項１２に記載の情報処理装置。
　前記撮影画像および前記第１の画像は、所定の度数まで解像度を落とした低解像度画像である、請求項１０に記載の情報処理装置。
　情報処理装置が、
　被写体が撮影された撮影画像を取得し、
　前記撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う
　処理を実行する、方法。
　情報処理装置が、
　第１の被写体が撮影された第１の画像を取得し、
　被写体が撮影された撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルに、前記第１の画像を入力することにより、前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する
　処理を実行する、方法。
　情報処理装置に、
　被写体が撮影された撮影画像を取得し、
　前記撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習して、第１の画像から前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを生成するモデルの学習を行う
　処理を実行させる、プログラム。
　情報処理装置に、
　第１の被写体が撮影された第１の画像を取得し、
　被写体が撮影された撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルに、前記第１の画像を入力することにより、前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを推定する
　処理を実行させる、プログラム。
　被写体が撮影された撮影画像を入力、前記撮影画像のホワイトバランスを調整するための画像補正パラメータを正解とする教師データを学習したモデルであって、
　第１の画像が入力される入力層と、
　前記第１の画像のホワイトバランスを調整するための第１の画像補正パラメータを出力する出力層と、
　前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第１要素と、
　前記第１要素と前記第１要素の重みとに基づいて値が算出される第２要素と
　を含み、
　前記入力層に入力された前記第１の画像に応じて、前記出力層以外の各層に属する各要素を前記第１要素として、前記第１要素と前記第１要素の重みとに基づく演算を行うことにより、前記第１の画像補正パラメータを前記出力層から出力する
　ように情報処理装置を機能させるためのモデル。