WO2021144924A1

WO2021144924A1 - 情報処理装置、情報処理方法、および情報処理プログラム

Info

Publication number: WO2021144924A1
Application number: PCT/JP2020/001302
Authority: WO
Inventors: 秀星板垣
Original assignee: ソニーグループ株式会社
Priority date: 2020-01-16
Filing date: 2020-01-16
Publication date: 2021-07-22

Abstract

被写体を撮影し、デジタルデータに変換して撮影画像を生成する撮影部と、撮影画像の所定領域ごとに、所定領域に含まれる被写が、撮影者が撮影したい主要被写体である確率を算出し、確率と撮影画像に対する露出の重みとの線形補間により、所定領域ごとに確率に対応する重みを算出する算出部と、所定領域ごとの重みに基づいて、撮影画像に対する露出補正を行う露出補正部とを備えた、情報処理装置が提供される。これにより、被写体を適切な露出で撮影することができる。

Description

情報処理装置、情報処理方法、および情報処理プログラム

　本開示は、情報処理装置、情報処理方法、および情報処理プログラムに関する。

　カメラやビデオカメラなどにおいて、被写体の明るさを判断し、絞りやシャッタースピードなどの撮影パラメータを調整することで適切な露光を得る自動露出（ＡＥ：Ａｕｔｏ　Ｅｘｐｏｓｕｒｅ）機能がある。ＡＥ機能は、携帯電話やスマートフォンなどカメラ機能を搭載した端末にも備わっている場合が多い。また、人物の顔を認識し、顔に対して適切な露出で撮影を行うことができる顔ＡＥ機能がある。

特開２０１７－００５７３８号公報

　しかしながら、ユーザが適切な露出で撮影したいと考えている被写体（以下、「主要被写体」という）には黒いものや白いものがあり、光の反射率に幅がある。また、主要被写体が発光している場合もある。そのため、このような主要被写体とその他の被写体との輝度の差がカメラのダイナミックレンジを超えてしまうと、超えた部分の被写体に対し、いわゆる、白飛びや黒潰れが発生してしまう。

　そこで、本開示では、被写体を適切な露出で撮影することができる情報処理装置、情報処理方法、および情報処理プログラムを提案する。

　本開示によれば、被写体を撮影し、デジタルデータに変換して撮影画像を生成する撮影部と、撮影画像の所定領域ごとに、所定領域に含まれる被写体が、撮影者が撮影したい主要被写体である確率を算出し、確率と撮影画像に対する露出の重みとに基づいて、所定領域ごとに確率に対応する重みを算出する算出部と、所定領域ごとの重みに基づいて、撮影画像に対する露出補正を行う露出補正部とを備えた、情報処理装置が提供される。

　また、本開示によれば、情報処理装置が、被写体を撮影し、デジタルデータに変換して撮影画像を生成し、撮影画像の所定領域ごとに、所定領域に含まれる被写体が、撮影者が撮影したい主要被写体である確率を算出し、確率と撮影画像に対する露出の重みとに基づいて、所定領域ごとに確率に対応する重みを算出し、所定領域ごとの重みに基づいて、撮影画像に対する露出補正を行う処理を実行する、方法が提供される。

　また、本開示によれば、情報処理装置に、被写体を撮影し、デジタルデータに変換して撮影画像を生成し、撮影画像の所定領域ごとに、所定領域に含まれる被写体が、撮影者が撮影したい主要被写体である確率を算出し、確率と撮影画像に対する露出の重みとに基づいて、所定領域ごとに確率に対応する重みを算出し、所定領域ごとの重みに基づいて、撮影画像に対する露出補正を行う処理を実行させる、プログラムが提供される。

本実施形態に係る情報処理装置１０の機能構成例を示すブロック図である。同実施形態に係る主要被写体オブジェクトの抽出の一例を示す図である。同実施形態に係る主要被写体ＭＡＰ生成の一例を示す図である。同実施形態に係る主要被写体度と露出重みとの線形補間の一例を示す図である。同実施形態に係る主要被写体ＭＡＰから主要被写体測光ＭＡＰへの変換の一例を示す図である。同実施形態に係る主要被写体ＭＡＰから主要被写体測光ＭＡＰへの変換の別例を示す図である。同実施形態に係る中央部重点ＡＥと主要被写体ＡＥとの比較の一例を示す図である。同実施形態に係る主要被写体が明るい場合の輝度ＭＡＰの一例を示す図である。同実施形態に係る主要被写体度と露出重みとの線形補間に対する主要被写体が明るい場合の露出重み補正の一例を示す図である。同実施形態に係る主要被写体が暗い場合の輝度ＭＡＰの一例を示す図である。同実施形態に係る主要被写体度と露出重みとの線形補間に対する主要被写体が暗い場合の露出重み補正の一例を示す図である。同実施形態に係る主要被写体度と露出重みとの線形補間に対する主要被写体が明るい場合の露出重み補正の別例を示す図である。同実施形態に係る主要被写体ＡＥ処理の流れを示すフローチャートである。同実施形態に係る情報処理装置１０のハードウェア構成例を示すブロック図である。

　以下に、本実施形態について図面に基づいて詳細に説明する。なお、本明細書および図面において、実質的に同一の部位には、同一の符号を付することにより重複する説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．実施形態
　　１．１．機能構成例
　　１．２．機能の詳細
　　１．３．機能の流れ
　２．ハードウェア構成例
　３．まとめ

＜１．実施形態＞
＜＜１．１．機能構成例＞＞
　まず、本実施形態に係る情報処理装置１０の機能構成例について説明する。情報処理装置１０は、デジタルカメラやデジタルビデオカメラであってもよいし、スマートフォンやタブレットＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）などのモバイル端末であってもよい。

　図１は、本実施形態に係る情報処理装置１０の機能構成例を示すブロック図である。図１に示すように、本実施形態に係る情報処理装置１０は、記憶部１１０、撮影部１２０、表示部１３０、算出部１４０、露出補正部１５０、決定部１６０、重み補正部１７０、センサ部１８０、制御部２００を備える。

（記憶部１１０）
　本実施形態に係る記憶部１１０は、各種プログラムやデータを一時的または恒常的に記憶するための記憶領域である。例えば、記憶部１１０には、情報処理装置１０が各種機能を実行するためのプログラムやデータが記憶されてもよい。具体的な一例として、記憶部１１０には、カメラアプリケーションを実行するためのプログラムや、主要被写体を決定するための学習モデル、各種設定などを管理するための管理データなどが記憶されてよい。また、カメラアプリケーションのユーザインタフェース（ＵＩ）を介してユーザによって入力された撮影パラメータ（例えば、フォーカスや露光など、撮影のための各種パラメータ）などが記憶されてよい。もちろん、上記はあくまで一例であり、記憶部１１０に記憶されるデータの種別は特に限定されない。

（撮影部１２０）
　本実施形態に係る撮影部１２０は、制御部２００による制御に基づいて動画や写真の撮影を行う。撮影部１２０は、撮像素子、フォーカスリングやズームレンズなどを備える。撮影部１２０によって撮影された動画や写真はデジタルデータに変換され、記憶部１１０に記憶される。なお、撮影部１２０によって撮影される動画は、マイクロフォンなど音声入力部（図示せず）によって撮影中に収集される音声や環境音と共に記憶される。また、撮影部１２０によって撮影され、記憶部１１０に記憶される動画には、録画中に撮影される動画と、録画中以外の時に、表示部１３０などに被写体をプレビュー表示するための動画とがある。前者の動画は、表示部１３０に表示されるとともにＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）に一時的に記憶された後、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）に記憶される。後者の動画もＲＡＭに一時的に記憶されるが、ＲＡＭの容量がいっぱいになったら古いものから削除されていき、ＲＯＭには記憶されない。

（表示部１３０）
　本実施形態に係る表示部１３０は、制御部２００による制御に基づいて各種の視覚情報を表示する。視覚情報とは、例えば、カメラアプリケーションのＵＩや、撮影部１２０によって撮影される被写体などである。このために、表示部１３０は、液晶ディスプレイ（ＬＣＤ：Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）装置、ＯＬＥＤ（Ｏｒｇａｎｉｃ　Ｌｉｇｈｔ　Ｅｍｉｔｔｉｎｇ　Ｄｉｏｄｅ）ディスプレイ装置など、各種のディスプレイ装置を備える。

（算出部１４０）
　本実施形態に係る算出部１４０は、撮影部１２０によって撮影された動画の１フレームの画像（撮影画像）の所定領域ごとに、当該所定領域に含まれる被写体が主要被写体である確率（主要被写体度：例えば、０～１）を算出する。ここで、主要被写体とは、撮影者が撮影したい物体（オブジェクト）である。本実施形態では、例えば、主要被写体になり得る物体を撮影した画像と主要被写体領域をマスクしたマスク画像とのセットの複数を教師データとする学習モデルを用いて撮影画像の被写体に対する主要被写体度を算出し、線形補間により主要被写体度から露出重みを算出し、当該露出重みに基づいて撮影画像に対する露出補正を行う。

　また、算出部１４０は、主要被写体度と撮影画像に対する露出の重み（露出重み）との線形補間により、撮影画像の所定領域ごとに主要被写体度に対応する露出重みを算出する。

　また、算出部１４０は、撮影画像の所定領域ごとに、各領域の輝度値として、各領域内の画素（ピクセル）の輝度値の平均値を算出する。さらに、算出部１４０は、主要被写体領域とそれ以外の領域とに対し、輝度値の平均値をそれぞれ算出する。

（露出補正部１５０）
　本実施形態に係る露出補正部１５０は、算出部１４０によって算出された撮影画像の所定領域ごとの露出重みに基づいて、撮影画像に対する露出補正を行う。また、露出補正部１５０は、所定の条件を満たし、主要被写体測光による露出補正が適切でないと判断した場合、撮影画像に対して中央部重点測光による露出補正を行う。

（決定部１６０）
　本実施形態に係る決定部１６０は、主要被写体度が所定の閾値（例えば、０．７）以上の所定領域を主要被写体領域に決定する。

（重み補正部１７０）
　本実施形態に係る重み補正部１７０は、主要被写体領域とそれ以外の領域との間の輝度差が大きく、主要被写体測光による露出補正により白飛びや黒潰れが発生し得る場合、主要被写体領域の露出重みを補正する。この際、重み補正部１７０は、主要被写体領域が明るい（または暗い）場合、輝度差の大きさによって主要被写体領域の露出重みを徐々に弱める（または強める）ように補正する。すなわち、重み補正部１７０は、主要被写体領域とそれ以外の領域との間の輝度差が特定の輝度差の場合に、主要被写体領域の露出重みを調整（変更）するように補正する。また、重み補正部１７０は、後述する高主要被写体領域数の多さによって、主要被写体領域の露出重みを徐々に弱めるように補正する。また、重み補正部１７０は、輝度差による露出重みの補正と、高主要被写体領域数による露出重みの補正とのいずれを採用するかを決定することができる。

（センサ部１８０）
　本実施形態に係るセンサ部１８０は、被写体までの距離（深度、Ｄｅｐｔｈ情報ともいう）を測定する。センサ部１８０は、例えば、ＴｏＦ（Ｔｉｍｅ　ｏｆ　Ｆｌｉｇｈｔ）センサなどを備える。

（その他）
　情報処理装置１０は、図示していないが上記以外にも、各種の音や音声を出力する音声出力部を備えてもよい。音声出力部は、例えば、制御部２００による制御に基づいてカメラアプリケーションの状況に応じた音や音声を出力する（例えば、撮影開始や終了の際に音を鳴らす）。このために、音声出力部は、スピーカやアンプを備える。

（制御部２００）
　本実施形態に係る制御部２００は、情報処理装置１０が備える各構成を制御する。また制御部２００は、カメラ撮影を制御することを特徴の一つとする。撮影の制御には、撮影パラメータの調整を行うことや、撮影パラメータに基づいて、撮影部１２０が備えるシャッターや絞りなどを操作することを含む。制御部２００が有する機能の詳細については後述される。

　以上、本実施形態に係る情報処理装置１０の機能構成例について説明した。なお、図１を用いて説明した上記の機能構成はあくまで一例であり、本実施形態に係る情報処理装置１０の機能構成は係る例に限定されない。例えば、情報処理装置１０は、必ずしも図１に示す構成のすべてを備えなくてもよいし、表示部１３０などの各構成を情報処理装置１０とは異なる別の装置に備えることも可能である。本実施形態に係る情報処理装置１０の機能構成は、仕様や運用に応じて柔軟に変形可能である。

　また、各構成要素の機能を、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｃｅｓｓｉｎｇ　Ｕｎｉｔ）などの演算装置がこれらの機能を実現する処理手順を記述した制御プログラムを記憶したＲＯＭやＲＡＭなどの記憶媒体から制御プログラムを読み出し、そのプログラムを解釈して実行することにより行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜利用する構成を変更することが可能である。また、情報処理装置１０のハードウェア構成の一例については後述される。

＜＜１．２．機能の詳細＞＞
　次に、本実施形態に係る情報処理装置１０が有する機能について詳細に説明する。本実施形態に係る情報処理装置１０の制御部２００は、学習モデルを用いて撮影画像の被写体に対する主要被写体度を算出し、線形補間により主要被写体度から露出重みを算出し、当該露出重みに基づいて撮影画像に対する露出補正を行うことを特徴の１つとする。

　まず、図２を用いて、本実施形態に係る学習モデルの生成方法について説明する。本実施形態の学習モデルは、撮影画像中の主要被写体部分を特定するためのモデルである。学習モデルは、撮影画像（または撮影画像の特徴量）が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第１要素と、第１要素と第１要素の重みとに基づいて値が算出される第２要素と、を含み、入力層に入力された撮影画像（または撮影画像の特徴量）に応じて、撮影画像中の主要被写体と認識される部分を示すデータ（例えば、後述の主要被写体度を示すデータ）を出力層から出力するよう、情報処理装置１０を機能させる。

　なお、本実施形態の学習モデルを生成する生成装置（例えば、サーバ装置などの情報処理装置１０）は、いかなる学習アルゴリズムを用いて上述の学習モデルを生成してもよい。例えば、生成装置は、ニューラルネットワーク（ＮＮ：Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）、サポートベクターマシン（ＳＶＭ：Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ）、クラスタリング、強化学習などの学習アルゴリズムを用いて本実施形態の学習モデルを生成してもよい。一例として、生成装置がＮＮを用いて本実施形態の学習モデルを生成するとする。この場合、学習モデルは、１つ以上のニューロンを含む入力層と、１つ以上のニューロンを含む中間層と、１つ以上のニューロンを含む出力層とを有していてもよい。

　ここで、本実施形態に係る学習モデルが「ｙ＝ａ_１＊ｘ_１＋ａ_２＊ｘ_２＋・・・＋ａ_ｉ＊ｘ_ｉ」で示す回帰モデルで実現されるとする。この場合、学習モデルが含む第１要素は、ｘ_１やｘ_２などといった入力データ（ｘ_ｉ）に対応する。また、第１要素の重みは、ｘ_ｉに対応する係数ａ_ｉに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンとみなすことができる。各モデルを単純パーセプトロンとみなした場合、第１要素は、入力層が有するいずれかのノードに対応し、第２要素は、出力層が有するノードとみなすことができる。

　また、本実施形態に係る学習モデルがＤＮＮ（Ｄｅｅｐ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）など、１つまたは複数の中間層を有するＮＮで実現されるとする。この場合、学習モデルが含む第１要素は、入力層または中間層が有するいずれかのノードに対応する。また、第２要素は、第１要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第１要素の重みは、第１要素と対応するノードから第２要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。

　上述した回帰モデルやＮＮなど、任意の構造を有する学習モデルを用いて、主要被写体度を算出する。より具体的には、学習モデルは、撮影画像が入力された場合に、当該撮影画像の所定領域ごとに主要被写体度を出力するように係数が設定される。本実施形態に係る学習モデルは、データの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。

　なお、上記例では、本実施形態に係る学習モデルが、撮影画像が入力された場合に、当該撮影画像の所定領域ごとに主要被写体度を出力するモデル（モデルＸとする）である例を示した。しかしながら、本実施形態に係る学習モデルは、モデルＸに対しデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、本実施形態に係る学習モデルは、撮影画像を入力とし、モデルＸが出力する主要被写体度を出力とする学習モデル（モデルＹとする）であってもよい。または、本実施形態に係る学習モデルは、撮影画像を入力とし、モデルＹが出力する主要被写体度を出力とする学習モデルであってもよい。

　図２は、本実施形態に係る主要被写体オブジェクトの抽出の一例を示す図である。図２の左側は、外の景色が見える窓のあるリビングにいる猫の撮影画像である。これに対し、図２の右側は、主要被写体である猫を抽出した画像である。このように、様々な撮影画像から、主要被写体になり得る、人、動植物、建築物、車や飛行機などの移動体、文字や看板、玩具、電化製品、料理、衣類、アクセサリ、天体、・・・などのオブジェクトを抽出し、主要被写体になり得るオブジェクトが写った画像と主要被写体部分をマスクしたマスク画像とを学習させることで学習モデルを生成する。このような学習モデルにより、撮影動画（画像）から適切な主要被写体を決定することができる。また、学習モデルの教師データとして、センサ部１８０によって取得される、被写体の深度を用いてもよい。これにより、被写体までの距離を考慮した学習モデルを生成することができる。また、撮影動画の過去のフレームの撮影画像を含めた時系列データを入力とするＲＮＮ（Ｒｅｃｕｒｒｅｎｔ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）による深層学習を行うこともできる。

　次に、図３を用いて、撮影画像から主要被写体を決定するための主要被写体ＭＡＰの生成方法について説明する。図３は、本実施形態に係る主要被写体ＭＡＰ生成の一例を示す図である。本実施形態では、撮影画像の所定領域ごとに主要被写体度を算出し、各所定領域と主要被写体度とをマッピングした主要被写体ＭＡＰを生成することで、主要被写体領域が決定される。図３の左側に示すように、各所定領域は、例えば、撮影画像を縦９×横１１に分割することで決定される。なお、分割する領域数は縦９×横１１に限定されず、各領域に含まれる画素数は一定であっても異なってもよい。例えば、各領域に含まれる画素数が一定になるように分割し、端数の画素数分の画素は撮影画像外縁の領域に含めるようにしてもよい。

　図３の左側において分割した撮影画像の各領域に対して、図２での説明のように生成された学習モデルを用いて主要被写体度が算出され、主要被写体ＭＡＰが生成される。図３の右側が生成された主要被写体ＭＡＰの一例である。図３の右側に示すように、主要被写体ＭＡＰには、領域ごとに算出された主要被写体度（０～１）が示されている。図３の例では、撮影画像における“花”を含んだ領域が高い主要被写体度を示している。なお、図３の例では、主要被写体度の高い領域が一箇所に集まっているが、撮影画像によっては主要被写体度の高い領域が分散したり、無かったりする場合もあり得る。

　本実施形態では、主要被写体に対して露出の重みをより持たせることで、被写体を適切な露出で撮影することができる。そのため、主要被写体度が高いほど、露出重みを持たせるような露出補正を行う。図４は、本実施形態に係る主要被写体度と露出重みとの線形補間の一例を示す図である。図４の例は、重みの最小値（ｙ_０）を２５、重みの最大値（ｙ_１）を１２８として、主要被写体度ｘと露出重みｙとの線形補間を示すものである。主要被写体度は、最小値（ｘ_０）を０、最大値（ｘ_１）を１とし、図３を用いて説明したように学習モデルを用いて算出することができる。図４の線形補間は、次式（１）で表すことができる。
　ｙ＝ｙ_０＋（ｙ_１－ｙ_０）＊（ｘ－ｘ_０）／（ｘ_１－ｘ_０）　・・・（１）

　式（１）を用いて、主要被写体度から露出重みを算出することができる。これにより、図３で生成した主要被写体ＭＡＰの領域ごとの主要被写体度から、領域ごとの露出重みを算出することができる。

　図５は、本実施形態に係る主要被写体ＭＡＰから主要被写体測光ＭＡＰへの変換の一例を示す図である。式（１）を用いて、図５の左側の主要被写体ＭＡＰの各主要被写体度から、領域ごとの露出重みを算出し、図５の右側に示すように主要被写体測光ＭＡＰを得ることができる。主要被写体測光ＭＡＰの各領域の数値がそれぞれの露出重みである。なお、例えば、要被写体度が所定の閾値（例えば、０．７）以上の領域を主要被写体領域とし、撮影画像中に主要被写体領域が１つもない、またはすべての領域が主要被写体領域である場合は、中央部重点測光による露出補正を行ってもよい。

　図６は、本実施形態に係る主要被写体ＭＡＰから主要被写体測光ＭＡＰへの変換の別例を示す図である。図６の例は、撮影画像外縁の領域には重要な被写体がほとんどないであろうという考えから、外縁領域の主要被写体度や露出重みの算出を行わないようにしたものである。これにより、主要被写体が含まれているであろう、外縁以外の領域（縦７×横９）に対してより適切な露出補正を行うことができる。しかしながら、主要被写体測光ＭＡＰにより、主要被写体領域に露出重みをより持たせるようにしても、主要被写体領域とそれ以外の領域との間の輝度差が大きい場合に、白飛びや黒潰れが発生する可能性がある。

　図７は、本実施形態に係る中央部重点ＡＥと主要被写体ＡＥとの比較の一例を示す図である。図７の例は、主要被写体領域とそれ以外の領域との間の輝度差が大きい撮影画像に対し、中央部重点ＡＥおよび主要被写体ＡＥによりそれぞれ露出補正を行ったものである。図７の左側は、撮影画像の中央領域に露出重みをより持たせるように補正された（中央部重点ＡＥ）画像である。また、図７の右側が、図５や図６で説明した主要被写体測光ＭＡＰを用いて主要被写体領域に露出重みをより持たせるように補正された（主要被写体ＡＥ）画像である。図７の右側の例では、撮影画像中の看板が主要被写体と判断され、看板部分により露出重みが持たされているため、中央部重点ＡＥのものと比べると、看板部分ははっきり見える。しかしながら、看板以外の背景部分などは黒潰れが発生し、却って見え難くなっている。図７の例では、主要被写体が明るい場合を示したが、主要被写体が暗い場合には、白飛びが発生し得る。

　そこで、主要被写体領域とそれ以外の領域との間の輝度差が大きい場合は、輝度差の大きさによって主要被写体領域の露出重みを補正することができる。図８は、本実施形態に係る主要被写体が明るい場合の輝度ＭＡＰの一例を示す図である。図８の左側は、主要被写体ＭＡＰを生成し、主要被写体度が所定の閾値（例えば、０．７）以上の領域を主要被写体領域（枠内）に決定したことを示している。図８の右側は、領域ごとに各画素の輝度値の平均値を算出して輝度ＭＡＰを生成し、主要被写体領域とそれ以外の領域とに対し、輝度値の平均値をそれぞれ算出したものである。図８の例では、主要被写体領域の輝度値の平均値は６５０．０、それ以外の領域の輝度値の平均値は５４．７であり、主要被写体が明るく、輝度差は１１倍以上ある。例えば、輝度差が３倍以上ある場合に輝度差が大きいとみなして、輝度差の大きさによって主要被写体領域の露出重みの補正を行うことができる。なお、撮影画像中のノイズや、輝度の極端なバラつきなどを考慮して、主要被写体領域の輝度値の平均値は、主要被写体領域の各輝度値の一部（例えば、輝度値の上位３０％）の平均値であってよい。同様に、主要被写体領域の領域数が少ない場合（例えば、６以下の場合）、主要被写体領域の輝度値の平均値は、主要被写体領域の上位１位の輝度値であってよい。

　図９は、本実施形態に係る主要被写体度と露出重みとの線形補間に対する主要被写体が明るい場合の露出重み補正の一例を示す図である。図９の左側は、図４で示した線形補間の基本形である。これに対し、図９の右側は、輝度差の大きさによって、主要被写体領域（主要被写体度が０．７以上）の露出重みを補正したものである。図９の右側に示すように、輝度差が１～３倍未満の場合は、基本形の線形補間と同一であるが、輝度差が３倍以上ある場合は、輝度差の大きさによって主要被写体領域の露出重みを徐々に弱める補正を行う。例えば、主要被写体度の露出重みの上限は、輝度差が３倍の場合に７６であり、輝度差が１６倍の場合は２５まで弱められる。図９の例では、露出重みを弱める例として、輝度差３倍、９倍、１６倍の３つのグラフを示しているが、各輝度差の間には各輝度差に対応したグラフが存在する。また、主要被写体領域のグラフは、輝度差の大きさによる違いを強調するために破線で示されているが、実際には直線である。さらに、露出補正を行う輝度差の３倍以上や、露出重みの上限７６などはあくまでも一例であり、これらに限定されない。例えば、輝度差が４倍以上ある場合に露出重みの補正を行うなどしてもよく、露出重みの上限も任意に調整可能である。

　図１０は、本実施形態に係る主要被写体が暗い場合の輝度ＭＡＰの一例を示す図である。図１０は、主要被写体が明るい場合の図８に対して、主要被写体が暗い場合の輝度ＭＡＰについて示すものである。図１０は、図８同様、主要被写体ＭＡＰおよび輝度ＭＡＰを生成し、主要被写体領域（枠内）とそれ以外の領域とに対し、輝度値の平均値をそれぞれ算出したものである。図１０の例では、主要被写体領域の輝度値の平均値は６０．０、それ以外の領域の輝度値の平均値は３９０．０であり、主要被写体が暗く、輝度差は６倍以上ある。

　図１１は、本実施形態に係る主要被写体度と露出重みとの線形補間に対する主要被写体が暗い場合の露出重み補正の一例を示す図である。図１１の左側も図９同様、図４で示した線形補間の基本形である。これに対し、図１１の右側は、輝度差の大きさによって、主要被写体領域（主要被写体度が０．７以上）の露出重みを補正したものである。図１１の右側に示すように、輝度差が２倍以上の場合は、基本形の線形補間と同一であるが、輝度差が１～２倍の場合は、輝度差の大きさによって主要被写体領域の露出重みを徐々に強める補正を行う。なお、図１１も図９同様、各輝度差の間には各輝度差に対応したグラフが存在し、主要被写体領域のグラフは、実際には直線である。また、露出補正を行う輝度差の２倍未満や、露出重みの上限７６などはあくまでも一例であり、これらに限定されない。

　また、主要被写体領域の輝度値の平均値が、それ以外の領域の輝度値の平均値より高く、主要被写体が明るい場合、高主要被写体領域数によって露出重みを補正することもできる。ここで、高主要被写体領域数とは、主要被写体度の高い（例えば、０．９９以上）領域の数である。図１２は、本実施形態に係る主要被写体度と露出重みとの線形補間に対する主要被写体が明るい場合の露出重み補正の別例を示す図である。図１２の左側も、図４で示した線形補間の基本形である。図１２の右側は、高主要被写体領域数の多さによって、主要被写体領域（主要被写体度が０．７以上）の露出重みを補正したものである。図１２の右側に示すように、高主要被写体領域数が６個以下の場合は、基本形の線形補間と同一であるが、高主要被写体領域数が７個以上の場合は、高主要被写体領域数の多さによって主要被写体領域の露出重みを徐々に弱める補正を行う。また、高主要被写体領域数が２４以上の場合は、中央部重点測光による露出補正を行ってもよい。なお、図１２に示す高主要被写体領域数の基準数（６～２４個）は、図３のように縦９×横１１の領域に分割した場合の数であるため、任意に変更可能である。また、図１２も図９同様、高主要被写体領域数の各基準数の間には、各基準数に対応したグラフが存在し、主要被写体領域のグラフは、実際には直線である。また、露出重みの上限７６などはあくまでも一例であり、これらに限定されない。

　なお、主要被写体領域の輝度値の平均値が、それ以外の領域の輝度値の平均値より高く、主要被写体が明るい場合の露出重みの補正について、輝度差による補正と、高主要被写体領域数による補正とを説明した。いずれを採用するかは、例えば、露出重みの補正量が小さく、露出重みが軽くなる方を採用することができる。

　＜＜１．３．機能の流れ＞＞
　次に、図１３を用いて、本実施形態に係る主要被写体ＡＥ処理の手順について説明する。図１３は、本実施形態に係る主要被写体ＡＥ処理の流れを示すフローチャートである。本処理は、例えば、情報処理装置１０が、被写体を撮影した動画をＲＡＭに一時記憶したことをトリガーとして開始され、主要被写体度を算出し、線形補間により主要被写体度から露出重みを算出し、露出重みに基づいて撮影画像に対する露出補正を行う処理である。

　図１３に示すように、まず、情報処理装置１０の算出部１４０は、撮影部１２０によって撮影された動画の１フレームの画像（撮影画像）の所定領域ごとに、主要被写体度を算出する（ステップＳ１０１）。所定領域は、撮影画像を予め定められた分割数（例えば、縦９×横１１）に分割することにより決定される。

　次に、算出部１４０は、主要被写体度と露出重みとの線形補間により、所定領域ごとの主要被写体度に対応する、所定領域ごとの露出重みを算出する（ステップＳ１０２）。

　次に、情報処理装置１０の決定部１６０は、ステップＳ１０１で算出された主要被写体度が所定の閾値以上の所定領域を主要被写体領域に決定する（ステップＳ１０３）。この際、撮影画像に主要被写体となり得る物体が含まれず、主要被写体領域が１つもない場合もあり得る。

　主要被写体領域がない場合（ステップＳ１０４：Ｎｏ）、情報処理装置１０の露出補正部１５０は、中央部重点測光による露出補正を実行する（ステップＳ１０５）。ステップＳ１０５の後、本処理は終了する。

　一方、主要被写体領域がある場合（ステップＳ１０４：Ｙｅｓ）、算出部１４０は、撮影画像の所定領域ごとに、各領域の輝度値として、各領域内の画素の輝度値の平均値を算出する（ステップＳ１０６）。また、算出部１４０は、主要被写体領域とそれ以外の領域とに対し、輝度値の平均値をそれぞれ算出する。

　次に、主要被写体領域およびそれ以外の領域の輝度値の各平均値が比較される。その結果、これらの領域間の輝度差が所定の閾値（例えば、３倍）未満の場合（ステップＳ１０７：Ｎｏ）、露出補正部１５０は、ステップＳ１０２で算出された、所定領域ごとの露出重みを用いて、撮影画像に対する露出補正を実行する（ステップＳ１０８）。ステップＳ１０８の後、本処理は終了する。

　一方、主要被写体領域とそれ以外の領域との間の輝度差が所定の閾値以上の場合（ステップＳ１０７：Ｙｅｓ）、主要被写体領域の輝度値の平均値が、それ以外の領域の輝度値の平均値より高いか否かが判定される（ステップＳ１０９）。

　主要被写体領域の輝度値の平均値が、それ以外の領域の輝度値の平均値より低い場合（ステップＳ１０９：Ｎｏ）、重み補正部１７０は、輝度差の大きさによって、主要被写体領域の露出重みを徐々に強めるように補正する（ステップＳ１１０）。

　次に、露出補正部１５０は、ステップＳ１１０で補正された、所定領域ごとの露出重みを用いて、撮影画像に対する露出補正を実行する（ステップＳ１１１）。ステップＳ１１１の後、本処理は終了する。

　一方、主要被写体領域の輝度値の平均値が、それ以外の領域の輝度値の平均値より高い場合（ステップＳ１０９：Ｙｅｓ）、重み補正部１７０は、輝度差の大きさによって、主要被写体領域の露出重みを徐々に弱めるように補正する（ステップＳ１１２）。

　次に、高主要被写体領域数（例えば、主要被写体度が０．９９以上の領域数）が所定数（例えば、２４個）以上の場合（ステップＳ１１３：Ｙｅｓ）、露出補正部１５０は、中央部重点測光による露出補正を実行する（ステップＳ１０５）。

　一方、高主要被写体領域数が所定数未満の場合（ステップＳ１１３：Ｎｏ）、重み補正部１７０は、高主要被写体領域数の多さによって、主要被写体領域の露出重みを徐々に弱めるように補正する（ステップＳ１１４）。

　次に、重み補正部１７０は、ステップＳ１１２における輝度差による露出重みの補正と、ステップＳ１１４における高主要被写体領域数による露出重みの補正とのいずれを採用するかを決定する（ステップＳ１１５）。これは、例えば、露出重みの補正量が小さく、露出重みが軽くなる方を採用することができる。

　次に、露出補正部１５０は、ステップＳ１１５で採用された、所定領域ごとの露出重みを用いて、撮影画像に対する露出補正を実行する（ステップＳ１１６）。ステップＳ１１６の後、本処理は終了する。

＜２．ハードウェア構成例＞
　次に、本実施形態に係る情報処理装置１０のハードウェア構成例について説明する。図１４は、本実施形態に係る情報処理装置１０のハードウェア構成例を示すブロック図である。図１４を参照すると、情報処理装置１０は、例えば、プロセッサ４１１と、ＲＯＭ４１２と、ＲＡＭ４１３と、ホストバス４１４と、ブリッジ４１５と、外部バス４１６と、インターフェース４１７と、入力装置４１８と、出力装置４１９と、ストレージ４２０と、ドライブ４２１と、接続ポート４２２と、通信装置４２３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

（プロセッサ４１１）
　プロセッサ４１１は、例えば、演算処理装置または制御装置として機能し、ＲＯＭ４１２、ＲＡＭ４１３、ストレージ４２０、またはリムーバブル記録媒体２０に記録された各種プログラムに基づいて各構成要素の動作全般またはその一部を制御する。

（ＲＯＭ４１２、ＲＡＭ４１３）
　ＲＯＭ４１２は、プロセッサ４１１に読み込まれるプログラムや演算に用いるデータなどを格納する手段である。ＲＡＭ４１３には、例えば、プロセッサ４１１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータなどが一時的または永続的に格納される。

（ホストバス４１４、ブリッジ４１５、外部バス４１６、インターフェース４１７）
　プロセッサ４１１、ＲＯＭ４１２、ＲＡＭ４１３は、例えば、高速なデータ伝送が可能なホストバス４１４を介して相互に接続される。一方、ホストバス４１４は、例えば、ブリッジ４１５を介して比較的データ伝送速度が低速な外部バス４１６に接続される。また、外部バス４１６は、インターフェース４１７を介して種々の構成要素と接続される。

（入力装置４１８）
　入力装置４１８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、およびレバーなどが用いられる。さらに、入力装置４１８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置４１８には、マイクロフォンなどの音声入力装置が含まれる。

（出力装置４１９）
　出力装置４１９は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、ＬＣＤ、または有機ＥＬなどのディスプレイ装置、スピーカ、ヘッドホンなどのオーディオ出力装置、プリンタ、携帯電話、またはファクシミリなど、取得した情報を利用者に対して視覚的または聴覚的に通知することが可能な装置である。また、本実施形態に係る出力装置４１９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

（ストレージ４２０）
　ストレージ４２０は、各種のデータを格納するための装置である。ストレージ４２０としては、例えば、ハードディスクドライブ（ＨＤＤ）などの磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどが用いられる。

（ドライブ４２１）
　ドライブ４２１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体２０に記録された情報を読み出し、またはリムーバブル記録媒体２０に情報を書き込む装置である。

（リムーバブル記録媒体２０）
リムーバブル記録媒体２０は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディアなどである。もちろん、リムーバブル記録媒体２０は、例えば、非接触型ＩＣチップを搭載したＩＣカード、または電子機器などであってもよい。

（接続ポート４２２）
　接続ポート４２２は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、または光オーディオ端子などのような外部接続機器３０を接続するためのポートである。

（外部接続機器３０）
　外部接続機器３０は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、またはＩＣレコーダなどである。

（通信装置４２３）
　通信装置４２３は、ネットワークに接続するための通信デバイスであり、例えば、有線または無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、または各種通信用のモデムなどである。

＜３．まとめ＞
　以上説明したように、情報処理装置１０は、被写体を撮影し、デジタルデータに変換して撮影画像を生成する撮影部１２０と、前記撮影画像の所定領域ごとに、前記所定領域に含まれる前記被写体が、撮影者が撮影したい主要被写体である確率を算出し、前記確率と前記撮影画像に対する露出の重みとに基づいて、前記所定領域ごとに前記確率に対応する前記重みを算出する算出部１４０と、前記所定領域ごとの前記重みに基づいて、前記撮影画像に対する露出補正を行う露出補正部１５０とを備える。

　これにより、被写体を適切な露出で撮影することができる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、本技術は以下のような構成も取ることができる。
（１）被写体を撮影し、デジタルデータに変換して撮影画像を生成する撮影部と、
　前記撮影画像の所定領域ごとに、前記所定領域に含まれる前記被写体が、撮影者が撮影したい主要被写体である確率を算出し、前記確率と前記撮影画像に対する露出の重みとに基づいて、前記所定領域ごとに前記確率に対応する前記重みを算出する算出部と、
　前記所定領域ごとの前記重みに基づいて、前記撮影画像に対する露出補正を行う露出補正部と
　を備えた、情報処理装置。
（２）前記確率が第１の閾値を超える前記所定領域を主要被写体領域に決定する決定部と、
　前記主要被写体領域の第１の輝度値の第１の平均値と、前記主要被写体領域以外の領域の第２の輝度値の第２の平均値との輝度差が第２の閾値以上の場合、前記主要被写体領域の前記重みを補正する重み補正部と
　をさらに備えた、前記（１）に記載の情報処理装置。
（３）前記重み補正部による前記主要被写体領域の前記重みの補正は、前記第１の平均値が前記第２の平均値よりも高い場合、前記主要被写体領域の前記重みを前記輝度差の大きさによって変更するように補正される、前記（２）に記載の情報処理装置。
（４）前記重み補正部が用いる前記第１の平均値は、前記第１の輝度値の上位３０％の平均値である、前記（３）に記載の情報処理装置。
（５）前記主要被写体領域の数が所定数以下の場合、前記重み補正部が用いる前記第１の平均値は、前記第１の輝度値の上位１位の輝度値である、前記（３）に記載の情報処理装置。
（６）前記重み補正部による前記主要被写体領域の前記重みの補正は、前記第１の平均値が前記第２の平均値より低い場合、前記主要被写体領域の前記重みを前記輝度差の大きさによって変更するように補正される、前記（２）に記載の情報処理装置。
（７）前記重み補正部による前記主要被写体領域の前記重みの補正は、前記第１の平均値が前記第２の平均値よりも高い場合、前記確率が第３の閾値を超える前記主要被写体領域の数の多さによって徐々に弱めるように補正される、前記（２）に記載の情報処理装置。
（８）前記重み補正部による前記主要被写体領域の前記重みの補正は、前記確率が前記第３の閾値を超える前記主要被写体領域の前記数が所定数以上の場合は行わず、前記露出補正部はさらに、前記撮影画像に対して中央部重点測光による露出補正を行う、前記（７）に記載の情報処理装置。
（９）前記露出補正部はさらに、前記主要被写体領域が１つもない場合、または前記所定領域のすべてが前記主要被写体領域である場合、前記撮影画像に対して中央部重点測光による露出補正を行う、前記（２）～（８）のいずれか１つに記載の情報処理装置。
（１０）前記算出部が基づく前記確率と前記重みとは、前記確率と前記重みとの線形補間である、前記（１）～（９）のいずれか１つに記載の情報処理装置。
（１１）前記算出部による前記確率の算出は、前記撮影画像を入力し、前記確率を出力する学習モデルを用いて算出される、前記（１）～（１０）のいずれか１つに記載の情報処理装置。
（１２）情報処理装置が、
　被写体を撮影し、デジタルデータに変換して撮影画像を生成し、
　前記撮影画像の所定領域ごとに、前記所定領域に含まれる前記被写体が、撮影者が撮影したい主要被写体である確率を算出し、前記確率と前記撮影画像に対する露出の重みとに基づいて、前記所定領域ごとに前記確率に対応する前記重みを算出し、
　前記所定領域ごとの前記重みに基づいて、前記撮影画像に対する露出補正を行う
　処理を実行する、方法。
（１３）情報処理装置に、
　被写体を撮影し、デジタルデータに変換して撮影画像を生成し、
　前記撮影画像の所定領域ごとに、前記所定領域に含まれる前記被写体が、撮影者が撮影したい主要被写体である確率を算出し、前記確率と前記撮影画像に対する露出の重みとに基づいて、前記所定領域ごとに前記確率に対応する前記重みを算出し、
　前記所定領域ごとの前記重みに基づいて、前記撮影画像に対する露出補正を行う
　処理を実行させる、プログラム。

　１０　　情報処理装置
　１１０　記憶部
　１２０　撮影部
　１３０　表示部
　１４０　算出部
　１５０　露出補正部
　１６０　決定部
　１７０　重み補正部
　１８０　センサ部
　２００　制御部

Claims

　被写体を撮影し、デジタルデータに変換して撮影画像を生成する撮影部と、
　前記撮影画像の所定領域ごとに、前記所定領域に含まれる前記被写体が、撮影者が撮影したい主要被写体である確率を算出し、前記確率と前記撮影画像に対する露出の重みとに基づいて、前記所定領域ごとに前記確率に対応する前記重みを算出する算出部と、
　前記所定領域ごとの前記重みに基づいて、前記撮影画像に対する露出補正を行う露出補正部と
　を備えた、情報処理装置。
　前記確率が第１の閾値を超える前記所定領域を主要被写体領域に決定する決定部と、
　前記主要被写体領域の第１の輝度値の第１の平均値と、前記主要被写体領域以外の領域の第２の輝度値の第２の平均値との輝度差が第２の閾値以上の場合、前記主要被写体領域の前記重みを補正する重み補正部と
　をさらに備えた、請求項１に記載の情報処理装置。
　前記重み補正部による前記主要被写体領域の前記重みの補正は、前記第１の平均値が前記第２の平均値よりも高い場合、前記主要被写体領域の前記重みを前記輝度差の大きさによって変更するように補正される、請求項２に記載の情報処理装置。
　前記重み補正部が用いる前記第１の平均値は、前記第１の輝度値の上位３０％の平均値である、請求項３に記載の情報処理装置。
　前記主要被写体領域の数が所定数以下の場合、前記重み補正部が用いる前記第１の平均値は、前記第１の輝度値の上位１位の輝度値である、請求項３に記載の情報処理装置。
　前記重み補正部による前記主要被写体領域の前記重みの補正は、前記第１の平均値が前記第２の平均値より低い場合、前記主要被写体領域の前記重みを前記輝度差の大きさによって変更するように補正される、請求項２に記載の情報処理装置。
　前記重み補正部による前記主要被写体領域の前記重みの補正は、前記第１の平均値が前記第２の平均値よりも高い場合、前記確率が第３の閾値を超える前記主要被写体領域の数の多さによって徐々に弱めるように補正される、請求項２に記載の情報処理装置。
　前記重み補正部による前記主要被写体領域の前記重みの補正は、前記確率が前記第３の閾値を超える前記主要被写体領域の前記数が所定数以上の場合は行わず、前記露出補正部はさらに、前記撮影画像に対して中央部重点測光による露出補正を行う、請求項７に記載の情報処理装置。
　前記露出補正部はさらに、前記主要被写体領域が１つもない場合、または前記所定領域のすべてが前記主要被写体領域である場合、前記撮影画像に対して中央部重点測光による露出補正を行う、請求項２に記載の情報処理装置。
　前記算出部が基づく前記確率と前記重みとは、前記確率と前記重みとの線形補間である、請求項１に記載の情報処理装置。
　前記算出部による前記確率の算出は、前記撮影画像を入力し、前記確率を出力する学習モデルを用いて算出される、請求項１に記載の情報処理装置。
　情報処理装置が、
　被写体を撮影し、デジタルデータに変換して撮影画像を生成し、
　前記撮影画像の所定領域ごとに、前記所定領域に含まれる前記被写体が、撮影者が撮影したい主要被写体である確率を算出し、前記確率と前記撮影画像に対する露出の重みとに基づいて、前記所定領域ごとに前記確率に対応する前記重みを算出し、
　前記所定領域ごとの前記重みに基づいて、前記撮影画像に対する露出補正を行う
　処理を実行する、方法。
　情報処理装置に、
　被写体を撮影し、デジタルデータに変換して撮影画像を生成し、
　前記撮影画像の所定領域ごとに、前記所定領域に含まれる前記被写体が、撮影者が撮影したい主要被写体である確率を算出し、前記確率と前記撮影画像に対する露出の重みとに基づいて、前記所定領域ごとに前記確率に対応する前記重みを算出し、
　前記所定領域ごとの前記重みに基づいて、前記撮影画像に対する露出補正を行う
　処理を実行させる、プログラム。