WO2022270000A1

WO2022270000A1 - 制御装置、制御方法、およびプログラム

Info

Publication number: WO2022270000A1
Application number: PCT/JP2022/006304
Authority: WO
Inventors: 秀一後藤
Original assignee: ソニーグループ株式会社
Priority date: 2021-06-25
Filing date: 2022-02-17
Publication date: 2022-12-29

Abstract

本技術は、特定の人物の顔の肌領域の明るさに合わせて露出を補正して撮影を行うことができるようにする制御装置、制御方法、およびプログラムに関する。本技術の制御装置は、被写体として写る複数の人物のそれぞれの顔を検出し、特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、特定の人物の顔を含む撮影範囲の撮影を行わせるものである。本技術は、デジタルカメラやスマートフォンなどの撮影機能を有するデバイスに適用することができる。

Description

制御装置、制御方法、およびプログラム

　本技術は、制御装置、制御方法、およびプログラムに関し、特に、特定の人物の顔の肌領域の明るさに合わせて露出を補正して撮影を行うことができるようにした制御装置、制御方法、およびプログラムに関する。

　デジタルカメラやスマートフォンなどの撮影機能として露出制御機能がある。露出制御機能により、ユーザは被写体の明るさが自動的に調整された画像を撮影することができる。

　特許文献１には、顔の肌色の領域を適正な明るさに補正する技術が開示されている。

特開２００９－０２７３５２号公報

　撮影範囲に複数の人物が含まれる場合、どの人物の明るさに合わせて露出を補正すればよいのかの判断が困難となる。

　また、ある人物の顔の肌の領域の明るさに合わせて露出を補正するとした場合、通常、対象とする人物の顔の範囲には髪の毛、眼鏡、マスクなどが含まれるため、最適な露出値を正確に算出することが難しい。

　本技術はこのような状況に鑑みてなされたものであり、特定の人物の顔の肌領域の明るさに合わせて露出を補正して撮影を行うことができるようにするものである。

　本技術の一側面の制御装置は、被写体として写る複数の人物のそれぞれの顔を検出する顔検出部と、特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、前記特定の人物の顔を含む撮影範囲の撮影を行わせる撮影制御部とを備える。

　本技術の一側面においては、被写体として写る複数の人物のそれぞれの顔が検出され、特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出が制御され、前記特定の人物の顔を含む撮影範囲の撮影が行われる。

撮影装置による露出制御の例を示す図である。肌領域の抽出方法の例を示す図である。撮影装置のハードウェア構成例を示すブロック図である。制御部の機能構成例を示すブロック図である。撮影装置の露出補正処理について説明するフローチャートである。肌領域の抽出方法の他の例を示す図である。コンピュータのハードウェアの構成例を示すブロック図である。

　以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
　１．本技術の概要
　２．撮影装置の構成
　３．撮影装置の動作
　４．変形例
　５．その他

＜１．本技術の概要＞
　図１は、本技術の一実施形態に係る撮影装置による露出制御の例を示す図である。

　図１の上段に示すように、人物Ｕ１，Ｕ２の２人の人物の顔が撮影範囲に含まれる場合、矩形の枠Ｆ１，Ｆ２で囲んで示すようにそれぞれの顔が検出される。撮影装置には、例えば静止画像の撮影前に取り込まれた画像を対象として、人物の顔を検出する機能が搭載されている。

　図１の上段に示すような表示を見て、ユーザは、どの人物の顔の肌領域の明るさに合わせて露出制御を行うのかを指定することができる。

　例えば、左側に写る人物Ｕ１の顔の肌領域の明るさに合わせて露出制御を行うことをユーザが指定した場合、矢印Ａ１の先に示すように、人物Ｕ１の顔の肌領域が抽出される。図１の中段に示す表示において、薄い色付きの小さな矩形を並べて覆われている範囲が、肌領域として抽出された範囲である。露出制御のターゲットとして指定された人物Ｕ１の顔を囲む枠Ｆ１は強調表示される。

　図１の例においては、枠Ｆ１で囲んで示す人物Ｕ１の顔領域のうち、髪の毛の領域、目と眉毛の領域、開いている口の領域を除いた領域が、肌領域として抽出されている。肌領域の抽出方法については後述する。

　露出制御のターゲットとなる人物の肌領域が抽出された後、矢印Ａ２の先に示すように、ユーザが指定した人物Ｕ１の顔の肌領域の明るさを基準にして露出が補正される。例えば、露出制御のターゲットとなる人物を他の人物に切り替えたり、人物Ｕ１をターゲットから解除したりする操作が行われるまで、レリーズ操作が行われる毎に、人物Ｕ１の顔の肌領域の明るさを基準にして露出が補正された画像が連続して撮影される。

　これにより、ユーザは、撮影範囲に複数の人物が含まれる場合においても、特定の人物の顔の肌領域の明るさに合わせて露出が補正された画像を撮影することが可能となる。

　露出制御の基準となる領域は、顔全体の領域ではなく、髪の毛の領域、目と眉毛の領域、口の領域などを除いた領域である。ユーザは、特定の人物の顔の肌の明るさに合わせて露出が補正された画像を撮影することができる。露出制御のターゲットとなる人物が眼鏡やマスクを装着している場合、眼鏡の領域やマスクの領域なども、肌領域から除かれる。ユーザは、より正確に、顔の肌の明るさに合わせて露出制御を行わせることができる。

　図２は、肌領域の抽出方法の例を示す図である。

　図２に示すように、肌領域の抽出は、例えば、機械学習によって取得された推論モデルである肌領域抽出モデルＭ１を用いて行われる。例えば、肌領域のみをアノテーションした複数枚の画像を教師データとする機械学習が行われることによって肌領域抽出モデルＭ１が生成される。撮影装置は、人物の顔画像を肌領域抽出モデルＭ１に入力し、肌領域抽出モデルＭ１の出力に基づいて肌領域を取得する。

　図２の例においては、人物Ｕ１の顔画像を肌領域抽出モデルＭ１に入力することで、人物Ｕ１の肌領域の情報が出力されている。肌領域抽出モデルＭ１から出力された情報に基づいて、図１を参照して説明したような肌領域の表示が行われる。

　露出制御のターゲットとなる人物が指定されている場合、撮影装置においては、このような肌領域の抽出が、指定された人物の顔画像を用いて繰り返し行われる。

　以上のようにして露出補正を行う撮影装置の一連の動作についてはフローチャートを参照して後述する。

＜２．撮影装置の構成＞
　図３は、撮影装置１のハードウェア構成例を示すブロック図である。

　撮影装置１は、制御部１１に対して、撮影部１２、マイクロフォン１３、センサ１４、ディスプレイ１５、操作部１６、スピーカ１７、記憶部１８、および通信部１９が接続されることによって構成される。図３の撮影装置１は例えばスマートフォンである。

　制御部１１は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などにより構成される。制御部１１は、所定のプログラムを実行し、ユーザの操作に応じて撮影装置１の全体の動作を制御する。制御部１１を有する撮影装置１は、露出制御を含む、撮影に関する各種の処理を制御する制御装置として機能する。

　撮影部１２は、レンズ、撮像素子などにより構成され、制御部１１による制御に従って撮影を行う。撮影部１２は、撮影によって得られた画像データを制御部１１に出力する。

　マイクロフォン１３は、集音した音声などのオーディオデータを制御部１１に出力する。

　センサ１４は、各種の対象のセンシングを行い、センサデータを制御部１１に出力する。

　ディスプレイ１５は、LCDなどにより構成され、制御部１１による制御に従って、メニュー画面や撮影中の画像などの各種の情報を表示する。例えば図１に示すような画像がディスプレイ１５に表示される。

　操作部１６は、撮影装置１の筐体表面に設けられた操作ボタンやタッチパネルなどにより構成される。操作部１６は、ユーザによる操作の内容を表す情報を制御部１１に出力する。例えば、露出制御のターゲットとなる人物を指定するための操作が操作部１６により受け付けられる。

　スピーカ１７は、制御部１１から供給されたオーディオ信号に基づいて音声を出力する。

　記憶部１８は、フラッシュメモリや、筐体に設けられたカードスロットに挿入されたメモリカードにより構成される。記憶部１８は、制御部１１から供給された画像のデータなどの各種のデータを記憶する。

　通信部１９は、外部の装置との間で無線や有線の通信を行う。通信部１９は、制御部１１から供給された画像のデータなどの各種のデータを外部の装置に送信する。

　図４は、制御部１１の機能構成例を示すブロック図である。

　図４に示すように、制御部１１は、顔検出部３１、顔認証部３２、肌領域抽出部３３、および撮影制御部３４によって構成される。例えば、静止画像の撮影前に撮影部１２により取り込まれた画像データが顔検出部３１に入力される。

　顔検出部３１は、撮影範囲に被写体として含まれるそれぞれの人物の顔を検出する。顔検出部３１により検出された顔の情報は、顔認証部３２に出力される。人物の顔は、例えば画像の特徴を解析することによって検出される。

　顔認証部３２は、顔検出部３１により検出された人物の顔の中から、露出制御のターゲットとなる特定の人物の顔を認証する。露出制御のターゲットとなる特定の人物の顔は例えばユーザにより指定される。露出制御のターゲットとなる人物の顔画像が事前に登録されるようにしてもよい。

　例えば、顔認証部３２は、機械学習によって生成された、人物の顔の認証用の推論モデルを有している。顔認証部３２は、顔検出部３１により検出されたそれぞれの人物の顔の画像を推論モデルに入力し、推論モデルの出力に基づいて、露出制御のターゲットとなる特定の人物の認証を行う。人物の顔の認証用の推論モデルに対しては、例えば、顔検出部３１により検出された、人物の顔を囲む矩形領域の画像が入力される。顔認証部３２による認証結果の情報は、肌領域抽出部３３に出力される。

　肌領域抽出部３３は、特定の人物の顔領域から肌領域を抽出する。図２を参照して説明したように、肌領域の抽出は肌領域抽出モデルＭ１を用いて行われる。肌領域抽出部３３により抽出された、目、唇、眉毛、まつげ、および髪の毛の領域を除く肌領域の情報は、撮影制御部３４に出力される。目、唇、眉毛、まつげ、および髪の毛の全ての領域が肌領域から除かれるのではなく、いずれかの領域が肌領域に含まれるようにしてもよい。すなわち、目、唇、眉毛、まつげ、および髪の毛のうちの、少なくともいずれかの領域を除く領域が肌領域として抽出されるようにすることが可能である。

　撮影制御部３４は、肌領域抽出部３３により抽出された肌領域の明るさに基づいて露出制御し、撮影を行わせる。例えば、特定の人物の顔の肌領域の明るさが一定の範囲の明るさとなるように露出制御が行われる。

＜３．撮影装置の動作＞
　図５のフローチャートを参照して、撮影装置１の露出補正処理について説明する。

　ステップＳ１において、顔検出部３１は、撮影範囲に被写体として含まれるそれぞれの人物の顔を検出する。

　ステップＳ２において、顔認証部３２は、顔検出部３１により検出された人物の顔の中から、露出制御のターゲットとなる特定の人物の顔を認証する。

　ステップＳ３において、肌領域抽出部３３は、特定の人物の顔領域から肌領域を抽出する。

　ステップＳ４において、撮影制御部３４は、肌領域抽出部３３により抽出された肌領域の明るさに基づいて露出制御を行い、撮影を行わせる。

　以上の処理により、ユーザは、撮影環境に依存せずに、顔領域から抽出した肌領域の明るさに合わせて露出を補正して撮影を行うことができる。撮影範囲に複数の人物が含まれる場合においても、ユーザは、特定の人物の顔のうちの肌領域の明るさに合わせて露出が補正された画像を撮影することが可能となる。また、抽出された肌領域は、髪の毛の領域、目と眉毛の領域、開いている口の領域や、眼鏡、マスクなどが除かれた領域であるため、肌領域に対して最適な露出値を正確に算出することが可能となる。

＜４．変形例＞
　露出制御のターゲットとなる人物の顔の肌領域が推論モデルを用いて抽出されるものとしたが、顔の特徴の解析結果に基づいて抽出されるようにしてもよい。

　図６は、肌領域の抽出方法の他の例を示す図である。

　図６に示すように、露出制御のターゲットとなる人物Ｕ１の顔画像を対象として、特徴解析が例えば肌領域抽出部３３により行われる。図６において顔の各位置に示す十字が、特徴点として解析された位置を表す。

　太い実線で囲んで示すように、例えば、人物Ｕ１の両目の間にある鼻筋の点と顔の外周を結んだ範囲が検出され、その範囲の内側から、鼻穴と口の範囲を除外した領域が肌領域として抽出される。

　このように、肌領域抽出部３３は、図２を参照して説明したような推論モデルを用いて肌領域を抽出することもできるし、人物の顔の特徴を解析して肌領域を抽出することもできる。

＜５．その他＞
　以上のようにして抽出された、ターゲットとなる人物の顔の肌領域の色に合わせてホワイトバランスの調整が行われるようにしてもよい。これにより、複数の人物が撮影範囲に含まれる場合においても、特定の人物の顔の肌領域の色に合わせてホワイトバランスの調整を行わせることが可能となる。

・プログラムについて
　上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

　図７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　CPU(Central Processing Unit)５１、ROM(Read Only Memory)５２、RAM(Random Access Memory)５３は、バス５４により相互に接続されている。

　バス５４には、さらに、入出力インタフェース５５が接続されている。入出力インタフェース５５には、入力部５６、出力部５７、記憶部５８、通信部５９、およびドライブ６０が接続されている。ドライブ６０は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア６１を駆動する。

　以上のように構成されるコンピュータでは、CPU５１が、例えば、記憶部５８に記憶されているプログラムを、入出力インタフェース５５およびバス５４を介して、RAM５３にロードして実行することにより、上述した一連の処理が行われる。

　CPU５１が実行するプログラムは、例えばリムーバブルメディア６１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部５８にインストールされる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであってもよいし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであってもよい。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。

　本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

・構成の組み合わせ例
　本技術は、以下のような構成をとることもできる。

（１）
　被写体として写る複数の人物のそれぞれの顔を検出する顔検出部と、
　特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、前記特定の人物の顔を含む撮影範囲の撮影を行わせる撮影制御部と
　を備える制御装置。
（２）
　前記特定の人物の顔の領域のうちの前記肌領域を抽出する肌領域抽出部をさらに備える
　前記（１）に記載の制御装置。
（３）
　前記肌領域抽出部は、前記特定の人物の顔画像を入力とし、前記肌領域を出力とする推論モデルを用いて前記肌領域を抽出する
　前記（２）に記載の制御装置。
（４）
　前記肌領域抽出部は、前記特定の人物の顔の特徴を解析し、前記肌領域を抽出する
　前記（２）に記載の制御装置。
（５）
　前記肌領域抽出部は、前記特定の人物の顔の領域のうちの、目、唇、眉毛、まつげ、および髪の毛のうちの少なくともいずれかの領域を除く領域を前記肌領域として抽出する
　前記（２）乃至（４）のいずれかに記載の制御装置。
（６）
　前記撮影範囲に含まれる複数の前記人物のうちの前記特定の人物の顔の認証を行う顔認証部をさらに備える
　前記（１）乃至（５）のいずれかに記載の制御装置。
（７）
　前記顔認証部は、前記撮影範囲に含まれる複数の前記人物の顔の中からユーザにより指定された顔を前記特定の人物の顔として認証を行う
　前記（６）に記載の制御装置。
（８）
　前記顔認証部は、前記人物の顔の領域の画像を入力とし、前記人物の顔の認証結果を出力とする推論モデルを用いて、前記特定の人物の顔の認証を行う
　前記（６）または（７）に記載の制御装置。
（９）
　前記撮影制御部は、前記特定の人物の顔の前記肌領域の明るさに基づいて露出を制御した撮影を連続して行わせる
　前記（１）乃至（８）のいずれかに記載の制御装置。
（１０）
　前記撮影制御部は、前記肌領域の色に合わせてホワイトバランスを調整し、前記特定の人物の顔を含む前記撮影範囲の撮影を行わせる
　前記（１）乃至（９）のいずれかに記載の制御装置。
（１１）
　制御装置が、
　被写体として写る複数の人物のそれぞれの顔を検出し、
　特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、前記特定の人物の顔を含む撮影範囲の撮影を行わせる
　制御方法。
（１２）
　コンピュータに、
　被写体として写る複数の人物のそれぞれの顔を検出し、
　特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、前記特定の人物の顔を含む撮影範囲の撮影を行わせる
　処理を実行させるためのプログラム。

　１　撮影装置，　１１　制御部，　３１　顔検出部，　３２　顔認証部，　３３　肌領域抽出部，　３４　撮影制御部

Claims

　被写体として写る複数の人物のそれぞれの顔を検出する顔検出部と、
　特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、前記特定の人物の顔を含む撮影範囲の撮影を行わせる撮影制御部と
　を備える制御装置。
　前記特定の人物の顔の領域のうちの前記肌領域を抽出する肌領域抽出部をさらに備える
　請求項１に記載の制御装置。
　前記肌領域抽出部は、前記特定の人物の顔画像を入力とし、前記肌領域を出力とする推論モデルを用いて前記肌領域を抽出する
　請求項２に記載の制御装置。
　前記肌領域抽出部は、前記特定の人物の顔の特徴を解析し、前記肌領域を抽出する
　請求項２に記載の制御装置。
　前記肌領域抽出部は、前記特定の人物の顔の領域のうちの、目、唇、眉毛、まつげ、および髪の毛のうちの少なくともいずれかの領域を除く領域を前記肌領域として抽出する
　請求項２に記載の制御装置。
　前記撮影範囲に含まれる複数の前記人物のうちの前記特定の人物の顔の認証を行う顔認証部をさらに備える
　請求項１に記載の制御装置。
　前記顔認証部は、前記撮影範囲に含まれる複数の前記人物の顔の中からユーザにより指定された顔を前記特定の人物の顔として認証を行う
　請求項６に記載の制御装置。
　前記顔認証部は、前記人物の顔の領域の画像を入力とし、前記人物の顔の認証結果を出力とする推論モデルを用いて、前記特定の人物の顔の認証を行う
　請求項６に記載の制御装置。
　前記撮影制御部は、前記特定の人物の顔の前記肌領域の明るさに基づいて露出を制御した撮影を連続して行わせる
　請求項１に記載の制御装置。
　前記撮影制御部は、前記肌領域の色に合わせてホワイトバランスを調整し、前記特定の人物の顔を含む前記撮影範囲の撮影を行わせる
　請求項１に記載の制御装置。
　制御装置が、
　被写体として写る複数の人物のそれぞれの顔を検出し、
　特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、前記特定の人物の顔を含む撮影範囲の撮影を行わせる
　制御方法。
　コンピュータに、
　被写体として写る複数の人物のそれぞれの顔を検出し、
　特定の人物の顔の領域のうちの肌領域の明るさに基づいて露出を制御し、前記特定の人物の顔を含む撮影範囲の撮影を行わせる
　処理を実行させるためのプログラム。