JP2019180017A

JP2019180017A - 画像処理装置、撮影装置、画像処理方法、およびプログラム

Info

Publication number: JP2019180017A
Application number: JP2018068068A
Authority: JP
Inventors: 孝志安達; Takashi Adachi
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2018-03-30
Filing date: 2018-03-30
Publication date: 2019-10-17
Anticipated expiration: 2038-03-30
Also published as: JP7182893B2

Abstract

【課題】属性推定が行えるように画角を変更しつつ、より広い範囲を対象として複数の人の属性推定を行うことを目的としている。【解決手段】撮影手段により撮影された画像に含まれる複数の人を検出する検出手段と、検出手段の結果に基づいて、検出手段により検出した複数の人のうち少なくとも１人を含む領域を複数決定する決定手段と、決定手段により決定された複数の領域の各々について、順次撮影されるよう撮影手段を制御する制御手段と、制御手段により制御された撮影手段から得られる撮影画像から領域に存在する人の属性情報を推定する推定手段とを有し、制御手段は、領域が撮影手段の撮影範囲に含まれ、かつ、該領域に存在する人の属性情報を推定手段が推定できる撮影条件になるよう撮影手段を制御することを特徴とする画像処理装置。【選択図】図５

Description

本発明は、画像処理技術に関するものである。

近年、撮影装置が撮影した画像に存在する人を解析して人の属性情報（性別や年齢など）を推定する属性推定の技術が注目されている。特許文献１には、画像から人の属性を推定するための技術について記載されている。

特許第４８８８２１７号

しかし、上述の特許文献１では、撮影装置が撮影した画像から人の検出はできている状況で、画像に映る人のサイズが小さいために属性推定を行えない場合について考慮していない。一方、撮影範囲に含まれる複数の人について属性推定する場合に、属性推定を行えるよう撮影装置の画角を変更すると、撮影装置の画角から外れてしまった人について、ユーザーが撮影装置の画角を制御し直して属性推定する必要があった。

本発明は、このような問題に鑑みてなされたものであり、属性推定が行えるように画角を変更しつつ、より広い範囲を対象として複数の人の属性推定を行うことを目的としている。

上記課題を解決するために、本発明の画像処理装置は以下の構成を備える。すなわち、撮影手段により撮影された画像に含まれる複数の人を検出する検出手段と、前記検出手段の結果に基づいて、前記検出手段により検出した前記複数の人のうち少なくとも１人を含む領域を複数決定する決定手段と、前記決定手段により決定された複数の領域の各々について、順次撮影されるよう前記撮影手段を制御する制御手段と、前記制御手段により制御された前記撮影手段から得られる撮影画像から前記領域に存在する人の属性情報を推定する推定手段とを有し、前記制御手段は、前記領域が前記撮影手段の撮影範囲に含まれ、かつ、該領域に存在する人の前記属性情報を前記推定手段が推定できる撮影条件になるよう前記撮影手段を制御することを特徴とする画像処理装置。

本発明によれば、属性推定が行えるように画角を変更しつつ、より広い範囲を対象として複数の人の属性推定を行うことができる。

システム構成を示す模式図である。撮影装置の外観図である。撮影装置の機能ブロック図である。画像処理装置の機能ブロック図である。画像処理のフローチャートである。画像処理を説明するための模式図である。画像処理において使用されるテーブルである。画像処理から得られる表である。画像処理のフローチャートである。画像処理を説明するための模式図である。画像処理装置の一部の機能を有する撮影装置とクライアント装置の機能ブロック図の一例である。画像処理装置のハードウェア構成を示す概略図である。

本実施形態に係る画像処理装置は、撮影装置によって撮影した連続する画像における複数の推定領域の各々に対して、人の属性情報（性別や年齢）を推定する属性推定を行う画像処理装置である。

以下、添付図面を参照しながら本発明の実施形態について説明する。なお、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。

（本実施形態）
図１は、本実施形態に係るシステム構成を示す図である。画像処理装置１００は、後述する画像処理を実行する装置である。なお、画像処理装置１００は、例えば、後述する画像処理の機能を実現するためのプログラムがインストールされたパーソナルコンピュータなどによって実現される。

表示装置１０１は、画像処理装置１００に接続され、後述する画像処理により出力されるデータやＵＩ（ｕｓｅｒｉｎｔｅｒｆａｃｅ）などをユーザーが閲覧するための表示装置である。

撮影装置１０２は、画像を撮影する装置であり、パン・チルト・ズーム（Ｐａｎ−Ｔｉｌｔ−Ｚｏｏｍ、以下「ＰＴＺ」と称す）制御可能に構成されている。また、撮影装置１０２は、例えば、ネットワークを介して画像の画像データなどを送信できるネットワークカメラなどである。

記録装置１０３は、撮影装置１０２で撮影された画像の画像データなどを記録することができる装置である。また、画像処理装置１００、撮影装置１０２、および記録装置１０３は、ネットワーク１０４を介して通信を行う。ネットワーク１０４は、例えばＥｔｈｅｒｎｅｔ（商標）等の通信規格を満足する複数のルータ、スイッチ、ケーブル等から構成される。本実施形態においては画像処理装置１００、撮影装置１０２、記録装置１０３間の通信を行うことができるものであればその通信規格、規模、構成を問わない。例えば、ネットワーク１０４はインターネットや有線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、無線ＬＡＮ（ＷｉｒｅｌｅｓｓＬＡＮ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）等により構成されてもよい。

また、図１の構成では、撮影装置１０２により撮影された画像の画像データ（ライブ映像）や記録装置１０３にて記録された画像データ（過去に撮影した画像）などが画像処理装置１００に送信される。

次に、図１２を参照して、本実施形態の後述する各機能を実現するための画像処理装置１００のハードウェア構成を説明する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１２０１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１２００が実行するコンピュータプログラムを一時的に記憶する。また、ＲＡＭ１２０１は、通信インターフェース１２０３を介して外部から取得したデータ（コマンドや画像データ）などを一時的に記憶する。また、ＲＡＭ１２０１は、ＣＰＵ１２００が後述の画像処理を実行する際に用いるワークエリアを提供する。また、ＲＡＭ１２０１は、例えば、フレームメモリとして機能したり、バッファメモリとして機能したりする。

ＣＰＵ１２００は、ＲＡＭ１２０１に格納されるコンピュータプログラムを実行する。なおＣＰＵ以外にも、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）等のプロセッサやＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）を用いてもよい。

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１２０２は、オペレーティングシステムのプログラムや画像データを記憶する。

後述する図５や図９のフローチャートを実行するためのコンピュータプログラムやデータはＨＤＤ１２０２に格納されており、ＣＰＵ１２００による制御に従って、適宜、ＲＡＭ１２０１にロードされ、ＣＰＵ１２００によって実行される。ＨＤＤ以外にもフラッシュメモリ等の他の記憶媒体を用いてもよい。

次に、図２および図３を参照して、撮影装置１０２について説明する。図２は、本実施形態に係る撮影装置１０２の外観図である。また、図３は、本実施形態に係る撮影装置１０２の機能ブロック図である。

レンズ２０２の光軸の向く方向が撮影装置１０２の撮影方向であり、レンズ２０２を通過した光束は、撮影部２０５の撮像素子に結像する。なお、レンズ２０２は、フォーカスレンズ及びズームレンズ等を備える。また、レンズ駆動部２１０は、フォーカスレンズ及びズームレンズなどの駆動系を含み、レンズ２０２の焦点距離を変更する。レンズ駆動部２１０は、パンチルトズーム制御部２０８により制御される。

パン駆動部２００は、パン動作を行うメカ駆動系及び駆動源のモータを含み、撮影装置１０２の撮影方向をパン方向２０３に変更するように駆動する。また、パン駆動部２００は、パンチルトズーム制御部２０８により制御される。

チルト駆動部２０１は、チルト動作を行うメカ駆動及び駆動源のモータを含み、撮影装置１０２の撮影方向をチルト方向２０４に変更するように駆動する。チルト駆動部２０１は、パンチルトズーム制御部２０８により制御される。

撮影部２０５は、ＣＣＤ（ｃｈａｒｇｅｃｏｕｐｌｅｄｄｅｖｉｃｅ）センサやＣＭＯＳ（ｃｏｍｐｌｅｍｅｎｔａｒｙｍｅｔａｌｏｘｉｄｅｓｅｍｉｃｏｎｄｕｃｔｏｒ）センサ等の撮像素子を有する。そして、撮影部２０５は、レンズ２０２を通って結像された被写体像を光電変換して電気信号を生成する。

画像処理部２０６は、撮影部２０５において光電変換された電気信号をデジタル信号へ変換する処理や、圧縮符号化処理などを行い、画像データを生成する。

パンチルトズーム制御部２０８は、システム制御部２０７から伝達された指示に基づいて、パン駆動部２００、チルト駆動部２０１及びレンズ駆動部２１０の制御を行う。

通信部２０９は、画像処理装置１００との通信を行うインターフェースである。例えば、通信部２０９は、生成された画像データを画像処理装置１００に送信する。また、通信部２０９は、画像処理装置１００から送信された撮影装置１０２のパン・チルト・ズーム動作などを制御する制御コマンドを受信し、システム制御部２０７へ伝達する。また、通信部２０９は、有線ＬＡＮインターフェースや無線ＬＡＮインターフェースを有する。

システム制御部２０７は、撮影装置１０２の全体を制御し、例えば、次のような処理を行う。すなわち、システム制御部２０７は、通信部２０９から伝達された制御コマンドを解析し、解析した内容に基づく処理を行う。例えば、システム制御部２０７は、パンチルトズーム制御部２０８に対してパン・チルト・ズーム動作の指示を行う。

なお、パン角度は、パン駆動部２００の駆動端の一方を０°としたときの、撮影装置１０２のパン方向２０３における撮影方向（光軸）の角度である。また、チルト角度は、チルト駆動部２０１の駆動端の一方を０°としたときの、撮影装置１０２のチルト方向２０４における撮影方向（光軸）の角度である。

次に、図４を参照して、本実施形態に係る画像処理装置１００について説明する。図４は、本実施形態に係る画像処理装置の機能ブロック図である。なお、図４に示す各機能ブロックは、ソフトウェアモジュールで実現してもよいし、ハードウェアモジュールで実現してもよい。また、ソフトウェアモジュールとハードウェアモジュールを協働させて実現してもよい。なお、以降の説明では画像処理装置１００が有する各機能は、画像処理装置１００のＣＰＵ１２００により実行されるものとする。

本実施形態に係る画像処理装置１００は、通信部４００と、検出領域設定部４０１と、操作受付部４０２と、検出部４０３と、推定領域決定部４０４と、コマンド管理部４０５と、属性推定部４０６と、出力制御部４０７と、記憶部４０８と、を有する。

通信部４００は、撮影装置１０２により撮影された画像の画像データの受信や、撮影装置１０２のパン・チルト・ズームを制御する制御コマンドなどを送信するための通信を行う。また、通信部４００は、例えば、記録装置１０３に記憶された画像データ、または他の外部装置のストレージデバイスに記憶された画像データなどを各装置からネットワーク１０４を介して送信してもらい受信する。

検出領域設定部４０１は、通信部４００を介して得られた画像において、検出部４０３が処理を行う対象とする領域である検出領域を設定する。なお、操作受付部４０２を介して、ユーザーにより設定された画像内の領域を検出領域として設定してもよいし、事前に設定された所定の領域を検出領域としてもよい。なお、ユーザーによる検出領域の指示や、事前に設定された領域がなければ、通信部４００を介して得られた画像データが示す画像全体を検出領域としてもよい。

操作受付部４０２は、マウス、キーボードなどの入力装置（不図示）を介して、ユーザーにより行われた操作を受け付ける。本実施形態における操作受付部４０２は、例えば、出力制御部４０７により表示装置１０１に出力された画像に対して、ユーザーが入力装置を介して設定した検出領域の位置の情報を受け付ける。

検出部４０３は、通信部４００を介して得られた画像において検出領域に含まれる複数の人の検出を行う。なお、本実施形態に係る検出部４０３は、学習画像から人体の特徴量（Ｈａａｒ−Ｌｉｋｅ特徴量、ＨＯＧ特徴量など）が学習されたうえで作成された識別器を保持している。そして、検出部４０３は、学習の結果である識別器に画像が入力され、該画像から人体の検出を行う。なお、本実施形態における検出部４０３は、人の体を検出する人体検出を行うとして説明するが、これに限定されない。例えば、検出部４０３は、人の顔を検出する顔検出や人の頭部を検出する頭部検出であってもよい。なお、以降の説明において、人体は人の全身のことであり、人の顔や胴体を含むものとする。

推定領域決定部４０４は、検出部４０３における検出の結果に基づいて、検出部４０３により検出した複数の人のうち少なくとも１人を含む推定領域を複数決定する。推定領域に含まれる人が、属性推定部４０６により属性情報を推定される対象となる。なお、推定領域の位置に関する情報は記憶部４０８にて記憶される。

コマンド管理部４０５は、推定領域決定部４０４において決定された複数の推定領域の各々について、順次撮影されるよう撮影装置１０２を制御するための制御コマンドを生成する。なおこのとき、１つの推定領域が撮影装置１０２の撮影範囲に含まれ、かつ、該推定領域に存在する人の属性情報を属性推定部４０４が推定できる撮影条件になるよう撮影装置１０２を制御する制御コマンドが生成される。またこのとき、コマンド管理部４０５により生成される制御コマンドは、例えば、撮影装置１０２のパン・チルト・ズームの少なくともいずれか１つを制御するための制御コマンドである。なお、本実施形態におけるコマンド管理部４０５にて生成された制御コマンドは、通信部４００および通信部２０９を介して、撮影装置１０２におけるシステム制御部２０７へ送られ、該制御コマンドに基づいて撮影装置１０２の制御が行われる。

属性推定部４０６は、撮影装置１０２から得られる撮影画像の各々に対して推定領域に存在する人の属性情報を推定する。本実施形態に係る属性推定部４０６は、学習画像によって学習した識別器を利用して人の顔領域から属性情報（性別や年齢に関する情報）を推定する。なお、人の顔領域から属性情報を推定する際、画像に含まれる顔領域のサイズ（画素数）が小さいと属性情報を推定できない場合がある。つまり、人の顔領域から属性情報を推定する場合、最低限必要な顔領域の画素数が存在する。また、本実施形態における属性情報を人の性別に関する情報や年齢に関する情報として説明するが、これに限定されない。例えば、人種や服装、髪形などに関する情報であってもよい。

出力制御部４０７は、撮影装置１０２から得られた画像の画像データや、属性推定部４０６により得られた属性情報の推定結果を表示装置１０１に出力する。

記憶部４０８は、検出領域や推定領域の位置に関する情報などを記憶する。

以上のように、推定領域に存在する人の属性情報を属性推定部４０６が推定できる撮影条件を満たしつつ、複数の推定領域の各々について順次撮影されるよう撮像装置１０２を制御して、該複数の推定領域の各々に存在する人の属性情報を推定する。こうすることにより、より広い範囲を対象として複数の人の属性推定を行うことが可能となる。

次に本実施形態における画像処理について図５に示すフローチャートを参照して説明する。図５は、本実施形態に係る画像処理の流れを示すフローチャートである。なお、図５に示すフローチャートの処理は、主に図４に示す各機能ブロックにより実行される。また、図５に示すフローチャートの処理は、ＨＤＤ１２０２に格納されたコンピュータプログラムに従って画像処理装置１００のＣＰＵ１２００により実行される。以下、画像処理装置１００のＣＰＵ１２００により実行される処理について説明する。

Ｓ５０１にて、通信部４００は、撮影装置１０２により撮影された画像の画像データを受信する。

次に、Ｓ５０２にて、検出領域設定部４０１は、通信部４００を介して得られた画像において、検出部４０３が画像に含まれる複数の人を検出する処理を行う対象とする領域である検出領域を設定する。本実施形態における操作受付部４０２は、出力制御部４０７により表示装置１０１に出力された画像に対して、ユーザーが設定した画像内の領域の位置に関する情報を受け付ける。そして、検出領域設定部４０１は、操作受付部４０２が受け付けた情報である画像内の領域の位置を検出領域の位置として設定する。なお本実施形態における検出領域の位置は、該検出領域の重心点におけるパン角度と、チルト角度と、該検出領域の画角となるズーム倍率により定められる。なお、検出領域の位置に関する情報は、記憶部４０８にて記憶される。

次に、Ｓ５０３にて、検出部４０３は、検出領域設定部４０１により設定された検出領域に含まれる複数の人体の検出を行う。このとき、検出部４０３は、検出領域内で検出した複数の人体各々の顔領域の画素数、および、位置情報も検出する。なお、本実施形態における検出部４０３は人体検出を行うが、検出した人体の画素数から顔領域の画素数を推定することができる。

次に、Ｓ５０４にて、検出領域に複数の人体が存在しない場合（Ｓ５０４で’Ｎｏ’）、Ｓ５０１の処理を行う。

Ｓ５０４にて、検出領域に複数の人体が存在する場合（Ｓ５０４で’Ｙｅｓ’）、Ｓ５０５の処理を行う。Ｓ５０５にて、推定領域決定部４０４は、検出部４０３の結果に基づいて、検出部４０３により検出した複数の人体のうち少なくとも１人を含む推定領域を複数決定する。以下図６を参照して、推定領域決定部４０４の処理について更に詳細に説明する。

図６は、推定領域決定部４０４の処理を説明するための図である。図６（ａ）において、画像６００は、撮影装置１０２により撮影された画像である。検出領域６０１は、ユーザーにより設定された画像内における領域であり、該領域内には検出部４０３により検出された複数の人体が存在している。

範囲６０２は、属性推定部４０６が該範囲に含まれる人の属性情報を推定するために最低限必要な顔領域の画素数を取得できるズーム倍率で撮影した場合の撮影範囲である。この場合、範囲６０２は、該範囲に含まれる６人各々の属性情報を推定するために最低限必要な顔領域の画素数を取得できるズーム倍率で撮影した撮影範囲であり、該ズーム倍率以下で撮影した撮影範囲になると該６人に対して属性情報を推定できなくなる。なお、範囲６０２は、検出部４０３が検出した人の顔領域の画素数に基づいて、推定領域決定部４０４により決定される。例えば、属性推定部４０６が人の属性情報を推定するうえで必要な顔領域の画素数が縦４０ピクセル以上かつ横３０ピクセル以上が条件であるとする。このとき、推定領域決定部４０４は、検出部４０３により検出された人の顔領域の画素数が該条件を満たすうえでの最小ズーム倍率で撮影した撮影範囲を範囲６０２として決定する。

そして、推定領域決定部４０４は、範囲６０２内において範囲６０２の面積以下となり、かつ、検出部４０３により検出した複数の人のうち少なくとも１人を含む領域６０２ａを推定領域として決定する。なおこのとき、推定領域決定部４０４は、範囲６０２に対応する推定領域である領域６０２ａに対して、推定領域を特定するための推定領域ＩＤである“１”を付与する。以上のように、推定領域決定部４０４は、検出部４０３が検出した人の顔領域の画素数に基づいて範囲６０２を決定し、該範囲６０２に基づいて推定領域６０２aを決定する。

次に、推定領域決定部４０４は、範囲６０３を決定する。範囲６０２と同様、範囲６０３は、属性推定部４０６が該範囲に含まれる人の属性情報を推定するために最低限必要な顔領域の画素数を取得できるズーム倍率で撮影した場合の撮影範囲である。そして、推定領域決定部４０４は、範囲６０３内において範囲６０３の面積以下となり、かつ、検出部４０３により検出した複数の人のうち少なくとも１人を含む領域である領域６０３ｂを決定する。なおこのとき、推定領域決定部４０４は、範囲６０３に対応する推定領域である領域６０３ｂに対して、推定領域ＩＤである“２”を付与する。

次に、推定領域決定部４０４は、範囲６０４を決定する。範囲６０２と同様、範囲６０４は、属性推定部４０６が該範囲に含まれる人の属性情報を推定するために最低限必要な顔領域の画素数を取得できるズーム倍率で撮影した場合の撮影範囲である。そして、推定領域決定部４０４は、範囲６０４内において範囲６０４の面積以下となり、かつ、検出部４０３により検出した複数の人のうち少なくとも１人を含む領域である領域６０４ｃを決定する。なおこのとき、推定領域決定部４０４は、範囲６０４に対応する推定領域である領域６０４ｃに対して、推定領域ＩＤである“３”を付与する。

次に、推定領域決定部４０４は、範囲６０５を決定する。範囲６０２と同様、範囲６０５は、属性推定部４０６が該範囲に含まれる人の属性情報を推定するために最低限必要な顔領域の画素数を取得できるズーム倍率で撮影した場合の撮影範囲である。そして、推定領域決定部４０４は、範囲６０５内において範囲６０５の面積以下となり、かつ、検出部４０３により検出した複数の人のうち少なくとも１人を含む領域である領域６０５ｄを決定する。なおこのとき、推定領域決定部４０４は、範囲６０５に対応する推定領域である領域６０５ｄに対して、推定領域ＩＤである“４”を付与する。

また、推定領域決定部４０４は、推定領域を特定するための推定領域ＩＤと、推定領域の位置と、推定領域内に含まれる人の属性情報を推定するために最低限必要なズーム倍率と、推定領域内に含まれる人数と、を対応付けてテーブル７００に格納する。なお、図７に示すテーブル７００は、推定領域決定部４０４によりデータが格納されるデータ構造図の一例である。

推定領域ＩＤは、推定領域を特定すると共に、複数の推定領域の各々について順次撮影するために撮影装置を制御していく際、対象とする推定領域の順番を表す。また、推定領域の位置は、該推定領域の重心点におけるパン角度と、チルト角度と、該推定領域の画角となるズーム倍率と、により定められる。図７に示す必要ズーム倍率は、推定領域内に含まれる人の属性情報を推定するために最低限必要なズーム倍率である。例えば、推定領域ＩＤが”１”である領域６０２ａにおける人の属性情報を推定するために最低限必要なズーム倍率は、範囲６０２が撮影範囲となる場合のズーム倍率（ｇｇ）となる。このとき、ズーム倍率（ｇｇ）以下で撮影した撮影範囲になると、領域６０２ａにおける人に対して属性推定部４０６は属性情報を推定できなくなる。なお、図６（ｅ）は、推定領域決定部４０４により決定された複数の推定領域と、推定領域ＩＤが付与された図である。なお、図６（e）に示される図は、出力制御部４０７により表示装置１０１に表示されてもよい。

以上のように、本実施形態における推定領域決定部４０４は、検出部４０３により検出された人の顔領域の画素数に基づいて、検出部４０３により検出した複数の人のうち少なくとも１人を含む推定領域を複数決定する。なお、本実施形態における推定領域決定部４０４は、検出領域６０１の左下から右方向へ走査するように推定領域を決定したが、これに限定されない。例えば、検出領域６０１の左上から右方向へ走査するように推定領域を決定してもよい。

なお、本実施形態における推定領域決定部４０４は、検出部４０３により検出した複数の人のうち少なくとも１人の人を含む推定領域を複数決定する際、人の顔領域が推定領域に含まれるように決定したが、これに限定されない。例えば、人の上半身が推定領域に含まれるように決定してもよい。

また、本実施形態における推定領域決定部４０４は、推定領域の数が少なくなるよう、範囲６０２、範囲６０３、範囲６０４、範囲６０５のそれぞれに対して一つずつ推定領域を決定するようにしたが、これに限定されない。例えば、推定領域決定部４０４は、範囲６０２において、少なくとも１人の人を含む推定領域を２つ決定してもよい。なお、推定領域決定部４０４が決定する推定領域の数をより少なくすることで、検出部４０３が検出した複数の人に対して、属性推定部４０６が属性情報を推定する処理を行う時間をより短くすることができる。

次に図５に示すフローチャートの説明に戻る。Ｓ５０６において、コマンド管理部４０５は、推定領域決定部４０４において決定された複数の推定領域の各々について、順次撮影されるよう撮影装置１０２を制御するための制御コマンドを生成する。なおこのとき、１つの推定領域が撮影装置１０２の撮影範囲に含まれ、かつ、該推定領域に存在する人の属性情報を属性推定部４０６が推定できる撮影条件になるよう撮影装置１０２を制御する制御コマンドが生成される。

本実施形態におけるコマンド管理部４０５は、まず、推定領域ＩＤが”１”である推定領域６０２ａが撮影されるよう撮影装置を制御する。このとき、推定領域６０２ａが撮影装置１０２の撮影範囲に含まれ、かつ、撮影条件として撮影装置１０２のズーム倍率が必要ズーム倍率以上になるように撮影装置１０２を制御する制御コマンドが生成される。この場合、撮影条件として撮影装置１０２のズーム倍率が必要ズーム倍率ｇｇ以上になるように撮影装置１０２を制御する制御コマンドが生成される。

なお、本実施形態におけるコマンド管理部４０５は、撮影装置１０２が撮影する撮影画像の重心と推定領域の重心とが略同一となるよう制御コマンドを生成してもよい。こうすることにより、撮影された画像の周縁部に歪みがある場合であっても、推定領域においては歪みを減らすことができ、属性情報を推定する精度をさらに向上させることができる。

次に、Ｓ５０７において、属性推定部４０６は、撮影装置１０２から得られる撮影画像に対して推定領域に存在する人の属性情報を推定する。この場合、推定領域６０２ａに存在する人の属性情報を推定する。

なお、Ｓ５０７にて、属性推定部４０６が一つの推定領域に存在する人の属性情報を推定する際、所定時間（例えば５秒など）が経過するとＳ５０８の処理に移行するようにしてもよい。

なお、属性推定部４０６が、撮影装置１０２から得られる撮影画像における推定領域に存在する人の属性情報を推定する際に、他の推定領域に存在する人が該撮影画像に映る場合がある。例えば、図６（ｃ）において、推定領域６０４ｃにおける人を対象に属性情報を推定するために範囲６０４と位置および大きさが略同一の撮影範囲で撮影したときの撮影画像が得られた場合を想定する。このとき、該撮影画像には、すでに属性情報の推定を行った推定領域６０２ａにおける人が３人含まれている。このとき、属性推定部４０６は、重複して属性情報を推定しないよう次のような処理を行う。例えば、属性推定部４０６は、撮影画像６０４から推定領域６０４ｃを切り出し、切り出された推定領域６０４ｃの画像に含まれる人を対象として属性情報の推定を行う。または、属性推定部４０６により属性情報の推定がなされた人の位置情報を記憶部４０８は記憶しておいてもよい。そして、例えば、該撮影画像における推定領域６０４ｃの属性情報を推定する際に、記憶部４０８に記憶された位置情報から、すでに属性情報の推定がなされた人は処理対象から除外するようにしてもよい。

次に、Ｓ５０８において、属性推定部４０６が属性情報を推定していない推定領域が存在する場合（Ｓ５０８にて’Ｎｏ’）、Ｓ５０６およびＳ５０７における処理を繰り返す。本実施形態の場合、推定領域ＩＤ”２”、推定領域ＩＤ”３”、推定領域ＩＤ”４”、の順番でＳ５０６およびＳ５０７における処理を繰り返す。

次に、Ｓ５０８において、属性推定部４０６が属性情報を推定していない推定領域が存在しない場合（Ｓ５０８にて’Ｙｅｓ’）、処理を終了する。

以上のように、本実施形態では、複数の推定領域の各々について順次撮影されるよう撮影装置１０２を制御して、該複数の推定領域の各々に存在する人の属性情報を推定する。こうすることにより、属性推定が行えるように画角を変更しつつ、より広い範囲を対象として複数の人の属性推定を行うことが可能となる。

次に図８を参照し、本実施形態に係る画像処理の結果の出力を示す。図８は、本実施形態に係る画像処理の結果が、出力制御部４０７により表示装置１０１に出力された表である。

例えば、１０：００から１１：５９の時間において、図５に示すＳ５０７にて、属性推定部４０６が推定領域６０２ａにおける人に対して属性情報を推定した際、１人の人が２５歳の男性と推定されると、男性の２０〜２９にカウント数に１プラスされる。同様に、Ｓ５０７にて、属性推定部４０６が推定領域６０２ａにおける１人の人に対して３０歳の女性と推定した場合、女性の３０〜３９のカウント数に１がプラスされる。このように、図５に示すＳ５０７における処理において、人の属性情報を推定するたびに、表示装置１０１に表示されるグラフにリアルタイムでカウントをプラスしてもよい。また、図５に示す本実施形態に係る画像処理が終了したのち、属性情報の推定結果を表示装置１０１に出力するようにしてもよい。

なお、本実施形態では、所定の時間間隔において、属性推定部４０６が推定した属性情報毎に人の総数をグラフとして出力するが、これに限定されない。例えば、推定領域ＩＤ毎に、属性推定部４０６が推定した結果を集計してもよい。

また、所定の時間間隔において、属性推定部４０６が属性情報を推定した人の総数とともに、例えば、検出部４０３により検出された人の数も出力するようにしてもよい。これにより、ユーザーは検出部４０３により検出された人の人数に対して、何人の属性情報の推定がなされたかを把握することができる。なお、推定領域ＩＤ毎に、属性情報が推定された人数と検出部４０３により検出された人数とを表示されるようにしてもよい。

なお、本実施形態におけるＳ５０２にて、検出領域設定部４０１が、通信部４００を介して得られた画像内に検出領域を設定したのち、該検出領域を対象として撮影装置１０２の画角を変更するように撮影装置１０２が制御されてもよい。例えば、図６（ａ）に示す画像６００に対してユーザーが検出領域６０１を設定したのち、コマンド管理部４０５は、検出領域６０１が撮影装置１０２の撮影範囲に含まれるようにしつつ、撮影装置のズーム倍率を上げて画角を変更するようにしてもよい。こうすることにより、Ｓ５０３における検出部４０３による検出の精度をさらに向上させることが可能になる。

また、本実施形態では、推定領域ＩＤ“１”、“２”、“３”、“４”の順番で複数の推定領域を順次撮影するように撮影装置１０２を制御したが、これに限定されない。例えば、次のような処理を行ってもよい。

Ｓ５０３にて、検出部４０３は検出領域６０１に含まれる人の検出を行う際、人の顔を検出する顔検出を行い、さらに、人の属性情報を推定しやすいかの指標である検出スコアを人の顔領域ごとに出力する。なお、検出スコアが高いほど人の顔領域に対して属性情報が推定されやすいことを表しており、例えば、顔検出により得られた顔の向きが正面に近いほど検出スコアが高くなるように出力される。

Ｓ５０４にて、検出領域に複数の顔領域が存在する場合、検出領域に複数の人体が存在するとみなし、Ｓ５０５の処理へ移行する。Ｓ５０５にて、推定領域決定部４０４は、検出部４０３の結果に基づいて、検出部４０３により検出した複数の人のうち少なくとも１人を含む推定領域を複数決定する。さらに推定領域決定部４０４は、検出部４０３により出力された検出スコアを推定領域毎に合算する。

そして、推定領域毎に合算された検出スコアが高い順番に従って、複数の推定領域の各々についてＳ５０６およびＳ５０７の処理を行ってもよい。例えば、合算された検出スコアが推定領域ＩＤ“２”、“３”、“１”、“４”の順番で高い場合、該順番に従ってＳ５０６およびＳ５０７の処理が行われてもよい。このように、検出スコアの高い推定領域を優先して撮影するように撮影装置１０２を制御することで、正面を向いている人が多い推定領域に対して優先的に属性推定が実行され、効率的に属性情報を推定できるようになる。

また、複数の推定領域の各々についてＳ５０６およびＳ５０７の処理が行われる際、次のような順番で行われてもよい。

Ｓ５０３にて、検出部４０３は検出領域６０１に含まれる人の検出を行う際、人の顔を検出する顔検出を行い、さらに、検出スコアを人の顔領域ごとに出力する。

そして、合算された検出スコアが最も高い推定領域に対して、Ｓ５０６およびＳ５０７の処理を行う。このとき、推定領域ＩＤ“２”に対応する推定領域６０３ｂにて合算された検出スコアが最も高いと想定し、該推定領域に対してＳ５０６およびＳ５０７の処理が行われたものとする。

その後、コマンド管理部４０５は、検出領域６０１が撮影装置１０２の撮影範囲に含まれるようにして、画像を撮影するよう撮影装置１０２を制御する制御コマンドを生成する。生成された制御コマンドに基づいて撮影装置１０２が制御されたのち、検出部４０３は検出領域６０１に含まれる人の顔検出を再度行い、人の顔領域ごとに検出スコアを出力し直す。

そして、推定領域決定部４０４は、属性推定部４０６により属性情報が推定されていない推定領域を対象として、検出部４０３により出力された検出スコアを推定領域毎に再度合算する。この場合、推定領域決定部４０４は、推定領域ＩＤ“１”、“３”、“４”に対応する推定領域を対象として、検出スコアを推定領域毎に合算する。そして、合算された検出スコアが最も高い推定領域に対して、Ｓ５０６およびＳ５０７の処理を行う。

以上のように、検出領域における人の検出スコアが繰り返し出力されていくなか、検出スコアが出力されるたびに推定領域毎に検出スコアが合算され、合算された検出スコアが最も高い推定領域に対してＳ５０６およびＳ５０７の処理を行うようにしてもよい。このように、検出スコアの最も高い推定領域を優先して撮影するように撮影装置１０２を制御することで、正面を向いている人がより多い推定領域に対して優先的に属性推定が実行され、より効率的に属性情報を推定できるようになる。また、本実施形態では、図５に示すＳ５０８にて、属性推定部４０６が属性情報を推定していない推定領域が存在しない場合（Ｓ５０８にて‘Ｙｅｓ’）、処理を終了するとしたが、これに限定されない。推定領域決定部４０４により決定された複数の推定領域各々についてＳ５０６およびＳ５０７における処理を行った後、属性推定部４０６により属性情報が推定されなかった人が存在する推定領域に対して再度Ｓ５０６およびＳ５０７における処理を行ってもよい。例えば、推定領域ＩＤ”１”、”２”、”３”、”４”の順番でＳ５０６およびＳ５０７における処理を行った場合において、６人の人が存在する推定領域ＩＤ”２”の推定領域６０３ｂにおいて５人に対してのみ属性情報が推定された場合を想定する。このとき、再び推定領域ＩＤ”２”に対してＳ５０６およびＳ５０７における処理を行うようにする。こうすることにより、属性推定部４０６により属性情報を推定できない人がいた場合であっても、該人に対して属性推定部４０６により属性情報が再度推定されるようになる。

また、複数の推定領域の各々についてＳ５０６およびＳ５０７における処理を行った後、属性推定部４０６により属性情報が推定されなかった人を対象として、推定領域決定部４０４は、少なくとも１つの推定領域を再度決定するようにしてもよい。そして、推定領域決定部４０４により再度決定された少なくとも１つの推定領域の各々について、Ｓ５０６およびＳ５０７の処理を行うようにしてもよい。以下、図９および図１０を参照して、推定領域を再度決定する処理について更に詳細に説明する。

図９は、推定領域を再度決定する処理を示す一連のフローチャートである。なお、図９に示すフローチャートの処理は、主に図４に示す各機能ブロックにより実行される。また、図９に示すフローチャートの処理は、ＨＤＤ１２０２に格納されたコンピュータプログラムに従って画像処理装置１００のＣＰＵ１２００により実行される。以下、画像処理装置１００のＣＰＵ１２００により実行される処理について説明する。なお、図５と同一の機能である処理のステップには同一符号を付すとともに、機能的に変わらない処理のステップについては説明を省略する。Ｓ９０９において、検出部４０３により検出された人の全てに対して属性情報が推定されている場合（Ｓ９０９にて‘Ｙｅｓ’）、処理を終了する。Ｓ９０９において、検出部４０３により検出された複数の人すべてに対して属性情報が推定されてない場合（Ｓ９０９にて‘Ｎｏ’）、Ｓ９１０の処理を行う。

Ｓ９１０にて、推定領域決定部４０４は、検出部４０３における検出の結果に基づいて、検出部４０３により検出した複数の人のうち属性情報を推定できなかった人を少なくとも１人含む推定領域を少なくとも１つ決定する。なお、推定領域に含まれる人が、属性推定部４０６により属性情報を推定される対象となる。また、推定領域の位置に関する情報は記憶部４０８にて記憶される。以下図１０を参照して、推定領域決定部４０４が再度推定領域を決定する処理について更に詳細に説明する。

図１０は、Ｓ９１０の処理を説明するための図である。図１０（ａ）において、人１０００および人１００１は、推定領域ＩＤ”１”に対応する推定領域である領域６０２ａにおいて属性推定部４０６により属性情報が推定されなかった人である。人１００２は、推定領域ＩＤ”２”に対応する推定領域である領域６０３ｂにおいて属性推定部４０６により属性情報が推定されなかった人である。人１００３は、推定領域ＩＤ”４”に対応する推定領域である領域６０５ｄにおいて属性推定部４０６により属性情報が推定されなかった人である。

推定領域決定部４０４は、検出部４０３における検出の結果に基づいて、属性推定部４０６により属性情報が推定されなかった人物１０００〜１００３のうち少なくとも１人を含む推定領域を少なくとも１つ決定する。

図１０ｂにおける、範囲１００４は、属性推定部４０６が人１０００および人１００１に対して属性情報を推定するために最低限必要な顔領域の画素数を取得できるズーム倍率で撮影した場合の撮影範囲である。なお、範囲１００４は、検出部４０３が検出した人の顔領域の画素数に基づいて、推定領域決定部４０４により決定される。そして、推定領域決定部４０４は、範囲１００４内において範囲１００４の面積以下となり、かつ、人１０００および人１００１の少なくとも一人を含む領域を推定領域として決定する。この場合、範囲１００４に対応する推定領域として領域１００４ｂが決定される。なおこのとき、推定領域決定部４０４は、範囲１００４に対応する推定領域である領域１００４ｂに対して、推定領域ＩＤである“５”を付与する。

次に、推定領域決定部４０４は、範囲１００５を決定する。範囲１００５は、属性推定部４０６が人１００２および人１００３の属性情報を推定するために最低限必要な顔領域の画素数を取得できるズーム倍率で撮影した場合の撮影範囲である。そして、推定領域決定部４０４は、範囲１００５内において範囲１００５の面積以下となり、かつ、人１００２および人１００３のうち少なくとも１人を含む領域を推定領域として決定する。この場合、推定領域決定部４０４は、範囲１００５に対応する推定領域として領域１００５ｂが決定される。また、推定領域決定部４０４は、範囲１００５に対応する推定領域である領域１００５ｂに対して、推定領域ＩＤである“６”を付与する。

以上のように、推定領域決定部４０４は、検出部４０３における検出の結果に基づいて、属性推定部４０６により属性情報が推定されなかった人のうち少なくとも１人を含む推定領域を少なくとも１つ決定する。なお、推定領域決定部４０４は、検出領域６０１の左下から右方向へ走査するように推定領域を決定したが、これに限定されない。例えば、検出領域６０１の左上から右方向へ操作するように推定領域を決定してもよい。

そして、推定領域決定部４０４により再度決定された複数の推定領域の各々について、Ｓ５０６およびＳ５０７の処理を行う。こうすることにより、属性推定部４０６により属性情報を推定できない人がいた場合であっても、該人に対して属性推定部４０６により属性情報が再度推定されるようになる。なお、Ｓ９１０にて、推定領域４０４により再度決定される推定領域は１つであってもよい。

これまで、上述した本実施形態に係る画像処理は画像処理装置１００が行うとして説明したが、これに限定されない。本実施形態に係る画像処理装置１００の１以上の機能を、撮影装置１０２が有していてもよい。つまり、本実施形態では、画像処理装置１００のＣＰＵ１２００により本実施形態に係る画像処理が実行されたが、後述するクライアント装置および撮影装置１０２がそれぞれ有するＣＰＵにより実行されてもよい。

例えば、図４に示す、検出領域設定部４０１と、検出部４０３と、推定領域決定部４０４と、コマンド管理部４０５と、属性推定部４０６と、記憶部４０８は撮影装置１０２が有していてもよい。なお、このとき、操作受付部４０２と、出力制御部４０７は、図１２に示すハードウェア構成により実現されるクライアント装置１１００が有する。この場合について、図１１を参照して更に詳細に説明する。なお、図２〜４と同一の機能を有する構成には同一符号を付すとともに、機能的に変わらないものについては説明を省略する。

図１１は、画像処理装置１００の一部の機能を有する撮影装置１０２とクライアント装置１１００の機能ブロック図の一例である。撮影装置１０２とクライアント装置１１００は、ネットワーク１０４を介して通信が行われる。
画像処理部２０６で生成された画像データは、通信部２０９と通信部１１０１とを介してクライアント装置１１００における出力制御部４０７に送られる。出力制御部４０７は、例えば、撮影装置１０２から送られた画像データを表示装置１０１に出力する。なおこのとき、表示装置１０１はクライアント装置１１００に接続されているものとする。

検出領域設定部４０１は、生成された画像データにおいて、検出部４０３が処理を行う対象とする領域である検出領域を設定する。なお、クライアント装置１１００における操作受付部４０２を介して、ユーザーにより設定された画像内の領域を検出領域として設定してもよいし、事前に設定された所定の領域を検出領域としてもよい。なお、ユーザーによる検出領域の指示や、事前に設定された領域がなければ、画像データが示す画像全体を検出領域としてもよい。

クライアント装置１１００における操作受付部４０２は、マウス、キーボードなどの入力装置（不図示）を介して、ユーザーにより行われた操作を受け付ける。なお、操作受付部４０２が受け付けたユーザーによる操作の情報は、通信部１１０１と通信部２０９とを介して撮影装置１０２における検出領域設定部４０１へと送られる。

検出部４０３は、生成された画像データにおいて検出領域に含まれる人体の検出を行う。推定領域決定部４０４は、検出部４０３における検出の結果に基づいて、検出部４０３により検出した複数の人のうち少なくとも１人を含む推定領域を複数決定する。

コマンド管理部４０５は、推定領域決定部４０４において決定された複数の推定領域の各々について、順次撮影されるよう撮影装置１０２を制御するための制御コマンドを生成する。なお、コマンド管理部４０５にて生成された制御コマンドは、システム制御部２０７へ送られ、該制御コマンドに基づいて撮影装置１０２の制御が行われる。

属性推定部４０６は、撮影装置１０２から得られる撮影画像の各々に対して推定領域に存在する人の属性情報を推定する。記憶部４０８は、検出領域や推定領域の位置に関する情報などを記憶する。

画像処理の出力の結果（例えば、図８に示す表など）は、通信部２０９および通信部１１０１を介して、撮影装置１０２からクライアント装置１１００へと送られる。なおこのとき、撮影装置１０２から送られた画像処理の出力の結果は、例えば、出力制御部４０７へと送られ、出力制御部４０７により表示装置１０１に出力されてもよい。

以上のように画像処理装置１００の１以上の機能は、撮影装置１０２が有していてもよい。

なお、本発明は、上述の実施形態の１以上の機能を実現するプログラムを１つ以上のプロセッサが読出して実行する処理でも実現可能である。プログラムは、ネットワーク又は記憶媒体を介して、プロセッサを有するシステム又は装置に供給するようにしてもよい。また、本発明は、上述の実施形態の１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。また、画像処理装置１００または撮影装置１０２の各部は、図１２に示すハードウェアにより実現してもよいし、ソフトウェアにより実現することもできる。

４００通信部
４０１検出領域設定部
４０２操作受付部
４０３検出部
４０４推定領域決定部
４０５コマンド管理部
４０６属性推定部

Claims

撮影手段により撮影された画像に含まれる複数の人を検出する検出手段と、
前記検出手段の結果に基づいて、前記検出手段により検出した前記複数の人のうち少なくとも１人を含む領域を複数決定する決定手段と、
前記決定手段により決定された複数の領域の各々について、順次撮影されるよう前記撮影手段を制御する制御手段と、
前記制御手段により制御された前記撮影手段から得られる撮影画像から前記領域に存在する人の属性情報を推定する推定手段とを有し、
前記制御手段は、前記領域が前記撮影手段の撮影範囲に含まれ、かつ、該領域に存在する人の前記属性情報を前記推定手段が推定できる撮影条件になるよう前記撮影手段を制御することを特徴とする画像処理装置。
前記制御手段は、前記撮影手段のパン、チルト、ズームの少なくともいずれか一つを制御することを特徴とする制御手段であって、
前記撮影条件は、前記撮影手段のズーム倍率が、前記領域に存在する人の前記属性情報を前記推定手段が推定するために最低限必要なズーム倍率以上であることを特徴とする請求項１に記載の画像処理装置。
前記属性情報は、人の年齢に関する情報、または、人の性別に関する情報のうち少なくとも１つを含むことを特徴とする請求項１または２に記載の画像処理装置。
前記制御手段は、前記撮影手段の撮影範囲の重心と前記領域の重心とが略同一となるよう前記撮影手段を制御することを特徴とする請求項１乃至３のいずれか１項に記載の画像処理装置。
前記検出手段が複数の人を検出する対象となる画像内の領域である検出領域を設定する設定手段を更に備えることを特徴とする請求項１乃至４のいずれか１項に記載の画像処理装置。
前記検出領域は、ユーザーにより設定された画像内の領域であることを特徴とする請求項５に記載の画像処理装置。
前記制御手段は、前記検出領域が前記撮影手段の撮影範囲に含まれつつ、前記撮影手段のズーム倍率を上げるよう前記撮影手段を制御し、
前記検出手段は、前記制御手段により制御された前記撮影手段により撮影された画像における前記検出領域に含まれる複数の人を検出することを特徴とする請求項５または６に記載の画像処理装置。
前記決定手段は、前記検出手段により検出された複数の人各々の顔領域の画素数に基づいて、前記検出手段により検出した前記複数の人のうち少なくとも１人を含む領域を複数決定することを特徴とする請求項１乃至７のいずれか１項に記載の画像処理装置。
前記決定手段は、前記推定手段により前記属性情報を推定できなかった複数の人のうち少なくとも１人を含む領域を少なくとも１つ決定し、
前記制御手段は、前記決定手段により決定された少なくとも１つの領域の各々について、順次撮影されるよう前記撮影手段を制御し、
前記推定手段は、前記制御手段により制御された前記撮影手段から得られる撮影画像から前記領域に存在する人の前記属性情報を推定し、
前記制御手段は、前記領域が前記撮影手段の撮影範囲に含まれ、かつ、該領域に存在する人の前記属性情報を前記推定手段が推定できるズーム倍率になるよう前記撮影手段を制御することを特徴とする請求項１乃至８のいずれか１項に記載の画像処理装置。
画像を撮影する撮影手段と、
前記撮影手段により撮影された画像に含まれる複数の人を検出する検出手段と、
前記検出手段の結果に基づいて、前記検出手段により検出した前記複数の人のうち少なくとも１人を含む領域を複数決定する決定手段と、
前記決定手段により決定された複数の領域の各々について、順次撮影されるよう前記撮影手段を制御する制御手段と、
前記制御手段により制御された前記撮影手段から得られる撮影画像から前記領域に存在する人の属性情報を推定する推定手段とを有し、
前記制御手段は、前記領域が前記撮影手段の撮影範囲に含まれ、かつ、該領域に存在する人の前記属性情報を前記推定手段が推定できる撮影条件になるよう前記撮影手段を制御することを特徴とする撮影装置。
撮影手段により撮影された画像に含まれる複数の人を検出する検出工程と、
前記検出工程の結果に基づいて、前記検出工程により検出した前記複数の人のうち少なくとも１人を含む領域を複数決定する決定工程と、
前記決定工程により決定された複数の領域の各々について、順次撮影されるよう前記撮影手段を制御する制御工程と、
前記制御工程により制御された前記撮影手段から得られる撮影画像から前記領域に存在する人の属性情報を推定する推定工程とを有し、
前記制御工程は、前記領域が前記撮影手段の撮影範囲に含まれ、かつ、該領域に存在する人の前記属性情報を前記推定工程が推定できる撮影条件になるよう前記撮影手段を制御することを特徴とする画像処理方法。
撮影手段により撮影された画像に含まれる複数の人を検出する検出手段と、
前記検出手段の結果に基づいて、前記検出手段により検出した前記複数の人のうち少なくとも１人を含む領域を複数決定する決定手段と、
前記決定手段により決定された複数の領域の各々について、順次撮影されるよう前記撮影手段を制御する制御手段と、
前記制御手段により制御された前記撮影手段から得られる撮影画像から前記領域に存在する人の属性情報を推定する推定手段とを有し、
前記制御手段は、前記領域が前記撮影手段の撮影範囲に含まれ、かつ、該領域に存在する人の前記属性情報を前記推定手段が推定できる撮影条件になるよう前記撮影手段を制御する制御手段として、コンピュータを機能させるためのプログラム。