JP7130375B2

JP7130375B2 - 画像処理装置、撮影装置、画像処理方法、およびプログラム

Info

Publication number: JP7130375B2
Application number: JP2018003816A
Authority: JP
Inventors: 佳那子竹田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2018-01-12
Filing date: 2018-01-12
Publication date: 2022-09-05
Anticipated expiration: 2038-01-12
Also published as: JP2019125058A

Description

本発明は、画像処理技術に関するものである。

従来、画像から人等の特定の物体を検出する技術があった。また、画像に含まれる物体が人等の特定の物体であることの確からしさを示す信頼度を算出する技術があった。特許文献１には、画像に写し出されている物体の検出の結果に対する信頼度を物体ごとに導出する旨の記載がある。また、従来、撮影した画像において、人等の特定の物体を検出しない範囲を設定する技術があった。特許文献２には、撮像した画像において、人体を検知しない非検知範囲を設定する旨の記載がある。

特開２０１５－２１９８７９特開２０１５－１５５８１５

しかし、特許文献１の構成では、特定の物体ではない物体が誤って特定の物体であると検出されてしまう場合があった。具体的には、ユーザーが検出しようとする対象である特定の物体を人物の顔としたとき、人物の顔が描かれたポスターなどが誤って人物の顔として検出されてしまう場合があった。

また、特許文献２の構成では、人体を検知しない非検知範囲において全く人体が検出されなくなってしまう。

そこで本発明は、特定の物体ではない物体が特定の物体であると検出されてしまう誤検出を抑制する範囲が設定される場合において、該範囲における検出すべき特定の物体に対し、特定の物体であると検出されなくなる可能性を低減することを目的としている。

上記課題を解決するために、本発明の画像処理装置は以下の構成を備える。すなわち、撮影手段により撮影された画像に含まれる特定の物体を検出する検出処理を行う検出手段と、ユーザーにより行われた前記画像に関する操作に対応する前記画像内の物体と、当該物体に対応する前記画像内における範囲である特定範囲とを決定する決定手段と、前記決定手段により決定された前記物体が前記特定の物体であると前記検出手段によって検出されることが抑制されるように、前記決定手段により決定された前記物体に対して行われた前記検出処理の結果に基づいて、前記特定範囲における前記検出処理を変更する変更手段と、を有し、前記検出手段は、前記画像に含まれる画像領域に前記特定の物体が含まれることの確からしさを示す信頼度を算出し、前記画像領域に前記特定の物体が含まれるかを判別する基準となる閾値と前記信頼度とを比較して、前記閾値より前記信頼度が大きい場合、前記信頼度に対応する前記画像領域に前記特定の物体が含まれると判別することで、前記画像から前記特定の物体を検出する。

本発明によれば、特定の物体ではない物体が特定の物体であると検出されてしまう誤検出を抑制する範囲が設定される場合において、該範囲における検出すべき特定の物体に対し、特定の物体であると検出されなくなる可能性を低減する。

第１の実施形態に係るシステム構成を示す図である。第１の実施形態に係る画像処理装置の機能ブロック図である。第１の実施形態に係る画像処理のフローチャートである。第１の実施形態に係る画像処理を説明するための図である。第２の実施形態に係る画像処理装置の機能ブロック図である第２の実施形態に係る画像処理のフローチャートである。第２の実施形態に係る画像処理を説明するための図である。第３の実施形態に係る画像処理のフローチャートである。第４の実施形態に係る撮影装置の外観図である。第４の実施形態に係る撮影装置の機能ブロック図である。第４の実施形態に係る画像処理のフローチャートである。第４の実施形態に係る位置座標について説明するための図である。各実施形態に係る画像処理装置の一部の機能を有する撮影装置とクライアント装置の機能ブロック図の一例である。各実施形態に係る画像処理装置のハードウェア構成を示す図である。

以下、添付図面を参照しながら本発明の実施形態について説明する。なお、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。

（第１の実施形態）
図１は、本実施形態に係るシステム構成を示す図である。画像処理装置１００は、後述する画像処理を実行する装置である。なお、画像処理装置１００は、例えば、後述する画像処理の機能を実現するためのプログラムがインストールされたパーソナルコンピュータなどによって実現される。

表示装置１０１は、画像処理装置１００に接続され、後述する画像処理により出力される画像やＵＩ（ｕｓｅｒｉｎｔｅｒｆａｃｅ）などをユーザーが閲覧するための表示装置である。撮影装置１０２は、画像を撮影する装置であり、例えば、ネットワークを介して撮影した画像データなどを送信できるネットワークカメラなどである。

記憶装置１０３は、撮影装置１０２で撮影された画像の画像データなどを記憶することができる装置である。また、画像処理装置１００、撮影装置１０２、および記憶装置１０３は、ネットワーク１０４を介して通信を行う。なお、本実施形態において、ネットワーク１０４は有線による通信を用いたネットワークでもよいし、無線による通信を用いたネットワークでもよい。

また、図１の構成では、撮影装置１０２により撮影された画像の画像データや記憶装置１０３にて記憶された画像データなどが画像処理装置１００に送信される。ただし、本実施形態はこれに限定されるものではない。例えば、撮影装置１０２で撮影された画像の画像データが、一旦他の外部装置のストレージデバイスに保存され、その後、他の外部装置により画像処理装置１００へ送信される構成であってもよい。

図２は、本実施形態に係る画像処理装置の機能ブロック図である。なお、図２に示す各機能ブロックは、ソフトウェアモジュールのみで実現されてもよいし、ハードウェアモジュールのみで実現されてもよい。また、ソフトウェアモジュールとハードウェアモジュールを複合させて実現されてもよい。

また、後述する画像処理において、本実施形態に係る画像処理装置によって、画像に含まれる特定の物体が検出される。特定の物体は、画像内からユーザーが検出しようとする対象である。なお、本実施形態における特定の物体は人物の顔として説明するが、これに限定されない。例えば、人物の頭・肩・腰・手足などの身体の一部、人物の全身、または車両などを特定の物体として後述する画像処理を実行してもよい。

通信部２０１は、撮影装置１０２により撮影された画像の画像データなどを受信する。なお、通信部２０１は、例えば、記憶装置１０３に記憶された画像データ、またはネットワーク１０４を介して他の外部装置のストレージデバイスから送信された画像データなどを受信してもよい。

検出部２０２は、算出部２０７と記憶部２０８と判別部２０９とを有し、画像に含まれる人物の顔を検出する検出処理を行う。

算出部２０７は、画像に含まれる画像領域に人物の顔が含まれることの確からしさを示す信頼度を算出する。なお、この信頼度の値が大きいほど、実際の人物の顔である確率が高いことを示す。

記憶部２０８は、算出部２０７で算出された、画像に含まれる画像領域に人物の顔が含まれることの確からしさを示す信頼度、当該画像領域の位置、および後述する閾値や特定範囲に関する情報などを記憶する。なお、本実施形態における画像領域や特定範囲の位置は、具体的には、受信した画像の左上の頂点を原点とするｘｙ座標で表される。

判別部２０９は、算出部２０７にて算出された信頼度と、画像領域に人物の顔が含まれるかを判別する基準となる閾値とを比較する。そして、閾値より信頼度が大きい場合、判別部２０９は、該信頼度に対応する画像領域に人物の顔が含まれると判別する。なお、初期段階における閾値は、画像の全体に設定されたものである。

出力制御部２０３は、判別部２０９によって人物の顔が含まれていると判別された画像領域の信頼度と、該画像領域の位置を示す検出枠と、各検出枠に対応する番号と、を通信部２０１で受信した画像に重畳させて、表示装置１０１に出力する。また、本実施形態における出力制御部２０３は、各検出枠に対応する番号ごとに選択項目を生成し、表示装置１０１に、生成された選択項目を含むリストも表示する。なお、画像領域の信頼度と、該画像領域の位置を示す検出枠と、各検出枠に対応する番号と、が重畳されて表示装置１０１に出力される画像は、静止画でもよいし、動画でもよい。

操作受付部２０４は、キーボードやマウスなどの入力装置（不図示）を介してユーザーにより行われた画像に関する操作を受け付ける。

範囲決定部２０５は、操作受付部２０４にて受け付けたユーザーによる操作に対応する画像内の物体と、当該物体に対応する画像内における範囲である特定範囲とを決定する。

検出処理変更部２０６は、範囲決定部２０５により決定された画像内の物体が人物の顔であると検出部２０２により検出されることが抑制されるように、該物体に対して行われた検出処理の結果に基づいて、特定範囲における検出処理を変更する。なお、本実施形態における検出処理変更部２０６は、特定範囲における範囲決定部２０５により決定された物体に対応する信頼度より閾値が大きくなるように、特定範囲における閾値を変更することで、特定範囲における検出処理を変更する。検出処理変更部２０６で変更された特定範囲での閾値、および、画像内の特定範囲の位置は記憶部２０８にて記憶される。

検出処理変更部２０６によって検出部２０２における検出処理が変更された後、記憶部２０８に記憶された情報に基づいて、通信部２０１にて受信される画像データに対する検出処理が検出部２０２により行われる。

次に、算出部２０７が行う処理について更に詳細に説明する。本実施形態における算出部２０７は、通信部２０１で受信された画像内を、予め設定されているテンプレートで走査し、各画像領域の画素とテンプレートとの差分値を算出する。算出された差分値に基づいて、ＳＳＤ（ＳｕｍｏｆＳｑｕａｒｅｄＤｉｆｆｅｒｅｎｃｅ）やＳＡＤ（ＳｕｍｏｆＡｂｓｏｌｕｔｅＤｉｆｆｅｒｅｎｃｅ）を計算する。そして、これらＳＳＤやＳＡＤが小さくなるほど、画像領域毎のテンプレートとの一致度が高くなるように各画像領域の一致度を算出する。なお、本実施形態におけるテンプレートは、人物の顔の画像領域を検出するためのテンプレートであり、人物の頭部付近の形状に似た形状、および、人物の肌色に合わせたテンプレートである。よって、本実施形態における一致度は、画像領域に人物の顔が含まれることの確からしさを示す信頼度を表す。

なお、本実施形態におけるテンプレートを用いて、画像領域中の肌色成分を検出する際には、人種や照明光などの影響を考慮して、必ずしも一般的な肌色ではない色を含めてもよい。すなわち、受信した画像の画像領域とテンプレートとの比較の際には、人種や照明光などの影響を考慮した略肌色の領域を肌色領域とみなし、それら略肌色の領域が多ければ一致度を高くするようにしてもよい。

また、一致度は、肌色成分の領域の面積に応じた一致度に限定されない。例えば、受信した画像にエッジ検出フィルタ処理を施して、エッジ検出フィルタ処理後の各画像領域のエッジ成分以外の領域とテンプレートにおけるエッジ成分以外の領域との一致度であってもよい。また、一致度は、エッジ検出フィルタ処理を施した画像において、各画像領域のエッジ成分とテンプレートのエッジ成分との一致度であってもよい。また、受信した画像に対して予め適用する処理としては、エッジ検出フィルタ処理以外にも、輝度色差成分への色変換処理や、拡大縮小処理や回転処理であってもよく、この場合、それら処理後の画像とテンプレートの一致度を求める。なお、拡大縮小処理は、受信した画像における様々なサイズの人物の顔とテンプレートとを合わせるため、回転処理は、受信した画像において人物の顔の傾きとテンプレートとを合わせるために行われる。

また、拡大縮小処理や回転処理などは、受信した画像に対して施すのではなく、テンプレートに対して施すようにしてもよい。また、人物の顔の検出処理を実行する際に、テンプレートに対してそれら処理を施すのではなく、それら処理がなされた複数のテンプレート群を予め用意しておいてもよい。

なお、上述した処理は、複数のテンプレートを予め用意しておく場合だけでなく、予め保持していたテンプレートに対して幾何学変換処理を施すことで、複数のテンプレートを生成した場合にも適用可能である。

以上、本実施形態における算出部２０７の処理について、特定の物体を人物の顔であるとして説明を行ったが、これに限定されない。例えば、人物の頭・肩・腰・手足などの身体の一部、人物の全身、もしくは車両などを特定の物体としてもよく、その場合、それぞれの特定の物体に適したテンプレートを用いて本実施形態に係る画像処理を行えばよい。また、本実施形態では、テンプレートを用いた特定の物体の検出方法について述べたが、物体の検出方法はこの方法に限らない。例えば、局所特徴量と統計的解析手法を用いて人物の顔などを検出してもよい。具体的には、顔の局所的な明暗差から人物の顔であるかを判断する、Ｈａａｒ－ｌｉｋｅ特徴を用いた顔識別機によって、画像領域に人物の顔が含まれることの確からしさを示す信頼度を算出してもよい。

次に、第１の実施形態における画像処理について図３のフローチャートを参照して説明する。図３は、本実施形態に係る画像処理の流れを示すフローチャートである。図３に示すフローチャートの処理は、主に図２の各機能ブロックにより行われる。

ステップＳ３００にて、通信部２０１は、撮影装置１０２で撮影された画像の画像データや、記憶装置１０３にて記憶された画像データを、ネットワーク１０４を介して要求する。

次に、ステップＳ３０１にて、通信部２０１は要求した画像データを受信する。

次に、ステップＳ３０２にて、受信した画像データに対して、検出部２０２が画像に含まれる人物の顔を検出する検出処理を行う。ここで検出部２０２における検出処理について、図４を用いて、詳細に説明する。

図４（ａ）は、本実施形態における算出部２０７による信頼度の算出処理の結果を、通信部２０１にて受信した画像に示した図である。図４（ａ）において、領域４０１は、人物４０２の顔を含んでおり、算出された信頼度は７８ポイントである。鉢植え４０４における領域４０３に対して算出された信頼度は６０ポイントである。領域４０５は、人物４０６の顔を含んでおり、算出された信頼度は８５ポイントである。人物が映ったポスター４０８における領域４０７に対して算出された信頼度は８０ポイントである。このように、ポスター４０８に対応する領域４０７の信頼度は、人物４０２に対応する領域４０１の信頼度よりも高い数値となっており、領域４０７において人の顔を含んでいると検出されてしまうおそれがある。また、猫４１０における領域４０９に対して算出された信頼度は５５ポイントである。

算出部２０７で算出された、画像に含まれる画像領域の信頼度、および、当該画像領域の位置は記憶部２０８に記憶される。なお、本実施形態における画像領域の位置は、受信した画像の左上の頂点を原点とするｘｙ座標で表される。例えば、１９２０×１０８０ピクセルの解像度を想定すると、図４（ａ）における領域４０１の位置は、領域４０１における４つの頂点の座標、（１００，１４０）と、（４２０，１４０）と、（１００，４１０）と、（４２０，４１０）と、で定められる。

判別部２０９は、算出部２０７にて算出された信頼度と、画像全体に設定されている初期段階の閾値とを比較する。そして、閾値より信頼度が大きい場合、該信頼度に対応する画像領域に人物の顔が含まれると判別する。

画像の全体に設定されている初期段階での閾値は、本実施形態においては事前に設定された値の６９ポイントとする。よって、図３に示すステップＳ３０２の段階では、図４（ａ）における領域４０１、領域４０５、領域４０７が、人物の顔を含む領域であると判別される。なお、ステップＳ３０２の段階では、ポスター４０８における領域４０７が、人物の顔を含むと判別されているが、後述するステップＳ３０３～Ｓ３０７のステップを経て、領域４０７は、人物の顔を含む領域であると判別されなくなる。また、本実施形態では、画像の全体に設定された閾値を事前に設定された値としたが、これに限定されない。例えば、領域４０１と、領域４０３と、領域４０５と、領域４０７と、領域４０９にそれぞれ対応する信頼度を出力制御部２０３により通信部２０１で受信した画像に重畳させて、表示装置１０１に表示させる。そして、表示された各領域に対応する各信頼度をユーザーが確認しつつ、ユーザーが任意に閾値を設定してもよい。これにより、画像の全体に設定される閾値をより最適な値にすることができる。以上説明したように、検出部２０２は画像から人物の顔を検出する検出処理を行う。

次に、図３に示す本実施形態に係る画像処理のフローチャートの説明に戻る。ステップＳ３０３にて、出力制御部２０３は、人物の顔が含まれていると判別された画像領域の信頼度と、該画像領域の位置を示す検出枠と、各検出枠に対応する番号と、を通信部２０１で受信した画像に重畳させて、表示装置１０１に出力する。また、本実施形態における出力制御部２０３は、各検出枠に対応する番号ごとに選択項目を生成し、表示装置１０１に、生成された選択項目を含むリストも表示する。これにより、ステップＳ３０２において検出部２０２により人物の顔であると検出された物体の中から、人物の顔であると検出すべきではなかった物体を、ユーザーは容易に確認しつつ選択することができる。なお、画像領域の信頼度と、該画像領域の位置を示す検出枠と、各検出枠に対応する番号と、が重畳されて表示装置１０１に出力される画像は、静止画でもよいし、動画でもよい。

図４（ｂ）は、出力制御部２０３の処理に基づいて出力された画像である。また、本実施形態において、検出枠４０１ｂは、領域４０１に対応する枠であり、対応する番号は（１）である。検出枠４０５ｂは、領域４０５に対応する枠であり、対応する番号は（２）である。検出枠４０７ｂは、領域４０７に対応する枠であり、対応する番号は（３）である。また、リスト４２０ｂにおいて、各検出枠に対応する番号ごとに生成された選択項目が表示されている。

選択項目４１１ｂは、番号（１）の検出枠４０１ｂに対応する。選択項目４１５ｂは、番号（２）の検出枠４０５ｂに対応する。選択項目４１７ｂは、番号（３）の検出枠４０７ｂに対応する。なお、ポイントという表記について、種々の変更が可能である。例えば、値を表示せずに信頼度を低・中・高などと表示してもよい。また、本実施形態では信頼度を画像中に表記しているが、表記しなくてもよい。

次に、ステップＳ３０４にて、操作受付部２０４は、キーボードやマウスなどの入力装置（不図示）を介してユーザーにより行われた操作を受け付ける。

次に、ステップＳ３０５にて、範囲決定部２０５は、ステップ３０４にて受け付けたユーザーによる操作に対応する画像内の物体と、当該物体に対応する特定範囲とを決定する。以下、本実施形態における操作受付部２０４および範囲決定部２０５の処理について更に詳細に説明する。

本実施形態における操作受付部２０４は、ユーザーによるリスト４２０ｂから選択項目のいずれかを選択する操作を受け付ける。ここでは、ユーザーによって選択項目４１７ｂが選択されたものとする。その場合、範囲決定部２０５は、操作受付部２０４にて受け付けたユーザーの操作に基づいて、ポスター４０８に対応する領域４０７に含まれる物体を、ユーザーによる操作に対応する物体として決定する。つまり、領域４０７に含まれるポスター４０８に描かれた人物の顔部分がユーザーによる操作に対応する物体として決定される。このとき、出力制御部２０３は、領域４０７に対応する検出枠４０７ｂの色を変更し、ユーザーによる操作に対応する物体が決定されたことを、ユーザーが視認できるようにしてもよい。なお、ここでの物体は、現段階において、閾値を上回る信頼度の画像領域に含まれる物体である。

そして、図４（ｃ）に示される、領域４０７に含まれる該物体に対応する特定範囲４０７ｃを決定する。なお、図４（ｃ）は、範囲決定部２０５により決定された特定範囲４０７ｃを画像中に示した図である。また、本実施形態において、範囲決定部２０５により決定される特定範囲４０７ｃは、領域４０７を包含し、かつ、領域４０７の面積より大きな範囲とする。ただし、特定範囲４０７ｃは、領域４０７と同じ範囲でもよいし、特定の物体の範囲に沿った範囲でもよい。また、出力制御部２０３は、通信部２０１で受信した画像に特定範囲４０７ｃを示す枠を重畳させて、表示装置１０１に出力してもよい。これにより、ユーザーは特定範囲４０７ｃを視認することができる。

なお、本実施形態において、操作受付部２０４は、ユーザーによるリスト４２０ｂから選択項目のいずれかを選択する操作を受け付けるとしたが、これに限定されない。例えば、操作受付部２０４は、検出枠４０１ｂ、４０５ｂ、４０７ｂが重畳された画像において、ユーザーが画像内の一点をマウスで指定した操作などを受け付けてもよい。これにより、ステップＳ３０２において検出部２０２により人物の顔であると検出された物体の中から、人物の顔であると検出すべきではなかった物体を、ユーザーは容易に確認しつつ選択することができる。なお、この場合、範囲決定部２０５は、ユーザーが指定した画像内の一点から最も近い距離にある物体を、ユーザーの操作に対応する物体であると決定する。

そして、当該物体に対応する特定範囲を決定する。本実施形態の場合、ユーザーが検出枠４０７ｂの近くの点を指定した情報をもとに、範囲決定部２０５は、ポスター４０８に対応する領域４０７に含まれる物体を、ユーザーによる操作に対応する物体として決定する。つまり、領域４０７に含まれるポスター４０８に描かれた人物の顔部分が、ユーザーによる操作に対応する物体として決定される。このとき、出力制御部２０３は、領域４０７に対応する検出枠４０７ｂの色を変更してもよい。これより、ユーザーによる操作に対応する物体が決定されたことを、ユーザーが視認できる。

そして、範囲決定部２０５は、領域４０７に含まれる該物体に対応する特定範囲４０７ｃを決定する。なお、範囲決定部２０５により決定される特定範囲４０７ｃは、領域４０７を包含し、かつ、領域４０７の面積以上の範囲とする。ただし、特定範囲４０７ｃは、領域４０７と同じ範囲でもよいし、特定の物体の範囲に沿った範囲でもよい。また、出力制御部２０３は、通信部２０１で受信した画像に特定範囲４０７ｃを示す枠を重畳させて、表示装置１０１に出力してもよい。

また、本実施形態において、操作受付部２０４は、ユーザーが画像内における任意の範囲の選択（以下、範囲選択）をおこなっていれば、その範囲の情報を受け取ってもよい。本実施形態の場合、ユーザーによって範囲選択された範囲に含まれ、かつ、ステップＳ３０２において人物の顔を含んでいると判別されている領域４０７に含まれる物体を、範囲決定部２０５は、ユーザーの操作に対応する物体であると決定する。そして、範囲決定部２０５は、領域４０７に含まれる物体に対応する特定範囲４０７ｃを決定する。なお、ユーザーによって範囲選択された範囲そのものを特定範囲としてもよい。

次に、ステップＳ３０６にて、検出処理変更部２０６は、画像の全体に設定された閾値を、特定範囲を対象として、特定範囲における範囲決定部２０５により決定された物体に対応する信頼度より高い値に変更することで、特定範囲における検出処理を変更する。

本実施形態の場合、ステップＳ３０５にて範囲決定部２０５により決定された物体に対応する領域４０７の信頼度は８０ポイントである。そのため、検出処理変更部２０６は、特定範囲４０７ｃにおける閾値を８１ポイントとする。これより、ポスター４０８に対する検出部２０２による人物の顔の検出を抑制できる。なお、特定範囲４０７ｃに侵入した人物に対して算出された信頼度が８１ポイントより大きい（例えば、８５ポイント）場合、当該人物に対しては検出部２０２により人物の顔を検出することができる。以上、本実施形態では、範囲決定部２０５により決定された物体に対して行われた検出処理の結果に基づいて、特定範囲４０７ｃの閾値を変更した。これにより、特定範囲４０７ｃにおいて特定の物体の検出を全く行わないように検出処理を変更する場合と比較して、特定範囲４０７ｃにおいて、検出すべき人物の顔に対して、人物の顔であると検出されなくなる可能性を低減する。

なお、撮影装置１０２が撮影する領域において、照明などの環境の変化によっては、算出部２０７にて算出される信頼度に変動が生じる場合がある。例えば、ポスター４０８に当たる照明の明るさによって、ポスター４０８に対して算出部２０７により算出される信頼度が変化することがある。そこで、照明などの環境の変化によって生じる信頼度の変動を考慮して、ポスター４０８に対する人物の顔の検出をより抑制したいのであれば、特定範囲４０７ｃにおける閾値は次のように変更してもよい。すなわち、特定範囲４０７ｃにおける閾値を、領域４０７の信頼度（８０ポイント）より１ポイント大きい８１ポイントではなく、２ポイント以上大きい値、例えば、８５ポイントにしてもよい。

次に、ステップＳ３０７にて、検出処理変更部２０６によって変更された特定範囲における閾値、および、画像内の特定範囲の位置は記憶部２０８にて記憶される。なお、本実施形態における特定範囲の位置は、上述した画像領域の位置と同様に、受信した画像の左上の頂点を原点とするｘｙ座標で表される。

本実施形態では、検出処理変更部２０６で変更された特定範囲４０７ｃ内における閾値、そして画像内の特定範囲４０７ｃの位置に関する情報が記憶部２０８にて記憶される。検出処理変更部２０６によって検出部２０２における検出処理が変更された後、記憶部２０８に記憶された情報に基づいて、通信部２０１にて受信される画像データに対する検出処理が検出部２０２により行われる。これより、ポスター４０８に対して誤って人物の顔があると検出部２０２により検出されてしまう誤検出が抑制される。なお、検出処理変更部２０６の処理後、出力制御部２０３は、検出処理が行われた画像データを表示装置１０１に表示する以外に、例えば、検出処理後の画像データやその他の情報を記憶装置１０３に記憶してもよい。また、ネットワーク１０４を介して、他の外部装置のストレージデバイスに保存してもよい。

また、本実施形態において、通信部２０１で受信した一枚の画像に対して信頼度の算出が行われたが、これに限定されるものではない。例えば、算出部２０７において画像内の各物体の信頼度を算出する処理を、異なる時間で撮影された複数の画像に対して行ってもよい。この場合、例えば、ポスター４０８に対する信頼度は、複数の画像にわたって複数回算出される。そして、検出処理変更部２０６は、例えば、算出された複数の信頼度の中で一番大きい値を閾値が超えるように、特定範囲内における閾値を変更すればよい。

また、本実施形態における上述した画像処理は、通信部２０１で受信した画像内において特定範囲を１つ設定したが、設定される特定範囲は複数でもよい。例えば、本実施形態において、画像の全体に設定されている初期段階での閾値が５０ポイントである場合を考える。このとき、図３に示すステップＳ３０２の段階では、図４（ａ）における領域４０１、領域４０３、領域４０５、領域４０７、領域４０９が、人物の顔を含む領域であると判別される。この場合、ユーザーの操作に基づいて、範囲決定部２０５は、領域４０３と領域４０７と領域４０９のそれぞれに含まれる各物体をユーザーの操作に対応する物体として決定する。また、範囲決定部２０５は、各領域に含まれる各物体にそれぞれ対応する特定範囲を決定する。そして、各特定範囲において範囲決定部２０５により決定された各物体が人物の顔であると検出部２０２により検出されることが抑制されるように、各特定範囲における検出処理を検出処理変更部２０６により変更すればよい。なお本実施形態に係る検出処理変更部２０６は、画像全体に設定された初期段階の閾値を、特定範囲を対象として、特定範囲における範囲決定部２０５により決定された物体に対応する信頼度より高い値に変更することで、特定範囲における検出処理を変更する。よって、領域４０３に含まれる物体に対応する特定範囲における閾値を６１ポイント、領域４０７に含まれる物体に対応する特定範囲における閾値を８１ポイント、領域４０９に含まれる物体に対応する特定範囲における閾値を５６ポイントに変更すればよい。

以上、図３のフローチャートに示される本実施形態における画像処理の後、記憶部２０８に記憶された情報に基づいて、通信部２０１にて受信される画像データに対する検出処理が検出部２０２により行われる。このとき、ポスター４０８に対して、検出部２０２によって人物の顔が存在すると検出されることが抑制される。

以上説明したように、本実施形態の構成によれば、範囲決定部２０５により決定された物体に対して行われた検出処理の結果に基づいて、特定範囲４０７ｃにおける検出処理を変更した。これにより、人物の顔ではない物体が誤って人物の顔であると検出されてしまう誤検出を抑制する範囲である特定範囲が設定される場合において、特定範囲において検出すべき人物の顔に対して、人物の顔であると検出されなくなる可能性を低減する。なお、ポスター４０８に関する誤検出だけではなく、マネキン等の特定の物体に形状が似ている任意の物体に関する誤検出を抑制することができる。

（第２の実施形態）
第２の実施形態では、特定範囲に動体が侵入している場合、特定範囲において変更されていた検出処理を変更前に戻す実施形態について説明する。これにより、特定の物体ではない物体が誤って特定の物体であると検出されてしまう誤検出を抑制する特定範囲が設定される場合において、特定範囲において検出すべき特定の物体に対して、特定の物体であると検出されなくなる可能性をより低減する。以下、第１の実施形態と異なる部分を主に説明し、第１の実施形態と同様な部分については、適宜、省略する。

図５は、第２の実施形態に係る画像処理装置の機能ブロック図であり、図２に示した機能ブロック図に動体検出部５０１と侵入判定部５０２とが加えられている。

動体検出部５０１は、通信部２０１にて受信した画像の画像データから、動体検出を行う。なお、動体検出処理は事前に背景画像を設定し、背景差分処理を行って、動体（前景）を検出する処理であってもよいし、前フレームと現在のフレームとの間差分処理を行って、動体を検出する処理でもよい。なお、以下の説明において、背景差分処理によって検出された前景のことも動体と称することとする。

侵入判定部５０２は、範囲決定部２０５により決定された特定範囲の位置と、動体検出部５０１で検出された動体の位置から、特定範囲に動体が侵入しているかを判定する。

侵入判定部５０２において、特定範囲に動体が侵入していると判定された場合、検出処理変更部２０６は、検出処理変更部２０６によって特定範囲において変更されていた検出処理を変更前に戻す。

また、侵入判定部５０２において、特定範囲に動体は侵入していないと判定された場合、検出処理変更部２０６は、特定範囲における検出処理を、検出処理変更部２０６によって特定範囲において変更されていた検出処理にする。

以上の処理が行われたのち、通信部２０１にて受信された画像データに対して検出処理が検出部２０２により行われる。以下、図６に示すフローチャートを参照して、本実施形態について更に詳細に説明する。

図６は、第２の実施形態に係る画像処理のフローチャートである。図に示すフローチャートの処理は主に図５の各機能ブロックにより行われる。

次に、ステップＳ３０１にて、通信部２０１は、要求した画像データを受信する。

次に、ステップＳ６０２にて、動体検出部５０１がＳ３０１で受信した画像データに対して動体検出を行う。動体が検出された場合（Ｓ６０２においてＹｅｓ）、該動体の位置を侵入判定部５０２へ送る。なお、本実施形態における動体の位置は、受信した画像の左上の頂点を原点としたときのｘｙ座標で表される。

次に、ステップＳ６０３にて、侵入判定部５０２は、範囲決定部２０５で決定された特定範囲の位置と、動体検出部５０１で検出された動体の位置の情報から、特定範囲に動体が侵入しているかを判定する。以下図７を参照して、侵入判定部５０２の処理について更に詳細に説明する。

図７は、画像内における特定範囲と動体検出部５０１により検出された動体とを示す図である。図７における特定範囲４０７ｃは、範囲決定部２０５にて決定された特定範囲である。動体７０３は、特定範囲４０７ｃに侵入した人物である。領域７０４は、検出された動体７０３の位置を示す。なお、画像全体に設定された初期段階での閾値は６９ポイント、検出処理変更部２０６により変更されていた特定範囲４０７ｃにおける閾値は８１ポイントである。

本実施形態における侵入判定部５０２は、図７に示す、特定範囲４０７ｃと領域７０４とで重なる領域がある場合に特定範囲に動体が侵入していると判定する。しかし、本実施形態は、これに限定されない。例えば、特定範囲４０７ｃと領域７０４とで重なる面積が、特定範囲４０７ｃの面積に対して所定の割合（例えば、２０％）以上だった場合、特定範囲４０７ｃに動体が侵入していると判定してもよい。

次に、ステップＳ６０３にて、侵入判定部５０２により特定範囲に動体が侵入していると判定された場合（Ｓ６０３においてＹｅｓ）、ステップＳ６０４の処理を行う。Ｓ６０４にて、検出処理変更部２０６は、検出処理変更部２０６によって特定範囲において変更されていた検出処理を変更前に戻す。本実施形態の場合、検出処理変更部２０６は、特定範囲４０７ｃにおける閾値を、検出処理変更部２０６により変更されていた特定範囲４０７ｃにおける閾値（８１ポイント）から、初期段階の画像全体に設定されていた閾値（６９ポイント）にする。ここでの処理を経て変更された閾値は記憶部２０８にて記憶される。これより、例えば、動体７０３が特定範囲４０７ｃに侵入している際、算出部２０７により算出された動体７０３における顔の領域の信頼度が７８ポイントであるとしても、検出部２０２は動体７０３に対して人物の顔があると検出する。

次に、ステップＳ６０３にて、侵入判定部５０２により特定範囲に動体が侵入していないと判定された場合（ステップＳ６０３においてＮｏ）、ステップＳ６０５の処理を行う。ステップＳ６０５にて、検出処理変更部２０６は、特定範囲における検出処理を、検出処理変更部２０６により特定範囲において変更されていた検出処理にする。本実施形態の場合、検出処理変更部２０６は、特定範囲４０７ｃにおける閾値を、図３に示す画像処理のフローを経て、検出処理変更部２０６により変更されていた特定範囲４０７ｃにおける閾値（８１ポイント）にする。ここでの処理を経て変更された閾値は記憶部２０８に記憶される。これより、特定範囲４０７ｃに動体が侵入していないとき、ポスター４０８に対して人物の顔があると検出部２０２により検出されることが抑制される。Ｓ６０２～Ｓ６０５の処理を経たのち、通信部２０１にて受信された画像データに対する検出処理が検出部２０２により行われる。

なお、本実施形態における上述した画像処理は、通信部２０１で受信した画像内において特定範囲が１つである場合を想定したが、画像内における特定範囲が複数あってもよい。この場合、画像内に存在する複数の特定範囲のそれぞれに対して、ステップＳ６０３～ステップＳ６０５の処理を行えばよい。例えば、画像内に特定範囲ａと特定範囲ｂと特定範囲ｃがある場合を想定する。このとき、ステップＳ６０３にて、侵入判定部５０２は、各特定範囲の位置と、動体検出部５０１で検出された動体の位置の情報から、各特定範囲に動体が侵入しているかを判定する。そして、例えば、特定範囲ａに動体が侵入していると判定された場合、Ｓ６０４にて、検出処理変更部２０６は、検出処理変更部２０６により特定範囲ａにおいて変更されていた検出処理を変更前に戻す。

以上説明したように、本実施形態における構成では、特定範囲に動体が侵入している場合、検出処理変更部２０６により変更されていた特定範囲における検出処理を変更前に戻すようにした。これより、人物が特定範囲に侵入している場合でも、特定範囲以外に設定されている検出処理の条件に基づいて人物の顔を検出することができる。よって、本実施形態における構成によれば、人物の顔ではない物体が誤って人物の顔であると検出されてしまう誤検出を抑制する特定範囲が設定される場合において、特定範囲における人物の顔に対して、人物の顔であると検出されなくなる可能性をより低減する。なお、特定範囲に動体が侵入している場合、検出処理変更部２０６により変更されていた特定範囲における検出処理を変更前と同じ状態にしなくてもよい。例えば、検出処理変更部２０６は、特定範囲に動体が侵入している場合、変更前の閾値に近づくように特定範囲の閾値を変更してもよい。

（第３の実施形態）
第１の実施形態および第２の実施形態では、特定範囲内における閾値を変更することで、検出処理を変更する構成について説明した。本実施形態では、特定範囲における範囲決定部により決定された物体に対応する信頼度が、画像全体に設定された閾値より小さくなるように、特定範囲において算出される信頼度を変更することで、特定範囲における検出処理を変更する構成について説明する。以下、他の実施形態と異なる部分を主に説明し、他の実施形態と同様な部分については、適宜、省略する。

第３の実施形態において、図２に示す通信部２０１が画像データを受信してから、範囲決定部２０５が特定範囲を決定するまでの処理は、第１の実施形態と同様のため説明を省略する。

検出処理変更部２０６は、特定範囲における範囲決定部２０５により決定された物体に対応する信頼度が、画像全体に設定された閾値より小さくなるように、特定範囲において算出される信頼度を変更することで、特定範囲における検出処理を変更する。

検出処理変更部２０６の処理後、通信部２０１にて受信される画像の検出処理が行われていく。このとき、ポスター４０８における領域４０７は、人物の顔を含むと判別部２０９にて判別されることが抑制される。つまり、ポスター４０８に対して人物の顔が存在すると検出部２０２により検出されることが抑制される。次に、第３の実施形態における画像処理の流れを図８に示すフローチャートを参照して、更に詳細に説明する。

図８は、第３の実施形態に係る画像処理のフローチャートである。図に示すフローチャートの処理は主に図２の各機能ブロックにより行われる。

ステップＳ３００～ステップＳ３０５までのステップは、第１の実施形態と同様であるため説明を省略する。

ステップＳ８０６にて、検出処理変更部２０６は、特定範囲における範囲決定部２０５により決定された物体の信頼度が、画像領域全体に設定された初期段階の閾値より小さくなるように、特定範囲において算出される信頼度を変更する。なお、本実施形態における検出処理変更部２０６は、特定範囲における算出部２０７による信頼度の算出方法を変更することで、特定範囲において算出される信頼度を変更する。

図４を参照して、本実施形態における検出処理変更部２０６の処理について更に詳細に説明する。検出処理変更部２０６は、特定範囲４０７ｃにおいて範囲決定部２０５により決定された物体の信頼度が、画像全体に設定されている閾値（６９ポイント）より小さくなるように算出部２０７の算出方法を変更する。なお、本実施形態において、ステップＳ３０５にて範囲決定部２０５により決定された物体に対応する領域４０７の信頼度は８０ポイントであり、画像全体に設定された閾値は６９ポイントである。よって、特定範囲４０７ｃにて算出される信頼度は１２ポイント減算されるようにする。以上より、範囲決定部２０５により決定された物体に対応する領域４０７の信頼度は６８ポイントとなり、画像全体に設定された閾値（６９ポイント）より小さくなる。ここでは、ステップＳ３０２にて算出された領域４０７の信頼度（８０ポイント）と、画像全体に設定された閾値（６９ポイント）との差分の絶対値（１１ポイント）に１ポイント加えた値が、特定範囲４０７ｃにて算出された信頼度から減算されるようにした。しかし、本実施形態は、これに限定されない。例えば、特定範囲４０７ｃにて算出される信頼度に対して、６８／８０を掛けた値が算出されるようにしてもよい。これより、範囲決定部２０５により決定された物体に対応する領域４０７の信頼度は６８ポイントとなり、画像全体に設定された閾値（６９ポイント）より小さくなる。

なお、本実施形態において、ステップＳ３０２において算出された領域４０７の信頼度（８０ポイント）が、画像全体に設定された閾値（６９ポイント）より１ポイント小さくなるように、特定範囲における算出部２０７による信頼度の算出方法を変更した。このとき、ポスター４０８における検出部２０２による人物の顔の検出を抑制できる。また、例えば、特定範囲４０７ｃにて算出される信頼度は１２ポイント減算されるようにする場合、特定範囲４０７ｃに侵入した人物の信頼度が８５ポイントであるとすると、当該人物に対しては検出部２０２により人物の顔を検出することができる。以上、本実施形態では、範囲決定部２０５により決定された物体に対して行われた検出処理の結果に基づいて、特定範囲４０７ｃにおいて算出される信頼度を変更する。これにより、特定範囲４０７ｃにおいて人物の顔の検出を全く行わないように検出処理を変更する場合と比較して、特定範囲４０７ｃにおいて、検出すべき人物の顔に対して、人物の顔であると検出されなくなる可能性を低減する。

なお、撮影装置１０２が撮影する領域において、照明などの環境の変化によっては、算出部２０７にて算出される信頼度に変動が生じる場合がある。そこで、照明などの環境の変化によって生じる信頼度の変動を考慮して、ポスター４０８に対する人物の顔の検出をより抑えたいのであれば、特定範囲における算出部２０７による信頼度の算出方法は、例えば、次のように変更してもよい。すなわち、ステップＳ３０２において算出された領域４０７の信頼度（８０ポイント）が、画像全体に設定された閾値（６９ポイント）より２ポイント以上小さくなるように、特定範囲における算出部２０７による信頼度の算出方法を変更してもよい。

また、本実施形態において、算出部２０７により算出された、ポスター４０８に対応する領域４０７が特定範囲４０７ｃに包含されたとき、算出方法を変更するようにしたが、これに限定されない。例えば、特定範囲４０７ｃと領域４０７とで重なる領域の面積が、領域４０７の面積に対して一定の割合（例えば、８０％）以上である場合、領域４０７の信頼度が画像全体に設定された閾値を下回る値が算出されるようにしてもよい。

ステップＳ８０６にて特定範囲における算出部２０７の算出方法が変更された後、通信部２０１にて受信される画像の検出処理が検出部２０２により行われる。このとき、ポスター４０８における検出部２０２による人物の顔の誤検出を抑制できる。

以上説明したように、本実施形態の構成によれば、範囲決定部２０５により決定された物体に対して行われた検出処理の結果に基づいて、特定範囲４０７ｃにおける検出処理を変更する。これにより、人物の顔ではない物体が誤って人物の顔であると検出されてしまう誤検出を抑制する範囲が設定される場合において、該範囲において検出すべき人物の顔に対して、人物の顔であると検出されなくなる可能性を低減する。

（第４の実施形態）
本実施形態では、パンチルトズーム制御を行うことができる撮影装置によって撮影された画像に対する画像処理について説明する。以下、他の実施形態と異なる部分を主に説明し、他の実施形態と同様な部分については、適宜、省略する。

図９は、本実施形態に係る撮影装置１０２の外観図である。また、図１０は、本実施形態に係る撮影装置１０２の機能ブロック図である。

レンズ９０２の光軸の向く方向が撮影装置１０２の撮影方向であり、レンズ９０２を通過した光束は、撮影部９０５の撮像素子に結像する。なお、レンズ９０２は、フォーカスレンズ及びズームレンズ等からなる。また、レンズ駆動部９１０は、フォーカスレンズ及びズームレンズなどの駆動系により構成され、レンズ９０２の焦点距離を変更する。レンズ駆動部９１０は、パンチルトズーム制御部９０８により制御される。

パン駆動部９００は、パン動作を行うメカ駆動系及び駆動源のモータにより構成され、撮影装置１０２の撮影方向をパン方向９０３に変更するように駆動する。また、パン駆動部９００は、パンチルトズーム制御部９０８により制御される。

チルト駆動部９０１は、チルト動作を行うメカ駆動及び駆動源のモータにより構成され、撮影装置１０２の撮影方向をチルト方向９０４に変更するように駆動する。チルト駆動部９０１は、パンチルトズーム制御部９０８により制御される。

撮影部９０５は、ＣＣＤ（ｃｈａｒｇｅｃｏｕｐｌｅｄｄｅｖｉｃｅ）センサやＣＭＯＳ（ｃｏｍｐｌｅｍｅｎｔａｒｙｍｅｔａｌｏｘｉｄｅｓｅｍｉｃｏｎｄｕｃｔｏｒ）センサ等の撮像素子により構成される。そして、撮影部９０５は、レンズ９０２を通って結像された被写体像を光電変換して電気信号を生成する。

画像処理部９０６は、撮影部９０５において光電変換された電気信号をデジタル信号へ変換する処理や、圧縮符号化処理などを行い、画像データを生成する。

パンチルトズーム制御部９０８は、システム制御部９０７から伝達された指示に基づいて、パン駆動部９００、チルト駆動部９０１及びレンズ駆動部９１０の制御を行う。

通信部９０９は、画像処理装置１００との通信を行うインターフェースである。例えば、通信部９０９は、生成された画像データを画像処理装置１００に送信する。また、通信部９０９は、画像処理装置１００が送信するカメラ制御コマンドを受信し、システム制御部９０７へ伝達する。

システム制御部９０７は、撮影装置１０２の全体を制御し、例えば、次のような処理を行う。すなわち、システム制御部９０７は、通信部９０９から伝達されたカメラ制御コマンドを解析し、コマンドに応じた処理を行う。また、システム制御部９０７は、パンチルトズーム制御部９０８に対してパンチルトズーム動作の指示を行う。

また、システム制御部９０７は、画像処理部９０６で生成された画像データを画像処理装置１００に送る際に、該画像データを取得した際の撮影情報も画像データに付与する。なお、本実施形態における撮影情報は、パンチルトズーム制御部９０８等から取得される、撮影装置１０２のパン角度とチルト角度と、撮影装置１０２により撮影される画像の水平画角と垂直画角と、を示す情報を含む。

なお、パン角度は、パン駆動部９００の駆動端の一方を０°としたときの、撮影装置１０２のパン方向９０３における撮影方向（光軸）の角度である。また、チルト角度は、チルト駆動部９０１の駆動端の一方を０°としたときの、撮影装置１０２のチルト方向９０４における撮影方向（光軸）の角度である。なお、撮影装置１０２により撮影される画像の水平画角と垂直画角は、レンズ９０２の焦点距離から算出可能である。

次に、図２を参照して、本実施形態に係る画像処理について説明する。なお、以下の説明において第１の実施形態の説明に用いた図２を参照するが、第１の実施形態と異なり、本実施形態では、画像領域や特定範囲などの位置が球面座標上で定められる。通信部２０１は、撮影装置１０２により撮影された画像の画像データと撮影情報とを受信する。

検出部２０２は、通信部２０１で受信した画像に含まれる人物の顔を検出する検出処理を行う。このとき、記憶部２０８は、画像に含まれる画像領域に人物の顔が含まれることの確からしさを示す信頼度、当該画像領域の位置を記憶する。なお、本実施形態における画像領域の位置は、球面座標上にて、該画像領域の重心点におけるパン角度とチルト角度、および、該画像領域の垂直画角と水平画角により定められる。

出力制御部２０３と操作受付部２０４と範囲決定部２０５と検出処理変更部２０６における処理は、第１の実施形態と同様であるため説明を省略する。

記憶部２０８は、検出処理変更部２０６にて変更された特定範囲内における閾値と、画像内の特定範囲の位置とを記憶する。なお、本実施形態における特定範囲の位置は、球面座標上にて、特定範囲の重心点におけるパン角度とチルト角度、および、該特定範囲の垂直画角と水平画角により定められる。

検出処理変更部２０６によって検出部２０２での検出処理が変更された後、記憶部２０８に記憶された情報に基づき、通信部２０１にて受信される画像に対して検出処理が行われる。

図１１は、第４の実施形態に係る画像処理の流れを示すフローチャートである。図１１を用いて本実施形態について更に詳細に説明する。図１１に示すフローチャートの処理は主に図２の各機能ブロックにより行われる。

ステップＳ３００にて、通信部２０１は、撮影装置１０２で撮影された画像の画像データを、ネットワーク１０４を介して要求する。

次に、ステップＳ１１００にて、撮影装置１０２が撮影した画像の画像データと、撮影装置１０２の撮影情報とを通信部２０１が受信する。

次に、ステップＳ３０２にて、通信部２０１で受信した画像データに対して、検出部２０２が画像内の人物の顔を検出する検出処理を行う。このとき、記憶部２０８は、算出部２０７で算出された、画像に含まれる画像領域に人物の顔が含まれることの確からしさを示す信頼度と、当該画像領域の位置とを記憶する。なお、本実施形態における画像領域の位置は、球面座標上にて、該画像領域の重心点におけるパン角度とチルト角度、および、該画像領域の垂直画角と水平画角により定められる。以下、図１２を参照して、本実施形態における画像領域の位置について詳しく説明する。

図１２（ａ）は、画像に含まれる画像領域の重心点がパン角度とチルト角度で球面座標上に示された図である。また、図１２（ｂ）は、画像に含まれる画像領域の水平画角と垂直画角が球面座標上にて示された図である。図１２（ａ）において、画像領域１２０２は、撮影装置１０２にて撮影された画像１２０１に含まれる領域である。角度１２０３は、画像領域１２０２の重心点Ｐの球面座標上におけるパン角度である。角度１２０４は、画像領域１２０２の重心点Ｐの球面座標上におけるチルト角度である。また、図１２（ｂ）において、角度１２０５は、画像領域１２０２の球面座標上における垂直画角である。角度１２０６は、画像領域１２０２の球面座標上における水平画角である。以上のように、本実施形態における画像領域の位置は、球面座標上において定められる。

図１１の説明に戻るが、ステップＳ３０３～ステップＳ３０６までの処理は、第一の実施形態と同様であるため説明を省略する。

ステップＳ３０７にて、検出処理変更部２０６によって変更された特定範囲での閾値、および、画像内の特定範囲の位置は記憶部２０８にて記憶される。なお、上述した本実施形態における画像領域の位置と同様に、本実施形態における特定範囲の位置は、球面座標上にて、特定範囲の重心点におけるパン角度とチルト角度、および、該特定範囲の垂直画角と水平画角により定められる。

以上、図１１のフローチャートに示される処理の後、記憶部２０８に記憶された情報に基づいて、通信部２０１にて受信される画像の検出処理が検出部２０２により行われる。このとき、パント・チルト・ズーム制御が行われて撮影装置１０２により撮影される領域が変化したとしても、範囲決定部２０５により決定された物体に対して、人物の顔であると検出部２０２により検出されることが抑制される。

以上説明したように、本実施形態の構成によれば、パント・チルト・ズーム制御ができる撮影装置であっても、第一の実施形態に係る画像処理の機能を実現できる。なお、本実施形態は、第２の実施形態、第３の実施形態、および後述する第５の実施形態にも適用することが可能である。また、本実施形態は、パント、チルト、及びズームの少なくともいずれかを変更可能な撮影装置に適用可能である。

（第５の実施形態）
本実施形態では、各実施形態に係る画像処理装置１００の１以上の機能を、撮影装置１０２が有する実施形態について説明する。つまり、撮影装置１０２が画像処理装置としての機能も有する実施形態について説明する。以下、他の実施形態と異なる部分を主に説明し、他の実施形態と同様な部分については、適宜、省略する。

例えば、図５に示す、検出部２０２と、範囲決定部２０５と、検出処理変更部２０６と、動体検出部５０１と、侵入判定部５０２は撮影装置１０２が有していてもよい。なお、このとき、出力制御部２０３と、操作受付部２０４は、後述する図１４に示すハードウェア構成により実現されるクライアント装置（不図示）が有する。この場合について図１３を参照して説明する。

図１３は、各実施形態に係る画像処理装置１００の一部の機能を有する撮影装置１０２とクライアント装置の機能ブロック図の一例である。撮影部９０５は、ＣＣＤセンサやＣＭＯＳセンサ等の撮像素子により構成され、撮影装置１０２のレンズを通って結像された被写体像を光電変換して電気信号を生成する。

画像処理部９０６は、撮影部９０５において光電変換された電気信号をデジタル信号へ変換する処理や、圧縮符号化処理を行い、画像データを生成する。なお、圧縮符号化処理は省略してもよい。

検出部２０２は、生成された画像データに対して人物の顔を検出する検出処理を行う。検出部２０２における検出処理の結果は、撮影装置１０２における通信部９０９と、クライアント装置１３００における通信部１３０１を介して、クライアント装置１３００における出力制御部２０３へ送られる。出力制御部２０３および操作受付部２０４における処理は、各実施形態と同様であるため説明を省略する。

クライアント装置１３００における操作受付部２０４が受け付けたユーザーによる操作の情報は、通信部１３０１および通信部９０９を介して、撮影装置１０２における範囲決定部２０５へ送られる。範囲決定部２０５は、操作受付部２０４にて受け付けたユーザーによる操作に対応する画像内の物体と、当該物体に対応する特定範囲とを決定する。そして、検出処理変更部２０６は、範囲決定部２０５により決定された画像内の物体が人物の顔であると検出部２０２により検出されることが抑制されるように、該物体に対して行われた検出処理の結果に基づいて、特定範囲における検出処理を変更する。

また、図１３に示すように、第２の実施形態に係る画像処理装置の機能を撮影装置１０２が有する場合において、動体検出部５０１は、画像処理部９０６にて生成された画像の画像データから、動体検出を行う。なお、侵入判定部５０２および検出処理変更部２０６における処理は、第２の実施形態と同様であるため説明を省略する。

以上のように各実施形態に係る画像処理装置１００の１以上の機能は、撮影装置１０２が有していてもよい。

（その他の実施形態）
次に、図１４を用いて、各実施形態の各機能を実現するための画像処理装置１００のハードウェア構成を説明する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１４０１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１４００が実行するコンピュータプログラムを一時的に記憶する。また、ＲＡＭ１４０１は、通信インターフェース１４０３を介して外部から取得したデータ（コマンドや画像データ）などを一時的に記憶する。また、ＲＡＭ１４０１は、ＣＰＵ１４００が各種の処理を実行する際に用いるワークエリアを提供する。また、ＲＡＭ１４０１は、例えば、フレームメモリとして機能したり、バッファメモリとして機能したりする。

ＣＰＵ１４００は、ＲＡＭ１４０１に格納されるコンピュータプログラムを実行する。ＣＰＵ以外にも、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）等のプロセッサやＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）を用いてもよい。

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１４０２は、オペレーティングシステムのプログラムや画像データを記憶する。

ＨＤＤ１４０２に保存されているコンピュータプログラムやデータは、ＣＰＵ１４００による制御に従って、適宜、ＲＡＭ１４０１にロードされ、ＣＰＵ１４００によって実行される。ＨＤＤ以外にもフラッシュメモリ等の他の記憶媒体を用いてもよい。以上が各実施形態における画像処理装置１００のハードウェア構成である。

なお、本発明は、上述の実施形態の１以上の機能を実現するプログラムを１つ以上のプロセッサが読出して実行する処理でも実現可能である。プログラムは、ネットワーク又は記憶媒体を介して、プロセッサを有するシステム又は装置に供給するようにしてもよい。また、本発明は、上述の実施形態の１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。また、画像処理装置１００の各部は、図１４に示すハードウェアにより実現してもよいし、ソフトウェアにより実現することもできる。

以上、本発明を実施形態と共に説明したが、上記実施形態は本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲は限定的に解釈されるものではない。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱しない範囲において、様々な形で実施することができる。例えば、各実施形態を組み合わせたものも本明細書の開示内容に含まれる。

２０１通信部
２０２検出部
２０３出力制御部
２０４操作受付部
２０５範囲決定部
２０６検出処理変更部
２０７算出部
２０９判別部
５０１動体検出部
５０２侵入判定部

Claims

撮影手段により撮影された画像に含まれる特定の物体を検出する検出処理を行う検出手段と、
ユーザーにより行われた前記画像に関する操作に対応する前記画像内の物体と、当該物体に対応する前記画像内における範囲である特定範囲とを決定する決定手段と、
前記決定手段により決定された前記物体が前記特定の物体であると前記検出手段によって検出されることが抑制されるように、前記決定手段により決定された前記物体に対して行われた前記検出処理の結果に基づいて、前記特定範囲における前記検出処理を変更する変更手段と、を有し、
前記検出手段は、
前記画像に含まれる画像領域に前記特定の物体が含まれることの確からしさを示す信頼度を算出し、
前記画像領域に前記特定の物体が含まれるかを判別する基準となる閾値と前記信頼度とを比較して、前記閾値より前記信頼度が大きい場合、前記信頼度に対応する前記画像領域に前記特定の物体が含まれると判別することで、前記画像から前記特定の物体を検出することを特徴とする画像処理装置。
前記変更手段は、前記特定範囲における前記決定手段により決定された前記物体に対応する前記信頼度より前記閾値が大きくなるように、前記特定範囲における前記閾値を変更することで、前記特定範囲における前記検出処理を変更することを特徴とする請求項１に記載の画像処理装置。
前記変更手段は、前記特定範囲における前記決定手段により決定された前記物体に対応する前記信頼度が前記閾値より小さくなるように、前記特定範囲において算出される前記信頼度を変更することで、前記特定範囲における前記検出処理を変更することを特徴とする請求項１に記載の画像処理装置。
前記操作は、前記画像内の位置を指定する操作であり、
前記決定手段は、ユーザーによって指定された前記画像内の位置に基づいて前記物体と、前記物体に対応する前記画像内における範囲である前記特定範囲とを決定することを特徴とする請求項１乃至３のいずれか１項に記載の画像処理装置。
前記操作は、前記画像内において、前記検出手段にて前記特定の物体であると検出された物体に対応する選択項目を選択する操作であり、
前記決定手段は、ユーザーによって選択された前記選択項目に基づいて、前記物体と、前記物体に対応する前記画像内における範囲である前記特定範囲とを決定することを特徴とする請求項１乃至３のいずれか１項に記載の画像処理装置。
前記検出手段は、
前記画像に含まれる各画像領域の画素と、前記特定の物体を検出するためのテンプレートとの差分値を基に、前記信頼度を算出することを特徴とすることを請求項１乃至５のいずれか１項に記載の画像処理装置。
前記画像は、静止画または動画であることを特徴とする請求項１乃至６のいずれか１項に記載の画像処理装置。
前記画像内の動体を検出する動体検出部と、
前記動体検出部により検出された前記動体が前記特定範囲に侵入しているかを判定する侵入判定手段と、をさらに備え、
前記侵入判定手段により前記特定範囲に前記動体が侵入していると判定された場合、前記変更手段は、前記特定範囲における前記検出処理を変更前に戻すことを特徴とする請求項１乃至７のいずれか１項に記載の画像処理装置。
画像を撮影する撮影手段と、
前記画像に含まれる特定の物体を検出する検出処理を行う検出手段と、
ユーザーにより行われた前記画像に関する操作に対応する前記画像内の物体と、当該物体に対応する前記画像内における範囲である特定範囲とを決定する決定手段と、
前記決定手段により決定された前記物体が前記特定の物体であると前記検出手段によって検出されることが抑制されるように、前記決定手段により決定された前記物体に対して行われた前記検出処理の結果に基づいて、前記特定範囲における前記検出処理を変更する変更手段と、を有し、
前記検出手段は、
前記画像に含まれる画像領域に前記特定の物体が含まれることの確からしさを示す信頼度を算出し、
前記画像領域に前記特定の物体が含まれるかを判別する基準となる閾値と前記信頼度とを比較して、前記閾値より前記信頼度が大きい場合、前記信頼度に対応する前記画像領域に前記特定の物体が含まれると判別することで、前記画像から前記特定の物体を検出することを特徴とする撮影装置。
撮影手段により撮影された画像に含まれる特定の物体を検出する検出処理を行う検出工程と、
ユーザーにより行われた前記画像に関する操作に対応する前記画像内の物体と、当該物体に対応する前記画像内における範囲である特定範囲とを決定する決定工程と、
前記決定工程により決定された前記物体が前記特定の物体であると前記検出工程によって検出されることが抑制されるように、前記決定工程により決定された前記物体に対して行われた前記検出処理の結果に基づいて、前記特定範囲における前記検出処理を変更する変更工程と、を有し、
前記検出工程は、
前記画像に含まれる画像領域に前記特定の物体が含まれることの確からしさを示す信頼度を算出し、
前記画像領域に前記特定の物体が含まれるかを判別する基準となる閾値と前記信頼度とを比較して、前記閾値より前記信頼度が大きい場合、前記信頼度に対応する前記画像領域に前記特定の物体が含まれると判別することで、前記画像から前記特定の物体を検出することを特徴とする画像処理方法。
コンピュータを、請求項１乃至８のいずれか１項に記載の情報処理装置が有する各手段として機能させるためのプログラム。