WO2018025845A1

WO2018025845A1 - 検出装置、検出方法及びプログラムを記憶する記憶媒体

Info

Publication number: WO2018025845A1
Application number: PCT/JP2017/027850
Authority: WO
Inventors: 哲夫井下
Original assignee: 日本電気株式会社
Priority date: 2016-08-03
Filing date: 2017-08-01
Publication date: 2018-02-08

Abstract

対象の領域を抽出する精度を向上させることができる対象検出技術を提供する。　本発明の一態様に係る検出装置１０３は、画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成する生成部１２０と、前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する決定部１３０と、を備える。

Description

検出装置、検出方法及びプログラムを記憶する記憶媒体

　本開示は物体を検出する技術に関し、特に、画像等から物体の領域を検出する技術に関する。

　映像から物体を検出する技術は、物体検出技術と呼ばれる。物体検出技術は、例えば、カメラによって撮影された映像から所望の物体を見つけ出すことによって、監視を行う用途に使用されている。物体検出の方法の一つとして、Ｓｌｉｄｉｎｇ　Ｗｉｎｄｏｗ法と呼ばれる技術が使用されている。Ｓｌｉｄｉｎｇ　Ｗｉｎｄｏｗ法は、検出対象の画像に対して矩形領域（Ｗｉｎｄｏｗ）を設定し、Ｗｉｎｄｏｗの位置と大きさを変化させながら、Ｗｉｎｄｏｗ内における検出対象物体の有無を、評価関数により評価する。しかし、車やカバンなどのように、同一の物体であっても、カメラに対する向きや距離などによって、画像内の大きさや向きが変化する物体が存在する。検出対象である物体の画像内における大きさや向きが変わる場合、Ｗｉｎｄｏｗのアスペクト比やサイズを様々に変更する必要があるので、Ｓｌｉｄｉｎｇ　Ｗｉｎｄｏｗ法によって実時間で検出することは困難である。

　特許文献１には、画像を分割して得られた複数の領域を、視覚的特徴量の類似度に基づいて統合することによって、オブジェクトに類似する領域を抽出するオブジェクト領域抽出装置が記載されている。特許文献１の技術における視覚的特徴量は、例えば、色の特徴量、模様の特徴量、形状の特徴量、及び、領域のサイズの特徴量等である。

　非特許文献１には、画像が分割された領域を、色の類似度、テクスチャの類似度、及び、領域サイズの類似度に基づいて統合し、統合された領域を物体検出領域として定義する手法が開示されている。

国際公開第２００８／０１８３９８号

J. R. R. Uijilings et al., "Selective Search for Object Recognition", International Journal of Computer Vision, Vol. 104, Issue 2, pp. 154-171, 2013.

　特許文献１及び非特許文献１の技術では、画像の分割によって生成された領域から得られる、色、模様（例えばテクスチャ）、及び、サイズなどに基づいて領域を統合する。そのため、１つの物体の領域が、１つの領域に統合されるとは限らない。すなわち、統合された領域は、必ずしも検出対象の物体の領域を含んでいるとは限らない。そのため、物体の領域を精度よく検出できるとは限らない。また、物体領域を含む領域を抽出するための、領域を統合する試行回数が増大することによって、物体検出の速度が低下する。

　本発明の目的の一つは、上述の課題に鑑みて、対象の領域を抽出する精度を向上させることができる物体検出技術を提供することにある。

　本発明の一態様に係る検出装置は、画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成する生成手段と、前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する決定手段と、を備える。

　本発明の一態様に検出方法は、画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成し、前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する。

　本発明の一態様に記憶媒体は、コンピュータに、画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成する生成処理と、前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する決定処理と、を実行させるプログラムを記憶する。本発明の一態様は、上記記憶媒体が記憶するプログラムによっても実現できる。

　本発明には、対象の領域を抽出する精度を向上させることができるという効果がある。

図１は、本発明の第１及び第３の実施形態に係る検出システムの構成の例を表すブロック図である。図２は、本発明の第１の実施形態に係る検出装置の動作の例を表すフローチャートである。図３は、本発明の第２の実施形態に係る検出システムの構成を表すブロック図である。図４は、本発明の第２の実施形態に係る検出装置の動作の例を表すフローチャートである。図５は、画像の例を表す図である。図６は、分割によって生成された部分領域を模式的に表す図である。図７は、部分領域の輪郭線の一部を拡大した図である。図８は、統合された領域の例を表す図である。図９は、統合された領域の他の例を表す図である。図１０は、入力画像の例を表す図である。図１１Ａは、背景領域と判定された領域と前景領域である領域とを模式的に表す図である。図１１Ｂは、前景領域の例を模式的に表す図である。図１２Ａは、背景領域と判定された領域と前景領域である領域とを模式的に表す図である。図１２Ｂは、前景領域の例を模式的に表す図である。図１３は、本発明の第３の実施形態の検出装置１００の動作の例を表すフローチャートである。図１４は、本発明の第４の実施形態の検出装置１０２の構成の例を示すブロック図である。図１５は、本発明の第４の実施形態の検出装置１０２の動作の例を表すフローチャートである。図１６は、本発明の実施形態に係る各検出装置を実現することができる、コンピュータ１０００のハードウェア構成の一例を表す図である。

　［第１の実施の形態］
　［構成の説明］
　次に、本発明の第１の実施形態について、図面を参照して詳細に説明する。

　図１は、本実施形態に係る検出システム１０の構成の例を表すブロック図である。

　図１を参照すると、本実施形態の検出システム１０は、検出装置１００と、入力装置２００と、出力装置３００とを含む。

　入力装置２００は、入力画像を、検出装置１００の後述する受信部１１０に送信する。入力装置２００は、入力画像を、例えば映像の形で、検出装置１００に送信してもよい。映像は、例えば、画像の時系列（すなわち、連続して撮影された複数の画像）である。入力装置２００は、例えば、撮影した画像や映像を出力する撮影装置であってもよい。入力装置２００は、撮影された画像や映像を記憶し、記憶している画像や映像を出力する記憶装置であってもよい。

　検出装置１００は、入力装置２００から映像等として得られた入力画像を解析することによって、その入力画像から、例えば物体などの検出の対象（以下、「対象」とも表記）の領域である対象領域を検出する。対象は、人物、動物、等であってもよい。検出装置１００は、検出した対象領域を示す情報を、出力装置３００に送信する。検出装置１００は、検出した対象領域を示す情報に加えて、入力装置２００から受信した入力画像を、出力装置３００に送信してもよい。

　出力装置３００は、例えば、検出装置１００によって送信された、対象領域を示す情報を表示する表示装置であってもよい。出力装置３００は、検出装置１００によって送信された入力画像に、対象領域の位置を示す図形等を重畳し、対象領域を示す図形等が重畳された入力画像を表示してもよい。出力装置３００は、検出装置１００によって検出された対象領域において、例えば、さまざまな物体認識技術のいずれかによる物体認識を行ってもよい。そして、出力装置３００は、対象領域において認識された物体の情報を表示してもよい。以下、検出装置１００について、詳細に説明する。

　検出装置１００は、受信部１１０と、生成部１２０と、決定部１３０と、送信部１４０と、特徴記憶部１５０とを含む。

　受信部１１０は、入力装置２００から、入力画像を受信する。受信部１１０は、入力画像を、静止画像として受信してもよい。受信部１１０は、入力画像を、映像として受信してもよい。入力画像を映像として受信する場合、受信部１１０は、映像を表すデータを、連続する複数の画像を表すデータに変換してもよい。すなわち、受信部１１０は、映像を複数の画像に変換してもよい。受信部１１０は、入力画像（例えば、受信した静止画像、又は、受信した映像から変換された画像）を、例えば１枚ずつ、生成部１２０に送信する。

　生成部１２０は、受け取った入力画像から、テクスチャ、色、他の特徴量、及び、それらの組み合わせ等の、画素に関連する特徴である画像特徴を抽出する。生成部１２０は、例えば、全ての、又は、所定の方法に従って選択された画素毎に、上述の画像特徴を抽出してもよい。生成部１２０は、画像特徴が抽出される画素を中心とする領域において、その画素の画像特徴を抽出してもよい。

　生成部１２０は、入力画像において、抽出した画像特徴に基づく領域、より具体的には、抽出した画像特徴の類似性に基づく領域を生成する。生成部１２０によって生成された領域を、以下の説明では、「部分領域」と表記する。生成部１２０は、例えば、抽出した画像特徴の類似性に基づいて、画素が、その画素を含むグループに含まれる少なくともいずれかの他の画素と隣接するように、画素のグルーピングを行うことによって、入力画像を複数の領域に分割してもよい。生成部１２０は、隣接する２つの画素の画像特徴が類似する場合、それらの画素を同一のグループにグルーピングする処理を繰り返すことによって、入力画像において複数の領域を生成してもよい。生成部１２０は、予め設定された範囲に含まれる大きさを持つ領域に分割してもよい。生成部１２０は、Ｍｅａｎ　Ｓｈｉｆｔ　Ｓｅｇｍｅｎｔａｔｉｏｎ、Ｓｕｐｅｒｐｉｘｅｌｓ、又は、Ｇｒａｐｈ　ｂａｓｅｄ　ｓｅｇｍｅｎｔａｔｉｏｎなどの領域分割技術によって、入力画像を複数の領域に分割してもよい。

　決定部１３０は、画像に現れる、検出の対象である物体等（上述のように、「対象」とも表記）の特徴である対象特徴に基づいて、上述の部分領域から、対象の領域である対象領域を決定する。すなわち、決定部１３０は、対象特徴に基づいて、複数の部分領域を対象領域として統合するかどうかを決定する。決定部１３０は、統合されない１つの部分領域が対象領域であるか否かを決定してもよい。

　決定部１３０は、１つ以上の部分領域の組み合わせのそれぞれを、対象領域の候補である候補領域としてもよい。候補領域に含まれる部分領域は、入力画像において連続していなくてもよい。すなわち、候補領域に含まれる部分領域は、入力画像において離れていてもよい。決定部１３０は、対象特徴に基づいて、それらの候補領域から対象領域を決定してもよい。例えば、決定部１３０は、例えばあらかじめ定められた全ての種類の対象特徴について、候補領域における対象特徴が、その対象特徴に関する所定の基準を満たす場合、その候補領域を対象領域に決定してもよい。

　その場合、決定部１３０は、例えば、１つの種類の対象特徴を選択してもよい。決定部１３０は、さらに、存在する候補領域から１つの候補領域を選択してもよい。決定部１３０は、選択された候補領域における、選択された種類の対象特徴を導出してもよい。決定部１３０は、導出された対象特徴が、その対象特徴に対する基準を満たすか否かを判定する。決定部１３０は、導出された対象特徴が、その対象特徴に対する基準を満たさない場合、選択された候補領域を候補領域から除外してもよい。決定部１３０は、導出された対象特徴が、その対象特徴に対する基準を満たす場合、選択された候補領域を候補領域のままとしてもよい。決定部１３０は、候補領域の選択以降の動作を、選択された対象特徴について全ての候補領域が選択されるまで繰り返してもよい。さらに、決定部１３０は、対象特徴の選択以降の動作を、選択されていない対象特徴が存在しなくなるまで繰り返してもよい。

　決定部１３０は、他の方法によって、候補領域を決定してもよい。対象特徴は、特徴記憶部１５０に格納されていてもよい。対象特徴に対する基準は、特徴記憶部１５０に格納されていてもよい。その場合、決定部１３０は、対象特徴及びそれらの対象特徴に対する基準を、特徴記憶部１５０から読み出せばよい。

　対象特徴は、対象の、色及びテクスチャなどの画像特徴を含んでいてもよい。決定部１３０は、対象の画像特徴と部分領域の画像特徴との類似性に基づいて、候補領域を選択してもよい。例えば、決定部１３０は、候補領域の画像特徴が、対象の画像特徴と、所定基準よりも近い場合、その候補領域を、候補領域のままとしてもよい。決定部１３０は、候補領域の画像特徴が、対象の画像特徴と、所定基準よりも近くない場合、その候補領域を、候補領域から除外してもよい。

　対象特徴が含む画像特徴は、画像の領域内の色の頻度の分布であってもよい。対象特徴が含む画像特徴は、画像の領域内の色の平均値であってもよい。対象特徴が含む画像特徴は、画像の領域内のテクスチャを表す特徴量の頻度の分布であってもよい。対象特徴が含む画像特徴は、画像の領域内のテクスチャを表す特徴量の平均値であってもよい。対象の画像特徴と候補領域（又は部分領域）の画像特徴との類似性は、例えば、対象特徴が含む画像特徴の種類に応じて定義された距離であってもよい。類似性は、他の値によって表されていてもよい。対象特徴が含む画像特徴は、領域の生成に使用される画像特徴と異なっていてもよい。

　以下の説明では、対象特徴が、対象の対象特徴と、所定基準よりも近い部分領域を、「対象に類似する部分領域」と表記する。部分領域の大きさは、部分領域の外接矩形の直交する二辺の長さによって表されていてもよい。候補領域の大きさは、その候補領域が含む全ての部分領域を囲む外接矩形の高さと幅とによって表されていてもよい。

　対象特徴は、例えば、入力画像に現れうる対象領域の大きさを含んでいてもよい。対象領域の大きさは、例えば、縦方向の大きさ及び横方向の大きさによって表されていてもよい。以下の説明では、二辺の長さが対象領域の縦方向の大きさ及び横方向方の大きさである矩形を、対象矩形と表記する。その場合、決定部１３０は、例えば、候補領域の外接矩形の大きさが対象領域の大きさを超えない場合、その候補領域を候補領域のままとすればよい。決定部１３０は、候補領域の外接矩形の大きさが対象領域の大きさを超える場合、その候補領域を候補領域から除外すればよい。決定部１３０は、例えば、候補領域の外接矩形の短辺の長さが、対象矩形の短辺の長さを超えず、候補領域の外接矩形の長辺の長さが、対象矩形の長辺の長さを超えない場合、候補領域の外接矩形の大きさが対象領域の大きさを超えないと判定すればよい。

　対象領域の大きさは、入力画像における位置に応じて定まっていてもよい。その場合、対象領域の大きさは、例えば、入力画像における、候補領域の位置を示す点の座標に対して定まっていてもよい。候補領域の位置を示す点は、例えば、候補領域の外接矩形の定められた頂点（例えば左上の頂点）又は重心であってもよい。決定部１３０は、候補領域の位置を示す点の座標を特定し、そして、特定された座標に応じた対象領域の大きさを特定してもよい。決定部１３０は、その候補領域の大きさが特定された対象領域の大きさを超えない場合、その候補領域を候補領域のままにすればよい。決定部１３０は、その候補領域の大きさが特定された対象領域の大きさを超える場合、その候補領域を候補領域から除外すればよい。

　対象特徴は、例えば、出現位置の分布を含んでいてもよい。対象特徴は、例えば、入力画像内の位置に応じた、対象の出現頻度の指標（以下、「頻度指標」とも表記）を、出現位置の分布として含んでいてもよい。例えば固定されたカメラの映像では、検出の対象（例えばカバン）が出現する頻度が画像内の場所によって異なる場合がある。例えば、固定された監視カメラによって得られた画像では、検出の対象であるカバンが検出される頻度は、人が通行する通路の領域に近い領域において高いと考えられる。しかし、例えば地面から離れた壁面などの人の侵入が困難な領域では、カバンが検出される頻度は低いと考えられる。このような場合、決定部１３０が、後述されるように、出現頻度に基づいて、例えば出現頻度が低い領域に存在する部分領域を、候補領域から除外してもよい。そのことによって、対象領域の誤検出を減少させることができる。

　頻度指標は、過去の複数の画像における対象の出現頻度に基づいて決定されていてもよい。例えば検出装置１００のユーザが、画像に撮影されている環境に応じて、頻度指標を設定してもよい。頻度指標は、対象の領域が出現する可能性に応じた連続値によって表されていてもよい。頻度指標は、出現頻度の大きさを示す複数の値のいずれかによって表されていてもよい。例えば、頻度指標は、対象が出現しないことを表す値又は対象が出現する可能性があることを表す値によって表されていてもよい。

　頻度指標は、画素毎に設定されていてもよい。頻度指標は、画像が所定の規則に従って分割された領域毎に設定されていてもよい。頻度指標は、対象の出現頻度が同じである又は一定範囲に含まれるように区分された領域毎に設定されていてもよい。

　部分領域が含む全ての画素における頻度指標が同じである場合、決定部１３０は、その頻度指標をその部分領域の頻度指標として設定すればよい。それぞれの部分領域は、異なる頻度指標が設定されている部分を含みうる。決定部１３０は、例えば、部分領域に含まれる領域における、頻度指標のうち、出現頻度が最も低いことを表す値（以下、最小頻度指標）を、その部分領域における頻度指標にしてもよい。決定部１３０は、例えば、候補領域が含む部分領域における頻度指標のうち、出現頻度が最も低いことを示す値を、その候補領域における頻度指標にしてもよい。決定部１３０は、頻度指標が所定の頻度閾値より小さい候補領域を、候補領域から除外してもよい。

　決定部１３０は、残った候補領域を対象領域に決定してもよい。以上の説明では、決定部１３０は、対象特徴に基づいて生成した候補領域から、他の対象特徴に基づいて候補領域を選択することによって、候補領域を絞り込んでいる。決定部１３０は、複数の対象特徴に基づく条件を全て満たす候補領域を生成してもよい。決定部１３０は、対象領域の決定を、対象の種類毎に行ってもよい。

　決定部１３０は、決定された対象領域を送信部１４０に送信する。決定部１３０は、更に、対象領域が決定された入力画像を、送信部１４０に送信してもよい。

　以下の説明では、入力画像における対象の大きさ、入力画像内の位置に応じた対象の出現位置の分布、入力画像内の位置に応じた対象の出現頻度の分布などの、対象が撮影された環境における対象の形状や位置などに由来する特徴を、「物体特徴」と表記する。

　特徴記憶部１５０は、検出の対象の色、色の分布、及び、テクスチャなどの画像特徴と、対象の大きさ、及び、出現位置の分布（例えば上述の頻度指標の分布）等の物体特徴とを含む、対象特徴を記憶する。特徴記憶部１５０は、対象特徴を、対象の種類毎に記憶していてもよい。本実施形態では、対象特徴のうちの少なくともいずれかが異なる対象は、異なる種類の対象である。例えば、黒いカバンと白いカバンは、異なる種類の対象である。

　送信部１４０は、決定部１３０によって決定された対象領域を示す情報を、出力装置３００に送信する（すなわち、出力する）。送信部１４０は、さらに、対象領域が決定された画像を、出力装置３００に送信してもよい。

　出力装置３００は、決定部１３０によって決定された対象領域を示す図形を、例えばその対象領域が決定された入力画像に重畳して、ユーザに提示してもよい。出力装置３００は、決定された対象領域から、適宜選択された認識技術によって物体を認識し、認識した物体を示す情報を表示してもよい。出力装置３００は、例えば対象領域が決定された入力画像に重畳して、対象領域を示す図形と、対象領域において認識された物体を示す情報とを表示してもよい。

　［動作の説明］
　次に、本実施形態の検出装置１００の動作について、図面を参照して詳細に説明する。

　図２は、本実施形態の検出装置１００の動作の例を表すフローチャートである。

　まず、受信部１１０が、入力装置２００から、入力画像を受信する（ステップＳ１０１）。

　図５は、ステップＳ１０１において受信する画像の例を表す図である。ステップＳ１０１において受信する画像は、カラー画像であってよい。図５に示す画像は、カラー画像から変換されたモノクロ画像である。

　次に、生成部１２０は、画像特徴の類似度によって画素をグルーピングすることによって、画像において小領域（すなわち、上述の部分領域）を生成する（ステップＳ１０２）。生成部１２０は、それぞれの画素を、隣接する画素のいずれかが属する領域と同じ領域に含まれるように、画素のグルーピングを行ってもよい。上述のように、生成部１２０は、適宜選択された領域分割方法によって、入力画像を複数の部分領域に分割してもよい。

　図６は、分割によって生成された部分領域を模式的に表す図である。図６は、図５に示す画像に変換されたカラー画像を分割することによって生成された部分領域を表す。

　次に、決定部１３０は、特徴記憶部１５０に格納されている、検出の対象の特徴（すなわち、上述の対象特徴）に基づいて、生成された小領域（すなわち部分領域）を統合するかどうかを決定する。そして、決定部１３０は、統合すると判定された部分領域を統合する（ステップＳ１０３）。言い換えると、決定部１３０は、上述の候補領域を抽出する。

　図７は、図６に示す部分領域の輪郭線の一部を拡大した図である。具体的には、図７は、カバンの領域が分割された部分領域の輪郭線を示す。以下では、図７に示すカバンの領域に着目して説明する。特徴記憶部１５０には、検出したい対象の物体特徴（例えば、カバンの領域の大きさ）の情報、及び、画像特徴（例えば、色）の情報などが、あらかじめ対象特徴として格納されている。以下の説明では、対象はカバンである。物体特徴は大きさである。画像特徴は色である。

　図７に示す（ａ）の部分領域を起点として、隣接する部分領域を色の類似性に基づいて統合する場合、図７に示す（ａ）、（ｂ）、及び、（ｃ）の部分領域が統合される。図６に示す例では、図７に示す（ａ）、（ｂ）、及び、（ｃ）の部分領域の少なくともいずれかに隣接する部分領域の色は、図５に示す画像に変換されたカラー画像では、（ａ）、（ｂ）、及び、（ｃ）の部分領域のいずれの色とも類似しない。例えば、図７に示す（ｄ）の部分領域の色は、（ａ）、（ｂ）、及び、（ｃ）の部分領域のいずれの色とも類似しない。この場合、（ａ）、（ｂ）、及び、（ｃ）の部分領域が統合された領域に、部分領域は統合されない。

　図８は、統合された領域の例を表す図である。図８に示す例では、図７に示す（ａ）、（ｂ）、及び、（ｃ）の部分領域が統合されている。図８の破線は、図７に示す（ａ）、（ｂ）、及び、（ｃ）の部分領域の範囲を示す。

　本実施形態の決定部１３０は、さらに、対象特徴（例えば、対象の大きさ）に基づいて、領域を統合する。対象の大きさは、例えば、矩形によって表される。決定部１３０は、色が類似する複数の部分領域の外接矩形が、対象の大きさを示す矩形より小さい場合、それらの複数の部分領域を統合してもよい。決定部１３０は、例えば、外接矩形の高さ及び幅が、それぞれ、対象の大きさを表す矩形の高さ及び幅より小さい場合、外接矩形が矩形より小さいと判定すればよい。

　例えば、図６に示す例では、図７の（ａ）、（ｂ）、（ｃ）、及び、（ｅ）の部分領域は、同じカバンの領域である。しかし、図７の（ｅ）の部分領域は、腕の領域である（ｄ）の部分領域によって、図７の（ａ）、（ｂ）、及び、（ｃ）の部分領域と隔てられている。すなわち、図７の（ｅ）の部分領域は、図７の（ａ）、（ｂ）、及び、（ｃ）の部分領域と続いていない。しかし、図７の（ｅ）の部分領域の色は、図７の（ａ）、（ｂ）、及び、（ｃ）の部分領域の色と類似している。さらに、図７の（ａ）、（ｂ）、（ｃ）、及び、（ｅ）の部分領域の外接矩形の大きさは、対象特徴として記憶されている、対象であるカバンの大きさより小さい。この場合、決定部１３０は、（ａ）、（ｂ）、（ｃ）、及び、（ｅ）の部分領域を統合すればよい。

　図９は、統合された領域の他の例を表す図である。図９に示す例では、図７に示す（ａ）、（ｂ）、（ｃ）、及び、（ｅ）の部分領域が統合されている。図９の破線は、（ａ）、（ｂ）、（ｃ）、及び、（ｅ）の部分領域を表す。

　決定部１３０は、統合された部分領域から、対象の対象特徴に基づいて、対象領域を決定する（ステップＳ１０４）。言い換えると、決定部１３０は、上述の候補領域を、対象領域として決定する送信部１４０は、決定した対象領域の情報を出力する（ステップＳ１０５）。

　［効果の説明］
　次に、本実施の形態の効果について説明する。

　本実施形態の決定部１３０は、入力画像に現れる検出の対象の特徴である対象特徴に基づいて、生成された領域から対象の領域である対象領域を決定する。そのため、例えばオクルージョンのために対象領域が複数の部分領域に分かれていても、オクルージョンに影響されずに対象領域を決定することができる。すなわち、対象の領域を抽出する速度及び精度を向上させることができる。

　［第２の実施の形態］
　［構成の説明］
　次に、本発明の第２の実施形態について、図面を参照して詳細に説明する。

　図３は、本実施形態に係る検出システム１１の構成を表すブロック図である。図３を参照すると、検出システム１１は、検出装置１０１と、入力装置２００と、出力装置３００とを含む。本実施形態の入力装置２００及び出力装置３００は、それぞれ、第１の実施形態の入力装置２００及び出力装置３００と同じである。検出装置１０１は、受信部１１０、生成部１２０、決定部１３０、送信部１４０、及び、特徴記憶部１５０を含む。検出装置１０１は、さらに、背景生成部１６０を含んでいてもよい。検出システム１１は、さらに、端末装置４００を含んでいてもよい。検出装置１０１は、さらに、抽出部１７０を含んでいてもよい。以下では、本実施形態と第１の実施形態との間の相違を主に説明する。

　背景生成部１６０は、受信部１１０が受信した複数の入力画像（例えば、上述の映像）に基づいて、背景画像を生成してもよい。背景画像を生成する方法は、知られている様々な方法のいずれかであってもよい。この場合、背景領域は、背景画像全体である。

　背景生成部１６０は、例えば、１枚の入力画像を、端末装置４００に送信してもよい。その１枚の入力画像は、映像として受信した複数の入力画像の１枚であってもよく、静止画像として受信した入力画像であってもよい。この場合の、背景生成部１６０によって端末装置４００に送信される入力画像は、対象が抽出される入力画像とは異なる画像であってもよい。背景生成部１６０によって端末装置４００に送信される入力画像は、例えば、対象が抽出される入力画像の背景と同じ背景が撮影されている画像であればよい。端末装置４００は、ディスプレイやタッチパネルなどの表示装置に、受信した入力画像を表示してもよい。端末装置４００のユーザは、端末装置４００のマウスやタッチパネルなどの入力機能を備えた装置を使用して、表示された入力画像における背景領域の範囲を入力してもよい。端末装置４００は、入力された背景領域の範囲を、背景生成部１６０に送信してもよい。背景生成部１６０は、受信した背景領域の範囲を、端末装置４００に送信した入力画像における背景領域の範囲にしてもよい。

　背景生成部１６０は、受信した入力画像と、その入力画像における背景領域の範囲とを、抽出部１７０に送信してもよい。

　抽出部１７０は、入力画像の背景領域から、色やテクスチャなどの画像特徴を抽出する。抽出部１７０は、例えば、生成部１２０による部分領域を生成する方法と同様の方法で、入力画像の背景領域において部分領域を生成してもよい。抽出部１７０は、入力画像において離れている複数の部分領域を、画像特徴の類似性に基づいて統合してもよい。言い換えると、抽出部１７０は、入力画像において離れている複数の部分領域の画像特徴が所定基準より近い場合、それらの複数の部分領域を、同じ種類の背景の部分領域として統合してもよい。抽出部１７０は、さらに、生成した部分領域の大きさを特定してもよい。抽出部１７０は、統合された部分領域の大きさを特定してもよい。抽出部１７０は、背景の種類毎に、背景領域において生成された部分領域から抽出された画像特徴を、背景の特徴である背景特徴として特徴記憶部１５０に格納してもよい。抽出部１７０は、背景の種類毎に、背景領域において生成された部分領域の大きさと、その部分領域において抽出された画像特徴とを、背景の特徴である背景特徴として特徴記憶部１５０に格納してもよい。言い換えると、抽出部１７０は、背景の種類毎に、画像特徴を含む背景特徴を、特徴記憶部１５０に格納してもよい。抽出部１７０は、背景の種類毎に、部分領域の大きさをさらに含む背景特徴を、特徴記憶部１５０に格納してもよい。

　本実施形態に係る特徴記憶部１５０は、上述の背景特徴を記憶する。背景特徴は、上述のように背景生成部１６０によって特徴記憶部１５０に格納されてもよい。背景特徴は、例えば検出システム１１のユーザ又は管理者によって、あらかじめ特徴記憶部１５０に格納されていてもよい。例えば、検出の対象である物体とは異なる、道路や森などの事物が背景として入力画像に撮影された場合、例えば、道路の領域及び森の領域が、背景領域の部分領域として特定されていればよい。そして、特徴記憶部１５０は、道路の領域における色やテクスチャなどの画像特徴を含む背景特徴を記憶していればよい。特徴記憶部１５０は、その道路の領域の大きさを示す情報をさらに含む背景特徴を記憶していてもよい。特徴記憶部１５０は、さらに、森の領域における色やテクスチャなどの画像特徴を含む背景特徴を記憶していればよい。特徴記憶部１５０は、その森の大きさを示す情報をさらに含む背景特徴を記憶していてもよい。

　本実施形態に係る決定部１３０は、特徴記憶部１５０に格納されている背景特徴に基づいて、入力画像から生成された部分領域が背景領域であるか否かを判定する。決定部１３０は、例えば、特徴記憶部１５０から、背景の種類毎に、背景特徴を読み出し、読み出した背景特徴が含む画像特徴と、入力画像の各部分領域の画像特徴とを比較してもよい。決定部１３０は、例えば、背景特徴が含む画像特徴と画像特徴が類似する部分領域を、背景領域と判定してもよい。以下の説明では、背景領域と判定されていない領域を、「前景領域」と表記する。部分領域が生成された時点において、生成された部分領域は全て前景領域である。

　決定部１３０は、背景と判定された部分領域以外の部分領域（すなわち、前景領域である部分領域）において、対象特徴に基づいてそれらの部分領域を統合する。決定部１３０は、統合された部分領域を、対象領域に決定する。詳細には、決定部１３０は、背景領域と判定された部分領域を、前景領域から除外する。決定部１３０は、前景領域から除外されなかった部分領域において、対象領域を決定する。例えば、決定部１３０は、前景領域から除外されなかった部分領域を１つ以上含む全ての組み合わせの各々を、候補領域に決定してもよい。決定部１３０は、対象特徴に基づいて、決定した候補領域から対象領域を選択することによって、対象領域を決定してもよい。本実施形態の決定部１３０が候補領域を決定する方法は、第１の実施形態の決定部１３０が候補領域を決定する方法と同様である。本実施形態の決定部１３０が対象領域を決定する方法は、第１の実施形態の決定部１３０が対象領域を決定する方法と同様である。

　［動作の説明］
　以上のように、本実施形態の決定部１３０は、背景特徴に基づいて、背景領域である部分領域を、対象領域の候補から除外する。そして、決定部１３０は、対象特徴に基づいて、除外されなかった部分領域から、対象領域を決定する。

　次に、本実施形態に係る検出装置１０１の動作について、図面を参照して詳細に説明する。

　図４は、本実施形態に係る検出装置１０１の動作の例を表すフローチャートである。

　図４に示す動作の開始時において、特徴記憶部１５０は、予め背景領域の特徴を記憶している。

　まず、受信部１１０が入力画像を受信する（ステップＳ１０１）。次に、生成部１２０が、受信した入力画像において部分領域を生成する（ステップＳ１０２）。図４に示すステップＳ１０１及びステップＳ１０２の動作は、図２に示す第１の実施形態におけるステップＳ１０１及びステップＳ１０２の動作と同じである。

　図１０は、入力画像の例を表す図である。ステップＳ１０１において、受信部１１０は、例えば、図１０に示す入力画像を受信する。図１０は、さらに、入力画像が分割された部分領域の例を示す。図１０に示す例では、生成部１２０によって、入力画像は、領域（ａ）から領域（ｌ）までの１２個の部分領域に分割されている。このうち、領域（ａ）から領域（ｃ）までの３つの領域は、背景領域である。３機の飛行機の領域は、それぞれ、３つの領域に分割されている。例えば、領域（ｄ）から領域（ｆ）までの３つの領域は、１機目の飛行機の領域である。領域（ｇ）から領域（ｉ）までの３つの領域は、２機目の飛行機の領域である。領域（ｊ）から領域（ｌ）までの３つの領域は、３機目の飛行機の領域である。図１０に示す例では、簡単のため、領域（ｄ）から領域（ｆ）までの３つの領域の境界線は、描かれていない。同様に、領域（ｇ）から領域（ｉ）までの３つの領域の境界線も、描かれていない。領域（ｊ）から領域（ｌ）までの３つの領域の境界線も、描かれていない。

　次に、決定部１３０は、生成された部分領域が背景と類似しているか否かを、特徴記憶部１５０に格納されている背景特徴に基づいて判定する（ステップＳ２０１）。決定部１３０は、例えば、背景特徴に含まれる画像特徴と、部分領域の各々の画像特徴とを比較すればよい。背景特徴に含まれる画像特徴と部分領域の画像特徴との間の差が所定の基準より小さい場合、決定部１３０は、背景特徴に含まれる画像特徴と部分領域の画像特徴とが類似する、すなわち、その部分領域が背景と類似すると判定すればよい。背景特徴に含まれる画像特徴と部分領域の画像特徴との間の差は、例えば適宜定義された距離によって表されればよい。

　背景特徴に含まれる画像特徴と部分領域の画像特徴とが類似する場合、決定部１３０は、背景特徴に含まれる画像特徴と類似する画像特徴を持つ部分領域を、背景領域と判定し、その部分領域を対象領域の候補から除外する。言い換えると、決定部１３０は、背景と類似する部分領域を、背景領域と認定し、その部分領域を対象領域の候補から除外する（ステップＳ２０２）。

　複数の種類の背景の背景特徴が特徴記憶部１５０に格納されている場合、決定部１３０は、まず、１番目の種類の背景の背景特徴を選択し、選択された背景特徴に含まれる画像特徴と類似する画像特徴を持つ部分領域を、対象領域の候補から除外する。決定部１３０は、残りの部分領域を、対象領域の候補のままとする。更に、決定部１３０は、２番目の種類の背景の背景特徴を選択し、選択した背景特徴に含まれる画像特徴と類似する画像特徴を持つ部分領域を、対象領域の候補から除外する。決定部１３０は、残りの部分領域を、同様に、対象領域の候補のままとする。決定部１３０は、背景の種類の選択と、背景に類似する部分領域の、対象領域の候補からの除外とを、選択されていない背景の種類がなくなるまで繰り返す。

　図１０に示す例では、領域（ａ）、（ｂ）、及び、（ｃ）が、背景領域と判定される。

　図１１Ａは、背景領域と判定された領域と前景領域である領域とを模式的に表す図である。図１１Ａに示す例では、飛行機の領域は、前景領域と判定されている。図１１Ａは、さらに、背景特徴と類似する部分領域として、領域（ａ）が選択されていることを示す。

　図１１Ｂは、前景領域の例を模式的に表す図である。選択された領域（ａ）が前景領域（すなわち、対象領域の候補）から除外された場合、図１１Ｂに示す、破線で描かれた矩形によって囲まれた黒い領域が、前景領域である。

　図１２Ａは、背景領域と判定された領域と前景領域である領域とを模式的に表す図である。図１２Ａに示す例でも、飛行機の領域は、前景領域と判定されている。図１２Ａは、さらに、背景特徴と類似する部分領域として、領域（ｂ）が選択されていることを示す。

　図１２Ｂは、前景領域の例を模式的に表す図である。選択された領域（ｂ）が前景領域（すなわち、対象領域の候補）から除外された場合、図１２Ｂに示す、破線で描かれた矩形によって囲まれた黒い領域が、前景領域である。図１２Ｂに示す例では、飛行機の領域が分離した前景領域として現れている。決定部１３０は、これらの分離した前景領域を、対象領域として検出してもよい。決定部１３０は、これらの分離した前景領域において、対象特徴に基づいて対象領域を決定してもよい。

　決定部１３０は、対象領域の候補として残った、すなわち、前景領域として残った部分領域を、第１の実施形態の検出装置１００の動作における図２に示すステップＳ１０３の動作と同様に、対象特徴に基づいて統合する（図４のステップＳ１０３）。決定部１３０は、第１の実施形態の検出装置１００の動作における図２に示すステップＳ１０４の動作と同様に、統合された部分領域を、対象領域に決定する（ステップＳ１０４）。送信部１４０は、第１の実施形態の検出装置１００の動作における図２に示すステップＳ１０５の動作と同様に、決定された対象領域の情報を出力する（ステップＳ１０５）。決定部１３０は、ステップＳ１０３において、対象特徴に基づいて、前景領域である部分領域を統合するのではなく、互いに接する、前景領域である部分領域を統合してもよい。

　［効果の説明］
　次に、本発明を実施するための形態の効果について説明する。

　本実施形態には、対象領域を検出する精度と速度とを向上させることができるという効果がある。その理由は、決定部１３０が、背景領域の特徴と類似する特徴を持つ部分領域を、対象領域の候補から除外するからである。すなわち、対象領域ではない背景領域を除外することができる。除外された背景領域において対象を検出する処理を行わないため、検出の精度が向上し、さらに、検出の速度も向上する。単純な背景上に複雑な対象領域が存在する場合、検出の速度を向上させることができるという効果がある。その理由は、部分領域を統合する前に単純な背景領域を除外した場合、対象領域が、分離した前景領域として残るからである。分離した前景領域をそのまま対象領域として検出することによって、対象領域を検出する速度を向上させることができる。

　［第３の実施の形態］
　［構成の説明］
　図１は、本発明の第３の実施形態の検出システム１０の構成の例を表すブロック図である。本実施形態の検出システム１０は、第１の実施形態の検出システム１０と同じ構成を備える。すなわち、本実施形態の検出システム１０は、検出装置１００と、入力装置２００と、出力装置３００とを含む。入力装置２００及び出力装置３００は、それぞれ、第１及び第２の実施形態に係る、入力装置２００及び出力装置３００と同じである。

　本実施形態の検出装置１００は、第１の実施形態の検出装置１００と同じ構成を備えていればよい。検出装置１００は、受信部１１０、生成部１２０、決定部１３０、送信部１４０、及び、特徴記憶部１５０を含む。

　本実施形態の検出装置１００は、以下で説明する相違を除いて、第１の実施形態の検出装置１００と同様に動作してもよい。その場合、本実施形態の受信部１１０、生成部１２０、決定部１３０、送信部１４０、及び、特徴記憶部１５０は、それぞれ、第１の実施形態の、同じ名称及び符号が付与された要素と同様に動作してもよい。

　本実施形態の特徴記憶部１５０は、複数の対象のいずれかの対象特徴として、他の対象（例えば、他の種類の対象）に基づく物体特徴を含んでいてもよい。具体的には、他の対象に基づく物体特徴は、他の種類の対象の対象領域に基づく物体特徴であってもよい。さらに具体的には、他の対象領域に基づく物体特徴は、例えば、他の種類の対象の対象領域に対する相対位置に応じた出現頻度であってもよい。以下の説明では、対象の対象特徴が基づく「他の対象」を、「関連対象」と表記する。また、対象の対象特徴が基づく他の対象領域（すなわち、前述の「他の種類の対象の対象領域」）を、その対象の「関連対象領域」と表記する。関連対象に基づく物体特徴を、「関連特徴」と表記する。

　さらに具体的には、特徴記憶部１５０は、少なくともいずれかの種類の対象の対象特徴として、関連対象の種類と、関連対象の対象領域に対する相対位置及びその相対位置における対象の出現頻度とを含む物体特徴を記憶していてもよい。関連対象の対象領域に対する相対位置は、例えば、関連対象の対象領域に定められた点に対する相対位置である。相対位置は、例えば、ベクトルによって表されていてもよい。その場合、物体特徴が含むその出現頻度は、関連対象の対象領域に定められた点から、そのベクトルによって表される移動を行った位置の点における対象の出現頻度を表す。相対位置は、例えば、ベクトルと範囲とによって表されていてもよい。範囲は、所定の図形の大きさを表すパラメータであってもよい。範囲は、例えば、矩形の縦方向の大きさと横方向の大きさによって表されていてもよい。ベクトルは、関連対象の対象領域に定められた点から、範囲を表す図形に固定された点（例えば、重心又は頂点等）へのベクトルであってもよい。この場合、物体特徴が含むその出現頻度は、関連対象の対象領域に定められた点から、そのベクトルによって表される移動を行った位置の点を基準とする範囲が表す領域内における、対象の出現頻度を表す。

　例えば、カバンなどの携行品等の出現頻度は、人物の領域の周辺において高い傾向がある。さらに、携行品等の出現頻度は、携行品等の種類と、人物の領域に対する相対位置とによって、出現頻度が異なりうる。例えばカバンの出現頻度は、人物の領域のうち、足首から肩までの領域の近くにおいて高いが、頭部付近においては低い傾向がある。例えば帽子の出現頻度は、人物の領域のうち、頭部付近においては高いが、足元付近においては低い傾向がある。このような対象領域の出現頻度は、関連対象の種類と、関連対象の対象領域に対する相対位置及びその相対位置における対象の出現頻度とを物体特徴として含む対象特徴によって表すことができる。

　本実施形態の決定部１３０は、対象領域を決定する場合、例えば対象特徴に基づいて、対象の種類を特定する。この場合、対象特徴は、色及びテクスチャなどの画像特徴を含んでいてもよい。対象特徴は、大きさ及び形状などの物体特徴を含んでいてもよい。
決定部１３０は、決定した対象領域から対象特徴を抽出してもよい。決定部１３０は、決定した対象領域から抽出される対象特徴と、特徴記憶部１５０に格納されている、対象の種類の各々の対象特徴とを比較してもよい。決定部１３０は、対象領域から抽出した対象特徴と類似する対象特徴を持つ対象の種類を特定してもよい。言い換えると、決定部１３０は、対象領域から抽出した対象特徴と、特徴記憶部１５０に格納されている対象特徴との差を算出する。決定部１３０は、算出した差の大きさが最も小さい対象の種類を、対象領域から抽出した対象特徴と類似する対象特徴を持つ対象の種類に決定してもよい。決定部１３０は、いずれの種類の対象についても、算出した差の大きさが所定の基準を満たさない場合、対象領域から抽出した対象特徴と類似する対象特徴を持つ対象の種類を特定しなくてもよい。

　対象の対象特徴に関連対象に基づく関連特徴が含まれており、さらに、その関連対象が入力画像において特定されている場合、決定部１３０は、その対象の対象領域を、その対象の対象特徴が含む関連特徴に基づいて決定する。具体的には、例えば、第１の対象の対象特徴として、第２の対象の対象領域に対する相対位置に応じた出現頻度の分布が含まれている場合、決定部１３０は、第２の対象の対象領域の位置に基づいて、第１の対象の出現頻度の分布を決定する。第１の対象がカバンであり、第２の対象が人物である場合、決定部１３０は、人物の領域の位置に基づいて、カバンの出現頻度の分布を決定する。決定部１３０は、第１の対象の対象領域を、他の対象特徴に加えて、決定した出現頻度の分布に基づいて決定すればよい。

　対象の対象特徴に、関連対象に基づく関連特徴が含まれていても、その関連対象が入力画像において特定されていない場合、決定部１３０は、その対象の対象領域を、その対象の対象特徴が含む関連特徴に基づかずに決定してよい。

　決定部１３０は、まず、対象特徴が関連特徴を含まない対象の対象領域を決定してもよい。決定部１３０は、次に、対象特徴が関連対象に基づく関連特徴が含み、その関連対象が入力画像において特定されている対象の対象領域を決定してもよい。決定部１３０は、さらに、他の対象の関連対象である対象の対象領域を決定してもよい。決定部１３０は、最後に、残った対象の対象領域を決定してもよい。

　本実施形態の検出装置１００は、以上で説明した相違を除いて、第２の実施形態の検出装置１０１と同様に動作してもよい。その場合、本実施形態の検出システム１０は、第２の実施形態の検出システム１１と同じ構成を備えていればよい。また、本実施形態の検出装置１００は、第２の実施形態の検出装置１０１と同じ構成を備えていればよい。すなわち、検出システム１０は、さらに、端末装置４００を含んでいてもよい。端末装置４００は、第２の実施形態に係る端末装置４００と同じである。検出装置１００は、さらに、背景生成部１６０及び抽出部１７０を含んでいてもよい。本実施形態の受信部１１０、生成部１２０、決定部１３０、送信部１４０、特徴記憶部１５０、背景生成部１６０、及び、抽出部１７０は、それぞれ、第２の実施形態の、同じ名称及び符号が付与された要素と同様に動作してもよい。

　図１３は、本実施形態の検出装置１００の動作の例を表すフローチャートである。

　検出装置１００は、ステップＳ１０１及びステップＳ１０２において、第１の実施形態の検出装置１００のステップＳ１０１及びステップＳ１０２の動作と同じ動作を行う。

　次に、決定部１３０は、特徴記憶部１５０に対象特徴が格納されている対象の種類を１つ選択する（ステップＳ３０１）。決定部１３０は、例えば、対象特徴が関連特徴を含まない対象の種類を選択してもよい。対象特徴が関連特徴を含まない対象の種類が存在しない場合、決定部１３０は、例えば、対象特徴に含まれる関連特徴の関連対象が既に選択されている対象（すなわち、関連対象の対象領域が決定されている対象）の種類を選択してもよい。決定部１３０は、例えば、他の種類の対象の関連対象である対象の種類を選択してもよい。決定部１３０は、他の方法に従って、対象の種類を選択してもよい。

　選択した種類の対象の、関連対象領域が決定されていない場合（ステップＳ３０２においてＮＯ）、決定部１３０は、関連特徴以外の対象特徴に基づいて、部分領域を統合する（ステップＳ１０３）。そして、決定部１３０は、対象領域を決定する（ステップＳ１０４）。例えば、選択した種類の対象の関連対象の対象領域が入力画像に存在しない場合、選択した種類の対象の関連対象領域は決定されない。選択した種類の対象の対象特徴が関連特徴を含まない場合も、選択した種類の対象の関連対象領域は決定されない。

　選択した種類の対象の、少なくとも１つの関連対象領域が決定されている場合（ステップＳ３０２においてＹＥＳ）、決定部１３０は、関連対象を含む対象特徴に基づいて、部分領域を統合する（ステップＳ３０３）。そして、決定部１３０は、対象領域を決定する（ステップＳ１０４）。対象特徴が、関連対象領域が決定されていない関連対象の関連特徴を含む場合、決定部１３０は、その関連特徴以外の対象特徴に基づいて、部分領域を統合すればよい。

　いずれかの対象の種類が選択されていない場合（ステップＳ３０４においてＮＯ）、検出装置１００は、ステップＳ３０１以降の動作を繰り返す。対象の種類が全て選択された場合（ステップＳ３０４においてＹＥＳ）、送信部１４０は、決定した対象領域の情報を出力する（ステップＳ１０５）。

　検出装置１００は、ステップＳ１０１及びステップＳ１０２の動作の後に、図４に示す、ステップＳ２０１及びステップＳ２０２の動作を行ってもよい。その場合、検出装置１００は、ステップＳ１０１、ステップＳ１０２、ステップＳ２０１、及び、ステップＳ２０２のそれぞれにおいて、第２の実施形態の検出装置１０１の、同じ符号が付与されたステップの動作と同じ動作を行う。この場合、検出装置１００は、さらに、ステップＳ１０３及びステップＳ１０４においても、第２の実施形態の検出装置１０１の、同じ符号が付与されたステップの動作と同じ動作を行う。

　［効果の説明］
　本実施形態には、対象領域を検出する精度をさらに向上させることができるという効果がある。その理由は、決定部１３０が、関連特徴に基づく関連特徴を含む対象特徴に基づいて、対象の対象領域を特定するからである。例えば、決定部１３０は、出現頻度の分布が他の対象領域の位置に基づく対象の対象領域を、その出現頻度の分布に基づいて決定する。

　［第４の実施の形態］
　［構成の説明］
　次に、本発明の第４の実施形態について、図面を参照して詳細に説明する。本実施形態は、上述の第１～第３の実施形態の主要部分に相当する。

　図１４は、本実施形態の検出装置１０２の構成の例を示すブロック図である。

　本実施形態に係る検出装置１０２は、生成部１２０と、決定部１３０と、を備える。生成部１２０は、画像の画素に関連する特徴である画像特徴の類似性に基づいて、画像（すなわち、上述の入力画像）において部分領域を生成する。上述のように、画像特徴は、例えば、色及びテクスチャなどである。決定部１３０は、画像に現れる対象の特徴である対象特徴に基づいて、部分領域から前記対象の領域である対象領域を決定する。決定部１３０は、例えば、対象特徴に基づいて部分領域を統合し、統合した部分領域から、対象特徴に基づいて対象領域を決定すればよい。前述のように、対象特徴は、色及びテクスチャなどの画像特徴に加えて、画像における対象領域の大きさ、及び、画像内の場所に応じた、対象領域の出現頻度などの、前述の物体特徴を含む。

　［動作の説明］
　次に、本実施形態の検出装置１０２の動作について、図面を参照して詳細に説明する。

　図１５は、本実施形態の検出装置１０２の動作の例を表すフローチャートである。

　図１５を参照すると、まず、生成部１２０が、画像特徴の類似性に基づいて、入力画像において部分画像を生成する（ステップＳ４０１）。次に、決定部１３０が、対象特徴に基づいて、対象領域を決定する（ステップＳ４０２）。

　［効果の説明］
　本実施形態には、対象の領域を検出する精度を向上させることができるという効果がある。その理由は、決定部１３０が、例えば大きさや出現頻度などの対象特徴に基づいて、対象の領域を決定するからである。そのため、色やテクスチャなどの画像特徴に基づいて対象の領域を決定する場合と比べて、対象の領域を検出する精度を向上させることができる。

　［その他の実施の形態］
　検出装置１００、検出装置１０１、及び、検出装置１０２は、記憶媒体から読み出されたプログラムがロードされたメモリと、そのプログラムを実行するプロセッサとを含むコンピュータによって実現することができる。検出装置１００、検出装置１０１、及び、検出装置１０２は、専用のハードウェアによって実現することもできる。検出装置１００、検出装置１０１、及び、検出装置１０２は、前述のコンピュータと専用のハードウェアとの組み合わせによって実現することもできる。

　言い換えると、上述の各実施形態に係る検出装置は、回路構成（ｃｉｒｃｕｉｔｒｙ）などのハードウェアによって実現することができる。回路構成は、例えば、コンピュータに含まれるプロセッサとメモリであってもよい。その場合、プログラムが、メモリにロードされていればよい。そのプログラムは、プロセッサが実行することが可能であり、コンピュータを上述の各実施形態の検出装置として動作させればよい。回路構成は、例えば、通信可能に接続された複数のコンピュータであってもよい。回路構成は、例えば、回路（ｃｉｒｃｕｉｔ）であってもよい。回路構成は、例えば、通信可能に接続された複数の回路であってもよい。回路構成は、通信可能に接続された、１台以上のコンピュータと、１個以上の回路との組み合わせであってもよい。

　図１６は、本発明の実施形態に係る各検出装置を実現することができる、コンピュータ１０００のハードウェア構成の一例を表す図である。図１６を参照すると、コンピュータ１０００は、プロセッサ１００１と、メモリ１００２と、記憶装置１００３と、Ｉ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）インタフェース１００４とを含む。また、コンピュータ１０００は、記憶媒体１００５にアクセスすることができる。メモリ１００２と記憶装置１００３は、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ハードディスクなどの記憶装置である。記憶媒体１００５は、例えば、ＲＡＭ、ハードディスクなどの記憶装置、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、可搬記憶媒体である。記憶装置１００３が記憶媒体１００５であってもよい。プロセッサ１００１は、メモリ１００２と、記憶装置１００３に対して、データやプログラムの読み出しと書き込みを行うことができる。プロセッサ１００１は、Ｉ／Ｏインタフェース１００４を介して、例えば、入力装置２００、出力装置３００、及び、端末装置４００と通信することができる。プロセッサ１００１は、記憶媒体１００５にアクセスすることができる。記憶媒体１００５には、コンピュータ１０００を、検出装置１００、検出装置１０１、又は、検出装置１０２として動作させるプログラムが格納されている。

　プロセッサ１００１は、記憶媒体１００５に格納されている、コンピュータ１０００を、検出装置１００、検出装置１０１、又は、検出装置１０２として動作させるプログラムを、メモリ１００２にロードする。そして、プロセッサ１００１が、メモリ１００２にロードされたプログラムを実行することにより、コンピュータ１０００は、検出装置１００、検出装置１０１、又は、検出装置１０２として動作する。

　受信部１１０、生成部１２０、決定部１３０、送信部１４０、背景生成部１６０及び抽出部１７０の機能は、コンピュータ１０００をこれらの部として機能させるプログラムとして実装されてもよい。そのプログラムは、記憶媒体１００５に格納されてもよい。受信部１１０、生成部１２０、決定部１３０、送信部１４０、背景生成部１６０及び抽出部１７０は、そのプログラムがロードされたメモリ１００２と、そのプログラムを実行するプロセッサ１００１とを含むコンピュータ１０００により実現することができる。また、特徴記憶部１５０は、コンピュータ１０００が含むメモリ１００２やハードディスク装置等の記憶装置１００３により実現することができる。あるいは、受信部１１０、生成部１２０、決定部１３０、送信部１４０、特徴記憶部１５０、背景生成部１６０、及び、抽出部１７０の一部又は全部を、それらの部の機能を実現する専用の回路によって実現することもできる。

　また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

　（付記１）
　画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成する生成手段と、
　前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する決定手段と、
　を備える検出装置。

　（付記２）
　前記対象特徴は、前記画像内の位置に応じた前記対象領域のサイズを含み、
　前記決定手段は、前記部分領域の前記画像内の位置に応じた前記対象領域の前記サイズに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記１に記載の検出装置。

　（付記３）
　前記決定手段は、前記画像における位置に応じた当該画像の背景の特徴に基づいて、前記部分領域が前記背景と類似しているか否かを判定し、前記背景に類似していると判定された前記部分領域以外の前記部分領域から、前記対象領域を決定する
　付記１又は２に記載の検出装置。

　（付記４）
　前記対象特徴は、前記画像における他の対象の領域の位置に応じた前記対象の第１の出現頻度を含み、
　前記決定手段は、前記他の対象の領域の位置の情報と前記第１の出現頻度とに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記１乃至３のいずれか１項に記載の検出装置。

　（付記５）
　前記対象特徴は、前記画像内の位置に応じた前記対象の第２の出現頻度を含み、
　前記決定手段は、前記部分領域の前記画像内の位置に応じた前記対象の前記第２の出現頻度に基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記１乃至４のいずれか１項に記載の検出装置。

　（付記６）
　付記１乃至５のいずれか１項に記載の検出装置と、
　前記画像を出力する入力装置と、
　受信した対象領域を示す情報を表示する出力装置と、を含み、
　前記検出装置は、
　前記画像を受信する受信手段と、
　決定した前記対象領域の情報を前記出力装置に送信する送信手段と、
　を備える
　検出システム。

　（付記７）
　画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成し、
　前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する、
　検出方法。

　（付記８）
　前記対象特徴は、前記画像内の位置に応じた前記対象領域のサイズを含み、
　前記部分領域の前記画像内の位置に応じた前記対象領域の前記サイズに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記７に記載の検出方法。

　（付記９）
　前記画像における位置に応じた当該画像の背景の特徴に基づいて、前記部分領域が前記背景と類似しているか否かを判定し、前記背景に類似していると判定された前記部分領域以外の前記部分領域から、前記対象領域を決定する
　付記７又は８に記載の検出方法。

　（付記１０）
　前記対象特徴は、前記画像における他の対象の領域の位置に応じた前記対象の第１の出現頻度を含み、
　前記他の対象の領域の位置の情報と前記第１の出現頻度とに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記７乃至９のいずれか１項に記載の検出方法。

　（付記１１）
　前記画像内の位置に応じた前記対象の第２の出現頻度を含み、
　前記部分領域の前記画像内の位置に応じた前記対象の前記第２の出現頻度に基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記７乃至１０のいずれか１項に記載の検出方法。

　（付記１２）
　コンピュータに、
　画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成する生成処理と、
　前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する決定処理と、
　を実行させるプログラムを記憶する記憶媒体。

　（付記１３）
　前記対象特徴は、前記画像内の位置に応じた前記対象領域のサイズを含み、
　前記決定処理は、前記部分領域の前記画像内の位置に応じた前記対象領域の前記サイズに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記１２に記載の記憶媒体。

　（付記１４）
　前記決定処理は、前記画像における位置に応じた当該画像の背景の特徴に基づいて、前記部分領域が前記背景と類似しているか否かを判定し、前記背景に類似していると判定された前記部分領域以外の前記部分領域から、前記対象領域を決定する
　付記１２又は１３に記載の記憶媒体。

　（付記１５）
　前記対象特徴は、前記画像における他の対象の領域の位置に応じた前記対象の第１の出現頻度を含み、
　前記決定処理は、前記他の対象の領域の位置の情報と前記第１の出現頻度とに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記１２乃至１４のいずれか１項に記載の記憶媒体。

　（付記１６）
　前記対象特徴は、前記画像内の位置に応じた前記対象の第２の出現頻度を含み、
　前記決定処理は、前記部分領域の前記画像内の位置に応じた前記対象の前記第２の出現頻度に基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　付記１２乃至１５のいずれか１項に記載の記憶媒体。

　以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１６年８月３日に出願された日本出願特願２０１６－１５２６２４を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本発明は、例えば、画像を処理する機能を備えたコンピュータ装置、携帯電話、スマートフォン、及び、デジタルスチールカメラ等に適用することができる。

　１０　　検出システム
　１１　　検出システム
　１００　　検出装置
　１０１　　検出装置
　１０２　　検出装置
　１１０　　受信部
　１２０　　生成部
　１３０　　決定部
　１４０　　送信部
　１５０　　特徴記憶部
　１６０　　背景生成部
　１７０　　抽出部
　２００　　入力装置
　３００　　出力装置
　４００　　端末装置
　１０００　　コンピュータ
　１００１　　プロセッサ
　１００２　　メモリ
　１００３　　記憶装置
　１００４　　Ｉ／Ｏインタフェース
　１００５　　記憶媒体

Claims

　画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成する生成手段と、
　前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する決定手段と、
　を備える検出装置。
　前記対象特徴は、前記画像内の位置に応じた前記対象領域のサイズを含み、
　前記決定手段は、前記部分領域の前記画像内の位置に応じた前記対象領域の前記サイズに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項１に記載の検出装置。
　前記決定手段は、前記画像における位置に応じた当該画像の背景の特徴に基づいて、前記部分領域が前記背景と類似しているか否かを判定し、前記背景に類似していると判定された前記部分領域以外の前記部分領域から、前記対象領域を決定する
　請求項１又は２に記載の検出装置。
　前記対象特徴は、前記画像における他の対象の領域の位置に応じた前記対象の第１の出現頻度を含み、
　前記決定手段は、前記他の対象の領域の位置の情報と前記第１の出現頻度とに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項１乃至３のいずれか１項に記載の検出装置。
　前記対象特徴は、前記画像内の位置に応じた前記対象の第２の出現頻度を含み、
　前記決定手段は、前記部分領域の前記画像内の位置に応じた前記対象の前記第２の出現頻度に基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項１乃至４のいずれか１項に記載の検出装置。
　請求項１乃至５のいずれか１項に記載の検出装置と、
　前記画像を出力する入力装置と、
　受信した対象領域を示す情報を表示する出力装置と、を含み、
　前記検出装置は、
　前記画像を受信する受信手段と、
　決定した前記対象領域の情報を前記出力装置に送信する送信手段と、
　を備える
　検出システム。
　画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成し、
　前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する、
　検出方法。
　前記対象特徴は、前記画像内の位置に応じた前記対象領域のサイズを含み、
　前記部分領域の前記画像内の位置に応じた前記対象領域の前記サイズに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項７に記載の検出方法。
　前記画像における位置に応じた当該画像の背景の特徴に基づいて、前記部分領域が前記背景と類似しているか否かを判定し、前記背景に類似していると判定された前記部分領域以外の前記部分領域から、前記対象領域を決定する
　請求項７又は８に記載の検出方法。
　前記対象特徴は、前記画像における他の対象の領域の位置に応じた前記対象の第１の出現頻度を含み、
　前記他の対象の領域の位置の情報と前記第１の出現頻度とに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項７乃至９のいずれか１項に記載の検出方法。
　前記画像内の位置に応じた前記対象の第２の出現頻度を含み、
　前記部分領域の前記画像内の位置に応じた前記対象の前記第２の出現頻度に基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項７乃至１０のいずれか１項に記載の検出方法。
　コンピュータに、
　画像の画素に関連する特徴である画像特徴の類似性に基づいて、前記画像において部分領域を生成する生成処理と、
　前記画像に現れる対象の特徴である対象特徴に基づいて、前記部分領域から前記対象の領域である対象領域を決定する決定処理と、
　を実行させるプログラムを記憶する記憶媒体。
　前記対象特徴は、前記画像内の位置に応じた前記対象領域のサイズを含み、
　前記決定処理は、前記部分領域の前記画像内の位置に応じた前記対象領域の前記サイズに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項１２に記載の記憶媒体。
　前記決定処理は、前記画像における位置に応じた当該画像の背景の特徴に基づいて、前記部分領域が前記背景と類似しているか否かを判定し、前記背景に類似していると判定された前記部分領域以外の前記部分領域から、前記対象領域を決定する
　請求項１２又は１３に記載の記憶媒体。
　前記対象特徴は、前記画像における他の対象の領域の位置に応じた前記対象の第１の出現頻度を含み、
　前記決定処理は、前記他の対象の領域の位置の情報と前記第１の出現頻度とに基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項１２乃至１４のいずれか１項に記載の記憶媒体。
　前記対象特徴は、前記画像内の位置に応じた前記対象の第２の出現頻度を含み、
　前記決定処理は、前記部分領域の前記画像内の位置に応じた前記対象の前記第２の出現頻度に基づいて、前記画像特徴が類似する１つ以上の前記部分領域を前記対象領域に決定する
　請求項１２乃至１５のいずれか１項に記載の記憶媒体。