JP2021117533A

JP2021117533A - 物体検出装置、物体検出方法及び物体検出プログラム

Info

Publication number: JP2021117533A
Application number: JP2020008425A
Authority: JP
Inventors: 勝人伊佐野; Shoto Isano; 孝之瀬光; Takayuki Seko; 尭理中尾; Takamasa Nakao; 紘和阿部; Hirokazu Abe; 祐貴徳田; Yuki Tokuda; 光義山足; Mitsuyoshi Yamatari
Original assignee: Mitsubishi Electric Corp; Mitsubishi Electric Information Systems Corp
Current assignee: Mitsubishi Electric Corp; Mitsubishi Electric Information Systems Corp
Priority date: 2020-01-22
Filing date: 2020-01-22
Publication date: 2021-08-10
Anticipated expiration: 2040-01-22
Also published as: EP4071710A4; JP6935522B2; CN114981838A; US20220301276A1; WO2021149327A1; EP4071710A1

Abstract

【課題】小さく映った物体についても物体検出モデルにより検出可能にする。【解決手段】領域特定部２８は、撮影装置によって撮影領域が撮影されて得られた複数の画像データをテストデータとして、テストデータにおいて基準サイズよりも小さい物体が出現する出現数に応じて拡大領域を特定する。データ抽出部２３は、撮影領域が撮影されて得られた画像データから、拡大領域の画像データを部分データとして抽出する。サイズ変更部２４は、部分データを画像データから物体を検出するモデルである物体検出モデルによって要求される要求サイズにサイズ変更する。物体検出部２５は、サイズ変更された部分データを物体検出モデルに入力して、部分データから対象の物体を検出する。【選択図】図１１

Description

本開示は、物体検出モデルを用いて画像データから対象の物体を検出する技術に関する。

ディープラーニング等を用いて生成された物体検出モデルに対して、撮影装置で得られた画像データを入力して、画像データに含まれる対象の物体を検出することが行われている（特許文献１参照）。物体検出モデルでは、予め定められたサイズに画像データを縮小した上で、物体の検出を行う場合がある。

特開２０１９−００３３９６号公報

例えば、画像データの奥の方に映った物体は、画像データを縮小した場合には小さくなりすぎてしまい、物体検出モデルによる検出が困難になってしまう。
本開示は、小さく映った物体についても物体検出モデルにより検出可能にすることを目的とする。

本開示に係る物体検出装置は、
撮影装置によって撮影領域が撮影されて得られた複数の画像データをテストデータとして、前記テストデータにおいて基準サイズよりも小さい物体が出現する出現数であって、前記撮影領域を構成する各領域についての出現数に応じて拡大領域を特定する領域特定部と、
前記撮影領域が撮影されて得られた画像データから、前記領域特定部によって特定された前記拡大領域の画像データを部分データとして抽出するデータ抽出部と、
前記データ抽出部によって抽出された前記部分データを画像データから物体を検出するモデルである物体検出モデルによって要求される要求サイズにサイズ変更するサイズ変更部と、
前記サイズ変更部によってサイズ変更された前記部分データを前記物体検出モデルに入力して、前記部分データから対象の物体を検出する物体検出部と
を備える。

前記領域特定部は、前記出現数が閾値よりも多い領域、又は、他の領域における前記出現数が閾値よりも少ない領域を前記拡大領域として特定する。

前記領域特定部は、前記出現数が最も多い領域、又は、他の領域における前記出現数が最も少ない領域を前記拡大領域として特定する。

前記領域特定部は、
前記撮影領域における複数の領域それぞれを計算領域として、各計算領域について前記基準サイズよりも小さい物体が出現する出現数を計算する出現数計算部と、
前記出現数計算部によって計算された前記出現数が多い一部の計算領域をエリート領域として抽出するエリート抽出部と、
前記エリート抽出部によって抽出された前記エリート領域を突然変異と交叉とのいずれかによって変更した変更領域を生成する領域変更部と、
前記前記エリート領域と、前記領域変更部によって生成された前記変更領域との領域それぞれを新たに前記計算領域として設定する領域設定部と、
前記領域設定部によって基準回目に設定された前記計算領域について計算された前記出現数が前記閾値よりも多い計算領域を前記拡大領域として特定する特定部と
を備える。

前記物体検出装置は、さらに、
センサによって検出された前記テストデータに含まれる物体を対象の物体として、前記撮影装置から前記対象の物体までの距離に応じたサイズの図形を、前記対象の物体の位置に設定することにより、前記テストデータに含まれる物体の位置及びサイズを表すアノテーションデータを生成するデータ生成部
を備え、
前記領域特定部は、前記データ生成部によって生成された前記アノテーションデータに基づき、前記基準サイズよりも小さい物体が出現する出現数を計算する。

前記物体検出装置は、さらに、
前記撮影領域に検出対象の物体が存在しない状態で前記撮影領域が撮影されて得られた背景データと、前記テストデータである前記複数の画像データそれぞれとの差分がある箇所を囲む図形を設定することにより、前記テストデータに含まれる物体の位置及びサイズを表すアノテーションデータを生成するデータ生成部
を備え、
前記領域特定部は、前記データ生成部によって生成された前記アノテーションデータに基づき、前記基準サイズよりも小さい物体が出現する出現数を計算する。

前記データ抽出部は、前記撮影領域が撮影されて得られた画像データから、検出対象領域を含む領域の画像データを対象データとして抽出し、
前記サイズ変更部は、前記対象データ及び前記部分データそれぞれを前記要求サイズにサイズ変更し、
前記物体検出部は、サイズ変更された前記対象データ及び前記部分データそれぞれを前記物体検出モデルに入力して、前記対象データ及び前記部分データそれぞれから対象の物体を検出する。

前記領域特定部は、出現数が閾値よりも多い複数の領域それぞれを拡大領域として特定し、
前記データ抽出部は、各拡大領域の画像データを部分データとして抽出し、
前記サイズ変更部は、前記各拡大領域についての部分データを画像データから前記要求サイズにサイズ変更し、
前記物体検出部は、サイズ変更された前記各拡大領域についての部分データを前記物体検出モデルに入力して、前記各拡大領域についての部分データから対象の物体を検出する。

前記領域特定部は、前記基準サイズを徐々に大きくしながら、前記基準サイズよりも小さい物体が出現する出現数が最も多い領域を拡大領域として特定することにより、複数の拡大領域を特定する。

本開示に係る物体検出方法は、
領域特定部が、撮影装置によって撮影領域が撮影されて得られた複数の画像データをテストデータとして、前記テストデータにおいて基準サイズよりも小さい物体が出現する出現数であって、前記撮影領域を構成する各領域についての出現数に応じて拡大領域を特定し、
データ抽出部が、前記撮影領域が撮影されて得られた画像データから、前記拡大領域の画像データを部分データとして抽出し、
サイズ変更部が、前記部分データを画像データから物体を検出するモデルである物体検出モデルによって要求される要求サイズにサイズ変更し、
物体検出部が、サイズ変更された前記部分データを前記物体検出モデルに入力して、前記部分データから対象の物体を検出する。

本開示に係る物体検出プログラムは、
撮影装置によって撮影領域が撮影されて得られた複数の画像データをテストデータとして、前記テストデータにおいて基準サイズよりも小さい物体が出現する出現数であって、前記撮影領域を構成する各領域についての出現数に応じて拡大領域を特定する領域特定処理と、
前記撮影領域が撮影されて得られた画像データから、前記領域特定処理によって特定された前記拡大領域の画像データを部分データとして抽出するデータ抽出処理と、
前記データ抽出処理によって抽出された前記部分データを画像データから物体を検出するモデルである物体検出モデルによって要求される要求サイズにサイズ変更するサイズ変更処理と、
前記サイズ変更処理によってサイズ変更された前記部分データを前記物体検出モデルに入力して、前記部分データから対象の物体を検出する物体検出処理と
を行う物体検出装置としてコンピュータを機能させる。

本開示では、テストデータにおいて基準サイズよりも小さい物体が出現する出現数に応じて拡大領域を特定する。これにより、小さい物体についても物体検出モデルにより検出可能になる。

実施の形態１に係る物体検出装置１０の構成図。実施の形態１に係る物体検出装置１０の動作を示すフローチャート。実施の形態１に係る検出対象領域３３及び拡大領域３４を示す図。実施の形態１に係る対象データ３５及び部分データ３６を示す図。実施の形態１に係るサイズ変更処理の説明図。変形例１に係る物体検出装置１０の構成図。実施の形態２に係る拡大領域３４を示す図。実施の形態３に係る物体検出装置１０の構成図。実施の形態３に係る物体検出装置１０の動作を示すフローチャート。変形例５に係る学習装置５０の構成図。実施の形態４に係る物体検出装置１０の構成図。実施の形態４に係る物体検出装置１０の動作を示すフローチャート。実施の形態４に係る出現数計算処理の説明図。実施の形態４に係る出現数計算処理の説明図。実施の形態４に係るエリート抽出処理の説明図。実施の形態４に係る領域変更処理の説明図。実施の形態４に係る特定処理の説明図。変形例７に係る物体検出装置１０の動作を示すフローチャート。実施の形態５に係る物体検出装置１０の構成図。実施の形態５に係る距離に基づく方法の説明図。実施の形態５に係る背景差分に基づく方法の説明図。

実施の形態１．
＊＊＊構成の説明＊＊＊
図１を参照して、実施の形態１に係る物体検出装置１０の構成を説明する。
物体検出装置１０は、コンピュータである。
物体検出装置１０は、プロセッサ１１と、メモリ１２と、ストレージ１３と、通信インタフェース１４とのハードウェアを備える。プロセッサ１１は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。

プロセッサ１１は、プロセッシングを行うＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）である。プロセッサ１１は、具体例としては、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）である。

メモリ１２は、データを一時的に記憶する記憶装置である。メモリ１２は、具体例としては、ＳＲＡＭ（ＳｔａｔｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）である。

ストレージ１３は、データを保管する記憶装置である。ストレージ１３は、具体例としては、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）である。また、ストレージ１３は、ＳＤ（登録商標，ＳｅｃｕｒｅＤｉｇｉｔａｌ）メモリカード、ＣＦ（ＣｏｍｐａｃｔＦｌａｓｈ，登録商標）、ＮＡＮＤフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ（登録商標）ディスク、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）といった可搬記録媒体であってもよい。

通信インタフェース１４は、外部の装置と通信するためのインタフェースである。通信インタフェース１４は、具体例としては、Ｅｔｈｅｒｎｅｔ（登録商標）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）、ＨＤＭＩ（登録商標，Ｈｉｇｈ−ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）のポートである。

物体検出装置１０は、通信インタフェース１４を介して、監視カメラといった撮影装置４１と接続されている。

物体検出装置１０は、機能構成要素として、設定読込部２１と、画像取得部２２と、データ抽出部２３と、サイズ変更部２４と、物体検出部２５と、統合部２６とを備える。物体検出装置１０の各機能構成要素の機能はソフトウェアにより実現される。
ストレージ１３には、物体検出装置１０の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ１１によりメモリ１２に読み込まれ、プロセッサ１１によって実行される。これにより、物体検出装置１０の各機能構成要素の機能が実現される。

ストレージ１３には、物体検出モデル３１と、設定データ３２とが記憶される。

図１では、プロセッサ１１は、１つだけ示されていた。しかし、プロセッサ１１は、複数であってもよく、複数のプロセッサ１１が、各機能を実現するプログラムを連携して実行してもよい。

＊＊＊動作の説明＊＊＊
図２から図５を参照して、実施の形態１に係る物体検出装置１０の動作を説明する。
実施の形態１に係る物体検出装置１０の動作手順は、実施の形態１に係る物体検出方法に相当する。また、実施の形態１に係る物体検出装置１０の動作を実現するプログラムは、実施の形態１に係る物体検出プログラムに相当する。

（図２のステップＳ１１：設定読込処理）
設定読込部２１は、検出対象領域３３及び拡大領域３４を示す設定データ３２をストレージ１３から読み込む。
検出対象領域３３は、撮影装置４１によって撮影される撮影領域のうち対象の物体を検出する領域である。
拡大領域３４は、検出対象領域３３のうち小さく映った物体を検出する領域である。実施の形態１では、図３に示すように、拡大領域３４は、画像データの奥の方の領域である。つまり、実施の形態１では、拡大領域３４は、検出対象領域３３における撮影装置４１の撮影領域のうち奥行方向の距離が基準距離以上の領域を含む領域である。なお、奥行方向の手前側の領域であっても小さな物体を対象の物体として扱う領域については、拡大領域３４として設定される可能性もある。また、検出対象領域３３のうち拡大領域３４を複数設定してもよい。

実施の形態１では、検出対象領域３３及び拡大領域３４を示す設定データ３２は、物体検出装置１０の管理者等によって事前に設定され、ストレージ１３に記憶されるものとした。しかし、ステップＳ１１の処理において、設定読込部２１が検出対象領域３３及び拡大領域３４を管理者等に指定させてもよい。つまり、例えば、設定読込部２１は、撮影領域を表示して、撮影領域のうちどの領域を検出対象領域３３とし、どの領域を拡大領域３４とするかを指定させ、その指定に基づき、設定データ３２を生成する機能を有してもよい。また設定データ３２を撮影装置４１ごとに、又は、撮影装置４１をグルーピングしたグループごとに、ストレージ１３に記憶するように構成してもよい。その場合、ステップＳ１１では、画像データを取得する撮影装置４１に対応した設定データ３２が読み込まれる。

（図２のステップＳ１２：画像取得処理）
画像取得部２２は、通信インタフェース１４を介して、撮影装置４１によって撮影領域が撮影されて得られた最新のフレームの画像データを取得する。

（図２のステップＳ１３：データ抽出処理）
データ抽出部２３は、ステップＳ１２で取得された画像データのうち、ステップＳ１１で読み込まれた設定データ３２が示す検出対象領域３３を含む領域の画像データを対象データ３５として抽出する。実施の形態１では、データ抽出部２３は、ステップＳ１２で取得された画像データをそのまま対象データ３５に設定する。また、データ抽出部２３は、対象データのうち、ステップＳ１１で読み込まれた設定データ３２が示す拡大領域３４の画像データを部分データ３６として抽出する。
具体例としては、ステップＳ１２で図４に示す画像データが取得された場合には、データ抽出部２３は、図４に示す画像データをそのまま対象データ３５に設定し、図４に示す画像データのうち拡大領域３４部分の画像データを部分データ３６として抽出する。

（図２のステップＳ１４：サイズ変更処理）
サイズ変更部２４は、抽出された対象データ３５及び部分データ３６それぞれを物体検出モデル３１によって要求される要求サイズにサイズ変更する。物体検出モデル３１は、ディープラーニングといった手法によって生成されたモデルであり、画像データから対象の物体を検出するモデルである。
具体例としては、図５に示すように、対象データ３５が横１９２０ピクセル×縦１２００ピクセルの画像データであり、部分データ３６が横３２０ピクセル×縦２４０ピクセルの画像データであったとする。また、要求サイズが横５１２ピクセル×縦５１２ピクセルであったとする。この場合には、サイズ変更部２４は、対象データ３５を縮小して、横５１２ピクセル×縦５１２ピクセルの画像データに変換する。また、サイズ変更部２４は、部分データ３６を拡大して、横５１２ピクセル×縦５１２ピクセルの画像データに変換する。
なお、対象データ３５については、原則として縮小されることを想定する。つまり、要求サイズは、対象データ３５のサイズよりも小さいことを想定する。しかし、部分データ３６については、拡大領域３４の大きさによって拡大される場合と縮小される場合とがある。但し、部分データ３６は、対象データ３５の一部の画像データであるため、縮小される場合であっても対象データ３５ほどの倍率で縮小されることはない。

（図２のステップＳ１５：物体検出処理）
物体検出部２５は、ステップＳ１４でサイズ変更された対象データ３５及び部分データ３６それぞれを物体検出モデル３１に入力して、対象データ３５及び部分データ３６それぞれから対象の物体を検出する。そして、物体検出部２５は、対象データ３５から検出された結果を第１結果データ３７とし、部分データ３６から検出された結果を第２結果データ３８とする。
具体例としては、物体検出部２５は、図５に示すように横５１２ピクセル×縦５１２ピクセルの画像データに変換された対象データ３５及び部分データ３６それぞれを物体検出モデル３１に入力する。すると、対象データ３５からは物体Ｘが検出される。また、部分データ３６からは物体Ｙが検出される。なお、対象データ３５にも物体Ｙは含まれている。しかし、対象データ３５では物体Ｙは非常に小さいため、対象データ３５から物体Ｙは検出されない可能性がある。

（図２のステップＳ１６：統合処理）
統合部２６は、対象データ３５から抽出された結果を示す第１結果データ３７と、部分データ３６から抽出された第２結果データ３８とを統合した統合結果データを生成する。
この際、第１結果データ３７及び第２結果データ３８に同一の物体が含まれている可能性がある。具体例としては、図５に示す対象データ３５からも物体Ｙが検出された場合には、対象データ３５及び部分データ３６から同一の物体Ｙが検出されることになる。そこで、統合部２６は、同一の物体については１つの物体になるように、第１結果データ３７と第２結果データ３８とを統合する。つまり、統合部２６は、対象データ３５及び部分データ３６から同一の物体Ｙが検出された場合であっても、統合結果データには物体Ｙが１つだけ含まれるように、第１結果データ３７と第２結果データ３８とを統合する。
例えば、統合部２６は、ＮＭＳ（ＮｏｎＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）といった手法を用いて、第１結果データ３７と第２結果データ３８とを統合する。

＊＊＊実施の形態１の効果＊＊＊
以上のように、実施の形態１に係る物体検出装置１０は、対象データ３５だけでなく部分データ３６も要求サイズにサイズ変更した上で、物体検出モデル３１に入力して対象の物体を検出する。これにより、画像データの奥の方に映った物体のように、小さく映った物体についても物体検出モデル３１により検出可能になる。

つまり、図５の対象データ３５には物体Ｘ及び物体Ｙが含まれている。しかし、物体検出モデル３１に入力される場合には、対象データ３５が要求サイズにサイズ変更されてしまい、物体Ｙは非常に小さくなってしまう。そのため、対象データ３５からは、本来検出されるべき物体Ｙは検出されなくなってしまう。
しかし、対象データ３５とは別に部分データ３６についても要求サイズにサイズ変更された上で、物体検出モデル３１に入力される。部分データ３６は、対象データ３５の一部の画像データである。したがって、サイズ変更された後の部分データ３６に含まれる物体Ｙは、サイズ変更された後の対象データ３５に含まれる物体Ｙに比べ大きい。そのため、部分データ３６からは物体Ｙが検出しやすくなる。

また、実施の形態１に係る物体検出装置１０は、同一の物体については１つの物体になるように、第１結果データ３７と第２結果データ３８とを統合して統合結果データを生成する。これにより、１つの物体が対象データ３５あるいは部分データ３６の一方から検出された場合、対象データ３５および部分データ３６の双方から検出された場合のどちらの場合も、１つの物体が検出された統合結果データを得ることができる。

＊＊＊他の構成＊＊＊
＜変形例１＞
撮影装置４１と物体を検知したい領域との距離又は角度等により、拡大領域３４は画像データの奥の方の領域に限定されずに、中央付近の領域とする場合が考えられる。また撮影装置４１の撮影領域によっては、拡大領域３４を複数設定する場合もある。
つまり小さく映った物体を検出する領域として、拡大領域３４は画像データ上の任意の領域を範囲として、任意の数の設定を行うことができる。それらの個別の条件を撮影装置４１ごとの設定データ３２に設定することにより、撮影装置４１ごとに部分データ３６の抽出が可能となる。

＜変形例２＞
実施の形態１では、各機能構成要素がソフトウェアで実現された。しかし、変形例２として、各機能構成要素はハードウェアで実現されてもよい。この変形例２について、実施の形態１と異なる点を説明する。

図６を参照して、変形例２に係る物体検出装置１０の構成を説明する。
各機能構成要素がハードウェアで実現される場合には、物体検出装置１０は、プロセッサ１１とメモリ１２とストレージ１３とに代えて、電子回路１５を備える。電子回路１５は、各機能構成要素と、メモリ１２と、ストレージ１３との機能とを実現する専用の回路である。

電子回路１５としては、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックＩＣ、ＧＡ（ＧａｔｅＡｒｒａｙ）、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）が想定される。
各機能構成要素を１つの電子回路１５で実現してもよいし、各機能構成要素を複数の電子回路１５に分散させて実現してもよい。

＜変形例３＞
変形例３として、一部の各機能構成要素がハードウェアで実現され、他の各機能構成要素がソフトウェアで実現されてもよい。

プロセッサ１１とメモリ１２とストレージ１３と電子回路１５とを処理回路という。つまり、各機能構成要素の機能は、処理回路により実現される。

実施の形態２．
実施の形態２は、部分データ３６のみを物体検出モデル３１に入力する点が実施の形態１と異なる。実施の形態２では、この異なる点を説明し、同一の点については説明を省略する。

＊＊＊動作の説明＊＊＊
図２及び図７を参照して、実施の形態２に係る物体検出装置１０の動作を説明する。
実施の形態２に係る物体検出装置１０の動作手順は、実施の形態２に係る物体検出方法に相当する。また、実施の形態２に係る物体検出装置１０の動作を実現するプログラムは、実施の形態２に係る物体検出プログラムに相当する。

ステップＳ１２の処理は、実施の形態１と同じである。

（図２のステップＳ１１：設定読込処理）
設定読込部２１は、実施の形態１と同様に、検出対象領域３３及び拡大領域３４を示す設定データ３２をストレージ１３から読み込む。
実施の形態２では、図７に示すように、検出対象領域３３を概ね覆うように複数の拡大領域３４が設定されている。各拡大領域３４は、撮影装置４１によって得られる画像データの位置に応じたサイズの領域が設定される。つまり、拡大領域３４は、対象の物体が小さい位置ほど、小さい領域が設定される。例えば、拡大領域３４は、画像データの奥の方の領域ほど小さいサイズの領域が設定され、画像データの手前の方の領域ほど大きいサイズの領域が設定される。

（図２のステップＳ１３：データ抽出処理）
データ抽出部２３は、ステップＳ１２で取得された画像データのうち、ステップＳ１１で読み込まれた設定データ３２が示す複数の拡大領域３４それぞれの画像データを部分データ３６として抽出する。

（図２のステップＳ１４：サイズ変更処理）
サイズ変更部２４は、抽出された複数の部分データ３６それぞれを物体検出モデル３１によって要求される要求サイズにサイズ変更する。

（図２のステップＳ１５：物体検出処理）
物体検出部２５は、ステップＳ１４でサイズ変更された複数の部分データ３６それぞれを物体検出モデル３１に入力して、複数の部分データ３６それぞれから対象の物体を検出する。そして、物体検出部２５は、複数の部分データ３６それぞれから検出された結果を第２結果データ３８とする。

（図２のステップＳ１６：統合処理）
統合部２６は、複数の部分データ３６それぞれから抽出された第２結果データ３８を統合した統合結果データを生成する。この際、複数の第２結果データ３８に同一の物体が含まれている可能性がある。そこで、統合部２６は、同一の物体については１つの物体になるように、複数の第２結果データ３８を統合する。

＊＊＊実施の形態２の効果＊＊＊
以上のように、実施の形態２に係る物体検出装置１０は、画像データにおける位置に応じたサイズの複数の拡大領域３４を設定し、各拡大領域３４の部分データ３６を入力として対象の物体を検出する。これにより、画像データにおける位置に応じた適切なサイズの画像データから物体検出モデル３１により検出が行われることになる。その結果、検出精度が高くなる可能性がある。
なお図７を用いて説明した拡大領域３４は、検出対象領域３３を概ね覆うように複数設定されているが、必ずしも拡大領域３４で検出対象領域３３を覆う必要はない。撮影装置４１の撮影領域に応じて、検出対象領域３３上に重点的に検出すべき領域や物体がある場合、逆に検出対象領域３３上に検出不要とする領域がある場合、撮影装置４１毎に検出対象領域３３の一部に複数の拡大領域３４を設定するように、設定データ３２を設定してもよい。

実施の形態３．
実施の形態３は、物体検出モデル３１を生成する点が実施の形態１，２と異なる。実施の形態２では、この異なる点を説明し、同一の点については説明を省略する。
実施の形態３では、実施の形態１に対応した物体検出モデル３１を生成する場合について説明する。

＊＊＊構成の説明＊＊＊
図８を参照して、実施の形態３に係る物体検出装置１０の構成を説明する。
物体検出装置１０は、機能構成要素として、学習部２７を備える点が実施の形態１と異なる。学習部２７は、他の機能構成要素と同様に、ソフトウェア又はハードウェアによって実現される。

＊＊＊動作の説明＊＊＊
図９を参照して、実施の形態３に係る物体検出装置１０の動作を説明する。
実施の形態３に係る物体検出装置１０の動作手順は、実施の形態３に係る物体検出方法に相当する。また、実施の形態３に係る物体検出装置１０の動作を実現するプログラムは、実施の形態３に係る物体検出プログラムに相当する。

ステップＳ２１からステップＳ２４の処理は、実施の形態１における図２のステップＳ１１からステップＳ１４の処理と同じである。

（図９のステップＳ２５：学習処理）
学習部２７は、ステップＳ２３でサイズ変更された対象データ３５及び部分データ３６それぞれを学習データとして与えることにより、ディープラーニングといった処理により物体検出モデル３１を生成する。ここで、対象データ３５及び部分データ３６は、図２で説明した処理における対象データ３５及び部分データ３６と同じ領域の画像データである。
なお、対象データ３５及び部分データ３６それぞれについて、含まれる対象の物体が人手等で特定され教師付きの学習データが生成されてもよい。そして、学習部２７は、教師付きの学習データを与えて学習させてもよい。

＊＊＊実施の形態３の効果＊＊＊
以上のように、実施の形態３に係る物体検出装置１０は、対象データ３５だけでなく部分データ３６も学習データとして与えることにより、物体検出モデル３１を生成する。部分データ３６は、サイズの拡大に伴い、対象データ３５と比較すると、一部又は全体の画像が不鮮明になる可能性がある。拡大に伴い、不鮮明な部分を含む画像データが学習データとして与えられていない場合には、不鮮明な部分を含む画像データからの検出精度が低くなってしまう場合がある。
そのため、対象データ３５だけを学習データとして与え物体検出モデル３１を生成すると、部分データ３６から物体を検出する処理の精度が低くなる可能性がある。しかし、実施の形態３に係る物体検出装置１０は、部分データ３６も学習データとして与えることにより、部分データ３６から物体を検出する処理の精度を高くすることができる。

＊＊＊他の構成＊＊＊
＜変形例４＞
実施の形態３では、実施の形態１に対応した物体検出モデル３１を生成する場合について説明した。実施の形態２に対応した物体検出モデル３１を生成することも可能である。
この場合には、ステップＳ２１からステップＳ２４の処理は、実施の形態２における図２のステップＳ１１からステップＳ１４の処理と同じである。図９のステップＳ２５では、学習部２７は、ステップＳ２３でサイズ変更された複数の部分データ３６それぞれを学習データとして与えることにより、ディープラーニングといった処理により物体検出モデル３１を生成する。これにより、実施の形態３と同様の効果を奏する。

＜変形例５＞
実施の形態３及び変形例４では、物体検出装置１０が物体検出モデル３１を生成した。しかし、物体検出装置１０とは別の学習装置５０が物体検出モデル３１を生成してもよい。
図１０に示すように、学習装置５０は、コンピュータである。学習装置５０は、プロセッサ５１と、メモリ５２と、ストレージ５３と、通信インタフェース５４とのハードウェアを備える。プロセッサ５１とメモリ５２とストレージ５３と通信インタフェース５４とは、物体検出装置１０のプロセッサ１１とメモリ１２とストレージ１３と通信インタフェース１４と同じである。
学習装置５０は、機能構成要素として、設定読込部６１と、画像取得部６２と、データ抽出部６３と、サイズ変更部６４と、学習部６５とを備える。学習装置５０の各機能構成要素の機能はソフトウェアにより実現される。設定読込部６１と画像取得部６２とデータ抽出部６３とサイズ変更部６４と学習部６５とは、物体検出装置１０の設定読込部２１と画像取得部２２とデータ抽出部２３とサイズ変更部２４と学習部２７と同じである。

なお、各実施の形態における物体検出装置１０は、無人搬送車（ＡＧＶ，Ａｕｔｏｍａｔｅｄｇｕｉｄｅｄｖｅｈｉｃｌｅ）に適用するようにしてもよい。誘導方式として画像認識方式を採用する無人搬送車においては、床や天井に描かれた記号を読み取り、それによって自車の位置を把握するようにしている。本開示における物体検出装置を無人搬送車に適用することで、小さく映ったマークについても検出できるようになるため、より高精度な移動が可能な無人搬送車を提供することができる。

実施の形態４．
実施の形態４では、拡大領域の特定方法を説明する。実施の形態４では、実施の形態１と異なる点を説明し、同一の点については説明を省略する。

＊＊＊構成の説明＊＊＊
図１１を参照して、実施の形態４に係る物体検出装置１０の構成を説明する。
物体検出装置１０は、機能構成要素として領域特定部２８を備える点が図１に示す物体検出装置１０と異なる。なお、図１１では、図１に示す機能構成要素が省略されている。領域特定部２８は、データ取得部２８１と、出現数計算部２８２と、エリート抽出部２８３と、領域変更部２８４と、領域設定部２８５と、特定部２８６とを備える。領域特定部２８は、他の機能構成要素と同様に、ソフトウェア又はハードウェアによって実現される。

＊＊＊動作の説明＊＊＊
図１２から図１７を参照して、実施の形態４に係る物体検出装置１０の動作を説明する。
実施の形態４に係る物体検出装置１０の動作手順は、実施の形態４に係る物体検出方法に相当する。また、実施の形態４に係る物体検出装置１０の動作を実現するプログラムは、実施の形態４に係る物体検出プログラムに相当する。

領域特定部２８は、撮影装置４１によって撮影領域が撮影されて得られた複数の画像データをテストデータに設定する。領域特定部２８は、テストデータにおいて基準サイズよりも小さい物体が出現する出現数であって、撮影領域を構成する各領域についての出現数に応じて拡大領域３４を特定する。
具体的には、領域特定部２８は、出現数が閾値よりも多い領域、又は、他の領域における出現数が閾値よりも少ない領域を拡大領域として特定する。領域特定部２８は、出現数が閾値よりも多い複数の領域をそれぞれ拡大領域３４としてもよいし、出現数が最も多い領域を拡大領域３４としてもよい。また、領域特定部２８は、複数の領域を除く他の領域における出現数が閾値よりも少なくなるような複数の領域それぞれを拡大領域３４としてもよいし、他の領域における出現数が最も少なくなる１つの領域を拡大領域３４としてもよい。

実施の形態４では、遺伝的アルゴリズムを用いて拡大領域３４を特定する。図２のステップＳ１１では、領域特定部２８によって特定された拡大領域３４を示す設定データ３２が読み込まれる。

ここでは、出現数が多い１つの領域を拡大領域３４として特定する場合について説明する。

（図１２のステップＳ３１：データ取得処理）
データ取得部２８１は、テストデータである各画像データについてのアノテーションデータ７１を取得する。
アノテーションデータ７１は、画像データに含まれる各物体について、種別と、位置と、サイズとを示すデータである。種別は、車両と人といった物体の分類を表す。位置は、画像データにおいて物体が位置する座標値である。サイズは、実施の形態４では、物体を囲む矩形の大きさである。

（図１２のステップＳ３２：初期設定処理）
領域設定部２８５は、撮影領域における複数の領域それぞれを初期の計算領域として設定する。領域設定部２８５は、例えば、各計算領域をランダムに設定する。実施の形態４では、計算領域の縦及び横のサイズは予め定められた一定サイズとする。

ステップＳ３３からステップＳ３５の処理が基準回−１繰り返し実行される。ここでは、基準回をＮ＿ＧＥＮと表す。

（図１２のステップＳ３３：出現数計算処理）
出現数計算部２８２は、ステップＳ３１で取得されたアノテーションデータ７１を入力として、各計算領域について基準サイズよりも小さい物体が出現する出現数を計算する。
具体的には、出現数計算部２８２は、アノテーションデータ７１から対象の種別についてのデータを抽出する。出現数計算部２８２は、抽出された対象の種別についてのデータから、基準サイズよりも小さい物体のデータを抽出する。基準サイズは、事前に設定されたサイズである。基準サイズは、例えば、物体検出モデル３１による検出精度が基準値よりも悪くなるサイズである。出現数計算部２８２は、各計算領域を対象として、アノテーションデータ７１が示す位置が対象の計算領域に含まれる物体の数を、対象の計算領域についての出現数として計算する。
ここでは、計算領域の数をＮ＿ＰＯＰ個であるとする。

図１３及び図１４を参照して具体例を説明する。
図１３では、対象の種別は車両としている。また、図１３の下部に示すアノテーションデータ７１では、位置情報として物体を囲む矩形の左上の座標値をｘｍｉｎ及びｙｍｉｎとし、物体を囲む矩形の右下の座標値をｘｍａｘ及びｙｍａｘとしている。また、図１３のアノテーションデータ７１では、ｘｍｉｎ及びｙｍｉｎとｘｍａｘ及びｙｍａｘとから特定される矩形のサイズを、画像データのサイズで除して得られた値を物体のサイズｏｂｊ＿ｓｉｚｅとしている。基準サイズが０．００２である場合には、図１３の右側に示すように、ｏｂｊ＿ｓｉｚｅが基準サイズより小さい８個の物体のデータが抽出される。
そして、図１４に示すように、各計算領域を対象として、対象の計算領域に含まれる物体の数が計算される。図１４では、抽出された全ての物体に対する対象の計算領域に含まれる物体の割合がスコアとして計算されている。なお、図１４では、各計算領域は、左上の座標値であるｘｍｉｎ及びｙｍｉｎで表されている。上述した通り、計算領域の形状及びサイズは一定であるため、左上の座標値が分かれば計算領域を特定可能である。
なおスコアは、ステップＳ３３で説明した、出現数計算部２８２が算出する出現数の具体例である。計算領域が一定の形状及びサイズである場合、スコアではなく、出現数で以降の処理を行ってもよい。

（図１２のステップＳ３４：エリート抽出処理）
エリート抽出部２８３は、ステップＳ３４で計算された出現数が多い一部の計算領域をエリート領域として抽出する。
具体的には、エリート抽出部２８３は、出現数が多い方から、抽出数の計算領域をエリート領域として抽出する。抽出数は、事前に設定される。抽出数は、例えば、計算領域数の２割と設定される。

図１５では、図１４と同様に、各計算領域について上述したスコアが計算されている。スコアの高い順に抽出数の計算領域がエリート領域として抽出される。これにより、出現数が多い抽出数の計算領域がエリート領域として抽出されることになる。

（図１２のステップＳ３５：領域変更処理）
領域変更部２８４は、ステップＳ３４で抽出されたエリート領域を突然変異と交叉とのいずれかによって変更して変更領域を生成する。ここでは、領域変更部２８４は、Ｎ＿ＰＯＰから抽出数を減算した数だけ、変更領域を生成する。
具体的には、領域変更部２８４は、変異確率で突然変異を採用し、（１−変異確率）で交叉を採用する。領域変更部２８４は、採用された突然変異又は交叉によって、エリート領域を変更して、変更領域を生成する。
ここで、突然変異による変更では、領域変更部２８４は、あるエリート領域のｘｍｉｎ又はｙｍｉｎをランダムに変更して変更領域を生成する。図１６では、１行目のエリート領域のｙｍｉｎがランダムに変更されて、変更領域が生成されている。交叉による変更では、領域変更部２８４は、ある２つのエリート領域のうち一方のエリート領域のｘｍｉｎと他方のエリート領域のｙｍｉｎとを採用して、変更領域を生成する。図１６では、２行目のエリート領域のｙｍｉｎと３行目のエリート領域のｘｍｉｎとが採用されて、変更領域が生成されている。
領域設定部２８５は、ステップＳ３４で抽出されたエリート領域と、生成された変更領域とのそれぞれを新たな計算領域として設定する。これにより、Ｎ＿ＰＯＰ個の計算領域が新たに設定される。

（図１２のステップＳ３６：特定処理）
出現数計算部２８２は、基準回目（Ｎ＿ＧＥＮ目）のステップＳ３５で設定された各計算領域について出現数を計算する。そして、特定部２８６は、計算された出現数が閾値よりも多い計算領域を拡大領域３４として特定する。ここでは、特定部２８６は、出現数が閾値よりも多い領域のうち、最も出現数が多い計算領域を拡大領域３４として設定する。その結果、図１７のように、多くの小さい物体を含む領域が拡大領域３４として設定される。
なお、特定部２８６は、出現数が閾値よりも多い領域のうち、２つ以上の計算領域を拡大領域３４として設定してもよい。また閾値は、０以上の整数を任意に設定することができる。

ここでは、出現数が多い１つの領域を拡大領域３４として特定する場合について説明した。しかし、以下のように変更することにより、他の領域における出現数が少ない領域を拡大領域３４として特定することも可能である。
ステップＳ３３及びステップＳ３６で出現数計算部２８２が各計算領域を対象として、対象の計算領域外にある小さい物体の出現数を計算する。ステップＳ３４でエリート抽出部２８３が、計算領域外の出現数が少ない方から、抽出数の計算領域をエリート領域として抽出する。ステップＳ３６で計算領域外の出現数が少ない計算領域のうち、最も出現数が少ない計算領域を拡大領域３４として設定する。なお、この場合にも、特定部２８６は、２つ以上の計算領域を拡大領域３４として設定してもよい。
また出現数が閾値より多い領域が特定できない場合、基準サイズの数値が小さいと判定し、基準サイズの数値を大きく変更することも可能である。つまり出現数が閾値より多くなる領域が特定できないのは、基準サイズの設定が小さいためと判定し、基準サイズを大きくすることにより、出現数を増やすように動作する。

＊＊＊実施の形態４の効果＊＊＊
以上のように、実施の形態４に係る物体検出装置１０は、テストデータにおいて基準サイズよりも小さい物体が出現する出現数に応じて拡大領域３４を特定する。これにより、拡大領域３４を適切に設定することが可能である。その結果、小さく映った物体についても物体検出モデル３１により検出可能になる。
なおテストデータとは、前述したとおり、拡大領域３４を設定するため、撮影装置４１によって撮影領域が撮影されて得られた複数の画像データを示すが、学習データであってもよい。

実施の形態４に係る物体検出装置１０は、遺伝的アルゴリズムを用いて拡大領域３４を設定する。最適化手法としては、遺伝的アルゴリズム以外にも、アニーリングといった他の手法があり、遺伝的アルゴリズムに代えて他の最適化手法を用いることも可能である。しかし、遺伝的アルゴリズムでは、突然変異と交叉とを用いて変更領域を生成するため、アニーリングのように局所安定に陥りにくく、一定基準値以上の解を少ない計算量で求めることができる。

＊＊＊他の構成＊＊＊
＜変形例６＞
計算領域を大きくすれば多くの小さい物体を含み易くなり、画像データ全体を計算領域とすれば全ての小さい物体を含むことになる。そのため、計算領域のサイズを任意に変更可能としてしまうと、処理を繰り返し、最適化が進むにつれ、計算領域のサイズが大きくなる可能性が高い。拡大領域３４のサイズが大きくなってしまうと、小さい物体を検出可能にするという目的を達成できなくなってしまう。そのため、実施の形態４では、計算領域のサイズは一定とした。
しかし、事前に設定した上限以下であれば、計算領域のサイズを変更可能にしてもよい。なお、アスペクト比が変わると、物体検出モデル３１での検出に悪影響を及ぼす恐れがある。そのため、アスペクト比は固定してもよい。

＜変形例７＞
実施の形態４では、実施の形態１における拡大領域３４を特定することを想定した。しかし、実施の形態２における拡大領域３４を特定することも可能である。
実施の形態２における拡大領域３４は、検出対象領域３３を概ね覆うように設定される必要がある。そこで、物体検出装置１０は、図１８に示す処理を行う。

ステップＳ３１からステップＳ３６の処理は、実施の形態４と同じである。

（図１８のステップＳ３７：繰り返し判定処理）
特定部２８６は、検出対象領域３３の基準割合以上が過去に特定された拡大領域３４によって覆われているか否かを判定する。
特定部２８６は、基準割合以上が覆われている場合には、処理を終了する。一方、特定部２８６は、基準割合以上が覆われていない場合には、基準サイズを大きくした上で、処理をステップＳ３２に戻す。

基準サイズを大きくすることにより、異なる領域が拡大領域３４として選択されるようになる。その結果、検出対象領域３３を概ね覆うように複数の拡大領域３４を設定することが可能になる。

実施の形態５．
実施の形態５では、アノテーションデータ７１を簡易的に設定する方法を説明する。実施の形態５では、実施の形態４と異なる点を説明し、同一の点については説明を省略する。

＊＊＊構成の説明＊＊＊
図１９を参照して、実施の形態５に係る物体検出装置１０の構成を説明する。
物体検出装置１０は、機能構成要素として、データ生成部２９を備える点が図１１に示す物体検出装置１０と異なる。データ生成部２９は、他の機能構成要素と同様に、ソフトウェア又はハードウェアによって実現される。

＊＊＊動作の説明＊＊＊
図２０及び図２１を参照して、実施の形態５に係る物体検出装置１０の動作を説明する。
実施の形態５に係る物体検出装置１０の動作手順は、実施の形態５に係る物体検出方法に相当する。また、実施の形態５に係る物体検出装置１０の動作を実現するプログラムは、実施の形態５に係る物体検出プログラムに相当する。

ここでは、距離に基づく方法と、背景差分に基づく方法との２つの方法を説明する。

＜距離に基づく方法＞
データ生成部２９は、センサによって検出されたテストデータに含まれる物体を対象の物体として設定する。例えば、テストデータである画像データが取得された際に、ＬｉＤＡＲ（ＬｉｇｈｔＤｅｔｅｃｔｉｏｎａｎｄＲａｎｇｉｎｇ）等によって撮影領域に存在する物体が検出されたとする。ＬｉＤＡＲによって照射されたレーザ光が物体に到達するまでの時間から、撮影装置４１から対象の物体までの距離が特定される。撮影装置４１から対象の物体までの距離の逆数は、対象の物体のサイズと相関がある。
そこで、図２０に示すように、データ生成部２９は、撮影装置４１から対象の物体までの距離に応じたサイズの図形を対象の物体の位置に設定する。図２０では、図形として円７２が設定されている。そして、データ生成部２９は、設定された図形を囲む矩形を対象の物体についてのバウンディングボックス７３として設定する。データ生成部２９は、バウンディングボックス７３のサイズを対象の物体のサイズとすることにより、対象の物体についてのアノテーションデータ７１を生成することができる。

なお、画像データとＬｉＤＡＲの情報とは事前にキャリブレーションされている必要がある。つまり、画像データにおける位置と、ＬｉＤＡＲによるレーザ光の照射方向とを対応付けるとともに、画像データの撮影時刻と、ＬｉＤＡＲによるレーザ光の照射時刻とを対応付ける必要がある。

＜背景差分に基づく方法＞
図２１に示すように、データ生成部２９は、撮影領域に検出対象の物体が存在しない状態で撮影領域が撮影されて得られた背景データと、テストデータである複数の画像データそれぞれとの差分がある箇所を囲む矩形をバウンディングボックス７３として設定する。具体的には、データ生成部２９は、連続して差異がある部分を１つの物体として、１つのバウンディングボックス７３で囲む。データ生成部２９は、バウンディングボックス７３のサイズを対象の物体のサイズとすることにより、対象の物体についてのアノテーションデータ７１を生成することができる。

なお、上述した２つの方法では、物体の位置及びサイズが特定される。しかし、アノテーションデータ７１には、物体の種別が必要である。物体の種別については、画像データを小さい画像データに分割して、各小さい画像データを入力として、物体検出モデルによって特定するといった方法により特定すればよい。

＊＊＊実施の形態５の効果＊＊＊
以上のように、実施の形態５に係る物体検出装置１０は、アノテーションデータ７１を簡易的に生成する。実施の形態４で説明した拡大領域３４の設定方法では、前提としてテストデータのアノテーションデータ７１が必要である。しかし、アノテーションデータ７１を人手により生成するには手間がかかる。しかし、実施の形態５に係る物体検出装置１０は、多少の誤差が含まれる恐れがあるものの、アノテーションデータ７１を簡易的に生成可能である。

以上、本開示の実施の形態及び変形例について説明した。これらの実施の形態及び変形例のうち、いくつかを組み合わせて実施してもよい。また、いずれか１つ又はいくつかを部分的に実施してもよい。なお、本開示は、以上の実施の形態及び変形例に限定されるものではなく、必要に応じて種々の変更が可能である。

１０物体検出装置、１１プロセッサ、１２メモリ、１３ストレージ、１４通信インタフェース、１５電子回路、２１設定読込部、２２画像取得部、２３データ抽出部、２４サイズ変更部、２５物体検出部、２６統合部、２７学習部、２８領域特定部、２８１データ取得部、２８２出現数計算部、２８３エリート抽出部、２８４領域変更部、２８５領域設定部、２８６特定部、２９データ生成部、３１物体検出モデル、３２設定データ、３３検出対象領域、３４拡大領域、３５対象データ、３６部分データ、３７第１結果データ、３８第２結果データ、４１撮影装置、５０学習装置、５１プロセッサ、５２メモリ、５３ストレージ、５４通信インタフェース、６１設定読込部、６２画像取得部、６３データ抽出部、６４サイズ変更部、６５学習部、７１アノテーションデータ、７２円、７３バウンディングボックス。

Claims

撮影装置によって撮影領域が撮影されて得られた複数の画像データをテストデータとして、前記テストデータにおいて基準サイズよりも小さい物体が出現する出現数であって、前記撮影領域を構成する各領域についての出現数に応じて拡大領域を特定する領域特定部と、
前記撮影領域が撮影されて得られた画像データから、前記領域特定部によって特定された前記拡大領域の画像データを部分データとして抽出するデータ抽出部と、
前記データ抽出部によって抽出された前記部分データを画像データから物体を検出するモデルである物体検出モデルによって要求される要求サイズにサイズ変更するサイズ変更部と、
前記サイズ変更部によってサイズ変更された前記部分データを前記物体検出モデルに入力して、前記部分データから対象の物体を検出する物体検出部と
を備える物体検出装置。
前記領域特定部は、前記出現数が閾値よりも多い領域、又は、他の領域における前記出現数が閾値よりも少ない領域を前記拡大領域として特定する
請求項１に記載の物体検出装置。
前記領域特定部は、前記出現数が最も多い領域、又は、他の領域における前記出現数が最も少ない領域を前記拡大領域として特定する
請求項１又は２に記載の物体検出装置。
前記領域特定部は、
前記撮影領域における複数の領域それぞれを計算領域として、各計算領域について前記基準サイズよりも小さい物体が出現する出現数を計算する出現数計算部と、
前記出現数計算部によって計算された前記出現数が多い一部の計算領域をエリート領域として抽出するエリート抽出部と、
前記エリート抽出部によって抽出された前記エリート領域を突然変異と交叉とのいずれかによって変更した変更領域を生成する領域変更部と、
前記エリート領域と、前記領域変更部によって生成された前記変更領域との領域それぞれを新たに前記計算領域として設定する領域設定部と、
前記領域設定部によって基準回目に設定された前記計算領域について計算された前記出現数が前記閾値よりも多い計算領域を前記拡大領域として特定する特定部と
を備える請求項１から３までのいずれか１項に記載の物体検出装置。
前記物体検出装置は、さらに、
センサによって検出された前記テストデータに含まれる物体を対象の物体として、前記撮影装置から前記対象の物体までの距離に応じたサイズの図形を、前記対象の物体の位置に設定することにより、前記テストデータに含まれる物体の位置及びサイズを表すアノテーションデータを生成するデータ生成部
を備え、
前記領域特定部は、前記データ生成部によって生成された前記アノテーションデータに基づき、前記基準サイズよりも小さい物体が出現する出現数を計算する
請求項１から４までのいずれか１項に記載の物体検出装置。
前記物体検出装置は、さらに、
前記撮影領域に検出対象の物体が存在しない状態で前記撮影領域が撮影されて得られた背景データと、前記テストデータである前記複数の画像データそれぞれとの差分がある箇所を囲む図形を設定することにより、前記テストデータに含まれる物体の位置及びサイズを表すアノテーションデータを生成するデータ生成部
を備え、
前記領域特定部は、前記データ生成部によって生成された前記アノテーションデータに基づき、前記基準サイズよりも小さい物体が出現する出現数を計算する
請求項１から４までのいずれか１項に記載の物体検出装置。
前記データ抽出部は、前記撮影領域が撮影されて得られた画像データから、検出対象領域を含む領域の画像データを対象データとして抽出し、
前記サイズ変更部は、前記対象データ及び前記部分データそれぞれを前記要求サイズにサイズ変更し、
前記物体検出部は、サイズ変更された前記対象データ及び前記部分データそれぞれを前記物体検出モデルに入力して、前記対象データ及び前記部分データそれぞれから対象の物体を検出する
請求項１から６までのいずれか１項に記載の物体検出装置。
前記領域特定部は、出現数が閾値よりも多い複数の領域それぞれを拡大領域として特定し、
前記データ抽出部は、各拡大領域の画像データを部分データとして抽出し、
前記サイズ変更部は、前記各拡大領域についての部分データを画像データから前記要求サイズにサイズ変更し、
前記物体検出部は、サイズ変更された前記各拡大領域についての部分データを前記物体検出モデルに入力して、前記各拡大領域についての部分データから対象の物体を検出する請求項１から６までのいずれか１項に記載の物体検出装置。
前記領域特定部は、前記基準サイズを徐々に大きくしながら、前記基準サイズよりも小さい物体が出現する出現数が最も多い領域を拡大領域として特定することにより、複数の拡大領域を特定する
請求項８に記載の物体検出装置。
領域特定部が、撮影装置によって撮影領域が撮影されて得られた複数の画像データをテストデータとして、前記テストデータにおいて基準サイズよりも小さい物体が出現する出現数であって、前記撮影領域を構成する各領域についての出現数に応じて拡大領域を特定し、
データ抽出部が、前記撮影領域が撮影されて得られた画像データから、前記拡大領域の画像データを部分データとして抽出し、
サイズ変更部が、前記部分データを画像データから物体を検出するモデルである物体検出モデルによって要求される要求サイズにサイズ変更し、
物体検出部が、サイズ変更された前記部分データを前記物体検出モデルに入力して、前記部分データから対象の物体を検出する物体検出方法。
撮影装置によって撮影領域が撮影されて得られた複数の画像データをテストデータとして、前記テストデータにおいて基準サイズよりも小さい物体が出現する出現数であって、前記撮影領域を構成する各領域についての出現数に応じて拡大領域を特定する領域特定処理と、
前記撮影領域が撮影されて得られた画像データから、前記領域特定処理によって特定された前記拡大領域の画像データを部分データとして抽出するデータ抽出処理と、
前記データ抽出処理によって抽出された前記部分データを画像データから物体を検出するモデルである物体検出モデルによって要求される要求サイズにサイズ変更するサイズ変更処理と、
前記サイズ変更処理によってサイズ変更された前記部分データを前記物体検出モデルに入力して、前記部分データから対象の物体を検出する物体検出処理と
を行う物体検出装置としてコンピュータを機能させる物体検出プログラム。