WO2023238248A1

WO2023238248A1 - 物体検出装置、及び物体検出方法

Info

Publication number: WO2023238248A1
Application number: PCT/JP2022/022986
Authority: WO
Inventors: 寛之鵜澤; 彩希八田; 周平吉田; 宥光飯沼; 大祐小林; 優也大森; 祐輔堀下; 健中村
Original assignee: 日本電信電話株式会社
Priority date: 2022-06-07
Filing date: 2022-06-07
Publication date: 2023-12-14

Abstract

物体検出装置は、動画像に含まれる画像から物体を検出する物体検出装置であって、動画像から画像を取得する取得部と、連続した画像の差分を用いて、画像を複数の部分面に分割する面数を設定する面数設定部と、分割された部分面毎に、物体を検出する頻度を割り当てる割当制御部と、設定された面数に応じて、画像を複数の部分面に分割し、割り当てられた頻度に応じて部分面から物体を検出する分割処理部と、画像を画像の全体を示す全体面に縮小し、全体面から物体を検出する全体処理部と、部分面、及び全体面から検出した各々の検出結果を合成して、画像から物体を検出する合成処理部と、を備えている。

Description

物体検出装置、及び物体検出方法

　開示の技術は、物体検出装置、及び物体検出方法に関する。

　入力された画像から画像に含まれる物体の位置、属性、及び信頼度を含むメタデータを検出し、物体を検出する技術が開示されている。例えば、深層学習を用いて、物体のメタデータを検出するＹＯＬＯ（Ｙｏｕ　Ｏｎｌｙ　Ｌｏｏｋ　Ｏｎｃｅ）、及びＳＳＤ（Ｓｉｎｇｌｅ　Ｓｈｏｔ　Ｍｕｌｔｉｂｏｘ）等の映像処理の技術が開示され、監視カメラ、及びドローンの飛行制御等への適用が検討されている。

Ｊｏｓｅｐｈ　Ｒｅｄｍｏｎ　ｅｔ．ａｌ，"ＹＯＬＯｖ３：　Ａｎ　Ｉｎｃｒｅｍｅｎｔａｌ　Ｉｍｐｒｏｖｅｍｅｎｔ"．＜ＵＲＬ：https://arxiv.org/abs/1804.02767＞Ｗｅｉ　Ｌｉｕ　ｅｔ．ａｌ，　"ＳＳＤ:Ｓｉｎｇｌｅ　Ｓｈｏｔ　ＭｕｌｔｉＢｏｘ　Ｄｅｔｅｃｔｏｒ"．＜ＵＲＬ：https://arxiv.org/pdf/1512.02325.pdf＞Ｈ．Ｕｚａｗａ　ｅｔ．　ａｌ，　"Ｈｉｇｈ-ｄｅｆｉｎｉｔｉｏｎ　ｏｂｊｅｃｔ　ｄｅｔｅｃｔｉｏｎ　ｔｅｃｈｎｏｌｏｇｙ　ｂａｓｅｄ　ｏｎ　ＡＩ　ｉｎｆｅｒｅｎｃｅ　ｓｃｈｅｍｅ　ａｎｄ　ｉｔｓ　ｉｍｐｌｅｍｅｎｔａｔｉｏｎ"，　ＩＥＩＣＥ　Ｅｌｅｃｔｒｏｎｉｃｓ　Ｅｘｐｒｅｓｓ，　２０２１，　Ｖｏｌｕｍｅ　１８，　Ｉｓｓｕｅ　２２，　Ｐａｇｅｓ　２０２１０３２３．氏家　隆之等， "動画像コーデックにおける動きベクトルを用いたＣＮＮ物体検出の負荷緩和"，　Ｖｏｌ．２０１８－ＣＶＩＭ－２１０　Ｎｏ．４情報処理学会研究報告

　非特許文献１には、３２０×３２０画素、４１６×４１６画素、及び６０８×６０８画素の入力画像からＹＯＬＯによって物体を検出する手法について開示されている。

　非特許文献２には、ＳＳＤによって物体を検出する手法について開示されている。

　非特許文献３には、入力された入力画像を複数の画像に分割し、入力画像の一部を示す部分面、及び入力された画像を縮小して画像の全体を示す全体面を用いて、ＹＯＬＯによって物体を検出し、部分面及び全体面から検出した結果を合成して最終的な物体の検出結果を得る手法について開示されている。

　非特許文献４には、動きベクトルに基づいて各物体の移動位置を予測し、物体位置を補正することで、物体検出を実行するフレームを間引くことを可能にする手法について開示されている。

　ところで、深層学習を行った学習済みモデルを用いて、画像から物体を検出する場合、検出する画像の大きさが制限される。例えば、４Ｋ（３８４０×２１６０画素）等の超高精細映像に対して物体を検出する処理を行う場合、入力された画像を複数に分割して得られる部分面、入力画像を縮小した全体面を用いて検出することがある。ここで、超高精細映像における入力画像を６０８×６０８画素の部分面に分割した場合、２８個の部分面に対して物体を検出する処理をそれぞれ行うことになり、処理量が膨大となる。そのため、処理量を抑制する手法として、上述したように、物体を検出する部分面を間引き、間引いた部分面に対する検出結果は、物体の移動予測によって位置補正を行うことで、処理量の抑制が実現される。

　しかしながら、１フレーム当たりの検出が実行可能な部分面が少ない、かつ部分面の総数が多い場合、各々の部分面において間引かれる（検出処理が実行されない）回数も増大する。そのため、動画像において、ドローンの急旋回等の急な変動が生じた場合、物体の移動が精度よく予測されず、物体の追従性能が劣化することがある。

　部分面の総数を減らすことにより、物体検出を実行可能な部分面数が増えるため、同一フレームにおいて、物体を検出する範囲が拡がり、物体の追従性が向上する。一方、部分面の総数を減らすことは、各々の部分面における画像縮小を伴い、物体の検出性能の劣化を招く。すなわち、超高精細映像から物体を検出する場合において、物体の追従性能、及び物体の検出性能が両立できない虞がある。

　本開示は、このような事情に鑑みてなされたもので、超高精細映像等から物体を検出する場合において、物体の追従性能、及び物体の検出性能を両立できる物体検出装置、及び物体検出方法を提案することを目的とする。

　本開示の第１態様は、動画像に含まれる画像から物体を検出する物体検出装置であって、動画像から画像を取得する取得部と、連続した画像の差分を用いて、画像を複数の部分面に分割する面数を設定する面数設定部と、分割された部分面毎に、物体を検出する頻度を割り当てる割当制御部と、設定された面数に応じて、画像を複数の部分面に分割し、割り当てられた頻度に応じて部分面から物体を検出する分割処理部と、画像を画像の全体を示す全体面に縮小し、全体面から物体を検出する全体処理部と、部分面、及び全体面から検出した各々の検出結果を合成して、画像から物体を検出する合成処理部と、を備えた物体検出装置である。

　本開示の第２態様は、動画像に含まれる画像から物体を検出する物体検出方法であって、動画像から画像を取得し、連続した画像の差分を用いて、画像を複数の部分面に分割する面数を設定し、分割された部分面毎に、物体を検出する頻度を割り当て、設定された面数に応じて、画像を複数の部分面に分割し、割り当てられた頻度に応じて部分面から物体を検出し、画像を画像の全体を示す全体面に縮小し、全体面から物体を検出し、部分面、及び全体面から検出した各々の検出結果を合成して、画像から物体を検出する、物体検出方法である。

　開示の技術によれば、超高精細映像等から物体を検出する場合において、物体の追従性能、及び物体の検出性能を両立できる。

本実施形態に係る物体検出装置のハードウェア構成を示すブロック図である。本実施形態に係る物体検出装置１０の機能構成の一例を示すブロック図である。本実施形態に係る物体の検出の説明に供する検出処理のデータの流れの一例を示すデータフロー図である。本実施形態に係る面数の設定の説明に供する面数設定処理のデータの流れの一例を示すデータフロー図である。本実施形態に係るガードタイムの説明に供する差分平均値、及び面数の時系列データの一例を示すグラフである。本実施形態に係る部分面毎の検出頻度の割当の説明に供する割当制御処理のデータの流れの一例を示すデータフロー図である。本実施形態に係る物体検出処理の一例を示すフローチャートである。本実施形態に係る面数設定処理の一例を示すフローチャートである。本実施形態に係る割当制御処理の一例を示すフローチャートである。

　以下、図面を参照して、本開示を実施するための形態例を詳細に説明する。

　まず、図１を参照して、本実施形態に係る物体検出装置１０のハードウェア構成について説明する。図１は、本実施形態に係る物体検出装置１０のハードウェア構成を示すブロック図である。

　図１に示すように、物体検出装置１０は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１２、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１３、ストレージ１４、入力部１５、表示部１６、及び通信インタフェース（Ｉ／Ｆ）１７を有する。各構成は、バス１８を介して相互に通信可能に接続されている。なお、上述したＣＰＵは、及びメモリを用いる構成は例示に過ぎず、例えば、専用の演算回路を搭載した物体の検出を専門に行う装置として実装してもよい。

　ＣＰＵ１１は、中央演算処理ユニットであり、各種プログラムの実行、及び各部の制御を行う。すなわち、ＣＰＵ１１は、ＲＯＭ１２、又はストレージ１４からプログラムを読み出し、ＲＡＭ１３を作業領域としてプログラムを実行する。ＣＰＵ１１は、ＲＯＭ１２、又はストレージ１４に記憶されているプログラムに従って、上記各構成の制御、及び各種の演算処理を行う。本実施形態では、ＲＯＭ１２、又はストレージ１４には、画像から物体を検出するための物体検出処理プログラムが格納されている。

　ＲＯＭ１２は、各種プログラム及び各種データを格納する。ＲＡＭ１３は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ１４は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記憶装置により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。

　入力部１５は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。

　表示部１６は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部１６は、タッチパネル方式を採用して、入力部１５として機能しても良い。

　通信インタフェース１７は、表示機器等の他の機器と通信するためのインタフェースである。当該通信には、たとえば、イーサネット（登録商標）若しくはＦＤＤＩ等の有線通信の規格、又は、４Ｇ、５Ｇ、若しくはＷｉ－Ｆｉ（登録商標）等の無線通信の規格が用いられる。通信インタフェース１７は、外部メモリから入力データを取得し、外部メモリに出力データを送信する。

　次に、図２を参照して、物体検出装置１０の機能構成について説明する。図２は、本実施形態に係る物体検出装置１０の機能構成の一例を示すブロック図である。

　図２に示すように、物体検出装置１０は、機能構成として、取得部２１、分割処理部２２、全体処理部２３、合成処理部２４、記憶部２５、推定部２６、生成部２７、面数設定部２８、振分部２９、及び割当制御部３０を備えている。ＣＰＵ１１が物体検出処理プログラムを実行することによって、取得部２１、分割処理部２２、全体処理部２３、合成処理部２４、記憶部２５、推定部２６、生成部２７、面数設定部２８、振分部２９、及び割当制御部３０として機能する。

　取得部２１は、一例として図３に示すように、動画像３１からフレーム毎の画像３２を取得する。

　分割処理部２２は、設定された面数に応じて、取得した画像３２を各々の部分の画像（以下、「部分面」という。）３３に分割し、割り当てられた検出頻度に応じて、分割された部分面３３毎に物体の検出を行う。ここで、面数は、後述する面数設定部２８によって設定され、検出頻度は、割当制御部３０によって設定される。なお、本実施形態に係る分割処理部２２は、画像３２を面数に応じた部分面に分割し、各々の部分面から物体を検出するための機械学習を行った学習モデルである。分割処理部２２は、各々の部分面３３に含まれている物体の位置（物体の中心、物体が含まれる領域の高さ及び幅）、物体の属性、及び物体を示す信頼度を含むメタデータを検出する。

　分割処理部２２は、図３に示すように、各々の部分面３３に含まれている物体のメタデータを検出し、所定の大きさ以上の信頼度に係るメタデータを検出結果（以下、「分割処理結果」という。）３４として出力する。

　全体処理部２３は、取得した画像３２を縮小し、画像の全体を示した画像（以下、「全体面」という。）３５から物体のメタデータを検出し、所定の大きさ以上の信頼度に係るメタデータを検出結果（以下、「全体処理結果」という。）３６として出力する。なお、本実施形態に係る全体処理部２３は、画像３２を全体面に縮小し、縮小した全体面から物体を検出するための機械学習を行った学習モデルである。

　合成処理部２４は、分割処理結果３４、及び全体処理結果３６を合成して画像３２から物体を検出して出力する。具体的には、図３に示すように、合成処理部２４は、分割処理結果３４、及び全体処理結果３６を用いて、対応するメタデータを検出して、当該メタデータを検出結果（以下、「合成処理結果」という。）３７として出力する。また、合成処理部２４は、分割処理結果３４に含まれ、かつ全体処理結果３６に含まれない物体（メタデータ）を検出して、合成処理結果３７として出力する。

　記憶部２５は、取得した画像３２、及び分割処理結果３４を記憶する。ここで、分割処理結果３４は、各々の部分面における物体のメタデータである。

　推定部２６は、一例として図４に示すように、取得部２１によって取得された現フレームにおける画像３２と、記憶部２５に記憶されている１フレーム前の画像を示す過去画像３９と、の間で動き探索を行い、物体の移動を示す動きベクトル３８を推定する。動き探索の方法は、現フレームにおける画像３２と、過去画像３９と、比較する方法等の当業者に公知となっている従来技術を用いる形態について説明する。しかし、本実施形態に係る動き探索の方法は、これに限定されない。

　生成部２７は、図４に示すように、記憶部２５に記憶されている１フレーム前の画像を示す過去画像３９、及び推定部２６によって推定された動きベクトル３８を用いて、現在のフレームに係る物体の位置を予測した予測画像４０を生成する。

　面数設定部２８は、図４に示すように、現在のフレームを示す画像３２と、生成部２７によって生成された予測画像４０と、を用いて、部分面３３の面数４１を設定する。具体的には、面数設定部２８は、現在のフレームを示す画像３２、及び予測画像４０の各々の画素における画素値の差分絶対値を導出し、全ての画素における差分絶対値の総和（以下、「差分絶対値和」という。）を導出する。ここで、本実施形態に係る差分絶対値和は、以下の数式によって表される。

　ここで、ｄｉｆｆは、全ての画素における差分絶対値和であり、Ｎは、フレームを識別するフレーム番号であり、ｃは画像のチャネル数であり、ｘは、画像内のｘ座標であり、ｙは、画像内のｙ座標である。また、ｍｖｘは、動きベクトル３８のｘ成分であり、ｍｖｙは、動きベクトル３８のｙ成分を示している。

　すなわち、上述した式（１）の第１項は、現在のフレームに係る画像の画素値を示しており、第２項は、１フレーム前のフレームに係る画像を動きベクトル３８を用いて補正した予測画像４０の画素値を示している。面数設定部２８は、画像の画素及びチャネル毎に、現在のフレームに係る画像の画素値と、動きベクトル３８によって補正された予測画像４０と、の画素値の差分絶対値を導出する。面数設定部２８は、全ての画素及びチャネルにおいて差分絶対値和を総和して、現在のフレームにかかる差分絶対値和ｄｉｆｆを導出する。

　面数設定部２８は、導出した現在のフレームに係る差分絶対値和ｄｉｆｆと、過去に導出した過去のフレームに係る差分絶対値和ｄｉｆｆと、を用いて、差分絶対値和の移動平均（以下、「平均差分和」という。）４２を導出する。

　面数設定部２８は、図４に示すように、導出した平均差分和４２に応じて、面数４１を設定する。具体的には、一例として図５に示すように、面数設定部２８は、平均差分和４２が、予め定められた閾値を超えた場合、閾値に対応した面数４１を設定する。例えば、図５に示すように、面数設定部２８は、平均差分和４２が、予め定められた閾値を超えた場合、Ｍ１より面数が少ないＭ２に変更して設定する。ここで、面数設定部２８は、面数４１において過度な変更が生じないように、ガードタイムを予め設定し、面数の変更が生じた場合、平均差分和４２が、予め定められた閾値を超えたか否かに関わらず、ガードタイムが経過するまで面数４１を変更しない。また、面数設定部２８は、ガードタイムが経過した場合において、平均差分和４２が、予め定められた閾値以下である場合、面数４１をＭ１（初期値）に変更して設定する。

　すなわち、平均差分和４２が大きくなった（画像の変動が大きい）場合、面数４１を少なく（各々の部分面を大きく）することによって、物体を検出する範囲が拡大し、物体の追従性能が向上する。また、平均差分和４２が小さくなった（画像の変動が小さい）場合、面数４１を多く（各々の部分面を小さく）することによって、物体の検出性能が向上する。

　なお、本実施形態では、閾値は１つである形態について説明した。しかし、これに限定されない。閾値は複数であってもよい。例えば、面数設定部２８は、複数の予め定められた閾値を設定し、平均差分和４２が、閾値を超えた場合、超えた閾値のうち、最も値が大きい閾値を判別し、判別された閾値に対応する面数４１に変更して設定する。なお、複数の閾値が設定される場合、大きい閾値ほど、少ない面数が対応付けられる。

　振分部２９は、変更された面数４１に応じて、記憶部２５に記憶されている分割処理結果３４に含まれる検出された物体を、変更された面数４１に対応した部分面３３にそれぞれ振り分ける。例えば、面数４１が変更された場合、現在のフレームにおいて、物体が検出された部分面３３と、過去のフレームにおいて、物体が検出された部分面３３と、が対応しないことがある。そのため、振分部２９は、図４に示すように、面数４１の変更が生じた場合、過去のフレームに係る分割処理結果３４の部分面３３を変更された面数４１に対応した部分面３３に変更し、検出された物体の位置を変更された部分面３３に割り振る。これにより、面数４１の変更が生じた場合であっても、現在のフレームに係る部分面３３と、過去のフレームに係る部分面３３と、の比較が可能となる。

　割当制御部３０は、一例として図６に示すように、記憶部２５に記憶されている現在のフレームまでの分割処理結果３４、及び面数設定部２８によって設定された面数４１を用いて、部分面３３毎に、物体を検出する検出頻度４３を割り当てる。割当制御部３０は、複数のフレームに跨る周期を予め設定し、現在の周期における分割処理結果３４、及び面数４１を用いて、次の周期における検出頻度４３を部分面３３毎に割り当てる。

　具体的には、割当制御部３０は、周期毎、及び部分面毎に検出数揺らぎ値を導出し、導出した検出数揺らぎ値に応じて、割当可能量を各々の部分面３３に比例配分して、部分面毎に次の周期における検出頻度４３を割り当てる。

　ここで、割当可能量は、予め定められた検出が実行可能な部分面の数に、周期に含まれるフレーム数を積算して定められる。例えば、１フレーム当たりの検出が実行可能な部分面の数がＴであり、周期に含まれるフレーム数がＲである場合、当該周期における割当可能量は、Ｔ×Ｒとなる。また、部分面の数が、１フレーム当たりの実行可能な部分面の数Ｔより多い場合、分割処理部２２において、物体の検出が実行される部分面が絞られる（間引かれる）。そのため、分割処理部２２は、物体の検出において、過去のフレームに係る分割処理結果３４に動きベクトル３８を適用して補正し、現在のフレームにおいて間引かれた部分面に物体が含まれるか否かを判定して物体を検出する。これにより、検出による処理量が削減される。

　本実施形態に係る検出数揺らぎ値は、以下の数式によって表される。

　ここで、ｆ（ｎ）は、検出数揺らぎ値であり、ｎは、部分面を識別するための番号であり、ｕは、周期に含まれるフレームを識別するための番号であり、Ｕは、周期内のフレーム数であり、Ｄは、各々のフレームにおける部分面毎の検出揺らぎ値であり、ｋは、周期を識別するための番号である。また、ｄは、検出した物体数であり、ｄａｖｇは、検出した物体数の平均値（以下、「検出平均値」という。）である。例えば、上述した式（３）において、ｄ（ｎ，ｋ，ｕ）は、現在の周期ｋのフレームｕにおける部分面ｎで検出された物体数を示している。また、検出平均値ａｖｇ（ｎ，ｋ－１）は、過去の周期ｋ－１における検出された検出平均値を示している。現在の周期までに検出した検出平均値ｄａｖｇは、周期毎に更新され、過去の周期までの検出平均値ｄａｖｇと、現在の周期において検出された物体数ｄの平均値と、を平均することによって得られ、次の周期において用いられる。

　なお、本実施形態では、現在の周期ｋ、及び部分面ｎにおける検出平均値ｄａｖｇ（ｎ，ｋ）は、現在の周期ｋにおける検出平均値と、過去の周期ｋ－１までの検出平均値ｄａｖｇ（ｎ，ｋ－１）と、を平均することによって導出する形態について説明した。しかし、これに限定されない。重み値を積算して次の周期におけるｄａｖｇを導出してもよい。具体的には、ｄａｖｇ＝ｄａｖｇ（ｎ，ｋ－１）＋（１－ｉ）ｄａｖｇ（ｎ，ｋ）として導出してもよい。ここで、ｉは、忘却係数である。

　割当制御部３０は、検出数揺らぎ値ｆ（ｎ）が大きい部分面ほど、次の周期における検出頻度４３が多くなるように、各々の部分面３３に割当可能量を比例配分する。

　次に、図７から図９を参照して、本実施形態に係る物体検出装置１０の作用について説明する。図７は、本実施形態に係る物体検出処理の一例を示すフローチャートである。ＣＰＵ１１がＲＯＭ１２又はストレージ１４から物体検出プログラムを読み出し、実行することによって、図７に示す物体検出プログラムが実行される。図７に示す物体検出プログラムは、例えば、入力データとして動画像３１が入力され、物体検出処理を実行する指示が入力された場合、実行される。

　ステップＳ１０１において、ＣＰＵ１１は、面数４１、及び検出頻度４３に初期値を設定する。例えば、面数４１として、面数に設定し得る面数のうち、最も面数が多い面数が設定され、検出頻度４３として、各々の部分面に１が設定される。

　ステップＳ１０２において、ＣＰＵ１１は、初期値として、経過フレームに１を設定し、経過時間に１を設定する。

　ステップＳ１０３において、ＣＰＵ１１は、入力データとして１フレーム毎に画像３２を取得する。

　ステップＳ１０４において、ＣＰＵ１１は、設定された面数４１に応じて、画像３２を複数の部分面３３に分割する。

　ステップＳ１０５において、ＣＰＵ１１は、設定された検出頻度４３に応じて、各々の部分面３３から物体を検出する。ここで、非間引き対象の部分面に対する検出結果は、物体の検出を実行して得られるメタデータであり、間引き対象の部分面３３に対する検出結果は、記憶部２５に記憶されている過去のフレームにおける分割処理結果３４を読み出し、推定部２６によって推定された動きベクトル３８を用いて物体の位置を補正することで得られるメタデータである。

　ステップＳ１０６において、ＣＰＵ１１は、画像３２を全体面３５に縮小する。

　ステップＳ１０７において、ＣＰＵ１１は、縮小した全体面３５から物体を検出する。

　ステップＳ１０８において、ＣＰＵ１１は、分割処理結果３４、及び全体処理結果３６を用いて、検出結果を合成する。

　ステップＳ１０９において、ＣＰＵ１１は、合成処理結果３７から物体を検出する。

　ステップＳ１１０において、ＣＰＵ１１は、画像３２、及び分割処理結果３４を記憶する。

　ステップＳ１１１において、ＣＰＵ１１は、合成処理結果３７を出力する。

　ステップＳ１１２において、ＣＰＵ１１は、経過フレーム数、及び経過時間に１を加算する。

　ステップＳ１１３において、ＣＰＵ１１は、面数設定処理を実行する。なお、面数設定処理は、後述する図８において詳細に説明する。

　ステップＳ１１４において、ＣＰＵ１１は、経過フレーム数が、所定の周期を経過して、次の周期となったか否かを判定する。次の周期となった場合（ステップＳ１１４：ＹＥＳ）、ＣＰＵ１１は、ステップＳ１１５に移行する。一方、次の周期となっていない（経過フレーム数が、所定の周期を経過していない）場合（ステップＳ１１４：ＮＯ）、ＣＰＵ１１は、ステップＳ１１６に移行する。

　ステップＳ１１５において、ＣＰＵ１１は、割当制御処理を実行する。なお、割当制御処理は、後述する図９において詳細に説明する。

　ステップＳ１１６において、ＣＰＵ１１は、次の画像３２が存在しないか否かを判定する。次の画像３２が存在しない場合（ステップＳ１１６：ＹＥＳ）、ＣＰＵ１１は、物体検出処理を終了する。一方、次の画像３２が存在する場合（ステップＳ１１６：ＮＯ）、ＣＰＵ１１は、ステップＳ１０３に移行する。

　次に、図８を参照して、本実施形態に係る面数設定処理について説明する。図８は、本実施形態に係る面数設定処理の一例を示すフローチャートである。ＣＰＵ１１がＲＯＭ１２又はストレージ１４から面数設定プログラムを読み出し、実行することによって、図８に示す面数設定プログラムが実行される。図８に示す面数設定プログラムは、例えば、入力データとして画像３２が入力され、面数設定処理を実行する指示が入力された場合、実行される。

　ステップＳ２０１において、ＣＰＵ１１は、取得した画像３２と、過去画像３９と、を用いて、動きベクトル３８を推定する。

　ステップＳ２０２において、ＣＰＵ１１は、推定した動きベクトル３８を１フレーム前の過去画像３９に適用して、予測画像４０を生成する。

　ステップＳ２０３において、ＣＰＵ１１は、現在のフレームに係る画像３２と、予測画像４０と、を比較して、差分絶対値和ｄｉｆｆを導出する。

　ステップＳ２０４において、ＣＰＵ１１は、導出した差分絶対値和ｄｉｆｆと、過去の差分絶対値和ｄｉｆｆと、を用いて、平均差分和４２を導出する。

　ステップＳ２０５において、ＣＰＵ１１は、経過時間が、ガードタイムを超えたか否かを判定する。経過時間が、ガードタイムを超えた場合（ステップＳ２０５：ＹＥＳ）、ＣＰＵ１１は、ステップＳ２０６に移行する。一方、経過時間が、ガードタイムを超えていない場合（ステップＳ２０５：ＮＯ）、ＣＰＵ１１は、ステップＳ２１０に移行する。

　ステップＳ２０６において、ＣＰＵ１１は、平均差分和４２が、予め定められた閾値を超えたか否かを判定する。平均差分和４２が、予め定められた閾値を超えた場合（ステップＳ２０６：ＹＥＳ）、ＣＰＵ１１は、ステップＳ２０７に移行する。一方、平均差分和４２が、予め定められた閾値を超えていない場合（ステップＳ２０６：ＮＯ）、ＣＰＵ１１は、ステップＳ２０８に移行する。

　ステップＳ２０７において、ＣＰＵ１１は、閾値に対応する面数を設定する。ここで、閾値が複数設定されている場合、平均差分和４２が超えた閾値のうち、最も値が大きい閾値に対応する面数を設定する。

　ステップＳ２０８において、ＣＰＵ１１は、面数に初期値を設定する。ここで、初期値として、設定され得る面数のうち、最も面数が多い面数が設定される。

　ステップＳ２０９において、ＣＰＵ１１は、設定された面数４１に応じて、記憶されている分割処理結果３４の部分面３３を変更し、分割処理結果３４に含まれる検出された物体を、変更された部分面３３にそれぞれ振り分ける。

　ステップＳ２１０において、ＣＰＵ１１は、経過時間に１を設定する。

　次に、図９を参照して、本実施形態に係る割当制御処理について説明する。図９は、本実施形態に係る割当制御処理の一例を示すフローチャートである。ＣＰＵ１１がＲＯＭ１２又はストレージ１４から割当制御プログラムを読み出し、実行することによって、図９に示す割当制御プログラムが実行される。図９に示す割当制御プログラムは、例えば、所定の周期が経過し、割当制御処理を実行する指示が入力された場合、実行される。

　ステップＳ３０１において、ＣＰＵ１１は、部分面毎に検出した物体数、及び過去の周期において検出した物体数の平均値を用いて、検出数揺らぎ値ｆ（ｎ）を導出する。

　ステップＳ３０２において、ＣＰＵ１１は、検出数揺らぎ値に応じて、各々の部分面３３に検出頻度４３を割り当てる。ここで、各々の部分面３３に割り当てられる検出頻度４３は、検出数揺らぎ値に応じて、周期における割当可能量を比例配分して割り当てられる。

　ステップＳ３０３において、ＣＰＵ１１は、次の周期において用いられる検出平均値ｄａｖｇを更新する。ここで、ＣＰＵ１１は、過去の周期までの検出平均値ｄａｖｇと、現在の周期において検出された物体数ｄの平均値と、を用いて、次の周期において用いられる検出平均値ｄａｖｇを導出する。

　ステップＳ３０５において、ＣＰＵ１１は、経過フレーム数に１を設定する。

　以上説明したように、本実施形態によれば、超高精細映像等から物体を検出する場合において、物体の追従性能、及び物体の検出性能を両立できる。

　なお、上記実施形態に係る検出頻度４３は、割当可能量を検出数揺らぎ値に応じて比例配分して割り当てられる形態について説明した。しかし、これに限定されない。例えば、各々の部分面３３の検出頻度４３に１を割り当て、残りの割当可能量（割当可能量－面数）を検出数揺らぎ値に応じて比例配分してもよい。

［変形例］
　上記実施形態では、予め定められたガードタイムを経過した場合、面数４１を変更して設定する形態について、説明した。本変形例では、ガードタイムが変動する形態について説明する。

　例えば、物体検出装置１０は、所定の期間において生じた面数４１の変更回数を計数し、当該変更回数が、所定の回数を超えた場合、ガードタイムに予め定められた時間を加算して、ガードタイムを延長してもよい。これにより、頻繁に面数４１の変更が生じることが抑制される。

　なお、上記各実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行した推論処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等の製造後に回路構成を変更可能なＰＬＤ（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ）、及びＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、物体検出処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

　また、上記各実施形態では、物体検出処理プログラムがストレージ１４に予め記憶（インストール）されている態様を説明したが、これに限定されない。プログラムは、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＤＶＤ－ＲＯＭ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、及びＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）メモリ等の非一時的（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ）記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

　以上の実施形態に関し、更に以下の付記を開示する。

　（付記項１）
　メモリと、
　前記メモリに接続された少なくとも１つのプロセッサと、
　を含み、
　前記プロセッサは、
　動画像に含まれる画像から物体を検出する物体検出装置であって、
　前記動画像から前記画像を取得し、
　連続した前記画像の差分を用いて、前記画像を複数の部分面に分割する面数を設定し、
　分割された前記部分面毎に、前記物体を検出する頻度を割り当て、
　設定された面数に応じて、前記画像を複数の前記部分面に分割し、割り当てられた前記頻度に応じて前記部分面から物体を検出し、
　前記画像を前記画像の全体を示す全体面に縮小し、前記全体面から物体を検出し、
　前記部分面、及び前記全体面から検出した各々の検出結果を合成して、前記画像から物体を検出する、
　ように構成されている物体検出装置。

　（付記項２）
　物体検出処理を実行するようにコンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
　動画像に含まれる画像から物体を検出する前記物体検出処理は、
　前記動画像から前記画像を取得し、
　連続した前記画像の差分を用いて、前記画像を複数の部分面に分割する面数を設定し、
　分割された前記部分面毎に、前記物体を検出する頻度を割り当て、
　設定された面数に応じて、前記画像を複数の前記部分面に分割し、割り当てられた前記頻度に応じて前記部分面から物体を検出し、
　前記画像を前記画像の全体を示す全体面に縮小し、前記全体面から物体を検出し、
　前記部分面、及び前記全体面から検出した各々の検出結果を合成して、前記画像から物体を検出する、
　非一時的記憶媒体。

１０   物体検出装置
２１   取得部
２２   分割処理部
２３   全体処理部
２４   合成処理部
２５   記憶部
２６   推定部
２７   生成部
２８   面数設定部
２９   振分部
３０   割当制御部

Claims

　動画像に含まれる画像から物体を検出する物体検出装置であって、
　前記動画像から前記画像を取得する取得部と、
　連続した前記画像の差分を用いて、前記画像を複数の部分面に分割する面数を設定する面数設定部と、
　分割された前記部分面毎に、前記物体を検出する頻度を割り当てる割当制御部と、
　設定された面数に応じて、前記画像を複数の前記部分面に分割し、割り当てられた前記頻度に応じて前記部分面から物体を検出する分割処理部と、
　前記画像を前記画像の全体を示す全体面に縮小し、前記全体面から物体を検出する全体処理部と、
　前記部分面、及び前記全体面から検出した各々の検出結果を合成して、前記画像から物体を検出する合成処理部と、
　を備えた物体検出装置。
　前記画像から物体の移動を示すベクトルを推定する推定部と、
　前記ベクトルを用いて、現在の前記物体の位置を予測した予測画像を生成する生成部と、
　をさらに備え、
　前記面数設定部は、前記予測画像、及び取得した前記画像を用いて算出した差分絶対値和が、予め定められた条件を満たした場合、前記予め定められた条件に対応する面数に変更して設定する
　請求項１に記載の物体検出装置。
　前記面数設定部は、前記面数を設定してから予め定められた期間が経過した後に、予め定められた条件を満たした場合、前記面数に変更して設定する
　請求項２に記載の物体検出装置。
　前記面数設定部は、前記面数の変更が生じた回数が、予め定められた回数を超えた場合、前記予め定められた期間に、予め定められた時間を加算する
　請求項３に記載の物体検出装置。
　前記割当制御部は、複数の画像を含む周期を設定し、現在の周期における物体を検出した検出数、及び現在の周期までに検出した検出数の平均値の差分に基づいて、次の周期における前記頻度を前記部分面毎に割り当てる
　請求項１に記載の物体検出装置。
　前記割当制御部は、現在の周期における検出数の平均値と、過去の周期における検出数の平均値と、を用いて、前記現在の周期までに検出した検出数の平均値を導出する
　請求項５に記載の物体検出装置。
　前記割当制御部は、前記現在の周期における検出数の平均値に重み値を積算した値を用いて、前記現在の周期までに検出した検出数の平均値を導出する
　請求項６に記載の物体検出装置。
　動画像に含まれる画像から物体を検出する物体検出方法であって、
　前記動画像から前記画像を取得し、
　連続した前記画像の差分を用いて、前記画像を複数の部分面に分割する面数を設定し、
　分割された前記部分面毎に、前記物体を検出する頻度を割り当て、
　設定された面数に応じて、前記画像を複数の前記部分面に分割し、割り当てられた前記頻度に応じて前記部分面から物体を検出し、
　前記画像を前記画像の全体を示す全体面に縮小し、前記全体面から物体を検出し、
　前記部分面、及び前記全体面から検出した各々の検出結果を合成して、前記画像から物体を検出する、
　物体検出方法。