WO2020145180A1

WO2020145180A1 - 物体検出認識装置、方法、及びプログラム

Info

Publication number: WO2020145180A1
Application number: PCT/JP2019/051148
Authority: WO
Inventors: 泳青孫; 島村　潤; 淳嵯峨田
Original assignee: 日本電信電話株式会社
Priority date: 2019-01-10
Filing date: 2019-12-26
Publication date: 2020-07-16
Also published as: JP7103240B2; JP2020113000A; US20220101628A1

Abstract

画像が表す物体のカテゴリ及び領域を精度よく認識できる。　第１階層型特徴マップ生成部２３が、前記ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップを生成する。第２階層型特徴マップ生成部２４が、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップを生成する。統合部２５が、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成する。物体領域検出部２６が、物体候補領域を各々検出して、物体認識部２７が、物体候補領域の各々について、物体候補領域が表す物体のカテゴリ及び領域を認識する。

Description

物体検出認識装置、方法、及びプログラム

　本発明は、物体検出認識装置、方法、及びプログラムに係り、特に、画像の物体を検出し、認識するための物体検出認識装置、方法、及びプログラムに関する。

　セマンティック画像分割と認識は、映像や画像中の画素をオブジェクトカテゴリに割当てようとする技術である。自動運転や医用画像の解析、状態とポーズ推定などによく応用されている。近年、深層学習を用いた画素毎の画像分割技術は盛んに研究されている。代表的な処理の流れの例である、Mask RCNNという手法（非特許文献１）は、図６に示すとおり、まず、入力画像に対して、ＣＮＮベースのbackboneネットワークを通して、特徴マップ抽出を行う(図６のa部分)。つぎに、前記特徴マップにおいて、物体に関連する候補領域（物体らしい領域）を検出する(図６のｂ部分)。最後に、前記候補領域から物体位置検出や画素の割り当てを行う(図６のｃ部分)。また、Mask RCNNの特徴マップ抽出処理についてＣＮＮの深い層の出力しか利用してないことに対して、図７（Ａ）、（Ｂ）に示すように、浅い層の情報を含め複数層の出力も利用する、ＦＰＮ(Feature Pyramid Network)という階層的な特徴マップ抽出方法（非特許文献２）も提案されている。

Mask R-CNN, Kaiming He,Georgia Gkioxari,Piotr Dollar,Ross Girshick,ICCV2017 Feature Pyramid Networks for Object Detection, Tsung-Yi Lin, Piotr Dollar , Ross Girshick , Kaiming He , Bharath Hariharan, and Serge Belongie,CVPR2017

　ＣＮＮベースの物体分割と認識手法について以下の観察がある。

　第一に、ＣＮＮベースのbackboneネットワークの浅い層では、入力画像の低レベル画像特徴を表している。つまり、物体の線や点、模様などの細部を表現している。

　第二に、ＣＮＮ層が深くなるにつれて、画像の高レベル特徴を抽出することができる。たとえば、物体の特徴な輪郭や物体間のコンテキスト関係などを表す特徴を抽出することができる。

　上記の非特許文献１に示すMask RCNNという手法はCNNの深い層から生成した特徴マップだけを用いて、次の物体領域候補検出と画素毎のセグメンテーションを行うこととなる。従って、物体の細部を表現する低レベル特徴量を失うめ、物体検出位置のずれやセグメンテーション（画素の割り当て）の精度が低くなる問題が生じる。

　一方、非特許文献２のＦＰＮという方法はCNNのbackboneネットワークに対して、深い層の特徴マップからアップサンプリングしながら、セマンティックな情報を浅い層へ伝搬していく。そして、複数の特徴マップを用いて物体分割を行うことにより、物体分割精度はある程度改善されるが、実際に高レベル特徴マップ（up layer）に対して低レベル特徴を取り入れてないため、物体分割と認識の精度問題が生じる。

　本発明は、上記問題点を解決するために成されたものであり、画像が表す物体のカテゴリ及び領域を精度よく認識できる物体検出認識装置、方法、及びプログラムを提供することを目的とする。

　上記目的を達成するために、第１の発明に係る物体検出認識装置は、認識対象となる画像を、ＣＮＮ（Convolutional Neural Network）に入力して、前記ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップを生成する第１階層型特徴マップ生成部と、前記ＣＮＮの各層で出力される特徴マップに基づいて、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップを生成する第２階層型特徴マップ生成部と、前記深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップ、及び前記浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップについて、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成する統合部と、前記統合部により生成された階層型特徴マップに基づいて、物体候補領域を各々検出する物体領域検出部と、前記統合部により生成された階層型特徴マップに基づいて、前記物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ及び領域を認識する物体認識部と、を含んで構成されている。

　また、第１の発明に係る物体検出認識装置において、前記第１階層型特徴マップ生成部は、深い層から浅い層まで順に特徴マップを計算し、深い層から浅い層まで順に計算された特徴マップからなる階層型特徴マップを生成し、前記第２階層型特徴マップ生成部は、浅い層から深い層まで順に特徴マップを計算し、浅い層から深い層まで順に計算された特徴マップからなる階層型特徴マップを生成し、前記統合部は、順番が対応する特徴マップ同士を統合することにより、階層型特徴マップを生成するようにしてもよい。また、前記第１階層型特徴マップ生成部は、深い層から浅い層まで順に、当該層の一つ前に計算された特徴マップをアップサンプリングしたものと、当該層で出力される特徴マップとを足し合わせるように計算された特徴マップを求め、深い層から浅い層まで順に計算された特徴マップからなる階層型特徴マップを生成し、前記第２階層型特徴マップ生成部は、浅い層から深い層まで順に、当該層の一つ前に計算された特徴マップをダウンサンプリングしたものと、当該層で出力される特徴マップとを足し合わせるように計算された特徴マップを求め、浅い層から深い層まで順に計算された特徴マップからなる階層型特徴マップを生成するようにしてもよい。

　また、第１の発明に係る物体検出認識装置において、前記物体認識部は、前記統合部により生成された階層型特徴マップに基づいて、前記物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ、位置、及び領域を認識するようにしてもよい。

　第２の発明に係る物体検出認識方法は、第１階層型特徴マップ生成部が、認識対象となる画像を、ＣＮＮ（Convolutional Neural Network）に入力して、前記ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップを生成し、第２階層型特徴マップ生成部が、前記ＣＮＮの各層で出力される特徴マップに基づいて、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップを生成し、統合部が、前記深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップ、及び前記浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップについて、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成し、物体領域検出部が、前記統合部により生成された階層型特徴マップに基づいて、物体候補領域を各々検出し、物体認識部が、前記統合部により生成された階層型特徴マップに基づいて、前記物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ及び領域を認識する。

　第３の発明に係るプログラムは、コンピュータを、第１の発明に記載の物体検出認識装置の各部として機能させるためのプログラムである。

　本発明の物体検出認識装置、方法、及びプログラムによれば、前記ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップと、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップとを生成し、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成し、物体候補領域を各々検出して、前記物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ及び領域を認識することにより、画像が表す物体のカテゴリ及び領域を精度よく認識できる、という効果が得られる。

本発明の実施の形態に係る物体検出認識装置の構成を示すブロック図である。本発明の実施の形態に係る物体検出認識装置における物体検出認識処理ルーチンを示すフローチャートである。階層型特徴マップを生成する方法と階層型特徴マップを統合する方法とを説明するための図である。 bottom-up augmentation処理を説明するための図である。物体の検出と認識の方法を説明するための図である。従来技術であるＭａｓｋ　ＲＣＮＮの処理を説明するための図である。（Ａ）従来技術であるＦＰＮの処理を説明するための図、及び（Ｂ）アップサンプリング処理による深い層から浅い層までの階層型特徴マップの生成方法を説明するための図である。

　以下、図面を参照して本発明の実施の形態を詳細に説明する。

＜本発明の実施の形態に係る概要＞
　まず、本発明の実施の形態における概要を説明する。

　上述した課題を踏まえて、特徴抽出のCNNベースのbackboneネットワークにおいて、浅い層からの情報伝搬と深い層からの情報伝搬との、バランスのよい両方向の情報伝搬パースを用いれば、精度のよい物体検出と認識に対して有効だと考えられる。

　そこで、本発明の実施の形態では、物体検出と認識の対象となる画像を取得し、画像に対して、ＣＮＮのbackboneネットワークを通して、たとえば、ＦＰＮにより、深い層から階層的な特徴マップを生成し、画像のＣＮＮのbackboneネットワークにおいて、Reversed FPNにより、浅い層から階層的な特徴マップを生成する。そして、生成された深い層からの階層的な特徴マップと浅い層からの階層的な特徴マップとを統合し、階層的な特徴マップを生成し、生成された階層的な特徴マップを用いて、物体検出と認識を行う。

＜本発明の実施の形態に係る物体検出認識装置の構成＞
　次に、本発明の実施の形態に係る物体検出認識装置の構成について説明する。図１に示すように、本発明の実施の形態に係る物体検出認識装置１００は、ＣＰＵと、ＲＡＭと、後述する物体検出認識処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。この物体検出認識装置１００は、機能的には図１に示すように、入力部１０と、演算部２０とを含んで構成されている。

　演算部２０は、蓄積部２１と、画像取得部２２と、第１階層型特徴マップ生成部２３と、第２階層型特徴マップ生成部２４と、統合部２５と、物体領域検出部２６と、物体認識部２７と、学習部２８とを含んで構成されている。

　蓄積部２１には、物体の検出及び認識の対象となる画像を蓄積する。蓄積部２１は、画像取得部２２から処理指示を受け取ると、画像取得部２２に対して画像を出力する。また、物体認識部２７で求められた検出結果及び認識結果を蓄積部２１に格納する。なお、学習時には、検出結果及び認識結果が予め付与された画像が、蓄積部２１に格納されている。

　画像取得部２２は、蓄積部２１に処理指示を出力し、蓄積部２１に格納された画像を取得し、取得した画像を、第１階層型特徴マップ生成部２３と、第２階層型特徴マップ生成部２４とへ出力する。

　第１階層型特徴マップ生成部２３は、画像取得部２２から画像を受け取って、当該画像を、ＣＮＮ（Convolutional Neural Network）に入力して、ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップを生成する。生成された階層型特徴マップは統合部２５へ出力される。

　第２階層型特徴マップ生成部２４は、画像取得部２２から画像を受け取って、当該画像を、ＣＮＮ（Convolutional Neural Network）に入力して、ＣＮＮの各層で出力される特徴マップに基づいて、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップを生成する。生成された階層型特徴マップは統合部２５へ出力される。

　統合部２５は、第１階層型特徴マップ生成部２３から生成された階層型特徴マップと、第２階層型特徴マップ生成部２４から生成された階層型特徴マップを受け取って、統合処理を行う。

　具体的には、統合部２５は、第１階層型特徴マップ生成部２３により生成された、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップ、及び第２階層型特徴マップ生成部２４により生成された、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップについて、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成し、物体領域検出部２６と、物体認識部２７とへ出力する。

　物体領域検出部２６は、統合部２５により生成された階層型特徴マップに基づいて、deep learningベースの物体検出（たとえば、図６に示すMask RCNNのｂの処理）を用いて、入力画像に対して、画素毎の物体分割を行うことにより、物体候補領域を各々検出する。

　物体認識部２７は、統合部２５により生成された階層型特徴マップに基づいて、物体候補領域の各々について、deep learningベースの認識手法（たとえば、図６に示すMask RCNNのｃの処理）を用いて、当該物体候補領域が表す物体のカテゴリ、位置、及び領域を認識する。物体のカテゴリ、位置、及び領域の認識結果が蓄積部２１に格納される。

　学習部２８は、蓄積部２１に格納された、検出結果及び認識結果が予め付与された画像の各々についての物体認識部２７による認識結果と、画像の各々について予め付与された検出結果及び認識結果とを用いて、第１階層型特徴マップ生成部２３と、第２階層型特徴マップ生成部２４と、物体領域検出部２６と、物体認識部２７との各々で用いられるニューラルネットワークのパラメータを学習する。学習は誤差逆伝播法などの一般的なニューラルネットワークの学習手法を用いればよい。学習部２８の学習により、第１階層型特徴マップ生成部２３と、第２階層型特徴マップ生成部２４と、物体領域検出部２６と、物体認識部２７との各々では、パラメータがチューニングされたニューラルネットワークを用いて各処理が可能となる。

　なお、学習部２８の処理については、画像取得部２２と、第１階層型特徴マップ生成部２３と、第２階層型特徴マップ生成部２４と、統合部２５と、物体領域検出部２６と、物体認識部２７とによる一連の物体の検出及び認識の処理とは別個に、任意のタイミングで行えばよい。

＜本発明の実施の形態に係る物体検出認識装置の作用＞
　次に、本発明の実施の形態に係る物体検出認識装置１００の物体の検出及び認識に関する作用について説明する。物体検出認識装置１００は、図２に示す物体検出認識処理ルーチンを実行する。

　まず、ステップＳ１０１では、画像取得部２２は、蓄積部２１に処理指示を出力し、蓄積部２１に格納された画像を取得する。

　次に、ステップＳ１０２では、第１階層型特徴マップ生成部２３は、上記ステップＳ１０１で取得した画像を、CNNベースのbackboneネットワークを入力し、各層から出力された特徴マップを取得する。ここで、VGGやResnetなどのＣＮＮネットワークを使えばよい。そして、図３のＦＰＮに示すdata augmentation手法により、深い層から浅い層まで順に、特徴マップを求め、深い層から浅い層まで順に計算された特徴マップからなる階層型特徴マップを生成する。このとき、深い層から浅い層まで順に特徴マップを計算する際には、図４に示す処理とは反対の処理となるように、当該層の一つ前に計算された特徴マップをアップサンプリングしたものと、当該層で出力される特徴マップとを足し合わせるように特徴マップを計算する。

　このような階層型特徴マップでは、up layerのセマンティックな情報（物体の特徴な輪郭、物体間のコンテキスト情報）を下の特徴マップへも伝搬でき、物体検出の際に、物体輪郭はなめらかで、検出漏れなく精度よい効果が期待できる。

　ステップＳ１０３では、第２階層型特徴マップ生成部２４は、上記ステップＳ１０１で取得した画像を、ステップＳ１０２と同じくCNNベースのbackboneネットワークを入力し、各層から出力された特徴マップを取得する。そして、図３のＲｅｖｅｒｓｅｄ　ＦＰＮに示すように、浅い層から深い層まで順に、特徴マップを求め、浅い層から深い層まで順に計算された特徴マップからなる階層型特徴マップを生成する。このとき、浅い層から深い層まで順に特徴マップを計算する際には、上記図４に示すように、当該層の一つ前に計算された特徴マップをダウンサンプリングしたものと、当該層で出力される特徴マップとを足し合わせるように特徴マップを計算する。

　このような特徴マップは物体に関する詳細な情報（線、点、模様などの情報）をup layerの特徴マップへも伝搬でき、物体分割の際に、物体輪郭はより正確で、特に小さいサイズの物体も漏れなく検出できる効果が期待できる。

　ステップＳ１０４では、統合部２５は、図３に示すように、順番が対応する特徴マップ同士で足し合わせるように統合することにより、階層型特徴マップを生成する。このとき、上記図４と同様に、data augmentation方法（bottom-up augmentation）を用いて、下の層から順に、当該層の一つ前に計算された特徴マップをダウンサンプリングしたものと、当該層で足し合わせて得られた特徴マップとを足し合わせるように計算された特徴マップを求め、順に計算された特徴マップからなる階層型特徴マップを生成する。

　なお、上記ではdata augmentation方法を用いて統合する場合を例に説明したが、他の統合方法を実施してもよい。例えば、順番が対応する特徴マップ同士で平均を取るように統合してもよいし、順番が対応する特徴マップ同士で最大値を取るように統合してもよい。あるいは、順番が対応する特徴マップ同士を単に足し合わせるように統合してもよい。また、重みづけの足し算により統合してもよい。たとえば、複雑な背景で被写体はある程度一定サイズ以上であれば、上記ステップＳ１０２で得られた特徴マップについて大きな重みづけをしてもよい。また、画像中にサイズの小さい被写体が複数存在する場合、上記ステップＳ１０３で得られる、低レベル特徴を強調する特徴マップに大きな重みづけをしてもよい。また、上記図４とは異なるdata augmentation方法を用いて統合してもよい。

　ステップＳ１０５では、物体領域検出部２６は、上記ステップＳ１０４で生成された階層型特徴マップに基づいて、物体候補領域を各々検出する。

　例えば、各層の特徴マップについて、ＲＰＮ（Region Proposal Network）により物体であるスコアを画素毎に計算し、各層で対応する領域のスコアが高くなる物体候補領域を検出する。

　ステップＳ１０６では、物体認識部２７は、上記ステップＳ１０４で生成された階層型特徴マップに基づいて、上記ステップＳ１０５で検出された物体候補領域の各々について、当該物体候補領域が表す物体のカテゴリ、位置、及び領域を認識する。

　例えば、図５（Ａ）に示すように、階層型特徴マップの各層の特徴マップの、当該物体候補領域に対応する部分を各々用いて、固定サイズの特徴マップを生成し、図５（Ｃ）に示すように、固定サイズの特徴マップを、ＦＣＮ（Fully Convolutional Network）に入力することにより、当該物体候補領域が表す物体の領域を認識する。また、図５（Ｂ）に示すように、固定サイズの特徴マップを、全結合層に入力することにより、当該物体候補領域が表す物体のカテゴリ及び当該物体を囲うボックス位置を認識する。そして、当該物体候補領域が表す物体のカテゴリ、位置、及び領域の認識結果を、蓄積部２１に格納する。

　ステップＳ１０７では、蓄積部２１に格納された全ての画像について処理を終了したかを判定し、終了していれば物体検出認識処理ルーチンを終了し、終了していなければステップＳ１０１に戻って次の画像を取得して処理を繰り返す。

　以上説明したように、本発明の実施の形態に係る物体検出認識装置によれば、ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップと、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップとを生成し、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成し、物体候補領域を各々検出して、物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ及び領域を認識することにより、画像が表す物体のカテゴリ及び領域を精度よく認識できる。

　また、CNNのネットワークにおける全部の畳込み層の情報である、物体の意味情報を表す高レベル特徴（上のlayer）と物体の細部情報を表現する低レベル特徴(下のlayer)を有効利用できるようになるため、より精度のよい物体分割と認識が可能となる。

　なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

　例えば、上述した実施の形態では、学習部２８を物体検出認識装置１００に含める場合を例に説明したが、これに限定されるものではなく、物体検出認識装置１００とは別個の学習装置として構成するようにしてもよい。

１０入力部
２０演算部
２１蓄積部
２２画像取得部
２３第１階層型特徴マップ生成部
２４第２階層型特徴マップ生成部
２５統合部
２６物体領域検出部
２７物体認識部
２８学習部
１００物体検出認識装置

Claims

　認識対象となる画像を、ＣＮＮ（Convolutional Neural Network）に入力して、前記ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップを生成する第１階層型特徴マップ生成部と、
　前記ＣＮＮの各層で出力される特徴マップに基づいて、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップを生成する第２階層型特徴マップ生成部と、
　前記深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップ、及び前記浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップについて、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成する統合部と、
　前記統合部により生成された階層型特徴マップに基づいて、物体候補領域を各々検出する物体領域検出部と、
　前記統合部により生成された階層型特徴マップに基づいて、前記物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ及び領域を認識する物体認識部と、
　を含む物体検出認識装置。
　前記第１階層型特徴マップ生成部は、深い層から浅い層まで順に特徴マップを計算し、深い層から浅い層まで順に計算された特徴マップからなる階層型特徴マップを生成し、
　前記第２階層型特徴マップ生成部は、浅い層から深い層まで順に特徴マップを計算し、浅い層から深い層まで順に計算された特徴マップからなる階層型特徴マップを生成し、
　前記統合部は、順番が対応する特徴マップ同士を統合することにより、階層型特徴マップを生成する請求項１記載の物体検出認識装置。
　前記第１階層型特徴マップ生成部は、深い層から浅い層まで順に、当該層の一つ前に計算された特徴マップをアップサンプリングしたものと、当該層で出力される特徴マップとを足し合わせるように計算された特徴マップを求め、深い層から浅い層まで順に計算された特徴マップからなる階層型特徴マップを生成し、
　前記第２階層型特徴マップ生成部は、浅い層から深い層まで順に、当該層の一つ前に計算された特徴マップをダウンサンプリングしたものと、当該層で出力される特徴マップとを足し合わせるように計算された特徴マップを求め、浅い層から深い層まで順に計算された特徴マップからなる階層型特徴マップを生成する請求項２記載の物体検出認識装置。
　前記物体認識部は、
　前記統合部により生成された階層型特徴マップに基づいて、前記物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ、位置、及び領域を認識する請求項１～請求項３の何れか１項記載の物体検出認識装置。
　第１階層型特徴マップ生成部が、認識対象となる画像を、ＣＮＮ（Convolutional Neural Network）に入力して、前記ＣＮＮの各層で出力される特徴マップに基づいて、深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップを生成し、
　第２階層型特徴マップ生成部が、前記ＣＮＮの各層で出力される特徴マップに基づいて、浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップを生成し、
　統合部が、前記深い層から浅い層までの階層的な特徴マップからなる階層型特徴マップ、及び前記浅い層から深い層までの階層的な特徴マップからなる階層型特徴マップについて、対応する層の特徴マップ同士を統合することにより、階層型特徴マップを生成し、
　物体領域検出部が、前記統合部により生成された階層型特徴マップに基づいて、物体候補領域を各々検出し、
　物体認識部が、前記統合部により生成された階層型特徴マップに基づいて、前記物体候補領域の各々について、前記物体候補領域が表す物体のカテゴリ及び領域を認識する
　物体検出認識方法。
　コンピュータを、請求項１～請求項４のいずれか１項に記載の物体検出認識装置の各部として機能させるためのプログラム。