WO2022014327A1

WO2022014327A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2022014327A1
Application number: PCT/JP2021/024671
Authority: WO
Inventors: 英明山本
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2020-07-14
Filing date: 2021-06-30
Publication date: 2022-01-20
Also published as: JPWO2022014327A1; EP4140815A4; EP4140815A1; US20230206596A1; CN115777116A

Abstract

本技術は、トラッキング性能を向上させることができるようにする情報処理装置、情報処理方法、およびプログラムに関する。特徴情報抽出部は、フレーム画像単位で物体の特徴情報を抽出し、トラッキング処理部は、特徴情報を用いて、前記フレーム画像において物体をトラッキングする。本技術は、例えば、車載カメラを用いた運転支援装置に適用することができる。

Description

情報処理装置、情報処理方法、およびプログラム

　本技術は、情報処理装置、情報処理方法、およびプログラムに関し、特に、トラッキング性能を向上させるようにした情報処理装置、情報処理方法、およびプログラムに関する。

　特許文献１には、車両パターン特徴を用いて、あらかじめ認識された駐車位置とナンバープレートとを照合することで、車両の駐車位置を求める駐車位置認識装置が開示されている。

　一方で、近年、車載カメラを用いた走行支援や自動運転において、周囲を走行する車両をトラッキングする技術が知られている。

特開平８－９６２９７号公報

　従来、物体をトラッキングする場合、本来のトラッキング対象とは異なる他の物体を誤ってトラッキングしてしまうことがあった。

　本技術は、このような状況に鑑みてなされたものであり、トラッキング性能を向上させることができるようにするものである。

　本技術の情報処理装置は、フレーム画像単位で物体の特徴情報を抽出する特徴情報抽出部と、前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングするトラッキング処理部と備える情報処理装置である。

　本技術の情報処理方法は、情報処理装置が、フレーム画像単位で物体の特徴情報を抽出し、前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングする情報処理方法である。

　本技術のプログラムは、コンピュータに、フレーム画像単位で物体の特徴情報を抽出し、前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングする処理を実行させるためのプログラムである。

　本技術においては、フレーム画像単位で物体の特徴情報が抽出され、前記特徴情報を用いて、前記フレーム画像において前記物体がトラッキングされる。

車両制御システムの構成例を示すブロック図である。センシング領域の例を示す図である。本技術を適用した情報処理装置の構成例を示すブロック図である。特徴情報のスコア化の例を示す図である。車両の同一判定の例を示す図である。車両の同一判定の例を示す図である。特徴領域の例を示す図である。点群データの例を示す図である。車両追跡処理について説明するフローチャートである。車両追跡処理におけるデータの流れについて説明する図である。座標情報の詳細について説明する図である。相対速度の演算の例を示す図である。相対速度の演算の例を示す図である。鳥瞰図座標の例を示す図である。トラッキング処理の詳細について説明する図である。複数の車載カメラの撮影範囲の例を示す図である。情報処理装置の他の構成例を示すブロック図である。統合処理の詳細について説明する図である。コンピュータの構成例を示すブロック図である。

　以下、本技術を実施するための形態（以下、実施の形態とする）について説明する。なお、説明は以下の順序で行う。

　１．車両制御システムの構成例
　２．従来のトラッキングの課題
　３．情報処理装置の構成例
　４．車両追跡処理の流れ
　５．複数の車載カメラを搭載した例
　６．コンピュータの構成例

＜１．車両制御システムの構成例＞
　図１は、本技術が適用される移動装置制御システムの一例である車両制御システム１１の構成例を示すブロック図である。

　車両制御システム１１は、車両１に設けられ、車両１の走行支援及び自動運転に関わる処理を行う。

　車両制御システム１１は、プロセッサ２１、通信部２２、地図情報蓄積部２３、ＧＮＳＳ（Global Navigation Satellite System）受信部２４、外部認識センサ２５、車内センサ２６、車両センサ２７、記録部２８、走行支援・自動運転制御部２９、ＤＭＳ（Driver Monitoring System）３０、ＨＭＩ（Human Machine Interface）３１、及び、車両制御部３２を備える。

　プロセッサ２１、通信部２２、地図情報蓄積部２３、ＧＮＳＳ受信部２４、外部認識センサ２５、車内センサ２６、車両センサ２７、記録部２８、走行支援・自動運転制御部２９、ドライバモニタリングシステム（ＤＭＳ）３０、ヒューマンマシーンインタフェース（ＨＭＩ）３１、及び、車両制御部３２は、通信ネットワーク４１を介して相互に接続されている。通信ネットワーク４１は、例えば、ＣＡＮ（Controller Area Network）、ＬＩＮ（Local Interconnect Network）、ＬＡＮ（Local Area Network）、ＦｌｅｘＲａｙ（登録商標）、イーサネット（登録商標）等の任意の規格に準拠した車載通信ネットワークやバス等により構成される。なお、車両制御システム１１の各部は、通信ネットワーク４１を介さずに、例えば、近距離無線通信（ＮＦＣ（Near Field Communication））やＢｌｕｅｔｏｏｔｈ（登録商標）等により直接接続される場合もある。

　なお、以下、車両制御システム１１の各部が、通信ネットワーク４１を介して通信を行う場合、通信ネットワーク４１の記載を省略するものとする。例えば、プロセッサ２１と通信部２２が通信ネットワーク４１を介して通信を行う場合、単にプロセッサ２１と通信部２２とが通信を行うと記載する。

　プロセッサ２１は、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＥＣＵ（Electronic Control Unit）等の各種のプロセッサにより構成される。プロセッサ２１は、車両制御システム１１全体の制御を行う。

　通信部２２は、車内及び車外の様々な機器、他の車両、サーバ、基地局等と通信を行い、各種のデータの送受信を行う。車外との通信としては、例えば、通信部２２は、車両制御システム１１の動作を制御するソフトウエアを更新するためのプログラム、地図情報、交通情報、車両１の周囲の情報等を外部から受信する。例えば、通信部２２は、車両１に関する情報（例えば、車両１の状態を示すデータ、認識部７３による認識結果等）、車両１の周囲の情報等を外部に送信する。例えば、通信部２２は、ｅコール等の車両緊急通報システムに対応した通信を行う。

　なお、通信部２２の通信方式は特に限定されない。また、複数の通信方式が用いられてもよい。

　車内との通信としては、例えば、通信部２２は、無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＮＦＣ、ＷＵＳＢ（Wireless USB）等の通信方式により、車内の機器と無線通信を行う。例えば、通信部２２は、図示しない接続端子（及び、必要であればケーブル）を介して、ＵＳＢ（Universal Serial Bus）、ＨＤＭＩ（登録商標）（High-Definition Multimedia Interface）、又は、ＭＨＬ（Mobile High-definition Link）等の通信方式により、車内の機器と有線通信を行う。

　ここで、車内の機器とは、例えば、車内において通信ネットワーク４１に接続されていない機器である。例えば、運転者等の搭乗者が所持するモバイル機器やウェアラブル機器、車内に持ち込まれ一時的に設置される情報機器等が想定される。

　例えば、通信部２２は、４Ｇ（第４世代移動通信システム）、５Ｇ（第５世代移動通信システム）、ＬＴＥ（Long Term Evolution）、ＤＳＲＣ（Dedicated Short Range Communications）等の無線通信方式により、基地局又はアクセスポイントを介して、外部ネットワーク（例えば、インターネット、クラウドネットワーク、又は、事業者固有のネットワーク）上に存在するサーバ等と通信を行う。

　例えば、通信部２２は、Ｐ２Ｐ（Peer To Peer）技術を用いて、自車の近傍に存在する端末（例えば、歩行者若しくは店舗の端末、又は、ＭＴＣ（Machine Type Communication）端末）と通信を行う。例えば、通信部２２は、Ｖ２Ｘ通信を行う。Ｖ２Ｘ通信とは、例えば、他の車両との間の車車間（Vehicle to Vehicle）通信、路側器等との間の路車間（Vehicle to Infrastructure）通信、家との間（Vehicle to Home）の通信、及び、歩行者が所持する端末等との間の歩車間（Vehicle to Pedestrian）通信等である。

　例えば、通信部２２は、電波ビーコン、光ビーコン、ＦＭ多重放送等の道路交通情報通信システム（ＶＩＣＳ（登録商標）（Vehicle Information and Communication System））により送信される電磁波を受信する。

　地図情報蓄積部２３は、外部から取得した地図及び車両１で作成した地図を蓄積する。例えば、地図情報蓄積部２３は、３次元の高精度地図、高精度地図より精度が低く、広いエリアをカバーするグローバルマップ等を蓄積する。

　高精度地図は、例えば、ダイナミックマップ、ポイントクラウドマップ、ベクターマップ（ＡＤＡＳ（Advanced Driver Assistance System）マップともいう）等である。ダイナミックマップは、例えば、動的情報、準動的情報、準静的情報、静的情報の４層からなる地図であり、外部のサーバ等から提供される。ポイントクラウドマップは、ポイントクラウド（点群データ）により構成される地図である。ベクターマップは、車線や信号の位置等の情報をポイントクラウドマップに対応付けた地図である。ポイントクラウドマップ及びベクターマップは、例えば、外部のサーバ等から提供されてもよいし、レーダ５２、ＬｉＤＡＲ５３等によるセンシング結果に基づいて、後述するローカルマップとのマッチングを行うための地図として車両１で作成され、地図情報蓄積部２３に蓄積されてもよい。また、外部のサーバ等から高精度地図が提供される場合、通信容量を削減するため、車両１がこれから走行する計画経路に関する、例えば数百メートル四方の地図データがサーバ等から取得される。

　ＧＮＳＳ受信部２４は、ＧＮＳＳ衛星からＧＮＳＳ信号を受信し、走行支援・自動運転制御部２９に供給する。

　外部認識センサ２５は、車両１の外部の状況の認識に用いられる各種のセンサを備え、各センサからのセンサデータを車両制御システム１１の各部に供給する。外部認識センサ２５が備えるセンサの種類や数は任意である。

　例えば、外部認識センサ２５は、カメラ５１、レーダ５２、ＬｉＤＡＲ（Light Detection and Ranging、Laser Imaging Detection and Ranging）５３、及び、超音波センサ５４を備える。カメラ５１、レーダ５２、ＬｉＤＡＲ５３、及び、超音波センサ５４の数は任意であり、各センサのセンシング領域の例は後述する。

　なお、カメラ５１には、例えば、ＴｏＦ（Time of Flight）カメラ、ステレオカメラ、単眼カメラ、赤外線カメラ等の任意の撮影方式のカメラが、必要に応じて用いられる。

　また、例えば、外部認識センサ２５は、天候、気象、明るさ等を検出するための環境センサを備える。環境センサは、例えば、雨滴センサ、霧センサ、日照センサ、雪センサ、照度センサ等を備える。

　さらに、例えば、外部認識センサ２５は、車両１の周囲の音や音源の位置の検出等に用いられるマイクロフォンを備える。

　車内センサ２６は、車内の情報を検出するための各種のセンサを備え、各センサからのセンサデータを車両制御システム１１の各部に供給する。車内センサ２６が備えるセンサの種類や数は任意である。

　例えば、車内センサ２６は、カメラ、レーダ、着座センサ、ステアリングホイールセンサ、マイクロフォン、生体センサ等を備える。カメラには、例えば、ＴｏＦカメラ、ステレオカメラ、単眼カメラ、赤外線カメラ等の任意の撮影方式のカメラを用いることができる。生体センサは、例えば、シートやステアリングホイール等に設けられ、運転者等の搭乗者の各種の生体情報を検出する。

　車両センサ２７は、車両１の状態を検出するための各種のセンサを備え、各センサからのセンサデータを車両制御システム１１の各部に供給する。車両センサ２７が備えるセンサの種類や数は任意である。

　例えば、車両センサ２７は、速度センサ、加速度センサ、角速度センサ（ジャイロセンサ）、及び、慣性計測装置（ＩＭＵ（Inertial Measurement Unit））を備える。例えば、車両センサ２７は、ステアリングホイールの操舵角を検出する操舵角センサ、ヨーレートセンサ、アクセルペダルの操作量を検出するアクセルセンサ、及び、ブレーキペダルの操作量を検出するブレーキセンサを備える。例えば、車両センサ２７は、エンジンやモータの回転数を検出する回転センサ、タイヤの空気圧を検出する空気圧センサ、タイヤのスリップ率を検出するスリップ率センサ、及び、車輪の回転速度を検出する車輪速センサを備える。例えば、車両センサ２７は、バッテリの残量及び温度を検出するバッテリセンサ、及び、外部からの衝撃を検出する衝撃センサを備える。

　記録部２８は、例えば、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、ＨＤＤ（Hard Disc Drive）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、及び、光磁気記憶デバイス等を備える。記録部２８は、車両制御システム１１の各部が用いる各種プログラムやデータ等を記録する。例えば、記録部２８は、自動運転に関わるアプリケーションプログラムが動作するＲＯＳ（Robot Operating System）で送受信されるメッセージを含むrosbagファイルを記録する。例えば、記録部２８は、ＥＤＲ（Event Data Recorder）やＤＳＳＡＤ（Data Storage System for Automated Driving）を備え、事故等のイベントの前後の車両１の情報を記録する。

　走行支援・自動運転制御部２９は、車両１の走行支援及び自動運転の制御を行う。例えば、走行支援・自動運転制御部２９は、分析部６１、行動計画部６２、及び、動作制御部６３を備える。

　分析部６１は、車両１及び周囲の状況の分析処理を行う。分析部６１は、自己位置推定部７１、センサフュージョン部７２、及び、認識部７３を備える。

　自己位置推定部７１は、外部認識センサ２５からのセンサデータ、及び、地図情報蓄積部２３に蓄積されている高精度地図に基づいて、車両１の自己位置を推定する。例えば、自己位置推定部７１は、外部認識センサ２５からのセンサデータに基づいてローカルマップを生成し、ローカルマップと高精度地図とのマッチングを行うことにより、車両１の自己位置を推定する。車両１の位置は、例えば、後輪対車軸の中心が基準とされる。

　ローカルマップは、例えば、ＳＬＡＭ（Simultaneous Localization and Mapping）等の技術を用いて作成される３次元の高精度地図、占有格子地図（Occupancy Grid Map）等である。３次元の高精度地図は、例えば、上述したポイントクラウドマップ等である。占有格子地図は、車両１の周囲の３次元又は２次元の空間を所定の大きさのグリッド（格子）に分割し、グリッド単位で物体の占有状態を示す地図である。物体の占有状態は、例えば、物体の有無や存在確率により示される。ローカルマップは、例えば、認識部７３による車両１の外部の状況の検出処理及び認識処理にも用いられる。

　なお、自己位置推定部７１は、ＧＮＳＳ信号、及び、車両センサ２７からのセンサデータに基づいて、車両１の自己位置を推定してもよい。

　センサフュージョン部７２は、複数の異なる種類のセンサデータ（例えば、カメラ５１から供給される画像データ、及び、レーダ５２から供給されるセンサデータ）を組み合わせて、新たな情報を得るセンサフュージョン処理を行う。異なる種類のセンサデータを組合せる方法としては、統合、融合、連合等がある。

　認識部７３は、車両１の外部の状況の検出処理及び認識処理を行う。

　例えば、認識部７３は、外部認識センサ２５からの情報、自己位置推定部７１からの情報、センサフュージョン部７２からの情報等に基づいて、車両１の外部の状況の検出処理及び認識処理を行う。

　具体的には、例えば、認識部７３は、車両１の周囲の物体の検出処理及び認識処理等を行う。物体の検出処理とは、例えば、物体の有無、大きさ、形、位置、動き等を検出する処理である。物体の認識処理とは、例えば、物体の種類等の属性を認識したり、特定の物体を識別したりする処理である。ただし、検出処理と認識処理とは、必ずしも明確に分かれるものではなく、重複する場合がある。

　例えば、認識部７３は、ＬｉＤＡＲ又はレーダ等のセンサデータに基づくポイントクラウドを点群の塊毎に分類するクラスタリングを行うことにより、車両１の周囲の物体を検出する。これにより、車両１の周囲の物体の有無、大きさ、形状、位置が検出される。

　例えば、認識部７３は、クラスタリングにより分類された点群の塊の動きを追従するトラッキングを行うことにより、車両１の周囲の物体の動きを検出する。これにより、車両１の周囲の物体の速度及び進行方向（移動ベクトル）が検出される。

　例えば、認識部７３は、カメラ５１から供給される画像データに対してセマンティックセグメンテーション等の物体認識処理を行うことにより、車両１の周囲の物体の種類を認識する。

　なお、検出又は認識対象となる物体としては、例えば、車両、人、自転車、障害物、構造物、道路、信号機、交通標識、道路標示等が想定される。

　例えば、認識部７３は、地図情報蓄積部２３に蓄積されている地図、自己位置の推定結果、及び、車両１の周囲の物体の認識結果に基づいて、車両１の周囲の交通ルールの認識処理を行う。この処理により、例えば、信号の位置及び状態、交通標識及び道路標示の内容、交通規制の内容、並びに、走行可能な車線等が認識される。

　例えば、認識部７３は、車両１の周囲の環境の認識処理を行う。認識対象となる周囲の環境としては、例えば、天候、気温、湿度、明るさ、及び、路面の状態等が想定される。

　行動計画部６２は、車両１の行動計画を作成する。例えば、行動計画部６２は、経路計画、経路追従の処理を行うことにより、行動計画を作成する。

　なお、経路計画（Global path planning）とは、スタートからゴールまでの大まかな経路を計画する処理である。この経路計画には、軌道計画と言われ、経路計画で計画された経路において、車両１の運動特性を考慮して、車両１の近傍で安全かつ滑らかに進行することが可能な軌道生成（Local path planning）の処理も含まれる。

　経路追従とは、経路計画により計画した経路を計画された時間内で安全かつ正確に走行するための動作を計画する処理である。例えば、車両１の目標速度と目標角速度が計算される。

　動作制御部６３は、行動計画部６２により作成された行動計画を実現するために、車両１の動作を制御する。

　例えば、動作制御部６３は、ステアリング制御部８１、ブレーキ制御部８２、及び、駆動制御部８３を制御して、軌道計画により計算された軌道を車両１が進行するように、加減速制御及び方向制御を行う。例えば、動作制御部６３は、衝突回避あるいは衝撃緩和、追従走行、車速維持走行、自車の衝突警告、自車のレーン逸脱警告等のＡＤＡＳの機能実現を目的とした協調制御を行う。例えば、動作制御部６３は、運転者の操作によらずに自律的に走行する自動運転等を目的とした協調制御を行う。

　ＤＭＳ３０は、車内センサ２６からのセンサデータ、及び、ＨＭＩ３１に入力される入力データ等に基づいて、運転者の認証処理、及び、運転者の状態の認識処理等を行う。認識対象となる運転者の状態としては、例えば、体調、覚醒度、集中度、疲労度、視線方向、酩酊度、運転操作、姿勢等が想定される。

　なお、ＤＭＳ３０が、運転者以外の搭乗者の認証処理、及び、当該搭乗者の状態の認識処理を行うようにしてもよい。また、例えば、ＤＭＳ３０が、車内センサ２６からのセンサデータに基づいて、車内の状況の認識処理を行うようにしてもよい。認識対象となる車内の状況としては、例えば、気温、湿度、明るさ、臭い等が想定される。

　ＨＭＩ３１は、各種のデータや指示等の入力に用いられ、入力されたデータや指示等に基づいて入力信号を生成し、車両制御システム１１の各部に供給する。例えば、ＨＭＩ３１は、タッチパネル、ボタン、マイクロフォン、スイッチ、及び、レバー等の操作デバイス、並びに、音声やジェスチャ等により手動操作以外の方法で入力可能な操作デバイス等を備える。なお、ＨＭＩ３１は、例えば、赤外線若しくはその他の電波を利用したリモートコントロール装置、又は、車両制御システム１１の操作に対応したモバイル機器若しくはウェアラブル機器等の外部接続機器であってもよい。

　また、ＨＭＩ３１は、搭乗者又は車外に対する視覚情報、聴覚情報、及び、触覚情報の生成及び出力、並びに、出力内容、出力タイミング、出力方法等を制御する出力制御を行う。視覚情報は、例えば、操作画面、車両１の状態表示、警告表示、車両１の周囲の状況を示すモニタ画像等の画像や光により示される情報である。聴覚情報は、例えば、ガイダンス、警告音、警告メッセージ等の音声により示される情報である。触覚情報は、例えば、力、振動、動き等により搭乗者の触覚に与えられる情報である。

　視覚情報を出力するデバイスとしては、例えば、表示装置、プロジェクタ、ナビゲーション装置、インストルメントパネル、ＣＭＳ（Camera Monitoring System）、電子ミラー、ランプ等が想定される。表示装置は、通常のディスプレイを有する装置以外にも、例えば、ヘッドアップディスプレイ、透過型ディスプレイ、ＡＲ（Augmented Reality）機能を備えるウエアラブルデバイス等の搭乗者の視界内に視覚情報を表示する装置であってもよい。

　聴覚情報を出力するデバイスとしては、例えば、オーディオスピーカ、ヘッドホン、イヤホン等が想定される。

　触覚情報を出力するデバイスとしては、例えば、ハプティクス技術を用いたハプティクス素子等が想定される。ハプティクス素子は、例えば、ステアリングホイール、シート等に設けられる。

　車両制御部３２は、車両１の各部の制御を行う。車両制御部３２は、ステアリング制御部８１、ブレーキ制御部８２、駆動制御部８３、ボディ系制御部８４、ライト制御部８５、及び、ホーン制御部８６を備える。

　ステアリング制御部８１は、車両１のステアリングシステムの状態の検出及び制御等を行う。ステアリングシステムは、例えば、ステアリングホイール等を備えるステアリング機構、電動パワーステアリング等を備える。ステアリング制御部８１は、例えば、ステアリングシステムの制御を行うＥＣＵ等の制御ユニット、ステアリングシステムの駆動を行うアクチュエータ等を備える。

　ブレーキ制御部８２は、車両１のブレーキシステムの状態の検出及び制御等を行う。ブレーキシステムは、例えば、ブレーキペダル等を含むブレーキ機構、ＡＢＳ（Antilock Brake System）等を備える。ブレーキ制御部８２は、例えば、ブレーキシステムの制御を行うＥＣＵ等の制御ユニット、ブレーキシステムの駆動を行うアクチュエータ等を備える。

　駆動制御部８３は、車両１の駆動システムの状態の検出及び制御等を行う。駆動システムは、例えば、アクセルペダル、内燃機関又は駆動用モータ等の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構等を備える。駆動制御部８３は、例えば、駆動システムの制御を行うＥＣＵ等の制御ユニット、駆動システムの駆動を行うアクチュエータ等を備える。

　ボディ系制御部８４は、車両１のボディ系システムの状態の検出及び制御等を行う。ボディ系システムは、例えば、キーレスエントリシステム、スマートキーシステム、パワーウインドウ装置、パワーシート、空調装置、エアバッグ、シートベルト、シフトレバー等を備える。ボディ系制御部８４は、例えば、ボディ系システムの制御を行うＥＣＵ等の制御ユニット、ボディ系システムの駆動を行うアクチュエータ等を備える。

　ライト制御部８５は、車両１の各種のライトの状態の検出及び制御等を行う。制御対象となるライトとしては、例えば、ヘッドライト、バックライト、フォグライト、ターンシグナル、ブレーキライト、プロジェクション、バンパーの表示等が想定される。ライト制御部８５は、ライトの制御を行うＥＣＵ等の制御ユニット、ライトの駆動を行うアクチュエータ等を備える。

　ホーン制御部８６は、車両１のカーホーンの状態の検出及び制御等を行う。ホーン制御部８６は、例えば、カーホーンの制御を行うＥＣＵ等の制御ユニット、カーホーンの駆動を行うアクチュエータ等を備える。

　図２は、図１の外部認識センサ２５のカメラ５１、レーダ５２、ＬｉＤＡＲ５３、及び、超音波センサ５４によるセンシング領域の例を示す図である。

　センシング領域１０１Ｆ及びセンシング領域１０１Ｂは、超音波センサ５４のセンシング領域の例を示している。センシング領域１０１Ｆは、車両１の前端周辺をカバーしている。センシング領域１０１Ｂは、車両１の後端周辺をカバーしている。

　センシング領域１０１Ｆ及びセンシング領域１０１Ｂにおけるセンシング結果は、例えば、車両１の駐車支援等に用いられる。

　センシング領域１０２Ｆ乃至センシング領域１０２Ｂは、短距離又は中距離用のレーダ５２のセンシング領域の例を示している。センシング領域１０２Ｆは、車両１の前方において、センシング領域１０１Ｆより遠い位置までカバーしている。センシング領域１０２Ｂは、車両１の後方において、センシング領域１０１Ｂより遠い位置までカバーしている。センシング領域１０２Ｌは、車両１の左側面の後方の周辺をカバーしている。センシング領域１０２Ｒは、車両１の右側面の後方の周辺をカバーしている。

　センシング領域１０２Ｆにおけるセンシング結果は、例えば、車両１の前方に存在する車両や歩行者等の検出等に用いられる。センシング領域１０２Ｂにおけるセンシング結果は、例えば、車両１の後方の衝突防止機能等に用いられる。センシング領域１０２Ｌ及びセンシング領域１０２Ｒにおけるセンシング結果は、例えば、車両１の側方の死角における物体の検出等に用いられる。

　センシング領域１０３Ｆ乃至センシング領域１０３Ｂは、カメラ５１によるセンシング領域の例を示している。センシング領域１０３Ｆは、車両１の前方において、センシング領域１０２Ｆより遠い位置までカバーしている。センシング領域１０３Ｂは、車両１の後方において、センシング領域１０２Ｂより遠い位置までカバーしている。センシング領域１０３Ｌは、車両１の左側面の周辺をカバーしている。センシング領域１０３Ｒは、車両１の右側面の周辺をカバーしている。

　センシング領域１０３Ｆにおけるセンシング結果は、例えば、信号機や交通標識の認識、車線逸脱防止支援システム等に用いられる。センシング領域１０３Ｂにおけるセンシング結果は、例えば、駐車支援、及び、サラウンドビューシステム等に用いられる。センシング領域１０３Ｌ及びセンシング領域１０３Ｒにおけるセンシング結果は、例えば、サラウンドビューシステム等に用いられる。

　センシング領域１０４は、ＬｉＤＡＲ５３のセンシング領域の例を示している。センシング領域１０４は、車両１の前方において、センシング領域１０３Ｆより遠い位置までカバーしている。一方、センシング領域１０４は、センシング領域１０３Ｆより左右方向の範囲が狭くなっている。

　センシング領域１０４におけるセンシング結果は、例えば、緊急ブレーキ、衝突回避、歩行者検出等に用いられる。

　センシング領域１０５は、長距離用のレーダ５２のセンシング領域の例を示している。センシング領域１０５は、車両１の前方において、センシング領域１０４より遠い位置までカバーしている。一方、センシング領域１０５は、センシング領域１０４より左右方向の範囲が狭くなっている。

　センシング領域１０５におけるセンシング結果は、例えば、ＡＣＣ（Adaptive Cruise Control）等に用いられる。

　なお、各センサのセンシング領域は、図２以外に各種の構成をとってもよい。具体的には、超音波センサ５４が車両１の側方もセンシングするようにしてもよいし、ＬｉＤＡＲ５３が車両１の後方をセンシングするようにしてもよい。

＜２．従来のトラッキングの課題＞
　近年、車載カメラを用いた走行支援や自動運転において、周囲を走行する車両をトラッキングする技術が知られている。

　走行中の車両をトラッキングする場合、トラッキング対象となる車両を、時間軸で同一の車両として同定して追跡することが難しく、本来のトラッキング対象とは異なる他の車両を、誤ってトラッキングしてしまうことがあった。これは、トラッキングにおけるＩＤスイッチングなどとも呼ばれる。

　トラッキングにおいては、認識された車両のカメラ座標系や三次元座標系での位置の推定結果に基づいて、同一車両であるか否かを判定することが多い。しかしながら、常に車両が正しく認識されるとは限らないこと、また、推定される車両の位置に誤差が含まれることが、ＩＤスイッチングの原因となってしまう。

　そこで、以下においては、ＩＤスイッチングを抑制し、トラッキング性能を向上させる構成について説明する。

＜３．情報処理装置の構成例＞
　図３は、本技術を適用した情報処理装置の構成例を示すブロック図である。

　図３には、カメラ２１０と情報処理装置２３０が示されている。

　情報処理装置２３０は、車載カメラを用いた運転支援装置の一例として構成される。情報処理装置２３０は、車両１に搭載され、カメラ２１０により得られた動画像であるカメラ画像において、車両１の周囲の物体を認識し、トラッキングする。カメラ２１０は、図１のカメラ５１に対応し、車両１の前方や後方を撮影する単眼カメラとして構成される。これに限らず、カメラ２１０は、例えば車両１の屋根（天井外側）に設けられ、車両１の全周囲を撮影する３６０度カメラなどとして構成されてもよい。

　情報処理装置２３０は、例えば図１の分析部６１に対応し、信号処理部２３１、車両認識部２３２、距離・速度演算部２３３、矩形領域切り出し部２３４、特徴情報抽出部２３５、およびトラッキング処理部２３６を備えている。

　信号処理部２３１は、カメラ２１０により得られたカメラ画像（ＲＡＷデータ）を構成する各フレーム画像に対して各種の信号処理を施し、順次、車両認識部２３２と矩形領域切り出し部２３４に供給する。

　車両認識部２３２は、信号処理部２３１からの各フレーム画像に対して物体認識処理を行うことにより、車両１の周囲の物体、具体的には、車両１の周囲を走行する車両を認識する。１のフレーム画像において認識される車両の数は、１に限らず、複数であってもよい。認識された車両を囲う矩形枠の位置や大きさを表す座標情報が、距離・速度演算部２３３と矩形領域切り出し部２３４に供給される。

　距離・速度演算部２３３は、車両認識部２３２からの座標情報に基づいて、認識された車両と自車（車両１）との距離、および、認識された車両の相対速度を演算する。例えば、距離・速度演算部２３３は、レーダ５２やＬｉＤＡＲ５３のセンシング結果に基づいて、認識された車両との距離を求め、その距離と座標情報を用いて、認識された車両の相対速度を計算する。演算により得られた距離情報と速度情報は、座標情報に付加されて、トラッキング処理部２３６に供給される。

　矩形領域切り出し部２３４は、信号処理部２３１からの各フレーム画像から、車両認識部２３２からの座標情報で表される矩形枠内の矩形領域（認識された車両）を切り出す。切り出された矩形領域の画像である車両画像は、特徴情報抽出部２３５に供給される。

　特徴情報抽出部２３５は、フレーム画像単位で、矩形領域切り出し部２３４からの車両画像における車両の特徴情報を抽出する。具体的には、特徴情報抽出部２３５は、１または複数のセンサにより得られたセンサデータに基づいて、車両の特徴情報を抽出する。センサデータには、カメラ２１０により得られたフレーム画像、レーダ５２またはＬｉＤＡＲ５３により得られた点群データの少なくともいずれかが含まれる。抽出された特徴情報は、トラッキング処理部２３６に供給される。

　トラッキング処理部２３６は、距離・速度演算部２３３からの座標情報に基づいて、フレーム画像毎に、トラッキング対象となる車両の位置を推定することで、カメラ画像（時系列で撮影されたフレーム画像）において車両をトラッキングする。

　このとき、トラッキング処理部２３６は、特徴情報抽出部２３５からの特徴情報を用いて、カメラ画像において車両をトラッキングする。すなわち、トラッキング処理部２３６は、現在時刻のフレーム画像（現フレーム）と、現フレームより前の時刻（１つ前）のフレーム画像（前フレーム）の特徴情報の比較結果に基づいて、車両をトラッキングする。

　具体的には、トラッキング処理部２３６は、現フレームと前フレームの特徴情報が一致した場合、現フレームにおける車両が、前フレームにおける車両と同一であると判定することで、その車両をトラッキングする。

　例えば、現フレームと前フレームの特徴情報が比較され、それぞれの一致の度合いを表すスコアが所定の閾値以上の場合に、現フレームと前フレームの特徴情報が一致したと判定される。より詳細には、各フレーム画像の車両画像からは、複数の特徴情報が抽出され、複数の特徴情報についてのスコアの合計が、所定の閾値以上の場合に、現フレームと前フレームの特徴情報が一致したと判定される。

　図４は、特徴情報のスコア化の例を示す図である。

　図４の例では、特徴情報として、車両画像における車両のナンバープレートの数字、ナンバープレートの位置、および、レーダ検出点の位置が抽出される。ナンバープレートの数字と位置は、センサデータの１つであるカメラ画像から切り出された車両画像において、車両の特徴的な領域（特徴領域）としてナンバープレートが認識されることで抽出される。レーダ検出点の位置は、センサデータの１つであるレーダ５２により得られた点群データのうち、車両に反射した点群データから抽出される。

　それぞれの特徴情報には、現フレームと前フレームとで一致した場合のスコアがあらかじめ設定されている。図４の例では、現フレームと前フレームとでナンバープレートの数字が一致した場合のスコアは５、ナンバープレートの位置が一致した場合のスコアは１とされる。また、レーダ検出点の位置については、現フレームと前フレームとで一致した数の割合に５を乗じた値が、そのスコアとされる。

　そして、それぞれの特徴情報のスコアの合計と、閾値である５とが比較され、特徴情報のスコアの合計が５以上である場合に、現フレームと前フレームの特徴情報が一致したと判定され、現フレームと前フレームの車両画像に映る車両が同一であると判定される。

　図５は、車両の同一判定の例を示す図である。

　図５の例では、ある時刻ｔ－１のフレーム画像において認識された車両が、その車両を囲う矩形枠２５１（以下、バウンディングボックス２５１などという）によりトラッキングされている。バウンディングボックス２５１内では、車両の特徴領域としてナンバープレートＮ２５１が認識されるとともに、点群データとして複数（具体的には７つ）のレーダ検出点Ｄ２５１が取得されている。バウンディングボックス２５１内で、ナンバープレートの位置と、レーダ検出点の位置は、カメラ座標系に基づいて、バウンディングボックス２５１の左下の頂点を原点として設定されたｐ－ｑ座標系の座標として表される。

　次の時刻ｔのフレーム画像において、バウンディングボックス２６１，２６２により２台の車両が認識され、同一判定の対象となる入力データとして入力されたとする。ここでは、バウンディングボックス２６１内の車両は、時刻ｔ－１のバウンディングボックス２５１内の車両で、バウンディングボックス２６２内の車両は、時刻ｔ－１のバウンディングボックス２５１内の車両とは別の車両であるものとする。

　バウンディングボックス２６１とバウンディングボックス２５１の特徴情報が比較された場合、ナンバープレートの数字はいずれも「１８－６６」で一致するので、スコアとして５が付与される。ナンバープレートの位置（座標）も一致するので、スコアとして１が付与される。また、レーダ検出点の位置として、７つのうち５つ（白抜きの丸）の位置が一致しているので、スコアとして（５／７）×５＝３．５７が付与される。この場合、スコアの合計は９．５７となり、閾値５以上であることから、バウンディングボックス２６１内の車両は、時刻ｔ－１のバウンディングボックス２５１内の車両と同一であると判定される。

　一方、バウンディングボックス２６２とバウンディングボックス２５１の特徴情報が比較された場合、ナンバープレートの数字は「８４－５４」と「１８－６６」で一致しないので、スコアは付与されない。ナンバープレートの位置（座標）も一致しないので、スコアは付与されない。また、レーダ検出点の位置として、７つのうち３つ（白抜きの丸）の位置が一致しているので、スコアとして（３／７）×５＝２．１４が付与される。この場合、スコアの合計は２．１４となり、閾値５未満であることから、バウンディングボックス２６２内の車両は、時刻ｔ－１のバウンディングボックス２５１内の車両と同一でないと判定される。

　このようにして、現フレームと前フレームの特徴情報を用いることにより、車両の同一判定が正しく行われる。

　なお、レーダにより照射される電波は、一般的に、表面が平面状の物体より、球面などの曲面状の物体の方が反射しやすく、検出しやすいことが知られている。例えば、角ばったデザインの車両と、丸みを帯びたデザインの車両とでは、後者の方が、レーダにより照射される電波がより多く反射する。すなわち、レーダにより車両に対して電波を照射する場合、車両の車種によって反射する位置が異なることから、レーダ検出点の位置を、車両の同一判定に用いることができる。また、レーダ検出点の位置は、自車とトラッキング対象となる車両との位置関係（角度や距離）にも依存することから、同一車種の車両が複数存在する場合にも、車両の同一判定において有用となる。

　また、例えばカメラ画像のフレームレートが１５ｆｐｓ程度の場合では、時刻ｔ－１のフレーム画像と時刻ｔのフレーム画像とでは、レーダ検出点の位置はほぼ変化しない。しかしながら、レーダにより照射された電波の反射強度が、検出閾値の近傍で変動するような場合には、上述した例のように、時刻ｔ－１におけるレーダ検出点の位置が、時刻ｔにおいて変化したり、検出されなくなったりする。

　図６は、車両の同一判定の他の例を示す図である。

　図６の例では、ある時刻ｔ－１のフレーム画像において認識された車両が、その車両を囲うバウンディングボックス２７１によりトラッキングされている。バウンディングボックス２７１内では、車両の特徴領域としてナンバープレートＮ２７１が認識されるとともに、点群データとして複数（具体的には５つ）のレーダ検出点Ｄ２７１が取得されている。

　次の時刻ｔのフレーム画像において、バウンディングボックス２８１，２８２により２台の車両が認識され、同一判定の対象となる入力データとして入力されたとする。ここでは、バウンディングボックス２８１内の車両は、時刻ｔ－１のバウンディングボックス２７１内の車両で、バウンディングボックス２８２内の車両は、時刻ｔ－１のバウンディングボックス２７１内の車両とは別の車両であるものとする。

　なお、時刻ｔのフレーム画像は、自車と周囲の車両がトンネルなどの日の当たらない場所を通過しているため、被写体が不鮮明であるものとする。

　バウンディングボックス２８１とバウンディングボックス２７１の特徴情報が比較された場合、画像が不鮮明のため、ナンバープレートの数字は一致せず、スコアは付与されない。ナンバープレートの位置（座標）は一致するので、スコアとして１が付与される。また、レーダ検出点の位置として、５つのうち４つ（白抜きの丸）の位置が一致しているので、スコアとして（４／５）×５＝４が付与される。この場合、スコアの合計は５となり、閾値５以上であることから、バウンディングボックス２８１内の車両は、時刻ｔ－１のバウンディングボックス２７１内の車両と同一であると判定される。

　一方、バウンディングボックス２８２とバウンディングボックス２７１の特徴情報が比較された場合も、画像が不鮮明のため、ナンバープレートの数字は一致せず、スコアは付与されない。ナンバープレートの位置（座標）も一致しないので、スコアは付与されない。また、レーダ検出点の位置として、５つのうち２つ（白抜きの丸）の位置が一致しているので、スコアとして（２／５）×５＝２が付与される。これらスコアの合計は２となり、閾値である５未満であることから、バウンディングボックス２８２内の車両は、時刻ｔ－１のバウンディングボックス２７１内の車両と同一でないと判定される。

　このようにして、トンネルなどの暗い場所で撮影条件が良くない場合であっても、現フレームと前フレームの特徴情報を用いることにより、車両の同一判定が正しく行われる。

（特徴情報の他の例）
　以上においては、車両画像において、特徴情報として、ナンバープレートの数字、ナンバープレートの位置、および、レーダ検出点の位置が抽出されるものとしたが、他の特徴情報が抽出されてもよい。

　図７は、特徴領域の例を示す図である。

　図７の例においては、車両が認識されたバウンディングボックス２９１内で、車両の特徴領域として、フロントグリルＧ２９１、右フロントライトＲ２９１、左フロントライトＬ２９１、および、エンブレムＥ２９１が認識されている。

　この場合、バウンディングボックス２９１を基準に設定されたｐ－ｑ座標系での、フロントグリルＧ２９１の位置（ｐ２，ｑ２）、右フロントライトＲ２９１の位置（ｐ３，ｑ３）、左フロントライトＬ２９１の位置（ｐ４，ｑ４）、および、エンブレムＥ２９１の位置（ｐ５，ｑ５）が、特徴情報として抽出される。図７の例では、ｐ－ｑ座標系での特徴領域の位置は、特徴領域を表す矩形枠の左下の頂点の座標で示されているが、矩形枠の他の点の座標で示されてもよい。

　さらに、特徴領域として認識されたフロントグリルＧ２９１、右フロントライトＲ２９１、左フロントライトＬ２９１、および、エンブレムＥ２９１を表す矩形枠の幅や高さに基づいて、それぞれの大きさや形状が、特徴情報として抽出されてもよい。

　また、図７の例では、車両の前部におけるパーツが特徴領域として認識されるものとしたが、車両の後部におけるパーツが特徴領域として認識されてもよい。

　図８は、点群データの例を示す図である。

　図８の例においては、車両が認識されたバウンディングボックス２９１内で、点群データとして、複数のＬｉＤＡＲ点群データＤ２９１が取得されている。

　この場合、バウンディングボックス２９１を基準に設定されたｐ－ｑ座標系での、ＬｉＤＡＲ点群データＤ２９１それぞれの位置が、特徴情報として抽出され、現フレームと前フレームとの間で一致する割合が求められる。

　これに限らず、ＬｉＤＡＲ点群データＤ２９１は、三次元座標系での位置情報を有することから、ＬｉＤＡＲ点群データＤ２９１の三次元座標が、特徴情報として抽出され、現フレームと前フレームとの間で一致する割合が求められてもよい。この場合、フレーム画像毎に奥行き（距離）方向の位置が変化することから、前フレームにおける三次元座標に、トラッキング対象となる車両の速度に１フレーム分の時間を乗じて求められる距離を加算することで予測される現フレームでの座標が、比較に用いられるようにする。

　さらに、ＬｉＤＡＲ点群データＤ２９１それぞれの反射強度が、特徴情報として抽出され、現フレームと前フレームとの間で一致する割合が求められてもよい。

　上述した特徴情報は、例えば車両１に搭載されるセンサに応じて組み合わされて用いることができる。また、特徴情報の抽出処理は、車両が認識されたバウンディングボックス内のみを対象とした演算処理であるので、画像全体を対象とした演算処理と比較して演算量を抑えることができ、リアルタイムな処理に好適である。

＜４．車両追跡処理の流れ＞
　次に、図９のフローチャートを参照して、情報処理装置２３０による車両追跡処理の流れについて説明する。図９の処理は、カメラ画像を構成するフレーム画像毎に繰り返される。

　ステップＳ１１において、信号処理部２３１は、カメラ２１０により得られたカメラ画像のフレーム画像に対して、各種の信号処理を施す。

　ステップＳ１２において、車両認識部２３２は、信号処理が施されたフレーム画像に対して物体認識処理を行うことにより、車両１の周囲を走行する車両を認識し、認識された各車両の座標情報を取得する。なお、ここでは、フレーム画像に対する物体認識処理のみならず、センサフュージョン処理に基づいた物体認識処理が行われてもよい。

　ステップＳ１３において、距離・速度演算部２３３は、認識された車両の座標情報に基づいて、認識された車両との距離、および、認識された車両の相対速度を演算する。演算により得られた距離情報と速度情報は、座標情報に付加される。

　ステップＳ１４において、矩形領域切り出し部２３４は、信号処理が施されたフレーム画像から、認識された車両の座標情報に基づいた矩形領域を切り出すことで、車両画像を取得する。

　ステップＳ１５において、特徴情報抽出部２３５は、フレーム画像から切り出された車両画像から車両の特徴情報を抽出する。

　ステップＳ１６において、トラッキング処理部２３６は、距離情報と速度情報が付加された座標情報と、車両画像から抽出された特徴情報を用いて、フレーム画像により構成されるカメラ画像において車両をトラッキングする。

（車両追跡処理におけるデータの流れ）
　ここで、図１０を参照して、図９の車両追跡処理におけるデータの流れについて説明する。なお、図１０に示される処理Ｐ１２乃至Ｐ１６はそれぞれ、図９のフローチャートにおけるステップＳ１２乃至Ｓ１６に対応し、時刻ｔのフレーム画像について実行されるものとする。

　処理Ｐ１２は、車両認識部２３２により実行される、時刻ｔのフレーム画像における車両認識処理である。処理Ｐ１２により、バウンディングボックスＩＤ（以下、ＢＢｏｘＩＤという）、ＢＢｏｘ座標を含む座標情報が取得される。

　ＢＢｏｘＩＤは、フレーム画像において認識された各車両のバウンディングボックス固有のＩＤであり、各時刻のフレーム画像毎に、個々のバウンディングボックスに対して割り振られる。ＢＢｏｘ座標は、フレーム画像の左下の頂点を原点として設定されたｕ－ｖ座標系でのバウンディングボックスの位置（座標）と、幅および高さを表す。

　例えば、図１１に示されるように、ある時刻のフレーム画像において、２台の車両が認識され、対応するバウンディングボックス３１１，３１２が設定されたとする。この場合、バウンディングボックス３１１の位置は、バウンディングボックス３１１の左下の頂点の座標（ｕ１，ｖ１）で表され、バウンディングボックス３１１の幅および高さは、バウンディングボックス３１１の横の長さｗと縦の長さｈで表される。

　したがって、例えばバウンディングボックス３１１の座標情報は、「ＢＢｏｘＩＤ：Ｂ１，ＢＢｏｘ座標：（ｕ１，ｖ１，ｗ，ｈ）」などと表される。

　処理Ｐ１３は、距離・速度演算部２３３により実行される、時刻ｔのフレーム画像において認識された車両の距離と相対速度の演算処理である。処理Ｐ１３により、距離情報と速度情報が付加された座標情報が取得される。距離情報は、自車を原点として左右方向をｘ軸、奥行き方向をｙ軸としたｘ－ｙ座標系での車両の位置（座標）を表し、速度情報は、自車に対する車両の相対速度を表す。図１０の例では、ＢＢｏｘＩＤ：Ｂ１の座標情報に、距離：（ｘ１，ｙ１）の距離情報と、相対速度：ｖ１の速度情報は付加されている。

　ここで、図１２および図１３を参照して、相対速度の演算の例について説明する。

　この例では、図１２に示されるように、自車(車両１)に対する車両３３１の相対速度ｖが推定される。車両３３１の相対速度は、時刻ｔのΔｔ秒前の時刻ｔ－１における車両３３１の位置から、時刻ｔにおいて車両３３１との距離がｄｍになるまで、車両３３１が車両１に近づく速度ｖ（ｍ／ｓ）となる。

　ここで、車両３３１の、時刻ｔ－１におけるカメラ画像での見かけ上の大きさをｓ１、時刻ｔにおけるカメラ画像での見かけ上の大きさをｓ２とする。見かけ上の大きさの変化率Ｓ＝ｓ２／ｓ１とした場合、相対速度ｖの計算式は、
　　　ｖ＝ｄ×（Ｓ－１）／Δｔ（ｍ／ｓ）
で表される。

　見かけ上の大きさの変化率Ｓは、カメラ画像において設定されるバウンディングボックスの大きさの変化率として求めることができる。

　図１３を参照して、上述した相対速度ｖの計算式の導出について説明する。図１３においては、車両３３１の実際の高さをＨ（ｍ）、カメラ２１０とフレーム画像の投影面までの距離をａ（ｍ）、時刻ｔ－１におけるバウンディングボックスの視野角をθ１、時刻ｔにおけるバウンディングボックスの視野角をθ２とする。

　車両３３１の、時刻ｔ－１におけるカメラ画像（フレーム画像）での見かけ上の大きさｓ１は、
　　　ｓ１＝ａ×tanθ１
で表され、時刻ｔにおけるカメラ画像（フレーム画像）での見かけ上の大きさｓ２は、
　　　ｓ２＝ａ×tanθ２
で表される。

　これにより、見かけ上の大きさの変化率Ｓは、
　　　Ｓ＝ｓ２／ｓ１＝（ａ×tanθ２）／（ａ×tanθ１）＝tanθ２／tanθ１
で表される。

　ここで、車両３３１の実際の高さＨについては、
　　　Ｈ＝ｄ×tanθ２＝（ｄ＋ｖ×Δｔ）×tanθ１
の関係が成立することから、第２項と第３項を変形することにより、
　　　Ｓ＝tanθ２／tanθ１＝（ｄ＋ｖ×Δｔ）／ｄ
が得られる。

　上記の式を、ｖについて解くことにより、
　　　ｖ＝ｄ×（Ｓ－１）／Δｔ
が得られる。

　以上のようにして、車両３３１の相対速度ｖが推定される。なお、相対速度は、上述した演算手法に限らず、他の演算手法により求められてもよい。

　図１０の説明に戻り、処理Ｐ１４は、矩形領域切り出し部２３４により実行される、時刻ｔのフレーム画像において認識された車両の座標情報に基づいた矩形領域（バウンディングボックス）の切り出し処理である。処理Ｐ１４により、ＢＢｏｘＩＤ毎の車両画像が取得される。

　処理Ｐ１５は、特徴情報抽出部２３５により実行される、時刻ｔの各車両画像からの車両の特徴情報の抽出処理である。処理Ｐ１５により、ＢＢｏｘＩＤ毎の特徴情報が取得される。図１０の例では、ＢＢｏｘＩＤ：Ｂ１の車両画像から、少なくとも、ナンバープレートの数字：Ｎ１とナンバープレートの位置：（ｐ１，ｑ１）が、特徴情報として抽出されている。

　なお、処理Ｐ１５において、ナンバープレートの数字は、特徴領域であるナンバープレートにおいて認識された数字がそのまま特徴情報として抽出されたものであるが、数字が認識できなかった場合には、例えば“－１”の値が出力される。

　処理Ｐ１６は、トラッキング処理部２３６による、時刻ｔのフレーム画像における車両のトラッキング処理である。処理Ｐ１６により、トラッキングＩＤ，ＢＢｏｘ座標、鳥瞰図座標、および特徴情報を含むトラッキング結果が出力される。

　トラッキングＩＤは、カメラ画像（各フレーム画像）においてトラッキング対象（トラッキングオブジェクト）となる車両固有のＩＤであり、各時刻のフレーム画像間で同一と判定されたトラッキングオブジェクトに引き継がれる。鳥瞰図座標は、上述した距離情報と同じｘ－ｙ座標系での車両の位置（座標）を表す。

　図１４は、鳥瞰図座標の例を示す図である。

　図１４においては、自車（車両１）の後方を撮影したカメラ画像においてトラッキングされている２台の車両３５１，３５２を含む鳥瞰図が示されている。

　車両１と同じ方向に向かって走行している車両３５１は、トラッキングＩＤとしてＩＤ１が割り振られ、車両３５１の位置は、車両１を基準とした座標（ｘ１，ｙ１）で表される。一方、車両１とは対向する方向に向かって走行している車両３５２には、トラッキングＩＤとしてＩＤ２が割り振られ、車両３５２の位置は、車両１を基準とした座標（ｘ２，ｙ２）で表される。

　このように、トラッキング処理によれば、自車を基準とした鳥瞰図における各車両の座標が出力される。

（トラッキング処理の詳細）
　次に、図１５を参照して、図１０の処理Ｐ１６（トラッキング処理）の詳細について説明する。図１５に示されるように、処理Ｐ１６においては、主に４つの処理Ｐ３１乃至Ｐ３４が実行され、これらの処理もまた、時刻ｔのフレーム画像について実行されるものとする。

　図１５の例では、特徴情報として、ナンバープレートの数字のみを用いて、車両の同一判定が行われるものとするが、さらに他の特徴情報を用いた車両の同一判定も、基本的には同様にして行われる。

　処理Ｐ３１は、時刻ｔのフレーム画像において認識された各車両についての、距離情報と速度情報が付加された座標情報と、特徴情報とを統合する統合処理である。座標情報と特徴情報とは、ＢＢｏｘＩＤに基づいて統合される。処理Ｐ３１により、ＢＢｏｘＩＤ、ＢＢｏｘ座標、距離、速度、および特徴情報（ナンバープレートの数字）を含む時刻ｔの観測値が取得される。

　図１５の例では、「ＢＢｏｘＩＤ：Ｂ１（ｔ），ＢＢｏｘ座標：（ｕ１，ｖ１，ｗ，ｈ）（ｔ）、距離：（ｘ１，ｙ１）（ｔ）、速度：ｖ１（ｔ）、ナンバー：Ｎ１（ｔ）」を含む観測値が取得されている。

　処理Ｐ３２は、時刻ｔの観測値と、時刻ｔ－１のトラッキングオブジェクトの特徴情報の一致判定処理である。処理Ｐ３２においては、図４乃至図６を参照して説明した、スコア化された特徴情報の一致判定処理が行われる。時刻ｔ－１のトラッキングオブジェクトは、時刻ｔ－１までトラッキングされている車両のトラッキング結果を含む。図１５の例では、「トラッキングＩＤ：ＩＤ１（ｔ－１），ＢＢｏｘ座標：（ｕ１，ｖ１）（ｔ－１）、距離：（ｘ１，ｙ１）（ｔ－１）、速度：ｖ１（ｔ－１）、ナンバー：Ｎ１（ｔ－１）」を含むトラッキングオブジェクトの特徴情報が、上述した時刻ｔの観測値の特徴情報（ナンバープレートの数字）と比較される。処理Ｐ３２により、時刻ｔの観測値と、時刻ｔ－１のトラッキングオブジェクトは、特徴情報一致リスト、時刻ｔ－１のトラッキングオブジェクト不一致リスト、および、時刻ｔの観測値不一致リストのいずれかに振り分けられる。

　処理Ｐ３３は、一致判定処理において振り分けられたリストに基づいて、時刻ｔ－１のトラッキングオブジェクトに、時刻ｔの観測値を関連付けるアソシエーション分析処理である。

　例えば、特徴情報一致リストにおいて、いずれも“－１”でなく、かつ、ナンバーＮ１（ｔ－１）とナンバーＮ１（ｔ）が一致している、トラッキングＩＤ：ＩＤ１（ｔ－１）のトラッキングオブジェクトとＢＢｏｘＩＤ：Ｂ１（ｔ）の観測値は、関連付けが確定されてペアリングされる。

　一方、不一致リストにおける時刻ｔ－１のトラッキングオブジェクトと、時刻ｔの観測値は、アソシエーション分析処理により、それぞれの間の距離に基づいた関連付けにより、ペアリングされる。図１５の例では、トラッキングＩＤ：ＩＤ２（ｔ－１）のトラッキングオブジェクトとＢＢｏｘＩＤ：Ｂ４（ｔ）の観測値がペアリングされている。

　処理Ｐ３４は、ペアリングされた時刻ｔ－１のトラッキングオブジェクトと時刻ｔの観測値を用いて、カルマンフィルタにより、時刻ｔにおける車両の位置を推定する処理である。処理Ｐ３４においては、例えば、時刻ｔ－１のトラッキングオブジェクトに基づいて予測された車両の存在確率と、時刻ｔの観測値に基づいて予測された車両の存在確率とを用いて、時刻ｔにおける車両の位置が推定される。処理Ｐ３４により、トラッキング結果として、時刻ｔのトラッキングオブジェクトが出力される。

　このとき、時刻ｔのトラッキングオブジェクトに含まれるナンバーＮ１'（ｔ）は、時刻ｔの観測値が、特徴情報一致リストに振り分けられた場合には、その値で更新され、不一致リストに振り分けられた場合には、ペアリングされた時刻ｔ－１のトラッキングオブジェクトの値が保持される。

　以上のようにして、第１時刻の観測値と、第１時刻より前の第２時刻のトラッキングオブジェクトにおける特徴情報の比較が繰り返されることで、トラッキング処理が行われる。

　以上の処理によれば、認識された車両の特徴情報を用いて、フレーム画像間での車両の同一判定が行われるので、トラッキングにおけるＩＤスイッチングを抑制し、トラッキング性能を向上させることが可能となる。特に、特徴情報の抽出処理は、車両が認識されたバウンディングボックス内のみを対象とした演算処理であるので、画像全体を対象とした演算処理と比較して演算量を抑えることが可能となる。

＜５．複数の車載カメラを搭載した例＞
　以上においては、車両１に搭載された１台の車載カメラにより車両をトラッキングする例について説明した。これに限らず、車両１に画角と撮影方向が異なる複数の車載カメラを搭載し、それぞれの車載カメラにより車両をトラッキングすることもできる。

　以下においては、複数の車載カメラによる車両のトラッキング結果を統合する構成について説明する。なお、以下の説明においては、５台の車載カメラを搭載した例を示すものとするが、車載カメラの数はこれに限られない。

　図１６は、車両１に搭載された複数の車載カメラの撮影範囲の例を示す図である。

　撮影範囲４０１は、車両１の前方を撮影する広角カメラの撮影範囲を示しており、撮影範囲４０２は、車両１の前方を撮影する挟角カメラの撮影範囲を示している。撮影範囲４０１は、撮影範囲４０２より、車両１の前方の広範囲をカバーしている一方、撮影範囲４０２は、撮影範囲４０１より、車両１の前方の遠い範囲をカバーしている。撮影範囲４０１，４０２が撮影されたカメラ画像は、車両１の前方における車両のトラッキングに用いられる。

　撮影範囲４０３は、車両１の左方を撮影する左カメラの撮影範囲を示しており、撮影範囲４０４は、車両１の右方を撮影する右カメラの撮影範囲を示している。撮影範囲４０３が撮影されたカメラ画像は、車両１の左方における車両のトラッキングに用いられ、撮影範囲４０４が撮影されたカメラ画像は、車両１の右方における車両のトラッキングに用いられる。

　撮影範囲４０５は、車両１の後方を撮影するリアカメラの撮影範囲を示している。撮影範囲４０５が撮影されたカメラ画像は、車両１の後方における車両のトラッキングに用いられる。

　本例においては、撮影範囲４０１乃至４０５それぞれが撮影されたカメラ画像において認識された車両から、トラッキング対象となる車両が特定されてトラッキングされる。

　図１７は、本例における情報処理装置の構成例を示すブロック図である。

　図１７には、広角カメラ４１１、挟角カメラ４１２、左カメラ４１３、右カメラ４１４、リアカメラ４１５、および情報処理装置４３０が示されている。

　広角カメラ４１１は、車両１の前方を撮影することで、図１６の撮影範囲４０１が撮影されたカメラ画像を取得し、情報処理装置４３０に供給する。

　挟角カメラ４１２は、車両１の前方を撮影することで、図１６の撮影範囲４０２が撮影されたカメラ画像を取得し、情報処理装置４３０に供給する。

　左カメラ４１３は、車両１の左方を撮影することで、図１６の撮影範囲４０３が撮影されたカメラ画像を取得し、情報処理装置４３０に供給する。

　右カメラ４１４は、車両１の右方を撮影することで、図１６の撮影範囲４０４が撮影されたカメラ画像を取得し、情報処理装置４３０に供給する。

　リアカメラ４１５は、車両１の後方を撮影することで、図１６の撮影範囲４０５が撮影されたカメラ画像を取得し、情報処理装置４３０に供給する。

　情報処理装置４３０は、情報処理部４３１－１乃至４３１－５と、統合処理部４３２を備えている。

　情報処理部４３１－１乃至４３１－５は、それぞれ、図３の情報処理装置２３０が備える構成を有している。すなわち、情報処理部４３１－１乃至４３１－５は、それぞれ、広角カメラ４１１、挟角カメラ４１２、左カメラ４１３、右カメラ４１４、およびリアカメラ４１５（以下、複数の車載カメラともいう）それぞれにより得られたカメラ画像において、車両１の周囲の車両をトラッキングする。カメラ画像それぞれにおける車両のトラッキング結果は、統合処理部４３２に出力される。

　統合処理部４３２は、画角と撮影方向が異なる複数の車載カメラにより撮影されたカメラ画像それぞれにおける車両のトラッキング結果を統合することで、その車両をトラッキングする。このとき、統合処理部４３２は、所定の時間単位毎に、トラッキング結果を統合する。

　なお、複数の車載カメラそれぞれにおける車両のトラッキング結果においては、同一車両（同一トラッキングＩＤ）のトラッキング結果であっても、例えばバウンディングボックスの大きさなどが異なる場合がある。この場合、統合処理部４３２は、それぞれのトラッキング結果の間で、バウンディングボックスのスケーリングなどを行うようにする。

（統合処理の詳細）
　次に、図１８を参照して、統合処理部４３２によるトラッキング結果の統合処理の詳細について説明する。図１８に示されるように、統合処理部４３２によるトラッキング結果の統合処理においては、主に３つの処理が実行される。ここで、複数の車載カメラはそれぞれ非同期でカメラ画像を撮影するが、カメラ画像それぞれのフレームレート（ｆｐｓ）は同一とされる。

　処理Ｐ４１は、複数の車載カメラそれぞれにおける車両のトラッキング結果を、所定の時間単位毎にグループ化する処理である。上述したように、複数の車載カメラのフレームレートは同一であるので、１フレーム時間（１／ｆｐｓ）内のトラッキング結果を、１つの時刻グループにグループ化することができる。図１８の例では、複数の車載カメラそれぞれについて得られた、時刻ｔ１＿１，ｔ１＿２，ｔ１＿３，ｔ１＿４，ｔ１＿５のトラッキング結果が、１つの時刻グループｔ１にグループ化されている。

　処理Ｐ４２は、１つの時刻グループ内のトラッキング結果を時刻順に並び替える処理である。図１８の例では、複数の車載カメラについてのトラッキング結果が、時刻ｔ１＿２，ｔ１＿１，ｔ１＿４，ｔ１＿５，ｔ１＿３の順に並び替えられ、その時刻順に、処理Ｐ４３の入力となる。

　処理Ｐ４３は、１つの時刻グループ内で時刻順に並び替えられたトラッキング結果を蓄積し、順次、図１５の処理Ｐ３２乃至Ｐ３４と同様の処理を繰り返すことで、１つの時刻グループのトラッキングオブジェクトとして出力する統合処理である。図１８の例では、時刻グループｔ１のトラッキングオブジェクトが出力されている。処理Ｐ４３によって出力されるトラッキングオブジェクトには、トラッキングＩＤを始め、ＢＢｏｘ座標、距離情報や速度情報、特徴情報などが必要に応じて含まれるようにできる。

　以上のようにして、複数の車載カメラについてのトラッキング結果の統合が繰り返されることで、車両のトラッキング処理が行われる。

　以上の処理によれば、複数の車載カメラを備える構成においても、個々の車載カメラについて、認識された車両の特徴情報を用いて、フレーム画像間での車両の同一判定が行われるので、トラッキングにおけるＩＤスイッチングを抑制し、トラッキング性能を向上させることが可能となる。

　以上においては、車両をトラッキング対象とする例を中心に説明したが、車両以外の任意の物体をトラッキング対象とすることができる。

　また、本技術は、車両以外の移動体の周囲の対象物をトラッキングする場合にも適用することが可能である。例えば、自動二輪車、自転車、パーソナルモビリティ、飛行機、船舶、建設機械、農業機械（トラクター）等の移動体が想定される。また、本技術が適用可能な移動体には、例えば、ドローン、ロボット等のユーザが搭乗せずにリモートで運転（操作）する移動体も含まれる。

　また、本技術は、例えば、監視システムなど、固定された場所で対象物をトラッキングする場合にも適用することができる。

＜６．コンピュータの構成例＞
　上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

　図１９は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　上述した情報処理装置２３０や情報処理装置４３０は、図１９に示す構成を有するコンピュータ６００により実現される。

　ＣＰＵ６０１、ＲＯＭ６０２、ＲＡＭ６０３は、バス６０４により相互に接続されている。

　バス６０４には、さらに、入出力インタフェース６０５が接続されている。入出力インタフェース６０５には、キーボード、マウスなどよりなる入力部６０６、ディスプレイ、スピーカなどよりなる出力部６０７が接続される。また、入出力インタフェース６０５には、ハードディスクや不揮発性のメモリなどよりなる記憶部６０８、ネットワークインタフェースなどよりなる通信部６０９、リムーバブルメディア６１１を駆動するドライブ６１０が接続される。

　以上のように構成されるコンピュータ６００では、ＣＰＵ６０１が、例えば、記憶部６０８に記憶されているプログラムを入出力インタフェース６０５およびバス６０４を介してＲＡＭ６０３にロードして実行することにより、上述した一連の処理が行われる。

　ＣＰＵ６０１が実行するプログラムは、例えばリムーバブルメディア６１１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部６０８にインストールされる。

　なお、コンピュータ６００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたときなどの必要なタイミングで処理が行われるプログラムであっても良い。

　本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）など）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　さらに、本技術は以下のような構成をとることができる。
（１）
　フレーム画像単位で物体の特徴情報を抽出する特徴情報抽出部と、
　前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングするトラッキング処理部と
　情報処理装置。
（２）
　前記特徴情報抽出部は、前記フレーム画像において認識された前記物体を囲う矩形枠に対応する前記特徴情報のみを抽出する
　（１）に記載の情報処理装置。
（３）
　前記トラッキング処理部は、第１時刻と、前記第１時刻より前の第２時刻の前記特徴情報の比較結果に基づいて、前記物体をトラッキングする
　（１）または（２）に記載の情報処理装置。
（４）
　前記トラッキング処理部は、前記第１時刻と前記第２時刻の前記特徴情報が一致した場合、前記第１時刻の前記フレーム画像における前記物体が、前記第２時刻の前記フレーム画像における前記物体と同一であると判定する
　（３）に記載の情報処理装置。
（５）
　前記トラッキング処理部は、前記第１時刻と前記第２時刻の前記特徴情報の一致の度合いを表すスコアが所定の閾値以上の場合に、前記第１時刻と前記第２時刻の前記特徴情報が一致したと判定する
　（４）に記載の情報処理装置。
（６）
　前記特徴情報抽出部は、複数の前記特徴情報を抽出し、
　前記トラッキング処理部は、複数の前記特徴情報についての前記スコアの合計が、前記閾値以上の場合に、前記第１時刻と前記第２時刻の前記特徴情報が一致したと判定する
　（５）に記載の情報処理装置。
（７）
　前記特徴情報抽出部は、１または複数のセンサにより得られたセンサデータに基づいて、前記特徴情報を抽出する
　（１）乃至（６）のいずれかに記載の情報処理装置。
（８）
　前記センサデータは、カメラにより得られた前記フレーム画像、レーダまたはＬｉＤＡＲにより得られた点群データの少なくともいずれかを含む
　（７）に記載の情報処理装置。
（９）
　前記特徴情報抽出部は、前記フレーム画像における前記物体の特徴領域から、前記特徴情報を抽出する
　（８）に記載の情報処理装置。
（１０）
　前記特徴情報は、前記特徴領域に含まれる数字を含む
　（９）に記載の情報処理装置。
（１１）
　前記特徴情報は、前記特徴領域の位置および形状の少なくともいずれかを含む
　（９）に記載の情報処理装置。
（１２）
　前記特徴領域は、車両のナンバープレート、フロントグリル、ライト、およびエンブレムの少なくともいずれかを含む
　（９）乃至（１１）のいずれかに記載の情報処理装置。
（１３）
　前記特徴情報抽出部は、前記物体に反射した前記点群データから、前記特徴情報を抽出する
　（９）に記載の情報処理装置。
（１４）
　前記特徴情報は、前記点群データのカメラ座標系の位置を含む
　（１３）に記載の情報処理装置。
（１５）
　前記特徴情報は、前記点群データの三次元座標系の位置を含む
　（１３）に記載の情報処理装置。
（１６）
　前記特徴情報は、前記点群データそれぞれの反射強度を含む
　（１３）に記載の情報処理装置。
（１７）
　画角と撮影方向が異なる複数のカメラにより撮影された前記フレーム画像それぞれに基づいた前記物体のトラッキング結果を統合することで、前記物体をトラッキングする統合処理部をさらに備える
　（１）乃至（１６）のいずれかに記載の情報処理装置。
（１８）
　前記統合処理部は、所定の時間単位毎に、前記トラッキング結果を統合する
　（１７）に記載の情報処理装置。
（１９）
　情報処理装置が、
　フレーム画像単位で物体の特徴情報を抽出し、
　前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングする
　情報処理方法。
（２０）
　コンピュータに、
　フレーム画像単位で物体の特徴情報を抽出し、
　前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングする
　処理を実行させるためのプログラム。

　１　車両，　６１　分析部，　２１０　カメラ，　２３０　情報処理装置，　２３１　信号処理部，　２３２　車両認識部，　２３３　距離・速度演算部，　２３４　矩形領域切り出し部，　２３５　特徴情報抽出部，　２３６　トラッキング処理部，　４１１　広角カメラ，　４１２　挟角カメラ，　４１３　左カメラ，　４１４　右カメラ，　４１５　リアカメラ，　４３０　情報処理装置，　４３１－１乃至４３１－５　情報処理部，　４３２　統合処理部

Claims

　フレーム画像単位で物体の特徴情報を抽出する特徴情報抽出部と、
　前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングするトラッキング処理部と
　情報処理装置。
　前記特徴情報抽出部は、前記フレーム画像において認識された前記物体を囲う矩形枠に対応する前記特徴情報のみを抽出する
　請求項１に記載の情報処理装置。
　前記トラッキング処理部は、第１時刻と、前記第１時刻より前の第２時刻の前記特徴情報の比較結果に基づいて、前記物体をトラッキングする
　請求項１に記載の情報処理装置。
　前記トラッキング処理部は、前記第１時刻と前記第２時刻の前記特徴情報が一致した場合、前記第１時刻の前記フレーム画像における前記物体が、前記第２時刻の前記フレーム画像における前記物体と同一であると判定する
　請求項３に記載の情報処理装置。
　前記トラッキング処理部は、前記第１時刻と前記第２時刻の前記特徴情報の一致の度合いを表すスコアが所定の閾値以上の場合に、前記第１時刻と前記第２時刻の前記特徴情報が一致したと判定する
　請求項４に記載の情報処理装置。
　前記特徴情報抽出部は、複数の前記特徴情報を抽出し、
　前記トラッキング処理部は、複数の前記特徴情報についての前記スコアの合計が、前記閾値以上の場合に、前記第１時刻と前記第２時刻の前記特徴情報が一致したと判定する
　請求項５に記載の情報処理装置。
　前記特徴情報抽出部は、１または複数のセンサにより得られたセンサデータに基づいて、前記特徴情報を抽出する
　請求項１に記載の情報処理装置。
　前記センサデータは、カメラにより得られた前記フレーム画像、レーダまたはＬｉＤＡＲにより得られた点群データの少なくともいずれかを含む
　請求項７に記載の情報処理装置。
　前記特徴情報抽出部は、前記フレーム画像における前記物体の特徴領域から、前記特徴情報を抽出する
　請求項８に記載の情報処理装置。
　前記特徴情報は、前記特徴領域に含まれる数字を含む
　請求項９に記載の情報処理装置。
　前記特徴情報は、前記特徴領域の位置および形状の少なくともいずれかを含む
　請求項５に記載の情報処理装置。
　前記特徴領域は、車両のナンバープレート、フロントグリル、ライト、およびエンブレムの少なくともいずれかを含む
　請求項９に記載の情報処理装置。
　前記特徴情報抽出部は、前記物体に反射した前記点群データから、前記特徴情報を抽出する
　請求項８に記載の情報処理装置。
　前記特徴情報は、前記点群データのカメラ座標系の位置を含む
　請求項１３に記載の情報処理装置。
　前記特徴情報は、前記点群データの三次元座標系の位置を含む
　請求項１３に記載の情報処理装置。
　前記特徴情報は、前記点群データそれぞれの反射強度を含む
　請求項１３に記載の情報処理装置。
　画角と撮影方向が異なる複数のカメラにより撮影された前記フレーム画像それぞれに基づいた前記物体のトラッキング結果を統合することで、前記物体をトラッキングする統合処理部をさらに備える
　請求項１に記載の情報処理装置。
　前記統合処理部は、所定の時間単位毎に、前記トラッキング結果を統合する
　請求項１７に記載の情報処理装置。
　情報処理装置が、
　フレーム画像単位で物体の特徴情報を抽出し、
　前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングする
　情報処理方法。
　コンピュータに、
　フレーム画像単位で物体の特徴情報を抽出し、
　前記特徴情報を用いて、前記フレーム画像において前記物体をトラッキングする
　処理を実行させるためのプログラム。