JP2019153225A - 物体識別装置 - Google Patents
物体識別装置 Download PDFInfo
- Publication number
- JP2019153225A JP2019153225A JP2018039867A JP2018039867A JP2019153225A JP 2019153225 A JP2019153225 A JP 2019153225A JP 2018039867 A JP2018039867 A JP 2018039867A JP 2018039867 A JP2018039867 A JP 2018039867A JP 2019153225 A JP2019153225 A JP 2019153225A
- Authority
- JP
- Japan
- Prior art keywords
- score
- recognition
- information
- image
- classes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
【課題】認識の精度を向上する。【解決手段】物体識別装置(100)は、周辺環境を認識する認識手段から出力されたデータを解析して、周辺環境に存在する物体が複数のクラスのいずれに分類されるかの尤もらしさを示すスコアを、複数のクラス各々について求め、スコアの最も高いクラスに物体を分類する物体識別装置である。当該物体識別装置は、物体を複数のクラスのいずれかに分類する際に、認識手段とは異なる情報源の、周辺環境に存在する物体を示唆する示唆情報が存在する場合、示唆情報に対応するクラスのスコアが増加するようにスコアを補正する。【選択図】図1
Description
本発明は、物体識別装置の技術分野に関する。
この種の装置で用いられる技術として、例えば、画像認識に有効な畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)に係る技術が提案されている(特許文献1参照)。
CNNを用いた画像認識では、畳み込みフィルタにより認識対象の画像に係る特徴量が抽出され、例えば該抽出された特徴量に基づいて認識対象の画像が複数のクラスのうちいずれかに分類(即ち、多クラス分類)される。この結果、例えば認識対象の画像に写っている物体が識別される。しかしながら、このような画像認識には改善の余地がある。
本発明は、上記事情に鑑みてなされたものであり、認識の精度を向上することができる物体識別装置を提供することを課題とする。
本発明の一態様に係る物体識別装置は、周辺環境を認識する認識手段から出力されたデータを解析して、前記周辺環境に存在する物体が複数のクラスのいずれに分類されるかの尤もらしさを示すスコアを、前記複数のクラス各々について求め、前記スコアの最も高いクラスに前記物体を分類する物体識別装置であって、前記物体を前記複数のクラスのいずれかに分類する際に、前記認識手段とは異なる情報源の、前記周辺環境に存在する物体を示唆する示唆情報が存在する場合、前記示唆情報に対応するクラスのスコアが増加するように前記スコアを補正するというものである。
物体識別装置に係る実施形態について図1及び図2を参照して説明する。ここでは、物体識別装置の一例として、画像認識システムを挙げる。尚、本実施形態では、CNNの入力データとして、例えば車両等の移動体に搭載されたカメラにより撮像された画像を一例として挙げる。
(構成)
実施形態に係る画像認識システムの構成について図1を参照して説明する。図1は、実施形態に係る物体画像認識システムの構成を示すブロック図である。
実施形態に係る画像認識システムの構成について図1を参照して説明する。図1は、実施形態に係る物体画像認識システムの構成を示すブロック図である。
図1において、画像認識システム100は、認識部10及び出力部20を備えて構成されている。認識部10は、その内部に論理的に実現される処理ブロックとして多クラス分類器及び最大スコア判定器を有する。多クラス分類器は、例えばCNN等により構成されている。尚、多クラス分類器には、既存の各種態様を適用可能であるので、その詳細についての説明は省略する。
画像情報(即ち、移動体に搭載されたカメラにより撮像された画像に相当する画像情報)が、多クラス分類器に入力されると、該多クラス分類器はスコアベクトルsを出力する。ここでは、スコアベクトルs=(車両スコア,パイロンスコア,警戒標識スコア,信号灯スコア,歩行者スコア,子供スコア,…)と表される。尚、スコアベクトル(又はラベリングベクトル)の求め方については、既存の各種態様を適用可能であるので、その詳細についての説明は省略する。
認識部10は、スコアベクトルsに、重みベクトルwを掛けることによって、重み付きスコアベクトルs×wを計算する。ここでは、重みベクトルw=(車両重み,パイロン重み,警戒標識重み,信号灯重み,歩行者重み,子供重み,…)と表される。最大スコア判定器は、重み付きスコアベクトルs×wに含まれる複数の成分のうち最大値の成分を選択し、上記画像情報を、該選択された成分に対応するクラスに分類する。つまり、認識部10は、上記画像情報に写っている物体を、上記選択された成分に対応するクラスにより示される物体であると認識する。出力部20は、認識部10による分類結果(即ち、認識結果)を出力する。
本実施形態では特に、認識部10は、移動体(即ち、多クラス分類器に入力される画像情報に相当する画像を撮像したカメラ)の周辺環境に存在する物体を示唆する示唆情報に応じて、重みベクトルwの少なくとも一つの成分の値(即ち、重み)を変更する。本実施形態では、示唆情報として、過去及び現在の地図情報(例えば、過去のある時刻に移動体が存在した位置周辺の地図情報、及び、移動体の現在位置周辺の地図情報)、過去及び現在のVICS(登録商標、Vehicle Information and Communication System)情報、及び、画像認識システム100による過去の分類結果(以降、適宜“過去出力”と称する)を挙げる。
移動体に搭載されたカメラにより撮像された画像に相当する画像情報が、時系列に沿って、画像認識システム100に入力される場合、時刻tの画像情報に、特定の物体の存在を示唆する物体が写っている場合、時刻tより後の時刻t´の画像情報に、上記特定の物体が写っている可能性が比較的高い。言い換えれば、時刻tの画像情報についての分類結果は、時刻t´の画像情報に写っている物体を示唆している可能性が比較的高い。例えば時刻tの画像情報に「500m先道路工事中」という標識が写っている場合、時刻t´の画像情報に「パイロン」が写っている可能性が比較的高い。このため、過去出力は示唆情報になり得るのである。
例えば示唆情報としての地図情報により、移動体に搭載されたカメラの撮像方向に交差点が存在することが示された場合、認識部10は、重みベクトルwに含まれる信号灯重みの値を大きくする。例えば示唆情報としてのVICS情報により、工事現場が移動体の近くに存在することが示された場合、認識部10は、重みベクトルwに含まれるパイロン重みの値を大きくする。例えば示唆情報としての過去出力が「道路工事中」の標識であった場合、認識部10は、重みベクトルwに含まれるパイロン重みの値を大きくする。例えば示唆情報としての過去出力が「学校、幼稚園、保育所等あり」の標識であった場合、認識部10は、重みベクトルwに含まれる子供重みの値を大きくする。
当該画像認識システム100では、現在から過去のある時点までの所定期間に取得された、例えば地図情報、VICS情報及び過去出力が示唆情報として扱われる。「所定期間」をどの程度の長さとするかは、例えば移動体の速度等に応じて適宜設定されてよい。尚、示唆情報が存在しない場合、認識部10は、重みベクトルwに含まれる各成分の値(即ち、重み)を等しくする。
(画像認識処理)
次に、画像認識システム100において実施される画像認識処理について図2のフローチャートを参照して説明する。
次に、画像認識システム100において実施される画像認識処理について図2のフローチャートを参照して説明する。
図2において、画像認識システム100の認識部10は、入力データ(ここでは、画像情報)を取得する(ステップS101)。ステップS101の処理と並行して、認識部10は、入力データ以外のデータ(即ち、上述の示唆情報)を取得する(ステップS102)。尚、示唆情報が存在しない場合、ステップS102の処理はスキップされてよい。
次に、ステップS101の処理において取得された入力データが認識部10の多クラス分類器に入力される(ステップS103)。その後、多クラス分類器からスコアベクトルsが出力される(ステップS104)。ステップS103及びS104の処理と並行して、認識部10は、重みベクトルwを決定する(ステップS105)。このとき、ステップS102の処理において、示唆情報が取得されていれば、識別部10は、該示唆情報に応じて重みベクトルwを変更する。
次に、認識部10は、スコアベクトルsに重みベクトルwを掛けることにより重み付きスコアベクトルs×wを求める(ステップS106)。次に、最大スコア判定器は、重み付きスコアベクトルs×wに含まれる複数の成分のうち最大値の成分を選択する(ステップS107)。その後、出力部20は、認識部10による分類結果を出力する(ステップS108)。
上記ステップS108の処理の後、所定時間(例えば数十ミリ秒から数百ミリ秒)が経過した後、ステップS101の処理が再度行われる。即ち、図2に示す画像認識処理は、所定時間に応じた周期で繰り返し行われる。
(技術的効果)
当該画像認識システム100では、画像情報(即ち、多クラス分類器の入力データ)以外のデータ(即ち、上述の示唆情報)も用いて画像認識が行われる。このため、画像情報のみを用いて画像認識を行う比較例に係るシステムに比べて、画像認識の精度を向上することができる。
当該画像認識システム100では、画像情報(即ち、多クラス分類器の入力データ)以外のデータ(即ち、上述の示唆情報)も用いて画像認識が行われる。このため、画像情報のみを用いて画像認識を行う比較例に係るシステムに比べて、画像認識の精度を向上することができる。
<変形例>
(1)画像情報(即ち、移動体に搭載されたカメラにより撮像された画像に相当する画像情報)に限らず、例えばLIDAR(Light Detection and Ranging)により取得された情報等も、多クラス分類器の入力データとされてよい。
(1)画像情報(即ち、移動体に搭載されたカメラにより撮像された画像に相当する画像情報)に限らず、例えばLIDAR(Light Detection and Ranging)により取得された情報等も、多クラス分類器の入力データとされてよい。
(2)重みベクトルwに含まれる複数の成分のうち、存在可能性が比較的低い物体に対応するクラスの成分の値(即ち、重み)は、標準では“0”に設定されてよい。そして、示唆情報により、重みが“0”に設定されたクラスに対応する物体の存在が示唆された場合に、当該クラスの重みが“0”より大きく設定されてよい。このように構成すれば、誤認識を抑制することができる。
(3)多クラス分類器は標準ではOFF状態(即ち、重みベクトルwの全ての成分の値が“0”に相当)であってよい。そして、示唆情報が存在する場合に、多クラス分類器がON状態にされてよい。このように構成すれば、画像認識システム100に係る処理負荷が軽減され、画像認識システム100の消費エネルギーを抑制することができる。尚、この場合、標準では、多クラス分類器を用いない画像認識が行われてよい。
(4)示唆情報として、スコアベクトルsに含まれる少なくとも一つの成分に対応するクラスの非存在を示す情報が取得された場合、識別部10は、当該対応するクラスの重みを“0”に設定してよい。この結果、当該対応するクラスの重み付きスコアは、非存在を示す示唆情報が取得されない場合に比べて低下する。具体的には、示唆情報として「自動車専用」の標識が取得された場合、識別部10は、重みベクトルwに含まれる、例えば歩行者重み、自転車重み等を“0”に設定してよい。
以上に説明した実施形態及び変形例から導き出される発明の各種態様を以下に説明する。
発明の一態様に係る物体識別装置は、周辺環境を認識する認識手段から出力されたデータを解析して、前記周辺環境に存在する物体が複数のクラスのいずれに分類されるかの尤もらしさを示すスコアを、前記複数のクラス各々について求め、前記スコアの最も高いクラスに前記物体を分類する物体識別装置であって、前記物体を前記複数のクラスのいずれかに分類する際に、前記認識手段とは異なる情報源の、前記周辺環境に存在する物体を示唆する示唆情報が存在する場合、前記示唆情報に対応するクラスのスコアが増加するように前記スコアを補正するというものである。尚、「周辺環境」は、認識手段の周辺環境を意味する。当該物体識別装置が認識手段の近傍に存在している場合には、「周辺環境」は、当該物体識別装置の周辺環境と同義となる。
当該物体識別装置によれば、示唆情報を用いてスコアが補正されるので、示唆情報を用いない(即ち、認識手段から出力されたデータだけ用いる)比較例に係る装置と比べて、認識の精度を向上することができる。
本発明は、上述した実施形態に限られるものではなく、特許請求の範囲及び明細書全体から読み取れる発明の要旨或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う物体識別装置もまた本発明の技術的範囲に含まれるものである。
10…認識部、20…出力部、100…画像認識システム
Claims (1)
- 周辺環境を認識する認識手段から出力されたデータを解析して、前記周辺環境に存在する物体が複数のクラスのいずれに分類されるかの尤もらしさを示すスコアを、前記複数のクラス各々について求め、前記スコアの最も高いクラスに前記物体を分類する物体識別装置であって、
前記物体を前記複数のクラスのいずれかに分類する際に、前記認識手段とは異なる情報源の、前記周辺環境に存在する物体を示唆する示唆情報が存在する場合、前記示唆情報に対応するクラスのスコアが増加するように前記スコアを補正する
ことを特徴とする物体識別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018039867A JP2019153225A (ja) | 2018-03-06 | 2018-03-06 | 物体識別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018039867A JP2019153225A (ja) | 2018-03-06 | 2018-03-06 | 物体識別装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019153225A true JP2019153225A (ja) | 2019-09-12 |
Family
ID=67946664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018039867A Pending JP2019153225A (ja) | 2018-03-06 | 2018-03-06 | 物体識別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019153225A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021064054A (ja) * | 2019-10-10 | 2021-04-22 | トヨタ自動車株式会社 | 路上障害物検知装置、路上障害物検知方法、及び路上障害物検知プログラム |
-
2018
- 2018-03-06 JP JP2018039867A patent/JP2019153225A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021064054A (ja) * | 2019-10-10 | 2021-04-22 | トヨタ自動車株式会社 | 路上障害物検知装置、路上障害物検知方法、及び路上障害物検知プログラム |
JP7215390B2 (ja) | 2019-10-10 | 2023-01-31 | トヨタ自動車株式会社 | 路上障害物検知装置、路上障害物検知方法、及び路上障害物検知プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102279291B1 (ko) | 사물 감지 장치 및 방법 | |
JP6709283B2 (ja) | 低解像度リモートセンシング画像を用いた移動車両の検出及び分析 | |
KR101912914B1 (ko) | 전방 카메라를 이용한 속도제한 표지판 인식 시스템 및 방법 | |
Xu et al. | An efficient tree classifier ensemble-based approach for pedestrian detection | |
CN111488770A (zh) | 交通标志识别方法、神经网络模型的训练方法和装置 | |
CN113688652B (zh) | 一种异常驾驶行为的处理方法和装置 | |
CN110781768A (zh) | 目标对象检测方法和装置、电子设备和介质 | |
JP2017520859A (ja) | 画像オブジェクト領域の認識方法及び装置 | |
KR20150081480A (ko) | 교통 표지판 인식 방법 및 장치 | |
CN112307978B (zh) | 目标检测方法、装置、电子设备及可读存储介质 | |
Farag et al. | An advanced vehicle detection and tracking scheme for self-driving cars | |
CN111046971A (zh) | 图像识别方法、装置、设备及计算机可读存储介质 | |
KR102195940B1 (ko) | 적응적 비최대억제 방법을 이용하는 딥러닝기반 영상객체 탐지를 위한 장치 및 방법 | |
TWI442917B (zh) | 具即時語音回報功能的導盲系統及其方法 | |
Gim et al. | Real-time speed-limit sign detection and recognition using spatial pyramid feature and boosted random forest | |
JP2019153225A (ja) | 物体識別装置 | |
CN115393625A (zh) | 从粗略标记进行图像分段的半监督式训练 | |
CN110121723B (zh) | 人工神经网络 | |
Muzammel et al. | Rear-end vision-based collision detection system for motorcyclists | |
Negi et al. | Text based traffic signboard detection using YOLO v7 architecture | |
CN107609454A (zh) | 一种识别图像中的手势的方法及装置 | |
JP2011043995A (ja) | 路面標示認識装置 | |
Sen et al. | Pothole detection system using object detection through dash cam video feed | |
CN114443878A (zh) | 图像分类方法、装置、设备及存储介质 | |
JP5901054B2 (ja) | 物体の検出方法及びその方法を用いた物体の検出装置 |