JP4946535B2 - 画像認識装置 - Google Patents

画像認識装置 Download PDF

Info

Publication number
JP4946535B2
JP4946535B2 JP2007062487A JP2007062487A JP4946535B2 JP 4946535 B2 JP4946535 B2 JP 4946535B2 JP 2007062487 A JP2007062487 A JP 2007062487A JP 2007062487 A JP2007062487 A JP 2007062487A JP 4946535 B2 JP4946535 B2 JP 4946535B2
Authority
JP
Japan
Prior art keywords
existence probability
existence
voxel
points
restoration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007062487A
Other languages
English (en)
Other versions
JP2008225787A (ja
Inventor
謙一 北浜
フランク ガルパン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2007062487A priority Critical patent/JP4946535B2/ja
Publication of JP2008225787A publication Critical patent/JP2008225787A/ja
Application granted granted Critical
Publication of JP4946535B2 publication Critical patent/JP4946535B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Length Measuring Devices By Optical Means (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、対象物の撮像画像を用いて対象物を認識する画像認識装置に関するものである。
従来の画像認識装置としては、例えば非特許文献1に記載されているように、物体の表面形状を点の集合として三次元空間上に復元し、その三次元空間の各ボクセルに点が存在するかどうかを検出するものが知られている。
FANG,S. AND CHEN,H.2000.Hardware AcceleratedVoxelization.Computers&Graphics 24,3(June),433-442.
しかしながら、上記従来技術においては、以下の問題点が存在する。即ち、画像認識装置を例えばロボットに適用し、画像認識装置の認識結果に応じてロボットの移動経路を求める場合、ノイズ等の影響により誤って点が1つでも復元されると、本来ならば存在しないはずの場所に障害物が存在すると判断されてしまう。この場合には、ロボットの正しい移動経路が得られなくなる。
本発明の目的は、対象物の有無を精度良く認識することができる画像認識装置を提供することである。
本発明は、撮像部により取得した対象物の撮像画像を用いて対象物を認識する画像認識装置において、対象物の撮像画像に基づいて、対象物の表面に対応する複数の点を三次元空間上に復元する三次元復元手段と、復元された複数の点を含む三次元空間を複数のボクセルに分割する空間分割手段と、復元された各点と撮像部とを結ぶ複数の仮想線上に、撮像部側に近づくにつれて存在確率が低くなるような存在確率分布をそれぞれ定義する存在確率定義手段と、複数の仮想線が通過するボクセルに対し、複数の仮想線上に定義された存在確率を全て対応付けする存在確率対応付け手段と、ボクセルに対して対応付けされた全ての存在確率の統計データに基づいて、ボクセルに相当する位置に対象物が存在するかどうかを判断する判断手段とを備えることを特徴とするものである。
このような画像認識装置においては、復元された点(復元点)よりも撮像部側に他の復元点が存在する確率は低いという条件を利用して、各復元点と撮像部とを結ぶ複数の仮想線上に、任意の復元点よりも撮像部側の位置の存在確率が当該復元点の位置の存在確率に比べて低くなるような存在確率分布をそれぞれ定義する。そして、複数の復元点を含む三次元空間を分割して得られた複数のボクセルのうち上記の各仮想線が通過するボクセルに対し、当該各仮想線上に定義された存在確率をそれぞれ対応付けする。ここで、実際の対象物の表面に対応する真の復元点は、ノイズ等の影響により誤って復元された点と異なり、集中する傾向にある。このため、実際に対象物が存在する位置に相当するボクセルには、比較的高い存在確率が数多く対応付けされるようになる。そこで、そのような存在確率の統計データに基づいて、各ボクセルに相当する位置に対象物が存在するかどうかを判断する。これにより、ノイズ等の影響を除外して、対象物の有無を精度良く認識することができる。
好ましくは、判断手段は、統計データとして、ボクセルに対して対応付けされた全ての存在確率の平均値を求め、存在確率の平均値が閾値よりも高いかどうかに基づいてボクセルに相当する位置に対象物が存在するかどうかを判断する。
ボクセルに対して比較的高い存在確率が数多く対応付けされると、そのボクセルにおける存在確率の平均値が高くなる。一方、ボクセルに対して比較的低い存在確率が数多く対応付けされると、ノイズ等の影響によって高い存在確率が1つだけあったとしても、そのボクセルにおける存在確率の平均値は高くはならない。従って、ボクセルに対して対応付けされた存在確率の平均値に基づいてボクセルに相当する位置に対象物が存在するかどうかを判断することにより、対象物の有無をより精度良く認識することができる。
本発明によれば、対象物の有無を精度良く認識することができる。これにより、例えば画像認識装置の認識結果を用いてロボットを任意の位置に移動させる場合に、ロボットの正しい移動経路を求めることが可能となる。
以下、本発明に係わる画像認識装置の好適な実施形態について、図面を参照して詳細に説明する。
図1は、本発明に係わる画像認識装置の一実施形態を示す概略構成図である。同図において、本実施形態の画像認識装置1は、例えば産業用ロボット(図示せず)等に搭載されるものである。
同図において、画像認識装置1は、ロボット前方を撮像するカメラ2,3と、これらのカメラ2,3と接続された演算処理ユニット4とを備えている。カメラ2,3は、例えばCCDカメラであり、異なる2つの視点から対象物Aを撮像するようにロボットの両眼部(図示せず)に設けられている。カメラ2,3により対象物Aが撮像されると、その対象物Aの画像がカメラ2,3の撮像面2a,3aにそれぞれ投影される。
演算処理ユニット4は、カメラ2,3により取得した対象物Aの撮像画像を入力し、所定の画像処理を行い、ロボット前方に障害物や把持物体等が実際に存在しているかどうかを判定する。演算処理ユニット4による演算処理手順の詳細を図2に示す。
同図において、まず例えば三角測量の原理を利用したステレオ視を用いて、図3(a)に示すように、カメラ2,3により撮像された対象物Aの表面形状(凹凸)を多数の点Pの集合として三次元空間上に復元する(手順S51)。カメラ2,3の画像面2a,3aにおいて同一の点Pの対応付けを行うことで、三角測量の原理により奥行きを知ることができる。
続いて、図3(b)に示すように、手順S51で得られた全ての点(復元点)Pを含む三次元空間を小空間(ボクセル)Qに分割する(手順S52)。これにより、全ての復元点Pは、何れかのボクセルQに含まれることとなる。
続いて、図3(b)に示すように、カメラ2,3の中心と復元点Pとを結ぶ光線(仮想線)上に、復元点の存在確率を表す分布(存在確率分布)を定義する(手順S53)。この存在確率分布の定義処理は、全ての復元点Pについて以下のようにして行う。
復元点Pは、カメラ2,3で見える範囲を撮像して得られるものである。このため、上記の手順S51で得られた復元点Pを通る光線上において、復元点Pの手前側(カメラ2,3側)に他の復元点Pが存在している確率は極めて低い。そこで、任意の復元点Pを通る光線上の存在確率分布としては、復元点Pの位置の存在確率が最も高く、復元点Pよりも手前側及び奥側(カメラ2,3の反対側)に向けて存在確率が低くなる正規分布に類似する山形状の分布となるように定義する。
例えば、図3(b)に示すように多数の復元点Pを含む三次元空間において、3つの復元点(A点、B点、C点)を通る光線上の存在確率分布は、図4に示すように定義される。図4において、存在確率分布Waは、A点を通る光線上の存在確率の分布を示し、A点の位置で存在確率が最大値となっている。存在確率分布Wbは、B点を通る光線上の存在確率の分布を示し、B点の位置で存在確率が最大値となっている。存在確率分布Wcは、C点を通る光線上の存在確率の分布を示し、C点の位置で存在確率が最大値となっている。また、A点、B点、C点のうち、C点の位置が最もカメラ2,3に近く、B点の位置が最もカメラ2,3に遠く離れている。このため、存在確率分布Wa,Wb,Wcにおける各存在確率の最大値を比較すると、存在確率分布Wcにおける存在確率の最大値が一番大きく、存在確率分布Wbにおける存在確率の最大値が一番小さくなっている。
続いて、各光線が通過する複数のボクセルQに対し、手順S53で当該各光線上に定義された存在確率をそれぞれ対応付けし、これらの対応付けされた存在確率を各ボクセルQ毎にメモリ(図示せず)に格納する(手順S54)。
ここで、図4に示すものを例にとると、A点、B点、C点を通る光線が便宜上すべて同じ複数のボクセルQを通過するとした場合、A点、B点、C点を通る光線が通過する複数のボクセルQに対しては、存在確率分布Wa,Wb,Wcにおける対応する存在確率がそれぞれ対応付けされることとなる。
続いて、各ボクセルQについて対応付けされた存在確率の平均値をそれぞれ計算する(手順S55)。
ここで、図4に示すものを例にとると、A点、B点、C点を通る光線が通過する複数のボクセルQに対して対応付けされた存在確率の平均値は、図4に示す太線Xのように表される。この場合には、A点とC点とのほぼ中間の位置に相当するボクセルQにおいて存在確率が最大となっている。
なお、A点、B点、C点を通る光線が全て同じ複数のボクセルQを通過する場合には、図4に示すように、A点、B点、C点を通る光線上に定義された存在確率分布Wa,Wb,Wcを重ね合わせることによっても、太線Xのように表される存在確率の平均値を得ることができる。
続いて、各ボクセルQについて対応付けされた存在確率の平均値に基づいて、各ボクセルQに相当する位置に対象物Aが存在するか、つまり各ボクセルQに対象物Aの表面の一部に対応する正しい復元点Pが存在するかどうかを判断する(手順S56)。その判断は、具体的には以下のようにして行う。
即ち、実際に対象物Aの画像が三次元空間上に復元されたときには、狭い範囲内に多くの復元点Pが集中するようになるため、対象物Aが存在する位置に相当するボクセルQに含まれる復元点Pの数が多くなる。このため、そのボクセルQに対しては、比較的高い存在確率が数多く対応付けされることになるため、当該ボクセルQにおける存在確率の平均値が高くなる。
しかし、対象物Aの画像の三次元復元時にカメラ2,3間で同一の点の対応がうまくとれていないと、本来ならば対象物Aが存在しない位置に相当するボクセルQに復元点Pがノイズ等として出てくることがある。ただし、このノイズ等による復元点Pは集中することは殆ど無い。このため、そのボクセルQに対しては比較的低い存在確率が数多く対応付けされることになるため、当該ボクセルQにおける存在確率の平均値があまり高くなることは無い。特に、復元点Pの数が多くなるほど、そのような傾向が顕著に表れるようになる。
そこで、例えばボクセルQにおける存在確率の平均値が予め設定された閾値よりも高いときは、そのボクセルQに含まれる復元点Pは正しいものであり、当該ボクセルQに対応する位置には対象物Aが存在するものと判断する。一方、ボクセルQにおける存在確率の平均値が予め設定された閾値よりも低いときは、そのボクセルQに含まれる復元点Pはノイズ等の影響により誤って生成されたものであり、当該ボクセルQに対応する位置には対象物Aが存在しないものと判断する。
ここで、図4に示すものを例にとると、A点とC点との中間付近の位置に対応するボクセルQにおいて存在確率の平均値(平均存在確率)が最大となっているため、そのボクセルQには真の復元点Pが存在しているとみなされる。一方、B点の位置に対応するボクセルQにおいても存在確率の平均値が少し高くなっているが、平均存在確率の最大値に比べると十分低いため、そのボクセルQに含まれる復元点Pはノイズ等の影響により誤って生成されたものとみなされる。
以上において、手順S51は、対象物の撮像画像に基づいて、対象物の表面に対応する複数の点を三次元空間上に復元する三次元復元手段を構成する。手順S52は、復元された複数の点を含む三次元空間を複数のボクセルに分割する空間分割手段を構成する。手順S53は、復元された各点と撮像部とを結ぶ複数の仮想線上に、復元された点よりも撮像部側の位置の存在確率が当該点の位置の存在確率に比べて低くなるような存在確率分布をそれぞれ定義する存在確率定義手段を構成する。手順S54は、各仮想線が通過するボクセルに対し、各仮想線上に定義された存在確率をそれぞれ対応付けする存在確率対応付け手段を構成する。手順S55,S56は、各ボクセルに対して対応付けされた存在確率の統計データに基づいて、各ボクセルに相当する位置に対象物が存在するかどうかを判断する判断手段を構成する。
以上のように本実施形態にあっては、カメラ2,3と各復元点Pとを結ぶ光線上に、各復元点Pの存在確率が最も高くなるような存在確率分布をそれぞれ定義し、各光線が通過するボクセルQに対し、当該光線上に定義された存在確率を対応付けし、各ボクセルQにおける存在確率の平均値をそれぞれ求め、その平均値が所定値よりも高いボクセルQに相当する位置に対象物Aが存在すると判断する。従って、ノイズ等の影響により誤って生成された復元点Pを除外して、対象物Aの存在を判断することができる。このため、対象物Aが1つの物体であることや、対象物Aが例えば床、壁、机等から成っていることを認識することもできる。これにより、対象物Aを精度良く認識することができる。
従って、例えばロボットが移動するときに、ロボットの進路に実際には障害物が無いにも拘わらず、誤って障害物があると認識して、その位置をよけるような移動経路をとるという不具合を防止することができる。また、ロボットが何らかの物体を把持するときに、実際には把持物体が無いにも拘わらず、誤って把持物体があると認識して、それを掴むように動作するという不具合を防止することも可能となる。
なお、本発明は、上記実施形態に限定されるものではない。例えば上記実施形態では、カメラ2,3と各復元点Pとを結ぶ光線上に正規分布に類似の存在確率分布を定義するようにしたが、存在確率分布としては特にこれに限られず、任意の復元点Pよりもカメラ2,3側の位置の存在確率が当該復元点Pの位置の存在確率に比べて低くなるような分布を用いれば良い。
また、上記実施形態では、ボクセルQに対して対応付けされた存在確率の平均値に基づいて、ボクセルQに真の復元点Pが存在するかどうかを判断したが、存在確率の平均値の代わりに、存在確率の中央値(最大値と最小値との中間の値)等の統計データを用いて判断しても良い。
また、上記実施形態では、演算処理ユニット4がロボットに搭載されているものとしたが、演算処理ユニット4をロボット以外の箇所に設置しても良い。この場合には、カメラ2,3による撮像画像を無線通信によりロボットから演算処理ユニットに送り、更に演算処理ユニットによる処理結果を同様に無線通信によりロボットに送るようにすれば良い。
さらに、本発明の画像認識装置は、ロボット以外、例えば車両等にも適用可能であることは言うまでもない。
本発明に係わる画像認識装置の一実施形態を示す概略構成図である。 図1に示した演算処理ユニットによる演算処理手順の詳細を示すフローチャートである。 図2に示した三次元復元処理及び空間分割処理を概念的に示す図である。 図2に示した手順により存在確率分布を定義し、更にボクセルに対して対応付けされた存在確率の平均値を求める方法を簡略化して示す図である。
符号の説明
1…画像認識装置、2,3…カメラ(撮像部)、4…演算処理ユニット(三次元復元手段、空間分割手段、存在確率定義手段、存在確率対応付け手段、判断手段)、A…対象物、P…復元点、Q…ボクセル。

Claims (2)

  1. 撮像部により取得した対象物の撮像画像を用いて前記対象物を認識する画像認識装置において、
    前記対象物の撮像画像に基づいて、前記対象物の表面に対応する複数の点を三次元空間上に復元する三次元復元手段と、
    前記復元された複数の点を含む三次元空間を複数のボクセルに分割する空間分割手段と、
    前記復元された各点と前記撮像部とを結ぶ複数の仮想線上に、前記撮像部側に近づくにつれて存在確率が低くなるような存在確率分布をそれぞれ定義する存在確率定義手段と、
    複数の前記仮想線が通過する前記ボクセルに対し、複数の前記仮想線上に定義された存在確率を全て対応付けする存在確率対応付け手段と、
    記ボクセルに対して対応付けされた全ての存在確率の統計データに基づいて、前記ボクセルに相当する位置に前記対象物が存在するかどうかを判断する判断手段とを備えることを特徴とする画像認識装置。
  2. 前記判断手段は、前記統計データとして、記ボクセルに対して対応付けされた全ての存在確率の平均値を求め、前記存在確率の平均値が閾値よりも高いかどうかに基づいて前記ボクセルに相当する位置に前記対象物が存在するかどうかを判断することを特徴とする請求項1記載の画像認識装置。
JP2007062487A 2007-03-12 2007-03-12 画像認識装置 Expired - Fee Related JP4946535B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007062487A JP4946535B2 (ja) 2007-03-12 2007-03-12 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007062487A JP4946535B2 (ja) 2007-03-12 2007-03-12 画像認識装置

Publications (2)

Publication Number Publication Date
JP2008225787A JP2008225787A (ja) 2008-09-25
JP4946535B2 true JP4946535B2 (ja) 2012-06-06

Family

ID=39844342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007062487A Expired - Fee Related JP4946535B2 (ja) 2007-03-12 2007-03-12 画像認識装置

Country Status (1)

Country Link
JP (1) JP4946535B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210166426A1 (en) * 2018-08-13 2021-06-03 Imperial College Innovations Limited Mapping object instances using video data

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013076621A (ja) * 2011-09-30 2013-04-25 Nippon Hoso Kyokai <Nhk> 距離指標情報推定装置及びそのプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981788A (ja) * 1995-09-12 1997-03-28 Toshiba Corp 環境モデル入力装置
JPH09231369A (ja) * 1996-02-21 1997-09-05 Canon Inc 画像情報入力装置
JP4479372B2 (ja) * 2004-06-25 2010-06-09 ソニー株式会社 環境地図作成方法、環境地図作成装置、及び移動型ロボット装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210166426A1 (en) * 2018-08-13 2021-06-03 Imperial College Innovations Limited Mapping object instances using video data

Also Published As

Publication number Publication date
JP2008225787A (ja) 2008-09-25

Similar Documents

Publication Publication Date Title
JP6295645B2 (ja) 物体検出方法及び物体検出装置
US8395676B2 (en) Information processing device and method estimating a posture of a subject in an image
US8379969B2 (en) Method for matching an object model to a three-dimensional point cloud
WO2014073322A1 (ja) 物体検出装置及び物体検出方法
JP6291469B2 (ja) 障害物検出装置および障害物検出方法
US20160221404A1 (en) Method and apparatus for measuring tire tread abrasion
US8331614B2 (en) Method and apparatus for tracking listener&#39;s head position for virtual stereo acoustics
US20100098299A1 (en) Information Extraction Method, Information Extraction Device, Program, Registration Device, and Verification Device
JP6138861B2 (ja) 距離算出装置
WO2017138245A1 (ja) 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム
KR20090050567A (ko) Tof 카메라를 이용한 로봇의 물체 자세 인식 방법
JP2009176090A (ja) 環境認識装置
US9824451B2 (en) Camera pose estimation
KR20210090384A (ko) 카메라 및 라이다 센서를 이용한 3d 객체 검출방법 및 장치
JP2016152027A (ja) 画像処理装置、画像処理方法およびプログラム
US20150131853A1 (en) Stereo matching system and method for generating disparity map using same
US9807340B2 (en) Method and apparatus for providing eye-contact function to multiple points of attendance using stereo image in video conference system
JP4946535B2 (ja) 画像認識装置
US20150063637A1 (en) Image recognition method and robot
JP5248388B2 (ja) 障害物危険度算出装置、方法及びプログラム
JP6577595B2 (ja) 車両用外界認識装置
JP2021051347A (ja) 距離画像生成装置及び距離画像生成方法
Sato et al. Efficient hundreds-baseline stereo by counting interest points for moving omni-directional multi-camera system
JP7064400B2 (ja) 物体検知装置
KR100961616B1 (ko) 컨투어 정합을 이용한 전방향 카메라 보정 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4946535

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees