JP3444171B2 - 物品認識装置 - Google Patents

物品認識装置

Info

Publication number
JP3444171B2
JP3444171B2 JP34826997A JP34826997A JP3444171B2 JP 3444171 B2 JP3444171 B2 JP 3444171B2 JP 34826997 A JP34826997 A JP 34826997A JP 34826997 A JP34826997 A JP 34826997A JP 3444171 B2 JP3444171 B2 JP 3444171B2
Authority
JP
Japan
Prior art keywords
image
hypothesis
estimated
input
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34826997A
Other languages
English (en)
Other versions
JPH11175729A (ja
Inventor
橋本  学
明伸 関
哲司 羽下
伸一 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP34826997A priority Critical patent/JP3444171B2/ja
Priority to TW087105127A priority patent/TW364108B/zh
Priority to KR1019980019189A priority patent/KR100276445B1/ko
Publication of JPH11175729A publication Critical patent/JPH11175729A/ja
Application granted granted Critical
Publication of JP3444171B2 publication Critical patent/JP3444171B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、積荷を自動的に移
載するロボットや産業機械において、積まれた荷物の配
置を認識する物品認識装置に関するものである。
【0002】
【従来の技術】従来の技術1.従来の技術1について、
特開平8ー293029号公報に記載された内容をもと
に説明する。図11は同公報に記載された、従来の技術
1の内容を説明するための図である。また、図12は同
公報に記載された、従来の技術1の実施例の動作を示す
フローチャートであり、図13は従来の技術1の実施例
に関わる説明図である。以下、従来の技術1の内容につ
いて、これらの図をもとに説明する。
【0003】図11には、箱状の物体(アルファベット
で表示)がパレット(1102)上に積まれたようすを
示している。システムが起動される(ST1201)
と、パレット直上に設置された撮像装置(1103)よ
り画像が入力される。ST1203では物体の積み方の
基準パターンに関する基本状態情報が入力部(110
7)より入力される。これは基本積みつけパターンと物
体の寸法データからなり、システム内部では荷姿認識モ
デル生成部(1111)によって、3次元的な荷姿モデ
ルとして格納される。
【0004】続くST1204では、前記荷姿モデルか
ら物体の外形線の3次元位置情報が生成され、さらにS
T1205において撮像装置の幾何学的パラメータを用
いて外形線情報が透視変換部(1113)によって透視
変換される。透視変換データは、3次元データである積
み荷の基本状態データが画像ではどのように見えるべき
かを表現したものであり、図13においては、基準パタ
ーン(1302)として摸式的に表している。
【0005】一方、ST1206、ST1207におい
ては撮像した画像(1301)からエッジ検出を行な
い、前記透視変換された基準パターン(1302)と比
較される。図13の1303に示したように、基本状態
情報との比較によって、箱状物体それぞれの有無が判定
される(ST1207)。ST1208ではあるべき物
体が実際に存在するならば物体の情報がロボットに対し
て出力され(ST1209)、存在しないならばそのま
ま終了(ST1210)する。ロボットは存在する物体
の位置情報をもとに把持および移載動作を行なう。
【0006】従来の技術2.従来の技術2について、特
開平6ー249631号公報に記載された内容をもとに
説明する。図14、16、17は同公報に記載された、
従来の技術2の内容を説明するための図である。また、
図15は同公報に記載された、従来の技術2の実施例の
動作を示すフローチャートである。以下、従来の技術2
の内容について、これらの図をもとに説明する。
【0007】同技術における計測システムは、積まれた
箱状の荷物の上方に設置されている。図14(A)に計
測対象たる積荷と、計測手段との位置関係が示されてい
る。本システムが起動されると(ST1501)、最初
にST1502において空間コード画像が生成される。
【0008】ここで、空間コード画像の生成方法を簡単
に述べる。図16に示したように、同技術はパレット
(161)の後ろ上方に配置された投光器(162)と
カメラ(163)を用いる。投光器(162)には、各
種のパターン光を時系列的に投光することにより、測定
空間を互いに積層された楔状測定領域r0 〜rn に分割
する。図17に投光器によって投光されたパターン光と
それをカメラによって計測する視点の位置関係を示す。
パターン光としては、例えば図16に示されたようなス
リットパターンが用いられる。同図では、A,B,Cの
3つのパターンが示されており、白黒の2値パターンと
なっている。白は光の当たっている部分、黒は当たって
いない部分である。このようなパターンは、例えば液晶
シャッターのようなドットマトリクス電気シャッターを
用いて作ることができる。光が当たっている状態を
“1”、当たっていない状態を“0”と表現すると、図
16においては、パターンAが投光されている時は前か
ら後ろに向かって、半分づつ1,0となる。同じく、パ
ターンBでは、前から順に1/4づつ1,0,1,0と
なる。パターンCでは1/8づつ1,0,1,0,1,
0,1,0となる。これら3つのパターンを投光して、
それぞれ画像を撮像すると、各画素については“00
0”から“111”の3ビットコードにコード化された
データのどれかに対応させることができる。このような
コードを空間コードと呼ぶ。ある空間コードに対応する
のは、3次元空間上では楔状領域であり、そこに物体W
が存在していれば物体の表面上の画像領域にコードが割
り当てられることになる。一方、カメラで撮像した画像
から、画像上のある画素の空間コードがわかれば、どの
楔状領域に相当するかがわかるので、三角測量の原理に
よって物体表面の高さ、すなわちカメラからの距離がわ
かることになる。この説明ではパターンの種類をA,
B,Cの3種類としたため、画像全体を8つの楔状領域
に分割したが、例えばパターンの種類を8種類とすれ
ば、楔状領域の数は256になり、より精密に距離情報
の精度を向上させることができる。
【0009】すなわち、空間コード画像を生成すること
によって、画像上のそれぞれの画素のカメラからの距離
が計測できるのである。本従来技術では、続くステップ
(ST1503)で、積荷の最上段領域を抽出してい
る。計測手段が図14(A)のような位置関係にある
時、同図(D)のような空間コード画像が得られる。そ
の際、画像を水平に左から右に走査し、もっとも空間コ
ードの大きいデータを持つ領域を抽出すれば、その領域
は同図(E)のように最上段物体の上面部分に対応す
る。ST1504では、最上段物体領域をグループ化し
ている。本従来の技術によれば、空間コード画像におい
て隣接する画素間で空間コードが所定の範囲内に近接し
ている時、それら領域を同じグループと判断したり、各
積荷上縁間に生じる溝状の部分やすき間部分の空間コー
ドの変化をもとにグループ化している。グループ化され
た各物体は、続くステップ(ST1505)で各物体の
3次元位置が計測される。グループ化された物体の辺縁
部分に相当する部分の3次元座標を何点かサンプリング
し、それらをもとに物体の重心位置と姿勢、および高さ
情報を得(ST1506)、処理を終了する(ST15
07)。この様子は図14(F)〜図14(J)に示さ
れている。
【0010】このようにして得られた積荷の位置データ
を用いて、ロボット等で積荷をひとつずつ移載すること
ができる。
【0011】
【発明が解決しようとする課題】上記従来の技術1に示
された画像処理装置では、積み荷に関する基本状態情報
を必要とする、すなわち物体がどのように配列されてい
るべきかをあらかじめ知っておく必要があった。したが
って、物体の位置が何らかの原因で基本状態とは異なっ
た状態に置かれていた場合には認識が不可能になるとい
う問題点があった。このような事態は、たとえばパレッ
トに積まれた箱状物体が輸送中に荷崩れを起こしたり、
あるいはパレットに荷物を積む作業者が規定通りに積ま
なかったりする場合として、日常的に頻繁に発生するも
のである。ここでは、箱状物体の表面に貼られたガムテ
ープなどの影響を少なくして物体の位置認識を行なうこ
とを目的としているが、本質的に物体の稜線のずれ量を
許容しない認識方式にすることでガムテープと物体稜線
との誤認を無くしているのであって、一般的に位置ずれ
を起こしている物体の認識が不可能であるという問題点
があった。
【0012】一方、上記第2の従来技術に示された画像
処理装置では、積荷の認識に必要な情報をすべて空間コ
ード画像から獲得するため、例えば解像度256×25
6または512×512画素といった高い解像度の距離
画像を生成する必要があった。そのため、高精度のパタ
ーン投光器が必要であり、しかもそれは時系列的に投光
パターンを変化させる機構を有するものでなければなら
ない。従って、パターン投光装置の装置規模が大きくな
り、高価になるという問題があった。さらに、時系列で
発生させた複数の投光パターンそれぞれに対応させて、
画像を入力する必要があるため、多くの画像メモリを必
要とし、またそれに要する画像入力時間の総計も多くか
かるという問題点があった。さらに、同技術では物体の
稜線を距離の不連続としてのみ検出しているため、例え
ば多数の箱状の物体が密接して置かれている場合のよう
に物体間の境界部に距離(高さ)の不連続が明確でないと
きは、認識の信頼性が低下するという問題があった。こ
の問題は通常の箱状物体が密接して並べられていること
から考えると日常的に発生すると考えられる。
【0013】本発明は、上記の問題点を解決するために
なされたものであり、位置ずれした積荷に対しても正し
い物体配置の認識が可能であり、また複雑で高精度な画
像取得手段を必要としない物体配置の認識装置を実現す
ることを目的とする。
【0014】
【課題を解決するための手段】本発明の第1の構成によ
る物品認識装置は、画像取得手段と、画像から物体の候
補を抽出する物体候補抽出手段と、物体候補の配置の組
合せの仮説を少なくとも1つ生成する物体配置仮説生成
手段と、前記各仮説から推定される入力画像を生成する
推定画像生成手段と、前記推定画像と実際に画像取得手
段により入力された入力画像とを比較し整合性を評価す
る画像比較手段と、この比較によって最も実際の入力情
報に近い推定画像を発生する前記仮説を最良仮説として
選択する最良仮説選択手段とを備えたものである。
【0015】本発明の第2の構成による物品認識装置
は、前記第1の構成による物品認識装置において、前記
画像取得手段として濃淡画像取得手段および距離画像取
得手段を有し、前記物体候補抽出手段として濃淡画像か
ら抽出したエッジ情報から物体の候補を抽出する手段を
持ち、前記物体配置仮説生成手段によって生成された各
仮説から推定エッジ画像を生成する手段および推定距離
画像を生成する手段を備え、これら推定画像と実際の入
力画像との比較によって最良仮説を選択するものであ
る。
【0016】本発明の第3の構成による物品認識装置
は、前記第1の構成による物品認識装置において、前記
画像比較手段によって算出した入力画像と定画像との整
合性評価結果に基づき、高い整合性を有する複数の仮説
を優良仮説として選択する優良仮説選択手段と、前記優
良仮説を表示する優良仮説表示手段と、表示された仮説
を人間が確認し、最も好ましい仮説を指示する選択仮説
指示手段と、指示された仮説を最良仮説として選択する
最良仮説選択手段を備えたものである。
【0017】
【発明の実施の形態】実施の形態1.図1は本発明の実
施の形態1による物品認識装置の構成を示すブロック図
であり、図2は本発明の実施の形態1による物品認識装
置の動作の流れを示すフローチャートである。以下、こ
のフローチャートにそって本物品認識装置の動作を説明
する。
【0018】なお、ここでは説明の簡単化のために認識
すべき物体の形状について、例えば段ボール箱のような
多面体形状を想定している。また、物体は同一形状およ
び同一サイズのものが積まれている状態を想定する。
【0019】まず最初に、装置が起動されると(ST2
01)、画像取得手段(101)によって認識対象の濃
淡画像が入力される。画像取得手段(101)はたとえ
ば白黒CCDカメラであり、物体が積まれたパレットの
上方に鉛直下方に向けて配置される。画像取得手段(1
01)によって入力された濃淡画像はエッジ検出が行な
われ(ST203)、エッジ情報をもとにテンプレート
マッチングによって箱状物体のコーナー部が検出され、
物体候補抽出手段(102)によってN個の物体候補が
抽出される(ST204)。図3は本発明の実施の形態
1の処理の様子を摸式的に表現した図であり、前記物体
候補とは図中候補C1、C2、...CNで示された位
置と姿勢で存在する箱状物体のことである(303a,
303b,303c,および303D)。これら箱状物
体は、必ずしも実際に存在する正しい物体ばかりではな
く、箱状物体の表面に貼られたガムテープや印刷文字な
どの影響によって誤って抽出された物体(偽候補物体と
呼ぶ)も含まれている。例えば、図3では、物体候補C
3などは誤った候補である。したがって、候補数Nは、
実際に空間に存在してカメラから見えている物体の個数
よりも大きな数になる。
【0020】続くST205では、物体配置仮説生成手
段(103)によって前記複数の物体候補の配置の組合
せを、物体配置仮説(304)として生成する。仮説は
N個の物体の組合せとして、H1 ,H2,...HMのM
個生成される(304a,304b,304c,304
d)。図3の例においては、仮説H1 は候補物体C1
2 などの組合せでできており、仮説H2 は物体候補C
1 ,C3 などからできている。この時点で、M個の仮説
のなかから最も正しい仮説を選択すれば物体を認識した
ことに相当する。処理手順ST206以降の処理ではい
かにして正しい仮説を選択するかを説明する。まず、仮
説H1 について正しさを評価する。ST206では、推
定画像生成手段(106)によって、仮説H1 に相当す
る濃淡エッジ画像を推定して生成する(305)。仮説
1 は3次元物体の組合せとして記述されているので、
3次元記述であるH1 をカメラの幾何学的パラメータを
用いて画像平面に投影することで簡単に推定エッジ画像
を生成することが可能である。
【0021】次に、ST207において画像比較手段
(105)によって前記推定画像と実際の入力エッジ画
像とを比較し、整合性を評価する(306)。整合性の
評価方法としては、例えば整合度合いSを以下のように
定義して計算する。
【0022】
【数1】
【0023】ここで、a,bは画像のサイズ、Iは入力
エッジ画像、Gは推定画像である。整合度Sは、推定画
像と入力画像が似ているほど小さい値をとる。ST20
8では、計算されたSがこれまで計算されたすべての仮
説のもつ整合度よりも高い整合度(すなわち小さなS)
をとる場合にはその仮説を最良仮説として登録し(ST
209)、そうでない場合にはすべての仮説を調べるま
でST206〜ST210までの処理を繰り返す。この
処理は最良仮説選択手段(106)によって行なわれ
る。
【0024】すべての仮説に対して推定画像と入力エッ
ジ画像との整合性を評価し、最も整合性の高い仮説が得
られたならば、それを最良の仮説すなわち認識結果とし
て出力し、処理を終了する(ST211)。
【0025】以上説明したように、本実施の形態1で
は、あらかじめエッジ画像から多数抽出した物体候補の
配置の組合せとして物体配置の仮説を多数生成し、その
中から最も実際の入力画像と整合する仮説を選ぶことに
より複数の物体を同時に認識するのである。
【0026】本実施の形態1においては、物体配置の推
定を現実に取得した荷姿の画像にもとづいて行なうの
で、基準パターンの照合を行なう従来の技術に比べて、
物体配置が不規則であっても配置の認識が可能である。
【0027】なお本実施の形態1では、物体候補の抽出
手法としてエッジ画像によるテンプレートマッチングを
用いたが、通常の濃淡画像によるテンプレートマッチン
グや、濃淡画像を一旦2値化して2値画像のテンプレー
トマッチングを用いる方法やエッジ検出結果からハフ変
換などのパラメトリックなパターン抽出の手法により箱
状物体の特徴的なパターンを抽出して候補として扱うこ
ともできる。
【0028】また、本実施の形態1では、推定画像と入
力画像との整合性判定において、濃淡エッジ画像を用い
る方法を説明したが、濃淡画像を直接推定できる場合に
は濃淡画像を用いたり、2値画像に変換して整合性を比
較したり、あるいは画像取得手段としてカラーカメラを
用いる場合にはカラー情報を使った整合性比較を行なっ
ても同様の効果が得られることはいうまでもない。
【0029】さらに、本実施の形態1では、整合性比較
計算において式 (1) に示されるように推定画像と入力
画像との差に着目した方法を述べたが、画像間の類似度
を計算すれば良いのであるから、例えば相互相関値等を
用いても同様の効果を奏することはいうまでもない。
【0030】さて、以上説明した実施の形態1では、冒
頭でも述べたように認識すべき対象物体として多面体即
ち箱状の物体の単一品種物体を想定していた。しかしな
がら、例えばセメント袋、米袋などの袋状の物体であっ
ても、本発明の構成要素を何ら変更することなく同一の
構成で画像認識を実現することができる。
【0031】また、以上説明した本実施の形態1では、
単一の品種の物体が積まれている状況を想定したが、処
理装置内部に複数の物体の寸法データをあらかじめ格納
しておき、複数の物体候補を生成し、その配置組合せと
して物体配置の仮説を生成しさえすれば、異なる種類の
物体が複数個積まれている状況に対しても本発明が効果
を奏することはいうまでもない。
【0032】実施の形態2.図4は本発明の実施の形態
2による物品認識装置の構成を示すブロック図であり、
図5は本発明の実施の形態2による物品認識装置の動作
の流れを示すフローチャートである。以下、このフロー
チャートにそって本物品認識装置の動作を説明する。
【0033】なお、実施の形態1と同じく、説明の簡単
化のために認識すべき物体の形状について、例えば段ボ
ール箱のような多面体形状を想定する。また、物体は同
一形状および同一サイズのものが積まれている状態を想
定する。図6は本実施の形態の処理の様子を摸式的に表
した図であるが、図のような3次元シーン(600)を
カメラ(601)が観測している状況を考える。
【0034】まず最初に、装置が起動されると(ST5
01)、濃淡画像取得手段(401)によって認識対象
の濃淡画像が入力される(ST502)。濃淡画像取得
手段は例えば白黒CCDカメラ(601)であり、物体
が積まれたパレットの上方に鉛直下方に向けて配置され
る。前記画像取得手段によって入力された濃淡画像はエ
ッジ検出手段(402)によってエッジ検出が行なわれ
(ST503)、濃淡エッジ画像(602)が生成され
る。
【0035】次に、ST504では、距離画像取得手段
(403)によって対象物体の距離画像(603)が取
得される。距離画像取得手段は例えばステレオカメラで
あり、濃淡画像取得手段と光軸を共有している。距離画
像とは、ある視点から見えているシーンの各点におい
て、基準点から各点までの距離情報を画像上に格納した
ものである。続くST505では、物体候補抽出手段
(404)において物体の候補が抽出される。濃淡エッ
ジ画像からの物体候補の抽出処理については実施の形態
1に示したように、テンプレートマッチングによるコー
ナーパターン検出が用いられる。抽出された物体候補
は、図6において、C1 ,C2 ,...CN で示された
位置と姿勢で存在する箱状物体である(604a,60
4b,604c,および604d)。これら箱状物体
は、必ずしも実際に存在する正しい物体ばかりではな
く、箱状物体の表面に貼られたガムテープや印刷文字な
どの影響によって誤って抽出された物体 (偽候補物体と
呼ぶ) も含まれている。例えば、図6では、物体候補C
3 などは誤った候補である。
【0036】ST506では、物体配置仮説生成手段
(405)によって前記複数の物体候補の配置の組合せ
を、物体配置仮説(605)として生成する。仮説はN
個の物体の組合せとして、H1 ,H2 ,...HM のM
個生成される(605a,605b,605c,605
d)。図6においては、仮説H1 は候補物体C1 ,C2
などの組合せでできており、仮説H2 は物体候補C1
3 などからできている。
【0037】この時点で、M個の仮説のなかから最も正
しい仮説を選択すれば物体を認識したことに相当するの
で、処理手順ST507以降では、如何にして正しい仮
説を選択するかを説明する。まず仮説H1 について正し
さを評価する。ST507では、推定エッジ画像生成手
段(406)および推定距離画像生成手段(407)に
よって、それぞれ仮説H1 に相当する濃淡エッジ画像と
距離画像を推定して生成する(606)。仮説H1 は3
次元物体の組合せとして記述されているので、3次元記
述であるH1 をカメラの幾何学的パラメータを用いて画
像平面に投影することで簡単に推定エッジ画像を生成す
ることが可能である。また、距離画像についても濃淡画
像取得手段であるカメラと光軸を共有し、また距離画像
取得に関する光学系の幾何学的パラメータが既知である
から簡単に推定画像を生成することが可能である。
【0038】次に、ST508において、入力画像と推
定画像の比較が行なわれる(607)。 濃淡エッジ画
像に関しては、エッジ画像比較手段 (408)によっ
て推定エッジ画像と入力エッジ画像との比較が行なわ
れ、距離画像に関しては、距離画像比較手段(409)
によって推定距離画像と入力距離画像との比較が行なわ
れる。図7および図8には、これら画像比較の方法を摸
式的に例示している。図7においては、実際の認識対象
となる3次元シーン(701)から得られた入力エッジ
画像(703)と、仮説のひとつ(702)から推定さ
れた推定エッジ画像(704)とを比較し、一致しない
エッジ成分(705)を検出してこれが小さいほど整合
性がよいと判定する。図8では、同様に認識対象(80
1)から得られた実際の入力距離画像(803)と、仮
説の一つ(802)から推定された推定距離画像(80
4)とを比較し、距離データが一致しない部分(80
5)を検出してこれが小さいほど整合性が高いと判断す
るものである。
【0039】ST509では、評価された画像の整合性
が、これまで計算されたすべての仮説のもつ整合度より
も高い整合度を持つ場合にはその仮説を最良仮説として
登録し(ST510)、そうでない場合にはすべての仮
説を調べるまでST507〜ST511までの処理を繰
り返す。この処理は最良仮説選択手段(410)によっ
て行なわれる。
【0040】すべての仮説に対して推定画像と入力エッ
ジ画像との整合性を評価し、最も整合性の高い仮説が得
られたならば、それを最良の仮説すなわち認識結果とし
て出力し、処理を終了する(ST512)。
【0041】以上説明したように、実施の形態2では、
あらかじめエッジ画像から多数抽出した物体候補の配置
の組合せとしてシーン記述の仮説を多数生成し、その中
から最も実際の入力画像と整合する仮説を選ぶことによ
り複数の物体を同時に認識するのである。図6では、仮
説H3 が最も入力画像と整合性の高い仮説であると判定
され(608)ている。
【0042】本実施の形態2においては、濃淡エッジ画
像と距離画像を用いているので濃淡エッジ画像のみを用
いる実施の形態1に比べて、より信頼性の高い物体配置
の認識が可能である。
【0043】なお本実施の形態2では、物体候補の抽出
手法としてエッジ画像によるテンプレートマッチングを
用いたが、通常の濃淡画像によるテンプレートマッチン
グや、濃淡画像を一旦2値化して2値画像のテンプレー
トマッチングを用いる方法や、エッジ検出結果からハフ
変換などのパラメトリックなパターン抽出の手法により
箱状物体の特徴的なパターンを抽出して候補として扱う
こともできる。
【0044】また、本実施の形態2では、距離画像取得
手段として、濃淡画像の取得手段とカメラ光軸を共有す
る光学系を有する方法を例にしたが、これら情報取得手
段の相互位置関係が既知であれば、必ずしもカメラ光軸
を共有する必要はなく、本発明において同様の効果を奏
することはいうまでもない。
【0045】さて、以上説明した実施の形態2では、冒
頭でも述べたように認識すべき対象物体として多面体即
ち箱状の物体の単一品種物体を想定していた。しかしな
がら、例えばセメント袋、米袋などの袋状の物体であっ
ても、本発明の構成要素を何ら変更することなく同一の
構成で画像認識を実現することができる。
【0046】また、以上説明した実施の形態2では、単
一の品種の物体が積まれている状況を想定したが、処理
装置内部に複数の物体の寸法データをあらかじめ格納し
ておき、複数の物体候補を生成し、その配置組合せとし
てシーン仮説を生成しさえすれば、異なる種類の物体が
複数個積まれている状況に対しても同様な効果を奏する
ことはいうまでもない。
【0047】実施の形態3.図9は本発明の実施の形態
3による物品認識装置の構成を示すブロック図であり、
図10は本発明の実施の形態3による物品認識装置の動
作の流れを示すフローチャートである。以下、このフロ
ーチャートにそって本物品認識装置の動作を説明する。
【0048】装置が起動されると(ST1001)、画
像取得手段(901)によって認識対象の濃淡画像が入
力される(ST1002)。画像取得手段はたとえば白
黒CCDカメラであり、物体が積まれたパレットの上方
に鉛直下方に向けて配置される。画像取得手段によって
入力された濃淡画像はエッジ検出が行なわれ(ST10
03)、エッジ情報をもとにテンプレートマッチングに
よって箱状物体のコーナー部が検出され、物体候補抽出
手段(902)によって物体候補が抽出される(ST1
004)。続くST1005では、物体配置仮説生成手
段(903)によって前記複数の物体候補の配置の組合
せを、物体配置仮説として生成する。物体候補抽出およ
び物体候補からの仮説の生成については、実施の形態1
における図3と同様の動作となる。
【0049】次に、生成された複数仮説の中から最も正
しい仮説を選択する処理について説明する。複数の仮説
すべてについて、ST1006では、推定画像生成手段
(904)によって仮説に相当する濃淡エッジ画像を推
定して生成する。さらに、これら推定画像を画像比較手
段(905)によって入力画像と比較し、整合性を判定
する(ST1007)。ST1008では、整合性があ
らかじめ設定したしきい値より高い仮説を、優良な仮説
として優良仮説表示手段(907)によって人間の操作
者(908)に対して、例えば図3(304)のような
3次元的表示によって表示する。人間の操作者は複数の
優良な仮説を、目視で確認し、最も正しいと思われる仮
説を選択仮説指示手段(909)によって指示する(S
T1009)。
【0050】人間によって選択された最終的な仮説は、
最良仮説選択手段(910)によって最良仮説、即ち認
識結果であるとして登録され、処理を終了する(ST1
011)。以上説明したように、実施の形態3では、あ
らかじめエッジ画像から多数抽出した物体候補の配置の
組合せとしてシーン記述の仮説を多数生成し、その中か
ら最も実際の入力画像と整合する仮説を選ぶことで複数
の物体を同時に認識するが、その際に、整合性がある程
度高いもの複数個をピックアップして人間に見せ、人間
が介在して最終的な認識を行なうことで複雑な判定を正
確に行なうように動作する。
【0051】なお本実施の形態3では、物体候補の抽出
手法としてエッジ画像によるテンプレートマッチングを
用いたが、通常の濃淡画像によるテンプレートマッチン
グや、濃淡画像を一旦2値化して2値画像のテンプレー
トマッチングを用いる方法や、エッジ検出結果からハフ
変換などのパラメトリックなパターン抽出の手法により
箱状物体の特徴的なパターンを抽出して候補として扱う
こともできる。
【0052】また、本実施の形態3では、推定画像と入
力画像との整合性判定において、濃淡エッジ画像を用い
る方法を説明したが、濃淡画像を直接推定できる場合に
は濃淡画像を用いたり、2値画像に変換して整合性を比
較したり、あるいは画像取得手段としてカラーカメラを
用いる場合にはカラー情報を使った整合性比較を行なっ
ても同様の効果が得られることはいうまでもない。無
論、実施の形態2のように距離画像を併用した整合性判
定を行なっても良い。
【0053】
【発明の効果】本発明は、以上説明したように構成され
ているので、以下に示すような効果を奏する。
【0054】本発明の第1の構成である物品認識装置に
よれば、画像取得手段と、画像から物体の候補を抽出す
る物体候補抽出手段と、物体候補の配置の組合せの仮説
を少なくとも1つ生成する物体配置仮説生成手段と、前
記各仮説から推定される入力画像を生成する推定画像生
成手段と、前記推定画像と実際に画像取得手段により入
力された入力画像とを比較し整合性を評価する画像比較
手段と、この比較によって最も実際の入力情報に近い推
定画像を発生する前記仮説を最良仮説として選択する最
良仮説選択手段とを備えたので、物体配置の基準パター
ンとの一致を要求されることなく、任意の物体配置を認
識することができる。
【0055】本発明の第2の構成である物品認識装置に
よれば、前記第1の構成による物品認識装置において、
前記画像取得手段として濃淡画像取得手段および距離画
像取得手段を有し、前記物体候補抽出手段として濃淡画
像から抽出したエッジ情報から物体の候補を抽出する手
段を持ち、前記物体配置仮説生成手段によって生成され
た各仮説から推定エッジ画像を生成する手段および推定
距離画像を生成する手段を備え、これら推定画像と実際
の入力画像との比較によって最良仮説を選択するように
したので、画像取得手段として濃淡画像取得手段と距離
画像取得手段を併用したので、より信頼性の高い物体配
置の認識が可能である。
【0056】本発明の第3の構成である物品認識装置に
よれば、前記第1の構成による物品認識装置において、
前記画像比較手段によって算出した入力画像と定画像と
の整合性評価結果に基づき、高い整合性を有する複数の
仮説を優良仮説として選択する優良仮説選択手段と、前
記優良仮説を表示する優良仮説表示手段と、表示された
仮説を人間が確認し、最も好ましい仮説を指示する選択
仮説指示手段と、指示された仮説を最良仮説として選択
する最良仮説選択手段を備えたもので、提示された複数
の仮説の中から、操作者が最良の仮説を選択できる様に
したので、更に信頼性の高い物体配置の認識が可能であ
る。
【図面の簡単な説明】
【図1】 本発明の実施の形態1による物品認識装置の
構成を示すブロック図である。
【図2】 本発明の実施の形態1による物品認識装置の
動作の流れを示すフローチャートである。
【図3】 本発明の実施の形態の処理の様子を摸式的に
表した図である。
【図4】 本発明の実施の形態2による物品認識装置の
構成を示すブロック図である。
【図5】 本発明の実施の形態2による物品認識装置の
動作の流れを示すフローチャートである。
【図6】 本発明の実施の形態の処理の様子を摸式的に
表した図である。
【図7】 画像比較の方法を摸式的に例示した図であ
る。
【図8】 画像比較の方法を摸式的に例示した図であ
る。
【図9】 本発明の実施の形態3による物品認識装置の
構成を示すブロック図である。
【図10】 本発明の実施の形態3による物品認識装置
の動作の流れを示すフローチャートである。
【図11】 従来の技術1の内容を説明するための図で
ある。
【図12】 従来の技術1の実施例の動作を示すフロー
チャートである。
【図13】 従来の技術1実施例に関わる説明図であ
る。
【図14】 従来の技術2の内容を説明するための図で
ある。
【図15】 従来の技術2の実施例の動作を示すフロー
チャートである。
【図16】 従来の技術2の内容を説明するための図で
ある。
【図17】 従来の技術2の内容を説明するための図で
ある。
【符号の説明】
101 画像取得手段、102 物体候補抽出手段、1
03 物体配置仮説生成手段、401 濃淡画像取得手
段、402 エッジ検出手段、408 エッジ画像比較
手段、409 距離画像比較手段、410 最良仮説選
択手段、6003次元シーン、601 白黒CCDカメ
ラ、602 濃淡エッジ画像、7013次元シーン、7
03 入力エッジ画像、704 推定エッジ画像、80
1認識対象、803 入力距離画像、804 測定距離
画像、902 物体候補抽出手段、903 物体配置仮
説生成手段、904 推定画像生成手段、905画像比
較手段、907 優良仮説表示手段、908 操作者、
909 選択仮説指示手段、910 最良仮説選択手
段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 黒田 伸一 東京都千代田区丸の内二丁目2番3号 三菱電機株式会社内 (56)参考文献 特開 平7−88791(JP,A) 特開 平7−299782(JP,A) 特開 平6−249631(JP,A) 特開 平8−293029(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 - 7/60 G01B 11/00 G06T 1/00 G01N 21/84 - 21/958 H04N 7/18

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像取得手段と、画像から物体の候補を
    抽出する物体候補抽出手段と、物体候補の配置の組合せ
    の仮説を少なくとも1つ生成する物体配置仮説生成手段
    と、前記各仮説から推定される入力画像を生成する推定
    画像生成手段と、前記推定画像と実際に画像取得手段に
    より入力された入力画像とを比較し整合性を評価する画
    像比較手段と、この比較によって最も実際の入力情報に
    近い推定画像を発生する前記仮説を最良仮説として選択
    する最良仮説選択手段とを備えたことを特徴とする物品
    認識装置。
  2. 【請求項2】 前記請求項1の発明において、前記画像
    取得手段として濃淡画像取得手段および距離画像取得手
    段を有し、前記物体候補抽出手段として濃淡画像から抽
    出したエッジ情報から物体の候補を抽出する手段を持
    ち、前記物体配置仮説生成手段によって生成された各仮
    説から推定エッジ画像を生成する手段および推定距離画
    像を生成する手段を備え、これら推定画像と実際の入力
    画像との比較によって最良仮説を選択することを特徴と
    する物品認識装置。
  3. 【請求項3】 前記請求項1の発明において、前記画像
    比較手段によって算出した入力画像と推定画像との整合
    性評価結果に基づき、高い整合性を有する複数の仮説を
    優良仮説として選択する優良仮説選択手段と、前記優良
    仮説を表示する優良仮説表示手段と、表示された仮説を
    人間が確認し、最も好ましい仮説を指示する選択仮説指
    示手段と、指示された仮説を最良仮説として選択する最
    良仮説選択手段を備えたことを特徴とする物品認識装
    置。
JP34826997A 1997-12-17 1997-12-17 物品認識装置 Expired - Fee Related JP3444171B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP34826997A JP3444171B2 (ja) 1997-12-17 1997-12-17 物品認識装置
TW087105127A TW364108B (en) 1997-12-17 1998-04-04 Goods recognition apparatus
KR1019980019189A KR100276445B1 (ko) 1997-12-17 1998-05-27 물품인식장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34826997A JP3444171B2 (ja) 1997-12-17 1997-12-17 物品認識装置

Publications (2)

Publication Number Publication Date
JPH11175729A JPH11175729A (ja) 1999-07-02
JP3444171B2 true JP3444171B2 (ja) 2003-09-08

Family

ID=18395904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34826997A Expired - Fee Related JP3444171B2 (ja) 1997-12-17 1997-12-17 物品認識装置

Country Status (3)

Country Link
JP (1) JP3444171B2 (ja)
KR (1) KR100276445B1 (ja)
TW (1) TW364108B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10315865B2 (en) 2015-11-12 2019-06-11 Kabushiki Kaisha Toshiba Conveying device, conveying system, and conveying method

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3785061B2 (ja) * 2000-10-27 2006-06-14 三菱重工業株式会社 荷役クレーンにおけるコンテナ位置検知方法及び装置並びにコンテナ着床、段積制御方法
JP2006300929A (ja) * 2005-03-22 2006-11-02 Jfe Engineering Kk 物体の3次元位置認識装置およびデパレタイズシステム
KR101097732B1 (ko) 2009-12-02 2011-12-22 한국생산기술연구원 로봇의 물체인식 능력 평가 시스템 및 평가 방법
JP6686890B2 (ja) * 2014-10-03 2020-04-22 日本電気株式会社 情報処理装置、情報処理方法、及び、プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3028016B2 (ja) * 1993-02-26 2000-04-04 村田機械株式会社 積荷の三次元画像計測方法
JP3426002B2 (ja) * 1993-09-20 2003-07-14 三菱電機株式会社 物体認識装置
JP3516067B2 (ja) * 1994-04-26 2004-04-05 川崎重工業株式会社 デパレタイズ用画像作成方法および画像作成装置
JPH08293029A (ja) * 1995-04-20 1996-11-05 Kobe Steel Ltd 箱状物体の積重ね状態認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10315865B2 (en) 2015-11-12 2019-06-11 Kabushiki Kaisha Toshiba Conveying device, conveying system, and conveying method

Also Published As

Publication number Publication date
KR100276445B1 (ko) 2000-12-15
JPH11175729A (ja) 1999-07-02
TW364108B (en) 1999-07-11
KR19990062408A (ko) 1999-07-26

Similar Documents

Publication Publication Date Title
JP5773436B2 (ja) 情報端末装置
JPH07141463A (ja) 2値画像内の機械印刷された金額の検出方法
US11232589B2 (en) Object recognition device and object recognition method
TW201104508A (en) Stereoscopic form reader
TWI500925B (zh) Check the device, check the method and check the program
CN113592886A (zh) 建筑图纸的审图方法、装置、电子设备及介质
WO2014063836A1 (en) Method and device for identifying a two-dimensional barcode
US8913852B2 (en) Band-based patch selection with a dynamic grid
JP3444171B2 (ja) 物品認識装置
JP5111055B2 (ja) 画像処理装置及び画像処理方法、コンピュータプログラム
EP2458556A1 (en) Marker generation device, marker generation detection system, marker generation detection device, marker, marker generation method, and program therefor
JP7419846B2 (ja) 液面検出方法及び液面検出装置
JP4919171B2 (ja) 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム
EP0651337A1 (en) Object recognizing method, its apparatus, and image processing method and its apparatus
JP2001076055A (ja) 査定金額算出方法及び損害査定システム
JP2001074452A (ja) 写真測量用画像処理装置、写真測量用画像処理方法および写真測量用画像処理プログラムを格納した記憶媒体
JP2006229685A (ja) 帳票歪み判定装置
JP4675055B2 (ja) マーカ処理方法、マーカ処理装置、プログラム、および、記録媒体
US7346193B2 (en) Method for detecting object traveling direction
JP2002536709A (ja) 第1の構造と少なくとも1つの予め設定された第2の構造との類似度を算出するための方法及び装置
JP3607433B2 (ja) 建設図面の電気記号抽出方法及びその装置
US20170200383A1 (en) Automated review of forms through augmented reality
JP2024004231A (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP6909360B1 (ja) 物体計測装置、及び計測装置
JPH11183159A (ja) 画像処理装置及びその方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080627

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080627

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090627

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees