JP7207862B2 - 物体認識装置および方法 - Google Patents

物体認識装置および方法 Download PDF

Info

Publication number
JP7207862B2
JP7207862B2 JP2018085209A JP2018085209A JP7207862B2 JP 7207862 B2 JP7207862 B2 JP 7207862B2 JP 2018085209 A JP2018085209 A JP 2018085209A JP 2018085209 A JP2018085209 A JP 2018085209A JP 7207862 B2 JP7207862 B2 JP 7207862B2
Authority
JP
Japan
Prior art keywords
image
recognition
feature
similarity
image feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018085209A
Other languages
English (en)
Other versions
JP2019192005A (ja
Inventor
泰樹 矢野
宣隆 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018085209A priority Critical patent/JP7207862B2/ja
Priority to CN201910255723.9A priority patent/CN110414304B/zh
Priority to DE102019205039.5A priority patent/DE102019205039A1/de
Publication of JP2019192005A publication Critical patent/JP2019192005A/ja
Application granted granted Critical
Publication of JP7207862B2 publication Critical patent/JP7207862B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、物体認識装置および方法に関する。
製造分野および物流分野では、物体のピッキング作業および組立作業の自動化が望まれている。これらの作業を自動化するためにロボットが用いられる。ロボットを用いて作業対象物体を扱う場合、作業対象物体の位置および姿勢を計測する手段が必要となる。そのために視覚センサが用いられる。
複数種類の物体を扱う作業をロボットに行わせるためには、視覚センサにより計測された物体の種別を認識する必要がある。特に、製造分野および物流分野では、多種多様な物体を扱っており、互いに類似した物体が同時に複数存在する場合がある。
類似する物体を含む認識候補の組から対象物体の種別を認識するために、類似する物体の間の差異に着目した研究が行われている。ここで、認識候補とは、物体認識装置の出力である認識結果となり得る物体である。
非特許文献1では、認識したい物体とその物体に類似する物体とから、それらの識別に強く寄与するテンプレート中の画素群を予め探索しておく。そして、非特許文献1では、物体の認識時に、事前の探索結果から得られる画素群において、対象物体と認識したい物体の間でマッチングする手法を提案する。
特許文献1では、各認識候補を特定の特徴ベクトルで表現する。特許文献1では、特徴ベクトル空間で近接する特徴ベクトル群に基づいて、対象物体の特徴ベクトルをそこに直行射影したときに局所的な散在性が最も大きくなるような部分空間を見つける手法を提案している。
なお、画像特徴パターンの抽出方法としては、非特許文献2が知られている。特徴点の抽出方法としては、非特許文献3が知られている。特徴量を算出する方法としては、非特許文献4が知られている。
特許第38141481号明細書
櫻本康憲、橋本学、"対象物と類似物の識別に有効な画素群を用いたテンプレートマッチング"、精密工学会誌、81巻7号、平成27年 Canny, John. "A computational approach to edge detection." IEEE Transactions on pattern analysis and machine intelligence 6 (1986): 679-698. Rosten, Edward, and Tom Drummond. "Machine learning for high-speed corner detection." Computer Vision ECCV 2006 (2006): 430-443. Lowe, David G. "Distinctive image features from scale-invariant keypoints." International journal of computer vision 60.2 (2004): 91-110.
非特許文献1では、選択された画素群の濃度値が、撮像画像とあらかじめ取得した対象物体の画像との間で大きく異なる場合がある。この場合、非特許文献1では、物体の識別が困難となり得る。撮影画像と対象物体の画像との間における画素群の濃度値の差異は、例えば、物体の汚れ、オクルージョン、センサのノイズにより発生する。オクルージョンとは、手前にある物体が背後にある物体を隠して見えないようにする状態を指す。さらに、非特許文献1では、対象とする物体ごとに、類似物体との識別に必要となる部分画像領域を探索する必要がある。
特許文献1では、類似する物体のそれぞれから得られる特徴量が異なることを前提としている。しかし、工業用部品のように、特徴の少ない物体、例えば模様の無い単色の物体では、類似する物体のそれぞれから抽出される特徴量がほぼ同一となる場合が多い。この場合、特許文献1では、物体の識別が困難となり得る。
本発明は、以上の問題を鑑みてなされたものであり、物体を正確に認識することができるようにした技術を提供することを目的とする。
上記課題を解決すべく、本発明の一つの観点に従う物体認識装置は、入力される物体である入力物体の画像を取得する画像取得部と、取得した入力物体の画像の認識候補となる複数の基準物体を選択することにより認識候補の組を生成する認識候補選択部と、認識候補の組に含まれる各基準物体について、入力物体の画像との類似度を計算する類似度計算部と、認識候補の組に含まれる基準物体の数が所定数になるまで、類似度計算部により計算される類似度に基づいて、認識候補の組に含まれる基準物体の中から所定の類似度の基準物体を取り除く識別部と、を備え、認識候補選択部は、識別部により所定の類似度の基準物体が取り除かれると認識候補の組を更新し、類似度計算部は、認識候補の組が更新されると、更新された認識候補の組に含まれる各基準物体について、入力物体の画像との類似度を再計算する。
本発明によれば、所定の類似度の基準物体を認識候補の組から取り除きながら類似度を再計算するため、認識候補の組に含まれる基準物体を段階的に絞り込むことができ、入力画像に類似する基準物体を抽出することができる。
物体認識装置の機能構成を示すブロック図である。 物体認識装置の適用例を示す説明図である。 物体認識装置のハードウェア構成を示すブロック図である。 教示物体を物体認識装置へ登録する処理を示すフローチャートである。 物体認識処理を示すフローチャートである。 重み計算処理を示すフローチャートである。 類似度の低い教示物体を除外しながら入力画像に最も似ている教示物体を判定する様子を示す説明図である。 第2実施例に係り、重み計算処理を示すフローチャートである。 特徴点を抽出する様子を示す説明図である。 第3実施例に係り、重み計算処理を示すフローチャートである。
以下、図面に基づいて、本発明の実施の形態を説明する。本実施形態では、入力画像があらかじめ登録された複数の教示物体のうちのいずれに該当するかを判定するために、認識候補となる教示物体を段階的に減らしていきながら、各教示物体と入力画像との類似度を再計算する。例えば、類似度の低い教示物体から順番に認識候補の組から除外することにより、明らかに似ていない教示物体を外して判定することができる。これにより、認識候補の組を更新しながら、残った各教示物体間の特徴の差を強調することができる。したがって、各教示物体間における画像上の特徴の差が少ない場合でも、入力画像がどの教示物体に該当するか正確に判定することができる。
本実施形態に係る物体認識装置の一例は、画像中の局所的特徴を表す画像特徴要素と複数の画像特徴要素の組によって構成される画像特徴パターンとに対して、入力画像から得られる画像特徴パターンとあらかじめ与えられた特定の複数の基準物体に対応する基準物体画像から得られる画像特徴パターンとの類似度をそれぞれ算出する。そして、本実施形態に係る物体認識装置は、基準物体ごとの類似度を比較して、入力画像に対応する基準物体を認識する。
本実施形態に係る物体認識装置は、上述のように、認識候補の組に含まれる基準物体を段階的に絞り込んで更新することにより、その組に残った基準物体間の相違を更新前よりも強調することができる。したがって、本実施形態に係る物体認識装置は、似たような形状、色彩の物体を取り扱う産業(製造業、輸送業など)においても、正確に物体を識別することができる。
このような本実施形態に係る物体認識装置は、例えば、入力画像を取得する画像入力部と、認識結果の候補となる物体(基準物体)である認識候補を複数選択する認識候補選択部と、認識候補の組に基づき入力画像の画像特徴パターン内の画像特徴要素それぞれの重みを算出し、入力画像の画像特徴パターンと重みおよび認識候補の画像特徴パターンから類似度を計算する類似度計算部と、類似度計算部によって算出された認識候補それぞれの類似度に基づいて、認識候補から少なくとも1つを選択する識別部と、を有し、識別部において選択された認識候補が複数存在する場合は、選択された認識候補をもとに、重みおよび類似度を再度計算する装置、と表現することもできる。
本実施形態に係る物体認識装置によれば、例えば、入力画像に最も似ていない認識候補(基準物体)を除外して新たな認識候補の組を作成し、この新たに作成された認識候補の組に基づいて重みおよび類似度を再計算する。したがって、本実施形態に係る物体認識装置は、各段階での認識候補の認識に有用な画像特徴要素を抽出することができるため、物体の汚れ、ノイズあるいはオクルージョンが存在する状況下であっても入力画像(被写体物体)を認識することができる。
図1~図7を用いて第1実施例を説明する。図1は、物体認識装置1の機能構成の一例を示す。物体認識装置1は、例えば、後述の計算処理を行う計算部11と、物体の画像データを取得する画像取得部12と、認識結果を出力する出力部13とを備える。
計算部11は、例えば、データ保持部111、認識候補選択部112、類似度計算部113、識別部114を備える。
データ保持部111は、あらかじめ取得される複数種類の物体に関するデータ(基準物体画像に関するデータ)を記憶デバイス101(図3参照)に保持する機能である。基準物体を教示物体と呼ぶこともできる。認識候補となる基準物体の画像は、物体認識装置1にあらかじめ登録されるためである。
認識候補選択部112は、データ保持部111にデータが保持されている物体群の中から、複数の認識候補を選択する機能である。類似度計算部113は、画像取得部12で取得された入力画像の画像特徴パターンと各認識候補の画像特徴パターンとから類似度を計算する機能である。識別部114は、各認識候補から得られた類似度から少なくとも1つの認識候補を選択する機能である。
ここで、図1の下側に示す認識候補の組32Gとは、あらかじめ記憶された基準物体の画像32のうち、画像の入力された物体(対象物体)に対応する(一致する)可能性があるとして選択された基準物体の画像32からなるグループである。入力画像31とは、判定対象の物体である。物体としては、例えば、各種製造業で扱われる部品、物流産業で扱われる商品などがある。
類似度計算部113は、重み計算部1131と、重み付き類似度計算部1132とを備える。重み計算部1131は、認識候補の組に基づいて、入力画像の画像特徴要素の重みをそれぞれ計算する機能である。重み付き類似度計算部1132は、重み計算部1131で算出された重みと入力画像の画像特徴パターン、および認識候補の画像特徴パターンとから、各認識候補の類似度を求める機能である。
図1の下側には、識別方法の一例が部分的に示されている。詳細な識別方法の例については、図5~図7で後述する。ここでは、識別方法の概略を簡単に述べる。判定対象の物体の画像31は、図2で述べるカメラ2により撮像される。判定対象の物体の画像31の全体を常時きれいに撮影できる保証はなく、油などの汚れが物体31の表面に付着していたり、物体31の一部が他の物体の陰に隠れてしまう場合もある。本実施例では、このような不安定な環境下において、色彩や模様に変化が少なく区別のしにくい物体を正確に判別する方法を提供する。
判定対象の物体の画像31を入力画像31とも呼ぶ。物体認識装置1の認識候補選択部112は、データ保持部111にあらかじめ記憶されている複数の基準物体の画像32の中から、認識候補となり得る基準物体の画像32(1)~32(3)を選択する。これら選択された基準物体の画像32(1)~32(3)により、認識候補の組32Gが形成される。認識候補として最初に選択される基準物体の画像数は複数である。なお、以下では、基準物体と基準物体の画像とを特に区別しない場合、両者に符号32を与えて説明する場合がある。
物体認識装置1の類似度計算部113は、認識候補の組32Gに含まれる各基準物体の画像32(1)~32(3)が入力画像31に対してどれほど似ているかを示す類似度を計算する。類似度が最初に計算されたときの認識候補の組に符号32G(1)を与え、2回目に類似度が計算されたときの認識候補の組に符号32G(2)を与える。
物体認識装置1の識別部114は、一回目の計算で得られた類似度に基づいて、認識候補の組32G(1)の中から最も類似度の低い基準物体の画像を一つ選択する。ここでは、基準物体の画像32(3)の類似度が他の基準物体の画像32(1),32(2)の類似度よりも低いものとする。類似度が高いほど入力画像と基準物体の画像とは似ており、類似度が低いほど両者は似ていないものとする。
後述のように、類似度計算部113では、各基準物体の画像を比較して得られる特徴的な部分について、入力画像との類似度を計算する。すなわち、類似度計算部113は、他の物体の画像とは異なる特徴的な箇所の集合体である画像特徴パターンに基づいて、入力画像と基準物体の画像とを比較し、最も似ていない基準物体の画像を認識候補の組32Gから取り除く。
識別部114により基準物体の画像32(3)が認識候補の組32Gから取り除かれると、類似度計算部113は、認識候補の組32Gに残された基準物体の画像31(1),3(2)と入力画像31との類似度を再計算する。
2回目の計算では、認識候補の組32Gに基準物体の画像32(1),32(2)の2つだけが含まれているため、2回目の計算対象となる画像特徴パターンは、1回目の計算対象となる画像特徴パターンとは異なる。1回目の計算では、3個の基準物体の画像32(1)~32(3)を比較した場合の特徴的な部分に基づいて類似度を計算した。これに対し、2回目の計算では、2個の基準物体の画像32(1),32(2)を比較した場合の特徴的な部分に基づいて類似度を計算する。認識候補の組32Gを構成する画像が異なれば、類似度計算の基礎となる特徴的な箇所も変化する。したがって、多数の基準物体の画像の中では埋もれてしまっていた特徴が、認識候補の組32Gに含まれる基準物体の画像が変化するにしたがって(更新されるにしたがって)次第に強調されていき、入力画像との類似を判断する際の重要な特徴となる。
図1では省略するが、図7で後述するように、識別部114は、最終的に、基準物体の画像32(1),32(2)のうち、最も入力画像との類似度が高い基準物体画像32(1)を選択する。選択された結果は、出力部13から出力される。
図2は、物体認識装置1を自動仕分け機10に適用した場合の外観例を示す。認識対象(識別対象)の物体31は、パレットなどの容器3に収容されて運搬される。容器3の上方には、カメラ2がアーム20により取り付けられている。カメラ2は、例えば、CCD(Charge Coupled Device)カメラまたはCMOSカメラなどの撮像素子を有する撮像装置である。カメラ2で撮影された画像データは、物体認識装置1へ送られる。物体認識装置1の画像取得部12は、カメラ2からの画像データを取得し、計算部11へ送る。
物体認識装置1は、パーソナルコンピュータを用いて実現することができる。図3で後述するように、汎用のコンピュータに所定のコンピュータプログラムを記憶させることにより、物体認識装置1を実現することができる。これに代えて、物体認識装置1を専用装置として構成してもよい。
物体認識装置1の認識結果は、例えば、図示せぬロボット制御装置へ送られ、ロボット等により取り出されて所定の場所に載置される。
図3は、物体認識装置1のハードウェア構成例を示す。物体認識装置1は、例えば、プロセッサ100と、記憶デバイス101と、入力デバイス102と、出力デバイス103と、通信インターフェース(通信IF104)と、を有する。プロセッサ100、記憶デバイス101、入力デバイス102、出力デバイス103、および通信IF104は、バス105により接続される。図3では、物体認識装置1の計算部11を中心に示しているが、図3に示す構成に対してさらに、画像取得部12および出力部13を実現するための入出力インターフェース(不図示)を備えることもできる。
プロセッサ100は、計算部11を制御する。プロセッサ100は、記憶デバイス101に記憶されている物体認識処理プログラムP1を実行することにより、図1で述べた各機能を実現する。
記憶デバイス101は、プロセッサ100の作業エリアとなる。記憶デバイス101は、コンピュータプログラムP1および画像データ等を記憶する。記憶デバイス101は、データ保持部111を実現する。通信IF104を介して取得されたデータは、記憶デバイス101に一時的に記憶される。記憶デバイス101としては、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等がある。
入力デバイス102は、データを入力するための装置である。入力デバイス102としては、例えば、キーボード、マウス、タッチパネル、テンキー、スキャナ、音声認識装置等がある。出力デバイス103は、データを出力する装置である。出力デバイス103としては、例えば、ディスプレイ、プリンタ、音声合成装置等がある。
図4は、基準物体を物体認識装置1へ登録する処理(教示処理)を示すフローチャートである。例えば、オペレータは、カメラの視野内に登録対象の基準物体を載置し、その基準物体をカメラにより撮影させる。カメラにより撮影された画像は、画像取得部12により取得され、データ保持部111へ記憶される(S1)。
物体認識装置1は、類似度計算部113を用いて、基準物体の画像32から画像特徴パターンを抽出し(S2)、抽出された画像特徴パターンと基準物体の属性情報とを対応付けてデータ保持部111へ保存する(S3)。基準物体の属性情報としては、例えば、基準物体の品種番号、製造番号、製造元等がある。
物体認識装置1は、基準物体の登録処理を完了したか判定する(S4)。例えば、オペレータが入力デバイス102から登録作業の完了を指示すると、物体認識装置1は、基準物体の登録処理が完了したものと判断し、本処理を終了する(S4:YES)。
このように、本実施例では、データ保持部111に、あらかじめ、認識候補となる基準物体を撮像した画像32から得られる画像特徴パターンとその基準物体の属性情報とを対応付けて保持しておく。
なお、例えば、基準物体の位置(姿勢)を変えたり、光の当て方を変えたりして、一つの基準物体から複数の画像32を取得し、それぞれの画像32から画像特徴パターンを抽出してもよい。この場合は、属性情報として、基準物体の撮影時の位置(姿勢)を示す情報と光の当て方を示す情報とを画像特徴パターンに対応付けて記憶させてもよい。
画像特徴パターンとしては、例えば、画像そのものを用いることもできる。この場合、画像特徴要素は画像中の各画素に対応する。あるいは、非特許文献2に詳述されている、Cannyエッジ検出のようなエッジ検出により得たエッジを利用してもよい。この場合、画像特徴要素は検出された各エッジとなる。
図5は、物体認識処理を示すフローチャートである。ステップS10では、重み計算部1131において、重み計算処理を実行する。重み計算処理の詳細は図6に示す。
重み計算処理では、認識候補選択部112で選択された認識候補の組となる基準物体の画像32から得られる画像特徴パターンと、画像取得部12で取得した入力画像31から得られる画像特徴パターンとに基づいて、入力画像31の画像特徴パターン中の各画像特徴要素ti(i=1,・・・,Nt)に対する重みWiを求める。ここで、Ntは、入力画像31が持つ画像特徴要素の総数である。例えば、局所領域tiとして座標(x, y)に位置する画素ti(x, y)を選択し、画像中の全画素に対応する重みWi(x, y)を求めればよい。
図6は、重み計算部1131による重みの計算例を示すフローチャートである。先ず、重み計算部1131は、認識候補選択部112で選択された認識候補の組の中から候補となる基準物体画像32を1つ選択し、それに対応する、種別、姿勢、画像特徴パターンなどのデータをデータ保持部111から取得する(S101)。
最初の認識候補として選択される基準物体は、データ保持部111に保持されている全ての基準物体としてもよい。または、画像取得部12で取得される入力画像31の種類が限られている場合、データ保持部111に保持されている基準物体のうちの一部の基準物体を最初の認識候補の組として選択してもよい。
ステップS102では、重み計算部1131は、画像取得部12によって取得された入力画像31に含まれる各画像特徴要素tiに対して、以下の処理S103,S104を実行する。
先ず、ステップS103において、重み計算部1131は、選択された画像特徴要素tiの特徴と、ステップS101で選択された候補mにおける各画像特徴要素mj(j=1,・・・,Nm)との差d(m,i,j)を求める。Nmは、選択した候補mに含まれる画像特徴要素の総数である。画像特徴要素として画素を使用した場合、Nmは全画素数となる。例えば、画像がグレースケールで与えられる場合、下記数1によって差d(m,i,j)を算出すればよい。
Figure 0007207862000001
(xi, yi)は、tiの座標である。(xj, yj)は、mjの座標である。It(xi, yi)、Im(xj,yj)は、それぞれti、mjの濃度値である。δは、ピクセルのずれの許容範囲である。画素の値がRGB色空間(r,g,b)で表される場合は、r、g、bそれぞれの誤差の絶対値の和を使用してもよい。
続けて重み計算部1131は、算出された画像特徴要素の差d(m,i,j)とあらかじめ設定された閾値εとを比較し、d(m,i,j) (j=1,・・・,Nm)のうち少なくとも一つは閾値内にあるかを調べる(S103)。
画像特徴要素の差の少なくとも一つが閾値以内であった場合は(S103:YES)、重み計算部1131は、画像特徴要素tiと類似する画像特徴要素を持つ候補の数を表すn(i)に1を加算する(S104)。なお、後述する重みの再計算のために、各認識候補mでのn(i)への加算の有無に関する情報を保持してもよい。
全認識候補に対してステップS101からステップS104までの処理が終わると、続いて重みの計算を行う(S105)。各画像特徴要素tiに対応する重みWiは、例えば下記数2により算出される。
Figure 0007207862000002
これにより、特定の画像特徴要素と類似する画像特徴要素を持つ認識候補の数が多ければ多いほど、その画像特徴要素に対応する重みが小さくなり、後述する重みづき類似度に与える影響が小さくなる。
図5に戻る。ステップS20では、各認識候補の重みづけ類似度S(t,m)を計算する。重みづけ類似度は、例えば、下記数3によって算出される。
Figure 0007207862000003
ここで、I(cond)は、指示関数である。条件condが成立すれば1を、そうでないときには0を返す。
ステップS30では、識別部114によって、例えば、類似度計算部113によって算出された各認識候補の類似度から、類似度の最も低い認識候補を組32Gから除外し、残った認識候補を新たな認識候補として選択する。除外方法として、例えば、最も類似度の低い候補(基準物体)を1つ除外してもよいし、あるいは、ある閾値以下の類似度を持つ認識候補をすべて除外してもよい。
ステップS40では、識別部114において、ステップS30で選択された認識候補の数を調べる。選択された認識候補の数が2つ以上存在するときは(S40:NO)、再度ステップS10へ戻って、選択された認識候補のもとで、重みと重みづけ類似度とを再計算する。
これにより、入力画像31とは明らかに異なる基準物体を認識候補の対象から除外することができる。したがって、類似する認識候補の間で異なっている画像特徴要素をより明確にし、物体の汚れやノイズ、オクルージョンが生じてもよりロバストに認識を行うことができる。
図7は、ステップS10~S40で行う認識候補の繰り返し選択処理の例を示す説明図である。図7に示すように、各認識候補32(1)~32(3)と画像取得部12によって対象物を撮像した画像31(入力画像31)とは、物体の汚れSTやノイズ、オクルージョン310による影響を受ける。このため、類似度も、汚れST、ノイズ、オクルージョン310の影響を受ける。
したがって、認識候補とする基準物体(基準物体の画像)の組み合わせによっては、汚れやオクルージョン等の影響によって、誤った認識候補の重み付き類似度が最も高くなってしまい、誤った認識結果を出力してしまうおそれがある。
これに対し、本実施例に係る物体認識装置1では、明らかに異なる認識候補を除外しながら重み付き類似度を再計算するため、除外されずに残った認識候補の認識に有用である画像特徴要素を再度見つけなおすことが可能となる。
例えば、図7の(2)に示すように、識別2巡目では、認識候補である基準物体の画像32(3)を除外したことで、残された認識候補である画像32(1)と画像32(2)との間で異なっている領域がより明確となる。このため、重み付き類似度が、物体の汚れやノイズ・オクルージョンに影響されにくくなる。汚れやオクルージョン等による影響に左右されにくくなる作用は、認識候補となる基準物体の画像の数が多いほど、より顕著となる。
図7をより詳しく説明する。図7の入力画像31は、例えば3つの突起と切り欠き部CTを有する。入力画像31には、油や塵埃等の汚れSTも含まれている。さらに、入力画像31の一部は他の物体により隠されてしまっている(オクルージョン310)。
最初に選択される認識候補の組32Gには、3つの基準物体の画像32(1)~32(3)が含まれているものとする。基準物体画像32(1),32()は、切り欠き部CTを有する。基準物体画像32(2)は、汚れSTを含む。
図7の(1)に示す識別1巡目では、他の画像と最も異なる特徴要素321について、入力画像31との類似度が判定される。画像32(1)の特徴要素321(1)は、オクルージョン310のために、入力画像31では発見できない。したがって、この特徴要素321(1)は入力画像31とは似ていないと判定される。図7では、入力画像に似ていると判定される特徴要素に丸印を対応付け、似ていないと判定される特徴要素にバツ印を対応付けている。
画像32(2)は、2つの特徴要素321(2a),321(2b)を有する。特徴要素321(2a)は、図7の上側に延びる突起である。この特徴要素321(2a)は、入力画像31には存在しないため、入力画像31に似ていないと判定される。特徴要素321(2b)は、汚れSTである。入力画像31も同じような場所に汚れSTを持つため、特徴要素321(2b)は入力画像31に似ていると判定される。
画像32(3)は、突起を備えていない滑らかな曲線部分が特徴要素321(3a),321(3b)として抽出される。他の画像32(1),32(2)は、いずれも突起を有するためである。しかし、入力画像31は2つの突起を有するため、特徴要素321(3a),321(3b)は入力画像31とは似ていないと判定される。
識別1巡目の結果、画像32(1)では、1つの特徴要素321(1)について似ていないと判定される。画像32(2)では、1つの特徴要素321(2a)については似ていないと判定されるが、他の1つの特徴要素321(2b)については似ていると判定される。画像32(3)では、2つの特徴要素321(3a),321(3b)の両方について似ていないと判定される。この結果、最も似ていないとされた画像32(3)は、認識候補の組32Gから取り除かれる。
認識2巡目では、残された画像32(1)と画像32(2)とを対比することにより、両者の最も異なる点を特徴要素322として抽出する。
画像32(1)は、滑らかな曲線部分の特徴要素322(1a)と、切り欠き部の特徴要素322(1b)と、突起の特徴要素322(1c)を有する。これら3つの特徴要素322のうち、特徴要素322(1a),322(1b)とは、入力画像31も備えているため、いずれも似ていると判定される。特徴要素322(1c)は、入力画像31が備えていないため、似ていないと判定される。
画像32(2)は、突起の特徴要素322(2a)と、汚れのある突起の特徴要素322(2b)と、滑らかな曲線部分の特徴要素322(2c),322(2d)を有する。これら4つの特徴要素322のうち、特徴要素322(2a),322(2c),322(2d)は、入力画像31は備えていないため、似ていないと判定される。特徴要素322(2b)は、入力画像31も備えているため、似ていると判定される。
識別2巡目の結果、画像32(2)の類似度は画像32(1)の類似度よりも低いため、認識候補の組32Gから取り除かれる。
識別3巡目では、認識候補の組32Gには1つの画像32(1)のみが含まれることになるため、その最後に残った画像32(1)が入力画像31に最も似ている画像として、すなわち、最終認識結果として出力される。
図5に戻る。ステップS10~S40の処理によって認識候補を繰り返し選択した結果、残った認識候補の数が1つとなったとき(S40:YES)、物体認識装置1は、残った認識候補を認識結果として、認識結果出力部13から出力させる(S50)。この認識結果の出力はディスプレイに表示させたり、図外のロボットまたは機械を操作するコントローラへ与えたりすることができる。
このように構成される本実施例によれば、認識候補の組32Gに含まれる基準物体を段階的に絞り込んで更新することにより、その組に残った基準物体間の相違を更新前よりも強調することができる。したがって、物体認識装置は、似たような形状、色彩の物体を取り扱う産業(製造業、輸送業など)においても、正確に物体を識別できる。
図7および図8を用いて第2実施例を説明する。本実施例を含む以下の各実施例は、第1実施例の変形例に相当するため、第1実施例との差異を中心に述べる。
本実施例は、上述したステップS10およびステップS20において、特徴点および特徴量を使用して、重みの計算と重み付き類似度とを計算する。
図8は、特徴点および特徴量を使用して、重みを計算する処理例を示すフローチャートである。
ステップS111では、入力画像31から画像特徴要素として特徴点を抽出する。特徴点の抽出方法として、例えば、非特許文献3に詳述されている、FASTのような撮像画像中のコーナーを検出する手法を用いて特徴点を抽出すればよい。
特徴点を抽出するのと同時に、その特徴点での特徴量を取得してもよい。例えば、非特許文献4に記載されている、SIFTのような特徴点まわりの輝度勾配などの情報を記述することにより特徴量を求めてもよい。
図9は、重み計算部1131による特徴点抽出例を示す説明図である。画像取得部12により、入力画像31から、例えば、コーナーやエッジなどの特徴をもつ局所領域を特徴点320として抽出し、その座標位置(x, y)を得る。図では、特徴点に符号320を与える。図では、特徴点を示す黒い丸印の一部に符号320を示している。特徴点の抽出に失敗した箇所には白丸印を付け、符号320Fを与えている。
特徴点320の抽出と同時に特徴量を取得して、その座標位置(x,y)における特徴量(x,y)を得てもよい。図9のように、特徴点320は1つの物体から複数取得することができる。図9に示すように、画像取得部12によって取得された画像では、光源の影響や他の物体によるオクルージョン等の影響をうけるため、抽出される特徴点は常に同一のものであるとは限らない。
図8に戻る。ステップS112では、重み計算部1131は、認識候補から候補を1つ選択し、それに対応する、種別、姿勢、テンプレート画像、特徴点、特徴量などのデータをデータ保持部111から取得する。
ステップS113では、重み計算部1131は、ステップS111で選択した特徴点抽出手法および特徴量記述手法を使用して、選択された認識候補から特徴点および特徴量を計算する。あるいは、あらかじめ認識候補から求めた特徴点および特徴量をデータ保持部111に保持しておき、ステップS113では、選択した認識候補と対応する特徴点および特徴量をデータ保持部111から取得してもよい。
ステップS114では、重み計算部1131は、ステップS111で抽出された画像の各特徴点tiに対して以下の処理S115,S116を実施する。
ステップS115では、重み計算部1131は、選択した特徴点tiと、ステップS113で取得した候補mの各特徴点mj(j=1,・・・,Nm)とから、特徴点の差d(m,i,j)を求める。Nmは、候補mから取得された特徴点の個数を示す。例えば、差d(m,i,j)として、特徴点tiの座標(xi,yi)と特徴点mjの座標(xj,yj)のユークリッド距離を使用してもよいし、特徴点tiの特徴量F(xi,yi)と特徴点mjの特徴量F(xj,yj)の誤差の絶対値を使用してもよいし、あるいはそれらの組み合わせを使用してもよい。
続いて、重み計算部1131は、求めた特徴点の差d(m,i,j)とあらかじめ設定した閾値εとを比較し、d(m,i,j) (j=1,・・・,Nm)のうち少なくとも一つは閾値内にあるかを調べる(S115)。重み計算部1131は、閾値内にあった場合(S115:YES)、特徴点tiと類似する特徴点を持つ候補の数を表すn(i)に1を加算する(S116)。
重み計算部1131は、全認識候補に対してステップS112~S116までの処理が終わると、重みを計算する(S117)。重みWiは特徴点tiごとに求まる。
図5のステップS20では、本実施例の物体認識装置1は、各認識候補の重みづけ類似度S(t,m)を計算する。重みづけ類似度も同様に特徴点を使用して計算する。
このように構成される本実施例も第1実施例と同様の作用効果を奏する。さらに、本実施例では、重み計算および重み付き類似度計算の対象が、各物体の特徴的な箇所を捉えた特徴点となるため、第1実施例に比べて、より類似物との識別に有用となる領域を捉えやすくなる。
図10を用いて第3実施例を説明する。本実施例では、ステップS10およびステップS20の計算に用いる画像特徴要素の数を低減する。
ステップS105で、重み計算部1131は、入力画像31の各画像特徴要素tiに対応する重みWiを算出する。重み計算部1131は、重みWiに応じてその画像特徴要素tiを除外するか否か判断する。重み計算部1131は、例えば、類似する特徴を持つ候補の数を表すn(i)が0となる画像特徴要素tiを除外する(S106)。
続いて、重み計算部1131は、ステップS20における重み付き類似度計算において、入力画像において除外されずに残った画像特徴要素のみからなる画像特徴パターンとステップS105で算出した重み、および各認識候補の画像特徴パターンを用いて重み付き類似度を計算する。
ステップS40の分岐処理によって、再度ステップS10における重みの計算を行う際は、重み計算部1131は、ステップS105で除外されずに残った画像特徴要素のみで、重みの計算と画像特徴要素の除外とを行う。
このように構成される本実施例も第1実施例と同様の作用効果を奏する。さらに、本実施例では、重み計算と重み付き類似度計算に与える影響がない、あるいは少ない画像特徴要素の計算を省略できるため(S106)、処理の高速化を図ることができる。
なお、本発明は上記実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記実施例は本発明を分かりやすく説明するために詳細に説明したものであり、本発明は必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
本発明の各構成要素は、任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれる。さらに特許請求の範囲に記載された構成は、特許請求の範囲で明示している組合せ以外にも組み合わせることができる。
1:物体認識装置、2:カメラ、3:容器、10:自動仕分け機、11:計算部、12:画像取得部、13:出力部、31:入力画像、32:基準物体画像、111:データ保持部、112:認識候補選択部、113:類似度計算部、114:識別部

Claims (8)

  1. 物体を認識する装置であって、
    入力される物体である入力物体の画像を取得する画像取得部と、
    前記取得した入力物体の画像の認識候補となる複数の基準物体を選択することにより認識候補の組を生成する認識候補選択部と、
    前記認識候補の組に含まれる各基準物体について、前記入力物体の画像との類似度を計算する類似度計算部と、
    前記認識候補の組に含まれる前記基準物体の数が所定数になるまで、前記類似度計算部により計算される類似度と、予め設定された閾値とに基づいて、前記認識候補の組に含まれる前記基準物体の中から所定の類似度の基準物体を取り除く識別部と、
    を備え、
    前記認識候補選択部は、前記識別部により前記所定の類似度の基準物体が取り除かれると前記認識候補の組を更新し、
    前記類似度計算部は、
    前記認識候補選択部で選択された認識候補の組の中から候補となる基準物体画像を選択し、
    前記画像取得部によって取得された前記入力物体の画像に含まれる画像特徴要素の特徴と、前記選択された基準物体画像における各画像特徴要素との差を算出し、
    前記算出された画像特徴要素の差と、予め設定された閾値とを比較し、前記画像特徴要素の差のうち少なくとも一つが前記閾値内にある場合、前記認識候補の数を更新し、
    前記認識候補の組が更新されると、前記更新された認識候補の組に含まれる前記各基準物体について、前記入力物体の画像との類似度を再計算する、
    物体認識装置。
  2. 前記所定数の基準物体を認識結果として出力する認識結果出力部をさらに備える、
    請求項1に記載の物体認識装置。
  3. 前記所定数とは1である、
    請求項に記載の物体認識装置。
  4. 前記基準物体を撮像した基準物体画像に関するデータを記憶するデータ保持部をさらに備える、
    請求項1に記載の物体認識装置。
  5. 前記データ保持部は、前記基準物体画像の持つ局所的特徴を表す画像特徴要素の組である基準物体画像特徴パターンを、前記基準物体画像に関するデータとして保持し、
    前記類似度計算部は、前記入力物体の画像の持つ局所的特徴を表す画像特徴要素の組である入力物体画像特徴パターンと前記基準物体画像特徴パターンとに基づいて、前記類似度を計算する、
    請求項に記載の物体認識装置。
  6. 前記類似度計算部は、
    前記基準物体画像特徴パターンに基づいて、前記入力物体画像特徴パターン内のそれぞれの前記画像特徴要素に対して重みを算出し、
    前記算出された重みと前記入力物体画像特徴パターンと前記基準物体画像特徴パターンとに基づいて、前記類似度を計算する、
    請求項に記載の物体認識装置。
  7. 前記類似度計算部は、
    前記画像特徴要素として特徴点および特徴量を算出し、
    前記基準物体の特徴点および特徴量に基づいて、前記入力物体画像から得られる前記特徴点または前記特徴量の少なくともいずれかについて前記重みを算出し、
    前記算出された重みと前記入力物体画像の持つ前記特徴点または前記特徴量のいずれかと前記基準物体の持つ前記特徴点または前記特徴量のいずれかとに基づいて、前記類似度を計算する、
    請求項に記載の物体認識装置。
  8. 前記類似度計算部は、
    前記基準物体画像特徴パターンに基づいて、前記入力物体画像特徴パターン内のそれぞれの前記画像特徴要素について重みを算出し、
    前記算出された重みに基づいて、前記入力物体画像特徴パターン内の所定の前記画像特徴要素を除外し、
    前記除外されずに残った前記入力物体画像特徴パターン内の前記画像特徴要素と前記重みと前記基準物体画像特徴パターンとに基づいて、前記類似度を計算する、
    請求項に記載の物体認識装置。
JP2018085209A 2018-04-26 2018-04-26 物体認識装置および方法 Active JP7207862B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018085209A JP7207862B2 (ja) 2018-04-26 2018-04-26 物体認識装置および方法
CN201910255723.9A CN110414304B (zh) 2018-04-26 2019-04-01 物体辨别装置及方法
DE102019205039.5A DE102019205039A1 (de) 2018-04-26 2019-04-09 Objekterkennungsvorrichtung und Objekterkennungsverfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018085209A JP7207862B2 (ja) 2018-04-26 2018-04-26 物体認識装置および方法

Publications (2)

Publication Number Publication Date
JP2019192005A JP2019192005A (ja) 2019-10-31
JP7207862B2 true JP7207862B2 (ja) 2023-01-18

Family

ID=68205697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018085209A Active JP7207862B2 (ja) 2018-04-26 2018-04-26 物体認識装置および方法

Country Status (3)

Country Link
JP (1) JP7207862B2 (ja)
CN (1) CN110414304B (ja)
DE (1) DE102019205039A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348266A (ja) 2003-05-20 2004-12-09 Fanuc Ltd 画像処理装置
WO2015136714A1 (ja) 2014-03-14 2015-09-17 オムロン株式会社 画像識別装置、画像センサ、画像識別方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02309458A (ja) * 1989-05-24 1990-12-25 Toshiba Corp パターン認識装置
US7813561B2 (en) * 2006-08-14 2010-10-12 Microsoft Corporation Automatic classification of objects within images
WO2008026414A1 (fr) * 2006-08-31 2008-03-06 Osaka Prefecture University Public Corporation Procédé de reconnaissance d'image, dispositif de reconnaissance d'image et programme de reconnaissance d'image
JP5213338B2 (ja) * 2007-03-02 2013-06-19 キヤノン株式会社 文字認識装置、文字認識方法、コンピュータプログラム
JP5596628B2 (ja) * 2011-06-17 2014-09-24 トヨタ自動車株式会社 物体識別装置
JP2013218604A (ja) * 2012-04-11 2013-10-24 Canon Inc 画像認識装置、画像認識方法及びプログラム
JP2017028407A (ja) * 2015-07-17 2017-02-02 富士通株式会社 撮影指示プログラム、撮影指示装置、および撮影指示方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348266A (ja) 2003-05-20 2004-12-09 Fanuc Ltd 画像処理装置
WO2015136714A1 (ja) 2014-03-14 2015-09-17 オムロン株式会社 画像識別装置、画像センサ、画像識別方法

Also Published As

Publication number Publication date
CN110414304B (zh) 2023-10-27
CN110414304A (zh) 2019-11-05
JP2019192005A (ja) 2019-10-31
DE102019205039A1 (de) 2019-10-31

Similar Documents

Publication Publication Date Title
US7340089B2 (en) Geometric pattern matching using dynamic feature combinations
US20190099891A1 (en) Information processing apparatus, method, and robot system
JP6143111B2 (ja) 物体識別装置、物体識別方法、及びプログラム
JP7049983B2 (ja) 物体認識装置および物体認識方法
TW202013248A (zh) 車輛損壞識別方法及裝置
JP6968342B2 (ja) 物体認識処理装置、物体認識処理方法及びプログラム
JP6648925B2 (ja) 画像処理方法、画像処理装置、画像処理システム、生産装置、プログラム及び記録媒体
US11094082B2 (en) Information processing apparatus, information processing method, robot system, and non-transitory computer-readable storage medium
KR20210008352A (ko) 촬상된 품목의 결함을 검출하기 위한 시스템 및 방법
CN108573471B (zh) 图像处理装置、图像处理方法以及记录介质
JP4709668B2 (ja) 3次元物体認識システム
JP7316731B2 (ja) ビジョンシステムで画像内のパターンを検出及び分類するためのシステム及び方法
JP4442119B2 (ja) 画像認識装置および画像認識方法、並びに、画像認識装置のティーチング装置およびティーチング方法
US6993177B1 (en) Gauging based on global alignment and sub-models
JP7214432B2 (ja) 画像処理方法、画像処理プログラム、記録媒体、画像処理装置、生産システム、物品の製造方法
JPWO2015008732A1 (ja) 光学文字認識装置
WO2009085173A1 (en) System and method for performing multi-image training for pattern recognition and registration
CN113378976A (zh) 一种基于特征顶点组合的目标检测方法、可读存储介质
US11189053B2 (en) Information processing apparatus, method of controlling information processing apparatus, and non-transitory computer-readable storage medium
JP7180283B2 (ja) 画像処理装置及び画像処理方法
CN114863129A (zh) 仪表数值分析方法、装置、设备及存储介质
Sulaiman et al. DEFECT INSPECTION SYSTEM FOR SHAPE-BASED MATCHING USING TWO CAMERAS.
JP7207862B2 (ja) 物体認識装置および方法
CN113034492A (zh) 一种印刷质量缺陷检测方法、存储介质
JP2007140729A (ja) 物品の位置及び姿勢を検出する方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220316

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221021

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20221021

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20221101

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20221115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230105

R150 Certificate of patent or registration of utility model

Ref document number: 7207862

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150