JP2022055779A - 物体認識結果の良否判定に用いる閾値を設定する方法、及び、物体認識装置 - Google Patents
物体認識結果の良否判定に用いる閾値を設定する方法、及び、物体認識装置 Download PDFInfo
- Publication number
- JP2022055779A JP2022055779A JP2020163399A JP2020163399A JP2022055779A JP 2022055779 A JP2022055779 A JP 2022055779A JP 2020163399 A JP2020163399 A JP 2020163399A JP 2020163399 A JP2020163399 A JP 2020163399A JP 2022055779 A JP2022055779 A JP 2022055779A
- Authority
- JP
- Japan
- Prior art keywords
- object recognition
- shape
- reliability score
- threshold value
- pseudo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Manipulator (AREA)
- Image Analysis (AREA)
Abstract
Description
本開示は、物体認識結果の良否判定に用いる閾値を設定する方法、及び、物体認識装置に関する。
特許文献1には、3次元カメラの撮像結果に基づいて、対象物を認識する物体認識方法が開示されている。この技術では、対象物の3次元データを用いて認識結果の信頼度スコアを算出し、その信頼度スコアを閾値と比較して認識結果の良否判定を実行する。
しかしながら、従来は、信頼度スコアの閾値を適切に設定することが困難であるという問題があった。
本開示の第1の形態によれば、物体認識結果の良否判定に用いる閾値を設定する方法が提供される。この方法は、(a)同一形状を有する複数の物体を含むデプス画像を撮影する工程と、(b)前記物体の形状を表す既知の3次元データと前記デプス画像とを用いて、前記複数の物体のうちの1つ以上の物体に関する3次元形状を認識する物体認識処理を実行する工程と、(c)前記物体認識処理による認識結果から、前記物体の正解形状を、作業者からの入力に応じて選択する工程と、(d)前記正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって、複数の疑似不正解形状を生成する工程と、(e)前記複数の疑似不正解形状に対する信頼度スコアをそれぞれ算出する工程と、(f)前記信頼度スコアの分布から、前記物体認識処理による認識結果の良否判定に用いる前記信頼度スコアの閾値を設定する工程と、を含む。
本開示の第2の形態によれば、物体認識装置が提供される。この物体認識装置は、デプス画像を撮影可能なカメラと、前記デプス画像を用いた物体認識処理を実行する物体認識部と、を備える。前記物体認識部は、(a)前記カメラを用いて、同一形状を有する複数の物体を含むデプス画像を撮影する処理と、(b)前記物体の形状を表す既知の3次元データと前記デプス画像とを用いて、前記複数の物体のうちの1つ以上の物体に関する3次元形状を認識する物体認識処理を実行する処理と、(c)前記物体認識処理による認識結果から、前記物体の正解形状を、作業者からの入力に応じて選択する処理と、(d)前記正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって、複数の疑似不正解形状を生成する処理と、(e)前記複数の疑似不正解形状に対する信頼度スコアをそれぞれ算出する処理と、(f)前記信頼度スコアの分布から、前記物体認識処理による認識結果の良否判定に用いる前記信頼度スコアの閾値を設定する処理と、を実行する。
A.第1実施形態
図1は、一実施形態におけるロボットシステムの一例を示す説明図である。このロボットシステムは、ロボット100と、ロボット100を制御する制御装置200と、情報処理装置300と、ワークWKを載置する架台400とを備える。情報処理装置300は、例えばパーソナルコンピューターである。図1には、3次元空間の直交座標系を規定する3つの軸X,Y,Zが描かれている。X軸とY軸は水平方向の軸であり、Z軸は鉛直方向の軸である。
図1は、一実施形態におけるロボットシステムの一例を示す説明図である。このロボットシステムは、ロボット100と、ロボット100を制御する制御装置200と、情報処理装置300と、ワークWKを載置する架台400とを備える。情報処理装置300は、例えばパーソナルコンピューターである。図1には、3次元空間の直交座標系を規定する3つの軸X,Y,Zが描かれている。X軸とY軸は水平方向の軸であり、Z軸は鉛直方向の軸である。
架台400には、複数のワークWKがバラ積みされている。これらのワークWKは、同一形状の物体であり、後述する物体認識の対象物である。なお、「同一形状の物体」とは、同一の設計に従って製造された物体を意味しており、製造誤差があっても「同一形状の物体」に該当する。
ロボットシステムは、更に、複数のワークWKのデプス画像を撮影可能なカメラ420を有している。「デプス」とは、カメラ420からの距離を意味しており、デプス画像の画素値は、カメラ420からの距離をそれぞれ示している。カメラ420は、デプス画像の他に、モノクロ画像やカラー画像などを撮影する機能を有していることが好ましい。このモノクロ画像やカラー画像は、複数のワークWKを含むシーン画像として利用できる。カメラ420で撮影されるデプス画像とシーン画像は、互いに対応関係が取られた状態で撮影される。
ロボット100は、基台110と、アーム120と、を備えている。アーム120は、6つの関節で順次接続されている。アーム120の先端部であるアームエンド122には、エンドエフェクター150が装着されている。図1の例では、エンドエフェクター150は、ワークWKを把持するグリッパーである。なお、カメラ420を、ロボット100のアーム120やエンドエフェクター150に設置してもよい。
アーム120は、6つの関節J1~J6で順次接続されている。これらの関節J1~J6のうち、3つの関節J2,J3,J5は曲げ関節であり、他の3つの関節J1,J4,J6はねじり関節である。本実施形態では6軸ロボットを例示しているが、1個以上の関節を有する任意のアーム機構を有するロボットを用いることが可能である。また、本実施形態のロボット100は、垂直多関節ロボットであるが、水平多関節ロボットを使用してもよい。また、本開示は、ロボット以外の装置にも適用可能である。
図2は、情報処理装置300の機能を示すブロック図である。情報処理装置300は、プロセッサー310と、メモリー320と、インターフェイス回路330と、インターフェイス回路330に接続された入力デバイス340及び表示部350と、を有している。インターフェイス回路330には、更に、カメラ420と制御装置200が接続されている。情報処理装置300とカメラ420とを含むシステムは、本開示の「物体認識装置」に相当する。
プロセッサー310は、デプス画像を用いた物体認識処理を実行する物体認識部312として機能する。物体認識部312の機能は、メモリー320に格納されたコンピュータープログラムをプロセッサー310が実行することによって実現される。但し、物体認識部312の機能の一部又は全部をハードウェア回路で実現してもよい。
メモリー320には、ワークWKの形状を表す既知の3次元データDDと、動作プログラムRPが格納されている。動作プログラムRPは、ロボット100を動作させる複数の命令で構成されている。動作プログラムRPは、例えば、ロボット100を用いて架台400からワークWKを1つずつ取り出し、作業場所にそのワークWKを移動させて、予め定められた作業を実行する動作を制御するものとして構成される。物体認識処理は、この際、架台400上のワークWKを認識するために使用される。
図3は、物体認識処理の良否判定に用いる信頼度スコアの閾値の設定手順を示すフローチャートである。この処理は、主として物体認識部312の制御によって実行される。
ステップS10では、作業者が、複数のワークWKを設置したシーンを設定し、物体認識部312が、カメラ420を用いて複数のワークWKのデプス画像を撮影する。このとき、デプス画像の他に、シーン画像を同時に撮影するようにしてもよい。なお、複数のワークWKは、ロボット100の作業時の状態と同様の設置状態で設置されていることが好ましい。図1の例では、複数のワークWKがバラ積みされており、この状態で撮影が実行される。
ステップS20では、物体認識部312が、デプス画像と、ワークWKの形状を表す3次元データとを用いて物体認識処理を実施する。
図4は、複数のワークWKの認識結果の一例を示す説明図である。実線はシーン画像に含まれる複数のワークWKを示し、破線は物体認識処理で認識されたワークWKの3次元形状を示す。ここでは複数のワークWKの中から4つのワークWKの3次元形状RR1~RR4が認識されている。
ステップS30では、物体認識部312が、物体認識処理による認識結果から、ワークWKの正しい3次元形状である正解形状を、作業者からの入力に応じて選択する。この際、図4に示したように、複数のワークWKを含むシーン画像に、認識結果である3次元形状RR1~RR4を重ねた状態で表示部350に表示することが好ましい。作業者は、複数の3次元形状RR1~RR4の中から、どの認識結果が正しいかを入力する。図4の例では、2つの3次元形状RR2,RR4はシーン画像におけるワークWKの輪郭とずれており、正しい結果ではない。一方、他の2つの3次元形状RR1,RR3は、シーン画像におけるワークWKの輪郭とほぼ一致しているので、正しい認識結果として作業者により入力される。この入力作業は、例えば、表示部350に表示された画像内で、正しい認識結果である3次元形状RR1,RR3をクリックすることによって行うことができる。以下の説明では、正しい認識結果として選択された3次元形状を「正解形状」とも呼ぶ。
ステップS40では、物体認識部312が、正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって、複数の疑似不正解形状を生成する。
図5は、正解形状RR1から生成される複数の疑似不正解形状PR11,PR12の例を示す説明図である。第1の疑似不正解形状PR11は正解形状RR1に対して並進ズレΔWを与えた例であり、第2の疑似不正解形状PR12は正解形状RR1に対して回転ズレΔθを与えた例である。正解形状RR1に対して並進ズレΔWと回転ズレΔθの両方を与えた疑似不正解形状も生成することが好ましい。
並進ズレについては、3次元空間の3つの軸X,Y,Zのうちの1軸以上に関して並進ズレΔWを与えることによって、それぞれ異なる疑似不正解形状を生成することが好ましい。例えば、並進ズレΔWのズレ量を2mmとした場合に、X軸に沿って、-2mmと+2mmのいずれかの並進ズレΔWを与えることができる。Y軸とZ軸についても同様である。なお、並進ズレΔWのズレ量は、3つの軸X,Y,Zについて同一とすることが好ましい。3つの軸X,Y,Zについて並進ズレを組み合わせる場合には、各軸におけるズレ量として{-2mm,0,+2mm}のいずれかの値を採用できる。従って、3つの軸X,Y,Zについて並進ズレの組み合わせは、(3×3×3)-1=26通りである。ここで1を引いた理由は、3つの軸に沿った並進ズレΔWのズレ量がすべて0となる場合を除外するためである。
回転ズレについても同様に、3つの回転軸のうちの1つ以上の回転軸周りに回転ズレΔθを与えることによって、それぞれ異なる疑似不正解形状を生成することが好ましい。3つの回転軸周りの回転ズレΔθの組み合わせも、26通り存在する。また、並進ズレΔWと回転ズレΔθの組み合わせは、(3×3×3)×(3×3×3)-1=727通りである。1つの正解形状から複数の疑似不正解形状を作成する場合には、この727通りのすべてを作成する必要はなく、その一部のみを作成してもよい。
並進ズレΔWのズレ量と回転ズレΔθのズレ量は、作業者によって予め設定されることが好ましい。こうすれば、作業者が望むズレ量を有する適切な疑似不正解形状を作成できる。なお、疑似不正解形状PR11,PR12を作業者に提示する必要はないが、表示部350に表示するようにしてもよい。図4に示した他の正解形状RR3についても同様に、複数の疑似不正解形状が生成される。
ステップS50では、物体認識部312が、ステップS40で生成した複数の疑似不正解形状PR11,PR12…に対して信頼度スコアをそれぞれ算出する。信頼度スコアは、例えば、個々の疑似不正解形状の特徴点のずれに応じて算出される。特徴点は、正解形状の輪郭、エッジ、平面部などから抽出された点を使用することが可能である。疑似不正解形状PR11の特徴点は、元になった正解形状RR1の特徴点をずらしたものとなる。この疑似不正解形状PR11の特徴点のずれに応じて、その疑似不正解形状PR11の信頼度スコアを算出できる。
図6は、信頼度スコアの計算方法の一例を示す説明図である。横軸は、水平方向のX座標を示し、縦軸は鉛直方向のZ座標を示す。この例では、3つのワークWK1,WK2,WK3に関する認識結果について、白丸で示される特徴点CP1~CP9が抽出されている。例えば、ワークWK1の4つの特徴点CP1~CP4は、ワークWK1の認識結果である正解形状から抽出された特徴点である。ハッチングを付した丸は、4つの特徴点CP1~CP4に対してX軸方向に並進ズレを与えた特徴点#CP1~#CP4を示している。これらの特徴点#CP1~#CP4は、疑似不正解形状の特徴点である。疑似不正解形状の特徴点#CP1~#CP4のそれぞれについて、同じシーンに含まれる他の元の特徴点CP5~CP9のうちの最も近い特徴点との距離D1~D4をそれぞれ求めることができる。なお、疑似不正解形状の特徴点#CP1~#CP4の元の特徴点CP1~CP4は、特徴点#CP1~#CP4の距離D1~D4を算出する相手から除外される。
図6の例において、信頼度スコアRsは、疑似不正解形状の特徴点#CP1~#CP4に関する距離D1~D4に応じて、次式に従って算出できる。
Rs=1/{1+min(Dj)} (1)
ここで、Djはj番目の特徴点に関する距離であり、min(X)はXのうちの最小値を取る論理演算を示す。
この(1)式では、距離Djの最小値min(Dj)が大きいほど信頼度スコアRsが低下する。なお、距離Djの最小値の代わりに、平均値を用いてもよい。
Rs=1/{1+min(Dj)} (1)
ここで、Djはj番目の特徴点に関する距離であり、min(X)はXのうちの最小値を取る論理演算を示す。
この(1)式では、距離Djの最小値min(Dj)が大きいほど信頼度スコアRsが低下する。なお、距離Djの最小値の代わりに、平均値を用いてもよい。
正解形状の信頼度スコアRsも、同様に算出することが可能である。例えば、ワークWK1の正解形状の信頼度スコアRsは、その正解形状の特徴点CP1~CP4のそれぞれについて、同じシーンに含まれる他の特徴点CP5~CP9のうちの最も近い特徴点との距離をそれぞれ求め、上記(1)式に従って信頼度スコアRsを算出できる。
図7は、信頼度スコアの計算方法の他の例を示す説明図である。図6との違いは、図6におけるワークWK1の元の特徴点CP1~CP4の図示が省略されており、これらの代わりに特徴点@CP1~@CP4が黒丸で描かれている点である。これらの特徴点@CP1~@CP4は、デプス画像から抽出されたワークWK1の特徴点である。物体認識処理では、3次元データとこれらの特徴点@CP1~@CP4とが比較されて、最終的に、3次元データの形状に近い特徴点CP1~CP4が図6のように決定される。従って、デプス画像のみから抽出されたワークWK1の特徴点@CP1~@CP4の一部は、物体認識処理で認識された形状の特徴点CP1~CP4とは若干異なる位置に存在することが多い。そこで、疑似不正解形状の特徴点#CP1~#CP4のそれぞれについて、デプス画像から抽出された対応する特徴点@CP1~@CP4との距離E1~E4をそれぞれ求め、これらの距離E1~E4を用いて信頼度スコアRsを算出することができる。
図7の例において、信頼度スコアRsは、疑似不正解形状の特徴点#CP1~#CP4に関する距離E1~E4に応じて、次式に従って算出できる。
Rs=1/{1+ave(Ej)} (2)
ここで、Ejはj番目の特徴点に関する距離であり、ave(X)はXの平均値を取る演算を示す。
この(2)式では、距離Ejの平均値が大きいほど信頼度スコアRsが低下する。なお、距離Ejの平均値の代わりに、最大値を用いてもよい。
Rs=1/{1+ave(Ej)} (2)
ここで、Ejはj番目の特徴点に関する距離であり、ave(X)はXの平均値を取る演算を示す。
この(2)式では、距離Ejの平均値が大きいほど信頼度スコアRsが低下する。なお、距離Ejの平均値の代わりに、最大値を用いてもよい。
正解形状の信頼度スコアRsも、同様に算出することが可能である。例えば、ワークWK1の正解形状の信頼度スコアRsは、その正解形状の特徴点CP1~CP4のそれぞれについて、デプス画像から抽出された対応する特徴点@CP1~@CP4との距離をそれぞれ求め、上記(2)式に従って信頼度スコアRsを算出できる。
上述した図6及び図7の説明から理解できるように、信頼度スコアRsは、疑似不正解形状の特徴点と、他の特徴点との距離に応じて算出することが可能である。この場合の「他の特徴点」は、正解形状に並進ズレや回転ズレを付与しても位置が変化しない特徴点を意味する。但し、信頼度スコアRsは、上述したもの以外の他の方法で算出してもよい。例えば、特徴点を用いない方法で信頼度スコアRsを算出してもよく、また、従来技術で説明した特開2019-185239号公報に開示された信頼度スコアを使用してもよい。
ステップS60では、物体認識部312が、十分な数の疑似不正解形状に対して信頼度スコアRsが蓄積されたか否かを判定する。この判定は、例えば、集まった信頼度スコアRsの数と、信頼度スコアRsの分布の形状と、疑似不正解形状を生成する基となった正解形状のバリエーションと、のうちの1つ以上に応じて実行できる。信頼度スコアRsが十分に蓄積されていないと判定された場合には、ステップS10に戻る。このステップS10では、作業者がバラ積み状態を変更して新たなシーンを設定し、デプス画像を再度撮影する。一方、信頼度スコアRsが十分に蓄積したと判定された場合には、ステップS70に進む。
ステップS70では、物体認識部312が、信頼度スコアRsの分布から、信頼度スコアRsの閾値を決定する。
図8は、第1実施形態における信頼度スコアRsの分布を示す説明図である。横軸は、信頼度スコアRsの値であり、縦軸は頻度である。個々の曲線は、1つ正解形状から生成した複数の疑似不正解形状に対する信頼度スコアの分布HSを示す。このような分布HSは、表示部350に表示するようにしてもよい。
作業者は、信頼度スコアRsの分布HSを観察して、信頼度スコアの閾値Tsとして、適切な値を設定することが可能である。閾値Tsは、物体認識処理の認識結果の良否判定に用いる閾値である。すなわち、認識結果の良否判定では、物体認識で認識された3次元形状の信頼度スコアRsの値が閾値Ts以上の場合に、その3次元形状が正解形状と判定される。
閾値Tsは、例えば、分布HSにおける信頼度スコアRsの最大値よりも大きな値としてもよい。あるいは、分布HSにおける信頼度スコアRsの平均と標準偏差から閾値Tsを決定しても良い。この場合に、例えば、複数の疑似不正解形状のうちの所定割合以上の疑似不正解形状に対する信頼度スコアRsが、閾値Tsよりも小さくなるように閾値Tsを設定することが好ましい。「所定割合」は、例えば、98%~99%の値を使用することができる。いずれの場合にも、ステップS40で多数の疑似不正解形状が生成されるので、信頼度スコアRsの分布HSから閾値Tsを容易に設定することができる。なお、閾値Tsの設定は、物体認識部312が自動的に実行しても良い。
なお、ステップS40で作業者により設定される並進ズレΔWや回転ズレΔθのズレ量は、以下の点を考慮して決定されることが好ましい。一般に、並進ズレΔWと回転ズレΔθのズレ量が小さい方が、疑似不正解形状の信頼度スコアRsが高くなるものと予想される。一方、作業者は、ワークWKについての作業時に行われる物体認識の認識結果について、認識精度に関する要求がある。ステップS40で使用されるズレ量は、この作業者の要求に応じて設定されることが好ましい。例えば、認識精度の要求が高い場合には、ズレ量を小さな値に設定する。この場合には、閾値Tsが高い値になるので、正しく認識されるワークWKの個数は減少するものの、精度の高い認識結果のみが出力されるので、作業者の考える作業をより確実に実行することができる。一方、認識精度の要求が低い場合には、認識精度の要求が高い場合よりもズレ量を大きく設定する。この場合には、閾値Tsがより低い値になるので、認識精度は比較的低いものの、より多くの正解形状を得ることができる。このように、作業者は、要求精度に応じた閾値Tsを設定できるので、認識精度と正解形状の個数とのトレードオフを適切に保つことができる。
以上のように、第1実施形態では、正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって複数の疑似不正解形状を生成し、複数の疑似不正解形状に対して信頼度スコアRsを算出し、信頼度スコアRsの分布から信頼度スコアRsの閾値Tsを設定するので、物体認識処理の認識結果の良否判定に用いる閾値Tsを容易に設定できる。
B.第2実施形態
図9は、第2実施形態における信頼度スコアRsの分布を示す説明図である。第2実施形態における装置構成や処理手順は第1実施形態と同様なので、その詳細は省略する。
図9は、第2実施形態における信頼度スコアRsの分布を示す説明図である。第2実施形態における装置構成や処理手順は第1実施形態と同様なので、その詳細は省略する。
図9では、信頼度スコアRsに関する2種類の分布HS1,HS2から複数の閾値Ts1,Ts2が設定されている。例えば、第1の分布HS1は、ワークWKの姿勢が表向きである場合の分布であり、第1の分布HS1から決まる第1の閾値Ts1は、ワークWKの姿勢が表向きである場合に適した閾値である。一方、第2の分布HS2は、ワークWKの姿勢が裏向きである場合の分布であり、第2の分布HS2から決まる第2の閾値Ts2は、ワークWKの姿勢が裏向きである場合に適した閾値である。一般には、ワークWKが、その様々な姿勢を複数の姿勢カテゴリーに分類できる形状を有する場合に、各姿勢カテゴリーに対してそれぞれ閾値Tsを設定することが可能である。「姿勢カテゴリー」とは、異なる姿勢カテゴリーの姿勢にあるワークWKの外形が、明確に区別できるものを意味する。例えば、ワークWKの表側の形状と裏側の形状とが一目で区別できるような形状的な差異が存在する場合に、表側が見える姿勢と裏側が見える姿勢を、互いに異なる「姿勢カテゴリー」とすることができる。
ワークWKが異なる姿勢カテゴリーの姿勢を取りうる場合には、図3のステップS10~S70のうち、少なくともステップS30,S40,S50,S70の処理を、複数の姿勢カテゴリーのそれぞれに対して実行することが好ましい。こうすれば、複数の姿勢カテゴリーに対して信頼度スコアRsの閾値をそれぞれ設定することができる。この場合に、例えば、ステップS30において作業者が正解形状を指定する際に、正解形状の姿勢カテゴリーも同時に指定することが好ましい。こうすれば、ワークWKの複数の姿勢カテゴリーのそれぞれについて、物体認識処理の認識結果の良否判定に用いる閾値をそれぞれ設定できる。この結果、それぞれの姿勢カテゴリーの姿勢をとるワークWKに対して、物体認識処理の認識結果の良否判定をより正しく行えるという利点がある。
・他の実施形態:
本開示は、上述した実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の形態で実現することができる。例えば、本開示は、以下の形態(aspect)によっても実現可能である。以下に記載した各形態中の技術的特徴に対応する上記実施形態中の技術的特徴は、本開示の課題の一部又は全部を解決するために、あるいは、本開示の効果の一部又は全部を達成するために、適宜、差し替えや、組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することが可能である。
本開示は、上述した実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の形態で実現することができる。例えば、本開示は、以下の形態(aspect)によっても実現可能である。以下に記載した各形態中の技術的特徴に対応する上記実施形態中の技術的特徴は、本開示の課題の一部又は全部を解決するために、あるいは、本開示の効果の一部又は全部を達成するために、適宜、差し替えや、組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することが可能である。
(1)本開示の第1の形態によれば、物体認識結果の良否判定に用いる閾値を設定する方法が提供される。この方法は、(a)同一形状を有する複数の物体を含むデプス画像を撮影する工程と、(b)前記物体の形状を表す既知の3次元データと前記デプス画像とを用いて、前記複数の物体のうちの1つ以上の物体に関する3次元形状を認識する物体認識処理を実行する工程と、(c)前記物体認識処理による認識結果から、前記物体の正解形状を、作業者からの入力に応じて選択する工程と、(d)前記正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって、複数の疑似不正解形状を生成する工程と、(e)前記複数の疑似不正解形状に対する信頼度スコアをそれぞれ算出する工程と、(f)前記信頼度スコアの分布から、前記物体認識処理による認識結果の良否判定に用いる前記信頼度スコアの閾値を設定する工程と、を含む。
この方法によれば、正解形状から生成した複数の疑似不正解形状を用いて、物体認識処理の認識結果の良否判定に用いる閾値を容易に設定できる。
この方法によれば、正解形状から生成した複数の疑似不正解形状を用いて、物体認識処理の認識結果の良否判定に用いる閾値を容易に設定できる。
(2)上記方法において、前記物体は、前記複数の物体の姿勢を複数の姿勢カテゴリーに分類できる形状を有しており、前記工程(c)から前記工程(f)までの処理を、前記複数の姿勢カテゴリーのそれぞれに対して実行することによって、前記複数の姿勢カテゴリーに対して前記閾値をそれぞれ設定するものとしてもよい。
この方法によれば、物体の表向きと裏向きなどの複数の姿勢カテゴリーのそれぞれについて、物体認識処理の認識結果の良否判定に用いる閾値をそれぞれ設定できる。
この方法によれば、物体の表向きと裏向きなどの複数の姿勢カテゴリーのそれぞれについて、物体認識処理の認識結果の良否判定に用いる閾値をそれぞれ設定できる。
(3)上記方法において、前記工程(d)は、前記並進ズレと前記回転ズレのズレ量を、前記作業者からの入力により取得する工程を含むものとしてもよい。
この方法によれば、並進ズレと回転ズレのズレ量を作業者からの入力により取得するので、作業者が望むズレ量を有する適切な疑似不正解形状を作成できる。
この方法によれば、並進ズレと回転ズレのズレ量を作業者からの入力により取得するので、作業者が望むズレ量を有する適切な疑似不正解形状を作成できる。
(4)上記方法において、前記工程(f)は、前記信頼度スコアの分布を表示する工程と、前記閾値を、前記作業者からの入力により設定する工程と、を含むものとしてもよい。
この方法によれば、作業者が信頼度スコアのヒストグラムの表示を観察して、適切な閾値を設定できる。
この方法によれば、作業者が信頼度スコアのヒストグラムの表示を観察して、適切な閾値を設定できる。
(5)本開示の第2の形態によれば、物体認識装置が提供される。この物体認識装置は、デプス画像を撮影可能なカメラと、前記デプス画像を用いた物体認識処理を実行する物体認識部と、を備える。前記物体認識部は、(a)前記カメラを用いて、同一形状を有する複数の物体を含むデプス画像を撮影する処理と、(b)前記物体の形状を表す既知の3次元データと前記デプス画像とを用いて、前記複数の物体のうちの1つ以上の物体に関する3次元形状を認識する物体認識処理を実行する処理と、(c)前記物体認識処理による認識結果から、前記物体の正解形状を、作業者からの入力に応じて選択する処理と、(d)前記正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって、複数の疑似不正解形状を生成する処理と、(e)前記複数の疑似不正解形状に対する信頼度スコアをそれぞれ算出する処理と、(f)前記信頼度スコアの分布から、前記物体認識処理による認識結果の良否判定に用いる前記信頼度スコアの閾値を設定する処理と、を実行する。
この物体認識装置によれば、正解形状から生成した複数の疑似不正解形状を用いて、物体認識処理の認識結果の良否判定に用いる閾値を容易に設定できる。
この物体認識装置によれば、正解形状から生成した複数の疑似不正解形状を用いて、物体認識処理の認識結果の良否判定に用いる閾値を容易に設定できる。
本開示は、上記以外の種々の形態で実現することも可能である。例えば、ロボットとロボット制御装置とを備えたロボットシステム、ロボット制御装置の機能を実現するためのコンピュータープログラム、そのコンピュータープログラムを記録した一時的でない記録媒体(non-transitory storage medium)等の形態で実現することができる。
100…ロボット、110…基台、120…アーム、122…アームエンド、150…エンドエフェクター、200…制御装置、300…情報処理装置、310…プロセッサー、312…物体認識部、320…メモリー、330…インターフェイス回路、350…表示部、400…架台、420…カメラ
Claims (5)
- 物体認識結果の良否判定に用いる閾値を設定する方法であって、
(a)同一形状を有する複数の物体を含むデプス画像を撮影する工程と、
(b)前記物体の形状を表す既知の3次元データと前記デプス画像とを用いて、前記複数の物体のうちの1つ以上の物体に関する3次元形状を認識する物体認識処理を実行する工程と、
(c)前記物体認識処理による認識結果から、前記物体の正解形状を、作業者からの入力に応じて選択する工程と、
(d)前記正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって、複数の疑似不正解形状を生成する工程と、
(e)前記複数の疑似不正解形状に対する信頼度スコアをそれぞれ算出する工程と、
(f)前記信頼度スコアの分布から、前記物体認識処理による認識結果の良否判定に用いる前記信頼度スコアの閾値を設定する工程と、
を含む、方法。 - 請求項1に記載の方法であって、
前記物体は、前記複数の物体の姿勢を複数の姿勢カテゴリーに分類できる形状を有しており、
前記工程(c)から前記工程(f)までの処理を、前記複数の姿勢カテゴリーのそれぞれに対して実行することによって、前記複数の姿勢カテゴリーに対して前記閾値をそれぞれ設定する、方法。 - 請求項1又は2に記載の方法であって、
前記工程(d)は、前記並進ズレと前記回転ズレのズレ量を、前記作業者からの入力により取得する工程を含む、方法。 - 請求項1~3のいずれか一項に記載の方法であって、
前記工程(f)は、
前記信頼度スコアの分布を表示する工程と、
前記閾値を、前記作業者からの入力により設定する工程と、
を含む、方法。 - 物体認識装置であって、
デプス画像を撮影可能なカメラと、
前記デプス画像を用いた物体認識処理を実行する物体認識部と、
を備え、
前記物体認識部は、
(a)前記カメラを用いて、同一形状を有する複数の物体を含むデプス画像を撮影する処理と、
(b)前記物体の形状を表す既知の3次元データと前記デプス画像とを用いて、前記複数の物体のうちの1つ以上の物体に関する3次元形状を認識する物体認識処理を実行する処理と、
(c)前記物体認識処理による認識結果から、前記物体の正解形状を、作業者からの入力に応じて選択する処理と、
(d)前記正解形状に対して並進ズレと回転ズレの少なくとも一方を与えることによって、複数の疑似不正解形状を生成する処理と、
(e)前記複数の疑似不正解形状に対する信頼度スコアをそれぞれ算出する処理と、
(f)前記信頼度スコアの分布から、前記物体認識処理による認識結果の良否判定に用いる前記信頼度スコアの閾値を設定する処理と、
を実行する、物体認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020163399A JP2022055779A (ja) | 2020-09-29 | 2020-09-29 | 物体認識結果の良否判定に用いる閾値を設定する方法、及び、物体認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020163399A JP2022055779A (ja) | 2020-09-29 | 2020-09-29 | 物体認識結果の良否判定に用いる閾値を設定する方法、及び、物体認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022055779A true JP2022055779A (ja) | 2022-04-08 |
Family
ID=80998986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020163399A Pending JP2022055779A (ja) | 2020-09-29 | 2020-09-29 | 物体認識結果の良否判定に用いる閾値を設定する方法、及び、物体認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022055779A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024009756A1 (ja) * | 2022-07-08 | 2024-01-11 | 日立Astemo株式会社 | 物体識別装置及び物体識別方法 |
-
2020
- 2020-09-29 JP JP2020163399A patent/JP2022055779A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024009756A1 (ja) * | 2022-07-08 | 2024-01-11 | 日立Astemo株式会社 | 物体識別装置及び物体識別方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5949242B2 (ja) | ロボットシステム、ロボット、ロボット制御装置、ロボット制御方法、およびロボット制御プログラム | |
US9089971B2 (en) | Information processing apparatus, control method thereof and storage medium | |
US20060013470A1 (en) | Device for producing shape model | |
WO2024027647A1 (zh) | 机器人控制方法、系统和计算机程序产品 | |
CN108627515B (zh) | 计算成为检查系统的检查对象外的图像区域的装置及方法 | |
JP6885856B2 (ja) | ロボットシステムおよびキャリブレーション方法 | |
US20190255706A1 (en) | Simulation device that simulates operation of robot | |
JP6410411B2 (ja) | パターンマッチング装置及びパターンマッチング方法 | |
JP2022055779A (ja) | 物体認識結果の良否判定に用いる閾値を設定する方法、及び、物体認識装置 | |
WO2023013740A1 (ja) | ロボット制御装置、ロボット制御システム、及びロボット制御方法 | |
JP6337445B2 (ja) | ロボット、処理装置及び検査方法 | |
JP7249221B2 (ja) | センサ位置姿勢キャリブレーション装置及びセンサ位置姿勢キャリブレーション方法 | |
JP2022163836A (ja) | ロボット画像の表示方法、コンピュータープログラム、及び、ロボット画像の表示システム | |
CN116472551A (zh) | 调整参数的装置、机器人系统、方法以及计算机程序 | |
CN110900606B (zh) | 一种基于小型机械臂手眼联动系统及其控制方法 | |
CN112643718A (zh) | 图像处理设备及其控制方法和存储其控制程序的存储介质 | |
JP2005186193A (ja) | ロボットのキャリブレーション方法および三次元位置計測方法 | |
US20230154162A1 (en) | Method For Generating Training Data Used To Learn Machine Learning Model, System, And Non-Transitory Computer-Readable Storage Medium Storing Computer Program | |
JP2024004619A (ja) | カメラによる物体認識を評価する方法、システム、及び、コンピュータープログラム | |
WO2023248353A1 (ja) | ワークの位置データを取得する装置、制御装置、ロボットシステム、方法、及びコンピュータプログラム | |
WO2023112337A1 (ja) | 教示装置 | |
JP7401250B2 (ja) | 画像処理装置、制御方法およびプログラム | |
WO2023013698A1 (ja) | ロボット制御装置、ロボット制御システム、及びロボット制御方法 | |
WO2023013739A1 (ja) | ロボット制御装置、ロボット制御システム、及びロボット制御方法 | |
WO2022181500A1 (ja) | 視覚センサの出力から得られる3次元位置情報を用いるシミュレーション装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20210913 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20211108 |