JP2009093611A - 三次元オブジェクト認識のためのシステムおよび方法 - Google Patents
三次元オブジェクト認識のためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2009093611A JP2009093611A JP2008040298A JP2008040298A JP2009093611A JP 2009093611 A JP2009093611 A JP 2009093611A JP 2008040298 A JP2008040298 A JP 2008040298A JP 2008040298 A JP2008040298 A JP 2008040298A JP 2009093611 A JP2009093611 A JP 2009093611A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional
- image
- model
- orientation
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000013459 approach Methods 0.000 claims description 73
- 239000013598 vector Substances 0.000 claims description 30
- 238000013507 mapping Methods 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 26
- 238000005457 optimization Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 2
- 238000007670 refining Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000011524 similarity measure Methods 0.000 claims 7
- 238000011960 computer-aided design Methods 0.000 claims 3
- 230000003014 reinforcing effect Effects 0.000 claims 2
- 230000000116 mitigating effect Effects 0.000 claims 1
- 230000001172 regenerating effect Effects 0.000 claims 1
- 230000002040 relaxant effect Effects 0.000 claims 1
- 230000009466 transformation Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 13
- 238000012800 visualization Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- FBOUIAKEJMZPQG-AWNIVKPZSA-N (1E)-1-(2,4-dichlorophenyl)-4,4-dimethyl-2-(1,2,4-triazol-1-yl)pent-1-en-3-ol Chemical compound C1=NC=NN1/C(C(O)C(C)(C)C)=C/C1=CC=C(Cl)C=C1Cl FBOUIAKEJMZPQG-AWNIVKPZSA-N 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1679—Programme controls characterised by the tasks executed
- B25J9/1692—Calibration of manipulator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1914—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Length Measuring Devices By Optical Means (AREA)
Abstract
【解決手段】本発明は、オブジェクト認識およびオンライン段階における三次元位置姿勢の測定に用いることができる三次元モデルの学習を、オフライン段階において自動的に行なう。この学習のために、ユーザは、例えば三次元CADモデル等のオブジェクトの幾何学的三次元表象を提供する。前記学習は、十分な数のオブジェクトの二次元画像を得、各画像に対して二次元モデルを算出し、多数の二次元モデルを三次元モデルにおいて保存することで実行される。オンライン段階において、前記二次元モデルは、ランタイムイメージとマッチされ、サーチされたオブジェクトの1つまたは複数の例に対し近似三次元位置姿勢が得られる。前記近似位置姿勢は、その後最小二乗マッチングを用いて絞り込まれる。
【選択図】図1
Description
幾何学的カメラ較正(工程101)は、コンピュータ視覚、ロボット工学、写真測量法、および他の分野において、イメージから精密な三次元情報を抽出するための前提条件である。三次元カメラ較正を用いることについては2つの主な利点をあげることができる。第1に、カメラの内的パラメータが既知の場合、距離的三次元情報は画像からしか得ることができない。第2に、レンズの歪みは、画像測定を著しく誤ったものとすることがあるため、較正処理の際、明確にモデル化し、測定する必要がある。その結果、カメラ較正を行わないと、多くのアプリケーションにとって必要とされるオブジェクト認識アプローチの正確さは得ることができない。本発明の好ましい実施形態において、Lenz、1987年により紹介されたカメラモデルが用いられており、ここでは、径方向に歪みのあるピンホールカメラが想定されている(図3)。カメラの較正は、Lanser et al.、1995年において説明されているアプローチに従い行なわれる。ここでは、既知の位置に丸い印が付された平面の較正ターゲットの複数の画像が較正に用いられている(図3)。あるいは、その他のモデルまたは較正方法も、本発明の範囲から逸脱することなく本発明に容易に取り込むことができる。このことは、例えば、使用されているレンズが、径方向の成分しか用いず不十分にモデル化されたさらに複雑な歪みを示す場合に必要となるであろう。較正の結果、内的カメラパラメータ(f、κ、sx、sy、cx、cy)が得られ、ここでは、fが焦点距離であり、κが径方向の歪みを表示し、sxおよびsyがそれぞれ、xおよびy方向におけるセンサ上のセンサ要素同士の距離であり、(cx、cy)Tが、画像における主点の位置である。カメラ座標系において与えられる三次元ポイントPc=(x、y、z)から、画像座標系におけるピクセル座標P=(r、c)Tへのマッピングは、以下の3つのステップにより行なわれる(図3参照)。
本発明は、任意の剛体三次元オブジェクトに対応することができる。一般的に、三次元オブジェクトは、CADモデルまたは同様の三次元記述により表現され、いくつかの利用可能なCADソフトツールの一つで生成することができる(工程102)。ほとんどのCADソフトツールは三次元記述をDXFファイル形式でエクスポートすることができるため、本発明の好ましい実施形態は、三次元オブジェクトのDXFファイルのインポートをサポートしている。あるいは、三次元の固体の形状を表すことができるその他の表象も同様に適している。オブジェクトは、平らな面の集合で表現されていると想定される。モデルが、円柱、球または任意の湾曲面などの曲面を含む場合、これらの面は、直線的なエッジで輪郭が描かれた十分な数の平らな面の集合によって近似されなければならない。多くの場合、平面近似はCADソフトの一部である。さもなければ、いくつかの利用可能な公知な標準的アプローチの一つ、例えば、Rypl、2003年において提示されているようなアプローチを、平らな面によって曲面を近似するために用いることができる。三角測量法の包括的概説が、BernおよびEppstein、1992年に示されている。
三次元モデル生成の第1のステップ(工程104)において、三次元オブジェクトは、内的表象に変換されるが、この内的表象は、輪郭が閉多角形である平らな面の集合として、オブジェクトを表す。図4Aは、主に平らな面と円柱とからなるオブジェクト例を示す。後者はいくつかの平らな長方形で近似されている。また、4つの小さな円は多角形の面で近似されている。視覚化を行う目的で、図4Bは、同一のオブジェクトを、隠線を取り除いた状態で示している。
オンライン段階では、単眼カメラ画像において三次元オブジェクトを認識するために、また、カメラ座標系に対するオブジェクトの三次元位置姿勢を測定するために、前記作成された三次元モデルが使用される。まず、入力画像から画像ピラミッドが作られる(工程203)。前記認識は、少なくとも一つの有効な二次元モデルが得られる最高位のピラミッドレベルから開始される(工程205)。ビューの二次元モデルと現行の画像ピラミッドレベルの二次元モデルとの類似度を計測することによって、このピラミッドレベルの二次元モデルすべてがサーチされる。このためには、前記二次元モデルが必要な範囲で回転され拡大縮小されて、前記拡大縮小および回転された二次元モデルの、画像における各位置で、類似度が算出される。欧州特許第1,193,642号に記載された類似度が適用される。人工画像から二次元モデルが生成されたので、投影されたエッジの極性はわからず、それらの方向のみがわかる。従って、欧州特許第1,193,642号に記載された類似度からは、勾配の局所的な極性を無視するバリアント(variant)が選択される。あるいは代わりに、他のエッジベースの二次元マッチングアプローチを本発明に用いてもよく、例えば、平均エッジ距離に基づくアプローチ(Borgefors、1988年)、ハウスドルフ距離に基づくアプローチ(Rucklidge、1997年)、または一般化ハフ変換に基づくアプローチ(Ballard、1981年またはUlrich et al.、2003年)がある。所定の類似閾値を超えたマッチの二次元位置姿勢(位置、回転、拡大縮小)は、マッチ候補の一覧に保存される。次の下位のピラミッドレベル上で、ツリー内に親ノードを持たない二次元モデルがすべて、最も高位のピラミッドレベル上のビューで行った方法と同じ方法でサーチされる。さらに、前のピラミッドレベル上で見つかったマッチ候補は絞り込まれる。この絞り込みは、ツリーにおける子ビューをすべて選択し、これらの子ビューの二次元モデルと現行の画像ピラミッドレベルの二次元モデルとの間の類似度を算出して行われる。しかしながら、親ビューのマッチに応じて、非常に制限されたパラメータ範囲内だけで類似度を算出することでも十分である。欧州特許第1,193,642号に記載されているように、このことは、精査すべき位置、回転および拡大縮小の範囲が、親マッチの近傍に限定できることを意味する。この処理は、最も下位のピラミッドレベルまですべてのマッチ候補が追跡されるまで繰り返される(工程206)。ピラミッドアプローチとツリー構造に配列される階層的モデルビューとの組み合わせは、リアルタイムアプリケーションにとって重要であり、これまでの認識アプローチには適用されたことが無い。
図15において、基本的なロボットビジョンシステム例が図示されている。このシステムは、本発明で提示された方法を組み込んでいる。三次元オブジェクト認識の代表的な利用分野がロボットビジョンである。前記システムは、画像を獲得するための画像獲得装置1と、画像を分析するための画像プロセッサ2と、三次元モデルデータを含む記憶装置3と、ロボット4とを含む。前記画像プロセッサは、例えば適切にプログラムされたコンピュータなど、ハードウェアとソフトウェアとの適当な組み合わせとして設けられてもよい。前記ロボットはたとえば、オブジェクトを取り扱うグリッパまたはグラスパ5を備えている。かかるシステムは、ロボットの「手」が機械的な「目」によって導かれるので「ハンド・アイシステム」とも呼ばれている。オブジェクト認識アプローチの結果を使用するために、オブジェクトの三次元位置姿勢がロボットの座標系に変換されなければならない。このように、カメラ較正に加え、ハンド・アイシステムの較正、すなわちカメラ座標とロボット座標との変換を判定しなければならない。その上で、例えばオブジェクト6を把持せよ、などの、適切なロボット指令の作成が可能になる。一般的に、かかるシステムの実現の可能性には2つの形式があるだろう。第1の可能性は、カメラがロボットに接続され、よってロボットが動くとカメラも動くものである(図15A)。第2の可能性は、カメラが世界座標系に対して固定されるものである(図15B)。どちらの場合も、カメラに対するグリッパの相対的位置姿勢は「ハンド・アイ較正」の標準的な方法を使用することによって測定できる。その結果、実際には、オブジェクト認識は下記のように実施される。
f 焦点距離
sx x方向におけるセンサ上のセンサ要素同士の距離
sy y方向におけるセンサ上のセンサ要素同士の距離
(cx、cy)T 画像における主点の位置
λ 緯度
φ 経度
d 距離
ω カメラのロール角
A エッジ振幅
N 面の法線ベクトル
δ 法線ベクトル間の角度
1 画像獲得装置
2 画像プロセッサ
3 記憶装置
4 ロボット
5 グリッパまたはグラスパ
6 オブジェクト
Claims (45)
- 三次元オブジェクト認識のための三次元モデルを構築する方法であって、
(a)カメラの内的パラメータを提供するステップと、
(b)三次元オブジェクトの幾何学的表象を提供するステップと、
(c)三次元オブジェクトがカメラから可視であるような位置姿勢の範囲を提供するステップと、
(d)異なる画像解像度について前記位置姿勢の範囲をサンプリングすることによって、前記三次元オブジェクトの仮想ビューを作成するステップと、
(e) 同一の画像解像度に対応するビューが前記ツリーにおいて同一の階層レベルに属するように、すべてのビューをツリー構造により表現するステップと、
(f)各画像について、適切な二次元マッチングアプローチを用いることにより、画像における二次元ビューを見つけるために使用可能な二次元モデルを作成するステップとを含む方法。 - 幾何学的カメラ較正を行うことによって、前記ステップ(a)における前記カメラの内的パラメータを得る、請求項1に記載の方法。
- 前記ステップ(b)の幾何学的表象は、コンピュータ支援設計(CAD)モデルである、請求項1または2に記載の方法。
- 前記三次元CADモデルは、DXFファイルによって表される、請求項3に記載の方法。
- 前記ステップ(c)の位置姿勢範囲の提供は、固定されたオブジェクト座標系における前記カメラの位置姿勢範囲の提供であって、
(c1)前記三次元オブジェクト表象を基準オブジェクト座標系に変換するステップと、
(c2)前記基準オブジェクト座標系において球座標の緯度、経度、距離の区間を提供することによって、カメラの位置を提供するステップと、
(c3)前記カメラ座標系のZ軸が前記基準オブジェクト座標系の原点を通り、前記カメラ座標系のX軸が予め定められた平面に平行となるように、前記カメラを回転させるステップと、
(c4)前記カメラロール角度の区間を提供することによって前記カメラの方位を提供するステップとを含む、請求項1〜4のいずれかに記載の方法。 - 前記ステップ(c3)において、前記予め定められた平面は、前記基準オブジェクト座標系の赤道面である、請求項5に記載の方法。
- 前記ステップ(c)の位置姿勢範囲の提供は、固定されたオブジェクト座標系における前記カメラの位置姿勢範囲の提供であって、
(c1)前記三次元オブジェクト表象を基準オブジェクト座標系に変換するステップと、
(c2)前記基準オブジェクト座標系においてX座標、Y座標、Z座標の区間を提供することによって、カメラの位置を提供するステップと、
(c3)前記カメラ座標系のZ軸が前記基準オブジェクト座標系の原点を通り、前記カメラ座標系のX軸が予め定められた平面に平行となるように、前記カメラを回転させるステップと、
(c4)前記カメラロール角度の区間を提供することによって前記カメラの方位を提供するステップとを含む、請求項1〜4のいずれかに記載の方法。 - 前記ステップ(c3)において、前記予め定められた平面は、前記基準オブジェクト座標系のX軸およびZ軸上に延びる平面である、請求項7に記載の方法。
- 前記ステップ(c4)において、前記カメラロール角度は、前記カメラのZ軸を中心とした回転である、請求項5〜8のいずれかに記載の方法。
- 前記ステップ(c)の位置姿勢範囲の提供は、固定されたカメラ座標系内での前記オブジェクトの位置姿勢範囲の提供である、請求項1〜4および7のいずれかに記載の方法。
- 前記ステップ(c1)における前記基準オブジェクト座標系は、幾何学的表象によって画定されたオブジェクト座標系と同じである、請求項5または7に記載の方法。
- 前記ステップ(c1)における基準オブジェクト座標系は、三次元オブジェクトの中心へ移された前記幾何学的表象によって画定され、所定の基準方位を向くよう回転させられたオブジェクト座標系である、請求項5または7に記載の方法。
- 異なる画像解像度について前記位置姿勢の範囲をサンプリングすることによる前記三次元オブジェクトの仮想ビューの作成は、画像ピラミッドの異なるレベルについて前記位置姿勢をサンプリングすることによる前記三次元オブジェクトの仮想ビューの作成である、請求項1〜12のいずれかに記載の方法。
- 前記ステップ(d)は、
(d1)最高画像解像度のビュー、すなわち最下位ピラミッドレベル上のビューのオーバーサンプリングを算出するステップと、
(d2)前記ビューを間引くステップであって、予め定められた閾値を越えた類似度を有する近傍のビューを次々に統合することによって間引きを行うステップと、
(d3)前記ステップ(d2)で2つの近傍のビューが閾値を越えた類似度を有するということがなくなるまで、前記ステップ(d2)を繰り返すステップと、
(d4)前記統合されたビューを前記三次元モデルにコピーするステップと、
(d5)前記ステップ(d2)の類似度閾値を緩和した後に全ての画像解像度について前記ステップ(d2)〜(d4)を繰り返すステップとを含む、請求項1に記載の方法。 - 両方のビューの像面に前記オブジェクトを投影し、請求項1に記載のステップ(f)の二次元マッチングアプローチで使用される類似度測定に基づいて前記投影図間の類似度を算出することによって、前記ステップ(d2)における類似度が算出される、請求項14に記載の方法。
- 両方のビューの像面に前記オブジェクトの三次元バウンディングボックスのみを投影し、請求項1に記載のステップ(f)の二次元マッチングアプローチで使用される類似度測定に基づいて前記投影図間の類似度を算出することによって、前記ステップ(d2)における類似度が算出される、請求項14に記載の方法。
- 前記類似度測定に代わって、前記原類似度測定よりも早く算出することができる分析的近似を行う、クレーム15または16に記載の方法。
- 前記類似度測定の最もスピードの速い近似から開始して、前記原類似度測定が使用されるまで類似度測定を絞り込むことによって、前記ステップ(d2)および(d3)が反復される、請求項14に記載の方法。
- 次に高位のピラミッドレベルへ至るために前記画像を平滑化しサブサンプリングし、前記サブサンプリングされた画像上で類似度を算出することによって、前記ステップ(d5)の類似度閾値の緩和がおこなわれる、請求項14に記載の方法。
- ピラミッドレベルに応じて類似度の前記分析的近似中に位置の許容値を乗ずることによって、前記ステップ(d5)の類似度閾値の緩和を行う、請求項14に記載の方法。
- 前記ステップ(e)が、
(e1)各ビューについて、当該ビューの三次元位置姿勢を前記三次元モデルに保存するステップと、
(e2)各ビューについて、子ビューすべてに対する参照を前記三次元モデルに保存するステップと、
(e3)各ビューについて、その親ビューに対する参照を前記三次元モデルに保存するステップとを含む、請求項1〜20のいずれかに記載の方法。 - 前記ステップ(f)が、
(f1)各ビューの像面に前記三次元オブジェクトを投影して3チャネル画像を生じさせ、前記3チャネルとは前記三次元オブジェクトの面の法線ベクトルの三つの要素を表すステップと、
(f2)前記3チャネル画像の勾配振幅を閾値処理することによって得られる画像エッジからなる二次元モデルを作成するステップとを含む、請求項1〜21のいずれかに記載の方法。 - 前記ステップ(f2)における二次元モデルの作成は、一般化ハフ変換、ハウスドルフ距離、またはエッジ勾配方向のドット積に基づくマッチングアプローチに使用できる二次元モデルの作成を含む、請求項22に記載の方法。
- 前記ステップ(f2)の閾値は、所定の最小面角度から算出される、請求項22に記載の方法。
- 前記ステップ(f1)において、各画像チャネルにある一定の値を加えて、投影されたオブジェクトのシルエットが前記ステップ(f2)の閾値処理によって削除されることの無いようにする、請求項22に記載の方法。
- 前記ステップ(f2)における閾値処理によって得られた画像エッジは自動的に確認され、確認できない場合には前記二次元モデルが廃棄される、請求項22に記載の方法。
- (g)投影歪みの影響を低減する前記像面の球マッピングを算出し、前記三次元モデルに前記球マッピングを保存するステップと、
(h)前記球マッピングを使用して前記ステップ(f)で作成された二次元モデルをマッピングし、前記原二次元モデルに加えて、前記球マッピングされた二次元モデルを前記三次元モデルに保存するステップとをさらに含む、請求項1〜26のいずれかに記載の方法。 - (i)レンズ歪みの影響を除去する前記像面のマッピングを算出し、前記マッピングを前記三次元モデルに保存するステップをさらに含む、請求項1〜26のいずれかに記載の方法。
- 三次元オブジェクトを認識し、前記オブジェクトのひとつの画像からその三次元位置姿勢を測定する方法であって、
(a)前記三次元オブジェクトの三次元モデルを提供するステップと、
(b)前記三次元オブジェクトの電子サーチ画像を提供するステップと、
(c)前記サーチ画像の異なる解像度を含むサーチ画像の表象を作成するステップと、
(d)前記階層的ツリー構造において、親ビュー(father view)を持たない二次元モデルを、前記画像ピラミッドの各レベルの画像とマッチさせるステップと、
(e)最下位ピラミッドまで追跡することにより、最上位ピラミッドレベルの二次元でのマッチの確認および絞り込み(refining)を行うステップと、
(f)前記二次元マッチングの位置姿勢および前記各三次元ビューの位置姿勢から、初期三次元オブジェクトの位置姿勢を測定するステップと、
(g)前記初期三次元オブジェクトの位置姿勢を絞り込むステップとを含む、方法。 - 前記ステップ(e)が、
(e1)前記マッチ候補の位置に応じて子ビューの二次元モデルを投影変換するステップと、
(e2)前記画像ピラミッドの各レベルの画像に対して、限定されたパラメータ範囲で子ビューの変換された二次元モデルをマッチさせるステップと、を含む、請求項29に記載の方法。 - 前記ステップ(d)または(e2)のそれぞれにおける前記マッチングは、一般化ハフ変換、ハウスドルフ距離、またはエッジ勾配方向のドット積に基づく、請求項29または30に記載の方法。
- 前記ステップ(d)またはステップ(e2)におけるマッチングはそれぞれ、勾配の局所的な極性を無視したエッジ勾配方向のドット積に基づく、請求項29または30に記載の方法。
- 前記ステップ(d)において、マッチングが行われる各ピラミッドレベルは、マッチングを適用する前に投影歪みを低減するために前記三次元モデルに保存された球マッピングを使用してマップされ、前記ステップ(d)において、前記球マッピングされた二次元モデルは前記原二次元モデルの代わりにマッチングに使用される、請求項29に記載の方法。
- 前記ステップ(d)または(e2)のそれぞれにおいて、マッチングが行われる各ピラミッドレベルは、マッチングが適用される前にレンズ歪みを除去するために前記三次元モデルに保存されたマッピングを使用してマップされる、請求項29または30に記載の方法。
- 前記ステップ(g)における前記初期三次元オブジェクト位置姿勢の絞込みは、サブピクセルレベルで正確な画像エッジポイントと対応する投影された三次元オブジェクトエッジとの間の距離を最小にすることによって行われる、請求項29に記載の方法。
- (g1)前記初期三次元オブジェクト位置姿勢を使用することによって前記三次元モデルエッジを前記サーチ画像投影し、その際に陰線アルゴリズムを使用して隠れたオブジェクトエッジを削除し、かつ、2つの隣接した面の間の角度が所定の最小角度を下回るような前記オブジェクトのエッジを削除する、ステップと、
(g2)ピクセルグリッドに応じて、前記投影されたエッジをサンプリングして離間したポイントにするステップと、
(g3)前記サンプリングされたエッジポイント各々について、その近傍でそれに対応する、サブピクセルレベルで正確な画像エッジポイントを探索するステップと、
(g4)反復的な非線形の最適化アルゴリズムを使用して、前記対応ポイント間の距離の二乗の総和を最小化することにより、絞り込まれた三次元オブジェクト位置姿勢の6つのパラメータを決定するステップとを含む、請求項35に記載の方法。 - 前記ステップ(g3)において、対応するサブピクセルレベルで正確な画像エッジポイントの探索の方向が、投影されたモデルエッジに垂直な方向に制限される、請求項36に記載の方法。
- 前記ステップ(g3)において、閾値未満の角差との対応のみが有効な対応として承認され、前記角差は前記投影モデルエッジに対する垂線と前記画像勾配との間で算出される、請求項36に記載の方法。
- 前記ステップ(g4)において、最適化中に角差に応じて前記距離の二乗が重み付けされ、前記角差は前記投影モデルエッジに対する垂線と前記画像勾配との間で算出される、請求項36に記載の方法。
- 前記ステップ(g1)〜(g4)が反復され、前記反復は、前記絞り込まれた三次元オブジェクト位置姿勢が前記反復の最後2回分の間で大きく変化しなくなるまで行われる、請求項36に記載の方法。
- 前記ステップ(g1)〜(g4)が、所定の回数分反復される、請求項36に記載の方法。
- 前記ステップ(g1)において、陰線アルゴリズムは反復の1回目のみに適用され、その後の反復では、前記反復の1回目に可視であった三次元モデルエッジの部分のみが、前記陰線アルゴリズムを再度行うことなく投影される、請求項40または41に記載の方法。
- 前記勾配に最大値フィルタを適用することによって前記マッチングを行う前に前記画像における勾配方向を拡大し、各フィルタ位置において前記フィルタの中心の勾配ベクトルを前記フィルタ内の最大振幅を有する勾配ベクトルと置き換える、請求項31または32に記載の方法。
- テキスチャ情報で三次元モデルを補強する方法であって、
(a)三次元オブジェクトのいくつかの画像例を提供するステップと、
(b)請求項31に記載のステップを使用して、前記画像例の各々において前記三次元オブジェクトの三次元位置姿勢を測定するステップと、
(c)前記画像例の各々について、前記ステップ(b)で測定された三次元位置姿勢を使用して、前記三次元モデルの各面を前記画像例に投影するステップと、
(d)前記オブジェクト面の各々について、前記面の三次元位置姿勢を使用して前記投影された面が覆っている前記画像例の部分を修正するステップと、
(e)前記テキスチャされ修正されたオブジェクト面から得られたテキスチャ情報で前記二次元モデルを補強し、幾何学的情報とテキスチャ情報とを含む二次元モデルとするステップとを含む、方法。 - 前記ステップ(e)の代わりに、下記のステップを行う、請求項44に記載の方法。
(e)前記テキスチャされ修正されたオブジェクト面から得られたテキスチャ情報のみを使用して前記二次元モデルを再生成し、前記幾何学情報を削除するステップ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07118329.7 | 2007-10-11 | ||
EP07118329A EP2048599B1 (en) | 2007-10-11 | 2007-10-11 | System and method for 3D object recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009093611A true JP2009093611A (ja) | 2009-04-30 |
JP4785880B2 JP4785880B2 (ja) | 2011-10-05 |
Family
ID=38779887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008040298A Active JP4785880B2 (ja) | 2007-10-11 | 2008-02-21 | 三次元オブジェクト認識のためのシステムおよび方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8379014B2 (ja) |
EP (1) | EP2048599B1 (ja) |
JP (1) | JP4785880B2 (ja) |
CN (1) | CN101408931B (ja) |
AT (1) | ATE452379T1 (ja) |
DE (1) | DE602007003849D1 (ja) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010205095A (ja) * | 2009-03-05 | 2010-09-16 | 3D Media Co Ltd | 3次元物体認識装置、並びに3次元物体認識プログラム及びこれが記録されたコンピュータ読み取り可能な記録媒体 |
JP2011129082A (ja) * | 2009-11-20 | 2011-06-30 | 3D Media Co Ltd | 3次元物体認識装置及び3次元物体認識方法 |
JP2011138490A (ja) * | 2009-12-28 | 2011-07-14 | Mitsubishi Electric Research Laboratories Inc | シーンにおける物体の姿勢を求めるための方法 |
WO2012014545A1 (ja) * | 2010-07-27 | 2012-02-02 | 株式会社三次元メディア | 3次元物体認識装置及び3次元物体認識方法 |
JP2012532382A (ja) * | 2009-07-01 | 2012-12-13 | 本田技研工業株式会社 | 3次元モデルを使用した物体認識 |
WO2012173141A1 (ja) * | 2011-06-16 | 2012-12-20 | オリンパス株式会社 | 画像処理装置、画像処理方法、およびプログラム |
JP2013146813A (ja) * | 2012-01-18 | 2013-08-01 | Seiko Epson Corp | ロボット装置および位置姿勢検出方法 |
JP2015032119A (ja) * | 2013-08-01 | 2015-02-16 | セコム株式会社 | 対象検出装置 |
KR20170026591A (ko) * | 2014-09-05 | 2017-03-08 | 인텔 코포레이션 | 카메라 교정 |
CN107300100A (zh) * | 2017-05-22 | 2017-10-27 | 浙江大学 | 一种在线cad模型驱动的级联式机械臂视觉引导逼近方法 |
JP2019032820A (ja) * | 2017-06-16 | 2019-02-28 | ダッソー システムズDassault Systemes | 画像を入力とする関数を学習するためのデータセット |
JP2019515364A (ja) * | 2016-02-26 | 2019-06-06 | カーネギー メロン ユニバーシティー | テクスチャなし物体の姿勢を推定するシステム及び方法 |
KR20190133223A (ko) * | 2017-04-28 | 2019-12-02 | 윌 비 컴퍼니 리미티드 | 입체물 인쇄 시스템 및 입체물 인쇄 방법 |
WO2020008936A1 (ja) * | 2018-07-06 | 2020-01-09 | キヤノン株式会社 | 画像処理装置、画像処理方法、システム、物品の製造方法 |
WO2021002249A1 (ja) * | 2019-07-01 | 2021-01-07 | 株式会社小松製作所 | 学習済みの作業分類推定モデルの製造方法、学習用データ、コンピュータによって実行される方法、および作業機械を含むシステム |
KR102249769B1 (ko) * | 2019-12-06 | 2021-05-12 | 주식회사 모빌테크 | 2차원 영상의 픽셀별 3차원 좌표값 추정 방법 및 이를 이용한 자율주행정보 추정 방법 |
JP2021086449A (ja) * | 2019-11-28 | 2021-06-03 | 株式会社日立製作所 | モデル作成装置及びモデル作成方法 |
KR102518014B1 (ko) * | 2022-09-16 | 2023-04-06 | 흥일기업주식회사 | 부품 스캔 장치 및 방법 |
Families Citing this family (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7016539B1 (en) | 1998-07-13 | 2006-03-21 | Cognex Corporation | Method for fast, robust, multi-dimensional pattern recognition |
US8081820B2 (en) | 2003-07-22 | 2011-12-20 | Cognex Technology And Investment Corporation | Method for partitioning a pattern into optimized sub-patterns |
US10127130B2 (en) | 2005-03-18 | 2018-11-13 | Salesforce.Com | Identifying contributors that explain differences between a data set and a subset of the data set |
US9129226B2 (en) * | 2011-12-04 | 2015-09-08 | Beyondcore, Inc. | Analyzing data sets with the help of inexpert humans to find patterns |
EP2028623B1 (en) * | 2007-08-24 | 2011-10-19 | Dassault Systèmes | Method of computer-aided design of edges connecting faces of a modeled object |
US8737721B2 (en) | 2008-05-07 | 2014-05-27 | Microsoft Corporation | Procedural authoring |
US8525871B2 (en) * | 2008-08-08 | 2013-09-03 | Adobe Systems Incorporated | Content-aware wide-angle images |
US8229928B2 (en) * | 2009-02-27 | 2012-07-24 | Empire Technology Development Llc | 3D object descriptors |
EP2249286A1 (en) * | 2009-05-08 | 2010-11-10 | Honda Research Institute Europe GmbH | Robot with vision-based 3D shape recognition |
TWI389558B (zh) * | 2009-05-14 | 2013-03-11 | Univ Nat Central | Method of determining the orientation and azimuth parameters of the remote control camera |
US8649565B1 (en) * | 2009-06-18 | 2014-02-11 | Hrl Laboratories, Llc | System for automatic object localization based on visual simultaneous localization and mapping (SLAM) and cognitive swarm recognition |
US8442305B2 (en) * | 2009-06-30 | 2013-05-14 | Mitsubishi Electric Research Laboratories, Inc. | Method for determining 3D poses using points and lines |
DE102009048066A1 (de) * | 2009-10-01 | 2011-04-07 | Conti Temic Microelectronic Gmbh | Verfahren zur Verkehrszeichenerkennung |
CN101739666B (zh) * | 2009-12-15 | 2011-12-21 | 西南交通大学 | 基于一维快速哈特莱变换和匹配追踪的图像稀疏分解快速方法 |
JP4850984B2 (ja) * | 2009-12-28 | 2012-01-11 | パナソニック株式会社 | 動作空間提示装置、動作空間提示方法およびプログラム |
JP5618569B2 (ja) * | 2010-02-25 | 2014-11-05 | キヤノン株式会社 | 位置姿勢推定装置及びその方法 |
US8872887B2 (en) * | 2010-03-05 | 2014-10-28 | Fotonation Limited | Object detection and rendering for wide field of view (WFOV) image acquisition systems |
JP5035372B2 (ja) * | 2010-03-17 | 2012-09-26 | カシオ計算機株式会社 | 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム |
JP5024410B2 (ja) * | 2010-03-29 | 2012-09-12 | カシオ計算機株式会社 | 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム |
JP4858626B2 (ja) | 2010-04-16 | 2012-01-18 | カシオ計算機株式会社 | 情報表示装置及びプログラム |
EP2385483B1 (en) | 2010-05-07 | 2012-11-21 | MVTec Software GmbH | Recognition and pose determination of 3D objects in 3D scenes using geometric point pair descriptors and the generalized Hough Transform |
US8873801B2 (en) * | 2010-08-03 | 2014-10-28 | Empire Technology Development Llc | Identification of objects in a video |
US9013550B2 (en) * | 2010-09-09 | 2015-04-21 | Qualcomm Incorporated | Online reference generation and tracking for multi-user augmented reality |
KR101743926B1 (ko) * | 2010-09-20 | 2017-06-08 | 삼성전자주식회사 | 로봇 및 그 제어방법 |
CN102445147A (zh) * | 2010-10-06 | 2012-05-09 | 鸿富锦精密工业(深圳)有限公司 | 影像量测机台测头模拟系统及方法 |
US8600192B2 (en) * | 2010-12-08 | 2013-12-03 | Cognex Corporation | System and method for finding correspondence between cameras in a three-dimensional vision system |
US9124873B2 (en) | 2010-12-08 | 2015-09-01 | Cognex Corporation | System and method for finding correspondence between cameras in a three-dimensional vision system |
JP5924862B2 (ja) * | 2010-12-15 | 2016-05-25 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN102141398B (zh) * | 2010-12-28 | 2013-01-30 | 北京航空航天大学 | 基于单目视觉的多机器人位置与姿态测量方法 |
CN102609550B (zh) * | 2011-01-19 | 2015-11-25 | 鸿富锦精密工业(深圳)有限公司 | 产品三维模型自动摆正系统及方法 |
US8723959B2 (en) | 2011-03-31 | 2014-05-13 | DigitalOptics Corporation Europe Limited | Face and other object tracking in off-center peripheral regions for nonlinear lens geometries |
US8917322B2 (en) * | 2011-04-01 | 2014-12-23 | Lockheed Martin Corporation | Method and apparatus for digital video latency reduction by real-time warping |
EP2523132A1 (en) * | 2011-05-11 | 2012-11-14 | Dassault Systèmes | Designing a three-dimensional modeled assembly of objects in a three-dimensional scene |
US9188973B2 (en) | 2011-07-08 | 2015-11-17 | Restoration Robotics, Inc. | Calibration and transformation of a camera system's coordinate system |
DE102011109387A1 (de) | 2011-08-04 | 2013-02-07 | Conti Temic Microelectronic Gmbh | Verfahren zur Erkennung von Verkehrszeichen |
CN103875250A (zh) * | 2011-08-12 | 2014-06-18 | 瑞典爱立信有限公司 | 摄像机和/或深度参数的信号通知 |
US8493459B2 (en) | 2011-09-15 | 2013-07-23 | DigitalOptics Corporation Europe Limited | Registration of distorted images |
US10796232B2 (en) | 2011-12-04 | 2020-10-06 | Salesforce.Com, Inc. | Explaining differences between predicted outcomes and actual outcomes of a process |
US10802687B2 (en) | 2011-12-04 | 2020-10-13 | Salesforce.Com, Inc. | Displaying differences between different data sets of a process |
US8908913B2 (en) * | 2011-12-19 | 2014-12-09 | Mitsubishi Electric Research Laboratories, Inc. | Voting-based pose estimation for 3D sensors |
US8630458B2 (en) * | 2012-03-21 | 2014-01-14 | Google Inc. | Using camera input to determine axis of rotation and navigation |
US8497859B1 (en) * | 2012-04-03 | 2013-07-30 | Google Inc. | Display of information on or within a three-dimensional image |
US8928730B2 (en) | 2012-07-03 | 2015-01-06 | DigitalOptics Corporation Europe Limited | Method and system for correcting a distorted input image |
US8983201B2 (en) | 2012-07-30 | 2015-03-17 | Microsoft Technology Licensing, Llc | Three-dimensional visual phrases for object recognition |
US9372871B2 (en) * | 2012-08-24 | 2016-06-21 | Google Inc. | Combining unstructured image and 3D search results for interactive search and exploration |
US9129429B2 (en) | 2012-10-24 | 2015-09-08 | Exelis, Inc. | Augmented reality on wireless mobile devices |
US9508146B2 (en) * | 2012-10-31 | 2016-11-29 | The Boeing Company | Automated frame of reference calibration for augmented reality |
US10262460B2 (en) * | 2012-11-30 | 2019-04-16 | Honeywell International Inc. | Three dimensional panorama image generation systems and methods |
US9227323B1 (en) | 2013-03-15 | 2016-01-05 | Google Inc. | Methods and systems for recognizing machine-readable information on three-dimensional objects |
RU2530220C1 (ru) * | 2013-03-18 | 2014-10-10 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Система и способ для автоматической регистрации анатомических точек в объемных медицинских изображениях |
WO2014169238A1 (en) | 2013-04-11 | 2014-10-16 | Digimarc Corporation | Methods for object recognition and related arrangements |
CN104125390B (zh) * | 2013-04-28 | 2018-03-23 | 浙江大华技术股份有限公司 | 一种用于球型摄像机的定位方法及装置 |
US9679224B2 (en) | 2013-06-28 | 2017-06-13 | Cognex Corporation | Semi-supervised method for training multiple pattern recognition and registration tool models |
DE102013219909A1 (de) | 2013-10-01 | 2015-04-02 | Conti Temic Microelectronic Gmbh | Verfahren und Vorrichtung zur Erkennung von Verkehrszeichen |
CN104574497B (zh) * | 2013-10-24 | 2017-04-05 | 万里科技股份有限公司 | 一种配对一个2d摄影图像文件和一个3d网格的方法 |
KR101364375B1 (ko) | 2013-10-25 | 2014-02-18 | 중앙대학교 산학협력단 | 3차원 데이터로부터 특정 객체를 추출하는 시스템 및 방법. |
US9747680B2 (en) | 2013-11-27 | 2017-08-29 | Industrial Technology Research Institute | Inspection apparatus, method, and computer program product for machine vision inspection |
US9915857B2 (en) * | 2013-12-09 | 2018-03-13 | Geo Semiconductor Inc. | System and method for automated test-pattern-free projection calibration |
CN103644894B (zh) * | 2013-12-10 | 2016-03-09 | 大连交通大学 | 一种复杂曲面目标识别及三维位姿测量的方法 |
EP3080783A4 (fr) * | 2013-12-15 | 2018-01-10 | 7893159 Canada Inc. | Methode et systeme de comparaison de modeles 3d |
JP6380828B2 (ja) * | 2014-03-07 | 2018-08-29 | セイコーエプソン株式会社 | ロボット、ロボットシステム、制御装置、及び制御方法 |
EP2916290A1 (en) * | 2014-03-07 | 2015-09-09 | Thomson Licensing | Method and apparatus for disparity estimation |
DE102014005181A1 (de) * | 2014-04-03 | 2015-10-08 | Astrium Gmbh | Positions- und Lagebestimmung von Objekten |
JP6424020B2 (ja) * | 2014-06-09 | 2018-11-14 | 株式会社キーエンス | 画像検査装置、画像検査方法、画像検査プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 |
CN104075694B (zh) * | 2014-07-02 | 2016-09-07 | 武汉华中天勤防务技术有限公司 | 一种高速实时姿态测量方法 |
US9715724B2 (en) * | 2014-07-29 | 2017-07-25 | Applied Materials Israel Ltd. | Registration of CAD data with SEM images |
US9327406B1 (en) | 2014-08-19 | 2016-05-03 | Google Inc. | Object segmentation based on detected object-specific visual cues |
US9710706B2 (en) * | 2014-09-23 | 2017-07-18 | GM Global Technology Operations LLC | Method for classifying a known object in a field of view of a camera |
US10613231B2 (en) * | 2014-12-18 | 2020-04-07 | Javad Gnss, Inc. | Portable GNSS survey system |
US10466041B2 (en) * | 2014-12-22 | 2019-11-05 | Bombardier Inc. | Reference system for online vision inspection |
TWI577493B (zh) | 2014-12-26 | 2017-04-11 | 財團法人工業技術研究院 | 校正方法與應用此方法的自動化設備 |
US10134177B2 (en) * | 2015-01-15 | 2018-11-20 | Samsung Electronics Co., Ltd. | Method and apparatus for adjusting face pose |
CN104680966B (zh) * | 2015-03-19 | 2017-11-14 | 京东方科技集团股份有限公司 | 一种显示装置的驱动方法及其驱动装置 |
US10275863B2 (en) | 2015-04-03 | 2019-04-30 | Cognex Corporation | Homography rectification |
US9542732B2 (en) * | 2015-04-03 | 2017-01-10 | Cognex Corporation | Efficient image transformation |
US9878447B2 (en) | 2015-04-10 | 2018-01-30 | Microsoft Technology Licensing, Llc | Automated collection and labeling of object data |
JP6554900B2 (ja) | 2015-04-28 | 2019-08-07 | オムロン株式会社 | テンプレート作成装置及びテンプレート作成方法 |
CN104992432B (zh) * | 2015-06-19 | 2017-10-20 | 北京邮电大学 | 多模图像配准方法 |
US9818043B2 (en) | 2015-06-24 | 2017-11-14 | Microsoft Technology Licensing, Llc | Real-time, model-based object detection and pose estimation |
TWI558208B (zh) * | 2015-07-14 | 2016-11-11 | 旺玖科技股份有限公司 | 影像處理方法、影像處理裝置及顯示系統 |
TW201719572A (zh) * | 2015-11-19 | 2017-06-01 | 國立交通大學 | 三維模型分析及搜尋方法 |
US9836673B2 (en) | 2015-12-30 | 2017-12-05 | International Business Machines Corporation | System, method and computer program product for training a three dimensional object indentification system and identifying three dimensional objects using semantic segments |
EP3206164B1 (en) | 2016-02-12 | 2022-05-25 | Cognex Corporation | System and method for efficiently scoring probes in an image with a vision system |
US9868212B1 (en) * | 2016-02-18 | 2018-01-16 | X Development Llc | Methods and apparatus for determining the pose of an object based on point cloud data |
JP2017182274A (ja) * | 2016-03-29 | 2017-10-05 | セイコーエプソン株式会社 | 情報処理装置およびコンピュータープログラム |
JP2017187882A (ja) | 2016-04-04 | 2017-10-12 | セイコーエプソン株式会社 | 画像処理に用いられるコンピュータープログラム |
JP2017196705A (ja) * | 2016-04-28 | 2017-11-02 | セイコーエプソン株式会社 | ロボット、及びロボットシステム |
JP2019517079A (ja) | 2016-05-24 | 2019-06-20 | モルフォトラスト・ユーエスエー・リミテッド ライアビリティ カンパニーMorphotrust Usa,Llc | 形状検知 |
US9875398B1 (en) | 2016-06-30 | 2018-01-23 | The United States Of America As Represented By The Secretary Of The Army | System and method for face recognition with two-dimensional sensing modality |
US10530972B2 (en) * | 2016-09-21 | 2020-01-07 | Htc Corporation | Control method for optical tracking system |
JP7071054B2 (ja) * | 2017-01-20 | 2022-05-18 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN106919944B (zh) * | 2017-01-20 | 2020-03-24 | 南京航空航天大学 | 一种基于orb算法的大视角图像快速识别方法 |
US10661442B2 (en) * | 2017-02-03 | 2020-05-26 | Abb Schweiz Ag | Calibration article for a 3D vision robotic system |
JP6732214B2 (ja) * | 2017-03-10 | 2020-07-29 | オムロン株式会社 | 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム |
CN108734058B (zh) * | 2017-04-18 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 障碍物类型识别方法、装置、设备及存储介质 |
EP3404583A1 (en) | 2017-05-19 | 2018-11-21 | MVTec Software GmbH | System and method for model adaptation |
JP7003455B2 (ja) * | 2017-06-15 | 2022-01-20 | オムロン株式会社 | テンプレート作成装置、物体認識処理装置、テンプレート作成方法及びプログラム |
US10621751B2 (en) * | 2017-06-16 | 2020-04-14 | Seiko Epson Corporation | Information processing device and computer program |
WO2019075278A1 (en) * | 2017-10-11 | 2019-04-18 | Patrick Baudisch | SYSTEM AND METHOD FOR HANDLING ASSETS FOR MANUFACTURING |
US10552665B2 (en) | 2017-12-12 | 2020-02-04 | Seiko Epson Corporation | Methods and systems for training an object detection algorithm using synthetic images |
FI129042B (en) | 2017-12-15 | 2021-05-31 | Oy Mapvision Ltd | Computer vision system with a computer-generated virtual reference object |
US10970425B2 (en) | 2017-12-26 | 2021-04-06 | Seiko Epson Corporation | Object detection and tracking |
DE102018200750A1 (de) | 2018-01-18 | 2019-07-18 | Elektrobit Automotive Gmbh | Zweidimensionale Gitterstrukturrepräsentation einer dreidimensionalen Umwelt |
US11562505B2 (en) | 2018-03-25 | 2023-01-24 | Cognex Corporation | System and method for representing and displaying color accuracy in pattern matching by a vision system |
US10311833B1 (en) | 2018-03-27 | 2019-06-04 | Seiko Epson Corporation | Head-mounted display device and method of operating a display apparatus tracking an object |
US10769437B2 (en) * | 2018-04-10 | 2020-09-08 | Seiko Epson Corporation | Adaptive sampling of training views |
US10878285B2 (en) | 2018-04-12 | 2020-12-29 | Seiko Epson Corporation | Methods and systems for shape based training for an object detection algorithm |
US10967507B2 (en) * | 2018-05-02 | 2021-04-06 | X Development Llc | Positioning a robot sensor for object classification |
CN110555219B (zh) * | 2018-05-31 | 2022-12-27 | 首都航天机械公司 | 一种基于图像识别的三维cad模型相似性检索系统及方法 |
CN108898585B (zh) * | 2018-06-15 | 2024-01-12 | 广州大学 | 一种轴类零件检测方法及其装置 |
EP3755970A4 (en) * | 2018-09-03 | 2021-11-24 | ABB Schweiz AG | ROBOT SYSTEM MANAGEMENT METHOD AND APPARATUS |
US10634918B2 (en) | 2018-09-06 | 2020-04-28 | Seiko Epson Corporation | Internal edge verification |
CN109887030A (zh) * | 2019-01-23 | 2019-06-14 | 浙江大学 | 基于cad稀疏模板的无纹理金属零件图像位姿检测方法 |
CN113822924B (zh) * | 2019-01-28 | 2024-04-05 | 弗劳恩霍夫应用研究促进协会 | 空间中的元素定位 |
US10943401B2 (en) | 2019-02-01 | 2021-03-09 | International Business Machines Corporation | Active visual recognition in mobile augmented reality |
CN109981346B (zh) | 2019-02-21 | 2020-07-10 | 清华大学 | 基于自治系统的网络空间坐标系创建方法及装置 |
JP7233261B2 (ja) * | 2019-03-13 | 2023-03-06 | キヤノン株式会社 | 3次元測量装置、撮像装置、制御方法及びプログラム |
US11527012B2 (en) | 2019-07-03 | 2022-12-13 | Ford Global Technologies, Llc | Vehicle pose determination |
WO2021012122A1 (zh) * | 2019-07-19 | 2021-01-28 | 西门子(中国)有限公司 | 机器人手眼标定方法、装置、计算设备、介质以及产品 |
US10853631B2 (en) | 2019-07-24 | 2020-12-01 | Advanced New Technologies Co., Ltd. | Face verification method and apparatus, server and readable storage medium |
CN110487789B (zh) * | 2019-08-12 | 2020-03-17 | 中国矿业大学(北京) | 基于磨片装置的岩石细观结构三维重建系统及方法 |
CN110751189B (zh) * | 2019-09-26 | 2022-02-22 | 北京航空航天大学 | 一种基于感知对比度和特征选择的椭圆检测方法 |
CN110660104A (zh) * | 2019-09-29 | 2020-01-07 | 珠海格力电器股份有限公司 | 工业机器人视觉识别定位抓取方法、计算机装置以及计算机可读存储介质 |
CN110706357B (zh) * | 2019-10-10 | 2023-02-24 | 青岛大学附属医院 | 导航系统 |
CN110705552B (zh) * | 2019-10-11 | 2022-05-06 | 沈阳民航东北凯亚有限公司 | 行李托盘识别方法及装置 |
CN111079565B (zh) * | 2019-11-27 | 2023-07-07 | 深圳市华汉伟业科技有限公司 | 视图二维姿态模板的构建方法及识别方法、定位抓取系统 |
TWI724696B (zh) | 2019-12-18 | 2021-04-11 | 財團法人工業技術研究院 | 工件孔洞量測方法 |
US11023730B1 (en) | 2020-01-02 | 2021-06-01 | International Business Machines Corporation | Fine-grained visual recognition in mobile augmented reality |
CN111275813B (zh) * | 2020-01-20 | 2021-09-17 | 北京字节跳动网络技术有限公司 | 数据处理方法、装置和电子设备 |
CN113283442B (zh) * | 2020-02-19 | 2024-05-10 | 北京四维图新科技股份有限公司 | 特征点的提取方法和装置 |
US20210279967A1 (en) * | 2020-03-06 | 2021-09-09 | Apple Inc. | Object centric scanning |
US11586844B2 (en) | 2020-03-30 | 2023-02-21 | Wipro Limited | Method and system for detecting and tracking objects in a rotational environment |
CN111540012B (zh) * | 2020-04-15 | 2023-08-04 | 中国科学院沈阳自动化研究所 | 一种基于机器视觉的光照鲁棒的平面上物体识别定位方法 |
CN111915632B (zh) * | 2020-07-26 | 2024-04-26 | 同济大学 | 一种基于机器学习的贫纹理目标物体真值数据库构建方法 |
US11597078B2 (en) * | 2020-07-28 | 2023-03-07 | Nvidia Corporation | Machine learning control of object handovers |
US11688142B2 (en) | 2020-11-23 | 2023-06-27 | International Business Machines Corporation | Automatic multi-dimensional model generation and tracking in an augmented reality environment |
CN112767412B (zh) * | 2020-12-31 | 2024-04-12 | 东软睿驰汽车技术(沈阳)有限公司 | 车辆部件级分割方法、装置以及电子设备 |
CN114693798B (zh) * | 2020-12-31 | 2023-12-26 | 北京小米移动软件有限公司 | 机械手控制方法及装置 |
CN112894815B (zh) * | 2021-01-25 | 2022-09-27 | 西安工业大学 | 视觉伺服机械臂物品抓取最佳位姿检测方法 |
CN113313766B (zh) * | 2021-03-09 | 2024-08-20 | 常州龙源智能机器人科技有限公司 | 机器人及其位姿计算方法、位姿计算装置 |
CN113091759B (zh) * | 2021-03-11 | 2023-02-28 | 安克创新科技股份有限公司 | 位姿处理、地图构建方法及装置 |
CA3215196A1 (en) | 2021-04-30 | 2022-11-03 | Ethan Rublee | Real time localization with image data |
CN113781315B (zh) * | 2021-07-21 | 2024-06-18 | 武汉市异方体科技有限公司 | 一种基于多视角的同源传感器数据融合滤波方法 |
KR102605786B1 (ko) * | 2021-08-02 | 2023-11-29 | 한국전자기술연구원 | 구면 좌표계와 관절 특성 정보를 사용한 3차원 절대 좌표 사람 자세 추정 방법 및 시스템 |
KR20230020845A (ko) | 2021-08-04 | 2023-02-13 | 현대자동차주식회사 | 전자장치 및 그의 객체 추적 방법 |
US11941863B2 (en) * | 2021-08-04 | 2024-03-26 | Datalogic Ip Tech S.R.L. | Imaging system and method using a multi-layer model approach to provide robust object detection |
CN114565679B (zh) * | 2022-02-18 | 2024-04-26 | 中国人民解放军63660部队 | 一种基于相机位置的焦距、径向畸变及姿态标定的方法 |
US20240202245A1 (en) * | 2022-12-20 | 2024-06-20 | Autodesk, Inc. | Active and passive querying of spatial recordings |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002245455A (ja) * | 2001-02-16 | 2002-08-30 | Monolith Co Ltd | 多変量空間処理方法および装置 |
JP2006301991A (ja) * | 2005-04-21 | 2006-11-02 | Pulstec Industrial Co Ltd | 座標変換関数の補正方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581672A (en) * | 1991-12-19 | 1996-12-03 | Aerohydro, Inc. | System of relational entities for object-oriented computer-aided geometric design |
EP0686932A3 (en) | 1994-03-17 | 1997-06-25 | Texas Instruments Inc | Computer vision system to search for three-dimensional rectangular objects |
US6526156B1 (en) | 1997-01-10 | 2003-02-25 | Xerox Corporation | Apparatus and method for identifying and tracking objects with view-based representations |
JP4341135B2 (ja) | 2000-03-10 | 2009-10-07 | コニカミノルタホールディングス株式会社 | 物体認識装置 |
US6580821B1 (en) | 2000-03-30 | 2003-06-17 | Nec Corporation | Method for computing the location and orientation of an object in three dimensional space |
US6956569B1 (en) | 2000-03-30 | 2005-10-18 | Nec Corporation | Method for matching a two dimensional image to one of a plurality of three dimensional candidate models contained in a database |
US7062093B2 (en) * | 2000-09-27 | 2006-06-13 | Mvtech Software Gmbh | System and method for object recognition |
EP1193642B1 (en) * | 2000-09-27 | 2005-03-30 | MVTec Software GmbH | System and method for object recognition |
CA2354301A1 (en) | 2001-07-27 | 2003-01-27 | Djamel Yahia Meddah | Geometric hashing for model-based recognition of an object |
US7221809B2 (en) * | 2001-12-17 | 2007-05-22 | Genex Technologies, Inc. | Face recognition system and method |
CA2369845A1 (en) | 2002-01-31 | 2003-07-31 | Braintech, Inc. | Method and apparatus for single camera 3d vision guided robotics |
EP1394727B1 (en) | 2002-08-30 | 2011-10-12 | MVTec Software GmbH | Hierarchical component based object recognition |
US7643685B2 (en) * | 2003-03-06 | 2010-01-05 | Animetrics Inc. | Viewpoint-invariant image matching and generation of three-dimensional models from two-dimensional imagery |
US7822264B2 (en) | 2003-08-15 | 2010-10-26 | Scape A/S | Computer-vision system for classification and spatial localization of bounded 3D-objects |
DE102004005380A1 (de) | 2004-02-03 | 2005-09-01 | Isra Vision Systems Ag | Verfahren zur Bestimmung der Lage eines Objekts im Raum |
CN1271863C (zh) * | 2004-04-01 | 2006-08-23 | 复旦大学 | 时间维受限的三维虚拟spiht树组织方法 |
US7145562B2 (en) * | 2004-05-03 | 2006-12-05 | Microsoft Corporation | Integration of three dimensional scene hierarchy into two dimensional compositing system |
EP1766552A2 (en) | 2004-06-23 | 2007-03-28 | Strider Labs, Inc. | System and method for 3d object recognition using range and intensity |
US20060132488A1 (en) * | 2004-12-17 | 2006-06-22 | Electronics And Telecommunications Research Institute | Apparatus and method for representing multi-level LOD three-dimensional image |
EP1693782B1 (en) | 2005-02-21 | 2009-02-11 | Mitsubishi Electric Information Technology Centre Europe B.V. | Method for facial features detection |
-
2007
- 2007-10-11 EP EP07118329A patent/EP2048599B1/en active Active
- 2007-10-11 DE DE602007003849T patent/DE602007003849D1/de active Active
- 2007-10-11 AT AT07118329T patent/ATE452379T1/de not_active IP Right Cessation
- 2007-11-29 CN CN2007101947121A patent/CN101408931B/zh active Active
-
2008
- 2008-02-20 US US12/034,362 patent/US8379014B2/en active Active
- 2008-02-21 JP JP2008040298A patent/JP4785880B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002245455A (ja) * | 2001-02-16 | 2002-08-30 | Monolith Co Ltd | 多変量空間処理方法および装置 |
JP2006301991A (ja) * | 2005-04-21 | 2006-11-02 | Pulstec Industrial Co Ltd | 座標変換関数の補正方法 |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010205095A (ja) * | 2009-03-05 | 2010-09-16 | 3D Media Co Ltd | 3次元物体認識装置、並びに3次元物体認識プログラム及びこれが記録されたコンピュータ読み取り可能な記録媒体 |
JP4649559B2 (ja) * | 2009-03-05 | 2011-03-09 | 株式会社三次元メディア | 3次元物体認識装置、並びに3次元物体認識プログラム及びこれが記録されたコンピュータ読み取り可能な記録媒体 |
JP2012532382A (ja) * | 2009-07-01 | 2012-12-13 | 本田技研工業株式会社 | 3次元モデルを使用した物体認識 |
JP2011129082A (ja) * | 2009-11-20 | 2011-06-30 | 3D Media Co Ltd | 3次元物体認識装置及び3次元物体認識方法 |
JP2011138490A (ja) * | 2009-12-28 | 2011-07-14 | Mitsubishi Electric Research Laboratories Inc | シーンにおける物体の姿勢を求めるための方法 |
WO2012014545A1 (ja) * | 2010-07-27 | 2012-02-02 | 株式会社三次元メディア | 3次元物体認識装置及び3次元物体認識方法 |
JP2012026974A (ja) * | 2010-07-27 | 2012-02-09 | 3D Media Co Ltd | 3次元物体認識装置及び3次元物体認識方法 |
WO2012173141A1 (ja) * | 2011-06-16 | 2012-12-20 | オリンパス株式会社 | 画像処理装置、画像処理方法、およびプログラム |
JP2013002956A (ja) * | 2011-06-16 | 2013-01-07 | Olympus Corp | 画像処理装置、画像処理方法、およびプログラム |
US9275473B2 (en) | 2011-06-16 | 2016-03-01 | Olympus Corporation | Image processing apparatus, image processing method, and program |
JP2013146813A (ja) * | 2012-01-18 | 2013-08-01 | Seiko Epson Corp | ロボット装置および位置姿勢検出方法 |
JP2015032119A (ja) * | 2013-08-01 | 2015-02-16 | セコム株式会社 | 対象検出装置 |
KR20170026591A (ko) * | 2014-09-05 | 2017-03-08 | 인텔 코포레이션 | 카메라 교정 |
KR102268878B1 (ko) * | 2014-09-05 | 2021-06-24 | 인텔 코포레이션 | 카메라 교정 |
JP2017535980A (ja) * | 2014-09-05 | 2017-11-30 | インテル・コーポレーション | カメラキャリブレーション |
JP2019515364A (ja) * | 2016-02-26 | 2019-06-06 | カーネギー メロン ユニバーシティー | テクスチャなし物体の姿勢を推定するシステム及び方法 |
KR20190133223A (ko) * | 2017-04-28 | 2019-12-02 | 윌 비 컴퍼니 리미티드 | 입체물 인쇄 시스템 및 입체물 인쇄 방법 |
KR102269950B1 (ko) | 2017-04-28 | 2021-06-29 | 윌 비 컴퍼니 리미티드 | 입체물 인쇄 시스템 및 입체물 인쇄 방법 |
CN107300100A (zh) * | 2017-05-22 | 2017-10-27 | 浙江大学 | 一种在线cad模型驱动的级联式机械臂视觉引导逼近方法 |
JP2019032820A (ja) * | 2017-06-16 | 2019-02-28 | ダッソー システムズDassault Systemes | 画像を入力とする関数を学習するためのデータセット |
WO2020008936A1 (ja) * | 2018-07-06 | 2020-01-09 | キヤノン株式会社 | 画像処理装置、画像処理方法、システム、物品の製造方法 |
WO2021002249A1 (ja) * | 2019-07-01 | 2021-01-07 | 株式会社小松製作所 | 学習済みの作業分類推定モデルの製造方法、学習用データ、コンピュータによって実行される方法、および作業機械を含むシステム |
CN113825879A (zh) * | 2019-07-01 | 2021-12-21 | 株式会社小松制作所 | 学习完成的作业分类推断模型的制造方法、学习用数据、由计算机执行的方法、以及包括作业机械的系统 |
JP2021086449A (ja) * | 2019-11-28 | 2021-06-03 | 株式会社日立製作所 | モデル作成装置及びモデル作成方法 |
JP7362453B2 (ja) | 2019-11-28 | 2023-10-17 | 株式会社日立製作所 | モデル作成装置及びモデル作成方法 |
KR102249769B1 (ko) * | 2019-12-06 | 2021-05-12 | 주식회사 모빌테크 | 2차원 영상의 픽셀별 3차원 좌표값 추정 방법 및 이를 이용한 자율주행정보 추정 방법 |
KR102518014B1 (ko) * | 2022-09-16 | 2023-04-06 | 흥일기업주식회사 | 부품 스캔 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
ATE452379T1 (de) | 2010-01-15 |
CN101408931A (zh) | 2009-04-15 |
JP4785880B2 (ja) | 2011-10-05 |
CN101408931B (zh) | 2013-02-20 |
DE602007003849D1 (de) | 2010-01-28 |
US20090096790A1 (en) | 2009-04-16 |
EP2048599A1 (en) | 2009-04-15 |
EP2048599B1 (en) | 2009-12-16 |
US8379014B2 (en) | 2013-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4785880B2 (ja) | 三次元オブジェクト認識のためのシステムおよび方法 | |
CN110288657B (zh) | 一种基于Kinect的增强现实三维注册方法 | |
JP6011102B2 (ja) | 物体姿勢推定方法 | |
JP4677536B1 (ja) | 3次元物体認識装置及び3次元物体認識方法 | |
CN113178009B (zh) | 一种利用点云分割和网格修补的室内三维重建方法 | |
US7522163B2 (en) | Method and apparatus for determining offsets of a part from a digital image | |
Azad et al. | Stereo-based 6d object localization for grasping with humanoid robot systems | |
CN111079565B (zh) | 视图二维姿态模板的构建方法及识别方法、定位抓取系统 | |
CN113012293A (zh) | 石刻模型构建方法、装置、设备及存储介质 | |
CN115345822A (zh) | 一种面向航空复杂零件的面结构光自动化三维检测方法 | |
GB2512460A (en) | Position and orientation measuring apparatus, information processing apparatus and information processing method | |
Li et al. | 3D object recognition and pose estimation for random bin-picking using Partition Viewpoint Feature Histograms | |
US9147279B1 (en) | Systems and methods for merging textures | |
Drost et al. | Local hough transform for 3d primitive detection | |
CN114022542A (zh) | 一种基于三维重建的3d数据库制作方法 | |
Fan et al. | Convex hull aided registration method (CHARM) | |
CN115601430A (zh) | 基于关键点映射的无纹理高反物体位姿估计方法及系统 | |
CN104166995B (zh) | 一种基于马步测度的Harris‑SIFT双目视觉定位方法 | |
Pacheco et al. | Reconstruction of high resolution 3D objects from incomplete images and 3D information | |
CN114170284A (zh) | 基于主动标志点投射辅助的多视图点云配准方法 | |
Zhong et al. | Triple screening point cloud registration method based on image and geometric features | |
Azad et al. | Accurate shape-based 6-dof pose estimation of single-colored objects | |
Wu et al. | Photogrammetric reconstruction of free-form objects with curvilinear structures | |
Canelhas | Truncated signed distance fields applied to robotics | |
Zhang et al. | Kinect-based universal range sensor for laboratory experiments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110105 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110405 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110408 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110502 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110628 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110712 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4785880 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |