JP2016031764A - 画像解析方法 - Google Patents

画像解析方法 Download PDF

Info

Publication number
JP2016031764A
JP2016031764A JP2015146739A JP2015146739A JP2016031764A JP 2016031764 A JP2016031764 A JP 2016031764A JP 2015146739 A JP2015146739 A JP 2015146739A JP 2015146739 A JP2015146739 A JP 2015146739A JP 2016031764 A JP2016031764 A JP 2016031764A
Authority
JP
Japan
Prior art keywords
points
point
region
node
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015146739A
Other languages
English (en)
Other versions
JP6091560B2 (ja
Inventor
ミン−トリ ファム
Pham Minh-Tri
ミン−トリ ファム
リカルド ゲラルディ
Gherardi Riccardo
リカルド ゲラルディ
フランク パーベット
Perbet Frank
フランク パーベット
ビョルン ステンガー
Stenger Bjorn
ビョルン ステンガー
サム ジョンソン
Johnson Sam
サム ジョンソン
オリバー ウッドフォード
Woodford Oliver
オリバー ウッドフォード
パブロ アルカンタリラ
Alcantarilla Pablo
パブロ アルカンタリラ
ロベルト シポラ
Cipolla Robert
ロベルト シポラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of JP2016031764A publication Critical patent/JP2016031764A/ja
Application granted granted Critical
Publication of JP6091560B2 publication Critical patent/JP6091560B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/005Tree description, e.g. octree, quadtree
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/35Determination of transform parameters for the alignment of images, i.e. image registration using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/66Analysis of geometric attributes of image moments or centre of gravity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Abstract

【課題】三次元点群を解析する方法であって、最低レベルに複数の葉ノードを含む、【解決手段】階層的な探索木に点を配置することを含む。各葉ノードは三次元点群の点に対応し、探索木は各々にノードを伴う複数の階層レベルを備え、ノードは枝によって階層を通り抜けて互いに垂直的に接続され、子孫ノードの特性の少なくとも1つのモーメントが各ノードに保存される。方法は、領域の中に入る点が最小数のノードによって表されるように、子孫の葉ノードの全てが領域内に含まれる最高レベルのノードを識別し、領域内に完全に含まれるサブツリーのない点に対して葉ノードを選択し、領域内の点を表すノードに統計的演算(識別されたノード内に保存される特性のモーメントから判定される)を行うことによって、領域内に位置する点の幾何学的情報を判定することを含む。【選択図】図3

Description

ここに記述される本発明の実施形態は、一般に画像解析方法およびシステムに関する。
多くのコンピュータ・ビジョンおよび画像処理アプリケーションは、三次元点群からの一群の点の統計的尺度を計算する必要がある。一例は、三次元点群の特徴の検出である。
特徴は、三次元点群によって表わされるシーンの内容のコンパクトな表現を提供する。それらは、シーンのローカル部分だけについて記述し、故に、クラッタ、オクルージョンおよびクラス内変動に対するロバスト性を与える。そのような特性のため、特徴は、オブジェクト認識および位置合わせ、シーン理解、カメラ校正ならびに姿勢推定などの問題に対してよい選択である。特徴の数は点(ポイント)の数よりもはるかに少ないので、データが大きい(つまり、大規模な再構成方法あるいはレーザー・スキャナーからキャプチャーされた)場合には、特徴ベースのアプローチは効率においてポイントベースのアプローチを上回る長所を持つ。
3Dコンピュータ・ビジョン用の特徴ベースのアプローチの応用はユビキタスである。これらは、次のものを含んでいるが次のものに制限されない。オブジェクト認識および位置合わせ、移動ロボット、ナビゲーションおよびマッピング、拡張現実、自動車の自動運転、シーン理解およびモデル化。
3Dオブジェクト認識の目標の一つはシーン内のオブジェクトのリアルタイム検出である。この技術は、3DデータからCADモデルを構築するための基本的な技術のうちの1つである。他の応用例は、ナビゲーション、移動ロボット工学、拡張現実および自動生産である。シーンの一部分だけが観測されるので、カメラから得られた三次元点群からの検出は困難なタスクである。人間は、ほとんど労せずしてオブジェクトを認識する。しかしながら、特に制限のある時間的制約がある場合には、これは依然としてコンピュータ・ビジョンにおける難題である。
3Dオブジェクト認識において1つの重要なステップは、特徴(すなわち、オブジェクトの位置および方向を推定するために使用することのできるシーン内の目立つ領域)を見つけ出して抽出することである。特徴抽出は、他のタスク(例えば、三次元点群位置合わせおよびオブジェクト追跡)にも有用である。
(関連出願の相互参照)
この出願は、2014年7月25日に提出された英国特許出願第1413245.0号に基づいていて、かつ、この優先権の利益を主張するものであって、その全内容が参照によってここに組み込まれる。
図1は、本発明の実施形態に従う方法を行うのに適したコンピュータ・ビジョンシステムの概略図である。 図2は、特徴の表現である。 図3は、実施形態に従う特徴検出方法を図示するフロー図である。 図4(a)は、ツリーノードおよび葉ノードとオーバーラップするクエリを示す図である。図4(b)は、探索木の概略図である。 図5は、探索領域の半径に対して10,000回の半径探索を行うのにかかった時間のプロットである。 図6は、CPUおよびGPUの両方で実行される本発明に従う方法を用いて探索領域の半径に対して100,000回の半径探索を行うのにかかった時間のプロットである。 図7は、実施形態に従う特徴記述子を生成する方法を図示するフロー図である。 図8は、実施形態に従う特徴を抽出して特徴記述子を生成する方法を図示するフロー図である。 図9は、実施形態に従う三次元点群フィルタリング方法を図示するフロー図である。 図10は、実施形態に従う三次元点群サブサンプリング方法を図示するフロー図である。 図11は、実施形態に従う三次元点群の密度推定を図示するフロー図である。 図12は、実施形態に従う、三次元点群から垂線を推定する方法を図示するフロー図である。 図13は、実施形態に従う、三次元点群の面方向を推定する方法を図示するフロー図である。
実施形態によれば、三次元点群を解析する方法が提供される。この方法は、複数の点(ポイント)を含む三次元点群を受け取ることを含む。各点は、画像内の空間的な点を表す。この方法は、最低レベルに複数の葉ノードを含む、階層的な探索木に点を配置することを含む。各葉ノードは三次元点群の点に対応し、探索木は複数の階層レベルを備え、階層レベルの各々にノードを伴い、ノードは枝によって階層間で互いに接続され、子孫ノードの特性の少なくとも1つのモーメントが各ノードに保存される。この方法は、領域の中に入る点が最小数のノードによって表されるように、子孫の葉ノードの全てが領域内に含まれる最高レベルのノードを特定し、領域内に完全に含まれるサブツリーのない点に対して葉ノードを選択し、領域内の点を表すノードに統計的演算を行うことによって、領域内にある点の幾何学的情報を決定することを含む。統計的演算は、識別されたノード内に保存される特性のモーメントから判定される。
上記方法は、点の集合をノードの集合として表し、ツリーは三次元点群から構築される。領域は3Dの球状領域であってよく、この実施形態において、この方法は、球領域の内部に位置する点群の全ての点の集合を発見し、当該集合をノードの集合として返す。この方法によって発見された点の集合は、正確または近似であり得る。
例えば、位置の平均を計算するために、領域に入る全ての点の平均を計算する必要がある。上記方法において、位置の平均を計算することが望まれるならば、探索木の構築時に、ツリーノードの全ての子孫ノードの位置の平均が各ノードに保存される。位置の平均は位置の一次モーメントであって、この場合に位置が特性である。幾何学的情報が計算される際に、可能な場合には、幾何学的情報はノードに保存された平均の値を用いて計算される。故に、この方法は、毎回点の各々について平均を計算するとは限らない。葉ノードそれ自身からの値は、その子孫ノードの全てが領域内に存在するノードが識別できない場合に使用されるに過ぎない。点のグループは、点が下る最高レベルのノードによって記述される。ノードから下る点の一部が領域外にあるならば、当該ノードは使用することができず、より低いレベルのノードが捜し求められる。
特性は、位置、法線ベクトル、カラー、曲率、強度または透明度から選択される少なくとも1つであってよい。
幾何学的情報は、点の数、位置の平均、カラーの平均、法線ベクトルの平均、強度の平均、位置の共分散、法線ベクトルの共分散、カラーの共分散、曲率の分散および強度の分散から選択される1つ以上であってよい。
モーメントは、零次、一次、二次または任意のより高次のモーメントから選択されてよい。
実施形態において、方法は、三次元点群内の全ての点の位置を隣接する点の平均に置き換えることにより三次元点群をフィルタリングするように構成され、隣接する点は領域によって定義される距離の内に入り、幾何学的情報は隣接する点の平均である。
一実施形態において、方法は、三次元点群をフィルタリングするために使用され、ここで点の位置の零次および一次モーメントがノードに保存され、方法は、三次元点群内の全ての点の位置を隣接する点の平均に置き換えることにより三次元点群をフィルタリングするように構成され、隣接する点は領域によって定義される距離の内に入り、幾何学的情報は、零次および一次モーメントから計算された、隣接する点の平均である。
さらなる実施形態において、幾何学的情報は、領域内の点の数であり、方法は、領域のサイズによって除算される領域内の点の数を用いて三次元点群の密度を推定することをさらに含む。
さらなる実施形態において、方法は、領域内の点の数を判定するために使用される。ここで、点の位置の零次モーメントがノードに保存され、幾何学的情報は領域内の点の数であり、方法は、領域のサイズによって除算される、保存された零次モーメントからの領域内の点の数を用いて三次元点群の密度を推定することをさらに含む。
方法は、点または点における面に対する法線を判定する際にも使用されてよく、ここで、点の位置の零次、一次および二次モーメントがノードに保存されてよく、幾何学的情報は三次元点群上で選択された点の法線ベクトルであり、法線ベクトルは、ノード内に保存されたモーメントから、選択された点の周囲の領域内の点の共分散行列を計算することによって判定され、方法は、共分散行列の第3の固有ベクトルから法線を判定することをさらに含む。
点または点のサブセットにおける面の方向が、点の位置の零次、一次および二次モーメントをノードに保存することによって判定されてもよく、幾何学的情報は選択された点における三次元点群の面の法線であり、方向は、ノード内に保存されたモーメントから、選択された点の周囲の領域内の点の共分散行列を計算し、共分散行列の3つの固有ベクトルから方向を導出することによって、判定される。
実施形態において、上記方法は特徴検出に使用される。特徴検出では、領域内の多数の点から幾何学的情報を計算する必要がある。多くのタイプの特徴検出器は、位置または面法線のどちらかの共分散を使用する。共分散は、零次、一次および二次モーメントから計算され、これらのモーメントはツリーの構築時にノードに保存することができる。これら保存されたモーメントは、共分散の判定時に子孫ノードの各々を用いてモーメント計算する必要性を回避するために、特徴検出中にノードから検索することができる。
共分散行列を計算する能力は、特徴位置および特徴記述子の判定において多くの用途がある。ここで、点の位置の零次、一次および二次モーメントがノードに保存され、幾何学的情報は三次元点群内の特徴の位置であり、方法は、選択された点の周囲に定義される領域内の点についてのノード内に保存されたモーメントから共分散行列を計算することと、共分散行列の固有値からスコアを判定することとをさらに含み、特徴は、当該特徴のスコアを基準として、選択された点に位置するとみなされる。
実施形態において、共分散行列は3つの固有値を持ち、最小の固有値がスコアとして割り当てられる。さらなる実施形態において、領域は、第1の半径を持つ第1の球であり、選択された点は、当該点の周囲に第1の球と第2の半径を持つ第2の球とを構築することによって解析され、第2の半径は第1の半径よりも大きく、選択された点についての第2の球の中の三次元点群内の点の各々は、これらの点の周囲に第1の球を構築し、各点についてスコアを計算することによって解析される。ここで、特徴の位置は、第1の球について計算された最大のスコアを伴う点にあると判定される。
上記において、記述子は、特徴が位置する点について判定された第1の球および当該第1の球についての3D方向である。
しかしながら、共分散行列は技術分野において知られている他の記述子を判定するためにも用いられてよく、これらは上記解析方法からの共分散を用いて計算することができる。
これは、オブジェクトの認識/位置合わせに使用することができ、ここでは未知のシーンから抽出された特徴が、既知の、過去に解析されたオブジェクトからの特徴のデータベースと比較される。
上記技法は、特徴および記述子を効率的に抽出するために使用することができるが、他の用法もある。例えば、三次元点群サブサンプリングであって、ここでは上記のフィルタリングされた三次元点群がサンプリングされる。これは、三次元点群の圧縮および可視化のために使用することができる。
さらなる実施形態では、三次元点群を解析するように構成されたシステムが提供され、システムは、複数の点を含む三次元点群を受け取るのに適合した三次元点群受信ユニットを含み、各点は、画像内の空間的な点を表し、システムは、最低レベルに複数の葉ノードを含む、階層的な探索木に点を配置するのに適合したプロセッサを含み、各葉ノードは三次元点群の点に対応し、探索木は複数の階層レベルを備え、当該階層レベルの各々にノードを伴い、ノードは枝によって階層を通り抜けて互いに垂直的に接続され、子孫ノードの特性の少なくとも1つのモーメントが各ノードに保存され、プロセッサは、領域の中に入る点が最小数のノードによって表されるように、子孫の葉ノードの全てが領域内に含まれる最高レベルのノードを識別し、領域内に完全に含まれるサブツリーのない点に対して葉ノードを選択し、領域内の点を表すノードに統計的演算を行うことによって、領域内に位置する点の幾何学的情報を判定および出力するようにさらに適合され、統計的手段は、識別されたノード内に保存される特性のモーメントから判定される。
実施形態において、プロセッサは、GPU(Graphics Processing Unit)である。
さらなる実施形態において、方法は、携帯電話機、タブレットなどのモバイルデバイス上で実装される。方法は、拡張現実アプリケーションなどでの使用のためにオブジェクト認識および位置合わせを提供するために使用することができる。特徴検出、記述、フィルタリング、三次元点群サブサンプリング、方向決定の実施形態および他の実施形態は全て、モバイルデバイス内で実装することができる。
本発明の実施形態はソフトウェアで実装可能なので、本発明の25の実施形態は汎用コンピュータ、モバイル処理デバイスなど(実施形態ではGPUを備える)に、任意の適した伝送媒体で提供されるコンピュータコードを包含する。伝送媒体は、フロッピー(登録商標)ディスク、CD ROM、磁気デバイス若しくはプログラム可能なメモリデバイスなどの任意の記録媒体、または、例えば電気、光学若しくはマイクロ波信号などの任意の信号などの任意の一時的な媒体を備えることができる。
図1は、三次元点群の形式で3Dデータをキャプチャーするために用いることのできる適切なシステムを示す。システムは、基本的に、カメラ35と、解析ユニット21と、ことによるとディスプレイ(図示されない)とを備える。
実施形態において、カメラ35は、標準的なビデオカメラであって、ユーザによって移動可能である。動作中に、カメラ35は、画像化されるオブジェクトの周囲を自由に動かされる。カメラは単にハンドヘルドであってもよい。しかしながら、さらなる実施形態にでは、カメラは三脚または他の機械的な支持器具上に取り付けられる。それから、三次元点群は、様々なカメラ姿勢で収集された2D画像を用いて構築されてもよい。他の実施形態において、3Dカメラまたは他のデプスセンサ(例えば、隔たって据えられた複数の開口を備えるステレオカメラ、オブジェクトにパターンを投影することのできるカメラ、LIDARセンサおよびTOF(Time Of Flight)センサ)が使用されてもよい。CATスキャナおよびMRIスキャナなどの医療スキャナがデータを提供するために使用されてもよい。これらのタイプのカメラおよびスキャナから三次元点群を生成する方法は、既知であってここではこれ以上論じられない。
解析ユニット21は、カメラ35からカメラデータを受信するセクションを備える。解析ユニット21は、プログラム25を実行するプロセッサ23を備える。解析ユニット21は、ストレージ27をさらに備える。ストレージ27は、カメラ35から受信されたデータを解析するためにプログラム25によって使用されるデータを保存する。解析ユニット21は、入力モジュール31および出力モジュール33をさらに備える。入力モジュール31は、カメラ35に接続される。入力モジュール31は単にカメラ35から直接的にデータを受信するかもしれないし、或いは、入力モジュール31は外部記録媒体またはネットワークからカメラデータを受信してもよい。
使用時に、解析ユニット21は、入力モジュール31を通じてカメラデータを受信する。プロセッサ23で実行されるプログラム25は、ストレージ27に保存されたデータを用いてカメラデータを解析し、3Dデータを生成してオブジェクトおよびそれらの姿勢を認識する。ディスプレイ(図示されない)またはローカルの若しくはネットワーク化された他の出力デバイスに接続され得る出力モジュールを介して、データは出力される。
図1は全くの概略であって、システムは、携帯電話機、タブレットなどのカメラ(例えば、カメラは3Dデータを得るために方々動かされ得る)が内蔵カメラであるモバイルデバイス内で提供され得る。或いは、データはモバイルデバイスに送信され得る。さらなる実施形態において、システムは、腕時計、および/または、ヘッドウェア、バイザーなどのウェアラブルテクノロジにおいて提供され得る。
解析ユニットは、多くのタスクを扱うように構成され得る。画像内の特徴を検出するタスクが図2乃至3を参照して記述される。特徴は、オブジェクトの関心領域であって通常はオブジェクトのプロファイルに変化がある所である。特徴を検出することは、オブジェクト認識および位置合わせ、ナビゲーションおよびマッピング、シーン理解およびモデリングなどの多くの3Dアプリケーションにおいて重要なステップである。図2は、特徴として識別されたオブジェクトのコーナーの概要を示す。
三次元点群のために多くの特徴検出器が存在する。これらの検出器の一部は、シーン内で観察される点の近辺に位置する点または面法線のいくついかの統計量の抽出に依存する。
実施形態において、解析に適した点を識別するために、クエリが球領域として提供される。解析用の点を識別するために、探索木構造が構築され点にインデックスが付けられる。図2のフロー図では、ステップS101において、三次元点群が図1を参照して記述されたタイプの装置から受信される。
ステップS103において、三次元点群の点にインデックスを付けるために探索木が構築される。多くの様々な方法論が、例えばOctreeまたはKDTreeなどの探索木を構築するために使用可能である。いくつかの実施形態では、ノード毎に、当該ノードで生じる2つのグループの値同士の距離が最大となるように選択された、2つの枝にツリーが分割される。
この実施形態において、ステップS105では、値が探索木のノードに保存される。値の正確な性質は、アプリケーションに依存し、後により詳細に説明される。しかしながら、各ノードにおいて、ノードから下る三次元点群の全ての点に関連した特性のモーメントがノード内に保存される。例えば、探索木の構築時に、行われる解析が、例えば、面法線、カラーなどの点の特性の共分散を必要とするならば、全ての子孫ノードについて計算された特性の共分散がノードに保存される。各ノードは、それ自身のサブツリーのためのルートノードを当該サブツリーが全ての子孫の点(子孫ポイント)を備える所に形成する。
ステップS107では、クエリの球領域(クエリボール領域)Rが設定される。一実施形態では、球のサイズは固定される。他の実施形態では、球のサイズは変化する。この特定の例では、簡単にするために、単一の球サイズが仮定される。
次に、実施形態において、分枝限定法が、球内に位置する端点(エンドポイント)までツリー内を探索するために用いられる。この実施形態において、子孫の葉ノードが全て領域内に含まれる場合に、最高レベルのサブツリーが識別されるように、領域Rの中に完全に入るサブツリーが特定される。
サブツリーが領域内に完全には含まれないためサブツリーを特定することができない場合には、点を表す葉ノードが選択される。従って、領域の中に入る点は、最小数のノードで表現される。
領域R内のノードの判定は、ステップS109で行われる。これは、図4を参照してより詳細に説明される。図4(b)では、探索木が、最高レベルに2枝に分かれるルートノードC1を備えて示される。2つの枝の各々は、ノードC2およびC3でそれぞれ終わる。ノードC2は、さらに再分割され、子孫の葉ノードC4およびC5を持つ。ノードC3は、さらに再分割され3つの葉ノードC6、C7およびC8で終わる。
図4(a)は、C1乃至C8とマーク付けされた葉ノードおよびツリーノードと共にサーチクエリQの概略を示す。点C4はQの外にあるので、ルートノードC1からの木全体が完全にはサーチクエリQの中に含まれていないことが分かる。しかしながら、ノードC3からのサブツリーは、サーチクエリQの中に完全に含まれている。故に、ノードC3は、3つの子孫ノードC6、C7およびC8を表現するために使用可能である。
葉ノードC5は、サーチクエリQの中に完全に含まれているサブツリーに属さない。故に、この点は、葉ノードC5によってのみ表現することができる。
上に説明されたように、ノードは、それらの子孫の葉ノードのモーメントを保存する。
図3の実施形態は、キーポイント検出器に関する。ハリス(Harris)法は、コーナーおよびエッジをベースとする方法であって、このタイプの方法は水平および垂直方向におけるそれらの激しい強度変化によって特徴付けられる。3Dに適応させる場合に、画像勾配は面法線によって置き換えられる。共分散行列C(x)は、定義済みの半径rと共に、三次元点群の各点x∈Rを中心に置く球領域に位置する点の面法線から計算される。それから、キーポイント応答は次のように定義される。
ここで、kは正の実数値のパラメータである。このパラメータは、弱いエッジの大きさと強いエッジの大きさとの比率の下限としておよそ役立つ。さらに、ハリス3Dキーポイント検出器の2つの他の変形がある。ロウ(Lowe)法は、以下の応答を用いる。
ノーブル(Noble)法は、以下の応答を用いる。
KLT(Kanade−Lucas−Tomasi)検出器では、3Dに適応させるために、面法線の代わりに入力3D位置から直接的に共分散行列が計算される。キーポイント応答のために、共分散行列の第1の固有値が用いられる。
いわゆるSIFTキーポイント検出器は、キーポイントを選択するためにヘッシアンの3Dバージョンを用いる。確率密度関数f(x)は、空間内でデータを規則的にサンプリングすることで近似される。確率密度関数上にスケール空間が構築され、ヘッセの行列式の極大値を求めて探索がなされる。入力三次元点群は、スケールの増加と共に多数のガウシアンフィルタを用いて畳み込まれる。少数のDoG(Difference−of−Gaussian)クラウドをもたらすために、隣接する平滑化されたボリュームが差し引かれる。キーポイントは、スケール中のDoGクラウドの極小値/極大値として識別される。
ISS(Intrinsic Shape Signatures)は、領域状の(region−wise)品質尺度に依存する。この方法は、最小の固有値の大きさ(クエリの球領域内に位置し、それぞれの主要な方向に沿って大きな変動を備える点のみを含めるために)および2つの連続した固有値同士の比率(主要な方向に沿って同様の広がりを持つ点を除外するために)を用いる。上記方法のように、所与の球領域内部に位置する点を探索するアルゴリズムが必要となる。
上記のものは、キーポイントまたは特徴の検出方法の例である。それらの各々は、領域Rの中に入る点の共分散行列の計算を必要とする。ステップS109では、領域Rの中に入るノードが識別される。
第1に、半径探索として所与のクエリボール領域内部の点を見つけ出すアルゴリズムを考慮する。このアルゴリズムは、3Dの点pおよび半径r>0を入力として取り、三次元点群の点のリストX={x,...,x}(ここでnは返される点の数である)を出力として返す。
ステップS109に関して論じられた方法では、根源的な木の各ノードは三次元点群の部分集合を定義し、これは所与のノードの子孫である葉ノードの点全ての集合である。
,...,cがノード(いくつかのmについてm<n)表し、ノードcの葉ノードの点の集合をP(c)によって示すとする。部分集合Xは、ノードのいくつかの集合C={ci1,...,cik}についての和集合P(ci1)∪...∪P(cik)として同等に表現することができる。実際には、Cの要素数(すなわちk)は、Xの要素数(すなわちn)よりも相当に少ないので、半径探索アルゴリズムがXの代わりにCを返し、かつ、Xの代わりにCに基づく統計量が計算されるならば、効率は改善される。
Cに基づく統計量の計算は可能であるが、さらなるステップが必要となる。説明の容易さのために、目標は、点(すなわちX)の統計量を計算することであると仮定される。一旦この例が説明されて、この思想の他の種類の幾何学的情報(例えば、面法線)への拡張が説明される。
点の数、点の平均、および、Xの点の共分散行列は、それぞれn、u、Cでそれぞれ示される。以下の量を定義する。
平均および共分散は、以下の数式を介して間接的に計算することができる。
故に、残りはCからm(X)およびM(X)を計算することである。これら2つの量はいくつかの点の量の和であって、和は結合演算子であるから、それらは以下の式によって計算することができる。
故に、量m(P(c))およびM(P(c))がノードc毎に計算されるならば、これらの量を合計することでクエリ毎にCからXの点統計量を計算することができる。
次のアルゴリズムによって以下のものが実装可能である。
各サーチクエリは木構造を変更しないので多数のクエリを並列的に取り扱うことができる点に注目すべきである。これは、GPUにタスクをロードすることによって、タスクがさらに加速されることを可能にする。
上記例は、ノードに保存される点の統計量を使用した。しかしながら、上述のように、点の任意の幾何学的特性が、同じやり方、ならびに、このノードに保存される特性の必要なモーメントで、上で説明されたように計算を削減するために使用可能である。例えば、零次モーメント(すなわち点の数)が計算されノードに保存されてよく、任意の特性の一次モーメントが例えば平均値を計算するためにノードに保存されてよい。さらなる実施形態では、二次モーメントが共分散などを計算するために保存されてよい。さらなる次数のモーメントが計算されてノードに予め保存されてもよい。
図3のフローチャートは特徴検出に関し、ステップS111において特徴検出に必要な統計量が計算される。使用される正確な統計量は、使用される実際の方法に依存し、適切な例が上に与えられた。例えば、ISS法が用いられるならば、共分散行列が構築される。これは、上述のようにノードの点または面法線の位置の二次モーメントを予め計算することによって達成される。
1つの領域について、一旦これがなされると、画像全体が解析されたかどうかが判定されるステップS113へと方法は進む。さらなる領域があるならば、新たな領域Rが設定され、評価されるノードが決定される所から手続きが再び仕上げられる。実施形態において、各領域は、所与の半径を持ち、三次元点群/画像の点を中心に置く球体として定義される。全ての点および全ての半径が解析された時に、画像全体が解析されたと判定される。
いくつかの実施形態において、領域のサイズは固定される。他の実施形態において、領域Rの半径が最適化される。ここで、ステップS109以降の処理は、同一の点を中心に置くが異なる半径を持つ領域のために繰り返される。実施形態において、これは、スコア(例えば、領域内に位置する点の共分散行列の第3の固有値によって判定される当該領域の点の「コーナーらしさ(cornerness)」)を計算することによって達成される。特徴検出では、隣接する領域の全てよりも高く得点する領域が選択される。
実際には、以下の条件の双方が満足されるならば2つの球領域は互いに隣接するとみなされる。
− 2つの半径同士の比が1/αとαとの間である。ここで、αは大抵1.5に設定される。
− 2つの球の中心間距離が、大きい方の球の半径のβ倍未満である。βは、大抵0.8に設定される。
これは、同一の半径が全ての球領域について固定されるケース、および、半径が球領域毎に変化するケースの双方に適用される。両ケースにおいて、球領域は、そのスコアがその隣接する球領域の全てのスコアよりも高いならば、維持されるだけである。半径が変えられるケースにおいて、実施形態では点あたりの半径が最適化されない点に注意されたい。寧ろ、様々な半径および様々な点で全ての球領域が計算される。それから、隣接する球領域と比較して最高のスコアを持つ球領域が維持される。
上記方法が、GLSL(OpenGL Shading Language)を使用し、CPUおよびGPUを用いてテストされた。それぞれ異なるオブジェクトを表現する、テスト用の10個の入力三次元点群が、東芝オブジェクト認識データセットから採用された。三次元点群あたりの点の数は、80000個から150000個までに及ぶ。
三次元点群の点から均等にサンプリングされた中心および0から25cmまで変化する半径を備えるクエリの球領域がランダムに生成された。上記方法は、必要とされる処理時間が少ない。上記方法から得られる、クエリの球領域の半径に亘る平均処理時間のプロットが図5に図示される。興味深いことに、半径が増加するにつれて、ノードの数が実際には減少するので上記方法の速度は減少し始める。
極値では、半径が非常に大きいので全ての点がクエリの球領域に含まれ、上記方法は1つのノード(すなわち、ルートノード)のみを訪れ(visit)る。
上記方法のCPUバージョンをGPUバージョンと比較すると、図6に図示されるように、GPUバージョンは8−13倍速度を改善することが示される。
それは統計的な特徴検出の高速な抽出方法を提供することが上記例から分かる。この方法は特徴検出の効率を改善し、これは大規模データに非常に有用である。
上記方法では、探索木が構築され、所与の球領域内の点がその位置を捜し当てられる。しかしながら、上記方法においてノード毎に、当該ノードの子孫の葉ノードに位置する全ての点がさらに識別される。次に、包含球(バウンディングボール;全ての点を内部に含んでいる球)と、ノード毎のこれらの点からのモーメント・セットとが予め計算される。所与の球領域から幾何学的情報を抽出する場合に、ノードの最小セットの点がクエリの球領域の内部に位置する同一の点集合(ポイントセット)であるように、包含球はノードの最小のセットを素早く識別するために使用される。幾何学的情報は、それから、クエリの球領域なの内部の点集合からではなく識別されたノードのモーメントから間接的に抽出される。
上記方法の処理速度は、クエリごとに発見された点の数には依存せず、発見されたノードの数に依存する。しかしながら、ノードの数は点の数に比べて実際にははるかに少なく、効率における相当な利得につながる。
三次元点群が大きくなるほど、上記方法に見られる速度の利得は大きくなる。例えば、クエリの球領域が三次元点群の全ての点を覆うほど大きいならば、上記方法は、クエリの球領域における全ての点に対立するものとして単一のノードを返す。このケースでの利得はN倍(ここで、Nは三次元点群の点数である)になり得る。
上記の記述は特徴検出に関するが、この方法は特徴記述子の構築に適用することもできる。
図7は、実施形態に従い、特徴記述子を生成し、および/または、特徴を抽出する、方法を図示するフロー図である。いかなる不要な反復も避けるために、類似の特徴を示すために類似の参照番号が使用される。
図3を参照して説明されたフロー図の場合のように、ステップS101では三次元点群が得られる。ステップS103では、三次元点群の点にインデックスを付けるために探索木が構築される。
ステップS205において、特性のモーメントが各ノードに保存され、特性のモーメントが保存されたノードから下る全てのノードに基づいてモーメントが計算される。この処理は図3のステップS105を参照してより詳細に説明される。この実施形態では、特徴記述子を判定するために、位置の零次、一次、および二次モーメントがノードに保存される。
ステップS207では、画像の領域Rが解析されるために設定される。記述子を構築する場合に、これは点xのあたりの設定サイズであるかもしれない。
ステップS209では、評価されるノードが決定される。この処理は図3のステップS109を参照して記述された処理と同じである。
実施形態では、ステップS205を参照して説明されたようなノードに保存されたモーメントを用いて、ステップS211において共分散行列を計算することによって記述子が決定されてもよい。記述子は、ステップS213において決定される。
ステップS215では、解析が完了したかどうかを調べるためにチェックが行われる。完了していなかったならば、ステップS217において新たな領域が選択され、ステップS209においてこの領域内のノードが評価され、処理を繰り返す。
例えば、特徴の位置が点xとして既に抽出されていたならば、処理は点xを順に踏むことができる。
図8は、特徴の抽出および検出の両方のための方法のフロー図である。いかなる不要な反復も避けるために、類似の特徴を示すために類似の参照番号が使用される。
図3を参照して説明されたフロー図の場合のように、ステップS101では三次元点群が得られる。ステップS103では、三次元点群の点にインデックスを付けるために探索木が構築される。
ステップS255では、特性のモーメントが各ノードに保存され、特性のモーメントが保存されたノードから下る全てのノードに基づいてモーメントが計算される。この処理は、図3のステップS105を参照してより詳細に説明される。この実施形態では、特徴抽出および記述子の生成のために、位置の零次、一次、および二次モーメントが保存される。
ステップS257では、点xが三次元点群から選択される。結局、三次元点群内の全ての点についてこの方法が行われる。
ステップS259において、点xについて、xを中心に置き固定の半径rを持つ第1の球B(x)と、同様にxを中心に置き固定の半径rを持つ第2の球B(x)とが構築される。ステップS261では、球B(x)毎に、3D方向R(x)およびスコアf(x)が計算される。
実施形態において、特徴抽出方法は、相対的に同じサイズのオブジェクト(すなわち、それらの外観は既知の半径rの3D球によって境界を定められ得る)を認識するために用いられる。ここで、rはrのγ倍(ここでγは大抵0.3に設定される)に決定され、rはrのβ倍(ここでβは大抵0.8に設定される)に決定される。γおよびβの値は必要に応じて変更することができる。
所与の点xについての3D方向R(x)およびスコアf(x)は、B(x)内部に位置する点の数n(x)、B(x)内部に位置する全ての点の位置の平均m(x)および共分散行列C(x)を計算することによって、計算される。点数は、保存された零次モーメントから判定することができる。
共分散行列の3つの固有値v(x)、v(x)およびv(x)は、それらの関連する固有ベクトルe(x)、e(x)およびe(x)と共に、計算されて降順にソートされる。固有ベクトルe(x)毎(ここでi=1,...,3)に、e(x)およびm(x)−xのドット積が負値であるならばe(x)=−e(x)と設定することによりその方向が反転される。3つの固有ベクトルは、それから、3D方向:R(x)=(e(x),e(x),e(x))として割り当てられる。
次に、第3の固有値v(x)がスコアf(x)として割り当てられる。直観的には、スコアf(x)はB(x)の点の面がどのくらい厚いかを示す。この方法によって検出される特徴は、大抵は、コーナー、エッジ、および、2つ以上のオブジェクトの交差する領域に対応する。
ステップS263において、B(x)内部に位置する全ての隣接する点に比べてスコアf(x)が大きい点xが選択される。ステップS265では、選択された特徴がロバストであるかどうかチェックされる。実施形態では、以下の要件を満足しない特徴は削除される。
・n(x)≦θ:(θのデフォルト値は5である)B(x)の点の数が少なすぎる。
・v(x)/v(x)≦θ:(θのデフォルト値は0.95である)v(x)がv(x)に近すぎることはe(x)およびe(x)の計算を不安定にする。
・v(x)/v(x)≦θ:(θのデフォルト値は0.95である)v(x)がv(x)に近すぎることはe(x)およびe(x)の計算を不安定にする。
ステップS267において、三次元点群の全ての点が解析されたかどうかを調べるためにチェックが行われる。否であるならば、新たな点xがステップS273において選択され、処理はステップS259にループバックする。
上記実施形態の方法は、非常に少ない処理時間を必要とする。それは、現在15フレーム/秒で作動しており、リアルタイムアプリケーションに適している。別の利点は、カラー情報を必要としない点である。故に、それは、カラーが弁別的特徴でない状況(例えば、低テクスチャオブジェクトまたは光の不足した状況でキャプチャーされたオブジェクト)に適している。
図9は、実施形態に従う、三次元点群をフィルタリングする方法を図示するフロー図である。いかなる不要な反復も避けるために、類似の特徴を示すために類似の参照番号が使用される。
図3を参照して説明されたフロー図の場合のように、ステップS101では三次元点群が得られる。ステップS103では、三次元点群の点にインデックスを付けるために探索木が構築される。
ステップS305において、特性のモーメントが各ノードに保存され、特性のモーメントが保存されるノードから下る全てのノードに基づいてモーメントが計算される。この処理は、図3のステップS105を参照してより詳細に説明される。この実施形態において、フィルタリングのために、子孫のノードの位置の平均が保存されるように一次モーメントがノードに保存される。
このフィルタリング方法において、各点が選択され、点の位置が当該点の周囲の領域の平均と置き換えられる。ステップS307において、フィルタリングされる点が選択される。解析される三次元点群内の各点は、処理中にフィルタリングされる。故に、この実施形態において、フィルタリングされる点は順に選択される。
ステップS309では点の周りの領域が設定され、これは当該点あたりを中心に置く球である。この実施形態において、球は固定の半径を持つ。半径は、必要とされるフィルタリングレベルに依存して設定される。半径は、画像化される三次元点群全体について固定される。実施形態において、半径は以下のように決定される。まず、三次元点群の任意の2つの点間の最短の非零距離が、全ての点の組み合わせ(ポイントペア)に網羅的に目を通すことにより確定される。この最短距離をdとする。それから、半径はdのλ倍(ここでλは大抵は5に設定される)に設定される。
ステップS311では、評価されるノードが決定される。この処理は、図3のステップS109を参照して記述された処理と同じである。ステップS313では、ステップS305を参照して説明されたようなノードに保存された一次モーメントを用いて平均が計算される。ステップS315において、各点の位置の値は、計算された平均に置き換えられる。ステップS317では、処理が全ての点について完了したかどうかを調べるためにチェックがなされる。否であれば、ステップS319に新たな点がおいて選択され、ステップS309において当該点の周囲に領域が構築される。それから、処理は、全ての点について完了するまで繰り返される。
上記例では、特性は点の位置である。しかしながら、他の特性を同じ方法で取り扱うことが可能である。例えば、特性として保存されているカラーの一次モーメントを用いて、点のカラーを上述のようにフィルタリングすることが可能である。多数の特性の平均または他の統計的尺度が計算できるように多数の特性のモーメントがノードに保存されてよいことに注意されたい。
他のフィルタリング方法が使用されてもよく、例えば、平均は、ステップS313まで図Bを参照して記述されるように計算されてもよい。しかしながら、ステップS315では、点における特性の平均からの差分が計算されてよい。差分が所定の値よりも大きければ、点は破棄されるか平均値に置き換えられてよい。
図10は、三次元点群サブサンプリングの方法を図示するフロー図である。この方法は、図9を参照して記述されたフィルタリング方法に基づいている。いかなる不要な反復も避けるために、類似の特徴を示すために類似の参照番号が使用される。フィルタリングされた三次元点群がステップS321において生成された後に、フィルタリングされた三次元点群から点がランダムにサンプリングされ、サブサンプリングされた三次元点群を生み出す。
サブサンプリングされた三次元点群はステップS101において受け取られる三次元点群に比べてサンプル数が少ないので、図10を参照して記述される上記方法は三次元点群圧縮方法でもある。
上記例は点のランダムサンプリングに言及したが、他のサンプリング方法が使用可能である。さらに、図Bを参照して記述されたフィルタリング方法は、例えば、点が平均から所定の距離を超えている場合に点の値を平均に置き換えるだけで変更することが可能であるし、平均から所定の距離より大きい点を破棄することもできる。
図11は、三次元点群の密度推定を図示するフロー図である。いかなる不要な反復も避けるために、類似の特徴を示すために類似の参照番号が使用される。
図3を参照して説明されたフロー図の場合のように、ステップS101では三次元点群が得られる。ステップS103では、三次元点群の点にインデックスを付けるために探索木が構築される。
ステップS405において、特性のモーメントが各ノードに保存され、特性のモーメントが保存されるノードから下る全てのノードに基づいてモーメントが計算される。この処理は、図3のステップS105を参照してより詳細に説明される。この実施形態では、密度推定のために、一次モーメントがノードに保存され、故に、子孫ノードの数が各ノードに保存される。
ステップS407において、密度が推定される領域が選択される。ステップS409では、図3のステップS109を参照して記述されたのと同じやり方で、評価されるノードが決定される。それから、ステップS411において、ノードに保存された零次モーメントを用いて領域内の点の総数が計算される。密度を推定するために、ステップS413において領域の体積によって点の数が除算され、ステップS415において密度が出力される。
図12は、三次元点群から法線を推定する方法を図示するフロー図である。いかなる不要な反復も避けるために、類似の特徴を示すために類似の参照番号が使用される。
図3を参照して説明されたフロー図の場合のように、ステップS101では三次元点群が得られる。ステップS103では、三次元点群の点にインデックスを付けるために探索木が構築される。
ステップS505において、特性のモーメントが各ノードに保存され、特性のモーメントが保存されるノードから下る全てのノードに基づいてモーメントが計算される。この処理は、図3のステップS105を参照してより詳細に説明される。この実施形態では、法線推定のために、子孫ノードの点の位置からの零次、一次および二次モーメントが各ノードに保存される。
ステップS507において、法線が計算される点が選択される。ステップS509では、点の周囲に領域が構築される。実施形態において、これは固定の半径を持つ球領域である。実施形態において、半径は以下のように決定される。まず、三次元点群の任意の2つの点間の最短の非零距離が、全ての点の組み合わせに網羅的に目を通すことにより確定される。この最短距離をdとする。それから、半径はdのλ倍(ここでλは大抵は5に設定される)に設定される。
ステップS511において、図3のステップS109を参照して記述されたのと同じ方法で、評価されるノードが決定される。ステップS513では、零次、一次および二次モーメントを用いて領域内の全ての点の共分散行列が計算される。ステップS515では、共分散行列の第3の固有ベクトルが法線として推定される。
ステップS517において、全ての点について処理が行われたかどうかを調べるためにチェックが行われる。否であれば、法線の推定が必要とされるさらなる点が存在し、新たな点がステップS519で選択され、新たな領域が構築されるステップS509へと処理はループバックする。ステップS521において、推定された法線が出力される。
さらなる実施形態において、法線の零次および一次モーメントをノードに保存することにより、法線ベクトルの平均が計算される。
図13は、三次元点群の面の方向の推定方法を図示するフロー図である。いかなる不要な反復も避けるために、類似の特徴を示すために類似の参照番号が使用される。
図3を参照して説明されたフロー図の場合のように、ステップS101では三次元点群が得られる。ステップS103では、三次元点群の点にインデックスを付けるために探索木が構築される。
ステップS605において、特性のモーメントが各ノードに保存され、特性のモーメントが保存されるノードから下る全てのノードに基づいてモーメントが計算される。この処理は、図3のステップS105を参照してより詳細に説明される。この実施形態では、方向推定のために、子孫ノードの点位置からの零次、一次および二次モーメントが各ノードに保存される。
ステップS607では、方向が計算される点が選択される。ステップS609では、領域が点の周囲に構築される。実施形態において、これは固定の半径を持つ球領域である。実施形態において、各点における方向が必要とされる場合に、半径は以下のように決定される。まず、三次元点群の任意の2つの点間の最短の非零距離が、全ての点の組み合わせに網羅的に目を通すことにより確定される。この最短距離をdとする。それから、半径はdのλ倍(ここでλは大抵は5に設定される)に設定される。
特徴の方向を判定することが望まれる場合に、半径は、例えば図8を参照して記述されたタイプの特徴検出方法において決定された球領域から決定することができる。
ステップS611において、評価されるノードは、図3のステップS109を参照して記述されたのと同じやり方で決定される。ステップS613において、保存された零次、一次および二次モーメントを用いて、領域内の全てのポイントの共分散行列が計算される。ステップS615では、方向は、共分散行列の3つの固有ベクトルとして推定される。
ステップS617において、全ての点について処理が行われたかどうかを調べるためにチェックが行われる。否であれば、方向の推定が必要とされるさらなる点が存在し、新たな点がステップS619で選択され、新たな領域が構築されるステップS609へと処理はループバックする。ステップS621において、推定された方向が出力される。
実施形態において、図3乃至13において教示された上記方法のいずれも、例えば携帯電話機、タブレット、ウェアラブルテクノロジなどのモバイルデバイスにおいて実装することができる。係る方法は、例えば拡張現実、ジェスチャ認識、オブジェクト認識、オブジェクト位置合わせ、オブジェクトまたはモバイルデバイスの姿勢推定、ナビゲーションおよび/またはゲームなどの他のアプリケーションの一部を形成できる。
いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な方法およびシステムは、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

Claims (20)

  1. 三次元点群を解析する方法であって、
    前記方法は、複数の点を含む三次元点群を受け取ることを具備し、
    各点は、画像内の空間的な点を表し、
    前記方法は、最下位レベルに複数の葉ノードを含む、階層的な探索木に点を配置することを具備し、
    各葉ノードは前記三次元点群の点に対応し、探索木は複数の階層レベルを備え、当該階層レベルの各々にノードを伴い、ノードは枝によって階層レベル間で互いに接続され、子孫ノードの特性の少なくとも1つのモーメントが各ノードに保存され、
    前記方法は、領域の中に入る点が最小数のノードによって表されるように、子孫の葉ノードの全てが前記領域内に含まれる最上位レベルのノードを特定し、前記領域内に完全に含まれるサブツリーのない点に対しては葉ノードを選択し、前記領域内の点を表すノードに統計的演算を行うことによって、領域内に位置する点の幾何学的情報を判定することを具備し、
    前記統計的演算は、識別されたノード内に保存される特性のモーメントから判定される、
    方法。
  2. 前記特性は、位置、法線ベクトル、カラー、曲率、強度または透明度から選択される少なくとも1つである、請求項1記載の方法。
  3. 前記幾何学的情報は、点の数、位置の平均、カラーの平均、法線ベクトルの平均、強度の平均、位置の共分散、法線ベクトルの共分散、カラーの共分散、曲率の分散および強度の分散から選択される少なくとも1つである、請求項1記載の方法。
  4. 前記モーメントは、零次、一次、二次または任意のより高次のモーメントから選択される、請求項1記載の方法。
  5. 点の位置の零次および一次モーメントが前記ノードに保存され、
    前記方法は、三次元点群内の全ての点の位置を隣接する点の平均に置き換えることにより三次元点群をフィルタリングするように構成され、
    前記隣接する点は、前記領域によって定義される距離の内に入り、
    前記幾何学的情報は、保存された零次および一次モーメントから計算される、前記隣接する点の平均である、
    請求項1記載の方法。
  6. 点の位置の零次モーメントが前記ノードに保存され、
    前記幾何学的情報は、領域内の点の数であり、
    前記方法は、前記領域のサイズによって除算される、保存された零次モーメントからの前記領域内の点の数を用いて三次元点群の密度を推定することをさらに具備する、
    請求項1記載の方法。
  7. 点の位置の零次、一次および二次モーメントが前記ノードに保存され、
    前記幾何学的情報は、三次元点群上で選択された点の法線ベクトルであり、
    前記法線ベクトルは、ノード内に保存されたモーメントから、前記選択された点の周囲の領域内の点の共分散行列を計算することによって判定され、
    前記方法は、前記共分散行列の第3の固有ベクトルから法線を判定することをさらに具備する、
    請求項1記載の方法。
  8. 点の位置の零次、一次および二次モーメントが前記ノードに保存され、
    前記幾何学的情報は、選択された点における三次元点群の面の方向であり、
    前記方向は、ノード内に保存されたモーメントから、前記選択された点の周囲の領域内の点の共分散行列を計算し、前記共分散行列の3つの固有ベクトルから前記方向を導出することによって、判定される、
    請求項1記載の方法。
  9. 点の位置の零次、一次および二次モーメントが前記ノードに保存され、
    前記幾何学的情報は、三次元点群内の特徴の位置であり、
    前記方法は、選択された点の周囲に定義される領域内の点についてのノード内に保存されたモーメントから共分散行列を計算することと、前記共分散行列の固有値からスコアを決定することとをさらに具備し、
    特徴は、当該特徴のスコアを基準として、前記選択されたポイントに位置するとみなされる、
    請求項1記載の方法。
  10. 前記共分散行列は、3つの固有値を持ち、
    最小の固有値が前記スコアとして割り当てられる、
    請求項9記載の方法。
  11. 前記領域は、第1の半径を持つ第1の球であり、
    選択された点は、当該点の周囲に第1の球と第2の半径を持つ第2の球とを構築することによって解析され、
    前記第2の半径は前記第1の半径よりも大きく、
    選択された点についての第2の点の中の三次元点群内の点の各々は、これらの点の周囲に第1の球を構築し、各球について前記スコアを計算することによって解析される、
    請求項9記載の方法。
  12. 特徴の位置は、前記第1の球について計算された最大のスコアを伴う点にあると判定される、請求項11記載の方法。
  13. 識別された特徴について記述子が導出され、
    前記記述子は、特徴が位置する点について判定された第1の球および当該第1の球についての3D方向である、
    請求項9記載の方法。
  14. 点の位置の零次、一次および二次モーメントが前記ノードに保存され、
    前記幾何学的情報は、三次元点群内の特徴の記述子であり、
    前記方法は、
    選択された点の周囲に定義される領域内の点についてのノード内に保存されたモーメントから共分散行列を計算することと、
    前記共分散行列から記述子を判定することと
    をさらに具備する、
    請求項1記載の方法。
  15. 前記方法は、点のマップを解析して領域についての特徴記述子を生み出すために構成され、
    前記特徴記述子は、前記幾何学的情報を含む、
    請求項1記載の方法。
  16. フィルタリングされた三次元点群をサンプリングすることをさらに具備する、請求項5記載の方法。
  17. オブジェクトの認識、および/または、位置合わせの方法であって、
    前記方法は、請求項14の方法に従って三次元点群を解析することを具備し、
    前記方法は、特徴記述子を複数のオブジェクトについての特徴記述子のデータベースと比較することをさらに具備する、
    方法。
  18. フィルタリングされた三次元点群をサンプリングすることを具備し、
    前記フィルタリングされた三次元点群は、請求項5の方法に従って判定される、
    三次元点群圧縮方法。
  19. 三次元点群を解析するように構成されたシステムであって、
    前記システムは、複数の点を含む三次元点群を受け取るのに適合した三次元点群受信ユニットを具備し、
    各点は、画像内の空間的な点を表し、
    前記システムは、最低レベルに複数の葉ノードを含む、階層的な探索木に点を配置するのに適合したプロセッサを具備し、
    各葉ノードは前記三次元点群の点に対応し、探索木は複数の階層レベルを備え、当該階層レベルの各々にノードを伴い、ノードは枝によって階層を通り抜けて互いに垂直的に接続され、子孫ノードの特性の少なくとも1つのモーメントが各ノードに保存され、
    前記プロセッサは、領域の中に入る点が最小数のノードによって表されるように、子孫の葉ノードの全てが前記領域内に含まれる最高レベルのノードを識別し、前記領域内に完全に含まれるサブツリーのない点に対して葉ノードを選択し、前記領域内の点を表すノードに統計的演算を行うことによって、領域内に位置する点の幾何学的情報を判定および出力するようにさらに適合され、
    前記統計的演算は、識別されたノード内に保存される特性のモーメントから判定される、
    システム。
  20. 請求項1の方法を行うようにコンピュータを制御するためのコンピュータ可読命令を搬送する記録媒体。
JP2015146739A 2014-07-25 2015-07-24 画像解析方法 Active JP6091560B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB1413245.0 2014-07-25
GB1413245.0A GB2528669B (en) 2014-07-25 2014-07-25 Image Analysis Method

Publications (2)

Publication Number Publication Date
JP2016031764A true JP2016031764A (ja) 2016-03-07
JP6091560B2 JP6091560B2 (ja) 2017-03-08

Family

ID=51587264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015146739A Active JP6091560B2 (ja) 2014-07-25 2015-07-24 画像解析方法

Country Status (3)

Country Link
US (1) US9767604B2 (ja)
JP (1) JP6091560B2 (ja)
GB (1) GB2528669B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090508A1 (ko) * 2021-11-16 2023-05-25 한국전자기술연구원 비디오 기반 포인트 클라우드 데이터 처리 방법 및 이를 지원하는 전자 장치

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10210430B2 (en) 2016-01-26 2019-02-19 Fabula Ai Limited System and a method for learning features on geometric domains
US10013653B2 (en) * 2016-01-26 2018-07-03 Università della Svizzera italiana System and a method for learning features on geometric domains
CN106296650B (zh) * 2016-07-22 2019-05-24 武汉海达数云技术有限公司 一种激光点云配准方法和装置
CN108510439B (zh) * 2017-02-28 2019-08-16 贝壳找房(北京)科技有限公司 点云数据的拼接方法、装置和终端
CN108133226B (zh) * 2017-11-27 2021-07-13 西北工业大学 一种基于harris改进的三维点云特征提取方法
US10826786B2 (en) * 2018-04-11 2020-11-03 Nvidia Corporation Fast multi-scale point cloud registration with a hierarchical gaussian mixture
CN108765475B (zh) * 2018-05-25 2021-11-09 厦门大学 一种基于深度学习的建筑物三维点云配准方法
WO2020086824A1 (en) * 2018-10-24 2020-04-30 University Of Notre Dame Du Lac Method of textured contact lens detection
CN109712229A (zh) * 2018-11-26 2019-05-03 漳州通正勘测设计院有限公司 一种单株树木骨架点提取方法、装置、设备及存储介质
CN111435551B (zh) * 2019-01-15 2023-01-13 华为技术有限公司 点云滤波方法、装置及存储介质
CN110111378B (zh) * 2019-04-04 2021-07-02 贝壳技术有限公司 一种基于室内三维数据的点云配准优化方法和装置
CN110458772B (zh) * 2019-07-30 2022-11-15 五邑大学 一种基于图像处理的点云滤波方法、装置和存储介质
CN110930382A (zh) * 2019-11-19 2020-03-27 广东博智林机器人有限公司 基于标定板特征点提取的点云拼接精度评估方法及系统
CN111582391B (zh) * 2020-05-11 2022-06-07 浙江大学 基于模块化设计的三维点云离群点检测方法和装置
CN111598915B (zh) * 2020-05-19 2023-06-30 北京数字绿土科技股份有限公司 点云单木分割方法、装置、设备及计算机可读介质
CN111709450B (zh) * 2020-05-21 2023-05-26 深圳大学 一种基于多尺度特征融合的点云法向量估计方法及系统
CN113065014B (zh) * 2020-12-05 2021-12-17 林周容 下滴树油树体类型识别装置及方法
CN115086716B (zh) * 2021-03-12 2023-09-08 腾讯科技(深圳)有限公司 点云中邻居点的选择方法、装置及编解码器
CN113076389A (zh) * 2021-03-16 2021-07-06 百度在线网络技术(北京)有限公司 文章地域识别方法、装置、电子设备及可读存储介质
CN113223062B (zh) * 2021-06-04 2024-05-07 武汉工控仪器仪表有限公司 一种基于角点特征点选取与快速描述子的点云配准方法
CN113487713B (zh) * 2021-06-16 2022-09-02 中南民族大学 一种点云特征提取方法、装置及电子设备
KR20240027182A (ko) * 2022-08-22 2024-03-04 한국전자기술연구원 스트리밍용 포인트 클라우드 압축 시스템 및 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04296985A (ja) * 1990-06-08 1992-10-21 Xerox Corp データ分析用密度集合階層化方法および装置
JPH07254063A (ja) * 1994-03-14 1995-10-03 Mitsubishi Electric Corp 画像処理方法
JP2002133412A (ja) * 2000-10-26 2002-05-10 Ricoh Co Ltd 画像領域検索方法、システム、そのプログラム、及びコンピュータ読み取り可能な記録媒体
JP2006139713A (ja) * 2004-11-15 2006-06-01 Fuji Electric Systems Co Ltd 3次元物体位置検出装置、プログラム
JP2014134856A (ja) * 2013-01-08 2014-07-24 Nec Corp 被写体識別装置、被写体識別方法および被写体識別プログラム
US20150049944A1 (en) * 2013-08-14 2015-02-19 Oracle International Corporation Memory-efficient spatial histogram construction

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4694404A (en) 1984-01-12 1987-09-15 Key Bank N.A. High-speed image generation of complex solid objects using octree encoding
US5963956A (en) * 1997-02-27 1999-10-05 Telcontar System and method of optimizing database queries in two or more dimensions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04296985A (ja) * 1990-06-08 1992-10-21 Xerox Corp データ分析用密度集合階層化方法および装置
JPH07254063A (ja) * 1994-03-14 1995-10-03 Mitsubishi Electric Corp 画像処理方法
JP2002133412A (ja) * 2000-10-26 2002-05-10 Ricoh Co Ltd 画像領域検索方法、システム、そのプログラム、及びコンピュータ読み取り可能な記録媒体
JP2006139713A (ja) * 2004-11-15 2006-06-01 Fuji Electric Systems Co Ltd 3次元物体位置検出装置、プログラム
JP2014134856A (ja) * 2013-01-08 2014-07-24 Nec Corp 被写体識別装置、被写体識別方法および被写体識別プログラム
US20150049944A1 (en) * 2013-08-14 2015-02-19 Oracle International Corporation Memory-efficient spatial histogram construction

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090508A1 (ko) * 2021-11-16 2023-05-25 한국전자기술연구원 비디오 기반 포인트 클라우드 데이터 처리 방법 및 이를 지원하는 전자 장치

Also Published As

Publication number Publication date
GB2528669A (en) 2016-02-03
GB201413245D0 (en) 2014-09-10
JP6091560B2 (ja) 2017-03-08
US9767604B2 (en) 2017-09-19
GB2528669B (en) 2017-05-24
US20160027208A1 (en) 2016-01-28

Similar Documents

Publication Publication Date Title
JP6091560B2 (ja) 画像解析方法
CN110070570B (zh) 一种基于深度信息的障碍物检测系统及方法
US11049267B2 (en) Apparatus, method, and system for alignment of 3D datasets
JP5677798B2 (ja) 3次元シーンにおける3次元物体の認識及び位置姿勢決定方法
US8396284B2 (en) Smart picking in 3D point clouds
US10489977B2 (en) Method for establishing a deformable 3D model of an element, and associated system
CN111723721A (zh) 基于rgb-d的三维目标检测方法、系统及装置
Santos et al. 3D plant modeling: localization, mapping and segmentation for plant phenotyping using a single hand-held camera
Pound et al. A patch-based approach to 3D plant shoot phenotyping
KR20190070514A (ko) 격자지도 생성 장치 및 방법
CN112784873A (zh) 一种语义地图的构建方法及设备
CN112818925A (zh) 一种城市建筑和树冠识别方法
Filipe et al. A comparative evaluation of 3d keypoint detectors
CN110007764B (zh) 一种手势骨架识别方法、装置、系统及存储介质
CN106415606B (zh) 一种基于边缘的识别、系统和方法
CN116229189B (zh) 基于荧光内窥镜的图像处理方法、装置、设备及存储介质
Hafiz et al. Interest point detection in 3D point cloud data using 3D Sobel-Harris operator
CN117292076A (zh) 工程机械局部作业场景动态三维重构方法及系统
CN116921932A (zh) 焊接轨迹识别方法、装置、设备及存储介质
CN113932712A (zh) 一种基于深度相机和关键点的瓜果类蔬菜尺寸测量方法
Prince et al. Multifeature fusion for automatic building change detection in wide-area imagery
Xu et al. Identification of street trees’ main nonphotosynthetic components from mobile laser scanning data
Collazos et al. A photogrammetric system for dendrometric feature estimation of individual trees
JP7085909B2 (ja) 画像処理装置、細胞認識装置、細胞認識方法および細胞認識プログラム
Thisse et al. 3D Dense & Scaled Reconstruction Pipeline with Smartphone Acquisition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170207

R150 Certificate of patent or registration of utility model

Ref document number: 6091560

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250