JP4834177B2 - 回転不変量2dスケッチ記述子 - Google Patents

回転不変量2dスケッチ記述子 Download PDF

Info

Publication number
JP4834177B2
JP4834177B2 JP2010527931A JP2010527931A JP4834177B2 JP 4834177 B2 JP4834177 B2 JP 4834177B2 JP 2010527931 A JP2010527931 A JP 2010527931A JP 2010527931 A JP2010527931 A JP 2010527931A JP 4834177 B2 JP4834177 B2 JP 4834177B2
Authority
JP
Japan
Prior art keywords
sketch
descriptor
rotation invariant
circle
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010527931A
Other languages
English (en)
Other versions
JP2010541095A (ja
Inventor
ラカニエール セバスティアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Industry Software Inc
Original Assignee
Siemens Product Lifecycle Management Software Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Product Lifecycle Management Software Inc filed Critical Siemens Product Lifecycle Management Software Inc
Publication of JP2010541095A publication Critical patent/JP2010541095A/ja
Application granted granted Critical
Publication of JP4834177B2 publication Critical patent/JP4834177B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/421Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/478Contour-based spectral representations or scale-space representations, e.g. by Fourier analysis, wavelet analysis or curvature scale-space [CSS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/11Technique with transformation invariance effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

関連出願との相互関係
本願は、2007年10月3日に提出した係属中の米国仮出願第60/977284号の優先権を主張するものである。
技術分野
ここに説明する本願の有利な実施形態は、一般的にコンピュータグラフィックスソフトウェアアプリケーションに関連するものである。より詳細には本願の実施形態は、2次元スケッチから不変量の記述子を抽出するための方法およびシステムに関する。
背景技術
Aberdeen Group の調査によれば、製品開発では、製造業者の部品のうち30%〜40%が、すでに作製された部品と重複するか、またはすでに作製された部品に置換することができる。Aberdee はさらに、使用可能な重複する部品がある新たな部品を導入するための項目あたりの年間在庫維持費は、4,500〜23,000ドルにもなると言っている。すなわち、製造業者が既存の部品を探すためのツールによって、部品を再利用することにより製品開発が格段に削減される。このようなツールは伝統的には、部品のジオメトリのテキストベースの記述であったが、製品に含まれる部品がより複雑になってきたため、このようなツールではすぐに限界に達した。また、多言語の環境で作業しており、種々の言語間での翻訳によってテキストベースの部品記述の精度が低下した場合にも、さらに制限がかかる。
製品開発のデータ管理の最近の傾向は、上述のテキストベースの記述子を探索することから、その代わりに、部品のジオメトリ自体の探索に移行してきている。このことは、高度な技術的手段を必要とする難しい問題である。その1つの問題に、ユーザは、部品が並進または回転または時にはスケーリングされる場合に部品のジオメトリを不変のものとして見なしたい場合があるという問題がある。
上記の問題を解決するための1つの一般的な手段に、並進または回転またはスケーリング時にそれ自体が不変である記述子をジオメトリから抽出して、該ジオメトリにインデックス付与するのに使用するという手段がある。不変性とは、スケッチの方向に関係なく同じ結果が返ってくることを意味する。スケール不変とは、係数によるスケーリングに対して不変であることを含意するだけである。並進不変量および回転不変量に関しても同様である。このような手段が成功するのは、1つの理由として、作業を以下の2段階に効率的に分けるからである:
(1)記述子をジオメトリから抽出する処理は比較的低速度であるが1回実施するだけでよいオフライン段階。
(2)記述子を比較する処理が非常に高速であるため同様のジオメトリを迅速に検索することができるオンライン段階。これらの一般的な解決手段は、2次元(「2D」)オブジェクトのシルエットを比較して外側の類似性を求める。
ここで、次のような回転不変量スケッチ記述子、すなわち、外側の類似性を含むだけでなく、しばしば重要である内部の類似性も含む回転不変量スケッチ記述子を求めるためのシステム、プロセスおよび方法が必要とされる。
発明の概要
上記の課題を解決するために、広い範囲で記載された本発明の有利な実施形態の目的と関連して、本願で提案する記述子の検出方法では、
扇形内の複数の各ポイントと起点との間の最大距離を計算するステップと、
前記最大距離を開始値として、該複数のポイントのうち1つとターゲット線との間の最小距離を計算するステップと、
前記最小距離から複数のフーリエ係数を計算するステップと、
前記フーリエ係数から不変量記述子を定義するステップと
を実施する。この方法では、前記ターゲット線は同心円である。
本発明の別の有利な実施形態は、
スケッチの起点が平面起点に位置するように該スケッチを並進させる並進ステップと、
前記スケッチのポイントから前記起点までの平均距離が1単位に等しくなるように該スケッチをスケーリングするスケーリングステップと、
前記スケッチから回転不変量の記述子を抽出してスケッチに該回転不変量の記述子によってインデックス付与する記述子抽出ステップと
を実施する、ジオメトリのインデックス付与方法である。前記方法では前記記述子抽出ステップにおいて、扇形内の複数の各ポイントから起点までの最大距離を計算する。また本方法では、前記記述子抽出ステップにおいて、前記最大距離を開始値として、前記複数のポイントのうち1つからターゲット線までの最小距離を計算する。本方法では前記記述子抽出ステップにおいて、前記最小距離から複数のフーリエ係数を計算する。本方法では前記記述子抽出ステップにおいて、前記フーリエ係数から不変量記述子を定義する。この方法では、前記ターゲット線は同心円である。
本発明の別の有利な実施形態は、記述子を求めるためのシステムであって、
複数の2次元スケッチを有するスケッチデータベースと、
前記複数の各2次元スケッチから計算される回転不変量記述子と、
前記回転不変量記述子のインデックスを有する記述子データベースと
を含むシステムである。
さらに本発明の別の有利な実施形態は、
複数の回転不変量記述子を有するデータベースにアクセスし、
相応の回転不変量記述子を有する少なくとも1つのスケッチを探索し、
前記少なくとも1つのスケッチを比較のために取り出す
方法である。
さらに本発明の別の有利な実施形態は、記述子を求めるための方法を実施するために機械読み取り可能媒体に実装されたコンピュータプログラム製品であり、該コンピュータプログラム製品は、
コンピュータが、
・扇形内の複数の各ポイントから起点までの最大距離を計算し、
・前記最大距離を開始値として、該複数のポイントのうち1つからターゲット線までの最小距離を計算し、
・前記最小距離から複数のフーリエ係数を計算し、
・前記フーリエ係数から不変量記述子を定義する
ために動作可能な命令を含む。このコンピュータプログラム製品では、前記ターゲット線は同心円である。
さらに、本発明の有利な実施形態は、ジオメトリにインデックス付与するための方法を実施するために機械読み取り可能媒体に実装されるコンピュータプログラム製品であり、該コンピュータプログラム製品は、
コンピュータが
・スケッチの重心が平面起点に位置するように該スケッチを並進し、
・前記スケッチ上のポイントから前記起点までの平均距離が1単位に等しくなるように該スケッチをスケーリングし、
・前記スケッチから回転不変量記述子を抽出する
ための命令を含む。前記コンピュータプログラム製品において、前記スケッチから前記回転不変量記述子を抽出するための命令はさらに、
コンピュータが
・扇形内の複数の各ポイントから起点までの最大距離を計算し、
・前記最大距離を開始値として、前記複数のポイントのうち1つからターゲット線までの最小距離を計算し、
・前記最小距離から複数のフーリエ係数を計算し、
・前記フーリエ係数から不変量記述子を定義する
ための命令を含む。このコンピュータプログラム製品では、前記ターゲット線は同心円である。
さらに本発明の別の有利な実施形態は、記述子を求めるための方法を実施するために少なくとも1つのプロセッサとアクセス可能なメモリとを含むデータ処理システムであり、該データ処理システムは、
・扇形内の複数の各ポイントから起点までの最大距離を計算するための最大距離計算手段と、
・前記最大距離を開始値として、該複数のポイントのうち1つからターゲット線までの最小距離を計算するための最小距離計算手段と、
・前記最小距離から複数のフーリエ係数を計算するためのフーリエ係数計算手段と、
・前記フーリエ係数から不変量記述子を定義するための不変量記述子定義手段と
を含む。
下記および図面に本発明の有利な実施例の別の利点の一部が記載されており、別の利点の一部は、本発明の有利な実施形態を実施する際に導き出すことができる。ここで本発明の有利な実施例を、図面を参照して説明する。図面も実施例の一部である。もちろん、他の実施例も利用することができ、本発明の範囲を逸脱することなしに変更を行うこともできる。
以下では添付の図面を参照しながら有利な実施形態を説明する。同様の符号は同様の要素を示す。
本発明の実施形態を概説するフローチャートである。 2Dスケッチから記述子を抽出するための処理の概観を示すフローチャートである。 2D回転不変量記述子を強調抽出するための処理を概略的に示すフローチャートである。 rを設定するための本発明の実施形態の処理の概観を示すフローチャートである。 φを計算するための本発明の実施形態の処理の概観を示すフローチャートである。 回転不変量記述子を計算するための本発明の実施形態の処理の概観を示すフローチャートである。 2Dスケッチを示す。 回転不変量記述子を計算するために準備された2Dスケッチを示す。 2つの離散関数の値のグラフである。 本発明の有利な実施形態を実施することができるコンピュータ環境のブロック回路図である。
有利な実施形態の詳細な説明
本発明の多数の革新的な技術思想を、本発明の有利な実施形態を詳細に参照しながら説明する。しかし、このようなレベルの実施例は、本発明の思想の数多くの有利な用途のうちのごく一部の例にしか過ぎないことを理解すべきである。本発明の有利な実施形態はとりわけ、記述子を求めるためのシステムおよび方法を提供する。以下では、本発明の有利な実施例では、汎用のパーソナルコンピュータ等のコンピュータ上でオペレーティングシステムが実行する。図10と以下の説明は、本発明の有利な実施例を実施することができる適切なコンピュータ環境を簡単に一般的に説明するためのものである。これは必須ではないが、パーソナルコンピュータによって実行されるたとえばプログラムモジュール等のコンピュータ実行可能な命令を一般的に仮定して、本発明の実施形態を説明する。一般的なプログラムモジュールは、特定のタスクを実行するかまたは特定の種類の抽象データを具現化するルーティン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。本実施例は、種々の公知のコンピュータ環境のうち任意のコンピューティング環境で実施することができる。
図10を参照すると、本発明の有利な実施形態を実現するための一例のシステムには、複数の関連の周辺装置(図示されていない)を備えた、コンピュータ1000の形態の汎用の計算装置が含まれる。この計算装置は、たとえばデスクトップコンピュータまたはラップトップコンピュータである。コンピュータ1000はマイクロプロセッサ1005とバス1010を有する。このバスは、マイクロプロセッサ1005とコンピュータ1000の複数のコンポーネントとを公知の技術によって接続して通信を行えるようにするために使用される。バス1010は、メモリバスまたはメモリコントローラ、周辺バス、および種々のバスアーキテクチャのいずれかを使用するローカルバスを含むバス構造の複数の種類のうち、任意の種類のバス構造とすることができる。コンピュータ1000は典型的にはユーザインタフェースアダプタ1015有し、これはマイクロプロセッサ1005を、バス1010を介して1つまたは複数のインタフェースデバイス、例えばキーボード1020,マウス1025および/または別のインタフェースデバイス1030と接続する。この別のインタフェースデバイスは、タッチスクリーン、デジタルペン入力パッド等の任意のユーザインタフェースデバイスとすることができる。バス1010はさらに、ディスプレイデバイス1035、例えばLCDスクリーンまたはモニタをマイクロプロセッサ1005に、ディスプレイアダプタ1040を介して接続する。バス1010はまたマイクロプロセッサ1005をメモリ1045に接続する。メモリはROM、RAM等を含むことができる。
コンピュータ1000はさらに、少なくとも1つの記憶デバイス1055および/または少なくとも1つの光学的ドライブ1060をバスに結合するドライブインタフェース1050を備えている。記憶デバイス1055は、ディスクを読み出しおよび書き込みするために図示しないハードディスクドライブ、および/またはリムーバル磁気ディスクドライブを読み出しおよび書き込みするために図示しない磁気ディスクドライブを含むことができる。同様に光学的ドライブ1060も、たとえばCD‐ROMまたは他の光学的媒体等であるリムーバブル光学的ディスクの読み出しまたは書き込みを行うための光学的ディスクドライブを備えることができる。この光学的ディスクドライブは図示されていない。上述のドライブおよび関連のコンピュータ読み出し可能な媒体によって、コンピュータ読み出し可能な命令、データ構造、プログラムモジュール、およびコンピュータ1000のための他のデータを不揮発記憶することができる。
コンピュータ1000は通信チャネル1065を介して他のコンピュータまたはコンピュータのネットワークと通信することができる。コンピュータ1000は、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)内の他のコンピュータに関連づけることができる。またはコンピュータ1000は、他のコンピュータとのクライアント/サーバ構成のクライアントとすることができる。さらに本発明の有利な実施形態は、通信ネットワークによって接続された遠隔の処理装置によってタスクが実行される分散コンピューティング環境でも実施することができる。分散コンピューティング環境では、プログラムモジュールがローカルメモリ記憶デバイスと遠隔のメモリ記憶デバイスの両方に配置される。これらの構成ならびに適切な通信ハードウェアおよび通信ソフトウェアはすべて、当業者に公知である。
本発明の有利な実施形態を実現するソフトウェアプログラミングコードは典型的にはコンピュータ1000のメモリ1045に記憶される。クライアント/サーバ構成では、このようなソフトウェアプログラミングコードを、サーバに所属するメモリにより記憶することができる。ソフトウェアプログラミングコードは、ハードディスクドライブ、ディスケット、CD‐ROM等の種々の不揮発性データ記憶デバイスのうち任意の記憶デバイスに実装することもできる。このコードはこのような媒体で配布することができ、また、1つのコンピュータシステムのメモリから何らかの種類のネットワークを介して別のコンピュータシステムへ配布して、この別のシステムのユーザが使用できるようにすることができる。ソフトウェアプログラミングコードを物理的媒体に実装する技術および手法、および/または、ネットワークを介してソフトウェアコードを配布する技術および手法は公知であり、これ以上詳細には説明しない。
システム
図1は、本発明の実施形態を概説するフローチャートである。Siemens Product Lifecycle Management Software Inc. 社の SolidEdge 等のアプリケーションまたはプログラムから、2次元(2D)スケッチ100またはジオメトリまたはイメージが作成される。図1を参照すると、2Dスケッチ100は典型的には、グラフィックスプログラムによってさらに変更または見るのに使用するために、または全体的に別のプログラムによって使用するために、スケッチデータベース105に記憶される。このスケッチデータベース105は、2Dスケッチ100に関連するユーザ定義記述またはタイトルに基づいて該2Dスケッチ100にインデックス付与することができるが、本願発明において有利には、2Dスケッチ100の記述子に基づいて、特に回転不変量2D記述子に基づいて2Dスケッチ100にインデックス付与する。2Dスケッチ100をスケッチデータベース105から検索し(ステップ150)、該2Dスケッチ100から回転不変量記述子Dを抽出する(ステップ155)。その後、回転不変量記述子Dを記述子データベース100に記憶する(ステップ160)。
2Dスケッチ100は任意の数の方向に方向付けすることができ、たとえば360°またはその分数のうち任意の角度に回転することができるので、ここで重要なのは、関連分野において周知である方向づけにしたがって、たとえば並進不変性、スケール不変性および回転不変性で2Dスケッチ100を正規化することである。図2は、2Dスケッチ100から記述子を抽出するための処理の概観を示すフローチャートである。図2を参照すると、スケッチ起点としても知られている重心が平面起点に位置するように2Dスケッチ100を並進させることにより、並進不変性になるようにする。次に、2Dスケッチ100のポイントからスケッチ起点までの平均距離が1単位に等しくなるように該2Dスケッチ100をスケーリングすることにより、スケール不変性になるようにする。この1単位はスケッチに依存する(ステップ205)。次に、ここで記載した本発明の実施形態を使用して、回転不変量2D記述子を抽出する(ステップ210)。
図3は、2D回転不変量記述子を強調抽出するための処理を概略的に示すフローチャートであり、この処理を以下でより完全に詳述する。図3を参照すると、2Dスケッチ100から開始して、rを該2Dスケッチ100上のポイントと起点との間の最大距離に設定する(ステップ300)。次にrを使用して、特定のターゲット線の一部分を含む平面の特定の扇形内にある2Dスケッチ100上のポイント間の最小距離の行列であるφを初期化する(ステップ305)。この特定のターゲット線すなわち同心円のこの一部分は、同一の扇形内にある。最後に、φから回転不変量2Dスケッチ記述子を計算する(ステップ310)。
図4は、rを設定するための本発明の実施形態の処理の概観を示すフローチャートである。典型的には2Dスケッチ100は3角形の集合によって表され、Vはスケッチ内の3角形の頂点の集合Sである。VはJ×2行列として表され、j番目の頂点は座標(V[j−1][0],V[j−1][1])を有する。図4を参照すると、Rおよびjを0に初期化する(ステップ400)。次に、xをV[j][0]に等しく設定し、yをV[j][1]に等しく設定し、Dを(x*x+y*y)に設定し、Rを(D,R)の最大値に設定する(ステップ405)。j=j+1にしたがい、jを1だけ増分する(ステップ410)。jが3未満である場合(ステップ415)、ステップ405に戻り、そうでない場合にはrを、以下で図5において計算されるRの平方根に等しく設定する(ステップ420)。S上のポイントと起点との間の最大距離であるrを使用して、φを理論的な最大値に初期化し、ステップ305で詳細に説明したようにφを実際の値に漸増的に修正する。
図5は、φを計算するための本発明の実施形態の処理の概観を示すフローチャートである。図5を参照すると、Mは2のべき乗であり、NおよびKは正の整数であり、φはN×Mの大きさの2次元行列であり、PはK×2の大きさの2次元行列である。もちろん、Kは2Dスケッチ100の良好な近似を得るために十分な大きさでなければならず、50,000または100,000の値が十分であるが、用途または別の要件によってこの値を変えてもよい。初めに、2Dスケッチ100上に均質に分布する複数のランダムなポイントであるP[0]〜P[K−1]を計算する(ステップ500)。ここでは、k番目のポイントは(P[k−1][0],P[k−1][1])の座標を有する。0<n<Nおよび0<m<Mに対し、φ(m)をrに設定する(ステップ505)。kを0に初期化する(ステップ510)。P[k]が起点であるか否かを求め(ステップ515)、そうである場合にはkを1増分する(ステップ520)。kがK以上である場合(ステップ525)、φ(m)は構築されており(ステップ530)、次にこのφ(m)を使用して、回転不変量スケッチ記述子を計算する(ステップ310)。しかし、kがK未満である場合、P[k]が起点であるか否かの問い合わせに戻る。P[k]が起点に等しくない場合(ステップ515)、xをP[k][0]に等しく設定し、yをP[k][1]に等しく設定し、tを(x*x+y*y)0.5に等しく設定し、θを(y/t)の逆正弦に設定する(ステップ535)。yが0未満でない場合(ステップ540)、mをθM/2πの下限に設定する(ステップ545)。yが0未満である場合(ステップ540)、θを2π−θに設定し(ステップ550)、mをθM/2πの下限に設定する(ステップ545)。両ステップ545および550の後に続いて、nを0に設定する(ステップ555)。次にdを、t−(n+1)*r/Nの絶対値に等しく設定する(ステップ560)。その後にφ(m)を、dおよびφ(m)の最小値に設定する(ステップ565)。nを1増分する(ステップ570)。nがN未満である場合(ステップ575)、(ステップ560)に戻り、そうでない場合にはkを1増分する(ステップ520)。上記のステップから、2Dスケッチ100は等しい大きさのM個の扇形に分割され、半径が増大していくN個の同心円が得られる。ここで、円を正方形または多角形等の別のターゲット線に置換できることが知られている。またφ(m)は、(m+1)番目の扇形内に含まれるポイントP(k)の集合を含む、(m+1)番目の扇形と(n+1)番目の円との交わり部分の間の最小距離である。
図6は、回転不変量記述子を計算するための本発明の実施形態の処理の概観を示すフローチャートである。図6を参照すると、Mは1のべき乗であり、NおよびKは正の整数であり、φはN×Mの大きさの2次元行列であり、ψはφと等しい大きさの行列である。各n∈{0・・・N−1}ごとに、ψ()はφ()のフーリエ変換に等しいとする(ステップ600)。ここでは、係数のノルムはもちろん、回転不変量である。回転不変量記述子を1次元の行列DまたはN*Mの次元として、m∈{0・・・M−1}およびn∈{0・・・N−1}に対してD[m*M+n]がψ(m)の絶対値の2乗に設定されるように返す(ステップ605)。択一的に、2乗を省略することができる。別の手段として、m∈{0・・・M−1}およびn∈{0・・・N−1}とした場合、離散フーリエ変換が新たな値ψ(m)を以下の式にしたがって定義する:
Figure 0004834177
したがって、回転不変量記述子は以下の系列から成る:
Figure 0004834177
同式において"p"は整数であり、0<p<Mである。"p"の値が高くなるほど、記述子の詳細の粒度レベルは薄くなる。もちろん、別のフーリエ変換を実施することもでき、有利には離散関数φのフーリエ係数を計算するために高速フーリエ変換を実施することもできる。さらに付加的に、計算されたフーリエ係数のノルム2乗(またはノルム自体)が、上記の回転不変量記述子を表す。
要約すると、本発明の有利な実施形態は、M個のポイントでサンプリングされた各同心円上に周期的な関数φを構築する。数学的には、フーリエ級数を使用すれば必ず、周期的な関数を正確に表すことができる。しかし、フーリエ級数は項の無限和であるから、本発明の有利な実施形態は、φのフーリエ級数表現から抽出されるデータの量を制限する。高速フーリエ変換を使用してこのフーリエ表現からデータを抽出することができる。さらに、φはM個の値によって表されるので、高速フーリエ変換を使用してM個より多くの値を抽出しても意味はない。Mの選択はアルゴリズムを実装する人に委ねられ、このMの選択により、記述子に記憶できる情報量が制御される。同心円はN個であるから、関数はN個になる。
実施例
図7は、2Dスケッチを示す。図7を参照すると、2Dスケッチ100は中空の十字形の2Dスケッチ700であり、705で示した通常の方向に方向づけされている。720に示しているように、中空の十字形700を並進して重心710を平面の起点715に位置付けすることにより、並進不変性にする。次に、725に示したように、ステップ205において中空の十字形700をスケーリングし、スケール不変性にする。
図8に、回転不変量記述子を計算するために準備された2Dスケッチを示す。図8を参照すると、800に示しているように、中空の十字形700は、該十字形700に均等に分布された多数のランダムなポイントを含む。N=2個の円を使用して、半径2.7である第1の円φ(m),805と、半径1.35である第2の円φ(m),810とを求める。中空の十字形700を、815に示したようにm個の扇形に分割する。その後、各扇形ごとに、この形状にある3つのポイント(1.1,0.3および0.08)と該扇形に含まれる円の円弧との間の最小距離を計算し、該最小距離は0.08となる。この円(n)およびスライス(m)でのφ(m)は0.08である。図9は、m∈{0,1,2・・・15}である場合のφ(m)およびφ(m)に対するN=2個の円の2つの離散関数φ(m)の値のグラフである。
結論
本発明は、デジタル電子回路、またはコンピュータハードウェア、ファームウェア、ソフトウェア、またはそれらの組合わせで実現することができる。本発明の有利な実施形態の装置は、機械読み出し可能な記憶デバイスに実装されるコンピュータプログラム製品であってプログラミング可能なプロセッサによって実行されるコンピュータプログラム製品で具現化することができる。また、本発明の有利な実施形態の方法のステップは、入力データに応答して動作し出力を生成することにより本発明の有利な実施形態の機能を実行するための命令のプログラムを実行するプログラミング可能なプロセッサによって実施することができる。
有利には本発明の有利な実施形態は、少なくとも1つのプログラミング可能なプロセッサを含むプログラミング可能なシステムで実行可能な1つまたは複数のコンピュータプログラムで具現化することができる。その際にはこの少なくとも1つのプログラミング可能なプロセッサは、データ記憶システム、少なくとも1つの入力デバイスからデータおよび命令を受信し、データ記憶システム、少なくとも1つの出力デバイスへデータおよび命令を送信するように結合されている。アプリケーションプログラムを高級な手順プログラミング言語で具現化するか、またはオブジェクト指向プログラミング言語で具現化するか、または望ましい場合にはアセンブリ言語または機械言語で具現化することができる。いずれの言語も、コンパイルされた言語または翻訳された言語とすることができる。
一般的に、プロセッサは命令およびデータをROMおよび/またはRAMから受け取る。コンピュータプログラム命令およびデータを実装するのに適した記憶デバイスには、すべての形態の不揮発性メモリが含まれる。これにはたとえば、EPROM、EEPROM、フラッシュメモリデバイスのような半導体メモリデバイス、内部ハードディスクのような磁気ディスク、リムーバブルディスク、磁気光学ディスク、CD−ROMディスクが含まれる。前記のものはすべて、専用設計されたASIC(アプリケーション専用集積回路)を補足するか、またはASICに組み込むことができる。
複数の実施形態を説明したが、本発明の有利な実施形態の技術的思想および範囲を逸脱することなく、種々の変更を行うことができ、たとえば、3角形を使用する代わりに線を使用してm個の扇形を作成できることが理解できる。さらに、本発明の有利な実施形態の範囲内に含まれるサンプルの変更手法は複数存在し、たとえばステップ505において、φ(m)をmax(rn/N,r−(rn/N))に設定する。別の修正例として、ステップ570と集合nによるステップ575とを入れ替え、nr/N<norm(P)<(n+1)r/Nとなるようにすることによって、φが、n番目の円と(n+1)番目の円との間のポイントにのみ依存するようにする。また、rを近似するために別の手法を使用することができ、たとえば、P[k]のノルムの最大値を使用することができる。したがってこれ以外の実施形態も特許請求の範囲内に含まれるものである。

Claims (6)

  1. 2次元のスケッチの形状に関する情報を表す記述子を求める方法であって、
    前記スケッチのいずれかのポイントと該スケッチの重心との最大距離とされる半径と、該スケッチの重心とによって定義される第1の円を作成するステップと、
    前記第1の円を複数の扇形に分割するステップと、
    前記第1の円と同心であり該第1の円より小さい複数の別の円を作成するステップと、
    前記スケッチに均等に分布するポイントの集合を作成するステップと、
    前記複数の各扇形に含まれる複数の各ポイントから前記複数の別の円の円弧であって該扇形に含まれる円弧までの最小距離を計算するステップと、
    前記複数の各円の円弧までの計算された前記最小距離によって定義される該複数の各円の周期的関数を求めるステップと、
    離散フーリエ変換を使用して前記周期的関数を表すステップと、
    前記周期的関数それぞれに相応するフーリエ係数の2次元行列を作成するステップと、
    効率的に検索して製品の設計およびデータ管理プロセスで使用するために、前記スケッチを一義的に識別する回転不変量の記述子として、前記2次元行列を記憶するステップと
    を実施することを特徴とする方法。
  2. 均質に分布されたポイントの集合の各ポイントから前記重心までの平均距離が1単位に等しくなるように、前記スケッチをスケーリングする、請求項1記載の方法。
  3. 前記重心を、前記スケッチが表現される平面の起点と該スケッチの起点として定義する、請求項1または2記載の方法。
  4. 記述子を求めるためのシステムにおいて、
    複数の2次元スケッチ(100)を有するスケッチデータベース(105)と、
    請求項1から3までのいずれか1項記載の方法によって前記複数の各2次元スケッチから計算される回転不変量記述子と、
    前記回転不変量記述子のインデックスを有する記述子データベース(110)と
    を含むことを特徴とする、システム。
  5. 機械読出し可能媒体に実装されるコンピュータプログラムにおいて、
    当該コンピュータプログラムがデータ処理システム上で実行される場合、当該コンピュータプログラムによって該データ処理システムが請求項1から3までのいずれか1項記載の方法を実施するように構成されていることを特徴とする、コンピュータプログラム。
  6. 少なくとも1つのプロセッサ(1005)とアクセス可能なメモリ(1045)とを含み、請求項1から3までのいずれか1項記載の方法を実施するために構成されたことを特徴とするデータ処理システム。
JP2010527931A 2007-10-03 2008-09-10 回転不変量2dスケッチ記述子 Active JP4834177B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US97728407P 2007-10-03 2007-10-03
US60/977,284 2007-10-03
US11/869,597 US8116553B2 (en) 2007-10-03 2007-10-09 Rotation invariant 2D sketch descriptor
US11/869,597 2007-10-09
PCT/US2008/010577 WO2009045263A1 (en) 2007-10-03 2008-09-10 Rotation invariant 2d sketch descriptor

Publications (2)

Publication Number Publication Date
JP2010541095A JP2010541095A (ja) 2010-12-24
JP4834177B2 true JP4834177B2 (ja) 2011-12-14

Family

ID=40193435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010527931A Active JP4834177B2 (ja) 2007-10-03 2008-09-10 回転不変量2dスケッチ記述子

Country Status (6)

Country Link
US (1) US8116553B2 (ja)
EP (1) EP2198393B1 (ja)
JP (1) JP4834177B2 (ja)
CN (2) CN101884049A (ja)
AT (1) ATE520095T1 (ja)
WO (1) WO2009045263A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9030407B2 (en) * 2011-12-21 2015-05-12 Nokia Technologies Oy User gesture recognition
US20140355888A1 (en) * 2013-05-31 2014-12-04 Siemens Product Lifecycle Management Software Inc. Automatic detection of regular patterns of features
CN103646239B (zh) * 2013-12-25 2016-07-13 武汉大学 基于极坐标傅里叶变换的旋转不变性图像特征提取方法
WO2015173821A1 (en) 2014-05-14 2015-11-19 Sync-Rx, Ltd. Object identification

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04112277A (ja) * 1990-08-31 1992-04-14 Toyobo Co Ltd 形状識別方法
JP2000215315A (ja) * 1999-01-26 2000-08-04 Ricoh Co Ltd 図形分類方法、図形検索方法、図形分類検索システム及び記録媒体
JP2000268270A (ja) * 1999-03-19 2000-09-29 Sogo Keibi Hosho Co Ltd 画像処理による火災検知方法及び火災検知装置
JP2002530133A (ja) * 1998-11-13 2002-09-17 アーチ・デベロップメント・コーポレーション 肺結節中の悪性腫瘍検出用システム
JP2006113922A (ja) * 2004-10-15 2006-04-27 Fujitsu Ltd 組み立て図面の装置部品イメージ検索装置
JP2006285627A (ja) * 2005-03-31 2006-10-19 Hokkaido Univ 3次元モデルの類似検索装置及び方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2198393A (en) * 1934-05-29 1940-04-23 Octrooien Mij Activit Nv Purification of liquid matter
FR2790571B1 (fr) * 1999-03-03 2003-04-04 France Telecom Procede de reconnaissance de formes
US6628845B1 (en) * 1999-10-20 2003-09-30 Nec Laboratories America, Inc. Method for subpixel registration of images
DE10056287A1 (de) 2000-11-14 2002-05-23 Siemens Ag Verfahren zur Erkennung eines Objekts sowie Einrichtung zur Durchführung des Verfahrens
US7353224B2 (en) * 2001-12-04 2008-04-01 Hewlett-Packard Development Company, L.P. System and method for efficiently finding near-similar images in massive databases
AU2002951815A0 (en) * 2002-10-03 2002-10-24 Canon Kabushiki Kaisha Mark embedding and detection using projective transforms
CN1553373A (zh) * 2003-06-03 2004-12-08 平子良 用雅可比-傅立叶矩系列描述图像
US7539354B2 (en) 2004-08-25 2009-05-26 Canon Kabushiki Kaisha Image database key generation method
JP4385139B2 (ja) * 2006-02-01 2009-12-16 国立大学法人電気通信大学 変位検出方法、及び、変位検出装置、変位検出プログラム、並びに、位相特異点マッチング処理方法、位相特異点マッチング処理プログラム
JP2011509398A (ja) * 2007-12-19 2011-03-24 ソシエテ ド テクノロジー ミシュラン タイヤ表面を検査するために使用できるようにするようタイヤ表面の3次元画像を処理する方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04112277A (ja) * 1990-08-31 1992-04-14 Toyobo Co Ltd 形状識別方法
JP2002530133A (ja) * 1998-11-13 2002-09-17 アーチ・デベロップメント・コーポレーション 肺結節中の悪性腫瘍検出用システム
JP2000215315A (ja) * 1999-01-26 2000-08-04 Ricoh Co Ltd 図形分類方法、図形検索方法、図形分類検索システム及び記録媒体
JP2000268270A (ja) * 1999-03-19 2000-09-29 Sogo Keibi Hosho Co Ltd 画像処理による火災検知方法及び火災検知装置
JP2006113922A (ja) * 2004-10-15 2006-04-27 Fujitsu Ltd 組み立て図面の装置部品イメージ検索装置
JP2006285627A (ja) * 2005-03-31 2006-10-19 Hokkaido Univ 3次元モデルの類似検索装置及び方法

Also Published As

Publication number Publication date
CN107103328A (zh) 2017-08-29
JP2010541095A (ja) 2010-12-24
US8116553B2 (en) 2012-02-14
US20090093994A1 (en) 2009-04-09
EP2198393B1 (en) 2011-08-10
EP2198393A1 (en) 2010-06-23
CN101884049A (zh) 2010-11-10
WO2009045263A1 (en) 2009-04-09
CN107103328B (zh) 2021-06-15
ATE520095T1 (de) 2011-08-15

Similar Documents

Publication Publication Date Title
US8368689B2 (en) System, method, and computer program product for radial functions and distributions of three dimensional object models
CN110659740A (zh) 基于边缘节点处的数据输入对机器学习模型排序和更新
US11822595B2 (en) Incremental agglomerative clustering of digital images
Xu et al. Shape similarity measurement model for holed polygons based on position graphs and Fourier descriptors
US20190278875A1 (en) Deep-learning based functional correlation of volumetric designs
KR102257172B1 (ko) 기하학적 형상들을 인식하는 시스템 및 방법
JP2012043419A (ja) 三次元モデル検索装置、三次元モデル検索方法、モデルライブラリ生成装置及びモデルライブラリ生成方法
JP4834177B2 (ja) 回転不変量2dスケッチ記述子
CN104484671A (zh) 应用于移动平台的目标检索系统
Hosny et al. An algorithm for fast computation of 3D Zernike moments for volumetric images
US10997754B2 (en) Freeform drawing beautification
EP4071650A2 (en) Graph alignment techniques for dimensioning drawings automatically
Theologou et al. A review on 3D object retrieval methodologies using a part-based representation
CN110175128A (zh) 一种相似代码案例获取方法、装置、设备和存储介质
CN112470172A (zh) 使用随机序列嵌入的符号序列分析的计算效率
CN111696157B (zh) 图像重定位的确定方法、系统、设备和存储介质
JP5735126B2 (ja) システムおよび筆跡検索方法
US20220059195A1 (en) Techniques for data-enabled drug discovery
US7398258B2 (en) Dimensional reduction using data matching in high dimensional space
US10686813B2 (en) Methods of determining a file similarity fingerprint
JP4545614B2 (ja) 文書分類プログラム及び文書分類装置
Berjón et al. A parallel implementation of 3D Zernike moment analysis
JP5482175B2 (ja) 境界粒子探索システム、境界粒子探索装置、制御方法、及びプログラム
Kim et al. Partial denoising boundary image matching using time-series matching techniques
Paprzycki et al. Solvers for nonlinear algebraic equations; where are we today?

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110922

R150 Certificate of patent or registration of utility model

Ref document number: 4834177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250