JP3815704B2 - 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法 - Google Patents

図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法 Download PDF

Info

Publication number
JP3815704B2
JP3815704B2 JP18840898A JP18840898A JP3815704B2 JP 3815704 B2 JP3815704 B2 JP 3815704B2 JP 18840898 A JP18840898 A JP 18840898A JP 18840898 A JP18840898 A JP 18840898A JP 3815704 B2 JP3815704 B2 JP 3815704B2
Authority
JP
Japan
Prior art keywords
graphic
feature
structural features
input
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18840898A
Other languages
English (en)
Other versions
JPH11203461A (ja
Inventor
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP18840898A priority Critical patent/JP3815704B2/ja
Priority to US09/179,418 priority patent/US6424746B1/en
Publication of JPH11203461A publication Critical patent/JPH11203461A/ja
Application granted granted Critical
Publication of JP3815704B2 publication Critical patent/JP3815704B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching

Description

【0001】
【発明の属する技術分野】
本発明は、図形の分類・検索の分野に係り、特に図形輪郭の構造的特徴を利用する図形の分類・検索技術に関する。
【0002】
【従来の技術】
輪郭には図形や物体に関するすべての情報が含まれているため、これまで、モデルを使った閉輪郭線の分類(認識)のための多種多様な方法が考案されてきた。通常の認識アルゴリズムにおいては、個々のモデルについて、互いに独立したデータ構造・モデルを考えるが、モデルの個数が多くなったときには、モデルの数に比例して認識の効率が低下する。そこで「構造的インデクシング」という方法が考えられるようになった。
【0003】
この構造的インデクシングの基本的な考え方は、モデルの集合に対して、一つの大規模なデータ構造(表)を用意し、モデル図形から得られる離散的な特徴量(構造的特徴)をインデックスとして、その大規模なデータ構造にモデルを分散して配置し、入力図形を認識(分類)する時には、入力図形から得られる特徴量を表と照らし合わせて、各モデルへの投票によって、照合し得るモデルを絞り込むというものである。そのようなデータ構造の例としては、特徴量からインデックスを計算し、そのインデックスに対応する表のエントリーが、その特徴量を持つモデルの識別子のリストであるような大規模な表がある。
【0004】
このような構造的インデクシングでは、複雑な図形については、簡単な投票操作で得られる第1候補が常に正解であるとは限らない。複雑な図形を認識する場合には、構造的インデクシングによって少数(数%から10%のモデル)の候補モデルを絞り込み、この候補モデルに対して別の複雑な認識アルゴリズムを適用する必要がある。したがって、構造的インデクシングに要求される条件としては、投票によって絞り込まれる全体の数%から10%の数の候補モデルの中に、必ず正しいモデルが含まれていること、そして、その処理に必要とされる時間が、その後の複雑な認識アルゴリズムに必要な時間に比べて無視できるほど、処理速度が高速であることである。この2条件が満たされれば、構造的インデクシングによって、認識精度を落とすことなく図形認識の数十倍のスピードアップが可能になる。これら2つの条件は、大規模図形データベースの図形検索においても、性能と効率を決定づける本質的な条件である。
【0005】
このような問題が本格的に考えられるようになったのは、コンピュータのディスクやメモリの容量が増加した最近になってからであるが、80年代にも研究が行われていた。例えば、Bairdは印刷文字認識への応用を考え、各モデル(文字図形)から得られるそれぞれの特徴に1つのビットを割り当てることにより、図形を特徴の有無によってビット列で表現する方法を考案した(Henry S. Baird, "Feature identification for hybrid structural/statistical pattern classification," Computer Vision,Graphics,and Image Processing, vol.42, pp.318-333, 1988)。この方法は、各文字に対して大量のトレーニングデータがある場合に適用可能であり、円弧、ストローク、交差点、穴、端点などの構造的特徴を種類別にパラメータ表現し、パラメータ空間でのクラスタリングを行い、各クラスタに1つのビットを割り当てる。入力図形に、それぞれのビットに対応する特徴が存在すれば、そのビットに1が設定される。このようにして構成される大規模次元のビット・ベクトルの分類により、入力図形が分類される。
【0006】
ところが、1つのモデル図形に対して1つのサンプル図形しか使えないような場合には、このBairdの方法は適用できない。構造的特徴の弱点は、ノイズや変形により特徴が変化することであるが、Bairdの方法では、1つのモデルに対し大量のサンプルパターンを用意して、データからの統計的・帰納的学習により実際に起こり得る多種多様な特徴変化に対処するからである。
【0007】
ここで考えている1モデルにつき1つのサンプル図形しか使えないような場合に対処するため、SteinとMedioniは、図形輪郭を様々な許容誤差で多角形近似して生成される複数の図形から構造的特徴を抽出する方法を考案した(F.Stein and G.Medioni,"Structural indexing: efficient 2-D object recognition," IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.14,no.12,pp.1198-1204, 1992)。また、Del BimboとPalaは、曲線を様々な広がりをもつガウシアン関数で平滑化して凹凸特徴を抽出するスケール・スペース法と構造的インデクシングを統合した方法を考案した(A. Del Bimbo and P.Pala, "Image indexing using shape-based visual features," Proceedings of 13th International Conference on Pattern Recognition,Vienna,Austria,August 1996,vol.C, pp.351-355)。このような方法では、各スケールから得られる構造的特徴の記述をもとにして、ノイズや輪郭の局所的な変形を考慮した階層的なデータ構造を構築する。ただし、スケールスペース法では、輪郭を様々な広がりを持つガウシアン関数で平滑化するため計算量が増大し、さらに、隣接する異なったスケール間で特徴の対応を見つけるという処理が必要となる。
【0008】
このように、1つのモデルに1つのサンプルしか使えないような状況で、構造的特徴を変えてしまうようなノイズや局所的変形に頑健な構造的インデクシングのための効率的なかつ効果的方法は未だ考案されておらず、それが実用面での大きな障害となっていた。
【0009】
また、2つの閉輪郭線の間のマッチング(対応付け)、分類(認識)のための多種多様な方法が考案されてきたが、現実に観測される入力図形にはノイズや大局的・局所的な変形が加わっているため、マッチングのアルゴリズムの設計においては、どのような変形、変換がどの程度に許容されるかという前提条件が必要となる。これまでに考案された方法の中にも、大きさの変化を許さないものや回転に対応できないものなどがある。さらに、伸び縮みのない対象である「剛体」だけを考慮している方法も多い。
【0010】
特に、大局的な変形としてアフィン変換を考えた場合、フーリェ特徴やモーメント特徴がアフィン変換に不変な特徴であることが知られている。しかしながら、それらの特徴によって形状を分類するには、高次の係数(2次元図形のフーリェ級数展開の係数やモーメントの次数)が必要であるため、多大な計算量を要するという問題があり、さらに、それら高次の係数はノイズに敏感で、安定なのは低次の係数だけであるという問題がある。また、これらの特徴を用いた方法では、単に図形を係数パラメータを使って分類するだけであるので、具体的な図形間の点対応や変換パラメータを求めることができない。
【0011】
このような問題から、図形をその輪郭上の特徴の列として記述し、2つの輪郭特徴列の最適対応問題として取り扱う方法が考案された。その代表例が、輪郭の凹凸特徴による表現であり、文字認識を含む図形認識の分野に応用されてきた。特に、凹凸構造はノイズのほか図形を観測するスケールに依存するところからスケール・スペース法と呼ばれるが、閉輪郭線を大小様々なサポートの大きさを持つガウシアン関数で平滑化し、凹凸の変化点である変曲点を抽出する方法が考案された(上田,鈴木:”多重スケールの凹凸構造を用いた変形図形のマッチングアルゴリズム”,電子情報通信学会論文誌 D-II,vol.J73-D-II,no.77,pp.992-1000,1990年7月、及び、F.Mokhtarian, "Silhouette-based isolated object recognition through curvature-scale space,"IEEE Transaction on Pattern Analysis and Machine Intelligence, vol.17, no.5, pp.539-543,May 1995)。
【0012】
この方法の利点は、曲線を「変曲点」という特徴で代表させることにより、情報量を縮約したコンパクトな構造表現を用いていることにある。しかしながら、この方法には次のような問題点がある。まず、具体的にどのような変形、変換が許容できるのかが明確でないために、実際にこの方法を用いる場合、どのようなことに注意しなければならないのかが、明確でない。また、実際のデジタル画像からの曲率の計算においては、Spline曲線、Bezier曲線などを使ってデジタル点列を曲線近似する必要があり、計算量が多い。さらに、スケール・スペース法では、様々なサポート(スケールを表す)を持つガウシアン関数で曲線を平滑化したうえで、異なったスケール間での変曲点の対応を見つける必要があるが、計算量が多いほか、対応付けの過程でエラーが入り込む可能性が大きい。
【0013】
スケール・スペース法の他にも、輪郭を多角形近似(区分線分近似)し、線分列の角度変化を特徴として、輪郭を角度変化を表す文字列で記述し、近似的なストリング・マッチング手法を適用する方法も考案されている( H.Bunke and U.Buehler, "Applications of approximate string matching to 2D shape recognition," Pattern Recognition, vol.26, no.12, pp.1797-1812,December 1993)。しかし、この方法では、輪郭を近似する線分を構成要素にしているため、情報があまり縮約されず、処理量の軽減が考慮されていないという問題がある。また、許容される変換も明かでなく、近似的なストリング・マッチングの基準となっている編集コストが必ずしも図形間の類似度をうまく表さないため、分類や認識の基準としては適当でない。
【0014】
【発明が解決しようとする課題】
本発明は、前述の諸点に鑑みてなされたもので、その目的は、図形の構造的特徴を変えてしまうようなノイズや局所的若しくは大局的な変形に頑健な図形分類又は検索のための処理方法又はシステムを提供することにある。本発明のもう一つの目的は、大量のモデル図形に対し1モデルにつき1サンプルしか使えないような場合でも、ノイズや変形に頑健な効率的、高速な構造的インデクシングによる図形分類又は検索処理方法及びシステムを提供することにある。本発明の他の目的は、そのようなノイズや変形に頑健な図形分類又は検索の処理方法又はシステムを実現するための特徴抽出処理方法、分類用表の作成処理方法、図形間の類似度又は相異度の評価処理方法、輪郭の構造的特徴の対応付け処理方法、図形の正規化処理方法などを提供することである。
【0015】
【課題を解決するための手段】
図形の閉輪郭線(又は線図形そのもの)を多角形近似し、量子化方向特徴と準凹凸構造に基づいて、連続した線分をより高いレベルの構造的特徴に統合するパターン特徴抽出方法は、比較的簡単な処理によってコンパクトな構造的特徴を抽出することができる。しかし、このような方法で得られる構造的特徴は、ノイズやスケールによって生ずる局所的な凹凸構造の変化により変動するため、1つのモデルに1つのサンプルしか使えないような場合に、単純に、モデルの構造的特徴と入力図形の構造的特徴とを突き合わせて図形の分類や検索を行うと、ノイズや局所的変形に弱い。
【0016】
そこで、請求項1乃至10の発明にあっては、入力された図形そのものを実際に変形するかわりに、入力図形から抽出した構造的特徴に予め定めた図形変形に関する特徴変換の規則を適用することにより、ノイズや局所的変形が加わった変形図形から抽出される可能性のある構造的特徴を合成し、これら抽出された構造的特徴と合成された各構造的特徴をそれぞれ図形の分類又は検索に利用する。
【0017】
構造的インデクシングによる場合、モデル構築の際に、モデル図形から抽出した構造的特徴に予め定めた変換規則を適用することにより、ノイズや局所的変形が加わった変形図形から抽出される可能性のある構造的特徴を合成する。そして、モデルの集合に対し、インデックスが特徴量に対応しエントリーがその特徴量を持つモデルの識別子のリストであるような1つの大規模な表(分類表と呼ぶ)を用意し、モデル構築時に、各モデル図形から抽出された構造的特徴と変換規則により合成された構造的特徴のそれぞれからインデックスを計算し、それぞれのインデックスに対応した分類表のエントリーに、その構造的特徴を持つモデルの識別子のリストを貯える。図形の分類又は検索の際には、同様に、入力された図形から抽出した構造的特徴に変換規則を適用することによりノイズや局所的変形が加わった変形図形から抽出される可能性のある構造的特徴を合成し、抽出された構造的特徴と合成された構造的特徴のそれぞれからインデックスを計算し、各インデックスに対応した分類表のエントリーのモデル識別子リストを参照し、当該モデル識別子リストに含まれる各モデル識別子に対する投票操作を行って得票数の多いモデルを候補として絞り込む。また、この分類結果を検索キーとしてデータベースを検索する。
【0018】
請求項11乃至16の発明にあっては、図形の輪郭の構造的特徴を抽出する方法として、曲線近似や多重スケールによる平滑化などの計算量の問題を解決し、かつ少数の構成要素によるコンパクトな表現を得るために、図形の輪郭を区分的線分で近似し(多角形近似)、量子化方向特徴と準凹凸構造に基づいて、連続したいくつかの線分をより高いレベルの構造的特徴に統合する方法を用いる。また、ノイズやスケールによって生ずる図形の輪郭の凹凸構造の局所的・大局的な変化に対処するため、2つの図形、例えば分類しようとする入力図形と予め用意されたモデル図形について、それぞれの輪郭の構造的特徴を互いに近づけるための編集コストに着目し、この編集コストに基づいて2つの図形の輪郭の構造的特徴の間の適切な対応関係を求める。そして、図形間の類似度又は相違度をより幾何学的に表現し、図形の分類(認識)の基準として、より図形本来の性質を持った距離尺度とするため、上のようにして求めた対応関係に従って、2つの図形の一方の図形に対し、その輪郭を他方の図形の輪郭に近づけるようにアフィン変換などの幾何学的変換を施すことにより正規化を行い、この正規化後の図形と他方の図形の輪郭の間の幾何学的な距離を計算し、この距離により2つの図形の類似度又は相違度を評価する。図形分類の場合には、入力図形と各モデル図形との間で同様の距離計算を行い、距離が小さい1つ又は複数のモデル図形を分類候補として選ぶ。
【0019】
【発明の実施の形態】
[実施例1]
図1に、本発明の一実施例による図形分類検索システムの概略構成を示す。図1において、図形入力部100は分類(認識)したい図形、あるいは、検索したい図形そのもの又はその検索キーとしての図形を入力する部分である。ここで入力される図形とは、物体や図形の輪郭を表す閉曲線であり、イメージスキャナやデジタルカメラ等の機器より撮像された画像から輪郭抽出によって抽出される場合と、デジタイザ等の機器により最初から線図形として(必要に応じて細線化処理を施されて)入力される場合とがある。
【0020】
特徴抽出部105は、入力された図形の閉輪郭線(又は入力された線図形、以下同様)を多角形近似(区分線分近似)したのち、量子化方向特徴と準凹凸構造に基づいて解析することにより、連なっている線分をより高いレベルの構造的特徴に統合する部分である。このような特徴抽出方法については後にさらに詳しく説明するが、コンパクトな表現の構造的特徴を得ることができる。
【0021】
特徴抽出部105で抽出される構造的特徴は、ノイズや輪郭線の局所的変形によって変化するので、本実施例では、ある特定の変形操作によって生じる構造的特徴の変換規則を考え、特徴合成部110において、この変換規則を、特徴抽出部105により入力図形から抽出された構造的特徴に適用することにより、ノイズや局所的変形により発生し得る変形図形の構造的特徴を合成する。ここで合成された構造的特徴と、入力図形から抽出された構造的特徴がすべて図形分類用特徴として分類検索部115に与えられる。
【0022】
分類検索部115は、与えられた各構造的特徴からインデックス(アドレス)を計算し、このインデックスに対応した分類表120のエントリーを参照し、入力図形を分類する。図形分類を目的とした場合には、分類検索部115は分類結果(モデル識別子)を出力する。図形検索を目的とした場合には、分類検索部115は、分類結果として得られたモデル識別子を検索キーとして持つ図形(具体的には、当該モデル図形そのもの又は、それに相当する図形を含む図形)を図形データベース125より検索し出力する。
【0023】
分類表120は当該システムの外部で作成されてもよいが、本実施例においては、当該システムの内部で分類表120を作成できる。したがって、当該システムは、分類表120の作成に関連してモデル図形入力部150、特徴抽出部155、特徴合成部160及び表作成部165を有する。モデル図形入力部150はモデル図形(閉じた閉輪郭線又は線図形)を入力する部分であり、特徴抽出部155は特徴抽出部105と同じ特徴抽出処理を行う部分である。特徴合成部160は、特徴抽出部155によりモデル図形から抽出された構造的特徴に対して特徴合成部110と同様の特定の構造的特徴の変換規則を適用することにより、モデル図形にノイズや局所的変形が加わった場合に発生し得る構造的特徴を合成する部分である。したがって、モデル図形入力部150、特徴抽出部155及び特徴合成部165はそれぞれ、図形入力部100、特徴抽出部105及び特徴合成部110と兼用することが可能である。表作成部165は、特徴抽出部155により抽出された構造的特徴及び特徴合成部160により合成された構造的特徴のそれぞれからインデックスを計算し、その各構造的特徴を持つモデルの識別子のリストを当該インデックスのエントリーとした、図2に模式的に示すような構造の大規模な表を分類表120として作成する部分である。
【0024】
この図形分類検索システムは、例えば、図3に簡略化して示すようなCPU200、メモリ205、ハードディスク等の大容量記憶装置210、画像若しくは図形入力のためのスキャナ、デジタルカメラ、デジタイザ等の入力装置215、ユーザインターフェイスのためのディスプレイ220とキーボードやマウス等の入力装置225、フロッピーディスクやCD−ROM等のディスク記録媒体235に対する読み書きを行うディスクドライブ230等をシステムバス240で相互に接続した構成のコンピュータ上で、プログラムにより実現することができる。図形データベース125及び分類表120は大容量記憶装置210に保存される。このコンピュータ上で図1中の各機能部100,105,110,115,150,155,160,165の機能(換言すれば同システムにおける一連の処理ステップ)を実現するための分類検索プログラム250は、例えば、同プログラムが記録されたディスク媒体235よりディスクドライブ230によって読み込まれて大容量記憶装置210に格納され、必要な時にその全部又は一部がメモリ205にロードされてCPU200により実行される。分類表120も、ディスク媒体235から読み込まれてもよい。このプログラム205の実行時に、分類表120も、その全体又は一部分がメモリ205にロードされて参照される。分類すべき図形やモデル図形は、例えば入力装置215から入力される。
【0025】
以下、この図形分類検索システムの各部分について詳細に説明する。
【0026】
<図形入力部100又はモデル図形入力部150>
図形入力部100は、前述のように分類すべき図形又は検索キーとしての図形を入力する。入力図形としての閉輪郭線の一例を図9に示す。モデル図形入力部150は同様のモデル図形の閉輪郭線(又は線図形)を入力する。
【0027】
<特徴抽出部105又は155>
図4は、特徴抽出部105又は155の処理の流れを示すフローチャートである。また、図5は、特徴抽出の過程で得られるデータを関連付けて模式的に示した図である。なお、図4中の輪郭抽出処理のためのステップ300は、輪郭抽出が必要とされる図形の画像が図形入力部100から入力された場合にのみ必要な処理ステップであり、輪郭抽出済みの図形が直接入力された場合には不要である。例えば、図8に示す図形が入力された場合には、ステップ300によって図9に示すような閉輪郭線が抽出される。
【0028】
特徴抽出部105はまず、図形入力部105から入力された図形の閉輪郭線(又はステップ300で抽出された閉輪郭線、以下同様)を多角形近似する(ステップ301)。この多角形近似若しくは区分線分近似は、Ramerの方法など、公知の任意の方法で行ってよい。例えば、図9に示した閉輪郭線は、図10に示すような多角形に近似される。
【0029】
このように多角形近似された閉輪郭線を、量子化方向特徴と準凹凸構造をもとにして解析し構造的特徴を抽出する(ステップ302〜308)。この特徴抽出の詳細は、H.Nishida, "Curve description based on directional features and quasi-convexity/concavity," Pattern Recognition, vol.28, no.7,pp.1045-1051, July 1995 に譲り、ここではその概略を説明する。
【0030】
2N個(Nは自然数)の量子化方向コードを決めるためにN本の軸を導入する。例えば、N=4のとき、図11に示すように4本の軸に沿って0,1,...,6,7の8つの方向コードを定義する。これらの2N方向とN本の軸をもとにして、多角形近似された閉輪郭線の線分を「セグメント」に統合しながら輪郭を解析する。
【0031】
まず、閉輪郭線をN本の各軸に沿って見たときに、極大点又は極小点となる点を、輪郭点の分割点とする(ステップ302)。例えば、N=4のとき、図10の閉輪郭線からは、図12に示す太短線と閉輪郭線との交点がそれぞれ分割点として抽出される。各分割点の近傍の()中の数字1〜13は分割点のラベルであり、図5中の「分割点」欄の数字に対応している。
【0032】
閉輪郭線は分割点で「部分セグメント」に分割される。換言すれば、この分割によって、輪郭上の連続した線分が「部分セグメント」に統合される。この部分セグメントは、N本のどの軸上でも、それを1つの端点からもう1つの端点へと辿る運動の射影が単調変化するような、連続した線分の集まりである。例えば、N=4のとき、図10の閉輪郭線から、図12に示すような13個の部分セグメントA〜Mが得られる。これら各部分セグメントと分割点とが対応付けられて図5の「部分セグメント」欄に示されている。隣り合う部分セグメントが共有する分割点は、それら部分セグメントの「連結点」でもあるので、以下の説明中では「連結点」と呼ぶ。
【0033】
次に、隣接する2つの部分セグメントの連結点の局所的な凹凸構造によって、「連結の向き」(凹凸)をチェツクする(ステップ303)。すなわち、隣接する2つの部分セグメントをaとbとして、aからbに移るように輪郭を辿った時に、連結点の周りで反時計回りになるときには、すなわち輪郭の凸部分に相当するときには、その連結の向きをa−→bと表す。逆に、連結点の周りで時計回りになるときには、つまり輪郭の凹部分に相当するときには、その連結の向きをb−→aと表す。N=4とし、図12に示す各連結点の「連結の向き」(凹凸)を図5の「凹凸」欄に示す。「凹凸」欄において、「0」は凸であること、すなわち「連結の向き」がa−→bであることを示し、「1」は凹であること、すなわち「連結の向き」がb−→aであることを示す。
【0034】
次に、各連結点に関し「方向特徴」を求める(ステップ304)。まず、各連結点の方向を求める。すなわち、隣接する2つの部分セグメントを、その連結の向きに辿った時に、その連結点が極値をとる量子化方向を求める。例えば、図12の部分セグメントA,Bの連結点の場合、図16から明らかなように、AからBを辿ったときに、その連結点は、方向3の軸及び方向4の軸に沿って極値をとり、それぞれ方向3と方向4の向きに凸であるので、その方向は3と4である。また、図12の部分セグメントG,Hの連結点の場合、図17から明らかなように、HからGを辿ったときに、その連結点は方向3,4,5の各軸に沿って極値をとり、それぞれ方向3,4,5の向きに凸であるので、その方向は3,4,5である。図12の閉輪郭線の各連結点の方向は図5の「方向」欄に示す通りである。
【0035】
そして、a−→b又はb−→aの部分セグメントa,bの連結点が量子化方向(j, j+1(mod 2N),..., k)に向いているときに、それぞれの連結点の方向特徴をa−j,k→b,b−j,k→aと表す。例えば図12に示した13個の部分セグメントに対しては、次のような部分セグメントの連結点の特徴が得られる。
L−3,3→M,K−2,2→L,J−1,1→K,I−0,0→J,
H−7,7→I,H−3,5→G,F−1,1→G,E−0,0→F,
D−7,7→E,C−6,6→D,B−5,5→C,A−3,4→B,A−7,7→M。
次に、以上のようにして得られた部分セグメントの連結点の特徴をまとめ、
0j(1,0),j(1,1)→ a1j(2,0),j(2,1)→・・・・−j(n,0),j(n,1)→ an
の形の系列を得る(ステップ305)。この形の系列に対応する部分輪郭を「セグメント」と呼ぶ。なお、セグメントの2端点のうちで、a0上にある端点をセグメントの始点、an上にある端点をセグメントの終点とし、1つのセグメントを始点から終点へと辿ると、セグメントの各部分セグメントの連結点の周りでは、いつも反時計回りに動くものとする。したがって、例えば、図12に示す13個の部分セグメントから、図13に示す4個のセグメントS1,S2,S3,S4、すなわち、
S1:A−7,7→M
S2:A−3,4→B−5,5→C−6,6→D−7,7→E−0,0→F−1,1→G
S3:H−3,5→G
S4:H−7,7→I−0,0→J−1,1→K−2,2→L−3,3→M
が得られる。図5の「セグメント」欄に、これら各セグメントと部分セグメントとの対応が示されている。「凹凸」欄と対比すると明らかなように、凹(=1)の分割点では、それを連結点とする2つの部分セグメントが1つのセグメントに統合され、また、凹(=1)の分割点と次の凹(=1)の分割点との間の部分セグメントが1つのセグメントに統合される。
【0036】
次に、各セグメントの回転の度合と方向を記述する特性数<r,d>を求める(ステップ306)。ここで、rとdは例えば次式により計算する。ただし、式中のA%Bは整数Aを自然数Bで割った余りを示す。
【0037】
【数1】
Figure 0003815704
【0038】
例えば、図13に示す4つのセグメントの特性数は、それぞれ<2,7>,<8,3>,<4,3>,<6,7>となる。
【0039】
さらに、輪郭線を囲む最小の直立長方形の中心が(0,5,0.5)、長い辺の長さが1になるような座標系を設定し、この座標系で、セグメントの大きさと位置の特徴として、その始点の位置(xs,ys)と終点の位置(xE,yE)、セグメントを囲む最小の直立長方形の大きさ(W,H)と中心の位置(xc,yc)を計算し、これらの8つの実数を0からL−1までの整数に量子化した8つのパラメータに特性数<r,d>を加えた10個の整数の組
【0040】
【外1】
Figure 0003815704
【0041】
で、セグメントの特徴を記述する(ステップ307)。
【0042】
さらに隣接するセグメントの結合をチッェクし、セグメントの結合を記述する(ステップ308)。隣接するセグメントS,Tは互いに、対応する系列の先頭又は最後の部分セグメントを共有して結合する。先頭の部分セグメントを共有する場合を「h結合」と呼び、S−h−Tと表し、最後の部分セグメントを共有する場合を「t結合」と呼び、S−t−Tと表す。ただし、セグメントは図形の内部を左手に見るような順番で並んでいるものとする。したがって、例えば図13に示す4個のセグメントS1,S2,S3,S4の結合は、
S1−h−S2−t−S3−h−S4−t−S1
と記述される(図5の「セグメント」欄参照)。
【0043】
特徴抽出部155による処理内容は、対象がモデル図形として入力された閉じた閉輪郭線(又は閉じた線図形)であることを別にすれば、以上に述べた特徴抽出部105の処理内容と同じである。
【0044】
<特徴合成部110又は160>
後に詳細に述べるように分類検索部115では、モデル毎に投票箱を用意し、入力図形から抽出された各セグメントの特徴(前記10個の整数の組)に対応する分類表120のエントリー(モデル図形の識別子のリスト)を参照し、同リスト上の各モデル識別子に対応した投票箱に1票を投票し、得票数の多寡によって入力図形を分類する。ところが、前に簡単に触れたように、入力図形に重畳するノイズや輪郭の局所的変形により、輪郭のセグメントの特徴は簡単に変化してしまう。この変化を考慮せず、入力図形及びモデル図形から抽出されたセグメントの特徴だけを用いたのでは、ノイズや局所的変形があると、正しいモデル図形に対する得票数が多くなるとは限らず、ノイズや局所的変形に弱い。また、1つのモデルに1つのサンプル図形しか使えない場合には、パターン認識における、データからの統計的・帰納的学習の手法を用いることができない。
【0045】
このような弱点を解消するため、本実施例では、ある種類の図形の変形操作によって生じる特徴の変換規則を構築し、図形から抽出されたセグメントの特徴にこの特徴変換規則を適用することにより、ノイズや輪郭の局所的変形によって発生する変形図形から抽出される可能性のあるセグメント特徴を合成する。このセグメント特徴の合成は、特徴合成部110及び同160で行われ、図形(入力図形又はモデル図形)から抽出されたセグメント特徴及び変換規則により合成されたセグメント特徴が、入力図形の分類及び分類表120の作成の両方に使われる。
【0046】
ノイズ又は輪郭の局所的変形によるセグメントの特徴変換として、具体的には例えば次の3通りを考える。
▲1▼ 輪郭の法線方向の揺らぎによって生じる凹凸構造の変化による、輪郭のセグメント分割の変動と、それにともなう量子化された回転数・方向つまり特性数<r,d>の再定義。
▲2▼ 小さな回転による量子化された回転数・方向つまり特性数<r,d>の変化。
【0047】
▲3▼ セグメントの大きさや中心と端点の位置の揺らぎによる特性数以外の特徴(8つのパラメータ)の変化。
これらの特徴変換について順に説明する。
【0048】
《特徴変換▲1▼:輪郭の法線方向に沿った変動》
多角形近似された輪郭から構造的特徴(セグメント特徴)によるコンパクトな表現を得ることができるが、これは輪郭線に加わるノイズや観測されるスケールによって生ずる凹凸変化に影響を受けやすい。例えば、図14の(A)の部分輪郭と(B)の部分輪郭は大局的に見るとよく似ているが、局所的な変形のために構造的な特徴は異なったものとなる。N=4としたとき、(A)の部分輪郭は、それぞれ特性数<6,6>,<2.6>,<3,2>を持ちS1−t−S2−h−S3 のように結合する3つのセグメントにより表される。これに対し、(B)の部分輪郭は、それぞれ特性数<6,6>,<2,6>,<2,2>,<2,6>,<3,2>を持ちS1'−t−S2'−h−S3'−t−S4'−h−S5'のように結合する5つのセグメントにより表される。
【0049】
このようなノイズや観測スケールによる構造変化は輪郭の法線方向の変形と考えることができるので、かかる変形を吸収するために、構造的特徴が互いに似たものになるようにセグメントを編集することを考える。図14に示す2つの部分輪郭の場合、図15の(A)と(B)に示すように、S2,S2',S3',S4'の部分を覆う如く{S1,S2,S3}と{S1',S2',S3',S4',S4',S5'}をそれぞれ1つのセグメントS,S'に置き換えることによって、互いに似た構造的特徴を持つように変換できる。
【0050】
一般的には、次のような規則で変換する。
(1)S1−h−S2−t−・・・−t−Snのように結合し、特性数<ri,di>を持つ連続したn個(nは奇数)のセグメントSi(i=1,...,n)について、
【0051】
【数2】
Figure 0003815704
【0052】
ならば(統合条件1)、これらのn個のセグメントを、
【0053】
【外2】
Figure 0003815704
【0054】
を持つ1つのセグメントSに統合する。
【0055】
(2)S1−t−S2−h−・・・−h−Snのように結合し、特性数<ri,di>を持つ連続したn個(nは奇数)のセグメントSi(i=1,...,n)について、
【0056】
【数3】
Figure 0003815704
【0057】
ならば(統合条件2)、これらn個のセグメントを、
【0058】
【外3】
Figure 0003815704
【0059】
を持つ1つのセグメントSに統合する。
【0060】
特徴合成部110又は160は、統合するセグメントの最大個数を示す整数パラメータをMとし、入力図形又はモデル図形の多角形近似された閉輪郭線から抽出された各セグメントに対し、連続するn個(n=1,3,...,M)のセグメントを上記の規則により統合し、変形したセグメントの特性数を合成する。閉輪郭線から抽出されるセグメントの個数をmとすると、上記の規則によりmMのオーダーの個数(これをO(mM)個と記す、以下同様)の特性数が生成される。例えば、N=4のとき、図13の4つのセグメントは特性数<2,7>,<8,3>,<4,3>,<6,7>を持つが、M=3のときに<2,7>,<8,3>,<10,3>,<4,3>,<6,7>,<12,7>の6つの特性数が合成される。
【0061】
《特徴変換▲2▼:図形の回転による特性数の変化》
セグメントの特性数<r,d>(r≧2)は、図形の回転によって変化することがある。いま特性数<r,d>を持つセグメントが系列
0d,d→a1d+1,d+1→・・・−r+d-2,r+d-2→an
で表されるとする。このセグメントを
【0062】
【外4】
Figure 0003815704
【0063】
だけ回転させると、このセグメントは次の5通りに変化し得る。
(1)α0d,d→α1d+1,d+1→・・・−r+d-2,r+d-2→αn
(2)α-1d-1,d-1→α0d,d→α1d+1,d+1→・・・−r+d-2,r+d-2→αn
(3)α0d,d→α1d+1,d+1→・・・−r+d-2,r+d-2→αnr+d-1,r+d-1→αn+1
(4)α0d,d→α1d+1,d+1→・・・−r+d-3,r+d-3→αn-1
(5)α1d+1,d+1→・・・−r+d-2,r+d-2→αn
このそれぞれの場合から、セグメントに微小な回転を与えることにより、特性数は、
(1) <r,d>
(2) <r+1,d−1>
(3) <r+1,d>
(4) <r−1,d> (r≧3)
(5) (r−1,d+1> (r≧3)
に変換され得る。
【0064】
例えば、特性数<r,d>を持つ円弧
【0065】
【外5】
Figure 0003815704
【0066】
において、
(1) ε=π/(2N),ψ=±π/(4N)
(2) ε=π/N,ψ=−π/(4N)
(3) ε=π/N,ψ=π/(4N)
(4) ε=π/(4N),ψ=−π/(4N)
(5) ε=π/(4N),ψ=π/(4N)
を考えればよい。このうち、(1),(2),(4)について、N=4,r=4,d=0の変換例を図18に示す。
【0067】
特徴合成部110又は160は、「輪郭の法線方向に沿った変動」による変換規則(特徴変換▲1▼)を適用して、各セグメントに対し最大
【0068】
【外6】
Figure 0003815704
【0069】
個の変形したセグメントの特性数を合成し、これら合成された特性数それぞれに対して、ここで述べる「図形の回転による特性数の変化」による変換規則(特徴変換▲2▼)によって最大5個の特性数を合成する。したがって、各セグメントから、特徴変換▲1▼及び特徴変換▲2▼の適用により最大
【0070】
【外7】
Figure 0003815704
【0071】
個の特性数が生成される。閉輪郭線から抽出されるセグメントの個数をmとすれば、この段階でO(mM)個の特性数が生成されることになる。
【0072】
例えば、N=4のときに、図13の4つのセグメントはそれぞれ特性数<2,7>,<8,3>,<4,3>,<6,7>を持つが、これに特徴変換▲1▼を適用すれば、M=3のときに、6個の特性数<2,7>,<8,3>,<10,3>,<4,3>,<6,7>,<12,7>が合成される。これらの合成された特性数に特徴変換▲2▼を適用すれば、28個の特性数<2,7>,<3,6>,<3,7>,<8,3>,<9,2>,<9,3>,<7,3>,<7,4>,<10,3>,<11,2>,<11,3>,<9,3>,<9,4>,<4,3>,<5,2>,<5,3>,<3,3>,<3,4>,<6,7>,<7,6>,<7,7>,<5,7>,<5,8>,<12,7>,<13,6>,<13,7>,<11,7>,<11,8>が合成される。
【0073】
《特徴変換▲3▼:局所的な大きさや位置の変動》
セグメントのパラメータ、すなわちセグメントの始点の位置(xs,ys)と終点の位置(xE,yE)、セグメントを囲む最小の直立長方形の大きさ(W,H)と中心の位置(xc,yc)は、局所的な変形やノイズによって変動する。また、これらパラメータxs,ys,xE,yE,xc,yc,W,HはそれぞれL段階(Lは自然数)に量子化されて取り扱われる。すなわち、パラメータp(pはxs,ys,xE,yE,xc,yc,W,Hのいずれか)の値が、i≦pL<i+1(0≦i<L)のとき、pの値は整数iに量子化される。このような量子化による誤差を考慮する必要がある。
【0074】
そこで、特徴合成部160では、特徴変換▲3▼として、実数パラメータα(0≦α≦1)に対して、i≦pL≦i+α/2(0<i<L)ならば、pの量子化値として整数iの他にi−1も生成し、また、i+1−α/2≦pL<i+1(0≦i<L−1)ならば、pの量子化値として整数iの他にi+1も生成する。
【0075】
したがって、特徴変換▲1▼、特徴変換▲2▼及び当該特徴変換▲3▼によって、各セグメントから最大
【0076】
【外8】
Figure 0003815704
【0077】
個の特徴(前記の10個の整数の組)が生成される。よって、閉輪郭線から抽出されるセグメントの個数をmとすると、最大
【0078】
【外9】
Figure 0003815704
【0079】
個の特徴が生成される。さらに、パラメータpの値が区間[0,1]上で一様分布すると仮定すると、1つのセグメントから平均O((1+α)8・M)個、1つの輪郭線から平均O((1+α)8・Mm)個の特徴が合成されることになる。
【0080】
なお、本実施例においては、この特徴変換▲3▼の適用による特徴合成はモデル構築の際に特徴合成部160で実行され、特徴合成部110では実行されない。つまり、分類表120を作成する際には、図形分類時に比べ、より多くの変形図形を考慮する。
【0081】
図6は、以上に述べた特徴合成部110の処理の流れを示すフローチャートである。特徴合成部110においては、まず、特徴抽出部105によって入力図形から抽出されたセグメント系列中の1つのセグメントを前記特徴変換▲1▼のための統合候補の先頭セグメントに設定し(ステップ400)、この先頭セグメントから3つ目のセグメントを統合候補の末尾セグメントに設定する(ステップ401)。そして、先頭セグメントから末尾セグメントまでのセグメント系列について特徴変換▲1▼のための前記統合条件1又は2が成立するか判定する(ステップ402)。統合条件1と統合条件2のいずれも成立しないときには、現在の末尾セグメントから2つ先のセグメント(統合するセグメント数は奇数である)を改めて末尾セグメントに設定し(ステップ407)、統合条件の判定を行う(ステップ401)。
【0082】
統合条件1又は統合条件2が成立した場合、先頭セグメントから末尾セグメントまでのセグメント系列の統合セグメントを生成し(ステップ403)、成立した統合条件に応じて、その統合セグメントの特性数と8組のパラメータを計算する(ステップ404)。かくして、例えば図14に示したようなセグメント系列が図15に示すようなセグメントに統合され、そのセグメント特徴が作られるわけである。
【0083】
このようにして統合セグメントの特徴が得られると、次に、この統合セグメントに対し前記特徴変換▲2▼を適用する(ステップ405)。この特徴変換▲2▼の適用によって、統合セグメントの特性数を回転操作した5つの変形セグメント特徴が得られる。ただし、この変形セグメント特徴の8組のパラメータとしては、統合セグメントの8組のパラメータがそのまま用いられる。
【0084】
特徴合成部110は、得られた5つの変形(合成)セグメント特徴を保存し(ステップ406)、再び末尾セグメントを先に移動させ(ステップ407)、ステップ402以降の処理を続ける。この処理の繰り返しは、末尾セグメントが先頭セグメントまで戻るか、又は先頭セグメントから末尾セグメントまでのセグメント数が一定値を越えるまで続く。
【0085】
末尾セグメントが先頭セグメントまで戻るか、又は先頭セグメントから末尾セグメントまでのセグメント数が一定値を越えると(ステップ408,YES)、特徴合成部110は、現在の先頭セグメントの1つ先のセグメントを改めて先頭セグメントに設定し(ステップ409)、ステップ401以降の処理を繰り返して行う。ただし、新たに設定した先頭セグメントが、最初に先頭セグメントに設定したセグメントに戻ったときには(ステップ410,YES)、処理を終了する。
【0086】
<表合成部165及び分類検索部115>
構造的インデクシングによるモデルの構築においては、モデル図形入力部150により入力したモデル図形から特徴抽出部155によって抽出されたセグメント特徴に対し、特徴合成部160において前述の3つの特徴変換▲1▼▲2▼▲3▼(変換モデル)を適用することにより、1つのモデル図形につき平均O((1+α)8・Mm)個のセグメント特徴を生成する。表作成部165は、それらの各セグメント特徴から分類表120のインデックスを計算し、このインデックスに対応する分類表120のエントリーのモデル識別子リストに、そのモデルの識別子を付加することにより、モデル集合に対する分類表120を作成する。
【0087】
モデル集合に含まれるモデルの個数をn、分類表120のインデックスの総数をIとすると、分類表120の各エントリーには平均O((1+α)8・Mmn/I)個のモデル識別子が格納される。ここで、モデルi(i=1,2,...,n)に対し、特徴変換▲1▼と特徴変換▲2▼を適用して合成される特徴の数(インデックスの数)ciが予め求められて保存されている。例えばN=4,M=3のとき、モデル図形が図13の輪郭線を持つとすればci=28となる。
【0088】
分類検索部115は入力図形の分類と該当図形の検索を行う。図7は分類検索部115の処理の流れを示すフローチャートである。
【0089】
分類検索部115は、入力図形に関するセグメント特徴(入力図形の輪郭から得られたセグメント特徴と、それに対し特徴変換▲1▼及び▲2▼を適用して合成したセグメント特徴)の中からセグメント特徴を1つ選び(ステップ500)、そのセグメント特徴から分類表120のインデックス(アドレス)を計算する(ステップ502)。そのインデックス(アドレス)に対応する分類表120のエントリーをアクセスし、モデル識別子リストを読み出す(ステップ503)。そして、そのモデル識別子リスト中の各モデル識別子(i)に対応した得票数viに1を加算する(ステップ504)。ただし、得票数viの初期値は0である。つまり、注目したセグメント特徴と同じセグメント特徴を持つモデルの投票箱に1票ずつ投票するわけである。ステップ500〜504の処理ループを繰り返し、同様の投票操作を入力図形に関する全てのセグメント特徴に対して行う。
【0090】
入力図形に関する全てのセグメント特徴について投票操作を行い、未処理のセグメント特徴がなくなると(ステップ501,NO)、各モデルiの得票数viをciで正規化し(ステップ505)、vi/ciの値の大きな順にモデルをソートする(ステップ506)。そして、上位のいくつかのモデルを候補として選択する(ステップ507)。図形の分類が目的の場合は、このようにして候補として絞り込んだモデルの識別子を分類結果として出力する(ステップ507)。図形の検索が目的の場合は、絞り込んだモデルの識別子を検索キーとして、図形データベース125より該当する図形パターンを取り出し、それを検索結果として例えばディスプレイ220に出力する(ステップ508)。
【0091】
本実施例によれば、以上に説明したように、図形から抽出された構造的特徴に特定の変換規則を適用することにより変形図形の構造的特徴を合成するため、比較的少ない計算量で、ノイズや局所的変形がある場合も考慮した図形分類用特徴を取得することができる。また、モデル図形から抽出された構造的特徴と、それに特定の変換規則を適用して合成した構造的特徴のそれぞれを使うことにより、比較的少ない計算量で、ノイズや局所的変形を考慮した構造的インデクシングのための表を作成することができる。したがって、1つのモデルに対して1つのサンプルしか使えないような場合にも、ノイズや局所的変形に頑健な効率的・高速な構造的インデクシングによる図形分類・検索が可能である。したがって、本実施例の図形分類・検索システムは、後記の第2の実施例の図形分類システムとともに、図形の変形に柔軟に対応する必要がある図形分類・検索の用途、例えば、植物の葉の輪郭形状(又は葉の画像)を入力し、その植物の種類を調べるような用途に特に効果的である。
【0092】
[実施例2]
図19に、本発明の他の実施例による図形分類システムの概略構成を示す。図19において、画像入力部1100はイメージスキャナやデジタルカメラ等の画像入力装置より分類(認識)したい図形の画像を入力する部分である。ここで図形とは、図形や物体の輪郭を表す閉曲線である。輪郭抽出部1105は、入力された画像から図形の閉じた輪郭線を抽出する部分である。なお、デジタイザなどで図形の輪郭を表す閉曲線を直接的に入力するための線図形入力部1106を設け、これにより入力された図形に対しては輪郭抽出処理は不要である(必要に応じて細線化処理を施してもよい)。多角形近似部1110は、入力図形の輪郭線に対し、例えばRamerの方法などによって、多角形近似(区分線分近似)をする部分である。例えば図8に示す図形の画像が入力された場合、図9に示す閉輪郭線が抽出され、これが図10に示すような多角形に近似される。
【0093】
特徴抽出部1115は、多角形近似された輪郭を、量子化方向特徴と準凹凸構造に基づいて解析し、連続したいくつかの線分をより高いレベルの構造的特徴に統合することにより、図形の輪郭の構造的特徴のコンパクトな表現を得る部分である。この量子化方向特徴と準凹凸構造に基づく構造的特徴の抽出処理の内容は、前記実施例1に関連して図4のフローチャートを参照し説明した通りであるので、ここでは説明を繰り返さない。
【0094】
予め用意された多数のモデル図形の集合に対し、各モデル図形毎にその輪郭の構造的特徴が以上に述べた方法により予め抽出され、それが辞書1125に格納されている。図形の分類の際には、マッチング部1120において、特徴抽出部1115から入力される入力図形の輪郭の構造的特徴と、辞書1125より入力されるモデル図形の輪郭の構造的特徴とのマッチングを行い、モデル図形と入力図形との輪郭の相違度(又は類似度)を求める。分類(認識)部1130は、マッチング部1120で求められた各モデル図形と入力図形との相違度(又は類似度)を比較し、入力図形に最も近い、つまり相違度の最も小さい(又は類似度の最も大きい)モデル図形を1つ(又は複数個)選ぶ。
【0095】
マッチング部1120は、概念的には、入力図形とモデル図形の輪郭の構造的特徴の間の最適な対応関係を求める対応付け部1121と、この対応関係をもとに輪郭の構造的特徴間のだいたいの点対応が決められるので、この点対応をもとにモデル図形を入力図形に近づけるようにモデル図形の幾何学的変換(モデル図形の正規化)を行う正規化部1122と、正規化後のモデル図形と入力図形の間の距離を計算する距離計算部1123とからなる。
【0096】
対応付け部1121は、2つの輪郭の構造的特徴間の対応関係を求める際に、2つの輪郭の構造的特徴を互いに近くなるように、それぞれの構造的特徴を編集するためのコストを評価し、この編集コストが最小となるような最適な対応関係を求める。このような2つの輪郭の構造的特徴の編集とそのコストについて次に説明する。
【0097】
前述のように、多角形近似された輪郭から構造的特徴によるコンパクトな表現を得ることができるが、このような記述は、輪郭線に加わるノイズや、観測されるスケールによって生じる凹凸変化に影響されやすい。繰り返しになるが、例えば、図14の(A)の部分輪郭と(B)の部分輪郭は大局的に見るとよく似ているが、局所的な変形のために構造的な特徴は異なったものとなる。N=4としたとき、(A)の部分輪郭は、それぞれ特性数<6,6>,<2.6>,<3,2>を持ち、
S1−t−S2−h−S3 のように結合する3つのセグメントにより表される。これに対し、(B)の部分輪郭は、それぞれ特性数<6,6>,<2,6>,<2,2>,<2,6>,<3,2>を持ちS1'−t−S2'−h−S3'−t−S4'−h−S5'のように結合する5つのセグメントにより表される。ノイズや観測スケールによる構造変化は輪郭線の法線方向の変形と考えることができるので、このような変形を吸収するために、それぞれの構造的特徴を、互いに似たようなものになるように編集することを考える。例えば、図14に示す2つの部分輪郭の場合、図15の(A)と(B)に示すように、S2,S2',S4'の部分を覆う如くセグメントのブロック{S1,S2,S3}と{S1',S2',S3',S4',S4',S5'}を1つのセグメントS,S'にそれぞれ置き換えることにより、互いに似た構造的特徴を持つように編集できる。
【0098】
より一般的に述べれば、一方の部分輪郭がm個の連続するセグメントのブロック{S1,S2,...,Sm}からなり、他方の部分輪郭がn個の連続するセグメントのブロック{S1',S2',...,Sn'}からなるとする。セグメントSi(i=1,...,m)の特性数を<ri,di>、セグメントSi'(i=1,...,n)の特性数を<ri',di'>とする。この2つの部分輪郭が次の条件(a)又は(b)を満たすときに、それぞれのセグメント・ブロックを1つのセグメントに置き換えることを考える。すなわち、
条件(a):S1−h−S2−t−・・・−t−Sm
かつ S1'−h−S2'−t−・・・−t−Sn'
を満たすときには、セグメント・ブロック{S1,S2,...,Sm}を
【0099】
【外10】
Figure 0003815704
【0100】
を持つ1つのセグメントSに置き換え、セグメント{S1',S2',...,Sn'}を
【0101】
【外11】
Figure 0003815704
【0102】
を持つ1つのセグメントS’に置き換えることを考える。
【0103】
条件(b):S1−t−S2−h−・・・−h−Sm
かつ S1'−t−S2'−h−・・・−h−Sn'
を満たすときには、セグメント・ブロック{S1,S2,...,Sm}を
【0104】
【外12】
Figure 0003815704
【0105】
を持つ1つのセグメントSに置き換え、セグメント{S1',S2',...,Sn'}を
【0106】
【外13】
Figure 0003815704
【0107】
を持つ1つのセグメントS’に置き換えることを考える。なお、上記の条件(a)と条件(b)は2つの部分輪郭の凹凸が一致するための条件である。そして、このような2つのセグメント・ブロックのセグメントへの置換のための編集コストを例えば次のように定義する。
【0108】
【数4】
Figure 0003815704
【0109】
ここで、l(Si)はセグメントSi(i=1,...,m)の長さ、l'(Si')はセグメントSi'(i=1,...,n)の長さ、L(S1S2・・・Sm)は{S1,S2,...,Sm}からなる部分輪郭の長さ、L(S1'S2'・・・Sn')は{S1',S2',...,Sn'}からなる部分輪郭の長さである。wは重み係数である。上式の右辺の第1項は統合後のセグメントS,S’の間の長さの差(長さの相違度)を表し、また、第3項は、統合後のセグメントS,S’の間の回転量の差(回転量の相異度)を表す。第2項が統合によって埋められるセグメントの長さの総和、つまり編集による変形量を表し、これが編集操作に関わる直接的なコストに相当する。ただし、2つの輪郭の構造的特徴を互いに近づけるための編集コストを評価することが目的であるから、編集後のセグメント間の相異度も当然考慮する必要がある。編集後の相異度が大きいのでは、その編集は無意味であるからである。したがって、上式では、編集による変形量に、編集後のセグメント間の相異度を修正項として加えた値を、編集コストとして評価している。ただし、編集コストの評価式はこれに限定されるものではなく、適宜な評価式を採用可能である。例えば、上式の右辺の3項を乗算した値を編集コストとするような評価式も可能である。
【0110】
さて、閉輪郭線の構造特徴はセグメントを要素とする循環列で記述できるので、マッチング部1120の対応付け部1121における2つの輪郭の構造的特徴の対応付けの問題は、上に述べたセグメントのブロック置換による編集のコストが全体として最小になるような、編集操作の集合を見つけることになる。例えば、図21に示すような、特性数<3,3>,<0,7>,<2,1>,<2,1>を持ちT1−h−T2−t−T3−h−T4−t−T1と結合した4つのセグメントT1,T2,T3,T4によって表されるモデル図形の輪郭と、図13に示すような入力図形の輪郭とのマッチングを考えると、編集の総コストが最小となる対応付けは、
(1){S4,S1,S2}←→{T2,T3,T4}
(2){S3}←→{T1}
である。
【0111】
正規化部1122は、このようにして決定された入力図形とモデル図形の輪郭の対応付けをもとに、モデル図形を入力図形に近づけるような幾何学的変換、例えばアフィン変換をモデル図形に施す。ただし、入力図形側をモデル図形に近づけるようにアフィン変換することも可能である。図21のモデル図形に上に述べたように入力図形とセグメント・ブロックを対応付けてアフィン変換を施すと、図22のような図形に正規化される。この正規化されたモデル図形と図10の入力図形を重ね合わせると図23のようになり、両図形のずれの程度がモデル図形と入力図形との類似度又は相違度に反映される。距離計算部1123は、上に述べたような正規化されたモデル図形と入力図形(入力図形側を正規化する場合は正規化された入力図形とモデル図形)との間の幾何学的な距離を計算する。この距離尺度としては、例えば、Housdorff距離や一般化Housdorff距離を用いることができる。
【0112】
以上に説明したマッチング部1120と分類(認識)部1130による処理の全体的な流れについて、図20のフローチャートを参照して要約する。マッチング部1120において、辞書1125より1つのモデル図形の輪郭の構造的特徴を取り出す(ステップ1150)。そして、対応付け部1121で、前述のように編集コストが最小となるようなモデル図形と入力図形の輪郭の構造的特徴間の最適な対応付けを求め(ステップ1151)、この対応付けに基づいて、正規化部1122でモデル図形に対し入力図形に近づけるようアフィン変換を施し(ステップ1152)、距離計算部1123でアフィン変換後のモデル図形と入力図形との間の距離を計算する(ステップ1153)。マッチング部1120は、同様の処理を各モデル図形に関して行い、最後のモデル図形に対する処理が終わると(ステップ1154,YES)、各モデル図形に関して得られた距離のデータを分類(認識)部1130に渡しマッチング処理を終わる。分類(認識)部1130において、渡された距離が小さい順にモデル図形をソートし(ステップ1155)、上位の1つ又は複数のモデル図形を分類候補として選び、その識別子を分類(認識)結果として出力する(ステップ1156)。
【0113】
マッチング部1120における1つのモデル図形と入力図形とのマッチングアルゴリズムの具体例をフローチャートの形式で図24乃至図26に示す。また、このアルゴリズム中で呼び出される関数segmentMatching()のアルゴリズムをフローチャートの形式で図27及び図28に示す。
【0114】
ここに示すマッチングアルゴリズムは動的計画法(DP)をもとにしており、2つの閉輪郭上のセグメントの個数をm,nとしたとき、O(mn log m)の手間でセグメント・ブロックの対応を見つけることができる。また、一方の輪郭(例えばモデル図形の輪郭)上のセグメント(s(1),s(2),...,s(m))が
s(1)-h−s(2)-t−・・・-t−s(m)-h−s(1)
と結合するような順番に並んでいるとし、他方の輪郭(例えば入力図形の輪郭)上のセグメント(t(1),t(2),...,t(n))が
t(1)-h−t(2)-t-・・・-t−t(n)-h−t(1)
と結合するような順番に並んでいるとする。また、形式的に、m<i<=2*m のときs(i)=s(i-m)、n<j<=2*n のとき t(j)=t(j-n) とする。また、ブロック置換により統合される連続したセグメントの最大個数をMBとする。left[2*n][2*m],right[2*n][2*m]はs,tの対応し得るセグメント・ブロックの範囲を記録するための2次元の整数配列である。
【0115】
ステップ1201〜1235のループ1は、xを1から1ずつインクリメントさせながらxがmin(m,MB)を超えるまで繰り返される。このループ1において、x−1(x=1,...,min(m,MB))だけシフトしたsのシフト列S(x)=(s(x),s(x+1),...,s(x+m-1)を考え、ステップ1203及びステップ1221で関数segmentMatching()を呼び出すことにより、シフト列S(x)と、tのシフト列T(j)=(t(j),t(j+1),...,t(j+n-1))との対応を見つける。ステップ1204〜1210及びステップ1222〜1228の部分で、関数segmentMatching()で設定されたポインタをもとに、S(x)とT(j)の間のセグメント・ブロックの対応を取り出す。ここで、関数segmentMatching()は、Wagner-Fisherによる近似ストリング・マッチングを応用するとO(mn)の手間がかかるので、総当たり的にマッチングを行えば全体でO(m・n2)の手間がかかることになるが、T(j)の生成順序を二分探索方式にし(ステップ1215〜1218,1232)、かつ、対応し得るセグメント・ブロックの範囲を2つの配列left,rightに記録しておくことによって、O(mn log m)の手間でセグメント・ブロックの対応を見つけることができる。これは、M.Maes, "On a cyclic string-to-string correction problem,"Information Processing Letters, vol.35, pp.73-78,1990 に述べられている方法の拡張である。
【0116】
なお、図24乃至図26のアルゴリズムにおいて、dminは距離の最小値のための変数で、ループ1に入る前にステップ1200で無限大に初期設定される。ループ1の内部において、ステップ1202でj=1,2,...,nのleft[j][0]に0を代入したのちleft[1][0]に1を代入する。ステップ1203で、segmentMatching()を図示のように引数を設定して呼び出す。ステップ1205からステップ1211までのループ2は、i0>=0の間、繰り返される。このループ中のステップ1206で、1つ前のセグメントの終わりを示す(k0,l0)をsegmentMatching()で設定された今現在のセグメントの終わり(i0,j0)からのポインタにする。ステップ1207〜1209のループ3は、k0>=0かつi0>k0の条件を満たす間、繰り返される。ステップ1212〜1214のループ4は、iをxからxmax-1まで1ずつインクリメントしながら、left[n+1][i]にleft[1][i]+nをright[n+1][i]にright[1][j]+nを代入する。ステップ1216から始まるループ5は、j<nの間、繰り返される。ループ5中には、ステップ1217〜1230のループ6があり、これはkを1から1ずつインクリメントしながらkがjを超えるまで繰り返される。ループ6のステップ1221でsegmentMatching()を引数を図示のように設定して呼び出す。ステップ1223〜1229のループ7は、i0>=0の間、繰り返される。ステップ1224で、1つ前のセグメントの終わりを示す(k0,l0)を、segmentMatching()で設定された今現在のセグメントの終わり(i0,j0)からのポインタにする。ステップ1225〜1227のループ8はk>=0かつi0>k0の間繰り返す。ステップ1234では、dminをとるようなセグメント・ブロックの対応を、その時点における2つの輪郭の最適対応とする。最終的な最適対応と距離dminは、ループ1の最終回のステップ1234で決まる。
【0117】
図27及び図28に示す関数segmentMatching()は、引数としてセグメント列s,tのシフト量x,y、対応し得るセグメント・ブロックの範囲を記録する配列left,right、これまでに見つかったセグメント・ブロックの対応から求められた図形間距離の最小値dminを与えられ、sのシフト列S(x)=(s(x),s(x+1),...,s(x+m-1))と、tのシフト列T(j)=(t(j),t(j+1),...,t(j+n-1))の間で、ブロック置換による編集コストが最小になるようなセグメント・ブロックの対応を求めるものである。ここに示すアルゴリズムは、DPをもとにした、2つの文字列間の近似対応を求めるWagner-Fisherのアルゴリズムの拡張である。
【0118】
最初のステップ1300で、l=0〜2*n-1のD(x-l,l)と、k=0〜2*m-1のD(k,y-1)に無限大を代入し、D(x-1,y-1)に0を代入し、xmaxにx+mを代入し、ymaxにy+nを代入した後、ループ1に入る。このループ1は、iをxから1ずつインクリメントしながら、iがxmax-1を超えるまで繰り返される。ループ1中のループ2は、jをyから1ずつインクリメントしながら、yがymax-1を超えるまで繰り返される。ステップ1305では、s(i-k+1),s(i-k+2),...,s(i)とt(j-l+1),t(j-l+2),...,t(j)のブロック置換による編集コストeとD(i-k,j-l)の和を最小にするk,lをk0,l0に設定する。ステップ1306の判定に用いるeは、k=k0,l=l0のときの編集コストの値である。
【0119】
ステップ1310では、(xmax-1,ymax-1)からポインタを(後ろから前へ)辿ることにより、編集コストが最小の対応付けに基づきモデル図形を正規化し、正規化後のモデル図形と入力図形の間の距離dを求める。すなわち、対応したセグメント・ブロックの各組に対して、2つの輪郭上に同じ個数の対応点を選び、最小二乗法によって、S(x)に対応する図形をT(j)に近い図形に変換するようなアフィン変換を計算する。T(j)とアフィン変換されたS(x)の距離を、Hausdorff距離
【0120】
【数5】
Figure 0003815704
【0121】
又は、一般化Hausdorff距離
【0122】
【数6】
Figure 0003815704
【0123】
により計算する。そして、求めた距離値dが、それまでに求められた距離の最小値dminより小さければ、その距離値dをdminに代入し(ステップ1311,1312)、dminの値を戻り値として返す(ステップ1313)。
【0124】
本実施例によれば、以上の説明から明らかなように、ノイズや大局的・局所的変換による図形の変形、輪郭の構造的特徴の変化がある場合にも、2つの図形の輪郭の構造的特徴の間の対応付けと図形の正規化を的確に行い、図形間の類似度又は相違度を精度良く評価できる。また、そのような対応付けや正規化は特徴空間での処理であるため、そのための演算量は比較的少ない。したがって、ノイズや大局的・局所的変換から生ずる図形の変形、特徴の変化に頑健で、かつ効率的な図形分類が可能になる。
【0125】
なお、本実施例の図形分類システムは、例えば図3に簡略化して示すような構成のコンピュータ上で、プログラムにより実現することができる。モデル図形の構造的特徴の集合である辞書1125は大容量記憶装置210に保存される。このコンピュータ上で図19中の各機能部1100,1105,1110,1115,1120(1121,1122,1123),1130の機能を実現するための図形分類プログラム1126は、例えばディスクドライブ230にセットされたディスク媒体235より読み込まれて大容量記憶装置210に格納される。このプログラム1126は、必要な時にその全部又は一部がメモリ205にロードされてCPU200により実行される。入力図形の画像又は線図形は入力装置215によって入力される。
【0126】
【発明の効果】
請求項1又は2の発明によれば、図形のノイズや変形に頑健な図形分類又は検索が可能になる。また、比較的少ない計算量で変形図形の構造的特徴を合成することができるため、効率的な図形分類又は検索の処理が可能である。
【0127】
請求項3乃至6の各項の発明によれば、1モデルにつき1サンプルしか使えないような場合にも、ノイズや変形に頑健で効率的かつ高速な構造的インデクシングによる図形分類又は検索が可能である。また、請求項9又は10の発明によれば、そのような図形のノイズや変形に対して頑健な図形分類又は検索を、コンピュータを利用し容易に実施できる。
【0128】
請求項7の発明によれば、比較的少ない計算量で、図形のノイズや変形を考慮した図形分類のための特徴を得ることができる。請求項8の発明によれば、1モデルにつき1サンプルしか使えないような場合にも、図形のノイズや変形に頑健な構造的インデクシングによる図形分類を可能にするための表を、比較的少ない計算量で作成することができる。
【0129】
請求項11又は12の発明によれば、ノイズや大局的・局所的変換から生ずる図形の変形、特徴の変化に対して頑健で効率的な図形分類が可能である。また、請求項13の発明によれば、そのような図形分類を、コンピュータを利用し容易に実施できる。
【0130】
請求項14の発明によれば、図形の変形、特徴の変化がある場合でも2つの図形間の類似度又は相違度の的確な評価が可能であり、また、その評価のための処理を特徴空間において比較的少ない計算量で行うことができる。請求項16又は15の発明によれば、図形の変形、特徴の変化がある場合でも、特徴空間での効率的な処理によって、的確な図形の対応付け又は正規化を行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例による図形分類検索システムの概略構成図である。
【図2】構造的インデクシングのための分類表の模式図である。
【図3】本発明をプログラムで実現するためのコンピュータのハードウェア構成の一例を簡略化して示すブロック図である。
【図4】特徴抽出処理の流れを示すフローチャートである。
【図5】特徴抽出過程で得られるデータを関連付けて示す図である。
【図6】特徴合成処理の流れを示すフローチャートである。
【図7】分類検索部の処理の流れを示すフローチャートである。
【図8】入力される図形の画像の一例を示す図である。
【図9】図形の閉輪郭線の一例を示す図である。
【図10】多角形近似された閉輪郭線の一例を示す図である。
【図11】方向軸と量子化方向コードの一例を示す図である。
【図12】輪郭の部分セグメントへの分割例を示す図である。
【図13】部分セグメントの統合による輪郭のセグメントへの分割例を示す図である。
【図14】大局的には似ているが局所的変形により構造的特徴が異なった2つの部分輪郭の例を示す図である。
【図15】図14の2つの部分輪郭を近づけるための編集の例を示す図である。
【図16】図12中の部分セグメントA,Bの連結点に関する量子化方向の説明のための図である。
【図17】図12中の部分セグメントG,Hの連結点に関する量子化方向の説明のための図である。
【図18】回転によるセグメントの特性数の変換の例を示す図である。
【図19】本発明の第2の実施例による図形分類システムの概略構成図である。
【図20】マッチング処理及び分類処理の流れを示すフローチャートである。
【図21】モデル図形の輪郭とそのセグメント分割の例を示す図である。
【図22】図21のモデル図形を図13の入力図形に近づけるように正規化した図形の例を示す図である。
【図23】図22の図形と図13の図形を重ねて示す図である。
【図24】マッチング・アルゴリズムの例を示すフローチャートである。
【図25】図24に示したマッチング・アルゴリズムの続きを示すフローチャートである。
【図26】図25に示したマッチング・アルゴリズムの続きを示すフローチャートである。
【図27】図24乃至図26に示したマッチング・アルゴリズムにおいて呼び出される関数segmentMatching(x,y,left,right,dmin)のアルゴリズムの例を示すフローチャートである。
【図28】図27に示したアルゴリズムの続きを示すフローチャートである。
【符号の説明】
100 図形入力部
105 特徴抽出部
110 特徴合成部
115 分類検索部
120 分類表
125 図形データベース
150 モデル図形入力部
155 特徴抽出部
160 特徴合成部
165 表作成部
200 CPU
205 メモリ
210 ハードディスク等の大容量記憶装置
215 スキャナ、デジタルカメラ、デジタイザ等の入力装置
220 ディスプレイ
225 キーボード、マウス等の入力装置
230 ディスクドライバ
235 フロッピーディスクやCD−ROM等のディスク媒体
250 図形分類検索プログラム
1100 画像入力部
1105 輪郭抽出部
1110 多角形近似部
1115 特徴抽出部
1120 マッチング部
1121 対応付け部
1122 正規化部
1123 距離計算部
1125 辞書
1130 分類部
1126 図形分類プログラム

Claims (16)

  1. コンピュータによる図形分類処理方法であって、前記コンピュータは、図形を入力する図形入力ステップと、前記図形入力ステップによる入力図形の構造的特徴を抽出する特徴抽出ステップと、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記特徴抽出ステップにより抽出された構造的特徴から変形図形の構造的特徴を合成する特徴合成ステップと、前記特徴抽出ステップ及び前記特徴合成ステップによって得られた各構造的特徴に基づいて前記入力図形を分類する分類ステップとを実行することを特徴とする図形分類処理方法。
  2. コンピュータによる図形検索処理方法であって、前記コンピュータは、図形を入力する図形入力ステップと、前記図形入力ステップによる入力図形の構造的特徴を抽出する特徴抽出ステップと、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記特徴抽出ステップにより抽出された構造的特徴から変形図形の構造的特徴を合成する特徴合成ステップと、前記特徴抽出ステップ及び前記特徴合成ステップによって得られた各構造的特徴に基づいて前記入力図形を分類し、分類結果に基づいて図形データベースを検索する分類検索ステップとを実行することを特徴とする図形検索処理方法。
  3. モデル図形により抽出された構造的特徴、又は、あらかじめ定められた図形変換に関する特徴変換規則に従って、前記モデル図形により抽出された構造的特徴から合成された変形図形の構造的特徴のいずれかを持つモデルの識別子のリストを、当該構造的特徴から計算されたインデックスのエントリーとする分類表を保持する記憶手段を具備するコンピュータによる図形分類処理方法であって、
    前記コンピュータは、図形を入力する図形入力ステップと、前記図形入力ステップによる入力図形の構造的特徴を抽出する特徴抽出ステップと、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記特徴抽出ステップにより抽出された構造的特徴から変形図形の構造的特徴を合成する特徴合成ステップと、前記特徴抽出ステップ及び前記特徴合成ステップによって得られた各構造的特徴からインデックスを計算し、該計算されたインデックスに対応する前記分類表のエントリーのモデル識別子リストを参照し、当該モデル識別子リストに含まれる各モデル識別子に対する投票操作を行って得票数の多いモデル識別子を求め、前記入力図形を分類する分類ステップとを実行することを特徴とする図形分類処理方法
  4. モデル図形により抽出された構造的特徴、又は、あらかじめ定められた図形変換に関する特徴変換規則に従って、前記モデル図形により抽出された構造的特徴から合成された変形図形の構造的特徴のいずれかを持つモデルの識別子のリストを、当該構造的特徴から計算されたインデックスのエントリーとする分類表を保持する記憶手段を具備するコンピュータによる図形検索処理方法であって、
    前記コンピュータは、図形を入力する図形入力ステップと、前記図形入力ステップによる入力図形の構造的特徴を抽出する特徴抽出ステップと、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記特徴抽出ステップにより抽出された構造的特徴から変形図形の構造的特徴を合成する特徴合成ステップと、前記特徴抽出ステップ及び前記特徴合成ステップによって得られた各構造的特徴からインデックスを計算し、該計算されたインデックスに対応する前記分類表のエントリーのモデル識別子リストを参照し、当該モデル識別子リストに含まれる各モデル識別子に対する投票操作を行って得票数の多いモデル識別子を求め、当該モデル識別子を検索キーとして図形データベースを検索する分類検索ステップとを実行することを特徴とする図形検索処理方法
  5. モデル図形により抽出された構造的特徴、又は、あらかじめ定められた図形変換に関する特徴変換規則に従って、前記モデル図形により抽出された構造的特徴から合成された変形図形の構造的特徴のいずれかを持つモデルの識別子のリストを、当該構造的特徴から計算されたインデックスのエントリーとする分類表を記憶する手段と、図形を入力する図形入力手段と、該図形入力手段による入力図形の構造的特徴を抽出する特徴抽出手段と、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記特徴抽出手段により抽出された構造的特徴から変形図形の構造的特徴を合成する特徴合成手段と、前記特徴抽出手段及び前記特徴合成手段によって得られた各構造的特徴からインデックスを計算し、該計算されたインデックスに対応する前記分類表のエントリーのモデル識別子リストを参照し、当該モデル識別子リストに含まれる各モデル識別子に対する投票操作を行って得票数の多いモデル識別子を求め、前記入力図形を分類する分類手段とを具備することを特徴とする図形分類システム。
  6. 図形データベースと、モデル図形により抽出された構造的特徴、又は、あらかじめ定められた図形変換に関する特徴変換規則に従って、前記モデル図形により抽出された構造的特徴から合成された変形図形の構造的特徴のいずれかを持つモデルの識別子のリストを、当該構造的特徴から計算されたインデックスのエントリーとする分類表を記憶する手段と、図形を入力する図形入力手段と、前記図形入力手段による入力図形の構造的特徴を抽出する特徴抽出手段と、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記特徴抽出手段により抽出された構造的特徴から変形図形の構造的特徴を合成する特徴合成手段と、前記特徴抽出手段及び前記特徴合成手段によって得られた各構造的特徴からインデックスを計算し、該計算されたインデックスに対応する前記分類表のエントリーのモデル識別子リストを参照し、当該モデル識別子リストに含まれる各モデル識別子に対する投票操作を行って得票数の多いモデル識別子を求め、当該モデル識別子を検索キーとして前記図形データベースを検索する分類検索手段とを具備することを特徴とする図形検索システム。
  7. コンピュータによる図形分類用特徴抽出処理方法であって、前記コンピュータは、図形を入力するステップと、入力図形の輪郭線又は線図形を多角形近似して、その構造的特徴を抽出するステップと、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記抽出された構造的特徴から、ノイズや局所的変形によって発生する変形図形の構造的特徴を合成するステップとを実行することを特徴とする図形分類用特徴抽出処理方法。
  8. コンピュータによる図形分類用表作成処理方法であって、前記コンピュータは、入力された各モデル図形から構造的特徴を抽出する特徴抽出ステップと、あらかじめ定められた図形変形に関する特徴変換規則に従って、前記特徴抽出ステップにより抽出された構造的特徴から変形図形の構造的特徴を合成する特徴合成ステップと、前記特徴抽出ステップ及び前記特徴合成ステップにより得られた各構造的特徴を持つモデルの識別子のリストを、当該各構造的特徴から計算されたインデックスに対応するエントリーとして登録する分類表を作成する表作成ステップとを実行することを特徴とする図形分類用表作成処理方法。
  9. 請求項5記載の図形入力手段、特徴抽出手段、特徴合成手段、及び分類手段としてコンピュータを機能させるための図形分類プログラムが記録されたことを特徴とする機械読み取り可能な情報記録媒体。
  10. 請求項6記載の図形入力手段、特徴抽出手段、特徴合成手段、及び分類検索手段としてコンピュータを機能させるための図形検索プログラムが記録されたことを特徴とする機械読み取り可能な情報記録媒体。
  11. コンピュータによる図形分類処理方法であって、前記コンピュータは、複数のモデル図形について図形について、該モデル図形の輪郭を多角形近似し、量子化方向特徴と準凹凸構造に基づいて連続したいくつかの線分をより高いレベルの構造的特徴に統合することにより各モデル図形の輪郭の構造的特徴を予め抽出して記憶手段に記憶しておくステップと、入力された図形について、該図形の輪郭を多角形近似し、量子化方向特徴と準凸凹構造に基づいて連続したいくつかの線分をより高いレベルの構造物特徴に統合して、入力図形の輪郭の構造的特徴を抽出するステップと、前記入力図形の輪郭の構造的特徴及び前記モデル図形の輪郭の構造的特徴をそれぞれ互いに近付けるために複数の構造的特徴を併合して1つの構造的特徴に置換する編集操作を行い、該編集操作に要する計算量を示す編集コストが最小になる入力図形とモデル図形の輪郭の構造的特徴の間の対応関係を求めるステップと、前記対応関係に従ってモデル図形と入力図形のうちの一方の図形の輪郭に対し他方の図形の輪郭に近づけるように幾何学的変換を施すステップと、前 幾何学的変換後の一方の図形の輪郭と他方の図形の輪郭の間の距離を計算し、計算するステップと、前記計算された距離の小さな1つ又は複数のモデル図形を入力図形の分類候補とするステップとを実行することを特徴とする図形分類処理方法。
  12. 複数のモデル図形について、該モデル図形の輪郭を多角形近似し、量子化方向特徴と準凹凸構造に基づいて連続したいくつかの線分をより高いレベルの構造的特徴に統合することにより抽出した各モデル図形の輪郭の構造的特徴を格納する辞書と、図形を入力するための図形入力手段と、前記図形入力手段により入力された図形について、該図形の輪郭を多角形近似し、量子化方向特徴と順凹凸構造に基づいて連続したいくつかの線分をよりに高いレベルの構造的特徴に統合して、入力図形の輪郭の構造的特徴を抽出するための特徴抽出手段と、前記特徴抽出手段により抽出された入力図形の輪郭の構造的特徴及び前記辞書に格納されているモデル図形の輪郭の構造的特徴をそれぞれ互いに近付けるために複数の構造的特徴を併合して1つの構造的特徴に置換する編集操作を行い、該編集操作に要する計算量を示す編集コストが最小になる入力図形とモデル図形の輪郭の構造的特徴の間の対応関係を求め、この対応関係に従ってモデル図形と入力図形のうちの一方の図形の輪郭に対し他方の図形の輪郭に近づけるように幾何学的変換を施し、この幾何学的変換後の一方の図形の輪郭と他方の図形の輪郭の間の距離を計算するマッチング手段と、前記マッチング手段により計算された距離の小さな1つ又は複数のモデル図形を入力図形の分類候補として選択する手段とを具備することを特徴とする図形分類システム。
  13. コンピュータを、請求項12記載の図形入力手段、特徴抽出手段、マッチング手段、及び、分類候補の選択のための手段として機能させるための図形分類プログラムが記録されたことを特徴とする機械読み取り可能な情報記録媒体。
  14. コンピュータによる図形間の類似度又は相違度の評価処理方法であって、前記コンピュータは、2つの図形について、それぞれの輪郭を多角形近似し、量子化方向特徴と準凹凸構造に基づいて連続したいくつかの線分をより高いレベルの構造的特徴に統合することにより輪郭の構造的特徴を抽出するステップと、前記抽出された図形の輪郭の構造的特徴をそれぞれ互いに近付けるために複数の構造的特徴を併合して1つの構造的特徴に置換する編集操作を行い、該編集操作に要する計算量を示す編集コストが最小になる両図形の輪郭の構造的特徴の間の対応関係を求めるステップと、前記求めた対応関係に従って一方の図形の輪郭に対し他方の図形の輪郭に近づけるように幾何学的変換を施すステップと、前記幾何学的変換後の一方の図形の輪郭と他方の図形の輪郭の間の距離を計算するステップとを実行することを特徴とする図形間の類似度又は相違度の評価処理方法。
  15. コンピュータによる図形正規化処理方法であって、前記コンピュータは、2つの図形について、それぞれの輪郭を多角形近似し、量子化方向特徴と準凹凸構造に基づいて連続したいくつかの線分をより高いレベルの構造的特徴に統合することにより輪郭の構造的特徴を抽出するステップと、前記抽出された2つの図形の輪郭の構造的特徴をそれぞれ互いに近付けるために複数の構造的特徴を併合して1つの構造的特徴に置換すれる編集操作を行い、該編集操作に要する計算量を示す編集コストが最小になる両図形の輪郭の構造的特徴の間の対応関係を求めるステップと、前記求めた対応関係に従って一方の図形の輪郭に対し他方の図形の輪郭に近づけるように幾何学的変換を施すステップとを実行すること特徴とする図形正規化処理方法
  16. コンピュータによる図形間対応付け処理方法であって、前記コンピュータは、2つの図形について、それぞれの輪郭を多角形近似し、量子化方向特徴と準凹凸構造に基づいて連続したいくつかの線分をより高いレベルの構造的特徴に統合することにより輪郭の構造的特徴を抽出するステップと、前記抽出された2つの図形の輪郭の構造的特徴をそれぞれ互いに近付けるために複数の構造的特徴を併合して1つの構造的特徴に置換する編集操作を行い、該編集操作に要する計算量を示す編集コストが最小になる両図形の輪郭の構造的特徴の間の対応関係を求めるステップとを実行すること特徴とする図形間対応付け処理方法
JP18840898A 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法 Expired - Fee Related JP3815704B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18840898A JP3815704B2 (ja) 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
US09/179,418 US6424746B1 (en) 1997-10-28 1998-10-27 Figure classifying method, figure classifying system, feature extracting method for figure classification, method for producing table for figure classification, information recording medium, method for evaluating degree of similarity or degree of difference between figures, figure normalizing method, and method for determining correspondence between figures

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP9-295237 1997-10-28
JP29523797 1997-10-28
JP31015297 1997-11-12
JP9-310152 1997-11-12
JP18840898A JP3815704B2 (ja) 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法

Publications (2)

Publication Number Publication Date
JPH11203461A JPH11203461A (ja) 1999-07-30
JP3815704B2 true JP3815704B2 (ja) 2006-08-30

Family

ID=27326033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18840898A Expired - Fee Related JP3815704B2 (ja) 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法

Country Status (2)

Country Link
US (1) US6424746B1 (ja)
JP (1) JP3815704B2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100518860B1 (ko) * 1999-07-05 2005-09-30 엘지전자 주식회사 이미지의 특징소 정규화 정보를 사용한 이미지 검색 방법
GB2352076B (en) * 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
JP2001256244A (ja) 2000-03-14 2001-09-21 Fuji Xerox Co Ltd 画像データ分類装置および画像データ分類方法
US7065242B2 (en) * 2000-03-28 2006-06-20 Viewpoint Corporation System and method of three-dimensional image capture and modeling
US6658147B2 (en) * 2001-04-16 2003-12-02 Parascript Llc Reshaping freehand drawn lines and shapes in an electronic document
JP4169522B2 (ja) * 2002-03-22 2008-10-22 株式会社リコー 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
AU2003275724A1 (en) * 2002-11-07 2004-06-07 Matsushita Electric Industrial Co., Ltd. Method for cerficating individual, iris registering device, system for certificating iris, and program for cerficating individual
JP4259949B2 (ja) 2003-08-08 2009-04-30 株式会社リコー 画像作成装置、画像作成プログラムおよび記録媒体
US20050058350A1 (en) * 2003-09-15 2005-03-17 Lockheed Martin Corporation System and method for object identification
EP1756752A4 (en) * 2003-11-13 2011-03-16 Honda Motor Co Ltd ENCRYPTION OF IMAGES USING MEASUREMENTS, LOCAL LINEAR STRUCTURE AND AFFINED SYMMETRY
JP4543759B2 (ja) * 2004-06-02 2010-09-15 トヨタ自動車株式会社 物体認識方法
US20060193520A1 (en) * 2005-02-28 2006-08-31 Takeshi Mita Object detection apparatus, learning apparatus, object detection system, object detection method and object detection program
JP4721830B2 (ja) * 2005-08-31 2011-07-13 トヨタ自動車株式会社 画像検索方法及び装置
WO2007026870A1 (ja) * 2005-09-02 2007-03-08 Nec Corporation データのクラスタリング装置、クラスタリング方法及びクラスタリング用プログラム
WO2007038612A2 (en) * 2005-09-26 2007-04-05 Cognisign, Llc Apparatus and method for processing user-specified search image points
CN101055620B (zh) * 2006-04-12 2011-04-06 富士通株式会社 形状比较装置和方法
US9305235B1 (en) * 2007-12-21 2016-04-05 Cognex Corporation System and method for identifying and locating instances of a shape under large variations in linear degrees of freedom and/or stroke widths
US20090208055A1 (en) * 2008-02-20 2009-08-20 Lockheed Martin Corporation Efficient detection of broken line segments in a scanned image
ATE553433T1 (de) * 2008-11-06 2012-04-15 Servicetrace E K VERFAHREN UND VORRICHTUNG ZUM BESTIMMEN EINER KENNGRÖßE EINES IT-SYSTEMS
US8488886B2 (en) * 2010-08-02 2013-07-16 Celartem, Inc. Font matching
JP5651414B2 (ja) * 2010-09-16 2015-01-14 株式会社東芝 車両検出装置
JP5754055B2 (ja) * 2010-11-26 2015-07-22 日本電気株式会社 物体または形状の情報表現方法
JP5757293B2 (ja) * 2010-12-28 2015-07-29 日本電気株式会社 物体形状認識方法、物体形状認識システム及びプログラム
US9870517B2 (en) * 2011-12-08 2018-01-16 Excalibur Ip, Llc Image object retrieval
US10127824B2 (en) 2016-04-01 2018-11-13 Yen4Ken, Inc. System and methods to create multi-faceted index instructional videos
CN106643545B (zh) * 2016-10-09 2018-10-26 湖南大学 激光位移技术测量钢轨轮廓的校准方法
CN106775548B (zh) * 2016-11-25 2018-02-23 北京小米移动软件有限公司 页面处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2156564B (en) * 1984-03-08 1987-10-28 Agency Ind Science Techn Device and method for pattern recognition
US5144679A (en) * 1987-06-29 1992-09-01 Hitachi, Ltd Graphic data searching and storage method
JP3001966B2 (ja) 1990-11-30 2000-01-24 株式会社リコー 文字認識用辞書の作成方法
JP3260843B2 (ja) 1992-08-25 2002-02-25 株式会社リコー 文字認識方法
JP2626528B2 (ja) * 1993-11-22 1997-07-02 日本電気株式会社 図形認識装置

Also Published As

Publication number Publication date
JPH11203461A (ja) 1999-07-30
US6424746B1 (en) 2002-07-23

Similar Documents

Publication Publication Date Title
JP3815704B2 (ja) 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
Attalla et al. Robust shape similarity retrieval based on contour segmentation polygonal multiresolution and elastic matching
Yang et al. Content-based 3-D model retrieval: A survey
JP4924165B2 (ja) 形状比較装置および形状比較方法
Mitra et al. Partial and approximate symmetry detection for 3d geometry
Bai et al. 3D shape matching via two layer coding
Agathos et al. 3D articulated object retrieval using a graph-based representation
JP5754055B2 (ja) 物体または形状の情報表現方法
JP2002222425A (ja) 情報処理装置及び方法
KR19980069941A (ko) 후보 테이블을 이용하여 분류를 행하는 패턴 인식 장치 및 방법
Ahmad et al. Describing colors, textures and shapes for content based image retrieval-a survey
US11682166B2 (en) Fitting 3D primitives to a high-resolution point cloud
Nishida Structural feature indexing for retrieval of partially visible shapes
JP3753880B2 (ja) 図形分類方法、図形検索方法、図形分類検索システム及び記録媒体
Pengcheng et al. Fast Chinese calligraphic character recognition with large-scale data
Xu A generalized discrete morphological skeleton transform with multiple structuring elements for the extraction of structural shape components
Kassis et al. Word spotting using radial descriptor graph
Rusiñol et al. Symbol Spotting in Digital Libraries
Saabni et al. Fast key-word searching via embedding and active-dtw
Lardeux et al. Low-complexity arrays of contour signatures for exact shape retrieval
JPH10289320A (ja) 候補テーブルを用いて分類を行うパターン認識装置および方法
JP2000076464A (ja) 図形認識方法、図形認識装置、図形分類方法、図形分類装置、記録媒体、及び、図形特徴抽出方法
JP2000067235A (ja) 図形分類方法、図形検索方法、記録媒体、図形分類装置、及び、図形検索装置
Lin et al. Efficient shape classification using region descriptors
Sclaroff et al. Search by shape examples: Modeling nonrigid deformation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090616

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees