JPH11203461A - 図形分類方法、図形検索方法、図形分類システム、図形検索システム、図形分類用特徴抽出方法、図形分類用表作成方法、情報記録媒体、図形間の類似度又は相異度の評価方法、図形正規化方法、及び、図形間対応付け方法 - Google Patents

図形分類方法、図形検索方法、図形分類システム、図形検索システム、図形分類用特徴抽出方法、図形分類用表作成方法、情報記録媒体、図形間の類似度又は相異度の評価方法、図形正規化方法、及び、図形間対応付け方法

Info

Publication number
JPH11203461A
JPH11203461A JP10188408A JP18840898A JPH11203461A JP H11203461 A JPH11203461 A JP H11203461A JP 10188408 A JP10188408 A JP 10188408A JP 18840898 A JP18840898 A JP 18840898A JP H11203461 A JPH11203461 A JP H11203461A
Authority
JP
Japan
Prior art keywords
graphic
feature
structural
model
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10188408A
Other languages
English (en)
Other versions
JP3815704B2 (ja
Inventor
Hirofumi Nishida
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP18840898A priority Critical patent/JP3815704B2/ja
Priority to US09/179,418 priority patent/US6424746B1/en
Publication of JPH11203461A publication Critical patent/JPH11203461A/ja
Application granted granted Critical
Publication of JP3815704B2 publication Critical patent/JP3815704B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ノイズや局所的変形に頑健な効率的な図形分
類検索を実現する。 【解決手段】 図形を入力し(100)、その構造的特徴を
抽出し(105)、抽出された構造的特徴に変換規則を適用
して変形図形の構造的特徴を合成し(110)、それら各構
造的特徴からインデックスを計算し、分類表120の対応
したエントリーのモデル識別子リストを参照し、モデル
別の投票操作を行って候補モデルを絞り込み、また候補
モデルの識別子をキーとして図形データベース125を検
索する(115)。モデル構築系(150,155,160,165)は、モデ
ル図形の構造的特徴とその変形図形の構造的特徴を生成
し、これらからインデックスを計算し、それら各構造的
特徴を持つモデルの識別子のリストを分類表120の対応
したエントリーに貯える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、図形の分類・検索
の分野に係り、特に図形輪郭の構造的特徴を利用する図
形の分類・検索技術に関する。
【0002】
【従来の技術】輪郭には図形や物体に関するすべての情
報が含まれているため、これまで、モデルを使った閉輪
郭線の分類(認識)のための多種多様な方法が考案され
てきた。通常の認識アルゴリズムにおいては、個々のモ
デルについて、互いに独立したデータ構造・モデルを考
えるが、モデルの個数が多くなったときには、モデルの
数に比例して認識の効率が低下する。そこで「構造的イ
ンデクシング」という方法が考えられるようになった。
【0003】この構造的インデクシングの基本的な考え
方は、モデルの集合に対して、一つの大規模なデータ構
造(表)を用意し、モデル図形から得られる離散的な特
徴量(構造的特徴)をインデックスとして、その大規模
なデータ構造にモデルを分散して配置し、入力図形を認
識(分類)する時には、入力図形から得られる特徴量を
表と照らし合わせて、各モデルへの投票によって、照合
し得るモデルを絞り込むというものである。そのような
データ構造の例としては、特徴量からインデックスを計
算し、そのインデックスに対応する表のエントリーが、
その特徴量を持つモデルの識別子のリストであるような
大規模な表がある。
【0004】このような構造的インデクシングでは、複
雑な図形については、簡単な投票操作で得られる第1候
補が常に正解であるとは限らない。複雑な図形を認識す
る場合には、構造的インデクシングによって少数(数%
から10%のモデル)の候補モデルを絞り込み、この候
補モデルに対して別の複雑な認識アルゴリズムを適用す
る必要がある。したがって、構造的インデクシングに要
求される条件としては、投票によって絞り込まれる全体
の数%から10%の数の候補モデルの中に、必ず正しい
モデルが含まれていること、そして、その処理に必要と
される時間が、その後の複雑な認識アルゴリズムに必要
な時間に比べて無視できるほど、処理速度が高速である
ことである。この2条件が満たされれば、構造的インデ
クシングによって、認識精度を落とすことなく図形認識
の数十倍のスピードアップが可能になる。これら2つの
条件は、大規模図形データベースの図形検索において
も、性能と効率を決定づける本質的な条件である。
【0005】このような問題が本格的に考えられるよう
になったのは、コンピュータのディスクやメモリの容量
が増加した最近になってからであるが、80年代にも研
究が行われていた。例えば、Bairdは印刷文字認識への
応用を考え、各モデル(文字図形)から得られるそれぞ
れの特徴に1つのビットを割り当てることにより、図形
を特徴の有無によってビット列で表現する方法を考案し
た(Henry S. Baird,"Feature identification for hyb
rid structural/statistical patternclassification,"
Computer Vision,Graphics,and Image Processing, vo
l.42,pp.318-333, 1988)。この方法は、各文字に対し
て大量のトレーニングデータがある場合に適用可能であ
り、円弧、ストローク、交差点、穴、端点などの構造的
特徴を種類別にパラメータ表現し、パラメータ空間での
クラスタリングを行い、各クラスタに1つのビットを割
り当てる。入力図形に、それぞれのビットに対応する特
徴が存在すれば、そのビットに1が設定される。このよ
うにして構成される大規模次元のビット・ベクトルの分
類により、入力図形が分類される。
【0006】ところが、1つのモデル図形に対して1つ
のサンプル図形しか使えないような場合には、このBair
dの方法は適用できない。構造的特徴の弱点は、ノイズ
や変形により特徴が変化することであるが、Bairdの方
法では、1つのモデルに対し大量のサンプルパターンを
用意して、データからの統計的・帰納的学習により実際
に起こり得る多種多様な特徴変化に対処するからであ
る。
【0007】ここで考えている1モデルにつき1つのサ
ンプル図形しか使えないような場合に対処するため、St
einとMedioniは、図形輪郭を様々な許容誤差で多角形近
似して生成される複数の図形から構造的特徴を抽出する
方法を考案した(F.Steinand G.Medioni,"Structural i
ndexing: efficient 2-D object recognition,"IEEE Tr
ansactions on Pattern Analysis and Machine Intelli
gence,vol.14,no.12,pp.1198-1204, 1992)。また、Del
BimboとPalaは、曲線を様々な広がりをもつガウシアン
関数で平滑化して凹凸特徴を抽出するスケール・スペー
ス法と構造的インデクシングを統合した方法を考案した
(A. Del Bimbo and P.Pala,"Image indexing using sh
ape-based visual features," Proceedings of13th Int
ernational Conference on Pattern Recognition,Vienn
a,Austria,August 1996,vol.C, pp.351-355)。このよ
うな方法では、各スケールから得られる構造的特徴の記
述をもとにして、ノイズや輪郭の局所的な変形を考慮し
た階層的なデータ構造を構築する。ただし、スケールス
ペース法では、輪郭を様々な広がりを持つガウシアン関
数で平滑化するため計算量が増大し、さらに、隣接する
異なったスケール間で特徴の対応を見つけるという処理
が必要となる。
【0008】このように、1つのモデルに1つのサンプ
ルしか使えないような状況で、構造的特徴を変えてしま
うようなノイズや局所的変形に頑健な構造的インデクシ
ングのための効率的なかつ効果的方法は未だ考案されて
おらず、それが実用面での大きな障害となっていた。
【0009】また、2つの閉輪郭線の間のマッチング
(対応付け)、分類(認識)のための多種多様な方法が
考案されてきたが、現実に観測される入力図形にはノイ
ズや大局的・局所的な変形が加わっているため、マッチ
ングのアルゴリズムの設計においては、どのような変
形、変換がどの程度に許容されるかという前提条件が必
要となる。これまでに考案された方法の中にも、大きさ
の変化を許さないものや回転に対応できないものなどが
ある。さらに、伸び縮みのない対象である「剛体」だけ
を考慮している方法も多い。
【0010】特に、大局的な変形としてアフィン変換を
考えた場合、フーリェ特徴やモーメント特徴がアフィン
変換に不変な特徴であることが知られている。しかしな
がら、それらの特徴によって形状を分類するには、高次
の係数(2次元図形のフーリェ級数展開の係数やモーメ
ントの次数)が必要であるため、多大な計算量を要する
という問題があり、さらに、それら高次の係数はノイズ
に敏感で、安定なのは低次の係数だけであるという問題
がある。また、これらの特徴を用いた方法では、単に図
形を係数パラメータを使って分類するだけであるので、
具体的な図形間の点対応や変換パラメータを求めること
ができない。
【0011】このような問題から、図形をその輪郭上の
特徴の列として記述し、2つの輪郭特徴列の最適対応問
題として取り扱う方法が考案された。その代表例が、輪
郭の凹凸特徴による表現であり、文字認識を含む図形認
識の分野に応用されてきた。特に、凹凸構造はノイズの
ほか図形を観測するスケールに依存するところからスケ
ール・スペース法と呼ばれるが、閉輪郭線を大小様々な
サポートの大きさを持つガウシアン関数で平滑化し、凹
凸の変化点である変曲点を抽出する方法が考案された
(上田,鈴木:”多重スケールの凹凸構造を用いた変形
図形のマッチングアルゴリズム”,電子情報通信学会論
文誌 D-II,vol.J73-D-II,no.77,pp.992-1000,1990
年7月、及び、F.Mokhtarian, "Silhouette-based isola
tedobject recognition through curvature-scale spac
e,"IEEE Transaction onPattern Analysis and Machine
Intelligence, vol.17, no.5, pp.539-543,May 199
5)。
【0012】この方法の利点は、曲線を「変曲点」とい
う特徴で代表させることにより、情報量を縮約したコン
パクトな構造表現を用いていることにある。しかしなが
ら、この方法には次のような問題点がある。まず、具体
的にどのような変形、変換が許容できるのかが明確でな
いために、実際にこの方法を用いる場合、どのようなこ
とに注意しなければならないのかが、明確でない。ま
た、実際のデジタル画像からの曲率の計算においては、
Spline曲線、Bezier曲線などを使ってデジタル点列を曲
線近似する必要があり、計算量が多い。さらに、スケー
ル・スペース法では、様々なサポート(スケールを表
す)を持つガウシアン関数で曲線を平滑化したうえで、
異なったスケール間での変曲点の対応を見つける必要が
あるが、計算量が多いほか、対応付けの過程でエラーが
入り込む可能性が大きい。
【0013】スケール・スペース法の他にも、輪郭を多
角形近似(区分線分近似)し、線分列の角度変化を特徴
として、輪郭を角度変化を表す文字列で記述し、近似的
なストリング・マッチング手法を適用する方法も考案さ
れている( H.Bunke andU.Buehler, "Applications of
approximate string matching to 2D shaperecognitio
n," Pattern Recognition, vol.26, no.12, pp.179
7-1812,December 1993)。しかし、この方法では、輪郭
を近似する線分を構成要素にしているため、情報があま
り縮約されず、処理量の軽減が考慮されていないという
問題がある。また、許容される変換も明かでなく、近似
的なストリング・マッチングの基準となっている編集コ
ストが必ずしも図形間の類似度をうまく表さないため、
分類や認識の基準としては適当でない。
【0014】
【発明が解決しようとする課題】本発明は、前述の諸点
に鑑みてなされたもので、その目的は、図形の構造的特
徴を変えてしまうようなノイズや局所的若しくは大局的
な変形に頑健な図形分類又は検索のための方法又はシス
テムを提供することにある。本発明のもう一つの目的
は、大量のモデル図形に対し1モデルにつき1サンプル
しか使えないような場合でも、ノイズや変形に頑健な効
率的、高速な構造的インデクシングによる図形分類又は
検索方法及びシステムを提供することにある。本発明の
他の目的は、そのようなノイズや変形に頑健な図形分類
又は検索の方法又はシステムを実現するための特徴抽出
方法、分類用表の作成方法、図形間の類似度又は相異度
の評価方法、輪郭の構造的特徴の対応付け方法、図形の
正規化方法などを提供することである。
【0015】
【課題を解決するための手段】図形の閉輪郭線(又は線
図形そのもの)を多角形近似し、量子化方向特徴と準凹
凸構造に基づいて、連続した線分をより高いレベルの構
造的特徴に統合するパターン特徴抽出方法は、比較的簡
単な処理によってコンパクトな構造的特徴を抽出するこ
とができる。しかし、このような方法で得られる構造的
特徴は、ノイズやスケールによって生ずる局所的な凹凸
構造の変化により変動するため、1つのモデルに1つの
サンプルしか使えないような場合に、単純に、モデルの
構造的特徴と入力図形の構造的特徴とを突き合わせて図
形の分類や検索を行うと、ノイズや局所的変形に弱い。
【0016】そこで、請求項1乃至10の発明にあって
は、入力された図形そのものを実際に変形するかわり
に、入力図形から抽出した構造的特徴に予め定めた図形
変形に関する特徴変換の規則を適用することにより、ノ
イズや局所的変形が加わった変形図形から抽出される可
能性のある構造的特徴を合成し、これら抽出された構造
的特徴と合成された各構造的特徴をそれぞれ図形の分類
又は検索に利用する。
【0017】構造的インデクシングによる場合、モデル
構築の際に、モデル図形から抽出した構造的特徴に予め
定めた変換規則を適用することにより、ノイズや局所的
変形が加わった変形図形から抽出される可能性のある構
造的特徴を合成する。そして、モデルの集合に対し、イ
ンデックスが特徴量に対応しエントリーがその特徴量を
持つモデルの識別子のリストであるような1つの大規模
な表(分類表と呼ぶ)を用意し、モデル構築時に、各モ
デル図形から抽出された構造的特徴と変換規則により合
成された構造的特徴のそれぞれからインデックスを計算
し、それぞれのインデックスに対応した分類表のエント
リーに、その構造的特徴を持つモデルの識別子のリスト
を貯える。図形の分類又は検索の際には、同様に、入力
された図形から抽出した構造的特徴に変換規則を適用す
ることによりノイズや局所的変形が加わった変形図形か
ら抽出される可能性のある構造的特徴を合成し、抽出さ
れた構造的特徴と合成された構造的特徴のそれぞれから
インデックスを計算し、各インデックスに対応した分類
表のエントリーのモデル識別子リストを参照し、当該モ
デル識別子リストに含まれる各モデル識別子に対する投
票操作を行って得票数の多いモデルを候補として絞り込
む。また、この分類結果を検索キーとしてデータベース
を検索する。
【0018】請求項11乃至16の発明にあっては、図
形の輪郭の構造的特徴を抽出する方法として、曲線近似
や多重スケールによる平滑化などの計算量の問題を解決
し、かつ少数の構成要素によるコンパクトな表現を得る
ために、図形の輪郭を区分的線分で近似し(多角形近
似)、量子化方向特徴と準凹凸構造に基づいて、連続し
たいくつかの線分をより高いレベルの構造的特徴に統合
する方法を用いる。また、ノイズやスケールによって生
ずる図形の輪郭の凹凸構造の局所的・大局的な変化に対
処するため、2つの図形、例えば分類しようとする入力
図形と予め用意されたモデル図形について、それぞれの
輪郭の構造的特徴を互いに近づけるための編集コストに
着目し、この編集コストに基づいて2つの図形の輪郭の
構造的特徴の間の適切な対応関係を求める。そして、図
形間の類似度又は相違度をより幾何学的に表現し、図形
の分類(認識)の基準として、より図形本来の性質を持
った距離尺度とするため、上のようにして求めた対応関
係に従って、2つの図形の一方の図形に対し、その輪郭
を他方の図形の輪郭に近づけるようにアフィン変換など
の幾何学的変換を施すことにより正規化を行い、この正
規化後の図形と他方の図形の輪郭の間の幾何学的な距離
を計算し、この距離により2つの図形の類似度又は相違
度を評価する。図形分類の場合には、入力図形と各モデ
ル図形との間で同様の距離計算を行い、距離が小さい1
つ又は複数のモデル図形を分類候補として選ぶ。
【0019】
【発明の実施の形態】[実施例1]図1に、本発明の一
実施例による図形分類検索システムの概略構成を示す。
図1において、図形入力部100は分類(認識)したい
図形、あるいは、検索したい図形そのもの又はその検索
キーとしての図形を入力する部分である。ここで入力さ
れる図形とは、物体や図形の輪郭を表す閉曲線であり、
イメージスキャナやデジタルカメラ等の機器より撮像さ
れた画像から輪郭抽出によって抽出される場合と、デジ
タイザ等の機器により最初から線図形として(必要に応
じて細線化処理を施されて)入力される場合とがある。
【0020】特徴抽出部105は、入力された図形の閉
輪郭線(又は入力された線図形、以下同様)を多角形近
似(区分線分近似)したのち、量子化方向特徴と準凹凸
構造に基づいて解析することにより、連なっている線分
をより高いレベルの構造的特徴に統合する部分である。
このような特徴抽出方法については後にさらに詳しく説
明するが、コンパクトな表現の構造的特徴を得ることが
できる。
【0021】特徴抽出部105で抽出される構造的特徴
は、ノイズや輪郭線の局所的変形によって変化するの
で、本実施例では、ある特定の変形操作によって生じる
構造的特徴の変換規則を考え、特徴合成部110におい
て、この変換規則を、特徴抽出部105により入力図形
から抽出された構造的特徴に適用することにより、ノイ
ズや局所的変形により発生し得る変形図形の構造的特徴
を合成する。ここで合成された構造的特徴と、入力図形
から抽出された構造的特徴がすべて図形分類用特徴とし
て分類検索部115に与えられる。
【0022】分類検索部115は、与えられた各構造的
特徴からインデックス(アドレス)を計算し、このイン
デックスに対応した分類表120のエントリーを参照
し、入力図形を分類する。図形分類を目的とした場合に
は、分類検索部115は分類結果(モデル識別子)を出
力する。図形検索を目的とした場合には、分類検索部1
15は、分類結果として得られたモデル識別子を検索キ
ーとして持つ図形(具体的には、当該モデル図形そのも
の又は、それに相当する図形を含む図形)を図形データ
ベース125より検索し出力する。
【0023】分類表120は当該システムの外部で作成
されてもよいが、本実施例においては、当該システムの
内部で分類表120を作成できる。したがって、当該シ
ステムは、分類表120の作成に関連してモデル図形入
力部150、特徴抽出部155、特徴合成部160及び
表作成部165を有する。モデル図形入力部150はモ
デル図形(閉じた閉輪郭線又は線図形)を入力する部分
であり、特徴抽出部155は特徴抽出部105と同じ特
徴抽出処理を行う部分である。特徴合成部160は、特
徴抽出部155によりモデル図形から抽出された構造的
特徴に対して特徴合成部110と同様の特定の構造的特
徴の変換規則を適用することにより、モデル図形にノイ
ズや局所的変形が加わった場合に発生し得る構造的特徴
を合成する部分である。したがって、モデル図形入力部
150、特徴抽出部155及び特徴合成部165はそれ
ぞれ、図形入力部100、特徴抽出部105及び特徴合
成部110と兼用することが可能である。表作成部16
5は、特徴抽出部155により抽出された構造的特徴及
び特徴合成部160により合成された構造的特徴のそれ
ぞれからインデックスを計算し、その各構造的特徴を持
つモデルの識別子のリストを当該インデックスのエント
リーとした、図2に模式的に示すような構造の大規模な
表を分類表120として作成する部分である。
【0024】この図形分類検索システムは、例えば、図
3に簡略化して示すようなCPU200、メモリ20
5、ハードディスク等の大容量記憶装置210、画像若
しくは図形入力のためのスキャナ、デジタルカメラ、デ
ジタイザ等の入力装置215、ユーザインターフェイス
のためのディスプレイ220とキーボードやマウス等の
入力装置225、フロッピーディスクやCD−ROM等
のディスク記録媒体235に対する読み書きを行うディ
スクドライブ230等をシステムバス240で相互に接
続した構成のコンピュータ上で、プログラムにより実現
することができる。図形データベース125及び分類表
120は大容量記憶装置210に保存される。このコン
ピュータ上で図1中の各機能部100,105,11
0,115,150,155,160,165の機能
(換言すれば同システムにおける一連の処理ステップ)
を実現するための分類検索プログラム250は、例え
ば、同プログラムが記録されたディスク媒体235より
ディスクドライブ230によって読み込まれて大容量記
憶装置210に格納され、必要な時にその全部又は一部
がメモリ205にロードされてCPU200により実行
される。分類表120も、ディスク媒体235から読み
込まれてもよい。このプログラム205の実行時に、分
類表120も、その全体又は一部分がメモリ205にロ
ードされて参照される。分類すべき図形やモデル図形
は、例えば入力装置215から入力される。
【0025】以下、この図形分類検索システムの各部分
について詳細に説明する。
【0026】<図形入力部100又はモデル図形入力部
150>図形入力部100は、前述のように分類すべき
図形又は検索キーとしての図形を入力する。入力図形と
しての閉輪郭線の一例を図9に示す。モデル図形入力部
150は同様のモデル図形の閉輪郭線(又は線図形)を
入力する。
【0027】<特徴抽出部105又は155>図4は、
特徴抽出部105又は155の処理の流れを示すフロー
チャートである。また、図5は、特徴抽出の過程で得ら
れるデータを関連付けて模式的に示した図である。な
お、図4中の輪郭抽出処理のためのステップ300は、
輪郭抽出が必要とされる図形の画像が図形入力部100
から入力された場合にのみ必要な処理ステップであり、
輪郭抽出済みの図形が直接入力された場合には不要であ
る。例えば、図8に示す図形が入力された場合には、ス
テップ300によって図9に示すような閉輪郭線が抽出
される。
【0028】特徴抽出部105はまず、図形入力部10
5から入力された図形の閉輪郭線(又はステップ300
で抽出された閉輪郭線、以下同様)を多角形近似する
(ステップ301)。この多角形近似若しくは区分線分
近似は、Ramerの方法など、公知の任意の方法で行って
よい。例えば、図9に示した閉輪郭線は、図10に示す
ような多角形に近似される。
【0029】このように多角形近似された閉輪郭線を、
量子化方向特徴と準凹凸構造をもとにして解析し構造的
特徴を抽出する(ステップ302〜308)。この特徴
抽出の詳細は、H.Nishida, "Curve description based
on directional featuresand quasi-convexity/concavi
ty," Pattern Recognition, vol.28, no.7,pp.1045-105
1, July 1995 に譲り、ここではその概略を説明する。
【0030】2N個(Nは自然数)の量子化方向コード
を決めるためにN本の軸を導入する。例えば、N=4の
とき、図11に示すように4本の軸に沿って0,
1,...,6,7の8つの方向コードを定義する。こ
れらの2N方向とN本の軸をもとにして、多角形近似さ
れた閉輪郭線の線分を「セグメント」に統合しながら輪
郭を解析する。
【0031】まず、閉輪郭線をN本の各軸に沿って見た
ときに、極大点又は極小点となる点を、輪郭点の分割点
とする(ステップ302)。例えば、N=4のとき、図
10の閉輪郭線からは、図12に示す太短線と閉輪郭線
との交点がそれぞれ分割点として抽出される。各分割点
の近傍の()中の数字1〜13は分割点のラベルであ
り、図5中の「分割点」欄の数字に対応している。
【0032】閉輪郭線は分割点で「部分セグメント」に
分割される。換言すれば、この分割によって、輪郭上の
連続した線分が「部分セグメント」に統合される。この
部分セグメントは、N本のどの軸上でも、それを1つの
端点からもう1つの端点へと辿る運動の射影が単調変化
するような、連続した線分の集まりである。例えば、N
=4のとき、図10の閉輪郭線から、図12に示すよう
な13個の部分セグメントA〜Mが得られる。これら各
部分セグメントと分割点とが対応付けられて図5の「部
分セグメント」欄に示されている。隣り合う部分セグメ
ントが共有する分割点は、それら部分セグメントの「連
結点」でもあるので、以下の説明中では「連結点」と呼
ぶ。
【0033】次に、隣接する2つの部分セグメントの連
結点の局所的な凹凸構造によって、「連結の向き」(凹
凸)をチェツクする(ステップ303)。すなわち、隣
接する2つの部分セグメントをaとbとして、aからb
に移るように輪郭を辿った時に、連結点の周りで反時計
回りになるときには、すなわち輪郭の凸部分に相当する
ときには、その連結の向きをa−→bと表す。逆に、連
結点の周りで時計回りになるときには、つまり輪郭の凹
部分に相当するときには、その連結の向きをb−→aと
表す。N=4とし、図12に示す各連結点の「連結の向
き」(凹凸)を図5の「凹凸」欄に示す。「凹凸」欄に
おいて、「0」は凸であること、すなわち「連結の向
き」がa−→bであることを示し、「1」は凹であるこ
と、すなわち「連結の向き」がb−→aであることを示
す。
【0034】次に、各連結点に関し「方向特徴」を求め
る(ステップ304)。まず、各連結点の方向を求め
る。すなわち、隣接する2つの部分セグメントを、その
連結の向きに辿った時に、その連結点が極値をとる量子
化方向を求める。例えば、図12の部分セグメントA,
Bの連結点の場合、図16から明らかなように、Aから
Bを辿ったときに、その連結点は、方向3の軸及び方向
4の軸に沿って極値をとり、それぞれ方向3と方向4の
向きに凸であるので、その方向は3と4である。また、
図12の部分セグメントG,Hの連結点の場合、図17
から明らかなように、HからGを辿ったときに、その連
結点は方向3,4,5の各軸に沿って極値をとり、それ
ぞれ方向3,4,5の向きに凸であるので、その方向は
3,4,5である。図12の閉輪郭線の各連結点の方向
は図5の「方向」欄に示す通りである。
【0035】そして、a−→b又はb−→aの部分セグ
メントa,bの連結点が量子化方向(j, j+1(mod 2
N),..., k)に向いているときに、それぞれの連結点の方
向特徴をa−j,k→b,b−j,k→aと表す。例えば図1
2に示した13個の部分セグメントに対しては、次のよ
うな部分セグメントの連結点の特徴が得られる。 L−3,3→M,K−2,2→L,J−1,1→K,I−0,0
J,H−7,7→I,H−3,5→G,F−1,1→G,E−0,0
→F,D−7,7→E,C−6,6→D,B−5,5→C,A−
3,4→B,A−7,7→M。 次に、以上のようにして得られた部分セグメントの連結
点の特徴をまとめ、 a0j(1,0),j(1,1)→ a1j(2,0),j(2,1)→・・・・−
j(n,0),j(n,1)→ an の形の系列を得る(ステップ305)。この形の系列に
対応する部分輪郭を「セグメント」と呼ぶ。なお、セグ
メントの2端点のうちで、a0上にある端点をセグメン
トの始点、an上にある端点をセグメントの終点とし、
1つのセグメントを始点から終点へと辿ると、セグメン
トの各部分セグメントの連結点の周りでは、いつも反時
計回りに動くものとする。したがって、例えば、図12
に示す13個の部分セグメントから、図13に示す4個
のセグメントS1,S2,S3,S4、すなわち、 S1:A−7,7→M S2:A−3,4→B−5,5→C−6,6→D−7,7→E−0,0
F−1,1→G S3:H−3,5→G S4:H−7,7→I−0,0→J−1,1→K−2,2→L−3,3
M が得られる。図5の「セグメント」欄に、これら各セグ
メントと部分セグメントとの対応が示されている。「凹
凸」欄と対比すると明らかなように、凹(=1)の分割
点では、それを連結点とする2つの部分セグメントが1
つのセグメントに統合され、また、凹(=1)の分割点
と次の凹(=1)の分割点との間の部分セグメントが1
つのセグメントに統合される。
【0036】次に、各セグメントの回転の度合と方向を
記述する特性数<r,d>を求める(ステップ30
6)。ここで、rとdは例えば次式により計算する。た
だし、式中のA%Bは整数Aを自然数Bで割った余りを
示す。
【0037】
【数1】
【0038】例えば、図13に示す4つのセグメントの
特性数は、それぞれ<2,7>,<8,3>,<4,3>,<6,7>となる。
【0039】さらに、輪郭線を囲む最小の直立長方形の
中心が(0,5,0.5)、長い辺の長さが1になるような座標
系を設定し、この座標系で、セグメントの大きさと位置
の特徴として、その始点の位置(xs,ys)と終点の位
置(xE,yE)、セグメントを囲む最小の直立長方形の
大きさ(W,H)と中心の位置(xc,yc)を計算し、
これらの8つの実数を0からL−1までの整数に量子化
した8つのパラメータに特性数<r,d>を加えた10個の
整数の組
【0040】
【外1】
【0041】で、セグメントの特徴を記述する(ステッ
プ307)。
【0042】さらに隣接するセグメントの結合をチッェ
クし、セグメントの結合を記述する(ステップ30
8)。隣接するセグメントS,Tは互いに、対応する系
列の先頭又は最後の部分セグメントを共有して結合す
る。先頭の部分セグメントを共有する場合を「h結合」
と呼び、S−h−Tと表し、最後の部分セグメントを共
有する場合を「t結合」と呼び、S−t−Tと表す。た
だし、セグメントは図形の内部を左手に見るような順番
で並んでいるものとする。したがって、例えば図13に
示す4個のセグメントS1,S2,S3,S4の結合は、 S1−h−S2−t−S3−h−S4−t−S1 と記述される(図5の「セグメント」欄参照)。
【0043】特徴抽出部155による処理内容は、対象
がモデル図形として入力された閉じた閉輪郭線(又は閉
じた線図形)であることを別にすれば、以上に述べた特
徴抽出部105の処理内容と同じである。
【0044】<特徴合成部110又は160>後に詳細
に述べるように分類検索部115では、モデル毎に投票
箱を用意し、入力図形から抽出された各セグメントの特
徴(前記10個の整数の組)に対応する分類表120の
エントリー(モデル図形の識別子のリスト)を参照し、
同リスト上の各モデル識別子に対応した投票箱に1票を
投票し、得票数の多寡によって入力図形を分類する。と
ころが、前に簡単に触れたように、入力図形に重畳する
ノイズや輪郭の局所的変形により、輪郭のセグメントの
特徴は簡単に変化してしまう。この変化を考慮せず、入
力図形及びモデル図形から抽出されたセグメントの特徴
だけを用いたのでは、ノイズや局所的変形があると、正
しいモデル図形に対する得票数が多くなるとは限らず、
ノイズや局所的変形に弱い。また、1つのモデルに1つ
のサンプル図形しか使えない場合には、パターン認識に
おける、データからの統計的・帰納的学習の手法を用い
ることができない。
【0045】このような弱点を解消するため、本実施例
では、ある種類の図形の変形操作によって生じる特徴の
変換規則を構築し、図形から抽出されたセグメントの特
徴にこの特徴変換規則を適用することにより、ノイズや
輪郭の局所的変形によって発生する変形図形から抽出さ
れる可能性のあるセグメント特徴を合成する。このセグ
メント特徴の合成は、特徴合成部110及び同160で
行われ、図形(入力図形又はモデル図形)から抽出され
たセグメント特徴及び変換規則により合成されたセグメ
ント特徴が、入力図形の分類及び分類表120の作成の
両方に使われる。
【0046】ノイズ又は輪郭の局所的変形によるセグメ
ントの特徴変換として、具体的には例えば次の3通りを
考える。 輪郭の法線方向の揺らぎによって生じる凹凸構造の
変化による、輪郭のセグメント分割の変動と、それにと
もなう量子化された回転数・方向つまり特性数<r,d
>の再定義。 小さな回転による量子化された回転数・方向つまり
特性数<r,d>の変化。
【0047】 セグメントの大きさや中心と端点の位
置の揺らぎによる特性数以外の特徴(8つのパラメー
タ)の変化。これらの特徴変換について順に説明する。
【0048】《特徴変換:輪郭の法線方向に沿った変
動》多角形近似された輪郭から構造的特徴(セグメント
特徴)によるコンパクトな表現を得ることができるが、
これは輪郭線に加わるノイズや観測されるスケールによ
って生ずる凹凸変化に影響を受けやすい。例えば、図1
4の(A)の部分輪郭と(B)の部分輪郭は大局的に見
るとよく似ているが、局所的な変形のために構造的な特
徴は異なったものとなる。N=4としたとき、(A)の
部分輪郭は、それぞれ特性数<6,6>,<2.6>,<3,2>を持
ちS1−t−S2−h−S3 のように結合する3つのセグ
メントにより表される。これに対し、(B)の部分輪郭
は、それぞれ特性数<6,6>,<2,6>,<2,2>,<2,6>,<3,2
>を持ちS1'−t−S2'−h−S3'−t−S4'−h−S5'の
ように結合する5つのセグメントにより表される。
【0049】このようなノイズや観測スケールによる構
造変化は輪郭の法線方向の変形と考えることができるの
で、かかる変形を吸収するために、構造的特徴が互いに
似たものになるようにセグメントを編集することを考え
る。図14に示す2つの部分輪郭の場合、図15の
(A)と(B)に示すように、S2,S2',S3',S4'の
部分を覆う如く{S1,S2,S3}と{S1',S2',S3',S
4',S4',S5'}をそれぞれ1つのセグメントS,S'に
置き換えることによって、互いに似た構造的特徴を持つ
ように変換できる。
【0050】一般的には、次のような規則で変換する。 (1)S1−h−S2−t−・・・−t−Snのように結合し、
特性数<ri,di>を持つ連続したn個(nは奇数)の
セグメントSi(i=1,...,n)について、
【0051】
【数2】
【0052】ならば(統合条件1)、これらのn個のセ
グメントを、
【0053】
【外2】
【0054】を持つ1つのセグメントSに統合する。
【0055】(2)S1−t−S2−h−・・・−h−Snの
ように結合し、特性数<ri,di>を持つ連続したn個
(nは奇数)のセグメントSi(i=1,...,n)について、
【0056】
【数3】
【0057】ならば(統合条件2)、これらn個のセグ
メントを、
【0058】
【外3】
【0059】を持つ1つのセグメントSに統合する。
【0060】特徴合成部110又は160は、統合する
セグメントの最大個数を示す整数パラメータをMとし、
入力図形又はモデル図形の多角形近似された閉輪郭線か
ら抽出された各セグメントに対し、連続するn個(n=1,
3,...,M)のセグメントを上記の規則により統合し、変
形したセグメントの特性数を合成する。閉輪郭線から抽
出されるセグメントの個数をmとすると、上記の規則に
よりmMのオーダーの個数(これをO(mM)個と記
す、以下同様)の特性数が生成される。例えば、N=4
のとき、図13の4つのセグメントは特性数<2,7>,<8,
3>,<4,3>,<6,7>を持つが、M=3のときに<2,7>,<8,
3>,<10,3>,<4,3>,<6,7>,<12,7>の6つの特性数が合
成される。
【0061】《特徴変換:図形の回転による特性数の
変化》セグメントの特性数<r,d>(r≧2)は、図
形の回転によって変化することがある。いま特性数<
r,d>を持つセグメントが系列 a0d,d→a1d+1,d+1→・・・−r+d-2,r+d-2→an で表されるとする。このセグメントを
【0062】
【外4】
【0063】だけ回転させると、このセグメントは次の
5通りに変化し得る。 (1)α0d,d→α1d+1,d+1→・・・−r+d-2,r+d-2→αn (2)α-1d-1,d-1→α0d,d→α1d+1,d+1→・・・−
r+d-2,r+d-2→αn (3)α0d,d→α1d+1,d+1→・・・−r+d-2,r+d-2→αn
r+d-1,r+d-1→αn+1 (4)α0d,d→α1d+1,d+1→・・・−r+d-3,r+d-3→αn-1 (5)α1d+1,d+1→・・・−r+d-2,r+d-2→αn このそれぞれの場合から、セグメントに微小な回転を与
えることにより、特性数は、 (1) <r,d> (2) <r+1,d−1> (3) <r+1,d> (4) <r−1,d> (r≧3) (5) (r−1,d+1> (r≧3) に変換され得る。
【0064】例えば、特性数<r,d>を持つ円弧
【0065】
【外5】
【0066】において、 (1) ε=π/(2N),ψ=±π/(4N) (2) ε=π/N,ψ=−π/(4N) (3) ε=π/N,ψ=π/(4N) (4) ε=π/(4N),ψ=−π/(4N) (5) ε=π/(4N),ψ=π/(4N) を考えればよい。このうち、(1),(2),(4)について、
N=4,r=4,d=0の変換例を図11に示す。
【0067】特徴合成部110又は160は、「輪郭の
法線方向に沿った変動」による変換規則(特徴変換)
を適用して、各セグメントに対し最大
【0068】
【外6】
【0069】個の変形したセグメントの特性数を合成
し、これら合成された特性数それぞれに対して、ここで
述べる「図形の回転による特性数の変化」による変換規
則(特徴変換)によって最大5個の特性数を合成す
る。したがって、各セグメントから、特徴変換及び特
徴変換の適用により最大
【0070】
【外7】
【0071】個の特性数が生成される。閉輪郭線から抽
出されるセグメントの個数をmとすれば、この段階でO
(mM)個の特性数が生成されることになる。
【0072】例えば、N=4のときに、図13の4つの
セグメントはそれぞれ特性数<2,7>,<8,3>,<4,3>,<6,
7>を持つが、これに特徴変換を適用すれば、M=3の
ときに、6個の特性数<2,7>,<8,3>,<10,3>,<4,3>,<
6,7>,<12,7>が合成される。これらの合成された特性数
に特徴変換を適用すれば、28個の特性数<2,7>,<3,
6>,<3,7>,<8,3>,<9,2>,<9,3>,<7,3>,<7,4>,<10,
3>,<11,2>,<11,3>,<9,3>,<9,4>,<4,3>,<5,2>,<
5,3>,<3,3>,<3,4>,<6,7>,<7,6>,<7,7>,<5,7>,<
5,8>,<12,7>,<13,6>,<13,7>,<11,7>,<11,8>が合成
される。
【0073】《特徴変換:局所的な大きさや位置の変
動》セグメントのパラメータ、すなわちセグメントの始
点の位置(xs,ys)と終点の位置(xE,yE)、セグ
メントを囲む最小の直立長方形の大きさ(W,H)と中
心の位置(xc,yc)は、局所的な変形やノイズによっ
て変動する。また、これらパラメータxs,ys,xE
E,xc,yc,W,HはそれぞれL段階(Lは自然
数)に量子化されて取り扱われる。すなわち、パラメー
タp(pはxs,ys,xE,yE,xc,yc,W,Hのい
ずれか)の値が、i≦pL<i+1(0≦i<L)のと
き、pの値は整数iに量子化される。このような量子化
による誤差を考慮する必要がある。
【0074】そこで、特徴合成部160では、特徴変換
として、実数パラメータα(0≦α≦1)に対して、
i≦pL≦i+α/2(0<i<L)ならば、pの量子
化値として整数iの他にi−1も生成し、また、i+1
−α/2≦pL<i+1(0≦i<L−1)ならば、p
の量子化値として整数iの他にi+1も生成する。
【0075】したがって、特徴変換、特徴変換及び
当該特徴変換によって、各セグメントから最大
【0076】
【外8】
【0077】個の特徴(前記の10個の整数の組)が生
成される。よって、閉輪郭線から抽出されるセグメント
の個数をmとすると、最大
【0078】
【外9】
【0079】個の特徴が生成される。さらに、パラメー
タpの値が区間[0,1]上で一様分布すると仮定する
と、1つのセグメントから平均O((1+α)8・M)
個、1つの輪郭線から平均O((1+α)8・Mm)個の
特徴が合成されることになる。
【0080】なお、本実施例においては、この特徴変換
の適用による特徴合成はモデル構築の際に特徴合成部
160で実行され、特徴合成部110では実行されな
い。つまり、分類表120を作成する際には、図形分類
時に比べ、より多くの変形図形を考慮する。
【0081】図6は、以上に述べた特徴合成部110の
処理の流れを示すフローチャートである。特徴合成部1
10においては、まず、特徴抽出部105によって入力
図形から抽出されたセグメント系列中の1つのセグメン
トを前記特徴変換のための統合候補の先頭セグメント
に設定し(ステップ400)、この先頭セグメントから
3つ目のセグメントを統合候補の末尾セグメントに設定
する(ステップ401)。そして、先頭セグメントから
末尾セグメントまでのセグメント系列について特徴変換
のための前記統合条件1又は2が成立するか判定する
(ステップ402)。統合条件1と統合条件2のいずれ
も成立しないときには、現在の末尾セグメントから2つ
先のセグメント(統合するセグメント数は奇数である)
を改めて末尾セグメントに設定し(ステップ407)、
統合条件の判定を行う(ステップ401)。
【0082】統合条件1又は統合条件2が成立した場
合、先頭セグメントから末尾セグメントまでのセグメン
ト系列の統合セグメントを生成し(ステップ403)、
成立した統合条件に応じて、その統合セグメントの特性
数と8組のパラメータを計算する(ステップ404)。
かくして、例えば図14に示したようなセグメント系列
が図15に示すようなセグメントに統合され、そのセグ
メント特徴が作られるわけである。
【0083】このようにして統合セグメントの特徴が得
られると、次に、この統合セグメントに対し前記特徴変
換を適用する(ステップ405)。この特徴変換の
適用によって、統合セグメントの特性数を回転操作した
5つの変形セグメント特徴が得られる。ただし、この変
形セグメント特徴の8組のパラメータとしては、統合セ
グメントの8組のパラメータがそのまま用いられる。
【0084】特徴合成部110は、得られた5つの変形
(合成)セグメント特徴を保存し(ステップ406)、
再び末尾セグメントを先に移動させ(ステップ40
7)、ステップ402以降の処理を続ける。この処理の
繰り返しは、末尾セグメントが先頭セグメントまで戻る
か、又は先頭セグメントから末尾セグメントまでのセグ
メント数が一定値を越えるまで続く。
【0085】末尾セグメントが先頭セグメントまで戻る
か、又は先頭セグメントから末尾セグメントまでのセグ
メント数が一定値を越えると(ステップ408,YE
S)、特徴合成部110は、現在の先頭セグメントの1
つ先のセグメントを改めて先頭セグメントに設定し(ス
テップ409)、ステップ401以降の処理を繰り返し
て行う。ただし、新たに設定した先頭セグメントが、最
初に先頭セグメントに設定したセグメントに戻ったとき
には(ステップ410,YES)、処理を終了する。
【0086】<表合成部165及び分類検索部115>
構造的インデクシングによるモデルの構築においては、
モデル図形入力部150により入力したモデル図形から
特徴抽出部155によって抽出されたセグメント特徴に
対し、特徴合成部160において前述の3つの特徴変換
(変換モデル)を適用することにより、1つのモ
デル図形につき平均O((1+α)8・Mm)個のセグメ
ント特徴を生成する。表作成部165は、それらの各セ
グメント特徴から分類表120のインデックスを計算
し、このインデックスに対応する分類表120のエント
リーのモデル識別子リストに、そのモデルの識別子を付
加することにより、モデル集合に対する分類表120を
作成する。
【0087】モデル集合に含まれるモデルの個数をn、
分類表120のインデックスの総数をIとすると、分類
表120の各エントリーには平均O((1+α)8・Mm
n/I)個のモデル識別子が格納される。ここで、モデ
ルi(i=1,2,...,n)に対し、特徴変換と特徴変換
を適用して合成される特徴の数(インデックスの数)
iが予め求められて保存されている。例えばN=4,
M=3のとき、モデル図形が図13の輪郭線を持つとす
ればci=28となる。
【0088】分類検索部115は入力図形の分類と該当
図形の検索を行う。図7は分類検索部115の処理の流
れを示すフローチャートである。
【0089】分類検索部115は、入力図形に関するセ
グメント特徴(入力図形の輪郭から得られたセグメント
特徴と、それに対し特徴変換及びを適用して合成し
たセグメント特徴)の中からセグメント特徴を1つ選び
(ステップ500)、そのセグメント特徴から分類表1
20のインデックス(アドレス)を計算する(ステップ
502)。そのインデックス(アドレス)に対応する分
類表120のエントリーをアクセスし、モデル識別子リ
ストを読み出す(ステップ503)。そして、そのモデ
ル識別子リスト中の各モデル識別子(i)に対応した得
票数viに1を加算する(ステップ504)。ただし、
得票数viの初期値は0である。つまり、注目したセグ
メント特徴と同じセグメント特徴を持つモデルの投票箱
に1票ずつ投票するわけである。ステップ500〜50
4の処理ループを繰り返し、同様の投票操作を入力図形
に関する全てのセグメント特徴に対して行う。
【0090】入力図形に関する全てのセグメント特徴に
ついて投票操作を行い、未処理のセグメント特徴がなく
なると(ステップ501,NO)、各モデルiの得票数
iをciで正規化し(ステップ505)、vi/ciの値
の大きな順にモデルをソートする(ステップ506)。
そして、上位のいくつかのモデルを候補として選択する
(ステップ507)。図形の分類が目的の場合は、この
ようにして候補として絞り込んだモデルの識別子を分類
結果として出力する(ステップ507)。図形の検索が
目的の場合は、絞り込んだモデルの識別子を検索キーと
して、図形データベース125より該当する図形パター
ンを取り出し、それを検索結果として例えばディスプレ
イ220に出力する(ステップ508)。
【0091】本実施例によれば、以上に説明したよう
に、図形から抽出された構造的特徴に特定の変換規則を
適用することにより変形図形の構造的特徴を合成するた
め、比較的少ない計算量で、ノイズや局所的変形がある
場合も考慮した図形分類用特徴を取得することができ
る。また、モデル図形から抽出された構造的特徴と、そ
れに特定の変換規則を適用して合成した構造的特徴のそ
れぞれを使うことにより、比較的少ない計算量で、ノイ
ズや局所的変形を考慮した構造的インデクシングのため
の表を作成することができる。したがって、1つのモデ
ルに対して1つのサンプルしか使えないような場合に
も、ノイズや局所的変形に頑健な効率的・高速な構造的
インデクシングによる図形分類・検索が可能である。し
たがって、本実施例の図形分類・検索システムは、後記
の第2の実施例の図形分類システムとともに、図形の変
形に柔軟に対応する必要がある図形分類・検索の用途、
例えば、植物の葉の輪郭形状(又は葉の画像)を入力
し、その植物の種類を調べるような用途に特に効果的で
ある。
【0092】[実施例2]図19に、本発明の他の実施
例による図形分類システムの概略構成を示す。図19に
おいて、画像入力部1100はイメージスキャナやデジ
タルカメラ等の画像入力装置より分類(認識)したい図
形の画像を入力する部分である。ここで図形とは、図形
や物体の輪郭を表す閉曲線である。輪郭抽出部1105
は、入力された画像から図形の閉じた輪郭線を抽出する
部分である。なお、デジタイザなどで図形の輪郭を表す
閉曲線を直接的に入力するための線図形入力部1106
を設け、これにより入力された図形に対しては輪郭抽出
処理は不要である(必要に応じて細線化処理を施しても
よい)。多角形近似部1110は、入力図形の輪郭線に
対し、例えばRamerの方法などによって、多角形近
似(区分線分近似)をする部分である。例えば図8に示
す図形の画像が入力された場合、図9に示す閉輪郭線が
抽出され、これが図10に示すような多角形に近似され
る。
【0093】特徴抽出部1115は、多角形近似された
輪郭を、量子化方向特徴と準凹凸構造に基づいて解析
し、連続したいくつかの線分をより高いレベルの構造的
特徴に統合することにより、図形の輪郭の構造的特徴の
コンパクトな表現を得る部分である。この量子化方向特
徴と準凹凸構造に基づく構造的特徴の抽出処理の内容
は、前記実施例1に関連して図4のフローチャートを参
照し説明した通りであるので、ここでは説明を繰り返さ
ない。
【0094】予め用意された多数のモデル図形の集合に
対し、各モデル図形毎にその輪郭の構造的特徴が以上に
述べた方法により予め抽出され、それが辞書1125に
格納されている。図形の分類の際には、マッチング部1
120において、特徴抽出部1115から入力される入
力図形の輪郭の構造的特徴と、辞書1125より入力さ
れるモデル図形の輪郭の構造的特徴とのマッチングを行
い、モデル図形と入力図形との輪郭の相違度(又は類似
度)を求める。分類(認識)部1130は、マッチング
部1120で求められた各モデル図形と入力図形との相
違度(又は類似度)を比較し、入力図形に最も近い、つ
まり相違度の最も小さい(又は類似度の最も大きい)モ
デル図形を1つ(又は複数個)選ぶ。
【0095】マッチング部1120は、概念的には、入
力図形とモデル図形の輪郭の構造的特徴の間の最適な対
応関係を求める対応付け部1121と、この対応関係を
もとに輪郭の構造的特徴間のだいたいの点対応が決めら
れるので、この点対応をもとにモデル図形を入力図形に
近づけるようにモデル図形の幾何学的変換(モデル図形
の正規化)を行う正規化部1122と、正規化後のモデ
ル図形と入力図形の間の距離を計算する距離計算部11
23とからなる。
【0096】対応付け部1121は、2つの輪郭の構造
的特徴間の対応関係を求める際に、2つの輪郭の構造的
特徴を互いに近くなるように、それぞれの構造的特徴を
編集するためのコストを評価し、この編集コストが最小
となるような最適な対応関係を求める。このような2つ
の輪郭の構造的特徴の編集とそのコストについて次に説
明する。
【0097】前述のように、多角形近似された輪郭から
構造的特徴によるコンパクトな表現を得ることができる
が、このような記述は、輪郭線に加わるノイズや、観測
されるスケールによって生じる凹凸変化に影響されやす
い。繰り返しになるが、例えば、図14の(A)の部分
輪郭と(B)の部分輪郭は大局的に見るとよく似ている
が、局所的な変形のために構造的な特徴は異なったもの
となる。N=4としたとき、(A)の部分輪郭は、それ
ぞれ特性数<6,6>,<2.6>,<3,2>を持ち、S1−t−S2−
h−S3 のように結合する3つのセグメントにより表さ
れる。これに対し、(B)の部分輪郭は、それぞれ特性
数<6,6>,<2,6>,<2,2>,<2,6>,<3,2>を持ちS1'−t
S2'−h−S3'−t−S4'−h−S5'のように結合する5
つのセグメントにより表される。ノイズや観測スケール
による構造変化は輪郭線の法線方向の変形と考えること
ができるので、このような変形を吸収するために、それ
ぞれの構造的特徴を、互いに似たようなものになるよう
に編集することを考える。例えば、図14に示す2つの
部分輪郭の場合、図15の(A)と(B)に示すよう
に、S2,S2',S4'の部分を覆う如くセグメントのブロ
ック{S1,S2,S3}と{S1',S2',S3',S4',S4',S
5'}を1つのセグメントS,S'にそれぞれ置き換える
ことにより、互いに似た構造的特徴を持つように編集で
きる。
【0098】より一般的に述べれば、一方の部分輪郭が
m個の連続するセグメントのブロック{S1,S2,...,S
m}からなり、他方の部分輪郭がn個の連続するセグメ
ントのブロック{S1',S2',...,Sn'}からなるとす
る。セグメントSi(i=1,...,m)の特性数を<ri,d
i>、セグメントSi'(i=1,...,n)の特性数を<
i',di'>とする。この2つの部分輪郭が次の条件
(a)又は(b)を満たすときに、それぞれのセグメン
ト・ブロックを1つのセグメントに置き換えることを考
える。すなわち、 条件(a):S1−h−S2−t−・・・−t−Smかつ S1'
h−S2'−t−・・・−t−Sn' を満たすときには、セグメント・ブロック{S1,S
2,...,Sm}を
【0099】
【外10】
【0100】を持つ1つのセグメントSに置き換え、セ
グメント{S1',S2',...,Sn'}を
【0101】
【外11】
【0102】を持つ1つのセグメントS’に置き換える
ことを考える。
【0103】条件(b):S1−t−S2−h−・・・−h−S
mかつ S1'−t−S2'−h−・・・−h−Sn' を満たすときには、セグメント・ブロック{S1,S
2,...,Sm}を
【0104】
【外12】
【0105】を持つ1つのセグメントSに置き換え、セ
グメント{S1',S2',...,Sn'}を
【0106】
【外13】
【0107】を持つ1つのセグメントS’に置き換える
ことを考える。なお、上記の条件(a)と条件(b)は
2つの部分輪郭の凹凸が一致するための条件である。そ
して、このような2つのセグメント・ブロックのセグメ
ントへの置換のための編集コストを例えば次のように定
義する。
【0108】
【数4】
【0109】ここで、l(Si)はセグメントSi(i=
1,...,m)の長さ、l'(Si')はセグメントSi'(i=
1,...,n)の長さ、L(S1S2・・・Sm)は{S1,S
2,...,Sm}からなる部分輪郭の長さ、L(S1'S2'・・・
Sn')は{S1',S2',...,Sn'}からなる部分輪郭の長
さである。wは重み係数である。上式の右辺の第1項は
統合後のセグメントS,S’の間の長さの差(長さの相
違度)を表し、また、第3項は、統合後のセグメント
S,S’の間の回転量の差(回転量の相異度)を表す。
第2項が統合によって埋められるセグメントの長さの総
和、つまり編集による変形量を表し、これが編集操作に
関わる直接的なコストに相当する。ただし、2つの輪郭
の構造的特徴を互いに近づけるための編集コストを評価
することが目的であるから、編集後のセグメント間の相
異度も当然考慮する必要がある。編集後の相異度が大き
いのでは、その編集は無意味であるからである。したが
って、上式では、編集による変形量に、編集後のセグメ
ント間の相異度を修正項として加えた値を、編集コスト
として評価している。ただし、編集コストの評価式はこ
れに限定されるものではなく、適宜な評価式を採用可能
である。例えば、上式の右辺の3項を乗算した値を編集
コストとするような評価式も可能である。
【0110】さて、閉輪郭線の構造特徴はセグメントを
要素とする循環列で記述できるので、マッチング部11
20の対応付け部1121における2つの輪郭の構造的
特徴の対応付けの問題は、上に述べたセグメントのブロ
ック置換による編集のコストが全体として最小になるよ
うな、編集操作の集合を見つけることになる。例えば、
図21に示すような、特性数<3,3>,<0,7>,<2,1>,<2,1>
を持ちT1−h−T2−t−T3−h−T4−t−T1と結合し
た4つのセグメントT1,T2,T3,T4によって表される
モデル図形の輪郭と、図13に示すような入力図形の輪
郭とのマッチングを考えると、編集の総コストが最小と
なる対応付けは、 (1){S4,S1,S2}←→{T2,T3,T4} (2){S3}←→{T1} である。
【0111】正規化部1122は、このようにして決定
された入力図形とモデル図形の輪郭の対応付けをもと
に、モデル図形を入力図形に近づけるような幾何学的変
換、例えばアフィン変換をモデル図形に施す。ただし、
入力図形側をモデル図形に近づけるようにアフィン変換
することも可能である。図21のモデル図形に上に述べ
たように入力図形とセグメント・ブロックを対応付けて
アフィン変換を施すと、図22のような図形に正規化さ
れる。この正規化されたモデル図形と図10の入力図形
を重ね合わせると図23のようになり、両図形のずれの
程度がモデル図形と入力図形との類似度又は相違度に反
映される。距離計算部1123は、上に述べたような正
規化されたモデル図形と入力図形(入力図形側を正規化
する場合は正規化された入力図形とモデル図形)との間
の幾何学的な距離を計算する。この距離尺度としては、
例えば、Housdorff距離や一般化Housdorff距離を用いる
ことができる。
【0112】以上に説明したマッチング部1120と分
類(認識)部1130による処理の全体的な流れについ
て、図20のフローチャートを参照して要約する。マッ
チング部1120において、辞書1125より1つのモ
デル図形の輪郭の構造的特徴を取り出す(ステップ11
50)。そして、対応付け部1121で、前述のように
編集コストが最小となるようなモデル図形と入力図形の
輪郭の構造的特徴間の最適な対応付けを求め(ステップ
1151)、この対応付けに基づいて、正規化部112
2でモデル図形に対し入力図形に近づけるようアフィン
変換を施し(ステップ1152)、距離計算部1123
でアフィン変換後のモデル図形と入力図形との間の距離
を計算する(ステップ1153)。マッチング部112
0は、同様の処理を各モデル図形に関して行い、最後の
モデル図形に対する処理が終わると(ステップ115
4,YES)、各モデル図形に関して得られた距離のデ
ータを分類(認識)部1130に渡しマッチング処理を
終わる。分類(認識)部1130において、渡された距
離が小さい順にモデル図形をソートし(ステップ115
5)、上位の1つ又は複数のモデル図形を分類候補とし
て選び、その識別子を分類(認識)結果として出力する
(ステップ1156)。
【0113】マッチング部1120における1つのモデ
ル図形と入力図形とのマッチングアルゴリズムの具体例
をフローチャートの形式で図24乃至図26に示す。ま
た、このアルゴリズム中で呼び出される関数segmentMat
ching()のアルゴリズムをフローチャートの形式で図2
7及び図28に示す。
【0114】ここに示すマッチングアルゴリズムは動的
計画法(DP)をもとにしており、2つの閉輪郭上のセ
グメントの個数をm,nとしたとき、O(mn log
m)の手間でセグメント・ブロックの対応を見つけるこ
とができる。また、一方の輪郭(例えばモデル図形の輪
郭)上のセグメント(s(1),s(2),...,s(m))が s(1)-h−s(2)-t−・・・-t−s(m)-h−s(1) と結合するような順番に並んでいるとし、他方の輪郭
(例えば入力図形の輪郭)上のセグメント(t(1),t
(2),...,t(n))が t(1)-h−t(2)-t-・・・-t−t(n)-h−t(1) と結合するような順番に並んでいるとする。また、形式
的に、m<i<=2*m のときs(i)=s(i-m)、n<j<=2*n のとき
t(j)=t(j-n) とする。また、ブロック置換により統合
される連続したセグメントの最大個数をMBとする。left
[2*n][2*m],right[2*n][2*m]はs,tの対応し得るセグ
メント・ブロックの範囲を記録するための2次元の整数
配列である。
【0115】ステップ1201〜1235のループ1
は、xを1から1ずつインクリメントさせながらxがmi
n(m,MB)を超えるまで繰り返される。このループ1にお
いて、x−1(x=1,...,min(m,MB))だけシフトしたsの
シフト列S(x)=(s(x),s(x+1),...,s(x+m-1)を考え、ス
テップ1203及びステップ1221で関数segmentMat
ching()を呼び出すことにより、シフト列S(x)と、tの
シフト列T(j)=(t(j),t(j+1),...,t(j+n-1))との対応
を見つける。ステップ1204〜1210及びステップ
1222〜1228の部分で、関数segmentMatching()
で設定されたポインタをもとに、S(x)とT(j)の間のセ
グメント・ブロックの対応を取り出す。ここで、関数se
gmentMatching()は、Wagner-Fisherによる近似ストリン
グ・マッチングを応用するとO(mn)の手間がかかるの
で、総当たり的にマッチングを行えば全体でO(m・n
2)の手間がかかることになるが、T(j)の生成順序を二
分探索方式にし(ステップ1215〜1218,123
2)、かつ、対応し得るセグメント・ブロックの範囲を
2つの配列left,rightに記録しておくことによって、O
(mn log m)の手間でセグメント・ブロックの対応を
見つけることができる。これは、M.Maes, "On a cyclic
string-to-string correction problem,"Information
Processing Letters, vol.35, pp.73-78,1990 に述べら
れている方法の拡張である。
【0116】なお、図24乃至図26のアルゴリズムに
おいて、dminは距離の最小値のための変数で、ループ1
に入る前にステップ1200で無限大に初期設定され
る。ループ1の内部において、ステップ1202でj=
1,2,...,nのleft[j][0]に0を代入したのちleft[1][0]
に1を代入する。ステップ1203で、segmentMatchin
g()を図示のように引数を設定して呼び出す。ステップ
1205からステップ1211までのループ2は、i0>=
0の間、繰り返される。このループ中のステップ120
6で、1つ前のセグメントの終わりを示す(k0,l0)をseg
mentMatching()で設定された今現在のセグメントの終わ
り(i0,j0)からのポインタにする。ステップ1207〜
1209のループ3は、k0>=0かつi0>k0の条件を満たす
間、繰り返される。ステップ1212〜1214のルー
プ4は、iをxからxmax-1まで1ずつインクリメントし
ながら、left[n+1][i]にleft[1][i]+nをright[n+1][i]
にright[1][j]+nを代入する。ステップ1216から始
まるループ5は、j<nの間、繰り返される。ループ5中
には、ステップ1217〜1230のループ6があり、
これはkを1から1ずつインクリメントしながらkがj
を超えるまで繰り返される。ループ6のステップ122
1でsegmentMatching()を引数を図示のように設定して
呼び出す。ステップ1223〜1229のループ7は、
i0>=0の間、繰り返される。ステップ1224で、1つ
前のセグメントの終わりを示す(k0,l0)を、segmentMatc
hing()で設定された今現在のセグメントの終わり(i0,j
0)からのポインタにする。ステップ1225〜1227
のループ8はk>=0かつi0>k0の間繰り返す。ステップ1
234では、dminをとるようなセグメント・ブロックの
対応を、その時点における2つの輪郭の最適対応とす
る。最終的な最適対応と距離dminは、ループ1の最終回
のステップ1234で決まる。
【0117】図27及び図28に示す関数segmentMatch
ing()は、引数としてセグメント列s,tのシフト量
x,y、対応し得るセグメント・ブロックの範囲を記録
する配列left,right、これまでに見つかったセグメント
・ブロックの対応から求められた図形間距離の最小値dm
inを与えられ、sのシフト列S(x)=(s(x),s(x+1),...,s
(x+m-1))と、tのシフト列T(j)=(t(j),t(j+1),...,t(j
+n-1))の間で、ブロック置換による編集コストが最小に
なるようなセグメント・ブロックの対応を求めるもので
ある。ここに示すアルゴリズムは、DPをもとにした、
2つの文字列間の近似対応を求めるWagner-Fisherのア
ルゴリズムの拡張である。
【0118】最初のステップ1300で、l=0〜2*n-1の
D(x-l,l)と、k=0〜2*m-1のD(k,y-1)に無限大を代入し、
D(x-1,y-1)に0を代入し、xmaxにx+mを代入し、ymaxにy
+nを代入した後、ループ1に入る。このループ1は、i
をxから1ずつインクリメントしながら、iがxmax-1を
超えるまで繰り返される。ループ1中のループ2は、j
をyから1ずつインクリメントしながら、yがymax-1を
超えるまで繰り返される。ステップ1305では、s(i-
k+1),s(i-k+2),...,s(i)とt(j-l+1),t(j-l+2),...,t(j)
のブロック置換による編集コストeとD(i-k,j-l)の和を
最小にするk,lをk0,l0に設定する。ステップ130
6の判定に用いるeは、k=k0,l=l0のときの編集コスト
の値である。
【0119】ステップ1310では、(xmax-1,ymax-1)
からポインタを(後ろから前へ)辿ることにより、編集
コストが最小の対応付けに基づきモデル図形を正規化
し、正規化後のモデル図形と入力図形の間の距離dを求
める。すなわち、対応したセグメント・ブロックの各組
に対して、2つの輪郭上に同じ個数の対応点を選び、最
小二乗法によって、S(x)に対応する図形をT(j)に近い
図形に変換するようなアフィン変換を計算する。T(j)
とアフィン変換されたS(x)の距離を、Hausdorff距離
【0120】
【数5】
【0121】又は、一般化Hausdorff距離
【0122】
【数6】
【0123】により計算する。そして、求めた距離値d
が、それまでに求められた距離の最小値dminより小さけ
れば、その距離値dをdminに代入し(ステップ131
1,1312)、dminの値を戻り値として返す(ステッ
プ1313)。
【0124】本実施例によれば、以上の説明から明らか
なように、ノイズや大局的・局所的変換による図形の変
形、輪郭の構造的特徴の変化がある場合にも、2つの図
形の輪郭の構造的特徴の間の対応付けと図形の正規化を
的確に行い、図形間の類似度又は相違度を精度良く評価
できる。また、そのような対応付けや正規化は特徴空間
での処理であるため、そのための演算量は比較的少な
い。したがって、ノイズや大局的・局所的変換から生ず
る図形の変形、特徴の変化に頑健で、かつ効率的な図形
分類が可能になる。
【0125】なお、本実施例の図形分類システムは、例
えば図3に簡略化して示すような構成のコンピュータ上
で、プログラムにより実現することができる。モデル図
形の構造的特徴の集合である辞書1125は大容量記憶
装置210に保存される。このコンピュータ上で図19
中の各機能部1100,1105,1110,111
5,1120(1121,1122,1123),11
30の機能を実現するための図形分類プログラム112
6は、例えばディスクドライブ230にセットされたデ
ィスク媒体235より読み込まれて大容量記憶装置21
0に格納される。このプログラム1126は、必要な時
にその全部又は一部がメモリ205にロードされてCP
U200により実行される。入力図形の画像又は線図形
は入力装置215によって入力される。
【0126】
【発明の効果】請求項1又は2の発明によれば、図形の
ノイズや変形に頑健な図形分類又は検索が可能になる。
また、比較的少ない計算量で変形図形の構造的特徴を合
成することができるため、効率的な図形分類又は検索の
処理が可能である。
【0127】請求項3乃至6の各項の発明によれば、1
モデルにつき1サンプルしか使えないような場合にも、
ノイズや変形に頑健で効率的かつ高速な構造的インデク
シングによる図形分類又は検索が可能である。また、請
求項9又は10の発明によれば、そのような図形のノイ
ズや変形に対して頑健な図形分類又は検索を、コンピュ
ータを利用し容易に実施できる。
【0128】請求項7の発明によれば、比較的少ない計
算量で、図形のノイズや変形を考慮した図形分類のため
の特徴を得ることができる。請求項8の発明によれば、
1モデルにつき1サンプルしか使えないような場合に
も、図形のノイズや変形に頑健な構造的インデクシング
による図形分類を可能にするための表を、比較的少ない
計算量で作成することができる。
【0129】請求項11又は12の発明によれば、ノイ
ズや大局的・局所的変換から生ずる図形の変形、特徴の
変化に対して頑健で効率的な図形分類が可能である。ま
た、請求項13の発明によれば、そのような図形分類
を、コンピュータを利用し容易に実施できる。
【0130】請求項14の発明によれば、図形の変形、
特徴の変化がある場合でも2つの図形間の類似度又は相
違度の的確な評価が可能であり、また、その評価のため
の処理を特徴空間において比較的少ない計算量で行うこ
とができる。請求項16又は15の発明によれば、図形
の変形、特徴の変化がある場合でも、特徴空間での効率
的な処理によって、的確な図形の対応付け又は正規化を
行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例による図形分類検索シス
テムの概略構成図である。
【図2】構造的インデクシングのための分類表の模式図
である。
【図3】本発明をプログラムで実現するためのコンピュ
ータのハードウェア構成の一例を簡略化して示すブロッ
ク図である。
【図4】特徴抽出処理の流れを示すフローチャートであ
る。
【図5】特徴抽出過程で得られるデータを関連付けて示
す図である。
【図6】特徴合成処理の流れを示すフローチャートであ
る。
【図7】分類検索部の処理の流れを示すフローチャート
である。
【図8】入力される図形の画像の一例を示す図である。
【図9】図形の閉輪郭線の一例を示す図である。
【図10】多角形近似された閉輪郭線の一例を示す図で
ある。
【図11】方向軸と量子化方向コードの一例を示す図で
ある。
【図12】輪郭の部分セグメントへの分割例を示す図で
ある。
【図13】部分セグメントの統合による輪郭のセグメン
トへの分割例を示す図である。
【図14】大局的には似ているが局所的変形により構造
的特徴が異なった2つの部分輪郭の例を示す図である。
【図15】図14の2つの部分輪郭を近づけるための編
集の例を示す図である。
【図16】図12中の部分セグメントA,Bの連結点に
関する量子化方向の説明のための図である。
【図17】図12中の部分セグメントG,Hの連結点に
関する量子化方向の説明のための図である。
【図18】回転によるセグメントの特性数の変換の例を
示す図である。
【図19】本発明の第2の実施例による図形分類システ
ムの概略構成図である。
【図20】マッチング処理及び分類処理の流れを示すフ
ローチャートである。
【図21】モデル図形の輪郭とそのセグメント分割の例
を示す図である。
【図22】図21のモデル図形を図13の入力図形に近
づけるように正規化した図形の例を示す図である。
【図23】図22の図形と図13の図形を重ねて示す図
である。
【図24】マッチング・アルゴリズムの例を示すフロー
チャートである。
【図25】図24に示したマッチング・アルゴリズムの
続きを示すフローチャートである。
【図26】図25に示したマッチング・アルゴリズムの
続きを示すフローチャートである。
【図27】図24乃至図26に示したマッチング・アル
ゴリズムにおいて呼び出される関数segmentMatching(x,
y,left,right,dmin)のアルゴリズムの例を示すフローチ
ャートである。
【図28】図27に示したアルゴリズムの続きを示すフ
ローチャートである。
【符号の説明】
100 図形入力部 105 特徴抽出部 110 特徴合成部 115 分類検索部 120 分類表 125 図形データベース 150 モデル図形入力部 155 特徴抽出部 160 特徴合成部 165 表作成部 200 CPU 205 メモリ 210 ハードディスク等の大容量記憶装置 215 スキャナ、デジタルカメラ、デジタイザ等の入
力装置 220 ディスプレイ 225 キーボード、マウス等の入力装置 230 ディスクドライバ 235 フロッピーディスクやCD−ROM等のディス
ク媒体 250 図形分類検索プログラム 1100 画像入力部 1105 輪郭抽出部 1110 多角形近似部 1115 特徴抽出部 1120 マッチング部 1121 対応付け部 1122 正規化部 1123 距離計算部 1125 辞書 1130 分類部 1126 図形分類プログラム
───────────────────────────────────────────────────── フロントページの続き (54)【発明の名称】 図形分類方法、図形検索方法、図形分類システム、図形検索システム、図形分類用特徴抽出方 法、図形分類用表作成方法、情報記録媒体、図形間の類似度又は相異度の評価方法、図形正規化 方法、及び、図形間対応付け方法

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 図形を入力する図形入力ステップと、該
    図形入力ステップによる入力図形の構造的特徴を抽出す
    る特徴抽出ステップと、該特徴抽出ステップにより抽出
    された構造的特徴から特定の変換規則に従って変形図形
    の構造的特徴を合成する特徴合成ステップと、該特徴抽
    出ステップ及び該特徴合成ステップによって得られた各
    構造的特徴に基づいて該入力図形を分類する分類ステッ
    プとを含むことを特徴とする図形分類方法。
  2. 【請求項2】 図形を入力する図形入力ステップと、該
    図形入力ステップによる入力図形の構造的特徴を抽出す
    る特徴抽出ステップと、該特徴抽出ステップにより抽出
    された構造的特徴から特定の変換規則に従って変形図形
    の構造的特徴を合成する特徴合成ステップと、該特徴抽
    出ステップ及び該特徴合成ステップによって得られた各
    構造的特徴に基づいて該入力図形を分類し、分類結果に
    基づいて図形データベースを検索する分類検索ステップ
    とを含むことを特徴とする図形検索方法。
  3. 【請求項3】 図形を入力する図形入力ステップと、該
    図形入力ステップによる入力図形の構造的特徴を抽出す
    る特徴抽出ステップと、該特徴抽出ステップにより抽出
    された構造的特徴から特定の変換規則に従って変形図形
    の構造的特徴を合成する特徴合成ステップと、該特徴抽
    出ステップ及び該特徴合成ステップによって得られた各
    構造的特徴からインデックスを計算し、該計算されたイ
    ンデックスに対応する表のエントリーのモデル識別子リ
    ストを参照し、当該モデル識別子リストに含まれる各モ
    デル識別子に対する投票操作を行って得票数の多いモデ
    ル識別子を求める分類ステップとを含み、該表は、モデ
    ル図形より抽出された構造的特徴又は、当該構造的特徴
    から特定の変換規則に従って合成された変形図形の構造
    的特徴のいずれかを持つモデルの識別子のリストを、当
    該構造的特徴から計算されたインデックスのエントリー
    とする表であることを特徴とする図形分類方法。
  4. 【請求項4】 図形を入力する図形入力ステップと、該
    図形入力ステップによる入力図形の構造的特徴を抽出す
    る特徴抽出ステップと、該特徴抽出ステップにより抽出
    された構造的特徴から特定の変換規則に従って変形図形
    の構造的特徴を合成する特徴合成ステップと、該特徴抽
    出ステップ及び該特徴合成ステップによって得られた各
    構造的特徴からインデックスを計算し、該計算されたイ
    ンデックスに対応する表のエントリーのモデル識別子リ
    ストを参照し、当該モデル識別子リストに含まれる各モ
    デル識別子に対する投票操作を行って得票数の多いモデ
    ル識別子を求め、当該モデル識別子を検索キーとして図
    形データベースを検索する分類検索ステップとを含み、
    該表は、モデル図形より抽出された構造的特徴又は、当
    該構造的特徴から特定の変換規則に従って合成された変
    形図形の構造的特徴のいずれかを持つモデルの識別子の
    リストを、当該構造的特徴から計算されたインデックス
    のエントリーとする表であることを特徴とする図形検索
    方法。
  5. 【請求項5】 図形を入力する図形入力手段と、該図形
    入力手段による入力図形の構造的特徴を抽出する特徴抽
    出手段と、該特徴抽出手段により抽出された構造的特徴
    から特定の変換規則に従って変形図形の構造的特徴を合
    成する特徴合成手段と、モデル図形より抽出された構造
    的特徴又は当該構造的特徴から特定の変換規則に従って
    合成された変形図形の構造的特徴のいずれかを持つモデ
    ルの識別子のリストを、当該構造的特徴から計算された
    インデックスのエントリーとする表を記憶する手段と、
    該特徴抽出手段及び該特徴合成手段によって得られた各
    構造的特徴からインデックスを計算し、該計算されたイ
    ンデックスに対応する該表のエントリーのモデル識別子
    リストを参照し、当該モデル識別子リストに含まれる各
    モデル識別子に対する投票操作を行って得票数の多いモ
    デル識別子を求める分類手段とを具備することを特徴と
    する図形分類システム。
  6. 【請求項6】 図形を入力する図形入力手段と、該図形
    入力手段による入力図形の構造的特徴を抽出する特徴抽
    出手段と、該特徴抽出手段により抽出された構造的特徴
    から特定の変換規則に従って変形図形の構造的特徴を合
    成する特徴合成手段と、モデル図形より抽出された構造
    的特徴又は当該構造的特徴から特定の変換規則に従って
    合成された変形図形の構造的特徴のいずれかを持つモデ
    ルの識別子のリストを、当該構造的特徴から計算された
    インデックスのエントリーとする表と、図形データベー
    スと、該特徴抽出手段及び該特徴合成手段によって得ら
    れた各構造的特徴からインデックスを計算し、該計算さ
    れたインデックスに対応する該表のエントリーのモデル
    識別子リストを参照し、当該モデル識別子リストに含ま
    れる各モデル識別子に対する投票操作を行って得票数の
    多いモデル識別子を求め、当該モデル識別子を検索キー
    として該図形データベースを検索する分類検索手段とを
    具備することを特徴とする図形検索システム。
  7. 【請求項7】 図形の輪郭線又は線図形を多角形近似し
    て、その構造的特徴を抽出するステップと、該ステップ
    で抽出された構造的特徴から、予め決められた変換規則
    に従って、ノイズや局所的変形によって発生する変形図
    形の構造的特徴を合成するステップとを含むことを特徴
    とする図形分類用特徴抽出方法。
  8. 【請求項8】 図形分類用表を用意するステップと、モ
    デル集合に含まれる各モデル図形から構造的特徴を抽出
    する特徴抽出ステップと、該特徴抽出ステップにより抽
    出された構造的特徴から特定の変換規則に従って変形図
    形の構造的特徴を合成する特徴合成ステップと、該特徴
    抽出ステップ及び該特徴合成ステップにより得られた各
    構造的特徴を持つモデルの識別子のリストを、当該各構
    造的特徴から計算されたインデックスに対応する該図形
    分類用表のエントリーとして貯えるステップとを含むこ
    とを特徴とする図形分類用表作成方法。
  9. 【請求項9】 請求項5記載の図形入力手段、特徴抽出
    手段、特徴合成手段、及び分類手段としてコンピュータ
    を機能させるための図形分類プログラムが記録されたこ
    とを特徴とする機械読み取り可能な情報記録媒体。
  10. 【請求項10】 請求項6記載の図形入力手段、特徴抽
    出手段、特徴合成手段、及び分類検索手段としてコンピ
    ュータを機能させるための図形検索プログラムが記録さ
    れたことを特徴とする機械読み取り可能な情報記録媒
    体。
  11. 【請求項11】 図形の輪郭を多角形近似し、量子化方
    向特徴と準凹凸構造に基づいて連続したいくつかの線分
    をより高いレベルの構造的特徴に統合する方法により各
    モデル図形の輪郭の構造的特徴を予め抽出しておき、同
    じ方法により入力図形の輪郭の構造的特徴を抽出し、入
    力図形の輪郭の構造的特徴及びモデル図形の輪郭の構造
    的特徴をそれぞれ互いに近付けるための編集コストに基
    づいて入力図形とモデル図形の輪郭の構造的特徴の間の
    対応関係を求め、この対応関係に従ってモデル図形と入
    力図形のうちの一方の図形の輪郭に対し他方の図形の輪
    郭に近づけるように幾何学的変換を施し、この幾何学的
    変換後の一方の図形の輪郭と他方の図形の輪郭の間の距
    離を計算し、計算された距離の小さな1つ又は複数のモ
    デル図形を入力図形の分類候補とすることを特徴とする
    図形分類方法。
  12. 【請求項12】 図形の輪郭を多角形近似し、量子化方
    向特徴と準凹凸構造に基づいて連続したいくつかの線分
    をより高いレベルの構造的特徴に統合する方法により抽
    出した各モデル図形の輪郭の構造的特徴を格納する辞書
    と、図形を入力するための手段と、当該手段による入力
    図形の輪郭の構造的特徴を前記方法によって抽出するた
    めの特徴抽出手段と、該特徴抽出手段により抽出された
    入力図形の輪郭の構造的特徴及び該辞書に格納されてい
    るモデル図形の輪郭の構造的特徴をそれぞれ互いに近付
    けるための編集コストに基づいて入力図形とモデル図形
    の輪郭の構造的特徴の間の対応関係を求め、この対応関
    係に従ってモデル図形と入力図形のうちの一方の図形の
    輪郭に対し他方の図形の輪郭に近づけるように幾何学的
    変換を施し、この幾何学的変換後の一方の図形の輪郭と
    他方の図形の輪郭の間の距離を計算するマッチング手段
    と、当該マッチング手段により計算された距離の小さな
    1つ又は複数のモデル図形を入力図形の分類候補として
    選択する手段とを具備することを特徴とする図形分類シ
    ステム。
  13. 【請求項13】 コンピュータを、請求項12記載の図
    形の入力のための手段、特徴抽出手段、マッチング手
    段、及び、分類候補の選択のための手段として機能させ
    るための図形分類プログラムが記録されたことを特徴と
    する機械読み取り可能な情報記録媒体。
  14. 【請求項14】 2つの図形について、それぞれの輪郭
    を多角形近似し、量子化方向特徴と準凹凸構造に基づい
    て連続したいくつかの線分をより高いレベルの構造的特
    徴に統合する方法により輪郭の構造的特徴を記述し、2
    つの図形の輪郭の構造的特徴をそれぞれ互いに近付ける
    ための編集コストに基づいて両図形の輪郭の構造的特徴
    の間の対応関係を求め、この対応関係に従って一方の図
    形の輪郭に対し他方の図形の輪郭に近づけるように幾何
    学的変換を施し、この幾何学的変換後の一方の図形の輪
    郭と他方の図形の輪郭の間の距離を計算することを特徴
    とする図形間の類似度又は相違度の評価方法。
  15. 【請求項15】 2つの図形について、それぞれの輪郭
    を多角形近似し、量子化方向特徴と準凹凸構造に基づい
    て連続したいくつかの線分をより高いレベルの構造的特
    徴に統合する方法により輪郭の構造的特徴を記述し、2
    つの図形の輪郭の構造的特徴をそれぞれ互いに近付ける
    ための編集コストに基づいて両図形の輪郭の構造的特徴
    の間の対応関係を求め、この対応関係に従って一方の図
    形の輪郭に対し他方の図形の輪郭に近づけるように幾何
    学的変換を施すこと特徴とする図形正規化方法。
  16. 【請求項16】 2つの図形について、それぞれの輪郭
    を多角形近似し、量子化方向特徴と準凹凸構造に基づい
    て連続したいくつかの線分をより高いレベルの構造的特
    徴に統合する方法により輪郭の構造的特徴を記述し、2
    つの図形の輪郭の構造的特徴をそれぞれ互いに近付ける
    ための編集コストを最小にするように両図形の輪郭の構
    造的特徴の間の対応関係を求めることを特徴とする図形
    間対応付け方法。
JP18840898A 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法 Expired - Fee Related JP3815704B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18840898A JP3815704B2 (ja) 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
US09/179,418 US6424746B1 (en) 1997-10-28 1998-10-27 Figure classifying method, figure classifying system, feature extracting method for figure classification, method for producing table for figure classification, information recording medium, method for evaluating degree of similarity or degree of difference between figures, figure normalizing method, and method for determining correspondence between figures

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP9-295237 1997-10-28
JP29523797 1997-10-28
JP9-310152 1997-11-12
JP31015297 1997-11-12
JP18840898A JP3815704B2 (ja) 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法

Publications (2)

Publication Number Publication Date
JPH11203461A true JPH11203461A (ja) 1999-07-30
JP3815704B2 JP3815704B2 (ja) 2006-08-30

Family

ID=27326033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18840898A Expired - Fee Related JP3815704B2 (ja) 1997-10-28 1998-07-03 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法

Country Status (2)

Country Link
US (1) US6424746B1 (ja)
JP (1) JP3815704B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6907141B1 (en) 2000-03-14 2005-06-14 Fuji Xerox Co., Ltd. Image data sorting device and image data sorting method
JP2005346391A (ja) * 2004-06-02 2005-12-15 Toyota Motor Corp 物体認識方法
WO2007026948A1 (ja) * 2005-08-31 2007-03-08 Toyota Jidosha Kabushiki Kaisha 画像検索方法及び装置
JP2007511838A (ja) * 2003-11-13 2007-05-10 本田技研工業株式会社 距離、局所線形構造およびアフィン対称を用いた画像クラスタリング
JP2007287145A (ja) * 2006-04-12 2007-11-01 Fujitsu Ltd 形状比較装置および形状比較方法
JP2012048711A (ja) * 2010-08-02 2012-03-08 Celartem Inc フォントマッチング
WO2012090645A1 (ja) * 2010-12-28 2012-07-05 日本電気株式会社 物体形状認識方法、物体形状認識システム及びプログラム
CN106643545A (zh) * 2016-10-09 2017-05-10 湖南大学 激光位移技术测量钢轨轮廓的校准方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100518860B1 (ko) * 1999-07-05 2005-09-30 엘지전자 주식회사 이미지의 특징소 정규화 정보를 사용한 이미지 검색 방법
GB2352076B (en) * 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US7065242B2 (en) 2000-03-28 2006-06-20 Viewpoint Corporation System and method of three-dimensional image capture and modeling
US6658147B2 (en) * 2001-04-16 2003-12-02 Parascript Llc Reshaping freehand drawn lines and shapes in an electronic document
JP4169522B2 (ja) * 2002-03-22 2008-10-22 株式会社リコー 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
WO2004042658A1 (ja) * 2002-11-07 2004-05-21 Matsushita Electric Industrial Co., Ltd. 個人認証方法、虹彩登録装置、虹彩認証装置および個人認証プログラム
JP4259949B2 (ja) 2003-08-08 2009-04-30 株式会社リコー 画像作成装置、画像作成プログラムおよび記録媒体
US20050058350A1 (en) * 2003-09-15 2005-03-17 Lockheed Martin Corporation System and method for object identification
US20060193520A1 (en) * 2005-02-28 2006-08-31 Takeshi Mita Object detection apparatus, learning apparatus, object detection system, object detection method and object detection program
US7827179B2 (en) * 2005-09-02 2010-11-02 Nec Corporation Data clustering system, data clustering method, and data clustering program
US20070071323A1 (en) * 2005-09-26 2007-03-29 Cognisign Llc Apparatus and method for processing user-specified search image points
US9305235B1 (en) * 2007-12-21 2016-04-05 Cognex Corporation System and method for identifying and locating instances of a shape under large variations in linear degrees of freedom and/or stroke widths
US20090208055A1 (en) * 2008-02-20 2009-08-20 Lockheed Martin Corporation Efficient detection of broken line segments in a scanned image
EP2189908B1 (de) * 2008-11-06 2012-04-11 ServiceTrace e.K. Verfahren und Vorrichtung zum Bestimmen einer Kenngröße eines IT-Systems
JP5651414B2 (ja) * 2010-09-16 2015-01-14 株式会社東芝 車両検出装置
JP5754055B2 (ja) * 2010-11-26 2015-07-22 日本電気株式会社 物体または形状の情報表現方法
US9870517B2 (en) * 2011-12-08 2018-01-16 Excalibur Ip, Llc Image object retrieval
US10127824B2 (en) 2016-04-01 2018-11-13 Yen4Ken, Inc. System and methods to create multi-faceted index instructional videos
CN106775548B (zh) * 2016-11-25 2018-02-23 北京小米移动软件有限公司 页面处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4747153A (en) * 1984-03-08 1988-05-24 Japan As Represented By Director General Of Agency Of Industrial Science And Technology Device and method for pattern recognition
US5144679A (en) * 1987-06-29 1992-09-01 Hitachi, Ltd Graphic data searching and storage method
JP3001966B2 (ja) 1990-11-30 2000-01-24 株式会社リコー 文字認識用辞書の作成方法
JP3260843B2 (ja) 1992-08-25 2002-02-25 株式会社リコー 文字認識方法
JP2626528B2 (ja) * 1993-11-22 1997-07-02 日本電気株式会社 図形認識装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6907141B1 (en) 2000-03-14 2005-06-14 Fuji Xerox Co., Ltd. Image data sorting device and image data sorting method
JP2007511838A (ja) * 2003-11-13 2007-05-10 本田技研工業株式会社 距離、局所線形構造およびアフィン対称を用いた画像クラスタリング
JP2005346391A (ja) * 2004-06-02 2005-12-15 Toyota Motor Corp 物体認識方法
WO2007026948A1 (ja) * 2005-08-31 2007-03-08 Toyota Jidosha Kabushiki Kaisha 画像検索方法及び装置
JP2007066025A (ja) * 2005-08-31 2007-03-15 Toyota Motor Corp 画像検索方法及び装置
US8295604B2 (en) 2005-08-31 2012-10-23 Toyota Jidosha Kabushiki Kaisha Image search method and device using affine-invariant regions
JP2007287145A (ja) * 2006-04-12 2007-11-01 Fujitsu Ltd 形状比較装置および形状比較方法
JP2012048711A (ja) * 2010-08-02 2012-03-08 Celartem Inc フォントマッチング
WO2012090645A1 (ja) * 2010-12-28 2012-07-05 日本電気株式会社 物体形状認識方法、物体形状認識システム及びプログラム
JP5757293B2 (ja) * 2010-12-28 2015-07-29 日本電気株式会社 物体形状認識方法、物体形状認識システム及びプログラム
CN106643545A (zh) * 2016-10-09 2017-05-10 湖南大学 激光位移技术测量钢轨轮廓的校准方法
CN106643545B (zh) * 2016-10-09 2018-10-26 湖南大学 激光位移技术测量钢轨轮廓的校准方法

Also Published As

Publication number Publication date
JP3815704B2 (ja) 2006-08-30
US6424746B1 (en) 2002-07-23

Similar Documents

Publication Publication Date Title
JP3815704B2 (ja) 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
Konidaris et al. Keyword-guided word spotting in historical printed documents using synthetic data and user feedback
JP5754055B2 (ja) 物体または形状の情報表現方法
Huang et al. Object-location-aware hashing for multi-label image retrieval via automatic mask learning
CN1239260A (zh) 使用多分辨率模型的手写字符记录
Wang et al. A coarse-to-fine word spotting approach for historical handwritten documents based on graph embedding and graph edit distance
Rajalakshmi et al. Pattern recognition-recognition of handwritten document using convolutional neural networks
Lawal et al. Recognition of handwritten arabic (indian) numerals using freeman's chain codes and abductive network classifiers
Lucena et al. Decision support system for classifying archaeological pottery profiles based on mathematical morphology
JP2017084349A (ja) 集合演算機能を備えたメモリ及びこれを用いた集合演算処理方法
Ahmad et al. Describing colors, textures and shapes for content based image retrieval-a survey
Pengcheng et al. Fast Chinese calligraphic character recognition with large-scale data
Kassis et al. Word spotting using radial descriptor graph
JP3753880B2 (ja) 図形分類方法、図形検索方法、図形分類検索システム及び記録媒体
Saabni et al. Fast key-word searching via embedding and active-dtw
JPH10289320A (ja) 候補テーブルを用いて分類を行うパターン認識装置および方法
Shirazi et al. Persian logo recognition using local binary patterns
Kadhim et al. Face recognition in multiple variations using deep learning and convolutional neural networks
JP2000067235A (ja) 図形分類方法、図形検索方法、記録媒体、図形分類装置、及び、図形検索装置
JP2000076464A (ja) 図形認識方法、図形認識装置、図形分類方法、図形分類装置、記録媒体、及び、図形特徴抽出方法
Wolf Densely Connected Convolutional Networks for Word Spotting in Handwritten Documents
Boualam et al. An overview on handwritten documents word spotting
Nishida Shape retrieval from image databases through structural feature indexing
JP3183949B2 (ja) パターン認識処理方法
Bouibed et al. Hybrid combination of convolutional neural network features for robust writer retrieval of historical documents

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060602

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090616

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees