JP2590414B2 - ファジィパターン認識方法 - Google Patents

ファジィパターン認識方法

Info

Publication number
JP2590414B2
JP2590414B2 JP3046808A JP4680891A JP2590414B2 JP 2590414 B2 JP2590414 B2 JP 2590414B2 JP 3046808 A JP3046808 A JP 3046808A JP 4680891 A JP4680891 A JP 4680891A JP 2590414 B2 JP2590414 B2 JP 2590414B2
Authority
JP
Japan
Prior art keywords
principal component
category
feature
similarity
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3046808A
Other languages
English (en)
Other versions
JPH05114051A (ja
Inventor
雅俊 來海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP3046808A priority Critical patent/JP2590414B2/ja
Publication of JPH05114051A publication Critical patent/JPH05114051A/ja
Application granted granted Critical
Publication of JP2590414B2 publication Critical patent/JP2590414B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、特徴量をファジィ集
合として扱い、特徴量空間において、入力された未知パ
ターンを予め与えられた幾つかの既知パターンの何れか
に識別するファジィパターン認識方法に関する。
【0002】
【従来の技術】文字などのパターン認識の処理は通常図
12のような手順で行われる。イメージスキャナなどに
よって入力された文書などの画像は、前処理として先ず
領域分割された後、文字領域とそれ以外の領域に分けら
れる。文字領域に対しては行切り出し、文字切り出しと
いう順序で1文字1文字が抽出される。
【0003】特徴抽出処理としては、1文字毎に抽出さ
れた文字の平滑化、正規化などの処理のあと、識別に必
要な特徴量が抽出される。この特徴抽出処理は文字識別
能力大きく作用する部分であり、最も重要な部分であ
ると言えるが、理論的な研究は殆ど進んでおらず、各々
の研究者の直観や経験に頼ることが多い。即ち通常は、
特徴の探索は発見的に行われ、その有効性は実験的に検
証される。例えば交差特徴、交差距離特徴、射影側面特
徴、幾何・位相的特徴あるいは構造解析法など種々の特
徴抽出方法がある。一般的には標準的な文字について抽
出された特徴量が辞書データとして記憶される。
【0004】識別処理では、認識すべき文字パターンの
特徴量について特徴空間においてそれぞれの辞書データ
との距離・類似度が求められ、最も近いカテゴリが識別
される。この代表的な手法としては、ユークリッド距
離、マハラノビス距離、ベイズ識別、複合類似度などの
距離・類似度識別方法がある。
【0005】後処理では、認識処理によってリジエクト
された文字や、認識は一応されたが類似度の低かった文
字などに対して、前後の認識結果を見て単語情報や文法
処理により、その文字が決定される。
【0006】上述した一連のパターン認識における識別
処理では具体的に次のようにして処理が行われる。
【0007】特徴量空間における識別手法の代表として
マハラノビス距離の定義式を次に示す。
【0008】
【数1】
【0009】但し x:未知パターンベクトル xi :カテゴリiの平均パターンベクトル i Φk :カテゴリiの第k主成分の固有ベクトル i λk :カテゴリiの第k主成分の固有値 このマハラノビス距離を用いた識別手法では、先ずそれ
ぞれのカテゴリについて多数の学習文字サンプルから共
分散行列を求めたあと、主成分分析を行う。そして各主
成分軸上で分散(固有値)を考慮しながら平均パターン
ベクトルからの距離を求め、全ての軸の距離の二乗和を
計算する。そしてこの距離が最も近い辞書パターンを認
識結果とする。
【0010】このように、マハラノビス距離di (x)
が最小となるカテゴリに分類するということは、例えば
図9に示すように、各主成分の特徴量の頻度分布を図1
0のような正規分布と見做して正規分布上での確率密度
最大のカテゴリに分類することに他ならない。
【0011】また、二次元の特徴量空間では等類似度線
は図11のように画一的な楕円形状となる。ここで長軸
が第1主成分軸、短軸が第2主成分軸である。
【0012】
【発明が解決しようとする課題】ところが、上述した統
計的識別手法には2つの問題点がある。先ず第1の問題
点は、サンプルデータは各主成分軸上で特徴量の出現頻
度が必ずしも正規分布を成さない、ということである。
その結果、正規分布の式を用いた確率密度関数がサンプ
ルデータの出現確率に一致しないので、理論上では誤認
識が最も少なくなるように識別したとても実際にはそ
うならない。第2の問題点は、各主成分の特徴量出現確
率と人間の識別基準とが一致しない、ということであ
る。すなわち例えば文字認識では筆記文字の変形分布
と、人間の識別可能な文字の概念的分布とが異なるとい
うことである。例えば同じカテゴリ(字種)について、
幾つかの主成分についてマハラノビス距離の異なる複数
のサンプル文字を配列した際、マハラノビス距離と人間
の感じる類似度とはかなり異なっていることが分かる。
【0013】この発明の目的は、各主成分軸上で辞書デ
ータとの類似度を求める時に、正規分布の式を用いるの
ではなく、人間の主観を反映したメンバシップ関数を用
いることにより、上述の問題を解消したファジィパター
ン認識方法を提供することにある。
【0014】
【課題を解決するための手段】この発明のファジィパタ
ーン認識方法は、辞書作成の際、カテゴリ毎にそれぞれ
複数の学習サンプルデータの特徴ベクトルを抽出した
後、主成分分析し、平均パターンベクトルと各主成分の
固有ベクトルを主成分辞書データとして求めるととも
に、各主成分軸上の特徴量を入力変数、類似度を出力変
数とするメンバシップ関数をメンバシップ関数辞書デー
タとして求め、認識の際、未知パターンの特徴ベクトル
を抽出した後、各カテゴリ毎に前記主成分辞書データに
基づき主成分展開するとともに、前記メンバシップ関数
辞書データから各主成分の特徴量に対するメンバシップ
値を求め、カテゴリ毎に求めた各主成分のメンバシップ
値から類似度最大のカテゴリを判定することを特徴とす
る。
【0015】
【作用】ここで各カテゴリとの類似度は次式で表すこと
ができる。
【0016】
【数2】
【0017】ただし iuk=(x−xi)iΦk iμk( ): 人間の主観から求めた、カテゴリiの
第k主成分軸上のメンバシップ関数 この発明のファジィパターン認識方法では、辞書データ
作成の際、カテゴリ毎にそれぞれ複数の学習サンプルデ
ータの特徴ベクトルxが抽出された後、主成分分析さ
れ、平均パターンベクトル xiと各主成分の固有ベク
トルiΦk が主成分辞書データとして求められる。ま
た、各主成分軸上の特徴量 iuk を入力変数、類似
度を出力変数とるメンバシップ関数がメンバシップ関
数辞書データとして作成される。例えば「ア」というカ
テゴリに属する複数の学習サンプルデータからそれぞれ
n次元の特徴ベクトルxが求められ、共分散行列が求め
られたあと主成分分析され、例えば図6に示すように各
主成分軸上の特徴量毎に標準的な「ア」からの類似度が
メンバシップ関数として求められる。
【0018】認識の際には未知パターンからn次元の特
徴ベクトルx求められ、平均パターンベクトルxi と各
主成分の固有ベクトル iΦk に基づき主成分展開され、
すなわち差ベクトル(x−xi )と固有ベクトル iΦk
との内積をとることによって第k主成分の特徴量 ik
が求められ、更にメンバシップ関数辞書データに基づき
各主成分の特徴量に対するメンバシップ値が求められ
る。そしてカテゴリ毎に求められた各主成分のメンバシ
ップ値から最も類似するカテゴリが認識結果として識別
される。
【0019】以上のように辞書データとして、複数の学
習サンプルデータから求めた各主成分軸上での特徴量に
対する類似度のメンバシップ関数を定めたことにより、
人間の主観を類似度に取り入れたファジィパターン認識
が可能となり、認識率を向上させることができる。
【0020】ここで、ある主成分の特徴量に対する類似
度は例えば図7のように表すことができる。また、二次
元の特徴量空間における等類似度線は図8のようにな
る。従来の方法では等類似度線は画一的な楕円形状であ
ったが、ファジィを用いたこの発明の方法では人間の感
覚を反映してより、よりきめ細かく表現することが可能
となる。
【0021】
【実施例】この発明のファジイパターン認識方法を適用
するパターン認識装置のブロック図を図1に示す。図1
において中央制御部1は、バスラインに接続される各種
処理部に対する各種データの入出力制御を行うことによ
って、この装置全体をファジィパターン認識装置として
機能させる。入力部2は例えばイメージスキャナやディ
ジタイザなどからなり、学習サンプルパターンおよび認
識すべきパターンを入力する。前処理部3は入力パター
ンを行切り出しおよび文字切り出しを行って1文字づつ
抽出し、また縦書き横書きの判定とともに傾きの補正な
どの各種前処理を行う。作業領域4は入力データの一時
記憶および各種データ処理時のワーキングエリアとして
用いられる。特徴抽出部5は、1文字ごとに抽出された
文字に対し平滑化、正規化などの処理を行った後、識別
に必要な多次元の特徴ベクトルを抽出する。特徴ベクト
ルとしては既に述べたように各種の手法を採択する。そ
して、辞書作成時には各カテゴリ毎に学習サンプルデー
タについて求めた各特徴ベクトルから共分散行列を求め
たあと主成分分析を行い、xiと iΦk を主成分辞
書6へ登録する。主成分辞書6は図2に示すように各カ
テゴリ毎に平均パターンベクトルxiと固有ベクトル
iΦk を記憶する。主成分展開部7は認識時に文字の
特徴ベクトルに対し、主成分辞書のデータxi,iΦk
に基づいて特徴量iukを求める。メンバシップ関数
辞書8は、図6に示したように、各カテゴリ毎に各主成
分の特徴量に対する類似度との関係を例えば図3に示す
ように各カテゴリの各主成分毎に記憶する。メンバシッ
プ値算出部9はメンバシップ関数辞書8を参照して各カ
テゴリ毎の各主成分毎にメンバシップ値(類似度)を求
める。類似度算出部10は〔数2〕に示したように各主
成分について求めたメンバシップ値を掛け合わせてカテ
ゴリ毎の類似度Fi(x)を求める。判定部11は求め
られた類似度のうち最大値すなわち最も類似するカテゴ
リを判定する。出力部12はその判定結果を認識結果と
して出力する。
【0022】次に、装置全体の処理手順をフローチャー
トとして図4および図5に示す。
【0023】図4は辞書データ作成時の処理手順であ
り、先ずカテゴリ番号を表す変数iに初期値0を設定
し、学習サンプルデータの番号を示す変数jに初期値1
を設定する(n1→n2)。続いて学習サンプルデータ
を入力し、前処理を行うとともにn次元の特徴ベクトル
を抽出し、これを一時記憶する(n3→n4)。このス
テップn3,n4の処理を同一カテゴリ(例えば
「ア」)における全ての学習サンプルデータについて繰
り返し行う(n5→n6→n3・・・)。1つのカテゴ
リについて全ての学習サンプルデータの特徴ベクトルを
抽出したなら、同様にして次のカテゴリ(例えば
「イ」)について同様に全ての学習サンプルデータにつ
いて特徴ベクトルを抽出する(n7→n8→n2→n3
・・・・)。全てのカテゴリについて同様の処理を行っ
た後、カテゴリ番号iに初期値0を設定し、順番にカテ
ゴリiについて各主成分の平均パターンベクトルxi
算出し、これを主成分辞書6へ登録する(n9→n1
0)。続いてカテゴリiについて第1主成分から第n主
成分について共分散行列を求めたあと主成分分析を行
い、固有ベクトル iΦK を算出しこれを主成分辞書6へ
登録する(n11)。その後、図6に示したように、あ
る主成分につき特徴量を入力変数、類似度を出力変数と
するメンバシップ関数を全ての主成分について定め、こ
れをメンバシップ関数辞書8へ登録する(n12)。こ
のメンバシップ関数の定めかたとしては、各特徴量に対
するメンバシップ値を1対1の関係で全て外部から設定
するか、メンバシップ関数の形を簡単なデータで表した
ものを外部から入力する方法が考えられる。上記ステッ
プn10〜n12の処理を全てのカテゴリについて同様
にして行う(n13→n14→n10・・・)。これに
より主成分辞書6およびメンバシップ関数辞書8に対す
る辞書データの登録が完了する。
【0024】図5は認識の際の処理手順であり、先ず未
知の文字を入力し、n次元の特徴ベクトルxを求める
(n20→n21)。続いてカテゴリ番号iに初期値0
を設定し、主成分辞書からxi iΦk を読み出して主
成分展開して各主成分軸上の特徴量を求める。すなわち
(x−xi iΦk の演算を行う(n22→n23)。
【0025】そして各主成分毎に特徴量に対する類似度
のメンバシップ値をメンバシップ関数辞書8を用いて算
出する(n24)。そして全ての主成分毎のメンバシッ
プ値を掛け合わせてカテゴリiの類似度Fi (x)を算
出する(n25)。ステップn23〜n25の処理を全
てのカテゴリについて行う(n26→n27→n23・
・・・)。その後、類似度が最大であるカテゴリを識別
し、これを出力する(n28)。
【0026】
【発明の効果】この発明によれば、特徴量空間において
パターン認識を行う際、各カテゴリの各主成分軸上のメ
ンバシップ関数を辞書データとして用い、未知パターン
の各主成分のメンバシップ値から類似度を求めるように
したことにより、上記メンバシップ関数を予め人間の主
観に対応して定めておくことによって、人間の感覚に適
応した精度の高いパターン認識が可能となる。
【図面の簡単な説明】
【図1】実施例に係るファジィパターン認識装置のブロ
ック図である。
【図2】主成分辞書の構成を示す図である。
【図3】メンバシップ関数辞書の構成を示す図である。
【図4】辞書データ作成時の処理手順を表すフローチャ
ートである。
【図5】認識時の処理手順を表すフローチャートであ
る。
【図6】あるカテゴリのある主成分軸におけるメンバシ
ップ関数の例を示す図である。
【図7】あるカテゴリのある主成分軸における特徴量に
対する類似度を人間の主観で表した図である。
【図8】二次元の特徴量について人間の主観で定めた等
類似度線の例を示す図である。
【図9】あるカテゴリのある主成分軸における学習サン
プルデータの頻度分布図である。
【図10】従来の統計的手法によるある主成分軸上での
理論的な類似度の頻度分布を示す図である。
【図11】従来の統計的手法による二次元における理論
的な等類似度線を示す図である。
【図12】一般的なパターン認識の処理の流れを示す図
である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 辞書作成の際、カテゴリ毎にそれぞれ複
    数の学習サンプルデータの特徴ベクトルを抽出した後、
    主成分分析し、平均パターンベクトルと各主成分の固有
    ベクトルを主成分辞書データとして求めるとともに、各
    主成分軸上の特徴量を入力変数、類似度を出力変数とす
    るメンバシップ関数をメンバシップ関数辞書データとし
    て求め、 認識の際、未知パターンの特徴ベクトルを抽出した後、
    各カテゴリ毎に前記主成分辞書データに基づき主成分展
    して各主成分の特徴量を求めるとともに、前記メンバ
    シップ関数辞書データから各主成分の特徴量に対するメ
    ンバシップ値を求め、カテゴリ毎に各主成分のメンバシ
    ップ値の積を類似度として求め、該類似度が最大となる
    カテゴリを判定することを特徴とするファジイパターン
    認識方法。
JP3046808A 1991-03-12 1991-03-12 ファジィパターン認識方法 Expired - Lifetime JP2590414B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3046808A JP2590414B2 (ja) 1991-03-12 1991-03-12 ファジィパターン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3046808A JP2590414B2 (ja) 1991-03-12 1991-03-12 ファジィパターン認識方法

Publications (2)

Publication Number Publication Date
JPH05114051A JPH05114051A (ja) 1993-05-07
JP2590414B2 true JP2590414B2 (ja) 1997-03-12

Family

ID=12757634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3046808A Expired - Lifetime JP2590414B2 (ja) 1991-03-12 1991-03-12 ファジィパターン認識方法

Country Status (1)

Country Link
JP (1) JP2590414B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1005694B1 (de) * 1997-08-21 2001-10-31 Siemens Aktiengesellschaft Verfahren zur bestimmung eines repräsentanten für einen sprachbaustein einer sprache aus einem lautabschnitte umfassenden sprachsignal
JP2002099916A (ja) * 2000-09-25 2002-04-05 Olympus Optical Co Ltd パターン分類方法及びその装置、コンピュータにより読み取り可能な記憶媒体
JP5268563B2 (ja) * 2008-10-29 2013-08-21 日立コンピュータ機器株式会社 文字認識装置、及び、認識辞書生成装置
CN103971133B (zh) * 2014-04-13 2017-06-09 北京工业大学 基于案例推理的钢板表面缺陷的自动识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56105586A (en) * 1980-01-28 1981-08-22 Toshiba Corp Pattern identifying device
JP2507308B2 (ja) * 1985-11-13 1996-06-12 株式会社東芝 パタ−ン認識学習方式
JPH01321591A (ja) * 1988-06-23 1989-12-27 Nec Corp 文字認識装置
JP2853168B2 (ja) * 1989-05-31 1999-02-03 株式会社明電舎 パターン認識装置

Also Published As

Publication number Publication date
JPH05114051A (ja) 1993-05-07

Similar Documents

Publication Publication Date Title
JP2815045B2 (ja) 画像特徴抽出装置,画像特徴解析装置,および画像照合システム
JP4989308B2 (ja) 画像処理装置及び画像検索方法
JP2750057B2 (ja) 自動手書き文字認識に対する統計的混合手法
Keysers et al. Adaptation in statistical pattern recognition using tangent vectors
US11704487B2 (en) System and method for fashion attributes extraction
KR19990010210A (ko) 대용량 패턴 정합 장치 및 방법
US5920644A (en) Apparatus and method of recognizing pattern through feature selection by projecting feature vector on partial eigenspace
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
Mwaura et al. Multimodal biometric system:-fusion of face and fingerprint biometrics at match score fusion level
JP2590414B2 (ja) ファジィパターン認識方法
JP3537949B2 (ja) パターン認識装置及び同装置における辞書修正方法
CN113762005A (zh) 特征选择模型的训练、对象分类方法、装置、设备及介质
Sucharta et al. A survey on various pattern recognition methods for the identification of a Different types of images
JP2556477B2 (ja) パタン照合装置
JP2020177318A (ja) 照合装置、学習装置、方法、及びプログラム
JP3180792B2 (ja) 文字認識装置、文字学習装置およびコンピュータ可読記録媒体
JPH06251156A (ja) パターン認識装置
JP7174382B2 (ja) 学習装置、照合装置、学習方法、照合方法及びプログラム
KR20020074330A (ko) 계층적 주요 성분 분석에 기반한 얼굴 인식 방법 및 장치
Ou et al. Fingerprint classifier using embedded hidden Markov models
JP3125432B2 (ja) 手書き文字認識装置
JP3754118B2 (ja) パターン認識装置及びパターン認識方法
JPH0540852A (ja) パターン認識装置
JP3280577B2 (ja) 文字認識装置
Tamamori et al. Image recognition based on separable lattice trajectory 2-D HMMs

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term