JPH05197813A - 特徴選択方法 - Google Patents

特徴選択方法

Info

Publication number
JPH05197813A
JPH05197813A JP4007240A JP724092A JPH05197813A JP H05197813 A JPH05197813 A JP H05197813A JP 4007240 A JP4007240 A JP 4007240A JP 724092 A JP724092 A JP 724092A JP H05197813 A JPH05197813 A JP H05197813A
Authority
JP
Japan
Prior art keywords
feature
feature set
features
recognition
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4007240A
Other languages
English (en)
Inventor
Shiko Yokozuka
志行 横塚
Hiromi Kida
博巳 木田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP4007240A priority Critical patent/JPH05197813A/ja
Publication of JPH05197813A publication Critical patent/JPH05197813A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 冗長性の少ない特徴集合を得ることができ、
かつ利用する識別関数に適した特徴集合を選択できるよ
うにする。 【構成】 新しい2つの特徴評価関数を導入する。すな
わち、選択特徴集合以外の特徴ベクトルの中から選択特
徴の候補となる特徴を複数個選択する第一特徴評価と、
選択特徴集合と上記第一特徴評価で得られた特徴を基に
して複数個の新しい選択特徴集合の候補を生成する第二
特徴評価である。これらの2つの評価関数により求めた
特徴を用いて認識率を計算し、その計算結果が所望の値
に満たしているとき処理を終了して、それをもとにして
認識結果を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、パタン認識装置におけ
る特徴選択方法に関し、特に特徴ベクトルの中からパタ
ン認識に有効な特徴を選択して、高精度かつ高速度でパ
タンを認識することが可能な特徴選択方法に関する。
【0002】
【従来の技術】従来より、パタン認識装置では、入力さ
れたパタンを走査して画像を取り出し、光電変換部で入
力画像を電気信号に変換した後、前処理部に送る。前処
理部では、入力されたパタ−ンに対して濃淡多値画像を
白黒の2値に変換したり、1文字毎に切り出したり、切
り出された文字の大きさの位置合わせを行う。前処理が
終了すると、パタンから特徴ベクトルを生成した後、パ
タンを認識するために有効な特徴を選択する特徴選択処
理を行い、その特徴について認識辞書に登録されている
各パタンの特徴と一致度を照合することにより、最も一
致したパタンを認識出力としている。なお、入力された
パタンをコンピュ−タにより認識する際には、そのパタ
ンの多数の特徴について比較することにより、一致度を
照合するのであるが、その特徴数は膨大な数であるた
め、その特徴の全部を用いて照合するのでは、非常に多
くの時間がかかる。そのため、従来よりパタンを認識す
るための特徴ベクトルの中から、認識に有効な特徴のみ
を選択する特徴選択方法が用いられている。特徴選択方
法として多く用いられている方法は、相関比を用いた特
徴選択方法である。なお、相関比に関する文献として
は、例えば、『パタ−ン・クラシフィケ−ション・アン
ド・シ−ン・アナリシス』(Pattern Classificatio
n and Scene Analysis(DUDA,HART,JOHN WILEY &
SONS)に詳述されている。
【0003】図3は、従来の相関比による特徴選択法の
機能ブロック図である。従来における相関比による特徴
選択法では、図3に示すように、先ず、パタンの特徴ベ
クトルの各特徴を相関比計算部31に入力することによ
り、相関比計算部31では入力された各特徴に対して相
関比という評価関数の計算を行う。次に、計算結果を特
徴選択情報生成部32に入力することにより、特徴選択
情報生成部32では、相関比の大きい順に特徴を並び換
えて所望の次元数だけの選択情報を生成する。そして、
生成された選択情報と読取対象の特徴ベクトルを特徴選
択部33に入力することにより、特徴選択部33では、
選択情報を基にして特徴の選択を行い、新特徴ベクトル
を出力する。ここで、相関比とは、カテゴリ内の分散値
と、カテゴリ間の分散値との比で表わした値であり、そ
の値の意味するところは特徴のカテゴリ間分離能力を評
価する値である。しかしながら、この特徴選択法は、特
徴間の関係を考慮して特徴を選択していないため、選択
された特徴集合の中にはかなりの冗長性がある。また、
最適な特徴集合は、実際に認識に用いる識別関数により
異なるが、この特徴選択法では、その点について考慮す
ることができないという問題がある。
【0004】
【発明が解決しようとする課題】前述のように、パタン
認識の分野では、特徴選択方法として相関比を用いた特
徴選択法がよく用いられている。しかし、この特徴選択
法は、特徴間の関係を考慮して特徴を選択していないた
め、選択された特徴集合の中にかなりの冗長性や不要な
特徴を多く含んでいる。また、一般に最適な選択特徴集
合(つまり、原特徴ベクトルの中から一定数個の特徴を
選択するとき、最も良い認識精度を達成できる特徴の組
み合わせ)は、実際に認識に用いる識別関数によって異
なる。しかしながら、従来の特徴選択法では、そのよう
な点について考慮することができないという問題があ
る。本発明の目的は、このような従来の課題を解決し、
従来の方法よりも冗長性の少ない特徴集合を得ることが
でき、かつ利用する識別関数に適した特徴集合を選択す
ることができる特徴選択方法を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明の特徴選択方法は、パタンを認識するための
特徴ベクトルの中から認識に有効な特徴のみを選択する
特徴選択方法において、多次元特徴ベクトルの中から最
も識別に有効な特徴を1つ選択し、特徴を選択特徴集合
の最初の要素とする初期特徴選択過程と、選択特徴集合
以外の特徴ベクトルの中から選択特徴集合の候補となる
特徴を複数個選択する第一の特徴評価過程と、選択特徴
集合および第一の特徴評画過程で得られた特徴をもとに
して複数個の新しい選択特徴集合の候補を生成する第二
の特徴評価過程と、第二の特徴評価過程で得られた複数
個の新しい特徴集合の候補の特徴を用いて認識率を測定
する認識率計算過程と、認識率計算過程で得られた結果
をもとにして、選択特徴集合候補の中から新しい選択特
徴集合を決定する選択特徴集合決定過程と、新しい選択
特徴集合を用いた場合の認識結果が所定の値を満たして
いるか否かを判別する処理終了決定過程とを有すること
に特徴がある。
【0006】
【作用】本発明においては、適切な特徴を選択するため
に、多次元の原特徴ベクトルの中から最も識別に有効な
特徴を1つだけ選択し、それを選択特徴集合の最初の要
素とする。次に、選択特徴集合の要素の候補を求めるた
めに、選択特徴集合以外の特徴ベクトルの中から現在の
エラ−率をより減少させるために必要となる特徴を複数
個求める。それらの特徴は、選択特徴集合の要素の候補
となる。それらの候補と選択特徴集合を組み合わせて、
選択特徴集合の候補を複数個作成する。次に、選択特徴
集合の候補を用いて実識実験を行う。この認識実験は、
集合の候補数だけ行われる。認識実験の中で、最も良い
認識実験となった集合の候補を、新しい選択特徴集合の
候補に決定する。この集合を用いたときの認識率が所望
の値であれば、処理を終了する。しかし、所望の値に到
達しなければ、選択特徴集合に新しい要素を追加するた
めに、再度上記処理を実行する。これにより、従来の方
法で選択された特徴集合よりも、冗長性の少ない特徴集
合を得ることができ、しかも利用する識別関数に適した
特徴を選択することができる。
【0007】
【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明の一実施例を示す特徴選択方
法を実行するプログラムモジュ−ルの構成図であるとと
もに、処理のフロ−チャ−トを示している。なお、図1
は、図2におけるパタン認識システムの特徴抽出部22
の詳細を示す機能ブロックを示している。図1におい
て、1は多次元特徴ベクトルの中から最も識別に有効な
特徴を1つ選択して、それを選択特徴集合の初めの要素
とする初期特徴選択部、2は選択特徴集合以外の特徴ベ
クトルの中から選択特徴集合の候補となる特徴を複数個
選択する第一特徴評価部、3は選択特徴集合と第一特徴
評価部で得られた特徴を基にして複数個の新しい選択特
徴集合の候補を生成する第二特徴評価部、4は第二特徴
評価部3で得られた複数個の新しい特徴集合の候補の特
徴を用いて認識率を測定する認識率計算部、5は認識率
計算部4で得られた結果を基にして選択特徴集合候補の
中から、新しい選択特徴集合を決定する選択特徴集合決
定部、6は新しい選択特徴集合を用いた場合の認識結果
が所望の値を満たしているか否かを判定する処理終了決
定部である。これらの各部1〜6は、いずれもコンピュ
−タにより実行されるプログラムモジュ−ルで構成され
る。
【0008】図1を処理フロ−チャ−トの各ステップと
して考えることにより、各処理を説明する。先ず、
(イ)初めに、初期特徴選択部1が、多次元の特徴ベク
トルの中から最も識別に有効な特徴を1つだけ選択し、
それを選択特徴集合の最初の要素とする。(ロ)次に、
第一特徴評価部2は、選択特徴集合の要素以外の特徴ベ
クトルの中から選択特徴集合の候補となる特徴を複数個
選択する。(ハ)次に、第二特徴評価部3は、選択特徴
集合と第一特徴評価部で得られた特徴を基にして、複数
個の新しい選択特徴集合の候補を生成する。(ニ)次
に、認識率計算部4は、第二特徴評価部3で得られた選
択特徴集合の候補の特徴を用いて認識率を測定する。こ
の認識率の測定は、選択特徴集合の候補数だけ行われ
る。(ホ)次に、選択特徴集合決定部5は、認識率計算
部で得られた結果に基づき、選択特徴集合候補の中から
新しい選択特徴集合を決定する。(ヘ)最後に、処理終
了決定部6は、新しい選択特徴集合を用いた場合の認識
結果が所望の値を満たしているか否かを判定する。所望
の値を満たしているならな、処理を終了するが、そうで
なければ処理は選択特徴集合に新しい特徴を選択し直す
ため、(ロ)の第一特徴評価部2に戻る。以下、各手順
(イ)〜(ヘ)について、詳細に説明する。
【0009】(イ)初期特徴計算処理 ここでは、多次元の特徴ベクトルの中から最も識別に有
効な特徴を1つ選択する。このために、多次元特徴ベク
トルの各特徴に対して、従来の方法と同じように相関比
を計算する。相関比は、(f1j(j=1,・・・,
n),n=特徴次元数)、各特徴j毎にカテゴリ間分散
(SBj)と全分散(STj)との比で計算される。 f1j=SBj/STj(0<f1j≦1) ・・・・・・・・・・(1) STj=Swj+SBj ・・・・・・・・・・・・・・・・・・・(2) ここで、Swjはカテゴリ内分散を表わしている。SB
jは、この値が大きければ大きいほど互いに隣接するカ
テゴリが離れていることを意味している。また、Swj
は、この値が小さければ小さいほど各カテゴリ内のパタ
ンが互いにまとまっていることを意味している。従っ
て、ある特徴のカテゴリ間分散SBjが大きく、かつカ
テゴリ内分散Swjが小さいとき、前式(1)(2)よ
りf1jが大きくなり、その特徴はカテゴリ分離能力が
高いと言える。図1の初期特徴計算部1では、この相関
比の値が最も大きい特徴を選択特徴集合Ωの最初の要素
とする。
【0010】(ロ)第一特徴評価処理 選択特徴集合の要素以外の特徴ベクトルの中から選択特
徴集合の要素の候補となる特徴をm個選択し、そのm個
の中からmC2=L個の特徴ペアpfi(i=1・・・
L)を作成する。m個の特徴は、以下の評価関数に基づ
いて計算する。 ここで、nは選択特徴集合Ωの要素以外の特徴数であ
り、epair(i,j)はカテゴリCiがカテゴリC
jに誤ったエラ−パタンの数でepair(i,j)=
0(i=j)である。また、fk(i,j)は、カテゴ
リCiとカテゴリCjとの相関比で、fk(i,j)=
0(i=j)である。第一特徴評価部2では、上式
(3)の値の大きい順にm個を選択する。
【0011】(ハ)第二特徴評価処理 ここでは、選択特徴集合Ωと特徴ペアpfiを併合し
て、その併合した特徴集合の中から以下の評価関数が最
大となる特徴を除去した集合である。 ω1(1−Fi)+ω2(ACC)i (i=1,・・・k) ・・・(4) ここで、ω1,ω2はω1+ω2=1という拘束条件のもと
で可変な重みである。また、(ACC)iは、特徴iと
残りの特徴との平均相関係数である。また、kは選択特
徴集合Ωの要素数+2である。上式(4)で得られた特
徴集合の候補Ψiの要素数は、k−1となる。このよう
にして得られた特徴集合の候補Ψiは、平均相関係数
(ACC)の導入により冗長性の少ない特徴を得ること
ができる。以上の処理を、図1に示す第二特徴評価部3
が実行する。
【0012】(ニ)認識率計算処理 認識率計算部4は、第二特徴評価部3で得られた特徴集
合の候補Ψiを用いて、読取対象のカテゴリに対し認識
率を測定する。なお、上記(ハ)と(ニ)の処理は、特
徴ペアpfiの数だけ(L回)繰り返される。これらの
処理により、L個の特徴集合の候補Ψiが生成され、各
候補を用いたときの認識率が計算される。 (ホ)選択特徴集合決定処理 ここでは、選択特徴集合決定部5が、前記の処理で得ら
れた最も優れた候補が選択され、それを新しい選択特徴
集合Ωとする。この選択特徴集合の要素数は、前の選択
特徴集合の要素数よりも1つ多くなる。 (ヘ)処理終了決定処理 処理終了決定処理部6は、選択特徴集合決定部5で得ら
れた選択特徴集合Ωを用いた場合の認識結果が所望の値
を満たしているならば、処理を終了する。しかし、満た
していなければ、処理は選択特徴集合に新しい要素を追
加するために第一特徴評価部1に戻される。
【0013】図2は、本発明の特徴選択方法を組み込ん
だ文字認識過程の流れ図である。先ず、手書き文字の
『亜』が入力されると、前処理部21では、規定された
文字の大きさに従って正規化し、かつ雑音が除去され
る。その後、特徴抽出部22で非常に多次元の特徴ベク
トルが抽出される。次に、特徴選択部23では、本発明
の処理により得られた特徴のみが選択された後、次の認
識部24に送られる。認識部24では、これらの特徴と
認識辞書を参照することにより、最も確からしい文字
『亜』を認識結果として出力する。
【0014】
【発明の効果】以上説明したように、本発明によれば、
従来の方法よりも冗長性の少ない特徴集合を得ることが
でき、かつ利用する識別関数に適した特徴集合が選択で
きる。
【0015】
【図面の簡単な説明】
【図1】本発明の一実施例を示す特徴選択方法を実行す
るプログラムモジュ−ル列の構成図である。
【図2】本発明の特徴選択方法を用いた文字認識システ
ムの処理流れ図である。
【図3】従来の相関比による特徴選択法の概略構成図で
ある。
【符号の説明】
1 初期特徴選択部 2 第一特徴評価部 3 第二特徴評価部 4 認識率計算部 5 選択特徴集合決定部 6 処理終了決定部 21 前処理部 22 特徴抽出部 23 次元圧縮部 24 認識部 31 相関比計算部 32 特徴選択情報生成部 33 特徴選択部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 パタンを認識するための特徴ベクトルの
    中から認識に有効な特徴のみを選択する特徴選択方法に
    おいて、多次元特徴ベクトルの中から最も識別に有効な
    特徴を1つ選択し、該特徴を選択特徴集合の最初の要素
    とする初期特徴選択過程と、選択特徴集合以外の特徴ベ
    クトルの中から選択特徴集合の候補となる特徴を複数個
    選択する第一の特徴評価過程と、上記選択特徴集合およ
    び該第一の特徴評画過程で得られた特徴をもとにして複
    数個の新しい選択特徴集合の候補を生成する第二の特徴
    評価過程と、該第二の特徴評価過程で得られた複数個の
    新しい特徴集合の候補の特徴を用いて認識率を測定する
    認識率計算過程と、該認識率計算過程で得られた結果を
    もとにして、選択特徴集合候補の中から新しい選択特徴
    集合を決定する選択特徴集合決定過程と、新しい選択特
    徴集合を用いた場合の認識結果が所定の値を満たしてい
    るか否かを判別する処理終了決定過程とを有することを
    特徴とする特徴選択方法。
JP4007240A 1992-01-20 1992-01-20 特徴選択方法 Pending JPH05197813A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4007240A JPH05197813A (ja) 1992-01-20 1992-01-20 特徴選択方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4007240A JPH05197813A (ja) 1992-01-20 1992-01-20 特徴選択方法

Publications (1)

Publication Number Publication Date
JPH05197813A true JPH05197813A (ja) 1993-08-06

Family

ID=11660481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4007240A Pending JPH05197813A (ja) 1992-01-20 1992-01-20 特徴選択方法

Country Status (1)

Country Link
JP (1) JPH05197813A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7796795B2 (en) 2002-11-26 2010-09-14 General Electric Co. System and method for computer aided detection and diagnosis from multiple energy images
JP2012252621A (ja) * 2011-06-06 2012-12-20 Meidensha Corp 画像特徴量抽出装置及びこれを用いた画像処理によるマーカ検出装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7796795B2 (en) 2002-11-26 2010-09-14 General Electric Co. System and method for computer aided detection and diagnosis from multiple energy images
JP2012252621A (ja) * 2011-06-06 2012-12-20 Meidensha Corp 画像特徴量抽出装置及びこれを用いた画像処理によるマーカ検出装置

Similar Documents

Publication Publication Date Title
EP0355748B1 (en) A pattern recognition apparatus and method for doing the same
Zois et al. Offline signature verification and quality characterization using poset-oriented grid features
EP2073147B1 (en) Generic biometric filter
JP4504702B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
US5359671A (en) Character-recognition systems and methods with means to measure endpoint features in character bit-maps
US5909510A (en) Method and apparatus for document classification from degraded images
JP2827994B2 (ja) 指紋特徴抽出装置
JP2001167131A (ja) 文書シグネチュアを使用する文書の自動分類方法
CN111428028A (zh) 基于深度学习的信息分类方法及相关设备
KR19990010210A (ko) 대용량 패턴 정합 장치 및 방법
US11715288B2 (en) Optical character recognition using specialized confidence functions
Nair et al. A life cycle on processing large dataset-LCPL
US6694054B1 (en) Pattern recognition process
CN116467141A (zh) 日志识别模型训练、日志聚类方法和相关系统、设备
CN117349406A (zh) 基于大数据的专利信息检索系统及方法
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
CN117763126A (zh) 知识检索方法、设备、存储介质及装置
JPH05197813A (ja) 特徴選択方法
US5845020A (en) Character recognizing apparatus
CN114385843A (zh) 分类网络构建方法以及图像检索方法
CN111813975A (zh) 一种图像检索方法、装置及电子设备
JP4350228B2 (ja) パターン認識方法および装置
CN110555338A (zh) 对象识别方法和装置、神经网络生成方法和装置
JP2008071214A (ja) 文字認識辞書作成方法及びその装置及び文字認識方法及びその装置及びプログラムを格納した記憶媒体
JP2728117B2 (ja) 文字認識装置