JP2001092924A - パターン認識方法および装置 - Google Patents
パターン認識方法および装置Info
- Publication number
- JP2001092924A JP2001092924A JP27058699A JP27058699A JP2001092924A JP 2001092924 A JP2001092924 A JP 2001092924A JP 27058699 A JP27058699 A JP 27058699A JP 27058699 A JP27058699 A JP 27058699A JP 2001092924 A JP2001092924 A JP 2001092924A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- class
- recognition
- pattern recognition
- recognition target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
ターン認識方法および装置を提供する。 【解決手段】特徴選択部5で入力データの近傍を考慮し
て特徴選択を行い、判定処理部6で特徴選択された空間
にフィッシャーの線形判別法を適用してカテゴリーの決
定を行う。
Description
法および装置に関し、特に、手書き文字等を高い認識率
で認識することのできるパターン認識方法および装置に
関する。
認識装置は、技術の向上とともにその対象が活字文字か
ら手書き文字にまで広がり、需要も増大している。
前処理として2値化と文字の切り出しを行った後、当該
文字の特徴抽出を行う。特徴抽出は、例えば、文字の輪
郭方向に関する特徴量を抽出するもので、図11(a)
に示すように対象となる文字を5×5に分割し、分割し
たそれぞれの領域に対して図11(b)に示すような8
方向の特徴量を抽出する。つまり、ここで抽出した特徴
量は、5×5×8の200次元のベクトルとして表すこ
とができる。なお、この200次元の空間を特徴空間と
呼ぶ。
特徴量に基づいて候補パターンの選出を行う。候補パタ
ーンの選出は、抽出した特徴量を標本辞書を用いて全パ
ターンマッチングを行い、ユークリッド距離の近いもの
を15個とり、これを入力に対する近傍パターンとする
ことにより行う。
リー(クラス、文字の種類)を選択し、これを候補カテ
ゴリーとして、詳細判定を行う。
一郎・上田修功・前田英作・村瀬洋:パターン認識,オ
ーム社,1998参照)により行う。フィッシャーの方
法とは、特徴空間をより次元の小さい部分空間に変換す
る方法の一つであり、特徴空間上のクラス(カテゴリ
ー)のパターンの分布から、このクラスを識別するのに
最適な1次元軸を求める手法である。
パターンを判別する場合、フィッシャー比と呼ばれる
(クラス間分散/クラス内分散)を最大とするような座
標変換を行って最適なY1軸を求め、このY1軸に射影
を行うと(X1、X2は、変換前の軸)、クラスC1、
C2を最適に分離することのできる境界(図中、破線で
示す)を定めることができる。これに対して、フィッシ
ャー比を最大としない座標変換を行った場合には、Y2
軸への射影のようにクラスC1、C2を分離する境界を
定めることはできない。つまり、フィッシャーの方法で
は、異なるクラスのパターンを離し、同一クラスのパタ
ーンが固まって分布するように射影することのできる射
影軸を決定している。
(a)に示す「フ」という文字が入力された場合、図1
3(b)に示す「ヲ」と図13(c)に示す「フ」が候
補パターンとして選出され、詳細判定により図13
(b)に示す「ヲ」と認識されてしまう場合がある。同
様に、図13(d)に示す「ハ」という文字が入力され
た場合、図13(e)に示す「ヘ」と図13(f)に示
す「ハ」が候補パターンとして選出され、詳細判定によ
り図13(e)に示す「ヘ」と認識されてしまう場合が
ある。
類似している場合に起こり得る。例えば、図13(d)
に示した「ハ」の場合、図13(e)に示した「ヘ」と
図13(f)に示した「ハ」のそれぞれと重ね合わせる
と、図14(a)、(b)に示すような結果が得られ
る。この重ね合わせの結果、つまり、距離によるパター
ンマッチングの結果は、図13(e)に示した「ヘ」が
図13(d)に示した「ハ」に最も近いことを示してい
る。このような場合、フィッシャーの方法により詳細判
定を行っても、図15に示したようにクラスAとクラス
Bとを完全に分離することはできず、結果として誤認識
が生じてしまうことになる。
28525号公報に記載されている「文字認識方法」の
ようなものも提案されている。この方法では、文字見本
の原始特徴ベクトルの集合分布が最適となる特徴空間を
求め、特徴抽出対象文字の原始特徴ベクトルをその特徴
空間に投影して二次特徴ベクトルを得ることにより文字
認識を行うものである。
は、文字見本において原始特徴ベクトルの集合分布が最
適となる特徴空間であり、入力データに対してこの特徴
空間が最適であるかどうかは分からない。このため、変
化の小さい活字では高い認識能力を有するが、手書き文
字に対しては、高い認識能力を持つとは限らない。
の文字認識方法では、活字文字に対しては高い認識能力
を有するが、手書き文字に対しては高い認識能力を有す
るとは言い難かった。
も高い認識能力を有するパターン認識方法および装置を
提供することを目的とする。
ため、請求項1の発明は、所定の識別関数を用いて認識
対象の特徴量を評価することにより該識別対象を2つの
クラスのいずれに属するかを識別するパターン認識方法
において、前記認識対象の特徴量に基づいて前記クラス
に属する候補の特徴量の中から注目すべき成分を抽出
し、該抽出した成分に基づいて識別関数を決定し、該決
定した識別関数に基づいて前記認識対象の識別を行うこ
とを特徴とする。
において、前記成分は、前記クラスに属する候補の全体
の特徴量と、前記クラスに属する候補のうち前記認識対
象との距離の近い候補の特徴量とに基づいて抽出される
ことを特徴とする。
において、前記識別関数は、フィッシャーの線形判別法
を適用して決定されることを特徴とする。
において、前記認識対象は、文字であることを特徴とす
る。
を用いて認識対象の特徴量を評価することにより該識別
対象を2つのクラスのいずれに属するかを識別するパタ
ーン認識装置において、前記認識対象の特徴量を抽出す
る特徴量抽出手段と、前記クラスに属する候補の特徴量
を格納する辞書手段と、前記特徴量抽出手段が抽出した
前記認識対象の特徴量に基づいて前記辞書手段に格納さ
れた前記クラスの特徴量から注目すべき成分を選択する
特徴選択手段と、前記特徴選択手段が選択した成分に基
づいて識別関数を決定し、該決定した識別関数に基づい
て前記認識対象の識別を行う識別処理手段とを具備する
ことを特徴とする。
において、前記特徴選択手段は、前記クラスに属する候
補の全体の特徴量と、前記クラスに属する候補のうち前
記認識対象との距離の近い候補の特徴量とに基づいて前
記成分を選択することを特徴とする。
において、前記識別処理手段は、フィッシャーの線形判
別法を適用して前記識別関数を決定することを特徴とす
る。
において、前記認識対象は、文字であることを特徴とす
る。
識方法および装置の一実施例について、添付図面を参照
して詳細に説明する。
の概略構成を示す機能ブロック図である。同図に示すよ
うに、文字認識装置10は、画像入力部1と前処理部
2、特徴抽出部3、候補選出部4、特徴選択部5、判定
処理部6、辞書部7、結果出力部8を具備して構成され
る。
(列)の画像を入力し、前処理部2は、認識の前処理と
して画像入力部1より入力された画像の2値化と文字の
切り出しなどを行う。特徴抽出部3は、前処理部2で前
処理が施された文字画像から特徴ベクトルを生成する。
特徴ベクトルの生成は、従来と同様に行い、例えば、文
字画像を5×5に分割し、分割した各々で8方向の特徴
量を抽出する。候補選出部4は、特徴抽出部3で生成さ
れた特徴ベクトルと辞書部7に格納されている全標本パ
ターンとのユークリッド距離を求め、候補カテゴリー
(クラス)を選出する。特徴選択部5は、特徴抽出部3
が生成した特徴ベクトルと候補選出部4が選出した候補
カテゴリーに基づいて、注目すべき成分を選択し、判定
処理部6は、特徴選択部5が選択した成分を参酌してフ
ィッシャーの方法により識別判定を行う。結果出力部6
は、判定処理部6が識別判定したカテゴリーを認識結果
として出力する。
動作を説明する。図2は、文字認識装置10の動作の流
れを示すフローチャートである。
まず、画像入力部1から認識対象の文字画像を入力し
(ステップ101)、前処理部2が画像入力部1から入
力された文字画像に対する前処理を行う(ステップ10
2)。続いて、特徴抽出部3が前処理が施された文字画
像から特徴の抽出、つまり、特徴ベクトルを生成し(ス
テップ103)、候補選出部4が、特徴ベクトルと辞書
部7に格納されている全標本パターンとのパターンマッ
チング(距離計算)を行い、その結果の上位の所定数
(例えば15個)を近傍パターンとし、この近傍パター
ンに基づいて候補カテゴリーを2つ決定する(ステップ
104)。
処理を行い(ステップ105)、判定処理部6が後述す
る詳細判定処理を行い(ステップ106)、結果出力部
8が認識結果を出力して(ステップ107)、処理を終
了する。
ついて説明する。特徴選択処理は、2つの候補カテゴリ
ーから認識結果としてのカテゴリーを決定する際に、注
目すべき成分を決定する処理である。例えば、図3
(a)に示す代表的な「ユ」と図3(b)に示す代表的
な「コ」を識別する際には、図3(c)に示すように、
文字の左上、右上、右下の順に重点を置くことで、その
識別が容易となる。しかしながら、図3(d)に示すよ
うな「コ」が入力された場合、文字の左上や右上に注目
しても「ユ」との違いは少なく(図3(e)参照)、図
3(f)に示すように文字の右下にのみ注目すれば、
「ユ」との識別が容易となる。
れを説明する。図4は、特徴選択処理の流れを示すフロ
ーチャートである。
してフィッシャーの方法を適用して射影を行う行列Aを
求める(ステップ151)。続いて、式1に示す候補カ
テゴリーの全標本辞書平均と、式2に示す近傍パターン
の平均を求める(ステップ152)。
まるようにする処理を行うが、これは候補カテゴリーの
近傍平均の成分u'i、v'iが0または1であるようなもの
を除く処理であり、具体的には、式3を満たす成分iを
抽出する(ステップ153)。
テップ154)。ここで、局所累積寄与度について説明
する。まず、式4に示すようにi成分の寄与度κiを定
義する。次に、入力データの近傍パターンを考慮する
と、式4から各成分の寄与度は式5に示すように定義で
きる。
ており、αが大きい程近傍情報を重視していることにな
る。
意にm個取り出したものの総和として定義し、Κ
local(m)で表す。
する最大局所累積寄与度Κ* local(m)を用いて最大化す
る成分を選択し(ステップ155)、特徴選択処理を終
了する。
(d)に示した「コ」を入力パターンとした場合に適用
すると、各方向(方向については、図11(b)を参
照)、各成分における寄与度κi localは、図5に示すよ
うになり、文字の下部の値が大きいことがわかる。
(図2のステップ106)について説明する。図6は、
詳細判定処理の流れを示すフローチャートである。
と、特徴選択部5により特徴選択された空間で候補カテ
ゴリーにおける近傍平均、標本辞書平均、クラス内変動
行列を求め(ステップ161)、フィッシャーの線形判
別法を適用して一次元への射影行列Asを得て(ステップ
162)、カテゴリーを決定し(ステップ163)、詳
細判定処理を終了する。
徴選択された特徴ベクトルをxs、候補カテゴリーの全標
本全体の平均において特徴選択されたものをus、vs、近
傍パターンのうち候補カテゴリーであるものの平均にお
いて特徴選択されたものをu' s、v'sとすれば、識別関数
は、式6で表され、その識別規則は式7で表せる。
ンとした場合にステップ162で得られる射影行列Asの
各成分を示したものであり、0となっている成分は、選
択されなかった成分である。この各成分を図8に示す特
徴選択を行わなかった場合の射影行列A(従来と同様の
方法で得たもの)と比較すると、射影行列Asは、文字の
下部の値が大きく、重み付けされていることがわかる。
を行うと、例えば、図9に示すようなデータX1(カテ
ゴリーBに属する)が入力されると、従来の方法で得ら
れる射影軸1へのX1の射影Y1はカテゴリーAに属す
ることになるが(Y1YA1<Y1YB1)、特徴選択
により得られる射影軸2へのX1の射影Y2は、カテゴ
リーBに属することになる(Y2YA2>Y2YB
2)。ただし、同図中の実線の楕円は、各カテゴリー
(A、B)の平均パターンm1、m2から等密度となる線で
あり、破線の楕円は、入力データX1の近傍パターンの
うちカテゴリーAであるものの領域(領域a)と、カテ
ゴリーBであるものの領域(領域b)を示している。
特徴選択を行わなかった場合(従来法)と、特徴選択を
行った場合(本手法)に決定されたカテゴリーの例を示
したもので(候補カテゴリーは、従来法と本手法で同
一)、特徴選択を行うことにより、高い認識能力を有す
るパターン認識を行えることが分かる。
て説明したが、音声認識などの他のパターン認識であっ
ても、フィッシャーの方法を適用するパターン認識であ
れば特徴選択を行って認識率を向上させることができ
る。
ば、入力データの近傍を考慮して特徴選択を行い、特徴
選択された空間でフィッシャーの線形判別法を適用する
ように構成したので、手書き文字などの変化の大きい入
力に対しても高い認識能力を得ることができる。
示す機能ブロック図である。
ャートである。
る。
る。
の図である。
めの図である。
分布を示した図である。
Claims (8)
- 【請求項1】 所定の識別関数を用いて認識対象の特徴
量を評価することにより該識別対象を2つのクラスのい
ずれに属するかを識別するパターン認識方法において、 前記認識対象の特徴量に基づいて前記クラスに属する候
補の特徴量の中から注目すべき成分を抽出し、該抽出し
た成分に基づいて識別関数を決定し、該決定した識別関
数に基づいて前記認識対象の識別を行うことを特徴とす
るパターン認識方法。 - 【請求項2】 前記成分は、 前記クラスに属する候補の全体の特徴量と、前記クラス
に属する候補のうち前記認識対象との距離の近い候補の
特徴量とに基づいて抽出されることを特徴とする請求項
1記載のパターン認識方法。 - 【請求項3】 前記識別関数は、 フィッシャーの線形判別法を適用して決定されることを
特徴とする請求項1記載のパターン認識方法。 - 【請求項4】 前記認識対象は、 文字であることを特徴とする請求項1記載のパターン認
識方法。 - 【請求項5】 所定の識別関数を用いて認識対象の特徴
量を評価することにより該識別対象を2つのクラスのい
ずれに属するかを識別するパターン認識装置において、 前記認識対象の特徴量を抽出する特徴量抽出手段と、 前記クラスに属する候補の特徴量を格納する辞書手段
と、 前記特徴量抽出手段が抽出した前記認識対象の特徴量に
基づいて前記辞書手段に格納された前記クラスの特徴量
から注目すべき成分を選択する特徴選択手段と、 前記特徴選択手段が選択した成分に基づいて識別関数を
決定し、該決定した識別関数に基づいて前記認識対象の
識別を行う識別処理手段とを具備することを特徴とする
パターン認識装置。 - 【請求項6】 前記特徴選択手段は、 前記クラスに属する候補の全体の特徴量と、前記クラス
に属する候補のうち前記認識対象との距離の近い候補の
特徴量とに基づいて前記成分を選択することを特徴とす
る請求項5記載のパターン認識装置。 - 【請求項7】 前記識別処理手段は、 フィッシャーの線形判別法を適用して前記識別関数を決
定することを特徴とする請求項5記載のパターン認識装
置。 - 【請求項8】 前記認識対象は、 文字であることを特徴とする請求項5記載のパターン認
識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27058699A JP4350228B2 (ja) | 1999-09-24 | 1999-09-24 | パターン認識方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27058699A JP4350228B2 (ja) | 1999-09-24 | 1999-09-24 | パターン認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001092924A true JP2001092924A (ja) | 2001-04-06 |
JP4350228B2 JP4350228B2 (ja) | 2009-10-21 |
Family
ID=17488196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27058699A Expired - Fee Related JP4350228B2 (ja) | 1999-09-24 | 1999-09-24 | パターン認識方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4350228B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006251596A (ja) * | 2005-03-14 | 2006-09-21 | Kyoto Institute Of Technology | 視覚障害者支援装置 |
JP2008158776A (ja) * | 2006-12-22 | 2008-07-10 | Canon Inc | 特徴検出方法及び装置、プログラム、記憶媒体 |
JP2019515382A (ja) * | 2016-05-04 | 2019-06-06 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 医療アトラス登録 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102359188B (zh) * | 2011-07-27 | 2014-04-30 | 福州大学 | 钢管混凝土桁式结构内栓钉节点及其施工方法 |
-
1999
- 1999-09-24 JP JP27058699A patent/JP4350228B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006251596A (ja) * | 2005-03-14 | 2006-09-21 | Kyoto Institute Of Technology | 視覚障害者支援装置 |
JP2008158776A (ja) * | 2006-12-22 | 2008-07-10 | Canon Inc | 特徴検出方法及び装置、プログラム、記憶媒体 |
US8072612B2 (en) | 2006-12-22 | 2011-12-06 | Canon Kabushiki Kaisha | Method and apparatus for detecting a feature of an input pattern using a plurality of feature detectors, each of which corresponds to a respective specific variation type and outputs a higher value when variation received by the input pattern roughly matches the respective specific variation type |
JP2019515382A (ja) * | 2016-05-04 | 2019-06-06 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 医療アトラス登録 |
Also Published As
Publication number | Publication date |
---|---|
JP4350228B2 (ja) | 2009-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5067165A (en) | Character recognition method | |
US8345978B2 (en) | Detecting position of word breaks in a textual line image | |
US7233697B2 (en) | Character recognition device and a method therefor | |
Singh et al. | Offline script identification from multilingual indic-script documents: a state-of-the-art | |
Zeki | The segmentation problem in arabic character recognition the state of the art | |
CN112818951A (zh) | 一种票证识别的方法 | |
JP2001175811A (ja) | 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 | |
Batista et al. | Improving performance of HMM-based off-line signature verification systems through a multi-hypothesis approach | |
JP3917349B2 (ja) | 文字認識結果を利用して情報を検索する検索装置および方法 | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
Chandra et al. | Optical character recognition-A review | |
JP2004178569A (ja) | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 | |
Elaiwat | Holistic word descriptor for lexicon reduction in handwritten arabic documents | |
JP2001092924A (ja) | パターン認識方法および装置 | |
Wan et al. | On-line Chinese character recognition system for overlapping samples | |
Oliveira et al. | A synthetic database to assess segmentation algorithms | |
Nguyen-Trong | An End-to-End Method to Extract Information from Vietnamese ID Card Images | |
JP2009259190A (ja) | 文字認識プログラムおよび文字認識装置 | |
JP2004094644A (ja) | 画像処理装置、画像処理方法、記憶媒体及びプログラム | |
Srihari | Recent advances in off-line handwriting recognition at CEDAR | |
JP3209197B2 (ja) | 文字認識装置及び文字認識プログラムを記録した記録媒体 | |
Deepa et al. | Amultiset APPROACH FOR RECOGNITION OF HANDWRITTEN CHARACTERS USING PUZZLE PIECES | |
Gatos et al. | A segmentation-free recognition technique to assist old Greek handwritten manuscript OCR | |
Batista et al. | A Multi-Hypothesis approach for Off-Line signature verification with HMMs | |
Graf et al. | Analysis of complex and noisy check images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090306 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090407 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090721 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090722 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120731 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120731 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130731 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130731 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |