JPH11203413A - 類似カテゴリ識別辞書作成装置および方法 - Google Patents

類似カテゴリ識別辞書作成装置および方法

Info

Publication number
JPH11203413A
JPH11203413A JP10007396A JP739698A JPH11203413A JP H11203413 A JPH11203413 A JP H11203413A JP 10007396 A JP10007396 A JP 10007396A JP 739698 A JP739698 A JP 739698A JP H11203413 A JPH11203413 A JP H11203413A
Authority
JP
Japan
Prior art keywords
pattern
similar
patterns
misrecognition
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10007396A
Other languages
English (en)
Inventor
Masaharu Ozaki
正治 尾崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP10007396A priority Critical patent/JPH11203413A/ja
Publication of JPH11203413A publication Critical patent/JPH11203413A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 速度を低下させることなく識別精度を向上さ
せることができるような類似カテゴリ識別辞書を作成す
ることを目的とする。 【解決手段】 学習サンプル保持手段1に学習サンプル
を保持しておき、それをもとに、誤認可能性算出手段2
がパターンごとにおよび二つのパターンの組み合わせを
仮に統合した場合の組み合わせごとに誤認の可能性の大
きさを示す指標を算出し、誤認減少判定手段3が二つの
パターンの組み合わせに対し、それらを統合する前後の
誤認可能性の各指標を比較して統合した場合の誤認可能
性の大小を判定する。類似パターン統合手段4は最も類
似しているパターンの組み合わせから順に調べて、誤認
可能性が少なくなると判定された組み合わせを統合す
る。類似パターン統合制御手段5は統合後のパターンで
再度指標の算出から始め、これを統合できるパターンの
組み合わせがなくなるまで繰り返す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は類似カテゴリ識別辞
書作成装置および方法に関し、特に画像特徴上、形状が
類似しているパターンをあらかじめまとめて同一のカテ
ゴリとして分類しておき、未知の文字画像から抽出した
特徴量をこれらの類似パターンカテゴリのいずれに属す
るものであるかを精度よく識別するための類似カテゴリ
識別辞書作成装置および方法に関する。
【0002】
【従来の技術】パターン認識は、未知のパターンを標準
的に用意されている参照パターンとの類似度を調べ、最
も類似しているものを選び出すプロセスである。このプ
ロセスは用いる特徴量、識別手法によってさまざまな方
法がある。その中で、多次元の特徴量空間における最短
距離識別は、その計算コストの少なさからさまざまな分
野で用いられている。最も顕著な例としては、文字認識
で実用的に用いられていることであろう。この最短距離
識別は他の識別手法と比較して、実装がしやすく、計算
コストも低いという利点を持つとはいえ、多くの文字種
を持つ日本語文字認識などにおいては一般的に、数百次
元の特徴量ベクトルを求め、3,000文字種以上との
特徴量の照合を行なうため、特徴ベクトルの照合処理に
非常に多大な計算機パワーを必要としていた。これを解
決するため、通常はまず少ない次元数の特徴量を用い
て、総当たりで最短距離識別を実施し(大分類と呼
ぶ)、その類似性の高いものから順にいくつか候補を取
り出し、その絞った候補と高い次元数の特徴量を用いて
詳細識別を実施する(詳細分類と呼ぶ)ということがな
されている。しかしながら、これでも、総字種との距離
計算回数自身が減少しているわけではない。
【0003】この距離計算回数自身を減らすために、類
似した字種をあらかじめカテゴリとしてまとめておき、
識別時には、まず最も類似しているカテゴリを選び、さ
らにそれに属する字種との距離計算を実施するという階
層的な識別手法が提案されている。このことにより、総
当たりに比較して少ない照合回数で識別を実現すること
ができる。たとえば、特開昭63−263590号公報
に開示されている技術では、学習サンプルすべてをクラ
スタリングによって類似した文字カテゴリに階層的に分
類し、それぞれのカテゴリに属する文字の特徴量ベクト
ルの平均を代表ベクトルとして計算しておき、識別の際
には順に階層ごとに最短距離識別を実施し、最終的にど
の文字サンプルに最も類似しているかを判定するもので
ある。この方式では、すべての文字サンプルの特徴量を
保持しておく必要があり、メモリを多く消費してしま
う。
【0004】また、特開平4−337888号公報で
は、識別対象字種を二つの群に分割していくことで階層
的識別辞書を構成し、統計的な判別分析を用いて精度よ
く識別することを行っているが、最短距離識別と比較し
て、処理速度・辞書のサイズは大きいものとなる。文献
(伊藤、遠藤他、「階層的印刷漢字システムにおける字
種を複数クラスタに登録する辞書構成法」、電子通信学
会論文誌D-II, Vol.J78-D-II, No.6, pp.896-905, 19
95年6月)では、各字種ごとにそれに属するサンプル
から代表ベクトルを取り出しておき、その代表ベクトル
のクラスタリングによって類似文字カテゴリを形成し、
階層的な識別辞書を構成している。このような構成をと
った場合、字種のサンプルの分布によっては、必ずしも
すべてのサンプルが対応する類似文字カテゴリの代表ベ
クトルに最短距離にあることは保証されないことがわか
っている。これでは類似文字カテゴリとの識別の際に誤
認が生じ、本来対応すべき字種が得られなくなってしま
う。これを避けるために、誤認が生じるものについては
誤認が生じている複数の類似文字カテゴリに字種を重複
して登録することを行っている。これはパターンに属す
るサンプルの分布をあらかじめ考慮せずに代表ベクトル
のみからクラスタリングを実施したために生じる状況で
あり、文字サンプルの分布が広範囲にわたる場合は、多
くの類似文字カテゴリに重複して登録される場合が生じ
る。その結果として、識別時に照合回数が増加してしま
うことになる。
【0005】
【発明が解決しようとする課題】以上述べたように、類
似したパターンをあらかじめまとめておき、階層的な識
別辞書を構成する場合において、単に代表パターンのみ
を用いてクラスタリングした結果を用いて識別辞書を構
成しているが、このような識別辞書による最短距離識別
で、サンプルの分布によっては誤認が多く生じてしまう
場合が多く存在するという問題があった。また、これを
解決するために最短距離識別以外の手法を用いると速度
が低下するという問題があった。
【0006】本発明はこのような点に鑑みてなされたも
のであり、速度を低下させることなく識別精度を向上さ
せることができるような類似カテゴリ識別辞書を作成す
る類似カテゴリ識別辞書作成装置および方法を提供する
ことを目的とする。
【0007】
【課題を解決するための手段】本発明では上記問題を解
決するために、画像から得られたパターンが特徴量の類
似しているパターンをまとめた類似カテゴリのどのパタ
ーンに類似しているかを識別するときの照合に使用され
る類似カテゴリ識別辞書を作成する類似カテゴリ識別辞
書作成装置において、サンプル画像から特徴量を抽出し
て得られた学習用のサンプルをパターンごとに保持して
おく学習サンプル保持手段と、前記学習サンプル保持手
段に保持されている学習サンプルをもとに、パターンご
とおよび二つのパターンの組み合わせごとに、誤認の可
能性の大きさを示す指標を算出する誤認可能性算出手段
と、前記誤認可能性算出手段によって算出された誤認可
能性の指標について、二つのパターンの組み合わせに対
し、それらを統合する前の誤認可能性の指標と統合した
後の誤認可能性の指標とを比較し、統合した場合の方が
誤認可能性が少なくなるかどうかを判定する誤認減少判
定手段と、各パターンの二つの組み合わせのうち、最も
類似している組み合わせから順に調べて前記誤認減少判
定手段で誤認が少なくなると判定された二つのパターン
の組み合わせを統合する類似パターン統合手段と、前記
二つのパターンの組み合わせを統合した結果にもとづい
て、前記パターンの組み合わせの統合を、統合できる前
記組み合わせがなくなるまで、繰り返すようにする類似
パターン統合制御手段と、を備えていることを特徴とす
る類似カテゴリ識別辞書作成装置が提供される。
【0008】このような類似カテゴリ識別辞書作成装置
によれば、学習サンプル保持手段に保持しておいた学習
サンプルをもとに、まず、誤認可能性算出手段がパター
ンごとに誤認の可能性の大きさを示す指標を算出し、か
つ、二つのパターンの組み合わせを仮に統合した場合の
誤認の可能性の大きさを示す指標を算出する。このよう
にして算出された誤認可能性の指標について、誤認減少
判定手段は二つのパターンの組み合わせに対し、それら
を統合する前および統合した後の誤認可能性の各指標を
比較し、統合した場合に誤認可能性が少なくなるかどう
かを判定する。ここで、類似パターン統合手段は最も類
似しているパターンの組み合わせから順に調べて、誤認
減少判定手段での判定の結果に従って誤認可能性が少な
くなると判定された組み合わせを統合する。類似パター
ン統合制御手段は統合前の二つのパターンを統合後の類
似パターンに置き換え、そのパターンごとに再度指標の
算出、誤認減少の判定、類似パターンの統合の処理を行
い、その処理を統合できるパターンの組み合わせがなく
なるまで、繰り返す。これにより、画像から得られる、
またはそれに類する多次元特徴量を用いてあらかじめ設
定している複数のパターンのいずれに最も類似している
かを調べる識別処理において、計算速度を上げながら識
別精度を向上させることが可能な、類似カテゴリ識別辞
書を作成することができる。
【0009】また、本発明では、画像から得られたパタ
ーンが特徴量の類似しているパターンをまとめた類似カ
テゴリのどのパターンに類似しているかを識別するとき
の照合に使用される類似カテゴリ識別辞書を作成する類
似カテゴリ識別辞書作成方法において、サンプル画像か
ら特徴量を抽出して得られた学習サンプルをパターンご
とに保持し、保持されている前記学習サンプルをもと
に、パターンごとおよび二つのパターンの組み合わせご
とに、誤認の可能性の大きさを示す指標を算出し、二つ
のパターンの各組み合わせについて、それらを統合する
以前の各パターンの誤認可能性の指標と組み合わせを一
つに統合した場合のパターンの誤認可能性の指標とを比
較して統合した場合の方が誤認可能性が少なくなるかど
うかの判定をし、各パターンの二つの組み合わせのう
ち、最も類似している組み合わせから順に調べて誤認が
少なくなると判定された二つのパターンを統合する、こ
とを特徴とする類似カテゴリ識別辞書作成方法が提供さ
れる。
【0010】このような類似カテゴリ識別辞書作成方法
によれば、サンプル画像から特徴量を抽出してパターン
ごとに保持しておいた学習サンプルに対し、パターンご
とおよび二つのパターンの組み合わせごとに、誤認の可
能性の大きさを示す指標を算出する。これにより、二つ
のパターンを統合する前と統合したと仮定した場合との
それぞれの誤認の可能性の大きさを知ることができるの
で、次に、両者の指標の比較から、統合すべきかどうか
を判定する。そして、各パターンの二つの組み合わせの
うち、最も類似している組み合わせから順に、誤認が少
なくなると判定された二つのパターンを統合する。これ
により、最初から誤認が少なくなるように類似したパタ
ーンの統合をしているので、統合した結果、誤認が増え
てしまうようなことはなくなり、精度の高い類似カテゴ
リ識別辞書を作成することができる。
【0011】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は本発明の原理図である。本
発明による類似カテゴリ識別辞書作成装置は、学習サン
プル保持手段1と、誤認可能性算出手段2と、誤認減少
判定手段3と、類似パターン統合手段4と、類似パター
ン統合制御手段5とから構成される。学習サンプル保持
手段1は、サンプル画像から特徴量を抽出して得られた
学習用のサンプルを受けて、その学習サンプルをパター
ンごとに保持する。誤認可能性算出手段2は、学習サン
プル保持手段1に保持されている学習サンプルをもと
に、パターンごとおよび二つのパターンの組み合わせご
とに、誤認の可能性の大きさを示す指標を算出する。こ
の誤認の可能性の大きさを示す指標としては、たとえば
パターンごとにサンプルの分布をもとに得た誤認のサン
プルの数が用いられる。誤認減少判定手段3では、誤認
可能性算出手段2によって算出した誤認可能性の指標に
ついて、二つのパターンの組み合わせに対し、それらを
統合する以前の誤認可能性の指標と、統合した場合の誤
認可能性の指標とを比較し、統合した場合の方が誤認可
能性が少なくなるかどうかを判定する。各パターンの二
つの組み合わせのうち、最も類似している組み合わせか
ら順に調べて誤認減少判定手段3で誤認が少なくなると
判定された場合には、類似パターン統合手段4がその二
つのパターンの組み合わせを統合する。そして、類似パ
ターン統合制御手段5は、二つのパターンの組み合わせ
を統合した結果にもとづいて、再度、パターンの組み合
わせの統合を試み、これ以上統合ができなくなるまで、
統合を繰り返すことによって、類似カテゴリ識別辞書を
構築していく。
【0012】このようにして作成された類似カテゴリ識
別辞書は、たとえばイメージスキャナなどから入力され
た文書画像から、たとえば文字あるいは単語情報を抽出
するために、画像中の文字の領域を、形状が類似してい
る字種をまとめた類似文字カテゴリに識別する処理に使
用される。
【0013】次に、類似カテゴリ識別辞書作成装置を文
字認識用の類似文字カテゴリ識別辞書の作成に適用した
場合を例に説明する。図2は本発明を実施するハードウ
ェア構成を示す図である。本発明を実施する装置は、一
般的なパーソナルコンピュータ10とその周辺機器とか
ら構成されている。パーソナルコンピュータ10は中央
演算装置(CPU)11と、主記憶メモリ12と、周辺
機器コントローラ13とから構成されており、その周辺
機器コントローラ13には、外部記憶装置14、ディス
プレイ15、キーボード16、マウスなどのポインティ
ングデバイス17、画像入力装置であるイメージスキャ
ナ18、およびネットワーク19が接続されている。
【0014】本発明装置の処理はすべてソフトウェアで
構成され、外部記憶装置14に格納されていて、必要に
応じて主記憶メモリ12にロードされ、随時CPUによ
って実行される。
【0015】図3は類似文字カテゴリ識別辞書を作成す
る処理の流れを示すフローチャートである。類似文字カ
テゴリ識別辞書の作成にあたって、まず、イメージスキ
ャナ18の原稿台の上に置かれた原稿を二値画像として
読み取り、二値画像を文字ごとに切り出し、大きさの正
規化などの前処理を施した後、対応する字種とともに外
部記憶装置14に格納するという画像入力処理を行う
(ステップS1)。次に、外部記憶装置14に格納され
た学習用の文字画像それぞれについて、特徴量を多次元
のベクトルで表現し、それを外部記憶装置14に保存す
るという特徴量抽出処理が行われる(ステップS2)。
次に、それぞれの字種の学習サンプルすべての特徴量ベ
クトルと、それらの平均である代表ベクトルをもとに、
誤認が少なくなるよう字種をクラスタリング処理によっ
て類似文字カテゴリを作成する(ステップS3)。以
下、辞書作成処理を処理の流れに沿ってさらに詳細に説
明する。
【0016】図4は画像入力処理の流れを示すフローチ
ャートである。まず、イメージスキャナ18から学習用
の原稿を読み込む(ステップS11)。原稿は文字の書
体、大きさを変化させておくことが幅広いサンプルを入
手するためには望ましい。単純に固定的なしきい値によ
って二値化してもよいし、グレースケールの多値画像と
して取り込み、しきい値処理によって二値化してもよ
い。後者の場合はいくつかの二値化しきい値によって、
つぶれ、かすれのある画像を収集することができるの
で、サンプル数を増やすのには効果的である。本実施の
形態では、しきい値をいくつか変えて異なるサンプル画
像を作成している(ステップS12)。次に、得られた
二値画像から文字ごとに領域を切り出す(ステップS1
3)。切り出された文字画像は、そこから文字を構成し
ないと思われる小さな孤立点ノイズの除去が施され(ス
テップS14)、文字の外接矩形をもとに大きさの正規
化が行われる(ステップS15)。ここでは、1文字を
64×64画素の画像に大きさに正規化するものとす
る。ノイズ除去、大きさの正規化などは、いくつかの公
知の技術があるので、そのうちの適当なものを利用すれ
ばよい。これらの前処理が施された画像はその対応する
字種を与えて、外部記憶装置14に格納される(ステッ
プS16)。なお、ステップS14〜S16は切り出さ
れた文字画像ごとに繰り返され、ステップS13〜S1
6は異なるしきい値ごとに繰り返し処理される。
【0017】次の特徴量抽出の処理は、本実施の形態で
は、次元数の少ないペリフェラル特徴を用いている。こ
のペリフェラル特徴を図5を参照して説明する。図5は
ペリフェラル特徴の説明図である。ペリフェラル特徴
は、外接矩形の各辺から最初に黒画素が現れる所(1次
ペリフェラル)、および一旦白画素になり、再び黒画素
になる所(2次ペリフェラル)までの画素数を特徴量と
するものである。この1次ペリフェラルおよび2次ペリ
フェラルを各辺64画素それぞれについて調べ、8画素
ずつ平均し、それを特徴量ベクトルの各要素とする。し
たがって、各辺8次元で、2次ペリフェラルまでを取る
とすると、合計64次元の特徴量ベクトルが得られる。
この特徴量ベクトルを外部記憶装置14にその字種に対
応させて格納する。この処理によって、準備したすべて
の書体、大きさの学習用の文字画像に対して、特徴量ベ
クトルが計算される。
【0018】この特徴量抽出の処理が終了すれば、次
に、類似文字カテゴリ生成の処理が起動される。類似文
字カテゴリ生成処理は、まず、外部記憶装置14から、
字種ごとに学習サンプルすべてを取り出し、それらの平
均ベクトルを計算し、これを字種の代表ベクトルとす
る。これをすべての字種について求めたならば、それら
をクラスタリング処理する。クラスタリングは文献(Du
da, Hart著”Pattern Classification and Scene Analy
sis ”, Wiley-Interscience社刊)に記載されている方
法を用いる。この方法はまず、初めに階層的クラスタリ
ングを施し、これを最初のクラスタとしてクラスタごと
の中心と各学習サンプルの特徴量ベクトルとの自乗誤差
の総和が最小になるように最適化を行なうものである。
【0019】階層的クラスタリングは、一般には以下の
ようなステップから構成される。 (1)所望のクラスタ数をm、文字種の総数をn、初期
クラスタをC={c1,2,3,...,n}とし、ci
は類似している文字種の代表特徴ベクトルである。初期
値としては、各文字種の代表特徴ベクトルが一つずつ入
れられる。
【0020】(2)もし、現在のクラスタの数がmに等
しければ、その時点のCをクラスタリングの結果として
処理を終わる。そうでない場合は次に進む。 (3)特徴空間におけるクラスタの距離dが最も小さい
二つのクラスタの組を見つけ出し、これを一つのクラス
タに統合し、(2)に戻る。
【0021】これだけでは代表ベクトルを用いているだ
けであるため、文字サンプルの分布を考慮して誤認を少
なくするようする処理を組み込む。この処理を図6を参
照して説明する。
【0022】図6は類似文字カテゴリ生成処理の流れを
示すフローチャートである。まず、文字種の総数をn、
初期クラスタをC={c1,2,3,...,n}とし、
最短距離にあるクラスタの組からいくつのクラスタの組
を調べるかを指定する個数をlとする。初期クラスタに
は、各文字種が1つずつ格納される(ステップS2
1)。次に、すべての学習サンプルについて、クラスタ
の代表ベクトルとの最短距離識別を実施し、誤認してい
るサンプルの数sを得る(ステップS22)。次に、特
徴空間におけるすべての2クラスタの組み合わせについ
て距離dを計算し、小さい順にl個の組を取り出し、変
数Tに格納する(ステップS23)。ここで、変数Tが
空かどうかの判断があり(ステップS24)、変数Tに
クラスタの組みがなければ、この処理は終了し、あれ
ば、変数Tから距離の最も小さいクラスタの組(ci
j )を取り出し、仮にそれを一つのクラスタに統合し
た場合のクラスタの代表ベクトルを計算する(ステップ
S25)。次に、ci ,cj の代表ベクトルを除き、代
わりにステップS25で計算した代表ベクトルを加え
て、すべての字種の学習サンプルについて、改めてクラ
スタの代表ベクトルとの最短距離識別を実施し、誤認し
ているサンプルの数s’を得る(ステップS26)。こ
こで、統合前の誤認サンプルの数sと統合後の誤認サン
プルの数s’とを比較し(ステップS27)、統合後の
誤認サンプルの数s’が統合前の誤認サンプルの数sよ
り減少していれば、誤認が減少する組み合わせとして、
クラスタを統合し、s’をsに代入し、ステップS23
へ戻る(ステップS28)。もし、統合後の誤認サンプ
ルの数s’が統合前の誤認サンプルの数sよりも減少し
ていなければ、変数Tから現在注目しているクラスタの
組(ci ,cj )を取り除き、ステップS24へ戻る
(ステップS29)。ここで、まだ、変数Tの中にクラ
スタの組が存在する場合は、別のクラスタの組を統合し
た場合における誤認のサンプル数の増減を調べることに
なる。
【0023】いくつのクラスタの組を調べるかを指定す
る数lは1以上で任意に与えることができる。この処理
の中でクラスタ間の距離dの計算方法には種々のものが
考えられるが、ここでは重心法と呼ばれる二つのクラス
タの代表ベクトル間の距離をクラスタの距離dとする方
法を用いる。しかし、これに限るものではなく、最大距
離法、最小距離法と呼ばれる、サンプル間の距離の最大
のもの、最小のものをクラスタ間の距離とする方法を用
いても構わない。
【0024】この一連の処理を実行することで、学習サ
ンプルすべてについて順に誤認が少なくなるようにクラ
スタを統合していくことができる。この得られたクラス
タの代表ベクトルは類似文字カテゴリであり、これらと
の最短距離識別では、誤認が少なくなることになる。
【0025】なお、これを実施しても誤認がまったくな
くなるわけでがないので、その場合は1つの字種を複数
の類似文字カテゴリに重複して登録しておくことにな
る。しかし、この場合においても、上記のアルゴリズム
によって誤認が少なくなるよう類似文字カテゴリを構築
しているため、単に代表ベクトルのみでクラスタリング
した結果を用いる場合と比較して、その重複は少なくな
る。したがって、識別時の距離計算回数が少なくなり、
識別処理の高速化を図ることができる。
【0026】このようにして作成された識別辞書を用い
て未知文字を識別するときには、二段階の照合を実施す
る。このときの処理を図7を参照して説明する。図7は
未知文字識別処理の流れを示すフローチャートである。
まず、イメージスキャナから文書画像(二値画像)を入
力する(ステップS31)。次に、入力された画像から
文字ブロックを抽出し、各文字を切り出す(ステップS
32)。文字ブロックの切り出し処理は、文献(秋山、
増田、「周辺分布、線密度、外接矩形特徴を併用した文
書画像の領域分割」電子情報通信学会論文誌 D-II, Vo
l.J69, No.8)などに開示されている周辺分布による領
域分割手法を用いることができる。切り出された文字画
像について、ペリフェラル特徴量ベクトルを計算する
(ステップS33)。この特徴量ベクトルに対して、ま
ず、大分類としてクラスタリングで得られた代表ベクト
ルと最初に照合し、最短距離にあるものを取り出し、そ
のクラスタに属する字種の代表ベクトルを得る(ステッ
プS34)。次に、その字種の代表ベクトルとの照合を
行い、最短距離にあるのものを取り出し(ステップS3
5)、それに対応する文字コードを出力する(ステップ
S36)。以上のステップS33〜S36の処理は、切
り出された文字ごとに順番に文字がなくなるまで繰り返
し実行される。
【0027】以上の実施の形態では、すべての学習サン
プルについて最短距離識別を実施し、誤認が減少するか
どうかを調べると述べたが、この処理はクラスタの組を
調べる毎に実行され、実際には計算量は膨大なものにな
る。この処理の目的は誤認が減少するかどうか調べるこ
とである。言い換えれば、誤認が発生しやすいサンプル
のみを調べればよいことになる。このため、別の実施の
形態として、ある字種ごとの分布を近似し、誤認が発生
しやすいサンプルを自動的に発生させてそれらを学習サ
ンプルとして調べることを考える。
【0028】第2の実施の形態では、サンプル分布の近
似方法として、主成分分析を用いる。主成分分析は、多
次元のサンプルの分布を軸の相関がないように直交変換
し、かつ軸の分散の大きさも同時に得るものである。主
成分分析は、学習サンプルに対して分散・共分散行列を
求め、それに対して固有値、固有ベクトルを求めること
に相当する。この主成分分析を用いた誤認しやすい字種
サンプルの生成について説明する。
【0029】まず、主成分分析をそれぞれの字種につい
て実施し、それぞれの字種の上位l位の主成分に対応す
る固有値、固有ベクトルを保存する。固有値、固有ベク
トルは特徴ベクトルの次元数、または学習サンプルの数
−1の小さいほうだけ得られ、固有ベクトルは固有値の
大きな順に分散が大きな方向を示す。ここでは、次元数
より多くの学習サンプルが得られていると仮定してい
る。lは分散の大きな順に主成分軸をいくつ調べるかを
示す定数で、任意に与えられるが、通常、誤認は分散の
大きい軸上で発生すると考えられるので、l=5くらい
で十分である。
【0030】次に、前処理が終了したならば、各類似文
字カテゴリごとに、特徴量空間内でl個の主成分軸方向
それぞれに中心から最も離れて現れ得る二つのサンプル
端点を計算する。端点ベクトルpは次式で得られる。
【0031】
【数1】
【0032】ただし、mはカテゴリの代表ベクトル、a
は定数、λi 、Φi はi番目の固有値、固有ベクトルで
ある。aは定数で正の実数である。すなわち、この端点
ベクトルpは、主成分軸上での最も代表ベクトルから離
れたサンプルの特徴空間内での位置を意味する。この式
の意味を、図8に模式的に2次元の特徴量空間で示す。
【0033】図8は端点ベクトルの式の特徴量空間での
意味を説明するための図である。図8において、小さな
黒丸は類似文字カテゴリ内のサンプルを表し、その分布
は主成分分析という統計上の処理により楕円になってい
る。この楕円の中心が分布の平均である代表ベクトル
m、長軸上の第1主成分方向に示した矢印が固有ベクト
ルΦ1 、短軸上の第2主成分方向に示した矢印が固有ベ
クトルΦ2 であり、×で示した長軸の両端点が式(1)
で表される端点ベクトルpである。主成分分析で得られ
た主成分軸は、互いに直交しており、かつ共分散がない
ことが知られている。したがって、各主成分軸では、統
計的に独立に扱うことができる。定数aはその主成分軸
の標準偏差の何倍までを分布の範囲とみなすかを示す。
正規分布を仮定した場合、a=3.5とすると、99.
96%の分布がこの中に含まれることになる。
【0034】この端点ベクトルpがl個それぞれの主成
分軸上で求まったならば、これらの端点ベクトルを近似
したサンプルとして採用する。すなわち、l=5の場合
は、10個のサンプルが得られることになる。これらを
その字種の学習サンプルとして、図6に示した類似文字
カテゴリ生成処理にそのまま適用することにより、計算
コストは実際の学習サンプルを用いるよりも小さくかつ
同等の効果を得ることができる。
【0035】さらに別の実施の形態として、得られた端
点ベクトルを単に1つのサンプルとして考えるのではな
く、ある重みを与えることも可能である。つまり、主成
分分析の結果の上位の主成分軸で得られた端点ベクトル
は分散が大きい軸上にあるから、その重みを大きくする
ことによって、上位の主成分軸上で仮定したサンプルの
誤認が少なくなれば、その効果は大きいとするものであ
る。重みはたとえば、主成分軸をl個取るのであれば、
上から順にl,l−1,l−2,...1としてもよい
し、あるいは、l個の主成分軸の分散の和に対する個々
の分散の比としてもよい。ここでは、後者を用いること
とする。この重みを用いた場合のクラスタリングの処理
の例を図9を参照して説明する。
【0036】図9は重みを考慮した類似文字カテゴリ生
成処理の流れを示すフローチャートである。まず、文字
種の総数をn、初期クラスタをC={c1,
2,3,...,n}とし、最短距離にあるクラスタの組
からいくつのクラスタの組を調べるかを指定する個数を
lとする。初期クラスタには、各文字種が1つずつ格納
される(ステップS41)。次に、各字種ごとに主成分
分析を実施し、誤認しやすい学習サンプルを作成し、同
時にサンプルそれぞれに重みを与える(ステップS4
2)。重みとしては、(サンプルに対応する主成分軸の
分散)/(サンプル作成に用いた全主成分軸の分散の
和)が与えられる。次に、ステップS42で作成された
すべて学習サンプルについて、クラスタの代表ベクトル
との最短距離識別を実施し、誤認しているサンプルを得
て、それぞれに付与されている重みの和wを得る(ステ
ップS43)。次に、特徴空間におけるすべての2クラ
スタの組み合わせについて距離dを計算し、小さい順に
l個の組を取り出し、変数Tに格納する(ステップS4
4)。ここで、変数Tが空かどうかの判断があり(ステ
ップS45)、変数Tにクラスタの組みがなければ、こ
の処理は終了し、あれば、変数Tから距離の最も小さい
クラスタの組(ci ,cj )を取り出し、仮にそれを一
つのクラスタに統合した場合のクラスタの代表ベクトル
を計算する(ステップS46)。次に、ci ,cj の代
表ベクトルを除き、代わりにステップS46で計算した
代表ベクトルを加えて、すべての字種の学習サンプルに
ついて、改めてクラスタの代表ベクトルとの最短距離識
別を実施し、誤認しているサンプルの重みの和w’を得
る(ステップS47)。ここで、統合前の誤認サンプル
の重みの和wと統合後の誤認サンプルの重みの和w’と
を比較し(ステップS48)、統合後の誤認サンプルの
重みの和w’が統合前の誤認サンプルの重みの和wより
減少していれば、誤認が減少する組み合わせとして、ク
ラスタを統合し、w’をwに代入し、ステップS44へ
戻る(ステップS49)。もし、統合後の誤認サンプル
の重みの和w’が統合前の誤認サンプルの重みの和wよ
り減少していなければ、変数Tから現在注目しているク
ラスタの組(ci ,cj )を取り除き、ステップS45
へ戻る(ステップS50)。ここで、まだ、変数Tの中
にクラスタの組が存在する場合は、別のクラスタの組を
統合した場合における誤認のサンプルの重みの和の増減
を調べることになる。
【0037】以上のように、本発明では、すべての学習
サンプルを用いることなく、誤認が生じる可能性のある
サンプルを生成し、それをもとに類似文字カテゴリを生
成することによって誤認の少ない識別辞書を少ない計算
コストで構築することができる。
【0038】
【発明の効果】以上説明したように本発明では、識別辞
書構築時に、パターンのサンプルの分布をもとに類似パ
ターンを統合するとき、統合することによって誤認の可
能性が少なくなるかどうかをあらかじめ判定し、誤認が
少なくなる類似パターンについてこれを統合するよう構
成した。このため、実際の未知サンプルを識別する場合
には、単にパターンの代表ベクトルのみのクラスタリン
グによって構築した類似パターン識別辞書と比較して、
より誤認の少ない識別が可能となる。また、どうしても
誤認が避けられない場合において、一つのパターンを複
数の類似カテゴリに登録することになるが、元々誤認が
少なくなるように識別辞書を構成しているため、その重
複の数はより少なくなり、結果として照合回数が少ない
識別辞書が得られる。
【0039】なお、本発明の実施の形態では文字認識の
場合を例にとって説明したが、特にこれに限定されるも
のではなく、特徴量空間で非常に多くのパターンとの最
短距離識別を実施するパターン認識処理に一般について
適用できるものである。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明を実施するハードウェア構成を示す図で
ある。
【図3】類似文字カテゴリ識別辞書を作成する処理の流
れを示すフローチャートである。
【図4】画像入力処理の流れを示すフローチャートであ
る。
【図5】ペリフェラル特徴の説明図である。
【図6】類似文字カテゴリ生成処理の流れを示すフロー
チャートである。
【図7】未知文字識別処理の流れを示すフローチャート
である。
【図8】端点ベクトルの式の特徴量空間での意味を説明
するための図である。
【図9】重みを考慮した類似文字カテゴリ生成処理の流
れを示すフローチャートである。
【符号の説明】
1 学習サンプル保持手段 2 誤認可能性算出手段 3 誤認減少判定手段 4 類似パターン統合手段 5 類似パターン統合制御手段 10 パーソナルコンピュータ 11 中央演算装置(CPU) 12 主記憶メモリ 13 周辺機器コントローラ 14 外部記憶装置 15 ディスプレイ 16 キーボード 17 ポインティングデバイス 18 イメージスキャナ 19 ネットワーク

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 画像から得られたパターンが特徴量の類
    似しているパターンをまとめた類似カテゴリのどのパタ
    ーンに類似しているかを識別するときの照合に使用され
    る類似カテゴリ識別辞書を作成する類似カテゴリ識別辞
    書作成装置において、 サンプル画像から特徴量を抽出して得られた学習用のサ
    ンプルをパターンごとに保持しておく学習サンプル保持
    手段と、 前記学習サンプル保持手段に保持されている学習サンプ
    ルをもとに、パターンごとおよび二つのパターンの組み
    合わせごとに、誤認の可能性の大きさを示す指標を算出
    する誤認可能性算出手段と、 前記誤認可能性算出手段によって算出された誤認可能性
    の指標について、二つのパターンの組み合わせに対し、
    それらを統合する前の誤認可能性の指標と統合した後の
    誤認可能性の指標とを比較し、統合した場合の方が誤認
    可能性が少なくなるかどうかを判定する誤認減少判定手
    段と、 各パターンの二つの組み合わせのうち、最も類似してい
    る組み合わせから順に調べて前記誤認減少判定手段で誤
    認が少なくなると判定された二つのパターンの組み合わ
    せを統合する類似パターン統合手段と、 前記二つのパターンの組み合わせを統合した結果にもと
    づいて、前記パターンの組み合わせの統合を、統合でき
    る前記組み合わせがなくなるまで、繰り返すようにする
    類似パターン統合制御手段と、 を備えていることを特徴とする類似カテゴリ識別辞書作
    成装置。
  2. 【請求項2】 画像から得られたパターンが特徴量の類
    似しているパターンをまとめた類似カテゴリのどのパタ
    ーンに類似しているかを識別するときの照合に使用され
    る類似カテゴリ識別辞書を作成する類似カテゴリ識別辞
    書作成方法において、 サンプル画像から特徴量を抽出して得られた学習サンプ
    ルをパターンごとに保持し、 保持されている前記学習サンプルをもとに、パターンご
    とおよび二つのパターンの組み合わせごとに、誤認の可
    能性の大きさを示す指標を算出し、 二つのパターンの各組み合わせについて、それらを統合
    する以前の各パターンの誤認可能性の指標と組み合わせ
    を一つに統合した場合のパターンの誤認可能性の指標と
    を比較して統合した場合の方が誤認可能性が少なくなる
    かどうかの判定をし、 各パターンの二つの組み合わせのうち、最も類似してい
    る組み合わせから順に調べて誤認が少なくなると判定さ
    れた二つのパターンを統合する、 ことを特徴とする類似カテゴリ識別辞書作成方法。
  3. 【請求項3】 前記二つのパターンの組み合わせを統合
    した結果にもとづいて、前記パターンの組み合わせの統
    合を、統合できる前記組み合わせがなくなるまで、繰り
    返すようにしたことを特徴とする請求項2記載の類似カ
    テゴリ識別辞書作成方法。
  4. 【請求項4】 画像から得られたパターンが特徴量の類
    似しているパターンをまとめた類似カテゴリのどのパタ
    ーンに類似しているかを識別するときの照合に使用され
    る類似カテゴリ識別辞書を作成する類似カテゴリ識別辞
    書作成方法において、 各パターンごとにサンプルの分布を求め、前記分布の端
    点を学習サンプルとすることにより誤認しやすいサンプ
    ルだけを生成し、 サンプル画像から特徴量を抽出して得られた学習サンプ
    ルをパターンごとに保持し、 保持されている前記学習サンプルをもとに、パターンご
    とおよび二つのパターンの組み合わせごとに、誤認の可
    能性の大きさを示す指標を算出し、 二つのパターンの各組み合わせについて、それらを統合
    する以前の各パターンの誤認可能性の指標と組み合わせ
    を一つに統合した場合のパターンの誤認可能性の指標と
    を比較して統合した場合の方が誤認可能性が少なくなる
    かどうかの判定をし、 各パターンの二つの組み合わせのうち、最も類似してい
    る組み合わせから順に調べて誤認が少なくなると判定さ
    れた二つのパターンを統合する、 ことを特徴とする類似カテゴリ識別辞書作成方法。
  5. 【請求項5】 前記二つのパターンの組み合わせを統合
    した結果にもとづいて、前記パターンの組み合わせの統
    合を、統合できる前記組み合わせがなくなるまで、繰り
    返すようにしたことを特徴とする請求項4記載の類似カ
    テゴリ識別辞書作成方法。
  6. 【請求項6】 前記学習サンプルを生成するステップ
    は、各パターンのサンプルの分布に対して主成分分析を
    行い、複数の上位主成分を取り出し、各主成分軸上で、
    その軸に対応する分散に比例する距離だけ、サンプルの
    平均から離れた点を学習サンプルとして採用することを
    特徴とする請求項4記載の類似カテゴリ識別辞書作成方
    法。
  7. 【請求項7】 前記学習サンプルを生成するステップ
    は、各パターンのサンプルの分布に対して主成分分析を
    行い、複数の上位主成分を取り出し、各主成分軸上で、
    その軸に対応する分散に比例する距離だけ、サンプルの
    平均から離れた点を学習サンプルとして採用し、 前記学習サンプルを保持するステップは、それぞれの学
    習サンプルに上位主成分から得られた学習サンプルの方
    により大きい重みを持つよう保持し、 前記誤認の可能性の大きさを示す指標を算出するステッ
    プは、前記学習サンプルの重みに応じて誤認可能性を算
    出する、 ことを特徴とする請求項4記載の類似カテゴリ識別辞書
    作成方法。
JP10007396A 1998-01-19 1998-01-19 類似カテゴリ識別辞書作成装置および方法 Pending JPH11203413A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10007396A JPH11203413A (ja) 1998-01-19 1998-01-19 類似カテゴリ識別辞書作成装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10007396A JPH11203413A (ja) 1998-01-19 1998-01-19 類似カテゴリ識別辞書作成装置および方法

Publications (1)

Publication Number Publication Date
JPH11203413A true JPH11203413A (ja) 1999-07-30

Family

ID=11664752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10007396A Pending JPH11203413A (ja) 1998-01-19 1998-01-19 類似カテゴリ識別辞書作成装置および方法

Country Status (1)

Country Link
JP (1) JPH11203413A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009506464A (ja) * 2005-08-29 2009-02-12 マイクロソフト コーポレーション 筆跡入力のスタイルを意識した使用
JP2009276937A (ja) * 2008-05-13 2009-11-26 Fujitsu Ltd 辞書作成装置、認識装置、認識方法及び認識プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009506464A (ja) * 2005-08-29 2009-02-12 マイクロソフト コーポレーション 筆跡入力のスタイルを意識した使用
JP2009276937A (ja) * 2008-05-13 2009-11-26 Fujitsu Ltd 辞書作成装置、認識装置、認識方法及び認識プログラム
US8379983B2 (en) 2008-05-13 2013-02-19 Fujitsu Limited Dictionary creating apparatus, recognizing apparatus, and recognizing method

Similar Documents

Publication Publication Date Title
EP2808827B1 (en) System and method for OCR output verification
Arica et al. Optical character recognition for cursive handwriting
Srikantan et al. Gradient-based contour encoding for character recognition
US7519201B2 (en) Detecting humans via their pose
EP0790574B1 (en) Character recognition apparatus and method
CN111126482B (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
KR101410489B1 (ko) 얼굴 식별 방법 및 그 장치
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
US20070058856A1 (en) Character recoginition in video data
CN106372624B (zh) 人脸识别方法及系统
JP5207870B2 (ja) 次元削減方法、パターン認識用辞書生成装置、及びパターン認識装置
KR19990010210A (ko) 대용량 패턴 정합 장치 및 방법
Rasool Feature‐Level vs. Score‐Level Fusion in the Human Identification System
WO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および記録媒体
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
JP4802176B2 (ja) パターン認識装置、パターン認識プログラム及びパターン認識方法
WO1996009607A1 (en) Handwritten pattern recognizer
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
Wang et al. A study on the document zone content classification problem
JP2004178569A (ja) データ分類装置、物体認識装置、データ分類方法及び物体認識方法
Ali et al. Different handwritten character recognition methods: a review
JPH11203413A (ja) 類似カテゴリ識別辞書作成装置および方法
CN109241886B (zh) 基于olbp与pca的人脸识别方法和系统
Zhang et al. Character recognition in natural scene images using local description
JP3925011B2 (ja) パターン認識装置及び認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071207

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081207

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20091207

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20091207

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 10

Free format text: PAYMENT UNTIL: 20111207

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121207

Year of fee payment: 11

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 11

Free format text: PAYMENT UNTIL: 20121207

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250