JPH04286087A

JPH04286087A - 文字認識装置

Info

Publication number: JPH04286087A
Application number: JP3051253A
Authority: JP
Inventors: Mitsuru Kubota; 久保田満
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1991-03-15
Filing date: 1991-03-15
Publication date: 1992-10-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、日本語文字等の多くの
文字カテゴリを分類する文字認識装置に関する。

【０００２】

【従来の技術】従来、漢字を含む日本語文字認識装置で
は、入力文字パターンより特徴ベクトルを抽出し、得ら
れた特徴ベクトルとあらかじめ蓄えられている特徴辞書
の各標準文字パターンの特徴ベクトルとの距離を調べ、
最も距離が近い標準文字パターンのカテゴリを認識候補
文字としていた。

【０００３】

【発明が解決しようとする課題】しかし、日本語文字認
識のように多くの文字カテゴリが存在する場合、特徴辞
書の全てカテゴリの標準ベクトルとの距離を調べる方法
では、計算量が増すため、高速な文字認識装置を実現す
ることはできないという問題点がある。これを解決する
ために、各カテゴリの特徴ベクトルを用いて特徴空間上
にクラスタリングし、文字カテゴリを数個のクラスタに
わけて、各クラスタを代表する特徴量との距離を調べ、
最も距離が近いクラスタの文字カテゴリについて詳細な
識別を行なう方法が一般に用いられている。しかし、こ
の場合、クラスタリングに用いる特徴ベクトルは、抽出
した特徴量の全特徴ベクトルを用いて行なっており、次
元数が高次であること、また、文字カテゴリが多いこと
から、最適なクラスタ数の決定及び、類似文字カテゴリ
の決定が容易でないという問題点がある。そこで、本発
明は、このような問題点を解決するもので、その目的と
するところは、効率のよい文字分類方法を用いて、高速
な文字認識装置を提供することである。

【０００４】

【課題を解決するための手段】本発明は、２値化された
文書画像に対して、文字パターンを文字枠により切り取
る文字枠切取り手段と、文字枠切り取り手段により得ら
れた文字パターンから特徴ベクトルを抽出し、あらかじ
め蓄えておいた特徴辞書の各カテゴリの標準ベクトルと
の距離を調べ、距離の大きさにより認識候補文字を決定
する手段からなる文字認識装置において、前記特徴辞書
は、あらかじめ類似文字カテゴリごとに各クラスタにま
とめられており、入力文字パターンの特徴ベクトルと各
クラスタを代表する特徴ベクトルとの距離を調べ、距離
が最も近いクラスタに属するカテゴリと詳細な識別を行
なうことを特徴とする。

【０００５】また、前記類似文字カテゴリごとに各クラ
スタにまとめる方法は、文字を構成する篇及び冠の特徴
を用いて行なうことを特徴とする。

【０００６】

【実施例】（実施例１）以下に、本発明を図面を用いて
詳細に説明する。

【０００７】図１は、本発明の文字認識装置における文
字認識方法を示すブロック図である。２値化された文字
画像に対して、文字枠による切り取り処理１０１を行い
、文字パターンを切り取る。次に、得られた文字パター
ンより特徴量を抽出１０２し、特徴ベクトルを作成する
。次に、入力文字パターンの特徴ベクトルと特徴辞書１
０３中の各クラスタの代表ベクトルとを比較１０４し距
離を調べ、最適なクラスタを選択し、文字を分類する。次に、選択されたクラスタ内の各文字カテゴリに対して
詳細な識別１０５を行い、認識候補文字を選択１０６す
る。

【０００８】次に、本発明における文字の分類方法を説
明する。文字パターンを、特徴空間上に位置づける、す
なわち、クラスタリングを行なう場合、文字パターンの
全特徴空間を用いて行なわれる場合が多い。しかし、日
本語文字のような複雑度の高い文字カテゴリを精度よく
認識するためには、高次元の特徴ベクトルが必要であり
、これら全次元の特徴ベクトルを用いて文字の分類を行
なうことは、初期の類似カテゴリの設定方法及び最適な
クラスタ数を決定する点で困難である。そこで、本発明
では、日本語文字の多くの文字カテゴリは、篇または、
冠により構成されていることに注目し、篇及び冠の部分
特徴ベクトルを用いて文字の分類を行なう。

【０００９】この場合、特徴ベクトルとしては、文字パ
ターンの篇及び冠などの部分パターンの特徴を反映して
いることが条件である。ここでは、文字部の背景部の特
徴を用いて文字の分類を行なう。図２は本発明に用いる
特徴ベクトルの抽出方法を示した図である。文字パター
ン２０１に対して、外接枠の縦及び横をそれぞれｎ分割
し、外接枠の各分割辺から文字部に向かって走査し、文
字部にぶつかるまでの面積を計数しこれを特徴ベクトル
２０２とする。この場合、特に左側分割辺２０３から文
字部に向かって走査した特徴ベクトルは、文字パターン
が篇により構成されているときには、篇の背景部の特徴
を反映していることになる。また、上側分割辺２０４か
ら文字部に向かって走査した特徴ベクトルは、文字パタ
ーンが冠によって構成されている場合、冠の背景部の特
徴を反映していることになる。従って、これらの左側及
び上側から走査したときの特徴ベクトルを用いて文字の
分類を行なう。

【００１０】まず最初に、外接枠の左側からの特徴ベク
トル、つまり篇の特徴ベクトルに注目した文字の分類方
法を「ぎょうにんべん」と「こざとへん」の関係を例に
とって説明する。

【００１１】図３は「ぎょうにんべん」の特徴ベクトル
空間３０１及び「こざとへん」の特徴ベクトル空間３０
２を示した図であり、分割辺をｎ分割して特徴抽出した
場合、ｎ次元の特徴ベクトル空間を形成する。個々の「
ぎょうにんべん」の特徴ベクトル３０３及び「こざとへ
ん」の特徴ベクトル３０４は、それぞれの特徴ベクトル
空間３０１及び３０２の中に存在している。そこで、カ
テゴリの平均ベクトルをカテゴリの代表特徴ベクトルと
して、「ぎょうにんべん」の代表特徴ベクトル３０５ま
たは、「こざとへん」の代表特徴ベクトル３０６と各特
徴ベクトルとのユークリッド距離３０７及び３０８を用
いてカテゴリ間の関係を表わし、これを用いて文字の分
類を行なう。ここで、２つのベクトル間のユークリッド
距離は次のように定義される。

【００１２】ＬＸＹ　　＝　　√［Σ（Ｘｉ−Ｙｉ）２
］ただし、Ｘｉ　はリファレンスの特徴ベクトル、Ｙｉ
　は入力の特徴ベクトルである。

【００１３】図４は、実際に５種類のフォントパターン
を用いて、「ぎょうにんべん」（２６文字／フォント）
の代表ベクトルを中心にユークリッド距離に基づく分散
４０１及び「こざとへん」（３３文字／フォント）との
ユークリッド距離に基づく分散４０２を示したものであ
る。横軸は代表ベクトルとのユークリッド距離、縦軸は
各距離に存在する確率を表わしている。図４からわかる
ように各カテゴリは重なることなく分散しており、しき
い値を設定することにより２つのカテゴリを分類するこ
とができる。

【００１４】次に、この方法を用いて、文字カテゴリ数
を拡張する場合について説明する。上記の例では、２つ
のカテゴリの場合について説明したが、実際には、篇の
カテゴリ数は数１０個存在し、カテゴリ数も多く、カテ
ゴリのとりかたによっては、重なる部分が生じる場合が
ある。図５は「ぎょうにんべん」の分散５０１と「てへ
ん」の分散５０２の様子を示したものであり、２つのカ
テゴリは、距離的にも接近しており、図４における場合
と異なり、しきい値を用いて分類することは困難である
。この場合、「ぎょうにんべん」と「てへん」を同一の
クラスタとして考えることで解決できる。同一クラスタ
であるか否かの判断は、各カテゴリの代表ベクトル間の
距離があるしきい値以内に収まるものを同一のクラスタ
として判断する。例えば、図６のようにカテゴリＡの代
表ベクトル６０１、カテゴリＢの代表ベクトル６０２及
びカテゴリＣの代表ベクトル６０３の３つの代表ベクト
ルがある場合、Ａの代表ベクトルとＢの代表ベクトルと
のユークリッド距離をＬＡＢ６０４、Ｂの代表ベクトル
とＣ代表ベクトルとのユークリッド距離をＬＢＣ６０５
、そしてＣ代表ベクトルとＡの代表ベクトルとのユーク
リッド距離をＬＣＡ６０６として、βをしきい値とする
とき、ＬＡＢ　　＜　　β かつ　　　　　　ＬＢＣ　　＜　　β かつ　　　　　　ＬＣＡ　　＜　　β の条件が成立するときカテゴリＡ、カテゴリＢ及びカテ
ゴリＣを同一のクラスタにまとめるものとする。このよ
うにして得られたクラスタを表１に示す。

【００１５】

【表１】

【００１６】クラスタ１には「きへん」「おんなへん」
「ぎょうにんべん」「けものへん」「てへん」及び「か
ねへん」の６個のカテゴリが含まれている。このクラス
タに含まれる文字数は３９１文字（ＪＩＳ第１水準）で
ある。また、別なクラスタ２には、「こざとへん」「ひ
へん」及び「うおへん」の３個のカテゴリが含まれる。このクラスタに含まれる文字数は７７文字である。図７
はクラスタ１の代表ベクトルを中心としたクラスタ１に
属する各特徴ベクトルとのユークリッド距離に基づく分
散７０１、及びクラスタ２に属する各特徴ベクトルとの
ユークリッド距離に基づく分散７０２を示したものであ
る。

【００１７】このように、類似カテゴリを同一のクラス
タとすることにより、カテゴリ数が増えた場合において
も文字の分類を行なうことができる。また、図７におけ
る場合、近接する類似カテゴリを同一のクラスタとして
まとめ、おおまかな文字の分類をした後、図４のように
同一クラスタ中の類似カテゴリを詳細に分類できるよう
なクラスタを構成してもよい。これにより、さらに候補
文字を絞ることができるため、効率のよい文字認識を行
なうことができる。

【００１８】以上、篇の部分特徴ベクトルを用いたクラ
スタリングの方法について示したが冠の部分特徴ベクト
ルを用いた文字の分類も同様に行なうことができる。こ
れら２種類の分類方法を併用することにより、候補文字
数を絞ることができ、全ての文字カテゴリの特徴辞書と
比較する必要がなくなり、高速な文字認識を行なうこと
ができる。

【００１９】

【発明の効果】本発明によれば、篇及び冠の部分特徴ベ
クトルに注目して、文字の分類を行なうことにより効率
よく文字を分類することができる。これにより、高速な
文字認識装置を提供することができる。

【図面の簡単な説明】

【図１】本発明の文字認識装置における文字の分類方法
を示したブロック図である。

【図２】入力文字パターンより得られる特徴抽出方法を
示した図である。

【図３】「ぎょうにんべん」及び「こざとへん」の特徴
ベクトル空間を示した説明図である。

【図４】「ぎょうにんべん」及び「こざとへん」のユー
クリッド距離に基づく分散を示した図である。

【図５】「ぎょうにんべん」及び「てへん」のユークリ
ッド距離に基づく分散を示した図である。

【図６】カテゴリＡ、カテゴリＢ及びカテゴリＣの各ユ
ークリッド距離を示した図である。

【図７】クラスタ１及びクラスタ２のユークリッド距離
に基づく分散を示した図である。

【符号の説明】

１０１　　文字枠切り取り処理１０２　　特徴抽出１０３　　特徴辞書１０４　　各クラスタ代表ベクトルとの比較１０５　　
詳細識別１０６　　候補文字の選択２０１　　文字パターン２０２　　特徴ベクトル２０３　　左側外接矩形辺２０４　　上側外接矩形辺３０１　　「ぎょうにんべん」特徴ベクトル空間３０２
　　「こざとへん」特徴ベクトル空間３０３　　「ぎょ
うにんべん」特徴ベクトル３０４　　「こざとへん」特
徴ベクトル３０５　　「ぎょうにんべん」平均ベクトル
３０６　　「こざとへん」平均ベクトル３０７　　ユー
クリッド距離３０８　　ユークリッド距離４０１　　「ぎょうにんべん」の分散４０２　　「こざとへん」の分散５０１　　「ぎょうにんべん」の分散５０２　　「てへん」の分散６０１　　カテゴリＡの代表ベクトル６０２　　カテゴリＢの代表ベクトル６０３　　カテゴリＣの代表ベクトル６０４　　カテゴリＡとＢとのユークリッド距離６０５
　　カテゴリＢとＣとのユークリッド距離６０６　　カ
テゴリＣとＡとのユークリッド距離７０１　　クラスタ
１の分散７０２　　クラスタ２の分散

Claims

【特許請求の範囲】

【請求項１】　　２値化された文書画像に対して、文字
パターンを文字枠により切り取る文字枠切取り手段と、
文字枠切り取り手段により得られた文字パターンから特
徴ベクトルを抽出し、あらかじめ蓄えておいた特徴辞書
の各カテゴリの標準ベクトルとの距離を調べ、距離の大
きさにより認識候補文字を決定する手段からなる文字認
識装置において、前記特徴辞書は、あらかじめ類似文字
カテゴリごとに各クラスタにまとめられており、入力文
字パターンの特徴ベクトルと各クラスタを代表する特徴
ベクトルとの距離を調べ、距離が最も近いクラスタに属
するカテゴリと詳細な識別を行なうことを特徴とする文
字認識装置。
【請求項２】　　前記類似文字カテゴリごとに各クラス
タにまとめる方法は、文字を構成する篇及び冠の特徴を
用いて行なうことを特徴とする請求項１記載の文字認識
装置。