JPH06119497A

JPH06119497A - 文字認識方法

Info

Publication number: JPH06119497A
Application number: JP4263339A
Authority: JP
Inventors: Tamotsu Maeda; 保前田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1992-10-01
Filing date: 1992-10-01
Publication date: 1994-04-28

Abstract

(57)【要約】【目的】高精度かつ高速な文字認識方法を提供する。【構成】１は画像入力部、２は文字切り出し部、３は
特徴抽出部、４は上記特徴データと非漢字辞書領域１０
を照合し文字コードを出力する非漢字認識部、５は非漢
字認識部４による認識結果の信頼度を判定する信頼度判
定部、６は上記特徴データと漢字辞書領域１１を照合し
文字コードを出力する漢字認識部、７は非漢字認識部４
と漢字認識部６の結果を比較して認識文字を判定する認
識文字決定部、８は非漢字認識部４あるいは漢字認識部
７の結果を出力する表示部である。【効果】非漢字辞書領域と照合した時点で認識文字が
正解である可能性が高いときは処理を打ち切り、それ以
外のときは漢字辞書領域との照合を行うため、一般の日
本語文書では認識精度を維持し、かつ処理速度を向上で
きる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字パターンを読み取
って、その文字パターンに対応する文字コードを出力す
る文字認識方法に関するものである。

【０００２】

【従来の技術】日本語で書かれた一般的な文書において
使用される、漢字ののべ文字数と非漢字（平がな、片か
な、英数字、記号など）ののべ文字数を比較すると、ば
らつきはあるもののほぼ同程度である。特に、外来語が
多く使われる雑誌や技術系の文書などでは片仮名が多く
使われるために漢字ののべ文字数はさらに少ない。

【０００３】これにもかかわらず、従来の文字認識装置
では文字パターンから抽出した特徴データを辞書中の全
ての文字カテゴリに対して照合していた。

【０００４】

【発明が解決しようとする課題】上記の従来の方法で
は、どの文字に対しても辞書に登録された全文字カテゴ
リと照合するために多くの処理時間を要するという問題
点を有していた。

【０００５】

【課題を解決するための手段】本発明は、上記問題点を
解決するため、入力文字パターンから抽出した特徴デー
タと辞書内の非漢字カテゴリに対する特徴データとの間
で類似度（あるいは距離、以下では類似度とだけ表記す
る）を計算し、この結果出力された認識文字が正解であ
る可能性が高い場合に処理を打ち切り、それ以外の場合
に漢字カテゴリに対して類似度を計算し、この類似度と
先に非漢字カテゴリから求めた類似度を比較して認識候
補文字を決定する。

【０００６】

【作用】本発明は入力文字の特徴データを辞書内の非漢
字カテゴリに対する特徴データと照合した時点で認識文
字が正解である可能性が高いときは処理を打ち切り、そ
れ以外のときはさらに漢字カテゴリに対する特徴データ
との照合を行いこのときの類似度と非漢字カテゴリとの
照合から求めた類似度に対して認識文字を出力するた
め、一般の日本語文書では従来と同等の認識精度を維持
し、かつ処理速度を向上できる。

【０００７】

【実施例】図１は本発明の一実施例における文字認識方
法を用いた文字認識装置の機能ブロック図を示すもので
ある。図１において１は文書を光電変換して２値化デー
タとしてＲＡＭ（ランダム・アクセス・メモリ）１０１
中の画像領域１０２に記憶させる画像入力部、２は上記
２値化データから文字部分を切り出す文字切り出し部、
３は文字切り出し部２により切り出された文字パターン
から特徴データを抽出する特徴抽出部、４は上記特徴デ
ータと辞書９の非漢字辞書領域１０を照合し文字コード
を出力する非漢字認識部、５は非漢字認識部４による認
識結果の信頼度を判定し信頼度が高ければ処理を打ち切
って結果を表示部８に出力し、それ以外のときは漢字認
識部６に非漢字認識部４の結果を出力する信頼度判定
部、６は上記特徴データと辞書９の漢字辞書領域１１を
照合し文字コードを出力する漢字認識部、７は非漢字認
識部４と漢字認識部６の結果を比較して認識文字を判定
する認識文字決定部、８は非漢字認識部４あるいは漢字
認識部７の結果を出力する表示部である。

【０００８】図２は本実施例の文字認識方法を用いた文
字認識装置の構成を示すブロック図である。ここで１０
０は文書を読み取るイメージスキャナであり、読み取っ
た文書をビットデータにして出力する。１０１はＲＡＭ
であり、イメージスキャナ１００からのビットデータを
記憶する画像領域１０２、画像領域１０２内の画像から
抽出した文字領域の外接長方形の座標を記憶する文字パ
ターン領域１０３、文字パターン領域１０３で示される
画像領域１０２内の文字パターンから抽出した特徴デー
タを記憶する特徴データ領域１０４、特徴データ領域１
０４の内容と漢字辞書領域１０または非漢字辞書領域１
１を照合した文字コードを記憶する文字コード領域１０
５、処理で使用するカウンタ等を記憶する作業領域１０
６を有している。１０８はＲＯＭ（リード・オンリー・
メモリ）であり、漢字カテゴリに対応する辞書を記憶す
る漢字辞書領域１０、漢字以外の文字カテゴリに対応す
る辞書を記憶する非漢字辞書領域１１、及び図３に示す
フローチャートに従った制御プログラムを記憶したプロ
グラム記憶領域１１１を有する。１０７はプログラム記
憶領域１１１に記憶された制御プログラムに従って処理
を行う処理回路である。１１３は命令やデータを入力す
るためのキーボードであり、１１２は文字パターン領域
１０３内の文字パターン領域１０５内の文字コード、ま
たはこれに対応する文字フォントを表示する表示部であ
る。

【０００９】以上のように構成された文字認識装置の認
識文字の修正方法について図３のフローチャートに従っ
て説明する。

【００１０】ステップＳ１で、画像入力部１により読み
込まれた文書画像から切り出された文字パターンから特
徴データを抽出する。ここで使用する特徴データはたと
えば文字の濃淡・輪郭・背景・方向等何でもよい。

【００１１】ステップＳ２で、この特徴データを辞書９
の非漢字辞書領域１０と照合して類似度を計算する。

【００１２】ステップＳ３で、類似度の最大値ρ１、こ
のときの文字カテゴリａ、２番目に大きい類似度ρ２を
求める。以下では、類似度が最大の文字カテゴリを第１
候補文字、２番目に大きい文字カテゴリを第２候補文字
とよぶ。

【００１３】ステップＳ４で、非漢字辞書領域１０によ
る第１候補文字が正しいか否かを判断するために、第１
候補文字の類似度ρ１がしきい値α以上で、かつ第１候
補文字の類似度ρ１と第２候補文字の類似度ρ２の差が
しきい値β以上という条件を満足するかどうかを調べ
る。この条件を満足する場合は非漢字辞書領域１０での
認識により正解文字が得られたと判断して処理を打ち切
りステップＳ９に進む。満足しない場合は漢字辞書領域
１１による認識結果と比較した後で認識文字を判断する
ためにステップＳ５に進む。なお、αとβは不正解文字
がこの条件を満足しないように余裕をみて大きめに決め
ておく方がよい。類似度の差の代わりにρ１とρ２の比
を使ってもよい。しきい値を用いる代わりにρ１とρ２
を入力、第１候補文字の正解／不正解を出力とする関数
ｆ（ρ１−ρ２）を使用してもよい。たとえば、ρ１と
（ρ１−ρ２）の分布は図４のように共に値が小さいほ
ど不正解が多い相関関係がみられるが、正解と不正解の
境界を４次曲線ρ１＝ｇ（ρ１−ρ２）で近似すると、
第１候補文字が正解のときはρ１は曲線の上、不正解の
ときは下にあるから、関数ｆ（ρ１−ρ２）はｇ（ρ１
−ρ２）≦ρ１のときｆ（ρ１−ρ２）＝１（正解）、
ｇ（ρ１−ρ２）＞ρ１のときｆ（ρ１−ρ２）＝０
（不正解）と定義できる。ここで、ｇ（ρ１−ρ２）＝
Ａ＊（ρ１−ρ２）＊＊４＋Ｂ＊（ρ１−ρ２）＊＊３
＋Ｃ＊（ρ１−ρ２）＊＊２＋Ｄ＊（ρ１−ρ２）＋Ｅ
とおき、境界付近のρ１とρ２を５点以上代入すれば定
数Ａ、Ｂ、Ｃ、Ｄ、Ｅを決定できる。関数ｆ（ρ１−ρ
２）は４次曲線以外の曲線・直線あるいは神経回路網等
を使用してもよい。

【００１４】ステップＳ５で、ステップＳ１で求めた特
徴データを辞書９の漢字辞書領域１１と照合して類似度
を計算する。

【００１５】ステップＳ６で、類似度の最大値ξ１、こ
のときの文字カテゴリｂを求める。ステップＳ７で、ξ
１＜ρ１かどうかを判定し、小さいときはステップＳ９
に、それ以外はステップＳ８に進む。この条件は、漢字
辞書領域１１で照合したときの最大類似度ξ１が非漢字
辞書領域１０での最大類似度ρ１より小さければ非漢字
カテゴリが、大きければ漢字カテゴリが正解であるとい
う処理をするためのものである。

【００１６】ステップＳ８では漢字カテゴリである文字
カテゴリｂを出力する。ステップＳ９では非漢字カテゴ
リである文字カテゴリａを出力する。

【００１７】認識対象例題文字列パターン「日本と比べ
ると」を例に、図５を用いて以下その動作を説明する。
まず、画像入力部１および文字切り出し部２で１文字毎
に分離された文字パターンのうち、「日」という文字パ
ターンから特徴抽出部３により特徴データを抽出する。
次に非漢字認識部４により非漢字辞書領域１０との照合
を行い、「Ｂ」という第１候補文字ａとその類似度ρ１
および第２候補文字の類似度ρ２が出力される。しきい
値をα＝８０、β＝１０と設定する。信頼度判定部５に
よると「日」ではρ１＝７５、ρ２＝５０であるからス
テップＳ４の条件を満足しないことがわかる。そこで漢
字認識部により漢字辞書領域１１との照合を行うと、第
１候補文字「日」の類似度ξ１＝９５が得られる。最後
に、認識文字決定部７によりρ１とξ１の大きい方を正
解とすると、「日」が最終的な認識文字として決定され
る。「本」という文字も同様に処理される。

【００１８】文字「と」ではρ１＝９６、ρ２＝７５で
あり、信頼度判定部５によりステップＳ４の条件を満た
すことが分かるので、第１候補文字ａ＝「と」を最終的
な認識文字として出力する。

【００１９】他の文字も同様に処理される。以上のよう
に本実施例によれば、非漢字認識部４、信頼度判定部
５、漢字認識部６および認識文字判定部７を設けること
により、入力文字の特徴データを非漢字辞書領域と照合
した時点で認識文字が正解である可能性が高いときは処
理を打ち切り、可能性が高くないときはさらに漢字辞書
領域との照合を行いこのときの類似度と非漢字辞書領域
から求めた類似度に対して認識文字を出力するため、一
般の日本語文書では認識精度を維持し、かつ処理速度を
向上できる。

【００２０】

【発明の効果】本発明は入力文字の特徴データを非漢字
辞書領域と照合した時点で認識文字が正解である可能性
が高いときは処理を打ち切り、可能性が高くないときは
さらに漢字辞書領域との照合を行いこのときの類似度と
非漢字辞書領域から求めた類似度に対して認識文字を出
力するため、一般の日本語文書では認識精度を維持し、
かつ処理速度を向上できる。

【図面の簡単な説明】

【図１】本発明の一実施例における文字認識方法を用い
た文字認識装置の構成図

【図２】本実施例を用いた文字認識装置のブロック図

【図３】本実施例の処理の流れを説明するフローチャー
ト

【図４】認識文字の類似度の分布を説明するための図

【図５】本実施例による処理の例を示す説明図

【符号の説明】

１画像入力部２文字切り出し部３特徴抽出部４非漢字認識部５信頼度判定部６漢字認識部７認識文字決定部８表示部９辞書１０非漢字領域１１漢字領域

Claims

【特許請求の範囲】

【請求項１】文字パターンから抽出した特徴データと辞
書内に登録したデータとの間で類似度あるいは距離を計
算し、類似度が最大である文字あるいは距離が最小であ
る文字を出力することにより文字を認識する文字認識方
法において、上記特徴データを上記辞書内の漢字以外の文字種に対応
するデータとの間で文字認識を行い第１候補文字の文字
コードと類似度あるいは距離および第２候補文字の類似
度あるいは距離を出力し、第１候補文字の類似度あるいは距離と第２候補文字の類
似度あるいは距離の絶対値、大小関係、相関関係、差あ
るいは比を用いて当該文字コードが正解であるかの判断
を行い、正解であると判断した場合は処理を打ち切り、それ以外
の場合は上記辞書内の漢字に対応するデータとの間で文
字認識を行い第１候補文字の文字コードと類似度あるい
は距離を出力し、類似度と類似度のうち大きい方に対応する文字コードあ
るいは距離と距離のうち小さい方に対応する文字コード
を出力することを特徴とする文字認識方法。