JPH04372089A

JPH04372089A - 文字認識方法

Info

Publication number: JPH04372089A
Application number: JP3176253A
Authority: JP
Inventors: Takakuni Minewaki; 隆邦嶺脇
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1991-06-20
Filing date: 1991-06-20
Publication date: 1992-12-25

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、日本語文字読み取り装
置（日本語ＯＣＲ）において、文字認識候補数を絞り込
むことによって後処理を高速化した文字認識方法に関す
る。

【０００２】

【従来の技術】従来から文字認識において、個々の文字
から抽出される特徴を用いて識別を行うと、正解文字を
得ることが難しく、このため文字認識の結果に対して、
言語情報に基づく処理を施し、すなわち前後の文字との
関係あるいは単語、文法等の情報を用いて正解文字を得
る後処理が行われている。

【０００３】

【発明が解決しようとする課題】上記した言語処理によ
って認識結果を修正処理（後処理）する場合、認識結果
の候補文字を組み合わせて、単語辞書と比較・照合する
方法が採られている。このような修正処理方法によると
、候補文字が多いほどその組み合わせの数は膨大なもの
となり、従って単語照合を行うときの処理量が増え、多
大な処理時間を要するという問題があり、また必要なメ
モリが増大するという問題があった。

【０００４】さらに、後処理の有無に係らず、最終的な
認識結果をユーザに提示し、ユーザが修正処理を行う必
要がある。例えば、本出願人が既に提案した方法、すな
わち文字の縦横比を用いて認識結果候補中の類似文字を
識別する方法（特願平２−２１１２０号）、文字の空白
比を用いて識別する方法（特願平１−２５００９１号）
、文字の面積比を用いて識別する方法（特願平１−２８
５６０５号）では、認識結果候補の中から不正解のもの
を削除したり、あるいは候補を絞り込むことなく、確度
の高い順に候補文字を並べ換えて出力しているので、ユ
ーザは提示された多数の候補文字から選択しなければな
らず、選択作業に時間がかかるという問題があった。

【０００５】本発明の目的は、確度の高い候補文字を上
位に並べ換えると共に、誤認識の確度の高い候補文字を
削除し、候補文字数を絞り込むことによって、後処理の
高速化を図った文字認識方法を提供することにある。

【０００６】

【課題を解決するための手段】前記目的を達成するため
に、請求項１記載の発明は、複数の認識結果候補から候
補数を絞り込む文字認識方法において、認識結果候補文
字によって、認識対象文字毎の縦横比が予め設定された
テーブルを参照し、該テーブルから読み出された認識結
果候補文字の縦横比と認識対象文字の縦横比とを比較し
、該比較結果が所定の閾値を越える認識結果候補文字を
、前記複数の候補から削除することを特徴としている。

【０００７】請求項２記載の発明は、前記テーブルには
、認識対象文字毎の標準の縦横比および縦横比の有効範
囲が設定され、認識対象文字の縦横比が、認識結果候補
文字によって前記テーブルから読み出される縦横比の有
効範囲外にあるとき、該候補文字を削除することを特徴
としている。

【０００８】請求項３記載の発明は、前記テーブルには
、認識対象文字毎の標準の縦横比が設定され、該標準の
縦横比に所定の演算を行って前記有効範囲を生成するこ
とを特徴としている。

【０００９】請求項４記載の発明は、削除処理後の複数
の認識結果候補文字に対して、認識対象文字の縦横比と
、認識結果候補文字によって前記テーブルから読み出さ
れた縦横比との差の絶対値を算出し、該値の小さい順に
、前記複数の認識結果候補文字を並べ換えることを特徴
としている。

【００１０】請求項５記載の発明は、複数の認識結果候
補から候補数を絞り込む文字認識方法において、認識結
果候補文字によって、認識対象文字毎の空白比が予め設
定されたテーブルを参照し、該テーブルから読み出され
た認識結果候補文字の空白比と認識対象文字の空白比と
を比較し、該比較結果が所定の閾値を越える認識結果候
補文字を、前記複数の候補から削除することを特徴とし
ている。

【００１１】請求項６記載の発明は、前記テーブルには
、認識対象文字毎の標準の空白比および空白比の有効範
囲が設定され、認識対象文字の空白比が、認識結果候補
文字によって前記テーブルから読み出される空白比の有
効範囲外にあるとき、該候補文字を削除することを特徴
としている。

【００１２】請求項７記載の発明は、前記テーブルには
、認識対象文字毎の標準の空白比が設定され、該標準の
空白比に所定の演算を行って前記有効範囲を生成するこ
とを特徴としている。

【００１３】請求項８記載の発明は、削除処理後の複数
の認識結果候補文字に対して、認識対象文字の空白比と
、認識結果候補文字によって前記テーブルから読み出さ
れた空白比との差の絶対値を算出し、該値の小さい順に
、前記複数の認識結果候補文字を並べ換えることを特徴
としている。

【００１４】請求項９記載の発明は、複数の認識結果候
補から候補数を絞り込む文字認識方法において、認識結
果候補文字によって、認識対象文字毎の面積比が予め設
定されたテーブルを参照し、該テーブルから読み出され
た認識結果候補文字の面積比と認識対象文字の面積比と
を比較し、該比較結果が所定の閾値を越える認識結果候
補文字を、前記複数の候補から削除することを特徴とし
ている。

【００１５】請求項１０記載の発明は、前記テーブルに
は、認識対象文字毎の標準の面積比および面積比の有効
範囲が設定され、認識対象文字の面積比が、認識結果候
補文字によって前記テーブルから読み出される面積比の
有効範囲外にあるとき、該候補文字を削除することを特
徴としている。

【００１６】請求項１１記載の発明は、前記テーブルに
は、認識対象文字毎の標準の面積比が設定され、該標準
の面積比に所定の演算を行って前記有効範囲を生成する
ことを特徴としている。

【００１７】請求項１２記載の発明は、削除処理後の複
数の認識結果候補文字に対して、認識対象文字の面積比
と、認識結果候補文字によって前記テーブルから読み出
された面積比との差の絶対値を算出し、該値の小さい順
に、前記複数の認識結果候補文字を並べ換えることを特
徴としている。

【００１８】

【作用】実施例１では、対象となる原稿の画像をスキャ
ナ等によって読み込み、読み込まれた画像データを画像
メモリに格納し、行・文字切り出し部は、画像メモリ中
の画像データから文字行、文字画像を抽出し、文字画像
メモリへ文字画像データを格納する。行・文字切り出し
部によって切り出された文字位置、文字サイズ等は、切
り出し情報メモリに格納される。文字認識部は、文字画
像メモリ中の文字画像データに対して正規化した後、特
徴抽出を行い、その抽出された特徴量と文字辞書メモリ
内の文字辞書特徴量とを比較することによって、対象文
字の認識結果候補を複数決定し、その結果を認識結果メ
モリへ格納する。類似文字判定部は、認識結果メモリの
内容について、切り出し情報メモリと各対象文字につい
ての縦横比の値が格納されている縦横比テーブルメモリ
を参照することによって、認識結果の修正と認識候補の
絞り込みを行い、その処理結果によって認識結果メモリ
の内容を書き換える。本実施例１では、文字画像の縦横
比を用いることによって候補文字数が絞り込まれる。

【００１９】実施例２、３では、それぞれ空白比テーブ
ルと面積比テーブルを設け、該テーブルを参照すること
によって認識結果候補文字数を絞る。

【００２０】

【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。（実施例１）図１は、本発明の第１の実施例に係るブロ
ック構成図である。図１において、画像入力部１は、ス
キャナ等によって構成され、対象となる原稿の画像を読
み込み、読み込まれた画像データを画像メモリ２に格納
する。行・文字切り出し部３は、画像メモリ２中の画像
データから文字行、文字画像を抽出し、文字画像メモリ
４へ文字画像データを出力して格納する。また、切り出
された文字位置、文字サイズ等の情報は、切り出し情報
メモリ６に格納される。

【００２１】文字認識部５は、文字画像メモリ４中の文
字画像データに対して正規化した後、特徴抽出を行い、
その抽出された特徴量と文字辞書メモリ７内の文字辞書
特徴量とを比較することによって、対象文字の認識結果
候補を複数決定し、その結果を認識結果メモリ８へ出力
して格納する。類似文字判定部９は、認識結果メモリ８
の内容について、切り出し情報メモリ６と縦横比テーブ
ルメモリ１０を参照することによって、認識結果の修正
と認識候補の絞り込みを行い、その処理結果によって認
識結果メモリ８の内容を書き換える。縦横比テーブルメ
モリ１０内には、後述するように各対象文字についての
縦横比の値が格納されている。結果出力部１１は、認識
結果メモリ８の内容をディスプレイ、プリンタ等に出力
する。

【００２２】本実施例では、文字画像の縦横比を用いる
ことによって候補文字数を絞り込むようにしているが、
その判定に際して、類似文字判定部９が参照する切り出
し情報メモリ６と縦横比テーブルメモリ１０の構成につ
いて、以下具体例を用いて説明する。

【００２３】例えば、横書きの文字列「ニューヨーク市
」を認識し、類似文字判定する場合を例にして説明する
と、行・文字切り出し部３は、画像メモリ２の画像デー
タから文字行と文字を切り出し、文字認識部５で認識処
理した結果、図２に示すような認識結果が認識結果メモ
リ８に格納されたとする。図２において、正解文字「ニ
ューヨーク市」は、第１候補として文字列「：１１ヨ・
ク市」が認識結果となり、第２候補として文字列「＝ュ
ーョ−タ布」が認識結果となり、第３候補として文字列
「ニ］・三ー７巾」が認識結果となる。ただし、第４候
補以下は、図から省略している。第１候補では、第１文
字「ニ」を「：」に誤認識し、第２文字「ュ」を「１」
に誤認識し、第３文字「ー」を「１」に誤認識し、第５
文字認「ー」を「・」に誤認識している。

【００２４】このような誤認識の原因としては、文字認
識を行うに際して画像データに対して正規化処理をして
いるので、正規化後の画像の形状が同一になってしまう
ことが挙げられる。図３から図５は、原文字画像を正規
化した後の形状がほぼ同形になる例を幾つか示したもの
である。図３から図５の何れの場合でも、正規化後の画
像についてはほぼ同形となって弁別することが困難にな
る。従って、文字画像情報のみのマッチングによる認識
結果では、正解文字が出力されるとは限らず、認識候補
中に誤認識文字が含まれることになる。

【００２５】これに対処するために、本実施例では、縦
横比テーブルメモリ１０を設け、正規化後の文字画像が
類似することによって誤認識するような文字について、
正規化前の標準的な文字の高さと文字の幅の比（以下、
縦横比）の値と、縦横比の許容範囲値（上限値および下
限値）を、該テーブル１０に格納している。その値は、
例えば、統計的な手法あるいは経験によって、または現
在認識中の対象文書から動的に決定される。

【００２６】本実施例では、縦横比を例えば次のように
定義する。すなわち、縦横比＝文字外接矩形の幅のドット数（文字幅）／文字
外接矩形の高さのドット数（文字高さ）によって算出さ
れる値をパラメータとしてテーブルに記憶すればよい。図６（ａ），（ｂ）は、縦横比テーブルメモリ１０の内
容を示す図で、前述したように、縦横比によって判定す
べき文字群の各文字について、その標準の縦横比の値と
縦横比の許容範囲値が格納されている。ここで、縦横比の許容範囲値とは、標準の縦横比より小
さい値の縦横比許容範囲上限と、標準の縦横比より大き
い値の縦横比許容範囲下限の間の許容範囲にある値をい
う。

【００２７】一方、行・文字切り出し部３は、認識対象
となる文字列「ニューヨーク市」を切り出し、各文字の
縦横比を切り出し情報メモリ６に書き込む。図７は、先
に例示した文字列の場合における、切り出し情報メモリ
６の内容を示す図であり、各文字について、文字の高さ
、文字の幅が記憶され、その高さと幅によって算出され
た縦横比が記憶されている。

【００２８】以上のように、文字認識部５の認識結果が
メモリ８（図２）に記憶され、縦横比テーブルメモリ１
０の内容（図６）が設定され、文字列「ニューヨーク市
」の各文字の縦横比が切り出し情報メモリ６（図７）に
書き込まれた状態において、本発明の類似文字判定部９
における類似文字判定の処理動作を、図８に示す類似文
字判定の処理フローチャートを参照して、以下説明する
。

【００２９】類似文字判定部９は、認識結果メモリ８か
ら先ず先頭文字の第１候補を選択し（ステップ８０１〜
８０４）、該候補文字で縦横比テーブルメモリ１０を参
照する（ステップ８０５）。該候補文字が縦横比テーブ
ルメモリ１０中にあれば、該候補文字は、類似文字の判
定処理が必要な文字であるとし（ステップ８０６）、次
いで、切り出し情報メモリ６に記憶された先頭文字（１
番目の文字）の縦横比と縦横比テーブルメモリ１０中の
第１候補文字の縦横比許容範囲とが比較され、先頭文字
（１番目の文字）の縦横比が、第１候補文字の許容範囲
内にあるか否かが判定される（ステップ８０７）。先頭
文字の縦横比が、第１候補文字の許容範囲内にない場合
は、第１候補文字は無効であるとして、候補から削除さ
れる（ステップ８０８）。

【００３０】先頭文字の縦横比が、第１候補文字の許容
範囲内にある場合は、切り出し情報メモリ６中の先頭文
字の縦横比の値と、縦横比テーブルメモリ１０中の第１
候補文字の標準縦横比の値との差の絶対値を算出して、
その値を候補文字の情報として、認識結果メモリ８に保
存する（ステップ８０９）。

【００３１】ここまでの処理を前述した例で説明すると
、まず、第１文字「ニ」の認識結果の第１候補「：」で
縦横比テーブルメモリ１０を参照し、該テーブルには「
：」があるので、縦横比許容範囲（０．１〜０．５）が
得られる。切り出し情報メモリ６の第１文字の縦横比は
１．１であるので、第１文字の縦横比が第１候補文字の
許容範囲外にあり、従って第１候補「：」は無効となる
。

【００３２】第２候補文字「＝」については、切り出し
情報メモリ６の第１文字の縦横比は１．１で、「＝」の
縦横比許容範囲は１．０〜４．３であるので、許容範囲
の条件を満たし、第２候補文字「＝」は有効となる。そ
して、切り出し情報メモリ６の第１文字の縦横比の値（
１．１）と第２候補文字「＝」の標準縦横比の値（３．
０）との差の絶対値（１．９）を特徴値として認識結果
メモリ８に保存する。第３候補文字「ニ」についても同
様に処理し、縦横比許容範囲（０．９〜１．９）を満た
すので、標準縦横比の値（１．２）との差の絶対値（０
．１）を特徴値として認識結果メモリ８に保存する。図
９は、これらの候補文字の判定結果をまとめて示したも
のである。

【００３３】再び図８のフローチャートに戻り、すべて
の候補文字について処理が終了すると（ステップ８１０
）、１番目の文字について、有効と判定された候補文字
が２個以上あった場合（ステップ８１１）、候補文字を
縦横比差の小さい順にソートし、候補文字を入れ替え、
候補文字が無効と判定されたものは認識結果メモリ８か
ら削除し、下位の候補文字を上位に詰める（ステップ８
１２）。ただし、候補文字であっても、縦横比テーブル
メモリ１０に無い文字は、削除された候補位置につめる
だけで、ソートや入れ替えの対象としない。

【００３４】前述した１番目の文字についてのソート前
の候補文字と、ソート後の候補文字をそれぞれ図１０、
図１１に示す。ソート後には、第１候補として縦横比差
の最も小さな「ニ」が書き込まれ、第２候補として縦横
比差が次に小さい「＝」が書き込まれる。ソート前に第
１候補であった「：」は削除され、第３候補には、第４
候補以降にあった候補文字が書き込まれる。従って、こ
の処理によって、第１候補の誤認識文字「：」が、正解
文字「ニ」に修正されたことになる。

【００３５】以上の処理を全ての文字について行う（ス
テップ８１３）。文字列「ニューヨーク市」についての
ソート前の認識結果メモリ８の内容と、ソート後の認識
結果メモリ８の内容をそれぞれ図１２、図１３に示す。図１３に示す如く、第１候補の文字列「：１１ヨ・ク市
」が、文字列「ニューヨーク市」に変更され、認識結果
文字が正しく修正される。

【００３６】以上説明したように、本実施例１によれば
、正規化後の文字画像が類似することによって発生した
誤認識候補文字について、その文字の正規化前のイメー
ジの縦横比を用いて候補文字の有効性を判定しているの
で、候補文字数を少なくすることができると共に、正し
い文字を上位候補に入れ替えることができる。

【００３７】なお、上記実施例の縦横比テーブルメモリ
には、正規化後の文字画像が類似することによって誤認
識するような文字の縦横比が格納されていたが、これに
限定されるものではなく、例えば、縦横比テーブルメモ
リには、図１４に示すように、認識の対象となる全ての
文字（英字、数字、漢字等）のそれぞれの標準の縦横比
と縦横比の有効範囲値を格納するようにしてもよい。あ
るいは、縦横比テーブルメモリには、図１５に示すよう
に、対象となる文字の標準の縦横比のみを格納するよう
にし、類似文字判定部９において、テーブル参照時に読
みだされる標準の縦横比に、予め定められた第１の定数
を掛けることによって縦横比許容範囲上限値を得るよう
にし、標準の縦横比に、予め定められた第２の定数を掛
けることによって縦横比許容範囲下限値を得るようにし
てもよい。図１６は、第１の定数を０．５とし、第２の
定数を２．０とした場合の縦横比テーブルメモリから得
られる縦横比許容範囲を示したものである。また、図１
５の縦横比テーブルメモリの内容を、認識対象となる全
ての文字に拡張することもできる。

【００３８】また、実施例１の構成に、単語辞書や単語
間の接続情報等が格納されている言語知識辞書メモリと
、言語知識修正部とを付加し、言語知識修正部が、認識
結果メモリの内容について言語知識辞書メモリを参照す
ることによって、認識結果の修正を行うように、構成を
変更することも可能である。あるいは、実施例１の構成
に、認識結果メモリの内容をユーザが修正するためのツ
ールである結果修正エディタを付加し、結果出力部に表
示された認識結果を見ながら、キーボード、マウス等に
よって誤認識文字を候補文字中の正しい文字に入れ替え
るようにしてもよい。さらに、実施例１の構成に、これ
らの言語知識修正部、言語知識辞書メモリ、そして結果
修正エディタを付加して構成することも可能である。

【００３９】（実施例２）図１７は、本発明の第２の実
施例に係るブロック構成図であり、実施例１と相違する
点は、実施例１の縦横比テーブルメモリを空白比テーブ
ルメモリ１２に置き換えた点であり、他の構成およびそ
の機能は実施例１のものと全く同様であるので、その説
明を省略する。

【００４０】本実施例２は、文字画像の空白比を用いる
ことによって候補文字数を絞り込んでいるが、まず、類
似文字判定部９が参照する切り出し情報メモリ６と空白
比テーブルメモリ１２の構成について、以下具体例を用
いて説明する。

【００４１】例えば、横書きの文字列「ちょっと待った
。」を認識し、類似文字判定する場合を例にして説明す
る。行・文字切り出し部３は、画像メモリ２の画像デー
タから文字行と文字を切り出し、文字認識部５で認識処
理した結果、図１８に示すような認識結果が認識結果メ
モリ８に格納されたとする。図１８において、正解文字
「ちょっと待った。」は、第１候補として文字列「ちよ
つと待つたｏ」が認識結果となり、第２候補として文字
列「らょフヒ侍っに０」が認識結果となり、第３候補と
して文字列「古まっど持フ仁。」が認識結果となる。ただし、第４候補以下は、図から省略している。第１候
補では、第２文字「ょ」を「よ」に誤認識し、第３文字
「っ」を「つ」に誤認識し、第４文字「っ」を「つ」に
誤認識し、第８文字認「。」を「ｏ」にそれぞれ誤認識
している。

【００４２】このような誤認識の原因としては、実施例
１と同様に、文字認識を行うに際して画像データに対し
て正規化処理をしているので、正規化後の画像の形状が
同一になってしまうことが挙げられる。図１９から図２
１は、原文字画像を正規化した後の形状がほぼ同形にな
る例を幾つか示したものである。図１９から図２１の何
れの場合でも、正規化後の画像についてはほぼ同形とな
って弁別することが困難になる。従って、実施例１と同
じく、文字画像情報のみのマッチングによる認識結果で
は、正解文字が出力されるとは限らず、認識候補中に誤
認識文字が含まれることになる。

【００４３】これに対処するために、本実施例２では、
空白比テーブルメモリ１２を設け、正規化後の文字画像
が類似することによって誤認識するような文字について
、正規化前の標準的な空白比の値と、空白比の許容範囲
値（上限値および下限値）を、該テーブル１２に格納し
ている。

【００４４】本実施例では、空白比を例えば、横書きの
場合、基準の行高さに対する、対象文字上端から行の上
基準線間までの距離（空白距離）の比とする。この決定
方法は、一意なものではなく、例えば次のようにして決
定することもできる。すなわち、基準の行高さとしては
、■；対象とする行の外接矩形の高さとする、■；対象
とする行内の文字矩形の高さの最大値とする、■；対象
とする行内の文字矩形列に対して、スキューを考慮して
設定された行の上基準線と行の下基準線の間隔の最大値
とする、■；対象とする行内の文字矩形列に対して、ス
キューを考慮して設定された行の上基準線と行の下基準
線の間隔の平均値とする等である。

【００４５】また、行の上基準線としては、ａ；対象と
する行の外接矩形の上辺とする、ｂ；対象とする行内の
文字矩形列に対して、スキューを考慮して文字矩形列の
上辺に接するように設定された直線とする等である。

【００４６】このように定義された基準の行高さと行の
上基準線に対して、次式によって空白比が算出される。空白比＝（空白距離／基準の行高さ）×定数

【００４７
】以下の説明では、基準の行高さとして■の方法によっ
て決定され、行の上基準線としてａの方法によって決定
され、定数が１であるとして説明する。なお、テーブル
に格納されている空白比の値は、例えば、予め測定され
た統計的な手法によってあるいは経験値によって、また
は現在認識中の対象文書から動的に決定される。

【００４８】図２２は、空白比テーブルメモリ１２の内
容を示す図で、前述したように、空白比によって判定す
べき文字群の各文字について、その標準の空白比の値と
空白比の許容範囲値が格納されている。ここで、空白比
の許容範囲値とは、標準の空白比より大きい値の空白比
許容範囲上限と、標準の空白比より小さい値の空白比許
容範囲下限の間の許容範囲にある値をいう。

【００４９】これに対して、行・文字切り出し部３は、
認識対象となる文字列を切り出し、各文字の空白比を切
り出し情報メモリ６に書き込む。図２３は、先に例示し
た文字列の場合における、切り出し情報メモリ６の内容
を示す図であり、各文字について、その行の基準の行高
さと、各文字の空白距離が記憶され、その高さと距離に
よって算出された空白比が記憶されている。

【００５０】以上のように、文字認識部５の認識結果が
メモリ８（図１８）に記憶され、空白比テーブルメモリ
１２の内容（図２２）が設定され、文字列「ちょっと待
った。」の各文字の空白比が切り出し情報メモリ６（図
２３）に書き込まれた状態において、本実施例２の類似
文字判定部９における類似文字判定の処理動作を、図２
４に示す類似文字判定の処理フローチャートを参照して
、以下説明する。

【００５１】類似文字判定部９は、認識結果メモリ８か
ら先ず先頭文字の第１候補を選択し（ステップ２４０１
〜２４０４）、該候補文字で空白比テーブルメモリ１２
を参照する（ステップ２４０５）。該候補文字が空白比
テーブルメモリ１２中にあれば、該候補文字は、類似文
字の判定処理が必要な文字であるとし（ステップ２４０
６）、次いで、切り出し情報メモリ６に記憶された先頭
文字（１番目の文字）の空白比と空白比テーブルメモリ
１２中の第１候補文字の空白比許容範囲とが比較され、
先頭文字（１番目の文字）の空白比が、第１候補文字の
許容範囲内にあるか否かが判定される（ステップ２４０
７）。先頭文字の空白比が、第１候補文字の許容範囲内
にない場合は、第１候補文字は無効であるとして、候補
から削除される（ステップ２４０８）。

【００５２】先頭文字の空白比が、第１候補文字の許容
範囲内にある場合は、切り出し情報メモリ６中の先頭文
字の空白比の値と、空白比テーブルメモリ１２中の第１
候補文字の標準空白比の値との差の絶対値を算出して、
その値を候補文字の情報として、認識結果メモリ８に保
存する（ステップ２４０９）。

【００５３】ここまでの処理を前述した例で説明すると
、まず、第２文字「ょ」の認識結果の第１候補「よ」で
空白比テーブルメモリ１２を参照し、該テーブルには「
よ」があるので、空白比許容範囲（０．０〜０．３）が
得られる。切り出し情報メモリ６の第２文字の空白比は
０．４であるので、第２文字の空白比が第１候補文字の
許容範囲外にあり、従って第１候補「よ」は無効となる
。

【００５４】第２候補文字「ょ」については、切り出し
情報メモリ６の第２文字の空白比は０．４で、「ょ」の
空白比許容範囲は０．２〜０．６であるので、許容範囲
の条件を満たし、第２候補文字「ょ」は有効となる。そ
して、切り出し情報メモリ６の第２文字の空白比の値（
０．４）と第２候補文字「ょ」の標準空白比の値（０．
５）との差の絶対値（０．１）を特徴値として認識結果
メモリ８に保存する。

【００５５】続いて、第３候補文字「ま」に処理が移る
が、空白比テーブルメモリ１２には文字「ま」がないの
で、第３文字に処理が進む。従って、第２文字について
は、有効な空白比差を持つ候補文字が１個となり、無効
となった第１候補の「よ」を削除し、下位候補を上位に
つめることによって、第２文字の処理が終了する。図２
５は、第２文字の候補文字の判定結果をまとめて示した
ものである。また、図２６は、第２文字について削除お
よび書き換え処理前の認識結果メモリ８の内容の一部を
示し、図２７は、第２文字について削除および書き換え
処理後の認識結果メモリ８の内容の一部を示す。

【００５６】同様にして、第３文字「っ」について処理
する。この場合、第１候補の「つ」と第３候補の「っ」
が有効となり、それぞれ前述した手順によって、空白比
差０．３と０．１が得られる。図２８は、第３文字につ
いての候補文字の判定結果をまとめて示したものである
。

【００５７】第３文字のすべての候補文字について処理
が終了すると（ステップ２４１０）、有効と判定された
候補文字が２個以上あった場合（ステップ２４１１）、
候補文字を空白比差の小さい順にソートし、候補文字を
入れ替え、候補文字が無効と判定されたものは認識結果
メモリ８から削除し、下位の候補文字を上位に詰める（
ステップ２４１２）。ただし、候補文字であっても、空
白比テーブルメモリ１２に無い文字（第２候補の「フ」
）は、削除された候補位置につめるだけで、ソートや入
れ替えの対象としない。

【００５８】第３文字についてのソート前の候補文字と
、ソート後の候補文字をそれぞれ図２９、図３０に示す
。ソート後には、第１候補として空白比差の最も小さな
「っ」が書き込まれ、第２候補は変更されず、第３候補
として空白比差が２番目に小さい「つ」が書き込まれる
。

【００５９】以上の処理を全ての文字について行う（ス
テップ２４１３）。文字列「ちょっと待った。」につい
てのソート前の認識結果メモリ８の内容と、ソート後の
認識結果メモリ８の内容をそれぞれ図３１、図３２に示
す。図３２に示す如く、第１候補の文字列「ちよつと待
つたｏ」が、文字列「ちょっと待った。」に変更され、
認識結果文字が正しく修正される。

【００６０】以上説明したように、本実施例２によれば
、正規化後の文字画像が類似することによって発生した
誤認識候補文字について、その文字の正規化前の空白比
を用いて候補文字の有効性を判定しているので、候補文
字数を少なくすることができると共に、正しい文字を上
位候補に入れ替えることができる。

【００６１】なお、上記実施例の空白比テーブルメモリ
には、正規化後の文字画像が類似することによって誤認
識するような文字の空白比が格納されていたが、これに
限定されるものではなく、例えば、空白比テーブルメモ
リには、図３３に示すように、認識の対象となる全ての
文字（英字、数字、漢字等）のそれぞれの標準の空白比
と空白比の有効範囲値を格納するようにしてもよい。あ
るいは、空白比テーブルメモリには、図３４に示すよう
に、対象となる文字の標準の空白比のみを格納するよう
にし、類似文字判定部９において、テーブル参照時に読
みだされる標準の空白比に、予め定められた第１の定数
を掛けることによって空白比許容範囲上限値を得るよう
にし、標準の空白比に、予め定められた第２の定数を掛
けることによって空白比許容範囲下限値を得るようにし
てもよい。図３５は、第１の定数を１．５とし、第２の
定数を０．５とした場合の空白比テーブルメモリから得
られる空白比許容範囲を示したものである。ただし、空
白比許容範囲上限値の計算値が１．０を越える場合は、
許容範囲上限値を１．０とし、小数第３位を四捨五入す
る。

【００６２】また、図３４の空白比テーブルメモリの内
容を、認識対象となる全ての文字に拡張することもでき
る。さらに、空白比テーブルメモリには、図３６に示す
ように、対象となる文字の標準の空白比のみを格納する
ようにし、類似文字判定部９において、テーブル参照時
に読みだされる標準の空白比に、予め定められた第１の
定数を足すことによって空白比許容範囲上限値を得るよ
うにし、標準の空白比から、予め定められた第２の定数
を引くことによって空白比許容範囲下限値を得るように
してもよい。図３７は、第１の定数を０．２とし、第２
の定数を０．２とした場合の空白比テーブルメモリから
得られる空白比許容範囲を示したものである。ただし、
空白比許容範囲上限値の計算値が１．０を越える場合は
、許容範囲上限値を１．０とし、空白比許容範囲下限値
の計算値が０．０未満の値になる場合は、許容範囲下限
値を０．０とする。この図３６に示す空白比テーブルメ
モリの内容を、認識対象となる全ての文字に拡張するこ
ともできる。

【００６３】上記実施例２およびその変形例は、縦書き
の文書にも適用することができる。図３８に示すように
縦書きの場合、空白比は、基準の行幅に対する、対象文
字左端から行の左基準線間での距離（空白距離）の比で
定義され、算出式は、空白比＝（空白距離／基準の行幅
）×定数、である。

【００６４】また、実施例１と同様に、実施例２の構成
に、単語辞書や単語間の接続情報等が格納されている言
語知識辞書メモリと、言語知識修正部とを付加し、言語
知識修正部が、認識結果メモリの内容について言語知識
辞書メモリを参照することによって、認識結果の修正を
行うように、構成を変更することも可能であり、あるい
は、実施例２の構成に、認識結果メモリの内容をユーザ
が修正するためのツールである結果修正エディタを付加
し、結果出力部に表示された認識結果を見ながら、キー
ボード、マウス等によって誤認識文字を候補文字中の正
しい文字に入れ替えるようにしてもよい。さらに、実施
例２の構成に、これらの言語知識修正部、言語知識辞書
メモリ、そして結果修正エディタを付加して構成するこ
とも可能である。

【００６５】（実施例３）図３９は、本発明の第３の実
施例に係るブロック構成図であり、実施例１、２と相違
する点は、実施例１、２の縦横比テーブルメモリ、空白
比テーブルメモリを面積比テーブル１３に置き換えた点
であり、他の構成およびその機能は実施例１、２のもの
と全く同様であるので、その説明を省略する。

【００６６】本実施例３は、文字画像の面積比を用いる
ことによって候補文字数を絞り込んでいるが、まず、類
似文字判定部９が参照する切り出し情報メモリ６と面積
比テーブルメモリ１３の構成について、以下具体例を用
いて説明する。

【００６７】実施例２で用いた横書きの文字列「ちょっ
と待った。」を認識し、類似文字判定する場合を例にし
て説明する。行・文字切り出し部３は、画像メモリ２の
画像データから文字行と文字を切り出し、文字認識部５
で認識処理した結果、図１８に示すような認識結果が認
識結果メモリ８に格納される。前述したように、図１８
において、正解文字「ちょっと待った。」は、第１候補
として文字列「ちよつと待つたｏ」が認識結果となる。

【００６８】誤認識の原因は、実施例１、２で説明した
如く、正規化後の画像の形状が同一になることが挙げら
れ、このため、正規化後の画像についてはほぼ同形とな
って弁別することが困難になり、認識候補中に誤認識文
字が含まれることになる。

【００６９】このために、本実施例３では、面積比テー
ブルメモリ１３を設け、正規化後の文字画像が類似する
ことによって誤認識するような文字について、正規化前
の標準的な面積比の値と、面積比の許容範囲値（上限値
および下限値）を、該テーブル１３に格納している。

【００７０】本実施例では、面積比を例えば、基準の文
字面積に対する、対象文字の面積比とする。この決定方
法は、一意なものではなく、例えば次のようにして決定
することもできる。すなわち、基準の文字面積としては
、■；対象とする行内の文字矩形面積の内の最大の面積
値とする、■；対象とする行内の文字矩形の高さの最大
値と幅の最大値の積をとった値とする、■；対象とする
行矩形の高さを２乗した（行高さ×行高さ）値とする、
■；対象とする行内の文字の内、全角の漢字とみなされ
る文字矩形面積の内の最大の面積値とする、■；対象と
する行内の文字の内、全角の漢字とみなされる文字矩形
面積の平均値とする、■；対象とする文書の文字の内、
全角の漢字とみなされる文字矩形面積の平均値とする等
である。

【００７１】また、対象文字の面積としては、ａ；対象
とする文字の外接矩形の面積とする等である。このよう
に定義された基準の文字面積と対象文字の面積に対して
、次式によって面積比が算出される。面積比＝（対象文字の面積／基準の文字面積）×定数

【
００７２】以下の説明では、基準の行高さとして■の方
法によって決定され、行の上基準線としてａの方法によ
って決定され、定数が１であるとして説明する。なお、
テーブルに格納されている面積の値は、例えば、予め測
定された統計的な手法によってあるいは経験値によって
、または現在認識中の対象文書から動的に決定される。

【００７３】図４０は、面積比テーブルメモリ１３の内
容を示す図で、前述したように、面積比によって判定す
べき文字群の各文字について、その標準の面積比の値と
面積比の許容範囲値が格納されている。ここで、面積比
の許容範囲値とは、標準の面積比より大きい値の面積比
許容範囲上限と、標準の面積比より小さい値の面積比許
容範囲下限の間の許容範囲にある値をいう。

【００７４】これに対して、行・文字切り出し部３は、
認識対象となる文字列を切り出し、各文字の面積比を切
り出し情報メモリ６に書き込む。図４１は、先に例示し
た文字列の場合における、切り出し情報メモリ６の内容
を示す図であり、各文字について、その文字高さと、文
字幅が記憶され、その高さと幅によって算出された面積
比が記憶されている。

【００７５】以上のように、文字認識部５の認識結果が
メモリ８（図１８）に記憶され、面積比テーブルメモリ
１３の内容（図４０）が設定され、文字列「ちょっと待
った。」の各文字の面積比が切り出し情報メモリ６（図
４１）に書き込まれた状態において、本実施例３の類似
文字判定部９における類似文字判定の処理動作を、図４
２に示す類似文字判定の処理フローチャートを参照して
、以下説明する。

【００７６】類似文字判定部９は、認識結果メモリ８か
ら先ず先頭文字の第１候補を選択し（ステップ４２０１
〜４２０４）、該候補文字で面積比テーブルメモリ１３
を参照する（ステップ４２０５）。該候補文字が面積比
テーブルメモリ１３中にあれば、該候補文字は、類似文
字の判定処理が必要な文字であるとし（ステップ４２０
６）、次いで、切り出し情報メモリ６に記憶された先頭
文字（１番目の文字）の面積比と面積比テーブルメモリ
１３中の第１候補文字の面積比許容範囲とが比較され、
先頭文字（１番目の文字）の面積比が、第１候補文字の
許容範囲内にあるか否かが判定される（ステップ４２０
７）。先頭文字の面積比が、第１候補文字の許容範囲内
にない場合は、第１候補文字は無効であるとして、候補
から削除される（ステップ４２０８）。

【００７７】先頭文字の面積比が、第１候補文字の許容
範囲内にある場合は、切り出し情報メモリ６中の先頭文
字の面積比の値と、面積比テーブルメモリ１３中の第１
候補文字の標準面積比の値との差の絶対値を算出して、
その値を候補文字の情報として、認識結果メモリ８に保
存する（ステップ４２０９）。

【００７８】ここまでの処理を前述した例で説明すると
、まず、第２文字「ょ」の認識結果の第１候補「よ」で
面積比テーブルメモリ１３を参照し、該テーブルには「
よ」があるので、面積比許容範囲（０．７０〜１．００
）が得られる。切り出し情報メモリ６の第２文字の面積
比は０．３８であるので、第２文字の面積比が第１候補
文字の許容範囲外にあり、従って第１候補「よ」は無効
となる。

【００７９】第２候補文字「ょ」については、切り出し
情報メモリ６の第２文字の面積比は０．３８で、「ょ」
の面積比許容範囲は０．３０〜０．７０であるので、許
容範囲の条件を満たし、第２候補文字「ょ」は有効とな
る。そして、切り出し情報メモリ６の第２文字の面積比
の値（０．３８）と第２候補文字「ょ」の標準面積比の
値（０．４５）との差の絶対値（０．０７）を特徴値と
して認識結果メモリ８に保存する。

【００８０】続いて、第３候補文字「ま」に処理が移る
が、面積比テーブルメモリ１３には文字「ま」がないの
で、第３文字に処理が進む。従って、第２文字について
は、有効な面積比差を持つ候補文字が１個となり、無効
となった第１候補の「よ」を削除し、下位候補を上位に
つめることによって、第２文字の処理が終了する。図４
３は、第２文字の候補文字の判定結果をまとめて示した
ものである。また、図４４は、第２文字について削除お
よび書き換え処理前の認識結果メモリ８の内容の一部を
示し、図４５は、第２文字について削除および書き換え
処理後の認識結果メモリ８の内容の一部を示す。

【００８１】同様にして、第３文字「っ」について処理
する。この場合、第１候補の「つ」と第３候補の「っ」
が有効となり、それぞれ前述した手順によって、空白比
差０．４０と０．０５が得られる。図４６は、第３文字
についての候補文字の判定結果をまとめて示したもので
ある。

【００８２】第３文字のすべての候補文字について処理
が終了すると（ステップ４２１０）、有効と判定された
候補文字が２個以上あった場合（ステップ４２１１）、
候補文字を面積比差の小さい順にソートし、候補文字を
入れ替え、候補文字が無効と判定されたものは認識結果
メモリ８から削除し、下位の候補文字を上位に詰める（
ステップ４２１２）。ただし、候補文字であっても、面
積比テーブルメモリ１３に無い文字（第２候補の「フ」
）は、削除された候補位置につめるだけで、ソートや入
れ替えの対象としない。

【００８３】第３文字についてのソート前の候補文字と
、ソート後の候補文字をそれぞれ図４７、図４８に示す
。ソート後には、第１候補として面積比差の最も小さな
「っ」が書き込まれ、第２候補は変更されず、第３候補
として面積比差が２番目に小さい「つ」が書き込まれる
。

【００８４】以上の処理を全ての文字について行う（ス
テップ４２１３）。文字列「ちょっと待った。」につい
てのソート前の認識結果メモリ８の内容と、ソート後の
認識結果メモリ８の内容をそれぞれ図４９、図５０に示
す。図５０に示す如く、第１候補の文字列「ちよつと待
つたｏ」が、文字列「ちょっと待った。」に変更され、
認識結果文字が正しく修正される。

【００８５】以上説明したように、本実施例３によれば
、正規化後の文字画像が類似することによって発生した
誤認識候補文字について、その文字の正規化前の面積比
を用いて候補文字の有効性を判定しているので、候補文
字数を少なくすることができると共に、正しい文字を上
位候補に入れ替えることができる。

【００８６】なお、上記実施例の面積比テーブルメモリ
には、正規化後の文字画像が類似することによって誤認
識するような文字の面積比が格納されていたが、これに
限定されるものではなく、例えば、面積比テーブルメモ
リには、図５１に示すように、認識の対象となる全ての
文字（英字、数字、漢字等）のそれぞれの標準の面積比
と面積比の有効範囲値を格納するようにしてもよい。あ
るいは、面積比テーブルメモリには、図５２に示すよう
に、対象となる文字の標準の面積比のみを格納するよう
にし、類似文字判定部９において、テーブル参照時に読
みだされる標準の面積比に、予め定められた第１の定数
を掛けることによって面積比許容範囲上限値を得るよう
にし、標準の面積比に、予め定められた第２の定数を掛
けることによって面積比許容範囲下限値を得るようにし
てもよい。図５３は、第１の定数を１．５とし、第２の
定数を０．５とした場合の面積比テーブルメモリから得
られる面積比許容範囲を示したものである。ただし、面
積比許容範囲上限値の計算値が１．０を越える場合は、
許容範囲上限値を１．０とする。

【００８７】また、図５２の面積比テーブルメモリの内
容を、認識対象となる全ての文字に拡張することもでき
る。さらに、面積比テーブルメモリには、図５４に示す
ように、対象となる文字の標準の面積比のみを格納する
ようにし、類似文字判定部９において、テーブル参照時
に読みだされる標準の面積比に、予め定められた第１の
定数を足すことによって面積比許容範囲上限値を得るよ
うにし、標準の面積比から、予め定められた第２の定数
を引くことによって面積比許容範囲下限値を得るように
してもよい。図５５は、第１の定数を０．２とし、第２
の定数を０．２とした場合の面積比テーブルメモリから
得られる面積比許容範囲を示したものである。ただし、
面積比許容範囲上限値の計算値が１．０を越える場合は
、許容範囲上限値を１．０とし、面積比許容範囲下限値
の計算値が０．０未満の値になる場合は、許容範囲下限
値を０．０とする。この図５４に示す面積比テーブルメ
モリの内容を、認識対象となる全ての文字に拡張するこ
ともできる。

【００８８】また、実施例１、２と同様に、実施例３の
構成に、単語辞書や単語間の接続情報等が格納されてい
る言語知識辞書メモリと、言語知識修正部とを付加し、
言語知識修正部が、認識結果メモリの内容について言語
知識辞書メモリを参照することによって、認識結果の修
正を行うように、構成を変更することも可能であり、あ
るいは、実施例３の構成に、認識結果メモリの内容をユ
ーザが修正するためのツールである結果修正エディタを
付加し、結果出力部に表示された認識結果を見ながら、
キーボード、マウス等によって誤認識文字を候補文字中
の正しい文字に入れ替えるようにしてもよい。さらに、
実施例３の構成に、これらの言語知識修正部、言語知識
辞書メモリ、そして結果修正エディタを付加して構成す
ることも可能である。

【００８９】

【発明の効果】以上、説明したように、請求項１記載の
発明によれば、正規化前の文字の縦横比を用いて候補文
字の有効性を判定しているので、候補文字数を絞り込む
ことができ、後処理が高速化される。請求項２記載の発
明によれば、認識対象文字毎の標準の縦横比とその有効
範囲によって縦横比テーブルを構成しているので、類似
文字の判定処理を高速に行うことができる。請求項３記
載の発明によれば、縦横比テーブルが標準の縦横比のみ
によって構成されているので、小容量のメモリで構成す
ることが可能となる。請求項４記載の発明によれば、正
しい文字を上位候補に入れ替えているので、修正処理を
容易に行うことができる。

【００９０】請求項５記載の発明によれば、正規化前の
文字の空白比を用いて候補文字の有効性を判定している
ので、候補文字数を絞り込むことができ、後処理が高速
化される。請求項６記載の発明によれば、認識対象文字
毎の標準の空白比とその有効範囲によって空白比テーブ
ルを構成しているので、類似文字の判定処理を高速に行
うことができる。請求項７記載の発明によれば、空白比
テーブルが標準の空白比のみによって構成されているの
で、小容量のメモリで構成することが可能となる。請求
項８記載の発明によれば、正しい文字を上位候補に入れ
替えているので、修正処理を容易に行うことができる。

【００９１】請求項９記載の発明によれば、正規化前の
文字の面積比を用いて候補文字の有効性を判定している
ので、候補文字数を絞り込むことができ、後処理が高速
化される。請求項１０記載の発明によれば、認識対象文
字毎の標準の面積比とその有効範囲によって面積比テー
ブルを構成しているので、類似文字の判定処理を高速に
行うことができる。請求項１１記載の発明によれば、面
積比テーブルが標準の面積比のみによって構成されてい
るので、小容量のメモリで構成することが可能となる。請求項１２記載の発明によれば、正しい文字を上位候補
に入れ替えているので、修正処理を容易に行うことがで
きる。

【図面の簡単な説明】

【図１】本発明の第１の実施例に係るブロック構成図で
ある。

【図２】実施例１における認識結果が認識結果メモリに
格納された図である。

【図３】原文字画像を正規化した後の形状がほぼ同形に
なる、第１の例を示した図である。

【図４】原文字画像を正規化した後の形状がほぼ同形に
なる、第２の例を示した図である。

【図５】原文字画像を正規化した後の形状がほぼ同形に
なる、第３の例を示した図である。

【図６】（ａ）、（ｂ）は、実施例１の縦横比テーブル
メモリの内容を示す図である。

【図７】実施例１の切り出し情報メモリの内容を示す図
である。

【図８】実施例１における類似文字判定の処理フローチ
ャートである。

【図９】実施例１の候補文字の判定結果をまとめて示し
た図である。

【図１０】実施例１のソート前の候補文字を示す図であ
る。

【図１１】実施例１のソート後の候補文字を示す図であ
る。

【図１２】実施例１のソート前の認識結果メモリの内容
を示す図である。

【図１３】実施例１のソート後の認識結果メモリの内容
を示す図である。

【図１４】認識の対象となる全ての文字のそれぞれの標
準の縦横比値と縦横比値の有効範囲を格納した縦横比テ
ーブルメモリの他の実施例である。

【図１５】対象となる文字の標準の縦横比値のみを格納
した縦横比テーブルメモリの更に他の実施例である。

【図１６】第１の定数を０．５、第２の定数を２．０と
した場合の縦横比テーブルメモリから得られる縦横比許
容範囲を示した図である。

【図１７】本発明の第２の実施例に係るブロック構成図
である。

【図１８】実施例２における認識結果が認識結果メモリ
に格納された図である。

【図１９】原文字画像を正規化した後の形状がほぼ同形
になる、第１の例を示した図である。

【図２０】原文字画像を正規化した後の形状がほぼ同形
になる、第２の例を示した図である。

【図２１】原文字画像を正規化した後の形状がほぼ同形
になる、第３の例を示した図である。

【図２２】実施例２の空白比テーブルメモリの内容を示
す図である。

【図２３】実施例２の切り出し情報メモリの内容を示す
図である。

【図２４】実施例２における類似文字判定の処理フロー
チャートである。

【図２５】実施例２の候補文字の判定結果をまとめて示
した図である。

【図２６】実施例２の削除および書き換え処理前の認識
結果メモリの内容の一部を示す図である。

【図２７】実施例２の削除および書き換え処理後の認識
結果メモリの内容の一部を示す図である。

【図２８】実施例２の候補文字の判定結果をまとめて示
した図である。

【図２９】実施例２のソート前の候補文字を示す図であ
る。

【図３０】実施例２のソート後の候補文字を示す図であ
る。

【図３１】実施例２のソート前の認識結果メモリの内容
を示す図である。

【図３２】実施例２のソート後の認識結果メモリの内容
を示す図である。

【図３３】認識の対象となる全ての文字のそれぞれの標
準の空白比値と空白比値の有効範囲を格納した空白比テ
ーブルメモリの他の実施例である。

【図３４】対象となる文字の標準の空白比値のみを格納
した空白比テーブルメモリの更に他の実施例である。

【図３５】第１の定数を１．５、第２の定数を０．５と
した場合の図３４の空白比テーブルメモリから得られる
空白比許容範囲を示した図である。

【図３６】対象となる文字の標準の空白比値のみを格納
した空白比テーブルメモリの更に他の実施例である。

【図３７】第１の定数を０．２、第２の定数を０．２と
した場合の図３６の空白比テーブルメモリから得られる
空白比許容範囲を示した図である。

【図３８】縦書きの場合における空白比を説明するため
の図である。

【図３９】本発明の第３の実施例に係るブロック構成図
である。

【図４０】実施例３の面積比テーブルメモリの内容を示
す図である。

【図４１】実施例３の切り出し情報メモリの内容を示す
図である。

【図４２】実施例３における類似文字判定の処理フロー
チャートである。

【図４３】実施例３の判定結果をまとめて示した図であ
る。

【図４４】実施例３の削除および書き換え処理前の認識
結果メモリの内容の一部を示す図である。

【図４５】実施例３の削除および書き換え処理後の認識
結果メモリの内容の一部を示す図である。

【図４６】実施例３の候補文字の判定結果をまとめて示
した図である。

【図４７】実施例３のソート前の候補文字を示す図であ
る。

【図４８】実施例３のソート後の候補文字を示す図であ
る。

【図４９】実施例３のソート前の認識結果メモリの内容
を示す図である。

【図５０】実施例３のソート後の認識結果メモリの内容
を示す図である。

【図５１】認識の対象となる全ての文字のそれぞれの標
準の面積比値と面積比値の有効範囲を格納した面積比テ
ーブルメモリの他の実施例である。

【図５２】対象となる文字の標準の面積比値のみを格納
した面積比テーブルメモリの更に他の実施例である。

【図５３】第１の定数を１．５、第２の定数を０．５と
した場合の図５２の面積比テーブルメモリから得られる
面積比許容範囲を示した図である。

【図５４】対象となる文字の標準の面積比値のみを格納
した面積比テーブルメモリの更に他の実施例である。

【図５５】第１の定数を０．２、第２の定数を０．２と
した場合の図５４の面積比テーブルメモリから得られる
面積比許容範囲を示した図である。

【符号の説明】

１　　画像入力部２　　画像メモリ３　　行・文字切り出し部４　　文字画像メモリ５　　文字認識部６　　切り出し情報メモリ７　　文字辞書メモリ８　　認識結果メモリ９　　類似文字判定部１０　　縦横比テーブルメモリ１１　　結果出力部１２　　空白比テーブルメモリ１３　　面積比テーブルメモリ

Claims

【特許請求の範囲】

【請求項１】　　複数の認識結果候補から候補数を絞り
込む文字認識方法において、認識結果候補文字によって
、認識対象文字毎の縦横比が予め設定されたテーブルを
参照し、該テーブルから読み出された認識結果候補文字
の縦横比と認識対象文字の縦横比とを比較し、該比較結
果が所定の閾値を越える認識結果候補文字を、前記複数
の候補から削除することを特徴とする文字認識方法。
【請求項２】　　前記テーブルには、認識対象文字毎の
標準の縦横比および縦横比の有効範囲が設定され、認識
対象文字の縦横比が、認識結果候補文字によって前記テ
ーブルから読み出される縦横比の有効範囲外にあるとき
、該候補文字を削除することを特徴とする請求項１記載
の文字認識方法。
【請求項３】　　前記テーブルには、認識対象文字毎の
標準の縦横比が設定され、該標準の縦横比に所定の演算
を行って前記有効範囲を生成することを特徴とする請求
項２記載の文字認識方法。
【請求項４】　　削除処理後の複数の認識結果候補文字
に対して、認識対象文字の縦横比と、認識結果候補文字
によって前記テーブルから読み出された縦横比との差の
絶対値を算出し、該値の小さい順に、前記複数の認識結
果候補文字を並べ換えることを特徴とする請求項１記載
の文字認識方法。
【請求項５】　　複数の認識結果候補から候補数を絞り
込む文字認識方法において、認識結果候補文字によって
、認識対象文字毎の空白比が予め設定されたテーブルを
参照し、該テーブルから読み出された認識結果候補文字
の空白比と認識対象文字の空白比とを比較し、該比較結
果が所定の閾値を越える認識結果候補文字を、前記複数
の候補から削除することを特徴とする文字認識方法。
【請求項６】前記テーブルには、認識対象文字毎の標準
の空白比および空白比の有効範囲が設定され、認識対象
文字の空白比が、認識結果候補文字によって前記テーブ
ルから読み出される空白比の有効範囲外にあるとき、該
候補文字を削除することを特徴とする請求項５記載の文
字認識方法。
【請求項７】　　前記テーブルには、認識対象文字毎の
標準の空白比が設定され、該標準の空白比に所定の演算
を行って前記有効範囲を生成することを特徴とする請求
項６記載の文字認識方法。
【請求項８】　　削除処理後の複数の認識結果候補文字
に対して、認識対象文字の空白比と、認識結果候補文字
によって前記テーブルから読み出された空白比との差の
絶対値を算出し、該値の小さい順に、前記複数の認識結
果候補文字を並べ換えることを特徴とする請求項５記載
の文字認識方法。
【請求項９】　　複数の認識結果候補から候補数を絞り
込む文字認識方法において、認識結果候補文字によって
、認識対象文字毎の面積比が予め設定されたテーブルを
参照し、該テーブルから読み出された認識結果候補文字
の面積比と認識対象文字の面積比とを比較し、該比較結
果が所定の閾値を越える認識結果候補文字を、前記複数
の候補から削除することを特徴とする文字認識方法。
【請求項１０】前記テーブルには、認識対象文字毎の標
準の面積比および面積比の有効範囲が設定され、認識対
象文字の面積比が、認識結果候補文字によって前記テー
ブルから読み出される面積比の有効範囲外にあるとき、
該候補文字を削除することを特徴とする請求項９記載の
文字認識方法。
【請求項１１】　　前記テーブルには、認識対象文字毎
の標準の面積比が設定され、該標準の面積比に所定の演
算を行って前記有効範囲を生成することを特徴とする請
求項１０記載の文字認識方法。
【請求項１２】　　削除処理後の複数の認識結果候補文
字に対して、認識対象文字の面積比と、認識結果候補文
字によって前記テーブルから読み出された面積比との差
の絶対値を算出し、該値の小さい順に、前記複数の認識
結果候補文字を並べ換えることを特徴とする請求項９記
載の文字認識方法。