JPH04372089A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH04372089A
JPH04372089A JP3176253A JP17625391A JPH04372089A JP H04372089 A JPH04372089 A JP H04372089A JP 3176253 A JP3176253 A JP 3176253A JP 17625391 A JP17625391 A JP 17625391A JP H04372089 A JPH04372089 A JP H04372089A
Authority
JP
Japan
Prior art keywords
character
ratio
recognition result
recognition
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3176253A
Other languages
English (en)
Inventor
Takakuni Minewaki
隆邦 嶺脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3176253A priority Critical patent/JPH04372089A/ja
Publication of JPH04372089A publication Critical patent/JPH04372089A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語文字読み取り装
置(日本語OCR)において、文字認識候補数を絞り込
むことによって後処理を高速化した文字認識方法に関す
る。
【0002】
【従来の技術】従来から文字認識において、個々の文字
から抽出される特徴を用いて識別を行うと、正解文字を
得ることが難しく、このため文字認識の結果に対して、
言語情報に基づく処理を施し、すなわち前後の文字との
関係あるいは単語、文法等の情報を用いて正解文字を得
る後処理が行われている。
【0003】
【発明が解決しようとする課題】上記した言語処理によ
って認識結果を修正処理(後処理)する場合、認識結果
の候補文字を組み合わせて、単語辞書と比較・照合する
方法が採られている。このような修正処理方法によると
、候補文字が多いほどその組み合わせの数は膨大なもの
となり、従って単語照合を行うときの処理量が増え、多
大な処理時間を要するという問題があり、また必要なメ
モリが増大するという問題があった。
【0004】さらに、後処理の有無に係らず、最終的な
認識結果をユーザに提示し、ユーザが修正処理を行う必
要がある。例えば、本出願人が既に提案した方法、すな
わち文字の縦横比を用いて認識結果候補中の類似文字を
識別する方法(特願平2−21120号)、文字の空白
比を用いて識別する方法(特願平1−250091号)
、文字の面積比を用いて識別する方法(特願平1−28
5605号)では、認識結果候補の中から不正解のもの
を削除したり、あるいは候補を絞り込むことなく、確度
の高い順に候補文字を並べ換えて出力しているので、ユ
ーザは提示された多数の候補文字から選択しなければな
らず、選択作業に時間がかかるという問題があった。
【0005】本発明の目的は、確度の高い候補文字を上
位に並べ換えると共に、誤認識の確度の高い候補文字を
削除し、候補文字数を絞り込むことによって、後処理の
高速化を図った文字認識方法を提供することにある。
【0006】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明は、複数の認識結果候補から候
補数を絞り込む文字認識方法において、認識結果候補文
字によって、認識対象文字毎の縦横比が予め設定された
テーブルを参照し、該テーブルから読み出された認識結
果候補文字の縦横比と認識対象文字の縦横比とを比較し
、該比較結果が所定の閾値を越える認識結果候補文字を
、前記複数の候補から削除することを特徴としている。
【0007】請求項2記載の発明は、前記テーブルには
、認識対象文字毎の標準の縦横比および縦横比の有効範
囲が設定され、認識対象文字の縦横比が、認識結果候補
文字によって前記テーブルから読み出される縦横比の有
効範囲外にあるとき、該候補文字を削除することを特徴
としている。
【0008】請求項3記載の発明は、前記テーブルには
、認識対象文字毎の標準の縦横比が設定され、該標準の
縦横比に所定の演算を行って前記有効範囲を生成するこ
とを特徴としている。
【0009】請求項4記載の発明は、削除処理後の複数
の認識結果候補文字に対して、認識対象文字の縦横比と
、認識結果候補文字によって前記テーブルから読み出さ
れた縦横比との差の絶対値を算出し、該値の小さい順に
、前記複数の認識結果候補文字を並べ換えることを特徴
としている。
【0010】請求項5記載の発明は、複数の認識結果候
補から候補数を絞り込む文字認識方法において、認識結
果候補文字によって、認識対象文字毎の空白比が予め設
定されたテーブルを参照し、該テーブルから読み出され
た認識結果候補文字の空白比と認識対象文字の空白比と
を比較し、該比較結果が所定の閾値を越える認識結果候
補文字を、前記複数の候補から削除することを特徴とし
ている。
【0011】請求項6記載の発明は、前記テーブルには
、認識対象文字毎の標準の空白比および空白比の有効範
囲が設定され、認識対象文字の空白比が、認識結果候補
文字によって前記テーブルから読み出される空白比の有
効範囲外にあるとき、該候補文字を削除することを特徴
としている。
【0012】請求項7記載の発明は、前記テーブルには
、認識対象文字毎の標準の空白比が設定され、該標準の
空白比に所定の演算を行って前記有効範囲を生成するこ
とを特徴としている。
【0013】請求項8記載の発明は、削除処理後の複数
の認識結果候補文字に対して、認識対象文字の空白比と
、認識結果候補文字によって前記テーブルから読み出さ
れた空白比との差の絶対値を算出し、該値の小さい順に
、前記複数の認識結果候補文字を並べ換えることを特徴
としている。
【0014】請求項9記載の発明は、複数の認識結果候
補から候補数を絞り込む文字認識方法において、認識結
果候補文字によって、認識対象文字毎の面積比が予め設
定されたテーブルを参照し、該テーブルから読み出され
た認識結果候補文字の面積比と認識対象文字の面積比と
を比較し、該比較結果が所定の閾値を越える認識結果候
補文字を、前記複数の候補から削除することを特徴とし
ている。
【0015】請求項10記載の発明は、前記テーブルに
は、認識対象文字毎の標準の面積比および面積比の有効
範囲が設定され、認識対象文字の面積比が、認識結果候
補文字によって前記テーブルから読み出される面積比の
有効範囲外にあるとき、該候補文字を削除することを特
徴としている。
【0016】請求項11記載の発明は、前記テーブルに
は、認識対象文字毎の標準の面積比が設定され、該標準
の面積比に所定の演算を行って前記有効範囲を生成する
ことを特徴としている。
【0017】請求項12記載の発明は、削除処理後の複
数の認識結果候補文字に対して、認識対象文字の面積比
と、認識結果候補文字によって前記テーブルから読み出
された面積比との差の絶対値を算出し、該値の小さい順
に、前記複数の認識結果候補文字を並べ換えることを特
徴としている。
【0018】
【作用】実施例1では、対象となる原稿の画像をスキャ
ナ等によって読み込み、読み込まれた画像データを画像
メモリに格納し、行・文字切り出し部は、画像メモリ中
の画像データから文字行、文字画像を抽出し、文字画像
メモリへ文字画像データを格納する。行・文字切り出し
部によって切り出された文字位置、文字サイズ等は、切
り出し情報メモリに格納される。文字認識部は、文字画
像メモリ中の文字画像データに対して正規化した後、特
徴抽出を行い、その抽出された特徴量と文字辞書メモリ
内の文字辞書特徴量とを比較することによって、対象文
字の認識結果候補を複数決定し、その結果を認識結果メ
モリへ格納する。類似文字判定部は、認識結果メモリの
内容について、切り出し情報メモリと各対象文字につい
ての縦横比の値が格納されている縦横比テーブルメモリ
を参照することによって、認識結果の修正と認識候補の
絞り込みを行い、その処理結果によって認識結果メモリ
の内容を書き換える。本実施例1では、文字画像の縦横
比を用いることによって候補文字数が絞り込まれる。
【0019】実施例2、3では、それぞれ空白比テーブ
ルと面積比テーブルを設け、該テーブルを参照すること
によって認識結果候補文字数を絞る。
【0020】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。 (実施例1)図1は、本発明の第1の実施例に係るブロ
ック構成図である。図1において、画像入力部1は、ス
キャナ等によって構成され、対象となる原稿の画像を読
み込み、読み込まれた画像データを画像メモリ2に格納
する。行・文字切り出し部3は、画像メモリ2中の画像
データから文字行、文字画像を抽出し、文字画像メモリ
4へ文字画像データを出力して格納する。また、切り出
された文字位置、文字サイズ等の情報は、切り出し情報
メモリ6に格納される。
【0021】文字認識部5は、文字画像メモリ4中の文
字画像データに対して正規化した後、特徴抽出を行い、
その抽出された特徴量と文字辞書メモリ7内の文字辞書
特徴量とを比較することによって、対象文字の認識結果
候補を複数決定し、その結果を認識結果メモリ8へ出力
して格納する。類似文字判定部9は、認識結果メモリ8
の内容について、切り出し情報メモリ6と縦横比テーブ
ルメモリ10を参照することによって、認識結果の修正
と認識候補の絞り込みを行い、その処理結果によって認
識結果メモリ8の内容を書き換える。縦横比テーブルメ
モリ10内には、後述するように各対象文字についての
縦横比の値が格納されている。結果出力部11は、認識
結果メモリ8の内容をディスプレイ、プリンタ等に出力
する。
【0022】本実施例では、文字画像の縦横比を用いる
ことによって候補文字数を絞り込むようにしているが、
その判定に際して、類似文字判定部9が参照する切り出
し情報メモリ6と縦横比テーブルメモリ10の構成につ
いて、以下具体例を用いて説明する。
【0023】例えば、横書きの文字列「ニューヨーク市
」を認識し、類似文字判定する場合を例にして説明する
と、行・文字切り出し部3は、画像メモリ2の画像デー
タから文字行と文字を切り出し、文字認識部5で認識処
理した結果、図2に示すような認識結果が認識結果メモ
リ8に格納されたとする。図2において、正解文字「ニ
ューヨーク市」は、第1候補として文字列「:11ヨ・
ク市」が認識結果となり、第2候補として文字列「=ュ
ーョ−タ布」が認識結果となり、第3候補として文字列
「ニ]・三ー7巾」が認識結果となる。ただし、第4候
補以下は、図から省略している。第1候補では、第1文
字「ニ」を「:」に誤認識し、第2文字「ュ」を「1」
に誤認識し、第3文字「ー」を「1」に誤認識し、第5
文字認「ー」を「・」に誤認識している。
【0024】このような誤認識の原因としては、文字認
識を行うに際して画像データに対して正規化処理をして
いるので、正規化後の画像の形状が同一になってしまう
ことが挙げられる。図3から図5は、原文字画像を正規
化した後の形状がほぼ同形になる例を幾つか示したもの
である。図3から図5の何れの場合でも、正規化後の画
像についてはほぼ同形となって弁別することが困難にな
る。従って、文字画像情報のみのマッチングによる認識
結果では、正解文字が出力されるとは限らず、認識候補
中に誤認識文字が含まれることになる。
【0025】これに対処するために、本実施例では、縦
横比テーブルメモリ10を設け、正規化後の文字画像が
類似することによって誤認識するような文字について、
正規化前の標準的な文字の高さと文字の幅の比(以下、
縦横比)の値と、縦横比の許容範囲値(上限値および下
限値)を、該テーブル10に格納している。その値は、
例えば、統計的な手法あるいは経験によって、または現
在認識中の対象文書から動的に決定される。
【0026】本実施例では、縦横比を例えば次のように
定義する。すなわち、 縦横比=文字外接矩形の幅のドット数(文字幅)/文字
外接矩形の高さのドット数(文字高さ)によって算出さ
れる値をパラメータとしてテーブルに記憶すればよい。 図6(a),(b)は、縦横比テーブルメモリ10の内
容を示す図で、前述したように、縦横比によって判定す
べき文字群の各文字について、その標準の縦横比の値と
縦横比の許容範囲値が格納されている。 ここで、縦横比の許容範囲値とは、標準の縦横比より小
さい値の縦横比許容範囲上限と、標準の縦横比より大き
い値の縦横比許容範囲下限の間の許容範囲にある値をい
う。
【0027】一方、行・文字切り出し部3は、認識対象
となる文字列「ニューヨーク市」を切り出し、各文字の
縦横比を切り出し情報メモリ6に書き込む。図7は、先
に例示した文字列の場合における、切り出し情報メモリ
6の内容を示す図であり、各文字について、文字の高さ
、文字の幅が記憶され、その高さと幅によって算出され
た縦横比が記憶されている。
【0028】以上のように、文字認識部5の認識結果が
メモリ8(図2)に記憶され、縦横比テーブルメモリ1
0の内容(図6)が設定され、文字列「ニューヨーク市
」の各文字の縦横比が切り出し情報メモリ6(図7)に
書き込まれた状態において、本発明の類似文字判定部9
における類似文字判定の処理動作を、図8に示す類似文
字判定の処理フローチャートを参照して、以下説明する
【0029】類似文字判定部9は、認識結果メモリ8か
ら先ず先頭文字の第1候補を選択し(ステップ801〜
804)、該候補文字で縦横比テーブルメモリ10を参
照する(ステップ805)。該候補文字が縦横比テーブ
ルメモリ10中にあれば、該候補文字は、類似文字の判
定処理が必要な文字であるとし(ステップ806)、次
いで、切り出し情報メモリ6に記憶された先頭文字(1
番目の文字)の縦横比と縦横比テーブルメモリ10中の
第1候補文字の縦横比許容範囲とが比較され、先頭文字
(1番目の文字)の縦横比が、第1候補文字の許容範囲
内にあるか否かが判定される(ステップ807)。先頭
文字の縦横比が、第1候補文字の許容範囲内にない場合
は、第1候補文字は無効であるとして、候補から削除さ
れる(ステップ808)。
【0030】先頭文字の縦横比が、第1候補文字の許容
範囲内にある場合は、切り出し情報メモリ6中の先頭文
字の縦横比の値と、縦横比テーブルメモリ10中の第1
候補文字の標準縦横比の値との差の絶対値を算出して、
その値を候補文字の情報として、認識結果メモリ8に保
存する(ステップ809)。
【0031】ここまでの処理を前述した例で説明すると
、まず、第1文字「ニ」の認識結果の第1候補「:」で
縦横比テーブルメモリ10を参照し、該テーブルには「
:」があるので、縦横比許容範囲(0.1〜0.5)が
得られる。切り出し情報メモリ6の第1文字の縦横比は
1.1であるので、第1文字の縦横比が第1候補文字の
許容範囲外にあり、従って第1候補「:」は無効となる
【0032】第2候補文字「=」については、切り出し
情報メモリ6の第1文字の縦横比は1.1で、「=」の
縦横比許容範囲は1.0〜4.3であるので、許容範囲
の条件を満たし、第2候補文字「=」は有効となる。そ
して、切り出し情報メモリ6の第1文字の縦横比の値(
1.1)と第2候補文字「=」の標準縦横比の値(3.
0)との差の絶対値(1.9)を特徴値として認識結果
メモリ8に保存する。第3候補文字「ニ」についても同
様に処理し、縦横比許容範囲(0.9〜1.9)を満た
すので、標準縦横比の値(1.2)との差の絶対値(0
.1)を特徴値として認識結果メモリ8に保存する。図
9は、これらの候補文字の判定結果をまとめて示したも
のである。
【0033】再び図8のフローチャートに戻り、すべて
の候補文字について処理が終了すると(ステップ810
)、1番目の文字について、有効と判定された候補文字
が2個以上あった場合(ステップ811)、候補文字を
縦横比差の小さい順にソートし、候補文字を入れ替え、
候補文字が無効と判定されたものは認識結果メモリ8か
ら削除し、下位の候補文字を上位に詰める(ステップ8
12)。ただし、候補文字であっても、縦横比テーブル
メモリ10に無い文字は、削除された候補位置につめる
だけで、ソートや入れ替えの対象としない。
【0034】前述した1番目の文字についてのソート前
の候補文字と、ソート後の候補文字をそれぞれ図10、
図11に示す。ソート後には、第1候補として縦横比差
の最も小さな「ニ」が書き込まれ、第2候補として縦横
比差が次に小さい「=」が書き込まれる。ソート前に第
1候補であった「:」は削除され、第3候補には、第4
候補以降にあった候補文字が書き込まれる。従って、こ
の処理によって、第1候補の誤認識文字「:」が、正解
文字「ニ」に修正されたことになる。
【0035】以上の処理を全ての文字について行う(ス
テップ813)。文字列「ニューヨーク市」についての
ソート前の認識結果メモリ8の内容と、ソート後の認識
結果メモリ8の内容をそれぞれ図12、図13に示す。 図13に示す如く、第1候補の文字列「:11ヨ・ク市
」が、文字列「ニューヨーク市」に変更され、認識結果
文字が正しく修正される。
【0036】以上説明したように、本実施例1によれば
、正規化後の文字画像が類似することによって発生した
誤認識候補文字について、その文字の正規化前のイメー
ジの縦横比を用いて候補文字の有効性を判定しているの
で、候補文字数を少なくすることができると共に、正し
い文字を上位候補に入れ替えることができる。
【0037】なお、上記実施例の縦横比テーブルメモリ
には、正規化後の文字画像が類似することによって誤認
識するような文字の縦横比が格納されていたが、これに
限定されるものではなく、例えば、縦横比テーブルメモ
リには、図14に示すように、認識の対象となる全ての
文字(英字、数字、漢字等)のそれぞれの標準の縦横比
と縦横比の有効範囲値を格納するようにしてもよい。あ
るいは、縦横比テーブルメモリには、図15に示すよう
に、対象となる文字の標準の縦横比のみを格納するよう
にし、類似文字判定部9において、テーブル参照時に読
みだされる標準の縦横比に、予め定められた第1の定数
を掛けることによって縦横比許容範囲上限値を得るよう
にし、標準の縦横比に、予め定められた第2の定数を掛
けることによって縦横比許容範囲下限値を得るようにし
てもよい。図16は、第1の定数を0.5とし、第2の
定数を2.0とした場合の縦横比テーブルメモリから得
られる縦横比許容範囲を示したものである。また、図1
5の縦横比テーブルメモリの内容を、認識対象となる全
ての文字に拡張することもできる。
【0038】また、実施例1の構成に、単語辞書や単語
間の接続情報等が格納されている言語知識辞書メモリと
、言語知識修正部とを付加し、言語知識修正部が、認識
結果メモリの内容について言語知識辞書メモリを参照す
ることによって、認識結果の修正を行うように、構成を
変更することも可能である。あるいは、実施例1の構成
に、認識結果メモリの内容をユーザが修正するためのツ
ールである結果修正エディタを付加し、結果出力部に表
示された認識結果を見ながら、キーボード、マウス等に
よって誤認識文字を候補文字中の正しい文字に入れ替え
るようにしてもよい。さらに、実施例1の構成に、これ
らの言語知識修正部、言語知識辞書メモリ、そして結果
修正エディタを付加して構成することも可能である。
【0039】(実施例2)図17は、本発明の第2の実
施例に係るブロック構成図であり、実施例1と相違する
点は、実施例1の縦横比テーブルメモリを空白比テーブ
ルメモリ12に置き換えた点であり、他の構成およびそ
の機能は実施例1のものと全く同様であるので、その説
明を省略する。
【0040】本実施例2は、文字画像の空白比を用いる
ことによって候補文字数を絞り込んでいるが、まず、類
似文字判定部9が参照する切り出し情報メモリ6と空白
比テーブルメモリ12の構成について、以下具体例を用
いて説明する。
【0041】例えば、横書きの文字列「ちょっと待った
。」を認識し、類似文字判定する場合を例にして説明す
る。行・文字切り出し部3は、画像メモリ2の画像デー
タから文字行と文字を切り出し、文字認識部5で認識処
理した結果、図18に示すような認識結果が認識結果メ
モリ8に格納されたとする。図18において、正解文字
「ちょっと待った。」は、第1候補として文字列「ちよ
つと待つたo」が認識結果となり、第2候補として文字
列「らょフヒ侍っに0」が認識結果となり、第3候補と
して文字列「古まっど持フ仁。」が認識結果となる。 ただし、第4候補以下は、図から省略している。第1候
補では、第2文字「ょ」を「よ」に誤認識し、第3文字
「っ」を「つ」に誤認識し、第4文字「っ」を「つ」に
誤認識し、第8文字認「。」を「o」にそれぞれ誤認識
している。
【0042】このような誤認識の原因としては、実施例
1と同様に、文字認識を行うに際して画像データに対し
て正規化処理をしているので、正規化後の画像の形状が
同一になってしまうことが挙げられる。図19から図2
1は、原文字画像を正規化した後の形状がほぼ同形にな
る例を幾つか示したものである。図19から図21の何
れの場合でも、正規化後の画像についてはほぼ同形とな
って弁別することが困難になる。従って、実施例1と同
じく、文字画像情報のみのマッチングによる認識結果で
は、正解文字が出力されるとは限らず、認識候補中に誤
認識文字が含まれることになる。
【0043】これに対処するために、本実施例2では、
空白比テーブルメモリ12を設け、正規化後の文字画像
が類似することによって誤認識するような文字について
、正規化前の標準的な空白比の値と、空白比の許容範囲
値(上限値および下限値)を、該テーブル12に格納し
ている。
【0044】本実施例では、空白比を例えば、横書きの
場合、基準の行高さに対する、対象文字上端から行の上
基準線間までの距離(空白距離)の比とする。この決定
方法は、一意なものではなく、例えば次のようにして決
定することもできる。すなわち、基準の行高さとしては
、■;対象とする行の外接矩形の高さとする、■;対象
とする行内の文字矩形の高さの最大値とする、■;対象
とする行内の文字矩形列に対して、スキューを考慮して
設定された行の上基準線と行の下基準線の間隔の最大値
とする、■;対象とする行内の文字矩形列に対して、ス
キューを考慮して設定された行の上基準線と行の下基準
線の間隔の平均値とする等である。
【0045】また、行の上基準線としては、a;対象と
する行の外接矩形の上辺とする、b;対象とする行内の
文字矩形列に対して、スキューを考慮して文字矩形列の
上辺に接するように設定された直線とする等である。
【0046】このように定義された基準の行高さと行の
上基準線に対して、次式によって空白比が算出される。 空白比=(空白距離/基準の行高さ)×定数
【0047
】以下の説明では、基準の行高さとして■の方法によっ
て決定され、行の上基準線としてaの方法によって決定
され、定数が1であるとして説明する。なお、テーブル
に格納されている空白比の値は、例えば、予め測定され
た統計的な手法によってあるいは経験値によって、また
は現在認識中の対象文書から動的に決定される。
【0048】図22は、空白比テーブルメモリ12の内
容を示す図で、前述したように、空白比によって判定す
べき文字群の各文字について、その標準の空白比の値と
空白比の許容範囲値が格納されている。ここで、空白比
の許容範囲値とは、標準の空白比より大きい値の空白比
許容範囲上限と、標準の空白比より小さい値の空白比許
容範囲下限の間の許容範囲にある値をいう。
【0049】これに対して、行・文字切り出し部3は、
認識対象となる文字列を切り出し、各文字の空白比を切
り出し情報メモリ6に書き込む。図23は、先に例示し
た文字列の場合における、切り出し情報メモリ6の内容
を示す図であり、各文字について、その行の基準の行高
さと、各文字の空白距離が記憶され、その高さと距離に
よって算出された空白比が記憶されている。
【0050】以上のように、文字認識部5の認識結果が
メモリ8(図18)に記憶され、空白比テーブルメモリ
12の内容(図22)が設定され、文字列「ちょっと待
った。」の各文字の空白比が切り出し情報メモリ6(図
23)に書き込まれた状態において、本実施例2の類似
文字判定部9における類似文字判定の処理動作を、図2
4に示す類似文字判定の処理フローチャートを参照して
、以下説明する。
【0051】類似文字判定部9は、認識結果メモリ8か
ら先ず先頭文字の第1候補を選択し(ステップ2401
〜2404)、該候補文字で空白比テーブルメモリ12
を参照する(ステップ2405)。該候補文字が空白比
テーブルメモリ12中にあれば、該候補文字は、類似文
字の判定処理が必要な文字であるとし(ステップ240
6)、次いで、切り出し情報メモリ6に記憶された先頭
文字(1番目の文字)の空白比と空白比テーブルメモリ
12中の第1候補文字の空白比許容範囲とが比較され、
先頭文字(1番目の文字)の空白比が、第1候補文字の
許容範囲内にあるか否かが判定される(ステップ240
7)。先頭文字の空白比が、第1候補文字の許容範囲内
にない場合は、第1候補文字は無効であるとして、候補
から削除される(ステップ2408)。
【0052】先頭文字の空白比が、第1候補文字の許容
範囲内にある場合は、切り出し情報メモリ6中の先頭文
字の空白比の値と、空白比テーブルメモリ12中の第1
候補文字の標準空白比の値との差の絶対値を算出して、
その値を候補文字の情報として、認識結果メモリ8に保
存する(ステップ2409)。
【0053】ここまでの処理を前述した例で説明すると
、まず、第2文字「ょ」の認識結果の第1候補「よ」で
空白比テーブルメモリ12を参照し、該テーブルには「
よ」があるので、空白比許容範囲(0.0〜0.3)が
得られる。切り出し情報メモリ6の第2文字の空白比は
0.4であるので、第2文字の空白比が第1候補文字の
許容範囲外にあり、従って第1候補「よ」は無効となる
【0054】第2候補文字「ょ」については、切り出し
情報メモリ6の第2文字の空白比は0.4で、「ょ」の
空白比許容範囲は0.2〜0.6であるので、許容範囲
の条件を満たし、第2候補文字「ょ」は有効となる。そ
して、切り出し情報メモリ6の第2文字の空白比の値(
0.4)と第2候補文字「ょ」の標準空白比の値(0.
5)との差の絶対値(0.1)を特徴値として認識結果
メモリ8に保存する。
【0055】続いて、第3候補文字「ま」に処理が移る
が、空白比テーブルメモリ12には文字「ま」がないの
で、第3文字に処理が進む。従って、第2文字について
は、有効な空白比差を持つ候補文字が1個となり、無効
となった第1候補の「よ」を削除し、下位候補を上位に
つめることによって、第2文字の処理が終了する。図2
5は、第2文字の候補文字の判定結果をまとめて示した
ものである。また、図26は、第2文字について削除お
よび書き換え処理前の認識結果メモリ8の内容の一部を
示し、図27は、第2文字について削除および書き換え
処理後の認識結果メモリ8の内容の一部を示す。
【0056】同様にして、第3文字「っ」について処理
する。この場合、第1候補の「つ」と第3候補の「っ」
が有効となり、それぞれ前述した手順によって、空白比
差0.3と0.1が得られる。図28は、第3文字につ
いての候補文字の判定結果をまとめて示したものである
【0057】第3文字のすべての候補文字について処理
が終了すると(ステップ2410)、有効と判定された
候補文字が2個以上あった場合(ステップ2411)、
候補文字を空白比差の小さい順にソートし、候補文字を
入れ替え、候補文字が無効と判定されたものは認識結果
メモリ8から削除し、下位の候補文字を上位に詰める(
ステップ2412)。ただし、候補文字であっても、空
白比テーブルメモリ12に無い文字(第2候補の「フ」
)は、削除された候補位置につめるだけで、ソートや入
れ替えの対象としない。
【0058】第3文字についてのソート前の候補文字と
、ソート後の候補文字をそれぞれ図29、図30に示す
。ソート後には、第1候補として空白比差の最も小さな
「っ」が書き込まれ、第2候補は変更されず、第3候補
として空白比差が2番目に小さい「つ」が書き込まれる
【0059】以上の処理を全ての文字について行う(ス
テップ2413)。文字列「ちょっと待った。」につい
てのソート前の認識結果メモリ8の内容と、ソート後の
認識結果メモリ8の内容をそれぞれ図31、図32に示
す。図32に示す如く、第1候補の文字列「ちよつと待
つたo」が、文字列「ちょっと待った。」に変更され、
認識結果文字が正しく修正される。
【0060】以上説明したように、本実施例2によれば
、正規化後の文字画像が類似することによって発生した
誤認識候補文字について、その文字の正規化前の空白比
を用いて候補文字の有効性を判定しているので、候補文
字数を少なくすることができると共に、正しい文字を上
位候補に入れ替えることができる。
【0061】なお、上記実施例の空白比テーブルメモリ
には、正規化後の文字画像が類似することによって誤認
識するような文字の空白比が格納されていたが、これに
限定されるものではなく、例えば、空白比テーブルメモ
リには、図33に示すように、認識の対象となる全ての
文字(英字、数字、漢字等)のそれぞれの標準の空白比
と空白比の有効範囲値を格納するようにしてもよい。あ
るいは、空白比テーブルメモリには、図34に示すよう
に、対象となる文字の標準の空白比のみを格納するよう
にし、類似文字判定部9において、テーブル参照時に読
みだされる標準の空白比に、予め定められた第1の定数
を掛けることによって空白比許容範囲上限値を得るよう
にし、標準の空白比に、予め定められた第2の定数を掛
けることによって空白比許容範囲下限値を得るようにし
てもよい。図35は、第1の定数を1.5とし、第2の
定数を0.5とした場合の空白比テーブルメモリから得
られる空白比許容範囲を示したものである。ただし、空
白比許容範囲上限値の計算値が1.0を越える場合は、
許容範囲上限値を1.0とし、小数第3位を四捨五入す
る。
【0062】また、図34の空白比テーブルメモリの内
容を、認識対象となる全ての文字に拡張することもでき
る。さらに、空白比テーブルメモリには、図36に示す
ように、対象となる文字の標準の空白比のみを格納する
ようにし、類似文字判定部9において、テーブル参照時
に読みだされる標準の空白比に、予め定められた第1の
定数を足すことによって空白比許容範囲上限値を得るよ
うにし、標準の空白比から、予め定められた第2の定数
を引くことによって空白比許容範囲下限値を得るように
してもよい。図37は、第1の定数を0.2とし、第2
の定数を0.2とした場合の空白比テーブルメモリから
得られる空白比許容範囲を示したものである。ただし、
空白比許容範囲上限値の計算値が1.0を越える場合は
、許容範囲上限値を1.0とし、空白比許容範囲下限値
の計算値が0.0未満の値になる場合は、許容範囲下限
値を0.0とする。この図36に示す空白比テーブルメ
モリの内容を、認識対象となる全ての文字に拡張するこ
ともできる。
【0063】上記実施例2およびその変形例は、縦書き
の文書にも適用することができる。図38に示すように
縦書きの場合、空白比は、基準の行幅に対する、対象文
字左端から行の左基準線間での距離(空白距離)の比で
定義され、算出式は、空白比=(空白距離/基準の行幅
)×定数、である。
【0064】また、実施例1と同様に、実施例2の構成
に、単語辞書や単語間の接続情報等が格納されている言
語知識辞書メモリと、言語知識修正部とを付加し、言語
知識修正部が、認識結果メモリの内容について言語知識
辞書メモリを参照することによって、認識結果の修正を
行うように、構成を変更することも可能であり、あるい
は、実施例2の構成に、認識結果メモリの内容をユーザ
が修正するためのツールである結果修正エディタを付加
し、結果出力部に表示された認識結果を見ながら、キー
ボード、マウス等によって誤認識文字を候補文字中の正
しい文字に入れ替えるようにしてもよい。さらに、実施
例2の構成に、これらの言語知識修正部、言語知識辞書
メモリ、そして結果修正エディタを付加して構成するこ
とも可能である。
【0065】(実施例3)図39は、本発明の第3の実
施例に係るブロック構成図であり、実施例1、2と相違
する点は、実施例1、2の縦横比テーブルメモリ、空白
比テーブルメモリを面積比テーブル13に置き換えた点
であり、他の構成およびその機能は実施例1、2のもの
と全く同様であるので、その説明を省略する。
【0066】本実施例3は、文字画像の面積比を用いる
ことによって候補文字数を絞り込んでいるが、まず、類
似文字判定部9が参照する切り出し情報メモリ6と面積
比テーブルメモリ13の構成について、以下具体例を用
いて説明する。
【0067】実施例2で用いた横書きの文字列「ちょっ
と待った。」を認識し、類似文字判定する場合を例にし
て説明する。行・文字切り出し部3は、画像メモリ2の
画像データから文字行と文字を切り出し、文字認識部5
で認識処理した結果、図18に示すような認識結果が認
識結果メモリ8に格納される。前述したように、図18
において、正解文字「ちょっと待った。」は、第1候補
として文字列「ちよつと待つたo」が認識結果となる。
【0068】誤認識の原因は、実施例1、2で説明した
如く、正規化後の画像の形状が同一になることが挙げら
れ、このため、正規化後の画像についてはほぼ同形とな
って弁別することが困難になり、認識候補中に誤認識文
字が含まれることになる。
【0069】このために、本実施例3では、面積比テー
ブルメモリ13を設け、正規化後の文字画像が類似する
ことによって誤認識するような文字について、正規化前
の標準的な面積比の値と、面積比の許容範囲値(上限値
および下限値)を、該テーブル13に格納している。
【0070】本実施例では、面積比を例えば、基準の文
字面積に対する、対象文字の面積比とする。この決定方
法は、一意なものではなく、例えば次のようにして決定
することもできる。すなわち、基準の文字面積としては
、■;対象とする行内の文字矩形面積の内の最大の面積
値とする、■;対象とする行内の文字矩形の高さの最大
値と幅の最大値の積をとった値とする、■;対象とする
行矩形の高さを2乗した(行高さ×行高さ)値とする、
■;対象とする行内の文字の内、全角の漢字とみなされ
る文字矩形面積の内の最大の面積値とする、■;対象と
する行内の文字の内、全角の漢字とみなされる文字矩形
面積の平均値とする、■;対象とする文書の文字の内、
全角の漢字とみなされる文字矩形面積の平均値とする等
である。
【0071】また、対象文字の面積としては、a;対象
とする文字の外接矩形の面積とする等である。このよう
に定義された基準の文字面積と対象文字の面積に対して
、次式によって面積比が算出される。 面積比=(対象文字の面積/基準の文字面積)×定数

0072】以下の説明では、基準の行高さとして■の方
法によって決定され、行の上基準線としてaの方法によ
って決定され、定数が1であるとして説明する。なお、
テーブルに格納されている面積の値は、例えば、予め測
定された統計的な手法によってあるいは経験値によって
、または現在認識中の対象文書から動的に決定される。
【0073】図40は、面積比テーブルメモリ13の内
容を示す図で、前述したように、面積比によって判定す
べき文字群の各文字について、その標準の面積比の値と
面積比の許容範囲値が格納されている。ここで、面積比
の許容範囲値とは、標準の面積比より大きい値の面積比
許容範囲上限と、標準の面積比より小さい値の面積比許
容範囲下限の間の許容範囲にある値をいう。
【0074】これに対して、行・文字切り出し部3は、
認識対象となる文字列を切り出し、各文字の面積比を切
り出し情報メモリ6に書き込む。図41は、先に例示し
た文字列の場合における、切り出し情報メモリ6の内容
を示す図であり、各文字について、その文字高さと、文
字幅が記憶され、その高さと幅によって算出された面積
比が記憶されている。
【0075】以上のように、文字認識部5の認識結果が
メモリ8(図18)に記憶され、面積比テーブルメモリ
13の内容(図40)が設定され、文字列「ちょっと待
った。」の各文字の面積比が切り出し情報メモリ6(図
41)に書き込まれた状態において、本実施例3の類似
文字判定部9における類似文字判定の処理動作を、図4
2に示す類似文字判定の処理フローチャートを参照して
、以下説明する。
【0076】類似文字判定部9は、認識結果メモリ8か
ら先ず先頭文字の第1候補を選択し(ステップ4201
〜4204)、該候補文字で面積比テーブルメモリ13
を参照する(ステップ4205)。該候補文字が面積比
テーブルメモリ13中にあれば、該候補文字は、類似文
字の判定処理が必要な文字であるとし(ステップ420
6)、次いで、切り出し情報メモリ6に記憶された先頭
文字(1番目の文字)の面積比と面積比テーブルメモリ
13中の第1候補文字の面積比許容範囲とが比較され、
先頭文字(1番目の文字)の面積比が、第1候補文字の
許容範囲内にあるか否かが判定される(ステップ420
7)。先頭文字の面積比が、第1候補文字の許容範囲内
にない場合は、第1候補文字は無効であるとして、候補
から削除される(ステップ4208)。
【0077】先頭文字の面積比が、第1候補文字の許容
範囲内にある場合は、切り出し情報メモリ6中の先頭文
字の面積比の値と、面積比テーブルメモリ13中の第1
候補文字の標準面積比の値との差の絶対値を算出して、
その値を候補文字の情報として、認識結果メモリ8に保
存する(ステップ4209)。
【0078】ここまでの処理を前述した例で説明すると
、まず、第2文字「ょ」の認識結果の第1候補「よ」で
面積比テーブルメモリ13を参照し、該テーブルには「
よ」があるので、面積比許容範囲(0.70〜1.00
)が得られる。切り出し情報メモリ6の第2文字の面積
比は0.38であるので、第2文字の面積比が第1候補
文字の許容範囲外にあり、従って第1候補「よ」は無効
となる。
【0079】第2候補文字「ょ」については、切り出し
情報メモリ6の第2文字の面積比は0.38で、「ょ」
の面積比許容範囲は0.30〜0.70であるので、許
容範囲の条件を満たし、第2候補文字「ょ」は有効とな
る。そして、切り出し情報メモリ6の第2文字の面積比
の値(0.38)と第2候補文字「ょ」の標準面積比の
値(0.45)との差の絶対値(0.07)を特徴値と
して認識結果メモリ8に保存する。
【0080】続いて、第3候補文字「ま」に処理が移る
が、面積比テーブルメモリ13には文字「ま」がないの
で、第3文字に処理が進む。従って、第2文字について
は、有効な面積比差を持つ候補文字が1個となり、無効
となった第1候補の「よ」を削除し、下位候補を上位に
つめることによって、第2文字の処理が終了する。図4
3は、第2文字の候補文字の判定結果をまとめて示した
ものである。また、図44は、第2文字について削除お
よび書き換え処理前の認識結果メモリ8の内容の一部を
示し、図45は、第2文字について削除および書き換え
処理後の認識結果メモリ8の内容の一部を示す。
【0081】同様にして、第3文字「っ」について処理
する。この場合、第1候補の「つ」と第3候補の「っ」
が有効となり、それぞれ前述した手順によって、空白比
差0.40と0.05が得られる。図46は、第3文字
についての候補文字の判定結果をまとめて示したもので
ある。
【0082】第3文字のすべての候補文字について処理
が終了すると(ステップ4210)、有効と判定された
候補文字が2個以上あった場合(ステップ4211)、
候補文字を面積比差の小さい順にソートし、候補文字を
入れ替え、候補文字が無効と判定されたものは認識結果
メモリ8から削除し、下位の候補文字を上位に詰める(
ステップ4212)。ただし、候補文字であっても、面
積比テーブルメモリ13に無い文字(第2候補の「フ」
)は、削除された候補位置につめるだけで、ソートや入
れ替えの対象としない。
【0083】第3文字についてのソート前の候補文字と
、ソート後の候補文字をそれぞれ図47、図48に示す
。ソート後には、第1候補として面積比差の最も小さな
「っ」が書き込まれ、第2候補は変更されず、第3候補
として面積比差が2番目に小さい「つ」が書き込まれる
【0084】以上の処理を全ての文字について行う(ス
テップ4213)。文字列「ちょっと待った。」につい
てのソート前の認識結果メモリ8の内容と、ソート後の
認識結果メモリ8の内容をそれぞれ図49、図50に示
す。図50に示す如く、第1候補の文字列「ちよつと待
つたo」が、文字列「ちょっと待った。」に変更され、
認識結果文字が正しく修正される。
【0085】以上説明したように、本実施例3によれば
、正規化後の文字画像が類似することによって発生した
誤認識候補文字について、その文字の正規化前の面積比
を用いて候補文字の有効性を判定しているので、候補文
字数を少なくすることができると共に、正しい文字を上
位候補に入れ替えることができる。
【0086】なお、上記実施例の面積比テーブルメモリ
には、正規化後の文字画像が類似することによって誤認
識するような文字の面積比が格納されていたが、これに
限定されるものではなく、例えば、面積比テーブルメモ
リには、図51に示すように、認識の対象となる全ての
文字(英字、数字、漢字等)のそれぞれの標準の面積比
と面積比の有効範囲値を格納するようにしてもよい。あ
るいは、面積比テーブルメモリには、図52に示すよう
に、対象となる文字の標準の面積比のみを格納するよう
にし、類似文字判定部9において、テーブル参照時に読
みだされる標準の面積比に、予め定められた第1の定数
を掛けることによって面積比許容範囲上限値を得るよう
にし、標準の面積比に、予め定められた第2の定数を掛
けることによって面積比許容範囲下限値を得るようにし
てもよい。図53は、第1の定数を1.5とし、第2の
定数を0.5とした場合の面積比テーブルメモリから得
られる面積比許容範囲を示したものである。ただし、面
積比許容範囲上限値の計算値が1.0を越える場合は、
許容範囲上限値を1.0とする。
【0087】また、図52の面積比テーブルメモリの内
容を、認識対象となる全ての文字に拡張することもでき
る。さらに、面積比テーブルメモリには、図54に示す
ように、対象となる文字の標準の面積比のみを格納する
ようにし、類似文字判定部9において、テーブル参照時
に読みだされる標準の面積比に、予め定められた第1の
定数を足すことによって面積比許容範囲上限値を得るよ
うにし、標準の面積比から、予め定められた第2の定数
を引くことによって面積比許容範囲下限値を得るように
してもよい。図55は、第1の定数を0.2とし、第2
の定数を0.2とした場合の面積比テーブルメモリから
得られる面積比許容範囲を示したものである。ただし、
面積比許容範囲上限値の計算値が1.0を越える場合は
、許容範囲上限値を1.0とし、面積比許容範囲下限値
の計算値が0.0未満の値になる場合は、許容範囲下限
値を0.0とする。この図54に示す面積比テーブルメ
モリの内容を、認識対象となる全ての文字に拡張するこ
ともできる。
【0088】また、実施例1、2と同様に、実施例3の
構成に、単語辞書や単語間の接続情報等が格納されてい
る言語知識辞書メモリと、言語知識修正部とを付加し、
言語知識修正部が、認識結果メモリの内容について言語
知識辞書メモリを参照することによって、認識結果の修
正を行うように、構成を変更することも可能であり、あ
るいは、実施例3の構成に、認識結果メモリの内容をユ
ーザが修正するためのツールである結果修正エディタを
付加し、結果出力部に表示された認識結果を見ながら、
キーボード、マウス等によって誤認識文字を候補文字中
の正しい文字に入れ替えるようにしてもよい。さらに、
実施例3の構成に、これらの言語知識修正部、言語知識
辞書メモリ、そして結果修正エディタを付加して構成す
ることも可能である。
【0089】
【発明の効果】以上、説明したように、請求項1記載の
発明によれば、正規化前の文字の縦横比を用いて候補文
字の有効性を判定しているので、候補文字数を絞り込む
ことができ、後処理が高速化される。請求項2記載の発
明によれば、認識対象文字毎の標準の縦横比とその有効
範囲によって縦横比テーブルを構成しているので、類似
文字の判定処理を高速に行うことができる。請求項3記
載の発明によれば、縦横比テーブルが標準の縦横比のみ
によって構成されているので、小容量のメモリで構成す
ることが可能となる。請求項4記載の発明によれば、正
しい文字を上位候補に入れ替えているので、修正処理を
容易に行うことができる。
【0090】請求項5記載の発明によれば、正規化前の
文字の空白比を用いて候補文字の有効性を判定している
ので、候補文字数を絞り込むことができ、後処理が高速
化される。請求項6記載の発明によれば、認識対象文字
毎の標準の空白比とその有効範囲によって空白比テーブ
ルを構成しているので、類似文字の判定処理を高速に行
うことができる。請求項7記載の発明によれば、空白比
テーブルが標準の空白比のみによって構成されているの
で、小容量のメモリで構成することが可能となる。請求
項8記載の発明によれば、正しい文字を上位候補に入れ
替えているので、修正処理を容易に行うことができる。
【0091】請求項9記載の発明によれば、正規化前の
文字の面積比を用いて候補文字の有効性を判定している
ので、候補文字数を絞り込むことができ、後処理が高速
化される。請求項10記載の発明によれば、認識対象文
字毎の標準の面積比とその有効範囲によって面積比テー
ブルを構成しているので、類似文字の判定処理を高速に
行うことができる。請求項11記載の発明によれば、面
積比テーブルが標準の面積比のみによって構成されてい
るので、小容量のメモリで構成することが可能となる。 請求項12記載の発明によれば、正しい文字を上位候補
に入れ替えているので、修正処理を容易に行うことがで
きる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係るブロック構成図で
ある。
【図2】実施例1における認識結果が認識結果メモリに
格納された図である。
【図3】原文字画像を正規化した後の形状がほぼ同形に
なる、第1の例を示した図である。
【図4】原文字画像を正規化した後の形状がほぼ同形に
なる、第2の例を示した図である。
【図5】原文字画像を正規化した後の形状がほぼ同形に
なる、第3の例を示した図である。
【図6】(a)、(b)は、実施例1の縦横比テーブル
メモリの内容を示す図である。
【図7】実施例1の切り出し情報メモリの内容を示す図
である。
【図8】実施例1における類似文字判定の処理フローチ
ャートである。
【図9】実施例1の候補文字の判定結果をまとめて示し
た図である。
【図10】実施例1のソート前の候補文字を示す図であ
る。
【図11】実施例1のソート後の候補文字を示す図であ
る。
【図12】実施例1のソート前の認識結果メモリの内容
を示す図である。
【図13】実施例1のソート後の認識結果メモリの内容
を示す図である。
【図14】認識の対象となる全ての文字のそれぞれの標
準の縦横比値と縦横比値の有効範囲を格納した縦横比テ
ーブルメモリの他の実施例である。
【図15】対象となる文字の標準の縦横比値のみを格納
した縦横比テーブルメモリの更に他の実施例である。
【図16】第1の定数を0.5、第2の定数を2.0と
した場合の縦横比テーブルメモリから得られる縦横比許
容範囲を示した図である。
【図17】本発明の第2の実施例に係るブロック構成図
である。
【図18】実施例2における認識結果が認識結果メモリ
に格納された図である。
【図19】原文字画像を正規化した後の形状がほぼ同形
になる、第1の例を示した図である。
【図20】原文字画像を正規化した後の形状がほぼ同形
になる、第2の例を示した図である。
【図21】原文字画像を正規化した後の形状がほぼ同形
になる、第3の例を示した図である。
【図22】実施例2の空白比テーブルメモリの内容を示
す図である。
【図23】実施例2の切り出し情報メモリの内容を示す
図である。
【図24】実施例2における類似文字判定の処理フロー
チャートである。
【図25】実施例2の候補文字の判定結果をまとめて示
した図である。
【図26】実施例2の削除および書き換え処理前の認識
結果メモリの内容の一部を示す図である。
【図27】実施例2の削除および書き換え処理後の認識
結果メモリの内容の一部を示す図である。
【図28】実施例2の候補文字の判定結果をまとめて示
した図である。
【図29】実施例2のソート前の候補文字を示す図であ
る。
【図30】実施例2のソート後の候補文字を示す図であ
る。
【図31】実施例2のソート前の認識結果メモリの内容
を示す図である。
【図32】実施例2のソート後の認識結果メモリの内容
を示す図である。
【図33】認識の対象となる全ての文字のそれぞれの標
準の空白比値と空白比値の有効範囲を格納した空白比テ
ーブルメモリの他の実施例である。
【図34】対象となる文字の標準の空白比値のみを格納
した空白比テーブルメモリの更に他の実施例である。
【図35】第1の定数を1.5、第2の定数を0.5と
した場合の図34の空白比テーブルメモリから得られる
空白比許容範囲を示した図である。
【図36】対象となる文字の標準の空白比値のみを格納
した空白比テーブルメモリの更に他の実施例である。
【図37】第1の定数を0.2、第2の定数を0.2と
した場合の図36の空白比テーブルメモリから得られる
空白比許容範囲を示した図である。
【図38】縦書きの場合における空白比を説明するため
の図である。
【図39】本発明の第3の実施例に係るブロック構成図
である。
【図40】実施例3の面積比テーブルメモリの内容を示
す図である。
【図41】実施例3の切り出し情報メモリの内容を示す
図である。
【図42】実施例3における類似文字判定の処理フロー
チャートである。
【図43】実施例3の判定結果をまとめて示した図であ
る。
【図44】実施例3の削除および書き換え処理前の認識
結果メモリの内容の一部を示す図である。
【図45】実施例3の削除および書き換え処理後の認識
結果メモリの内容の一部を示す図である。
【図46】実施例3の候補文字の判定結果をまとめて示
した図である。
【図47】実施例3のソート前の候補文字を示す図であ
る。
【図48】実施例3のソート後の候補文字を示す図であ
る。
【図49】実施例3のソート前の認識結果メモリの内容
を示す図である。
【図50】実施例3のソート後の認識結果メモリの内容
を示す図である。
【図51】認識の対象となる全ての文字のそれぞれの標
準の面積比値と面積比値の有効範囲を格納した面積比テ
ーブルメモリの他の実施例である。
【図52】対象となる文字の標準の面積比値のみを格納
した面積比テーブルメモリの更に他の実施例である。
【図53】第1の定数を1.5、第2の定数を0.5と
した場合の図52の面積比テーブルメモリから得られる
面積比許容範囲を示した図である。
【図54】対象となる文字の標準の面積比値のみを格納
した面積比テーブルメモリの更に他の実施例である。
【図55】第1の定数を0.2、第2の定数を0.2と
した場合の図54の面積比テーブルメモリから得られる
面積比許容範囲を示した図である。
【符号の説明】
1  画像入力部 2  画像メモリ 3  行・文字切り出し部 4  文字画像メモリ 5  文字認識部 6  切り出し情報メモリ 7  文字辞書メモリ 8  認識結果メモリ 9  類似文字判定部 10  縦横比テーブルメモリ 11  結果出力部 12  空白比テーブルメモリ 13  面積比テーブルメモリ

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】  複数の認識結果候補から候補数を絞り
    込む文字認識方法において、認識結果候補文字によって
    、認識対象文字毎の縦横比が予め設定されたテーブルを
    参照し、該テーブルから読み出された認識結果候補文字
    の縦横比と認識対象文字の縦横比とを比較し、該比較結
    果が所定の閾値を越える認識結果候補文字を、前記複数
    の候補から削除することを特徴とする文字認識方法。
  2. 【請求項2】  前記テーブルには、認識対象文字毎の
    標準の縦横比および縦横比の有効範囲が設定され、認識
    対象文字の縦横比が、認識結果候補文字によって前記テ
    ーブルから読み出される縦横比の有効範囲外にあるとき
    、該候補文字を削除することを特徴とする請求項1記載
    の文字認識方法。
  3. 【請求項3】  前記テーブルには、認識対象文字毎の
    標準の縦横比が設定され、該標準の縦横比に所定の演算
    を行って前記有効範囲を生成することを特徴とする請求
    項2記載の文字認識方法。
  4. 【請求項4】  削除処理後の複数の認識結果候補文字
    に対して、認識対象文字の縦横比と、認識結果候補文字
    によって前記テーブルから読み出された縦横比との差の
    絶対値を算出し、該値の小さい順に、前記複数の認識結
    果候補文字を並べ換えることを特徴とする請求項1記載
    の文字認識方法。
  5. 【請求項5】  複数の認識結果候補から候補数を絞り
    込む文字認識方法において、認識結果候補文字によって
    、認識対象文字毎の空白比が予め設定されたテーブルを
    参照し、該テーブルから読み出された認識結果候補文字
    の空白比と認識対象文字の空白比とを比較し、該比較結
    果が所定の閾値を越える認識結果候補文字を、前記複数
    の候補から削除することを特徴とする文字認識方法。
  6. 【請求項6】前記テーブルには、認識対象文字毎の標準
    の空白比および空白比の有効範囲が設定され、認識対象
    文字の空白比が、認識結果候補文字によって前記テーブ
    ルから読み出される空白比の有効範囲外にあるとき、該
    候補文字を削除することを特徴とする請求項5記載の文
    字認識方法。
  7. 【請求項7】  前記テーブルには、認識対象文字毎の
    標準の空白比が設定され、該標準の空白比に所定の演算
    を行って前記有効範囲を生成することを特徴とする請求
    項6記載の文字認識方法。
  8. 【請求項8】  削除処理後の複数の認識結果候補文字
    に対して、認識対象文字の空白比と、認識結果候補文字
    によって前記テーブルから読み出された空白比との差の
    絶対値を算出し、該値の小さい順に、前記複数の認識結
    果候補文字を並べ換えることを特徴とする請求項5記載
    の文字認識方法。
  9. 【請求項9】  複数の認識結果候補から候補数を絞り
    込む文字認識方法において、認識結果候補文字によって
    、認識対象文字毎の面積比が予め設定されたテーブルを
    参照し、該テーブルから読み出された認識結果候補文字
    の面積比と認識対象文字の面積比とを比較し、該比較結
    果が所定の閾値を越える認識結果候補文字を、前記複数
    の候補から削除することを特徴とする文字認識方法。
  10. 【請求項10】前記テーブルには、認識対象文字毎の標
    準の面積比および面積比の有効範囲が設定され、認識対
    象文字の面積比が、認識結果候補文字によって前記テー
    ブルから読み出される面積比の有効範囲外にあるとき、
    該候補文字を削除することを特徴とする請求項9記載の
    文字認識方法。
  11. 【請求項11】  前記テーブルには、認識対象文字毎
    の標準の面積比が設定され、該標準の面積比に所定の演
    算を行って前記有効範囲を生成することを特徴とする請
    求項10記載の文字認識方法。
  12. 【請求項12】  削除処理後の複数の認識結果候補文
    字に対して、認識対象文字の面積比と、認識結果候補文
    字によって前記テーブルから読み出された面積比との差
    の絶対値を算出し、該値の小さい順に、前記複数の認識
    結果候補文字を並べ換えることを特徴とする請求項9記
    載の文字認識方法。
JP3176253A 1991-06-20 1991-06-20 文字認識方法 Pending JPH04372089A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3176253A JPH04372089A (ja) 1991-06-20 1991-06-20 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3176253A JPH04372089A (ja) 1991-06-20 1991-06-20 文字認識方法

Publications (1)

Publication Number Publication Date
JPH04372089A true JPH04372089A (ja) 1992-12-25

Family

ID=16010334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3176253A Pending JPH04372089A (ja) 1991-06-20 1991-06-20 文字認識方法

Country Status (1)

Country Link
JP (1) JPH04372089A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342471A (ja) * 1993-06-01 1994-12-13 Hiroshi Kuyama 図形等の形状特性解析方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342471A (ja) * 1993-06-01 1994-12-13 Hiroshi Kuyama 図形等の形状特性解析方法

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
JP2973944B2 (ja) 文書処理装置および文書処理方法
EP0439951B1 (en) Data processing
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
KR100412317B1 (ko) 문자인식/수정방법및장치
US6944344B2 (en) Document search and retrieval apparatus, recording medium and program
US20070140566A1 (en) Framework for detecting a structured handwritten object
JPH07200745A (ja) 少なくとも二つのイメージセクションの比較方法
JP3294995B2 (ja) 帳票読取装置
US7130487B1 (en) Searching method, searching device, and recorded medium
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JPH04372089A (ja) 文字認識方法
JP4087191B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JPH06215184A (ja) 抽出領域のラベリング装置
JP3812719B2 (ja) 文書検索装置
JP7404625B2 (ja) 情報処理装置、及びプログラム
JP7285018B2 (ja) プログラム、誤り文字検出装置及び誤り文字検出方法
JP3897999B2 (ja) 手書き文字認識方法
JP2976990B2 (ja) 文字認識装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JP3195405B2 (ja) 文字認識装置
JP2963474B2 (ja) 類似文字識別方法
JP3033904B2 (ja) 文字認識後処理方法
JP2002014981A (ja) 文書ファイリング装置