JPH07220030A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH07220030A
JPH07220030A JP6031822A JP3182294A JPH07220030A JP H07220030 A JPH07220030 A JP H07220030A JP 6031822 A JP6031822 A JP 6031822A JP 3182294 A JP3182294 A JP 3182294A JP H07220030 A JPH07220030 A JP H07220030A
Authority
JP
Japan
Prior art keywords
character
frequency
dictionary
determination
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6031822A
Other languages
English (en)
Inventor
Kenichirou Kishi
健一郎 木子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP6031822A priority Critical patent/JPH07220030A/ja
Publication of JPH07220030A publication Critical patent/JPH07220030A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 頻度の高い文字を専用の単純な特徴によって
処理の最初に分離することにより、高速に文字認識を行
なう文字認識装置を提供する。 【構成】 文書画像入力部1で入力された文書画像か
ら、前処理部2で文字画像が切り出され、正規化され
る。高頻度文字判定部3は、高頻度文字判定用辞書4を
用い、文字画像中の認識対象文字が高頻度文字か否かを
判定するための単純な特徴を抽出し、判定を行なう。判
定結果が高頻度文字であった場合には、高頻度文字識別
部5において、高頻度文字識別用辞書6を用いて、高頻
度文字中のどの文字であるかを特定する。判定結果が高
頻度文字でない場合には、一般特徴抽出部7で詳細な特
徴の抽出を行ない、大分類部8で大分類用辞書9を用い
て大分類し、詳細分類部10で詳細分類用辞書11を用
いて詳細分類を行なって、文字を特定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、紙等の媒体上に記録さ
れた文字を画像として取り込み、取り込んだ文字画像か
ら文字を認識する文字認識装置に関するものである。
【0002】
【従来の技術】従来の日本語の文字認識装置において
は、その文字種が非常に多く、形状も複雑であることか
ら、あらかじめ大まかな分類(大分類)を行なった後
に、詳細な分類によって文字を特定する方法が取られて
いる。しかし、このような手法を取る場合、大まかな特
徴であっても、すべての文字種との照合を行なうのは、
処理量の面から見てたいへん効率が悪い。
【0003】そこで、例えば、特開平1−136289
号公報、特開平1−241689号公報、特開平3−4
0186号公報等に示されているように、扱い得るすべ
ての文字種に関して一度に照合を行なうのではなく、文
字の出現頻度の高い順に分割した複数の辞書を用意し、
比較的使用頻度の高い文字からなる辞書から順に照合を
行なって、その結果正解とみなすことができる文字がな
い場合には、順次、出現頻度の低い文字からなる辞書と
の照合を行なう方法が提案されている。また、特開平4
−40186号公報に記載された文字認識装置において
は、出現頻度ごとの辞書の構成を可変とし、使用者の認
識させる文字の頻度に応じて、出現頻度の高い文字から
なる辞書を拡張できるようにしている。
【0004】図10は、従来の文字認識装置の動作を説
明するためのフローチャートである。S61において、
文書を光学的に読み取り、文書画像として入力する。S
62において、文書画像中から各文字画像を切り出す。
切り出した文字画像に対して、S63で正規化処理を行
ない、S64で特徴を抽出する。このとき、一般文字の
識別に必要な詳細な特徴の抽出が行なわれる。S65に
おいて、まず、高頻度文字用の辞書を選択し、S66で
照合を行なう。S67において、該当する文字があった
か否かを判定し、該当文字がない場合には、S68で頻
度の低い文字のための辞書に切り換え、S66で再度照
合を行なう。S67において該当する文字が見つかる
と、S69で認識結果を表示する。S70で認識対象文
字が残っているか否かを判定し、まだ認識していない文
字画像がある場合には、S63へ戻って次の文字画像の
認識を行なう。
【0005】しかしながら、このような従来の方法で
は、文字の出現頻度の多少とは関係なく、すべての辞書
との照合において用いられる特徴を予め抽出している。
実際には、特に頻度の高い文字では、平仮名等のように
構造が単純な文字である場合が多い。しかし、他の文字
と同様に、必要以上に冗長な特徴を抽出し、照合を行な
っており、全体の処理速度が遅くなるという問題を生じ
ていた。これらの問題は、従来の手法が、主に精度の向
上やメモリ領域の節約等を目的としているためであり、
処理速度は考慮されていないことに起因する。
【0006】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、特に頻度の高い文字を、専
用の単純な特徴によって処理の最初に分離することによ
り、高速に文字認識を行なう文字認識装置を提供するこ
とを目的とするものである。
【0007】
【課題を解決するための手段】本発明は、文字画像から
文字の特徴を求めて認識を行なう文字認識装置におい
て、使用頻度の高い高頻度文字を判定するために必要な
情報を格納する高頻度文字判定用辞書と、該高頻度文字
判定用辞書を用い前記高頻度文字を判定する高頻度文字
判定手段と、前記高頻度文字の識別を行なうために必要
な情報を格納する高頻度文字識別用辞書と、前記高頻度
文字判定手段における判定結果が高頻度文字であった場
合に前記高頻度文字識別用辞書を用いて文字を特定する
高頻度文字識別手段と、前記高頻度文字判定手段におけ
る判定結果が前記高頻度文字でない場合に詳細な特徴を
抽出し文字を特定する一般文字識別手段を有することを
特徴とするものである。
【0008】前記高頻度文字判定手段による高頻度文字
の判定には、一定以上の画素数を有する白画素塊が全白
画素数に占める割合を用いることができる。または、水
平および垂直方向に一定長以上連続する白画素の数が全
白画素数に占める割合を用いることをができる。あるい
は、高頻度文字の画像特徴を表わすテンプレートと認識
対象文字画像との演算の結果を用いることができる。こ
れらの判定方法は、適宜組み合わせて用いることができ
る。
【0009】
【作用】本発明によれば、高頻度文字判定手段により、
使用頻度の高い文字、すなわち、高頻度文字を分離す
る。このとき、専用の簡単な特徴のみによって高頻度文
字か否かを判定する。そして、高頻度文字は一般の文字
とは分離して、高頻度文字識別手段により複雑な特徴を
抽出せずに文字の認識を行なうことができる。その結
果、高頻度文字に対する認識が従来よりも高速に処理で
きるようになる。これらにより、文字認識の処理全体を
高速化することが可能となる。
【0010】また、高頻度文字の判定に、一定以上の画
素数の白画素塊が全白画素数に占める割合や、水平およ
び垂直方向に一定長以上の連続する白画素の数が全白画
素数に占める割合、あるいは、あらかじめ登録してある
高頻度文字の画像特徴を表すテンプレートと認識対象文
字画像との演算の結果を用いることにより、複雑な処理
を行なうことなく、高速な処理によって、構造が比較的
簡単な高頻度文字を分離することができる。これらの判
定手法を適宜組み合わせて用いることもでき、分離する
精度を向上することができる。
【0011】
【実施例】図1は、本発明の文字認識装置の一実施例の
構成図である。図中、1は文書画像入力部、2は前処理
部、3は高頻度文字判定部、4は高頻度文字判定用辞
書、5は高頻度文字識別部、6は高頻度文字識別用辞
書、7は一般特徴抽出部、8は大分類部、9は大分類用
辞書、10は詳細分類部、11は詳細分類用辞書、12
は制御部、13は操作・表示部である。
【0012】文書画像入力部1は、読取対象となる文字
の書かれた画像を入力する。この文書画像入力部1は、
例えば、一般的なイメージスキャナやファクシミリ等の
画像入力装置によって実現することができる。前処理部
2は、文書画像入力部1で入力された複数の文字からな
る文書画像から、個々の文字の画像を切り出すととも
に、切り出された文字画像の正規化を行なう。高頻度文
字判定部3は、高頻度文字か否かを判定するための特徴
を抽出し、それを用いて判定を行なう。高頻度文字判定
用辞書4には、高頻度文字判定部3において判定の基準
として使用する情報が格納されている。高頻度文字識別
部5は、高頻度文字判定部3による判定結果が高頻度文
字であった場合に、高頻度文字中のどの文字であるかを
識別する。高頻度文字識別用辞書6は、高頻度文字識別
部5における識別に用いる情報が格納されている。一般
特徴抽出部7は、高頻度文字判定部3による判定結果が
高頻度文字でない場合に、従来の手法により文字認識を
行なうための特徴を抽出する。大分類部8は、一般特徴
抽出部7により抽出された特徴を用いて大分類を行な
う。大分類用辞書9は、大分類部8で用いる情報が格納
されている。詳細分類部10は、大分類部8によって分
類された候補の中から認識結果を特定する。詳細分類用
辞書11は、詳細分類部10で用いる情報が格納されて
いる。制御部12は、全体の処理とデータの制御を行な
う。操作・表示部13は、認識のための操作および認識
結果の表示・出力を行なう。
【0013】上述の前処理部2、高頻度文字判定部3、
高頻度文字識別部5、一般特徴抽出部7、大分類部8、
詳細分類部10、制御部12の各部は、ハードウェア等
で構成することもできるが、それぞれ各部の機能を達成
するためのソフトウェア(プログラム)で構成すること
も可能である。例えば、中央処理装置が各部の機能を達
成するプログラムを実行するように構成すればよい。
【0014】図2は、図1で説明した本発明の文字認識
装置の一実施例における全体の動作の一例を説明するた
めのフローチャートである。はじめに、S21におい
て、認識対象となる文字が記された文書画像が、スキャ
ナ等からなる文書画像入力部1によって読み込まれる。
読み込まれた画像は、前処理部2において、S22で個
々の文字に切り出され、S23で正規化が行なわれる。
正規化された文字画像は高頻度文字判定部3へと送られ
る。
【0015】高頻度文字判定部3では、S24におい
て、高頻度文字か否かを判定するために必要な簡単な特
徴を抽出し、これを用いて認識対象画像が高頻度文字か
どうかを判定する。高頻度文字の判定方法については、
後で詳しく説明する。
【0016】S25において、高頻度文字判定部3で高
頻度文字であると判定された場合、S26で、高頻度文
字識別部5において高頻度文字の中のどの文字であるか
を特定する。識別に使用する特徴は、一般の文字認識で
用いられるものと同様のものとすることも可能である
が、高頻度文字として分離された文字のカテゴリ数は少
ないので、特徴の次元数を減らすことによって、より高
速な識別を行なうことが可能である。識別結果は、操作
・表示部13に送られ、S30において、認識結果とし
て表示される。
【0017】S25において、高頻度文字判定部3で高
頻度文字でないと判定された場合、従来と同様の手法に
より、文字認識を行なう。まず、S27において、一般
特徴抽出部7で高頻度でない一般の文字を認識するため
の特徴を抽出する。この特徴は、従来の文字認識で一般
に用いられているものと同様のもので構わない。次に、
S28において、大分類部8で、一般特徴抽出部7によ
り抽出された特徴と大分類用辞書9とを照合して大分類
を行ない、候補数をある程度の数まで減らす。大分類で
得られた候補は、S29において、詳細分類部10で、
より詳細な特徴を基に詳細分類用辞書11との照合を行
ない、認識結果を決定する。識別結果は操作・表示部1
−9に送られ、S30において、認識結果として表示さ
れる。
【0018】S31において、認識処理の行なわれてい
ない認識対象文字があるか否かが判定され、次の認識対
象文字がある場合には、S23に戻り、処理が繰り返し
行なわれる。全ての文字を認識した時点で処理を終了す
る。
【0019】図3は、高頻度文字の判定処理の一例を説
明するためのフローチャート、図4は、認識対象文字の
正規化画像の一例の説明図、図5は、水平方向の一定長
以上白画素が連続する部分の一例の説明図、図6は、垂
直方向の一定長以上白画素が連続する部分の一例の説明
図、図7は、一定以上の画素数を有する白画素塊の一例
の説明図、図8は、二値のテンプレートの一例の説明
図、図9は、多値のテンプレートの一例の説明図であ
る。
【0020】高頻度文字は、平仮名等のように、構成が
単純で、正規化された画像において白画素の占める割合
が比較的多く、連続する白画素の面積が大きいという性
質がある。このような性質を簡単に抽出する特徴量とし
て、この例では、水平および垂直方向に一定長以上連続
する白画素の画素数と全白画素数の比、一定以上の画素
数の白画素塊と全白画素数の比、及び、高頻度文字画像
の形状を代表させたテンプレートと文字画像との演算値
を用いる。
【0021】いま、文書画像入力部1で入力された文書
画像から、前処理部2で切り出され、正規化されて、図
4に示すような認識対象文字の正規化画像が得られたと
する。まず、S41において、文字画像から、水平及び
垂直方向に一定長以上の白画素が連続する部分の白画素
の数を求め、文字画像全体の白画素の数との比率を求め
る。特徴量としては、水平又は垂直方向に一定長以上白
画素が連続する部分の白画素数を文字画像全体の白画素
数で割った値を用いる。
【0022】例えば、図4に示した認識対象文字の正規
化画像では、一定長を6画素とすれば、図5にハッチン
グを施して示した部分が、水平方向に6画素以上の白画
素が連続している部分である。図4に示した画像の白画
素の数は、170であり、図5にハッチングを施して示
した部分の白画素の数は54である。すなわち、水平方
向の特徴量の値は、54/170=0.318と求めら
れる。また、垂直方向についても同様に一定長を6画素
とすれば、図6にハッチングを施して示した部分が、垂
直方向に6画素以上の白画素が連続している部分であ
る。この部分の白画素の数は131である。垂直方向の
特徴量の値は、131/170=0.771となる。
【0023】このようにして求められた水平方向および
垂直方向の特徴量の値は、S42において、高頻度文字
判定用辞書4に格納されている判定の基準値と比較さ
れ、基準値の範囲内であれば、認識対象文字は高頻度文
字の可能性が高いものと判定し、S43以降の判定を続
ける。
【0024】S43では、文字画像から一定以上の画素
数の白画素塊を抽出し、その白画素塊内の白画素数と全
白画素数の比を求める。特徴量としては、白画素塊内の
白画素数を全白画素数で割った値を用いる。例えば、白
画素塊の白画素数の閾値を20以上とした場合には、図
7でハッチングを施して示した部分が白画素塊として抽
出される。図7の例では、白画素塊は2つあり、白画素
塊内の白画素数は、128である。全白画素数は170
であるから、この特徴量は128/170=0.753
である。
【0025】このようにして求められた白画素塊に関す
る特徴量の値は、S44において、高頻度文字判定用辞
書4に格納されている判定の基準値と比較され、基準値
の範囲内であれば、認識対象文字は高頻度文字の可能性
が高いものとして判定し、S45の判定を続ける。
【0026】S41やS43において高頻度文字として
分離された文字の中には、構造は単純であっても高頻度
ではない文字が含まれている場合がある。そこで、S4
5では、高頻度文字のみをさらに精度良く分離する方法
として、テンプレートを用いる。ここでいうテンプレー
トとは、高頻度文字のみの文字画像を重ね合わせて、特
に高頻度文字画像の形状を代表させたものである。テン
プレートは2値または多値からなり、高頻度文字におい
て黒となりやすい画素には大きな値、逆に白になりやす
い画素は小さな値となるように作成する。例えば、図8
に示した2値のテンプレートの場合には、黒となりやす
い画素に1、白になりやすい画素には0を割り当てる。
また、例えば、図9に示したような、多値のテンプレー
トの場合には、黒画素及び白画素のなりやすさに応じ
て、画素ごとの値を設定する。テンプレートは、想定す
る高頻度文字の数に応じて、複数のものを用いることが
できる。
【0027】S45では、文字画像の各画素と、あらか
じめ作成しておいたテンプレートの対応する画素の値と
を比較して、高頻度文字か否かの評価値を算出する。具
体的には、例えば、二値のテンプレートを用いる場合、
文字画像の画素とテンプレートの画素とで、画素値(1
または0)が一致した場合には、その画素にプラスの評
価値を与える。逆に、不一致の場合には、その画素にマ
イナスの評価値を与える。多値のテンプレートを用いる
場合には、例えば、文字画像の画素値が1の時には、テ
ンプレートに示されている画素の値に応じてプラスの評
価を与え、画素値が0の時には、テンプレートに示され
ている画素の値に応じてマイナスの評価値を与える。も
ちろん、プラスの評価値、マイナスの評価値のみを用い
てもよい。
【0028】S46では、こうして得られた各画素ごと
の評価値の合計と、高頻度文字判定部辞書4に格納され
ている基準値とを比較する。そして、基準値の範囲内で
あれば、S48で認識対象文字を高頻度文字であると判
定し、S50で高頻度文字としての識別処理が行なわれ
る。S42、S44、S46において、それぞれの特徴
量または評価値が基準値の範囲内でない場合には、S4
7で認識対象文字を高頻度文字でないものと判定し、S
49において、従来の手法によって認識を行なう。
【0029】図3では、S41、S43、S45におい
て、それぞれの手法により高頻度文字か否かを判定して
いる。このように3つの手法を組合わせて用いることに
より、高頻度文字を分離する精度をより向上させてい
る。しかし、上述の3種類の手法は、それぞれ単独で用
いることも可能であり、または2つを組み合わせて構成
することもできる。
【0030】高頻度文字判定部3で抽出した特徴は、高
頻度文字識別部5で用いることができる。また、大分類
部8、詳細分類部10において用いることももちろん可
能であり、その場合には、一般特徴抽出部7では高頻度
文字判定部3で抽出した特徴を抽出する必要はない。
【0031】上述の実施例では、高頻度文字以外の文字
の認識を大分類部8及び詳細分類部10により、2段階
の認識を行なっているが、これに限らず、1段の認識部
により構成したり、さらに多段の認識処理を行なっても
よい。認識手法は、従来から用いられている種々の手法
を適用することができる。
【0032】
【発明の効果】以上の説明から明らかなように、本発明
によれば、頻度の高い文字のみを専用の簡単な特徴によ
って分離し、識別するようにしたので、高頻度文字に対
する認識を従来よりも高速に処理することが可能になる
という効果がある。
【図面の簡単な説明】
【図1】 本発明の文字認識装置の一実施例の構成図で
ある。
【図2】 本発明の文字認識装置の一実施例における全
体の動作の一例を説明するためのフローチャートであ
る。
【図3】 高頻度文字の判定処理の一例を説明するため
のフローチャートである。
【図4】 認識対象文字の正規化画像の一例の説明図で
ある。
【図5】 水平方向の一定長以上白画素が連続する部分
の一例の説明図である。
【図6】 垂直方向の一定長以上白画素が連続する部分
の一例の説明図である。
【図7】 一定以上の画素数を有する白画素塊の一例の
説明図である。
【図8】 二値のテンプレートの一例の説明図である。
【図9】 多値のテンプレートの一例の説明図である。
【図10】 従来の文字認識装置の動作を説明するため
のフローチャートである。
【符号の説明】
1…文書画像入力部、2…前処理部、3…高頻度文字判
定部、4…高頻度文字判定用辞書、5…高頻度文字識別
部、6…高頻度文字識別用辞書、7…一般特徴抽出部、
8…大分類部、9…大分類用辞書、10…詳細分類部、
11…詳細分類用辞書、12…制御部、13…操作・表
示部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文字画像から文字の特徴を求めて認識を
    行なう文字認識装置において、使用頻度の高い高頻度文
    字を判定するために必要な情報を格納する高頻度文字判
    定用辞書と、該高頻度文字判定用辞書を用い前記高頻度
    文字を判定する高頻度文字判定手段と、前記高頻度文字
    の識別を行なうために必要な情報を格納する高頻度文字
    識別用辞書と、前記高頻度文字判定手段における判定結
    果が高頻度文字であった場合に前記高頻度文字識別用辞
    書を用いて文字を特定する高頻度文字識別手段と、前記
    高頻度文字判定手段における判定結果が前記高頻度文字
    でない場合に詳細な特徴を抽出し文字を特定する一般文
    字識別手段を有することを特徴とする文字認識装置。
  2. 【請求項2】 前記高頻度文字判定手段による高頻度文
    字の判定に、一定以上の画素数を有する白画素塊が全白
    画素数に占める割合を用いることを特徴とする請求項1
    に記載の文字認識装置。
  3. 【請求項3】 前記高頻度文字判定手段による高頻度文
    字の判定に、水平および垂直方向に一定長以上連続する
    白画素の数が全白画素数に占める割合を用いることを特
    徴とする請求項1に記載の文字認識装置。
  4. 【請求項4】 前記高頻度文字判定手段による高頻度文
    字の判定に、高頻度文字の画像特徴を表わすテンプレー
    トと認識対象文字画像との演算の結果を用いることを特
    徴とする請求項1に記載の文字認識装置。
JP6031822A 1994-02-02 1994-02-02 文字認識装置 Pending JPH07220030A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6031822A JPH07220030A (ja) 1994-02-02 1994-02-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6031822A JPH07220030A (ja) 1994-02-02 1994-02-02 文字認識装置

Publications (1)

Publication Number Publication Date
JPH07220030A true JPH07220030A (ja) 1995-08-18

Family

ID=12341785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6031822A Pending JPH07220030A (ja) 1994-02-02 1994-02-02 文字認識装置

Country Status (1)

Country Link
JP (1) JPH07220030A (ja)

Similar Documents

Publication Publication Date Title
US7519226B2 (en) Form search apparatus and method
US6006240A (en) Cell identification in table analysis
KR100249055B1 (ko) 문자인식장치및방법
JPH07160822A (ja) パターン認識方法
JPH07220030A (ja) 文字認識装置
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2001092924A (ja) パターン認識方法および装置
JPS63269267A (ja) 文字認識方法
JPH04130979A (ja) 文字画像切出し方法
JP2963474B2 (ja) 類似文字識別方法
JPH0795336B2 (ja) 文字認識方式
JP2000082113A (ja) 文字認識装置および辞書作成方法および記録媒体
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JP3116453B2 (ja) 英文字認識装置
JPH10334190A (ja) 文字認識方法、装置および記録媒体
JPH05189604A (ja) 光学的文字読取装置
JPH08202830A (ja) 文字認識システム
JP2000048124A (ja) 文字認識方法、記録媒体、及び、文字認識装置
JPH0792819B2 (ja) パターン切出しおよび認識方法とそのシステム
JPH0256085A (ja) 文字認識の後処理方法
JP2000040123A (ja) 文字認識方法及び文字認識プログラムを記録した媒体
JPH10198763A (ja) 文字認識装置およびコンピュータを文字認識装置として機能させるプログラムを格納したコンピュータが読取可能な記憶媒体
JPH04280392A (ja) 文字認識方式
JPH07262313A (ja) 光学式文字読取方法及び装置
JPH05233877A (ja) 単語読み取り方法