JP2624124B2 - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JP2624124B2
JP2624124B2 JP5165010A JP16501093A JP2624124B2 JP 2624124 B2 JP2624124 B2 JP 2624124B2 JP 5165010 A JP5165010 A JP 5165010A JP 16501093 A JP16501093 A JP 16501093A JP 2624124 B2 JP2624124 B2 JP 2624124B2
Authority
JP
Japan
Prior art keywords
character
unit
data
input
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5165010A
Other languages
English (en)
Other versions
JPH06348908A (ja
Inventor
大輔 西脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5165010A priority Critical patent/JP2624124B2/ja
Publication of JPH06348908A publication Critical patent/JPH06348908A/ja
Application granted granted Critical
Publication of JP2624124B2 publication Critical patent/JP2624124B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字を自動的に読み取る
文字認識装置および文字認識方法に関するものである。
【0002】
【従来の技術】従来の文字認識装置では、運用時に棄却
したパターンに対する特徴を認識辞書に追加登録する機
能を有し、オペレータの判断で追加が可能な構成になっ
ている。これにより、同一筆記者の記入文字に対して繰
り返し発生する棄却を抑制することを可能にしていると
同時に、変形文字など逆に登録不要なパターンの不用意
な追加を防いでいる。このように構成された文字認識装
置は例えば、特開昭58−106666号公報に開示さ
れている。
【0003】この動作の概略を図5に示すフローチャー
トを参照して説明する。入力されたパタンに対し特徴抽
出を行い(ステップ31,32)、既存の読み取り辞書
を参照し比較した結果、対応するものが読み取り辞書内
になく棄却された場合には(ステップ33,34)、そ
の棄却イメージを表示し(ステップ35)、正解をキー
入力する(ステップ36)と同時に、そのパタンを辞書
に追加することが必要と判断した場合(ステップ3
7)、つまり、今後もその字形を読ませたい場合にのみ
既存の読み取り辞書に追加登録する(ステップ38)よ
うな動作をする。
【0004】
【発明が解決しようとする課題】この従来の文字認識装
置では、予め登録されている認識辞書に対し、棄却パタ
ーンを追加することでそれまでに読めなかったパターン
を読み取ることが可能となるが、参照パターンの増加に
伴って必然的に類似パターンの登録が繰り返され、結果
的に、例えば、図3に示すような類似文字に対しては区
別が困難となり誤読が発生するという問題があった。
【0005】これは、上述の文字認識装置が棄却パター
ンの登録時に、同一筆記者は一般的に異なる字形を記入
しないという条件を考慮できないためで、これを実現す
るために必要とする筆記者の使用しない字形に対応する
読み取り辞書の参照を制限する機能を類似文字の組み合
わせを考慮して行っていないからに他ならない。本発明
はかかる問題を解決するためになされたもので、類似字
形の識別を考慮した、より高性能な文字認識装置および
文字認識方法を得ることを目的とする。
【0006】
【課題を解決するための手段】本発明の文字認識装置
は、入力文字パタンを電気信号に変換する光電変換手段
により得られた信号を格納する文字パタンメモリと、識
別結果を決定する際に識別に必要な特徴を入力文字パタ
ンより抽出する特徴抽出部と、この特徴抽出部で抽出し
た識別特徴を特徴データとして格納する特徴データ格納
部と、識別結果判定用に予め学習用の文字パタンより抽
出した各字種に対する標準特徴を標準データとして字種
と対にして格納し、一時的に特定の標準データの参照を
禁止することが可能な機能を有する識別辞書部と、類似
文字種の字種ならびに特徴を要素として有する類似文字
集合において、類似文字集合の要素となる文字種および
特徴データの識別辞書部における格納先を記憶する類似
文字テーブルと、特徴データ格納部に格納した入力文字
パタンより抽出した特徴データと識別辞書部に登録した
標準データとを比較し、識別辞書部より該当する標準デ
ータに対する字種を選択して出力する判定部と、識別辞
書部に登録した標準データのいずれにも該当しなかった
際に該当する入力文字パタンを表示する表示部と、この
表示部に表示した入力パタンに対する正しい読み取り結
果を入力するキー入力部と、文字パタンメモリ,特徴抽
出部,特徴データ格納部,識別辞書部,判定部,表示
部,キー入力部および類似文字テーブル各部間のデータ
を転送するデータバスと、文字パタンメモリ,特徴抽出
部,特徴データ格納部,識別辞書部,判定部,表示部,
キー入力部および類似文字テーブル各部の動作を制御す
る制御部によって構成され、判定部において判定した文
字種もしくはキー入力部より修正入力された文字種が類
似文字テーブルのいずれかの類似文字集合の要素として
登録されている場合、同テーブルに文字種と共に格納さ
れている特徴データの識別辞書部における格納位置より
対応する標準データを取り出し、この取り出した標準デ
ータと特徴データ格納部に格納されている入力パタンに
対する特徴データとの比較を行い、比較結果が同一でな
い場合、その字種を類似文字集合から一時的に削除する
と同時に、識別辞書部内のその字種に対する標準データ
の判別部における参照を一時的に禁止するようにする一
方、類似文字テーブルにおける類似文字集合からの字種
の削除ならびに判別部における識別辞書部の標準データ
の参照禁止を任意に解除し るようにしたものである。
また、入力文字パタンを電気信号に変換する光電変換手
段により得られた信号を格納する文字パタンメモリと、
識別結果を決定する際に識別に必要な特徴を入力文字パ
タンより抽出する特徴抽出部と、この特徴抽出部で抽出
した識別特徴を特徴データとして格納する特徴データ格
納部と、識別結果判定用に予め学習用の文字パタンより
抽出した各字種に対する標準特徴を標準データとして字
種と対にして格納し、一時的に特定の標準データの参照
を禁止することが可能な機能を有する識別辞書部と、類
似文字種の字種ならびに特徴を要素として有する類似文
字集合において、類似文字集合の要素となる文字種およ
特徴データの識別辞書部における格納先を記憶する類
似文字テーブルとを備え、文字パタンメモリに格納され
た入力文字パタンより抽出した特徴データと識別辞書部
に登録された標準データとを比較し、識別辞書部に該当
する標準データがあった場合にはその該当する標準デー
タに対する字種を選択して出力し、識別辞書部に登録さ
れた標準データのいずれにも該当しなかった場合には該
当する入力文字パタンを表示し、この表示した入力パタ
ンに対する正しい読み取り結果を入力させ、選択して出
力された文字種もしくは修正入力された文字種が類似文
字テーブルのいずれかの類似文字集合の要素として登録
されている場合、同テーブルに文字種と共に格納されて
いる特徴データの識別辞書部における格納位置より対応
する標準データを取り出し、この取り出した標準データ
と特徴データ格納部に格納されている入力パタンに対す
る特徴データとの比較を行い、比較結果が同一でないと
判断されたときは、識別辞書部内のその字種に対する標
準データの参照をこれ以降禁止して文字種識別の混同を
防止するようにしたものである。
【0007】
【作用】本発明においては、文字認識手段を備え、類似
文字の誤読を低減するため、類似文字のうち入力がない
と判断された時点で、対応する読み取り辞書の参照を選
択的に禁止することにより、類似文字のコンフュージョ
ンを抑え、誤読を低減する。
【0008】これについて詳記すれば、図3および図4
は本発明の文字認識装置の作用を説明するための説明図
である。そして、図3はそれぞれ類似文字の組み合わせ
であり、図3(a)は数字の「1と「7」,図3(b)
は数字の「1」と「2」の場合であり、文字種とその字
形が有する特徴データで構成されているとする。通常、
これらの字形を識別するのは困難であるが、筆記者がこ
れら類似文字の組み合わせの要素のうちいずれかの字形
は使用しないことが読み取り途中で判明すれば、その字
形の参照を読み取り辞書において禁止し、読み取り候補
から除外すれば類似文字に関する誤読はなくなる。
【0009】例えば、ある筆記者が数字の「7」に対し
て図4(a)のような字形を使うということが認識結果
よりわかれば、図3(a)に示される数字「7」と
「1」の類似文字の組み合わせに対し、筆記者が使用し
ない「7」の特徴の参照を読み取り辞書に対し禁止する
ようにすれば、以後、「1」と「7」の類似文字の問題
はなくなり、「1」と判定するようになる。
【0010】同様に、数字の「2」に対して図4(b)
のようなループのある字形を使うということが認識結果
よりわかれば、図3(b)で示される数字「1」と
「2」の類似文字の組み合わせに対し、筆記者が使用し
ない「2」の特徴の参照を読み取り辞書に対し禁止する
ようにすれば、以後「1」と「2」の類似文字の問題は
なくなり、「1」と判定するようになる。このように、
本発明によれば、読み取り辞書に対する特定字形の参照
禁止機能により、従来の技術では識別困難な類似文字の
識別が可能となる。
【0011】
【実施例】つぎに本発明について図面を参照して説明す
る。図1は本発明による文字認識装置の一実施例を示す
ブロック図である。この図1において、101は入力文
字パタンを電気信号に変換するスキャナ等の光電変換手
段により得られた光電変換信号11を格納する文字パタ
ンメモリ、201は識別結果を決定する際に識別に必要
な特徴を上記入力文字パタンより抽出する特徴抽出部、
102はこの特徴抽出部201で抽出した識別特徴を格
納する特徴データ格納部、103は識別結果判定用に予
め学習用の文字パタンより抽出した標準特徴を格納し、
一時的に特定の特徴データの参照を禁止することが可能
な機能を有する識別辞書部、202は類似文字の集合と
それらの各集合の要素の特徴データの識別辞書部103
における格納先を記憶する類似文字テーブルである。
【0012】203は特徴データ格納部102に格納し
た上記入力文字パタンより抽出した特徴データと識別辞
書部103に登録した標準特徴とを比較し、該当する標
準特徴を選択して判定する判定部、301は識別辞書部
103に登録した標準特徴のいずれにも該当しなかった
場合に該当する入力文字パタンを表示する表示部、40
1はこの表示部301に表示した入力パタンに対する正
しい読み取り結果を入力するキー入力部、601は文字
パタンメモリ101,特徴抽出部201,特徴データ格
納部102,認識辞書部103,判定部203,表示部
301,キー入力部401および類似文字テーブル20
2の各部間のデータを転送するデータバス、501は文
字パタンメモリ101,特徴抽出部201,特徴データ
格納部102,認識辞書部103,判定部203,表示
部301,キー入力部401および類似文字テーブル2
02の各部の動作を制御する制御部である。
【0013】そして、判定部203において判定した文
字種もしくはキー入力部401より修正入力された文字
種が類似文字テーブル202のいずれかの類似文字集合
の要素として登録されている場合に、登録されている特
徴データと特徴データ格納部102に格納されている入
力パタンに対する特徴データとの比較を行い、同一でな
い場合にその字種を類似文字集合から削除し、同時に識
別辞書中の参照を禁止するように構成されている。図2
は図1に示す文字認識手段における動作の一例を示すフ
ローチャートである。この図2において、各ステップ2
1〜27においてはそれぞれ所定の処理を実行する。
【0014】つぎに図1に示す実施例の動作を図2を参
照して説明する。まず、パタンが入力され(ステップ2
1)、文字パタンメモリ101に格納される。このとき
のパタン入力手段としてはCCDスキャナ等を用いれば
よい。つぎに特徴抽出部201において入力パタンに対
し、識別に必要な特徴を抽出し(ステップ22)、特徴
データ格納部102に格納する。ここで、特徴の種類と
しては、一般的に用いられている位置,方向,射影,密
度などまたはそれらの組み合わせなどを用いればよい。
続いて、この特徴データと識別辞書部103に登録され
ている標準パタンに対する特徴データとの比較を行い、
対応するものを検索しそれを識別結果として出力する。
【0015】このとき、識別辞書部103に該当するも
のがないと判断された場合には、表示部301にイメー
ジを表示し、正解をキー入力部401から入力する。こ
こで、表示部301としては通常の端末用表示装置とし
て使用されるCRTまたは液晶ディスプレイを使えばよ
く、表示するものとしてはイメージに限らず、候補とし
て上がったものも併せて表示してもよい。
【0016】つぎに、判定結果が判明した後(ステップ
23)、類似文字テーブル202を参照し(ステップ2
4)、判定結果と同一の文字種が、類似文字テーブル2
02内に登録されている類似文字集合内の要素として存
在するかどうかを調べる(ステップ25)。このとき、
登録されている場合、同テーブルに文字種と共に格納さ
れている識別情報の格納位置より、対応する特徴データ
を識別辞書部103より取り出して比較を行い同一でな
いと判断した場合には、識別辞書部103内にある特徴
データの参照をこれ以後禁止する。
【0017】ここで、識別辞書部103の特徴データの
参照を選択的に禁止する方法は、辞書にフラグを立て、
そのフラグの状態で判断すればよい。また、この例では
類似文字集合の特徴データは類似文字テーブル202に
はなく、かわりに識別辞書部103上での存在位置を指
定しているが、これら類似文字集合に属する字形の特徴
データは、類似文字テーブル202に直接格納してもよ
い。
【0018】そして、識別辞書部103の特徴データの
参照を禁止する条件としては、筆記者毎が適当である
が、処理単位毎,業務毎等必要に応じて変更できるよう
にしておけばよい。また、これら条件が初期化される毎
に、禁止フラグを解除してやればよい。
【0019】このように、本発明は、スキャナなどの光
電変換手段により電気信号に変換された入力文字パタン
の光電変換信号11は文字パタンメモリ101に転送さ
れ、制御部501のもとで、特徴抽出部201により特
徴抽出される。そして、特徴データ格納部102に格納
した後、認識対象の標準特徴を格納してある認識辞書部
103の内容との比較を判定部203によって行い、字
種を判定する際、該当するものがない場合には、入力パ
タンを表示部301に表示する。
【0020】つぎに、キー入力部401より正解を入力
し入力文字パタンに対し文字種が確定した後、類似文字
テーブル202を参照し、確定した文字種が類似文字テ
ーブル202内に存在する場合に、該当する特徴データ
を識別辞書部103より抽出して比較し、入力パタンに
対する特徴データと異なる場合に、識別辞書部103内
の特徴データの参照を選択的に禁止することにより、類
似文字のコンフュージョンを抑える。
【0021】
【発明の効果】以上説明したように本発明は、従来の文
字認識装置では困難であった識別辞書の特定字形に対す
る特徴データの参照を選択的に禁止するようにしたの
で、類似文字として考慮しなければならない字形を削減
し、類似文字に起因する誤読をなくすことができ、認識
精度を著しく向上することができるという効果を有す
る。
【図面の簡単な説明】
【図1】本発明による文字認識装置の一実施例を示すブ
ロック図である。
【図2】図1に示す文字認識手段における動作の一例を
示すフローチャートである。
【図3】本発明の文字認識装置の作用を説明するための
説明図である。
【図4】本発明の文字認識装置の作用を説明するための
説明図である。
【図5】従来の文字認識装置の動作を説明するためのフ
ローチャートである。
【符号の説明】
101 文字パタンメモリ 102 特徴データ格納部 103 識別辞書部 201 特徴抽出部 202 類似文字テーブル 203 判定部 301 表示部 401 キー入力部 501 制御部 601 データバス

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力文字パタンを電気信号に変換する光
    電変換手段により得られた信号を格納する文字パタンメ
    モリと、 識別結果を決定する際に識別に必要な特徴を前記入力文
    字パタンより抽出する特徴抽出部と、 この特徴抽出部で抽出した識別特徴を特徴データとして
    格納する特徴データ格納部と、 識別結果判定用に予め学習用の文字パタンより抽出した
    各字種に対する標準特徴を標準データとして字種と対に
    して格納し、一時的に特定の標準データの参照を禁止す
    ることが可能な機能を有する識別辞書部と、 類似文字種の字種ならびに特徴を要素として有する類似
    文字集合において、類似文字集合の要素となる文字種お
    よび特徴データの前記識別辞書部における格納先を記憶
    する類似文字テーブルと、 前記特徴データ格納部に格納した前記入力文字パタンよ
    り抽出した特徴データと前記識別辞書部に登録した標準
    データとを比較し、前記識別辞書部より該当する標準デ
    ータに対する字種を選択して出力する判定部と、 前記識別辞書部に登録した標準データのいずれにも該当
    しなかった際に該当する入力文字パタンを表示する表示
    部と、 この表示部に表示した入力パタンに対する正しい読み取
    り結果を入力するキー入力部と、 前記文字パタンメモリ,特徴抽出部,特徴データ格納
    部,識別辞書部,判定部,表示部,キー入力部および類
    似文字テーブル各部間のデータを転送するデータバス
    と、 前記文字パタンメモリ,特徴抽出部,特徴データ格納
    部,識別辞書部,判定部,表示部,キー入力部および類
    似文字テーブル各部の動作を制御する制御部によって構
    成され、 前記判定部において判定した文字種もしくは前記キー入
    力部より修正入力された文字種が前記類似文字テーブル
    のいずれかの類似文字集合の要素として登録されている
    場合、同テーブルに文字種と共に格納されている特徴デ
    ータの前記識別 辞書部における格納位置より対応する標
    準データを取り出し、この取り出した標準データと前記
    特徴データ格納部に格納されている入力パタンに対する
    特徴データとの比較を行い、比較結果が同一でない場
    合、その字種を類似文字集合から一時的に削除すると同
    時に、前記識別辞書部内のその字種に対する標準データ
    の前記判別部における参照を一時的に禁止するようにす
    る一方、 前記類似文字テーブルにおける類似文字集合からの字種
    の削除ならびに前記判別部における前記識別辞書部の標
    準データの参照禁止を任意に解除し得 るようにしたこと
    を特徴とする文字認識装置。
  2. 【請求項2】 入力文字パタンを電気信号に変換する光
    電変換手段により得られた信号を格納する文字パタンメ
    モリと、識別結果を決定する際に 識別に必要な特徴を前記入力文
    字パタンより抽出する特徴抽出部と、 この特徴抽出部で抽出した識別特徴を特徴データとして
    格納する特徴データ格納部と、識別結果判定用に 予め学習用の文字パタンより抽出した
    各字種に対する標準特徴を標準データとして字種と対に
    して格納し、一時的に特定の標準データの参照を禁止す
    ることが可能な機能を有する識別辞書部と、 類似文字種の字種ならびに特徴を要素として有する類似
    文字集合において、類似文字集合の要素となる文字種お
    よび特徴データの前記識別辞書部における格納先を記憶
    する類似文字テーブルとを備え、前記 文字パタンメモリに格納された入力文字パタンより
    抽出した特徴データと前記識別辞書部に登録された標準
    データとを比較し、前記識別辞書部に該当する標準データがあった場合には
    その該当する標準データに対する字種を選択して出力
    し、 前記識別辞書部に登録された標準データのいずれにも該
    当しなかった場合には該当する入力文字パタンを表示
    し、この表示した入力パタンに対する正しい読み取り結
    果を入力させ、 前記選択して出力された文字種もしくは前記修正入力さ
    れた文字種が前記類似 文字テーブルのいずれかの類似文
    字集合の要素として登録されている場合、同テーブルに
    文字種と共に格納されている特徴データの前記識別辞書
    部における格納位置より対応する標準データを取り出
    し、この取り出した標準データと前記特徴データ格納部
    に格納されている入力パタンに対する特徴データとの比
    較を行い、比較結果が同一でないと判断されたときは、
    前記識別辞書部内のその字種に対する標準データの参照
    をこれ以降禁止して文字種識別の 混同を防止することを
    特徴とする文字認識方法。
JP5165010A 1993-06-11 1993-06-11 文字認識装置および文字認識方法 Expired - Lifetime JP2624124B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5165010A JP2624124B2 (ja) 1993-06-11 1993-06-11 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5165010A JP2624124B2 (ja) 1993-06-11 1993-06-11 文字認識装置および文字認識方法

Publications (2)

Publication Number Publication Date
JPH06348908A JPH06348908A (ja) 1994-12-22
JP2624124B2 true JP2624124B2 (ja) 1997-06-25

Family

ID=15804132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5165010A Expired - Lifetime JP2624124B2 (ja) 1993-06-11 1993-06-11 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP2624124B2 (ja)

Also Published As

Publication number Publication date
JPH06348908A (ja) 1994-12-22

Similar Documents

Publication Publication Date Title
KR100339446B1 (ko) 주소 인식 장치 및 주소 인식 방법
US5748809A (en) Active area identification on a machine readable form using form landmarks
US6470336B1 (en) Document image search device and recording medium having document search program stored thereon
US5815704A (en) Document filing apparatus and method having document registration, comparison and retrieval capabilities
JP2005018678A (ja) 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム
JPH0721310A (ja) 文書認識装置
US6535652B2 (en) Image retrieval apparatus and method, and computer-readable memory therefor
EP1202213B1 (en) Document format identification apparatus and method
JP2624124B2 (ja) 文字認識装置および文字認識方法
US5854860A (en) Image filing apparatus having a character recognition function
JPH0291789A (ja) 文字認識方法
US6678427B1 (en) Document identification registration system
JPH11353317A (ja) 図面ファイリング装置、図面識別コード判別装置、図面ファイリングシステム、図面ファイリング方法及び図面識別コード判別方法
JPH07152856A (ja) 光学的文字読取装置
JPH10124610A (ja) 光学式文字読取装置
JP2000132635A (ja) 認識データ確認方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2746345B2 (ja) 文字認識の後処理方法
JP3006294B2 (ja) 光学的文字読取装置
JP3310063B2 (ja) 文書処理装置
JP2003115029A (ja) 帳票読取装置
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JP2002074269A (ja) 文字認識方法
JPH10154157A (ja) 電子ファイリングシステム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080411

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090411

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100411

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110411

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140411

Year of fee payment: 17

EXPY Cancellation because of completion of term