JP2886690B2 - 光学的文字読取装置における文字認識方法 - Google Patents

光学的文字読取装置における文字認識方法

Info

Publication number
JP2886690B2
JP2886690B2 JP2403609A JP40360990A JP2886690B2 JP 2886690 B2 JP2886690 B2 JP 2886690B2 JP 2403609 A JP2403609 A JP 2403609A JP 40360990 A JP40360990 A JP 40360990A JP 2886690 B2 JP2886690 B2 JP 2886690B2
Authority
JP
Japan
Prior art keywords
character
character type
field
read
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2403609A
Other languages
English (en)
Other versions
JPH04218885A (ja
Inventor
彰三 門田
歳弘 花野井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2403609A priority Critical patent/JP2886690B2/ja
Publication of JPH04218885A publication Critical patent/JPH04218885A/ja
Application granted granted Critical
Publication of JP2886690B2 publication Critical patent/JP2886690B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は光学的文字読取装置にお
ける文字認識方法にかかり、特に読取対象とする文字種
が多数にわたる場合に、読取精度の向上と読取速度の向
上を図るのに好適な光学的文字読取装置における文字認
識方法に関する。
【0002】
【従来の技術】従来の光学的文字読取装置において、多
数の文字種の書かれた帳票を読み取るためには、特公昭
59−52473号公報に記載されているように、文字
種選択機能を用いて、フィールドごとの文字種を制限
し、できるだけ精度を上げるようにしていた。たとえ
ば、図11に示す帳票20を読み取る場合には、以下の
ようになる。図11において、フィールドは21,2
2,23の三つに分かれており、フィールド21は数字
“0”“1”“2”のみ、フィールド22には英数字の
み、フィールド23には英字のみしか書かれていないこ
とがわかっている。そこで、あらかじめ図12に示すよ
うな文字種表を作っておく。図12には3種類の文字種
a,b,cが定義されている。文字種aは、カテゴリ
“0”“1”“2”のみ、文字種bは数字“0”〜
“9”、文字種cは英字“A”〜“Z”であるとする。
【0003】フィールド21を読み取る時には文字種a
のみを使用すれば“0”〜“2”が読み取れ、フィール
ド22を読み取る時には文字種b,cを使用すれば英数
字が読み取れ、フィールド23を読み取る時には文字種
cを使用すれば英字のみが読み取れる。
【0004】このように、フィールドごとに文字種を制
限することにより、マッチングする標準パターンの数を
減らすことが可能になり、処理速度、認識精度ともに向
上させることができる。
【0005】
【発明が解決しようとする課題】従来の光学的文字読取
装置において、上記したように文字種を定義するために
は、帳票を読み取る前に、あらかじめ読取制御パラメー
タを作成し、その中で文字種表とフィールドとの対応付
けを行っていた。
【0006】ここで、文字種に含まれる文字数が数字や
英字等のように少ない時は、キーボードから入力するこ
とができたが、漢字を読むようになると文字種に含まれ
る文字数が2000字以上にもなり、とうてい一字一字
キーボードから入力することは不可能である。
【0007】本発明は、かかる従来技術の問題点に鑑み
なされたもので、文字種内の文字数が多数存在する場合
においても、文字種選択機能の利用を可能にすることを
目的としている。
【0008】
【課題を解決するための手段】本発明の光学的文字読取
装置における文字認識方法は、光電変換手段によって現
在読み取りを行っているフィールドを指示するフィール
ド信号に基づいて、フィールド毎に該フィールドに書か
れる可能性のある文字種を定めた文字種指定マスク表を
用いて、該フィールドに対応する文字種指定マスクを定
め、さらに各文字種について、カテゴリ毎に当該文字種
が使用されるか否かを定めた文字種選択表を用いて、上
記カテゴリに対応する文字種選択信号を形成し、上記文
字種指定マスクと文字種選択信号の論理積をとり、その
結果に基づいて標準パターンとのマッチングの実行また
は中止、またはを指示することを特徴としている。
【0009】また、上記文字種選択表は、各カラム位置
対応に設けるようにしてもよいし、上記論理積の結果に
基づいて、マッチングの結果得られた候補文字の選択を
行うようにしてもよい。
【0010】なお、上記文字種選択表は、光学的文字読
取装置が有している単語辞書から容易に作成できる。
【0011】
【作用】すなわち、本発明によれば、前記した文字種指
定マスクと文字種選択信号の論理積をとり、その結果に
基づいて標準パターンとのマッチングの実行または中止
等を指示するため、無駄なマッチング処理を行うことが
なくなり、読取速度及び読取精度の向上を図ることがで
きる。
【0012】また、文字種指定マスクと文字種選択信号
の論理積をとり、その結果に基づいて行われる候補文字
の選択は、マッチングの結果得られた候補文字について
行われる。この場合、論理積の結果により候補文字中の
カテゴリが文字種選択されていないと判定された場合、
その候補順位を下げることにより、文字種選択されてい
るカテゴリだけが候補文字の上位を占めるようにするこ
とができる。
【0013】なお、漢字を読み取ることが可能な光学的
文字読取装置は、一般に読取精度を向上させるために、
単語辞書を具備している。この単語辞書は、読み取った
結果と単語を比較照合して、最も合った単語を出力する
ために使用されている。そして、上記単語辞書に乗って
いない文字は認識される必要がないため、この単語辞書
から作成された文字種選択表で十分なのである。
【0014】
【実施例】以下、添付の図面に示す実施例により、更に
詳細に本発明について説明する。まず最初に、本発明に
おいて用いられる帳票と文字種表と文字種選択表と文字
種指定マスク表について説明する。
【0015】図1に示すように、帳票30にはフィール
ドが3つあり、フィールド31には数字“0”“1”
“2”だけが書かれ、フィールド32には英数字だけが
書かれ、フィールド33には漢字だけが書かれるものと
する。ただし、フィールド33には、都道府県名が書か
れるものであり、光学的文字読取装置には都道府県名辞
書(ファイル名F1)があらかじめ準備されているもの
とする。
【0016】次に、図2に示すように、文字種表を定義
する。文字種a〜cは、図12に示したものと同じであ
る。文字種dは、文字種a〜cと異なり、ファイル名F
1によって表示されている。ファイル名を示すために、
先頭に“&”マークを付加している。ここで、ファイル
名F1は前記したように都道府県名の入っている都道府
県名辞書を意味している。
【0017】図2に示す文字種表に基づいて、図3に示
す文字種選択表と図5に示す文字種指定マスク表を作成
する。文字種選択表は、図3に示すように、光学的文字
読取装置において使用される全ての標準パターンと一対
一で対応している。それぞれのカテゴリは文字種a,
b,c,dに対応するフラグを有しており、文字種内に
そのカテゴリが含まれていればフラグが“1”に設定さ
れる。文字種aは数字“0”“1”“2”しか使用しな
いため、“0”“1”“2”だけが“1”で他の全ての
カテゴリは“0”である。文字種b,cについても対応
する数字と英字のカテゴリのみフラグが“1”になって
いる。
【0018】文字種dの場合には、次のようにして作成
される。あらかじめ、全てのカテゴリのフラグをオフに
しておく。次に、図2に示す文字種表にはファイル名を
示す“&”とファイル名F1が格納されているため、フ
ァイル名F1の示す都道府県名辞書内の全ての単語辞書
をロードする。次に、単語に含まれる文字から文字種の
一覧表を作成する。この文字種の一覧表から、文字種a
〜cと同様にして文字種選択表を作成する。このような
文字種選択表は、光学的文字読取装置において、辞書か
ら容易に作成することができる。
【0019】フィールド毎にどの文字種を使用するかを
指定することにより、文字種指定マスク表が作成され
る。文字種指定マスク表は、図4に示すような構成にな
っている。フィールド31では文字種aだけが使用され
るため、“1000”のマスクが作成される。フィール
ド32では文字種b,cだけが使用されるため、“01
10”のマスクが作成される。フィールド33では文字
種dだけが使用されるため、“0001”のマスクが作
成させる。このような文字種指定マスクは、光学的文字
読取装置において、容易に作成することができる。
【0020】次に、上記した文字種選択表と文字種指定
マスクを用いて、標準パターンと未知パターンのマッチ
ング回数を制限し、処理の高速化を図る場合について説
明する。図5は本発明の一実施例を示すブロック図であ
る。図5に示す実施例において、1は光電変換手段であ
り、帳票を光学的に走査し帳票イメージをメモリに取り
込む。2はフィールド抽出手段であり、光電変換手段1
の出力及びあらかじめ定められている読み取り制御パラ
メータから与えられたフィールド位置情報に基づいて、
現在読取を行っているフィールドを同定する。このフィ
ールド抽出手段2は読み取りの対象となっているフィー
ルドを示すフィールド指示信号6を出力する。3は1文
字切出手段であり、フィールド中の文字を一文字ずつ切
り出す。4は特徴抽出手段であり、1文字切出手段3か
ら出力される文字パタンの特徴抽出を行う。5は判定手
段であり、標準パタンメモリ14に記憶されている多数
の標準パタンを一つずつ取り出し、特徴抽出手段4によ
って特徴抽出された未知パタンの特徴とマッチングをと
り、最も似かよっている標準パタンについてそのカテゴ
リを出力する。7は文字種指定マスク選択手段であり、
フィールド抽出手段2から出力されたフィールド指示信
号6をアドレスとして用いて、文字種指定マスクメモリ
8に格納されている文字種指定マスクを読み出して文字
種指定マスク信号9を出力する。ここで、文字種指定マ
スクメモリ8は、図4に示す文字種指定マスク表を記憶
しているものとする。10は文字種選択機能部である。
この文字種選択機能部10は、標準パターンメモリ14
から出力されるカテゴリ指示信号13に基づいて、文字
種選択メモリ11をアクセスする。ここで、文字種選択
メモリ11は、図3に示す文字種選択表を記憶している
ものとする。文字種選択機能部10は、文字種選択メモ
リ11から上記カテゴリに対応する文字種選択信号を読
み出し、次に文字種指定マスク選択手段7から出力され
る文字種指定マスク信号9と読み出した文字種選択信号
15の間で論理積をとる。論理積をとった結果“1”が
得られた場合、文字種選択機能部10は選択信号12を
“1”として出力し、判定手段5に対して標準パターン
メモリ14から出力されている標準パターンと特徴抽出
手段4から出力されている未知パタンの間の判定処理を
実行を指示する。また、論理積をとった結果“0”が得
られた場合、文字種選択機能部10は選択信号12を
“0”として出力し、判定手段5に対して標準パターン
メモリ14から出力されている標準パターンと特徴抽出
手段4から出力されている未知パタンの間の判定処理の
中止を指示する。
【0021】図5に示す実施例において、帳票上の文字
の読み取りは、次のように行われる。以下の説明では、
図1に示す帳票30を図2に示す文字種表に基づいて読
み取る場合を例にしてついて説明する。また、文字種選
択表は図3に示すように作成され、文字種指定マスク表
は図4に示すように作成されているものとする。
【0022】光電変換手段1が帳票30を走査すること
によって得られたパターンは、図示しないメモリに格納
され、その後フィールド抽出手段2が現在読取を行って
いるフィールドの抽出を行う。フィールド抽出手段2
は、抽出されたフィールドのフィールド指示信号6を出
力する。例えば、図1に示すフィールド31が読取の対
象になっている場合には、フィールド指示信号6として
f31が出力される。同様に、フィールド32,33が
読取の対象になっている場合には、それぞれフィールド
指示信号6としてf31,f32が出力されるのもとす
る。
【0023】文字種指定マスク選択手段7は、上記フィ
ールド指示信号6に基づいて、文字種指定マスクメモリ
8から当該フィールド指示信号6に対応する文字種指定
マスクを読み出して、文字種指定マスク信号9を出力す
る。この動作と並行して、1文字切出手段3は、フィー
ルド中の文字を1文字ずつ切り出す。その後、特徴抽出
手段4は、切出された1文字について特徴抽出を行い、
判定手段5に出力する。 次に、文字種選択機能部10
は、標準パターンメモリ14から出力されるカテゴリ指
示信号13に基づいて、文字種選択メモリ11をアクセ
スし、上記カテゴリ指示信号13に対応する文字種選択
表のデータを文字種選択信号15として読み出す。そし
て、次に文字種指定マスク選択手段7から出力される文
字種指定マスク信号9と読み出した文字種選択信号15
の間で論理積をとる。すなわち、標準パターンと文字種
選択表は一対一に対応付けられているので、どの標準パ
ターンを使用すれば良いかは、文字選択信号15と文字
種指定マスク信号9の論理積を取ることによって求めら
れる。たとえば、カテゴリ“0”では、図3に示す文字
種選択表の内容は“1100”であり、フィールド31
における文字種指定マスク“1000”と論理積をとる
と“1000”となり、結果が“0”以外であるので、
文字種選択機能部10は選択信号12として“1”を出
力する。したがって、この場合には、判定手段5は、標
準パターンメモリ14から出力されるカテゴリ“0”の
標準パターンと特徴抽出手段4から出力される未知パタ
ーンのマッチングをとる。また、カテゴリ“3”以上の
標準パターンでは、上記論理積は“0000”となり、
結果が“0”のため、文字種選択機能部10は選択信号
12として“0”を出力する。したがって、この場合に
は、判定手段5は、マッチングを行わない。
【0024】以上の例では、文字種選択表のすべてのカ
テゴリについて、初めから終わり論理積をとることによ
り、当該標準パターンによいるマッチング実行の可否を
決定した。しかし、例えば数字しか読まないことが分か
っているのに、すべてのカテゴリについて、論理積をと
ってマッチング実行の可否を決定するのは不経済であ
る。このような場合には、次のようにすることにより、
調べる範囲を限定することができる。
【0025】すなわち、あらかじめ、数字、英字、仮
名、漢字等のカテゴリ群別に、文字種選択表と同様な表
(カテゴリ群選択表と名付ける)を作成しておく。カテ
ゴリ群選択表は、カテゴリ群中に含まれるカテゴリの文
字種選択表の論理和をとることによって作成される。カ
テゴリ群の選択は、カテゴリの選択の場合と同じよう
に、カテゴリ群選択表と文字種選択マスクとの論理積を
とることによって行われる。たとえば、数字カテゴリ群
とマスクの論理積が1であれば、数字が使用されること
がわかり、0であれば数字は使用されないことがわか
る。同様に英字、仮名、漢字等の各カテゴリ群の使用可
否を決め、使用すべきカテゴリのみ文字種選択をすれば
他のカテゴリとの整合チェックをすることなく、処理の
高速化が図れる。図6に上記カテゴリ群選択表の一例を
示す。
【0026】図7は、本発明の他の一実施例を示すブロ
ック図である。図7に示す実施例が図1に示す実施例と
異なっている点は、1文字切り出し手段3からカラム位
置信号16が出力され、このカラム位置信号16が文字
種選択機能10に入力されている点である。ここで、カ
ラム位置信号16は、フィールド内における文字位置を
示すものである。カラム位置信号16は、前記した文字
種選択表において、書かれた文字の位置情報を利用し、
より効率的なマッチングを行うために使用される。
【0027】図8はカラム位置ごとの文字種選択表の一
例示す。図9において、カラムは1からnまであること
にする。ここで、nは単語の最大長により決まる。以下
の例では、単語辞書は都道府県名辞書であると仮定す
る。最初に、単語辞書からカラム1に出現するカテゴリ
だけを集めてカテゴリ一覧表を作成する。すなわち、都
道府県名のカラム1に出現するカテゴリは、東京都の
“東”、神奈川県の“神”など数十種類に限定される。
このカテゴリ一覧表を使用して、カラム1用の文字種選
択表を作成する。図8に示す文字種選択表K1はカラム
1用の文字種選択表の一例である。同様にして、カラム
2からカラムnにそれぞれ出現するカテゴリのみを集め
てカテゴリ一覧表を作成し、図8に示すように、カラム
2からカラムnの文字種選択表K2〜Knを作成する。
【0028】図8に示すカラム位置ごとの文字種選択表
K1〜Knは、以下のようにして使用される。すなわ
ち、図8に示す光電変換手段1により帳票を走査し、帳
票イメージを図示しないメモリ上に取り込む。フィール
ド抽出手段2は読取パラメータに示されたフィールド位
置情報から現在読取対象となっているフィールドを抽出
し、フィールド指示信号6を文字種指定マスク選択手段
7に出力する。1文字切り出し手段3は、フィールド抽
出手段2から出力される帳票イメージから1文字ずつ文
字を切り出し、特徴抽出手段4に出力する。特徴抽出手
段4は、一文字の特徴抽出を行い、判定手段5に出力す
る。
【0029】一方、フィールド抽出手段2により出力さ
れたフィールド指示信号6により、文字種指定マスク選
択手段7は文字種指定マスクメモリ8をアクセスする。
そして、文字種指定マスク選択手段7は、文字種指定マ
スクメモリ8から読み出した文字種指定マスク信号9を
出力する。文字種選択機能10は、1文字切り出し手段
3より出力されたカラム位置信号16により、文字種選
択メモリ中のカラム位置に対応する文字種選択表(K1
〜Knの1つ)を選び、さらに標準パタンメモリ14よ
り出力されたカテゴリ指示信号13に基づいて上記選ば
れた文字種選択表をアクセスして、文字種選択信号15
と文字種選択マスク信号9との論理積を求める。もし、
論理積が“0”でなければ選択信号12みよりその標準
パタンは選択され、“0”であれば選択されない。判定
手段5は、選択された標準パターンとのみ、特徴抽出手
段4から出力される未知パターンとマッチングをとるこ
とにより、最も類似したカテゴリを答えとして出力す
る。
【0030】以上の説明から明らかなように、単語辞書
を利用すると、全体としてのカテゴリの使用/非使用情
報のみならず、カラム位置ごとのカテゴリの使用/非使
用状況を知ることができる。また、カラム位置ごとに使
用されるカテゴリの種類が異なるので、カラム位置ごと
に文字種を選択することにより、読取精度はさらに向上
する。
【0031】図9は本発明の他の実施例を示すブロック
図である。図9に示す実施例が図1に示す実施例と異な
っている点は、候補選択手段17が判定手段5の後段に
設けられ、図1においては判定手段5に入力されている
文字種選択信号12が候補選択手段17に入力される点
である。
【0032】一般に、単語照合を行う場合、単語辞書の
中に帳票上に書かれる単語が完全に含まれている場合に
は、かなり精度良く認識することができる。しかし、単
語辞書が不備で、帳票上に書かれた単語が辞書中に存在
しない場合には、誤って単語が照合されるため、認識精
度が低下することがある。図1に示す認識方式において
も同様に、単語辞書に含まれていないカテゴリはマッチ
ングするべき標準パターンがスキップされてしまうた
め、正解が候補にあがってこない。図9に示す実施例
は、このような場合に適用されるものである。
【0033】すなわち、図9の実施例に示すように、判
定手段5は全てのカテゴリについて未知パターンと標準
パターンのマッチングを行い、文字種選択はマッチング
の結果得られた候補文字について候補選択手段17にお
いて行うようにする。図9においては、マッチングの結
果得られた複数の候補カテゴリのうちの上位からあらか
じめ定められた数の候補カテゴリが、候補選択手段17
により候補文字メモリ18に記憶される。ここで、候補
選択手段17は、選択信号12により候補文字中のカテ
ゴリが文字種選択されていないと判定した場合、その候
補順位を下げることにより、文字種選択されているカテ
ゴリだけが上位を占めるようにすることができる。図9
に示す実施例においては、単語辞書にないカテゴリがフ
ィールドに書かれた場合、上位には上がらないが候補文
字中から削除されることなく、候補文字中に含まれてい
るため、候補文字表示及び選択の処理により認識するこ
とができ、確実に誤読を防止できる。
【0034】本発明の他の実施例を以下に示す。単語辞
書に単語の出現頻度が含まれている場合には、単語の出
現頻度を利用すれば、さらに認識精度を向上させること
ができる。未知パタンと標準パタンの類字度をS、カテ
ゴリの出現頻度をhとすると、出現頻度を考慮に入れた
評価関数rは、次の数1又は数2で表される。
【0035】
【数1】
【0036】
【数2】
【0037】数1、数2から明らかなように、出現頻度
hの大きいカテゴリは、評価値rが大きくなり、認識さ
れやすくなる。
【0038】単語辞書からカテゴリの出現頻度hを求め
るためには、以下のようにする。カテゴリiがk個の単
語中に含まれていたとすると、出現頻度h(i)は次の
数3で定義される。
【0039】
【数3】
【0040】単語の出現頻度が単語辞書中に具備されて
いる場合には、以下のようにする。カテゴリiが単語
1、単語2、…単語kに含まれており、それぞれの単語
の出現頻度はT1,T2,…Tkであったとする。カテ
ゴリiの出現頻度h(i)は
【0041】
【数4】
【0042】で定義される。
【0043】このように定義された出現頻度は、図10
に示すように、文字種選択表の中に入れておく。図10
に示す例では、出現頻度は0〜10の10ランクに分け
られ、最も出現頻度の高いものを10とした。また、0
はその文字が選択されていないことを示す。
【0044】与えられたカテゴリの文字種選択表と文字
種指定マスクを比較し、文字種指定マスクの“1”の立
っている文字種の出現頻度を見る。すべての文字種で出
現頻度が0であると、そのカテゴリは使用されない。ど
れかの文字種で出現頻度が0以外であれば、そのカテゴ
リは使用される。複数の文字種で出現頻度が0でない場
合には、その中で最も大きな値を用いて、評価値rを計
算する。
【0045】上記出現頻度は、図1、図5、図7に示さ
れた実施例のみならず、図9に示す実施例においても適
用することができる。すなわち、図9に示す実施例にお
いては、文字種選択機能部10と候補選択手段17にお
いて、各候補文字毎に出現頻度を求め、最も大きな出現
頻度順に候補の順位付けを変更するか、あるいは評価値
rの大きさによって候補の順位付けを行うことにより、
出現頻度の大きい文字を上位にもって行くことができ
る。
【0046】なお、今までの説明では、単語辞書を用い
て説明してきたが、必ずしも単語辞書を用いないで文字
選択表を作成することが可能である。すなわち、1文字
ずつ使用すべき文字を、1文字単語(複数の文字から得
られる単語ではなく、1文字だけで構成される単語)と
して、単語辞書と同一の形式で作成したものを使用すれ
ば、上記実施例と同様の効果が得られる。
【0047】以上の説明から明らかなように、上記実施
例によれば、次のような効果が得られる。
【0048】選択された標準パターンだけ使用してマッ
チングするため、認識精度・認識速度ともに向上する。
【0049】文字種選択表は単語辞書から自動的に構成
されるため、文字種選択表を入力するためのキーイン作
業は不要である。
【0050】文字種選択表は単語辞書から自動的に構成
されるため、カラム位置を考慮に入れた文字種選択表を
も作成することができる。
【0051】単語辞書に単語出現頻度が入っている場合
には、カテゴリごとの出現頻度を利用した認識結果が得
られる。
【0052】単語辞書が完備していない場合には、図9
に示すように、選択信号による文字種選択の機能を候補
選択機能に取り入れることにより、認識精度を向上し、
かつ容易に修正することを可能にすることができる。
【0053】
【発明の効果】本発明によれば、以上説明したように構
成されているため、以下に記載されているような効果を
有する。
【0054】文字種内の文字数が多数存在する場合にお
いても、文字種選択機能の利用が可能になるため、認識
精度と認識速度がともに向上する効果がある。
【図面の簡単な説明】
【図1】帳票の一例を示す説明図。
【図2】文字種表の一例を示す説明図。
【図3】文字種選択表の一例を示す説明図。
【図4】文字種指定マスク表の一例を示す説明図。
【図5】本発明の実施例を示すブロック図。
【図6】カテゴリ群選択表の一例を示す説明図。
【図7】本発明の他の実施例を示すブロック図。
【図8】カラム位置毎に作成された文字種選択表の一例
示す説明図。
【図9】本発明の他の実施例を示すブロック図。
【図10】単語の出現頻度を考慮した文字種選択表の一
例を示す説明図。
【図11】帳票の一例を示す説明図。
【図12】文字種表の一例を示す説明図。
【符号の説明】
1 光電変換手段 2 フィールド抽出手段 3 1文字切出手段 4 特徴抽出手段 5 判定手段 6 フィールド指示信号 7 文字種指定マスク選択手段 8 文字種指定マスクメモリ 9 文字種指定マスク信号 10 文字種選択機能部 11 文字種選択メモリ 12 選択信号 13 カテゴリ指示信号 14 標準パターンメモリ 15 文字種選択信号 16 カラム位置信号 17 候補選択手段 18 候補文字メモリ

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】帳票上に設けられたフィールド内に記入さ
    れた文字を読み取り、現在読み取りを行っている帳票上
    のフィールドを同定し、読み取った文字を一文字ずつ切
    り出し、切り出された文字と標準パタ−ンとのマッチン
    グをとる文字認識手段と、上記標準パーターンを記憶し
    ており、上記文字認識手段に対して各カテゴリに対応す
    る標準パターンを順次読み出す標準パターンメモリとを
    備えた光学的文字読取装置において、上記文字認識手段
    から出力される現在読み取りを行っているフィールドを
    指示するフィールド指示信号に基づいて、フィールド毎
    に該フィールドに書かれる可能性のある文字種を定めた
    文字種指定マスク表から該フィールドに対応する文字種
    指定マスクを示す文字種指定マスク信号を形成し、さら
    に、各文字種について、カテゴリ毎に当該文字種が使用
    されるか否かを定めた文字種選択表から上記カテゴリに
    対応する文字種選択信号を形成し、上記文字種指定マス
    ク信号と文字種選択信号の論理積をとり、その結果に基
    づいて、上記文字認識手段に対して、標準パターンとの
    マッチングの実行または中止を指示することを特徴とす
    る光学的文字読取装置における文字認識方法。
  2. 【請求項2】帳票上に設けられたフィールド内に記入さ
    れた文字を読み取り、現在読み取りを行っている帳票上
    のフィールドを同定し、読み取った文字を一文字ずつ切
    り出して各読み取り文字のカラム位置を同定し、さらに
    切り出された文字と標準パタ−ンとのマッチングをとる
    文字認識手段と、上記標準パーターンを記憶しており、
    上記文字認識手段に対して各カテゴリに対応する標準パ
    ターンを順次読み出す標準パターンメモリとを備えた光
    学的文字読取装置において、上記文字認識手段から出力
    される現在読み取りを行っているフィールドを指示する
    フィールド指示信号に基づいて、フィールド毎に該フィ
    ールドに書かれる可能性のある文字種を定めた文字種指
    定マスク表から該フィールドに対応する文字種指定マス
    クを示す文字種指定マスク信号を形成し、さらに、各文
    字種について、カテゴリ毎に当該文字種が使用されるか
    否かを定めた文字種選択表を各カラム位置対応に設け、
    上記カラム位置対応に設けられた文字種選択表から上記
    カテゴリ及びカラム位置に対応する文字種選択信号を形
    成し、上記文字種指定マスク信号と文字種選択信号の論
    理積をとり、その結果に基づいて、上記文字認識手段に
    対して、標準パターンとのマッチングの実行または中止
    を指示することを特徴とする光学的文字読取装置におけ
    る文字認識方法。
  3. 【請求項3】帳票上に設けられたフィールド内に記入さ
    れた文字を読み取り、現在読み取りを行っている帳票上
    のフィールドを同定し、読み取った文字を一文字ずつ切
    り出し、切り出された文字と標準パタ−ンとのマッチン
    グをとり、候補文字を選択して出力する文字認識手段
    と、上記標準パーターンを記憶しており、上記文字認識
    手段に対して各カテゴリに対応する標準パターンを順次
    読み出す標準パターンメモリとを備えた光学的文字読取
    装置において、上記文字認識手段から出力される現在読
    み取りを行っているフィールドを指示するフィールド指
    示信号に基づいて、フィールド毎に該フィールドに書か
    れる可能性のある文字種を定めた文字種指定マスク表か
    ら該フィールドに対応する文字種指定マスク示す文字種
    指定マスク信号を形成し、さらに、各文字種について、
    カテゴリ毎に当該文字種が使用されるか否かを定めた文
    字種選択表から上記カテゴリに対応する文字種選択信号
    を形成し、上記文字種指定マスク信号と文字種選択信号
    の論理積をとり、その結果に応じて上記文字認識手段が
    候補文字の選択を行うことを特徴とする光学的文字読取
    装置における文字認識方法。
JP2403609A 1990-12-19 1990-12-19 光学的文字読取装置における文字認識方法 Expired - Lifetime JP2886690B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2403609A JP2886690B2 (ja) 1990-12-19 1990-12-19 光学的文字読取装置における文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2403609A JP2886690B2 (ja) 1990-12-19 1990-12-19 光学的文字読取装置における文字認識方法

Publications (2)

Publication Number Publication Date
JPH04218885A JPH04218885A (ja) 1992-08-10
JP2886690B2 true JP2886690B2 (ja) 1999-04-26

Family

ID=18513339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2403609A Expired - Lifetime JP2886690B2 (ja) 1990-12-19 1990-12-19 光学的文字読取装置における文字認識方法

Country Status (1)

Country Link
JP (1) JP2886690B2 (ja)

Also Published As

Publication number Publication date
JPH04218885A (ja) 1992-08-10

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
US5579408A (en) Character recognition method and apparatus
KR100412317B1 (ko) 문자인식/수정방법및장치
US5890182A (en) Sentence processing method and apparatus
KR970049402A (ko) 화상 처리 방법과 장치, 및 기억 매체
JP2886690B2 (ja) 光学的文字読取装置における文字認識方法
JP4054453B2 (ja) 文字認識装置およびプログラム記録媒体
JPH0247788B2 (ja)
JP7527574B2 (ja) 情報処理装置、及びプログラム
JPH0452509B2 (ja)
JP4922030B2 (ja) 文字列検索装置、方法及びプログラム
JPH01106263A (ja) 文書の格納検索装置
JPH07117961B2 (ja) 文献データ登録方法
KR100473660B1 (ko) 단어인식방법
JP2890241B2 (ja) 光学的文字認識装置
JPS6368989A (ja) 文書読み取り装置
JPH11120294A (ja) 文字認識装置および媒体
JPS63188284A (ja) 文字読取装置
JP2957211B2 (ja) 日本語文書校正支援装置
JPH0528323A (ja) 文字認識装置
JPH0922441A (ja) 光学文字読取装置
JPH02136970A (ja) 英単語検索装置
JPH06139403A (ja) 文字修正方法
JPH08147416A (ja) 情報処理方法
JPH02130693A (ja) 個人用認識辞書作成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080212

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090212

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090212

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100212

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100212

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110212

Year of fee payment: 12

EXPY Cancellation because of completion of term