JP2839515B2 - 文字読取システム - Google Patents

文字読取システム

Info

Publication number
JP2839515B2
JP2839515B2 JP63322320A JP32232088A JP2839515B2 JP 2839515 B2 JP2839515 B2 JP 2839515B2 JP 63322320 A JP63322320 A JP 63322320A JP 32232088 A JP32232088 A JP 32232088A JP 2839515 B2 JP2839515 B2 JP 2839515B2
Authority
JP
Japan
Prior art keywords
character
candidate
similar
output
candidate character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63322320A
Other languages
English (en)
Other versions
JPH02166584A (ja
Inventor
究 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63322320A priority Critical patent/JP2839515B2/ja
Publication of JPH02166584A publication Critical patent/JPH02166584A/ja
Application granted granted Critical
Publication of JP2839515B2 publication Critical patent/JP2839515B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、文字認識処理の結果得られた出力候補文字
の列をもとに最終的な文字読取結果を決定する文字読取
システムに関する。
(従来の技術) 一般に、文字読取装置において、文字認識精度の向上
の有力な方法として、文字認識処理によって得られた出
力候補文字の列に対して、予め設定された出力候補であ
る単語が格納された単語辞書との照合を行なうことによ
って最終的な読取結果を決定する後処理が用いられてい
る。この後処理は、地名、人名、法人名等のように帳票
に記録される文字列の内容が予めある程度明らかになっ
ている場合、これらの文字列(単語)群により構成され
る辞書を予め設定しておき、この辞書と帳票に対して文
字認識処理を行なった結果得られる出力候補文字列とを
照合することによって、出力候補文字列との類似度が最
も高い文字列を辞書から選択し、これを最終的な文字読
取結果とするものである。
(発明が解決しようとする課題) しかしながら、帳票に記録される文字列を、後処理の
対象とする単語に分類できない場合がある。例えば、住
所を記録する帳票においては、地名部分は単語として扱
うことができるが、何丁目何番地の部分は意味的に正当
な単語として扱うことができない。このために、何丁目
何番地のような不確定な数字を含む部分については、後
処理を行なうことが困難となっている。したがって、後
処理を行なうことができない部分の文字読取率が低下し
てしまうという問題があった。
本発明は前記のような点に鑑みてなされたもので、意
味的に単語として扱えない文字列に対しても後処理を行
ない、文字読取率を向上させることが可能な文字読取シ
ステムを提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、帳票の文字記入領域への記入が許される記
入候補文字(以下、単に記入文字と称する)と当該文字
に形状が類似した少なくとも1つの類似候補文字との組
が、複数の記入文字について格納される類似候補文字格
納手段と、文字認識処理によって得られた出力候補文字
が、認識処理の対象となった文字記入領域への記入が許
される記入文字の群に含まれていない場合に、当該出力
候補文字と一致する類似候補文字を前記類似候補文字格
納手段を参照して検索する候補文字検索手段とを備え、
この候補文字検索手段によって前記出力候補文字と一致
する類似候補文字が検索された場合に、この類似候補文
字と同一組の記入文字を前記出力候補文字に代えて最終
的な文字読取結果として出力するように構成するもので
ある。
(作用) このようにして構成される文字読取システムにおいて
は、意味的に単語として扱えない部分、例えば住所にお
ける何丁目何番地のような不確定な数字が含まれる文字
列部分については、文字認識処理を行なった結果得られ
た出力候補文字が、認識処理の対象となった文字記入領
域への記入が許される記入文字の群に含まれない場合
に、出力候補文字と対応する記入文字を類似候補文字格
納手段から取り出され、出力候補文字に代えて出力され
る。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。
第1図は同実施例に係わる文字読取システムの構成を示
すブロック図である。同図において、文字読取部11は、
帳票に設けられた文字読取処理の対象とする文字記入領
域(以下、読取フィールドと称する)内に記録された文
字について1文字毎に文字認識処理を行ない、各文字に
対して例えば第3位までの候補文字を候補文字処理部12
に出力する。候補文字処理部12は、文字読取部11から出
力された候補文字から、読取フィールド毎に記入が許さ
れる記入文字(例えば、特定の文字種)の指定等に従っ
て出力候補文字を決定し、後処理部13に出力する。後処
理部13は、通常の単語単位で行なう後処理と異なる処理
を行なうことが指定された読取フィールドについて、こ
の読取フィールド内に記入された文字に対する文字認識
結果を対象として、類似候補文字テーブル14(類似候補
文字格納手段)を用いて後処理を行なう。なお、後処理
部13は、通常の後処理(単語として扱うことができる出
力候補文字列についての後処理)も行なうが、このため
の機能ブロックは図示していない。類似候補文字テーブ
ル14は、文字記入領域への記入が許される記入文字とこ
の記入文字に形状が類似した少なくとも1つの類似候補
文字との組が、複数の記入文字について格納されてい
る。また、類似候補文字テーブル14内の記入文字は、読
取フィールドの記入が許される記入文字の群(例えば文
字種)毎に分類されて格納されている。出力部15は、表
示器等からなり、後処理部13によって後処理が施された
最終的な文字読取結果を出力するものである。
次に、同実施例の動作を説明する。
ここでは、読取処理の対象とする帳票には、何丁目何
番地何号の部分を含む住所が記録されるものとし、例え
ば「××区」,「××町」,「×丁目×番地×号」の部
分がそれぞれ記録される読取フィールドが設けられてい
る。
なお、帳票の文字読取処理を行なう前に、「×丁目×
番号×号」以外の部分に対しては通常の単語単位での後
処理を行ない、「×丁目×番地×号」の部分に対応する
文字列が記録される読取フィールドについては、類似候
補文字テーブル14を用いた後処理を行なうように設定さ
れているものとする。また、それぞれの読取フィールド
について、指定文字種(記入が許される記入文字の群)
が指定されているものとする。同実施例においては、
「×丁目×番地×号」の部分が記録される読取フィール
ドに対して、アラビア数字、及び接続記号が指定されて
いるものとする。これによって、第2図に示すような類
似候補文字テーブル14から、認識処理の対象となった読
取フィールドへの記入が許される記入文字の群を指定す
ることができる。第2図は、住所「×丁目×番地×号」
が記録される読取フィールドについて後処理を行なう際
に用いられる類似候補文字テーブル14の構成を示すもの
である。なお、類似候補文字テーブル14を用いた後処理
を行なうことが指定されなかった読取フィールドについ
ては、各読取フィールドに対応する単語群により構成さ
れる辞書(図示せず)を用いて周知の後処理が行なわれ
る。
まず、文字読取部11は、帳票に設けられた各読取フィ
ールド内に記録された文字の認識処理を行なう。ここで
は、第3図に示すような文字列が記録された読取フィー
ルドについての文字読取処理が行なわれるものとする。
文字列「×××町」が記録された読取フィールドについ
ては、「×××町」が単語として扱えることから通常の
単語単位での後処理が行なわれる。一方、文字列「1−
2−34」が記録された読取フィールド(「×丁目×番号
×号」の部分に対応する)に対しては、類似候補文字テ
ーブル14を用いた後処理を行なうことが指定される。文
字読取部11が、帳票に記録された文字列1−2−34」の
各文字について文字認識処理を行なった結果、第4図に
示すように、各文字について第3位までの候補が得られ
たものとする。文字読取部11は、文字認識処理によって
得られた各文字について第3位までの文字情報を候補文
字処理部12に出力する。候補文字処理部12は、文字読取
部11において得られた第3位までの候補文字から、読取
フィールドに対する指定文字種(アラビア数字,接続記
号)に基づいて、出力候補文字を選択する。すなわち、
文字列「1−2−34」の各文字について得られた第3位
までの候補文字から、指定文字種に含まれる候補順位が
高い文字を出力候補文字として選択する。ただし、指定
文字種に含まれる候補文字が得られなかった場合には、
候補順位が高いものが出力候補文字として選択される。
これにより、候補文字処理部12は、第5図に示すような
出力候補文字列「1−2−ヨチ」を選択し、後処理部13
に出力する。
ここで、後処理部13における類似候補文字テーブル14
を用いた後処理の動作を第6図に示すフローチャートを
参照しながら説明する。まず、後処理部13は、候補文字
処理部12から「×丁目×番地×号」の部分の文字列が記
入される読取フィールドにおける出力候補文字列、すな
わち「1−2−ヨチ」の文字データを入力する(ステッ
プS1)。後処理部13は、入力した出力候補文字列データ
から、指定文字種(アラビア数字,接続記号)以外の文
字データを順次検索する(ステップS2)。この結果、出
力候補文字列「1−2−」の部分については指定文字種
に含まれる文字データであると判断され、出力候補文字
の第5文字「ヨ」はステップS3において指定文字種以外
の文字であると判断される。後処理部13は、指定文字種
以外の出力候補文字(記入が許される記入文字の群に含
まれない文字)があると、指定文字種以外の出力候補文
字「ヨ」と一致する類似候補文字を、第2図に示す類似
候補文字テーブル14の類似候補文字群から検索する(ス
テップS4)。この結果、第7図に示すように、記入文字
「3」と同一組の類似候補文字群中に出力候補文字と同
一の類似候補文字「ヨ」が求められる(ステップS5)。
後処理部13は、類似候補文字テーブル14の類似候補文字
「ヨ」と同一組の記入文字「3」を取出して出力候補文
字「ヨ」と置換する。同様にして、出力候補文字の第6
文字「チ」も、指定文字種と異なるために類似候補文字
テーブルの類似候補文字群から検索される(ステップS
3,S4)。第7図に示すように、記入文字「4」と同一組
の類似候補文字群中に出力候補文字「チ」と同一の類似
候補文字が求められる(ステップS5)。したがって、後
処理部13は、類似候補文字テーブル14の類似候補文字
「チ」と同一組の記入文字「4」を取出して出力候補文
字「チ」と置換する。こうして、後処理部13は、出力候
補文字列「1−2−ヨチ」の各文字について検索が終了
すると(ステップS7)、出力候補文字「ヨチ」を、記入
文字「34」に置換した文字列(第8図)の文字データを
最終的な文字読取結果として出力部15に出力する(ステ
ップS8)。
また、ステップS5において、指定文字種と異なる出力
候補文字が、類似候補テーブル14の類似候補文字群中に
存在しなかった場合、この出力候補文字は、誤読された
ものと判断され出力候補文字の文字データを誤読したこ
とを示すリジェクトデータに置換される。
なお、前記実施例においては、予め読取フィールドに
対して通常の単語単位の後処理を行なうか、または類似
候補テーブル14を用いた後処理を行なうか指定するよう
にしているが、全ての読取フィールドに対して単語単位
での後処理を行ない、その結果、十分に信頼できる読取
結果が得られなかった場合に、本発明による後処理を行
なうようにしても良い。
[発明の効果] 以上のように本発明によれば、帳票の読取フィールド
内に記録される文字列が意味的に単語として扱えない場
合であっても、文字認識処理によって得られる出力候補
文字をもとにした後処理を行なうことができるので、帳
票に記録された文字の読取率を向上させることが可能と
なるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる文字読取システムの
構成を示すブロック図、第2図は同実施例に用いられる
類似候補文字テーブルの内容を示す図、第3図は文字読
取処理の対象とする読取フィールドに記録された文字を
示す図、第4図は文字認識処理によって得られた候補文
字を示す図、第5図は出力候補文字を示す図、第6図は
後処理部における後処理の手順を示すフローチャート、
第7図は第2図に示す類似候補文字テーブルの一部の内
容を示す図、第8図は最終的な文字読取結果を示す図で
ある。 11……文字読取部、12……候補文字処理部、13……後処
理部、14……類似候補文字テーブル、15……出力部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/68 G06K 9/03

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】帳票に設けられた文字記入領域内に記録さ
    れている文字について文字認識処理を行い、その結果得
    られる出力候補文字をもとに最終的な読取結果を決定す
    る文字読取システムにおいて、 帳票の文字記入領域域への記入が許される記入文字と当
    該文字に形状が類似した少なくとも1つの類似候補文字
    との組が、複数の記入文字について格納される類似候補
    文字格納手段と、 前記文字認識処理によって得られた出力候補文字が、こ
    の認識処理の対象となった文字記入領域域への記入が許
    される記入文字ではない場合に、当該出力候補文字と一
    致する類似候補文字を前記類似候補文字格納手段を参照
    して検索する候補文字検索手段と、 前記候補文字検索手段によって前記出力候補文字と一致
    する類似候補文字が検索された場合に、この類似候補文
    字と同一組の記入文字を前記出力候補文字に代えて最終
    的な文字読取結果として出力する出力手段と、 を具備したことを特徴とする文字読取システム。
JP63322320A 1988-12-21 1988-12-21 文字読取システム Expired - Lifetime JP2839515B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63322320A JP2839515B2 (ja) 1988-12-21 1988-12-21 文字読取システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63322320A JP2839515B2 (ja) 1988-12-21 1988-12-21 文字読取システム

Publications (2)

Publication Number Publication Date
JPH02166584A JPH02166584A (ja) 1990-06-27
JP2839515B2 true JP2839515B2 (ja) 1998-12-16

Family

ID=18142318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63322320A Expired - Lifetime JP2839515B2 (ja) 1988-12-21 1988-12-21 文字読取システム

Country Status (1)

Country Link
JP (1) JP2839515B2 (ja)

Also Published As

Publication number Publication date
JPH02166584A (ja) 1990-06-27

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JP2693914B2 (ja) 検索システム
JP2839515B2 (ja) 文字読取システム
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
KR102550868B1 (ko) 교원 업적 검증 시스템
JPH04232570A (ja) キーワード検索方法
JPH0256086A (ja) 文字認識の後処理方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
KR920006874A (ko) 소정의 포맷을 갖는 문서의 인식방법
JPS63138479A (ja) 文字認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JP2560959B2 (ja) 文字認識後処理方式
JPH06274701A (ja) 単語照合装置
JPH0438026B2 (ja)
JP2918380B2 (ja) 文字認識結果の後処理方法
JPH06301822A (ja) 文字認識後処理方式
JPS59117673A (ja) 文字認識装置における後処理方式
JPS60225273A (ja) 単語検索方式
JPH0546815A (ja) 光学式文字読取装置における住所単語照合方法
JP2680311B2 (ja) 文字認識方式
JP2725454B2 (ja) 文字コード知識処理方式
JP2947832B2 (ja) 単語照合方法
JP3245415B2 (ja) 文字認識方法
JPH04250589A (ja) 単語照合装置及び単語照合方法
JPS61161588A (ja) 文字認識後処理方式