JPS63138479A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS63138479A JPS63138479A JP61285140A JP28514086A JPS63138479A JP S63138479 A JPS63138479 A JP S63138479A JP 61285140 A JP61285140 A JP 61285140A JP 28514086 A JP28514086 A JP 28514086A JP S63138479 A JPS63138479 A JP S63138479A
- Authority
- JP
- Japan
- Prior art keywords
- word
- knowledge
- recognition
- attributes
- recognizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、複数の単語記入領域を有する81票に記入さ
れた各単語を認識する際に用いられる文字認識装置に関
する。
れた各単語を認識する際に用いられる文字認識装置に関
する。
(従来の技術)
従来から文字認識装置の中で、認識正答率を向上させる
ために、知識辞書を用いて認識単語候補の妥当性チェッ
ク(以下知識処理と称する)を行なうものが知られてい
る。
ために、知識辞書を用いて認識単語候補の妥当性チェッ
ク(以下知識処理と称する)を行なうものが知られてい
る。
この知識処理は、認識部で得られた認識単語候補と、意
味的に正当な単語が登録されている知識辞書とを比較し
、最終的な認識単語を選択するものである。
味的に正当な単語が登録されている知識辞書とを比較し
、最終的な認識単語を選択するものである。
例えば第2図において、帳WS上の姓名記入領域F1に
記入された単語の認識を行なう場合には姓名用知識辞書
J1を用いて知識処理を行ない、企業名記入領域F2に
記入された単語の認識を行なう場合には企業名用知識辞
書J2を用いて知識処理を行なう。
記入された単語の認識を行なう場合には姓名用知識辞書
J1を用いて知識処理を行ない、企業名記入領域F2に
記入された単語の認識を行なう場合には企業名用知識辞
書J2を用いて知識処理を行なう。
しかしながら従来の文字認識装置において、帳票S上に
複数の属性をもつ領域がある場合には、複数の属性に対
応する大容量の知識辞書を予め用意しておかなければな
らない。
複数の属性をもつ領域がある場合には、複数の属性に対
応する大容量の知識辞書を予め用意しておかなければな
らない。
例えば第2図の帳票Sにおいて、姓名、企業名のいずれ
かが対応する姓名十企業名記入領域F3に記入された単
語の認識を行なう場合には、前記姓名用知識辞書J1と
企業名用知識辞書J2とが結合されたものに等しい姓名
十企業名用知識辞書J3を用いて知識処理を行なう。
かが対応する姓名十企業名記入領域F3に記入された単
語の認識を行なう場合には、前記姓名用知識辞書J1と
企業名用知識辞書J2とが結合されたものに等しい姓名
十企業名用知識辞書J3を用いて知識処理を行なう。
したがって91票上にこのような領域が多く存在する場
合には、大容量の知識辞書を幾つも用意しておかなけれ
ばならず、知識辞書を作る際に非常に手間がかかり、運
用コストが高くなるという問題があった。
合には、大容量の知識辞書を幾つも用意しておかなけれ
ばならず、知識辞書を作る際に非常に手間がかかり、運
用コストが高くなるという問題があった。
(発明が解決しようとする問題点)
本発明は上述したような事情によりなされたもので、帳
票上に複数の属性が対応する文字記入領域領域が多く存
在する場合でも、知識辞書を作る際の手間が少なく、運
用コストを低く抑えることができる文字認識装置の提供
を目的としている。
票上に複数の属性が対応する文字記入領域領域が多く存
在する場合でも、知識辞書を作る際の手間が少なく、運
用コストを低く抑えることができる文字認識装置の提供
を目的としている。
[発明の構成]
(問題点を解決するための手段)
本発明の文字認識装置は、複数の単語記入領域を有する
帳票から各単語のイメージを得る読取部と、前記単語記
入領域に記入されるべき単語の属性を記憶する属性記憶
部と、前記単語のイメージを認識し1つの単語ののイメ
ージに対応する複数の認識単語候補を得る認識部と、各
単語の属性に対応して各認識単語候補の妥当性を判断す
るための情報が格納されている複数組の知識辞書と、複
数の属性をもつ前記単語記入領域に記入されている単語
のイメージの認識単語候補と前記各属性に対応した複数
の知識辞書とを対比して最も妥当な認識単語候補を認識
単語として出力する知識処理部とを備えたものである。
帳票から各単語のイメージを得る読取部と、前記単語記
入領域に記入されるべき単語の属性を記憶する属性記憶
部と、前記単語のイメージを認識し1つの単語ののイメ
ージに対応する複数の認識単語候補を得る認識部と、各
単語の属性に対応して各認識単語候補の妥当性を判断す
るための情報が格納されている複数組の知識辞書と、複
数の属性をもつ前記単語記入領域に記入されている単語
のイメージの認識単語候補と前記各属性に対応した複数
の知識辞書とを対比して最も妥当な認識単語候補を認識
単語として出力する知識処理部とを備えたものである。
(作 用)
本発明の文字認識装置では、読取部が帳票から各単語の
イメージを得、認識部が前記イメージを認識し1つの単
語のイメージに対応する複数の認識単語候補を得ると、
知識処理部が複数の属性をもつ単語記入領域の認識単語
候補と前記各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は1つの属性に対応させてお
くだけでよい。
イメージを得、認識部が前記イメージを認識し1つの単
語のイメージに対応する複数の認識単語候補を得ると、
知識処理部が複数の属性をもつ単語記入領域の認識単語
候補と前記各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は1つの属性に対応させてお
くだけでよい。
(実施例)
以下、本発明の実施例の詳細を図面に基いて説明する。
第1図は本発明の一実施例の梢成を示すブロック図であ
る。
る。
同図において1は複数の単語記入領域を有し、各領域に
記入される単語の属性が予め判明している帳票からイメ
ージを得るスキャナ部、2は1つの単語記入領域分のイ
メージを認識し、幾つかの認識単語候補(文字コードで
表わされている)を出力する認識部、3は知識処理を実
行するか否かを判断する知識処理制御部、4は各認識単
語候補の知識処理を実行するのに必要な知識辞書を選択
する知識辞書管理部、5a、5b・・・はそれぞれ1つ
の属性に対応し、意味的に正当な単語精報(文字コード
で表わされている)が格納されている知識辞書、6は与
えられた認識11語候補と各知識R書内の単語情報とを
順次比較し、類似度(後述)が最大の認識単語候補を最
終的な認識単語として出力する知識処理部、7は帳票上
の各領域が知識処理を必要とする領域であるか否かを示
す情報と1、各領域の属性を示す情報がデープルとして
予め格納されている知識処理情報記憶部である。
記入される単語の属性が予め判明している帳票からイメ
ージを得るスキャナ部、2は1つの単語記入領域分のイ
メージを認識し、幾つかの認識単語候補(文字コードで
表わされている)を出力する認識部、3は知識処理を実
行するか否かを判断する知識処理制御部、4は各認識単
語候補の知識処理を実行するのに必要な知識辞書を選択
する知識辞書管理部、5a、5b・・・はそれぞれ1つ
の属性に対応し、意味的に正当な単語精報(文字コード
で表わされている)が格納されている知識辞書、6は与
えられた認識11語候補と各知識R書内の単語情報とを
順次比較し、類似度(後述)が最大の認識単語候補を最
終的な認識単語として出力する知識処理部、7は帳票上
の各領域が知識処理を必要とする領域であるか否かを示
す情報と1、各領域の属性を示す情報がデープルとして
予め格納されている知識処理情報記憶部である。
なお本実施例において認識単語候補の類似度とは、認識
部2における候補順位から決まる得点と、知識辞書内の
単語情報との一致の有無から決まる得点との和と考えて
よい。
部2における候補順位から決まる得点と、知識辞書内の
単語情報との一致の有無から決まる得点との和と考えて
よい。
例えば認識単語候補1位の単語は10点、2位は9点、
・・・等とし、さらに知識辞書内の単語情報と一致した
ものに5点、一致しないものには0点等を加えた総得点
が類似度となり、この値が最も高いものがa終曲な認識
単語となる。
・・・等とし、さらに知識辞書内の単語情報と一致した
ものに5点、一致しないものには0点等を加えた総得点
が類似度となり、この値が最も高いものがa終曲な認識
単語となる。
本実施例装置では、まずスキャナ部1が読取った1つの
文字記入領域分のイメージが認識部2に渡される。認識
部2では1文字ごとの認識を行なって幾つかの候補文字
を選択して1領域分をまとめ、認識単語候補として知識
処理制御部3に出力する。
文字記入領域分のイメージが認識部2に渡される。認識
部2では1文字ごとの認識を行なって幾つかの候補文字
を選択して1領域分をまとめ、認識単語候補として知識
処理制御部3に出力する。
続いて知識処理制御部3が知識処理情報記憶部7を検索
し、これら認識単語候補に対応する領域が知識処理を実
行すべき領域であるか否かを判断する。そして対象領域
が知識処理を必要としない領域であれば、前記認識単語
候補のうち、第1候補のものを最終的な認識単語として
出力する。
し、これら認識単語候補に対応する領域が知識処理を実
行すべき領域であるか否かを判断する。そして対象領域
が知識処理を必要としない領域であれば、前記認識単語
候補のうち、第1候補のものを最終的な認識単語として
出力する。
一方、対象領域が知識処理を必要とする領域であったな
らば、知識処理部3が知識処理情報記憶部7に示されて
いるテーブルの先頭から知識辞書名を取出し、知識RM
管理部4へ渡す。
らば、知識処理部3が知識処理情報記憶部7に示されて
いるテーブルの先頭から知識辞書名を取出し、知識RM
管理部4へ渡す。
知識辞書管理部4ではこの知識辞書名にしたがって複数
の知諏辞IF 5 a、5b・・・から1つを選択し、
知識処理部6へ渡す。
の知諏辞IF 5 a、5b・・・から1つを選択し、
知識処理部6へ渡す。
同時に知識処理制御部3から知識処理部6へ1領域分の
認識単語候補が渡され、知識処理部6は各認識単語候補
と知識辞書とを比較する。
認識単語候補が渡され、知識処理部6は各認識単語候補
と知識辞書とを比較する。
そして比較の結果、類似度が最も高くなった認識単語候
補が選ばれ、その類似度とともに知識処理制御部3へ渡
される。
補が選ばれ、その類似度とともに知識処理制御部3へ渡
される。
知識処理制御部3は知識処理情報記憶部7内のテーブル
を再び参照し、続く知識辞書名があれば知識辞書管理部
4に新たな知識辞書名を渡し、知識処理部6において比
較を行なわせる。
を再び参照し、続く知識辞書名があれば知識辞書管理部
4に新たな知識辞書名を渡し、知識処理部6において比
較を行なわせる。
ここで知識処理部6で得ちれた認識単語候補の類似度と
、先に得られている認識単語候補の類似度とを比較し、
類似度の大きい方の認識単語@清とその類似度を知識処
理Mm部3に保持させておく。
、先に得られている認識単語候補の類似度とを比較し、
類似度の大きい方の認識単語@清とその類似度を知識処
理Mm部3に保持させておく。
この比較が知識処理情報記憶部7内のテーブルの知識辞
書名が無くなるまで繰返えし行なわれた後、知識処理制
御部3は類似度が最も高かった認識単語候補を最終的な
認識単語として出力する。
書名が無くなるまで繰返えし行なわれた後、知識処理制
御部3は類似度が最も高かった認識単語候補を最終的な
認識単語として出力する。
かくして本実施例装置によれば、複数の属性をもつ領域
に記入されている単語に、各属性に対応した複数の知識
辞書を順次対応させるので、既存の小容量の知!111
をそのまま使用することがでさ、複数の属性を色合して
いる大容量の知識辞書を作成する手間がかからない。
に記入されている単語に、各属性に対応した複数の知識
辞書を順次対応させるので、既存の小容量の知!111
をそのまま使用することがでさ、複数の属性を色合して
いる大容量の知識辞書を作成する手間がかからない。
なお上述した実施例では、1つの単語と該当するすべて
の知識辞書とを順次比較し、最も類似度の高い単語を最
終的な認識単語としているが、知識辞書に優先順位を設
け、その順位にしたがってに比較を行ない、一定値以上
の類似度を有した単語を五終的な認識単語とする方式を
採用してもよい。
の知識辞書とを順次比較し、最も類似度の高い単語を最
終的な認識単語としているが、知識辞書に優先順位を設
け、その順位にしたがってに比較を行ない、一定値以上
の類似度を有した単語を五終的な認識単語とする方式を
採用してもよい。
さらに本実施例装置において処理速度を向上させるなめ
に、例えば知識処理部6と知識処p!!制御部3とに基
準類似度を予め与えておき、この基準類似度以上の類似
度をもつ単語があった場合、直ちにその単語を出力する
方式を採用してもよい。
に、例えば知識処理部6と知識処p!!制御部3とに基
準類似度を予め与えておき、この基準類似度以上の類似
度をもつ単語があった場合、直ちにその単語を出力する
方式を採用してもよい。
[発明の効果コ
以上説明したように本発明の文字認識装置は、帳票上の
複数の属性をもつ単語記入領域に記入された単語の認識
単語候補と各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は1つの属性に対応させてお
くだけでよい。
複数の属性をもつ単語記入領域に記入された単語の認識
単語候補と各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は1つの属性に対応させてお
くだけでよい。
したがって帳票上に複数の属性をもつ単語記入領域が多
く存在する場合でも、知識辞書を作る際に手間がかから
ず、運用コストを低く抑えることができる。
く存在する場合でも、知識辞書を作る際に手間がかから
ず、運用コストを低く抑えることができる。
第1図は本発明の一実施例の構成を示すブロック図、第
2図は従来の文字認識装置における知識処理の方法を概
念的に示す図である。 1・・・・・・・・・スキャナ部 2・・・・・・・・・認識部 3・・・・・・・・・知識処理制御部 4・・・・・・・・・知識辞書管理部 5a、5b・・・知識辞書
2図は従来の文字認識装置における知識処理の方法を概
念的に示す図である。 1・・・・・・・・・スキャナ部 2・・・・・・・・・認識部 3・・・・・・・・・知識処理制御部 4・・・・・・・・・知識辞書管理部 5a、5b・・・知識辞書
Claims (1)
- (1)複数の単語記入領域を有する帳票から各単語のイ
メージを得る読取部と、前記単語記入領域に記入される
べき単語の属性を記憶する属性記憶部と、前記単語のイ
メージを認識し1つの単語ののイメージに対応する複数
の認識単語候補を得る認識部と、各単語の属性に対応し
て各認識単語候補の妥当性を判断するための情報が格納
されている複数組の知識辞書と、複数の属性をもつ前記
単語記入領域に記入されている単語のイメージの認識単
語候補と前記各属性に対応した複数の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
知識処理部とを有してなることを特徴とする文字認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61285140A JPS63138479A (ja) | 1986-11-29 | 1986-11-29 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61285140A JPS63138479A (ja) | 1986-11-29 | 1986-11-29 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63138479A true JPS63138479A (ja) | 1988-06-10 |
Family
ID=17687617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61285140A Pending JPS63138479A (ja) | 1986-11-29 | 1986-11-29 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63138479A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0256085A (ja) * | 1988-08-20 | 1990-02-26 | Ricoh Co Ltd | 文字認識の後処理方法 |
JPH04340686A (ja) * | 1991-05-17 | 1992-11-27 | Pfu Ltd | 文字認識後処理用氏名辞書 |
-
1986
- 1986-11-29 JP JP61285140A patent/JPS63138479A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0256085A (ja) * | 1988-08-20 | 1990-02-26 | Ricoh Co Ltd | 文字認識の後処理方法 |
JPH04340686A (ja) * | 1991-05-17 | 1992-11-27 | Pfu Ltd | 文字認識後処理用氏名辞書 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0782504B2 (ja) | 情報検索処理方式および検索ファイル作成装置 | |
JPS63138479A (ja) | 文字認識装置 | |
JPS59229683A (ja) | 認識処理装置 | |
JPH0441388B2 (ja) | ||
JPH0528324A (ja) | 英文字認識装置 | |
JP2839515B2 (ja) | 文字読取システム | |
JPH07296005A (ja) | 日本語テキスト登録・検索装置 | |
JPH0438026B2 (ja) | ||
JP2570784B2 (ja) | 文書リーダ後処理装置 | |
JPH0259513B2 (ja) | ||
JPS63282586A (ja) | 文字認識装置 | |
JPS60225273A (ja) | 単語検索方式 | |
JPH03118661A (ja) | 単語検索装置 | |
JPH06274701A (ja) | 単語照合装置 | |
JPS6049480A (ja) | データ検索装置 | |
JP2637762B2 (ja) | パターン詳細同定方式 | |
JPH02148174A (ja) | Ocrによる住所データベース検索装置 | |
JP2917310B2 (ja) | 単語照合における単語辞書検索方式 | |
JPH06161995A (ja) | 氏名データ整形方法および装置 | |
JPH04340686A (ja) | 文字認識後処理用氏名辞書 | |
JPH03278194A (ja) | 文字認識処理方式 | |
JPH06215198A (ja) | 文字認識後処理方式 | |
JPS59188783A (ja) | 文字判定処理方式 | |
JPH07160730A (ja) | 全文検索装置 | |
JPH05120325A (ja) | 電子化辞書 |