JPS63138479A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS63138479A
JPS63138479A JP61285140A JP28514086A JPS63138479A JP S63138479 A JPS63138479 A JP S63138479A JP 61285140 A JP61285140 A JP 61285140A JP 28514086 A JP28514086 A JP 28514086A JP S63138479 A JPS63138479 A JP S63138479A
Authority
JP
Japan
Prior art keywords
word
knowledge
recognition
attributes
recognizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61285140A
Other languages
English (en)
Inventor
Kazunori Nakao
中尾 和則
Satsuki Nagira
柳楽 さつき
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Software Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Software Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Software Engineering Corp filed Critical Toshiba Corp
Priority to JP61285140A priority Critical patent/JPS63138479A/ja
Publication of JPS63138479A publication Critical patent/JPS63138479A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、複数の単語記入領域を有する81票に記入さ
れた各単語を認識する際に用いられる文字認識装置に関
する。
(従来の技術) 従来から文字認識装置の中で、認識正答率を向上させる
ために、知識辞書を用いて認識単語候補の妥当性チェッ
ク(以下知識処理と称する)を行なうものが知られてい
る。
この知識処理は、認識部で得られた認識単語候補と、意
味的に正当な単語が登録されている知識辞書とを比較し
、最終的な認識単語を選択するものである。
例えば第2図において、帳WS上の姓名記入領域F1に
記入された単語の認識を行なう場合には姓名用知識辞書
J1を用いて知識処理を行ない、企業名記入領域F2に
記入された単語の認識を行なう場合には企業名用知識辞
書J2を用いて知識処理を行なう。
しかしながら従来の文字認識装置において、帳票S上に
複数の属性をもつ領域がある場合には、複数の属性に対
応する大容量の知識辞書を予め用意しておかなければな
らない。
例えば第2図の帳票Sにおいて、姓名、企業名のいずれ
かが対応する姓名十企業名記入領域F3に記入された単
語の認識を行なう場合には、前記姓名用知識辞書J1と
企業名用知識辞書J2とが結合されたものに等しい姓名
十企業名用知識辞書J3を用いて知識処理を行なう。
したがって91票上にこのような領域が多く存在する場
合には、大容量の知識辞書を幾つも用意しておかなけれ
ばならず、知識辞書を作る際に非常に手間がかかり、運
用コストが高くなるという問題があった。
(発明が解決しようとする問題点) 本発明は上述したような事情によりなされたもので、帳
票上に複数の属性が対応する文字記入領域領域が多く存
在する場合でも、知識辞書を作る際の手間が少なく、運
用コストを低く抑えることができる文字認識装置の提供
を目的としている。
[発明の構成] (問題点を解決するための手段) 本発明の文字認識装置は、複数の単語記入領域を有する
帳票から各単語のイメージを得る読取部と、前記単語記
入領域に記入されるべき単語の属性を記憶する属性記憶
部と、前記単語のイメージを認識し1つの単語ののイメ
ージに対応する複数の認識単語候補を得る認識部と、各
単語の属性に対応して各認識単語候補の妥当性を判断す
るための情報が格納されている複数組の知識辞書と、複
数の属性をもつ前記単語記入領域に記入されている単語
のイメージの認識単語候補と前記各属性に対応した複数
の知識辞書とを対比して最も妥当な認識単語候補を認識
単語として出力する知識処理部とを備えたものである。
(作 用) 本発明の文字認識装置では、読取部が帳票から各単語の
イメージを得、認識部が前記イメージを認識し1つの単
語のイメージに対応する複数の認識単語候補を得ると、
知識処理部が複数の属性をもつ単語記入領域の認識単語
候補と前記各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は1つの属性に対応させてお
くだけでよい。
(実施例) 以下、本発明の実施例の詳細を図面に基いて説明する。
第1図は本発明の一実施例の梢成を示すブロック図であ
る。
同図において1は複数の単語記入領域を有し、各領域に
記入される単語の属性が予め判明している帳票からイメ
ージを得るスキャナ部、2は1つの単語記入領域分のイ
メージを認識し、幾つかの認識単語候補(文字コードで
表わされている)を出力する認識部、3は知識処理を実
行するか否かを判断する知識処理制御部、4は各認識単
語候補の知識処理を実行するのに必要な知識辞書を選択
する知識辞書管理部、5a、5b・・・はそれぞれ1つ
の属性に対応し、意味的に正当な単語精報(文字コード
で表わされている)が格納されている知識辞書、6は与
えられた認識11語候補と各知識R書内の単語情報とを
順次比較し、類似度(後述)が最大の認識単語候補を最
終的な認識単語として出力する知識処理部、7は帳票上
の各領域が知識処理を必要とする領域であるか否かを示
す情報と1、各領域の属性を示す情報がデープルとして
予め格納されている知識処理情報記憶部である。
なお本実施例において認識単語候補の類似度とは、認識
部2における候補順位から決まる得点と、知識辞書内の
単語情報との一致の有無から決まる得点との和と考えて
よい。
例えば認識単語候補1位の単語は10点、2位は9点、
・・・等とし、さらに知識辞書内の単語情報と一致した
ものに5点、一致しないものには0点等を加えた総得点
が類似度となり、この値が最も高いものがa終曲な認識
単語となる。
本実施例装置では、まずスキャナ部1が読取った1つの
文字記入領域分のイメージが認識部2に渡される。認識
部2では1文字ごとの認識を行なって幾つかの候補文字
を選択して1領域分をまとめ、認識単語候補として知識
処理制御部3に出力する。
続いて知識処理制御部3が知識処理情報記憶部7を検索
し、これら認識単語候補に対応する領域が知識処理を実
行すべき領域であるか否かを判断する。そして対象領域
が知識処理を必要としない領域であれば、前記認識単語
候補のうち、第1候補のものを最終的な認識単語として
出力する。
一方、対象領域が知識処理を必要とする領域であったな
らば、知識処理部3が知識処理情報記憶部7に示されて
いるテーブルの先頭から知識辞書名を取出し、知識RM
管理部4へ渡す。
知識辞書管理部4ではこの知識辞書名にしたがって複数
の知諏辞IF 5 a、5b・・・から1つを選択し、
知識処理部6へ渡す。
同時に知識処理制御部3から知識処理部6へ1領域分の
認識単語候補が渡され、知識処理部6は各認識単語候補
と知識辞書とを比較する。
そして比較の結果、類似度が最も高くなった認識単語候
補が選ばれ、その類似度とともに知識処理制御部3へ渡
される。
知識処理制御部3は知識処理情報記憶部7内のテーブル
を再び参照し、続く知識辞書名があれば知識辞書管理部
4に新たな知識辞書名を渡し、知識処理部6において比
較を行なわせる。
ここで知識処理部6で得ちれた認識単語候補の類似度と
、先に得られている認識単語候補の類似度とを比較し、
類似度の大きい方の認識単語@清とその類似度を知識処
理Mm部3に保持させておく。
この比較が知識処理情報記憶部7内のテーブルの知識辞
書名が無くなるまで繰返えし行なわれた後、知識処理制
御部3は類似度が最も高かった認識単語候補を最終的な
認識単語として出力する。
かくして本実施例装置によれば、複数の属性をもつ領域
に記入されている単語に、各属性に対応した複数の知識
辞書を順次対応させるので、既存の小容量の知!111
をそのまま使用することがでさ、複数の属性を色合して
いる大容量の知識辞書を作成する手間がかからない。
なお上述した実施例では、1つの単語と該当するすべて
の知識辞書とを順次比較し、最も類似度の高い単語を最
終的な認識単語としているが、知識辞書に優先順位を設
け、その順位にしたがってに比較を行ない、一定値以上
の類似度を有した単語を五終的な認識単語とする方式を
採用してもよい。
さらに本実施例装置において処理速度を向上させるなめ
に、例えば知識処理部6と知識処p!!制御部3とに基
準類似度を予め与えておき、この基準類似度以上の類似
度をもつ単語があった場合、直ちにその単語を出力する
方式を採用してもよい。
[発明の効果コ 以上説明したように本発明の文字認識装置は、帳票上の
複数の属性をもつ単語記入領域に記入された単語の認識
単語候補と各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は1つの属性に対応させてお
くだけでよい。
したがって帳票上に複数の属性をもつ単語記入領域が多
く存在する場合でも、知識辞書を作る際に手間がかから
ず、運用コストを低く抑えることができる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は従来の文字認識装置における知識処理の方法を概
念的に示す図である。 1・・・・・・・・・スキャナ部 2・・・・・・・・・認識部 3・・・・・・・・・知識処理制御部 4・・・・・・・・・知識辞書管理部 5a、5b・・・知識辞書

Claims (1)

    【特許請求の範囲】
  1. (1)複数の単語記入領域を有する帳票から各単語のイ
    メージを得る読取部と、前記単語記入領域に記入される
    べき単語の属性を記憶する属性記憶部と、前記単語のイ
    メージを認識し1つの単語ののイメージに対応する複数
    の認識単語候補を得る認識部と、各単語の属性に対応し
    て各認識単語候補の妥当性を判断するための情報が格納
    されている複数組の知識辞書と、複数の属性をもつ前記
    単語記入領域に記入されている単語のイメージの認識単
    語候補と前記各属性に対応した複数の知識辞書とを対比
    して最も妥当な認識単語候補を認識単語として出力する
    知識処理部とを有してなることを特徴とする文字認識装
    置。
JP61285140A 1986-11-29 1986-11-29 文字認識装置 Pending JPS63138479A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61285140A JPS63138479A (ja) 1986-11-29 1986-11-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61285140A JPS63138479A (ja) 1986-11-29 1986-11-29 文字認識装置

Publications (1)

Publication Number Publication Date
JPS63138479A true JPS63138479A (ja) 1988-06-10

Family

ID=17687617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61285140A Pending JPS63138479A (ja) 1986-11-29 1986-11-29 文字認識装置

Country Status (1)

Country Link
JP (1) JPS63138479A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256085A (ja) * 1988-08-20 1990-02-26 Ricoh Co Ltd 文字認識の後処理方法
JPH04340686A (ja) * 1991-05-17 1992-11-27 Pfu Ltd 文字認識後処理用氏名辞書

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256085A (ja) * 1988-08-20 1990-02-26 Ricoh Co Ltd 文字認識の後処理方法
JPH04340686A (ja) * 1991-05-17 1992-11-27 Pfu Ltd 文字認識後処理用氏名辞書

Similar Documents

Publication Publication Date Title
JPH0782504B2 (ja) 情報検索処理方式および検索ファイル作成装置
JPS63138479A (ja) 文字認識装置
JPS59229683A (ja) 認識処理装置
JPH0441388B2 (ja)
JPH0528324A (ja) 英文字認識装置
JP2839515B2 (ja) 文字読取システム
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPH0438026B2 (ja)
JP2570784B2 (ja) 文書リーダ後処理装置
JPH0259513B2 (ja)
JPS63282586A (ja) 文字認識装置
JPS60225273A (ja) 単語検索方式
JPH03118661A (ja) 単語検索装置
JPH06274701A (ja) 単語照合装置
JPS6049480A (ja) データ検索装置
JP2637762B2 (ja) パターン詳細同定方式
JPH02148174A (ja) Ocrによる住所データベース検索装置
JP2917310B2 (ja) 単語照合における単語辞書検索方式
JPH06161995A (ja) 氏名データ整形方法および装置
JPH04340686A (ja) 文字認識後処理用氏名辞書
JPH03278194A (ja) 文字認識処理方式
JPH06215198A (ja) 文字認識後処理方式
JPS59188783A (ja) 文字判定処理方式
JPH07160730A (ja) 全文検索装置
JPH05120325A (ja) 電子化辞書