JPH03164887A - 光学式文字読取装置 - Google Patents
光学式文字読取装置Info
- Publication number
- JPH03164887A JPH03164887A JP1305027A JP30502789A JPH03164887A JP H03164887 A JPH03164887 A JP H03164887A JP 1305027 A JP1305027 A JP 1305027A JP 30502789 A JP30502789 A JP 30502789A JP H03164887 A JPH03164887 A JP H03164887A
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- knowledge processing
- knowledge
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012015 optical character recognition Methods 0.000 title 1
- 230000003287 optical effect Effects 0.000 claims description 17
- 239000000284 extract Substances 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 12
- 238000012937 correction Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
め要約のデータは記録されません。
Description
単語が住所、姓名のようにおよそ限定されている場合、
知識処理と呼ばれる方式を採用して、認識精度の向上化
を図っている。
をそれぞれマトリックス形式で組合せてなる各文字候補
列と、知識ベースに記憶された全ての111語とを比較
して両者の類似度をそれぞれ算出し、最大類似度を得た
単語を最終的な認識結果として出力する方式である。
語の文字列に対して、「朗」の文字が良好に認識されな
かった場合、知識ベース内において「−」の文字が先頭
にあるの全ての単語が、最大類似度の単語として判定さ
れてしまうといった不都合か生じる。
置では、最大類似度を得た複数の単語候補のうち、発生
率の最も高いものを最終的な知識処理の結果として出力
する方式が多々採用されている。
けでは誤読が生じる。
ないでリジェクトすることにより、オペレータにその部
分の修正を促すといった方式も一部で採用されている。
かもキー人力操作等による正解の文字人力作業を要する
ため、オペレータにかかる負担が無視できないレベルに
まで拡大する恐れがあった。
ェクト発生に伴う修正作業を効率良くかつ正確に行うこ
とのできる光学式文字読取装置の提供を目的としている
。
ために、帳票上に記された文字のイメージを光学的に読
取るイメージ読取手段と、このイメージ読取手段により
読取られたイメージから文字認識を行って文字候補を判
定する文字認識手段と、予め単語が格納された知識ベー
スと、文字認識手段により得られた文字候補の列と知識
ベース内の111語とを比較して、最大類似度を得た単
語を判定する知識処理手段と、この手段において最大類
似度を得た単語が同時に複数判定された場合、該各単語
と文字候補列とを文字単位でそれぞれ比較する比較手段
と、この比較の結果、文字が一致しない桁が検出された
場合、該桁を文字単位でリジェクトするリジェクト手段
とを具備したものである。
するために、前記第1の発明の光学式文字読取装置にお
いて、文字単位のリジェクトが発生したとき、知識処理
手段により得られた最大類似度の各単語を表示する表示
手段と、この表示手段により表示された各単語の中から
正解の111語を指定するための指定手段と、指定され
た単語を知識処理の修正結果として出力する修正手段と
を具備したものである。
た単語が同時に複数判定された場合、比較手嵌により、
該各単語と文字候補列とを文字単位でそれぞれ比較する
。そしてこの比較の結果、文字が一致しない桁が検出さ
れると、この桁はリジェクト手段によって文字単位でリ
ジェクトされる。
のリジェクト処理を実現することで、リジェクトの発生
に伴う修正作業を文字単位で効率良く行うことができる
。
リジェクトが発生すると、表示手段により、知識処理手
段により得られた最大類似度の各単語が表示される。こ
の後、指定手段により、表示された各単語の中から正解
の単語が指定されると、修正手段により、指定された単
語が知識処理の修正結果として出力される。
だけの簡単な操作で、リジェクトの発生に伴う修正作業
を効率良くかつ正確に行うことができる。
構成を説明するためのブロック図である。
ジを光学的に読取るイメージスキャナ、2はイメージス
キャナ1により読取られた文字イメージデータ(入力文
字パターン)と標準文字パターンとから複合類似度法等
によるパターンマツチングを行って複数の文字候補(文
字コード)を判定する文字認識部である。また3は名前
等に関する単語文字列が予め格納された知識ベース、4
は文字認識部2により判定された各文字の候補群をマト
リックス形式で組合せてなる各文字候補列と、知識ベー
ス3内の各単語とを比較して両者の類似度を算出し、最
大類似度の単語を判定する知識処理部、5.6はそれぞ
れリジェクト発生に伴う修正作業等に洪されるキーボー
ド、CRT等の人力部および表示部である。そして7は
以上の各構成部を統括的に制御するCPUである。
て説明する。
すフローチャート、第1図は第3図の処理の一部を詳細
に示したフローチャートである。
が記入されているものとする。
スキャナ1により読み込まれると(第3図−A)、その
文字列のイメージデータは 1文字毎に切出されて文字
認識部2に順次人力される。
(入力文字パターン)について、それぞれ複合類似度法
等による標準文字パターンとのパターンマツチングを行
うことにより文字認識を行う(第3図−B)。これによ
り、各文字毎に高い類似度を得た上位n番目までの文字
候補が判定される。
理部4に送られる。知識処理部4は、各文字の候補群を
それぞれマトリックス形式で組合せることにより複数の
文字候補列を生成し、これらの文字候補列と知識ベース
3内の全ての単語との類似度をそれぞれ算出する。そし
て、最大類似度を得た111語を知識処理結果として判
定する(第3図−C)。
候補が判定されたものの、「朗」の文字については正し
い文字候補が判定されなかった場合、各文字候補列が知
識ベース3内のどの単語とも一致しない状態が発生し得
る。この状態を無候補と呼ぶ。この場合、「−」の文字
を1桁目に持つ全ての単語、例えば「一部」 「−朗」
等が最大類似度の単語として判定されてしまう。したが
って、このまま発生確率の高い単語候補を出力してしま
うと、「一部」が最終的な出力となるため誤読となる。
似度の単語が同時に複数判定された場合(第1図−CI
) 、各文字候補列と前記各単語とを文字ili位で
それぞれ比較する(第1図−C2)。
合は(第1図−03)、これをリジェクトして、表示部
6の画面を通じてオペレータにその旨を通知する(第1
図−C4)。次に、CPU7は、最大類似度を得た各単
語を知識処理部4から抽出してこれを同画面上に表示す
る(第1図−DI)。オペレータは、この画面を参照し
ながら帳票Pに記入した単語文字列と一致する正解の単
語を入力部5を用いて指定する(第1図−D2)。
果として本装置より出力される(第1図−D3)。
度の各単語における無候補の文字が同一の場合、発生確
率の高い方の単語を最終的な知識処理の結果として判定
出力する。
の文字認識では正しい文字候補が判定されず、しかもこ
のとき最大類似度の単語として、それぞれ2桁目が無候
補の「一部」と「二部」が出力された場合、発生確率の
高い「一部」が最終的な知識処理の結果となる。
語における文字単位のリジェクト処理を実現することで
、リジェクトの発生に伴う修正作業を、画面上で正解の
単語候補を指定するだけの簡単な操作で効率良く正確に
行うことができる。
レータに促す方式を採用しているが、ある程度の数をま
とめてバッチ処理的に修正を行うようにしてもよい。
ば、単語における文字単位のりジェクト処理を実現する
ことで、リジェクト発生に伴う修正作業を効率良くかつ
正確に行うことができる。
おけるリジェクト処理の流れを示すフローチャート、第
2図は第1図の光学式文字読取装置の構成を説明するた
めのブロック図、第3図は第1図の光学式文字読取装置
における全体の処理の流れを示すフローチャートである
。 1・・・イメージスキャナ、2・・・文字認識部、3・
・・知識ベース、4・・・知識処理部、5・・・人力部
、6・・・表示部、7・・・CPU、P・・・帳票。
Claims (2)
- (1)帳票上に記された文字のイメージを光学的に読取
るイメージ読取手段と、 このイメージ読取手段により読取られたイメージから文
字認識を行って文字候補を判定する文字認識手段と、 予め単語が格納された知識ベースと、 前記文字認識手段により得られた文字候補の列と前記知
識ベース内の単語とを比較して、最大類似度を得た単語
を判定する知識処理手段と、この手段において最大類似
度を得た単語が同時に複数判定された場合、該各単語と
前記文字候補列とを文字単位でそれぞれ比較する比較手
段と、この比較の結果、文字が一致しない桁が検出され
た場合、該桁を文字単位でリジェクトするリジェクト手
段とを具備したことを特徴とする光学式文字読取装置。 - (2)請求項1の光学式文字読取装置において、文字単
位のリジェクトが発生したとき、知識処理手段により得
られた最大類似度の各単語を表示する表示手段と、 この表示手段により表示された各単語の中から正解の単
語を指定するための指定手段と、指定された単語を知識
処理の修正結果として出力する修正手段とを具備したこ
とを特徴とする光学式文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1305027A JP2984287B2 (ja) | 1989-11-22 | 1989-11-22 | 光学式文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1305027A JP2984287B2 (ja) | 1989-11-22 | 1989-11-22 | 光学式文字読取装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03164887A true JPH03164887A (ja) | 1991-07-16 |
JP2984287B2 JP2984287B2 (ja) | 1999-11-29 |
Family
ID=17940212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1305027A Expired - Lifetime JP2984287B2 (ja) | 1989-11-22 | 1989-11-22 | 光学式文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2984287B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987170A (en) * | 1992-09-28 | 1999-11-16 | Matsushita Electric Industrial Co., Ltd. | Character recognition machine utilizing language processing |
-
1989
- 1989-11-22 JP JP1305027A patent/JP2984287B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987170A (en) * | 1992-09-28 | 1999-11-16 | Matsushita Electric Industrial Co., Ltd. | Character recognition machine utilizing language processing |
Also Published As
Publication number | Publication date |
---|---|
JP2984287B2 (ja) | 1999-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0612524A (ja) | 文字認識方式 | |
JPH03164887A (ja) | 光学式文字読取装置 | |
JPH0388062A (ja) | 文書作成装置 | |
JP3037727B2 (ja) | Ocrシステム | |
JP3486246B2 (ja) | 文字認識装置 | |
JPS6224382A (ja) | 手書き文字の認識方法 | |
JPS61163472A (ja) | 文字認識装置 | |
JPS63147287A (ja) | 光学的文字認識装置 | |
JP2649807B2 (ja) | 文字読取装置 | |
JP2878772B2 (ja) | 光学的文字読取装置 | |
JPS63208180A (ja) | 文字認識装置 | |
JPH06333083A (ja) | 光学式文字読取装置 | |
JPH02126384A (ja) | 文字認識システムのパターン認識方法 | |
JPH03161886A (ja) | Ocrの誤読修正方法 | |
JPH07210623A (ja) | 文書画像処理装置 | |
JPS6334681A (ja) | 文字認識装置 | |
JPH0581261A (ja) | 文書入力装置 | |
JPH0272495A (ja) | 文字読取システム | |
JPH0344784A (ja) | 文字認識装置 | |
JPH04138583A (ja) | 文字認識装置 | |
JPH03219384A (ja) | 文字認識装置 | |
JPH08167005A (ja) | 文字認識装置 | |
JPH02123484A (ja) | 光学的文字読取装置 | |
JPS63280389A (ja) | 文字読み取り装置 | |
JPS61220081A (ja) | パタ−ン切り出し及び認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070924 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080924 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080924 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090924 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090924 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100924 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100924 Year of fee payment: 11 |