JPH03164887A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH03164887A
JPH03164887A JP1305027A JP30502789A JPH03164887A JP H03164887 A JPH03164887 A JP H03164887A JP 1305027 A JP1305027 A JP 1305027A JP 30502789 A JP30502789 A JP 30502789A JP H03164887 A JPH03164887 A JP H03164887A
Authority
JP
Japan
Prior art keywords
character
word
knowledge processing
knowledge
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1305027A
Other languages
English (en)
Other versions
JP2984287B2 (ja
Inventor
Kazuji Kiyono
清野 和司
Satsuki Nagira
柳楽 さつき
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Software Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Software Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Software Engineering Corp filed Critical Toshiba Corp
Priority to JP1305027A priority Critical patent/JP2984287B2/ja
Publication of JPH03164887A publication Critical patent/JPH03164887A/ja
Application granted granted Critical
Publication of JP2984287B2 publication Critical patent/JP2984287B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的〕 (産業上の利用分野) 本発明は、光学式文字読取装置に関する。
(従来の技術) 従来から、光学式文字読取装置では、帳票に記入される
単語が住所、姓名のようにおよそ限定されている場合、
知識処理と呼ばれる方式を採用して、認識精度の向上化
を図っている。
この知識処理は、文字認識によって得た各文字の候補群
をそれぞれマトリックス形式で組合せてなる各文字候補
列と、知識ベースに記憶された全ての111語とを比較
して両者の類似度をそれぞれ算出し、最大類似度を得た
単語を最終的な認識結果として出力する方式である。
ところで、この知識処理では、例えば「−朗」という単
語の文字列に対して、「朗」の文字が良好に認識されな
かった場合、知識ベース内において「−」の文字が先頭
にあるの全ての単語が、最大類似度の単語として判定さ
れてしまうといった不都合か生じる。
こうした事態に対処するため、従来の光学式文字読取装
置では、最大類似度を得た複数の単語候補のうち、発生
率の最も高いものを最終的な知識処理の結果として出力
する方式が多々採用されている。
しかしながら、単に発生率の高い単語候補を選択するだ
けでは誤読が生じる。
そこで、単語候補が複数得られた場合は、これを出力し
ないでリジェクトすることにより、オペレータにその部
分の修正を促すといった方式も一部で採用されている。
しかし、この方式では、単語全体がリジェクトされ、し
かもキー人力操作等による正解の文字人力作業を要する
ため、オペレータにかかる負担が無視できないレベルに
まで拡大する恐れがあった。
(発明が解決しようとする課a) 本発明はこのような課題を解決するためのもので、リジ
ェクト発生に伴う修正作業を効率良くかつ正確に行うこ
とのできる光学式文字読取装置の提供を目的としている
[発明の構成] (課題を解決するための手段) 第1の発明の光学式文字読取装置は上記目的を達成する
ために、帳票上に記された文字のイメージを光学的に読
取るイメージ読取手段と、このイメージ読取手段により
読取られたイメージから文字認識を行って文字候補を判
定する文字認識手段と、予め単語が格納された知識ベー
スと、文字認識手段により得られた文字候補の列と知識
ベース内の111語とを比較して、最大類似度を得た単
語を判定する知識処理手段と、この手段において最大類
似度を得た単語が同時に複数判定された場合、該各単語
と文字候補列とを文字単位でそれぞれ比較する比較手段
と、この比較の結果、文字が一致しない桁が検出された
場合、該桁を文字単位でリジェクトするリジェクト手段
とを具備したものである。
また第2の発明の光学式文字読取装置は上記目的を達成
するために、前記第1の発明の光学式文字読取装置にお
いて、文字単位のリジェクトが発生したとき、知識処理
手段により得られた最大類似度の各単語を表示する表示
手段と、この表示手段により表示された各単語の中から
正解の111語を指定するための指定手段と、指定され
た単語を知識処理の修正結果として出力する修正手段と
を具備したものである。
(作 用) 第1の発明の光学式文字読取装置では、最大類似度を古
た単語が同時に複数判定された場合、比較手嵌により、
該各単語と文字候補列とを文字単位でそれぞれ比較する
。そしてこの比較の結果、文字が一致しない桁が検出さ
れると、この桁はリジェクト手段によって文字単位でリ
ジェクトされる。
したがって、この発明によれば、単語における文字単位
のリジェクト処理を実現することで、リジェクトの発生
に伴う修正作業を文字単位で効率良く行うことができる
また第2の発明の光学式文字読取装置では、文字単位の
リジェクトが発生すると、表示手段により、知識処理手
段により得られた最大類似度の各単語が表示される。こ
の後、指定手段により、表示された各単語の中から正解
の単語が指定されると、修正手段により、指定された単
語が知識処理の修正結果として出力される。
したがって、この発明によれば、正解の単語を指定する
だけの簡単な操作で、リジェクトの発生に伴う修正作業
を効率良くかつ正確に行うことができる。
(実施例) 以下、本発明の実施例を図面に基づいて説明する。
第2図は本発明に係る一実施例の光学式文字読取装置の
構成を説明するためのブロック図である。
同図において、1は帳票P上に記入された文字のイメー
ジを光学的に読取るイメージスキャナ、2はイメージス
キャナ1により読取られた文字イメージデータ(入力文
字パターン)と標準文字パターンとから複合類似度法等
によるパターンマツチングを行って複数の文字候補(文
字コード)を判定する文字認識部である。また3は名前
等に関する単語文字列が予め格納された知識ベース、4
は文字認識部2により判定された各文字の候補群をマト
リックス形式で組合せてなる各文字候補列と、知識ベー
ス3内の各単語とを比較して両者の類似度を算出し、最
大類似度の単語を判定する知識処理部、5.6はそれぞ
れリジェクト発生に伴う修正作業等に洪されるキーボー
ド、CRT等の人力部および表示部である。そして7は
以上の各構成部を統括的に制御するCPUである。
次にこの実施例装置の動作を第1図および第3図を用い
て説明する。
尚、第3図はこの装置における全体的な処理の流れを示
すフローチャート、第1図は第3図の処理の一部を詳細
に示したフローチャートである。
ここで帳票P上には、「−朗」という名前の単語文字列
が記入されているものとする。
まず帳票P上に記入された文字列のイメージがイメージ
スキャナ1により読み込まれると(第3図−A)、その
文字列のイメージデータは 1文字毎に切出されて文字
認識部2に順次人力される。
文字認識部2は、入力された個々の文字イメージデータ
(入力文字パターン)について、それぞれ複合類似度法
等による標準文字パターンとのパターンマツチングを行
うことにより文字認識を行う(第3図−B)。これによ
り、各文字毎に高い類似度を得た上位n番目までの文字
候補が判定される。
このようにして得られた各文字の候補群は、次に知識処
理部4に送られる。知識処理部4は、各文字の候補群を
それぞれマトリックス形式で組合せることにより複数の
文字候補列を生成し、これらの文字候補列と知識ベース
3内の全ての単語との類似度をそれぞれ算出する。そし
て、最大類似度を得た111語を知識処理結果として判
定する(第3図−C)。
ここで、「−朗」の「−」の文字については正しい文字
候補が判定されたものの、「朗」の文字については正し
い文字候補が判定されなかった場合、各文字候補列が知
識ベース3内のどの単語とも一致しない状態が発生し得
る。この状態を無候補と呼ぶ。この場合、「−」の文字
を1桁目に持つ全ての単語、例えば「一部」 「−朗」
等が最大類似度の単語として判定されてしまう。したが
って、このまま発生確率の高い単語候補を出力してしま
うと、「一部」が最終的な出力となるため誤読となる。
そこで、この実施例では、第1図に示すように、最大類
似度の単語が同時に複数判定された場合(第1図−CI
 ) 、各文字候補列と前記各単語とを文字ili位で
それぞれ比較する(第1図−C2)。
そしてこの比較結果、文字の一致しない桁を検出した場
合は(第1図−03)、これをリジェクトして、表示部
6の画面を通じてオペレータにその旨を通知する(第1
図−C4)。次に、CPU7は、最大類似度を得た各単
語を知識処理部4から抽出してこれを同画面上に表示す
る(第1図−DI)。オペレータは、この画面を参照し
ながら帳票Pに記入した単語文字列と一致する正解の単
語を入力部5を用いて指定する(第1図−D2)。
これにより、指定された単語が、最終的な知識処理の結
果として本装置より出力される(第1図−D3)。
尚、図には示されていないが、この装置では、最大類似
度の各単語における無候補の文字が同一の場合、発生確
率の高い方の単語を最終的な知識処理の結果として判定
出力する。
例えば、帳票P上に「一部」と記入したものの、「部」
の文字認識では正しい文字候補が判定されず、しかもこ
のとき最大類似度の単語として、それぞれ2桁目が無候
補の「一部」と「二部」が出力された場合、発生確率の
高い「一部」が最終的な知識処理の結果となる。
かくしてこの実施例の光学式文字読取装置によれば、単
語における文字単位のリジェクト処理を実現することで
、リジェクトの発生に伴う修正作業を、画面上で正解の
単語候補を指定するだけの簡単な操作で効率良く正確に
行うことができる。
尚、上述の実施例はリジェクト発生後直ちに修正をオペ
レータに促す方式を採用しているが、ある程度の数をま
とめてバッチ処理的に修正を行うようにしてもよい。
[発明の効果] 以上説明したように本発明の光学式文字読取装置によれ
ば、単語における文字単位のりジェクト処理を実現する
ことで、リジェクト発生に伴う修正作業を効率良くかつ
正確に行うことができる。
【図面の簡単な説明】
第1図は本発明に係る一実施例の光学式文字読取装置に
おけるリジェクト処理の流れを示すフローチャート、第
2図は第1図の光学式文字読取装置の構成を説明するた
めのブロック図、第3図は第1図の光学式文字読取装置
における全体の処理の流れを示すフローチャートである
。 1・・・イメージスキャナ、2・・・文字認識部、3・
・・知識ベース、4・・・知識処理部、5・・・人力部
、6・・・表示部、7・・・CPU、P・・・帳票。

Claims (2)

    【特許請求の範囲】
  1. (1)帳票上に記された文字のイメージを光学的に読取
    るイメージ読取手段と、 このイメージ読取手段により読取られたイメージから文
    字認識を行って文字候補を判定する文字認識手段と、 予め単語が格納された知識ベースと、 前記文字認識手段により得られた文字候補の列と前記知
    識ベース内の単語とを比較して、最大類似度を得た単語
    を判定する知識処理手段と、この手段において最大類似
    度を得た単語が同時に複数判定された場合、該各単語と
    前記文字候補列とを文字単位でそれぞれ比較する比較手
    段と、この比較の結果、文字が一致しない桁が検出され
    た場合、該桁を文字単位でリジェクトするリジェクト手
    段とを具備したことを特徴とする光学式文字読取装置。
  2. (2)請求項1の光学式文字読取装置において、文字単
    位のリジェクトが発生したとき、知識処理手段により得
    られた最大類似度の各単語を表示する表示手段と、 この表示手段により表示された各単語の中から正解の単
    語を指定するための指定手段と、指定された単語を知識
    処理の修正結果として出力する修正手段とを具備したこ
    とを特徴とする光学式文字読取装置。
JP1305027A 1989-11-22 1989-11-22 光学式文字読取装置 Expired - Lifetime JP2984287B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1305027A JP2984287B2 (ja) 1989-11-22 1989-11-22 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1305027A JP2984287B2 (ja) 1989-11-22 1989-11-22 光学式文字読取装置

Publications (2)

Publication Number Publication Date
JPH03164887A true JPH03164887A (ja) 1991-07-16
JP2984287B2 JP2984287B2 (ja) 1999-11-29

Family

ID=17940212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1305027A Expired - Lifetime JP2984287B2 (ja) 1989-11-22 1989-11-22 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JP2984287B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987170A (en) * 1992-09-28 1999-11-16 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987170A (en) * 1992-09-28 1999-11-16 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing

Also Published As

Publication number Publication date
JP2984287B2 (ja) 1999-11-29

Similar Documents

Publication Publication Date Title
JPH0612524A (ja) 文字認識方式
JPH03164887A (ja) 光学式文字読取装置
JPH0388062A (ja) 文書作成装置
JP3037727B2 (ja) Ocrシステム
JP3486246B2 (ja) 文字認識装置
JPS6224382A (ja) 手書き文字の認識方法
JPS61163472A (ja) 文字認識装置
JPS63147287A (ja) 光学的文字認識装置
JP2649807B2 (ja) 文字読取装置
JP2878772B2 (ja) 光学的文字読取装置
JPS63208180A (ja) 文字認識装置
JPH06333083A (ja) 光学式文字読取装置
JPH02126384A (ja) 文字認識システムのパターン認識方法
JPH03161886A (ja) Ocrの誤読修正方法
JPH07210623A (ja) 文書画像処理装置
JPS6334681A (ja) 文字認識装置
JPH0581261A (ja) 文書入力装置
JPH0272495A (ja) 文字読取システム
JPH0344784A (ja) 文字認識装置
JPH04138583A (ja) 文字認識装置
JPH03219384A (ja) 文字認識装置
JPH08167005A (ja) 文字認識装置
JPH02123484A (ja) 光学的文字読取装置
JPS63280389A (ja) 文字読み取り装置
JPS61220081A (ja) パタ−ン切り出し及び認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070924

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 11