JP2990734B2 - 文字認識装置の認識候補文字出力制御方法 - Google Patents
文字認識装置の認識候補文字出力制御方法Info
- Publication number
- JP2990734B2 JP2990734B2 JP2093724A JP9372490A JP2990734B2 JP 2990734 B2 JP2990734 B2 JP 2990734B2 JP 2093724 A JP2093724 A JP 2093724A JP 9372490 A JP9372490 A JP 9372490A JP 2990734 B2 JP2990734 B2 JP 2990734B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- characters
- correct
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
り装置(以下、OCRと記載:Optical Character Reader)
の認識候補文字の出力制御方法に係り、特に、認識候補
文字の中から、効率良く正解文字を選択するのに好適な
OCRの認識候補文字出力制御方法に関するものである。
り、用紙媒体上に記入、あるいは、印刷された文字を自
動認識し、計算機への入力機能を果たすものである。
税金納付票、電気、ガス料金払込票などの内容の読み取
りに利用されている。
%の認識率が得られている。
や、書体、および、文字の大きさが、多種多様であり、
さらに、パターンが複雑であることから、より複雑な文
字認識方法が必要である。
子情報通信ハンドブック/1988」(オーム社発行)のPP.
1677〜1678、および、PP.2687〜2688に記載されてい
る。
してのものである。
する場合には、まず、複数個の認識候補文字を出力す
る。
るか、もしくは、正解文字が全て含まれないかのいずれ
かである。すなわち、認識候補文字の大部分が正解文字
ではない。
出力するOCRの場合、少なくとも15個の認識候補文字
は、正解文字ではない。
に、当然のことながら、認識候補文字には、単語を形成
しない文字が多く含まれる。
字に対して、複数個の認識候補文字を表示装置などに全
て表示し、その中から、利用者が、正解文字を選択する
構成になっていた。
字を表示装置などに全て表示し、その中から、利用者
が、正解文字を選択する構成になっていた。
作業が多くなり、文字認識を用いたデータエントリ業務
のスループットを低下させる大きな原因なっていた。
は、読み取った文字の一文字一文字について、正解文字
として指定される確率の高い順、すなわち、確度の順
(1位、2位、・・・、m位)に認識候補文字を出力し
ていた。
その決め方は、それぞれのOCRにより異なる。また、OCR
の特性や、文字の書き方などの要因により、正解文字が
必ずしも確度の高い順位に出現するとは限らないなどの
問題があった。
識候補文字の中における正解文字の出現順位と、その出
現頻度とを学習し、より正解度の高い認識候補文字を選
別し、認識候補文字の個数を削減して、候補文字の確認
訂正作業に掛る負荷を軽減させることを可能とするOCR
の認識候補文字出力制御方法を提供することである。
字出力制御方法は、出力された第1候補文字群のそれぞ
れの文字の文字コードを、予め任意に設定された正解文
字として抽出される確率の高い順位で記憶する認識候補
文字格納部と、この認識候補文字格納部に記憶された第
1候補文字群から正解文字として抽出された文字に関し
て、正解文字として抽出された総回数、および、確率の
順位に対応した出現回数を記憶する第2候補文字記憶部
とを付与し、この第2候補文字記憶部に記憶した正解文
字として抽出された総回数と、確率の順位に対応した出
現回数に基づき、認識候補文字格納部に記憶された候補
文字から、さらに、正解文字として抽出される確率の高
い第2候補文字群を選別するステップと、このようにし
て選別した第2候補文字群から、人手を介して指定され
た正解文字を抽出するステップ、そして、この抽出した
正解文字の認識候補文字格納部での出現順位を認識し、
この正解文字の第2候補文字記憶部における出現順位に
対応した出現回数と、正解文字として抽出された総回数
とを訂正するステップを含むことを特徴とする。
候補文字群内における順位、すなわち、認識候補文字格
納部における順位を学習し、この学習した結果を、文字
毎に、第2候補文字記憶部に格納する。
部に出力されてきた場合には、第2候補文字記憶部に格
納した文字毎の学習結果に基づき、さらに、正解文字と
して抽出される確率の高い候補文字を選別する。
合には、認識候補文字の各々について、第2候補文字記
憶部に格納された過去からの出現順位のデータを参照し
て、出現している順位が妥当かどうかを判定し、表示す
べき認識候補文字を選別する。このことにより、表示さ
れる認識候補文字を、より、正解文字として抽出される
確率の高い文字だけに限定することが出来る。
ているために、利用者は、迅速に、正解文字を確定する
ことが出来る。
字の出現順位を学習し、その学習結果を第2候補文字記
憶部に反映する。このことにより、表示装置に表示する
認識候補文字を、さらに、確率の高い文字だけに限定す
る。
る。
すブロック部である。
にする光学走査・光電変換部11、光学走査・光電変換部
11で得た文字パターンの雑音除去と、一文字分のパター
ン切り出しを行なう前処理部12、認識アルゴリズムを実
行する特徴抽出部13、そして、特徴抽出部13で得られた
特徴と認識辞書14との比較を行ない、かつ、本発明の認
識候補文字出力制御を行ない、認識候補文字を決定する
認識処理部9、さらに、利用者が、正解文字を決定する
ために用いる表示部7とキーボード8から構成されてい
る。
は、特徴抽出部13で得られた特徴と認識辞書14との比較
を行ない、読み取った文字を認識し、対応する認識候補
文字群を出力する文字認識部1、文字認識部1が出力し
た認識候補文字群を格納する認識候補文字格納部2、認
識候補文字格納部2に格納した認識候補文字群から、さ
らに、正解の確度の高い第2候補文字群を選別する候補
文字選別部3、候補文字選別部3により選別された第2
候補文字群から、利用者の指定に基づき、正解の文字を
抽出する確認訂正部4、そして、確認訂正部4における
処理結果を学習する順位学習部5と、順位学習部5の結
果を文字毎に格納する第2候補文字記憶部6から構成さ
れている。
群は、確認訂正部4を介して表示部7に表示され、利用
者は、この第2候補文字群から、正解の文字を指定し、
キーボード8を介して、確認訂正部4に通知する。
うに、それぞれの文字に対応した記憶領域をもち、この
記憶領域には、それぞれの文字の総出現回数、第1順位
での出現回数、第2順位での出現回数、さらに、第m順
位での出現回数などが記録される構成となっている。
本発明に係る処理動作を説明する。
処理動作の一実施例を示すフローチャートである。
る。
出部13で得られた文字に対応して、それぞれ、m個の認
識候補文字を取り出し、認識候補文字格納部2に出力す
る(ステップ201)。この時、m個の認識候補文字は、
それぞれ、予め設定された順位で出力される。
る。
に格納したならば(ステップ202)、次に、候補文字選
別部3は、認識候補文字格納部2に記憶されたm個の認
識候補文字の各々に対して、第2候補文字記憶部6の内
容を参照し(ステップ203)、第2候補文字群となり得
る文字、すなわち、正解文字として抽出される確率の高
い文字を選別する(ステップ204)。そして、選別した
第2候補文字群を、確認訂正部4に送出する(ステップ
205)。
候補文字群を表示部7に表示する(ステップ206)。利
用者は、表示部7に表示している第2候補文字群から正
解文字を指定し、キーボード8を介して正解文字を入力
する(ステップ207、208)。そして、確認訂正部4は、
利用者が入力した正解文字を順位学習部5へ送る(ステ
ップ209)。
から受け取ると、認識候補文字格納部2を参照して、正
解文字の実際の順位を求める(ステップ210)。
補文字記憶部6の領域における総出現回数と、当該順位
の出現回数を変更して、第2候補文字記憶部6に記憶し
ている内容を更新する(ステップ211)。
文字を確定させる度に、この正解文字に関して、その認
識候補文字群中での出現順位と、出現頻度を対応させて
記憶していた内容を更新する。そのことにより、候補文
字選別部3は、第1認識候補文字群の中から、より正解
度の高い候補文字を選別して表示することが出来る。
文字群の表示部への表示構成の一実施例を示す説明図で
ある。
解の文字候補欄31、第2順位の正解の文字候補欄32、さ
らに、最後の候補としての第m順位の正解の文字候補欄
33から構成される第2文字候補群30が表示されている。
から正解文字を確認して、第1図のキーボード8を介し
て正解文字を入力する。
文字が、絞り込まれており、表示される候補文字が少な
く、利用者は、容易に、正解の文字を認識し、指定する
ことが出来る。
構成を示す説明図である。
装置などから構成され、ある文字、例えば、候補文字
「間」41に対応する記憶領域40には、この文字の総出現
回数(N0)401、第1順位での出現回数(N1)402、第2
順位での出現回数(N2)403、さらに、第m順位での出
現回数(Nm)404が記憶される構成となっている。
参照し、認識候補文字格納部2の第1候補文字群から、
さらに、第2図に示された第2候補文字群を選別する。
位学習部5の動作を、第3図、および、第4図に示され
た認識候補文字の記憶構成を用いて、さらに具体的に説
明する。
係る処理動作の一実施例を示すフローチャートである。
出現の割合の基準「T」を、予め、設定する(ステップ
501)。
m個の認識候補文字の各々に対して、第2候補文字記憶
部6の内容を参照し、以下の動作を行なう。
テップ502)。これを、例えば、「X」とする。そし
て、この文字「X」に対応する第2候補文字記憶部6の
内容に基づき、文字「X」の出現の割合が、「T」以上
となる最小の順位を求める(ステップ503)。
6の内容を、総出現回数が「N0(X)」、第i順位での
出現回数が「Ni(X)」(i=1、2、・・・、m)と
する。
なる最小の順位「k」を求める。尚、「T」は、通常、
0.8〜0.9に設定すれば良い。
文字格納部2における順位(k0(X)とする)を比較す
る(ステップ504)。
文字「X」を候補文字として採用すると判定する(ステ
ップ506)。
ば、文字「X」を候補文字として採用しないと判定する
(ステップ508)。
「X」を候補文字として採用すると判定したならば、文
字「X」を、確認訂正部4に送出する(ステップ50
7)。
認識候補文字群に対して行ない、認識候補文字の選別結
果を確認訂正部4に送る。
処理動作の一実施例を示すフローチャートである。
た候補文字群を第3図の第2候補文字群30として表示し
(ステップ601)、利用者に正解文字を選択させる(ス
テップ602、603)。すなわち、第3図の第2候補文字群
30には、第1順位の候補文字31と、第2順位以降の候補
文字32〜33を区別して表示させ、カーソルキーやマウス
などの位置指示器を用いて、利用者に正解文字を選択さ
せ(ステップ603)て、正解文字、例えば、「Y」を順
位学習部5へ送る(ステップ604)。
処理動作の一実施例を示すフローチャートである。
確認訂正部4から受け取ると、第1図の認識候補文字格
納部2を参照して、正解文字「Y」の実際の順位、例え
ば、「j」を求める(ステップ701)。
字記憶部6の領域を参照し、総出現回数「N0(Y)」
と、第j順位の出現回数「Nj(Y)」を更新する(ステ
ップ702)。
す。
での出現順位と、出現頻度を対応させて第2候補文字記
憶部6に格納し、かつ、正解文字を確定する度に、第2
候補文字記憶部6の格納内容を更新する。このことによ
り、第1図の候補文字選別部3は、認識候補文字の中か
ら、より正解度の高い候補文字を選別して表示すること
が可能となる。
数としているが、出現の比率を求めて記録しても同じ効
果が得られることは自明である。
例においては、候補文字選別部3で、第2候補文字記憶
部6の記憶内容を参照して、正解の文字となり得る確率
が高い文字のみを、認識候補文字格納部2の第1候補文
字群から、第2候補文字群として選別する。このことに
より、表示部7に表示される候補文字が少なくなり、利
用者は、正解の文字の選択が容易になり、文字認識結果
の確認訂正に要する時間を短縮することが出来る。
文字が確定する度に、順位学習部5の処理結果に基づ
き、更新される。このことにより、候補文字選別部3
は、より確度の正確な情報を得ることが出来るため、第
2候補文字群の選別を、より正確に行なうことが可能と
なる。そして、利用者の正解の文字の指定動作時の負荷
を軽減することが出来る。
して正解文字を推定する照合処理の前処理に適用すれ
ば、照合時間を短縮することが可能となる。
の出現順位と、その出現頻度とを学習し、より正確度の
高い認識候補文字を選別させ、認識候補文字の表示個数
を削減して、利用者の候補文字の確認訂正作業に掛る負
荷を軽減させる。
OCRの構成の一実施例を示すブロック図、第2図は第1
図における認識処理部の本発明に係る処理動作を示すフ
ローチャート、第3図は第1図における確認訂正部によ
る第2候補文字群の表示部への表示動作を示す説明図、
第4図は第1図における第2候補文字記憶部の記憶構成
を示す説明図、第5図は第1図における候補文字選別部
の本発明に係る処理動作の一実施例を示すフローチャー
ト、第6図は第1図における確認訂正部の本発明に係る
処理動作の一実施例を示すフローチャート、第7図は第
1図における順位学習部の本発明に係る処理動作の一実
施例を示すフローチャートである。 1:文字認識部,2:認識候補文字格納部,3:候補文字選別
部,4:確認訂正部,5:順位学習部,6:第2候補文字記憶部,
7:表示部,8:キーボード,9:認識処理部,10:帳票,11:光学
走査・光電変換部,12:前処理部,13:特徴抽出部,14:認識
辞書,30:第2候補文字群,31:第1順位の正解の文字候補
欄,32:第2順位の正解の文字候補欄,33:第m順位の正解
の文字候補欄,40:記憶領域,41:候補文字「間」,401:総
出現回数(N0),402:第1順位での出現回数(N1),403:
第2順位での出現回数(N2),404:第m順位での出現回
数(Nm)。
Claims (1)
- 【請求項1】用紙媒体上に記入され、光学的手段を用い
て読み取られたそれぞれの文字を、文字単位に画素の集
合として認識し、該画素の集合が表す文字と一致する正
解文字となる可能性のある複数個の文字からなる第1候
補文字群を、予め、任意に設定された正解文字として抽
出される確率の順位に出力する文字認識装置の認識候補
文字出力制御方法において、該出力された第1候補文字
群のそれぞれの文字の文字コードを、上記順位で記憶す
る認識候補文字格納手段と、該認識候補文字格納手段に
記憶された第1候補文字群から正解文字として抽出され
た文字に関して、正解文字として抽出された総回数、お
よび、上記順位に対応した出現回数を記憶する第2候補
文字記憶手段とを付与し、該第2候補文字記憶手段に記
憶した上記総回数と出現回数に基づき、上記認識候補文
字格納手段に記憶された候補文字から、さらに、正解文
字として抽出される確率の高い第2候補文字群を選別す
るステップと、該選別した第2候補文字群から、人手を
介して指定された正解文字を抽出するステップと、該正
解文字の上記認識候補文字格納手段での出現順位を認識
し、該正解文字の上記第2候補文字記憶手段における該
出現順位に対応した出現回数と、正解文字として抽出さ
れた総回数とを訂正するステップとを含むことを特徴と
する文字認識装置の認識候補文字出力制御方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2093724A JP2990734B2 (ja) | 1990-04-09 | 1990-04-09 | 文字認識装置の認識候補文字出力制御方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2093724A JP2990734B2 (ja) | 1990-04-09 | 1990-04-09 | 文字認識装置の認識候補文字出力制御方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03291777A JPH03291777A (ja) | 1991-12-20 |
| JP2990734B2 true JP2990734B2 (ja) | 1999-12-13 |
Family
ID=14090362
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2093724A Expired - Lifetime JP2990734B2 (ja) | 1990-04-09 | 1990-04-09 | 文字認識装置の認識候補文字出力制御方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2990734B2 (ja) |
-
1990
- 1990-04-09 JP JP2093724A patent/JP2990734B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH03291777A (ja) | 1991-12-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5159667A (en) | Document identification by characteristics matching | |
| JP2726568B2 (ja) | 文字認識方法及び装置 | |
| US7885464B2 (en) | Apparatus, method, and program for handwriting recognition | |
| JP3452774B2 (ja) | 文字認識方法 | |
| EP0565912A2 (en) | Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms | |
| EP0687991A2 (en) | Information processing method and apparatus | |
| JPH0772906B2 (ja) | 文書認識装置 | |
| JP2003524258A (ja) | 電子ドキュメントを処理する方法および装置 | |
| US5909509A (en) | Statistical-based recognition of similar characters | |
| US6567548B2 (en) | Handwriting recognition system and method using compound characters for improved recognition accuracy | |
| Bae et al. | Segmentation of touching characters using an MLP | |
| US7133556B1 (en) | Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition | |
| JP2990734B2 (ja) | 文字認識装置の認識候補文字出力制御方法 | |
| JP2586372B2 (ja) | 情報検索装置及び情報検索方法 | |
| JPH0896081A (ja) | 文字認識装置及び文字認識方法 | |
| JP4101345B2 (ja) | 文字認識装置 | |
| AU2216897A (en) | Method and device for handwritten character recognition | |
| JPH10302025A (ja) | 手書き文字認識装置およびそのプログラム記録媒体 | |
| JPS6142083A (ja) | 文字認識装置 | |
| JP2986255B2 (ja) | 文字認識装置 | |
| JP3138665B2 (ja) | 手書き文字認識方式および記録媒体 | |
| Krishnan et al. | Handwritten Text Recognition and Conversion System | |
| JP2874815B2 (ja) | 日本語文字読取装置 | |
| JPH06131503A (ja) | 文字認識処理装置 | |
| JPH04372089A (ja) | 文字認識方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071015 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081015 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091015 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101015 Year of fee payment: 11 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101015 Year of fee payment: 11 |