JPS59128682A - 文字読取り装置 - Google Patents

文字読取り装置

Info

Publication number
JPS59128682A
JPS59128682A JP58003002A JP300283A JPS59128682A JP S59128682 A JPS59128682 A JP S59128682A JP 58003002 A JP58003002 A JP 58003002A JP 300283 A JP300283 A JP 300283A JP S59128682 A JPS59128682 A JP S59128682A
Authority
JP
Japan
Prior art keywords
character
appearance frequency
characters
similarity
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58003002A
Other languages
English (en)
Inventor
Haruo Mizukami
水上 治雄
Masataka Yamamoto
山本 勝敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP58003002A priority Critical patent/JPS59128682A/ja
Publication of JPS59128682A publication Critical patent/JPS59128682A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、帳票などに記録された文字を認識するに当
り、入力文字/母ターンと認識辞書内の基準文字ノリー
ンとの類似度と、帳票上の各文字位置での文字又はサブ
セットの出現頻度を用いて文字を認識して読み取る文字
読取り装置に関するものである。
〔従来技術〕
従来この種の文字読取り装置においては、未知の文字ノ
4ターンと認識辞書内の基準文字パターンとの類似度の
みを用いて文字を認識して読み敗るように構成されてい
るので、漢字等を含む多字種の文字を認識対象とする場
合には、類似した文字が多いということかからして文字
の認識率が低下するとい5欠点があった。また、帳票の
読み取りフィールドごとに読み取り字種や読み取りサブ
セットを指定する方法も提案されているが、この場合に
は、帳票フォーマットを作成するのが非常に面倒である
という欠点があった。
〔発明の概要〕
この発明は、上記のような従来のものの欠点を除去する
目的でなされたもので、文章入力用以外の帳票などにお
いては、この帳票の各文字位置によって出現しやすい文
字又はサブセットと、出現しにくい文字又はサブセット
が存在するという観点から、入力文字パターンと認識辞
薔内の基準文字パターンとの類似度と、帳票上の各文字
位置での文字又はサブセットの出現頻度を用いて文字を
認識するようにし、これにより文字認識精度を向上させ
ることができるようにした文字読取り装置を提供するも
のである。
〔発明の実施例〕
以下、この発明の実施例について説明する。図面はこの
発明の一実施例である文字読取り装置を示す!ロック構
成図である。図において、lは帳票、2は帳票l上の文
字を走査して電気信号に変換する走査手段、3は走糞手
段2で得られた文字の電気信号から文字の2値ノリーン
等を得る前処理手段、4は前処理手段3で前処理を施さ
れた文字ノeターンから特徴を抽出する特徴抽出手段、
6は認識対象文字の基準・リーンの特徴を格納した認識
辞書、5は特徴抽出手段4で抽出された特徴と認識辞書
6内の基準文字・母ターンの特徴とから類似度を計算す
る類似度計算手段、7は帳票l上の各文字位置での認識
対象文字の出現頻度、又は漢字、英字、数字1月数名、
平板名、記号などのサブセットの出現頻度を格納する出
現頻度格納手段、8は判定手段、9は読み取り結果、1
0は文字の認識結果から帳票1の各文字位置での文字又
はサブセットの出現頻度を更新する出現頻度更新手段で
ある。
次に、上記図面に示された構成を有する文字読取り装置
の動作について説明する。まず、帳票1上に書かれた文
字を、走査手段2で、あらかじめ与えられた帳票フォー
マットに基づいて走査して電気信号に変換する。前処理
手段3では、走査手段2で得られた文字の電気信号から
文字の2値化等の前処理を施した文字/4’ターンを得
る。特徴抽出手段4では、前処理手段3で前処理を施さ
れた文字パターンの特徴を抽出する。類似度計算手段5
では、特徴抽出手段4で得られた入力文字/IPターン
Piの特徴と、認識辞書6に格納されているすべての基
準文字・母ターンPjの特徴とのマツチングを取り、類
似度Sijを求める。出現頻度格納手段7には、認識対
象となっている各文字について、現在読み取ろうとして
いる文字が記入されている帳票1上の位置での出現頻度
Fijが格納されている。判定手段8では、上記類似度
Sijと上記出現頻度FBjから計算するf(81j、
Fij)を用いて、入力文字ツクターンPiがどの文字
であるか、又は読み取り拒否とするかどうかを判定する
。また、判定手段8で得られた読み取り結果9を出現頻
度更新手段10に送り、文字の出現頻度を更新する。た
だし、読み取り結果9が読み取り拒否の場合には、読み
取り結果9を出現頻度更新手段lOには送らない。
さて、実際の具体例として、通常の場合、同じフォーマ
ットを持つ帳票lを連続して読み取ることが多くある。
この場合、最初は文字の出現頻度がすべての文字につい
て0であるから、帳票1のID(R別うベル)を読み取
り、それに基づいた帳票フォーマットに従い、類似度だ
けを用いて文字の認識を行なう。そして、その読み取り
結果9により文字の出現頻度を更新する。この場合、読
み取り結果9が誤読であっても、実用レベルでの文字認
識精度は90数−以上であるから、文字の出現頻度に悪
影響を及ぼすことは少ない。文字の出現頻度が更新され
て行くと、上記類似度と文字の出現頻度を用いて文字を
認識する。例えば、帳票1のある文字位置に記録された
文字ノeターンに対して、片仮名「り」と数字「7」が
同程度の類似度を持った候補文字となったとき、その文
字位置での文字の出現頻度のうち、数字「7」の方が圧
倒的に片仮名「り」より大きければ、読み取り結果9を
数字「7」とする。つまり、類似度だけを用いて文字を
認識する場合に比較して、より高い認識精度を得ること
ができる。ここで、別のIDを持つ帳票1が来た場合に
は、別の帳票lのIDに対応する帳票フォーマットの文
字の出現頻度を用いて文字の認識を行なう。
なお、上記実施例では類似度と文字の出現頻度を用いて
判定する場合について説明したが、文字の出現頻度の代
わりに、帳票1上の文字位置ごとに、漢字、英字、数字
2月数名、平板名、記号などのサブセットのうち、どの
サブセットが出現しやすいかというサブセットの出現頻
度を用いて文字を認識するようにしても良い。
〔発明の効果〕
この発明は以上説明したように、帳票などに記録された
文字を認識するのに、入力文字/ぐターンから抽出され
た特徴と認識辞書内の基準文字・ぐターンの特徴との類
似度と、帳票上の文字位置ごとの文字の出現頻度又はサ
ブセットの出現頻度を用いて文字を認識するように構成
したので、従来のこの種の文字読取り装置におけるよう
に、類似度だけを用いて文字を認識する場合に比較して
、文字に対する認識率の精度をより一層向上させること
ができるという優れた効果を奏するものである。
【図面の簡単な説明】
図面はこの発明の一実施例である文字読取り装置を示す
ブロック構成図である。 図において、1・・・帳票、2・・・走査手段、3・・
・前処理手段、番・・・特徴抽出手段、5・・・類似度
計算手段、6・・・認識辞書、7・・・出現頻度格納手
段、8・・・判定手段、9・・・読み取り結果、lO・
・・出現頻度更新手段である。 代理人  葛野信−

Claims (1)

    【特許請求の範囲】
  1. 帳票などに記録された文字を認識して読み取る文字読み
    取り装置において、あらかじめ与えられた帳票フォーマ
    ットに従って文字を走査して電気信号に変換する走査手
    段と、該走査手段で得られた文字の電気信号から文字の
    2値ノソターン等を得る前処理手段と、該前処理手段で
    前処理を施された文字・母ターンから特徴を抽出する特
    徴抽出手段と、認識対象文字の基準A’ターンの特徴を
    格納した認識辞書と、前記帳票上の各文字位置での認識
    対象文字の出現頻度、又は漢字、英字、数字1片仮名、
    平板名、記号などのサブセットの出現頻度を格納する出
    現頻度格納手段と、前記特徴抽出手段で抽出された特徴
    と前記認識辞書内の基準文字ノぐターンの特徴とから類
    似度を計算する類似度計算手段と、文字の認識結果から
    前記帳票の各文字位置での文字又はサブセットの出現頻
    度を更W[する出現頻度更新手段とを具備し、前記類似
    度と前記出現頻度を用いて文字を認識するよ5にしたこ
    とを特徴とする文字読取り装置。
JP58003002A 1983-01-12 1983-01-12 文字読取り装置 Pending JPS59128682A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58003002A JPS59128682A (ja) 1983-01-12 1983-01-12 文字読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58003002A JPS59128682A (ja) 1983-01-12 1983-01-12 文字読取り装置

Publications (1)

Publication Number Publication Date
JPS59128682A true JPS59128682A (ja) 1984-07-24

Family

ID=11545151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58003002A Pending JPS59128682A (ja) 1983-01-12 1983-01-12 文字読取り装置

Country Status (1)

Country Link
JP (1) JPS59128682A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01219971A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文字認識方式
JPH03223986A (ja) * 1989-12-26 1991-10-02 Fuji Facom Corp 認識結果のリジェクト方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01219971A (ja) * 1988-02-29 1989-09-01 Fujitsu Ltd 文字認識方式
JPH03223986A (ja) * 1989-12-26 1991-10-02 Fuji Facom Corp 認識結果のリジェクト方法

Similar Documents

Publication Publication Date Title
US5077805A (en) Hybrid feature-based and template matching optical character recognition system
JPH0221383A (ja) 光学文字読取装置
JPS6140684A (ja) 輪郭追跡装置
JP2004280334A (ja) 画像読み取り装置
JPS59128682A (ja) 文字読取り装置
JPH11328315A (ja) 文字認識装置
JPS6316795B2 (ja)
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2985813B2 (ja) 文字列認識装置および知識データベース学習方法
JPH0475557B2 (ja)
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP2630261B2 (ja) 文字認識装置
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP2959054B2 (ja) パターン認識装置における線種判別方式
JPS60238986A (ja) 文字認識装置のパタ−ンマツチング方式
JP2746345B2 (ja) 文字認識の後処理方法
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP2973898B2 (ja) 文字認識方法及び装置
JP2828820B2 (ja) 指紋照合装置
JPH05274464A (ja) 電子ファイリング装置
JPH0426153B2 (ja)
JPH11288461A (ja) 画像認識方法および記録媒体
JPH0436431B2 (ja)
JP2000288478A (ja) 宛先特定装置
JPH0578068B2 (ja)