JPH04119488A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04119488A
JPH04119488A JP2239721A JP23972190A JPH04119488A JP H04119488 A JPH04119488 A JP H04119488A JP 2239721 A JP2239721 A JP 2239721A JP 23972190 A JP23972190 A JP 23972190A JP H04119488 A JPH04119488 A JP H04119488A
Authority
JP
Japan
Prior art keywords
dictionary
character
pattern
recognition
plural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2239721A
Other languages
English (en)
Inventor
Kenji Tanabe
田邊 憲二
Toshiyuki Yoshida
敏之 吉田
Yukio Sakamoto
幸夫 坂本
Mamoru Okada
守 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP2239721A priority Critical patent/JPH04119488A/ja
Publication of JPH04119488A publication Critical patent/JPH04119488A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野] 本発明は、イメージスキャナ等により読み取ったイメー
ジ情報から切り出された未知の文字ドツトパターンの認
識を行う文字認識装置に関し、特に、認識時に用いる2
値化しきい値が変化した場合でも、認識率および認識速
度を低下させないようにした文字認識装置に関する。
〔従来の技術] パターンマツチングによる文字認識装置においては、通
常は、固定的な2値化しきい値を用いて得た文字ドツト
パターンを辞書と照合するようにしていた。この場合、
読み取り対象となる帳票類の筆記具の種類等に応じて、
2値化しきい値を適宜変化させることも行われていた。
なお、これに関しては、例えば、橋本新一部編著「文字
認識概論J(電気通信協会昭和57年発行)の第2章認
識理論(11〜13頁)の記載を参考にすることができ
る。
しかし上記技術においては、固定的な2値化しきい値を
用いているため、読み取り対象となる帳票類の筆記具の
種類等に応じて、2値化しきい値を適宜変化させたとし
ても、適正な2値化しきい値を浦定することが難かしく
、文字ドツトパターンの文字幅が変動することになって
、認識率の低下を招くという問題があった。
これに対しては、認識率の低下を防止するる目的で、イ
メージ情報から切り出された文字ドツトパターンの文字
幅を正規化する処理を含む文字認識装置が知られている
。なお、これに関しては、例えば、長谷用等著の[画像
処理の基本技法〈技法入門編〉」(技術評論社、昭和6
1年発行)の第■部第3章「画像処理の基本アルゴリズ
ム」(64〜67頁)の記載を参考にすることができる
〔発明が解決しようとする課題〕
しかし、上記従来技術に示す装置の場合には、文字ドツ
トパターンの文字幅を正規化する処理のオーバヘッドの
ため、認識速度が低下するという別の問題があった。
これに対しては、辞書を複数の異なる2値化しきい値に
対応して作成した複数の辞書で構成し、イメージスキャ
ナ等により読み取り、2値化したドツトイメージから切
り出した未知の文字ドツトパターンを、上述の複数の辞
書中の文字ドツトパターンと照合し、最も一致度が高い
辞書パターンに対応する文字のコードを出力するように
することが考えられる。
但し、この場合には、複数の辞書中のすべての文字ドツ
トパターンとの照合を行うため、処理のオーバヘッドが
大となり、認識速度が低下することが考えられる。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の技術における上述の如き問題を解
消し、認識時に用いる2値化しきい値が変化した場合で
も、認識率および認識速度が低下しないようにした文字
認識装置を提供することにある。
〔課題を解決するための手段〕
本発明の上述の目的は、イメージスキャナ等により読み
取り、2値化したドツトイメージから切り出した未知の
文字ドツトパターンを、辞書内容と照合して認識する文
字認識装置において、前記辞書を、複数の異なる2値化
しきい値に対応して作成した複数の辞書で構成するとと
もに、該複数の辞書中のいずれかを基本辞書として、該
基本辞書中の文字ドツトパターンと前記文字ドツトパタ
ーンとを照合することにより候補文字を絞り込む手段と
、前記基本辞書以外の辞書における前記候補文字に対応
する辞書パターンと前記文字ドツトパターンとを照合す
る手段を有する如く構成したことを特徴とする文字認識
装置によって達成される。
[作用] 本発明に係る文字認識装置においては、辞書を複数の異
なる2値化しきい値に対応して作成した複数の辞書で構
成して、イメージスキャナ等により読み取り、2値化し
たドツトイメージから切り出した未知の文字ドツトパタ
ーンを、上述の複数の辞書中の予め定ろた基本辞書中の
文字ドツトパターンと照合し、最も一致度が高い辞書パ
ターンについてのみ、他の複数の辞書中の対応する辞書
パターンとの照合を行い、対応する文字のコードを出力
するようにしたので、2値化しきい値が変化した場合で
も、認識率および認識速度が低下しないようにした文字
認識装置を実現できるものである。
[実施例] 以下、本発明の実施例を図面に基づいて詳細に説明する
まず、パターン照合方法について説明する。
イメージスキャナ等により読み取り、2値化したドツト
イメージから切り出した未知の文字ドツトパターンを、
第2図に示す如く、縦m×横nのメツシュに分割し、(
mXn)次元のベクトルQ(q、、、・・・・+qmn
)で表わす。但し、ここで、qi、aは1行J列のメツ
シュ内にある黒画素数を示している。辞書中の個々の文
字も、同様に、(mXn)次元のベクトルPで表わされ
ている。なお、本実施例においては、m = n = 
6としている。
次に、ドツトパターンのベクトルと、辞書中のベクトル
とを比較したときの距離D(一致度)を、次式で定義す
る。この距離値が最小となる辞書パターンPを求めるこ
とにより、未知パターン認識するものである。
D=Σ pi、I QL+ ここで、pjJは辞書パターンPの要素、q工Jは未知
パターンQの要素を示している。
次に、辞書の構成について説明する。一つの辞書は、上
述のベクトルPを、例えば、第3図に示す如く、14種
の文字(これらはJ I S X9002−1980「
磁気インク文字読取用字体及び印字仕様(E13B)J
に規定されているものである。)について、それぞれ持
つ。本実施例では、イメージスキャナの読み取り濃度の
レンジの中間値、実用範囲の両端値およびこれらの間を
補う値を、2値化しきい値として文字パターンを収集し
、異なる辞書を作成している。具体的には、読み取り濃
度のレンジをO〜255の256段階とするとき、80
.100.128゜160、180のそれぞれで作成し
た5個の辞書を使用している。なお、ここでは、2値化
しきい値+28のときに作成した辞書を、基本辞書(辞
書O)とする。
第1図に、本発明の一実施例の文字g識装置を示す。図
中、lは読み取り対象の帳票等を読み取るイメージスキ
ャナ、2はイメージスキャナ1により読み取ったイメー
ジ情報を一旦格納するイメージ情報格納部、3はイメー
ジ情報格納部2中のイメージ情報から1文字毎の文字ド
ツトパターンを切り出す文字切り出し部、4は辞書部5
内の辞書パターンと文字切り出し部3がら入力される文
字パターンとの照合を行うパターン照合部である(この
詳細については後述する)。また、6は認識結果の情報
を格納しておく認識結果情報格納部を示している。
以下、本実施例の動作を説明する。
イメージスキャナ1は、帳票等から文字列を読み取り、
2値化して、2次元の画素の集合(o:白画素、1.黒
画素とする)に変換して、イメージ情報格納部2に格納
する。ここでは、文字部分の画素を黒画素とする。
次に、文字切り出し部3が動作して、イメージ情報から
1文字毎の文字ドツトパターンを切り出す。この方式に
ついては、種々の方式を利用することが可能である。
次に、パターン照合部4は、まず、第1パターン照合部
41により、切り出された1文字分の未知の文字ドツト
パターンに対して、辞書部5の基本辞書部51の辞書O
中の辞書パターンとの間でパターン照合を行い、最小の
距離値を持つ辞書パターンに対応する文字を81.2番
目に小さい距離値を持つ辞書パターンに対応する文字を
82とする。
次に、第2パターン照合部42により、辞書部5の複数
辞書部52の、辞書0以外の辞書(辞書l、辞書2.辞
書3および辞書4)において、第1パターン照合部41
で求めたSlと82に対応する辞書パターンとのみ、照
合を行う。
そして、上述のすべての照合が終了した後、最小の距離
(これをDIとする)を持つ辞書パターンを第1候補と
し、同一辞書で2番目に小さい距離(これをD2とする
)を持つ辞書パターンを第2候補とする。
更に、リジェクト判定部43では、信頼性を高めるため
に、二つのしきい値αおよびβを設定し、Dlくα、 かつ、 D2D1)β の場合を正解とする。上記α、βは例えば、α=150
、β=50とする。正解が得られた場合には、第1候補
の辞書パターンに対応する文字コードを認識結果格納部
6へ出力する。
上記実施例においては、辞書パターンと米中パターンと
の照合回数が、 従来の方式の場合ニア0回 であったのに対して、 実施例の場合、22回 となり、約173となった。
上記実施例によれば、帳票上の認識対象文字の濃度にば
らつきがあり、帳票毎または文字毎に2値化しきい値の
調整が必要となるような手書き帳票の認識に特に有効で
、この場合にも、認識率および認識速度が低下しないよ
うにした文字認識装置を実現することができる。
なお、上記実施例は本発明の一例を示すものであり、本
発明はこれに限定されるべきものではないことは言うま
でもない。
〔発明の効果] 以上、詳細に説明した如く、本発明によれば、イメージ
スキャナ等により読み取り、2値化したドツトイメージ
から切り出した未知の文字ドツトパターンを、辞書内容
と照合して認識する文字認識装置において、前記辞書を
、複数の異なる2値化しきい値に対応して作成した複数
の辞書で構成するとともに、該複数の辞書中のいずれか
を基本辞書として、該基本辞書中の文字ドツトパターン
と前記文字ドツトパターンとを照合することにより候補
文字を絞り込む手段と、前記基本辞書以外の辞書におけ
る前記候補文字に対応する辞書パターンと前記文字ドツ
トパターンとを照合する手段を有する如く構成したので
、認識時に用いる2値化しきい値が変化した場合でも、
認識率および認識速度が低下しないようにした文字認識
装置を実現できるという顕著な効果を奏するものである
++
【図面の簡単な説明】
第1図は本発明の一実施例の文字認識装置を示す図、第
2図はパターン照合方法を説明する図、第3図は実施例
で用いた文字集合を表わす図である。 l:イメージスキャナ、2:イメージ情報格納部、3:
文字切り出し部、4:パターン照合部、41:第1パタ
ーン照合部、42:第2パターン照合部、43:リジェ
クト判定部、5:辞書部、51:基本辞書部、52:複
数辞書部、6:認識結果情報格納部。 名称 ストローク O ストローク 1 ストローク 2 ストローク 3 ストローク 4 ストローク 5 ストローク 6 文字 名 称 ストローク ストローク ストローク ストローク ストローク ストローク ストローク

Claims (1)

    【特許請求の範囲】
  1. (1)イメージスキャナ等により読み取り、2値化した
    ドットイメージから切り出した未知の文字ドットパター
    ンを、辞書内容と照合して認識する文字認識装置におい
    て、前記辞書を、複数の異なる2値化しきい値に対応し
    て作成した複数の辞書で構成するとともに、該複数の辞
    書中のいずれかを基本辞書として、該基本辞書中の文字
    ドットパターンと前記文字ドットパターンとを照合する
    ことにより候補文字を絞り込む手段と、前記基本辞書以
    外の辞書における前記候補文字に対応する辞書パターン
    と前記文字ドットパターンとを照合する手段を有する如
    く構成したことを特徴とする文字認識装置。
JP2239721A 1990-09-10 1990-09-10 文字認識装置 Pending JPH04119488A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2239721A JPH04119488A (ja) 1990-09-10 1990-09-10 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2239721A JPH04119488A (ja) 1990-09-10 1990-09-10 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04119488A true JPH04119488A (ja) 1992-04-20

Family

ID=17048936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2239721A Pending JPH04119488A (ja) 1990-09-10 1990-09-10 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04119488A (ja)

Similar Documents

Publication Publication Date Title
CA1160347A (en) Method for recognizing a machine encoded character
US4847912A (en) Method of detecting a space between words with optical character reader
Amin et al. Recognition of printed Arabic text using neural networks
Agarwal et al. Bank check analysis and recognition by computers
JPH04119488A (ja) 文字認識装置
JP2000090194A (ja) 画像処理方法および画像処理装置
JPH04119487A (ja) 文字認識装置
JPH0291789A (ja) 文字認識方法
JPH08272902A (ja) 異字体異品質文字の認識方法
KR100200619B1 (ko) 문자열 영상에서 어절 영상을 분리하는 방법
JPS6336389A (ja) 文字読取装置
JPH0484380A (ja) 文字認識装置
JP2002312398A (ja) 文書検索装置
JP3127413B2 (ja) 文字認識装置
Said Automatic processing of documents and bank cheques
JPS62262194A (ja) 光学式文字読取装置
Senior Normalisation and Preprocessing for a Recurrent Network Off-line Handwriting Recognition System
JP2917396B2 (ja) 文字認識方式
JP2002024763A (ja) 文字認識方法及び装置
Amano Restoration of decorative headline images for document retrieval
JPH08161428A (ja) 文字認識方法
JPS60138689A (ja) 文字認識方法
JPH04343193A (ja) 2値化閾値設定方法
JPS6327992A (ja) 個人用辞書作成方法
JPS5914078A (ja) 帳票読取装置