JPS6379193A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS6379193A
JPS6379193A JP61224516A JP22451686A JPS6379193A JP S6379193 A JPS6379193 A JP S6379193A JP 61224516 A JP61224516 A JP 61224516A JP 22451686 A JP22451686 A JP 22451686A JP S6379193 A JPS6379193 A JP S6379193A
Authority
JP
Japan
Prior art keywords
character
handwritten
printed
characters
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61224516A
Other languages
English (en)
Inventor
Nobuyuki Hirose
広瀬 信之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61224516A priority Critical patent/JPS6379193A/ja
Publication of JPS6379193A publication Critical patent/JPS6379193A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、たとえば郵便物自動読取区分機において、
郵便物上に記載されている宛名を読取る文字読取装置に
関する。
(従来の技術) 従来、郵便物自動読取区分機においては、区分情報とし
て郵便物上の郵便番号や宛名としての都道府県名、市名
1区名および町名などの地名を読取って判定し、この結
果から区分先を判定するものが種々考案されている。
しかし、地名から区分先を判定する装置で読取られる地
名としては、文字情報の形式および使用文字種が多用で
ある。また、最近では、地名などを手書きした手書き文
字による郵便物に変わって、ワープロ(ワードプロセッ
サ)などによって地名などを印刷した印活文字(印刷活
字)による郵便物が増えている。このため、文字形状の
特徴または複合類似度などの認識手段を用いる場合、認
識(照合)に必要とされる文字パターン情報の数が増加
し、上記認識手段の構成(ハードウェアおよびソフトア
エア)が大型化してしまい、認識処理に時間が係るとい
う欠点があった。
そこで、係員により手書き文字による郵便物と印活文字
による郵便物とをあらかじめ選別し、使用する文字パタ
ーン情報を限定するような方法を取っているが、これで
は係員への負担が大きいという欠点があった。
(発明が解決しようとする問題点) この発明は、係員への負担が大きいという欠点を除去し
、手書き文字による郵便物と印刷活字による郵便物との
選別を自動化し、係員への負担を軽減するとともに、処
理速度の向上が図れる文字読取装置を提供することを目
的とする。
[発明の構成] (問題点を解決するための手段) この発明の文字読取装置は、文字情報を読取って認識す
る文字読取装置において、被読取物上を光学的に走査す
る走査手段と、この走査手段により得られた画像情報か
ら文字行および文字行における各文字領域を検出する検
出手段と、この検出手段により検出された文字行におけ
る各文字領域のばらつきから、文字情報が手書き文字か
印刷活字かを判定する判定手段と、手書き文字の基準と
なるパターン情報を記憶している手書き文字パターン記
憶部と、印刷活字の基準となるパター、ン情報を記憶し
ている印刷活字パターン記憶部とを備えた記憶手段と、
上記判定手段の判定結果にもとづいて、上記記憶手段の
手書き文字パターン記憶部あるいは印刷活字パターン記
憶部を選択して文字情報の認識処理を行う処理手段とか
ら構成されるものである。
(作用) この発明は、被読取物上を光学的に走査することによっ
て得られた画像情報から文字行および文字行における各
文字領域を検出し、この文字行における各文字領域のば
らつきから文字情報が手書き文字か印刷活字かを判定し
、この判定により手書き文字と判定された場合には手書
き文字パターン記憶部を選択して文字情報の認識処理を
行い、また上記判定により印刷活字と判定された場合に
は印刷活字パターン記憶部を選択して文字情報の認識処
理を行うようにしたものである。
(実施例) 以下、この発明の一実施例について図面を参照して説明
する。
第1図において、11は走査部で、矢印ノ方向に搬送さ
れる被読取物、たとえば郵便物1の搬送路に沿って設け
られている。この走査部11は、第2図に示すように、
郵便物1上の視野範囲を光学的に走査して光電変換する
ことにより得られる光学的電気信号をアナログ信号に変
換し、このアナログ信号を2値または多値の量子化信号
として出力するものである。この走査部11は、たとえ
ば郵便物1上に光を照射する光源、その反射光を受けて
アナログ信号に変換する自己走査形のCODイメージセ
ンサ、およびそのアナログ信号を2値または多値の量子
化信号に変換する二子化回路などによって構成される。
12は文字行検出装置で、上記走査部11からの量子化
信号を画像メモリ13に格納し、この画像メモリ13で
格納された画像パターンから宛名部2、たとえば地名3
が存在する最上行4や受取人名5などが存在する最下行
6の位置を検出し、その領域の座標を出力するものであ
る。この文字行検出装置12は、たとえば走査部11か
ら供給される量子化信号によりX方向への投影であるX
マスクを作成するXマスク作成回路、Y方向への投影で
あるYマスクを作成するXマスク作成回路、およびそれ
らのマスク信号で抽出される各行情報と各条件情報とに
より、Xマスク内にある各行が宛名情報ブロックとして
ふされしいか否かを判定し、その判定したブロックの左
側のX座標値および左上端のY座標値を選択出力する判
定回路などによって構成されている。
14は文字検出切出部で、上記文字行検出装置12から
の座標値にもとづいて、画像メモリ13で格納された画
像パターンから宛名部2における各文字をそれぞれ検出
切出しするものである。この文字検出切出部14は、切
出し文字に対応してマスクを作成し、そのマスクごとに
各文字パターンを1文字ずつ検出切出しするようになっ
ている。
15は文字判定部で、上記文字検出切出部14からの各
文字パターンに対応する文字マスクのばらつき、たとえ
ば各文字マスクの幅(W)のばらつき、高さくH)のば
らつき、大きさく面積S)のばらつき、マスク間のピッ
チ(間隔P)のばらつき、および行方向に対するずれ量
として中心線から各文字マスクの中心位置までの距離(
Q)のばらつき、さらには最下行4および最下行6の傾
き(R)のばらつきを算出し、これらの各ばらつきの度
合い(分散σ2)としきい値(σ2 TH)との関係か
らポイントを換算し、各分散パラメータ(σ2)に対す
るポイントの総和が所定値より大きいか否かにより、上
記宛名部2が手書き文字によるものかあるいは印活文字
(印刷活字)によるものかを判定するものである。
この文字判定部15は、基準点から各文字マスクの左端
、右端、上端、下端までのそれぞれの座標を位置パラメ
ータとして算出し、この位置パラメータ(座標値)から
各分散パラメータを求めるばらつき算出回路16、およ
びこのばらつき算出回路16からの各分散パラメータと
しきい値との比較によるポイントの総和(トータルポイ
ントTp)から手書き文字か印活文字かを判定する判定
回路17とから構成される。
すなわち、ばらつき算出回路16は、第3図に示すよう
に、たとえば基準点としての宛名部2の左上端の座標値
(A点)から各文字マスクa、b。
・・・の左端X 1 + 右端X2.上端y1.下端y
2までの座標(位置パラメータ)をそれぞれ算出する。
ついで、第4図に示すように、上記各文字マスクの位置
パラメータをもとに、各文字マスクa、b。
・・・の幅(Wa、Wb、・・・)に対する分散σ2W
1高さくHa、Hb、・・・)に対する分散σ2H1大
きさくS a、  S b、・・・)に対する分散σ2
s1マスクa、b、・・・間のピッチ(P)に対する分
散σ2P1および最下行4および最下行6ごとの各文字
マスクの中心位置Nから中心線(ここでは、最小2乗法
により、文字マスクの中心位置Nからの距離(Q)に対
する分散σ2Qが最小となるように求めた直線)Lまで
の距離(Qa、Qtj、・・・)に対する分散σ2Q1
さらには基準線にと中心線りとの角度(R)に対する分
散σ2Rを、それぞれ次式(1)にもとづいて算出する
ただし、Nは文字マスクの数 Xiは各文字マスクの値 xiは文字マスクの平均値 上記ばらつき算出回路16によって算出された各分散パ
ラメータσ2は、判定回路17に出力される。この判定
回路17には、印活文字に対する分散パラメータσ2m
に対して手書き文字に対する各分散パラメータσ2hの
値が高くなる(σ2h>σ2m)ことから、各分散パラ
メータσ2に対するしきい値σ2TH (σ2h>σ2TH>σ2m)がそれぞれ設定されてお
り、これらのしきい値σ2THと各分散パラメータσ2
とを比較することによりポイントに換算する。そして、
各分散パラメータσ2に対するポイントの総和を取るこ
とによってトータルポイントTpを算出し、このトータ
ルポイントTpが所定値より大きいか否かにより手書き
文字か印活文字かを判定するようになっている。
すなわち、文字マスクの幅(W )に対する分散パラメ
ータσ2wとしきい値σ2 WTHとの比較の結果、文
字マスクの幅(W)に対する分散パラメータσ2wがし
きい値σ2 WTHより大きい場合(σ2w≧σ25v
ru)にはプラスのポイントを与え、小さい場合(σ2
wくσ2 +HTH)にはマイナスのポイントを与える
ことにより、文字マスクの幅(W)に対する分散パラメ
ータσ2w8ポイントTpWに換算する。
同様にして、高さくH)に対する分散σ2Hs大きさく
S)に対する分散σ2s1各文字マスク間のピッチ(P
)に対する分散σ2P1および行ごとの各文字マスクの
中心位置Nから中心線りまでの距離(Q)に対する分散
σ2Q1さらには基準線にと中心線りとの角度(R)に
対する分散σ2Rを、それぞれのしきい値σ2THとの
比較によってポイントTpH,TpSSTl)P。
TpQ、 TpRに換算し、これらのポイントの総和(
トータルポイント)Tpを求める。
Tp=Tpw +TpH+TI)S 十Tpp +TpQ +TI)R そして、このトー・タルポイントTpが所定値「0」よ
り大きい場合(Tp≧0)は手書き文字と判定し、トー
タルポイントTpが所定値「0」より小さい場合(T 
p < 0)は印活文字と判定し、この判定結果を文字
認識部18に出力する。
文字認識部18は、上記文字検出切出部14から供給さ
れる文字パターンを、たとえば文字判定部15からの判
定結果に応じてパターン辞書部1つ内の手書き文字に対
する基準パターンあるいは印活文字に対する基準パター
ンを選択し、この選択された基準パターンとの照合(比
較)により候補となる文字を認識するものである。
上記パターン辞書部1つは、たとえば数字、漢字、カタ
カナなどに対する基準パターンとして、手書き文字に関
する文字の特徴やサンプル画像などの情報が記憶されて
いる手書き文字パターン辞書19aと、印活文字に関す
る文字の特徴やサンプル画像などの情報が記憶されてい
る印活文字パターン辞書19bとから構成されている。
すなわち、第5図(c)に示すような文字パターンが上
記文字検出切出部14から供給された場合、文字認識部
18は文字パターンの大きさおよび傾きなどを正規化し
た文字情報を、文字判定部15からの判定結果に応じた
基準パターン、たとえば手書き文字パターン辞書19a
内の数字、漢字、カタカナなどに対する基準パターンと
の相関関係(重なり具合)を比較するパターンマツチン
グ法、あるいは線の方向、ループ、交点などの文字の特
徴を比較するストローク法のいずれか、またはパターン
マツチング法およびストローク法の両方を併用すること
によって認識を行い、認識の結果として候補文字を出力
する。
また、たとえば第6図(c)に示すような文字パターン
が上記文字検出切出部14から供給された場合、文字認
識部18は正規化した文字情報を、文字判定部15から
の判定結果に応じた文字パターン、たとえば印活文字パ
ターン辞書19’b内の基準パターンとのマツチング法
などにより認識を行い、候補の文字を出力する。
次に、このような構成において動作を説明する。
たとえば今、郵便物1が搬送路上を矢印1方向に搬送さ
れ、走査部11が郵便物1上を光学的に走査して光電変
換することにより、その孟子化信号が文字行検出装置1
2に出力される。そして、文字行検出装置12によって
画像メモリ13に記憶された画像パターンから宛名部2
のみが抽出される。さらに、文字検出切出部14によっ
てマスクが作成され、そのマスクごとに各文字が1文字
ずつ検出切出しされて文字判定部15、および文字認識
部18に供給される。
すると、文字判定部15では、ばらつき判定回路16に
より各文字マスクの位置パラメータをもとに各文字マス
クの幅(W)に対する分散σ2w、高さくH)に対する
分散σ2H1大きさくS)に対する分散σ2Ssマスク
間のピッチ(P)に対する分散σ2P1および中心線り
から中心位置Nまでの距離(Q)に対する分散σ2Q%
さらには基準線にと中心線りとの角度(R)に対する分
散σ2Rをそれぞれ算出する。そして、判定回路17に
より、各分散パラメータσ2をそれぞれのしきい値σ2
THとの比較によってポイントに換算し、この各ポイン
トの総和Tpから手書き文字か印活文字かの判定結果を
文字認識部18に出力する。
すなわち、走査部11により、第5図(a)に示すよう
な郵便物1が走査された場合、文字行検出装置12によ
り同図(b)に示す宛名部2が抽出され、文字検出切出
部14により同図(e)に示す文字マスクa、b、・・
・が切出しされる。
すると、文字判定部15では、各分散パラメータσ2と
しきい値σ2THとの比較によるポイントの換算によっ
て得られるポイントの総和Tpが所定の値「0」より大
きくなることから手書き文字と判定し、この結果を文字
認識部18に出力する。この結果、文字認識部18では
、文字検出切出部14からの各文字パターンを、上記文
字判定部15からの判定結果に応じて選択される手書き
文字パターン辞書19a内の基準パターンとの照合によ
り認識を行う。
一方、走査部11により、第6図(a)に示すような郵
便物1が走査された場合、文字行検出装置12により同
図(b)に示す宛名部2が抽出され、文字検出切出部1
4により同図(e)に示す文字マスクa、b、・・・が
切出しされる。
すると、文字判定部15では、各分散パラメータσ2と
しきい値σ2THとの比較によるポイントの換算によっ
て得られるポイントの総和Tpが所定の値「0」より小
さくなることがら印活文字(印刷活字)と判定し、この
結果を文字認識部18に出力する。この結果、文字認識
部18では、文字検出切出部14からの各文字パターン
を、上記文字判定部15からの判定結果に応じて選択さ
れる印活文字パターン辞書19b内の基準パターンとの
照合により認識を行う。
上記したように、検出切出しされる各文字パターンをマ
スクし、これらの各マスクの幅に対する分散、高さに対
する分散、大きさに対する分散、マスク間のピッチに対
する分散をそれぞれ算出し、各分散パラメータをそれぞ
れのしきい値と比較することによってポイントに換算し
、各分散パラメータに対するポイントの総和が所定の値
より大きいか否かにより手書き文字か印活文字かを判定
するようにしている。すなわち、手書き文字は、印活文
字に比べ文字の大きさや間隔、文字の並びなどのばらつ
きが激しいことを利用して、手書き文字か印活文字かを
自動的に判定するようにしている。これにより、手書き
による郵便物と印活文字による郵便物との選別を自動化
し、係員への負担を軽減することができる。
また、手書き文字か印活文字かに応じて、手書き文字パ
ターン辞書あるいは印活文字パターン辞書を選択して認
識処理することが可能となるため、照合の対象となる基
準パターンの数を限定することができる。したがって、
認識処理に要する時間を短縮でき、処理速度の向上が図
れる。さらに、照合の対象となる基準パターンの数を限
定することができるため、信頼性の高い認識を行うこと
ができるものである。
また、中心線からマスクの中心位置までの距離に対する
分散、さらには基準線と中心線との角度に対する分散を
、それぞれ手書き文字か印活文字かの判定の要素として
加えることにより、郵便物のスキューや郵便物に貼付さ
れた地名の記載されたラベルのずれ(書状に対するラベ
ルの傾き)などによって判定の精度が影響されないよう
にしている。したがって、高い精度で手書き文字か印活
文字かを判定することができるものである。
すなわち、光学的走査によって得られた塁子化画像の文
字のばらつきを測定することにより、複雑な論理を必要
とせず、ハードウェアおよびソフトウェアの大幅な低減
が実現でき、手書き文字か印活文字かの判定を容易に行
うことができる。
なお、上記実施例においては、分散としきい値とを比較
することによりプラスあるいはマイナスのポイントに換
算するようにしたが、これに限らず、たとえば各ポイン
トに対して重み付けするようにしても良い。
また、郵便物の宛名を認識する装置に適用したが、これ
に限らず、たとえば原稿を読取ってその内容を記憶する
記憶装置などにも適用できる。
さらに、判定の要素としてマスクの幅、高さ、大きさ、
マスクのピッチ、および中心線からマスクの中心位置ま
での距離、さらには中心線と基準線との角度から精度の
高い判定を行うようにしたが、たとえば上記要素を選択
して用いることにより必要とする判定の精度を任意に変
更することが可能である。
[発明の効果] 以上、詳述したようにこの発明によれば、手書き文字に
よる郵便物と印刷活字による郵便物との選別を自動化し
、係員への負担を軽減することができるとともに、処理
速度の向上が図れる文字読取装置を提供できる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示す文字読取装置のブロ
ック図、第2図は郵便物と走査部との位置関係を示すた
めの図、第3図は文字マスクの位置パラメータの求め方
を説明するための図、第4図は各要素に対する分散の求
め方を説明するための図、第5図は手書き文字による郵
便物の一例を示す図、第6図は印活文字による郵便物の
一例を示す図である。 1・・・郵便物、2・・・宛名部、11・・・走査部、
12・・・文字行検出装置、14・・・文字検出切出部
、15・・・文字判定部、16・・・ばらつき算出回路
、17・・・判定回路、18・・・文字認識部、19・
・・パターン辞書部、19a・・・手書き文字パターン
辞書、19b・・・印活文字パターン辞書、a、b、・
・・・・・文字マスク。 出願人代理人 弁理士 鈴 江 武 彦(a) (b) (C) 第5 図 (a) (b) (C) 第6図

Claims (2)

    【特許請求の範囲】
  1. (1)文字情報を読取って認識する文字読取装置におい
    て、 被読取物上を光学的に走査する走査手段と、この走査手
    段により得られた画像情報から文字行および文字行にお
    ける各文字領域を検出する検出手段と、 この検出手段により検出された文字行における各文字領
    域のばらつきから、文字情報が手書き文字か印刷活字か
    を判定する判定手段と、 手書き文字の基準となるパターン情報を記憶している手
    書き文字パターン記憶部と、印刷活字の基準となるパタ
    ーン情報を記憶している印刷活字パターン記憶部とを備
    えた記憶手段と、 上記判定手段の判定結果にもとづいて、上記記憶手段の
    手書き文字パターン記憶部あるいは印刷活字文字パター
    ン記憶部を選択して文字情報の認識処理を行う処理手段
    と を具備したことを特徴とする文字読取装置。
  2. (2)判定手段は、各文字領域の幅、高さ、面積、間隔
    、行方向に対するずれ量に対するばらつきの度合いを数
    値化することにより手書き文字か印刷活字かを判定する
    ものであることを特徴とする特許請求の範囲第1項記載
    の文字読取装置。
JP61224516A 1986-09-22 1986-09-22 文字読取装置 Pending JPS6379193A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61224516A JPS6379193A (ja) 1986-09-22 1986-09-22 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61224516A JPS6379193A (ja) 1986-09-22 1986-09-22 文字読取装置

Publications (1)

Publication Number Publication Date
JPS6379193A true JPS6379193A (ja) 1988-04-09

Family

ID=16815017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61224516A Pending JPS6379193A (ja) 1986-09-22 1986-09-22 文字読取装置

Country Status (1)

Country Link
JP (1) JPS6379193A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03240184A (ja) * 1990-02-17 1991-10-25 Oki Electric Ind Co Ltd 属性判定装置
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03240184A (ja) * 1990-02-17 1991-10-25 Oki Electric Ind Co Ltd 属性判定装置
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体

Similar Documents

Publication Publication Date Title
EP0385009A1 (en) Apparatus and method for use in image processing
US7519226B2 (en) Form search apparatus and method
US5642442A (en) Method for locating the position and orientation of a fiduciary mark
US5325447A (en) Handwritten digit normalization method
US5805740A (en) Bar-code field detecting apparatus performing differential process and bar-code reading apparatus
JPH0420226B2 (ja)
US5164996A (en) Optical character recognition by detecting geo features
JPS6379193A (ja) 文字読取装置
AU768373B2 (en) Stamp detecting device, stamp detecting method, letter processing apparatus and letter processing method
US20040024716A1 (en) Mail sorting processes and systems
JP2827960B2 (ja) 宛名行抽出装置
JP2861860B2 (ja) 宛名行抽出装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JPH0916715A (ja) 文字認識装置および方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0929179A (ja) 宛名読取装置
JPH10328623A (ja) 郵便宛名認識装置
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JP2787515B2 (ja) 光学式文字読取装置
JP2000207491A (ja) 文字列読取方法及び装置
JPH06282684A (ja) 文字認識装置
Roy et al. Address Block Location and Pin Code Recognition for Indian Postal Automation
JPH0737034A (ja) 光学式文字読み取り装置
JPH01305486A (ja) 文字判定装置