JPH0793474A - 文字領域検出装置 - Google Patents

文字領域検出装置

Info

Publication number
JPH0793474A
JPH0793474A JP5234976A JP23497693A JPH0793474A JP H0793474 A JPH0793474 A JP H0793474A JP 5234976 A JP5234976 A JP 5234976A JP 23497693 A JP23497693 A JP 23497693A JP H0793474 A JPH0793474 A JP H0793474A
Authority
JP
Japan
Prior art keywords
area
address
character
digital image
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5234976A
Other languages
English (en)
Inventor
Hiroshi Sasaki
宏 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5234976A priority Critical patent/JPH0793474A/ja
Publication of JPH0793474A publication Critical patent/JPH0793474A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】本発明は、郵便物自動読取区分機のあて名読取
装置などに用いられるあて名領域検出装置において、郵
便物上のあて名領域の検出精度を向上できるようにする
ことを最も主要な特徴とする。 【構成】たとえば、郵便物より読み取った2値のデジタ
ル画像に対してラベリング処理を施した後、得られたラ
ベルを統合処理する。そして、この統合されたラベルの
うち、あて名が手書かまたは印活かの判定結果にもとづ
いて、手書または印活候補サイズ大のラベルだけを抽出
する。しかる後、この抽出したラベルの集中するエリア
を検出し、そのエリアがあて名記載フォーマットに適合
するかを判定することにより、あて名領域を正確に検出
できる構成となっている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、たとえば郵便物自動
読取区分機のあて名読み取りなどに用いられる文字読取
装置において、読み取るべき文字領域の検出を行う文字
領域検出装置に関する。
【0002】
【従来の技術】従来、郵便物自動読取区分機のあて名読
み取りなどに用いられる文字読取装置(いわゆる、あて
名読取装置)では、たとえば郵便物の表面の、文字など
のない空白部分と文字を含めたパターン部分とをぼかし
た画像(文面などが読み取れない程度にぼやかされてい
る)を用い、その画像上で最もあて名らしいと思われる
場所に集まったパターンのかたまりをあて名領域として
検出するようになっている。
【0003】しかしながら、近年においては、郵便物の
表面に種々の広告文や通信文などが記載されたものが増
え、このため、上記した従来装置では、誤って広告文や
通信文などをあて名領域として検出してしまうという問
題が生じている。このように、あて名領域を誤って検出
した場合、正確な区分が行えなくなるなど、後のあて名
認識処理や区分集積処理に影響を与えることになる。
【0004】
【発明が解決しようとする課題】上記したように、従来
においては、表面に広告文や通信文などの記載された郵
便物については対応しきれず、あて名領域を誤って検出
する場合が増えつつあった。そこで、この発明は、誤検
出を防止でき、文字領域の検出の精度を向上することが
可能な文字領域検出装置を提供することを目的としてい
る。
【0005】
【課題を解決するための手段】上記の目的を達成するた
めに、この発明の文字領域検出装置にあっては、被読取
物の表面を光学的に走査して多値のデジタル画像を得る
光電変換手段と、この光電変換手段で得た多値のデジタ
ル画像を2値のデジタル画像に変換する画像変換手段
と、この画像変換手段で変換された2値のデジタル画像
の、連続する黒の部分をまとめて1つのパターンとする
処理手段と、この処理手段でパターン化された各パター
ンの大きさをもとに文字領域らしきエリアを検出する検
出手段と、この検出手段で検出されたエリアが読み取る
べき文字領域か否かを判定する判定手段とから構成され
ている。
【0006】
【作用】この発明は、上記した手段により、広告文や通
信文などをその文字の大きさの違いから排除できるよう
になるため、読み取るべき文字領域らしきエリアを絞り
込むことが可能となるものである。
【0007】
【実施例】以下、この発明の一実施例について図面を参
照して説明する。図1は、本発明にかかる郵便物自動読
取区分機の構成を概略的に示すものである。
【0008】すなわち、この郵便物自動読取区分機は、
葉書や封書などの書状である郵便物(被読取物)Pが一
括、かつ立位状態でセットされる供給部11、この供給
部11にセットされた郵便部Pを最前端より順に1枚ず
つ取り出す取出部12、この取出部12で取り出された
郵便物Pを搬送する取込搬送路13、この搬送路13を
搬送される郵便物Pのあて名情報を読み取る読取部1
4、この読取部14であて名情報の読み取られた郵便物
Pをその読取結果(区分指定データ)にもとづいて区分
する区分部15により構成されている。
【0009】区分部15は、上記読取部14を通過した
郵便物Pを搬送する書状搬送路16、鉛直方向に設けら
れた複数段(ここでは、たとえばA〜Gの7段)の区分
搬送路17a〜17g、各区分搬送路17a〜17gに
沿って設けられた多数のポケット(集積箱)18〜から
なっている。
【0010】なお、上記供給部11の上部には、オペレ
ータ(郵便局員)が操作する操作パネルとしてのオペレ
ータパネル19が設けられている。また、上記搬送路1
3,16,17a〜17gの各所には、その搬送路上に
おける郵便物Pの搬送を検知するための、たとえばフォ
トセンサにより構成される搬送検知器(図示していな
い)が設けられている。
【0011】しかして、供給部11にセットされた郵便
物Pは、取出部12により順に取り出され、取込搬送路
13を搬送されて読取部14に送られる。そして、この
読取部14によって、郵便物Pに記載されているあて名
情報が読み取られる。
【0012】この後、郵便物Pは区分部15に送られ、
その区分指定データにもとづいて書状搬送路16および
区分搬送路17a〜17gのいずれかを選択的に搬送さ
れ、所定のポケット、つまり上記区分指定データに対応
するポケット18内に区分されて集積される。
【0013】図2は、上記した読取部14の概略構成を
示すものである。すなわち、読取部14は、郵便物P上
の全面の画像を得て光電変換する光電変換部14a、こ
の光電変換部14aの出力に応じて文字パターンの認識
を行うことによりあて名情報を識別する識別部14bと
からなっている。
【0014】上記光電変換部14aは、郵便物Pのあて
名情報の記載面を光学的に走査して光電変換することに
よって多値のデジタル画像を得るものであり、たとえば
CCDスキャナによって構成されている。
【0015】上記識別部14bは、2値化回路41、あ
て名領域検出部42、文字認識部43、町名・街区認識
部44、あて名辞書45、およびあて名認識部46によ
って構成されている。
【0016】2値化回路41は、上記光電変換部14a
で得られた多値のデジタル画像を、適当なしきい値を用
いて黒と白の2値のデジタル画像に変換するものであ
る。あて名領域検出部42は、上記2値化回路41から
の2値のデジタル画像をもとに、上記郵便物Pに記載さ
れている全情報の中からあて名情報が記載されているあ
て名領域(読み取るべき文字領域)を検出し、このあて
名領域の位置を示すデータを出力するものである。な
お、ここでの検出方法の詳細については後述する。
【0017】また、本実施例では、上記光電変換部14
a、2値化回路41、およびあて名領域検出部42によ
り、文字領域検出装置としてのあて名領域検出装置が構
成されている。
【0018】文字認識部43は、上記光電変換部14a
からの多値のデジタル画像のうち、上記あて名領域検出
部42から供給されるあて名領域の位置を示すデータに
対応する部分の画像を切り出して新たに2値化する選択
回路51、この選択回路51から供給される画像、つま
りあて名領域内のあて名情報に対応する各文字情報を1
文字ずつ検出して切り出す文字検出切出回路52、この
文字検出切出回路52からの出力、つまり検切りされた
文字情報を正規化し、サンプリングする正規化回路5
3、およびこの正規化回路53で処理された文字情報
を、たとえば辞書55内の文字に対応する基準パターン
とのマッチング法などによって文字の認識を行う認識回
路54によって構成されている。
【0019】町名・街区認識部44は、上記文字認識部
43から供給される認識文字に対して、あて名辞書45
に登録されているあて名により町名・街区の認識を行う
ものである。
【0020】あて名認識部46は、上記町名・街区認識
部44から供給される町名・街区によってあて名を認識
し、このあて名に対応する上記区分指定データを出力す
るものである。
【0021】すなわち、この区分指定データによって前
記区分部15におけるポケット18の位置が示され、そ
のポケット18にて上記区分指定データに該当する郵便
物Pが区分集積されることになる。
【0022】図3は、本装置で処理される郵便物Pの一
例を示すものである。たとえば、郵便物Pの表面には、
受取人の住所などが記載されたあて名情報Paの他、郵
便番号情報Pb、切手などの料額印情報Pc、差出人の
住所などが記載された差出人情報Pd、および広告文
(または通信文)Peなどが存在する。
【0023】次に、上記したあて名領域の検出にかかる
動作について、図4および図5を参照して説明する。な
お、図4は検出処理の流れを概略的に示すものであり、
図5はかかる処理における郵便物画像の一例を示すもの
である。
【0024】まず、2値化回路41で得られた2値のデ
ジタル画像に対して、ラベリング処理が施される(ステ
ップST1)。ラベリング処理とは、連続する黒の部分
(黒画素)をまとめて1つのパターンとする処理であ
り、まとまった1つのパターンをラベルとして得るよう
になっている。
【0025】たとえば、図5(a)に示す2値のデジタ
ル画像に対してラベリング処理を行い、各ラベルを矩形
で表わした結果を図5(b)に示している。続いて、上
記ラベリング処理により得られたラベルに対して、統合
処理が行われる(ステップST2)。
【0026】ここでの統合処理は、文字の一部と思われ
る小さなラベルを、それを含む大きなラベルに統合させ
るものである。たとえば、「太」という文字からは
「大」と「、」との2つのラベルが得られるが、これら
を統合させることにより1つのラベルと見なすことがで
きる。
【0027】図5(b)の矩形で表わされた各ラベルに
対して、統合処理を行った結果を図5(c)に示してい
る。続いて、あて名候補サイズ(あて名情報らしいラベ
ルの大きさ)の算出が行われる(ステップST3)。
【0028】ここで、あて名情報らしいラベルの大きさ
の値としては、たとえばあて名情報Paが印刷活字(印
活)ならば1辺が3〜5mm、手書ならば8〜15mm
というように、郵便物Pについて経験的・統計的に得ら
れる値(印活候補サイズ、手書候補サイズ)が用いられ
る。
【0029】続いて、処理の対象となっている郵便物P
のあて名情報Paが、手書か印活かの判定が行われる
(ステップST4)。ここでは、たとえば装置の供給モ
ードであらかじめ郵便物Pが手書あるいは印活であると
判断できる場合には、それが判定の結果とされ、そうで
ない場合には不明と判定される。
【0030】続いて、手書か印活かの判定結果をもと
に、あて名候補サイズにしたがって候補サイズ大のラベ
ルとそれ以外のサイズのラベルとの分類(ステップST
5)、および分類された候補サイズ大のラベルが集中し
ているエリアの検出(ステップST6)がそれぞれに行
われる。
【0031】すなわち、上記ステップST4にて手書と
判定された場合には、上記ステップST3にて算出され
た手書候補サイズ大のラベルだけが抽出される(ステッ
プST5a)。
【0032】そして、この処理で抽出された手書候補サ
イズ大のラベルのうち、たとえば単位面積あたりのラベ
ルの発生頻度があるしきい値以上か否かにより、ラベル
の集中しているエリアが検出される(ステップST6
a)。
【0033】同様にして、上記ステップST4にて印活
と判定された場合には、上記ステップST3にて算出さ
れた印活候補サイズ大のラベルだけが抽出される(ステ
ップST5b)。
【0034】そして、この処理で抽出された印活候補サ
イズ大のラベルのうち、たとえば単位面積あたりのラベ
ルの発生頻度があるしきい値以上か否かにより、ラベル
の集中しているエリアが検出される(ステップST6
b)。
【0035】たとえば、図5(c)に示したラベル統合
処理を行った結果に対して、候補サイズ大のラベルを抽
出した結果を図5(d−1)に、それ以外のサイズのラ
ベルを抽出した結果を図5(d−2)にそれぞれ示して
いる。
【0036】また、図5(d−1)に示した候補サイズ
大のラベルを抽出した結果に対して、ラベル集中エリア
の検出を行った結果を図5(e)に示している。なお、
上記ステップST4の処理において、不明と判定された
場合には、上記した手書についての処理(ステップST
5a,ST6a)と印活についての処理(ステップST
5b,ST6b)との両方が行われる。
【0037】続いて、検出されたラベル集中エリアが、
郵便物Pについて経験的・統計的に得られるあて名記載
フォーマットに適合するかのチェックが行われる(ステ
ップST7)。
【0038】チェックの方法としては、たとえばラベル
集中エリア内の各ラベルと、上記ステップST5にて得
られる候補サイズ大のラベル以外のサイズのラベル(あ
て名以外の不要パターン)との配置(位置関係や大きさ
の違いなど)を比較し、郵便物Pのあて名領域として適
当であるかを判定することにより行われる。
【0039】そして、最後に、あて名記載フォーマット
との適合の度合いに応じてあて名領域を決定し、その位
置を示すデータを出力することにより、上記した一連の
処理は終了される(ステップST8)。
【0040】この場合、複数のラベル集中エリアが検出
されている場合には、あて名記載フォーマットと最も適
合するもの1つをあて名領域として決定するようにして
も良いし、優先順位をつけていくつかの候補を決定する
ようにしても良い。
【0041】このように、候補サイズ大のラベルを除く
サイズのラベルを排除する、つまりあて名情報Paの記
載文字に適合しない大きさの文字などを排除することに
より、不適合な大きさをもつ差出人情報Pdおよび広告
文(または通信文)Peなどが、あて名領域として検出
されるのを防止できるようになるものである。
【0042】したがって、郵便物Pの表面よりあて名領
域をより正確に検出することが可能となり、この得られ
たあて名領域の位置を示すデータに対応する、前記の光
電変換部14aで得られた多値のデジタル画像を切り出
すことにより、より精度の高い認識処理および区分処理
を行い得るようになるものである。
【0043】上記したように、広告文や通信文などをそ
の文字の大きさの違いから排除できるようにしている。
すなわち、郵便物のあて名情報にふさわしい大きさをも
ったラベルのみを抽出し、そのサイズのラベルが集中し
て存在するエリアをあて名領域として検出するようにし
ている。これにより、郵便物のあて名情報としてふさわ
しくない大きさで書かれた広告文や通信文などと区別で
きるようになるため、読み取るべきあて名領域らしきエ
リアを絞り込むことが可能となる。したがって、郵便物
の表面に存在する広告文や通信文などをあて名領域とし
て誤検出することなく、より高い精度であて名領域を検
出できるようになるものである。
【0044】なお、上記実施例においては、郵便物自動
読取区分機のあて名読取装置に適用した場合について説
明したが、これに限らず、たとえばあて名情報からデー
タベースを作成する装置などにも適用できる。
【0045】また、あて名領域検出装置に限らず、各種
の文字読取装置の文字領域検出装置としても利用するこ
とができる。その他、この発明の要旨を変更しない範囲
において、種々変形実施可能なことは勿論である。
【0046】
【発明の効果】以上、詳述したようにこの発明によれ
ば、誤検出を防止でき、文字領域の検出の精度を向上す
ることが可能な文字領域検出装置を提供できる。
【図面の簡単な説明】
【図1】この発明の一実施例にかかる郵便物自動読取区
分機を概略的に示す構成図。
【図2】同じく、読取部の概略構成を示すブロック図。
【図3】同じく、郵便物の一例を示す平面図。
【図4】同じく、あて名領域検出にかかる処理の流れを
説明するために示すフローチャート。
【図5】同じく、あて名領域検出にかかる処理の概要を
説明するために示す図。
【符号の説明】
14…読取部、14a…光電変換部、14b…識別部、
41…2値化回路、42…あて名領域検出部、P…郵便
物、Pa…あて名情報、Pe…広告文(または通信
文)。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 被読取物の表面を光学的に走査して多値
    のデジタル画像を得る光電変換手段と、 この光電変換手段で得た多値のデジタル画像を2値のデ
    ジタル画像に変換する画像変換手段と、 この画像変換手段で変換された2値のデジタル画像の、
    連続する黒の部分をまとめて1つのパターンとする処理
    手段と、 この処理手段でパターン化された各パターンの大きさを
    もとに文字領域らしきエリアを検出する検出手段と、 この検出手段で検出されたエリアが読み取るべき文字領
    域か否かを判定する判定手段とを具備したことを特徴と
    する文字領域検出装置。
  2. 【請求項2】 前記処理手段は、2値のデジタル画像に
    対してラベリング処理を施すものであることを特徴とす
    る請求項1に記載の文字領域検出装置。
  3. 【請求項3】 前記検出手段は、被読取物について経験
    的・統計的に得られる文字サイズを用いて前記パターン
    を選別し、この選別により抽出されたパターンの単位面
    積あたりの発生頻度により文字領域らしきエリアを検出
    するものであることを特徴とする請求項1に記載の文字
    領域検出装置。
  4. 【請求項4】 前記判定手段は、前記検出手段で検出さ
    れたエリアが、被読取物について経験的・統計的に得ら
    れる記載フォーマットに適合するかのチェックを行うも
    のであることを特徴とする請求項1に記載の文字領域検
    出装置。
JP5234976A 1993-09-21 1993-09-21 文字領域検出装置 Pending JPH0793474A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5234976A JPH0793474A (ja) 1993-09-21 1993-09-21 文字領域検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5234976A JPH0793474A (ja) 1993-09-21 1993-09-21 文字領域検出装置

Publications (1)

Publication Number Publication Date
JPH0793474A true JPH0793474A (ja) 1995-04-07

Family

ID=16979203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5234976A Pending JPH0793474A (ja) 1993-09-21 1993-09-21 文字領域検出装置

Country Status (1)

Country Link
JP (1) JPH0793474A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023212232A1 (en) * 2022-04-28 2023-11-02 United States Postal Service System and method for detecting an address block and barcode on a captured image of item, and reading the detected barcode using connected component analysis

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023212232A1 (en) * 2022-04-28 2023-11-02 United States Postal Service System and method for detecting an address block and barcode on a captured image of item, and reading the detected barcode using connected component analysis

Similar Documents

Publication Publication Date Title
US20060291692A1 (en) Information processing apparatus having learning function for character dictionary
US7415130B1 (en) Mail image profiling and handwriting matching
JP3388829B2 (ja) 文字読取装置
JP4855698B2 (ja) 宛先認識装置
JPH11238097A (ja) 郵便物宛先読取装置及び宛先読取方法
US20040218783A1 (en) Method and system for image processing
KR100366296B1 (ko) 반송 우편물의 자동 처리시스템 및 방법
JPH0793474A (ja) 文字領域検出装置
JP5178851B2 (ja) 宛先認識装置
JP3028849B2 (ja) 郵便物宛名自動読取区分機および郵便物宛名自動読取方法
JPH0793466A (ja) 文字種判別装置およびその判別方法
JPH07271899A (ja) 文字認識装置
JP3160347B2 (ja) 郵便物の宛名読取装置
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP3660404B2 (ja) 住所領域検出装置、住所読取装置、区分機及び住所読取方法
JP2000210624A (ja) 郵便宛名認識装置
JPH08164365A (ja) 宛名読取装置
JP3660405B2 (ja) 区分機、宛名認識装置及び宛名認識方法
JP2868910B2 (ja) 郵便物処理装置
JPH07117984B2 (ja) 光学式文字読取装置
JPS6394384A (ja) 文字行方向判定方式
JPH08155397A (ja) 郵便物区分装置およびバーコード印刷装置
JPH1190341A (ja) 郵便物処理システム
JPH0739821A (ja) 宛名読取装置および宛名読取区分機