JP2000210624A - 郵便宛名認識装置 - Google Patents

郵便宛名認識装置

Info

Publication number
JP2000210624A
JP2000210624A JP11016706A JP1670699A JP2000210624A JP 2000210624 A JP2000210624 A JP 2000210624A JP 11016706 A JP11016706 A JP 11016706A JP 1670699 A JP1670699 A JP 1670699A JP 2000210624 A JP2000210624 A JP 2000210624A
Authority
JP
Japan
Prior art keywords
address
area
character string
character
mail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11016706A
Other languages
English (en)
Inventor
Kiyouka Chiba
京香 千葉
Masato Teramoto
正人 寺本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11016706A priority Critical patent/JP2000210624A/ja
Publication of JP2000210624A publication Critical patent/JP2000210624A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 通常のレイアウト情報における差出人領域に
宛名住所が書かれていた場合でも、その宛名領域を精度
良く検出することが可能な郵便宛名認識装置を提供する
こと。 【解決手段】 郵便宛名認識装置10は、郵便物11の
イメージデータを取り込む画像入力部12と、画像入力
部12で取り込んだイメージデータを格納する画像メモ
リ13と、画像メモリ13に格納されたイメージデータ
に対して宛名領域を検出し、該検出した宛名領域内の文
字に基づいて宛名住所を求める画像処理部14からな
り、宛名領域の検出は、領域内の文字列の特質(文字列
末尾の敬称の有無,文字列の印刷の色,濃度,またはサ
イズの相違)に基づいて行うようにした。これにより、
宛名領域の検出精度が向上し、宛名住所文字列の認識率
が向上する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、郵便物自動区分シ
ステムなどに用いられる郵便宛名認識装置に関し、特
に、郵便物から宛名が記載されている宛名領域を精度良
く検出する機能を有する郵便宛名認識装置に関する。
【0002】
【従来の技術】近年、郵便物を宛先別に自動区分する郵
便物自動区分システムが普及している。このような郵便
物自動区分システムにおいては、郵便物に記載されてい
る宛名の住所文字列を読み取って自動認識する郵便宛名
認識装置が不可欠である。郵便物に記載されている宛名
の住所文字列を読取るには、まず、宛名が記載されてい
る領域(宛名領域)を検出し、その領域内の文字を読み
取って認識する必要がある。しかし、従来の宛名領域の
検出は、一般に、微分を利用して、横方向および縦方向
に対して白黒の変化点の累計を行うなど黒ドットの投影
処理を行うことにより行われているが、この方法では、
図形や文字列の領域の有無を検出することはできるが、
その領域が広告や差出人住所領域であるのか宛先住所領
域であるのかを区別することはできず、従って、広告や
差出人住所が宛先住所と誤って認識されてしまう可能性
がある。
【0003】このような誤検出を回避するために、従
来、郵便物の宛名が書かれると予想される位置(通常は
上部)や、逆に差出人住所が書かれると思われる位置
(通常は下部)を予めレイアウト情報として覚えてお
き、このレイアウト情報に基づいて宛名領域を選択する
方法も提案されている。
【0004】
【発明が解決しようとする課題】上述したように、上記
従来の技術では、黒ドットの投影処理を行って認識する
場合、宛名領域と差出人住所領域を誤検出してしまう可
能性がある。また、上述したように、差出人住所は、横
長郵便物であれば下部や右下部にあり、縦長郵便物に横
書きしているものであれば下部にあるというレイアウト
情報を用いて、これらの領域は宛名領域として不適当と
することで、差出人住所を宛名領域と誤検出しないよう
にすることは可能であるが、例えば、下部の差出人住所
が書かれるべき領域に宛名住所が書かれる特殊な場合に
は、その領域を宛名領域として正しく検出することはで
きないという課題があった。本発明の目的は、通常のレ
イアウト情報における差出人領域に宛名住所が書かれて
いた場合でも、その宛名領域を精度良く検出することが
可能な郵便宛名認識装置を提供することである。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するために、郵便物のイメージデータを取り込む画像
入力部と、該画像入力部で取り込んだイメージデータを
格納する画像メモリと、該画像メモリに格納されたイメ
ージデータに対して宛名領域を検出し、該検出した宛名
領域内の文字に基づいて宛名住所を求める画像処理部を
有する郵便宛名認識装置において、宛名領域の検出は、
領域内の文字列の特質(文字列末尾の敬称の有無,文字
列の印刷の色,濃度,サイズの相違など)に基づいて行
うようにしたものである。この構成により、通常のレイ
アウト情報における差出人領域に宛名住所が書かれてい
た場合でも、その宛名領域を精度良く検出することが可
能となる。
【0006】
【発明の実施の形態】本発明では、宛名領域と差出人住
所領域との相違部、例えば、宛名に付加される「様」
「殿」「先生」「君」「御中」などの敬称を検出する手
段を設け、文字認識した文字列に上記敬称が存在する場
合に、その文字列を宛名住所として認識するようにした
ものである。これは、「宛名には敬称が付加されるが、
差出人には付加されない」という事実を利用して差出人
の誤検出を防止するものであり、これによって、通常差
出人住所があると予想される場所(領域)に宛名住所が
印刷されていてもその領域を正しく宛名領域であること
を検出することが可能となる。さらに、本発明では、宛
名領域や差出人領域の文字の色や濃度やサイズなどの違
いを利用して宛名領域を検出することも可能である。
【0007】以下、本発明の郵便宛名認識装置の一実施
例を具体的に説明する。図1は本発明の郵便宛名認識装
置の全体のブロック図、図2および図3は本発明に有効
な郵便物の例、図4は本発明における処理の流れを説明
するためのフローチャートである。
【0008】図1(a)において、11は認識対象とな
る宛名住所文字列などが記載されている郵便物であり、
10は本発明に係る郵便宛名認識装置で、画像入力部1
2,画像メモリ13,認識プロセッサ14,文字認識辞
書15,ワークメモリ16,住所辞書17,敬称テーブ
ル18,およびプログラムメモリ19などから構成され
ている。なお、辞書類,各メモリ,テーブル類は別個の
メモリを用いても同一のメモリの異なる領域を用いても
よい。図1(b)は、敬称テーブル18の一例を示す図
であり、「様」「殿」「先生」「君」「御中」などが登
録されている。
【0009】本実施例における郵便宛名認識装置10の
処理の概要を説明する。まず、郵便物11上の宛名住所
文字列のイメージデータを画像入力部12から入力し、
画像メモリ13に格納する。次に、認識プロセッサ14
は、プログラムメモリ19に格納されているプログラム
を実行することによって、画像メモリ13に格納された
イメージデータに対し、宛名領域の検出,認識対象文字
列の検出,文字方向の検出,1文字単位の切り出しなど
を行った後、文字認識辞書15を用い文字認識を行う。
【0010】次に、文字認識結果で得た文字列と住所辞
書17の住所列との照合処理などを行い、一致したもの
があった場合に、その一致した住所列(認識結果)をワ
ークメモリ16に格納する。次に、ワークメモリ16に
格納された住所列は郵便番号などに変換され、郵便物の
区分などに利用される。
【0011】図2は、本発明に有効な郵便物の一例を示
す図である。同図において、21は郵便物の宛先が記入
されている宛名領域を示し、22は郵便物を出した差出
人の住所が記入されている差出人住所領域を示してい
る。通常は、上部に宛名領域が、下部に差出人住所領域
が記入され、このような従来のレイアウト情報による領
域検出方法では、上部にある領域を宛名領域の第1の候
補としているため、図2の場合には差出人住所領域22
を宛名領域と間違って認識してしまう可能性が大きい。
【0012】この事情は、図3のような横置きの場合も
同じである。すなわち、通常は、左上部に宛名領域が、
右下部に差出人住所領域が記入され、このような従来の
レイアウト情報による領域検出方法では、左上部にある
領域が宛名領域の第1の候補とされ、差出人住所領域2
2を宛名領域と間違って認識してしまう可能性が大き
い。
【0013】次に、本発明における宛名領域の検出手法
の概要を説明する。図4は、本発明における宛名領域抽
出の一例を説明するための図である。同図(a)は、本
実施例で認識の対称となる郵便物を示している。宛名領
域を抽出するために、本発明では、「様」「殿」「先
生」「君」「御中」などの宛名に付与される敬称を検出
する。そのためには、文字列を探し出す必要がある。
【0014】文字列を探し出すために、先ず、黒ドット
のつながりを検出する。同図(b)は検出された黒ドッ
トのつながりを示している。次に、黒ドットのつながり
の各々に対して、その高さ,幅,面積などを利用し、文
字らしいもの(文字の可能性が大きいもの)を探す。黒
ドットのつながりの面積が大きければ広告などの可能性
が大きく、逆に、黒ドットのつながりの面積が小さけれ
ば汚れなどの可能性が大きく、これらを文字列でないと
みなして除外する。同図(c)は、このようにして得ら
れた文字列の候補を示す図である。これらの文字らしい
ものの位置関係から文字列を推定し、その推定した文字
列の末尾と考えられる各行の後方の文字のみの文字認識
を行う。同図(d)および(e)の丸で囲った部分がこ
のとき文字認識する文字を示している。この文字認識の
結果、「様」「殿」「先生」「君」「御中」などが認識
された場合には、それを敬称とみなし、当該文字列の領
域を宛名領域とする。
【0015】なお、宛名領域を探し出した後は、従来と
同様に、その領域の全ての文字列を文字認識辞書15を
用いて認識し、認識結果と住所辞書17に登録されてい
る住所列との照合を行い、一致した住所列を宛名住所と
する。
【0016】図5は、本実施例の処理の流れを説明する
ためのフローチャートである。まず、画像メモリ13に
格納された郵便物のイメージデータに対し、黒画素のつ
ながりを利用してある一定の範囲のサイズのものを検出
することにより、文字列検出を行う(ステップ51)。
検出した文字列に対し、文字切出し処理を行い(ステッ
プ52)、各行の後方の文字に対して文字認識辞書15
とのマッチング処理などによる文字認識処理を行う(ス
テップ53)。
【0017】各行の後方の文字認識結果と敬称テーブル
18(図1(b)参照)とを照合し(ステップ54)、
一致した文字列群が存在する場合、その一致した文字列
群が存在する領域を宛名領域とする。この検出した宛名
領域の全ての文字に対し、文字認識辞書15とのマッチ
ング処理などにより文字認識処理を行う(ステップ5
5)。認識の結果得られた文字列と住所辞書17に登録
されている住所列を照合し(ステップ56)、一致した
住所列を認識された宛名住所としてワークメモリ16に
出力する。
【0018】敬称テーブル18との照合において、敬称
テーブル18に登録されている敬称と一致する文字列が
存在しない場合は(ステップ54:N)、その領域は宛
名領域でないとしてレジェクトし(宛名領域の候補から
除外;ステップ57)、再びステップ51に戻り次の文
字列に対して同様の処理を繰り返す。
【0019】なお、図5のフローチャートは一例を示し
たにすぎず、例えば、全ての文字列に対してステップ5
1の「文字列検出」〜ステップ53の「後方の文字のみ
文字認識処理」を行っておき、これらの文字列に対して
敬称テーブル18と照合させ、不一致(ステップ54:
N)の場合、その文字列をリジェクト(ステップ57)
した後、ステップ54に戻り次の文字列に対して敬称テ
ーブル18との照合を繰り返すようにしてもよい。
【0020】上記実施例では、宛名領域の文字の内容
(敬称の有無など)を利用して検出する実施例を説明し
たが、次に、カラーセンサーを用いて文字の色により宛
名領域を認識する実施例、文字の印刷濃度、文字サイズ
を利用して宛名領域を認識する実施例を説明する。一般
に、差出人住所や模様などは封筒の色などに合わせて様
々な色を用いてカラーで印刷したり、文字の濃度やサイ
ズも様々に変化させて印刷する場合があるが、郵便宛名
住所の文字は印刷であれば黒で標準的な一定の濃度、サ
イズで印刷するのが普通である。本実施例は、この事情
を利用したものである。すなわち、画像入力部12にお
いて、カラーセンサーを用いて、郵便物11のイメージ
データをカラーで入力する。入力されたイメージデータ
のうち、カラー文字列の領域は差し当たって宛名領域の
候補から除外し、黒の文字列の領域だけを宛名領域の候
補とし、この領域の文字列に対してのみ、上述した如き
文字列検出/文字列切出し/文字認識辞書との照合/住
所辞書との照合を行い、宛名住所を求める。なお、上記
例では、文字の印刷の色で宛名領域の候補を選択する場
合を説明したが、上述した理由により、郵便宛名の印刷
の濃度やサイズも宛名領域の候補の選択に利用できるこ
とはいうまでもない。これにより、処理すべき文字列の
量を大幅に減らすことができ、結果的に、1郵便物当た
りの認識処理を高速化することが可能になる。
【0021】なお、上述した敬称テーブルを用いる方
法,カラーセンサーを用いる方法,または印刷濃度や文
字サイズを用いる方法などを適宜組み合わせる変形例な
ども可能である。例えば、敬称テーブルを用いる上記実
施例において、文字列の後方から読み取った文字列が敬
称テーブルに登録されている敬称と一致しない場合にカ
ラーセンサーを用いる方法を用いたり、カラーセンサー
を用いる実施例において、黒印刷の宛名領域を見い出せ
なかった場合にカラー文字列領域も宛名候補に加えたり
してもよい。それでも宛名領域が探せない場合には手作
業によって宛名領域を指示する。
【0022】
【発明の効果】本発明によれば、敬称や文字列の色,濃
度,サイズを利用して宛名領域を検出することにより、
通常のレイアウト情報における差出人領域に宛名住所が
書かれていた場合でも、その宛名領域を精度良く検出す
ることが可能となる。
【図面の簡単な説明】
【図1】本発明における全体のブロック図である。
【図2】本発明に有効な郵便物の一例を示す図である。
【図3】本発明に有効な郵便物の一例を示す図である。
【図4】本発明における宛名領域検出方法の1例であ
る。
【図5】本発明における処理の流れを説明するためのフ
ローチャートである。
【符号の説明】
10:郵便宛名認識装置、11:郵便物、12:画像入
力部、13:画像メモリ、14:認識プロセッサ、1
5:文字認識辞書、17:住所辞書、18:敬称テーブ
ル、19:プログラムメモリ、21:宛名領域、22:
差出人住所領域

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 郵便物のイメージデータを取り込む画像
    入力部と、該画像入力部で取り込んだイメージデータを
    格納する画像メモリと、該画像メモリに格納されたイメ
    ージデータに対して宛名領域を検出し、該検出した宛名
    領域内の文字に基づいて宛名住所を求める画像処理部を
    有する郵便宛名認識装置において、 前記宛名領域の検出は、領域内の文字列の特質の相違に
    基づいて行うことを特徴とする郵便宛名認識装置。
  2. 【請求項2】 前記文字列の特質の相違は、文字列末尾
    の敬称の有無であることを特徴とする請求項1記載の郵
    便宛名認識装置。
  3. 【請求項3】 前記文字列の特質の相違は、文字列の印
    刷の色,濃度,サイズの相違のいずれかを含むことを特
    徴とする請求項1記載の郵便宛名認識装置。
JP11016706A 1999-01-26 1999-01-26 郵便宛名認識装置 Pending JP2000210624A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11016706A JP2000210624A (ja) 1999-01-26 1999-01-26 郵便宛名認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11016706A JP2000210624A (ja) 1999-01-26 1999-01-26 郵便宛名認識装置

Publications (1)

Publication Number Publication Date
JP2000210624A true JP2000210624A (ja) 2000-08-02

Family

ID=11923727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11016706A Pending JP2000210624A (ja) 1999-01-26 1999-01-26 郵便宛名認識装置

Country Status (1)

Country Link
JP (1) JP2000210624A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007015158A (ja) * 2005-07-06 2007-01-25 Brother Ind Ltd 記録装置および記録装置制御プログラム
JP2010073047A (ja) * 2008-09-19 2010-04-02 Toshiba Corp 情報処理装置およびプログラム
JP2016122404A (ja) * 2014-12-25 2016-07-07 キヤノン株式会社 情報処理装置、情報処理方法、プログラムおよび記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007015158A (ja) * 2005-07-06 2007-01-25 Brother Ind Ltd 記録装置および記録装置制御プログラム
JP2010073047A (ja) * 2008-09-19 2010-04-02 Toshiba Corp 情報処理装置およびプログラム
JP2016122404A (ja) * 2014-12-25 2016-07-07 キヤノン株式会社 情報処理装置、情報処理方法、プログラムおよび記憶媒体

Similar Documents

Publication Publication Date Title
JPH11226513A (ja) 郵便物宛先読取装置及び郵便物区分装置
US20060291692A1 (en) Information processing apparatus having learning function for character dictionary
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JP4855698B2 (ja) 宛先認識装置
JP2000210624A (ja) 郵便宛名認識装置
JPH06124366A (ja) 住所読取装置
JP5178851B2 (ja) 宛先認識装置
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JP2001109887A (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2000148906A (ja) 文書認識装置および郵便区分機
JPS6394384A (ja) 文字行方向判定方式
JPH08305794A (ja) 宛名行抽出装置
US8428303B2 (en) Postal indicium detection method and postal indicium detection apparatus
JP2616995B2 (ja) 文字認識装置
JPH0793466A (ja) 文字種判別装置およびその判別方法
JPH0737034A (ja) 光学式文字読み取り装置
JPH11207265A (ja) 情報処理装置および郵便物処理装置
JPH11238095A (ja) 郵便物宛先読取装置
JP3088036B2 (ja) 宛名読取区分機
JPH04309B2 (ja)
JPH01316887A (ja) 宛名情報読取装置
JPH08155397A (ja) 郵便物区分装置およびバーコード印刷装置
JP2007222746A (ja) 郵便物処理装置及び郵便物処理方法
JP2977219B2 (ja) 郵便物の宛名読取装置
JPH10328623A (ja) 郵便宛名認識装置