JP2861860B2 - 宛名行抽出装置 - Google Patents

宛名行抽出装置

Info

Publication number
JP2861860B2
JP2861860B2 JP7105575A JP10557595A JP2861860B2 JP 2861860 B2 JP2861860 B2 JP 2861860B2 JP 7105575 A JP7105575 A JP 7105575A JP 10557595 A JP10557595 A JP 10557595A JP 2861860 B2 JP2861860 B2 JP 2861860B2
Authority
JP
Japan
Prior art keywords
block
address
unit
character
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7105575A
Other languages
English (en)
Other versions
JPH08305793A (ja
Inventor
昇 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP7105575A priority Critical patent/JP2861860B2/ja
Publication of JPH08305793A publication Critical patent/JPH08305793A/ja
Application granted granted Critical
Publication of JP2861860B2 publication Critical patent/JP2861860B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、宛名行抽出装置に係わ
り、特に、郵便物の宛名行を抽出する宛名行抽出装置に
関する。
【0002】
【従来の技術】文書画像認識装置においては、文書を走
査して得られるディジタル画像に対してレイアウト解析
処理を行い、抽出された個々の文字画像に対して文字認
識処理を行い、文字コードへ変換するといった手順で文
字認識が行われる。ここで、レイアウト解析処理とは、
入力画像から文字行を抽出し、各文字列の方向および個
々の文字の方向からなる書式の判定を行う処理である。
【0003】このレイアウト解析処理に関する文献とし
ては、たとえば、馬場口らにより、「手書き文字列から
の文字切り出しの基礎的考察」と題して、1985年に電子
情報通信学会論文誌(Vol.69-D No.11)の2123ページか
ら2241ページに掲載された論文がある。この論文には、
郵便物の宛名のレイアウト解析に特化した技術が開示さ
れており、以下に記す手順に従って、レイアウト解析が
行われている。
【0004】 郵便物表面を走査して得られた画像に
対して孤立点除去を施す。 8連結ラベリングを行い連結成分の外接矩形を得
る。 得られた矩形同士の重複した部分の面積がしきい値
以上ならこれらの矩形を統合する。 矩形の中心座標を矩形面積で重み付けして、縦、横
方向に投影し、投影された点の集中の度合いの高い点を
宛名行の位置とする。 最小距離にある全ての矩形の組について、矩形統合
後の矩形が正方形に近いなら統合を行う。 矩形の面積の平均値を標準矩形面積とする。 矩形の縦横比が既定値以上である場合、矩形内の画
像を矩形長辺へ投影し最小値で矩形を分割する。 文字列方向に矩形を統合して宛名行候補を生成す
る。
【0005】このように、この技術では、郵便物表面を
走査して得られた画像に対してラベリング処理を行うこ
とにより、行接触を分離して正しい宛名行の抽出を図っ
ている。
【0006】また、別の方法としては、須田らにより、
「郵便あて名自動読取区分機の行・文字検出切り出し」
と題して、1990年電子情報通信学会秋期全国大会講演論
文集の6-355 ページに掲載された論文がある。この論文
の技術における処理の流れは、以下の通りである。
【0007】 予め抽出されている宛名領域から、罫
線、枠線の除去を行う。 宛名領域内で投影をとり、しきい値処理で行を切り
出す。 行ごとに適応2値化を行う。 原画像を文字列方向に射影し、しきい値以上の射影
パターンのみを宛名領域から切り出し宛名行とする。 画素の投影値をしきい値処理することで、接触文字
列の分離を行う。
【0008】このように、この技術では、宛名領域が抽
出されたものとして宛名行抽出を行っており、画素の投
影値をしきい値処理することで接触文字列の分離を行っ
ている。
【0009】
【発明が解決しようとする課題】一般的に宛名のレイア
ウト解析処理は、画素投影による階層分割処理または、
ラベリング出力に基づく過分割統合処理のいずれかによ
り行われている。従来の技術で述べた2つの技術のう
ち、前者は過分割統合処理を用いたものであり、この技
術では、行間の接触の判定が矩形の大きさのみを用いて
行われるので、手書き文字に多く見られる文字の変形に
よって矩形の縦横比が大きくなっている場合などに、矩
形の分離処理が行われてしまうといったように、文字が
分割されやすいという問題点があった。
【0010】また、従来の技術で述べた後者の方式で
は、画素投影のみを用いた宛名行の切り出しを行ってい
るため、手書き文字に多く見られる宛名行間の入り組
み、宛名行の傾きが生じた場合に正しい宛名行の抽出を
行うことができない。
【0011】画素投影に基づく階層分割処理では、画素
投影の極小値が既定の閾値に満たない部分において分割
することにより、多少の行同士の接触を分離することが
可能である。しかし、文字行が接触していなくても文字
の入り組み、傾きが大きく、各々の画素パターン同士が
接触してしまう場合には、接触位置で投影パターンが極
小値をとらない場合が多く、分離することが困難とな
る。
【0012】また、ラベリングに基づく過分割統合処理
においては、宛名行間の接触がなければ、傾き、入り組
みに関係なく分割することが可能である。しかし、行間
の接触がある場合には、分離位置を検出するのは容易で
はなく、正確な宛名行の抽出が行えないという問題があ
った。
【0013】このように、従来、手書き文字の変形、宛
名行間の接触、宛名行の入れ組、傾き等の影響による宛
名行抽出精度の劣化を同時に回避することができる技術
は実現されていなかった。
【0014】そこで、本発明の目的は、文字の変形、宛
名行間の接触、宛名行の入れ組、傾き等が存在しても、
安定した宛名行の抽出が行える宛名行抽出装置を提供す
ることにある。
【0015】
【課題を解決するための手段】請求項1記載の発明は、
(イ)郵便物の記載内容に応じた画像データから宛名以
外の記載情報を検出する雑情報検出手段と、(ロ)この
雑情報検出手段の検出結果を用いて郵便物の宛名の記載
に用いられている可能性が高い、宛名行の筆記方向を指
定する情報を含む書式候補を少なくとも1つ仮定する宛
名書式仮定手段と、(ハ)画像データから宛名書式仮定
手段が仮定した各書式候補に応じた宛名が記載されてい
る可能性の高い領域である宛名存在領域に関するデータ
を、それぞれ、宛名存在領域画像として抽出する抽出手
段と、(ニ)この抽出手段が書式候補ごとに抽出した各
宛名存在領域画像に対して、水平軸あるいは垂直軸のう
ち、対応する書式候補で指定されている宛名行の筆記方
向に直交する方向に近い軸上へ画素を投影し、ヒストグ
ラムを算出する画素投影手段と、(ホ)抽出手段が書式
候補ごとに抽出した各宛名存在領域画像に対して、ぼか
し処理を行いぼかし画像を生成するぼかし処理手段と、
(ヘ)このぼかし処理手段が生成した各ぼかし画像か
ら、黒画素が連結した閉領域を包含するサイズが最小で
ある矩形のブロックを特定し、特定したブロックに関す
る情報を出力するブロック特定手段と、(ト)画素投影
手段が算出した各ヒストグラムの極小点でそのヒストグ
ラムに対応する宛名存在領域を分割し、分割後の各領域
を粗分割領域とする粗分割領域設定手段と、(チ)ブロ
ック特定手段によって特定されたブロックのうち、いず
れか1つの粗分割領域内に含まれるブロックに関して
は、そのまま、その粗分割領域に対して分類付けを行
い、複数の粗分割領域に跨がるブロックに関しては、そ
のブロックをそれぞれが1つの粗分割領域に含まれるよ
うに複数のブロックに分割し、分割したブロックを各粗
分割領域に対して分類付けするブロック分類手段と、
(リ)このブロック分類手段によって各粗分割領域に分
類されたブロックの大きさの平均値を粗分割領域ごとに
算出する文字サイズ推定手段と、(ヌ)各粗分割領域に
属するブロックに関して、各粗分割領域で算出した平均
値との差が所定値以内の大きさを持つブロックを宛名文
字ブロックとして選出し、平均値より大きくかつ平均値
との差が規定値より大きい大きさを持つブロックを接触
候補ブロックとして選出する文字ブロック選出手段と、
(ル)この文字ブロック選出手段によって接触候補ブロ
ックとして選出されたブロックに対して、水平軸または
垂直軸のうち宛名行の筆記方向に直交する方向に近い軸
上へ画素の投影を行うことによりヒストグラムを算出
し、算出したヒストグラムに極小点が存在する場合に
は、その極小点でそのブロックの分割を行い、分割後の
ブロックを宛名文字ブロックとする行間接触検出分離手
段と、(ヲ)文字ブロック選出手段あるいは行間接触分
離手段で宛名文字ブロックとされたブロックを、粗分割
領域ごとに統合し、宛名行を生成するブロック統合部
と、(ワ)このブロック統合部が、粗分割領域ごとに生
成した宛名行の画像データ内での位置や大きさを書式候
補単位で相互に比較し、宛名行として最も適当な形態の
宛名行が得られた書式候補を郵便物に用いられている書
式とする書式決定手段とを具備する。
【0016】すなわち、請求項1記載の発明による宛名
行抽出装置では、ぼかし処理手段、ブロック特定手段に
よって、宛名存在領域内に存在するブロックが特定され
ている(いわゆる、ラベリングが行われている)ので、
「い」のように分離した部分を有する文字も、1ブロッ
クとして抽出される。また、宛名存在領域内の投影結果
であるヒストグラムの極小値で、宛名存在領域の粗分割
領域への分割が行われ、粗分割領域の境界を跨いだブロ
ックが存在するときは、その粗分割領域の境界でブロッ
クが分離されるので、文字の中での、へんとつくりとの
間の距離より行間の間隔が小さいときなどにも、文字単
位で正確なブロック抽出が行われることになる。
【0017】また、このようにして抽出されたブロック
のうちに、文字として不適当な大きさのものがあった場
合には、行間接触分離手段によって、該当ブロックに関
するヒストグラムを作成され、再度、ブロックの分離が
行われるようになっているので、たとえば、宛名行の傾
きがある場合や、行間で文字の接触が起こっている場合
にも、正しい分離が行われることになる。そして、この
ように正確に抽出されたブロックを基に宛名行が生成さ
れる構成となっているので、宛名書きにおける文字や宛
名行の変動に対して頑強な宛名行の抽出が行えることに
なる。
【0018】なお、請求項2記載の発明のように、行間
接触検出分離手段を、接触候補ブロックとして選出され
たブロックの画素投影を取ることによって得られたヒス
トグラムをスムージングし、スムージングしたヒストグ
ラムに、極小値があらわれる間隔が文字サイズ推定手段
が算出した平均値に応じたものである重み付け関数を重
畳し、その重畳結果に極小値があらわれる位置でブロッ
クを分割するものとした場合には、さらに、文字間の接
触等の影響を受けにくい宛名行抽出装置が得られること
になる。
【0019】また、請求項3記載の発明のように、行間
接触分離手段として、処理対象とされたブロック近傍の
ヒストグラムを算出するものを用いて宛名行抽出装置を
構成した場合には、さらに、誤った文字行抽出が行われ
る可能性が低い宛名行抽出装置が得られることになる。
【0020】
【実施例】以下、実施例につき本発明を詳細に説明す
る。
【0021】図1に、本発明の一実施例による宛名行抽
出装置の機能ブロック図を示す。図示してあるように、
実施例の宛名行抽出装置は、画像入力部11と雑情報検
出部12と宛名書式仮定部13と複数の宛名行抽出部1
1 〜143 と書式判定部15とを備える。なお、各部
は、プロセッサ、メモリ等の周知の電子素子を用いて形
成されており、以下に記すように動作する。
【0022】画像入力部11は、郵便物を走査して、そ
の表面に描かれた文字あるいは郵便番号枠等の画像に応
じた多値のディジタル画像を出力する。雑情報検出部1
2は、画像入力部11が出力するディジタル画像に対し
て、ノイズ除去を施す。そして、ノイズ除去を施したデ
ィジタル画像を基に、郵便物表面に記載されている切
手、郵便番号枠等の宛名以外の物体の位置と大きさを検
出し、それらの検出結果を、宛名周辺情報として宛名書
式仮定部13に出力する。
【0023】宛名書式仮定部13は、宛名書式仮定部1
3からの宛名周辺情報を基に、処理対象となっている郵
便物の書式を判定(仮定)し、その結果を出力する。
【0024】図2を用いて、宛名書式仮定部の動作内容
を説明する。図示してあるように、郵便物に宛名を書く
場合には、その長手方向が上下方向になるように郵便物
を置いて(縦長に置いて)書く場合(a、b)と、長手
方向が左右方向となるように郵便物を置いて(横長に置
いて)書く場合(c)とがあり、文字の筆記方向にも、
文字を縦書きする場合(a)と、横書きする場合(b、
c)とがある。
【0025】宛名書式仮定部13は、雑情報検出部から
の宛名周辺情報(たとえば、切手の位置、郵便番号枠の
位置)を基に、郵便物を走査したときの向きを判定し、
画像内に線分が検出された場合には、線分の向きから文
字の筆記方向の限定を行い、宛名周辺情報に基づくルー
ルにより、宛名行の抽出対象となっている郵便物が、図
2に示した書式のうち、どの書式によるものであるかを
判断(仮定)し、その結果を、宛名行抽出部14に出力
する。なお、以後の説明においては、図3(a)のよう
な書式を「縦置き縦書き」、(b)のような書式を「縦
置き横書き」、(c)のような書式を「横置き横書き」
と表記することにする。
【0026】すなわち、宛名書式仮定部13は、長手方
向と並行な線分が抽出されたときには、書式を「縦置き
縦書き」または「横置き横書き」に限定し、それ以上の
書式の限定が行えないときには(書式が一意に絞り込め
ないときには)、それら書式として用いられている可能
性がある複数の書式候補を出力する。また、書式候補を
出力する際には、宛名が存在する可能性の高い領域(以
下、宛名存在領域と記す)に関する情報をも出力する。
たとえば、「縦書き縦置き」の場合には、宛名は切手を
上側に置いたときに郵便番号枠の下から郵便物の終端ま
での右半分に存在する可能性が高いため、宛名存在領域
をその領域に設定し、設定した宛名存在領域に関する情
報を書式候補と併せて出力する。
【0027】各宛名行抽出部14は、それぞれ、宛名書
式仮定部13が出力する書式候補と、その書式に該当す
る宛名存在領域の座標情報を受け取り、書式に応じた宛
名行の生成を行い、宛名行として出力する。この宛名行
抽出部の動作内容の詳細は後述する。宛名書式仮定部1
3から書式候補が複数出力された場合は、複数の宛名行
抽出部14が起動され、各宛名行抽出部14は、それぞ
れ別の書式候補に応じた宛名行の抽出処理を実行する。
【0028】書式判定部15は、各宛名行抽出部14が
抽出した宛名行候補を入力とし、それぞれの確からしさ
の判定を行い、最も確からしい書式を特定し、特定した
書式を出力する。
【0029】以下、図3を参照して、書式判定部の動作
を詳細に説明する。なお、図3は、実施例の宛名行抽出
装置において、2つの宛名行抽出部が起動される場合の
一例を示した図であり、(a)には、宛名行の抽出が行
われる画像を示してあり、(b)、(c)には、2つの
宛名行抽出部の抽出結果を示してある。
【0030】図3(a)に示した画像に対して、雑情報
検出部と書式仮定部による処理が行われると、書式仮定
部は「横置き横書き」と「縦置き縦書き」という2つの
書式候補を出力し、2つの宛名行抽出部が起動されるこ
とになる。
【0031】そして、書式候補「横置き横書き」が与え
られた宛名行抽出部は、図3(b)に模式的に示したよ
うな形で、宛名行を抽出し、各宛名行の幅、長さ、位置
等に関する情報を出力する。また、書式候補「縦置き縦
書き」が与えられた宛名行抽出部は、図3(c)に模式
的に示したような形で、宛名行を抽出し、各宛名行の
幅、長さ、位置等に関する情報を出力する。
【0032】書式判定部15は、宛名行の幅の既定の基
準値と、書式候補が「横置き横書き」の場合の宛名行の
幅61との差、および、基準値と書式候補が「縦置き縦
書き」の場合の宛名行の幅63の差を算出する。この
際、宛名行が複数行ある場合には、同様の処理を他の宛
名行に対しても行い、書式候補ごとに、算出した差のコ
スト値を求め、コスト値の小さい方の書式を採用し、採
用した書式を用いた方の宛名行抽出部の出力を、最終出
力とする。
【0033】なお、最終書式の決定時に、基準値との比
較を、長さ62、64に対して、あるいは位置等に関し
ても行うようにしても良い。また、予め宛名行の幅、長
さ、位置の頻度分布を多数の郵便物から計測しておき、
これを参照して、書式候補から1つの書式を選択するよ
うにすることもできる。
【0034】以下、宛名行抽出部の動作の詳細を説明す
る。
【0035】図4に、実施例による宛名行抽出装置内に
設けられる宛名行抽出部の機能ブロック図を示す。図示
してあるように、宛名行抽出部14は、2値化部21、
画素投影部22、領域粗分割部23、ぼかし処理部2
4、ラベリング部25、ブロック分類部26、文字サイ
ズ推定部27、文字ブロック選出部28、文字接触検出
分離部29、ブロック統合部30から構成される。
【0036】2値化部21は、宛名書式仮定部13から
出力された宛名存在領域の位置に相当する多値の宛名画
像に対して、所定の閾値で2値化処理を行い、生成した
2値画像を画素投影部22とぼかし処理部24に供給す
る。
【0037】画素投影部22は、2値化部21が生成し
た2値画像を水平軸と垂直軸のうち書式候補の文字列方
向と直交する方向に近い軸上に画素投影してヒストグラ
ムを計算する。領域粗分割部23は、ヒストグラムのス
ムージング後に、ヒストグラムが“0”でない連続領域
を1つの粗分割領域として宛名存在領域を分割し、各粗
分割領域に関する座標情報を出力する。
【0038】なお、このとき、行間の接触を分離しやす
くするために、ヒストグラムが閾値以下である部分を
“0”として分割する方法も用いることができる。さら
に、これら粗分割領域の幅、領域内に含まれる黒画素数
等が宛名行として不適当なものを所定の閾値により棄却
し、残った領域を粗分割領域として出力する方法もあ
る。
【0039】ぼかし処理部24は、2値化部21が生成
した2値画像に対してガウシアンフィルタを重畳し、そ
の重畳結果を適当な2値化レベルで2値化することによ
って、ぼかし画像を生成する。このぼかし処理部24に
よって、「い」「二」等、複数の連結成分から成る文字
は、一つのブロックとして出力されることになる。な
お、ぼかし処理としては、たとえば、画素を縦横方向に
スキャンし、白ランの長さが既定値以下の部分の白画素
を黒画素に変換するといった処理を用いることもでき
る。
【0040】ラベリング部25は、ぼかし処理部24が
生成したぼかし画像に対してラベリング処理を行い、黒
画素連結成分の最小包囲矩形(以後、ブロックと表記す
る。)の座標情報を出力する。
【0041】ブロック分類部26は、ラベリング部25
からの各ブロックの座標情報と、領域粗分割部23から
の各粗分割領域に関する座標情報とを比較して、各粗分
割領域に含まれるブロックをピックアップすることによ
って、ブロックを各粗分割領域にグループ分けする。な
お、この段階では、1行の宛名行が複数の粗分割領域に
分割されないように、グループ分けされているだけであ
り、1つの粗分割領域に複数の宛名行が含まれているこ
ともある。
【0042】各粗分割領域に分類されたブロックは、粗
分割領域ごとに文字サイズ推定部24と文字ブロック選
出部25に出力される。このとき、粗分割領域の境界に
跨ったブロックは、ぼかし処理により生じた行間接触で
あるから、粗分割領域の境界でブロックを切断し、粗分
割領域内に含まれるブロックの方を他の粗分割領域に属
するブロックとして出力する。
【0043】図5ないし図8を用いて、ブロック分類部
の動作を更に詳細に説明する。まず、図5および図6を
用いて、ブロック分類部にラベリング部側から入力され
ることになる情報を説明する。
【0044】図5(a)に示してあるような原画像に対
して、ぼかし処理部24によるぼかし処理行われた場
合、ぼかし画像は、同図(b)に示したような、文字内
の分離が埋められたものとなり、ラベリング部によっ
て、同図(c)に示したように、各文字が分断されるこ
となくブロックの抽出が行えることになる。しかし、図
6(a)に示してあるような、文字のストロークの間隔
に比べて、文字間あるいは行間の間隔が小さくなってい
る原画像に対してぼかし処理部24によるぼかし処理
行われた場合、ぼかし画像は、同図(b)に示したよう
に、文字間に存在していた白画素も黒画素に変換された
ものとなる。このため、ラベリング部によるラベリング
結果も、図6(c)に示したように、たとえば、2文字
分を1ブロックとしたものとなってしまうことになる。
【0045】次に、図7を用いて、領域粗分割部側から
入力される情報の説明を行う。なお、この図は、図6
(a)に示した原画像に対して、画素投影部および粗領
域分割部によって行われる処理の概要を模式的に示した
ものである。
【0046】既に説明したように、画素投影部における
投影処理は、ぼかし処理を行わない2値画像に対して行
われるため、図7に模式的に示してあるように、処理対
象となる原画像が、行間が狭いものであっても、明らか
な境界を有するヒストグラム45が得られることにな
る。このため、領域粗分割部は、投影処理結果を基に、
粗分割領域の境界51、52を得ることができることに
なる。
【0047】結局、ブロック分類部26には、図8
(a)に模式的に示したように、これら2種の情報が入
力されることになり、ブロック分類部26は、ブロック
41は、そのまま宛名文字ブロックとし、ブロック4
2、43に関しては、図8(b)に示したように、それ
ぞれ、境界51、52で分割を行い、分割結果であるブ
ロック421 、431 を、境界51側の粗分割領域に属
するブロックとして、ブロック422 、432 を、境界
52側の粗分割領域に属するブロックとして出力する。
【0048】図4に戻って、宛名行抽出部の動作の説明
を続ける。
【0049】文字サイズ推定部27は、粗分割領域ごと
に、それぞれの粗分割領域に属するブロックを入力し、
各粗分割領域におけるブロックの大きさの平均値を出力
する。ブロックの大きさとしては、ブロックの幅が用い
られており、文字サイズ推定部27は、粗分割領域内の
ブロックの大きさが1文字として大きすぎるものと小さ
すぎるものを、予め定めたしきい値でしきい値処理する
ことで除外し、残ったブロックの大きさの平均値を、文
字ブロック選出部28と行間接触検出分離部29に出力
している。なお、ブロックの大きさとして、たとえば、
ブロックの長辺の長さやブロックの面積の平方根等を用
いることもできる。
【0050】文字ブロック選出部28は、注目粗分割領
域に属するブロックと平均値の大きさを入力し、文字ら
しい大きさを持つブロックである文字ブロックの選出を
行うとともに、これより大きなブロックは文字の接触に
より生じたブロックである可能性が高い接触候補ブロッ
クとして、行間接触検出分離部29に出力する。
【0051】すなわち、文字ブロック選出部28は、各
粗分割領域ごとの平均値の既定数倍により定められる上
限値、下限値の範囲に、入力されたブロックの大きさが
含まれる場合に、そのブロックを文字ブロックとして出
力し、入力されたブロックの大きさが上記の上限値を超
える場合には、そのブロックを行間接触候補ブロックと
して出力する。
【0052】行間接触検出分離部29は、文字ブロック
の大きさより大きいと判定された文字接触候補ブロック
内の画素の投影処理を行い、ヒストグラムを算出する。
次いで、そのヒストグラムに対して、スムージング処理
を施して、スムージングされたヒストグラムを生成す
る。
【0053】そして、ヒストグラム全体で算出した分散
値と、たとえば、ヒストグラムの中心付近にある極小値
で分離したヒストグラムの一部の両方から算出した分散
値の和とを比較して、全体のヒストグラムから算出した
分散値が小さくなる場合には、注目している行間接触候
補ブロックは分離せずに、文字ブロックとして出力す
る。そして、極小値で分離したヒストグラムの一部の両
方から算出した分散値の和が小さくなる場合には、注目
している文字接触候補ブロックを極小値で分離して個別
の分離ブロックを生成する。分離ブロックに対して再度
分離可能かを調査するなど、同様の処理を行う。
【0054】なお、行間接触候補ブロックを分離する際
に、粗分割領域内のブロックの大きさの平均値に基づい
た、以下に記すような重みづけ関数をヒストグラムに重
畳してから、同様の分離処理を行うようにすれば、切り
出し位置の精度を向上させることができる。
【0055】
【数1】
【0056】この式において、Wは、ブロックの平均の
大きさであり、ブロックの中心に原点に取っている。
【0057】また、文字接触候補ブロック内の画素だけ
ではなく、その周辺の画素を投影して、ヒストグラムを
算出するように行間接触検出分離部29を構成すること
によっても、切り出し位置の精度を向上させることがで
きる。
【0058】行間接触検出分離部29は、ブロックを分
離した場合には、分離により生成される分割ブロックそ
れぞれに対して、再度、文字ブロック選出部28におい
て行ったものと同じ、ブロックの大きさが文字ブロック
の条件に合うかどうかの判定を行い、分離ブロックが文
字ブロックの条件を満たしている場合には文字ブロック
として出力する。もし、注目している分割ブロックが文
字ブロックとして有効でなく文字接触ブロックとして判
定された場合には、再度、注目している分離ブロックの
ヒストグラムを用いた分離処理を行う。
【0059】行間接触検出分離部29では、全ての分離
ブロックが文字ブロックとして出力されるか、ヒストグ
ラムによる接触判定でブロックが接触ブロックでないと
判定されるまで、同様の処理が繰り返される。
【0060】ブロック統合部30では、各粗分割領域に
属する文字ブロックに対して、宛名書式仮定部13にお
いて仮定された宛名書式に則して近接統合を行い、宛名
行を生成する。たとえば、仮定された宛名書式における
筆記方向が縦書きの場合には、ブロックの横方向のずれ
に重み付けした評価関数を用いたk平均クラスタリング
アルゴリズムによって、ブロックを分類し、生成された
各クラスを宛名行として出力する。実施例の宛名行抽出
装置では、下記の評価関数Je(ω)を用いており、こ
の評価関数を最小にするブロックのクラスタ分割を行
い、各クラスタを宛名行としている。なお、次式におい
て、kは定数である。
【0061】
【数2】
【0062】このように構成された実施例の宛名行抽出
装置では、文字の変形、宛名行間の接触、宛名行の入れ
組、傾き等が存在しても、従来の技術に比して、安定し
た宛名行の抽出が行えることになる。
【0063】図9(a)に示したように、分離を含む文
字が多数存在し、宛名行間の近い宛名書きを例に、従来
の技術と、実施例の宛名行抽出装置による宛名行の抽出
結果の違いを説明する。
【0064】図9(a)に示したように宛名が記載され
た郵便物から、従来の黒画素を文字列方向と直交する方
向に投影したヒストグラムを用いて切り出しを行う技術
によって宛名行を抽出する場合には、ヒストグラム上の
極小値が十分小さくなく、予め設定した閾値を超える。
そのため行を分離することができず、同図(b)に示し
たような、宛名行抽出結果73が得られてしまうことに
なる。また、従来のラベリングを用いた技術によっても
文字の大きさの推定が精度よく行えないため、文字の大
きさが小さめに見積もられた場合には、同図(c)に示
したように、宛名行抽出結果71、72のような出力が
得られてしまうし、逆に、文字の大きさが大きめに見積
もられた場合、宛名行検出結果73のような出力が得ら
れてしまう。
【0065】これに対して、実施例の宛名行抽出装置で
は、文字内の分離をぼかしにより結合しておき、これに
より文字の大きさを推定し、推定した文字の大きさに基
づいて接触文字の分離を行うように構成されているた
め、行を高精度に切り出すことができ、同図(c)のよ
うに、正確な宛名行抽出結果74、75が得られること
になる。
【0066】また、図10(a)のように文字の大きさ
が一つの宛名書きの中で変化し、接触、スキューも同時
に存在するような場合でも、従来技術では、同図(b)
のように接近した宛名行を分離することができないが、
実施例の宛名行抽出装置では、粗分割領域ごとに、推定
した文字のサイズに基づいて行間接触が生じている部分
を予め分離してから、ブロックの近接統合処理を行うた
め、同図(c)のように高精度に宛名行を切り出すこと
ができることになる。
【0067】
【発明の効果】以上、詳細に説明したように、請求項1
ないし請求項3記載の発明による宛名行抽出装置によれ
ば、文字の変形、宛名行間の接触、宛名行の入れ組、傾
き等が存在しても、安定した宛名行の抽出が行える。
【0068】また、請求項2または請求項3記載の発明
のように、宛名行抽出装置を構成した場合には、ブロッ
クの分離する位置の精度が向上することになるので、そ
の結果として、更に、安定な宛名行抽出が行えることに
なる。
【図面の簡単な説明】
【図1】本発明の一実施例による宛名行抽出装置の概要
を示す機能ブロック図である。
【図2】実施例の宛名行抽出装置内の書式仮定部が仮定
する書式を説明するための説明図である。
【図3】実施例の宛名行抽出装置内の書式判定部の動作
を説明するために用いた、処理対象とされる画像と宛名
行抽出部の出力との対応関係の概要を示した模式図であ
る。
【図4】実施例の宛名行抽出装置内に設けられる宛名行
抽出部の概要を示す機能ブロック図である。
【図5】実施例の宛名行抽出装置内のぼかし処理部およ
びラベリング部の動作結果の一例を示した説明図であ
る。
【図6】実施例の宛名行抽出装置内のぼかし処理部およ
びラベリング部の動作結果の他の例を示した説明図であ
る。
【図7】実施例の宛名行抽出装置内の画素投影部および
領域粗分割部の動作結果の一例を示した説明図である。
【図8】実施例の宛名行抽出装置内のブロック分類部の
動作の概要を示す説明図である。
【図9】実施例の宛名行抽出装置と、従来技術による宛
名行抽出性能の違いを示すための説明図である。
【図10】実施例の宛名行抽出装置と、従来技術による
宛名行抽出性能の違いを示すための説明図である。
【符号の説明】
11 画像入力部 12 雑情報検出部 13 宛名書式仮定部 14 宛名行抽出部 15 書式判定部 21 2値化部 22 画素投影部 23 領域粗分割部 24 ぼかし処理部 25 ラベリング部 26 ブロック分割部 27 文字サイズ推定部 28 文字ブロック選出部 29 行間接触検出分離部 30 ブロック統合部

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 郵便物の記載内容に応じた画像データか
    ら宛名以外の記載情報を検出する雑情報検出手段と、 この雑情報検出手段の検出結果を用いて前記郵便物の宛
    名の記載に用いられている可能性が高い、宛名行の筆記
    方向を指定する情報を含む書式候補を少なくとも1つ仮
    定する宛名書式仮定手段と、 前記画像データから前記宛名書式仮定手段が仮定した各
    書式候補に応じた宛名が記載されている可能性の高い領
    域である宛名存在領域に関するデータを、それぞれ、宛
    名存在領域画像として抽出する抽出手段と、 この抽出手段が書式候補ごとに抽出した各宛名存在領域
    画像に対して、水平軸あるいは垂直軸のうち、対応する
    書式候補で指定されている宛名行の筆記方向に直交する
    方向に近い軸上へ画素を投影し、ヒストグラムを算出す
    る画素投影手段と、 前記抽出手段が書式候補ごとに抽出した各宛名存在領域
    画像に対して、ぼかし処理を行いぼかし画像を生成する
    ぼかし処理手段と、 このぼかし処理手段が生成した各ぼかし画像から、黒画
    素が連結した閉領域を包含するサイズが最小である矩形
    のブロックを特定し、特定したブロックに関する情報を
    出力するブロック特定手段と、 前記画素投影手段が算出した各ヒストグラムの極小点で
    そのヒストグラムに対応する宛名存在領域を分割し、分
    割後の各領域を粗分割領域とする粗分割領域設定手段
    と、 前記ブロック特定手段によって特定されたブロックのう
    ち、いずれか1つの前記粗分割領域内に含まれるブロッ
    クに関しては、そのまま、その粗分割領域に対して分類
    付けを行い、複数の粗分割領域に跨がるブロックに関し
    ては、そのブロックをそれぞれが1つの粗分割領域に含
    まれるように複数のブロックに分割し、 分割したブロックを各粗分割領域に対して分類付けする
    ブロック分類手段と、 このブロック分類手段によって各粗分割領域に分類され
    たブロックの大きさの平均値を粗分割領域ごとに算出す
    る文字サイズ推定手段と、 各粗分割領域に属するブロックに関して、前記各粗分割
    領域で算出した前記平均値との差が所定値以内の大きさ
    を持つブロックを宛名文宇ブロックとして選出し、前記
    平均値より大きくかつ前記平均値との差が規定値より大
    きい大きさを持つブロックを接触候補ブロックとして選
    出する文字ブロック選出手段と、 この文字ブロック選出手段によって接触候補ブロックと
    して選出されたブロックに対して、水平軸または垂直軸
    のうち前記宛名行の筆記方向に直交する方向に近い軸上
    へ画素の投影を行うことによりヒストグラムを算出し、
    算出したヒストグラムに極小点が存在する場合には、そ
    の極小点でそのブロックの分割を行い、分割後のブロッ
    クを宛名文字ブロックとする行間接触検出分離手段と、 文字ブロック選出手段あるいは行間接触分離手段で宛名
    文字ブロックとされたブロックを、前記粗分割領域ごと
    に統合し、宛名行を生成するブロック統合部と、 このブロック統合部が、粗分割領域ごとに生成した宛名
    行の前記画像データ内での位置や大きさを前記書式候補
    単位で相互に比較し、宛名行として最も適当な形態の宛
    名行が得られた書式候補を前記郵便物に用いられている
    書式とする書式決定手段とを具備することを特徴とする
    宛名行抽出装置。
  2. 【請求項2】 前記行間接触検出分離手段が、接触候補
    ブロックとして選出されたブロックの画素投影を取るこ
    とによって得られたヒストグラムをスムージングし、ス
    ムージングしたヒストグラムに、極小値があらわれる間
    隔が前記文字サイズ推定手段が算出した前記平均値に
    じたものである重み付け関数を重畳し、その重畳結果に
    極小値があらわれる位置でブロックを分割するものであ
    ることを特徴とする請求項1記載の宛名行抽出装置。
  3. 【請求項3】 前記行間接触検出分離手段が、前記文字
    ブロック選出手段によって接触候補ブロックとして選出
    されたブロック内の画素と、そのブロックの近傍の画素
    を、水平軸または垂直軸のうち前記宛名行の筆記方向に
    直交する方向に近い軸上へ投影することによりヒストグ
    ラムを算出し、算出したヒストグラムに極小点が存在す
    る場合には、その極小点でそのブロックの分割を行い、
    分割後のブロックを宛名文字ブロックとするものである
    ことを特徴とする請求項1または請求項2記載の宛名行
    抽出装置。
JP7105575A 1995-04-28 1995-04-28 宛名行抽出装置 Expired - Lifetime JP2861860B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7105575A JP2861860B2 (ja) 1995-04-28 1995-04-28 宛名行抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7105575A JP2861860B2 (ja) 1995-04-28 1995-04-28 宛名行抽出装置

Publications (2)

Publication Number Publication Date
JPH08305793A JPH08305793A (ja) 1996-11-22
JP2861860B2 true JP2861860B2 (ja) 1999-02-24

Family

ID=14411324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7105575A Expired - Lifetime JP2861860B2 (ja) 1995-04-28 1995-04-28 宛名行抽出装置

Country Status (1)

Country Link
JP (1) JP2861860B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003044856A (ja) * 2001-07-30 2003-02-14 Dds:Kk 指紋照合装置、指紋照合方法及び指紋照合プログラム
CN100369049C (zh) * 2005-02-18 2008-02-13 富士通株式会社 灰度字符的精确分割装置及方法
CN100514355C (zh) * 2005-09-05 2009-07-15 富士通株式会社 指定文本行提取方法和装置
JP7292984B2 (ja) * 2019-06-13 2023-06-19 キヤノン株式会社 行分割装置および方法、ならびにプログラム
KR20220086896A (ko) 2020-12-17 2022-06-24 삼성전자주식회사 필기 입력을 처리하는 전자 장치 및 그 작동 방법

Also Published As

Publication number Publication date
JPH08305793A (ja) 1996-11-22

Similar Documents

Publication Publication Date Title
Shi et al. Line separation for complex document images using fuzzy runlength
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7379594B2 (en) Methods and systems for automatic detection of continuous-tone regions in document images
EP1061469B1 (en) Method and apparatus for selecting text and/or non-text blocks in a stored document
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US6014450A (en) Method and apparatus for address block location
US9324001B2 (en) Character recognition device and character segmentation method
JPH096957A (ja) 濃度画像の2値化方法および画像2値化装置
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20030010530A (ko) 이미지 처리 방법, 장치 및 시스템
Chen et al. Decompose algorithm for thresholding degraded historical document images
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
JP4392907B2 (ja) 文字切出し方法
JP4011646B2 (ja) 行検出方法および文字認識装置
Tan et al. Removal of interfering strokes in double-sided document images
JP2861860B2 (ja) 宛名行抽出装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2827960B2 (ja) 宛名行抽出装置
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
Sherkat et al. Use of colour for hand-filled form analysis and recognition
JP2000357287A (ja) ナンバープレート認識方法および認識装置
JP2714012B2 (ja) 宛名領域検出装置
JP4242962B2 (ja) 文字切出装置
Tan et al. Text extraction from historical handwritten documents by edge detection

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071211

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081211

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091211

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091211

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101211

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101211

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111211

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111211

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 15

EXPY Cancellation because of completion of term