JP3316326B2 - 画像処理装置 - Google Patents
画像処理装置Info
- Publication number
- JP3316326B2 JP3316326B2 JP32329994A JP32329994A JP3316326B2 JP 3316326 B2 JP3316326 B2 JP 3316326B2 JP 32329994 A JP32329994 A JP 32329994A JP 32329994 A JP32329994 A JP 32329994A JP 3316326 B2 JP3316326 B2 JP 3316326B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- image
- address
- document
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
【0001】
【産業上の利用分野】本発明は、例えば葉書や封筒の郵
便物文書画像などの書面画像から文字認識する画像処理
装置に関する。
便物文書画像などの書面画像から文字認識する画像処理
装置に関する。
【0002】
【従来の技術】従来、OCR(Optical Character Read
er)の技術により名刺から住所氏名を読み取って電子的
な住所録を作成するシステムは存在するが、葉書などに
書かれた差出人の住所氏名から電子的な住所録を作成す
るためのデータ入力手段は専らキーボードからの手動入
力に頼ってきた。
er)の技術により名刺から住所氏名を読み取って電子的
な住所録を作成するシステムは存在するが、葉書などに
書かれた差出人の住所氏名から電子的な住所録を作成す
るためのデータ入力手段は専らキーボードからの手動入
力に頼ってきた。
【0003】また、郵便物に関しては、特開昭48−4
1629号公報のように郵便番号や宛先を自動抽出・認
識するシステムは存在するが、葉書などの差出人の住所
氏名領域を、文字認識処理を行うことなく自動的に抽出
するシステムは発表されていない。
1629号公報のように郵便番号や宛先を自動抽出・認
識するシステムは存在するが、葉書などの差出人の住所
氏名領域を、文字認識処理を行うことなく自動的に抽出
するシステムは発表されていない。
【0004】
【発明が解決しようとする課題】上記従来のシステムで
は、例えば住所録作成などのために大量の葉書などを基
に差出人の住所・氏名データを手動で入力するには、多
大な時間と労力を必要とする。また、例えば葉書には、
差出人住所氏名領域以外に絵や写真、他の文章など余分
な部分が多く含まれているために、OCR技術などで葉
書画像から文字認識を行っても後から差出人の住所・氏
名の部分を選び出すという手間をかけなければならず、
その文字認識処理にも時間がかかるという問題を有して
いた。
は、例えば住所録作成などのために大量の葉書などを基
に差出人の住所・氏名データを手動で入力するには、多
大な時間と労力を必要とする。また、例えば葉書には、
差出人住所氏名領域以外に絵や写真、他の文章など余分
な部分が多く含まれているために、OCR技術などで葉
書画像から文字認識を行っても後から差出人の住所・氏
名の部分を選び出すという手間をかけなければならず、
その文字認識処理にも時間がかかるという問題を有して
いた。
【0005】本発明は、上記従来の問題を解決するもの
で、入力された郵便物文書などの書面画像から文字認識
処理を行う前に、自動的に差出人住所・氏名などの特定
文書領域を抽出することで文字認識時間を少なくして、
文字認識による住所録作成などのデータ作成処理などを
自動的に行うことができる画像処理装置を提供すること
を目的とする。
で、入力された郵便物文書などの書面画像から文字認識
処理を行う前に、自動的に差出人住所・氏名などの特定
文書領域を抽出することで文字認識時間を少なくして、
文字認識による住所録作成などのデータ作成処理などを
自動的に行うことができる画像処理装置を提供すること
を目的とする。
【0006】
【課題を解決するための手段】本発明の画像処理装置
は、葉書や封書を含む郵便物文書の書面画像から画像デ
ータを入力する画像入力手段と、前記入力された画像デ
ータを格納する画像メモリと、前記画像メモリに格納さ
れている画像データに含まれている文字に対して文字認
識処理を行う前に、前記書面画像の特定部分からその書
面画像の表裏を判定する裏表判定手段と、前記裏表判定
手段の判定結果に応じて、前記画像データからその書面
画像の表または裏の住所氏名領域を含む特定文書領域を
自動的に抽出する特定文書領域抽出手段と、前記特定文
書領域抽出手段でそれぞれ求められた表または裏の住所
氏名領域を含む特定文書領域に対して文字認識処理を行
う文字認識手段と、前記文字認識手段で認識された結果
の文字列を予め辞書登録されている情報と照合し、前記
特定文書に含まれる郵便番号、住所、電話番号やFAX
番号を示す記号、氏名などの項目に分類する住所氏名分
類手段と、を備えてなる画像処理装置において、前記裏
表判定手段は、前記書面画像の一定の領域内に存在する
黒画素連結成分の外接矩形のうち、予め指定された大き
さの外接矩形を抽出する外接矩形抽出手段と、前記抽出
した外接矩形のうち外接矩形の数が一定数以上横方向に
並んで存在するかどうかで該画像の裏表を特定する裏表
特定手段とを含み、前記裏表判定手段は、前記外接矩形
抽出手段によって抽出された予め指定された大きさの外
接矩形の候補矩形に対して、前記裏表特定手段によって
予め規定された縦方向の範囲内に3つ以上横方向に並ん
で存在する場合に表面と判定し、それ以外の場合を裏面
と判定することで前記書面画像の表裏判定を行い、前記
特定文書領域抽出手段は、前記裏表判定手段で表面と判
定された場合に機能する表面住所氏名領域抽出手段と、
前記裏表判定手段で裏面と判定された場合に機能する裏
面住所氏名領域抽出手段とを備え、前記表面住所氏名領
域抽出手段は、前記書面画像のうち前記表裏判定手段に
て判定された表面の画像に対して、予め指定された横方
向の区間においてその画像の上端より下向きに黒画素が
存在する部分までその画像を走査する走査手段と、前記
走査手段で走査した距離に基づいて領域を特定する領域
特定手段とを含み、前記表面住所氏名領域抽出手段は、
前記走査手段にて走査した結果、走査距離が所定距離よ
りも長い場合、その最も長かった箇所を宛先部分と差出
人住所部分とを分割する縦方向の空白部分の位置と見な
し、前記領域特定手段によってその最も長かった走査箇
所から左側全体の領域を差出人の住所氏名領域として抽
出することを特徴とするものであり、そのことにより上
記目的が達成される。
は、葉書や封書を含む郵便物文書の書面画像から画像デ
ータを入力する画像入力手段と、前記入力された画像デ
ータを格納する画像メモリと、前記画像メモリに格納さ
れている画像データに含まれている文字に対して文字認
識処理を行う前に、前記書面画像の特定部分からその書
面画像の表裏を判定する裏表判定手段と、前記裏表判定
手段の判定結果に応じて、前記画像データからその書面
画像の表または裏の住所氏名領域を含む特定文書領域を
自動的に抽出する特定文書領域抽出手段と、前記特定文
書領域抽出手段でそれぞれ求められた表または裏の住所
氏名領域を含む特定文書領域に対して文字認識処理を行
う文字認識手段と、前記文字認識手段で認識された結果
の文字列を予め辞書登録されている情報と照合し、前記
特定文書に含まれる郵便番号、住所、電話番号やFAX
番号を示す記号、氏名などの項目に分類する住所氏名分
類手段と、を備えてなる画像処理装置において、前記裏
表判定手段は、前記書面画像の一定の領域内に存在する
黒画素連結成分の外接矩形のうち、予め指定された大き
さの外接矩形を抽出する外接矩形抽出手段と、前記抽出
した外接矩形のうち外接矩形の数が一定数以上横方向に
並んで存在するかどうかで該画像の裏表を特定する裏表
特定手段とを含み、前記裏表判定手段は、前記外接矩形
抽出手段によって抽出された予め指定された大きさの外
接矩形の候補矩形に対して、前記裏表特定手段によって
予め規定された縦方向の範囲内に3つ以上横方向に並ん
で存在する場合に表面と判定し、それ以外の場合を裏面
と判定することで前記書面画像の表裏判定を行い、前記
特定文書領域抽出手段は、前記裏表判定手段で表面と判
定された場合に機能する表面住所氏名領域抽出手段と、
前記裏表判定手段で裏面と判定された場合に機能する裏
面住所氏名領域抽出手段とを備え、前記表面住所氏名領
域抽出手段は、前記書面画像のうち前記表裏判定手段に
て判定された表面の画像に対して、予め指定された横方
向の区間においてその画像の上端より下向きに黒画素が
存在する部分までその画像を走査する走査手段と、前記
走査手段で走査した距離に基づいて領域を特定する領域
特定手段とを含み、前記表面住所氏名領域抽出手段は、
前記走査手段にて走査した結果、走査距離が所定距離よ
りも長い場合、その最も長かった箇所を宛先部分と差出
人住所部分とを分割する縦方向の空白部分の位置と見な
し、前記領域特定手段によってその最も長かった走査箇
所から左側全体の領域を差出人の住所氏名領域として抽
出することを特徴とするものであり、そのことにより上
記目的が達成される。
【0007】また、本発明の画像処理装置は、葉書や封
書を含む郵便物文書の書面画像から画像データを入力す
る画像入力手段と、前記入力された画像データを格納す
る画像メモリと、前記画像メモリに格納されている画像
データに含まれている文字に対して文字認識処理を行う
前に、前記書面画像の特定部分からその書面画像の表裏
を判定する裏表判定手段と、前記裏表判定手段の判定結
果に応じて、前記画像データからその書面画像の表また
は裏の住所氏名領域を含む特定文書領域を自動的に抽出
する特定文書領域抽出手段と、前記特定文書領域抽出手
段でそれぞれ求められた表または裏の住所氏名領域を含
む特定文書領域に対して文字認識処理を行う文字認識手
段と、前記文字認識手段で認識された結果の文字列を予
め辞書登録されている情報と照合し、前記特定文書に含
まれる郵便番号、住所、電話番号やFAX番号を示す記
号、氏名などの項目に分類する住所氏名分類手段と、を
備えてなる画像処理装置において、前記裏表判定手段
は、前記書面画像の一定の領域内に存在する黒画素連結
成分の外接矩形のうち、予め指定された大きさの外接矩
形を抽出する外接矩形抽出手段と、前記抽出した外接矩
形のうち外接矩形の数が一定数以上横方向に並んで存在
するかどうかで該画像の裏表を特定する裏表特定手段と
を含み、前記裏表判定手段は、前記外接矩形抽出手段に
よって抽出された予め指定された大きさの外接矩形の候
補矩形に対して、前記裏表特定手段によって予め規定さ
れた縦方向の範囲内に3つ以上横方向に並んで存在する
場合に表面と判定し、それ以外の場合を裏面と判定する
ことで前記書面画像の表裏判定を行い、前記特定文書領
域抽出手段は、前記裏表判定手段で表面と判定された場
合に機能する表面住所氏名領域抽出手段と、前記裏表判
定手段で裏面と判定された場合に機能する裏面住所氏名
領域抽出手段とを備え、前記表面住所氏名領域抽出手段
は、前記書面画像のうち前記裏表判定手段にて判定され
た表面の画像に対して、予め指定された横方向の区間に
おいてその画像の上端より下向きに黒画素が存在する部
分までの画像を走査し、この走査した距離が最も長い箇
所に存在する黒画素の位置を求める黒画素位置算出設定
手段と、前記黒画素位置算出手段で求めた黒画素の位置
を左上座標とし、予め定められた座標を右下座標とする
矩形領域内における縦方向の空白部分に基づいて領域を
特定する領域特定手段とを含み、前記表面住所氏名領域
抽出手段は、前記黒画素位置算出手段で求めた結果、黒
画素の位置を左上座標とし、予め定められた座標を右下
座標とする矩形領域内における縦方向の空白部分を抽出
し、この空白部分が所定大きさよりも大きい場合、その
最大幅の空白部分を宛先部分と差出人住所部分とを分割
する縦方向の空白部分の位置と見なし、前記領域特定手
段によってこの抽出した空白部分のうち最大幅を持つ空
白部分の左端から左側全体の領域を差出人の住所氏名領
域として抽出することを特徴とするものであり、そのこ
とにより上記目的が達成される。
書を含む郵便物文書の書面画像から画像データを入力す
る画像入力手段と、前記入力された画像データを格納す
る画像メモリと、前記画像メモリに格納されている画像
データに含まれている文字に対して文字認識処理を行う
前に、前記書面画像の特定部分からその書面画像の表裏
を判定する裏表判定手段と、前記裏表判定手段の判定結
果に応じて、前記画像データからその書面画像の表また
は裏の住所氏名領域を含む特定文書領域を自動的に抽出
する特定文書領域抽出手段と、前記特定文書領域抽出手
段でそれぞれ求められた表または裏の住所氏名領域を含
む特定文書領域に対して文字認識処理を行う文字認識手
段と、前記文字認識手段で認識された結果の文字列を予
め辞書登録されている情報と照合し、前記特定文書に含
まれる郵便番号、住所、電話番号やFAX番号を示す記
号、氏名などの項目に分類する住所氏名分類手段と、を
備えてなる画像処理装置において、前記裏表判定手段
は、前記書面画像の一定の領域内に存在する黒画素連結
成分の外接矩形のうち、予め指定された大きさの外接矩
形を抽出する外接矩形抽出手段と、前記抽出した外接矩
形のうち外接矩形の数が一定数以上横方向に並んで存在
するかどうかで該画像の裏表を特定する裏表特定手段と
を含み、前記裏表判定手段は、前記外接矩形抽出手段に
よって抽出された予め指定された大きさの外接矩形の候
補矩形に対して、前記裏表特定手段によって予め規定さ
れた縦方向の範囲内に3つ以上横方向に並んで存在する
場合に表面と判定し、それ以外の場合を裏面と判定する
ことで前記書面画像の表裏判定を行い、前記特定文書領
域抽出手段は、前記裏表判定手段で表面と判定された場
合に機能する表面住所氏名領域抽出手段と、前記裏表判
定手段で裏面と判定された場合に機能する裏面住所氏名
領域抽出手段とを備え、前記表面住所氏名領域抽出手段
は、前記書面画像のうち前記裏表判定手段にて判定され
た表面の画像に対して、予め指定された横方向の区間に
おいてその画像の上端より下向きに黒画素が存在する部
分までの画像を走査し、この走査した距離が最も長い箇
所に存在する黒画素の位置を求める黒画素位置算出設定
手段と、前記黒画素位置算出手段で求めた黒画素の位置
を左上座標とし、予め定められた座標を右下座標とする
矩形領域内における縦方向の空白部分に基づいて領域を
特定する領域特定手段とを含み、前記表面住所氏名領域
抽出手段は、前記黒画素位置算出手段で求めた結果、黒
画素の位置を左上座標とし、予め定められた座標を右下
座標とする矩形領域内における縦方向の空白部分を抽出
し、この空白部分が所定大きさよりも大きい場合、その
最大幅の空白部分を宛先部分と差出人住所部分とを分割
する縦方向の空白部分の位置と見なし、前記領域特定手
段によってこの抽出した空白部分のうち最大幅を持つ空
白部分の左端から左側全体の領域を差出人の住所氏名領
域として抽出することを特徴とするものであり、そのこ
とにより上記目的が達成される。
【0008】さらに、本発明の画像処理装置は、葉書や
封書を含む郵便物文書の書面画像から画像データを入力
する画像入力手段と、前記入力された画像データを格納
する画像メモリと、前記画像メモリに格納されている画
像データに含まれている文字に対して文字認識処理を行
う前に、前記書面画像の特定部分からその書面画像の表
裏を判定する裏表判定手段と、前記裏表判定手段の判定
結果に応じて、前記画像データからその書面画像の表ま
たは裏の住所氏名領域を含む特定文書領域を自動的に抽
出する特定文書領域抽出手段と、前記特定文書領域抽出
手段でそれぞれ求められた表または裏の住所氏名領域を
含む特定文書領域に対して文字認識処理を行う文字認識
手段と、前記文字認識手段で認識された結果の文字列を
予め辞書登録されている情報と照合し、前記特定文書に
含まれる郵便番号、住所、電話番号やFAX番号を示す
記号、氏名などの項目に分類する住所氏名分類手段と、
を備えてなる画像処理装置において、前記裏表判定手段
は、前記書面画像の一定の領域内に存在する黒画素連結
成分の外接矩形のうち、予め指定された大きさの外接矩
形を抽出する外接矩形抽出手段と、前記抽出した外接矩
形のうち外接矩形の数が一定数以上横方向に並んで存在
するかどうかで該画像の裏表を特定する裏表特定手段と
を含み、前記裏表判定手段は、前記外接矩形抽出手段に
よって抽出された予め指定された大きさの外接矩形の候
補矩形に対して、前記裏表特定手段によって予め規定さ
れた縦方向の範囲内に3つ以上横方向に並んで存在する
場合に表面と判定し、それ以外の場合を裏面と判定する
ことで前記書面画像の表裏判定を行い、前記特定文書領
域抽出手段は、前記裏表判定手段で表面と判定された場
合に機能する表面住所氏名領域抽出手段と、前記裏表判
定手段で裏面と判定された場合に機能する裏面住所氏名
領域抽出手段とを備え、裏面住所氏名領域抽出手段は、
前記書面画像中の連結領域から外接矩形を抽出し、その
中から有効矩形と特定する有効矩形特定手段と、前記書
面画像を2つの領域に分割しそれぞれの領域において有
効矩形の数を計算する有効矩形数計算手段と、前記有効
矩形数計算手段で計算したそれぞれの領域の有効矩形数
のうち、指定された一方の領域内の有効矩形数が他方の
領域内の有効矩形数に一定倍率を乗じた値に基づいて領
域を特定する領域特定手段とを含み、裏面住所氏名領域
抽出手段は、有効矩形特定手段によって前記書面画像中
の黒画素連結成分の外接矩形を抽出し、この抽出した外
接矩形のうち一定の条件を満たす矩形を有効矩形として
抽出し、前記有効矩形数計算手段によって前記書面画像
を2つの領域に分割し、それぞれの領域において有効矩
形の数を計算し、前記領域特定手段によってそれぞれの
領域の有効矩形数のうち、指定された一方の領域内の有
効矩形数が他方の領域内の有効矩形数に一定倍率を乗じ
た値より大きい場合には指定された一方の領域を差出人
の住所氏名領域と判断し、そうでない場合には他方の領
域を差出人の住所氏名領域と判断することを特徴とする
ものであり、そのことにより上記目的が達成される。
封書を含む郵便物文書の書面画像から画像データを入力
する画像入力手段と、前記入力された画像データを格納
する画像メモリと、前記画像メモリに格納されている画
像データに含まれている文字に対して文字認識処理を行
う前に、前記書面画像の特定部分からその書面画像の表
裏を判定する裏表判定手段と、前記裏表判定手段の判定
結果に応じて、前記画像データからその書面画像の表ま
たは裏の住所氏名領域を含む特定文書領域を自動的に抽
出する特定文書領域抽出手段と、前記特定文書領域抽出
手段でそれぞれ求められた表または裏の住所氏名領域を
含む特定文書領域に対して文字認識処理を行う文字認識
手段と、前記文字認識手段で認識された結果の文字列を
予め辞書登録されている情報と照合し、前記特定文書に
含まれる郵便番号、住所、電話番号やFAX番号を示す
記号、氏名などの項目に分類する住所氏名分類手段と、
を備えてなる画像処理装置において、前記裏表判定手段
は、前記書面画像の一定の領域内に存在する黒画素連結
成分の外接矩形のうち、予め指定された大きさの外接矩
形を抽出する外接矩形抽出手段と、前記抽出した外接矩
形のうち外接矩形の数が一定数以上横方向に並んで存在
するかどうかで該画像の裏表を特定する裏表特定手段と
を含み、前記裏表判定手段は、前記外接矩形抽出手段に
よって抽出された予め指定された大きさの外接矩形の候
補矩形に対して、前記裏表特定手段によって予め規定さ
れた縦方向の範囲内に3つ以上横方向に並んで存在する
場合に表面と判定し、それ以外の場合を裏面と判定する
ことで前記書面画像の表裏判定を行い、前記特定文書領
域抽出手段は、前記裏表判定手段で表面と判定された場
合に機能する表面住所氏名領域抽出手段と、前記裏表判
定手段で裏面と判定された場合に機能する裏面住所氏名
領域抽出手段とを備え、裏面住所氏名領域抽出手段は、
前記書面画像中の連結領域から外接矩形を抽出し、その
中から有効矩形と特定する有効矩形特定手段と、前記書
面画像を2つの領域に分割しそれぞれの領域において有
効矩形の数を計算する有効矩形数計算手段と、前記有効
矩形数計算手段で計算したそれぞれの領域の有効矩形数
のうち、指定された一方の領域内の有効矩形数が他方の
領域内の有効矩形数に一定倍率を乗じた値に基づいて領
域を特定する領域特定手段とを含み、裏面住所氏名領域
抽出手段は、有効矩形特定手段によって前記書面画像中
の黒画素連結成分の外接矩形を抽出し、この抽出した外
接矩形のうち一定の条件を満たす矩形を有効矩形として
抽出し、前記有効矩形数計算手段によって前記書面画像
を2つの領域に分割し、それぞれの領域において有効矩
形の数を計算し、前記領域特定手段によってそれぞれの
領域の有効矩形数のうち、指定された一方の領域内の有
効矩形数が他方の領域内の有効矩形数に一定倍率を乗じ
た値より大きい場合には指定された一方の領域を差出人
の住所氏名領域と判断し、そうでない場合には他方の領
域を差出人の住所氏名領域と判断することを特徴とする
ものであり、そのことにより上記目的が達成される。
【0009】さらに、本発明の画像処理装置は、葉書や
封書を含む郵便物文書の書面画像から画像データを入力
する画像入力手段と、前記入力された画像データを格納
する画像メモリと、前記画像メモリに格納されている画
像データに含まれている文字に対して文字認識処理を行
う前に、前記書面画像の特定部分からその書面画像の表
裏を判定する裏表判定手段と、前記裏表判定手段の判定
結果に応じて、前記画像データからその書面画像の表ま
たは裏の住所氏名領域を含む特定文書領域を自動的に抽
出する特定文書領域抽出手段と、前記特定文書領域抽出
手段でそれぞれ求められた表または裏の住所氏名領域を
含む特定文書領域に対して文字認識処理を行う文字認識
手段と、前記文字認識手段で認識された結果の文字列を
予め辞書登録されている情報と照合し、前記特定文書に
含まれる郵便番号、住所、電話番号やFAX番号を示す
記号、氏名などの項目に分類する住所氏名分類手段と、
を備えてなる画像処理装置において、前記裏表判定手段
は、前記書面画像の一定の領域内に存在する黒画素連結
成分の外接矩形のうち、予め指定された大きさの外接矩
形を抽出する外接矩形抽出手段と、前記抽出した外接矩
形のうち外接矩形の数が一定数以上横方向に並んで存在
するかどうかで該画像の裏表を特定する裏表特定手段と
を含み、前記裏表判定手段は、前記外接矩形抽出手段に
よって抽出された予め指定された大きさの外接矩形の候
補矩形に対して、前記裏表特定手段によって予め規定さ
れた縦方向の範囲内に3つ以上横方向に並んで存在する
場合に表面と判定し、それ以外の場合を裏面と判定する
ことで前記書面画像の表裏判定を行い、前記特定文書領
域抽出手段は、前記裏表判定手段で表面と判定された場
合に機能する表面住所氏名領域抽出手段と、前記裏表判
定手段で裏面と判定された場合に機能する裏面住所氏名
領域抽出手段とを備え、前記裏面住所氏名領域抽出手段
は、前記書面画像内の指定された領域に対して縦方向お
よび横方向の空白部分を抽出する空白部分抽出手段と、
該空白部分抽出手段で抽出した空白部分が存在する方向
に基づいて指定された領域を分割し、候補領域を特定す
る候補領域特定手段と、前記各手段による処理を再帰的
に繰り返して最終的に一つの領域を特定する領域特定手
段とを含み、前記裏面住所氏名領域抽出手段は、前記空
白部分抽出手段によって前記書面画像内の指定された領
域に対して縦方向および横方向の空白部分を抽出し、抽
出された空白部分のうち、予め定められた大きさ以上の
空白部分が横方向に存在する場合にはその部分から上下
に候補領域を分割し、予め定められた大きさ以上の空白
部分が縦方向に存在する場合にはその部分から左右に候
補領域を分割し、この分割領域のうち文字列方向が縦方
向の場合には一定条件の大きさを持ち最も左下に位置す
る領域を、一方文字列方向が横方向の場合には一定条件
の大きさを持ち最も右下に位置する領域を、前記領域特
定手段によってそれぞれ差出人住所氏名候補領域と特定
し、前記領域特定手段によって前記空白部分の抽出、領
域分割並びに候補領域抽出を再帰的に繰り返して、最終
的に一つの領域を差出人住所氏名候補領域と特定するこ
とを特徴とするものであり、そのことにより上記目的が
達成される。
封書を含む郵便物文書の書面画像から画像データを入力
する画像入力手段と、前記入力された画像データを格納
する画像メモリと、前記画像メモリに格納されている画
像データに含まれている文字に対して文字認識処理を行
う前に、前記書面画像の特定部分からその書面画像の表
裏を判定する裏表判定手段と、前記裏表判定手段の判定
結果に応じて、前記画像データからその書面画像の表ま
たは裏の住所氏名領域を含む特定文書領域を自動的に抽
出する特定文書領域抽出手段と、前記特定文書領域抽出
手段でそれぞれ求められた表または裏の住所氏名領域を
含む特定文書領域に対して文字認識処理を行う文字認識
手段と、前記文字認識手段で認識された結果の文字列を
予め辞書登録されている情報と照合し、前記特定文書に
含まれる郵便番号、住所、電話番号やFAX番号を示す
記号、氏名などの項目に分類する住所氏名分類手段と、
を備えてなる画像処理装置において、前記裏表判定手段
は、前記書面画像の一定の領域内に存在する黒画素連結
成分の外接矩形のうち、予め指定された大きさの外接矩
形を抽出する外接矩形抽出手段と、前記抽出した外接矩
形のうち外接矩形の数が一定数以上横方向に並んで存在
するかどうかで該画像の裏表を特定する裏表特定手段と
を含み、前記裏表判定手段は、前記外接矩形抽出手段に
よって抽出された予め指定された大きさの外接矩形の候
補矩形に対して、前記裏表特定手段によって予め規定さ
れた縦方向の範囲内に3つ以上横方向に並んで存在する
場合に表面と判定し、それ以外の場合を裏面と判定する
ことで前記書面画像の表裏判定を行い、前記特定文書領
域抽出手段は、前記裏表判定手段で表面と判定された場
合に機能する表面住所氏名領域抽出手段と、前記裏表判
定手段で裏面と判定された場合に機能する裏面住所氏名
領域抽出手段とを備え、前記裏面住所氏名領域抽出手段
は、前記書面画像内の指定された領域に対して縦方向お
よび横方向の空白部分を抽出する空白部分抽出手段と、
該空白部分抽出手段で抽出した空白部分が存在する方向
に基づいて指定された領域を分割し、候補領域を特定す
る候補領域特定手段と、前記各手段による処理を再帰的
に繰り返して最終的に一つの領域を特定する領域特定手
段とを含み、前記裏面住所氏名領域抽出手段は、前記空
白部分抽出手段によって前記書面画像内の指定された領
域に対して縦方向および横方向の空白部分を抽出し、抽
出された空白部分のうち、予め定められた大きさ以上の
空白部分が横方向に存在する場合にはその部分から上下
に候補領域を分割し、予め定められた大きさ以上の空白
部分が縦方向に存在する場合にはその部分から左右に候
補領域を分割し、この分割領域のうち文字列方向が縦方
向の場合には一定条件の大きさを持ち最も左下に位置す
る領域を、一方文字列方向が横方向の場合には一定条件
の大きさを持ち最も右下に位置する領域を、前記領域特
定手段によってそれぞれ差出人住所氏名候補領域と特定
し、前記領域特定手段によって前記空白部分の抽出、領
域分割並びに候補領域抽出を再帰的に繰り返して、最終
的に一つの領域を差出人住所氏名候補領域と特定するこ
とを特徴とするものであり、そのことにより上記目的が
達成される。
【0010】さらに、本発明の画像処理装置は、前記裏
面住所氏名領域抽出手段は、前記候補領域特定手段によ
って特定した候補領域での文字列方向が縦方向の場合に
は、前記候補領域内を左端から右方向に黒画素が存在す
る部分まで走査し、走査した距離が最も長い箇所に存在
する黒画素の位置である最長到達点を新たな右上座標と
し、元の候補領域の左下座標を新たな左下座標とする新
たな領域を差出人住所氏名領域と特定するとともに、さ
らに、前記最長到達点の横方向座標と元の候補領域の右
端の横方向座標との座標差を求め、この座標差が予め定
められた値より小さい場合に、前記最長到達点と元の候
補領域の右端との間の区間の画像を最長到達点から上方
向に走査し、その区間における横方向の空白部分を抽出
し、この抽出した空白部分のうち予め定められた値より
も大きい高さを持つ空白部分が最初に抽出された時点
で、その白部分の下端を新たな上端とする領域を差出人
住所氏名領域と特定し、一方、前記候補領域特定手段に
よって特定した候補領域での文字列方向が横方向の場合
には、前記候補領域内を下端から上方向に黒画素が存在
する部分まで走査し、走査した距離が最も長い箇所に存
在する黒画素の位置である最長到達点を新たな左上座標
とし、元の候補領域の右下座標を新たな右下座標とする
新たな領域を差出人住所氏名領域と特定するとともに、
さらに、前記最長到達点の縦方向座標と元の候補領域の
上端の縦方向座標との座標差を求め、この座標差が予め
定められた値より小さい場合に、前記最長到達点と元の
候補領域の上端との間の区間の画像を最長到達点から左
方向に走査し、その区間における縦方向の空白部分を抽
出し、この抽出した空白部分のうち予め定められた値よ
りも大きい幅を持つ空白部分が最初に抽出された時点
で、その空白部分の右端を新たな左端とする領域を差出
人住所氏名領域と特定する、ことを特徴とするものであ
り、そのことにより上記目的が達成される。
面住所氏名領域抽出手段は、前記候補領域特定手段によ
って特定した候補領域での文字列方向が縦方向の場合に
は、前記候補領域内を左端から右方向に黒画素が存在す
る部分まで走査し、走査した距離が最も長い箇所に存在
する黒画素の位置である最長到達点を新たな右上座標と
し、元の候補領域の左下座標を新たな左下座標とする新
たな領域を差出人住所氏名領域と特定するとともに、さ
らに、前記最長到達点の横方向座標と元の候補領域の右
端の横方向座標との座標差を求め、この座標差が予め定
められた値より小さい場合に、前記最長到達点と元の候
補領域の右端との間の区間の画像を最長到達点から上方
向に走査し、その区間における横方向の空白部分を抽出
し、この抽出した空白部分のうち予め定められた値より
も大きい高さを持つ空白部分が最初に抽出された時点
で、その白部分の下端を新たな上端とする領域を差出人
住所氏名領域と特定し、一方、前記候補領域特定手段に
よって特定した候補領域での文字列方向が横方向の場合
には、前記候補領域内を下端から上方向に黒画素が存在
する部分まで走査し、走査した距離が最も長い箇所に存
在する黒画素の位置である最長到達点を新たな左上座標
とし、元の候補領域の右下座標を新たな右下座標とする
新たな領域を差出人住所氏名領域と特定するとともに、
さらに、前記最長到達点の縦方向座標と元の候補領域の
上端の縦方向座標との座標差を求め、この座標差が予め
定められた値より小さい場合に、前記最長到達点と元の
候補領域の上端との間の区間の画像を最長到達点から左
方向に走査し、その区間における縦方向の空白部分を抽
出し、この抽出した空白部分のうち予め定められた値よ
りも大きい幅を持つ空白部分が最初に抽出された時点
で、その空白部分の右端を新たな左端とする領域を差出
人住所氏名領域と特定する、ことを特徴とするものであ
り、そのことにより上記目的が達成される。
【0011】
【0012】
【0013】
【0014】
【0015】
【0016】
【0017】
【0018】
【作用】本発明においては、例えば葉書などの入力書面
画像から文字認識処理を行う前に、裏表判定手段で書面
画像の特定部分から書面画像の一方面か他方面かを判定
した判定結果に応じて、特定文書領域抽出手段で入力画
像データから例えば葉書の差出人住所氏名領域などの特
定文書領域を自動的に抽出するので、その特定文書領域
以外に絵や写真、他の文章など余分な部分が多く含まれ
ていたとしても、特定文書領域だけの文字認識で済み、
文字認識にかかる時間が少なくなる。このように、特定
文書領域を自動的に抽出して文字認識処理をするので、
文字認識による住所録作成などのデータ作成処理なども
自動的に行うことができ、従来の手動入力に比べて多大
な時間と労力の節約が図られる。
画像から文字認識処理を行う前に、裏表判定手段で書面
画像の特定部分から書面画像の一方面か他方面かを判定
した判定結果に応じて、特定文書領域抽出手段で入力画
像データから例えば葉書の差出人住所氏名領域などの特
定文書領域を自動的に抽出するので、その特定文書領域
以外に絵や写真、他の文章など余分な部分が多く含まれ
ていたとしても、特定文書領域だけの文字認識で済み、
文字認識にかかる時間が少なくなる。このように、特定
文書領域を自動的に抽出して文字認識処理をするので、
文字認識による住所録作成などのデータ作成処理なども
自動的に行うことができ、従来の手動入力に比べて多大
な時間と労力の節約が図られる。
【0019】また、裏表判定手段により、例えば画像入
力手段などで入力した葉書などの書面画像の一定の領域
内に存在する黒画素連結成分の外接矩形のうち、予め指
定された大きさの外接矩形を抽出し、抽出した外接矩形
のうち、例えばその中心座標が一定の範囲に収まる外接
矩形の一定数以上存在するかどうか、即ち、外接矩形が
一定数以上横方向に並んで存在するかどうかを調べて、
外接矩形が一定数以上横方向に並んで存在する場合に書
面画像の一方面であると判断するようにする。特に、書
面画像が葉書の画像の場合にはこの外接矩形は郵便番号
記入枠に相当し、この郵便番号記入枠が3個以上並んで
いる葉書などの郵便物文書表面の特徴を抽出し、表裏を
容易に判定することが可能となる。このような裏表の判
定により、例えば葉書の差出人住所氏名領域などの特定
文書領域の抽出にかかる時間や労力を大幅に削減するこ
とが可能となる。
力手段などで入力した葉書などの書面画像の一定の領域
内に存在する黒画素連結成分の外接矩形のうち、予め指
定された大きさの外接矩形を抽出し、抽出した外接矩形
のうち、例えばその中心座標が一定の範囲に収まる外接
矩形の一定数以上存在するかどうか、即ち、外接矩形が
一定数以上横方向に並んで存在するかどうかを調べて、
外接矩形が一定数以上横方向に並んで存在する場合に書
面画像の一方面であると判断するようにする。特に、書
面画像が葉書の画像の場合にはこの外接矩形は郵便番号
記入枠に相当し、この郵便番号記入枠が3個以上並んで
いる葉書などの郵便物文書表面の特徴を抽出し、表裏を
容易に判定することが可能となる。このような裏表の判
定により、例えば葉書の差出人住所氏名領域などの特定
文書領域の抽出にかかる時間や労力を大幅に削減するこ
とが可能となる。
【0020】さらに、特定文書領域の抽出は、入力され
た郵便物文書である葉書などの表面画像に対して、予め
指定された横方向の区間内でその上端部から下向きに黒
画素が存在する部分まで画像を走査することにより、そ
の最長走査箇所が、右側の宛先部分と左側の差出人住所
部分とを分割する縦方向の空白部分であるとして抽出さ
れ、この走査距離が最も長い箇所から左側全体の領域を
差出人の住所氏名領域などの特定文書領域として抽出す
ることが可能となる。
た郵便物文書である葉書などの表面画像に対して、予め
指定された横方向の区間内でその上端部から下向きに黒
画素が存在する部分まで画像を走査することにより、そ
の最長走査箇所が、右側の宛先部分と左側の差出人住所
部分とを分割する縦方向の空白部分であるとして抽出さ
れ、この走査距離が最も長い箇所から左側全体の領域を
差出人の住所氏名領域などの特定文書領域として抽出す
ることが可能となる。
【0021】また、入力された郵便物文書である葉書な
どの表面画像に対して、予め指定された横方向の区間に
おいて上端部から下向きに黒画素が存在する部分まで画
像を走査し、走査した距離が最も長い箇所に存在する黒
画素の位置を左上座標とし、予め定められた座標を右下
座標とする矩形領域内において右側宛先部分と左側の差
出人住所部分とを分割する縦方向の空白部分を抽出する
ことにより、差出人住所領域が右側によっており最初の
区間において領域を分割するのに十分な空白部分が存在
しない場合においても、抽出した空白部分の左端から左
側全体の領域を差出人の住所氏名領域などの特定文書領
域として抽出することが可能となる。
どの表面画像に対して、予め指定された横方向の区間に
おいて上端部から下向きに黒画素が存在する部分まで画
像を走査し、走査した距離が最も長い箇所に存在する黒
画素の位置を左上座標とし、予め定められた座標を右下
座標とする矩形領域内において右側宛先部分と左側の差
出人住所部分とを分割する縦方向の空白部分を抽出する
ことにより、差出人住所領域が右側によっており最初の
区間において領域を分割するのに十分な空白部分が存在
しない場合においても、抽出した空白部分の左端から左
側全体の領域を差出人の住所氏名領域などの特定文書領
域として抽出することが可能となる。
【0022】さらに、入力された郵便物文書である葉書
などの表面画像に対して、予め指定された矩形領域内に
おける最大の縦方向幅を持つ横方向の空白部分を抽出す
ることにより、宛先や差出人住所が横書きの場合でも、
上側の宛先部分と下側の差出人住所部分とを分割して、
その下側の差出人住所氏名領域などを特定文書領域とし
て抽出することが可能となる。
などの表面画像に対して、予め指定された矩形領域内に
おける最大の縦方向幅を持つ横方向の空白部分を抽出す
ることにより、宛先や差出人住所が横書きの場合でも、
上側の宛先部分と下側の差出人住所部分とを分割して、
その下側の差出人住所氏名領域などを特定文書領域とし
て抽出することが可能となる。
【0023】さらに、特定文書領域の抽出は、入力され
た郵便物文書である葉書などの裏面画像中の黒画素連結
成分の外接矩形のうち一定の条件を満たす有効矩形を抽
出し、入力された画像を2つの領域に分割してそれぞれ
の領域において有効矩形の数をカウントし、一方に一定
倍率を乗じて比較することにより、写真や絵柄の多い
(即ち有効領域が少ない)領域か文字が多い(即ち有効
領域が多い)領域かを判断できるため、どちらの領域に
差出人の住所氏名領域が存在するかを判断することが可
能となる。
た郵便物文書である葉書などの裏面画像中の黒画素連結
成分の外接矩形のうち一定の条件を満たす有効矩形を抽
出し、入力された画像を2つの領域に分割してそれぞれ
の領域において有効矩形の数をカウントし、一方に一定
倍率を乗じて比較することにより、写真や絵柄の多い
(即ち有効領域が少ない)領域か文字が多い(即ち有効
領域が多い)領域かを判断できるため、どちらの領域に
差出人の住所氏名領域が存在するかを判断することが可
能となる。
【0024】また、入力された郵便物文書である葉書な
どの裏面画像内の指定された領域に対して縦方向および
横方向の一定以上の大きさの空白部分を利用して領域分
割を行い、分割された領域のうち文字列方向が縦方向、
横方向それぞれの場合に応じて抽出位置条件を変えて条
件に合う1個の候補領域を抽出する操作を再帰的に繰り
返すことにより、最後に残った最適な領域を差出人の住
所氏名領域として抽出することが可能となる。
どの裏面画像内の指定された領域に対して縦方向および
横方向の一定以上の大きさの空白部分を利用して領域分
割を行い、分割された領域のうち文字列方向が縦方向、
横方向それぞれの場合に応じて抽出位置条件を変えて条
件に合う1個の候補領域を抽出する操作を再帰的に繰り
返すことにより、最後に残った最適な領域を差出人の住
所氏名領域として抽出することが可能となる。
【0025】さらに、上記抽出候補領域に対して、その
領域内を左端から右方向に黒画素が存在する部分まで走
査しその走査距離が最も長い箇所に存在する黒画素の位
置である最長到達点を右上座標とし、元の候補領域の左
下座標を左下座標とする新たな領域を抽出することによ
り、差出人住所氏名領域の上に近接して他の文字や絵柄
などの領域が存在する場合であっても不要な領域を除去
でき、差出人住所領域を精度よく抽出することが可能と
なる。
領域内を左端から右方向に黒画素が存在する部分まで走
査しその走査距離が最も長い箇所に存在する黒画素の位
置である最長到達点を右上座標とし、元の候補領域の左
下座標を左下座標とする新たな領域を抽出することによ
り、差出人住所氏名領域の上に近接して他の文字や絵柄
などの領域が存在する場合であっても不要な領域を除去
でき、差出人住所領域を精度よく抽出することが可能と
なる。
【0026】さらに、上記最長到達点の横方向座標と元
の領域の右端の横方向座標との差を求め、その座標差が
予め定められた値より小さい場合に、最長到達点と元の
領域の右端との間の区間の画像を最長到達点より上に走
査しその区間における横方向の空白部分を利用して新た
な領域を抽出することにより、差出人住所氏名領域の左
上に重なって他の文字や絵柄などの領域が存在し、最長
到達点が住所領域の途中になった場合でも、住所領域の
右上部分が領域分割で失われてしまうようなことが防止
される。
の領域の右端の横方向座標との差を求め、その座標差が
予め定められた値より小さい場合に、最長到達点と元の
領域の右端との間の区間の画像を最長到達点より上に走
査しその区間における横方向の空白部分を利用して新た
な領域を抽出することにより、差出人住所氏名領域の左
上に重なって他の文字や絵柄などの領域が存在し、最長
到達点が住所領域の途中になった場合でも、住所領域の
右上部分が領域分割で失われてしまうようなことが防止
される。
【0027】さらに、上記のようにして抽出された候補
領域に対して、その領域内の縦方向で最大幅を持つ空白
部分の左端を新たな右端として元の候補領域を分割する
ことにより、差出人領域の右側に他の文字や絵柄などが
存在して候補領域の幅が大きくなった場合でも不要な領
域を除いた住所氏名領域を抽出することが可能となる。
領域に対して、その領域内の縦方向で最大幅を持つ空白
部分の左端を新たな右端として元の候補領域を分割する
ことにより、差出人領域の右側に他の文字や絵柄などが
存在して候補領域の幅が大きくなった場合でも不要な領
域を除いた住所氏名領域を抽出することが可能となる。
【0028】さらに、上記のようにして抽出された候補
領域に対して、その領域の左端から一定数の縦方向の空
白部分を数え、その空白部分の左端を新たな右端として
元の候補領域を分割することにより、差出人住所氏名領
域の右側に近接して他の文字や絵柄などが存在して候補
領域の幅が大きくなった場合であっても、必要な領域の
みを住所氏名領域として正確に抽出することが可能とな
る。
領域に対して、その領域の左端から一定数の縦方向の空
白部分を数え、その空白部分の左端を新たな右端として
元の候補領域を分割することにより、差出人住所氏名領
域の右側に近接して他の文字や絵柄などが存在して候補
領域の幅が大きくなった場合であっても、必要な領域の
みを住所氏名領域として正確に抽出することが可能とな
る。
【0029】さらに、上記のようにして抽出された候補
領域に対して、その領域内を下端から上方向に黒画素が
存在する部分まで走査し、その走査距離が最も長い箇所
に存在する黒画素の位置(最長到達点)を左上座標と
し、元の候補領域の右下座標を右下座標とする新たな領
域を抽出することにより、差出人の住所氏名領域の左側
に近接して他の文字・絵柄などの領域が存在する場合で
も不要な領域を除去し、差出人の住所領域を精度よく抽
出することが可能となる。
領域に対して、その領域内を下端から上方向に黒画素が
存在する部分まで走査し、その走査距離が最も長い箇所
に存在する黒画素の位置(最長到達点)を左上座標と
し、元の候補領域の右下座標を右下座標とする新たな領
域を抽出することにより、差出人の住所氏名領域の左側
に近接して他の文字・絵柄などの領域が存在する場合で
も不要な領域を除去し、差出人の住所領域を精度よく抽
出することが可能となる。
【0030】さらに、上記最長到達点の縦方向座標と元
の領域の上端の縦方向座標との差が予め定められた値よ
りも小さい場合に、その最長到達点と元の領域の上端と
の間の区間の画像を最長到達点より左に走査し、その区
間における縦方向の空白部分を利用して新たな領域を抽
出することにより、差出人の住所領域の左下に重なって
他の文字・絵柄などの領域が存在し、最長到達点が住所
領域の途中になった場合でも、住所領域の左上部分が領
域分割で失われてしまうようなことが防止される。
の領域の上端の縦方向座標との差が予め定められた値よ
りも小さい場合に、その最長到達点と元の領域の上端と
の間の区間の画像を最長到達点より左に走査し、その区
間における縦方向の空白部分を利用して新たな領域を抽
出することにより、差出人の住所領域の左下に重なって
他の文字・絵柄などの領域が存在し、最長到達点が住所
領域の途中になった場合でも、住所領域の左上部分が領
域分割で失われてしまうようなことが防止される。
【0031】さらに、抽出候補領域に対して、その領域
内の横方向で最大の高さを持つ空白部分の下端を新たな
上端として元の候補領域を分割することにより、差出人
住所領域の上に他の文字・絵柄等が存在し候補領域の高
さが大きくなった場合でも、不要な領域を除いた本来求
めるべき例えば差出人の住所氏名領域を正確に抽出する
ことが可能となる。
内の横方向で最大の高さを持つ空白部分の下端を新たな
上端として元の候補領域を分割することにより、差出人
住所領域の上に他の文字・絵柄等が存在し候補領域の高
さが大きくなった場合でも、不要な領域を除いた本来求
めるべき例えば差出人の住所氏名領域を正確に抽出する
ことが可能となる。
【0032】さらに、抽出候補領域に対して、その領域
の下端から一定数の横方向の空白部分を数え、その空白
部分の下端を新たな上端として元の候補領域を分割する
ことにより、例えば求めている差出人の住所氏名領域の
上に近接して他の文字や絵柄などが存在し、候補領域の
高さが大きくなった場合でも、必要な領域のみを住所氏
名領域としてより正確に抽出することが可能となる。
の下端から一定数の横方向の空白部分を数え、その空白
部分の下端を新たな上端として元の候補領域を分割する
ことにより、例えば求めている差出人の住所氏名領域の
上に近接して他の文字や絵柄などが存在し、候補領域の
高さが大きくなった場合でも、必要な領域のみを住所氏
名領域としてより正確に抽出することが可能となる。
【0033】
【実施例】以下、本発明の実施例について説明する。
【0034】図1は、本発明の一実施例における画像処
理装置のシステム構成を示すブロック図である。
理装置のシステム構成を示すブロック図である。
【0035】図1において、画像入力手段としてのスキ
ャナA1は郵便物文書である葉書1などの画像データを
入力する。このスキャナA1が接続される画像メモリB
1は、スキャナA1で入力した画像データを格納する。
この画像メモリB1が接続される表裏判定手段C1は、
画像データから文字認識処理を行う前に、画像メモリB
1に格納した葉書などの画像の特定部分からその表裏を
判定する。これら表裏判定手段C1と画像メモリB1が
接続される特定文書領域抽出手段としての表面住所氏名
領域抽出手段D1および裏面住所氏名領域抽出手段E1
は、裏表判定手段C1の判定結果に応じて画像メモリB
1からの画像データに対して特定文書領域を抽出するよ
うにいずれかが働く。表面住所氏名領域抽出手段D1
は、画像メモリB1に格納した葉書などの書面の表面画
像より特定文書領域としての差出人住所氏名領域を抽出
し、また、裏面住所氏名領域抽出手段E1は、画像メモ
リB1に格納した葉書などの書面の裏面画像より特定文
書領域としての差出人住所氏名領域を抽出する。これら
表面住所氏名領域抽出手段D1および裏面住所氏名領域
抽出手段E1が接続されている文字認識手段F1は、表
面住所氏名領域抽出手段D1または裏面住所氏名領域抽
出手段E1でそれぞれ求めた住所氏名領域に対して文字
認識処理を行う。さらに、この文字認識手段F1と地名
辞書H1が接続される住所氏名分類手段G1は、文字認
識手段F1で認識した文字と、地名辞書H1で登録され
ている都道府県名などの地名とを照合し、住所録などの
様式に応じて、抽出領域で文字認識された住所や氏名な
どの特定文書を分類する。
ャナA1は郵便物文書である葉書1などの画像データを
入力する。このスキャナA1が接続される画像メモリB
1は、スキャナA1で入力した画像データを格納する。
この画像メモリB1が接続される表裏判定手段C1は、
画像データから文字認識処理を行う前に、画像メモリB
1に格納した葉書などの画像の特定部分からその表裏を
判定する。これら表裏判定手段C1と画像メモリB1が
接続される特定文書領域抽出手段としての表面住所氏名
領域抽出手段D1および裏面住所氏名領域抽出手段E1
は、裏表判定手段C1の判定結果に応じて画像メモリB
1からの画像データに対して特定文書領域を抽出するよ
うにいずれかが働く。表面住所氏名領域抽出手段D1
は、画像メモリB1に格納した葉書などの書面の表面画
像より特定文書領域としての差出人住所氏名領域を抽出
し、また、裏面住所氏名領域抽出手段E1は、画像メモ
リB1に格納した葉書などの書面の裏面画像より特定文
書領域としての差出人住所氏名領域を抽出する。これら
表面住所氏名領域抽出手段D1および裏面住所氏名領域
抽出手段E1が接続されている文字認識手段F1は、表
面住所氏名領域抽出手段D1または裏面住所氏名領域抽
出手段E1でそれぞれ求めた住所氏名領域に対して文字
認識処理を行う。さらに、この文字認識手段F1と地名
辞書H1が接続される住所氏名分類手段G1は、文字認
識手段F1で認識した文字と、地名辞書H1で登録され
ている都道府県名などの地名とを照合し、住所録などの
様式に応じて、抽出領域で文字認識された住所や氏名な
どの特定文書を分類する。
【0036】図2は図1の画像処理装置を内蔵した印字
機能付きコンピュータの概略斜視図であり、(a)は蓋
を開けた場合を示し、(b)は蓋を閉じた場合であって
内臓されたスキャナA1で葉書1を読み取るべく所定位
置にセットした場合を示している。
機能付きコンピュータの概略斜視図であり、(a)は蓋
を開けた場合を示し、(b)は蓋を閉じた場合であって
内臓されたスキャナA1で葉書1を読み取るべく所定位
置にセットした場合を示している。
【0037】図2(a)に示すように、コンピュータの
蓋を開けると、液晶画面2とキーボード3が配設されて
おり、キーボード3から文字を入力してワードプロセッ
サとしても用いることができる。また、図2(b)に示
すように、蓋を閉じて上面の所定位置に葉書1を一定方
向に整列させてセットすれば、フィーダによって葉書1
が1枚づつコンピュータ本体内に取り込まれた後、内蔵
されたスキャナA1によって葉書1などの画像が入力さ
れて、上記画像処理機能が働くことになる。最終的に、
住所氏名分類手段G1において、住所録などの様式に応
じて、抽出領域で文字認識された住所や氏名などを項目
別に分類するが、これらの住所や氏名などを所定様式の
書面に印字して出力したり、液晶画面2に表示して出力
したり、そのデータを記憶したりする。
蓋を開けると、液晶画面2とキーボード3が配設されて
おり、キーボード3から文字を入力してワードプロセッ
サとしても用いることができる。また、図2(b)に示
すように、蓋を閉じて上面の所定位置に葉書1を一定方
向に整列させてセットすれば、フィーダによって葉書1
が1枚づつコンピュータ本体内に取り込まれた後、内蔵
されたスキャナA1によって葉書1などの画像が入力さ
れて、上記画像処理機能が働くことになる。最終的に、
住所氏名分類手段G1において、住所録などの様式に応
じて、抽出領域で文字認識された住所や氏名などを項目
別に分類するが、これらの住所や氏名などを所定様式の
書面に印字して出力したり、液晶画面2に表示して出力
したり、そのデータを記憶したりする。
【0038】上記構成により、以下その動作を説明す
る。
る。
【0039】まず、セットされた位置から取り込まれた
葉書1の書面を、コンピュータに内臓されたスキャナA
1により2次元2値画像情報に変換して読み取り、この
画像情報を画像メモリB1に格納する。この格納方法
は、白画素を0、黒画素を1とし、8画素を1バイト
(byte)として、図3に示すように画像メモリB1
に左上画素から右上画素へ順に格納していく。この画像
メモリB1のメモリ容量は(縦画素数×横画素数/8)
byte必要である。
葉書1の書面を、コンピュータに内臓されたスキャナA
1により2次元2値画像情報に変換して読み取り、この
画像情報を画像メモリB1に格納する。この格納方法
は、白画素を0、黒画素を1とし、8画素を1バイト
(byte)として、図3に示すように画像メモリB1
に左上画素から右上画素へ順に格納していく。この画像
メモリB1のメモリ容量は(縦画素数×横画素数/8)
byte必要である。
【0040】次に、表裏判定手段C1が、画像メモリB
1に格納された例えば葉書画像などの書面によりその表
裏を判定する。このとき、表裏判定手段C1で表面と判
定した場合には、表面住所氏名領域抽出手段D1が働
き、画像メモリB1に格納された葉書画像の表面より差
出人の住所氏名領域を抽出する。また、表裏判定手段C
1で裏面と判定した場合、裏面住所氏名領域抽出手段E
1が働き、画像メモリB1に格納された葉書画像の裏面
より差出人の住所氏名領域を抽出する。
1に格納された例えば葉書画像などの書面によりその表
裏を判定する。このとき、表裏判定手段C1で表面と判
定した場合には、表面住所氏名領域抽出手段D1が働
き、画像メモリB1に格納された葉書画像の表面より差
出人の住所氏名領域を抽出する。また、表裏判定手段C
1で裏面と判定した場合、裏面住所氏名領域抽出手段E
1が働き、画像メモリB1に格納された葉書画像の裏面
より差出人の住所氏名領域を抽出する。
【0041】さらに、文字認識手段F1が、表面住所氏
名領域抽出手段D1または裏面住所氏名領域抽出手段E
1から求めた矩形の住所氏名領域の左上・右下座標を受
け取り、その領域内に対して、文字認識手段F1で文字
認識処理を行う。この文字認識処理手段としては、例え
ば橋本新一郎編著「文字認識概論」p.57〜95,オ
ーム社,1982に記載されている方法などがある。
名領域抽出手段D1または裏面住所氏名領域抽出手段E
1から求めた矩形の住所氏名領域の左上・右下座標を受
け取り、その領域内に対して、文字認識手段F1で文字
認識処理を行う。この文字認識処理手段としては、例え
ば橋本新一郎編著「文字認識概論」p.57〜95,オ
ーム社,1982に記載されている方法などがある。
【0042】さらに、住所氏名分類手段G1は、文字認
識手段F1で認識した結果の文字列情報を元に、先頭に
「〒」のある文字列を郵便番号、文字列内に地名辞書H
1内に登録された都道府県名または市町村名が存在する
文字列を住所、先頭に「電話番号」または「TEL」ま
たは電話番号を示す記号が存在する文字列を電話番号、
先頭に「FAX」のある文字列をFAX番号、それ以外
の文字列を氏名に分類する。この分類した結果は、郵便
番号・住所・氏名・電話番号などの項目に分けて所定様
式の住所録に登録することができ、液晶画面2に表示す
ることもできる。また、プリンタを用いて、郵便番号と
して分類された部分を葉書の郵便番号欄に印字したり、
差出人住所・氏名と分類された部分を、セットされた新
しい葉書の所定欄に宛先および宛名として自動的に印字
することもできる。
識手段F1で認識した結果の文字列情報を元に、先頭に
「〒」のある文字列を郵便番号、文字列内に地名辞書H
1内に登録された都道府県名または市町村名が存在する
文字列を住所、先頭に「電話番号」または「TEL」ま
たは電話番号を示す記号が存在する文字列を電話番号、
先頭に「FAX」のある文字列をFAX番号、それ以外
の文字列を氏名に分類する。この分類した結果は、郵便
番号・住所・氏名・電話番号などの項目に分けて所定様
式の住所録に登録することができ、液晶画面2に表示す
ることもできる。また、プリンタを用いて、郵便番号と
して分類された部分を葉書の郵便番号欄に印字したり、
差出人住所・氏名と分類された部分を、セットされた新
しい葉書の所定欄に宛先および宛名として自動的に印字
することもできる。
【0043】したがって、葉書などの入力画像データか
ら文字認識処理を行う前に、裏表判定手段C1で書面画
像の特定部分から葉書画像の裏表を判定し、この判定結
果に基づいて、表面住所氏名領域抽出手段D1または裏
面住所氏名領域抽出手段E1で入力画像データから葉書
の差出人住所氏名領域を自動的に抽出することができる
ため、差出人住所氏名領域以外に絵や写真、他の文章な
ど余分な部分が多く含まれていたとしても、差出人住所
氏名領域だけの文字認識で済み、文字認識にかかる時間
を少なくすることができる。また、このように、特定文
書領域である差出人住所氏名領域を自動的に抽出して文
字認識処理をするため、文字認識による住所録作成など
のデータ作成処理なども自動的に行うことができ、従来
の手動入力に比べて多大な時間と労力を節約することが
できる。
ら文字認識処理を行う前に、裏表判定手段C1で書面画
像の特定部分から葉書画像の裏表を判定し、この判定結
果に基づいて、表面住所氏名領域抽出手段D1または裏
面住所氏名領域抽出手段E1で入力画像データから葉書
の差出人住所氏名領域を自動的に抽出することができる
ため、差出人住所氏名領域以外に絵や写真、他の文章な
ど余分な部分が多く含まれていたとしても、差出人住所
氏名領域だけの文字認識で済み、文字認識にかかる時間
を少なくすることができる。また、このように、特定文
書領域である差出人住所氏名領域を自動的に抽出して文
字認識処理をするため、文字認識による住所録作成など
のデータ作成処理なども自動的に行うことができ、従来
の手動入力に比べて多大な時間と労力を節約することが
できる。
【0044】以下に、上記裏表判定手段C1、表面住所
氏名領域抽出手段D1および裏面住所氏名領域抽出手段
E1の具体的構成およびその動作についてさらに詳しく
説明する。
氏名領域抽出手段D1および裏面住所氏名領域抽出手段
E1の具体的構成およびその動作についてさらに詳しく
説明する。
【0045】(表裏判定手段C1の実施例1) 図4は図1の表裏判定手段C1の実施例1のシステム構
成を示すブロック図であり、スキャナA1と画像メモリ
B1は図1と同様の部材である。
成を示すブロック図であり、スキャナA1と画像メモリ
B1は図1と同様の部材である。
【0046】図4において、スキャナA1と、画像メモ
リB1と、ラベリング結果を格納するラベル画像メモリ
C2と、外接矩形の左上・右下座標を格納する外接矩形
座標メモリD2とがデータバスを介して接続されてい
る。制御部F2はプログラム用ROM(E2)内のプロ
グラムに従って、上記スキャナA1、画像メモリB1、
ラベル画像メモリC2および外接矩形座標メモリD2を
用いて表裏判定処理の流れを制御する。
リB1と、ラベリング結果を格納するラベル画像メモリ
C2と、外接矩形の左上・右下座標を格納する外接矩形
座標メモリD2とがデータバスを介して接続されてい
る。制御部F2はプログラム用ROM(E2)内のプロ
グラムに従って、上記スキャナA1、画像メモリB1、
ラベル画像メモリC2および外接矩形座標メモリD2を
用いて表裏判定処理の流れを制御する。
【0047】以下に、その表裏判定処理の流れを説明す
る。
る。
【0048】図5は、図1の表裏判定手段C1の実施例
1におけるシステム処理の流れを示すフローチャートで
ある。
1におけるシステム処理の流れを示すフローチャートで
ある。
【0049】図5に示すように、まず、ステップS1−
1でスキャナA1は葉書の書面を2次元2値画像情報に
変換して読み取り、この画像情報を画像メモリB1に格
納する。次に、ステップS1−2で制御部F2は、画像
メモリB1から読み出された画像データに対して、黒画
素連結成分のラベリングを行い、求めたラベル画像をラ
ベル画像メモリC2に格納する。このラベリングのアル
ゴリズムとしては、例えば鳥脇純一郎著「画像理解のた
めのディジタル画像処理[II]」p.45・46,昭晃
堂,1988に記載されている方法がある。このラベル
画像メモリC2への格納方法は、図6に示すように、ラ
ベル画像メモリC2に左上画素のラベル値から右下画素
のラベル値へ順に1画素につき2byte単位で格納し
ていく。このメモリ容量は(縦画素数×横画素数×2)
byte必要である。
1でスキャナA1は葉書の書面を2次元2値画像情報に
変換して読み取り、この画像情報を画像メモリB1に格
納する。次に、ステップS1−2で制御部F2は、画像
メモリB1から読み出された画像データに対して、黒画
素連結成分のラベリングを行い、求めたラベル画像をラ
ベル画像メモリC2に格納する。このラベリングのアル
ゴリズムとしては、例えば鳥脇純一郎著「画像理解のた
めのディジタル画像処理[II]」p.45・46,昭晃
堂,1988に記載されている方法がある。このラベル
画像メモリC2への格納方法は、図6に示すように、ラ
ベル画像メモリC2に左上画素のラベル値から右下画素
のラベル値へ順に1画素につき2byte単位で格納し
ていく。このメモリ容量は(縦画素数×横画素数×2)
byte必要である。
【0050】さらに、ステップS1−3で制御部F2は
ラベル値毎に外接矩形を求める。即ち、制御部F2は、
ラベル画像メモリC2内全体を走査して、ラベル値毎に
最大・最小横座標、最大・最小縦座標を求め、(最小横
座標,最小縦座標)がそのラベル値を持つ黒画素連結成
分の外接矩形の左上座標となり、(最大横座標,最大縦
座標)が外接矩形の右下座標となる。このようにして求
めた外接矩形のうち、制御部F2は、ステップS1−4
でこの外接矩形が指定した範囲内にあるかどうかをまず
判定し、ステップS1−5で外接矩形の大きさが指定範
囲内にあるかどうかを判定する。即ち、図7に示すよう
に葉書画像の左端から横方向に1/3より右側部分で、
下端から縦方向に3/4より上側部分の一定の探索範囲
内に存在する黒画素連結成分の外接矩形をその座標値よ
り調べることにより、その外接矩形が指定した範囲内に
あるかどうかを判定し、図8に示すように郵便番号枠の
大きさ(幅:Rx,高さ:Ry)に対して読み取り時に
生じる誤差(±εドット)を加えた範囲の大きさ(幅:
Rx−ε〜Rx+ε,高さ:Ry−ε〜Ry+ε)を持
つ外接矩形を郵便番号枠候補矩形として、外接矩形の大
きさが指定範囲内にあるかどうかを判定する。さらに、
ステップS1−6で、図9に示すように、この候補矩形
の左上・右下座標値を外接矩形座標メモリD2に格納す
る。上記の処理を全てのラベル値に対して行うことで、
郵便番号枠の大きさに近い黒画素外接矩形が抽出される
ことになる。これらステップS1−2〜5を外接矩形抽
出手段が行い、書面画像の一定の領域内に存在する黒画
素連結成分の外接矩形のうち、予め指定された大きさの
外接矩形を抽出する。
ラベル値毎に外接矩形を求める。即ち、制御部F2は、
ラベル画像メモリC2内全体を走査して、ラベル値毎に
最大・最小横座標、最大・最小縦座標を求め、(最小横
座標,最小縦座標)がそのラベル値を持つ黒画素連結成
分の外接矩形の左上座標となり、(最大横座標,最大縦
座標)が外接矩形の右下座標となる。このようにして求
めた外接矩形のうち、制御部F2は、ステップS1−4
でこの外接矩形が指定した範囲内にあるかどうかをまず
判定し、ステップS1−5で外接矩形の大きさが指定範
囲内にあるかどうかを判定する。即ち、図7に示すよう
に葉書画像の左端から横方向に1/3より右側部分で、
下端から縦方向に3/4より上側部分の一定の探索範囲
内に存在する黒画素連結成分の外接矩形をその座標値よ
り調べることにより、その外接矩形が指定した範囲内に
あるかどうかを判定し、図8に示すように郵便番号枠の
大きさ(幅:Rx,高さ:Ry)に対して読み取り時に
生じる誤差(±εドット)を加えた範囲の大きさ(幅:
Rx−ε〜Rx+ε,高さ:Ry−ε〜Ry+ε)を持
つ外接矩形を郵便番号枠候補矩形として、外接矩形の大
きさが指定範囲内にあるかどうかを判定する。さらに、
ステップS1−6で、図9に示すように、この候補矩形
の左上・右下座標値を外接矩形座標メモリD2に格納す
る。上記の処理を全てのラベル値に対して行うことで、
郵便番号枠の大きさに近い黒画素外接矩形が抽出される
ことになる。これらステップS1−2〜5を外接矩形抽
出手段が行い、書面画像の一定の領域内に存在する黒画
素連結成分の外接矩形のうち、予め指定された大きさの
外接矩形を抽出する。
【0051】葉書の表裏判定は、葉書の特定部位に郵便
番号枠の大きさに近い黒画素外接矩形が3つ以上横に並
んでいるかどうかで表裏を判別する。具体的には、求め
た候補矩形に対して、制御部F2は、ステップS1−7
で、外接矩形座標メモリD2から外接矩形の座標を取り
出して、候補矩形の中心座標を求める。このようにして
求めた中心座標の縦方向座標が、ステップS1−8で図
10に示すように±1ドット以内に収まる3つ以上の候
補矩形が横方向に並んで存在するかどうかを判定し、こ
の候補矩形が存在する場合に、ステップS1−9で葉書
の表面と判定し、これ以外をステップS1−10で葉書
の裏面と判定する。これらステップS1−7〜10を裏
表特定手段が行い、抽出した外接矩形のうち外接矩形の
数が一定数以上横方向に並んで存在するかどうかで葉書
画像の裏表を特定する。
番号枠の大きさに近い黒画素外接矩形が3つ以上横に並
んでいるかどうかで表裏を判別する。具体的には、求め
た候補矩形に対して、制御部F2は、ステップS1−7
で、外接矩形座標メモリD2から外接矩形の座標を取り
出して、候補矩形の中心座標を求める。このようにして
求めた中心座標の縦方向座標が、ステップS1−8で図
10に示すように±1ドット以内に収まる3つ以上の候
補矩形が横方向に並んで存在するかどうかを判定し、こ
の候補矩形が存在する場合に、ステップS1−9で葉書
の表面と判定し、これ以外をステップS1−10で葉書
の裏面と判定する。これらステップS1−7〜10を裏
表特定手段が行い、抽出した外接矩形のうち外接矩形の
数が一定数以上横方向に並んで存在するかどうかで葉書
画像の裏表を特定する。
【0052】したがって、入力された葉書画像の一定の
領域内に存在する黒画素連結成分の外接矩形のうち、予
め指定された大きさの外接矩形である郵便番号記入枠を
外接矩形抽出手段で抽出し、外接矩形抽出手段で抽出し
た外接矩形のうち、その中心座標が一定の範囲に収まる
外接矩形が一定数以上存在するかどうかを裏表特定手段
で調べて、郵便番号記入枠が3個以上並んでいる葉書の
表面の特徴を抽出し、葉書などの書面の表裏を容易に判
定することができる。この裏表判定により、葉書の差出
人住所氏名領域などの特定文書領域の抽出にかかる時間
や労力を大幅に削減することができる。
領域内に存在する黒画素連結成分の外接矩形のうち、予
め指定された大きさの外接矩形である郵便番号記入枠を
外接矩形抽出手段で抽出し、外接矩形抽出手段で抽出し
た外接矩形のうち、その中心座標が一定の範囲に収まる
外接矩形が一定数以上存在するかどうかを裏表特定手段
で調べて、郵便番号記入枠が3個以上並んでいる葉書の
表面の特徴を抽出し、葉書などの書面の表裏を容易に判
定することができる。この裏表判定により、葉書の差出
人住所氏名領域などの特定文書領域の抽出にかかる時間
や労力を大幅に削減することができる。
【0053】 (表面住所氏名領域抽出手段D1の実施例1) 図11は図1の表面住所氏名領域抽出手段D1の実施例
1〜3のシステム構成を示すブロック図であり、スキャ
ナA1と画像メモリB1は図1と同様の部材である。図
11において、データバスで接続されたスキャナA1と
画像メモリB1を用いて、制御部F3はプログラム用R
OM(E3)内のプログラムに従って表面住所氏名領域
抽出処理の流れを制御する。
1〜3のシステム構成を示すブロック図であり、スキャ
ナA1と画像メモリB1は図1と同様の部材である。図
11において、データバスで接続されたスキャナA1と
画像メモリB1を用いて、制御部F3はプログラム用R
OM(E3)内のプログラムに従って表面住所氏名領域
抽出処理の流れを制御する。
【0054】以下に、その表面住所氏名領域抽出処理の
流れを説明する。
流れを説明する。
【0055】図12は、図1の表面住所氏名領域抽出手
段D1の実施例1におけるシステム処理の流れを示すフ
ローチャートである。
段D1の実施例1におけるシステム処理の流れを示すフ
ローチャートである。
【0056】図12に示すように、まず、ステップS2
−1で画像入力手段としてのスキャナA1は葉書表面を
2次元2値画像情報に変換して取り込み、画像メモリB
1に画像情報を格納する。次に、画像メモリB1に格納
された画像データに対して、ステップS2−2、3で制
御部F3は、図13に示すように葉書画像内の横方向の
区間(左から幅1/4〜1/2)を上端から下向きの縦
方向に黒画素が存在する部分まで走査し、上端からの走
査距離が最も長かった箇所を求める。さらに、走査時に
は走査線上だけでなく、その左右数ドットも黒画素が存
在するかどうか調べ、黒画素が存在した時点で走査を終
了する。これは、同一行内の文字と文字の間を抜けてさ
らに走査が進められることを防止するためである。これ
らステップS2−2、3を走査手段が行い、葉書の表画
像に対して、予め指定された横方向の区間で画像の上端
より下向きに黒画素が存在する部分まで画像を走査す
る。
−1で画像入力手段としてのスキャナA1は葉書表面を
2次元2値画像情報に変換して取り込み、画像メモリB
1に画像情報を格納する。次に、画像メモリB1に格納
された画像データに対して、ステップS2−2、3で制
御部F3は、図13に示すように葉書画像内の横方向の
区間(左から幅1/4〜1/2)を上端から下向きの縦
方向に黒画素が存在する部分まで走査し、上端からの走
査距離が最も長かった箇所を求める。さらに、走査時に
は走査線上だけでなく、その左右数ドットも黒画素が存
在するかどうか調べ、黒画素が存在した時点で走査を終
了する。これは、同一行内の文字と文字の間を抜けてさ
らに走査が進められることを防止するためである。これ
らステップS2−2、3を走査手段が行い、葉書の表画
像に対して、予め指定された横方向の区間で画像の上端
より下向きに黒画素が存在する部分まで画像を走査す
る。
【0057】この走査処理の結果、ステップS2−4で
走査距離が最も長かった最長走査距離が葉書上端から3
/4よりも小さいかどうかを判定する。さらに、この最
長走査距離が葉書上端から縦方向に3/4よりも大きい
場合に、ステップS2−5で走査距離が最も長かった箇
所を葉書右側の宛先部分と左側の差出人住所部分とを分
割する縦方向の空白部分の位置と見なし、この箇所より
左側全体を差出人の住所・氏名領域とする。これらステ
ップS2−4、5を領域特定手段が行い、上記走査手段
で走査した距離が最も長い箇所が葉書上端から3/4よ
りも大きい場合に、その箇所から左側全体の領域を差出
人住所氏名領域として特定する。
走査距離が最も長かった最長走査距離が葉書上端から3
/4よりも小さいかどうかを判定する。さらに、この最
長走査距離が葉書上端から縦方向に3/4よりも大きい
場合に、ステップS2−5で走査距離が最も長かった箇
所を葉書右側の宛先部分と左側の差出人住所部分とを分
割する縦方向の空白部分の位置と見なし、この箇所より
左側全体を差出人の住所・氏名領域とする。これらステ
ップS2−4、5を領域特定手段が行い、上記走査手段
で走査した距離が最も長い箇所が葉書上端から3/4よ
りも大きい場合に、その箇所から左側全体の領域を差出
人住所氏名領域として特定する。
【0058】このように、スキャナA1で入力した郵便
物文書である葉書の表面画像に対して、予め指定された
横方向の区間内で葉書の上端から下向きに黒画素が存在
する部分まで画像を走査し、走査した距離が所定距離よ
りも長く、その最も長い走査箇所から左側全体の領域を
差出人の住所氏名領域として自動的に抽出することがで
きる。
物文書である葉書の表面画像に対して、予め指定された
横方向の区間内で葉書の上端から下向きに黒画素が存在
する部分まで画像を走査し、走査した距離が所定距離よ
りも長く、その最も長い走査箇所から左側全体の領域を
差出人の住所氏名領域として自動的に抽出することがで
きる。
【0059】 (表面住所氏名領域抽出手段D1の実施例2) 図14は、図1の表面住所氏名領域抽出手段D1の実施
例2におけるシステム処理の流れを示すフローチャート
であり、これは図12から連続するもので、図12と同
一のステップはその説明を省略し、異なるステップにつ
いて以下に説明する。
例2におけるシステム処理の流れを示すフローチャート
であり、これは図12から連続するもので、図12と同
一のステップはその説明を省略し、異なるステップにつ
いて以下に説明する。
【0060】図12の走査の結果、ステップS2−4で
最長走査距離が葉書の上端からの距離が縦方向(高さ)
全体の3/4よりも短い場合(Y)は、図15に示すよ
うに、差出人の住所・氏名領域が右側に寄っていて、走
査が差出人住所氏名領域の上端部で停止した場合と判断
することができる。この場合、図14に示すように、ス
テップS2−6で、葉書画像内の横方向の区間(左から
幅1/4〜1/2)を上端から下向きの縦方向に黒画素
が存在する部分までの最長走査点の座標を左上座標と
し、また、(左から1/2,上端から3/4)の座標を
右下座標とした矩形領域を走査範囲とすることができ
る。さらに、ステップS2−7、8で、制御部F3は画
像メモリB1に格納された画像のうち上記走査範囲内を
左から順に縦方向に走査し、縦方向の空白部分を求め
る。さらに、このようにして求めた縦方向の空白部分の
うち、ステップS2−9で最大幅を持つ空白部分が平均
文字幅よりも小さいかどうかを判定する。さらに、この
最大幅の空白部分が平均文字幅よりも大きい場合に、ス
テップS2−10で最大幅の空白部分を葉書右側の宛先
部分と左側の差出人住所部分とを分割する縦方向の空白
部分と見なして、その空白部分の左端より画像左側全体
を住所氏名領域とすることができる。これらステップS
2−6〜10を領域特定手段が行い、最長走査距離にあ
る黒画素の位置を左上座標とし、予め定められた座標を
右下座標とする矩形領域内において縦方向の空白部分を
抽出し、この抽出した空白部分のうち最大幅を持つ空白
部分の左端から左側全体の領域を差出人住所・氏名領域
と特定する。
最長走査距離が葉書の上端からの距離が縦方向(高さ)
全体の3/4よりも短い場合(Y)は、図15に示すよ
うに、差出人の住所・氏名領域が右側に寄っていて、走
査が差出人住所氏名領域の上端部で停止した場合と判断
することができる。この場合、図14に示すように、ス
テップS2−6で、葉書画像内の横方向の区間(左から
幅1/4〜1/2)を上端から下向きの縦方向に黒画素
が存在する部分までの最長走査点の座標を左上座標と
し、また、(左から1/2,上端から3/4)の座標を
右下座標とした矩形領域を走査範囲とすることができ
る。さらに、ステップS2−7、8で、制御部F3は画
像メモリB1に格納された画像のうち上記走査範囲内を
左から順に縦方向に走査し、縦方向の空白部分を求め
る。さらに、このようにして求めた縦方向の空白部分の
うち、ステップS2−9で最大幅を持つ空白部分が平均
文字幅よりも小さいかどうかを判定する。さらに、この
最大幅の空白部分が平均文字幅よりも大きい場合に、ス
テップS2−10で最大幅の空白部分を葉書右側の宛先
部分と左側の差出人住所部分とを分割する縦方向の空白
部分と見なして、その空白部分の左端より画像左側全体
を住所氏名領域とすることができる。これらステップS
2−6〜10を領域特定手段が行い、最長走査距離にあ
る黒画素の位置を左上座標とし、予め定められた座標を
右下座標とする矩形領域内において縦方向の空白部分を
抽出し、この抽出した空白部分のうち最大幅を持つ空白
部分の左端から左側全体の領域を差出人住所・氏名領域
と特定する。
【0061】このように、スキャナA1で入力した葉書
の表面画像に対して、予め指定された横方向の区間にお
いて葉書上端部から下向きの縦方向に黒画素が存在する
部分まで画像を走査し、走査した距離が最も長い箇所に
存在する黒画素の位置を左上座標とし、予め定められた
座標を右下座標とする矩形領域内において縦方向の空白
部分を抽出し、この抽出した空白部分のうち最大幅をも
つ空白部分の左端より左側全体の領域を差出人の住所・
氏名領域として抽出することができる。
の表面画像に対して、予め指定された横方向の区間にお
いて葉書上端部から下向きの縦方向に黒画素が存在する
部分まで画像を走査し、走査した距離が最も長い箇所に
存在する黒画素の位置を左上座標とし、予め定められた
座標を右下座標とする矩形領域内において縦方向の空白
部分を抽出し、この抽出した空白部分のうち最大幅をも
つ空白部分の左端より左側全体の領域を差出人の住所・
氏名領域として抽出することができる。
【0062】 (表面住所氏名領域抽出手段D1の実施例3) 図16は、図1の表面住所氏名領域抽出手段D1の実施
例3におけるシステム処理の流れを示すフローチャート
であり、これは図12および図14から連続するもの
で、図12および図14と同一のステップはその説明を
省略し、異なるステップについて以下に説明する。
例3におけるシステム処理の流れを示すフローチャート
であり、これは図12および図14から連続するもの
で、図12および図14と同一のステップはその説明を
省略し、異なるステップについて以下に説明する。
【0063】本実施例の場合、図12のステップS2−
2、3で、制御部F3は、葉書画像内の横方向の区間
(左から幅1/4〜1/2)を上端から下向きの縦方向
に黒画素が存在する部分まで走査し、葉書上端部からの
走査距離が最も長かった箇所を求めるが、この走査時に
は走査線上だけでなく、その左右数ドットも黒画素が存
在するかどうかをも調べて、黒画素が存在した時点で走
査を終了する。
2、3で、制御部F3は、葉書画像内の横方向の区間
(左から幅1/4〜1/2)を上端から下向きの縦方向
に黒画素が存在する部分まで走査し、葉書上端部からの
走査距離が最も長かった箇所を求めるが、この走査時に
は走査線上だけでなく、その左右数ドットも黒画素が存
在するかどうかをも調べて、黒画素が存在した時点で走
査を終了する。
【0064】さらに、図14の判定の結果のステップS
2−9で、最大幅を持つ空白部分が平均文字幅よりも小
さい場合(Y)は、宛先の住所氏名が横書きで、空白部
分は宛先住所の同一行内の文字間の場合であると判断す
ることができる。この場合、図16に示すように、ステ
ップS2−11で、走査範囲を上端は画像の上から1/
2の部分、下端は下から1/4の縦方向幅部分を左から
右への横方向走査範囲とする。さらに、ステップS2−
12、13で画像の左端から右端まで横方向に上記走査
範囲内を走査し、最大の縦方向の幅を持つ横方向の空白
部分を求める。このようにして求めた最大幅の空白部分
を、ステップS2−14で葉書上側の宛先部分と下側の
差出人住所部分とを分割する横方向の空白部分と見なし
て、この空白部分の下端より下側全体を特定抽出領域と
しての差出人住所氏名領域とする。これらステップS2
−11〜14を領域特定手段が行い、葉書の表画像に対
して、予め指定された矩形領域内において横方向の空白
部分を抽出し、この抽出した空白部分のうち最大の縦方
向幅を持つ空白部分の下端から下側全体の領域を差出人
住所・氏名領域と特定する。
2−9で、最大幅を持つ空白部分が平均文字幅よりも小
さい場合(Y)は、宛先の住所氏名が横書きで、空白部
分は宛先住所の同一行内の文字間の場合であると判断す
ることができる。この場合、図16に示すように、ステ
ップS2−11で、走査範囲を上端は画像の上から1/
2の部分、下端は下から1/4の縦方向幅部分を左から
右への横方向走査範囲とする。さらに、ステップS2−
12、13で画像の左端から右端まで横方向に上記走査
範囲内を走査し、最大の縦方向の幅を持つ横方向の空白
部分を求める。このようにして求めた最大幅の空白部分
を、ステップS2−14で葉書上側の宛先部分と下側の
差出人住所部分とを分割する横方向の空白部分と見なし
て、この空白部分の下端より下側全体を特定抽出領域と
しての差出人住所氏名領域とする。これらステップS2
−11〜14を領域特定手段が行い、葉書の表画像に対
して、予め指定された矩形領域内において横方向の空白
部分を抽出し、この抽出した空白部分のうち最大の縦方
向幅を持つ空白部分の下端から下側全体の領域を差出人
住所・氏名領域と特定する。
【0065】このように、スキャナA1で入力した郵便
物文書の葉書などの表面画像に対して、予め指定された
矩形領域内において横方向の空白部分を抽出し、この抽
出した空白部分のうち最大の高さをもつ空白部分の下端
より下側全体の領域を差出人の住所氏名領域として抽出
することができる。
物文書の葉書などの表面画像に対して、予め指定された
矩形領域内において横方向の空白部分を抽出し、この抽
出した空白部分のうち最大の高さをもつ空白部分の下端
より下側全体の領域を差出人の住所氏名領域として抽出
することができる。
【0066】 (裏面住所氏名領域抽出手段E1の実施例1) 図17は図1の裏面住所氏名領域抽出手段E1の実施例
1のシステム構成を示すブロック図であり、スキャナA
1と画像メモリB1は図1と同様の部材である。 図1
7において、スキャナA1と、このスキャナA1で入力
した画像データを格納する画像メモリB1と、ラベリン
グ結果を格納するラベル画像メモリC3と、外接矩形の
左上・右下座標を格納する外接矩形座標メモリD3とが
データバスを介して接続されている。制御部F3はプロ
グラム用ROM(E3)内のプログラムに従って、スキ
ャナA1、画像メモリB1、ラベル画像メモリC3およ
び外接矩形座標メモリD3を用いて裏面住所氏名領域抽
出処理の流れを制御する。
1のシステム構成を示すブロック図であり、スキャナA
1と画像メモリB1は図1と同様の部材である。 図1
7において、スキャナA1と、このスキャナA1で入力
した画像データを格納する画像メモリB1と、ラベリン
グ結果を格納するラベル画像メモリC3と、外接矩形の
左上・右下座標を格納する外接矩形座標メモリD3とが
データバスを介して接続されている。制御部F3はプロ
グラム用ROM(E3)内のプログラムに従って、スキ
ャナA1、画像メモリB1、ラベル画像メモリC3およ
び外接矩形座標メモリD3を用いて裏面住所氏名領域抽
出処理の流れを制御する。
【0067】以下に、その裏面住所氏名領域抽出処理の
流れを説明する。
流れを説明する。
【0068】図18は、図1の裏面住所氏名領域抽出手
段E1の実施例1におけるシステム処理の流れを示すフ
ローチャートである。
段E1の実施例1におけるシステム処理の流れを示すフ
ローチャートである。
【0069】図18に示すように、まず、ステップS3
−1で葉書の裏面をスキャナA1により2次元2値画像
情報に変換して読み込み、画像メモリB1にその画像情
報を格納する。画像メモリB1に格納された画像データ
に対して、ステップS3−2で制御部F3は黒画素連結
成分のラベリングを行い、求めた値をラベル画像メモリ
C3に格納する。さらに、ステップS3−3でラベル画
像メモリC3内全体を走査し、制御部F3はラベル毎の
最大・最小横座標、最大・最小縦座標を求め、(最小横
座標,最小縦座標)がそのラベル値を持つ黒画素連結成
分の外接矩形の左上座標、(最大横座標,最大縦座標)
が外接矩形の右下座標として、左上・右下座標値を外接
矩形座標メモリD3に格納する。
−1で葉書の裏面をスキャナA1により2次元2値画像
情報に変換して読み込み、画像メモリB1にその画像情
報を格納する。画像メモリB1に格納された画像データ
に対して、ステップS3−2で制御部F3は黒画素連結
成分のラベリングを行い、求めた値をラベル画像メモリ
C3に格納する。さらに、ステップS3−3でラベル画
像メモリC3内全体を走査し、制御部F3はラベル毎の
最大・最小横座標、最大・最小縦座標を求め、(最小横
座標,最小縦座標)がそのラベル値を持つ黒画素連結成
分の外接矩形の左上座標、(最大横座標,最大縦座標)
が外接矩形の右下座標として、左上・右下座標値を外接
矩形座標メモリD3に格納する。
【0070】このようにして求めた外接矩形のうち、ス
テップS3−4で外接矩形が次の指定条件を満たすかど
うかを判定する。即ち、画像の端に接しているもののデ
ータを外接矩形座標メモリD3から除く。また、外接矩
形の大きさが平均的な文字の大きさの1/4以下のもの
は雑音成分として除去する。さらに、外接矩形の大きさ
が平均的な文字の大きさの4倍以上のものは絵柄や写真
領域として除去する。さらに、外接矩形の縦横比が20
を超えるようなものは線として除去する。上記処理で除
去されなかった文字を多く含む矩形を有効矩形と呼ぶ。
これらステップS3−2〜4を有効矩形特定手段が行
い、書面画像中の連結領域の外接矩形を抽出し、この抽
出した外接矩形のうち一定の条件を満たす文字を多く含
む有効矩形だけを特定している。
テップS3−4で外接矩形が次の指定条件を満たすかど
うかを判定する。即ち、画像の端に接しているもののデ
ータを外接矩形座標メモリD3から除く。また、外接矩
形の大きさが平均的な文字の大きさの1/4以下のもの
は雑音成分として除去する。さらに、外接矩形の大きさ
が平均的な文字の大きさの4倍以上のものは絵柄や写真
領域として除去する。さらに、外接矩形の縦横比が20
を超えるようなものは線として除去する。上記処理で除
去されなかった文字を多く含む矩形を有効矩形と呼ぶ。
これらステップS3−2〜4を有効矩形特定手段が行
い、書面画像中の連結領域の外接矩形を抽出し、この抽
出した外接矩形のうち一定の条件を満たす文字を多く含
む有効矩形だけを特定している。
【0071】さらに、ステップS3−5で、画像中の文
字列方向が横方向の場合、制御部F3は外接矩形座標メ
モリD3に格納された有効矩形の座標値を取り出し、矩
形下端の縦座標が画像上半分中にあるか下半分中にある
かを調べ、それぞれの場合の矩形数をカウントする。こ
のステップS3−5を有効矩形数計算手段が行い、書面
画像を2つの領域に分割しそれぞれの領域において有効
矩形の数を計算している。
字列方向が横方向の場合、制御部F3は外接矩形座標メ
モリD3に格納された有効矩形の座標値を取り出し、矩
形下端の縦座標が画像上半分中にあるか下半分中にある
かを調べ、それぞれの場合の矩形数をカウントする。こ
のステップS3−5を有効矩形数計算手段が行い、書面
画像を2つの領域に分割しそれぞれの領域において有効
矩形の数を計算している。
【0072】さらに、制御部F3は、このカウントした
有効矩形数に基づいて、画像の上半分か下半分かのどち
らに差出人の住所氏名領域が存在するかを判定する。具
体的には、ステップS3−6で画像の下半分より上半分
の方が有効矩形数が多いかどうかを判定し、上半分の方
が下半分よりも有効矩形数が多い場合には、ステップS
3−7で画像の上半分に差出人の住所氏名が書かれ、下
半分に絵や写真が存在すると判定し、逆の場合には、ス
テップS3−8で画像の下半分に差出人の住所・氏名が
書かれ、上半分には絵や写真が存在すると判定する。ま
た、画像の下半分の有効矩形数に一定倍率(≧1)を乗
じることで、画像の下半分に差出人の住所・氏名が書か
れていると判定する画像を増やすこともできる。これら
ステップS3−6〜8を領域特定手段が行い、上記有効
矩形数計算手段で計算したそれぞれの領域の有効矩形数
のうち、指定された一方の領域内の有効矩形数が他方の
領域内の有効矩形数に一定倍率を乗じた値より大きい場
合には指定された一方の領域を特定し、そうでない場合
には他方の領域を特定している。
有効矩形数に基づいて、画像の上半分か下半分かのどち
らに差出人の住所氏名領域が存在するかを判定する。具
体的には、ステップS3−6で画像の下半分より上半分
の方が有効矩形数が多いかどうかを判定し、上半分の方
が下半分よりも有効矩形数が多い場合には、ステップS
3−7で画像の上半分に差出人の住所氏名が書かれ、下
半分に絵や写真が存在すると判定し、逆の場合には、ス
テップS3−8で画像の下半分に差出人の住所・氏名が
書かれ、上半分には絵や写真が存在すると判定する。ま
た、画像の下半分の有効矩形数に一定倍率(≧1)を乗
じることで、画像の下半分に差出人の住所・氏名が書か
れていると判定する画像を増やすこともできる。これら
ステップS3−6〜8を領域特定手段が行い、上記有効
矩形数計算手段で計算したそれぞれの領域の有効矩形数
のうち、指定された一方の領域内の有効矩形数が他方の
領域内の有効矩形数に一定倍率を乗じた値より大きい場
合には指定された一方の領域を特定し、そうでない場合
には他方の領域を特定している。
【0073】このように、スキャナA1で入力した葉書
の裏面画像中の黒画素連結成分の外接矩形を抽出し、こ
の抽出した外接矩形のうち一定の条件を満たす矩形、即
ち、文字を多く含む有効矩形だけを抽出し、入力した画
像を2つの領域、例えば上下領域に分割してそれぞれの
領域において有効矩形の数を計算し、それぞれの領域の
有効領域数のうち、指定された一方の領域内の有効矩形
数がもう一方の領域内の有効矩形数に一定倍率を乗じた
値より大きい場合には指定された一方の領域に差出人の
住所氏名領域が存在すると判断し、そうでない場合には
もう一方の領域に差出人の住所氏名領域が存在すると判
断することができる。
の裏面画像中の黒画素連結成分の外接矩形を抽出し、こ
の抽出した外接矩形のうち一定の条件を満たす矩形、即
ち、文字を多く含む有効矩形だけを抽出し、入力した画
像を2つの領域、例えば上下領域に分割してそれぞれの
領域において有効矩形の数を計算し、それぞれの領域の
有効領域数のうち、指定された一方の領域内の有効矩形
数がもう一方の領域内の有効矩形数に一定倍率を乗じた
値より大きい場合には指定された一方の領域に差出人の
住所氏名領域が存在すると判断し、そうでない場合には
もう一方の領域に差出人の住所氏名領域が存在すると判
断することができる。
【0074】(裏面住所氏名領域抽出手段E1の実施例
2)図19は図1の裏面住所氏名領域抽出手段E1の実
施例2〜9のシステム構成を示すブロック図であり、ス
キャナA1と画像メモリB1は図1と同様の部材であ
る。
2)図19は図1の裏面住所氏名領域抽出手段E1の実
施例2〜9のシステム構成を示すブロック図であり、ス
キャナA1と画像メモリB1は図1と同様の部材であ
る。
【0075】図19において、葉書の裏面画像を入力す
るスキャナA1と、このスキャナA1で入力した画像デ
ータを格納する画像メモリB1と、候補領域内の周辺分
布メモリC4とがデータバスを介して接続されている。
制御部F4はプログラム用ROM(E4)内のプログラ
ムに従って、スキャナA1、画像メモリB1および周辺
分布メモリC4を用いて裏面住所氏名領域抽出処理の流
れを制御する。
るスキャナA1と、このスキャナA1で入力した画像デ
ータを格納する画像メモリB1と、候補領域内の周辺分
布メモリC4とがデータバスを介して接続されている。
制御部F4はプログラム用ROM(E4)内のプログラ
ムに従って、スキャナA1、画像メモリB1および周辺
分布メモリC4を用いて裏面住所氏名領域抽出処理の流
れを制御する。
【0076】以下に、その裏面住所氏名領域抽出処理の
流れを説明する。
流れを説明する。
【0077】図20および図21は、図1の裏面住所氏
名領域抽出手段E1の実施例2におけるシステム処理の
流れを示すフローチャートである。
名領域抽出手段E1の実施例2におけるシステム処理の
流れを示すフローチャートである。
【0078】まず、図20に示すように、ステップS4
−1でスキャナA1は葉書の裏面を2次元2値画像情報
に変換して読み取り、画像メモリB1に画像情報を格納
する。さらに、ステップS4−2で最初に画像全体を差
出人住所氏名候補領域とする。さらに、画像メモリB1
に格納された画像データに基づいて、ステップS4−3
で制御部F4は、ステップS4−2で求めた候補領域内
の周辺分布を求めて周辺分布メモリC4にその値を格納
する。この周辺分布とは領域内を縦方向または横方向に
走査し黒画素をカウントすることによって求めるもの
で、領域R内の縦方向投影による周辺分布PPv・横方
向投影による周辺分布PPhは、iを横方向の座標と
し、jを縦方向の座標とするとそれぞれ、 と表現される。このとき、PPv(i)=0の区間は縦
方向の空白部分、PPh(j)=0の区間は横方向の空
白部分に相当する。周辺分布メモリC4への格納方法
は、図22に示すように、縦方向投影による周辺分布に
ついては、i:0〜横画素数−1においてPPv(i)
=0の場合は0を、PPv≠0の場合は1を周辺分布メ
モリC4上に順に1byte単位で格納し、横方向投影
による周辺分布については、j:0〜縦画素数−1にお
いてPPh(j)=0の場合は0を、PPh(j)≠0
の場合は1を周辺分布メモリC4上に順に1byte単
位で格納していく。このメモリ容量は(縦画素数+横画
素数)byte必要である。
−1でスキャナA1は葉書の裏面を2次元2値画像情報
に変換して読み取り、画像メモリB1に画像情報を格納
する。さらに、ステップS4−2で最初に画像全体を差
出人住所氏名候補領域とする。さらに、画像メモリB1
に格納された画像データに基づいて、ステップS4−3
で制御部F4は、ステップS4−2で求めた候補領域内
の周辺分布を求めて周辺分布メモリC4にその値を格納
する。この周辺分布とは領域内を縦方向または横方向に
走査し黒画素をカウントすることによって求めるもの
で、領域R内の縦方向投影による周辺分布PPv・横方
向投影による周辺分布PPhは、iを横方向の座標と
し、jを縦方向の座標とするとそれぞれ、 と表現される。このとき、PPv(i)=0の区間は縦
方向の空白部分、PPh(j)=0の区間は横方向の空
白部分に相当する。周辺分布メモリC4への格納方法
は、図22に示すように、縦方向投影による周辺分布に
ついては、i:0〜横画素数−1においてPPv(i)
=0の場合は0を、PPv≠0の場合は1を周辺分布メ
モリC4上に順に1byte単位で格納し、横方向投影
による周辺分布については、j:0〜縦画素数−1にお
いてPPh(j)=0の場合は0を、PPh(j)≠0
の場合は1を周辺分布メモリC4上に順に1byte単
位で格納していく。このメモリ容量は(縦画素数+横画
素数)byte必要である。
【0079】さらに、制御部F4は、ステップS4−4
で周辺分布メモリC4内を走査し、平均的な文字の高さ
Ch以上の高さを持つ横方向の空白部分・平均的な文字
の幅Cw以上の幅を持つ縦方向の空白部分、即ち、Ch
以上の長さを持つPPh(j)=0の区間・Cw以上の
長さを持つPPv(i)=0の区間を求める。このステ
ップS4−4を空白部分抽出手段が行い、書面画像内の
指定された領域に対して縦方向および横方向の空白部分
を抽出する。
で周辺分布メモリC4内を走査し、平均的な文字の高さ
Ch以上の高さを持つ横方向の空白部分・平均的な文字
の幅Cw以上の幅を持つ縦方向の空白部分、即ち、Ch
以上の長さを持つPPh(j)=0の区間・Cw以上の
長さを持つPPv(i)=0の区間を求める。このステ
ップS4−4を空白部分抽出手段が行い、書面画像内の
指定された領域に対して縦方向および横方向の空白部分
を抽出する。
【0080】次に、ステップS4−4で求めた空白部分
を元に、図21に示すように、ステップS4−5で横方
向の空白部分が存在する場合はその部分から上下に候補
領域を分割し、また、ステップS4−9で縦方向の空白
部分が存在する場合はその部分から左右に候補領域を分
割する。さらに、ステップS4−5とステップS4−9
の後それぞれ、ステップS4−6とステップS4−10
でそれぞれ文字列方向が縦方向か横方向かを判定する、
分割した候補領域の中から制御部F4は、条件を満たす
もの一つを差出人住所氏名領域として選び出す。
を元に、図21に示すように、ステップS4−5で横方
向の空白部分が存在する場合はその部分から上下に候補
領域を分割し、また、ステップS4−9で縦方向の空白
部分が存在する場合はその部分から左右に候補領域を分
割する。さらに、ステップS4−5とステップS4−9
の後それぞれ、ステップS4−6とステップS4−10
でそれぞれ文字列方向が縦方向か横方向かを判定する、
分割した候補領域の中から制御部F4は、条件を満たす
もの一つを差出人住所氏名領域として選び出す。
【0081】即ち、分割処理の結果、縦横両方向で領域
が一つになった場合、その領域を住所氏名領域と判断す
る。また、分割結果の領域が複数存在する場合は、文字
列方向が縦方向の場合、左下の領域を差出人住所氏名候
補領域とし、また、文字列方向が横方向の場合、右下の
領域を差出人住所氏名候補領域とする。具体的には、縦
方向の領域範囲は、ステップS4−6で文字列方向が縦
方向と判定された場合、図23に示すように、ステップ
S4−7で下から順に画像の高さの1/4以上の長さを
持つ領域を探し、見つかった領域を縦方向の領域範囲と
し、この領域が存在しない場合は、縦方向の分割を行わ
ない。また、ステップS4−6で文字列方向が横方向と
判定された場合、ステップS4−8で最も下となる領域
を縦方向の領域範囲とする。
が一つになった場合、その領域を住所氏名領域と判断す
る。また、分割結果の領域が複数存在する場合は、文字
列方向が縦方向の場合、左下の領域を差出人住所氏名候
補領域とし、また、文字列方向が横方向の場合、右下の
領域を差出人住所氏名候補領域とする。具体的には、縦
方向の領域範囲は、ステップS4−6で文字列方向が縦
方向と判定された場合、図23に示すように、ステップ
S4−7で下から順に画像の高さの1/4以上の長さを
持つ領域を探し、見つかった領域を縦方向の領域範囲と
し、この領域が存在しない場合は、縦方向の分割を行わ
ない。また、ステップS4−6で文字列方向が横方向と
判定された場合、ステップS4−8で最も下となる領域
を縦方向の領域範囲とする。
【0082】また、横方向の領域範囲は、ステップS4
−10で文字列方向が縦方向と判定された場合、図23
に示すように、ステップS4−11で左から順に平均的
な文字幅以上の長さの領域を探し、見つかった領域を横
方向の領域範囲とし、この領域が存在しない場合は、横
方向の分割を行わない。また、ステップS4−10で文
字列方向が横方向と判定された場合、ステップS4−1
2で右から順に葉書画像の幅の1/4以上の長さの領域
を探し、見つかった領域を横方向の領域範囲とし、この
領域が存在しない場合は、横方向の分割を行わない。こ
のようにして求めた縦方向の領域範囲・横方向の領域範
囲で囲まれた矩形領域を分割処理後の差出人の住所氏名
候補領域とする。これらステップS4−5〜12を候補
領域特定手段が行い、上記空白部分抽出手段で抽出した
空白部分のうち、予め定められた大きさ以上の空白部分
を利用して指定された領域を分割し、この分割領域のう
ち文字列方向が縦方向の場合には一定条件の大きさを持
ち最も左下に位置する領域を候補領域として特定し、ま
た、文字列方向が横方向の場合には一定条件の大きさを
持ち最も右下に位置する領域を候補領域として特定す
る。
−10で文字列方向が縦方向と判定された場合、図23
に示すように、ステップS4−11で左から順に平均的
な文字幅以上の長さの領域を探し、見つかった領域を横
方向の領域範囲とし、この領域が存在しない場合は、横
方向の分割を行わない。また、ステップS4−10で文
字列方向が横方向と判定された場合、ステップS4−1
2で右から順に葉書画像の幅の1/4以上の長さの領域
を探し、見つかった領域を横方向の領域範囲とし、この
領域が存在しない場合は、横方向の分割を行わない。こ
のようにして求めた縦方向の領域範囲・横方向の領域範
囲で囲まれた矩形領域を分割処理後の差出人の住所氏名
候補領域とする。これらステップS4−5〜12を候補
領域特定手段が行い、上記空白部分抽出手段で抽出した
空白部分のうち、予め定められた大きさ以上の空白部分
を利用して指定された領域を分割し、この分割領域のう
ち文字列方向が縦方向の場合には一定条件の大きさを持
ち最も左下に位置する領域を候補領域として特定し、ま
た、文字列方向が横方向の場合には一定条件の大きさを
持ち最も右下に位置する領域を候補領域として特定す
る。
【0083】さらに、ステップS4−13で縦・横両方
向で領域が一つになるまでステップS4−3まで戻って
繰り返す。即ち、上記した空白部分抽出、領域分割さら
に候補領域抽出を再帰的に繰り返して、最後に得られた
一つの領域を差出人の住所氏名領域として、領域特定手
段が特定して抽出する。
向で領域が一つになるまでステップS4−3まで戻って
繰り返す。即ち、上記した空白部分抽出、領域分割さら
に候補領域抽出を再帰的に繰り返して、最後に得られた
一つの領域を差出人の住所氏名領域として、領域特定手
段が特定して抽出する。
【0084】このように、スキャナA1で入力した郵便
物文書である葉書などの裏面画像内の指定された領域に
対して縦方向および横方向の空白部分を抽出し、この抽
出した空白部分のうち、予め定められた大きさ以上の空
白部分を利用して指定された領域を分割し、分割した領
域の内文字列方向が縦方向の場合には一定条件の大きさ
を持ち最も左下に位置する領域を候補領域として抽出
し、また、文字列方向が横方向の場合には一定条件の大
きさを持ち最も右下に位置する領域を候補領域として抽
出し、これら空白部分抽出、領域分割さらに候補領域抽
出を再帰的に繰り返すことにより差出人の住所氏名領域
を抽出することができる。
物文書である葉書などの裏面画像内の指定された領域に
対して縦方向および横方向の空白部分を抽出し、この抽
出した空白部分のうち、予め定められた大きさ以上の空
白部分を利用して指定された領域を分割し、分割した領
域の内文字列方向が縦方向の場合には一定条件の大きさ
を持ち最も左下に位置する領域を候補領域として抽出
し、また、文字列方向が横方向の場合には一定条件の大
きさを持ち最も右下に位置する領域を候補領域として抽
出し、これら空白部分抽出、領域分割さらに候補領域抽
出を再帰的に繰り返すことにより差出人の住所氏名領域
を抽出することができる。
【0085】 (裏面住所氏名領域抽出手段E1の実施例3) 図24は、図1の裏面住所氏名領域抽出手段E1の実施
例3、4におけるシステム処理の流れを示すフローチャ
ートである。
例3、4におけるシステム処理の流れを示すフローチャ
ートである。
【0086】図24に示すように、ステップS4−13
の処理の後、ステップS4−14で文字列方向を判定
し、文字列方向が縦方向の場合、ステップS4−15
で、抽出した住所氏名領域の高さが葉書画像の全体の7
/10より大きい場合、その領域上部に絵または文章な
どが存在していると判断し、実際の住所氏名領域との分
割を行う。
の処理の後、ステップS4−14で文字列方向を判定
し、文字列方向が縦方向の場合、ステップS4−15
で、抽出した住所氏名領域の高さが葉書画像の全体の7
/10より大きい場合、その領域上部に絵または文章な
どが存在していると判断し、実際の住所氏名領域との分
割を行う。
【0087】具体的には、制御部F4が、ステップS4
−16、17で画像メモリB1に格納された画像の領域
内を左端から右方向に黒画素が存在する部分まで走査す
る。走査範囲の上端は画像の上から1/4の高さより下
で、その下端は下から1/4の高さより上とし、走査時
には走査線上だけでなく、その上下数ドットも黒画素が
存在するかどうか調べて、黒画素が存在した時点で走査
を終了する。さらに、図25に示すように左端からの走
査距離が最も長い箇所を求め、ステップS4−18で最
長走査到達点の座標を新たな右上座標とし、元の領域の
左下座標を住所氏名領域の左下座標とする。
−16、17で画像メモリB1に格納された画像の領域
内を左端から右方向に黒画素が存在する部分まで走査す
る。走査範囲の上端は画像の上から1/4の高さより下
で、その下端は下から1/4の高さより上とし、走査時
には走査線上だけでなく、その上下数ドットも黒画素が
存在するかどうか調べて、黒画素が存在した時点で走査
を終了する。さらに、図25に示すように左端からの走
査距離が最も長い箇所を求め、ステップS4−18で最
長走査到達点の座標を新たな右上座標とし、元の領域の
左下座標を住所氏名領域の左下座標とする。
【0088】このように、実施例2で抽出された候補領
域に対して、その領域内を左端から右方向に黒画素が存
在する部分まで走査し、走査した距離が最も長い箇所に
存在する黒画素の位置である最長到達点を右上座標と
し、元の候補領域の左下座標を左下座標とする新たな領
域を差出人住所氏名領域としてより精密に抽出すること
ができる。
域に対して、その領域内を左端から右方向に黒画素が存
在する部分まで走査し、走査した距離が最も長い箇所に
存在する黒画素の位置である最長到達点を右上座標と
し、元の候補領域の左下座標を左下座標とする新たな領
域を差出人住所氏名領域としてより精密に抽出すること
ができる。
【0089】 (裏面住所氏名領域抽出手段E1の実施例4) 図24に示すように、ステップS4−19で制御部F4
は、葉書裏面の左端からの走査距離が最も長い箇所を求
めた最長走査到達点の横方向座標と元の領域の右端の横
方向座標との差を求める。この求めた座標差が平均的な
文字の幅以下であるかどうかを判定する。この座標差が
平均的な文字の幅以下の場合には、その到達点と領域右
端との間に住所領域が縦に存在していると判断し、住所
領域を途中で分割しないように、上方向に住所領域が無
くなるまで走査し、住所氏名領域の上端を設定する。
は、葉書裏面の左端からの走査距離が最も長い箇所を求
めた最長走査到達点の横方向座標と元の領域の右端の横
方向座標との差を求める。この求めた座標差が平均的な
文字の幅以下であるかどうかを判定する。この座標差が
平均的な文字の幅以下の場合には、その到達点と領域右
端との間に住所領域が縦に存在していると判断し、住所
領域を途中で分割しないように、上方向に住所領域が無
くなるまで走査し、住所氏名領域の上端を設定する。
【0090】具体的には、ステップS4−20で、図2
6に示すように、その到達点と領域右端との間の横方向
の区間について、到達点から上に順に横方向に走査し、
ステップS4−21で平均的な文字の高さより大きい高
さを持つ横方向の空白部分が出現するまで到達地点より
上に進む。この空白部分が出現した時点で、ステップS
4−22でその空白部分の下端を住所氏名領域の新たな
上端とする。
6に示すように、その到達点と領域右端との間の横方向
の区間について、到達点から上に順に横方向に走査し、
ステップS4−21で平均的な文字の高さより大きい高
さを持つ横方向の空白部分が出現するまで到達地点より
上に進む。この空白部分が出現した時点で、ステップS
4−22でその空白部分の下端を住所氏名領域の新たな
上端とする。
【0091】このように、実施例3の最長到達点の横方
向座標と元の領域の右端の横方向座標との差を求め、そ
の座標差が予め定められた値より小さい場合に、最長到
達点と元の領域の右端との間の区間の画像を最長到達点
より上に走査し、その区間における横方向の空白部分を
抽出し、抽出した空白部分のうち予め定められた値より
大きい高さを持つ空白部分が最初に抽出された時点でそ
の空白部分の下端を新たな上端とすることにより差出人
住所氏名領域を途中で分断することなく抽出することが
できる。
向座標と元の領域の右端の横方向座標との差を求め、そ
の座標差が予め定められた値より小さい場合に、最長到
達点と元の領域の右端との間の区間の画像を最長到達点
より上に走査し、その区間における横方向の空白部分を
抽出し、抽出した空白部分のうち予め定められた値より
大きい高さを持つ空白部分が最初に抽出された時点でそ
の空白部分の下端を新たな上端とすることにより差出人
住所氏名領域を途中で分断することなく抽出することが
できる。
【0092】 (裏面住所氏名領域抽出手段E1の実施例5) 図27は、図1の裏面住所氏名領域抽出手段E1の実施
例5、6におけるシステム処理の流れを示すフローチャ
ートである。
例5、6におけるシステム処理の流れを示すフローチャ
ートである。
【0093】図27に示すように、実施例4のステップ
S4−22の処理の後、またはステップS4−15また
は19の処理の後、ステップS4−23で、文字列方向
が縦方向の場合で、得られた住所氏名領域の幅が画像の
幅の1/2より大きいかどうかを判定する。この住所氏
名領域幅が画像幅の1/2より大きい場合、この領域の
右側に文章が存在すると判断し、住所氏名領域との分割
を行う。
S4−22の処理の後、またはステップS4−15また
は19の処理の後、ステップS4−23で、文字列方向
が縦方向の場合で、得られた住所氏名領域の幅が画像の
幅の1/2より大きいかどうかを判定する。この住所氏
名領域幅が画像幅の1/2より大きい場合、この領域の
右側に文章が存在すると判断し、住所氏名領域との分割
を行う。
【0094】具体的には、ステップS4−24で、制御
部F4は、図28に示すように、画像メモリB1に格納
された画像の領域内を左より順に縦方向に走査して最大
幅を持つ縦方向の空白部分を求める。この求めた空白部
分の左端を、ステップS4−25で差出人の住所氏名領
域の新たな右端とする。
部F4は、図28に示すように、画像メモリB1に格納
された画像の領域内を左より順に縦方向に走査して最大
幅を持つ縦方向の空白部分を求める。この求めた空白部
分の左端を、ステップS4−25で差出人の住所氏名領
域の新たな右端とする。
【0095】このように、抽出候補領域に対して、その
領域内の縦方向の空白部分のうち最大幅を持つ空白部分
を抽出し、抽出した空白部分の左端を新たな右端として
元の候補領域を分割することにより、差出人住所氏名領
域を余分な文章や絵柄などの領域を含むことなく抽出す
ることができる。
領域内の縦方向の空白部分のうち最大幅を持つ空白部分
を抽出し、抽出した空白部分の左端を新たな右端として
元の候補領域を分割することにより、差出人住所氏名領
域を余分な文章や絵柄などの領域を含むことなく抽出す
ることができる。
【0096】 (裏面住所氏名領域抽出手段E1の実施例6) 図27に示すように、実施例5のステップS4−25の
処理の後、ステップS4−26で、文字列方向が縦方向
の場合で、得られた住所氏名領域の幅が画像の幅の1/
2より大きいかどうかを判定する。この住所氏名領域の
幅が画像の幅の1/2より大きい場合、この領域の右側
に文章が存在すると判断し、住所氏名領域との分割を行
う。
処理の後、ステップS4−26で、文字列方向が縦方向
の場合で、得られた住所氏名領域の幅が画像の幅の1/
2より大きいかどうかを判定する。この住所氏名領域の
幅が画像の幅の1/2より大きい場合、この領域の右側
に文章が存在すると判断し、住所氏名領域との分割を行
う。
【0097】具体的には、ステップS4−27、28
で、制御部F4は、画像メモリB1に格納された画像の
領域内を左から順に縦方向に走査しながら、縦方向の空
白部分を数える。ステップS4−29で縦方向の空白部
分が8個以上存在する場合、左より数えて8番目の縦方
向の空白部分の左端を住所氏名領域の新たな右端とす
る。
で、制御部F4は、画像メモリB1に格納された画像の
領域内を左から順に縦方向に走査しながら、縦方向の空
白部分を数える。ステップS4−29で縦方向の空白部
分が8個以上存在する場合、左より数えて8番目の縦方
向の空白部分の左端を住所氏名領域の新たな右端とす
る。
【0098】このように、抽出候補領域に対して、その
領域の左端よりはじめて領域内の縦方向の空白部分の数
を数え、空白部分の数が予め定められた値に達した時点
でその空白部分の左端を新たな右端として元の候補領域
を分割することにより、差出人住所氏名領域を余分な文
章や絵柄などの領域を含むことなく抽出することができ
る。
領域の左端よりはじめて領域内の縦方向の空白部分の数
を数え、空白部分の数が予め定められた値に達した時点
でその空白部分の左端を新たな右端として元の候補領域
を分割することにより、差出人住所氏名領域を余分な文
章や絵柄などの領域を含むことなく抽出することができ
る。
【0099】 (裏面住所氏名領域抽出手段E1の実施例7) 図30は、図1の裏面住所氏名領域抽出手段E1の実施
例7、8におけるシステム処理の流れを示すフローチャ
ートである。
例7、8におけるシステム処理の流れを示すフローチャ
ートである。
【0100】図30に示すように、ステップS4−30
で、文字列方向が横方向の場合で、得られた住所氏名領
域の幅が画像の全体幅の7/10より大きいかどうかを
判定する。この住所氏名領域の幅が画像の全体幅の7/
10より大きい場合、この領域の左側に絵柄や写真など
が存在すると判断し、求める差出人の住所氏名領域との
分割を行う。
で、文字列方向が横方向の場合で、得られた住所氏名領
域の幅が画像の全体幅の7/10より大きいかどうかを
判定する。この住所氏名領域の幅が画像の全体幅の7/
10より大きい場合、この領域の左側に絵柄や写真など
が存在すると判断し、求める差出人の住所氏名領域との
分割を行う。
【0101】具体的には、図29に示すように、制御部
F4は、ステップS4−31、32で画像メモリB1に
格納された画像の領域内をその下端から上方向に黒画素
が存在する部分まで走査し、この走査は領域の左端より
右端に至るまで繰り返し、その走査時には走査線上だけ
でなく、その左右数ドットも黒画素が存在するかどうか
調べて、黒画素が存在した時点で走査を終了する。さら
に、ステップS4−33で領域の下端からの走査距離が
最も長い箇所を求め、その到達点の座標を新たな左上座
標とし、元の領域の右下座標を、求める差出人の住所氏
名領域の右下座標とする。
F4は、ステップS4−31、32で画像メモリB1に
格納された画像の領域内をその下端から上方向に黒画素
が存在する部分まで走査し、この走査は領域の左端より
右端に至るまで繰り返し、その走査時には走査線上だけ
でなく、その左右数ドットも黒画素が存在するかどうか
調べて、黒画素が存在した時点で走査を終了する。さら
に、ステップS4−33で領域の下端からの走査距離が
最も長い箇所を求め、その到達点の座標を新たな左上座
標とし、元の領域の右下座標を、求める差出人の住所氏
名領域の右下座標とする。
【0102】このように、抽出候補領域に対して、その
領域内を下端から上方向に黒画素が存在する部分まで走
査し、走査した距離が最も長い箇所に存在する黒画素の
位置(最長到達点)を左上座標とし、元の候補領域の右
下座標を右下座標とする新たな領域を差出人住所氏名領
域として抽出するため、差出人の住所氏名領域の左側に
近接して他の文字・絵柄などの領域が存在する場合で
も、その不要な領域を除去することができ、差出人の住
所領域を精度よく抽出することができる。
領域内を下端から上方向に黒画素が存在する部分まで走
査し、走査した距離が最も長い箇所に存在する黒画素の
位置(最長到達点)を左上座標とし、元の候補領域の右
下座標を右下座標とする新たな領域を差出人住所氏名領
域として抽出するため、差出人の住所氏名領域の左側に
近接して他の文字・絵柄などの領域が存在する場合で
も、その不要な領域を除去することができ、差出人の住
所領域を精度よく抽出することができる。
【0103】 (裏面住所氏名領域抽出手段E1の実施例8) 図30に示すように、実施例7で求めた最長走査到達点
の縦方向座標と元の領域の上端の縦方向座標との差を求
め、ステップS4−34で、この求めた座標差が平均的
な文字の高さ以下かどうかを判定する。この座標差が平
均的な文字の高さ以下の場合には、図31に示すよう
に、その到達点と領域上端との間に住所領域が横に存在
すると判断し、差出人の住所領域を途中で分割しないよ
うに、左方向に住所領域が無くなるまで走査し、差出人
の住所氏名領域の左端を設定する。
の縦方向座標と元の領域の上端の縦方向座標との差を求
め、ステップS4−34で、この求めた座標差が平均的
な文字の高さ以下かどうかを判定する。この座標差が平
均的な文字の高さ以下の場合には、図31に示すよう
に、その到達点と領域上端との間に住所領域が横に存在
すると判断し、差出人の住所領域を途中で分割しないよ
うに、左方向に住所領域が無くなるまで走査し、差出人
の住所氏名領域の左端を設定する。
【0104】具体的には、ステップS4−35、36で
制御部F4はその到達点と領域上端との間の縦方向の区
間について、その到達点から左に順に縦方向に画像メモ
リB1に格納された画像内を走査し、平均的な文字の幅
より大きい幅を持つ縦方向の空白部分が出現した時点
で、その空白部分の右端を、求める差出人の住所氏名領
域の新たな左端とする。
制御部F4はその到達点と領域上端との間の縦方向の区
間について、その到達点から左に順に縦方向に画像メモ
リB1に格納された画像内を走査し、平均的な文字の幅
より大きい幅を持つ縦方向の空白部分が出現した時点
で、その空白部分の右端を、求める差出人の住所氏名領
域の新たな左端とする。
【0105】このように、上記最長到達点の縦方向座標
と元の領域の上端の縦方向座標との差を求め、座標の差
が予め定められた値よりも小さい場合に、その最長到達
点と元の領域の上端との間の区間の画像を最長到達点よ
り左に走査し、その区間における縦方向の空白部分を抽
出し、抽出された空白部分のうち予め定められた値より
大きい幅を持つ空白部分が最初に抽出された時点でその
空白部分の右端を新たな左端とすることで、差出人の住
所氏名領域を抽出するため、差出人の住所領域の左下に
重なって他の文字や絵柄などの領域が存在して、その最
長到達点が住所領域の途中になった場合でも、住所領域
の左上部分が領域分割で失われてしまうようなことを防
止することができる。
と元の領域の上端の縦方向座標との差を求め、座標の差
が予め定められた値よりも小さい場合に、その最長到達
点と元の領域の上端との間の区間の画像を最長到達点よ
り左に走査し、その区間における縦方向の空白部分を抽
出し、抽出された空白部分のうち予め定められた値より
大きい幅を持つ空白部分が最初に抽出された時点でその
空白部分の右端を新たな左端とすることで、差出人の住
所氏名領域を抽出するため、差出人の住所領域の左下に
重なって他の文字や絵柄などの領域が存在して、その最
長到達点が住所領域の途中になった場合でも、住所領域
の左上部分が領域分割で失われてしまうようなことを防
止することができる。
【0106】 (裏面住所氏名領域抽出手段E1の実施例9) 図32は、図1の裏面住所氏名領域抽出手段E1の実施
例9、10におけるシステム処理の流れを示すフローチ
ャートである。
例9、10におけるシステム処理の流れを示すフローチ
ャートである。
【0107】図32に示すように、ステップS4−38
で、文字列方向が横方向の場合で、得られた住所氏名領
域の高さが画像の高さの3/10より大きいかどうかを
判定する。この住所氏名領域の高さが画像の高さの3/
10より大きい場合には、領域上部に文書が存在すると
判断し、住所氏名領域との分割を行う。また、小さい場
合には、その領域の分割を終了して、求める差出人の住
所氏名領域とする。
で、文字列方向が横方向の場合で、得られた住所氏名領
域の高さが画像の高さの3/10より大きいかどうかを
判定する。この住所氏名領域の高さが画像の高さの3/
10より大きい場合には、領域上部に文書が存在すると
判断し、住所氏名領域との分割を行う。また、小さい場
合には、その領域の分割を終了して、求める差出人の住
所氏名領域とする。
【0108】具体的には、図33に示すように、ステッ
プS4−39、40で制御部F4は、画像メモリB1に
格納された画像の領域内を下から順に横方向に走査して
最大の高さを持つ横方向の空白部分を求める。さらに、
ステップS4−41でこの求めた空白部分の下端を、求
める差出人の住所氏名領域の新たな上端とする。
プS4−39、40で制御部F4は、画像メモリB1に
格納された画像の領域内を下から順に横方向に走査して
最大の高さを持つ横方向の空白部分を求める。さらに、
ステップS4−41でこの求めた空白部分の下端を、求
める差出人の住所氏名領域の新たな上端とする。
【0109】このように、抽出候補領域に対して、その
領域内の横方向の空白部分のうち最大の高さを持つ空白
部分を抽出し、抽出した空白部分の下端を新たな上端と
して元の候補領域を分割することにより、差出人住所氏
名領域を抽出するため、差出人住所領域の上に他の文字
・絵柄等が存在し候補領域の高さが大きくなった場合で
も、不要な領域を除いた本来求めるべき差出人の住所氏
名領域を正確に抽出することができる。
領域内の横方向の空白部分のうち最大の高さを持つ空白
部分を抽出し、抽出した空白部分の下端を新たな上端と
して元の候補領域を分割することにより、差出人住所氏
名領域を抽出するため、差出人住所領域の上に他の文字
・絵柄等が存在し候補領域の高さが大きくなった場合で
も、不要な領域を除いた本来求めるべき差出人の住所氏
名領域を正確に抽出することができる。
【0110】 (裏面住所氏名領域抽出手段E1の実施例10) 図32に示すように、ステップS4−42で、文字列方
向が横方向の場合で、得られた住所氏名領域の高さが画
像の高さの3/10より大きいかどうかを判定する。こ
の住所氏名領域の高さが画像の高さの3/10より大き
い場合、その領域上部に文書が存在すると判断し、住所
氏名領域との分割を行う。また、小さい場合には、その
領域の分割を終了して、求める差出人の住所氏名領域と
する。
向が横方向の場合で、得られた住所氏名領域の高さが画
像の高さの3/10より大きいかどうかを判定する。こ
の住所氏名領域の高さが画像の高さの3/10より大き
い場合、その領域上部に文書が存在すると判断し、住所
氏名領域との分割を行う。また、小さい場合には、その
領域の分割を終了して、求める差出人の住所氏名領域と
する。
【0111】具体的には、ステップS4−43、44で
制御部F4は、画像メモリB1に格納された画像の領域
内を下から順に横方向に走査しながら、横方向の空白部
分を数える。さらに、ステップS4−45で、この横方
向の空白部分が8個以上存在する場合、下より数えて8
番目の横方向の空白部分の下端を、求める差出人の住所
氏名領域の新たな上端とする。
制御部F4は、画像メモリB1に格納された画像の領域
内を下から順に横方向に走査しながら、横方向の空白部
分を数える。さらに、ステップS4−45で、この横方
向の空白部分が8個以上存在する場合、下より数えて8
番目の横方向の空白部分の下端を、求める差出人の住所
氏名領域の新たな上端とする。
【0112】このように、抽出候補領域に対して、その
領域の下端より始めて領域内の横方向の空白部分の数を
数え、空白部分の数が予め定められた値に達した時点で
その空白部分の下端を新たな上端として元の候補領域を
分割することにより、差出人住所氏名領域を抽出するた
め、差出人の住所氏名領域の上に近接して他の文字や絵
柄などが存在し、候補領域の高さが大きくなった場合で
も、必要な領域のみを住所氏名領域としてより正確に抽
出することができる。
領域の下端より始めて領域内の横方向の空白部分の数を
数え、空白部分の数が予め定められた値に達した時点で
その空白部分の下端を新たな上端として元の候補領域を
分割することにより、差出人住所氏名領域を抽出するた
め、差出人の住所氏名領域の上に近接して他の文字や絵
柄などが存在し、候補領域の高さが大きくなった場合で
も、必要な領域のみを住所氏名領域としてより正確に抽
出することができる。
【0113】以上のように、各実施例において、入力さ
れた郵便物文書である葉書画像の特定条件の領域を差出
人の住所氏名領域として抽出し、この抽出された住所氏
名領域内の文字認識を行って郵便番号・住所・氏名・電
話番号などをそれぞれの属性に分けて自動的に分類する
ことにより、受け取った郵便物から容易に住所録の作成
が可能になる。
れた郵便物文書である葉書画像の特定条件の領域を差出
人の住所氏名領域として抽出し、この抽出された住所氏
名領域内の文字認識を行って郵便番号・住所・氏名・電
話番号などをそれぞれの属性に分けて自動的に分類する
ことにより、受け取った郵便物から容易に住所録の作成
が可能になる。
【0114】なお、上記表裏判定手段C1の実施例1、
表面住所氏名領域抽出手段D1の実施例1〜3、および
裏面住所氏名領域抽出手段E1の実施例1〜10では特
定抽出領域として葉書の差出人住所氏名領域で説明した
が、葉書だけでなく封筒などの書面画像における他の特
定抽出領域に対しても同様に適用することが可能であ
る。
表面住所氏名領域抽出手段D1の実施例1〜3、および
裏面住所氏名領域抽出手段E1の実施例1〜10では特
定抽出領域として葉書の差出人住所氏名領域で説明した
が、葉書だけでなく封筒などの書面画像における他の特
定抽出領域に対しても同様に適用することが可能であ
る。
【0115】また、上記各実施例では、表面住所氏名領
域抽出手段D1と裏面住所氏名領域抽出手段E1とはど
ちらかを別々に動作をするように構成したが、この場
合、例えば葉書から差出人の住所氏名領域などの特定抽
出領域を抽出する際に、差出人の住所氏名領域がある葉
書面を一定方向にセットする必要があったが、表面住所
氏名領域抽出手段D1と裏面住所氏名領域抽出手段E1
とを連動させて、一方が終われば他方を駆動させるよう
にすれば、例えば葉書の表面に差出人の住所氏名領域が
無かったとしても葉書の裏面に動作を移すことができ、
かつ、葉書の向きをランダムにセットしても自動的に葉
書の差出人の住所氏名領域などの特定抽出領域を抽出す
ることができる。
域抽出手段D1と裏面住所氏名領域抽出手段E1とはど
ちらかを別々に動作をするように構成したが、この場
合、例えば葉書から差出人の住所氏名領域などの特定抽
出領域を抽出する際に、差出人の住所氏名領域がある葉
書面を一定方向にセットする必要があったが、表面住所
氏名領域抽出手段D1と裏面住所氏名領域抽出手段E1
とを連動させて、一方が終われば他方を駆動させるよう
にすれば、例えば葉書の表面に差出人の住所氏名領域が
無かったとしても葉書の裏面に動作を移すことができ、
かつ、葉書の向きをランダムにセットしても自動的に葉
書の差出人の住所氏名領域などの特定抽出領域を抽出す
ることができる。
【0116】
【発明の効果】以上のように本発明によれば、葉書など
の入力書面画像から文字認識処理を行う前に、裏表判定
手段の判定結果に応じて、特定文書領域抽出手段で入力
画像データから特定文書領域を自動的に抽出するため、
その特定文書領域以外に絵や写真、他の文章など余分な
部分が多く含まれていたとしても、特定文書領域だけの
文字認識で済ますことができて、文字認識にかかる時間
を少なくすることができる。このように、特定文書領域
を自動的に抽出して文字認識処理をするため、文字認識
による住所録作成などのデータ作成処理なども自動的に
行うことができ、従来の手動入力に比べて多大な時間と
労力の節約を図ることができる。
の入力書面画像から文字認識処理を行う前に、裏表判定
手段の判定結果に応じて、特定文書領域抽出手段で入力
画像データから特定文書領域を自動的に抽出するため、
その特定文書領域以外に絵や写真、他の文章など余分な
部分が多く含まれていたとしても、特定文書領域だけの
文字認識で済ますことができて、文字認識にかかる時間
を少なくすることができる。このように、特定文書領域
を自動的に抽出して文字認識処理をするため、文字認識
による住所録作成などのデータ作成処理なども自動的に
行うことができ、従来の手動入力に比べて多大な時間と
労力の節約を図ることができる。
【0117】また、裏表判定手段の裏表の判定により、
例えば葉書の差出人住所氏名領域などの特定文書領域の
抽出にかかる時間や労力を大幅に削減することができ
る。
例えば葉書の差出人住所氏名領域などの特定文書領域の
抽出にかかる時間や労力を大幅に削減することができ
る。
【0118】さらに、入力された郵便物文書の葉書画像
などの一定の領域内に存在する黒画素連結成分の外接矩
形のうち、予め指定された大きさの外接矩形について、
その外接矩形の数が一定数以上並んで存在するかどうか
を調べることにより、例えば郵便番号記入枠などの場
合、郵便番号記入枠が郵便物文書の表面上の特定領域に
並んでいるという郵便物文書表面の特徴を容易に抽出す
ることができて、書面の表裏を容易に判定することがで
きる。
などの一定の領域内に存在する黒画素連結成分の外接矩
形のうち、予め指定された大きさの外接矩形について、
その外接矩形の数が一定数以上並んで存在するかどうか
を調べることにより、例えば郵便番号記入枠などの場
合、郵便番号記入枠が郵便物文書の表面上の特定領域に
並んでいるという郵便物文書表面の特徴を容易に抽出す
ることができて、書面の表裏を容易に判定することがで
きる。
【0119】さらに、入力された例えば郵便物文書の表
面などの一方画像に対して、予め指定された横方向の区
間において上端から下向きに黒画素が存在する部分まで
画像を走査することにより、例えば右側の宛先部分と左
側の差出人住所部分とを分割する縦方向の空白部分を容
易に抽出することができて、走査した距離が最も長い箇
所から左側全体の領域を、求める差出人の住所氏名領域
などの特定抽出領域として容易に抽出することができ
る。
面などの一方画像に対して、予め指定された横方向の区
間において上端から下向きに黒画素が存在する部分まで
画像を走査することにより、例えば右側の宛先部分と左
側の差出人住所部分とを分割する縦方向の空白部分を容
易に抽出することができて、走査した距離が最も長い箇
所から左側全体の領域を、求める差出人の住所氏名領域
などの特定抽出領域として容易に抽出することができ
る。
【0120】さらに、入力された郵便物文書の表面など
の一方画像に対して、予め指定された横方向の区間にお
いて上端から下向きに黒画素が存在する部分まで画像を
走査し、走査した距離が最も長い箇所に存在する黒画素
の位置を左上座標とし、予め定められた座標を右下座標
とする矩形領域内において、右側宛先部分と左側の差出
人住所部分とを分割する縦方向の空白部分を抽出するこ
とにより、差出人住所領域が右側に、寄っているために
最初の走査区間において領域を分割するのに十分な空白
部分が存在しない場合でも、新たな矩形領域内で最大幅
を持つ空白部分を、右側の宛先部分と左側の差出人住所
部分とを分割する縦方向の空白部分とし、その空白部分
の左端から左側全体の領域を差出人の住所氏名領域など
の特定抽出領域として抽出することができる。
の一方画像に対して、予め指定された横方向の区間にお
いて上端から下向きに黒画素が存在する部分まで画像を
走査し、走査した距離が最も長い箇所に存在する黒画素
の位置を左上座標とし、予め定められた座標を右下座標
とする矩形領域内において、右側宛先部分と左側の差出
人住所部分とを分割する縦方向の空白部分を抽出するこ
とにより、差出人住所領域が右側に、寄っているために
最初の走査区間において領域を分割するのに十分な空白
部分が存在しない場合でも、新たな矩形領域内で最大幅
を持つ空白部分を、右側の宛先部分と左側の差出人住所
部分とを分割する縦方向の空白部分とし、その空白部分
の左端から左側全体の領域を差出人の住所氏名領域など
の特定抽出領域として抽出することができる。
【0121】さらに、入力された郵便物文書の表面など
の一方画像に対して、予め指定された矩形領域内におけ
る横方向の最大の高さを持つ空白部分を抽出することに
より、宛先や差出人住所が横書きの場合でも上側の宛先
住所部分と下側の差出人住所部分とをその空白部分で分
割し、下側の差出人住所氏名領域などの特定抽出領域を
抽出することができる。
の一方画像に対して、予め指定された矩形領域内におけ
る横方向の最大の高さを持つ空白部分を抽出することに
より、宛先や差出人住所が横書きの場合でも上側の宛先
住所部分と下側の差出人住所部分とをその空白部分で分
割し、下側の差出人住所氏名領域などの特定抽出領域を
抽出することができる。
【0122】さらに、入力された郵便物文書の裏面など
の他方画像中の黒画素連結成分の外接矩形のうち一定の
条件を満たす有効矩形を抽出し、入力された画像を2つ
の領域に分割しそれぞれの領域において有効矩形の数を
カウントし、一方に一定倍率を乗じて比較することによ
り、写真や絵柄の多い(有効領域が少ない)領域か、文
字が多い(有効領域が多い)領域かを判断することで、
どちらの領域に差出人の住所氏名領域などの特定抽出領
域が存在するかを判断することができる。
の他方画像中の黒画素連結成分の外接矩形のうち一定の
条件を満たす有効矩形を抽出し、入力された画像を2つ
の領域に分割しそれぞれの領域において有効矩形の数を
カウントし、一方に一定倍率を乗じて比較することによ
り、写真や絵柄の多い(有効領域が少ない)領域か、文
字が多い(有効領域が多い)領域かを判断することで、
どちらの領域に差出人の住所氏名領域などの特定抽出領
域が存在するかを判断することができる。
【0123】さらに、入力された郵便物文書の裏面など
の他方画像内の指定された領域に対して縦方向および横
方向の一定以上の大きさの空白部分を利用して領域分割
を行い、分割された領域の内文字列方向の縦方向、横方
向それぞれの場合に応じて抽出位置条件を変えて分割さ
れた領域のうち一定の条件に合う1個の候補領域を抽出
する操作を再帰的に繰り返すことにより、最後に残った
最適な領域を差出人住所氏名領域などの特定抽出領域と
して抽出することができる。
の他方画像内の指定された領域に対して縦方向および横
方向の一定以上の大きさの空白部分を利用して領域分割
を行い、分割された領域の内文字列方向の縦方向、横方
向それぞれの場合に応じて抽出位置条件を変えて分割さ
れた領域のうち一定の条件に合う1個の候補領域を抽出
する操作を再帰的に繰り返すことにより、最後に残った
最適な領域を差出人住所氏名領域などの特定抽出領域と
して抽出することができる。
【0124】さらに、抽出候補領域に対して、その領域
内を左端から右方向に黒画素が存在する部分まで走査
し、その走査距離が最も長い箇所に存在する黒画素の位
置(最長到達点)を右上座標とし、元の候補領域の左下
座標を左下座標とする新たな領域を抽出することによ
り、差出人住所氏名領域の上に近接して他の文字や絵柄
などの領域が存在する場合でも不要な領域を除去し、差
出人住所領域などの特定抽出領域を精度よく抽出するこ
とができる。
内を左端から右方向に黒画素が存在する部分まで走査
し、その走査距離が最も長い箇所に存在する黒画素の位
置(最長到達点)を右上座標とし、元の候補領域の左下
座標を左下座標とする新たな領域を抽出することによ
り、差出人住所氏名領域の上に近接して他の文字や絵柄
などの領域が存在する場合でも不要な領域を除去し、差
出人住所領域などの特定抽出領域を精度よく抽出するこ
とができる。
【0125】さらに、最長到達点の横方向座標と元の領
域の右端の横方向座標との差が予め定められた値より小
さい場合に、最長到達点と元の領域の右端との間の区間
の画像を最長到達点より上に走査し、その区間における
横方向の空白部分を利用して新たな領域を抽出すること
により、差出人住所氏名領域などの特定抽出領域の左上
に重なって他の文字や絵柄などの領域が存在し、最長到
達点が住所領域の途中になった場合でも、住所領域の右
上部分が領域分割で失われてしまうことを防ぐことがで
きる。
域の右端の横方向座標との差が予め定められた値より小
さい場合に、最長到達点と元の領域の右端との間の区間
の画像を最長到達点より上に走査し、その区間における
横方向の空白部分を利用して新たな領域を抽出すること
により、差出人住所氏名領域などの特定抽出領域の左上
に重なって他の文字や絵柄などの領域が存在し、最長到
達点が住所領域の途中になった場合でも、住所領域の右
上部分が領域分割で失われてしまうことを防ぐことがで
きる。
【0126】さらに、抽出候補領域に対して、その領域
内の縦方向で最大幅を持つ空白部分の左端を新たな右端
として元の候補領域を分割することにより、差出人住所
領域の右側に他の文字・絵柄などが存在し候補領域の幅
が大きくなった場合でも不要な領域を除いた住所氏名領
域などの特定抽出領域を抽出することができる。
内の縦方向で最大幅を持つ空白部分の左端を新たな右端
として元の候補領域を分割することにより、差出人住所
領域の右側に他の文字・絵柄などが存在し候補領域の幅
が大きくなった場合でも不要な領域を除いた住所氏名領
域などの特定抽出領域を抽出することができる。
【0127】さらに、抽出候補領域に対して、その領域
の左端から一定数の縦方向の空白部分を数えその空白部
分の左端を新たな右端として元の候補領域を分割するこ
とにより、差出人住所領域の右側に近接して他の文字や
絵柄などが存在し、候補領域の幅が大きくなった場合で
も、必要な特定抽出領域のみを抽出することができる。
の左端から一定数の縦方向の空白部分を数えその空白部
分の左端を新たな右端として元の候補領域を分割するこ
とにより、差出人住所領域の右側に近接して他の文字や
絵柄などが存在し、候補領域の幅が大きくなった場合で
も、必要な特定抽出領域のみを抽出することができる。
【0128】さらに、抽出候補領域に対して、その領域
内を下端から上方向に黒画素が存在する部分まで走査
し、その走査距離が最も長い箇所に存在する黒画素の位
置(最長到達点)を左上座標とし、元の候補領域の右下
座標を右下座標とする新たな領域を抽出することによ
り、差出人住所氏名領域の左側に近接して他の文字・絵
柄等の領域が存在する場合でも不要な領域を除去し、差
出人住所領域などの特定抽出領域を精度よく抽出するこ
とができる。
内を下端から上方向に黒画素が存在する部分まで走査
し、その走査距離が最も長い箇所に存在する黒画素の位
置(最長到達点)を左上座標とし、元の候補領域の右下
座標を右下座標とする新たな領域を抽出することによ
り、差出人住所氏名領域の左側に近接して他の文字・絵
柄等の領域が存在する場合でも不要な領域を除去し、差
出人住所領域などの特定抽出領域を精度よく抽出するこ
とができる。
【0129】さらに、最長到達点の縦方向座標と元の領
域の上端の縦方向座標との差が予め定められた値よりも
小さい場合に最長到達点と元の領域の上端との間の区間
の画像を最長到達点より左に走査しその区間における縦
方向の空白部分を利用して新たな領域を抽出することに
より、差出人住所氏名領域などの特定抽出領域の左下に
重なって他の文字・絵柄などの領域が存在し最長到達点
が住所領域の途中になった場合でも、住所領域の左上部
分が領域分割で失われてしまうことを防ぐことができ
る。
域の上端の縦方向座標との差が予め定められた値よりも
小さい場合に最長到達点と元の領域の上端との間の区間
の画像を最長到達点より左に走査しその区間における縦
方向の空白部分を利用して新たな領域を抽出することに
より、差出人住所氏名領域などの特定抽出領域の左下に
重なって他の文字・絵柄などの領域が存在し最長到達点
が住所領域の途中になった場合でも、住所領域の左上部
分が領域分割で失われてしまうことを防ぐことができ
る。
【0130】さらに、抽出候補領域に対して、その領域
内の横方向で最大の高さを持つ空白部分の下端を新たな
上端として元の候補領域を分割することにより、差出人
住所氏名領域の上に他の文字・絵柄等の領域が存在し候
補領域の高さが大きくなった場合でも不要な領域を除い
た住所氏名領域などの特定抽出領域を抽出することがで
きる。
内の横方向で最大の高さを持つ空白部分の下端を新たな
上端として元の候補領域を分割することにより、差出人
住所氏名領域の上に他の文字・絵柄等の領域が存在し候
補領域の高さが大きくなった場合でも不要な領域を除い
た住所氏名領域などの特定抽出領域を抽出することがで
きる。
【0131】さらに、抽出候補領域に対して、その領域
の下端から一定数の横方向の空白部分を数えその空白部
分の下端を新たな上端として元の候補領域を分割するこ
とにより、差出人住所氏名領域などの特定抽出領域の上
に近接して他の文字・絵柄等が存在し候補領域の高さが
大きくなった場合でも必要な領域のみを抽出することが
できる。
の下端から一定数の横方向の空白部分を数えその空白部
分の下端を新たな上端として元の候補領域を分割するこ
とにより、差出人住所氏名領域などの特定抽出領域の上
に近接して他の文字・絵柄等が存在し候補領域の高さが
大きくなった場合でも必要な領域のみを抽出することが
できる。
【図1】本発明の一実施例における画像処理装置のシス
テム構成を示すブロック図である。
テム構成を示すブロック図である。
【図2】図1の画像処理装置を内蔵した印字機能付きコ
ンピュータであって、(a)は蓋を開けた場合の状態を
示す概略斜視図、(b)は蓋を閉じた場合の状態を示す
概略斜視図である。
ンピュータであって、(a)は蓋を開けた場合の状態を
示す概略斜視図、(b)は蓋を閉じた場合の状態を示す
概略斜視図である。
【図3】葉書画像情報を画像メモリB1に格納する方法
を示す図である。
を示す図である。
【図4】図1の表裏判定手段C1の実施例1のシステム
構成を示すブロック図である。
構成を示すブロック図である。
【図5】図1の表裏判定手段C1の実施例1におけるシ
ステム処理の流れを示すフローチャートである。
ステム処理の流れを示すフローチャートである。
【図6】ラベル画像をラベル画像メモリC2に格納する
方法を示す図である。
方法を示す図である。
【図7】図1の表裏判定手段C1の実施例1の外接矩形
抽出時において郵便番号枠候補矩形を探す書面画像内の
範囲を示す図である。
抽出時において郵便番号枠候補矩形を探す書面画像内の
範囲を示す図である。
【図8】図1の表裏判定手段C1の実施例1の外接矩形
抽出時において郵便番号枠候補矩形として判定される黒
画素外接矩形の大きさの範囲を示す図である。
抽出時において郵便番号枠候補矩形として判定される黒
画素外接矩形の大きさの範囲を示す図である。
【図9】図1の表裏判定手段C1の実施例1における矩
形座標情報を外接矩形座標メモリに格納する方法を示す
図である。
形座標情報を外接矩形座標メモリに格納する方法を示す
図である。
【図10】図1の表裏判定手段C1の実施例1の裏表判
定時において表面と判定される場合の郵便番号枠候補矩
形の例を示す図である。
定時において表面と判定される場合の郵便番号枠候補矩
形の例を示す図である。
【図11】図1の表面住所氏名領域抽出手段D1の実施
例1〜3のシステム構成を示すブロック図である。
例1〜3のシステム構成を示すブロック図である。
【図12】図1の表面住所氏名領域抽出手段D1の実施
例1におけるシステム処理の流れを示すフローチャート
である。
例1におけるシステム処理の流れを示すフローチャート
である。
【図13】図12の画像走査時において黒画素探索走査
を行う葉書画像内の範囲を示す図である。
を行う葉書画像内の範囲を示す図である。
【図14】図1の表面住所氏名領域抽出手段D1の実施
例2におけるシステム処理の流れを示すフローチャート
である。
例2におけるシステム処理の流れを示すフローチャート
である。
【図15】図14の空白部分抽出時において最長走査距
離が葉書の高さの3/4より短い場合に走査を行う葉書
画像内の範囲を示す図である。
離が葉書の高さの3/4より短い場合に走査を行う葉書
画像内の範囲を示す図である。
【図16】図1の表面住所氏名領域抽出手段D1の実施
例3におけるシステム処理の流れを示すフローチャート
である。
例3におけるシステム処理の流れを示すフローチャート
である。
【図17】図1の裏面住所氏名領域抽出手段E1の実施
例1のシステム構成を示すブロック図である。
例1のシステム構成を示すブロック図である。
【図18】図1の裏面住所氏名領域抽出手段E1の実施
例1におけるシステム処理の流れを示すフローチャート
である。
例1におけるシステム処理の流れを示すフローチャート
である。
【図19】図1の裏面住所氏名領域抽出手段E1の実施
例2〜9のシステム構成を示すブロック図である。
例2〜9のシステム構成を示すブロック図である。
【図20】図1の裏面住所氏名領域抽出手段E1の実施
例2におけるシステム処理の流れを示すフローチャート
である。
例2におけるシステム処理の流れを示すフローチャート
である。
【図21】図1の裏面住所氏名領域抽出手段E1の実施
例2におけるシステム処理の流れを示すフローチャート
である。
例2におけるシステム処理の流れを示すフローチャート
である。
【図22】周辺分布情報を周辺分布メモリC4に格納す
る方法を示す図である。
る方法を示す図である。
【図23】図21の候補領域抽出時において文字列方向
が縦方向の場合に行う住所氏名領域の領域抽出処理を示
す図である。
が縦方向の場合に行う住所氏名領域の領域抽出処理を示
す図である。
【図24】図1の裏面住所氏名領域抽出手段E1の実施
例3、4におけるシステム処理の流れを示すフローチャ
ートである。
例3、4におけるシステム処理の流れを示すフローチャ
ートである。
【図25】図24の住所氏名領域分割の際に求める左端
からの最長走査到達点を示す図である。
からの最長走査到達点を示す図である。
【図26】図24において、左端からの最長走査到達点
で住所氏名領域を分割した際、到達点と分割前の領域右
端との横方向座標差が平均文字幅以下の場合に走査を行
う葉書画像内の区間を示す図である。
で住所氏名領域を分割した際、到達点と分割前の領域右
端との横方向座標差が平均文字幅以下の場合に走査を行
う葉書画像内の区間を示す図である。
【図27】図1の裏面住所氏名領域抽出手段E1の実施
例5、6におけるシステム処理の流れを示すフローチャ
ートである。
例5、6におけるシステム処理の流れを示すフローチャ
ートである。
【図28】図27において、住所氏名領域の幅が画像の
幅の1/2より大きい時、領域内を走査して求めた最大
幅を持つ縦方向の空白部分を示す図である。
幅の1/2より大きい時、領域内を走査して求めた最大
幅を持つ縦方向の空白部分を示す図である。
【図29】図30において、住所氏名領域分割の際に求
める下端からの最長走査到達点を示す図である。
める下端からの最長走査到達点を示す図である。
【図30】図1の裏面住所氏名領域抽出手段E1の実施
例7、8におけるシステム処理の流れを示すフローチャ
ートである。
例7、8におけるシステム処理の流れを示すフローチャ
ートである。
【図31】図30において、下端からの最長走査到達点
で領域を分割した際、到達点と分割前の領域上端との縦
方向座標差が平均的な文字の高さ以下の場合に走査を行
う葉書画像内の区間を示す図である。
で領域を分割した際、到達点と分割前の領域上端との縦
方向座標差が平均的な文字の高さ以下の場合に走査を行
う葉書画像内の区間を示す図である。
【図32】図1の裏面住所氏名領域抽出手段E1の実施
例9、10におけるシステム処理の流れを示すフローチ
ャートである。
例9、10におけるシステム処理の流れを示すフローチ
ャートである。
【図33】図32において、住所氏名領域の高さが画像
の高さの3/10より大きい時、領域内を走査して求め
た最大の高さを持つ横方向の空白部分を示す図である。
の高さの3/10より大きい時、領域内を走査して求め
た最大の高さを持つ横方向の空白部分を示す図である。
A1 スキャナ B1 葉書画像メモリ C1 裏表判定手段 D1 表面住所氏名領域抽出手段 E1 裏面住所氏名領域抽出手段 F1 文字認識手段 G1 住所氏名分類手段 H1 地名辞書 C2、C3 ラベル画像メモリ C4 周辺分布メモリ D2、D3 外接矩形座標メモリ E2、E3、E4 プログラム用ROM F2、F3、F4 制御部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−326187(JP,A) 特開 昭63−101982(JP,A) 特開 平3−267180(JP,A) 特開 平1−321587(JP,A) 特開 平5−128305(JP,A) 特開 平5−174180(JP,A)
Claims (5)
- 【請求項1】 葉書や封書を含む郵便物文書の書面画像
から画像データを入力する画像入力手段と、 前記入力された画像データを格納する画像メモリと、 前記画像メモリに格納されている画像データに含まれて
いる文字に対して文字認識処理を行う前に、前記書面画
像の特定部分からその書面画像の表裏を判定する裏表判
定手段と、 前記裏表判定手段の判定結果に応じて、前記画像データ
からその書面画像の表または裏の住所氏名領域を含む特
定文書領域を自動的に抽出する特定 前記特定文書領域抽出手段でそれぞれ求められた表また
は裏の住所氏名領域を文書領域抽出手段と、含む特定文
書領域に対して文字認識処理を行う文字認識手段と、 前記文字認識手段で認識された結果の文字列を予め辞書
登録されている情報と照合し、前記特定文書に含まれる
郵便番号、住所、電話番号やFAX番号を示す記号、氏
名などの項目に分類する住所氏名分類手段と、を備えて
なる画像処理装置において、 前記裏表判定手段は、前記書面画像の一定の領域内に存
在する黒画素連結成分の外接矩形のうち、予め指定され
た大きさの外接矩形を抽出する外接矩形抽出手段と、前
記抽出した外接矩形のうち外接矩形の数が一定数以上横
方向に並んで存在するかどうかで該画像の裏表を特定す
る裏表特定手段とを含み、 前記裏表判定手段は、前記外接矩形抽出手段によって抽
出された予め指定された大きさの外接矩形の候補矩形に
対して、前記裏表特定手段によって予め規定された縦方
向の範囲内に3つ以上横方向に並んで存在する場合に表
面と判定し、それ以外の場合を裏面と判定することで前
記書面画像の表裏判定を行い、 前記特定文書領域抽出手段は、前記裏表判定手段で表面
と判定された場合に機能する表面住所氏名領域抽出手段
と、前記裏表判定手段で裏面と判定された場合に機能す
る裏面住所氏名領域抽出手段とを備え、 前記表面住所氏名領域抽出手段は、前記書面画像のうち
前記表裏判定手段にて判定された表面の画像に対して、
予め指定された横方向の区間においてその画像の上端よ
り下向きに黒画素が存在する部分までその画像を走査す
る走査手段と、前記走査手段で走査した距離に基づいて
領域を特定する領域特定手段とを含み、 前記表面住所氏名領域抽出手段は、前記走査手段にて走
査した結果、走査距離が所定距離よりも長い場合、その
最も長かった箇所を宛先部分と差出人住所部分とを分割
する縦方向の空白部分の位置と見なし、前記領域特定手
段によってその最も長かった走査箇所から左側全体の領
域を差出人の住所氏名領域として抽出することを特徴と
する画像処理装置。 - 【請求項2】 葉書や封書を含む郵便物文書の書面画像
から画像データを入力する画像入力手段と、 前記入力された画像データを格納する画像メモリと、 前記画像メモリに格納されている画像データに含まれて
いる文字に対して文字認識処理を行う前に、前記書面画
像の特定部分からその書面画像の表裏を判定する裏表判
定手段と、 前記裏表判定手段の判定結果に応じて、前記画像データ
からその書面画像の表または裏の住所氏名領域を含む特
定文書領域を自動的に抽出する特定文書領域抽出手段
と、 前記特定文書領域抽出手段でそれぞれ求められた表また
は裏の住所氏名領域を含む特定文書領域に対して文字認
識処理を行う文字認識手段と、 前記文字認識手段で認識された結果の文字列を予め辞書
登録されている情報と照合し、前記特定文書に含まれる
郵便番号、住所、電話番号やFAX番号を示す記号、氏
名などの項目に分類する住所氏名分類手段と、を備えて
なる画像処理装置において、 前記裏表判定手段は、前記書面画像の一定の領域内に存
在する黒画素連結成分の外接矩形のうち、予め指定され
た大きさの外接矩形を抽出する外接矩形抽出手段と、前
記抽出した外接矩形のうち外接矩形の数が一定数以上横
方向に並んで存在するかどうかで該画像の裏表を特定す
る裏表特定手段とを含み、 前記裏表判定手段は、前記外接矩形抽出手段によって抽
出された予め指定された大きさの外接矩形の候補矩形に
対して、前記裏表特定手段によって予め規定された縦方
向の範囲内に3つ以上横方向に並んで存在する場合に表
面と判定し、それ以外の場合を裏面と判定することで前
記書面画像の表裏判定を行い、 前記特定文書領域抽出手段は、前記裏表判定手段で表面
と判定された場合に機能する表面住所氏名領域抽出手段
と、前記裏表判定手段で裏面と判定された場合に機能す
る裏面住所氏名領域抽出手段とを備え、 前記表面住所氏名領域抽出手段は、前記書面画像のうち
前記裏表判定手段にて判定された表面の画像に対して、
予め指定された横方向の区間においてその画像の上端よ
り下向きに黒画素が存在する部分までの画像を走査し、
この走査した距離が最も長い箇所に存在する黒画素の位
置を求める黒画素位置算出設定手段と、前記黒画素位置
算出手段で求めた黒画素の位置を左上座標とし、予め定
められた座標を右下座標とする矩形領域内における縦方
向の空白部分に基づいて領域を特定する領域特定手段と
を含み、 前記表面住所氏名領域抽出手段は、前記黒画素位置算出
手段で求めた結果、黒画素の位置を左上座標とし、予め
定められた座標を右下座標とする矩形領域内における縦
方向の空白部分を抽出し、この空白部分が所定大きさよ
りも大きい場合、その最大幅の空白部分を宛先部分と差
出人住所部分とを分割する縦方向の空白部分の位置と見
なし、前記領域特定手段によってこの抽出した空白部分
のうち最大幅を持つ空白部分の左端から左側全体の領域
を差出人の住所氏名領域として抽出することを特徴とす
る画像処理装置。 - 【請求項3】 葉書や封書を含む郵便物文書の書面画像
から画像データを入力する画像入力手段と、 前記入力された画像データを格納する画像メモリと、 前記画像メモリに格納されている画像データに含まれて
いる文字に対して文字認識処理を行う前に、前記書面画
像の特定部分からその書面画像の表裏を判定する裏表判
定手段と、 前記裏表判定手段の判定結果に応じて、前記画像データ
からその書面画像の表または裏の住所氏名領域を含む特
定文書領域を自動的に抽出する特定文書領域抽出手段
と、 前記特定文書領域抽出手段でそれぞれ求められた表また
は裏の住所氏名領域を含む特定文書領域に対して文字認
識処理を行う文字認識手段と、 前記文字認識手段で認識された結果の文字列を予め辞書
登録されている情報と照合し、前記特定文書に含まれる
郵便番号、住所、電話番号やFAX番号を示す記号、氏
名などの項目に分類する住所氏名分類手段と、を備えて
なる画像処理装置において、 前記裏表判定手段は、前記書面画像の一定の領域内に存
在する黒画素連結成分の外接矩形のうち、予め指定され
た大きさの外接矩形を抽出する外接矩形抽出手段と、前
記抽出した外接矩形のうち外接矩形の数が一定数以上横
方向に並んで存在するかどうかで該画像の裏表を特定す
る裏表特定手段とを含み、 前記裏表判定手段は、前記外接矩形抽出手段によって抽
出された予め指定された大きさの外接矩形の候補矩形に
対して、前記裏表特定手段によって予め規定された縦方
向の範囲内に3つ以上横方向に並んで存在する場合に表
面と判定し、それ以外の場合を裏面と判定することで前
記書面画像の表裏判定を行い、 前記特定文書領域抽出手段は、前記裏表判定手段で表面
と判定された場合に機能する表面住所氏名領域抽出手段
と、前記裏表判定手段で裏面と判定された場合に機能す
る裏面住所氏名領域抽出手段とを備え、 裏面住所氏名領域抽出手段は、前記書面画像中の連結領
域から外接矩形を抽出し、その中から有効矩形と特定す
る有効矩形特定手段と、前記書面画像を2つの領域に分
割しそれぞれの領域において有効矩形の数を計算する有
効矩形数計算手段と、前記有効矩形数計算手段で計算し
たそれぞれの領域の有効矩形数のうち、指定された一方
の領域内の有効矩形数が他方の領域内の有効矩形数に一
定倍率を乗じた値に基づいて領域を特定する領域特定手
段とを含み、 裏面住所氏名領域抽出手段は、有効矩形特定手段によっ
て前記書面画像中の黒画素連結成分の外接矩形を抽出
し、この抽出した外接矩形のうち一定の条件を満たす矩
形を有効矩形として抽出し、前記有効矩形数計算手段に
よって前記書面画像を2つの領域に分割し、それぞれの
領域において有効矩形の数を計算し、前記領域特定手段
によってそれぞれの領域の有効矩形数のうち、指定され
た一方の領域内の有効矩形数が他方の領域内の有効矩形
数に一定倍率を乗じた値より大きい場合には指定された
一方の領域を差出人の住所氏名領域と判断し、そうでな
い場合には他方の領域を差出人の住所氏名領域と判断す
ることを特徴とする画像処理装置。 - 【請求項4】 葉書や封書を含む郵便物文書の書面画像
から画像データを入力する画像入力手段と、 前記入力された画像データを格納する画像メモリと、 前記画像メモリに格納されている画像データに含まれて
いる文字に対して文字認識処理を行う前に、前記書面画
像の特定部分からその書面画像の表裏を判定する裏表判
定手段と、 前記裏表判定手段の判定結果に応じて、前記画像データ
からその書面画像の表または裏の住所氏名領域を含む特
定文書領域を自動的に抽出する特定文書領域抽出手段
と、 前記特定文書領域抽出手段でそれぞれ求められた表また
は裏の住所氏名領域を含む特定文書領域に対して文字認
識処理を行う文字認識手段と、 前記文字認識手段で認識された結果の文字列を予め辞書
登録されている情報と照合し、前記特定文書に含まれる
郵便番号、住所、電話番号やFAX番号を示す記号、氏
名などの項目に分類する住所氏名分類手段と、を備えて
なる画像処理装置において、 前記裏表判定手段は、前記書面画像の一定の領域内に存
在する黒画素連結成分の外接矩形のうち、予め指定され
た大きさの外接矩形を抽出する外接矩形抽出手段と、前
記抽出した外接矩形のうち外接矩形の数が一定数以上横
方向に並んで存在するかどうかで該画像の裏表を特定す
る裏表特定手段とを含み、 前記裏表判定手段は、前記外接矩形抽出手段によって抽
出された予め指定された大きさの外接矩形の候補矩形に
対して、前記裏表特定手段によって予め規定された縦方
向の範囲内に3つ以上横方向に並んで存在する場合に表
面と判定し、それ以外の場合を裏面と判定することで前
記書面画像の表裏判定を行い、 前記特定文書領域抽出手段は、前記裏表判定手段で表面
と判定された場合に機能する表面住所氏名領域抽出手段
と、前記裏表判定手段で裏面と判定された場合に機能す
る裏面住所氏名領域抽出手段とを備え、 前記裏面住所氏名領域抽出手段は、前記書面画像内の指
定された領域に対して縦方向および横方向の空白部分を
抽出する空白部分抽出手段と、該空白部分抽出手段で抽
出した空白部分が存在する方向に基づいて指定された領
域を分割し、候補領域を特定する候補領域特定手段と、
前記各手段による処理を再帰的に繰り返して最終的に一
つの領域を特定する領域特定手段とを含み、 前記裏面住所氏名領域抽出手段は、前記空白部分抽出手
段によって前記書面画像内の指定された領域に対して縦
方向および横方向の空白部分を抽出し、抽出された空白
部分のうち、予め定められた大きさ以上の空白部分が横
方向に存在する場合にはその部分から上下に候補領域を
分割し、予め定められた大きさ以上の空白部分が縦方向
に存在する場合にはその部分から左右に候補領域を分割
し、この分割領域のうち文字列方向が縦方向の場合には
一定条件の大きさを持ち最も左下に位置する領域を、一
方文字列方向が横方向の場合には一定条件の大きさを持
ち最も右下に位置する領域を、前記領域特定手段によっ
てそれぞれ差出人住所氏名候補領域と特定し、前記領域
特定手段によって前記空白部分の抽出、領域分割並びに
候補領域抽出を再帰的に繰り返して、最終的に一つの領
域を差出人住所氏名候補領域と特定することを特徴とす
る画像処理装置。 - 【請求項5】 前記裏面住所氏名領域抽出手段は、 前記候補領域特定手段によって特定した候補領域での文
字列方向が縦方向の場合には、 前記候補領域内を左端から右方向に黒画素が存在する部
分まで走査し、走査した距離が最も長い箇所に存在する
黒画素の位置である最長到達点を新たな右上座標とし、
元の候補領域の左下座標を新たな左下座標とする新たな
領域を差出人住所氏名領域と特定するとともに、さら
に、 前記最長到達点の横方向座標と元の候補領域の右端の横
方向座標との座標差を求め、この座標差が予め定められ
た値より小さい場合に、前記最長到達点と元の候補領域
の右端との間の区間の画像を最長到達点から上方向に走
査し、その区間における横方向の空白部分を抽出し、こ
の抽出した空白部分のうち予め定められた値よりも大き
い高さを持つ空白部分が最初に抽出された時点で、その
白部分の下端を新たな上端とする領域を差出人住所氏名
領域と特定し、 一方、前記候補領域特定手段によって特定した候補領域
での文字列方向が横方向の場合には、 前記候補領域内を下端から上方向に黒画素が存在する部
分まで走査し、走査した距離が最も長い箇所に存在する
黒画素の位置である最長到達点を新たな左上座標とし、
元の候補領域の右下座標を新たな右下座標とする新たな
領域を差出人住所氏名領域と特定するとともに、さら
に、 前記最長到達点の縦方向座標と元の候補領域の上端の縦
方向座標との座標差を求め、この座標差が予め定められ
た値より小さい場合に、前記最長到達点と元の候補領域
の上端との間の区間の画像を最長到達点から左方向に走
査し、その区間における縦方向の空白部分を抽出し、こ
の抽出した空白部分のうち予め定められた値よりも大き
い幅を持つ空白部分が最初に抽出された時点で、その空
白部分の右端を新たな左端とする領域を差出人住所氏名
領域と特定する、 ことを特徴とする請求項4記載の画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32329994A JP3316326B2 (ja) | 1994-12-26 | 1994-12-26 | 画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32329994A JP3316326B2 (ja) | 1994-12-26 | 1994-12-26 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08180133A JPH08180133A (ja) | 1996-07-12 |
JP3316326B2 true JP3316326B2 (ja) | 2002-08-19 |
Family
ID=18153239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32329994A Expired - Fee Related JP3316326B2 (ja) | 1994-12-26 | 1994-12-26 | 画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3316326B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016424A (ja) * | 2001-07-04 | 2003-01-17 | Pfu Ltd | 画像処理装置および画像処理装置の制御方法ならびにそのプログラム |
JP2011086178A (ja) | 2009-10-16 | 2011-04-28 | Toshiba Corp | 料額印検出方法及び料額印検出装置 |
KR101000535B1 (ko) * | 2010-07-05 | 2010-12-14 | 윤상준 | 경조금이 수납된 봉투와 지폐의 분리장치 및 그 분리장치를 포함하는 경조금 자동 접수 처리 시스템 |
JP5664181B2 (ja) * | 2010-11-30 | 2015-02-04 | 富士通株式会社 | 画像処理装置、画像処理方法及び画像処理用コンピュータプログラム |
JP6175963B2 (ja) * | 2013-07-31 | 2017-08-09 | ブラザー工業株式会社 | 読取装置および情報処理装置 |
-
1994
- 1994-12-26 JP JP32329994A patent/JP3316326B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08180133A (ja) | 1996-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5784487A (en) | System for document layout analysis | |
JP2930612B2 (ja) | 画像形成装置 | |
US6377704B1 (en) | Method for inset detection in document layout analysis | |
US6754385B2 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
US6351559B1 (en) | User-enclosed region extraction from scanned document images | |
US5828771A (en) | Method and article of manufacture for determining whether a scanned image is an original image or fax image | |
US5119433A (en) | Method and system for locating the amount field on a document | |
KR100390264B1 (ko) | 폼처리중자동페이지등록및자동영역검출을위한시스템및방법 | |
US8428356B2 (en) | Image processing device and image processing method for generating electronic document with a table line determination portion | |
TW565803B (en) | System and method for accurately recognizing text font in a document processing system | |
EP0854433A3 (en) | Caption and photo extraction from scanned document images | |
US20010043740A1 (en) | Character recognizing device, image reading device, character recognizing method, and program product | |
US5974177A (en) | Apparatus and method of network distribution of record data using transmittal symbols hand entered on a transmittal sheet | |
JP3316326B2 (ja) | 画像処理装置 | |
JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
JP2004166062A (ja) | 書類読取装置 | |
JP4281236B2 (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
EP0975146A1 (en) | Locating the position and orientation of multiple objects with a smart platen | |
JP2000251010A (ja) | 帳票読み取り方法 | |
US6678427B1 (en) | Document identification registration system | |
JP3309084B2 (ja) | 図形の電子化方法 | |
JP3122476B2 (ja) | 自動文書清書装置 | |
JPH08305791A (ja) | 画像認識装置及び制御シート | |
JPH10507014A (ja) | 2進イメージにおけるランドスケープ・スキャンの自動決定 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20000605 |
|
LAPS | Cancellation because of no payment of annual fees |