JP3376931B2

JP3376931B2 - 文字行抽出方法および装置

Info

Publication number: JP3376931B2
Application number: JP35007398A
Authority: JP
Inventors: 建志平本; 浩松内
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1997-12-25
Filing date: 1998-12-09
Publication date: 2003-02-17
Anticipated expiration: 2018-12-09
Also published as: JPH11265425A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、光学的文字読み取
り装置（ＯＣＲ）等において、文書デ−タから文字行を
抽出する方法および装置に関する。

【０００２】

【従来の技術】従来、ＯＣＲ等における文書から文字行
を抽出する方法として、画像データより画素連結矩形を
生成し、写真領域を除去したものを基本矩形とし、文字
行方向を判定し、基本矩形を接続し、文字行候補を生成
し、生成された文字行候補を非分割領域として、主方
向、副方向に適宜分割して、副方向の文字行を抽出する
とともに、文字行候補内で基本矩形の統合を行なうこと
により文字矩形を生成し、文字矩形サイズの平均値、分
散値から文字行候補の構成を判定し、構成に応じて文字
行候補を分割し、分割された文字行候補の領域内におい
て文字矩形を接続することにより文字行を抽出する、特
願平０８−１１８０６２に代表される様々な方法が提案
されている。しかし、これらの方法では、名刺に印刷さ
れた郵便番号部分のように、縦書き文字行の中に横書き
で数字を並べ行の幅が局所的に大きくなっているような
部分や、住所行の直上に住所行と直交する方向に郵便番
号か書かれているような、例外的な文字行を正確に抽出
することは困難である。

【０００３】一般的な配置の文字行を、精度よく抽出す
るように考えられた処理手順や閾値設定等を、一般的な
配置の文字行に対する精度に悪影響を与えることなく、
例外的な配置の文字行を抽出できるようにするには、自
ずと限界がある。また、例外的な配置にも精度よく抽出
できる処理を実現しようとすると、例外的な配置を考慮
しない場合に比べて、非常に多くの例外的な処理を必要
としてしまう。

【０００４】

【発明が解決しようとする課題】以上述べたように、従
来の文字行を抽出する方法では、名刺の郵便番号部分に
見られるような、例外的な文字行まで、その他の文字行
に対する許容範囲や処理量を犠牲にすることなく正確に
抽出することが困難であるという課題があった。

【０００５】そこで、本発明はこのような課題を解決
し、名刺の郵便番号部分に見られるような、例外的な文
字行まで、その他の文字行に対する処理を犠牲にするこ
となく、正確にかつ効率よく、文書デ−タから文字行を
抽出する方法および装置を提供することを目的とする。

【０００６】

【課題を解決するための手段】上記課題を解決するため
に、本願発明の文字行抽出方法は文字行抽出ステップ
と、再構成起点領域選択ステップと、遊離副方向郵便番
号文字抽出ステップと、遊離副方向郵便番号行生成ステ
ップとにより構成される。

【０００７】文字行抽出ステップは、処理対象の画像デ
ータから文字行を抽出し、各文字行を構成する文字や文
字行の外接矩形を得る。

【０００８】再構成起点領域選択ステップは、抽出され
た各文字行から、適切な大きさと文字数で構成されるも
のを再構成起点領域として選択する。

【０００９】遊離副方向郵便番号文字抽出ステップは、
選択された再構成起点領域の上端からさらに上の部分
に、再構成起点領域中の文字行と直交する方向の文字行
が存在する可能性がある領域を、遊離副方向郵便番号行
抽出領域として、当該再構成起点領域との相対的な位
置、および、相対的な大きさにより生成する遊離副方向
郵便番号行抽出領域生成ステップと、生成された遊離副
方向郵便番号行抽出領域内に存在する、文字行、文字、
ノイズを遊離副方向郵便番号文字候補として抽出する郵
便番号文字候補抽出ステップとよりなる。

【００１０】そして、遊離副方向郵便番号行生成ステッ
プは、抽出された遊離副方向郵便番号文字候補を、相互
の位置関係に応じて接続して郵便番号行とする。

【００１１】また、上記課題を解決するために、本願発
明の文字行抽出方法は文字行抽出ステップと、再構成起
点領域選択ステップと、遊離副方向郵便番号文字抽出ス
テップと、遊離副方向郵便番号行生成ステップとにより
構成される。

【００１２】文字行抽出ステップと、再構成起点領域選
択ステップは、前記文字行抽出方法と同様のステップで
ある。

【００１３】包含副方向郵便番号文字抽出ステップは、
選択された再構成起点領域の上端付近に、再構成起点領
域と直交する方向の郵便番号行が存在する可能性がある
領域を、包含副方向郵便番号行抽出領域として、当該再
構成起点領域との相対的な位置、および、相対的な大き
さにより生成する包含副方向郵便番号行抽出領域生成ス
テップと、生成された包含副方向郵便番号行抽出領域内
に存在する、文字行、文字、ノイズを包含副方向郵便番
号文字候補として抽出する郵便番号文字候補抽出ステッ
プとよりなる。

【００１４】そして、包含副方向郵便番号行生成ステッ
プは、抽出された包含副方向郵便番号文字候補と、再構
成起点領域の上端付近の文字を、相互の位置関係に応じ
て接続して郵便番号行とし、再構成起点領域中の文字行
を再構成する。

【００１５】また、上記課題を解決するために、本願発
明の文字行抽出方法は文字行抽出ステップと、再構成起
点領域選択ステップと、分離パック文字抽出ステップ
と、分離パック文字統合ステップとにより構成される。

【００１６】文字行抽出ステップと、再構成起点領域選
択ステップは、前記文字行抽出方法と同様のステップで
ある。

【００１７】分離パック文字抽出ステップは、選択され
た再構成起点領域の上端から１文字から数文字分下の付
近に、再構成起点領域中の文字行に含まれるべき郵便番
号の一部が取りこぼされている可能性がある領域を、分
離パック文字抽出領域として、当該再構成起点領域との
相対的な位置、および、相対的な大きさにより生成する
分離パック文字候補抽出ステップと、生成された分離パ
ック文字抽出領域内に存在する、文字、ノイズを分離パ
ック文字候補として抽出する分離パック文字候補抽出ス
テップとよりなる。

【００１８】そして、分離パック文字統合ステップは、
抽出された分離パック文字候補と、再構成起点領域中の
文字行の位置関係に応じて、当該分離パック文字候補を
再構成起点領域中の文字行に統合する。

【００１９】上記３つの本願発明に係る文字行抽出方法
は、共通の文字行抽出ステップと、再構成起点領域選択
ステップ以降のステップについて、自由に組み合わせる
ことが可能であり、対象とする画像に適したステップを
選択するとことが望ましい。

【００２０】また、前記文字行抽出方法において、対象
とする画像データが、住所、電話番号、ＦＡＸ番号等が
書かれた住所行と、郵便番号行が、比較的まとまった領
域に書かれているものである場合、再構成起点領域選択
ステップの代替ステップとして、その全ての住所行を囲
む外接矩形を住所領域とし、再構成起点領域の代替領域
として抽出する住所領域抽出ステップを設けると好適で
ある。

【００２１】さらに、前記住所領域抽出ステップには、
抽出された文字行から、当該文字行の形状が住所行に近
い幅と長さを持つものを、住所候補行とする住所候補行
抽出ステップと、処理対象の画像データ自体を２×２の
４つの住所候補区画に分割する住所候補区画生成ステッ
プと、各住所行の中心位置から、その住所候補行が所属
する住所候補区画を判定し、各住所候補区画毎に当該住
所候補行の数を計数する所属行計数ステップと、最も多
くの住所候補行が所属する住所候補区画を住所区画とす
る所属行数比較ステップとよりなる住所区画抽出ステッ
プと、抽出された住所候補行から、所属行計数ステップ
において、抽出された住所区画に所属すると判断された
当該住所候補行を、住所行として抽出する住所行抽出ス
テップと、そして、抽出された住所行の外接矩形を生成
し、住所領域とする住所領域生成ステップとを設けるこ
とが望ましい。

【００２２】また、前記住所領域抽出ステップにおいて
は、住所領域生成ステップの前には、抽出された住所行
を除いた文字行から、住所行と平行で、かつ、住所行の
文字と同程度の文字で構成され、かつ、住所行との間隔
が小さく、かつ、住所行の行頭から行末間にほぼ収まっ
ている文字行を、副住所行とするステップを設け、そし
て、住所領域抽出ステップにおける住所領域生成ステッ
プを、抽出された住所行、および、副住所行の外接矩形
を生成し、住所領域とするステップとしてもよい。

【００２３】さらに、上記課題を解決するために、本願
発明の文字行抽出方法は文字行抽出ステップと、単独文
字抽出ステップと、文字行開始位置文字抽出ステップ
と、開始記号判定ステップと、郵便番号文字検索ステッ
プとにより構成される。

【００２４】文字行抽出ステップは、前記文字行抽出方
法と同様のステップである。単独文字抽出ステップは、
文字行に属さず単独の１文字で存在すると判定された文
字を抽出する。また、文字行開始位置文字抽出ステップ
は、抽出された各文字行の行開始位置に存在する文字を
抽出する。

【００２５】開始記号判定ステップは、単独文字抽出ス
テップ、および、文字行開始位置文字抽出ステップによ
って抽出された文字と、〒記号や顔記号等との類似度を
計算し、類似度の高いものを開始記号として抽出する。

【００２６】そして、郵便番号文字検索ステップは、抽
出された開始記号から、水平方向に５文字、または、７
文字の郵便番号文字を抽出する第１水平方向検索ステッ
プと、抽出された開始記号から、その下方から水平方向
に５文字、または、７文字の郵便番号文字を抽出する第
２水平方向検索ステップと、抽出された開始記号から、
水平方向に３文字分の郵便番号文字を抽出し、その下方
から水平方向に２文字、または、４文字の郵便番号文字
を抽出する２段組検索ステップと、抽出された開始記号
から、その下方から水平方向に３文字分の郵便番号文字
を抽出し、その下方から水平方向に２文字、または、４
文字の郵便番号文字を抽出する３段組検索ステップと、
抽出された開始記号から、その下方から水平方向に３文
字分の郵便番号文字を抽出し、その下方にハイフンを抽
出し、さらにその下方から水平方向に２文字、または、
４文字の郵便番号文字を抽出する４段組検索ステップ
と、抽出された郵便番号文字から、郵便番号行を生成す
る文字行再構成ステップとよりなる。

【００２７】さらに、前記第１水平方向検索ステップ、
第２水平方向検索ステップ、２段組検索ステップ、３段
組検索ステップ、４段組検索ステップには、郵便番号文
字を抽出する際に、仮文字切り出し、および、仮文字認
識を行ない、郵便番号文字が０から９までのいずれかの
数字との類似度が十分高いことを確認するステップを設
けることが望ましい。

【００２８】そして、前記文字行抽出方法においては、
文字行再構成ステップ以前に、抽出された郵便番号文字
に対して文字認識を行ない、その認識結果が郵便番号デ
ータベースに存在する場合のみ、文字行再構成ステップ
を実行するステップを設けてもよい。

【００２９】さらに、上記課題を解決するために、本願
発明の文字行抽出方法は文字行抽出ステップと、安定文
字配置行選択ステップと、外部文字候補抽出ステップ
と、外部文字行検索ステップとにより構成される。

【００３０】文字行抽出ステップは、前記文字行抽出方
法と同様のステップである。安定文字配置行選択ステッ
プは、抽出された各文字行の行頭、および、行末の数文
字を除いた中央部の文字について、当該文字の中心位置
の間隔の平均値を算出する文字中心間距離算出ステップ
と、当該文字の中心位置の間隔の分散値を算出する文字
中心間分散算出ステップと、当該文字の文字矩形サイズ
の平均値を算出する文字サイズ平均算出ステップと、算
出された値から文字配置の安定性の有無を判別し、安定
性が有る文字行を安定文字配置行として選択する安定文
字配置行判別ステップとよりなる。

【００３１】外部文字候補抽出ステップは、抽出された
安定文字配置行について、文字中心間距離算出ステップ
と、文字中心間分散算出ステップと、文字サイズ平均算
出ステップにおいて、各値の算出に使用されなかった行
頭、および、行末の数文字について、当該文字を加えて
文字配置の安定性の有無を再び判別する安定文字配置行
再判別ステップと、安定性が無くなると判別された場合
に、当該文字から外部文字候補を生成する外部文字候補
生成ステップとよりなる。

【００３２】そして、外部文字行検索ステップは、抽出
された外部文字候補から、外部文字候補が所属していた
文字行と直行する方向に文字を抽出する直行方向検索ス
テップと、抽出された文字から、新規文字行を生成する
文字行再生成ステップとよりなる。

【００３３】さらに、前記文字行抽出方法においては、
安定文字配置行選択ステップ以前に、文字行抽出ステッ
プにおいて抽出された文字行に対して、仮文字切り出
し、仮文字認識を行ない、当該文字行を構成する文字矩
形を補正するステップを設けるとよい。

【００３４】また、上記課題を解決するために、本願発
明の文字行抽出装置は文字行抽出手段と、再構成起点領
域選択手段と、遊離副方向郵便番号文字抽出手段と、遊
離副方向郵便番号行生成手段とにより構成される。

【００３５】文字行抽出手段は、処理対象の画像データ
から文字行を抽出し、各文字行を構成する文字や文字行
の外接矩形を得る。

【００３６】再構成起点領域選択手段は、抽出された各
文字行から、適切な大きさと文字数で構成されるものを
再構成起点領域として選択する。

【００３７】遊離副方向郵便番号文字抽出手段は、選択
された再構成起点領域の上端からさらに上の部分に、再
構成起点領域中の文字行と直交する方向の文字行が存在
する可能性がある領域を、遊離副方向郵便番号行抽出領
域として、当該再構成起点領域との相対的な位置、およ
び、相対的な大きさにより生成する遊離副方向郵便番号
行抽出領域生成手段と、生成された遊離副方向郵便番号
行抽出領域内に存在する、文字行、文字、ノイズを遊離
副方向郵便番号文字候補として抽出する郵便番号文字候
補抽出手段とよりなる。

【００３８】そして、遊離副方向郵便番号行生成手段
は、抽出された遊離副方向郵便番号文字候補を、相互の
位置関係に応じて接続して郵便番号行とする。

【００３９】また、上記課題を解決するために、本願発
明の文字行抽出装置は文字行抽出手段と、再構成起点領
域選択手段と、遊離副方向郵便番号文字抽出手段と、遊
離副方向郵便番号行生成手段とにより構成される。

【００４０】文字行抽出手段と、再構成起点領域選択手
段は、前記文字行抽出装置と同様の手段である。

【００４１】包含副方向郵便番号文字抽出手段は、選択
された再構成起点領域の上端付近に、再構成起点領域と
直交する方向の郵便番号行が存在する可能性がある領域
を、包含副方向郵便番号行抽出領域として、当該再構成
起点領域との相対的な位置、および、相対的な大きさに
より生成する包含副方向郵便番号行抽出領域生成手段
と、生成された包含副方向郵便番号行抽出領域内に存在
する、文字行、文字、ノイズを包含副方向郵便番号文字
候補として抽出する郵便番号文字候補抽出手段とよりな
る。

【００４２】そして、包含副方向郵便番号行生成手段
は、抽出された包含副方向郵便番号文字候補と、再構成
起点領域の上端付近の文字を、相互の位置関係に応じて
接続して郵便番号行とし、再構成起点領域中の文字行を
再構成する。

【００４３】また、上記課題を解決するために、本願発
明の文字行抽出装置は文字行抽出手段と、再構成起点領
域選択手段と、分離パック文字抽出手段と、分離パック
文字統合手段とにより構成される。

【００４４】文字行抽出手段と、再構成起点領域選択手
段は、前記文字行抽出装置と同様の手段である。

【００４５】分離パック文字抽出手段は、選択された再
構成起点領域の上端から１文字から数文字分下の付近
に、再構成起点領域中の文字行に含まれるべき郵便番号
の一部が取りこぼされている可能性がある領域を、分離
パック文字抽出領域として、当該再構成起点領域との相
対的な位置、および、相対的な大きさにより生成する分
離パック文字候補抽出手段と、生成された分離パック文
字抽出領域内に存在する、文字、ノイズを分離パック文
字候補として抽出する分離パック文字候補抽出手段とよ
りなる。

【００４６】そして、分離パック文字統合手段は、抽出
された分離パック文字候補と、再構成起点領域中の文字
行の位置関係に応じて、当該分離パック文字候補を再構
成起点領域中の文字行に統合する。

【００４７】上記３つの本願発明に係る文字行抽出装置
は、共通の文字行抽出手段と、再構成起点領域選択手段
以降の手段について、自由に組み合わせることが可能で
あり、対象とする画像に適した手段を選択するとことが
望ましい。

【００４８】また、前記文字行抽出装置において、対象
とする画像データが、住所、電話番号、ＦＡＸ番号等が
書かれた住所行と、郵便番号行が、比較的まとまった領
域に書かれているものである場合、再構成起点領域選択
手段の代替手段として、その全ての住所行を囲む外接矩
形を住所領域とし、再構成起点領域の代替領域として抽
出する住所領域抽出手段を設けると好適である。

【００４９】さらに、前記住所領域抽出手段には、抽出
された文字行から、当該文字行の形状が住所行に近い幅
と長さを持つものを、住所候補行とする住所候補行抽出
手段と、処理対象の画像データ自体を２×２の４つの住
所候補区画に分割する住所候補区画生成手段と、各住所
行の中心位置から、その住所候補行が所属する住所候補
区画を判定し、各住所候補区画毎に当該住所候補行の数
を計数する所属行計数手段と、最も多くの住所候補行が
所属する住所候補区画を住所区画とする所属行数比較手
段とよりなる住所区画抽出手段と、抽出された住所候補
行から、所属行計数手段において、抽出された住所区画
に所属すると判断された当該住所候補行を、住所行とし
て抽出する住所行抽出手段と、そして、抽出された住所
行の外接矩形を生成し、住所領域とする住所領域生成手
段とを設けることが望ましい。

【００５０】また、前記住所領域抽出手段においては、
住所領域生成手段の前には、抽出された住所行を除いた
文字行から、住所行と平行で、かつ、住所行の文字と同
程度の文字で構成され、かつ、住所行との間隔が小さ
く、かつ、住所行の行頭から行末間にほぼ収まっている
文字行を、副住所行とする手段を設け、そして、住所領
域抽出手段における住所領域生成手段を、抽出された住
所行、および、副住所行の外接矩形を生成し、住所領域
とする手段としてもよい。

【００５１】さらに、上記課題を解決するために、本願
発明の文字行抽出装置は文字行抽出手段と、単独文字抽
出手段と、文字行開始位置文字抽出手段と、開始記号判
定手段と、郵便番号文字検索手段とにより構成される。

【００５２】文字行抽出手段は、前記文字行抽出装置と
同様の手段である。単独文字抽出手段は、文字行に属さ
ず単独の１文字で存在すると判定された文字を抽出す
る。また、文字行開始位置文字抽出手段は、抽出された
各文字行の行開始位置に存在する文字を抽出する。

【００５３】開始記号判定手段は、単独文字抽出手段、
および、文字行開始位置文字抽出手段によって抽出され
た文字と、〒記号や顔記号等との類似度を計算し、類似
度の高いものを開始記号として抽出する。

【００５４】そして、郵便番号文字検索手段は、抽出さ
れた開始記号から、水平方向に５文字、または、７文字
の郵便番号文字を抽出する第１水平方向検索手段と、抽
出された開始記号から、その下方から水平方向に５文
字、または、７文字の郵便番号文字を抽出する第２水平
方向検索手段と、抽出された開始記号から、水平方向に
３文字分の郵便番号文字を抽出し、その下方から水平方
向に２文字、または、４文字の郵便番号文字を抽出する
２段組検索手段と、抽出された開始記号から、その下方
から水平方向に３文字分の郵便番号文字を抽出し、その
下方から水平方向に２文字、または、４文字の郵便番号
文字を抽出する３段組検索手段と、抽出された開始記号
から、その下方から水平方向に３文字分の郵便番号文字
を抽出し、その下方にハイフンを抽出し、さらにその下
方から水平方向に２文字、または、４文字の郵便番号文
字を抽出する４段組検索手段と、抽出された郵便番号文
字から、郵便番号行を生成する文字行再構成手段とより
なる。

【００５５】さらに、前記第１水平方向検索手段、第２
水平方向検索手段、２段組検索手段、３段組検索手段、
４段組検索手段には、郵便番号文字を抽出する際に、仮
文字切り出し、および、仮文字認識を行ない、郵便番号
文字が０から９までのいずれかの数字との類似度が十分
高いことを確認する手段を設けることが望ましい。

【００５６】そして、前記文字行抽出装置においては、
文字行再構成手段以前に、抽出された郵便番号文字に対
して文字認識を行ない、その認識結果が郵便番号データ
ベースに存在する場合のみ、文字行再構成手段を実行す
る手段を設けてもよい。

【００５７】さらに、上記課題を解決するために、本願
発明の文字行抽出装置は文字行抽出手段と、安定文字配
置行選択手段と、外部文字候補抽出手段と、外部文字行
検索手段とにより構成される。

【００５８】文字行抽出手段は、前記文字行抽出装置と
同様の手段である。安定文字配置行選択手段は、抽出さ
れた各文字行の行頭、および、行末の数文字を除いた中
央部の文字について、当該文字の中心位置の間隔の平均
値を算出する文字中心間距離算出手段と、当該文字の中
心位置の間隔の分散値を算出する文字中心間分散算出手
段と、当該文字の文字矩形サイズの平均値を算出する文
字サイズ平均算出手段と、算出された値から文字配置の
安定性の有無を判別し、安定性が有る文字行を安定文字
配置行として選択する安定文字配置行判別手段とよりな
る。

【００５９】外部文字候補抽出手段は、抽出された安定
文字配置行について、文字中心間距離算出手段と、文字
中心間分散算出手段と、文字サイズ平均算出手段におい
て、各値の算出に使用されなかった行頭、および、行末
の数文字について、当該文字を加えて文字配置の安定性
の有無を再び判別する安定文字配置行再判別手段と、安
定性が無くなると判別された場合に、当該文字から外部
文字候補を生成する外部文字候補生成手段とよりなる。

【００６０】そして、外部文字行検索手段は、抽出され
た外部文字候補から、外部文字候補が所属していた文字
行と直行する方向に文字を抽出する直行方向検索手段
と、抽出された文字から、新規文字行を生成する文字行
再生成手段とよりなる。

【００６１】さらに、前記文字行抽出装置においては、
安定文字配置行選択手段以前に、文字行抽出手段におい
て抽出された文字行に対して、仮文字切り出し、仮文字
認識を行ない、当該文字行を構成する文字矩形を補正す
る手段を設けるとよい。

【００６２】

【発明の実施の形態】以下、本発明の実施の形態につい
て、図を用いて説明する。

【００６３】図１は本発明に係る文字行抽出方法および
文字行抽出装置を用いた文字認識装置の構成を示すブロ
ック図である。かかる文字認識装置は、スキャナ−等よ
りなる光学的手段により紙面に印字された文字画像等を
画像デ−タとして読み取る画像入力部１、文字行を抽出
する文字行抽出部２、抽出された文字行を構成する文字
を一文字づつ認識する文字認識部７により構成される。
この装置の文字行抽出部２、文字認識部７の動作は汎用
のコンピュ−タ−とこれに格納されるプログラムによっ
ても達成することができ、このプログラムはフロッピ−
ディスク等の記録媒体に記録することができる。

【００６４】以下に、各構成部分の詳細をさらに説明す
る。まず、本願発明に係る文字抽出装置である文字行抽
出部２の構成を説明する。文字行抽出部２は、図１に示
すように、画像データから一般的な文字行を公知の技術
により抽出する基本文字行抽出部３、基本文字行抽出部
３による文字行抽出結果を補正する第１文字行補正部
４、および、第２文字行補正部５、第３文字行補正部６
よりなる。

【００６５】第１文字行補正部４の構成を図２に示す。
文字行補正部４中、再構成起点領域選択部４１は基本文
字行抽出部３により抽出された文字行の中から、文字行
の幅、長さ、文字数等から適切な文字行を、再構成起点
領域として選択する。

【００６６】遊離副方向郵便番号行抽出部４３、包含副
方向郵便番号行抽出部４４、パック文字修正部４５は、
再構成起点領域内、および、再構成起点領域付近に存在
する郵便番号行の抽出不具合を補正する。

【００６７】遊離副方向郵便番号行抽出部４３の構成を
図３に示す。遊離副方向郵便番号行抽出部４３中、遊離
副方向郵便番号行抽出領域決定部４３０１は再構成起点
領域選択部４１によって生成された再構成起点領域を基
準とし、その再構成起点領域からの相対的な位置と大き
さにより、抽出処理対象領域を設定する。抽出処理対象
領域の設定は、住所領域より上の部分に、一定、あるい
は、文字の大きさ等に比例した大きさで行われる。郵便
番号文字候補検索部４３０２は、遊離副方向郵便番号行
抽出領域決定部４３０１で設定された抽出処理対象領域
内に存在する、文字行、文字、ノイズを郵便番号文字候
補として抽出する。遊離副方向郵便番号行作成部４３０
３は、郵便番号文字候補検索部４３０２で抽出された郵
便番号文字候補を、相互の位置関係や統合時の形状等を
考慮し、適宜接続を行い郵便番号行を作成する。

【００６８】次に、包含副方向郵便番号行抽出部４４の
構成を図４に示す。包含副方向郵便番号行抽出部４４
中、包含副方向郵便番号行抽出領域決定部４４０１は再
構成起点領域選択部４１によって生成された再構成起点
領域を基準とし、その再構成起点領域からの相対的な位
置と大きさにより、抽出処理対象領域を設定する。抽出
処理対象領域の設定は、再構成起点領域の上端付近に、
一定、あるいは、文字の大きさ等に比例した大きさで行
われる。郵便番号文字候補検索部４４０２は、包含副方
向郵便番号行抽出領域決定部４４０１で設定された抽出
処理対象領域内に存在する、文字行、文字、ノイズを郵
便番号文字候補として抽出する。包含副方向郵便番号行
作成部４４０３は、郵便番号文字候補検索部４４０２で
抽出された郵便番号文字候補と、抽出処理対象領域中の
文字行の上端付近の文字を、相互の位置関係や統合時の
形状等を考慮し、適宜接続を行い郵便番号行を作成す
る。文字行再構成部４４０４は、包含副方向郵便番号行
作成部４４０３において、抽出処理対象領域中の文字行
の一部の文字が郵便番号行として使用されたものについ
て、それらの文字を抜いた形で文字行を作成し直す。

【００６９】次に、パック文字修正部４５の構成を図５
に示す。パック文字修正部４５中、分離パック文字抽出
領域決定部４５０１は再構成起点領域選択部４１によっ
て生成された再構成起点領域を基準とし、その再構成起
点領域からの相対的な位置と大きさにより、抽出処理対
象領域を設定する。抽出処理対象領域の設定は、再構成
起点領域の上端から１文字程度下の付近に、一定、ある
いは、文字の大きさ等に比例した大きさで行われる。分
離パック文字検索部４５０２は、分離パック文字抽出領
域決定部４５０１で設定された抽出処理対象領域内に存
在する、文字、ノイズを分離パック文字として抽出す
る。分離パック文字統合部４５０３は、分離パック文字
検索部４５０２で抽出された分離パック文字を、相互の
位置関係や統合時の形状等を考慮し、抽出処理対象領域
内の文字行に統合する。なお、パック文字とは図６の
Ｐ、Ｐ・・・で示すような文字行中に、行方向と直交す
る方向に複数の数字を並べ、１つの文字と同様な形で文
字行中に埋め込まれた文字列をいう。

【００７０】以上の構成により第１文字行補正部４は、
基本文字行抽出部３による文字行抽出結果を補正するこ
とができるが、郵便番号行の近くに、住所、電話番号、
ＦＡＸ番号等が並べて記述されている画像を対象とする
場合、再構成起点領域選択部４１の代替部として住所領
域抽出部４２を使用すると良好である。住所領域抽出部
４２は、住所、電話番号、ＦＡＸ番号等、住所情報に関
連する文字行を囲む外接矩形、すなわち住所領域を、再
構成起点領域の代替領域として生成する。

【００７１】住所領域抽出部４２の構成を図７に示す。
住所領域抽出部４２中、住所候補行抽出部４２０１は基
本文字行抽出部３により抽出された文字行の中から、文
字行の幅、長さ、文字数等から住所、電話番号、ＦＡＸ
番号等が書かれている可能性が高いと判断したものを、
住所候補行として抽出する。

【００７２】住所区画抽出部４２０２は、画像データを
２×２の４つの領域に分割した区画から、住所行が所属
する領域として１つ区画を選択する部分であり、図に示
すように区画分割部４２０２ａ、所属行計数部４２０２
ｂ、住所区画決定部４２０２ｃにより構成される。

【００７３】区画分割部４２０２ａは、画像データを２
×２の４つの領域に分割し、それぞれを住所候補区画と
して生成する。

【００７４】所属行計数部４２０２ｂは、住所候補行
が、区画分割部４２０２ａで生成された住所候補区画の
どの区画に所属するかを住所候補行の中心位置により判
断し、所属した住所候補区画の所属行数を更新する。

【００７５】住所区画決定部４２０２ｃは、４つの住所
候補区画の中から最も多く所属行を持つものを、住所区
画として選択する。

【００７６】住所行抽出部４２０３は、住所区画決定部
４２０２ｃから住所区画を受け取り、住所区画への所属
条件を満たす住所候補行を、住所行として抽出する。

【００７７】副住所行抽出部４２０４は、住所行以外の
各文字行について、住所行との位置関係から、住所、電
話番号、ＦＡＸ番号等が書かれている文字行である可能
性が高いものを、副住所行として抽出する。

【００７８】住所領域生成部４２０５は、抽出した全て
の住所行、および、副住所行の外接矩形を、住所領域と
して生成する。

【００７９】次に、第２文字行補正部５の構成を図８に
示す。第２文字行補正部５中、単独文字抽出部５１は、
基本文字行抽出部３による抽出結果、または、第１文字
行補正部４により補正された抽出結果から、文字行に含
まれず単独で存在している文字を抽出する。

【００８０】文字行開始位置文字抽出部５２は、基本文
字行抽出部３により抽出された文字行、または、第１文
字行補正部４により補正された文字行から、各文字行の
行開始位置に存在する文字を抽出する。

【００８１】開始記号判定部５３は、単独文字抽出部５
１と文字行開始位置文字抽出部５２により抽出された文
字について、〒記号や顔記号等との類似度を計算し、類
似度の高いものを開始記号として抽出する。

【００８２】さらに、郵便番号文字検索部５４は、開始
記号判定部５３により抽出された開始記号を起点に郵便
番号行を抽出する。

【００８３】郵便番号文字検索部５４の詳細な構成を図
９に示す。郵便番号文字検索部５４中、第１水平方向検
索部５４０１は、開始記号判定部５３で抽出された開始
記号を起点に、水平方向に５文字、または、７文字の郵
便番号文字を抽出する。第１水平方向検索部５４０１で
抽出される郵便番号行の例を図１０（ａ）に示す。

【００８４】第２水平方向検索部５４０２は、開始記号
判定部５３で抽出された開始記号を起点に、その下方か
ら水平方向に５文字、または、７文字の郵便番号文字を
抽出する。第２水平方向検索部５４０２で抽出される郵
便番号行の例を図１０（ｂ）に示す。

【００８５】２段組検索部５４０３は、開始記号判定部
５３で抽出された開始記号を起点に、水平方向に３文字
分の郵便番号文字を抽出し、その下方から水平方向に２
文字、または、４文字の郵便番号文字を抽出する。２段
組検索部５４０３で抽出される郵便番号行の例を図１０
（ｃ）に示す。

【００８６】３段組検索部５４０４は、開始記号判定部
５３で抽出された開始記号を起点に、その下方から水平
方向に３文字分の郵便番号文字を抽出し、その下方から
水平方向に２文字、または、４文字の郵便番号文字を抽
出する。３段組検索部５４０４で抽出される郵便番号行
の例を図１０（ｄ）に示す。

【００８７】４段組検索部５４０５は、開始記号判定部
５３で抽出された開始記号を起点に、その下方から水平
方向に３文字分の郵便番号文字を抽出し、その下方にハ
イフンを抽出し、さらにその下方から水平方向に２文
字、または、４文字の郵便番号文字を抽出する。４段組
検索部５４０５で抽出される郵便番号行の例を図１０
（ｅ）に示す。

【００８８】第１水平方向検索部５４０１、第２水平方
向検索部５４０２、２段組検索部５４０３、３段組検索
部５４０４、４段組検索部５４０５は、郵便番号文字を
抽出する過程において、仮文字切り出し部５４０７、お
よび、仮文字認識部５４０８を利用し、文字数の確認
と、郵便番号文字であることの確認を行なう。さらに、
認識した郵便番号を、郵便番号ＤＢ検索部を利用し、実
在する郵便番号であることを確認する。

【００８９】さらに、文字行再構成部５４０６は、抽出
された郵便番号文字から、新たに郵便番号行を生成す
る。

【００９０】最後に、第３文字行補正部６の構成を図１
１に示す。第３文字行補正部６中、文字矩形補正部６１
は、基本文字行抽出部３により抽出された文字行、また
は、第１文字行補正部４、または、第２文字行補正部５
により補正された文字行について、仮文字切り出し部６
２、および、仮文字認識部６３を利用し、当該文字行中
の文字矩形の補正を行なう。

【００９１】安定文字配置行選択部６４は、文字行の中
心付近に存在する文字の配置が安定している文字行を、
安定文字配置行として選択する部分であり、図に示すよ
うに文字中心間距離算出部６４ａ、文字中心間分散算出
部６４ｂ、文字サイズ平均算出部６４ｃ、安定文字配置
行判定部６４ｄにより構成される。

【００９２】文字中心間距離算出部６４ａは、各文字行
の行頭、および、行末の数文字を除いた中央部の文字に
ついて、文字行内で隣接する文字の中心位置の間隔の平
均値を算出する。

【００９３】文字中心間分散算出部６４ｂは、文字中心
間距離算出部６４ａと同様な文字の中心位置の間隔につ
いて、分散値を算出する。

【００９４】文字サイズ平均算出部６４ｃは、文字中心
間分散算出部６４ｂ、文字中心間距離算出部６４ａで対
象とした文字について、文字の平均サイズを算出する。

【００９５】安定文字配置行判定部６４ｄは、文字中心
間距離算出部６４ａ、文字中心間分散算出部６４ｂ、文
字サイズ平均算出部６４ｃより得た各パラメータをもと
に、文字配置の安定性の有無を判別し、安定性が有る文
字行を安定文字配置行として選択する。

【００９６】次に、外部文字候補抽出部６５は、安定文
字配置行選択部６５により選択された各安定文字配置行
について、安定性に問題をきたす行頭、および、行末の
文字から、外部文字候補を生成する部分であり、図に示
すように安定文字配置行再判別部６５ａ、外部文字候補
生成部６５ｂにより構成される。

【００９７】安定文字配置行再判別部６５ａは、各安定
文字配置行について、文字中心間距離算出部６４ａ、文
字中心間分散算出部６４ｂ、文字サイズ平均算出部６４
ｃにおいて各パラメータの算出の対象としなかった文字
を加えた場合に、文字配置の安定性が無くなる文字を抽
出する。

【００９８】外部文字候補生成部６５ｂは、安定文字配
置行再判別部６５ａにより抽出された文字から、外部文
字候補を生成する。

【００９９】さらに、外部文字行検索部６６は、外部文
字候補抽出部６５により生成された外部文字候補を起点
に文字行を再生成する部分であり、図に示すように直行
方向検索部６６ａ、文字行再生成部６６ｂにより構成さ
れる。

【０１００】直行方向検索部６６ａは、外部文字候補を
起点として、その外部文字候補が所属する文字行と直行
する方向に文字を検索し、外部文字候補との位置関係や
文字の大きさから適切な文字を抽出する。

【０１０１】文字行再生成部６６ｂは、外部文字候補と
直行方向検索部６６ａにより抽出された文字から、新規
の文字行を再生成する。

【０１０２】以上の構成を有する文字行抽出装置による
文字行抽出方法の動作について、名刺画像から文字行を
抽出する場合を例にとって以下に説明する。まず、文字
行抽出部２の大まかな動作について、図１２を用いて説
明する。図１２は文字行抽出部２の処理を示すフローチ
ャートである。ここでは、図１３に示す名刺から文字行
を抽出するものとする。まず、文字領域抽出部２の基本
文字行抽出部３は、画像入力部１から入力された名刺の
画像データから、公知の技術により文字行を抽出する。
これにより図１４のＬ、Ｌ・・・で示すような文字行が
得られる。また、図１４のＮ、Ｎ・・・で示すような文
字行以外のものが、文字やノイズとして抽出される（ス
テップ１０１）。次に第１文字行補正部４は文字行とし
て抽出されていない郵便番号文字を集め、新たに郵便番
号行を抽出し（ステップ１０２）。さらに、第２文字行
補正部５、第３文字行補正部６は文字行抽出結果を補正
する（ステップ１０３、ステップ１０４）。

【０１０３】以下に、各構成部分の動作についてさらに
詳細に説明する。まず、第１文字行補正部４の動作につ
いて図１５を用いて説明する。図１５は第１文字行補正
部４の動作を示すフローチャートである。第１文字行補
正部４の再構成起点領域選択部４１は、抽出された文字
行の中から、文字行の幅、長さ、文字数等から適切な文
字行を、再構成起点領域として選択する（ステップ２０
１）。そして、遊離副方向郵便番号行抽出部４３は再構
成起点領域より上部において郵便番号行を抽出する（ス
テップ２０２）。包含副方向郵便番号行抽出部４４は、
ステップ２０２により郵便番号行が抽出されなかった場
合に（ステップ２０３）、再構成起点領域の上端付近に
おいて郵便番号行を抽出する（ステップ２０４）。さら
に、パック文字修正部４５は、ステップ２０４により郵
便番号行が抽出されなかった場合に（ステップ２０
５）、分離しているパック文字を再構成起点領域中の文
字行に統合する（ステップ２０６）。

【０１０４】ここで、再構成起点領域選択部４１は、基
本文字行抽出部３から入力された文字行の中から、文字
行の幅、長さ、文字数等から適切な文字行を、再構成起
点領域として選択するが、ここでは、より高度な住所領
域抽出部４２を再構成起点領域選択部４１の代替部とし
て用い、住所領域抽出部４２により抽出される住所領域
を再構成起点領域として使用する動作について以下に説
明する。

【０１０５】住所領域抽出部４２の動作について図１６
を用いて説明する。図１６は住所領域抽出部４２の動作
を示すフローチャートである。住所領域抽出部４２の区
画分割部４２０２ａは、画像データを２×２の４つの領
域に分割し、それぞれを住所候補区画として生成する
（ステップ３０１）。例えば、図１３の画像に対して図
１７のＢ１、Ｂ２、Ｂ３、Ｂ４に示す４つの住所候補区
画が得られる。住所候補行抽出部４２０１は、基本文字
行抽出部３から入力された各文字行について、住所行の
可能性が高いものを住所候補行とし（ステップ３０
２）、所属行計数部４２０２ｂは、その住所候補行の中
心位置から所属する住所候補区画を判断し（ステップ３
０３）、所属した住所候補区画の所属行数を更新する
（ステップ３０４）。住所候補行抽出部４２０１、所属
行計数部４２０２ｂは、以上の動作（ステップ３０２か
らステップ３０４）を基本文字行抽出部３で生成された
全ての文字行の処理がされるまで繰り返す（ステップ３
０５）。そして、住所区画決定部４２０２ｃは、４つの
住所候補区画の中から最も多く所属行を持つものを、住
所区画として選択する（ステップ３０６）。ステップ３
０１からステップ３０５により図１８のＣ、Ｃ・・・の
ような住所候補行の中心位置と、図１８のＢ１、Ｂ２、
Ｂ３、Ｂ４に示す４つの住所候補区画の関係が得られ、
ステップ３０６により図１８のＢ４が住所区画として選
択される。ここで、画像データが回転した状態で入力さ
れた場合、図１９の例ではＢ１が、図２０の例ではＢ２
が、図２１の例ではＢ３がそれぞれ住所区画として選択
される。

【０１０６】住所行抽出部４２０３は、住所候補行の中
から住所区画に所属するものを住所行として抽出する
（ステップ３０７）。副住所行抽出部４２０４は、住所
行との行間が適切な範囲で、かつ、住所行の行頭から行
末間にほぼ収まっている文字行を副住所行として抽出す
る（ステップ３０８）。住所領域生成部４２０５は、住
所行と副住所行の外接矩形を住所領域として生成する
（ステップ３０９）。ステップ３０７により図２２の
Ｊ、Ｊ・・・のような住所行が得られ、ステップ３０８
により図２３のＳのような副住所行が得られ、ステップ
３０９により図２４のＡのような住所領域が得られる。

【０１０７】次に、遊離副方向郵便番号行抽出部４３の
動作について図２５を用いて説明する。図２５は遊離副
方向郵便番号行抽出部４３の動作を示すフローチャート
である。遊離副方向郵便番号行抽出部４３の遊離副方向
郵便番号行抽出領域決定部４３０１は、住所領域を基準
とし、その住所領域からの相対的な位置と大きさによ
り、遊離副方向郵便番号行抽出領域を設定する（ステッ
プ４０１）。郵便番号文字候補検索部４３０２は、文字
行、文字、ノイズ等の中から遊離副方向郵便番号行抽出
領域内に存在するものを郵便番号文字候補として抽出す
る（ステップ４０２）。遊離副方向郵便番号行作成部４
３０３は、抽出された郵便番号文字候補を、相互の位置
関係や統合時の形状等を考慮し、適宜接続を行い郵便番
号行を作成する（ステップ４０３）。ステップ４０１に
より図２６（ａ）のＥのような遊離副方向郵便番号行抽
出領域が設定され、ステップ４０２により図２６（ｂ）
のＲ、Ｒ・・・のような郵便番号文字候補が得られ、ス
テップ４０３により図２６（ｃ）のＹのような郵便番号
行が得られる。

【０１０８】次に、包含副方向郵便番号行抽出部４４の
動作について図２７を用いて説明する。図２７は包含副
方向郵便番号行抽出部４４の動作を示すフローチャート
である。包含副方向郵便番号行抽出部４４の包含副方向
郵便番号行抽出領域決定部４４０１は、住所領域を基準
とし、その住所領域からの相対的な位置と大きさによ
り、包含副方向郵便番号行抽出領域を設定する（ステッ
プ５０１）。郵便番号文字候補検索部４４０２は、文字
行、文字、ノイズ等の中から包含副方向郵便番号行抽出
領域内に存在するものを郵便番号文字候補として抽出す
る（ステップ５０２）。包含副方向郵便番号行作成部４
４０３は、郵便番号文字候補と、住所行の上端付近の文
字を、相互の位置関係や統合時の形状等を考慮し、適宜
接続を行い郵便番号行を作成する（ステップ５０３）。
文字行再構成部４４０４は、住所行中の一部の文字が郵
便番号行として使用されたものについて、それらの文字
を抜いた形で住所行を作成し直す（ステップ５０４）。
例えば、基本文字行抽出部３により図２８（ａ）のＬ、
Ｌ・・・のような文字行とＮ、Ｎ・・・のようなノイズ
が抽出され、住所領域抽出部４２により図２８（ｂ）の
Ａのような住所領域が得られている場合、ステップ５０
１により図２８（ｃ）のＥのような包含副方向郵便番号
行抽出領域が設定され、ステップ５０２により図２９
（ａ）のＲ、Ｒ・・・のような郵便番号文字候補が得ら
れ、ステップ５０３からステップ５０４により図２９
（ｂ）のＹのような郵便番号行とＬ、Ｌ・・・のような
住所行が得られる。

【０１０９】次に、パック文字修正部４５の動作につい
て図３０を用いて説明する。図３０はパック文字修正部
４５の動作を示すフローチャートである。パック文字修
正部４５の分離パック文字抽出領域決定部４５０１は、
住所領域を基準とし、その住所領域からの相対的な位置
と大きさにより、分離パック文字抽出領域を設定する
（ステップ６０１）。分離パック文字検索部４５０２
は、文字、ノイズ等の中から分離パック文字抽出領域内
に存在するものを分離パック文字として抽出する（ステ
ップ６０２）。分離パック文字統合部４５０３は、各分
離パック文字について、近接する位置に住所行（副住所
行も含む）が存在する場合（ステップ６０３）、当該住
所行にその分離パック文字を統合する形で住所行を作成
し直す（ステップ６０４）。以上の動作（ステップ６０
３からステップ６０４）を分離パック文字検索部４５０
２で抽出された全ての分離パック文字の処理がされるま
で繰り返す（ステップ６０５）。例えば、基本文字行抽
出部３により図３１（ａ）のＬ、Ｌ・・・のような文字
行とＮ、Ｎ・・・のようなノイズが抽出され、住所領域
抽出部４２により図３１（ｂ）のＡのような住所領域が
得られている場合、ステップ６０１により図３１（ｃ）
のＥのような分離パック文字抽出領域が設定され、ステ
ップ６０２により図３２（ａ）のＲ、Ｒ・・・のような
分離パック文字が得られ、ステップ６０３からステップ
６０５により図３２（ｂ）のＬ、Ｌ・・・のような住所
行が得られる。

【０１１０】以上の第１文字行補正部４までの処理で、
多くの文字行抽出結果の補正が完了するが、図３３に示
すような全ての郵便番号文字が他の文字行に属した場合
には、補正を行なうことができない。このような場合、
第２文字行補正部５による文字行の補正を行なうと好適
である。

【０１１１】第２文字行補正部５の動作について図３４
を用いて説明する。図３４は第２文字行補正部５の動作
を示すフローチャートである。第２文字行補正部５の単
独文字抽出部５１は、基本文字行抽出部３による抽出結
果、または、第１文字行補正部４により補正された抽出
結果の中から、文字行に含まれず単独で存在する文字を
抽出する（ステップ７０１）。文字行開始位置文字抽出
部５２は、適切な長さと文字数を有する文字行から（ス
テップ７０２）、文字行開始位置に存在する文字を抽出
する（ステップ７０３）。そして、開始記号判定部５３
は、抽出された文字に対して〒記号や顔記号等の郵便番
号行の初めに書かれている文字との類似度を計算し（ス
テップ７０４）、その類似度が高かった文字から、開始
記号を生成する（ステップ７０５、ステップ７０６）。
以上の動作（ステップ７０５からステップ７０６）を抽
出された全ての文字について処理がされるまで繰り返す
（ステップ７０７）。さらに、郵便番号文字検索部５４
は、開始記号をきっかけに郵便番号行を抽出する（ステ
ップ７０８）。例えば、第２文字行補正部５により図１
４のＬ、Ｌ・・・のような文字行とＮ、Ｎ・・・のよう
なノイズが補正された抽出結果として得られている場
合、ステップ７０１により図１４のＮ、Ｎ・・・のよう
な矩形が単独文字として抽出される。また、第２文字行
補正部５により図３３のＬ、Ｌ・・・のような文字行が
補正された抽出結果として得られている場合、ステップ
７０１では文字が抽出されず、ステップ７０２からステ
ップ７０３により図３５（ａ）のＭ、Ｍ・・・のような
文字が得られ、ステップ７０４からステップ７０７によ
り図３５（ｂ）のＯ、Ｏ・・・のような開始記号が得ら
れる。

【０１１２】郵便番号文字検索部５４の動作について図
３６を用いて詳細に説明する。図３６は郵便番号文字検
索部５４の動作を示すフローチャートである。郵便番号
文字検索部５４の第１水平方向検索部５４０１は、開始
記号を起点に水平方向に５文字、または、７文字の郵便
番号文字を抽出する（ステップ８０１）。第２水平方向
検索部５４０２は、ステップ８０１において郵便番号文
字が抽出されなかった場合のみ（ステップ８０２）、開
始記号を起点にその下方から水平方向に５文字、また
は、７文字の郵便番号文字を抽出する（ステップ８０
３）。さらに、２段組検索部５４０３は、ステップ８０
３において郵便番号文字が抽出されなかった場合のみ
（ステップ８０４）、開始記号を起点に水平方向に３文
字分の郵便番号文字を抽出し、その下方から水平方向に
２文字、または、４文字の郵便番号文字を抽出する（ス
テップ８０５）。さらに、３段組検索部５４０４は、ス
テップ８０５において郵便番号文字が抽出されなかった
場合のみ（ステップ８０６）、開始記号を起点にその下
方から水平方向に３文字分の郵便番号文字を抽出し、そ
の下方から水平方向に２文字、または、４文字の郵便番
号文字を抽出する（ステップ８０７）。さらに、４段組
検索部５４０５は、ステップ８０７において郵便番号文
字が抽出されなかった場合のみ（ステップ８０８）、開
始記号を起点にその下方から水平方向に３文字分の郵便
番号文字を抽出し、その下方にハイフンを抽出し、さら
にその下方から水平方向に２文字、または、４文字の郵
便番号文字を抽出する（ステップ８０９）。そして、文
字行再構成部５４０６は、いずれかの検索により郵便番
号文字が抽出された場合のみ（ステップ８０２、ステッ
プ８０４、ステップ８０６、ステップ８０８、ステップ
８１０）、抽出された郵便番号文字から新たに郵便番号
行を生成し、それらの郵便番号文字が所属していた元の
文字行を修正する。以上の動作（ステップ８０１からス
テップ８１１）を生成された全ての開始記号について処
理がされるまで繰り返す（ステップ８１２）。

【０１１３】ここで、第１水平方向検索部５４０１の動
作について図３７を用いてさらに詳細に説明する。図３
７は第１水平方向検索部５４０１の動作を示すフローチ
ャートである。第１水平方向検索部５４０１は、開始記
号から右方向に１つの文字（１つの文字矩形情報であ
り、複数の文字が含まれている可能性あり）を検索する
（ステップ９０１）。仮文字切り出し部５４０７は、文
字が見つかった場合のみ（ステップ９０２）、その文字
に対して仮文字切り出しを行ない、仮文字矩形を生成す
る（ステップ９０３）。さらに、仮文字認識部５４０８
は、仮文字矩形に対し仮文字認識をする（ステップ９０
４）。第１水平方向検索部５４０１は、仮文字認識の結
果、郵便番号文字である可能性が高かった場合（ステッ
プ９０５）、郵便番号文字として保持し、その郵便番号
文字が７桁分揃うまで、以上の動作（ステップ９０１か
らステップ９０５）を繰り返す（ステップ９０６）。郵
便番号ＤＢ検索部５４０９は、郵便番号文字が７桁分揃
った場合（ステップ９０６）、データベースを検索し、
実在する７桁の郵便番号である場合のみ、それらの郵便
番号文字を保持し、実在しない場合には、それらの郵便
番号文字を破棄する（ステップ９０７）。また、郵便番
号文字が７桁分揃う以前に、開始記号から右方向に文字
が見つからなかった場合や（ステップ９０２）、仮文字
認識の結果、郵便番号文字である可能性が低かった場合
において（ステップ９０５）、既に保持している郵便番
号文字が５桁分揃っている場合にのみ（ステップ９０
８）、データベースを検索し、実在する５桁の郵便番号
である場合のみ、それらの郵便番号文字を保持し、実在
しない場合には、それらの郵便番号文字を破棄する（ス
テップ９０９）。一方、郵便番号文字が７桁分揃う以前
に、開始記号から右方向に文字が見つからなかった場合
や（ステップ９０２）、仮文字認識の結果、郵便番号文
字である可能性が低かった場合において（ステップ９０
５）、既に保持している郵便番号文字が５桁分揃ってい
なかった場合には、それらの郵便番号文字を破棄する
（ステップ９０８）。例えば、開始記号判定部５３によ
り図３５（ｂ）のＯのような開始記号が得られている場
合、ステップ９０１により図３８のＣＲのような文字が
得られ、ステップ９０３により射影分布等を利用し図３
９のＰ１、Ｐ２の位置で文字が切り出され、ステップ９
０４により「１０５」が認識され、さらに、ステップ９
０１からステップ９０６の繰り返しにより図４０のＥ
Ｒ、ＥＲ・・・のような文字切り出し結果と、「１０５
−１０００」という郵便番号が得られ、ステップ９０７
により郵便番号データベースが参照され、実在する郵便
番号であることの確認が行なわれる。

【０１１４】第２水平方向検索部５４０２、２段組検索
部５４０３、３段組検索部５４０４、４段組検索部５４
０５の動作については、ステップ９０１の開始記号から
の検索が、それぞれ、図１０（ｂ）、（ｃ）、（ｄ）、
（ｅ）の形状に合わせる形で行なわれるだけで、基本的
に第１水平方向検索部５４０１と同様である。

【０１１５】最後に、第３文字行補正部６の動作につい
て図４１を用いて説明する。図４１は第３文字行補正部
６の動作を示すフローチャートである。第３文字行補正
部６の文字矩形補正部６１は基本文字行抽出部３により
抽出された文字行、または、第１文字行補正部４により
補正された文字行、または、第２文字行補正部５により
補正された文字行の中から、文字行の幅、長さ、文字数
等から適切な文字行について（ステップ１００１）、当
該文字行の文字（１つの文字矩形情報であり、複数の文
字が含まれている可能性あり）を補正する。その際、仮
文字切り出し部６２と仮文字認識部６３は、当該文字行
について仮文字切り出しと仮文字認識を行ない、正確な
文字の区切り位置を見つけ、文字の補正に必要な情報を
文字矩形補正部６１に渡す（ステップ１００２）。さら
に、安定文字配置行選択部６４は、当該文字行中の行
頭、および、行末の数文字を除いた中央部の文字を選択
し（ステップ１００３）、選択した文字の配置の安定性
を調べる（ステップ１００４）。そして、外部文字候補
抽出部６５は、選択した文字の配置に安定性が有った場
合のみ（ステップ１００５）、当該文字行から外部文字
候補を抽出する（ステップ１００６）。以上の動作（ス
テップ１００２からステップ１００６）を第３文字行補
正部６の文字矩形補正部６１は基本文字行抽出部３によ
り抽出された文字行、または、第１文字行補正部４によ
り補正された文字行、または、第２文字行補正部５によ
り補正された文字行について処理がされるまで繰り返す
（１００１）。さらに、外部文字行検索部６６は、抽出
された外部文字候補を起点に、その外部文字候補が所属
する文字行と直交する方向に文字の検索を行ない、新規
文字行の抽出を試みる（ステップ１００７）。新規文字
行が抽出された場合のみ（ステップ１００８）、新規文
字行の中の文字が従来所属していた文字行を再構成する
（ステップ１００９）。そして、以上の動作（ステップ
１００７からステップ１００９）を抽出された全ての外
部文字候補について処理がされるまで繰り返す（１０１
０）。

【０１１６】安定文字配置行選択部６４の動作について
図４２を用いてさらに詳細に説明する。図４２は安定文
字配置行選択部６４の動作を示すフローチャートであ
る。安定文字配置行選択部６４の文字サイズ平均算出部
６４ａは、字行中の行頭、および、行末の数文字を除い
た中央部の、選択された文字について、その大きさの平
均値を算出する（ステップ１１０１）。また、文字中心
間距離算出部６４ｂは、選択された文字の中心位置の間
隔の平均値を算出する（ステップ１１０２）。さらに、
文字中心間分散算出部６４ｃは、選択された文字の中心
位置の間隔の分散値を算出する（ステップ１１０３）。
そして、安定文字配置行判別部６４ｄは、文字のサイズ
の平均値と中心間距離の平均値から比べ、文字の中心間
距離の分散値が十分小さいかにより、文字の配置の安定
度の有無を判別する（ステップ１１０４）。

【０１１７】次に、外部文字候補抽出部６５の動作につ
いて図４３を用いてさらに詳細に説明する。図４３は外
部文字候補抽出部６５の動作を示すフローチャートであ
る。外部文字候補抽出部６５の安定文字配置行再判定部
６５ａは、選択された文字の配置に安定性が有ると判別
された文字行について、文字行中で選択されていない開
始位置、または、終了位置の１文字も合わせて選択し
（ステップ１２０１）、安定文字配置行選択部６４を利
用し、再び文字の配置の安定度の有無を判別する（ステ
ップ１２０２）。そして、安定性が無いと判別された場
合のみ（ステップ１２０３）、ステップ１２０１におい
て選択された文字に追加した１文字を、新たに外部文字
候補として生成する（ステップ１２０４）。以上の動作
（ステップ１２０１からステップ１２０４）を選択され
た文字の配置に安定性が有ると判別された文字行につい
て処理がされるまで繰り返す（１２０５）。

【０１１８】例えば、第２文字行補正部５により図４４
のＬ１、Ｌ２、Ｌ３・・・のような文字行が補正された
抽出結果として得られ、さらに、文字行Ｌ１が図４５
（ａ）のＣＲ、ＣＲ・・・のような文字矩形で構成さ
れ、文字行Ｌ２が図４５（ｂ）のＣＲ、ＣＲ・・・のよ
うな文字矩形で構成され、文字行Ｌ３が図４５（ｃ）の
ＣＲ、ＣＲ・・・のような文字矩形で構成されている場
合、ステップ１００１からステップ１００２により文字
行Ｌ３のみ図４６（ａ）のＣＲ１、ＣＲ２・・・ＣＲ７
のような文字矩形が、図４６（ａ）のＰの位置で分割さ
れ、図４６（ｂ）のＣＲ１、ＣＲ２・・・ＣＲ８に示す
文字矩形に補正され、さらに、ステップ１００３により
文字行Ｌ１は図４７（ａ）のＳＣ０、ＳＣ０・・・のよ
うな文字矩形が選択され、文字行Ｌ２は図４７（ｂ）の
ＳＣ０、ＳＣ０・・・のような文字矩形が選択され、文
字行Ｌ３は図４７（ｃ）のＳＣ０、ＳＣ０・・・のよう
な文字矩形が選択され、ステップ１００４により文字行
Ｌ１は図４７（ａ）のＤ０、Ｄ０・・・のような文字の
中心位置の間隔から文字配置の安定性無しと判別され、
文字行Ｌ２は図４７（ｂ）のＤ０、Ｄ０・・・のような
文字の中心位置の間隔から文字配置の安定性有りと判別
され、文字行Ｌ３は図４７（ｃ）のＤ０、Ｄ０・・・の
ような文字の中心位置の間隔から文字配置の安定性有り
と判別される。そして、ステップ１００５により安定性
ありと判別された文字行Ｌ２とＬ３のみステップ１００
６が行なわれ、ステップ１００６により文字行Ｌ２は図
４８（ａ）のＳＣ１のような安定性の判別に使用されな
かった文字矩形を新たに１文字加え、図４８（ａ）のＤ
１、Ｄ０、Ｄ０・・・のような文字の中心位置の間隔か
ら、文字配置の安定性有りと判別され、外部文字候補は
生成されない。また、文字行Ｌ３は図４８（ｂ）のＳＣ
１のような安定性の判別に使用されなかった文字矩形を
新たに１文字加え、図４８（ｂ）のＤ１、Ｄ０、Ｄ０・
・・のような文字の中心位置の間隔から、文字配置の安
定性無しと判別され、図４９（ｃ）のＥＣのような外部
文字候補が生成される。そして、ステップ１００７によ
り図５０のＣＲ、ＣＲ・・・のような文字矩形が抽出さ
れ、ステップ１００８からステップ１００９により図５
１のＬ、Ｌ・・・のような文字行が抽出される。

【０１１９】ところで、以上の実施形態では、名刺から
文字を抽出する場合を例に挙げており、文字行、文字、
ノイズ等の接続のパラメータや抽出領域設定時の住所領
域からの相対位置等の、任意に設定できる変数の値等は
慣用されている名刺の大きさやレイアウト等から経験
的、または実験的に定めることができる。そして、この
各種の変数の値は文字行を抽出する対象が変わることに
よって、異なる値を採用できることは言うまでもない。

【０１２０】

【発明の効果】以上のように、まず、本願発明に係る文
字行抽出方法および装置では、画像データから公知の技
術により文字行が生成された後、再構成起点領域が抽出
され、抽出された再構成起点領域の上端からさらに上の
部分に、再構成起点領域と直交する方向の郵便番号行が
存在する可能性がある遊離副方向郵便番号行抽出領域を
設定し、その領域内に存在する文字行、文字、ノイズを
抽出する。そして、それらを相互の位置関係や接続時の
形状等を考慮しつつ接続を行い、郵便番号行を抽出す
る。このようにして、従来の方法では抽出が困難であっ
た、文字行の上端からさらに上の部分に存在し、その文
字行と直交する行方向の郵便番号等の文字行を、従来の
方法での文字行抽出結果を補正することで、正確にかつ
効率よく文字行を抽出することができ、文字認識率の向
上を図ることができる。

【０１２１】そして、本願発明に係る文字行抽出方法お
よび装置では、画像データから公知の技術により文字行
が生成された後、再構成起点領域が抽出され、抽出され
た再構成起点領域の上端付近に、再構成起点領域と直交
する方向の郵便番号行が存在する可能性がある包含副方
向郵便番号行抽出領域を設定し、その領域内に存在する
文字行、文字、ノイズを抽出する。そして、それらを相
互の位置関係や接続時の形状等を考慮しつつ接続を行
い、郵便番号行を抽出する。このようにして、従来の方
法では抽出が困難であった、文字行の上端付近に存在
し、その文字行と直交する行方向の郵便番号等の文字行
を、従来の方法での文字行抽出結果を補正することで、
正確にかつ効率よく文字行を抽出することができ、文字
認識率の向上を図ることができる。

【０１２２】また、本願発明に係る文字行抽出方法およ
び装置では、画像データから公知の技術により文字行が
生成された後、再構成起点領域が抽出され、抽出された
再構成起点領域の上端から１文字から数文字分下の付近
に、再構成起点領域中の文字行に含まれるべき郵便番号
の一部が取りこぼされている可能性がある分離パック文
字抽出領域を設定し、その領域内に存在する文字、ノイ
ズを抽出する。そして、それらを再構成起点領域中の文
字行との相互の位置関係や接続時の形状等を考慮しつつ
接続を行い、再構成起点領域中の文字行と統合する。こ
のようにして、従来の方法では抽出が困難であった、行
方向と直交する方向に複数の郵便番号等の文字を並べ、
１つの文字と同様な形で、埋め込まれた部分を持つ文字
行を、従来の方法での文字行抽出結果を補正すること
で、正確にかつ効率よく文字行を抽出することができ、
文字認識率の向上を図ることができる。

【０１２３】上記３つの文字行抽出方法において、それ
ぞれの文字行を補正する方法を、従来の文字行抽出方法
または装置の失敗傾向に合わせて、あるいは、対象とす
る画像に合わせて、自由に組み合わせて使用することが
可能である。

【０１２４】また、上記文字行抽出方法および装置にお
いて、対象とする画像データが、住所、電話番号、ＦＡ
Ｘ番号等が書かれた住所行と、郵便番号行が、比較的ま
とまった領域に書かれているものである場合、その全て
の住所行を囲む外接矩形を住所領域とし、再構成起点領
域の代替領域として用いると、より正確な文字行の抽出
が可能となり、効率も上がることとなる。

【０１２５】そして、本願発明に係る文字行抽出方法お
よび装置では、画像データから公知の技術により文字行
が生成された後、その文字行の形状や文字数により住所
行の可能性があると思われるもの選択し、それらが、最
も多く所属する画像データを４分割した領域を住所区画
とし、選択した住所区画内の当該文字行を住所行とし、
住所行の外接矩形を求めることで住所領域を抽出する。

【０１２６】また、住所行の外接矩形を求める前に、住
所行との間隔が小さく、かつ、住所行の行頭から行末間
にほぼ収まっている文字行を、副住所行として抽出し、
住所行と副住所行の外接矩形を住所領域とすることで、
住所領域の精度を増すことができる。

【０１２７】このように、例えば名刺等の、住所行と、
郵便番号行が、比較的まとまった領域に書かれている画
像データに対しては、さらに正確な文字行の抽出が可能
となり、効率も上がることとなる。

【０１２８】また、本願発明に係る文字行抽出方法およ
び装置では、画像データから公知の技術により文字行が
生成された後、その抽出された文字行に属さず単独の１
文字で存在する文字と、抽出された文字行の行開始位置
に存在する文字について、〒記号や顔記号等との類似度
を計算し、類似度の高いものを開始記号として抽出す
る。そして、抽出された開始記号を起点とし、改めて郵
便番号行を抽出する。このようにして、従来の方法では
抽出が困難であった、郵便番号行を、従来の方法での文
字行抽出結果を補正することで、正確にかつ効率よく文
字行を抽出することができ、文字認識率の向上を図るこ
とができる。

【０１２９】さらに、上記文字行抽出方法および装置に
おいて、開始記号を起点とし、改めて郵便番号行を抽出
する際に、仮文字切り出し、および、仮文字認識を行な
い、郵便番号文字が０から９までのいずれかの数字との
類似度が十分高いことを確認し、郵便番号行を抽出する
と、より正確な文字行の抽出が可能となり、効率も上が
ることとなる。

【０１３０】そして、上記文字行抽出方法および装置に
おいて、郵便番号を文字認識し、その認識結果が郵便番
号データベースに存在することを確認し、郵便番号行を
抽出すると、さらに、より正確な文字行の抽出が可能と
なり、効率も上がることとなる。

【０１３１】また、本願発明に係る文字行抽出方法およ
び装置では、画像データから公知の技術により文字行が
生成された後、抽出された各文字行の行頭、および、行
末の数文字を除いた中央部の文字の配置について、それ
らの文字の大きさの平均値や、文字の中心位置の間隔の
平均値、分散値を基に、中央部の文字配置の安定性を判
別する。そして、安定性が有ると判別された文字行につ
いて、さらに、安定性の判別に使用しなかった文字行の
行頭、または、行末の１文字を加えた文字について、文
字配置の安定性を再び判別し、安定性が損なわれると判
別された際に加えていた１文字を、外部文字候補として
抽出する。そして、その外部文字候補を起点とし、その
外部文字候補が所属していた文字行と直交する方向に、
改めて文字行を抽出する。このようにして、従来の方法
では抽出が困難であった、他の文字行中に埋もれ、か
つ、その文字行と直交する行方向を持つ文字行を、従来
の方法での文字行抽出結果を補正することで、正確にか
つ効率よく文字行を抽出することができ、文字認識率の
向上を図ることができる。

【０１３２】そして、上記文字行抽出方法および装置に
おいて、抽出された各文字行の行頭、および、行末の数
文字を除いた中央部の文字の配置について、安定性を判
別する前に、抽出された各文字行に対して、仮文字切り
出し、仮文字認識を行ない、その文字行を構成する文字
矩形を補正すると、より正確な文字行の抽出が可能とな
り、効率も上がることとなる。

【図面の簡単な説明】

【図１】本発明の文字行抽出方法を用いた文字認識装置
の一例を示すブロック図

【図２】第１文字行補正部の構成を示すブロック図

【図３】遊離副方向郵便番号行抽出部の構成を示すブロ
ック図

【図４】包含副方向郵便番号行抽出部の構成を示すブロ
ック図

【図５】パック文字修正部の構成を示すブロック図

【図６】パック文字の一例を示す図

【図７】住所領域抽出部の構成を示すブロック図

【図８】第２文字行補正部の構成を示すブロック図

【図９】郵便番号文字検索部の構成を示すブロック図

【図１０】（ａ）は第１水平方向検索部が抽出対象とす
る郵便番号の一例を示す図（ｂ）は第２水平方向検索部が抽出対象とする郵便番号
の一例を示す図（ｃ）は２段組検索部が抽出対象とする郵便番号の一例
を示す図（ｄ）は３段組検索部が抽出対象とする郵便番号の一例
を示す図（ｅ）は４段組検索部が抽出対象とする郵便番号の一例
を示す図

【図１１】第３文字行補正部の構成を示すブロック図

【図１２】文字行抽出部の処理を示すフローチャート

【図１３】画像入力部から入力される画像データの一例
を示す図

【図１４】画像データから基本文字行を抽出したところ
を示す図

【図１５】第１文字行補正部の処理を示すフローチャー
ト

【図１６】住所領域抽出部の処理を示すフローチャート

【図１７】区画分割部にて、画像データを４つの住所候
補区画に分割したところを示す図

【図１８】住所区画抽出部における住所候補行の中心位
置と住所候補区画の関係の一例を示す図

【図１９】右９０°回転した画像データに対して、住所
区画抽出部における住所候補行の中心位置と住所候補区
画の関係の一例を示す図

【図２０】右１８０°回転した画像データに対して、住
所区画抽出部における住所候補行の中心位置と住所候補
区画の関係の一例を示す図

【図２１】右２７０°回転した画像データに対して、住
所区画抽出部における住所候補行の中心位置と住所候補
区画の関係の一例を示す図

【図２２】住所行抽出部において、住所行を抽出したと
ころを示す図

【図２３】副住所行抽出部において、副住所行を抽出し
たところを示す図

【図２４】住所領域抽出部において、住所領域を抽出し
たところを示す図

【図２５】遊離副方向郵便番号行抽出部の処理を示すフ
ローチャート

【図２６】（ａ）は遊離副方向郵便番号行抽出領域の例
を示す図（ｂ）は郵便番号文字候補の例を示す図（ｃ）は郵便番号行の例を示す図

【図２７】包含副方向郵便番号行抽出部の処理を示すフ
ローチャート

【図２８】（ａ）は文字行およびノイズの例を示す図（ｂ）は住所領域の例を示す図（ｃ）は包含副方向郵便番号行抽出領域の例を示す図

【図２９】（ａ）は郵便番号文字候補の例を示す図（ｂ）は郵便番号行と住所行の例を示す図

【図３０】パック文字修正部の処理を示すフローチャー
ト

【図３１】（ａ）は文字行およびノイズの例を示す図（ｂ）は住所領域の例を示す図（ｃ）は分離パック文字抽出領域の例を示す図

【図３２】（ａ）は分離パック文字の例を示す図（ｂ）は住所行の例を示す図

【図３３】第１文字行補正部において、文字行が補正で
きない一例を示す図

【図３４】第２文字行補正部の処理を示すフローチャー
ト

【図３５】（ａ）は文字行開始位置文字抽出部におい
て、文字を抽出したところを示す図（ｂ）は開始記号判定部において、開始記号を抽出した
ところを示す図

【図３６】郵便番号文字検索部の処理を示すフローチャ
ート

【図３７】第１水平方向検索部の処理を示すフローチャ
ート

【図３８】第１水平方向検索部において、文字矩形を抽
出したところを示す図

【図３９】仮文字切り出し部および仮文字認識部におい
て、文字の切り出し位置を決定したところを示す図

【図４０】第１水平方向検索部において、郵便番号を抽
出したところを示す図

【図４１】第３文字行補正部の処理を示すフローチャー
ト

【図４２】安定文字配置行選択部の処理を示すフローチ
ャート

【図４３】外部文字候補抽出部の処理を示すフローチャ
ート

【図４４】第２文字行補正部において、文字行が補正で
きない一例を示す図

【図４５】（ａ）は図４４の文字行Ｌ１を構成する文字
矩形を示す図（ｂ）は図４４の文字行Ｌ２を構成する文字矩形を示す
図（ｃ）は図４４の文字行Ｌ３を構成する文字矩形を示す
図

【図４６】（ａ）は図４４の文字行Ｌ３を構成する文字
矩形と射影分布を示す図（ｂ）は文字矩形補正部において、文字矩形を補正した
ところを示す図

【図４７】（ａ）は安定文字配置行選択部において、図
４４の文字行Ｌ１の処理過程で中央部の文字を選択した
ところと、その文字の中心位置の距離を示す図（ｂ）は図４４の文字行Ｌ２の処理過程で中央部の文字
を選択したところと、その文字の中心位置の距離を示す
図（ｃ）は図４４の文字行Ｌ３の処理過程で中央部の文字
を選択したところと、その文字の中心位置の距離を示す
図

【図４８】（ａ）は安定文字配置行再判別部において、
図４４の文字行Ｌ２の処理過程で新規に文字を選択した
ところと、文字の中心位置の距離を示す図（ｂ）は図４４の文字行Ｌ３の処理過程で新規に文字を
選択したところと、文字の中心位置の距離を示す図

【図４９】（ａ）は外部文字候補生成部において、図４
４の文字行Ｌ１の中の外部文字候補を生成したところを
示す図（ｂ）は図４４の文字行Ｌ２の中の外部文字候補を生成
したところを示す図（ｃ）は図４４の文字行Ｌ３の中の外部文字候補を生成
したところを示す図

【図５０】外部文字行検索部において、文字矩形を抽出
したところを示す図

【図５１】外部文字行検索部において、文字行を補正し
たところを示す図

【符号の説明】

１画像入力部２文字行抽出部３基本文字行抽出部４第１文字行補正部５第２文字行補正部６第３文字行補正部７文字認識部４１再構成起点領域選択部４２住所領域抽出部４３遊離副方向郵便番号行抽出部４４包含副方向郵便番号行抽出部４５パック文字修正部５１単独文字抽出部５２文字行開始位置文字抽出部５３開始記号判定部５４郵便番号文字検索部６１文字矩形補正部６２仮文字切り出し部６３仮文字認識部６４安定文字配置行選択部６４ａ文字サイズ平均算出部６４ｂ文字中心間距離算出部６４ｃ文字中心間分散算出部６４ｄ安定文字配置行判別部６５外部文字候補抽出部６５ａ安定文字配置行再判別部６５ｂ外部文字候補生成部６６外部文字行検索部４２０１住所候補行抽出部４２０２住所区画抽出部４２０２ａ区画分割部４２０２ｂ所属行計数部４２０２ｃ住所区画決定部４２０３住所行抽出部４２０４副住所行抽出部４２０５住所領域生成部４３０１遊離副方向郵便番号行抽出領域決定部４３０２郵便番号文字候補検索部４３０３遊離副方向郵便番号行作成部４４０１包含副方向郵便番号行抽出領域決定部４４０２郵便番号文字候補検索部４４０３包含副方向郵便番号行作成部４４０４文字行再構成部４５０１分離パック文字抽出領域決定部４５０２分離パック文字検索部４５０３分離パック文字統合部５４０１第１水平方向検索部５４０２第２水平方向検索部５４０３２段組検索部５４０４３段組検索部５４０５４段組検索部５４０６文字行再構成部５４０７仮文字切り出し部５４０８仮文字認識部５４０７郵便番号ＤＢ検索部

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開昭62−87397（ＪＰ，Ａ) 特開平10−175385（ＪＰ，Ａ) 特開平10−31716（ＪＰ，Ａ) 実開昭63−31471（ＪＰ，Ｕ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/00 - 9/82 B42D 15/02

Claims

(57)【特許請求の範囲】

【請求項１】文字行抽出ステップと、再構成起点領域選
択ステップと、遊離副方向郵便番号文字抽出ステップ
と、遊離副方向郵便番号行生成ステップにより構成され
る文字行抽出方法であって、文字行抽出ステップが、処理対象の画像データから文字
行を抽出するステップであり、再構成起点領域選択ステップが、抽出された文字行か
ら、適切な大きさと文字数で構成されるものを再構成起
点領域として選択するステップであり、遊離副方向郵便番号文字抽出ステップが、選択された再構成起点領域の上端からさらに上の部分
に、再構成起点領域と直交する方向の郵便番号行が存在
する可能性がある領域を、遊離副方向郵便番号行抽出領
域として、当該再構成起点領域との相対的な位置、およ
び、相対的な大きさにより生成する遊離副方向郵便番号
行抽出領域生成ステップと、生成された遊離副方向郵便番号行抽出領域内に存在す
る、文字行、文字、ノイズを、遊離副方向郵便番号文字
候補として抽出する郵便番号文字候補抽出ステップとか
らなり、遊離副方向郵便番号行生成ステップが、抽出された遊離
副方向郵便番号文字候補の位置関係から、郵便番号行を
生成するステップである文字行抽出方法。
【請求項２】文字行抽出ステップと、再構成起点領域選
択ステップと、包含副方向郵便番号文字抽出ステップ
と、包含副方向郵便番号行生成ステップにより構成され
る文字行抽出方法であって、文字行抽出ステップと、再構成起点領域選択ステップ
が、請求項１記載の文字行抽出ステップと、再構成起点領域
選択ステップと同様のステップであり、包含副方向郵便番号文字抽出ステップが、選択された再
構成起点領域の上端付近に、再構成起点領域と直交する
方向の郵便番号行が存在する可能性がある領域を、包含
副方向郵便番号行抽出領域として、当該再構成起点領域
との相対的な位置、および、相対的な大きさにより生成
する包含副方向郵便番号行抽出領域生成ステップと、生成された包含副方向郵便番号行抽出領域内に存在す
る、文字行、文字、ノイズを、包含副方向郵便番号文字
候補として抽出する郵便番号文字候補抽出ステップとか
らなり、包含副方向郵便番号行生成ステップが、抽出された包含
副方向郵便番号文字候補と、再構成起点領域の上端付近
の文字の位置関係から、郵便番号行を生成し、再構成起
点領域中の文字行を再生成するステップである文字行抽
出方法。
【請求項３】文字行抽出ステップと、再構成起点領域選
択ステップと、分離パック文字抽出ステップと、分離パ
ック文字統合ステップにより構成される文字行抽出方法
であって、文字行抽出ステップと、再構成起点領域選択ステップ
が、請求項１記載の文字行抽出ステップと、再構成起点
領域選択ステップと同様のステップであり、分離パック文字抽出ステップが、選択された再構成起点
領域の上端から１文字から数文字分下の付近に、再構成
起点領域中の文字行に含まれるべき郵便番号の一部が取
りこぼされている可能性がある領域を、分離パック文字
抽出領域として、当該再構成起点領域との相対的な位
置、および、相対的な大きさにより生成する分離パック
文字抽出領域生成ステップと、生成された分離パック文字抽出領域内に存在する、文
字、ノイズを、分離パック文字候補として抽出する分離
パック文字候補抽出ステップとからなり、分離パック文字統合ステップが、抽出された分離パック
文字候補と、再構成起点領域中の文字行の位置関係か
ら、当該分離パック文字候補を再構成起点領域中の文字
行に統合するステップである文字行抽出方法。
【請求項４】前記遊離副方向郵便番号行生成ステップ以
後に、包含副方向郵便番号文字抽出ステップと、包含副方向郵
便番号行生成ステップとを有し、包含副方向郵便番号文字抽出ステップが、選択された再
構成起点領域の上端付近に、再構成起点領域と直交する
方向の郵便番号行が存在する可能性がある領域を、包含
副方向郵便番号行抽出領域として、当該再構成起点領域
との相対的な位置、および、相対的な大きさにより生成
する包含副方向郵便番号行抽出領域生成ステップと、生成された包含副方向郵便番号行抽出領域内に存在す
る、文字行、文字、ノイズを、包含副方向郵便番号文字
候補として抽出する郵便番号文字候補抽出ステップとか
らなり、包含副方向郵便番号行生成ステップが、抽出された包含
副方向郵便番号文字候補と、再構成起点領域の上端付近
の文字の位置関係から、郵便番号行を生成し、再構成起
点領域中の文字行を再生成するステップである請求項１
記載の文字行抽出方法。
【請求項５】前記包含副方向郵便番号行生成ステップ以
後に、分離パック文字抽出ステップと、分離パック文字統合ス
テップとを有し、分離パック文字抽出ステップが、選択された再構成起点
領域の上端から１文字から数文字分下の付近に、再構成
起点領域中の文字行に含まれるべき郵便番号の一部が取
りこぼされている可能性がある領域を、分離パック文字
抽出領域として、当該再構成起点領域との相対的な位
置、および、相対的な大きさにより生成する分離パック
文字抽出領域生成ステップと、生成された分離パック文字抽出領域内に存在する、文
字、ノイズを、分離パック文字候補として抽出する分離
パック文字候補抽出ステップとからなり、分離パック文字統合ステップが、抽出された分離パック
文字候補と、再構成起点領域中の文字行の位置関係か
ら、当該分離パック文字候補を再構成起点領域中の文字
行に統合するステップである請求項２又は４記載の文字
行抽出方法。
【請求項６】再構成起点領域選択ステップが、抽出された文字行から、住所、電話番号、ＦＡＸ番号等
が書かれた住所行を抽出し、当該全ての住所行を囲む外
接矩形を住所領域とし、再構成起点領域の代替領域とし
て抽出する住所領域抽出ステップである、請求項１から５いずれかに記載の文字行抽出方法。
【請求項７】前記住所領域抽出ステップが、住所候補行抽出ステップと、住所区画抽出ステップと、
住所行抽出ステップと、住所領域生成ステップにより構
成され、住所候補行抽出ステップが、抽出された文字行から、当該文字行の形状が住所行に近
い幅と長さを持つものを、住所候補行として抽出するス
テップであり、住所区画抽出ステップが、処理対象の画像データ自体を２×２の４つの住所候補区
画に分割する住所候補区画生成ステップと、各住所候補行の中心位置から、その住所候補行が所属す
る住所候補区画を判定し、各住所候補区画毎に当該住所
候補行の数を計数する所属行計数ステップと、最も多くの住所候補行が所属する住所候補区画を住所区
画とする所属行数比較ステップとからなり、住所行抽出ステップが、抽出された住所候補行から、所属行計数ステップにおい
て、抽出された住所区画に所属すると判定された当該住
所候補行を、住所行として抽出するステップであり、住所領域生成ステップが、抽出された住所行の外接矩形を、住所領域として生成す
るステップである請求項６記載の文字行抽出方法。
【請求項８】前記住所領域抽出ステップにおける住所領
域生成ステップ以前に、抽出された住所行を除いた文字行から、住所行と平行
で、かつ、住所行の文字と同程度の文字で構成され、か
つ、住所行との間隔が小さく、かつ、住所行の行頭から
行末間にほぼ収まっている文字行を、副住所行として抽
出するステップを有し、住所領域抽出ステップにおける住所領域生成ステップ
が、抽出された住所行、および、副住所行の外接矩形を、住
所領域として生成するステップである請求項７記載の文
字行抽出方法。
【請求項９】文字行抽出ステップと、単独文字抽出ステ
ップと、文字行開始位置文字抽出ステップと、開始記号
判定ステップと、郵便番号文字検索ステップにより構成
される文字行抽出方法であって、文字行抽出ステップが、処理対象の画像データから文字行を抽出するステップで
あり、単独文字抽出ステップが、文字行に属さず単独の１文字で存在すると判定された文
字を抽出するステップであり、文字行開始位置文字抽出ステップが、抽出された各文字行の行開始位置に存在する文字を抽出
するステップであり、開始記号判定ステップが、単独文字抽出ステップ、および、文字行開始位置文字抽
出ステップによって抽出された文字と、〒記号や顔記号
等との類似度を計算し、類似度の高いものを開始記号と
して抽出するステップであり、郵便番号文字検索ステップが、抽出された開始記号から、水平方向に５文字、または、
７文字の郵便番号文字を抽出する第１水平方向検索ステ
ップと、抽出された開始記号から、その下方から水平方向に５文
字、または、７文字の郵便番号文字を抽出する第２水平
方向検索ステップと、抽出された開始記号から、水平方向に３文字分の郵便番
号文字を抽出し、その下方から水平方向に２文字、また
は、４文字の郵便番号文字を抽出する２段組検索ステッ
プと、抽出された開始記号から、その下方から水平方向に３文
字分の郵便番号文字を抽出し、その下方から水平方向に
２文字、または、４文字の郵便番号文字を抽出する３段
組検索ステップと、抽出された開始記号から、その下方から水平方向に３文
字分の郵便番号文字を抽出し、その下方にハイフンを抽
出し、さらにその下方から水平方向に２文字、または、
４文字の郵便番号文字を抽出する４段組検索ステップ
と、抽出された郵便番号文字から、郵便番号行を生成する文
字行再構成ステップを有する文字行抽出方法。
【請求項１０】第１水平方向検索ステップ、第２水平方
向検索ステップ、２段組検索ステップ、３段組検索ステ
ップ、４段組検索ステップにおいて、郵便番号文字を抽出する際に、仮文字切り出し、およ
び、仮文字認識を行ない、郵便番号文字が０から９まで
のいずれかの数字との類似度が十分高いことを確認する
ステップを有する請求項９記載の文字行抽出方法。
【請求項１１】文字行再構成ステップ以前に、抽出された郵便番号文字に対して文字認識を行ない、そ
の認識結果が郵便番号データベースに存在する場合の
み、文字行再構成ステップを実行するステップを有する
請求項９又は１０記載の文字行抽出方法。
【請求項１２】文字行抽出ステップと、安定文字配置行
選択ステップと、外部文字候補抽出ステップと、外部文
字行検索ステップにより構成される文字行抽出方法であ
って、文字行抽出ステップが、処理対象の画像データから文字行を抽出するステップで
あり、安定文字配置行選択ステップが、抽出された各文字行の行頭、および、行末の数文字を除
いた中央部の文字について、当該文字の中心位置の間隔
の平均値を算出する文字中心間距離算出ステップと、当該文字の中心位置の間隔の分散値を算出する文字中心
間分散算出ステップと、当該文字の文字矩形サイズの平
均値を算出する文字サイズ平均算出ステップと、算出さ
れた値から文字配置の安定性の有無を判別し、安定性が
有る文字行を安定文字配置行として選択する安定文字配
置行判別ステップとからなり、外部文字候補抽出ステップが、抽出された安定文字配置行について、文字中心間距離算
出ステップと、文字中心間分散算出ステップと、文字サ
イズ平均算出ステップにおいて、各値の算出に使用され
なかった行頭、および、行末の数文字について、当該文
字を加えて文字配置の安定性の有無を再び判別する安定
文字配置行再判別ステップと、安定性が無くなると判別された場合に、当該文字から外
部文字候補を生成する外部文字候補生成ステップとから
なり、外部文字行検索ステップが、抽出された外部文字候補から、外部文字候補が所属して
いた文字行と直行する方向に文字を抽出する直行方向検
索ステップと、抽出された文字から、新規文字行を生成する文字行再生
成ステップを有する文字行抽出方法。
【請求項１３】安定文字配置行選択ステップ以前に、文字行抽出ステップにおいて抽出された文字行に対し
て、仮文字切り出し、仮文字認識を行ない、当該文字行
を構成する文字矩形を補正するステップを有する請求項
１２記載の文字行抽出方法。
【請求項１４】文字行抽出手段と、再構成起点領域選択
手段と、遊離副方向郵便番号文字抽出手段と、遊離副方
向郵便番号行生成手段により構成される文字行抽出装置
であって、文字行抽出手段が、処理対象の画像データから文字行を抽出する手段であ
り、再構成起点領域選択手段が、抽出された文字行から、適切な大きさと文字数で構成さ
れるものを再構成起点領域として選択する手段であり、遊離副方向郵便番号文字抽出手段が、選択された再構成起点領域の上端からさらに上の部分
に、再構成起点領域と直交する方向の郵便番号行が存在
する可能性がある領域を、遊離副方向郵便番号行抽出領
域として、当該再構成起点領域との相対的な位置、およ
び、相対的な大きさにより生成する遊離副方向郵便番号
行抽出領域生成手段と、生成された遊離副方向郵便番号行抽出領域内に存在す
る、文字行、文字、ノイズを、遊離副方向郵便番号文字
候補として抽出する郵便番号文字候補抽出手段とからな
り、遊離副方向郵便番号行生成手段が、抽出された遊離副方向郵便番号文字候補の位置関係か
ら、郵便番号行を生成する手段である文字行抽出装置。
【請求項１５】文字行抽出手段と、再構成起点領域選択
手段と、包含副方向郵便番号文字抽出手段と、包含副方
向郵便番号行生成手段により構成される文字行抽出装置
であって、文字行抽出手段と、再構成起点領域選択手段が、請求項１４記載の文字行抽出手段と、再構成起点領域選
択手段と同様の手段であり、包含副方向郵便番号文字抽出手段が、選択された再構成起点領域の上端付近に、再構成起点領
域と直交する方向の郵便番号行が存在する可能性がある
領域を、包含副方向郵便番号行抽出領域として、当該再
構成起点領域との相対的な位置、および、相対的な大き
さにより生成する包含副方向郵便番号行抽出領域生成手
段と、生成された包含副方向郵便番号行抽出領域内に存在す
る、文字行、文字、ノイズを、包含副方向郵便番号文字
候補として抽出する郵便番号文字候補抽出手段とからな
り、包含副方向郵便番号行生成手段が、抽出された包含副方向郵便番号文字候補と、再構成起点
領域の上端付近の文字の位置関係から、郵便番号行を生
成し、再構成起点領域中の文字行を再生成する手段であ
る文字行抽出装置。
【請求項１６】文字行抽出手段と、再構成起点領域選択
手段と、分離パック文字抽出手段と、分離パック文字統
合手段により構成される文字行抽出装置であって、文字行抽出手段と、再構成起点領域選択手段が、請求項１４記載の文字行抽出手段と、再構成起点領域選
択手段と同様の手段であり、分離パック文字抽出手段が、選択された再構成起点領域の上端から１文字から数文字
分下の付近に、再構成起点領域中の文字行に含まれるべ
き郵便番号の一部が取りこぼされている可能性がある領
域を、分離パック文字抽出領域として、当該再構成起点
領域との相対的な位置、および、相対的な大きさにより
生成する分離パック文字抽出領域生成手段と、生成された分離パック文字抽出領域内に存在する、文
字、ノイズを、分離パック文字候補として抽出する分離
パック文字候補抽出手段とからなり、分離パック文字統合手段が、抽出された分離パック文字候補と、再構成起点領域中の
文字行の位置関係から、当該分離パック文字候補を再構
成起点領域中の文字行に統合する手段である文字行抽出
装置。
【請求項１７】遊離副方向郵便番号行生成手段以後に、包含副方向郵便番号文字抽出手段と、包含副方向郵便番
号行生成手段とを有し、包含副方向郵便番号文字抽出手
段が、選択された再構成起点領域の上端付近に、再構成起点領
域と直交する方向の郵便番号行が存在する可能性がある
領域を、包含副方向郵便番号行抽出領域として、当該再
構成起点領域との相対的な位置、および、相対的な大き
さにより生成する包含副方向郵便番号行抽出領域生成手
段と、生成された包含副方向郵便番号行抽出領域内に存在す
る、文字行、文字、ノイズを、包含副方向郵便番号文字
候補として抽出する郵便番号文字候補抽出手段とからな
り、包含副方向郵便番号行生成手段が、抽出された包含副方向郵便番号文字候補と、再構成起点
領域の上端付近の文字の位置関係から、郵便番号行を生
成し、再構成起点領域中の文字行を再生成する手段であ
る請求項１４記載の文字行抽出装置。
【請求項１８】包含副方向郵便番号行生成手段以後に、分離パック文字抽出手段と、分離パック文字統合手段と
を有し、分離パック文字抽出手段が、選択された再構成起点領域の上端から１文字から数文字
分下の付近に、再構成起点領域中の文字行に含まれるべ
き郵便番号の一部が取りこぼされている可能性がある領
域を、分離パック文字抽出領域として、当該再構成起点
領域との相対的な位置、および、相対的な大きさにより
生成する分離パック文字抽出領域生成手段と、生成された分離パック文字抽出領域内に存在する、文
字、ノイズを、分離パック文字候補として抽出する分離
パック文字候補抽出手段とからなり、分離パック文字統合手段が、抽出された分離パック文字候補と、再構成起点領域中の
文字行の位置関係から、当該分離パック文字候補を再構
成起点領域中の文字行に統合する手段である請求項１５
又は１７記載の文字行抽出装置。
【請求項１９】再構成起点領域選択手段が、抽出された文字行から、住所、電話番号、ＦＡＸ番号等
が書かれた住所行を抽出し、当該全ての住所行を囲む外
接矩形を住所領域とし、再構成起点領域の代替領域とし
て抽出する住所領域抽出手段である請求項１４から１８
いずれかに記載の文字行抽出装置。
【請求項２０】住所領域抽出手段が、住所候補行抽出手段と、住所区画抽出手段と、住所行抽
出手段と、住所領域生成手段により構成され、住所候補行抽出手段が、抽出された文字行から、当該文字行の形状が住所行に近
い幅と長さを持つものを、住所候補行として抽出する手
段であり、住所区画抽出手段が、処理対象の画像データ自体を２×２の４つの住所候補区
画に分割する住所候補区画生成手段と、各住所候補行の中心位置から、その住所候補行が所属す
る住所候補区画を判定し、各住所候補区画毎に当該住所
候補行の数を計数する所属行計数手段と、最も多くの住所候補行が所属する住所候補区画を住所区
画とする所属行数比較手段とからなり、住所行抽出手段が、抽出された住所候補行から、所属行計数手段において、
抽出された住所区画に所属すると判定された当該住所候
補行を、住所行として抽出する手段であり、住所領域生成手段が、抽出された住所行の外接矩形を、住所領域として生成す
る手段である請求項１９記載の文字行抽出装置。
【請求項２１】住所領域抽出手段における住所領域生成
手段以前に、抽出された住所行を除いた文字行から、住所行と平行
で、かつ、住所行の文字と同程度の文字で構成され、か
つ、住所行との間隔が小さく、かつ、住所行の行頭から
行末間にほぼ収まっている文字行を、副住所行として抽
出する手段を有し、住所領域抽出手段における住所領域
生成手段が、抽出された住所行、および、副住所行の外接矩形を、住
所領域として生成する手段である請求項２０記載の文字
行抽出装置。
【請求項２２】文字行抽出手段と、単独文字抽出手段
と、文字行開始位置文字抽出手段と、開始記号判定手段
と、郵便番号文字検索手段により構成される文字行抽出
装置であって、文字行抽出手段が、処理対象の画像データから文字行を抽出する手段であ
り、単独文字抽出手段が、文字行に属さず単独の１文字で存在すると判定された文
字を抽出する手段であり、文字行開始位置文字抽出手段が、抽出された各文字行の行開始位置に存在する文字を抽出
する手段であり、開始記号判定手段が、単独文字抽出手段、および、文字行開始位置文字抽出手
段によって抽出された文字と、〒記号や顔記号等との類
似度を計算し、類似度の高いものを開始記号として抽出
する手段であり、郵便番号文字検索手段が、抽出された開始記号から、水平方向に５文字、または、
７文字の郵便番号文字を抽出する第１水平方向検索手段
と、抽出された開始記号から、その下方から水平方向に５文
字、または、７文字の郵便番号文字を抽出する第２水平
方向検索手段と、抽出された開始記号から、水平方向に３文字分の郵便番
号文字を抽出し、その下方から水平方向に２文字、また
は、４文字の郵便番号文字を抽出する２段組検索手段
と、抽出された開始記号から、その下方から水平方向に３文
字分の郵便番号文字を抽出し、その下方から水平方向に
２文字、または、４文字の郵便番号文字を抽出する３段
組検索手段と、抽出された開始記号から、その下方から水平方向に３文
字分の郵便番号文字を抽出し、その下方にハイフンを抽
出し、さらにその下方から水平方向に２文字、または、
４文字の郵便番号文字を抽出する４段組検索手段と、抽出された郵便番号文字から、郵便番号行を生成する文
字行再構成手段を有する文字行抽出装置。
【請求項２３】第１水平方向検索手段、第２水平方向検
索手段、２段組検索手段、３段組検索手段、４段組検索
手段において、郵便番号文字を抽出する際に、仮文字切り出し、およ
び、仮文字認識を行ない、郵便番号文字が０から９まで
のいずれかの数字との類似度が十分高いことを確認する
手段を有する請求項２２記載の文字行抽出装置。
【請求項２４】文字行再構成手段以前に、抽出された郵便番号文字に対して文字認識を行ない、そ
の認識結果が郵便番号データベースに存在する場合の
み、文字行再構成手段を実行する手段を有する請求項２
２又は２３記載の文字行抽出装置。
【請求項２５】文字行抽出手段と、安定文字配置行選択
手段と、外部文字候補抽出手段と、外部文字行検索手段
により構成される文字行抽出装置であって、文字行抽出手段が、処理対象の画像データから文字行を抽出する手段であ
り、安定文字配置行選択手段が、抽出された各文字行の行頭、および、行末の数文字を除
いた中央部の文字について、当該文字の中心位置の間隔
の平均値を算出する文字中心間距離算出手段と、当該文
字の中心位置の間隔の分散値を算出する文字中心間分散
算出手段と、当該文字の文字矩形サイズの平均値を算出する文字サイ
ズ平均算出手段と、算出された値から文字配置の安定性の有無を判別し、安
定性が有る文字行を安定文字配置行として選択する安定
文字配置行判別手段とからなり、外部文字候補抽出手段が、抽出された安定文字配置行について、文字中心間距離算
出手段と、文字中心間分散算出手段と、文字サイズ平均
算出手段において、各値の算出に使用されなかった行
頭、および、行末の数文字について、当該文字を加えて
文字配置の安定性の有無を再び判別する安定文字配置行
再判別手段と、安定性が無くなると判別された場合に、当該文字から外
部文字候補を生成する外部文字候補生成手段とからな
り、外部文字行検索手段が、抽出された外部文字候補から、外部文字候補が所属して
いた文字行と直行する方向に文字を抽出する直行方向検
索手段と、抽出された文字から、新規文字行を生成する文字行再生
成手段を有する文字行抽出装置。
【請求項２６】安定文字配置行選択手段以前に、文字行抽出手段において抽出された文字行に対して、仮
文字切り出し、仮文字認識を行ない、当該文字行を構成
する文字矩形を補正する手段を有する請求項２５記載の
文字行抽出装置。