JPH08243506A - 住所読取り装置及び方法 - Google Patents

住所読取り装置及び方法

Info

Publication number
JPH08243506A
JPH08243506A JP7053947A JP5394795A JPH08243506A JP H08243506 A JPH08243506 A JP H08243506A JP 7053947 A JP7053947 A JP 7053947A JP 5394795 A JP5394795 A JP 5394795A JP H08243506 A JPH08243506 A JP H08243506A
Authority
JP
Japan
Prior art keywords
character
connected component
address
cutout
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7053947A
Other languages
English (en)
Inventor
Tatsuhiko Kagehiro
達彦 影広
Masashi Koga
昌史 古賀
Hisao Ogata
日佐男 緒方
Yoshihiro Shima
好博 嶋
Katsumi Marukawa
勝美 丸川
Shigeru Watanabe
成 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7053947A priority Critical patent/JPH08243506A/ja
Publication of JPH08243506A publication Critical patent/JPH08243506A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 郵便物等の住所情報が記載された用紙で縦横
書きどちらでも住所文字列を読取る住所読取り装置及び
方法を提供する。 【構成】 住所文字列中の文字パターンから縦横書き判
別を行い、その結果を文字切出しの情報として用いて、
正しい文字パターンを見出す。 【効果】 本発明によれば、住所文字列の記載方法が縦
書き横書きかかわらず住所読取り自動区分が可能にな
り、また、縦横書きの情報を文字切出しの特徴抽出に生
かすことにより読取り精度があがる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は住所読取り装置及び方法
に関し、特に郵便物等に記載されている住所文字列を読
取る郵便読取り区分機における住所読取り方法装置及び
方法に関する。
【0002】
【従来の技術】郵便物自動読み取り装置においては、郵
便物上に記載された宛名の都道1府県名、市区群名、町
名等の地名を読み取って、区分先を指定するものが種々
考案されており、例えば特開平4−205685号公報
において宛名として住所の地名部分を読み取る方法が記
載されている。また、郵便物上の宛名記載領域を検出す
る方法として特開平5−151389号公報がある。宛
名記載領域から文字行を切出す方法としては、特開昭6
3−115286号公報があり、切出された文字行の縦
横書き判別法には特開昭63−18785号公報があ
る。
【0003】
【発明が解決しようとする課題】従来技術では、宛名記
載領域から文字行を抽出し、その文字行の縦横書きを判
別し、その結果から文字認識に入力する文字パターンの
向きを決定する。縦書き横書きそれぞれには、連結成分
を結合し文字パターンを生成する際に固有のルールがあ
る。固有のルールとは、連続して連結成分が入力された
際、入力された連結成分の形状がある特定の形状だった
場合、縦書きと横書きでは入力された連結成分の前後の
連結成分を結合し文字パターンを生成するルールが異な
ってくる。つまり、誤って切出される可能性の高い文字
パターンが縦書きと横書きで異なっているため、連結成
分同志の結合条件を縦横書きで異なったルールにする必
要がある。従来技術では、この縦横書き固有の結合ルー
ルを有効に活用していないため、漢字における「へん」
と「つくり」の分離や、縦書きの漢数字の多様な切出し
による曖昧性を引き起こす。そのため、文字パターンの
誤った切出しや、漢数字の誤認識を生じ、住所文字列の
読み取り率を低下させている。
【0004】そこで、本発明では、縦横書き判別結果を
文字切出しに生かすことにより切出し精度を上げ、住所
読取りの精度の向上を目的とする。
【0005】
【課題を解決するための手段】本発明は、宛名情報が記
載されている紙面から文字情報を検出して住所を認識す
る住所読取り装置において、住所情報が記載された紙面
から画像情報を電気信号に変換して入力する画像入力手
段と、入力された画像から複数の文字行領域を切り出す
第1の手段と、文字行の行頭と行末から複数の文字を切
出して、切出された文字パターンを文字認識することに
より縦横書き判別を行う第2の手段と、第2の手段の結
果を用いて、連結成分を入力する縦書き専用の特徴抽出
手段と横書き専用の特徴抽出手段とを切り替える第3の
手段と、第3の手段の縦横書きそれぞれ専用の特徴抽出
手段を用いて、連結成分の外形特徴をパターンに応じて
検出する第4の手段と、第4の手段の検出結果を元に、
文字切出しの曖昧性、多様性をなくし、文字切出しの精
度をあげるために切出し候補の限定を行う第5の手段
と、第5の手段中で文字切出し候補を限定するために、
縦書き横書きそれぞれ専用に複数の連結成分のパターン
とそれに対応した連結成分の結合ルールを持ち、そのル
ールに応じて切出し候補の文字パターンを限定する手段
と、第5の手段により限定された切り出し候補の文字パ
ターンを文字認識し、一意の切り出し候補を決定し文字
認識結果を出力する第6の手段と、第6の手段の文字認
識結果により生成されたラティス文字列から住所認識を
行い住所読み取る第7の手段を有し、住所読取りを行う
ことを特徴としている。
【0006】
【作用】本発明は、縦書き横書きそれぞれ専用の連結成
分の形状の特徴抽出文字切出し候補限定手段を持ち、縦
横書き判別の結果により連結成分を入力する特徴抽出文
字切出し候補限定手段を切り替え、縦書き横書きそれぞ
れ専用の特徴抽出手段からの抽出結果を元に文字切出し
による多様な切出し候補の限定を行う。それぞれ専用の
特徴抽出文字切出し候補限定手段は、縦横書き専用の連
結成分のパターンとそれに対応した連結成分の結合ルー
ルを持ち、特定の形状を持った連結成分が検出された場
合は結合ルールを参照することにより、文字切出し候補
の限定を行う。この特徴抽出文字切出し候補限定手段の
切り替えにより、文字パターンとして連結成分を結合し
た切出し候補の限定に縦書き横書きそれぞれ固有の制約
条件を生かすことができる。そのため、文字切出しの精
度を上げ、住所読取りの精度向上をはかることができ
る。
【0007】
【実施例】以下、図面を参照して本発明の一実施例に係
る住所読取装置につき説明する。図1は本発明の実施例
の住所読取り処理の構成図である。住所読み取り処理
は、住所の記載された面を光電変換して得られた文書画
像110を入力とする。まず、文書画像110は102の領域切
り出しで住所情報のみを含んだ領域だけ切り出され、10
3の文字行切り出しで各文字行ごとに抽出が行われる。
文字行切出しが行われた画像情報は105の文字切出し候
補生成で、複数の連結成分の組み合わせによって生成さ
れる文字パターンのサイズ、連結成分同志の重なり、連
結成分間の距離の情報を用いて、文字パターンの候補を
生成する。この生成された文字パターンの候補は切出し
候補として、106のパターンテーブルに書き込まれる。
また、107の外形特徴抽出文字切出し候補決定では、画
像情報中の連結成分の外形特徴を抽出し、その結果を元
にパターンテーブル106中の切出し候補を限定し、素の
限定された切出し候補をパターンテーブル114に書き込
む。108の文字認識文字切出し候補決定で、パターンテ
ーブル114を参照し、文字認識による類似度を元に一意
の文字パターンに決定され、認識結果の候補文字列が出
力される。認識結果の候補文字列は109の住所照合で正
しい住所文字列に修正される。また、ここで住所として
不適切な候補文字列と判断された場合は110の不読修正
で人手により正しい住所文字列が入力される。これらの
住所文字列を元に111の区分情報生成において用紙に区
分情報が付与され、112の区分情報が生成される。
【0008】図2は本実施例におけるハードウエア構成
を示す。201は画像入力をつかさどるスキャナ部であ
る。203は住所読み取り結果の区分情報に基づき郵便物
を区分するソーター部である。212は住所読取り、即ち
図1における101から109の処理を司る認識装置である。
スキャナ部201と認識装置212は、入出力用ケーブル204
で接続する。ソーター部203と認識装置212は入出力用ケ
ーブル205で接続する。認識装置212には認識装置内部の
各部分を接続するためのバス213、スキャナ部201との通
信を司るインターフェイス部206、認識装置全体の制御
および住所認識処理を司る演算処理装置部207、ソータ
ー部との通信を司るインターフェイス部208、起動時の
操作を行うためのキーボード209、実行状況を必要に応
じて表示するためのCRT210、住所認識に必要なテー
ブル、プログラム、辞書などを格納するためのメモリ21
1を備える。
【0009】図3は図1の105の文字切り出し認識の処
理手順を示している。301で文字行の切出しを行い、住
所情報が記載された紙面の文書画像を1行毎の画像情報
に切り分ける。
【0010】行単位にされた画像情報から303の文字切
出し候補生成で連結成分を組み合わせ、多様な仮説によ
る文字切り出しを行い、その結果をパターンテーブルに
書き込む。302で縦横書き判別を行い、縦横書き判別の
結果を元に縦書き用特徴抽出文字切出し候補限定と横書
き用特徴抽出文字切出し候補限定の切り替えを行い、入
力されるべき特徴抽出の選択を行う。縦書き横書きそれ
ぞれ専用の特徴抽出字切出し候補限定では、特定の形状
をした連結成分が検出された際に、その連結成分に対応
した結合ルールに沿ってパターンテーブルの内容を書き
換え文字切出し候補を限定する。313の文字認識文字切
出し候補決定でパターンテーブルを参照し文字パターン
を文字認識し、その結果得られた類似度を元に多様な文
字切出しを一意に決定する。その文字認識結果の候補文
字列を314のラティス生成でラティスを生成する。
【0011】図4は図1の103の文字行切り出しの文字
行抽出方法を示している。407の画像は、図1の102の領
域切出しにより切り出された画像であり、401は画像のx
軸、402は画像のy軸を示している。画像407中の黒画素
をy軸402と平行の軸408上に投影したヒストグラムが40
3、404、405である。これらの、ヒストグラムの値を検
出することにより点線406のような文字行の上下のy座
標を抽出することができる。
【0012】図5は縦横書き判別方法を示している。50
1は横書きの文字列の入力画像を示している。502、503
は文字行の行頭と行末の文字パターンを示し、これらを
そのまま切出した文字パターンが505、509であり、パタ
ーン回転504、511で90度回転させた文字パターンが50
6、510である。これらの文字パターンを、507で文字認
識をする。その結果の類似度を508で比較し、その結果
を元に512で縦横書き判別を行う。この判別結果を元に
縦書き用特徴抽出と横書き用特徴抽出の入力切り替えを
行う。画像中のレイアウト情報を用いて判別する方法の
場合、規定のレイアウト以外の住所文字列を含んだ画像
が入力された際に誤判別する可能性が高くなるが、本手
法によると文字認識そのものを用いて判別を行うため安
定して縦横書き判別を行うことができる。また、住所文
字列の最初と最後の一文字づつにおいてそのままの向き
の文字と90度回転した文字と類似度の差が大きくでな
い場合は、住所文字列の最初からと最後からの文字の切
出しを一文字づつずらして同様の判別方法を行う。これ
により、「田」や「山」などの90度回転しても類似度
に差が生じにくい文字を避け、判別に適した文字による
縦横書き判別が行われ、精度の向上を図ることができ
る。
【0013】図6(A)に本発明により改善される文字
切り出しの入力画像601の例を示す。図6(B)は入力
画像601から解釈される切出しの可能性を示している。6
02は文字として切出す際の連結成分の間を示しており、
これをノードと呼ぶ。603はノード同志を結んだ道筋を
示し、604、605、606、607、608は各道筋に含まれる連
結成分の組み合わせにより生成される文字パターンを示
している。ここで、ノード同志を結んだ道筋をパスと呼
ぶ。図6(C)は図6(B)中から、本発明中の切出し
候補限定で余分なパスを切り落とすことにより、正しい
文字切出しのパスのみを残したものを示している。これ
らの文字パターンによると、605は「三」を切出した場
合、一番上の棒を「一」とし、その後の二本の棒を
「二」として切出している。606は「三」の一番下の棒
とハイフンを組み合わせ「丁」と誤認識する可能性を示
している。607と608は「六」を前後に切り分けた場合
「上」と「ハ」に誤認識される可能性を示している。こ
れらのように、縦書きの漢数字の文字切出しには多様な
解釈が存在し、正確な文字パターンのパスを選択する事
は困難である。そこで、本発明中の縦書き用特徴抽出を
用いると、ハイフン検出により606の「丁」の部分が612
の「|」と正しく切出され、なべぶた検出により607の
「上」と608の「ハ」の部分が613の「六」として正しく
切出され、最長横棒検出により605の「一」と「二」の
部分が611の「三」に正しく切出される。これらの検出
により、他の漢数字等に対しても正確な文字切り出しが
可能になり、図6(C)のように誤りのない切出しパス
だけを残すことができる。
【0014】図7にハイフン検出と連結成分の結合ルー
ルの処理手順を示す。このパターン検出と結合ルール
は、図3の305の縦書き用特徴抽出文字切出し候補限定
の一部として参照される。703は行数に関する制御ルー
プで行数分だけステップ702、ステップ705、ステップ70
6を繰り返す。702はではFLGに0をセットして初期化
し、705は連結成分数に関する制御のループで連結成分
数だけステップ708、ステップ709、ステップ710を繰り
返す。709は次の行へ入力をずらす処理である。708はF
LGが1ならステップ711を実行する分岐で、709は入力
連結成分が縦棒ならステップ712、714を行い、そうでな
いならステップ713を行う。つまり、入力連結成分がハ
イフンである場合は、ステップ712、714を行い、そうで
ない場合はステップ713を行う。710は入力する連結成分
を次にずらす処理を行う。ステップ711は処理(α)を
行い、パターンテーブルを書き換える。図7(B)は処
理(α)を示しており、715はノード、716、717はパス
を示している。この処理(α)は前連結成分と入力連結
成分を一つの文字パターンとして結んでいたパスを切り
落とす処理である。これにより、ハイフンの連結成分と
次の連結成分は一つの文字パターンとして結合されな
い。ステップ712ではFLGに1をセットし、ステップ7
14では処理(α)を行い、これにより、ハイフンの連結
成分とその1つ前の連結成分は1つの文字パターンとし
て結合されない。ステップ710はFLGに0をセットす
る処理である。
【0015】図8になべぶた検出と連結成分の結合ルー
ルの処理手順を示す。このパターン検出と結合ルール
は、図3の305の縦書き用特徴抽出文字切出し候補限定
の一部として参照される。ステップ802は行数に関する
制御ループでステップ804、ステップ805、ステップ80
6、ステップ807を行数分だけ繰り返す。ステップ804で
は行中の最大の横棒の長さを抽出し、805ではFLGに
0をセットして初期化する。ここで、最大横幅の長さは
Wとする。ステップ808ではFLGが1ならステップ811
を行う。ステップ809では、入力連結成分が真ん中に突
起のある横棒である場合にはステップ812を行い、そう
でない場合にはステップ813を行う。ステップ810では入
力連結成分を次にずらす処理を行う。ステップ811では
処理(β)を行い、パターンテーブルの書き換えを行
う。図8(B)に処理(β)を示しており、816はノー
ド、817、818はパスを示している。処理(β)では81
7、818のパスを切り落とすことにより、前連結成分と入
力連結成分の組み合わせのみで文字パターンが構成され
るようにし、それぞれの連結成分単体で文字パターンを
構成することを防ぐ。ステップ812ではステップ809を満
たした連結成分の横幅がWと等しい場合はステップ814
を行い、そうでない場合はステップ815を行う。ステッ
プ813ではFLGに0をセットする。ステップ814ではF
LGに1をセットし、815ではFLGに0をセットして
いる。本手法により、なべぶたが検出された場合は次の
連結成分と結合するため、漢数字の「六」などの文字切
出しに有効である。
【0016】図9に最長横棒検出と連結成分の結合ルー
ルの処理手順を示す。このパターン検出と結合ルール
は、図3の305の縦書き用特徴抽出文字切出し候補限定
の一部として参照される。ステップ902は行数に関する
制御ループでステップ904、ステップ905、ステップ90
6、ステップ907を文字行分繰り返す。ステップ904では
行中の最大の横棒の長さを抽出し、905ではFLGに0
をセットし初期化する。ここで、最大横幅の長さはWと
する。ステップ907は入力行を次の行に移す。ステップ9
06は連結成分に関する制御のループで、行中の連結成分
の数だけステップ908、ステップ909、ステップ910を繰
り返す。ステップ908ではFLGが1の場合にはステッ
プ911を行う。ステップ909では入力成分が横棒である場
合、ステップ912を実行し、そうでない場合はステップ9
13でFLGに0をセットする。ステップ913では入力連
結成分を次の連結成分にずらす。ステップ911では処理
(γ)を行い、パターンテーブルを書き換える。処理
(γ)は図9(B)に示しており、916はノード、917、
918はパスを示している。処理(γ)は917、918のパス
を切り落とし前連結成分、入力連結成分それぞれ単体で
文字パターンを構成することを妨げ、前連結成分と入力
連結成分を組み合わせて文字パターンを構成するようパ
ターンテーブルを書き換える。ステップ912ではステッ
プ909を満たした連結成分の横幅がWより短い場合、ス
テップ914でFLGに1をセットし、そうでない場合ス
テップ915でFLGに0をセットする。本手法により、
横棒の連結成分が連続して入力された際は、最大横幅W
の横棒が入力されるまで一文字として結合され、縦書き
において「一」「二」「三」が連続して記述された画像
であっても、精度良く切出すことが可能である。
【0017】図12にパターンテーブルのデータ構造を
示す。この1つのパターンテーブルは、図6、図10で
示した切出しの1つパスに対応しており、すべてのパタ
ーンテーブルは図1の105、図3の312の切出し候補生成
で作られる。1201はパターンテーブルの先頭のポインタ
であり、1202はこのパターンテーブルに対応した切出し
パス中の連結成分のx,y座標の最大最小値が格納され
ている。1203、1204は、このパターンテーブルに対応し
ているパスの両端のノード番号が格納されており、1203
が前のノードの番号、1204が後ろのノードの番号であ
る。1206はこのパターンテーブルに対応したパス中の文
字パターンを文字認識した際の候補文字が複数格納さ
れ、1205にはそれぞれの候補文字に対応した類似度が格
納されている。この候補文字列1206や類似度1205は図1
の108、図3の313の文字認識切出し候補決定で書き込ま
れる。1207はこのパターンテーブルが文字パターンとし
て有効であるかを示すフラグで、このフラグは図1の10
7の外形特徴抽出文字切出し候補限定により書き換えら
れる。つまり、図7の処理(α)、図8の処理(β)、
図9処理(γ)はそれぞれパターンテーブル中のパスフ
ラグ1207を書き換えて、パスの切り落しを行っている。
1208には次のパターンテーブルへのポインタが格納され
ており、ここを参照することにより次のパターンテーブ
ルを手繰ることができる。
【0018】図10(A)に入力された画像1001を示
し、図10(B)に画像1001を入力とした場合、多様な
文字切出しパスを示し、図10(C)に画像1001を入力
画像にした際の正しい文字切出しパスを示している。10
02は多様な文字切出しの文字間を示しており、1003はそ
の文字間の点を結んで文字パターンとして切出パスを示
しており、1004、1005、1006、1007、1008、1009、101
0、1011、1012はそれぞれの切出しパスで文字認識され
た際の結果を示している。1007の「分」は1005の
「八」、1006の「刀」のように分割されても認識可能で
あり、また、1012の「窪」も1010の「穴」、1011の
「佳」のように分割されも認識可能である。そこで、そ
れぞれの切出しパスにおける文字認識の類似度を元に最
適なパスを評価することに、図10(C)のような切出
しパスを決定する。1013の「分」、1014の「恋」、1017
「窪」のように類似度を元に切出しパスを評価すること
により文字パターン誤った分割を防ぐことができる。
【0019】図11(A)に入力画像1101と図1の106
の住所照合で用いているラティスの例1104を示してい
る。1104は図3の306のラティス生成により生成された
ラティスを示している。1104の中に書かれている文字列
は文字認識により得られた候補文字列を示し、上から下
の行にいくにつれて類似度が下がっていく。1103の点線
の矩形は正解の候補文字を示している。図11(B)に
図1の108の住所辞書を用いて住所照合を行いラティス1
104から住所文字列を生成した例を示している。1105は
住所照合により選択されたラティス内の住所文字列のパ
スである。1106は1104中の候補文字列内に「分」の文字
が含まれていなかったため前後の文字列から推測し補っ
た結果、選択された文字である。
【0020】ここで得られた正解住所文字列は図1の11
2の区分情報として与えられ、正解住所文字列がラティ
スから生成不能の場合は図1の110の不読修正に画像情
報として送られ人手で区分情報が付加される。
【0021】
【発明の効果】以上説明したように本発明によると、住
所文字列の記載方法が縦書き横書きかかわらず住所読取
り自動区分が可能になり、また、縦横書きの情報を文字
切出しのための特徴抽出に生かすことにより、読取り精
度があがるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施例の処理手順である。
【図2】本発明のハード構成図である。
【図3】縦横書き専用の特徴抽出を用いた文字切出しの
処理手順である。
【図4】文字行抽出の手法を示した図である。
【図5】縦横書き判別の手法を示した図である。
【図6】本発明を使用する前とした後の縦書き漢数字の
文字切出しの相違を示した図である。
【図7】縦書き用特徴抽出手段内のハイフン検出手段の
処理を示した図である。
【図8】縦書き用特徴抽出手段内のなべぶた検出手段の
処理を示した図である。
【図9】縦書き用特徴抽出手段内の最長横棒検出手段の
処理を示した図である。
【図10】多様な文字切出しパスからの正しい文字切出
しパスの選択を示した図である。
【図11】文字認識により得られた候補文字列からの正
解住所文字列の生成を示した図である。
【図12】パターンテーブルのデータ構造を示した図で
ある。
【符号の説明】
101・・・画像入力、102・・・領域切出し、103・・・
文字行切出し、104・・・縦横書き判別、105・・・文字
切出し候補生成、106・・・パターンテーブル、107・・
・外形特徴抽出文字切出し候補限定、108・・・文字認
識切出し候補決定、109・・・住所照合、110・・・不読
修正、111・・・区分情報生成、112・・・区分情報、11
3・・・文書画像、114・・・パターンテーブル。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 嶋 好博 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 丸川 勝美 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 渡辺 成 愛知県尾張旭市晴丘町池上1番地 株式会 社日立製作所オフィスシステム事業部内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】宛名情報が記載されている紙面から文字情
    報を検出して住所を認識する住所読取り装置において、 住所情報が記載された紙面から画像情報を電気信号に変
    換して入力する画像入力手段と、 入力された画像から複数の文字行領域を切り出す第1の
    手段と、 文字行の行頭と行末から複数の文字を切出して、切出さ
    れた文字パターンを文字認識することにより縦横書き判
    別を行う第2の手段と、 第2の手段の結果を用いて、連結成分を入力する縦書き
    専用の特徴抽出手段と横書き専用の特徴抽出手段とを切
    り替える第3の手段と、 第3の手段の縦横書きそれぞれ専用の特徴抽出手段を用
    いて、連結成分の外形特徴をパターンに応じて検出する
    第4の手段と、 第4の手段の検出結果を元に、文字切出しの曖昧性、多
    様性をなくし、文字切出しの精度をあげるために切出し
    候補の限定を行う第5の手段と、 第5の手段中で文字切出し候補を限定するために、縦書
    き横書きそれぞれ専用に複数の連結成分のパターンとそ
    れに対応した連結成分の結合ルールを持ち、そのルール
    に応じて切出し候補の文字パターンを限定する手段と、 第5の手段により限定された切り出し候補の文字パター
    ンを文字認識し、一意の切り出し候補を決定し文字認識
    結果を出力する第6の手段と、 第6の手段の文字認識結果により生成されたラティス文
    字列から住所認識を行い住所読み取る第7の手段を有す
    ることを特徴とする住所読取り装置。
  2. 【請求項2】請求項1記載において、連結成分の外形特
    徴をパターンに応じて検出する第4の手段は、 連結成分の外形特徴からなべぶたの形状をした連結成分
    を検出する第8の手段と、 第8の手段の結果に応じて切出し候補を限定し、なべぶ
    たの形状をした連結成分のみの文字パターンを持った切
    出し候補を落とす第9の手段と、 連結成分の外形特徴からハイフンの形状をした連結成分
    を検出する第10の手段と、 第10の手段の結果に応じて、ハイフンの形状をした連
    結成分の前後の連結成分と1文字として結合している文
    字パターンの切出し候補を落とす第11の手段と、 連結成分の外形特徴から横棒の形状をした連結成分を検
    出し、その長さを抽出する第12の手段と、 連結成分の外形特徴から最長の横棒の長さを検出する第
    13の手段と、 第13の手段で検出した最長の横棒の長さを用いて、縦
    書きで連続して記述された漢数字を一文字づつ文字パタ
    ーンとして切出す第14の手段を有することを特徴とす
    る住所読取り装置。
  3. 【請求項3】請求項2記載において、第8の手段は、 なべぶたの形状をした連結成分を検出する手段と、 なべぶたの形状をした連結成分を検出した際に、切出さ
    れた文字パターンの候補からなべぶたの形状の連結成分
    のみで構成されている文字パターンを持った切出し候補
    を切り落とす手段と、 なべぶたの形状をした連結成分のみの文字パターンの切
    出し候補を切り落とすことにより、切出し候補を一意に
    限定する際に誤った文字切出しを防ぐ手段を有する住所
    読取り装置。
  4. 【請求項4】請求項2記載において、第10の手段は、 ハイフンの形状をした連結成分を検出する手段と、 ハイフンの形状をした連結成分を検出した際に、切出さ
    れた文字パターンの候補からハイフンの形状をした連結
    成分と他の連結成分が1つの文字パターンとして結合さ
    れた切出し候補を切り落とす手段と、 ハイフンの形状をした連結成分と他の連結成分との組み
    合わせの切出し候補を切り落とすことにより、切出し候
    補を一意に限定する際に誤った文字切出しを防ぐ手段を
    有する住所読取り装置。
  5. 【請求項5】請求項2記載において、第14の手段は、 横棒の形状を持った連結成分を検出する手段と、 横棒の形状を持った連結成分のうち横幅の最大の連結成
    分の長さを検出する第15の手段と、 第15の手段で検出した長さと等しい横棒の形状を持っ
    た連結成分が、一番下のパターンとなっている文字パタ
    ーンを持った切出し候補以外は切り落とす第16の手段
    と、 第16の手段で切出し候補を切り落とすことにより、切
    出し候補を一意に限定する際に縦書きの漢数字の誤った
    文字切出しを防ぐ手段を有する住所読取り装置。
  6. 【請求項6】宛名情報が記載されている紙面から文字情
    報を検出して住所を認識する住所読取り方法において、 住所情報が記載された紙面から画像情報を入力して電気
    信号に変換し、 入力された画像から複数の文字行領域を切り出し、 文字行の行頭と行末から複数の文字を切出して、切出さ
    れた文字パターンを文字認識することにより縦横書き判
    別を行い、 判別結果を用いて、連結成分を入力する縦書き専用の特
    徴抽出手段と横書き専用の特徴抽出手段とを切り替え、 縦横書きそれぞれ専用の特徴抽出手段を用いて、連結成
    分の外形特徴をパターンに応じて検出し、 検出結果を元に、文字切出しの曖昧性、多様性をなく
    し、文字切出しの精度をあげるために切出し候補の限定
    を行い、 文字切出し候補を限定するために、縦書き横書きそれぞ
    れ専用に複数の連結成分のパターンとそれに対応した連
    結成分の結合ルールを持ち、そのルールに応じて切出し
    候補の文字パターンを限定し、 限定された切り出し候補の文字パターンを文字認識し、
    一意の切り出し候補を決定し文字認識結果を出力し、 文字認識結果により生成されたラティス文字列から住所
    認識を行い住所読み取ることを特徴とする住所読取り方
    法。
JP7053947A 1995-03-14 1995-03-14 住所読取り装置及び方法 Pending JPH08243506A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7053947A JPH08243506A (ja) 1995-03-14 1995-03-14 住所読取り装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7053947A JPH08243506A (ja) 1995-03-14 1995-03-14 住所読取り装置及び方法

Publications (1)

Publication Number Publication Date
JPH08243506A true JPH08243506A (ja) 1996-09-24

Family

ID=12956923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7053947A Pending JPH08243506A (ja) 1995-03-14 1995-03-14 住所読取り装置及び方法

Country Status (1)

Country Link
JP (1) JPH08243506A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013238999A (ja) * 2012-05-15 2013-11-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2014085841A (ja) * 2012-10-24 2014-05-12 Glory Ltd 文字切出装置及び文字切出方法並びに文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013238999A (ja) * 2012-05-15 2013-11-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2014085841A (ja) * 2012-10-24 2014-05-12 Glory Ltd 文字切出装置及び文字切出方法並びに文字認識装置

Similar Documents

Publication Publication Date Title
JP3246432B2 (ja) 宛名読取り装置および郵便物等区分機
US7031519B2 (en) Orthogonal technology for character recognition
JP2973944B2 (ja) 文書処理装置および文書処理方法
EP0163377B1 (en) Pattern recognition system
EP0621553A2 (en) Methods and apparatus for inferring orientation of lines of text
KR20010031815A (ko) 우편물의 루팅 정보를 인식하기 위한 방법 및 시스템
JPH0420226B2 (ja)
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
US6920247B1 (en) Method for optical recognition of a multi-language set of letters with diacritics
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
US20010043742A1 (en) Communication document detector
JPH08243506A (ja) 住所読取り装置及び方法
JPS6336037B2 (ja)
JP2827960B2 (ja) 宛名行抽出装置
JP2842263B2 (ja) 住所読み取り装置
JPH11312219A (ja) 宛名読取り装置および郵便物等区分機および文字列認識方法
JP3468668B2 (ja) 住所認識方法及び郵便区分機
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JPH10162103A (ja) 文字認識装置
JPH08243504A (ja) 住所読取り方法
JP3788262B2 (ja) 住所認識システム、及びその住所識別方法
JP2000210624A (ja) 郵便宛名認識装置
JP3740271B2 (ja) 文字行記載領域読み取り方法及び郵便物等の宛名認識方法
EP0114996A2 (en) Character recognition utilizing transition measurements
CN115830607A (zh) 基于人工智能的文本识别方法、装置、计算机设备及介质