JP3468668B2 - 住所認識方法及び郵便区分機 - Google Patents

住所認識方法及び郵便区分機

Info

Publication number
JP3468668B2
JP3468668B2 JP23803297A JP23803297A JP3468668B2 JP 3468668 B2 JP3468668 B2 JP 3468668B2 JP 23803297 A JP23803297 A JP 23803297A JP 23803297 A JP23803297 A JP 23803297A JP 3468668 B2 JP3468668 B2 JP 3468668B2
Authority
JP
Japan
Prior art keywords
character
address
tree
pattern
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23803297A
Other languages
English (en)
Other versions
JPH1185909A (ja
Inventor
昌史 古賀
竜治 嶺
洋 上田
裕 酒匂
浩道 藤澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP23803297A priority Critical patent/JP3468668B2/ja
Publication of JPH1185909A publication Critical patent/JPH1185909A/ja
Application granted granted Critical
Publication of JP3468668B2 publication Critical patent/JP3468668B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字読取りに関係
し、特に郵便物等の文書上に記載された住所を読取る住
所読取りにかかわる。
【0002】
【従来の技術】郵便物に記載されている宛名の読取りと
しては、一般的には以下の様な手順が知られている。
【0003】(1)宛名文字行の位置を決定する(文字
行抽出)。
【0004】(2)文字パタンを切り出す(文字切出
し)。
【0005】(3)各々の文字パタンの文字カテゴリ
(文字コード)を識別する(文字識別)。
【0006】(4)文字の識別結果を住所文字列として
解釈する(文字列照合)。
【0007】ここで、(3)には、予め記憶している標
準パタン中で最も入力パタンに類似したものを選び出す
パタン整合法がよく用いられる。
【0008】今、例として、図1(A)の様な文字行か
ら(B)に示す様な5つの文字パタンが切出された場合
を考えてみる。また、認識対象の住所が図2の様なもの
(仮想的な住所)であったとする。
【0009】従来の方式では、この場合、文字識別処理
において、5つの文字パタンをそれぞれ読み取り対象の
文字カテゴリである「旭安井口山市住所松上新中町田波
板北本里」の19の文字カテゴリの標準パタンと比較す
る(現実には、全国の地名を読み取るためには約400
0字、1つの市内の地名を読み取るためには数百文字が
読み取り対象となる)。そして、文字識別処理の結果得
られた候補文字を、住所文字列と比較し、最も類似した
ものを選択していた。
【0010】
【発明が解決しようとする課題】上記の様な処理手順に
おいては、切出された文字パタンを、住所中に有り得る
全ての文字カテゴリの標準パタンと比較する必要があ
り、処理量が大きくなってしまう、という問題点があっ
た。
【0011】本発明で解決しようとする第1の課題は、
住所に現われる文字の並びに関する知識を用い、各パタ
ンと比較する標準パタンの文字カテゴリを絞り込み、処
理量の削減を図ることである。なお、この前述の例で
は、住所中の市、町の部分を対象としているが、本課題
は、市名、町名のみならず、丁目番地の表記、アパート
やビルの名称、氏名などを含めた住所を対象とする。
【0012】また、文字切出しに多重仮説検定法(昭和
59年度電子通信学会総合全国大会1558「接触した
手書き文字の自動分離を行う文字切り出し方式」)を用
いる場合、文字識別を行う必要のある文字候補のパタン
の数が多くなり、処理量が増大するという問題がある。
【0013】本発明で解決しようとする第2の課題は、
多重仮説検定法において必要な文字識別の回数を削減を
図り、更に識別精度の向上を図ることである。
【0014】
【課題を解決するための手段】本発明では、住所の文字
列の知識を図3に記すように住所文字列の各文字が節点
に対応するような木構造で表現する。以下、このような
木構造を「住所木」と呼ぶ。そして、文字識別を利用し
て住所木中の子節点(木構造の各節点の末端側に枝を介
して連接している節点)を選択しながら住所木を探索す
ることにより、住所文字列を認識する。この際、各入力
パタンと比較する標準パタンの文字カテゴリを、住所木
を参照して接続可能な文字カテゴリのみに限定すること
により、上記の課題が解決できる。
【0015】例えば、出発節点から次の節点を選択する
場合には、図1の第一の文字パタンを「中」「所」の2
字種の標準パタンとマッチングする。もし、いずれかの
文字のみに類似している場合には、類似している方の文
字に対応する節点を選択し、以下同様に節点の探索を進
める。もし、入力文字パタンが次の節点の両方の文字に
十分類似している場合には、両方の文字に対応する両方
の節点を次の節点の候補(複数)として展開し、以下同
様に探索を進める。もし、入力文字パタンが次の節点の
いずれの文字とも類似していない場合には、その枝の探
索を停止する。こうして、木構造の葉、すなわち「町」
「里」「旭」「井」「松」「口」等の文字に対応する節
点に到達したならば、出発節点から当該の葉に至る文字
列を読み取り結果とする。もし、複数の葉に達した場合
(これは、複数の住所読み取り結果が候補として残った
ことを意味する)は、より詳細な判定(例えば、各節点
の展開の際の文字識別結果の確からしさの平均値)によ
り候補を選択する。
【0016】仮に、各文字カテゴリに1つの標準パタン
を用いるとすると、従来の方式だと19(カテゴリ)×
5(パタン)=95回の標準パタンとのマッチングが必
要であったのに対し、本方式だと約10回程度のマッチ
ングで十分であり、大幅な処理量の削減が可能である。
また、全国の地名を読み取ることを想定し、文字種を4
000字種、文字列長さの平均値を10字とすると、1
つの文字列を読み取るのに従来方式では約4万回のマッ
チングが必要なのに対し、本方式では数百回程度のマッ
チングで十分である。
【0017】また、上で説明したような方式を多重仮説
検定法に応用した場合も、同様に文字識別の処理量を削
減できる。また、文字カテゴリを限定しているので、誤
った位置でパタンが切出された場合にそのパタンを文字
識別でリジェクトできる確率は高く、以降のパタンの検
定を中断でき、さらに処理量を削減することができる。
【0018】本方式は、読み取り精度の向上にも効果が
ある。各文字カテゴリで複数の標準パタンをマッチング
する Parzen Density Estimation 法やk−NN法が、
文字識別の精度向上に有効な事が知られている。しか
し、標準パタン数の増加は処理量の増加につながり、従
来の方式では標準パタン数を十分に増やすことは出来な
かった。しかし、本方式では識別対象の文字カテゴリが
大幅に削減されているため、標準パタン数を多くするこ
とが可能となり、読み取り精度向上が図れる。
【0019】
【発明の実施の形態】本発明の実施形態の一例を、図4
のデータ・フロー・ダイアグラムを用いて説明する。本
明細書では、データ・フロー・ダイアグラムはゲーン・
サクソン記法に従う(J.マーチン「ソフトウエア構造
化技法」近代科学社、ISBN4 - 7649 -0124 - 2 C3050 P
5562E)。
【0020】本実施例は、住所の記載された文字行の画
像を入力とし、文字列認識結果の住所文字列を出力とす
る住所認識処理である。まず、文字切出し401は、文
字行画像中より文字パタン候補を切出す。文字識別40
2は、各文字パタン候補の文字識別を行い、探索処理4
04に結果を渡す。探索処理404は、文字識別結果に
応じ、住所辞書408に格納されている住所木を探索す
る探索木を動的に生成する。探索木の生成が終了した
後、文字列候補選択405は、探索木の出発節点から葉
に至る経路、すなわち認識された文字列を選びだし、出
力する。標準パタン選択403は、探索木の次の節点を
展開するのに必要な文字カテゴリの標準パタンを標準パ
タン辞書406から選択し、文字識別処理402に出力
する。
【0021】本発明で生成される探索木の生成過程の例
を図5に模式的に示す。ここでは、図1に示す様なパタ
ン列を、図2に示す様な住所のいずれであるかを認識す
る処理を例としている。506が探索木の出発節点であ
る。出発節点506からは、節点501すなわち図3の
Aに対応する節点が展開される。節点501から次の節
点を展開するために、第一の文字パタンを「中」「所」
の2字種の標準パタンとマッチングする。もし、いずれ
かの文字に類似している場合には、類似している文字に
対応する節点を新たに生成する。本例の様に「中」に類
似していると判断された場合には、図3の住所木中の節
点Bに対応する節点502を生成する(図5では、参考
のため、文字識別の結果選択されなかった枝も破線で記
載してある)。次に、節点502の次の節点を生成する
ため、第2のパタンを「住」「山」の2文字カテゴリ、
すなわち図3のBの次の節点として有り得る文字カテゴ
リ、の標準パタンとマッチングする。入力文字パタンが
両方の文字に十分類似している場合には、両方の文字に
対応する節点を生成する。以下、同様に節点の展開を繰
り返す。もし、503の様にリジェクトとなった場合、
すなわち入力文字パタンが次の節点のいずれの文字とも
類似していない場合には、その枝の探索を停止する。こ
うして節点506の様な住所木の葉に対応する節点に達
したら、その枝の探索を停止する。探索を継続すべき枝
が全て無くなったら全ての探索処理は終了である。
【0022】探索終了後、生成された探索木中の出発節
点から葉に至る経路上の文字の列を、文字列認識結果と
する。もし、複数の葉に到達した場合には、より詳細な
判定により候補を選択する。候補の選択には、例えば経
路上のパタンの文字識別結果の類似度の平均値が最大の
ものを選ぶ等の手法がある。
【0023】なお、上記実施例では、市名、町名から成
る住所を用いて処理の一連の流れを説明したが、更に、
市名や町名に続けて、丁目番地の表記、アパートやビル
の名称等を含めた形での住所の一連の処理にも本願発明
を適用できる。これは、丁目、番地名、アパート名、氏
名も有限の文字列であるので、前述の木で表現できるこ
とによる。
【0024】本発明は、文字切出しに多重仮説検定法を
用いた場合にも応用できる。多重仮説検定法において
は、図6に示す様に文字の切出し方の仮説がネットワー
クで表現される。以下、このようなネットワークを切出
し仮説ネットワークと呼ぶ。切出し仮説ネットワーク上
では、切出されたパタンが辺、パタンの境界が節点で表
現されている。また、文字行中の文字の切出し方の仮説
は、切出し仮説ネットワークの左端の出発節点601か
ら右端への終点節点602への経路で表現される。
【0025】図4の文字切出し処理401が、図6の様
な切出し仮説ネットワークを生成する場合の探索木が生
成される過程を図7に示す。多重仮説検定法では、ある
パタンの後続するパタンを予め一意に決めない。このた
め、図5で示した探索の過程に加え、各節点から次の節
点を展開する際に、次に文字識別すべきパタンを切出し
仮説ネットワーク中から選択する過程が必要となる。図
7中の701〜705は、この選択の過程を模式的に示
している。図7のような探索木でも、図5と同様に、各
節点は図3の住所木の節点へ対応している。例えば、7
10と711はAに、712と713はBに対応してい
る。ただし、出発節点714は、図5の例と同様に住所
木への対応を持たない。
【0026】図8は、探索木の情報を格納する探索木テ
ーブルの形式を示す。探索木テーブルは各レコードが3
つのデータ項目を有するテーブルで表現される。各レコ
ードは、探索木の枝に対応する。図8は図7の様な探索
木を表わしており、レコード801は枝714、レコー
ド802は枝706、レコード803は枝707、レコ
ード804は枝708、レコード805は枝709に対
応する。第一のデータ項目adrNode(次接点)
は、当該の枝の末端側の節点に対応する住所木の節点へ
のポインタを格納する。例えば802に対応する探索木
の枝は706であり、706の子節点712および71
3に対応する住所木の節点はBであるので、801のa
drNodeにはBへのポインタを格納する。第二のデ
ータ項目ptnCrd(パタン確信度)は、子節点の展
開の確からしさの値を格納する。ptnCrdの値とし
ては、例えば後述する文字識別処理の過程で得られる確
率密度等を用いる。第三のデータ項目strCrd(文
字列確信度)は、探索木の根から子節点に至る一連の展
開の確からしさを表わす値を格納する。strCrd
(文字列確信度)の値としては、例えば根から当該子節
点に至る経路上の枝のptnCrdの平均値等を用い
る。第四のデータ項目ptn(入力パターン)は、子節
点を展開する際に用いたパタンへのポインタを格納す
る。親節点が出発節点の場合には、ヌルポインタ(ポイ
ンタとしてありえない値)を格納し、これより上位の節
点が無いことを記憶する。第五のデータ項目prv(直
前の枝)は、当該節点の親節点へのポインタを格納す
る。出発節点の場合は、prvにはヌルポインタを格納
する。この探索木テーブルは、住所中の文字の連接関係
を木構造で記憶したテーブルといえる。なお本例では、
後述する処理手順により、715の様に次節点を展開す
る事が出来なかった枝はテーブルに格納しない様になっ
ている。
【0027】図9に、住所木を格納する住所木テーブル
のデータ形式を示す。住所木テーブルは各レコードが3
つのデータ項目を有するテーブルで表現される。各レコ
ードが、住所木の枝に対応する。また、各節点には固有
な整数値(id)を割り付ける。第一のデータ項目pr
tNode(親接点)は、枝の上位側の節点のidを格
納する。第二のデータ項目cldNode(子接点)に
は、枝の下位側の節点のidを格納する。図中では、図
3に対応するよう、節点のidを「A」「B」と記号で
記しているが、実際には各節点に固有な整数値を格納す
る。第三のデータ項目code(文字コード)には、枝
に対応する文字コードを格納する。
【0028】本発明の処理手順を図10に示す。第1の
ステップは、文字行画像から切出し仮説ネットワークを
生成する処理、すなわち文字切出し処理1001であ
る。文字切出し処理には、例えば村瀬他「言語情報を利
用した手書き文字列からの文字切り出しと認識」(信学
論(D)vol. J69-D, No. 9)にあるような既知の方式を
用いる。第2のステップは、文字識別・探索処理100
2である。文字識別と探索処理は、後述するように、互
いに連携しながら動作し、探索木テーブルにデータを書
き込んでいく。第3のステップは、探索木中より最も確
からしい文字列の候補を求める文字列候補選択処理10
03である。文字列候補選択処理では、adrNode
が住所木の葉に相当するレコードを探索木テーブルから
もとめ、これらレコードのうちでstrCrdの値が最
も大きいものを選択する。次に、このレコードから次々
とポインタprvをたどることにより、出発節点から葉
に至る経路を求め、経路上の文字の列を認識結果の文字
列候補とする。
【0029】文字識別・探索処理の処理手順を図11に
示す。まずステップ1101において、第一のレコード
に、出発節点を登録する。次にステップ1102におい
て、注目している枝データへのポインタpcと新規枝デ
ータ書き込み先pwを探索木テーブルの2レコード目に
セットする。次にループ1103において、文字行の左
端のパタンの候補(図6の603、604に示すように
複数個有り得る)各々を、住所木の出発節点から始まる
枝に対応する文字カテゴリ(住所木テーブルのデータ項
目「code」に格納してある)に対して文字識別処理
を行う。文字識別がアクセプトとなった場合には、ポイ
ンタpwが示すアドレスに探索木の枝を登録する。次にル
ープ1104において、探索木テーブルに登録されてい
る枝の子節点の展開を繰り返し、文字識別結果がアクセ
プトの場合には探索木テーブルに新たな枝を追加する。
こうしてこれ以上探索する枝がなくなった場合、すなわ
ちポインタpc と pw の値が等しくなったらループを終
了する。次にステップ1105において、探索木中より
最も確からしい文字列を求め、認識結果として出力す
る。
【0030】ループ1104では、未展開の節点から次
節点を展開する処理ループ1106、展開した節点を文
字列確信度でソートするステップ1107、予め定めら
れた定数srcWdより多くの子節点が展開された場合
には上位srcWd個の節点のみを選択するステップを
実行する。本ステップにより、仮に多くの文字識別結果
がアクセプトとなった場合でも、節点の数を削減するこ
とにより、処理に要する時間の増大を抑えることが出来
る。
【0031】図12は、本実施例におけるハードウエア
構成を示す。上に述べてきた本発明は、例えば同図のよ
うな郵便物宛名読取区分機の、住所読取りをつかさどる
認識装置1205に適用される。図中の太線は、郵便物
の流れを示す。1201は、画像入力をつかさどるスキ
ャナである。スキャナ1201は、住所文字行の画像を
抽出をつかさどる前処理装置1204に接続する。前処
理装置1204は、入出力用インタフェース1207を
介して認識装置のバス1210に接続する。1202
は、住所読取り時間を確保するために郵便物搬送路上に
設けるディレイライン(遅延用搬走路)である。120
3は、住所読取結果に基づき郵便物を区分するソータで
ある。ソータ1203は入出力用インタフェース120
8を介して認識装置のバス1210に接続する。120
6は、本発明に必要なプログラム、文字識別用標準パタ
ン、住所木等を格納しておくための外部記憶装置であ
る。外部記憶装置にはハードディスク等を用いる。外部
記憶装置は入出力用インタフェース1209を介して認
識装置のバス1210に接続する認識装置1205に
は、認識装置内部の各部分を接続するためのバス121
0、認識装置全体の制御および住所認識処理をつかさど
る演算処理装置1211、外部の装置との入出力をつか
さどる入出力用インタフェース1207、1208、1
209、住所認識に必要なプログラム、テーブル、辞書
などを格納するためのメモリ1212を備える。
【0032】装置起動時には、まず外部記憶装置120
6からプログラム、標準パタン辞書、住所木がメモリ1
212へロードされる。ロード完了後、前処理装置12
04から文字行画像が認識装置1205へ文字行画像が
供給されると、文字行画像はメモリ1212に複写され
る。さらに演算処理装置1212は本発明で説明した方
式に従って切出し仮説ネットワーク、探索木をメモリ1
212上に生成しながら住所を認識し、認識結果をソー
タ1203へ発信する。ソータ1203は認識結果に応
じて郵便物を区分する。
【0033】図10および図11で説明した処理手順
は、入力の文字行が正しく切り出されていることを前提
としている。このため、図13に示すような例には対応
することができない。図13(A)は、住所先頭の1文
字が完全に欠落してしまった例、図13(B)は、行頭
にノイズが混入した例、図13(C)は行の頭の文字の
一部が欠けてしまった例である。以下に、上述の文字識
別・探索処理方式を拡張し、行頭の欠けやノイズの混入
に対応する方式を説明する。
【0034】図14は、行頭の欠けに対応する処理手順
である。ステップ1401は、図10で説明したフロー
と同様の文字切出し処理である。ステップ1402は、
図11で説明したような、文字行が正しく切り出されて
いることを前提とした読取り処理である。もし、ステッ
プ1402でアクセプトとなる認識結果が得られれば、
図10で説明したフローと同じく、文字列候補処理14
05を実行する。もし、アクセプトとなる候補が得られ
なかった場合には、ステップ1403を実行する。
【0035】ステップ1403は、行頭の何文字かがそ
っくり欠落した場合に対応する処理である。この場合、
住所木の根に対応するパターンは文字行中からは欠落し
ていることを前提とする必要があり、行頭が住所木のど
の節点に対応しているかを調べてから文字識別・探索を
開始する必要がある。まず、切り出し仮説ネットワーク
中から行頭となりうるパターンを求める。ここで、行頭
となりうるパターン」とは、ネットワークの出発節点に
接しているパターンのことである。たとえば、図13
(C)の様な入力画像に対しては、図15に示すような
文字切り出し仮説ネットワークが生成され、出発節点は
1501であり、「行頭となりうるパターン」とはパタ
ーン1503と1504である。次に、全ての行頭とな
りうるパターンに対して、住所中にありうる全ての文字
カテゴリで識別する。もし、アクセプトとなる文字カテ
ゴリがあれば、当該カテゴリに対応する節点を住所木中
から求める。そして、当該節点を根とする住所木の部分
木を住所木とみなして、図11で説明したの同様の処理
手順で文字識別・探索を行う。もし、ステップ1403
でアクセプトとなる認識結果が得られれば、図10で説
明したフローと同じく、文字列候補処理1405を実行
する。もし、アクセプトとなる候補が得られなかった場
合には、ステップ1404を実行する。
【0036】ステップ1404は、図13(B)のよう
に行頭にノイズが混入した場合、および図13(C)の
ように行頭の文字の1部が欠落した場合に対応する処理
である。この場合、1文字目のパタンを文字識別した結
果がリジェクトとなり、ステップ1403ではアクセプ
トとなる候補が挙がらないことが予想される。このた
め、2文字目となるパターンを手がかりに探索開始節点
を求める必要がある。まず、行の2番目の文字となりう
るパターン、すなわち切出し仮説ネットワークの出発節
点から1つの辺を介して到達しうるパターン(図15の
例では、パターン1505、1506と1507)を、
住所中にありうる全ての文字カテゴリで識別する。も
し、アクセプトとなる文字カテゴリがあれば、当該カテ
ゴリに対応する節点を住所木中から求める。そして、当
該節点を根とする住所木の部分木を住所木とみなして、
図11で説明したの同様の処理手順で文字識別・探索を
行う。
【0037】本発明で用いる文字識別処理の原理の一例
を図16に示す。図16は文字識別に用いる特徴のベク
トル空間を模式的に示している。特徴量には、例えば森
「パターン認識」(ISBN4 - 88552 - 075 - 4 C3055、
電子情報通信学会)pp. 32 -109 に記載のあるような既
知のものを用いることができる。予め、各文字カテゴリ
毎に複数の文字パターンを収集しておき、これらの特徴
量を標準パタンとして標準パタン辞書406に格納して
おく。文字識別処理402において、入力パタンがある
文字に類似しているか否か判定する場合には、Parzen D
ensity Estimation ("Statistical Pattern Recogniti
on," ISBN 0-12-269851-7)により、当該文字カテゴリ
における当該文字パタンの条件つき確率密度分布が一定
値以上か否かで判定する。すなわち、入力パタンの特徴
ベクトルxから予め設定してある半径r以内に当該文字
カテゴリの標準パタンがいくつあるかを調べ、一定値数
以上であればアクセプト、下回ればリジェクトとする。
【0038】
【発明の効果】住所の文字列の知識を用い、各パタンと
比較する標準パタンの文字カテゴリを絞り込み、住所認
識の際の処理量の削減を図ることが可能となる。また、
文字切出しに多重仮説検定法を用いる場合において、文
字識別を行う対象のパタンの数を削減することが可能と
なる。
【図面の簡単な説明】
【図1】読取り対象の住所文字列の例を示す。
【図2】読み取り対象の住所文字列を示す。
【図3】住所文字列の木構造表現の例を示す。
【図4】本発明の一実施例のデータフローを示す。
【図5】本発明において生成される探索木の生成過程の
例を示す。
【図6】切出し仮説ネットワークの例を示す。
【図7】多重仮説検定方を用いた際に本発明において生
成される探索木の生成過程の例を示す。
【図8】探索木テーブルの形式を示す。
【図9】住所木テーブルの形式を示す。
【図10】本発明の一実施例の処理フローを示す。
【図11】文字識別・探索の処理フローを示す。
【図12】本発明の構成を示す。
【図13】認識が困難な入力画像の例を示す。
【図14】行頭の欠けおよびノイズ混入に対応する処理
フローを示す。
【図15】行頭が欠けた場合の切出し仮説ネットワーク
の例を示す。
【図16】文字識別の原理の一例を示す。
【符号の説明】
401……文字切出し、402……文字識別処理、40
3……標準パターン選択処理、404……探索処理、4
05……文字列候補選択処理、407……探索木、40
8……住所木。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上田 洋 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 酒匂 裕 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 藤澤 浩道 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (56)参考文献 特開 平7−320002(JP,A) 特開 平4−289989(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 - 9/72

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】文書上に記載された画像情報を電気信号に
    変換して入力し、画像中から記載されている住所を読取
    る住所読取り方法であって、 画像上より住所の記載されている文字行を抽出する文字
    行抽出処理と、 文字行より文字パタンを切出すパタン切出し処理と、 住所中の文字の連接関係を木構造で記憶した住所木を参
    照し、住所文字列に応じて各文字パタンの文字識別対象
    の文字カテゴリを限定する文字カテゴリ限定処理と、 切出された文字パタンを文字識別する文字識別処理と、
    前記文字識別処理の結果、アクセプトとなる認識候補が
    得られた場合は住所木記憶手段に格納された木構造を探
    索し、アクセプトとなる認識候補が得られなかった場合
    は住所中の全ての文字カテゴリで識別しアクセプトとな
    る文字カテゴリに対応する接点を求め、該接点を根とす
    る住所木の部分木構造を探索する住所木探索処理とを有
    することを特徴とする住所読取方法。
  2. 【請求項2】該パタン切出し処理が文字の切出し方を一
    意に決定できない際には複数の切出し方の仮説を出力
    し、住所木探索処理が複数の文字切出しの仮説に従って
    探索を制御することを特徴とする請求項1記載の住所読
    取り方法。
  3. 【請求項3】 郵便物に記載された住所文字行の画像を抽
    出し、住所を読みとり、その結果に基づき郵便物を区分
    する郵便物宛名読取区分機において、 上記宛先情報に含まれる住所の文字行を抽出する文字行
    抽出処理、上記文字行より文字パタンを切り出すパタン
    切り出し処理、上記文字行から住所を示す文字の連接関
    係が木構造の住所木を記憶する記憶手段から住所木を参
    照し、住所文字列に応じて各文字パタンの文字識別対象
    の文字カテゴリを限定する文字カテゴリ限定処理、切り
    出されたパタンを文字識別刷る文字識別処理、前記文字
    識別処理の結果、アクセプトとなる認識候補が得られた
    場合は住所木記憶手段に格納された木構造を探索し、ア
    クセプトとなる認識候補が得られなかった場合は住所中
    の全ての文字カテゴリで識別しアクセプトとなる文字カ
    テゴリに対応する接点を求め、該接点を根とする住所木
    の部分木構造を探索する住所木探索処理、とを実行する
    処理手段を有することを特徴とする郵便区分機。
JP23803297A 1997-09-03 1997-09-03 住所認識方法及び郵便区分機 Expired - Fee Related JP3468668B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23803297A JP3468668B2 (ja) 1997-09-03 1997-09-03 住所認識方法及び郵便区分機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23803297A JP3468668B2 (ja) 1997-09-03 1997-09-03 住所認識方法及び郵便区分機

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP11052246A Division JPH11316803A (ja) 1999-03-01 1999-03-01 住所認識方法

Publications (2)

Publication Number Publication Date
JPH1185909A JPH1185909A (ja) 1999-03-30
JP3468668B2 true JP3468668B2 (ja) 2003-11-17

Family

ID=17024165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23803297A Expired - Fee Related JP3468668B2 (ja) 1997-09-03 1997-09-03 住所認識方法及び郵便区分機

Country Status (1)

Country Link
JP (1) JP3468668B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145073A (zh) * 2018-08-28 2019-01-04 成都市映潮科技股份有限公司 一种基于分词算法的地址解析方法及装置
CN112115214B (zh) * 2019-06-20 2024-04-02 中科聚信信息技术(北京)有限公司 地址标准化方法、地址标准化装置和电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04289989A (ja) * 1991-03-19 1992-10-14 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH04306786A (ja) * 1991-04-03 1992-10-29 Matsushita Electric Ind Co Ltd 文字認識装置
JPH07320002A (ja) * 1994-05-27 1995-12-08 Sanyo Electric Co Ltd 文字認識装置
JP3232991B2 (ja) * 1995-12-13 2001-11-26 株式会社日立製作所 文字読取り方法及び住所読取り方法
JP3313272B2 (ja) * 1996-01-08 2002-08-12 株式会社日立製作所 住所読み取り方法および識別関数重みベクトル生成方法

Also Published As

Publication number Publication date
JPH1185909A (ja) 1999-03-30

Similar Documents

Publication Publication Date Title
JPH11232391A (ja) 宛名読取り装置および郵便物等区分機および文字列認識方法
Koga et al. Lexical search approach for character-string recognition
CN111782892B (zh) 基于前缀树的相似字符识别方法、设备、装置和存储介质
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
Wong et al. Postprocessing statistical language models for handwritten Chinese character recognizer
JP3468668B2 (ja) 住所認識方法及び郵便区分機
JP3709305B2 (ja) 地名文字列照合方法、地名文字列照合装置、地名文字列認識装置及び郵便物区分システム
JPH09161013A (ja) 文字読取り方法及び住所読取り方法
US20050154703A1 (en) Information partitioning apparatus, information partitioning method and information partitioning program
JPH11316803A (ja) 住所認識方法
JP3145071B2 (ja) 文字認識方法および装置
KR20000035325A (ko) 문서 인식 장치 및 우편 구분기
JP2002183667A (ja) 文字認識装置及び記録媒体
JPH11312219A (ja) 宛名読取り装置および郵便物等区分機および文字列認識方法
JPH08243504A (ja) 住所読取り方法
JPH09245120A (ja) 文字切出し方法
JP2000011096A (ja) 文字認識処理装置及び方法並びに記憶媒体
JP3788262B2 (ja) 住所認識システム、及びその住所識別方法
Dengel et al. Fragmentary string matching by selective access to hybrid tries
JP2000288478A (ja) 宛先特定装置
Lucas Spatially aware rapid retrieval system (SPARRS)
JPH10174935A (ja) 宛名読取装置および文字情報読取装置
Ogata et al. A method for street number matching in Japanese address recognition
JP2001043318A (ja) 住所読取装置
JPH11272805A (ja) 文字認識方法および装置

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090905

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100905

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees