JPH09185681A - 住所読み取り方法 - Google Patents

住所読み取り方法

Info

Publication number
JPH09185681A
JPH09185681A JP8000438A JP43896A JPH09185681A JP H09185681 A JPH09185681 A JP H09185681A JP 8000438 A JP8000438 A JP 8000438A JP 43896 A JP43896 A JP 43896A JP H09185681 A JPH09185681 A JP H09185681A
Authority
JP
Japan
Prior art keywords
pattern
character
candidate
address
penalty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8000438A
Other languages
English (en)
Other versions
JP3313272B2 (ja
Inventor
Masashi Koga
昌史 古賀
Tatsuhiko Kagehiro
達彦 影広
Yutaka Sako
裕 酒匂
Hiromichi Fujisawa
浩道 藤澤
Hisao Ogata
日佐男 緒方
Yoshihiro Shima
好博 嶋
Masato Teramoto
正人 寺本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP00043896A priority Critical patent/JP3313272B2/ja
Priority to US08/763,515 priority patent/US6246794B1/en
Priority to KR1019960064613A priority patent/KR100411697B1/ko
Priority to CNB961215445A priority patent/CN1151464C/zh
Publication of JPH09185681A publication Critical patent/JPH09185681A/ja
Application granted granted Critical
Publication of JP3313272B2 publication Critical patent/JP3313272B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】文字識別や文字列照合で、文字の切り出し方が
確定できない場合でも、高い精度で文字を切り出し文字
列を認識する。 【解決手段】多重仮説検定型の文字切り出し処理におい
て、先ず従来の方法で全部の切り出し方の中からより正
しいと判断される複数の切り出し方の候補を選別し、次
いで本発明の方法である各文字パターンの大きさや前後
のパターンとの位置関係に基づき切り出し方の仮説の妥
当性を評価するための評価値(概形ペナルティ)を求め
る。この仮定は予め収集登録しサンプルを学習して求め
た線形識別関数により行う。このようにして正しい切り
出し方を判別することにより、大きさや位置関係の情報
を容易に扱えるようになる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、郵便物等の文書上
に記載された住所を読み取り、文書を区分する、住所読
取り区分装置にかかわる。
【0002】
【従来の技術】住所が記載されている文字の並び(住所
文字行)から住所を読み取るためには、以下の3つの機
能が必要である。
【0003】(1)文字パターンを切り出す。(文字切
り出し) (2)各々の文字パターンの文字種(文字コード)を識
別する。(文字識別) (3)文字の識別結果を住所文字列として解釈する。
(文字列照合) これらの内、手書きで書かれた文字行は文字のピッチの
ばらつきが大きいため、(1)の文字切り出しが特に難
しい。
【0004】従来から、手書きの文字行から正確に文字
を切り出すためには、多重仮説検定法が有効であること
が知られている。これは、文字の切り出し方に複数の仮
説を立て、文字パターンの候補を切り出した後、文字識
別や文字列照合によって正しい仮説を決定する方式であ
る。例えば、文字識別結果で仮説を検定する藤澤らの方
式(昭和59年度電子通信学会総合全国大会1558
「接触した手書き文字の自動分離を行う文字切り出し方
式」)がある。また、文字の外形により、文字パターン
の候補の切り出しの成否を判定する方式として石寺らの
方式(1995年電子情報通信学会総合大会Dー576
「手書き住所読み取りのための文字切り出し法」)があ
る。また、文字識別結果および文字列照合結果により、
仮説を検定する方式としては、村瀬等の方式(信学論
(D)vol. J69-D、 No. 9「言語情報を利用した手書き
文字列からの文字切り出しと認識」)、および大井の方
式(信学技報PRU92-40「住所読取りにおける丁目・街区
認識方式」)等がある。
【0005】この多重仮説検定方式とは、文字パターン
の候補を抽出し、文字識別や文字列照合の結果を用いて
検定する方式である。例えば、図19(b)に示す住所
文字列に対しては、図20(a)に示すような文字パタ
ーンの候補が生成される。図20(a)の中では、パタ
ーンとパターンの境界を節、パターンを弧とするグラフ
で、文字パターンの候補の関係が表現されている。この
ように、文字パターンの候補の関係をグラフで表現した
ものを切り出しグラフと呼ぶ。このように文字パターン
の候補の関係を表現すれば、文字パターンの切り出し
は、切り出しグラフの始点から終点へ至る最適な経路を
見いだす問題に置き換えられる。
【0006】
【発明が解決しようとする課題】以上述べたように従来
技術においては、例えば、図19の(a)と(b)の住
所は、どちらも(c)に示すようなパターンを含んでい
る。(c)を、1文字(「板」)に切出すか、2文字
「水反」と切り出すべきかは、文字識別結果を用いる従
来方式では判断できない。なぜなら、どちらの切り出し
方でも、切り出されたパターンを文字識別した結果、高
い類似度が得られるからである。また仮に、「中住市板
町」と「中住市水反町」の両方が住所としてあり得るな
ら、上記の二つの切り出し方のいずれが正しいかは、文
字列照合を用いる従来の方式でも判断できない。文字パ
ターンの大きさと前後のパターンとの位置関係を利用す
れば、このような場合でも正しく文字を切り出すことが
できる。例えば、(a)は文字の間隔を大きく取って書
かれているのに対し、(c)中のパターンの間隙gは小
さい。したがって、(c)は1文字だと判断できる。こ
れに対し、(b)は文字の間隔を小さく書かれており、
(c)中のパターンの間隙gは文字の間隔として解釈す
ることは妥当である。したがって、(b)では2文字だ
と判断できる。
【0007】一方、図20(a)から、文字識別結果に
より不適切な弧を削除すると、図20(b)のような切
り出しグラフになる。しかし、図19(c)の部分に
は、複数の切り出し方が候補として残っており、従来の
方法では文字切り出しを誤る可能性がある。しかし、従
来の方式では、このような前後のパターンとの関係に基
づいて文字の切り出し方を決定するのは困難であった。
例えば、藤沢等の方式、石寺らの方式は、パターン一つ
一つの妥当性を判断するものであり、前後のパターンと
の関係を利用することはできない。また、大井の方式、
村瀬等の方式は、文字列照合で各パターンの前後との関
係を利用しているが、前後の文字との間隔などの相対的
特徴量の情報は利用できない。
【0008】本発明が解決しようとする課題は、多重仮
説検定法に関わることで、文字識別結果および文字列照
合のみでは正しく切出の候補の検定ができない住所文字
行から、注目パターンおよびその前後のパターンの相対
的特徴量を利用し、正確に文字を切り出す事である。
【0009】
【課題を解決するための手段】上記の課題を解決するた
め、本発明では、多重仮説検定方式に、文字パターンの
大きさや前後のパターンとの位置関係に基づく評価値
(概形ペナルティ)を導入する。また、本発明は、種々
の切り出し誤りの仮説に対応したペナルティ算出手段を
設けることにより、大きさや位置関係の情報を容易に扱
えることを特徴とする。ここで、図20において節4と
節6の間に張られる弧に対応するパターン(以下「パタ
ーン4−6」と呼ぶ)を例に挙げて、本方法の原理を説
明する。まず、パターン4−6近傍は、実は仮説202
の破線で示された矩形のように切り出されるべきであっ
たと仮定し、この仮説が妥当かどうかを文字パターンの
大きさや前後のパターンとの位置関係に基づき評価す
る。同様に、切り出し方の辞書201中の7つの仮説に
基づきパターン4−6を評価する。この場合、以下の理
由により、仮説203が妥当と判断される。
【0010】(1) パターン4−5の間隔とパターン
5−6の間隔は、前後の間隔(パターン4−6に対する
パターン6−7、パターン3−4の間隔)と比べて十分
大きい。
【0011】(2) パターン4−5とパターン5−6
は、いずれも幅が十分に広い。
【0012】このように、仮説201中のいづれかの仮
説が妥当と判断された場合には、当該パターン(この例
ではパターン4−6)を切り出しグラフから削除する。
なお、このような判断は、あらかじめ収集したサンプル
を学習して求めた線形識別関数により行なう。このこと
により、切り出しグラフから弧を削減し、従来の方式で
は対応困難であった文字行から高い精度で文字パターン
が切り出せるようになる。また、このように切り出しの
誤り方を体系化することにより、切り出し候補の検定に
必要なパラメータの学習が容易になる。
【0013】以上のようにして本発明の実現方法は説明
されるが、このために、請求項1においては、本発明の
対象となる住所読取装置において、画像上から住所の記
載されている文字行を抽出する文字行抽出処理を行い、
ここで文字パターンを一意に定められない場合は複数の
文字パターンの候補を切り出すパターン切出処理を行
い、この切り出されたパターンを文字識別する文字識別
処理を行う。続いて、想定し得る文字切り出しの各種の
誤り方毎に、それぞれの読み出されたパターンが当該の
誤り方で切り出されたパターンであると言う仮説の妥当
性を、各パターン及びその前後複数のパターンとの相対
的特徴量に基づき概形ペナルティとして算出し、その後
に文字識別結果と概形ペナルティに応じて文字パターン
を絞り込み、予め記憶してある住所文字列の辞書と照合
する住所辞書照合処理を行うことにより住所読み取りを
行っている。
【0014】請求項2においては、上記各概形ペナルテ
ィを算出するために、正しく切り出されたパターン候補
と、誤って切り出されたパターン候補とを識別する識別
関数を用いている。
【0015】請求項3においては、上記識別関数におい
て、少なくとも各パターンの前後のパターンとの間隔を
特徴量の一つとして処理している。
【0016】請求項4においては、上記識別関数におい
て、少なくとも各パターンの前後のパターン中の間隙を
特徴量の一つとしている。
【0017】請求項5においては、上記識別関数を作成
するために、先ず文字行の画像を入力データとし、文字
パターンの切り出し方が一意に定められない場合は複数
の文字パターンの候補を切り出し、これらの文字パター
ンの候補が正しく切り出されているか否か、また、誤っ
ている場合には如何なる種類の誤りかを分類することに
より、各文字パターンの候補の切り出し誤りを判別し、
この結果に応じてパターン候補を分類格納し、更に分類
格納されているパターン候補を用いて識別関数を学習決
定する方法としている。
【0018】
【発明の実施の形態】本発明の実施の形態の一例の構成
を、図1のデータ・フロー・ダイアグラムを用いて説明
する。本明細書では、データ・フロー・ダイアグラムは
ゲーン・サクソン記法に従う(J.マーチン「ソフトウ
エア構造化技法」近代科学社、ISBN4- 7649 - 0124 - 2
C3050 P5562E)。本例は、住所の記載された面を光電
変換して得られた全体画像を入力とし、住所読取結果の
住所文字列を出力とする住所認識処理である。まず、文
字行抽出処理301により、全体画像から住所文字行を
抽出する。次に、文字パターン候補抽出処理302は、
住所文字行中より文字パターンの候補を抽出し、切り出
しグラフを生成する。概形ペナルティ算出処理303
は、各パターン候補の概形ペナルティ(p)を算出す
る。文字識別処理304は、各文字パターン候補を文字
識別し、複数の候補文字のコードと各候補文字の類似度
を出力する。パターン確信度算出処理305は、文字識
別結果の類似度、概形ペナルティを基に、各パターン候
補の確からしさ(パターン確信度)を算出する。住所辞
書照合処理306は、パターン確信度に基づきパターン
候補を取捨選択し、文字識別結果の候補文字を住所文字
列辞書と照合する。
【0019】図2は、本例の処理の手順を示す。まず、
ステップ401で、全体画像より文字行を抽出する。次
に、ステップ402で文字行中より、文字パターンの候
補を抽出し、切り出しグラフを生成する。次に、切り出
しグラフ中の全ての文字パターン候補について、制御ル
ープ403の中で、ステップ405からステップ407
を繰り返す。制御ループ403の中では、まずステップ
405で、各文字パターン候補の概形ペナルティを算出
する。次に、各文字パターン候補をステップ406で文
字識別する。次に、ステップ407で、切り出しグラフ
上の各弧に対応するパターンの確信度を計算する。制御
ループ403を終了後、ステップ404で、文字識別結
果を住所辞書と照合する。
【0020】次に、文字行抽出処理301の入力および
出力を、図3を用いて説明する。文字行抽出処理301
は、全体画像中の郵便物の像501から、住所文字行を
抽出する処理である。住所文字行とは、宛名の都道府県
名、市名から、丁目・番地までを含む矩形の領域502
のことである。宛名が2行以上に及ぶ場合は、行数分だ
けの矩型領域502を出力する。このように住所文字行
を抽出する方法としては、東芝レビュー1993 Vol. 48 N
o. 7「郵便機械における画像処理技術」3章3節にある
様な方法を用いる。
【0021】次に、文字パターン候補抽出処理302の
原理を、図4を用いて説明する。まず、住所文字行よ
り、文字の境界の候補を抽出する。図中で0から9まで
の番号(境界番号)を付与している縦棒が、境界の候補
である。境界の候補は、信学技報IE88-138「不定ピッチ
文字列を含む印刷文書における印刷文書における文字切
出手法」に記載があるような統合矩形同士の間隙とす
る。ここで、境界の右のパターンの左端のx座標から境
界の左のパターンの右端のx座標を引いた値を境界間
隙、境界の右のパターンの左端のx座標から境界の左の
パターンの右端のx座標の平均を境界座標と定義する。
例えば、境界番号4に対応する境界座標は604のx座
標、境界間隙は605で表される幅となる。次に、境界
座標の差が、文字行の高さから推定した文字サイズを越
えないような境界の組み合わせを調べ、それら境界に挾
まれるパターンを文字パターンの候補として登録する。
図4の例では、境界座標の差601及び602は推定し
た文字サイズを越えず、境界座標の差603は越える。
このため、パターン0−1とパターン0−2は登録する
が、パターン0−3は登録しない。
【0022】図5は、文字パターン候補抽出処理302
で生成される切り出しグラフの弧を表現するパターンテ
ーブルの形式を示す。パターンテーブルの各レコード
が、それぞれパターン候補一つに対応する。パターンテ
ーブルの各レコードには、パターンの輪郭を格納する領
域701がり、パターンの輪郭はチェーンコード等で記
述する。また、パターンの左側の境界の番号702、右
側の境界の番号を格納する領域703があり、境界の番
号は、図4に示すように、文字行の左端を0番とし、左
から右へ順に1刻みに増えるよう定める。さらに、文字
識別の結果の候補文字を格納する領域704があり、本
実施の形態では、類似度が高い順に最大3文字の候補文
字を格納する。上記領域704に格納した候補文字の類
似度を格納する領域705があり、候補文字、類似度は
左詰めとし、候補文字数が3以下の場合には、候補文字
の領域の余白にはヌルコードを、類似度の領域の余白に
は0を埋める。なお、パターン確信度を格納するために
領域706がある。
【0023】図6は、文字パターン候補抽出処理302
で生成される切り出しグラフの節を表現する境界テーブ
ルの形式を示す。本テーブルの各レコードが1つの境界
を表す。各レコードは境界番号801、境界座標80
2、境界間隙803をそれぞれ格納する領域である。
【0024】文字識別処理304は、例えば森「パター
ン認識」(ISBN4 - 88552 - 075 -4 C3055、電子情報通
信学会)pp. 32 - 109 に記載のあるような既知の方式
を用いて実現する。文字識別対象のカテゴリーは、漢
字、平仮名、片仮名、アラビア数字および記号のうち、
地名もしくは丁目・街区で用いられるものとする。文字
識別の出力としては、複数の候補文字および各候補文字
の標準パターンに対する入力パターンの類似度が得られ
るものとする。
【0025】次に、概形ペナルティ算出処理303の構
成を、図7のデータ・フロー・ダイアグラムを用いて説
明する。本処理の入力である文字パターン候補は、パタ
ーンテーブル中の1つのレコードおよび境界テーブルで
表現される。ここで、各パターンの候補に対し、それが
誤って切り出されたものであるという仮定を評価する処
理として、切り出し誤り仮説評価処理901、902、
903等を行う。本実施の形態では、図8に示す切り出
し誤りの種類E1からE7に対応する7種類の切り出し
誤り仮説評価処理を用いる。切り出し誤り仮説評価処理
の出力piは、大きければ大きいほど切り出し誤り仮説
が確からしい事を示す。これらの切り出し誤り仮説評価
の出力piは、処理904で加算され、概形ペナルティ
pとして出力される。
【0026】図8は、切り出し誤りの仮説の種類を説明
する図である。図中で、黒い太線は注目しているパター
ン候補を、破線の矩形は正しい文字パターンの外接矩形
を、白抜きの線は注目しているパターン候補の周辺のパ
ターンの一部を表す。例えば、E1は注目しているパタ
ーン候補が実は文字の左側の一部を誤って切り出したも
のであるという仮説を表す。また、E7は注目している
パターン候補が実は2文字を誤って1つのパターンとし
たものであるという仮説を示す。
【0027】図9は、切り出し誤り仮説評価処理の構成
を示すデータ・フロー・ダイアグラムである。本処理の
入力であるパターン候補はパターンテーブル中の1つの
レコードおよび境界テーブルで表現される。ここで、仮
説評価処理1101は、図7の仮説評価処理901、9
02、903等の切り出し誤り仮説評価処理のいづれか
に対応する。特徴量抽出処理1102は、入力された文
字パターン候補から、文字パターンの大きさや前後のパ
ターンとの位置関係等の特徴量を抽出する。特徴量は、
以下の式で表わされるn次元のベクトルとする。
【0028】F = (f1、f2、・・、fn) 次に、処理1103で、特徴量Fより、piをもとめ
る。piは、正しく切り出された候補パターンとEiの
ような誤りをした候補パターンを識別する線形識別関数
の値であり、以下のような式で定義できる。
【0029】pi = F・Vi + ci(F・V
i:ViとFの内積) ここで Vi:線形識別関数の重みベクトル ci:定数 Vi、ciは、後述する方法で予め学習しておき、パラ
メータ辞書1104に記憶しておく。本例とは別の例と
して、文字識別結果の候補文字に応じて、パラメータ辞
書を切替えてもよい。
【0030】図10に、本例で用いる特徴量を説明す
る。図中で、黒い太線で表されたパターン1201は注
目している文字パターン候補を、白抜きで表されたパタ
ーン1202、1203は周辺のパターンを示す。ま
た、破線の矩形は、各パターンに外接する矩形を示す。
本例では、特徴量の次元数n=6とし、各次元fjは以
下のように定義する。
【0031】 f1:注目しているパターンの高さ f2:注目しているパターンの幅 f3:注目しているパターンと左隣のパターンの間隔 f4:注目しているパターンと右隣のパターンの間隔 f5:注目しているパターン中の最大の間隙 f6:注目しているパターン中の連結成分数 本例では、全ての切り出し誤り仮説評価処理で同じ特徴
量を用いるが、各々の処理で異なる特徴量を用いてもよ
い。また、各特徴量を、文字行の高さh等の文字行の全
体的な特徴量で正規化してもよい。
【0032】図11は、切り出し誤り仮説評価法の原理
を示す。座標軸1301、1302は、実際にはn次元
である特徴空間を仮想的に示す。パターングループ13
03は、正しく切り出されている文字パターン候補の特
徴量Fの分布、パターングループ1304は、切り出し
誤り仮説Eiが真である文字パターン候補の特徴量Fの
分布を示す。図中のWiは、パターングループ1303
及び1304を識別する識別関数の重みベクトルであ
り、これらグループ1303と1304を識別する識別
平面B1305であり、Wiと直交する。ここで a:原点から超平面Bまでのユークリッド距離 とすると、超平面Bは、以下の式を満たすFの集合とし
て表わされる。
【0033】(Wi・F)=a・|Wi| (Wi・F:WiとFの内積、|Wi|:Wiのノル
ム) また、グループ1303と1304を識別する線形識別
関数の値dは、以下のようになり、d>0ならばFはグ
ループ1304に、d<0ならグループ1303と識別
される。
【0034】d = (Wi・F) − a・|Wi| Wiおよびa・|Wi|は、鳥脇「認識工学」(ISBN4
- 339 - 01059 - 6 C3355 P2781E、コロナ社)pp. 113
- 119の様な方式でもとめられる。しかし、このdの値
をそのままpiとして用いるのは、各Eiの特徴空間上
での分布が異なるため、適切でない。このため、以下の
式のように正規化した線形識別関数の値をpiとして用
いる。
【0035】 pi = d/(s・|Wi|) = (Wi・F)/(s・|Wi|) − a/s (s:1303と1304をあわせた集合に対するdの
分散) したがって、パラメータ辞書1104に格納するVi、
ciは、以下の様に求められる。
【0036】Vi = Wi/(s・|Wi|) ci = a/s 次に、パターン確信度算出処理305の概略を説明す
る。パターン確信度とは、切り出しグラフ上の各弧、す
なわち各パターン候補が、どれだけ確からしいかを示す
尺度であり、以下の式で求める。
【0037】(パターン確信度)={ c1・(1位候
補文字類似度)−c2・p} 式中のpは概形ペナルティである。また、c1、c2は
定数であり、システム毎に適宜調整する。
【0038】次に、住所辞書照合処理306の構成を、
図12のデータ・フロー・ダイアグラムを用いて説明す
る。本処理の入力であるパターン候補、パターン確信度
候補文字、類似度は、パターンテーブルおよび境界テー
ブルにより渡される。まず、パターン確信度が一定値以
下のパターン候補を、パターン候補選別処理1401で
選別する。図20(a)の例では、パターン0−2、0
−3等が、文字識別結果の類似度が小さいために、パタ
ーン確信度も小さくなり削除され、図20(b)のよう
になる。また、パターン4−6が、概形ペナルティが大
きいために、パターン確信度も小さくなり、削除され
る。次に、辞書照合処理1403で、各パターン候補に
対応する文字識別結果の候補文字を、あらかじめ住所文
字列辞書1404に格納してある住所文字列と照合し、
照合に成功した住所文字列の候補(候補文字列)を出力
する。候補住所文字列ソート1405は、候補文字列を
照合確信度の大きい順に並べ変え、住所読取結果として
出力する。照合確信度とは、文字識別結果の候補文字と
候補文字列を照合した際の一致の度合いであり、照合確
信度の値が大きい程、当該候補文字列は確からしい候補
と推定できる。
【0039】図13は、辞書照合処理1403の処理の
概略を示す。本処理では、文字識別結果に基づいて生成
したオートマトンが受理する住所文字列を、住所文字列
辞書1404中より選び出す。オートマトンが受理する
住所文字列を求める方式は、丸川等の方式(情報処理学
会論文誌第35巻第6号「手書き漢字住所認識のための
エラー修正アルゴリズム」)に準じる。ここで図13に
おける中央の枠は、補パターン選別後、文字識別結果の
候補文字より生成したオートマトン1501を模式的て
おり、パターン間の境界が状態、文字識別結果の候補文
字が遷移である。各状態の番号は、切り出しグラフの節
の番号と同じにしてある。なお、オートマトンは、パタ
ーンテーブルと同じ形式のテーブルで実現する。オート
マトン1501中の太線は、住所文字列辞書1404中
の文字列1503(「中住市水反町12」)が、どのよ
うな遷移を経てオートマトン1501に受理されたかを
示す。このように、住所文字列辞書1404中の文字列
が受理された場合には、当該文字列を候補文字列の一つ
として出力する。また、照合確信度mcは、照合の際の
各遷移に対応する確信度tc(遷移確信度)の総和とす
る。
【0040】mc = Σtc 遷移確信度は、以下の式で求める。
【0041】 tc = { c1・sm−c2・p}・jm ただし sm:各遷移に対応する候補文字の類似度 jm:遷移の前後の状態番号の差 式中の定数c1、c2は、パターン確信度を求めるのに
用いたものと同じものを用いる。図13の例では、文字
列「中住市水反町11」も受理され、住所認識結果15
02に出力される。しかし、後者の場合は、前者より小
さい類似度の候補文字を使って受理されているため、照
合確信度は小さくなる。
【0042】図14は、本実施の形態におけるハードウ
エア構成を示す。上に述べてきた本発明の実施形態の例
は、同図のような郵便物宛名読み取り区分機の、住所読
み取りを司る認識装置1604に適用される。図中の太
線は、郵便物の流れを示す。画像はスキャナ1601に
より入力される。ここで、住所読取り時間を確保するた
めに郵便物搬送路上にディレイライン1602が設けら
れている。この住所読み取り結果に基づき郵便物はソー
タ1603により区分される。スキャナ1601と認識
装置1604は入出力用ケーブル1612で接続する。
ソータ1603と認識装置1604は、入出力用ケーブ
ル1613で接続する。認識装置1604には、認識装
置内部の各部分を接続するためのバス1611、スキャ
ナ1601との通信を司る入出力用インタフェース16
05、認識装置全体の制御および住所認識処理を司る演
算処理装置1606、ソータ1603との通信を司る入
出力用インタフェース1607、起動等の操作を行うた
めのキーボード1608、実行状況を必要に応じ表示す
るためのCRT1609、住所認識に必要なテーブル、
プログラム、辞書などを格納するためのメモリ1610
を備える。
【0043】図15は、図9における切り出し誤り仮説
評価1101に用いるパラメータ辞書1104を学習す
るためのサンプルを収集するためのサンプル収集ツール
の表示画面の例である。図15において、1701は画
面を表示するCRTであり、1702は文字行画像表示
用のウインドウである。ウインドウ内には文字行画像全
体が表示されるが、この中で現在注目しているパターン
は、色を変えて表示する(図中の黒太線で描かれた部
分)。オペレータは、ウインドウ1702中の画像を観
察し、これが正しく切り出されたパターンか、誤ってい
るか、誤っている場合には図8のどの誤り方かを判断
し、それぞれに対応するボタンをマウスカーソル170
4でクリックする。ボタンは、パネル1703上に配置
する。ボタンのクリックのイベントを受けると、サンプ
ル収集ツールは、注目していたパターンの特徴量を、誤
りの種類に対応したファイルに格納し、新たなパターン
をウインドウ1702に表示する。
【0044】図16は、図9におけるパラメータ辞書1
104を学習するためのシステムのデータ・フロー・ダ
イアグラムである。あらかじめ収集された文字行画像D
B(データベース)1801を用いて、上記のサンプル
収集ツール1802が切り出し正解のパターンDB(デ
ータベース)1803、および図8における切り出し誤
りの仮説における各種パターンデータベースE1からE
7に対応した切り出し誤りのパターンDB(1804、
1805等)を生成する。学習ツール1806は、切り
出し正解のパターンDB1803およびE1に対応した
切り出し誤りパターンのデータベース1804を入力と
し、図11で説明したような方式でV1、c1を求め、
パラメータ辞書1808に出力する。以下、E2からE
7に対応した切り出し誤りのパターンデータベース(1
805等)に対しても同様に、学習ツール(1807
等)を用いてVi、ciを求め、パラメータ辞書180
8に出力する。
【0045】図17は、パラメータ辞書を格納するテー
ブルの形式を示す。テーブル中の各レコード pdic[i]
に、各Eiに対応するパラメータ、Vi、ciを格納す
る。例えば、テーブルの先頭1903は pdic[1] に対
応し、V1、c1を格納する。また、先頭からi番目レ
コード目1904は pdic[i] に対応し、Vi、ciを
格納する。各レコードにおいて、ciは領域1901に
格納され、Viは領域1902に格納される。
【0046】図18は、概形ペナルティ算出処理の処理
手順を示す。まず、ステップ2001で変数pを0に初
期化する。次に、制御ループ2002で、変数iをイン
クリメントしながら、ステップ2003、2004を繰
り返す。ステップ2003は、切り出し誤り仮説評価を
起動するステップである。ステップ2004は、切り出
し誤り仮説評価の結果得られたpiを、pに加算するス
テップである。ステップ2008は、変数pを概形ペナ
ルティとして出力する。ステップ2005から2006
は、切り出し誤り仮説評価を行なうサブルーチンの処理
手順を示す。ステップ2005は変数piにパラメータ
辞書より読み込んだciの値(pdic[i].c)を代入する
ステップである。ステップ2006は、特徴抽出によっ
てえられたFとパラメータ辞書より読み込んだViの内
積を求めるための制御ループで、特徴量の次元数だけ変
数jをインクリメントしながら、Viの各次元の値(pd
ic[i].v[j])とFの各次元の値(f[j])の積をpiに加
算する。
【0047】
【発明の効果】以上の本発明の方法により、文字識別結
果および文字列照合のみでは正しく切り出しの候補の検
定ができない住所文字行からでも、文字パターンの大き
さと前後のパターンとの位置関係を利用し、正確に文字
を切り出す事が可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態の一例を示す構成図。
【図2】本発明の実施の形態の一例における処理手順を
示す図。
【図3】郵便物の全体画像と文字行の関係を示す文字配
置図。
【図4】パターンと境界の関係を示す図。
【図5】切り出しグラフの弧の格納するパターンテーブ
ルの形式を示す図表。
【図6】切り出しグラフの節の格納するノードテーブル
の形式を示す図表。
【図7】概形ペナルティ算出処理の手順を示すデータ・
フロー・ダイヤグラム図。
【図8】切り出し誤りの仮説の種類を示すデータ・フロ
ー・ダイヤグラム図。
【図9】切り出し誤り仮説評価処理の手順を示す図。
【図10】切り出し誤り仮説評価処理に用いる特徴量を
示す図。
【図11】切り出し誤り仮説評価処理の原理を示す図。
【図12】住所辞書照合処理の手順を示すデータ・フロ
ー・ダイヤグラム図。
【図13】辞書照合処理の原理を示す図。
【図14】本発明の実施形態の一例を示すハードウエア
構成図。
【図15】サンプル収集ツールの表示画面の例を示す
図。
【図16】パラメータ辞書を学習するためのシステム構
成図。
【図17】パラメータ辞書の格納形式を示す図表。
【図18】概形ペナルティ算出処理の手順を示すフロー
チャート図。
【図19】読取り対象の住所文字列の例を示す図。
【図20】切り出しグラフおよび切り出し誤り仮説の例
を示す図。
【符号の説明】
301……文字行抽出処理、302……文字パターン候
補抽出処理、303……概形ペナルティ算出処理、30
4……文字識別処理、305……パターン確信度算出、
306……住所辞書照合処理、501……郵便物の
像 502……宛名住所書き込み領域 601……境界座標の差 602……境界座
標の差 603……境界座標の差 604……境界座
標 605……境界間隙 701……パター
ン輪郭格納領域 702……パターン左側境界番号欄 703……パター
ン右側境界番号欄 704……候補文字格納領域 705……候補文
字類似度格納領域 706……パターン確信度格納領域 801……境界番
号欄 802……境界座標欄 803……境界間
隙欄 1101……切り出し誤り仮説評価処理 1201……注目文字パターン候補 1202……周辺パターン 1203……周辺
パターン 1301……座標軸 1302……座標
軸 1303……正しく切り出されている文字パターン候補
グループ 1304……切り出し誤り仮説が真である文字パターン
候補グループ 1404……住所文字列辞書 1502……住所
認識結果 1604……認識装置 1611……バス 1612……入出力ケーブル 1613……入出
力ケーブル 1701……CRT表示画面 1702……文字
画像表示ウインドウ 1703……パネル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤澤 浩道 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 緒方 日佐男 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 嶋 好博 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 寺本 正人 愛知県尾張旭市晴丘町池上1番地 株式会 社日立製作所オフィスシステム事業部内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】文書上に記載された画像情報を電気信号に
    変換して入力する画像入力手段と、画像中より記載され
    ている住所を読取る手段とを有する住所読取装置におい
    て、 画像上より住所の記載されている文字行を抽出する文字
    行抽出処理と、 文字パターンの切り出し方を一意に定められない場合は
    複数の文字パターンの候補を切り出すパターン切り出し
    処理と、 切出されたパターンを文字識別する文字識別処理と、 想定しうる文字切り出しの各種の誤り方毎に、各々のパ
    ターンが当該の誤り方で切り出されたパターンであると
    いう仮説の妥当性を、各パターンおよびその前後複数の
    パターンとの相対的特徴量に基づき概形ペナルティとし
    て算出する処理と、 文字識別結果および概形ペナルティに応じて文字パター
    ンの候補を絞り込み、予め記憶してある住所文字列の辞
    書と照合する住所辞書照合処理とを順次実行することを
    特徴とする住所読取方法。
  2. 【請求項2】請求項1における各概形ペナルティ算出処
    理として、正しく切り出されたパターン候補と誤って切
    り出されたパターン候補とを識別する識別関数を用いる
    ことを特徴とする住所読取方法。
  3. 【請求項3】請求項2における識別関数において、少な
    くとも各パターンの前後のパターンとの間隔を特徴量の
    一つとすることを特徴とする住所読取方法。
  4. 【請求項4】請求項2における識別関数において、少な
    くとも各パターン中の間隙を特徴量の一つとすることを
    特徴とする住所読取方法。
  5. 【請求項5】請求項2における各概形ペナルティ算出処
    理の識別関数を作成する方法において、 文字行の画像を入力とし、文字パターンの切り出し方を
    一意に定められない場合は複数の文字パターンの候補を
    切り出すパターン切り出し処理と、 文字パターンの候補が正しく切り出されているか否か、
    誤っている場合には如何なる種類の誤りかを分類する切
    り出し誤り種類判別処理と、 各文字パターンの候補を切り出し誤り判別処理の結果に
    応じて分類して格納するパターン格納手段と、 パターン格納手段によって格納されている文字パターン
    候補を用いて識別関数を学習する処理とを順次実行する
    ことを特徴とする住所読取方法。
JP00043896A 1995-12-13 1996-01-08 住所読み取り方法および識別関数重みベクトル生成方法 Expired - Fee Related JP3313272B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP00043896A JP3313272B2 (ja) 1996-01-08 1996-01-08 住所読み取り方法および識別関数重みベクトル生成方法
US08/763,515 US6246794B1 (en) 1995-12-13 1996-12-11 Method of reading characters and method of reading postal addresses
KR1019960064613A KR100411697B1 (ko) 1995-12-13 1996-12-12 문자판독방법및주소판독방법
CNB961215445A CN1151464C (zh) 1995-12-13 1996-12-13 读取字符的方法和读取邮政地址的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00043896A JP3313272B2 (ja) 1996-01-08 1996-01-08 住所読み取り方法および識別関数重みベクトル生成方法

Publications (2)

Publication Number Publication Date
JPH09185681A true JPH09185681A (ja) 1997-07-15
JP3313272B2 JP3313272B2 (ja) 2002-08-12

Family

ID=11473826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00043896A Expired - Fee Related JP3313272B2 (ja) 1995-12-13 1996-01-08 住所読み取り方法および識別関数重みベクトル生成方法

Country Status (1)

Country Link
JP (1) JP3313272B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185909A (ja) * 1997-09-03 1999-03-30 Hitachi Ltd 住所認識方法
CN102194101A (zh) * 2010-03-15 2011-09-21 欧姆龙株式会社 字符串检测装置和方法、字符评价装置和方法
JP2012008909A (ja) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2013186906A (ja) * 2012-03-09 2013-09-19 Fujitsu Ltd 画像中の文字列を認識する方法及び装置
JP2015170130A (ja) * 2014-03-06 2015-09-28 株式会社東芝 認識装置、認識方法およびプログラム
JP2015170129A (ja) * 2014-03-06 2015-09-28 株式会社東芝 認識装置、認識方法およびプログラム
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2016212473A (ja) * 2015-04-30 2016-12-15 富士ゼロックス株式会社 情報処理装置および情報処理プログラム
US10438097B2 (en) 2015-05-11 2019-10-08 Kabushiki Kaisha Toshiba Recognition device, recognition method, and computer program product
US10515297B2 (en) 2015-05-11 2019-12-24 Kabushiki Kaisha Toshiba Recognition device, recognition method, and computer program product

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185909A (ja) * 1997-09-03 1999-03-30 Hitachi Ltd 住所認識方法
CN102194101A (zh) * 2010-03-15 2011-09-21 欧姆龙株式会社 字符串检测装置和方法、字符评价装置和方法
JP2012008909A (ja) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2013186906A (ja) * 2012-03-09 2013-09-19 Fujitsu Ltd 画像中の文字列を認識する方法及び装置
US9280725B2 (en) 2013-02-14 2016-03-08 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2015170130A (ja) * 2014-03-06 2015-09-28 株式会社東芝 認識装置、認識方法およびプログラム
JP2015170129A (ja) * 2014-03-06 2015-09-28 株式会社東芝 認識装置、認識方法およびプログラム
JP2016212473A (ja) * 2015-04-30 2016-12-15 富士ゼロックス株式会社 情報処理装置および情報処理プログラム
US10438097B2 (en) 2015-05-11 2019-10-08 Kabushiki Kaisha Toshiba Recognition device, recognition method, and computer program product
US10515297B2 (en) 2015-05-11 2019-12-24 Kabushiki Kaisha Toshiba Recognition device, recognition method, and computer program product

Also Published As

Publication number Publication date
JP3313272B2 (ja) 2002-08-12

Similar Documents

Publication Publication Date Title
US6246794B1 (en) Method of reading characters and method of reading postal addresses
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
US6081620A (en) System and method for pattern recognition
EP1362322B1 (en) Holistic-analytical recognition of handwritten text
US20040006467A1 (en) Method of automatic language identification for multi-lingual text recognition
JPH1091712A (ja) 文書分析システムおよび文書分析プロセス
US7769235B2 (en) Text recognition method using a trainable classifier
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
Koga et al. Lexical search approach for character-string recognition
WO2007070010A1 (en) Improvements in electronic document analysis
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
US20230084845A1 (en) Entry detection and recognition for custom forms
US20210319247A1 (en) Text classification
JP3469375B2 (ja) 認識結果の確信度決定方法及び文字認識装置
JPH06180771A (ja) 英文字認識装置
JPH09245120A (ja) 文字切出し方法
JP3925011B2 (ja) パターン認識装置及び認識方法
JP3374762B2 (ja) 文字認識方法及びその装置
JP3468668B2 (ja) 住所認識方法及び郵便区分機
Nisar et al. A statistical feature based decision tree approach for hand gesture recognition
JP2000251015A (ja) 相似文字判別方法および相似文字判別装置、並びに相似文字判別プログラムを記録した記憶媒体
JPH08243504A (ja) 住所読取り方法
Arlazarov et al. Characteristics of optical text recognition programs
JP2000207491A (ja) 文字列読取方法及び装置
JPH11312219A (ja) 宛名読取り装置および郵便物等区分機および文字列認識方法

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080531

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090531

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100531

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees