JPH09161013A - 文字読取り方法及び住所読取り方法 - Google Patents

文字読取り方法及び住所読取り方法

Info

Publication number
JPH09161013A
JPH09161013A JP7324516A JP32451695A JPH09161013A JP H09161013 A JPH09161013 A JP H09161013A JP 7324516 A JP7324516 A JP 7324516A JP 32451695 A JP32451695 A JP 32451695A JP H09161013 A JPH09161013 A JP H09161013A
Authority
JP
Japan
Prior art keywords
character
pattern
hypothetical
dictionary
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7324516A
Other languages
English (en)
Other versions
JP3232991B2 (ja
Inventor
Tatsuhiko Kagehiro
達彦 影広
Masashi Koga
昌史 古賀
Yutaka Sako
裕 酒匂
Hiromichi Fujisawa
浩道 藤澤
Hisao Ogata
日佐男 緒方
Yoshihiro Shima
好博 嶋
Shigeru Watanabe
成 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP32451695A priority Critical patent/JP3232991B2/ja
Priority to US08/763,515 priority patent/US6246794B1/en
Priority to KR1019960064613A priority patent/KR100411697B1/ko
Priority to CNB961215445A priority patent/CN1151464C/zh
Publication of JPH09161013A publication Critical patent/JPH09161013A/ja
Application granted granted Critical
Publication of JP3232991B2 publication Critical patent/JP3232991B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】郵便物等の手書きの住所文字列を効率よく読取
る。 【解決手段】住所文字行の画像情報から仮の文字切出し
を行い(206)、仮説文字パターンのテーブル219
を作り、仮説文字パターンをについての文字識別を行い
(207)、特に、住所文字列の街区部の文字に対し
て、仮説文字パターンの周辺情報(縦横長、縦横比、パ
ターンの前後の隙間等)を抽出し(212)、その情報
を用いて精度良く文字切出しを行う(215)。 【効果】文字切出し精度が向上し、住所文字列の認識精
度の向上につながる。手書きの宛名文字列に対する文字
切出し、漢数字で縦方向に記述されている文字列に対す
る文字切出しの精度が向上する。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は文字読取り方法に関
し、特に郵便物等に記載されている住所文字列を読取る
場合いに好ましい文字読取り方法に関する。
【0002】
【従来の技術】郵便物の宛名自動読取りを自動的に行う
方法として、通便物上に記載された宛名の都道府県名、
市区群名、町名等の地名を電子装置等で自動適に読み取
る方法が種々考案されており、例えば特許出願公開平2
−64882号では、住所の先頭から町名までの文字列
と丁目番地部分の文字列において異なった文字切出し処
理を行って宛名を認識している。また、郵便物上の宛名
記載領域を検出する方法として特許出願公開平5−15
1389号があり、これは郵便番号位置を検出してこの
位置から宛名記載領域を検出する方法である。宛名記載
領域から文字行を切出す方法としては特許出願公告昭6
0−41396号があり、これは記載されている文字等
のブロックパターンの高さを検出し、同じ高さのパター
ンを行として検出する方法である。切出された文字行の
縦横書き判別法には特許出願公開昭63−18785号
があり、これは宛名領域の文字群の水平方向周辺長と垂
直方向周辺長を求め、これらの周辺長を比較することに
より文字群の行方向を判別する。
【0003】文字行からの個々の文字切出す技術に関し
ては、電子通信学会論文誌(D)J68−D,No.1
2、第2123頁ないし第2131頁に示されているよ
うに、文字幅、文字ピッチ、文字間隔等を基に文字切出
しを決定している。その他に、電子通信学会(D)J6
8−D, No.4,第765頁ないし第772頁に示
されているように、文字識別結果の情報を用いて文字切
出しを決定する方法もある。しかし、これも分離文字、
特に縦書きの漢数字の羅列における文字切出しの曖昧性
を解決するには不十分である。
【0004】
【発明が解決しようとする課題】上記従来技術、特に文
字行からの個々の文字切出しに関しては、文字パターン
の文字幅、文字ピッチ、文字間隔等の特徴量を用いた
り、文字識別結果得られる候補文字の類似度を用いて文
字切出しを決定する方法では、手書き文字列の場合、文
字幅、文字ピッチ、文字間長等の特徴量は一定でなく、
曖昧なため、これらの情報を基に手書き文字列における
文字切出しを決定するのは難しく、正確な文字切出しは
困難であった。また、パターンの縦横長、縦横比、パタ
ーンの前後の隙間等の特徴量と、文字識別結果得られる
候補文字の類似度を統合して文字切出しを決定した場合
でも、文字種に応じて最適な縦横長、縦横比、文字間隔
等が異なっており、文字切出しの情報として用いるには
不十分である。例えば、図1の宛名記載面101のに示
すように、丁目番地記載部分(以下街区記載部分とも略
称)102の漢数字「三−二−一」の場合、パターンの
縦横長、縦横比は文字種に依存して大きく変動するた
め、文字切出しに曖昧性が生じ多様な認識結果の解釈が
存在する。そのため、103に示すように、街区記載部
分の文字切出しの曖昧性により発生する多様な認識結果
(6通り)が予想される。認識結果104は正しい認識
結果である。
【0005】従って、本発明の目的はこの問題を解決
し、文字行から各文字を精度よく識別する文字読み取り
方法を実現することである。本発明の他の目的は町域記
載部分と街区記載部分からなる住所文字を精度良く読み
取る方法を実現することである。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、本発明の文字読み取り方法は、画像入力装置によっ
て電子画像化された識別すべき文字行中の連結成分(例
えば黒画素の連続であるストローク)を組み合わせて、
文字として可能性のある複数の文字切出しを行う(この
切り出したパターンを以下仮説文字パタンと略称)第1
ステップと、上記仮説文字パターンに対し文字識別用辞
書を参照し文字識別し、その文字識別結果(認識候補文
字及びその類似度)を上記仮説文字パターンの補助情報
として得る第2ステップと、上記補助情報に加えて、上
記仮説文字パターン周辺情報と得る第3ステップと、上
記第2ステップで得えた認識候補文字をキーとして文字
の周辺情報をもつ切出用辞書を参照し、上記第3ステッ
プで抽出した上記仮説文字パターンの周辺情報の確信度
を求め、仮説文字パターンの重み付けをする第4ステッ
プと、上記仮説文字パターンの重み付けを用いて文字切
出しを決定する第5ステップと、上記第5ステップによ
り決定された文字切出し結果から生成された文字識別結
果の集合を基に文字識別辞書を用いて単語照合を行い上
記識別すべき文字情報の認識を行い上記文字行を読み取
る第6ステップをもつ。
【0007】また、上記文字文字読み取り方法を用いて
町域と街区が書かれた住所の文字列の読み取りを行う場
合、上記住所の文字列を含む画像情報を電気信号に変換
し、電気信号の画像情報から上記住所の文字列の文字行
領域を切出し、上記第1ステップによって切出された文
字行中の連結成分を組み合わせて、複数の仮説文字パタ
ーンを生成する。
【0008】上記複数の仮説文字パターンのそれぞれに
対し文字識別用辞書をもちいて文字識別し、上記仮説文
字パターンに類似する候補文字の情報を得る。上記候補
文字の情報を用いて町域辞書を参照して上記住所の町域
の読み取りを行うと共に、上記街区の先頭位置を検出す
る。町域辞書は有りうる全ての町名が格納されている。
【0009】上記街区の先頭位置を検出すると、街区の
仮説文字パターンのパターン周辺情報を求め、そのパタ
ーン周辺情報を基に文字切出用辞書を参照し上記パター
ン周辺情報の確信度を求める。上記確信度を考慮し上記
街区の文字に対する上記仮説文字パターンの文字切りだ
しの再決定を行い、上記再決定において得られた上記仮
説文字パターンに類似する候補文字の情報を用いて街区
辞書を参照し上記街区の文字の読み取りを決定する。街
区辞書は街区として有りえる全ての街区の文字情報が格
納されている。
【0010】上述のように本発明の文字読み取り方法
は、識別すべき文字行の切出しを、文字識別により得ら
れる類似度を文字切出しに反映する手法と、文字パター
ンの縦横長、縦横比、パターン間隔長の特徴量を文字切
出しに反映する手法を統合することにより、互いの手法
の短所を補い合い、有効な情報を最適に用いて、文字列
の認識において、文字幅、文字ピッチ、文字間隔等が不
規則であっても、正確な文字切出しを可能にしている。
【0011】また、手書き文字列の認識における文字切
出しで、全ての文字に対して共通の文字幅、文字ピッ
チ、文字間隔長を推定し、その推定値を元に文字切出し
を行うことが困難であるという問題に対しては、文字切
出し仮説検定用の文字切出辞書を用意し、文字識別結果
の文字種をキーにして辞書を参照して文字パターンの特
徴量と比較し、確信度を算出して文字切出しに反映す
る。
【0012】この文字切出辞書に、予め各特徴量に対す
るパターンの確信度として尤度分布を算出し辞書に格納
しておく。ただし、この確信度の算出には、多大な労力
と時間、経験的知識が必要であるという問題があるが、
本発明によると、文字切出し仮説を画面に表示し、正解
の文字切出し仮説を選択する作業のみにより、文字種毎
に最適な重み付けの確信度を生成することが可能にな
る。
【0013】
【発明の実施の形態】図2は本発明による文字読み取り
方法の一実施の形態を示す処理フロー図である。本実施
の形態は文字読み取り方法を宛名の住所の自動読み取り
に適用したものである。町域と街区からなる住所の読み
取り処理は、郵便物等の宛名記載面201を撮像手段
(スキャナ部)により画像入力として取り込み(20
2)、画像入力から、住所情報のみを含んだ住所記載領
域の情報を抽出し(203)、上記住所記載の情報から
文字行の切り出しを行う(204)。文字行の切出しが
行われた画像情報は縦横書き判定で、文字行中の文字列
が縦書きか横書きかを判定し(205)、その判定結果
を用いて縦横書きの処理モードの切り替えをする(22
1)。
【0014】次ぎに、文字行の中の文字黒画素の塊(連
結成分)の組み合わせにより、文字を構成する可能性が
ある所で文字切出しの処理を行う。以下、この文字切出
し処理を文字切出し仮説生成(206)と略称し、切出
し仮説生成で切り出された文字パターンを仮説文字パタ
ーンと略称する。複数の仮説文字パターンの中には読み
取るべき正しい文字パターンの他に不適当なパターンが
含まれている。生成された仮説文字パターンをパターン
テーブル219に登録する。仮説文字パターン及びパタ
ーンテーブル219については図6及び図7によって詳
細に説明する。
【0015】パターンテーブル219に登録された全て
の仮説文字パターンに対して文字識別辞書208を用い
て文字識別を行う(207)。上記文字識別は各仮説文
字パターンに類似した複数の認識候補文字、各認識候補
の仮説文字パターンに対する類似度、文字行における仮
説文字パターンの位置、連結成分数等の情報をそれぞれ
の仮説文字パターンの属性情報として求める。上記認識
候補文字及び属性情報をパターンテーブル219に各仮
説文字パターンに対して書き込む。上記認識候補文字及
び属性情報が書き込まれたパターンテーブル219を基
に仮説文字パターンの中から文字切出しとして妥当なも
のを選択し、文字切出しを決定する(209)。文字切
出し決定により選択された仮説文字パターンに対応した
認識候補文字列を基に認識候補文字列の集合を作る(2
10)。この認識候補文字列の集合には、仮説文字パタ
ーン毎に下位候補文字までの文字種を登録する。この登
録された文字種をラティスと呼ぶ。
【0016】このラティスを用いて町域辞書220を用
いて町域照合を行い(211)、住所の町域部の文字と
して妥当な文字列を生成する。町域辞書220は町域と
して有りうる全ての町域名称が記載されているものであ
る。また、町域照合211により町域を記載した文字の
読み取りが完了すると共に、町域を記載した文字の最後
尾の文字が確定し、この次が街区先頭位置であるという
街区先頭位置情報を得る。
【0017】上記街区先頭位置情報を得て、パターンテ
ーブル219中の街区部分のみについて仮説文字パター
ンの縦長、横長、縦横比、パターン間隔長、連結成分数
(パターン周辺情報と呼ぶ)の情報を抽出する(21
2)。抽出されたパターン周辺情報に対する確信度を文
字切出用辞書214を用いて算出する(213)。算出
された確信度は対応した仮説文字パターンの属性として
パターンテーブル219中に書き込まれる。上記確信度
を利用してパターンテーブル219中の仮説文字パター
ンを選び直す、すなわち、文字切出し決定209の際に
選ばれた仮説文字パターンと街区部分のみ異なった文字
切出し再決定が行われる(215)。文字切出し再決定
215が行われた後に、その情報を基にラティス再生成
を行う(216)。再生成されたラティスを入力として
街区辞書222を用いて街区照合を行い(217)、街
区文字の読み取りを行う。街区辞書は街区として有りえ
る全ての街区文字が用意されている。これにより町域照
合(211)で読み取った町名の文字と共に住所の読み
取りが完了する(宛名認識結果218)。
【0018】以下、図2の処理の各部の詳細及び処理を
行う装置について説明する。なお、画像入力202ない
し縦横書き切り替え221部は従来の技術と同様であ
り、また、文字切出仮説生成206ないし町域照合21
1部は実質的に前記電子通信学会(D)J68−D,
No.4,第765頁ないし第772頁の技術が適用で
きる。
【0019】図3は上記住所読み取り方法を実施する装
置の構成を示す。同図において、301は画像入力20
2を行うスキャナ部、303は住所読み取り結果、すな
わち図2の宛名認識結果218の区分情報に基づき郵便
物を区分するソーター部、312は住所読取る、即ち、
図2における処理202から222を行う認識装置であ
る。スキャナ部301と認識装置312は入出力用ケー
ブル304で接続する。ソーター部303と認識装置3
12は入出力用ケーブル305で接続する。
【0020】認識装置312には認識装置内部の各部分
を接続するためのバス313、スキャナ部301との通
信を行うインターフェイス部306、認識装置312全
体の制御及び住所認識処理を行う演算処理装置部30
7、ソーター部303との通信を行うインターフェイス
部308、起動時の操作等を行うためのキーボード30
9、実行状況を必要に応じて表示するためのCRT31
0、住所の読み取りに必要なテーブル、プログラム、辞
書等を格納するためのメモリ311を備える。
【0021】図4は図2の画像入力202から文字行抽
出204の処理を説明する図である。407は、画像入
力202から宛名領域切出203により切り出された宛
名領域の画像である。宛名領域407中の黒画素をy軸
402と平行の軸408上に投影したヒストグラムが4
03、404、405である。これらのヒストグラムの
値を検出することにより、点線406のような文字行の
上下のy座標を抽出し、文字行を抽出する(204)。
【0022】図5は図2の縦横書き判定205の処理を
説明する図である。501は抽出された横書きの文字列
の画像を示している。502、503は文字行の行頭と
行末の文字パターンを示し、文字パターン502及び5
03そのまま切出した文字パターンが505及び509
であり、パターン回転処理504及び511で90度回
転させた文字パターンが506及び510である。これ
らの文字パターンを、文字認識をする(507)。その
結果の類似度を比較(508)し、その結果を基に縦横
書き判別205を行う。この判別結果を基に縦書き用特
徴抽出と横書き用特徴抽出の入力切り替えを行う(図2
の221)。
【0023】画像中のレイアウト情報を用いて判別する
方法の場合、規定のレイアウト以外の住所文字列を含ん
だ画像が入力された際に誤判別する可能性が高くなる
が、本実施例によると文字認識そのものを用いて判別を
行うため安定して縦横書き判別を行うことができる。ま
た、住所文字列の最初と最後の一文字づつにおいてその
ままの向きの文字と90度回転した文字と類似度の差が
大きくない場合は、住所文字列の最初からと最後からの
文字の切出しを一文字づつずらして同様の判別方法を行
う。これにより、「田」や「山」等の90度回転しても
類似度に差が生じにくい文字を避け、判別に適した文字
による縦横書き判別が行われ、精度の向上を図ることが
できる。
【0024】図6は仮説文字パターンを入力画像と対応
付けて説明する図である。識別すべき手書き住所文字列
601を入力画像として図2の文字切出し仮説生成20
6で、1文字として切出すことが可能な境界線(点線6
03−i(i=1,2…n)で表す)で入力画像のパタ
ーンを切り出す。説明の都合上点線603−iに対応し
た丸で囲んだ(0)、、、、…602−i(i
=1,2…n)をノードと呼ぶ。ノードとノードを結ん
だ線604をアークと呼び、アーク604に対応するパ
ターン605、606…611等が仮説文字パターンで
ある。例えば、読み取られるべき文字パターン「兵」は
文字切出し仮説の可能性としてパターン「兵」605の
外パターン「丘」606とパターン「八」607の仮説
文字パターンに分割可能である。また、パターン「可」
も同様にパターン「可」610の他にパターン「一」6
09とパターン611に分割可能である。このように複
数の仮説文字パターンはノード間をアークで結ぶ間に有
る。
【0025】図7はパターンテーブル219のデータ構
造を示す。701は仮説文字パターンとして切出された
パターンの画像情報が格納されたメモリの場所を示すポ
インタである。702にはこの仮説文字パターンに対応
したアーク上の確信度(重みを表し、ノードの始点と終
点の距離によって異なり、この距離が長い方が重みは大
きくなる。)が格納されている。703には仮説文字パ
ターン中の連結成分数(例えば、文字パターン「三」は
連結成分数が3、「八」は連結成分数が2)が格納さ
れ、704には仮説文字パターンのx,y座標(例え
ば、図6の仮説文字パターン「丘」を囲むブロック左
上、右下点の座標)が格納されている。705はアーク
の前ノードの番号が格納され、706にはアークの後ノ
ードの番号が格納され、このノード番号を参照すること
により仮説文字パターンのネットワークを表現できる。
707は仮説文字パターンを文字識別辞書208を参照
して文字識別207した際に得られる複数の候補文字列
が格納され、708は各候補文字が仮説文字パターン類
似する程度を表す類似度が格納してある。
【0026】類似度の計算方法は特に特定されず、従来
知られている方法を使用できる。太線709は1つの仮
設文字パターンのテーブルの範囲を示し、また、この範
囲が1つのアークに対応する。例えば、仮設文字パター
ンが「兵」のとき1つのアーク604−1に対応する。
従って、前ノード番号705は(0)で、後ノード番号
706はである。
【0027】図8は図6の文字切出し決定処理209を
説明する図である。図はパターンテーブル219のデー
タを基に文字切出し決定処理209を行い、一意に決定
された仮説文字パターン列を示す。文字切出し決定処理
209は、パターンテーブルの全ての仮説文字パターン
に対し文字識別を行ったときに得られた候補文字の類似
度を各アークの確信度702として登録しておき、ノー
ド番号0からノード番号8へたどるアークの組み合わせ
による複数のルートについて、各ルートのアークの確信
度の合計を求め、その確信度の合計の最も高いルートに
ある仮説文字パターン列を文字切出しとして決定する。
図8は確信度の合計の最も高いルートがノード(0)−
−−−−−を経ることを示している。
【0028】図8と図6とを比較すると、図8では、図
6のノード番号(0)から、から、からのア
ーク604が無く、また、ノード番号から、から
、からのアーク604も無くなっている。このよ
うに、パターンテーブル219中の全ての仮説文字パタ
ーンを文字識別によって評価することにより文字らしい
パターンの確信度が高くなり、文字切出しが決定(図2
の209)される。
【0029】図9は一意に決定された文字切出しに対す
る文字識別結果を入力とした町域照合処理211により
得られる町域部分の認識結果と街区部分先頭位置を説明
するための図である。601は読み取られる住所文字列
の画像を、点線902は文字切出しが決定した境界線
を、707は文字切出しに対応した仮説文字パターンの
文字識別結果の候補文字列を示す。候補文字列707を
基に町域照合(図2の211)を行った結果選択された
文字が丸で囲まれた文字903であり、選択された各文
字「兵」、「庫」…「荷」を組み合わせて町域認識結果
の文字列910を生成する。点線905は町域照合によ
り得られた文字列が入力画像601中で対応する範囲を
示している。町域照合処理211により、街区部分の先
頭位置911が確定される。
【0030】同図において、906、907、908、
909は街区部分の仮説文字パターンであり、912…
916はそれぞれ街区部分の仮説文字パターンに対する
文字識別結果の候補文字列を示す。これらは図2のラテ
ィス生成211までの処理で得られている。街区先頭位
置911以降は漢数字又は算用数字で記述されているこ
とが多く、街区部分の文字切出し処理は、漢字で記述さ
れている町域部分の文字切出しと異なった処理を行う。
つまり、町域部分の文字切出しと同様の手法を街区部分
に適用すると、パターン「三」を仮説文字パターン90
6、907のように分離したり、仮説文字パターン
「二」を908、909のように分離したりする場合が
多い。また、使用される文字も限定される。
【0031】図10は街区部分の文字切出し再決定の処
理フロー図を示す。即ち、図2のパターン周辺情報抽出
212ないし文字切出し再決定処理215の処理フロー
図である。なお、具体的文字パターンの例については後
で図11ないし図14を用いて詳細に説明する。町域照
合211から得られた街区先頭位置の情報911を入力
として街区先頭検出1013を行い、パターンテーブル
219より街区部分の仮説文字パターンの認識候補文字
を文字種情報としてを抽出する(1002)。本実施例
の場合は、文字識別207の結果の候補文字列の中で類
似度が最も高い候補文字を文字種情報としている。抽出
され文字種情報をキーとして、切出し用辞書214を参
照する。文字種抽出1002の際に、文字種に対応する
仮説文字パターンの周辺情報を抽出する(212)。上
記周辺情報は仮説文字パターンの縦長、横長、縦横比、
パターン間隔長、連結成分数のデータである。
【0032】切出し用辞書214の参照は、上記文字種
をキーにして辞書214で上記抽出された縦長、横長、
縦横比、パターン間隔長、連結成分数の周辺情報に対す
る尤度比を求める。ここで、辞書214には確信度とし
て各周辺情報の値に対する尤度比が登録されており、各
周辺情報の値に対する尤度比が確信度として算出される
(1005、1006、1007、1008)。算出さ
れたそれぞれの確信度を統合する(1010)。切出し
た仮説文字パターンが文字識別された文字種として正し
かったという事象をHとし、e1,e2,e3,…enをパ
ターンの周辺情報の各特徴量として、P(e|H)をH
だった場合のeの生起確率とすると、ある特徴量ek
対する尤度比L(ek|H)は以下の式で求められる。
【0033】
【0034】
【数1】
【0035】ここでP(H)をHである生起確率とし、
式(1)で求められる複数の尤度比を用いて、e1
2,e3...,enが得られた際のHの生起確率P
(H|e1,e2,e3,...,en)を求める際にBa
yes ruleを用いると以下の式のようになる。
【0036】
【数2】
【0037】式(2)を用いて、確信度統合処理101
0では、1005、1006、1007、1008のそ
れぞれで算出された尤度比をBayes ruleを用
いて統合する。次に、統合された確信度を文字識別によ
り得られた類似度に掛けた値をアークに反映して重み付
けする(1011)。このようにアークに重み付けされ
た仮説文字パターンのデータを基に最初のノードから最
後のノードへたどる最適なルートを探索し、文字切出し
パスを決定する(1012)。その結果を街区照合(図
2の217)で使う。
【0038】図11は住所文字列の街区部分に対応した
仮説文字パターンを説明する図である。住所文字列の入
力画像の街区部分1102は図2の文字切出し仮説生成
206、境界線1104ように文字切出だされ、仮説文
字パターンとして、パターンテーブル219に記録され
ている。パタンテーブルでのデータの構成は図6、図7
で説明したものと同じである。点線1103は切出しの
境界線1104とノード番号1105(丸で囲んだ番号
51、52、…55など)との対応を示している。例え
ば、仮説文字パターン「三」1106(アーク1107
に対応)を文字識別処理すると、「三」「3」「五」の
候補文字列1108が得られる。仮説文字パターン「三
|」1109(アーク1111に対応)は文字識別処理
すると、「示」「未」「身」の候補文字列1110が得
られる。
【0039】また。各仮説文字パターンに対応するアー
クについて重み付けについては、図10で述べた重み付
けがなされる。例えば上記文字種「示」「未」「身」1
110は、街区部分の文字として発生しない不適当な文
字であるため、仮説文字パターン1109に対応するア
ーク1111の重み付けを下げる。この重み付け処理に
より、街区部分として明らかに不適当であるアークを削
除する。他の仮説文字パターン(例えば「二」、
「一」、「一|」「|」等)についても対応するアーク
の重み付けを行い、不適当であるアークを削除する。
【0040】図12は図10の街区部分の仮説文字パタ
ーンに対するアークの重み付け処理1011を説明する
図である。仮説文字パターン「三」1106を例に詳細
に説明する。先ず、仮説文字パターン「三」から周辺情
報を抽出する(212)。ここで、周辺情報とはパター
ンの縦長、横長、アスペクト比、連結成分数、文字間隔
長の値であり、また、文字識別結果の候補文字「三、
3、五」1108の1位の候補文字「三」もここで参照
する。これらの情報をまとめたものがブロック1213
内に1214、1215として示されている。
【0041】文字種抽出1002において、文字種
「三」の情報1214を、文字切出し用辞書214に送
る。切出し用辞書214には文字種「三」をキーにして
参照可能なアーク重みづけのためのデータ1205が格
納されており、文字種抽出1002で得られた文字種を
キーにして切出し用辞書214中のインデックス「三」
を検索する。文字種「三」の検索する際、抽出した文字
種「三」と一致したインデックスの付いたデータ120
5から縦長1206、横長1207、アスペクト比12
08、連結成分数1209、文字間長1210に対応し
た尤度比を引き出し、各周辺情報の確信度を求め(12
04)、確信度統合1216で各尤度比(確信度1、
2、3、4、5)の統合を行い(1010)、重み付け
1011で仮説文字パターン「三」1106に対応した
アーク1107に重み付けを行う。上述のように、パタ
ーンの周辺情報を仮説文字パターン1106のアーク1
107に反映し、文字種に応じて最適な重み付けを行
う。
【0042】図13は上記重み付けの結果をアークの線
の太さで表した図である。1301は仮説文字パターン
「三」1106に対応した周辺情報を加味して重み付け
をしたアークを示す。また、1303は仮説文字パター
ン「|」に対応した周辺情報を加味して重み付けをした
アークで、これも周辺情報を加味すると非常に重みが大
きくなる。また、1302は、パターン「三」の下2つ
の連結成分を組み合わせて構成された「二」の文字パタ
ーンに非常によく似た仮説文字パターンのアークでノー
ド番号52と54を結ぶ。この仮説文字パターン「二」
を文字識別すると図11に示すように文字種「二」
「三」「2」の候補文字が得られ、その中で文字種
「二」は類似度も大きな値が得られるため、文字切出し
としては、この仮説は妥当であるという判定される危険
性がある。しかし、周辺情報を加味すると、アーク13
02に対応したパターンは1つ上のパターンとの隙間が
狭いことにより文字切出し用辞書214を参照するとア
ーク1302上のパターンの確信度は低くなり、アーク
1302の重み付けも類似度だけの場合と比較して低く
なる。このため、アーク1301上の重み付けの方が大
きくなり、相対的にアーク1302を通るルートの方が
重みの合計の方が小さくなる。
【0043】図14は街区部分の文字切出し再決定を行
って選択された仮説文字パターン列を示している。すな
わち、アークへの重み付け(図10の1011)により
仮説文字パターンに対応するアークに対し重み付けを行
い、重み付けの和が最大になるようにパスを決定する
と、仮説文字パターン「三」のアーク1301と仮説文
字パターン「|」のアーク1303を選択してルートが
選択される。このようにして街区部分の文字切出し再決
定では、仮説文字パターン「三」、「|」、「二」、
「|」、「一」に対応したアークを選択してパスを構成
している。これらの選択されたアークのパターンに付属
した候補文字列を用いて、街区部分のラティスを生成す
る(216)。
【0044】図15は上記実施の形態における住所文字
列全体の認識結果を示す。即ち街区専用の文字切出しを
行い、ラティス生成、街区照合処理を行った結果の文字
列に町域照合結果を結合することによる住所文字列全体
の認識結果を示す。入力した住所文字列画像601にお
いて、点線905は町域部分の範囲を示し、910は図
9で示した町域照合結果を示している。点線1510は
図14で示した文字切出し再決定の切出し境界を示し、
文字列1506は文字切出し結果の1文字毎の文字識別
結果の候補文字列を示す。点線1507、1509は街
区部分の範囲を示し、文字列1508は文字識別結果の
候補文字列から街区照合217により得られた街区認識
すなわち読み取り結果を示す。文字列1504は町域照
合結果1502と街区照合結果1508を結合して生成
した宛名文字列全体の認識結果を示している。このよう
に、街区部分のみ文字切出しを再試行し、町域照合結果
と組み合わせることにより、住所文字列全体の認識精度
が向上する。
【0045】図16は入力した宛名文字列と文字切出し
仮説のパターンテーブルと文字識別結果を画面上に表示
した例を示す。図3の表示装置310の画面上1600
には、入力された住所文字列の画像1601、パターン
テーブルのノード1602−i(i=1,2…8)、ノ
ード間を結んだアーク1603−1、1603−4、相
隣るノード間を結ぶアーク、仮説文字パターン1604
−j(j=1,2…10)、仮説文字パターン1604
−jに対する文字識別により得られた候補文字列160
5が表示されている。このように、表示装置310の画
面上1600に画面表示を行うことにより、住所文字列
認識処理の際の文字切出し、文字識別処理の途中経過が
直感的に把握しやすくなり、装置の保守、機能拡張の際
に有用である。また、文字切出し辞書214を作成、更
新する際に仮説により切出されたパターンの周辺情報の
収集が必要である。
【0046】式(1)を参照すると、文字切出し用辞書
に格納されている尤度比とは、文字切出しが正解だった
仮説のパターンの周辺情報の分布を、文字切出しが不正
解だった仮説のパターンの周辺情報の分布で割った値で
ある。そこで、図16のような画面表示に対しポインタ
により、あるアークを指定すると周辺情報の各パラメー
タ、文字識別結果等の情報を出力できるようにすると容
易にパターンの周辺情報を正解不正解に分類して収集で
きる。また、この画面表示をしたツールは文字識別処理
の文字識別用辞書の生成、更新の際に必要な文字パター
ンの収集にも有効であり、作業量を削減できる。
【0047】
【発明の効果】以上説明したように本発明によると、文
字切出し、即ち文字読み取りの精度が向上する。特に郵
便物の手書きされた宛名の住所の読み取りを行う場合、
町名記載部と街区記載部の処理を異ならしめ、街区記載
部の文字読み取りに本発明を適用した場合、街区に使用
される文字は限定されるので、文字切出し、辞書は小容
量で良く、そのため処理時間を少なくすることができ
る。町名記載部と街区記載部を合わせた住所の読み取り
を効率的かつ精度良く実現できる。
【図面の簡単な説明】
【図1】従来技術における文字切出しの曖昧性が生じる
入力画像例を示す図である。
【図2】本発明による文字読み取り方法の一実施形態を
示す処理フロー図である。
【図3】本発明による文字識別方法を実施する文字識別
装置の一実施の構成図である。
【図4】図2の文字行抽出204の処理を説明する図で
ある。
【図5】図2の縦横書き判定205の処理を説明する図
である。
【図6】図2の文字切出し仮説生成206を入力画像と
対応付けて説明する図である。
【図7】図2のパターンテーブル219のデータ構造を
示す図である。
【図8】図2の文字切出し決定処理209により一意に
決定された仮説文字パターンの列を概念的に示す図であ
る。
【図9】図2のラティス生成210及び町域照合211
の処理を説明する図である。
【図10】図2の街区部分のみ漢数字、算用数字用に文
字切出し再決定の処理215を説明する図である。
【図11】街区部分の入力画像に対する仮説文字パター
ンの対応を示した文字識別を説明する図である。
【図12】図10の仮説中文字パターンに対する確信度
を算出する処理を説明する図である。
【図13】街区部分の文字切出し仮説に対し、パターン
の確信度を算出しアークの重み付けに反映した結果を示
した図である。
【図14】街区部分の文字切出しの再決定を行った際に
選択された文字切出しを示す図である。
【図15】住所文字列の町域部分と街区部分の認識結果
を組み合わせて住所文字列全体の認識結果を示した図で
ある。
【図16】本発明による宛名認識装置のメンテナンス、
機能拡張、辞書の生成更新のために用いるツールの画面
表示例を示した図である。
【符号の説明】
206:文字切出し仮説生成、 209:文字切出し決
定、210:ラティス生成、 211:町域照合、 2
12:パターン周辺情報抽出213:パターン確信度算
出、 214:文字切出し用辞書、215:文字切出し
再決定、 216:ラティス再生成。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤澤 浩道 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 緒方 日佐男 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 嶋 好博 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 渡辺 成 愛知県尾張旭市晴丘町池上1番地 株式会 社日立製作所オフィスシステム事業部内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】文字行情報を含む画像情報を電気信号に変
    換する第1ステップと、 上記電気信号に変換された画像情報の文字行領域を抽出
    し、上記文字行領域中の文字を構成する連結成分を組み
    合わせを複数の仮説文字パターンとしてを切り出す第2
    ステップと、 上記仮説文字パターンに対し文字識別辞書を参照し文字
    識別し、複数の認識候補文字を得る第3ステップと、 上記仮説文字パターンの周辺情報と抽出する第4ステッ
    プと、 上記第3ステップで得えた認識候補文字をキーとして文
    字の周辺情報をもつ切出用辞書を参照し、上記第4ステ
    ップで抽出した上記仮説文字パターンの周辺情報の確信
    度を求め、仮説文字パターンの重み付けをする第5ステ
    ップと上記仮説文字パターンの重み付けを用いて文字切
    出しを決定する第6ステップと、 上記第6ステップにより決定された文字切出し結果から
    生成された文字識別結果の集合を基に文字識別辞書を用
    いて単語照合を行い上記識別すべき文字情報の認識を行
    い上記文字行を読み取る第7ステップを有することを特
    徴とする文字読取り方法。
  2. 【請求項2】請求項1記載の文字読取方法において、上
    記仮説文字パターンの周辺情報が、上記仮説文字パター
    ンの縦長、横長、縦横比、パターン間隔長、連結成分数
    の情報であり、上記文字切出辞書は文字ごとに上記縦
    長、横長、縦横比、パターン間隔長、連結成分数に対す
    る尤度分布情報が格納され、第5ステップにおける上記
    文字切出辞書の参照が、上記文字識別結果の候補文字の
    文字種をキーとして上記文字切出辞書を参照することを
    特徴とする住所の読取り方法。
  3. 【請求項3】請求項1記載の方法において、第5ステッ
    プは上記文字切出用辞書を生成更新する生成更新ステッ
    プを有し、上記生成更新ステップは表示装置の画面上に
    読み取るべき文字列の入力画像と、上記仮説文字パター
    ンと、上記仮説文字パターンに対する文字識別結果の候
    補文字を表示する表示ステップと、上記表示装置の画面
    表示を用いて、文字切出用辞書の更新を行う更新ステッ
    プとをもち、文字列の認識処理状態を画面上でグラフィ
    カルに表示するステップを有することを特徴とする住所
    読取り方法。
  4. 【請求項4】町名記載部分と街区記載部分をもつ文字行
    情報を含む画像情報を電気信号に変換する第1ステップ
    と、 上記電気信号に変換された画像情報の文字行領域を抽出
    し、上記文字行領域中の文字を構成する連結成分を組み
    合わせを複数の仮説文字パターンとしてを切り出す第2
    ステップと、 上記仮説文字パターンに対し文字識別辞書を参照し文字
    識別し、複数の認識候補文字及び上記認識候補文字を得
    る第3ステップと、 上記認識候補文字からなるラティスを構成し、町域辞書
    と照合し上記複数の仮説文字パターンから町名記載部分
    の文字行を認識すると共に、街区記載部分の先頭位置情
    報を検出する第4ステップと、 上記第4ステップで得えた先頭位置情報によって街区記
    載部分の仮説文字パターンの認識候補文字に対応する仮
    説文字のパターン周辺情報を抽出する第5ステップと、
    上記認識候補文字をキーとして上記パターン周辺情報に
    対応する尤度が記載された切出用辞書を参照し、上記仮
    説文字パターンのパターン周辺情報の確信度を求める仮
    説文字パターンの重み付けをする第5ステップと上記重
    み付けにより街区記載部分の文字切出しを行う第6ステ
    ップと上記第6ステップから生成された文字識別結果の
    集合を基に街区辞書と単語照合を行い上記識別すべき街
    区文字行を読み取る第7ステップを有することを特徴と
    する住所読取り方法。
  5. 【請求項5】請求項4記載の方法において、上記第2ス
    テップは抽出した文字行の行頭と行末から文字を切り出
    し、切りだされた文字パターを識別することにより縦横
    書き判別を行いうステップを持つことを特徴とする住所
    読取り方法。
  6. 【請求項6】請求項4記載の方法において、上記パター
    ン周辺情報は、縦長、横長、縦横比、パターン間隔長、
    連結成分数の情報をもち、上記文字切出辞書は街区記載
    に使用される文字ごとに上記縦長、横長、縦横比、パタ
    ーン間隔長、連結成分数に対する尤度分布情報が格納さ
    れ、上記第5ステップの上記認識候補文字をキーとして
    上記文字切出辞書の上記文字を使用することを特徴とす
    る住所読取り方法。
  7. 【請求項7】請求項4記載の方法において、第5ステッ
    プは上記文字切出用辞書を生成更新する生成更新ステッ
    プを有し、上記生成更新ステップは表示装置の画面上に
    読み取るべき住所文字列の入力画像と、上記仮説文字パ
    ターンと、上記仮説文字パターンに対する文字識別結果
    の候補文字を表示する表示ステップと、上記表示装置の
    画面表示を用いて、文字切出用辞書の更新を行う更新ス
    テップとをもち、住所文字列の認識処理状態を画面上で
    グラフィカルに表示するステップを有することを特徴と
    する住所読取り方法。
JP32451695A 1995-12-13 1995-12-13 文字読取り方法及び住所読取り方法 Expired - Fee Related JP3232991B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP32451695A JP3232991B2 (ja) 1995-12-13 1995-12-13 文字読取り方法及び住所読取り方法
US08/763,515 US6246794B1 (en) 1995-12-13 1996-12-11 Method of reading characters and method of reading postal addresses
KR1019960064613A KR100411697B1 (ko) 1995-12-13 1996-12-12 문자판독방법및주소판독방법
CNB961215445A CN1151464C (zh) 1995-12-13 1996-12-13 读取字符的方法和读取邮政地址的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32451695A JP3232991B2 (ja) 1995-12-13 1995-12-13 文字読取り方法及び住所読取り方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP11057792A Division JPH11316801A (ja) 1999-03-05 1999-03-05 文字読取り方法及び住所読取り方法

Publications (2)

Publication Number Publication Date
JPH09161013A true JPH09161013A (ja) 1997-06-20
JP3232991B2 JP3232991B2 (ja) 2001-11-26

Family

ID=18166678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32451695A Expired - Fee Related JP3232991B2 (ja) 1995-12-13 1995-12-13 文字読取り方法及び住所読取り方法

Country Status (1)

Country Link
JP (1) JP3232991B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145308A (ja) * 1997-07-29 1999-02-16 Omron Corp ナンバープレート認識方法およびナンバープレート認識装置
JPH1185909A (ja) * 1997-09-03 1999-03-30 Hitachi Ltd 住所認識方法
JPH11232391A (ja) * 1998-02-10 1999-08-27 Hitachi Ltd 宛名読取り装置および郵便物等区分機および文字列認識方法
KR100339446B1 (ko) * 1998-01-22 2002-06-03 아끼쿠사 나오유끼 주소 인식 장치 및 주소 인식 방법
JP2008003740A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム
JP2008217348A (ja) * 2007-03-02 2008-09-18 Canon Inc 文字認識装置、文字認識方法、コンピュータプログラム
KR101136169B1 (ko) * 2010-03-17 2012-04-17 가부시끼가이샤 도시바 집중 정보 처리 장치 및 집중 정보 처리 시스템
JP2013105344A (ja) * 2011-11-14 2013-05-30 Hitachi Omron Terminal Solutions Corp 帳票処理システム及び帳票処理方法
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145308A (ja) * 1997-07-29 1999-02-16 Omron Corp ナンバープレート認識方法およびナンバープレート認識装置
JPH1185909A (ja) * 1997-09-03 1999-03-30 Hitachi Ltd 住所認識方法
KR100339446B1 (ko) * 1998-01-22 2002-06-03 아끼쿠사 나오유끼 주소 인식 장치 및 주소 인식 방법
US6535619B1 (en) 1998-01-22 2003-03-18 Fujitsu Limited Address recognition apparatus and method
JPH11232391A (ja) * 1998-02-10 1999-08-27 Hitachi Ltd 宛名読取り装置および郵便物等区分機および文字列認識方法
JP2008003740A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム
JP2008217348A (ja) * 2007-03-02 2008-09-18 Canon Inc 文字認識装置、文字認識方法、コンピュータプログラム
KR101136169B1 (ko) * 2010-03-17 2012-04-17 가부시끼가이샤 도시바 집중 정보 처리 장치 및 집중 정보 처리 시스템
JP2013105344A (ja) * 2011-11-14 2013-05-30 Hitachi Omron Terminal Solutions Corp 帳票処理システム及び帳票処理方法
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
JP3232991B2 (ja) 2001-11-26

Similar Documents

Publication Publication Date Title
KR100411697B1 (ko) 문자판독방법및주소판독방법
JP3246432B2 (ja) 宛名読取り装置および郵便物等区分機
US6542635B1 (en) Method for document comparison and classification using document image layout
JP2973944B2 (ja) 文書処理装置および文書処理方法
US7142728B2 (en) Method and system for extracting information from a document
JP3077765B2 (ja) 語彙辞書の検索範囲を削減するシステム及び方法
US5579408A (en) Character recognition method and apparatus
US6917708B2 (en) Handwriting recognition by word separation into silhouette bar codes and other feature extraction
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JP3232991B2 (ja) 文字読取り方法及び住所読取り方法
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JPH1166238A (ja) 手書き文字認識方法
JPS6336037B2 (ja)
JP3529036B2 (ja) 文書付き画像の分類方法
JPH11316801A (ja) 文字読取り方法及び住所読取り方法
KR0186172B1 (ko) 문자 인식장치의 접촉문자 분리 및 특징 추출방법
JP3897999B2 (ja) 手書き文字認識方法
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JPH08287188A (ja) 文字列認識装置
JP3468668B2 (ja) 住所認識方法及び郵便区分機
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2000207491A (ja) 文字列読取方法及び装置
JP2001092924A (ja) パターン認識方法および装置
JP2991594B2 (ja) 郵便物の宛名読取装置

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070921

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090921

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090921

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100921

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees