JP2000288478A - 宛先特定装置 - Google Patents

宛先特定装置

Info

Publication number
JP2000288478A
JP2000288478A JP11099121A JP9912199A JP2000288478A JP 2000288478 A JP2000288478 A JP 2000288478A JP 11099121 A JP11099121 A JP 11099121A JP 9912199 A JP9912199 A JP 9912199A JP 2000288478 A JP2000288478 A JP 2000288478A
Authority
JP
Japan
Prior art keywords
destination
character
destination information
information
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11099121A
Other languages
English (en)
Inventor
Keiko Yamagishi
桂子 山岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11099121A priority Critical patent/JP2000288478A/ja
Publication of JP2000288478A publication Critical patent/JP2000288478A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)

Abstract

(57)【要約】 【課題】類似した顧客名称の誤読を防止することができ
るとともに、宛先特定の認識性能の向上が図れる宛先特
定装置を提供する。 【解決手段】文字位置切出部112および文字認識部1
13は、画像バッファ121内の画像パターン入力部1
11で入力された画像から文字認識を行ない、文字候補
を文字候補バッファ123に出力する。宛先決定部11
4は、宛先情報辞書126内の宛先情報の顧客名称と文
字候補バッファ123内の文字候補との照合を行なって
宛先候補を決定し、宛先候補バッファ124に格納す
る。宛先情報辞書更新部115は、宛先候補バッファ1
24に格納された宛先名称と文字候補バッファ123に
格納された文字候補とを照合し、この照合結果を宛先候
補に付加して宛先情報辞書126に登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、たとえば、郵便物
処理装置などにおいて、郵便物などの配達物の配達先
(宛先)を特定する宛先特定装置に関する。
【0002】
【従来の技術】最近、たとえば、郵便物の宛先情報をあ
らかじめ登録しておき、郵便物の宛先面に記載された手
書き文字や活字文字を光学的に読取って文字認識を行な
い、あらかじめ登録しておいた宛先情報と照合すること
により郵便物の宛先を特定する宛先特定装置が開発され
ている。
【0003】従来、このような宛先特定装置において
は、たとえば、特願平9−256842号で述べられて
いるような手法で、宛先情報のうち、会社名や個人名な
どの名称文字列を対象として、文字認識結果のそれぞれ
の文字を含む登録名称文字列を抽出し、さらに、その文
字位置の反転などをチェックし、文字認識結果と登録名
称文字列との類似性が最も高い登録名称文字列の宛先情
報により宛先の特定を行なっていた。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の宛先特定装置では、あらかじめ登録されている
宛先情報に対し、いわゆる表記ゆれを含む宛先情報が記
載された場合に、文字の一致度から候補を特定すること
ができない。たとえば、漢字の「沢と澤」、「国と國」
などのように、辞書には新字で登録されているのに、郵
便物には旧字で記載された場合や、文字認識で正解が上
がりにくい文字を含む宛先情報は、認識されにくいとい
う問題があった。
【0005】また、会社名などで文字列が一部省略され
る場合に、文字の連続性や文字の一致度が低くなるた
め、宛先候補が認識されにくいという問題点があった。
さらに、表記ゆれや文字認識結果が低いため、候補とし
て抽出されない宛先情報が存在するという問題があっ
た。
【0006】そこで、本発明は、類似した顧客名称の誤
読を防止することができるとともに、宛先特定の認識性
能の向上が図れる宛先特定装置を提供することを目的と
する。
【0007】
【課題を解決するための手段】本発明の宛先特定装置
は、配達物の宛先面の画像を読取って画像データを入力
する画像入力手段と、この画像入力手段で入力された画
像データから文字認識を行なう文字認識手段と、対象と
なる宛先の顧客名称とこれに対応した住所情報とからな
る宛先情報をあらかじめ記憶している宛先情報記憶手段
と、前記文字認識手段の認識結果と前記宛先情報記憶手
段に記憶されている宛先情報の顧客名称とを照合するこ
とにより宛先情報を決定する宛先決定手段と、この宛先
決定手段で決定された宛先情報と前記文字認識手段の認
識結果とを照合し、この照合結果を前記宛先決定手段で
決定された宛先情報に付加して前記宛先情報記憶手段に
記憶する宛先情報更新手段とを具備している。
【0008】また、本発明の宛先特定装置は、宛先情報
更新手段は、宛先決定手段で決定された宛先情報の各文
字に対し、文字認識手段で認識した文字候補と照合して
一致した文字について文字一致情報を付加して宛先情報
記憶手段に記憶することを特徴とする。
【0009】また、本発明の宛先特定装置は、宛先決定
手段は、文字認識手段で認識した文字候補と宛先情報記
憶手段に記憶されている宛先情報とを照合する際、宛先
情報記憶手段に記憶されている宛先情報の各文字の文字
一致情報が付加された文字について照合を行ない、その
照合結果があらかじめ設定された閾値よりも高い一致度
の宛先情報を宛先として決定することを特徴とする。
【0010】また、本発明の宛先特定装置は、配達物の
宛先面の画像を読取って画像データを入力する画像入力
手段と、この画像入力手段で入力された画像データから
文字認識を行なう文字認識手段と、対象となる宛先の顧
客名称とこれに対応した住所情報とからなる宛先情報を
あらかじめ記憶している宛先情報記憶手段と、前記文字
認識手段の認識結果と前記宛先情報記憶手段に記憶され
ている宛先情報の顧客名称とを照合することにより宛先
情報を決定する宛先決定手段と、この宛先決定手段で決
定された宛先情報の各文字に対し、前記文字認識手段で
認識した文字候補と照合した結果省略された文字につい
て文字省略情報を付加して前記宛先情報記憶手段に記憶
する宛先情報更新手段とを具備している。
【0011】また、本発明の宛先特定装置は、宛先決定
手段は、文字認識手段で認識した文字候補と宛先情報記
憶手段に記憶されている宛先情報とを照合する際、宛先
情報記憶手段に記憶されている宛先情報の各文字の文字
省略情報が付加された文字について照合を行ない、その
照合結果があらかじめ設定された閾値よりも高い一致度
の宛先情報を宛先として決定することを特徴とする。
【0012】また、本発明の宛先特定装置は、宛先決定
手段は、文字認識手段で認識した文字候補と宛先情報記
憶手段に記憶されている宛先情報とを照合する際、宛先
情報記憶手段に記憶されている宛先情報に付加されてい
る文字列の区切り情報から生成される複数の文字列のそ
れぞれについて照合を行ない、その照合結果があらかじ
め設定された閾値よりも高い一致度の宛先情報を宛先と
して決定することを特徴とする。
【0013】また、本発明の宛先特定装置は、配達物の
宛先面の画像を読取って画像データを入力する画像入力
手段と、この画像入力手段で入力された画像データから
文字認識を行なう文字認識手段と、対象となる宛先の顧
客名称とこれに対応した住所情報とからなる宛先情報を
あらかじめ記憶している宛先情報記憶手段と、前記文字
認識手段で認識した文字候補と前記宛先情報記憶手段に
記憶されている宛先情報の顧客名称とを照合することに
より宛先情報を決定する宛先決定手段と、この宛先決定
手段において前記宛先情報記憶手段に記憶されている宛
先情報と照合した前記文字認識手段で認識した文字候補
の前後の文字候補を前記宛先決定手段で決定された宛先
情報に付加して前記宛先情報記憶手段に記憶する宛先情
報更新手段とを具備している。
【0014】さらに、本発明の宛先特定装置は、宛先決
定手段は、文字認識手段で認識した文字候補と宛先情報
記憶手段に記憶されている宛先情報とを照合する際、宛
先情報記憶手段に記憶されている宛先情報の前後に付加
された文字列についても照合を行ない、それぞれの照合
結果があらかじめ設定された閾値よりも高い一致度の宛
先情報を宛先として決定することを特徴とする。
【0015】本発明によれば、配達物上に記載された宛
先情報の文字認識結果と、あらかじめ登録されている宛
先情報の顧客名称とを照合することにより、文字認識結
果に類似した顧客名称を抽出する際に、登録された顧客
名称の各文字が文字認識した文字候補と一致したかどう
かを示す文字一致情報や、顧客名称が省略されて記載さ
れたかどうかを示す文字省略情報を登録しておくこと
で、以後の照合の際に、旧字、俗字で記載された文字や
文字認識されにくい文字を除いた部分で照合することに
より、これらの文字を含む顧客名称の特定を行なうこと
が可能となり、宛先特定の認識性能の向上に役立ち、ま
た、認識結果を蓄えていくことで、通常記載される文字
情報を得ることができ、類似した顧客名称の誤読を防ぐ
ことができる。
【0016】また、本発明によれば、照合時の文字一致
情報から省略文字を判定し、連続した省略文字から文字
列の区切り情報を検出して登録しておくことで、登録名
称が省略して記載されたときにも、通常省略されがちな
文字を除外して照合を行なうことができ、宛先特定の認
識性能の向上に役立つ。
【0017】さらに、本発明によれば、照合した文字候
補の前後に記載される文字列の文字候補を登録しておく
ことで、同姓同名の複数名称を特定する際に複数行で判
定して、他の文字列の一致度により名称を特定すること
ができる。また、各文字列の一致度が低いときに、複数
文字列による判定により、1つの文字列の一致度が低く
ても、複数の文字列のそれぞれの一致度から総合的に判
定することで、宛先を特定することが可能となり、宛先
特定の認識性能の向上に役立つ。
【0018】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0019】まず、第1の実施の形態について説明す
る。
【0020】図1は、第1の実施の形態に係る宛先特定
装置の構成を概略的に示すものである。第1の実施の形
態に係る宛先特定装置は、郵便物の宛先情報をあらかじ
め登録しておき、郵便物の宛先面に記載された手書き文
字や活字文字を光学的に読取って文字認識を行ない、あ
らかじめ登録しておいた宛先情報と照合して郵便物の宛
先を特定するものであり、以下、これを1つの例として
説明する。
【0021】まず、装置の概略を説明する。図1におい
て、画像入力手段としてのスキャナなどの画像パターン
入力部111は、配達物としての郵便物の宛先面に記載
された手書き文字や活字文字を光学的に読取り、あらか
じめ設定された閾値で2値化を行なうことにより、画像
データとして2値画像を画像バッファ121に格納す
る。
【0022】文字位置切出部112は、画像バッファ1
21に格納された2値画像の文字の区切り位置の切出し
を行なうことにより、文字パターンの位置情報を作成
し、文字位置バッファ122に格納する。
【0023】文字認識部113は、画像バッファ121
内の2値画像と文字位置バッファ122内の複数の文字
パターンの位置情報から、各文字位置候補に対して文字
認識を行なうことにより、たとえば、上位10の文字候
補を文字候補バッファ123に出力する。
【0024】宛先決定部114は、宛先情報記憶手段と
しての宛先情報辞書126内の宛先情報の顧客名称と、
文字候補バッファ123内の文字候補との照合を行なう
ことにより宛先候補を抽出し、宛先候補バッファ124
に格納する。なお、宛先候補の決定方法については後述
する。
【0025】宛先情報更新手段としての宛先情報辞書更
新部115では、宛先候補バッファ124に格納された
宛先名称と、文字候補バッファ123に格納されている
文字候補とを照合することにより、上記宛先名称の各文
字が文字候補内に存在するかどうかをチェックして、認
識された文字候補の位置情報を宛先情報辞書126の該
当する宛先名称文字列に書込む。
【0026】このように、宛先情報辞書126の各宛先
情報に、これまでの照合結果の文字一致情報を順次蓄え
ていくことで、登録されている宛先情報文字列の認識さ
れにくい文字位置が判明する。
【0027】図2(a)に、宛先情報辞書126におい
て、認識した文字候補の位置情報を認識フラグとして登
録した例を示す。たとえば、図2(a)に示すように、
宛先情報辞書126に「小澤太郎」と登録されているの
に、図2(b)に示すように、「小沢太郎」と記載され
た場合には、「澤」が不一致となり、各文字に対応して
「小(1)、澤(0)、太(1)、郎(1)」と認識フ
ラグを登録する。これにより、「澤」が文字候補として
上がりにくいということがわかる。
【0028】また、たとえば、図2(a)に示すよう
に、宛先情報辞書126に「東京労働組合」と登録され
ているのに、図2(c)に示すように、「東京労組」と
記載された場合には、「東(1)、京(1)、労
(1)、働(0)、組(1)、合(0)」と認識フラグ
を登録する。この場合には、「働」、「合」は記載され
なかったため、前者の例と区別するため、省略フラグを
設定する。この認識フラグと省略フラグは、その宛先名
称が宛先として選択されたときに更新する。その更新方
法は、認識フラグが「0」で、文字が一致した場合にフ
ラグを「1」にすることで、フラグが「0」の文字は文
字が一致する可能性が低いことがわかる。なお、一致文
字に対し最大値に達するまで、その値を増加させること
により、一致頻度として登録していく方法もある。
【0029】次に、図3に示すフローチャートを参照し
て全体の処理の流れを説明する。まず、ステップ301
で、画像パターン入力部111は、郵便物上の記載文字
の画像を取込む。次に、ステップ302で、文字位置切
出部112は、入力画像に対して文字位置の切出しを行
なう。次に、ステップ303で、文字認識部113は、
文字認識を行なう。
【0030】次に、ステップ304で、宛先決定部11
4は、文字認識結果と宛先情報辞書126内の宛先情報
とを照合して、宛先情報の候補を決定する。次に、ステ
ップ305で、宛先情報辞書更新部115は、宛先候補
バッファ124に格納された宛先名称と、文字候補バッ
ファ123に格納されている文字候補とを照合すること
により、上記宛先名称の各文字が文字候補内に存在する
かどうかをチェックして、認識された文字候補の位置情
報を宛先情報辞書126の該当する宛先名称文字列に書
込む。
【0031】次に、図3のステップ304における宛先
決定部114の処理、すなわち、図2に示すような認識
フラグと省略フラグが設定された宛先情報辞書126を
用いた宛先候補決定のための処理について、図4に示す
フローチャートを参照して詳細に説明する。まず、ステ
ップ401で、宛先情報辞書126から宛先候補の絞り
込みを行なう。ここに、宛先候補の抽出方法は、たとえ
ば、特願平9−256842号に述べられているような
手法を用いる。この手法は、文字候補バッファ123内
の認識された文字候補を含む宛先情報辞書126内の宛
先候補を抽出するものである。
【0032】次に、ステップ402で、絞り込まれた宛
先候補から候補を1つ抽出し、ステップ403で、抽出
した候補の各文字の認識フラグが閾値以上の文字を照合
文字とする。次に、ステップ404で、選択された宛先
情報辞書126内の宛先候補の照合文字と文字候補とを
照合し、両者の一致度が閾値以上かどうかの判定を行な
い、閾値以上の候補をステップ405で宛先候補バッフ
ァ124に格納する。その際、省略フラグが設定されて
いる場合は、その文字が省略される場合もあるため、文
字の連結性の判定の際に考慮して判定する。
【0033】次に、ステップ406で、他に抽出された
宛先候補があるか否かを判定し、あればステップ402
以降の処理を続行し、なければステップ407で最終的
な宛先候補を決定して、宛先候補バッファ124に残
し、残りの宛先候補を削除する。たとえば、文字一致度
が最大のものを最終的な宛先候補として出力する。な
お、最終候補が1つに絞り込むことができない場合に
は、候補無しとする場合もある。
【0034】ステップ404での照合時に、たとえば、
図2(b)に示すように、文字候補が「小沢太郎」で、
宛先候補としての「小澤太郎」の「澤」が認識フラグが
「0」で照合文字として選択されなかった場合、照合文
字3文字中、3文字が一致で2文字目が不一致という照
合判定に対し、宛先候補としての「小田太郎」は全ての
文字が照合文字として選択され、照合文字4文字中、3
文字が一致となり、「小澤太郎」の方が候補として出力
されることになる。
【0035】また、図2(c)に示すように、「東京労
組」と記載された場合、宛先候補としての「東京労働組
合」と照合する際、「働」と「合」の省略フラグと文字
長から4文字中、4文字が一致と判定し、一致度が高い
ことで、候補として出力可能となる。
【0036】次に、図3のステップ305における宛先
情報辞書更新部115の処理、すなわち、図2に示すよ
うな認識フラグおよび省略フラグを設定する処理につい
て、図5に示すフローチャートを参照して詳細に説明す
る。まず、ステップ501で、宛先候補バッファ124
に宛先候補が存在するか否かをチエックし、存在する場
合、ステップ502で、宛先情報辞書126内の対応す
る宛先候補の一致文字位置の認識フラグに対し値を更新
する。その更新方法は、たとえば、認識フラグが「0」
で文字が一致した場合にフラグを「1」にする方法、ま
た、一致文字に対し最大値に達するまでその値を増加さ
せることにより、一致頻度として登録していく方法があ
る。次に、ステップ503で、宛先情報辞書126内の
対応する宛先候補の省略された文字位置の省略フラグに
対し、たとえば、値を1つ増加させるなどして値を更新
する。
【0037】このように、第1の実施の形態によれば、
郵便物の宛先情報の顧客名称の文字認識結果と、宛先情
報辞書126に登録された宛先情報との照合により、文
字認識結果に類似した顧客名称を抽出する際に、登録さ
れた顧客名称の各文字が文字候補と一致したかどうかを
示す一致文字位置情報や、顧客名称が省略されて記載さ
れたかどうかを示す文字省略情報を登録しておくこと
で、以後の照合の際に、旧字、俗字で記載された文字や
文字認識されにくい文字を除いた部分で照合することに
より、これらの文字を含む顧客名称の特定を行なうこと
が可能となり、宛先特定の認識性能の向上に役立ち、ま
た、認識結果を蓄えていくことで、通常記載される文字
情報を得ることができ、類似した顧客名称の誤読を防ぐ
ことができる。
【0038】次に、第2の実施の形態について説明す
る。
【0039】第2の実施の形態に係る宛先特定装置の構
成、および、全体の処理の流れは前述した第1の実施の
形態と同様であるので、その説明は省略し、異なる部分
についてだけ説明する。
【0040】図6(a)に、宛先情報辞書126におい
て、認識した文字候補の位置情報を表わす省略フラグお
よび分割文字列が登録されている例を示す。この省略フ
ラグは、第1の実施の形態で説明した手法と同様な手法
で設定され、この省略フラグのある文字は省略される可
能性がある。ここでは、さらに分割文字列について説明
する。
【0041】図6(a)に示すように、宛先情報辞書1
26に「株式会社東京」と登録されている場合に、実際
には図6(b)に示すように、「東京」と記載されるこ
とが多い場合、「株式会社」の各文字に省略フラグが登
録されることになる。また、たとえば、「鈴木歯科医
院」と登録されている場合に、図6(c)に示すよう
に、「鈴木医院」と記載された場合には、「歯科」の各
文字に省略フラグが登録される。この省略フラグが連続
している場合には、対応する文字列が省略されているこ
とであり、これらの文字列の前後の文字列が、それぞれ
意味ある単語と言え、これらの単語の分割文字列として
登録しておく。
【0042】たとえば、宛先情報辞書126の例である
図6(a)において、省略フラグの連続性により文字列
の区切りを検出して文字列を分割することで、「株式会
社東京」は「株式会社」、「東京」と2つの文字列に、
「鈴木歯科医院」は「鈴木」、「歯科」、「医院」と3
つの文字列に分割される。この分割された各文字列に省
略フラグが設定されており、省略される可能性がある場
合には、文字列ごとの省略フラグを設定しておく。この
例では、省略される可能性のある。「株式会社」、「歯
科」の文字列に省略フラグを設定する。
【0043】次に、図3のステップ304における宛先
決定部114の処理、すなわち、図6に示すような省略
フラグと分割文字列が設定された宛先情報辞書126を
用いた宛先候補決定のための処理について、図7に示す
フローチャートを参照して詳細に説明する。まず、ステ
ップ701で、宛先情報辞書126から宛先候補の絞り
込みを行なう。ここに、宛先候補の抽出方法は、たとえ
ば、特願平9−256842号に述べられているような
手法を用いる。この手法は、文字候補バッファ123内
の認識された文字候補を含む宛先情報辞書126内の宛
先候補を抽出するものである。
【0044】次に、ステップ702で、絞り込まれた宛
先候補から候補を1つ抽出し、ステップ703で、選択
された宛先情報辞書126内の宛先候補を構成する複数
の分割文字列ごとに一致度を調べ、省略フラグの設定さ
れていない分割された全ての文字列単位で一致度が閾値
を越えているか否かをチェックし、閾値を越えている場
合には、ステップ704で、宛先候補を宛先候補バッフ
ァ124に格納する。
【0045】次に、ステップ705で、他に抽出された
宛先候補があるか否かを判定し、あればステップ702
以降の処理を続行し、なければステップ707で最終的
な宛先候補を決定して、宛先候補バッファ124に残
し、残りの宛先候補を削除する。なお、最終候補が1つ
に絞り込むことができない場合には、候補無しとする場
合もある。
【0046】ステップ704での照合時に、たとえば、
図6(b)に示すように、文字候補が「鈴木医院」で、
宛先候補としての「鈴木歯科医院」と照合する際に、3
つの分割文字列それぞれについて一致度を判定する。
「鈴木」は2文字中、2文字が一致、「歯科」は省略フ
ラグ付きであるため、照合文字なしでよく、「医院」は
2文字中、2文字が一致となり、省略フラグが設定され
ていない全ての文字列について一致度が高いため、候補
として選択する。
【0047】次に、図3のステップ305における宛先
情報辞書更新部115の処理、すなわち、図6に示すよ
うな省略フラグおよび分割文字列を設定する処理につい
て、図8に示すフローチャートを参照して詳細に説明す
る。まず、ステップ801で、宛先候補バッファ124
に宛先候補が存在するか否かをチエックし、存在する場
合、ステップ802で、宛先情報辞書126内の対応す
る宛先候補の各文字の省略フラグが連続して設定されて
いる文字列を抽出し、その文字列に省略フラグを設定す
る。次に、ステップ803で、前後の文字列も分離して
抽出することで、文字列を分割して登録する。
【0048】このように、第2の実施の形態によれば、
郵便物の宛先情報の顧客名称の文字認識結果と、宛先情
報辞書126に登録された宛先情報との照合により、文
字認識結果に類似した顧客名称を抽出する際に、照合時
の一致文字位置情報から省略文字を判定し、連続した省
略文字から文字列の区切り情報を検出して、照合用の宛
先情報辞書126に登録しておくことで、登録名称が省
略して記載されたときにも、通常省略されがちな文字を
除外して照合を行なうことができ、宛先特定の認識性能
の向上に役立つ。
【0049】次に、第3の実施の形態について説明す
る。
【0050】第3の実施の形態に係る宛先特定装置の構
成、および、全体の処理の流れは前述した第1の実施の
形態と同様であるので、その説明は省略し、異なる部分
についてだけ説明する。
【0051】図9(a)に、宛先情報辞書126におい
て、認識した文字候補の前後に記載された文字候補を登
録した例を示す。図9(a)に示すように、宛先情報辞
書126に「鈴木太郎」と登録されている場合に、実際
には図9(b)に示すように、「鈴木歯科医院鈴木太郎
先生」と記載されることが多い場合や、図9(c)に示
すように、「柳町マンション管理人鈴木太郎様」と記載
されるなど、宛先名称の前後に文字列がある場合があ
る。この文字列を宛先情報辞書126に登録しておく。
また、個人名の後には通常「様」が付くが、「先生」と
つく場合など、特殊なケースもあるため、「様」以外の
文字列は登録しておく。
【0052】このように、通常記載されることのある文
字列を登録しておくことで、同姓同名の宛先特定時や、
宛先名称だけでは文字の一致度が低い場合に、複数文字
列による判定を行なって、宛先の特定を行なうことが可
能となり、宛先特定の認識性能が向上する。
【0053】次に、図3のステップ304における宛先
決定部114の処理、すなわち、図9に示すような宛先
文字列の前後に記載された文字候補が登録された宛先情
報辞書126を用いた宛先候補決定のための処理につい
て、図10に示すフローチャートを参照して詳細に説明
する。まず、ステップ1001で、宛先情報辞書126
から宛先候補の絞り込みを行なう。ここに、宛先候補の
抽出方法は、たとえば、特願平9−256842号に述
べられているような手法を用いる。この手法は、文字候
補バッファ123内の文字認識候補を含む宛先情報辞書
126内の宛先候補を抽出するものである。
【0054】次に、ステップ1002で、絞り込まれた
宛先候補から候補を1つ抽出し、ステップ1003で、
宛先名称候補と照合する文字列に対し、前後の文字列に
ついても照合の対象とする。次に、ステップ1004
で、選択された宛先情報辞書126内の宛先候補につい
て記載文字列との一致度を調べ、さらに、前後の文字候
補についても一致度を調べる。その結果、一致度が閾値
を越えている場合には、ステップ1005で、宛先候補
を宛先候補バッファ124に格納する。
【0055】次に、ステップ1006で、他に抽出され
た宛先候補があるか否かを判定し、あればステップ10
02以降の処理を続行し、なければステップ1007で
最終的な宛先候補を決定して、宛先候補バッファ124
に残し、残りの宛先候補を削除する。なお、最終候補が
1つに絞り込むことができない場合には、候補無しとす
る場合もある。
【0056】たとえば、図9(b)のように、「鈴木歯
科医院鈴木太郎先生」のように記載された場合に、文字
認識部113でノイズなどにより一部の文字が認識され
ず、認識候補が「**歯科医**木太郎先*」となった
場合には、宛先情報辞書126の登録名称である「鈴木
太郎」は4文字中、3文字が一致、前文字列の「鈴木歯
科医院」は6文字中、3文字が一致、後文字列の「先
生」は2文字中、1文字が一致となり、それぞれの文字
列の文字候補の一致度が低くても、3つの文字列の照合
結果から総合的に判定することで、候補として選択する
ことにより、認識性能が向上することになる。
【0057】次に、図3のステップ305における宛先
情報辞書更新部115の処理、すなわち、図9に示すよ
うな前文字列、後文字列の登録を行なう処理について、
図11に示すフローチャートを参照して詳細に説明す
る。まず、ステップ1101で、宛先候補バッファ12
4に宛先候補が存在するか否かをチエックし、存在する
場合、ステップ1002で、宛先候補の敬称のチェック
を行なって、「様」以外の文字列が敬称として使用され
ていた場合には、ステップ1103で、記載された敬称
文字候補を宛先情報辞書126内の対応する宛先候補の
後文字列として登録する。
【0058】次に、ステップ1104で、候補行の前ま
たは後に文字列が存在するか否かをチェックし、存在す
る場合には、ステップ1105で、文字列の前文字列ま
たは後文字列に文字候補を登録する。
【0059】このように、第3の実施の形態によれば、
郵便物の宛先情報の顧客名称の文字認識結果と、宛先情
報辞書126に登録された宛先情報との照合により、文
字認識結果に類似した顧客名称を抽出する際に、照合し
た文字候補の前後に記載される文字列の文字候補を照合
用の宛先情報辞書126に登録しておくことで、同姓同
名の複数名称を特定する際に複数行で判定して、他の文
字列の一致度により名称を特定することができる。さら
に各文字列の一致度が低い時に複数文字列による判定に
より、1つの文字列の一致度が低くても、複数の文字列
のそれぞれの一致度から統合的に判定することで、宛先
を特定することが可能となり、認識性能の向上に役立
つ。
【0060】
【発明の効果】以上詳述したように本発明によれば、類
似した顧客名称の誤読を防止することができるととも
に、宛先特定の認識性能の向上が図れる宛先特定装置を
提供できる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る宛先特定装置の構成
を概略的に示すブロック図。
【図2】第1の実施の形態における宛先情報辞書の構成
例を示す図。
【図3】第1の実施の形態における全体の処理の流れを
説明するフローチャート。
【図4】第1の実施の形態における宛先決定部の処理の
流れを説明するフローチャート。
【図5】第1の実施の形態における宛先情報辞書更新部
の処理の流れを説明するフローチャート。
【図6】第2の実施の形態における宛先情報辞書の構成
例を示す図。
【図7】第2の実施の形態における宛先決定部の処理の
流れを説明するフローチャート。
【図8】第2の実施の形態における宛先情報辞書更新部
の処理の流れを説明するフローチャート。
【図9】第3の実施の形態における宛先情報辞書の構成
例を示す図。
【図10】第3の実施の形態における宛先決定部の処理
の流れを説明するフローチャート。
【図11】第3の実施の形態における宛先情報辞書更新
部の処理の流れを説明するフローチャート。
【符号の説明】
111……画像パターン入力部(画像入力手段)、11
2……文字位置切出部(文字認識手段)、113……文
字認識部(文字認識手段)、114……宛先決定部(宛
先決定手段)、115……宛先情報辞書更新部(宛先情
報更新手段)、126……宛先情報辞書(宛先情報記憶
手段)。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 配達物の宛先面の画像を読取って画像デ
    ータを入力する画像入力手段と、 この画像入力手段で入力された画像データから文字認識
    を行なう文字認識手段と、 対象となる宛先の顧客名称とこれに対応した住所情報と
    からなる宛先情報をあらかじめ記憶している宛先情報記
    憶手段と、 前記文字認識手段の認識結果と前記宛先情報記憶手段に
    記憶されている宛先情報の顧客名称とを照合することに
    より宛先情報を決定する宛先決定手段と、 この宛先決定手段で決定された宛先情報と前記文字認識
    手段の認識結果とを照合し、この照合結果を前記宛先決
    定手段で決定された宛先情報に付加して前記宛先情報記
    憶手段に記憶する宛先情報更新手段と、 を具備したことを特徴とする宛先特定装置。
  2. 【請求項2】 前記宛先情報更新手段は、前記宛先決定
    手段で決定された宛先情報の各文字に対し、前記文字認
    識手段で認識した文字候補と照合して一致した文字につ
    いて文字一致情報を付加して前記宛先情報記憶手段に記
    憶することを特徴とする請求項1記載の宛先特定装置。
  3. 【請求項3】 前記宛先決定手段は、前記文字認識手段
    で認識した文字候補と前記宛先情報記憶手段に記憶され
    ている宛先情報とを照合する際、前記宛先情報記憶手段
    に記憶されている宛先情報の各文字の前記文字一致情報
    が付加された文字について照合を行ない、その照合結果
    があらかじめ設定された閾値よりも高い一致度の宛先情
    報を宛先として決定することを特徴とする請求項2記載
    の宛先特定装置。
  4. 【請求項4】 配達物の宛先面の画像を読取って画像デ
    ータを入力する画像入力手段と、 この画像入力手段で入力された画像データから文字認識
    を行なう文字認識手段と、 対象となる宛先の顧客名称とこれに対応した住所情報と
    からなる宛先情報をあらかじめ記憶している宛先情報記
    憶手段と、 前記文字認識手段の認識結果と前記宛先情報記憶手段に
    記憶されている宛先情報の顧客名称とを照合することに
    より宛先情報を決定する宛先決定手段と、 この宛先決定手段で決定された宛先情報の各文字に対
    し、前記文字認識手段で認識した文字候補と照合した結
    果省略された文字について文字省略情報を付加して前記
    宛先情報記憶手段に記憶する宛先情報更新手段と、 を具備したことを特徴とする宛先特定装置。
  5. 【請求項5】 前記宛先決定手段は、前記文字認識手段
    で認識した文字候補と前記宛先情報記憶手段に記憶され
    ている宛先情報とを照合する際、前記宛先情報記憶手段
    に記憶されている宛先情報の各文字の前記文字省略情報
    が付加された文字について照合を行ない、その照合結果
    があらかじめ設定された閾値よりも高い一致度の宛先情
    報を宛先として決定することを特徴とする請求項4記載
    の宛先特定装置。
  6. 【請求項6】 前記宛先情報に付加する文字省略情報は
    文字列の区切り情報であることを特徴とする請求項4記
    載の宛先特定装置。
  7. 【請求項7】 前記宛先決定手段は、前記文字認識手段
    で認識した文字候補と前記宛先情報記憶手段に記憶され
    ている宛先情報とを照合する際、前記宛先情報記憶手段
    に記憶されている宛先情報に付加されている文字列の区
    切り情報から生成される複数の文字列のそれぞれについ
    て照合を行ない、その照合結果があらかじめ設定された
    閾値よりも高い一致度の宛先情報を宛先として決定する
    ことを特徴とする請求項6記載の宛先特定装置。
  8. 【請求項8】 配達物の宛先面の画像を読取って画像デ
    ータを入力する画像入力手段と、 この画像入力手段で入力された画像データから文字認識
    を行なう文字認識手段と、 対象となる宛先の顧客名称とこれに対応した住所情報と
    からなる宛先情報をあらかじめ記憶している宛先情報記
    憶手段と、 前記文字認識手段で認識した文字候補と前記宛先情報記
    憶手段に記憶されている宛先情報の顧客名称とを照合す
    ることにより宛先情報を決定する宛先決定手段と、 この宛先決定手段において前記宛先情報記憶手段に記憶
    されている宛先情報と照合した前記文字認識手段で認識
    した文字候補の前後の文字候補を前記宛先決定手段で決
    定された宛先情報に付加して前記宛先情報記憶手段に記
    憶する宛先情報更新手段と、 を具備したことを特徴とする宛先特定装置。
  9. 【請求項9】 前記宛先決定手段は、前記文字認識手段
    で認識した文字候補と前記宛先情報記憶手段に記憶され
    ている宛先情報とを照合する際、前記宛先情報記憶手段
    に記憶されている宛先情報の前後に付加された文字列に
    ついても照合を行ない、それぞれの照合結果があらかじ
    め設定された閾値よりも高い一致度の宛先情報を宛先と
    して決定することを特徴とする請求項8記載の宛先特定
    装置。
JP11099121A 1999-04-06 1999-04-06 宛先特定装置 Pending JP2000288478A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11099121A JP2000288478A (ja) 1999-04-06 1999-04-06 宛先特定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11099121A JP2000288478A (ja) 1999-04-06 1999-04-06 宛先特定装置

Publications (1)

Publication Number Publication Date
JP2000288478A true JP2000288478A (ja) 2000-10-17

Family

ID=14238954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11099121A Pending JP2000288478A (ja) 1999-04-06 1999-04-06 宛先特定装置

Country Status (1)

Country Link
JP (1) JP2000288478A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195535A (ja) * 2005-01-11 2006-07-27 Ntt Data Corp 情報抽出装置及び情報抽出方法並びに情報抽出プログラム
JP2007011824A (ja) * 2005-07-01 2007-01-18 Hitachi Engineering & Services Co Ltd 文字列抽出方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195535A (ja) * 2005-01-11 2006-07-27 Ntt Data Corp 情報抽出装置及び情報抽出方法並びに情報抽出プログラム
JP2007011824A (ja) * 2005-07-01 2007-01-18 Hitachi Engineering & Services Co Ltd 文字列抽出方法および装置

Similar Documents

Publication Publication Date Title
JP3639126B2 (ja) 住所認識装置及び住所認識方法
US5943443A (en) Method and apparatus for image based document processing
JP2734386B2 (ja) 文字列読み取り装置
US20020114515A1 (en) Character string recognition apparatus, character string recognizing method, and storage medium therefor
JP2000293626A (ja) 文字認識方法及び装置ならびに記憶媒体
US7406201B2 (en) Correcting segmentation errors in OCR
US10438097B2 (en) Recognition device, recognition method, and computer program product
JP3589007B2 (ja) 文書ファイリングシステムおよび文書ファイリング方法
JP2000288478A (ja) 宛先特定装置
JP2751865B2 (ja) 文字列認識装置
JP3145071B2 (ja) 文字認識方法および装置
JPH06223121A (ja) 情報検索装置
JP2000298701A (ja) 宛先特定装置
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
JPH07319880A (ja) キーワード抽出・検索装置
JP2001236467A (ja) パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体
JP2746345B2 (ja) 文字認識の後処理方法
JP2001283156A (ja) 住所認識装置、住所認識方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0256086A (ja) 文字認識の後処理方法
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JP2002279344A (ja) 文字認識装置、文字認識方法および記録媒体
JP4584507B2 (ja) 住所認識装置、記録媒体及びプログラム
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JP2000251017A (ja) 単語辞書作成装置および単語認識装置