JP2000090192A - 住所および郵便番号の文字列修正方法 - Google Patents

住所および郵便番号の文字列修正方法

Info

Publication number
JP2000090192A
JP2000090192A JP10261654A JP26165498A JP2000090192A JP 2000090192 A JP2000090192 A JP 2000090192A JP 10261654 A JP10261654 A JP 10261654A JP 26165498 A JP26165498 A JP 26165498A JP 2000090192 A JP2000090192 A JP 2000090192A
Authority
JP
Japan
Prior art keywords
address
character string
character
postal code
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10261654A
Other languages
English (en)
Inventor
Minako Kuwata
みな子 桑田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP10261654A priority Critical patent/JP2000090192A/ja
Publication of JP2000090192A publication Critical patent/JP2000090192A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 住所を階層に区切るキー文字の認識に失敗し
た場合でも住所および郵便番号の表記を修正できる。 【解決手段】 項目分類部15は、認識文字列を最終出
力項目に分類して住所文字列と電話番号文字列とのペア
を作成する。文字列修正部17は、住所辞書14を用い
て入力(認識)住所文字列−郵便番号文字列に近い検索住
所文字列−郵便番号文字列を検索し、入力住所文字列−
郵便番号文字列との最大類似度を有する最大類似度検索
住所文字列を求め、入力住所文字列が最大類似度検索住
所文字列の70%以上を含んでいる場合には、入力住所
文字列を最大類似度検索住所文字列を用いて置き換え
る。こうして、住所の階層構造に因らずに住所の修正を
行うことによって、住所の階層を区切るキー文字の認識
に失敗した場合でも認識住所を修正できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、名刺読み取り装
置,住所録読み取り装置あるいは顧客名簿読み取り装置
や住所・郵便番号入力装置等に適用される住所および郵
便番号の文字列修正方法に関する。
【0002】
【従来の技術】名刺読み取り装置や住所録読み取り装置
によって名刺や住所録を読み取った場合、住所文字の認
識に失敗があったり誤認識したりする場合が多々ある。
特に住所は正確性が要求される情報であるために、誤認
識結果等は正しく修正しておく必要がある。通常、住所
には郵便番号が併記されている。そこで、住所と郵便番
号との組み合わせを考慮して住所を修正する方法が提案
されている。
【0003】このような文字認識結果修正方法として、
従来より、特開平3−257693号公報や特開平4−
111186号公報に開示されているようなものがあ
る。特開平3−257693号公報に開示された文字認
識結果修正方法においては、住所辞書と住所構造辞書と
を備えて、住所および郵便番号の文字列認識結果を修正
するものである。尚、上記住所辞書は、郵便番号とこの
郵便番号に対応する住所文字列の情報とを対応付けて登
録した辞書である。また、上記住所構造辞書は、住所の
区切り文字の順序構造および上記区切り文字間の文字
数、文字種類、住所文字列の省略可能性等を関連付けて
登録した辞書である。
【0004】また、特開平4−111186号公報に開
示された文字認識結果修正方法においては、地名単語テ
ーブルおよびインデックステーブルを備えて、最も類似
度の高い地名単語を決定するものである。尚、上記地名
単語テーブルは、住所文字列を構成する地名単語の階層
関係を表現したテーブルである。また、上記インデック
ステーブルは、上記単語の階層毎に、各単語の文字の出
現位置毎に文字コードでソートしたテーブルである。
【0005】上述のように、何れの公報においても、階
層構造を有する地名辞書を用いて、住所文字列の認識結
果を修正するようにしている。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の住所文字列認識結果修正方法においては、住所の階
層構造を利用して上階から下階へ、あるいは、下階から
上階へ順次修正を行うようにしている。そのため、都,
道,府,県,市,町,村および群等の階層を区切るキー文字
の認識に失敗した場合には、入力住所の階層構造が不明
であるために認識結果の修正ができないという問題があ
る。また、住所辞書の構造が複雑となり、ユーザが新た
な住所表記を登録することができず、住所辞書に予め登
録されてはいない通称の住所表記の登録修正は全く不可
能であるという問題もある。
【0007】さらには、上記住所辞書に登録されている
1住所の記載文字数が少ないため、住所文字列および郵
便番号文字列の全体に占める認識正解文字数によって文
字数の切り出しの正誤を判断する場合における切り出し
誤りを特定する材料が乏しいと言う問題がある。
【0008】そこで、この発明の目的は、住所を階層に
区切るキー文字の認識に失敗した場合でも住所および郵
便番号の表記を修正できる住所および郵便番号の文字列
修正方法を提供することにある。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明は、住所と郵便番号との対にお
ける上記住所の文字列および上記郵便番号の文字列を修
正する住所および郵便番号の文字列修正方法であって、
住所と郵便番号との対が登録された住所辞書のみを用い
て、対となって入力された住所文字列および郵便番号文
字列を修正することを特徴としている。
【0010】上記構成によれば、階層構造を有する地名
辞書を必要とはせず、単に県市区町名等が列挙された住
所と郵便番号とが対になって登録された住所辞書のみを
用いて、入力された住所文字列と郵便番号文字列との対
の文字列が修正される。したがって、文字列修正に用い
られる上記住所辞書の構造が簡単であり、一般ユーザに
よって容易に追加修正等が可能となる。
【0011】また、請求項2に係る発明は、請求項1に
記載の住所および郵便番号の文字列修正方法において、
上記住所辞書の中から,上記入力された住所文字列と郵
便番号文字列との各文字に一致する文字数に基づく類似
度が最大値を呈する住所文字列と郵便番号文字列との対
を検索し、上記検索された住所文字列と郵便番号文字列
との対を用いて,上記入力された住所文字列と郵便番号
文字列との対を修正することを特徴としている。
【0012】上記構成によれば、住所の階層構造を利用
することなく、住所文字列及び郵便番号文字列に関する
正解文字数に基づいて、上記入力された住所文字列と郵
便番号文字列との対に最も類似した住所文字列と郵便番
号文字列の対が検索される。そのため、修正処理におい
て「都道府県」,「市」,「区」および「町」等の住所階層を表す
キー文字を用いる必要がなく、上記キー文字の認識に失
敗した場合でも上記入力された住所文字列と郵便番号文
字列との対の文字列が適切に修正される。
【0013】また、請求項3に係る発明は、請求項2に
記載の住所および郵便番号の文字列修正方法において、
上記検索された住所文字列中に,上記入力された住所文
字列の各文字に一致する文字が所定割合以上含まれてい
るか否かを判定し、上記所定割合以上含まれている場合
に,上記検索された住所文字列と郵便番号文字列との対
を用いた修正を行うようになっていることを特徴として
いる。
【0014】上記構成によれば、上記住所辞書から検索
された最も類似した住所文字列と郵便番号文字列の対が
正解文字列候補として相応しい場合にのみ、その検索さ
れた住所文字列と郵便番号文字列との対を用いた修正を
行うことによって、修正誤りが減少される。
【0015】また、請求項4に係る発明は、請求項2に
係る発明の住所および郵便番号の文字列修正方法におい
て、上記入力された住所文字列の各文字の位置と当該文
字に一致する上記検索された住所文字列中の文字の位置
とが異なる場合には,上記両住所文字列間にずれが在る
と判定し、上記両住所文字列間にずれが在る場合には,
上記ずれを考慮した修正を行うことを特徴としている。
【0016】上記構成によれば、上記入力された住所文
字列と上記検索された住所文字列との間にずれが在る場
合には、上記ずれを考慮した修正が行われる。従って、
上記検索住所文字列との間の住所構造のずれを残した
り、上記入力文字列中に在る切り出し誤りを吸収して、
適切な修正が行われる。
【0017】また、請求項5に係る発明は、請求項4に
係る発明の住所および郵便番号の文字列修正方法におい
て、上記入力住所文字列と検索住所文字列との間にずれ
が在る場合には、上記入力住所文字列中における上記検
索住所文字列の何れにも一致しない最前の文字より前の
全文字列と、上記入力住所文字列中における上記検索住
所文字列の何れにも一致しない最前文字以降の文字列に
対応する上記検索住所文字列中の文字列と、上記入力住
所文字列中における番地を表す文字列とを組み合わせて
成る修正住所文字列を生成することによって、上記ずれ
を考慮した修正を行うようになっていることを特徴とし
ている。
【0018】上記構成によれば、上記入力住所文字列中
における番地を表す文字列以外の文字列で上記検索住所
文字列の何れにも一致しない最前文字以降の文字列が、
上記検索住所文字列中の対応する文字列で置き換えられ
る。こうして、上記検索住所文字列との間の階層構造の
ずれを残して、あるいは、入力住所文字列中に在る切り
出し誤りを吸収して、上記入力住所文字列が適切に修正
される。
【0019】
【発明の実施の形態】以下、この発明を図示の実施の形
態により詳細に説明する。図1は、本実施の形態の住所
および郵便番号の文字列修正方法が適用された文字認識
装置におけるブロック図である。本実施の形態の制御部
1は、以下に述べる各部を制御して、住所と郵便番号と
が記載されている名刺や住所録等の文字を認識する文字
認識処理動作を実行する。
【0020】画像入力部2は、スキャナ3で読み込まれ
た画像データやハードディスク(図示せず)等の磁気メモ
リから読み出された画像データを取り込んで、画像バッ
ファ4に格納する。また、画像バッファ4に格納した画
像データを読み出して制御部1に送出する。文字認識部
5は、制御部1から送出されてくる画像データに対して
文字切り出し処理、特徴抽出処理、マッチング処理、文
字列生成処理を行って、入力名刺中の文字を認識して文
字コードに変換する。
【0021】具体的には、上記文字切り出し処理では、
上記画像データから行および文字を切り出し、文字矩形
座標データを抽出して文字認識結果バッファ6に格納す
る。特徴抽出処理では、上記文字矩形座標データに基づ
いて画像データから文字画像を読み出し、この文字画像
から文字の特徴を抽出する。マッチング処理では、標準
パターン辞書7に登録されている標準パターン特徴と上
記文字の特徴とのマッチングを取って文字認識コード候
補を決め、文字認識コード候補データとして文字認識結
果バッファ6に格納する。文字列生成処理では、上記矩
形座標データを参照して文字認識コード候補に基づいて
まとまりのある文字列を生成して、文字列情報データと
して文字認識結果バッファ6に格納する。その結果、文
字認識結果バッファ6には、文字認識部5の処理結果と
して、文字認識コード候補,文字矩形座標および文字列
情報のデータが格納されることになる。
【0022】仮項目付け処理部8は、上記文字認識結果
バッファ6に格納されている文字認識コード候補および
文字列情報の各データを読み出し、項目キーワード辞書
9および項目別単語辞書10を検索する。そして、一致
する単語があればこの単語の仮項目名を当該文字列の仮
項目として付け、文字認識結果バッファ6と対応付けて
仮項目バッファ11に格納する。
【0023】図3は、上記項目キーワード辞書9及び項
目別単語辞書10の具体的内容の一例を示す。項目キー
ワード辞書9は、図3(a)に示すように、上記項目ラベ
ルとして使用される単語とその仮項目名を対応付けて登
録したものである。例えば入力画像が名刺画像である場
合には、上記単語としては「TEL」,「郵便番号」,「〒」,
「FAX」,「ファックス」等があり、夫々の仮項目名は「電
話項目ラベル」,「郵便番号項目ラベル」,「ファックス項目
ラベル」である。また、入力画像が住所録である場合に
は、上記単語としては「氏名」,「住所」,「電話」,「郵便番
号」,「所属」,「役職」,「備考」等があり、夫々の仮項目名
は「氏名項目ラベル」,「住所項目ラベル」,「電話項目ラベ
ル」,「郵便番号項目ラベル」,「所属項目ラベル」,「役職項
目ラベル」,「備考項目ラベル」である。
【0024】項目別単語辞書10は、図3(b)に示すよ
うに、各項目に現れる単語とその仮項目名とを対応付け
て各項目別に登録したものである。具体的には、地名辞
書には、「東京都」,「大阪府」,「奈良市」,「美濃庄町」,「材
木町」等の地名とその仮項目名「地名」とが登録されてい
る。また、姓辞書には、「山田」,「鈴木」,「佐藤」等の姓と
その仮項目名「姓」とが格納されている。また、名辞書に
は、「太郎」,「花子」,「次郎」,「雪子」等の名とその仮項目
名「名」が登録されている。また、一般辞書には、「机」,
「花」,「印刷」等の一般名詞とその仮項目名「一般名詞」と
が格納されている。
【0025】そして、上記仮項目付け処理部8は、入力
文書が図4に示すような名刺の場合には、文字認識結果
バッファ6の文字列情報データ「〒」が項目キーワード辞
書9の単語「〒」と合致するため、図5に示すように、単
語「〒」の仮項目名「郵便番号項目ラベル」を文字列情報デ
ータ「〒」と対応付けて仮項目バッファ11に格納する。
こうして、上記認識文字列の仮分類が行われるのであ
る。
【0026】後処理部12は、上記文字認識結果バッフ
ァ6および仮項目バッファ11の内容を読み出し、文字
認識コード候補,文字矩形座標,言語辞書13および項目
別単語辞書10の地名辞書を用いて文字認識精度を上げ
るための認識後処理を行う。例えば、文字認識コード候
補の種々組み合わせから図6(a)に示すような認識結果
文字列候補が得られた場合には、認識結果第1位文字列
「大坂市北区…」中の文字「坂」が、上記地名辞書に登録さ
れた「大阪市」を参照することによって、認識結果第2位
文字列中の文字「阪」に起きかえられる。その結果、図6
(b)に示すように、認識結果第1位文字列が「大阪市北区
…」に修正されるのである。
【0027】項目分類部15は、上記文字認識結果バッ
ファ6および仮項目バッファ11の内容を読み出し、各
文字列を最終出力項目に分類し、分類結果を項目分類バ
ッファ16に格納する。そうした後、項目分類バッファ
16から項目名「住所項目ラベル」が付与された文字列と
項目名「郵便番号項目ラベル」が付与された文字列とを読
み出し、住所と郵便番号とのペアを作成して文字列修正
部17に送出する。この場合の住所と郵便番号とのペア
作成は、次のようなペア作成方法に従って行われる。 ペア作成方法1…文字認識部5で認識された順番にペア
を作成する。 ペア作成方法2…住所文字列および郵便番号文字列を構
成する各文字の文字矩形座標に基づいて、各住所文字列
および各郵便番号文字列の平均座標を求め、平均座標の
近い住所文字列と郵便番号文字列とをペアにする。 ペア作成方法3…入力文書が住所文字列および郵便番号
文字列の位置が固定されている住所録等である場合に、
入力文書のフォーマット情報を用いて上記ペアを作成す
る。 ペア作成方法4…入力文書の罫線情報を用い、罫線で囲
まれた領域内にある住所文字列と郵便番号文字列とをペ
アにする。
【0028】図7〜図9に、上記作成された住所文字列
と郵便番号文字列とのペアの一例を示す。図7(a)は、
入力文書としての名刺の画像である。図7(b)は、文字
認識部5による認識結果と項目分類部15による項目分
類結果である。図7(c)は、図7(b)に示す認識結果と項
目分類結果に基づいて、「ペア作成方法1」によって作成
された住所文字列と郵便番号文字列とのペアである。
【0029】また、図8(a)は、入力文書としての名刺
の画像である。図8(b)は、文字認識部5による認識結
果と項目分類部15による項目分類結果である。図8
(c)は、図8(b)に示す認識結果と項目分類結果とに基づ
いて、「ペア作成方法2」によって作成された住所文字列
と郵便番号文字列とのペアである。この場合、図8(a)
において、住所「東京都千代田区外神田…」とこの住所の
直前に印刷されている郵便番号「101−0021」とが
ペアリングされ、住所「大阪市北区茶屋町…」とこの住所
の直前に印刷されている郵便番号「530−0013」と
がペアリングされている。
【0030】また、図9(a)は、入力文書としての住所
録の画像である。図9(b)は、文字認識部5の認識結果
と項目分類部15の項目分類結果である。図9(c)は、
図9(b)に示す認識結果と項目分類結果とに基づいて、
「ペア作成方法3」によって作成された住所文字列と郵便
番号文字列とのペアである。この場合、図9(a)に示す
ように、住所あるいは郵便番号の何れか一方のみが存在
して他方が無いデータは、(A),(B)で示すように、住
所あるいは郵便番号の片方が空白のペアとなる。
【0031】上述のように、上記項目分類部15は、文
字認識の出現順,文字列の位置関係,紙面のフォーマッ
ト情報,紙面の罫線情報等に基づいて住所と郵便番号と
のペアを作成するのであるが、その具体的方法は上記ペ
ア作成方法1〜ペア作成方法4に限定するものではな
い。
【0032】上記文字列修正部17は、上記項目分類部
15からの住所と郵便番号とのペアに基づいて、後に詳
述するようにして住所および郵便番号の修正処理を行っ
て、出力住所文字列バッファ18及び出力郵便番号文字
列バッファ19に格納する。そして、修正処理結果は、
出力部20によって出力住所文字列バッファ18および
出力郵便番号文字列バッファ19から読み出されて出力
される。
【0033】以下、上記文字列修正部17によって行わ
れる住所および郵便番号の修正処理動作について詳細に
説明する。図2は、制御部1による制御の下に文字列修
正部17によって実行される住所および郵便番号修正処
理動作のフローチャートである。項目分類部15によっ
て住所と郵便番号とのペアが作成されると住所および郵
便番号修正処理動作がスタートする。
【0034】ステップS1で、上記制御部1を介して、
項目分類部15によって作成された住所と郵便番号との
1組分の文字列が入力される。ステップS2で、入力は
終了か否か、すなわち文字列の入力があったか否かが判
別される。その結果、入力終了であれば住所および郵便
番号修正処理動作を終了する。入力終了でなければステ
ップS3に進む。
【0035】ステップS3で、「連続する数字が存在する
位置」や「上記地名辞書に登録されている地名の次の位
置」等の情報を用いて、ステップS1において入力された
住所の文字列から番地位置が検出される。図10に、番
地位置の検出結果の例を示す。ステップS4で、住所辞
書14が検索される。具体的な検索方法は特に限定しな
いが、例えば、先頭文字による検索や都道府県名による
検索や市名による検索や郵便番号による検索等を行い、
(住所−郵便番号)または(住所のみ)または(郵便番号の
み)の入力文字列に対して、入力文字列に近い住所と郵
便番号とが組み合わされた複数あるいは単数の文字列を
得る。そして、ステップS5で、当該組の住所文字列と
郵便番号文字列との検索が終了したと判定されるとステ
ップS6に進む。
【0036】図11は、上記住所辞書14の検索結果の
一例を示す。入力(認識)文字列は 「住所 :大阪市北瓢茶璽町18−21(豊崎ビル) 郵便番号:5300013 」 であり、入力住所文字列に近い正解候補住所文字列とそ
の郵便番号文字列、および、入力郵便番号文字列に近い
正解候補郵便番号文字列とその住所文字列が、検索結果
として複数件出力されている。
【0037】ステップS6で、上記ステップS4およびス
テップS5において検索された住所文字列−郵便番号文
字列の組を、以下に述べる類似度を用いた文字列評価方
法を用いて評価する検索文字列評価が行われる。ここ
で、入力された住所文字列−郵便番号文字列の組み合わ
せをTとし、そのメンバの住所をT1郵便番号をT2とす
る。一方、住所辞書14から検索された住所文字列−郵
便番号文字列の組み合わせをRとし、そのメンバの住所
をR1郵便番号をR2とする。 T={T1=(a1,a2,a3,a4,…,ai),T2=(p1,p
2,p3,p4,…,pk)} R={R1=(b1,b2,b3,b4,…,bj),R2=(q1,q
2,q3,q4,…,ql)} 尚、ai,pk,bj,qlは、夫々T1,T2,R1,R2のメンバ
としての文字である。
【0038】ところで、上記入力された住所文字列−郵
便番号文字列の組み合わせTと検索された住所文字列−
郵便番号文字列の組み合わせRの具体的な例を、 T={T1=大阪市北瓢茶璽町18−21(豊崎ビル),
2=5300013} R={R1=大阪府大阪市北区茶屋町,R2=53000
13} とする。
【0039】また、上記TとRとの類似度D(T,R)を D(T,R)=d1(T1,R1)+m×d2(T2,R2)+1/(|i−j|)…(1) m:0<m<1の定数と定義する。但し、
【数1】 つまり、d(T1,R1)は、T1のメンバとR1のメンバ
との一致文字数である。但し、比較する文字位置は、前
後x文字を許容範囲とする。本実施の形態においては、
xを前後7文字としている。また、d2(T2,R2)は、T
2のメンバとR2のメンバとの一致文字数である。但し、
比較する文字位置は、前後y文字を許容範囲とする。本
実施の形態においては、yを前後3文字としている。d
1,d2の初期値は「0」である。
【0040】以下、上記T1およびR1の具体例 T1=大阪市北瓢茶璽町18−21(豊崎ビル) R1=大阪府大阪市北区茶屋町 の場合についてのd1(T1,R1)を算出する。ここで、T
1の番地位置は9文字目の数字「1」である。そして、d1
(T1,R1)の算出対象文字列は上記番地位置の直前文字
までの文字列とする。また、比較文字位置の許容範囲x
は{−3,−2,−1,0,1,2,3}の7文字である。尚、
上記番地位置は、ある住所文字列中において「丁目」や
「番地」を表す数字列の開始位置である。
【0041】先ず、T1の1文字目「大」と、R1の1文字
目(x=0)「大」,2文字目(x=1)「阪」,3文字目(x=
2)「府」,4文字目(x=3)「大」とを順次比較する。そし
て、一致する文字があるので、d1(T1,R1)に「1」を加
算する。次に、T1の2文字目「阪」と、R1の1文字目
(x=−1)「大」,2文字目(x=0)「阪」,3文字目(x=
1)「府」,4文字目(x=2)「大」,5文字目(x=3)「阪」
とを順次比較する。そして、一致する文字があるので、
1(T1,R1)に「1」を加算する。次に、T1の3文字目
「市」と、R1の1文字目(x=−2)「大」,2文字目(x=
−1)「阪」,3文字目(x=0)「府」,4文字目(x=1)
「大」,5文字目(x=2)「阪」,6文字目(x=3)「市」とを
順次比較する。そして、一致する文字があるので、d
1(T1,R1)に「1」を加算する。次に、T1の4文字目
「北」と、R1の1文字目(x=−3)「大」,2文字目(x=
−2)「阪」,3文字目(x=−1)「府」,4文字目(x=0)
「大」,5文字目(x=1)「阪」,6文字目(x=2)「市」,7
文字目(x=3)「北」とを順次比較する。そして、一致す
る文字があるので、d1(T1,R1)に「1」を加算する。
【0042】次に、T1の5文字目「瓢」と、R1の2文字
目(x=−3)「阪」,3文字目(x=−2)「府」,4文字目
(x=−1)「大」,5文字目(x=0)「阪」,6文字目(x=
1)「市」,7文字目(x=2)「北」,8文字目(x=3)「区」
とを順次比較する。そして、一致する文字がないので、
1(T1,R1)に「0」を加算する。次に、T1の6文字目
「茶」と、R1の3文字目(x=−3)「府」,4文字目(x=
−2)「大」,5文字目(x=−1)「阪」,6文字目(x=
0)「市」,7文字目(x=1)「北」,8文字目(x=2)「区」,
9文字目(x=3)「茶」とを順次比較する。そして、一致
する文字があるので、d1(T1,R1)に「1」を加算する。
次に、T1の7文字目「璽」と、R1の4文字目(x=−3)
「大」,5文字目(x=−2)「阪」,6文字目(x=−1)
「市」,7文字目(x=0)「北」,8文字目(x=1)「区」,9
文字目(x=2)「茶」,10文字目(x=3)「屋」とを順次
比較する。そして、一致する文字がないので、d1(T1,
1)に「0」を加算する。次に、T1の8文字目「町」
と、R1の5文字目(x=−3)「阪」,6文字目(x=−
2)「市」,7文字目(x=−1)「北」,8文字目(x=0)
「区」,9文字目(x=1)「茶」,10文字目(x=2)「屋」,
11文字目(x=3)「町」とを順次比較する。そして、一
致する文字があるので、d1(T1,R1)に「1」を加算す
る。
【0043】次に、T1の9文字目「1」は番地位置の文
字であるからd1(T1,R1)の算出処理を終了し、算出結
果d1(T1,R1)=6を得る。そして、次にd2(T2,R2)
の算出処理に移行する。
【0044】以下、上記T2及びR2の具体例に従ってd
2(T2,R2)を算出する。ここで、 T2=5300013 R2=5300013 の比較文字位置の許容範囲yは{−1,0,1}の3文字で
ある。
【0045】先ず、T2の1文字目「5」と、R2の1文字
目(x=0)「5」,2文字目(x=1)「3」とを順次比較す
る。そして、一致する文字があるのでd2(T2,R2)に
「1」を加算する。次に、T2の2文字目「3」と、R2の1
文字目(x=−1)「5」,2文字目(x=0)「3」,3文字目
(x=1)「0」とを順次比較する。そして、一致する文字
があるのでd2(T2,R2)に「1」を加算する。次に、T2
の3文字目「0」と、R2の2文字目(x=−1)「3」,3文
字目(x=0)「0」,4文字目(x=1)「0」とを順次比較
する。そして、一致する文字があるので、d2(T2,R2)
に「1」を加算する。次に、T2の4文字目「0」と、R2
3文字目(x=−1)「0」,4文字目(x=0)「0」,5文字
目(x=1)「0」とを順次比較する。そして、一致する文
字があるのでd2(T2,R2)に「1」を加算する。
【0046】次に、T2の5文字目「0」と、R2の4文字
目(x=−1)「0」,5文字目(x=0)「0」,6文字目(x
=1)「1」とを順次比較する。そして、一致する文字が
あるのでd2(T2,R2)に「1」を加算する。次に、T2
6文字目「1」と、R2の5文字目(x=−1)「0」,6文字
目(x=0)「1」,7文字目(x=1)「3」とを順次比較す
る。そして、一致する文字があるので、d2(T2,R2)に
「1」を加算する。次に、T2の7文字目「3」と、R2の6
文字目(x=−1)「1」,7文字目(x=0)「3」とを順
次比較する。そして、一致する文字があるのでd2(T2,
2)に「1」を加算する。T2の7文字目「3」は最終文字
であるからd2(T2,R2)の算出処理を終了し、算出結果
2(T2,R2)=7を得る。
【0047】上述のように、上記一致文字数算出に際し
ては、比較文字位置を許容範囲x,y分だけ前後にずら
している。図12に、TとR1との比較時における文
字の対応付けを示している。このように、前後x文字を
比較の対象とすることによって、修正対象住所文字列T
1と住所辞書14の記載とにずれがある(図12において
は入力住所文字列T1で「大阪府」が省略されている)場合
でも、そのずれを吸収して正確な一致文字数算出を行え
る。また、文字認識部5で文字切り出し誤りがあって
も、その誤りを吸収できるのである。
【0048】また、入力住所文字列T1の文字列数iは
i=8であり、検索住所文字列R1の文字列数jはj=
11である。したがって、1/(|i−j|)=1/3とな
り、入力された住所文字列−郵便番号文字列の組み合わ
せTと検索された住所文字列−郵便番号文字列の組み合
わせRとの類似度D(T,R)は、式(1)より D(T,R)=6+m×7+1/3 となり、重み係数mを「0.7」とすると、 D(T,R)=6+0.7×7+1/3 =11.23 が得られる。図13に、上記具体例に対する類似度D
(T,R)の計算例を示す。
【0049】以下同様にして、上記ステップS4におけ
る住所辞書14の検索結果得られた総ての住所と郵便番
号との組み合わせRに付いて、入力された住所と郵便番
号との組み合わせTとの類似度D(T,R)が算出され
る。
【0050】ステップS7で、上記算出された総ての類
似度D(T,R)中で最大値を呈する検索住所文字列−郵
便番号文字列の組が、最良検索データとして抽出され
る。ステップS8で、入力住所文字列−郵便番号文字列
の組を上記最良検索データで置き換え可能か否かが判定
される。その結果、置き換え可能であればステップS9
に進み、置き換え不可能であれば上記ステップS1に戻
って次の組の住所と郵便番号との文字列入力に移行す
る。ここで、上記置き換え可能か否かの判定は、次のよ
うにして行われる。
【0051】すなわち、入力(認識)住所文字列と上記最
良検索データ中における検索住所文字列(以下、最大類
似度検索住所文字列と言う)との一致文字数を求め、上
記最大類似度検索住所文字列の70%以上の文字を上記
入力住所文字列が含んでいる場合には、上記置き換えは
可能であると判定するのである。但し、この場合にも比
較文字位置の前後z文字を比較の対象とする。
【0052】例えば、入力住所文字列−郵便番号文字列
Tと最大類似度検索住所文字列−郵便番号文字列Rとが T={T1=大阪市北瓢茶璽町18−21(豊崎ビル),
2=5300013} R={R1=大阪府大阪市北区茶屋町,R2=53000
13} の場合、比較文字位置の許容範囲zを「7」とすると、R
1の文字「大」,「阪」,「大」,「阪」,「市」,「北」,「茶」および
「町」の8文字がT1と一致し、一致文字数S=8とな
る。また、R1の文字数Lは「11」であるから、(S/L)
×100=72.72となり、70%以上の文字を入力
住所文字列T1が含むため、上記具体例の場合には「置き
換え可能」であると判定するのである。図14に、上記
具体例に対する一致文字数の計算例を示す。
【0053】こうして、「置き換え可能」であると判定さ
れると入力住所文字列を最大類似度検索住所文字列に置
き換えることになる。ところが、入力住所文字列と最大
類似度検索住所文字列とには、 入力住所文字列 :大阪市中央区大手肴×丁目○番△号 最大類似度検索住所文字列:大阪府大阪市中央区大手町 のごとく、住所表記の階層にずれが生ずる場合がある。
したがって、先ず、住所の階層構造にずれがないか否か
を検出した後、この検出結果に従って置き換え処理を行
う必要がある。そこで、ステップS9で、上記入力住所
文字列の住所階層構造と最大類似度検索住所文字列の住
所階層構造とにずれがあるか否かが判別される。その結
果、ずれがある場合にはステップS10に進み、ずれがな
い場合にはステップS11に進む。
【0054】上記住所階層構造のずれの有無は以下のよ
うにして行う。すなわち、入力住所文字列 → 大阪市中
央区大手肴×丁目○番△号の各文字と最大類似度検索住
所文字列とを先頭文字から順に比較する。そして、最初
に一致した文字の位置を一致テーブルPi={P0,P1,
…,Pi,…,PI}に記入する。但し、一致する文字がない
場合には「−1」を記入する。ここで、 最大類似度検索住所文字列 → 大阪府大阪市中央区大手
町 の文字位置を次のように設定すると、 0 1 2 3 4 5 6 7 8 9 10 11 大 阪 府 大 阪 市 中 央 区 大 手 町 入力住所文字列の1番目の文字「大」が最大類似度検索住
所文字列中の文字と最初に一致する文字位置は「0」であ
る。したがって、一致テーブルPiの内容は{0}とな
る。次に、入力住所文字列の2番目の文字「阪」が最大類
似度検索住所文字列中の文字と最初に一致する文字位置
は「1」である。したがって、上記一致テーブルPiの内
容は{0,1}となる。次に、入力住所文字列の3番目の
文字「市」が最大類似度検索住所文字列中の文字と最初に
一致する文字位置は「5」である。したがって、一致テー
ブルPiの内容は{0,1,5}となる。以下同様に比較を
行うと最終的に一致テーブルPiの内容は Pi={0,1,5,6,7,8,0,10,-1,-1,-1,-1,-1,
-1,-1,-1} となる。但し、一致テーブルPのメンバの番号iは、 0≦i<(入力住所文字列文字数) である。
【0055】そして、以下のように上記一致テーブルP
のメンバとiとの差を順次求めて、ずれテーブルQi
メンバを求める。但し、Qi<0であれば、Qi=0とす
る。また、Pi=−1であれば、Qi=−1とする。その
結果、 i=0 → P0−i=0−0= 0 であるから、Q0= 0 i=1 → P1−i=1−1= 0 であるから、Q1= 0 i=2 → P2−i=5−2= 3 であるから、Q2= 3 i=3 → P3−i=6−3= 3 であるから、Q3= 3 i=4 → P4−i=7−4= 3 であるから、Q4= 3 i=5 → P5−i=8−5= 3 であるから、Q5= 3 i=6 → P6−i=0−6=−6 であるから、Q6= 0 i=7 → P7−i=10−7= 3 であるから、Q7= 3 i=8 → P8=−1 であるから、Q8=−1 i=9 → P9=−1 であるから、Q9=−1 i=10 → P10=−1 であるから、Q10=−1 i=11 → P11=−1 であるから、Q11=−1 i=12 → P12=−1 であるから、Q12=−1 i=13 → P13=−1 であるから、Q13=−1 i=14 → P14=−1 であるから、Q14=−1 i=15 → P15=−1 であるから、Q15=−1 となり、ずれテーブルQiは、 Qi={0,0,3,3,3,3,0,3,-1,-1,-1,-1,-1,
-1,-1,-1} となる。
【0056】次に、ずれテーブルQiのメンバで、「−
1」以外で最も大きい値をQiの代表値とする。本例の場
合には「3」が、ずれテーブルQiの代表値となる。そし
て、代表値が「0」である場合には、入力住所文字列の住
所階層構造と最大類似度検索住所文字列の住所階層構造
とにずれは無いと判定する。また、代表値が「0」以外の
値である場合にはずれ在りと判定する。そして、ずれ在
りの場合には、一致テーブルPのメンバ「−1」のうち最
小のiの1つ前のiがずれ位置となる。したがって、本
例の場合のずれ位置は「7」であり、該当する文字は「手」
である。
【0057】こうして、上記ステップS9において上記
入力住所文字列の住所階層構造と最大類似度検索住所文
字列の住所階層構造とにずれがあると判別されると、ス
テップS10で、上記ずれを考慮した置き換え処理が実行
される。この場合の置き換え処理は以下のようにして行
われる。
【0058】すなわち、上記入力住所文字列のうち上記
ずれ位置までの文字列は、そのまま出力住所文字列バッ
ファ18にコピーして残す。本例の場合におけるずれ位
置は「7」であるから、入力住所文字列「大阪市中央区大
手肴×丁目○番△号」のうち8番目までの文字列「大阪
市中央区大手」を出力住所文字列バッファ18にコピー
する。
【0059】次に、上記P7は「10」であるから、入力
住所文字列における文字位置「7」の文字「手」は最大類似
度検索住所文字列の文字位置「10」の文字に一致する。
そして、最大類似度検索住所文字列「大阪府大阪市中央
区大手町」には、上記文字位置「10」よりも後ろに更に
文字「町」が存在するので、その文字「町」を出力住所
文字列バッファ18の最後尾に追加コピーする。最後
に、入力住所文字列「大阪市中央区大手肴×丁目○番△
号」における上記番地位置以降の文字列「×丁目○番△
号」を出力住所文字列バッファ18の最後尾に追加コピ
ーするのである。こうして、上記ずれを考慮した置き換
え処理が実行された結果、出力住所文字列バッファ18
には、住所文字列「大阪市中央区大手町×丁目○番△
号」が格納される。その結果、入力住所文字列「大阪市
中央区大手肴×丁目○番△号」の誤認識文字「肴」が正解
文字「町」に修正されるのである。
【0060】一方、上記ステップS9において入力住所
文字列の住所階層構造と最大類似度検索住所文字列の住
所階層構造にずれは無いと判別されると、ステップS11
で、ずれていない場合の置き換え処理が実行される。こ
の場合の置き換え処理は以下のようにして行われる。
【0061】すなわち、上記入力住所文字列の住所階層
構造と最大類似度検索住所文字列の住所階層構造とにず
れは無いのであるから、入力住所文字列における上記番
地位置より前の全文字列に対応する最大類似度検索住所
文字列中の文字列を出力住所文字列バッファ18にコピ
ーする。そして、入力住所文字列における上記番地位置
以降の文字列を出力住所文字列バッファ18の最後尾に
追加コピーするのである。
【0062】ステップS12で、郵便番号置き換え処理が
実行される。すなわち、上記ステップS8において上記
入力住所文字列−郵便番号文字列を上記最良検索データ
と置き換え可能であると判別された場合には、無条件に
上記入力郵便番号文字列も上記最良検索データで置き換
えるのである。具体的に言えば、最大類似度検索住所文
字列のペアである郵便番号文字列(つまり、上記最良検
索データの郵便番号文字列)を出力郵便番号文字列バッ
ファ19にコピーする。
【0063】そうした後、上記ステップS1に戻って次
の組の住所と郵便番号との文字列入力に移行する。そし
て、上記ステップS2において入力終了であると判別さ
れると、住所および郵便番号修正処理動作を終了するの
である。
【0064】その後、上記出力部20によって、上記出
力住所文字列バッファ18に格納された住所文字列と出
力郵便番号文字列バッファ19に格納された郵便番号文
字列とを格納順にペアにして、修正結果として出力する
のである。
【0065】上述のように、本実施の形態においては、
画像入力部2から入力された名刺や住所録等の画像デー
タに基づいて文字認識部5で文字認識を行い、仮項目付
け処理部8によって上記文字認識結果に項目名を付け
る。そして、項目分類部15によって、上記仮項目付け
結果に基づいて認識文字列を最終出力項目に分類し、住
所文字列と電話番号文字列とのペアを作成する。
【0066】そうすると、上記文字列修正部17は、住
所と郵便番号とが対になって登録された住所辞書14を
引いて、入力(認識)住所文字列−郵便番号文字列に近い
検索住所文字列−郵便番号文字列を検索する。そして、
入力住所文字列−郵便番号文字列Tと検索住所文字列−
郵便番号文字列Rとの類似度D(T,R)が最大値を呈す
る最良検索データを求め、入力住所文字列が上記最良検
索データの最大類似度検索住所文字列の70%以上を含
んでいる場合には、入力住所文字列−郵便番号文字列を
上記最良検索データの全部あるいは一部で置き換えるよ
うにしている。
【0067】このように、本実施の形態においては、住
所の階層構造に因らず、住所文字列の類似度に基づいて
住所の修正を行うので、修正処理の途中において「都道
府県」,「市」,「町」及び「村」等の住所階層を表す文字を用
いる必要がない。したがって、上記住所の階層を区切る
キー文字の認識に失敗した場合でも認識住所を修正でき
るのである。
【0068】また、上記文字列修正部17は、上記置き
換えに際しては、入力住所文字列の各文字とこの文字に
一致する最大類似度検索住所文字列の文字との位置のず
れを検出する。そして、ずれがある場合には上記入力住
所文字列における上記ずれ位置までの文字列を残し、こ
れに最大類似度検索住所文字列における上記ずれ位置に
対応する文字より後の文字列を付加し、更に上記入力住
所文字列における上記番地位置以降の文字列を付加する
ことによって、修正住所文字列を生成するようにしてい
る。したがって、上記入力住所文字列と最大類似度検索
文字列とに住所の階層構造上のずれが在っても、そのず
れを考慮して修正を行うことができる。また、文字認識
部5による切り出し誤りがある場合でもその切り出し誤
り部を正しく修正できる。
【0069】また、本実施の形態においては、上述した
ように住所の階層構造に因らず住所の修正を行うので、
住所辞書14の構造は階層構造を有している必要は無
く、ユーザでも容易に登録することが可能である。そこ
で、住所辞書14に付属するユーザ登録辞書を設けて住
所文字列と郵便番号文字列とをペアで登録しておき、図
2に示すフローチャートのステップS4において辞書検
索を行う際に、住所辞書14と上記ユーザ登録辞書とを
合わせて検索するようにすれば、入力住所が通称の住所
表記であっても認識修正が可能となる。
【0070】あるいは、会社等の組織が個別の郵便番号
を登録申請して取得する大口ユーザ郵便番号が住所辞書
14に無い場合でも、ユーザ登録辞書に大口ユーザの住
所と大口ユーザ郵便番号とのペア (奈良県天理市擽本町,〒632−8567) を登録しておけば、入力住所文字列−郵便番号文字列の
ペア 住所 :奈良県天理市擽本町 郵便番号:632−8567 を 住所 :奈良県天理市本町 郵便番号:632−8567 と誤認識した場合でも、住所辞書14から検索住所文字
列−郵便番号文字列 (奈良県天理市擽本町,〒632−0000) を検索し、上記ユーザ登録辞書から検索住所−郵便番号
文字列 (奈良県天理市擽本町,〒632−8567) を検索することができる。したがって、両検索住所文字
列−郵便番号文字列に対して上記検索文字列評価を行う
ことによって、誤認識住所文字列「奈良県天理市機本町」
を正しく修正できるのである。
【0071】また、上記実施の形態においては、画像入
力部2,文字認識部5,仮項目付け処理部8および項目分
類部15を有して、入力画像データから入力文字を認識
し、この文字認識結果に項目名を付け、この項目名に基
づいて住所文字列と郵便番号文字列とのペアを作成する
ようにしている。しかしながら、この発明はこれに限定
されるものではなく、予めペアリングされた住所文字列
と郵便番号文字列との対を入力して修正住所文字列と郵
便番号文字列との対を出力するように構成することも可
能である。
【0072】図15は、この発明の住所および郵便番号
の文字列修正方法が適用されて上述の入力住所文字列−
郵便番号文字列を修正して、出力する住所修正装置のブ
ロック図である。制御部31は、以下に述べる各部を制
御して入力された住所文字列と郵便番号文字列との対を
修正する。修正データ入力部32は修正の対象となる住
所文字列と郵便番号文字列との対を入力する。この修正
データ入力部32への入力としては、顧客名簿等のデー
タベース上の文字データでもよいし、マニュアル入力さ
れた文字データであってもよい。文字列修正部33は、
図1における文字列修正部17と同様に機能して、住所
辞書14と同じ構成の住所辞書34を用いて入力住所文
字列と郵便番号文字列との対を修正して、出力住所文字
列バッファ35および出力郵便番号文字列バッファ36
に格納する。出力部37は、出力住所文字列バッファ3
5に格納された住所文字列と出力郵便番号文字列バッフ
ァ36に格納された郵便番号文字列とをペアにして、修
正結果として出力する。
【0073】上記構成の住所修正装置を用いれば、既に
5/3桁郵便番号で記述された顧客名簿等のデータベー
スを7桁郵便番号に変換する処理を、人手を介さずに自
動的に行うことができる。
【0074】尚、上記文字認識装置および住所修正装置
においては、ROM(リード・オンリ・メモリ)(図示せず)
に住所および郵便番号修正処理動作のプログラムを格納
しておき、制御部1あるいは制御部31は上記格納され
たプログラムに基づいて住所および郵便番号修正処理を
行うようにしている。しかしながら、住所および郵便番
号修正処理動作のプログラムの一部あるいは全部をフロ
ピーディスクやハードディスク装置等の記録媒体に格納
しておき、必要に応じて上記プログラムをRAM(ラン
ダム・アクセス・メモリ)(図示せず)にインストールする
ようにしても差し支えない。
【0075】
【発明の効果】以上より明らかなように、請求項1に係
る発明の住所および郵便番号の文字列修正方法は、単に
県市区町名等が列挙された住所と郵便番号とが対になっ
て登録された住所辞書のみを用いて、入力された住所文
字列と郵便番号文字列との対の文字列を修正するので、
階層構造を有する複雑な地名辞書を必要とはしない。す
なわち、この発明で用いる上記住所辞書の構造は簡単で
あり、一般ユーザによって容易に追加・修正することが
できる。
【0076】したがって、この発明によれば、上記住所
辞書に通称の住所表記と郵便番号との対を追加登録する
ことによって、入力住所が通称の住所表記の場合でも入
力住所文字列を適切に修正できる。あるいは、上記住所
辞書に大口ユーザの住所と大口ユーザ郵便番号との対を
追加登録することによって、入力郵便番号が大口ユーザ
郵便番号である場合にも対処できる。
【0077】また、請求項2に係る発明の住所および郵
便番号の文字列修正方法は、上記入力された住所文字列
と郵便番号文字列との各文字に一致する文字数に基づく
類似度が最大値を呈する住所文字列と郵便番号文字列と
の対を上記住所辞書から検索し、この検索された住所文
字列と郵便番号文字列との対を用いて、上記入力された
住所文字列と郵便番号文字列との対を修正するので、住
所の階層構造を利用することなく上記修正を行うことが
できる。したがって、住所階層を表すキー文字の認識に
失敗した場合であっても、上記修正を適切に行うことが
できる。
【0078】また、請求項3に係る発明の住所および郵
便番号の文字列修正方法は、上記検索された住所文字列
中に上記入力された住所文字列の各文字に一致する文字
が所定割合以上含まれている場合に上記修正を行うの
で、上記検索された最も類似した住所文字列と郵便番号
文字列の対が、尚且つ、正解文字列候補として相応しい
場合にのみ、その検索された住所と郵便番号の対を用い
た修正が行われる。したがって、この発明によれば、修
正誤りを減少することができる。
【0079】また、請求項4に係る発明の住所および郵
便番号の文字列修正方法は、上記入力された住所文字列
の各文字の位置と当該文字に一致する上記検索された住
所文字列中の文字の位置とが異なる場合にはずれが在る
と判定して、ずれを考慮した修正を行うので、上記入力
住所文字列と検索住所文字列との間の住所構造のずれを
残し、あるいは、上記入力文字列中に在る切り出し誤り
を吸収して、上記入力された住所文字列と郵便番号文字
列との対を適切に修正できる。
【0080】また、請求項5に係る発明の住所および郵
便番号の文字列修正方法は、上記入力住所文字列と検索
住所文字列との間にずれが在る場合には、上記入力住所
文字列中における番地を表す文字列以外の文字列で上記
検索住所文字列の何れにも一致しない最前文字以降の文
字列を、上記検索住所文字列中の対応する文字列で置き
換えるので、上記置き換えを行っていない入力住所文字
列中に存在する階層構造のずれを残して、または、入力
住所文字列中に在る切り出し誤りを吸収して、上記入力
住所文字列を適切に修正できる。
【図面の簡単な説明】
【図1】 この発明の住所および郵便番号の文字列修正
方法が適用された文字認識装置におけるブロック図であ
る。
【図2】 図1における文字列修正部によって実行され
る住所および郵便番号修正処理動作のフローチャートで
ある。
【図3】 図1における項目キーワード辞書および項目
別単語辞書の具体的内容を示す概念図である。
【図4】 入力文書の一例としての名刺を示す図であ
る。
【図5】 図4に示す名刺から得られた文字列情報デー
タと仮項目付け処理結果との対応関係を示す図である。
【図6】 図1における後処理部による後処理の説明図
である。
【図7】 図1における項目分類部によって作成された
住所文字列と郵便番号文字列とのペアを示す図である。
【図8】 図7とは異なる住所文字列と郵便番号文字列
とのペアを示す図である。
【図9】 図7および図8とは異なる住所文字列と郵便
番号文字列とのペアを示す図である。
【図10】 番地位置の説明図である。
【図11】 住所辞書検索結果の一例を示す図である。
【図12】 入力住所文字列と検索住所文字列との比較
時における文字の対応付けの一例を示す図である。
【図13】 入力住所文字列と検索住所文字列との類似
度の計算例を示す図である。
【図14】 入力住所文字列と最大類似度検索住所文字
列とにおける一致文字数の計算例を示す図である。
【図15】 この発明の住所および郵便番号の文字列修
正方法が適用された住所修正装置のブロック図である。
【符号の説明】
1,31…制御部、2…画像入力部、
3…スキャナ、5…文字認識部、
6…文字認識結果バッファ、8…仮項目付け処理
部、 11…仮項目バッファ、12…後処理
部、 14,34…住所辞書、15
…項目分類部、 16…項目分類バッ
ファ、17,33…文字列修正部、 18,3
5…出力住所文字列バッファ、19,36…出力郵便番
号文字列バッファ、20,37…出力部、
32…修正データ入力部。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 住所と郵便番号との対における上記住所
    の文字列および上記郵便番号の文字列を修正する住所お
    よび郵便番号の文字列修正方法であって、 住所と郵便番号との対が登録された住所辞書のみを用い
    て、対となって入力された住所文字列および郵便番号文
    字列を修正することを特徴とする住所および郵便番号の
    文字列修正方法。
  2. 【請求項2】 請求項1に記載の住所および郵便番号の
    文字列修正方法において、 上記住所辞書の中から、上記入力された住所文字列と郵
    便番号文字列との各文字に一致する文字数に基づく類似
    度が最大値を呈する住所文字列と郵便番号文字列との対
    を検索し、 上記検索された住所文字列と郵便番号文字列との対を用
    いて、上記入力された住所文字列と郵便番号文字列との
    対を修正することを特徴とする住所および郵便番号の文
    字列修正方法。
  3. 【請求項3】 請求項2に記載の住所および郵便番号の
    文字列修正方法において、 上記検索された住所文字列中に、上記入力された住所文
    字列の各文字に一致する文字が所定割合以上含まれてい
    るか否かを判定し、 上記所定割合以上含まれている場合に、上記検索された
    住所文字列と郵便番号文字列との対を用いた修正を行う
    ようになっていることを特徴とする住所および郵便番号
    の文字列修正方法。
  4. 【請求項4】 請求項2に記載の住所および郵便番号の
    文字列修正方法において、 上記入力された住所文字列の各文字の位置と当該文字に
    一致する上記検索された住所文字列中の文字の位置とが
    異なる場合には、上記両住所文字列間にずれが在ると判
    定し、 上記両住所文字列間にずれが在る場合には、上記ずれを
    考慮した修正を行うことを特徴とする住所および郵便番
    号の文字列修正方法。
  5. 【請求項5】 請求項4に記載の住所および郵便番号の
    文字列修正方法において、 上記入力住所文字列と検索住所文字列との間にずれが在
    る場合には、上記入力住所文字列中における上記検索住
    所文字列の何れにも一致しない最前の文字より前の全文
    字列と、上記入力住所文字列中における上記検索住所文
    字列の何れにも一致しない最前文字以降の文字列に対応
    する上記検索住所文字列中の文字列と、上記入力住所文
    字列中における番地を表す文字列とを組み合わせて成る
    修正住所文字列を生成することによって、上記ずれを考
    慮した修正を行うようになっていることを特徴とする住
    所および郵便番号の文字列修正方法。
JP10261654A 1998-09-16 1998-09-16 住所および郵便番号の文字列修正方法 Pending JP2000090192A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10261654A JP2000090192A (ja) 1998-09-16 1998-09-16 住所および郵便番号の文字列修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10261654A JP2000090192A (ja) 1998-09-16 1998-09-16 住所および郵便番号の文字列修正方法

Publications (1)

Publication Number Publication Date
JP2000090192A true JP2000090192A (ja) 2000-03-31

Family

ID=17364920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10261654A Pending JP2000090192A (ja) 1998-09-16 1998-09-16 住所および郵便番号の文字列修正方法

Country Status (1)

Country Link
JP (1) JP2000090192A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2427322A (en) * 2005-06-17 2006-12-20 Mgt Plc Predictive text string entry via telephone keypad
JP2007102489A (ja) * 2005-10-04 2007-04-19 Sharp Corp 番組データ処理装置、番組データ処理方法、制御プログラム、記録媒体、ならびに、番組データ処理装置を備えた録画装置、再生装置、および、情報表示装置
JP2007164785A (ja) * 2005-12-12 2007-06-28 Xerox Corp 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法
JP2010134828A (ja) * 2008-12-08 2010-06-17 Toshiba Corp データベース合成装置、文字認識支援システム、及びデータベースの合成方法
JP2022012657A (ja) * 2020-07-02 2022-01-17 株式会社ダブルスタンダード 情報処理装置、情報処理方法及び情報処理プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2427322A (en) * 2005-06-17 2006-12-20 Mgt Plc Predictive text string entry via telephone keypad
JP2007102489A (ja) * 2005-10-04 2007-04-19 Sharp Corp 番組データ処理装置、番組データ処理方法、制御プログラム、記録媒体、ならびに、番組データ処理装置を備えた録画装置、再生装置、および、情報表示装置
JP4619915B2 (ja) * 2005-10-04 2011-01-26 シャープ株式会社 番組データ処理装置、番組データ処理方法、制御プログラム、記録媒体、ならびに、番組データ処理装置を備えた録画装置、再生装置、および、情報表示装置
JP2007164785A (ja) * 2005-12-12 2007-06-28 Xerox Corp 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法
JP2010134828A (ja) * 2008-12-08 2010-06-17 Toshiba Corp データベース合成装置、文字認識支援システム、及びデータベースの合成方法
JP2022012657A (ja) * 2020-07-02 2022-01-17 株式会社ダブルスタンダード 情報処理装置、情報処理方法及び情報処理プログラム

Similar Documents

Publication Publication Date Title
JP2968145B2 (ja) 高度なデータ収集方法及びデータ処理システム
JP3425408B2 (ja) 文書読取装置
US20090006394A1 (en) Systems and methods for validating an address
JP3422924B2 (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20060045340A1 (en) Character recognition apparatus and character recognition method
WO2009005492A1 (en) Systems and methods for validating an address
JP3812818B2 (ja) データベース生成装置、データベース生成方法及びデータベース生成処理プログラム
JP2000090192A (ja) 住所および郵便番号の文字列修正方法
JP4054453B2 (ja) 文字認識装置およびプログラム記録媒体
JPH10105654A (ja) 帳票用文字認識装置
JPH1011434A (ja) 情報認識装置
JP2655087B2 (ja) 文字認識後処理方式
KR20000035325A (ko) 문서 인식 장치 및 우편 구분기
JPH10198688A (ja) 定型文書読み取り装置
JPH06103402A (ja) 名刺認識装置
JP2922365B2 (ja) Ocr処理システムにおける漢字住所データ処理方法
JPH0256086A (ja) 文字認識の後処理方法
JP2001101178A (ja) データ処理装置およびそのプログラム記録媒体
JPH10105621A (ja) 帳票用文字認識装置
JP2000298701A (ja) 宛先特定装置
JPH0546815A (ja) 光学式文字読取装置における住所単語照合方法
JP2000251017A (ja) 単語辞書作成装置および単語認識装置
JPH11120294A (ja) 文字認識装置および媒体
JPH0498358A (ja) カナ住所知識処理方式
JPH05210635A (ja) 入力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040929

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070619

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070911

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080513