JP2635155B2 - ベた書き住所認識装置 - Google Patents

ベた書き住所認識装置

Info

Publication number
JP2635155B2
JP2635155B2 JP1067832A JP6783289A JP2635155B2 JP 2635155 B2 JP2635155 B2 JP 2635155B2 JP 1067832 A JP1067832 A JP 1067832A JP 6783289 A JP6783289 A JP 6783289A JP 2635155 B2 JP2635155 B2 JP 2635155B2
Authority
JP
Japan
Prior art keywords
score
character
place name
address
counter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1067832A
Other languages
English (en)
Other versions
JPH02245995A (ja
Inventor
勝之 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1067832A priority Critical patent/JP2635155B2/ja
Publication of JPH02245995A publication Critical patent/JPH02245995A/ja
Application granted granted Critical
Publication of JP2635155B2 publication Critical patent/JP2635155B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [概要] べた書き住所の認識結果を、階層分けされた住所辞書
の地名と照合して最終的な認識結果を得るべた書き住所
認識装置に関し、 文字数は異なるが共通文字を含む複数の地名が住所辞
書に存在しても、認識候補との類似度が最も高い地名を
切り出すことを目的とし、 住所辞書と認識候補との照合により、辞書地名を構成
する各文字に一致する候補文字の順位に応じた得点の総
和を得点カウンタで計算し、また辞書地名の文字数を文
字数カウンタで計数し、更に辞書地名の認識候補内に存
在する文字数を有効文字数カウンタで計数し、これら3
つのカウンタの値に基づいて最終得点を算出し、複数の
地名の最終得点の中から最も高い得点をもつ地名を切出
すように構成する。
[産業上の利用分野] 本発明は、べた書きされた住所の認識結果を住所辞書
と照合して最終的な認識結果を得るべた書き住所認識装
置に関する。
近年、オンライン手書文字認識技術の向上と共に、文
字認識技術を利用した住所入力システムなどが開発され
ている。このような住所入力システムは、不特定多数の
記入者を対象としているため、認識性能の低下を避ける
ことができない。
そのため、誤認識したべた書き住所を正しい住所に修
正する効率的な後処理方式の開発が望まれている。
[従来の技術] 本願発明者等は、住所入力システム等で認識されたべ
た書きされた住所を効率的に修正する後処理方式とし
て、べた書きされた住所を上位階層の地名から順に各階
層ごとの地名に切り分け、この切り分け処理のために候
補順位に応じた得点を付与して照合処理する方式を提案
している(特願昭63−261418号(特開平2−109187
号))。
この方式を第4図を参照して説明すると次のようにな
る。
第4図において、26は「神奈川県川崎市」と県名と市
名がべた書きされた住所の入力文字列であり、10は入力
文字列26の認識結果として得られたの認識候補である。
この認識候補10に対し住所辞書12の一部を構成する都
道府県辞書12−1を用いて都道府県名を切り出す。ここ
で認識候補10内における候補順位に応じた得点付与は、
1位が5点、2位が4点、3位が3点、4位が2点、5
位が1点、それ以外が0点とする。
まず、住所辞書12の中の都道府県名辞書12−1から
「北海道」を読出すが、[北」、「海」、「道」とも認
識候補10中に存在せず、従って「北海道」の得点は0点
となる。更に処理が進んで都道府県名辞書12−1から
「神奈川県」を読出すと、認識候補10に存在する各文字
につき、「神」は1位、「奈」は2位、「川」は2位、
「県」は1位となり、[神奈川県」の得点は18点とな
る。
以下同様に、すべての都道府県名について得点を計算
すると、「神奈川」の得点が最も高くなり、べた書きさ
れた住所の認識候補から、まず「神奈川県」が切り出さ
れる。
次に、残った認識候補10に対して、神奈川県下の郡名
辞書12−2を適用すると、同様にして「川崎市」を切り
出すことができる。
このように、べた書きされた住所を上位階層から順に
各階層ごとの地名に切り分け、階層毎に認識候補と住所
辞書とを照合して得点を算出するこてによって、べた書
きされた住所の認識候補の中から正しい住所に修正され
た認識結果を得る後処理を行うことができる。
[発明が解決しようとする問題点] しかしながら、このような従来方式にあっては、候補
順位に応じた得点を辞書内の地名に付与して順位付けを
行い、最高得点となる地名を認識候補の中から切りだし
ていたため、ある地名が別の地名を包含する関係が成立
する複数の地名が辞書中に存在した場合、他の地名に包
含される地名の辞書照合においいて同一得点となってし
まい、2つ地名に順位づけすることができず、特定の地
名を切出すことができない問題があった。
例えば、「小杉」と「小杉町」という2つの地名が位
同じ辞書中に存在している場合に、「小杉」と記入した
場合である。
この問題を「神奈川県川崎市中原区小杉123」とべた
書きされた場合の認識結果の後処理を示す第5図を参照
して説明する。
第5図において、26は入力文字列であり、上に書かれ
た数字は文字位置を示す。10は入力文字列26の認識候補
であり、横の数字は候補順位を示す。32−1,32−2,32−
3は第4図の従来の方式を用いて既に切り出しが済んだ
地名である。更に、24−1、24−2は新たに切り出しを
行うのに使用する住所辞書の「小杉」と「小杉町」の地
名である。
このように「神奈川」、「川崎市」、「中原区」の地
名32−1〜32−3は、従来方式で切り出すことができ
る。しかし、「中原区」の下には「小杉」と「小杉町」
という2つの地名が存在する。ここで「小杉町」は「小
杉」を包含する関係にある。
この2つの地名24−1,24−2に対し従来方式を適用す
ると、「小杉」の類似度は4+5=9点、「小杉町」の
類似度は4+5+0=9点となり、同一得点であるため
2つの地名に順位付けすることができきず、入力した文
字「小杉」を切出すことができない。
本発明は、このような従来の問題点に鑑みてなされた
もので、文字数は異なるが共通する文字をもつ複数の地
名が住所辞書に存在しても、認識候補との照合で正しい
地名を切り出すことができるべた書き住所の認識装置を
目的とする。
[課題点を解決するための手段] 第1図は本発明の原理説明図である。
まず本発明は、第1図(a)に示すように、地名を階
層分けして格納した住所辞書12とべた書きされた住所の
認識候補10とを階層毎の地名に分割しながら照合回路14
で照合して認識結果を修正するべた書き住所の認識装置
を対象とする。
このような認識装置、即ち、認識結果を修正する後処
理装置として本発明にあっては、住所辞書12から読出さ
れた階層の任意の地名24−iにつき、該地名24−iを構
成する各文字に一致する認識候補10内の候補文字を検索
して該候補文字の順位に応じた得点の総和Aを計算する
得点カウンタ16と;住所辞書12から読出した地名24−i
の文字数Bをカウントする文字数カウンタ18と;住所辞
書12から読出された地名24−iの各文字の内の認識候補
10内に存在する文字数Cをカウントする有効文字数カウ
ンタ20と;得点カウンタ16、文字数カウンタ18及び有効
文字数カウンタ20の値A,B,Cに基づいて地名24−iの最
終得点Dを計算する得点計算回路22と;を備え、同一階
層に属し且つ一方の地名24−1が他方の地名24−2の一
部に含まれる少なくとも2つの地名24−1,24−2が住所
辞書12に格納され、認識候補12内に入力文字列から認識
された地名24−1が存在した際に、前記得点計算回路22
により地名24−1,24−2毎に異なる最終得点Dを算出す
ることを特徴とする。
また前記得点計算回路22は、得点カウンタ16の値A
に、有効文字数カウンタ18の値Cを文字数カウンタの値
Bで除した値を掛け合わせて最終得点Dを算出する。即
ち、D=A×C/Bを算出する。
[作用] このような構成を備えた本発明のべた書き住所認識装
置にあっては、例えば住所辞書に「小杉」と「小杉町」
の2つが格納され、入力文字列から「小杉」が認識され
て認識候補となっている際に、住所辞書の「小杉」と認
識候補との照合処理に得られる最終得点は、住所辞書の
「小杉町」と認識候補との照合処理により得られる最終
得点とは異なった値を必ずもつこととなり、異なった類
似度を示す得点が得られることで例えば最終得点の高い
辞書地名を認識結果とすることができる。
[実施例] 第2図は本発明の一実施例を示した実施例構成図であ
る。
第2図において、10は記入されたべたがき住所の文字
列を文字認識することで得られた認識候補であり、また
12は地名が階層分けして格納された住所辞書である。こ
の実施例において住所辞書12は上位から都道府県名辞
書、次に市町村名辞書、町名辞書等の複数段階に階層分
けされた状態で格納されている。
14は照合回路であり、住所辞書12から読み出した地名
の各文字について対応する認識候補10との照合を行な
い、照合結果として辞書文字に一致する認識候補10の認
識文字の認識順位に従って予め設定された得点を出力す
る。
照合回路14に対しては得点カウンタ16、文字カウンタ
18及び有効文字数カウンタ20が設けられている。
得点カウンタ16は、辞書12からの地名の各文字に一致
する認識候補10内の認識文字につけられた得点出力を計
数して1つの地名構成文字分の得点総和Aを出力する。
文字数カウンタ18は、照合回路14に対し住所辞書12よ
り読み出された地名の文字数Bをカウントして出力す
る。更に有効文字数カウンタ20は、住所辞書12から読み
出された地名を構成する各文字のうち、認識候補10内に
存在する有効文字数Cを計数して出力する。
得点カウンタ16、文字カウンタ18及び有効文字数カウ
ンタ20の計数値A,B,Cは得点計算回路22に与えられ、得
点計算回路22において辞書12から読出されて処理対象と
なっている地名についての最終得点Dを計算する。この
得点計算回路22による最終得点Dの計算は、 として算出される。
得点計算回路22の算出結果は候補レジスタ34に与えら
れ、候補レジスタ34には住所辞書12から読み出した地名
と得点計算回路22で計算した最終得点の対応関係をもっ
て記録される。候補レジスタ34に続いては結果出力回路
36が設けられ、結果出力回路36は住所辞書12内の全ての
地名について照合回路14で照合が終了した時に、候補レ
ジスタ34に保持されている得点を読み取り、最も得点の
高い地名を照合結果38として出力する。
次に第3図の処理説明図を参照して第2図の実施例の
動作を説明する。
第3図において、26はべたがき住所の入力文字列であ
り、第5図と同様の「神奈川県川崎市中原区小杉123」
の入力文字列を例にとっているが、入力文字番号7以降
を取り出して示している。
この様な入力文字列26に対し文字認識により認識候補
10が得られ、認識候補10についても文字列26に対応して
7番目以降の文字列についても認識結果を示している。
この認識候補10において上下方向に5段階に分かれた順
位をもつ認識候補が得られ、上から下へいく程順位が低
くなり、最上位となる1位から最下位の5位について左
に示す得点1〜5を設定している。
いま地名32−3に示す様に「中原区」までの切り出し
が終了し、次に照合回路14に対し辞書12より24−1で示
す地名「小杉」が入力されたとすると、照合回路14はま
ず得点カウンタ16、文字数カウンタ18及び有効文字数カ
ウンタの値を0にリセットする。
この状態で照合回路14は住所辞書12からの1文字目の
入力「小」について認識候補10との照合を行ない、認識
候補10内における「小」の順位が2位であることから、
0にリセットされた得点カウンタ16の値に得点4点が加
算され、得点カウンタ16の値AはA=4点となる。同時
に文字数カウンタ18の値BがメンクリメントされてB=
1となる。更に文字「小」は認識候補10内に存在したこ
とから有効文字数カウンタ20の値Cもメンクリメントさ
れてC=1となる。
次に2文字目の「杉」の照合に移行する。照合回路14
は住所辞書12から入力した2文字目の「杉」に対し認識
候補10との照合を行ない、認識候補10内の「杉」は順位
が1位であるので得点カウンタ16の値Aに得点5点が加
算される。この時、得点カウンタ16の値AはすでにA=
4となっていることから、得点カウンタ16の値は更に5
点加算することでA=4+5=9点となる。また文字数
カウンタの値BがメンクリメントされてB=1+1=2
となる。更に文字「杉」は認識候補10内に存在して得点
カウンタ16に対し得点があったことから、有効文字数カ
ウンタ20の値CもメンクリメントされてC=1+1=2
となる。
この様に照合回路3に入力された地名「小杉」の全て
の文字について照合が終了すると、得点計算回路22によ
る得点計算が行なわれる。即ち、得点計算回路7は得点
カウンタ16、文字数カウンタ18及び有効文字数カウンタ
20から得点A=9点、文字数B=2文字、有効文字数C
=2文字を読み出し、前記第(1)式に基づいて最終得
点Dを計算し、この場合、最終得点Dは、 D=9×2/2=9点 となる。得点計算回路22で最終得点Dが計算されると候
補レジスタ34に文字「小杉」に対応して最終得点D=9
点が登録される。
この様に地名「小杉」と認識候補10との照合が終了す
ると次に住所辞書12内の地名「小杉町」と認識候補10と
の照合が行なわれる。
照合回路14に住所辞書12内の地名「小杉町」が入力さ
れると、まず照合回路14は得点カウンタ16、文字数カウ
ンタ18及び有効文字数カウンタ20の値を0にリセットす
る。
続いて照合回路14は、一文字目の入力文字「小」につ
いて認識候補10との照合を行ない、認識候補10内におけ
る「小」の順位が2位であることから得点カウンタ16の
値Aに得点4点を加算してA=4点とする。同時に文字
数カウンタ16の値BがメンクリメントされてB=1とな
る。更に入力文字「小」は認識候補10内に存在して得点
があったので、有効文字数カウンタ20の値Cもインクリ
メントされてC=1となる。
次に照合回路14は2文字目の「杉」の照合を行なう。
即ち、照合回路14は2文字目の文字「杉」に対し認識候
補10内を検索し、認識候補10内における文字「杉」の順
位が1位であることから得点カウンタ16の値Aに得点5
点を加算し、得点カウンタ16の値AはA=4+5=9点
となる。また文字数カウンタ18の値Bがインクリメント
されてB=2となる。更に2文字目の「杉」は認識候補
10内に存在して得点があったので、有効文字数カウンタ
20の値CもインクリメントされてC=2となる。
続いて照合回路14は3文字目の「町」の照合を行な
う。3文字目の「町」は認識候補10内に存在しない。従
って、3文字目の「町」の得点は0点となり、得点カウ
ンタ16の値AはA=9点のままである。しかし、文字数
カウンタBの値はインクリメントされてB=3となる。
また3文字目の「町」は文字候補10内に存在せず、得点
がないことから有効文字数カウンタ20の値CはC=2の
まま保持される。
この様にして照合回路14に入力された地名「小杉町」
の全ての文字についての照合が終了すると、得点計算回
路22に制御に移る。得点計算回路22は得点カウンタ16、
文字数カウンタ18及び有効文字数カウンタ20から得点A
=9点、文字数B=3文字、有効文字数C=2文字を読
み出し、前記第(1)式に従って最終得点Dを計算す
る。この場合「小杉町」の最終得点は、 D=9×2/3=6点 となる。得点計算回路22で計算された最終得点D=6点
は地名「小杉町」と共に候補レジスタ34に登録される。
以上で認識候補10と住所辞書12内の地名「小杉町」との
照合が終了する。
続いて、結果出力回路36の制御に移り、候補レジスタ
34に格納された「小杉」の最終得点9点、「小杉町」の
最終得点6点を読み出し、この場合「小杉」の方が得点
が高いことから最も得点が高い地名「小杉」を照合結果
38として出力する。
尚、上記の実施例は住所辞書12に地名「小杉」と「小
杉町」が格納され、文字数が少ない「小杉」の文字列の
認識結果が得られた時の処理を例にとるものであった
が、本発明はこれに限定されず、同一階層に位置し、文
字数が異なると共に共通文字をもつ複数の地名が住所辞
書に存在し、この様な複数の地名の中で文字数が少ない
ものが入力文字列から認識されて認識候補となった場合
につき、全く同様に適用して複数の地区名に類似度を示
す順位づけを行って最終的な認識結果を決めることがで
きる。
[発明の効果] 以上説明してきたように本発明によれば、地名を階層
分けして格納した住所辞書から読み出された地名と認識
候補との単語照合の際に候補順位に応じた得点を付与す
るだけでなく、辞書から読み出した地名の文字数と認識
候補内に存在する文字数を考慮して地名に対する得点計
算を行なうため、ある地名が別の地名を包含する関係が
成り立っている複数の地名につき、最終的な認識結果を
得るために区別可能な得点順位をつけることができる。
【図面の簡単な説明】
第1図は本発明の原理説明図; 第2図は本発明の実施例構成図; 第3図は本発明の処理説明図; 第4図は従来方式の説明図; 第5図は従来方式の問題点説明図である。 図中、 10:認識候補 12:住所辞書 14:照合回路 16:得点カウンタ 18:文字数カウンタ 20:有効文字数カウンタ 22:得点計算回路 34:候補レジスタ 36:結果出力回路 38:照合結果

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】地名を階層分けして格納した住所辞書(1
    2)とべた書きされた住所の認識候補(10)とを階層毎
    の地名に分割しながら照合して認識結果を修正するべた
    書き住所認識装置に於いて、 前記住所辞書(12)から読出された階層の地名(24−
    i)につき、該地名(24−i)を構成する各文字に一致
    する前記認識候補(10)内の候補文字を検索して該候補
    文字の順位を示す得点の総和(A)を計算する得点カウ
    ンタ(16)と; 前記住所辞書(12)から読み出した地名(24−i)の文
    字数(B)をカウントする文字数カウンタ(18)と; 前記住所辞書(12)から読み出された地名(24−i)の
    各文字の内の前記認識候補(10)内に存在する文字数
    (C)をカウントする有効文字数カウンタ(20)と; 前記得点カウンタ(16)、文字数カウンタ(18)及び有
    効文字数カウンタ(20)の値(A,B,C)に基づいて前記
    地名(24−i)の最終得点(D)を計算する得点計算回
    路(22)と; を備え、前記住所辞書(12)に同一階層に属し且つ一方
    の地名(24−1)が他方の地名(24−2)の一部に含ま
    れる少なくとも2つの地名(24−1,24−2)が格納さ
    れ、前記認識候補(10)に入力文字列から認識された地
    名(24−1)が存在する際に、前記得点計算回路(22)
    で地名(24−1,24−2)毎に異なる最終得点(D)を算
    出することを特徴とするべた書き住所認識装置。
  2. 【請求項2】前記得点計算回路(22)は、前記得点カウ
    ンタ(16)の値(A)に、前記有効文字数カウンタ(2
    0)の値(C)を前記文字数カウンタ(18)の値(B)
    で除した値を掛け合わせて最終得点(D)を算出する事
    を特徴とする請求項1記載のべた書き住所認識装置。
JP1067832A 1989-03-20 1989-03-20 ベた書き住所認識装置 Expired - Lifetime JP2635155B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1067832A JP2635155B2 (ja) 1989-03-20 1989-03-20 ベた書き住所認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1067832A JP2635155B2 (ja) 1989-03-20 1989-03-20 ベた書き住所認識装置

Publications (2)

Publication Number Publication Date
JPH02245995A JPH02245995A (ja) 1990-10-01
JP2635155B2 true JP2635155B2 (ja) 1997-07-30

Family

ID=13356314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1067832A Expired - Lifetime JP2635155B2 (ja) 1989-03-20 1989-03-20 ベた書き住所認識装置

Country Status (1)

Country Link
JP (1) JP2635155B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2790064B2 (ja) * 1994-12-14 1998-08-27 日本電気株式会社 記号列読み取り装置
CN101276327B (zh) * 2007-03-27 2010-06-23 富士通株式会社 地址识别装置
CN113806237B (zh) * 2021-11-18 2022-03-08 杭州费尔斯通科技有限公司 一种基于词典的语言理解模型的测评方法和系统

Also Published As

Publication number Publication date
JPH02245995A (ja) 1990-10-01

Similar Documents

Publication Publication Date Title
JP3077765B2 (ja) 語彙辞書の検索範囲を削減するシステム及び方法
US20090144277A1 (en) Electronic table of contents entry classification and labeling scheme
CN101620677A (zh) 一种基于三角剖分与lod技术的指纹识别方法
JPH0684006A (ja) オンライン手書き文字認識方法
JP2001052116A (ja) パターン列マッチング装置とパターン列マッチング方法と文字列マッチング装置と文字列マッチング方法
CN104598887B (zh) 用于非规范格式手写中文地址的识别方法
JP2635155B2 (ja) ベた書き住所認識装置
JP2847715B2 (ja) 文字認識装置及び文字認識方法
JP2619499B2 (ja) べた書き住所の文字認識後処理方式
CN112836080A (zh) 一种通过音频查找曲谱的方法及系统
JP2998054B2 (ja) 文字認識方法及び文字認識装置
JP2655087B2 (ja) 文字認識後処理方式
JPH0357509B2 (ja)
JP2845463B2 (ja) パターン認識装置
JP2922365B2 (ja) Ocr処理システムにおける漢字住所データ処理方法
Ganzberger et al. Matching database records to handwritten text
JPH11143984A (ja) 文字読取装置
JPH07271920A (ja) 文字認識装置
JPH0438026B2 (ja)
JPS61161588A (ja) 文字認識後処理方式
JPS5953986A (ja) 文字認識装置
JPH06180767A (ja) 文字認識装置
JPH0795337B2 (ja) 単語認識方式
JP3468199B2 (ja) 英単語認識装置
JP2622004B2 (ja) 文字認識装置