JPH04270449A - 住所入力装置 - Google Patents

住所入力装置

Info

Publication number
JPH04270449A
JPH04270449A JP3013424A JP1342491A JPH04270449A JP H04270449 A JPH04270449 A JP H04270449A JP 3013424 A JP3013424 A JP 3013424A JP 1342491 A JP1342491 A JP 1342491A JP H04270449 A JPH04270449 A JP H04270449A
Authority
JP
Japan
Prior art keywords
address
reading
candidate
dictionary
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3013424A
Other languages
English (en)
Inventor
Yoshiji Oyama
芳史 大山
Kenji Imamura
賢治 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3013424A priority Critical patent/JPH04270449A/ja
Publication of JPH04270449A publication Critical patent/JPH04270449A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、誤りを含む住所の読み
に対して、住所辞書を検索することにより正しい住所の
読み及び漢字を自動的に得ることができる住所入力装置
に関する。
【0002】
【従来の技術】ワープロ等のシステムにおいて、組み込
まれた住所辞書によりカナ漢字変換で住所入力を提供す
るものがある。これは正しい住所の読みが入力されれば
その住所の表記を生成することはできるが、住所の読み
が一部誤っている場合には変換できないため、読みを確
認して再入力をする必要があった。
【0003】
【発明が解決しようとする課題】上記のワープロ等のシ
ステムにおいて、住所等が記載された文書等を見ながら
住所入力を行なう場合であるとそれ程の誤りは生じにく
い。しかし、電話等の音声で住所を聞く場合、聞く人が
その住所に精通していない場合、何回か問い合わせるこ
とになる。さらに「かながわけん  さかいでし」と全
く別の住所の組み合せに誤った場合、実在しない「神奈
川県坂出市」が出されても入力誤りとなる。また、実在
しないために「神奈川県?」と出されてもあとの修正が
必要になるという問題があった。
【0004】本発明はこのような問題に対し、誤りを含
んだ読みに対しても、住所辞書を検索できるようにする
ことにより、正しいと思われる候補を抽出し、実在する
住所の中で入力に類似した住所を提示して、誤りを訂正
することが容易な住所入力装置を提供することを目的と
する。
【0005】
【課題を解決するための手段】本発明は、住所読みを入
力する住所読み入力部と、住所の読み、住所の表記、正
式の読み及び住所の上下関係を示す住所コードを収録し
た住所辞書と、住所の区画を示す接辞の読み及び表記を
収録する区画接辞テーブルと、前記住所読み入力部で入
力された読みと前記区画接辞テーブルの読みを組み合わ
せて、前記住所辞書を検索し、表記と住所コード、読み
、及び正式の読みを取得する辞書検索部と、住所の上下
関係をチェックし関係を満足する組み合せを抽出する住
所チェック部と、入力の読みの誤りを仮定して、取得さ
れた住所コードから推定される上下の住所候補を前記住
所辞書から検索し読みを比較し住所候補を生成する住所
候補生成部と、該住所候補生成部から出力される住所候
補列を並び替え結果を出力する住所候補結果出力部とか
らなることを特徴とする。
【0006】
【作用】本発明によれば、住所の読みを県郡町字等の区
画で区切ってこの装置に入力する。(この区切って入力
された語を以下では「区画の読み」と呼ぶ。)。次に、
この区画の読みに対して、区画接辞テーブルの読みを後
方からみて一致する部分を除いた読み及び元々の区画の
読みで住所辞書を検索し、区切り毎に住所候補を抽出す
る。
【0007】得られた住所候補に含まれる住所コードを
基に区切り毎の住所が実在するかを検証し入力された読
み全部に対して住所が実在する場合それを住所候補列と
する。住所候補が抽出されないものがあったり、実在し
ない組み合せのため住所候補列が確定しない場合、住所
コードが得られた部分を基に上下の住所候補を住所辞書
より検索し、入力された読みと比較する。
【0008】双方の読みを比較してあらかじめ決められ
た距離の範囲内である場合に正しい住所と仮定して、実
在するかの検証を繰り返し、住所候補列を抽出し、これ
を結果として出力する。
【0009】つまり、読みに一部誤りがあっても前後の
住所をもとに住所辞書を検索することで住所候補を抽出
できる。従って、電話による住所の伝達のように読み誤
り、聞き取り誤り、さらにキーボードからの入力時のキ
ータッチ誤りが発生する場合においてもメニュー形式等
で逐次確認をするのではなく一括して入力することで候
補の選択を容易にすることができる。
【0010】また、住所辞書については、上下関係を示
す住所コード(例えばJIS6260都道府県コード、
JISC6261市区町村コード体系)及び住所の読み
を検索キーとし、これらのキー情報及び住所の表記をデ
ータとして収録しておくことで、全国の住所を入力する
ことが可能となる。
【0011】
【実施例】図1は、本発明の一実施例の装置構成を示す
ブロック図であり、図中、1は住所の区画ごとにスペー
スで区切られて入力された文字列を入力する住所読み入
力部、2は区画毎の読み及び住所の上下関係を表す住所
コードをキーとしキーと共に住所の表記をデータとする
住所辞書、3は区画毎の読みを収録した区画接辞テーブ
ル、4は区画毎の読み及び区画接辞テーブルの情報から
住所辞書を参照し区画毎の住所候補を生成する辞書検索
部、5は住所コードの組み合せから上下関係が成立する
組み合せを抽出する住所チェック部、6は入力の読みの
誤りを仮定して、取得された住所コードから推定される
上下の住所候補を該住所辞書から検索し読みを比較し住
所候補を生成する住所候補生成部、7は該住所候補生成
部から出力される結果情報を基に重複があればまとめ、
順番を決定し相違部分の情報とともに結果を出力する住
所候補結果出力部である。
【0012】図2は図1の住所辞書2の構成例であり、
図に示すように読み21,住所コード22,表記23及
び正式読み24からなる。このうち読み及び住所コード
はキーフィールドになっている。住所コードに対応して
表記には区画名も付与した形で収録している。また住所
コードはその住所区画の上位の住所コード及び下位の住
所コードが分かる形で収録されている。
【0013】例えば、「読み:あいち」「表記:愛知郡
」住所コード「23300」は、上位2桁の住所コード
すなわち「23」が、「愛知県」であり、23300で
「愛知郡」を表しており、この5桁が同じで8桁になる
と、例えば23300302はその下位の町名「東郷町
」を示す。
【0014】図3は図1の区画接辞テーブル3の構成例
であり、図に示すように区画の読み21、表記23を夫
々収録している。
【0015】以下、図4〜図8に用いて「かながわけん
  さかいでし」「あいちけん  せきなんし」が入力
された場合の処理の流れを具体的に説明する。
【0016】まず、入力として「かながわけん  さか
いでし」が入力されたとする。住所読み入力部1で区画
読みは「かながわけん」と「さかいでし」に分割される
。 次に辞書検索部4で、区画接辞テーブル3を参照し、図
4に示す住所コード候補例(その1)から図中の4−1
の区画番号1の読み1を「かながわけん」とし、「けん
」とのマッチングがとれ、接辞を削除した「かながわ」
が図4の4−2の区画番号1の読み2とされる。次に「
さかいでし」についても読み1が「さかいでし」、読み
2が「さかいで」となる。
【0017】次にこれら読み1、読み2の内容から住所
辞書2を検索する。「かながわけん」から住所辞書と一
致するものがなく、「かながわ」と一致するものは2件
あり、これは、図2の表記23に示す神奈川県と神奈川
区であり、住所コード22がそれぞれ図4の候補4−3
,候補4−4にそれぞれ収録される。
【0018】一方「さかいでし」とは一致するものがな
く「さかいで」と一致する坂出市が区画番号2の候補4
−3に収録される。次に住所チェック部5で、区画番号
1,2を構成する住所コード間で上下関係をチェックす
る。すなわち、図4に示すように区画番号1の住所コー
ド「14」「14100102」の下位はレベル2には
存在しない。逆に、区画番号2の住所コード「3720
3」の上位は「37」であるが、これは区画番号1に存
在しないため、住所チェックは失敗に終わる。
【0019】そこで住所候補生成部6において、まず区
画番号1を正しいと仮定して、図2に示す「14」の下
位である「14100」(横浜市)または「14201
」(横須賀市)の住所コードを取得し、これの読み「よ
こはま」または「よこすか」と、「さかいで」の読みの
距離を算出する。距離Lの定義として、完全に一致すれ
ばL=0、n文字の挿入、k文字の欠落、j文字の前後
入れ替わり(n>0,k>0,j>1)を除いて一致す
るとき、L=n+k+j/2とする。
【0020】例えばL≦1を、候補検出の条件とすれば
、この場合該当無しとなる。
【0021】次に区画番号2を正しいと仮定する。区画
番号2の住所コード「37203」の上位である「37
」(香川県)の読みは「かがわ」であり、これと図4の
区画番号2の読み1,読み2を比較すれば、読み2の場
合でL=1となる。従ってこの場合、「香川県(かがわ
けん)坂出市(さかいでし)」が住所候補となる。また
、この「香川県(かがわけん)」部分が入力と違うとこ
ろなので、この情報も含めて、図5に例示する形式で住
所候補の結果が出力される。
【0022】次の入力例「あいちけん  せきなんし」
について説明する。
【0023】住所読み入力部1では、図6の住所コード
候補例(その2)に示すように、区画読みは「あいちけ
ん」「せきなんし」に分割される。次に辞書検索部4で
、区画接辞テーブル3を参照し、図6のように「あいち
けん」を図6の区画番号1で6−1の読み1とし、「け
ん」とのマッチングがとられた「あいち」が同様に読み
2とされる。次に「せきなんし」についても読み1が「
せきなんし」、読み2が「せきなん」となる。
【0024】次にこれら読み1、読み2の内容から住所
辞書2を検索する。「あいちけん」から住所辞書2と一
致するものがなく、「あいち」と一致するものは2件あ
り、これは、愛知県と愛知郡であり、住所コードがそれ
ぞれ図6の候補6−3,候補6−4にそれぞれ収録され
る。一方「せきなんし」とは一致するものがなく、「せ
きなん」とは石楠町が一致し、候補6−3に収録される
【0025】次に住所チェック部5で、区画番号1,2
を構成する住所コード間で上下関係をチェックする。す
なわち、図6に示すように区画番号1の住所コード「2
3」「23300」と区画番号2の住所コード「232
11995」の間には、図7に示す住所の構造例のよう
に、住所コードから、隣接した上下関係はないことがわ
かる。
【0026】しかし、1区画「23211」(豊田市)
をスキップすれば「23」と「23211995」の間
には、上下関係があるといえる。このような場合、抜け
た区画の個数をi(この例では1)とし、距離L=iと
定義しておく。Lが0でないため、さらに住所候補生成
部6において、区画番号1,区画番号2のいずれかが正
しいと仮定して、候補を調べる。
【0027】まず区画番号1を正しいと仮定して、候補
1「23」の下位は「23300」、「23211」お
よび「23209」が、「23300」の下位は「23
300302」が抽出される。それぞれの読みが「あい
ち」「とよた」「へきなん」「とうごう」であり、これ
らと「ヘきなん」を比較すると、Lが1以下という条件
では、「愛知県  碧南市」のみが候補となる。
【0028】つぎに、区画番号2は、「2321199
5」であり、その上位は「23211」(豊田市)であ
る。この「とよたし」と「あいち」を比較すると、Lと
1位以下にならないため、区画番号1を正しいと仮定し
たほうが候補が残る。従って最終的な候補として、「愛
知県  碧南市」および「愛知県  豊田市  石楠町
」が選ばれ、住所候補結果出力部7においては、住所コ
ード、表記、読み、Lの値などを基に、例えば(1)L
の小さい順、(2)最下位の住所コードの短い順とすれ
ば、図8に例示する形式で結果が出力される。
【0029】尚、辞書検索部4では、“「高付加価値型
番号案内システム(CPUID)の電話帳検索方式」「
入力カナ情報の問題点と対策」NTT R&D 199
0 Vol.39No.6”に述べられている表記の揺
らぎの吸収(例えば、「かながわけん」は「かなかわけ
ん」として、「かがわけん」は「かかわけん」として扱
う)させた上でマッチングを行うこともでき、この場合
入力列に対してこの処理を行い、住所辞書の読み部分は
、あらかじめこの揺らぎを吸収させておくことも可能で
ある。
【0030】
【発明の効果】以上説明したように本発明の住所入力装
置は、従来に比べて、正確でしかも修正や確認が少なく
て済む住所入力機能が実現できる。特に、電話などを通
じて誤って聞こえた場合の誤りの指摘や訂正、入力する
人と伝える人の勘違いからくる入力ミスの削減が可能と
なる。
【0031】区画が抜ける現象は、音声で聞き取る場合
、話し手は繰り返して言ったつもりではなくても聞き手
は繰り返しと思い一部を省略してしまう場合があるため
有効である。例えば「○○し  きょうごくちょう  
きょうごく」と聞いた場合、「きょうごく」と言うべき
所を「きょうごくちょう」と誤ったための言い直しと勘
違いすると「○○し  きょうごく」という入力になる
ため、「○○市京極町」と「○○市京極町京極」と並べ
て提示して確認させることができ、問題を解決すること
ができる。
【0032】さらに、都/道/府/県/市/区/町/村
/支庁などの行政区画の名前を相互に誤って入力する場
合に対処するため、これらを除いたものとそのままの形
式でマッチングさせることを可能としている。したがっ
て「さかいし」の場合「堺市」と「坂石」の双方でマッ
チングさせることが可能であり、本発明により柔軟な候
補の提示が可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例の装置構成を示すブロック図
である。
【図2】図1の住所辞書の構成例を示す図である。
【図3】図1の区画接辞テーブルの構成例を示す図であ
る。
【図4】住所コードの候補例(その1)を示す図である
【図5】住所候補の出力結果例を示す図である。
【図6】住所コードの候補例(その2)を示す図である
【図7】図6の住所の構造例を示す図である。
【図8】住所の出力結果例を示す図である。
【符号の説明】
1…住所読み入力部、  2…住所辞書、  3…区画
接辞テーブル、  4…辞書検索部、  5…住所チェ
ック部、  6…住所候補生成部、  7…住所候補結
果出力部、  21…読み、  22…住所コード、 
 23…表記、  24…正式読み。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  住所読みを入力する住所読み入力部と
    、住所の読み、住所の表記、正式の読み及び住所の上下
    関係を示す住所コードを収録した住所辞書と、住所の区
    画を示す接辞の読み及び表記を収録する区画接辞テーブ
    ルと、前記住所読み入力部で入力された読みと前記区画
    接辞テーブルの読みを組み合わせて、前記住所辞書を検
    索し、表記と住所コード、読み、及び正式の読みを取得
    する辞書検索部と、住所の上下関係をチェックし関係を
    満足する組み合せを抽出する住所チェック部と、入力の
    読みの誤りを仮定して、取得された住所コードから推定
    される上下の住所候補を前記住所辞書から検索し読みを
    比較し住所候補を生成する住所候補生成部と、該住所候
    補生成部から出力される住所候補列を並び替え結果を出
    力する住所候補結果出力部とからなることを特徴とする
    住所入力装置。
JP3013424A 1991-02-04 1991-02-04 住所入力装置 Pending JPH04270449A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3013424A JPH04270449A (ja) 1991-02-04 1991-02-04 住所入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3013424A JPH04270449A (ja) 1991-02-04 1991-02-04 住所入力装置

Publications (1)

Publication Number Publication Date
JPH04270449A true JPH04270449A (ja) 1992-09-25

Family

ID=11832756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3013424A Pending JPH04270449A (ja) 1991-02-04 1991-02-04 住所入力装置

Country Status (1)

Country Link
JP (1) JPH04270449A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08171614A (ja) * 1994-12-20 1996-07-02 Nec Corp 文字列読み取り装置
JP2010049574A (ja) * 2008-08-22 2010-03-04 Fujitsu Ltd データ処理装置、データ処理プログラムおよびデータ処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60237569A (ja) * 1984-05-09 1985-11-26 Nec Corp 住所漢字変換方式
JPS6175954A (ja) * 1984-09-21 1986-04-18 Sharp Corp 漢字デ−タ入力方式
JPS62226369A (ja) * 1986-03-28 1987-10-05 Seiko Epson Corp かな漢字変換装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60237569A (ja) * 1984-05-09 1985-11-26 Nec Corp 住所漢字変換方式
JPS6175954A (ja) * 1984-09-21 1986-04-18 Sharp Corp 漢字デ−タ入力方式
JPS62226369A (ja) * 1986-03-28 1987-10-05 Seiko Epson Corp かな漢字変換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08171614A (ja) * 1994-12-20 1996-07-02 Nec Corp 文字列読み取り装置
JP2010049574A (ja) * 2008-08-22 2010-03-04 Fujitsu Ltd データ処理装置、データ処理プログラムおよびデータ処理方法

Similar Documents

Publication Publication Date Title
CN109635125B (zh) 一种词汇图谱搭建方法及电子设备
JPH04270449A (ja) 住所入力装置
JP3221477B2 (ja) データベース照合型入力方法及び装置、データベース照合型日本語入力装置、並びに、電話番号案内サービスシステム
JP2000250931A (ja) 位置情報の自動抽出装置および自動抽出方法と記録媒体
JPS61184683A (ja) 認識結果選択方式
Angkawattanawit et al. Thai Q-Cor: integrating word approximation and soundex for Thai query correction
JP3470927B2 (ja) 自然語解析方法及び装置
JP4382634B2 (ja) 住所解析装置、住所解析方法及び住所解析プログラム
JP4203984B2 (ja) 音声入力装置及び音声入力受付方法
EP1978453B1 (en) Data search method and apparatus for same
JPS58123126A (ja) 辞書検索装置
JP3387421B2 (ja) 単語入力支援装置及び単語入力支援方法
JPH0962700A (ja) 辞書構築方法及び装置
JP2000276467A (ja) 変換装置
JPH09325789A (ja) 音声合成装置及び音声合成装置を備えた情報検索システム
JPS6125268A (ja) 住所入力装置
KR20210047192A (ko) 음소 기반 텍스트 검색 장치 및 방법
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH07121538A (ja) スペルチェック装置
JPH06332934A (ja) 電子辞書引き装置
JPH1078953A (ja) 住所表記変換方法および住所表記チェック方法
JPH0656609B2 (ja) 中文入力装置
JP2944524B2 (ja) かな漢字変換方法
JPH04369763A (ja) かな漢字変換装置及び方法
JPH0576675B2 (ja)