JP2000276467A

JP2000276467A - 変換装置

Info

Publication number: JP2000276467A
Application number: JP11085387A
Authority: JP
Inventors: Hiroyuki Kumai; 裕之隈井; Shogo Hamamichi; 勝吾浜道; Katsuya Kono; 勝也河野; Junichi Matsuda; 純一松田
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1999-03-29
Filing date: 1999-03-29
Publication date: 2000-10-06

Abstract

(57)【要約】【課題】本発明の目的は、多用な形式でローマ字を用
いて記述された日本の住所をカナに変換するとともに日
本形式の並びに並び替えて出力する装置を提供すること
にある。【解決手段】入力手段１０２から入力されたローマ字
表記された日本の住所の中から、地名階層判定手段１０
６を用いて都道府県、市区郡町村等の地名階層を判定
し、地名情報を階層的に格納する地名データベース１０
８を備える地名検定手段１０７は、ローマ字カナ変換手
段１０４を用いて変換したカナ地名が実在するか否か、
及び他の地名との地名階層上の整合性を検定し、検定に
成功した場合は、地名データベース１０８に格納された
正とするカナ地名表記を取得し、最終的に日本形式の正
しい順序でカナに変換された住所を出力手段１１０に出
力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータ等の
情報処理装置に係わり、特にローマ字で表記された住所
及び名称のカナ文字への変換装置に関する。

【０００２】

【従来の技術】近年、国際間の商取引が増大等に伴い、
日本の住所や企業名、人名がローマ字で表記される機会
が増加している。従来、ローマ字で表記された日本の住
所や企業名、人名はその件数も少なく、また、取り扱う
部署も限定されていたため、住所や名称のローマ字表記
になれた専門オペレータが、手作業で日本語の住所表記
に変換していることが多かった。しかし、情報処理装置
の普及に伴い、一般ユーザにおいてもこれらローマ字表
記に接する機会が増えている。このような状況の中で、
日本人の一般ユーザにとってローマ字表記の住所、名
称、カナや漢字で表記された住所、名称に比べて極めて
判読性の悪いものとなっている。

【０００３】第１に欧米形式の住所表記と日本形式の住
所表記では、記述の方向が異なる場合が多々ある。例え
ば住所においては、日本形式では、都道府県、市区郡町
村、大字、字、地番と大きな単位から記述するのに対
し、欧米形式では、地番、字、大字、市区郡町村、都道
府県と、小さな単位から記述する。加えて、日本の住所
をローマ字化するとき、公的に決まった記述形式がな
く、字の位置が大字の右にくることもあれば、左にくる
こともある。また、ローマ字で表記しているにもかかわ
らず、日本形式のに従って大きな単位から記述している
例、「ＳＨＩ、ＫＥＮ」等の行政単位（地名接辞）を省
略して記述している例も見られる。

【０００４】第２に、カナをローマ字記述する場合に
は、ローマ字表記の多義性の問題がある。例えば、「オ
オイ」には「ＯＯＩ」、「ＯＩ」のように長音を省略す
る書き方も許され、また、「フジ」に対して「ＨＵＺ
Ｉ」、「ＦＵＪＩ」、「ＨＵＪＩ」、「ＦＵＺＩ」等複
数のローマ字記述が許されるあり得る。

【０００５】名称においては、日本人姓名をローマ字で
表すとき、姓、名の順に記述するか、名、姓の順に記述
するかは一般規則がなく、企業名についても、「航空」
を「ＫＯＵＫＵＵ」ではなく、「ＡＩＲＬＩＮＥＳ」と
するように、本来日本語である業種名を英語で表現した
り、業種名が先頭にきて記述の順序が逆転するなど、単
純にローマ字をカナに変換しただけでは日本形式の記述
にならないことが多い。

【０００６】地名における長音などのローマ字表記の多
義性を解消する従来技術として特開平９−２５９１４２
がある。また、外国語による住所データと和文による住
所データを１対１でデータベースに格納し電話番号やビ
ル名等の特定キーを用いた検索で、外国語による住所デ
ータを和文による住所データに変換する方式が、特開平
５−１０１０９３に述べられている。

【０００７】

【発明が解決しようとする課題】上記特開平９−２５９
１４２で述べられている装置は、ローマ字表記の多義性
を解消することはできるが、欧米形式で記述されたロー
マ字表記の住所や名称を日本形式に並び替えることはで
きない。また、特開平５−１０１０９３で述べられてい
る方式では、既に登録されているパターンの外国語によ
る住所のみが変換可能であり、新たにパターンの住所を
変換することはできなかった。

【０００８】上記問題点に鑑み、本発明の第１の目的
は、多様な形式でローマ字を用いて記述された日本の住
所をカナあるいは漢字に変換するとともに日本形式の並
びに並び替えて出力する、汎用的で高精度なローマ字で
表記された住所のカナ文字への変換装置を提供すること
にある。

【０００９】本発明の第２の目的は、ローマ字を用いて
欧米の並びで記述された個人や企業の名称に対して、個
人名、企業名の判別を行い、判別結果に従い日本形式の
並びに並び替えてカナあるいは漢字に変換して出力する
ローマ字で表記された名称のカナ文字への変換装置を提
供することにある。

【００１０】

【課題を解決するための手段】上記課題を解決するため
に、本発明のローマ字で表記された住所のカナ文字への
変換装置では、地名階層判定手段と、県市町村名等の地
名情報を階層的に格納する地名データベースと地名検定
手段を備え、入力されたローマ字住所文字列の中から地
名階層判定手段を用いて地名階層を表す特徴文字列を検
知し、都道府県、市区郡町村等の地名階層を判定し、次
に地名検定手段を用いて当該地名が実在するか否か、ま
た、他の単語の地名との地名階層上の整合性を検定し、
ローマ字表記された日本の住所をカナに変換し日本形式
の正しい順序で出力する。

【００１１】本発明のローマ字で表記された名称のカナ
文字への変換装置では、名称種別判定手段と、日本人の
姓、名の頻度情報を格納する姓名データベースと姓名変
換手段を備え、名称種別判定手段を用いて入力されたロ
ーマ字名称が個人名であるか否かを判定し、判定結果が
日本人名であった場合には、次に姓名変換手段を用いて
単語のいずれが姓であるかを決定し、ローマ字表記され
た日本人名をカナに変換し、姓、名の順序で出力する。

【００１２】

【発明の実施の形態】以下、図を用いて本発明のローマ
字表記住所のカナ文字への変換装置の一実施形態のにつ
いて説明する。

【００１３】第１の発明であるローマ字で表記された住
所のカナ文字への変換装置について説明する。

【００１４】図２に本発明のローマ字表記住所のカナ文
字への変換装置の変換例を示す。

【００１５】ローマ字表記住所は、図２の（ａ）（ｂ）
（ｃ）に示すように、多用な形式で記述される。本発明
の装置は、これら多用な形式で記述された住所に対し
て、地名の階層判定を行い、次に各地名をローマ字カナ
変換した後、当該地名が実在するかどうかを階層の整合
性も含めて検定し、（ｄ）に示すごとく最終的に正しい
日本のカナ地名を出力するものである。

【００１６】ここで、日本の住所の構成要素について説
明する。日本の住所は、以下の階層に整理することがで
きる。

【００１７】（１）都道府県、（２）市区郡町村、
（３）大字、（４）字、（５）地番、（６）号室等。

【００１８】ここで、（２）市区郡町村の階層は、市
名、政令指定都市では市名と区名、郡町村では、郡名と
町、及び村名で一つの階層を構成し、東京特別区（２３
区）は（２）で市が存在しない場合として扱う。

【００１９】本実施形態においては、字までの住所のカ
ナ変換を対象とする。地番は数字のみで構成されカナに
変換する意味はない。また号室等については、アパート
やマンション名を含むがこれらはローマ字からカナへの
変換のみ行い、地名データーベースでの検定は行わない
ものとする。

【００２０】図１は、本発明のローマ字で表記された住
所のカナ文字への変換装置の一実施形態のブロック構成
図である。

【００２１】図１において、各手段は、ハードウェアま
たは汎用プロセッサとソフトウェアによって実施可能で
ある。

【００２２】図１において、１０２は住所を表すローマ
字文字列を入力する入力手段であり、キーボード等の入
力装置、すでに作成されたローマ字文字列を格納したフ
ァイルを読み出すファイル装置等により実現可能であ
る。ローマ字コードを入力できる装置であれば、どのよ
うな装置でも利用可能である。

【００２３】１１０は、変換結果の住所を表すカナ／漢
字文字列を出力する出力手段であり、ディスプレイやプ
リンタ等の出力装置、あるいは変換結果を書き出すファ
イル装置等により実現可能である。カナ／漢字文字列を
出力できる装置であれば、どのような装置でも利用可能
である。

【００２４】１０１は、ＣＰＵ等の制御装置であり、各
手段が処理したデーターを加工しながら、他の手段に渡
して行く。

【００２５】１０３は、入力手段１０２から入力された
ローマ字文字列を一時的に格納するローマ字バッファで
あり、入力文字列と当該入力文字列の一部が処理された
ときに、当該一部の文字列に対してどのような処理が行
われたかを記録する属性エリアからなる。詳細は後述す
る。

【００２６】１０４はローマ字文字列をカナ文字列に変
換するローマ字カナ変換手段であり、ワードプロセッサ
等ののローマ字漢字変換入力などで使用されている既知
の方法でローマ字変換を行う。

【００２７】１０５はローマ字カナ変換手段１０４の変
換結果のカナ文字列を格納するカナバッファである。

【００２８】１０６はローマ字バッファの文字列から、
地名の階層を表す「ＳＨＩ」や「ＫＥＮ」などの特定表
記を検索し、文字列の一部がどの地名階層に属するかを
判定する地名階層判定手段である。

【００２９】１０７は階層化された地名データベース１
０８を使用し、カナバッファ１０５に格納された地名
が、実在するか否か、更に変換済みの地名との階層上の
整合性を検定する地名検定手段である。

【００３０】１０８は日本の住所の一部である地名に対
しその上位の地名の情報を階層情報として保持する地名
データベースである。

【００３１】１０９は上記各手段によって変換された住
所文字列を保持する変換結果バッファである。

【００３２】次にローマ字バッファ１０３およびカナバ
ッファ１０５について、図３を用いて詳しく説明する。

【００３３】図３（ａ）に、ローマ字住所文字列が格納
されたローマ字バッファ１０３およびカナバッファ１０
５の初期状態の様子を示す。

【００３４】３０１は、入力手段１０２を用いて入力さ
れたローマ字文字列を保持するローマ字文字列格納エリ
アである。３０２は、当該ローマ字文字列が住所のどの
階層に対応するかを保持する属性格納エリアである。属
性格納エリアは、何も対応していないことを示す、未定
義状態の「Ｕ」、地名の階層を示す都道府県「Ｐ」、市
「Ｃ」、区「Ｋ」、郡「Ｇ」、町「Ｔ」、村「Ｖ」、大
字「Ｏ」、字「Ａ」等の値を設定する。更に当該文字列
が、「ＳＨＩ」、「ＫＵ」等の地名接辞であった場合に
は、例えば「ＳＣ」、「ＳＫ」のように対応する記号が
値として設定される。ローマ字文字列格納エリア、およ
び属性格納エリアは変換処理の進行にしたがって分割あ
るいは統合される。例えば、処理の最初の段階でスペー
スなどの単語の区切りにより分割し、（ｂ）に示す状態
になる。ローマ字バッファ１０３は、ローマ字格納エリ
ア３０１及び属性格納エリア３０２とで構成される。３
０３はカナバッファであり、ローマ字格納エリアの一部
の文字列のカナへの変換結果が格納される。

【００３５】図５に地名データベース１０８の例を示
す。地名データベースは、実在する日本の住所の地名を
地名階層の単位で保持したデータベースである。コード
は当該地名の番号を示す。

【００３６】地名見出しは、当該地名を検索するときの
検索キーである。正地名表記は、当該地名の正しい表記
である。地名見出しは、正地名表記をローマ字で表した
場合の多義性を吸収する文字列に変換されている。例え
ば正地名表記が「オオイ」である場合、そのローマ字表
記が「ＯＩ」、「ＯＯＩ」、「ＯＨＩ」など複数有り得
ることを考慮し、地名検定手段で「オイ」も「オオイ」
も「オイ」に変換して検索するようになっている。従っ
て地名見出しには「オイ」と登録する。この変換を正規
化と呼ぶ。正規化には、長音以外に、濁音の清音化、ス
ペースの削除などがある。図５では、「ヨコハマシカ
ナザワク」の濁音「ザ」を清音「サ」に正規化してい
る。単位は、当該地名の地名階層上の区分である。日本
の地名の場合、地名階層は、都道府県、市区郡町村、大
字、字の４階層で構成すると都合がよい。上位コード
は、当該地名の上位地名のコードをあらわしている。例
えば、コード「０３３」の大字である「トミオカニシ」
は、上位コードが「１４−１０８」である。したがっ
て、「トミオカニシ」の上位地名は、都道府県はコード
が「１４」の地名（図５の例では「カナガワケン」とな
る）であり、市区郡町村は上位コードに「１４」をもち
コードが「１０８」の地名（図の例では「ヨコハマシ
カナザワク」となる）である。本地名データベースに
は、更に付加情報として郵便番号などを格納してもよ
い。

【００３７】図６に変換結果バッファ１０９の例を示
す。

【００３８】変換結果バッファ１０９は各地名階層ごと
に地名検定手段で検定された結果を格納するテーブルで
ある。各地名階層ごとに正地名表記を格納する変換結果
エリアと、コード、および上位コードを格納することが
できる。地名検定の結果、複数の地名が地名データベー
スから得られた場合には、得られた複数の地名を格納で
きるようになっている。

【００３９】次に図７から図１０を用いて、地名変換の
制御の流れについて説明する。

【００４０】本実施形態においては、地名データベース
１０８に格納されている字までの住所を正しく変換する
住所変換について説明する。

【００４１】尚、以下の説明では、「９９−１７ＴＯ
ＭＩＯＫＡＮＩＳＨＩ４ＣＨＯＭＥＫＡＮＡＺＡ
ＷＡ−ＫＵＹＯＫＯＨＡＭＡＣＩＴＹ」というロー
マ字表記の住所が入力された場合を例として説明する。

【００４２】第１の実施形態として、地名接辞を利用し
た住所変換について説明する。地名接辞とは、「都、
県、市、区、郡、町、村」等の住所に付加される行政単
位のことである。ローマ字で住所が記述される場合に
は、「ＴＯ、ＫＥＮ、ＳＨＩ、ＫＵ、ＧＵＮ、ＭＡＣＨ
Ｉ、ＭＵＲＡ」等となる。例えば、「ＹＯＫＯＨＡＭＡ
−ＳＨＩＫＡＮＡＧＡＷＡ−ＫＥＮ」というように地
名に付加されるケースが多い。第１の実施形態は、この
地名接辞に着目することで、地名階層判定手段におい
て、少ない処理で効率的に地名階層を判定し、住所を特
定するものである。尚、地名接辞は、「市」を表す「Ｓ
ＨＩ、ＣＩＴＹ」等のように同じ行政単位を表す複数の
表現が存在する。

【００４３】まず、図７を用いてローマ字表記住所のカ
ナ文字への変換の全体の流れについて説明する。

【００４４】まず、Ｓ７０１において、市区郡町村の地
名検索を行う。市区郡町村が特定できた場合には、次に
Ｓ７０２に進み都道府県の地名を検索する。一般に日本
の住所は、少なくとも市区郡町村、大字、字までが記述
されていれば、特定可能である。これは、市区郡町村と
大字の組み合わせにより、住所はほとんど一意に特定で
きる。また、都道府県は記述を省略されることも多い。
従って、市区郡町村が検索できれば、都道府県が検索で
きなくてもエラーとはしない。都道府県が検索できた場
合には、Ｓ７０４において市区郡町村の記述位置と都道
府県の記述位置関係から、住所の記述方向を決定する。
住所の記述方向は、その後の大字や字の検索方向の優先
順を決定する。都道府県が検索できなかった場合には、
Ｓ７０５において記述方向は既定の方向、本実施形態で
は左から右により小さな地名単位から大きな地名単位に
記述されていると仮定し、その後の大字や字の検索方向
の優先順を決定する。

【００４５】次にＳ７０６において大字、字地名を検索
する。最後にＳ７０７において、検索結果から地名デー
タベース１０８を用いて正しいカナ地名を生成し出力手
段１１０に出力する。

【００４６】次に図８を用いて市区郡町村検索Ｓ７０１
について、詳しく説明する。市区郡町村の検索は、「Ｓ
ＨＩ」「ＫＵ」「ＧＵＮ」「ＭＡＣＨＩ」「ＭＵＲＡ」
等の市区郡町村の特徴を表す地名接辞を検索することに
より行う。これらの地名接辞が見つかる場合には、その
左側の１単語を市区郡町村とする。更に地名データベー
スを用いることで、当該市区郡町村の存在を確認する。
市区郡町村が見つからない場合は、市区郡町村が見つか
らないという結果を出力する。市区郡町村が見つからな
い場合には、地名接辞が存在しない場合には、後述する
入力文字列の各単語を順次カナに変換し地名データーベ
ースを検索して市区郡町村を特定する、第２の実施形態
によって住所の特定を試みることができる。

【００４７】まず、Ｓ８０１において、市の地名接辞
（ＳＨＩ、ＣＩＴＹ等）を検索する。地名接辞が見つか
った場合には、Ｓ８０２において当該地名接辞の左側の
１単語を取得し市名とする。また、市名が政令指定都市
であるか否かをチェックする。これは、あらかじめ用意
された政令指定都市名を格納したテーブルと比較するこ
とで行う。地名接辞が見つからなかった場合にはＳ８０
３に進み、後述する郡町村特別区地名検索処理を行う。
次にＳ８０２において政令指定都市である場合には区が
存在する。したがって、Ｓ８０４において区の地名接辞
（ＫＵ等）を検索し、存在すればＳ８０５において、当
該地名接辞の左側の１単語を取得し区名とする。このと
き区の地名接辞が見つからない場合でも、エラーとしな
い。これは、例えば仙台市に対する川内市のように、政
令指定都市と同じローマ字表記となる一般市が存在する
場合があるためである。尚、処理効率は落ちるが、Ｓ８
０３で市名が政令指定都市であるか否かをチェックする
処理を省略して、常に区を検索する、すなわちＳ８０５
を行うようにしても良い。

【００４８】例では、「ＣＩＴＹ」が見つかるため、
「ＹＯＫＯＨＡＭＡ」が市名として取得され、政令指定
都市名であるため「ＫＵ」を検索し、「ＫＡＮＡＺＡＷ
Ａ」が区名として取得される。

【００４９】次に、Ｓ８０７において市名、区名をカナ
に変換し、地名接辞に対応するカナ（「シ」や「ク」）
を付加する。

【００５０】例では「ヨコハマシカナザワク」に変換
される。この時のローマ字バッファ、及びカナバッファ
の状態を図３の（Ｃ）および（Ｄ）に示す。

【００５１】次にＳ８０８において変換したカナを用い
て、地名検定手段を用いて当該市区郡町村が実在するか
どうかを検定する。地名検定手段では、変換結果のカナ
を前述した正規化処理を行って検索キーを作成し、地名
データベースを検索する。例では、「ヨコハマシカナ
ザワク」から、正規化を経て検索キー「ヨコハマシカナ
サワク」を作成し、図５に示す地名データベースを検索
し、地名コード１０８のデータにマッチングし、実在す
る市区として特定する。

【００５２】検定の結果、当該市区郡町村が実在する場
合には、Ｓ７０２の都道府県地名検索に進む。当該市区
郡町村が実在しない場合には、Ｓ７０３のエラー処理に
進む。

【００５３】図９を用いて、Ｓ８０３の郡町村特別区地
名検索処理について簡単に説明する。

【００５４】Ｓ９０１において郡の地名接辞（ＧＵＮ
等）を検索する。地名接辞が見つかった場合には、Ｓ９
０２において当該地名接辞の左側の１単語を取得し郡名
とする。次に、Ｓ９０３において町、または村の地名接
辞（ＣＨＯ、ＭＡＣＨＩ、ＭＵＲＡ、ＭＵＲＡ等）を検
索する。地名接辞が見つかった場合には、Ｓ９０４にお
いて当該地名接辞の左側の１単語を取得し町、または村
名とする。

【００５５】Ｓ９０１において、郡の地名接辞が見つか
らなかった場合には、東京都特別区を検索する。Ｓ９０
５に進み地名接辞（ＫＵ等）を検索する。地名接辞が見
つかった場合には、Ｓ９０６において当該地名接辞の左
側の１単語を取得し特別区名とする。

【００５６】Ｓ９０３およびＳ９０５において、地名接
辞が見つからなかった場合には、市区郡町村が検索でき
なかったものとして、エラー処理７０３に進む。

【００５７】尚、以上の市区郡町村地名検索処理の中
で、政令指定都市と郡町、郡村が検索された場合に、Ｓ
７０５で説明した住所の記述方向を決定しても良い。

【００５８】市区郡町村が確定できた場合は、図７のＳ
７０２に進み都道府県の地名検索を行う。具体的には、
上述した市区郡町村と同様に、都、道、府、県の地名接
辞（ＴＯ、ＤＯ、ＦＵ、ＫＥＮ、ＰＲＥＦ等）を検索す
る。地名接辞が見つかった場合には、当該地名接辞の左
側の１単語を取得し都道府県名とし、カナ文字列に変換
した後、地名検定手段１０７を用いて実在するか否かを
検定する。前述したように都道府県名は省略して記述さ
れることが多く、存在していなくてもエラーとしない。

【００５９】例の場合、都道府県を表す地名接辞は検索
されないため、検索を行わない。

【００６０】次に、大字、字の地名検索処理Ｓ７０６を
図９を用いて詳しく説明する。

【００６１】大字は、主に町名であり、日本の住所には
必ず存在する。大字は「町」等がつくケースが多いもの
の、多様な日本語から構成されており、大字を特徴づけ
る文字列はないと考えてよい。また、字は存在する場合
と、存在しない場合がある。字は多くの都市では、丁目
であることが多い。従って、「ＣＨＯＭＥ」という表記
を用いて字を検索することには合理性がある。本実施形
態では、これらの特徴に基づき、大字と字を検定する。

【００６２】まず、Ｓ１００１において、丁目（字）を
示す地名接辞（ＣＨＯＭＥ等）を検索する。地名接辞が
見つかった場合には、Ｓ１００２において当該地名接辞
の左側の数字の１単語を取得し丁目（字）とする。ま
た、字を設定済みとする。次に大字を検索するが、大字
は、例の「ＴＯＭＩＯＫＡＮＩＳＨＩ」のように複数
の単語で構成される場合も有れば、１単語が大字、残り
の単語が字やアパート名である場合もある。そこで、大
字の検索では既に上位地名が検定されていることを利用
して、まずＳ１００３において、都道府県や市区郡町村
に割り当てられていない単語群を取り出し、次にＳ１０
０４において当該市区郡町村に属する大字に一致するま
で、割り当てられていない単語群の組み合わせから、
数、前後の並びの異なる大字候補を順次作成し地名検定
手段を用いて検定する。例では、「ＴＯＭＩＯＫＡＮ
ＩＳＨＩ」、「ＮＩＳＨＩＴＯＭＩＯＫＡ」、「ＮＩ
ＳＨＩ」、「ＴＯＭＩＯＫＡ」が大字の候補として考え
られる。尚、数字のみで構成される単語は、大字ではな
いとして除外する。例では、「ＴＯＭＩＯＫＡＮＩＳＨ
Ｉ」を変換した「トミオカニシ」が図５に示す地名デー
タベースにおいて上位地名の「ヨコハマシカナザワ
ク」に属する地名として検定される。

【００６３】残りの文字列は、字である可能性もある
し、アパート名などの可能性もある。そこでＳ１００１
において、丁目が検索されていなければ、Ｓ１００６に
進み、Ｓ１００４と同様に、字の検定を行う。例の場合
は、Ｓ１００１において「ＣＨＯＭＥ」が存在している
ため、Ｓ１００６には進まず、Ｓ１００５へと進み既に
取得された丁目を用いて、字の検定を行う。図５に示す
地名データベースには、「トミオカニシ」に属する字と
して、「４」が存在するため、字として検定する。

【００６４】この時のローマ字バッファ、及びカナバッ
ファの状態を図４の（ｅ）および（ｆ）に示す。

【００６５】字より下位の文字列に関しては、大字に最
も近い数字のみからなる文字列を地番として扱い、その
他のアパート名やビル名等の文字列を、地番以下として
設定する。これらの文字列は、ローマ字バッファの属性
格納エリアを参照することで取得でき、文字列が数字記
号列のみから構成されるか否かによって、地番であるか
否かを決定できる。尚、図２（ｃ）に示すごとく、「４
−９９−１５」のように字が地番と同じ文字列に含まれ
る場合は、上述のＳ１００６において、字候補の文字列
として、先頭の数字を切り出すことで、地名検定でき
る。

【００６６】以上のようにして、各地名階層において検
定された地名は、変換結果バッファに格納される。例の
場合の変換結果バッファは、図６（ｂ）の状態となる。
最後にＳ７０７において変換結果バッファを参照し、正
しいカナ住所「ヨコハマシカナザワクトミオカニシ４
９９−１５」が得らる。ここで、入力されたローマ字
住所文字列に都道府県が記述されていない場合、市区郡
町村の上位地名コードを含み、かつ単位が、都、道、府
または県であるものを検索することで、都道府県の文字
列を取得することができる。

【００６７】以上のようにして、ローマ字住所を地名検
定手段を用いて正しい住所に変換することができ、図２
の（ｄ）に示すカナ住所を出力手段に出力することがで
きる。

【００６８】尚、地名データベースの正地名表記欄にカ
ナではなく漢字を記述しておけば、ローマ字表記の住所
を漢字に変換して出力することも可能である。

【００６９】次に、Ｓ７０３のエラー処理について説明
する。エラー処理では、単にエラーメッセージを出力す
る以外に、以下のような地名の再変換処理を行ってもよ
い。すなわち、図２（ｃ）に示すように、入力されたロ
ーマ字住所に地名接辞を含まない場合、上述の実施形態
では、市区郡町村が検索できず、Ｓ７０３に進み、以下
に述べる第２の実施形態の方法を用いて、カナ住所に変
換することができる。

【００７０】住所のカナ変換の第２の実施形態は、処理
量が増大する欠点があるが、より多様な入力文字列に対
応できる。この目的のため、あらかじめ地名データベー
スに、地名接辞を含まない地名見出しを登録する。図３
地名データベースには、「ヨコハマカナサワク」、「ヨ
コハマシカナサワ」、「ヨコハマカナサワ」が登録して
ある。

【００７１】第２の実施形態では、大字の地名検定で説
明したのと同様、すべての単語について組み合わせを変
えながら、成功するまで検定を繰り返す。例えば、ロー
マ字文字列が図４（ｇ）に示すように、ローマ字バッフ
ァに格納される。この例では、最初に「ＹＯＫＯＨＡＭ
ＡＫＡＮＡＺＡＷＡＮＩＳＨＩＴＯＭＩＯＫＡ」
を作成しカナに変換し、「ヨコハマカナサワトミオカニ
シ」を地名検定する。しかし、この検定は失敗する。順
次、「ヨコハマカナサワトミオカ」、「ヨコハマカナサ
ワ」と地名検定を繰り返すと、「ヨコハマカナサワ」が
市区として一致する。次に残りの文字列で「ニシトミオ
カ」、「トミオカニシ」、「ニシ」というように順次地
名検定が行われる。この例では、「トミオカニシ」の検
定の段階で既に検定された「ヨコハマカナサワ」に属す
る大字に一致する。以上のように、入力ローマ字文字列
の各単語をバックトラック手法を用いて、少なくとも市
区郡町村と大字の階層関係に矛盾が起こらない組み合わ
せの検索を再帰的に繰り返す。都道府県から字までの間
で、最も多くの階層と検定できた場合を、最終的な正し
い住所として出力する。

【００７２】尚、上述した第２の実施形態のみにより、
本発明を実施することができるが、組み合わせの数が爆
発的に増え、処理時間が増大するため、上述したよう
に、第１の実施形態のエラー処理において実行するほう
が現実的である。

【００７３】Ｓ７０３のエラー処理では、補正テーブル
を用いて、地名のローマ字の一部を変更して再度、検定
を行うことが考えられる。例えば、「金沢区」は、正し
くは「ＫＡＮＡＺＡＷＡＫＵ」であるが、「金」を「Ｋ
ＡＮＥ」と読み、「ＫＡＮＥＺＡＷＡＫＵ」というロー
マ字を入力するユーザが存在する可能性がある。そこ
で、本発明の住所変換装置の第３の実施形態では、Ｓ７
０３において、ローマ字の一部を変更する情報を格納す
るローマ字綴り変更テーブルを用意し、入力されたロー
マ字の一部を変更し、再度地名検定を行う。

【００７４】ローマ字綴り変更テーブルの例を図１１に
示す。変換元のローマ字文字列と変換先のローマ字文字
列とで構成する。ローマ字の置き換えは、１回に１個所
づつ行い、すべての修正テーブルの修正を試しても地名
検定に失敗する場合には、更に複数の置き換えを組合せ
て修正し地名検定を行う。例えば、図１１の例では、入
力ローマ字文字列が「ＫＡＮＥＺＡＷＡＫＵ」の場合に
は、「ＫＡＮＡＳＡＷＡＫＵ」、「ＫＡＮＥＴＡＫＵＫ
Ｕ」「ＫＡＮＡＴＡＫＵＫＵ」と順次変更しながら地名
検定を繰り返す。

【００７５】以上のように、本発明の本発明のローマ字
で表記された住所のカナ文字への変換装置を用いること
により、多用な表現でローマ字を用いて入力された住所
を実在する日本の住所に変換できる。

【００７６】尚、本実施形態では、住所を日本の住所と
して説明してきたが、本発明の住所変換装置は本来の住
所記述の順序が英語形式とは異なる中国や韓国など住所
にあっても適用可能である。中国や韓国の住所の記述の
順序は日本と同様に大きな単位から記述する。この場
合、地名データベース１０８の地名見出しは、ローマ字
で記述されることになる。

【００７７】また、上述の実施形態では、地名データベ
ース１０８の地名見出しをカナで保持したが、日本の住
所でも地名見出しをローマ字で保持しても良い。ただ
し、歴史的経緯から日本のカナに対するローマ字の表現
は、例えば「フジ」に対して「ＨＵＺＩ」、「ＦＵＺ
Ｉ」、「ＨＵＪＩ」、「ＦＵＪＩ」等、多種類の表現が
可能となるため、地名データーベースの容量や正規化処
理が増加するなどの不利な点が多い。

【００７８】次に、第２の発明であるローマ字で表記さ
れた名称のカナ文字への変換装置について説明する。

【００７９】以下の実施形態ではローマ字表記された名
称を、日本人名、日本に滞在している外国人名、日本に
ある企業名と想定する。日本人名がローマ字表記される
場合、姓、名の記述順序には必ずしも規則性が無い。
姓、名の順に書かれる場合も有れば、名、姓の順に書か
れる場合もある。ただし、英語式に、「Ｍｒ」「Ｍｒ
ｓ」等の人名接辞が先頭に付与される場合には、姓、名
の順序はファーストネーム（名）、ファミリーネーム
（姓）の順で記述される。

【００８０】日本にある企業のローマ字表記名称は、単
に企業名の読み方をローマ字でつづったものだけでな
く、業種名を英単語に変換している場合もある。例え
ば、「スズキ貿易式会社」に対して、「ＳＵＺＵＫＩ
ＢＯＵＥＫＩＫＫ」と記述する場合もあれば、「ＳＵ
ＺＵＫＩＴＲＡＤＩＮＧＣＯ，ＬＴＤ」と記述する
場合もある。日本に滞在している外国人名については、
外国人名であることが判定できれば、それ以上カナに変
換する利点はないが、日本人名と企業名に関しては、ロ
ーマ字表記名称をカナ名称に変換することで、日本人に
とって認識しやすくなるという利点がある。

【００８１】図１５に本実施形態におけるローマ字名称
のカナ名称への変換結果の例を示す。尚、カナ名称の先
頭に、後述する名称種別判別手段の判定結果を日本人姓
名を「（Ｊ）」、外国人姓名を「（Ｆ）」、企業名を
「（Ｃ）」、判定不可能な場合を「（Ｕ）」として、付
加して、判別結果が分かるように出力するようにしてい
る。

【００８２】図１２は、本発明のローマ字で表記された
名称のカナ文字への変換装置の一実施形態のブロック構
成図である。

【００８３】図１２において、各手段は、ハードウェア
または汎用プロセッサとソフトウェアによって実施可能
である。

【００８４】図１２において、１２０２は名称を表すロ
ーマ字文字列を入力する入力手段であり、キーボード等
の入力装置、すでに作成されたローマ字文字列を格納し
たファイルを読み出すファイル装置等により実現可能で
ある。ローマ字コードを入力できる装置であれば、どの
ような装置でも利用可能である。

【００８５】１２１０は、変換結果の住所を表すカナ／
漢字文字列を出力する出力手段であり、ディスプレイや
プリンタ等の出力装置、あるいは変換結果を書き出すフ
ァイル装置等により実現可能である。カナ／漢字文字列
を出力できる装置であれば、どのような装置でも利用可
能である。

【００８６】１２０１は、ＣＰＵ等の制御装置であり、
各手段が処理したデーターを加工しながら、他の手段に
渡して行く。

【００８７】１２０３は、入力手段１２０２から入力さ
れたローマ字文字列を一時的に格納するローマ字バッフ
ァであり、入力文字列と当該入力文字列の一部が処理さ
れたときに、当該一部の文字列に対してどのような名称
の判定が行われたかを記録する属性エリアからなる。

【００８８】１２０４はローマ字文字列をカナ文字列に
変換するローマ字カナ変換手段であり、ワードプロセッ
サ等ののローマ字漢字変換入力などで使用されている既
知の方法でローマ字変換を行う。

【００８９】１２０６はローマ字バッファの文字列か
ら、人名に先立つ「Ｍｒ」や「Ｍｒｓ」等の接辞や、企
業名を表す「Ｃｏ」「Ｌｔｄ」等の識別子を検索した
り、単語の個数、およびカナに変換可能か否かによっ
て、名称の種別を判定する名称種別判定手段である。

【００９０】１２０７は日本人の姓、名を表すローマ字
文字列と対応するカナ文字列を保持する姓名データベー
ス１２０８を使用し、より正しい日本人姓名に変換する
姓名変換手段である。

【００９１】１２０８は日本人の姓、名を表すローマ字
文字列と対応するカナ文字列と、当該姓、または名の頻
度情報を保持する姓名データベースである。

【００９２】１２０９は企業名の業種を表すローマ字表
記と対応するカナ表記とを保持する企業業種名テーブル
である。

【００９３】１２０５は上記各手段によって変換された
名称文字列を保持する変換結果バッファである。図１８
に本実施形態おける変換結果バッファの例を示す。１８
０１は、名称種別判定手段の判定結果を格納する名称種
別エリアであり、上述した「（Ｊ）」、「（Ｆ）」、
「（Ｃ）」及び「（Ｕ）」のいずれかを格納し、制御手
段１２０１は、名称種別エリアの内容にしたがって制御
を切り替える。１８０２は姓エリア、１８０３は名エリ
アであり名称種別が「（Ｊ）」の場合に日本人姓、名の
カナ変換結果を格納する。１８０４は固有名エリア、１
８０５は業種名エリアであり、名称種別が「（Ｃ）」の
場合に企業の固有名と業種名を格納する。１８０６は非
変換エリアであり、名称種別が「（Ｆ）」及び
「（Ｕ）」の場合にローマ字文字列をそのまま格納す
る。図１８には、ローマ字名称のカナ変換の結果、企業
である「スズキボウエキ」に変換された例を示してい
る。

【００９４】図１３を用いてローマ字表記名称のカナ文
字への変換の流れについて説明する。入力手段１２０１
から入力されたローマ字文字列に対し、まず名称種別判
定手段１２０６において名称種別の判定を行う。Ｓ１３
０１では、ローマ字文字列中に企業を表す識別子が存在
するか否かを判定する。企業を表す識別子としては、
「Ｃｏ」「ＣｏＬｔｄ」「ＫＫ」「ＩＮＣ」等があ
る。これらの識別子がローマ字文字列に含まれる場合
は、当該名称が企業名であると判定して、後述するＳ１
３０３の企業名変換処理に進む。企業を表す識別子が存
在しない場合には、次にＳ１３０２に進み、ローマ字文
字列中に個人を表す識別子が存在するか否かを判定す
る。個人名を表す識別子としては、「Ｍｒ」「Ｍｒｓ」
「Ｄｒ」等がある。個人を表す識別子が存在する場合に
は、当該名称は個人名と判定する。個人名と判定された
場合には、Ｓ１３０４に進み、更に外国人名か日本人名
かの判定を行う。もし残りの単語が２単語で、どちらの
単語もカナに変換可能なローマ字である場合には、日本
人名と判定する。日本人名と判定した場合には、この処
理では「Ｍｒ」「Ｍｒｓ」「Ｄｒ」等の人名接辞の後で
あるので、名、姓の順であると判断でき、Ｓ１３０５に
おいて姓、名の順に入れ替え、更にカナに変換し出力手
段１２１０に出力する。個人を表す識別子が存在しない
場合には、Ｓ１３０７に進み日本人姓名の可能性を判定
する。すなわち、単語数が２単語でどちらの単語もカナ
に変換可能なローマ字である場合には日本人名と判定す
る。日本人名と判定した場合には、Ｓ１３０８に進み姓
名データベースを用いた、姓、名順序の決定を行う。具
体的には、図１６に示す姓名データベースを用いて以下
のように決定する。

【００９５】姓名データベースは、ローマ字で記述され
た姓、または名と、姓、名の区別と、当該姓または名の
統計的な出現確率を保持する。出現確率は、例えば姓、
名を各々１００００集めた際の統計調査の出現個数でも
良い。これにより、例えば、「ＹＯＳＨＩＮＯＫＩＭ
ＵＲＡ」という名称に対して、「ＫＩＭＵＲＡ」は姓の
出現確率３０、名の出現確率０、「ＹＯＳＨＩＮＯ」は
姓の出現確率１０、名の出現確率２であり、「ＫＩＭＵ
ＲＡ」を姓としたほうが、姓名トータルの出現確率が高
くなるため、「キムラヨシノ」と変換するのがもっと
もらしいと判断できる。「ＹＯＳＨＩＮＯＭＡＹＵＭ
Ｉ」という名称に対して、「ＭＡＹＵＭＩ」は姓の出現
確率２、名の出現確率４０、この場合は「ＹＯＳＨＩＮ
Ｏ」を姓としたほうが、姓名トータルの出現確率が高く
なるため、「ヨシノマユミ」と変換するのがもっとも
らしいと判断できる。

【００９６】姓名データーベース１２０８には、更に図
１６に示すように対応するカナ表記を保持しても良い。
こうすることで、例えば「ＫＥＮＩＣＨＩ」を「ケニ
チ」ではなく「ケンイチ」と、また「ＹＵＫＩ」が姓の
場合は「ユウキ」、名の場合は「ユキ」などと、よりも
っともらしいカナに変換することができるようになる。
尚、かな表記を保持させた場合には、Ｓ１３０５におい
ても姓名データベースを用いて、よりもっともらしいカ
ナに変換するようにしてもよい。

【００９７】以上のようにして、姓、名の順序を決定し
カナに変換して出力する。

【００９８】もし、Ｓ１３０７において日本人名でない
と判定された場合は、名称の判定はできなかったものと
して、ステップ１３０９に進み、ローマ字名称をそのま
ま出力する。

【００９９】次に、図１４を用いて、Ｓ１３０３の企業
名変換処理について説明する。

【０１００】ローマ字表記された企業名は、企業を表す
識別子と、業種名と個有名によって構成されることが多
い。例えば、「ＳＵＺＵＫＩＴＲＡＤＩＮＧＣＯ，
ＬＴＤ」の場合は、「ＣＯ，ＬＴＤ」が企業を表す識別
子、「ＴＲＡＤＩＮＧ」が業種名、「ＳＵＺＵＫＩ」が
固有名となる。固有名には「ＳＵＺＵＫＩ」「ＴＡＴＩ
ＫＡＷＡ」などの固有名詞だけでなく、「北東開発」に
おける「ＮｏｒｔｈＥａｓｔ」や「鈴木電器」における
「ＤＥＮＫＩ」など普通名詞の場合もある。また、企業
によっては、「株式会社日立製作所」を「Ｈｉｔａｃ
ｈｉ，Ｌｔｄ．」と表すように、業種名を省略する場合
も見受けられる。上述のようにに企業名のローマ字表現
には多様な表現があるが、企業を識別するために、少な
くとも固有名が必要である。

【０１０１】Ｓ１４０１では、企業を表す識別子を除い
た残りの単語数を調べる。

【０１０２】残りの単語数が０の場合には、Ｓ１４０４
に進み固有名となる名称が取得できないため、企業名称
としての解析が不可能であるとして、名称種別を不明と
設定する。

【０１０３】残りの単語数が１の場合には、Ｓ１４０３
に進みその単語を固有名とする。そして、Ｓ１４０６に
進み、当該固有名がカナに変換可能な場合にはカナに変
換し出力結果バッファに設定する。

【０１０４】残りの単語が１より大きい場合は、Ｓ１４
０２に進み、固有名と業種名を特定する。固有名と業種
名の特定は、図１６に示す企業業種名テーブル１２０９
を用いて行う。企業業種名テーブルは業種名のローマ字
表記と対応するカナ表記で構成される。カナ表記はロー
マ字表記のカナ変換結果だけでなく、「ＡＩＲＬＩＮＥ
Ｓ」に対する「コウクウ」のように、英単語に対する日
本語訳語でもよい。業種名の検索では、業種名テーブル
で一致した部分を業種名とし、残りの部分を固有名とす
る。この時、固有名として少なくとも１単語が残ってい
るかをチェックする。固有名が残らない場合には、更に
他の業種名を検索する。すべての業種名で検索しても、
業種名の部分が得られない場合には、全体を固有名とす
る。

【０１０５】以上のようにして、ローマ字文字列の固有
名、業種名が特定され、最後にＳ１４０６において、ロ
ーマ字文字列をカナに変換する。ただし、単語のローマ
字がカナのローマ字表現以外のパタンを含む場合には、
日本語でないとして、ローマ字をカナに変換しない。

【０１０６】以上の処理を行うことで、入力されたロー
マ字名称は、カナ名称に変換され変換結果バッファ１２
０５に格納される。最後に出力手段１２１０に、姓、名
の順、あるいは、固有名、業種名の順に出力する。

【０１０７】以上のようにすることで、図１５に示すよ
うにローマ字表記名称の名称を日本語形式の名称に変換
することができる。

【０１０８】以上述べたように、本発明のローマ字で表
記された名称のカナ文字への変換装置を用いることによ
り、欧米形式で入力された名称を日本語形式の名称に変
換することができる。

【０１０９】

【発明の効果】以上述べたように、本発明のローマ字で
表記された住所のカナ文字への変換装置を用いることに
より、多用な表現でローマ字を用いて入力された住所を
実在する日本の住所に変換できる。

【０１１０】また、本発明のローマ字で表記された名称
のカナ文字への変換装置を用いることにより、欧米形式
で入力された名称を日本語形式の名称に変換することが
できる。

【０１１１】したがって、ローマ字住所や名称に不慣れ
なユーザは、変換結果の日本語化された住所や名称を確
認することで、配達等の業務を効率化することができ、
また、住所録等において、住所、名称をカナまたは漢字
に統一できるという効果がある。

【図面の簡単な説明】

【図１】本発明に係るローマ字表記住所のカナ文字への
変換装置の第１の実施形態の機能ブロック構成図であ
る。

【図２】ローマ字表記住所のカナ文字への変換装置の第
１の実施形態におけるローマ字住所のカナ変換の入出力
結果を例示した図である。

【図３】ローマ字表記住所のカナ文字への変換装置の第
１の実施形態におけるローマ字バッファおよびカナバッ
フの状態を示す図である。

【図４】ローマ字表記住所のカナ文字への変換装置の第
１の実施形態におけるローマ字バッファおよびカナバッ
フの状態を示す図である。

【図５】ローマ字表記住所のカナ文字への変換装置の実
施形態における地名データベースの例を示す図である。

【図６】ローマ字表記住所のカナ文字への変換装置の第
１の実施形態における変換結果バッファの例を示す図で
ある。

【図７】ローマ字表記住所のカナ文字への変換装置の第
１の実施形態の処理内容を示すフローチャートである。

【図８】ローマ字表記住所のカナ文字への変換装置の第
１の実施形態の処理内容を示すフローチャートである。

【図９】ローマ字表記住所のカナ文字への変換装置の第
１の実施形態の処理内容を示すフローチャートである。

【図１０】ローマ字表記住所のカナ文字への変換装置の
第１の実施形態の処理内容を示すフローチャートであ
る。

【図１１】ローマ字表記住所のカナ文字への変換装置の
第３の実施形態で用いるローマ字綴り変更テーブルの例
を示した図である。

【図１２】本発明に係るローマ字表記名称のカナ文字へ
の変換装置の実施形態の機能ブロック構成図である。

【図１３】ローマ字表記名称のカナ文字への変換装置の
実施形態の処理内容を示すフローチャートである。

【図１４】ローマ字表記名称のカナ文字への変換装置の
実施形態の処理内容を示すフローチャートである。

【図１５】ローマ字表記名称のカナ文字への変換装置の
実施形態におけるローマ字名称のカナ変換の入出力結果
を例示した図である。

【図１６】ローマ字表記名称のカナ文字への変換装置の
実施形態で用いる姓名データベースの例を示した図であ
る。

【図１７】ローマ字表記名称のカナ文字への変換装置の
実施形態で用いる企業業種名テーブルの例を示した図で
ある。

【図１８】ローマ字表記名称のカナ文字への変換装置の
実施形態で用いる変換結果バッファの例を示した図であ
る。

【符号の説明】

１０１制御手段、１０２入力手段、１０３ローマ字
バッファ、１０４ローマ字カナ変換手段、１０５カナ
バッファ、１０６地名階層判定手段、１０７地名検定
手段、１０８地名データベース、１０９変換結果バッ
ファ、１１０出力手段、１２０１制御手段、１２０２
入力手段、１２０３ローマ字バッファ、１２０４ロー
マ字カナ変換手段、１２０５変換結果バッファ、１２
０６名称種別判定手段、１２０７姓名変換手段、１２
０８姓名データベース、１２０９企業業種名テーブ
ル、１２１０出力手段。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ０６Ｆ 15/20 ５９２Ａ (72)発明者河野勝也東京都国分寺市東恋ケ窪一丁目280番地株式会社日立製作所中央研究所内 (72)発明者松田純一東京都国分寺市東恋ケ窪一丁目280番地株式会社日立製作所中央研究所内Ｆターム(参考） 5B009 KC06 ME02 ME16 ME23 ME24 VB01 5B091 AB04

Claims

【特許請求の範囲】

【請求項１】欧米形式の住所の並び順でローマ字表記さ
れたローマ字住所を入力する入力手段と、該ローマ字住
所をカナ住所に変換するローマ字カナ変換手段と、該カ
ナ住所を出力する出力手段とを備え、当該ローマ字住所
をカナ住所に変換しかつ並び順を日本形式の住所の並び
順に並び替えて出力することを特徴とする、ローマ字表
記住所のカナ文字への変換装置。
【請求項２】請求項１のローマ字住所表記のカナ文字へ
の変換装置において、上記ローマ字住所文字列の中から
住所の地名階層を表す地名接辞を検索し地名階層を判定
する地名階層判定手段を備え、該地名階層判定手段の結
果に従って当該カナ住所の並び順を日本形式の住所の並
び順に並び替えて出力することを特徴とする、ローマ字
表記住所のカナ文字への変換装置。
【請求項３】請求項１のローマ字住所表記のカナ文字へ
の変換装置において、正とするカナ地名と該正とするカ
ナ地名に対応する異表記のカナ地名と住所の階層情報で
ある上位地名情報とを対応づけて格納する地名データベ
ースと、入力されたローマ字住所の一部の地名を前記ロ
ーマ字カナ変換手段を用いてカナに変換した文字列を検
索子として該地名データベースの異表記のカナ地名と比
較し正とするカナ地名と上位地名情報とを取得し既にカ
ナに変換済みの別の地名との住所の階層の整合性を検定
する地名検定手段を備え、上記ローマ字住所を正とする
カナ地名から構成されるカナ住所に変換しかつ日本形式
の住所の並び順に並び替えて出力することを特徴とす
る、ローマ字表記住所のカナ文字への変換装置。
【請求項４】請求項３のローマ字住所表記のカナ文字へ
の変換装置において、上記地名データベースは正とする
カナ地名に対する漢字地名を格納し、上記ローマ字住所
を正とする漢字から構成されるカナ住所に変換しかつ日
本形式の住所の並び順に並び替えて出力することを特徴
とする、ローマ字表記住所のカナ文字への変換装置。
【請求項５】請求項３のローマ字住所表記のカナ文字へ
の変換装置において、上記地名検定手段は、上記地名デ
ータベースから正とするカナ地名が取得できなかった場
合に、入力されたローマ字住所の一部のローマ字を変更
して再度前記検索子を作成するとともに上記地名検定手
段を用いて検定を行うことを特徴とする、ローマ字表記
住所のカナ文字への変換装置。
【請求項６】入力された欧米形式住所の並び順で表記さ
れたローマ字住所をバッファに格納するステップと、該
ローマ字住所をカナ住所に変換するステップと、当該ロ
ーマ字住所の並び順を日本形式の住所の並び順に並び替
えるステップと、該並び替えた日本形式の住所を出力手
段に出力するステップとを有するローマ字表記住所のカ
ナ文字への変換方法が記録されたコンピュータが読み取
り可能な記録媒体。
【請求項７】欧米形式で１または複数の単語でローマ字
表記された個人名や企業名等を表すローマ字名称を入力
する入力手段と、該ローマ字名称をカナ名称に変換する
ローマ字カナ変換手段と、該カナ名称を出力する出力手
段と、該ローマ字名称が企業名であるか外国人名である
か日本人名であるかを判定する名称種別判定手段とを備
え、該名称種別判定手段の判定結果に従って、ローマ字
名称をカナ名称に変換しかつカナ名称の単語の順序を並
び替えて出力することを特徴とする、ローマ字表記名称
のカナ文字への変換装置。
【請求項８】請求項７のローマ字表記名称のカナ文字へ
の変換装置において、更に日本人の姓または名のローマ
字名称と対応するカナ名称と当該姓または名の頻度情報
とを対応づけて保持する姓名データベースと、該姓名デ
ータベースを用いて当該ローマ字名称が姓または名であ
るかの判定を行うとともに対応するカナ名称を取得する
姓名変換手段を備え、前記名称種別判定手段の判定の結
果日本人名であると判定された場合には、該姓名変換手
段を用いてローマ字表記の単語が姓であるか名であるか
を判定すると共にカナ名称に変換しかつカナ名称の単語
の順序を並び替えて出力することを特徴とする、ローマ
字表記名称のカナ文字への変換装置。
【請求項９】入力された欧米形式で１または複数の単語
でローマ字表記された個人名や企業名等を表すローマ字
名称をバッファに格納するステップと、該ローマ字名称
をカナ名称に変換するステップと、該ローマ字名称が企
業名であるか外国人名であるか日本人名であるかを判定
するステップと、該名称種別判定手段の判定結果に従っ
てローマ字名称をカナ名称に変換し、かつ、カナ名称の
単語の順序を並び替えて出力手段に出力するステップと
を有するローマ字表記名称のカナ文字への変換方法が記
録されたコンピュータが読み取り可能な記録媒体。