JP2000276467A - 変換装置 - Google Patents

変換装置

Info

Publication number
JP2000276467A
JP2000276467A JP11085387A JP8538799A JP2000276467A JP 2000276467 A JP2000276467 A JP 2000276467A JP 11085387 A JP11085387 A JP 11085387A JP 8538799 A JP8538799 A JP 8538799A JP 2000276467 A JP2000276467 A JP 2000276467A
Authority
JP
Japan
Prior art keywords
name
kana
address
roman
converting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11085387A
Other languages
English (en)
Inventor
Hiroyuki Kumai
裕之 隈井
Shogo Hamamichi
勝吾 浜道
Katsuya Kono
勝也 河野
Junichi Matsuda
純一 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11085387A priority Critical patent/JP2000276467A/ja
Publication of JP2000276467A publication Critical patent/JP2000276467A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 本発明の目的は、多用な形式でローマ字を用
いて記述された日本の住所をカナに変換するとともに日
本形式の並びに並び替えて出力する装置を提供すること
にある。 【解決手段】 入力手段102から入力されたローマ字
表記された日本の住所の中から、地名階層判定手段10
6を用いて都道府県、市区郡町村等の地名階層を判定
し、地名情報を階層的に格納する地名データベース10
8を備える地名検定手段107は、ローマ字カナ変換手
段104を用いて変換したカナ地名が実在するか否か、
及び他の地名との地名階層上の整合性を検定し、検定に
成功した場合は、地名データベース108に格納された
正とするカナ地名表記を取得し、最終的に日本形式の正
しい順序でカナに変換された住所を出力手段110に出
力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータ等の
情報処理装置に係わり、特にローマ字で表記された住所
及び名称のカナ文字への変換装置に関する。
【0002】
【従来の技術】近年、国際間の商取引が増大等に伴い、
日本の住所や企業名、人名がローマ字で表記される機会
が増加している。従来、ローマ字で表記された日本の住
所や企業名、人名はその件数も少なく、また、取り扱う
部署も限定されていたため、住所や名称のローマ字表記
になれた専門オペレータが、手作業で日本語の住所表記
に変換していることが多かった。しかし、情報処理装置
の普及に伴い、一般ユーザにおいてもこれらローマ字表
記に接する機会が増えている。このような状況の中で、
日本人の一般ユーザにとってローマ字表記の住所、名
称、カナや漢字で表記された住所、名称に比べて極めて
判読性の悪いものとなっている。
【0003】第1に欧米形式の住所表記と日本形式の住
所表記では、記述の方向が異なる場合が多々ある。例え
ば住所においては、日本形式では、都道府県、市区郡町
村、大字、字、地番と大きな単位から記述するのに対
し、欧米形式では、地番、字、大字、市区郡町村、都道
府県と、小さな単位から記述する。加えて、日本の住所
をローマ字化するとき、公的に決まった記述形式がな
く、字の位置が大字の右にくることもあれば、左にくる
こともある。また、ローマ字で表記しているにもかかわ
らず、日本形式のに従って大きな単位から記述している
例、「SHI、KEN」等の行政単位(地名接辞)を省
略して記述している例も見られる。
【0004】第2に、カナをローマ字記述する場合に
は、ローマ字表記の多義性の問題がある。例えば、「オ
オイ」には「OOI」、「OI」のように長音を省略す
る書き方も許され、また、「フジ」に対して「HUZ
I」、「FUJI」、「HUJI」、「FUZI」等複
数のローマ字記述が許されるあり得る。
【0005】名称においては、日本人姓名をローマ字で
表すとき、姓、名の順に記述するか、名、姓の順に記述
するかは一般規則がなく、企業名についても、「航空」
を「KOUKUU」ではなく、「AIRLINES」と
するように、本来日本語である業種名を英語で表現した
り、業種名が先頭にきて記述の順序が逆転するなど、単
純にローマ字をカナに変換しただけでは日本形式の記述
にならないことが多い。
【0006】地名における長音などのローマ字表記の多
義性を解消する従来技術として特開平9−259142
がある。また、外国語による住所データと和文による住
所データを1対1でデータベースに格納し電話番号やビ
ル名等の特定キーを用いた検索で、外国語による住所デ
ータを和文による住所データに変換する方式が、特開平
5−101093に述べられている。
【0007】
【発明が解決しようとする課題】上記特開平9−259
142で述べられている装置は、ローマ字表記の多義性
を解消することはできるが、欧米形式で記述されたロー
マ字表記の住所や名称を日本形式に並び替えることはで
きない。また、特開平5−101093で述べられてい
る方式では、既に登録されているパターンの外国語によ
る住所のみが変換可能であり、新たにパターンの住所を
変換することはできなかった。
【0008】上記問題点に鑑み、本発明の第1の目的
は、多様な形式でローマ字を用いて記述された日本の住
所をカナあるいは漢字に変換するとともに日本形式の並
びに並び替えて出力する、汎用的で高精度なローマ字で
表記された住所のカナ文字への変換装置を提供すること
にある。
【0009】本発明の第2の目的は、ローマ字を用いて
欧米の並びで記述された個人や企業の名称に対して、個
人名、企業名の判別を行い、判別結果に従い日本形式の
並びに並び替えてカナあるいは漢字に変換して出力する
ローマ字で表記された名称のカナ文字への変換装置を提
供することにある。
【0010】
【課題を解決するための手段】上記課題を解決するため
に、本発明のローマ字で表記された住所のカナ文字への
変換装置では、地名階層判定手段と、県市町村名等の地
名情報を階層的に格納する地名データベースと地名検定
手段を備え、入力されたローマ字住所文字列の中から地
名階層判定手段を用いて地名階層を表す特徴文字列を検
知し、都道府県、市区郡町村等の地名階層を判定し、次
に地名検定手段を用いて当該地名が実在するか否か、ま
た、他の単語の地名との地名階層上の整合性を検定し、
ローマ字表記された日本の住所をカナに変換し日本形式
の正しい順序で出力する。
【0011】本発明のローマ字で表記された名称のカナ
文字への変換装置では、名称種別判定手段と、日本人の
姓、名の頻度情報を格納する姓名データベースと姓名変
換手段を備え、名称種別判定手段を用いて入力されたロ
ーマ字名称が個人名であるか否かを判定し、判定結果が
日本人名であった場合には、次に姓名変換手段を用いて
単語のいずれが姓であるかを決定し、ローマ字表記され
た日本人名をカナに変換し、姓、名の順序で出力する。
【0012】
【発明の実施の形態】以下、図を用いて本発明のローマ
字表記住所のカナ文字への変換装置の一実施形態のにつ
いて説明する。
【0013】第1の発明であるローマ字で表記された住
所のカナ文字への変換装置について説明する。
【0014】図2に本発明のローマ字表記住所のカナ文
字への変換装置の変換例を示す。
【0015】ローマ字表記住所は、図2の(a)(b)
(c)に示すように、多用な形式で記述される。本発明
の装置は、これら多用な形式で記述された住所に対し
て、地名の階層判定を行い、次に各地名をローマ字カナ
変換した後、当該地名が実在するかどうかを階層の整合
性も含めて検定し、(d)に示すごとく最終的に正しい
日本のカナ地名を出力するものである。
【0016】ここで、日本の住所の構成要素について説
明する。日本の住所は、以下の階層に整理することがで
きる。
【0017】(1)都道府県、(2)市区郡町村、
(3)大字、(4)字、(5)地番、(6)号室等。
【0018】ここで、(2)市区郡町村の階層は、市
名、政令指定都市では市名と区名、郡町村では、郡名と
町、及び村名で一つの階層を構成し、東京特別区(23
区)は(2)で市が存在しない場合として扱う。
【0019】本実施形態においては、字までの住所のカ
ナ変換を対象とする。地番は数字のみで構成されカナに
変換する意味はない。また号室等については、アパート
やマンション名を含むがこれらはローマ字からカナへの
変換のみ行い、地名データーベースでの検定は行わない
ものとする。
【0020】図1は、本発明のローマ字で表記された住
所のカナ文字への変換装置の一実施形態のブロック構成
図である。
【0021】図1において、各手段は、ハードウェアま
たは汎用プロセッサとソフトウェアによって実施可能で
ある。
【0022】図1において、102は住所を表すローマ
字文字列を入力する入力手段であり、キーボード等の入
力装置、すでに作成されたローマ字文字列を格納したフ
ァイルを読み出すファイル装置等により実現可能であ
る。ローマ字コードを入力できる装置であれば、どのよ
うな装置でも利用可能である。
【0023】110は、変換結果の住所を表すカナ/漢
字文字列を出力する出力手段であり、ディスプレイやプ
リンタ等の出力装置、あるいは変換結果を書き出すファ
イル装置等により実現可能である。カナ/漢字文字列を
出力できる装置であれば、どのような装置でも利用可能
である。
【0024】101は、CPU等の制御装置であり、各
手段が処理したデーターを加工しながら、他の手段に渡
して行く。
【0025】103は、入力手段102から入力された
ローマ字文字列を一時的に格納するローマ字バッファで
あり、入力文字列と当該入力文字列の一部が処理された
ときに、当該一部の文字列に対してどのような処理が行
われたかを記録する属性エリアからなる。詳細は後述す
る。
【0026】104はローマ字文字列をカナ文字列に変
換するローマ字カナ変換手段であり、ワードプロセッサ
等ののローマ字漢字変換入力などで使用されている既知
の方法でローマ字変換を行う。
【0027】105はローマ字カナ変換手段104の変
換結果のカナ文字列を格納するカナバッファである。
【0028】106はローマ字バッファの文字列から、
地名の階層を表す「SHI」や「KEN」などの特定表
記を検索し、文字列の一部がどの地名階層に属するかを
判定する地名階層判定手段である。
【0029】107は階層化された地名データベース1
08を使用し、カナバッファ105に格納された地名
が、実在するか否か、更に変換済みの地名との階層上の
整合性を検定する地名検定手段である。
【0030】108は日本の住所の一部である地名に対
しその上位の地名の情報を階層情報として保持する地名
データベースである。
【0031】109は上記各手段によって変換された住
所文字列を保持する変換結果バッファである。
【0032】次にローマ字バッファ103およびカナバ
ッファ105について、図3を用いて詳しく説明する。
【0033】図3(a)に、ローマ字住所文字列が格納
されたローマ字バッファ103およびカナバッファ10
5の初期状態の様子を示す。
【0034】301は、入力手段102を用いて入力さ
れたローマ字文字列を保持するローマ字文字列格納エリ
アである。302は、当該ローマ字文字列が住所のどの
階層に対応するかを保持する属性格納エリアである。属
性格納エリアは、何も対応していないことを示す、未定
義状態の「U」、地名の階層を示す都道府県「P」、市
「C」、区「K」、郡「G」、町「T」、村「V」、大
字「O」、字「A」等の値を設定する。更に当該文字列
が、「SHI」、「KU」等の地名接辞であった場合に
は、例えば「SC」、「SK」のように対応する記号が
値として設定される。ローマ字文字列格納エリア、およ
び属性格納エリアは変換処理の進行にしたがって分割あ
るいは統合される。例えば、処理の最初の段階でスペー
スなどの単語の区切りにより分割し、(b)に示す状態
になる。ローマ字バッファ103は、ローマ字格納エリ
ア301及び属性格納エリア302とで構成される。3
03はカナバッファであり、ローマ字格納エリアの一部
の文字列のカナへの変換結果が格納される。
【0035】図5に地名データベース108の例を示
す。地名データベースは、実在する日本の住所の地名を
地名階層の単位で保持したデータベースである。コード
は当該地名の番号を示す。
【0036】地名見出しは、当該地名を検索するときの
検索キーである。正地名表記は、当該地名の正しい表記
である。地名見出しは、正地名表記をローマ字で表した
場合の多義性を吸収する文字列に変換されている。例え
ば正地名表記が「オオイ」である場合、そのローマ字表
記が「OI」、「OOI」、「OHI」など複数有り得
ることを考慮し、地名検定手段で「オイ」も「オオイ」
も「オイ」に変換して検索するようになっている。従っ
て地名見出しには「オイ」と登録する。この変換を正規
化と呼ぶ。正規化には、長音以外に、濁音の清音化、ス
ペースの削除などがある。図5では、「ヨコハマシ カ
ナザワク」の濁音「ザ」を清音「サ」に正規化してい
る。単位は、当該地名の地名階層上の区分である。日本
の地名の場合、地名階層は、都道府県、市区郡町村、大
字、字の4階層で構成すると都合がよい。上位コード
は、当該地名の上位地名のコードをあらわしている。例
えば、コード「033」の大字である「トミオカニシ」
は、上位コードが「14−108」である。したがっ
て、「トミオカニシ」の上位地名は、都道府県はコード
が「14」の地名(図5の例では「カナガワケン」とな
る)であり、市区郡町村は上位コードに「14」をもち
コードが「108」の地名(図の例では「ヨコハマシ
カナザワク」となる)である。本地名データベースに
は、更に付加情報として郵便番号などを格納してもよ
い。
【0037】図6に変換結果バッファ109の例を示
す。
【0038】変換結果バッファ109は各地名階層ごと
に地名検定手段で検定された結果を格納するテーブルで
ある。各地名階層ごとに正地名表記を格納する変換結果
エリアと、コード、および上位コードを格納することが
できる。地名検定の結果、複数の地名が地名データベー
スから得られた場合には、得られた複数の地名を格納で
きるようになっている。
【0039】次に図7から図10を用いて、地名変換の
制御の流れについて説明する。
【0040】本実施形態においては、地名データベース
108に格納されている字までの住所を正しく変換する
住所変換について説明する。
【0041】尚、以下の説明では、「99−17 TO
MIOKA NISHI 4CHOME KANAZA
WA−KU YOKOHAMA CITY」というロー
マ字表記の住所が入力された場合を例として説明する。
【0042】第1の実施形態として、地名接辞を利用し
た住所変換について説明する。地名接辞とは、「都、
県、市、区、郡、町、村」等の住所に付加される行政単
位のことである。ローマ字で住所が記述される場合に
は、「TO、KEN、SHI、KU、GUN、MACH
I、MURA」等となる。例えば、「YOKOHAMA
−SHI KANAGAWA−KEN」というように地
名に付加されるケースが多い。第1の実施形態は、この
地名接辞に着目することで、地名階層判定手段におい
て、少ない処理で効率的に地名階層を判定し、住所を特
定するものである。尚、地名接辞は、「市」を表す「S
HI、CITY」等のように同じ行政単位を表す複数の
表現が存在する。
【0043】まず、図7を用いてローマ字表記住所のカ
ナ文字への変換の全体の流れについて説明する。
【0044】まず、S701において、市区郡町村の地
名検索を行う。市区郡町村が特定できた場合には、次に
S702に進み都道府県の地名を検索する。一般に日本
の住所は、少なくとも市区郡町村、大字、字までが記述
されていれば、特定可能である。これは、市区郡町村と
大字の組み合わせにより、住所はほとんど一意に特定で
きる。また、都道府県は記述を省略されることも多い。
従って、市区郡町村が検索できれば、都道府県が検索で
きなくてもエラーとはしない。都道府県が検索できた場
合には、S704において市区郡町村の記述位置と都道
府県の記述位置関係から、住所の記述方向を決定する。
住所の記述方向は、その後の大字や字の検索方向の優先
順を決定する。都道府県が検索できなかった場合には、
S705において記述方向は既定の方向、本実施形態で
は左から右により小さな地名単位から大きな地名単位に
記述されていると仮定し、その後の大字や字の検索方向
の優先順を決定する。
【0045】次にS706において大字、字地名を検索
する。最後にS707において、検索結果から地名デー
タベース108を用いて正しいカナ地名を生成し出力手
段110に出力する。
【0046】次に図8を用いて市区郡町村検索S701
について、詳しく説明する。市区郡町村の検索は、「S
HI」「KU」「GUN」「MACHI」「MURA」
等の市区郡町村の特徴を表す地名接辞を検索することに
より行う。これらの地名接辞が見つかる場合には、その
左側の1単語を市区郡町村とする。更に地名データベー
スを用いることで、当該市区郡町村の存在を確認する。
市区郡町村が見つからない場合は、市区郡町村が見つか
らないという結果を出力する。市区郡町村が見つからな
い場合には、地名接辞が存在しない場合には、後述する
入力文字列の各単語を順次カナに変換し地名データーベ
ースを検索して市区郡町村を特定する、第2の実施形態
によって住所の特定を試みることができる。
【0047】まず、S801において、市の地名接辞
(SHI、CITY等)を検索する。地名接辞が見つか
った場合には、S802において当該地名接辞の左側の
1単語を取得し市名とする。また、市名が政令指定都市
であるか否かをチェックする。これは、あらかじめ用意
された政令指定都市名を格納したテーブルと比較するこ
とで行う。地名接辞が見つからなかった場合にはS80
3に進み、後述する郡町村特別区地名検索処理を行う。
次にS802において政令指定都市である場合には区が
存在する。したがって、S804において区の地名接辞
(KU等)を検索し、存在すればS805において、当
該地名接辞の左側の1単語を取得し区名とする。このと
き区の地名接辞が見つからない場合でも、エラーとしな
い。これは、例えば仙台市に対する川内市のように、政
令指定都市と同じローマ字表記となる一般市が存在する
場合があるためである。尚、処理効率は落ちるが、S8
03で市名が政令指定都市であるか否かをチェックする
処理を省略して、常に区を検索する、すなわちS805
を行うようにしても良い。
【0048】例では、「CITY」が見つかるため、
「YOKOHAMA」が市名として取得され、政令指定
都市名であるため「KU」を検索し、「KANAZAW
A」が区名として取得される。
【0049】次に、S807において市名、区名をカナ
に変換し、地名接辞に対応するカナ(「シ」や「ク」)
を付加する。
【0050】例では「ヨコハマシ カナザワク」に変換
される。この時のローマ字バッファ、及びカナバッファ
の状態を図3の(C)および(D)に示す。
【0051】次にS808において変換したカナを用い
て、地名検定手段を用いて当該市区郡町村が実在するか
どうかを検定する。地名検定手段では、変換結果のカナ
を前述した正規化処理を行って検索キーを作成し、地名
データベースを検索する。例では、「ヨコハマシ カナ
ザワク」から、正規化を経て検索キー「ヨコハマシカナ
サワク」を作成し、図5に示す地名データベースを検索
し、地名コード108のデータにマッチングし、実在す
る市区として特定する。
【0052】検定の結果、当該市区郡町村が実在する場
合には、S702の都道府県地名検索に進む。当該市区
郡町村が実在しない場合には、S703のエラー処理に
進む。
【0053】図9を用いて、S803の郡町村特別区地
名検索処理について簡単に説明する。
【0054】S901において郡の地名接辞(GUN
等)を検索する。地名接辞が見つかった場合には、S9
02において当該地名接辞の左側の1単語を取得し郡名
とする。次に、S903において町、または村の地名接
辞(CHO、MACHI、MURA、MURA等)を検
索する。地名接辞が見つかった場合には、S904にお
いて当該地名接辞の左側の1単語を取得し町、または村
名とする。
【0055】S901において、郡の地名接辞が見つか
らなかった場合には、東京都特別区を検索する。S90
5に進み地名接辞(KU等)を検索する。地名接辞が見
つかった場合には、S906において当該地名接辞の左
側の1単語を取得し特別区名とする。
【0056】S903およびS905において、地名接
辞が見つからなかった場合には、市区郡町村が検索でき
なかったものとして、エラー処理703に進む。
【0057】尚、以上の市区郡町村地名検索処理の中
で、政令指定都市と郡町、郡村が検索された場合に、S
705で説明した住所の記述方向を決定しても良い。
【0058】市区郡町村が確定できた場合は、図7のS
702に進み都道府県の地名検索を行う。具体的には、
上述した市区郡町村と同様に、都、道、府、県の地名接
辞(TO、DO、FU、KEN、PREF等)を検索す
る。地名接辞が見つかった場合には、当該地名接辞の左
側の1単語を取得し都道府県名とし、カナ文字列に変換
した後、地名検定手段107を用いて実在するか否かを
検定する。前述したように都道府県名は省略して記述さ
れることが多く、存在していなくてもエラーとしない。
【0059】例の場合、都道府県を表す地名接辞は検索
されないため、検索を行わない。
【0060】次に、大字、字の地名検索処理S706を
図9を用いて詳しく説明する。
【0061】大字は、主に町名であり、日本の住所には
必ず存在する。大字は「町」等がつくケースが多いもの
の、多様な日本語から構成されており、大字を特徴づけ
る文字列はないと考えてよい。また、字は存在する場合
と、存在しない場合がある。字は多くの都市では、丁目
であることが多い。従って、「CHOME」という表記
を用いて字を検索することには合理性がある。本実施形
態では、これらの特徴に基づき、大字と字を検定する。
【0062】まず、S1001において、丁目(字)を
示す地名接辞(CHOME等)を検索する。地名接辞が
見つかった場合には、S1002において当該地名接辞
の左側の数字の1単語を取得し丁目(字)とする。ま
た、字を設定済みとする。次に大字を検索するが、大字
は、例の「TOMIOKA NISHI」のように複数
の単語で構成される場合も有れば、1単語が大字、残り
の単語が字やアパート名である場合もある。そこで、大
字の検索では既に上位地名が検定されていることを利用
して、まずS1003において、都道府県や市区郡町村
に割り当てられていない単語群を取り出し、次にS10
04において当該市区郡町村に属する大字に一致するま
で、割り当てられていない単語群の組み合わせから、
数、前後の並びの異なる大字候補を順次作成し地名検定
手段を用いて検定する。例では、「TOMIOKA N
ISHI」、「NISHI TOMIOKA」、「NI
SHI」、「TOMIOKA」が大字の候補として考え
られる。尚、数字のみで構成される単語は、大字ではな
いとして除外する。例では、「TOMIOKANISH
I」を変換した「トミオカニシ」が図5に示す地名デー
タベースにおいて上位地名の「ヨコハマシ カナザワ
ク」に属する地名として検定される。
【0063】残りの文字列は、字である可能性もある
し、アパート名などの可能性もある。そこでS1001
において、丁目が検索されていなければ、S1006に
進み、S1004と同様に、字の検定を行う。例の場合
は、S1001において「CHOME」が存在している
ため、S1006には進まず、S1005へと進み既に
取得された丁目を用いて、字の検定を行う。図5に示す
地名データベースには、「トミオカニシ」に属する字と
して、「4」が存在するため、字として検定する。
【0064】この時のローマ字バッファ、及びカナバッ
ファの状態を図4の(e)および(f)に示す。
【0065】字より下位の文字列に関しては、大字に最
も近い数字のみからなる文字列を地番として扱い、その
他のアパート名やビル名等の文字列を、地番以下として
設定する。これらの文字列は、ローマ字バッファの属性
格納エリアを参照することで取得でき、文字列が数字記
号列のみから構成されるか否かによって、地番であるか
否かを決定できる。尚、図2(c)に示すごとく、「4
−99−15」のように字が地番と同じ文字列に含まれ
る場合は、上述のS1006において、字候補の文字列
として、先頭の数字を切り出すことで、地名検定でき
る。
【0066】以上のようにして、各地名階層において検
定された地名は、変換結果バッファに格納される。例の
場合の変換結果バッファは、図6(b)の状態となる。
最後にS707において変換結果バッファを参照し、正
しいカナ住所「ヨコハマシカナザワク トミオカニシ4
99−15」が得らる。ここで、入力されたローマ字
住所文字列に都道府県が記述されていない場合、市区郡
町村の上位地名コードを含み、かつ単位が、都、道、府
または県であるものを検索することで、都道府県の文字
列を取得することができる。
【0067】以上のようにして、ローマ字住所を地名検
定手段を用いて正しい住所に変換することができ、図2
の(d)に示すカナ住所を出力手段に出力することがで
きる。
【0068】尚、地名データベースの正地名表記欄にカ
ナではなく漢字を記述しておけば、ローマ字表記の住所
を漢字に変換して出力することも可能である。
【0069】次に、S703のエラー処理について説明
する。エラー処理では、単にエラーメッセージを出力す
る以外に、以下のような地名の再変換処理を行ってもよ
い。すなわち、図2(c)に示すように、入力されたロ
ーマ字住所に地名接辞を含まない場合、上述の実施形態
では、市区郡町村が検索できず、S703に進み、以下
に述べる第2の実施形態の方法を用いて、カナ住所に変
換することができる。
【0070】住所のカナ変換の第2の実施形態は、処理
量が増大する欠点があるが、より多様な入力文字列に対
応できる。この目的のため、あらかじめ地名データベー
スに、地名接辞を含まない地名見出しを登録する。図3
地名データベースには、「ヨコハマカナサワク」、「ヨ
コハマシカナサワ」、「ヨコハマカナサワ」が登録して
ある。
【0071】第2の実施形態では、大字の地名検定で説
明したのと同様、すべての単語について組み合わせを変
えながら、成功するまで検定を繰り返す。例えば、ロー
マ字文字列が図4(g)に示すように、ローマ字バッフ
ァに格納される。この例では、最初に「YOKOHAM
A KANAZAWA NISHI TOMIOKA」
を作成しカナに変換し、「ヨコハマカナサワトミオカニ
シ」を地名検定する。しかし、この検定は失敗する。順
次、「ヨコハマカナサワトミオカ」、「ヨコハマカナサ
ワ」と地名検定を繰り返すと、「ヨコハマカナサワ」が
市区として一致する。次に残りの文字列で「ニシトミオ
カ」、「トミオカニシ」、「ニシ」というように順次地
名検定が行われる。この例では、「トミオカニシ」の検
定の段階で既に検定された「ヨコハマカナサワ」に属す
る大字に一致する。以上のように、入力ローマ字文字列
の各単語をバックトラック手法を用いて、少なくとも市
区郡町村と大字の階層関係に矛盾が起こらない組み合わ
せの検索を再帰的に繰り返す。都道府県から字までの間
で、最も多くの階層と検定できた場合を、最終的な正し
い住所として出力する。
【0072】尚、上述した第2の実施形態のみにより、
本発明を実施することができるが、組み合わせの数が爆
発的に増え、処理時間が増大するため、上述したよう
に、第1の実施形態のエラー処理において実行するほう
が現実的である。
【0073】S703のエラー処理では、補正テーブル
を用いて、地名のローマ字の一部を変更して再度、検定
を行うことが考えられる。例えば、「金沢区」は、正し
くは「KANAZAWAKU」であるが、「金」を「K
ANE」と読み、「KANEZAWAKU」というロー
マ字を入力するユーザが存在する可能性がある。そこ
で、本発明の住所変換装置の第3の実施形態では、S7
03において、ローマ字の一部を変更する情報を格納す
るローマ字綴り変更テーブルを用意し、入力されたロー
マ字の一部を変更し、再度地名検定を行う。
【0074】ローマ字綴り変更テーブルの例を図11に
示す。変換元のローマ字文字列と変換先のローマ字文字
列とで構成する。ローマ字の置き換えは、1回に1個所
づつ行い、すべての修正テーブルの修正を試しても地名
検定に失敗する場合には、更に複数の置き換えを組合せ
て修正し地名検定を行う。例えば、図11の例では、入
力ローマ字文字列が「KANEZAWAKU」の場合に
は、「KANASAWAKU」、「KANETAKUK
U」「KANATAKUKU」と順次変更しながら地名
検定を繰り返す。
【0075】以上のように、本発明の本発明のローマ字
で表記された住所のカナ文字への変換装置を用いること
により、多用な表現でローマ字を用いて入力された住所
を実在する日本の住所に変換できる。
【0076】尚、本実施形態では、住所を日本の住所と
して説明してきたが、本発明の住所変換装置は本来の住
所記述の順序が英語形式とは異なる中国や韓国など住所
にあっても適用可能である。中国や韓国の住所の記述の
順序は日本と同様に大きな単位から記述する。この場
合、地名データベース108の地名見出しは、ローマ字
で記述されることになる。
【0077】また、上述の実施形態では、地名データベ
ース108の地名見出しをカナで保持したが、日本の住
所でも地名見出しをローマ字で保持しても良い。ただ
し、歴史的経緯から日本のカナに対するローマ字の表現
は、例えば「フジ」に対して「HUZI」、「FUZ
I」、「HUJI」、「FUJI」等、多種類の表現が
可能となるため、地名データーベースの容量や正規化処
理が増加するなどの不利な点が多い。
【0078】次に、第2の発明であるローマ字で表記さ
れた名称のカナ文字への変換装置について説明する。
【0079】以下の実施形態ではローマ字表記された名
称を、日本人名、日本に滞在している外国人名、日本に
ある企業名と想定する。日本人名がローマ字表記される
場合、姓、名の記述順序には必ずしも規則性が無い。
姓、名の順に書かれる場合も有れば、名、姓の順に書か
れる場合もある。ただし、英語式に、「Mr」「Mr
s」等の人名接辞が先頭に付与される場合には、姓、名
の順序はファーストネーム(名)、ファミリーネーム
(姓)の順で記述される。
【0080】日本にある企業のローマ字表記名称は、単
に企業名の読み方をローマ字でつづったものだけでな
く、業種名を英単語に変換している場合もある。例え
ば、「スズキ貿易式会社」に対して、「SUZUKI
BOUEKI KK」と記述する場合もあれば、「SU
ZUKI TRADING CO,LTD」と記述する
場合もある。日本に滞在している外国人名については、
外国人名であることが判定できれば、それ以上カナに変
換する利点はないが、日本人名と企業名に関しては、ロ
ーマ字表記名称をカナ名称に変換することで、日本人に
とって認識しやすくなるという利点がある。
【0081】図15に本実施形態におけるローマ字名称
のカナ名称への変換結果の例を示す。尚、カナ名称の先
頭に、後述する名称種別判別手段の判定結果を日本人姓
名を「(J)」、外国人姓名を「(F)」、企業名を
「(C)」、判定不可能な場合を「(U)」として、付
加して、判別結果が分かるように出力するようにしてい
る。
【0082】図12は、本発明のローマ字で表記された
名称のカナ文字への変換装置の一実施形態のブロック構
成図である。
【0083】図12において、各手段は、ハードウェア
または汎用プロセッサとソフトウェアによって実施可能
である。
【0084】図12において、1202は名称を表すロ
ーマ字文字列を入力する入力手段であり、キーボード等
の入力装置、すでに作成されたローマ字文字列を格納し
たファイルを読み出すファイル装置等により実現可能で
ある。ローマ字コードを入力できる装置であれば、どの
ような装置でも利用可能である。
【0085】1210は、変換結果の住所を表すカナ/
漢字文字列を出力する出力手段であり、ディスプレイや
プリンタ等の出力装置、あるいは変換結果を書き出すフ
ァイル装置等により実現可能である。カナ/漢字文字列
を出力できる装置であれば、どのような装置でも利用可
能である。
【0086】1201は、CPU等の制御装置であり、
各手段が処理したデーターを加工しながら、他の手段に
渡して行く。
【0087】1203は、入力手段1202から入力さ
れたローマ字文字列を一時的に格納するローマ字バッフ
ァであり、入力文字列と当該入力文字列の一部が処理さ
れたときに、当該一部の文字列に対してどのような名称
の判定が行われたかを記録する属性エリアからなる。
【0088】1204はローマ字文字列をカナ文字列に
変換するローマ字カナ変換手段であり、ワードプロセッ
サ等ののローマ字漢字変換入力などで使用されている既
知の方法でローマ字変換を行う。
【0089】1206はローマ字バッファの文字列か
ら、人名に先立つ「Mr」や「Mrs」等の接辞や、企
業名を表す「Co」「Ltd」等の識別子を検索した
り、単語の個数、およびカナに変換可能か否かによっ
て、名称の種別を判定する名称種別判定手段である。
【0090】1207は日本人の姓、名を表すローマ字
文字列と対応するカナ文字列を保持する姓名データベー
ス1208を使用し、より正しい日本人姓名に変換する
姓名変換手段である。
【0091】1208は日本人の姓、名を表すローマ字
文字列と対応するカナ文字列と、当該姓、または名の頻
度情報を保持する姓名データベースである。
【0092】1209は企業名の業種を表すローマ字表
記と対応するカナ表記とを保持する企業業種名テーブル
である。
【0093】1205は上記各手段によって変換された
名称文字列を保持する変換結果バッファである。図18
に本実施形態おける変換結果バッファの例を示す。18
01は、名称種別判定手段の判定結果を格納する名称種
別エリアであり、上述した「(J)」、「(F)」、
「(C)」及び「(U)」のいずれかを格納し、制御手
段1201は、名称種別エリアの内容にしたがって制御
を切り替える。1802は姓エリア、1803は名エリ
アであり名称種別が「(J)」の場合に日本人姓、名の
カナ変換結果を格納する。1804は固有名エリア、1
805は業種名エリアであり、名称種別が「(C)」の
場合に企業の固有名と業種名を格納する。1806は非
変換エリアであり、名称種別が「(F)」及び
「(U)」の場合にローマ字文字列をそのまま格納す
る。図18には、ローマ字名称のカナ変換の結果、企業
である「スズキ ボウエキ」に変換された例を示してい
る。
【0094】図13を用いてローマ字表記名称のカナ文
字への変換の流れについて説明する。入力手段1201
から入力されたローマ字文字列に対し、まず名称種別判
定手段1206において名称種別の判定を行う。S13
01では、ローマ字文字列中に企業を表す識別子が存在
するか否かを判定する。企業を表す識別子としては、
「Co」「Co Ltd」「KK」「INC」等があ
る。これらの識別子がローマ字文字列に含まれる場合
は、当該名称が企業名であると判定して、後述するS1
303の企業名変換処理に進む。企業を表す識別子が存
在しない場合には、次にS1302に進み、ローマ字文
字列中に個人を表す識別子が存在するか否かを判定す
る。個人名を表す識別子としては、「Mr」「Mrs」
「Dr」等がある。個人を表す識別子が存在する場合に
は、当該名称は個人名と判定する。個人名と判定された
場合には、S1304に進み、更に外国人名か日本人名
かの判定を行う。もし残りの単語が2単語で、どちらの
単語もカナに変換可能なローマ字である場合には、日本
人名と判定する。日本人名と判定した場合には、この処
理では「Mr」「Mrs」「Dr」等の人名接辞の後で
あるので、名、姓の順であると判断でき、S1305に
おいて姓、名の順に入れ替え、更にカナに変換し出力手
段1210に出力する。個人を表す識別子が存在しない
場合には、S1307に進み日本人姓名の可能性を判定
する。すなわち、単語数が2単語でどちらの単語もカナ
に変換可能なローマ字である場合には日本人名と判定す
る。日本人名と判定した場合には、S1308に進み姓
名データベースを用いた、姓、名順序の決定を行う。具
体的には、図16に示す姓名データベースを用いて以下
のように決定する。
【0095】姓名データベースは、ローマ字で記述され
た姓、または名と、姓、名の区別と、当該姓または名の
統計的な出現確率を保持する。出現確率は、例えば姓、
名を各々10000集めた際の統計調査の出現個数でも
良い。これにより、例えば、「YOSHINO KIM
URA」という名称に対して、「KIMURA」は姓の
出現確率30、名の出現確率0、「YOSHINO」は
姓の出現確率10、名の出現確率2であり、「KIMU
RA」を姓としたほうが、姓名トータルの出現確率が高
くなるため、「キムラ ヨシノ」と変換するのがもっと
もらしいと判断できる。「YOSHINO MAYUM
I」という名称に対して、「MAYUMI」は姓の出現
確率2、名の出現確率40、この場合は「YOSHIN
O」を姓としたほうが、姓名トータルの出現確率が高く
なるため、「ヨシノ マユミ」と変換するのがもっとも
らしいと判断できる。
【0096】姓名データーベース1208には、更に図
16に示すように対応するカナ表記を保持しても良い。
こうすることで、例えば「KENICHI」を「ケニ
チ」ではなく「ケンイチ」と、また「YUKI」が姓の
場合は「ユウキ」、名の場合は「ユキ」などと、よりも
っともらしいカナに変換することができるようになる。
尚、かな表記を保持させた場合には、S1305におい
ても姓名データベースを用いて、よりもっともらしいカ
ナに変換するようにしてもよい。
【0097】以上のようにして、姓、名の順序を決定し
カナに変換して出力する。
【0098】もし、S1307において日本人名でない
と判定された場合は、名称の判定はできなかったものと
して、ステップ1309に進み、ローマ字名称をそのま
ま出力する。
【0099】次に、図14を用いて、S1303の企業
名変換処理について説明する。
【0100】ローマ字表記された企業名は、企業を表す
識別子と、業種名と個有名によって構成されることが多
い。例えば、「SUZUKI TRADING CO,
LTD」の場合は、「CO,LTD」が企業を表す識別
子、「TRADING」が業種名、「SUZUKI」が
固有名となる。固有名には「SUZUKI」「TATI
KAWA」などの固有名詞だけでなく、「北東開発」に
おける「NorthEast」や「鈴木電器」における
「DENKI」など普通名詞の場合もある。また、企業
によっては、「株式会社 日立製作所」を「Hitac
hi,Ltd.」と表すように、業種名を省略する場合
も見受けられる。上述のようにに企業名のローマ字表現
には多様な表現があるが、企業を識別するために、少な
くとも固有名が必要である。
【0101】S1401では、企業を表す識別子を除い
た残りの単語数を調べる。
【0102】残りの単語数が0の場合には、S1404
に進み固有名となる名称が取得できないため、企業名称
としての解析が不可能であるとして、名称種別を不明と
設定する。
【0103】残りの単語数が1の場合には、S1403
に進みその単語を固有名とする。そして、S1406に
進み、当該固有名がカナに変換可能な場合にはカナに変
換し出力結果バッファに設定する。
【0104】残りの単語が1より大きい場合は、S14
02に進み、固有名と業種名を特定する。固有名と業種
名の特定は、図16に示す企業業種名テーブル1209
を用いて行う。企業業種名テーブルは業種名のローマ字
表記と対応するカナ表記で構成される。カナ表記はロー
マ字表記のカナ変換結果だけでなく、「AIRLINE
S」に対する「コウクウ」のように、英単語に対する日
本語訳語でもよい。業種名の検索では、業種名テーブル
で一致した部分を業種名とし、残りの部分を固有名とす
る。この時、固有名として少なくとも1単語が残ってい
るかをチェックする。固有名が残らない場合には、更に
他の業種名を検索する。すべての業種名で検索しても、
業種名の部分が得られない場合には、全体を固有名とす
る。
【0105】以上のようにして、ローマ字文字列の固有
名、業種名が特定され、最後にS1406において、ロ
ーマ字文字列をカナに変換する。ただし、単語のローマ
字がカナのローマ字表現以外のパタンを含む場合には、
日本語でないとして、ローマ字をカナに変換しない。
【0106】以上の処理を行うことで、入力されたロー
マ字名称は、カナ名称に変換され変換結果バッファ12
05に格納される。最後に出力手段1210に、姓、名
の順、あるいは、固有名、業種名の順に出力する。
【0107】以上のようにすることで、図15に示すよ
うにローマ字表記名称の名称を日本語形式の名称に変換
することができる。
【0108】以上述べたように、本発明のローマ字で表
記された名称のカナ文字への変換装置を用いることによ
り、欧米形式で入力された名称を日本語形式の名称に変
換することができる。
【0109】
【発明の効果】以上述べたように、本発明のローマ字で
表記された住所のカナ文字への変換装置を用いることに
より、多用な表現でローマ字を用いて入力された住所を
実在する日本の住所に変換できる。
【0110】また、本発明のローマ字で表記された名称
のカナ文字への変換装置を用いることにより、欧米形式
で入力された名称を日本語形式の名称に変換することが
できる。
【0111】したがって、ローマ字住所や名称に不慣れ
なユーザは、変換結果の日本語化された住所や名称を確
認することで、配達等の業務を効率化することができ、
また、住所録等において、住所、名称をカナまたは漢字
に統一できるという効果がある。
【図面の簡単な説明】
【図1】本発明に係るローマ字表記住所のカナ文字への
変換装置の第1の実施形態の機能ブロック構成図であ
る。
【図2】ローマ字表記住所のカナ文字への変換装置の第
1の実施形態におけるローマ字住所のカナ変換の入出力
結果を例示した図である。
【図3】ローマ字表記住所のカナ文字への変換装置の第
1の実施形態におけるローマ字バッファおよびカナバッ
フの状態を示す図である。
【図4】ローマ字表記住所のカナ文字への変換装置の第
1の実施形態におけるローマ字バッファおよびカナバッ
フの状態を示す図である。
【図5】ローマ字表記住所のカナ文字への変換装置の実
施形態における地名データベースの例を示す図である。
【図6】ローマ字表記住所のカナ文字への変換装置の第
1の実施形態における変換結果バッファの例を示す図で
ある。
【図7】ローマ字表記住所のカナ文字への変換装置の第
1の実施形態の処理内容を示すフローチャートである。
【図8】ローマ字表記住所のカナ文字への変換装置の第
1の実施形態の処理内容を示すフローチャートである。
【図9】ローマ字表記住所のカナ文字への変換装置の第
1の実施形態の処理内容を示すフローチャートである。
【図10】ローマ字表記住所のカナ文字への変換装置の
第1の実施形態の処理内容を示すフローチャートであ
る。
【図11】ローマ字表記住所のカナ文字への変換装置の
第3の実施形態で用いるローマ字綴り変更テーブルの例
を示した図である。
【図12】本発明に係るローマ字表記名称のカナ文字へ
の変換装置の実施形態の機能ブロック構成図である。
【図13】ローマ字表記名称のカナ文字への変換装置の
実施形態の処理内容を示すフローチャートである。
【図14】ローマ字表記名称のカナ文字への変換装置の
実施形態の処理内容を示すフローチャートである。
【図15】ローマ字表記名称のカナ文字への変換装置の
実施形態におけるローマ字名称のカナ変換の入出力結果
を例示した図である。
【図16】ローマ字表記名称のカナ文字への変換装置の
実施形態で用いる姓名データベースの例を示した図であ
る。
【図17】ローマ字表記名称のカナ文字への変換装置の
実施形態で用いる企業業種名テーブルの例を示した図で
ある。
【図18】ローマ字表記名称のカナ文字への変換装置の
実施形態で用いる変換結果バッファの例を示した図であ
る。
【符号の説明】
101 制御手段、102 入力手段、103 ローマ字
バッファ、104 ローマ字カナ変換手段、105 カナ
バッファ、106 地名階層判定手段、107地名検定
手段、108 地名データベース、109 変換結果バッ
ファ、110出力手段、1201 制御手段、1202
入力手段、1203 ローマ字バッファ、1204 ロー
マ字カナ変換手段、1205 変換結果バッファ、12
06名称種別判定手段、1207 姓名変換手段、12
08 姓名データベース、1209 企業業種名テーブ
ル、1210 出力手段。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/20 592A (72)発明者 河野 勝也 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 松田 純一 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B009 KC06 ME02 ME16 ME23 ME24 VB01 5B091 AB04

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】欧米形式の住所の並び順でローマ字表記さ
    れたローマ字住所を入力する入力手段と、該ローマ字住
    所をカナ住所に変換するローマ字カナ変換手段と、該カ
    ナ住所を出力する出力手段とを備え、当該ローマ字住所
    をカナ住所に変換しかつ並び順を日本形式の住所の並び
    順に並び替えて出力することを特徴とする、ローマ字表
    記住所のカナ文字への変換装置。
  2. 【請求項2】請求項1のローマ字住所表記のカナ文字へ
    の変換装置において、上記ローマ字住所文字列の中から
    住所の地名階層を表す地名接辞を検索し地名階層を判定
    する地名階層判定手段を備え、該地名階層判定手段の結
    果に従って当該カナ住所の並び順を日本形式の住所の並
    び順に並び替えて出力することを特徴とする、ローマ字
    表記住所のカナ文字への変換装置。
  3. 【請求項3】請求項1のローマ字住所表記のカナ文字へ
    の変換装置において、正とするカナ地名と該正とするカ
    ナ地名に対応する異表記のカナ地名と住所の階層情報で
    ある上位地名情報とを対応づけて格納する地名データベ
    ースと、入力されたローマ字住所の一部の地名を前記ロ
    ーマ字カナ変換手段を用いてカナに変換した文字列を検
    索子として該地名データベースの異表記のカナ地名と比
    較し正とするカナ地名と上位地名情報とを取得し既にカ
    ナに変換済みの別の地名との住所の階層の整合性を検定
    する地名検定手段を備え、上記ローマ字住所を正とする
    カナ地名から構成されるカナ住所に変換しかつ日本形式
    の住所の並び順に並び替えて出力することを特徴とす
    る、ローマ字表記住所のカナ文字への変換装置。
  4. 【請求項4】請求項3のローマ字住所表記のカナ文字へ
    の変換装置において、上記地名データベースは正とする
    カナ地名に対する漢字地名を格納し、上記ローマ字住所
    を正とする漢字から構成されるカナ住所に変換しかつ日
    本形式の住所の並び順に並び替えて出力することを特徴
    とする、ローマ字表記住所のカナ文字への変換装置。
  5. 【請求項5】請求項3のローマ字住所表記のカナ文字へ
    の変換装置において、上記地名検定手段は、上記地名デ
    ータベースから正とするカナ地名が取得できなかった場
    合に、入力されたローマ字住所の一部のローマ字を変更
    して再度前記検索子を作成するとともに上記地名検定手
    段を用いて検定を行うことを特徴とする、ローマ字表記
    住所のカナ文字への変換装置。
  6. 【請求項6】入力された欧米形式住所の並び順で表記さ
    れたローマ字住所をバッファに格納するステップと、該
    ローマ字住所をカナ住所に変換するステップと、当該ロ
    ーマ字住所の並び順を日本形式の住所の並び順に並び替
    えるステップと、該並び替えた日本形式の住所を出力手
    段に出力するステップとを有するローマ字表記住所のカ
    ナ文字への変換方法が記録されたコンピュータが読み取
    り可能な記録媒体。
  7. 【請求項7】欧米形式で1または複数の単語でローマ字
    表記された個人名や企業名等を表すローマ字名称を入力
    する入力手段と、該ローマ字名称をカナ名称に変換する
    ローマ字カナ変換手段と、該カナ名称を出力する出力手
    段と、該ローマ字名称が企業名であるか外国人名である
    か日本人名であるかを判定する名称種別判定手段とを備
    え、該名称種別判定手段の判定結果に従って、ローマ字
    名称をカナ名称に変換しかつカナ名称の単語の順序を並
    び替えて出力することを特徴とする、ローマ字表記名称
    のカナ文字への変換装置。
  8. 【請求項8】請求項7のローマ字表記名称のカナ文字へ
    の変換装置において、更に日本人の姓または名のローマ
    字名称と対応するカナ名称と当該姓または名の頻度情報
    とを対応づけて保持する姓名データベースと、該姓名デ
    ータベースを用いて当該ローマ字名称が姓または名であ
    るかの判定を行うとともに対応するカナ名称を取得する
    姓名変換手段を備え、前記名称種別判定手段の判定の結
    果日本人名であると判定された場合には、該姓名変換手
    段を用いてローマ字表記の単語が姓であるか名であるか
    を判定すると共にカナ名称に変換しかつカナ名称の単語
    の順序を並び替えて出力することを特徴とする、ローマ
    字表記名称のカナ文字への変換装置。
  9. 【請求項9】入力された欧米形式で1または複数の単語
    でローマ字表記された個人名や企業名等を表すローマ字
    名称をバッファに格納するステップと、該ローマ字名称
    をカナ名称に変換するステップと、該ローマ字名称が企
    業名であるか外国人名であるか日本人名であるかを判定
    するステップと、該名称種別判定手段の判定結果に従っ
    てローマ字名称をカナ名称に変換し、かつ、カナ名称の
    単語の順序を並び替えて出力手段に出力するステップと
    を有するローマ字表記名称のカナ文字への変換方法が記
    録されたコンピュータが読み取り可能な記録媒体。
JP11085387A 1999-03-29 1999-03-29 変換装置 Pending JP2000276467A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11085387A JP2000276467A (ja) 1999-03-29 1999-03-29 変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11085387A JP2000276467A (ja) 1999-03-29 1999-03-29 変換装置

Publications (1)

Publication Number Publication Date
JP2000276467A true JP2000276467A (ja) 2000-10-06

Family

ID=13857347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11085387A Pending JP2000276467A (ja) 1999-03-29 1999-03-29 変換装置

Country Status (1)

Country Link
JP (1) JP2000276467A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189627A (ja) * 2000-12-21 2002-07-05 Tsubasa System Co Ltd 文書データの変換方法
JP2011100332A (ja) * 2009-11-06 2011-05-19 Mixi Inc 姓名による属性解析方法、プログラム及びシステム
JP2014116689A (ja) * 2012-12-06 2014-06-26 Alpine Electronics Inc 車載装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189627A (ja) * 2000-12-21 2002-07-05 Tsubasa System Co Ltd 文書データの変換方法
JP2011100332A (ja) * 2009-11-06 2011-05-19 Mixi Inc 姓名による属性解析方法、プログラム及びシステム
JP2014116689A (ja) * 2012-12-06 2014-06-26 Alpine Electronics Inc 車載装置

Similar Documents

Publication Publication Date Title
Matci et al. Address standardization using the natural language process for improving geocoding results
US8364462B2 (en) Cross lingual location search
CN100437573C (zh) 标识相关姓名的系统及方法
KR101132150B1 (ko) 주소 정형화를 위한 주소 처리방법 및 장치, 그리고 이를 위한 기록매체
CN110516011B (zh) 一种多源实体数据融合方法、装置及设备
Taşkın et al. Standardization problem of author affiliations in citation indexes
CN108304411B (zh) 地理位置语句的语义识别方法和装置
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP6476886B2 (ja) キーワード抽出システム、キーワード抽出方法、及び、コンピュータ・プログラム
JP3812818B2 (ja) データベース生成装置、データベース生成方法及びデータベース生成処理プログラム
JP2693914B2 (ja) 検索システム
JP2007108356A (ja) 個人情報秘匿装置及びそのプログラム
KR20000039018A (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JP2000276467A (ja) 変換装置
JP3621614B2 (ja) 住所解析方法、装置、住所解析プログラムを記録した記録媒体
JP2007200252A (ja) 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体
Kanada A method of geographical name extraction from Japanese text for thematic geographical search
JP2000250931A (ja) 位置情報の自動抽出装置および自動抽出方法と記録媒体
JP4382634B2 (ja) 住所解析装置、住所解析方法及び住所解析プログラム
JPS6394365A (ja) 日本文文書誤り検定装置
JP2761536B2 (ja) 住所生成システム
JP2007172315A (ja) 同義語辞書生成システム、同義語辞書生成方法および同義語辞書生成プログラム
JP3266068B2 (ja) 地図データリンケージシステム及び地図データリンケージを行うプログラムを有する記憶媒体
JP2000311170A (ja) テキスト情報抽出方法
Fall et al. Searching trademark databases for verbal similarities

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060427