以下、図を参照しながらこの発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、パーソナルコンピュータや携帯通信端末などの通信端末において実現したり、ネットワークを通じて接続されるサーバ装置と通信端末とが協働することにより実現したりすることができるものである。以下においては、説明を簡単にするため、サーバ装置と通信装置とがネットワークを通じて接続されて構成されるシステムの当該サーバ装置に、この発明を適用した場合を例にして説明する。
[第1の実施の形態]
[システムの全体構成]
図1は、この発明の装置、方法、プログラムが適用された多言語対応地図サーバ1が用いられて構成される多言語対応地図提供システムの概略構成を説明するための図である。図1に示すように、この実施の形態の多言語対応地図提供システムは、通信ネットワーク4を介して、多言語対応地図サーバ1と、パーソナルコンピュータ2や携帯通信端末3などの通信端末が接続されて構成される。
通信ネットワーク4は、種々の広域通信ネットワークを含むものである。具体的に、通信ネットワーク4は、IP(Internet Protocol)網、公衆交換電話網(PSTN(Public Switched Telephone Network))、デジタル回線網(ISDN(Integrated Services Digital Network))、携帯電話網などを含むものである。さらに、通信ネットワーク4は、近年提供されるようになってきている高速無線通信規格に準じた無線通信網などをも含むものである。
多言語対応地図サーバ(以下、単に地図サーバという。)1は、図1に示すように、地図データ提供部103と注記データ翻訳部104とを備え、ユーザからの要求に応じて、目的とする地域の地図を描画するための地図データと地図用の注記データとを提供する。そして、地図サーバ1は、注記データ翻訳部104を有することにより、日本語の注記データをユーザからの要求に応じた言語に翻訳して提供することができるものである。すなわち、地図サーバ1においては、主に注記データ翻訳部104によって、提供する地図の多言語化(多言語対応)の機能を実現している。
パーソナルコンピュータ(以下、パソコンと略称する。)2は、図1に示すように、通信機能を備えたパソコン本体21と、ユーザインターフェースとしてディスプレイ装置22、キーボード23、マウス(ポインティングデバイス)24等が接続されて構成されたものである。これらが全体として情報処理装置としてのパソコン2を構成する。なお、この実施の形態のパソコン2は、操作言語として日本語、中国語、韓国語、英語などの複数の言語を切り替えることができるものである。したがって、操作言語として例えば中国語を選択した場合に、パソコン2においては、ガイダンス表示やメッセージ表示等が中国語で行うようにされる。
携帯通信端末3としては、例えば、携帯電話端末、PDA(Personal Digital Assistants)、タブレット端末あるいはパッド型端末などと呼ばれる情報端末など種々のものがある。この実施の形態において、携帯通信端末3は、例えば、スマートフォンなどと呼ばれる高機能携帯電話端末であるものとして説明する。なお、この実施の形態の携帯通信端末3もまた、操作言語として日本語、中国語、韓国語、英語などの複数の言語を切り替えることができるものである。したがって、操作言語として例えば中国語を選択した場合に、携帯通信端末3においては、ガイダンス表示やメッセージ表示等が中国語で行うようにされる。
そして、ユーザは、パソコン2や携帯通信端末3を通じて地図サーバ1にアクセスし、地図を作成する目的とする地域(日本国内の地域)と注記データの言語(注記データを表現する言語の種別)とを指定して、地図の提供を要求する。当該要求に応じて地図サーバ1は、要求された地域の地図を描画するための地図データと、当該地域の地図に含める注記データであって、要求された言語に翻訳した注記データとを要求元のパソコン2や携帯通信端末3に送信する。ここで、地図データは緯度、経度情報が付加された地図の描画データ(ベクトルデータやラスターデータ等)である。また、注記データは、緯度、経度情報が付加された文字データである。
これにより、パソコン本体21では、提供された地図データと注記データとを緯度、経度情報を基準に用いて地図の表示画像を描画し、これをディスプレイ装置22の表示画面に表示する。同様に、携帯通信端末3では、提供された地図データと注記データとを緯度、経度情報を基準に用いて地図の表示画像を描画し、これを表示部313の表示画面に表示する。
この場合、注記データは要求された言語に翻訳されているので、ユーザは目的とする言語に翻訳された注記データが表示された地図を表示して見ることができるようにされる。なお、上述のようにして表示された地図は、パソコン本体21に接続されたプリンタや携帯通信端末3に接続するようにされるプリンタなどを通じて印刷することもできるようにされる。
そして、この実施の形態の多言語対応地図提供システムの地図サーバ1では、予め用意されている日本語の注記データを要求された言語に適切かつ迅速に翻訳することができるようにしている。これにより、日本国内の地図であって、注記データが要求された言語によって適切に表現された地図を、外国人観光客等が手軽に利用することができるようにしている。
[多言語対応地図サーバ1の構成例]
次に、この実施の形態の地図サーバ1の構成例について説明する。図2は、この実施の形態の地図サーバ1の構成例を説明するためのブロック図である。
図2に示すように、地図サーバ1は、通信ネットワーク4への接続端子101、通信I/F102、地図データ提供部103、注記データ翻訳部104を備える。また、地図サーバ1は、地図データベース(以下、地図DBと略称する。)105、日本語注記データベース106(以下、日本語注記DBと略称する。)を備える。さらに、地図サーバ1は、言語別一般名詞接尾語辞書107、地域別漢字読み方辞書108、外来語辞書109、言語別汎用翻訳辞書110を備える。また、地図サーバ1は、地図サーバ1の各部を制御する制御部120を備える。
制御部120は、CPU(Central Processing Unit)121、ROM(Read Only Memory)122、RAM(Random Access Memory)123、EEPROM(Electrically Erasable and Programmable ROM)124が、CPUバス125を通じて接続されて構成されたコンピュータ装置である。ここでCPU121は、ROM122やEEPROM124に記憶されているプログラムを読み出して実行し、各部への制御信号を形成し、これを関係する各部に供給したり、また、各部からのデータを受信してこれを処理したりする。
ROM112は、CPU121によって実行される種々の処理プログラムや処理に必要となるデータが予め記憶されているものである。RAM123は、各種の処理において、処理の途中結果を一時記憶するなど、主に作業領域として用いられるものである。EEPROM124は、書き換え可能ないわゆる不揮発性メモリであり、電源が落とされても保持しておくべきデータを記憶保持する。具体的に、EEPROM124は、機能追加のための新たなプログラム、各種設定パラメータなどを記憶保持する。
通信ネットワーク4への接続端子101は、通信ネットワーク4との接続端部を形成する。すなわち、接続端子101を通じて、当該地図サーバ1が通信ネットワーク4に接続される。通信I/F102は、通信ネットワーク4を通じて送信されてくる地図の提供要求など、自機宛の種々の情報を受信し、これを自機において処理可能な形式の情報に変換して制御部120に供給する。また、通信I/F102は、要求された地図データなど、制御部120を通じて供給される送信用の種々の情報を、通信ネットワーク4に送出する形式の信号に変換して、これを通信ネットワーク4に送出する。このように、接続端子101と通信I/F102とは、通信ネットワーク4を通じて種々の情報の送受信を実現する部分である。
地図データ提供部103は、制御部120に制御され、接続端子101及び通信I/F102を通じて受け付けた要求に応じて、要求された地域の地図を描画するための地図データを後述する地図DB105から抽出し、これを要求元に提供する。注記データ翻訳部104は、制御部120に制御され、接続端子101及び通信I/F102を通じて受け付けた要求に応じて、要求された地域の地図に含める日本語注記データを要求に応じた言語に翻訳し、これを要求元に提供する。翻訳対象の日本語の注記データは、後述する日本語注記DB106から抽出される。そして、これら地図データ提供部103と注記データ翻訳部104とにより、要求された地域の要求された言語に対応した地図を描画するための地図データと翻訳した注記データとを提供する機能を実現する。
地図DB105、日本語注記DB106、言語別一般名詞接尾語辞書107、地域別漢字読み方辞書108、外来語辞書109、言語別汎用翻訳辞書110のそれぞれは、大容量記録媒体上に作成され、制御部120を通じてアクセス可能にされている。ここで、大容量記録媒体は、例えば、ハードディスク、DVD(Digital Versatile Disc)などの光ディスク、半導体メモリなどである。なお、上記の各データベースや辞書は、例えば、通信ネットワーク4上に設けられた他のサーバ装置に設けるようにし、これを地図サーバ1が、制御部120、接続端子101、通信I/F102を通じて利用するように構成することもできる。
そして、地図DB105は、この実施の形態においては、日本全国の地図を描画するための例えばベクトルデータやラスタデータ等の地図データ(地図用の描画データ)を緯度・経度情報に対応付けて記憶保持する。なお、この実施の形態において、地図DB105に蓄積されている地図データは、例えば、道路、鉄道、河川、山岳、施設、住宅などの所定の種別毎(レイヤ毎)に形成されている。すなわち、地図データは、いわゆるレイヤ構造(階層構造)とされている。また、地図DB105に蓄積されている地図データは、緯度・経度に基づいて地域をほぼ同じ大きさの網の目状の領域(メッシュ)に分けて構成するようにされている。これにより、日本地図から要求された地域の地図を切り取るようにして、当該要求された地域の地図のみを提供することができるようにしている。
日本語注記DB106は、描画される地図上に表示する、例えば道路の名称、交差点の名称、鉄道路線の名称、駅の名称、河川の名称、橋梁の名称、山岳の名称、店舗や施設の名称などの種々の日本語の注記データを緯度・経度情報に対応付けて記憶保持する。日本語注記DB106に記憶保持されている注記データもまた、地図データと同様に、所定の種別毎(レイヤ毎)に形成されて、いわゆるレイヤ構造とされていると共に、緯度・経度に基づいた所定のメッシュに分けて構成するようにされている。これら地図DB105の地図データと日本語注記DB106の日本語注記データとによって、日本語版の日本地図を描画することができるようにされる。
そして、言語別一般名詞接尾語辞書107、地域別漢字読み方辞書108、外来語辞書109、言語別汎用翻訳辞書110が、多言語に対応した日本地図を提供するために、上述した注記データ翻訳部104によって用いられる翻訳用の辞書群である。
ここで、言語別一般名詞接尾語辞書107は、日本語の一般名詞に付けられる種々の接尾語を各言語に変換するための辞書であり、日本語の接尾語と、これに対応する各言語の単語とを関連付けて記憶保持するものである。そして、この実施の形態において接尾語は、日本語の接尾語として学術的に厳密に定義されるものに限られない。例えば「○○駅」、「○○店」、「○○川」、「○○山」、「○○小学校」、「○○邸」、「○○ビル」、「○○公民館」、「○○市役所」など、地図上に注記として表記される種々の一般名詞に付加される「駅」、「店」、「川」、「山」、「小学校」、「邸」、「ビル」、「公民館」、「市役所」などの種々のものが含まれる。そして、この実施の形態においては、中国語、韓国語、英語、ドイツ語、…などの多数の言語の一般名詞接尾語辞書が用意されている。
地域別漢字読み方辞書108は、予め決められる地域毎に、主に地名などであって、その地域で特有の読み方をする漢字とその読み方とを、あるいは、同じ表記でも他の地域とは異なる読み方をする漢字とその読み方とを対応付けて記憶保持するものである。ここで、予め決められる地域は、例えば行政界によって決められる地域である。行政界は、行政区画の境をいい、都府県界、北海道の支庁界、郡市・東京都の区界および町村・政令市の区界などである。この実施の形態において、地域別漢字読み方辞書108は、少なくとも、都道府県毎に形成されているものである。なお、例えば、同一県内であっても、同じ漢字で読み方の異なる地域がある場合には、その県内が、例えば、群、市町村、区などにさらに細分化される。
外来語辞書109は、地図の注記文字として用いられる外来語と、その外来語の元の単語とを対応付けて記憶保持するものである。例えば、「ストア」と「store」、「レストラン」と「restaurant」、「サンデー」と「Sunday」などの種々のものが記憶保持されている。言語別汎用翻訳辞書110は、いわゆる機械翻訳を行う場合に用いられる言語別の汎用翻訳辞書である。この実施の形態においては、日本語から中国語への変換辞書(日中辞書)、日本語から英語への変換辞書(日英辞書)、日本語からドイツ語への変換辞書(日独辞書)、…等、日本語から他の種々の言語への変換辞書からなっている。
そして、この実施の形態の地図サーバ1の注記データ翻訳部104は、地図の日本語の注記データについて、単に言語別汎用翻訳辞書110だけを用いていわゆる機械翻訳を行うものではない。言語別一般名詞接尾語辞書107、地域別漢字読み方辞書108、外来語辞書109、言語別汎用翻訳辞書110を用いることによって、日本の注記データを目的する言語に適切に翻訳することができるようにしている。すなわち、注記データ翻訳部104は、上述した種々の辞書を使い分けることにより、日本語の注記データを日本語の特性を無視することなく、かつ、地図の注記としての本来の意味を損なうことなく、適切に種々の言語に翻訳することができるようにしている。このような種々の辞書を用いた注記データ翻訳部104における注記データの翻訳処理の詳細については後述する。
なお、図2においては、二重線で示した地図データ提供部103と注記データ翻訳部104とは、制御部120から独立した処理部分として示している。しかし、これに限るものではない。地図データ提供部103と注記データ翻訳部104との一方または両方は、制御部120のCPU121において実行されソフトウェア(プログラム)により、制御部120の機能として実現することもできる。
[パソコン2の構成例]
次に、この実施の形態の地図サーバ1にアクセス可能なパソコン2の構成例について説明する。図3は、この実施の形態で用いられるパソコン2の概略構成を説明するためのブロック図である。この実施の形態のパソコン2は、パソコン本体21と、ディスプレイ装置22と、キーボード23と、マウス24と、図1には示さなかったがスピーカ装置25とから構成される。
パソコン本体21は、図3に示すように、通信ネットワーク4への接続端子201と、通信I/F202と、ハードディスクドライブ(以下、HDDと略称する。)203と、制御部210とからなっている。制御部210は、図示しないが、CPU、ROM、RAM、EEPなどがCPUバスを通じて接続されて構成されたコンピュータ装置である。
そして、ユーザは、キーボード23やマウス24を通じて操作入力を行うことにより、制御部210において種々のアプリケーションプログラムを実行し、種々の情報処理を行うことができるようにされる。例えば、通信I/F202、接続端子201を通じて通信ネットワーク4上のサーバ装置にアクセスし、Webページをディスプレイ装置22の表示画面に表示して閲覧することができるようにされる。同様にして、パソコン2は、通信ネットワーク4上のサーバ装置にアクセスし、目的とする情報のアップロードやダウンロードをすることもできるようにされる。もちろん、電子メールの作成、送信、電子メールの受信、閲覧などを行うこともできる。また、HDD203のハードディスクに蓄積されている画像情報や音声情報を、ディスプレイ装置22やスピーカ装置25を通じて出力することもできる。
そして、この実施の形態のパソコン2は、ユーザからの操作入力に応じて、地図サーバ1にアクセスし、日本地図の内の目的とする地域の地図を描画するための地図データや当該地域の注記データの提供を受けることができるものである。なお、注記データは、パソコン2のユーザの操作入力に応じて、目的とする言語に翻訳されたものが提供される。
そして、パソコン2は、提供を受けた地図データや注記データを用いて地図を描画し、これをディスプレイ装置22の表示画面に表示することができるものである。また、パソコン2は、ユーザから操作入力に応じて、表示した地図を、パソコン本体21に接続される図示しないプリンタから出力するなどのこともできる。このように、パソコン2は、パソコン本体21が周辺機器と協働し、ユーザからの操作入力(指示入力)に応じた種々の情報処理を行うことができるものである。
[携帯通信端末3の構成例]
次に、この実施の形態の地図サーバ1にアクセス可能な携帯通信端末3の構成例について簡単に説明する。図4は、この実施の形態で用いられる携帯通信端末3の概略構成を説明するためのブロック図である。この実施の形態の携帯通信端末3は、上述もしたように、スマートフォンなどと呼ばれる高機能携帯電話端末である。
図4に示すように、携帯通信端末3は、通信機能を実現する部分として、送受信アンテナ301、送受信処理部302、受話器(スピーカ)303、送話器(マイクロホン)304を備えている。また、携帯通信端末3は、ユーザインターフェースを実現する部分として、キー操作部311、表示制御部312、表示部313、音声処理部314、スピーカ315を備えている。さらに、携帯通信端末3は、GPS部321とGPSアンテナ322とを備えると共に、各部を制御する制御部320を備えている。
ここで、制御部320は、図示しないが、CPU、ROM、RAM、EEPROM等が、CPUバスを通じて接続されて形成されたコンピュータ装置である。表示部313は、例えば、有機ELディスプレイ(organic electroluminescence display)やLCD(Liquid Crystal Display)等のいわゆる薄型の表示素子が用いられて構成されたものである。また、音声処理部314とスピーカ315とは、着信音や警告音、その他の音声メッセージ等を出力するためのものである。
なお、図4においては、キー操作部311と表示部313とは別々に示しているが、表示部313の表示画面上にはいわゆるタッチパネルが設けられており、表示部313に表示される情報とタッチパネルとにより、キー操作部311が構成されている。もちろん、携帯通信端末3の筐体にハードウェアキーを設けることも可能である。また、GPS部321とGPSアンテナ322とは、複数のGPS衛星からの測位情報を受信して解析することにより、自機の現在位置を正確に検出(測位)する部分である。
そして、携帯通信端末3は、制御部320と送受信処理部302とが協働し、目的とする相手先に対して電話をかけて通話したり、自機にかかってきた電話に応答して通話したりすることができる。また、ユーザは、キー操作部311を通じて操作入力を行うことにより、制御部330において種々のアプリケーションプログラムを実行し、種々の情報処理を行うこともできる。
例えば、送受信処理部302及び送受信アンテナ301を通じて通信ネットワーク4上のサーバ装置にアクセスし、Webページを制御部330、表示制御部312を通じて表示部313に表示して閲覧することができる。また、同様にして、通信ネットワーク4上のサーバ装置にアクセスし、目的とする情報のアップロードやダウンロードをすることもできる。もちろん、電子メールの作成、送信、電子メールの受信、閲覧なども行うことができる。
そして、携帯通信端末3もまた、キー操作部311を通じて受け付けたユーザからの操作入力に応じて、地図サーバ1にアクセスし、日本地図の内の目的とする地域の地図を描画するための地図データや当該地域の注記データの提供を受けることができるものである。なお、注記データは、携帯通信端末3のユーザの操作入力に応じて、目的とする言語に翻訳されたものが提供される。
そして、携帯通信端末3の制御部330は、提供を受けた地図データや注記データを用いて地図を描画し、これを表示制御部312を通じて表示部313の表示画面に表示することができるものである。このように、携帯通信端末3は、ユーザからの操作入力(指示入力)に応じた種々の情報処理を行うことができるものである。
[パソコン2や携帯通信端末3を用いた地図サーバ1の利用]
次に、パソコン2や携帯通信端末3を用いて地図サーバ1を利用する場合の処理について説明する。パソコン2や携帯通信端末3のどちらを用いてもほぼ同様にして地図サーバ1を利用することができる。この実施の形態の場合には、パソコン2や携帯通信端末3において、まず、Webページ閲覧ソフトウェアであるいわゆるブラウザを起動させる。そして、検索機能を用いて地図サーバ1を特定したり、あるいは、地図サーバ1に割り当てられ入るURL(Uniform Resource Locator)を用いたりして、通信ネットワーク4上の地図サーバ1にアクセスし、地図サーバ1が提供する地図サイト(Webページ)を閲覧できるようにする。
そして、地図サーバ1が提供する地図サイトに対して、ユーザが使用言語を選択することにより、当該選択した言語に対応した地図の検索用画面や地図表示用アプリケーションの提供を地図サーバ1から受けるようにする。図5は、地図の検索用画面の例を説明するための図である。図5Aは、ユーザが英語を使用言語として選択した場合に、地図サーバ1から提供される検索用画面の例を示す図であり、図5Bは、ユーザが中国語を使用言語として選択した場合に、地図サーバ1から提供される検索用画面の例を示す図である。
なお、図5に示した例は、携帯通信端末3の表示部313の表示画面313Gの大きさを想定しているが、パソコン2のディスプレイ装置22の表示画面22Gにも同様の表示がなされる。但し、パソコン2のディスプレイ装置22の表示画面22Gに地図の検索用画面が表示された場合、表示画面22Gの空きエリアには、例えばバナー広告などの種々の他の情報が表示される。
そして、パソコン2や携帯通信端末3を通じて、地図サーバ1が提供する地図サイトにアクセスし、使用言語として例えば英語が選択されたとする。この場合、図5Aに示すように、当該地図検索画面のタイトルTT、言語種別LGが英語表記で表示される。そして、日本地図中の目的とする地域を検索するためのキーワードの入力欄n1が設けられ、これに、住所、駅名、施設名、郵便番号などのキーワード情報の入力をすることができる。なお、住所、駅名、施設名、郵便番号などを目的とする地域の検索条件として利用可能であることの表示が英語でなされる。
また、当該地図検索画面の最下段には、OKアイコンとBKアイコンとが設けられ、OKアイコンが選択された場合であって、キーワード情報が入力されている場合には、当該キーワードと言語種別(この例の場合には英語を示す情報)を含む地図の提供要求が地図サーバ1に送信される。また、BKアイコンが選択された場合には、当該地図サイトを離れ、例えば、ブラウザの初期画面(所定のポータルサイトの画面など)に戻るようにされる。
同様に、パソコン2や携帯通信端末3を通じて、地図サーバ1が提供する地図サイトにアクセスし、使用言語として例えば中国語が選択されたとする。この場合、図5Bに示す用に、当該地図検索画面のタイトルTT、言語種別LGが中国語表記で表示される。そして、日本地図中の目的とする地域を検索するためのキーワードの入力欄n1が設けられ、これに、住所、駅名、施設名、郵便番号などのキーワード情報の入力をすることができる。なお、住所、駅名、施設名、郵便番号などを目的とする地域の検索条件として利用可能であることの表示が中国語でなされる。また、当該地図検索画面の最下段に設けられたOKアイコンとBKアイコンとの機能は、図5Aに示した英語表記の検索画面の場合と同じである。
この他、韓国語やドイツ語などの他の言語が使用言語として選択された場合にも、表記に用いる言語がその選択された言語となり、図5A、Bに示した態様の地図の検索用画面が地図サーバ1から要求元の通信端末に対して提供されて、使用可能にされる。
そして、図5に示したような地図の検索用画面を通じて入力するようにされた検索用キーワードと言語種別とを含む地図の提供要求が、パソコン2や携帯通信端末3から地図サーバ1に送信されてきたとする。この場合、地図サーバ1では、制御部120が検索キーワードに基づいて、目的とする地域が特定される。そして、地図データ提供部103が機能し、目的とする地域の地図データを地図DB105から抽出し、これを要求元に提供する。同時に、注記データ翻訳部104が機能し、当該地域の地図に含められる日本語の注記データを日本語注記DB106から抽出して、これを選択された言語に翻訳し、翻訳した注記データを要求元に提供する。
これにより、パソコン2あるいは携帯通信端末3は、地図サーバ1から提供された地図の描画アプリケーションを用いて、地図サーバ1からの地図データと翻訳された注記データとを用いて地図を描画する。このようにして描画された地図は、パソコン2のディスプレイ装置22の表示画面22Gや携帯通信端末3の表示部313の表示画面313Gに表示され、ユーザに提供される。
[日本語の注記データの翻訳処理の詳細]
次に、この実施の形態の地図サーバ1において行われる注記データの翻訳処理について具体的に説明する。上述もしたように、この実施の形態の地図サーバ1においては、地図データ提供部103が、要求された地域の地図データを制御部120を通じて地図DB105から抽出し、これを要求元に提供する。また、注記データ翻訳部104が、要求された地域の日本語の注記データを制御部120を通じて日本語注記DB106から抽出し、これを要求された言語に翻訳して要求元に提供する。これら地図データと翻訳された注記データとが用いられて、上述したように、要求元において目的する地域の地図が描画され、利用することができるようにされる。
そして、この実施の形態の地図サーバ1において、注記データ翻訳部104は、上述した種々の辞書群を用いて、正確かつ迅速に日本語の注記データを目的とする言語に翻訳することができるようにしている。図6は、地図サーバ1の注記データ翻訳部104において行われる注記データの翻訳処理の詳細を説明するためのブロック図である。
図6に示すように、注記データ翻訳部104は、抽出部104Aと、接尾語翻訳部104Bと、外来語翻訳部104Cと、第1の翻訳部104Dと、第2の翻訳部104Eとを備えた構成となっている。地図サーバ1の制御部120は、ユーザからの地図の提供要求を受け付けると、当該提供要求に含まれるキーワード情報に基づいて、要求された地域を特定する。そして、制御部120は、特定した地域を示す情報(地域情報)と、ユーザからの提供要求に含まれる注記データの言語を示す情報(言語情報)とを含む制御信号CTを注記データ翻訳部104に供給する。
注記データ翻訳部104においては、まず、抽出部104Aが機能し、制御部120からの地域情報に基づいて、その地域の日本語の注記データを日本語注記DB106から抽出する。すなわち、抽出部104Aは、翻訳対象となる日本語の注記データを抽出する。次に、注記データ翻訳部104においては、接尾語翻訳部104Bが機能し、抽出された日本語の注記データのそれぞれについて、接尾語が存在する場合には、これを言語別一般名詞接尾語辞書107を参照して、制御部120からの言語情報に応じた言語に翻訳する。
言語別一般名詞接尾語辞書107は、上述もしたように、言語毎に日本語の接尾語とこれに対応する当該言語の単語とが関連付けられて記憶保持されているものである。具体的には、図6に示すように、例えば、中国語についての一般名詞接尾語辞書は、日本語の「駅」、「山」、…等の接尾語に対して、対応する中国語の単語である「站」、「山」、…等の単語が関連付けられて形成されたものである。同様に、英語についての一般名詞接尾語辞書は、日本語の「駅」、「山」、…等の接尾語に対して、対応する英語の単語である「station」、「Mt.」、…等の単語が関連付けられて形成されたものである。韓国語やドイツ語などのその他の種々の言語についても、同様に構成されている。
そして、接尾語翻訳部104Bは、抽出された日本語の注記データの末尾部分について、指示された言語の一般名詞接尾語辞書107を参照し、対応する日本語の接尾語が存在した場合に、その日本語の接尾語に対応する当該指示された言語の単語を抽出する。すなわち、各言語の一般名詞接尾語辞書107には、種々の文字数の接尾語が登録されている。例えば、「高等専門学校」、「経済研究所」、…等の5文字の接尾語、「高等学校」、「芸術大学」、…等の4文字の接尾語、「中学校」、「小学校」…等の3文字の接尾語、「高校」、「会館」、…等の2文字の接尾語、「駅」、「山」、…等の1文字の接尾語が登録されている。
接尾語翻訳部104Bは、抽出された日本語の注記データの末尾5文字の部分、末尾4文字の部分というように、末尾部分の文字数を徐々に狭めながら、同じ文言(文字列)が選択された言語の一般名詞接尾語辞書に存在するか否かを確認していく。そして、同じ文言が存在することが確認できた場合に、その文言は接尾語であると判別することができる。もちろん、各言語の一般名詞接尾語辞書107に、6文字以上の接尾語が登録されている場合には、その文字数に応じた範囲で、接尾語の有無が確認される。
そして、接尾語が存在することが確認されると、その接尾語が選択された言語に翻訳される。例えば、抽出された日本語の注記データの末尾に接尾語「駅」が有ることが検出されたとする。この接尾語「駅」を中国語に翻訳する場合には、中国語の一般名詞接尾語辞書に基づいて、単語「站」が抽出される。また、抽出された日本語の注記データの末尾に、接尾語「山」が有ることが検出されたとする。この接尾語「山」を英語に翻訳する場合には、英語の一般名詞接尾語辞書に基づいて、単語「Mt.」が抽出される。
このようにして、日本語の注記データについては、始めに、接尾語翻訳部104Bによって、指示された言語の一般名詞接尾語辞書107が参照され、接尾語部分が当該指示された言語に翻訳される。なお、翻訳対象の日本語の注記データに接尾語が存在しない場合には、接尾語翻訳部104Bにおいて、翻訳処理が行われることはない。
次に、注記データ翻訳部104においては、外来語翻訳部104Cが機能し、日本語の注記データのそれぞれについて、カタカナ表記された外来語が存在する場合には、これを外来語辞書109を参照して、元の単語に変換する処理を行う。ここで、外来語辞書109は、上述もしたように、カタカナ表記された単語と、対応する元の言語の単語とを対応付けて作成したものである。
そして、外来語翻訳部104Cは、日本語の注記データの先頭から順に、カタカナ表記部分について外来語辞書109を参照し、そして、対応する外来語が存在した場合に、その外来語に対応する元の単語を抽出する。したがって、「サンデー○○店」については、「サンデー」部分について、本来の単語である「Sunday」が取得される。
これにより、例えば「サンデー○○店」を中国語に翻訳する場合に、「○○商店星期日」のように「サンデー」部分を「星期日」と意訳したり、「聖代○○店」のように「サンデー」部分を「聖代」と音訳したりすることがないようにすることができる。この例の場合、「サンデー○○店」を中国語に翻訳する場合、「Sunday 三沢商店」と翻訳することができる。「Sunday」は中国語ではないが、注記データの翻訳としては分かりやすいものとなる。また、「サンデー○○店」を英語に翻訳する場合であっても、「Misawa store Sunday」や「Sundae Misawa branch」などと翻訳されることなく、「Sunday Misawa Store」のように、日本語の注記データに対応した形で地図の注記に適した翻訳を行うことができるようにされる。
このようにして、抽出された日本語の注記データについては、接尾語の翻訳処理の後に、当該注記データの先頭から順にカタカナで表記された部分が検出される。そして、当該カタカナで表記された部分について、外来語翻訳部104Cによって、外来語辞書が参照され、カタカナ表記部分が元の単語に変換される。なお、翻訳対象の日本語の注記データにカタカナで表記された部分が存在しない場合には、外来語翻訳部104Cにおいて、翻訳処理(元の単語への変換処理)が行われることはない。
次に、注記データ翻訳部104においては、第1の翻訳部104Dが機能し、日本語の注記データのそれぞれについて、漢字表記部分について、地域別漢字読み方辞書108を参照して、当該漢字部分を正確な読み方の情報に変換する処理を行う。この場合、地図を作成する地域に対応する地域の地域別漢字読み方辞書108が参照される。
地域別漢字読み方辞書108は、例えば、都道府県別に、主に地理的表示などであって、その地域で特有の読み方をする漢字とその読み方とを、あるいは、同じ表記でも他の地域とは異なる読み方をする漢字とその読み方とを対応付けたものである。具体的に、地域別漢字読み方辞書108には、例えば、都道府県別であって、図6に示すように、地名、人名、駅名、施設名、山岳、河川、…などというように、注記データについての所定の種類別のレイヤに対応する複数の漢字読み方辞書が構成されている。
そして、例えば、埼玉県の地名レイヤに対応する漢字読み方辞書には、漢字「七里」は「ナナサト」と読み、栃木県の地名レイヤに対応する漢字読み方辞書には、漢字「七里」は「シチリ」と読むことが登録されている。この他にも、同じ漢字で異なる読み方をするものについては、読み方の異なる地域と注記データが示す対象物の種類(レイヤ)に応じた地域別漢字読み方辞書108に登録される。また、地域別漢字読み方辞書108においては、例えば、愛知県の駅名レイヤに対応する漢字読み方辞書には、漢字「本陣」は「ホンジン」と読むことも登録されている。
そして、第1の翻訳部104Dは、日本語の注記データの先頭から順に、漢字表記部分について、翻訳対象の注記データが含まれる地域の各レイヤに対応する地域別漢字読み方辞書を順に参照する。つまり、翻訳対象の注記データが含まれる地域の漢字読み方辞書について、地名レイヤ対応する漢字読み方辞書→人名レイヤに対応する漢字読み方辞書→駅名レイヤに対応する漢字読み方辞書…というように、複数の漢字読み方辞書を順次に参照する。
そして、対応する漢字表記が存在した場合に、その漢字部分に対応する読み方を取得する。したがって、埼玉県内の地図を作成する場合であって、注記データに漢字「七里」が含まれている場合には、埼玉県の地名レイヤに対応する漢字読み方辞書が参照されることにより「nanasato」という読み方の情報が取得される。また、栃木県内の地図を作成する場合であって、注記データに漢字「七里」が含まれている場合には、栃木県の地名レイヤに対応する漢字読み方辞書が参照されることにより「shichiri」という読み方の情報が取得される。また、愛知県内の地図を作成する場合であって、注記データに漢字「本陣」が含まれている場合には、愛知県の駅名レイヤに対応する漢字読み方辞書が参照されることにより「honjin」という読み方の情報が取得される。
このようにして、抽出された日本語の注記データについては、接尾語の翻訳、カタカナ表記部分の元の単語への変換の後においては、第1の翻訳部104Dによって、漢字部分が本来の読み方の情報に変換される。これにより、地域に応じて漢字の読み方を適切に特定することができる。また、上述もしたように、漢字「本陣」を例えば英語に翻訳する場合に、「headquarters」や「base」などというように、注記データが漢字本来の読み方と離れて意訳されてしまうことを防止することができるようにされる。
なお、地域別漢字読み方辞書108は、上述もしたように、所定の種類別にレイヤ構造とされている。このため、接尾語翻訳部104Bにおいて、接尾語として例えば「駅」を翻訳した場合には、対応する地域の地域別漢字読み方辞書108であって、駅名の漢字読み方辞書を優先的に参照するように制御することもできる。このように、接尾語翻訳部104Bの翻訳結果に基づいて、第1の翻訳部104Dにおいて優先的に参照する地域別漢字読み方辞書108を選択するようにしてもよい。また、翻訳対象の日本語の注記データの漢字部分漢字ついて、地域別漢字読み方辞書108に該当データが存在しない場合には、第1の翻訳部104Dにおいて、翻訳処理が行われることはない。
そして、注記データ翻訳部104においては、第1の翻訳部104Dの処理によっても、日本語の注記データについて未翻訳部分が残っている場合には、第2の翻訳部104Eが機能し、当該未翻訳部分について翻訳を行う。この場合、第2の翻訳部104Eは、言語別汎用翻訳辞書110を用いて、当該未翻訳部分を自然言語としていわゆる機械翻訳する。言語別汎用翻訳辞書110は、上述もしたように、日本語から他の種々の言語へ変換するための種々の辞書からなっている。
このように、接尾語翻訳部104B、外来語翻訳部104C、第1の翻訳部104Dを経ても翻訳できなかった部分は、第2の翻訳部104Eにより機械翻訳される。これにより、日本語の注記データの全体を日本語の注記データの特性を損なうことなく、適切に目的とする言語に翻訳することができるようにされる。
このようにして、注記データ翻訳部104において、指示された言語に翻訳するようにされた注記データCdが形成され、これが上述した地図データの提供と同様にして、要求元のユーザの通信端末に対して提供され、地図の描画に用いられるようにされる。
[注記データ翻訳部104の処理のまとめ]
次に、図6を用いて説明した注記データ翻訳部104において行われる処理の詳細について、図7のフローチャートを参照しながらまとめる。図7は、この実施の形態の地図サーバ1の注記データ翻訳部104において行われる処理の詳細を説明するためのフローチャートである。
図7に示す処理は、ユーザからの地図提供要求を受信した制御部120からの制御に応じて、注記データ翻訳部104において行われる処理を説明するためのフローチャートである。すなわち、接続端子101、通信I/F102を通じてユーザからの地図の提供要求を、制御部120が受け付けたとする。この場合、制御部120は、上述したように、地図の提供を指示された地域を示す情報(地域情報)と注記データの言語を示す情報(言語情報)を含み、要求された地域の注記データを提供することを指示する制御信号CTを注記データ翻訳部104に提供する。
当該制御信号CTの提供を受けた注記データ翻訳部104は、図7に示す処理を実行し、まず、注記データ翻訳部104の抽出部104Aが、地図の作成地域として指示された地域の日本語の注記データを日本語注記DB106から抽出する(ステップS101)。そして、接尾語翻訳部104Bが機能し、上述もしたように、指示された言語の一般名詞接尾語辞書107を用いて、翻訳対象の注記データの末尾部分について接尾語が存在するか否かを判別する処理を実行する(ステップS102)。
ステップS102の判別処理において、接尾語が存在すると判別したときには、接尾語翻訳部104Bは、当該接尾語について、当該指示された言語の一般名詞接尾語辞書107を用いて、当該注記データの接尾語を翻訳する(ステップS103)。なお、ステップS102の判別処理において、翻訳対象の注記データに接尾語は存在していないと判別したときには、ステップS103の処理を実行することなくステップS104の判別処理に進む。
次に、注記データ翻訳部104の外来語翻訳部104Cが機能し、翻訳対象の注記データの先頭から順にカタカナ表記された外来語が存在するか否かを判別する(ステップS104)。ステップS104の判別処理において、カタカナ表記された外来語部分が存在すると判別したときには、外来語翻訳部104Cは、当該外来語部分について、外来語辞書109を用いて、当該外来語部分を元の単語に変換する(ステップS105)。なお、ステップS104の判別処理において、翻訳対象の注記データにカタカナ表記された外来語部分は存在していないと判別したときには、ステップS105の処理を実行することなくステップS106の処理に進む。
次に、注記データ翻訳部104の第1の翻訳部104Dが機能し、接尾語部分やカタカナ表記された外来語部分を除く漢字部分について、地域別漢字読み方辞書108を用いて、当該漢字部分を正確な読み方の情報に変換する(ステップS106)。このステップS106の処理においては、翻訳対象の注記データが含まれる地域の各レイヤに対応する漢字読み方辞書のそれぞれが参照される。そして、翻訳対象の注記データにおいて、未翻訳の漢字部分がある場合には、当該未翻訳漢字部分を指示された言語の汎用翻訳辞書を用いて機械翻訳を行う(ステップS107)。
この後、注記データ翻訳部104は、ステップS101において抽出した全注記データについて、翻訳が完了したか否かを判別する(ステップS108)。ステップS108の判別処理において、抽出した全注記データの翻訳を完了していないと判別したときには、次に翻訳すべき注記データを翻訳対象とするように位置付け、ステップS102からの処理を繰り返す。
また、ステップS108の判別処理において、抽出した全注記データの翻訳を完了したと判別したときには、注記データ翻訳部104は、翻訳した注記データの全部を要求元のユーザの通信端末に送信する(ステップS110)。そして、この図7に示す処理を終了する。
なお、翻訳された注記データは、制御部120、通信I/F102、接続端子101を通じて通信ネットワーク4に送出され、要求元のユーザのパソコン2や携帯通信端末3などの通信端末に送信される。そして、要求元のユーザの通信端末では、翻訳された注記データと、地図データ提供部103の機能により提供された地図データとが用いられて、注記データが目的する言語とされた目的とする地域の地図を描画して表示し、利用することができるようにされる。
[第1の実施の形態の効果]
第1の実施の形態の地図サーバ1の注記データ翻訳部104では、地図に含める注記データを、(1)言語別一般名詞接尾語辞書107を用いた接尾語部分の翻訳、(2)外来語辞書109を用いた外来語部分の翻訳、(3)地域別漢字読み方辞書108を用いた漢字部分の翻訳を段階的に実行する。そして、上記(1)〜(3)の処理によっても翻訳できなかった未翻訳部分については、(4)未翻訳部分を言語別汎用翻訳辞書110を用いていわゆる機械翻訳する。
これにより、注記データを不正確な読み方の単語に翻訳したり、不必要な意訳をしたりすることなく、注記データをその注記データが持つ本来の表示内容を歪めることなく、正確に、目的する言語に翻訳することができる。したがって、日本を訪れる各国からの旅行者の方が、目的とする言語の適切な注記データが含められるようにされた日本の目的とする地域の地図を簡単かつ迅速に形成し、これを提供することができる。
すなわち、山や川の名称、駅名、地名、人名、施設名等の漢字名称に対して、地域要素を取り入れて、正確な読み方で翻訳することができる。また、日本語の特徴である一般名詞接尾語を利用して、施設名、地形名等に対して、いわゆる固有名詞を用いた翻訳より正確に翻訳することができる。また、地図注記特性を考えて、カタカナで表記される外来語は表音表記でなく、元の単語で代用する翻訳手法を用いることにより、注記データの持つ意味を損なうことなく、適切な翻訳ができる。
また、注記データは日本語の注記データだけを用意し、これを適切に保守しておくようにすればよいので、複数の言語の注記データを作成しておく場合に比べて、注記データの作成や保守の面で手間やコストを抑制することができる。
[第2の実施の形態]
上述したように、第1の実施の形態の地図サーバ1は、注記データ翻訳部104の機能によって、日本語の注記データを目的する言語の注記データに適切に翻訳することができるという顕著な効果を奏することができるものである。そして、接尾語について、さらに詳細に考察すると、その翻訳については新たな課題が存在していることが判明した。
すなわち、地図注記は意味さえ分かれば、できる限り短く表記する方法が採用されている場合がある。例えば、「東京大学」は「東大」、「商業高等学校」は「商高」、「浜中学校」は「浜中」、「日光小学校」は「日光小」などというように、省略して表記される場合がある。一方、地名、人名、店舗などの施設名などには、「雄大(ゆうだい)」、「日高(ひだか)」、「田中(たなか)」、「浜中(はまなか)」などの名称が存在する。このため、地図注記の末尾に「大」、「高」、「中」、「小」といった文字が存在する場合、それが接尾語なのか、一般名詞の一部なのかの判別ができないために、正確に翻訳することができない場合があると考えられる。
また、「○○公民館」、「○○小学校」などのように、3文字以上で構成された接尾語の場合には、接尾語として認識することに問題は生じない。しかし、「山」、「川」、「イン」などの1文字または2文字で構成される文言(文字列)の場合、接尾語である場合と、一般名詞の一部である場合の両方が存在する。例えば、「高尾山(たかおさん)」の場合の「山」は接尾語であるが、「尾山(おやま)」の場合の「山」は人名の一部である場合もある。また、ホテルなどを意味する「○○イン」の場合の「イン」は接尾語として「Inn」と翻訳すべきであるが、道路の名称などに用いられる「スカイライン」の場合の「イン」は一般名詞の一部である。
このように、注記データの末尾部分の1文字または2文字は、接尾語である場合もあれば、一般名詞の一部である場合もある。このため、注記データの末尾部分の1文字または2文字と同じ文言が一般名詞接尾語辞書107に存在するからといって、それをそのまま接尾語として翻訳することができない場合がある。そこで、この第2の実施の形態においては、注記データの末尾部分の1文字、2文字が接尾語であるか否かを正確に判別して、接尾語の翻訳をより正確に行うことができるようにしている。
なお、この第2の実施の形態においても、説明を簡単にするため、図1を用いて上述した第1の実施の形態の多言語対応地図提供システムの地図サーバ1に、この発明を適用した場合を例にして説明する。したがって、この第2の実施の形態においても、地図サーバ1は、図2、図6を用いて説明した構成を有し、ネットワーク4を通じて地図サーバ1に接続可能なパソコン2、携帯通信端末3は、図3、図4を用いて説明した構成を有するものとして説明する。したがって、必要に応じて、図2、図6等の図面をも参照しながら、この第2の実施の形態の地図サーバ1の詳細について説明する。
そして、この第2の実施の形態においては、注記データの接尾語の翻訳をより正確に行うために、注記データがレイヤ構造を持つことに着目した実施例1と、接尾語別固有名詞辞書を用いる実施例2の2つの実施例について具体的に説明する。図8は、注記データがレイヤ構造を持つことに着目した実施例1の概要を説明するための図であり、図9は、接尾語別固有名詞辞書を用いる実施例2の概要を説明するための図である。
[第2の実施の形態の実施例1の詳細]
上述もしたように、日本語注記DB106は、描画される地図上に表示する種々の日本語の注記データを緯度・経度情報に対応付けて記憶保持するが、注記データは所定の種別毎(レイヤ毎)にまとめられたいわゆるレイヤ構造とされている。具体的には、図8に示すように、日本語の注記データのそれぞれは、教育機関名称レイヤ106(1)、山岳名称レイヤ106(2)、河川名称レイヤ106(3)、…、鉄道名称レイヤ106(n)等の種々のレイヤのいずれかに属する構成とされている。したがって、日本語注記DB106に記憶保持されている注記データのそれぞれは、どの名称レイヤ(注記レイヤ)に属するものであるかの情報をも有している。
そして、翻訳対象の注記データの末尾部分の1文字または2文字が、言語別一般名詞接尾語辞書107に存在するものである場合には、当該注記データが属するレイヤの種別を参照し、当該注記データの末尾の1文字または2文字の部分が接尾語か否かを判別する。すなわち、翻訳対象の注記データの末尾の1文字が、「大」、「高」、「中」、「小」などであったとする。この場合、当該注記データが、教育機関名称レイヤ106(1)に属するものである場合には、当該注記データの末尾の1文字は接尾語であると判別する。また、当該注記データが、住宅名称(個人名称)レイヤや施設名称レイヤに属するものである場合には、当該注記データの末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
同様に、翻訳対象の注記データの末尾の1文字が、「山」であり、当該注記データが、山岳名称レイヤ106(2)に属するものであって場合には、当該注記データの末尾の1文字は接尾語であると判別する。しかし、当該注記データが他のレイヤに属するものである場合には、当該注記データの末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
また、翻訳対象の注記データの末尾の1文字が、「川」であり、当該注記データが、河川名称レイヤ106(3)に属するものであって場合には、当該注記データの末尾の1文字は接尾語であると判別する。しかし、当該注記データが他のレイヤに属するものである場合には、当該注記データの末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
また、翻訳対象の注記データの末尾の2文字が、「イン」であり、当該注記データが、ホテルなどが属する施設名称レイヤに属するものであって場合には、当該注記データの末尾の2文字は接尾語であると判別する。しかし、当該注記データが他のレイヤに属するものである場合には、当該注記データの末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
このように、翻訳対象の注記データの末尾の1文字または2文字が、言語別一般名詞接尾語辞書107に存在し、接尾語が一般名詞の一部か分からない場合に、当該注記データが属するレイヤの種別を判別する。これにより、当該注記データの末尾の1文字または2文字が接尾語か一般名詞の一部かを明確に判別することができる。
なお、上述した翻訳対象の注記データの末尾の1文字が、「大」、「高」、「中」、「小」である場合や翻訳対象の注記データの末尾の1文字または2文字が、「山」、「川」、「イン」である場合は一例である。したがって、接尾語になり得る1文字または2文字の種々の文言について、接尾語になる場合のレイヤと一般名詞の一部になる場合のレイヤの対応付けを事前に行っておく。そして、当該対応付けをEEPROM124に登録しておき、CPU121で実行されるプログラムで参照できるようにしたり、また、CPU121において実行されるプログラム中に記載しておくようにしたりする。このようにすることによって、接尾語になり得る1文字または2文字の種々の文言について、接尾語か否かの判別を適切に行うことができる。
次に、この第2の実施の形態の実施例1の場合において、地図サーバ1の図6に示した構成を有する注記データ翻訳部104での処理の詳細について、図10のフローチャートを参照しながら説明する。図10は、この第2の実施の形態の実施例1において、地図サーバ1の注記データ翻訳部104において行われる処理の詳細を説明するためのフローチャートである。
図10において、図7を用いて説明した第1の実施の形態の注記データ翻訳部104において行われる処理と同様に行われる処理(ステップ)には、同じステップ番号を付し、その部分の説明は重複するので省略する。そして、図10と図7とを比較すると分かるように、この第2の実施の形態の実施例1の場合においては、ステップS102とステップS103との間に、ステップS201A〜ステップS203Aの3つの処理(ステップ)が設けられている点が、図7に示したフローチャートとは異なる点である。
すなわち、この第2の実施の形態の実施例1において、注記データ翻訳部104の接尾語翻訳部104Bは、ステップS102において、翻訳対象の注記データの末尾部分に接尾語が存在する(接尾語の候補となるものが存在する)と判別したとする。この場合、接尾語翻訳部104Bは、即座に接尾語の翻訳を行うのではなく、その接尾語の候補が一般名詞の可能性があるか否かを判別する(ステップS201A)。
具体的に、ステップS201Aにおいては、確認された(抽出された)接尾語の候補が、1文字または2文字である場合には、当該接尾語の候補は一般名詞の可能性があると判別する。したがって、確認された接尾語の候補が、3文字以上である場合には、当該接尾語の候補は接尾語であると判別することになる。
このため、ステップS201Aの判別処理において、確認された接尾語の候補が、一般名詞ではない(3文字以上である)と判別した場合には、当該接尾語の候補を接尾語としてステップS103において翻訳処理する。これに対して、ステップS201Aにおいて、確認された接尾語の候補が、一般名詞の可能性があると判別した場合には、接尾語翻訳部104Bは、当該接尾語の候補を含む注記データが属するレイヤの種別を確認する(ステップS202A)。そして、ステップS202Aの確認の結果得られる、当該接尾語の候補を末尾部分に含む翻訳対象の注記データが属するレイヤの種別に基づいて、当該接尾語の候補は一般名詞の一部か否かを判別する(ステップS203A)。
このステップS203Aの判別処理は、上述もしたように、予め決められる接尾語の候補と、当該接尾語の候補を含む注記データが属するレイヤの種別との関係から、当該接尾語の候補が、接尾語か一般名詞の一部かを判別する処理である。したがって、接尾語の候補が「大」、「高」、「中」、「小」などである場合には、当該接尾語の候補を末尾部分に含む注記データが属するレイヤが教育機関名称レイヤ106(1)か否かを判別する処理がステップS203Aの処理である。
この場合、当該接尾語の候補を末尾部分に含む注記データが属するレイヤが教育機関名称レイヤではないときには、当該接尾語の候補は一般名詞の一部であると判別する。また、当該接尾語の候補を末尾部分に含む注記データが属するレイヤが教育機関名称レイヤであるときには、当該接尾語の候補は一般名詞の一部でない、すなわち、接尾語であると判別する。
同様に、ステップS203Aにおいては、接尾語の候補が「山」である場合には、当該接尾語の候補を末尾部分に含む注記データが属するレイヤは、山岳名称レイヤ106(2)か否かを判別する。また、接尾語の候補が「川」である場合には、当該接尾語の候補を末尾部分に含む注記データが属するレイヤは、河川名称レイヤ106(3)か否かを判別する。
そして、ステップS203Aの判別処理において、当該接尾語の候補は一般名詞の一部ではないと判別した場合には、ステップS103において当該接尾語の候補を接尾語として翻訳処理する。これに対して、ステップS203Aにおいて、当該接尾語の候補が一般名詞の一部であると判別した場合には、接尾語の翻訳処理は行わず、ステップS104からの処理を行う。
これにより、翻訳対象の注記データの末尾部分に、接尾語の候補が存在する場合に、その接尾語の候補が本当に接尾語か否かを正確に判別することができる。したがって、注記データの末尾部分に含まれる文言が、真に接尾語である場合においてのみ、接尾語の翻訳を行うことができる。
なお、ここでは、接尾語の候補が、「大」、「高」、「中」、「小」、「山」、「川」である場合を例にして説明したが、これに限るものではない。1文字または2文字の種々の接尾語と、当該1文字または2文字の種々の接尾語が属する名称レイヤとの対応付けを予め行っておくことにより、1文字または2文字の種々の接尾語について適切に翻訳することができる。
[第2の実施の形態の実施例2の詳細]
ところで、日本語注記DB106が、レイヤ構造とされていない場合もあると考えられる。このような場合には、上述した第2の実施の形態の実施例1の方式は採用できない。そこで、接尾語別の固有名詞辞書を用いるようにするのが、第2の実施の形態の実施例2である。
すなわち、図9に示すように、接尾語別固有名詞辞書111を例えば地図サーバ1に設ける。この接尾語別固有名詞辞書111は、末尾部分の1文字または2文字が接尾語である種々の名称(固有名詞)を、その接尾語毎に集めたものである。具体的には、図9に示すように、末尾が「山」である全国の山岳名称辞書111(1)、末尾が「川」である全国の河川名称辞書111(2)、末尾が「湖」または「沼」である全国の湖沼名称辞書111(3)、末尾が「大」、「高」、「中」、「小」等である全国の教育機関名所辞書など、種々の接尾語を有する固有名詞辞書を形成しておく。
そして、翻訳対象の注記データの末尾部分の1文字または2文字が、言語別一般名詞接尾語辞書107に存在するものである場合には、当該注記データが当該接尾語に対応する固有名詞辞書111(n(nは1以上の整数))に存在するか否かを判別する。例えば、注記データが「高尾山」である場合、接尾語の候補として「山」が抽出される。この場合、注記データである「高尾山」と言う文言が、末尾が「山」である全国の山岳名称辞書111(1)に存在するか否かを判別する。そして、注記データ「高尾山」が山岳名称辞書111(1)に存在する場合には、当該接尾語の候補「山」は接尾語であると判別し、存在しない場合には、当該接尾語の候補「山」は一般名詞の一部であると判別する。
なお、翻訳対象の注記データの末尾の1文字または2文字が、「大」、「高」、「中」、「小」、「川」、「イン」などである場合についても同様に、接尾語別の固有名詞辞書を用いて接尾語か否かの判別を行うことができる。もちろん、これらは一例であり、接尾語になり得る1文字または2文字の種々の文言別(接尾語別)に、固有名詞辞書を整備しておくことにより、接尾語になり得る1文字または2文字の種々の文言について、接尾語か否かの判別を適切に行うことができる。
次に、この第2の実施の形態の実施例2の場合において、地図サーバ1の図6に示した構成を有する注記データ翻訳部104での処理の詳細について、図11のフローチャートを参照しながら説明する。図11は、この第2の実施の形態の実施例2において、地図サーバ1の注記データ翻訳部104において行われる処理の詳細を説明するためのフローチャートである。
この実施例2の図11においても、図7を用いて説明した第1の実施の形態の注記データ翻訳部104において行われる処理と同様に行われる処理(ステップ)には、同じステップ番号を付し、その部分の説明は重複するので省略する。そして、図11と図7とを比較すると分かるように、この第2の実施の形態の実施例2の場合においては、ステップS102とステップS103との間に、ステップS201A、ステップS202B、ステップS203Bの3つの処理(ステップ)が設けられている点が、図7に示したフローチャートとは異なる点である。
すなわち、この第2の実施の形態の実施例1において、注記データ翻訳部104の接尾語翻訳部104Bは、ステップS102において、翻訳対象の注記データの末尾部分に接尾語が存在する(接尾語の候補となるものが存在する)と判別したとする。この場合、接尾語翻訳部104Bは、即座に接尾語の翻訳を行うのではなく、その接尾語の候補が一般名詞の可能があるか否かを判別する(ステップS201A)。
このステップS201Aの判別処理を、図10を用いて説明した第2の実施の形態の実施例1におけるステップS201Aの処理と同様に行われる処理である。すなわち、ステップS201Aにおいては、確認された(抽出された)接尾語の候補が、1文字または2文字である場合には、当該接尾語の候補は一般名詞の可能性があると判別する。したがって、確認された接尾語の候補が、3文字以上である場合には、当該接尾語の候補は接尾語であると判別することになる。
このため、ステップS201Aの判別処理において、確認された接尾語の候補が、一般名詞ではない(3文字以上である)と判別した場合には、当該接尾語の候補を接尾語としてステップS103において翻訳処理する。これに対して、ステップS201Aにおいて、確認された接尾語の候補が、一般名詞の可能性があると判別した場合には、接尾語翻訳部104Bは、当該接尾語の候補を末尾部分に有する固有名詞が登録された固有名詞辞書111を参照し、当該翻訳対象の注記データが存在するか否かを確認する(ステップS202B)。
このステップS202Bの確認処理においては、第1の実施の形態において、接尾語の有無の判別を行う場合と同様に、参照される固有名詞辞書111(n)に登録されている文字数の大きな固有名から順に検索対象とされる。例えば、翻訳対象の注記データが8文字であり、参照される固有名詞辞書111(n)に、6文字〜2文字の固有名詞が登録されているとする。
この場合、まず、当該翻訳対象の注記データの末尾6文字部分を用いて、参照対象の固有名詞辞書111(n)を参照する。当該6文字部分が、当該固有名詞辞書111(n)に存在しない場合には、当該翻訳対象の注記データの末尾5文字部分を用いて、参照対象の固有名詞辞書111(n)を参照する。このように、対象文字数分の注記データが当該固有名詞辞書111(n)に存在しない場合には、翻訳対象の注記データの末尾に文字数を1文字ずつ少なくしながら、翻訳対象の注記データが接尾語別の固有名詞辞書に存在するか否かを確認していく。
そして、ステップS202Bの確認の結果、翻訳対象の注記データが、あるいは、翻訳対象の注記データの所定文字数の末尾部分が、接尾語別の固有名詞辞書111(n)に存在するか否かに応じて、当該接尾語の候補が一般名詞の一部か否かを判別する(ステップS203B)。
すなわち、ステップS202Bでの確認の結果が、翻訳対象の注記データが、あるいは、翻訳対象の注記データの所定文字数の末尾部分が、接尾語別の固有名詞辞書111(n)に存在しないことを示しているとする。この場合、ステップS203Bにおいては、当該接尾語の候補は、接尾語ではなく、一般名詞の一部であると判別する。また、ステップS202Bでの確認の結果が、翻訳対象の注記データが、あるいは、翻訳対象の注記データの所定文字数の末尾部分が、接尾語別の固有名詞辞書111(n)に存在することを示しているとする。この場合、ステップS203Bにおいては、当該接尾語の候補は、一般名詞の一部ではなく、接尾語であると判別する。
そして、ステップS203Bの判別処理において、当該接尾語の候補は一般名詞の一部ではないと判別した場合には、ステップS103において当該接尾語の候補を接尾語として翻訳処理する。これに対して、ステップS203Bにおいて、当該接尾語の候補が一般名詞の一部であると判別した場合には、接尾語の翻訳処理は行わず、ステップS104からの処理を行う。
これにより、翻訳対象の注記データの末尾部分に、接尾語の候補が存在する場合に、その接尾語の候補が本当に接尾語か否かを正確に判別することができる。したがって、注記データの末尾部分に含まれる文言が、真に接尾語である場合においてのみ、接尾語の翻訳を行うことができる。
なお、この第2の実施の形態の実施例2の場合、翻訳対象の注記データの文字数が少ない場合に、末尾の文字が接尾語か一般名詞の一部かの判別ができない場合もある。例えば、福岡県、新潟県、静岡県には、「西川」という河川名が存在するが、「西川」という苗字や店舗などの施設名も存在する。このように、注記データの文字数が少ない場合に限り、接尾語か一般名詞の一部かの区別ができない場合もある。
しかし、この第2の実施の形態の実施例2の方式は、上述もしたように、日本語注記DB106がレイヤ構造でない場合などにおいて、注記データの末尾部分が接尾語か否かを判別する上で有効なものである。
[接尾語か否かの判別の他の例]
上述した地図サーバ1のように、地図データの提供を行うサーバ装置等においては、地図上に表現される種々の拠点(POI:point of interest)についての情報をデータベース化したPOIデータベースを備えている場合もある。POIは、誰かが便利あるいは興味のある所と思った特定の場所のことである。
そして、POIデータベースには、例えば、大学、高校、中学校、小学校、店舗や会社などの施設、さらには、山、川、道路などの種々の場所などのいわゆる拠点についての種々の情報が蓄積される。具体的には、その特定の場所(POI)の緯度・経度、名称、住所、ジャンル、メッシュコードなどの情報が蓄積される。ここで、POIのジャンルは、その場所が、例えば、大学や高校であったり、山や川や道路であったりするなどのことを示す情報である。
そして、上述もしたように、地図の注記データには、緯度・経度も対応付けられている。このため、翻訳対象の注記データが1文字あるいは2文字の接尾語の候補を含む場合、その注記データに対応付けられた緯度・経度をキー情報として用いてPOIデータベースを参照し、その場所のジャンルを取得する。そして、取得したその場所のジャンルに基づいて、翻訳対象の注記データの末尾部分の1文字または2文字の接尾語の候補が、真に接尾語なのか、あるいは、一般名詞の一部なのかを判別する。
例えば、翻訳対象の注記データが「○大」であったとする。この注記データに対応付けられている緯度・経度から例えば地図サーバ1が備えるPOIデータベースを参照する。そして、その場所のPOIデータのジャンルが、「大学」を示すものである場合には、当該注記データ「○大」の文字「大」は、接尾語であると判別することができる。また、その場所のPOIデータのジャンルが、例えば「店舗」であることを示すものである場合には、当該注記データ「○大」の文字「大」は、一般名詞の一部であると判別することができる。
このように、POIデータベースが地図サーバ1やネットワーク上に存在している場合には、当該POIデータベースの情報を用いて、翻訳対象の注記データに含まれる1文字または2文字の接尾語の候補が接尾語か否かを判別するようにしてもよい。しかし、POIデータベースの場合にも、目的とする場所が拠点(POI)として登録されていなかったり、また、情報が細かすぎるために適切な判別ができなかったりする場合があると考えられる。このため、このPOIデータベースを用いる方式の場合にも、上述した第2の実施の形態の実施例2の場合と同様に、日本語注記データがレイヤ構造を持たない場合などにおいて好適な方式である。
[実施の形態の変形例]
なお、上述した実施の形態においては、地図サーバ1が、地図データ提供部103と、注記データ翻訳部104との両方を備えるものとして説明したが、これに限るものではない。例えば、地図データだけを提供する地図サーバと、注記データだけを提供する注記サーバとを別体のものとして設けるようにすることもできる。
この場合、地図サーバの構成は、地図データ提供部103と、地図DB105とを備えるようにすればよい。また、注記サーバは、注記データ翻訳部104と、日本語注記DB106と、言語別一般名詞接尾語辞書107と、地域別漢字読み方辞書108と、外来語辞書109と、言語別汎用翻訳辞書110とを備えた構成とすればよい。
また、地図DB105、注記データ翻訳部104、日本語注記DB106、言語別一般名詞接尾語辞書107、地域別漢字読み方辞書108、外来語辞書109、言語別汎用翻訳辞書110のそれぞれは、地図データ提供部103や注記データ翻訳部104を備えたサーバ装置とは異なるサーバ装置に設けられていてもよい。すなわち、必要なデータベースや辞書類は、通信ネットワーク4上に設けられていれば、これにアクセスして利用するように構成することもできる。
また、例えば、注記データが地名や人名に限られるような場合など、接尾語や外来語が存在しないような場合には、接尾語翻訳部104Bや外来語翻訳部104Cを設ける必要はない。しかし、種々の注記データが翻訳対象となる場合には、接尾語翻訳部104Bや外来語翻訳部104Cを設けることにより、注記データについてより正確な翻訳を行うことができる。
また、上述した実施の形態においては、地図サーバ1から地図データと指示された言語に翻訳された注記データの提供を受けて、ユーザ側のパソコン2や携帯通信端末3などの通信端末側で、地図の描画処理を行うようにした。しかし、これに限るものではない。地図サーバ1において、抽出した地図データと翻訳した注記データとを用いて、要求された地域の地図を描画し、この描画した地図画像を要求元のパソコン2や携帯通信端末3などの通信端末に提供して表示するようにすることも可能である。
また、上述した実施の形態においては、地図サーバ1とパソコン2や携帯通信端末3が通信ネットワーク4を通じて接続されて構成されるシステムである場合を例にして説明したが、これに限るものではない。例えば、パーソナルコンピュータに地図データ提供部103や注記データ翻訳部104の機能を設けるようにする。さらに、地図DB及び日本語注記DBや翻訳のための各辞書群を、当該パーソナルコンピュータか、当該パーソナルコンピュータがアクセス可能なようにしてネットワーク上に設けるようにする。
そして、当該パーソナルコンピュータが、キーボードやマウスを通じてユーザから地図の作成要求を受け付けた場合に、上述した地図サーバ1の場合と同様に、地図データの抽出と、注記データの抽出及び翻訳を行う。そして、当該パーソナルコンピュータが、抽出した地図データと翻訳した注記データとを用いて、地図を描画し、これを表示画面に表示してユーザに提供するようにすることもできる。すなわち、この発明の注記データの翻訳装置は、パーソナルコンピュータを用いてスタンドアロンの構成で実現することもできる。
また、注記データの翻訳をパソコン2や携帯通信端末3において行うように構成することも可能である。すなわち、上述した実施の形態においては、地図サーバ1が備えていた注記データ翻訳部104を、パソコン2や携帯通信端末3に設けるようにする。この場合、簡単には、パソコン2の制御部210や携帯通信端末3の制御部330で実行されるプログラムにより、パソコン2の制御部210や携帯通信端末3の制御部330の機能として、注記データ翻訳部104の機能を実現できる。
そして、パソコン2や携帯通信端末3は、地図サーバ1から地図データや日本語注記データの提供を受ける。そして、日本語注記データについては、図7、図10、図11を用いて説明したようにして翻訳を行う。この場合、言語別一般名詞接尾語辞書107、地域別漢字読み方辞書108、外来語辞書109、言語別汎用辞書110、接尾語別固有名詞辞書111などの各種の辞書は、地図サーバ1やインターネット上に設けられているものを用いることができる。もちろん、注記データの翻訳に用いる種々の辞書を、パソコン2や携帯通信端末3に搭載するようにしてもよい。また、容量の大きな辞書はインターネット上で公開されたものを用い、容量の小さい辞書は、パソコン2や携帯通信端末3に搭載するようにしてもよい。
[その他]
上述した実施の形態の説明から分かるように、注記データ翻訳部104の抽出部104Aが抽出手段としての機能を実現し、第1の翻訳部104Dが第1翻訳手段としての機能を実現し、第2の翻訳部104Eが第2の翻訳手段としての機能を実現している。また、接尾語翻訳部104Bが接尾語翻訳手段としての機能を実現し、外来語翻訳部104Cが外来語翻訳手段としての機能を実現している。
また、図6、図7、図10、図11を用いて説明した方法が、この発明の注記データ翻訳方法が用いられたものである。また、図7、図10、図11を用いて説明した処理を、地図サーバ1等の制御部で実行可能にソフトウェア化したものが、この発明の注記データ翻訳プログラムに相当する。