以下、図を参照しながらこの発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、パーソナルコンピュータや携帯通信端末などの通信端末において実現したり、ネットワークを通じて接続されるサーバ装置と通信端末とが協働することにより実現したりすることができるものである。以下においては、説明を簡単にするため、サーバ装置と通信装置とがネットワークを通じて接続されて構成されるシステムの当該サーバ装置に、この発明を適用した場合を例にして説明する。
[第1の実施の形態]
[システムの全体構成]
図1は、この発明の装置、方法、プログラムの実施形態が適用された読み仮名地図対応地図サーバ1が用いられて構成される多言語対応地図提供システムの概略構成を説明するための図である。図1に示すように、この実施の形態の多言語対応地図提供システムは、通信ネットワーク4を介して、読み仮名地図対応地図サーバ1と、パーソナルコンピュータ2や携帯通信端末3などの通信端末が接続されて構成される。
通信ネットワーク4は、種々の広域通信ネットワークを含むものである。具体的に、通信ネットワーク4は、IP(Internet Protocol)網、公衆交換電話網(PSTN(Public Switched Telephone Network))、デジタル回線網(ISDN(Integrated Services Digital Network))、携帯電話網などを含むものである。さらに、通信ネットワーク4は、近年提供されるようになってきている高速無線通信規格に準じた無線通信網などをも含むものである。
読み仮名地図対応地図サーバ(以下、単に地図サーバという。)1は、図1に示すように、地図データ提供部103と注記読み仮名変換部104とを備え、ユーザからの要求に応じて、目的とする地域の地図を描画するための地図データと地図用の注記データとを提供する。そして、地図サーバ1は、注記読み仮名変換部104を有することにより、漢字を含む注記を、ユーザからの要求に応じて、読み仮名のみからなる注記に変換した注記データを提供することができるものである。
ここで、読み仮名のみからなる注記は、ひらがなのみからなるもの、あるいは、カタカナのみからなるものであっても良いし、更に、外来語などはカタカナでそのまま残すようにすることで、ひらがなとカタカナとからなるものとするようにしても良い。このように、ひらがな及び/またはカタカナからなる読み仮名のみで注記を表わした地図は、漢字を読み難い、例えば小さい子供や、外国人などに非常に好適である。
パーソナルコンピュータ(以下、パソコンと略称する。)2は、図1に示すように、通信機能を備えたパソコン本体21と、ユーザインターフェースとしてディスプレイ装置22、キーボード23、マウス(ポインティングデバイス)24等が接続されて構成されたものである。これらが全体として情報処理装置としてのパソコン2を構成する。
携帯通信端末3としては、例えば、携帯電話端末、PDA(Personal Digital Assistants)、タブレット端末あるいはパッド型端末などと呼ばれる情報端末など種々のものがある。この実施の形態において、携帯通信端末3は、例えば、スマートフォンなどと呼ばれる高機能携帯電話端末であるものとして説明する。
そして、ユーザは、パソコン2や携帯通信端末3を通じて地図サーバ1にアクセスし、地図を作成する目的とする地域(日本国内の地域)と、通常の漢字を含む注記ではなく、読み仮名のみからなる注記とすることを指定して、地図の提供を要求することができる。当該要求に応じて地図サーバ1は、要求された地域の地図を描画するための地図データと、当該地域の地図に含める注記であって、要求された注記の注記データとを要求元のパソコン2や携帯通信端末3に送信する。ここで、地図データは緯度、経度情報が付加された地図の描画データ(ベクトルデータやラスターデータ等)である。また、注記データは、緯度、経度情報が付加された文字データ(注記文字のデータ)などからなる。
これにより、パソコン本体21では、提供された地図データと注記データとを緯度、経度情報を基準に用いて注記を含む地図の表示画像を描画し、これをディスプレイ装置22の表示画面に表示する。同様に、携帯通信端末3では、提供された地図データと注記データとを緯度、経度情報を基準に用いて注記を含む地図の表示画像を描画し、これを表示部313の表示画面に表示する。
この場合、地図の注記は要求に応じて、漢字を含む表記の場合と、ひらがな及び/またはカタカナの表記の注記とされる。なお、上述のようにして表示された地図は、パソコン本体21に接続されたプリンタや携帯通信端末3に接続するようにされるプリンタなどを通じて印刷することもできる。
[地図サーバ1の構成例]
次に、この実施の形態の地図サーバ1の構成例について説明する。図2は、この実施の形態の地図サーバ1の構成例を説明するためのブロック図である。
図2に示すように、地図サーバ1は、通信ネットワーク4への接続端子101、通信I/F102、地図データ提供部103、注記読み仮名変換部104を備える。また、地図サーバ1は、地図データベース(以下、地図DBと略称する。)105、日本語注記データベース106(以下、日本語注記DBと略称する。)を備える。さらに、地図サーバ1は、一般名詞接尾語読み仮名辞書107、地域対応読み仮名辞書108、ユニーク読み仮名語辞書109、汎用読み仮名辞書110のそれぞれを備える。また、地図サーバ1は、地図サーバ1の各部を制御する制御部120を備える。
制御部120は、CPU(Central Processing Unit)121、ROM(Read Only Memory)122、RAM(Random Access Memory)123、EEPROM(Electrically Erasable and Programmable ROM)124が、CPUバス125を通じて接続されて構成されたコンピュータ装置である。ここでCPU121は、ROM122やEEPROM124に記憶されているプログラムを読み出して実行し、各部への制御信号を形成し、これを関係する各部に供給したり、また、各部からのデータを受信してこれを処理したりする。
ROM112は、CPU121によって実行される種々の処理プログラムや処理に必要となるデータが予め記憶されているものである。RAM123は、各種の処理において、処理の途中結果を一時記憶するなど、主に作業領域として用いられるものである。EEPROM124は、書き換え可能ないわゆる不揮発性メモリであり、電源が落とされても保持しておくべきデータを記憶保持する。具体的に、EEPROM124は、機能追加のための新たなプログラム、各種設定パラメータなどを記憶保持する。
通信ネットワーク4への接続端子101は、通信ネットワーク4との接続端部を形成する。すなわち、接続端子101を通じて、当該地図サーバ1が通信ネットワーク4に接続される。通信I/F102は、通信ネットワーク4を通じて送信されてくる地図の提供要求など、自機宛の種々の情報を受信し、これを自機において処理可能な形式の情報に変換して制御部120に供給する。また、通信I/F102は、要求された地図データなど、制御部120を通じて供給される送信用の種々の情報を、通信ネットワーク4に送出する形式の信号に変換して、これを通信ネットワーク4に送出する。このように、接続端子101と通信I/F102とは、通信ネットワーク4を通じて種々の情報の送受信を実現する部分である。
地図データ提供部103は、制御部120に制御され、接続端子101及び通信I/F102を通じて受け付けた要求に応じて、要求された地域の地図を描画するための地図データを後述する地図DB105から抽出し、これを要求元に提供する。
注記読み仮名変換部104は、制御部120に制御され、接続端子101及び通信I/F102を通じて受け付けた読み仮名地図の要求に応じて、当該要求で指定された地域の地図に含める日本語注記の漢字部分を、全て、ひらがな及び/またはカタカナからなる読み仮名に変換し、これを要求元に提供する。そして、地図データ提供部103と注記読み仮名変換部104とにより、要求された地域の地図を描画するための地図データと、読み仮名のみからなる注記の注記データとを提供する機能を実現する。
地図DB105、日本語注記DB106、一般名詞接尾語読み仮名辞書107、地域対応読み仮名辞書108、ユニーク読み仮名語辞書109、汎用読み仮名辞書110のそれぞれは、大容量記録媒体上に作成され、制御部120を通じてアクセス可能にされている。ここで、大容量記録媒体は、例えば、ハードディスク、DVD(Digital Versatile Disc)などの光ディスク、半導体メモリなどである。なお、上記の各データベースや辞書は、例えば、通信ネットワーク4上に設けられた他のサーバ装置に設けるようにし、これを地図サーバ1が、制御部120、接続端子101、通信I/F102を通じて利用するように構成することもできる。
そして、地図DB105は、この実施の形態においては、日本全国の地図を描画するための例えばベクトルデータやラスタデータ等の地図データ(地図用の描画データ)を緯度・経度情報に対応付けて記憶保持する。なお、この実施の形態において、地図DB105に蓄積されている地図データは、例えば、道路、鉄道、河川、山岳、施設、住宅などの所定の種別毎(レイヤ毎)に形成されている。すなわち、地図データは、いわゆるレイヤ構造(階層構造)とされている。また、地図DB105に蓄積されている地図データは、緯度・経度に基づいて地域をほぼ同じ大きさの網の目状の領域(メッシュ)に分けて構成するようにされている。これにより、日本地図から要求された地域の地図を切り取るようにして、当該要求された地域の地図のみを提供することができるようにしている。
日本語注記DB106は、描画される地図上に表示する、例えば道路の名称、交差点の名称、鉄道路線の名称、駅の名称、河川の名称、橋梁の名称、山岳の名称、店舗や施設の名称などの種々の日本語の注記データを緯度・経度情報に対応付けて記憶保持する。日本語注記DB106に記憶保持されている注記データもまた、地図データと同様に、所定の種別毎(レイヤ毎)に形成されて、いわゆるレイヤ構造とされていると共に、緯度・経度に基づいた所定のメッシュに分けて構成するようにされている。これら地図DB105の地図データと日本語注記DB106の日本語注記データとによって、日本語版の日本地図を描画することができるようにされる。
そして、一般名詞接尾語読み仮名辞書107、地域対応読み仮名辞書108、ユニーク読み仮名語辞書109、汎用読み仮名辞書110が、上述した注記読み仮名変換部104によって用いられる注記の読み仮名変換用の辞書群である。
一般名詞接尾語読み仮名辞書107は、日本語の一般名詞に付けられる種々の接尾語を、その読み仮名に変換するための辞書であり、日本語の接尾語と、これに対応する読み仮名とを関連付けて記憶保持するものである。そして、この実施の形態において接尾語は、日本語の接尾語として学術的に厳密に定義されるものに限られない。例えば「○○駅」、「○○店」、「○○川」、「○○山」、「○○小学校」、「○○邸」、「○○ビル」、「○○公民館」、「○○市役所」など、地図上に注記として表記される種々の一般名詞に付加される「駅」、「店」、「川」、「山」、「小学校」、「邸」、「ビル」、「公民館」、「市役所」などの種々のものが含まれる。
地域対応読み仮名辞書108には、所定の漢字と、地域を特定する地域特定情報と、その読み仮名とが対応付けられて格納されている。この地域対応読み仮名辞書108に格納されている所定の漢字は、汎用読み仮名辞書110による読み仮名以外の読み仮名が、或る特定の地域で特に使用されている漢字である。
図3に、地域対応読み仮名辞書108の記憶データの例を示す。また、この地域対応読み仮名辞書108を用いた漢字→読み仮名変換のイメージを図4に示す。なお、図4(A)は、所定の漢字の例として漢字「新宿」と特定の地域との対応関係を示し、図4(B)は、地域対応読み仮名辞書108を用いて、各特定の地域において、漢字「新宿」をその読み仮名に変換した状態を示している。
すなわち、図3に示すように、地域対応読み仮名辞書108には、所定の漢字について、汎用読み仮名辞書110では得られない読み仮名が用いられる地域を特定するための地域特定情報と、当該読み仮名とが対応付けられて格納されている。
例えば、図3に示すように、漢字「新宿」は、汎用読み仮名辞書5では、「しんじゅく」という読み仮名に変換されるが、或る地域では「あらじゅく」という読み仮名で使用されたり、「にいじゅく」という読み仮名で使用されたりする。
この例の場合、地域特定情報は、当該読み仮名が用いられている地域を、例えば図4(A),(B)に示すように矩形領域として、その矩形領域を、その右上隅の位置情報Pi(緯度、経度)と、左下隅の位置情報Pj(緯度、経度)の組[Pi,Pj]で特定するようにしている。ここで、地域特定情報で特定される地域は、或る地域内における地域(地域内地域)をも設定することができるようにされている。
この場合、そのように地域内地域が設定された場合は、その地域内地域の範囲は、当該地域内地域を含む地域範囲と重複することになるが、地域対応読み仮名辞書108は、その重複する地域範囲のうち、小さい地域範囲の読み仮名を優先するようにする。
つまり、注記データに含まれる位置情報で示される注記の位置が、地域対応読み仮名辞書108に設定されている地域範囲に含まれる地域内地域内であるときには、地域対応読み仮名辞書108では、その地域内地域に対応して記憶されている読み仮名を漢字の読み仮名として優先して適用するものである。
すなわち、図3の例では、地域特定情報[P1,P2]で特定される矩形領域601(図4(A),(B)参照)では、漢字「新宿」に対する読み仮名は「あらじゅく」とされることが、地域対応読み仮名辞書108に記憶されている。そして、地域特定情報[P1,P2]で特定される矩形領域601内の[P3,P4]で特定される地域内地域の矩形領域602(図4(A),(B)参照)では、漢字「新宿」に対する読み仮名は「にいじゅく」とされることが、地域対応読み仮名辞書108に記憶されている。
したがって、地域特定情報[P1,P2]で特定される矩形領域601と[P3,P4]で特定される地域内地域の矩形領域602とは、領域が重複するが、地域内地域の矩形領域602では、漢字「新宿」に対する読み仮名は「にいじゅく」が優先して用いられる。
なお、図4(A),(B)に示すように、矩形領域601以外の領域については、地域対応読み仮名辞書108には、何等の情報も記憶されないが、この領域における漢字「新宿」に対する読み仮名は、前述したように、汎用読み仮名辞書110により「しんじゅく」となる。
なお、地域特定情報[Pi,Pj]で特定される領域の大きさは、所定の大きさの地域に限られず、家一件分の大きさとするようにしても良い。また、地域特定情報で特定される地域範囲は、矩形領域に限られるものではなく、例えば或る位置地点を中心とした所定の半径の円形領域とするようにしても良い。
ここで、前述したように、地域対応読み仮名辞書108においては、地域内地域が設定されていて領域が重複する場合には、小さい領域に対して設定された読み仮名が優先して適用されるが、その際の適用の優先条件としては、
・領域の面積が小さい領域
・矩形領域の場合には、対角線の長さが短い領域、
・円形領域の場合には、円の半径の長さが短い領域
に対応して設定された読み仮名が優先して適用される。
なお、地域対応読み仮名辞書108は、例えば、都道府県別に、主に地理的表示などであって、その地域で特有の読み方をする漢字とその読み方とを、あるいは、同じ表記でも他の地域とは異なる読み方をする漢字とその読み方とを対応付けたものとすることができる。具体的には、地域対応読み仮名辞書108は、例えば、都道府県別であって、地名、人名、駅名、施設名、山岳、河川、…などというように、注記データについての所定の種類別のレイヤに対応する複数の漢字読み仮名辞書の構成とすることもできる。
そして、例えば、埼玉県の地名レイヤに対応する漢字読み方辞書には、漢字「七里」は「ナナサト」と読み、栃木県の地名レイヤに対応する漢字読み方辞書には、漢字「七里」は「シチリ」と読むことを登録することができる。この他にも、同じ漢字で異なる読み方をするものについては、読み方の異なる地域と注記データが示す対象物の種類(レイヤ)に応じた漢字読み仮名辞書に登録することができる。例えば、地域対応読み仮名辞書108の、愛知県の駅名レイヤに対応する漢字読み方辞書には、漢字「本陣」は「ホンジン」と読むことを登録することができる。
次に、ユニーク読み仮名語辞書109は、汎用読み仮名辞書110及び地域対応読み仮名辞書108では、正しい読み仮名が得られないようなユニークな読み仮名となる漢字(ユニーク読み仮名語)と、そのユニークな読み仮名との対応関係を記憶する辞書である。
汎用読み仮名辞書110は、それぞれの漢字と、その漢字の一般的な読み仮名との対応を記憶する辞書である。
そして、この実施の形態の地図サーバ1の注記読み仮名変換部104は、地図の日本語の注記について、単に汎用読み仮名辞書110だけを用いて機械的に読み仮名変換処理を行うものではない。一般名詞接尾語読み仮名辞書107、地域対応読み仮名辞書108、ユニーク読み仮名語辞書109、汎用読み仮名辞書110を用いることによって、漢字を含む注記を、その読み仮名のみからなる注記に適切に変換することができるようにしている。すなわち、注記読み仮名変換部104は、上述した種々の辞書を使い分けることにより、漢字を含む注記を、日本語の特性を無視することなく、かつ、地図の注記としての本来の意味を損なうことなく、適切な読み仮名に変換することができるようにしている。このような種々の辞書を用いた注記読み仮名変換部104における注記の読み仮名変換処理の詳細については後述する。
なお、図2においては、二重線で示した地図データ提供部103と注記読み仮名変換部104とは、制御部120から独立した処理部分として示している。しかし、これに限るものではない。地図データ提供部103と注記読み仮名変換部104との一方または両方は、制御部120のCPU121において実行されソフトウェア(プログラム)により、制御部120の機能として実現することもできる。
[パソコン2の構成例]
次に、この実施の形態の地図サーバ1にアクセス可能なパソコン2の構成例について説明する。図5は、この実施の形態で用いられるパソコン2の概略構成を説明するためのブロック図である。この実施の形態のパソコン2は、パソコン本体21と、ディスプレイ装置22と、キーボード23と、マウス24と、図1には示さなかったがスピーカ装置25とから構成される。
パソコン本体21は、図5に示すように、通信ネットワーク4への接続端子201と、通信I/F202と、ハードディスクドライブ(以下、HDDと略称する。)203と、制御部210とからなっている。制御部210は、図示しないが、CPU、ROM、RAM、EEPなどがCPUバスを通じて接続されて構成されたコンピュータ装置である。
そして、ユーザは、キーボード23やマウス24を通じて操作入力を行うことにより、制御部210において種々のアプリケーションプログラムを実行し、種々の情報処理を行うことができるようにされる。例えば、通信I/F202、接続端子201を通じて通信ネットワーク4上のサーバ装置にアクセスし、Webページをディスプレイ装置21の表示画面に表示して閲覧することができるようにされる。同様にして、パソコン2は、通信ネットワーク4上のサーバ装置にアクセスし、目的とする情報のアップロードやダウンロードをすることもできるようにされる。もちろん、電子メールの作成、送信、電子メールの受信、閲覧などを行うこともできる。また、HDD203のハードディスクに蓄積されている画像情報や音声情報を、ディスプレイ装置21やスピーカ装置24を通じて出力することもできる。
そして、この実施の形態のパソコン2は、ユーザからの操作入力に応じて、地図サーバ1にアクセスし、日本地図の内の目的とする地域の地図を描画するための地図データや当該地域の注記の注記データの提供を受けることができるものである。なお、パソコン本体2のユーザは、操作入力により、読み仮名のみからなる注記の地図の提供を要求することができる。
そして、パソコン2は、提供を受けた地図データや注記データを用いて地図を描画し、これをディスプレイ装置22の表示画面に表示することができるものである。また、パソコン2は、ユーザから操作入力に応じて、表示した地図を、パソコン本体2に接続される図示しないプリンタから出力するなどのこともできる。このように、パソコン2は、パソコン本体2が周辺機器と協働し、ユーザからの操作入力(指示入力)に応じた種々の情報処理を行うことができるものである。
[携帯通信端末3の構成例]
次に、この実施の形態の地図サーバ1にアクセス可能な携帯通信端末3の構成例について簡単に説明する。図6は、この実施の形態で用いられる携帯通信端末3の概略構成を説明するためのブロック図である。この実施の形態の携帯通信端末3は、上述もしたように、スマートフォンなどと呼ばれる高機能携帯電話端末である。
図6に示すように、携帯通信端末3は、通信機能を実現する部分として、送受信アンテナ301、送受信処理部302、受話器(スピーカ)303、送話器(マイクロホン)304を備えている。また、携帯通信端末3は、ユーザインターフェースを実現する部分として、キー操作部311、表示制御部312、表示部313、音声処理部314、スピーカ315を備えている。さらに、携帯通信端末3は、GPS部321とGPSアンテナ322とを備えると共に、各部を制御する制御部320を備えている。
ここで、制御部320は、図示しないが、CPU、ROM、RAM、EEPROM等が、CPUバスを通じて接続されて形成されたコンピュータ装置である。表示部313は、例えば、有機ELディスプレイ(organic electroluminescence display)やLCD(Liquid Crystal Display)等のいわゆる薄型の表示素子が用いられて構成されたものである。また、音声処理部314とスピーカ315とは、着信音や警告音、その他の音声メッセージ等を出力するためのものである。
なお、図6においては、キー操作部311と表示部313とは別々に示しているが、表示部313の表示画面上にはいわゆるタッチパネルが設けられており、表示部313に表示される情報とタッチパネルとにより、キー操作部311が構成されている。もちろん、携帯通信端末3の筐体にハードウェアキーを設けることも可能である。また、GPS部321とGPSアンテナ322とは、複数のGPS衛星からの測位情報を受信して解析することにより、自機の現在位置を正確に検出(測位)する部分である。
そして、携帯通信端末3は、制御部320と送受信処理部302とが協働し、目的とする相手先に対して電話をかけて通話したり、自機にかかってきた電話に応答して通話したりすることができる。また、ユーザは、キー操作部311を通じて操作入力を行うことにより、制御部330において種々のアプリケーションプログラムを実行し、種々の情報処理を行うこともできる。
例えば、送受信処理部302及び送受信アンテナ301を通じて通信ネットワーク4上のサーバ装置にアクセスし、Webページを制御部330、表示制御部312を通じて表示部313に表示して閲覧することができる。また、同様にして、通信ネットワーク4上のサーバ装置にアクセスし、目的とする情報のアップロードやダウンロードをすることもできる。もちろん、電子メールの作成、送信、電子メールの受信、閲覧なども行うことができる。
そして、携帯通信端末3もまた、キー操作部311を通じて受け付けたユーザからの操作入力に応じて、地図サーバ1にアクセスし、日本地図の内の目的とする地域の地図を描画するための地図データや当該地域の注記の注記データの提供を受けることができるものである。なお、携帯通信端末3のユーザは、操作入力により、読み仮名のみからなる注記の地図の提供を要求することができる。
そして、携帯通信端末3の制御部330は、提供を受けた地図データや注記データを用いて地図を描画し、これを表示制御部312を通じて表示部313の表示画面に表示することができるものである。このように、携帯通信端末3は、ユーザからの操作入力(指示入力)に応じた種々の情報処理を行うことができるものである。
[パソコン2や携帯通信端末3を用いた地図サーバ1の利用]
次に、パソコン2や携帯通信端末3を用いて地図サーバ1を利用する場合の処理について説明する。パソコン2や携帯通信端末3のどちらを用いてもほぼ同様にして地図サーバ1を利用することができる。この実施の形態の場合には、パソコン2や携帯通信端末3において、まず、Webページ閲覧ソフトウェアであるいわゆるブラウザを起動させる。そして、検索機能を用いて地図サーバ1を特定したり、あるいは、地図サーバ1に割り当てられ入るURL(Uniform Resource Locator)を用いたりして、通信ネットワーク4上の地図サーバ1にアクセスし、地図サーバ1が提供する地図サイト(Webページ)を閲覧できるようにする。
そして、ユーザが、地図サーバ1が提供する地図サイトに対してアクセスすることにより、要求する地図の検索用画面や地図表示用アプリケーションの提供を地図サーバ1から受けるようにする。
パソコン2あるいは携帯通信端末3は、地図サーバ1から提供された地図の描画アプリケーションを実行させ、地図サーバ1から取得した地図データおよび注記データを用いて地図を描画する。このようにして描画された地図は、パソコン2のディスプレイ装置21の表示画面21Gや携帯通信端末3の表示部313の表示画面313Gに表示され、ユーザに提供される。
[注記の読み仮名変換処理の詳細]
次に、この実施の形態の地図サーバ1において行われる日本語の注記の読み仮名変換処理について具体的に説明する。上述もしたように、この実施の形態の地図サーバ1においては、地図データ提供部103が、要求された地域の地図データを、制御部120を通じて地図DB105から抽出し、これを要求元に提供する。また、注記読み仮名変換部104が、要求された地域の注記の注記データを、制御部120を通じて日本語注記DB106から抽出し、これを要求に応じて注記を読み仮名のみからなるものに変換して、要求元に提供する。これら地図データと、読み仮名に変換された注記の注記データとが用いられて、要求元において目的する地域の地図が描画され、利用することができるようにされる。
そして、この実施の形態の地図サーバ1において、注記読み仮名変換部104は、上述した種々の辞書群を用いて、注記を正確な読み仮名に変換することができるようにしている。図7は、地図サーバ1の注記読み仮名変換部104において行われる注記の読み仮名変換処理の詳細を説明するためのブロック図である。
図7に示すように、注記読み仮名変換部104は、抽出部104Aと、接尾語変換部104Bと、単語分割部104Cと、第1の読み仮名変換部104Dと、第2の読み仮名変換部104Eとを備えた構成となっている。
地図サーバ1の制御部120は、ユーザからの地図の提供要求を受け付けると、当該提供要求に含まれるキーワード情報に基づいて、要求された地域を特定する。そして、制御部120は、特定した地域を示す情報(地域情報)と、ユーザからの提供要求に含まれる注記の読み仮名変換要求情報とを含む制御信号CTを注記読み仮名変換部104に供給する。そして、注記読み仮名変換部104は、この制御信号CTに基づいて、図7に示した各部が、以下のようにして処理を行って、漢字を含む注記を、読み仮名のみからなる注記に変換する処理を行う。
以下に、注記読み仮名変換部104を構成する各部の処理を、図8を参照しながら説明する。ここで、図8は、注記の読み仮名変換処理の流れに応じた注記の読み仮名変換例を示す。この図8の例は、ユーザの地図要求に基づき、図4(A),(B)に示すように矩形の地域領域600が、制御信号CTにより指定された場合である。
注記読み仮名変換部104においては、まず、抽出部104Aが機能し、制御部120からの地域情報に基づいて、その指定された地域の日本語の注記の注記データを日本語注記DB106から抽出する。すなわち、抽出部104Aは、変換対象となる日本語の注記の注記データを抽出する。注記データには、注記文字の情報(テキスト情報)、注記の地図上の位置を示す緯度、経度を示す位置情報や当該注記が属するレイヤの情報が含まれている。
具体例を示すと、抽出部104Aでは、図4に示すように、制御信号CTにより指定された矩形の領域600のうち、地域特定情報[P1,P2]で特定される矩形領域(以下、「あらじゅく範囲」という)601に存在する注記と、地域特定情報[P3,P4]で特定される矩形領域(以下、「にいじゅく範囲」という)602に存在する注記と、領域600内のうちの、「あらじゅく範囲」601及び「にいじゅく範囲」602以外の範囲領域(以下、その他範囲という)に存在する注記の注記データを抽出する。
次に、注記読み仮名変換部104においては、接尾語変換部104Bが機能し、注記データが抽出された日本語の注記のそれぞれについて、接尾語が存在する場合には、その接尾語を、一般名詞接尾語読み仮名辞書107を参照して、その読み仮名に変換する。
すなわち、接尾語変換部104Bは、抽出された日本語の注記の末尾部分について、指示された言語の一般名詞接尾語読み仮名辞書107を参照し、対応する日本語の接尾語が存在するか否か判別し、存在した場合に、その日本語の接尾語に対応する当該指示された言語の単語を抽出する。この場合、一般名詞接尾語読み仮名辞書107には、種々の文字数の接尾語が登録されている。例えば、「高等専門学校」、「経済研究所」、…等の5文字の接尾語、「高等学校」、「芸術大学」、…等の4文字の接尾語、「中学校」、「小学校」…等の3文字の接尾語、「高校」、「会館」、…等の2文字の接尾語、「駅」、「山」、…等の1文字の接尾語が登録されている。
接尾語変換部104Bは、抽出された日本語の注記の末尾5文字の部分、末尾4文字の部分というように、末尾部分の文字数を徐々に狭めながら、当該注記の末尾部分と同じ文言(文字列)が、一般名詞接尾語読み仮名辞書107に存在するか否かを確認していく。そして、接尾語変換部104Bは、同じ文言が存在することが確認できた場合に、その文言は接尾語であると判別する。もちろん、一般名詞接尾語読み仮名辞書107に、6文字以上の接尾語が登録されている場合には、その文字数に応じた範囲で、接尾語の有無が確認される。
そして、接尾語が存在することが確認されると、その接尾語が、対応する読み仮名に変換される。例えば、抽出された日本語の注記の末尾に接尾語「駅」が有ることが検出されたとする。
この接尾語変換部104Bにより、例えば、図8に示すように、「あらじゅく範囲」601に存在する「新宿高」、その他範囲に存在する「新宿高」および「にいじゅく範囲」602に存在する「新宿小」のそれぞれは、その接尾語「高」、「高」、「小」のそれぞれが、その読み仮名である「こう」、「こう」、「しょう」のそれぞれに変換される。
このようにして、日本語の注記は、始めに、接尾語変換部104Bによって、一般名詞接尾語読み仮名辞書107が参照され、接尾語部分がその読み仮名に変換される。なお、変換対象の注記に接尾語が存在しない場合には、接尾語変換部104Bにおいては、読み仮名への変換処理が行われることはない。
次に、注記読み仮名変換部104においては、単語分割部104Cが機能し、注記のそれぞれについて、単語に分割される。ここで、カタカナ部分は、一つの単語として分割される。例えば、図4(A)に示した「新宿マンション」は、「新宿」と「マンション」の2つの単語に分割される。カタカナ部分「マンション」は、読み仮名が全てひらがなに変換される場合を除き、そのカタカナ表記のままで、後の処理では変換はされない。
次に、注記読み仮名変換部104においては、第1の読み仮名変換部104Dが機能し、注記のそれぞれについて、漢字表記部分について、地域対応読み仮名辞書108を参照して、当該漢字部分を正確な読み仮名に変換する処理を行う。この場合、注記読み仮名変換部104においては、先ず、地域対応読み仮名辞書108の地域特定情報を参照して、注記データに含まれる位置情報(緯度、経度)をその地域範囲に含む地域特定情報が有るか否か判断する。
そして、注記データに含まれる位置情報(緯度、経度)をその地域範囲に含む地域特定情報があれば、その注記の単語の中に、注記読み仮名変換部104の地域特定情報で特定される地域範囲の漢字が含まれているか否か判別する。そして、注記読み仮名変換部104の地域特定情報で特定される地域範囲の漢字が、当該注記に含まれている場合には、その漢字を、注記読み仮名変換部104の地域特定情報で特定される地域範囲の読み仮名に変換する。
注記の位置情報(緯度、経度)が、注記読み仮名変換部104の地域特定情報で特定される地域範囲に含まれない場合、また、地域範囲に含まれていても、対応する漢字が注記に存在しない場合には第1の読み仮名変換部104Dでは、読み仮名変換処理は行わない。
図8の例を当てはめると、この第1の読み仮名変換部104Dにおいては、「あらじゅく範囲」601の「新宿こう」は、「あらじゅくこう」に読み仮名変換される。また、「にいじゅく範囲」602の「新宿しょう」は、この第1の読み仮名変換部104Dにおいて、「にいじゅくしょう」に読み仮名変換される。そして、その他範囲の「新宿こう」は、この第1の読み仮名変換部104Dにおいては、読み仮名変換処理が行われない。
次に、注記読み仮名変換部104においては、第1の読み仮名変換部104Dでの変換処理によっても、注記の漢字について読み仮名への未変換部分が残っている場合には、第2の読み仮名変換部104Eが機能し、当該未変換部分について読み仮名変換を行う。
この場合、第2の読み仮名変換部104Eでは、先ず、ユニーク読み仮名語辞書109を参照して、未変換部分の漢字がユニーク読み仮名語であれば、このユニーク読み仮名語辞書109により読み仮名変換を実行する。次に、第2の読み仮名変換部104Eは、未変換部分の漢字にユニーク読み仮名語がなくなったときには、汎用読み仮名辞書110を用いて、残りの漢字を、その読み仮名に変換する。なお、第1の読み仮名変換部104Dでの変換処理によって注記の漢字について読み仮名への未変換部分が残っていない場合には、この第2の読み仮名変換部104Eでは読み仮名変換処理は行われない。
なお、注記の読み仮名を、すべてひらがなで表わすようにする場合には、この第2の読み仮名変換部104Eにおいて、カタカナをひらがなに変換する処理を実行する。
図8の例を当てはめると、第1の読み仮名変換部104Dで、その他範囲の「新宿こう」は読み仮名変換されなかったので、この第2の読み仮名変換部104Eにおいて、「新宿こう」が、汎用読み仮名辞書110が参照されて、「しんじゅくこう」に読み仮名変換される。
以上のようにして、注記読み仮名変換部104において、指定された地域範囲の地図の注記の全てが読み仮名に変換された注記データCdが得られる。そして、この注記データCdが、指定された地域範囲の地図データと共に、要求元のユーザの通信端末に対して提供され、地図の描画に用いられるようにされる。
上述の実施形態によれば、地域毎に特有の読み仮名が用いられる漢字も、その読み仮名に変換されるので、地図の注記の漢字が適切な読み仮名のみに変換された注記表記がなされる地図が得られる。
なお、地域対応読み仮名辞書108を、上述したように、所定の種類別にレイヤ構造とした場合、接尾語変換部104Bにおいて、接尾語として例えば「駅」を検出した場合には、対応する地域の地域対応読み仮名辞書108であって、駅名レイヤの漢字読み仮名辞書を優先的に参照するように制御することもできる。このように、接尾語変換部104Bの変換結果に基づいて、第1の読み仮名変換部104Dにおいて優先的に参照する地域別漢字読み方辞書を選択するようにしてもよい。
また、上述したように、注記データには、当該注記データで表わされる注記が属するレイヤの情報も含まれている。そこで、当該注記データに含まれるレイヤ情報を用いて、地域別漢字読み方辞書108において、いずれのレイヤに対応する漢字読み方辞書を参照するかを決定するようにしても良い。
[注記読み仮名変換部104の処理のまとめ]
次に、図7を用いて説明した注記読み仮名変換部104において行われる処理の詳細について、図9のフローチャートを参照しながらまとめる。図9は、この実施の形態の地図サーバ1の注記読み仮名変換部104において行われる処理の詳細を説明するためのフローチャートである。
図9に示す処理は、ユーザからの地図提供要求を受信した制御部120からの制御に応じて、注記読み仮名変換部104において行われる処理を説明するためのフローチャートである。すなわち、接続端子101、通信I/F102を通じてユーザからの地図の提供要求を、制御部120が受け付けたとする。この場合、制御部120は、上述したように、地図の提供を指示された地域を示す情報(地域情報)と注記の言語を示す情報(言語情報)を含み、要求された地域の注記の注記データを提供することを指示する制御信号CTを注記読み仮名変換部104に提供する。
当該制御信号CTの提供を受けた注記読み仮名変換部104は、図9に示す処理を実行し、まず、注記読み仮名変換部104の抽出部104Aが、地図の作成地域として指示された地域の日本語の注記の注記データを日本語注記DB106から抽出する(ステップS101)。そして、接尾語変換部104Bが機能し、上述もしたように、一般名詞接尾語読み仮名辞書107を用いて、変換対象の注記の末尾部分について接尾語が存在するか否かを判別する(ステップS102)。
ステップS102の判別処理において、接尾語が存在すると判別したときには、接尾語変換部104Bは、当該接尾語について、一般名詞接尾語読み仮名辞書107を用いて、当該注記の接尾語を読み仮名に変換する(ステップS103)。なお、ステップS102の判別処理において、変換対象の注記に接尾語は存在していないと判別したときには、ステップS103の処理を実行することなくステップS104の判別処理に進む。
次に、注記読み仮名変換部104の単語分割部104Cが機能し、変換対象の注記を、単語毎に分割する。
次に、注記読み仮名変換部104の第1の読み仮名変換部104Dが機能し、接尾語部分を除く漢字部分について、地域対応読み仮名辞書108を用いて、当該漢字部分を正確な読み仮名に変換する(ステップS105)。
次に、変換対象の注記において、未変換の漢字部分がある場合には、当該未変換漢字部分を、ユニーク読み仮名語辞書109及び汎用読み仮名辞書110を用いて、その読み仮名に変換する(ステップS106)。
この後、注記読み仮名変換部104は、ステップS101において抽出した全ての注記の注記データについて、読み仮名変換が完了したか否かを判別する(ステップS107)。ステップS107の判別処理において、抽出した全ての注記の読み仮名変換を完了していないと判別したときには、次に読み仮名変換すべき注記の注記データを対象とするように位置付け(ステップS108)、その後、ステップS102に戻り、このステップS102からの処理を繰り返す。
また、ステップS107の判別処理において、抽出した全ての注記の読み仮名変換を完了したと判別したときには、注記読み仮名変換部104は、読み仮名変換した注記の注記データの全部を要求元のユーザの通信端末に送信する(ステップS109)。そして、この図9に示す処理を終了する。
なお、読み仮名変換された注記の注記データは、制御部120、通信I/F102、接続端子101を通じて通信ネットワーク4に送出され、要求元のユーザのパソコン2や携帯通信端末3などの通信端末に送信される。そして、要求元のユーザの通信端末では、読み仮名変換された注記データと、地図データ提供部103の機能により提供された地図データとが用いられて、読み仮名のみからなる注記表記とされた目的とする地域の地図を描画して表示し、利用することができる。
[第1の実施の形態の効果]
第1の実施の形態の地図サーバ1の注記読み仮名変換部104では、地図に含める注記を、(1)一般接尾語読み仮名辞書107を用いた接尾語部分の読み仮名変換処理、(2)地域対応読み仮名辞書108を用いた漢字部分の読み仮名変換処理を段階的に実行する。そして、上記(1)、(2)の処理によっても読み仮名変換できなかった未変換部分については、(3)未変換漢字部分をユニーク読み仮名語辞書109および汎用読み仮名辞書110を用いていわゆる読み仮名変換する。
これにより、地図の注記の漢字は、要求された地域の地図上で適切な読み仮名に変換される。したがって、漢字を読むのが苦手なユーザにも、適切な読み方の注記の地図を提供することができる。
すなわち、山や川の名称、駅名、地名、人名、施設名等の漢字名称に対して、地域要素を取り入れて、正確な読み方に変換することができる。また、日本語の特徴である一般名詞接尾語を利用して、施設名、地形名等に対して、いわゆる固有名詞を用いた読み仮名変換より正確に読み仮名変換することができる。
[第2の実施の形態]
上述したように、第1の実施の形態の地図サーバ1は、注記読み仮名変換部104の機能によって、日本語の注記の漢字を適切に読み仮名変換することができるという顕著な効果を奏することができるものである。そして、接尾語について、さらに詳細に考察すると、その読み仮名変換については新たな課題が存在していることが判明した。
すなわち、地図注記は意味さえ分かれば、できる限り短く表記する方法が採用されている場合がある。例えば、「東京大学」は「東大」、「商業高等学校」は「商高」、「浜中学校」は「浜中」、「日光小学校」は「日光小」などというように、省略して表記される場合がある。一方、地名、人名、店舗などの施設名などには、「雄大(ゆうだい)」、「日高(ひだか)」、「田中(たなか)」、「浜中(はまなか)」などの名称が存在する。このため、地図注記の末尾に「大」、「高」、「中」、「小」といった文字が存在する場合、それが接尾語なのか、一般名詞の一部なのかの判別ができないために、正確に読み仮名変換することができない場合があると考えられる。
また、「○○公民館」、「○○小学校」などのように、3文字以上で構成された接尾語の場合には、接尾語として認識することに問題は生じない。しかし、「山」、「川」、「イン」などの1文字または2文字で構成される文言(文字列)の場合、接尾語である場合と、一般名詞の一部である場合の両方が存在する。例えば、「高尾山(たかおさん)」の場合の「山」は接尾語であるが、「尾山(おやま)」の場合の「山」は人名の一部である場合もある。また、ホテルなどを意味する「○○イン」の場合の「イン」は接尾語とすべきであるが、道路の名称などに用いられる「スカイライン」の場合の「イン」は一般名詞の一部である。
このように、注記の末尾部分の1文字または2文字は、接尾語である場合もあれば、一般名詞の一部である場合もある。このため、注記の末尾部分の1文字または2文字と同じ文言が一般名詞接尾語読み仮名辞書107に存在するからといって、それをそのまま接尾語として読み仮名変換することができない場合がある。そこで、この第2の実施の形態においては、注記の末尾部分の1文字、2文字が接尾語であるか否かを正確に判別して、接尾語の読み仮名変換をより正確に行うことができるようにしている。
なお、この第2の実施の形態においても、説明を簡単にするため、図1を用いて上述した第1の実施の形態の地図サーバ1に、この発明を適用した場合を例にして説明する。したがって、この第2の実施の形態においても、サーバ装置1は、図2〜図4および図7〜図9を用いて説明した構成を有し、ネットワーク2を通じてサーバ装置1に接続可能なパソコン2、携帯通信端末3は、図5、図6を用いて説明した構成を有するものとして説明する。したがって、必要に応じて、図2、図7等の図面をも参照しながら、この第2の実施の形態の地図サーバ1の詳細について説明する。
そして、この第2の実施の形態においては、地図の注記の接尾語の読み仮名変換処理をより正確に行うために、注記データがレイヤ構造を持つことに着目した実施例1と、接尾語別固有名詞辞書を用いる実施例2の2つの実施例について具体的に説明する。図10は、注記データがレイヤ構造を持つことに着目した実施例1の概要を説明するための図であり、図11は、接尾語別固有名詞辞書を用いる実施例2の概要を説明するための図である。
[第2の実施の形態の実施例1の詳細]
上述もしたように、日本語注記DB106は、描画される地図上に表示する種々の日本語の注記の注記データを緯度・経度情報に対応付けて記憶保持するが、注記データは所定の種別毎(レイヤ毎)にまとめられたいわゆるレイヤ構造とされている。具体的には、図10に示すように、日本語の注記データのそれぞれは、教育機関名称レイヤ106(1)、山岳名称レイヤ106(2)、河川名称レイヤ106(3)、…、鉄道名称レイヤ106(n)等の種々のレイヤのいずれかに属する構成とされている。したがって、日本語注記DB106に記憶保持されている注記データのそれぞれは、どの名称レイヤ(注記レイヤ)に属するものであるかの情報をも有している。
そして、読み仮名への変換対象の注記の末尾部分の1文字または2文字が、一般名詞接尾語読み仮名辞書107に存在するものである場合には、変換対象の注記の注記データが属するレイヤの種別を参照し、当該注記データで表わされる注記の末尾の1文字または2文字の部分が接尾語か否かを判別する。すなわち、変換対象の注記の末尾の1文字が、「大」、「高」、「中」、「小」などであったとする。この場合、当該注記データが、教育機関名称レイヤ106(1)に属するものである場合には、当該注記データで表わされる注記の末尾の1文字は接尾語であると判別する。また、当該注記データが、住宅名称(個人名称)レイヤや施設名称レイヤに属するものである場合には、当該注記データで表わされる注記の末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
同様に、変換対象の注記の末尾の1文字が、「山」であり、当該注記が、山岳名称レイヤ106(2)に属するものであって場合には、当該注記の末尾の1文字は接尾語であると判別する。しかし、当該注記が他のレイヤに属するものである場合には、当該注記の末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
また、変換対象の注記の末尾の1文字が、「川」であり、当該注記が、河川名称レイヤ106(3)に属するものであって場合には、当該注記の末尾の1文字は接尾語であると判別する。しかし、当該注記データが他のレイヤに属するものである場合には、当該注記データで表わされる注記の末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
また、変換対象の注記の末尾の2文字が、「イン」であり、当該注記の注記データが、ホテルなどが属する施設名称レイヤに属するものであって場合には、当該注記データで表わされる注記の末尾の2文字は接尾語であると判別する。しかし、当該注記データが他のレイヤに属するものである場合には、当該注記データで表わされる注記の末尾の1文字は接尾語ではなく、一般名詞の一部であると判別する。
このように、変換対象の注記の末尾の1文字または2文字が、一般名詞接尾語読み仮名辞書107に存在し、接尾語が一般名詞の一部かどうか分からない場合に、当該注記データが属するレイヤの種別を判別する。これにより、当該注記データで表わされる注記の末尾の1文字または2文字が接尾語か一般名詞の一部かを明確に判別することができる。
なお、上述した変換対象の注記の末尾の1文字が、「大」、「高」、「中」、「小」である場合や変換対象の注記データの末尾の1文字または2文字が、「山」、「川」、「イン」である場合は一例である。したがって、接尾語になり得る1文字または2文字の種々の文言について、接尾語になる場合のレイヤと一般名詞の一部になる場合のレイヤの対応付けを事前に行っておく。そして、当該対応付けをEEPROM124に登録しておき、CPU121で実行されるプログラムで参照できるようにしたり、また、CPU121において実行されるプログラム中に記載しておくようにしたりする。このようにすることによって、接尾語になり得る1文字または2文字の種々の文言について、接尾語か否かの判別を適切に行うことができる。
次に、この第2の実施の形態の実施例1の場合において、地図サーバ1の図7に示した構成を有する注記読み仮名変換部104での処理の詳細について、図12のフローチャートを参照しながら説明する。図10は、この第2の実施の形態の実施例1において、地図サーバ1の注記読み仮名変換部104において行われる処理の詳細を説明するためのフローチャートである。
図12において、図9を用いて説明した第1の実施の形態の注記読み仮名変換部104において行われる処理と同様に行われる処理(ステップ)には、同じステップ番号を付し、その部分の説明は重複するので省略する。そして、図12と図9とを比較すると分かるように、この第2の実施の形態の実施例1の場合においては、ステップS102とステップS103との間に、ステップS201A〜ステップS203Aの3つの処理(ステップ)が設けられている点が、図9に示したフローチャートとは異なる点である。
すなわち、この第2の実施の形態の実施例1において、注記読み仮名変換部104の接尾語変換部104Bは、ステップS102において、変換対象の注記の末尾部分に接尾語が存在する(接尾語の候補となるものが存在する)と判別したとする。この場合、接尾語変換部104Bは、即座に接尾語の読み仮名変換を行うのではなく、その接尾語の候補が一般名詞の可能性があるか否かを判別する(ステップS201A)。
具体的に、ステップS201Aにおいては、確認された(抽出された)接尾語の候補が、1文字または2文字である場合には、当該接尾語の候補は一般名詞の可能性があると判別する。したがって、確認された接尾語の候補が、3文字以上である場合には、当該接尾語の候補は接尾語であると判別することになる。
このため、ステップS201Aの判別処理において、確認された接尾語の候補が、一般名詞ではない(3文字以上である)と判別した場合には、当該接尾語の候補を接尾語としてステップS103において読み仮名変換処理をする。これに対して、ステップS201Aにおいて、確認された接尾語の候補が、一般名詞の可能性があると判別した場合には、接尾語変換部104Bは、当該接尾語の候補を含む注記の注記データが属するレイヤの種別を確認する(ステップS202A)。そして、ステップS202Aの確認の結果得られる、当該接尾語の候補を末尾部分に含む変換対象の注記の注記データが属するレイヤの種別に基づいて、当該接尾語の候補は一般名詞の一部か否かを判別する(ステップS203A)。
このステップS203Aの判別処理は、上述もしたように、予め決められる接尾語の候補と、当該接尾語の候補を含む注記の注記データが属するレイヤの種別との関係から、当該接尾語の候補が、接尾語か一般名詞の一部かを判別する処理である。したがって、接尾語の候補が「大」、「高」、「中」、「小」などである場合には、当該接尾語の候補を末尾部分に含む注記の注記データが属するレイヤが教育機関名称レイヤ106(1)か否かを判別する処理がステップS203Aの処理である。
この場合、当該接尾語の候補を末尾部分に含む注記の注記データが属するレイヤが教育機関名称レイヤではないときには、当該接尾語の候補は一般名詞の一部であると判別する。また、当該接尾語の候補を末尾部分に含む注記の注記データが属するレイヤが教育機関名称レイヤであるときには、当該接尾語の候補は一般名詞の一部でない、すなわち、接尾語であると判別する。
同様に、ステップS203Aにおいては、接尾語の候補が「山」である場合には、当該接尾語の候補を末尾部分に含む注記の注記データが属するレイヤは、山岳名称レイヤ106(2)であるか否かを判別する。また、接尾語の候補が「川」である場合には、当該接尾語の候補を末尾部分に含む注記の注記データが属するレイヤは、河川名称レイヤ106(3)であるか否かを判別する。
そして、ステップS203Aの判別処理において、当該接尾語の候補は一般名詞の一部ではないと判別した場合には、ステップS103において当該接尾語の候補を接尾語として読み仮名変換処理をする。これに対して、ステップS203Aにおいて、当該接尾語の候補が一般名詞の一部であると判別した場合には、接尾語の読み仮名変化処理は行わず、ステップS104からの処理を行う。
これにより、変換対象の注記の末尾部分に、接尾語の候補が存在する場合に、その接尾語の候補が本当に接尾語か否かを正確に判別することができる。したがって、注記の末尾部分に含まれる文言が、真に接尾語である場合においてのみ、接尾語の読み仮名変換処理を行うことができる。
なお、ここでは、接尾語の候補が、「大」、「高」、「中」、「小」、「山」、「川」である場合を例にして説明したが、これに限るものではない。1文字または2文字の種々の接尾語と、当該1文字または2文字の種々の接尾語が属する名称レイヤとの対応付けを予め行っておくことにより、1文字または2文字の種々の接尾語について適切に読み仮名変換処理をすることができる。
[第2の実施の形態の実施例2の詳細]
ところで、日本語注記DB106が、レイヤ構造とされていない場合もあると考えられる。このような場合には、上述した第2の実施の形態の実施例1の方式は採用できない。そこで、接尾語別の固有名詞辞書を用いるようにするのが、第2の実施の形態の実施例2である。
すなわち、図11に示すように、接尾語別固有名詞辞書111を例えば地図サーバ1に設ける。この接尾語別固有名詞辞書111は、末尾部分の1文字または2文字が接尾語である種々の名称(固有名詞)を、その接尾語毎に集めたものである。具体的には、図11に示すように、末尾が「山」である全国の山岳名称辞書111(1)、末尾が「川」である全国の河川名称辞書111(2)、末尾が「湖」または「沼」である全国の湖沼名称辞書111(3)、末尾が「大」、「高」、「中」、「小」等である全国の教育機関名所辞書など、種々の接尾語を有する固有名詞辞書を形成しておく。
そして、変換対象の注記の末尾部分の1文字または2文字が、一般名詞接尾語読み仮名辞書107に存在するものである場合、すなわち、末尾語候補として判別された場合には、変換対象の注記の漢字部分が、その接尾語候補に対応する固有名詞辞書111(n(nは1以上の整数))に存在するか否かを判別する。例えば、変換対象の注記が「高尾山」である場合、接尾語の候補として「山」が抽出される。この場合、注記である「高尾山」と言う文言が、末尾が「山」である全国の山岳名称辞書111(1)に存在するか否かを判別する。そして、注記の「高尾山」が山岳名称辞書111(1)に存在する場合には、当該接尾語の候補「山」は接尾語であると判別し、存在しない場合には、当該接尾語の候補「山」は一般名詞の一部であると判別する。
なお、変換対象の注記の末尾の1文字または2文字が、「大」、「高」、「中」、「小」、「川」、「イン」などである場合についても同様に、接尾語別の固有名詞辞書を用いて接尾語か否かの判別を行うことができる。もちろん、これらは一例であり、接尾語になり得る1文字または2文字の種々の文言別(接尾語別)に、固有名詞辞書を整備しておくことにより、接尾語になり得る1文字または2文字の種々の文言について、接尾語か否かの判別を適切に行うことができる。
次に、この第2の実施の形態の実施例2の場合において、地図サーバ1の図7に示した構成を有する注記読み仮名変換部104での処理の詳細について、図13のフローチャートを参照しながら説明する。図13は、この第2の実施の形態の実施例2において、地図サーバ1の注記読み仮名変換部104において行われる処理の詳細を説明するためのフローチャートである。
この実施例2の図13においても、図9を用いて説明した第1の実施の形態の注記読み仮名変換部104において行われる処理と同様に行われる処理(ステップ)には、同じステップ番号を付し、その部分の説明は重複するので省略する。そして、図13と図9とを比較すると分かるように、この第2の実施の形態の実施例2の場合においては、ステップS102とステップS103との間に、ステップS201A、ステップS202B、ステップS203Bの3つの処理(ステップ)が設けられている点が、図9に示したフローチャートとは異なる点である。
すなわち、この第2の実施の形態の実施例1において、注記読み仮名変換部104の接尾語変換部104Bは、ステップS102において、変換対象の注記データの末尾部分に接尾語が存在する(接尾語の候補となるものが存在する)と判別したとする。この場合、接尾語変換部104Bは、即座に接尾語の読み仮名変換処理を行うのではなく、その接尾語の候補が一般名詞の可能性があるか否かを判別する(ステップS201A)。
このステップS201Aの判別処理を、図12を用いて説明した第2の実施の形態の実施例1におけるステップS201Aの処理と同様に行われる処理である。すなわち、ステップS201Aにおいては、確認された(抽出された)接尾語の候補が、1文字または2文字である場合には、当該接尾語の候補は一般名詞の可能性があると判別する。したがって、確認された接尾語の候補が、3文字以上である場合には、当該接尾語の候補は接尾語であると判別することになる。
このため、ステップS201Aの判別処理において、確認された接尾語の候補が、一般名詞ではない(3文字以上である)と判別した場合には、当該接尾語の候補を接尾語としてステップS103において読み仮名変換処理をする。これに対して、ステップS201Aにおいて、確認された接尾語の候補が、一般名詞の可能性があると判別した場合には、接尾語変換部104Bは、当該接尾語の候補を末尾部分に有する固有名詞が登録された固有名詞辞書111を参照し、当該変換対象の注記が存在するか否かを確認する(ステップS202B)。
このステップS202Bの確認処理においては、第1の実施の形態において、接尾語の有無の判別を行う場合と同様に、参照される固有名詞辞書111(n)に登録されている文字数の大きな固有名から順に検索対象とされる。例えば、変換対象の注記が8文字であり、参照される固有名詞辞書111(n)に、6文字〜2文字の固有名詞が登録されているとする。
この場合、まず、当該変換対象の注記の末尾6文字部分を用いて、参照対象の固有名詞辞書111(n)を参照する。当該6文字部分が、当該固有名詞辞書111(n)に存在しない場合には、当該変換対象の注記の末尾5文字部分を用いて、参照対象の固有名詞辞書111(n)を参照する。このように、対象文字数分の注記が当該固有名詞辞書111(n)に存在しない場合には、変換対象の注記の末尾に文字数を1文字ずつ少なくしながら、変換対象の注記が接尾語別の固有名詞辞書に存在するか否かを確認していく。
そして、ステップS202Bの確認の結果、変換対象の注記が、あるいは、変換対象の注記の所定文字数の末尾部分が、接尾語別の固有名詞辞書111(n)に存在するか否かに応じて、当該接尾語の候補が一般名詞の一部か否かを判別する(ステップS203B)。
すなわち、ステップS202Bでの確認の結果が、変換対象の注記が、あるいは、変換対象の注記の所定文字数の末尾部分が、接尾語別の固有名詞辞書111(n)に存在しないことを示しているとする。この場合、ステップS203Bにおいては、当該接尾語の候補は、接尾語ではなく、一般名詞の一部であると判別する。また、ステップS202Bでの確認の結果が、変換対象の注記が、あるいは、変換対象の注記の所定文字数の末尾部分が、接尾語別の固有名詞辞書111(n)に存在することを示しているとする。この場合、ステップS203Bにおいては、当該接尾語の候補は、一般名詞の一部ではなく、接尾語であると判別する。
そして、ステップS203Bの判別処理において、当該接尾語の候補は一般名詞の一部ではないと判別した場合には、ステップS103において当該接尾語の候補を接尾語として読み仮名変換処理をする。これに対して、ステップS203Bにおいて、当該接尾語の候補が一般名詞の一部であると判別した場合には、接尾語の読み仮名変換処理は行わず、ステップS104からの処理を行う。
これにより、変換対象の注記の末尾部分に、接尾語の候補が存在する場合に、その接尾語の候補が本当に接尾語か否かを正確に判別することができる。したがって、注記の末尾部分に含まれる文言が、真に接尾語である場合においてのみ、接尾語の読み仮名変換処理を行うことができる。
なお、この第2の実施の形態の実施例2の場合、変換対象の注記の文字数が少ない場合に、末尾の文字が接尾語か一般名詞の一部かの判別ができない場合もある。例えば、福岡県、新潟県、静岡県には、「西川」という河川名が存在するが、「西川」という苗字や店舗などの施設名も存在する。このように、注記の文字数が少ない場合に限り、接尾語か一般名詞の一部かの区別ができない場合もある。
しかし、この第2の実施の形態の実施例2の方式は、上述もしたように、日本語注記DB106がレイヤ構造でない場合などにおいて、注記の末尾部分が接尾語か否かを判別する上で有効なものである。
[接尾語か否かの判別の他の例]
上述した地図サーバ1のように、地図データの提供を行うサーバ装置等においては、地図上に表現される種々の拠点(POI:point of interest)についての情報をデータベース化したPOIデータベースを備えている場合もある。POIは、誰かが便利あるいは興味のある所と思った特定の場所のことである。
そして、POIデータベースには、例えば、大学、高校、中学校、小学校、店舗や会社などの施設、さらには、山、川、道路などの種々の場所などのいわゆる拠点についての種々の情報が蓄積される。具体的には、その特定の場所(POI)の緯度・経度、名称、住所、ジャンル、メッシュコードなどの情報が蓄積される。ここで、POIのジャンルは、その場所が、例えば、大学や高校であったり、山や川や道路であったりするなどのことを示す情報である。
そして、上述もしたように、地図の注記データには、緯度・経度も対応付けられている。このため、変換対象の注記が1文字あるいは2文字の接尾語の候補を含む場合、その注記データに対応付けられた緯度・経度をキー情報として用いてPOIデータベースを参照し、その場所のジャンルを取得する。そして、取得したその場所のジャンルに基づいて、変換対象の注記の末尾部分の1文字または2文字の接尾語の候補が、真に接尾語なのか、あるいは、一般名詞の一部なのかを判別する。
例えば、変換対象の注記が「○大」であったとする。この注記の注記データに対応付けられている緯度・経度から例えば地図サーバ1が備えるPOIデータベースを参照する。そして、その場所のPOIデータのジャンルが、「大学」を示すものである場合には、当該注記「○大」の文字「大」は、接尾語であると判別することができる。また、その場所のPOIデータのジャンルが、例えば「店舗」であることを示すものである場合には、当該注記「○大」の文字「大」は、一般名詞の一部であると判別することができる。
このように、POIデータベースが地図サーバ1やネットワーク上に存在している場合には、当該POIデータベースの情報を用いて、変換対象の注記に含まれる1文字または2文字の接尾語の候補が接尾語か否かを判別するようにしてもよい。しかし、POIデータベースの場合にも、目的とする場所が拠点(POI)として登録されていなかったり、また、情報が細かすぎるために適切な判別ができなかったりする場合があると考えられる。このため、このPOIデータベースを用いる方式の場合にも、上述した第2の実施の形態の実施例2の場合と同様に、日本語注記データがレイヤ構造を持たない場合などにおいて好適な方式である。
[上記の実施形態の変形例]
なお、上述した実施の形態においては、地図サーバ1が、地図データ提供部103と、注記読み仮名変換部104との両方を備えるものとして説明したが、これに限るものではない。例えば、地図データだけを提供する地図サーバと、注記データだけを提供する注記サーバとを別体のものとして設けるようにすることもできる。
この場合、地図サーバの構成は、地図データ提供部103と、地図DB105とを備えるようにすればよい。また、注記サーバは、注記読み仮名変換部104と、日本語注記DB106と、一般名詞接尾語読み仮名辞書107と、地域対応読み仮名辞書108と、ユニーク読み仮名語辞書109と、汎用読み仮名辞書110とを備えた構成とすればよい。
また、地図DB105、注記読み仮名変換部104、日本語注記DB106、一般名詞接尾語読み仮名辞書107と、地域対応読み仮名辞書108と、ユニーク読み仮名語辞書109と、汎用読み仮名辞書110のそれぞれは、地図データ提供部103や注記読み仮名変換部104を備えたサーバ装置とは異なるサーバ装置に設けられていてもよい。すなわち、必要なデータベースや辞書類は、通信ネットワーク4上に設けられていれば、これにアクセスして利用するように構成することもできる。
また、例えば、注記が地名や人名に限られるような場合など、接尾語が存在しないような場合には、地図サーバ1には接尾語変換部104Bを設ける必要はない。しかし、種々の注記データが読み仮名変換の対象となる場合には、接尾語変換部501Bを設けることにより、注記についてより正確な読み仮名変換を行うことができる。
また、上述した注記表記変換装置の第1及び第2の実施の形態においては、地図サーバ1から地図データと指示された表記の注記の注記データの提供を受けて、ユーザ側のパソコン2や携帯通信端末3などの通信端末側で、地図の描画処理を行うようにした。しかし、これに限るものではない。地図サーバ1において、抽出した地図データと、要求に応じて読み仮名変換された注記の注記データとを用いて、要求された地域の地図を描画し、この描画した地図画像を要求元のパソコン2や携帯通信端末3などの通信端末に提供して表示するようにすることも可能である。
また、上述した実施の形態においては、地図サーバ1とパソコン2や携帯通信端末3が通信ネットワーク4を通じて接続されて構成されるシステムである場合を例にして説明したが、これに限るものではない。例えば、パーソナルコンピュータに地図データ提供部103や注記読み仮名変換部104の機能を設けるようにする。さらに、地図DB及び日本語注記DBや読み仮名変換仮名各種辞書群を、当該パーソナルコンピュータか、当該パーソナルコンピュータがアクセス可能なようにしてネットワーク上に設けるようにする。
そして、当該パーソナルコンピュータが、キーボードやマウスを通じてユーザから地図の作成要求を受け付けた場合に、上述した地図サーバ1の場合と同様に、地図データの抽出と、注記データの抽出及び読み仮名変換を行う。そして、当該パーソナルコンピュータが、抽出した地図データと読み仮名変換した注記データとを用いて、地図を描画し、これを表示画面に表示してユーザに提供するようにすることもできる。すなわち、この発明の注記表記変換装置は、パーソナルコンピュータを用いてスタンドアロンの構成で実現することもできる。
また、注記の読み仮名変換をパソコン2や携帯通信端末3において行うように構成することも可能である。すなわち、上述した実施の形態においては、地図サーバ1が備えていた注記読み仮名変換部104を、パソコン2や携帯通信端末3に設けるようにする。この場合、簡単には、パソコン2の制御部210や携帯通信端末3の制御部330で実行されるプログラムにより、パソコン2の制御部210や携帯通信端末3の制御部330の機能として、注記読み仮名変換部104の機能を実現できる。
この場合、パソコン2や携帯通信端末3は、一般名詞接尾語読み仮名辞書107、地域対応読み仮名辞書108、ユニーク読み仮名語辞書109、汎用読み仮名辞書110、接尾語別固有名詞辞書111などの各種の辞書は、地図サーバ1やインターネット上に設けられているものを用いることができる。もちろん、注記の読み仮名変換に用いる種々の辞書を、パソコン2や携帯通信端末3に搭載するようにしてもよい。また、容量の大きな辞書はインターネット上で公開されたものを用い、容量の小さい辞書は、パソコン2や携帯通信端末3に搭載するようにしてもよい。
[その他]
上述した第1及び第2の実施の形態の説明から分かるように、注記読み仮名変換部104の抽出部501Aが抽出手段としての機能を実現し、第1の読み仮名変換部501Dが第1の読み仮名変換手段としての機能を実現し、第2の読み仮名変換部501Eが第2の読み仮名変換手段としての機能を実現している。
また、図7、図9、図12、図13を用いて説明した方法が、この発明の注記表記変換方法が用いられたものである。また、図7、図9、図12、図13を用いて説明した処理を、地図サーバ1等の制御部で実行可能にソフトウェア化したものが、この発明の注記表記変換プログラムに相当する。