JP5246512B2

JP5246512B2 - 音声読み上げシステム、および音声読み上げ端末

Info

Publication number: JP5246512B2
Application number: JP2009178921A
Authority: JP
Inventors: 健司永松
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2009-07-31
Filing date: 2009-07-31
Publication date: 2013-07-24
Anticipated expiration: 2029-07-31
Also published as: JP2011033764A

Description

本発明は、音声読み上げシステムに関し、特に、複数の読みを持つ名称に優先する読みを決定する音声読み上げシステムに関する。

近年、自動車に搭載されるカーナビゲーション装置、ならびに公共機関および交通機関において自動放送をする装置など、読み上げる対象となるテキストを音声データに自動変換し、音声によるアナウンスとして出力する装置が広く普及している。これらの装置を用いるシステムには、録音した音声を接続して再生する録音編集方法を用いるシステムと、発音を表した文字または符号列から音声を合成する規則合成方法を用いるシステムとがある。

録音編集方法は、従来、鉄道等の自動音声案内において用いられてきた。鉄道等において用いられる自動音声案内は、定型的な表現が多く使用される。このため、録音編集方法は、定型的な表現を、録音された音声の部品としてあらかじめ複数用意し、それらの録音された音声の部品を要求に従って適宜組み合わせることによって、音声を生成する方法である。しかし、録音編集方法は、あらかじめ定められた表現を組合せることによって、音声を生成するが、それ以外の手段によって、音声を生成できない。

一方、規則合成方法は、入力された任意のテキストを音声に変換する方法である。録音編集方法は、あらかじめ想定される表現を音声によって録音しておく必要があったが、規則合成方法は、テキストのみを入力し、入力されたテキストを音声に自動変換する。このため、規則合成方法を用いるシステムは、日々更新されるニュースおよび緊急情報など、頻繁に更新される内容を読み上げるシステムとして、自動車に搭載されるカーナビゲーション装置など様々な場所において利用される。

一般的な規則合成方法は、まず、入力されたテキストに後述の言語処理を行い、そして、読みおよびアクセントの情報を示す中間記号列を生成した後、基本周波数パタン（すなわち、声の高さに対応する声帯の振動周期）および音素継続時間長（すなわち、発声速度に対応する各音素の長さ）などの韻律パラメータを決定する。続いて、規則合成方法は、波形生成処理によって、韻律パラメータにあわせた音声波形を生成する。韻律パラメータから音声波形を生成する方法には、音素または音節に対応する音声素片を組み合わせる、波形接続型音声合成が広く用いられる。

前述の言語処理は、通常、入力されたテキストをそのまま読み上げるように、テキストに読みを付与する処理を含む。すなわち、「国分寺」というテキストが入力された場合には、「国分寺」というテキストには、「こくぶんじ」という読みが付与される。

古井貞熙著、「ディジタル音声処理」東海大学出版会出版、１９８５年９月発行 T. Dutoit著、「An Introduction to Text-to-Speech Synthesis」KLUWER出版、1997年発行

例えば、カーナビゲーション装置において、地名、交差点名、および建物名などのような地点名称（ＰＯＩ、ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ）には、複数の読み方の情報が設定される場合がある。この複数の読み方の情報は、カーナビゲーション装置における目的地設定のための音声認識処理において、利用者がどの読み方によって指定しても目的の地点を設定できるようにするために用いられる情報である。

しかしながら、この読み方の情報は、一般的に利用者からの発声を認識する音声認識において用いられ、カーナビゲーション装置が音声を読み上げるために用いられることは少ない。カーナビゲーション装置が音声を読み上げる音声読み上げにおいて、カーナビゲーション装置が地名を読み上げる場合も、利用者が発声した読み方によって読み上げられることができれば、利用者にとって利便性が向上する。

また、従来の手段を用いて、利用者による音声によって入力した読み方を記録し、記録された読み方を用いて音声を読み上げる際の読み方を決定しても、利用者が音声によって入力したことのない地点名について、利用者が呼ぶであろう読み方を決定することはできない。

本発明は、上記の問題を鑑みてなされたものであり、地点名称を、利用者が使用している読み方、または利用者が使用すると推測される読み方で読み上げる手法、およびその読み上げ装置を提供することを目的とする。

なお、前述の課題は、カーナビゲーション装置における課題によって例示したが、音声を読み上げる装置であれば、すべて同じ課題を持つ。

本発明の代表的な一例を示せば以下の通りである。すなわち、複数の単語を読み上げる（例えば、音声にて出力する）複数の音声読み上げ端末と、ネットワークを介して前記音声読み上げ端末と接続される読み情報更新サーバとを備える音声読み上げシステムであって、前記音声読み上げ端末は、前記単語と、前記単語に指定される読みとの組み合わせを保持し、前記組み合わせを、前記読み情報更新サーバに送信し、前記読み情報更新サーバは、複数の前記音声読み上げ端末から送信された、複数の前記組み合わせを保持し、前記組み合わせから、前記読みが指定されていない前記単語を取得し、複数の前記組み合わせの中から、前記単語における前記読みが、当該組み合わせの前記単語における前記読みと類似する複数の他の前記組み合わせを特定し、前記複数の他の組み合わせから、当該組み合わせにおいて前記読みが指定されていない前記単語の前記読みを抽出し、前記抽出された読みによって、前記読みが指定されていない単語の前記読みを指定し、前記単語と前記指定された読みとによって、前記組み合わせを更新し、前記更新された組み合わせを前記音声読み上げ端末に送信し、前記音声読み上げ端末は、保持された前記組み合わせを、前記送信された組み合わせによって更新し、前記更新された組み合わせに基づいて、前記単語を読み上げる。

本発明の一実施形態によると、利用者が使用している読み方で音声を読み上げる装置を提供できる。

本発明の第１の実施形態の端末側装置およびサーバ側装置の構成を示すブロック図である。本発明の第１の実施形態の端末側装置およびサーバ側装置のハードウェアを示すブロック図である。本発明の第１の実施形態の端末側装置の処理を示す説明図である。本発明の第１の実施形態の端末側装置の音声入力処理を示す説明図である。本発明の第１の実施形態の端末側装置による経路誘導等において用いられる地点情報が含まれた地点データベースの説明図である。本発明の第１の実施形態の端末側装置における読み履歴データベースを示す説明図である。本発明の第１の実施形態の端末側装置における読み履歴データベースを示す説明図である。本発明の第１の実施形態の端末側装置の音声合成処理を示す説明図である。本発明の第１の実施形態の端末側装置の音声合成処理において用いられる単語辞書を示す説明図である。本発明の第１の実施形態の端末側装置の読み優先順更新処理の処理を示す説明図である。本発明の第１の実施形態の端末側装置の読み履歴送信手段から送信される読み履歴ベクトル情報の説明図である。本発明の第１の実施形態の端末側装置の読み履歴送信手段から送信される読み履歴ベクトル情報の説明図である。本発明の第１の実施形態の端末側装置の読み優先順受信手段によって受信される読み優先順データを示す説明図である。本発明の第１の実施形態の端末側装置における読み履歴データベースを示す説明図である。本発明の第１の実施形態の端末側装置の経路誘導等において用いられる地点情報が含まれた地点データベースを示す説明図である。本発明の第１の実施形態のサーバ側装置の処理を示す説明図である。本発明の第１の実施形態のサーバ側装置の読み履歴記憶手段によって保存される読み履歴ベクトルデータベースを示す説明図である。本発明の第１の実施形態のサーバ側装置の読み履歴登録処理を示す説明図である。本発明の第１の実施形態のサーバ側装置の読み優先順決定処理を示すフローチャートである。本発明の第１の実施形態のサーバ側装置の形態素解析処理に基づく読み優先順決定処理を示すフローチャートである。本発明の第１の実施形態のサーバ側装置の読み優先順決定手段による地点名称の形態素解析結果を示す説明図である。本発明の第１の実施形態のサーバ側装置の読み優先順決定手段による地点名称の形態素解析結果を示す説明図である。本発明の第２の実施形態の端末側装置の構成を示すブロック図である。

（第１の実施形態）
図１は、本発明の第１の実施形態の端末側装置１００、およびサーバ側装置１０１の構成を示すブロック図である。

本発明において用いられる装置は、端末側装置１００およびサーバ側装置１０１の組合せを基本とする。

図１に示す端末側装置１００は、利用者によってテキストが入力され、入力されたテキストを音声として読み上げる装置である。また、図１に示すサーバ側装置１０１は、端末側装置１００に、地点名称などの読み方、または、最も利用者が呼ぶ可能性の高い読み方を示す読み優先順を送信する装置である。

図１に示す端末側装置１００は、読み上げるテキストが入力されるテキスト入力手段１、入力されたテキストの読みを決定する読み決定手段２、決定された読みに従って入力されたテキストを音声に変換する音声合成手段３、変換された音声を利用者に読み上げる音声出力手段９、端末側装置１００に利用者が発した音声を入力する音声入力手段７、利用者によって入力された音声に従って記録されている読み履歴を更新する読み履歴更新手段６、地点名称などの読み方、読み優先順および利用者が音声入力した読み履歴などを保存した読み履歴記憶手段５、記録されている読み履歴をサーバ側装置１０１に送信する読み履歴送信手段４、および、サーバ側装置１０１から通知された読み優先順の情報を受信して読み履歴記憶手段５の情報を更新する読み優先順受信手段８を、少なくとも備える。

図１に示すサーバ側装置１０１は、端末側装置１００から送信される読み履歴ベクトル情報を受信する読み履歴受信手段１１、複数の端末側装置１００から受信した読み履歴ベクトル情報を保存する読み履歴記憶手段１３、保存される読み履歴ベクトル情報に基づいて地点名称などの読み方、および読み優先順を決定する読み優先順決定手段１４、決定された読み優先順を端末側装置１００に通知する読み優先順送信手段１２を、少なくとも備える。さらに、サーバ側装置１０１が新規の地点名称を追加する機能を有する場合には、サーバ側装置１０１は、新規読み受信手段１５を備える。

図２は、本発明の第１の実施形態の端末側装置１００およびサーバ側装置１０１のハードウェアを示すブロック図である。

端末側装置１００は、ＣＰＵ２１、メモリ２２、入力装置２３、出力装置２４、およびＮＷインターフェース２５を備える。また、サーバ側装置１０１は、ＣＰＵ２６、メモリ２７、入力装置２８、出力装置２９、およびＮＷインターフェース３０を備える。

前述の各手段は、各々メモリ２２またはメモリ２７に含まれるプログラムによって実行され、必要に応じて、メモリ２２またはメモリ２７を参照および更新する手段である。

音声出力手段９は、スピーカなどの出力装置２４によって実装され、音声入力手段７は、マイクロフォンなどの入力装置２３によって実装される。プログラムは、ＣＰＵ２１またはＣＰＵ２６によって実行される。また、端末側装置１００とサーバ側装置１０１との間は、インターネット、ＬＡＮまたはＷＡＮなどのネットワーク２０によって接続される。

なお、複数個の端末側装置１００が、サーバ側装置１０１に接続されてよい。

第１の実施形態においては、図１に示す端末側装置１００がカーナビゲーション装置に備わる場合を例に、端末側装置１００およびサーバ側装置１０１に実行される処理を示す。

図３は、本発明の第１の実施形態の端末側装置１００の処理を示す説明図である。

図３に示す説明図は、端末側装置１００による音声を入力する処理と読み方の情報を更新する処理とを示す。カーナビゲーション装置において一般的に実施される、音声の意味を解析するなどの処理は、図３において省略される。端末側装置１００とカーナビゲーション装置とは、物理的に別のハードウェアを用いてもよいし、または、ハードウェアを共用し、プログラムによってわけられていてもよい。

第１の実施形態の端末側装置１００は、音声入力処理２０１、音声合成処理２０２、または読み優先順更新処理２０３のいずれかを実行する。そして、各々の処理の後、次の処理を待つという状態を繰り返す。

音声入力処理２０１は、利用者が発声した音声を端末側装置１００に入力する処理である。音声入力処理２０１は、読み履歴更新手段６、音声入力手段７によって実行される。音声合成処理２０２は、入力された音声を合成する処理である。音声合成処理２０２は、テキスト入力手段１、読み決定手段２、音声合成手段３、および、音声出力手段９によって実行される。読み優先順更新処理２０３は、読み履歴送信手段４、読み履歴記憶手段５、および読み優先順受信手段８によって実行される。

図４は、本発明の第１の実施形態の端末側装置１００の音声入力処理２０１を示す説明図である。

端末側装置１００は、音声入力処理２０１において、音声入力処理３０１、音声認識処理３０２、および読み履歴更新処理３０３を実行する。音声入力処理３０１および音声認識処理３０２は、図１に示す音声入力手段７によって実行され、読み履歴更新処理３０３は、図１に示す読み履歴更新手段６によって実行される。

以下に示す音声入力処理２０１の処理は、例えば、利用者がカーナビゲーション装置に目的地を設定するために、利用者が地点名称を意味する音声を発してカーナビゲーション装置に地点名称を入力する場合の処理である。

音声入力処理２０１が起動された場合、まず音声入力処理３０１が実行される。カーナビゲーション装置の利用者、すなわち運転者が発した音声が、音声入力処理３０１によって端末側装置１００に入力される。

音声入力処理２０１は、利用者によって、または自動的に起動される。端末側装置１００は、音声入力処理３０１において、マイクロフォンなどの入力装置を介して利用者が発した音声を、端末側装置１００に入力する。端末側装置１００は、入力された音声を示す音声データを音声認識処理３０２へ送る。

ここで、利用者が、音声入力処理３０１において「こくぶんじひたち」という音声を発した場合を以下に示す。

続いて、端末側装置１００は、音声認識処理３０２によって、利用者によって入力された音声データを認識する。音声認識処理３０２における音声データの認識は、既存の音声認識アルゴリズムを利用してもよい（例えば、非特許文献１、２参照）。非特許文献１には、音声データを、テキストデータに変換する音声認識アルゴリズムが記載されている。

この音声認識処理３０２の結果、利用者によって入力された音声データは、テキストデータに変換される。利用者が「こくぶんじひたち」と発声した場合、入力された音声データは、音声認識処理３０２によって、「こくぶんじひたち」というカナのテキストデータに変換される。

一般的なカーナビゲーション装置は、このような音声認識の処理によって認識されたテキストデータに基づいて、メモリに備わる地点名称データベースを検索し、利用者が発声した地点が具体的にどの地点を示すかを判定する。そして、カーナビゲーション装置は、判定された地点を、目的地を設定する処理などに送る。

ここで、音声認識処理３０２において認識されたテキストデータに基づいて、利用者が発声した地点が具体的にどの地点をさすかを判定する処理の例を、後述する。

図５は、本発明の第１の実施形態の端末側装置１００による経路誘導等において用いられる地点情報が含まれた地点名称データベース４００の説明図である。

なお、地点名称データベース４００は、カーナビゲーション装置に備わるメモリに保存されてもよいし、端末側装置１００に備わるメモリに保存されてもよい。また、カーナビゲーション装置および端末側装置１００が共有するメモリに保存されてもよい。地点名称データベース４００は、必要に応じて、カーナビゲーション装置または端末側装置１００から参照または更新される。

図５に示す地点名称データベース４００には、カーナビゲーション装置において用いられる可能性のある地点のリストと、それらの地点を音声によって入力された場合に、入力された音声データを照合する地点名称読みデータとが、複数含まれる。地点名称データベース４００は、地点毎に一意に付された識別子である地点ＩＤ４０１、地点の一般的な名称を示す地点名称４０２、および、地点名称の読み方を示す地点名称読み４０３を、少なくとも含む。

図５に示す地点名称データベース４００において、地点ＩＤ４０１が「１」を示す地点名称４０２は、「日立国分寺店」であり、地点名称４０２が「日立国分寺店」を示す地点名称読み４０３は、第１候補が「ひたちこくぶんじてん」、第２候補が「こくぶんじひたち」、第３候補が「ひたちこくぶんじ」である。

図４に示す音声認識処理３０２の結果、入力された音声データが「こくぶんじひたち」であると認識された場合、端末側装置１００は、図５に示す地点名称データベース４００を検索し、地点ＩＤ４０１が「１」である地点名称読み４０３の第２候補と、入力された音声データとが一致すると判定する。その結果、端末側装置１００は、入力された音声データが示す地点の地点名称４０２は、地点ＩＤ４０１が「３」である「日立国分寺店」であると判定する。

音声認識処理３０２において判定された地点名称４０２は、一般的に、カーナビゲーション装置における目的地を設定する処理などに送られる。本発明の第１の実施形態における音声認識処理３０２において判定された地点名称４０２は、読み履歴更新処理３０３に送られる。

音声認識処理３０２から送られた音声データの判定結果に基づいて、端末側装置１００は、読み履歴更新処理３０３において、読み履歴データベース５００の更新処理を実行する。読み履歴データベース５００の更新処理を、図６および図７を用いて示す。

図６は、本発明の第１の実施形態の端末側装置１００における読み履歴データベース５００を示す説明図である。

図６に示す読み履歴データベース５００は、図１に示す読み履歴記憶手段５によって保存され、読み決定手段２によって参照されるデータベースである。読み履歴データベース５００が保存されるメモリは、地点名称データベース４００と同じく、端末側装置１００から参照できれば、カーナビゲーション装置または端末側装置１００のいずれの装置にあってもよい。なお、読み履歴データベース５００は、図５に示す地点名称データベース４００と同じデータによって構成されるため、後述するように地点名称データベース４００を用いてもよい。

読み履歴データベース５００は、地点名称を示す地点表記５０１、および地点名称の読み方を示す地点読み順５０２を、少なくとも含む。地点表記５０１は、地点名称データベース４００における地点名称４０２と同じである。地点読み順５０２は、利用者によって最近使用された地点名称に基づいて、順位が付されており、最近使用された地点名称の読み方には、第１候補が付される。

端末側装置１００は、読み履歴更新処理３０３において、音声認識処理３０２から送られた音声データの判定結果を、読み履歴データベース５００において検索する。本実施形態における端末側装置１００は、音声認識処理３０２の判定結果である地点名称の「日立国分寺店」を、読み履歴データベース５００において検索し、地点表記５０１における「日立国分寺店」と、地点読み順５０２において第２候補である「こくぶんじひたち」とを、音声入力処理３０１において入力された音声データであると判定する。

続いて、端末側装置１００は、読み履歴更新処理３０３において、読み履歴データベース５００の地点読み順５０２において、判定された「こくぶんじひたち」を、最近使用された地点名称の読み方であるため、第２候補から第１候補に更新する。この読み履歴更新処理３０３の結果を、図７に示す。

図７は、本発明の第１実施形態の端末側装置１００における読み履歴データベース５００を示す説明図である。

地点表記５０１が「日立国分寺店」である地点読み順５０２のうち「ひたちこくぶんじてん」は、図６に示す地点読み順５０２において第２候補であったが、読み履歴更新処理３０３によって、図７に示す地点読み順５０２の下線６０１に示すように第１候補に更新される。また、地点表記５０１が「日立国分寺店」である地点読み順５０２のうち「ひたちこくぶんじてん」は、図６に示す地点読み順５０２において第１候補であったが、読み履歴更新処理３０３によって、図７に示す地点読み順５０２の下線６０２に示すように第２候補に更新される。

なお、本実施形態の端末側装置１００は、読み履歴更新処理３０３においても図５に示す地点名称データベース４００を用い、複数の音声入力処理２０１が同時に並行して処理される場合、読み履歴更新処理３０３における更新と音声認識処理３０２における検索とが同時に処理されることによって、音声認識処理３０２の検索結果に影響を受けることはない。

端末側装置１００は、読み履歴更新処理３０３の後、音声入力処理２０１を終了する。

前述の音声入力処理２０１によって、端末側装置１００は、利用者から入力された音声を地点名称として認識し、利用者が最近使用した地点名称の読みを、地点名称の読みの第１候補とすることができる。

次に、図３に示す音声合成処理２０２を、説明する。

図８は、本発明の第１の実施形態の端末側装置１００における音声合成処理２０２を示す説明図である。

音声合成処理２０２は、カーナビゲーション装置において、例えば、目的地へ至る経路に沿って利用者を誘導する音声を読み上げる場合などに、起動される。音声合成処理２０２において、端末側装置１００は、テキスト入力処理７０１、読み決定処理７０２、および音声合成処理７０３を実行する。テキスト入力処理７０１は、テキスト入力手段１によって実行され、読み決定処理７０２は、読み決定手段２によって実行され、音声合成処理７０３は、音声合成手段３によって実行される。

まず、端末側装置１００は、音声合成処理２０２によってカーナビゲーション装置が読み上げようとする音声を示すテキストデータを、テキスト入力処理７０１において入力される。このテキストデータは、カーナビゲーション装置において行われる、目的地へ至る経路に沿って利用者を誘導する音声をカーナビゲーション装置が読み上げる処理から送られたり、センターサーバから受信した配信情報およびメール情報などを音声としてカーナビゲーション装置が読み上げる処理から送られたりする。

続いて、テキスト入力処理７０１によって入力されたテキストデータ、すなわち、カーナビゲーション装置から読み上げられる音声を示すテキストデータは、読み決定処理７０２へ送られる。読み決定処理７０２は、漢字かな混じり文として送られたテキストデータに、テキストデータに含まれる文字列の読みを付与する。

テキストデータに含まれる文字列の読みを付与する処理は、広義には、従来の音声合成技術における言語処理（読み付与処理）も含まれる。一方でこの読み決定処理７０２において、特定の地点名に対して振り仮名を付与するように、部分的な文字列に対して読みを指定する処理とすることも可能である。

従来の音声合成技術における読み付与処理は、形態素解析処理に基づいて構成される。形態素解析処理については、例えば文献「自然言語処理」（長尾真編、岩波書店、１９９６年発行）に詳細な記述がある。

図９は、本発明の第１の実施形態の端末側装置１００の音声合成処理において用いられる単語辞書８００を示す説明図である。

この形態素解析処理は、一般に、図９に示す単語辞書８００を参照して解析処理が行われる。音声合成のための形態素解析処理において用いられる単語辞書８００は、少なくとも表記８０１（単語エントリーとして検索される）、品詞８０２、アクセントを含む読み８０３が含まれる。

例えば、読み決定処理７０２に、漢字かな混じりテキスト「日立国分寺店の先を右折です」が入力され、従来の読みを付与する処理を行う場合、端末側装置１００は、形態素解析処理の単語辞書に含まれる読み情報を用いて、「ひたちこくぶんじてんのさきをうせつです」のように読みを決定する。

本発明における端末側装置１００は、読み決定処理７０２において、図９に示す単語辞書８００に加えて、図６または図７に示す読み履歴データベース５００を用いる。

具体的には、端末側装置１００は、従来の形態素解析処理における形態素の辞書検索処理において、図９に示す単語辞書８００よりも優先して読み履歴データベース５００を検索し、読み履歴データベース５００に含まれる地点表記５０１を、単語エントリーとして検索する。

これによって、端末側装置１００は、読み履歴データベース５００における地点表記５０１と地点読み順５０２とを優先して検索することができ、読みを付与する処理に反映することができる。具体的には、端末側装置１００は、テキスト入力処理７０１において入力されたテキストデータに含まれる地点表記の文字列「日立国分寺店」に、図６に示す読み履歴データベース５００の状態においては「ひたちこくぶんじてん」という読みが、図７に示す読み履歴データベース５００の状態においては「こくぶんじひたち」という読みを、読み決定処理７０２において付与する。

この結果、前述の例に示した「日立国分寺店の先を右折です」が入力された場合、端末側装置１００は、図７に示す読み履歴データベース５００の状態において、入力されたテキストデータに「こくぶんじひたちのさきをうせつです」という読みを付与する。

前述の処理によって読みが付与されたテキストデータは、続いて、音声合成処理７０３に送られ、音声に変換される。この音声合成処理７０３は、例えば、非特許文献１、２に記載されている方法を用いればよい。そして、端末側装置１００は、音声に変換されたデータを、図１に示す音声出力手段９によって読み上げてもよいし、カーナビゲーション装置の処理に出力を戻してもよい。

以上の処理によって、第１の実施形態における端末側装置１００を備えるカーナビゲーション装置は、あらかじめ端末側装置１００に登録されている地点名称を音声として読み上げる場合、利用者が音声によって入力したことのある読みによって読み上げることができる。すなわち、「日立国分寺店」という地点を、「こくぶんじひたち」と呼んでいる利用者には、カーナビゲーション装置も「こくぶんじひたち」という音声を読み上げ、「ひたちこくぶんじ」と呼んでいる利用者には、カーナビゲーション装置も「ひたちこくぶんじ」という音声を読み上げることができる。

これによって、本発明を適用したカーナビゲーション装置は、利用者が慣れ親しんだ名称の呼び方によって、音声ガイダンスをすることが可能となり、利用者にとって利便性が向上する。

次に、図３に示す読み優先順更新処理２０３を、図１０を用いて説明する。

図１０は、本発明の第１の実施形態の端末側装置１００の読み優先順更新処理２０３の処理を示す説明図である。

読み優先順更新処理２０３は、図１に示す読み履歴送信手段４と読み優先順受信手段８とによって実行される。

カーナビゲーション装置は、登録されている地点情報（地点名称を含む）が更新されることがある。具体的には、カーナビゲーション装置が備える経路誘導用の地図データは、定期的に更新されることが多く、ＰＯＩ（ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ：地点）または道路情報などが、追加、修正、または削除される。

従来は、利用者がカーディーラー等の店舗に行って、ＣＤ−ＲＯＭ、またはＤＶＤ−ＲＯＭなどの地図情報記録メディアを交換することによって、カーナビゲーション装置が備える地図データは、更新されていた。しかし、今後のカーナビゲーション装置は、カーナビゲーション装置に接続された携帯電話、または無線ＬＡＮなどを用いて、ネットワーク経由によって更新される場合が増えていくと推測される。

カーナビゲーション装置は、本実施形態における読み優先順更新処理２０３を起動および実行するように構成すれば、手動によって更新しても自動によって更新しても、いずれの更新の方法を採ってもよい。本実施形態においては、ネットワーク経由において地図データを自動的に更新される場合を後述する。

カーナビゲーション装置において、地図データの更新処理が起動された場合、本発明の端末側装置１００における読み優先順更新処理２０３が同時に実行される。

読み優先順更新処理２０３は、図１０に示すように、読み履歴ベクトル作成処理９０１、読み履歴送信処理９０２、読み優先順受信処理９０３、および、読み履歴更新処理９０４の順に処理される。

読み優先順更新処理２０３が起動されると、まず、読み履歴ベクトル作成処理９０１が実行される。

読み履歴ベクトル作成処理９０１は、カーナビゲーション装置の利用者が地点をどのように呼んだか、すなわちその地点の名称がどのように音声として入力されたかを指定する読み履歴ベクトル情報１０００を作成する処理である。

図１１は、本発明の第１の実施形態の端末側装置１００の読み履歴送信手段４から送信される読み履歴ベクトル情報１０００の説明図である。

読み履歴ベクトル情報１０００は、地点名称に関する様々な情報を含んでもよいが、最も簡単には、例えば、図１１に示すように、利用者が端末側装置１００に音声入力し、読み履歴更新処理３０３によって更新された読み履歴データベース５００内における地点表記５０１と地点読み順５０２の第１候補との組みあわせを列挙したベクトル形式であってもよい。図１１に示す地点表記１００１は、図６に示す地点表記５０１であり、図１１に示す地点読み第１候補１００２は、図６に示す地点読み順５０２の第１候補である。

また、前述のように、読み履歴データベース５００と地点データベース４００とを共用する場合の、読み履歴ベクトル情報１０００を示す。

図１２は、本発明の第１の実施形態の端末側装置１００の読み履歴送信手段４から送信される読み履歴ベクトル情報１０００の説明図である。

図１２に示す読み履歴ベクトル情報１０００は、地点ＩＤ１１０１ごとの地点読み第１候補１１０２を列挙したベクトル形式によって示される。図１２に示す地点読み第１候補１１０２のうち「−」を示す行は、利用者による音声の入力がまだなされていない、すなわち、読み履歴更新処理３０３が行われていない地点を示す。

読み履歴ベクトル作成処理９０１によって作成された読み履歴ベクトル情報１０００は、読み履歴送信処理９０２によって、サーバ側装置１０１へ送信される。

読み履歴ベクトル作成処理９０１と、読み履歴送信処理９０２とは、読み履歴送信手段４によって実行される。

読み履歴ベクトル情報１０００は、端末側装置１００からサーバ側装置１０１へ、前述に示したカーナビゲーション装置の地図データの更新と同じく、携帯電話または無線ＬＡＮのようなネットワークを経由して自動的に送信されてもよい。また、例えば、ＵＳＢメモリまたはＳＤメモリカードのようなデータ記録メディアを用いた手作業によって、カーディーラー店舗に設置された地図データを更新するサーバ装置に入力され、カーディーラー店舗に設置されたサーバ装置からサーバ側装置１０１に送られてもよい。

読み履歴ベクトル送信処理９０２が終了すると、続いて読み優先順受信処理９０３が実行される。読み優先順受信処理９０３において、端末側装置１００は、サーバ側装置１０１から読み優先順データ１２００が送信されるまで待機する。

図１３は、本発明の第１の実施形態の端末側装置１００の読み優先順受信手段８によって受信される読み優先順データ１２００を示す説明図である。

図１３に示す読み優先順データ１２００は、図１２に示す読み履歴ベクトル情報１０００と同じく地点ＩＤ１２０１ごとに読み優先順データ１２００が示される形式であるが、前述のように図１１に示す読み履歴ベクトル情報１０００と同じベクトル形式であってもよい。

サーバ側装置１０１から送信される読み優先順データ１２００は、端末側装置１００において新たに追加すべき地点を示す地点ＩＤ１２０１と、その読みを示す地点読み第１候補１２０２とを含む。

図１２に示す読み履歴ベクトル情報１０００において、地点ＩＤ１１０１が「２」であるエントリーは、地点読み第１候補１１０２に「−」と記載されていた。これに対し、図１３に示す読み優先順データ１２００において、地点ＩＤ１２０１が「２」であるエントリーは、地点ＩＤ１２０１の地点読み第１候補１２０２に、「ひたちほんしゃ」という読みが指定される。すなわち、サーバ側装置１０１は、読みが記載されていなかった地点ＩＤに読みを指定して、読みを指定した地点ＩＤを端末側装置１００に送る。

このように、図１３に示す読み優先順データ１２００は、読みを追加すべき地点と読みの組みあわせを、サーバ側装置１０１によって０個以上指定された情報を含む。なお、サーバ側装置１０１によって読みを指定された地点ＩＤ１２０１には、端末側装置１００において新たに追加すべき旨を示すフラグを付加してもよい。

端末側装置１００は、サーバ側装置１０１から図１３に示す読み優先順データ１２００を受信すると、続いて読み履歴更新処理９０４を実行する。

読み履歴更新処理９０４は、サーバ側装置１０１から受信した読み優先順データ１２００に基づいて、読み履歴データベース５００を更新する。すなわち、読み履歴データベース５００に保存される各地点の地点読み順５０２に、受信した読み優先順データ１２００に指定された読みを第１候補として設定する。

例えば、図１３に示す読み優先順データ１２００を受信した場合、地点ＩＤ１２０１が「２」である地点と、その地点読み第１候補１２０２が示す読みとは、新たに読み履歴データベース５００に追加すべき地点とその読みとを示す。

端末側装置１００は、読み優先順受信処理９０３において受信した読み優先順データ１２００から、追加すべき地点と読みとの組み合わせをすべて抽出する。そして、抽出された組み合わせを、対応する読み履歴データベース５００の地点表記５０１と地点読み順５０２とに、第１候補として追加する。

この結果、図７に示す読み履歴データベース５００、または図５に示す地点データベース４００は、それぞれ図１４、および図１５に示す内容に更新される。

図１４は、本発明の第１の実施形態の端末側装置１００における読み履歴データベース５００を示す説明図である。

端末側装置１００は、地点表記５０１が「日立本店」を示すエントリーの地点読み順５０２に、「ひたちほんしゃ」という読みを下線１３０１に示すように第１候補として追加する。

端末側装置１００は、読み優先順データ１２００から抽出した組み合わせのうち、地点ＩＤ１２０１について、地点データベース４００において検索してから、地点表記５０１を検索してもよい。

図１５は、本発明の第１の実施形態の端末側装置１００の経路誘導等において用いられる地点情報が含まれた地点データベース４００を示す説明図である。

端末側装置１００は、地点表記４０１が「２」を示すエントリーの地点名称読み４０３に、「ひたちほんしゃ」という読みを下線１４０１に示すように第１候補として追加する。

読み履歴データベース５００、または地点データベース４００の更新が終了すると、読み優先順更新処理２０３が終了する。

前述の通り、読み優先順更新処理２０３によって、カーナビゲーション装置の利用者がこれまで音声によって入力したことのない地点「日立本店」に、優先すべき読み「ひたちほんしゃ」が指定される。そして、読み優先順更新処理２０３が行われた後、カーナビゲーション装置は、利用者に経路を誘導するために読み上げる音声に、例えば「日立本店の先を右折です」というテキストが指定された場合、前述の音声合成処理２０２における読み決定処理３０２によって、「ひたちほんしゃのさきをうせつです」という読みを読み上げる。

次に、端末側装置１００と連携するサーバ側装置１０１の処理について示す。

サーバ側装置１０１の構成は、図１に示される。以下、この図１に従って、サーバ側装置１０１における処理を示す。

図１６は、本発明の第１の実施形態のサーバ側装置１０１の処理を示す説明図である。

まず、図１１または図１２に示す読み履歴ベクトル情報１０００は、端末側装置１００の読み履歴送信手段４によって、サーバ側装置１０１に送信される。読み履歴ベクトル情報１０００は、サーバ側装置１０１において、読み履歴送信手段４に対応する受信手段である読み履歴受信手段１１によって受信され、続いて、読み履歴記憶手段１３へ送られる（読み履歴受信処理１８０１）。

なお、サーバ側装置１０１は、複数の端末側装置１００から送信される複数の読み履歴ベクトル情報１０００を受信できる。その場合、サーバ側装置１０１は、一つの端末側装置１００から読み履歴ベクトル情報１０００を受信してから、その端末側装置１００に読み優先順データ１２００を送信するまでの間、他の端末側装置１００からの読み履歴ベクトル情報１０００の送信要求を承認せず、他の端末側装置１００を待機させておいてもよい。また、複数の端末側装置１００からの送信要求を、並列に処理してもよい。後者の場合、サーバ側装置１０１は、後述する読み履歴記憶手段１３および読み優先順決定手段１４を排他的に処理する。

以下に示す本実施形態のサーバ側装置１０１は、一つの端末側装置１００から送信された読み履歴ベクトル情報１０００について処理する。

読み履歴ベクトル情報１０００は、端末側装置１００から送信され、読み履歴受信手段１１によって受信されると、読み履歴記憶手段１３に送られて読み履歴ベクトルデータベース１５００に保存される（読み履歴登録処理１８０２）。

図１７は、本発明の第１の実施形態の読み履歴記憶手段１３によって保存される読み履歴ベクトルデータベース１５００を示す説明図である。

読み履歴ベクトルデータベース１５００は、各端末側装置１００から送信される読み履歴ベクトル情報１０００を、端末側装置１００を一意に識別する端末ＩＤ１５０１とともに保存する。例えば、端末ＩＤ１５０１が「１」（以降、端末ＩＤ１と記載する）である端末側装置１００から図１１または図１２に示す読み履歴ベクトル情報１０００が送られた場合、サーバ側装置１０１の読み履歴ベクトルデータベース１５００には、図１７に示すように端末ＩＤ１のエントリーに、受信された読み履歴ベクトル情報１０００が保存される。以降、各端末ＩＤ１５０１に対応するエントリーを、読み履歴ベクトルと記載する。

具体的には、端末側装置１００から送信された読み履歴ベクトル情報１０００の地点ＩＤ１１０１が「１」を示す地点読み第１候補１１０２の値は、読み履歴ベクトルデータベース１５００において、一意に決定される端末ＩＤ１５０１の地点ＩＤ１として保存される。また、読み履歴ベクトル情報１０００の地点ＩＤ１１０１が「２」を示す地点読み第１候補１１０２の値は、読み履歴ベクトルデータベース１５００における地点ＩＤ２に保存される。

他の端末ＩＤ１５０１が示す端末側装置１００から読み履歴ベクトル情報１０００が送信された場合も同じく、サーバ側装置１０１は、対応する端末ＩＤ１５０１の読み履歴ベクトルへ送られた読み履歴ベクトル情報１０００を保存する。

読み履歴登録処理１８０２は、読み履歴記憶手段１３によって保存される読み履歴ベクトルデータベース１５００の読み履歴ベクトルを作成し、作成された読み履歴ベクトルを読み履歴ベクトルデータベース１５００に登録する処理である。

図１８は、本発明の第１の実施形態のサーバ側装置の読み履歴登録処理１８０２を示す説明図である。

読み履歴登録処理１８０２は、受信した読み履歴ベクトル情報１０００に対応する端末ＩＤ１５０１を取得し（端末ＩＤ取得処理１９０１）、取得した端末ＩＤ１５０１を付与された読み履歴ベクトルデータベース１５００の読み履歴ベクトルを作成し（登録データ作成処理１９０２）、読み履歴ベクトルデータベース１５００に登録する（排他的ＤＢ登録処理１９０３）。

読み履歴登録処理１８０２に続いて、後述する読み優先順決定処理１８０３が実行される。

読み優先順決定処理１８０３は、読み履歴ベクトル情報１０００を送信した端末側装置１００に、その端末側装置１００の利用者がまだ音声によって入力していない地点、すなわち受信した読み履歴ベクトル情報１０００内に読みが指定されていない地点の、読みを決定する。なお、読み優先順決定処理１８０３は、読み優先順決定手段１４によって実行される。

図１９は、本発明の第１の実施形態のサーバ側装置１０１の読み優先順決定処理１８０３を示すフローチャートである。

ここで、読み履歴登録処理１８０２において、端末側装置１００から送信された読み履歴ベクトル情報１０００は、端末ＩＤ１の読み履歴ベクトルに保存されたとする。

サーバ側装置１０１は、読み優先順決定処理１８０３において、まず、読み履歴ベクトルデータベース１５００から、端末ＩＤ１の読み履歴ベクトルと比較する他の読み履歴ベクトルを取得する（Ｓ２００１）。

そして、サーバ側装置１０１は、取得された読み履歴ベクトルと端末ＩＤ１の読み履歴ベクトルとの距離、すなわち類似性を、後述する手段によって算出する（Ｓ２００２）。

サーバ側装置１０１は、読み履歴ベクトルデータベース１５００に含まれる全読み履歴ベクトルと、端末ＩＤ１の読み履歴ベクトルとの比較が、すべて終了したか否かを判定する（Ｓ２００３）。

終了していない場合、サーバ側装置１０１は、Ｓ２００１に戻り、まだ端末ＩＤ１の読み履歴ベクトルと比較していない読み履歴ベクトルを取得する。

終了した場合は、サーバ側装置１０１は、Ｓ２００２において算出された距離の中から、最小の距離となる読み履歴ベクトルを取得する（Ｓ２００４）。

サーバ側装置１０１は、最小の距離となる読み履歴ベクトルと、端末ＩＤ１の読み履歴ベクトルとを比較し、端末ＩＤ１の読み履歴ベクトルにおいて指定されていない地点ＩＤに、最小の距離となる読み履歴ベクトルにおける同じ地点ＩＤを持つ値をコピーする（Ｓ２００５）。

最後に、サーバ側装置１０１は、Ｓ２００５によって地点ＩＤの値をコピーされた読み履歴ベクトルによって、読み履歴ベクトルデータベース１５００を更新する（Ｓ２００６）。

Ｓ２００３の詳細を、後述する。

ここで、読み優先順決定手段１４（すなわち、読み優先順決定処理１８０３）によって決定される読みは、利便性の向上のため、その端末側装置１００の利用者が今後、その地点を音声によって入力する場合に使用する可能性の高い読みである必要がある。

利用者によって使用される可能性の高い読みを決定するためのＳ２００３の方法には、例えば、後述する方法がある。

まず、サーバ側装置１０１は、読み履歴記憶手段１３によって読み履歴ベクトルデータベース１５００に保存される読み履歴ベクトルのうち、読み履歴ベクトル情報１０００を送信した端末側装置１００、すなわち本実施形態においては、端末ＩＤ１の読み履歴ベクトルに最も近い読み履歴ベクトルを検索する。

なお、最も近い読み履歴ベクトル、すなわち最も類似している読み履歴ベクトルを検索するために、地点ＩＤ１およびその他の地点ＩＤの値の各々を要素ととらえ、一つの読み履歴ベクトルが複数の要素によってベクトルを構成しているとみなし、そのベクトルの距離を算出することによって、最も類似する読み履歴ベクトルを検索する。

ここで、ベクトルの距離には、例えば、読みの一致または不一致する地点ＩＤの個数によって算出するハミング距離、すなわち読みが一致しなかった地点ＩＤの個数を用いることができる。このとき、読みが指定されていない地点ＩＤ（図１７に示す「−」という記号が記載されている要素）は、読みが一致したものとして算出する。

具体的には、図１７に示す地点ＩＤ１、地点ＩＤ２、地点ＩＤ１０００以外の要素には、「−」が記載されている場合、端末ＩＤ１の読み履歴ベクトルと、端末ＩＤ１５０１が「２」（以降、端末ＩＤ２と記載する）を示す読み履歴ベクトルとのベクトルの距離は、地点ＩＤ１において、双方の値が一致しないため、１と算出される。また、端末ＩＤ１の読み履歴ベクトルと、端末ＩＤ１５０１が「１００」（以降、端末ＩＤ１００と記載する）を示す読み履歴ベクトルとのベクトルの距離は、地点ＩＤ１において、双方の値が一致し、他のすべての値も一致しているとみなせるため、０と算出される。

なお、ベクトルの距離は、ハミング距離そのものではなく、距離を算出する二つの読み履歴ベクトルが各々示すベクトルにおいて算出されたハミング距離を、「−」が記載されていない地点ＩＤの個数によって割った値を距離としてもよい。

また、ベクトルの距離は、あらかじめ地点ＩＤごとに重みを設定しておいて、読みが一致しない地点の重みを合計した値を距離としてもよい。

このベクトルの距離を計算する処理の結果、最も距離の値が低い読み履歴ベクトルの組み合わせが、最も近い読み履歴ベクトルであると判定される。前述の具体例において、端末ＩＤ１の読み履歴ベクトルに最も近い読み履歴ベクトルを持つ端末側装置１００は、ベクトルの距離が０と算出された、端末ＩＤ１００を示す端末側装置１００であると判定される。

続いて、サーバ側装置１０１は、端末ＩＤ１を示す読み履歴ベクトルから最もベクトルの距離が近いと判定された読み履歴ベクトルの中から、端末ＩＤ１の読み履歴ベクトルに読みが指定されていない地点ＩＤを検索し、その地点ＩＤの読みを抽出する。前述の具体例において、サーバ側端末１０１は、最も近いと判定された端末ＩＤ１００の読み履歴ベクトルから、端末ＩＤ１の読み履歴ベクトルには読みが指定されていない読み、すなわち、地点ＩＤ２における読み「ひたちほんしゃ」を抽出する。

前述の具体例においては一つの地点とその読みとが抽出されたが、当然ながら、複数の地点とその読みとの組み合わせが抽出されてもよい。

前述に示す読み優先順決定処理１８０３によれば、端末ＩＤ１から受信した読み履歴ベクトルにおいて指定されていない読みを、最も距離の近い読み履歴ベクトルから抽出し、読みを指定することができる。

しかし、図１９に示す処理のように最も距離の近い読み履歴ベクトルを取得するのではなく、任意の距離に存在する複数の読み履歴ベクトルから、指定されていない読みを抽出してもよい。これによって、受信した読み履歴ベクトルにおいても読みが指定されていなく、また、最も距離の近い読み履歴ベクトルにおいても読みが指定されていない場合に、２番目以降に距離が近い読み履歴ベクトルに指定されている読みから抽出することによって、り指定されていない読みをより減らすことが可能となる。

任意の距離に存在する複数の読み履歴ベクトルから読みを抽出する場合、サーバ側装置１０１は、図１９に示すＳ２００４において、あらかじめ定められた任意の距離に存在する読み履歴ベクトルを取得する。そして、Ｓ２００５において、最も距離の近い読み履歴ベクトルから、受信した読み履歴ベクトルにおいて読みを指定されていなかった地点ＩＤを検索し、最も距離の近い読み履歴ベクトルの地点ＩＤに読みが指定されていない場合は、２番目に距離の近い読み履歴ベクトルを検索する。このように、読みが指定されている読み履歴ベクトルを検索し、指定されている読みの中でも距離が近い読みを抽出する。

以上の読み優先順決定処理１８０３は、複数の地点の読み方が同じ利用者間において、どちらか一方の利用者がいまだ音声によって入力していなかった地点を初めて呼ぶ場合、もう一方の利用者が用いる読み方と同じ読み方によって、呼ぶ傾向が高いという特徴を利用している。すなわち、「日立国分寺店」を「こくぶんじひたち」と呼ぶ端末ＩＤ１に対応する端末側装置１００の利用者は、「日立国分寺店」を「こくぶんじひたち」と呼ぶ端末ＩＤ１００に対応する端末側装置１００の利用者と同じじように「日立本店」という地名を、「ひたちほんしゃ」と呼ぶ可能性が高い。

図１２に示す読み履歴ベクトル情報１０００は、前述の通り読み優先順決定処理１８０３によって更新され、図１３に示す読み優先順データ１２００のように変更される。図１３に示される読み優先順データ１２００は、読み優先順決定手段１４から読み優先順送信手段１２へ送られ、その後、携帯電話、または無線ＬＡＮなどのネットワークを介して端末側装置１００へ送信される（読み優先順送信処理１８０４）。

以上によって、サーバ側装置１０１における、読み履歴ベクトルへの処理を終了する。

サーバ側装置１０１は、新たな地点情報が追加される場合、サーバ側装置１０１に備わる新規読み受信手段１５が実行され、新たな地点ＩＤが追加される。

新たな地点情報を追加する処理は、まず、図１７に示す読み履歴ベクトルデータベース１５００において、新たな地点ＩＤの列を追加し、新たな地点ＩＤの列の値に未設定を示す「−」を記載する。前述のサーバ側装置１０１の処理は、地点の読み履歴ベクトルデータベース１５００の変更のみであるため、新たに追加された地点の名称およびそれらの地点に対応する複数の読み候補を、端末側装置１００に送信することができない。新たな地点情報を、端末側装置１００に追加する処理は、例えばカーナビゲーション装置に備わる地図データ更新技術などを用いて、別途、カーナビゲーション装置から端末側装置１００に送信されてもよい。

しかし、新たな地点情報を追加する処理によって、読み履歴ベクトルデータベース１５００の読みの値に「−」を記載するだけでは、端末側装置１００に優先すべき読みを送信できない。これは新たに追加された地点への読みは、すべての端末側装置１０１の利用者が入力していないため、前述の読み履歴ベクトルの距離、すなわち類似性に基づく読み優先順決定処理１８０３によって読みを決定できないためである。

後述の読み決定方法は、読み履歴ベクトルデータベース１５００において、地点ＩＤが示す地点名称の文字列を形態素解析し、解析結果の距離が近い地点ＩＤに指定されている読みをもとにして、追加された地点の読みを決定する方法である。

なお、後述の読み決定方法は、前述の読み履歴ベクトルの距離、すなわち類似性に基づく読み決定手法の代わりに読み優先順決定処理１８０３において用いられてもよい。

以下、具体例を挙げて説明する。以下の説明において、サーバ側装置１０１は、端末ＩＤ１に対応する端末側装置１００の利用者に、読み優先順決定処理１８０３をする。

図２０は、本発明の第１の実施形態のサーバ側装置１０１の形態素解析処理に基づく読み優先順決定処理１８０３を示すフローチャートである。

まず、読み履歴ベクトルデータベース１５００に、新たに「日立新宿店」という地点名称の文字列が追加されたとする。サーバ側装置１０１は、新規読み受信手段１５によって、新たな地点名称である「日立新宿店」を受信し、受信した新たな地点名称に一意な地点ＩＤを割り当て、読み履歴ベクトルデータベース１５００の列を作成する。

サーバ側装置１０１は、この文字列に形態素解析処理を行う（Ｓ２１０１）。ここで用いる形態素解析処理は、端末側装置１００による読み決定処理７０２において用いられる処理と同じである。

この形態素解析処理の結果、サーバ側装置１０１は、「日立新宿店」から図２１に示す解析結果１６００を得る。

図２１は、本発明の第１の実施形態のサーバ側装置１０１の読み優先順決定手段１４による地点名称の解析結果１６００を示す説明図である。

図２１に示す解析結果１６００は、図９に示す単語辞書８００と同じ列を含む。解析結果１６００は、表記１６０１、品詞１６０２、および読み１６０３を含む。本実施形態のサーバ側装置１０１は、図２１に示すように、地点「日立新宿店」の文字列を、「日立」、「新宿」、および「店」の形態素に分割する。

また、サーバ側装置１０１は、解析結果１６００のうち、品詞１６０２の列のみを抽出し、追加された地点の品詞情報ベクトルを取得する。

次に、サーバ側装置１０１は、読み履歴ベクトルデータベース１５００の端末ＩＤ１の読み履歴ベクトルにおいて、地点ＩＤの読みを取得する（Ｓ２１０２）。そして、取得した地点ＩＤに既に指定されている読みが有るか無しかを判定する（Ｓ２１０３）。指定されている読みがない場合、サーバ側装置１０１は、Ｓ２１０２に戻り、次の地点ＩＤを取得する。

指定されている読みが有る場合、サーバ側装置１０１は、取得された地点ＩＤに対応する地点名称の表記文字列を、Ｓ２１０１の処理と同じく形態素解析する（Ｓ２１０４）。なお、形態素解析処理は、地点情報が追加された際に一度だけ実行し、その解析結果を保存しておいてもよい。

例えば、サーバ側装置１０１は、地点ＩＤ１に対応する地点「日立国分寺店」の文字列から、形態素解析によって、図２２に示す解析結果１７００を取得する。

図２２は、本発明の第１の実施形態のサーバ側装置１０１の読み優先順決定手段１４による地点名称の解析結果１７００を示す説明図である。

読み優先順決定手段１４による解析結果１７００は、図２１と同じく図９に示す単語辞書８００と同じ列を含む。本実施形態のサーバ側装置は、図２２に示すように、地点「日立国分寺店」の文字列を、「日立」、「国分寺」、および「店」に分割する。

そして、解析結果１７００のうち品詞１６０２の列のみを抽出し、既に読みが指定されている地点ＩＤの品詞情報ベクトルを取得する。そして、サーバ側装置１０１は、Ｓ２１０２において取得された追加された地点の品詞情報ベクトルと、既に読みが指定されている地点の品詞情報ベクトルとの距離を算出する（Ｓ２１０５）。この距離計算には、前述した一致および不一致によるハミング距離などを用いてもよい。また、距離計算の手段には、品詞情報ベクトルだけではなく、表記１６０１または読み１６０３を各々情報ベクトルとし、各々の情報ベクトル間の距離を算出し、算出した距離に重みをつけて加算するなどをしてもよい。

次に、サーバ側装置１０１は、既に読みが指定されているすべての地点ＩＤについて、追加された地点の品詞情報ベクトルからの距離を算出したか否かを判定する（Ｓ２１０６）。すべての地点ＩＤについて距離を算出していない場合、サーバ側装置１０１は、Ｓ２１０２に戻る。すべての地点ＩＤについて距離を算出した場合、サーバ側装置１０１は、追加された地点から最も距離が小さい地点を取得する（Ｓ２１０７）。

ここで、品詞情報ベクトルによって、最も距離が小さい（近い）地点を検索した結果、端末ＩＤ１において、地点「日立新宿店」から最も距離が近い地点として、地点「日立国分寺店」が取得されたとする。

次に、サーバ側装置１０１は、読み履歴ベクトルデータベース１５００を参照し、Ｓ２１０７において取得された最も距離が近い地点における、形態素解析結果の読み情報の順序と、その地点ＩＤに設定された読み情報とを比較する。

例えば、読み履歴ベクトルデータベース１５００の端末ＩＤ１において、地点「日立国分寺店」は、「こくぶんじひたち」という読みを優先すべきものとして指定されているとする。そして、図２２に示す解析結果１７００の読み１６０３を用いて、「こくぶんじひたち」という読みを構成できるか否かを判定する。この判定処理には、入力文字列「こくぶんじひたち」に、図２２に示す読み１６０３を用いて、最長一致法アルゴリズムによって全体が一致する文字列を構成できるか否かを判定してもよい。なお、この判定によって、読みを構成できないと判定された場合、サーバ側装置１０１は、Ｓ２１０７に戻り、次に距離が近い地点を取得してもよい。

その結果、サーバ側装置１０１は、図２２に示す２行目の形態素の読み１６０３の「こくぶんじ」と、１行目の形態素の読み１６０３「ひたち」とを結合することによって「こくぶんじひたち」という読みが構成できると判定する。

そして、サーバ側装置１０１は、この２行目の形態素の品詞１６０２「地名」と、１行目の形態素の品詞１６０２「固有名詞」の順番を、追加された地点名称の解析結果１６００に適用し、「しんじゅくひたち」という読みを生成する（Ｓ２１０８）。

前述の処理の結果から、端末ＩＤ１の利用者は、追加された地点「日立新宿店」を、「しんじゅくひたち」という呼び方によって呼ぶ可能性が高いことが推測される。この読み「しんじゅくひたち」は、図１７に示す読み履歴ベクトルデータベース１５００に、追加された地点「日立新宿店」に対応する地点ＩＤに保存され、前述の処理に従って端末側装置１００へ図１３に示す読み優先順データ１２００の形式によって送信される。

この結果、端末側装置１００は、新たに追加された地点「日立新宿店」に「しんじゅくひたち」という読みを第１候補として設定される。そして、端末側装置１００が備わるカーナビゲーション装置における音声ガイダンスは、これ以降、文字列「日立新宿店」に「しんじゅくひたち」という音声を読み上げる。

なお、図２０に示す処理は、前述の新規に追加される地名にも、またはどの端末ＩＤ１５０１においても読みが指定されていない未知地名にも、適用することができる読み優先順決定処理１８０３である。図１９および図２０に示す処理は、読み履歴ベクトルデータベース１５００の読み履歴ベクトル間の距離を算出する処理であり、同様の流れによって行われる。ただし、図２０においては、サーバ側装置１０１から読み優先順データを送信する対象となる端末側装置１００を示す端末ＩＤ１５０１の読み履歴ベクトルのみを用いる。

また、前述において読み履歴ベクトル間の距離を取得するために、品詞情報ベクトルを用いたが、品詞情報のほかにも様々な言語情報またはＰＯＩに関する補足情報（飲食店、施設名などのカテゴリ情報など）を解析結果に含めてもよい。また、Ｓ２１０５における距離を算出するためのアルゴリズムには、前述の品詞情報ベクトル間におけるハミング距離のほかにも、品詞またはＰＯＩカテゴリの近さを考慮した重み付き距離などの様々な方法を用いてもよい。

この図２０に示す処理は、対象となった読み履歴ベクトルのすべての未知地名に読み情報が指定されるまで繰り返されてもよい。

（第２の実施形態）
第２の実施形態では、端末側装置１００およびサーバ側装置１０１という区別を設けずに、同じ装置によって本発明の処理を行う。第２の実施形態は、例えば、外部との通信機能を持たないカーナビゲーション装置においても適用できるし、また、通信機能を有していても、利用者の読み履歴情報をサーバ側装置１０１に送信することができない場合（セキュリティ等）にも適用できる。

図２３は、本発明の第２の実施形態の端末側装置２２００の構成を示すブロック図である。

第２の実施形態において、サーバ側装置１０１は使用されない。このため、端末側装置２２００は、第１の実施形態における端末側装置１００が備える手段と同様な手段を備えるが、読み履歴ベクトル送信手段４および読み優先順受信手段８を備えない。また、読み優先順受信手段８の代わりに、第１の実施形態においてサーバ側装置１０１に備えられた読み優先順決定手段１４と同じ機能を持つ読み優先順決定手段２２０８を備える。第１の実施形態における端末側装置１００に備わる手段と異なる手段は、この読み優先順決定手段２２０８のみであるため、この手段についてのみ後述し、その他の手段については省略する。

この第２の実施形態において、端末側装置２２００は、第１の実施形態のように他の端末側装置１００の読み履歴ベクトル情報１０００、または読み優先順データ１２００を用いて、未知、すなわち新規の地名に読み優先順を決定できない。そのため、読み優先順決定手段２２０８では、第１の実施形態における読み優先順決定処理１８０３の中でも、形態素および品詞情報に基づく読み決定処理、すなわち、図２０に示す形態素ベクトル間距離に基づく読み優先順決定処理を行うことによって、未知、すなわち新規の地名に読み優先順を決定する。これによって、端末側装置２２００のみによって処理する構成が可能となる。

すなわち、第２の実施の形態によれば、端末側装置は、複数の単語を音声にて出力し、前記単語と、当該単語に対応する読みとの組み合わせを保持し、前記保持された単語を形態素解析によって、品詞毎の単位文字列に分割し、前記分割された単位文字列が同じ品詞である場合、前記単位文字列の読みが類似する単語を取得し、前記取得された単語の読みに基づいて、前記単位文字列を並べる順番を特定し、前記特定された単位文字列の順番によって、当該取得された単語と単位文字列の品詞の配列が類似する単語の単位文字列を並べ、前記並べられた単位文字列に基づいて、当該単語の読みを生成し、前記生成された読みによって、前記組み合わせに含まれる単語の読みを更新し、前記更新された組み合わせを用いて、前記単語を音声にて出力するためのデータを作成することを特徴とする。

（第３の実施形態）
また、第１および第２の実施形態の中間段階として、第３の実施形態の端末側装置１００は、サーバ側装置１０１に利用者の読み履歴ベクトル情報１０００全体を送らずに、読み優先順を決定したい地点ＩＤのみを送信し、サーバ側装置１０１によって処理された結果の読み優先順データ１２００を受信してもよい。この場合、第２の実施形態と同じく読み履歴ベクトル間の距離計算ができないため、サーバ側装置１０１における読み優先順決定処理１８０３において、形態素および品詞情報の近さに基づく図２０の処理を行う。

例えば、端末側装置１００は、通信手段を持つがサーバ側装置１０１に大量のデータを送ることができない場合、または端末側装置１００ではＣＰＵの処理性能などの制限によって、第２の実施形態を適用できない場合などに、第３の実施形態は適用可能である。

本発明の第１ないし第３の実施形態によれば、例えばカーナビゲーション装置に備わる端末側装置１００は、音声入力された地点名の読み情報を記録しておく読み履歴記憶手段５と、その情報を音声入力ごとに更新する読み履歴更新手段６と、記憶されている読み履歴ベクトル情報１０００をサーバ側装置１０１に送信する読み履歴送信手段４と、サーバ側装置１０１から送信される読み優先順情報を受信する読み優先順受信手段８と、読み履歴記憶手段５に格納されている読み履歴ベクトル情報１０００を利用して漢字かなテキストへの読みを付与する読み決定手段２とを備えることによって、利用者が音声によって入力した地点名の呼び方を用いて、以降の音声ガイダンスを行うことができる。また、端末側装置１００は、利用者がまだ入力していない地点名称にも、サーバ側装置１０１から送信された読みを用いることによって、利用者がその地点名称を呼ぶ可能性の高い読みによって地点名を読み上げることができる。

すなわち、第３の実施の形態によれば、端末側装置は、前記組み合わせのうち、一部の単語と、当該単語に対応する読みとの組み合わせを前記サーバに送信し、前記サーバ側装置は、前記送信された一部の組み合わせを使用する。

１００端末側装置
１０１サーバ側装置
１テキスト入力手段
２読み決定手段
３音声合成手段
４読み履歴送信手段
５読み履歴記憶手段
６読み履歴更新手段
７音声入力手段
８読み優先順受信手段
９音声出力手段
１１読み履歴受信手段
１２読み優先順送信手段
１３読み履歴記憶手段
１４読み優先順決定手段
１５新規読み受信手段
１０００読み履歴ベクトル情報
１２００読み優先順データ
１５００読み履歴ベクトルデータベース

Claims

複数の単語を読み上げる複数の音声読み上げ端末と、ネットワークを介して前記音声読み上げ端末と接続される読み情報更新サーバとを備える音声読み上げシステムであって、
前記音声読み上げ端末は、
前記単語と、前記単語に指定される読みとの組み合わせを保持し、
前記組み合わせを、前記読み情報更新サーバに送信し、
前記読み情報更新サーバは、
複数の前記音声読み上げ端末から送信された、複数の前記組み合わせを保持し、
前記組み合わせから、前記読みが指定されていない前記単語を取得し、
複数の前記組み合わせの中から、前記単語における前記読みが、当該組み合わせの前記単語における前記読みと類似する複数の他の前記組み合わせを特定し、
前記複数の他の組み合わせから、当該組み合わせにおいて前記読みが指定されていない前記単語の前記読みを抽出し、
前記抽出された読みによって、前記読みが指定されていない単語の前記読みを指定し、
前記単語と前記指定された読みとによって、前記組み合わせを更新し、
前記更新された組み合わせを前記音声読み上げ端末に送信し、
前記音声読み上げ端末は、
保持された前記組み合わせを、前記送信された組み合わせによって更新し、
前記更新された組み合わせに基づいて、前記単語を読み上げることを特徴とする音声読み上げシステム。
前記音声読み上げ端末は、
前記組み合わせに含まれる前記単語に、利用者によって入力された前記単語に対する読みを指定し、
前記単語を読み上げる場合に、前記指定された読みを優先して用いることを特徴とする請求項１に記載の音声読み上げシステム。
前記読み情報更新サーバは、
新たな単語を、前記組み合わせに追加し、
前記新たな単語を追加された前記組み合わせを、前記音声読み上げ端末に送信することを特徴とする請求項１に記載の音声読み上げシステム。
複数の単語を読み上げる複数の音声読み上げ端末と、ネットワークを介して前記音声読み上げ端末と接続される読み情報更新サーバとを備える音声読み上げシステムであって、
前記音声読み上げ端末は、
前記単語と、前記単語に指定される読みとの組み合わせを保持し、
前記組み合わせを、前記読み情報更新サーバに送信し、
前記読み情報更新サーバは、
複数の前記音声読み上げ端末から送信された、複数の前記組み合わせを保持し、
前記複数の単語を形態素解析によって、品詞毎の単位文字列に分け、
同じ前記品詞において、前記文字列が当該単語の文字列と類似する他の前記単語を取得し、
前記他の単語に指定される前記読みに基づいて、前記単位文字列を並べる順番を特定し、
前記特定された単位文字列の順番に基づいて、前記単語の単位文字列を並べ、
前記並べられた単位文字列から、単語の読みを生成し、
前記生成された読みによって、前記組み合わせの前記読みを更新し、
前記更新された組み合わせを前記音声読み上げ端末に送信し、
前記音声読み上げ端末は、
保持された前記組み合わせを、前記送信された組み合わせによって更新し、
前記更新された組み合わせに基づいて、前記単語を読み上げることを特徴とする音声読み上げシステム。
複数の単語を読み上げる音声読み上げ端末であって、
前記単語と、前記単語に指定される読みとの組み合わせを保持し、
新たな前記単語を、前記組み合わせに追加し、
前記複数の単語を形態素解析によって、品詞毎の単位文字列に分け、
同じ前記品詞において、前記文字列が当該単語の文字列と類似する他の前記単語を取得し、
前記他の単語に指定される前記読みに基づいて、前記単位文字列の順番を特定し、
前記特定された単位文字列の順番に基づいて並べられた前記単語の文字列から、前記単語の読みを抽出し、
前記抽出された読みによって、前記組み合わせの前記読みを更新することを特徴とする音声読み上げ端末。