JPWO2015111256A1

JPWO2015111256A1 - 音声調整システム、サーバ及び車載装置

Info

Publication number: JPWO2015111256A1
Application number: JP2015558732A
Authority: JP
Inventors: 古郡　弘滋; 弘滋古郡
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2014-01-24
Filing date: 2014-10-15
Publication date: 2017-03-23
Also published as: WO2015111256A1

Abstract

車載装置の記憶容量や処理能力に依存せずに、ユーザに提供する情報の多様化を図ることができる音声調整システム、サーバ及び車載装置を提供する。携帯端末２００は、ユーザ操作を介して音声調整用のパラメータである個人別ＴＴＳパラメータの入力を受け付け、サービス提供サーバ３００は、発話内容を示すテキストデータを記憶する記憶部３０２を有し、個人別ＴＴＳパラメータを取得し、そのパラメータに基づいてテキストデータから音声データを生成し、車載装置１００は、音声データを取得し、取得した音声データに基づいて音声を出力する。

Description

本発明は、音声調整システム、サーバ及び車載装置に関する。

本技術分野の背景技術として、特開２００６−３０１０５９号公報（特許文献１）がある。この公報には、「音声データＩＤまたはテキストデータを含む音声出力要求を、ユーザが設定したナレータの音質に対応した変換テーブルを用いて変換し、変換後のデータが音声データＩＤの場合は音声データを使って音声出力し、テキストデータの場合は音声合成部で音声データを合成して音声出力する。」と記載されている。

特開２００６−３０１０５９号公報

特許文献１では、例えば、ユーザが選択できるメッセージの声質の種類を多くするためには、その特徴を示す特徴データをその分だけ記憶する必要があるが、車両用ナビゲーション装置における記憶装置の容量には限界がある。
そこで、本発明は、車載装置の記憶容量や処理能力に依存せずに、ユーザに提供する情報の多様化を図ることができる音声調整システム、サーバ及び車載装置を提供することを目的とする。

上記目的を達成するために、本発明の音声調整システムは、ユーザ操作を受け付ける携帯端末と、前記携帯端末が通信可能なサーバと、音声データに基づいて音声を出力する車載装置とを備え、前記携帯端末は、前記ユーザ操作を介して音声調整用のパラメータの入力を受け付ける端末側処理部を有し、前記サーバは、発話内容を示すデータを記憶する記憶部と、前記パラメータを取得し、前記パラメータに基づいて前記データから音声データを生成するサーバ側処理部とを有し、前記車載装置は、前記音声データを取得し、取得した前記音声データに基づいて音声を出力する車載側処理部を有することを特徴とする。

本発明によれば、車載装置の記憶容量や処理能力に依存せずに、ユーザに提供する情報の多様化を図ることができる。

図１は本発明の実施形態に係る音声調整システムを示した図である。図２は車載装置の構成を示したブロック図である。図３は携帯端末の構成を示したブロック図である。図４は携帯端末が音声調整プログラムを実行したときの動作を示した図である。図５は調整画面の一例を示した図である。図６は車載装置の起動時の動作を示した図である。図７は編集画面の一例を示した図である。図８は車載装置のユーザが音声認識を利用して行先設定を行うときの動作を示した図である。図９は携帯端末がメール読み上げプログラムを実行したときの動作の一例を示した図である。

以下、図面を参照して本発明の実施の形態について説明する。
図１は、本発明の実施形態に係る音声調整システムを示した図である。
この音声調整システム１は、移動体である車両１０に搭載される車載装置１００と、様々なユーザが携帯する携帯端末２００と、インターネット網などの公衆通信回線網Ｎ１に接続されたサービス提供サーバ３００とを備えている。
なお、後述するように、車載装置１００と携帯端末２００とは、近距離無線通信により通信接続が可能である。また、携帯端末２００とサービス提供サーバ３００とは、公衆通信回線網Ｎ１を介して通信接続が可能である。

図２は、車載装置１００の構成を示したブロック図である。
車載装置１００は、情報処理部１０１と、記憶部１０２と、表示部１０３と、入力部１０４と、ＧＰＳ受信装置１０５と、近距離通信部１０６と、音声入出力部１０７とを備えている。これらの各デバイスは、バス１０８によって電気的に接続され、相互にデータの受け渡しが可能に構成されている。
情報処理部１０１は、バス１１２によって相互に接続されたＣＰＵ１０９、ＲＯＭ１１０、ＲＡＭ１１１および周辺回路（不図示）を有し、車載装置１００を中枢的に制御するコンピューター（車載側処理部）として機能する。例えば、車載装置１００の情報処理部１０１は、記憶部１０２に記憶される制御プログラムを実行することにより、公知のカーナビゲーション装置やカーオーディオ装置が実行する経路案内処理や音声処理などの各種処理を実行する。

経路案内処理の場合、情報処理部１０１は、ＧＰＳ受信装置１０５で受信されたＧＰＳ電波などに基づいて車両１０の現在地を特定し、記憶部１０２に記憶された地図データを用いて、出発地（例えば、現在地）から目的地に至る経路を探索する。また、情報処理部１０１は、地図画像や交通情報などのグラフィックス情報を生成し、表示部１０３に出力するとともに、記憶部１０２から経路案内を行うための音声データを読み出し、車両に設置された不図示のスピーカから案内音声を放音させる。

記憶部１０２には、情報処理部１０１が実行する制御プログラムや各種のデータが記憶される。この記憶部１０２には、例えば、ＨＤＤ（Hard Disk Drive）、半導体メモリ、ＣＤ-ＲＯＭ、または、ＤＶＤ-ＲＯＭが適用される。本実施形態では、この記憶部１０２に、ナビゲーション処理を行う制御プログラムや、携帯端末２００のユーザが発声した音声などを携帯端末２００経由でサービス提供サーバ３００に送信する音声対話型のアプリケーションプログラム（以下、会話プログラムと言う）が記憶されている。
なお、これらプログラムは、公衆通信回線網Ｎ１（図１）を介して取得（ダウンロード）したプログラムでも良いし、車載装置１００に予めインストールされているプログラムでも良い。

表示部１０３は、情報処理部１０１の制御の下、各種の画像を表示する。表示部１０３には、例えば、液晶表示装置が使用される。
入力部１０４は、ユーザ操作を検出して情報処理部１０１に通知する装置であり、操作スイッチや、表示画面に重ねた配置された透過型のタッチパネルを備えている。
ＧＰＳ受信装置１０５は、ＧＰＳ衛星から送信されるＧＰＳ電波を受信し、ＧＰＳ電波に基づいて自車位置や方位などを算出し、情報処理部１０１に出力する。
近距離通信部１０６は、情報処理部１０１の制御の下、近距離無線通信を行うための無線通信インターフェースである。この近距離通信部１０６を用いることにより、車載装置１００と車両内の携帯端末２００との間で無線通信することができる。本実施形態では、近距離無線通信にBluetooth（登録商標）を用いているが、Wi-Fi（登録商標）などでも良い。

音声入出力部１０７は、デコーダやアンプなどを備え、情報処理部１０１の制御の下、各種の音声を、車両１０に設置されたスピーカから出力させる。例えば、音声入出力部１０７は、記憶部１０２に記憶された音声データから音声信号を生成し、スピーカから放音させる。この音声の具体例としては、ナビゲーション用の案内音声、ＣＤ音声、ラジオ音声、携帯端末２００から送信された各種の音声である。また、音声入出力部１０７は、マイクやＡＤ変換回路を有し、ユーザが発声した音声を音声データに変換する機能も具備している。なお、車載装置１００は、公知の車載装置が具備する他の構成を更に具備しても良い。

図３は、携帯端末２００の構成を示したブロック図である。
携帯端末２００は、スマートフォンやＰＤＡ（Personal Data Assistance）である。図３に示すように、携帯端末２００は、情報処理部２０１と、記憶部２０２と、表示部２０３と、入力部２０４と、ＧＰＳ受信装置２０５と、通信部２０６と、近距離通信部２０７と、音声入出力部２０８とを備えている。これらの各デバイスは、バス２０９によって電気的に接続され、相互にデータの受け渡しが可能に構成されている。

情報処理部２０１は、バス２１３によって相互に接続されたＣＰＵ２１０、ＲＯＭ２１１、ＲＡＭ２１２および周辺回路（不図示）を有し、携帯端末２００を中枢的に制御するコンピューター（端末側処理部）として機能する。
例えば、携帯端末２００の情報処理部２０１は、記憶部２０２に記憶される制御プログラムを実行することにより、公知の携帯端末が具備する電話機能や、電子メールを送受信・閲覧するメール機能や、インターネットをブラウジングするブラウジング機能や、インターネットなどから取得した各種アプリケーションプログラムを実行する機能を具備する。

記憶部２０２には、情報処理部２０１が実行する制御プログラムや各種のデータが記憶される。この記憶部２０２には、例えば、半導体メモリまたはＨＤＤが適用される。
本実施形態では、この記憶部２０２に、車載装置１００で使用される音声（ナビゲーション用の案内音声）を調整するためのアプリケーションプログラム（以下、音声調整プログラムと言う）や、車載装置１００と通信するためのアプリケーションプログラム（以下、通信プログラムと言う）や、サービス提供サーバ３００に記憶されるテキストデータを編集するためのアプリケーションプログラム（以下、編集プログラムと言う）が記憶されている。
これらプログラムは、公衆通信回線網Ｎ１（図１）を介して取得（ダウンロード）したプログラムでも良いし、携帯端末２００に予めインストールされているプログラムでも良い。

表示部２０３は、情報処理部２０１の制御の下、各種の画像を表示する装置であり、例えば、液晶表示装置が使用される。
入力部２０４は、ユーザ操作を検出して情報処理部２０１に通知する装置であり、操作スイッチや、表示画面に重ねた配置された透過型のタッチパネルを備えている。
ＧＰＳ受信装置２０５は、ＧＰＳ衛星から送信されるＧＰＳ電波を受信し、ＧＰＳ電波に基づいて携帯端末２００の現在地や方位などを算出し、情報処理部２０１に出力する。

通信部２０６は、情報処理部２０１の制御の下、無線通信網（本実施形態では携帯電話通信網）を経由して公衆通信回線網Ｎ１（図１）などにアクセスし、公衆通信回線網Ｎ１などに接続された機器と通信するための通信インターフェースである。この通信部２０６により、携帯端末２００とサービス提供サーバ３００（図１）との間で通信することができる。また、この通信部２０６により他の携帯端末と電話やメールが可能である。
近距離通信部２０７は、情報処理部２０１の制御の下、近距離無線通信を行うための無線通信インターフェースである。この近距離通信部２０７を用いることにより、携帯端末２００と車載装置１００との間で無線通信することができる。

音声入出力部２０８は、情報処理部２０１の制御の下、各種の音声を、携帯端末２００が備えるスピーカから出力させたり、ユーザの発した音声を、マイクを介して入力し、音声データに変換したりする。この音声入出力部２０８を用いることにより、他の携帯端末と電話したり、携帯端末２００の記憶部２０２に記憶された楽曲などの音声データを再生したりすることができる。なお、車載装置１００は、公知の車載装置が具備する他の構成を更に具備しても良い。

サービス提供サーバ３００は、テキストデータから音声データを作成するなどのサービス、つまり、ＴＴＳ（Text to speech）サービスを提供するサーバである。図１に示すように、サービス提供サーバ３００は、情報処理部３０１と、記憶部３０２と、通信部３０３とを備えており、車載装置１００よりも処理能力が高く、且つ、記憶容量が多い装置に構成されている。
情報処理部３０１は、ＣＰＵ、ＲＯＭおよびＲＡＭなどを備え、サービス提供サーバ３００を中枢的に制御するコンピューター（サーバ側処理部）として機能する。

記憶部３０２には、情報処理部３０１が実行する制御プログラムや各種のデータが記憶される。この情報処理部３０１は、記憶部３０２に記憶される制御プログラムを実行することにより、テキストデータから音声データを作成する音声変換処理などを行うＴＴＳエンジンとして機能することができる。
また、記憶部３０２には、車載装置１００で再生する発話内容（経路案内用の音声など）を示すテキストデータを記述したデータベースや、経路検索などに用いるPoint of Interest（POI）のデータベースも記憶されている。

次に、この音声調整システム１で実行される処理を説明する。
図４は、携帯端末２００が音声調整プログラムを実行したときの動作を示した図である。
携帯端末２００の情報処理部２０１は、ユーザ操作に応じて音声調整プログラムを実行すると、サービス提供サーバ３００へのログイン処理を行う（ステップＳ１Ａ）。この場合、情報処理部２０１が、通信部２０６によりサービス提供サーバ３００へアクセスし、ログイン画面を表示部２０３に表示させる。そして、携帯端末２００のユーザが、入力部２０４を介してログイン情報（例えば、ユーザＩＤやパスワード）を入力することにより、ログインが完了する。

ログインが完了すると、サービス提供サーバ３００の情報処理部３０１が、携帯端末２００の画面に、音声調整用の画面（調整画面）を表示させる（ステップＳ２Ａ）。
図５は、調整画面の一例を示した図である。
調整画面は、音声調整用のパラメータの入力を受け付ける画面であり、より具体的には、音声のピッチ、速度、高低（高さ）、抑揚、性別、種類の入力を受け付ける画面を表示する。なお、パラメータは、上記パラメータに限定されず、適宜に追加・変更しても良い。

図４に戻り、携帯端末２００の入力部２０４を介して音声調整用のパラメータが入力されると、サービス提供サーバ３００の情報処理部３０１は、これらパラメータ群を、個人別ＴＴＳパラメータとして、記憶部３０２に記憶（保存）する（ステップＳ３Ａ）。
この場合、記憶部３０２には、携帯端末２００を識別する識別情報（ユーザＩＤまたは端末ＩＤ）と対応づけて個人別ＴＴＳパラメータが記憶される。これにより、識別情報に基づいて個人別ＴＴＳパラメータを特定することができる。

このようにして、携帯端末２００のユーザは、所有する携帯端末２００を操作して所望のパラメータを設定し、サービス提供サーバ３００に保存しておくことができる。このパラメータ設定時（音声調整プログラム実行時）には、携帯端末２００を車載装置１００に接続しておく必要がない。従って、ユーザは、車両１０内に限らず、車両１０外の任意の場所でパラメータの設定を行うことが可能である。

なお、上記パラメータ設定時において、サービス提供サーバ３００が、予め定めたサンプルのテキストデータを、個人別ＴＴＳパラメータに基づいて音声データ化（音声変換）して携帯端末２００に送り、携帯端末２００側で再生するようにしてもよい。この構成によれば、ユーザが、自身が設定したパラメータの音声を迅速に確認することができる。
また、サービス提供サーバ３００は処理能力が高いため、ほぼリアルタイムで音声データ化することが可能できる。従って、ユーザは、音声を確認しながらパラメータの調整を行うことができる。

図６は、車載装置１００の起動時の動作を示した図である。なお、前提として、車載装置１００と携帯端末２００とを通信接続されているものとする。
車載装置１００が起動すると、車載装置１００の情報処理部１０１は、携帯端末２００の通信プログラムを実行させる。これにより、車載装置１００が携帯端末２００を経由してサービス提供サーバ３００にアクセスし、サーバ３００との間で通信が可能になる。
この場合、車載装置１００の情報処理部１０１は、サービス提供サーバ３００から、個人別ＴＴＳパラメータにより調整された音声データをダウンロードする（ステップＳ１Ｂ）。なお、サービス提供サーバ３００は、携帯端末２００から識別情報（ユーザＩＤまたは端末ＩＤ）を取得し、この識別情報に基づいて単一の個人別ＴＴＳパラメータを特定すれば良い。また、この方法に限らず、携帯端末２００または車載装置１００に対応する個人別ＴＴＳパラメータを特定するための公知の技術を広く適用可能である。

ここで、上記音声データは、サービス提供サーバ３００の記憶部３０２に記憶された定型文のテキストデータ群を音声変換したデータである。つまり、サービス提供サーバ３００は、ＴＴＳエンジンにより、個人別ＴＴＳパラメータに基づいて各テキストデータを音声データ化する。これによって、個人別ＴＴＳパラメータにより調整された音声で各テキストデータの文字に対応する音声のデータを生成する。この音声変換処理は、車載装置１００からダウンロード指示があったときに実行しても良いし、ダウンロード指示よりも前のタイミング（例えば、個人別ＴＴＳパラメータが保存された後の適当なタイミング）で実行しても良い。

ダウンロードが終了すると、車載装置１００の情報処理部１０１は、音声データを記憶部１０２に記憶させ、記憶した音声データを、予め指定されたタイミングで音声入出力部１０７によって再生する（ステップＳ２Ｂ）。これにより、例えば、ダウンロード直後に、”こんにちは、＊＊＊さん”、”お誕生日おめでとう”、”今日も安全運転で行きましょう”と再生することができ、予め設定した自宅に到着したタイミングなどで、”お疲れ様でした”を再生することができる。
このようにして、サービス提供サーバ３００で、携帯端末２００のユーザが希望する音声に変換し、その音声を、車載装置１００で再生することができる。

また、ユーザが携帯端末２００を操作し、編集プログラムを実行させることにより、サービス提供サーバ３００に記憶されるテキストデータを編集することも可能である。この場合、図４に示したステップＳ１Ａと同様のログイン処理を行い、ログインが完了すると、サービス提供サーバ３００の情報処理部３０１が、携帯端末２００の画面に、テキストデータ編集用の画面（編集画面）を表示させる。

図７は、編集画面の一例を示した図である。
この編集画面は、車載装置１００で再生する音声内容に対応する定型文のテキストデータの編集を受け付ける画面である。図７に示すように、編集画面には、サービス提供サーバ３００の記憶部３０２に記憶されるテキストデータ群が表示され、各テキストデータの編集を受け付ける。また、編集されたテキストデータは、携帯端末２００を識別する識別情報（ユーザＩＤまたは端末ＩＤ）と対応づけて記憶部３０２に記憶される。
このようにして、携帯端末２００のユーザは、所有する携帯端末２００を操作してテキストデータを編集し、サービス提供サーバ３００に保存しておくことができる。この編集時（編集プログラム実行時）には、携帯端末２００を車載装置１００に接続しておく必要がないため、ユーザは、車外などの任意の場所でテキストデータの編集を行うことができる。

図８は、車載装置１００のユーザが音声認識を利用して行先設定を行うときの動作を示した図である。なお、この場合も、前提として、車載装置１００と携帯端末２００とが通信接続されているものとする。また、車載装置１００の情報処理部１０１は、ユーザ操作に応じて会話プログラムを実行し、音声入出力部１０７を介して行先（目的地）を指定する音声の入力を待ち受け、音声を入力すると、その音声に対応する音声データを、携帯端末２００を経由してサービス提供サーバ３００に送信する。
サービス提供サーバ３００の情報処理部３０１は、携帯端末２００を経由して受信した音声データを音声認識し、音声認識結果を検索キーとしてＰＯＩ検索（ＰＯＩのデータベースの検索）を行う（ステップＳ１Ｃ）。

次いで、サービス提供サーバ３００の情報処理部３０１は、ＴＴＳエンジンにより、個人別ＴＴＳパラメータを使用して検索結果を読み上げる音声データを生成し、携帯端末２００を経由して車載装置１００に送信する（ステップＳ２Ｃ）。これにより、個人別ＴＴＳパラメータで調整された声の音声データ、つまりユーザが希望する声の音声データが生成され、車載装置１００に送信される。
続いて、車載装置１００の情報処理部１０１は、受信した音声データを再生する処理を行う（ステップＳ３Ｃ）。これにより、車載装置１００においては、ユーザが希望する声で、例えば、”検索結果 ○○件有ります”、”１件目・・・２件目・・・・・”といった音声が再生される。

その後、ユーザ操作により適切な候補（行き先）が選択されると、車載装置１００の情報処理部１０１は、現在地から行き先へ至る推奨経路を検索する処理（行き先設定）を行う（ステップＳ４Ｃ）。
推奨経路が決定すると、車載装置１００の情報処理部１０１は、経路案内処理を開始することにより、例えば、”ルートガイドを始めます・・・３００ｍ先を右折します・・・”といった案内音声を再生する（ステップＳ５Ｃ）。

この場合、案内音声は、サービス提供サーバ３００により個人別ＴＴＳパラメータに基づいて調整された音声で放音される。つまり、サービス提供サーバ３００は、記憶部３０２に記憶された案内音声のテキストデータを、個人別ＴＴＳパラメータに基づいて予め音声データ化しておき、サービス提供サーバ３００から携帯端末２００を経由して車載装置１００に送信し、車載装置１００が記憶部１０２に記憶しておくことにより、車載装置１００で調整済みの案内音声を再生することができる。
このようにして、ユーザが希望する音声で経路案内を行うことができる。なお、このサービス提供サーバ３００が音声データ化するタイミングや、音声データを車載装置１００に送信するタイミングは、案内音声の再生前であれば任意のタイミングに設定することが可能である。

以上説明したように、本実施の形態によれば、携帯端末２００は、ユーザ操作を介して音声調整用のパラメータである個人別ＴＴＳパラメータの入力を受け付け、サービス提供サーバ３００は、発話内容を示すテキストデータを記憶する記憶部３０２を有し、個人別ＴＴＳパラメータを取得し、そのパラメータに基づいてテキストデータから音声データを生成し、車載装置１００は、音声データを取得し、取得した音声データに基づいて音声を出力するので、車載装置１００の記憶容量や処理能力に依存せずに、ユーザが所望する音声を車載装置１００側で再生することができる。また、車載装置１００よりも処理能力が高いサービス提供サーバ３００で音声変換するので、車載装置１００で音声変換する場合よりも音声変換の調整範囲を広くすることができる。これらにより、ユーザに提供する情報の多様化を図ることが可能になる。

しかも、携帯端末２００とサービス提供サーバ３００との間の通信だけで個人別ＴＴＳパラメータを設定するので、車載装置１００を操作することなく、個人別ＴＴＳパラメータを設定することができる。従って、任意の場所、且つ、任意のタイミングで、個人別ＴＴＳパラメータを設定することができ、利便性が向上する。
なお、車載装置１００側で個人別ＴＴＳパラメータを設定しようとすると、専用のメニュー画面やプログラムを用意する必要が生じ、車載装置１００の機能や性能に依存してしまう。言い換えれば、本実施形態では、車載装置１００の機能や性能に依存せずに、パラメータの設定や所望の声に調整された音声データの取得・再生を行うことができる。

また、個人別ＴＴＳパラメータは、音声のピッチ、速度、高低（高さ）などを含むため、ユーザが希望する音声に調整し易い。
さらに、テキストデータから音声データを生成するので、公知の音声変換技術を広く適用することができ、且つ、音声内容の編集や作成などを容易に行うことができる。
また、携帯端末２００の情報処理部（端末側処理部）２０１は、ユーザ操作を介して、サービス提供サーバ３００に記憶されるテキストデータの編集を受け付け、サービス提供サーバ３００の情報処理部（サーバ側処理部）３０１は、上記編集を行うようにテキストデータを編集するので、ユーザが所望する音声内容に容易に調整できる。この場合も、車載装置１００を操作することなく、データを編集できるので、任意の場所、且つ、任意のタイミングで編集することができ、利便性が向上し、車載装置１００の機能や性能に依存することなく編集が可能になる。

また、上述の実施形態は、あくまで本発明の一態様に過ぎず、本発明の範囲内で任意に変更が可能である。例えば、上記実施形態では、音声のピッチ、速度、高低（高さ）、抑揚、性別などを調整可能にする場合を説明したが、これに限らない。例えば、いずれか一つ以上を調整可能にすればよく、調整項目は適宜に増減が可能である。
また、上記実施形態では、テキストデータを、個人別ＴＴＳパラメータに基づいて音声データ化する場合を説明したが、基準となる音声データを予めサービス提供サーバ３００に記憶しておき、この音声データを、個人別ＴＴＳパラメータに基づいてピッチ、速度および高さなどを調整するようにしても良い。

また、上述の実施形態において、更に、携帯端末２００にメール読み上げ用のアプリケーションプログラム（以下、メール読み上げプログラム）を記憶し、このプログラムを用いて、サービス提供サーバ３００により個人別ＴＴＳパラメータで調整された声でメールの音声データを生成し、車載装置１００で再生するようにしても良い。

図９は、携帯端末２００がメール読み上げプログラムを実行したときの動作の一例を示した図である。
図９に示すように、携帯端末２００の情報処理部２０１は、ユーザ操作に応じて音声調整プログラムを実行すると、メールのテキストをサービス提供サーバ３００に送信する（ステップＳ１Ｄ）。次に、サービス提供サーバ３００の情報処理部３０１は、ＴＴＳエンジンにより、個人別ＴＴＳパラメータを使用してメールのテキストを読み上げる音声データを生成し、携帯端末２００を経由して車載装置１００に送信する（ステップＳ２Ｄ）。続いて、車載装置１００の情報処理部１０１は、受信した音声データを再生する処理を行う（ステップＳ３Ｄ）。これにより、車載装置１００においては、ユーザが希望する声で、例えば、”今日の打ち合わせの件、開始時刻が変更になりました”といったメール内容を示す音声を再生することができる。

また、上述の実施形態において、車載装置１００が携帯端末２００の各種機能を有していても良い。例えば、車載装置１００が、ユーザ操作を介して音声調整用のパラメータである個人別ＴＴＳパラメータの入力を受け付け、個人別ＴＴＳパラメータをサービス提供サーバ３００に取得させるようにしてもよい。また、上述の実施形態において、車載装置１００が、インタネット網などの公衆通信回線網Ｎ１に接続されたサービス提供サーバ３００などと無線通信するための通信ユニットを備えるようにし、携帯端末２００を介することなく、サービス提供サーバ３００などと無線通信できるようにしても良い。
また、上述の実施形態において、車載装置１００は、自動車などの四輪車に搭載されるものに限らず、自転車などの二輪車に搭載されるものでも良い。

１音声調整システム
１００車載装置
１０１情報処理部（車載側処理部）
１０２、２０２、３０２記憶部
２００携帯端末
２０１情報処理部（端末側処理部）
３００サービス提供サーバ
３０１情報処理部（サーバ側処理部）

Claims

ユーザ操作を受け付ける携帯端末と、
前記携帯端末が通信可能なサーバと、
音声データに基づいて音声を出力する車載装置とを備え、
前記携帯端末は、前記ユーザ操作を介して音声調整用のパラメータの入力を受け付ける端末側処理部を有し、
前記サーバは、発話内容を示すデータを記憶する記憶部と、前記パラメータを取得し、前記パラメータに基づいて前記データから音声データを生成するサーバ側処理部とを有し、
前記車載装置は、前記音声データを取得し、取得した前記音声データに基づいて音声を出力する車載側処理部を有することを特徴とする音声調整システム。
前記パラメータは、音声のピッチ、速度、高さの少なくともいずれかのパラメータを含むことを特徴とする請求項１に記載の音声調整システム。
前記データは、テキストデータであることを特徴とする請求項１に記載の音声調整システム。
前記端末側処理部は、前記ユーザ操作を介して前記サーバに記憶される前記データの編集を受け付け、
前記サーバ側処理部は、前記端末側処理部で受け付けた編集を行うように前記データを編集することを特徴とする請求項１に記載の音声調整システム。
携帯端末と通信可能なサーバにおいて、
発話内容を示すデータを記憶する記憶部と、
前記携帯端末がユーザ操作を介して受け付けた音声調整用のパラメータを取得し、前記パラメータに基づいて前記データから車載装置で再生する発話内容の音声データを生成するサーバ側処理部とを備えることを特徴とするサーバ。
前記パラメータは、音声のピッチ、速度、高さの少なくともいずれかのパラメータを含むことを特徴とする請求項５に記載のサーバ。
前記データは、テキストデータであることを特徴とする請求項５に記載のサーバ。
前記端末側処理部は、前記ユーザ操作を介して前記サーバに記憶される前記データの編集を受け付け、
前記サーバ側処理部は、前記端末側処理部で受け付けた編集を行うように前記データを編集することを特徴とする請求項５に記載のサーバ。
音声データに基づいて音声を出力する車載装置において、
発話内容を示すデータを記憶する記憶部と、携帯端末がユーザ操作を介して受け付けた音声調整用のパラメータを取得し、前記パラメータに基づいて前記データから音声データを生成するサーバ側処理部とを備えるサーバから前記音声データを取得し、取得した前記音声データに基づいて音声を出力する車載側処理部を有することを特徴とする車載装置。