JP4655268B2 - 音声出力システム - Google Patents

音声出力システム Download PDF

Info

Publication number
JP4655268B2
JP4655268B2 JP2005119423A JP2005119423A JP4655268B2 JP 4655268 B2 JP4655268 B2 JP 4655268B2 JP 2005119423 A JP2005119423 A JP 2005119423A JP 2005119423 A JP2005119423 A JP 2005119423A JP 4655268 B2 JP4655268 B2 JP 4655268B2
Authority
JP
Japan
Prior art keywords
voice
data
narrator
output
guidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005119423A
Other languages
English (en)
Other versions
JP2006301059A (ja
Inventor
章博 大矢
慶範 渡辺
貴士 石嵜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2005119423A priority Critical patent/JP4655268B2/ja
Publication of JP2006301059A publication Critical patent/JP2006301059A/ja
Application granted granted Critical
Publication of JP4655268B2 publication Critical patent/JP4655268B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)

Description

本発明は、ユーザに対する種々のメッセージを音声で案内し、その案内に用いる音声の声質をユーザの好みに合わせることを可能とした音声出力システムに関するものである。
車両の走行に伴ってGPS(Global Positioning System:全地球測位システム)等により現在位置を検出し、その現在位置を表示装置上に道路地図と共に表示して、現在地から目的地までの適切な経路を設定し、表示装置や音声出力装置などによって案内する車両用ナビゲーション装置は、ユーザの効率的で安全な運転に貢献している。
この車両用ナビゲーション装置の中には、音声案内機能を有するものがある。音声案内機能は、ユーザに音声でメッセージを通知する機能であり、車両用ナビゲーション装置に対する特定の操作がなされたとき、あるいはいろいろな機能の実行中に音声案内が実行される。例えば、車両用ナビゲーション装置には、交差点案内機能を有するものがあり、この交差点案内の途中で音声案内を実行するものもある。交差点案内では、現在位置が走行予定ルート上の次の経由地交差点まで所定の基準距離に達したとき、音声案内部が交差点案内を開始し、例えば、基準距離が600mであれば、最初に「次の経由地交差点まであと600メートルです。そこを左折してください。」の音声メッセージを流し、その後、次の経由地交差点まで400m、200m、0mに達するたびに、「次の経由地交差点まであと400メートルです。そこを左折して下さい。」、「次の経由地交差点まであと200メートルです。そこを左折して下さい。」、「次の経由地交差点まであと0メートルです。そこを左折して下さい。」という音声メッセージを流す。これにより、ユーザは次の経由地交差点までの接近状況と当該経由地交差点での進路がわかり、当該経由地交差点で間違いなく所望の進路へ進むことができる。
しかし、従来の車両用ナビゲーション装置においては、音声メッセージとして、単一の声質の音声メッセージしか出力されない場合が多いが、ユーザによっては、他の声質のメッセージを出力したい場合がある。例えば、男性の場合には、女性の声質を好むが、女性の場合には男性の声質を好んだりする。それに対して、音声を変える発明として合成音声による音声出力を別の声質の合成音声に切替える仕組みや、音声データによる音声出力を別の音声データに置き換えることで別の声質で音声出力する仕組みが提案されている。
例えば、案内音声の声質の変更を音声データの置き換えにより実現する地図表示装置が提案されている(特許文献1参照)。
特開2003−177029号公報
特許文献1をはじめとする従来技術においては、音声合成の方法には、音声波形をそのままあるいは符号化して蓄積しておき、必要に応じて繋ぎあわせる録音編集方式、音声波形を分析してパラメータに変換された形で蓄積し、それを繋ぎ合せて音声合成回路を駆動し音声を作り出すパラメータ編集方式、文字列あるいは音素記号列から、音声学的・言語学的規則に基づいて、音声を作り出す規則合成方式などがある。
車両用ナビゲーション装置では、上記のパラメータ編集方式,規則合成方式に相当する合成音声で出力されている部分と、録音編集方式に相当する音声データにより出力されている部分があり、これら両方の部分を好みの音声に変換する仕組みが必要となる。よって、全ての音声データを好みの声質の音声データに置き換える場合には、全音声データを別の声質で再収録が必要になるだけでなく、例えば声質が2つであればデータ量が2倍になるため記憶装置の容量を圧迫し製造コストも上昇するという問題がある。
上記問題を背景として、本発明の課題は、低コストで音声メッセージをユーザの好みの声質に変更可能とする音声出力システムを提供することにある。
課題を解決するための手段および発明の効果
本発明は、上記課題を解決するための音声出力システムを提供するものである。即ち、音声メッセージとなる音声データを、音声データIDを付して格納する音声データ格納部と、予め定められた案内対象地点について音声により案内するための音声出力要求を、音声データIDを指定すること、または音声メッセージを生成する基となるテキストデータを生成することにより出力する音声出力要求手段と、ユーザが音声メッセージのナレータの声質を選択する声質選択手段と、音声出力要求が出力されたときに、音声データ格納部に格納されている、音声データIDあるいはテキストデータに対応する、ユーザが選択したナレータの声質の音声データを音声メッセージとする音声管理手段と、を備え、
音声管理手段は、テキストデータから音声メッセージを合成する音声合成手段を含み、音声管理手段は、ユーザが選択したナレータの声質に対応する音声データが音声データ格納部に格納されていないとき、音声データIDに対応する音声データをテキストデータに変換出力し、
ナレータを特定するインデックスとナレータの声質の特徴を示す特徴データを含む変換テーブルをさらに備え、
音声合成手段は、音声管理手段が変換出力したテキストデータを基に、変換テーブルを用いてナレータの声質の特徴を示す音声メッセージを合成するとともに、音声出力要求に含まれるテキストデータに対応する、ユーザが選択したナレータの声質に対応する音声データが音声データ格納部に格納されていない場合、テキストデータを基に、変換テーブルを用いてナレータの声質の特徴を示す音声メッセージを合成し、音声管理手段で生成された音声メッセージを出力する音声出力制御手段と、を有することを特徴とする。
本発明は、上記問題に対して音声データを所望の声質にするための枠組みを提供するものである。実現方法としては、音声データIDあるいはテキストデータからなる変換テーブルを持ち、かつ、音声合成手段に用いられる声質情報を置き換えることで、声質の変更を実現する。
上記構成によって、全ての音声データを好みの声質の音声データに置き換える場合には、全音声データを別の声質で再収録する必要はなく、例えば声質が2つあっても声の特徴を表す声質データのみ記憶すればよいので、記憶装置の容量を圧迫することもないため製造コストも上昇を抑制することができる。
また、上記構成によって、ユーザは所望の声質による音声メッセージを聞くことができる。
また、本発明の音声出力システムは、車両の現在位置を検出する位置検出手段と、電子地図データを記憶する地図データ記憶手段と、現在位置から目的地までの案内経路を探索する経路探索手段と案内経路を電子地図データ上に示して案内を行なう経路案内手段と、案内経路に含まれる案内対象地点につい音声により案内するための音声出力要求を音声出力要求手段により出力し、音声出力制御手段から出力される当該音声出力要求に対応する音声メッセージにより案内を行なう音声案内手段と、を有する構成をとることができる。
車両用ナビゲーション装置では、音声による案内は欠かせないものになっている。上記構成によって、音声案内の声質をアイドルやアニメキャラクタやアナウンサーの声に変更し、快適な運転に寄与することができる。
低コストで音声メッセージをユーザの好みの声質に変更可能とする音声出力システムを提供するという目的を、音声データIDまたはテキストデータを含む音声出力要求を、ユーザが設定したナレータの声質に対応した変換テーブルを用いて変換し、変換後のデータが音声データIDの場合は音声データを使って音声出力し、テキストデータの場合は音声合成部で音声データを合成して音声出力する構成により実現した。
以下、本発明の実施の形態を、図面に示す実施例を参照しながら説明する。図1は本発明の音声出力システムを車両用ナビゲーション装置に適用した構成図である。なお、本発明の音声出力システムの適用範囲を車両用ナビゲーション装置に限定するものではない。
図1は車両用ナビゲーション装置(以下、ナビゲーション装置と略称する)100の全体構成を示すブロック図である。ナビゲーション装置100は、位置検出器1,地図データ入力器6,操作スイッチ群7,リモートコントロール(以下リモコンと称する)センサ11,音声合成装置24およびスピーカ15,不揮発メモリ9,表示装置10,ハードディスク装置(HDD)21,これらの接続された制御回路8,リモコン端末12を備えている。
本発明の位置検出手段である位置検出器1は、周知の地磁気センサ2,ジャイロスコープ3,距離センサ4,および衛星からの電波に基づいて車両の位置を検出するGPSのためのGPS受信機5を有している。これらのセンサ等2,3,4,5は各々が性質の異なる誤差を持っているため、複数のセンサにより各々補完しながら使用するように構成されている。なお、精度によっては前述したうちの一部センサで構成してもよく、さらに、ステアリングの回転センサや各転動輪の車輪センサすなわち車速センサ23等を用いてもよい。
操作スイッチ群7は、例えば表示装置10と一体になったタッチパネル22もしくはメカニカルなスイッチが用いられる。タッチパネル22は、表示装置10の画面上にガラス基盤と透明なフィルムにスペーサと呼ばれる隙間を介してX軸方向、Y軸方向に電気回路が配線され、フィルム上を使用者がタッチすると、押された部分の配線がショートして電圧値が変わるため、これを2次元座標値(X,Y)として検出する、いわゆる抵抗膜方式が広く用いられる。その他に、縦横に微細に配置された赤外線センサ、赤外線センサが検出した指等の接触を電気信号に変えるパネル部分、電気信号を外部機器へ送るための信号処理回路、および、これらを制御するコントローラを含んで構成され、例えば指やタッチペンなどでその赤外線を遮断すると、その遮断した位置が2次元座標値(X,Y)として検出される方式を用いてもよい。あるいは、透明な導電性基盤のガラス面に電気信号を受ける物質を塗布し、指をガラス面に近づけると静電容量の変化を電気信号としてセンサで検知する、いわゆる静電容量方式を用いてもよい。
メカニカルスイッチ,タッチパネルの他に、マウスやカーソル等のポインティングデバイスを用いてもよい。また、マイク31および音声認識ユニット30を用いて種々の指示を入力することも可能である。これは、音声認識ユニット30に接続されるマイク31から音声を入力することによって、その音声信号を周知の音声認識技術により音声認識処理して、その結果に応じた操作コマンドに変換するものである。音声認識ユニット30は、マイク31から入力された音声信号を適切なレベルに増幅する増幅器と、増幅後の音声信号をA/D変換した後、周知の隠れマルコフモデル等の音声認識アルゴリズムにより音声を識別するための音声信号処理装置(DSP:Digital Signal Processor)、音声を識別するための基準データが記憶されているメモリ等で構成されており、DSPにより音声信号がその音声に対応した数値情報に変換された後、制御回路8に送られる。これら本発明の声質選択手段でもある操作スイッチ群7,タッチパネル22,リモコン端末12,マイク31によって、種々の指示を入力することが可能である。
送受信機13は、例えばVICS(Vehicle Information and Communication System:道路交通情報通信システム)センタ14から道路交通情報を受信するための装置である。
また、ETC(自動料金収受システム,ETC:Electronic Toll Collection)車載器16と通信することにより、ETC車載器16がETC路上器から受信した料金情報などを本ナビゲーション装置100に取り込むことができる。また、ETC車載器16によって外部ネットワークと接続し、VICSセンタ14との通信を行なう構成をとってもよい。
本発明の経路探索手段,経路案内手段である制御回路8は通常のコンピュータとして構成されており、周知のCPU81,ROM82,RAM83,入出力回路であるI/O84およびこれらの構成を接続するバスライン85が備えられている。CPU81は、HDD21に記憶されたナビプログラム21pおよびデータにより制御を行なう。また、HDD21へのデータの読み書きの制御はCPU81によって行なわれる。A/D変換部86は周知のA/D(アナログ/デジタル)変換回路を含み、例えば位置検出器1などから制御回路8に入力されるアナログデータをCPU81で演算可能なデジタルデータに変換するものである。
本発明の音声データ格納部,地図データ記憶手段でもあるHDD21には、ナビプログラム21pの他に位置検出の精度向上のためのいわゆるマップマッチング用データ、道路の接続を表した道路データを含む地図データ21mが記憶される。地図データ21mは、表示用となる所定の地図画像情報を記憶すると共に、リンク情報やノード情報等を含む道路網情報を記憶する。リンク情報は、各道路を構成する所定の区間情報であって、位置座標、距離、所要時間、道幅、車線数、制限速度等から構成される。また、ノード情報は、交差点(分岐路)等を規定する情報であって、位置座標、右左折車線数、接続先道路リンク等から構成される。また、リンク間接続情報には、通行の可不可を示すデータなどが設定されている。
また、HDD21には経路案内の補助情報や娯楽情報、その他に使用者が独自にデータを書き込むことができ、ユーザデータ21uとして記憶される。これらのユーザデータ21uは、操作スイッチ群7およびリモコン端末12の操作あるいはマイク31からの音声入力によって内容の書き換えが可能である。
また、地図データ21mおよびユーザデータ21uは、地図データ入力器6を介して記憶媒体20からそのデータの追加・更新を行なうことが可能である。記憶媒体20は、そのデータ量からCD−ROMやDVDを用いるのが一般的であるが、例えばメモリカード等の他の媒体を用いてもよい。
不揮発メモリ9はEEPROM(Electrically Erasable & Programmable Read Only Memory:電気的消去・プログラム可能・読出し専用メモリ)やフラッシュメモリ等の書き換え可能な半導体メモリによって構成され、ナビゲーション装置100の動作に必要な情報およびデータが記憶されている。なお、不揮発メモリ9は、車両のアクセサリスイッチがオフ状態(即ち、ナビゲーション装置100がオフ状態)になっても、記憶内容が保持されるようになっている。
また、不揮発メモリ9の代わりにナビゲーション装置100の動作に必要な情報およびデータをHDD21に記憶してもよい。さらに、ナビゲーション装置100の動作に必要な情報およびデータを不揮発メモリ9とHDD21に分けて記憶してもよい。この場合、HDD21よりも不揮発メモリ9へのアクセス速度の方が速いため、読み書きの頻度が比較的多いものを不揮発メモリ9に記憶し、読み書きの頻度が比較的少ないものをHDD21に記憶するとよい。不揮発メモリ9に記憶された内容をHDD21にバックアップ保存するようにしてもよい。
表示装置10は周知のカラー液晶表示器で、例えばドット・マトリックスLCD(Liquid Crystal Display)およびLCD表示制御を行なうためのドライバ回路を含んで構成されている。ドライバ回路は、例えば、画素毎にトランジスタを付けて目的の画素を確実に点灯させたり消したりすることができるアクティブマトリックス駆動方式が用いられ、制御回路8から送られる表示指示および表示画面データに基づいて表示を行なう。また、表示器として有機EL(ElectroLuminescence:電界発光)表示器,プラズマ表示器を用いてもよい。
車速センサ23は周知のロータリエンコーダ等の回転検出部を含み、例えば車輪取り付け部付近に設置されて車輪の回転を検出してパルス信号として制御回路8に送るものである。制御回路8では、その車輪の回転数を車両の速度に換算して、車両の現在位置から所定の場所までの予想到達時間を算出したり、車両の走行区間毎の平均車速を算出する。
外部機器接続装置26は、センサや他の制御機器等の外部機器とデータ伝送可能に接続するための入出力回路,コネクタを含むものである。以下の機能の一つあるいは少なくとも二つ以上を実現可能な構成となっている。
(1)不揮発メモリ9あるいはHDD21に記憶された内容をバックアップするためのデータバックアップ装置の接続
(2)他の車載機器とデータ伝送を行なうための車内LAN(Local Area Network)の通信インターフェース回路
(3)携帯電話機17を介しての外部ネットワーク接続
また、外部機器接続装置26を介して車速センサ23からのデータ取り込み、あるいはETC車載器16との接続を行なってもよい。
このような構成を持つことにより、ナビゲーション装置100は、制御回路8のCPU81によりナビプログラム21pが起動されると、ユーザが操作スイッチ群7あるいはリモコン端末12の操作あるいはマイク31からの音声入力によって、表示装置10上に表示されるメニューから目的地経路を表示装置10に表示させるための経路案内処理を選択した場合、次のような処理を実施する。
即ち、使用者が地図上の任意の地点あるいは施設検索や住所検索、使用者が設定した登録地などから地点を選択して目的地として設定すると、GPS受信機5から得られる衛星のデータに基づき車両の現在位置が求められ、該現在位置から目的地までの最適な案内経路を求める処理が行われる。そして、表示装置10上の道路地図に案内経路を重ねて表示し、ユーザに適切な経路を案内する。このような自動的に最適な案内経路を設定する手法は、ダイクストラ法等の手法が知られている。また、表示装置10およびスピーカ15の少なくとも一方によって、操作時のガイダンスや動作状態に応じたメッセージの報知を行なう。
ダイクストラ法では、リンク情報,ノード情報,リンク間接続情報を用いて、現在地から各ノードに至るまでの経路評価値(経路計算コスト)を算出し、目的地までの全ての経路評価値の計算が終了した段階で、総評価値が最小となるリンクを接続して目的地までの経路を設定している。この場合の評価値は、道路長・道路種別・道路幅員・車線数・交差点での右左折・信号機の有無などに応じて設定されている。例えば、道路幅員が広いほど評価値が低く、車線数が多いほど評価値が低い。
各リンクでの経路計算コストの計算は、例えば次式を用いて行われる。経路計算コスト=リンク長×道路幅員係数×道路種別係数×渋滞度。ここで、道路幅員係数とは道路幅に応じて設定される係数であり、道路種別係数とは有料道路等の道路種別に応じて設定される係数である。そして、渋滞度とは、その道路の渋滞度合に応じて設定される係数である。
最適な案内経路が求められると、制御回路8は案内経路の右左折する交差点あるいは案内の目印となる建物等の案内対象点を設定する。そして、設定された案内対象点に対し、車両がある一定距離まで近づいたときに音声により案内すべきポイントとして、案内実施点を決定する。案内実施点は、例えば、案内対象点が交差点の場合、一般道では700m手前,300m手前,100m手前、高速道路では2km手前,1km手前,500m手前といったように複数設定することができる。
図2に、本発明の音声案内手段,音声出力要求手段,音声管理手段,音声合成手段,音声出力制御手段である音声合成装置24の詳細を示す。音声合成装置24は、声質を管理するナレータ判定部24a,音声出力の要求を音声データあるいはテキストデータとして出す本発明の音声出力要求手段である音声出力要求部24b,音声出力要求部24bからの音声出力要求をナレータ情報と変換テーブルを用いて変換する本発明の音声管理手段である音声管理部24c,テキストデータから音声に変換する本発明の音声合成手段である音声合成部24d,音声管理部24cまたは音声合成部24dからの音声データをスピーカ15から出力する本発明の音声出力制御手段である音声出力制御部24eを含んで構成される。
音声管理部24cは通常のコンピュータとして構成されており、周知のCPU241,ROM242,RAM243等が含まれている。CPU241は、ROM242あるいはRAM243に記憶された音声管理プログラムおよびデータにより制御を行なう。
ナレータ判定部24aは操作スイッチ群7,タッチパネル22,リモコン端末12,あるいはマイク31からの入力操作によって、制御回路8からナレータ変更要求が送られてきた場合、HDD21に領域が確保される図4のような変換テーブル記憶領域のインデックス一覧すなわちナレータ一覧を、図3のように表示装置10の画面上に表示する。ユーザが所望のナレータつまり声質を選択すると、そのナレータ情報がナレータ判定部24aに含まれる図示しない不揮発メモリの所定の記憶領域に記憶される。ナレータ情報をHDD21あるいは不揮発メモリ9に記憶してもよい。
HDD21に領域が確保される音声データ格納部21sには、音声データIDとそのIDに対応した音声データが記憶されている。例えば、音声データIDが100の音声データは「間もなく目的地です」である。音声データ格納部21sの音声データはナレータがデフォルトに設定されている場合に用いられるものである。また、音声データ格納部21sには、音声案内に用いられるテキストデータの自然な読み方にできるだけ近い読み方が得られるように、テキストデータを、その表記された単位ではなく、音韻解析などに基づいて発声に適した単位に分割した、その単位毎の音声波形信号が音声合成用データとして格納されている。
また、HDD21に領域が確保され、その詳細が図4に示される変換テーブル21tはナレータを特定するインデックスとナレータの声質の特徴を示す特徴データを含んで構成される。特徴データは、音声に対して所定の波形処理を行ない、声質の特徴を示す特徴データを抽出あるいは生成されたもので、入力音声の基本周波数,パワー,スペクトル包絡,あるいはこれらから生成した声紋データ等が含まれる。勿論、これ以外にも、話者固有の声質を反映可能なものであれば特徴データとして使用可能である。
変換テーブル21tのナレータとその特徴データは予め記憶されているものであるが、ユーザが好みのナレータとその特徴データを登録することも可能である。例えば,マイク31からの人の音声信号、外部機器接続装置26等に接続された図示しないCDプレーヤ,MDプレーヤ33にて再生された音楽CDやMDなどに記憶されている音声信号、TVチューナ34,ラジオチューナにて受信された音声信号などを、音声認識ユニット30に含まれる図示しない音声データ抽出部によって所定の波形処理を行ない、声質の特徴を示す特徴データを抽出あるいは生成するものである。なお、これらCDプレーヤ,MDプレーヤ,TVチューナ34,ラジオチューナに関しては必ずしもこれら全てを備える必要はなく、いずれか一つだけでもよい。
音声出力制御部24eは、周知のD/A変換器,増幅器,電子ボリュームを含んで構成される。音声管理部24cあるいは音声合成部24dからの音声データをD/A変換器でアナログデータに変換し、操作スイッチ群7等で設定された電子ボリューム音量となるように増幅器の増幅率を調整してスピーカ15から音声データを出力する。
図5に音声合成出力処理のフロー図を示す。なお、本処理はROM242に記憶されCPU241により実行される音声管理プログラムに含まれ、音声管理プログラムの他の処理とともに繰り返し実行される。また、音声合成装置24以外の制御回路8に接続される回路・機器に関する制御処理はナビプログラム21pにおいて実行される。
ユーザの操作に対するガイダンスメッセージ送出あるいは経路案内地点に到達したことによる案内音声送出等のために制御回路8から音声出力要求が送られると、音声出力要求部24bでは該音声出力要求の内容に基づいて、音声出力の要求を、出力メッセージの内容がデフォルト音声データとして音声データ格納部21sに含まれている場合にはそのメッセージの音声データIDを、あるいは音声データ格納部21sに含まれていない場合には出力メッセージに対応したテキストデータとして音声管理部24cに送る(S1)。
音声管理部24cでは、受け取った音声出力要求およびナレータ判定部24aの保持するナレータ情報の内容に基づいて、そのナレータ情報に対応した変換テーブルを用いて変換を行なう。
音声出力要求は、図7のように音声データIDとテキストデータが混在することもあり、データの最後に末尾を示すEOF(End Of File)が付加されている。そして、音声データIDとテキストデータとを区別するために、データの最上位ビットの値が音声データIDは0,テキストデータは1となっている。音声管理部24cでは、まず、音声出力要求の先頭からデータを参照し、音声データIDとテキストデータとの区別を行なった上で順次以下の処理を行ない、EOFデータを読み込んだら処理を終了する。
音声出力要求の内容が音声データIDで、変換後の音声データが音声データ格納部21sに記憶されている場合すなわち、そのナレータの音声データが音声データ格納部21sに記憶されている場合(S3:Yes)には、その記憶されている音声データIDに対応する音声データを音声出力制御部24eに送り、音声メッセージが音声出力制御部24eから出力される(S4)。一方、ナレータの音声データが音声データ格納部21sに記憶されていない場合(S3:No)は、音声データIDに対応する音声データをテキストデータに変換して音声合成部24dに送る。
また、音声出力要求の内容がテキストデータで、そのテキストデータに相当して選択されているナレータの音声データが音声データ格納部21sに記憶されている場合(S3:Yes)には、その記憶されている音声データIDに対応する音声データを音声出力制御部24eに送り、音声メッセージが音声出力制御部24eから出力される(S4)。一方、そのテキストデータに相当して選択されているナレータの音声データが音声データ格納部21sに記憶されていない場合(S3:No)は、テキストデータを音声合成部24dに送る。
そして、音声合成部24dでは、受け取ったテキストデータを基に、選択されたナレータ情報に対応する変換テーブルを用いて音声データを合成する(S5)。そして、音声合成部24dは、案内用テキスト情報を構成する各単位に対応する音声データを、なめらかな発声が得られるように連結する波形処理も行なう。これによって、使用した特徴データに対応するナレータの音声にて音声案内が可能な音声データを合成することができる。合成した音声データは音声出力制御部24eから出力される(S6)。
図6を用いて変換前のデータと変換後のデータの対応の一例を示す。
(1)音声出力要求の内容がテキストデータで、テキストデータに対応する音声データが音声データ格納部21sに記憶されている場合は、その音声データを音声出力制御部24eから出力する。
(2)音声出力要求の内容がテキストデータで、テキストデータに対応する音声データが音声データ格納部21sに記憶されていない場合は、音声合成部24dでナレータ情報を反映して音声を合成し音声出力制御部24eから出力する。
(3)音声出力要求の内容が音声データIDで、ナレータの音声データが音声データ格納部21sに記憶されていない場合は、音声管理部24cでテキストデータに変換し、音声合成部24dでナレータ情報を反映して音声を合成し音声出力制御部24eから出力する。
(4)音声出力要求の内容が音声データID列で、ナレータの音声データが音声データ格納部21sに記憶されている場合は、その音声データを音声出力制御部24eから出力する。
(5)音声出力要求の内容が音声データID列で、デフォルトデータとして音声データ格納部21sに記憶されている場合は、その音声データを音声出力制御部24eから出力する。
例えば、デフォルト音声データが女性ナレータで、選択されているナレータ情報が歌手Aの場合、歌手Aに対応した変換テーブルを用いて案内音声を変換することになる。つまり、音声管理部24cへの入力が音声データIDで歌手Aの音声データが音声データ格納部21sに記憶されていない場合、その音声データIDに対応する音声データがテキストデータに変換される。そして、ナレータ情報である歌手Aの情報が音声合成部24dに入力され、音声合成部24dでテキストデータと歌手Aの情報を基に歌手A用の合成音声が作成される。これにより、音声の声質が変換される。
以上、本発明の実施の形態を説明したが、これらはあくまで例示にすぎず、本発明はこれらに限定されるものではなく、特許請求の範囲の趣旨を逸脱しない限りにおいて、当業者の知識に基づく種々の変更が可能である。
車両用ナビゲーション装置の構成を示すブロック図。 音声合成装置周辺の構成を示すブロック図。 声質選択時の画面表示例を示すブロック図。 変換テーブルの一例を示す図。 音声合成出力処理を説明するためのフロー図。 声質変換前のデータと変換後のデータの対応の一例を示す図。 音声出力要求データの一例を示す図。
符号の説明
1 位置検出器(位置検出手段)
7 操作スイッチ群(声質選択手段)
8 制御回路(経路探索手段,経路案内手段)
9 不揮発メモリ
10 表示装置
12 リモコン端末(声質選択手段)
15 スピーカ(音声案内手段)
20 記憶媒体
22 タッチパネル(声質選択手段)
21 ハードディスク装置(音声データ格納部,地図データ記憶手段)
24 音声合成装置(音声案内手段,音声出力要求手段,音声管理手段,音声合成手段,音声出力制御手段)
24a ナレータ判定部
24b 音声出力要求部(音声出力要求手段)
24c 音声管理部(音声管理手段)
24d 音声合成部(音声合成手段)
24e 音声出力制御部(音声出力制御手段)
30 音声認識ユニット
31 マイク(声質選択手段)
100 車両用ナビゲーション装置

Claims (2)

  1. 音声メッセージとなる音声データを、音声データIDを付して格納する音声データ格納部と、
    予め定められた案内対象地点について前記音声メッセージの出力により案内するための音声出力要求を、前記音声データIDを指定すること、または前記音声メッセージに対応したテキストデータを生成することにより出力する音声出力要求手段と、
    ユーザが前記音声メッセージのナレータの声質を選択する声質選択手段と、
    前記音声出力要求が出力されたときに、前記音声データ格納部に格納されている、前記音声データIDあるいは前記テキストデータに対応する、前記ユーザが選択したナレータの声質の音声データを前記音声メッセージとする音声管理手段と、
    を備え、
    前記音声管理手段は、前記テキストデータから前記音声メッセージを合成する音声合成手段を含み、
    前記音声管理手段は、前記ユーザが選択したナレータの声質に対応する音声データが前記音声データ格納部に格納されていないとき、前記音声データIDに対応する音声データをテキストデータに変換出力し、
    前記ナレータを特定するインデックスと前記ナレータの声質の特徴を示す特徴データを含む変換テーブルをさらに備え、
    前記音声合成手段は、前記音声管理手段が変換出力したテキストデータを基に、前記変換テーブルを用いて前記ナレータの声質の特徴を示す音声メッセージを合成するとともに、
    前記音声出力要求に含まれるテキストデータに対応する、前記ユーザが選択したナレータの声質に対応する音声データが前記音声データ格納部に格納されていない場合、前記テキストデータを基に、前記変換テーブルを用いて前記ナレータの声質の特徴を示す音声メッセージを合成し、
    前記音声管理手段で生成された音声メッセージを出力する音声出力制御手段と、
    を有することを特徴とする音声出力システム。
  2. 車両の現在位置を検出する位置検出手段と、
    電子地図データを記憶する地図データ記憶手段と、
    前記現在位置から目的地までの案内経路を探索する経路探索手段と、
    前記案内経路を前記電子地図データ上に示して案内を行なう経路案内手段と、
    前記案内経路に含まれる案内対象地点について音声により案内するための音声出力要求を前記音声出力要求手段により出力し、前記音声出力制御手段から出力される当該音声出力要求に対応する音声メッセージにより案内を行なう音声案内手段と、
    を有する請求項1に記載の音声出力システム。
JP2005119423A 2005-04-18 2005-04-18 音声出力システム Expired - Fee Related JP4655268B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005119423A JP4655268B2 (ja) 2005-04-18 2005-04-18 音声出力システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005119423A JP4655268B2 (ja) 2005-04-18 2005-04-18 音声出力システム

Publications (2)

Publication Number Publication Date
JP2006301059A JP2006301059A (ja) 2006-11-02
JP4655268B2 true JP4655268B2 (ja) 2011-03-23

Family

ID=37469454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005119423A Expired - Fee Related JP4655268B2 (ja) 2005-04-18 2005-04-18 音声出力システム

Country Status (1)

Country Link
JP (1) JP4655268B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128099A (ja) * 2008-11-26 2010-06-10 Toyota Infotechnology Center Co Ltd 車載用音声情報提供システム
JPWO2015111256A1 (ja) * 2014-01-24 2017-03-23 クラリオン株式会社 音声調整システム、サーバ及び車載装置
CN113449141A (zh) * 2021-06-08 2021-09-28 阿波罗智联(北京)科技有限公司 语音播报方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0419799A (ja) * 1990-05-15 1992-01-23 Matsushita Electric Works Ltd 音声合成装置
JPH04167749A (ja) * 1990-10-31 1992-06-15 Toshiba Corp 音声応答装置
JPH07210194A (ja) * 1994-01-18 1995-08-11 Hitachi Ltd 音声出力装置
JPH09179576A (ja) * 1995-12-21 1997-07-11 Toshiba Corp 音声合成方法
JPH1097267A (ja) * 1996-09-24 1998-04-14 Hitachi Ltd 声質変換方法および装置
JPH11259271A (ja) * 1998-03-13 1999-09-24 Aqueous Reserch:Kk エージェント装置
JP2001134283A (ja) * 1999-11-04 2001-05-18 Mitsubishi Electric Corp 音声合成装置および音声合成方法
JP2001272993A (ja) * 2000-03-24 2001-10-05 Fujitsu General Ltd 音声合成システム及び緊急通報システム
JP2002229581A (ja) * 2001-02-01 2002-08-16 Hitachi Ltd 音声出力システム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0419799A (ja) * 1990-05-15 1992-01-23 Matsushita Electric Works Ltd 音声合成装置
JPH04167749A (ja) * 1990-10-31 1992-06-15 Toshiba Corp 音声応答装置
JPH07210194A (ja) * 1994-01-18 1995-08-11 Hitachi Ltd 音声出力装置
JPH09179576A (ja) * 1995-12-21 1997-07-11 Toshiba Corp 音声合成方法
JPH1097267A (ja) * 1996-09-24 1998-04-14 Hitachi Ltd 声質変換方法および装置
JPH11259271A (ja) * 1998-03-13 1999-09-24 Aqueous Reserch:Kk エージェント装置
JP2001134283A (ja) * 1999-11-04 2001-05-18 Mitsubishi Electric Corp 音声合成装置および音声合成方法
JP2001272993A (ja) * 2000-03-24 2001-10-05 Fujitsu General Ltd 音声合成システム及び緊急通報システム
JP2002229581A (ja) * 2001-02-01 2002-08-16 Hitachi Ltd 音声出力システム

Also Published As

Publication number Publication date
JP2006301059A (ja) 2006-11-02

Similar Documents

Publication Publication Date Title
JP4804052B2 (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
JP4277746B2 (ja) カーナビゲーション装置
JP4725731B2 (ja) 車載用ナビゲーション装置
RU2425329C2 (ru) Навигационное устройство и способ для приема и воспроизведения звуковых образцов
JP2006092513A (ja) 項目検索装置
WO2016174955A1 (ja) 情報処理装置、及び、情報処理方法
JP2006317421A (ja) 車載制御装置
JP2006201232A (ja) ナビゲーション装置及び地図表示方法
JP4655268B2 (ja) 音声出力システム
US7725255B2 (en) Vehicular display system and method
JP2007241122A (ja) 音声認識装置、音声認識方法、音声認識プログラム、および記録媒体
JP2008139082A (ja) 地図表示装置
JP4869642B2 (ja) 音声認識装置及びこれを備えた車両用走行誘導装置
US20110022390A1 (en) Speech device, speech control program, and speech control method
JP2009288119A (ja) ナビゲーション装置
JP2007113940A (ja) 車両用経路探索装置
JP4705398B2 (ja) 音声案内装置、音声案内装置の制御方法及び制御プログラム
JP4457916B2 (ja) 車両用ナビゲーション装置
JP5092809B2 (ja) 地図表示装置
JP2008046758A (ja) 車載用情報端末、情報端末の操作方法およびメニュー項目の検索方法
JP2007278721A (ja) 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体
JP5028045B2 (ja) 車載表示装置
JP4777524B2 (ja) ナビゲーション装置
JP2006262147A (ja) 車両用音響制御装置
WO2007074739A1 (ja) データ処理装置およびデータ更新方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070719

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101209

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees