JP2006098695A - 音声合成装置、制御方法、制御プログラム及び記録媒体 - Google Patents
音声合成装置、制御方法、制御プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2006098695A JP2006098695A JP2004284240A JP2004284240A JP2006098695A JP 2006098695 A JP2006098695 A JP 2006098695A JP 2004284240 A JP2004284240 A JP 2004284240A JP 2004284240 A JP2004284240 A JP 2004284240A JP 2006098695 A JP2006098695 A JP 2006098695A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- text information
- speech synthesis
- synthesis
- synthesizer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 ユーザが入力部11を介して、音声読み上げモードを指定し、あるいは、主制御部4がテキスト情報の内容あるいはテキスト情報の入力元に基づいて音声読み上げモードを指定すると、音声データ生成部15は、指定あるいは設定された音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定し、特定された音声合成パラメータに基づいて音声合成を行って音声として出力する。
【選択図】 図1
Description
TTS(Text To Speech)コントローラを実装し、誘導経路案内に対応するテキスト情報、任意に指定したテキスト情報(VICS情報、メールなど)に基づいて音声合成を行って、読み上げを行うものが知られている(例えば、特許文献1参照)。
この場合において、合成される音声の質(声質)は、予めナビゲーション装置で設定している発話する速度、声の高さ、声の太さなどの音素を固定値として使用し、音声合成(発声)を行わせていたため、一定のものになってしまうという問題点があった。
しかしながら、上記従来のナビゲーションシステムにおいては、常に合成される音声の質は一定であるため、例えば、ユーザの長いメールを早く読み通したいという要望や、固有名称(地名、建物名、施設名など)については発話速度を遅くしたり、大きな声で発話してもらいたいという要望等には応えられないという問題点があった。
そこで、本発明の目的は、音声合成装置において、音声合成の対象とするテキスト情報の種類、内容に基づいて音声合成の態様を適宜変更することが可能な音声合成装置、その制御方法、制御プログラムおよび記録媒体を提供することにある。
上記構成によれば、モード指定部を介してユーザが音声読み上げモードを指定すると、パラメータ特定部は、指定された音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定する。
これらの結果、音声合成部は、特定された音声合成パラメータに基づいて音声合成を行って音声として出力する。
上記構成によれば、モード設定部は、テキスト情報の内容あるいはテキスト情報の入力元の種類に応じて音声読み上げモードを設定する。
これにより、パラメータ特定部は、設定された音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定し、音声合成部は、特定された音声合成パラメータに基づいて音声合成を行って音声として出力する。
また、前記テキスト情報の内容は、メールであり、前記モード設定部は、前記メールの容量が所定の基準容量よりも大きい長文メールである場合に、前記読上モードを長文高速読上モードに設定するようにしてもよい。
さらに、前記テキスト情報の入力元は、メールアプリケーション、交通情報処理アプリケーションあるいはナビゲーションアプリケーションであるようにしてもよい。
さらにまた、前記音声読み上げモードに対応づけて前記音声合成制御パラメータの組み合わせを予め記憶するパラメータ記憶部を備えるようにしてもよい。
また、上記各制御プログラムをコンピュータ読取可能な記録媒体に記録するようにしてもよい。
図1は、本実施の形態に係るナビゲーション装置100の機能的構成を示すブロック図である。この図に示すように、ナビゲーション装置100は、絶対位置・方位検出部1と、相対方位検出部2と、車速検出部3と、主制御部4と、ROM5と、DRAM6と、SRAM7と、VRAM8と、ユーザインタフェース部9と、表示部10と、入力部11と、ディスク制御部12と、FM多重信号処理部13と、外部記録装置制御部14、音声データ生成部(音声合成出力部)15と、を備えている。
音声データ生成部15は、音声表記記号列が入力される合成単位系列変換部15Aを備えている。
音声表記記号列が入力されると、合成単位系列変換部15Aは、音声表記記号列を解析し、音声合成単位の記号列である合成単位系列記号列に変換して、音声合成制御パラメータ生成部15Bに出力する。
音声合成制御パラメータ生成部15Bは、予め設定されたTTSパラメータおよび音声合成規則データベース(DB)15Cを参照して、音源部15Dおよび音声合成フィルタ15Eを制御するための音声合成制御パラメータを時系列的に生成する。
生成される音声合成制御パラメータとしては、声道の伝達特性を定めるパラメータと、音源特性に関与するパラメータ(ピッチ(基本周波数)、音源振幅、有声/無声等)がある。これらのパラメータは、一定の時間的な枠の中で、互いに相関関係を持って設定される。
上記構成において、音声合成を行って各種情報の音声読み上げを行わせるに先立って、ユーザは、複数の音声読み上げモードに対応して複数組のTTSパラメータを予め設定するためのTTSパラメータの設定処理を行っておく必要がある。
まず、ユーザはTTSパラメータを設定すべき音声読み上げモードNを選択する(ステップS1)。
この場合において、音声読み上げモードNとしては、メール読み上げモード、長文メール高速読み上げモード、交通情報(VICS)読み上げモード、経路案内モード等が挙げられる。メール読み上げモードにおいては、通常の音声合成がなされる、あるいは、固有名詞等については大きくはっきり発音するなどの処理がなされる。長文メール高速読み上げモードにおいては、メールの内容を短時間で把握するために、固有名詞等については大きくはっきり発音するとともに、発話速度を速くするなどの処理がなされる。交通情報(VICS)読み上げモードにおいては、地名、インターチェンジ名などの固有名称を大きくはっきりと発音させる等の処理がなされる。経路案内モードにおいては、距離、方向(進行方向など)、目印(信号、ビルなど)については、大きくはっきり発音させる等の処理がなされる。
ここで、TTSパラメータP1〜Pnの種類としては、ピッチ、発話スピード、声の太さ、特殊記号の読み上げ可否、男声/女性、声の高さ、声の大きさ、アクセントの大きさ、母音の無声化の可否などが挙げられる。
続いて、主制御部4は、設定されたTTSパラメータP1〜Pnを読み上げモードNに対応づけてDRAM6およびSRAM7に記憶し設定処理を終了する(ステップS3)。
その後、主制御部4は、自己が実行しているメールアプリケーション、交通情報処理アプリケーションあるいはナビゲーションアプリケーションから音声出力要求がなされた場合には、出力するテキストデータTおよび音声読み上げモードを取得あるいは設定し(ステップS11)、音声データ生成部15に対し、TTS出力要求情報Sを設定し、出力する(ステップS12)。
音声データ生成部15は、主制御部4からTTS出力要求情報Sを取得すると(ステップS21)、TTSパラメータP1〜Pnを設定する(ステップS22)。
さらに音声データ生成部15は、テキストデータTを設定する(ステップS23)。
これにより、音声データ生成部15は、テキストデータTを音声データに変換する(ステップS24)。
まず音声データ生成部15は、入力されたテキストデータTを解析し、音声記号の系列に変換するととともに、韻律的な特徴を自動的に生成するために、形態素解析や構文解析を行う(ステップS31)。
具体的には、ある単語に対し文法的に連結可能な単語の種類を規定した単語検索テーブル15Gおよび辞書15Hを参照して入力されたテキストを単語と、形態素の系列と、に分割する。
これにより合成単位系列変換部15Aは、音声合成用情報を解析し、音声合成単位の記号列である合成単位系列記号列に変換されて、音声合成制御パラメータ生成部15Bに出力される。
ここで、音声合成制御パラメータとしては、声道の伝達特性を定めるパラメータと、音源特性に関与するパラメータ(ピッチ(基本周波数)、音源振幅、有声/無声等)がある。これらのパラメータは、一定の時間的な枠の中で、互いに相関関係を持って設定される。
このとき、スピーカ15Fから出力される合成音声は、設定されたTTSパラメータP1〜Pnに従うものとなる。
例えば、メールの容量が所定の基準容量よりも大きい長文メールである場合には、読上モードが長文高速読上モードに設定され、読み上げ速度を上げて、より短時間でメールの内容を把握することができる。
以上の説明のように、本実施形態によれば、テキスト情報の内容あるいはテキスト情報の入力元の種類に応じて主制御部4が自動的に音声読み上げモードを設定し、設定された音声読み上げモードに対応するTTSパラメータの組に基づいて音声合成を行って合成音声を出力するので、読み上げ対象に応じてより聞き取りやすい合成音声を得ることができ、使い勝手が向上する。
以上の説明では、テキスト情報の入力元は、ナビゲーション装置上で実行されるメールアプリケーション、交通情報処理アプリケーションあるいはナビゲーションアプリケーションである場合を説明したが、これら以外の各種アプリケーションであっても良い。
さらに、アプリケーションばかりでなく、外部装置、例えば、外部の交通情報処理装置、インターネット端末などからテキスト情報を入力するようにしてもよい。
以上の説明では、ナビゲーション装置について説明したが、音声合成装置を設けることが可能な装置であれば、どのような装置でも適用が可能である。
1 絶対位置・方位検出部
2 相対方位検出部
3 車速検出部
4 主制御部(モード設定部、パラメータ特定部)
5 ROM
6 DRAM(パラメータ記憶部)
7 SRAM(パラメータ記憶部)
9 ユーザインタフェース部
10 表示部
11 入力部(モード指定部)
12 ディスク制御部
13 FM多重信号処理部
14 外部記録装置制御部
15 音声データ生成部(音声合成出力部、音声合成部)
15A 合成単位系列変換部
15B 音声合成制御パラメータ生成部
15C 音声合成規則データベース(DB)
15D 音源部
15E 音声合成フィルタ
15F スピーカ
Claims (11)
- 入力されたテキスト情報に基づいて音声合成を行い、前記テキスト情報を音声に変換して出力する音声合成装置において、
ユーザが音声読み上げモードを指定するモード指定部と、
前記指定された前記音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定するパラメータ特定部と、
特定された音声合成パラメータに基づいて音声合成を行って前記音声として出力する音声合成部と、
を備えたことを特徴とする音声合成装置。 - 入力されたテキスト情報に基づいて音声合成を行い、前記テキスト情報を音声に変換して出力する音声合成装置において、
前記テキスト情報の内容あるいは前記テキスト情報の入力元の種類に応じて音声読み上げモードを設定するモード設定部と、
設定された前記音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定するパラメータ特定部と、
特定された音声合成パラメータに基づいて音声合成を行って前記音声として出力する音声合成部と、
を備えたことを特徴とする音声合成装置。 - 請求項1または請求項2記載の音声合成装置において、
前記テキスト情報の内容は、メール、交通情報あるいは経路案内情報のいずれかであることを特徴とする音声合成装置。 - 請求項1または請求項2記載の音声合成装置において、
前記テキスト情報の内容は、メールであり、
前記モード設定部は、前記メールの容量が所定の基準容量よりも大きい長文メールである場合に、前記読上モードを長文高速読上モードに設定することを特徴とする音声合成装置。 - 請求項1ないし請求項4のいずれかに記載の音声合成装置において、
前記テキスト情報の入力元は、メールアプリケーション、交通情報処理アプリケーションあるいはナビゲーションアプリケーションであることを特徴とする音声合成装置。 - 請求項1ないし請求項5のいずれかに記載の音声合成装置において、
前記音声読み上げモードに対応づけて前記音声合成制御パラメータの組み合わせを予め記憶するパラメータ記憶部を備えたことを特徴とする音声合成装置。 - 入力されたテキスト情報に基づいて音声合成を行い、前記テキスト情報を音声に変換して出力する音声合成装置の制御方法において、
ユーザが音声読み上げモードを指定するモード指定過程と、
前記指定された前記音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定するパラメータ特定過程と、
特定された音声合成パラメータに基づいて音声合成を行って前記音声として出力する音声合成過程と、
を備えたことを特徴とする制御方法。 - 入力されたテキスト情報に基づいて音声合成を行い、前記テキスト情報を音声に変換して出力する音声合成装置の制御方法において、
前記テキスト情報の内容あるいは前記テキスト情報の入力元の種類に応じて音声読み上げモードを設定するモード設定過程と、
設定された前記音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定するパラメータ特定過程と、
特定された音声合成パラメータに基づいて音声合成を行って前記音声として出力する音声合成過程と、
を備えたことを特徴とする制御方法。 - 入力されたテキスト情報に基づいて音声合成を行い、前記テキスト情報を音声に変換して出力する音声合成装置をコンピュータにより制御するための制御プログラムにおいて、
ユーザが指定した音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定させ、
特定された音声合成パラメータに基づいて音声合成を行って前記音声として出力させる、
ことを特徴とする制御プログラム。 - 入力されたテキスト情報に基づいて音声合成を行い、前記テキスト情報を音声に変換して出力する音声合成装置をコンピュータにより制御するための制御プログラムにおいて、
前記テキスト情報の内容あるいは前記テキスト情報の入力元の種類に応じて音声読み上げモードを設定させ、
設定された前記音声読み上げモードに対応する音声合成制御パラメータの組み合わせを特定させ、
特定された音声合成パラメータに基づいて音声合成を行って前記音声として出力させる、
ことを特徴とする制御プログラム。 - 請求項9または請求項10のいずれかに記載の制御プログラムを記録したことを特徴とするコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004284240A JP4684609B2 (ja) | 2004-09-29 | 2004-09-29 | 音声合成装置、制御方法、制御プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004284240A JP4684609B2 (ja) | 2004-09-29 | 2004-09-29 | 音声合成装置、制御方法、制御プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006098695A true JP2006098695A (ja) | 2006-04-13 |
JP4684609B2 JP4684609B2 (ja) | 2011-05-18 |
Family
ID=36238586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004284240A Expired - Fee Related JP4684609B2 (ja) | 2004-09-29 | 2004-09-29 | 音声合成装置、制御方法、制御プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4684609B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014069220A1 (ja) * | 2012-10-31 | 2016-09-08 | 日本電気株式会社 | 再生装置、設定装置、再生方法およびプログラム |
US9886237B2 (en) | 2012-11-27 | 2018-02-06 | Denso Corporation | Text-reading device and text-reading method |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08335096A (ja) * | 1995-06-07 | 1996-12-17 | Oki Electric Ind Co Ltd | テキスト音声合成装置 |
JPH0962286A (ja) * | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
JPH0990971A (ja) * | 1995-09-25 | 1997-04-04 | N T T Data Tsushin Kk | 音声合成方法 |
JPH10260815A (ja) * | 1997-03-18 | 1998-09-29 | Toshiba Corp | 音声合成方法 |
JPH11102198A (ja) * | 1997-07-31 | 1999-04-13 | Toyota Motor Corp | メッセージ処理装置、メッセージ処理方法及びメッセージ処理プログラムを記録した媒体 |
JP2000075875A (ja) * | 1998-08-28 | 2000-03-14 | Ntt Data Corp | 音声合成方法及び装置 |
JP2002132282A (ja) * | 2000-10-20 | 2002-05-09 | Oki Electric Ind Co Ltd | 電子テキスト読み上げ装置 |
JP2002351485A (ja) * | 2001-05-28 | 2002-12-06 | Matsushita Electric Ind Co Ltd | 電子メール読み上げ装置 |
-
2004
- 2004-09-29 JP JP2004284240A patent/JP4684609B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08335096A (ja) * | 1995-06-07 | 1996-12-17 | Oki Electric Ind Co Ltd | テキスト音声合成装置 |
JPH0962286A (ja) * | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
JPH0990971A (ja) * | 1995-09-25 | 1997-04-04 | N T T Data Tsushin Kk | 音声合成方法 |
JPH10260815A (ja) * | 1997-03-18 | 1998-09-29 | Toshiba Corp | 音声合成方法 |
JPH11102198A (ja) * | 1997-07-31 | 1999-04-13 | Toyota Motor Corp | メッセージ処理装置、メッセージ処理方法及びメッセージ処理プログラムを記録した媒体 |
JP2000075875A (ja) * | 1998-08-28 | 2000-03-14 | Ntt Data Corp | 音声合成方法及び装置 |
JP2002132282A (ja) * | 2000-10-20 | 2002-05-09 | Oki Electric Ind Co Ltd | 電子テキスト読み上げ装置 |
JP2002351485A (ja) * | 2001-05-28 | 2002-12-06 | Matsushita Electric Ind Co Ltd | 電子メール読み上げ装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014069220A1 (ja) * | 2012-10-31 | 2016-09-08 | 日本電気株式会社 | 再生装置、設定装置、再生方法およびプログラム |
US9886237B2 (en) | 2012-11-27 | 2018-02-06 | Denso Corporation | Text-reading device and text-reading method |
Also Published As
Publication number | Publication date |
---|---|
JP4684609B2 (ja) | 2011-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2137723B1 (en) | Apparatus for text-to-speech delivery and method therefor | |
JP3573907B2 (ja) | 音声合成装置 | |
WO1993007447A1 (fr) | Instrument de navigation pour vehicules | |
JP2009003394A (ja) | 音声読み上げのための装置、プログラム及び方法 | |
EP2544178B1 (en) | Mobile computing apparatus and method of reducing user workload in relation to operation of a mobile computing apparatus | |
JP4797858B2 (ja) | 車載用ナビゲーション装置 | |
CN103020232B (zh) | 一种导航系统中单字录入方法 | |
JP4784156B2 (ja) | 複数のキャラクタによる音声案内を行う音声合成装置、音声合成方法、そのプログラム及びこのプログラムが記録された情報記録媒体 | |
JP2003014485A (ja) | ナビゲーション装置 | |
JP2001117584A (ja) | 音声処理装置 | |
JPH08193837A (ja) | ナビゲーションシステム | |
JP4684609B2 (ja) | 音声合成装置、制御方法、制御プログラム及び記録媒体 | |
JP2006330484A (ja) | 音声案内装置及び音声案内プログラム | |
JP3513988B2 (ja) | ナビゲーションシステム | |
JP3862478B2 (ja) | 音声合成装置および音声合成方法 | |
JP2006010509A (ja) | ナビゲーションシステム | |
JP4655268B2 (ja) | 音声出力システム | |
JP2004226711A (ja) | 音声出力装置及びナビゲーション装置 | |
JP2002062893A (ja) | 車載ナビゲーション装置 | |
JP4550207B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP2010048959A (ja) | 音声出力システム及び車載装置 | |
JP3706495B2 (ja) | 音声合成装置 | |
JP3838193B2 (ja) | 文章読み上げ装置、同装置のためのプログラム及び記録媒体 | |
JP4067795B2 (ja) | ナビゲーション装置及び経路案内方法 | |
JPH0934490A (ja) | 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100527 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110201 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110209 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140218 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4684609 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |