JP2010066422A - 音声合成装置、音声合成方法、及びプログラム - Google Patents
音声合成装置、音声合成方法、及びプログラム Download PDFInfo
- Publication number
- JP2010066422A JP2010066422A JP2008231612A JP2008231612A JP2010066422A JP 2010066422 A JP2010066422 A JP 2010066422A JP 2008231612 A JP2008231612 A JP 2008231612A JP 2008231612 A JP2008231612 A JP 2008231612A JP 2010066422 A JP2010066422 A JP 2010066422A
- Authority
- JP
- Japan
- Prior art keywords
- information
- phoneme
- speech
- prosody
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】コーパスベースの音声合成装置1であって、テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部11と、前記テキスト情報に対応する音素列と、当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部13と、前記速度情報に応じて前記韻律情報を変更する韻律情報変更部14と、前記音素列と、韻律情報変更部14による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部15と、音声信号生成部15が生成した音声信号を出力する音声信号出力部16とを備える。
【選択図】図1
Description
このような構成により、素片接続合成法やHMM合成法での音声合成を行うことができる。
このような構成により、基本周波数情報や、パワースペクトル情報を含む韻律情報を用いて、音声合成を行うことができる。
本発明の実施の形態1による音声合成装置について、図面を参照しながら説明する。本実施の形態による音声合成装置は、部分的に発話速度を変更することができるものである。
(ステップS101)音素列・韻律情報生成部12は、音声合成の一連の処理を開始するかどうか判断する。そして、音声合成の一連の処理を開始する場合には、ステップS102に進み、そうでない場合には、処理を開始すると判断するまでステップS101の処理を繰り返して実行する。音素列・韻律情報生成部12は、例えば、音声合成の一連の処理を開始する旨の指示を受け付けた場合に、その処理を開始すると判断してもよく、あるいは、テキスト情報記憶部11に新たなテキスト情報と速度情報とが蓄積されたタイミングで、音声合成の一連の処理を開始すると判断してもよく、その他のタイミングで、音声合成の一連の処理を開始すると判断してもよい。
なお、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
この具体例では、素片接続合成法により音声合成を行う場合について説明する。この具体例において、テキスト情報記憶部11では、図5で示されるテキスト情報と、速度情報とが記憶されているものとする。図5中のタグが速度情報である。「fast」タグによって、「次の東京行きのぞみ100号は10時30分に8番線から発車の予定です」の全体の話速を速くすることが示されている。また、「keyword」タグによって、「10時30分に」の部分がキーワードであることが示されている。この具体例では、話速を速くする場合には話速を2倍にする、と決まっているものとする。また、この具体例では、キーワードの部分の話速を変化させないと決まっているものとする。
11 テキスト情報記憶部
12 韻律情報生成部
13 韻律情報記憶部
14 韻律情報変更部
15 音声信号生成部
16 音声信号出力部
Claims (9)
- コーパスベースの音声合成装置であって、
テキスト情報と、当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部と、
前記テキスト情報に対応する音素列と、当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部と、
前記速度情報に応じて前記韻律情報を変更する韻律情報変更部と、
前記音素列と、前記韻律情報変更部による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部と、
前記音声信号生成部が生成した音声信号を出力する音声信号出力部と、を備えた音声合成装置。 - 前記音声信号生成部は、素片接続合成法により音声信号を生成する、請求項1記載の音声合成装置。
- 前記音声信号生成部は、HMM合成法により音声信号を生成する、請求項1記載の音声合成装置。
- 前記音素列には、ポーズが含まれており、
前記韻律情報には、前記ポーズに対応する持続時間情報も含まれており、
前記韻律情報変更部は、ポーズに対応する持続時間情報を変更しない、請求項1から請求項3のいずれか記載の音声合成装置。 - 前記テキスト情報から音素列、及び当該音素列に対応する韻律情報を生成し、前記韻律情報記憶部に蓄積する音素列・韻律情報生成部をさらに備えた、請求項1から請求項4のいずれか記載の音声合成装置。
- 前記韻律情報は、前記音素列の各音素の基本周波数情報を含む、請求項1から請求項5のいずれか記載の音声合成装置。
- 前記韻律情報は、前記音素列の各音素のパワースペクトル情報を含む、請求項1から請求項6のいずれか記載の音声合成装置。
- コーパスベースの音声合成方法であって、
テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部で記憶されている前記速度情報に応じて、前記テキスト情報に対応する音素列と当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部で記憶されている前記韻律情報を変更する韻律情報変更ステップと、
前記音素列と、前記韻律情報変更ステップでの変更後の韻律情報とを用いて音声信号を生成する音声信号生成ステップと、
前記音声信号生成ステップで生成した音声信号を出力する音声信号出力ステップと、を備えた音声合成方法。 - コーパスベースの音声合成装置としてコンピュータを機能させるためのプログラムであって、
コンピュータを、
テキスト情報と当該テキスト情報の一部に対する速度に関する情報である速度情報とが記憶されるテキスト情報記憶部で記憶される前記速度情報に応じて、前記テキスト情報に対応する音素列と当該音素列の各音素の持続時間に関する情報である持続時間情報を少なくとも含む情報である韻律情報とが記憶される韻律情報記憶部で記憶される前記韻律情報を変更する韻律情報変更部、
前記音素列と、前記韻律情報変更部による変更後の韻律情報とを用いて音声信号を生成する音声信号生成部、
前記音声信号生成部が生成した音声信号を出力する音声信号出力部、として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008231612A JP5164041B2 (ja) | 2008-09-10 | 2008-09-10 | 音声合成装置、音声合成方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008231612A JP5164041B2 (ja) | 2008-09-10 | 2008-09-10 | 音声合成装置、音声合成方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010066422A true JP2010066422A (ja) | 2010-03-25 |
JP5164041B2 JP5164041B2 (ja) | 2013-03-13 |
Family
ID=42192074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008231612A Expired - Fee Related JP5164041B2 (ja) | 2008-09-10 | 2008-09-10 | 音声合成装置、音声合成方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5164041B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012159683A (ja) * | 2011-01-31 | 2012-08-23 | Toshiba Corp | 電子機器 |
WO2014069220A1 (ja) * | 2012-10-31 | 2014-05-08 | Necカシオモバイルコミュニケーションズ株式会社 | 再生装置、設定装置、再生方法およびプログラム |
CN113178188A (zh) * | 2021-04-26 | 2021-07-27 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06337876A (ja) * | 1993-05-28 | 1994-12-06 | Toshiba Corp | 文章読み上げ装置 |
JPH08179789A (ja) * | 1994-12-26 | 1996-07-12 | Sharp Corp | 音声情報表示装置 |
JPH10210154A (ja) * | 1996-12-31 | 1998-08-07 | At & T Corp | ボイスメッセージの明瞭度を向上する方法 |
JPH10274999A (ja) * | 1997-03-31 | 1998-10-13 | Sanyo Electric Co Ltd | 文書読み上げ装置 |
JP2003208192A (ja) * | 2002-01-17 | 2003-07-25 | Canon Inc | 文書処理装置、文書読み上げ速度制御方法、記憶媒体、及びプログラム |
-
2008
- 2008-09-10 JP JP2008231612A patent/JP5164041B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06337876A (ja) * | 1993-05-28 | 1994-12-06 | Toshiba Corp | 文章読み上げ装置 |
JPH08179789A (ja) * | 1994-12-26 | 1996-07-12 | Sharp Corp | 音声情報表示装置 |
JPH10210154A (ja) * | 1996-12-31 | 1998-08-07 | At & T Corp | ボイスメッセージの明瞭度を向上する方法 |
JPH10274999A (ja) * | 1997-03-31 | 1998-10-13 | Sanyo Electric Co Ltd | 文書読み上げ装置 |
JP2003208192A (ja) * | 2002-01-17 | 2003-07-25 | Canon Inc | 文書処理装置、文書読み上げ速度制御方法、記憶媒体、及びプログラム |
Non-Patent Citations (6)
Title |
---|
CSNG200500348006; 小林 隆夫 Takao KOBAYASHI: 'コーパスベース音声合成技術の動向[IV] Technology Trends in Corpus-based Speech Synthesis [IV]' 電子情報通信学会誌 第87巻 第4号 THE JOURNAL OF THE INSTITUTE OF ELECTRONICS,INFORMATION AND CO , 2004, p.322-327, 社団法人電子情報通信学会 DENSHI-JOHO-TSUSHIN-GAKK * |
CSNG200700179015; 河井 恒 Hisashi KAWAI: '大規模コーパスを用いた音声合成システムXIMERA XIMERA: A Concatenative Speech Synthesis System' 電子情報通信学会論文誌 (J89-D) 第12号 THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS , 20061201, p.2688-2698, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
CSNJ201110016463; 平井 俊男 Toshio Hirai: 'コーパス・ベース多言語音声合成システムXIMERA' 日本音響学会 2006年 春季研究発表会講演論文集CD-ROM [CD-ROM] , 20060314, p.333-334, 社団法人日本音響学会 * |
JPN6012040599; 河井 恒 Hisashi KAWAI: '大規模コーパスを用いた音声合成システムXIMERA XIMERA: A Concatenative Speech Synthesis System' 電子情報通信学会論文誌 (J89-D) 第12号 THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS , 20061201, p.2688-2698, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
JPN6012040600; 平井 俊男 Toshio Hirai: 'コーパス・ベース多言語音声合成システムXIMERA' 日本音響学会 2006年 春季研究発表会講演論文集CD-ROM [CD-ROM] , 20060314, p.333-334, 社団法人日本音響学会 * |
JPN6012040601; 小林 隆夫 Takao KOBAYASHI: 'コーパスベース音声合成技術の動向[IV] Technology Trends in Corpus-based Speech Synthesis [IV]' 電子情報通信学会誌 第87巻 第4号 THE JOURNAL OF THE INSTITUTE OF ELECTRONICS,INFORMATION AND CO , 2004, p.322-327, 社団法人電子情報通信学会 DENSHI-JOHO-TSUSHIN-GAKK * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012159683A (ja) * | 2011-01-31 | 2012-08-23 | Toshiba Corp | 電子機器 |
US8538758B2 (en) | 2011-01-31 | 2013-09-17 | Kabushiki Kaisha Toshiba | Electronic apparatus |
US9047858B2 (en) | 2011-01-31 | 2015-06-02 | Kabushiki Kaisha Toshiba | Electronic apparatus |
WO2014069220A1 (ja) * | 2012-10-31 | 2014-05-08 | Necカシオモバイルコミュニケーションズ株式会社 | 再生装置、設定装置、再生方法およびプログラム |
CN104756181A (zh) * | 2012-10-31 | 2015-07-01 | Nec卡西欧移动通信株式会社 | 回放装置、设置装置、回放方法及程序 |
JPWO2014069220A1 (ja) * | 2012-10-31 | 2016-09-08 | 日本電気株式会社 | 再生装置、設定装置、再生方法およびプログラム |
US9728201B2 (en) | 2012-10-31 | 2017-08-08 | Nec Corporation | Playback apparatus, setting apparatus, playback method, and program |
CN104756181B (zh) * | 2012-10-31 | 2017-10-27 | 日本电气株式会社 | 回放装置、设置装置、回放方法及程序 |
CN113178188A (zh) * | 2021-04-26 | 2021-07-27 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备及存储介质 |
CN113178188B (zh) * | 2021-04-26 | 2024-05-28 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5164041B2 (ja) | 2013-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3224000B2 (ja) | テキスト−音声変換システム | |
JP6078964B2 (ja) | 音声対話システム及びプログラム | |
EP3065130B1 (en) | Voice synthesis | |
EP3321927A1 (en) | Voice interaction method and voice interaction device | |
CN112102811B (zh) | 一种合成语音的优化方法、装置及电子设备 | |
JP2013072903A (ja) | 合成辞書作成装置および合成辞書作成方法 | |
CN112037755A (zh) | 一种基于音色克隆的语音合成方法、装置及电子设备 | |
JP5164041B2 (ja) | 音声合成装置、音声合成方法、及びプログラム | |
US9484014B1 (en) | Hybrid unit selection / parametric TTS system | |
CN112037757A (zh) | 一种歌声合成方法、设备及计算机可读存储介质 | |
JP6170384B2 (ja) | 音声データベース生成システム、音声データベース生成方法、及びプログラム | |
JP2009122381A (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP6314828B2 (ja) | 韻律モデル学習装置、韻律モデル学習方法、音声合成システム、および韻律モデル学習プログラム | |
JP6179884B2 (ja) | Wfst作成装置、音声認識装置、音声翻訳装置、wfst作成方法、およびプログラム | |
JP6486582B2 (ja) | 電子機器、音声制御方法、およびプログラム | |
CN113421571A (zh) | 一种语音转换方法、装置、电子设备和存储介质 | |
JP4963345B2 (ja) | 音声合成方法及び音声合成プログラム | |
JP6251219B2 (ja) | 合成辞書作成装置、合成辞書作成方法および合成辞書作成プログラム | |
JPH08248993A (ja) | 音韻時間長制御方法 | |
EP1589524B1 (en) | Method and device for speech synthesis | |
CN113421544B (zh) | 歌声合成方法、装置、计算机设备及存储介质 | |
JP4872690B2 (ja) | 音声合成方法、音声合成プログラム、音声合成装置 | |
JP2987089B2 (ja) | 音声素片作成方法および音声合成方法とその装置 | |
EP1640968A1 (en) | Method and device for speech synthesis | |
JP2001350491A (ja) | 音声処理方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121210 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5164041 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |