JP2010224053A - 音声合成装置、音声合成方法、プログラム及び記録媒体 - Google Patents
音声合成装置、音声合成方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2010224053A JP2010224053A JP2009068920A JP2009068920A JP2010224053A JP 2010224053 A JP2010224053 A JP 2010224053A JP 2009068920 A JP2009068920 A JP 2009068920A JP 2009068920 A JP2009068920 A JP 2009068920A JP 2010224053 A JP2010224053 A JP 2010224053A
- Authority
- JP
- Japan
- Prior art keywords
- segment
- prosody
- unvoiced
- voiced
- unvoiced segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】音声合成装置は、音声素片を有声素片と無声素片に分離して、それぞれに対して韻律制御を行い、無声素片に基づいて、無声素片に含まれる残留有声成分を推定する残留有声成分推定部と、目標韻律情報と無声素片と残留有声成分推定量とに基づいて、無声素片の韻律制御を行う無声素片韻律制御部と、を備える。
【選択図】図1
Description
(音声合成装置の構成)
図2は、本発明の第一実施形態の音声合成装置の構成を示すブロック図である。第一実施形態の音声合成装置は、言語処理部1、韻律推定部2、素片選択部3、韻律制御選択部61、有声素片制御部41、第一無声素片制御部42、第二無声素片制御部43、素片接続部5、残留有声成分量推定部7、有声素片情報記憶部12、無声素片情報記憶部13を備えている。以下、図2のブロック図を参照しながら、第一実施形態の音声合成装置の詳細な動作について説明する。
言語処理部1は、入力されたテキスト文に対して形態素解析や構文解析、読み付け等の分析を行い、言語処理結果として韻律推定部2と、素片選択部3、韻律制御選択部3に出力する。
R(f)=Pu(f)/Pv(f),f=f0,f1,・・・ ,fn
本発明の第一実施形態によれば、残留有声成分が含まれる無声素片に対して、残留有声成分量に応じて韻律の制御方法を切り替える、具体的には目標ピッチ周波数を修正してから韻律制御を行うため、無声素片の波形の連続性に配慮した韻律制御を行うことが可能である。この結果、従来方式と比較して波形の不連続性に伴う音質低下を低減できる。
(音声合成装置の構成)
図25は、本発明の第二実施形態の音声合成装置の構成を示すブロック図である。第二実施形態の音声合成装置は、第一実施形態の音声合成装置(図2)と比較して、第一無声素片韻律制御部42が省略されており、韻律制御選択部61が韻律制御選択部62に、残留有声成分量推定部7が残留有声成分量推定部71に、第二無声素片韻律制御部43が第二無声素片韻律制御部44にそれぞれ置換されている。以下、図25のブロック図を参照しながら、第二実施形態の音声合成装置の詳細な動作について説明する。
残留有声成分量推定部71は、素片選択部3から供給された無声素片を基に、無声素片に残留する有声成分の量を推定し、推定結果を韻律制御選択部62及び第二無声素片韻律制御部44へ伝達する。無声素片のみを用いて残留有声成分量を推定する点が、第一実施形態の残留有声成分量推定部7と主に異なる。
R(f)=Pu(f)/Pave,f=f0,f1,・・・ ,fn
本発明の第二実施形態によれば、先に述べた第一実施形態と比較して、有声素片を利用せずに残留有声成分量の推定や無声素片韻律の制御を行う。また、第一無声素片制御部が省略された構成となっている。この結果、第一実施形態よりも構成内容が簡単になり、処理の複雑さを低減することが可能である。
2 韻律推定部
3 素片選択部
5 素片接続部
6,61,62 韻律制御選択部
12 有声素片情報記憶部
13 無声素片情報記憶部
41 有声素片韻律制御部
42 第一無声素片韻律制御部
43,44 第二無声素片韻律制御部
431 ピッチ・時間長情報分離部
432 目標ピッチ周波数補正部
433,443 有声素片ピッチ周波数抽出部
434 韻律制御部
Claims (16)
- 音声素片を有声素片と無声素片に分離して、それぞれに対して韻律制御を行い、
前記無声素片に基づいて、前記無声素片に含まれる残留有声成分を推定する残留有声成分推定部と、
目標韻律情報と前記無声素片と前記残留有声成分推定量とに基づいて、前記無声素片の韻律制御を行う無声素片韻律制御部と、
を備えることを特徴とする音声合成装置。 - 前記無声素片韻律制御部は、前記目標韻律情報と前記無声素片と前記残留有声成分推定量とに基づいて、前記無声素片の目標韻律を定めることを特徴とする請求項1に記載の音声合成装置。
- 前記無声素片韻律制御部は、
前記目標韻律情報と前記無声素片とに基づいて、無声素片の韻律変更度合を計算する韻律変更度合計算部を有し、
前記韻律変更度合と前記残留有声成分推定量とに基づいて、前記無声素片の目標韻律を定めることを特徴とする請求項1又は2に記載の音声合成装置。 - 前記残留有声成分推定部は、前記無声素片と前記有声成分とに基づいて、前記無声素片に含まれる残留有声成分を推定することを特徴とする請求項1から3のいずれか1項に記載の音声合成装置。
- 前記無声素片韻律制御部は、前記目標韻律情報と前記無声素片と前記残留有声成分推定量と前記有声素片に基づいて、前記無声素片の韻律制御を行うことを特徴とする請求項1から4のいずれか1項に記載の音声合成装置。
- 音声素片を有声素片と無声素片に分離して、それぞれに対して韻律制御を行う音声合成装置で用いられ、
前記無声素片に基づいて、前記無声素片に含まれる残留有声成分を推定する残留有声成分推定ステップと、
目標韻律情報と前記無声素片と前記残留有声成分推定量とに基づいて、前記無声素片の韻律制御を行う無声素片韻律制御ステップと、
を有することを特徴とする音声合成方法。 - 前記無声素片韻律制御ステップは、前記目標韻律情報と前記無声素片と前記残留有声成分推定量とに基づいて、前記無声素片の目標韻律を定めることを特徴とする請求項6に記載の音声合成方法。
- 前記無声素片韻律制御ステップは、
前記目標韻律情報と前記無声素片とに基づいて、無声素片の韻律変更度合を計算する韻律変更度合計算ステップを有し、
前記韻律変更度合と前記残留有声成分推定量とに基づいて、前記無声素片の目標韻律を定めることを特徴とする請求項6又は7に記載の音声合成方法。 - 前記残留有声成分推定ステップは、前記無声素片と前記有声成分とに基づいて、前記無声素片に含まれる残留有声成分を推定することを特徴とする請求項6から8のいずれか1項に記載の音声合成方法。
- 前記無声素片韻律制御ステップは、前記目標韻律情報と前記無声素片と前記残留有声成分推定量と前記有声素片に基づいて、前記無声素片の韻律制御を行うことを特徴とする請求項6から9のいずれか1項に記載の音声合成方法。
- 音声素片を有声素片と無声素片に分離して、それぞれに対して韻律制御を行う音声合成装置で用いられ、
コンピュータに、
前記無声素片に基づいて、前記無声素片に含まれる残留有声成分を推定する残留有声成分推定処理と、
目標韻律情報と前記無声素片と前記残留有声成分推定量とに基づいて、前記無声素片の韻律制御を行う無声素片韻律制御処理と、
を実行させることを特徴とするプログラム。 - 前記無声素片韻律制御処理は、前記目標韻律情報と前記無声素片と前記残留有声成分推定量とに基づいて、前記無声素片の目標韻律を定めることを特徴とする請求項11に記載のプログラム。
- 前記無声素片韻律制御処理は、
前記目標韻律情報と前記無声素片とに基づいて、無声素片の韻律変更度合を計算する韻律変更度合計算処理を有し、
前記韻律変更度合と前記残留有声成分推定量とに基づいて、前記無声素片の目標韻律を定めることを特徴とする請求項11又は12に記載のプログラム。 - 前記残留有声成分推定処理は、前記無声素片と前記有声成分とに基づいて、前記無声素片に含まれる残留有声成分を推定することを特徴とする請求項11から13のいずれか1項に記載のプログラム。
- 前記無声素片韻律制御処理は、前記目標韻律情報と前記無声素片と前記残留有声成分推定量と前記有声素片に基づいて、前記無声素片の韻律制御を行うことを特徴とする請求項11から14のいずれか1項に記載のプログラム。
- 請求項11から15のいずれか1項に記載のプログラムを記録しコンピュータ読み取り可能なことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009068920A JP5245962B2 (ja) | 2009-03-19 | 2009-03-19 | 音声合成装置、音声合成方法、プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009068920A JP5245962B2 (ja) | 2009-03-19 | 2009-03-19 | 音声合成装置、音声合成方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010224053A true JP2010224053A (ja) | 2010-10-07 |
JP5245962B2 JP5245962B2 (ja) | 2013-07-24 |
Family
ID=43041342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009068920A Active JP5245962B2 (ja) | 2009-03-19 | 2009-03-19 | 音声合成装置、音声合成方法、プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5245962B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015152788A (ja) * | 2014-02-14 | 2015-08-24 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
CN113409762A (zh) * | 2021-06-30 | 2021-09-17 | 平安科技(深圳)有限公司 | 情感语音合成方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287350A (ja) * | 2003-03-25 | 2004-10-14 | Casio Comput Co Ltd | 音声変換装置、音声効果付与装置、及びプログラム |
JP2005084692A (ja) * | 2003-09-10 | 2005-03-31 | Microsoft Corp | デジタルオーディオ信号の高品質の伸張および圧縮を提供するシステムおよび方法 |
JP2005084660A (ja) * | 2003-09-11 | 2005-03-31 | Casio Comput Co Ltd | 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム |
-
2009
- 2009-03-19 JP JP2009068920A patent/JP5245962B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287350A (ja) * | 2003-03-25 | 2004-10-14 | Casio Comput Co Ltd | 音声変換装置、音声効果付与装置、及びプログラム |
JP2005084692A (ja) * | 2003-09-10 | 2005-03-31 | Microsoft Corp | デジタルオーディオ信号の高品質の伸張および圧縮を提供するシステムおよび方法 |
JP2005084660A (ja) * | 2003-09-11 | 2005-03-31 | Casio Comput Co Ltd | 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015152788A (ja) * | 2014-02-14 | 2015-08-24 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
CN113409762A (zh) * | 2021-06-30 | 2021-09-17 | 平安科技(深圳)有限公司 | 情感语音合成方法、装置、设备及存储介质 |
CN113409762B (zh) * | 2021-06-30 | 2024-05-07 | 平安科技(深圳)有限公司 | 情感语音合成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5245962B2 (ja) | 2013-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9368103B2 (en) | Estimation system of spectral envelopes and group delays for sound analysis and synthesis, and audio signal synthesis system | |
US10347238B2 (en) | Text-based insertion and replacement in audio narration | |
US8447592B2 (en) | Methods and apparatus for formant-based voice systems | |
US20060259303A1 (en) | Systems and methods for pitch smoothing for text-to-speech synthesis | |
US20040030555A1 (en) | System and method for concatenating acoustic contours for speech synthesis | |
US20100217584A1 (en) | Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program | |
US20110046957A1 (en) | System and method for speech synthesis using frequency splicing | |
KR20180078252A (ko) | 성문 펄스 모델 기반 매개 변수식 음성 합성 시스템의 여기 신호 형성 방법 | |
US10446133B2 (en) | Multi-stream spectral representation for statistical parametric speech synthesis | |
JP5983604B2 (ja) | 素片情報生成装置、音声合成装置、音声合成方法および音声合成プログラム | |
JP5245962B2 (ja) | 音声合成装置、音声合成方法、プログラム及び記録媒体 | |
EP3113180B1 (en) | Method for performing audio inpainting on a speech signal and apparatus for performing audio inpainting on a speech signal | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP2011141470A (ja) | 素片情報生成装置、音声合成システム、音声合成方法、及び、プログラム | |
Rao | Unconstrained pitch contour modification using instants of significant excitation | |
JP2004279436A (ja) | 音声合成装置及びコンピュータプログラム | |
EP1589524B1 (en) | Method and device for speech synthesis | |
AU2015397951B2 (en) | System and method for outlier identification to remove poor alignments in speech synthesis | |
Ninh et al. | F0 parameterization of glottalized tones in HMM-based speech synthesis for Hanoi Vietnamese | |
Shah et al. | Influence of various asymmetrical contextual factors for TTS in a low resource language | |
EP1640968A1 (en) | Method and device for speech synthesis | |
Peiró-Lilja et al. | LaFresCat: A Catalan Multi-Accent Speech Dataset for Text-to-Speech | |
Klabbers et al. | Evaluation of speaker mimic technology for personalizing SGD voices. | |
Greibus et al. | Segmentation analysis using synthetic speech signals | |
KR101567566B1 (ko) | 개인 음색을 반영한 통계적 음성합성 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110920 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5245962 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |