JP5726822B2 - 音声合成装置、方法及びプログラム - Google Patents
音声合成装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5726822B2 JP5726822B2 JP2012180446A JP2012180446A JP5726822B2 JP 5726822 B2 JP5726822 B2 JP 5726822B2 JP 2012180446 A JP2012180446 A JP 2012180446A JP 2012180446 A JP2012180446 A JP 2012180446A JP 5726822 B2 JP5726822 B2 JP 5726822B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- prosodic
- prosody
- normalization
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
第1の実施形態について説明する。
まず、本実施形態の第1の構成例について説明する。
次に、本実施形態の第2の構成例について説明する。
次に、本実施形態の第3の構成例について説明する。
次に、本実施形態の第3の構成例について説明する。
以下、第2の実施形態について説明する。
まず、本実施形態の第1の構成例について説明する。
次に、本実施形態の第2の構成例について説明する。
次に、本実施形態の第3の構成例について説明する。
次に、本実施形態の第3の構成例について説明する。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (13)
- 入力されたテキストを解析して、言語情報を出力するテキスト解析部と、
対象話者の韻律制御辞書及び1又は複数の基準話者の韻律制御辞書を記憶する辞書記憶部と、
前記言語情報に基づいて、前記対象話者の韻律制御辞書を用いて第1の韻律パラメータを生成するとともに、前記1又は複数の基準話者の韻律制御辞書をそれぞれ用いて1又は複数の第2の韻律パラメータを生成する韻律パラメータ生成部と、
正規化パラメータに基づいて、前記1又は複数の第2の韻律パラメータをそれぞれ正規化処理する正規化部と、
重み情報に基づいて、前記第1の韻律パラメータ及び正規化処理された前記1又は複数の第2の韻律パラメータを内挿処理して、第3の韻律パラメータを生成する韻律パラメータ内挿部と、
前記第3の韻律パラメータに従って、合成音声を生成する音声合成部とを備えたことを特徴とする音声合成装置。 - 前記第1の韻律パラメータ及び前記1又は複数の第2の韻律パラメータに基づいて、前記正規化パラメータを生成する正規化パラメータ生成部を更に備えたことを特徴とする請求項1に記載の音声合成装置。
- 前記対象話者の韻律制御辞書に対応する所定の韻律パラメータ統計量及び前記1又は複数の基準話者の韻律制御辞書に対応する所定の韻律パラメータ統計量に基づいて、前記正規化パラメータを生成する正規化パラメータ生成部を更に備えたことを特徴とする請求項1に記載の音声合成装置。
- 前記正規化パラメータは、予め設定されたパラメータであることを特徴とする請求項1に記載の音声合成装置。
- 前記正規化部は、前記第1の韻律パラメータをも正規化処理するものであり、
前記韻律パラメータ内挿部は、正規化処理された前記第1の韻律パラメータ及び正規化処理された前記1又は複数の第2の韻律パラメータを内挿処理するものである請求項1に記載の音声合成装置。 - 入力されたテキストを解析して、言語情報を出力するテキスト解析部と、
対象話者の韻律制御辞書及び1又は複数の基準話者の韻律制御辞書を記憶する辞書記憶部と、
前記言語情報に基づいて、前記対象話者の韻律制御辞書を用いて第1の韻律パラメータを生成するとともに、前記1又は複数の基準話者の韻律制御辞書をそれぞれ用いて1又は複数の第2の韻律パラメータを生成する韻律パラメータ生成部と、
重み情報に基づいて、前記第1の韻律パラメータ及び前記1又は複数の第2の韻律パラメータを内挿処理して、第3の韻律パラメータを生成する韻律パラメータ内挿部と、
正規化パラメータに基づいて、前記第3の韻律パラメータを正規化処理する正規化部と、
正規化処理された前記第3の韻律パラメータに従って、合成音声を生成する音声合成部とを備えたことを特徴とする音声合成装置。 - 前記第1の韻律パラメータ及び生成された前記第3の韻律パラメータに基づいて、前記正規化パラメータを生成する正規化パラメータ生成部を更に備えたことを特徴とする請求項6に記載の音声合成装置。
- 前記対象話者の韻律制御辞書に対応する所定の韻律パラメータ統計量及び前記1又は複数の基準話者の韻律制御辞書に対応する所定の韻律パラメータ統計量並びに前記重み情報に基づいて、前記正規化パラメータを生成する正規化パラメータ生成部を更に備えたことを特徴とする請求項6に記載の音声合成装置。
- 前記正規化パラメータは、予め設定されたパラメータであることを特徴とする請求項6に記載の音声合成装置。
- 音声合成装置の音声合成方法において、
テキスト解析部が、入力されたテキストを解析して、言語情報を出力するステップと、
辞書記憶部が、対象話者の韻律制御辞書及び1又は複数の基準話者の韻律制御辞書を記憶するステップと、
韻律パラメータ生成部が、前記言語情報に基づいて、前記対象話者の韻律制御辞書を用いて第1の韻律パラメータを生成するとともに、前記1又は複数の基準話者の韻律制御辞書をそれぞれ用いて1又は複数の第2の韻律パラメータを生成するステップと、
正規化部が、正規化パラメータに基づいて、前記1又は複数の第2の韻律パラメータをそれぞれ正規化処理するステップと、
韻律パラメータ内挿部が、重み情報に基づいて、前記第1の韻律パラメータ及び正規化処理された前記1又は複数の第2の韻律パラメータを内挿処理して、第3の韻律パラメータを生成するステップと、
音声合成部が、前記第3の韻律パラメータに従って、合成音声を生成するステップとを有することを特徴とする音声合成方法。 - 音声合成装置の音声合成方法において、
テキスト解析部が、入力されたテキストを解析して、言語情報を出力するステップと、
辞書記憶部が、対象話者の韻律制御辞書及び1又は複数の基準話者の韻律制御辞書を記憶するステップと、
韻律パラメータ生成部が、前記言語情報に基づいて、前記対象話者の韻律制御辞書を用いて第1の韻律パラメータを生成するとともに、前記1又は複数の基準話者の韻律制御辞書をそれぞれ用いて1又は複数の第2の韻律パラメータを生成するステップと、
韻律パラメータ内挿部が、重み情報に基づいて、前記第1の韻律パラメータ及び前記1又は複数の第2の韻律パラメータを内挿処理して、第3の韻律パラメータを生成するステップと、
正規化部が、正規化パラメータに基づいて、前記第3の韻律パラメータを正規化処理するステップと、
音声合成部が、正規化処理された前記第3の韻律パラメータに従って、合成音声を生成するステップとを有することを特徴とする音声合成方法。 - コンピュータを音声合成装置として機能させるためのプログラムにおいて、
入力されたテキストを解析して、言語情報を出力するテキスト解析部と、
対象話者の韻律制御辞書及び1又は複数の基準話者の韻律制御辞書を記憶する辞書記憶部と、
前記言語情報に基づいて、前記対象話者の韻律制御辞書を用いて第1の韻律パラメータを生成するとともに、前記1又は複数の基準話者の韻律制御辞書をそれぞれ用いて1又は複数の第2の韻律パラメータを生成する韻律パラメータ生成部と、
正規化パラメータに基づいて、前記1又は複数の第2の韻律パラメータをそれぞれ正規化処理する正規化部と、
重み情報に基づいて、前記第1の韻律パラメータ及び正規化処理された前記1又は複数の第2の韻律パラメータを内挿処理して、第3の韻律パラメータを生成する韻律パラメータ内挿部と、
前記第3の韻律パラメータに従って、合成音声を生成する音声合成部とをコンピュータに機能させるためのプログラム。 - コンピュータを音声合成装置として機能させるためのプログラムにおいて、
入力されたテキストを解析して、言語情報を出力するテキスト解析部と、
対象話者の韻律制御辞書及び1又は複数の基準話者の韻律制御辞書を記憶する辞書記憶部と、
前記言語情報に基づいて、前記対象話者の韻律制御辞書を用いて第1の韻律パラメータを生成するとともに、前記1又は複数の基準話者の韻律制御辞書をそれぞれ用いて1又は複数の第2の韻律パラメータを生成する韻律パラメータ生成部と、
重み情報に基づいて、前記第1の韻律パラメータ及び前記1又は複数の第2の韻律パラメータを内挿処理して、第3の韻律パラメータを生成する韻律パラメータ内挿部と、
正規化パラメータに基づいて、前記第3の韻律パラメータを正規化処理する正規化部と、
正規化処理された前記第3の韻律パラメータに従って、合成音声を生成する音声合成部とをコンピュータに機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012180446A JP5726822B2 (ja) | 2012-08-16 | 2012-08-16 | 音声合成装置、方法及びプログラム |
CN201310357397.5A CN103594082A (zh) | 2012-08-16 | 2013-08-16 | 声音合成装置、方法以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012180446A JP5726822B2 (ja) | 2012-08-16 | 2012-08-16 | 音声合成装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014038208A JP2014038208A (ja) | 2014-02-27 |
JP5726822B2 true JP5726822B2 (ja) | 2015-06-03 |
Family
ID=50084189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012180446A Active JP5726822B2 (ja) | 2012-08-16 | 2012-08-16 | 音声合成装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5726822B2 (ja) |
CN (1) | CN103594082A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9472182B2 (en) * | 2014-02-26 | 2016-10-18 | Microsoft Technology Licensing, Llc | Voice font speaker and prosody interpolation |
WO2017046887A1 (ja) * | 2015-09-16 | 2017-03-23 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラム、音声合成モデル学習装置、音声合成モデル学習方法及び音声合成モデル学習プログラム |
CN111128116B (zh) * | 2019-12-20 | 2021-07-23 | 珠海格力电器股份有限公司 | 一种语音处理方法、装置、计算设备及存储介质 |
CN112509552B (zh) * | 2020-11-27 | 2023-09-26 | 北京百度网讯科技有限公司 | 语音合成方法、装置、电子设备和存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2951514B2 (ja) * | 1993-10-04 | 1999-09-20 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 声質制御型音声合成装置 |
JPH09244693A (ja) * | 1996-03-07 | 1997-09-19 | N T T Data Tsushin Kk | 音声合成方法及び装置 |
JP3361066B2 (ja) * | 1998-11-30 | 2003-01-07 | 松下電器産業株式会社 | 音声合成方法および装置 |
JP3513071B2 (ja) * | 2000-02-29 | 2004-03-31 | 株式会社東芝 | 音声合成方法及び音声合成装置 |
JP2008545995A (ja) * | 2005-03-28 | 2008-12-18 | レサック テクノロジーズ、インコーポレーテッド | ハイブリッド音声合成装置、方法および用途 |
JP4246790B2 (ja) * | 2006-06-05 | 2009-04-02 | パナソニック株式会社 | 音声合成装置 |
JP4455610B2 (ja) * | 2007-03-28 | 2010-04-21 | 株式会社東芝 | 韻律パタン生成装置、音声合成装置、プログラムおよび韻律パタン生成方法 |
JPWO2010050103A1 (ja) * | 2008-10-28 | 2012-03-29 | 日本電気株式会社 | 音声合成装置 |
JP5275102B2 (ja) * | 2009-03-25 | 2013-08-28 | 株式会社東芝 | 音声合成装置及び音声合成方法 |
-
2012
- 2012-08-16 JP JP2012180446A patent/JP5726822B2/ja active Active
-
2013
- 2013-08-16 CN CN201310357397.5A patent/CN103594082A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2014038208A (ja) | 2014-02-27 |
CN103594082A (zh) | 2014-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140052447A1 (en) | Speech synthesis apparatus, method, and computer-readable medium | |
JP4738057B2 (ja) | ピッチパターン生成方法及びその装置 | |
JP5631915B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムならびに学習装置 | |
JP6802958B2 (ja) | 音声合成システム、音声合成プログラムおよび音声合成方法 | |
JP6483578B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP2005164749A (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
US9147392B2 (en) | Speech synthesis device and speech synthesis method | |
JP2008242317A (ja) | 韻律パタン生成装置、音声合成装置、プログラムおよび韻律パタン生成方法 | |
JP2010230699A (ja) | 音声合成装置、プログラム、及び方法 | |
JP2014038282A (ja) | 韻律編集装置、方法およびプログラム | |
JP5726822B2 (ja) | 音声合成装置、方法及びプログラム | |
JP5807921B2 (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
JP2016151736A (ja) | 音声加工装置、及びプログラム | |
JPWO2016103652A1 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP6330069B2 (ja) | 統計的パラメトリック音声合成のためのマルチストリームスペクトル表現 | |
JP6786065B2 (ja) | 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム | |
WO2010050103A1 (ja) | 音声合成装置 | |
JP5930738B2 (ja) | 音声合成装置及び音声合成方法 | |
JP6433063B2 (ja) | 音声加工装置、及びプログラム | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP2001242882A (ja) | 音声合成方法及び音声合成装置 | |
JP6400526B2 (ja) | 音声合成装置、その方法、およびプログラム | |
JP2009122381A (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4841339B2 (ja) | 韻律補正装置、音声合成装置、韻律補正方法、音声合成方法、韻律補正プログラム、および、音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131219 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131226 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140109 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140325 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140624 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150401 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5726822 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |