JP2007256866A - 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム - Google Patents
音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム Download PDFInfo
- Publication number
- JP2007256866A JP2007256866A JP2006084281A JP2006084281A JP2007256866A JP 2007256866 A JP2007256866 A JP 2007256866A JP 2006084281 A JP2006084281 A JP 2006084281A JP 2006084281 A JP2006084281 A JP 2006084281A JP 2007256866 A JP2007256866 A JP 2007256866A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- phoneme
- data
- pitch data
- speech synthesis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】ピッチデータ列抽出部15は、音声データベース23から取り出した音声データからピッチデータ列を抽出する。ピッチ編集部17は、ピッチデータの変動をより顕著にするように編集する。音素HMM学習部19は、ピッチ編集部17で編集されたピッチデータを学習に使用し、音素ラベルと音素ピッチデータとの対応関係を求める。データ書き出し部21は、学習後の音素ラベルと音素ピッチデータとの対応関係を音声合成辞書25に書き込む。
【選択図】図1
Description
音素ラベル列とそれに対応する音声データとを受信する受信部と、
前記受信部で受信した音声データからピッチデータ列を抽出するピッチデータ列抽出部と、
抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチの変動を拡大するように該ピッチデータを編集し、編集済ピッチデータ列を生成するピッチ編集部と、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習部と、
学習結果を音声合成辞書に記録するデータ書き出し部と、
を備えることを特徴とする。
第1の観点に係る音声合成辞書構築装置であって、
前記ピッチ編集部は、所定の基準ピッチを中心にしてピッチが拡大するように補正する、ことを特徴とする。
第1の観点に係る音声合成辞書構築装置であって、
前記所定の基準ピッチは、ピッチの平均値である、ことを特徴とする。
第1の観点に係る音声合成辞書構築装置であって、
前記ピッチの変動の拡大の程度は、所定の重み係数により決定される、ことを特徴とする。
第1の観点に係る音声合成辞書構築装置であって、
前記所定の重み係数は、前記ピッチデータが、前記所定の基準ピッチ以上の場合と、前記所定の基準ピッチより小さい場合とで、異なる値とすることができる、ことを特徴とする。
第1の観点に係る音声合成辞書構築装置であって、
前記ピッチの変動の拡大の程度は、前記ピッチデータが、前記所定の基準ピッチからどの程度逸脱しているかによって異なる、ことを特徴とする。
データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
前記ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチの変動を拡大するように該ピッチデータを編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
から構成される音声合成辞書構築方法である。
コンピュータに、
データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
前記ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチの変動を拡大するように該ピッチデータを編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
を実行させるコンピュータプログラムである。
音素ラベル列と音声データSpm(但し、1≦m≦NSPであり、NSPは音声データベースのデータ数である。)の対を順次読み出し、図2の記憶部37に記憶する。
EdPitm[fm]=(Pitm[fm]−C)×α+C
(但し、Cは所定の基準値、αは所定の重み係数とする。)
とする編集処理を施す(ステップS25)。
EdPitm[fm]=Pitm[fm]
とする(ステップS27)。
EdPitm[fm]=(Pitm[fm]−Avem)×α+Avem
とする(ステップS73)。
Pitm[fm]≧Avemのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α1+Avemとし、
Pitm[fm]<Avemのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α2+Avemとし、
fmが無声音に対応するフレームの場合は、
EdPitm[fm]=Pitm[fm]とする。
|Pitm[fm]−Avem|≧εのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α3+Avem
とし、
|Pitm[fm]−Avem|<εのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α4+Avem
とし、
当該フレームが無声音の場合は、
EdPitm[fm]=Pitm[fm]とする。
以下、音素ラベルと音素ピッチ情報及び音素スペクトルパラメータ情報とを対応付けて音声合成辞書に書き出す音声合成辞書構築装置71について説明する。
Claims (8)
- 音素ラベル列とそれに対応する音声データとを受信する受信部と、
前記受信部で受信した音声データからピッチデータ列を抽出するピッチデータ列抽出部と、
抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチの変動を拡大するように該ピッチデータを編集し、編集済ピッチデータ列を生成するピッチ編集部と、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習部と、
学習結果を音声合成辞書に記録するデータ書き出し部と、
を備えることを特徴とする音声合成辞書構築装置。 - 前記ピッチ編集部は、所定の基準ピッチを中心にしてピッチが拡大するように補正する、ことを特徴とする請求項1に記載の音声合成辞書構築装置。
- 前記所定の基準ピッチは、ピッチの平均値である、ことを特徴とする請求項2に記載の音声合成辞書構築装置。
- 前記ピッチの変動の拡大の程度は、所定の重み係数により決定される、ことを特徴とする請求項1に記載の音声合成辞書構築装置。
- 前記所定の重み係数は、前記ピッチデータが、前記所定の基準ピッチ以上の場合と、前記所定の基準ピッチより小さい場合とで、異なる値とすることができる、ことを特徴とする請求項1に記載の音声合成辞書構築装置。
- 前記ピッチの変動の拡大の程度は、前記ピッチデータが、前記所定の基準ピッチからどの程度逸脱しているかによって異なる、ことを特徴とする請求項1に記載の音声合成辞書構築装置。
- データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
前記ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチの変動を拡大するように該ピッチデータを編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
から構成される音声合成辞書構築方法。 - コンピュータに、
データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチの変動を拡大するように該ピッチデータを編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
を実行させるコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006084281A JP4760471B2 (ja) | 2006-03-24 | 2006-03-24 | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006084281A JP4760471B2 (ja) | 2006-03-24 | 2006-03-24 | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007256866A true JP2007256866A (ja) | 2007-10-04 |
JP4760471B2 JP4760471B2 (ja) | 2011-08-31 |
Family
ID=38631135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006084281A Active JP4760471B2 (ja) | 2006-03-24 | 2006-03-24 | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4760471B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011028230A (ja) * | 2009-07-02 | 2011-02-10 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002268660A (ja) * | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
-
2006
- 2006-03-24 JP JP2006084281A patent/JP4760471B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002268660A (ja) * | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011028230A (ja) * | 2009-07-02 | 2011-02-10 | Yamaha Corp | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4760471B2 (ja) | 2011-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8338687B2 (en) | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method | |
US8423367B2 (en) | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method | |
JP4328698B2 (ja) | 素片セット作成方法および装置 | |
JP4539537B2 (ja) | 音声合成装置,音声合成方法,およびコンピュータプログラム | |
JP4038211B2 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
JP2008203543A (ja) | 声質変換装置及び音声合成装置 | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
CN101131818A (zh) | 语音合成装置与方法 | |
CN105609097A (zh) | 语音合成装置及其控制方法 | |
JP4829477B2 (ja) | 声質変換装置および声質変換方法ならびに声質変換プログラム | |
WO2013018294A1 (ja) | 音声合成装置および音声合成方法 | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
Bettayeb et al. | Speech synthesis system for the holy quran recitation. | |
JP4639932B2 (ja) | 音声合成装置 | |
JP5326546B2 (ja) | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP2008256942A (ja) | 音声合成データベースのデータ比較装置及び音声合成データベースのデータ比較方法 | |
JP4760471B2 (ja) | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム | |
WO2008056604A1 (fr) | Système de collecte de son, procédé de collecte de son et programme de traitement de collecte | |
JP5054632B2 (ja) | 音声合成装置及び音声合成プログラム | |
JP2002062890A (ja) | 音声合成方法および音声合成装置ならびに音声合成処理プログラムを記録した記録媒体 | |
JP2536169B2 (ja) | 規則型音声合成装置 | |
JP2010224419A (ja) | 音声合成装置、方法およびプログラム | |
JP2004354644A (ja) | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 | |
JP2005181998A (ja) | 音声合成装置および音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110523 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4760471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |