JP4760471B2 - 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム - Google Patents
音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム Download PDFInfo
- Publication number
- JP4760471B2 JP4760471B2 JP2006084281A JP2006084281A JP4760471B2 JP 4760471 B2 JP4760471 B2 JP 4760471B2 JP 2006084281 A JP2006084281 A JP 2006084281A JP 2006084281 A JP2006084281 A JP 2006084281A JP 4760471 B2 JP4760471 B2 JP 4760471B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- phoneme
- data
- data string
- speech synthesis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
音素ラベル列とそれに対応する音声データとを受信する受信部と、
前記受信部で受信した音声データからピッチデータ列を抽出するピッチデータ列抽出部と、
抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチについて、所定の基準ピッチを中心にしてピッチを拡大するように編集し、編集済ピッチデータ列を生成するピッチ編集部と、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習部と、
学習結果を音声合成辞書に記録するデータ書き出し部と、
を備えることを特徴とする。
データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
前記ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチについて、所定の基準ピッチを中心にしてピッチを拡大するように編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
から構成される音声合成辞書構築方法である。
コンピュータに、
データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチについて、所定の基準ピッチを中心にしてピッチを拡大するように編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
を実行させるコンピュータプログラムである。
音素ラベル列と音声データSpm(但し、1≦m≦NSPであり、NSPは音声データベースのデータ数である。)の対を順次読み出し、図2の記憶部37に記憶する。
EdPitm[fm]=(Pitm[fm]−C)×α+C
(但し、Cは所定の基準値、αは所定の重み係数とする。)
とする編集処理を施す(ステップS25)。
EdPitm[fm]=Pitm[fm]
とする(ステップS27)。
EdPitm[fm]=(Pitm[fm]−Avem)×α+Avem
とする(ステップS73)。
Pitm[fm]≧Avemのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α1+Avemとし、
Pitm[fm]<Avemのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α2+Avemとし、
fmが無声音に対応するフレームの場合は、
EdPitm[fm]=Pitm[fm]とする。
|Pitm[fm]−Avem|≧εのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α3+Avem
とし、
|Pitm[fm]−Avem|<εのときは、
EdPitm[fm]=(Pitm[fm]−Avem)×α4+Avem
とし、
当該フレームが無声音の場合は、
EdPitm[fm]=Pitm[fm]とする。
以下、音素ラベルと音素ピッチ情報及び音素スペクトルパラメータ情報とを対応付けて音声合成辞書に書き出す音声合成辞書構築装置71について説明する。
Claims (4)
- 音素ラベル列とそれに対応する音声データとを受信する受信部と、
前記受信部で受信した音声データからピッチデータ列を抽出するピッチデータ列抽出部と、
抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチについて、所定の基準ピッチを中心にしてピッチを拡大するように編集し、編集済ピッチデータ列を生成するピッチ編集部と、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習部と、
学習結果を音声合成辞書に記録するデータ書き出し部と、
を備えることを特徴とする音声合成辞書構築装置。 - 前記所定の基準ピッチは、ピッチの平均値である、ことを特徴とする請求項1に記載の音声合成辞書構築装置。
- データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
前記ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチについて、所定の基準ピッチを中心にしてピッチを拡大するように編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
から構成される音声合成辞書構築方法。 - コンピュータに、
データベースから、音素ラベル列とそれに対応する音声データとを受信する受信ステップと、
前記受信ステップで受信した音声データからピッチデータ列を抽出するピッチデータ列抽出ステップと、
ピッチデータ列抽出ステップで抽出されたピッチデータ列において、ピッチデータ列内でのピッチデータが表すピッチについて、所定の基準ピッチを中心にしてピッチを拡大するように編集し、編集済ピッチデータ列を生成するピッチ編集ステップと、
前記音素ラベル列と編集済ピッチデータ列とから、隠れマルコフモデルに基づく学習により各音素ラベルに音素ピッチ情報を対応させる音素HMM学習ステップと、
学習結果を出力する出力ステップと、
を実行させるコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006084281A JP4760471B2 (ja) | 2006-03-24 | 2006-03-24 | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006084281A JP4760471B2 (ja) | 2006-03-24 | 2006-03-24 | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007256866A JP2007256866A (ja) | 2007-10-04 |
JP4760471B2 true JP4760471B2 (ja) | 2011-08-31 |
Family
ID=38631135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006084281A Active JP4760471B2 (ja) | 2006-03-24 | 2006-03-24 | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4760471B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5471858B2 (ja) * | 2009-07-02 | 2014-04-16 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002268660A (ja) * | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
-
2006
- 2006-03-24 JP JP2006084281A patent/JP4760471B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007256866A (ja) | 2007-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8338687B2 (en) | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method | |
US8423367B2 (en) | Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method | |
JP4328698B2 (ja) | 素片セット作成方法および装置 | |
TWI471854B (zh) | 引導式語者調適語音合成的系統與方法及電腦程式產品 | |
US20120143611A1 (en) | Trajectory Tiling Approach for Text-to-Speech | |
JP4038211B2 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
JP2008203543A (ja) | 声質変換装置及び音声合成装置 | |
JP2007140002A (ja) | 音声合成装置,音声合成方法,およびコンピュータプログラム | |
CN101131818A (zh) | 语音合成装置与方法 | |
CN105609097A (zh) | 语音合成装置及其控制方法 | |
CN112037754A (zh) | 一种语音合成训练数据的生成方法及相关设备 | |
JP4829477B2 (ja) | 声質変換装置および声質変換方法ならびに声質変換プログラム | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JP5326546B2 (ja) | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4760471B2 (ja) | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム | |
JPH08248994A (ja) | 声質変換音声合成装置 | |
JP5376643B2 (ja) | 音声合成装置、方法およびプログラム | |
JP3281281B2 (ja) | 音声合成方法及び装置 | |
JP2536169B2 (ja) | 規則型音声合成装置 | |
JP5054632B2 (ja) | 音声合成装置及び音声合成プログラム | |
JP4929896B2 (ja) | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム | |
JP3091426B2 (ja) | 自然発話音声波形信号接続型音声合成装置 | |
JPH0944191A (ja) | 音声合成装置 | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110523 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4760471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |