JP5198200B2 - 音声合成装置及び方法 - Google Patents
音声合成装置及び方法 Download PDFInfo
- Publication number
- JP5198200B2 JP5198200B2 JP2008245966A JP2008245966A JP5198200B2 JP 5198200 B2 JP5198200 B2 JP 5198200B2 JP 2008245966 A JP2008245966 A JP 2008245966A JP 2008245966 A JP2008245966 A JP 2008245966A JP 5198200 B2 JP5198200 B2 JP 5198200B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- cost
- local
- target
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
Hunt, A. and Black, A., "Unit selection in a concatenative speech synthesis system using a large speech database", Proc. ICASSP 96, vol 1, pp 373-376, Atlanta, Georgia, 1996. J. Wouters and M. W. Macon, "Unit Fusion for Concatenative Speech Synthesis," Proc. ICSLP2000, Vol.3, pp.302-305, 2000.
図1は、第1の実施形態に係る音声合成装置は、図1に示すように、言語解析部1、韻律情報生成部2、波形生成部3、及び音声素片記憶部4を含む。
2…韻律生成部
3…波形生成部
4…音声素片記憶部
31…素片系列選択部
32…補正対象選択部
33…補正用素片選択部
34…素片補正部
35…素片接続部
Claims (12)
- 音声素片群と、その各音声素片の音素環境及び韻律情報とを記憶する記憶手段と、
目標音声の音素環境及び韻律情報との違いを表す目標コストと、音声素片間の接続のずれの大きさを表す接続コストとの重み付き和が最小となるように、前記目標音声に対応する素片系列を前記音声素片群の中から選択する第1の選択手段と、
前記素片系列中の連続する2つの音声素片毎に、音声素片間の接続のずれの大きさを表す局所的接続コストに第1の重みを付けた値を含む第1の局所コストを計算し、前記素片系列の中から、前記第1の局所コストが第1の閾値を越える音声素片対、または前記第1の局所コストが最大の音声素片対を補正対象素片対として選択する第2の選択手段と、
前記音声素片群の中から、前記局所的接続コストに第2の重みを付けた値を含む第2の局所コストが第2の閾値より小さく、且つ、前記第1の局所コストが前記補正対象素片対の前記第1の局所コストよりも小さい2つの音声素片を、前記補正対象素片対を補正するための補正用素片対として選択する第3の選択手段と、
前記補正用素片対と前記補正対象素片対とを、その接続境界に近いほど前記補正用素片対に対する重みを大きくして加算することにより、前記補正対象素片対を補正する補正手段と、
補正後の前記補正対象素片対を含む素片系列中の音声素片を接続することにより合成音声を生成する生成手段と、
を含む音声合成装置。 - 前記第1の選択手段は、前記目標音声に対応する音素列を合成単位で区切ることにより得られる複数のセグメントのそれぞれに対し1個の音声素片からなる前記素片系列を前記音声素片群の中から選択することを特徴とする請求項1記載の音声合成装置。
- 前記第3の選択手段は、前記補正対象素片対に対応する2つのセグメントにおける前記目標音声の音素環境及び韻律情報との違いが予め定められた基準以内の複数の音声素片の中から、前記第2の局所コストが前記第2の閾値より小さく、且つ、前記第1の局所コストが前記補正対象素片対の前記第1の局所コストよりも小さい前記補正用素片対を選択する請求項2記載の音声合成装置。
- 前記第2の局所コストは、前記補正対象素片対に対応する2つのセグメントにおける目標音声の音素環境及び韻律情報との違いを表す局所的目標コストと、前記局所的接続コストとの重み付き和であることを特徴とする請求項2記載の音声合成装置。
- 前記第1の局所コストは、前記連続する2つの音声素片と目標音声との音素環境及び韻律情報の違い表す局所的目標コストと、前記連続する2つの音声素片間の前記局所的接続コストとの重み付き和であることを特徴とする請求項1記載の音声合成装置。
- 前記第2の局所コストに含まれる前記局所的接続コストに付けられた前記第2の重みは、前記第1の局所コストに含まれる前記局所的接続コストに付けられる前記第1の重みよりも大きいことを特徴とする請求項1記載の音声合成装置。
- 前記合成単位は半音素であり、
前記局所的目標コストは、目標音声の音素環境との違いを示す音素環境サブコストを含む複数種類のサブコストの重み付き和であり、
前記2つのセグメントの境界が音素間の境界である場合と、1つの音素中の左半音素と右半音素との境界である場合とで、前記音素環境サブコストに付ける重みが異なることを特徴とする請求項4記載の音声合成装置。 - 前記合成単位は半音素であり、
前記局所的目標コストは目標音声のアクセントとの違いを示すアクセントサブコストを含む複数種類のサブコストの重み付き和であり、
前記2つのセグメントの境界が音素間の境界である場合と、1つの音素中の左半音素と右半音素との境界である場合とで、前記アクセントサブコストに付ける重みが異なることを特徴とする請求項4記載の音声合成装置。 - 音声素片群と、その各音声素片の音素環境及び韻律情報とを記憶手段に記憶するステップと、
目標音声の音素環境及び韻律情報との違いを表す目標コストと、音声素片間の接続のずれの大きさを表す接続コストとの重み付き和が最小となるように、前記目標音声に対応する素片系列を前記音声素片群の中から選択する第1の選択ステップと、
前記素片系列中の連続する2つの音声素片毎に、音声素片間の接続のずれの大きさを表す局所的接続コストに第1の重みを付けた値を含む第1の局所コストを計算し、前記素片系列の中から、前記第1の局所コストが第1の閾値を越える音声素片対、または前記第1の局所コストが最大の音声素片対を補正対象素片対として選択する第2の選択ステップと、
前記音声素片群の中から、前記局所的接続コストに第2の重みを付けた値を含む第2の局所コストが第2の閾値より小さく、且つ、前記第1の局所コストが前記補正対象素片対の前記第1の局所コストよりも小さい2つの音声素片を、前記補正対象素片対を補正するための補正用素片対として選択する第3の選択ステップと、
前記補正用素片対と前記補正対象素片対とを、その接続境界に近いほど前記補正用素片対に対する重みを大きくして加算することにより、前記補正対象素片対を補正する補正ステップと、
補正後の前記補正対象素片対を含む素片系列中の音声素片を接続することにより合成音声を生成する生成ステップと、
を含む音声合成方法。 - 前記第1の局所コストは、前記連続する2つの音声素片と目標音声との音素環境及び韻律情報の違いを表す局所的目標コストと、前記連続する2つの音声素片間の前記局所的接続コストとの重み付き和であることを特徴とする請求項9記載の音声合成方法。
- 前記第2の局所コストに含まれる前記局所的接続コストに付けられた前記第2の重みは、前記第1の局所コストに含まれる前記局所的接続コストに付けられる前記第1の重みよりも大きいことを特徴とする請求項9記載の音声合成方法。
- コンピュータを、
音声素片群と、その各音声素片の音素環境及び韻律情報とを記憶する記憶手段、
目標音声の音素環境及び韻律情報との違いを表す目標コストと、音声素片間の接続のずれの大きさを表す接続コストとの重み付き和が最小となるように、前記目標音声に対応する素片系列を前記音声素片群の中から選択する第1の選択手段、
前記素片系列中の連続する2つの音声素片毎に、音声素片間の接続のずれの大きさを表す局所的接続コストに第1の重みを付けた値を含む第1の局所コストを計算し、前記素片系列の中から、前記第1の局所コストが第1の閾値を越える音声素片対、または前記第1の局所コストが最大の音声素片対を補正対象素片対として選択する第2の選択手段、
前記音声素片群の中から、前記局所的接続コストに第2の重みを付けた値を含む第2の局所コストが第2の閾値より小さく、且つ、前記第1の局所コストが前記補正対象素片対の前記第1の局所コストよりも小さい2つの音声素片を、前記補正対象素片対を補正するための補正用素片対として選択する第3の選択手段、
前記補正用素片対と前記補正対象素片対とを、その接続境界に近いほど前記補正用素片対に対する重みを大きくして加算することにより、前記補正対象素片対を補正する補正手段と、
補正後の前記補正対象素片対を含む素片系列中の音声素片を接続することにより合成音声を生成する生成手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008245966A JP5198200B2 (ja) | 2008-09-25 | 2008-09-25 | 音声合成装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008245966A JP5198200B2 (ja) | 2008-09-25 | 2008-09-25 | 音声合成装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010078808A JP2010078808A (ja) | 2010-04-08 |
JP5198200B2 true JP5198200B2 (ja) | 2013-05-15 |
Family
ID=42209359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008245966A Expired - Fee Related JP5198200B2 (ja) | 2008-09-25 | 2008-09-25 | 音声合成装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5198200B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014017024A1 (ja) * | 2012-07-27 | 2014-01-30 | 日本電気株式会社 | 音声合成装置、音声合成方法、及び音声合成プログラム |
JP6398523B2 (ja) * | 2014-09-22 | 2018-10-03 | カシオ計算機株式会社 | 音声合成装置、方法、およびプログラム |
CN112216275B (zh) * | 2019-07-10 | 2024-07-19 | 阿里巴巴集团控股有限公司 | 一种语音信息的处理方法、装置及电子设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4454780B2 (ja) * | 2000-03-31 | 2010-04-21 | キヤノン株式会社 | 音声情報処理装置とその方法と記憶媒体 |
JP4963345B2 (ja) * | 2004-09-16 | 2012-06-27 | 株式会社国際電気通信基礎技術研究所 | 音声合成方法及び音声合成プログラム |
JP4664194B2 (ja) * | 2005-11-29 | 2011-04-06 | パナソニック株式会社 | 声質制御装置および方法およびプログラム記憶媒体 |
JP2008033133A (ja) * | 2006-07-31 | 2008-02-14 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
JP2008139631A (ja) * | 2006-12-04 | 2008-06-19 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成方法、装置、プログラム |
CN101617359B (zh) * | 2007-02-20 | 2012-01-18 | 日本电气株式会社 | 声音合成装置、声音合成方法 |
-
2008
- 2008-09-25 JP JP2008245966A patent/JP5198200B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010078808A (ja) | 2010-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3913770B2 (ja) | 音声合成装置および方法 | |
JP4966048B2 (ja) | 声質変換装置及び音声合成装置 | |
JP4080989B2 (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
US20080027727A1 (en) | Speech synthesis apparatus and method | |
JP3910628B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP2006276528A (ja) | 音声合成装置及びその方法 | |
US8630857B2 (en) | Speech synthesizing apparatus, method, and program | |
JP5198200B2 (ja) | 音声合成装置及び方法 | |
JP2003337592A (ja) | 音声合成方法及び音声合成装置及び音声合成プログラム | |
US7765103B2 (en) | Rule based speech synthesis method and apparatus | |
JP4533255B2 (ja) | 音声合成装置、音声合成方法、音声合成プログラムおよびその記録媒体 | |
JP5512597B2 (ja) | 音声合成装置とその方法とプログラム | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP2012042974A (ja) | 音声合成装置 | |
JP5177135B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP4476855B2 (ja) | 音声合成装置及びその方法 | |
JP5862667B2 (ja) | 波形処理装置、波形処理方法および波形処理プログラム | |
JP2005091747A (ja) | 音声合成装置 | |
JP5054632B2 (ja) | 音声合成装置及び音声合成プログラム | |
JP2004354644A (ja) | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2005241789A (ja) | 素片接続型音声合成装置及び方法、並びに音声素片データベースの作成方法 | |
JP3423276B2 (ja) | 音声合成方法 | |
WO2014017024A1 (ja) | 音声合成装置、音声合成方法、及び音声合成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120713 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |